XSLT - XML 到 CSV 将列转换为具有两种不同类型地址的行

Posted

技术标签:

【中文标题】XSLT - XML 到 CSV 将列转换为具有两种不同类型地址的行【英文标题】:XSLT - XML to CSV transpose columns to rows with two different type of address 【发布时间】:2020-07-29 21:12:51 【问题描述】:

下面是我的xml

 <?xml version='1.0' encoding='UTF-8'?>
<Report_Data>
    <Report_Entry>
        <PERSON>12345</PERSON>
        <NAME> Person Name </NAME>
        <Emergency_Contacts_group>
            <ADDRESS_LINE_1>Emergency contact address 1</ADDRESS_LINE_1>
            <ADDRESS_LINE_2>Emergency contact address 2</ADDRESS_LINE_2>
            <ADDRESS_LINE_3>Emergency contact address 3</ADDRESS_LINE_3>
            <ADDRESS_LINE_4>Emergency contact address 4</ADDRESS_LINE_4>
        </Emergency_Contacts_group>

        <Trustee_group>
            <TRUST_ADDRESS_LINE_1>TRUSTEE address 1</TRUST_ADDRESS_LINE_1>
            <TRUST_ADDRESS_LINE_2>TRUSTEE address 2</TRUST_ADDRESS_LINE_2>
            <TRUST_ADDRESS_LINE_3>TRUSTEE address 3</TRUST_ADDRESS_LINE_3>
        </Trustee_group>
    </Report_Entry>
    </Report_Data>

要求是得到以下格式的输出:

PERSON|NAME|ADDRESS_LINE_TYPE|ADDRESS_LINE_DATA|TRUSTEE_ADDRESS_LINE_TYPE|TRUSTEE_ADDRESS_DATA
12345|Person Name|ADDRESS_LINE_1|Emergency contact address 1|ADDRESS_LINE_1|TRUSTEE address 1
12345|Person Name|ADDRESS_LINE_2|Emergency contact address 2|ADDRESS_LINE_2|TRUSTEE address 2
12345|Person Name|ADDRESS_LINE_3|Emergency contact address 3|ADDRESS_LINE_3|TRUSTEE address 3
12345|Person Name|ADDRESS_LINE_4|Emergency contact address 4||

我写的 XSLT 有问题

    <?xml version="1.0" encoding="UTF-8"?>
    <xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:xs="http://www.w3.org/2001/XMLSchema"
    version="1.0">

  <xsl:output method="text"/>

  <xsl:template match="/">
    <xsl:text>Person|Address_LINE_TYPE| ADDRESS_LINE_DATA</xsl:text>
    <xsl:apply-templates/>
  </xsl:template>

  <xsl:template match="*[contains(name(),'ADDRESS_LINE')]">
      <xsl:text>&#xa;</xsl:text>
      <xsl:value-of select="../../PERSON"/>
      <xsl:text>|</xsl:text>
      <xsl:value-of select="local-name()"/>
      <xsl:text>|</xsl:text>
      <xsl:value-of select="."/> 

  </xsl:template>

  <xsl:template match="text()"/>

</xsl:stylesheet>

产生这样的输出是错误的:

Person|Address_LINE_TYPE| ADDRESS_LINE_DATA
12345|ADDRESS_LINE_1|Emergency contact address 1
12345|ADDRESS_LINE_2|Emergency contact address 2
12345|ADDRESS_LINE_3|Emergency contact address 3
12345|ADDRESS_LINE_4|Emergency contact address 4
12345|TRUST_ADDRESS_LINE_1|TRUSTEE address 1
12345|TRUST_ADDRESS_LINE_2|TRUSTEE address 2
12345|TRUST_ADDRESS_LINE_3|TRUSTEE address 3

问题:1 Trustee_Group 数据正在紧急联系人下方打印。

问题:2 Trustee_group 地址行类型需要单独的列,它应该是 ADDRESS_LINE_1 而不是 TRUST_ADDRESS_LINE_1

请指导我实现所需的输出。

【问题讨论】:

请看这里的发展:xsltfiddle.liberty-development.net/gVhDDyT 【参考方案1】:

这并不完全是微不足道的。以下是我的处理方法:

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text"/>

<xsl:template match="/Report_Data">
    <xsl:text>PERSON|NAME|ADDRESS_LINE_TYPE|ADDRESS_LINE_DATA|TRUSTEE_ADDRESS_LINE_TYPE|TRUSTEE_ADDRESS_DATA&#10;</xsl:text>
    <xsl:for-each select="Report_Entry">
        <xsl:call-template name="generate-rows">
            <xsl:with-param name="person-data">
                <xsl:value-of select="PERSON"/>
                <xsl:text>|</xsl:text>
                <xsl:value-of select="NAME"/>
                <xsl:text>|</xsl:text>
            </xsl:with-param>
            <xsl:with-param name="emergency-contacts" select="Emergency_Contacts_group/*"/>
            <xsl:with-param name="trustees" select="Trustee_group/*"/>
        </xsl:call-template>
    </xsl:for-each>
</xsl:template>

<xsl:template name="generate-rows">
    <xsl:param name="person-data"/>
    <xsl:param name="emergency-contacts"/>
    <xsl:param name="trustees"/>
    <xsl:param name="i" select="1"/>
    <xsl:variable name="emergency-contact" select="$emergency-contacts[$i]" />
    <xsl:variable name="trustee" select="$trustees[$i]" />
    <!-- write to output -->
    <xsl:value-of select="$person-data"/>
    <xsl:value-of select="name($emergency-contact)"/>
    <xsl:text>|</xsl:text>  
    <xsl:value-of select="$emergency-contact"/>
    <xsl:text>|</xsl:text>  
    <xsl:value-of select="name($trustee)"/>
    <xsl:text>|</xsl:text>  
    <xsl:value-of select="$trustee"/>
    <xsl:text>&#10;</xsl:text>
    <!-- recursive call -->
    <xsl:if test="$i &lt; count($emergency-contacts) or $i &lt; count($trustee)">
        <xsl:call-template name="generate-rows">
            <xsl:with-param name="person-data" select="$person-data"/>
            <xsl:with-param name="emergency-contacts" select="$emergency-contacts"/>
            <xsl:with-param name="trustees" select="$trustees"/>
            <xsl:with-param name="i" select="$i + 1"/>
        </xsl:call-template>
    </xsl:if>
</xsl:template>

</xsl:stylesheet>

【讨论】:

【参考方案2】:

我会这样做,假设总是有一个“ADDRESS_LINE_X”并且可能有也可能没有关联的“TRUST_ADDRESS_LINE_X”。

<?xml version='1.0' encoding='UTF-8'?>
    <xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:xs="http://www.w3.org/2001/XMLSchema"
    version="1.0">

  <xsl:output method="text"/>

  <xsl:template match="/">
    <xsl:text>PERSON|NAME|ADDRESS_LINE_TYPE|ADDRESS_LINE_DATA|TRUSTEE_ADDRESS_LINE_TYPE|TRUSTEE_ADDRESS_DATA</xsl:text>
    <xsl:apply-templates/>
  </xsl:template>

  <xsl:template match="Emergency_Contacts_group">
      <xsl:for-each select="*">
        <xsl:text>&#xa;</xsl:text>
        <xsl:value-of select="../../PERSON"/>
        <xsl:text>|</xsl:text>
        <xsl:value-of select="../../NAME"/>
        <xsl:text>|</xsl:text>
        <xsl:value-of select="local-name()"/>
        <xsl:text>|</xsl:text>
        <xsl:value-of select="."/>
        <xsl:text>|</xsl:text>
            <xsl:variable name="trustName" select="concat('TRUST_',local-name())"/>
            <xsl:variable name="trust" select="../../Trustee_group/*[local-name()=$trustName]"/>
        <xsl:choose>
            <xsl:when test="$trust">
                <xsl:value-of select="$trustName"/>
                <xsl:text>|</xsl:text>
                <xsl:value-of select="$trust"/>
            </xsl:when>
            <xsl:otherwise>
                <xsl:text>|</xsl:text>        
            </xsl:otherwise>
        </xsl:choose>

      </xsl:for-each>
  </xsl:template>

  <xsl:template match="text()"/>

</xsl:stylesheet>

在这里查看它的工作原理:https://xsltfiddle.liberty-development.net/gVhDDyT/1

【讨论】:

以上是关于XSLT - XML 到 CSV 将列转换为具有两种不同类型地址的行的主要内容,如果未能解决你的问题,请参考以下文章

使用 XSLT 将 XML 转换为多个 CSV

将 xml 转换为 csv 并且列需要以行的形式(枢轴)

如何编写 XSLT 将 XML 转换为 CSV?

使用 XSLT 将 XML 转换为 CSV

使用 Python 或 XSLT 将复杂的 XML 转换为 CSV

XML 到 CSV 使用 XSLT 帮助