XML 到 CSV 使用 XSLT 帮助

Posted

技术标签:

【中文标题】XML 到 CSV 使用 XSLT 帮助【英文标题】:XML to CSV using XSLT help 【发布时间】:2011-02-20 12:03:47 【问题描述】:

我想使用 XSLT 将 XML 转换为 CSV,但是当从名为 XML To CSV XSLT 的 SO 线程针对我的输入应用 XSL 时:

127.0.0.1域名> abuse@iana.orgInternet Corporation for Assigned Names and Number+1-310-301-5820电话> ...4676 Admiralty Way, Suite 330 Marina del Rey美国国家> 互联网号码分配机构90292-6695邮政编码> CA注册人> abuse@iana.orgInternet Corporation for Assigned Names and Number+1-310-301-5820电话> 技术联系> 2010-04-14注册表数据>

我最终得到:

  abuse@iana.orgInternet Corporation for Assigned Names and Number+1-310-301-5820,
    ,
    ,
    ,
    ...,      
    4676 Admiralty Way, Suite 330Marina del ReyUSInternet Assigned Numbers Authority90292-6695CA,      
    abuse@iana.orgInternet Corporation for Assigned Names and Number+1-310-301-5820,      
    2010-04-14,

我的问题是,生成的转换缺少节点(例如包含 IP 地址的 DomainName 元素),并且一些子节点没有逗号连接(例如 AbuseContact 的子节点)。

我希望以 CSV 格式查看所有 XML 输出,以及字符串,例如:“abuse@iana.orgInternet Corporation for Assigned Names and Number+1-310-301-5820”,以逗号分隔。

我的 XSL 生锈了。感谢您的帮助。 :)

这是我正在使用的 XSL:

【问题讨论】:

好问题 (+1)。请参阅我的答案以获得简单的解决方案。 :) 【参考方案1】:

这个简单的转换产生了想要的结果

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output method="text"/>
 <xsl:strip-space elements="*"/>

    <xsl:template match="/">
    <xsl:apply-templates select="//text()"/>
    </xsl:template>

    <xsl:template match="text()">
      <xsl:copy-of select="."/>
      <xsl:if test="not(position()=last())">,</xsl:if>
    </xsl:template>
</xsl:stylesheet>

注意使用:

 <xsl:strip-space elements="*"/>

丢弃任何纯空白文本节点。

更新:AJ 提出了结果应该以每行的记录/元组分组的问题。问题中没有定义记录/元组到底应该是什么。因此,当前的解决方案解决了纯空白文本节点和缺少逗号这两个问题,但并不旨在将输出放入记录/元组中。

【讨论】:

CSV 不需要换行来分隔记录集/元组吗? 从问题中不清楚什么构成记录元组 - 这在关系数据库世界中具有意义,但是对于树需要明确定义。我还编辑了我的答案以反映您的评论。 谢谢大家!我想要一组记录。那会有多难?我还希望能够将 XSL 应用于类似结构化的 XML 文档——不按名称引用元素的解决方案是首选。再次感谢。 :) @Adam-Kahtava:一旦定义了元组应该由什么组成,实现元组/集合应该不难。 某些字段(嗯,地址元素)中有逗号,因此您可能需要检查这一点,并将字段括在引号中。如果字段包含引号,我相信这必须成为双引号。【参考方案2】:

我相信您需要递归解决方案来解决这个问题。所以,你需要一些东西一直潜入树中,直到它到达一个 text() 节点。如果那个 text() 节点实际上是最后一个节点的子节点,那么它就会换行。否则,它只是用逗号放置值。

如果节点没有 text() 节点作为其子节点,则递归开始挖掘该树。

<xsl:strip-space elements="*" />    

<xsl:template name="rec">        
    <xsl:param name="node"/>        
    <xsl:for-each select="child::*">
        <xsl:choose>
            <xsl:when test="child::text()">
                <xsl:choose>                        
                    <xsl:when test="local-name(.) != 'UpdatedDate'">"<xsl:value-of select="normalize-space(.)"/>", </xsl:when>
                    <xsl:otherwise>"<xsl:value-of select="normalize-space(.)"/>" <xsl:text>&#xD;</xsl:text></xsl:otherwise>
                </xsl:choose>                    
            </xsl:when>
            <xsl:when test="child::node()">
                <xsl:call-template name="rec">
                    <xsl:with-param name="node" select="child::node()"/>
                </xsl:call-template>                    
            </xsl:when>
        </xsl:choose>

    </xsl:for-each>
</xsl:template>

这不是万无一失的,但它在我与撒克逊人的最后产生了这个结果:

"127.0.0.1", "abuse@iana.org", "Internet Corporation for Assigned Names and Number", "+1-310-301-5820", "...", "4676 Admiralty Way, Suite 330", "Marina del Rey", "US", "Internet Assigned Numbers Authority", "90292-6695", "CA", "abuse@iana.org", "Internet Corporation for Assigned Names and Number", "+1-310-301-5820", "2010-04-14"

希望这会有所帮助。

【讨论】:

为什么我的回答被否决了?关于它的评论会很有帮助。我自己是 XSLT 的新手。 可能是因为沿子轴移动不需要显式递归或循环。

以上是关于XML 到 CSV 使用 XSLT 帮助的主要内容,如果未能解决你的问题,请参考以下文章

XSLT 1.0:CSV 到 XML - 如何分而治之

使用 XSLT 将 CSV 文件转换为 XML

使用 XSLT 在文本文件 (CSV) 中解析 XML 文件

使用 XSLT 将 XML 转换为 CSV

使用 Python 或 XSLT 将复杂的 XML 转换为 CSV

使用 XSLT 将 XML 转换为 CSV