为嵌套 XML 生成 XSL(非规范化格式)

Posted

技术标签:

【中文标题】为嵌套 XML 生成 XSL(非规范化格式)【英文标题】:Generate XSL (Denormalise format) for Nested XML 【发布时间】:2020-12-20 21:34:40 【问题描述】:

我需要将我的 XML 展平,因为文件大小非常大且嵌套级别,我正在手动创建 XSL 文件。以下是我的 XML 文件内容示例场景-

<StudentDetail>
  <SchoolName>SSHPS</SchoolName>
  <SchoolEstablishedYear>1990</SchoolEstablishedYear>
  <ClassDetails>
    <ClassDetail>
      <ClassStartedYear>1990</ClassStartedYear>
      <Section ID="12345">
        <SectioName>Section A</SectioName>
        <Students>
          <Student ID="1">
            <StudentName>John</StudentName>
            <Address>
              <HomeNumber>10</HomeNumber>
              <StreetName>Avenue</StreetName>
            </Address>
          </Student>
          <Student ID="2">
            <StudentName>Steve</StudentName>
          </Student>
        </Students>
      </Section>
      <Section ID="123456">
        <SectioName>Section B</SectioName>
        <Students>
          <Student ID="100">
            <StudentName>Dia</StudentName>
            <Age>6</Age>
          </Student>
          <Student ID="101">
            <StudentName>Kevin</StudentName>
          </Student>
        </Students>
      </Section>
    </ClassDetail>
    <ClassDetail>
      <ClassStartedYear>1995</ClassStartedYear>
      <Section ID="543466">
        <SectioName>Section A</SectioName>
        <Students>
          <Student ID="200">
            <StudentName>Dia</StudentName>
            <Muncipality>
              <AreaCode>100</AreaCode>
              <Areaname>GRAND</Areaname>
            </Muncipality>
          </Student>
          <Student ID="201">
            <StudentName>Liva</StudentName>
          </Student>
        </Students>
      </Section>
      <Section ID="7543466">
        <SectioName>Section A</SectioName>
        <Students>
          <Student ID="300">
            <StudentName>Zane</StudentName>
          </Student>
          <Student ID="301">
            <StudentName>Susan</StudentName>
          </Student>
        </Students>
      </Section>
    </ClassDetail>
  </ClassDetails>
</StudentDetail>

以下是所需的XML格式-

<StudentDetail>
    <Student>
        <SchoolName>SSHPS</SchoolName>
        <SchoolEstablishedYear>1990</SchoolEstablishedYear>
        <ClassStartedYear>1990</ClassStartedYear>
        <SectionID>12345</SectionID>
        <SectioName>Section A</SectioName>
        <StudentID>1</StudentID>
        <StudentName>John</StudentName>
        <Address_HomeNumber>10</Address_HomeNumber>
        <Address_StreetName>Avenue</Address_StreetName>
        <Age> </Age>
        <Muncipality_AreaCode></Muncipality_AreaCode>
        <Muncipality_Areaname></Muncipality_Areaname>
    </Student>
   .
   .
   .
    <Student>
        <SchoolName>SSHPS</SchoolName>
        <SchoolEstablishedYear>1990</SchoolEstablishedYear>
        <ClassStartedYear>1995</ClassStartedYear>
        <SectionID>7543466</SectionID>
        <SectioName>Section A</SectioName>
        <StudentID>100</StudentID>
        <StudentName>Dia</StudentName>
        <Address_HomeNumber></Address_HomeNumber>
        <Address_StreetName></Address_StreetName>
        <Age></Age>
        <Muncipality_AreaCode>100</Muncipality_AreaCode>
        <Muncipality_Areaname>GRAND</Muncipality_Areaname>
    </Student>
</StudentDetail>

我已经生成了 XSL 模板,我无法加载它,因为其中有一些错误-

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output indent="yes" method="xml"/>
<xsl:template match="/">
    <StudentDetail>
        <xsl:for-each select="StudentDetail/ClassDetails">
         <Student>
            <SchoolName><xsl:value-of select="StudentDetail/SchoolName"/></SchoolName>
            <SchoolEstablishedYear><xsl:value-of select="StudentDetail/SchoolEstablishedYear"/></SchoolEstablishedYear>
            <ClassStartedYear><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/ClassStartedYear"/></ClassStartedYear>
            <StudentID><xsl:value-of select="StudentDetail/ClassDetails/Section/@ID"/></StudentID>
            <SectioName><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/Section/SectionName"/></SectioName>
            <StudentID><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/Section/Students/Student/@ID"/></StudentID>
            <StudentName><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/Section/Students/Student"/></StudentName>
            <Address_HomeNumber><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/Section/Students/Student/Address/HomeNumber"/></Address_HomeNumber>
            <Address_StreetName><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/Section/Students/Student/Address/StreetName"/></Address_StreetName>
            <Age><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/Section/Students/Student/Age"/></Age>
            <Muncipality_AreaCode><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/Section/Students/Student/Muncipality/AreaCode"/></Muncipality_AreaCode>
            <Muncipality_Areaname><xsl:value-of select="StudentDetail/ClassDetails/ClassDetail/Section/Students/Student/Muncipality/Areaname"/></Muncipality_Areaname>
         </Student>
        </xsl:for-each>
    </StudentDetail>       
</xsl:template>

我是处理 XML 的新手,我一直在处理嵌套的 XML

【问题讨论】:

1. 您的输入有 8 个学生,您的预期输出只有 2 个。为什么? --- 2. 我发现同一个学生有可能出现在多个班级;应该怎么处理? 谢谢。我更新了问题。我重新创建了一个类似于我面临的问题的场景。我想在展平后列出所有 8 个学生。为了解释的目的,我认为一个班级将有多个部分,并且每个部分中都会有一组学生。 你还没有回答我的第二个问题。 好吧,回答第二个问题,我假设同一个学生不会出现在多个班级中 【参考方案1】:

您的样式表的主要问题是您为每个ClassDetails 而不是为每个Student 创建一个Student

代替:

<xsl:for-each select="StudentDetail/ClassDetails">
    <Student>
        <!-- data -->
    </Student>
</xsl:for-each>

你应该这样做:

<xsl:for-each select="StudentDetail/ClassDetails/ClassDetail/Section/Students/Student">
    <Student>
        <!-- data -->
    </Student>
</xsl:for-each>

然后,在Student 元素中,您需要从祖先SchoolClassDetailSection 部分以及当前Student 节点的子元素中检索数据。

为了最大程度地减少反复上下导航树的需要,我建议将祖先部分的详细信息放在变量中并从那里访问它们:

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>

<xsl:template match="/StudentDetail">
    <xsl:copy>
        <xsl:variable name="school-details" select="SchoolName | SchoolEstablishedYear"/>
        <xsl:for-each select="ClassDetails/ClassDetail">
            <xsl:variable name="class-details" select="ClassStartedYear"/>
            <xsl:for-each select="Section">
                <xsl:variable name="section-details">
                    <SectionID>
                        <xsl:value-of select="@ID"/>
                    </SectionID>
                    <xsl:copy-of select="SectioName"/>
                </xsl:variable>
                <xsl:for-each select="Students/Student">
                    <xsl:copy>
                        <xsl:copy-of select="$school-details | $class-details"/>
                        <xsl:copy-of select="$section-details"/>
                        <StudentID>
                            <xsl:value-of select="@ID"/>
                        </StudentID>
                        <xsl:copy-of select="StudentName"/>
                        <Address_HomeNumber>
                            <xsl:value-of select="Address/HomeNumber"/>
                        </Address_HomeNumber>
                        <Address_StreetName>
                            <xsl:value-of select="Address/StreetName"/>
                        </Address_StreetName>
                        <Age>
                            <xsl:value-of select="Age"/>
                        </Age>
                        <Muncipality_AreaCode>
                            <xsl:value-of select="Muncipality/AreaCode"/>
                        </Muncipality_AreaCode>
                        <Muncipality_Areaname>
                            <xsl:value-of select="Muncipality/Areaname"/>
                        </Muncipality_Areaname>
                    </xsl:copy>
                </xsl:for-each>
            </xsl:for-each>
        </xsl:for-each>
    </xsl:copy>
</xsl:template>

</xsl:stylesheet>

【讨论】:

【参考方案2】:

首先,我很惊讶有人愿意将这种结构良好的输入转化为这种结构不良的输出。但我们不是来讨论这个的。

其次,我对您“手动生成 XSL”的说法感到困惑。我原以为您要么手动创建它,要么以编程方式生成它,但不清楚这里是哪种情况。

第三,您告诉我们您生成的 XSL 中存在“一些错误”,但您没有告诉我们该错误是什么。我能看到的唯一错误是缺少xsl:stylesheet 元素的关闭标签,这可能是一个错字。如果您遇到错误,请告诉我们错误是什么。

第四,似乎有一个更简单的方法。据我所知,您可以通过应用三个规则来实现所需的输出:

如果一个元素有子元素,只处理它的子元素

如果元素有ID属性,将&lt;X ID="x"/&gt;改为&lt;XID&gt;x&lt;/XID&gt;,然后处理其子元素

如果一个元素有一个文本节点子节点,则原封不动地复制它。

第一条规则对应默认的XSLT处理规则;其他两条规则在 XSLT 中可以简单地表示为:

<xsl:template match="*[@ID]">
  <xsl:element name="name()ID">
    <xsl:value-of select="@ID"/>
  </xsl:element>
  <xsl:apply-templates/>
</xsl:template>

<xsl:template match="*[text()]">
  <xsl:copy-of select="."/>
</xsl:template>

【讨论】:

以上是关于为嵌套 XML 生成 XSL(非规范化格式)的主要内容,如果未能解决你的问题,请参考以下文章

Symfony 2 使用自定义非规范化器对嵌套对象进行非规范化

为啥非规范化不返回嵌套对象?

使用 Symfony 2 序列化器对对象中的嵌套结构进行非规范化

xml用xsl实现分类排版的问题

如何查询非规范化 BigQuery 表以输出嵌套和重复的字段

为 React+Redux 应用程序发回规范化或非规范化 API 响应是不是更好?