XML-XSLT-XPATH:如何获取重复记录?

Posted

技术标签:

【中文标题】XML-XSLT-XPATH:如何获取重复记录?【英文标题】:XML-XSLT-XPATH : How to fetch duplicate records? 【发布时间】:2015-11-09 16:44:47 【问题描述】:

大家好, 我是 XML-XSLT-XPATH 的新手,因此我坚持以下方案。 我想获取名称和名字重复的记录。 例如:如果 用户 Aname="abc"firstname="xyz" 并且 用户 Bname="abc" & firstname="xyz",则应该说用户 A 与用户 B 有重复,反之亦然。 好吧,我有一个像下面这样的输入 XML。

     <userlist>
        <user>abc@gmail.com
           <name>abc</name>
           <firstname>xyz</firstname>
           <email>abc@gmail.com</email>
           <userid>abcxy</userid>
        </user>
        <user>abc1@gmail.com
           <name>abc</name>
           <firstname>xyz</firstname>
           <email>abc1@gmail.com</email>
           <userid>abc1xy</userid>
        </user>
        <user>abc2@gmail.com
           <name>abc2</name>
           <firstname>xyz2</firstname>
           <email>abc2@gmail.com</email>
           <userid>abc2xy</userid>
        </user>
        <user>abc3@gmail.com
           <name>abc3</name>
           <firstname>xyz3</firstname>
           <email>abc3@gmail.com</email>
           <userid>abc3xy</userid>
        </user>
</userlist>

“预期输出”:

<duplicatUserList>
  <user>abc@gmail.com
           <name>abc</name>
           <firstname>xyz</firstname>
           <email>abc@gmail.com</email>
           <userid>abcxy</userid>
   </user>
    <user>abc1@gmail.com
           <name>abc</name>
           <firstname>xyz</firstname>
           <email>abc1@gmail.com</email>
           <userid>abc1xy</userid>
    </user>
</duplicateUserList>

这可能是我问的很简单,但正如我所说,我是这个 XSLT-XPath 的新手。 需要 XSLT 来获取重复记录。 任何帮助将不胜感激。 提前谢谢你。

【问题讨论】:

【参考方案1】:

这可以看作是分组问题的变体。重复项只是大小大于 1 的组的成员:

XSLT 2.0

<xsl:stylesheet version="2.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>

<xsl:template match="/userlist">
    <duplicatUserList>
        <xsl:for-each-group select="user" group-by="concat(name, '|', firstname)">
            <xsl:if test="count(current-group()) > 1">
                <xsl:copy-of select="current-group()"/>
            </xsl:if>
        </xsl:for-each-group>
    </duplicatUserList>
</xsl:template>

</xsl:stylesheet>

或者,您可以使用 key 来识别重复项。这也是一种分组形式 - 比较:http://www.jenitennison.com/xslt/grouping/muenchian.html

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<xsl:strip-space elements="*"/>

<xsl:key name="dup" match="user" use="concat(name, '|', firstname)" />

<xsl:template match="/userlist">
    <duplicatUserList>
        <xsl:copy-of select="user[count(key('dup', concat(name, '|', firstname))) > 1]"/>
    </duplicatUserList>
</xsl:template>

</xsl:stylesheet>

【讨论】:

非常感谢@michael.hor257k 如果您提供一些参考站点,我可以通过它作为初学者开始使用 XML-XSLT-XPATH 进行飞行。 我不是问这个问题的合适人选,但我相信投资一本好书会让你做得更好。 你想要一个参考,还是一个带你一步一步的教程?无论哪种方式,我认为两者的书本形式都比在线资源质量要好得多,这仅仅是因为写书的人往往会花几个月的时间专注于这项任务,并在出版前对其进行仔细审查。对于循序渐进的教程方法,我推荐 Jeni Tennison 的“Beginning XSLT 2.0”,作为参考,我推荐我自己的“XSLT 2.0 Programmer's Reference”第 4 版。

以上是关于XML-XSLT-XPATH:如何获取重复记录?的主要内容,如果未能解决你的问题,请参考以下文章

如何获取在 SQL 中具有重复列组合的记录? [复制]

Mysql如何处理重复数据?让你的效率更高效

如何使用 TSQL 而不是 linq 获取和跳过记录 [重复]

如何在linq C#中使用group by并获取记录列表[重复]

SQL - 如何从一个表中获取重复记录并连接到另一张表

如何获取一个MySql表中存在的记录而不是另一个[重复]