如何使用 Xpath 表达式仅删除 XML 中的空节点?
Posted
技术标签:
【中文标题】如何使用 Xpath 表达式仅删除 XML 中的空节点?【英文标题】:How to remove only empty nodes in XML using Xpath expressions? 【发布时间】:2022-01-15 02:41:32 【问题描述】:我需要使用 Xpath 表达式删除 XML 中的空节点。
让我们考虑下面的示例 XML。其中,'nickname' 和 'height' 节点不需要,因为它们是空的。
原始数据
<class>
<student rollno = "393">
<firstname>Dinkar</firstname>
<lastname>Kad</lastname>
<nickname></nickname>
<marks>85</marks>
<height></height>
</student>
</class>
预期数据
<class>
<student rollno = "393">
<firstname>Dinkar</firstname>
<lastname>Kad</lastname>
<marks>85</marks>
</student>
</class>
【问题讨论】:
XPath 只能选择实际存在的节点,它不能以任何方式改变它们。要创建不同的 XML 树,您需要 XSLT 或 XQuery。 【参考方案1】:您可以使用带有谓词 not(node()) 的 XPath 来选择所有没有子节点的元素。
例如:
<?php
$doc = new DOMDocument;
$doc->preserveWhiteSpace = false;
$doc->loadxml('<parentnode>
<tag1>2</tag1>
<tag2>4</tag2>
<tag3></tag3>
<tag2>4</tag2>
<tag3></tag3>
<tag2>4</tag2>
<tag3></tag3>
</parentnode>');
$xpath = new DOMXPath($doc);
foreach( $xpath->query('//*[not(node())]') as $node )
$node->parentNode->removeChild($node);
$doc->formatOutput = true;
echo $doc->savexml();
打印
<?xml version="1.0"?>
<parentnode>
<tag1>2</tag1>
<tag2>4</tag2>
<tag2>4</tag2>
<tag2>4</tag2>
</parentnode>
【讨论】:
【参考方案2】:针对这些空元素的 XPath 表达式是:*[not(node())]
。
但是,您不能使用 XPath 转换 XML。
我将应用以下 XSLT 样式表,它有一个复制所有内容的默认模板和一个特殊模板匹配没有任何子节点的元素(无元素或text()
),它是空的,这意味着这些元素得到掉了。
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output indent="yes"/>
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="@*|node()"/>
</xsl:copy>
</xsl:template>
<xsl:template match="*[not(node())]"/>
</xsl:stylesheet>
【讨论】:
以上是关于如何使用 Xpath 表达式仅删除 XML 中的空节点?的主要内容,如果未能解决你的问题,请参考以下文章