如何使用 Xpath 表达式仅删除 XML 中的空节点?

Posted

技术标签:

【中文标题】如何使用 Xpath 表达式仅删除 XML 中的空节点?【英文标题】:How to remove only empty nodes in XML using Xpath expressions? 【发布时间】:2022-01-15 02:41:32 【问题描述】:

我需要使用 Xpath 表达式删除 XML 中的空节点。

让我们考虑下面的示例 XML。其中,'nickname' 和 'height' 节点不需要,因为它们是空的。

原始数据


<class>
   <student rollno = "393">
      <firstname>Dinkar</firstname>
      <lastname>Kad</lastname>
      <nickname></nickname>
      <marks>85</marks>
      <height></height>
   </student>
</class>

预期数据


<class>
   <student rollno = "393">
      <firstname>Dinkar</firstname>
      <lastname>Kad</lastname>
      <marks>85</marks>
   </student>
</class>

【问题讨论】:

XPath 只能选择实际存在的节点,它不能以任何方式改变它们。要创建不同的 XML 树,您需要 XSLT 或 XQuery。 【参考方案1】:

您可以使用带有谓词 not(node()) 的 XPath 来选择所有没有子节点的元素。

例如:

<?php
$doc = new DOMDocument;
$doc->preserveWhiteSpace = false;
$doc->loadxml('<parentnode>
   <tag1>2</tag1>
   <tag2>4</tag2>
   <tag3></tag3>
   <tag2>4</tag2>
   <tag3></tag3>
   <tag2>4</tag2>
   <tag3></tag3>
</parentnode>');

$xpath = new DOMXPath($doc);

foreach( $xpath->query('//*[not(node())]') as $node ) 
$node->parentNode->removeChild($node);


$doc->formatOutput = true;
echo $doc->savexml();

打印

<?xml version="1.0"?>
   <parentnode>
     <tag1>2</tag1>
     <tag2>4</tag2>
     <tag2>4</tag2>
     <tag2>4</tag2>
   </parentnode>

【讨论】:

【参考方案2】:

针对这些空元素的 XPath 表达式是:*[not(node())]

但是,您不能使用 XPath 转换 XML。

我将应用以下 XSLT 样式表,它有一个复制所有内容的默认模板和一个特殊模板匹配没有任何子节点的元素(无元素或text()),它是空的,这意味着这些元素得到掉了。

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output indent="yes"/>
    
    <xsl:template match="node()|@*">
      <xsl:copy>
          <xsl:apply-templates select="@*|node()"/>
      </xsl:copy>            
    </xsl:template>
    
    <xsl:template match="*[not(node())]"/>
    
</xsl:stylesheet>

【讨论】:

以上是关于如何使用 Xpath 表达式仅删除 XML 中的空节点?的主要内容,如果未能解决你的问题,请参考以下文章

如何删除不在 xpath 字符串数组中的 xml 节点?

如何从 XML 中仅提取标签名称(而不是值),最终使用 XPath

使用 Java 删除 XML 中的空标签

如何使用 vbscript 删除 XML 文件中的特定节点

Xpath语法

使用 XSLT 删除 XML 消息中的空元素字段和默认值