如何从 lxml 树中剥离命名空间?

Posted

技术标签:

【中文标题】如何从 lxml 树中剥离命名空间?【英文标题】:How can I strip namespaces out of an lxml tree? 【发布时间】:2015-05-14 07:47:00 【问题描述】:

接着Removing child elements in XML using python...

感谢@Tichodroma,我有这个代码:

如果你可以使用lxml,试试这个:

 import lxml.etree

 tree = lxml.etree.parse("leg.xml")
 for dog in tree.xpath("//Leg1:Dog",
                       namespaces="Leg1": "http://what.not"):
     parent = dog.xpath("..")[0]
     parent.remove(dog)
     parent.text = None
 tree.write("leg.out.xml")

现在leg.out.xml 看起来像这样:

 <?xml version="1.0"?>
 <Leg1:MOR xmlns:Leg1="http://what.not" oCount="7">
   <Leg1:Order>
     <Leg1:CTemp id="FO">
       <Leg1:Group bNum="001" cCount="4"/>
       <Leg1:Group bNum="002" cCount="4"/>
     </Leg1:CTemp>
     <Leg1:CTemp id="GO">
       <Leg1:Group bNum="001" cCount="4"/>
       <Leg1:Group bNum="002" cCount="4"/>
     </Leg1:CTemp>
   </Leg1:Order>
 </Leg1:MOR>

如何修改我的代码以从所有元素的标签名称中删除 Leg1: 命名空间前缀?

【问题讨论】:

我看了看,无法使用。 Remove namespace and prefix from xml in python using lxml的可能重复 【参考方案1】:

从每个元素中删除命名空间前缀的一种可能方法:

def strip_ns_prefix(tree):
    #iterate through only element nodes (skip comment node, text node, etc) :
    for element in tree.xpath('descendant-or-self::*'):
        #if element has prefix...
        if element.prefix:
            #replace element name with its local name
            element.tag = etree.QName(element).localname
    return tree

另一个在 xpath 中检查命名空间而不是使用 if 语句的版本:

def strip_ns_prefix(tree):
    #xpath query for selecting all element nodes in namespace
    query = "descendant-or-self::*[namespace-uri()!='']"
    #for each element returned by the above xpath query...
    for element in tree.xpath(query):
        #replace element name with its local name
        element.tag = etree.QName(element).localname
    return tree

【讨论】:

感谢这完美的作品。它也非常适合我的方法。 您可能还需要调用etree.cleanup_namespaces(tree) - 否则etree.tostring(tree) 仍会显示命名空间。 第二种方法更健壮(对默认命名空间)

以上是关于如何从 lxml 树中剥离命名空间?的主要内容,如果未能解决你的问题,请参考以下文章

python lxml findall 具有多个命名空间

ActionScript 3 剥离XML命名空间

python通过LXML库读取xml命名空间

lxml etree xmlparser 删除不需要的命名空间

如何从嵌套命名空间中引用外部 C++ 命名空间?

如何从默认命名空间发送到自定义命名空间?