使用Etree Python提取XML元素

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Etree Python提取XML元素相关的知识,希望对你有一定的参考价值。

在我的XML文件中,我有一些Windows标签,我想从中根据适当的窗口名称逐一提取视点的名称。

我们是CML鱼片:

<windows>
<window class='dashboard' maximized='true' name='Dashboard 1'>
      <viewpoints>
        <viewpoint name='Category sheet'>
          <zoom type='entire-view' />
        </viewpoint>
        <viewpoint name='Segment Sheet'>
          <zoom type='entire-view' />
          <selection-collection>
            <tuple-selection>
              <tuple-reference>
                <tuple-descriptor>
                  <pane-descriptor>
                    <x-fields>
                      <field>[federated.1y3sjvb0pyupci132wn6b0wdgpc3].[none:Segment:nk]</field>
                    </x-fields>
                    <y-fields>
                      <field>[federated.1y3sjvb0pyupci132wn6b0wdgpc3].[sum:Sales:qk]</field>
                    </y-fields>
                  </pane-descriptor>
                  <columns>
                    <field>[federated.1y3sjvb0pyupci132wn6b0wdgpc3].[none:Segment:nk]</field>
                    <field>[federated.1y3sjvb0pyupci132wn6b0wdgpc3].[sum:Sales:qk]</field>
                  </columns>
                </tuple-descriptor>
                <tuple>
                  <value>&quot;Corporate&quot;</value>
                  <value>706146.36680000008</value>
                </tuple>
              </tuple-reference>
            </tuple-selection>
          </selection-collection>
        </viewpoint>
        <viewpoint name='Subcat Sheet'>
          <zoom type='entire-view' />
        </viewpoint>
        <viewpoint name='sub cat grp Sheet'>
          <zoom type='entire-view' />
        </viewpoint>
      </viewpoints>
      <active id='4' />
    </window>
    <window class='dashboard' name='Story 1'>
      <viewpoints />
      <active id='4' />
    </window>
  </windows>

我的尝试:

for win in root.findall('./windows/window'):
                    dashwins = win.find('window[@class="dashboard"]') 
                    if dashwins != None:
                        print(dashwins.attrib)
                        for i in dashwins:
                            view1 = i.find('viewpoint')
                            for j in view1:
                                print(j.get('name'))
  • 当且仅当在window标签内存在class = dashboard属性时,才需要提取视点名称。
答案

您可以扩展xpath表达式以获取目标viewpoint元素下的所有window元素,然后询问它们的name属性。

>>> from xml.etree import ElementTree
>>> tree = ElementTree.parse('sanu.xml')
>>> for el in tree.findall('.//window[@class="dashboard"]//viewpoint'):
...     el.attrib['name']
... 
'Category sheet'
'Segment Sheet'
'Subcat Sheet'
'sub cat grp Sheet'

以上是关于使用Etree Python提取XML元素的主要内容,如果未能解决你的问题,请参考以下文章

使用 xml.etree.ElementTree 在 python 中解析 XML

python xml.etree.ElementTree 附加到子元素

如何使用python xml.etree ElementTree类过滤元素

使用 Python Etree 解析 XML 并返回指定的标签而不考虑命名空间

在没有 Etree 的情况下提取 XML 键的字符串/值

如何使用 python xml.etree.ElementTree 解析 eBay API 响应?