Python爬虫编程思想(75): 读取与搜索XML文件

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(75): 读取与搜索XML文件相关的知识,希望对你有一定的参考价值。

        xml文件已经被广泛使用在各种应用中,无论是Web应用、还是移动应用,或是桌面应用以及其他应用,几乎都会有XML文件的身影。尽管目前很多应用都不会将大量的数据保存在XML文件中,但至少会使用XML文件保存一些配置信息。

        在Python语言中需要导入xml模块或其子模块,并利用其中提供的API来操作XML文件。例如,读取XML文件需要导入xml.etree.ElementTree模块,并通过该模块的parse函数读取XML文件。

下面的例子读取了一个名为products.xml的文件,并输出了XML文件中相应节点和属性的值。

from xml.etree.ElementTree import parse
# 开始分析products.xml文件,files/products.xml是要读取的XML文件的名字
doc = parse(\'files/products.xml\')
# 通过XPath搜索子节点集合,然后对这个子节点集合进行迭代
for item in doc.iterfind(\'products/product\'):
    # 读取product节点的id子节点的值
id = item.findtext(\'id\')
    # 读取product节点的name子节点的值
name

以上是关于Python爬虫编程思想(75): 读取与搜索XML文件的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(76): 读取与搜索XML文件

Python爬虫编程思想(76): 读取与搜索XML文件

Python爬虫编程思想(29):正则表达式的匹配(match)与搜索(search)

Python爬虫编程思想(12):搭建代理与使用代理

Python爬虫编程思想(35):用正则表达式搜索替换和分隔字符串

Python爬虫编程思想(13):读取和设置Cookie