Pyhton3 操作xml文件-根据标签名称输出标签的文本值

Posted lixinx

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pyhton3 操作xml文件-根据标签名称输出标签的文本值相关的知识,希望对你有一定的参考价值。

文件截图:

技术图片

我将豆瓣某用户的想读、在读、读过书籍的名称以及链接采集下来并存入xml文件中,上图为某用户想读书籍的信息截图。

存储好书籍的链接以后,我们若想根据这个链接去访问每一本书的书籍主页并获得详细信息时,要面临的第一个问题就是:如何使用Python语言读取多个同名标签的文本值呢?

 1 import xml.dom.minidom
 2 
 3 #打开xml文档,其中abc代表想要读取的xml文件名称
 4 dom = xml.dom.minidom.parse(abc.xml)
 5 
 6 #得到文档的元素对象
 7 root = dom.documentElement
 8 
 9 #bookUrl代表想要读取的标签名称
10 info= dom.getElementsByTagName(bookUrl)
11 
12 #因为xml文件中存在多个同名的标签,因此我们需要使用for循环来遍历每一对符合要求的标签读取、显示它们的文本信息
13 for i in range(len(info)):
14     url=info[i].firstChild.data
15     print(url)

程序运行结果:

https://book.douban.com/subject/30361646/
https://book.douban.com/subject/27064871/
https://book.douban.com/subject/11442993/
https://book.douban.com/subject/26584727/
https://book.douban.com/subject/26928713/
https://book.douban.com/subject/27055756/
https://book.douban.com/subject/27044356/
https://book.douban.com/subject/26901114/
https://book.douban.com/subject/1186348/
https://book.douban.com/subject/2109619/
https://book.douban.com/subject/27005639/
https://book.douban.com/subject/26739163/

如有错误,恳请大家指正,共同进步~














以上是关于Pyhton3 操作xml文件-根据标签名称输出标签的文本值的主要内容,如果未能解决你的问题,请参考以下文章

学习笔记-模块之xml文件处理

web.xml中web-app标签标红问题

在 XML 输出中重命名标签

dom4j解析标签名中含有特殊字符报错

使用 NSXMLParser 根据属性解析 XML

在 Maven 中 - 如何根据正在使用的配置文件的名称重命名输出 .war 文件