Python怎样获取XPath下的A标签的内容

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python怎样获取XPath下的A标签的内容相关的知识,希望对你有一定的参考价值。

参考技术A

1、首先打开jupyter notebook,在主界面的右边点击New,选择Python3新建一个Python文件:

2、然后首先引入lxml包,定义一段html文本,用etree中和HTML方法导入上述html文本,然后就可以用xpath定位A标签的内容了,定位用的的函数是text方法,最后把结果打印出来即可:

3、最后运行所有的cell中的代码,即可拿到A标签的内容了。以上就是Python获取XPath下的A标签的内容的方法演示:

Xpath基础学习

方法

  • 获取文本

    • a/text() 获取a标签下的文本
    • a//text() 获取a标签下所有标签的文本
    • a[text()=‘xxx‘]获取文本为xxx的a标签
  • @符号

    • a/@href 获取a标签的href的属性,其他属性获取方法相同
    • a[@class=‘xxx‘]获取class属性为xxx的a标签
  • // 获取当前位置下的所有标签

    • a//sapn获取a标签下的所有的span标签

例子

获取豆瓣电影排行榜的所有电影名:

1、

技术图片

我们可以看到属于类为article的div,我们写上//div[@class=‘article‘]

2、我们进一步发现该div下只有一个div,于是可以加上/div,这样所有的影片块就被选中了

技术图片

3、观察发现每一个电影都是一个table

技术图片

4、进一步定位到属于一个类属性为pl2的div下的a标签

技术图片

5、追加//div[@class=‘pl2‘]/a//text()

技术图片

以上是关于Python怎样获取XPath下的A标签的内容的主要内容,如果未能解决你的问题,请参考以下文章

Xpath基础学习

python网络数据采集之xpath

Python中Scrapy框架元素选择器XPath的简单实例

xpath获取当前标签下的所有文本

xpath提取多个标签下的text

Python Xpath的解析,应用