Xpath基础学习

Posted wuren-best

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Xpath基础学习相关的知识,希望对你有一定的参考价值。

方法

  • 获取文本

    • a/text() 获取a标签下的文本
    • a//text() 获取a标签下所有标签的文本
    • a[text()=‘xxx‘]获取文本为xxx的a标签
  • @符号

    • a/@href 获取a标签的href的属性,其他属性获取方法相同
    • a[@class=‘xxx‘]获取class属性为xxx的a标签
  • // 获取当前位置下的所有标签

    • a//sapn获取a标签下的所有的span标签

例子

获取豆瓣电影排行榜的所有电影名:

1、

技术图片

我们可以看到属于类为article的div,我们写上//div[@class=‘article‘]

2、我们进一步发现该div下只有一个div,于是可以加上/div,这样所有的影片块就被选中了

技术图片

3、观察发现每一个电影都是一个table

技术图片

4、进一步定位到属于一个类属性为pl2的div下的a标签

技术图片

5、追加//div[@class=‘pl2‘]/a//text()

技术图片

以上是关于Xpath基础学习的主要内容,如果未能解决你的问题,请参考以下文章

全网最全python爬虫系统进阶学习(附原代码)学完可就业

全网最全python爬虫系统进阶学习(附原代码)学完可就业

Xpath基础学习

xpath 语法

Xpath语法-爬虫

[vscode]--HTML代码片段(基础版,reactvuejquery)