xpath简单入门

Posted Lawliet_Y

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了xpath简单入门相关的知识,希望对你有一定的参考价值。

语法:

选取节点:

实例:

 

 

(贴图转载自w3school)


 

补充:

/a/@href        #获取a标签的href属性

当<div class="demo"></div>种情况的时候我们可以写成/div[@class="demo"]

但如果是

<div class="demo1 demo2 demo3"></div>

这种情况我们如果匹配demo2就不能直接用等于的方法

可以用/div[contains(@class,\'demo2\')]

如果选择demo2和demo3

可以用/div[contains(@class,\'demo2\') and contains(@class,\'demo3\')]

/*网上的一个相关解答还有一个*/

如果目标Class不一定是第一个,那么

//div[contains(concat(\' \',@class,\' \'),\'demo\')]

 没看明白,但是暂且保留


 

python下用lxml模块

导入的时候只需要一个etree来接收就可以

import ...

from lxml import etree

...

html = urllib.request.urlopen(url)

content = etree.HTML(html)

cont_list = content.xpath(\'/div[@class="test"]\')

//cont_list接收的是一个匹配成功的列表

以上是关于xpath简单入门的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫从入门到进阶之xpath的使用

进一步了解XPath(利用XPath爬取飞哥的博客)python爬虫入门进阶(04)

进一步了解XPath(利用XPath爬取飞哥的博客)python爬虫入门进阶(04)

EL表达式 入门

五子棋游戏(简单易懂,入门都能学)

互联网金融爬虫怎么写-第二课 雪球网股票爬虫(正则表达式入门)