爬虫相关知识(二 )xpath

Posted 似水年华梦

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫相关知识(二 )xpath相关的知识,希望对你有一定的参考价值。

#xpath表达式的基本格式

# 斜杠(/)作为路径内部的分割符。

# 同一个节点有绝对路径和相对路径两种写法。

# 绝对路径(absolute path)必须用"/"起首,后面紧跟根节点,比如/step/step/...。

# 相对路径(relative path)则是除了绝对路径以外的其他写法,比如 step/step,也就是不使用"/"起首。

# "."表示当前节点。

# ".."表示当前节点的父节点
选择节点的基本规则

- nodename(节点名称):表示选择该节点的所有子节点

- "/":表示选择根节点

- "//":表示选择任意位置的某个节点

- "@": 表示选择某个属性
通配符

# "*"表示匹配任何元素节点。

# "@*"表示匹配任何属性值。
 //title[@*] :表示选择所有带有属性的title元素。
 # node()表示匹配任何类型的节点。 
选择多个路径

用"|"选择多个并列的路径。

//book/title | //book/price :表示同时选择book元素的title子元素和price子元素。

 

以上是关于爬虫相关知识(二 )xpath的主要内容,如果未能解决你的问题,请参考以下文章

Python3爬虫——用Xpath提取网页信息

优酷电视剧爬虫代码实现一:下载解析视频网站页面补充知识点:XPath无效怎么办?

Python爬虫:Xpath获取关键标签,实现盖楼抽奖

Python爬虫:Xpath获取关键标签,实现盖楼抽奖

爬虫基础之一:XPath插件语法及使用

爬虫基础之一:XPath插件语法及使用