XPath语法

Posted Jayson

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了XPath语法相关的知识,希望对你有一定的参考价值。

XPath是在XML文档中导航和选择元素的查询语言. 在XPath语法中有四个重要的概念

1.根节点和非根节点

  /div 选择div节点, 只有当它是问档根节点时

  //div 选择文档中所有的div节点(包括非根节点)

2.通过属性选择节点

  //@href 选择带有href属性的所有节点

  //a[@href=‘http://google.com‘] 选择页面中所有指向Google网站的链接

3.通过位置选择节点

  //a[3] 选择文档中的第三个链接

  //table[last()] 选择文档中最后一个表

  //a[position()<3] 选择文档中的前三个链接

4.星号(*)匹配任意字符或节点, 可以在不同条件下使用

  //table/tr/* 选择所有表格行 tr 标签的所有的子节点(这很适合选择th和td标签)

  //div[@*] 选择带任意属性的所有div标签

XPath语法页面(http://msdn.microsoft.com/en-us/enus/library/ms256471). 

以上是关于XPath语法的主要内容,如果未能解决你的问题,请参考以下文章

xpath 语法

Xpath语法-爬虫

XPath语法

爬虫进阶数据提取-lxml模块(万能操作)

Python Xpath语法

XML——XPATH语法介绍