Python爬虫编程思想(40):XPath基础

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(40):XPath基础相关的知识,希望对你有一定的参考价值。

目录

         1  XPath概述

2. 使用XPath

       XPath的英文全称是XML Path Language,中文是XML路径语言,它是一种在XML文档中查找信息的语言,最初是用于在XML文档中搜索节点的,但同样可用于html文档的搜索,因为XML与HTML是同源的。

1  XPath概述

        XPath的功能非常强大,它提供了非常简单的路径选择表达式。另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等。几乎所有我们想定位的节点,都可以用XPath来选择。

以上是关于Python爬虫编程思想(40):XPath基础的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(44):XPath实战:节点轴选择

Python爬虫编程思想(42):XPath实战:匹配属性

Python爬虫编程思想(41):XPath实战:选取DOM节点

Python爬虫编程思想(43):XPath实战:按序选择节点

Python爬虫编程思想(46):使用Chrome验证XPath

Python爬虫编程思想(149):使用Scrapy抓取数据,并通过XPath指定解析规则