Python爬虫编程思想(64): 在pyquery中使用CSS选择器

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(64): 在pyquery中使用CSS选择器相关的知识,希望对你有一定的参考价值。

        pyquery的CSS选择器用于指定CSS代码,并通过CSS代码选取html文档中对应的节点。创建一个CSS选择器需要创建一个PyQuery对象,PyQuery类的构造方法需要传入一个HTML文档(可以是字符串、URL或文件形式)。由于PyQuery类重载了函数调用运算符(实现了__call__函数),所以可以按下面的代码使用PyQuery类的实例。

from pyquery import PyQuery as pq
doc = pq(html)
# 由于PyQuery类重载了函数调用运算符,所以可以像调用函数一样使用PyQuery的实例,函数参数就是CSS代码
result = doc(\'#button1\')

        下面的例子用PyQuery对象解析了字符串形式的HTML代码和京东商城首页的HTML代码,并通过CSS选择器提取字符串形式的HTML代码中的节点信息,以及京东商城首页导航条链接的文本。

        京东商城导航条的样式如图1所示。我们要提取的就是这一行文本,如“秒杀”、“优惠券”等。

以上是关于Python爬虫编程思想(64): 在pyquery中使用CSS选择器的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(107):基于Splash的爬虫--对象属性

Python爬虫编程思想(162): 综合爬虫项目:可视化爬虫

Python爬虫编程思想(162): 综合爬虫项目:可视化爬虫

Python爬虫编程思想(162): 综合爬虫项目:可视化爬虫

Python爬虫编程思想(162): 综合爬虫项目:可视化爬虫

Python爬虫编程思想:网络爬虫的基本原理