爬虫学习笔记PyQuery模块

Posted 会吐泡泡的鱼

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫学习笔记PyQuery模块相关的知识,希望对你有一定的参考价值。

PyQuery模块也是一个解析html的一个模块,它和Beautiful Soup用起来差不多,它是jquery实现的,和jquery语法差不多,会用jquery的人用起来就比较方便了。

Pyquery需要依赖lxml模块,不装的话,使用会报错。

安装

 

 

 

解析html的3种方式

 

 

 

css选择器

css在bs模块里面也用过,用法差不多。具体如下

 

常用方法

 

 

以上是关于爬虫学习笔记PyQuery模块的主要内容,如果未能解决你的问题,请参考以下文章

学习笔记之PyQuery篇

爬虫学习2----Pyquery

[爬虫学习笔记]Url过滤模块UrlFilter

静觅爬虫学习笔记2-urllib库的基本使用

[爬虫学习笔记]基于 SimHash 的去重复处理模块ContentSeen的构建

[爬虫学习笔记]用于提取网页中所有链接的 Extractor 模块