python爬虫网页解析之parsel模块

Posted J哥。

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫网页解析之parsel模块相关的知识,希望对你有一定的参考价值。

一.parsel模块安装

官网链接https://pypi.org/project/parsel/1.0.2/

pip install parsel==1.0.2

二.模块作用

改模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配


推荐Python大牛在线分享技术 扣qun:855408893

领域:web开发,爬虫,数据分析,数据挖掘,人工智能


三.使用

import requests
import parsel

response = requests.get(url)
sel = parsel.Selector(response.text)  #注意这里的S要大写

# re正则
# print(sel.re('正则匹配格式'))

# xpath
# print(sel.xpath('xpath').getall()) #getall获取所有

# css选择器
# print(sel.css('css选择器 ::text').extract_first())#获取第一个

以上是关于python爬虫网页解析之parsel模块的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫--解析网页几种方法之正则表达式

Python爬虫最强组合httpx+parsel测评

爬虫网页解析之css用法及实战爬取中国校花网

python爬虫--解析网页几种方法之BeautifulSoup

python爬虫之真实世界中的网页解析

Python 爬虫之urllib库,及urllib库的4个模块基本使用和了解