Python爬虫之Scrapy框架系列(10)——Scrapy选择器selector

Posted 孤寒者

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫之Scrapy框架系列(10)——Scrapy选择器selector相关的知识,希望对你有一定的参考价值。

目录:

1.Scrapy选择器

Scrapy提供基于lxml库的解析机制,它们被称为选择器。
因为,它们“选择”由XPath,re正则和CSS表达式指定的html文档的某部分。
Scarpy选择器的API非常小,且非常简单。
有点像bs4。

1.1 构造selector选择器

  • Scrapy选择器是通过scrapy.Selector类,
    通过传递文本或者TextResponse对象构造的实例。
    (它会根据输入类型自动选择最佳解析规则:XML与HTML)
html_str="""
<div class="info">
                    <div class="hd">
                        <a href="https://movie.douban.com/

以上是关于Python爬虫之Scrapy框架系列(10)——Scrapy选择器selector的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫之Scrapy框架系列(10)——Scrapy选择器selector

Python爬虫之Scrapy框架系列(16)——深入剖析request和response类

Python爬虫之Scrapy框架系列(16)——深入剖析request和response类

Python爬虫之Scrapy框架系列——创建并运行你的第一个Scrapy demo项目

Python爬虫之Scrapy框架系列——创建并运行你的第一个Scrapy demo项目

Python爬虫之Scrapy框架系列——settings.py配置文件的学习