python爬虫:scrapy自定义item

Posted HuaBro

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫:scrapy自定义item相关的知识,希望对你有一定的参考价值。

items.py

class LianhezaobaospyderItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    # pass
    body=scrapy.Field()
    link=scrapy.Field()

爬虫.py

from .. import items

def parse_news(self,response):
    item=items.LianhezaobaospyderItem()                
    item[body]=response.xpath("//div[@class=‘xx‘]/text()").get()
    item[link]=response.url
    yield item    

item和字典类似,数据量大时,字典可能键值对错误

以上是关于python爬虫:scrapy自定义item的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫Scrapy_入门案例

Python爬虫Scrapy_入门案例

转载Python爬虫框架Scrapy学习笔记

自定义 scrapy 爬虫的 requests

一篇文章教会你理解和定义Scrapy爬虫框架中items.py文件

数据之路 - Python爬虫 - Scrapy框架