Scrapy框架: pipelines.py设置

Posted Hank

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Scrapy框架: pipelines.py设置相关的知识,希望对你有一定的参考价值。

保存数据到json文件

# -*- coding: utf-8 -*-

# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html

from scrapy.exporters import JsonItemExporter

class ErshouPipeline(object):
    def open_spider(self, spider):
        self.file=open('01ershou.json','wb')
        self.exporter=JsonItemExporter(self.file)
        self.exporter.start_exporting()

    def process_item(self, item, spider):
        self.exporter.export_item(item)
        return item

    def close_spider(self, spider):
        self.exporter.finish_exporting()
        self.file.close()

以上是关于Scrapy框架: pipelines.py设置的主要内容,如果未能解决你的问题,请参考以下文章

爬虫框架Scrapy 之 --- scrapy文件

scrapy框架的命令行解释

基于python的scrapy爬虫抓取京东商品信息

爬虫2.2-scrapy框架-文件写入

大数据时代下的Scrapy爬虫框架

scrapy实例:爬取安居客租房信息