Scrapy学习-6-JSON数据处理

Posted 陈乾

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Scrapy学习-6-JSON数据处理相关的知识,希望对你有一定的参考价值。

使用json模块处理JSON数据
class JsonwithEncodingPipeline(object):

    def __init__(self):
        self.file = codecs.open(article.json, w, encoding=utf-8)

    def process_item(self, item, spider):
        lines = json.dumps(dict(item), ensure_ascii=False) + \n
        self.file.write(lines)
        return item

    def spider_closed(self, spider):
        self.file.close()

 

内置JSON处理对象JsonItemExporter的使用
class JsonExporterPipeline(object):

    def __init__(self):
        self.file = open(articleexport.json, wb)
        self.exporter = JsonItemExporter(self.file, encoding=utf-8, ensure_ascii=False)
        self.exporter.start_exporting()

    def spider_closed(self, spider):
        self.exporter.finish_exporting()
        self.file.close()

    def process_item(self, item, spider):
        self.exporter.export_item(item)
        return item

 

以上是关于Scrapy学习-6-JSON数据处理的主要内容,如果未能解决你的问题,请参考以下文章

scrapy按顺序启动多个爬虫代码片段(python3)

学习《从零开始学Python网络爬虫》PDF+源代码+《精通Scrapy网络爬虫》PDF

Scrapy Spider没有返回所有元素

scrapy学习笔记

你知道在 scrapy 中,可以定制化导出数据格式吗?scrapy 导出器学习

scrapy 基本操作