scrapy pip中间件个人处理

Posted zengxm

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scrapy pip中间件个人处理相关的知识,希望对你有一定的参考价值。

import pymongo
from scrapy.conf import settings
import pymysql



class Mongodb_Pipeline(object):

    def __init__(self):
        self.client = pymongo.MongoClient()
        self.db = self.client[settings.get(MONGODB_NAME)]

    def process_item(self, item, spider):
        if item:
            coll = item[classification1]
            self.db[coll].insert(dict(item))
        return item


    def close_spider(self):
        self.client.close()

不成体系,不要看

 

以上是关于scrapy pip中间件个人处理的主要内容,如果未能解决你的问题,请参考以下文章

scrapy之 Spider Middleware(爬虫中间件)

Python爬虫编程思想(158):Scrapy中的下载器中间件

Python爬虫编程思想(158):Scrapy中的下载器中间件

Python爬虫编程思想(158):Scrapy中的下载器中间件

Scrapy入门到放弃06:Spider中间件

python爬虫Scrapy框架之中间件