分布式豆瓣爬虫: 控制节点-数据存储器

Posted mxsf

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式豆瓣爬虫: 控制节点-数据存储器相关的知识,希望对你有一定的参考价值。

一、实现原理

因为存储方式相同所以数据存储器的代码无需修改

 

二、代码如下

 1 import csv
 2 
 3 class DataOutput:
 4     def __init__(self):
 5         self.file = open(数据.csv, w)
 6         self.csv_file = csv.writer(self.file)
 7         self.csv_file.writerow([电影名, 评分, 评分人数])
 8 
 9     def output_csv(self, data):
10         """
11         将数据写入 csv 文件
12         :param data: 数据
13         :return: None
14         """
15         self.csv_file.writerow(data)

 

以上是关于分布式豆瓣爬虫: 控制节点-数据存储器的主要内容,如果未能解决你的问题,请参考以下文章

python爬取豆瓣电影首页超链接

23个Python爬虫开源项目代码:微信淘宝豆瓣知乎微博...

python豆瓣电影爬虫

用Scrapy爬虫爬取豆瓣电影排行榜数据,存储到Mongodb数据库

Python从0开始写爬虫——把扒到的豆瓣数据存储到数据库

Forward团队-爬虫豆瓣top250项目-需求分析