分布式豆瓣爬虫: 控制节点-数据存储器

Posted 2021-01-28 mxsf

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了分布式豆瓣爬虫: 控制节点-数据存储器相关的知识，希望对你有一定的参考价值。

一、实现原理

因为存储方式相同所以数据存储器的代码无需修改

二、代码如下

 1 import csv
 2 
 3 class DataOutput:
 4     def __init__(self):
 5         self.file = open(‘数据.csv‘, ‘w‘)
 6         self.csv_file = csv.writer(self.file)
 7         self.csv_file.writerow([‘电影名‘, ‘评分‘, ‘评分人数‘])
 8 
 9     def output_csv(self, data):
10         """
11         将数据写入 csv 文件
12         :param data: 数据
13         :return: None
14         """
15         self.csv_file.writerow(data)

以上是关于分布式豆瓣爬虫: 控制节点-数据存储器的主要内容，如果未能解决你的问题，请参考以下文章

python爬取豆瓣电影首页超链接

23个Python爬虫开源项目代码：微信淘宝豆瓣知乎微博...

python豆瓣电影爬虫

用Scrapy爬虫爬取豆瓣电影排行榜数据，存储到Mongodb数据库

Python从0开始写爬虫——把扒到的豆瓣数据存储到数据库

Forward团队-爬虫豆瓣top250项目-需求分析