python 爬取豆瓣电影前250名
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 爬取豆瓣电影前250名相关的知识,希望对你有一定的参考价值。
import requests
import re
# python3 如果出现乱码的话
# import importlib
# importlib.reload(importlib)
# 存放电影名字的List
movieList = []
# 打开文件
f = open('/Users/fangchao/Desktop/movies.txt','w',encoding='utf-8')
# 循环获取豆瓣电影数据
for page in range(10):
# 利用requests请求豆瓣数据
r = requests.get('https://movie.douban.com/top250?start='+str(page*25))
# 豆瓣内容
content = r.text
# 利用正则表达式筛选出电影名
re_movie = r'<span class="title">(.*?)</span>'
movies = re.findall(re_movie,content)
# 循环获取到的电影名List 并打印写入文件
for movieName in movies:
if movieName.find('/') == -1:
movieList.append(movieName)
f.write(movieName+'\n')
print(movieName)
# 关闭文件
f.close()
以上是关于python 爬取豆瓣电影前250名的主要内容,如果未能解决你的问题,请参考以下文章
python爬虫爬取豆瓣电影前250名电影及评分(requests+pyquery)
python爬虫--爬取豆瓣top250电影名
团队-Python 爬取豆瓣电影top250-需求分析
运维学python之爬虫高级篇scrapy爬取豆瓣电影TOP250
团队-爬取豆瓣电影TOP250-需求分析
Python 爬取豆瓣TOP250实战