python 爬取豆瓣电影前250名

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 爬取豆瓣电影前250名相关的知识,希望对你有一定的参考价值。

import requests
import re

# python3 如果出现乱码的话
# import importlib
# importlib.reload(importlib)

# 存放电影名字的List
movieList = []

# 打开文件
f = open('/Users/fangchao/Desktop/movies.txt','w',encoding='utf-8')

# 循环获取豆瓣电影数据
for page in range(10):
    # 利用requests请求豆瓣数据
    r = requests.get('https://movie.douban.com/top250?start='+str(page*25))
    # 豆瓣内容
    content = r.text
    # 利用正则表达式筛选出电影名
    re_movie = r'<span class="title">(.*?)</span>'
    movies = re.findall(re_movie,content)
    # 循环获取到的电影名List 并打印写入文件
    for movieName in movies:
        if movieName.find('/') == -1:
            movieList.append(movieName)
            f.write(movieName+'\n')
            print(movieName)

# 关闭文件
f.close()

以上是关于python 爬取豆瓣电影前250名的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫爬取豆瓣电影前250名电影及评分(requests+pyquery)

python爬虫--爬取豆瓣top250电影名

团队-Python 爬取豆瓣电影top250-需求分析

运维学python之爬虫高级篇scrapy爬取豆瓣电影TOP250

团队-爬取豆瓣电影TOP250-需求分析

Python 爬取豆瓣TOP250实战