Python爬虫实战（1）requests爬取豆瓣电影TOP250

Posted 2023-03-01

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python爬虫实战（1）requests爬取豆瓣电影TOP250相关的知识，希望对你有一定的参考价值。

参考技术A

爬取时间：2020/11/25
系统环境：Windows 10
所用工具：Jupyter Notebook\\Python 3.0
涉及的库：requests\\lxml\\pandas\\matplotlib\\numpy

蛋肥想法： 先将电影名称、原名、评分、评价人数、分类信息从网站上爬取下来。

蛋肥想法： print数据列表后发现电影原名、分类信息等存在不需要的字符，需预先处理；同时因为后续想做一个豆瓣电影TOP250的维度分布图，而同一电影存在多个发行国家、类型（如“法国美国 / 剧情动作犯罪”），为了简（偷）便（懒），这里均取第一个作为记入的数据；最后将数据保存为xlsx。

蛋肥想法： 蛋肥想知道在豆瓣电影TOP250中年份、国家、类型的维度数据，为了练手，使用刚才保存成xlsx的数据，并分别画成雷达图、柱形图、扇形图。

以上是关于Python爬虫实战（1）requests爬取豆瓣电影TOP250的主要内容，如果未能解决你的问题，请参考以下文章