Python爬虫实战(1)requests爬取豆瓣电影TOP250
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫实战(1)requests爬取豆瓣电影TOP250相关的知识,希望对你有一定的参考价值。
参考技术A 爬取时间:2020/11/25
系统环境:Windows 10
所用工具:Jupyter Notebook\\Python 3.0
涉及的库:requests\\lxml\\pandas\\matplotlib\\numpy
蛋肥想法: 先将电影名称、原名、评分、评价人数、分类信息从网站上爬取下来。
蛋肥想法: print数据列表后发现电影原名、分类信息等存在不需要的字符,需预先处理;同时因为后续想做一个豆瓣电影TOP250的维度分布图,而同一电影存在多个发行国家、类型(如“法国 美国 / 剧情 动作 犯罪”),为了简(偷)便(懒),这里均取第一个作为记入的数据;最后将数据保存为xlsx。
蛋肥想法: 蛋肥想知道在豆瓣电影TOP250中年份、国家、类型的维度数据,为了练手,使用刚才保存成xlsx的数据,并分别画成雷达图、柱形图、扇形图。
以上是关于Python爬虫实战(1)requests爬取豆瓣电影TOP250的主要内容,如果未能解决你的问题,请参考以下文章