Python爬虫编程思想(37):项目实战:抓取猫眼电影Top100榜单

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(37):项目实战:抓取猫眼电影Top100榜单相关的知识,希望对你有一定的参考价值。

本文会使用urllib3抓取猫眼电影Top100榜单,读者使用下面的URL进入Top100榜单页面。

https://maoyan.com/board/4

Top100榜单页面如图1所示。

        从Top100榜单页面可以看出,每一页有10部电影,共10页,一共100部电影。页面下方是导航,用于切换1至10个页面。这个爬虫的目的就是抓取这100部电影的信息(如电影封面图像的URL、电影名称、演员列表、评分、上映时间等),然后将这些数据以JSON格式保存到名为board.txt的文本文件中。

以上是关于Python爬虫编程思想(37):项目实战:抓取猫眼电影Top100榜单的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(92):项目实战:抓取京东图书评价

Python爬虫编程思想(126):项目实战--实时抓取“得到”App在线课程

Python爬虫编程思想(126):项目实战--实时抓取“得到”App在线课程

Python爬虫编程思想(61): 项目实战:抓取租房信息

Python爬虫编程思想(69): 项目实战--抓取当当图书排行榜

Python爬虫编程思想(69): 项目实战--抓取当当图书排行榜