Python 来分析,堪比“唐探系列”!B站9.5分好评如潮!

Posted AI科技大本营

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 来分析,堪比“唐探系列”!B站9.5分好评如潮!相关的知识,希望对你有一定的参考价值。

作者 | 菜鸟哥

来源 | 菜鸟学Python

Hello 小伙伴们,最近一部非常不错的悬疑+侦探+喜剧 电影,登上B站热榜!菜鸟哥看完之后,大呼过瘾,简直就是一本非常棒的"剧本杀"!演员都是实力派,演技超级好,剧情设计太有节奏感了!尤其是片尾的大反转,亮点很多。

短短几天的时间,播放量接近2000万,更是收获了9.5分的评价。接下来,我们一起来看看,扬名立万究竟是一部怎样的电影吧。

故事发生在民国时期,月黑风高之夜,一群失意电影人不约而同地受到上海滩大亨陆子野的邀请,来到一栋神秘大别墅,参加电影剧本讨论会。试图将一桩轰动上海的重大命案改编成电影。而随着讨论的逐渐深入,他们发现这栋别墅就是案发现场,齐头扎进了一个巨大的迷局,暗处的黑势力也在虎视眈眈,而凶手就在他们中间。


豆瓣影评

该部电影主打的是悬疑+喜剧的题材,围绕一群电影人展开故事主线。题材内容富有张力。为充分了解大家对于影片的评价,我们从B站弹幕和B站影评两个角度来抓取数据。

B站弹幕

对于弹幕的数据抓取,程序如下图所示:

上述的程序内容非常的简单,利用requests库来提取网页数据后,利用BeautifulSoup来解析网页数据后,获取到弹幕的内容、颜色以及字体等内容,最后将数据保存到本地。

程序中最为关键的点是cid数值的获取。如下图所示:

在网页当中,点击“F12”,打开开发者模式后,在网络下,通过搜索cid的关键词,来找到cid的数值。

接下来我们首先来分析一下弹幕数据。

对于观影者来说,弹幕的发送时间往往跟用户的观影时间呈现强相关性。

如上视频所示,弹幕的数量有两个高峰时间段,分别是晚上八点到凌晨以及下午的一点到六点。

假期期间,大家有着充分的观影时间,无论是白天或者是晚上,都可以随时随地观看电影发送弹幕。

而在大家的弹幕词云,如下图所示。

在弹幕当中,大家发送最多的弹幕当然是“新年快乐”,并且包含了“前方高能”等常见的弹幕用语。弹幕更多的是观影用户的随手发送的信息,不能很好体现对于电影本身的评价。

因此接下来我们来进一步的来抓取B站的影评数据:

上图是抓取B站影评的全部程序,程序的主入口是run函数。

58-72行函数,利用requests库来请求数据后,解析返回的json数据,并提取data数据,然后利用get_detial_data函数来获取详细的数据内容。

对于获取的影评数据,我们先看一下大家的评分数据。

从大家的评分数据可以看出,接近87%的影评给出了满分10分的评价。超过九成的用户给出了8分以上的评分。足以见得用户对于该部影片的喜爱和支持。

在用户的影评当中。对该部影片给予了高度的评价,“好看”、“不错”等褒义词成为了高频关键词。错过电影院观看的小伙伴们,非常值得花6块钱在B站看一下这部电影。

以上便是今天同大家对于《扬名立万》这部影片的分享,有喜欢的小伙伴可以前往B站观看;尤其是最后的结局,一些细节很有意思。最后男主角李家辉为啥没有去截住“夜莺”,以及最后越南两船相撞,主角团一行人有没有到死掉,照相馆无人取的照片等等。

资讯

Meta开发AI语音助手,助力元宇宙

技术

Pandas重复数据处理大全

技术

5个短小精悍的Python趣味脚本

资讯

M2芯片终于要来了?全线换新

分享

点收藏

点点赞

点在看

以上是关于Python 来分析,堪比“唐探系列”!B站9.5分好评如潮!的主要内容,如果未能解决你的问题,请参考以下文章

Python爬取分析B站动漫《柯南》弹幕,从数据中分析接下来的剧情

“垃圾分类”大家怎么说?用Python来分析b站弹幕

最新selenium+验证码识别模拟登陆B站

毕业设计 大数据B站数据分析与可视化 - python 数据分析 大数据

Python爬虫实例:爬取B站《工作细胞》短评——异步加载信息的爬取

EDG夺冠,Python分析一波B站评论,总结:EDG,nb