Python电影数据分析

Posted 我不是小鲁班

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python电影数据分析相关的知识,希望对你有一定的参考价值。

数据说明:MovieLens数据集,它包含来自于943个用户以及精选的1682部电影的100K个电影打分。每个用户至少为20部电影打分,数据类型user id | item id | rating | timestamp. 

地址:https://grouplens.org/datasets/movielens/

1、引入pandas,numpy包

2、读取数据:首先,文件如果不在默认路径下,需要更改路径,使用下面两行命令,另外要注意正反斜杠的应用。

os.getcwd()

os.chdir("新的路径")

3、由于数据包含了打分数据,用户数据,但在两个文件里,因此需要合并。首先,使用header=[\'l列名1\',\'列名2\'.....]格式给两个文件添加列名

然后数据合并

结果:

将文件转换成字典类型,并按照列名读取两列

 数据统计分析,data.describe()

 

 

以上是关于Python电影数据分析的主要内容,如果未能解决你的问题,请参考以下文章

python 抓取电影天堂电影信息放入数据库

Python分析豆辨电影

Python分析豆辨电影

Python开发简单爬虫之静态网页抓取篇:爬取“豆瓣电影 Top 250”电影数据

团队-Python 爬取豆瓣电影top250-需求分析

使用Python分析《我不是药神》电影豆瓣评论