18.Pandas实战,对电影数据进行分析

Posted hisweety

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了18.Pandas实战,对电影数据进行分析相关的知识,希望对你有一定的参考价值。

第一步:读取三个表数据(用户表、评分表、电影表)
mnames=[‘MovieID‘,‘Title‘,‘Genres‘]
user_data = pd.read_table(r".datasmovielens-1musers.dat", sep=‘::‘, header=None, names=unames)

movie_data = pd.read_table(r".datasmovielens-1mmovies.dat", sep=‘::‘, header=None, names=mnames)

Rnames=[‘UserID‘,‘MovieID‘,‘Rating‘,‘Timestamp‘]
rating_data = pd.read_table(r".datasmovielens-1m atings.dat", sep=‘::‘, header=None, names=Rnames)

第二步:将三张表合并

根据共同的UserID进行合并,合并类型为outer,完成三张表的合并

user_rating=pd.merge(user_data,rating_data,left_on=‘UserID‘,right_on=‘UserID‘,how=‘outer‘)

根据共同的MovieID进行合并,合并类型为outer,完成第三张表合并

data=pd.merge(user_rating,movie_data,left_on=‘MovieID‘,right_on=‘MovieID‘,how=‘outer‘)

第三步:完成各项需求
技术图片

技术图片

技术图片
找到因性别,导致评价差异最大的电影。






以上是关于18.Pandas实战,对电影数据进行分析的主要内容,如果未能解决你的问题,请参考以下文章

利用Python数据分析-Numpy和Pands篇

基于SparkSQL的电影分析项目实战

第十一篇|基于SparkSQL的电影分析项目实战

python数据分析实战电影票房数据分析数据采集

python数据分析实战电影票房数据分析数据可视化

对豆瓣电影近十年数据进行分析分析(截止2019年3月)