如何使用Movielens数据集进行推荐?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用Movielens数据集进行推荐?相关的知识,希望对你有一定的参考价值。
刚刚学习协同过滤的相关内容,对于使用Movielens数据集进行推荐的整体过程还不太清楚,请问其基本方法和步骤是什么?
有大小数据集,先设计算法,再把算法用编程实现,利用训练集算出相应结果,再用测试集做对比,看看和测试集的相似度有多高,越高的话,证明你的算法越好。 参考技术A 您好,我现在正在做推荐系统这方面的本科毕设,就是不知道怎么对数据集进行处理,可以的话向您求教一下啊,我的QQ 1365522535,谢谢您了 参考技术B 现在我遇到同样的问题了,这个具体的步骤是什么啊,我现在只有数据集,不晓得怎么操作啊,让他变成矩阵!求助啊,能不能麻烦你发到我邮箱805800400@qq.com,或者加我QQ吧805800400,非常感谢!!!ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例
ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例
目录
基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例
# 2.2、使用matplotlib和NetworkX绘制知识图谱
相关文章
ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例
ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例实现代码
基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例
# 1、定义数据集
userId | movieId | rating | timestamp |
1 | 1 | 4 | 964982703 |
1 | 3 | 4 | 964981247 |
1 | 6 | 4 | 964982224 |
1 | 47 | 5 | 964983815 |
1 | 50 | 5 | 964982931 |
1 | 70 | 3 | 964982400 |
1 | 101 | 5 | 964980868 |
1 | 110 | 4 | 964982176 |
1 | 151 | 5 | 964984041 |
1 | 157 | 5 | 964984100 |
movieId | title | genres |
1 | Toy Story (1995) | Adventure|Animation|Children|Comedy|Fantasy |
2 | Jumanji (1995) | Adventure|Children|Fantasy |
3 | Grumpier Old Men (1995) | Comedy|Romance |
4 | Waiting to Exhale (1995) | Comedy|Drama|Romance |
5 | Father of the Bride Part II (1995) | Comedy |
6 | Heat (1995) | Action|Crime|Thriller |
7 | Sabrina (1995) | Comedy|Romance |
8 | Tom and Huck (1995) | Adventure|Children |
9 | Sudden Death (1995) | Action |
10 | GoldenEye (1995) | Action|Adventure|Thriller |
11 | American President, The (1995) | Comedy|Drama|Romance |
userId movieId rating timestamp
0 1 1 4.0 964982703
1 1 3 4.0 964981247
2 1 6 4.0 964982224
3 1 47 5.0 964983815
4 1 50 5.0 964982931
... ... ... ... ...
100831 610 166534 4.0 1493848402
100832 610 168248 5.0 1493850091
100833 610 168250 5.0 1494273047
100834 610 168252 5.0 1493846352
100835 610 170875 3.0 1493846415
[100836 rows x 4 columns]
# 2、构建知识图谱
# 2.1、创建Graph
graph
Graph with 9829 nodes and 100403 edges
# 2.2、使用matplotlib和NetworkX绘制知识图谱
# T1、直接绘制
# T2、将网络转化为稀疏矩阵再绘制
# 3、基于知识图谱实现推理
recommended_movies
Index(['movieId', 'score', 'title', 'genres'], dtype='object')
user_id= 1
title genres
0 Toy Story (1995) Adventure|Animation|Children|Comedy|Fantasy
1 Air Up There, The (1994) Comedy
2 Pretty Woman (1990) Comedy|Romance
3 Natural Born Killers (1994) Action|Crime|Thriller
4 Total Eclipse (1995) Drama|Romance
recommended_movies
Index(['movieId', 'score', 'title', 'genres'], dtype='object')
user_id= 11
title genres
0 American President, The (1995) Comedy|Drama|Romance
1 Jurassic Park (1993) Action|Adventure|Sci-Fi|Thriller
2 Vampire in Brooklyn (1995) Comedy|Horror|Romance
3 In the Line of Fire (1993) Action|Thriller
4 Silence of the Lambs, The (1991) Crime|Horror|Thriller
以上是关于如何使用Movielens数据集进行推荐?的主要内容,如果未能解决你的问题,请参考以下文章
ML之CF:基于MovieLens电影评分数据集利用基于用户协同过滤算法(余弦相似度)实现对用户进行Top5电影推荐案例