推荐领域数据集

Posted 白婷的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐领域数据集相关的知识,希望对你有一定的参考价值。

转自:http://blog.csdn.net/dajunxing/article/details/51357132,感谢分享!

http://www.grouplens.org/taxonomy/term/14

Movielens Dataset:

       其中Movielens-100k和movielens-1M有用户对电影的打分,电影的title、genre、IMDB链接、用户的gender、age、occupation、zip code。movielens-10M中还有用户对电影使用的tag信息。

HetRec2011 Dataset:包括了movielens-2k、delicious-2k和last.fm-2k。

       在movielens-2k中,电影的信息更加丰富了,有IMDB和Rotten Tomatoes的信息,具体还有电影对应的genre、director、actor、发行的国家、拍摄的地点、tag信息,当然还有打分信息。

       在delicious-2k中,是用户对bookmark(书签)的tag信息。具体包括用户之间的relation、书签的title和url、用户对书签使用的tag。这个数据集适用于tag的推荐。

       在last.fm-2k中,是用户收听音乐的信息。具体包括双向的朋友关系、艺术家、用户收听艺术家信息(有weight)、用户对艺术家的tag信息、艺术家tag信息。

Wikilens Dataset

BookCrossing Dataset: 用户对书的打分信息,用户城市、用户年龄、书在Amazon的信息及url。

Jest Joker Dataset

Eachmovie Dataset

 (下图摘自论文Recommender System Survey)

Flixster Dataset: 用户对电影的打分以及用户的friendship信息。 http://www.sfu.ca/~sja25/datasets/

Epinions Dataset: 包括用户trust关系、用户对item的打分信息、评论信息。 http://www.trustlet.org/wiki/Epinions_datasets

Yelp Dataset: https://www.yelp.com/academic_dataset

Bibsonomy Dataset: 与delicious类似。http://www.kde.cs.uni-kassel.de/bibsonomy/dumps

Foursquare Dataset:Location-based 推荐。http://www.public.asu.edu/~hgao16/dataset.html

Epinions and Ciao Dataset:http://www.public.asu.edu/~jtang20/datasetcode/truststudy.htm

另外还有一些社交网络分析的数据集

    http://snap.stanford.edu/na09/resources.html

   http://snap.stanford.edu/data/

以上转自:http://www.cnblogs.com/startover/p/3261476.html

 

A Collection of Recommendation Data Sets  & data sets crawled and used in our research work

DoubanEpinions (665K)Epinions (510K)Epinions (Extended)FlixsterFilmTrustJesterMovieLens 1MMovieLens 10M

http://www.librec.NET/datasets.html

以上是关于推荐领域数据集的主要内容,如果未能解决你的问题,请参考以下文章

第一篇:使用Spark探索经典数据集MovieLens

Spark探索经典数据集MovieLens

闭眼推荐,9 个不能错过的机器学习数据集

数十篇推荐系统论文被批无法复现:源码数据集均缺失,性能难达预期

MockNeo4j知识图谱数据集Mock问答训练数据集mock

如何使用Movielens数据集进行推荐?