推荐系统之集体智慧再理解

Posted 尼萌工作室

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐系统之集体智慧再理解相关的知识,希望对你有一定的参考价值。


 这是尼萌工作室的第【 15】篇文章。本文正文1470字,阅读完成约15分钟。


摘要:基于人口统计学,协同过滤,基于内容推荐都是是一种集体智慧的体现,也就是需要借助于群体信息做决策。


在推荐工程中, 常用到的一种思想为集体智慧决策。

一般来说,凡是借助于群体信息来进行信息过滤的推荐算法都可归为集体智慧。

 

基于人口统计学,协同过滤,基于内容推荐都是是一种集体智慧的体现,也就是需要借助于群体信息做决策。从另一个角度来讲,其实就是“借用数据”,在自身数据稀缺的情况下利用其他相似的信息帮助建模。




01 基于人口统计学Demogtaphic-based)

一种最易于实现的推荐方法,它只是简单的根据系统用户的基本信息发现用户的相关程度,然后将相似群体的用户喜爱的其他物品推荐给当前用户。

基于大数据技术,将企业用户标签化,构建成用户画像,如四川推荐麻辣火锅,做到群体大致精准的推荐。


02 协同过滤(Memory-based)


通过历史行为数据来找到某种人(User)和物(Item)的可能关联来进行推荐,又称为Neighborhood-based(近邻推荐)。

基于用户行为相似信息的推荐模型, 根据用户在物品上的行为找到物品或者用户的“近邻”,这里的“邻”,一般指群体,其基本假设是相似的用户可能会有相似的喜好,相似的物品可能会被相似的人所偏好。

熟悉的包括基于用户(User-CF)的协同过滤,基于物品(Item-CF)的协同过滤,word2vect embedding 等方式。

优点:不需要对物品,用户进行严格的建模,也不要求推荐的可解释性,是领域无关的。

缺点也明显:

  • 对物品和用户都存在冷启动问题(本质是基于历史行为数据)

  • 对用户行为数据准确性和完备性较高。如果用户行为太少,出现推荐偏差。

  • 若历史行为中热点集中爆发,则会出现大量用户推荐都为热门物品,有失个性化

  • 对于品味独特,小众,长尾推荐也不能很好的契合。


以上是关于推荐系统之集体智慧再理解的主要内容,如果未能解决你的问题,请参考以下文章

集体智慧和协同过滤

认知智慧城市之101:智慧交易-推荐系统

集体智慧编程-第二章-提供推荐

如何实施推荐系统?

如何利用Spark MLlib进行个性推荐?

阅读之推荐系统