浅谈推荐系统

Posted 区块链and语义研究实验室

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了浅谈推荐系统相关的知识,希望对你有一定的参考价值。



李雷


互联网技术的发展使我们走入了一个信息爆炸的时代,在海量信息能非常方便快捷的呈现在我们面前的同时,也带来了一些负面问题。同学们知道是什么问题吗?

俗话说:乱花渐欲迷人眼。在信息爆炸的时代,我们想从大量的信息中找到自己感兴趣的、适合自己的信息会变得非常困难。

浅谈推荐系统

韩梅梅


对信息提供方来说,提供方需要提供大量的信息才能取得部分收益,这样提供信息花费的成本与取得的回报根本不成比例。

浅谈推荐系统

Jim


浅谈推荐系统

李雷


是的,两位同学说的非常好。我们分析原因,可以发现信息量的爆炸式增长固然是原因之一,但其实还有一个更深层次的原因,那就是提供方提供的信息没有几乎没有任何关联与针对性。

遍地撒网,愿者上钩!

浅谈推荐系统

Jim


浅谈推荐系统

李雷


这个比喻用的很好,正是因为信息与用户没有较强的关联与针对性,用户就只能“随缘”获取信息,因此互联网上的信息利用率相对较低。


      信息量的爆炸式增长,使信息与用户的关联性、针对性反而减弱,用户无法快捷地获取自己想要的信息,导致信息的利用率低下,也使信息提供方付出的成本变得高昂。



那么,用什么方式可以解决这些问题呢?

浅谈推荐系统

韩梅梅


推荐系统!

浅谈推荐系统

Jim


浅谈推荐系统

李雷


没错!推荐系统可以向用户推荐“量身定做”的内容,因而能极大的提高互联网上相关信息的利用率。其实,推荐系统早在上个世纪就已经开始研究,不过真正广泛运用还是大数据时代开启后。

因为大数据使用户的行为能够被更准确的分析,从而使信息提供商能准确地刻画用户画像,分析用户喜好,从而给用户推荐相关的内容。

浅谈推荐系统

Jim


浅谈推荐系统

李雷


对,推荐系统其实就是一种信息过滤系统,通过大量数据与相关算法,分析计算用户的行为偏好,从而发掘或预测出用户的个人需求,给予用户相关推荐。

下图是一个推荐系统的通用架构:

浅谈推荐系统
浅谈推荐系统

李雷


从图中可以看出,推荐系统有三大组成部分:用户行为数据收集加工模块、推荐算法模块、业务应用模块,其中最核心的内容便是推荐算法。

实际应用中,我们通常将推荐算法分为四大类,分别是基于规则的推荐算法、基于内容的推荐算法,协同过滤推荐算法和混合推荐算法。我们接下来就将对这四种推荐算法进行详细介绍。

浅谈推荐系统




浅谈推荐系统

李雷


首先是基于规则的推荐算法,它是一种以规则为导向的推荐算法,也称为基于流行度的推荐算法,这类算法很简单,就是对产品进行一个简单的结构化数据统计,例如用户点击量、用户购买量、用户评分等,再利用设定好的规则进行过滤,最后取排行的前n名给用户进行推荐。

浅谈推荐系统

基于规则的推荐算法似乎没有使用大数据智能技术。

浅谈推荐系统

Jim


浅谈推荐系统

李雷


没错,该类算法只是简单的对结构化数据进行统计,因此没办法实现个性推荐,从智能的角度来说是非常局限的。但是该类推荐算法的实现十分简单,执行效率非常高,因此在生产领域反而使用广泛。你们能举一些例子吗?

我知道,微博热搜、百度热点!

浅谈推荐系统

韩梅梅


还有视频网站的热门视频、购物网站的”大家都在买“这类!

浅谈推荐系统

Jim






浅谈推荐系统

李雷


第二大类是基于内容的推荐算法,它是一种以内容为导向的推荐算法,通过对内容进行特征提取,从而向用户推荐相同或近似的内容。对内容特征提取的准确率会直接影响到最终推荐结果的准确度。

浅谈推荐系统

基于内容的推荐算法适用于新闻、视频、音乐等多媒体内容的推荐,因为用户可能喜欢相同、相似的内容。

不太适用于购物推荐,因为一般来说,用户购买了某类物品,短时间内是不会再去买第二件同类物品的。

浅谈推荐系统

韩梅梅


浅谈推荐系统

李雷


是的。此外,基于内容的推荐算法极大依赖于对内容特征提取的准确性,例如对内容打分类型、打Tag等。这类工作在早期由人工来完成,但是随着人工智能技术的发展,特别是自然语言处理技术的发展,提取内容特征的工作逐渐交由机器自动完成,从而极大提升了系统效率。





浅谈推荐系统

李雷


第三类是协同过滤推荐算法,这是目前在众多推荐系统中,基本上都会使用到的一种推荐算法,协同过滤推荐算法。这种算法的一个思想就是:“物以类聚,人以群分”,喜欢相同物品的用户更有可能具有相同的兴趣。

浅谈推荐系统
浅谈推荐系统

李雷


这类算法又分为:基于用户的协同过滤、基于物品的协同过滤和基于模型的协同过滤。分别是对用户刻画画像、对物品刻画特征、建模分析的方式来分析用户与用户的相似度。协同过滤推荐算法的核心其实就是相似度算法。

我知道了,是依靠相似度算法来计算出用户之间的相似与否,最后从相似的用户之间互相推荐内容。

浅谈推荐系统

韩梅梅


是这个理儿。因此,这类算法的优点是计算性能好,准确度一般较高,稳定性较好,而且容易发现用户的潜在兴趣点。但也有一些缺点:需要大量的用户行为数据来计算相似性,数据不足时无法保证准确度。

浅谈推荐系统

Jim






浅谈推荐系统

李雷


最后是混合推荐算法。

看这个名字,感觉和机器学习中的集成学习差不多,博才众长,通过多个推荐算法的结合,得到一个更好的“混合”推荐算法。

浅谈推荐系统

Jim


浅谈推荐系统

李雷


其实与其叫做混合推荐算法,我更宁愿叫做采用多种算法的混合推荐系统,因为该类并不是将几个推荐算法融合成一个算法,而是将其组合成一个系统。

那么算法是怎么组合的呢?

浅谈推荐系统

韩梅梅


浅谈推荐系统

李雷


组合的方式有很多,不过最典型的方式有两种:加权和级联。

就类似于电路中的并联和串联?

浅谈推荐系统

Jim


浅谈推荐系统

李雷


没错!加权就相当于并联,使用不同推荐算法对相同的内容计算分数,最后按照权值计算总分,通过最终的总分对内容进行推荐。

浅谈推荐系统
浅谈推荐系统

李雷


级联就相当于串联,先使用第一种推荐算法计算出一次推荐结果(可能结果很多),然后再使用第二种推荐算法对第一次的结果再次计算……以此类推,最终得到top n 的推荐结果。

浅谈推荐系统

除了这两种,还有没有其它组合方式呢?

浅谈推荐系统

韩梅梅


浅谈推荐系统

李雷


有!混合模式还有切换式、层叠式、特征组合式、特征补充等多种模式。在混合推荐算法中,选用何种混合模式,一般需要考虑到子算法的互补性,也就是组合后的算法需要使结果的准确度有较大提升才行。





浅谈推荐系统

李雷


那么以上就是推荐系统的介绍。学了这么多推荐系统的知识,大家有什么感受或收获呢?

推荐系统的基础是用户行为数据收集,核心是推荐算法。推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾物品准确推荐给需要它的用户,帮助用户找到他们感兴趣但很难发现的物品。高质量的推荐系统会使用户对系统产生依赖,因此推荐系统能为用户提供十足的个性化服务。

浅谈推荐系统

Jim


推荐系统还能与用户建立长期稳定的关系,提高用户忠诚度,防止用户流失。此外,推荐系统可以运用在非常多的地方,无论是电商行业、新闻行业还是知识服务行业等,只要有客户参与服务,都可以使用推荐系统来增加客户的体验。

浅谈推荐系统

韩梅梅


浅谈推荐系统

李雷


没错,大家说的都很好!推荐系统也是多种技术综合的一种系统,其中包括但不限于大数据、自然语言处理、相似度计算、语义模型、特征提取等技术,这些技术的发展与应用都能提高推荐系统的推荐结果准确度。





浅谈推荐系统

李雷


说了这么多,相信大家也收获了很多,不如留言一起聊一聊吧。

也可以私信我们,欢迎提问!

Jim


欢迎大家踊跃留言交流!

韩梅梅



以上是关于浅谈推荐系统的主要内容,如果未能解决你的问题,请参考以下文章

浅谈推荐系统

浅谈推荐算法

浅谈微视推荐系统中的特征工程

浅谈商品推荐:如何猜中用户的心思?

浅谈Docker之Docker初步安装及配置(CentOS)

资料汇总