八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单

Posted 大数据分析和人工智能

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单相关的知识,希望对你有一定的参考价值。

上礼拜刚在Amazon买了TOTORO的汽车贴纸,这几天打开Amazon都是这些相关的推荐。

哈哈,不管你是在国内,还是国外,用淘宝还是Amazon,你应该都有这种体验吧;


有时候,哪怕你没有买,只有浏览了几样商品,这些网站也会给你一些相关推荐。

八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单

不懂推荐系统背后原理的人,会觉得,
“哇!这原来就是传说中的人工智能推荐啊,好了解我哦”

懂得人:“哦,这个网址,背后用的是哪个算法啊。”

今天,不管你懂不懂,八分钟保证你看懂推荐系统背后的原理。

01 日常生活中的2种简单的推荐方法

  • 第一种就是非定制的推荐系统;

  • 第二种就是定制化的推荐系统。

什么叫做非定制化的推荐系统呢?

简单来说就是,什么最热卖,什么关注的人多,就推荐你什么。


比如,水果店老板发现最近西瓜销量排第一,于是呢,老板逢人就推荐西瓜。

八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单

这样就产生一个问题了。
一个有糖尿病的老爷爷去买水果,老板也向他推荐西瓜。如果你是这位老爷爷,你肯定要不高兴了吧。


“糖分这么高,还使劲推荐我这个,还是换一家吧。”

八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单

原本好好的生意,就这样泡汤了。

老板,想了想,我是不是应该改变一下推荐方法啊。


比如,年纪大的人,我推荐猕猴桃,维生素丰富还能降血糖。小姑娘呢,可以推荐她们柠檬,美白又减肥。

八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单

上面的故事,就是平时我们日常生活中,会用到的推荐系统:

定制化的推荐系统,和非定制化的推荐系统。


02  定制化推荐系统的推荐方法

讲到定制化的推荐系统里面常用的方法,一般常用的有两大类。

第一种:协同过滤(collaborative filtering),什么是协同过滤呢,这个我们过会详细讲,因为这是目前蛮常用的推荐方法。

第二种:基于内容的推荐(content-based recommendation)。

基于内容的推荐大致是,我看了一篇关于足球的报道,之后又向我推荐了足球的相关报告。里面用的技术就是基于内容的推荐。

八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单

还有一些其他的推荐方法,比如co-occurrence,或者把几种方法的结果都综合组合一下的方法。

今天这篇文章,主要就是讲的是推荐系统里的明星算法,也就是前面说的第一种:协同过滤 (collaborative filtering)~


03 协同过滤是什么

协同过滤这个算法,目的就是找相似。
其中:找相似,可以是找相似的人,也可以找相似的东西。
  • 比如,我们找到相似的一群人,我们就能用其中一些人喜欢的东西,推荐给另一个人;

  • 找相似的东西的,如果一个人喜欢一样东西,那么我再推荐她另一样东西,因为这两样东西很相似。

讲了这个两个例子,是不是觉得协同过滤最重要的就是找相似啊,哈哈,那我们就讲讲这个算法的核心部分,怎么找相似。


04 协同过滤相似怎么找

我们都知道,坐标里面的两个点,如果他们的夹角越小,那么这两个点越相近(这里肯定有人要问为什么不是距离,这个问题后面会说)。

八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单

下面我们做个小练习,回顾一下初中知识,