八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单
Posted 大数据分析和人工智能
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单相关的知识,希望对你有一定的参考价值。
上礼拜刚在Amazon买了TOTORO的汽车贴纸,这几天打开Amazon都是这些相关的推荐。
哈哈,不管你是在国内,还是国外,用淘宝还是Amazon,你应该都有这种体验吧;
有时候,哪怕你没有买,只有浏览了几样商品,这些网站也会给你一些相关推荐。
不懂推荐系统背后原理的人,会觉得,
“哇!这原来就是传说中的人工智能推荐啊,好了解我哦”
懂得人:“哦,这个网址,背后用的是哪个算法啊。”
今天,不管你懂不懂,八分钟保证你看懂推荐系统背后的原理。
01 日常生活中的2种简单的推荐方法
第一种就是非定制的推荐系统;
第二种就是定制化的推荐系统。
什么叫做非定制化的推荐系统呢?
简单来说就是,什么最热卖,什么关注的人多,就推荐你什么。
比如,水果店老板发现最近西瓜销量排第一,于是呢,老板逢人就推荐西瓜。
这样就产生一个问题了。
一个有糖尿病的老爷爷去买水果,老板也向他推荐西瓜。如果你是这位老爷爷,你肯定要不高兴了吧。
“糖分这么高,还使劲推荐我这个,还是换一家吧。”
原本好好的生意,就这样泡汤了。
老板,想了想,我是不是应该改变一下推荐方法啊。
比如,年纪大的人,我推荐猕猴桃,维生素丰富还能降血糖。小姑娘呢,可以推荐她们柠檬,美白又减肥。
上面的故事,就是平时我们日常生活中,会用到的推荐系统:
定制化的推荐系统,和非定制化的推荐系统。
02 定制化推荐系统的推荐方法
讲到定制化的推荐系统里面常用的方法,一般常用的有两大类。
第一种:协同过滤(collaborative filtering),什么是协同过滤呢,这个我们过会详细讲,因为这是目前蛮常用的推荐方法。
第二种:基于内容的推荐(content-based recommendation)。
基于内容的推荐大致是,我看了一篇关于足球的报道,之后又向我推荐了足球的相关报告。里面用的技术就是基于内容的推荐。
还有一些其他的推荐方法,比如co-occurrence,或者把几种方法的结果都综合组合一下的方法。
今天这篇文章,主要就是讲的是推荐系统里的明星算法,也就是前面说的第一种:协同过滤 (collaborative filtering)~~
03 协同过滤是什么
协同过滤这个算法,目的就是找相似。
其中:找相似,可以是找相似的人,也可以找相似的东西。
比如,我们找到相似的一群人,我们就能用其中一些人喜欢的东西,推荐给另一个人;
找相似的东西的,如果一个人喜欢一样东西,那么我再推荐她另一样东西,因为这两样东西很相似。
讲了这个两个例子,是不是觉得协同过滤最重要的就是找相似啊,哈哈,那我们就讲讲这个算法的核心部分,怎么找相似。
04 协同过滤相似怎么找
我们都知道,坐标里面的两个点,如果他们的夹角越小,那么这两个点越相近(这里肯定有人要问为什么不是距离,这个问题后面会说)。
下面我们做个小练习,回顾一下初中知识,
第一张图两个从原点出发的点,他们之间的夹角是30度,cos
以上是关于八分钟就看懂 | 推荐系统 (协同过滤) 原来这么简单的主要内容,如果未能解决你的问题,请参考以下文章