推荐系统简介(1~3)

Posted Jozky86

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐系统简介(1~3)相关的知识,希望对你有一定的参考价值。

接下来10天时间做一个推荐系统项目
学习网站:

文章目录

推荐系统的基本思想

推荐系统的数据分析

用户:个人信息,喜好标签,上下文信息
物品:内容信息,分类标签,关键词
用户行为信息:评分/评价,打标签,点击/浏览,收藏/购买

推荐算法分类


主线按照数据源来分类

基于人口统计学的推荐算法

人以群分

基于内容的推荐算法

根据电影的内容来判断相似,基于相似度原则

基于协同过滤的推荐算法

协同过滤(Collaborative Filtering,CF)
用户与物品之间相关联的矩阵

基于用户(User-CF)

基于物品的协同过滤(item-CF)

物品被哪些人喜欢,找出物品的相似度

混合推荐

基于内容和协同过滤区别


CF依赖于历史数据,对于新用户会出现冷启动问题。

推荐系统评测

让用户,网站,内容三方满意

推荐系统实验方法

离线实验


好处:方便
坏处:无法直接获得实际业务标准,真实可靠程度打折扣

用户调查

在线实验

AB测试
两套系统分别测试

评测指标

推荐准确度评测

准确率、精确率和召回率

TP(True Positive):正确的正例,一个实例是正类并且也被判定成正类
FN(False Negative):错误的反例,漏报,本为正类但判定为假类
FP(False Positive):错误的正例,误报,本为假类但判定为正类
TN(True Negative):正确的反例,一个实例是假类并且也被判定成假类


准确率(accuracy):
正确分类的item数与总数之比
公式:(TP+TN)/(总数)
A=(20+50)/100=70%
精确率(precision):
所有被检索到的item中,“应该被检索到的item占的比例”
公式:TP/(TP+FP)
P=20/(20+30)=40%
召回率(recall):
所有检索到的item占所有“应该检索到的item”的比例
公式:TP=(TP+FN)
R=(20)/(20+0)=100%

以上是关于推荐系统简介(1~3)的主要内容,如果未能解决你的问题,请参考以下文章

Kemaswill 机器学习 数据挖掘 推荐系统 Python optparser模块简介

[机器学习]推荐系统简介——一起来看看你是怎么被大数据杀熟的

吴恩达机器学习-11-推荐系统

机器学习和推荐系统中的评测指标—准确率(Precision)召回率(Recall)F值(F-Measure)简介

机器学习-推荐系统

LibRec: 基于机器学习的大数据推荐系统