推荐系统简介(1~3)
Posted Jozky86
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐系统简介(1~3)相关的知识,希望对你有一定的参考价值。
接下来10天时间做一个推荐系统项目
学习网站:
文章目录
推荐系统的基本思想
推荐系统的数据分析
用户:个人信息,喜好标签,上下文信息
物品:内容信息,分类标签,关键词
用户行为信息:评分/评价,打标签,点击/浏览,收藏/购买
推荐算法分类
主线按照数据源来分类
基于人口统计学的推荐算法
人以群分
基于内容的推荐算法
根据电影的内容来判断相似,基于相似度原则
基于协同过滤的推荐算法
协同过滤(Collaborative Filtering,CF)
用户与物品之间相关联的矩阵
基于用户(User-CF)
基于物品的协同过滤(item-CF)
物品被哪些人喜欢,找出物品的相似度
混合推荐
基于内容和协同过滤区别
CF依赖于历史数据,对于新用户会出现冷启动问题。
推荐系统评测
让用户,网站,内容三方满意
推荐系统实验方法
离线实验
好处:方便
坏处:无法直接获得实际业务标准,真实可靠程度打折扣
用户调查
在线实验
AB测试
两套系统分别测试
评测指标
推荐准确度评测
准确率、精确率和召回率
TP(True Positive):正确的正例,一个实例是正类并且也被判定成正类
FN(False Negative):错误的反例,漏报,本为正类但判定为假类
FP(False Positive):错误的正例,误报,本为假类但判定为正类
TN(True Negative):正确的反例,一个实例是假类并且也被判定成假类
准确率(accuracy):
正确分类的item数与总数之比
公式:(TP+TN)/(总数)
A=(20+50)/100=70%
精确率(precision):
所有被检索到的item中,“应该被检索到的item占的比例”
公式:TP/(TP+FP)
P=20/(20+30)=40%
召回率(recall):
所有检索到的item占所有“应该检索到的item”的比例
公式:TP=(TP+FN)
R=(20)/(20+0)=100%
以上是关于推荐系统简介(1~3)的主要内容,如果未能解决你的问题,请参考以下文章
Kemaswill 机器学习 数据挖掘 推荐系统 Python optparser模块简介
[机器学习]推荐系统简介——一起来看看你是怎么被大数据杀熟的