如何评估基于内容的推荐系统
Posted
技术标签:
【中文标题】如何评估基于内容的推荐系统【英文标题】:How to evaluate a Content-based Recommender System 【发布时间】:2011-09-04 07:14:28 【问题描述】:我正在构建一个基于内容的电影推荐系统。很简单,只要让用户输入一个电影的名字,系统就会找到具有最相似特征的电影。
在计算相似度并按降序排序后,找到相似度最高的5个对应的电影并返回给用户。
到目前为止,当我想评估系统的准确性时,一切都运行良好。我在 Google 上找到的一些公式只是根据评分值评估准确性(比较预测评分和实际评分,如 RMSE)。我没有将相似度分数更改为评级(从 1 到 5),所以我无法应用任何公式。
您能否建议任何将相似度得分转换为预测评分的方法,以便我可以应用 RMSE?或者有没有解决这个问题的想法?
【问题讨论】:
这个问题不是更适合Cross Validated吗? 【参考方案1】:你有什么基本事实吗?例如,您是否有关于用户过去喜欢/看过/购买的电影的信息?它不一定是评级,但为了评估推荐,您需要了解有关用户偏好的一些信息。
如果你这样做了,那么除了 RMSE 之外,还有其他方法可以测量准确度。当我们预测评级时使用 RMSE(正如您所说的是真实评级和预测之间的误差),但在您的情况下,您正在生成前 N 个推荐。在这种情况下,您可以使用精确率和召回率来评估您的建议。它们在信息检索应用程序中非常有用(参见Wikipedia),它们在推荐系统中也很常见。您还可以计算 F1 指标,它是精度和召回率的调和平均值。您会发现它们是非常简单的公式,并且很容易实现。
Guy Shani 的“评估推荐系统”是一篇关于如何评估推荐系统的非常好的论文,它将让您深入了解这一切。你可以找到论文here。
【讨论】:
以上是关于如何评估基于内容的推荐系统的主要内容,如果未能解决你的问题,请参考以下文章