推荐系统之--- 利用用户行为数据
Posted allen-rg
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐系统之--- 利用用户行为数据相关的知识,希望对你有一定的参考价值。
一、用户行为数据
一个用户行为表示为6部分,即产生行为的用户和行为的对象、行为的种类、产生行为的上下文、行为的内容和权重。用户行为的统一表示如下:
user id 产生行为的用户的唯一标识
item id 产生行为的对象的唯一标识
behavior type 行为的种类(比如是购买还是浏览)
context 产生行为的上下文,包括时间和地点等
behavior weight 行为的权重(如果是观看视频的行为,那么这个权重可以是观看时长;如果是打分行为,这个权重可以是分数)
behavior content 行为的内容 (如果是评论行为,那么就是评论的文本;如果是打标签的行为,就是标签)
二、用户行为分析
在利用用户行为数据设计推荐算法之前,研究人员首先需要对用户行为数据进行分析,了解数据中蕴含的一般规律,这样才能对算法的设计起到指导作用。
1、用户活跃度和物品流行度的分布:
很多关于互联网数据的研究发现,互联网上的很多数据分布都满足一种称为Power Law的分布,这个分布在互联网领域也称长尾分布。
以上是关于推荐系统之--- 利用用户行为数据的主要内容,如果未能解决你的问题,请参考以下文章
利用用户行为数据——基于Spark平台的协同过滤实时电影推荐系统项目系列博客