有人觉得推荐理由的设计是一件很简单的事情,拼凑一些描述推荐物品优点的句子,通过这样的方式就可以产生物品的推荐理由。但是如此机械生硬的做法很容易让用户产生消极厌倦的情绪,难以获得用户对推荐系统的信赖。怎样的推荐理由才是“好”的推荐理由,才能提供良好的用户体验呢?在设计推荐理由时需要考虑到的七个设计目标我们一一列举:
透明性
使推荐系统更加透明,是推荐理由的主要作用之一,也是评价推荐理由是否有效的重要标准。推荐理由能让用户理解生成推荐结果的计算过程,同时也可以解释一个物品比另一个物品更受欢迎的原因。
用户信任度
用户对推荐系统的信任程度通常是与透明性联系在一起的。用户通过推荐理由了解到当前推荐结果的产生原理,可以增强用户对系统推荐结果的信心,并且在推荐失误的情况下对错误结果更加宽容。建立起用户对推荐系统的信心后,用户会更倾向于继续使用这个系统;相反,在透明性不好的系统,用户的信任程度偏低,使用次数也会随之下降。
可理解性
可理解性是紧密关联透明性的另一指标。用户总是希望自己有最后的决定权,如果系统推荐的商品不满意,得有办法让用户改进它。对于这类需求,需要简洁地告诉用户系统的推荐逻辑,比如“因为你喜欢A所以给你推荐了B”,用户可以依此来修改兴趣列表,调整推荐结果。
正确性
基于推荐理由,用户可以比较自己的需求和实际提供的物品特性,从而确认推荐物品的质量,验证推荐结果的准确性。一个表达准确的推荐理由能够帮助用户使用户做出更明智更准确的决策。
高效性
高效性是指让用户快速地判断推荐结果是不是真的符合自己的兴趣。在实际应用中,我们通过计算用户与推荐系统的交互次数,或者用户使用推荐理由找到心仪物品的耗费时长,作为衡量推荐理由高效性的量化标准。
说服力
给出推荐物品的正面信息以打动用户,改变和强化用户对此物品的正面观点,使其接受推荐结果并进行点击、收藏或者购买等行为。说服力通常是从推荐系统或者销售方的角度出发,目的是获取更多利益。不过说服力和用户信任度是推荐系统需要权衡的两方面因素,过分追求说服力有可能会削弱用户的信任程度。
满意度
满意度是推荐理由设计的一个综合性指标,是针对整个推荐流程而言的。推荐理由使推荐结果看上去更加友好,提供更多的参考信息,极大的改善了用户体验。
图2:推荐理由的设计维度
几乎所有推荐系统的推荐理由模块在设计时,都要涉及到这三个基本的维度:产生方式,采用信息和推荐算法。其中,产生方式包括黑盒和白盒模式,区别在于是否公开推荐过程使用的算法;采用信息,表示生成推荐理由使用了哪些输入信息;推荐算法,顾名思义,即是推荐过程中使用的计算方法。
a) 白盒模式:透明性是推荐理由设计的重要指标。在白盒模式中,推荐理由能够直接反映推荐系统生成推荐结果所使用的具体方法,具有良好的用户体验。
b) 黑盒模式:黑盒模式隐藏了推荐过程的实现原理,会使用户体验有一定影响。采用黑盒模式的原因,主要包括基于保密原因不愿公开实现细节,或者是计算方式过于繁琐复杂,缺乏简洁直观的推荐理由使用户能够一目了然。
a) 用户画像:生成推荐理由时考虑到用户的个体特性,譬如说基于用户的人口学特征、用户偏好以及用户的行为特征。
b) 物品信息:推荐理由的生成依赖于物品的特定信息。
c) 替代商品:推荐理由中包含了对替代商品的评价意见。
推荐系统的主流算法包括基于内容的推荐,协同过滤,和基于知识的推荐,对于不同的算法推荐理由有相对应的展现形式。下面介绍了推荐理由在各种推荐算法中的一些基本模板。
a) 基于内容:
最朴素简单的推荐理由生成方法,直接将匹配用户请求的物品的特征(分类、标签等)作为推荐理由。进一步说,基于内容还可以基于用户生成内容直接生成推荐理由,譬如说,专家知识类型的推荐理由一般都由人工生成然后录入系统,挑选物品相关的高质量用户评论作为推荐理由。
通常的生成方式是基于全体用户的历史行为,结合物品信息(如分类、标签等)和时间维度(月、日、小时等)进行统计分析,离线定期生成榜单结果。
基于用户的协同过滤,基本模板是“和你口味相似的用户都买了【某物品】”。算法的原理是认为相似的用户对新物品的喜好是相似的。
基于物品的协同过滤,基本模板是“买了【某物品】的用户还买了【某某物品】”。算法的原理是认为相似的物品对同一用户的喜好是相似的。
d) 基于知识
基本模板是“由于你【用户的需求或偏好】,所以你可能选择【某物品】”。基于知识的推荐的原理是对知识库进行分析处理,形成用户需求和物品之间的强规则,进而形成推荐体系。
上文提到了推荐理由的设计优化的七个指标,这七个指标是单纯在评估推荐理由时使用的。在实际应用考察推荐理由模块的效果时,我们更倾向于把推荐理由模块所在的系统作为一个整体来进行评估。在这种情况下,我们会使用如下一些标准:
1. 用户满意度:
描述用户对推荐结果的满意程度,这是推荐系统最重要的指标。测量用户满意度,可以通过调查问卷方式了解用户对推荐理由的体验感受,或者可以监测用户线上行为数据,进行AB测试来对比不同推荐理由策略的优劣。
2. 预测准确度:
描述推荐系统预测用户行为的能力。一般通过离线数据集上算法给出的推荐列表和用户行为的重合率来计算。重合率越大则准确率越高。
3. 覆盖率:
描述推荐系统对物品长尾的发掘能力。一般通过所有推荐物品占总物品的比例和所有物品被推荐的概率分布来计算。比例越大,概率分布越均匀则覆盖率越大。
4. 多样性:
描述推荐系统中推荐结果能否覆盖用户不同的兴趣领域。一般通过推荐列表中物品两两之间不相似性来计算,物品之间越不相似则多样性越好。
5. 学习速度:
描述推荐系统是否能够快速地获取用户的偏好信息,以及能否快速感知对用户偏好的变化。推荐理由能够通过暗示用户的偏好发生变化,从而提升了用户的满意度。要获取学习速度方面的效果,系统须允许用户去修改自己的偏好信息,然后使用用户线上行为数据进行AB测试来进行分析比较。
达观数据智能推荐引擎将静态和动态推荐理由自动结合。在推荐系统运行过程中,静态推荐理由挖掘模块可以通过分析数据统计系统内容,将每个待推荐对象各种统计数据生成用户可直观理解的推荐理由,这些统计数据包括,物品不同指标下的榜单信息构成理由,物品的用户行为信息构成理由,和物品的用户行为趋势信息构成理由。
而动态推荐理由挖掘模块,对每个待推荐内容根据传入的推荐上下文自动进行运算,并给出相应的动态推荐理由。根据每次输入的参数不同,给出的推荐理由也各不相同。在针对某次具体应用场景的实施应用中,动态推荐理由包括,按地域或时间生成的推荐理由,按传入的用户历史的浏览行为生成的推荐理由,和按物品的关键词、属性、类别等生成推荐理由。
目前达观智能推荐系统已经成功服务了
招商银行、浦发银行、中国移动、中国联通、人民网、四川日报、虎扑、澎湃
等多个行业龙头企业。