8种策略解决推荐系统的冷启动难题

Posted 丸子笔记

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了8种策略解决推荐系统的冷启动难题相关的知识,希望对你有一定的参考价值。

This browser does not support music or audio playback. Please play it in WeChat or another browser.

丸子妹:天气开始渐凉,思绪开始游荡。


即使你没有接触过推荐系统,那你也一定听说过“千人千面”。


从今日头条到淘宝京东,推荐系统已然成为各家app或网站的标配,只要它的内容或商品sku足够丰富,那么它一定会用到推荐系统。简单来说,个性化推荐就是平台会根据用户的个人信息(静态信息&动态信息)及产品信息,为不同的用户在不同的场景提供不同的内容或商品的推荐。


推荐系统的理论基础在于,用户具有异质性,其前提条件是平台拥有足够多的用户和资源(内容或商品等)


在推荐相关的产品中,大家的焦点总是在算法模型的升级迭代和效果提升上,这样的内容层出不穷也更容易获得关注,但实际做推荐模块的产品和开发一定会遇到一个绕不开的难题,那就是:推荐系统如何进行冷启动。本文将结合实际工作的经验总结为大家提供几个冷启动的方法策略,不涉及算法。


冷启动问题的目标用户:

1.新到访用户或新注册用户;

2.行为轨迹非常稀疏、个人信息基本没有的用户;

3.低频应用场景相关行业的用户;


针对这三种场景的目标用户,冷启动的主要策略主要包含2个方面:充分挖掘用户的个人信息、充分利用已有资源信息。而接下来将围绕2个核心方向分别介绍4种产品策略,共8种。实际在运用的过程中,用户和资源的各种策略可交叉进行一对一,一对多的策略组合,这个数学组合问题我就不算了,总之远大于八种。


8种策略解决推荐系统的冷启动难题


一、充分挖掘用户的个人信息


策略1.未注册的用户位置信息授权


对于未注册用户,我们所拥有的用户信息少之又少,几乎等于没有。一方面平台当然希望首次到访的用户进行注册,但仍旧会有一部分用户跳过了注册步骤,通过游客身份体验产品功能,这时如果平台本身有弹窗请求获取用户授权之后的定位信息,那这个信息对于从用户角度进行冷启动还是非常有用的。


当你获得了用户的定位信息之后,大的范围是省份、城市(如电商、旅游平台),小的范围可能定位到街道楼宇(如外卖、打车平台),此时的冷启动策略则是根据平台已有的相应省份、城市或街道楼宇用户的行为提取出来,获取近期一段时间的热门资源作为此类用户的推荐内容。



对于已经注册的用户来说,一般我们能够拿到用户的手机号、相关位置信息以及其他一些静态信息(诸如年龄、职业、学历、婚姻状态、是否有小孩儿等),此类静态信息相对比第一种场景更加丰富,而此时的冷启动策略也需要具体细分到每一个信息点的挖掘。


比如手机号和位置信息,除了策略1种的方案,还可以判断用户的常住地、家乡等,对于出行行业来说,国家法定假日等是否可以给用户提供往返交通,异地场景十分可以推荐酒店;


比如年龄,可以参照数据库中已有较明显的兴趣倾向的不同,对于电商、短视频等行业来说,年轻用户更倾向于美食、穿搭、潮流、萌宠等,而中老年用户则更倾向于养生、健康提醒、生活妙招、太极广场舞等;


比如是否有小孩儿,对于住宿行业可以提供有家庭房的酒店,对于出行行业提供儿童票婴儿票相关信息,对于电商则可推荐儿童玩具及教育相关的内容等;


策略3.用户来源渠道(针对有投放渠道跟踪的场景)


对于通过广告投放等渠道进入的新用户,如果平台对投放渠道有相应的跟踪机制,那么用户进入平台后,可根据所在投放渠道具体投放的内容进行个性化推荐。


一般来说,目前外部广告投放也会针对不同的渠道不同的人群投放不一样的物料,推荐模块可将各个渠道投放的物料进行打点分类标记,同一物料可打多个相关的标签,在明确吸引用户来到平台的那个触动点之后,对于用户进行同等维度内容或资源的推荐,沉淀转化效果一定不错。


策略4.用户主动提供的兴趣内容


针对新用户,可以让用户在首次访问时主动提供自己感兴趣的内容,此方案需与其他产品模块进行联动,通过用户主动圈定可快速了解用户喜好从而在冷启动场景有较为精准的召回候选集。


比如种草类,让用户选择化妆品、电子产品、男装/女装、美食等;

比如新闻类,让用户选择实时热点新闻、娱乐新闻、生活八卦、职场宝典等;

比如旅游类,让用户选择心仪的目的地类型,亲子欢乐、浪漫情侣、海岛度假、历史寻迹等;


8种策略解决推荐系统的冷启动难题


二、充分利用已有资源信息


策略1.花式推荐热门资源


冷启动时,普遍使用的就是热门资源这个推荐策略了。全平台热门的内容或者商品,那么对于新用户来说问题也不大。整体思路是没问题的,但具体问题还是要具体分析。虽然整个平台上的热门资源约等于最所有用户来说最好卖的资源,但不同的平台还是可以结合已经获得的用户相关的信息进行细分场景的优化。


比如电商平台,11月份全平台热卖的可能已经是羽绒服、暖宝宝了,可是对于广州的用户来说,能推荐这些么?


比如电影平台,今天最热门的新闻可能是一部国产儿童动画片,那么对于中青年男女用户是不是一定要围绕这个点去推荐呢?


比如招聘平台,当下最热门的岗位可能是AI算法工程师、python开发,但是对于产品经理来说有效信息几乎等于零。


关键结论:结合平台当下的热门资源以及获得的用户基本属性,尽可能多的进行不同品类曝光,避免单一品类热门资源影响总体效果。



策略2.积极曝光优质的新品资源


推荐平台热门资源当然没问题,但是时令性的,实时性的一些新品虽然没有积累的热度,但由于其在当下具有非常高的转化率,如果能够及时做推荐曝光效果也不一定差哦。新品资源的推荐维度一方面可以通过算法直接加权,另一方面可以通过新品与已有资源的属性进行物品的协同,找出其共性,从而锚定目标人群进行推荐。


比如近期电商平台,金秋时节的大闸蟹开始上市了,虽然从全平台或局部区域大闸蟹都不一定有足够的热度,但因为大闸蟹属于时令性产品,其权重不应该低于所有的设定的热门资源,因此新用户进来推荐一下时令好货用户的点击转化会比较不错。


比如新闻资讯平台,每天的实时热点都不同,当用户没有主动提供关注的兴趣领域时,除了当下总体热度最高的新闻,其实热度增长幅度较高的新闻资讯可以推荐给用户。


策略3.重点关注“专家”标注的资源


这里的专家范围比较广泛,主要是领域内的运营同学或者产品同学或者kol等。专家标注的资源是指基于认同领域内的专家的意见之上,对于平台所拥有的资源进行人工标注。标注的资源主要包括:热度相对较高、种类相对广泛、质量相对较优、近期时效性相对较前的一部分资源,同时结合平台已获取到的用户维度的信息,进行更细粒度的组合推荐。


此方案需要耗费一定的人力和时间成本,因此需要多方权衡。


策略4.挖掘少有的用户行为轨迹里面的信息


用户本身如果已经产生了轨迹但比较稀疏,算法的效果可能也比较差。那么针对这类用户,应该从为数不多的轨迹行为中挖掘用户的兴趣点和关注度,利用规则快速覆盖。但这条策略的使用有两个要点

1.必须是近期一段时间内的轨迹我们才会进行深入挖掘;

2.必须结合资源推荐的其他维度进行推荐;


针对以上两个要点,分析其本质主要是用户的需求是变化的(很大可能),半年前的一两条轨迹和今天他到平台的需求可能已经发生了变化,基于此,即使是一个月前的轨迹,那我们也应该考虑到其时效性的成本,需要结合当前热门的资源或新品资源进行多样化推荐,否则推荐的内容就可能驴唇不对马嘴。


对于用户点击过的资源(内容或商品)其本身的价值系数较高,平台可以通过分析其品类、标签及其他属性,挖掘其相关联的商品(同品类同属性,或关联属性),从而丰富推荐候选集,达到比较好的推荐效果。


比如旅游平台,也许用户半年之前浏览过“家庭房”“家庭出游”相关的内容或产品,但今天他到访平台,我们一方面可以认定用户属于亲子用户可以进行此类资源的推荐。但同时也要考虑到用户需求的变化,如之前浏览或预订是帮亲戚或朋友一家(孩子属于亲戚或朋友家)完成的,这次是自己的需求需要完成(用户本身未婚),那么在推荐维度上需要考虑当前热门的出行目的地或游玩方式,多样化推荐总不会太差。


实际应用落地过程中,应该根据平台自身业务场景以及目前已有的用户&资源的信息进行多重策略的交叉组合,从而找到不同场景对应的最佳冷启动方案。


欢迎随时讨论交流~


往期相关热门文章:





以上是关于8种策略解决推荐系统的冷启动难题的主要内容,如果未能解决你的问题,请参考以下文章

ChatGPT教你解决推荐系统的冷启动问题(中英文版)

推荐系统冷启动

如何解决推荐系统中的冷启动问题?

深度 | 推荐系统如何冷启动?

冷启动处理

4招有效解决推荐系统冷启动难题