推荐系统的这些坑,我全帮你踩了一遍!

Posted 51CTO技术栈

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐系统的这些坑,我全帮你踩了一遍!相关的知识,希望对你有一定的参考价值。





本文将为大家分享影响推荐系统的几个关键因素和应用智能推荐应该具备的思维模式。只有做好思想上的准备和组织架构的配合,才能更好地指导现实中的实践。




首先,智能推荐对于互联网平台来说,并不是万能的,而是数据化运营环节中的重要组成部分。其他的部分都间接影响着平台整体数据指标,也直接影响着推荐系统的使用效果。只有重视这些影响推荐系统的关键因素,才能在应用推荐系统时找到优化方向,不会沦落到万事需要推荐系统来背锅的境地。


影响推荐系统的关键因素:


(1)UI和UE;
(2)推广人群;
(3)数据;
(4)运营经验;
(5)算法。

1.达到行业标准的UI和UE
用户愿意长期使用的APP,必定是具备了作为一款合格APP的基础,在这个“颜值即正义”的时代,即软件满足用户所需的正常的人机交互体验。先不要提你的内容有多好,你的算法有多棒,如果用户在你的平台操作不畅,使用不便,再加上你的界面落伍又丑陋,那么正常用户使用后不删除就已经不错了,就更不必想着高黏性高活跃度了,所以达到行业标准的UI和UE是基础。
2.特定的推广人群
这几年移动互联网市场已经高度成熟,一款“收割”所有人、满足所有用户群体需求的APP已经不复存在。所以你的APP的内容及功能一定是重度垂直某个领域、服务某个群体的。
假设你的APP是一款同志社交的APP,如果不在同志聚集的渠道做推广,而是广撒网不分人群、不分渠道,那么可以预想到的是,绝大部分人不会下载,即使下载了也会即刻删除。
还有笔者服务过的客户里面,有客户拿着较为严肃的深度内容到服务趣头条这类网赚平台的推广渠道花大力气做推广,最终日留存只有不到9%,那么这时候的首要任务就不是提留存率而是降流失率了!尽快确定目标群体及生产、获取这个群体所匹配的高质量内容,有了稳定的使用人群之后再谈智能推荐应用问题。
3.数据
数据是贯穿在推荐系统应用中,数据就是推荐系统的食材。若数据较少,那么巧妇也难为无米之炊。对于数据较少的情况,可以先观察应用内用户的生命周期,制订数据收集计划,达到合适的数据量再上线推荐系统。理论上讲,数据量越大、数据维度越丰富,模型优化的效果越好。而实际场景中并不是这样,还需结合业务场景,具体问题具体分析。
4.运营经验
运营经验即运营过程中总结的常识和通识,每个行业每个业务场景都可运用他人总结的经验作为指导,以实现业务目标。如新闻场景中,过了时效性的新闻就不适合再被推荐了;在电商场景中有利润款、引流款、应季款、过季款。诸如此类,在每个场景都可以总结出一些普遍的规律,而这些规律在推荐系统的应用过程中是必不可少的。不仅可以让推荐系统提升更多的指标,而且没有这些规律的干预,推荐系统根本无法正常运行。
5.算法
算法,也是推荐系统的核心。不存在适用所有场景的推荐算法,只有根据不同业务场景搭配、优化的算法组合。当然,如果你的平台尚处婴儿期,那么算法确实很难让平台有质的提升。而平台进入成熟期之后,算法的优劣将会带来指数级的变化。
上述五个关键因素都会直接地影响推荐效果,在平台的各个阶段每个因素的重要性会有所不同。因此,在资源没那么多、人手没那么足的情况下,要优先解决主要矛盾,抓大放小。

应当具备的思维


除了注意以上关键因素,还应当具备以下两种思维也是重要的一个部分。
1.不确定性思维
首先我们要具备的是不确定性思维。推荐系统与大部分AI系统一样,提供的都是概率性算法,都是提供更高概率的用户满意的推荐结果,这与传统的软件有本质区别。大多数传统软件的目标是给用户提供一套稳定的、符合具体功能预期的工具。
例如CRM系统,用户在选择时的要求很简单,就是看功能是否满足需求、看软件是否易用稳定,至于使用CRM系统后的销售额能够提升多少,那跟这套系统基本没有什么关系。
又如RPA系统,机器人就是根据固定的规则完成指定性的工作,工作的结果只有成功与未成功两种,反馈给用户或使用者的都是确定性结果。
推荐系统不仅是内容分发的通道,更是提高分发效率的工具,从指标提升的结果上看,分发效率提升多少是不确定的。因为其千人千面的特性,测试、运营人员很难检测所有用户的推荐结果,也不能复现每个用户的操作过程,更不能保证单个用户对推荐结果是否满意,所以推荐结果满意度也是不确定的。
在推荐结果与效果不确定的前提下,就需要一个确定的目标来衡量推荐效果、引导推荐结果,因此需要我们具备目标性思维。
2.目标性思维
所谓目标性思维即我们做的所有工作都是围绕着目标进行的,其背后隐含的逻辑是所有的工作成果都是可以被量化的。既然推荐结果存在不确定性,那么用“推荐结果很准”“推荐结果质量很高”这样比较玄学、虚无的概念是无法判断推荐系统的真正的工作状态的。
因此,我们可以在每个业务场景上设置一个较为合理的目标,把UI、UE、数据、算法、推荐策略等这些关键因素与业务场景的数据指标看作一个函数关系,这些关键因素是这个函数关系的自变量,而我们不断地调整、优化这些自变量使函数的输出值即业务场景数据指标达到我们确定的合理的目标。
当我们具备目标性思维时,所有跟推荐系统相关的动作均现出了原形,无论多么主观地强调现有推荐工作是多么的完善、多么的强大,我们只看最终的结果是否达到了目标。所以目标性思维即比较朴素的“黑猫白猫,能抓到老鼠就是好猫”的结果导向性思维。




比较合理的做法是:提前制订一个合理的指标点,在有限的推荐系统试用周期内,通过算法策略调整、运营经验干预等优化方式与运营人员通力合作,努力让数据指标有上升性趋势,用目标的确定来应对推荐结果的不确定。



当然,推荐结果有时会出现明显的不合乎情理、不符合常识的情况,艾克斯通过追踪用户的所有用户行为、推荐结果及推荐原因的方式,将推荐结果“白盒化”并展示在独立的管理后台,虽然无法做到统计学意义上的推荐结果的可解释性,但至少可以追踪单个用户。
因此,我们可以通过随机抽样的方式,通过对用户行为结果及原因的追踪,分析样本结果的合理性,从而尽可能的从概率上提高整体用户的推荐效果。同时,结合管理后台的相应数据指标,如黏性、CTR等,用明确的数据指标驱动推荐业务工作。
小结:
综上所述、对于一个企业而言,是否上线智能推荐系统以及如何上线推荐系统都是个至关重要的问题。从上线、部署、到投入应用都离不开对以上关键因素的考虑。并且平台还必须看清推荐系统的实际作用,具备合理的心理预期。只有做足了这些准备,才能实现推荐系统效果的最优化。

6月23日今晚8点,【51CTO大咖来了】邀请到珠海金山网络游戏科技有限公司(西山居)人工智能领域专家,高级算法工程师黄鸿波老师,来为大家进行智能推荐系统在企业中的落地的主题直播,以企业实际的智能推荐系统落地为出发点,对推荐系统在落地过程中常见的企业架构以及会存在的一些技术问题做了一定的总结,感兴趣的朋友请扫描海报中的二维码或者点击下方“阅读原文”进行报名。


点击阅读原文报名活动

以上是关于推荐系统的这些坑,我全帮你踩了一遍!的主要内容,如果未能解决你的问题,请参考以下文章

实测两款 GitHub 开源抢票插件,所有坑都帮你踩过了

使用Docker部署前端项目实战教程,该踩的坑我都帮你踩了!

使用Docker部署前端项目实战教程,该踩的坑我都帮你踩了!

精品投稿推荐系统评测心得

在你做推荐系统的过程中都遇到过什么坑?

万字长文总结!深度剖析那些Java开发中碰到的异常,一次性全帮你处理掉!