字节跳动推荐平台技术公开,项亮:底层架构有时比上层算法更重要

Posted QbitAl

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字节跳动推荐平台技术公开,项亮:底层架构有时比上层算法更重要相关的知识,希望对你有一定的参考价值。

允中 发自 凹非寺
量子位 报道 | 公众号 QbitAI

字节跳动已正式吹响进军云计算市场号角。

12月2日,火山引擎全系列云产品亮相,共推出了78项云产品服务,涵盖云基础、视频及内容分发、数据中台、开发中台、人工智能等五大类。

火山引擎云产品以性价比、提升业务价值作为重要卖点。发布会上,字节跳动AML(应用机器学习)负责人项亮出现在“新云•智享盛宴”分会场,详细介绍了智能推荐如何结合云服务为企业创造价值,并首次向外界分享了火山引擎智能推荐系统的技术演进和应用实践。

项亮是《推荐系统实践》的作者,其所在的字节跳动AML团队,为火山引擎的智能推荐技术服务提供了全力支持。

以下为项亮演讲全文。

项亮演讲原文

很多人理解推荐就是推荐算法,机器学习模型怎么做的、这些模型怎么调参,觉得这些很重要。其实我想说,推荐系统里底层的工程架构、系统架构非常重要,某种程度上会超过上层的算法。

我们在内部很多实践里也看到,底层工程架构、系统架构如果出现问题,对业务造成的影响是大于算法的。这就是火山引擎为什么要推出推荐系统平台这样一个偏底层架构的产品。

我给大家分三个方面介绍一下智能推荐平台:首先介绍推荐在不同产品、不同业务中究竟发挥什么作用,以及智能推荐平台会给企业带来什么价值;然后我会稍微详细介绍一下平台各个模块大概是做什么的,具有什么能力;最后介绍一些我们客户使用推荐系统的案例。

可以做选择的地方,就可以做推荐

我做推荐系统已经十几年了。很早之前,很多人认为推荐就是锦上添花的工作。但是在今日头条、抖音这些产品的成长中,个性化推荐发挥了重要的作用。推荐也逐渐成为了互联网信息分发的主流模式。

信息分发到现在一共经过了四个阶段,这些阶段一方面有先后顺序,另一方面也不完全是替代关系。比如最早的门户时代,信息分发的方式是分类索引;到了谷歌做搜索引擎,这是基于用户的主动性,通过搜索的方式发现信息;再往后出现了脸书、YouTube,还有国内的微博、微信这些产品,用户基于订阅关注获得信息;然后就是推荐引擎,从“人找信息”变成了“信息找人”。这是在移动互联网时代快速发展起来的,现在已经成为了比较主流的信息分发方式。

所有可以选择的地方,为了解决用户选择困难,基本都可以上推荐系统。比如今日头条,用户看新闻,肯定是适合用推荐的,还有大家熟悉的短视频。分类信息也可以做推荐,信息的分类一般会有很多,手机屏幕再大也是有限的,一屏展示不了多少内容。电商的热门推荐也一样。

说起电商的推荐,商品详情页这个地方,以前最早亚马逊做了打包交叉销售,当用户买了一本书的时候,可以推荐别的书。最开始大家只考虑推荐的商品和当前买的东西是否相关,但现在都会考虑个性化推荐,不仅要和当前商品相关,还要和消费者的兴趣产生关系。

新用户冷启动也已经涉及到推荐。一般有产品会专门做精选页面、热门页面给新用户。虽然是新用户,也可以通过推荐的技术提升效果。像大屏,现在智能电视很普及,我们家已经没有传统电视了,智能电视的节目也是需要推荐的。

另外还有社交、应用市场、音视频、小说的推荐,基本上可以看到,凡是可以做选择的地方都可以做推荐,对效果的影响也很大。

定好目标,剩下的交给机器学习

智能推荐可以帮助客户提升流量活跃度、销售贡献度和效率。但是,搭建整个推荐系统是非常耗费资源的事情。你做推荐系统,肯定要做得更实时,特征回流要快,这些东西都消耗大量的人力成本,试错成本也很大。

企业可以直接在成熟的推荐平台上做推荐系统。字节跳动每天增加1500次AB test,大量的实验可以规避各种错误,现在把推荐系统平台通过火山引擎开放出来,降低大家的试错成本。

火山引擎智能推荐平台,第一个特点是端到端。这个词这些年经常有人提,我估计有些人还不是特别理解。十年前业界的推荐做不到端到端,比如有人买了《射雕英雄传》,就推荐一本和《射雕英雄传》相似的书,基于当时的技术和建模方式,直接就是通过算法工程师自己脑子里的策略实现的。

现在的技术是可以做到直接提升你想提升的业务目标。比如你想实现什么效果,模型可以直接预估这个目标,最终结果按照预估的结果排。先把目标定下来,剩下的都是机器学习的事儿,这就是端到端,这个能力会全流程提供给客户。

第二是实时性,比如消费者购买商品的行为,下次给他推荐的时候,能不能用上刚刚发生的行为,这也很关键。业界开始做实时的推荐系统,可能就是2013、2014左右的时候。据我所知,现在很多企业并没有做到完全的实时,大部分人还是今天训练几个模型,明天就按照今天的模型预估用户的兴趣。我们所有系统都是实时的,特征实时更新、模型实时训练,可以给用户实时的反馈。

再往下就是大规模。我们在内部具备的处理大规模数据的推荐系统、广告系统的能力,对外会同步提供。

然后是行业定制。我们提供了一些行业模板,包括内容、电商等我们有实践的行业。当然有很多行业我们没有做,但是智能推荐平台上会基于我们对外合作中积累的行业经验,给每个行业提供现成的模板,希望大家配置的时候不用配太多东西,就可以快速构建推荐系统。

另外,很多企业都希望自己有研发能力,希望系统不要太黑盒了。我们提供的平台是兼具黑白盒能力的平台,你既可以实现:什么都不管,就把数据接对了,目标定对了,系统就可以做到;你也可以实现:深度开发,比如系统里面调调模型,加加特征,这个也是支持的。

接下来是更加细节的指标,比如模型种类,支持很多种不同的模型。我们对各种模型都做了充分的内部探索,提供出来的是真正有用的。比如多目标,现在推荐系统往往不只是有一个目标,我们提供了多目标的支持。还有很多比较细节的技术。

用好推荐平台,提升的不仅仅是营收

字节内部有很多产品,都是通过推荐中台把产品在底层打通的。比如A产品上有一个方法特别有用,B产品借鉴过去也很快,我们希望把这样的能力同步到对外部客户的服务中。火山引擎的智能推荐平台,就是基于字节推荐中台打造的。

在主要功能上,火山引擎智能推荐平台提供的推荐类型非常丰富,黑白盒功能也介绍过,第三就是校验和归因分析。做推荐,数据是非常关键的,比如给平台的数据是错的,那推荐肯定做不好,往往这一步是很多推荐系统工作中最耗时的部分,所以我们平台会给大家提供校验和归因功能,方便大家把数据做对。另外大家在实际工作中不只是模型,还有各种各样的运营策略,我们也提供这种能力。

最后讲一些客户案例:

一家电商客户,在很多位置接入了信息流的个性化推荐。比如个性化搜索,以前搜索和推荐听起来是两个不同的技术,但是在电商里,搜索结果也需要个性化。火山引擎的智能推荐平台,帮助这家客户在推荐场景中获得人均GMV100%的增长,提升了平台收入和用户体验。

电视现在也非常互联网化了,也可以接推荐系统。比如一些客户关心时长和付费转化率,这是可以通过机器学习模型预估的,也取得了不错的效果,无论是首页的个性化推荐还是频道页推荐、详情页推荐。

此外还有内容社区、广告等案例,最后讲的一个是手机厂商的应用商店,这是我们技术toB做得最早的业务,从几年前就开始做了。客户在使用我们平台过程中,研发团队的能力也得到了提升,从这两条曲线就可以看到,双方效果的差距越来越小。这也说明,智能推荐平台的作用不仅是提升营收,还能够为客户创造更多价值。

希望未来我们有机会为更多客户服务。我的分享就到这里,谢谢大家!

以上是关于字节跳动推荐平台技术公开,项亮:底层架构有时比上层算法更重要的主要内容,如果未能解决你的问题,请参考以下文章

文章如何实现大量曝光?推荐算法架构师亲自揭秘!

跟着字节AB工具DataTester,5步开启一个实验

卧槽!字节跳动《人人都要学的架构思维》完整版PDF开放下载!

火山引擎DataLeap:揭秘字节跳动数据血缘架构演进之路

字节跳动开源云原生机器学习平台 Klever

字节跳动面试:海量算法高频面试题精编解析