文章如何实现大量曝光?推荐算法架构师亲自揭秘!

Posted 互联网分析沙龙

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文章如何实现大量曝光?推荐算法架构师亲自揭秘!相关的知识,希望对你有一定的参考价值。

编者按:”冷启动”、“自然推荐”这些专业名词的背后,是一篇内容在头条推荐系统的“漂流之旅”。如何让你的内容在今日头条获得更好的推荐?针对今日头条的创作者,平台又会给出哪些创作意见?


11月17日,在今日头条2018生机大会“头条公开课”分论坛的现场,今日头条推荐算法架构师项亮为大家揭秘了今日头条推荐机制。让我们一起听听他的对这些问题的回答。


(点击观看 今日头条推荐系统揭秘)


大家好,我是项亮。非常感谢大家参加下午的活动。今天,我要给大家聊一聊今日头条推荐系统。



1

推荐系统的本质

从巨大的内容池中为用户匹配出感兴趣的内容


首先要和大家介绍的是推荐系统的工作原理。


推荐系统的本质,就是从一个巨大的内容池里,给当前用户匹配出几篇感兴趣的文章。这个内容池有几十万、上百万的内容,涵盖文章、图片、小视频、问答等各种各样的体裁。信息的匹配主要依据三个要素:用户、内容、感兴趣。


下面我会把这 3 个要素详细地介绍一下。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


首先,用户刻画。


我们怎么给用户提供他们喜欢的内容,或者说怎样更好地去理解一个用户的需求?其实,平台有很多角度可以去刻画一个用户的画像:年龄、性别、历史浏览的文章、环境特征等等。以环境特征为例,用户浏览某个信息的时间是在平时还是在周末;地点是在外出时,还是在常住的地方。这些都是刻画用户的重要因素。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


其次,内容刻画。


头条的内容体裁非常丰富,有图文、小视频、视频、问答等各种各样的体裁。这些内容有娱乐、体育、健康等多种分类。平台可以提取文章中的关键词,或者利用AI技术识别音频与视频的具体内容,从而将内容快速分类。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


最后,最重要的一点,感兴趣。


我们不可能直接问用户:你对这个内容感兴趣吗?是否感兴趣,我们只能从用户的“动作”中捕获出来。当用户刷新出十几篇文章的时候,如果用户对某篇文章感兴趣,他首先会点击阅读。点击之后,如果确实觉得这一篇文章确实写得很好,他可能会跟身边人分享,还会点赞、评论。假如这篇文章让他对作者产生了兴趣,还会让他有下一步的动作——关注作者。有的人看完这一篇文章,觉得这个文章内容质量太差,就会给这篇文章不喜欢。


以上种种,都是我们用来刻画这个用户是不是喜欢这篇文章的“动作”。这些“动作”在我们的推荐系统里,都会作为一个因素被纳入最终的考虑之中。假如你的文章得到很多人的点击,但点击进去,用户看了两眼就走了,不点赞,也不评论,推荐系统就会判定你的文章没那么吸引人。


2

推荐算法的实质

拟合一个用户对内容满意度的函数


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


前面简单介绍了推荐算法的 3 个要素,那么推荐算法本身是什么呢?它实际上是一个拟合你对内容满意度的函数。它会估算你进入一篇文章后的点击概率,看完后的点赞、评论概率;在此基础上,它还会给出你对这篇内容的正面评论、负面评论与中性评论的概率。


推荐系统会把这些概率通过融合的方式集成在一起,最后算出用户对这篇文章的兴趣分。当一个用户来到今日头条,推荐系统会从我们几十万、上百万的内容池里面,将所有文章按照兴趣分由高到低排序,前十名的文章会在此时脱颖而出,被推荐到用户的手机上展现。


3

一篇文章在推荐系统中的生命周期

初审 - 冷启动 - 正常推荐 - 复审


前面,我从推荐系统的 3 个要素介绍了推荐系统的本质。下面,我会从创作者比较关心的角度,也就是从一个文章在推荐系统里面的生命周期去介绍一下推荐系统。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


当大家发表完一篇文章,拍完一个视频后,就会生成一个内容。这个内容在整个系统里面经过如下一些步骤。


初审结束后我们会做一些加权推荐,我们称之为“冷启动”,“冷启动”完成之后,我们会对文章做正常推荐。在这一过程中,我们会不断搜集到用户的反馈。一旦文章被展示出来,就会有用户点击它,评论它,甚至举报它。系统就会收集各种各样的用户行为。基于这种行为,进而触发我们复审流程。复审会直接影响到文章的后续推荐。


  • 内容初审


首先就是要对这个内容进行审核,也叫初审。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


初审的目的在于判断这篇文章有没有违反国家有关法律的风险。在这一过程中,机器会判断优先级,将内容交给不同的人审核。在机器和人工的共同配合下,内容会以较快的速度通过初审,从而立即展现在读者面前。


  • 冷启动


在内容审核之后就是“冷启动”的过程。“冷启动”,是一个推荐上的概念。新的文章发表之后,和之前那些已经在平台上火起来的文章相比,具备一定的劣势。这些现在还是“冷”的文章中的大部分可能是火不起来。这里就存在一个矛盾:如果不把这篇文章展现给用户,就不知道将来会不会火起来。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


因此,对于所有的新信息,我们会做一个加权推荐。让所有的用户有一定的概率能够看到新的文章。在加权之后,文章大概会展现几千次。基于这几千次用户的点击、分享、点赞,我们可以判断哪些人群会喜欢这篇文章,哪些人群绝对不喜欢。当你的文章在几千次的展现之后,我们认为已经给足了冷启动的机会,就会撤销对这一篇文章的加权。这个文章后续能不能推出来,就靠这篇文章创作的实力了。


  • 正常推荐


从去年开始,我们加强了社交分发,也就是粉丝触达。所以对于那些有很多粉丝的作者而言,他的文章会在流量上得到粉丝的加持。至少在粉丝推荐列表里,他的文章会经常出现。这个过程就是正常的推荐。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


  • 内容复审


在正常推荐过程,基于各种各样的用户行为,系统会监测到很多数据上的异常,比如点击率特别高、但与此同时,负面评论与举报又特别多的现象,这时,这篇文章就会再次进入审核流程,即复审。在复审中,如果我们发现存在标题党、封面党、低俗、虚假这些问题,系统就会停止这一篇文章推荐。


4

常见问题:推荐为什么“不稳定”?

为什么推了一半不推了?


前面简单介绍了,一篇文章在今日头条是如何被推荐到用户的过程,以及在平台内经历的审核、冷启动、正常推荐、复审、继续推荐全过程。下面我想解答两个创作者们经常问的一些问题,在这里给大家集中解答一下。


  • 为什么推荐流量“不稳定”?


很多人会问,我的文章题材、风格都差不多,为什么有的文章几百万展现,有的文章就几千次展现。推荐流量为什么这么不稳定?


这个其实要给大家解释一下,头条的推荐系统是从上百万篇文章里面,把你的文章选取出来。如果那个时候其他的文章表现得特别好,你的文章就不会得到很好的推荐。也就是说,每一篇文章的推荐量,既取决于当时具体的环境,也取决于以及当时整个内容池里面其他文章的表现。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


它和纯粉丝分发不一样。一个用户在其他平台关注的内容作者可能只有几百个,他只要在这一阶段把这几百个人的内容比下去就可以了。而在今日头条,你的文章需要把剩下的几百万篇文章比下去。所以在推荐过程中,同一时期其他文章的表现决定了你的文章表现。


  • 为什么文章推荐一半就不推荐了?


经常有人问,我这个文章推荐了一半,展现量都很好,为什么忽然就不推荐了?


这也是我经常被问到的问题,遇到这种情况,大概率是你的文章出现了一些指标上的问题。比如它的点击率高的吓人,但负面评论也多得吓人。在这种情况下,文章或视频就会进入复审流程,它就不会得到推荐了。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


还有一种原因,跟审核无关,跟头条的推荐机制有关。如果你的文章是某个小众领域,目标人群是有限的。例如动漫类的文章,头条喜欢动漫的人只有这么多,推荐系统把这些人群推荐完了,后就没有办法推荐给其他人了,这也是一个经常出现的原因。


5

3点建议

面向用户创作,坚持优质原创,加强粉丝经营


在介绍完整个推荐系统的主要设计原理,解答了大家关心的两个问题后,我想给大家创作上提一些建议。


文章如何实现大量曝光?推荐算法架构师亲自揭秘!


第一点,面向用户的需求,不要面向算法创作。不要寄希望钻算法的漏洞,比如说标题党、封面党。对于所有在数据上表现的特别好文章,今日头条推荐系统都是有复审流程的。当然我们也不鼓励大家写一些没有人看的东西。大家应该面向用户的需求,去写一些高质量的文章。


第二点,坚持优质的原创,不要做低质内容的无用功。头条整体对低质内容识别手段和打压手段正在不断进化。低质内容的生存空间必将越来越窄。


第三点,经营粉丝,加强和粉丝的互动。刚刚也提到,在推荐系统里面,我们对粉丝做了比较强的触达的,如果你的粉丝量比较大,我们会保证粉丝以更大的概率看到你的文章。


谢谢大家。

 


The End


最近微信频繁改版,大家是不是都快找不到我了,把沙龙君标星,这样就能每天看到我的文章啦。



你可能还想看:








以上是关于文章如何实现大量曝光?推荐算法架构师亲自揭秘!的主要内容,如果未能解决你的问题,请参考以下文章

架构揭秘

揭秘今日头条推荐算法与系统架构

揭秘抖音上热门的4个核心算法

GaussDB(for MySQL)如何快速创建索引?华为云数据库资深架构师为您揭秘

GaussDB(for MySQL)如何快速创建索引?华为云数据库资深架构师为您揭秘

首次揭秘:百度是如何培养AI架构师的?