Youtube 算法规则

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Youtube 算法规则相关的知识,希望对你有一定的参考价值。

参考技术A

在Google工程师Paul Covington,Jay Adams和Emre Sargin发表的这份 研究论文中 ,他们分解了用于对YouTube推荐视频进行排名的信号:

前三个信号是您可以直接影响的唯一信号。其余部分取决于您频道之外的因素,以便个性化推荐。

这些Google工程师甚至声称,他们的最终排名目标“通常 是预期的每次观看观看时间的简单函数。 按点击率排名通常会宣传用户未完成的欺骗性视频(“点击诱饵”),而观看时间可以更好地吸引用户参与。”

有人可能会认为这意味着优化点击率会让您受到YouTube的惩罚,但这是一个巨大的误解。

YouTube只会惩罚诱饵和切换策略-点击前的承诺过多,而点击后的内容令人失望。点击率仍然像以往一样重要。毕竟,如果不先获得点击,就无法为YouTube带来大量观看时间。

您甚至可以在 YouTube Studios中 看到这些优先级:YouTube的新分析仪表板。

最多可以在5秒内总结出最出色的YouTube频道或系列:

另一方面,许多YouTube频道很难吸引人,因为他们将YouTube频道视为上传所有视频内容的地方,而不是一个连续的视频系列的首页。

保持一致性的YouTube频道能够 持续 增加其订阅者人数和观看人数,因为它使人们更容易决定观看更多内容并订阅其频道。

“我们的盛宴”频道体现了我们正在谈论的那种一致性-名人吃食物-具有多个系列,这些系列本质上是同一前提的变体。

较新的YouTube频道不能依靠推荐引擎来获得所有观看次数。

毕竟,推荐内容主要取决于观看者过去观看和与您的视频互动的方式。YouTube需要数据来作为推荐的依据,没有人观看您的视频就没有数据。因此,请采取所有通常的措施来宣传您的视频,例如:

但最重要的是,着眼于 YouTube SEO 并 吸引更多的订阅者 ,这不仅是为了长期 获取 视频观看次数,而且还因为用户反复在平台上消费以及用户订阅的内容是YouTube算法用于提出个性化建议。

在工程师中,工程师注意到“最重要的信号是那些描述 用户之前与商品本身和其他类似商品互动的信息 ……例如,考虑用户过去的历史以及上传了被评分视频的频道用户从该频道观看了许多视频?用户最后一次观看有关该主题的视频是什么时候?”

如果您可以让新用户点击其中一个视频后继续观看更多内容,则可以增加在下次打开YouTube时向他们推荐视频的机会。

我们已经确定,点击率仍然很重要,YouTube优先考虑观看时间只是针对低质量点击诱饵的一种对策。

环顾YouTube,您会发现视频缩略图上不乏表情丰富的面孔。

Netflix所做的一项 关于平台上艺术品性能的研究表明,“情感是传达复杂细微差别的有效方法。众所周知,人类必须对面孔做出硬性回应-我们已经看到这在所有媒介上都是一致的。但重要的是要注意, 情绪复杂的面孔胜过坚忍或良性的表情。

Netflix也注意到的最早趋势之一,值得发扬到自己的缩略图,它是当图像包含3个以上的人时,它赢得别人的倾向就下降了。

三分法则是实现“ 黄金分割率” 的简化方法,研究表明,这种方法可以 最大程度地减少 大脑处理图像 所需的时间 。

该图像构图准则建议您将兴趣点放置在图像的中心,而不是图像的中心。

根据 Sandvine 的2019年研究,YouTube现在占互联网上所有移动流量的37%。这也意味着相当一部分观众会在移动设备上观看您的视频。
4.鼓励观众点击后留下
让人们观看您的视频是一回事。让他们从头到尾真正观看视频是另一回事。

幸运的是,通过在视频创建过程中建立此目标,可以提高视频的完成率(并获得更多的观看时间):

从头开始,并在视频介绍中加入一个“钩子”
转录您的视频,以便人们可以观看静音
根据您的分析调整视频的长度(观看者在下车之前实际拍到多远?)
请勿过长地使用同一张镜头,否则可能会让观看者感到厌烦(这就是为什么跳跳剪辑在YouTube上很受欢迎的原因)
如果您的视频很长,请在片刻间撒些片刻,以便在观众开始徘徊时重新吸引观众的注意力
5.鼓励您在频道上疯狂观看
您还可以通过采用涉及视频消耗和一致性的策略来优化频道级别的观看时间。

除了为您的YouTube频道提供专门的前提条件(这可能是最重要的因素)之外,您还可以通过以下其他方法使观看者更轻松地观看更多内容:

使用插卡和结束卡手动推荐相关视频
每当您共享时,都链接到播放列表中的视频,以便用户观看的下一个视频始终是您自己的视频
开发从缩略图到视频本身的一致格式-如果观众喜欢您的其中一个视频,那么他们应该能够正确地假设他们会喜欢您的其他视频。
将特定的号召性用语甚至是其他视频中的场景整合到观众中,直接“吸引”观众,以消费更多内容。

随着YouTube算法的变化,一件事保持不变
多年来,YouTube的算法发生了很大变化,每次都使创作者和品牌争先恐后,想知道为什么他们曾经依赖的方法不再有效。

但是,即使YouTube算法不断发展,但请记住,该平台的目标仍然不变:吸引更多的人在YouTube上观看和观看更多视频。那与您的没什么不同。

Paxos算法进阶

 很多读者看完了paxos算法,只知道算法这么做可以达到一致性,但是不知道为什么。



本文翻译自youtube上讲解paxos的视频,适用于对Paxos算法有基本了解的同学。

有条件的同学也可以戳“阅读原文”观看视频。

https://www.youtube.com/watch?v=JEpsBg0AO6o&t=3575s


01

Basic Paxos 算法: 


使用场景:

    1. 多个server提出value 

    2. 系统必须同意唯一的value 


要求: 

1. Safety 

    1)只有一个value最终会被chosen

    2)别的server只能学习到chosen的value 

2. Liveness 

    1)会有value最终被chosen (结合上边一条就是有且仅有一个value会被chosen)

    2)如果有value被chosen,其他的server可以学习到它 


02


为什么需要Paxos?


        对于单个acceptor的情况,是不安全的!因为acceptor服务器崩溃之后保存的value就丢失了。

        对应的解决方法是quorum,也就是建立多个acceptor。当多数acceptor同意的时候value才会被chosen。这样一个acceptor崩掉之后,value仍然可以被读取。


        但是quorum并不简单。我们想象一下以下三种情况:


        1. 假设每个acceptor accept了他们收到的第一个value,就会像下边这张图出现“脑裂”现象,就没法达成一致。 

        

    

这意味着acceptor有时候需要改变他们的想法。 


        2. 假如每个acceptor accept了他们收到的每一个value,就会造成多个value都被chosen的情况。如下图 


Paxos算法进阶


这意味着一旦一个value被chosen,其他的proposal必须propose那个被chosen的value。这需要two-phase protocal来实现。

 

        3. 假如仅仅有two phase protocal,也是不行的,因为像下图一样,会造成两个value被选择了。 

Paxos算法进阶


这意味着我们需要对proposal进行排序,拒绝更早的proposal 


03


Paxos过程


上一节通过对quorum的分析所得出的结论,我们再回顾一下Paxos的过程。


每个proposal都有一个唯一数字标识,数字越大优先级越高。


Phase 1: prepare ,这个过程有两个目的

    1)找到任何已经被chosen的value 

    2)block其他older并且尚未完成的proposal 

Phase 2: Accept 

    通知acceptor去accept一个特定的value 


Paxos算法进阶



几点需要注意的: 

    a) 在1),每一次n必须都是不一样的 

    b) 在2),proposer向所有的acceptor广播prepare请求,但是在4),proposer在收到majority的返回之后就会做出反应。majority意味着任意两个proposal之间肯定有重叠的server。 

    c) 在3),一旦acceptor收到了prepare请求,意味着他承诺永远不会accept比n小的proposal。这一个承诺的实现方式是acceptor保存了minProposal

    d) 在4),如果有多个acceptor返回他们所accept的值,proposer会选取最大的acceptedProposal对应的acceptedValue。

    e) 在6),如果n<minProposal,acceptor就会reject。reject的方式是返回一个比n更大的值。 

    f) 整个过程中acceptor需要在硬盘上保存minProposal, acceptedProposal, acceptedValue 


04


Paxos举例说明


为了理解Paxos,最关键的部分是理解在有竞争的proposal时,第二个proposal的prepare阶段。 


定义:P3.1 表示serve收到了一个n=3.1的proposal。其中3.1的3是第三轮proposal,1是server1提出的请求。 


    Case 1: 第二个proposal到来之前,第一个proposal已经被chosen了 

Paxos算法进阶


        在上图中,S1提出了X值,S5提出了Y值,而S3在收到P4.5的时候,告诉了S5:我已经同意了X值! 

        所以S5转而提出了X值。事情解决了。 


    Case 2: 第二个proposal到来之前,前一个proposal没有被chosen,但是被部分acceptor accept了。第二个proposer恰好看到了! 

Paxos算法进阶


        同样,第二个proposer会被说服,转而提出X值。 



    Case 3:第二个proposal到来之前,前一个proposal没有被chosen,但是被部分acceptor accept了。第二个proposer没有看到!


    在这个情况下,最终Y会被chosen。 

    关键是S3的选择。S3在收到P4.5的时候,会把自己的minProposal改成4.5,因此在收到A3.1X的时候,会拒绝!拒绝的方式是把自己的的minProposal=4.5返回给proposal的提出者也就是S1.接下来S1会开始新的一轮proposal,并且在prepare阶段发现Y已经被chosen了。 

    解决这种情况的关键是两个proposal必须有overlap的acceptor。 


05


Paxos死锁


这种情况下会造成死锁。 



防止死锁的方法是:在每次Accept被拒绝之后,delay一段时间,让别的proposal完成。 

在multi-paxos中,可以通过选举leader来避免死锁。 


06


额外注意


    a)在Basic Paxos过程中,只有proposer知道哪个value被chosen了 

    b)如果别的server想知道哪个value被chosen了,那就需要自己run一边Basic Paxos流程 



这里我们只分享了Basic Paxos的基本流程,下一篇文章我们会分享如何拓展到Multi Paxos,并用Multi Paxos进行log同步。




以上是关于Youtube 算法规则的主要内容,如果未能解决你的问题,请参考以下文章

如何破解YouTube视频推荐算法?

推荐算法论文:Deep Neural Networks for YouTube Recommendations

从YouTube算法论文反推其推荐机制

深入理解YouTube推荐系统算法!

资源 | 主要推荐系统算法总结及Youtube深度学习推荐算法实例概括

在后台流式传输 youtube 视频是不是合法?