解密优酷智能生产技术，看 AI 赋能内容数字化

Posted 2021-08-25 阿里云视频云

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了解密优酷智能生产技术，看 AI 赋能内容数字化相关的知识，希望对你有一定的参考价值。

2021 年，随着社会节奏的加快，用户碎片化消费时间不断增加，当前短视频的消费用户规模已超 7.73 亿人，短视频的市场规模超过 2000 亿元。短视频行业发展迅速，但也存在低质内容泛滥，精品内容稀缺的问题。在 7 月 10 日的 Imagine 阿里云视频云全景创新峰会上，阿里巴巴文娱资深算法专家李静，发表了《视频技术再创新，开启内容数字化浪潮》的主题演讲，从短视频领域的内容生产困境出发，分享 MediaAI 平台的技术能力及应用实践，解密优酷短视频智能生产的技术，以下为演讲内容整理。

优酷如何开启内容数字化浪潮？

既然是优酷，就要从长视频、短视频以及最后分发呈现出来的所有的视频形态说起。优酷的数字化也会从视频的整个生命周期来分析。优酷作为一个长视频网站，从长视频最初的拍摄到制作再到完成，我们有内容评估的数字化系统。

当一个长视频拍摄出来之后，如何利用这种版权内容再进行二次的创作，这就是创作内容的的数字化；接下来我们希望生成一些短视频特效，让用户看起来更好看，更有趣，这是特效的数字化。

最后，在终端上用户拿着手机、平板或者通过电视大屏观看视频的时候如何体验内容数字化的好处？

所以，内容的数字化浪潮要从整个视频的生命周期来讲。

创作要素解构

第一个是内容评估的数字化。在阿里巴巴文娱有一个北斗星的团队，是专注于做长视频的内容评估，它的核心点是希望通过后验的数据去衡量整个视频内容的质量，视频内容或者视频的生产元素。

其中又包括一些外延的东西，例如导演、编剧、演员、剧本等，这些东西是大家平时能听到的，但距离自己又很遥远的东西，这些就是视频内容生产外延的内容。

外延之外还有内延信息，包括呈现出来视频本身它涵盖的一些人物的信息、镜头的语言以及本身人物的性格等。所有的这些信息都是基于我们 NLP 语言（Natural Language Processing）或者 CV（Computer Vision）的能力进行解构。

所以当我们有了外延信息和对于内容的解构之后，我们希望可以通过这些信息去预测用户的心理感受或者对内容的喜好度。

从数据侧获得的先验数据，其中包含了非常直观的收视率、用户的互动状态、评论数，我们希望通过这些数据可以进一步挖掘用户的心理状态、生理状态，以此推动我们核心能力来完成内容的评估。

内容的评估需要应用到 AI 的能力，一个是 AI 评估，一个是 AI 体检。

什么是 AI 评估？

一个视频片段是否好，以前用人来审，需要花费大量的人力。如果用人工审核预测一部电视剧是否是爆款，会非常非常困难。所以在内容评估上我们利用北斗星的系统，从最开始演员、供应商、IP 等级、导演和编剧的信息预估这部电视剧是什么样的水平。

并且，可以对电视剧里的的演员做进一步更深的分析，例如他的粉丝价值，整个口碑等。通过分析我们让平台进一步做辅助性决策，再利用我们的 AI 技术最终评估这部电视剧到底是什么档次。

第二个点是 AI 体检。

当视频片段拍完剪辑好之后，用算法来预测这些片段，哪些是看点，哪些是高潮点，哪些是剧情非常拖沓无聊的点，去寻找用户可能弃剧的风险点，给出一些建设性的意见，帮助剪辑师进行剪辑优化。这是优酷内容评估另外一个应用点。

在长视频之后，就是短视频了。

优酷的《山河令》和《司藤》在放送结束之后，我们如何进一步利用它做二次的短视频创作？

短视频最近几年来非常火，去年短视频消费用户达 7 亿多人，短视频工会和 MCN 数量超过两万家，市场规模超过两千亿，在如此庞大的短视频消费市场下我们面临了一些问题，高质量的短视频非常稀缺，大量的低质的、粗制滥造的短视频充斥在整个市场上。

所以，我们想利用自动化生产的方式代替掉那些质量低劣的短视频，让我们的智能创作达到人创作的水平，这是优酷想要去做的。

所以阿里巴巴文娱研发出了概念级的视频的解构能力去赋能智能创作。这是什么呢？

当每次提到视频解构、CV 能力，大家可能都会自然想到一些标签，对于一个视频场景，里面有人物、物体、运动等，在过去 CV 领域这些是特别客观的标签描述，但进行视频创作的时候，这些东西并不是创作者们非常需要的，创作者们需要的元素或者素材是能够让观众有深切感受的，所以我们重新定义了语义级的标签，才能够赋能智能创作。