阿里AI视频识别算法新突破：可帧级解读视频

Posted 2021-05-02 网络视听生态圈

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了阿里AI视频识别算法新突破：可帧级解读视频相关的知识，希望对你有一定的参考价值。

网络视听生态圈

wlststq ←【长按复制】添加好友或点击上方，轻松关注

推荐理由：从政策监管到内容生产，从技术创新到企业运营，从市场营销到资本运作，带您全面了解中国网络视听行业的生态变化。

手机里存了大量的视频，想剪辑其中的精彩片段却犹如大海捞针？视频网站拥有海量视频，如何严格审核避免问题发生？

近日，在德国慕尼黑举办的计算机视觉国际顶会ECCV（European Conference on Computer Vision）上，阿里安全图灵实验室高级算法专家析策展示了最新的AI视频识别算法，其识别精度超越目前主流方法，有效提升了视频自动标签的行业精度，这一新算法已被ECCV收录。

阿里安全图灵实验室高级算法专家析策表示，为提升AI技术在实际场景中针对视频识别的精度，提出一种新的基于图（Graph）的视频建模方法，能表达含有复杂事件内容的长视频。

析策表示，这一方法的主要思路是通过“深度卷积图神经网络”（下称“DCGN”）对视频的帧、镜头、事件进行多级的建模，逐渐地从帧级、镜头级，一直到视频级进行抽象，从而获得视频全局的表达，进而进行分类。

他举例称，“比如一段美食节目视频中，包含厨师长、主持人聊天、食物、观众等内容，AI在学习视频内容时会先根据内容对视频进行逐帧的语义表达，形成特征序列，用不用的标签进行打标，随后在通过多层次的网络对这些不同打标的内容进行关系表达，深度理解这些内容之间的关联度，将相似的节点衔接起来，最终组合出对整个视频的理解。”

烹饪节目中包含各种内容，不同内容用不同演示边框表示，最终组合出对整个视频的理解

析策表示，一个视频包含帧、镜头、场景、事件等，帧与帧、镜头与镜头间的关系十分复杂，不仅仅是前后帧的顺序关系，而目前公开的建模方法一般都无法表达如此复杂的关系，DCGN因对复杂内容的深度学习和理解进而提升识别精度。

据悉，阿里安全图灵实验室已将AI能力在内容治理、知识产权、身份认证验证和新零售安防等领域进行运用，覆盖阿里生态的淘宝、支付宝、优酷、UC等核心业务线。

近期刷爆社交网络的网红“AI鉴黄师”，每天可审核数亿张图片，识别准确率高于99.5%，技术能力便来自阿里安全图灵实验室。连视频内容都能理解了，解读一张图片岂不是小菜一碟？

来源：快科技

以上是关于阿里AI视频识别算法新突破：可帧级解读视频的主要内容，如果未能解决你的问题，请参考以下文章

IBM和MIT在视频识别模型训练方面取得最新突破

何恺明等最新突破：视频识别快慢结合，取得人体动作AVA数据集最佳水平

阿里妈妈新突破！深度树匹配如何扛住千万级推荐系统压力

融合AI技术的视频监控，为行业带来了哪些创新和突破？

今年AI论文8大领域突破：特斯拉自动驾驶入选，视频博主最利好，跨界输出很潮流...

基于AI神经网络算法，辨识各异常行为