阿里AI视频识别算法新突破:可帧级解读视频

Posted 网络视听生态圈

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了阿里AI视频识别算法新突破:可帧级解读视频相关的知识,希望对你有一定的参考价值。

网络视听生态圈

wlststq  ←【长按复制】添加好友或点击上方,轻松关注
推荐理由:从政策监管到内容生产,从技术创新到企业运营,从市场营销到资本运作,带您全面了解中国网络视听行业的生态变化。


手机里存了大量的视频,想剪辑其中的精彩片段却犹如大海捞针?视频网站拥有海量视频,如何严格审核避免问题发生?


近日,在德国慕尼黑举办的计算机视觉国际顶会ECCV(European Conference on Computer Vision)上,阿里安全图灵实验室高级算法专家析策展示了最新的AI视频识别算法,其识别精度超越目前主流方法,有效提升了视频自动标签的行业精度,这一新算法已被ECCV收录。


阿里安全图灵实验室高级算法专家析策表示,为提升AI技术在实际场景中针对视频识别的精度,提出一种新的基于图(Graph)的视频建模方法,能表达含有复杂事件内容的长视频。


析策表示,这一方法的主要思路是通过“深度卷积图神经网络”(下称“DCGN”)对视频的帧、镜头、事件进行多级的建模,逐渐地从帧级、镜头级,一直到视频级进行抽象,从而获得视频全局的表达,进而进行分类。


他举例称,“比如一段美食节目视频中,包含厨师长、主持人聊天、食物、观众等内容,AI在学习视频内容时会先根据内容对视频进行逐帧的语义表达,形成特征序列,用不用的标签进行打标,随后在通过多层次的网络对这些不同打标的内容进行关系表达,深度理解这些内容之间的关联度,将相似的节点衔接起来,最终组合出对整个视频的理解。”

烹饪节目中包含各种内容,不同内容用不同演示边框表示,最终组合出对整个视频的理解


析策表示,一个视频包含帧、镜头、场景、事件等,帧与帧、镜头与镜头间的关系十分复杂,不仅仅是前后帧的顺序关系,而目前公开的建模方法一般都无法表达如此复杂的关系,DCGN因对复杂内容的深度学习和理解进而提升识别精度。


据悉,阿里安全图灵实验室已将AI能力在内容治理、知识产权、身份认证验证和新零售安防等领域进行运用,覆盖阿里生态的淘宝、支付宝、优酷、UC等核心业务线。


近期刷爆社交网络的网红“AI鉴黄师”,每天可审核数亿张图片,识别准确率高于99.5%,技术能力便来自阿里安全图灵实验室。连视频内容都能理解了,解读一张图片岂不是小菜一碟?


来源:快科技

以上是关于阿里AI视频识别算法新突破:可帧级解读视频的主要内容,如果未能解决你的问题,请参考以下文章

IBM和MIT在视频识别模型训练方面取得最新突破

何恺明等最新突破:视频识别快慢结合,取得人体动作AVA数据集最佳水平

阿里妈妈新突破!深度树匹配如何扛住千万级推荐系统压力

融合AI技术的视频监控,为行业带来了哪些创新和突破?

今年AI论文8大领域突破:特斯拉自动驾驶入选,视频博主最利好,跨界输出很潮流...

基于AI神经网络算法,辨识各异常行为