腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?
Posted AI科技大本营
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?相关的知识,希望对你有一定的参考价值。
作者 | 伍杏玲
出品 | AI 科技大本营(ID:rgznai100)
远程会议已成为我们常规的工作沟通方式,在线交流打破时间、空间的限制,给予我们便利之际,也屡遭尴尬:
忘记静音,一边听会一边敲键盘,被对方提醒:“XX,麻烦静下音”;
自己正在讲话呢,身旁人走来走去有噪音,影响会议收听效果,你恨不得马上转移开会阵地……
后疫情时代,远程会议有以下发展趋势:远程协作占员工的工作时间50-80%,线上线下混合会议将超过90%,视频会议功能将成为大部分会议的标配。因此提高远程会议的交互体验已成为厂商迫在眉睫的事。
为了应对以上会议室各种复杂声学场景下的开会难题,腾讯会议旗下天籁实验室推出天籁语音模组方案,由腾讯AILab 技术加持,实现12米超长距离拾音,消除超过200种会议噪声,在双讲、回声消除等方面实现突破性升级。
天籁语音模组加持,立即开启自动“屏蔽杂音”模式
天籁语音模组能消除超过 200 种会议噪声是怎样的概念?
腾讯天籁实验室资深研究员刘成做了以下演示:在顶端装有天籁模组的屏幕那头用力敲打键盘、做桌椅碰撞,笔者与之实时连线,并没有听到键盘噪音,宛如开启了“噪声静音”模式。
刘成表示,还有空调噪声、翻纸张、塑料瓶、水杯、雨打在窗户上、外面马路施工、脚步等 200 多种声音,可通过 AI 算法降噪处理。同时天籁语音模组基于深度学习模型,也能将空调声、风扇声等平稳噪声消除。
刘成尝试在距离屏幕 2 米 和 8 米的位置讲话,收听效果变化不大。这是因为天籁模组是全面 180 度拾音,不管讲话人从左边、右边、前面、后面走动变化,声音变化不大。在双讲测试里,刘成和另一人同时发声,两者声音均能清晰听到,并无剪切感或回声泄露情况。
据刘成介绍,天籁语音模组结合房间声场感知、采集和空间声场重建技术,远场多人音频通信、多讲话人实时追踪、多人自动取景等实时音视频技术难题,帮助企业和用户实现在远场复杂物理空间下通信体验的突破性提升。
例如针对讲话者离屏幕较远时,可能存在听不清、声音小的情况,天籁语音模组方案将多个 MEMS 麦克风板嵌入到会议大屏中,结合音频处理器,能够实现 180 度广角、12 米超长距离拾音,让参会者可以像面对面交流般清晰、自然,并给与参会者更灵活的活动空间。
基于 20 多年音视频技术经验,打造“软硬一体”的云视频会议生态
去年 9 月,腾讯会议发布企业版、会议室连接器以及新一代云视频会议室解决方案“腾讯会议Rooms”,据了解,天籁语音模组将应用于腾讯会议 Rooms 专款机型上,还开放给腾讯会议Rooms专款硬件合作伙伴,助力打造会议室场景高清、纯净、流畅的开会体验。
与此同时,不做硬件的腾讯会议,还通过开放音视频认证标准,联合硬件设备厂商,共同为企业量身打造“软硬一体”的云视频会议解决方案。
腾讯会议天籁实验室技术研发专家余涛介绍“软硬一体”方案背后的几点思考:
一是从商业上,为硬件厂商集成一体化方案提供便利,可快速形成产品能力。
二是从技术上,由于远程语音、噪音等语音的复杂性,仅靠几个算法,即使在深度学习模组加持下,想要较好地解决远场语音问题还是较难的。
自 QQ 推出语音通话开始,腾讯已有 20 年音视频技术的积累。去年成立专注于新一代实时音频技术的天籁实验室,并结合腾讯AI Lab 技术的加持,天籁模组从多维度、多角度、多模态出发,在提升远场拾音能力上拥有天时地利的技术优势。
目前天籁模组将首先服务于腾讯会议 Rooms,相信未来天籁模组可应用在小型会议室、中型会议室、大型会议室、超大型会议室、开放空间等。最后,据余涛透露,与硬件厂商合作的具备天籁音频模组的产品,正在量产中。
更多精彩推荐
GitHub 遭抵制!AI 代码生成神器竟成“抄袭工具”?
基于 Python 的 8 种常用抽样方法
太酷了,Python 制作足球可视化图表 | 代码干货
点分享点收藏点点赞点在看
以上是关于腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?的主要内容,如果未能解决你的问题,请参考以下文章