音视频技术开发周刊 | 194

Posted LiveVideoStack_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音视频技术开发周刊 | 194相关的知识,希望对你有一定的参考价值。

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

小提示:链接跳转仅支持公众号相关链接

进入全真互联网——音视频通信的技术变革

随着5G和下一代编解码、传输等技术持续演进,音视频通话技术从低延时到超低延时实时通信快速迭代,越来越多应用与服务迁移至线上,越来越真实无损地还原线下体验,新的互动方式和场景不断涌现,从高度数字化到拟真化再到全真互联网时代。本次LiveVideoStackCon 2021上海站我们邀请到了腾讯云副总裁李郁韬来分享音视频的变革趋势、演进以及未来。

边缘计算不“边缘”——助攻视频行业这几年

随着边缘计算行业的不断发展,其业务也越来越广泛,越来越成熟。边缘计算的发展历程并不是一帆风顺,其运用起来也和传统云计算有很大不同。那么边缘计算行业所面对的挑战以及未来的发展是什么样的呢?有请网心科技的李浩为我们分享他助攻视频行业的这几年。

实时音视频技术的演进与应用

本次分享我们邀请到了来自腾讯云实时音视频TRTC后台的研发负责人薛笛,他向我们分享了腾讯云TRTC在架构升级和产品实践中的经验。仔细讲解了混音引擎最初的制造源、在整个优化过程中发现的问题以及解决方法,为后来做腾讯会议和云呼叫中心打下了一个良好的基础。


流媒体的安全

本文来自Streaming Video Alliance,在本网络研讨会中,我们将探讨许多可用于阻止直播盗版的技术,以及视频发行商可以用来帮助尽可能减少盗版的一些做法。

谈谈 WebRTC 的 SDP Unified Plan

今年2月份,webrtc M89 的正式发布,在Release note 提出了一个重要更新,即废弃webrtc Plan B SDP 语义,推荐使用标准SDP格式:Unified Plan。WebRTC1.0 已经正式成为 W3C 标准,主流浏览器基本都支持UnifiedPlan SDP。

WebRTC如何驱动亚秒级广播和游戏直播流

本次演讲来自Demuxed 2020,主讲人是来自苹果公司开发人员Sean dubios,他还是Pion WebRTC的创建者。演讲主题是WebRTC如何驱动亚秒级广播和游戏直播流。

MediaStreamTrack 的可插入流

从现在开始,WebRTC 会有更多的虚拟背景和有趣的面具功能加入。

https://web.dev/mediastreamtrack-insertable-media-processing/

Visionular AV1编码器针对所有用例进行了优化

得益于AOMedia资助的dav1d项目,Visionular确定了AV1可行的用户方案,可以在其中利用软件解码解决方案,这已成为标准和Visionular解决方案发展的重要基础。

http://aomedia.org/av1%20adoption/visionular-av1-encoder-optimized/

浅析 XR 关键技术

扩展现实(XR)实际是一个概括性术语,囊括了增强现实(AR),虚拟现实(VR),混合现实(MR)以及介于他们之间的所有内容。

AR中面部追踪的基础浅析

在AR中实现追踪并不是一件易事,一方面需要拥有更为强大的传感器,另一方面还需要设备有足够的算力。

DeepBlur:一种简单有效的自然图像模糊方法

现有的图像模糊技术要么容易受到人类或深度学习模型的再识别攻击,要么在保持图像保真度方面不够,要么计算量太大,难以实现。为了解决这些问题,我们提出了DeepBlur,这是一种简单而有效的图像模糊方法,它通过无条件预先训练的生成模型的潜在空间进行模糊处理,该模型能够合成逼真的人脸图像。

输入两张“怪异”图像,VGG、Inception、ResNet集体翻车,经典图像分类模型有多脆弱?

如果我们对图像进行一些非常规操作,比如把猪放在它“不熟悉”的天空环境中,或者把局部目标异常放大,它们还能准确分类吗?

Telegram 下个月添加群组视频通话功能

有无使用 WebRTC?是否支持浏览器?据悉,群组视频通话将在下个月出现在Telegram的消息平台上,并被吹捧为一个功能齐全的实现,包括支持基于Web的视频会议。

https://techcrunch.com/2021/04/28/telegram-to-add-group-video-calls-next-month/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Techcrunch+%28TechCrunch%29

VLC发布3.0.13版本

此次更新包括2处更改,41个添加项和3个删除项。在多路分配器、编解码器、使用权、视频输出、接口等方面都做了相应的更新或修复调整。

https://code.videolan.org/videolan/vlc-3.0/-/blob/master/NEWS

Safari 14.1 的 Webkit 新功能

WebKit中的Web Speech API支持语音合成已有一段时间了。现在,Safari支持与Siri相同的语音引擎支持的语音识别。这意味着Web开发人员可以享受50多种语言和方言的高质量转录。

https://webkit.org/blog/11648/new-webkit-features-in-safari-14-1/

插图源自Pexels

The cover from creativeboom.com

以上是关于音视频技术开发周刊 | 194的主要内容,如果未能解决你的问题,请参考以下文章

音视频技术开发周刊 93期

音视频技术开发周刊 | 230

音视频技术开发周刊 | 234

音视频技术开发周刊 | 263

音视频技术开发周刊 | 229

音视频技术开发周刊 | 255