音视频技术开发周刊 | 202
Posted LiveVideoStack_
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音视频技术开发周刊 | 202相关的知识,希望对你有一定的参考价值。
每周一期,纵览音视频技术领域的干货。
新闻投稿:contribute@livevideostack.com。
小提示:链接跳转仅支持公众号相关链接
本文对 ffplay 源码进行分析,试图用更基础而系统的方法,来尝试解开播放器的音视频同步,以及播放/暂停、快进/后退的控制原理。
探索使用 VideoToolbox 进行低延迟视频编码
低延迟编码对于很多视频app来说都很重要,特别是对实时音视频场景。苹果在 WWDC 2021 在 VideoToolbox 里推出了一种新的低延迟编码模式。低延迟编码模式的主要目的是为实时通讯场景优化现有的编码流程。
https://joey.blue/2021/07/01/Low-Latency-Encoding-with-VideoToolbox/
Spin Digital 发布 VVC 8K 解码器和媒体播放器
2021 年 6 月 21 日 — 高端视频编码解决方案提供商 Spin Digital 宣布推出支持多功能视频编码 (VVC) 标准的 8K 实时软件解码器和媒体播放器。
https://spin-digital.com/announcements/vvc-player/
本文主要介绍了适配复杂优化准则的自动编码优化框架。这也是首个利用强化学习网络实现智能分析任务的通用编码框架。
CVPR2021最佳论文:当GAN遇到3D场景,无需监督就学会“动态抠图”、360度展示对象
GAN又又又有新玩法了!人脸?NO,NO,NO~这回,开发者利用「3D+GAN」生成了汽车大片,还是能360度展示、随手换背景那种。
近期,苹果计算机视觉科研部门研发了一种基于HDR图像技术的AR渲染方案,其特点是无需重复训练,即可在各种新场景中动态渲染AR模型表面的反光/光影效果,逼真模拟金属等自然纹理。
激光雷达分类多种多样比如按发射波形可分为脉冲型和连续型,按探测方式可分为直接探测和相干探测,按线束可分为单线和多线等,本文将按扫描方式将雷达进行分类介绍。
新闻资讯
W3C将Web Audio API纳入官方标准,用于在Web浏览器中直接创建、操作音乐和声音
Web Audio API 专注于声音创建(而不仅仅是播放录制的音频),它提供了一组丰富的模块,Web 和应用程序开发人员可以将这些模块结合起来开发各种音频相关的应用程序,包括乐器、娱乐和游戏的音轨、AR/VR空间音频以及音频的在线分析和编辑等。
https://www.w3.org/2021/06/pressrelease-webaudio.html.en
活动推荐
在后疫情时代,随着技术的急速更迭,社会上对于线上化工具的普遍态度产生了从被动接纳走向积极应用的转变。其中,视频会议也迎来了发展的黄金时代。但与此同时,来自社会的压力也使得视频会议技术正面临着决定性的挑战。外部市场的竞争与饱和以及内部技术的生产力等等,都成为了视频会议将进一步赋能与渗透更多行业的过程中需要考虑的问题。
7月8日 19:30,我们分别邀请到了来自科天云研发中心总经理张军、二六三企业通信音视频架构师 贺晓敏、微软(中国)Microsoft Teams 高级产品市场经理 段旭东以及腾讯会议产品部高级研究员 许景禧四位视频会议技术专家,以视频会议存量时代为背景,进一步讨论在视频会议技术发展的过程中有关底层技术难点、端到端加密以及现代化办公和行业前沿技术等议题,引发大家对于视频会议技术未来创新全方位的思考。
7月10日,“Imagine”——2021阿里云视频云全景创新峰会暨全球视频云创新挑战赛决赛颁奖典礼将在北京举行。本届峰会,以全景化的创新视角,深入探索这个超视频化时代的图景与能量,思考视频云技术在时代的想象空间。就行业场景赋能,洞察视频云新应用场景链路中的盲点、痛点、机会点、创新点,覆盖互娱、电商、教育、传媒、协同等众行业。同时,阿里云将重磅发布一系列新洞察、新技术、新计划,联合各界一同创造新视界、新体验、新未来。
插图源自Pexels
以上是关于音视频技术开发周刊 | 202的主要内容,如果未能解决你的问题,请参考以下文章