音视频技术开发周刊 | 232
Posted LiveVideoStack_
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音视频技术开发周刊 | 232相关的知识,希望对你有一定的参考价值。
每周一期,纵览音视频技术领域的干货。
新闻投稿:contribute@livevideostack.com。
FFmpeg 工具:音视频开发都用它,快@你兄弟来看丨音视频工具
音视频基础概念合集:148 个问题带你快速上车音视频丨音视频基础
这篇文章是为音视频基础的概念建一个索引,方便记忆和查阅。如果你是对音视频方向感兴趣的开发者,强烈建议点赞、收藏、分享。
本文介绍了一种利用通用媒体应用程序格式(CMAF)作为标准化容器格式的方法,结合低延迟HLS(LL-HLS)和低延迟DASH(LL-DASH)中的特定内容编码约束和寻址模式约束,提供跨格式解决方案,最大限度地提高边缘缓存效率,最大限度地降低源存储成本和客户端请求率。
Audio Orchestrator:使用多设备编排沉浸式互动音频
字节跳动技术团队过去一年间,以审慎的态度在开源领域稳扎稳打,陆续向社区开放了多个经过内部业务验证的开源项目,也向社区反哺了多个主流开源项目的新特性。
ffmpeg 源码分析-命令行3-4
本文章以 FFMpeg 4.2.5版本的源码为准,本系列主要分析 ffmpeg_parse_options() 转码的内部逻辑。本系列以一条简单的转码命令开始,ffmpeg -i a.mp4 b.flv 、 a.mp4。
https://juejin.cn/post/7052334889235906567
https://juejin.cn/post/7052334393947324429
2009年,Apple推出了HLS(HTTP Live Streaming)——基于HTTP的自适应码率流媒体传输协议。HLS描述了一组通过互联网提供音视频服务的工具和程序。
中国队夺金幕后的「AI手语翻译官」:初次上岗,手语可懂度超90%
在央视频多场赛事中,腾讯 3D 手语数智人「聆语」作为「AI 手语翻译官」,提供了手语解说服务,让处于无声世界中的特殊人群也能「听」到中国举办冰雪赛事的盛况,进一步提升了听障人士的观看体验。
这是一个适用于Vimeo播放器的通用ABR解决方案,该算法能自适应全球不同网络状况和全天的网络波动。
深度学习中的优化是一项极度复杂的任务,本文是一份基础指南,旨在从数学的角度深入解读优化器。
详解AI加速器(一):2012年的AlexNet到底做对了什么?
临近 2022 年新春佳节,抖音正式启动了温暖中国年活动。为了增加线上的虎年新春氛围,一系列 AR 相机特效上线集成到抖音相机中,日常生活的景观会在抖音的镜头下呈现出各种奇妙的效果。
图像分割是计算机视觉研究中的一个经典难题,已经成为图像理解领域关注的一个热点,图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。
在这篇论文中,作者提出了两种方法来调整为 RGB 图像设计的深度图像压缩框架来压缩 YUV420 图像;基于轻量级框架,进一步研究了调整 YUV 通道的训练失真权重时对编码性能的影响。
今天来说说图像处理最基础知识,彩色图像与灰度图像转换,一般大家熟知的彩色图像转灰度的公式如下。
无人驾驶车辆在运行中需要面对白天、黑夜、黄昏、大风、暴雨、雾霾等自然环境信息,以及道路上行人、车辆、红绿灯等物体信息,车辆究竟是如何做到理解这些复杂的信息?
《2021-2022中国自动驾驶产业年度总结报告》通过对2021年自动驾驶大事件的梳理,从汽车产业价值链、技术发展路径、多场景应用、企业商业模式、核心零部件供应、数据安全这六个维度进行年度复盘与分析。
本节将介绍自动驾驶汽车的定位技术包括:GNSS(全球导航卫星系统),RTK(实时运动定位)和惯性导航。
阅读推荐
“元宇宙”这个词对人们来说有不同的含义:对一些人来说,它是在一个持久的景观中的沉浸式虚拟现实体验;对另一些人来说,它是一个特定的技术栈;对一些人来说,它是对未来社会的一种展望。
Mux收购web端推流直播工具 StreamClub
Stream Club平台即将加入Mux,这是一个让客户能够轻松构建实时视频广播和创建类似工作室的体验的平台。Mux和Stream Club有一个共同的目标——让每个人都可以使用流媒体直播。Mux为开发者提供基础设施,Stream Club为创作者提供现场内容制作体验。
https://mux.com/blog/stream-club-is-joining-mux/
在2021年底,LiveVideoStack策划了一次年终技术盘点,我们向音视频领域的一线技术工作者们发出了约稿邀请,希望他们能够输出一些音视频方向的技术内容。
FPGA交换格式:实现可互操作的FPGA工具
谷歌和Antmicro合作的FPGA 交换格式项目,提供一个统一的框架,以降低开发人员从一种工具快速迁移到另一种工具的准入门槛。Antmicro 和其他 CHIPS 联盟成员正在合作开发 Interchange 格式定义和相关工具,旨在成为 FPGA 行业需要的开发标准。
https://opensource.googleblog.com/2022/02/FPGA%20Interchange%20format%20to%20enable%20interoperable%20FPGA%20tooling.html
上个月,MPEG-LA发布了VVC专利池。此前,Access Advance在2021年7月率先发布了VVC专利池。两大VVC专利池形成对峙,但都没有吸引最重要的企业加入。
Datadog宣布收购CoScreen
CoScreen 现在是 Datadog 的一部分,Datadog是云应用程序的监控和安全平台,也是最成功的科技公司之一。Datadog 让技术团队深入了解他们的系统和应用程序,帮助他们更快地发现、分析和解决问题。
https://www.coscreen.co/blog/coscreen-joins-datadog/
活动推荐
LiveVideoStackCon 专题评审团活动报名
为了更加完善LiveVideoStackCon 音视频技术大会的演讲内容,如:准确性、逻辑性、可阅读性、内容的干货程度、以及对参会者的受益情况等,保证内容对外输出的准确&严谨;其次,对演讲者的自我提升(输出内容更加专业、降低错误、增加演讲自信、多方沟通促进交流);而对参与审校人员来说,在评审内容时可以了解到业内的最新动态,与评审团成员相互交流,分享心得。
因此我们特别成立LiveVideoStackCon 评审团机制,点击阅读原文了解更多详情,报名参与:
http://livevideostack.mikecrm.com/mVxofCi
以上是关于音视频技术开发周刊 | 232的主要内容,如果未能解决你的问题,请参考以下文章