音视频技术开发周刊 | 205
Posted LiveVideoStack_
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音视频技术开发周刊 | 205相关的知识,希望对你有一定的参考价值。
每周一期,纵览音视频技术领域的干货。
新闻投稿:contribute@livevideostack.com。
小提示:链接跳转仅支持公众号相关链接
近日,LiveVideoStack来到字节跳动采访了火山引擎视频云产品负责人Keith,他和大家分享了火山引擎视频云的情况,以及对音视频技术未来趋势的看法。
2021 年第二季度 DDoS 攻击趋势
最近几周见证了大规模勒索软件和勒索 DDoS(分布式拒绝服务)攻击活动,这些攻击活动中断了世界各地关键基础设施的各个方面,包括最大的石油管道系统运营商之一和世界上最大的肉类加工公司之一。本季度早些时候,比利时的 200 多个组织,包括政府和议会网站以及其他服务,也受到了 DDoS 攻击。
https://blog.cloudflare.com/ddos-attack-trends-for-2021-q2/
作业帮:基于 WeNet + ONNX 的端到端语音识别方案
本文介绍我们作业帮的WeNet + ONNX端到端语音识别推理方案,实验表明,相比LibTorch,ONNX的方案获得20%~30%的速度提升。
本文根据网易云信资深音视频服务端开发工程师陈策在《MCtalk Live#5:网易云信线上万人连麦技术大揭秘》线上直播分享整理。
基于Python的视频剪辑工具
MoviePy(完整文档)是一个用于视频编辑的 Python 库:剪切、串联、标题插入、视频合成(又名非线性编辑)、视频处理和创建自定义效果。有关使用示例,请参阅图库。MoviePy 可以读取和写入所有最常见的音频和视频格式,包括 GIF,并在 Windows/Mac/Linux 上运行,使用 Python 3.6+。
https://github.com/Zulko/moviepy
使用扩散模型生成高保真图像
今天,我们提出了两种相互关联的方法,它们突破了扩散模型的图像合成质量的界限——通过重复细化 (SR3) 的超分辨率和一种称为级联扩散模型 (CDM) 的类条件合成模型。我们得出了通过扩大扩散模型和精心挑选的数据增强技术,可以胜过现有的方法。具体来说,SR3 在人类评估中获得了超过 GAN 的强大图像超分辨率结果。CDM 生成的高保真 ImageNet 样本在 FID 分数和分类准确度分数上均大大超过 BigGAN-deep 和 VQ-VAE2。
https://ai.googleblog.com/2021/07/high-fidelity-image-generation-using.html
给图像特征提取开个“ViP”是什么效果?字节&牛津提出视觉解析器,全面超越HaloNet!
本文来自OSA Publishing,演讲者是郑州大学的Xiaomin Liu,题目是“基于压缩结构光场图像进行多信息融合深度估计”。
通过本文可Get如何使用OpenCV,深度学习和Python执行年龄的自动识别/预测。撸完本教程您将能以相当高的精确度,预测静态图像文件、实时视频中人的年龄。
逼真的虚拟化身也引起了人们对“深度伪造”这个问题的关注。目前,涉及合成视频或音频的深度伪造会对人们产生误导。未经授权使用虚拟化身也可能使人们对与它所描述的真实人物的认知产生混淆。
虽然任何虚拟化身,不管是否真实都可能由第三方驱动,但逼真的虚拟化身由于有类似人类的表情和手势,更容易建立信任。更糟糕的是,在未来或许你所认识的人的逼真虚拟化身可能会被用于广告或影响他人意见。
自动驾驶商业化的选择就像一次赌注,没有人知道哪个赛道会胜出。
无人车最新破绽:3D打印障碍轻松骗过9成算法,激光雷达和视觉「融合了个寂寞」
活动推荐
DTCC2021中国数据库技术大会150+议题精彩预览!
2021年8月18日~8月20日,由 IT168 旗下 ITPUB社区主办的第十二届中国数据库技术大会(DTCC202 1),将在北京隆重召开。大会以“数造未来”为主题,设置2大主会场,20+技术专场,邀请了超百位行业专家,为广大数据领域从业人士提供一场年度盛会和交流平台。
本届DTCC2021大会在技术主题方面,从数据库的底层内核代码开发,到数据库的架构设计,再到数据库技术的云平台实践,再到上层的AI与大数据应用,在大会的主题设置中,实现了比较全面的覆盖。针对当前比较热门的数据库技术主题,例如,云原生数据库的开发实践、分布式数据库的应用、图数据库技术的应用、时序数据库,在本次大会中,设置了多个专场,进行集中式分享。为期3天的DTCC大会,150+案例主题,让我们预览一下精彩概要主题及日程安排:https://mp.weixin.qq.com/s/nNdZMRUjpvesPpuxNrLV4Q
插图源自Pexels
以上是关于音视频技术开发周刊 | 205的主要内容,如果未能解决你的问题,请参考以下文章