Play.ht训练出播客乔布斯/用嘴做视频？Meta出品/我国牵头发布首个自动驾驶测试场景领域国际标准...

Posted 2022-10-26 AI科技大本营

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Play.ht训练出播客乔布斯/用嘴做视频？Meta出品/我国牵头发布首个自动驾驶测试场景领域国际标准...相关的知识，希望对你有一定的参考价值。

本周，业界有哪些新鲜事？

核心硬件

Linux 6.1为LoongArch CPU带来新功能

日前，Linux 6.1为LoongArch CPU带来新的附加功能。早在5.19版本中，Linux便实现对LoongArch CPU 的初步支持，此后开发人员坚持填补功能特性上的短板，并在上一代6.0版本优化中带来对LoongArch PCI的支持。

据了解，开发人员已经完成 LoongArch EFI 引导，为 Linux 6.1 的 EFI 机密计算做好了准备。本轮开发周期还经历了 TLB / 缓存操作的重构，支持 qspinlock / perf 事件、Kexec 和 Kdump 处理。

台积电2nm将在2025年量产，晶体管密度提升较小

据台积电透露，3nm会在明年量产饱和，2nm将在2025年正式量产。据公司CEO魏哲家表示，2nm工艺超出预期，但并未打算提前量产。

工艺细节上，2nm略显逊色，晶体管密度相较3nm只提升了10%，较预期70%的提升幅度相差较大。这可能与其放弃使用FinFET晶体管，改用GAA晶体管的保守策略有关。该2nm工艺预计将会在苹果 A19芯片上首发。

英伟达RTX 4090显卡售罄，延续性能王者风范

英伟达RTX 4090显卡正式开卖，公版定价12999元，刚开放售卖即被哄抢一空，非公版也在第一时间被抢断货。而在海外二手平台，这一显卡已被炒至4499美元（约3万元人民币）。

延续性能王者的一贯作风，RTX 4090的配置更加“疯狂”。不但启用144 个 SM，总共18432 个CUDA内核，GPU 将配备96 MB的二级缓存和总计224 个ROP。

产业政策

数字货币智能合约广泛应用，累计交易金额超千亿

如今，数字人民币正在成为新一代的法定货币。基于可编程性，数字人民币智能合约在消费红包、政府补贴、预付资金等领域得到应用。

截至2022年8月31日，我国15个省（市）数字货币试点地区累计交易3.6亿笔，金额1000.4亿元，支持商户门店数超过560万个。与此同时，A股市场也有多家上市公司切入到数字货币领域，包括神州信息、证通电子、博思软件等。

深圳布局高端人工智能芯片研发，给予最高千万资助

10月11日，深圳市发展和改革委员会发布了《深圳市关于促进半导体与集成电路产业高质量发展的若干措施（征求意见稿）》意见的通告。在“全面提升产业链核心环节”中，强调实现核心芯片产品的突破。

其中，要求重点突破CPU、GPU、DSP、FPGA等高端通用芯片的设计，布局人工智能芯片、边缘计算芯片等专用芯片的开发。对企业购买IP开展高端芯片研发，给予IP购买实际支付费用最高20%的资助，单个企业每年总额不超过1000万元。

智能驾驶

首个自动驾驶测试场景领域国际标准由我国牵头发布

据工信部网站13日消息，2022年10月，由我国牵头制定的首个自动驾驶测试场景领域国际标准ISO 34501: 2022 Road vehicles － Test scenarios for automated driving systems － Vocabulary《道路车辆自动驾驶系统测试场景词汇》正式发布。

据了解，该国际标准主要规范了自动驾驶系统、动态驾驶任务、设计运行范围及条件等概念，明确了场景、动静态环境和实体要素之间的关系，并形成了包括功能场景、抽象场景、逻辑场景和具体场景在内的场景层次描述规则。

通过计算反应时间，Waymo证明自动驾驶比人靠谱12.5%

智能驾驶安全性问题决定了产业的前景，但从现阶段业界通行的SAE L0-L5分级来看，基本是对人类干预程度的模糊描述，没有标准化、可定量的严谨说明。从非智能到完全智能之间的模糊地带，对于智能汽车厂商来说，必须通过科学的方式来证明它的安全性。

继虚拟代表“司机”之后，Waymo再次通过数学模型来证明智能驾驶比人类驾驶更安全。通过架构模型，对比人类司机应对紧急情况时的反应时间和自动驾驶系统的反应时间，看谁更短。

在同时被卷入的16起交通事故中，Waymo的自动驾驶系统能够规避12起碰撞发生，即规避概率达到了75%，这一数据在理想状态下的人类NIEON模型上的表现为规避10起碰撞，规避概率为62.5%。

技术前沿

视频剪辑太麻烦，上Make-A-Video用嘴直接做

曾几何时，电视台的视频编导们还饱受找素材和剪辑之苦。但自从有了“Text to Image”，文字可以直接转图片，而在此基础上，文字直接生成视频功能也随之而来。

对于Meta出品的Make-A-Video来说，做视频不过就是写几个单词或者几行文字的事，而这个可以通过语音转文字实时完成，通过对内容的判断，Make-A-Video可以直接生成出原来并不存在的视频画面，而且画风多元。首席人工智能科学家Yann LeCun对自家产品评价道：该来的总是会来的。”

从工作原理看，Make-A-Video首先可以根据输入文本生成图像嵌入，通过解码器Dt生成16帧64×64的RGB图像，插值网络↑F对结果进行插值，从而达到理想帧率，超分网络将画面分辨率最终提升到768×768。

机器学习通过分析人眼可预测患心脏病风险

一项发表在《英国眼科杂志》上的最新研究表明，通过分析人眼球静脉和动脉血管，使用机器学习开发的软件可以在不到一分钟时间里预测患心脏病风险的水平。

实际上，使用人工智能从人眼中诊断疾病已经是机器学习发展最快的领域之一。糖尿病、阿兹海默症都可以诊断。但因为可靠性和普遍性仍然存疑，要将这一研究推行商业化落地还需要监管机构进一步的标准化认证。

AI语音模仿史蒂夫·乔布斯，做客Joe Rogan播客节目

在podcast.ai推出的第一期播客节目里，乔布斯成为了首位嘉宾。通过Play.ht 的语言模型将乔布斯过往录音进行大规模训练，最终形成一段假的播客内容。

至于这段录音对乔布斯的声音和思想有多高还原度，恐怕还不应该有过高的期待。除了声音比较像，语速和韵律还是不太正常，而思想则更谈不上，可以说是思维混乱。

以上是关于Play.ht训练出播客乔布斯/用嘴做视频？Meta出品/我国牵头发布首个自动驾驶测试场景领域国际标准...的主要内容，如果未能解决你的问题，请参考以下文章

真·拿嘴做视频！Meta「AI导演」一句话搞定视频素材，网友：我已跟不上AI发展速度...

LDA训练过程（吉布斯采样）

北京大学创业训练营专家讲座:创新大师乔布斯的创业理念与营销哲学

传智播客安卓视频教程

.NET传智播客第19期就业班视频（高清无加密）

从视频制作音频播客的服务？ [关闭]