Intel推出10nm 3D新CPU架构,让失效的摩尔定律再次生效!

Posted Hardy晗狄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Intel推出10nm 3D新CPU架构,让失效的摩尔定律再次生效!相关的知识,希望对你有一定的参考价值。

 

 

 

Intel在大洋彼岸的Architecture Day 2018活动中,公布了多项重大产品消息,最重要的消息就是发布了基于下一代Sunny Cove架构的10nm芯片,该CPU芯片将有望在2019年下半年开始出货。

 

 

大会公布了Sunny Cove架构细节和2019-2021年的核心路标。Intel将核心产品线的路标更新方式分为两个分支: 通用和专用产品。

 

下一代Sunny Cove架构

 

在摩尔定律已经发展到尽头的今天,英特尔在10nm工艺制程上遇到巨大困难,本来2到3年提高工艺制程的计划一拖再拖。以至于从2015年发布Skylake架构的芯片以来,英特尔一直在14nm上小修小补。

甚至传言称英特尔在10nm工艺制程上遇到巨大困难,可能完全放弃10nm计划。此次对下一代Sunny Cove架构的改进和创新让人耳目一新,并证实了10nm计划的落地。

 

 

而英特尔突然宣布明年将推出下一代Sunny Cove架构的酷睿与至强芯片,其架构平台终于从“湖”(Lake)变成“海”(Cove)。旨在提高通用计算任务的时钟和功率效能,Sunny Cove的特点主要包括:

  • 增强CPU微架构,提高并行操作能力
  • 通过新算法降低延时
  • 增加关键缓存大小优化工作负载
  • 特定和架构扩展(如AES、SHA-NI性能提升加密指令等)
  • 下一代Deeper、Wider、Smarter处理器

 

 

 

Deeper:Sunny Cove是一种基于10nm工艺构建的增强型微架构。 虽然它仍然来自之前的Skylake,但是已被改进以并行执行更多指令,并具有更低的延迟,同时芯片缓存也比之前扩大很多。Sunny Cove芯片的一级缓存比Skylake大50%,至于2级缓存大小则会取决于芯片的市场定位。

 

 

Smarter:Sunny Cove包括对AVX-512指令的支持。 AVX-512涵盖许多不同的扩展和功能,一些是通用矢量算法,另一些是专门用于神经网络等工作负载。提供更好的分支预测精度算法,有效降低负载延时。

 

 

除此之外,Sunny Cove还包含加速加密和数据压缩工作负载的新指令,在这些新指令上相比前代有75%的性能提升。

 

 

Wider:Sunny Cover处理器也比Skylake更宽,有5宽度分配能力、10个执行端口、2倍L1存储宽度。将SIMD、Shuffle、LEA单元添加到向量和整数块区中。

但英特尔推出的并非完全是10nm芯片,而是通过Foveros技术将不同性能、不同部分封装在一起,仅高性能部分使用的是10nm工艺制程。

 

Foveros全新3D封装技术

 

英特尔在推出Sunny Cove的同时,也宣布了其业界首创的逻辑芯片3D堆叠技术Foveros。该技术之前已经应用在存储芯片上,但用在CPU上仍有困难,如果在CPU上堆叠内核,不但会让CPU极度过热,而且验证测试也需谨慎。

下图显示了通过Active Interposer层将两个独立的芯片装载到同一个Package中。这种设计让Intel在设计部件时拥有极大的灵活性。应客户的要求,Intel生产了一款搭载Atom和标准Core处理器的CPU。虽然这种异构组合在ARM架构上比较常见,但这是我们第一次在Intel CPU上看到它。

 

 

Foveros允许将复杂的逻辑芯片堆叠在一起,从而提供更大的功能,使处理器不同部分的组件与相应的制造工艺匹配。例如,高性能CPU内核可能构建在性能最高的10nm工艺上,但集成USB、Wi-Fi、以太网、PCIe的I/O连接部分不需要这么高的性能。

因此,对于芯片的这一部分使用性能稍低的14nm甚至22nm工艺可能更有意义,性能仍然足够好,但功耗和成本要低得多。Foveros意味着处理器可以按照不同的制程集成这些组件。

使用Foveros,这些不同的组件可以并排紧密包装在一起,实现更高的密度和更小的芯片面积。

大会上演示的基于Foveros技术芯片实现核心CPU和Atom CPU的物理硅空间共享。如果把市面上的EMIB和Foveros相比,答案就是Foveros是一个3D芯片堆叠解决方案,而EMIB是2D堆叠解决方案,但这两种技术并不排斥,据说Intel英特尔正在计划开发使用这两种技术的硬件产品。

 

英特尔表示,Foveros产品将在2019年下半年出货,该技术已准备好进行大规模生产,它不仅仅面向专用或定制处理器,还包括主流消费级CPU。首批产品将采用22FFL(低功耗FinFET)工艺,将10nm计算单元堆叠在芯片顶部。

 

 

10nm部分将包含Sunny Cove高功率核心和四个Atom内核,它与现代手机上的ARM处理器类似,对于较轻的工作任务使用低功耗Atom内核,而Sunny Cove用于计算量更大的任务。

 

 

该产品的最终结果是一个混合x86架构,它可以在Core和Atom之间切换,两者都构建在10nm上。芯片上的逻辑包含在底部芯片中,而CPU内核位于顶部。AMD和英特尔都在向Chiplets进军,但Intel似乎相信,3D芯片将获得更多的市场份额。

 

 

EMIB和Foveros的组合能力使Intel能够以新的组合连接硬件。随着时间的推移和新问题的出现,摩尔定律的定义也发生了变化。但是今天,CPU继续遵循摩尔定律,继续改进规模、集成和功耗。如果英特尔能够真正开始大规模生产3D芯片,它可能重塑我们未来设计CPU的方式。

 

独立显卡2020年上市

 

英特尔放弃第10代集成显卡,推出全新的第11代(Gen11)集成显卡,它配备64个增强型执行单元,比此前的英特尔第9代集成显卡(24EU)多出一倍以上,运算能力突破1 TFLOPS。

 

 

新的集成显卡将使用基于图块的渲染方法,该方法将图像划分为单独渲染的图块。这样会减少GPU所需的内存带宽。该芯片包含两个解码器和一个编码器,英特尔重新设计了HEVC /H.265编码器。它将支持4K甚至8K视频流,并且支持HDR和AMD的FreeSync技术。

 

 

新的集成显卡将在2019年与10nm处理器一起推出,因此很可能与新的Sunny Cove核心搭配组合。Intel强调,公司计划推出新架构的独立显卡,代号为“Xe”,预计将于2020年出货。

推出深度学习参考堆栈

 

除了以上内容,英特尔还宣布推出深度学习参考堆栈(Deep Learning Reference Stack),这是一个集成、高性能的开源堆栈,基于英特尔至强可扩展平台进行了优化。

 

 

它的开源社区版本旨在确保人工智能开发者可以轻松访问英特尔平台的所有特性和功能。深度学习参考堆栈经过高度调优,专为云原生环境而构建。

该版本可以降低集成多个软件组件所带来的复杂性,帮助开发人员快速进行原型开发,同时让用户有足够的灵活度打造定制化的解决方案。

  • 操作系统:Clear Linux操作系统可根据个人开发需求进行定制,针对Intel平台以及深度学习等特定用例进行了调优;
  • 编排:Kubernetes可基于对Intel平台的感知,管理和编排面向多节点集群的容器化应用;
  • 容器:Docker容器和Kata容器利用Intel虚拟化技术来帮助保护容器;
  • 函数库:Intel深度神经网络数学核心函数库(MKL DNN)是Intel高度优化、面向数学函数性能的数学库;
  • 运行时:Python针对Intel架构进行了高度调优和优化,提供应用和服务执行运行时支持;
  • 框架:TensorFlow是一个领先的深度学习和机器学习框架;
  • 部署:KubeFlow是一个开源、行业驱动型部署工具,在Intel架构上提供快速体验,易于安装和使用。

 

参考链接:

https://www.extremetech.com/computing/282137-intel-uses-new-foveros-3d-chip-stacking-technology-to-build-core-atom-on-the-same-silicon

https://wccftech.com/intel-sunny-cove-cpu-architecture-and-next-generation-roadmap-revealed/

 

温馨提示:

请识别二维码关注公众号,点击原文链接获取更多技术资料和文章。

以上是关于Intel推出10nm 3D新CPU架构,让失效的摩尔定律再次生效!的主要内容,如果未能解决你的问题,请参考以下文章

Intel新一代Atom升级Tremont架构:10nm+新指令集

关于intel cpu命名规则的一些说明

Intel CPU架构

宏碁发布2019款Swift 5超轻薄本:10nm酷睿CPU仅998g重

内存狂挤牙膏Intel跪了!10nm玩出6种花样

Intel 26款十代桌面酷睿全泄露:10核心可加速5.3GHz可降至25W