全新的Skylake 英特尔I7-6700K深度玩评
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了全新的Skylake 英特尔I7-6700K深度玩评相关的知识,希望对你有一定的参考价值。
参考技术A【IT168 评测】2015年8月5日,Intel终于推出了代号为Skylake的第六代酷睿平台,此次主要为架构升级,工艺依旧是上一代Broadwell的14nm工艺。而由于不和上一代主打移动的路线撞车,英特尔这次在首发名单中仅有I7-6700K和I5-6600K两款处理器和主打高端的Z170一款芯片组。
在正式开始评测之前,我们先来看一看一些由英特尔官方PPT提供的数据。
▲第一批登场的两款都是黑盒版的高端CPU,Z170也是新一代的高端芯片组
▲在高端消费级市场之中,游戏玩家非常重要,这次首发的两款CPU也是主要针对游戏玩家
▲Skylake除了传统的倍频超频之外,还全民开放了能够逐Mhz调节的外频超频,内存超频也得到了改进
▲PCI-E3.0、USB3.0的支持,4核心默频4.0Ghz,非常厉害
▲和英特尔现任主流平台旗舰I7-4790K的对比,外频完全开放,内存支持到DDR4,内存调节步幅也有优化
▲DDR4在Z170新品组上将普及开来
▲官方数据,注意6700的实际TDP是95W而非91W,两者的集显都是HD530,原生支持4K/60Hz输出
▲全新的包装盒和LOGO,UNLOCKED字样很醒目。339、242美元的售价也是不太便宜
▲新品的公布计划,18号公布了架构细节,在第三季度内会有更多的Skylake型号全面登场
▲除了台式产品之外,Skylake也会根据笔记本来推出“K”系列的黑盒版
▲新特性的总结,可谓是一切全新,之前Z97那一套都不能通用了
▲新平台架构图,可谓是“开创新时代”的新架构、新芯片组,突出一个快字
Z170新名堂多多 LGA1151引领芯片组革命
本次测试的主板为华硕提供的Z170-A【点击查看详情】,齐全的配置与诸多新特性的支持使得我们的测试稳定而准确。
▲主要特性一览,原生支持USB3.1、全面支持超频的4×DDR4插槽和3×PCI-E3.0都是亮点
▲华硕非ROG高端系列专用的银白配色
▲原生的DDR4支持,4个插槽最大支持64G的内存容量
▲主板后置原生接口,配合6700K能够核显支持原生4K输出,USB3.1接口的加入也与时俱进
▲主要北桥芯片用散热片盖起来了,三路Sli的支持也是足够良心
▲双TPU设计
▲Crystal Sound音频模块,三路PCI-E,支持SLI与交火技术
▲豪华的十相固态电容供电系统,为CPU提供强劲动力
▲做工精湛
▲最新的LGA1151接口虽然不能兼容之前的CPU架构,但是只要不与主板元件冲突的话,散热器是与LGA1150通用的
Skylake架构解析 指令执行前端明显提升
这代skylake最明显提升的是指令执行前端(处理器架构分两部分,一部分是指令执行前端,一部分是后面的运算单元部分,前者决定了处理器运算的效率,后者则是运算的能力!),提升包括更高分支预测效率,更大的微指令缓存,更快的指令预取速度,更高度并行化的乱序执行技术,剩下就是AES相关的提升了。(此部分文件翻译自Techbang,小编有对内容进行个人理解下的润色)
上面这张图片展示出 Skylake 的改进之处,除了已知的新品组 I/O 部分有重大改变之外,核心部分没有意外地朝向每个时脉更多指令、提升效率的方向进行。负责连结核心内部各处功能的 Ring 和 LLC 部分,也提升了吞吐量性能,镜头捕捉影像后负责处理的 ISP 也内建在核心之中。
其它部分就是已知的规格,内存部分升级 DDR4 双通道,全面支持 DirectX 12、部分产品会采用 GT3+eDRAM 以及 GT4+eDRAM 的封装形式。超频能力因为 BCLK 基本参考外频独立,而能够大幅超频不影响其它 PCIe 的运作。
接下来的简报中,可以看见 Skylake 强化了前端部分,分支预测器的容量和准确度皆有提升,更大的缓冲区提供更更多的指令特性,以及更快的预取速度。乱序执行缓冲区也提升容量,能够提取更多指令加强平行化处理。
处理单元部分加入更多的单元,同时减少处理延迟,当单元不处理时就关闭省电,AES-GCM 和 AES-CBC 加密演算法可分别提升 17% 和 33%。载入与储存频宽也因为缓冲区的加大随着变大,也换了更好的演算法处理 page miss 和 L2 读取问题,将执行结果回写和移除指令的单元也有提升。
简单来说 Skylake 加宽加深了指令暂存区,除 In-Flight Loads 和 FP Register File 不变之外,In-Flight Stores 提升了 33%,Scheduler Entries 更是提升 60%以上。其它像是 AVX2 线路也可在不需要时关闭,从而更加节能。
内部 Ring 汇流排负责交换资料的部分,吞吐量提升 1 倍,耗电量不变仅多了 50% 的电晶体数量,LLC(L3 快取)在处理失误时的吞吐量也提升 1 倍。此外就是 eDRAM 的变更部分,在先前的微架构中,LLC 需要有 25%(512KB)的容量花在 eDRAM 的存取标记,而且 eDRAM 也无法和处理核心、绘图核心以外的区域直接沟通。
到了 Skylake 微架构,eDRAM 的控制器接在 System Agent,能够快取处理器封装内部的所有资料,也不须再冲刷掉内部资料以维持快取一致性。改接在 System Agent 之后,对于降低耗电量也有好处,显示萤幕更新不必再唤醒部分核心。
Skylake 将 eDRAM 改由 System Agent 管理,快取一致性获得保障的同时还有降低耗电量的功用。
Intel 在 Skylake 中还加入了 Intel Speed Shift Technology,处理核心能够自行在不同的 P-State 中切换,延迟仅为 1ms。过去旧款的处理器由作业系统控制,延迟约为 30ms,不过新款的切换方式还需要作业系统协助才行(Windows 10 已支援)。
Duty Cycle Control 则是以核心的开关,模拟过去主频比较低的 P-State,直接避免晶体的漏电问题,换取更有效率的运作。SpeedStep Techonology 现在也不仅仅是支援处理核心,System Agent、DDR、eDRAM I/O 也包含在内。其它像是内部用来连接各区块的线路,也能够在工作完成时分别进入省电状态。
默频下性能对比4770K 有不小性能提升
测试平台说明:由于此次平台配置差异过大,且当时4770K测试软件版本与现在有较大不同,为求严谨、公正故不列出数据测试对比图,所有测试数据仅供参考使用。
▲此次直接采用Win10作为测试软平台,也是照顾到Z170芯片组能在此环境下得到最好的优化
CineBenchmark 15是一款综合的处理器和显卡性能测试工具,它支持基于x86架构下的Windows 7/8.1/10等系统,另外基于PowerPC和Intel架构Mac平台也可以很好的支持。CineBenchmark 11.5最高支持16个处理器核心。CineBenchmark使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。
▲CineBench R15的成绩,多核883分,单核178分,均高于4770K
wPrime是一款通过算质数来测试计算机运算能力等的软件,它能够很好的支持多核心处理器,最高支持八核心处理器。相对于Super PI的单线程测试,wPrime可以更好的反应处理器的多线程完整运算能力。
▲可能是由于新系统的支持不佳,wPrime成绩并不是非常理想
Fritz Chess Benchmark是国际象棋软件Fritz自带的电脑棋力测试程序,由于支持多线程,而且他做的是大量科学计算,所有经常被网友用来测试电脑的科学运算能力,他通过模拟电脑思考国际象棋的算法通过测量部分测试电脑成绩。
Fritz Chess Benchmark能够很好的榨干处理器的性能,超频测试后基本可以用其检查稳定性。Fritz Chess Benchmark还提供了一组对比成绩,就是基于Pentium 3 1.0GHz为基准1,然后计算的成绩可以更加直观的获悉CPU的相对性能提升。▲多核性能的16116分同样高于4770K的15936分,而单核3248分的成绩相当抢眼
AIDA64是一款测试软硬件系统信息的工具,它可以详细的显示出PC每一个方面的信息。AIDA64不仅提供了诸如协助超频,硬件侦错,压力测试和传感器监测等多种功能,而且还可以对处理器,系统内存和磁盘驱动器的性能进行全面评估。
▲非常强大的提升,DDR4比DDR3高到不知道哪里去了
WinRAR是一款通用的文件解压缩工具,常用于Windows下的文件打包或解压,针对目前的多核心CPU,WinRAR很早就开始提供了多线程的支持,CPU的性能以及内存读写带宽是直接影响WinRAR解压缩速率的关键。
WinRAR解压缩对线程数和内存带宽非常敏感,由于测试统一了内存频率和时序,所以影响主要来自线程数,当然单线程的处理器能力也有一定的影响。
▲比起4770K的8593Kbps,单线程性能强大不已的6700K这次可是完胜
由CPUID推出的硬件检测工具CPU-Z可以说是知名度、使用率都最高的CPU检测软件,在最新的的1.73.0版本中,其不仅添加了对Win10的完美支持,同时也添加了包括6700K在内的一系列新款CPU的识别,同时还加入了自己的一个简易测试,并且带上了大量的官方测试数据作为基准,非常的简单易用。
▲一些配置识别
▲自带的测试工具,此次参照是4790K,可以看到可闻提升
HD530表现优异 非Iris最强核显就是它
Intel还改变了核显名命名方式,编号由四位数减为三位数,官方说法是为了“减少混乱”,已发布的i7-6700K、i5-6600K上配备的就是HD Graphics 530,24个执行单元,最高频率1150MHz。
第九代核显在架构技术上有了很大的改进,比如支持“多层覆盖”(Multi Plane Overlay),类似AMD Carrizo APU里的视频播放路径调整。传统上,图像处理数据需要从CPU进入内存再交给GPU,然后返回内存,最后进入视频控制器,这在移动设备上会造成一定的效率低下。多层覆盖在视频控制器中增加了一个固定单元硬件模块,整个过程绕开GPU,减轻了GPU功耗和内存数据传输占用。
数字接口标准支持到HDMI 1.4、DisplayPort 1.2、eDP 1.3。通过DP-HDMI转接器也可以支持到HDMI 2.0,4096×2160/60Hz的最高分辨率也可以满足4K需求了,也高于HDMI 1.4,但还是比原生DP差一些。
在实际测试分数中,这颗核显的成绩也是非常抢眼。
▲GPU-Z升级到0.8.5之后,就可以正确识别出HD530的型号
▲新3DMark分数,是不是已经和低端的独显打平了?
▲3Dmark 11接近2000分的表现,虽然不如前代5775C上搭载的HD6200那般凶悍,却也代表了核心显卡的高水准
总结与其他:一次有诚意的系统性升级
在放出结论之前,我们先来介绍一下英特尔官方的超频工具Intel Extreme Tuning Utility。
Intel Extreme Tuning Utility是英特尔公司专为旗下中高端处理器与主板产品量身打造的超频工具,能够对处理器、内存和系统时钟进行精确调整,并监控温度、电压和风扇速度。在多次版本更新之后,这款官方发布的超频工具不仅无比强大,而且易用性和安全性都是超一流。
▲再回顾一下测试平台的数据
▲自身带一个测试工具,其实更大的作用是监视CPU的状态
▲超频界面,倍频、电压、功率都可以很方便的进行大幅度的调整
▲根据民间大神的测试,在极限条件下6700K已经能够超到6.8Ghz
总结:卷着Z170芯片组和DDR4支持强风的Skylake旗舰型号I7-6700K在CPU性能上的提升依旧是“挤牙膏”式的,不过更好的架构带来的是更佳的外围硬件支持与更强劲的核显性能,从而使得整体的应用体验得到提升。唯一的问题在于如果您选用了6700K作为您的新一代主机核心的话,您只能乖乖的去买配套的Z170主板与DDR4内存,这可就是一笔不小的花销,如果不是急于尝鲜的话,可以等过一段时间DDR4价格亲民之后再入手不迟。总体来说,I7-6700K作为全新平台的抗鼎之作,英特尔拿出了十分的诚意来推广DDR4与一系列新技术,这一切都是值得肯定的。
- 官方服务
- 官方网站官方网站
深度学习框架只为GPU? 答案在这里
目前大多数的机器学习是在处理器上完成的,大多数机器学习软件会针对GPU进行更多的优化,甚至有人认为学习加速必须在GPU上才能完成,但事实上无论是运行机器学习的处理器还是优化的深度学习框架,都不单只针对GPU,代号为“Skylake”的英特尔至强SP处理器就证明了这一点。
机器学习软件在英特尔至强SP系列白金版上的一系列基准测试性能表现与在GPU上非常相近,了解了底层架构之后,我们可以看到,在性能如此接近的情况下,使用GPU加速器更像是在购买一种“奢侈品”,用户在GPU以外还有很多其他的选择。毫无疑问,在用户只需要机器学习的情况下,“加速器”在性能和能耗方面更有优势,大多数人需要的不只是一台“智能的用于机器学习的服务器”,那就让我们来重点看一下英特尔至强SP 白金级处理器为什么是最佳的选择:
CPU优化深度学习框架和函数库
英特尔在基于GPU优化的框架中增加了CPU优化深度学习框架, 打破了深度学习框架偏重于GPU而忽视了CPU的行业现状,解决了目前这些框架缺乏CPU优化的实际问题。
TensorFlow由谷歌开发,是一个领先的深度学习和机器学习框架,有面向Linux的处理器优化
Caffe是图片识别领域最受欢迎的应用之一,英特尔提供的优化可以在CPU运行时提高Caffe的性能
Torch是当下流行的深度学习框架,需要在优化的CPU上应用,可以通过英特尔软件优化(比如英特尔至强可扩展处理器)提高Torch在CPU上的性能
Theano是一个开源的Python库,很受机器学习程序员的欢迎,它可以帮助程序员高效地定义、优化和评估涉及多维阵列的数学表达式
Neon是一个基于Python的深度学习框架,目的是在现代深度神经网络上实现易用性和可扩展性,并致力于在所有硬件上实现性能的最大化
MXNet是一个开源的深度学习框架
Python及其函数库是机器学习应用里最受欢迎的基础组成,Python加速版过去几年里得到了广泛应用,并且可以直接下载或通过Conda、yum、apt-get或Docker images下载
BigDL是一个面向Apache Spark的分布式深度学习函数库。通过BigDL用户可以把自己的深度学习应用当作标准Apache Spark程序来编写,直接在现有Apache Spark或Hadoop集群上运行。在Torch基础上开发的BigDL可以为深度学习提供综合性支持:包括数值计算(通过Tensor)和高级神经网络;此外用户还可以利用BigDL把提前训练的Caffe或Torch模型载入Spark程序。英特尔曾声称在一个单节点至强处理器上(例如与GPU相比),BigDL中的处理速度比原始开源Caffe、Torch或TensorFlow要高一个数量级
英特尔MKL-DNN是一个开源的、性能强化的函数库,用于加速在CPU上的深度学习框架
英特尔数据分析加速库(DAAL)是一个包含了被优化的算法构建模块的开源函数库,针对大数据问题最相关的数据分析阶段。这个函数库适用于当下流行的数据平台,包括Hadoop、Spark、R和Matlab
结果证明了一切,无论是TensorFlow、Caffe,还是Torch、Theano,这些深度学习框架都针对英特尔数学核心函数库(Intel MKL)和英特尔高级矢量扩展指令集(Intel AVX)进行了优化。通过CPU优化,TensorFlow和Caffe基准测试中的CPU性能分别提高了72倍和82倍。
机器学习加速器
科技与行业的发展都是瞬息万变的,机器学习的加速器也会从GPU转向FPGA、ASIC等等,除非我们永远只需要一台只能用于机器学习的服务器,只要在一台服务器上想实现可以支持各种的工作负载,英特尔至强可扩展处理器无疑是最佳的解决方案。
加速器的选择正在变得多元化,这是整个行业的发展趋势,多核CPU(英特尔至强融核处理器,特别是“Knights Mill”版)和FPGA(英特尔至强处理器,包含Intel/Altera FPGA)都可以提供更灵活的选择、卓越的性价比和高能效。
基于英特尔至强融核处理器训练或学习一个AlexNet图片分类系统的速度,是使用NVIDIA GPU的类似配置系统的2.3倍;英特尔至强融核处理器的性价比最高可以是GPU解决方案的9倍,每瓦性能高达8倍,英特尔Nervana将推出更多专为人工智能开发的产品。英特尔至强SP系列处理器为机器学习提供了卓越的性能,同时相比其他解决方案也为我们带来了更多的功能与选择,让我们在产品与行业的发展中都可以拥有更多可能。
以上是关于全新的Skylake 英特尔I7-6700K深度玩评的主要内容,如果未能解决你的问题,请参考以下文章