实现统一寻址 AMD新一代Kaveri APU评测

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了实现统一寻址 AMD新一代Kaveri APU评测相关的知识,希望对你有一定的参考价值。

参考技术A

  【IT168 评测】今年年初的CES上,AMD正式公布了第三代APU——Kaveri,这是自2011年APU诞生以来最重要的一次更新,它不仅首次使用GCN架构GPU核心,同时也是首款支持HSA异构运算的APU,实现了CPU与GPU的统一寻址,让异构运算上升到了一个新的层次。


  不过首批Kaveri并未登录移动平台,而是率先进军DIY市场,AMD于1月份更新了旗下台式机处理器。在经过了半年的等待,专为笔记本电脑打造的Kaveri APU终于在2014台北电脑展正式发布。


▲移动版Kaveri APU的新特性

  针对笔记本电脑打造的Kaveri最高提供4个“压路机”X86心与8个GCN架构GPU核心,支持Mantle技术,支持DirectX11.2,多媒体加速器升级至UVD4.2\\VCE2.0,加入AMD TrueAudio技术,最高型号支持第三代PCI-E接口、DDR3-2133内存。


▲加入AMD TrueAudio技术

  众多的硬件更新配合AMD先进的软件技术为大家带来了更卓越的使用体验,作为新一代APU,Kaveri与上代产品一样,支持AMD快播技术、视频防抖技术、手势控制以及脸部登录,除此以外,Kaveri还新增了一项音频体验——AMD TrueAudio技术,它是由集成在Kaveri内部的一个专门核心控制,在对声音进行特殊优化时,效率更高且不占用CPU资源。


▲进军移动商用市场

  在产品布局上,Kaveri针对家用娱乐市场提供标准电压A系列APU和低功耗A系列APU,并且首次在移动平台APU中加入了顶级的FX系列,是移动版Kaveri的最高规格APU。

  与此同时,AMD还首次进军移动商用PC领域,推出了专门为商用笔记本打造的AMD PRO系列APU,可以说AMD Kaveri APU是AMD有史以来最重要的产品之一,不仅技术先进、理念超前,而且产品全面覆盖面广阔。

重新设计内核 12个计算核心不是梦


▲4个CPU核心与8个GPU核心

  Kaveri作为新一代APU为大家提供了4个“压路机”架构CPU核心和8个GCN架构的GPU核心,总共具备12个可用的处理核心,每一个核心都可以独立使用,尽管CPU和GPU的架构不同,但在AMD强大的异构系统中,这12个核心被有效利用起来,从而实现更高的运算能力,于是AMD将这12个运算核心统称为“计算核心(COMPUTE CORE)”。


▲CPU核心的改进

  当然在先进异构运算架构之下,每一个核心运算性能的强弱也是非常重要的。就CPU核心而言,Kaveri集成了两个双核模块设计的“压路机”架构CPU,与之前的“打桩机”核心相比,“压路机”在指令提取上可以降低30%的i-Cache丢失率、降低20%的分支预测错误率、调度器工作效率提升至少5%~10%,每线程最大派遣带宽提升25%以上,最终获得了更强的单核执行能力和更高的每瓦性能。


▲KAVERI更注重图形性能

  除了CPU的改进以外,Kaveri在图形处理核心方面也进行了升级,它首次将GCN架构显示核心集成到APU当中,并且分别配了47%的晶体管专门用于显卡,由此可见,Kaveri非常注重图形处理能力。


▲GCN架构显卡核心


▲提供8个异步计算引擎

  Kaveri集成有8个GCN架构显卡核心,每个核心拥有独立的分支和信息单元、向量寄存器、调度器、矢量单元、标量单元、纹理过滤单元等结构,同时Kaveri的GPU部分还具备八个异步计算引擎,每个引擎可管理多达八个队列,可与显卡控制处理器并行运行,独立调度和任务分配,从而实现高效多任务处理。

CPUGPU统一内存寻址 释放全部计算潜能

  毫无疑问,CPU与GPU的改进让KAVERI获得了更强的性能,不过CPU与GPU实现统一寻址才是KAVERI最引人注目的地方。

  Kaveri支持的HSA(Heterogeneous Systems Architecture)架构能够让APU中的CPU和GPU通过hUMA技术实现内存统一寻址,GPU和CPU对整体内存空间相互可见,并可同时访问,从而提升APU整体的运算能力。这样做的好处就是可以让CPU和GPU更好的协同工作,更加灵活的调度资源,提升APU整体的计算效能,从而大幅降低之前因独立内存寻址而带来的延迟效应。


▲统一内存寻址

  那么啥叫统一寻址呢?简单说就是CPU和GPU可以共享内存资源,在过去没有统一寻址的时候,内存中划拨了固定大小的区域给显卡做显存,剩下的部分留给CPU使用,虽然都是在同一个内存空间内,但CPU不能直接访问用作显存的部分,当CPU需要GPU去算个啥的时候,它需要先把数据拷贝到显存中,然后GPU做处理,完成以后的结果回传给CPU使用。这样一来造成了多次数据传输,耗费了系统资源,增加了数据出错的几率,二来存储空间分配不够智能,划分出去的显存太大就会造成浪费,过小就会不够用,同时也不好进一步分配。


▲hUMA实现统一寻址

  AMD最新的Kaveri通过hUMA技术实现了CPU与GPU统一寻址,CPU和GPU能够共享同一个内存存储空间,并且CPU可直接存取GPU的存储地址,就好象是一栋建筑里的两个快递员给A座和B座客户送快递,其中A座里的门牌号写的是数字,B座的门牌号写的是莫尔斯电码,给A座送快递的兄弟只认识数字,给B座送东西的帅哥只明白莫尔斯电码,当A座的人要寄个快递给B座,A座的快递员由于看不懂莫尔斯电码,所以没法找到具体的地址,只能先收货再传给B座的快递员去派送,这就是过去没有统一寻址时的工作方式。

  而现在hUMA把B座的门牌号变成了数字,并且教会了B座快递员识数,这时A座与B座的门牌号是一致的,两个快递员都能够看懂,这就是统一寻址,CPU和GPU就像是这两个快递员,这栋大楼就是内存,A座和B座就是分割出来给CPU和GPU的存储空间,从前两者的地址编码不一样,互通有无很麻烦,hUMA把它们都换成统一的内存地址,不仅让CPU部分跟GPU部分数据交互更直接,同时还可动态分配内存空间,提升内存利用率。


▲APU效率更高

  可以说hUMA技术解决了系统中不同种类计算核心在读取和访问内存之间的障碍,彻底将CPU和GPU绑在了一起,对异构运算起到了积极的作用,让CPU和GPU的融合更进一步。

升级多媒体加速器 加入独立音效核心

  现在的处理器集成度非常高,它不仅集成了CPU运算单元、GPU运算单元,而且还集成了许多专门的模块用于处理特定的数据,比如多媒体加速器。


▲KAVERI升级了多媒体加速器

  众所周知,视频编解码是非常耗费系统资源的,很多用户都会记得在1080P普及之初,许多电脑播放全高清视频的时候会非常不流畅,这是因为那时没有专门用于视频解码的核心支持,全靠CPU软解,占用大量的系统资源,于是新一代CPU不仅仅提升了运算能力,同时还加入专门用于视频编解码的内核,这就是多媒体加速器。


▲视频编码升级至VCE 2

  在视频编码引擎部分, Kaveri升级至VCE2,支持H.264 YUV420(I, P & B帧)、H.264 SVC暂存编码以及VCE DEM(显示编码模式),新增用于60GHz无线显示的H.264 YUV444 (I帧)。


▲统一视频解码升级至UVD4

  

在解码的部分, Kaveri支持H.264 / AVCHD w/改善纠错、VC-1 / WMV profile D、MPEG-2、Multi-View Codec (MVC)、MPEG-4/DivX,与之前的UVD3相比,改进不是很大,仅增强了H.264/AVCHD视频解码的纠错能力。


▲新增AMD TRUEAUDIO技术

  既然是多媒体加速器,除了图形图像以外, Kaveri首次为APU加入专门处理音频的内核,提供AMD TRUEAUDIO 技术,它可以将双声道信号模拟生成更具方向感的多声道音频,在嘈杂的环境中能识别出主要的声音,降低周围噪音的分贝,增强声音的清晰度,在娱乐与视讯通话领域为用户提供更优质的服务。

降低功耗进军商用PC 首推移动版FX系列

  在了解了AMD  Kaveri APU众多更新与特性以后,下面我们来看看新一代移动版APU究竟包括了那些具体型号。


▲AMD新一代移动版APU的型号汇总

从上面这张AMD新一代移动APU的汇总表上可以看到三个亮点:

◆AMD FX-7600P与AMD FX-7500
◆A系列商用ULV APU
◆ULV APU的TDP低至19W和17W


▲首推移动版FX系列

  首先说说FX-7600P。FX系列对于关注DIY的用户并不陌生,它是AMD台式机处理器中定位最高的型号,也是超频玩家最喜欢的超频利器,不过到Kaveri之前,FX的名字从未出现在AMD移动平台处理器上,而FX-7600P是AMD首款移动平台APU,也是AMD迄今为止性能最强的笔记本处理器,而AMD FX-7500是低功耗APU中的旗舰,主要针对超轻薄笔记本市场。

  在参数上,FX-7600P融合Radeon R7单显,具有12个计算核心(4CPU核心+8GPU核心),基础频率2.7 GHz,最大智能超频3.6 GHz,最高支持DDR3-2133内存,TDP 35W,支持第三代PCI Express,其性能表现非常令人期待。

  除此以外,A系列标准电压APU主要针对高性能笔记本电脑设计,最大热设计功耗为35W,而低电压系列主要针对超薄笔记本,热设计功耗仅为19W,较上一代产品的25W,降低了了6W,在保证处理能力充足的同时,降低了整机发热量,提升产品的续航能力。


▲针对商用市场推出的AMD PRO系列APU

  与此同时我们还看到了一个新系列,那就是AMD A系列商用低电压APU,这是AMD首次针对商用市场推出的移动平台APU,与普通版APU相比,他的名字后面多了个“Pro”,这三个字母意味着AMD商用系列APU在性能、耐用和稳定方面可以提供更出色的表现,以满足商务用户在可靠性和工作效率方面的要求。

AMD FX-7600P现身 12核APU性能首测

  通过前面的介绍,我们对Kaveri有了比较全面的了解,接下来我们针对Kaveri系列中最顶级的AMD FX-7600P APU进行更加深入的测试。


▲AMD FX-7600P

  上面这张图片比较全面的展示了AMD FX-7600P的参数细节,其设计热功耗为35W,具备12个计算核心(COMPUTE CORE),其中包括4个“压路机”X86核心与8个GCN架构GPU核心,集成Radeon R7单显。

  除了AMD FX-7600P以外,这次测试的样机配备了三星256 GB固态硬盘,配备两条镁光4GB DDR3-1866内存,其存储系统达到了目前笔记本电脑的最高水平,能够最大限度发挥出AMD FX-7600P的性能。

◆CINEBENCH R11.5


▲CPU性能提升接近1倍!

  CINEBENCH R11.5是目前最流行的CPU和GPU测试系统,对于此次测试来说,我们主要关注CINEBENCH R11.5的CPU多核心测试成绩,从结果可以明显看到,AMD FX-7600P的CPU多核心处理能力比上一代A10-5750M提升了近一倍!

◆Musemage

  Musemage是全球首款支持GPU加速的图像处理软件,它包含有一系列先进的功能和一个易用的用户界面,当用户处理照片时,Musemage可以利用CPU与GPU协同操作,从而获得更快的处理器速度。


▲新一代APU较之前的产品可以节约30%的处理时间

  在此项测试中,Musemage对一张照片进行了降噪、锐化、模糊、自动对比度、白平衡以及其他的多项处理,最终配备AMD FX-7600P APU集成Radeon R7单显的样机获得了5302分的总成绩,处理耗时为18859ms ,而上一代A10-5750M APU + HD8570M独显此项测试成绩为3750分,耗时26661ms,也就是说新一代APU较之前的产品可以节约30%的处理时间。

◆PCmark 8

  PCmark 8是新一代整机综合性能基准测试软件,它针对不同的应用模式提供了Home、Creative、Work、Storge和Applications五种不同的测试。其中的Storge主要测试的是电脑的存储效能和稳定性,而Applications则主要针对微软Office等第三方软件所进行的测试。对于普通家用户来说,Home的测试更具参考价值,所以我们在这一模式下对样机进行了测试。


▲PCmark 8成绩

  从测试结果来看,配备AMD FX-7600P的笔记本取得了3023分的总成绩,这说明它的运算性能较强,整机综合素质比较出色,对于日常网页浏览、视频播放、视频转码、游戏等方面都能提供较好的支持。

融合单显性能强 游戏性能直逼独显

  作为新一代旗舰级APU,AMD FX-7600P不光是CPU部分处理能力翻倍,而且它内置的Radeon R7单显性能也非常抢眼。

  Radeon R7单显拥有8个GCN架构GPU核心,支持Direct X11.2,最大频率686MHz,支持Mantle技术,多媒体加速器升级至UVD4.2\\VCE2.0,加入AMD TrueAudio技术,最高型号支持第三代PCI-E接口、DDR3-2133内存。

◆3Dmark 11


▲3Dmark 11测试结果

  对于评判显卡游戏性能的高低而言,3Dmark绝对是目前最专业最权威的基准测试程序,它的测试结果具有非常重要的参考价值。对于Radeon R7单显来说,在3Dmark 11的测试中,其图形项目得分达到2095分!已经达到中端独显的水平,与上一代Radeon HD8610G相比提升了50%左右。

◆3Dmark 

  与3Dmark 11类似,3Dmark是Futuremark最新一代基准测试软件,它针对不同级别的显卡提供三种测试环境,其中FireStrike专为基于DirectX11显卡的高端产品设计、CloudGate支持基于DirectX10的主流硬件而IceStorm是为入门级DirectX9设备打造。


▲3Dmark测试结果

  对于Radeon R7而言,它的FireStrike测试的总成绩达到1260,图形项目得分1406,与A10-5750M总分865,图形项目930分相比,AMD FX-7600P Radeon R7提升了45%和51%,可在全高清分辨率下满足《生化危机6》《剑灵》等主流3D游戏,如果再配合AMD新一代独立显卡,混合交火后的游戏性能相当令人期待。

总结:统一内存寻址意义非凡

  经过前面详细的介绍,相信大家已经对AMD新一代Kaveri有了较为全面的认识,首先需要肯定的是Kaveri PU在性能上较前代产品确有大幅提升,就拿此次测试的FX-7600P为例,4核“压路机”X86核心+8核GCN架构GPU核心达到了AMD新一代APU的最高配置,展现了AMD在CPU领域和GPU领域的最高技术,同时伴随HSA架构引入的hUMA技术,实现了CPU和GPU的统一寻址,加速了CPU与GPU的融合,为APU今后的发展指明了方向,拓宽了道路。

  从测试结果上看,FX-7600P作为Kaveri家族在移动平台的旗舰产品,其CPU的处理能力较上一代旗舰提升一倍,在支持GPU协同运算的新应用上,FX-7600P则有着巨大的性能优势。

  与此同时,使用了47%的晶体管打造的8核心GCN架构GPU,为FX-7600P带来了匹敌中端独显的游戏性能,新加入的AMD TureAudio增强了用户的听觉享受,而Mantle技术提升了游戏的运行效率,让选择它的用户在游戏时有可能获得更好的音频与视觉体验。

  毫无疑问,新一代Kaveri亮点很多,性能提升显著,但要想发挥出它的全部能力势必需要软件方面的支持,而AMD所倡导的异构运算正是未来PC发展的方向,他最大的好处在于集中管理整机各个部分的运算能力,合理分配资源,它所带来的性能的提升,是现阶段仅靠单纯提升CPU运算能力所无法比拟的。所以未来支持异构运算的软件一定是越来越丰富,而异构运算模式也不单单局限于现在PC上使用的x86 CPU和GPU,像现在最流行的ARM架构处理芯片也将加入其中。

    官方服务
      官方网站官方网站

以上是关于实现统一寻址 AMD新一代Kaveri APU评测的主要内容,如果未能解决你的问题,请参考以下文章

AMD正式公布第七代桌面级APU AM4新接口

[评测]AMD Radeon RX 6900 XT 评测

AMD RX6800系列评测出,RTX 3080卒,享年两个月

重回双雄争霸时代 AMD Radeon RX 6800/6800XT首发评测

AMD Ryzen:8代APU成功打入Chromebook

卡皇降临!AMD Radeon RX 6900XT显卡首发评测