GPU

Posted zjone391

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了GPU相关的知识,希望对你有一定的参考价值。

图形处理器

 编辑

同义词 gpu一般指图形处理器

图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑工作站、游戏机和一些移动设备(如平板电脑智能手机等)上图像运算工作的微处理器
用途是将计算机系统所需要的显示信息进行转换驱动,并向显示器提供行扫描信号,控制显示器的正确显示,是连接显示器和个人电脑主板的重要元件,也是“人机对话”的重要设备之一。显卡作为电脑主机里的一个重要组成部分,承担输出显示图形的任务,对于从事专业图形设计的人来说显卡非常重要。

 

功能作用

编辑
显卡的处理器称为图形处理器(GPU),它是显卡的“心脏”,与CPU类似,只不过GPU是专为执行复杂的数学和几何计算而设计的,这些计算是图形渲染所必需的。某些最快速的GPU集成的晶体管数甚至超过了普通CPU。
时下的GPU多数拥有2D或3D图形加速功能。如果CPU想画一个二维图形,只需要发个指令给GPU,如“在坐标位置(x, y)处画个长和宽为a×b大小的长方形”,GPU就可以迅速计算出该图形的所有像素,并在显示器上指定位置画出相应的图形,画完后就通知CPU “我画完了”,然后等待CPU发出下一条图形指令。
有了GPU,CPU就从图形处理的任务中解放出来,可以执行其他更多的系统任务,这样可以大大提高计算机的整体性能。
GPU会产生大量热量,所以它的上方通常安装有散热器或风扇。
GPU是显示卡的“大脑”,GPU决定了该显卡的档次和大部分性能,同时GPU也是2D显示卡和3D显示卡的区别依据。2D显示芯片在处理3D图像与特效时主要依赖CPU的处理能力,称为软加速。3D显示芯片是把三维图像和特效处理功能集中在显示芯片内,也就是所谓的“硬件加速”功能。显示芯片一般是显示卡上最大的芯片(也是引脚最多的)。时下市场上的显卡大多采用NVIDIA和 AMD-ATI 两家公司的图形处理芯片
GPU已经不再局限于3D图形处理了,GPU通用计算技术发展已经引起业界不少的关注,事实也证明在浮点运算并行计算等部分计算方面,GPU可以提供数十倍乃至于上百倍于CPU的性能,如此强悍的“新星”难免会让CPU厂商老大英特尔为未来而紧张, NVIDIA和英特尔也经常为CPU和GPU谁更重要而展开口水战。GPU通用计算方面的标准目前有OpenCL、CUDA、ATI STREAM。其中,OpenCL(全称Open Computing Language,开放运算语言)是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景,AMD-ATI、NVIDIA时下的产品都支持OPEN CL。
1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡,1992年 4月 ATi发布了 Mach32 图形卡集成了图形加速功能,1998年 4月 ATi被IDC评选为图形芯片工业的市场领导者,但那时候这种芯片还没有GPU的称号,很长的一段时间ATI都是把图形处理器称为VPU,直到AMD收购ATI之后其图形芯片才正式采用GPU的名字。
NVIDIA公司在1999年发布GeForce 256图形处理芯片时首先提出GPU的概念。从此NV显卡的芯就用这个新名字GPU来称呼。GPU使显卡削减了对CPU的依赖,并实行部分原本CPU的工作,更加是在3D图形处理时。GPU所采用的核心技术有硬体T&L、立方环境材质贴图与顶点混合、纹理压缩及凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&L技术能够说是GPU的标志。

工作原理

编辑
简单说GPU就是能够从硬件上支持T&L(Transform and Lighting,多边形转换和光源处理)的显示芯片,由于T&L是3D渲染中的一个重要部分,其作用是计算多边形的3D位置与处理动态光线效果,也能称为“几何处理”。一个好的T&L单元,能提供细致的3D物体和高级的光线特效;只不过大多数PC中,T&L的大部分运算是交由CPU处理的(这就也就是所谓软件T&L),因为CPU的任务繁多,除了T&L之外,还要做内存管理和输入响应等非3D图形处理工作,所以在实际运算的时候性能会大打折扣,一般出现显卡等待CPU数据的情况,CPU运算速度远跟不上时下复杂三维游戏的要求。即使CPU的工作频率超出1GHz或更高,对它的帮助也不大,因为这是PC本身设计造成的问题,与CPU的速度无太大关系。
 

供应商

编辑
GPU有非常多的厂商都生产,和CPU一样,生产的厂商比较多,但大家熟悉的却只有INA,以至于大家以为GPU只有三大厂商。

英特尔

英特尔的GPU基本为集成显卡芯片,用于英特尔的主板和英特尔的CPU。可能你想不到,要是只按市场占有率计算,英特尔随着他主板及CPU发售的集成GPU占据了整个GPU市场的60%以上。
他的GPU主要有:唯一一款独立显卡芯片Intel 740(i740)。Extreme Graphics系列、GMA系列(集成于芯片组中)。现在的HD Graphics系列[1]  、Iris? Graphics系列[2]  、Iris? Pro Graphics[2]  系列等(集成于CPU中)。

NVIDIA

NVIDIA是现在最大的独立显卡芯片生产销售商。
他的GPU包括大家熟悉的Geforce系列[3]  ,包括GTX、GTS、GT等。专业工作站的Quadro系列[4]  ,超级计算的Tesla系列[5]  ,多显示器商用的NVS系列[6]  ,移动设备的Tegra系列[7]  。
以前也销售集成在主板上的集成显卡芯片,这些随着主板芯片组一起发售,但是由于AMD收购ATI后自身主板芯片组GPU能力提高,NVIDIA芯片组如日中天的景象已经消失了。
曾经为游戏机XboxPS3供应GPU。

AMD(ATI)

AMD是世界上第二大的独立显卡芯片生产销售商,他的前身就是ATI,2006年AMD以54亿美元收购ATI。
他的GPU主要是大家熟悉的Radeon系列[8]  ,包括以前的X、HD系列,近几年的R9、R7、R5、R3,现在的RX系列等。专业工作站的FireGL系列,超级计算的FireStream系列,多显示器商用的FireMV系列,现在前三者已合并为FirePro系列[9]  。
早期ATI还生产过Wonder系列、Mach系列、Rage系列芯片。
除了独立显卡之外AMD还拥有集成显卡芯片,集成于芯片组APU中。
由于AMD收购ATI后,其主板市场迅速扩大,已经夺取了NVIDIA在AMD处理器主板芯片组的半壁江山。
就现在的发售量和发售盈利方面,AMD的GPU市场占有率方面仍然略输于NVIDIA。
AMD也是游戏机Xbox 360WiiWii UPS4Xbox One的GPU供应商。
 
 

3dfx

3dfx是一家于1994年成立的生产3D GPU及显卡的公司。
曾经生产了Voodoo系列显卡,并且研发了SLI技术。
由于经营不善等问题于2002年被NVIDIA收购。

Matrox

Matrox当年和NVIDIA,ATI一起争夺独立显卡芯片市场份额的一家公司,在曾经的一个时期Matrox的显卡和NVIDIA,ATI曾经在性能上比肩过。但由于后来其开发能力日渐衰退,在GF5时期,也就是ATI的9000系列时期,Matrox由于性能上整整落后了GF5900和Raden9800一个世代而逐渐被淘汰,淡出了民用独立显卡市场。
但时下Matrox仍然在工程用专业显卡方面有自己的地位。这些显卡用于工程主图和多头输出仍然很强力。与NVIDIA和AMD的专业显卡不同,NVIDIA,ATI的专业显卡涉足的是3D领域,而Matrox得专业显卡涉足的是2D领域,也就是CAD。
但由于OpenCLCUDA的日渐普及,DX10以上显卡将在所有支持CUDA的程序上表现出惊人的性能,也就是说当CUDA在各种运用软件普及的那天,Matrox也必将退出2D专业卡的市场。

SiS和VIA

矽统威盛时下是对孪生兄弟,但他们曾经也是分开的两家公司,并且都生产自己主板的集成显卡芯片。但这可怜的两兄弟已经逐步在淡出主板市场了,也就必定将淡出GPU市场。
 
 

产品区别

编辑
GPU在几个主要方面有别于DSP(Digital Signal Processing,简称DSP,数字信号处理)架构。其所有计算均使用浮点算法,而且此刻还没有位或整数运算指令。此外,由于GPU专为图像处理设计,因此存储系统实际上是一个二维的分段存储空间,包括一个区段号(从中读取图像)和二维地址(图像中的X、Y坐标)。此外,没有任何间接写指令。输出写地址由光栅处理器确定,而且不能由程序改变。这对于自然分布在存储器之中的算法而言是极大的挑战。最后一点,不同碎片的处理过程间不允许通信。实际上,碎片处理器是一个SIMD数据并行执行单元,在所有碎片中独立执行代码。
尽管有上述约束,但是GPU还是可以有效地执行多种运算,从线性代数和信号处理到数值仿真。虽然概念简单,但新用户在使用GPU计算时还是会感到迷惑,因为GPU需要专有的图形知识。这种情况下,一些软件工具可以提供帮助。两种高级描影语言CG和HLSL能够让用户编写类似C的代码,随后编译成碎片程序汇编语言。Brook是专为GPU计算设计,且不需要图形知识的高级语言。因此对第一次使用GPU进行开发的工作人员而言,它可以算是一个很好的起点。Brook是C语言的延伸,整合了可以直接映射到GPU的简单数据并行编程构造。经 GPU存储和操作的数据被形象地比喻成“流”(stream),类似于标准C中的数组。核心(Kernel)是在流上操作的函数。在一系列输入流上调用一个核心函数意味着在流元素上实施了隐含的循环,即对每一个流元素调用核心体。Brook还提供了约简机制,例如对一个流中所有的元素进行和、最大值或乘积计算。Brook还完全隐藏了图形API的所有细节,并把GPU中类似二维存储器系统这样许多用户不熟悉的部分进行了虚拟化处理。用Brook编写的应用程序包括线性代数子程序、快速傅立叶转换、光线追踪和图像处理。利用ATI的X800XT和Nvidia的GeForce 6800 Ultra型GPU,在相同高速缓存、SSE汇编优化Pentium 4执行条件下,许多此类应用的速度提升高达7倍之多。
对GPU计算感兴趣的用户努力将算法映射到图形基本元素。类似Brook这样的高级编程语言的问世使编程新手也能够很容易就掌握GPU的性能优势。访问GPU计算功能的便利性也使得GPU的演变将继续下去,不仅仅作为绘制引擎,而是会成为个人电脑的主要计算引擎。

 

 
 

以上是关于GPU的主要内容,如果未能解决你的问题,请参考以下文章

怎样让chrome使用gpu

用GPU加速Linux Kernel?

Tensorflow 不使用 GPU,发现 xla_gpu 不是 gpu

GPU编解码GPU硬编码

查看GPU信息,设置指定的GPU,pytorch移动到指定GPU操作

keras-gpu的安装与配置