GPU:给显卡一颗驿动的“芯”(首发电脑报) - 产品流水线 - 阿镝

(这条文章已经被阅读了 23 次) 时间:2001-06-13 22:45:24 来源:阿镝 (flyhero) 原创-IT

是的,是GPU而不是CPU,你没看错我也没写错,那么GPU是怎样的一个概念呢?
1999年8月31日世界著名图形芯片制造厂商nVIDIA公司正式发布了代号为NV10的GeForce 256图形处理芯片,并首次提出了GPU(Graphic Processor Unit)的概念。GPU的中文意译为“图形处理器”。应该说GPU概念的提出在3D图形芯片技术的发展史上具有划时代的意义,GPU再加上CPU,使计算机同时拥有了两颗奔腾的“芯”。 GPU使显卡减少了对CPU的依赖,它将一部分原来由CPU完成的工作“抢”了过来,在3D图形的处理上尤其如此,于是GPU当之无愧地成为了计算机运算体系中又一重要的核心部件,从而使 CPU能够从繁杂的3D图形处理中解放出来,集中资源去进行其它方面的运算。
GPU所采用的核心技术有硬件T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四象素256位渲染引擎等,而硬件T&L技术可以说是GPU的标志。硬件T&L(Hardware transform and lighting)即硬件转换与投影。我们在游戏中所看到的移动影像其实是由一连串快速显示的静态画面所组成,电脑绘制出一张静态画面要经过系列步骤,这些步骤包括转换(tranform)、投影(lighting)、三角形设定(triangle setup)及成像(rendering)等等,显然T&L是最前面两个步骤。传统上,转换及投影这两个步骤是由系统处理器即CPU进行运算处理的,而GPU拥有自己的硬件转换与投射(T&L)引擎,从而可以分担了CPU的工作,让它可以集中力量进行其它方面的运算。具体如下图所示:
从上图可以看出,GPU除了具备传统显卡芯片的绘图(Rendering)功能之外,还把原本属于CPU的T&L(Transform & Lighting)工作给“抢”了过来,使CPU可以腾出更大的“空间”去进行人工智能、物理性和游戏控制方面的运算。
目前来讲,具有硬件T&L技术的显卡芯片主要有nVIDIA的GeForce256、GeForce2 系列、GeForce3、Quadro系列,ATI的Radeon和从前S3的Savage 2000,需要指出的是尽管Savage 2000也具有硬件T&L,但宣称自己产品为GPU的只有nVIDIA和ATI。
nVIDIA :打造GPU概念,只求一统江湖
nVIDIA公司自从推出TNT芯片后,一直保持着半年一代的发展步伐,如此速度使其它公司应接不暇,望尘莫及,自推出GeForce256及GPU概念以来,nVIDIA已拥有GeForce256、GeForce2 系列、GeForce3、Quadro系列的全线GPU产品,在图形芯片领域风头无二。
GeForce256
GeForce256采用0.22微米的制造工艺,集成了2300万个晶体管,比奔腾III处理器还要多,具有256位总线的显存通道宽度,在芯片中增加了以往各类图形芯片都不具备的T&L引擎,因此它基本上可以脱离CPU的帮助独立处理所有2D/3D图形显示数据,是全球首块GPU。但由于没能很好地解决散热及功耗问题(GeForce256的耗电量则高达17W),因此nVIDIA只能将其工作频率设为125MHz,所以GeForce256只能算做一款显卡芯片换代时期的过渡产品。
GeForce2 系列
⒈GeForce2 GTS GeForce 2 GTS与GeForce256一样也采用256位架构,但其采用了0.18微米的制造工艺,同时发热量也显著降低(GeForce2 GTS的耗电量约为8-9W),内核的运行速度更是飙升到200MHz,集成的晶体管数目也由GeForce256的2300万增加到了2500万,还改进了T&L引擎,三角形生成速度从GeForce256的1500万/秒提高到了2500万个/秒,能在3D加速芯片上进行所有的几何转换、光照、裁剪等处理。由于拥有4条在一个时钟周期内可以各自完成2个纹理处理的渲染引擎,所以在每个时钟周期内GeForce 2 GTS可以完成8个纹理的处理,渲染速度达到1600M/秒。全屏幕硬件抗锯齿(FSAA)和像素阴影等功能的使用,可以大幅提升游戏画面的质量。在与其搭配的显存方面,GeForce 2 GTS使用DDR显存,显存工作频率为166MHz,显存带宽高达5.2GB/s,在75MHz的显示器工作频率下,其2D/3D画面的最大分辨率 为2048×1536,支持Directx5-7。
⒉GeForce2 MX GeForce2 MX是GeForce2 GTS的简化版本,因此其价格相当接近于GeForce 256芯片。GeForce2 MX采用128位架构,核心运行频率为175MHz,渲染流水线有2条,其像素填充率、显存频率和渲染流水线的数值都只达到GeForce2 GTS的1/2。但是由于GeForce2 MX在流水线渲染方面象GeForce2 GTS一样可以在一个时钟周期内处理两个纹理单元,其核心运行频率也高于GeForce256,而且其硬件T&L能力也进一步升级到第二带,所以其综合的图形处理能力比GeForce 256有显著增强。此外,GeForce2 MX还拥有DVC和双显示功能。所谓的DVC(Digital Vibrance Control),即图形数字动态控制功能,可令 2D、3D以及视频图象更加清晰、亮丽;双显示功能则类似于Matrox G400的双头显示功能,即通过单个显示芯片可以提供对两个显示屏幕的图像输出。
⒊GeForce2 Pro GeForce2 Pro的大部分功能都与GeForce2 GTS相同,采用256位架构,三角形生成速度2500万个/秒,与GeForce2 GTS相比,显存带宽增加20%,主要用于OEM市场。
⒋GeForce2 Ultra GeForce2 Ultra是本系列的终极产品。采用第二代256位架构,三角形生成速度达到3100万/秒,显存带宽高达7.4GB/s。
⒌GeForce2 Go 它是世界上第一块笔记本电脑使用的GPU。在2D方面,GeForce2 Go可以提供16位和32位的图形模式,你可以轻松浏览网页、观看的DVD画质的视频节目;在3D方面,它的三角形生成速度可以达到1800万/秒,支持硬件T&L。

Geforcer3
Geforcer3采用0.15微米的制造工艺,核心频率200MHz。拥有4条在一个时钟周期内可以各自完成个纹理处理的渲染引擎,所以在每个时钟周期内Geforcer3可以完成16个纹理的处理,内核集成的晶体管数目也创下了前所未有的记录,多达5700万。拥有60亿次/秒的浮点运算速度,8000亿次/秒的运算处理速度,像率填充率为3.2G/s。。内建全新的nfiniteFX引擎、光速记忆体架构以及高分辨率图形保真技术。GeForce3还是第一款具有完全可编程和高分辨率反锯齿(HRAA) 能力的GPU。

Quadro系列
Quadro主要面向专业图形工作站,支持AutoCAD、3D Studio Max、Maya、 Softimage/3D、Adobe Photoshop等专业图形软件的使用。
⒈Quadro 动力强劲,每秒可进行200亿次的运算操作,三角形生成速度达1700万/秒,像素填充率最高可达5.4G/秒,并针对PIII Xeon和AMD Athlon处理器进行了优化。
⒉Quadro DCC Quadro DCC是专为DCC(Digital Content Creation)应用而设计的专业工作站图形解决方案,支持DirectX和OpenGL应用,其核心架构与GeForce3和微软的XBOX图形芯片一致。
⒊Quadro2 MXR/EX Quadro2 MXR/EX是专业图形工作站的高级显示版本,三角形生成速度达21M/秒,带宽为2.7GB/秒,50M pixels/sec的渲染能力。
⒋Quadro2 Pro Quadro2 PRO是世界上最快的专业图形工作站显示芯片,三角形生成速度达31M/秒,6.4GB/s的带宽,64MB的统一帧缓冲,1.0G pixels/s 渲染能力,以上指标都为高分辨率、高画质的图像提供了有力支持。

ATI:跟进GPU概念,市场搏杀力争上游
ATI并不是GPU概念的始作俑者,但却是最积极的跟进者,鉴于GPU概念的先进和nVIDIA的成功经验,ATI选择了跟进,目前ATI拥有Radeon系列的GPU芯片。
Radeon
作为ATI的新一代显卡芯片,Radeon的性能堪与GeForce2 GTS比肩。它采用0.18微米制造工艺,内置2500万晶体管,采用256位芯片架构,核心频率200MHz,显存频率为400MHz,支持ATI独有的MAXX技术,显存总线带宽高达6.4GB/s,使用ATI独有的Hyper-Z技术后可增至8GB/s,内建TMDS输出,支持DFP分辨率高达2048×1536,每秒可生成3000万三角形,像素填充率高达1200M/秒。值得一体的是,nVIDIA硬件T&L功能的英文缩写为“Hardware transform and lighting”,而ATI显然对硬件T&L功能进行了扩充,在其官方网站上其描述Radeon具有硬件T&L功能的语句是“Hardware for transformation, clipping, and lighting”。

S3:支持硬件T&L,但已昨日黄花
众所周知,S3已被威盛并购,但这里我还是想提一下S3从前的Savage 2000。S3并没有称Savage 2000为GPU,但Savage 2000确实支持硬件T&L功能。
Savage 2000
Savage2000为128位显示芯片,其像素填充率高达700M/s,核心频率200MHZ。它还是首款支持双像素/双纹理管道及独特的Quadtexture引擎技术的芯片,可以在单时钟周期下处理四次纹理贴图。另外Savage 2000还具有独特的“转换与减轻”引擎(S3TL)和硬件T&L技术,并可根据CPU的需要开启或关闭硬件T&L功能,同时仍支持S3TC纹理压缩,因此对CPU集中资源进行其它方面的运算大有好处。