一日一记7-----电脑补课讲堂(一)_lintongfang_百度空间

【显卡篇】


  显卡(Video card,Graphics card),又称为显示适配器(Video adapter),是个人电脑最基本组成部分之一。显卡的用途是将计算机系统所需要的显示信息进行转换驱动显示器,并向显示器提供行扫描信号,控制显示器的正确显示,是连接显示器和个人电脑主板的重要元件,是“人机对话”的重要设备之一。显卡作为电脑主机里的一个重要组成部分,承担输出显示图形的任务,对于喜欢玩游戏和从事专业图形设计的人来说显卡非常重要。

一、显卡基础知识


  前言

  现在的显卡新技术层出不穷,各项参数重多,刚接触硬件的朋友们往往想了解一款显卡好坏而无从看起,在此特介绍一下显卡的相关属性参数,孰好孰坏,各位自己定夺吧。合适的,才是{zh0}的。


  显卡的主要构成(极其参数)

1、显示芯片(型号、版本级别、开发代号、制造工艺、核心频率)
2、显存(类型、位宽、容量、封装类型、速度、频率)
3、技术(象素渲染管线、顶点着色引擎数、3D API、RAMDAC频率及支持MAX分辨率)
4、PCB板(PCB层数、显卡接口、输出接口、散热装置)
5、品牌

1、显示芯片

  显示芯片,又称图型处理器 - GPU,它在显卡中的作用,就如同CPU在电脑中的作用一样。更直接的比喻就是大脑在人身体里的作用。

  先简要介绍一下常见的生产显示芯片的厂商:Intel、ATI(已被AMD收购,品牌改为AMD)、nVidia、VIA(S3)、SIS、Matrox、3D Labs。
Intel、VIA(S3)、SIS 主要生产集成芯片;

  ATI(AMD)、nVidia 以独立芯片为主,是目前市场上的主流,但由于ATi已经被AMD收购,仍然继续研发独立显示芯片;

  Matrox、3D Labs 则主要面向专业图形市场。由于ATI和nVidia基本占据了主流显卡市场,下面主要将主要针对这两家公司的产品做介绍。


  型号

  ATi公司的主要品牌 Radeon(镭) 系列,其型号由早其的 Radeon Xpress 200 到 Radeon(X300、X550、X600、X700、X800、X850) 到Radeon(X1300、X1600、X1800、X1900、X1950) ,在到{zx1}的HD系列(HD3650/3850/4850/4870等等)。

  nVIDIA公司的主要品牌GeForce 系列,其型号由早其的 GeForce 256、GeForce2(100/200/400)、GeForce3(200/500)、GeForce4,(420/440/460/4000/4200/4400/4600/4800) 到 GeForceFX(5200/5500/5600/5700/5800/5900/5950)、GeForce(6100/6150/6200/6400/6500/6600/6800/)、GeForce(7300/7600/7800/7900/7950)、GeForce 8系列、GeForce 9系列到{zx1}的GTS/GTX 2XXxx系列。


  版本级别

  除了上述标准版本之外,还有些特殊版,特殊版一般会在标准版的型号后面加个后缀,常见的有:

  ATi:
SE (Simplify Edition 简化版) 通常只有64bit内存界面,或者是像素流水线数量减少。
Pro (Professional Edition 专业版) 高频版,一般比标版在管线数量/顶点数量还有频率这些方面都要稍微高一点。
XT (eXTreme xx版) 是ATi系列中xx的,而nVIDIA用作低端型号。
XT PE (eXTreme Premium Edition XT白金版) xx的型号。
XL (eXtreme Limited xx系列中的较低端型号)ATI{zx1}推出的R430中的高频版
XTX (XT eXtreme xx版) X1000系列发布之后的新的命名规则。
CE (Crossfire Edition 交叉火力版) 交叉火力。
VIVO (VIDEO IN and VIDEO OUT) 指显卡同时具备视频输入与视频捕捉两大功能。
HM (Hyper Memory)可以占用内存的显卡


  nVIDIA:

ZT 在XT基础上再次降频以降低价格。
XT 降频版,而在ATi中表示{zg}端。
LE (Lower Edition 低端版) 和XT基本一样,ATi也用过。
MX 平价版,大众类。
GTS/GS 低频版。
GE 比GS稍强点,其实就是超了频的GS。
GT 高频版。比GS高一个档次 因为GT没有缩减管线和顶点单元。
GTO 比GT稍强点,有点汽车中GTO的味道。
Ultra 在GF7系列之前代表着{zg}端,但7系列{zg}端的命名就改为GTX 。
GTX (GT eXtreme)加强版,降频或者缩减流水管道后成为GT,再继续缩水成为GS版本。
GT2 双GPU显卡。
TI (Titanium 钛) 一般就是代表了nVidia的xx版本。
Go 多用语移动平台。
TC (Turbo Cache)可以占用内存的显卡


  开发代号

  所谓开发代号就是显示芯片制造商为了便于显示芯片在设计、生产、销售方面的管理和驱动架构的统一而对一个系列的显示芯片给出的相应的基本的代号。开发代号作用是降低显示芯片制造商的成本、丰富产品线以及实现驱动程序的统一。一般来说,显示芯片制造商可以利用一个基本开发代号再通过控制渲染管线数量、顶点着色单元数量、显存类型、显存位宽、核心和显存频率、所支持的技术特性等方面来衍生出一系列的显示芯片来满足不同的性能、价格、市场等不同的定位,还可以把制造过程中具有部分瑕疵的xx显示芯片产品通过屏蔽管线等方法处理成为xx合格的相应低端的显示芯片产品出售,从而大幅度降低设计和制造的难度和成本,丰富自己的产品线。同一种开发代号的显示芯片可以使用相同的驱动程序,这为显示芯片制造商编写驱动程序以及消费者使用显卡都提供了方便。

  同一种开发代号的显示芯片的渲染架构以及所支持的技术特性是基本上相同的,而且所采用的制程也相同,所以开发代号是判断显卡性能和档次的重要参数。同一类型号的不同版本可以是一个代号,例如:GeForce (X700、X700 Pro、X700 XT) 代号都是RV410;而Radeon(X1900、X1900XT、X1900XTX) 代号都是 R580 等,但也有其他的情况,如:GeForce(7300 LE、7300GS) 代号是 G72 ;而 GeForce (7300 GT、7600 GS、7600 GT) 代号都是G73 等。

  
  制造工艺

  制造工艺指得是在生产GPU过程中,要进行加工各种电路和电子元件,制造导线连接各个元器件。通常其生产的精度以um(微米)来表示,未来有向nm(纳米)发展的趋势(1mm=1000um 1um=1000nm),精度越高,生产工艺越先进。在同样的材料中可以制造更多的电子元件,连接线也越细,提高芯片的集成度,芯片的功耗也越小。

  制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。微电子技术的发展与进步,主要是靠工艺技术的不断改进,使得器件的特征尺寸不断缩小,从而集成度不断提高,功耗降低,器件性能得到提高。芯片制造工艺在1995年以后,从0.5微米、0.35微米、0.25微米、0.18微米、0.15微米、0.13微米,再到目前主流的 90 纳米(0.09纳米) 、65 纳米、45纳米等。


  核心频率

  显卡的核心频率是指显示核心的工作频率,其工作频率在一定程度上可以反映出显示核心的性能,但显卡的性能是由核心频率、显存、像素管线、像素填充率等等多方面的情况所决定的,因此在显示核心不同的情况下,核心频率高并不代表此显卡性能强劲。比如9600PRO的核心频率达到了400MHz,要比9800PRO的380MHz高,但在性能上9800PRO{jd1}要强于9600PRO。在同样级别的芯片中,核心频率高的则性能要强一些,提高核心频率就是显卡超频的方法之一。显示芯片主流的只有ATI和NVIDIA两家,两家都提供显示核心给第三方的厂商,在同样的显示核心下,部分厂商会适当提高其产品的显示核心频率,使其工作在高于显示核心固定的频率上以达到更高的性能。


  2、显存

  类型:目前市场中所采用的显存类型主要有SDRAM,DDR SDRAM,DDR SGRAM三种。

  SDRAM颗粒目前主要应用在低端显卡上,频率一般不超过200MHz,在价格和性能上它比DDR都没有什么优势,因此逐渐被DDR取代。

  DDR SDRAM 是Double Data Rate SDRAM的缩写(双倍数据速率) ,它能提供较高的工作频率,带来优异的数据处理性能。

  DDRSGRAM是显卡厂商特别针对绘图者需求,为了加强图形的存取处理以及绘图控制效率,从同步动态随机存取内存(SDRAM)所改良而得的产品。SGRAM允许以方块(Blocks)为单位个别修改或者存取内存中的资料,它能够与中央处理器(CPU)同步工作,可以减少内存读取次数,增加绘图控制器的效率,尽管它稳定性不错,而且性能表现也很好,但是它的超频性能很差。

  目前市场上的主流是DDR2和DDR3。


  位宽

  显存位宽是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。目前市场上的显存位宽有64位、128位、256位和512位几种,人们习惯上叫的64位显卡、128位显卡和256位显卡就是指其相应的显存位宽。显存位宽越高,性能越好价格也就越高,因此512位宽的显存更多应用于xx显卡,而主流显卡基本都采用128和256位显存。

  显存带宽=显存频率X显存位宽/8,在显存频率相当的情况下,显存位宽将决定显存带宽的大小。例如:同样显存频率为500MHz的128位和256位显存,那么它俩的显存带宽将分别为:128位=500MHz*128∕8=8GB/s,而256位=500MHz*256∕8=16GB/s,是128位的2倍,可见显存位宽在显存数据中的重要性。显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成。显存位宽=显存颗粒位宽×显存颗粒数。显存颗粒上都带有相关厂家的内存编号,可以去网上查找其编号,就能了解其位宽,再乘以显存颗粒数,就能得到显卡的位宽。


  容量

  这个就比较好理解了,容量越大,存的东西就越多,当然也就越好。
   目前主流的显存容量,64MB、128MB、256MB、512MB等。


  封装类型

  显存封装形式主要有:

TSOP (Thin Small Out-Line Package) 薄型小尺寸封装
QFP (Quad Flat Package) 小型方块平面封装
MicroBGA (Micro Ball Grid Array) 微型球闸阵列封装,又称FBGA(Fine-pitch Ball Grid Array)

  目前的主流显卡基本上是用TSOP和MBGA封装,其中又以TSOP封装居多.


  速度

  显存速度一般以ns(纳秒)为单位。常见的显存速度有7ns、6ns、5.5ns、5ns、4ns,3.6ns、2.8ns、2.2ns、1.1ns等,越小表示速度越快\越好。

  显存的理论工作频率计算公式是:额定工作频率(MHz)=1000/显存速度×n得到(n因显存类型不同而不同,如果是SDRAM显存,则n=1;DDR显存则n=2;DDRII显存则n=4)。


  频率

  显存频率一定程度上反应着该显存的速度,以MHz(兆赫兹)为单位。

  显存频率随着显存的类型、性能的不同而不同:
  SDRAM显存一般都工作在较低的频率上,一般就是133MHz和166MHz,此种频率早已无法满足现在显卡的需求。
DDRSDRAM显存则能提供较高的显存频率,因此是目前采用最为广泛的显存类型,目前无论中、低端显卡,还是xx显卡大部分都采用DDRSDRAM,其所能提供的显存频率也差异很大,主要有400MHz、500MHz、600MHz、650MHz等,xx产品中还有800MHz或900MHz,乃至更高。

  显存频率与显存时钟周期是相关的,二者成倒数关系,也就是显存频率=1/显存时钟周期。如果是SDRAM显存,其时钟周期为6ns,那么它的显存频率就为1/6ns=166 MHz;而对于DDRSDRAM,其时钟周期为6ns,那么它的显存频率就为1/6ns=166MHz,但要了解的是这是DDRSDRAM的实际频率,而不是我们平时所说的DDR显存频率。因为DDR在时钟上升期和下降期都进行数据传输,其一个周期传输两次数据,相当于SDRAM频率的二倍。习惯上称呼的DDR频率是其等效频率,是在其实际工作频率上乘以2,就得到了等效频率。因此6ns的DDR显存,其显存频率为1/6ns*2=333MHz。但要明白的是显卡制造时,厂商设定了显存实际工作频率,而实际工作频率不一定等于显存{zd0}频率。此类情况现在较为常见,如显存{zd0}能工作在650MHz,而制造时显卡工作频率被设定为550 MHz,此时显存就存在一定的超频空间。这也就是目前厂商惯用的方法,显卡以超频为卖点。


  3、技术

  象素渲染管线

  渲染管线也称为渲染流水线,是显示芯片内部处理图形信号相互独立的的并行处理单元。

   在某种程度上可以把渲染管线比喻为工厂里面常见的各种生产流水线,工厂里的生产流水线是为了提高产品的生产能力和效率,而渲染管线则是提高显卡的工作能力和效率。 渲染管线的数量一般是以 像素渲染流水线的数量×每管线的纹理单元数量来表示。例如,GeForce6800Ultra的渲染管线是16×1,就表示其具有16条像素渲染流水线,每管线具有1个纹理单元;GeForce4MX440的渲染管线是2×2,就表示其具有2条像素渲染流水线,每管线具有2个纹理单元等等,其余表示方式以此类推。渲染管线的数量是决定显示芯片性能和档次的最重要的参数之一,在相同的显卡核心频率下,更多的渲染管线也就意味着更大的像素填充率和纹理填充率,从显卡的渲染管线数量上可以大致判断出显卡的性能高低档次。但显卡性能并不仅仅只是取决于渲染管线的数量,同时还取决于显示核心架构、渲染管线的的执行效率、顶点着色单元的数量以及显卡的核心频率和显存频率等等方面。

  一般来说在相同的显示核心架构下,渲染管线越多也就意味着性能越高,例如16×1架构的GeForce6800GT其性能要强于12×1架构的GeForce6800,就象工厂里的采用相同技术的2条生产流水线的生产能力和效率要强于1条生产流水线那样;而在不同的显示核心架构下,渲染管线的数量多就并不意味着性能更好,例如4×2架构的GeForce2GTS其性能就不如2×2架构的GeForce4MX440,就象工厂里的采用了先进技术的1条流水线的生产能力和效率反而还要强于只采用了老技术的2条生产流水线那样。


  顶点着色引擎数

  顶点着色引擎(Vertex Shader),也称为顶点遮蔽器,根据官方规格,顶点着色引擎是一种增加各式{tx}在3D场影中的处理单元,顶点着色引擎

  的可程式化特性允许开发者靠加载新的软件指令来调整各式的{tx},每一个顶点将被各种的数据变素清楚地定义,至少包括每一顶点的x、y、z坐标,每一点顶点可能包函的数据有颜色、最初的径路、材质、光线特征等。顶点着色引擎数越多速度越快。


  3D API

  API是Application Programming Interface的缩写,是应用程序接口的意思,而3D API则是指显卡与应用程序直接的接口。

  3DAPI能让编程人员所设计的3D软件只要调用其API内的程序,从而让API自动和硬件的驱动程序沟通,启动3D芯片内强大的3D图形处理功能,从而大幅度地提高了3D程序的设计效率。如果没有3DAPI在开发程序时,程序员必须要了解全部的显卡特性,才能编写出与显卡xx匹配的程序,发挥出全部的显卡性能。而有了3DAPI这个显卡与软件直接的接口,程序员只需要编写符合接口的程序代码,就可以充分发挥显卡的不必再去了解硬件的具体性能和参数,这样就大大简化了程序开发的效率。同样,显示芯片厂商根据标准来设计自己的硬件产品,以达到在API调用硬件资源时{zy}化,获得更好的性能。有了3DAPI,便可实现不同厂家的硬件、软件{zd0}范围兼容。比如在最能体现3DAPI的游戏方面,游戏设计人员设计时,不必去考虑具体某款显卡的特性,而只是按照3D API的接口标准来开发游戏,当游戏运行时则直接通过3DAPI来调用显卡的硬件资源。

  目前个人电脑中主要应用的3D API有:DirectX和OpenGL。

  RAMDAC频率和支持{zd0}分辨率

  RAMDAC是Random Access Memory Digital/Analog Convertor的缩写,即随机存取内存数字~模拟转换器。

  RAMDAC作用是将显存中的数字信号转换为显示器能够显示出来的模拟信号,其转换速率以MHz表示。计算机中处理数据的过程其实就是将事物数字化的过程,所有的事物将被处理成0和1两个数,而后不断进行累加计算。图形加速卡也是靠这些0和1对每一个象素进行颜色、深度、亮度等各种处理。显卡生成的都是信号都是以数字来表示的,但是所有的CRT显示器都是以模拟方式进行工作的,数字信号无法被识别,这就必须有相应的设备将数字信号转换为模拟信号。而RAMDAC就是显卡中将数字信号转换为模拟信号的设备。RAMDAC的转换速率以MHz表示,它决定了刷新频率的高低(与显示器的“带宽”意义近似)。其工作速度越高,频带越宽,高分辨率时的画面质量越好.该数值决定了在足够的显存下,显卡{zg}支持的分辨率和刷新率。如果要在1024×768的分辨率下达到85Hz的分辨率,RAMDAC的速率至少是1024×768×85×1.344(折算系数)÷106≈90MHz。目前主流的显卡RAMDAC都能达到350MHz和400MHz,已足以满足和超过目前大多数显示器所能提供的分辨率和刷新率。


  4、PCB板

  PCB是Printed Circuit Block的缩写,也称为印制电路板。就是显卡的躯体(绿色的板子),显卡一切元器件都是放在PCB板上的,因此PCB板的好坏,直接决定着显卡电气性能的好坏和稳定。


  层数

  目前的PCB板一般都是采用4层、6层、或8层,理论上来说层数多的比少的好,但前提是在设计合理的基础上。

  PCB的各个层一般可分为信号层(Signal),电源层(Power)或是地线层(Ground)。每一层PCB版上的电路是相互独立的。在4层PCB的主板中,信号层一般分布在PCB的最上面一层和最下面一层,而中间两层则是电源与地线层。相对来说6层PCB就复杂了,其信号层一般分布在1、3、5层,而电源层则有2层。至于判断PCB的优劣,主要是观察其印刷电路部分是否清晰明了,PCB是否平整无变形等等。


  显卡接口

  常见的有PCI、AGP 2X/4X/8X (目前已经淘汰),{zx1}的是PCI-Express X16接口,是目前的主流。


  输出接口

  现在最常见的输出接口主要有:

VGA (Video Graphics Array) 视频图形阵列接口,作用是将转换好的模拟信号输出到CRT或者LCD显示器中
DVI (Digital Visual Interface) 数字视频接口接口,视频信号无需转换,信号无衰减或失真,未来VGA接口的替代者。
S-Video (Separate Video) S端子,也叫二分量视频接口,一般采用五线接头,它是用来将亮度和色度分离输出的设备,主要功能是为了克服视频节目复合输出时的亮度跟色度的互相干扰。


  散热装置

  散热装置的好坏也能影响到显卡的运行稳定性,常见的散热装置有:

被动散热:既只安装了铝合金或铜等金属的散热片。
风冷散热:在散热片上加装了风扇,目前多数采用这种方法。
水冷散热:通过热管液体把GPU和水泵相连,一般在xx{dj0}显卡中采用。


  颜色

  很多人认为红色显卡的比绿色的好、绿色的比黄色的好,显卡的好坏和其颜色并没有什么关系,有的厂家喜用红色,有的喜用绿色,这是xx由生产商决定的。一些xx大厂,那是早就形成了一定的风格的。因此,其PCB的颜色一般也不会有太大的变动。


  5、品牌

  目前显卡业的竞争也是日趋激烈。各类品牌名目繁多,以下是我自认为一些比较不错的牌子,仅供参考请不要太迷信了:

  蓝宝石(SAPPHIRE) 、华硕(ASUS)、鸿海(Foxconn)、撼迅/迪兰恒进(PowerColor/Dataland)、丽台(Leadtek)、讯景(XFX)、映众(Inno3D)……

  微星(MSI)、艾尔莎(ELSA)、富彩(FORSA)、同德(Palit)、捷波(Jetway)、升技(Abit)、磐正(EPOX) 、映泰(Biostar) 、耕昇(Gainward)、旌宇(SPARKLE)、影驰(GALAXY)、天扬(GRANDMARS) 、超卓天彩(SuperGrece)、铭瑄(MAXSUN)、翔升(ASL)、盈通(YESTON) ……

  1、像素:pixels

  从技术角度,像素指“图像元素”,指显示器中图形信息的一个小点?D即代表一种单色(大多是红、绿、蓝色的数值)。如果屏幕分辨率是1024x768,那么在即是指屏幕会显示宽度1024个像素乘以高度768个像素的画面,当所有像素同时显示时,就会在屏幕上看到显示。根据显示器类型不同及显卡生成的数据量与输出量不同,图像呈现的檗速度约在每秒60至120次不等;CRT显示器以线为单位呈现影像,而LCD显示器则是每个像素个别更新。

  2、顶点:Vertics

  所有3D场景的对象都是由顶点形成。一个顶点是X、Y、Z坐标形成的3D空间中的一点,多个顶点组合在一起(至少四个)可形成一个多边形,如三角形、立方体或更复杂的形状,将材质贴在其上可使该组件(或几个排好的组件)看起来更真实。上图的3D立方体就是由八个顶点所形成,使用大量顶点,可形成弧线形对象等较复杂的图像

  3、材质:Texture

  材质从严格意义上讲只是2D影像,其大小可根据场景不同而不同,材质贴在3D对象上以仿真表面。例如,上图的3D立方体由八个顶点组合而成,看起来只是一个很平凡的箱子,但贴上材质后可改变外观,一旦将材质贴到3D对象上,该对象看起来就像是绘过该材质一样。

  4、着色器:Shader

  目前有两种着色器:顶点着色器与像素着色器。其中,顶点着色器能将3D部件做变形或转换处理;像素处理单元可根据复杂的输入资料改变像素颜色,如3D场景中的光源;当点亮对象时,某些颜色显得更亮,但其它对象因像素颜色的讯息改变,会产生阴影。在大多数游戏中经常使用像素着色器来构建华丽的视觉效果,例如,让一把3D的剑周围的像素光彩夺目,不同的着色器会影响一个复杂3D对象的所有顶点,让对象看起来栩栩如生。如今,游戏开发者越来越倚重复杂的着色器处理程序以及逻辑单元,以便创造更真实的图像,图像最丰富的游戏往往使用大量的着色器。DirectX10是第三代着色器,称为几何着色器,可根据想呈现的效果,可分割、修饰、甚至摧毁对象。这三类着色器类型在编程中的应用方法类似,但目的大不相同。

  5、填充率:FillRate

  在显卡的包装上常常可以看到名为填充率(FillRate)的指标。所谓填充率,通常是指图形处理器处理像素的速度。

  一般而言,显卡的填充率可分为两种:像素填充率与材质填充率。其中,像素填充率是显卡输出的像素总数,其值乘以GPU频率后,即为光栅运作(ROP:RasterOperations)的速度。

  ATI与Nvidia在计算材质填充率时的方式并不相同。Nvidia将像素管线的数字乘上频率速度,得到材质填充率;而ATI则是将材质单元的数字乘上频率速度。两者计算方式都有一定道理,因为Nvidia每个像素着色器有一个材质单元,或是每一个像素管线有一个材质单元。

  6、顶点着色单元:VertexShaderUnits

  如像素着色单元一样,顶点着色单元是GPU中处理影响顶点的着色器。一般来说,顶点越多,3D对象便越复杂,而3D场景包含了较多或是更复杂的3D对象,因此顶点着色单元对最终的图形效果非常重要。不过,和像素着色单元比起来,顶点着色器对整体呈现效果的影响要小一些。

  7、像素着色单元:PixelShaderUnits

  像素着色单元是GPU芯片中专门处理像素着色程序的组件,这些处理单元仅执行像素运算,由于像素代表色值,因此像素着色单元是用来处理绘图影像的各种视觉{tx}。举例来说,游戏中最出色的水波{tx}便是由像素着色单元所完成。GPU中的像素着色单元数目,通常用来比较不同显卡的像素处理效能。一般来说,如果拿8像素着色单元和16着色单元作比较,可以想象16着色单元的显卡在处理复杂的像素着色器{tx}时,速度比较快。当然,GPU的时针频率亦会对此有所影响,但从性能方面考虑,把GPU的时针频率速度提高一倍的效果远不如将着色单元的数目提升一倍更佳。

  以ATIRadeonX800XL与X800GTO这两款显卡为例,它们具有同样的核心频率与256位的显存位宽,但RadeonX800XL有16个像素着色单元,而X800GTO虽然也使用同样的处理器,但是只可使用其中的12个单元。由下图可以明显看出着色单元的数量对显卡性能的影响。

  8、通用着色器:UnifiedShaders

  通用着色器在个人计算机市场上还不普及,不过{zx1}上市的DirectX10规格已开始用通用着色器的架构。这代表顶点几何与像素着色器代码结构的功能相似,但都有专属的滚动条。Xbox360的新规格是由ATI为微软(Microsoft)开发,新一代DirectX10展现的潜在需求将创造新的话题。

  9、材质贴图单元(TMU:TextureMappingUnits)

  材质需要被寻址或是过滤,这项工作由TMU结合像素着色单元、顶点着色单元共同完成,由TMU将材质贴到像素上。

  在比较两款不同显卡的材质处理性能时,需要看GPU的材质单元数量;一般来说,具有较多TMU的显卡,材质信息的处理速度较快。

  10、光栅处理单元(ROP:RasterOperatorUnits)

  光栅处理单元负责将像素数据写入显存,一般以填充率来描述。ROP和填充率在3D显卡早期是衡量显卡性能的重要参数。如今,虽然ROP的工作仍然非常重要,但随着显卡性能的迅速提高,它已经不再是性能的瓶颈,因此,它已不再作为测量性能的技术指标。

  11、管线:Pipelines

  管线是描述显卡架构的名词,以更准确地衡量GPU实际运算能力。管线并不是一般熟悉的工程专有名词,在GPU上有不同的管线,可在任何时间各自提供不同功能。

  传统上,它通常用来指专用TMU上的附加像素着色单元。举例来说,ATIRadeon9700显卡有8个像素处理器,其中每个像素着色单元与一个TMU相对应,因此,多将其称为8管线的显卡。如今,随着图形处理器架构的演变,管线这个术语在很多时候已不能真实地反映显卡的真实性能。ATI的X1000系列显卡,是首先采用新的架构的显卡,其通过优化底层结构来实现GPU性能的提升。基于在图像处理中,某些处理单元比其它单元更常用,为了增加处理器的整体性能,ATI尝试在不增加晶体管数量的前提下,找到{zj0}性能所需的处理单元数量。在此架构下,像素管线失去了传统的意义,因为像素着色单元不再依附TMU,举例来说,ATIRadeonX1600显卡有12个像素着色器单元,但只有4个TMU,因此不能说它是12管线的架构,但也不能说它是4管线架构,虽然大家常使用这两种说法。因此,现在GPU上的管线数目仅在比较两个不同的卡片(除了ATI’sX1x00系列之外)时才有实际意义,如在比较24管线和16管线的显卡时,才可以认为24管线的显卡性能更更佳。

  12、制程:ManufacturingProcess

  制程这个名词是指在制作集成电路的制造过程中的结构大小和精密度,结构越小,制程越先进。例如与0.13微米制程相比,0.18微米制程所生产的处理器体积大、效率低,这是因为较小的晶体管,工作时所需的电量通常较低,发热量也相对较低。较小制程也代表工作单元间的距离比较短,数据传输所需的时间也较短;较小制程有距离短、耗电低及其它优点,因此频率频率速度较高。

  说得复杂一点,“微米”和“奈米”这两个名词都是用来形容制程大小。1奈米等于0.001微米,“0.09微米制程”也就是“90奈米制程”。如上所述,较小制程通常与较高频率速度有关。例如,当我们拿0.18微米制程处理器的GPU与0.09微米(90奈米)制程的GPU相比时,一般0.09制程的GPU会有较高的频率。

  13、核心频率、ClockSpeed

  GPU的核心频率以兆赫(MHz)为单位,该单位代表“每秒百万周期”。一般来说,核心频率越高,GPU的速度越快,每秒工作量越多。比如说,拿NvidiaGeForce6600与6600GT的比较:6600GT的核心频率是500MHz,但一般6600系列的核心是400MHz,因为尽管GPU核心相同,但6600GT额外20%的频率提升将给显卡性能带来明显的变化。不过,核心频率并非这么{jd1},毕竟GPU架构对真实性能也有相当大的影响。以GeForce6600GT与GeForce6800GT为例,6600GT的核心频率为500MHz,而6800GT的核心频率只有350MHz,但因6800GT是16管线的架构,而6600GT是8管线的架构,从这个意义来说,16管线、速度为350MHz的6800GT的性能,大约和8管线、两倍速度(即700MHz)的6600GT相当。?D?D当然,这是一种简化的比较方法。

  14、显存大小

  显存大小可能是影响显卡性能的因素中最被高估的方面。大多数消费者常常会把卡片上RAM的大小拿来作为区分显卡档次的依据,但实际上与其它因素相比,如时针频率及内存接口,显存的大小对显卡整体性能的影响并不大。一般来说,在大部分的情况下,128MB显存的显卡与256MB显存的显卡性能大致相当。虽然在某些具体应用中,显存大小与性能间可能存在一定的对应关系,但在大多数情况下,增加显存并不会自动提升效能。如果要提高材质的分辨率,增加显存倒是个有效的办法。如今,游戏开发商经常使用多重材质集来开发游戏,如果显存足够大,那么材质的分辨率就越高,高分辨率的材质可以为游戏画面提供更清晰的材质。

  15.显存位宽

  显存位宽是影响显存性能的最重要的因素。目前主流的显卡,其显存位宽大约在64~256位之间,xx显卡大多可至512位。

  从理论上讲,随着总线位宽的增加,每周期所传输的数据资料量便就大,显卡的性能便会得到明显的提升。例如,比较频率相同但位宽不同的显卡,可以明显看出,128位总线传输的数据是64位总线的两倍,而256位总线则传输四倍的数据。

  显存的位宽越高(即每秒通讯量),意味着显存的性能便越高,这也是为什么显存总线位宽比显存大小重要的原因。因为在同样的频率下,64位总线的内存实际的传输速度仅为256位总线的25%而已!将显存位宽与显存大小结合起来考虑,一般认为,使用256位128MB显存的显卡,其性能往往高于使用64位512MB显存的显卡。

  16、显存类型

  从概念上说,显卡中使用的显存是内存的子集。一般而言,内存分为两种:SDR(单数据速率)和DDR(双数据速率),后者每频率周期会转换数据两次。早在显卡刚面市时,SDR就被淘汰了,由于DDR的工作效率是SDR的两倍,因此要注意的是,所有的DDR内存,经常在广告上将实际频率速度提高为两倍。例如,DDR常被当作“1000MHzDDR”内存(意即有1000MHz的表现),可是实际的频率速度却是500MHz。因此,许多人看到1200MHzDDR显卡被报导指出只有600MHz的传输速度时,都大感惊讶,但这还不是该小心的地方,因为这只是DDR被报导的频率速度。DDR2和GDDR3内存的运作原则上相同,都是双倍的频率速度,DDR、DDR2和GDDR3的区别只有在制造技术上,一般来说,DDR2比DDR的速度还快,而DDR3比DDR2的频率速度更快。

  17、显存频率

  与图形处理器GPU一样,显存工作在一定频率速度下,以兆赫(MHz)来测量,同样地,提高显存频率能够明显地提高显存性能。从这个角度,显存频率速度的数字,是几个能够用来比较显存效能的数字之一。例如,假设其它因素(如内存总线宽度)都相同,比较500MHz显存频率和700MHz显存频率的显卡时,可合理推论,通常显存频率为700MHz的显卡会有较佳的性能。但是,必须明确,显存频率并非决定显卡性能或者显卡中显存性能的{wy}指标。64位总线、700MHz显存的显卡,比128位总线、400MHz显存的显卡还要慢。128位总线400MHz的频率速度,大约与64位总线800MHz的速度相同。此外,必须注意的是,GPU的核心频率与显存频率是两个xx不同的概念。

  18、显卡接口

  显卡和计算机其它组件之间的所有数据传输,均通过显卡槽或接口,目前使用的显卡接口有三种:PCI、AGP以及PCIExpress。不同的显卡接口数据带宽不同,带宽越高,相应的显卡性能便越佳。很多时候,显卡与主板、CPU等其他组件通讯的带宽往往是制约显卡性能的瓶颈。

  最慢的显卡总线,非古老的PCI总线(PeripheralComponentsInterconnect)莫属;而图形加速端口(AGP,AcceleratedGraphicsPort)的表现较好了许多,但AGP1.0和AGP2x规格,其数据带宽仍嫌过低,限制显卡效能的提高,不过,一旦使用AGP4x,即可达到当前显卡要求的实际{zg}带宽;AGP8x规格的带宽是AGP4x规格的两倍(2.16GB/s),但这两种标准之间的表现有些微差别。

  {zx1}、{zg}频宽的接口是PCIExpressbus,新的显卡通常使用PCIExpressx16的规格,来结合16个分离的PCIExpresslinks,可达到4GB/s的带宽,从理论上讲,这是AGP8x接口带宽的两倍。PCIExpress可使用此带宽上传数据至计算机,或下载数据至显卡上。不过,AGP8x规格的性能优越,至今还未看见有哪个PCIExpress显卡能表现得比AGP8x好上太多(假设其它硬件与参数相同)

  19、HDRLighting:高动态光照渲染

  HDR是“高动态范围(HighDynamicRange.)”的缩写,支持HDR光照渲染技术的游戏,要比不支持HDR的游戏更能展现真实的画面,但并非所有的显卡都能展现HDR的图形。

  在与DirectX9兼容的图形处理器出现前,谈到显卡运算的光照渲染准确范围,显卡的限制一直都很大,那时所有光照渲染都必须以8位(或256)整数阶层来运算。这一情况直到xx支持DirectX9等级的图形处理器面世后才得到改善,如今,显卡有能力在全24位或是16.7百万色下,显示高范围的光照渲染准确性。

  在16.7百万色彩下,并且DirectX9/ShaderModel2.0兼容的显卡运算能力也得到满足的前提下,PC游戏的HDR光照渲染才有可能实现。HDR光照渲染是个复杂的概念,要看到实际操作才能领会,可以简单地解释为HDR光照渲染的对比增加(阴影更深,亮光更亮),同时在阴影和光亮区均能够很好地展现图形细节,而使得画面更为逼真。

  支持{zx1}的PixelShader3.0规格的图形处理器,拥有更高的光照渲染准确度(32位),并且可使用浮点精度的混色,这代表所有SM3.0的绘图卡都能支持特殊的HDR技术,称“OpenEXR”,这是为电影工业所开发的规格。

  {zh1},应该要注意所有类型的HDR需要硬件具有较高的运算能力,如果不是最强大的图形处理器或CPU,系统速度会被拖得很慢。因此,如果您想要体验{zx1}的HDR游戏,一定要配备高效能的硬件。

  20、抗锯齿:Anti-Aliasing

  锯齿(Aliasing)是一个描述图形呈现时呈现的锯齿状或是块状边角的术语,指屏幕图形中出现的阶梯般的角边;抗锯齿(AA:Anti-aliasing)则可以有效地应对这种现象。不过,由于抗锯齿的运算使用大量的运算资源,因此会导致帧速度下降。

  同时,抗锯齿技术也受显卡显存性能的制约,一般而言,与低端显卡相比,配备高性能显存的显卡在执行抗锯齿功能时,效果要好得多。

  21、高清晰材质库

  所有3D游戏都依据目标规格开发,其中一个规格就是游戏所需要的材质内存容量。游戏进行时,所有必备材质都必须能存于显存,否则性能就会受到严重影响,额外需要的材质则被储存在较慢的RAM系统或硬盘里。因此,如果游戏开发公司以128MB显存作为游戏的{zd1}需求,那么支持它的材质就称为“材质库”,不论何时,都不会对显卡要求超过128MB的内存容量。

  22、材质过滤

  所有游戏中的3D对象都经过材质处理,随着材质呈现的视角增加,游戏中的材质会越来越模糊且变形,为了解决这个问题,图形处理器开始使用材质过滤。最早的材质过滤被称为双线性的,会呈现非常明显的过滤条纹,画面变得很不好看,一直到了三线性的材质过滤在双线性技术上做了一些改善,才解决了这个问题;这两种过滤方式,对如今的显卡而言,实现均没有问题。

  现在{zh0}的过滤方式是各向异性过滤(AF:anisotropicfiltering),和抗锯齿一样,各向异性过滤有不同的等级。例如,八倍的AF(8xAF)比四倍AF(4xAF)产生更佳的过滤质量。同时,各向异性过滤和抗锯齿一样,要求硬件的运算能力更强,且随着AF的级别上升对系统的压力更大。



郑重声明:资讯 【一日一记7-----电脑补课讲堂(一)_lintongfang_百度空间】由 发布,版权归原作者及其所在单位,其原创性以及文中陈述文字和内容未经(企业库qiyeku.com)证实,请读者仅作参考,并请自行核实相关内容。若本文有侵犯到您的版权, 请你提供相关证明及申请并与我们联系(qiyeku # qq.com)或【在线投诉】,我们审核后将会尽快处理。
—— 相关资讯 ——