联系我们

4000 555 018
(7×24)
正睿服务器  >  新闻中心  >  评测室
新闻中心

Quadro大战FirePro 八款专业图形卡横评

间隙填充
正睿科技  发布时间:2009-08-29 10:23:38  浏览数:28930
虽然现在的专业显卡和我们通常使用的普通显卡看起来差不多,不过由于面向的领域不同,因此它们也具有着很多不同点:最显眼的就是价钱了。所谓的专业卡,专业首先是因为其面向的应用专业。专业显卡所针对的领域就是诸如3D建模程序和计算机辅助设计系统这样的3D专业应用,不同于我们平时的3D游戏,这些程序需要以不同的方式调动显卡的运算资源。
数字内容创作:电影级别的三维图像
 

常见的通用三维建模软件:3ds MAX
 
  现在的专业卡市场,其显示核心基本上和桌面显卡采用的核心一样,如Quadro和GeForce就会采用同样的核心,但在硬件上还是有区别的。专业图形和游戏的应用很多地方不一样。在做专业设计的时候,可能会用到很多模式,比如线框模式、带线框渲染模式,这些模式在游戏里是不会用到的。游戏里只需要把渲染好的纹理等显示就可以了,专业卡则不一样。通常而言,桌面显卡更倾向于较小的模型、较少的多边形数量,以及大量的纹理,而专业显卡则需要面对大或者超大的模型、大量的多边形数量以及高精度的复杂纹理。

  粗略而言,一般三维设计可以包括建模、打光、贴图、材质和最终渲染这几步,大致上和现在显卡的结构:T&L加纹理单元一一对应,可以说,除了在前面说过的侧重点不同之外,专业卡和桌面卡都是为了将这些步骤进行硬件加速。最不相同的地方是最后一个阶段:渲染。专业三维设计的目的是为了“生产”三维图像,而游戏则是为了生成用户看到的三维游戏图像,为了达到电影级别的三维效果,通常专业三维设计的最终渲染都是由CPU来完成,而桌面显卡则使用的是由GPU生成的效果,因此人们常常会看到游戏画面远不如电影看到的效果那么逼真,尽管显示尺寸都一样。


WoW地球版本的片头:场景模型

WoW地球版本的片头:场景的最终渲染效果

游戏效果
 
  为了真实,电影的三维图像都采用了极大量的多边形(几亿个多边形并不少见)和极高精度的纹理,以及光照、阴影,因此会获得很好的效果,最终这些图像最终只是以视频的方式播放出来;而在游戏中,为了得到实时的效果,只能采用较少的多边形(几万个),其他也相应有所降低,因此效果自然大是不如。
 
  台上一分钟,台下十年功,为了得到逼真的效果,在银幕上看到的流畅画面背后都是复杂的生产过程,生产这些三维图像就是我们谈及的专业显卡的应用之一,这些应用属于DCC(Digital Content Creation,数字内容创作)应用。通常的显卡无法胜任这些应用,在生产环境,你需要专业图形卡。
 

还是3ds MAX,左下为预览窗口
 
  由于专业应用的渲染通常由CPU来完成,因此专业卡并不会减少渲染时间,事实上,到近段时间为止一般的专业图形卡最大的作用仍然只是加快DCC软件的创作速度,它们都着重于加速三维设计软件包括如3ds Max、Maya、Softimage XSI等软件在建模、贴图、光照时候的工作区(Viewport)的预览速度。在面对复杂的场景时,普通的游戏卡往往旋转一点角度、画一条直线都需要系统耗费大量时间来重新绘制预览工作区,这样整个创作过程就会变得极端低效(想象一下,碰一下鼠标机器就要等一段时间才能响应)。专业图形卡在进行这些操作时能以实时的速度提供预览,从而提升了创作效率。  

  除了提高创作效率之外,专业图形卡还必须对各种专用API、创作软件提供良好的支持,以及确保工作的稳定性。一般的图形卡则侧重于为游戏提供对应的兼容性。

  由于通常情况下渲染结果其实由CPU生成,因此专业图形卡对三维设计的最终渲染表现不是十分明显,不过这个问题也不是一成不变,在前些年,还几乎没有对最终渲染进行硬件加速,因为当时的专业图形卡的可编程能力非常弱,渲染出来的结果往往和预计有着明显的差异??因此只能用于预览窗口的加速。而近些年来GPU可编程能力不断提升,如Direct3D和OpenGL这些的API也不断增强相关功能,GPU的渲染效果也开始能和CPU软件渲染相媲美了,而GPU渲染的速度则是CPU渲染的数十数百倍。


GPU Ray Tracer 1.1.0:GPU渲染;GPU Ray Tracer是使用HLSL语言写的Direct3D Ray Trace软件(近来也支持GLSL)
 
  使用GPU加速各种应用还是近年的事情,如HLSL(DirectX9开始集成)/GLSL(从OpenGL 1.5开始集成)这样的API提供了将GPU能力用来加速三维设计最终渲染的一个途径。
 

GPU Ray Tracer 1.1.0:CPU渲染,效果更好,耗时也长
 

Radiosity @ 3ds MAX

  Ray Trace光线追踪是渲染中常用到的一种方法,经常一起出现的还有Radiosity(辐射渲染)算法,它们都是为了得到逼真的Global Illumination(全局照明)渲染效果(在游戏里面就不用想得到这些效果了),Ray Trace算法和Radiosity算法包含大量的有限元分析计算和迭代,传统的GPU对此毫无办法,只有最新的专业图形芯片才开始对其提供硬件支持:

GPU厂商们显然不会满意专业图形卡不能加速最后渲染效果这一情况:NV在第十代Quadro上推出的GPU Interactive Ray Tracing

  NViRT(NVIDIA Interactive Ray Tracing,NVIDIA交互光线追踪)比起使用HLSL/GLSL更进一步:它通过CUDA来实现三维渲染硬件加速??效果更接近于CPU渲染,与目前为止的3D硬件渲染都不同。NVIDIA iRT可以解决渲染当中光栅化模式下的一些问题,比如说不规则曲面的实时反射的效果、特殊材质的光线折射的效果,另外还有诸如非直接照明等方面也是iRT技术的强项。如果使用传统的光栅化的方式,有些效果很难实现,或者需要花费非常多的资源才能实现。NVIDIA iRT是业界第一个真正可以投入实用的交互式的Ray Tracing技术,它可以容易的内置到各种应用中。

  也许不久的将来,买到的专业卡将可以真正地加速三维创作的全系列工作??从三维建模一直到图像渲染(当然,时下也有一种方向是全部回归到软件??全部都靠CPU来执行)。


GPU渲染加速可能是CUDA目前最有前途的应用之一,其他领域上和CPU的争论仍在继续

  CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。它是一个完整的GPGPU解决方案,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。在架构上采用了一种全新的计算体系结构来使用GPU提供的硬件资源,从而给大规模的数据计算应用提供了一种比CPU更加强大的计算能力。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。

  通过使用CUDA,图形工作站将可以充分地应用到Quadro显卡的强大计算能力。ATI也推出了一样性质的Stream Computing流计算技术。

  专业卡因为面向的应用专业为名。事实上,并不是只有DCC数字内容创作才是专业应用??很多特别的应用都算专业的应用,这些应用你在普通的桌面游戏卡上无法实现,你只能寻求专业图形卡:


更精确的颜色:10-bit颜色通道

  普通显卡使用的颜色通道都为8-bit,而现在的专业卡都可以达到10-bit,每RGB通道达到10-bit有什么好处呢?下图表示了不同位深的效果:1 bit、2 bit、4 bit以及8 bit图像的灰度级别,随着位深的增加,色彩梯度更加平滑,色阈也更加宽广。高位深表示在一个色阈中更多的采样数值,8 bit提供256个采样点,而10 bit提供1024个采样点,其色彩精度是8 bit 的4 倍。

  按照RGB三原色计算,10 bit单色彩通道相加为30 bit色彩,或者说10亿色。


高精度:SDI接口

  SDI(Serial Digital Interface,串行数字接口)是一种被广泛应用在专业视频编辑广播领域的接口。该接口的速度为270Mb/s,能够传输10bit精度,未经任何压缩的数字视频信号。是传输质量最高的数字视频接口之一。常用于连接非线性视频编辑系统和线性视频编辑系统,也有用SDI接口进行直接视频输出和录像。随着高清晰电视的来临,SDI接口也发展出了HD-SDI格式。NV的第十代Quadro在FX3800及其以上的型号中提供了HD SDI的支持。


更多的显示器:Quadro NVS 450可以提供4个DisplayPort接口
 

更多更大的显示:NV SLI Mosaic Mode
 
  SLI Mosaic Mode模式可直观运用多颗Quadro Plex GPU(图形处理器)支持多台显示设备。使用四个输出接口,将显示面积平铺放大??告别仅拥有一页窗口显示的时代。SLI Mosaic模式可支持多颗GPU(单颗为Quadro Plex GPU)在操作系统下的显示,该显示模式与单颗逻辑Quadro GPU的显示模式相同。
 
 

G-Sync:Frame lock和Genlock

  Genlock(Generator Lock)其实就是提供该显卡刷新率信号的端口。在多个显卡/系统连接进行共同输出时(如视频墙、超高清晰度卫星地图显示)多个系统会因为行刷新率的不同导致画面出现闪烁或者条纹。GenLock接口则能够将显卡的内部刷新率型号告知其他系统的显卡,在共同进行连续视频输出时保持行刷新同步,避免这些情况的发生。

  在进行集群渲染和可视化模拟时,每个显示系统所分到的任务量并不是一致的,复杂度的不同渲染时间自然也就不同,他们在进行共同输出时就会导致最终画面错误或者破碎。所以我们需要通过FrameLock接口来传输数据缓存同步信号和行刷新信号,以保证整个集群中所有系统最终显示速率的一致和渲染结果的正确。

  专业卡市场目前主要有两个芯片厂商的产品:被AMD收购的ATI以及NVIDIA。其中ATI的专业卡以FirePro为名,其图形卡产品都以红色作为PCB颜色。而NVIDIA则是用Quadro的名称。目前,ATI和NVIDIA都提供了图形处理器通用计算技术,也能部分地提供GPU渲染加速功能。

  最先出场的是ATI FirePro V5700,面向中端市场。FirePro V5700基于RV730图形核心,具备320个Shader处理单元,显存为512MB,支持DirectX 10.1、Shader Model 4.1、OpenGL 2.1、PCI-E 2.0、每RGB色彩通道8/10/16-bit HDR渲染、全30-bit显示管线、GPU通用计算、多屏显示等一系列特性和技术。

中端争霸 FirePro V5700对抗Quadro FX3800


ATI FirePro V5700在表中处于正中的位置,定位于中端市场
 

ATI FirePro V5700,特点是小巧,只占用单个扩展槽位置,并且不需要外接电源
 

一个Dual-Link DVI-I接口和两个DisplayPort接口

FirePro V5700显卡背面

  正面由于散热器的覆盖,我们看不到具体的显存颗粒。而在显卡背面,我们看到了4颗显存(正面散热器下也有4颗)。


搭配了现代H5RS5223CFA颗粒 显卡规格为512MB 128bit
 


FirePro V5700显卡的GPU-Z截图

  ATI FirePro V7750面向中高端市场,定位上比V5700要高一档。和V5700一样,ATI FirePro V7750基于RV730核心,具备320个流处理器,配备1GB显存,真30-bit显示管线,支持10-bit的RGB通道和HDR(High Dynamic Range,高动态光照渲染)配备Dual-link DVI以及双DisplayPort接口。

ATI FirePro V7750专业图形卡首发评测


ATI FirePro V7750专业显卡,比V5700强大一些,也更长一些,不过仍然是单槽位设计

 
ATI FirePro V7750专业显卡


ATI FirePro V7750专业显卡全线都提供了CrossFire多显卡接口
 

ATI FirePro V7750专业显卡,需要一路外接的PCI-E 6Pin显卡辅助电源

ATI FirePro V7750

  ATI FirePro V8700面向高端专业市场??在V8750出现之前,V8700就是ATI最高规格的专业卡,从规格上看,FirePro V8700源于在桌面上大获成功的RV770核心(对应的是Radeon HD4870显卡),拥有800个Shader处理单元和1GB的GDDR5显存,带宽为108.8GB/s。V8700的核心频率为750MHz,显存频率为1700MHz,支持DirectX 10.1、Shader Model 4.1、OpenGL 2.1、PCI-E 2.0、CrossFireX、每RGB色彩通道8/10/16-bit HDR渲染、全30-bit显示管线等一系列技术,配备两个DisplayPort和一个Dual-LinkDVI接口,最高分辨率 2560*1600,且支持高清色差输出和3D立体输出。

长于抗锯齿 FirePro V8700专业显卡评测

 

作为最高端的型号之一,V8700自然是采用了全厂带把手的双卡槽设计
 

FirePro V8700显卡,外型粗狂有力
 

CrossFire交火接口
 
需要双6Pin供电接口,大多数高端显卡都需要双6Pin,或者更高端的8Pin PCI-E辅助电源接口
 
为了固定重而长得板卡,全长卡通常都会增加一个把手,配合相应的机箱以进行固定


FirePro V8700显卡GPU-Z截图


  NV的专业卡一直都以Quadro为名,相对来说,产品线要比FirePro更广一些,除了通常的Quadro FX桌面专业卡之外,还有移动/笔记本的Quadro Go、高端工作站用的Quadro Plex及图形服务器产品线。

  Quadro FX380属于第10代Quadro产品。Quadro FX380作为入门级的产品,最吸引人的就是价格??它是Quadro 10中最便宜的型号。在NVIDIA官方的发布会上,Quadro FX380的价格被定为99美元,也是Quadro 10家族唯一一款100美元以下的产品。而在国内市场,这款产品目前的售价为1099元,也是一款千元级的产品。对于新款专业卡来说,这样的价格已经相当平易近人,甚至还不到一款高端娱乐卡的售价。

最诱人的是价格 Quadro FX380显卡评测


Quadro FX380
 

  和上一代的Quadro FX370相比,Quadro FX380性能主要有几大改变。首先是显存位宽提升到了128bit,是原来Quadro FX370的一倍。其次是显存颗粒使用了更高规格的GDDR3,相比DDR2来说能够达到更高的频率,因此总带宽就是FX370的四倍,达到了22.4GB/s。FX380和FX370一样,具有16个流处理器和256MB显存容量。


和ATI不同,NVIDIA的中低端Quadro都不提供SLI功能


双DVI-I接口,没有提供HDMI或DisplayPort


G96核心
 

现代H5RS5223CFR显存颗粒,4颗组成了256MB 128bit的规格
 
GPU-Z 0.3.4下信息

  Quadro FX580面向中低端市场??比FX380高一个档次,它基于G98核心,具有32个流处理器,512MB显存,128bit显存位宽。

少花钱多办事 Quadro FX580颠覆性测试


Quadro FX580和GeForce 9500GT很相似
 

Quadro FX580提供了一个DVI接口和两个DisplayPort接口,接口上明显比FX380要丰富
 
应用方便:不需要外接电源
 
G96-875-C1核心,大面积使用在GeForce 9500GT上
 

HYB18H1G321AF显存,组成512MB 128bit规格,容量是FX380的一倍(语言的奥秘:写“一倍”和“二倍”都是同一个意思)
 

  Quadro FX1800则面向中端市场,它具有64个流处理器,768MB显存,带宽为192bit。FX1800在某种程度上是FX580的增强版本,如Gsync/SDI这样的高级功能需要再上一级才会具备。

Quadro中端新动力 FX1800显卡抢先评测


FX1800:较FX580更长的卡身


FX 1800使用了PCI-E 2.0 x16界面,最大59W的功耗让其仍然只需要单槽位设计

Quadro FX1800型号


两个DisplayPort接口和1个DualLink DVI-I接口
 


仍然不需要辅助电源接口。75W以上的PCIE显卡才需要额外的电源支持


GPU-Z


  和FX1800相比,Quadro FX3800算是高一个台阶的作品,面向高端市场,它具有如SDI、立体眼镜和SLI Multi-OS这样的特别功能??比它低档的Quadro都不提供这样的功能,只有FX3800及以上,才真正属于传统意义的“专业显卡”。
 
专业设计之选 戴尔T5500双路工作站评测

 
FX3800的规格也比FX1800高了差不多两个档次:它具有三倍于FX1800的流处理器数量、1GB的显存,带宽为256bit(FX 1800为192bit)
 

  NVIDIA SLI Multi OS是一个全新的技术,首次实现了让两台虚拟机同时获得GPU加速能力。这项技术基于另一项虚拟技术的最新进展,即Intel的VT-d技术。新的VT-d技术能够重新映射DMA和设备的中断,甚至可以直接将中断分配给某一个操作系统,利用这个技术,NVIDIA实现了让一台物理机上的两个操作系统分别使用自己一块GPU,而且其性能与单操作系统的性能非常的接近。这是第一次在虚拟机上实现GPU的硬件加速。对于很多行业来说,这是非常重要的。例如在石油天然气行业,集团里常常会有很多的老的各种程序在运行,它们都是基于Linux的,而很多新的软件却是基于Windows来设计的。如果要同时运行两种软件的话,就必须使用两台独立的设备来进行,但现在可以通过使用虚拟机技术安装多个操作系统来解决这个问题,不单节省成本,也可以给工作带来很多便利。因为在一台机器上做数据共享比在两台机器上共享更加容易。
 

两块FX 3800??3800提供了SLI接口,不过这可能会误导群众,这里首先要说明的是:FX 3800支持SLI技术,但是SLI并不是一个能增强专业图形卡性能的技术??仅仅是一个用于游戏的多显卡技术。要想多Quadro联合渲染,你需要更高一个档次的FX 4800
 

由于功率达到了107W,因此FX 3800需要一路6Pin的PCI-E辅助电源输入
 

支持SLI

  在我们收到的Quadro中,Quadro FX4800是最高档次的型号??我们并没有测试Quadro FX5800。与FX3800相比,FX4800规格提升在两个方面:一方面是性能,FX4800的流处理器和FX3800一样是192个,但是FX4800的显存方面得到了增强:容量提升到1.5GB,显存带宽从256bit提升到384bit,分别提升了50%。在性能之外,FX4800比FX3800多了两个特性:G-Sync功能与SLI Frame Rendering功能,前者提供用于多个显示器的同步信号,后者则提供了一定形式的多显卡系统渲染能力。
 
王牌对王牌 Quadro FX4800极限性能对比


FX3800只能支持SLI MultiOS,在通常的单系统平台下,多个FX3800只能用来接多个显示器,无法加快操作速度,而FX4800的SLI Frame Rendering则可以加速通常DCC类软件的预览渲染速度(要对最终的渲染加速,仍然需要使用NViRT功能??需要软件支持)

 
 
 
 
Quadro FX4800具备1.5GB显存,在面对极复杂的场景时不至于需要频繁和系统内存交换而导致性能下降
 

侧面的型号标签

产品上的标签

双Displayport和DVI输出接口设计,并提供一个立体眼镜输出


150W:使用一个6Pin PCI-E辅助供电
 
Quadro FX4800的GPU-Z信息
 

  测试对比平台的详细参数如下: 

专业卡测试平台、测试环境
测试分组
类别 双路Intel Gainestown
Xeon X5550
处理器子系统
处理器 双路Intel Xeon X5550
处理器架构 Intel 45nm Nehalem
处理器代号 Gainestown
处理器封装 Socket 1366 LGA
处理器规格 四核
处理器指令集 MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
主频 2.67GHz
处理器外部总线 2x QPI
3200MHz
6.4GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
L1 D-Cache 4x 32KB
8路集合关联
L1 I-Cache 4x 32KB
4路集合关联
L2 Cache 4x 256KB
8路集合关联
L3 Cache 8MB @ 2664MHz
16路集合关联
主板
芯片组 Intel Tylersburg-EP
IOH:Intel 5520(Tylersburg-36D)
ICH:Intel 82801JR(ICH10R)
芯片特性 2x QPI
VT-d Gen 2
内存控制器 每CPU集成三通道R-ECC DDR3 1066
内存 2GB R-ECC DDR3 1066 SDRAM x6
系统磁盘子系统
磁盘控制器 Intel ICH10R RAID Controller
磁盘控制器规格 6x SATA 3Gb/s
MatrixRAID 0/1/3/5
磁盘控制器设置 SATA 3Gb/s
AHCI w/NCQ
磁盘控制器驱动 Intel Matrix Storage Manager
8.8.0.1009 x64
磁盘 Seagate
Barracuda 7200.11 x1
磁盘规格 7200RPM
320GB
SATA 3Gbps
16MB Cache
磁盘设置 SATA 3Gb/s
NCQ
50GB系统分区
图形子系统
显卡 Misc
显卡驱动 Misc
软件环境
操作系统 Microsoft
Windows XP Professional x64 Edition SP2

专业卡测试平台

  本次测试我们选择了常见的Windows XP Professional x64 Edition SP2操作系统作为平台。由于工作站通常配备较多的内存,因此使用64位操作系统比较合适,而由于一些SPEC测试套间尚未能很好地支持Vista系统,从软件兼容性来说,很明显Windows XP更适合我们的测试软件。常见的DCC类软件都已经有了Vista及64位的版本。

  不过根据之前测试的结果,我们如果在同一台电脑中分别安装NVIDIA和AMD的显卡。即便是每次都卸载驱动,但难免会有AMD的驱动文件遗留在系统中,会对接下来的NVIDIA显卡测试造成性能影响。为此,我们本次测试使用了另外一块Seagate Barracuda 7200.11硬盘作为Quadro FX4800的系统盘。

  为了体现专业显卡与普通显卡的区别,我们还特地加入了两块桌面游戏卡:GeForce GTX260+和Radeon HD4870,这两个都是比较超值的中高档游戏卡:


ATI Radeon HD4870显卡:RV770核心,800个统一着色器(和NVIDIA的流处理器不能直接比较),1GB显存,位宽256bit,核心频率750MHz,显存频率3.6GHz,符合Direct3D 10.1标准


NVIDIA GeForce GTX260+显卡:GT200核心,216个流处理器,864MB显存,位宽448bit,核心频率576MHz,显存频率2GHz,符合DirectX 10标准

桌面卡测试平台、测试环境
测试分组
类别 华硕P6T Deluxe V2
单路Intel Nehalem-WS
Xeon W5580
处理器子系统
处理器 单路Intel Xeon W5580
处理器架构 Intel 45nm Nehalem
处理器代号 Nehalem-WS
处理器封装 Socket 1366 LGA
处理器规格 四核
处理器指令集 MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
主频 3.2GHz
处理器外部总线 2x QPI
3200MHz
6.4GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
L1 D-Cache 4x 32KB
8路集合关联
L1 I-Cache 4x 32KB
4路集合关联
L2 Cache 4x 256KB
8路集合关联
L3 Cache 8MB @ 2664MHz
16路集合关联
主板
主板型号 华硕P6T Deluxe V2
芯片组 IOH:Intel X58
ICH:Intel 82801JR(ICH10R)
芯片特性 1x QPI
VT-d Gen 2
内存控制器 每CPU集成三通道R-ECC DDR3 1066
内存 2GB R-ECC DDR3 1066 SDRAM x3
系统磁盘子系统
磁盘控制器 Intel ICH10R RAID Controller
磁盘控制器规格 6x SATA 3Gb/s
MatrixRAID 0/1/3/5
磁盘控制器设置 SATA 3Gb/s
AHCI w/NCQ
磁盘控制器驱动 Intel Matrix Storage Manager
8.8.0.1009 x64
磁盘 Seagate
Barracuda 7200.11
磁盘规格 7200RPM
320GB
SATA 3Gb/s
NCQ
16MB Cache
磁盘设置 SATA 3Gb/s
NCQ
50GB系统分区
软件环境
操作系统 Microsoft
Windows XP Professional x64 Edition SP2
桌面卡测试平台

  在测试桌面卡的时候,使用了另外搭建的平台:基于Nehalem-WS 2S Xeon W5580处理器的一个平台,主板是ASUS P6T Deluxe V2??因此这是一个单路的平台(虽然W5580支持双路处理),在单个处理核心上,比专业卡平台要更强劲(W5580的频率比专业卡平台的X5550更高),然而在总的处理能力上,显然是双路的X5550要更强一些。

  根据被测显卡的情况,我们选择以下列表中的部分测试软件进行测试。

  Cinbench R10

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

  SPECapc for Maya 6.5 v1.0

  Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、 texture highlighted with a wireframe mesh、texture with wireframe mesh control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。Maya使用OpenGL API。

  SPECapc for 3ds Max 9

  SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 8开始同时支持OpenGL和DirectX 8.0/9.0 API。

  SPECapc for SolidWorks 2007

  SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。SolidWorks使用OpenGL API。

  SPECviewperf 9

  SPECViewperf 9.0是SPEC推出的专业级、符合工业标准的OpenGL 图形显示卡效能测试分析软件的第9个版本,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、 ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。SPECviewperf 9使用OpenGL API。

  SPECviewperf 10

  SPECviewperf 10是SPECviewperf的第10个版本,和上一个版本相比,测试项目更加复杂完善。SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。SPECviewperf 10仍然使用OpenGL API。


  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

 
CineBench测试画面:一辆CineBench牌摩托车(上一个版本CineBench 2003则是一个建筑场景)
 

CineBench R10:OpenGL性能

  在服务器测试中,我们使用CineBench测试处理器的性能。而在工作站中,CineBench还提供了显卡性能的参考数据。从结果来看,定位略高的FirePro表现略好于Quadro。令人惊奇的是HD4870和GTX260+的表现也不错??CineBench的测试比较短而简单,专业卡的稳定性和全面性都无法体现出来。

  Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、 texture highlighted with a wireframe mesh、texture with wireframe mesh control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。Maya使用OpenGL API。最近SPECapc for Maya推出了for 2009的版本。


Maya测试画面之一:狼人
 

SPECapc for Maya 6.5:Overall

  从总分来看,FirePro的表现都很好,比Quadro高不少。不过Quadro系列的得分都很一致。


SPECapc for Maya 6.5:GFX

  FirePro的性能在Maya上表现良好。


SPECapc for Maya 6.5:CPU

  相同的CPU的结果也很相似。


SPECapc for Maya 6.5:I/O

  I/O项目上Quadro平台要好不少。

  SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 8开始同时支持OpenGL和DirectX 8.0/9.0 API。

 
3ds MAX测试画面之一:不规则表面与几何物体


SPECapc for 3ds Max 9:Software

  Software模式也就是软件渲染,不过显卡多多少少也有一点影响,总的来说相同档次的显卡相差不是很大……


SPECapc for 3ds Max 9:OpenGL

  早些年OpenGL一直是NVIDIA的强项,不过这个情况在近年得到了改变:FirePro V8700表现很强劲,当然它的定位要比FX4800要高一些。最近的驱动中ATI和NVIDIA都提供了OpenGL 3.0的支持。


SPECapc for 3ds Max 9:Direct3D

  ATI系列显卡硬件支持到Direct3D 10.1,而NVIDIA系列支持到Direct3D 10,从性能上看,情况和OpenGL下一样。

  SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。SolidWorks使用OpenGL API。


SolidWorks测试画面之一:四驱车
 

SPECapc for SolidWork 2007
 

SPECapc for SolidWork 2007

  FX4800的耗时是131.24秒,而档次略高的V8700则是137.59,因此Quadro的表现显得要好一些。

  SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。SolidWorks使用OpenGL API。


SolidWorks测试画面之一:四驱车
 

SPECapc for SolidWork 2007
 

SPECapc for SolidWork 2007

  FX4800的耗时是131.24秒,而档次略高的V8700则是137.59,因此Quadro的表现显得要好一些。

  SPECviewperf 10是SPECviewperf的第10个版本,和上一个版本相比,测试项目更加复杂完善。SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。SPECviewperf 10仍然使用OpenGL API。


SPECviewperf 10测试画面之一:赛车

  SPECviewperf 10包括6个测试项目,它们输出结果恰好按照字母排列:3dsmax-04、catia-02、ensight-03、maya-02、proe-04、sw-01、tcvis-01、ugnx-01,此外,SPECviewperf 10测试还分别测试了在各种AA抗锯齿条件下的性能以及在多线程操作下的性能,因此导致输出结果比较多。在测试中,NVIDIA系列显卡可以支持到32x AA,而ATI系列只能达到8x,因此对比结果上只提供了8x的情况:


3dsmax-04:基本测试

   专业卡全面领先于娱乐卡一倍以上。


3dsmax-04:8x AA

  尽管ATI无法达到8x以上的AA,不过,在8x AA的情况下,ATI FirePro系列显卡的性能下降比较少,而NVIDIA Quadro则比较明显,顶级的FX4800从49.34下降到43.01,而最入门的FX370LP则从44.54下降至24.64。AA是一个极耗显存容量和显存带宽的选项,因此显卡的显存配置比较重要(入门级别的FX370LP只有128bit宽度的256MB显存)。


3dsmax-04:4线程综合

   在多线程的状态下,所有显卡的性能都有所提升,不过,幅度并不相同,高端的Quadro FX4800、FX3800、FX1800和FirePro V5700、V7750、V8700性能明显要比低端的FX580和FX380高出一大截。可以说,ATI的低端显卡表现比较好一点。


catia-02:基本测试

  在3dsmax-04测试上,Quadro和FirePro的性能大致相似,而在catia-02测试上,Quadro要全面胜出。


catia-02:8x AA

  和3dsmax-04项目相似,在AA条件下,显存不足的显卡性能下降较大。


catia-02:4线程综合

  在多线程状态下,FirePro发挥的更好。


ensight-03:基本测试
  基本测试上,Quadro FX4800基本上和FirePro V8700持平。
 
ensight-03:8x AA
  ensight-03测试比较特别,在8x AA下FirePro系列显卡性能下降比Quadro要多。
 

maya-02:基本测试

  maya-02测试,性能大致和其定位一致。


maya-02:8x AA

  FirePro V8700表现一直独秀……由于显存配置比较低,FX380和FX580表现和桌面卡差不多。现代的中端桌面卡都拥有512MB以上的显存容量和巨大的显存带宽。


maya-02:4线程综合

  FirePro V8700的表现仍然是非常突出。


proe-04:基本测试

  在proe-04项目上,Quadro军团的表现明显比FirePro要好。


proe-04:8x AA

 


proe-04:4线程综合

  FirePro V5700的定位比Quadro FX380的定位要高一点,性能则比较相似。


sw-01:基本测试

  sw-01测试也是Quadro表现比较突出。


sw-01:8x AA

  可以发现,FirePro V8700和V7750的性能几乎就和无AA的时候一样??包括HD4870。


sw-01:4线程综合
 

tcvis-01:基本测试

  通常状态下,Quadro的表现好一些。


tcvis-01:8x AA

  AA下则是FirePro好一些。


tcvis-01:4线程综合

 


ugnx-01:基本测试

 


ugnx-01:8x AA

  在ugnx-01上,FirePro系列显卡具有明显的优势。

现代的专业图形卡发展迅速??整个图形卡市场都是这样。到目前为止,GPU的计算性能增长已经超过了所用的CPU的计算性能增长,雄心勃勃的图形芯片厂商还企图通过GPGPU让显卡担当更多的计算任务,在高性能计算市场,硝烟已起。


Direct3D 11新增加的Compute Shader

  在传统的专业卡应用上,虽然专业卡基本上仍然是通过加速DCC类软件的预览渲染来加速专业创作的效率,最终渲染多是依靠CPU。不过这个情况近来也有所改变,尽管应用比较难,通过HLSL/GLSL语言也可以实现一些CPU渲染上用到的Ray Trace效果。NVIDIA的第十代更是通过自身的CUDA实现了NViRT(NVIDIA Interactive Ray Tracing),专业卡未来的目标就是成为不需要CPU的真正图形加速卡。在Direct3D 11里面增加的Compute Shader有望成就这个目标(此外,还有负责OpenGL开放标准的行业组织Khronos Group宣布的OpenCL)。


高端的外置专业显卡:NVIDIA Quadro Plex,内置多块Quadro FX5800,价格也非常专业
 
 
Quadro FX380,价格不足100美元

  在我们的测试当中,可以看到,NVIDIA的Quadro具有不凡的威力。确实,在过去10年里,NVIDIA一直在开拓专业图形市场,无论是产品线的宽度上,还是产品的性能上,都比老对手显得要强。例如,在入门级别的产品上,Quadro的选择要更方便一些,需要专业应用而又囊中羞涩的可以选择FX380这样的便宜专业显卡,提供了专业卡所需要的各种要素:稳定性、兼容性以及专业图形驱动,也能提供比较不错的性能。


ATI FirePro V8700,Direct3D 10.1硬件支持


硬件支持Direct3D 10.1对MSAA项目有利

  测试中,如Maya、3ds Max这样的应用中ATI FirePro表现不错,这些应用环境下你应该选择ATI FirePro。此外,其抗锯齿选项对性能的影响也很小??硬件支持Direct3D 10.1对抗锯齿有性能提升的效果,虽然大部分应用都是OpenGL,然而硬件层级的支持仍然能发挥一定作用。NVIDIA的Quadro则如SolidWorks这样的应用优势明显,并且具有更强的整体性能,除了Maya、3ds Max这样的应用,用户都可以选择Quadro。


NVIDIA Quadro FX4800

  在一些项目中,娱乐卡??GeForce GTX275和ATI Radeon HD4870也能有不错的效果,如Maya这样的应用,不过,大部分情况下娱乐卡的性能都很低,它们没有为专业应用作优化的专业显卡驱动,难保不会出现兼容性问题,并且稳定性也难有保障,因此最好还是选择专业显卡。

  • 正睿合作伙伴
  • 社区
首页 | 注册 | 网站地图 | 通告 | 联系我们
CopyRight(C)2004-2022 Chongqing Zhengrui Technology Co.,Ltd. All rights reserved.
重庆正睿科技有限公司(C)版权所有 未经书面授权 不得转载、复制或建立镜像
渝ICP备11002339号-1  渝公网安备 50010702500475号