admin管理员组

文章数量:1534194

2024年3月16日发(作者:)

NVIDIA Quadro M6000 24GB应用性能测试

——万元专业显卡的价值在哪里?

作者:暂无

来源:《智能制造》 2016年第8期

测试/ 朱辉杰 闻波

撰文/ 朱辉杰

引文

对于利用三维软件进行机电产品和建筑设计的工程师或设计师而言,专业显卡并不陌生。

这种专门开发的图形加速卡,被安装在图形工作站中,针对CAID、CAD/CAM 和CAE 等应用进行

了广泛的功能认证和性能优化,不仅保证了专业图形创建工作的高性能和高效率,还最大程度

地提供了软硬件功能兼容性和稳定性。

虽然都是“显卡”,普通显卡提供日常影像显示和三维游戏图形加速,属于娱乐工具,而

专业显卡则主要应用于专业图形创建、大规模数据可视化和GPU 计算加速,是工程师和设计师

的“生产工具”。为此,专业显卡的价格往往远高于普通显卡。

目前市场上的普通显卡,即使是最顶级、最烧包的游戏显卡Geforece GTX TITAN X,单片

价格也不超过万元。而在本文中,我们将测试的NVIDIA 专业显卡QuadroM6000 24GB,市场价

格超过人民币40,000 元!这是目前能买到的顶级性能的专业显卡之一。Quadro M6000 24GB采

用的GPU GM200 和Geforece GTX TITAN X 是类似的,但前者的价格是后者的五倍!

惊人的价格能否带来惊人的性能?作为“生产工具”,Quadro M6000 24GB 在实际专业图

形软件环境中,能否爆发与价格相配的能量?哪些行业、哪些工作需要QuadroM6000 24GB 这

样的怪兽级专业显卡?我们将通过一系列的应用实测去寻找答案。

认识NVIDIAQuadro M6000 24GB 和测试平台在正式测试开始之前, 我们先了解一下

NVIDIAQuadro M6000 24GB。

2015 年,NVIDIA 就已经发布了Quadro M6000 这款定位超高端的专业显卡,当时的

Quadro M6000 配备了12GB 的GDDR5 显存,显存的位宽是384bit,采用28nm制程的Maxwell

GM200 GPU,最高GPU 工作频率达到1140MHz,提供3072 个CUDA 核心,192 个纹理单元,其

单精度浮点性能达到了7TFlops。2016 年3 月,NVIDIA 直接将Quadro M6000 的显存翻了一

倍,发布了24GB 版本的Quadro M6000。

新版本的Quadro M6000 提高了显存容量,以应付更大规模的三维图像处理任务。对于三

维建模和大规模图形可视化用户而言,图形、图像的整体规模,分辨率和精度正迅速提高,几

GB 容量的模型和场景并不稀奇,在影像工业、企业级VR 和地球物理等领域,数十GB 的场景

已经进入实用阶段,这直接推动高端专业显卡的显存容量进入赛跑阶段。

Quadro M6000 24GB 版本的另一个亮点在于“显卡的工作频率和温度控制更聪明”。出于

散热、稳定性和系统能耗控制的原因,即使是高端的专业显卡,核心频率也不是越高越好。

NVIDIA 更早采用GK110 核心的高端专业显卡产品Quadro K6000 和采用GM204 核心的Quadro

M4000,核心频率均未超过1000MHz 大关。而2015 年发布的Quadro M5000 和Quadro

M6000 首次将频率突破1000MHz,热设计功耗直奔250W,负载峰值的发热将十分惊人。这使得

配备Quadro M6000 的工作站,必须具有足够强大的供电系统,散热也必须非常优秀。2016 年

更新的Quadro M6000 24GB,让核心频率随着应用负载的变化更为“聪明”地匹配,从而改善

功耗和散热表现,对于长时间、高负载应用场合,进一步提高了稳定性。

为了测试Quadro M6000 24GB,我们组建了比较贴近企业现实“工况”的图形工作站,其

配置如下:

在接下来的测试中,我们将使用工作站基准测试程序SPEC Viewperf 12,三维设计软件西

门子NX、AutodeskAIP,产品方案逼真渲染软件Showcase,以及多物理场仿真软件COMSOL 进

行实际模型和算例测试, 以验证NVIDIA Quadro M6000 24GB 的性能和稳定性表现。

开始实战

SPECviewperf 12 是最新版本的工作站基准测试程序,用于测试工作站的在综合图形性能,

它包含了CATIA(catia-04)、Creo (creo-01)、Energy (energy-01)、Maya (maya-04)、

Medical (medical-01)、Showcase (showcase-01)、Siemens NX (snx-02) 和Solidworks

(sw-03) 共八个独立测试环境,以实景化模拟方式运行,几乎囊括了线框计算、动态渲染、实

体操作和规模数据可视化等所有常见的专业图形模式,能比较全面、公正地衡量系统的图形性

能。

SPECviewperf 12 是SPECviewperf 变动较大的一个版本,相比10 和11 版本,测试项目

和模型、场景有了大幅度的更新,提高了测试应用软件的版本,对OpenGL 和DirectX API 进

行了版本更新,提高了测试系统的硬件门槛(包括主频、内存容量、分辨率、API 版本等)。

因此,SPECviewperf 12 对显卡性能的要求更苛刻,在12 版本得出的测试成绩,失去了和早

期版本SPECviewperf 横向对比的意义。

从测试成绩看,Quadro M6000 24GB 确实体现出了高端显卡的性能水平,例如在Siemens

NX 8.0 版本的大规模实体和线框模型测试中,166.92 的分数远高于大部分中端专业显卡100

上下的水准,而普通显卡在此类测试中不仅分数会惨不忍睹,还会出现破面和贴图问题(主要

会出现在Creo 和NX、SW 测试中)。

此外,我们在SPECviewperf 测试环节进行了循环测试,循环次数设定为8,连续运行超过

33 小时后,显卡始终保持稳定,而且没有因为频率负载优化降低性能。

Siemens NX 应用实测

在此环节,为了尽可能的贴近大多数读者的应用环境,我们选择了用户基础更广泛的

Siemens NX 9.0 版本,而不是更新的10.0 版本。NX 是集成产品设计、工程与制造于一体的

解决方案,是国内用户群最大的高端交互式CAD/CAM( 计算机辅助设计与计算机辅助制造) 系

统。

由于用户集中在汽车、船舶、新能源和大型装备等行业,Siemens NX 经常被用于创建和处

理高精度的大体量产品模型,其对显卡的性能需求非常高。NX 软件的用户最好使用经过西门子

官方认证的专业显卡,以保证实现完整的功能,确保稳定性。使用普通的显卡,在NX 软件中

模型很容易出现显示不全、黑面、暗边和目标点选不中等问题,而Quadro M6000 是经过了西

门子官方认证的专业显卡。

我们测试了两个范例模型,一个是拉拔机生产线模型,包括拉拔机生产线本体和数字模型

人,用以验证生产线的工况和流程;另一个是某商用飞机总体数字化模型。前者选自实际大规

模生产线设计项目,包含全部动力系统、操作执行机构和紧固连接件,模型规模超过1GB。后

者是获奖的建模设计项目,模型细节丰富,包含超过5400 多个零部件(含重复件)。

我们在软件中对这两个模型进行实体旋转、平移和剖切,调整各种视角,并进行软件内的

渲染。系统出乎意料的快,各种操作几乎没有延迟,只是可能由于系统I/O 瓶颈,在线框模式

下稍显停滞,硬盘灯狂闪。

Quadro M6000 确实没有辜负其40000 元以上的价格。

Autodesk AIP 应用实测

相比定位高端的Siemens NX,AutodeskInventor 则是定位中端的三维设计软件,其用户

人群同样十分广泛,特别是通用机械设计、通用零部件和非标准设备等领域,拥有越来越广泛

的用户基础。AutodeskInventor 版本更新很快,我们在本次测试中使用群众基础最好的

AutodeskInventor2015 版本。

测试项目包括两个。

第一,直径1600mm 主桩、副桩液压倒桩台车装置。这是实际环境的大型非标准设计项目,

包含主桩、副桩两部分,其中不仅含有全套的油缸滑轮总成,还包括全套的杆、板、柱、筋和

架结构,模型总体规模庞大。按照此类设备的实际设计环境(因为主体是钢结构),我们没有

设定任何不必要的材质和光。操作中,十分流畅,只有切换二、三维视图时,稍有停滞,但几

乎不影响实际工作。

第二,3000KW 水下泥泵齿轮箱的动画渲染和输出。

水下泥泵齿轮箱的结构简单,但体量巨大,而且进行实时、动态的渲染和播放,以检验各

部件的运动情况,这是AutodeskInventor 用户常用的工作内容。这个工作比较挑战显卡的渲

染和计算能力。实际效果和我们预期类似,整体过程流畅,速度飞快。而且当我们将输出分辨

率提高到2K水准后,仍然保持流畅。

我们连续渲染多次,不断提高分辨率,最终结果几乎都在一分钟内完成,这对设计工作的

迟滞可以忽略不计。当然,此类机械部件项目虽然体量巨大,但往往材质和光源要求不高,作

为高端显卡Quadro M6000,也是应有的表现。

Showcase 应用实测

Showcase 是强大的数字样机创建工具,此前是独立的软件解决方案,后被Autodesk 收归

旗下。

因为创建物理样机的过程和成本都很高,在产品验证阶段使用Showcase 创建逼真的数字

样机,可以实现保持高效的同时,大幅度降低成本,因此受到了汽车、电器、消费品等领域用

户的欢迎。

巧妙地应用Showcase 软件,结合Quadro M6000 此类专业显卡的高性能,创建、渲染的逼

真数字模型,几乎在材质、光感上可以乱真。

我们在这个环节的测试中使用了某航天企业工程师设计的“手电钻”方案,合理设定材质

和光源后,进行高分辨率渲染,结果如下图。

我们选择的背景不太好,降低了整体质感。但是,手电钻模型本身的真实感一流。

Showcase 针对NVIDIA 的专业显卡有优化,可以最大程度地发挥GPU 硬件渲染的效能,加上

Quadro M6000 的硬件性能给力,整个渲染过程可用高速来形容。工程师日常渲染(中等分辨率)

大约需要5 分钟(某品牌工作站),而在我们的Quadro M6000 测试平台上,仅仅用了59 秒,

过程中,GPU 几乎全速工作。这种效率正是实际工作中工程师需要的,省下的时间可以多做些

任务,当然,也可以去抽根烟。

COMSOL 分析计算应用实测

COMSOL 是多物理场建模和仿真分析软件,COMSOL起初只是Matlab 的一个工具箱——

Toolbox 1.0。后来改名为Femlab,开始为行业用户所熟悉和应用。从3.2 版本开始,正式命

名为COMSOL Multiphysics。这个软件的优势就在于多物理场耦合方面,这套软件曾经被NASA

技术杂志选为“年度最佳产品”。

COMSOL Multiphysics 对Quadro M6000 压力不在于建模、渲染, 而在于GPU 辅助计算能

力。COMSOLMultiphysics 是支持多核心、多线程CPU 和GPU 加速的仿真分析软件之一,而且

解算效率非常高。

我们在本测试中进行了一个相对简单的流固体耦合算例,仅用于验证和测试Quadro M6000

的GPU 加速能力。

实际测试中,我们首选关闭解算器的GPU 辅助加速,整个项目计算时间需要662 秒。然后,

我们打开GPU 加速,结算时间缩短为192 秒,缩短了70% 的时间!

本测试选择的模型结构简单,网格划分也比价粗疏,仍然节省了70% 的时间。我们可以设

想,那些往往需要数个、十数个小时解算的项目,如果采用了Quadro M6000的GPU 加速,将

带来多大的价值。例如,下图的民用船舶设计中,进行相应的初步流体分析,就可以利用GPU

加速能力。

另外,我们在测试中发现,GPU 加速开启后,解算器对GPU 的占用还是比较高的,同期进

行其他图形计算工作会受到一定影响。因此,这种应用模式对于规模大的项目,比较适合利用

空余时间集中解算。对于设计中的简单实时验证分析,则可以高效完成。

测试结论

经过基准测试和一系列三维设计、渲染(静态、动态)和仿真分析实景测试,从高端三维

软件到流行三维软件,从飞机、汽车体量的模型到生产线、非标准工具模型,从辅助建模到

GPU 加速解算,Quadro M6000 24GB 证明了其定位和价值。几乎所有的项目都保持了全流程的

顺畅,而且依靠ISV 认证NVIDIA 驱动,各种模型显示不存在任何现实错误和缺陷,个别需要

效率的项目(如渲染和解算)确实有助于大幅度提高工作效率、缩短工作周期。

需要说明的是,在本次测试中,我们没有设置任何二维项目,以Quadro M6000 24GB 的性

能和定位,应付二维图形实在是太容易了。我们也没有进行普通商业图形和消费娱乐图形倾向

的基准测试,这些都不是Quadro M6000 的目标应用环境,毕竟没什么人花几万元购买Quadro

M600024GB 仅仅是为了画拓扑图或玩游戏的吧。

那么,在制造业和建筑业领域,谁是Quadro M600024GB 的核心用户呢?航空航天、汽车、

船舶、大型装备和建筑设计等领域的用户显然对上号了。这些行业领域的产品价值和利润较高,

以Quadro M6000 24GB 生产工具的定位,其价格并不是不能接受。这些行业的一套加工设备、

检测设备动辄百万、千万,单套产品的价值从十几万、几十万到上亿元,在产品总体设计和产

品验证环节采用几万元的专业显卡,从而显著提高效率、减少设计验证的迭代次数、缩短设计

周期,是非常合理的。另外,这些行业的产品体量大,模型和场景数据量大,需要Quadro

M6000 24GB 的高性能加持。

实际上,高端行业用户的需求是没有上限的,越强越好,越强越不嫌强。单片的Quadro

M6000 24GB 显然离需求上限还远,规模更大、更复杂的模型和场景,系统集成度越来越高的产

品,制造业和建筑业不断整合的业务流畅,会不断推高图形、图像处理的性能需求。

注:

(1) 感谢NVIDIA 公司提供本次测试用Quadro M600024GB 显卡。

(2)感谢来自上海钜立、泰安航天特种车、江苏圣洁达、上海交通大学等企业和机构的工

程技术人员在本次测试过程中提供的帮助。

本文标签: 显卡测试模型专业图形