NVIDIA TITAN X显卡性能全面深度评测
有这么一个显卡系列,不以数字命名,因为用数字不足以诠释它的独特和强大;有这么一个显卡系列,每次出现必定轰动业界,让N饭们欢呼雀跃;有这么一个显卡系列,模糊游戏卡和专业卡的边界,是业界当之无愧的“跨界卡王”。没错,熟悉显卡的朋友们都知道,吉吉我说的正是NVIDIA的传奇显卡系列——TITAN,而今天,我将为大家带来的是目前最新也是最强的泰坦卡——NVIDIA TITAN X的评测。
由于NVIDIA TITAN X供货极为有限,所以NVIDIA一直都没有为国内媒体送测新TITAN X,厂商也舍不得为媒体送测这么昂贵的显卡,因此国内科技媒体网站上便一直都没有TITAN X的相关专业评测,我们只能通过民间土豪玩家的帖子和外媒的测试结果来对这块卡的性能了解个大概,这不得不说是一个遗憾。为了满足心中一窥最强性能的渴望,吉吉我在GTX 1080 Ti发布的前夕借来了一块NVIDIA TITAN X,并以最快的速度对该卡进行了相关测试。虽然大家都知道该卡毫无疑问是目前最强的单芯显卡,但究竟强到什么程度?就让我来告诉你吧!
NVIDIA TITAN X包装盒
NVIDIA TITAN X发布于7月末,据说是因为一个赌注而诞生的。老黄在2016年7月22日参加斯坦福大学的AI会议的时候情不自禁地介绍了NVIDIA的全新TITAN显卡——NVIDIA TITAN X,于是NVIDIA也就顺势把这块新卡皇给放到了官网上。老黄在会议的演讲中说到,TTXP的诞生源于一次打赌,对象是Brian Kelleher,NVIDIA的首席硬件工程师,老黄不相信Kelleher能够做出单芯10 TFLOPS的显卡,于是Kelleher便做出了新TITAN X,该卡的单精度达到了11 TFLOPS,创下了显卡界单芯显卡单精度历史新高。
漆黑酷炫的外观
该卡的命名比较有意思,上代卡泰坦卡叫“NVIDIA GeForce GTX TITAN X”,这一代居然没有重新命名,只是简单粗暴地省略了“GeForce GTX”,就叫做“NVIDIA TITAN X”。然而好玩的是,该卡的背板上刻有型号名,刻的是“GeForce GTX TITAN X”,简直不能更乱,因此很多玩家直接称呼这代为“TITAN X Pascal”或“新TITAN X”,简称“TTXP”。
背板必不可少
这块卡没有采用Pascal架构完整的GP100核心,而是精简掉双精度单元的GP102核心,流处理器数量为3584个。NVIDIA TITAN X的推出不仅引来了阵阵欢呼,也遭到了玩家的疯狂吐槽,因为新TITAN X用的居然不是完整核心,比完整GP100核心少了256个CUDA处理器。NVIDIA TITAN X售价近1万块,买这块卡的玩家大部分都是因为信仰,但如此有信仰的卡王居然不完美,这让广大N饭怎么能忍?那么完整核心去哪里了?精明的老黄居然把完整核心用在了Quadro P6000上,这块专业卡的售价超过了3万,也就是说想要“原汁原味”的信仰,你得掏出3倍的价格。不过即使不完整,NVIDIA TITAN X依旧是N饭的终极梦想,因为没有在中国首发,所以有些玩家甚至以1.5倍以上的价格从黄牛手里淘到了这款卡。
其名为“TITAN X”
背景铺叙完毕,该来说说测试部分了。吉吉我为了体现NVIDIA TITAN X的实力,选择了一块GTX 1080 Founders Edition以及一块GTX TITAN X作为主要对比对象,并且考虑到三款卡都是旗舰级显卡,测试常规1080p分辨率已经没有什么意义了,因此我们的测试中只包含2K分辨率和4K分辨率。此外,由于吉吉我手中没有R9 Fury X和Radeon Pro Duo了,AMD的Vega还没有发布,因此便没有与AMD显卡进行对比。接下来就让我们一起见证什么是最强吧!
卓越的Pascal大核心
NVIDIA TITAN X采用全新16nm制程的Pascal架构,核心代号为GP102,具体型号为GP102-400-A1,而Quadro P6000的核心代号为GP102-425-A1。GP102核心面积约为471平方毫米,得益于16nm的制程优势,核心内集成了12亿晶体管,是GTX TITAN X晶体管数量的1.5倍,核心面积却仅为GTX TITAN X的78.4%。
显 卡 规 格 比 较 表 | ||||
显卡型号 | NVIDIA TITAN X |
GTX TITAN X |
GTX 1080 |
R9 Fury X |
首发限价 | $1200 | $999 | $699 | $650 |
GPU代号 | GP102 | GM200 | GP104 | Fiji XT |
GPU工艺 | 16nm | 28nm | 16nm | 28nm |
GPU晶体管 | 12B | 8B | 7.2B | 8.9B |
着色器数量 | 3584 | 3072 | 2560 | 4096 |
单精度浮点 | 11 T | 7 T | 9 T | 8.6 T |
ROPs数量 | 96 | 96 | 64 | 64 |
纹理单元数量 | 224 | 192 | 160 | 256 |
核心频率 | 1418MHz | 1002MHz | 1607MHz | 1050MHz |
boost频率 | 1531MHz | 1076MHz | 1733MHz | 1050MHz |
架构 | Pascal | Maxwell 2 | Pascal | GCN 1.2 |
显存频率 | 1251 MHz | 1753 MHz | 1250 MHz | 500 MHz |
内存位宽 | 384 bit | 384 bit | 256 bit | 4096 bit |
内存带宽 | 505 GB/s | 336.6 GB/s | 320 GB/s | 512 GB/s |
内存类型 | GDDR5X | GDDR5 | GDDR5X | HBM |
内存容量 | 12 GB | 12 GB | 8 GB | 4 GB |
注:表中售价均为官方首发限价
基于Pascal架构的GP102-400芯片运算资源总量为3584个ALU,比GP102-425少了256个;GP102-400的TMUs数量为224个,后端的ROPs数量为96个,6个带宽为64bit的双通道显存控制器组成了总量为384bit的显存控制单元,大小为12GB。同GTX TITAN X相比,其各项参数均有所提升,尤其是显存带宽达到了505GB/s,这是因为其采用了GDDR5X显存,GDDR5X显存的改进使得NVIDIA TITAN X在位宽相同的情况下拥有更高的带宽。
GP102-400架构图
我们可以看到,NVIDIA TITAN X的默认核心频率为1418MHz,Boost频率为1531MHz,达到了上代GTX TITAN X频率的1.4倍,提升幅度非常明显。NVIDIA TITAN X的默认Pixel Fillrate能力达到了155.8Gpiexls/S,默认Texture Fillrate能力为363.6Gtexels/S。凭借超高的基础频率和庞大的运算规模,NVIDIA TITAN X拥有11 TFLOPS的超高单精度浮点运算能力,照比GTX TITAN X提升了57%,为目前单精度浮点运算性能最高的单芯显卡。
SMs单元架构图
Pascal架构GP104-400芯片由以下主要的部分组成:
1、基于TSMC的16nm FinFET Plus工艺,相比28nm HPM提升了65%的性能或者减少了70%的能耗,同时晶体管密度翻倍。
2、6单元的宏观并行结构,30组SMs单元被分为6个GPC,每个GPC包含5组SMs,但砍掉了2祖SMs单元,因此总量为28个,相对应地,纹理单元缩减为224个。
3、28组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
4、GP102拥有12个32位显存控制器,总计384位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计96个ROPs单元和3M二级缓存。
5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
在NVIDIA TITAN X上,我们看到了其与上代基于Maxwell 2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元,这就让这款显卡能够支持所有在GeForce GTX 900系列中的特性。
显卡拆解赏析
从外形上可以看出,除了其散热器外壳、显卡名称和散热鳍片颜色互相对调以外,其他地方TITAN X和GTX 1080 FE是相同的。
显卡正面外观
TITAN X采用公版标配的涡轮散热器,涡轮将热空气经I/O区散热孔中吹出,涡轮扇的最大转速被限制在55%,也就是2300转左右,这点跟GTX TITAN X的涡轮扇相同。
显卡背版
拆掉一半背板
老黄称GTX TITAN X没有背板是为了让多卡SLI有更好的散热,这点显然不会被玩家所认可,所以NVIDIA TITAN X上搭载了全新设计的背板,在组建SLI平台时,可以卸掉一半背板来增加气流量,以此来增强散热效果。
显卡散热器外壳