|
编译自: http://pc.watch.impress.co.jp/docs/2008/0702/kaigai451.htm |
●各有特色的GT200和RV770
NVIDIA公司的新旗舰GPU产品为“GeForce GTX 200(GT200)”,AMD(原ATI)的新旗舰GPU则为“ATI Radeon HD 4800(RV770)”。这两款GPU都拥有接近1TFLPOS的处理性能,不过两款产品在架构上存在着较大的差异。这里从产品的设计思想上我们就可以看到二者的差异就很大。
简单的说,GT200是以适合通用处理的架构为目标,其结果同时也带来了很高的图形处理性能。而在另一方面,RV770是以图形处理性能进行最优化处理,不过其通用处理性能也达到了一定的水平。由于GT200着重于通用处理的性能,因此控制单元核心尺寸增加了。而RV770则相比而言其控制部分的核心更为紧凑且高效,但是其在通用程序处理效率上有欠缺。
那么哪种架构会更适合这个时代呢,目前我们还无法回答。虽然NVIDIA建筑在通用处理方面进行了最优化,但是其终究还是一款GPU产品。因此在通用处理以及图形处理之间还是需要有一个很好的平衡。两家公司GPU的差很大,但是两家公司发展方向的差别也是很有意思的。如果详细观看架构的话就会发现,两家公司可以说是各有特点。而这次的报道,将主要介绍的是NVIDI公司的架构设计。
●NVIDIA架构使用3层设计
GT200的基本架构仍然延续了GeForce 8800(G80)。不过与G80相比,GT200上功能以及性能上均有提升。NVIDIA公司G8x以后的GPU产品使用的都是3层构造。其中最小的是单线程的scalar处理器“SP(Streaming Processor)”。共连结有8个SP多重处理器SM(Streaming Multiprocessor)”。“TPC(Texture/Processor Cluster)”(Thread Processor Cluster和1个texture单元(Texture Unit)构成SM单元)。因此我们可以根据GPU配备TPC的数量了解高端和低端GPU的差别。
GT200配备的单体的scalar处理器Streaming Processor(SP),与G80系列产品相比几乎没有变化。不过内置的8个SP所捆绑的Streaming Multiprocessor(SM)和TPC变化则相当大
以前的G80、G90系列产品上Streaming Multiprocessor(SM)和Streaming Processor(SP)数量是8个,Super Function Unit(SFU)数量为2个。GT200上双精度浮点运算单元“Double Precision Unit”有一个,同时寄存器文件(Register File)数量提升了一倍。至于其它Streaming Multiprocessor(SM)的组成如下:
Streaming Processor(SP) 8个
Super Function Unit(SFU) 2个
Double Precision Unit 1个
(Instruction Fetch and Issue) 1个
32-bit(Register File) 16,384
Shared Memory 16KB
Instruction L1 Cache
Constant L1 Cache
这里一共有2个Super Function Unit(SFU)和4的Streaming Processor(SP),1个双精度浮点运算处理器由8个Streaming Processor(SP)共同构成。同时SM内部寄存器数量在以前是8个,192个32-bit寄存器,而GT200的数量则提升了一倍分别有16个SM寄存器和384个32-bit寄存器。寄存器的倍增是因为对双精度提供了支持,以及为了提高multi-thread性能(消除memory access等待时间)的原因。(如果每个Streaming Processor(SP)寄存器数量变化2,048,每个1线程分配32个寄存器)。
GPU的芯片集成内存传统上称为缓存。而NVIDIA架构只有16KB共享内存。同时一级缓存从G80时代就是8K,因此这一次缓存容量也有提升。
GT200概要
CUDA的概要