众所周知,Geforce 8系列最大的亮点在于舍弃了原先传统的渲染方式,将顶点引擎和像素渲染引擎合二为一,形成了统一渲染的构架,与之前的分别处理两类指令相比,全新的处理器被成为流处理器(streaming processor),从字面上亦能解释,通过的数据流即可由该处理器进行编译。而每个流处理器都能处理vertex、pixel、geometry等操作,是一个通用的浮点处理器。 这些浮点处理器都可以随时有计划的编排分组成不同的工作量,提升Streaming Processor的速度也能显著提升性能,而Streaming Processor集成在GPU核心之中,提高GPU的运行频率即可获得性能的提升,且提升的倍数关系远大于之前的构架,这将在之后的测试中验证,但值得注意的是,GPU的频率与流处理器的运行频率并非1:1的关系。其实NVIDIA从GeForce 6时代的部分GPU上就已经引入了异步频率的设计,例如ROP(像素输出处理器)的频率和内存控制器是一样的,到了GeForce 7800的时候,顶点着色器和像素着色器的频率也运行于异步了——顶点着色器比像素着色器高几十个MHz。
Geforce8600渲染构架基本与8800相同,但SP仅仅只有32个
以Geforce 8800GTX的渲染构架为例,其拥有128个(8组)运行在1350Mhz时钟频率的Unified shader(Steam Proccessor)。而Geforce 8600系列则只有仅仅32个Steam Proccessor,仅仅占到了8800GTX的1/4,但效能则不会相差如此之巨,从而可见统一渲染构架的潜力之强。
当然,G80家族还不仅仅只有统一构架值得炫耀,超前的设计赋予其游刃有余的性能面对未来更为苛刻的应用环境。而NVIDIA在AMD即将发布R600之前抢先上市Geforce 8600GT系列,市场运作上又比对手快了三个月左右,事实上证明这样做法不仅能够有效的压制对手,而且为日后的应用打下坚实的基础,从而开发出更为完善的产品。作为支持DirectX10的中流砥柱,拥有32个steaming processors的 8800GT足以满足目前主流游戏的应用,特别是在开启高负荷特效之后,性能表现更为抢眼。
Unified Steam proccessors可以处理各种多样的shader程序,瞬时就能迎合需求而达到平衡,内建的高速缓存拥有极高性能和命中率,和高速的显存子系统相结合。和前代texture fetch和过滤的延迟相比,GIGAthrad技术可以迅速向texture unit派送有效的工作,texture unit进行的操作并不需要过多的等待。在复杂的vertex和pixel shader程序中,有相当多的时钟用来将这些shader合成,并进行Z运算,ROP子系统的总容量也要考虑在内,而900Mhz的时钟频率的显存子系统让更高阶的分辨率进行高质量过滤更加有效。除了硬件架构方面,NVIDIA的Forcware驱动也起了重要的作用,我们相信随着驱动的完善,Geforce8800系列的性能也会不断提高 。