|
编译自: http://pc.watch.impress.co.jp/docs/2008/0619/kaigai448.htm |
●1TFLOPS和双精度
NVIDIA公司的首席科学家David B. Kirk先生(Chief Scientist)表示在一年半前推出GeForce 8800(G80)的时候就表示今后推出的新一代GPU将会是以单片1TFLOPS性能为主。同时在1年前推出面向GPU处理器产品“Tesla(tesla)”的时候表示“我们确信在2007年末之前将会实现双精度浮点运算。谈到这点上我们认为不会是复合型单精度运算而昌实际上的双精度硬件产品”。
目前开发计划有了很大的延迟,不过NVIDIA公司推出的“GeForce GTX 280(GT200)”和“Tesla T10P”都将能够支持双精度(64bits)和900GFLOPS~1TFLOPS超强性能。目前在1TFLOPS和双精度方面该公司正在与AMD公司进行着激烈的竞争,目前NVIDIA公司确定了两个发展阶段。同时NVIDIA公司的通用处理程序编制模型“CUDA:compute unified device architecture)”和CUDA 2.0step up也正在开发中。
双精度和1TFLOPS对于NVIDIA公司来说将会是一个重要的里程碑。1TFLOPS表示其性能为CPU的10倍,同时双精度非图形应用软件将会是必要的一部分。
●与CPU变化接近的传统图形市场
目前CPU与GPU正在向合并发展(AVX和SSE5和Larrabee),同时作为GPU生产商的NVIDIA来说,如果实现GPU处理器的通用处理作用也是相当重要的。因为如果这个不能够获得成功,那么随着GPU市场的不断缩小,NVIDIA生存的空间也将会丢失。
对于NVIDIA来说,GPU将会比CPU更重要。除了可以应用于PC服务器和手机中,也可以应用于通用图形处理。同时作为该公司的理想,GPU也会支持更为广泛的应用软件。在最终用户的一般应用软件中,处理与图形处理将会并重,而在服务器产品和同等数量的Tesla GPU服务器的引入,并行处理任何将会在Tesla上执行。同时最终像Tegra一样的手机产品也将会因为CUDA等通用应用软件在GPU核心上运行。
终端用户一般使用的应用软件中,GeForce产品进行的是沉重的并列化处理。而在服务器产品上,同等数量的CPU服务器在引入Tesla GPU服务器之后,将可以在Tesla上进行并行处理。而最终就会像Tegra一样在GPU核心上运行CUDA通用应用软件。而这时,应用软件的性能就由GPU而不是由CPU来决定,这时GPU将会成为数据处理的主角。
不过NVIDIA目前的前进方向将会面临很多困难,比如将会丢失广大的集成显示芯片市场,而GPU将会只面向要求更高的游戏玩家。这个对于VIDIA来说将会是一次很大的赌搏。
CUDA编译
Tesla T10的构造
CUDA的环境