论文部分内容阅读
十几年前,PC中负责显示功能的只有一颗显示控制器,把字符与简单的图形输出到屏幕上。1999年NVIDIA(英伟达)发明全世界首颗GPU,GeForce 256的问世才真正开始了视觉处理的时代。GPU让PC从原本简单及粗造的二维画面走进了今天所看到的精致3D世界,在2006年NVIDIA更在GPU结构上创新而发布了CUDA GPU架构,开启了GPU运算革命。基于CUDA GPU架构,NVIDIA的GPU不仅可以快速地实时处理3D图形渲染,更可以利用GPU的多核心做并行运算。而在2009年我们宣布了下一代CUDA GPU架构——“Fermi”,2010年3月29号它会以GeForce GTX480/470的姿态出炉。
在PC体验越来越着重在视觉效果这一趋势下,NVIDIA的研发人员设计的Fermi架构不仅可以满足现代PC的需求,更创造与加强了一系列GPU的运算功能。这使得以Fermi架构为基础的GPU将受到极大的关注。从高性能运算领域的科研机构到专业的图形设计人员,直至热衷于影音或游戏世界的计算机玩家,都能以不同的方式享受到极致的效能。
NVIDIA的研发团队在设计Fermi时就把从并行运算至图形的未来纳入考虑。针对运算所采用的大规模并行运算架构,集成了上一代GPU两倍的512个CUDA核心,这是普通CPU的一百多倍。它不仅让GPU的核心结构变得更有效率,还增添了全新的缓存架构和对ECC的支持,当然还有GDDR5高速显存。因此,Fermi的双精度浮点运算能力超越上一代8倍以上。
过去的GPU性能大多强调图形渲染速度。基于Fermi架构的GeForce GTX 400系列产品不但渲染性能更强,甚至有上代GPUMs倍几何处理性能,并且完整的支持业界最新的DirectX 11以及OpenGL。除此之外,它当然也具有CUDA并行运算功能,也加强了物理加速,人工智能,实时光线追踪技术,3D立体技术和曲面细分等特征。为了有效地加强与增添这些技术,除了上述的运算架构改变,NVIDIA也在Fermi架构下新增了曲面细分多形引擎(Polymorph Engine)和光栅引擎(Raster Enginel。
随着基于Fermi架构的新一代NVIDIAGPu全面上市,不难想象:海上钻井平台的工作人员利用NVIDIA Tesla更有效率地分析地质寻找潜在的大片海底油田;好莱坞的艺术家们利用NVIDIA Quadro呈现一幕幕三维立体电影巨作;而游戏玩家则使用装配了NVIDIA GeForce的个人电脑激战正酣。与此同时,NVlDIA的GPU还可参与Folding@home项目,为模拟蛋白质折叠贡献自己的一份力量,帮助人类找到战胜疾病的新途径。
借助最新的微软DirectCompute API以及Khronos的OpenCL语言以及NVIDIA的CUDA C与C 语言,CPU GPU协同的异构运算模式已经成为最具执行效率的电脑架构。采用GPU加速并行运算可使应用程序运行效率提升几十倍甚至百倍。在我国的顶级学术机构中国科学院过程工程研究所和清华大学不仅开设了CUDA编程课程普及GPU计算,而且还成功地将GPU计算应用到大量科学以及工程设计研究项目中。
这也就解释了为何美国加州伯克利大学并行计算实验室主任Dave Patterson认为:历史会证明Fermi是一个里程碑式的GPU。NVIDIA从创立以来的17年间不断挑战着视觉运算的界限。为了不只满足现有的需求,更为了未来应用的前瞻性,全新的Fermi架构因此而诞生。
在PC体验越来越着重在视觉效果这一趋势下,NVIDIA的研发人员设计的Fermi架构不仅可以满足现代PC的需求,更创造与加强了一系列GPU的运算功能。这使得以Fermi架构为基础的GPU将受到极大的关注。从高性能运算领域的科研机构到专业的图形设计人员,直至热衷于影音或游戏世界的计算机玩家,都能以不同的方式享受到极致的效能。
NVIDIA的研发团队在设计Fermi时就把从并行运算至图形的未来纳入考虑。针对运算所采用的大规模并行运算架构,集成了上一代GPU两倍的512个CUDA核心,这是普通CPU的一百多倍。它不仅让GPU的核心结构变得更有效率,还增添了全新的缓存架构和对ECC的支持,当然还有GDDR5高速显存。因此,Fermi的双精度浮点运算能力超越上一代8倍以上。
过去的GPU性能大多强调图形渲染速度。基于Fermi架构的GeForce GTX 400系列产品不但渲染性能更强,甚至有上代GPUMs倍几何处理性能,并且完整的支持业界最新的DirectX 11以及OpenGL。除此之外,它当然也具有CUDA并行运算功能,也加强了物理加速,人工智能,实时光线追踪技术,3D立体技术和曲面细分等特征。为了有效地加强与增添这些技术,除了上述的运算架构改变,NVIDIA也在Fermi架构下新增了曲面细分多形引擎(Polymorph Engine)和光栅引擎(Raster Enginel。
随着基于Fermi架构的新一代NVIDIAGPu全面上市,不难想象:海上钻井平台的工作人员利用NVIDIA Tesla更有效率地分析地质寻找潜在的大片海底油田;好莱坞的艺术家们利用NVIDIA Quadro呈现一幕幕三维立体电影巨作;而游戏玩家则使用装配了NVIDIA GeForce的个人电脑激战正酣。与此同时,NVlDIA的GPU还可参与Folding@home项目,为模拟蛋白质折叠贡献自己的一份力量,帮助人类找到战胜疾病的新途径。
借助最新的微软DirectCompute API以及Khronos的OpenCL语言以及NVIDIA的CUDA C与C 语言,CPU GPU协同的异构运算模式已经成为最具执行效率的电脑架构。采用GPU加速并行运算可使应用程序运行效率提升几十倍甚至百倍。在我国的顶级学术机构中国科学院过程工程研究所和清华大学不仅开设了CUDA编程课程普及GPU计算,而且还成功地将GPU计算应用到大量科学以及工程设计研究项目中。
这也就解释了为何美国加州伯克利大学并行计算实验室主任Dave Patterson认为:历史会证明Fermi是一个里程碑式的GPU。NVIDIA从创立以来的17年间不断挑战着视觉运算的界限。为了不只满足现有的需求,更为了未来应用的前瞻性,全新的Fermi架构因此而诞生。