GPU的未来专访NVIDIA(英伟达)创始人,总裁兼首席执行官黄仁勋先生体刊记者

来源 :微型计算机 | 被引量 : 0次 | 上传用户:lanrengbuluo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  MCQ:和欧美游戏市场更重视对GPU性能要求较高的单机游戏不同,目前亚洲市场更倾向于对GPU性能要求不那么高的网络游戏。对于这种情况,NVIDIA如何看待?
  黄:我们在全球有游戏之道项目,前几天我们在韩国与暴雪一起发布了《星际争霸Ⅱ》。在中国,我们和主要的游戏开发商建立了联系。在美国,我们与暴雪保持紧密的沟通。我们创造了很多游戏开发商能够使用到的技术,例如PhysX就是其中之一。另外还有很多与图形显示相关的技术,例如Tessellation等。而游戏开发商则可以凭借这些技术进一步优化和完善游戏的画面。总的来说,我们并非只是做了“游戏之道”这一个项目,事实上我们与游戏开发商在一起推动这个产业的发展。
  MCQ:事实上,目前游戏和图形硬件的研发都围绕微软DirectX来设计。那么在未来,您认为NVIDIA能够从规则的执行者转变为规则的制定者,并从硬件上对游戏发展进行一定程度的规划吗?
  黄:我们研究DirectX,我们也研究OpenGL。但在未来,这只是一个底线和基础,越来越多的游戏需要更为复杂的游戏引擎,我们有3D立体幻镜引擎、PhysX引擎还有iRay引擎。除了API之外,这些引擎也是非常复杂和重要的,我们需要为游戏开发商开发和设计这些引擎。
  当然,我们的技术都将支持大众需要的API,如果DirectX不够优秀了,还会有OpenCL、OpenGL以及CUDA等很多引擎,我们会让游戏开发商自己选择适合的API进行游戏开发。但是在未来,基于DirectX API设计的引擎会变得越来越重要,例如PhysX和iRay引擎。而对游戏开发商而言,开发和设计这类引擎都太过于复杂了,我们需要做的事情就是将这些引擎设计好并提供给游戏开发商。
  MCQ:对于CUDA-x86编译器,我们的理解是面向x86平台的PGI CUDA C编译器(CUDA-x86)能让开发人员在基于x86架构工作站和服务器上编译和运行CUDA架构的应用程序,有无NVIDIA GPU均可。从这个角度上说,CUDA-x86编译器的出现有何深远意义?
  黄:多核心的CPU解决方案是不可能与拥有核群GPU的解决方案在延展性达到一样的执行效率的。现实中很多应用并不能对多核心并行运算进行很好的扩展性支持。造成这种情况的原因与GPU拥有的高带宽及运算连贯性有关,而且实际情况还远远不止。即使CPU实际性能表现并不像GPU的扩展性那么好,但在CPU使用CUDA-x86进行编程以后还是可以较大幅度提升应用运行的效率。如果CUDA可以在一个具备1000核心的CPU集群中运行的话,其执行速度仍然会得到提升,还是会带来很多的优势。最重要的优势是CUDA应用可以在任何配置下运行。
  PGI将会努力提升CUDA-x86的性能,我也会努力提升这个编译器的性能,因为我希望CUDA可以成功,这就要求CUDA一定要保证应用在所有平台上。PhysX可以在没有NVIDIA芯片的iPhone Xbox 360和PSP上运行,同样PhysX也可以在x86和CUDA上运行。并且,我们对PhysX进行了优化,保证其能够良好地支持所有的平台,因为我们希望PhysX成功。
  MCQ:您是否会考虑在GPU中集成x86的CPU?
  黄:不会。我认为Tegra是我们成长最快的个人计算机业务。GeForce Tegra的业务模式一定会快速成长。我不知道未来Windows系统会怎么发展,但是我注意到微软已经通过了对ARM的授权。但微软是一个软件公司,未来世界上最大的软件市场将会在哪里?——ARM!我认为所有有远见的公司都会在ARM上投入,而不是投资在x86上。
  
  微型计算机
  GPU的未来究竟在哪里?GPU在未来究竟应该扮演怎样的角色?这个看似沉重的话题其实并不沉重,因为GPU的应用就在你我身边。第一,GPU在未来最基本的应用仍然是进行和游戏相关的图形应用,这也是GPU最能吸引广大玩家的魅力所在。第二,GPU的功能已经被扩展,它可以在我们的日常生活中扮演更多的角色,在未来我们观看高清Flash网页离不开GPU的硬件加速功能;诸如Photoshop等使用率较高的软件已经率先在部分操作中使用OpenGL技术进行计算加速,这正是利用了GPU并行计算的优势;利用GPU加速,我们在转码时的效率会大大提升。
  而在通用计算领域,GPU的作用已经被提升到一个前所未有的高度。已经有大量的企业在生物信息学、计算化学、医疗成像等领域利用GPU进行密集的并行计算,这正是GPU的优势所在。总的来看,GPU在未来会扮演一个越来越重要的角色,它的功能也是丰富多样的。在未来,上游GPU厂商甚至会根据用户的应用需求,设计出更多具备不同功能的产品,就好比目前NVIDIA针对通用计算和专业应用设计出Tesla和Quadro系列产品一样。
其他文献
很多朋友在购买了GeForee 8800GTS 512MB显卡后,安装RivaTuner 2.06进行超频,却发现该软件无法识别显卡,即使安装最新版Forceware驱动也无济于事。其实类似的问题早在GeForce 7800 GS上市时也曾出现过,解决方法其实很简单。针对GeForce 8800GTs 512MB显卡,在RivaTuner的安装目录下用记事本打开“RivaTuner,cfg”文件,
在2月上刊杂志中,我们在技术与趋势栏目中为大家详细介绍了AMD新一代处理器Fusion APU的相关技术特点。很快,我们在第一时间拿到了基于Fusion APU(采用代号Bobcat的E350处理器)的索泰魅酷2样机。那么,究竟这款入门级的AMD FusionAPU会给我们带来怎样的体验,面对此前的Atom 翼扬的组合,Fusion APU在客厅应用方面会有怎样的特别表现呢?下面我们将为你揭示答案
如果你是一个凡事讲求实惠,动辄将性价比放在嘴边的消费者,那我们建议你不妨跳过后面的内容,因为看完以后你会说它没有性价比,抱怨我们在浪费你的时间。但是,如果你能够理解并认同设计的价值,并愿意欣赏全世界顶尖设计水准的笔记本电脑,我们邀请你加入我们,一起来细细品味联想ideapad U260带给我们的感官享受。    薄  界定一个人是内向还是外向,放在桌上的U260是最好的检验。外向的人多半会发出声惊
众所周知,振动是产生声音的关键。传统音箱正是依靠单元振膜的振动而发声,而今天我们要给大家介绍的则是一款不带喇叭,依靠共振即可发出美妙音乐的音箱——川腾HI·M共振音响。  HI·M共振音响的三角形外观,扁平的造型宛如飞碟。音箱上没有配置喇叭,并采用密闭式设计。这款音箱采用了锌合金外壳,金属材质的应用也使它有一定的份量。HI·M共振音响的连接非常简单,只需接上一根一分二的连接线(一端为3.5mm音频
鉴于GeForce GTS 450这类产品在2560×1600超高分辨率或抗锯齿环境下难以获得十分流畅的帧速,1GB显存也无法发挥太大作用。因此本着实用、节约成本的设计理念,一些厂商推出了512MB的GeForce GTS 450产品,如这款耕升GeForce GTS 450马超版。它只集成了512MB三星0.5nsGDDR5显存,组成512MB/128bit的规格,显卡默认工作频率为783MHz
如今的IT产品越来越注重工业设计,用户的需求早已从单纯的性能强,价格合理转变为美观,易用、好用。以前,迷你电脑总是让用户觉得时尚有余,性能不足,各个厂商的产品不是图形性能不济,就是处理器太过老旧,而华硕近期推出的新款迷你电脑C85110则是一款外观时尚唯美且配置平衡主流的产品,有望一改迷你电脑在多数消费者心目中的花瓶印象。  这款产品的外观设计获得了包括德国红点设计大奖在内的诸多设计奖项。其造型简
“夏利”能变“法拉利: 黄 建    量产工具(USB DIsK PRODucTION TOOL,简称PDT),负责向还处于空白状态的闪存芯片和控制芯片写入控制数据,让电脑能正确识别和读写闪存盘。除了工业生产还常用于闪存盘的维护。  如果你的闪存盘在长时间使用后出现性能“衰退”现象,你会不会想到通过量产工具调整闪存盘底层硬件,以达到提升读写速度的目的;而量产工具到底能不能帮助我们提升闪存盘读写速度
自从可开核的处理器问世以来,一直受到广大玩家的热力追捧。近日,市面上又出现7一款名为Athlon X2 5200+的处理器,究竟此处理器能否成功开核,开核后性能怎样,Mc评测室也实测了这款产品,为大家带来答案。  AMD AthIonX2 5200+采用45nm工艺设计,主频为2.3GHz。值得特别关注的是,Athlon×25200+采用了目前主流的AM3接口,完美支持DDR3和DDR2内存。据我
接收器对于2.4GHz无线产品来说,是不可或缺的设备,它不仅起着收发信号的关键作用,在无线音频产品中还会增加USB声卡功能,也正因为此,2.4GHz无线耳麦的接收器迟迟不能缩小体积,进而影响便携性。但技术的进步总会解决这个问题的,近期当我们收到最新的2.4GHz无线耳麦时,就发现已经有两款产品的接收器变为了超小型的Nano接收器,接收器体积的缩小意味着USB声卡芯片、无线芯片和内置天线也会相应变小
过去,一提到多卡互联,大家总会想到效率不高和兼容性差。尽管从理论上说,多张显卡互联可以同时处理大量数据,能够成倍提升显卡的性能。但这是在软件优化和驱动配合都相当到位的情况下。但现实情况是,在统一渲染架构(DirectX 10时代)出现之前,多卡互联技术由于驱动、游戏和显卡架构优化不够等多种原因,实际效率并不高。  多卡互联性能的充分提升,是在统一渲染架构出现之后。因为DlrectX 9等API使用