打开未来的应用之门

来源 :微型计算机 | 被引量 : 0次 | 上传用户:lingshao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  自从电脑问世以来,人们对于处理器性能的追求就从未停止过。要提升处理器的性能,最简单有效的方法就是提升处理器的频率。但随着AMD和英特尔在2000年以后的处理器性能争夺战,处理器频率很快就提升到了一个极限——Pentium 4处理器最终未能突破4GHz大关。
  在频率提升越来越困难的情况下,业界迅速找到了提升处理器性能的新方法,那就是增加核心数量,从而让处理器在同一时间并行处理更多的任务,为此双核心的Pentium D、Athlon 64 X2纷纷问世,如今Core 2 Quad的发布更是宣告桌面处理器多核心时代的来临。那凭借当今的科学技术,处理器的核心究竟能达到多少呢?多核处理器的极限又在哪里?英特尔在近期给出的答案是80核心!
  
  4核怎么够,英特尔80核心处理器问世
  
  早在多年前,英特尔便宣布开始进行一项被称作Tera-Scale(万亿次计算)的研究计划。在1996年,当时英特尔为Sandia国家实验室建立TASCI Red超级计算机,该计算机使用了104个机柜,占地2500平方英尺,装配了近1万个Pentium Pro处理器,耗电量高达500千瓦,所以当时的万亿次计算更多采用的是与处理器集群相关的技术。进入2006年,英特尔逐步揭开了新一代万亿次计算Tera-Scale处理器的面纱。此时人们惊奇的发现,Tera-Scale处理器并没有采用处理器集群来实现,而仅仅通过了1枚芯片实现!更让人震惊的是,这款处理器在有限的面积下竟然集成了多达80个核心,并且可以轻松工作在3GHz以上的频率,同时处理器的耗电量仅为62W!毫无疑问,Tera-Scale处理器就如一枚重磅炸弹瞬间在业界掀起了滔天巨浪。那么,接下来让我们想到的一个问题是:80核心的处理器究竟能用来做什么呢?
  
  Tera-Scale助推新型应用
  
  Tera-Scale架构的推出显然不仅仅是英特尔作为展示自己研发实力的“花瓶”,更为重要的在于其实际的应用价值。早在Tera-Scale基础架构被定义之初,英特尔就经过了大量的市场调查,并为Tera-Scale处理器的应用领域定义了一个新名词:“RMS(Recognition,识别;Mining,挖掘;Synthesis,合成)”。RMS应用模型具有较强的通用性,可用于满足高强度计算、数字内容创建、计算机视觉和人工智能等领域的需求。总体来看,Tera-Scale处理器可以被应用于4大场合,遍及未来生活的方方面面。
  首先,Tera-Scale处理器可应用于个人应用领域。这样的场景可能我们都很熟悉,数码相机的大量普及,使存储在电脑上的照片数量成倍增长,随之而来的问题是,我们在电脑上查找照片所花的时间越来越长。虽然我们可以使用诸如Google Desktop等桌面搜索引擎来相对快速地查找照片,但这种搜索仍然要求我们记得住照片的名称,否则“大海捞针”的情况也是无法避免的。但当有了Tera-Scale处理器以后就有所不同了,由于其具有强大的计算能力,电脑将具有一定程度的“智慧”,例如我们从一张图片中选取指定的人物作为搜索对象,电脑就会找到所有包含该人物的图片。同样在目前广为关注的视频搜索方面,Tera-Scale处理器也将会成为强大的助推器,今后我们只要以一段音乐、一句歌词甚至是某段场景为条件,就能快速找到想要的视频。而这一切要在今天实现起来,必须依靠大型服务器才行。
  其次,Tera-Scale另一大应用领域是在娱乐方面。当然这里的娱乐不仅仅简单的指看HDTV或者玩游戏,而更高层次的虚拟现实游戏,例如我们可以和电影/游戏中的人物进行互动,或者直接参与到影片/游戏中当主角,如同《黑客帝国》般的虚拟世界将不再是科幻。当然,这一切都需要Tera-Scale处理器提供强大的数据处理能力,以便及时处理声音及动作。
  再次,Tera-Scale在旅游以及学习方面也能够施展才华。通过Tera-Scale强大的处理能力,人们还可以创造出用于协作和教育的交互式虚拟现实环境,让你沉醉于法国浪漫的酒吧当中,或者在虚拟现实世界中与外国人交流。
  最后,在医疗健康方面,通过Tera-Scale可以支持实时、逼真的人体模拟系统。这样一来,就可以让医生和研究人员在系统上准确、快速地进行各种药物和病理实验。同时家庭医护的概念也将发生变化,我们不必再漫长地等待医院的诊断报告。采用Tera-Scale处理器的家用电脑具有足够的运算能力,因此我们可以在家中进行检查,并用家用电脑快速运算出结果,大大缩短诊断的时间。
  毫无疑问,Tera-Scale处理器在硬件上解决了未来应用领域的庞大运算量需求,但它是如何在小小的一块芯片上实现如此惊人性能的呢?
  
  Tera-Scale处理器架构探秘
  
  相对于我们常见的处理器而言,Tera-Scale处理器最为显著的特点就是采用了被称作“瓷砖片”的平铺设计方法(Tiledesign)。在这种设计方法中,每个核心在晶体管规模和复杂程度上相对常见的处理器有所简化,并且各个核心像瓷砖片那样平铺起来,相互连接。Tera-Scale处理器允许最终产品的内部集成10个到100多个的核心,以满足不同领域的运算需求,例如掌上电脑、桌面电脑、笔记本电脑甚至大型服务器。这样的设计与IBM的Cell处理器非常类似,Cell处理器同样可以根据实际需求来决定其协处理器的数量。
  在Tera-Scale处理器中,每个核心都具有2个独立运算单元、2KB的数据缓存和3KB的指令缓存。与此同时,每核心的寄存器单元还包括了6个读取端口和4个写入端口。这样一来,核心与核心之间就可以更为容易地实现相互连接和协同工作。除此以外,每个核心运算单元的流水线长度达到了9级,因此可以在一个时钟周期内完成2次浮点运算。
  在采用了瓷砖片设计之后,每个核心还能实现差异化设Oo这就意味着Tera-Scale处理器中的80个核心并不需要完全相同,它们可以根据应用场合的不同而增加、缩减或者替换。例如英特尔既可以把80个核心替换为专用DSP芯片,也可以替换为视频编码加速芯片,以针对不同的专业应用。在未来,英特尔甚至可以把3D运算核心加入到Tera-Scale处理器中,直接与GPU抢饭碗。毫无疑问,瓷砖片设计方法的引入将会使得处理器的功能、性能和设计方向发生翻天覆地的变化,未来一个处理器就能满足所有的系统运算需求,即使出现同时集成3D运算、视频编码加速、物理加速和音效等功能的处理器也毫不奇怪。
  无论是双核心还是80核心,如何让核心之间更好的协同工作—直都是研究的重点。在Tera-Scale处理器上,英特尔采用了“片上网络”(network-on-a-chip)的设计概念。所谓的片上网络,就是将每个处理 器核心当作一个独立个体,由一个统一的调度机构来进行任务的分配和功耗的控制。Tera-Scale处理器可以自动识别出哪些核心处于繁忙状态,哪些核心处于空闲状态,并且据此对核心进行负载平衡。另一方面,一旦某些核心出现故障,可以立刻将这些核心的当前任务转移给其它核心。最后,针对各种不同种类的核心,片上网络结构还可以先将任务分类,再分配给最适合执行该任务的核心,从而让80核心的运算效率保持在较高的水平。Tera-Scale处理器将可能采用一种点对点类型的信号连接方式,提供高达20GB/s的数据带宽。从现有资料来看,这条总线可能就是英特尔正在开发的CSL总线。
  
  更加先进的电源管理
  
  许多人可能会担心在集成80核心之后,Tera-Scale处理器的芯片面积和发热量都会相当惊人。实际上在英特尔展示的可运行原型上,采用65nm制程的80核心Tera-Scale处理器的芯片面积仅有275mm2(同样制程的Core 2 Duo E6300处理器的面积为111mm2)。与此同时,工作在0.95V、3.16GHz频率下的Tera-Scale处理器的功耗也只有65W。但要注意的是,在这款原型中并没有大容量的缓存,英特尔表示将在未来通过3D堆栈封装技术为Tera-Scale芯片增加缓存,从而具有真正的实用性。不过缓存的耗电量通常占到了整体的50%以上,因此最终完整的80核心Tera-Scale处理器的耗电量可能是现在的一倍以上。
  在功耗控制方面,Tera-Scale处理器的每个核心都能根据需要关闭或打开,每个核心还分为了21个电源管理区域,在核心未满载的情况下,同样允许关闭核心中的空闲区域以进一步节省电力。此外,Tera-Scale处理器使用了一种新式的模组PLL(频率发生器),比传统的全局PLL更加节电,芯片电压可以控制在0.7-1.3V,频率可在0-5.8GHz范围内调整。
  
  更多的设计细节
  
  较为有趣的是,英特尔在Tera-Scale处理器上放弃了传统的x86指令集,转而采用了专为这款处理器设计的超长指令集。这一指令集将会把所有的指令重新融合为一个96位指令进行计算。由此我们不难看出,英特尔可能打算在未来让x86指令集步入历史。
  在前面我们还提到,英特尔计划采用3D堆栈内存技术为80个核心提供较大容量的内存。由于Tera-scale处理器需要一条高达1.2TB/s的内存带宽才能使得80个核心都能够及时获取数据,目前最佳的解决方法就是采用3D堆栈内存一一整个内存呈平面状覆盖在80个核心上,让SRAM与核心之间有成千上万只连接针脚。采用3D堆栈内存后,每个核心将具有80GB/s带宽,延迟仅为1.25ns(4GHz频率下),而整个Tera-scale,总带宽则高达3TB/s!但令人担忧的是,采用3D堆栈内存将对散热和供电提出新的考验,目前还不清楚英特尔将会如何解决。当然英特尔也表示,Tera-scale处理器并非一定需要3D堆栈内存才能运行,只是核心数量会受到限制而已。
  
  写在最后
  
  尽管英特尔为我们展示了Tera-scale处理器的万亿次运算能力,但目前它还只是研究项目,不一定会推向市场。但是,该项研究对探索未来处理器的发展方向有着重要的意义,为今后四核、八核处理器的开发做好铺垫。此外,Tera-Scale处理器对新的硅设计方式和功耗管理技术也是一项可行性实验。
  英特尔(中国)研究中心总经理杜江凌博士表示,如同提升处理器频率的历史一样,随着处理器核心数量的增加,增加核心对于提升处理器性能的作用将会变得越来越有限。英特尔的研究表明,超过16核心后,继续增加核心数量的作用会越来越小。而在核心数量增多的情况下,只有配合加入新指令集、改进缓存和硬件线程调度功能才能顺利提升处理器的性能。单纯提升核心数量和频率让摩尔定律在今后继续延续,Tera-scale处理器正是对此作出的新尝试。 对于应用领域而言,Tera-scale处理器的意义也将异常深远。今后个人电脑、移动设备和服务器将具有类似超级计算机的运算能力,这种超高的运算能力将让现在很多大家不敢想、不敢做的应用成为现实。
其他文献
近日笔者用上了Windows Vista,但麻烦事随之而来。原本硬盘容量就小,Windows Vista安装之后所占的硬盘空间达到8GB,加之保存的各种资料,硬盘空间所剩无几。早前我曾用过一款名为nLite的软件为WindowsXP“瘦身”,于是重新祭出了这一法宝。    新人登场,vLite是谁?    经测试,nLite对Windows Vista并不奏效,访问软件作者的网站才了解到,原来是w
笔记本电脑多次维修能否要求换新?    北京读者王先生问:我于2006年4月购买了DELL Inspiron 630m笔记本电脑,11月因间歇性黑屏更换了Palmrest,今年1月由于休眠状态不能唤醒又一次更换了Palmrest,但今年3fl又发现LCD显示屏安装偏右—Fa请MC帮我咨询DELL,在使用不到一年的过程中出现诸多问题,能否要求更换新机或退款?    处理结果:根据检测结果进行处理。 
测试说明  《刺客信条》PC版3D设置菜单解读 《刺客信条》PC版3D设置菜单默认测试分辨率为1680×1050,关闭垂直同步(Vertical Sync设置为OFF)。因此笔者关注的重点在Multisampling(多重采样反锯齿)、ShadOW(阴影)、PostFX(后处理效果)、Graphic Quality(图像质量)、Level of Detail(细节程度)这5项设置。其中,Mult
来了!来了!来了!终于,ThinkPad推出了人们翘盼已久的内地学生机。2008年6月30日~7月13日,国内6大城市指定高校的在校生均可以低廉的价格购买到ThinkPadT61、X61、X61s和X61T。其中价格最低的两款机器均只要7999元即可买到,相比同等配置的行货价格便宜了40%左右,一款学生优惠价为9999元的X61s的行货价格竟为19999元,优惠幅度更是高达50%。然而,这样的好事
近期英特尔推出了新一代的G4 5 /G43主流整合芯片组。我们也拿到了基于G43芯片组的技嘉GA-EG43MS2H主板,看看它的表现究竟如何。  技嘉GA-EG43M-S2H主板采用的是G43 ICH10的芯片组搭配方式,其中在北桥中集成了GMA X4500图形核心。该核心支持DirectX 10、ShaderMo d e l 4.0及Op e nGL2.0,核心频率为533MHz,Shader运
英特尔Atom处理器的“狼子野心”  2005以及2006年的那段时间对英特尔来说显得有一丝苦涩,那个时候英特尔不仅在桌面处理器市场上遭遇AMD强有力的反击,而且苦心经营的Xscale处理器也难以得到业界认同并节节败退。为了扭转颓势,英特尔上演了壮士断腕的一幕,将Xscale以及相关设计专利一并转卖给Marvell,并宣称自此全面退出移动通讯处理器市场……  但“凡事计划没有变化快”,就在Xsca
日前,精灵电子推出了一款NetScrollG500游戏鼠标。它的定价只有199元,却提供了不输于高端游戏鼠标的性能。这款鼠标采用左右对称设计,鼠标外壳表面经过银色特殊喷漆处理,边缘应用了黑色亚克力材质,而在鼠标的左右两边更采用了防滑设计,有效避免了因玩家长时间游戏手部出汗而发生手滑的现象。通过在鼠标滚轮之后的按键,玩家可以在游戏中根据自己的需求任意在800、1600以及2000dpi之间调节鼠标的
深入虎穴的主人公被敌人围困,于是通过GPS设备获取当前的地理坐标,然后通知后方进行救援……在好莱坞的大片里,我们无数次为这样的情节所吸引。长久以来,卫星导航这种美好的体验只有步入影院才能领略,而能随时随地享受这份快乐身边,玩转地球的滋味终于能够亲身体验一番。  说列GPS(Global Positioning System,全球卫星定位系统),这个曾经作为军事目的而出现的技术,如今摇身一变成为了“
距离第一款Directx10显卡上市已经过去了大约8个月,越来越多已经拥有Directx10显卡的玩家却仍然无法体验新技术许诺的种种先进特效。并非大家甘愿如此,面而是Directx 10游戏开发进度滞后导致Directx 10显卡“巧妇难为无米之炊”。现在,第一款Directx 10游戏《失落星球》终于登台亮相,或许它不是你最期待的游戏大作,但从图形技术的角度看,这款游戏采用了哪些Durectx
现在新装机应该配多贵硬盘?图便宜买80GB,还是循规蹈矩买160GB?其实,在网络时代的今天,音乐、影视、游戏文件动辄以GB为单位,因此至少应该选择320GB的大容量硬盘才不会让你后悔。本期我们就搜集了市场上的7款大容量硬盘进行测试,为大家采购升级硬盘提供实用参考。   在这个网络共享极其流行的时代,丰富的共享影音视频资源让人们对大容量存储的需求越来越高。现在游戏和影片容量越来越大,以从网络下载的