论文部分内容阅读
不久前,同事的一位朋友请我帮忙攒机。他的Pentium 4 2.8GHz超线程处理器过去可以畅玩QQ游戏,但最近的表现却尽显老态,于是他终于下定决心升级自己的PC。在向我咨询了新处理器的大致规格后,他将信将疑的问,“主频差不多,这新机器能比我的老机器快吗?”我告诉他,在相同的处理器微架构和内核数量下,主频才是直观反应性能水平的第一要素;而在更先进的微架构下,即使主频相对较低,其性能水平依然可以凌驾于微架构相对落后的高主频处理器之上。对于一个尚且使用着8年前PC产品的用户,我并没有必要把这个问题的答案细化、深入,事实上普通用户并不关心纸面上的参数和特性,他们只相信自己的眼睛和最直观的使用体验。从这个角度而言,英特尔每年一次的“重大技术变革”(制造工艺和处理器微架构每年交替进行)以及具体到各季度的处理器产品更新(很多时候这些新产品之间的规格差异仅仅是主频的轻微增减和缓存的上下浮动)对于大部分普通消费者来说并没有“时效性”——这些产品真正替代的往往是消费者手中三年甚至更久远以前的产品。对于英特尔大部分时间里更新产品的战略性市场行为,消费者最需要做的其实是克制冲动和耐心等待:等待一款足够出色,并能完美替换先服役PC的产品。
细细想来,无论架构如何调整,制造工艺如何进化,主频依然是处理器发展最为明朗的主线;在摩尔定律的支持下,英特尔始终把“更高的主频”作为下一个发展目标,而先进的处理器微体系架构和制造工艺则是保证处理器在高主频工作状态下依旧保持良好效能的先决条件。任何等级的超频大赛都是以挑战更高处理器主频为主题,当“全民超频”的概念逐渐普及之时,英特尔则依靠更加智能的微体系架构设计来为用户提供更加简单安全的处理器超频特性。SandyBridge的到来,应该算是解决了英特尔遗留近十年的“高主频问题”,在32nm制造工艺和新一代微体系架构的辅佐下,SandyBridge处理器仅通过第二代睿频加速技术即可将主频达到3.8GH z,依靠风冷散热器可轻松突破4.5GHz,更可进一步向5GHz发起冲击——在如此高主频状态下依然可保证良好的功耗控制能力,这一点的确难能可贵。更令人欣喜的是,传统的处理器性能提升绝不是Sandy Bridge唯一的亮点:不是说消费者对参数不感冒,他们只相信自己的眼睛么?Sandy Bridge带来的正是一次前所未有的视觉大餐。
架构变化
2006年英特尔推出酷睿微体系架构,让高耗低能的NetBurst彻底作古,被看作是近年来英特尔平台最大的一次架构革新。此后无论Nehalem还是Westmere都是以酷睿微体系架构为蓝本进行细节调整,“增强型酷睿微体系架构“由此得名。尽管Westmere已经提供了处理器内置高清显卡,但采用独立封装的GPU核心并非完全融入CPU之中,而依旧沿用英特尔在产品过渡期惯用的”胶水工艺“,更何况第一代高清显卡的性能水平只能勉强与主板芯片组集成显卡持平,因此无论从技术角度还是实战体验上,Westmere均无法获得令人满意的分数。携英特尔第二代高清显卡翩然而至的SandyBridge让情况有所改观。
与Westmere将采用45nm制造工艺的GPU独立封装不同,Sandy Bridge是实实在在的32nm处理器——无论CPU还是GPU均采用32nm制造工艺,且完全封装于同一颗芯片上,真正实现了处理器和显卡的融合,这也是业界首创。虽然Sandy Bridge将CPU与GPU完美融合,但GPU依然拥有自己独立的时钟频率和功耗调控机制,任何与GPU相关的节能或超频行为都是独立于CPU进行的,且与Westmere相比,Sandy Bridge高清显卡的超频幅度要高很多。
原有的L3高速缓存被更名为LLC最末级缓存,并由所有CPU内核及高清显卡内核共享,任何单元都可访问LLC中的任何数据,这也从另一个角度诠释了Sandy Bridge是如何将CPU与GPU完美融合的。为了提高LLC读写效率,英特尔为Sandy Bridge加入了一个先进的环形总线,这与之前Nehalem/We~mem处理器各个物理内核享有独立的L3缓存访问通道大相径庭。后者的设计虽然对L3访问效率并没有致命影响,但当处理器结构变得更加复杂(例如将更多的功能模块加入到处理器中)、有更多的单元需要访问L3缓存时,这种独立通道设计的弊端就暴露无遗——它将大幅增加处理器内部线路设计的复杂性,亦增添了设计开发成本。从这一点看,环形总线的意义类似于当初被媒体热炒的Nehalem可扩展架构——更加灵活,更加高效。
事实上,Sandy Bridge的环形总线架构与Nehalem-EX/Westmere-EX至强处理器所采用的技术相同,每一份LLC缓存、高清显卡、多媒体引擎以及System Agent(即原北桥芯片组)都分别享有一个环形总线节点。环形总线共分为四条独立总线,分别是数据环线、请求环线、响应环线和侦听环线,每条环线上的每个节点在一个时钟周期内可接收32字节数据,当核心数量和缓存容量增加时,缓存的带宽也会相应扩展,且环形总线会自动选择最短路径完成访问从而降低访问延迟。因此,环形总线架构对于多核心、多处理器平台扩展有着至关重要的意义。
除了L3缓存更名为LLC缓存,英特尔还将之前的“非核心”部分更名为SystemAgent,且不包含LLC缓存。LLC缓存的工作频率将与处理器内核保持一致,其延迟也由Westmere的36个周期下降为2至31个周期,具体延迟数根据不同核心访问不同位置LLC缓存而定。由于LLC工作频率与处理器内核保持一致,当处理器因节能而降频时,LLCI作频率也会随之下降,这对于GPU核心访问LLC缓存而言的确不利。
正如上文所述,为了便于环形总线工作,Sandy B ridge根据处理器内核数量将LLC缓存划分为相应的份数,在SandyBridge问世之初我们曾经质疑过这种做法是否会影响LLC缓存的利用率,所幸的是这种担心是多余的。虽然LLC缓存被分别划分给了每个处理器内核,但每个处理器内核却可以通过环形总线访问整个LLC缓存——得益于每份LLC缓存均享有一个环形总线节点和一个独立的缓存流水线,这比Westmere中所有处理器内核均请求同一个缓存流水线和队列的情况要先进得多。
核芯显卡
Sandy Bridge相对于Westmere的最大改进并不在于处理器性能,高清显卡性能的提升才是Sandy Bridge的最大卖点。毕竟要想让那一部分用户忘记独立显卡转投英特尔高清显卡阵营,单凭借Westmere的45nm 双芯片封装GPU是很难实现的。虽说SandyBridge那完全融合于CPU的32nm高清显卡依然无法对中高端独立显卡构成任何威胁,但已经媲美中低端独立显卡水平的性能表现和相对于独显而言毋庸置疑的能耗优势势必将开启“非独立显卡”的新篇章。
Sandy Bridge核心显卡拥有LLC缓存的独立访问权,这是Sandy Bridge核芯显卡区别于上代产品的重中之重。与过去的集成显卡解决方案相比,SNB核芯显卡无需再向内
Sandy Bridge命名规则
作为业界首款实现CPU和GPU完美融合的处理器产品,英特尔第二代智能酷睿处理器家族的发布是空前盛大的,亮相新品的数量级亦是过去历届新品发布所无法比拟的:15款移动处理器、14款桌面处理器共计29款全新c PU悉数登场,暴风骤雨般席卷OEM和零售市场。
相信你也一定猜到,如此众多的处理器势必将掀起新一轮的“型号谜团”——英特尔向来无法做到浅显易读的处理器命名规则和规格区分,这意味着用户在采购前又需要对处理器的型号和细节技术规格进行一番恶补。下面的文字虽然不足以对这29款处理器进行详尽的规格参数介绍,但却可以帮助用户迅速区分它们的规格差异和定位偏好。
定位于高端用户群的Core i7处理器将拥有至少4个物理核心,而主流及中高端定位的Corei5处理器根据具体定位不同而划分为4核和双核的版本,定位稍低的Core i3处理器则完全基于双核架构。下面的表格对这29款处理器的主要技术参数进行了罗列展示,请大家参考。
可以看到,处理器品牌标识并未改变,依旧采用Core i7/i5/_3.但型号由之前的3位数变为4位数,均以数字2开头,表明此为第二代智能酷睿处理器,处理器型号末端的字母则表明该处理器隶属的产品系列。例如大家所熟悉的字母K,代表不锁倍频版本,可由用户随意超频。由于部分Sandy Bridge处理器的主频将被完全锁死,因此对于超频玩家和用户而言,K系列处理器意义重大。
除此之外,桌面级处理器还增添了T系列和s系列,在上文的表格中已经清楚标明。这些处理器主要针对OEMU商,用于定制体积更小、更加省电的小型Pc产品(例如我们介绍过的迷你电脑)。其中s表示“性能优化”,与同为65W TDP的产品相比主频相对较低:而T则表示“节能优化”,与同为35W或45W TDP的产品相比主频相对较低。
移动平台的第二代智能酷睿处理器的型号就略微复杂一些了。虽然尾端字母与之前并无区别:xM表示至尊版型号,QM表示四核型号,而M则表示普通双核型号,但其他技术规格如主频、睿频加速、缓存容量和核芯显卡参数等全部由产品型号中的4位数字进行区分,且可循规律几乎为零,因此用户除了生硬的对照记忆之外怕是没有别的捷径可求了。存请求缓存数据,而是可以直接访问处理器的LLC缓存,不仅大大节省了通信时间,同时也为处理器整体节能带来利好。核芯显卡的LLC缓存利用规则完全由显卡驱动控制,包括寄存的数据和核芯显卡可利用的LLC缓存容量等。也许在消费者看来,统一了制造工艺后将32nm核芯显卡完全融入CPU、并使之可以全权访问LLC缓存是件理所当然的事,但事实上对于英特尔而言,重新设计核芯显卡并使之可自由访问LLC缓存并不容易,比起NVIDIA重新设计GF100显示核心的复杂程度有过之而无不及。
当然,SNB核芯显卡的技术改良并不仅限于此,新一代EU处理单元对多个技术环节进行了调整。每个处理单元抓取多线程指令的能力大幅提升,而DirectX 10 API指令与内部ISA映射的一一对应则可有效提升处理单元宽度,IPC也得到相应提升。EU还可以对包括正余弦运算在内的抽象代数运算提供硬件支持,其运算效率亦较前代产品实现较大提升。
在英特尔过去的显示核心架构中,寄存器采用即时分配原则,当某个线程对寄存器的需求并不迫切时,剩余的寄存器可被分配给其他线程。这种做法虽然可以有效节省核心面积,但更多情况下却会因为线程无法调用空闲寄存器而对显示核心的性能构成严重影响。在过去几年里,英特尔一直尝试提升每线程分配的平均寄存器数量,但收效并不明显,因此在SNB核芯显卡中,英特尔为每个线程分配120个固定寄存器,从而彻底解决了当寄存器不足时、工作线程难为无米之炊的糟糕状况。
处理单元的多个技术更新让新一代SNB核显处理单元的吞吐量大幅上升,可以达到上一代产品的2倍有余。虽然不同型号的SNB处理器其核显规格有所差异,核芯显卡处理单元的数量亦存在区别(HD Graphics 3000拥有12个处理单元,而HD Graphics 2000则只有6个),但凭借新一代处理单元出色的运算能力和吞吐效率,即便是只有6个处理单元的核显版本,其表现也会比上一代英特尔高清显卡优秀很多。
与Larrabee相比,SNB核显的设计思路可谓云壤之别。Larrabee的关注重心是可编程硬件的扩展应用,而SNB的核心显卡却倾注于固定功能硬件的扩展应用。后者虽然妥协了硬件功能的灵活性,但却在功耗、性能和核心面积上赢得了先机,很显然,这种设计思路更符合英特尔自身的定位。对于Larrabee的胎死腹中,我们不必扼腕叹息,因为SNB和它的核芯显卡(也是英特尔的第六代显示核心产品)更贴合用户的应用需求,也蕴含着更多希望。
多媒体转码/高清视频回放
为了迎合日益增长的高清应用需求,同时进一步巩固自己在该领域的传统优势,英特尔对Sandy Bridge的多媒体性能进行再度强化。
先来看看SNB的多媒体转码特性。大多数视频源都以某种压缩格式编码,而作为终端用户,为了将这些视频与自己的存储设备和播放设备匹配(例如硬盘容量不够,不足以放下大尺寸的高清片源,或是自己的播放设备不支持播放某种格式的视频),则需要对这些视频源进行解码和再编码。而作为一种高负荷的CPU密集运算应用,视频编解码也成为业界衡量处理器性能水平的一项重要标准,而GPU是否能为媒体转码提供必要的加速效果,也从一定程度上决定了用户的使用体验是否美好:实验证明,在没有出色的GPU加速的情况下,单纯用CPU对一段高清视频进行转码需要花掉的时间可能足够你看完一场双加时的NBA季后赛。因此,在GPU中加入固定功能的视频解码器已经成为目前业界的统一手段。
视频转码与播放视频不同,后者只需要对视频进行解码,解码器的工作效率只要高于视频帧率,用户便可获得流畅的播放画面;而前者则需要先对视频源进行解码,并同时进行再编码。因此,硬件加速视频解码引擎的工作效率直接决定了硬件加速视频编码引擎的工作效率。在上一代产品中,视频解码硬件加速功能被拆分到固定功能解码器和GPU的处理单元阵列中,而对于SNB而 言,所有视频解码加速将完全由一个高速解码引擎完成,它被称为Quick Sync快速同步技术。该技术可很好的平衡流数据管线,并支持多数据流和基于帧的任务切换器。在32nm制造工艺提供的高主频和大容NLLC缓存支持下,SNB的高速解码引擎不仅拥有更高的解码效率,并能确保低带宽占用,从而提升带宽利用效率。
事实上,这个解码引擎在编码环节中还会被再度利用。当视频源的帧被逐一解码后即会被分配至核芯显卡的可编程处理单元阵列内等待转码。在媒体加速引擎的帮助下,可编程处理单元可高效处理待转码的数据,包括高质量的视频缩放、降噪过滤、反交错及细节强化过滤等。整个英特尔快速同步引擎便是由快速解码引擎、可编程处理单元阵列和固定功能硬件三部分组成的。
在高效的视频解码引擎支持下,用户利用SNB核芯显卡回放高清视频的体验将是无比流畅的,且CPU资源占用率仍可保持在一个相当低的水平上,便于用户利用SNB出色的性能输出能力在同一时间里完成更多的任务。在SNB核芯显卡的技术规格列表中,英特尔还提到了InTru 3D技术,一项由英特尔和梦工厂在2008年联合开发的3D动画技术。英特尔一直希望通过这项技术在多个平台上推广下一代3D视觉体验,经过两年多的酝酿,现在借助SNB核芯显卡所提供的InTru 3D技术用户便可以在家中观看3D电影了。当然,前提是用户额外购买了支持3D显示的显示器或电视以及3D眼镜。
第几代睿频加速技术
与第一代睿频加速技术相比,SandyBridge提供的第二代睿频加速技术的原理虽然相同,但实际表现更加“睿智”。面对不同的应用环境和任务类型,第二代英特尔睿频加速技术可根据不同的指令类型确定超频幅度,最大化利用TDP冗余量来实现高效性能输出。在平衡性能及功耗时,第二代英特人睿频加速技术的算法也更加智能,处理器的超频幅度相对第一代睿频加速技术而言更大。英特尔对睿频加速的安全性负责,用户既能享受到大幅超频后的高性能快感,又无需担忧硬件损坏。更重要的是,即使处理器工作在多线程模式下,只要TDP存在余量,第二代睿频加速技术即可对多个处理器内核进行智能超频,对于充斥着各类多任务的现代PC应用环境而言,这无疑是令人鼓舞的。
当然,第二代睿频加速技术同样支持对核芯显卡进行超频,且核心频率的提升幅度相当可观,有助于改善核芯显卡在大型3D游戏环境下的性能表现。不过,由于核芯显卡与CPU物理内核共享TDP,因此要将CPU内核与核芯显卡同时超频将增加功耗及发热负担,为了安全起见,英特尔规定在InteLH67芯片组下只能对核芯显卡进行超频,而在P67芯片组下则只能对CPU内核进行睿频加速。这个约束的确略显保守,相信第三方主板厂商将会利用自身的研发实力破除英特尔强加在Sandy Bridge身上的枷锁。
高级矢量扩展指令集
高级矢量扩展指令集的引入可以理解为英特尔和微软两大巨头的再度携手:Sandy Bridge全新加入的高级矢量扩展指令集(Advanced Vector Extensions),不久后即将发布的Windows 7 Service Pack 1中也将对此提供支持。256位的高级矢量扩展指令集类似于用户所熟悉的SSE多媒体扩展指令集,其主要职能是改善处理器的密集型浮点运算能力,可向下兼容SSE,但位宽却提升为之前的两倍(SSE4位宽为128位),理论上其浮点运算效率将提升为之前的两倍。
在高级矢量扩展指令集的支持下,Sandy Bridge处理器在多媒体编码、图形处理等环境下的表现将得到提升,同样获益的还有金融分析、工程建模等科学运算领域。当然,高级矢量扩展指令集需要配合相应的软件环境才能发挥功效。
关于芯片组
与英特尔第二代智能酷睿处理器同期发布还有两款采用全新LGAlL55接口规范的主板芯片组InteLP67和InteLH67。与Lynnfield的主板芯片组命名规则类似,P系列芯片组主要针对游戏玩家,除了不对Sandy Bridge核芯显卡提供显示输出接口外,其与H67最主要的区别在于P67支持双8X多显卡系统(包括交叉火力和SLI),而H67则只能支持单显卡,在第三方主板的支持下,可以实现16X+4X的双显卡多屏显示(但对系统的3D性能并无只管改善)。值得一提的是,所有6系列芯片组均对SATA 36Gbps提供原生支持。
除了H67和P67两款主板芯片组之外,英特尔还陆续推出了H61.B65.Q65和Q67等四款芯片组。从芯片组的命名规则上不难理解,H61和B65是技术规格偏低、面向低端用户和中小企业用户的产品,而Q65和Q67则拥有英特尔主动管理技术,是针对商用环境的产品。下面的表格可助用户区分这几款芯片组的大致规格差异。
相信大家对不久前曝出的英特尔6系列芯片组技术问题已有耳闻。1月31日,英特尔公司对外公布了6系列芯片组存在的技术问题:经英特尔实验室所进行的压力测试发现,6系列芯片组的SATA端口中,2至5号端口的时钟电路部分设计存在一些欠考虑的地方,由于受到时钟电路的基准电路的影响,其中一个晶体管的栅极到漏极之间的低压电阻在受到3.3V+5%(SATA 2.0偏压生成电路)和漏极受到1.05V-5%(SATA 2.0时钟生成器)压差情况下,随着使用时间和温度上升等因素的影响,会有一定几率是低压电阻降级和衰退,导致漏极到栅极的漏电流增加,从而使SATA 2.0偏压生成电路降级,而源级到漏极的正常电流不够,进而导致SATA 2.0时钟生成器降级且不稳定,因此影响这几个SATA端口的性能。
需要说明的是,这个设计问题仅仅会暴露在SATA 2至5号端口上,且压力测试显示在使用3年后也仅会有5%的几率出现该问题。如果用户使用的是SATA 0和SATA 1端口,则该问题将对用户完全没有影响。虽然SATA 2至5端口的设备性能会下降,但也并不会因此损坏硬件(如用户连接的硬盘、光驱等)。尽管如此,本着对消费者和合作伙伴负责的态度,英特尔依然在第一时间发表声明,向业界确认这个潜在问题的存在,并立即回收已经出货的所有芯片组,并承诺对主板厂商进行免费退换。更新后的芯片组将由之前的B2 Stepping升级至B3 Stepping,并已于2月12日开始出货。因为销毁所有B2 Stepping出货产品并对OEM厂商进行赔付,以及近半月的货源真空,英特尔将因此损失逾10亿美元。
也许不少用户依然会担心将来购买的英特尔主板产品会存在上述潜在问题,事实上 这种担忧是完全没有必要的:从该技术问题本身来讲,除了相当低的触发几率外,其影响也并非覆盖所有SATA接口;其次,英特尔已对OEM厂商进行了赔付,并对2011年1月9日至2011年1月31日短短20天内出货的所有B2 Stepping芯片组实施免费退换,OEM厂商也积极配合并推出相应的解决方案。自此之后的所有相关产品将基于B3 Stepping的全新芯片组,所有潜在问题已经得到有效排除,用户可以放心购买使用。
可以看到,英特尔针对此事的响应速度和处理态度都是相当令人满意的。作为业界领军企业,英特尔在此事上所体现出的责任感值得其他厂商学习。
桌面计算平台转折点
多年以来,台式机电脑都是个人用户工作和生活中不可或缺的重要工具,与日俱增的计算性能不仅让PC成为数字办公和数字娱乐的枢纽设备,同时也帮助用户开发出了更多新颖的应用模式。而近年来随着笔记本的平均购置成本逐渐走低,越来越多的用户开始将机动性更强的笔记本作为自己办公娱乐的首选。虽然传统台式机在用户心中的地位早已先入为主,但英特尔的Roadmap却暗示我们移动和小型化才是桌面计算的归宿。
英特尔近几次重要的处理器技术及架构更新,除了继续强调性能表现方面的突破外,更多的重要特性均围绕低能耗和高能效展开。酷睿微体系架构奠定了高效执行机制和智能功耗控制的基调,45纳米及32纳米制造工艺则从材料环节将英特尔处理器产品的节能特性一步步推向高潮。在厂商和媒体的共同努力下,用户的台式机节能意识正在被逐渐唤醒,但相比之下,笔记本节能的迫切和直观程度显然更加突出。一直以来电池续航能力就是仅次于性能(某些情况下甚至凌驾于性能之上)的笔记本核心技术指标,英特尔笔记本平台也凭借在节能和续航方面的巨大优势始终稳坐钓鱼台。而就传统台式机而言,功耗带来的电费开销问题几乎可以被普通用户忽略,散热和静音方面的诉求则可以通过机箱、主板的设计以及散热器的选择来解决,更何况目前的英特尔处理器技术已经在功耗控制上做得相当出色。SandyBridge问世,续写了英特尔处理器在能效表现方面的优良传统,其搭载的新一代核芯显卡则是以此为依托的一把开山利剑。
正如前文所述,小型化是桌面计算平台大势之所趋,而这也并非英特尔在PC小型化上的首次尝试。曾经的准系统、上网机早已因性能和功耗问题夭折(只能怪这先锋的概念生不逢时),而当下火热的一体机概念虽然看上去生机勃勃,但在价格、性能和功耗三者之间纠结不堪亦是不争的事实。在Sandy Bridge到来之前,凌动赢了功耗却输了性能,而第一代英特尔智能酷睿处理器的“核显”技术尚不成熟(不仅制造工艺相对CPU而言落后一代,架构也并非真正意义上的“一芯两核”,而是将GPU和CPU拼合),短板明显:在小型化桌面计算平台中,英特尔新酷睿处理器本身的计算能力和功耗水平足以满足设计和应用需求,但由图形子系统滋生的连锁问题却让厂商和用户陷入了被动。这也正是Sandy Bridge的使命之所在:除了进一步提升系统的智能能效表现之外,正式入驻CPU内核的英特尔核芯显卡亦实现多项重点技术指标的突破,这是英特尔集成类显示核心产品在性能方面首次得以与入门级独显产品分庭抗礼。如果说英特尔集显产品常年以来享有的高市场占有率得益于其整合型主板产品的用户基础,那么此次Sandy Bridge的出现将真正意义上为非独立显卡产品(英特尔相当忌讳我们称其核芯显卡为“集显”)正名。
Larrabee的胎死腹中让英特尔认准了更加正确合理的方向,Sandy Bridge便是个好的开始,而英特尔在桌面计算领域的平台化掌控也初露尊容。传统台式机在SandyBridge及其核芯显卡的“围剿”下将逐渐分化,一部分为了迎合高端游戏玩家将依旧搭载高性能独立显卡,继续他们的耗电之旅;另一部分主流用户则基本上可彻底挥别入门级独立显卡,享受更加紧凑高效的桌面系统。假以时日,现在比比皆是傻大笨粗的ATX机箱将从桌面灭绝,各种一体机和小型PC将成为我们桌面的主人。无论办公娱乐,谁会不希望自己的桌面简洁一些,漂亮一些呢。
数字家庭娱乐新方案
从某种意义上说,Sandy Bridge是专为数字家庭娱乐环境设计的。我们并不否认Sandy Bridge凭借其出色的多任务响应能力和复杂计算效率能为商业用户带来更多帮助,但不得不承认的是,目前商用PC与家用PC的界限正愈发模糊。除了少数特殊行业对PC性能和配置情况有着特定要求(例如3D渲染往往使用带有专业图形卡的工作站),大多数办公用机都与普通家用电脑无异。相比普通商用电脑往往集中于处理数字文档(各类Word,PPT以及Excel表格),家用电脑的应用模式更加丰富,对处理器的性能要求也更加多样化。
在进一步完善自己的高清视频解码性能后,InteLHD Graphics核芯显卡的3D游戏性能和对3D特效的支持也达到了入门级独立显卡的水平,即使在面对《街头霸王4》和《星际争霸2》等大型3D游戏时也能提供令人满意的性能输出——相信我,这个“令人满意”要比前几代集成显卡产品所享有过的形容词货真价实得多。集成显卡的游戏性能向来遭受诸多诟病,大多数用户在集显和独显之间犹豫不决也缘于此。虽然Sandy Bridge为用户提供的核芯显卡依然无法达到中高端独立显卡的性能水平,但它在大型3D游戏环境下所输出的特效和流畅度相比之下已取得长足进步,并可通过超频显卡核心频率来进一步提升游戏性能表现。虽说类似技术在AMD平台上早有支持,且竞争对手相同定位的产品(女HAMD 890GX芯片组所集成的显示核心Radeon HD4290)同样具有较为出色的3D游戏性能,但对于英特尔自身而言,Sandy Bridge核芯显卡算得上是为英特尔集显产品向来的疲软表现画上了句号。英特尔非独显平台游戏性能复苏,对广大英特尔拥趸而言无疑是个好消息,而那些对硬件技术不甚了解、攒机时多参考朋友意见的初级用户,也有更多可能转投阵营。
在没有独立显卡掺和的时候,用户不必拘泥于硕大的ATX机箱,而可以选择更为小巧的HTPC机箱,这便是我们俗称的迷你电脑;而Sandy Bridge核芯显卡的游戏性能的提升,让放置客厅的迷你电脑也可在游戏领域有所作为。不过,经我们测试,Sandy Bridge核芯显卡在高分辨率尤其是富HD下的游戏表现差强人意,因此用户如果希望自己的游戏屏幕是家中的高清电视,则需要在分辨率和游戏画质上做出一定妥协。
能耗更低,效率更高,适应范围更广英特尔Sandy Bridge处理器将激活搁置多年的迷你电脑方案,为用户的数字家庭娱乐环 境提供更多可能性和选择空间,当然,这也得依仗与主板厂商的密切配合。Mini-ITX主板方兴未艾,在Sandy Bridge的强力支援下,相信此次迷你电脑能够避免当初上网机和HTPC曾面临的窘境,一路顺风顺水走下去。
也谈接Ⅱ规范再变更
Sandy Bridge处理器采用LGA1155接口封装,上一代LGA1156接口则会逐渐淡出视野,这对于近两年才攒机的用户而言显然不是一个好消息。两年内三次更新处理器接口规范,这种近乎偏执狂的做法虽难以接受,却也可以理解。
08年的Bloomfield处理器经历了数次价格调整,目前已基本上淡出了中高端用户的视线,但以至尊版Core i7 Extreme处理器和InteLX58芯片组为主体的英特尔旗舰级平台依旧是目前英特尔桌面的性能王者;相比之下,于09年至10年之间购买了LGA1156接口的Lynnfield处理器和Clarkdale处理器的用户就很难找到安慰自己的理由了。基于Sandy B ridge架构的第二代新酷睿处理器与酷睿处理器(Nehalem架构的Lynnfield核心)和第一代新酷睿处理器(Westmere架构的Clarkdale核心)同为定位于主流市场的主打产品,然而在不到一年的时间里,后两者就先后由聚光灯下的明星产品沦为昨日黄花。Sandy Bridge的问世,让为Lynnfield和Clarkdale买单的消费者不爽,不过正如前文所述,英特尔产品线更新速度虽然略显激进,但也的确是芯片巨头稳固自身战略地位的一种必然行为;而消费者的眼光也应更远一些,等待你们的将是三、四年后更加成熟的一代产品。
首先,用户的消费能力和消费观念不尽相同,因此用户更新和升级设备的步调也并非一致。虽然我无法准确计算出不同用户采购设备的时间差,但显然这个时间差可以为英特尔每年更新的产品线提供足以消化的消费力。另一方面,每次升级处理器制造工艺及研发新一代处理器架构的投入成本都是惊人的,这些成本需要尽可能转化为收益才不至于让每年的财务报表过于难看,下游的系统类厂商和配件类厂商亦出于同样的考虑。作为行业领袖,英特尔的一举一动可谓牵一发而动全身,因此我们看到的不仅仅是处理器的频繁换代,随之而来的还有主板、笔记本、台式机等等的更新换代。技术在进步,并不代表每一代产品都足够成熟,对此你我都有深刻体会,但厂商无法为了一个相比之下更为“完美”的产品而空空等待研发进度。在两个相对成熟的产品之间总会有一些过渡产品节点,而这些过渡节点也总会有消费者自觉占据,这也许就是所谓的产业生态吧。
Sandy Bridge性能测试
为了让您更好的了解Sandy Bridge系列处理器在性能上的提升。我们选择了i7 2720M、i5 2520M、i5 2410M、i3 2310M进行了性能测试,进行对比的是上一代的i7 740M、i5540M、i5 460M、i3 370M处理器。测试时我们选择了SYSmark 2007、PCMark Vantage、3Dmark 06进行标准的Benchmark性能测试,同时我们也选择了一些常用的应用软件未衡量两代处理器之间的性能差异。
SYSmark 2007
熟悉这套软件的读者都知道,SYSmark是一种使用实际应用程序,模拟真实工作场景的测试软件。在这方面,SYSmark将场景数量从2004版的两个(Internet Content Creation和Office Productivity)增加到了四个——E-Lea rning,Office Productivity,VideoContent和3D Modeling,其中使用应用软件也自然进行了调整——有些是升级到更新的版本,有些则是增加了时下流行的新软件。
下面,我们首先列出这四个场景的具体分工和使用到的相应的软件和版本细节:
E-Learning
这个场景使用一系列软件将丰富的图像、视频和音频内容集成到一个Web页面中,展示了在线教学内容的创作过程。它涉及到的应用程序包括:
Adobe Illustrator CS2
Adobe Photoshop CS2
Macromedia Flash 8
Microsoft PowerPoint 2003
Video Creation
这个场景再现了将各种赖源的素材制作成视频,并加入丰富的特效的过程。而且,这一过程不仅包含适合在线播放的流媒体内容的制作,也包含通常是下载播放的高清内容的制作。它用的软件包括:
Adobe After Effects 7
Adobe Illustrator CS2
Adobe Photoshop CS2
Microsoft Windows Media Encoder9系列
Sony Vegas 7
3D Modeling
只要看看这个场景的用到的软件,我们就能知道它的用途所在。它所再现的是一个建筑设计项目的模型建立过程。它包含的软件有:
AutoDesk 3ds Max 8
SketchUp 5
从上面提到的信息不难看出,相比2004版,SYSmark 2007的场景更加细化,所采用的软件也更具针对性。在2004版中,BAPco实际是按软件所针对的应用将其划分成两类,然后在针对这些软件编制相应的脚本,显然,这种以软件功能为核心的做法有可能与用户的实际应用情况脱节,或者缺乏针对性。
反观SYSmark 2007.则采取了更为以用户应用为核心的策略。例如,同样是PowerPoint2003.它既出现在Office Productivity,也出现在E-Learning场景中;同样是AdobePhotoshop CS2和Adobe Illustrator CS2.它既出现在E—Learning,也出现在VideoCreation场景中。因为虽然应用不同,但是在用户的真实操作过程中都会用到这些相同的软件。
此外,以应用为核心,涉及多个应用软件的另一个好处就是能够充分反映用户实际工作中通常采用的多任务并行的模式,也能更加充分地展现出已经成为主流的双核甚至多核系统的优势。
PCMark Vantage
PCMark Vantage仅可用于针对WindowsVista系统,它提供了更加易用的一键测试功能和桌面、移动、工作站平台统一化的测试脚本,是基于Windows Vista的系统测试软件。
PCMark Vantage可以衡量各种类型PC的综合性能。从多媒体家庭娱乐系统到笔记本, 从专业工作站到高端游戏平台,无论是在专业人士手中,还是属于普通用户,都能通过PCMa rk Vantage了解系统性能,测试内容可以分为以下三个部分:
处理器测试
基于数据加密、解密、压缩、解压缩、图形处理、音频和视频转码、文本编辑、网页渲染、邮件功能、处理器人工智能游戏测试、联系人创建与搜索。
图形测试
基于高清视频播放、显卡图形处理、游戏测试。
硬盘测试
使用Windows Defender、《AlanWake》游戏、图像导入、Windows Vista启动、视频编辑、媒体中心使用、WindowsMedia Player搜索和归类,以及以下程序的启动:Office Word 2007、AdobePhotoshop CS2、Internet Explorer、Outlook 2007。
PCMark Vantage分为四个版本:基础试用版,只能使用一次,免费提供;基础版,提供PCMark得分和在线分数浏览器(ORB),不限制运行次数,测试结果不得用于商业目的;高级版,可运行所有套装,并有高级在线服务,测试结果不得用于商业目的;专业版,仅限商业用户,提供全部功能设置、技术支持,查看测试结果无需联网,可在命令行模式下测试,结果可导入微软Excel,给予全面商业授权。
PCMark Vantage的最低系统需求
处理器:InteLPentium 4或AMD同等级型号,支持SSE2指令集。
显卡:兼容Shader ModeL2.0.256MB显存,GPU图形处理测试需要Shader ModeI3.0。
硬盘:1-7GB空闲空间,NTFS分区格式。
内存:1GB
操作系统:Windows Vista旗舰版、家庭高级版、家庭基础版、企业版、商业版,32/64位均可(安装时可选64位)。
3DMark06
3DMark是FutureMark公司出品的3D图形性能基准测试工具,具有悠久的历史,迄今已成为业界标准之一。3DMa rk06主要使用较新的游戏技术衡量DirectX 9级别的3D硬件。此前的3DMark都是随着新版DirectX和新一代硬件的发布而推出,在一定程度上限制了3DMark对最新硬件性能的充分挖掘。现在,该级别的硬件已经遍布高中低各个领域,因此3DMark06可以完全利用DirectX 9的特性。事实上,3DMark06所有测试都需要支持SM3.0的DirectX 9硬件,不过只支持SM2.x的硬件也可以运行大部分测试。
3DMark06特点
两个HDR/SM3.0测试:需要Dire ctX 9级别硬件且支持SM3.0、16-bit浮点纹理和16-bit浮点混合;
两个SM2.0测试:需要DirectX 9级别硬件且完全支持SM2.0;
两个全新CPU测试:均支持多线程、多核心处理器,需要DirectX 9级别硬件且完全支持SM2.0
纹理测试:集中考察显卡的关键性能;
可根据需要进行多种不同范围的测试设置;
一个基于CPU测试的小游戏:使用游戏引擎的CPU测试场景。
通过使用3DMarko6及其测试结果在线比较服务,用户可以获得:
3DMark得分:电脑3D性能的衡量标尺;
SM2.0得分:电脑ShaderModeL2.0性能的衡量标尺;
HDR/SM 3.O得分:电脑HDR和ShaderModeL3.0性能的衡量标尺;
CPU得分:电脑处理器性能的衡量标尺;
与全球各地的最新电脑进行性能对比;
为用户硬件升级提供指导。
Apps应用程序测试
WinZip测试是将一段MPEG2文件压缩为zip包并记录所用时间,成绩单位为秒,用时越少越好。Photoshop CS5测试是在基准测试用图片上进行RadiaLBlur,用时越少越好。Aimersoft iPhone VC、iTunes、TMPEG4、YuanFan、MediaShow Espresso都是视频格式转换测试,成绩单位为秒。
细细想来,无论架构如何调整,制造工艺如何进化,主频依然是处理器发展最为明朗的主线;在摩尔定律的支持下,英特尔始终把“更高的主频”作为下一个发展目标,而先进的处理器微体系架构和制造工艺则是保证处理器在高主频工作状态下依旧保持良好效能的先决条件。任何等级的超频大赛都是以挑战更高处理器主频为主题,当“全民超频”的概念逐渐普及之时,英特尔则依靠更加智能的微体系架构设计来为用户提供更加简单安全的处理器超频特性。SandyBridge的到来,应该算是解决了英特尔遗留近十年的“高主频问题”,在32nm制造工艺和新一代微体系架构的辅佐下,SandyBridge处理器仅通过第二代睿频加速技术即可将主频达到3.8GH z,依靠风冷散热器可轻松突破4.5GHz,更可进一步向5GHz发起冲击——在如此高主频状态下依然可保证良好的功耗控制能力,这一点的确难能可贵。更令人欣喜的是,传统的处理器性能提升绝不是Sandy Bridge唯一的亮点:不是说消费者对参数不感冒,他们只相信自己的眼睛么?Sandy Bridge带来的正是一次前所未有的视觉大餐。
架构变化
2006年英特尔推出酷睿微体系架构,让高耗低能的NetBurst彻底作古,被看作是近年来英特尔平台最大的一次架构革新。此后无论Nehalem还是Westmere都是以酷睿微体系架构为蓝本进行细节调整,“增强型酷睿微体系架构“由此得名。尽管Westmere已经提供了处理器内置高清显卡,但采用独立封装的GPU核心并非完全融入CPU之中,而依旧沿用英特尔在产品过渡期惯用的”胶水工艺“,更何况第一代高清显卡的性能水平只能勉强与主板芯片组集成显卡持平,因此无论从技术角度还是实战体验上,Westmere均无法获得令人满意的分数。携英特尔第二代高清显卡翩然而至的SandyBridge让情况有所改观。
与Westmere将采用45nm制造工艺的GPU独立封装不同,Sandy Bridge是实实在在的32nm处理器——无论CPU还是GPU均采用32nm制造工艺,且完全封装于同一颗芯片上,真正实现了处理器和显卡的融合,这也是业界首创。虽然Sandy Bridge将CPU与GPU完美融合,但GPU依然拥有自己独立的时钟频率和功耗调控机制,任何与GPU相关的节能或超频行为都是独立于CPU进行的,且与Westmere相比,Sandy Bridge高清显卡的超频幅度要高很多。
原有的L3高速缓存被更名为LLC最末级缓存,并由所有CPU内核及高清显卡内核共享,任何单元都可访问LLC中的任何数据,这也从另一个角度诠释了Sandy Bridge是如何将CPU与GPU完美融合的。为了提高LLC读写效率,英特尔为Sandy Bridge加入了一个先进的环形总线,这与之前Nehalem/We~mem处理器各个物理内核享有独立的L3缓存访问通道大相径庭。后者的设计虽然对L3访问效率并没有致命影响,但当处理器结构变得更加复杂(例如将更多的功能模块加入到处理器中)、有更多的单元需要访问L3缓存时,这种独立通道设计的弊端就暴露无遗——它将大幅增加处理器内部线路设计的复杂性,亦增添了设计开发成本。从这一点看,环形总线的意义类似于当初被媒体热炒的Nehalem可扩展架构——更加灵活,更加高效。
事实上,Sandy Bridge的环形总线架构与Nehalem-EX/Westmere-EX至强处理器所采用的技术相同,每一份LLC缓存、高清显卡、多媒体引擎以及System Agent(即原北桥芯片组)都分别享有一个环形总线节点。环形总线共分为四条独立总线,分别是数据环线、请求环线、响应环线和侦听环线,每条环线上的每个节点在一个时钟周期内可接收32字节数据,当核心数量和缓存容量增加时,缓存的带宽也会相应扩展,且环形总线会自动选择最短路径完成访问从而降低访问延迟。因此,环形总线架构对于多核心、多处理器平台扩展有着至关重要的意义。
除了L3缓存更名为LLC缓存,英特尔还将之前的“非核心”部分更名为SystemAgent,且不包含LLC缓存。LLC缓存的工作频率将与处理器内核保持一致,其延迟也由Westmere的36个周期下降为2至31个周期,具体延迟数根据不同核心访问不同位置LLC缓存而定。由于LLC工作频率与处理器内核保持一致,当处理器因节能而降频时,LLCI作频率也会随之下降,这对于GPU核心访问LLC缓存而言的确不利。
正如上文所述,为了便于环形总线工作,Sandy B ridge根据处理器内核数量将LLC缓存划分为相应的份数,在SandyBridge问世之初我们曾经质疑过这种做法是否会影响LLC缓存的利用率,所幸的是这种担心是多余的。虽然LLC缓存被分别划分给了每个处理器内核,但每个处理器内核却可以通过环形总线访问整个LLC缓存——得益于每份LLC缓存均享有一个环形总线节点和一个独立的缓存流水线,这比Westmere中所有处理器内核均请求同一个缓存流水线和队列的情况要先进得多。
核芯显卡
Sandy Bridge相对于Westmere的最大改进并不在于处理器性能,高清显卡性能的提升才是Sandy Bridge的最大卖点。毕竟要想让那一部分用户忘记独立显卡转投英特尔高清显卡阵营,单凭借Westmere的45nm 双芯片封装GPU是很难实现的。虽说SandyBridge那完全融合于CPU的32nm高清显卡依然无法对中高端独立显卡构成任何威胁,但已经媲美中低端独立显卡水平的性能表现和相对于独显而言毋庸置疑的能耗优势势必将开启“非独立显卡”的新篇章。
Sandy Bridge核心显卡拥有LLC缓存的独立访问权,这是Sandy Bridge核芯显卡区别于上代产品的重中之重。与过去的集成显卡解决方案相比,SNB核芯显卡无需再向内
Sandy Bridge命名规则
作为业界首款实现CPU和GPU完美融合的处理器产品,英特尔第二代智能酷睿处理器家族的发布是空前盛大的,亮相新品的数量级亦是过去历届新品发布所无法比拟的:15款移动处理器、14款桌面处理器共计29款全新c PU悉数登场,暴风骤雨般席卷OEM和零售市场。
相信你也一定猜到,如此众多的处理器势必将掀起新一轮的“型号谜团”——英特尔向来无法做到浅显易读的处理器命名规则和规格区分,这意味着用户在采购前又需要对处理器的型号和细节技术规格进行一番恶补。下面的文字虽然不足以对这29款处理器进行详尽的规格参数介绍,但却可以帮助用户迅速区分它们的规格差异和定位偏好。
定位于高端用户群的Core i7处理器将拥有至少4个物理核心,而主流及中高端定位的Corei5处理器根据具体定位不同而划分为4核和双核的版本,定位稍低的Core i3处理器则完全基于双核架构。下面的表格对这29款处理器的主要技术参数进行了罗列展示,请大家参考。
可以看到,处理器品牌标识并未改变,依旧采用Core i7/i5/_3.但型号由之前的3位数变为4位数,均以数字2开头,表明此为第二代智能酷睿处理器,处理器型号末端的字母则表明该处理器隶属的产品系列。例如大家所熟悉的字母K,代表不锁倍频版本,可由用户随意超频。由于部分Sandy Bridge处理器的主频将被完全锁死,因此对于超频玩家和用户而言,K系列处理器意义重大。
除此之外,桌面级处理器还增添了T系列和s系列,在上文的表格中已经清楚标明。这些处理器主要针对OEMU商,用于定制体积更小、更加省电的小型Pc产品(例如我们介绍过的迷你电脑)。其中s表示“性能优化”,与同为65W TDP的产品相比主频相对较低:而T则表示“节能优化”,与同为35W或45W TDP的产品相比主频相对较低。
移动平台的第二代智能酷睿处理器的型号就略微复杂一些了。虽然尾端字母与之前并无区别:xM表示至尊版型号,QM表示四核型号,而M则表示普通双核型号,但其他技术规格如主频、睿频加速、缓存容量和核芯显卡参数等全部由产品型号中的4位数字进行区分,且可循规律几乎为零,因此用户除了生硬的对照记忆之外怕是没有别的捷径可求了。存请求缓存数据,而是可以直接访问处理器的LLC缓存,不仅大大节省了通信时间,同时也为处理器整体节能带来利好。核芯显卡的LLC缓存利用规则完全由显卡驱动控制,包括寄存的数据和核芯显卡可利用的LLC缓存容量等。也许在消费者看来,统一了制造工艺后将32nm核芯显卡完全融入CPU、并使之可以全权访问LLC缓存是件理所当然的事,但事实上对于英特尔而言,重新设计核芯显卡并使之可自由访问LLC缓存并不容易,比起NVIDIA重新设计GF100显示核心的复杂程度有过之而无不及。
当然,SNB核芯显卡的技术改良并不仅限于此,新一代EU处理单元对多个技术环节进行了调整。每个处理单元抓取多线程指令的能力大幅提升,而DirectX 10 API指令与内部ISA映射的一一对应则可有效提升处理单元宽度,IPC也得到相应提升。EU还可以对包括正余弦运算在内的抽象代数运算提供硬件支持,其运算效率亦较前代产品实现较大提升。
在英特尔过去的显示核心架构中,寄存器采用即时分配原则,当某个线程对寄存器的需求并不迫切时,剩余的寄存器可被分配给其他线程。这种做法虽然可以有效节省核心面积,但更多情况下却会因为线程无法调用空闲寄存器而对显示核心的性能构成严重影响。在过去几年里,英特尔一直尝试提升每线程分配的平均寄存器数量,但收效并不明显,因此在SNB核芯显卡中,英特尔为每个线程分配120个固定寄存器,从而彻底解决了当寄存器不足时、工作线程难为无米之炊的糟糕状况。
处理单元的多个技术更新让新一代SNB核显处理单元的吞吐量大幅上升,可以达到上一代产品的2倍有余。虽然不同型号的SNB处理器其核显规格有所差异,核芯显卡处理单元的数量亦存在区别(HD Graphics 3000拥有12个处理单元,而HD Graphics 2000则只有6个),但凭借新一代处理单元出色的运算能力和吞吐效率,即便是只有6个处理单元的核显版本,其表现也会比上一代英特尔高清显卡优秀很多。
与Larrabee相比,SNB核显的设计思路可谓云壤之别。Larrabee的关注重心是可编程硬件的扩展应用,而SNB的核心显卡却倾注于固定功能硬件的扩展应用。后者虽然妥协了硬件功能的灵活性,但却在功耗、性能和核心面积上赢得了先机,很显然,这种设计思路更符合英特尔自身的定位。对于Larrabee的胎死腹中,我们不必扼腕叹息,因为SNB和它的核芯显卡(也是英特尔的第六代显示核心产品)更贴合用户的应用需求,也蕴含着更多希望。
多媒体转码/高清视频回放
为了迎合日益增长的高清应用需求,同时进一步巩固自己在该领域的传统优势,英特尔对Sandy Bridge的多媒体性能进行再度强化。
先来看看SNB的多媒体转码特性。大多数视频源都以某种压缩格式编码,而作为终端用户,为了将这些视频与自己的存储设备和播放设备匹配(例如硬盘容量不够,不足以放下大尺寸的高清片源,或是自己的播放设备不支持播放某种格式的视频),则需要对这些视频源进行解码和再编码。而作为一种高负荷的CPU密集运算应用,视频编解码也成为业界衡量处理器性能水平的一项重要标准,而GPU是否能为媒体转码提供必要的加速效果,也从一定程度上决定了用户的使用体验是否美好:实验证明,在没有出色的GPU加速的情况下,单纯用CPU对一段高清视频进行转码需要花掉的时间可能足够你看完一场双加时的NBA季后赛。因此,在GPU中加入固定功能的视频解码器已经成为目前业界的统一手段。
视频转码与播放视频不同,后者只需要对视频进行解码,解码器的工作效率只要高于视频帧率,用户便可获得流畅的播放画面;而前者则需要先对视频源进行解码,并同时进行再编码。因此,硬件加速视频解码引擎的工作效率直接决定了硬件加速视频编码引擎的工作效率。在上一代产品中,视频解码硬件加速功能被拆分到固定功能解码器和GPU的处理单元阵列中,而对于SNB而 言,所有视频解码加速将完全由一个高速解码引擎完成,它被称为Quick Sync快速同步技术。该技术可很好的平衡流数据管线,并支持多数据流和基于帧的任务切换器。在32nm制造工艺提供的高主频和大容NLLC缓存支持下,SNB的高速解码引擎不仅拥有更高的解码效率,并能确保低带宽占用,从而提升带宽利用效率。
事实上,这个解码引擎在编码环节中还会被再度利用。当视频源的帧被逐一解码后即会被分配至核芯显卡的可编程处理单元阵列内等待转码。在媒体加速引擎的帮助下,可编程处理单元可高效处理待转码的数据,包括高质量的视频缩放、降噪过滤、反交错及细节强化过滤等。整个英特尔快速同步引擎便是由快速解码引擎、可编程处理单元阵列和固定功能硬件三部分组成的。
在高效的视频解码引擎支持下,用户利用SNB核芯显卡回放高清视频的体验将是无比流畅的,且CPU资源占用率仍可保持在一个相当低的水平上,便于用户利用SNB出色的性能输出能力在同一时间里完成更多的任务。在SNB核芯显卡的技术规格列表中,英特尔还提到了InTru 3D技术,一项由英特尔和梦工厂在2008年联合开发的3D动画技术。英特尔一直希望通过这项技术在多个平台上推广下一代3D视觉体验,经过两年多的酝酿,现在借助SNB核芯显卡所提供的InTru 3D技术用户便可以在家中观看3D电影了。当然,前提是用户额外购买了支持3D显示的显示器或电视以及3D眼镜。
第几代睿频加速技术
与第一代睿频加速技术相比,SandyBridge提供的第二代睿频加速技术的原理虽然相同,但实际表现更加“睿智”。面对不同的应用环境和任务类型,第二代英特尔睿频加速技术可根据不同的指令类型确定超频幅度,最大化利用TDP冗余量来实现高效性能输出。在平衡性能及功耗时,第二代英特人睿频加速技术的算法也更加智能,处理器的超频幅度相对第一代睿频加速技术而言更大。英特尔对睿频加速的安全性负责,用户既能享受到大幅超频后的高性能快感,又无需担忧硬件损坏。更重要的是,即使处理器工作在多线程模式下,只要TDP存在余量,第二代睿频加速技术即可对多个处理器内核进行智能超频,对于充斥着各类多任务的现代PC应用环境而言,这无疑是令人鼓舞的。
当然,第二代睿频加速技术同样支持对核芯显卡进行超频,且核心频率的提升幅度相当可观,有助于改善核芯显卡在大型3D游戏环境下的性能表现。不过,由于核芯显卡与CPU物理内核共享TDP,因此要将CPU内核与核芯显卡同时超频将增加功耗及发热负担,为了安全起见,英特尔规定在InteLH67芯片组下只能对核芯显卡进行超频,而在P67芯片组下则只能对CPU内核进行睿频加速。这个约束的确略显保守,相信第三方主板厂商将会利用自身的研发实力破除英特尔强加在Sandy Bridge身上的枷锁。
高级矢量扩展指令集
高级矢量扩展指令集的引入可以理解为英特尔和微软两大巨头的再度携手:Sandy Bridge全新加入的高级矢量扩展指令集(Advanced Vector Extensions),不久后即将发布的Windows 7 Service Pack 1中也将对此提供支持。256位的高级矢量扩展指令集类似于用户所熟悉的SSE多媒体扩展指令集,其主要职能是改善处理器的密集型浮点运算能力,可向下兼容SSE,但位宽却提升为之前的两倍(SSE4位宽为128位),理论上其浮点运算效率将提升为之前的两倍。
在高级矢量扩展指令集的支持下,Sandy Bridge处理器在多媒体编码、图形处理等环境下的表现将得到提升,同样获益的还有金融分析、工程建模等科学运算领域。当然,高级矢量扩展指令集需要配合相应的软件环境才能发挥功效。
关于芯片组
与英特尔第二代智能酷睿处理器同期发布还有两款采用全新LGAlL55接口规范的主板芯片组InteLP67和InteLH67。与Lynnfield的主板芯片组命名规则类似,P系列芯片组主要针对游戏玩家,除了不对Sandy Bridge核芯显卡提供显示输出接口外,其与H67最主要的区别在于P67支持双8X多显卡系统(包括交叉火力和SLI),而H67则只能支持单显卡,在第三方主板的支持下,可以实现16X+4X的双显卡多屏显示(但对系统的3D性能并无只管改善)。值得一提的是,所有6系列芯片组均对SATA 36Gbps提供原生支持。
除了H67和P67两款主板芯片组之外,英特尔还陆续推出了H61.B65.Q65和Q67等四款芯片组。从芯片组的命名规则上不难理解,H61和B65是技术规格偏低、面向低端用户和中小企业用户的产品,而Q65和Q67则拥有英特尔主动管理技术,是针对商用环境的产品。下面的表格可助用户区分这几款芯片组的大致规格差异。
相信大家对不久前曝出的英特尔6系列芯片组技术问题已有耳闻。1月31日,英特尔公司对外公布了6系列芯片组存在的技术问题:经英特尔实验室所进行的压力测试发现,6系列芯片组的SATA端口中,2至5号端口的时钟电路部分设计存在一些欠考虑的地方,由于受到时钟电路的基准电路的影响,其中一个晶体管的栅极到漏极之间的低压电阻在受到3.3V+5%(SATA 2.0偏压生成电路)和漏极受到1.05V-5%(SATA 2.0时钟生成器)压差情况下,随着使用时间和温度上升等因素的影响,会有一定几率是低压电阻降级和衰退,导致漏极到栅极的漏电流增加,从而使SATA 2.0偏压生成电路降级,而源级到漏极的正常电流不够,进而导致SATA 2.0时钟生成器降级且不稳定,因此影响这几个SATA端口的性能。
需要说明的是,这个设计问题仅仅会暴露在SATA 2至5号端口上,且压力测试显示在使用3年后也仅会有5%的几率出现该问题。如果用户使用的是SATA 0和SATA 1端口,则该问题将对用户完全没有影响。虽然SATA 2至5端口的设备性能会下降,但也并不会因此损坏硬件(如用户连接的硬盘、光驱等)。尽管如此,本着对消费者和合作伙伴负责的态度,英特尔依然在第一时间发表声明,向业界确认这个潜在问题的存在,并立即回收已经出货的所有芯片组,并承诺对主板厂商进行免费退换。更新后的芯片组将由之前的B2 Stepping升级至B3 Stepping,并已于2月12日开始出货。因为销毁所有B2 Stepping出货产品并对OEM厂商进行赔付,以及近半月的货源真空,英特尔将因此损失逾10亿美元。
也许不少用户依然会担心将来购买的英特尔主板产品会存在上述潜在问题,事实上 这种担忧是完全没有必要的:从该技术问题本身来讲,除了相当低的触发几率外,其影响也并非覆盖所有SATA接口;其次,英特尔已对OEM厂商进行了赔付,并对2011年1月9日至2011年1月31日短短20天内出货的所有B2 Stepping芯片组实施免费退换,OEM厂商也积极配合并推出相应的解决方案。自此之后的所有相关产品将基于B3 Stepping的全新芯片组,所有潜在问题已经得到有效排除,用户可以放心购买使用。
可以看到,英特尔针对此事的响应速度和处理态度都是相当令人满意的。作为业界领军企业,英特尔在此事上所体现出的责任感值得其他厂商学习。
桌面计算平台转折点
多年以来,台式机电脑都是个人用户工作和生活中不可或缺的重要工具,与日俱增的计算性能不仅让PC成为数字办公和数字娱乐的枢纽设备,同时也帮助用户开发出了更多新颖的应用模式。而近年来随着笔记本的平均购置成本逐渐走低,越来越多的用户开始将机动性更强的笔记本作为自己办公娱乐的首选。虽然传统台式机在用户心中的地位早已先入为主,但英特尔的Roadmap却暗示我们移动和小型化才是桌面计算的归宿。
英特尔近几次重要的处理器技术及架构更新,除了继续强调性能表现方面的突破外,更多的重要特性均围绕低能耗和高能效展开。酷睿微体系架构奠定了高效执行机制和智能功耗控制的基调,45纳米及32纳米制造工艺则从材料环节将英特尔处理器产品的节能特性一步步推向高潮。在厂商和媒体的共同努力下,用户的台式机节能意识正在被逐渐唤醒,但相比之下,笔记本节能的迫切和直观程度显然更加突出。一直以来电池续航能力就是仅次于性能(某些情况下甚至凌驾于性能之上)的笔记本核心技术指标,英特尔笔记本平台也凭借在节能和续航方面的巨大优势始终稳坐钓鱼台。而就传统台式机而言,功耗带来的电费开销问题几乎可以被普通用户忽略,散热和静音方面的诉求则可以通过机箱、主板的设计以及散热器的选择来解决,更何况目前的英特尔处理器技术已经在功耗控制上做得相当出色。SandyBridge问世,续写了英特尔处理器在能效表现方面的优良传统,其搭载的新一代核芯显卡则是以此为依托的一把开山利剑。
正如前文所述,小型化是桌面计算平台大势之所趋,而这也并非英特尔在PC小型化上的首次尝试。曾经的准系统、上网机早已因性能和功耗问题夭折(只能怪这先锋的概念生不逢时),而当下火热的一体机概念虽然看上去生机勃勃,但在价格、性能和功耗三者之间纠结不堪亦是不争的事实。在Sandy Bridge到来之前,凌动赢了功耗却输了性能,而第一代英特尔智能酷睿处理器的“核显”技术尚不成熟(不仅制造工艺相对CPU而言落后一代,架构也并非真正意义上的“一芯两核”,而是将GPU和CPU拼合),短板明显:在小型化桌面计算平台中,英特尔新酷睿处理器本身的计算能力和功耗水平足以满足设计和应用需求,但由图形子系统滋生的连锁问题却让厂商和用户陷入了被动。这也正是Sandy Bridge的使命之所在:除了进一步提升系统的智能能效表现之外,正式入驻CPU内核的英特尔核芯显卡亦实现多项重点技术指标的突破,这是英特尔集成类显示核心产品在性能方面首次得以与入门级独显产品分庭抗礼。如果说英特尔集显产品常年以来享有的高市场占有率得益于其整合型主板产品的用户基础,那么此次Sandy Bridge的出现将真正意义上为非独立显卡产品(英特尔相当忌讳我们称其核芯显卡为“集显”)正名。
Larrabee的胎死腹中让英特尔认准了更加正确合理的方向,Sandy Bridge便是个好的开始,而英特尔在桌面计算领域的平台化掌控也初露尊容。传统台式机在SandyBridge及其核芯显卡的“围剿”下将逐渐分化,一部分为了迎合高端游戏玩家将依旧搭载高性能独立显卡,继续他们的耗电之旅;另一部分主流用户则基本上可彻底挥别入门级独立显卡,享受更加紧凑高效的桌面系统。假以时日,现在比比皆是傻大笨粗的ATX机箱将从桌面灭绝,各种一体机和小型PC将成为我们桌面的主人。无论办公娱乐,谁会不希望自己的桌面简洁一些,漂亮一些呢。
数字家庭娱乐新方案
从某种意义上说,Sandy Bridge是专为数字家庭娱乐环境设计的。我们并不否认Sandy Bridge凭借其出色的多任务响应能力和复杂计算效率能为商业用户带来更多帮助,但不得不承认的是,目前商用PC与家用PC的界限正愈发模糊。除了少数特殊行业对PC性能和配置情况有着特定要求(例如3D渲染往往使用带有专业图形卡的工作站),大多数办公用机都与普通家用电脑无异。相比普通商用电脑往往集中于处理数字文档(各类Word,PPT以及Excel表格),家用电脑的应用模式更加丰富,对处理器的性能要求也更加多样化。
在进一步完善自己的高清视频解码性能后,InteLHD Graphics核芯显卡的3D游戏性能和对3D特效的支持也达到了入门级独立显卡的水平,即使在面对《街头霸王4》和《星际争霸2》等大型3D游戏时也能提供令人满意的性能输出——相信我,这个“令人满意”要比前几代集成显卡产品所享有过的形容词货真价实得多。集成显卡的游戏性能向来遭受诸多诟病,大多数用户在集显和独显之间犹豫不决也缘于此。虽然Sandy Bridge为用户提供的核芯显卡依然无法达到中高端独立显卡的性能水平,但它在大型3D游戏环境下所输出的特效和流畅度相比之下已取得长足进步,并可通过超频显卡核心频率来进一步提升游戏性能表现。虽说类似技术在AMD平台上早有支持,且竞争对手相同定位的产品(女HAMD 890GX芯片组所集成的显示核心Radeon HD4290)同样具有较为出色的3D游戏性能,但对于英特尔自身而言,Sandy Bridge核芯显卡算得上是为英特尔集显产品向来的疲软表现画上了句号。英特尔非独显平台游戏性能复苏,对广大英特尔拥趸而言无疑是个好消息,而那些对硬件技术不甚了解、攒机时多参考朋友意见的初级用户,也有更多可能转投阵营。
在没有独立显卡掺和的时候,用户不必拘泥于硕大的ATX机箱,而可以选择更为小巧的HTPC机箱,这便是我们俗称的迷你电脑;而Sandy Bridge核芯显卡的游戏性能的提升,让放置客厅的迷你电脑也可在游戏领域有所作为。不过,经我们测试,Sandy Bridge核芯显卡在高分辨率尤其是富HD下的游戏表现差强人意,因此用户如果希望自己的游戏屏幕是家中的高清电视,则需要在分辨率和游戏画质上做出一定妥协。
能耗更低,效率更高,适应范围更广英特尔Sandy Bridge处理器将激活搁置多年的迷你电脑方案,为用户的数字家庭娱乐环 境提供更多可能性和选择空间,当然,这也得依仗与主板厂商的密切配合。Mini-ITX主板方兴未艾,在Sandy Bridge的强力支援下,相信此次迷你电脑能够避免当初上网机和HTPC曾面临的窘境,一路顺风顺水走下去。
也谈接Ⅱ规范再变更
Sandy Bridge处理器采用LGA1155接口封装,上一代LGA1156接口则会逐渐淡出视野,这对于近两年才攒机的用户而言显然不是一个好消息。两年内三次更新处理器接口规范,这种近乎偏执狂的做法虽难以接受,却也可以理解。
08年的Bloomfield处理器经历了数次价格调整,目前已基本上淡出了中高端用户的视线,但以至尊版Core i7 Extreme处理器和InteLX58芯片组为主体的英特尔旗舰级平台依旧是目前英特尔桌面的性能王者;相比之下,于09年至10年之间购买了LGA1156接口的Lynnfield处理器和Clarkdale处理器的用户就很难找到安慰自己的理由了。基于Sandy B ridge架构的第二代新酷睿处理器与酷睿处理器(Nehalem架构的Lynnfield核心)和第一代新酷睿处理器(Westmere架构的Clarkdale核心)同为定位于主流市场的主打产品,然而在不到一年的时间里,后两者就先后由聚光灯下的明星产品沦为昨日黄花。Sandy Bridge的问世,让为Lynnfield和Clarkdale买单的消费者不爽,不过正如前文所述,英特尔产品线更新速度虽然略显激进,但也的确是芯片巨头稳固自身战略地位的一种必然行为;而消费者的眼光也应更远一些,等待你们的将是三、四年后更加成熟的一代产品。
首先,用户的消费能力和消费观念不尽相同,因此用户更新和升级设备的步调也并非一致。虽然我无法准确计算出不同用户采购设备的时间差,但显然这个时间差可以为英特尔每年更新的产品线提供足以消化的消费力。另一方面,每次升级处理器制造工艺及研发新一代处理器架构的投入成本都是惊人的,这些成本需要尽可能转化为收益才不至于让每年的财务报表过于难看,下游的系统类厂商和配件类厂商亦出于同样的考虑。作为行业领袖,英特尔的一举一动可谓牵一发而动全身,因此我们看到的不仅仅是处理器的频繁换代,随之而来的还有主板、笔记本、台式机等等的更新换代。技术在进步,并不代表每一代产品都足够成熟,对此你我都有深刻体会,但厂商无法为了一个相比之下更为“完美”的产品而空空等待研发进度。在两个相对成熟的产品之间总会有一些过渡产品节点,而这些过渡节点也总会有消费者自觉占据,这也许就是所谓的产业生态吧。
Sandy Bridge性能测试
为了让您更好的了解Sandy Bridge系列处理器在性能上的提升。我们选择了i7 2720M、i5 2520M、i5 2410M、i3 2310M进行了性能测试,进行对比的是上一代的i7 740M、i5540M、i5 460M、i3 370M处理器。测试时我们选择了SYSmark 2007、PCMark Vantage、3Dmark 06进行标准的Benchmark性能测试,同时我们也选择了一些常用的应用软件未衡量两代处理器之间的性能差异。
SYSmark 2007
熟悉这套软件的读者都知道,SYSmark是一种使用实际应用程序,模拟真实工作场景的测试软件。在这方面,SYSmark将场景数量从2004版的两个(Internet Content Creation和Office Productivity)增加到了四个——E-Lea rning,Office Productivity,VideoContent和3D Modeling,其中使用应用软件也自然进行了调整——有些是升级到更新的版本,有些则是增加了时下流行的新软件。
下面,我们首先列出这四个场景的具体分工和使用到的相应的软件和版本细节:
E-Learning
这个场景使用一系列软件将丰富的图像、视频和音频内容集成到一个Web页面中,展示了在线教学内容的创作过程。它涉及到的应用程序包括:
Adobe Illustrator CS2
Adobe Photoshop CS2
Macromedia Flash 8
Microsoft PowerPoint 2003
Video Creation
这个场景再现了将各种赖源的素材制作成视频,并加入丰富的特效的过程。而且,这一过程不仅包含适合在线播放的流媒体内容的制作,也包含通常是下载播放的高清内容的制作。它用的软件包括:
Adobe After Effects 7
Adobe Illustrator CS2
Adobe Photoshop CS2
Microsoft Windows Media Encoder9系列
Sony Vegas 7
3D Modeling
只要看看这个场景的用到的软件,我们就能知道它的用途所在。它所再现的是一个建筑设计项目的模型建立过程。它包含的软件有:
AutoDesk 3ds Max 8
SketchUp 5
从上面提到的信息不难看出,相比2004版,SYSmark 2007的场景更加细化,所采用的软件也更具针对性。在2004版中,BAPco实际是按软件所针对的应用将其划分成两类,然后在针对这些软件编制相应的脚本,显然,这种以软件功能为核心的做法有可能与用户的实际应用情况脱节,或者缺乏针对性。
反观SYSmark 2007.则采取了更为以用户应用为核心的策略。例如,同样是PowerPoint2003.它既出现在Office Productivity,也出现在E-Learning场景中;同样是AdobePhotoshop CS2和Adobe Illustrator CS2.它既出现在E—Learning,也出现在VideoCreation场景中。因为虽然应用不同,但是在用户的真实操作过程中都会用到这些相同的软件。
此外,以应用为核心,涉及多个应用软件的另一个好处就是能够充分反映用户实际工作中通常采用的多任务并行的模式,也能更加充分地展现出已经成为主流的双核甚至多核系统的优势。
PCMark Vantage
PCMark Vantage仅可用于针对WindowsVista系统,它提供了更加易用的一键测试功能和桌面、移动、工作站平台统一化的测试脚本,是基于Windows Vista的系统测试软件。
PCMark Vantage可以衡量各种类型PC的综合性能。从多媒体家庭娱乐系统到笔记本, 从专业工作站到高端游戏平台,无论是在专业人士手中,还是属于普通用户,都能通过PCMa rk Vantage了解系统性能,测试内容可以分为以下三个部分:
处理器测试
基于数据加密、解密、压缩、解压缩、图形处理、音频和视频转码、文本编辑、网页渲染、邮件功能、处理器人工智能游戏测试、联系人创建与搜索。
图形测试
基于高清视频播放、显卡图形处理、游戏测试。
硬盘测试
使用Windows Defender、《AlanWake》游戏、图像导入、Windows Vista启动、视频编辑、媒体中心使用、WindowsMedia Player搜索和归类,以及以下程序的启动:Office Word 2007、AdobePhotoshop CS2、Internet Explorer、Outlook 2007。
PCMark Vantage分为四个版本:基础试用版,只能使用一次,免费提供;基础版,提供PCMark得分和在线分数浏览器(ORB),不限制运行次数,测试结果不得用于商业目的;高级版,可运行所有套装,并有高级在线服务,测试结果不得用于商业目的;专业版,仅限商业用户,提供全部功能设置、技术支持,查看测试结果无需联网,可在命令行模式下测试,结果可导入微软Excel,给予全面商业授权。
PCMark Vantage的最低系统需求
处理器:InteLPentium 4或AMD同等级型号,支持SSE2指令集。
显卡:兼容Shader ModeL2.0.256MB显存,GPU图形处理测试需要Shader ModeI3.0。
硬盘:1-7GB空闲空间,NTFS分区格式。
内存:1GB
操作系统:Windows Vista旗舰版、家庭高级版、家庭基础版、企业版、商业版,32/64位均可(安装时可选64位)。
3DMark06
3DMark是FutureMark公司出品的3D图形性能基准测试工具,具有悠久的历史,迄今已成为业界标准之一。3DMa rk06主要使用较新的游戏技术衡量DirectX 9级别的3D硬件。此前的3DMark都是随着新版DirectX和新一代硬件的发布而推出,在一定程度上限制了3DMark对最新硬件性能的充分挖掘。现在,该级别的硬件已经遍布高中低各个领域,因此3DMark06可以完全利用DirectX 9的特性。事实上,3DMark06所有测试都需要支持SM3.0的DirectX 9硬件,不过只支持SM2.x的硬件也可以运行大部分测试。
3DMark06特点
两个HDR/SM3.0测试:需要Dire ctX 9级别硬件且支持SM3.0、16-bit浮点纹理和16-bit浮点混合;
两个SM2.0测试:需要DirectX 9级别硬件且完全支持SM2.0;
两个全新CPU测试:均支持多线程、多核心处理器,需要DirectX 9级别硬件且完全支持SM2.0
纹理测试:集中考察显卡的关键性能;
可根据需要进行多种不同范围的测试设置;
一个基于CPU测试的小游戏:使用游戏引擎的CPU测试场景。
通过使用3DMarko6及其测试结果在线比较服务,用户可以获得:
3DMark得分:电脑3D性能的衡量标尺;
SM2.0得分:电脑ShaderModeL2.0性能的衡量标尺;
HDR/SM 3.O得分:电脑HDR和ShaderModeL3.0性能的衡量标尺;
CPU得分:电脑处理器性能的衡量标尺;
与全球各地的最新电脑进行性能对比;
为用户硬件升级提供指导。
Apps应用程序测试
WinZip测试是将一段MPEG2文件压缩为zip包并记录所用时间,成绩单位为秒,用时越少越好。Photoshop CS5测试是在基准测试用图片上进行RadiaLBlur,用时越少越好。Aimersoft iPhone VC、iTunes、TMPEG4、YuanFan、MediaShow Espresso都是视频格式转换测试,成绩单位为秒。