论文部分内容阅读
随着9月10日AMD采用K10架构的Barcelona(巴塞罗那)处理器正式发布,拉开了四核处理器竞争的序幕,由于进入双核时代以来,AMD一直以K8架构处理器苦苦对抗Intel的Core架构,因此AMD对Barcelona处理器寄予了厚望,希望能再创K8单核时代的辉煌。而Intel在Core 2 Quad的抢先上市使用得Intel在时间上占据了优势,而BarCelona处理器是否能后来居上,将成为AMD和Intel对抗的关键战役。
原生四核!Batcelona处理器
Barcelona处理器是AMD推出的首颗四核处理器,相比Intel的Core 2 Quad采用两个双核Die封装在一起的实现方式,AMD标榜它是首颗“原生”四核处理器。在工艺方面,Barcelona处理器仍然采用了65nm工艺,热设计功耗为95W,在K8架构的基础上进行了一系列的改进,制造设计上要复杂很多,Barcelona需要总共11层金属层,而K8则为9层,Core 2也只有8层,更多的金属层会增加制造方面复杂程度,但是对最终消费者并没有太大的影响。这也是AMDBarcelona处理器跳票6个月之久,迟迟未能正式推出的主要原因。在规格方面,Barcelona处理器的四个核心每个都拥有128KB L1缓存和512KB L2缓存,并且还增加了共享的2MB L3缓存,这样总的缓存达到了4.5MB,晶体管总数也大大增加了,达到4.63亿个。
性能提升源自架构改进
虽然Barcelona处理器的架构基于K8架构改进而来,但是并非只是简单地采用了L3缓存,而是增加了一系列的新技术提升处理器的效率。对比K8架构,K10处理器在规格上有很大提升,在部分规格上更是成倍地增长,并支持HyperTransport 3.0总线。
◎全新的“宽浮点加速器”
在Barcelona处理器中,AMD扩展了SSE指令的执行宽度,不必再像K8架构处理器将指令分割成两个64bit执行,大大提高了SSE指令的执行效率,另外,Barcelona处理器可以实现每周期获取32字节指令,相对K8架构有一倍的提升,好比高速公路收费站窗口,同时开两条通道比一条通道的通行速度更快,避免车辆堵塞。另外,AMD进一步提高了L1缓存和SSE寄存器(registers)之间的带宽,Barcelona可以实现每个周期调用2 128bit,同时L2缓存和内存控制器的接口也被提升到128bits/周期,让各部分的改进实现总体上的平衡,避免了指令获取和执行的改进所带来的性能瓶颈,这些改进被AMD统一命名为“宽浮点加速器”。这就好比工厂的流水线作业,只是增加一个工序的速度并不能提升整体的速度,需要各个环节的配合,才能实现整体效率的提升。
◎乱序分支预测技术
分支预测技术与处理器的流水线宽度及级数有着非常紧密的联系。K8架构处理器之所以性能出色,原因就在于分支预测技术与架构的搭配适当。但这并不表示K8架构的分支预测技术已经完美,有些急待处理的数据有时还是无法被及时预测到,Barcelona处理器加入间接分支预测器,即乱序执行能力,同时也靠增加一倍返回堆栈容量等技术,进一步提升了核心性能。
◎全新的L3缓存设计
多线程软件的高效率运行,需要多核心处理器拥有更高速的缓存来保持更好的性能。为了在性能和容量上进行平衡,AMD在设计了128KB L1缓存和512KB L2缓存后,由于制程的原因,并没有采用更大容量L2 cache的做法,而是追加一个L3 cache,而且这个L3 cache将被四核心共享,在容量上也达到了2MB。快速的32路L3缓存不仅可以更好地满足多任务并行,而且对单任务的执行也有着较大积极作用。尤其在3D运用方面,2MB的L3缓存将对性能产生极大的推进作用。
◎更为高效的内存控制器
AMD的Barcelona拥有专门的内存控制器,可同时支持DDR3/DDR3/FB-DIMM等内存规范,每颗处理器都拥有属于自己的内存资源,访问延迟极低。并且系统内的多个处理器可以直接通讯,始终保持极高的任务协作效率。Barcelona处理器的内存控制器采用双64bit控制器设计,两个控制器可以独立运行,这将使处理器执行多任务能力有一定提高。而且Barcelona还改进了数据预取器的数据寄存方式,直接将数据寄存入L1缓存中,相比K8构架中寄存入L2缓存的做法,新的数据预取器准确率更高,速度更快,内存性能及CPU整体性能将得益于此。
◎增强的虚拟化技术
在虚拟技术方面,Barcelona也有了相应的改进,提供的是硬件加速转换,AMD把它称为Nested Paging,相比现在使用的Shadow paging软件转换模式将会带来虚拟系统至少40%的性能提升。
◎完善的功耗管理
Barcelona拥有完善的功耗管理技术,它的CoolCore技术可以在一些逻辑块不工作时关闭相应的部分,实现全方位的节能,Barcelona还支持双动态功耗管理技术,将核心和内存控制器的功耗管理分离,更加节能。另外,Barcelona的各个独立核心虽然共享同样的电压,但是可以根据负载情况,运行在不同的频率下,更有效地利用资源。
Barcelona兼容性几何
Barcelona处理器采用AM2+处理器,支持HvperTransport3.0,但是可以兼容旧版本的HyperTransport。采用Barcelona新架构的AM2+接口处理器将可以在旧有的AM2平台上正常使用,只需升级BIOS就可以了,只是旧平台没法实现HyperTransport 3.0的高速优势和双动态功耗管理技术这些特性,可以实现AMD平台的平稳过渡。另外,新的AMD平台芯片组如RD790/RD780/RX780/740G等也都将逐渐推出,为Barcelona处理器提供各种定位的平台支持。
K10 Vs. Core架构
想必不少读者更加关心的是Barcelona~理器的性能有多大的提升,和Intel孰强孰弱?由于Barcelona处理器目前仅有服务器版本,因此采用目前最高频率的四核处理器Opteron 2350(2GHz)和Intel主流频率的四核处理器xeon E5345(2.3GHz,性能约同Core2 Quad Q6600)来进行对比测试,测试结果如下表。虽然Intel处理器的频率略高,但是还是可以看出Barcelona处理器在性能方面稍逊一筹。并且Barcelona处理器由于仍然采用65nm的制程,导致首发的Opteron 2350处理器的频率较低,仅有2GHz,这也是Barcelona架构的弱点所在,不过到年底Barcelona处理器频率将会有所提升,预计可达2.5GHz甚至更高,AMD仍有和Core架构一争高下的机会。
Barcelona市场前景
Barcelona处理器的发布,正式拉开了四核处理器竞争的序幕,虽然Barcelona不是全新的架构,但也是一个高度优化的AMD x86-64架构,增加了若干新技术,尽管没有巨大的革命性意义,Barcelona的进步就像Intel的Core 2架构对Pentium M架构一样,虽然只是一小步,但是基于原有架构的新设计将把性能提升到一个崭新的高度。不过从目前推出的Barcelona处理器(Opteron2350)的性能来看,相比Intel Core架构还是稍逊一筹,在制程方面也不能和Intel抗衡,不过随着AMD四核处理器的推出,将引发四核处理器大幅降价,随着K10桌面版本的推出,将把四核处理器的竞争推向高潮,AMD是否会再次祭起价格战的法宝?Intel的Penryn处理器上市之后又会如何应对?一切都有待市场的验证,并且年底AMDK10处理器频率有望提升,将会成为Core 2 Quad真正的劲敌,届时四核处理器的竞争将更加激烈和精彩。
原生四核!Batcelona处理器
Barcelona处理器是AMD推出的首颗四核处理器,相比Intel的Core 2 Quad采用两个双核Die封装在一起的实现方式,AMD标榜它是首颗“原生”四核处理器。在工艺方面,Barcelona处理器仍然采用了65nm工艺,热设计功耗为95W,在K8架构的基础上进行了一系列的改进,制造设计上要复杂很多,Barcelona需要总共11层金属层,而K8则为9层,Core 2也只有8层,更多的金属层会增加制造方面复杂程度,但是对最终消费者并没有太大的影响。这也是AMDBarcelona处理器跳票6个月之久,迟迟未能正式推出的主要原因。在规格方面,Barcelona处理器的四个核心每个都拥有128KB L1缓存和512KB L2缓存,并且还增加了共享的2MB L3缓存,这样总的缓存达到了4.5MB,晶体管总数也大大增加了,达到4.63亿个。
性能提升源自架构改进
虽然Barcelona处理器的架构基于K8架构改进而来,但是并非只是简单地采用了L3缓存,而是增加了一系列的新技术提升处理器的效率。对比K8架构,K10处理器在规格上有很大提升,在部分规格上更是成倍地增长,并支持HyperTransport 3.0总线。
◎全新的“宽浮点加速器”
在Barcelona处理器中,AMD扩展了SSE指令的执行宽度,不必再像K8架构处理器将指令分割成两个64bit执行,大大提高了SSE指令的执行效率,另外,Barcelona处理器可以实现每周期获取32字节指令,相对K8架构有一倍的提升,好比高速公路收费站窗口,同时开两条通道比一条通道的通行速度更快,避免车辆堵塞。另外,AMD进一步提高了L1缓存和SSE寄存器(registers)之间的带宽,Barcelona可以实现每个周期调用2 128bit,同时L2缓存和内存控制器的接口也被提升到128bits/周期,让各部分的改进实现总体上的平衡,避免了指令获取和执行的改进所带来的性能瓶颈,这些改进被AMD统一命名为“宽浮点加速器”。这就好比工厂的流水线作业,只是增加一个工序的速度并不能提升整体的速度,需要各个环节的配合,才能实现整体效率的提升。
◎乱序分支预测技术
分支预测技术与处理器的流水线宽度及级数有着非常紧密的联系。K8架构处理器之所以性能出色,原因就在于分支预测技术与架构的搭配适当。但这并不表示K8架构的分支预测技术已经完美,有些急待处理的数据有时还是无法被及时预测到,Barcelona处理器加入间接分支预测器,即乱序执行能力,同时也靠增加一倍返回堆栈容量等技术,进一步提升了核心性能。
◎全新的L3缓存设计
多线程软件的高效率运行,需要多核心处理器拥有更高速的缓存来保持更好的性能。为了在性能和容量上进行平衡,AMD在设计了128KB L1缓存和512KB L2缓存后,由于制程的原因,并没有采用更大容量L2 cache的做法,而是追加一个L3 cache,而且这个L3 cache将被四核心共享,在容量上也达到了2MB。快速的32路L3缓存不仅可以更好地满足多任务并行,而且对单任务的执行也有着较大积极作用。尤其在3D运用方面,2MB的L3缓存将对性能产生极大的推进作用。
◎更为高效的内存控制器
AMD的Barcelona拥有专门的内存控制器,可同时支持DDR3/DDR3/FB-DIMM等内存规范,每颗处理器都拥有属于自己的内存资源,访问延迟极低。并且系统内的多个处理器可以直接通讯,始终保持极高的任务协作效率。Barcelona处理器的内存控制器采用双64bit控制器设计,两个控制器可以独立运行,这将使处理器执行多任务能力有一定提高。而且Barcelona还改进了数据预取器的数据寄存方式,直接将数据寄存入L1缓存中,相比K8构架中寄存入L2缓存的做法,新的数据预取器准确率更高,速度更快,内存性能及CPU整体性能将得益于此。
◎增强的虚拟化技术
在虚拟技术方面,Barcelona也有了相应的改进,提供的是硬件加速转换,AMD把它称为Nested Paging,相比现在使用的Shadow paging软件转换模式将会带来虚拟系统至少40%的性能提升。
◎完善的功耗管理
Barcelona拥有完善的功耗管理技术,它的CoolCore技术可以在一些逻辑块不工作时关闭相应的部分,实现全方位的节能,Barcelona还支持双动态功耗管理技术,将核心和内存控制器的功耗管理分离,更加节能。另外,Barcelona的各个独立核心虽然共享同样的电压,但是可以根据负载情况,运行在不同的频率下,更有效地利用资源。
Barcelona兼容性几何
Barcelona处理器采用AM2+处理器,支持HvperTransport3.0,但是可以兼容旧版本的HyperTransport。采用Barcelona新架构的AM2+接口处理器将可以在旧有的AM2平台上正常使用,只需升级BIOS就可以了,只是旧平台没法实现HyperTransport 3.0的高速优势和双动态功耗管理技术这些特性,可以实现AMD平台的平稳过渡。另外,新的AMD平台芯片组如RD790/RD780/RX780/740G等也都将逐渐推出,为Barcelona处理器提供各种定位的平台支持。
K10 Vs. Core架构
想必不少读者更加关心的是Barcelona~理器的性能有多大的提升,和Intel孰强孰弱?由于Barcelona处理器目前仅有服务器版本,因此采用目前最高频率的四核处理器Opteron 2350(2GHz)和Intel主流频率的四核处理器xeon E5345(2.3GHz,性能约同Core2 Quad Q6600)来进行对比测试,测试结果如下表。虽然Intel处理器的频率略高,但是还是可以看出Barcelona处理器在性能方面稍逊一筹。并且Barcelona处理器由于仍然采用65nm的制程,导致首发的Opteron 2350处理器的频率较低,仅有2GHz,这也是Barcelona架构的弱点所在,不过到年底Barcelona处理器频率将会有所提升,预计可达2.5GHz甚至更高,AMD仍有和Core架构一争高下的机会。
Barcelona市场前景
Barcelona处理器的发布,正式拉开了四核处理器竞争的序幕,虽然Barcelona不是全新的架构,但也是一个高度优化的AMD x86-64架构,增加了若干新技术,尽管没有巨大的革命性意义,Barcelona的进步就像Intel的Core 2架构对Pentium M架构一样,虽然只是一小步,但是基于原有架构的新设计将把性能提升到一个崭新的高度。不过从目前推出的Barcelona处理器(Opteron2350)的性能来看,相比Intel Core架构还是稍逊一筹,在制程方面也不能和Intel抗衡,不过随着AMD四核处理器的推出,将引发四核处理器大幅降价,随着K10桌面版本的推出,将把四核处理器的竞争推向高潮,AMD是否会再次祭起价格战的法宝?Intel的Penryn处理器上市之后又会如何应对?一切都有待市场的验证,并且年底AMDK10处理器频率有望提升,将会成为Core 2 Quad真正的劲敌,届时四核处理器的竞争将更加激烈和精彩。