论文部分内容阅读
正如PC诞生25年来,人们对PC计算性能的追求热情从未减弱一样。即使是以每秒367万亿次峰值速度位居Top500榜首的IBM 蓝色基因/L造价已经跨过1亿美元门槛,高昂的价格依旧没有能够挡住美、日、中三国的HPC厂商对千万亿次HPC这一新的世界纪录的冲击。个中道理很简单,现有的HPC在性能上还远未能满足像物质模拟这样的科学研究和工程计算的需要。
然而,即使钱不成问题,向千万亿次的冲击也将在技术上遭遇严峻的挑战。
巨星超级计算技术有限公司董事长兼总裁李晓渝和南开大学计算研究所所长邓越凡博士在《中国计算机报》撰文《迎接新一代超级计算技术的挑战》中,谈到下一代HPC必须直面高扩展能力、高性能节点比、高整体系统均衡优化、高可用性与可持续性、高性能密度、高机动性、高可管理性、高标准化与普适化、高经济有效性、高性能能耗比等十大技术挑战。
他们还指出,“机群(Cluster)结构的扩展能力是相当有限的”,“未来的超级计算系统绝不可能像机群那样只靠简单地堆积普通服务器来达到更高的性能要求”。
从最新的Top500统计也可看出,大规模并行处理(MMP)架构数量为108,占总数的21.6%,而机群架构高达361套,占总数的77.2%,其他架构占6.2%;而在前30名中,MMP迅速上升到63.3%,而Top500的前4名均采用MMP架构。据报道,曙光公司也将采用新的体系架构建造千万亿次HPC——曙光6000。
在未来两年向千万亿次发起冲击的IBM、Cray以及日本厂商中,一个值得注意的现象是,他们不约而同地采用了AMD的皓龙处理器。
IBM为洛斯阿拉莫斯国家实验室建造的Roadrunner将采用16000多颗皓龙和16000多颗作为协处理器的、由IBM与索尼联合研发的Cell处理器。Roadrunner造价为1.1亿美元,峰值性能高达1600万亿次,性能是蓝色基因/L的4倍。
老牌的HPC厂商Cray也已明确表示采用皓龙处理器为橡树岭国家实验室建造千万亿次HPC。
而作为名列Top500第九的用户,东京技术学院世界科学信息与计算中心负责计算基础架构的 Satoshi Matsuoka 教授说:“我强烈地意识到,TSUBAME 超级计算机之所以能够在世界 500 强的名单上排名前列,一个原因就在于 AMD 皓龙处理器稳定、先进的处理性能。东京技术研究所准备构建未来的千万亿次的日本超级计算机。因此,我们正计划和考虑使用一系列先进技术,特别是 AMD 处理器技术。 ”
今年11月初,日本东京大学宣布推出具有512个内核的协处理器GRAPE-DR,东京大学是通过一台两路的皓龙系统演示GRAPE-DR。并表示计划在2008年推出相应的2千万亿次HPC。
在向千万亿次冲刺的竞赛中,AMD的皓龙处理器之所以赢得众多青睐,得益于皓龙开放的超传输总线技术(HT)。HT既可以提供很高的总线带宽,有容许系统厂商自己的芯片组与之直连,而省去传统的北桥控制芯片。如Cray用自己的芯片组SeaStar2与皓龙直接,构成了自己独特的MMP架构。
在由不同种类处理器构成的混合架构成为未来HPC发展趋势下,AMD的HT架构具有的开放性,为混合架构的构建提供了简捷而高效的途径。
而AMD新一代Torrensa开放式协作平台更是容许用户将加速器逐步由板卡级过渡到芯片级直连,最终作为CPU的一部分,这一特性顺应了HPC从定制化向通用化的转变。
然而,即使钱不成问题,向千万亿次的冲击也将在技术上遭遇严峻的挑战。
巨星超级计算技术有限公司董事长兼总裁李晓渝和南开大学计算研究所所长邓越凡博士在《中国计算机报》撰文《迎接新一代超级计算技术的挑战》中,谈到下一代HPC必须直面高扩展能力、高性能节点比、高整体系统均衡优化、高可用性与可持续性、高性能密度、高机动性、高可管理性、高标准化与普适化、高经济有效性、高性能能耗比等十大技术挑战。
他们还指出,“机群(Cluster)结构的扩展能力是相当有限的”,“未来的超级计算系统绝不可能像机群那样只靠简单地堆积普通服务器来达到更高的性能要求”。
从最新的Top500统计也可看出,大规模并行处理(MMP)架构数量为108,占总数的21.6%,而机群架构高达361套,占总数的77.2%,其他架构占6.2%;而在前30名中,MMP迅速上升到63.3%,而Top500的前4名均采用MMP架构。据报道,曙光公司也将采用新的体系架构建造千万亿次HPC——曙光6000。
在未来两年向千万亿次发起冲击的IBM、Cray以及日本厂商中,一个值得注意的现象是,他们不约而同地采用了AMD的皓龙处理器。
IBM为洛斯阿拉莫斯国家实验室建造的Roadrunner将采用16000多颗皓龙和16000多颗作为协处理器的、由IBM与索尼联合研发的Cell处理器。Roadrunner造价为1.1亿美元,峰值性能高达1600万亿次,性能是蓝色基因/L的4倍。
老牌的HPC厂商Cray也已明确表示采用皓龙处理器为橡树岭国家实验室建造千万亿次HPC。
而作为名列Top500第九的用户,东京技术学院世界科学信息与计算中心负责计算基础架构的 Satoshi Matsuoka 教授说:“我强烈地意识到,TSUBAME 超级计算机之所以能够在世界 500 强的名单上排名前列,一个原因就在于 AMD 皓龙处理器稳定、先进的处理性能。东京技术研究所准备构建未来的千万亿次的日本超级计算机。因此,我们正计划和考虑使用一系列先进技术,特别是 AMD 处理器技术。 ”
今年11月初,日本东京大学宣布推出具有512个内核的协处理器GRAPE-DR,东京大学是通过一台两路的皓龙系统演示GRAPE-DR。并表示计划在2008年推出相应的2千万亿次HPC。
在向千万亿次冲刺的竞赛中,AMD的皓龙处理器之所以赢得众多青睐,得益于皓龙开放的超传输总线技术(HT)。HT既可以提供很高的总线带宽,有容许系统厂商自己的芯片组与之直连,而省去传统的北桥控制芯片。如Cray用自己的芯片组SeaStar2与皓龙直接,构成了自己独特的MMP架构。
在由不同种类处理器构成的混合架构成为未来HPC发展趋势下,AMD的HT架构具有的开放性,为混合架构的构建提供了简捷而高效的途径。
而AMD新一代Torrensa开放式协作平台更是容许用户将加速器逐步由板卡级过渡到芯片级直连,最终作为CPU的一部分,这一特性顺应了HPC从定制化向通用化的转变。