论文部分内容阅读
近日,在北京的媒体将镜头全部对准曙光公司,这是一家以国家“863”计划重大成果为基础的服务器厂商,他们最新研发的曙光5000高性能计算机于今年8月入住上海超级计算中心。曙光5000的推出,不但刷新了该公司此前创建的中国纪录,更使曙光公司在国内行业的王者地位不容置疑。从曙光1号到曙光5000的路,它承载了整个中国高性能计算机的发展史。
200万元起家
1992年,国家“863”计划投入200万元研制曙光1号。3月,智能中心组织了陈鸿安、樊建平、刘金水、李如昆、王永杰等科技骨干到美国硅谷进行曙光1号的封闭式开发。这11个月左右的留美生涯,后来被这群科技人员戏称为“美国洋插队”的生活。但就在这里曙光1号诞生了,它标志着我国已掌握了设计制造支持多线程机制的对称式紧耦合并行机的世界先进水平,缩短了我国在并行处理技术上与国外的差距。然而,此时李国杰清醒地认识到,曙光1号计算机实际上只咬住了当时国外高技术的“尾巴”,这远远不够。
1993年10月,在中国科学院院士李国杰的带领下,国家智能计算机研究开发中心研制出了我国第一台SMP(对称式多处理机)结构计算机——曙光1号计算机,闯出了一条中国的高性能计算机之路。
中国的“争气机”
1995年5月,在研究人员仅有10来个人,所花时间只有2年,而直接科研经费只用了500万元的条件下,他们推出了曙光1000大规模并行计算机系统。曙光1000在整体上达到了20世纪90年代前期的国际先进水平,某些技术还达到了国际领先水平,其运行速度的峰值达到了每秒25亿次。所以,有人说曙光机是中国的“争气机”,而曙光1000也荣获了1996年中国科学院科技进步奖特等奖和1997年国家科学技术进步奖一等奖。
也正是1995年,以曙光1号2000万元知识产权为基础,中国科学院计算所成立了曙光信息产业有限公司。该公司先后在1998年、2001年推出了曙光2000和曙光3000。2004年6月29日,曙光4000通过了国家科技部鉴定,成为国内首台每秒运算超过10万亿次的超级计算机。它的运算能力位列当时全球前十,也使中国成为继美国和日本之后,第三个能研制10万亿次高性能计算机的国家。
捅破“天花板”的大系统
一连串响当当的头衔和荣誉背后,记录着历军从一名普通的研究人员到曙光公司总裁,从科研带头人到高性能计算行业领军人物的成长历程。历军在曙光的短短十几年间,一步步实现了他人生的转变,同时也带领着曙光公司完成了厚积薄发、蜕变和腾飞的过程,曙光5000的诞生,业界并不觉得意外。
首个百万亿次计算机的研究项目落户曙光有其必然性。经过多年的发展,曙光积累了丰富的服务器产品研发、应用经验,并在天津建成了曙光产业基地,实现了国产高性能计算机的产业化生产,构建了集研发、设计、制造于一体的服务器产业链。同时,公司还构建了国内唯一的高性能计算机用户体验中心和可靠性测试中心,技术实力今非昔比,为百万亿次计算机的研制提供了强有力的工程技术和产品技术支撑。尽管如此,对于参与研发的全体技术人员来讲,研发的这两年都是在极度挑战中度过的。据技术人员介绍,百万亿次计算机所面临的技术瓶颈要比十亿次计算机更多、更难解决,其绝对不是简单的数字叠加就可获得,而是要从体系结构、处理器、互联芯片到组装工艺都有重大创新,甚至到每一条连接线路都要经过反复地论证。
曙光5000被称为捅破“天花板”的大系统,解决了一系列的世界性难题。例如,上千个客户端如何在多用户并发访问模式下保持稳定的I/O性能;面对众多核心,操作系统如何容忍单个处理器故障,怎样支持节点之间的隔离;如何改造现有算法,并利用并行编译技术使应用与百万亿次计算机的体系结构相适应,以达到数万个处理器的可扩展性等等,这些都是国际学术界和企业所共同面对的难点。除了200万亿次的双精度浮点运算能力,曙光5000还拥有全自主、超高密度、超高性价比、超低功耗以及超广泛应用等众多特点。“曙光5000同时在体积、节能、软件效率和可管理性方面都会有很大幅度的提高,它的性能将会是4000A的20倍,体积只有2/3,耗电只增加了50%,这些方面在整个业界也是首屈一指的。”历军自豪地说。
五个团队“攻城”
自2006年起,有5个团队从不同角度和层面围绕着曙光5000的高墙发起了进攻。一支团队来自曙光公司和中科院所共同维护的国家计算机高级工程计算中心,他们更多地把精力投入到工程设计方面;还有一个是由中科院计算所研究人员参与的计算团队。而曙光公司内部则分成了3个团队,第一个团队专门围绕刀片技术(刀片服务器)来做,规模20多人;第二个团队是曙光的产品设计中心,主要研发围绕整个刀片、机柜、工艺设计、产品维护等,整体虽然有50多人参与,但是他们并没有完全投入到项目当中,投入大约一半的力量;第三个团队主要偏重于操作系统以上部分,比如说用户的应用、测试、调试、优化,然后从整个需求反过来对设计提要求。
“举一个例子,我的一个研发组里开始有20个人投入到主板设计开发,但可能做刀片服务器的时候,已经变成了只能有5个人在主板的设计上,其他人都被抽走做别的设计了。到最后就变成了用更少的人完成同样的任务。因为在开发过程中,每一步我们都遇到了新挑战,都要投入研发力量去解决。”曙光副总裁聂华说。在曙光5000的总设计师孙凝晖博士的带领下,200多位技术支持工程师、50多名各行业领域的首席工程师和100多名研究生带着极大的热情投身于这个国家级的大工程中。这些工程师们通常不是计算机科班出身,他们来自石油物探、气象、化学等等不同的专业领域,他们是这些领域中的翘楚,同时又都是计算机的专家。正是通过众多技术工程师的共同努力,虽然异常艰难,但是他们却将每一步的难题一一破解,迎来了曙光5000的诞生。
曙光,一步一个台阶
作为高性能计算机,曙光5000并不是象牙塔内的观赏品。由于公司背景,曙光5000从一提出即以应用为前提。对曙光公司而言,单纯的运算速度并不是其所追求的目标,在高性能计算领域所体现的科技实力,和为中国国家竞争力所带来的增值,才是曙光公司研制百万亿次计算机的出发点。
从曙光历史发展看,从曙光1000的200亿次,曙光3000的4032亿次,到曙光4000的10万亿次,曙光产品的高性能是有连接和传承的,不是一 步跳高式的跃进,而是一步一个台阶踏踏实实地往上迈。历军的观点是:“现在发现一步跃上台阶的品牌显示度高且快,但是持久性差,命力很短,所以曙光要按照这样一步一个台阶走,稳扎稳打”,“曙光4000、曙光5000先后打破了中国高性能计算机的性能纪录,打破纪录没什么意义,只不过代表国家的水平而已,我们更看重它实际的作用”。今天,曙光公司已成为国内影响最大的服务器公司。虽然从资产和管理规模上讲,曙光公司还不到国外大企业的百分之一,但曙光高性能服务器已在市场上占有一席之地,并且对我国经济发展、国家安全起到了不可替代的作用。
高性能计算机发展路线图
除了提高国家竞争力外,未来高性能计算机的发展可能会朝着不同的轨道发展。历军对曙光高性能计算机发展路线图作了明确而生动的商业前景描绘:
首先,就是大型计算机的普及化。因为大系统通常一个国家有一台两台就够了,可是这样的大系统并不能以商业市场化的方式让它更广泛地被应用。但实际上随着科技发展,高性能计算机市场的需求其实是很旺盛的,随着国家的科技实力的提高,懂超级计算机的人越来越多,会用的人也越来越多,所以曙光5000这个大系统带出的一系列的技术,在市场上有广泛的应用前景。如高性能计算机面向专业领域,即针对某项应用专门设计系统。以地震预报为例,未来就有可能研制出专门针对地质模拟的系统。
第二个方向是高性能计算机的小型化,就是未来很有可能每一位工程师桌边都会有一个万亿次计算能力的系统。目前,曙光已经解决了个人HPC,市场需求很广泛。尤其针对工程设计人员,他们可能面对的仅是一个齿轮或者一套机械,但这一套机械模拟在一般工作站无法满足要求,因为对精度的要求会越来越高,一些零部件的设计、机械结构的设计、模拟方针等方面的模拟需求,小型高性能计算机则都可以满足。其功能可以细微到对一个家庭的装修方案的计算机虚拟现实。所以在桌边建一个这样的小系统——省电、便宜、好用,就像今天的PC一样。
“今天,我可以肯定地说,在不久的将来,也就是在曙光5000完成之后的3年左右的时间,我们将推出新机器,也许我们这种千万亿次的机器,会用到我们自己的CPU。其实现在曙光5000研究的课题之一,就是自主的龙芯CPU在超级计算机上应用的探索。”历军对曙光的下一步要迈的台阶信心百倍。
200万元起家
1992年,国家“863”计划投入200万元研制曙光1号。3月,智能中心组织了陈鸿安、樊建平、刘金水、李如昆、王永杰等科技骨干到美国硅谷进行曙光1号的封闭式开发。这11个月左右的留美生涯,后来被这群科技人员戏称为“美国洋插队”的生活。但就在这里曙光1号诞生了,它标志着我国已掌握了设计制造支持多线程机制的对称式紧耦合并行机的世界先进水平,缩短了我国在并行处理技术上与国外的差距。然而,此时李国杰清醒地认识到,曙光1号计算机实际上只咬住了当时国外高技术的“尾巴”,这远远不够。
1993年10月,在中国科学院院士李国杰的带领下,国家智能计算机研究开发中心研制出了我国第一台SMP(对称式多处理机)结构计算机——曙光1号计算机,闯出了一条中国的高性能计算机之路。
中国的“争气机”
1995年5月,在研究人员仅有10来个人,所花时间只有2年,而直接科研经费只用了500万元的条件下,他们推出了曙光1000大规模并行计算机系统。曙光1000在整体上达到了20世纪90年代前期的国际先进水平,某些技术还达到了国际领先水平,其运行速度的峰值达到了每秒25亿次。所以,有人说曙光机是中国的“争气机”,而曙光1000也荣获了1996年中国科学院科技进步奖特等奖和1997年国家科学技术进步奖一等奖。
也正是1995年,以曙光1号2000万元知识产权为基础,中国科学院计算所成立了曙光信息产业有限公司。该公司先后在1998年、2001年推出了曙光2000和曙光3000。2004年6月29日,曙光4000通过了国家科技部鉴定,成为国内首台每秒运算超过10万亿次的超级计算机。它的运算能力位列当时全球前十,也使中国成为继美国和日本之后,第三个能研制10万亿次高性能计算机的国家。
捅破“天花板”的大系统
一连串响当当的头衔和荣誉背后,记录着历军从一名普通的研究人员到曙光公司总裁,从科研带头人到高性能计算行业领军人物的成长历程。历军在曙光的短短十几年间,一步步实现了他人生的转变,同时也带领着曙光公司完成了厚积薄发、蜕变和腾飞的过程,曙光5000的诞生,业界并不觉得意外。
首个百万亿次计算机的研究项目落户曙光有其必然性。经过多年的发展,曙光积累了丰富的服务器产品研发、应用经验,并在天津建成了曙光产业基地,实现了国产高性能计算机的产业化生产,构建了集研发、设计、制造于一体的服务器产业链。同时,公司还构建了国内唯一的高性能计算机用户体验中心和可靠性测试中心,技术实力今非昔比,为百万亿次计算机的研制提供了强有力的工程技术和产品技术支撑。尽管如此,对于参与研发的全体技术人员来讲,研发的这两年都是在极度挑战中度过的。据技术人员介绍,百万亿次计算机所面临的技术瓶颈要比十亿次计算机更多、更难解决,其绝对不是简单的数字叠加就可获得,而是要从体系结构、处理器、互联芯片到组装工艺都有重大创新,甚至到每一条连接线路都要经过反复地论证。
曙光5000被称为捅破“天花板”的大系统,解决了一系列的世界性难题。例如,上千个客户端如何在多用户并发访问模式下保持稳定的I/O性能;面对众多核心,操作系统如何容忍单个处理器故障,怎样支持节点之间的隔离;如何改造现有算法,并利用并行编译技术使应用与百万亿次计算机的体系结构相适应,以达到数万个处理器的可扩展性等等,这些都是国际学术界和企业所共同面对的难点。除了200万亿次的双精度浮点运算能力,曙光5000还拥有全自主、超高密度、超高性价比、超低功耗以及超广泛应用等众多特点。“曙光5000同时在体积、节能、软件效率和可管理性方面都会有很大幅度的提高,它的性能将会是4000A的20倍,体积只有2/3,耗电只增加了50%,这些方面在整个业界也是首屈一指的。”历军自豪地说。
五个团队“攻城”
自2006年起,有5个团队从不同角度和层面围绕着曙光5000的高墙发起了进攻。一支团队来自曙光公司和中科院所共同维护的国家计算机高级工程计算中心,他们更多地把精力投入到工程设计方面;还有一个是由中科院计算所研究人员参与的计算团队。而曙光公司内部则分成了3个团队,第一个团队专门围绕刀片技术(刀片服务器)来做,规模20多人;第二个团队是曙光的产品设计中心,主要研发围绕整个刀片、机柜、工艺设计、产品维护等,整体虽然有50多人参与,但是他们并没有完全投入到项目当中,投入大约一半的力量;第三个团队主要偏重于操作系统以上部分,比如说用户的应用、测试、调试、优化,然后从整个需求反过来对设计提要求。
“举一个例子,我的一个研发组里开始有20个人投入到主板设计开发,但可能做刀片服务器的时候,已经变成了只能有5个人在主板的设计上,其他人都被抽走做别的设计了。到最后就变成了用更少的人完成同样的任务。因为在开发过程中,每一步我们都遇到了新挑战,都要投入研发力量去解决。”曙光副总裁聂华说。在曙光5000的总设计师孙凝晖博士的带领下,200多位技术支持工程师、50多名各行业领域的首席工程师和100多名研究生带着极大的热情投身于这个国家级的大工程中。这些工程师们通常不是计算机科班出身,他们来自石油物探、气象、化学等等不同的专业领域,他们是这些领域中的翘楚,同时又都是计算机的专家。正是通过众多技术工程师的共同努力,虽然异常艰难,但是他们却将每一步的难题一一破解,迎来了曙光5000的诞生。
曙光,一步一个台阶
作为高性能计算机,曙光5000并不是象牙塔内的观赏品。由于公司背景,曙光5000从一提出即以应用为前提。对曙光公司而言,单纯的运算速度并不是其所追求的目标,在高性能计算领域所体现的科技实力,和为中国国家竞争力所带来的增值,才是曙光公司研制百万亿次计算机的出发点。
从曙光历史发展看,从曙光1000的200亿次,曙光3000的4032亿次,到曙光4000的10万亿次,曙光产品的高性能是有连接和传承的,不是一 步跳高式的跃进,而是一步一个台阶踏踏实实地往上迈。历军的观点是:“现在发现一步跃上台阶的品牌显示度高且快,但是持久性差,命力很短,所以曙光要按照这样一步一个台阶走,稳扎稳打”,“曙光4000、曙光5000先后打破了中国高性能计算机的性能纪录,打破纪录没什么意义,只不过代表国家的水平而已,我们更看重它实际的作用”。今天,曙光公司已成为国内影响最大的服务器公司。虽然从资产和管理规模上讲,曙光公司还不到国外大企业的百分之一,但曙光高性能服务器已在市场上占有一席之地,并且对我国经济发展、国家安全起到了不可替代的作用。
高性能计算机发展路线图
除了提高国家竞争力外,未来高性能计算机的发展可能会朝着不同的轨道发展。历军对曙光高性能计算机发展路线图作了明确而生动的商业前景描绘:
首先,就是大型计算机的普及化。因为大系统通常一个国家有一台两台就够了,可是这样的大系统并不能以商业市场化的方式让它更广泛地被应用。但实际上随着科技发展,高性能计算机市场的需求其实是很旺盛的,随着国家的科技实力的提高,懂超级计算机的人越来越多,会用的人也越来越多,所以曙光5000这个大系统带出的一系列的技术,在市场上有广泛的应用前景。如高性能计算机面向专业领域,即针对某项应用专门设计系统。以地震预报为例,未来就有可能研制出专门针对地质模拟的系统。
第二个方向是高性能计算机的小型化,就是未来很有可能每一位工程师桌边都会有一个万亿次计算能力的系统。目前,曙光已经解决了个人HPC,市场需求很广泛。尤其针对工程设计人员,他们可能面对的仅是一个齿轮或者一套机械,但这一套机械模拟在一般工作站无法满足要求,因为对精度的要求会越来越高,一些零部件的设计、机械结构的设计、模拟方针等方面的模拟需求,小型高性能计算机则都可以满足。其功能可以细微到对一个家庭的装修方案的计算机虚拟现实。所以在桌边建一个这样的小系统——省电、便宜、好用,就像今天的PC一样。
“今天,我可以肯定地说,在不久的将来,也就是在曙光5000完成之后的3年左右的时间,我们将推出新机器,也许我们这种千万亿次的机器,会用到我们自己的CPU。其实现在曙光5000研究的课题之一,就是自主的龙芯CPU在超级计算机上应用的探索。”历军对曙光的下一步要迈的台阶信心百倍。