论文部分内容阅读
无极计算在数据、主机、软件、交互等计算基本元素的层面上实现基于网络的彻底分离和封装,通过逻辑层屏蔽资源的物理属性,再加上基于虚拟组织的安全、信任等方面的技术保证,通过不同的流程管理机制实现计算元素的自主聚合,最终目标是达到应用执行在任意时间和空间上的无限延伸,解决Anytime,Anywhere,Any Application(A4)的问题,实现分布式计算的终极目标,符合技术基础架构化的大趋势,最终完成无极时空的愿景
曹军威,博士,清华大学信息技术研究院研究员、院务委员会副主任,美国麻省理工学院访问科学家。1991年至1998年,清华大学自动化系本科、硕士;2001年英国Warwick大学计算机博士;2002年至2006年先后在德国NEC欧洲实验室和美国MIT/LIGO实验室任Research Scientist;2006年回清华工作至今,主要从事先进计算技术及其应用研究。曹军威长期致力于基础架构科学、技术与应用研究,从事应用集成、网格计算、海量数据分析、云计算、物联网、智能电网等方面的基础研究、成果转化和产业合作,致力于从基础架构的独特视角总结其中的一般规律,开发共性关键技术,并在教育、制造、电力、石化等行业获得广泛应用;发表学术论文110余篇(SCI检索50余篇),编著学术论著3本,被国际国内同行引用2200次以上,单篇最高引用达300次以上;应用方面的合作成果发表在Nature等国际著名期刊上。
你在家中想继续完成一个工作计划,打开笔记本发现要编辑的文件在公司的电脑中;你想参考过去几天的会议记录和一些零星的想法,发现这些都在手机的备忘录中;你用Word完成了计划想以PDF的格式提交,发现你的电脑里没有安装Adobe的软件;你用Matlab进行模拟仿真计算,发现你的计算机运行的速度不够快……你发现你的工作只能在上班时间,坐在公司的办公室里完成—只能在特定的时间和地点完成特定的工作,为什么不能在任意时间、任意地点完成任意工作呢?这就是通常所说的Anytime,Anywhere,Any Application(A4)的问题。在计算机、网络、通信等信息技术如此发达的今天,应对这些看似简单的需求还是捉襟见肘。
清华大学信息技术研究院曹军威研究员和他的团队长期从事分布式计算技术的研究,指出要解决A4问题,需要彻底解决支持应用和计算完成的所有因素的跨域共享问题,而这是传统的计算模式所不能支持的。问题的根本在于需要从技术基础架构(Infrastructure)化的角度重新审视和反思计算技术的发展,和传统意义上成熟的基础架构(如电网、交通、通信、互联网等)相比,计算技术的基础架构化进程还远没有实现。为此,曹军威早在美国麻省理工学院工作期间就根据技术基础架构化的一般趋势,提出无极计算的理念,并致力于开发相关技术,实现将应用延伸到任意时间和空间的终极目标,完成无极时空的愿景。
无极计算——计算技术的基础架构化
1996年曹军威本科毕业,成为清华大学国家计算机集成制造系统(CIMS)工程技术研究中心研究生,一开始接触的科研工作就是基于分布式计算技术的制造业应用集成。1998年,他赴英国攻读计算机博士学位,进行网格计算的资源管理和调度方面的研究,毕业后又在欧美从事了多年网格计算应用方面的开发工作。这些经历都促使他不断地从更加本质的视角反思分布式计算技术的发展。
其实,网格计算最具启发性的就是它从基础架构的角度对其理念和初衷进行了清晰和透彻的阐述。为什么计算资源不能像电网一样做到按需使用?简单的问题实际上直指技术基础架构化的核心。虽然现在看起来网格计算在实际应用中遇到种种困难,但其计算资源基础架构化的初衷仍然是符合技术发展趋势的,仍然是目前包括云计算等在内的计算技术发展的终极目标。曹军威对于基础架构的思考和认识逐渐清晰起来,要将应用延伸到任意时间和空间,需要彻底解决支持应用和计算完成的所有因素的跨域共享问题,彻底实现计算技术的基础架构化,为此曹军威提出无极计算的理念。
根据百度百科的解释,“无极”原指“无边际,无穷尽”,出自《庄子•逍遥游》,也指一种古代哲学思想,指称道的终极性的概念。从计算技术而言,不同方面的科学研究人员或技术开发人员从不同角度提出了很多未来的分布式计算模式,如对等计算、网格计算、软件即服务、云计算等。借助无极的概念,是否能在一个统一的架构下实现这些不同的计算模式呢?这就需要对现有技术进行总结和反思,在对计算系统基础架构化的认识和把握基础上,从一个更加准确的视角理解未来计算系统的发展趋势,因此无极计算不是全新的计算技术理念。
传统的All-in-one(全内置设计)模式将支持应用的各种元素(主机、数据、软件和交互)集中在一起。系统对所有元素进行集中的统一的维护和管理,这样在操作系统的管辖下形成独立存在的单位,能够完成独立的任务并通过网络与外界进行信息交换,这是传统模式下应用元素的组织方式。曹军威研究员所提出的无极计算(elop computing)模式在元素层实现基于网络的跨域共享(见图1),进而通过一系列的上层服务彻底解决A4问题,实现计算和应用的无极限。具体如下:
元素层(e|element):元素层是无极计算基础架构的最底层,其基本功能是封装整个应用架构最基本的元素,完成元素间无缝的互操作、共享、访问控制与透明管理功能。
逻辑层(l|logic):逻辑层实现对基本元素的逻辑描述,将元素与具体物理地点解耦,实现异构屏蔽和统一的访问操作机制,使得上层应用能够不用关心具体元素的位置、性能等详细信息。
组织层(o|organization):组织层实现逻辑层所代表元素的合理组织与安全访问,提供认证、授权、信任机制等方面的支持。
流程层(p|process):流程层是应用使能的最上层,在组织机制的保证下将逻辑元素以流程的形式进行说明、支持聚合、运行和监测。
无极计算希望在计算基本元素的层面上实现基于网络的彻底分离和封装,通过逻辑层屏蔽资源的物理属性,再加上组织上安全、信任等方面的技术保证,通过不同的流程实现计算元素的自主聚合,最终目标是达到应用执行在时间和空间上的延伸。这样一来,以往的计算模式成为无极计算的一个侧影,网格计算尝试将主机和数据元素分离出来,软件即服务是只将软件分离出来等等。
无极计算的基础在于对底层元素的构建,如何建立合理的、完善的、完整的计算元素以适用于各个领域应用的需求是首先需要解决的关键基础问题,关系到元素之上各层次的设计方式。除此之外,还需要定义统一的通信协议和接口标准,使得元素层的的规划按照这种特有的专用模式来进行。对于计算和数据资源的封装可以借鉴网格计算中的做法,对于软件的封装可以借鉴网构件的思想,利用虚拟化的思想可以简化人机界面与应用的分离和远程访问的问题,这些需要在无极计算的框架下统一进行。
无极时空——物联时代的应用解决方案
2006年回国后,曹军威对基础架构的研究开始有了另一方面的理解。既然像网格计算这样的数字空间需要基础架构化实现资源的深度共享,为什么这一理念不能延伸到物理世界呢?各行各业的资源都会有一个互联、整合和共享的需要,这一想法也被近年来兴起的物联网技术与应用所印证。曹军威认为,物联网发展的内在动因是新一轮的基础架构化进程对数字和物理资源深度互联的需求,而无极计算的理念和技术实现同样适应物联时代的应用需求。
自1999年,由MIT的AUTO-ID CENTER首先提出物联网的概念时起,“物联网”在十多年的时间里逐渐为人熟知。随着互联网的巨大成功和无线网络技术的成熟,通过二者的结合,把现有互联网延伸并连接各种信息传感设备,进行信息交换和通信,从而实现智能化识别、定位、跟踪、监控和管理,导致了物联网的产生。
物联网是继个人计算机、互联网及移动通信网络之后全球信息化的第三次浪潮,是传感网、互联网(移动通信)、云计算,以及智能信息处理等信息技术发展到一定阶段,在应用需求和供给创新的双轮驱动下,通过水平分层与垂直整合技术脉络与产业链条而形成的全球性信息系统。
物联网概念从最初以RFID(radio-frequency identification)为特征,经以信息感知的传感器为特征,到目前以在前两者基础上的智能处理为特征,目的是把物理世界与信息世界紧密耦合在一起,形成感知—传输—处理—决策—控制的闭环系统,更好地为人们的生产、生活提供更加智慧的服务。
曹军威和他的团队近年来开发了无极计算软件工具包和硬件系统,以此为基础快速形成了物联时代特点的应用解决方案(见图2),希望以此实现无极时空的愿景。
无极物联网接入器的实现因为要和以传感器为主的数据源打交道,因此对实时计算的要求比较高。曹军威和他的团队开发了基于ARM嵌入式平台的无极物联网接入设备(见图3)。接入设备的主要功能是数据集中与分发,自动或被动地去收集下层大量布置的数据传感器上的采样数据,对这些数据进行分级处理,并做相应的记录,再汇集到上层的数据中心,实现从“物”(设备)到“网”(互联网)的连接功能。
无极物联网接入器的一个主要任务是对收集到的采样数据做分级处理。采样数据种类繁多,传感器数量又很大,在处理时要充分考虑占用空间小、处理流程简单清晰、处理时间短这样的方式。首先是将数据从传输报文中提取,然后判断该数据是实时数据还是历史数据;属于哪种类型,是属于一般等级还是优先等级;是完全归数据集中器分析处理,还是要继续上传给数据中心分析处理;有没有存储或者做记录的必要,以及对该数据生命周期的管理。这是一个完整的统筹规划的过程,依靠应用行业的类别,制定专门的处理规约,接入器的处理程序要依据这样的规约来设计。
与无极物联网接入器将物理系统传感数据接入相对应,无极云平台接入器通过虚拟桌面的嵌入式系统实现,将用户交互部分接入系统(见图4)。云平台接入器需要负责接收标准的远程显示协议(RDP)的命令数据,然后负责给出一种RDP命令数据到平台接口的映射机制以到达提供机制而非实现的目的。用户交互一般对移动性的要求比较高,接入器的选取还要做到价格低、体积小、使用方便等,只要能满足良好的图形处理能力就可以作为用户侧的云平台接入器,所以利用嵌入式设备实现人机界面在终端上的推送是一个可行性更高的方案。
云服务器主机的实现一般是聚集计算和存储资源的集群数据中心,通过虚拟化技术可以实现无极计算底层主机的封装形成虚拟主机,通过无极接入器与其他元素相连接,在无极软件架构的管理下支撑上层应用,最终实现嵌入式计算的实时性、数据中心的高效能和终端设备的移动性的完美结合。
目前曹军威和他的团队主要基于无极计算架构下的物联网应用解决方案开展智能电网广域监控方面的基础理论、仿真研究和应用示范,这方面的工作获得了国家973基础研究计划物联网课题的支持。同时他们还与国家重点行业企业密切合作,加强无极时空解决方案在政府部门以及制造、石化等行业的推广应用。
总之,从无极计算到无极时空,曹军威和他的团队坚信只要把握住信息和计算技术基础架构化的大趋势,针对不同时代的应用需求特点,依托清华大学雄厚的科研实力和技术积累,快速反应构建满足应用需求的解决方案,就能在基础研究、成果转化和产业合作各个层面作出应有的贡献。
曹军威,博士,清华大学信息技术研究院研究员、院务委员会副主任,美国麻省理工学院访问科学家。1991年至1998年,清华大学自动化系本科、硕士;2001年英国Warwick大学计算机博士;2002年至2006年先后在德国NEC欧洲实验室和美国MIT/LIGO实验室任Research Scientist;2006年回清华工作至今,主要从事先进计算技术及其应用研究。曹军威长期致力于基础架构科学、技术与应用研究,从事应用集成、网格计算、海量数据分析、云计算、物联网、智能电网等方面的基础研究、成果转化和产业合作,致力于从基础架构的独特视角总结其中的一般规律,开发共性关键技术,并在教育、制造、电力、石化等行业获得广泛应用;发表学术论文110余篇(SCI检索50余篇),编著学术论著3本,被国际国内同行引用2200次以上,单篇最高引用达300次以上;应用方面的合作成果发表在Nature等国际著名期刊上。
你在家中想继续完成一个工作计划,打开笔记本发现要编辑的文件在公司的电脑中;你想参考过去几天的会议记录和一些零星的想法,发现这些都在手机的备忘录中;你用Word完成了计划想以PDF的格式提交,发现你的电脑里没有安装Adobe的软件;你用Matlab进行模拟仿真计算,发现你的计算机运行的速度不够快……你发现你的工作只能在上班时间,坐在公司的办公室里完成—只能在特定的时间和地点完成特定的工作,为什么不能在任意时间、任意地点完成任意工作呢?这就是通常所说的Anytime,Anywhere,Any Application(A4)的问题。在计算机、网络、通信等信息技术如此发达的今天,应对这些看似简单的需求还是捉襟见肘。
清华大学信息技术研究院曹军威研究员和他的团队长期从事分布式计算技术的研究,指出要解决A4问题,需要彻底解决支持应用和计算完成的所有因素的跨域共享问题,而这是传统的计算模式所不能支持的。问题的根本在于需要从技术基础架构(Infrastructure)化的角度重新审视和反思计算技术的发展,和传统意义上成熟的基础架构(如电网、交通、通信、互联网等)相比,计算技术的基础架构化进程还远没有实现。为此,曹军威早在美国麻省理工学院工作期间就根据技术基础架构化的一般趋势,提出无极计算的理念,并致力于开发相关技术,实现将应用延伸到任意时间和空间的终极目标,完成无极时空的愿景。
无极计算——计算技术的基础架构化
1996年曹军威本科毕业,成为清华大学国家计算机集成制造系统(CIMS)工程技术研究中心研究生,一开始接触的科研工作就是基于分布式计算技术的制造业应用集成。1998年,他赴英国攻读计算机博士学位,进行网格计算的资源管理和调度方面的研究,毕业后又在欧美从事了多年网格计算应用方面的开发工作。这些经历都促使他不断地从更加本质的视角反思分布式计算技术的发展。
其实,网格计算最具启发性的就是它从基础架构的角度对其理念和初衷进行了清晰和透彻的阐述。为什么计算资源不能像电网一样做到按需使用?简单的问题实际上直指技术基础架构化的核心。虽然现在看起来网格计算在实际应用中遇到种种困难,但其计算资源基础架构化的初衷仍然是符合技术发展趋势的,仍然是目前包括云计算等在内的计算技术发展的终极目标。曹军威对于基础架构的思考和认识逐渐清晰起来,要将应用延伸到任意时间和空间,需要彻底解决支持应用和计算完成的所有因素的跨域共享问题,彻底实现计算技术的基础架构化,为此曹军威提出无极计算的理念。
根据百度百科的解释,“无极”原指“无边际,无穷尽”,出自《庄子•逍遥游》,也指一种古代哲学思想,指称道的终极性的概念。从计算技术而言,不同方面的科学研究人员或技术开发人员从不同角度提出了很多未来的分布式计算模式,如对等计算、网格计算、软件即服务、云计算等。借助无极的概念,是否能在一个统一的架构下实现这些不同的计算模式呢?这就需要对现有技术进行总结和反思,在对计算系统基础架构化的认识和把握基础上,从一个更加准确的视角理解未来计算系统的发展趋势,因此无极计算不是全新的计算技术理念。
传统的All-in-one(全内置设计)模式将支持应用的各种元素(主机、数据、软件和交互)集中在一起。系统对所有元素进行集中的统一的维护和管理,这样在操作系统的管辖下形成独立存在的单位,能够完成独立的任务并通过网络与外界进行信息交换,这是传统模式下应用元素的组织方式。曹军威研究员所提出的无极计算(elop computing)模式在元素层实现基于网络的跨域共享(见图1),进而通过一系列的上层服务彻底解决A4问题,实现计算和应用的无极限。具体如下:
元素层(e|element):元素层是无极计算基础架构的最底层,其基本功能是封装整个应用架构最基本的元素,完成元素间无缝的互操作、共享、访问控制与透明管理功能。
逻辑层(l|logic):逻辑层实现对基本元素的逻辑描述,将元素与具体物理地点解耦,实现异构屏蔽和统一的访问操作机制,使得上层应用能够不用关心具体元素的位置、性能等详细信息。
组织层(o|organization):组织层实现逻辑层所代表元素的合理组织与安全访问,提供认证、授权、信任机制等方面的支持。
流程层(p|process):流程层是应用使能的最上层,在组织机制的保证下将逻辑元素以流程的形式进行说明、支持聚合、运行和监测。
无极计算希望在计算基本元素的层面上实现基于网络的彻底分离和封装,通过逻辑层屏蔽资源的物理属性,再加上组织上安全、信任等方面的技术保证,通过不同的流程实现计算元素的自主聚合,最终目标是达到应用执行在时间和空间上的延伸。这样一来,以往的计算模式成为无极计算的一个侧影,网格计算尝试将主机和数据元素分离出来,软件即服务是只将软件分离出来等等。
无极计算的基础在于对底层元素的构建,如何建立合理的、完善的、完整的计算元素以适用于各个领域应用的需求是首先需要解决的关键基础问题,关系到元素之上各层次的设计方式。除此之外,还需要定义统一的通信协议和接口标准,使得元素层的的规划按照这种特有的专用模式来进行。对于计算和数据资源的封装可以借鉴网格计算中的做法,对于软件的封装可以借鉴网构件的思想,利用虚拟化的思想可以简化人机界面与应用的分离和远程访问的问题,这些需要在无极计算的框架下统一进行。
无极时空——物联时代的应用解决方案
2006年回国后,曹军威对基础架构的研究开始有了另一方面的理解。既然像网格计算这样的数字空间需要基础架构化实现资源的深度共享,为什么这一理念不能延伸到物理世界呢?各行各业的资源都会有一个互联、整合和共享的需要,这一想法也被近年来兴起的物联网技术与应用所印证。曹军威认为,物联网发展的内在动因是新一轮的基础架构化进程对数字和物理资源深度互联的需求,而无极计算的理念和技术实现同样适应物联时代的应用需求。
自1999年,由MIT的AUTO-ID CENTER首先提出物联网的概念时起,“物联网”在十多年的时间里逐渐为人熟知。随着互联网的巨大成功和无线网络技术的成熟,通过二者的结合,把现有互联网延伸并连接各种信息传感设备,进行信息交换和通信,从而实现智能化识别、定位、跟踪、监控和管理,导致了物联网的产生。
物联网是继个人计算机、互联网及移动通信网络之后全球信息化的第三次浪潮,是传感网、互联网(移动通信)、云计算,以及智能信息处理等信息技术发展到一定阶段,在应用需求和供给创新的双轮驱动下,通过水平分层与垂直整合技术脉络与产业链条而形成的全球性信息系统。
物联网概念从最初以RFID(radio-frequency identification)为特征,经以信息感知的传感器为特征,到目前以在前两者基础上的智能处理为特征,目的是把物理世界与信息世界紧密耦合在一起,形成感知—传输—处理—决策—控制的闭环系统,更好地为人们的生产、生活提供更加智慧的服务。
曹军威和他的团队近年来开发了无极计算软件工具包和硬件系统,以此为基础快速形成了物联时代特点的应用解决方案(见图2),希望以此实现无极时空的愿景。
无极物联网接入器的实现因为要和以传感器为主的数据源打交道,因此对实时计算的要求比较高。曹军威和他的团队开发了基于ARM嵌入式平台的无极物联网接入设备(见图3)。接入设备的主要功能是数据集中与分发,自动或被动地去收集下层大量布置的数据传感器上的采样数据,对这些数据进行分级处理,并做相应的记录,再汇集到上层的数据中心,实现从“物”(设备)到“网”(互联网)的连接功能。
无极物联网接入器的一个主要任务是对收集到的采样数据做分级处理。采样数据种类繁多,传感器数量又很大,在处理时要充分考虑占用空间小、处理流程简单清晰、处理时间短这样的方式。首先是将数据从传输报文中提取,然后判断该数据是实时数据还是历史数据;属于哪种类型,是属于一般等级还是优先等级;是完全归数据集中器分析处理,还是要继续上传给数据中心分析处理;有没有存储或者做记录的必要,以及对该数据生命周期的管理。这是一个完整的统筹规划的过程,依靠应用行业的类别,制定专门的处理规约,接入器的处理程序要依据这样的规约来设计。
与无极物联网接入器将物理系统传感数据接入相对应,无极云平台接入器通过虚拟桌面的嵌入式系统实现,将用户交互部分接入系统(见图4)。云平台接入器需要负责接收标准的远程显示协议(RDP)的命令数据,然后负责给出一种RDP命令数据到平台接口的映射机制以到达提供机制而非实现的目的。用户交互一般对移动性的要求比较高,接入器的选取还要做到价格低、体积小、使用方便等,只要能满足良好的图形处理能力就可以作为用户侧的云平台接入器,所以利用嵌入式设备实现人机界面在终端上的推送是一个可行性更高的方案。
云服务器主机的实现一般是聚集计算和存储资源的集群数据中心,通过虚拟化技术可以实现无极计算底层主机的封装形成虚拟主机,通过无极接入器与其他元素相连接,在无极软件架构的管理下支撑上层应用,最终实现嵌入式计算的实时性、数据中心的高效能和终端设备的移动性的完美结合。
目前曹军威和他的团队主要基于无极计算架构下的物联网应用解决方案开展智能电网广域监控方面的基础理论、仿真研究和应用示范,这方面的工作获得了国家973基础研究计划物联网课题的支持。同时他们还与国家重点行业企业密切合作,加强无极时空解决方案在政府部门以及制造、石化等行业的推广应用。
总之,从无极计算到无极时空,曹军威和他的团队坚信只要把握住信息和计算技术基础架构化的大趋势,针对不同时代的应用需求特点,依托清华大学雄厚的科研实力和技术积累,快速反应构建满足应用需求的解决方案,就能在基础研究、成果转化和产业合作各个层面作出应有的贡献。