论文部分内容阅读
很多大的疾病都是因为小的毛病引起的。如果人们平时能多关注这些小毛病并及时做出相应的调养方案,那么人们患大病的概率就会大大降低。人既如此,那么不停工作的计算机设备呢?显然,它们更需要维护人员定期或不定期地关注其各种“身体”指标。就让我们为这些辛劳的设备定期做体检吧。
建体检中心很必要
显然,要为计算机设备做体检,一个体检设施齐全的体检中心是必不可少的。也许有人会说现在分析计算机性能的软件很多,随便用一个来分析一下不就行了嘛,为何还要建立专门的体检中心呢?这是一种非常直接的想法,同时也是未经分析的方法。比如,某集团公司目前有各种ERP系统、实时生产系统等各种系统和近100台服务器,所涉及的操作系统各式各样,上述方法显然行不通。而且计算机的性能往往是非线性的,不具有特定的规律,只是偶尔检测服务器的指标并没有代表性。采用软件对服务器进行一个一个的体检也是不现实的。这时,体检中心的重要性就突显出来。
对计算机设备的体检与对人的体检原理基本相似,但也有不同之处。其中最关键的就是计算机的各种身体指标呈非线性分布而且其性能与所运行的软件及软件运行的时间关系极大,仅通过一两次检测是无法确定计算机的状况的。同时,计算机上运行的应用系统不一样,所需体检的指标也不一样。显然一个体检设施齐全的体检中心是很必要的,同时它还必须能够长时间不间断地观察计算机设备的“身体”状态,并作记录,从而对计算机设备的各项指标做出相应的报告,甚至进行人机交互,使运维人员可第一时间了解到设备的运行状态。比如,上海哲涛科技自主研发的计算机设备“体检”中心——SUM(服务器集中监控与管理平台),能真正地像医院的体检中心那样实时对计算机设备各项性能指标进行检测、记录与分析。运维人员不用关注每一个单一的计算机設备,进入此体检中心可一目了然地了解到所有计算机设备的各种指标。集中检测、记录、出具统一的报告是一个体检中心必须达到的要求,否则就达不到真正的体检目的。
先确定体检指标
有了体检中心就有了对计算机设备进行体检的基础,但具体要体检什么指标呢?是测“血压”还是量“体温”呢?这就要运维人员根据系统所承载的软件和工作任务来确定具体要对哪些指标进行体检。比如有些计算机需要检测CPU使用率,有的要检测内存使用情况,而有的又要检测磁盘空间的使用情况,有的设备又需要检测具体进程的CPU使用率和内存使用率等。体检中心通过网络实时检测网络中设备的各种性能指标,并实时产生性能变化趋势。
定期或不定期体检
设备的各种指标展示了设备在某一时间点的状态。但正如前文所描述的,设备的性能往往是非线性的而且与很多软件的因素有关,所以定期查阅、记录设备的性能分析报告和性能参数等显得十分重要。在体检中心,我们可以查阅有关各种性能的分析报告。它们从统计学、故障率等方面说明设备的表现,从而帮助运维管理员有效地安排和部署软硬件设施。
缺什么补什么
通过查询和分析设备的各种性能,可以大致了解到设备的弱项。有的可能是软件的配置问题,有的可能是硬件问题,有的可能是软件的部署结构问题。不管是什么问题,它们都将表现到设备的资源使用率和状态分析报告中。通过对设备体检,我们就可以有针对性地了解设备和软件的总体部署,从而能够更加合理地安排硬件,而不是盲目地购置设备和大型的运维软件,特别是一些大型的运维软件本身的使用也将大大花费人力成本,这样将适得其反。
通过一个简易的体检中心来对设备进行实时体检,是现在的运维管理员必需的工具之一,特别是许多企业和机构都有各种不同的系统、软件,通过运维管理员的人工管理和监控是很难达到监控和管理的目的的,而且这样成本也很高。如果构建一个简易的体检中心,那将给企业和机构等具有较多服务器的组织带来极大的经济效益,并能节省故障的排查时间。
建体检中心很必要
显然,要为计算机设备做体检,一个体检设施齐全的体检中心是必不可少的。也许有人会说现在分析计算机性能的软件很多,随便用一个来分析一下不就行了嘛,为何还要建立专门的体检中心呢?这是一种非常直接的想法,同时也是未经分析的方法。比如,某集团公司目前有各种ERP系统、实时生产系统等各种系统和近100台服务器,所涉及的操作系统各式各样,上述方法显然行不通。而且计算机的性能往往是非线性的,不具有特定的规律,只是偶尔检测服务器的指标并没有代表性。采用软件对服务器进行一个一个的体检也是不现实的。这时,体检中心的重要性就突显出来。
对计算机设备的体检与对人的体检原理基本相似,但也有不同之处。其中最关键的就是计算机的各种身体指标呈非线性分布而且其性能与所运行的软件及软件运行的时间关系极大,仅通过一两次检测是无法确定计算机的状况的。同时,计算机上运行的应用系统不一样,所需体检的指标也不一样。显然一个体检设施齐全的体检中心是很必要的,同时它还必须能够长时间不间断地观察计算机设备的“身体”状态,并作记录,从而对计算机设备的各项指标做出相应的报告,甚至进行人机交互,使运维人员可第一时间了解到设备的运行状态。比如,上海哲涛科技自主研发的计算机设备“体检”中心——SUM(服务器集中监控与管理平台),能真正地像医院的体检中心那样实时对计算机设备各项性能指标进行检测、记录与分析。运维人员不用关注每一个单一的计算机設备,进入此体检中心可一目了然地了解到所有计算机设备的各种指标。集中检测、记录、出具统一的报告是一个体检中心必须达到的要求,否则就达不到真正的体检目的。
先确定体检指标
有了体检中心就有了对计算机设备进行体检的基础,但具体要体检什么指标呢?是测“血压”还是量“体温”呢?这就要运维人员根据系统所承载的软件和工作任务来确定具体要对哪些指标进行体检。比如有些计算机需要检测CPU使用率,有的要检测内存使用情况,而有的又要检测磁盘空间的使用情况,有的设备又需要检测具体进程的CPU使用率和内存使用率等。体检中心通过网络实时检测网络中设备的各种性能指标,并实时产生性能变化趋势。
定期或不定期体检
设备的各种指标展示了设备在某一时间点的状态。但正如前文所描述的,设备的性能往往是非线性的而且与很多软件的因素有关,所以定期查阅、记录设备的性能分析报告和性能参数等显得十分重要。在体检中心,我们可以查阅有关各种性能的分析报告。它们从统计学、故障率等方面说明设备的表现,从而帮助运维管理员有效地安排和部署软硬件设施。
缺什么补什么
通过查询和分析设备的各种性能,可以大致了解到设备的弱项。有的可能是软件的配置问题,有的可能是硬件问题,有的可能是软件的部署结构问题。不管是什么问题,它们都将表现到设备的资源使用率和状态分析报告中。通过对设备体检,我们就可以有针对性地了解设备和软件的总体部署,从而能够更加合理地安排硬件,而不是盲目地购置设备和大型的运维软件,特别是一些大型的运维软件本身的使用也将大大花费人力成本,这样将适得其反。
通过一个简易的体检中心来对设备进行实时体检,是现在的运维管理员必需的工具之一,特别是许多企业和机构都有各种不同的系统、软件,通过运维管理员的人工管理和监控是很难达到监控和管理的目的的,而且这样成本也很高。如果构建一个简易的体检中心,那将给企业和机构等具有较多服务器的组织带来极大的经济效益,并能节省故障的排查时间。