浅析民航气象数据库系统巡检

来源 :世界家苑 | 被引量 : 0次 | 上传用户:dongwujunye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:民航气象数据库系统是民航气象业务的核心信息系统,其24小时不间断的运转保证了气象业务的正常开展,本文重点阐述了数据库系统设备巡检的内容。
  关键词:民航气象数据库系统;巡检;AIX;故障处理
  引言
  民航数据库系统是民航气象业务的核心信息系统,它采用一套分级的,包含发送、请求、响应、回复、转发等多种功能的,复杂的数据交换模式,实现了实时收集、处理、储存、交换民航国内、国际飞行所需的综合航空气象情报信息的功能,提供给用户气象资料自动分析和制作等功能,为航空气象用户提供航空气象产品[1]。
  1配置分析
  民航气象数据库系统分为三级体系架构,每一级根据业务处理能力的实际需求进行不同的配置,同级间则采用了相同的配置。本场属于民航气象第三级数据库系统,系统由一台ibm system p520 作为数据库服务器,一台ibm system p520 作为应用服务器,一台DELL OPTIPLEX 745作为通信服务器,采用cisco2960 交换机作为本地网络的核心交换机,通过cisco2851 路由器与所在地区气象中心数据库相连,利用cisco pix 515e 作为安全隔离。在数据库服务器和应用服务器上,均安装了AIX操作系统并搭配目前功能最强大的ORACLE数据库,而通信服务器则安装了Linux操作系统[2]。
  2数据库主机系统、网络系统与数据库巡检
  通过本场一次气象数据库系统硬盘自身驱动器监控报错故障处理分析,结合AIX系统管理技术学习,总结出了民航气象数据库系统在维护时对主机系统、网络系统、数据库进行巡检的方法及命令总结,以便发现问题及时处理。在巡检中可以使用工具Secure CRT,它的记录功能非常实用,方便对巡检过程进行保存和后期检查。
  2.1主机系统
  针对济南本场的情况,数据库系统主机系统的巡检包括了数据库服务器DB00、数据库服务器DB01、通信服务器,其中数据库服务器安装的是AIX操作系统,通信服务器安装的是Linux操作系统。
  2.1.1数据库服务器的巡检内容
  (1)用命令errpt查看日常报错,一旦系统的某个功能模块检测到一个错误或定义的需要记录日志的事件,则记录到/dev/error,错误进程errdemon从/dev/error文件中读取错误日志,然后根据错误模板库(/var/adm/ras/errtmpit)和错误消息库(/usr/lib/nls/msg/$LANGcodedepoint.cat)对其进行处理后写入系统的错误日志/var/adm/ras/errlog中,正常情况下错误进程errdemon处于开启状态,当使用more或者其他文本的查看命令来打开errlog文件,看到的只有乱码,为了能够查看日志,需要使用errpt命令,命令执行后输出的六列内容分别为错误标示符、时间戳、类型、种类、资源名和描述。
  当需要查看详细报错内容时,需要输入指令errpt –aj +错误代码。在软件错误日志中的故障原因(Failure Causes)通常是指一个软件缺点,如果有用户原因(User Causes)或安装原因(Install Causes)或二者都有,而没有故障原因,那么问题通常不是软件的缺点。而对硬件设备进行诊断的时候,最常用的是并发模式下诊断硬件设备,在root用户下使用diag命令进入诊断主菜单,按照现场情况采用Diagnostic Routines和Advanced Diagnostic Routines进行硬件检测。需要注意的是在做diag诊断时,并发模式下是比较危险的,可以选择停止服务器的服务和业务后再做,可以避免可能出现的系统崩溃问题[3]。
  用户原因(User Causes)、安装原因(Install Causes)和故障原因(Failure Causes)只是一般的建议,更换部件则需要根据诊断和对错误日志的分析结果来确定。
  (2)用命令lsvg –l rootvg查看系统rootvg内的每个逻辑卷的以下信息,LV:卷组内的一个逻辑卷;Type:逻辑卷类型;LPs:逻辑卷中的逻辑分区数;PPs:逻辑卷使用的物理分区数;PVs:逻辑卷使用的物理卷数;Logical volume state:逻辑卷的状态;Opened/stale:表示逻辑卷是打开的但包含的分区不是当前的;Opened/syncd:表示逻辑卷是打开和同步的,Closed 表示逻辑卷还没有打开;Mount point:逻辑卷的文件系统安装点。
  (3)用命令topas查看系统CPU使用率和工作状态,具体每项内容分为Kernel:
  操作系统的内核占用的CPU时间比率;User:用户进程占用的CPU时间比率;Wait:CPU处于等待状态占CPU时间的比率;Idle:CPU空闲时间比率。Real:MB操作系统实际拥有的内存的总量,单位是MB;%Comp,计算型内存占用比率;%Noncomp非计算型内存占用的比率;%Client也为非计算型内存,Noncomp包涵Client型内存,jfs文件系统使用的内存为noncomp,为了区分,jfs2和nfs使用的内存为Client。
  (4)用命令df –g以G为单位查看磁盘使用率,当一个文件系统空间被占满之后,就会导致大量的问题出现,甚至系统崩溃,因此最好要避免这种情况的发生。
  (5)用命令lsps –a查看内存交换区使用率,济南本场情况为运行时间5个月的服务器,2G内存基本耗尽,交换分区使用了百分之三十至四十,重启后降至百分之十,在系统内存耗尽并且交换分区使用率达到百分之八十以上时,系统崩溃的可能性增大,需要考虑增加物理内存。
  (6)用命令svmon查看系統内存使用率。在非常繁忙的系统中,svmon收集的数据和真实的数据会有所差距,因为svmon使用的全是VMM中的数据,而在svmon进程搜集的过程中,VMM(虚存管理器)可能已经发生改动了。   在使用svmon命令时,也可以增加参数来输出需要的更为详细的内容,例如svmon –G是全局统计信息,svmon –U root oracle –w是输出只考虑工作段的用户 root 和 steve 的内存使用统计信息等。
  (7)用命令lspv 硬盘名(例如hisk0)主要用来显示卷组(Volume)中的物理卷(PV,Physical Volume)信息,在输出信息中需要关注硬盘是否有陈旧(stale)块,若存在陈旧分区、逻辑卷或物理卷,可以尝试使用syncvg命令来同步它们。
  (8)网络巡检主要利用命令:ifconfig –a;netstat –rn;netstat –i,依次检查所有网络接口的信息、核心路由表、通过接口传送数据包的数量以及输入/输出的错误数。
  2.1.2通信服务器的巡检内容
  (1)用命令df –h以GB,MB,KB等查看磁盘利用率。linux文件系统的内核在识别和使用文件系统时需要利用virtual filesystem switch(虚拟文件系统)来读取文件系统,也就是说整个LINUX的文件系统都是VFS在进行管理的,我们用户并不需要知道每个分区上头的文件系统是什么,VFS会主动帮我们做好读取工作,有了VFS我们可以不用去指定读取的是哪一个文件系统,只需要输入指令进行查看即可。
  (2)用命令top可以查看系统的状态,比如CPU、内存的使用。具体输出内容包括当前系统时间、登陆系统的用户数量、负载情况、任务进程、CPU状态、内存状态、swap交换分区状态内存总量以及各个进程的状态监控。另外,使用free命令也可以查看swap交换分区使用率。
  (3)MQ应用方面巡检,需要查看通道状态使用命令showchl,正常状态应显示:Running,若未启动,则需要使用命令runmqchl进行启动。查看队列状态使用命令showque,正常状态应显示:0,如队列有积压,则检查通道状态。
  (4)使用ifconfig –a;netstat –rn;netstat –i命令依次检查配置信息、路由表、网络接口情况,对网络进行巡检。
  2.2网络系统
  民航数据库系统网络系统巡检需要检查的内容包括了交换机cisco3750、路由器cisco2851和防火墙pix515,下面针对济南本场具体情况结合需要的命令进行介绍。
  2.2.1检查cpu使用率
  在交换机和路由器中,使用命令show processes cpu可以输出CPU在最后5秒的使用率、最后1分钟的使用率和最后5分钟的使用率,同时显示正在运行的进程状态。在防火墙中则需要使用命令show cpu usage。
  2.2.2检查内存使用率
  在交换机、路由器和防火墙中均使用show memory命令查看内存使用率,具体输出内容为使用内存情况的统计信息,包括空闲池统计信息。
  2.2.3设备电源及风扇
  在交换机和路由器中使用show env temp命令可以查看设备电源、风扇、温度,其中交换机需要注意RPS正确显示为NOT PRESENT。
  2.2.4检查log日志
  在交换机、路由器和防火墙中均使用show log命令检查log日志,主要包括了Syslog logging、Console logging、Monitor logging、Buffer logging、Trap logging几个项目。
  2.3数据库
  本部分介绍ORACLE数据的检查内容,专门列出了数据库状态、告警日志文件、数据库连接、数据文件的状态、表空间使用情况和数据库等待事件的检查方法及命令。
  2.3.1检查数据库状态
  确认所有的INSTANCE状态以及listener状态正常,登陆到所有数据库或实例,检测ORACLE后台进程,RAC状态等。具体命令分别为oracle@ZSJN $ps -ef|grep ora;oracle@ZSJN $lsnrctl status;SQL>select status from V$instance。
  2.3.2检查告警日志文件
  数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600)定期检查日志文件,根据日志中发现的问题及时进行处理;包括alert,trc,listener日志其中alert位置:/u0/oracle/admin/ ZSJN /bdump;trc位置:/u0/oracle/admin/ ZSJN /bdump;listener位置:/u0/oracle/product/10.2.0/db/network/log。
  2.3.3检查数据库连接信息
  定时对数据库的连接情况进行检查,看与数据库建立的会话数目是不是正常,如果建立了过多的连接,会消耗数据库的资源。同时,对一些“挂死”的连接,可能需要手工进行清理。利用命令SQL>select count(*)from v$session;和SQL>select sid,username,program,status from v$session;进行检查。
  2.3.4检查数据文件的状态
  如果数据文件的STATUS列不是AVAILABLE,那么就要采取相应的措施,如对该数据文件进行恢复操作,或重建该数据文件所在的表空间。参考命令
  SQL>select file_name,status from dba_data_files;
  SQL>select count(*)from dba_data_files;
  SQL>select count(*)from dba_data_files;
  2.3.5检查表空间使用情况
  检查表空间使用情况的命令是SQL>select f.tablespace_name,a.total,f.free,round((f.free/a.total)*100)"% Free"
  from(select tablespace_name,sum(bytes/(1024*1024))total from dba_data_files
  group by tablespace_name)a,(select tablespace_name,round
  (sum(bytes/(1024*1024)))free from dba_free_space group by tablespace_name)f WHERE a.tablespace_name=f.tablespace_name(+)order by "% Free"。
  2.3.6检查数据库的等待事件
  如果数据库长时间持续大量像latch free,enqueue,buffer busy waits,db file sequential read,db file scattered read等等待事件时,需要对其进行分析,可能存在问题的语句。使用到的命令是SQL>select sid,event,p1,p2,p3,WAIT_TIME,SECONDS_IN_WAIT from v$session_wait where event not like 'SQL%' and event not like 'rdbms%'。
  参考文献
  [1]梁帆. 民航气象第三级数据库系统管理维护和典型故障处理.硅谷.2011,24:124-125.
  [2]張迪馨. 民航二期气象数据库系统主机维护经验总结.空中交通管理.2007,08:45-46.
  [3]于宇斌,IBM UNIX&Linux—AIX 5L系统管理技术[M].北京:电子工业出版社.2005.
  (作者单位:中国民用航空空中交通管理局华东地区山东分局)
其他文献
摘 要:关注高中学生数学学习心理,由德育展开育智。分别论述了三各重要方面,从尊师重道、严格规范、关注学生分层发展来构建深层次师生关系,以期激发学生的学习斗志、监督和管理学生的学习习惯,同时培养学生做人做事的勇气和刚正。  关键词:尊师重道;规范严格;分层教学;师生关系  面对成绩好并且学习习惯好的学生,教学效果会很好,但是面对一些学习习惯和数学成绩较差的学生,应该采用什么措施来扭转局面,使得这些学
期刊
摘 要:教育体制的改革,促使我国高校教育体系、教学理念、教学模式发生了根本性变化。科技资源的不断发展,涌现出多样化的教学形式。在高校教育体系中,传统教学模式已无法适应新时代对素质型、全能型人才的需求,混合式教学逐渐走进高校教育工作者的视野中。这种新型且高效的教学模式使得大学英语教学活动得以顺利革新和开展,极大地改善了以往学生兴趣低、语言交际能力差等问题。  关键词:大学;英语;混合教学;可行性  
期刊
摘 要:本文首先介绍了语料库的定义、语料库的分类以及21世纪第三代语料库的的发展以及特点。接着用平行语料库和单语语料库的例子来说明语料库技术是如何驱动翻译研究范式发生改变的。最后说明即使语料库在翻译学研究中具有极大优势,但是由于语料库技术发展并不成熟,也存在着诸多问题。  关键词:语料库翻译;平行语料库;单语语料库  语料库是一种极为复杂的资源库,用不同的标准可以将其分为不同的类型。如果按用途划分
期刊
摘 要:信息化教學是以现代信息技术为基础,充分利用现代信息技术和信息资源,科学地安排教学过程的各个环节和要素,以实现教学过程的优化。笔者总结目前在高职教学中常用的信息化教学手段,通过介绍智慧课堂、游戏化教学、在线课程特点以及应用范围,探索信息化教学手段对于教学优化的帮助,合理安排信息化手段进行教学优化。  关键词:信息化;智慧课堂;游戏化教学;在线课程;教学优化  1.引言  传统的课堂教学模式是
期刊
摘 要:语文是学好其他科目的基础课程,是各个学习阶段必不可少的科目,也是我国课程教育中的重要部分,是中华文化的浓缩,也传扬中华文化的方式。而汉语言文学是高等院校的一个专业,不同于语文贯穿从小学到高中的各个阶段,它仅限于高等院校,但它也是在语文基础上开展的专业。这门课程的目的在于通过学习汉语言,发掘需要的魅力,改善学生的表达能力,组织能力。当代教育理念下,汉语言文学和语文课程并不冲突,二者有区别也有
期刊
摘 要:近几年,财政部全面推进管理会计体系建设,在指导意见中,明确提出四大任务和措施,而其中三条都涉及鼓励单位与科研院校合作。而现实情况是,在高等院校中,虽然有企业与高等院校合作,但是合作企业往往只是提供建议,而很少决策。一些课题虽然与企业有关,也是一些无关痛痒的问题。同样,在企业中,很少有高校教师进入企业锻炼,锻炼的时间也不够长,不能对企业及管理、业务深入了解,更提不出对企业的一些实质性有益建议
期刊
摘 要:新媒体时代的到来,给高职院校的学生管理工作带来了机遇,但同时也提出了严峻的挑战,如何在新形势下进一步创新学生管理工作,这也给高职院校提出了新的思考。文章总结了当前高职院校学生管理工作中存在的不足,分析了新媒体时代给高职院校学生管理工作带来的机遇和挑战,并针对性的提出了在新媒体时代加强高职院校学生管理工作的创新对策。  关键词:新媒体;高职院校;学生管理;创新  一、当前高职院校学生管理工作
期刊
摘 要:通过调查辽东学院经管类专业大学生创业意愿与创业能力,了解经管类专业大学生的创业意愿与创业能力的现状和创业所需的六个能力与专业、年级以及性别存在怎样的关系,并对调查结果提出建议。  关键词:经管类大学生;创业意愿;创业能力  一、调查背景  随着大学教育的逐渐普及,越来越多的大学毕业生在毕业之后面临着严峻的就业形势,在激烈的竞争中,很多人都无法实现自身的社会价值。激烈的就业竞争环境,使得人们
期刊
摘 要:近年来,大学生轻生事件涌入我们的视野,这些事件深层次透露出的是当代大学生生命价值观所存在的问题。当代大学生生命价值观存在积极与消极两极发展趋势。生命价值观对大学生的影响是重大的,然而由于受到社会、学校、家庭以及大学生自我认知等因素的影响,大学生生命价值观存在严重缺陷,给大学生的成长造成了不利影响。全社会应该共同致力促进大学生树立正确生命价值观,着重于教育方式促进发展。  关键词:大学生;生
期刊
摘 要:等教育自学考试本科与高职教育衔接(以下简称“专本衔接)是指符合条件的高职高专院校组织在校生,在高等自学主考高校的指导下实施助学辅导,参加高等教育自学本科专业的考试,为高职高专在校生提供接受继续教育和取得高一层次学历的机会。文章通过自学助考的优势分析,成为自考考试困境和加快实用型人才培养的重要途径。  关键词:自学考试;专本衔接  专本衔接是自学考试实施多年来在形式上的新尝试,是对原有的自学
期刊