基于zabbix和OMSA的集群硬件健康报警

来源 :中国新通信·理论版 | 被引量 : 0次 | 上传用户:adayidaai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:通过对播控平台现有zabbix监控功能及日常使用方面的经验,总结出需要在现有基础上增加对于服务器硬件层面的监控,结合服务器厂家提供的基础性能监控OMSA研究讨论出一种可为平台各服务器进行硬件监控的方案。
  关键词:zabbix;OMSA;硬件监控
  一、前言
  江西iptv集成播控平台包含53路高清、77路标清直播频道,所有信号经由卫星机接收,编码器转码分为两种码流HLS和udp,HLS为单播,udp为组播,单播通过中心CDN服务器传输给运营商,组播通过组播交换机传输给电信运营商。为全省人民提供优质的直播视听服务。
  为了更好的服务全省人民,平台提供了各类增值业务。增值业务部署于平台服务器集群中,集群服务器数量200余台。服务器分属于4个区域:中心区域,电信区域,联通区域,移动区域。区域内部靠华为9306汇聚链接,联通、移动、电信区域互不相连,中心区域可达其他三大区域。
  二、监控系统
  监控的原理是通过部署在相关设备上的信息收集程序对相关设备进行信息收集并且在需要的情况下上传到特定的服务端进行信息处理,一般情况下处于相关设备上的称为客户端,对客户端传递来的信息进行处理的成为服务端。大多数场合使用的都是C/S方式即客户端-服务端架构,另外还有客户端-代理-服务端这种架构方式。
  监控的作用是告警和预警,平台部署监控有利于提前发现问题和在出现问题的时候提醒技术人员迅速处理,设计报警的时候需要考虑报警的合理性和报警效率。
  ZABBIX监控即使一种分布式且功能齐全的开源告警监控系统,拥有灵活的扩展性和丰富的功能。
  江西iptv集成播控平台有大量的戴尔服务器,而戴尔服务器的硬件信息是通过IDRAC进行管理的,IDRAC不支持与zabbix的数据接口进行对接,不能满足我们的需求。通过多方咨询,戴尔官方还提供了一款开源名为OMSA的IT系统管理解决方案。
  三、 OMSA
  OMSA(全称Openmanage Server Administrator),是戴尔公司发布的一套IT系统管理解决方案。其提供了web界面和操作系统相关的命令行工具,技术人员可以通过这两种方式对服务器硬件层面进行查询和管理。
  四、编写系统脚本
  通过运行/opt/dell/srvadmin/bin/omreport chassis命令可以初步的得到服务器硬件的基本状态,例如cpu,内存,风扇,电源等的健康状态。但是这需要登录服务器运行命令才能得到输出结果,为了实现自动化运维的思路,需要把命令的关键输出信息进行收集并且传递到zabbix相关agent里面进行key的制作。让每台服务器的硬件健康信息呈现在现有的zabbix监控界面。
  (一)脚本实例
  设定zabbix收集信息的命令:
  UserParameter=hardware_cpu_model,awk -v hardware_cpu_crontol=`omreport  chassis biossetup|awk '/CState/{if($NF=="Enabled") {print 0} else {print  1}}'` -v hardware_cpu_c1=`omreport chassis biossetup|awk '/C1[-|E]/{if($NF=="Enabled") {print 0} else{print 1}}'` 'BEGIN{if(hardware_cpu_crontol==0 && hardware_cpu_c1==0){print 0} else {print 1}}'
  上面为收集cpu健康状态并且把是否ok的信息传递到zabbix的agent的一个简单的脚本,其他的收集内存,风扇等都是通过类似的命令格式进行收集的。
  服务器上面的监控脚本编写完成,需要在zabbix页面上添加key以便呈现在监控页面及设置报警触发器
  (二)触发器的阈值
  Zabbix客户端模式的报警流程是先先收集到服务器的信息,然后储存到zabbix自己的数据库里面,并且该数值与设定的触发器值进行比较,如果达到阈值就会触发报警,在zabbix首页进行显示,并且如果设定声音报警或者其他动作报警(微信、短信等)就会发送报警信息到相关终端。
  关于报警的阈值需要按照实际情况进行配置。报警的严重性级别也可以按照对生产环境的影响程度进行区分。Cpu、内存这种直接影响到现网业务稳定性的关键性硬件是必须设置为最高级别严重性的,因为这几个硬件如果出现问题,对服务器而言是灾难性的。
  1、訪问zabbix控制页面http://xxx:85
  2、点击配置-主机-选择相关主机-监控项-创建监控项
  3、填写名称、类型、键值、信息类型、数据类型等,填写完成点击更新即可创建完成。
  (三)监控效果
  监控项可以配置为固定模板以方便对整个集群服务器添加监控。
  1、配置-模板-创建模板-填写相关项信息。
  2、对每台服务器进行模板链接即可创建成功。
  3、声音及页面弹窗报警
  IPTV播控平台是7*24小时都有值班人员的高度监测环境,播出系统几乎完全封闭于一个内部网络架构,所以微信报警这种需要外网环境基础的报警方式并不适用。声音及弹窗报警这种无外网环境且实时的性最高的报警方式是最适合IPTV平台的,只需在监控大屏上投放zabbix监控界面即可,如果遇到事件即会在监控大屏显示且会有报警声音传出。
  五、结语
  在对整个集群配置完成集群硬件健康报警管理后,IPTV平台的集群稳定性得到了充足的提升,对每日运维巡检工作也大大提高了效率,运维人员无需频繁进入IDC机房进行硬件设备的巡检,只需对监控选项进行一定程度的信息查看即可,运维人员在中心机房就可以远程做到对各个机房设备的硬件健康监控,当某一服务器硬件部分出现了一定程度的健康下降时,报警信息会及时的呈现在监控大屏上,故障反应时间精确到秒级,运维人员在接收到报警后可以迅速做出应对,剔除失败的业务服务器,抢修事故机器等,从而实现高度自动化运维,安全播出保障工作也得到了进一步的提升。
其他文献
摘 要:要想确保国民经济良好发展,就需要确保城市电网规划与设计工作做到位。而合理的规划设计必须要在有限的成本上,根据城市实际发展情况,借助技术理念,综合电网规划设计趋向,确保电力提供可以推动城市经济发展。  关键词:城市电网;规划设计;关键技术  一、城市电网规划与设计基本條件  第一,保证科技先进性与实用性。进入数字化社会,电力领域智能化到来,城市电网规划设计同样要与国际接轨,引进新的科学技术
期刊
摘 要:110kV电网作为输电网与配电网的重要衔接,直接影响着电能的分配利用,对整个电力系统的运行效能起着重要作用。系统全面的110kV电网规划可以确保电网建设与经济社会发展相协调。当前,我国经济社会发展正在从规模速度型向质量效益型转变,本文通过对新形势下110kV电网规划设计相关问题的分析与论述,为电网规划工作的技术原则和重点任务提供参考。  关键词:新形势;110kV电网;规划;设计  一、
期刊
摘 要:当前我国的市政公用工程飞度发展,随着诸多先进的施工技术得到利用 ,在保证施工质量的同时,水电等资源也得到了有效利用。笔者主要讨论市政公用给排水施工中节水技术的应用,并分析市政公用给排水中具体的节能措施,希望可以促进我国市政公用工程的健康发展。  关键词:市政公用工程;给排水施工;节能节水技术;应用  前言:目前, 市政公用工程的主要目标是设计出科学合理的给排水系统以及减少能源节约。 节能
期刊
摘 要:在当前时代下,随着我国网络技术的不断发展,人们使用计算机网络的频率在不断的增加,但是在计算机网络应用的过程中,很有可能会出现数据的泄露和丢失的问题,给实际的工作带来诸多的影响。因此在当前时代下,计算机网络数据加密技术得到了广泛的运用,为了最大程度的提高计算机网络数据加密技术的应用效果,要结合计算机网络数据加密技术的要求和需求,选择正确的数据加密技术,最大程度的保护计算机网络中的数据安全。
期刊
摘 要:當前随着科学技术与各行业的发展,对于计算机设备以及智能管理的要求越来越高。计算机硬件智能化管理系统的研发正是顺应了这一要求,主要用于计算机设备的科学管理以及各行业计算机工作的数据支持。计算机硬件智能化管理系统的应用大大提高了计算机硬件设备的利用效率,并在一定基础上节约人力、物力等资源。据此,本文将围绕计算机硬件智能化管理系统的研发展开深入的分析和讨论,希望能够帮助相关人员顺利开展其工作。
期刊
摘 要:相比于4G网络,5G网络在架构组成上已经出现较大变化,其5G承载网对传送网提出了更高的技术要求,也对现有的PTN网络实现了延续与升级优化。所以本文中专门探析了5G传送网中的SPN新技术,对其组网架构、环网带宽容量等等进行了分析解读。  关键词:SPN切片分组网;5G传送网;组网架构;带宽容量;技术优势  SPN切片分组网(Slicing Packet Network)属于5G网络切片中的
期刊
摘 要:民机行业发展迅猛,面对日益增加的手册翻译量,以及编制与翻译人员匹配不平衡的局面,民机出版物应当与时俱进,引入人工智能技术,让机器取代重复性劳动;减轻译员在低技术含量工作中的负担,将人力资源得到最合理,最有效的利用;让人工智能协助人的工作,提高翻译效率和翻译质量,保证及时交付高质量的手册。  关键词:人工智能;机器翻译;民机出版物  一、引言  人工智能(Artificial Intell
期刊
摘 要:Linux与Windows之间的文件共享,可由Samba软件实现。通过在Linux服务器上安装Samba软件作为SMB server,可共享出部分硬盘空间,供其它windows机器使用。配合NFS,可实现跨平台多服务器间的文件共享。  关键词:数据;效果;服务器  一、案例实施背景  某数据中心随着业务发展和运维水平的提高,Windows服务器数据备份、跨平台文件共享的场景越来越多。与此
期刊
摘 要:目前,我国已经进入了信息化发展阶段,各行业中信息技术的应用十分广泛,在这样的背景下,随着医院自身规模的不断扩大,网络技术等在医院中也得到了较好的应用。虽然网络技术、信息化技术等可以帮助医院的运行效率得到有效提高,但是,也让医院的日常工作中出现了很多安全隐患,如果出现了网络瘫痪或者信息数据丢失,医院内的很多数据就会泄露等,这对于医院和患者都有较为严重的影响,也会导致医院信息不够准确。针对医
期刊
摘 要:随着我国经济迅速发展,对能源需求量日益增加,利用生物质能是我国迫切需要,是解决能源出路的最好途径之一。生物质能是当前正在提倡利用的可再生能源,利用当地生物质供热,符合我国有关循环经济的发展战略,符合可持续发展。生物质分散供热适用于村镇的单个用户。对于生物质锅炉热源厂、生物质热电厂,由于其规模、成本等各种条件的限制,还不宜作为城区供热的主要热源,但可以作为新市镇的主要热源;或作为城区的辅助
期刊