银行业网络故障排查的方法研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:Gzliao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着银行业对金融科技的重视程度不断增加,相应资金投入也越来越大,网络规模和复杂程度也较以往出现较大的增长,这对网络运维人员提出极大挑战,目前网络故障排查没有统一的办法,主要依靠个人的经验来判断,该文提出一种“立足源点,同类比较,精准定位”的网络故障排查方法,可以帮助网络管理员第一时间分析、排查、定位故障原因,解决网络故障,提升银行业网络故障应急处置能力。
  关键词:网络故障排查;立足源点;同类比较;精准定位
  中图分类号:TP393 文献标识码:A
  文章编号:1009-3044(2019)32-0063-03
  1概述
  随着金融科技的迅猛发展,银行业在科技方面的投入不断加大,应用系统建设数量迅速增加,网络规模越来越大,拓扑结构越来越复杂,各家银行都在探索建立一种效率与安全并重的架构,可以为金融消费者提供满意服务的同时,抵御内外部的非法网络攻击,并在出现网络故障时可以第一时间定位、分析和解决。就网络故障排查方面,虽然目前市场上出现一些运用人工智能算法的网络故障定位分析工具,但这些工具在实际使用过程中,还存在一些缺陷,只能作为辅助工具,出现故障时更大程度上还是依赖于一线网络运维人员来排查和解决,在金融科技越来越得到行业和管理层重视的今天,网络故障导致的停止服务,属于重大信息安全生产事故,如何迅速排查解决网络故障,对于网络运维人员的知识水平和排查能力提出了极大的挑战。
  2网络故障定义
  网络故障是指由于硬件、软件的漏洞、病毒的侵入等引起网络无法提供正常服务或降低服务质量的状态。目前对于网络故障的分类网上有很多种。从范围角度来说,可分为广域网故障和局域网故障。广域网故障一般涉及外单位,从业务的角度来说,表现为外单位无法访问本单位提供的服务;局域网故障,一般在本单位内部,可能的表现为单位内部客户端无法访问某项业务。从故障类型来说,可分为线路故障、设备故障、配置出错故障等。线路故障可能是本单位设备间互联线路异常,也可能是与外单位互联线路异常等;设备故障又可分为端口故障、板卡故障、电源故障等类型。配置出错故障一般由于人为原因造成,在网络实施过程中,可能因为未考虑周全或个人粗心等原因,造成配置错误,从而导致业务访问异常。
  网络故障多种多样,发生难以避免。但每家银行应该在设计网络架构时,具有一定的容错机制,在关键区域配置双设备、双线路,冗余路由协议,建立灾备中心等,保证在单设备、线路、单中心发生故障时,不影响网络和业务的正常运行。
  3网络故障排查方法
  目前网络故障排查没有统一的办法,主要依靠个人的经验来判断。笔者认为当出现网络故障时,应首先对故障原因进行分析,确定网络故障的影响范围,从而定位问题区域。在这里提出一种“立足源点,同类比较,精准定位”的排查方法。“立足源点”表示首先从故障源本身开展向不同区域的业务测试;“同类比较”的意思是寻找与故障点同级的设备或线路,进行相同的业务尝试。“精确定位”的意思是逐渐缩小范围,最后定位具体故障点;
  下面从一线网络运维工程师的视角,结合笔者经验,通过几个示例,描述如何分析、定位、解决网络故障的方法。
  (1)线路故障示例
  具体网络拓扑见图1。
  业务人员反映,通过客户端无法访问生产区服务器1。客户端均通过工作区的楼层交换机访问业务。根据“立足源点,同类比较,精准定位”的原则,首先立足源点,通过无法访问服务器1的这台客户端尝试访问服务器2、3、6,这三台服务器分别接人不同分区或不同的汇聚交换机中,通过这一尝试,基本可判断是网络故障还是系统故障,如果服务器2、3、6均可正常访问,则大概率为服务器1系统出现问题,此时再找另外一台客户端尝试访问服务器1,即可基本确定故障原因;如果服务器2不可访问,服务器3、6可以访问,则可判断大概率第一台生产区汇聚交换机上下行網络出现问题;如果服务器2、3无法访问,服务器6可以访问,则可判断大概率生产区网络出现问题;如果服务器2、3、6均无法访问,则需要进一步排查,此时可以分别找一台连接同一楼层交换机的客户端和连接不同楼层交换机的客户端来访问业务,以此判断故障范围。
  在笔者亲历的情况是,服务器2,3均无法访问,服务器6可以正常访问,初步判断为生产区网络出现问题。笔者在客户端尝试登录途经网络设备,登录核心交换机、生产区防火墙均正常,但无法登录生产区汇聚交换机,判定原因为生产区防火墙与生产区汇聚交换机这一段出现问题,在机房查看设备物理状态发现,问题的原因是由于机柜门挤压,导致生产区汇聚交换机与生产区防火墙互联光纤折断。
  (2)板卡故障示例
  具体示例见图2。
  本单位属于银行省级节点,承担着上联总行,下联地市、县行的中间枢纽角色,具体在网络拓扑图上,该行通过上联路由器与总行相连,通过下联路由器与地市、县行相连。地市行网络运维人员反映,通过网络管理系统发现,该行至省行电信线路中断,联通线路正常运行,经联系电信运营商排查,运营商广域网线路正常。按照“立足源点,同类比较,精准定位”的原则,省级节点网络管理员对其他地市行至省行的电信线路进行监测,发现所有地市行至省行线路均为中断状态,初步判断原因为电信端下联路由器故障,继续围绕电信端下联路由器分析定位原因,可能为端口故障,板卡故障或配置错误。登录设备后发现,下联县行电信线路正常,连接防火墙线路正常,但与上联路由器互联线路不正常。不正常的两条线路均处于一张板卡上连接,其他状态正常的线路端口均在不同板卡上连接,判断为电信路由器板卡故障导致,更换故障板卡后线路恢复正常。
  (3)路由路径不一致导致的业务故障
  具体示例见图3。
  机构A1,A2...An均需要访问机构C提供的业务,机构B-方面与A1,A2...An连接,一方面与机构C连接,承担着网络中继的角色,机构A1,A2...An,机构B均将左侧路由器作为主路由器,机构c将右侧路由器作为其主路由器,正常的网络流量路径如图中所示,以机构A1为例,流量路径为:机构A1主路由器一机构B主路由器一机构C备路由器一机构C主路由器一机构B备路由器一机构B主路由器一机构A1主路由器,业务可正常访问。但在某日机构B出现线路故障,机构B主路由器与备路由器之间互联线出现中断,如图4所示。
  机构A1向机构B和机构c反映,访问机构c业务中断,作为机构B的网络管理员,按照“立足源点,同类比较,精准定位”的原则,首先要求机构A1访问机构B的业务,可正常访问;然后向机构A2,A3等同类机构询问,均表示可以正常访问机构C业务。在这种线路异常情况下,网络流量路径为:机构A主路由器一机构B主路由器一机构C备路由器一机构c主路由器一机构B备路由器一机构A备路由器。路由路径较正常情况出现变化,流量从机构A的主路由器来,从机构A的备路由器回包,但在所有A1,A2…An机构中,只有机构A1访问业务中断,将问题定位于机构A1网络内部,可能由于网络架构的设计问题,机构A1网络拓扑简图见图5。
  以机构A1的视角来看,访问机构c业务的流量路径来回不一致,机构A1内部存在两台防火墙,两台防火墙未做状态同步,这种情况下,如果路由不一致,会导致网络中断的现象,以此定位了问题故障原因。
  4结束语
  银行业网络规模越来越大,对运维人员提出了极大的挑战,除了要求网络管理员会熟练使用网络运维工具之外,还需不断提高自身知识水平和应急处置能力,本文提出的“立足源点,同类比较,精准定位”的网络故障排查方法,可以帮助网络管理员在网络故障发生后,迅速分析、排查、定位故障原因,第一时间解决故障,保障业务连续性和安全陛。
  【通联编辑:代影】
其他文献
摘要:该文简要介绍了金墙病毒隔离墙的系统模式、原理、特点及在电视制作网络中的实际应用。  关键词:电视制作网;隔离墙;使用方法;网络安全  中图分类号:TP393 文献标识码:A  文章编号:1009-3044(2019)32-0043-02  如今数字化、网络化技术的飞速发展,国内各家电视台都投人大量资金建设电视节目制作网络和电视节目播控网络,最大限度地实现资源共享,提高节目制作和播出效率。然而
摘要:社会网络影响力最大化是社会网络分析领域的一个重要研究问题,该问题旨在寻找出社会网络中具有最大影响力的节点集合。从社会网络影响力最大化问题产生背景出发,介绍影响力最大化问题的求解过程与求解过程中用到的基础模型,归纳总结了现有的几种主要传播模型、影响力最大化算法及研究现状。最后,讨论了该研究存在的问题和对未来的展望。  关键词:社会网络;传播模型;影响力最大化算法  中图分类号:TP393 文献
伴随着国家信息化进程的不断加快,信息技术对我国人民日常生活的影响也越来越大。大学作为国家培养人才的重要地点,自然也要跟紧信息化的步伐。如今,越来越多的高校加入了校园一卡通的行列,校园一卡通已经成了我国大部分高校学生日常生活中不可缺少的一部分。伴随着校园一卡通在高校的不断普及,其可能存在的安全性问题也越来越受关注。本文将从校园一卡通的所要实现的目标及其整体结构总结和讨论校园一卡通的好处及其可能存在的
摘要:高校智慧校园是在数字信息化校园基础上,所建构的智能化网络服务评价架构,其主要用到大数据、云计算及物联网技术。当前大数据及云计算技术,在智慧校园体系建设中的应用,通常会利用Hadoop分布式平台、HDFS文件系统、Ma-pReduce虚拟计算等大数据技术,以及云计算平台及其服务器,来完成高校信息管理系统的部署与建设,并实现对数据资源的挖掘、整合处理与存储,以满足不同学校成员的教学、科研、管理决
摘要:当前,在线测评系统得到广泛应用,选题策略成为发挥系统效能的关键,传统的选题策略存在检验精度不够、试题曝光不均衡,题库安全性差等不足,论文提出一种新的自适应选题策略,先对题库进行基于难度的分区,区内再按区分度二次分层,建立相应选择量模型,通过反馈机制,选出信息量最大的试题。实验表明新策略在保证检测效能的前提下有效地降低了试卷重复率,保证了题库的安全性。  关键词:自适应策略;信息量;随机抽样法
摘要:随着信息技术的发展,高校教学的信息化水平也逐渐提升,这不仅丰富了课堂教学量,同时也改变了传统的教学模式,推动了高校教学的发展。当前,部分高校的教学信息化水平还比较低,难以满足教学的实际需求,因此应加快网络辅助教学平台建设,为教学提供强力的支撑,推动教学水平的提升。  关键词:网络辅助教学平台;建设;实践  中图分类号:TP311 文献标识码:A  文章编号:1009-3044(2019)32
摘要:使用SQL Server进行数据挖掘时,透彻理解相关技术及产品的使用特点、工作机制对提升挖掘效果具有重要意义。遵循CRISP-DM标准数据挖掘流程,以UCI数据集Adult分类任务为案例,研究了在MicrosoftBI技术框架下实现SQL Serv-er数据挖掘的基本过程、方法和特点,探索了重要图表工具的工作机制。实验表明SQLServer数据挖掘技术易于使用、性能良好,并能和SSIS等很好
摘要:高校排课中待解决的主要问题就是合理的安排教师、教室、时间、班级等教学资源。大多数遗传算法对排课的应用考虑的是节次优先等问题,而对排课中的教学资源冲突采用消除的办法解决。针对排课中的冲突,该文以班级、时间、教室为三维坐标空间,以排课中存在的冲突数为适应度函数,采用平面交叉的方式,通过精英保留策略构造遗传种群进行选择进化。  关键词:遗传算法;三维编码;冲突函数;平面交叉;精英保留  中图分类号
摘要:在“互联网 ”时代下,信息技术在教育教学工作中得到了较为广泛的应用,在很大程度上促进了我国教育事业的发展和进步。但是也应该看到,信息技术在带来巨大便利的同时,也给教育工作带来了一定的负面影响。因而高校各级部门应该加强对于学生在网络安全教育方面的工作力度,发挥信息技术的长处,尽量减小网络安全问题对当代大学生的危害,达到培养高素质人才的目的。  关键词:互联网 ;网络安全;教育  中图分类号:T
随着网络的发展衍生出了数以万计的软件,同时也有一些软件以其拥有强大的功能和卓越的实用性慢慢深入人们的生活。其中一些有着特殊用途的软件慢慢被高校用于管理和激励学生