论文部分内容阅读
[摘 要]通过维护人员的计表工作,提前发现的设备隐患,重点介绍计表发现典型故障及处理方法,日常维护经验技巧,总结维护中测试方法,设备重要技术指标,强化维护人员水平,从而提高传输设备的运行质量。
[关键词]计表、经验、故障、隐患、设备质量、测试。
主题:提高设备的运行质量
中图分类号:TD353.5 文献标识码:A 文章编号:1009-914X(2013)14-0250-01
一、前言
目前我局管内传输设备主要有马可尼、中兴、华为等厂家,用于干线或本地网传输系统。虽然各机房人员维护的设备型号、网管、厂家等存在差异,其维护及计表测试项目也存在差异,但是目的是相同的即提前发现设备隐患,及时解决问题,提高设备运行的质量,更好的服务于铁路运输安全。随着铁路信息化建设的发展,通信设备运用质量对于铁路运输安全的影响也越来越大,相应的对传输维护人员的要求也更高,一名好的维护人员,不仅在问题出现时能迅速地定位、解决问题;更重要的是在故障产生前,能够通过例行的维护工作及时发现故障隐患、消除故障隐患,使设备长期稳定地运行。对传输设备良好、有效的维护,不仅能够减少设备的故障率,并且可以延长设备的使用寿命。
二、传输设备计表维护内容及项目
2.1 按照维护周期的长短,将计表维护分为以下几类
日常例行维护是指每天必须进行的维护项目。日常维护可以帮助我们随时了解设备运行情况,以便及时维护和排除隐患。在日常例行维护工作中发现的问题须详细记录故障现象。
周期性例行维护是指定期进行的维护。通过周期性维护,我们可以了解设备的长期工作情况。在例行维护工作中及时发现问题,防患于未然。
突发性维护是指因为通信设备故障、网络调整等带来的维护任务。
2.2 网管系统的例行维护项目
网元和单板状态检查;告警检查;性能事件的监视;保护倒换检查;光接口的光功率检查;查询操作日志;ECC路由的检查;查询网元时间;单板配置信息的查询;网元数据库备份;网管数据库的维护;网管计算机硬件和软件平台的维护。
2.3 设备的例行维护项目
设备声音告警检查;指示灯观察;设备温度检查;风扇检查和定期清理;业务检查;检查环境温度;公务电话检查;全网光纤连接测试:包括各站光纤标签粘贴检查、实际接收光功率测试、光纤连接检查。
三、传输计表的典型案例
3.1 计表重启T2000网管后不能正常监控
在进行华为T2000网管计表时,正常重启后, T2000网管软件运行异常,不能正常监控,重新安装T2000网管软件,但重装后,故障依旧;这时在计算机任务管理器里查看计算机进程程序时,发现进程里有两个lsass.exe文件进程,而且内存使用大小不一样;判断为计算机中病毒;把计算机C盘格式化重新安装系统,重新安装T2000网管,恢复网管数据,T2000网管使用正常;T2000网管的服务器、客户端都能正常打开,监控正常;
之所以可以进行所有硬盘的格式化是因为前期网管数据、LICENSE、网管软件进行了移动硬盘的备份,所以在网管维护中,网管数据及网管软件的备份是关键,也是核心。
3.2 更换换纤时没有注意光衰减器导致光功率过载出现误码
联通置换OptiX 2500+网元接T2000网管,联通置换和联通之间的由OptiX 2500+设备组成2.5G的无保护链,如图:
联通置换网元的S16板上瞬报报RLOS,询问联通相应的S16板上报MS-RDI。用光功率计在联通置换网元的ODF架测试收联通的光功率,为收无光;联通网管测试S16的输出光功率,为0dBm。判断是联通站发往联通置换网元的光纖出了问题。对光缆里的其它空纤测试,发现3号纤可用。将尾纤换到3号纤后,告警消失但是性能事件上报RS、MS误码。
网管上查询联通置换网元收联通的光功率为-3dBm,光功率实测也在这个值附近。怀疑是光功率过载导致的误码,检查上月计表网管的光功率记录表,发现前期记录的值为-13dBm,询问机房人员使用的是长距的SS62S1603板,2.5G长距光板的过载点为-9dBm,如果输入光功率过强会导致误码甚至影响激光器的寿命。怎么会有10dB的衰耗?发现光衰减装在ODF架上,有些光衰减器外形与法兰盘一致,如果安装在ODF架上,在换纤时会被忽视。在换纤后要测试收光功率值,并和前期记录的值进行比较;日常维护时,可以用网管查询S16板的收光功率,如果发生变化可以得到及时处理,同时要妥善保管前期工程的竣工资料。
3.2 温度过高导致交叉板报背板帧失步(OOF)
在机房温度过高情况下,机房维护人员拔出S390风扇清洗30分钟后,S390的4#与5#交叉板温度过高(75℃),接着S390的3#OL64、6#OL64与8#OL4报背板帧失步,同时导致13#和14#SC 报时钟输入丢失,最终该网元业务中断,其下挂网元所有业务也中断;故障处理为:将风扇插回,复位交叉板,业务恢复正常。
在设备风扇故障时,设备内温度会快速升高。温度在传输设备中可通过告警和性能进行上报和查看,处理高温环境下一般使用空调保证机房温度环境,特殊情况下可使用电风扇。
四、传输计表经验小结
4.1 网管系统的例行维护经验小结
对于温度问题我们一定要重视。日常维护中要经常清洗风扇并定期从网管上查看设备环境温度,PMU板的温度告警门限设置要在0℃~40℃,这样设备温度过高网管会上报告警,从而及时采取降温措施。
更改业务配置注意事项:不要在业务高峰期使用网管进行业务调配,因为一旦出错,影响会很大,应该选择在业务量最小的时候进行业务的调配。在更改业务配置前,应对网管进行数据备份,同时针对作业内容涉及站点提前做好告警及性能查看记录。
做好光接口的光功率检查维护,查看各光接口光功率数值并记录,比对系统开通时的数值和阈值,是否劣化和接近限值,并查明原因。线路板的光功率异常是引起误码的常见原因。当光功率过大或过小,都会导致接收光模块接收光信号不正常,并同时引起B1、B2、B3、V5误码;所以,计表发现设备上报大量各种类型的误码时,需及时处理,查找并解决设备隐患。
无效告警处理,采取建帐登记,及时处理,通过定期核查统计后,进行无用业务网管清理,提高设备资源利用率。
4.2 设备的例行维护经验小结
检查环境温度:机房的环境温度必须达到规定的标准,机房的温度过高和过低,都有可能引起误码。环境温度长期工作-5℃~+45℃,短期工作-10℃~+55℃,短期工作是指连续工作时间不超过48小时且每年累计时间不超过15天。下列情况会引起环境温度异常:子架风扇故障;子架风扇防尘网积尘过多,设备通风不畅;机房内空调故障。
风扇检查和定期清理:良好的散热是保证设备长期正常运行的重要保证。在例行维护时应注意以下两点:通过观察风扇告警灯“FAN-ALM”,保证风扇时刻处于工作状态。定期清理风扇的防尘网,周期为每2周一次。网管中的风扇告警(FAN_FAIL)指示风扇工作异常。
为了便于设备日常巡视,采取了将设备内部张贴其单板功能及指示灯含义、光口指标、公务、光纤链接信息,设置设备巡视记录本,明确规定必查及填写项目,通过数值记录提高巡视效果。促使日常巡视和故障有参考指标和依据,强化人员对设备单板的熟悉程度,提高硬件故障处理的效率。
五、结束语
传输计表中通过网管系统可以动态地监视网上设备的运行状况、服务质量。系统运行状态指示,可以协助设备维护人员监视设备运行状况。通过计表帮助我们熟悉传输设备,了解传输网络,对其进行网络优化,提高设备利用率。
参考文献
[1] SDH传输设备维护手册,人民邮电出版社,王晓明,1997年.
[2] 传输技术资料.
作者简介
马跃山:1993年毕业于齐齐哈尔铁路运输职工大学通信专业,现工作于乌鲁木齐铁路局电务处,任通信科长,工程师。
[关键词]计表、经验、故障、隐患、设备质量、测试。
主题:提高设备的运行质量
中图分类号:TD353.5 文献标识码:A 文章编号:1009-914X(2013)14-0250-01
一、前言
目前我局管内传输设备主要有马可尼、中兴、华为等厂家,用于干线或本地网传输系统。虽然各机房人员维护的设备型号、网管、厂家等存在差异,其维护及计表测试项目也存在差异,但是目的是相同的即提前发现设备隐患,及时解决问题,提高设备运行的质量,更好的服务于铁路运输安全。随着铁路信息化建设的发展,通信设备运用质量对于铁路运输安全的影响也越来越大,相应的对传输维护人员的要求也更高,一名好的维护人员,不仅在问题出现时能迅速地定位、解决问题;更重要的是在故障产生前,能够通过例行的维护工作及时发现故障隐患、消除故障隐患,使设备长期稳定地运行。对传输设备良好、有效的维护,不仅能够减少设备的故障率,并且可以延长设备的使用寿命。
二、传输设备计表维护内容及项目
2.1 按照维护周期的长短,将计表维护分为以下几类
日常例行维护是指每天必须进行的维护项目。日常维护可以帮助我们随时了解设备运行情况,以便及时维护和排除隐患。在日常例行维护工作中发现的问题须详细记录故障现象。
周期性例行维护是指定期进行的维护。通过周期性维护,我们可以了解设备的长期工作情况。在例行维护工作中及时发现问题,防患于未然。
突发性维护是指因为通信设备故障、网络调整等带来的维护任务。
2.2 网管系统的例行维护项目
网元和单板状态检查;告警检查;性能事件的监视;保护倒换检查;光接口的光功率检查;查询操作日志;ECC路由的检查;查询网元时间;单板配置信息的查询;网元数据库备份;网管数据库的维护;网管计算机硬件和软件平台的维护。
2.3 设备的例行维护项目
设备声音告警检查;指示灯观察;设备温度检查;风扇检查和定期清理;业务检查;检查环境温度;公务电话检查;全网光纤连接测试:包括各站光纤标签粘贴检查、实际接收光功率测试、光纤连接检查。
三、传输计表的典型案例
3.1 计表重启T2000网管后不能正常监控
在进行华为T2000网管计表时,正常重启后, T2000网管软件运行异常,不能正常监控,重新安装T2000网管软件,但重装后,故障依旧;这时在计算机任务管理器里查看计算机进程程序时,发现进程里有两个lsass.exe文件进程,而且内存使用大小不一样;判断为计算机中病毒;把计算机C盘格式化重新安装系统,重新安装T2000网管,恢复网管数据,T2000网管使用正常;T2000网管的服务器、客户端都能正常打开,监控正常;
之所以可以进行所有硬盘的格式化是因为前期网管数据、LICENSE、网管软件进行了移动硬盘的备份,所以在网管维护中,网管数据及网管软件的备份是关键,也是核心。
3.2 更换换纤时没有注意光衰减器导致光功率过载出现误码
联通置换OptiX 2500+网元接T2000网管,联通置换和联通之间的由OptiX 2500+设备组成2.5G的无保护链,如图:
联通置换网元的S16板上瞬报报RLOS,询问联通相应的S16板上报MS-RDI。用光功率计在联通置换网元的ODF架测试收联通的光功率,为收无光;联通网管测试S16的输出光功率,为0dBm。判断是联通站发往联通置换网元的光纖出了问题。对光缆里的其它空纤测试,发现3号纤可用。将尾纤换到3号纤后,告警消失但是性能事件上报RS、MS误码。
网管上查询联通置换网元收联通的光功率为-3dBm,光功率实测也在这个值附近。怀疑是光功率过载导致的误码,检查上月计表网管的光功率记录表,发现前期记录的值为-13dBm,询问机房人员使用的是长距的SS62S1603板,2.5G长距光板的过载点为-9dBm,如果输入光功率过强会导致误码甚至影响激光器的寿命。怎么会有10dB的衰耗?发现光衰减装在ODF架上,有些光衰减器外形与法兰盘一致,如果安装在ODF架上,在换纤时会被忽视。在换纤后要测试收光功率值,并和前期记录的值进行比较;日常维护时,可以用网管查询S16板的收光功率,如果发生变化可以得到及时处理,同时要妥善保管前期工程的竣工资料。
3.2 温度过高导致交叉板报背板帧失步(OOF)
在机房温度过高情况下,机房维护人员拔出S390风扇清洗30分钟后,S390的4#与5#交叉板温度过高(75℃),接着S390的3#OL64、6#OL64与8#OL4报背板帧失步,同时导致13#和14#SC 报时钟输入丢失,最终该网元业务中断,其下挂网元所有业务也中断;故障处理为:将风扇插回,复位交叉板,业务恢复正常。
在设备风扇故障时,设备内温度会快速升高。温度在传输设备中可通过告警和性能进行上报和查看,处理高温环境下一般使用空调保证机房温度环境,特殊情况下可使用电风扇。
四、传输计表经验小结
4.1 网管系统的例行维护经验小结
对于温度问题我们一定要重视。日常维护中要经常清洗风扇并定期从网管上查看设备环境温度,PMU板的温度告警门限设置要在0℃~40℃,这样设备温度过高网管会上报告警,从而及时采取降温措施。
更改业务配置注意事项:不要在业务高峰期使用网管进行业务调配,因为一旦出错,影响会很大,应该选择在业务量最小的时候进行业务的调配。在更改业务配置前,应对网管进行数据备份,同时针对作业内容涉及站点提前做好告警及性能查看记录。
做好光接口的光功率检查维护,查看各光接口光功率数值并记录,比对系统开通时的数值和阈值,是否劣化和接近限值,并查明原因。线路板的光功率异常是引起误码的常见原因。当光功率过大或过小,都会导致接收光模块接收光信号不正常,并同时引起B1、B2、B3、V5误码;所以,计表发现设备上报大量各种类型的误码时,需及时处理,查找并解决设备隐患。
无效告警处理,采取建帐登记,及时处理,通过定期核查统计后,进行无用业务网管清理,提高设备资源利用率。
4.2 设备的例行维护经验小结
检查环境温度:机房的环境温度必须达到规定的标准,机房的温度过高和过低,都有可能引起误码。环境温度长期工作-5℃~+45℃,短期工作-10℃~+55℃,短期工作是指连续工作时间不超过48小时且每年累计时间不超过15天。下列情况会引起环境温度异常:子架风扇故障;子架风扇防尘网积尘过多,设备通风不畅;机房内空调故障。
风扇检查和定期清理:良好的散热是保证设备长期正常运行的重要保证。在例行维护时应注意以下两点:通过观察风扇告警灯“FAN-ALM”,保证风扇时刻处于工作状态。定期清理风扇的防尘网,周期为每2周一次。网管中的风扇告警(FAN_FAIL)指示风扇工作异常。
为了便于设备日常巡视,采取了将设备内部张贴其单板功能及指示灯含义、光口指标、公务、光纤链接信息,设置设备巡视记录本,明确规定必查及填写项目,通过数值记录提高巡视效果。促使日常巡视和故障有参考指标和依据,强化人员对设备单板的熟悉程度,提高硬件故障处理的效率。
五、结束语
传输计表中通过网管系统可以动态地监视网上设备的运行状况、服务质量。系统运行状态指示,可以协助设备维护人员监视设备运行状况。通过计表帮助我们熟悉传输设备,了解传输网络,对其进行网络优化,提高设备利用率。
参考文献
[1] SDH传输设备维护手册,人民邮电出版社,王晓明,1997年.
[2] 传输技术资料.
作者简介
马跃山:1993年毕业于齐齐哈尔铁路运输职工大学通信专业,现工作于乌鲁木齐铁路局电务处,任通信科长,工程师。