电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

交换机故障范文

来源:文库作者:开心麻花2026-01-071

交换机故障范文(精选11篇)

交换机故障 第1篇

1 设备的日常维护工作

ZXJ10交换机的日常维护包括日维护、月维护、季维护,要想做好如下的维护项目。

1.1 日维护项目

1.1.1 机房环境系统的检查

机房的环境系统(包括温度、湿度、灰尘等)对于交换设备的正常运行十分重要,恶劣的机房环境会加速硬件单板的老化、损坏。应从以下3点做好机房环境系统的工作,保证设备有一个良好的运行环境。

(1)机房温、湿度检查。打开后台告警系统,查看是否存在与交换机设备温度、湿度相关的告警;也可以通过机房内的温度计、湿度计进行相关检查。机房的温度标准为:15~25℃,湿度范围为:30%~70%。

(2)机房防尘检查。进入机房检查机房内部的清洁情况,地面应保证干净整洁。进入机房时,应该穿上指定的工作鞋和工作服。

(3)机架防尘检查。须定期清洗防尘网。在交换机每个机架底都有一个防尘网,需要清洗时,双手均衡地将防尘网从防尘网安装架内拉出,以防防尘网上的积灰散落到机架内,然后用清水冲洗干净,将防尘网晾干(或甩干)后推入到防尘网安装架内。

1.1.2 检查交换机运行状态

维护人员每天进行机房巡视时要观察交换机各单板运行情况,通过指示灯的颜色来检查交换机运行状态;也可以通过查看后台服务器及维护终端告警界面是否有错误告警来检查交换机运行状态。

1.1.3 重要单板状态检查

重要单板是指对于一个模块非常重要,一旦发生故障会使整个模块业务中断的单板。这些单板在配置上都是采用主备或者负荷分担的方式进行冗余备份的。如:MP、网板、时钟同步板、DSNI板、FBI/CFBI板、模块间通信板、模块内通信板等。重要单板主备通信要保持正常,以便主用单板发生故障时,备用单板能自动替换上。可以通过后台告警的机架图来检查重要单板主备通信状态。例如检查MP主备状态,在后台告警界面机架状态图中,点击备用MP后弹出状态图,多次点击“状态”按钮,观察状态显示是否准确及时。如超时或结果上报较慢,说明主备通信状态不正常。

1.1.4 测试告警上报状况

在维护终端上复位对业务无影响的某一单板(如备用SP板),看告警箱、后台告警界面、机架图是否显示相应告警,若无告警上报,表示告警系统有问题须马上处理。

1.1.5 模块内、模块间、出入局试呼叫

使用本局电话,互相呼叫本模块内用户、本局其他模块内用户、邻接局用户及经邻接局汇接的用户,测试是否可完成正常的呼叫通话过程,通过电话呼叫拨测及时发现问题。

1.1.6 登记诊断测试任务,及时查看诊断测试结果

诊断测试是用来测试交换机系统本身的工作情况,就像我们到医院体检一样,可以提前知道身体的状况。充分利用诊断测试工具,还可以帮助定位故障。诊断测试时间应在话务量较小的时候进行。诊断测试包括模块内测试和模块间测试。模块内测试主要用于测试模块内的各组成单元的功能、单元与MP的链路、单元与交换网的话路是否正常;模块间测试主要是对相邻模块的通信、话路进行检测。查看测试结果,红色提示信息异常,红色文字描述是故障的说明,包括测试结果的定性分析。

1.2 月维护项目

1.2.1 所有后台系统病毒检查维护

在各后台维护终端、服务器上都运行着很重要的程序,且连接到前台交换机,所以保证网络的安全性很重要,做好后台系统病毒检查维护是一项长期而又重要的工作。系统维护人员应在各服务器、终端上安装杀毒工具,并且定期更新病毒库。

1.2.2 后台数据备份

做好后台数据备份的目的主要是系统发生故障时可恢复数据。交换机后台数据备份有手工备份和自动备份2种方式。在数据恢复前,一定要注意做好数据查毒和一致性检查工作。为保证安全,数据备份最好采用不同的存储介质,保存2份备份文件。

1.2.3 计费系统数据备份及计费服务器磁盘空间整理

计费系统数据很重要,因此,一定要做好每月的计费系统数据和话费数据备份,并将话单定期拷入可移动硬盘(如MO磁盘)中,释放计费数据库空间。计费服务器磁盘空间整理:将计费服务器上备份话单拷贝到终端上备份,然后删除服务器上备份话单,释放服务器磁盘空间。计费数据库空间门限:当计费数据库剩余空间不足30%时话单接收程序会产生告警,若剩余库空间低于20%则停止话单接收。备份话单磁盘空间门限:当剩余磁盘空间低于20%时产生告警,若剩余空间低于10%则停止话单接收。在笔者的实际工作中就曾碰到过一次话单停止接收的故障,原因就是在清理计费数据库空间时,没有删除原始话单,也就是相当于没有释放计费数据库空间,而恰巧计费数据库剩余空间不足的告警又被屏蔽,所以导致了话单停止接收的故障。幸好当时笔者清楚这一故障产生的原因,立即将话单备份删除,及时释放计费数据库空间,顺利将故障解决。

1.2.4 告警数据库、维护日志、话务统计数据库空间整理

定期查询告警数据库、维护日志及话务统计数据库的可用空间,定期做好数据库空间整理以便释放这些数据库空间,保证有足够的数据库空间让新信息正常写入。

1.2.5 后台服务器磁盘空间整理

后台服务器磁盘空间过小会影响服务器的正常运行,需要定期清除无用文件,以保留有效的剩余空间,保证服务器的正常运行。

1.2.6 交换机系统时间校对

交换机系统时间不一致可能会影响计费话单,所以必须做好交换机系统时间校对这项工作。首先,必须检查当前系统时间和北京时间是否一致,如不一致,则必须根据实际情况进行时间调整。其次,检查前台各个模块的当前时间是否一致,如不一致,则必须进行前后台时间同步。调整时间可能影响到计费话单,所以必须在晚上零点以后、话务量低的时候修改时间,避免引起话单时间重叠。

1.3 季度维护项目

1.3.1 MP切换验证

MP是整个交换机的核心,一旦出故障都是致命性的,所以做好MP的日常维护尤为重要。MP工作有主备保护,平时工作在主用MP,可以通过做“主备MP切换”来判断备用MP的状况。若发生切换失败或切换后出现故障现象,则须及时处理。

1.3.2 七号信令链路业务切换验证

对同一信令局向的不同链路进行去活操作,业务不会中断,测试各链路的服务情况(信令局向只有一条链路不能进行去活操作)。

1.3.3 V5信令链路业务切换验证

选中主链进行保护切换,主链会倒换到次链,业务不会中断(只有一条链路的V5接口不能进行保护切换)。

1.3.4 局容量配置核查、号码分析和中继数据核对检查

每季度进行局容量配置核查,查看各模块容量规划;进行号码分析数据和中继数据核对,主要包括中继、路由、字冠、源码、计费数据等,这些数据都要与现场实际使用情况一致,要求根据现场实际情况删除存在的循环冗余及无用垃圾数据,以便释放号码分析容量。清理垃圾数据时一定要谨慎,要清除的数据一定要确认确实无误才可删除。目前,由于用户的要求五花八门,各有千秋,需要很多的号码分析容量来满足这些用户的要求,而交换机的号码分析容量是有限的,所以定期清理垃圾数据释放号码分析容量是一项长期且不可忽视的工作。

1.3.5 电源连接检查、工作地线检查及接地电阻测量

电源分配柜输出和一次P电源输入输出电压范围应在-40~57V之间,如有出入,则需要马上查找原因并进行调整。检查交换机工作地线连接是否牢固,是否有锈蚀,保证机架设备有良好的接地。另外,还要特别重视对机房接地电阻的测量,地阻值要符合要求。一类、二类、三类机房接地电阻<1Ω,四类机房接地电阻<3Ω。若机房接地电阻不合格就会引发许多不必要的设备故障。对此,笔者在工作过程中就深有体会:某机房因地阻不合格造成部分用户接听电话过程中有杂音,也有某机房因地阻不合格造成部分用户无来电显示,还有一些机房因地阻不合格造成一遇打雷天气交换网板就被雷电击坏等。所以,维护人员必须认真做好这项季度维护项目,一旦发现地阻不合格就要马上整改,直至合格。

1.3.6 电源模块检查

A电源、B电源、C电源平时是左右负荷分担工作的,维护人员要定期检查这些电源左右模块可否单独工作,保证其中一块电源在出现故障时另一块能接替所有的工作。

1.3.7 交换机负荷检查

在almntp.exe告警服务器窗口,逐个检查前台主备MP的内存大小与使用情况;逐个模块读取CPU与BHCA资源的占用率;观察音电路的空闲与闭塞情况,以计算出占用率。对于前台MP的内存情况通常建议需要余留10%空闲空间,即如果现场MP内存为128 M,那么剩余空间建议保持10 M。CPU占有率要求低于70%,BHCA值要求小于200 K。音电路占用率要求小于70%。若检查交换机超负荷运行,则需要马上扩容,否则会影响交换机话务。

2 ZXJ10交换机的故障处理

做好了ZXJ 10交换机的日常维护工作,设备的故障会减少很多,但在日常工作中交换机出现故障还是难免的。笔者结合自己在工作中碰到的故障,简单介绍ZXJ 10交换机的故障处理方法。

2.1 常见故障的处理方法

2.1.1 对比法

对比法比较简单,只要把出现故障的数据配置或设备与正确的数据或设备相比较,找到不同点,然后进行分析解决问题。这种方法一般在处理用户呼叫故障时用得比较多。例如,A用户申告无法拨打C号码,而B用户可以拨打C号码。处理这类情况的方法:查看A用户的数据配置,并与B用户的数据进行比较,找出两者的不同点,然后很快定位故障。

2.1.2 替换法

替换法是一种简单实用的故障排除法,将出现故障的硬件或单板用同样功能(最好是同样型号)的板件替换掉,如果替换后问题消失,那就是这个板件出现故障。维护人员在日常工作中常用到这种方法,也就是我们常说的“换板”。对于ZXJ 10交换机来说,板件出现故障率最高的是用户板,其次就是MP、电源板。当这些板件出现故障时,首先可使用替换法来排除故障。

2.1.3 最小系统法

最小系统法就是去掉系统中的其他硬件设备,只保留最简单的部件,观察最小系统是否有故障。如果有,则可排除其他硬件的问题,确定故障来自于现有的几个硬件。如果没有,则将其他硬件一一添加,查看在添加哪个硬件后出现故障,然后将该硬件更换即可。例如,某日笔者接到反映:某模块机房的一整框用户都乱响铃。当时笔者一一排除了外线、铃流板、电源板等硬件,唯独剩下20块用户板未排除。于是,笔者采用最小系统法,把19块用户板拔出,用户框上只留了1块用户板,测试电话是否正常;然后再插上第2块用户板,测试电话是否正常再插上第3块用户板,测试电话是否正常;将其他用户板一一插上,在插到第16块用户板时,故障出现了,把这块板更换后,故障消失。然后依次插上剩余的其他用户板,测试电话都正常。可见,巧用了这个最小系统法很快就把故障解决了。

2.1.4 流程图分析法

在交换机维护过程中,流程图分析法是对故障相关或经过的软件或硬件用软件流程图或硬件流程图来分析和定位故障,逐个断点,逐段分析。例如,对于一个普通端局2号模块与3号模块用光纤组网时模块间通信涉及的单板为:2号模块:MPHMPMPDSNIDSNFBI3号模块:FBIDSNDSNIMPMPMP。当出现模块间通信异常时可以按照上述流程及相应的物理连线来判断、分析问题。当然,采用这种方法的前提是维护人员必须对设备的物理连线、信号流程都有清晰准确的概念。

2.1.5 信令分析法

信令分析法是一种在局间、局内业务对接、调试中最基本的方法,其通过信令分析来确定问题的所在。由于信令有统一的标准,所以能准确的定位问题。对于不同的信令方式,在ZXJ 10系统中都有相应的信令跟踪工具。如七号信令跟踪,用于MTP、TUP、ISUP等信令的跟踪及V5第二级、第二级的信令跟踪;随路信令跟踪,用于随路线路信号和记发器信号的跟踪;ISDN信令分析,用于DSS1信令的分析。目前,最常用的是七号信令跟踪。例如,笔者某日接到用户反映拨打移动电话时信号时断时续。笔者从七号信令跟踪结果发现凡是电话不通时都是发生在移动拆线时。找移动机房,移动机房也采用七号信令跟踪。将跟踪结果一比较,发现双方的CIC电路识别码不一致。原来是移动前2天数据调整时,把4个2 M电路的CIC电路识别码混淆了,由此导致了拨打移动手机时信号时断时续的故障。可见,处理类似的呼叫故障采用信令分析法将会是一个事半功倍的处理办法。

2.1.6 失败码分析法

失败码分析法用于诊断本局、随路、共路TUP/ISUP、V5业务上的故障。在ZXJ10交换机中每一次失败呼叫都有相应的失败码和失败原因值,而通过对失败码的解释可以方便地定位故障原因。失败码分析法就是我们常说的“呼损”跟踪法。在处理用户呼叫方面故障时,将呼损跟踪法和七号信令跟踪法相结合,是一个很常用且相当好用的故障处理方法。

2.1.7 单板重启动方法

单板的重启动可以消除单板的部分错误状态,因此,灵活掌握单板重启动方法很重要。例如:MP的重启动一般是在MP发生吊死等故障,或者修改了局容量配置时进行;很多不明原因的故障影响呼叫时可以通过重启动解决;后台服务器工作异常有时可以通过重启动解决;有时安装新的软件或者修改配置后也需要重启动。重启动的方法是防止瘫局的重要手段,当然对于系统的异常重启动要排除、制止。

2.1.8 经验处理法

经验处理法是指维护人员根据自己或别人积累的经验,在维护过程中遇到故障时,首先依据以往对类似故障的处理做法进行故障的排除处理的方法。此方法处理故障快速,但需要维护人员长期不断积累经验,有时会作出错误判断,因为同一种故障现象也可能由不同原因造成。

以上是笔者对故障分析处理常用方法的扼要阐述,在实际维护过程中,还应注意故障现象是个别现象还是普遍现象,以便进一步缩小故障定位范围。并且,各种方法的运用并非孤立进行,而应综合、灵活运用。

2.2 常用的故障诊断工具

(1)后台告警:针对单板,若单板有故障,在后台告警界面都有相应级别的告警。

(2)动态观察:针对功能单元、公共资源等,通过动态观察,可以看到相应功能单元、公共资源的状态,是占用、闭塞、还是空闲等。观察到结果有助于维护人员准确判断故障。

(3) 112测试台:针对用户电路及外线,可以测试设备内电路的好坏,也可以测试外线线路的质量,在处理用户电话出现拨号音这类故障时,它是一个很直观的诊断工具。

(4)诊断测试工具:针对功能单元到T网与MP,维护人员只要登记相应的诊断测试任务,就能查看诊断测试结果。

(5)信令跟踪:针对中继,局间对接,根据所采用的信令方式选择相应的信令跟踪工具,通过跟踪到的信令来分析确定问题所在。

(6)话务统计:针对话务量流向及接通率。

(7)呼叫业务观察与检索:按模块、业务、失败原因、用户、中继等来跟踪呼叫,生成文件存档;对呼损逐个分析,排除正常情况下的呼损,分析失败产生的根本原因。

(8)话务观察:观察当前用户呼叫状态。

(9)呼叫动态跟踪:定位单个用户的呼叫详细过程。

2.3 常见故障的分类

2.3.1 用户故障

用户常见故障有用户话机无音、不能振铃、电话打不通等,可分为外线故障、用户板故障与用户数据问题等。处理用户故障时,首先通过在机房配线架甩开外线的方法定位故障,判断是外线问题,还是室内问题,然后结合后台告警观察、112测试系统来排除故障,必要的话还可以采用用户状态的观察、动态跟踪用户状态、诊断测试单元这些故障诊断工具。

2.3.2 用户群故障

用户群常见故障有群内用户不能转接、打不出、话务台故障等。用户群故障多为数据故障,处理用户群故障时,首先应检查数据配置。当然,也有因用户操作不当引起的故障。

2.3.3 中继故障

中继常见故障有2M中继电路物理层断、中继板故障、2M中继闭塞等。处理中继故障时,首先查看后台告警界面是否有2M电路告警,若有一般就是2M中继电路物理层断或是2M中继板故障,然后通过2M环回测试定位故障。若后台告警界面无2M电路告警,一般就是2M中继闭塞故障,可以通过动态观察分析具体电路、指定中继呼叫、信令跟踪、诊断测试相结合的方法来分析故障原因,当然也要注意因数据配置引起的故障。

2.3.4 交换机公共资源故障

交换机公共资源故障分模块内和模块间故障。模块内公共资源故障有ASIG、TNET、SP、DT等各功能单元故障、功能单元到T网的话路故障、功能单元到MP的通信故障、通信端口故障等;模块间公共资源故障有模块间的话路、模块间的通信链路故障。交换机公共资源故障的处理方法有通过电话呼叫、诊断测试和后台告警等。

3 故障处理对维护人员的要求

设备在运行过程中出现故障是难免的,而准确、快速定位故障,并进行故障的排除,以便尽快恢复设备的正常运行,尤为重要。但要做到快速、准确定位故障,对维护人员无论是从业务技能,还是操作规范上,都提出了较高的要求。业务技能方面,要求维护人员掌握数字程控交换机的基本原理、系统结构;掌握工程组网方式(单模块、多模块、模块间的连接方式及本局设备与它局设备或传输的连接等);掌握信令系统内容;掌握数据配置和业务配置等基本操作;掌握常用仪器、仪表的使用方法,如万用表、地线测试仪、OTDR、误码分析仪等。操作规范方面,要求维护人员应当受过相关内容的培训;做到在拔插、更换任何单板时,带上防静电手环,并尽可能在话务量较小时进行;进行任何数据更改前应进行原始数据的备份等。

4 结语

目前,不同的通信公司使用的设备并非完全一样,有的主要使用“中兴”,有的使用“华为”“贝尔”等,但设备的型号并不是维护和故障处理的关键。笔者相信,只要维护人员不断学习、实践、总结,并持之以恒,日积月累,就一定会成为一名出色的故障处理人员、设备维护专家。

摘要:针对目前大多数通信公司使用的交换机出现的常见故障,文章以ZXJ10交换机为例,提出了以日常维护和预防为主的程控交换机维护项目。并且,介绍了故障处理的方法,给广大通信工作者提供参考。

关键词:程控交换机,日常维护,故障,维护人员

参考文献

排除交换机雷击故障 第2篇

这两个部门内各自放置了一台联想D-LINKDES-1016R交换机,与机房的主干交换机相连,对两台交换机进行查看时发现,这两台交换机与主干交换机连接的端口信号灯都处于熄灭状态。因为部门内的工作站可以互访,先考虑是不是线路出现问题,用工具检测后证实线路正常,然后考虑相连两端的交换机端口是否出现问题。对主干交换机上与两台故障交换机连接的端口进行测试没有发现问题,这两台交换机都是通过级联端口(MDI-Ⅱ)与主干交换机相连,而故障交换机的其他端口经测试也全部正常,

到此基本确定是两台联想D-LINK交换机的级联口被雷击坏而造成故障。

我们知道,交换机之间如果使用直通线缆(TIA/EIA-568B)相连,是从交换机的级联接口(MDI-II)到相连交换机的任意MDI-X接口进行连接;当使用交叉电缆TIA/EIA-568A时,是通过交换机的任意MDI-X接口与相连交换机的任意MDI-X接口连接。重新做网线头将两条直通线缆改为交叉线缆后分别插入到两台故障交换机的空闲MDI-X接口上,两部门的工作站就能够正常访问服务器,到此故障排除。

程控交换机故障诊断与维护研究 第3篇

【关键词】程控交换机;通信行业;信息技术;故障诊断;维护

基于当前通信行业发展的需要,程控交换机的市场空间越来越广阔,给其功能发挥也提出了新要求。但伴随程控交换机运行环境的逐渐复杂和故障发生率的上升,各种不利于程控机安全稳定运行的因素越来越普遍。因此,熟悉程控交换机故障类型、明确故障产生原因、强化故障排除力度已成为当今程控交换机相关工作人员研究重点。

1.程控交换机故障分析

就程控交换机故障产生类型进行分析,它主要表现在软件与硬件两个方面,这也是导致各种问题产生的主要原因。程控交换机因为本身运行环境复杂、网络化明显的特征,使其在运行中极容易受到诸多外界不良因素的干扰,给系统运行环境的稳定性、安全性造成威胁,最终给程控交换机的正常运行带来影响。程控交换机在这种条件下就需要强化故障诊断力度,在其具体故障诊断中我们可以从以下几方面入手。首先,收集各种已经发生过的故障信息;其次,判断故障发生原因和类型;再次,确定故障的发生位置;最后选择行之有效的方法进行处理。

在故障诊断工作中,按照故障信息来源我们可以将这些故障方法分为四种。第一种故障诊断方法便是日常诊断,这类故障诊断方法是以故障信息集中表现为依据开展的。第二种故障诊断方法是系统警报,是根据记录报警信息指示开展的,它是将报警信息作为故障诊断的信息依据的诊断方法。第三种诊断方法是故障申报,这种故障诊断方法是对于表面还未曾出现故障,但通信用户主动提出故障诊断要求的一种诊断方法,这种诊断是目前极为常见的一种,也是故障信息的主要来源。最后一种诊断方法是通告信息诊断,是维护工作人员在相邻地区开展诊断工作的时候,得知附近程控交换机出现故障,利于通告的方式提交故障信息。

总之,程控交换机故障诊断工作中,我们只有明确故障发生种类、信息来源,才能做到行之有效的处理故障。科学的选择这些故障诊断方法不仅有利于设备故障的处理与维护,而且为设备正常、安全运行提供了扎实基础。

2.程控交换机故障诊断具体方法

程控交换机作为程序储存、控制为一体的综合性机械,它在运行中包含了计算机技术、信息技术和微电子技术等,是利用提前编制好的程序来实现连续不间断控制工作的一种现代化机械。基于此,其在故障诊断工作中我们需要结合设备的实际应用情况,提前规划故障的诊断方法,提出科学的故障诊断与处理措施。

2.1指示灯诊断

指示灯是程控交换机中至关重要的一部分,它是用来反映程控交换机某一时间段运行状态的重要指标,它不仅能准确的反映出程控交换机的具体工作情况,而且能及时有效的反馈出具体工作指标,根据这一指标我们能及时指出故障诊断途径,能迅速判断出故障发生种类、类型和实际位置。可以说指示灯诊断方法是整个设备诊断中一项最直观、最简单的诊断体系,但要注意,这种诊断并不是说看到指示灯发生变化就出现故障,而需要我们深入了解各种指示灯色彩变化所代表的信息,以方便迅速的认识和分析故障。

2.2告警信息分析

告警信息是一个来自于报警系统的内容,尤其是在程控交换机这一复杂、综合的机械设备中,其告警装置的信息来源丰富、警告种类繁多,在这种机械中告警装置信息主要表现出声光、屏幕显示等。告警系统在故障诊断方面主要是一种蕴含大量信息内容的,它的信息虽然看似明确,可以准确的给出故障的类型与发生位置,但是在实际工作中基尼广場会因为软件、硬件等不同类型的真短信息而造成故障信息出现差异,最终给故障诊断构成一定影响。

2.3倒换与复位

倒换是一项切换过程,由专业的人员操作,通过倒换操作,判断程控交换机的运行状态,以此来判断主备关系是否保持在稳定状态。复位是一项重启的过程,其可保障程控交换机内的软件恢复到原始状态,在一定周期内维护程控交换机的正常状态,诊断并解决程序故障。倒换与复位都可以短期排除故障影响,一般应用在应急状态中,具有明显的诊断能力。

3.程控交换机故障维护的措施

3.1程控交换机的硬件维护

程控交换机的硬件系统包括两部分,第一是机房部分,属于程控交换机的外在;第二是设备,与程控交换机的运行存在直接的关系。针对此两部分,提出三点维护措施,保障程控交换机具备良好的硬件系统。如:(1)强化硬件管理,程控交换机对运行环境有特定的要求,维护硬件运行的环境,促使其具备良好的环境条件,符合程控交换机硬件的运行需要,达到高效的运行状态,避免硬件系统受到环境的干扰,进而保障各个硬件的运行寿命;(2)防护电磁影响,电磁对硬件设备的影响比较大,较容易干扰程控交换机的正常运行,因为部分硬件自身存有电磁辐射,导致硬件设备之间产生明确的干扰,所以在程控交换机的硬件设备之间,需要采取屏蔽措施,主要隔离电磁辐射能力较强的硬件设备,保障硬件设备的安全运行;(3)硬件设备的实际维护,程控交换机的硬件设备在运行上都具备特定的要求,需要固定措施保障硬件设备的稳定性,利用日常检测的方式,维护硬件设备,发现有问题的设备,必须快速实行维护,既可以实行现场维修,也可以更换原有的硬件设备,必须确保硬件设备的安全性能,才可保障程控交换机的安全价值。

3.2程控交换机的软件维护

程控交换机的软件部分整体性较强,虽然所涉及的程序复杂,但是维护方式并不难,深入分析软件系统的特性,利用正确的软件维护方式,提高软件系统的运行水平。针对程控交换机实行软件维护时,必须利用专业的操作人员,熟悉各项软件的维护需求,以免影响软件维护的基础,操作人员根据软件的日常运行,判断软件中潜在的问题,利用检测、指令控制的方法,完善软件运行,一方面维护程控交换机的软件程序,另一方面营造安全的软件系统,强化软件系统的实质运行,确保其适应通信行业的复杂环境。

4.结束语

程控交换机在通信过程中起到重要的作用,但是其在日常运行中确实出现诸多故障,降低程控交换机的运行水平,无法达到高效的运行标准,所以需利用有效的途径,准确诊断程控交换机的故障,再对其实行维护措施,保障程控交换机具备高效益的运行标准,完善其在通信行业中的应用。通过故障诊断与维护,为程控交换机提供优质的环境,确保其具备稳定的运行方式。 [科]

【参考文献】

[1]石磊.浅谈程控交换机的维护与管理[J].科技资讯,2010(03).

[2]王迎迎,余扬.程控交换机的维护与管理[J].科技资讯,2009(10).

浅谈交换机故障诊断与排除 第4篇

关键词:交换机,软件故障,硬件故障

0 引言

交换机工作在OSI七层模型中的数据链路层的网络设备, 使用MAC地址表来转发或过滤数据帧。交换机是交换以太网的核心设备, 交换机一旦出现故障, 与它相连接的内网设备可能出现网络功能瘫痪。这对于一个网络管理员来说交换机故障的诊断与排除的尤其重要。

1 交换机故障诊断方法与原则

1.1 交换机的故障多种多样, 不同的故障有不同的表现形式。

但是诊断故障的方法不外乎以下几种。

1.1.1 排除法

排除法是指依据所观察到的故障现象, 尽可能全面的列举出所有可能发生的故障, 然后逐个分析、排除。在排除时要遵循由简到繁的原则, 提高效率。

1.1.2 对比法

所谓对比法, 就是利用现有的、相同型号的且能够正常运行的交换机作为参考对象, 和故障交换机之间进行对比, 从而找出故障点。

1.1.3 替换法

替换法是指使用正常的交换机部件来替换可能有故障的部件, 从而找出故障点的方法。它主要用于硬件故障的诊断, 但需要注意的是替换的部件必须是相同品牌、相同型号的同类交换机所有。

1.2 以在故障分析时, 一般遵循以下的原则来分析。

1.2.1 先边缘后核心

指在诊断和隔离网络故障时, 应先从最边缘的客户端开始, 依次向接入层、汇聚层和核心层进行诊断, 进而定位发生故障的位置, 判断发生故障的设备, 分析发生故障的原因。

1.2.2 由外而内

如果交换机存在故障, 我们可以先从外部的各种指示灯上辨别, 然后根据故障指示, 再来检查内部的相应的部件是否存在问题。

1.2.3 由软到硬

在检查时, 总是先从系统配置或系统软件上着手进行排查。如果软件上不能解决问题, 那就是硬件有问题了。

1.2.4 先易后难

将导致故障的所有原因一一列出, 然后再从中挑选出发生概率最大、可能性最高、且最易于诊断和排除的原因, 并由此入手, 以提高故障排查效率。

1.2.5 先链路后设备

在排查硬件故障时, 要先检查链路的完好性, 问题不能解决时, 再查看端口或设备是否发生故障。

2 交换机故障的类型与排除

交换机故障一般可以分为硬件故障和软件故障两大类。

软件故障是主要是指系统、配置上的故障。

系统故障主要是因为系统设计有漏洞;系统软件被损坏或遭到人为远程攻击而造成的。主要表现在交换机指示灯显示正常, 但网速很慢或网络不能使用。如果确定是这类故障, 首先可以通过关闭交换机电源, 过一会重新启动交换看网络是否正常。然后再采用升级或重新安装系统软件来排除故障。

配置故障主要是因为交换机的配置不完整或配置错误;或者遭到第三方的恶意修改而造成的。可以登录到交换机通过show命令检查交换机的配置文件, 如发现配置不正确, 只要更改或重新配置交换机就可以排除故障。

硬件故障主要指交换机电源、背板、模块、端口等部件的故障, 可以分为以下几类:

2.1 电源故障

由于外部供电不稳定, 或者电源线路老化或者雷击等原因导致电源损坏, 从而不能正常工作。由于电源缘故而导致机内其他部件损坏的事情也常有发生。如果面板上的POWER指示灯灭了, 则说明交换机没有正常供电。预防这类故障, 首先保证有稳定的供电电源, 必要时可以采用冗余电源。在机房内设置专业的避雷措施, 来避免雷电对交换机的伤害。

2.2 端口故障

端口故障或损坏的原因主要是因为不小心的插拔接头、雷击、外部电源不稳定或设备老化造成的。端口发生故障时主要表现为端口的LED指示灯熄灭或呈橘黄色、与该端口相连的计算机无法连接到网络。为了预防这类故障, 要尽可能减少插拔接头, 特别是带电插拔接头;做好防雷措施, 将交换机外壳可靠接地;保证机房的环境卫生。发生这种故障后, 可以在电源关闭的情况下, 用酒精棉球清洗端口。如果端口确实被损坏, 那就只能更换端口了。

2.3 插槽或模块故障

模块化交换机是由很多模块组成, 如果插拔模块时不小心, 或者搬运交换机时受到碰撞, 或者电源不稳定等情况, 都可能导致此类故障。这类故障的现象主要表现为有一组端口的LED指示灯熄灭或呈琥珀色或该组相连的计算机无法与网络通信。对于这类故障的处理主要是通过替换法。可以将故障模块插入到正常插槽进行测试, 也可以将正常模块插入有故障的插槽进行测试。如果确认模块有故障, 则予以更换。

2.4背板故障

交换机的各个模块都是接插在背板上的。如果设备使用时间较长;使用环境差;或者设备过遭受过雷击等因素都有可能造成主电路版的故障。这类故障主要表现在交换机指示灯正常, 但网络却处于瘫痪状态。处理方法一般是更换电路版。

3结束语

对于交换机故障, 我们主要以预防为主, 要注意机房的环境卫生, 温度和湿度;操作时按规范要求进行;做好软件及配置文件的备份工作。当发生故障时, 及时认真做好故障处理情况记录, 以积累自己的经验。

参考文献

交换机常见故障及解决技巧 第5篇

故障现象:整个网络的运作正常,但个别的机器不能正常通信。

故障原因:这是交换机故障中最常见的,如果光纤插头或RJ-45端口脏了,可能导致端口污染而不能正常通信。还有,平常很多人都喜欢带电插拔接头,在理论上说似乎并没有不妥,但实际上经常这样的话就无意中增加了端口的故障发生率;在搬运时的不小心,也可能导致端口物理损坏;购买的水晶头尺寸偏大,插入交换机时,也很容易破坏端口。此外,如果接在端口上的双绞线有一段暴露在室外,万一这根电缆被雷电击中,就会导致所连交换机端口被击坏。

解决方法:一般情况下,端口故障是个别的端口损坏,先检查出现问题的计算机,在排除了端口所连计算机的故障后,可以通过更换所连端口,来判断其是否端口问题,若更换端口后问题能解决的话,再进一步判断是端口的何种缘故。关闭电源后,用酒精棉球清洗端口,如果端口确实被损坏,那就只能更换端口了。此外,无论是光纤端口还是双绞线的RJ-45端口,在插拔接头时一定要小心,建议插拔时最好不要带电操作。

2.电路板故障

故障现象:有一个电脑室经常出现一部分电脑不能访问服务器的现象。

故障原因:交换机一般是由主电路板和供电电路板组成,造成这种故障一般都是这两个部分出现了问题。而造成电路板不能正常工作的主要因素有:电路板上的元器件受损或基板不良,硬件工注不合适和硬件更新后以及由于兼容问题而造成的电路板块类型不合适等。

解决方法:首先确定究竟是主电路板还是供电电路板出现问题,先从电源部分开始检查,用万能表在去掉主电路板负载的情况下通电测量,看测量出的指标是否正常,若不正常,则换用一个AT电源,输入电源到主电路板,交换机前面板的指示灯恢复正常的亮度和颜色,而所连接这台交换机的电脑正常互访,就说明是供电电路板出现了问题。若以上操作无效的话,问题就应该是出现在主电路板上了。

3.电源故障

故障现象:开启交换机后,交换机没有正常运作,而且发现面板上的POWER指示灯并没有亮,而且风扇也不转动。

故障原因:这种故障通常是由于外部供电环境的不稳定,或者是电源线路老化,又或者是由于遭受雷击等而导致电源损坏或者风扇停止,从而导致交换机不能正常工作。还有可能是由于电源缘故而导致交换机机内的其他部件坏的损坏。

解决方法:这类问题很容易发现也很容易解决,当发生这种故障时,首先检查电源系统,看看供电插座有没有电流,电压是否正常。要是供电正常的话,那就要检查电源线是否有所损坏,有没有松动等,若电源线损坏的话就更换一条,松动了的话就重新插好。

如果问题还没有解决,那问题就应该落在交换机的电源或者是机内的其他部件损坏了。预防方法也比较简单,首先要做的就是保证外部供电环境的稳定,这可以通过引入独立的电力线来提供独立的电源,并添加稳压器来避免瞬间高压或低压象。可能的话,建议最好配置UPS系统。还有的就是采取必要的避雷措施,以防雷电对交换机造成的损害。

连接电缆和配线架跳线、配置不当、系统数据的问题也时有发生,此外,局数据错误也会对整个交换局造成影响,而用户数据被错误设置,则会对某个用户产生影响,还有的就是交换机软件方面的问题,软件程序设计存在着缺陷这些也是应当注意的问题。

延伸阅读

交换机交换方式

交换机通过以下三种方式进行交换:

1)直通式:

直通方式的以太网交换机可以理解为在各端口间是纵横交叉的线路矩阵电话交换机。它在输入端口检测到一个数据包时,检查该包的包头,获取包的目的地址,启动内部的动态查找表转换成相应的输出端口,在输入与输出交叉处接通,把数据包直通到相应的端口,实现交换功能。由于不需要存储,延迟非常小、交换非常快,这是它的优点。它的缺点是,因为数据包内容并没有被以太网交换机保存下来,所以无法检查所传送的数据包是否有误,不能提供错误检测能力。由于没有缓存,不能将具有不同速率的输入/输出端口直接接通,而且容易丢包。

2)存储转发:

存储转发方式是计算机网络领域应用最为广泛的方式。它把输入端口的数据包先存储起来,然后进行CRC(循环冗余码校验)检查,在对错误包处理后才取出数据包的目的地址,通过查找表转换成输出端口送出包。正因如此,存储转发方式在数据处理时延时大,这是它的不足,但是它可以对进入交换机的数据包进行错误检测,有效地改善网络性能。尤其重要的是它可以支持不同速度的端口间的转换,保持高速端口与低速端口间的协同工作。

3)碎片隔离:

这是介于前两者之间的一种解决方案。它检查数据包的长度是否够64个字节,如果小于64字节,说明是假包,则丢弃该包;如果大于64字节,则发送该包。这种方式也不提供数据校验。它的数据处理速度比存储转发方式快,但比直通式慢。

交换机故障 第6篇

【关键词】语音故障 硬件故障 分类查找 语音性能和质量 烽火epon系列

【中图分类号】 TP393.4【文献标识码】 A【文章编号】1672-5158(2013)07-0029-01

一、整理案例,正确分析语音故障排查方法,认真做到语音配置设备的维护

在互联网与电子产品的领域中,华为软交换烽火epon系列语音产品大都采用集中式网络管理,语音业务由于需要配置局端VLAN数据与参数,才能进一步开通。而语音故障的原因大都分别为,VOIP用户无法通话,在终端设备上,可能受外界的某些干扰因素干扰。例如电话机接通话音电路与线路的动作没有馈电,语音通话中在电波的通信中会出现断断续续模糊不清的杂音,而某些时候打电话时拨出的被叫方电话号码与网络给接的号码不一致的现象出现一些串号的情况或其他一些故障。而对于如此之类语音故障,可以媒体服务器的平台对语音故障进行,通过对测试结果的分析与调查来解决。而分路器的布防大都分级放置在LCP和NAP处,由于其网络构造较复杂,不便于用户管理,在很多语音通话的过程中会时断时续由于丢包现象的发生,造成语音故障的产生。

而多数情况下,提起手柄使线路接通电话机的话音电路会出现没有拨号音的状况,而网关状态通常显示未注册或正在注册中的情况发生。例如某FTTX工程发生了这样的现象,其AN5116-02型OLT设备下带AN5006-07和09型ONU开有语音和数据业务,onu停电,等来电设备重新上电后,语音业务不正常,需要多次重写配置,才能注册成功。使用华为soft3000,语音协议使用MGCP。可以利用技术做做镜像抓包,以方便查找故障点,在进行了几次摘、挂机实验后,停止抓包,并将保存的文件提供给研发人员分析。最后,华为工程师在查找原因时发现,局方所提供的软交换平台地址为备用地址,将注册地址修改后,故障消失。从此次故障来看,通过抓包发现onu在注册时,软交换平台给回的消息为400(临时不执行)的错误,那么就需要平台给出为什么不执行的原因,最后通过平台侧的工程师协助查找,发现是所提供软交换平台地址错误导致的。通过修改后设置相同的媒体服务器,再进行测试,故障得到解决。

二、科学进行语音测试,总结语音故障排查方法,具体问题具体分析,解决问题

在华为软交换烽火epon系列语音测试中,有时会出现硬件故障,在某些端口硬中,由于其端口手机出现不鸣叫或长时间鸣叫等现象,应及时请有关人士查看先硬件端口,查找原因,必要时可以进一步更换端口。而产品中的抓包分析是查找问题,定位故障的最为快速的手段,是故障查找与解决过程中最方便有效的办法。将网络传输发送与接收的数据包进行截获、重发、编辑、转存等操作,用来对语音故障进行分析,由于华为软交换烽火epon系列语音故障书面报告或口语故障的汇报存在信息情况不全面与精准,在进行特定问题的调查中难以准确。而抓包分析提取的图像,可令管理员在OLT上联口与ONU端口等地方分析故障细节,具体问题具体分析,详细全面解决语音故障。

近些年,华为公司先后围绕客户的需求,持续创新,与合作伙伴开放合作,在电信网络、企业网络、消费者和云计算等领域构筑了端到端的解决方案优势,在承载语音、数据和视频的业务上,烽火epon系列采用DPI(深度包检测)技术,通过对网络里所有必须的业务控制点,所有流量或部分设定的流量进行1-7层的深入分析,并根据制定的策略来进行处理。DPI可以部署在企业网出口,也可部署在城域网出口,其应用的场景根据需求不同有很多选择。而在语音故障上由于端点用户名设置错误而导致业务无法开通的问题,会伴随着使用偶尔会出现在体验中。例如:在某工程的测试过程中,我们发现在配置完了AC16盘中的“NGN配置”后,终端IAD可以PING通上联NGN服务器,而电话却提机无音。而工作人员在处理过程中先后采用了几步:1、认真检查配置,在发现没有错误后,通过“端口镜像”,将未用的上联口GE3设置为“监视端口”。2、而用来作NGN上联通道的GE2设置为“被监视端口”,并将此配置下到设备,打开抓包软件ethereal,进行抓包。3、在进行了几次摘、挂机实验后,停止抓包,并将保存的文件提供给研发人员分析,从而解决故障与矛盾。

三、结束语

新时代在数据通信网络中,EPON一直具有节省光纤资源、对网络协议透明的的特点,在充足满足客户接入网带宽与变化的需求基础上,开始逐渐成为光接入网领域中的热门技术。华为软交换烽火epon系列的产品,覆盖着电信5类线,满足着宽带或语音等应用需求,为客户提供实战性、专业化的网络技术需求。所以其故障的排查在使用中显得尤为重要,在分析NGN信令包,RTP包,私有协议包的基础上,对语音业务进行检查配置、镜像抓包、串口捕获是解决故障的基本方式。由于中国大陆的光纤网路布建目前正快速的发展当中,其中EPON宽频高速连线技术所带来的低功耗、高扩充性与高整合能力的优势特性深受广大电信业者的注目,而对epon系列语音故障排查,显得尤为重要。市场对华为软交换烽火epon系列的产品存在着巨大的需求,其语音故障排查方法的进步与完善将极大地对宽带用户体验提升到一个崭新的水平,对光纤网路具有深远的影响。

参考文献

[1] 《烽火EPON系列语音业务故障排查指南》

[2] 《烽火科技EPON系统解决方案》

交换机故障现场处理操作研究与实践 第7篇

为了更快速、更高效地处理交换机的故障, 争取在现场能够一次性地将故障相关的信息捕获完全, 确保通过与相关厂商研发相关人员的沟通和联系, 能够根据这些信息快速地定位故障的原因, 所以有必要对交换机在出现故障时现场处理的步骤进行总结和规范, 方便网络管理人员能够高效处理各类网络故障。

2 故障描述

IEEE802 LAN中, 用户只要能接到网络设备上, 不需要经过认证和授权即可直接使用。这样, 一个未经授权的用户, 他可以没有任何阻碍地通过连接到局域网的设备进入网络。随着局域网技术的广泛应用, 特别是在运营网络的出现, 对网络的安全认证的需求已经提到了议事日程上。如何在以太网技术简单、廉价的组网特点的基础上, 提供用户对网络或设备访问合法性认证的手段, 已经成为业界关注的焦点。IEEE 802.1x协议正是在这样的背景下提出的。

IEEE802.1x (Port-Based Network Access Control) 是一个基于端口的网络存取控制标准, 为LAN接入提供点对点式的安全接入[1]。这是IEEE标准委员会针对以太网的安全缺陷而专门制定的标准, 能够在利用IEEE 802 LAN的优势基础上, 提供一种对连接到局域网设备或用户进行认证的手段。

2.1 不启用802.1X故障现场描述

交换机下连的用户不能获得IP地址 (通过DHCP方式获得IP地址) ;或手工配置了IP地址的情况下, 不能跟网关通讯, 不能上网的故障。

2.2 启用802.1X故障现场描述

交换机下连的用户不能认证, 或能够认证通过但不能获得IP地址 (通过DHCP方式获得IP地址) , 不能上网等;或静态配置IP地址的情况下, 不能认证或能够认证通过但不能跟网关通讯, 不能上网的故障。

3 交换机故障现场处理步骤

3.1 故障排查步骤

针对不启用802.1X故障现场, 可以采用以下步骤。

1) 详细了解出现故障前后网络环境变化的相关信息;

2) 详细了解交换机使用的数量及出现故障的交换机的数量;

3) 详细了解出现故障的交换机每个端口下连的最终的用户数及整台交换机所带的用户数;

4) 详细了解每台交换机出现故障的用户数, 及部分用户的MAC地址和IP地址信息 (至少要求三个以上) ;

5) 提供完整的网络拓扑图 (从最终用户的电脑à交换机à汇聚层交换机à核心层交换机àDHCP Server, 要求在拓扑图上标出设备的型号, MAC地址, IP地址, 各设备相连的准确的端口标识) ;

6) 收集故障机的指示灯的状态信息 (比如灯的闪烁情况, Link/Active指示灯的情况, Power指示灯情况, 光纤模块指示灯的情况, 堆叠指示灯的情况等信息) [2];

7) 收集出现故障时的交换机的show信息, 具体如下:

在交换机上需要收集的信息如下:

8) 收集出现故障时的交换机的Sdebug信息, 具体如下:

9) 在汇聚层及核心层交换机上需要收集的信息如下:

10) 故障排查步骤:

A.通过串口登陆交换机, 在特权模式下ping交换机的管理IP地址及管理网关的IP地址;

B.将笔记本电脑接在出现故障的交换机用户VLAN的端口上;

C.设置笔记本电脑的IP地址; (通过ipconfig/all确认, 要求提供截图)

D.在笔记本电脑上运行Sniffer软件 (需要定义过滤模板, 只捕获ICMP协议) , 然后在笔记本电脑上开一个dos窗口, 去ping网关同网段的设备及其他网段的IP地址, 将测试过程 (要求截图) 及报文保存;

E.在交换机上需要收集如下信息:

Show mac-address-table dy;show arp;

在汇聚层或核心层交换机上需要收集如下信息:

Show mac-address-table dy;show arp

F.将笔记本电脑接在跟交换机管理IP同一个VLAN的端口上;

G.设置笔记本电脑的IP地址; (通过ipconfig/all确认, 要求提供截图)

H.在笔记本电脑上运行Sniffer软件 (需要定义过滤模板, 只捕获ICMP协议) , 然后在笔记本电脑上开一个dos窗口, 去ping网关同网段的设备及其他网段的IP地址, 将测试过程 (要求截图) 及报文保存;

I.在交换机上需要收集如下信息:

Show mac-address-table dy;show arp;

在汇聚层或核心层交换机上需要收集如下信息:

Show mac-address-table dy;show arp

通过以上10个步骤, 能够准备了解和采集到交换机设备所处网络环境、交换机设备工作状况等相关重要信息, 极大的方便研发等相关人员对故障的定位和处理。

3.2 故障排查步骤

在开启802.1x功能之后, 802.1x标准定义了一种基于“客户端服务器” (Client-Server) 模式实现了限制未认证用户对网络的访问。客户端要访问网络必须先通过认证服务器的认证。在客户端通过认证之前, 只有EAPOL报文 (Extensible Authentication Protocol over LAN) 可以在网络上通行。交换机只提供Authentication, Authorization, and Accounting三种安全功能。针对此类故障可以通过以下步骤解决。

1) 详细了解出现故障前后网络环境变化的相关信息;

2) 详细了解交换机使用的数量及出现故障的交换机的数量;

3) 详细了解出现故障的交换机每个端口下连的最终的用户数及整台交换机所带的用户数;

4) 详细了解每台交换机出现故障的用户数, 及部分用户的MAC地址和IP地址信息 (至少要求三个以上) ;

5) 提供完整的网络拓扑图 (从最终用户的电脑à交换机à汇聚层交换机à核心层交换机àDHCP Server及RG-SAM Serv⁃er;要求在拓扑图上标出设备的型号, 管理IP地址, 各交换设备相连的准确的端口标识及DHCP Server和RG-SAM Server服务器的MAC地址和IP地址及认证客户端的版本及配置信息) ;

6) 收集故障机的指示灯的状态信息 (比如灯的闪烁情况, Link/Active指示灯的情况, Power指示灯情况, 光纤模块指示灯的情况, 堆叠指示灯的情况等信息) ;

7) 在交换机上打开debug aaa命令, 收集认证过程Debug信息, 具体操作如下:

switch#debug aaa

8) 收集出现故障时的交换机的show信息, 具体如下:

在交换机上需要收集的信息如下:

9) 收集出现故障时的交换机的Sdebug信息, 具体如下:

10) 在汇聚层及核心层交换机上需要收集的信息如下:

11) 故障排查步骤:

A.通过串口登陆交换机, 在特权模式下ping交换机的管理IP地址及管理网关的IP地址DHCP Server

IP地址及RG-SAM IP地址[3];

B.将笔记本电脑接在出现故障的交换机用户VLAN的端口上;

C.设置笔记本电脑的IP地址; (通过ipconfig/all确认, 要求提供截图)

D.在笔记本电脑上运行Sniffer软件 (需要定义过滤模板, 只捕获ICMP协议) , 然后在笔记本电脑上开一个dos窗口, 去ping网关同网段的设备及其他网段的IP地址, 将测试过程 (要求截图) 及报文保存;

E.在交换机上需要收集如下信息:

Show dot1x summary;show mac-address-table dy;show arp;

在汇聚层或核心层交换机上需要收集如下信息:

Show mac-address-table dy;show arp

F.将笔记本电脑接在跟交换机管理IP同一个VLAN的端口上;

G.设置笔记本电脑的IP地址; (通过ipconfig/all确认, 要求提供截图)

H.在笔记本电脑上运行Sniffer软件 (需要定义过滤模板, 只捕获ICMP协议) , 然后在笔记本电脑上开一个dos窗口, 去ping网关同网段的设备及其他网段的IP地址, 将测试过程 (要求截图) 及报文保存;

I.在交换机上需要收集如下信息:

Show dot1x summary;Show mac-address-table dy;show arp;

在汇聚层或核心层交换机上需要收集如下信息:

Show mac-address-table dy;show arp

4 总结

传统的网络故障处理, 没有合理规范的处理流程, 造成网络管理人员对网络故障通常采用经验法等方式处理故障, 既浪费时间又不能及时处理故障。通过本文的处理流程经验介绍, 希望能对网络管理人员有所帮助和提高。

摘要:网络技术已经广泛的应用到社会的各个领域。现代通信行业为人民的生产生活带来了极大的便利。在通信网络中, 交换机是进行信息交换的关键设备, 无论是在通信效率还是网络安全等方面都起着重要的作用, 交换机的故障分析与维护尤为重要。该文对交换机的几种典型故障处理操作进行分析分析与讨论。

关键词:交换机,故障

参考文献

[1]林冬茂.基于802.1x协议与数字证书的网络安全方案[J].科技风, 2013, 26 (14) :1.

[2]王日新.浅谈程控交换机故障的分析与维护[J].消费电子, 2013, 24 (8) :70.

交换机故障 第8篇

电力调度交换机的运行维护是一项重要的电力通信安全生产工作。其主要工作内容包括设备运行状态监测、设备数据库定期备份、网管系统参数指标监测、设备故障实时分析、设备故障点发现、故障排除等。流程化、规范化的维护操作够提升设备安全运行水平, 提高运行维护工作的效率。

1 调度交换机的日常维护管理

1.1 日常维护管理工作关键

日常维护管理是指利用巡视、测试、监测等手段, 及时发现设备告警状态, 采集告警数据并进行分析, 最终排除设备故障和隐患的过程。在本项工作中, 应重点关注巡视设备的运行状态、网管系统告警信息, 备份数据库数据内容和测试调度电话工作状态四个关键点, 才能及时发现设备潜在的安全风险点, 准确识别可能存在的各种不安全因素, 消除存在隐患。

1.2 设备外部运行环境维护

调度交换网安全稳定运行, 需要以良好的外部环境作为基础。调度交换机房应有温湿度监测装置, 配置安全可靠的供电电源, 机房的照明系统、防火系统、防小动物、防静电以及机柜的接地电阻接地等一系列安全措施都要符合标准且进行定期检查维护。机房环境的干净整洁, 对调度交换机的可靠运行也至关重要。应定期检查设备的污染情况, 并对设备进行清洁维护。

2 调度交换机的故障处理

2.1 故障的发现与分析

设备告警状态的直接依据是调度交换机的指示灯工作状态, 不同的指示灯工作状态代表不同的故障类型, 设备运维人员需熟识各类指示灯状态信号, 密切关注其变化情况。故障分析是在故障发现后对系统运行情况的综合诊断测试, 需借助运维终端软件管理程序完成。通过该系统获得调度交换机告警信息以及运行参数, 对故障进行深入分析。故障分析过程中, 应注重基本告警信息的筛选, 避免因告警信息量庞大而造成的影响故障分析事件的发生。

2.2 故障的查找与排除

下面以广州哈里斯IXP-LCC型号调度交换机为例, 针对不同故障类型和设备状态, 定位故障点, 提出与之对应的故障处置方法。

2.2.1 交换机主控系统故障

(1) 中央处理器板 (RCPU2) 故障:

1) 故障现象:单台交换机主备中央处理器板同时发生故障:本台交换机停止工作;主备中央处理器板CRIT ALARM红色告警灯亮。单台交换机单层中央处理器板故障:单台交换机双主控系统主用或备用的中央处理器板CRIT ALARM红色告警灯亮;交换机接续正常。

2) 故障原因:中央处理器板硬件电路损坏导致板卡无法使用。

3) 故障处理:登陆调度机系统维护终端, 查看设备告警信息, 初步确定故障性质。如果诊断为板卡故障, 则更换故障板卡, 还原初始化配置。最后将数据库进行主备数据同步操作, 保障双系统的运行。

(2) 时隙交换板 (MXU) 故障:

1) 故障现象:时隙交换板MXU主要完成语音交换, 与背板上的PTU板配套使用。时隙交换板故障时, 板卡上有黄色告警灯闪烁, 与其配对使用的PTU板亮红色告警灯;与此板卡对应的电话端口无法使用, 相应的用户板卡状态为退出服务。

2) 故障原因:背板上的网线松动或网线水晶头接触不好。硬件加载错误。板卡故障。

3) 故障处理:插拔背板上的网线, 如果恢复正常, 则说明网线插头接触不好, 有必要的话重做网线插头。

上电时PTU的DS5红灯亮、PAM卡的DS3红灯亮, 表示硬件加载错误, 需要关开电重新加载。

MXU灯正常, PAM卡灯不亮, SDU亮红灯, 说明PAM卡硬件加载错误或损坏, 需要关开电重新加载。

在告警板卡的槽位上调换同层相同型号的板卡, 如果恢复正常, 则说明此板卡故障;更换故障板卡。

如果调换同层相同型号的板卡后故障仍然存在, 则说明此板卡所所对应的背板 (PTU) 故障;更换相应的背板。

2.2.2 交换机的外围机框公共板故障

(1) 故障现象:交换机多方通话、远端维护、来电显示等功能缺失。

(2) 故障原因:每种公共服务板在交换机上一般都不止一块, 单个公共服务卡故障一般不会造成某种功能完全丧失, 但会造成该功能所支持的范围缩小, 故障卡板红色告警灯亮。

(3) 故障处理:用户近期摘机无拨号音的概率增高, 可判定为多功能板CFU3故障。

模拟电话的来电显示以及交换机远端集中维护功能不能正常使用, 可初步判定为多功能板故障。若频繁出现2M中继板吊死的情况, 可能为时钟板故障, 更换故障板卡。

2.2.3 交换机电源故障

(1) 故障现象:交换机主机框和外围机框全部断电;交换机外围机框单个电源板卡告警, 系统运行正常, 不影响正常业务接续。

(2) 故障原因:主机框和外围机框断电, 指示外部电源故障。调度交换机某个外围机框电源板故障时, 可以利用相邻机框电源板提供供电保障, 不影响业务接续。

(3) 故障处理:若交换机所有板件的指示灯都不亮, 可初步判定为外部电源故障。检查直流供电开关盒高频开关电源。若单个机框电源板出现告警, 说明此电源板故障, 更换故障板卡。

2.2.4 调度交换中继故障

电力调度交换网通过2M数字中继组成交换网络, 主要采用QSIG信令方式实现与上级和下级单位调度交换机的中继联接。

(1) 故障现象:中继板告警灯亮, 该局向无法正常接续;2M数字中继板卡无红灯告警, 查看板卡状态为Out of serveis。

(2) 故障原因:本端2M中继板故障。该局向经过的传输路由有故障。对端2M中继板故障。2M线缆故障。

(3) 故障处理:对发生告警的2M中继接口进行环回试验, 如果近端环回不正常, 判定为本端中继板或2M线缆故障;若远端环回不正常, 通知运维人员检查传输系统;如果传输系统正常, 则通知对端维护人员检查对端交换机;若红色告警灯不亮, 但是该局向不能正常接续, 则通过维护终端, 查看板卡电路状态是否正常;若板卡状态为退出服务, 则重启交换机或者拔插板卡。

2.2.5 调度台故障

(1) 调度台触摸屏故障:

1) 故障现象:触摸操作定位不准确, 不能正常使用。

2) 故障原因:触摸屏设备故障。调度台主机故障。软件故障。

3) 故障处理:校准调度台触摸屏;重启调度台主机, 如恢复正常, 判定为软件故障;检查触控电缆两端插头, 排除接触不好的情况;更换触摸屏, 若恢复则为触摸屏故障;更换主机, 若恢复则为主机故障。

(2) 调度台话机故障:

1) 故障现象:调度台只有一个手柄可以接起电话。

2) 故障原因:话机电话线接头松动。话机本身故障。调度台U口设置。

3) 故障处理:重新插拔话机电话线, 故障恢复说明连线接头松动。更换话机, 如果通话恢复正常, 否则判定为话机故障。更改调度台U口设置。

2.2.6 外围设备故障:

(1) 录音系统故障:

1) 故障现象:录音系统不能正常录音。

2) 故障原因:存储录音文件的磁盘空间已满。录音端口故障。数据库文件遭到破坏。

3) 故障处理:备份录音文件, 释放磁盘空间。用数据库修复文件修复数据库。更换录音端口, 录音恢复正常说明端口故障。

(2) 交换机维护终端故障:

1) 故障现象:无法登陆维护终端。

2) 故障原因:维护终端与异步通信适配器 (DCA) 的线缆连接松动。通信适配器 (DCA) 故障。

3) 故障处理:重新插拔接线缆连接头, 若恢复正常, 说明线缆松动。若通信适配器 (DCA) 故障, 则更换DCA。

2.3 故障处理实例

2.3.1 实例1

(1) 故障现象:2011年1月4日下午15点左右, 洛阳供电公司出现调度台U口在B机上时, 响铃接不起电话, 也拨不出电话的现象, 用户维护人员发现B机第一机架第三槽口PTU板与第二机架第二槽口PTU板告警;当时主用机架为第二机架;观察B机第一机架与第二机架TCU、MXU、BTU、PTU及用户机架PSW、SDU板亮灯状态, 发现如下异常:第二机架第三槽口MXU上有黄灯亮;第一机架第四槽口PTU板网口处有红灯亮, 但对应的MXU未亮黄灯;第二机架第三槽口PTU板未插;用户机架PSW板上第二与第五红灯亮;个别用户机柜SDU板亮红灯;不能进入终端。

(2) 处理过程如下:将第二机架第三槽口PTU板插入恢复, PTU网口处红灯, 将第二机架断电重启, PTU板与前端MXU板正常;将第一机架切换到第二机架, 此时B机用户与调度台同时振铃, 第一机架第四槽口PTU板仍亮红灯, 关掉第一机架电源, 振铃消失, 重启第一机架后PTU板正常, 用户机柜PSW及SDU板亮灯状态正常;测试B机用户及维护终端, 正常;切换机架正常。

2.3.2 实例2

(1) 故障现象:河南省调端调度A机灵宝换流站中继板告警:2011年1月17日巡视机房时发现河南省调端调度A机灵宝换流站中继板PMA亮红灯告警。

(2) 故障处理:省调端在十楼数配上对设备打硬环后告警消失, 排除省调端设备故障。随后检查传输路由, 该路由为国网ECI设备, 在国网ECI网管上河南省调16口打环后告警消失, 排除此段通道故障。与国信通联系后, 确认为灵宝换流站2M中继板卡故障, 灵宝换流站更换板卡后故障消失。

3 结语

调度交换系统作为协调调度生产的重要基础支撑在整个电力系统中不可或缺, 是电网安全、稳定运行的重要指挥系统, 电网调度的安全是电网运行的可靠保障。因此, 维护人员应不断积累经验, , 逐步提高日常维护和故障排除技能, 以确保电力调度交换网的稳定运行。

摘要:电力调度交换机的运行维护对保证电网的安全运行十分重要。文章结合实际运行维护管理经验, 介绍了Harris调度程控交换机的日常维护和故障判断、定位及处理方法。

关键词:调度交换机,维护,管理,故障处理

参考文献

[1]HARRIS 2020软件初级教程.广州哈里斯通信有限公司.

[2]HARRIS 2020维护初级教程.广州哈里斯通信有限公司.

[3]HARRIS 2020硬件初级教程.广州哈里斯通信有限公司.

[4]於蔚蔚.REDCOM交换机的维护与常见故障处理[J].电力系统通信, 2005 (4) .

交换机故障 第9篇

1 程控交换机的基本结构

程控交换机的基本结构包括外围电路模块、交换网络模块、管理通信模块[3,4]。具体介绍如下:

1.1 外围电路模块

1.1.1 用户电路

数字交换网络交换的是数字语音信号,而用户线上传输的一般是模拟信号以及-48V直流电压和铃流等带外信号,所以用户线信号进入数字交换网络前必须进行处理(如滤波、变换等)。这项工作是由用户电路(SLC)完成的。用户电路是用户线和交换网路或其他电路(如扫描电路)之间必不可少的接口。程控交换机的用户电路具有七种功能,即馈电、过压保护、振铃、监视、单路编译码器、混合电路和测试。这七种功能通常又简称为BORSCHT功能。模拟交换机的用户电路出没有编译码器外,其余六种功能完全一样。用户电路一般用集成电路实现。

1.1.2 中继电路

中继器是中继线与交换网络以及控制系统间的接口电路,它传输的信号不仅包括语音信号还包括各种局间信号。中继器一般由保护电路、信号互换电路、用户线信号电路和隔离电路等组成。其中信号互换电路用来指定中继线工作方向(出中继或入中继)和指定信号形式。用户线信号电路则用来在出入中继期间用户电路断开时,代替用户电路向话机馈电、铃流的接通和断开、传输信号等功能。隔离电路的功能则用来分离开中继器是中继线和交换网络以及控制系统间的接口电路。

1.2 交换网络模块(SM)

程控交换机最基本的功能就是在各条用户线之间、用户线和中继线之间或中继线与中继线之间建立起语音信号临时通道。

交换模块(SM)由主控单元与接口单元组成,主控单元通过接口单元配上不同的外围接口电路就可以构成不同的交换模块,提供不同的业务功能。

交换模块(SM)的主控单元主要有主处理机(MPU)、模块内通信控制点(NOD)、模块通信板(MC2)、光纤接口(OPT)、模块内交换网板(NET)、数据存储板(MEM)、音信号板(SIG)和信令处理板(MFC、LAP)等构成,各电路均按双备分方式配置。

1.3 管理通信模块(AM/CM)

管理通信模块(AM/CM)由中央处理模块(CPM)、中央交换网(CNET)、通信控制模块(CCM)、同步定时系统(STM)、业务线路接口模块(LIM)和后管理模块(BAM)几部分组成。

1.3.1 中央处理模块(CPM)

CPM包括主处理板(AMP)、中心数据板(CDP)、总线控制板(BCP)、内置服务处理板(ISP),完成系统全局数据的存储和处理,并负责对AM/CM中的单板管理。CPM到CCM有HDLC链路,再通过CCM到各模块的HDLC链路来控制各模块的工作。其中AMP板完成对中心模块的数据管理、设备管理、维护、告警、流量统计及负载控制等功能。

1.3.2 中央交换网(CNET)

CNET是一个大型交换网,包括交换网通信控制板(NCC)、总线驱动板(BDR)、总线交换网板(CNU)、边缘交换网板(SNU)。

CNET为三级结构,由中心交换网板CNU和边缘交换网板SNU组成,其中CNU板为中间级,SNU板为输入输出级。NCC完成交换网络的时隙分配、接续控制,控制本模块单板与其它模块的通信。BDR板的主要功能是进行总线驱动,增强NCC总线驱动能力,以实现网控功能。

1.3.3 通信控制模块(CCM)

CCM是模块间通信的核心,包括帧交换网板(FSN)、总线控制板(BAC)。

BAC是通信控制模块的总线管理控制板,负责完成对通信控制模块帧交换网的通道配置、总线仲裁,对通信控制模块中各单板的工作状态进行监控,完成CCM与外界的通信,同时BAC板具有帧交换的功能,参与整个通信控制模块的帧交换工作。

FSN是通信控制模块的帧交换板,用于实现多个HDLC通道的HDLC信令链路交换。它接收来自各接收通道的信息包,根据其中的目的地址发送到相应的通道,通过交换总线实现板内、板间接收单元到任意发送单元的交换。同时,FSN与其它模块单板相连,实现各模块之间的信令交换。

1.3.4 同步定时系统(STM)

STM从上级交换设备提供的时钟基准中提取恢复时钟信号,输入交换机可用时钟,并将时钟信号输出到其它各个模块。它和AMP板通过串口线直接连接,接受AMP的控制。

1.3.5 业务线路接口模块(LIM)

LIM包括各类业务接口板(OBC、E16、STU等)和高速信号接口板(QSI),主要完成业务数据与信令数据的复核和分解,提供传输线路驱动接口,使中心模块与其它网络设备相连。

QSI板是LIM的核心板,是LIM同中心模块其他设备相连的枢纽。在发送方向,它将从本模块中各业务接口板接收下来的数据进行码速变换,传送给中心交换网络CNET;同时将信令数据传送到通信控制模块CCM。在接收方向,将中心交换网送来的高速信号数据进行分发,送给本模块的业务接口板;同时也将通信控制模块CCM送来的信令数据进行分发,送给本模块各业务接口板。

1.3.6 后台管理模块(BAM)

BAM以LAN的形式将维护台、特服台、计费台、服务器等组成后台终端系统,由一台装有专用软件的计算机终端构成,通过HDLC链路与AM/CM通信。

2 人工神经网络方法

神经网络的全称是人工神经网络(artificial neural network,ANN),是在现代神经生物学研究成果的基础上发展起来的一种模拟人脑信息处理机制的网络系统,它不但具有处理数值数据的一般计算能力,而且还具有处理知识的思维、学习和记忆能力。

2.1 BP网络

BP神经网络又称为误差反向传播(Back Propagation)神经网络,它是一种多层的前向神经网络。在人工神经网络的实际应用中,BP网络广泛应用于函数逼近、模式识别/分类、数据压缩等,80%~90%的人工神经网络模型是采用BP网络或他的变化形式,它也是前馈网络的核心部分,体现了人工神经网络最精华的部分[5]。

2.1.1 BP神经元模型

如图1所示给出了一个具有R个输入的基本的BP神经元模型结构。图中每一个输入被赋予一定的权值,与偏差求和后形成神经元传递函数的输入。

BP网络属于多层网络,其神经元常用的传递函数包括log-sigmoid型函数、logsig、tan-sigmoid函数tansig,以及线性函数pureline。在隐层中常常采用sigmoid函数进行中间结果的传递,而在最后输出层用线性传递函数进行值域扩展。

2.1.2 BP算法

BP网络的学习是有指导学习,训练过程需要提供输入向量p和期望响应t,训练过程中网络的权值和偏差根据网络误差性能进行调整,最终实现期望的功能。前向型神经网络采用均方误差作为默认的网络性能函数,网络学习的过程就是使均方误差最小化的过程。

BP算法的迭代公式可以表示为:

其中xk代表当前的权值和偏差,xk+1代表迭代产生的下一次的权值和偏差,gk为前误差函数的梯度,ak代表学习速率。

3 基于神经网络的程控交换机故障诊断

程控交换机是由相互关联的一系列单板相互配合完成一定功能的通信设备,当某单板故障告警时会导致其它单板无法完成预定功能而告警,接着又会导致另一些相关单板的告警。通过理论分析相关单板的关联关系,整理出完备的设备告警关联关系数据,设计BP网络模型并对其进行训练,可实现对故障的迅速准确定位。

基于神经网络的程控交换机故障诊断的方法步骤如下:

1)通过分析,抽取反映程控交换机的故障参数,如(x1,x2,xn)作为网络的输入模式。

2)对被检测对象的状态类别进行编码。

3)进行网络设计,确定网络层数和各层神经元数。

4)用各种状态样本组成训练样本,输入网络,对网络进行训练,确定各个单元的连接权值。

5)用训练好的网络对待检测对象进行状态识别,即把待检对象的特征参数作为网络输入,根据网络输出确定待检对象的状态。

通过对通信管理模块和交换模块的分析,可分别得到程控交换机构成单板间的关联关系,如图2和图3所示。另外,电源板(PWX)和时钟板(STM),任意一类告警都会导致整个设备的工作异常,为最高级且独立的告警,应用神经网络时未予考虑。

BP神经网络的层数设计为两层,其中隐层有14个神经元,传递函数为logsig型函数;输出层有9个神经元,传递函数为pureline线型函数。神经网络模型如图4所示。

从模型中可以看出,系统的输入、输出均为9维向量,输入的每一位代表9个不同的程控交换机单板,输出的9位中,1代表故障单板,0代表无故障。

由于该系统所处理的数据量不大,所以模型没有设计作为数据缓冲的输入层。训练精度设定为1e-5时,经过98次迭代就可以达到要求精度,仿真结果如图5所示。

该系统神经元数目不多,需要确定的权值、偏差数目也相对较少,所以选用对于小型神经网络收敛速度快、精度高的trainlm函数作为训练函数。通过大量的测试数据验证,诊断结果快速准确,满足系统设计的各项要求。

系统在验证测试过程中,训练精度分别设定为1e-5、1e-4、1e-3时,各需要经过98、47、12步迭代才能达到要求精度,可见随着精度的提高训练时间会加大,即迭代次数也会增加。检测结果的数据表明训练精度越高,得到的结果误差越小,系统可靠性也越高,反之,训练精度越低,得到的结果误差越大,系统可靠性也越低。

4 结束语

通过对程控交换机基本结构及其组成的分析,分别得到程控交换机通信管理模块和交换模块相关单板间硬件故障时的关联关系,并应用神经网络的方法设计了一个程控交换机故障诊断系统。经仿真测试验证该方法能迅速准确地对故障进行定位,对提高程控交换设备的故障管理水平具有一定的理论指导意义。

参考文献

[1]陈宜勋.程控交换机在使用中的故障分析与处理[J].煤炭技术,2004,23(4):29-30.

[2]阮琳.对程控交换机呼叫前转业务失败故障的分析与处理[J].电信科学,2004,20(5):73-74.

[3]马志强.程控数字交换技术[M].西安:空军工程大学,2002.

[4]华为技术有限公司.C&C08数字程控交换技术手册.1999.

交换机故障 第10篇

1 故障一

1.1 故障现象

DR所摄的影像不能从控制室计算机传输到影像工作站计算机, 控制室计算机显示器提示:could not send mage。影像工作站Hb提示:Hb数据输入端口指示灯不亮。

1.2 故障分析

故障原因可能有: (1) Hb故障。 (2) 数据传输网线故障。 (3) 控制室计算机数据输出网卡接触不良或松动。 (4) 控制室计算机数据输出网卡故障。 (5) 控制室计算机数据输出网卡主板扩展槽故障。

1.3 故障排除

第一步:在影像工作站计算机工作状态下, 将数据输入端口指示灯不亮的Hb网线拔下, 插入原指示灯亮灯端口的影像工作站计算机数据输出网线 (打印机数据输入网线) , 若指示灯不亮, 则可判断Hb已损坏, 更换Hb即可排除故障。若指示灯亮, 则证明Hb工作正常。

第二步:在影像工作站将Hb上不亮的灯端口的数据传输网线拔下, 插入开机的影像工作站计算机, 将Hb移至DR控制室, 插入数据传输网线的另一端, 若端口指示灯不亮, 则证明数据传输网线故障, 需更换网线。若端口指示灯亮, 则证明数据传输网线工作正常。

第三步:打开控制室计算机机箱, 此时数据输出网卡上的工作指示灯应不亮。拔出数据输出网卡, 观察金手指上是否锈迹, 若有锈迹, 用干净的橡皮擦擦拭, 然后重新插回扩展槽。若数据输出网卡工作指示灯亮, 则故障排除。若工作指示灯仍不亮, 如果主板上尚有空余的扩展槽可逐个插入, 若数据输出网卡工作指示灯亮, 则故障排除。若工作指示灯亮均不亮, 再将工作正常的数据输入网卡拔出, 将数据输出网卡插入其中, 若工作指示灯亮, 则证明数据输出网卡工作正常, 故障系由扩展槽故障所致, 若工作指示灯不亮, 则由此可以推断数据输出网卡已坏。更换数据输出网卡并在控制室计算机上退出IMIX系统, 在Administrator界面输入Administrator密码进入Administrator系统, 修改IP地址即可排除故障。

第四步:若故障由主板扩展槽引起而主板又无空余的扩展槽, 则须购买一个USB网卡, 并在控制室计算机上退出IMIX系统, 在Administrator界面输入Administrator密码, 进入Administrator系统, 设定USB网卡端口及修改IP地址即可排除故障。

2 故障二

2.1 故障现象

DR所摄的影像不能从DR主机传输到控制室计算机, 控制室计算机显示器提示:could not send mage。

2.2 故障分析

故障原因可能有: (1) DR主机与控制室计算机数据传输网线故障。 (2) 控制室计算机数据输入网卡故障。 (3) 控制室计算机数据输入网卡扩展槽故障。

2.3 故障排除

第一步:在DR主机工作状态下, 将控制室计算机数据输入网线拔下并插入Hb, 若Hb端口指示灯不亮, 则表明DR主机与控制室计算机数据传输故障。检查DR数据传输网线接口是否松动, 若松动, 紧固后重新开机即可排除故障;若无松动, 则须更换网线, 以排除故障。

第二步:若Hb端口指示灯亮, 则表明DR数据传输网线工作正常, 故障出在DR数据输入网卡或数据输入网卡扩展槽, 排除方法同1.3的第三步骤和第四步骤。

需要注意的是, 若数据输出网卡或数据输入网卡为主板集成网卡, 网卡损坏后, 若主板尚有空余的扩展槽, 购置新网卡插入扩展槽并进入计算机Administrator系统修改IP地址即可排除故障。若主板无空余扩展槽, 则须购置USB网卡并进入控制室计算机Administrator系统, 设定USB网卡端口及修改IP地址即可排除故障。

参考文献

交换机故障 第11篇

华为C&C08 32模数字程控电话交换机于2005年落户宣钢公司, 由于设备的技术成熟度较高, 整个C&C08系统多采用主备用结构, 整体运行稳定性较高, 设备故障率很低。由于我们在日常维护中, 很少遇到设备故障, 动手处理故障的机会很少, 使我们在设备发生故障后, 一是无法对故障快速定位、处理, 二是在处理故障时没有头绪, 不得章法, 稍有疏忽, 就可能使得小故障危及全局安全运行。

整个C&C08系统中, 交换模块的设备占有很大的比例, 随着设备的不间断运行, 发生用户故障情况逐渐增多, 经过我们仔细的分析, 故障主要集中于设备板卡故障、用户操作使用不当和线路故障三方面, 以下我们主要针对用户的操作使用和设备故障两方面造成的用户电话故障进行分析。

1. 宣钢公司数字程控电话交换系统介绍

宣钢公司在用的华为C&C08 32模数字程控电话交换系统是一个专网用户局 (简称867局) , 由一个管理/通讯模块 (AM/CM) 、一个交换模块 (SM) 和2个远端交换模块 (SMⅡ) 组成。867局的SM和SMⅡ是整个系统的核心模块, 各自具有独立交换功能, SMⅡ通过SM完成出、入局的电话通信。

2. 用户电话发生故障后的分析和处理办法

在我们对867局电话的日常维护中, 接到最多的申告电话故障是用户电话机不振铃, 根据我们积累的维护经验, 除电话机故障外, 出现用户电话不振铃情况主要有以下几种原因:

2.1 用户对电话新业务的使用操作不当

故障现象:经常会有用户反映, 拨打某电话号码后, 主叫方听到回铃音, 但被叫无人接听, 结果总认为被叫没在现场;或者主叫用户会听到“呼叫的号码不存在”的提示, 当与被叫使用其他联系方式沟通后才知道被叫电话根本就不响铃, 而被叫电话号码如果做主叫时, 却能与其他被叫电话正常通话。

原因分析:出现这种情况, 我们可以在电话配线架上连接一部电话机进行监听, 会听到拨号音是“滴、滴、滴”间断且非常急促的声音, 而不是正常的“滴”这样不间断的长音, 由此我们断定用户使用了新业务呼叫前转, 呼转到一部无人接听的电话或是一个不存在电话号码。此故障主要由我们监听电话的拨号音来确定电话故障原因。

处理办法:呼叫前转的方式有三种:无条件呼叫前转 (CFU) ;遇忙呼叫前转 (CFB) ;无应答呼叫前转 (CFNR) 。我们可以在配线架上连接话机, 进行新业务取消, 操作方法是在电话机上连续接下“#57#”或“#40#”或“#41#”取消对应CFU、CFB、CFNR新业务, 待听到“您的新业务已取消, 谢谢”提示之后电话恢复正常。

2.2 用户框中A32单板故障

故障现象:在处理867局SM模块用户电话故障时, 发现配线架横列模块对应电话号码端口无拨号音, 拔出直列模块保安单元断开外线电缆后, 依旧无拨号音, 但用户线有馈电。

原因分析:将断开的用户电缆线与电话机进行连接后, 使用其它电话拨打此故障电话号码, 主叫听到回铃音后, 我们进行电话接听可以正常通话。由此可以断定为A32单板上用户无铃流, 导致用户不振铃。

处理办法:更换A32用户单板。需要注意的是该操作会影响其他用户正常通信, 一般要选择话务量较低时完成。

2.3 用户框中多个用户出现通信故障

故障现象:在处理867局的一个远端模块用户故障时, 发现一个用户框中多个用户同时发生故障不能通话, 故障现象与“单板故障”类似, 所不同的是用户线电压和电流为“零”无馈电, 。

原因分析:先将A32单板更换, 再用万用表测用户线电压、电流时仍然为“零”, 接着对用户电缆进行检查时也没有发现断裂情况, 由于该远端模块采用“弹性放号”分配资源, 我们及时调整了用户端口数据, 再进行测试, 用户通信一切正常。

由此我们断定, 故障点在交换机用户框母板, 需要更换, 考虑到此维护风险较大, 可能导致远端模块通信瘫痪, 最终决定将于单板除尘维护时更换机框。

处理办法:由于此SMⅡ采用弹性放号分配资源, 我们采取了“保守治疗”, 调整了发生故障的用户端口数据, 问题得到解决。

3. 日常维护工作建议

3.1 完善制度, 加强对设备的日常维护管理, 要求每班固定时间对设备运行状态进行现场检查, 发现问题及时解决。

3.2 班组内必须准备齐全重要备件 (如CTN、BENTA、MPU、E16、DTM、A32、PWX、PWC、PWS等单板)

3.3 制定标准化作业文档, 对设备的各种操作统一标准流程, 规范操作。

3.4 班组内进行“每周一课”的专项学习, 学习设备随机手册, 交流日常维护经验, 取长补短, 提高全员技术水平。

4. 结束语

华为C&C08 32模数字程控电话交换机由于其高稳定性、低故障率和丰富的新业务, 在867局投入使用后, 给宣钢公司生产经营及生产调度等通信工作带来了极大的方便, 而我们作为设备的维护人员, 日常主要做预防性维护, 这就需要我们工作中不断提高个人技术水平, 多了解设备, 加强责任心。对于发生的故障, 事后深入分析、讨论, 制定处理流程和方法, 进一步查找故障根源, 针对根源查隐患, 防患于未然。

摘要:在对华为C&C08 32模数字程控电话交换机日常维护中, 我们通过对单个或部分用户电话不振铃故障的分析研究, 总结出故障原因和处理方法, 并就交换机的日常维护工作提出一些建议。

交换机故障范文

交换机故障范文(精选11篇)交换机故障 第1篇1 设备的日常维护工作ZXJ10交换机的日常维护包括日维护、月维护、季维护,要想做好如下的维护...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部