一种故障定位分析的方法及系统的制作方法_2

文档序号:9633684阅读:来源:国知局
网元。
[0040]较佳地,所述场景复现系统,还用于:
[0041]根据所述网元快照信息中的操作日志数据,所述场景复现系统对所述快照系统中的代理网元进行操作,其中所述操作日志数据包括操作人员的操作时间、操作对象、操作类型和操作结果的数据。
[0042]较佳地,所述快照网元系统还包括:
[0043]网络通信模块,用于监控所述场景复现系统与所述快照网元系统之间的信息交互。
[0044]较佳地,所述快照网元系统还包括报文处理模块,所述报文处理模块具有用于:
[0045]当所述快照网元系统中的代理网元接收到场景复现系统的查询或者设置请求时,获取该代理网元的报文命令码;
[0046]所述快照网元系统根据所述报文命令码,获取所述场景复现系统中的通信报文数据,并确定响应报文;
[0047]所述快照网元系统将所述响应报文反馈给所述场景复现系统;
[0048]所述场景复现系统根据所述响应报文定位所述故障。
【附图说明】
[0049]图1为本发明实施例提供的一种故障定位分析的方法的流程示意图;
[0050]图2为本发明实施例提供的一种网管系统存储备份网元快照信息的方法的流程示意图;
[0051]图3为本发明实施例提供的另一种故障定位分析的方法的流程示意图;
[0052]图4为本发明实施例提供的一种快照网元系统的操作流程的示意图;
[0053]图5为本发明实施例提供的一种故障定位分析的系统的结构示意图;
[0054]图6为本发明实施例提供的一种网管系统的结构示意图。
【具体实施方式】
[0055]本发明实施例提供了一种故障定位分析的方法及系统,用以通过搭建的场景复现系统和快照网元系统对网管系统中的故障进行定位分析,从而减少了投入的设备和工作量,提高了故障定位分析的成功率。
[0056]实施例1
[0057]参见图1,本发明实施例提供的一种故障定位分析的方法,包括:
[0058]S101、根据网管系统运行中产生故障时备份的网元快照信息搭建场景复现系统和快照网元系统,其中快照网元系统中包括与网管系统进行交互的网元一一对应的代理网元;
[0059]需要说明的是,本发明实施例中的网管系统是指用于管理外部真实网元通信的系统,且在运行中产生了故障,一般地把网管系统在正常运行的场景成为工程场景。本发明实施例中的场景复现系统和快照网元系统是根据在网管系统产生故障时备份的网元快照信息搭建的系统,且本发明的场景复现系统和快照网元系统可以理解是网管系统中增加的一部分,也可以理解为单独与网管系统存在的两个系统。例如场景复现系统和快照网元系统可以在是工程场景之外的是实验室模拟搭建,也可以在产生故障的网管系统中增加一部分存储空间用于搭建场景复现系统和快照网元系统,本发明实施例不做具体限定。
[0060]其中,快照网元系统中包括多个虚拟的代理网元,且每一代理网元和网管系统交互的真实网元一一对应。且代理网元的个数与真实网元相同,且每一代理网元的参数与真实网元相同。
[0061]本发明实施例中提供的网元快照信息包括网管配置数据、通信报文数据和操作日志数据。网管系统在运行中会将网元快照信息进行存储,用以为网管系统故障时提供参数。
[0062]S102、根据网元快照信息,场景复现系统与快照网元系统中的代理网元之间进行信息交互,根据快照网元系统反馈的报文信息确定故障。
[0063]需要说明的是,网元快照信息中存储了真实网元与网管系统的信息交互,以及操作人员的操作人员的操作日志,因此在场景复现系统与快照网元系统进行信息交互时,需要参照网元快照信息进行相同的交互,然后快照网元系统根据交互的条件进行相同的报文反馈,从而完成故障的复现,以及确定故障的位置。
[0064]通过本发明实施例提供的故障定位分析的方法,根据网管系统在故障时备份的网元快照信息搭建两个虚拟的系统场景复现系统和快照网元系统,其中场景复现系统是网管系统的一个虚拟系统,且作用和参数相同,快照网元系统是与网管系统产生交互的网元的一个虚拟系统,且作用和参数相同;通过网元快照信息,使得场景复现系统和快照网元系统产生相同的信息交互,根据快照网元系统反馈的报文信息确定网管系统的故障。因此,本发明提供的故障定位分析方法,通过利用网管系统中备份的网元快照信息在场景复现系统和快照网元系统重新复现,解决了当前网管系统故障复现时设备投入量大、复现成功率难以保证,以及工作量较大的问题。
[0065]需要说明的是,网管系统在工程场景运行时,首先需要现场操作人员开启故障监控模式,其中故障监控模式是指在网管系统运行中记录快照网元信息的模式。当然现场操作人员可以根据需要开启故障监控。例如,对于资源较为丰富的网管系统可以一直开启故障监控模式,且需要配置定期清理数据,防止硬盘占满的情况。对于资源比较有限或性能较差的网管系统在故障发生之后再开启故障监控模式,然后通过现场工作然人员进行网元快照信息的收集。然后将网元快照信息进行备份,以备网管系统产生故障时所需。
[0066]其中,在S101中根据网管系统运行中产生故障时备份的网元快照信息搭建场景复现系统和快照网元系统,包括:
[0067]根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据搭建场景复现系统;
[0068]根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据和通信报文数据搭建快照网元系统;
[0069]其中,网管配置数据包括多个网元的设备类型、IP地址、板卡、端口、交叉配置以及业务配置的数据;所述通信报文数据包括网管系统发送给每个网元的查询或设置报文、每个网元返回给网管系统的应答报文的数据。
[0070]本发明实施例中的网元快照信息包括网管配置数据、通信报文数据和操作日志数据。其中,网管配置数据是指网管系统中各个网元的配置信息,例如包括每个网元的设备类型、IP地址、板卡、端口、交叉配置以及其他业务配置。通信报文数据是指网管系统与外界真实网元的通讯报文的记录,该通信报文数据包括网管系统发送给每个网元的查询或设置报文、以及每个网元返回给网管系统的应答报文的数据。操作日志数据是指网管系统操作人员对网元或者设备进行操作的记录,例如包括操作时间、操作对象、操作类型和操作结果。例如,操作对象包括网元、板卡或业务等等,操作类型包括增加、删除、修改等等,操作结果包括失败、成功等。
[0071]进一步,网元快照信息是网管系统在运行时实时记录更新的,为了防止网元快照信息占用较大的内存,需要定期清理,或者周期性地生成网元快照信息。其中,网管系统可以设定的文件个数阈值、或设定文件大小阈值、或文件时间阈值,用以将不需要的网元快照信息进行删除。例如,假设网元快照信息产生的文件个数超过3个时,将删除较早生成的网元快照信息;假设网元快照信息产生的文件大小超过100M,则将删除文件中较早生成的网元快照信息。
[0072]具体地,在根据网管配置数据搭建场景复现系统时,可以在网管系统中新增加一部分空间,用以根据网管配置数据中的参数进行配置,从而形成与产生故障时的网管系统相同,使得场景复现系统的配置恢复到网管系统在工程场景的水平。或者,在网管系统之外的软件中实现场景复现系统的搭建,且需要根据网管配置数据进行搭建。
[0073]其中,根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据和通信报文数据搭建快照网元系统,包括:
[0074]根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据和通信报文数据,形成快照网元系统中的代理网元。
[0075]具体地,在根据网管配置数据和通信报文数据搭建快照网元系统时,根据网管配置数据中各个网元的类型,以及IP地址等信息形成与网管系统进行交互的网元完全相同的代理网元,根据通信报文数据确定每一网元与网管系统之间的交互。例如,与网管系统进行交互的网元包括N个,则形成的代理网元包括N个。
[0076]其中,S102中根据网元快照信息,场景复现系统与快照网元系统中的代理网元之间进行信息交互,包括:
[0077]根据网元快照信息中的操作日志数据,场景复现系统对快照网元系统中的代理网元进行操作,其中操作日志数据包括操作人员的操作时间、操
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1