异构的故障管理系统的制作方法与工艺

文档序号:11773036阅读:207来源:国知局
异构的故障管理系统的制作方法与工艺
本发明属于软件算法领域,用于执行轨道交通安全产品的故障管理功能。例如,轨道交通安全计算机平台,列车自动防护等。

背景技术:
在工业控制系统和安全信号系统中(应用于航空电子、铁路信号、核电等行业),在故障状态下采取措施尽量避免或者减少故障对人身和财产的损害,故障管理任务的正确执行对于保证系统的安全可靠有着极其重要的作用。当故障发生时,故障管理功能如果不能及时响应,系统发生安全事故的可能性就大为增加。因此,必须保证故障管理功能在各种情况下都能正常工作。现有的故障管理技术侧重点有所不同,下面列举3个现有的技术。1.IBM,USpatentNo.6,654,910,“Intelligentfaultmanagement”,阐述了用于汽车电子的智能故障管理方法,能保证系统的最短故障恢复时间和高可用性。控制系统是由多个逻辑控制单元组成,每个逻辑控制单元都有相应的故障监测方法。当检测到故障时,控制单元会降级系统性能,并通知其它控制单元。2.NEC,USpatent7,003,696,“Faultmanagementsystemforswitchingequipment”,描述了一个交换设备的故障管理系统。当一个交换设备的处理器或者电路出现可恢复的故障时,相关的故障终端能够被自动检测到。当一个时钟故障检测装置检测到时钟信号故障时,它会报告给中央故障管理系统。中央故障管理系统发出处理器和外围电路复位信号,并报告给外部显示终端。3.罗伯特.博世有限公司,CN200780036171.8,“用于故障处理的方法和装置”。描述了在具有多个组件的系统中进行故障管理的方法,其核心是能够借助 于状态值来表明所述组件的故障状态,而且组件之间的状态值有一定的依赖关系。以上这3种方法也都是采取组合式的故障管理方法,但区别于本专利中的主动查询和被动响应(一正一反)相结合的运行方式,而且每个故障管理模块的具体处理方式也有较大差异。

技术实现要素:
:本发明要解决的技术问题是提供一种异构的故障管理系统,其可以可靠的进行故障管理、预警。为了解决以上技术问题,本发明提供了一种异构的故障管理系统,系统故障管理模块是由两个异构的故障管理模块组成,两个故障管理模块分别采取被动接收和主动查询的方式运行,当任何一个故障管理模块启动时,系统就进入故障管理模式。本发明的有益效果在于:故障管理模块一被动收集故障报警信息,而故障管理模块二主动确认任务的正常工作状态。这两种故障管理模块通过两个不同的渠道来监控任务执行,有效地保障了系统故障管理的执行。故障管理模块二对任务的监控可根据任务的特点采用多种方式,灵活性好。故障管理模块一反应迅速,而故障管理模块二判定故障更加严格。两种故障管理模块的组合使用可使系统能迅速对故障做出响应,并在任何一个故障管理模块出现问题时,也不会造成系统故障管理功能失效。故障管理模块一采取被动接收的方式运行,实时监控任务发送来的故障报警信息。当未收到故障报警信息时,认为系统运行正常。如果收到故障报警信息,则立即启动故障反应机制。故障管理模块一采用实时监控并接收错误信息汇报的方式,运行起来后就 一直处于监听的状态;所有软件任务中都有多个故障检查点,当有故障出现时,检测程序确定故障类型和等级,并触发故障报警信号量,把故障信息写入到指定的消息队列;故障管理模块一收到故障报警信号量后,立即启动并从故障消息队列中取出故障报警信息,根据故障类型和等级作出警告、离线运行或者停机等不同的处理。故障管理模块二采取主动查询的方式运行,周期运行任务监控,当所监控的任务每个周期都能主动地报告各自的工作状态,认为系统运行正常,如果有任何任务没有在特定的时间内汇报工作状态,故障管理模块二启动故障反应机制。故障管理模块二通过多个全局变量来检查被监控任务的正常工作状态;每个任务如果能够正常工作,它们可以正确操作相应的全局变量;故障管理模块二通过全局变量的检查来确定所监控任务的工作状态;如果所有任务都能正确处理全局变量,则故障管理模块二认为系统工作正常,不触发故障管理功能;如果此故障管理模块二发现任何监控的任务不能正确操作全局变量,就判断某个任务出现故障,并启动故障管理模块进行处理。附图说明:图1是系统故障管理功能的结构图。图2是故障管理模块一的工作流程图。图3是故障管理模块二的工作流程图。具体实施方式:本发明提供一种异构的故障管理系统,该算法能够应用于包括但并不局限于安全信号系统、工业控制系统等领域。具体过程如下:系统的故障管理功能依赖于两种异构的故障管理系统的协同工作。当任意一种故障管理方法检测到 故障时,系统就进入故障管理模式。系统的故障管理功能架构参见图1。假定两种故障管理方法分别由故障管理模块一和故障管理模块二实现。如图2所示,故障管理模块一采用实时监控并接收错误信息汇报的方式,运行起来后就一直处于监听的状态。所有软件任务中都有多个故障检查点,当有故障出现时,检测程序确定故障类型和等级,并触发故障报警信号量,把故障信息写入到指定的消息队列。故障管理模块一收到故障报警信号量后,立即启动并从故障消息队列中取出故障报警信息,根据故障类型和等级作出警告、离线运行或者停机等不同的处理。如图3所示,故障管理模块二通过多个全局变量来检查被监控任务的正常工作状态。每个任务如果能够正常工作,它们可以正确操作相应的全局变量。故障管理模块二通过全局变量的检查来确定所监控任务的工作状态。如果所有任务都能正确处理全局变量,则故障管理模块二认为系统工作正常,不触发故障管理功能。如果此故障管理模块二发现任何监控的任务不能正确操作全局变量,就判断某个任务出现故障,并启动故障管理模块进行处理。当两种故障管理方法中的任何一个检测到故障并进入故障处理,整个系统就进入故障模式,并迫使系统进入安全状态。故障管理模块一的工作过程:1)首先要确定故障管理模块一所监控的任务,并尽可能详尽地考虑到每个任务会出现的各种故障,并对每个任务的故障进行编号并分类。当检测程序检测到故障发生时,将故障信号量设置为“True”,并将故障编号、故障等级和处理方式等信息打包写入故障消息队列中。为了保证能准确地将严重故障信息报送出来,故障消息在写入队列的时候可以添加校验信息,例如CRC值。并且故障消息的内容之间也会有特定的逻辑关系,例如相应的故障等级会有特定的故 障处理方式。如果故障处理中发现故障信息的信息校验不正确或者逻辑不符,直接使设备进入离线状态或者由操作人员决定后续的处理。2)故障管理模块一必须对所监控任务的故障信息代码划分故障等级,每种故障等级的处理措施也不相同。当故障管理模块一收到故障信息后,可以根据故障信息的代码判断出故障的发生地,故障等级和故障状况。由于故障等级已经预先设定,故障管理模块一可以根据故障信息的代码决定后续的措施。我们目前设计的故障处理通常可以分为报警、离线运行和停机三种状态。3)故障管理模块一运行后就一直处于监听状态。当检测到故障信号量置位后,会立刻从故障消息队列中获取故障信息,并启动故障处理,使系统进入故障管理模式。故障管理模块二的工作过程:1)首先要确定故障管理模块二所监控的任务。这里所监控的任务可以与故障管理模块一有所不同,并制定每个任务正常工作时必须与故障管理模块二所进行的交互。例如,每个任务触发故障管理模块二的时间要求(一个周期或者多个周期)和交互形式(函数调用,全局变量的操作,信号量的置位,应答式的交互等)。2)假定故障管理模块二采用监控全局变量的形式来检查每个任务的状态。在每个周期内,被监控任务都要根据预先设定的算法去操作自己的全局变量。全局变量的初值可以由故障管理模块二在每个周期随机给出。当所有监控任务都能正确地操作自己的全局变量,故障管理模块二就认为监控任务工作正常。如果任意一个任务在规定时间内没有或者错误地操作了相应的全局变量,故障管理模块二就会触发系统进入故障处理状态。不同的任务可以产生不同的故障类别和等级。3)故障管理模块二的启动可以由定时中断触发,周期运行。任务的检查间隔可以分为一个或者多个周期。此参数可以由故障管理模块二从相应的配置文件中读取。4)如果所有的任务都能在规定的时间内操作全局变量,并且通过故障管理模块二的校验,则故障管理模块二认为系统工作正常。如果某个任务未能如期完成与故障管理模块二所规定的动作,故障管理模块二启动,记录相应的故障信息,并使系统进入故障处理模式。系统的故障处理可以分为报警、离线运行和停机三种。5)故障管理模块二也可采用直接应答交互的检查方式来判断被监控任务的工作状态。故障管理模块二可以通过信号量发送检查请求,并将请求信息写入到相应的消息队列中。被监控任务如果能够在规定的时间内按照请求信息返回数据,并且通过故障管理模快二的验证,则不触发故障状态。否则将启动故障状态。故障管理模块二也可以检查的一个总体的全局变量,而这个全局变量的最后结果应该是所有被监控任务的操作集合。也可以采用多个故障管理通道的组合,每个故障管理通道负责不同类型或者等级的故障处理。本发明故障管理模块一被动收集故障报警信息,而故障管理模块二主动确认任务的正常工作状态。这两种故障管理模块通过两个不同的渠道来监控任务执行,有效地保障了系统故障管理的执行。故障管理模块二对任务的监控可根据任务的特点采用多种方式,灵活性好。故障管理模块一反应迅速,而故障管理模块二判定故障更加严格。两种故障管理模块的组合使用可使系统能迅速对故障做出响应,并在任何一个故障管理模块出现问题时,也不会造成系统故障管理功能失效。故障管理处理方式一中采用了信号量和消息队列的故障接收和处理方式,故障处理方式二中采用了中断启动和全局变量监控任务轮询的处理方式。从具体技术处理手段上讲,这两种故障处理方式都有自己的特点,是自己发明的技术。并且两种故障组合处理的增强方式在轨道交通领域应该是有独创性的。本发明并不限于上文讨论的实施方式。以上对具体实施方式的描述旨在于为了描述和说明本发明涉及的技术方案。基于本发明启示的显而易见的变换或替代也应当被认为落入本发明的保护范围。以上的具体实施方式用来揭示本发明的最佳实施方法,以使得本领域的普通技术人员能够应用本发明的多种实施方式以及多种替代方式来达到本发明的目的。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1