高可靠性是过程控制系统的首要要求。
冗馀技术是计算机系统可靠性设计中经常采用的技术是提高计算机系统可靠性的最有效方法之一
为了达到统一高可靠性和低效率的目的,我们通常在控制系统的设计和应用中采用冗馀技术。
合理的冗馀设计大大提高了系统的可靠性,同时也增加了系统的复杂性和设计难度,采用冗馀结构的系统也增加了用户投资。
因此,如何合理有效地进行控制系统的冗馀设计,是一个值得研究的课题。
1)冗長化技術
冗余技术简介:冗余技术是指增加冗余设备,以保证系统更可靠、安全运行。
冗馀的分类方法多种多样,根据在系统中的位置,冗馀可以分为部件级、部件级和系统级; 根据冗馀程度,可以划分为1:1冗馀、1:2冗馀、1:n冗馀等多种类型。
在目前部件可靠性不断提高的情况下,与其他形式的冗馀方式相比,1:1部件级热冗馀是一种有效且相对简单、配置灵活的冗馀技术实现方式,如I/O卡部件冗馀、电源冗馀、主控制器冗馀等。
因此,目前国内外主流的过程控制系统大多采用这种方式。
当然,某些本地设计也有成功的组件级或多种冗馀方法组合。
控制系统冗馀设计的目的:系统运行不受局部故障的影响,且故障部件的维护不影响整个系统的功能实现,可实现在线维护,及时修复故障部件。
冗馀设计增加了系统设计的难度,冗馀配置增加了用户系统的投资。 但这笔投资既提高了系统的可靠性,又提高了整个用户系统的平均无故障时间,缩短了平均故障修复时间。 因此,在重要场合控制系统中的应用,
冗馀是非常必要的。
由2个部件组成的并联系统,与1个部件相比,平均故障时间为1.5倍。
系统可用性指标可以用两个参数简单描述。 一个是平均无故障时间,另一个是平均修复时间。
系统可用性由以下公式表示:
系统可用性=mtbf/(mtbfmtbr )
可用性达到99.999%时,系统每年停止服务的时间只有6分钟。
2 )控制系统冗馀关键技术
冗馀是一种高级可靠性设计技术,1:1热冗馀即所谓的双工,是有效的冗馀方式之一。 但这需要通过硬件、软件、通信等协同工作来实现,而不是两个部件简单并行工作。
将两个相互冗馀的部件组成一个有机整体,通常包括以下几个技术要点:
1)情報同期技術
这是实现动作备用部件间无扰动切换技术的前提,只有根据控制实时性的要求进行高速高效的信息同步,保证动作备用部件间的步调一致动作,才能实现冗余部件间的无扰动切换。
热待机工作模式下,其中一个处于工作状态,实现系统的数据采集、运算、控制输出、网络通信等功能; 另一个是待机状态,实时跟踪工作卡的内部控制状态。
工作/备用卡之间的正/负逻辑是互斥的,一个是工作卡,另一个一定是备用卡,同时它们之间有冗余的控制电路和信息通信电路,使两张卡协调同时有序地工作,保证了对外输入输出特性的同一性。
这意味着用户只能使用一个部件。
通常,在设计中,工作、备用部件之间通过高速冗馀通信通道实现运行状态的互检和控制状态的同步。
2)故障検出技術
系统发生故障时,为了及时将冗馀部分投入工作,必须具有高精度的在线故障检测技术,实现故障发现、故障定位、故障隔离和故障报警。
故障检测包括电源、微处理器、数据通信链路、数据总线和I/O状态等。
故障诊断包括故障自诊断和故障互检
3 )故障仲裁技术和切换技术
准确发现故障后,还需及时确定故障部位,分析故障严重程度,依赖上述冗馀控制电路对工作、备用故障状态进行分析、比较和仲裁,判断工作/备用状态是否需要切换。
将控制权转换为冗余备用部件还必须保证高速、安全、无干扰。
处于工作状态的部件故障或工作部件故障比备用部件严重时,备用部件应及时无扰动地交接工作部件的所有控制任务,避免对现场控制造成任何影响。
另外,切换时间需要在毫秒级甚至微秒级,避免因该部件的故障导致外部控制对象失控或检测信息失效等。
此外,还需要尽快通过网络通信或当场的LED显示进行警报,告知用户发生故障的部件和故障情况,并进行及时的维护。
4 )热插拔技术
为了保证容错系统的高可靠性,必须尽量缩短系统的平均修复时间MTBR。
为此,需要进行设计以提高单元的独立性、修复性、故障维护性。
实现故障部件的在线维护和更换也是冗馀技术的重要组成部分是实现控制系统故障部件快速修复技术的关键。
部件热插拔功能可帮助您在不中断系统正常控制的情况下添加或更换组件,使系统平稳运行。
5)障害隔離技術
冗馀设计时,工作、备用部件之间的故障应尽量做到互不影响或影响概率相当低,即故障被隔离。
由此,在处于备用状态的部件发生故障时,可以不影响冗馀工作部件和其他相关部件的正常运行,保证冗馀的有效性。
3 :通过冗余技术在控制系统中的应用进行分析
通过对控制系统冗余原理和方法的具体分析,发现系统的可用性很大程度上取决于MTBF值较低、严重影响系统正常运行的部件,如主控制卡、网络、电源、通信中继卡等。
在系统设计中对关键部件进行冗余设计,可以大大提高系统的可用性。
根据控制系统内各个部件功能定位的不同,采用了具体方式有所差别,具体策略为:
1)主控制卡的冗余
主控制卡是整个系统的核心控制单元,完成系统的控制任务。
而冗余技术各个设计要点在此得到充分应用。
互为冗余的两块主控制卡软件、硬件完全一致,它们执行同样的系统软件和应用程序,在工作/备用冗余逻辑电路的控制下,其中一个运行在工作状态,另外一个运行在备用状态。
工作卡和备用卡之间具有公共的冗余逻辑控制电路和专用的高速对等冗余通讯通道,同时也可以通过I/O总线和过程控制网络进行信息交互或故障诊测。
互为冗余的主控制卡都能访问I/O和过程控制网络,备用模式下的主控制卡执行诊断程序,监视工作卡的状态,通过周期查询工作卡件中的数据存储器,接受工作卡发送的实时控制运行信息。
备用处理器可随时保存最新的控制数据,以保证工作/备用的无扰动切换,但工作模式下的主控制卡起着控制、输出、实时过程信息发布,等决定性的作用。
冗余技术的关键在于实现信息同步,而信息同步的最终目的是为了实现冗余部件之间无扰动切换。
我们把信息同步的方法分为“自然同步”和“强制同步”。
互为冗余的两个主控制卡作为一个整体与外界交换信息,共享进入这个整体的输入信息,这就是冗余部件的同一性。
对外输出信息时工作卡掌握主动权,代表这个整体发言,即冗余的协同性。
通俗地讲,两个互为冗余的部件,对于用户使用和外部控制对象而言,可被视为一个整体。
为了保证互为冗余的两个卡件具有平等获取外部信息的权利,冗余部件具有同样的通讯接口,保证卡件内输入信息的一致。
冗余的两块卡件有各自的通讯通路,只要保证相同的输入信息在两个通信通路上同时进行传输,两块卡件就可以获得相同的信息。
这种凭借外部设备实现输入信息的同步称为“自然同步”。
“自然同步”发生在冗余系统和外部设备之间。
工作卡掌握主动权,代表整体发言,并通过冗余通信将各种状态信息传送给备用卡,达到控制任务的同步,这就是“强制同步”。
“强制同步”通过冗余通信使备用卡内部控制状态与工作卡保持一致,它发生在互为冗余的卡件之间。
根据变量特性的不同,具体采用的同步方式也各不相同。
2) 电源系统冗余。
电源是整个控制系统得以正常工作的动力源泉,一旦电源单元发生故障,往往会使整个控制系统的工作中断,造成严重后果。
要使控制系统能够安全、可靠、长期、稳定地运行,首先稳定的供电必须得到保证。
JX-300X型DCS采用可热插拔的冗余电源,正常工作时,两台电源各输出一半功率,从而使每一台电源都工作在轻负载状态,有利于电源稳定工作。
当其中一台发生故障,短时由另一台接替其工作,并报警。
设计为可热插拔的冗余电源,这样系统维护时可以在不影响系统正常运行的情况下更换故障的电源。
3) 网络系统冗余。
采用冗余网卡和冗余网络接口。
正常工作时,冗余的两条数据高速通路同时并行运行,自动分摊网络流量,并考虑了负载均衡的冗余设计,使系统网络通信带宽提高。
当其中一路故障时,另一路自动地承担全部通信负载,保证通信的正常进行。
4)冷却系统冗余。
利用控制柜内可自动切换的冗余风扇,对风扇和机柜内温度进行实时监测,发现工作风扇故障或柜内温度过高时都会自动报警,并自动启动备用风扇。
5) 信息冗余。
信息冗余技术是指在通信过程中或存放组态信息时,利用增加的多余信息位提供检错甚至纠错的能力。
该系统中SBUS总线通讯和SCnet控制网络都采用循环冗余码校验(CRC)方法。
而重要组态信息在主控制卡内的存放采用1:1冗余存放,使重要信息具备故障自我恢复能力,保证系统运行过程中重要信息的安全性。