CN112804234A - 一种应用于电力终端的嵌入式容侵容错装置及处理方法 - Google Patents

一种应用于电力终端的嵌入式容侵容错装置及处理方法 Download PDF

Info

Publication number
CN112804234A
CN112804234A CN202110056847.1A CN202110056847A CN112804234A CN 112804234 A CN112804234 A CN 112804234A CN 202110056847 A CN202110056847 A CN 202110056847A CN 112804234 A CN112804234 A CN 112804234A
Authority
CN
China
Prior art keywords
power terminal
terminal system
fault
data
electric power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110056847.1A
Other languages
English (en)
Inventor
吕志宁
宁柏锋
刘威
罗伟峰
邓巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Co ltd
Original Assignee
Shenzhen Power Supply Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Co ltd filed Critical Shenzhen Power Supply Co ltd
Priority to CN202110056847.1A priority Critical patent/CN112804234A/zh
Publication of CN112804234A publication Critical patent/CN112804234A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/12Applying verification of the received information
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00004Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by the power network being locally controlled
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/12Applying verification of the received information
    • H04L63/123Applying verification of the received information received data contents, e.g. message integrity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/20Network architectures or network communication protocols for network security for managing network security; network security policies in general
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them
    • Y04S40/20Information technology specific aspects, e.g. CAD, simulation, modelling, system security

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明具体公开了一种应用于电力终端的嵌入式容侵容错装置及处理方法,所述方法包括以下步骤:S1、对输入数据的合法性和完整性进行校验以判断是否存在异常状态;S2、对电力终端***运行过程中存在的异常状态所导致的损坏范围和失效程度进行评估和预警;S3、对电力终端***运行过程中存在的异常状态进行修复并上报修复结果,若修复成功则进入步骤S4,若修复失败则返回继续修复;S4、持续为电力终端***提供服务,同时生成电力终端***运行过程中的异常状态的***日志和事件报告。本发明能够保证电力终端***在故障存在的情况下仍不失效,从而保护其核心功能不受影响,实现了电力终端***的主动免疫,大大提升了电力终端***的信息安全防护能力。

Description

一种应用于电力终端的嵌入式容侵容错装置及处理方法
技术领域
本发明涉及电力***技术领域,尤其涉及一种应用于电力终端的嵌入式容侵容错装置及处理方法。
背景技术
随着电网的智能化和信息化发展,大量的终端接入电网,在开放网络环境下,电力终端易受到来自多元利益主体的网络攻击。近年来,针对能源***工控领域的高级攻击手段层出不穷,以“震网”、“火焰”和“Black Energy(黑暗力量)”等恶意代码为主要技术手段的APT(Advanced Persistent Threat,高级可持续威胁攻击)对能源等工业控制***造成了巨大危害。与此同时,在实践中,***在长期运行下发生故障也是在所难免的。从发生故障的原因来看,有的故障是退化故障,例如计算机的硬盘,它会随着使用次数的增加而老化,最终失效;有的故障是设计故障,即在***设计时的设计缺陷引发的故障;还有的故障是随机故障,这些随机故障往往是由于一些偶然的、突发的事件触发的。
无论是来自外部的网络攻击,还是内部故障的蔓延恶化,导致的结果往往都是***的部分或者全部服务失效。也就是说,攻击或者故障将导致***无法完成人们要求它提供的既定服务。与之相应的,容错正是要在***出现缺陷、出现故障时通过相应的算法、措施,使得发生故障的***依然能够继续提供可接受的服务。也就是说,在电力工控终端嵌入式***中,应用容侵和容错技术可保证***发生故障时能够保证***避免服务失效,保护***的核心功能不受影响。根据故障的类型,容错大致可以划分为两类——硬件容错和软件容错。对于硬件外设的退化故障,往往需要硬件容错——提供备份的冗余硬件来实现。而对于随机故障和设计故障,则可以采用软件容错的方法来实现。
发明内容
为了解决上述技术问题,本发明提供一种应用于电力终端的嵌入式容侵容错装置,包括嵌入式设于电力终端***中的错误检测模块、损坏评估模块、状态恢复模块和持续服务模块,其中:
错误检测模块,用于校验输入数据的合法性和完整性并判断电力终端***运行过程中是否存在的异常状态;
损坏评估模块,用于接收错误检测模块所判断的***异常状态并评估电力终端***的损坏范围和失效程度;
状态恢复模块,用于接收损坏评估模块所评估的电力终端***的损坏范围和失效程度信息,根据失效映射类型进行失效自愈修复管理,并将修复结果上报至电力终端***;
持续服务模块,用于生成电力终端***运行过程中异常状态的***日志并对所生成的***日志进行离线分析,同时持续为电力终端***提供服务。
同时,本发明还提供一种应用于电力终端的嵌入式容侵容错处理方法,所述方法包括以下步骤:
S1、通过错误检测模块对输入数据的合法性和完整性进行校验,进而判断电力终端***是否存在异常状态;
S2、利用损坏评估模块对电力终端***运行过程中存在的异常状态所导致的损坏范围和失效程度进行评估和预警;
S3、利用状态恢复模块对电力终端***运行过程中存在的异常状态进行修复并上报修复结果,若修复成功则进入步骤S4,若修复失败则返回继续修复,直至修复成功;
S4、通过持续服务模块持续为电力终端***提供服务,同时生成电力终端***运行过程中的异常状态的***日志和事件报告并进行离线分析。
优选地,所述错误检测模块对输入数据的合法性和完整性进行校验具体包括:对电力终端***中的处理器的数据总线和处理器的寄存器进行奇偶校验,用于判断存储过程中短字长数据是否发生了比特位错误;在额外的数据位上存储一个数据加密的ECC代码用于确定数据是否存在错误;通过设定限值的方式对外部采集数据进行合法性检查;在处理器内部的软件或硬件中设置一个预期任务和时间值,利用看门狗定时器监测设置时间内预期任务的完成与否判断处理器内部硬件或者软件是否存在错误;利用CRC校验对外部传输的数据块进行多项式计算检测,然后将检测结果附在数据帧的后面,根据CRC校验通过与否判定传输过程中数据是否发生错误;对外部不同设备或不同信号点采集的同一数据进行比较,判断是否可能存在同源冗余数据异常;在逻辑门校验的基础上设置反向检查机制以进行业务逻辑合法性检查。
优选地,所述步骤S2的具体实现方式包括:
S21、基于电力终端***中存在的异常状态利用故障树和失效模式严酷度对数据、代码、业务逻辑、维护策略和后勤管理各个环节的安全风险进行分析;
S22、根据步骤S21中安全分险的分析结果识别出电力终端***中各类潜在故障,并根据各类潜在故障对电力终端***进行安全评估和状态分级;
S23、建立基于时空多维度故障分析的电力终端***的风险预警***。
优选地,所述步骤S22中电力终端***中的状态分级包括正常、异常、恶劣、严重和危机五级。
优选地,所述步骤S23的具体实现方式为:首先将异常状态对应的各类故障信号映射为具体的故障性质、影响范围和故障原因,然后将其结果记录在受安全芯片保护的电力终端***的日志中并通知运维人员,从而完成电力终端***中风险预警***的建立,实现了对电力终端***安全风险全生命周期的把控。
优选地,所述步骤S3的具体实现方式包括:
S31、构建包括预警描述、预警原因和处理措施的专家库,并根据专家库对电力终端***运行过程中存在的异常状态进行故障处理;
S32、建立多个状态恢复块并选取其中一个状态恢复块对电力终端***进行恢复,如果电力终端***未恢复正常则继续调用其他恢复块对电力终端***进行恢复,直到电力终端***恢复正常或状态恢复块用完,恢复结果上报到运行人员;
S33、通过复位机构对整个电力终端***进行复位以实现电力终端***的自愈恢复。
优选地,所述步骤S4的具体事项方式包括:
S41、对电力终端***运行过程中所存在的异常状态进行日志记录;
S42、对步骤S41中异常状态的日志记录进行整理分析并形成事件报告;
S43、同时持续为电力终端***进行服务。
与现有技术比较,本发明提出了一种应用于电力终端的嵌入式容侵容错装置及其处理方法,通过将错误检测模块、损坏评估模块、状态恢复模块和持续服务模块嵌入式设于电力终端***中,并利用错误检测模块判断电力终端***运行过程中是否存在的异常状态,然后通过损坏评估模块评估所存在的异常状态对应故障所导致的后果,再由状态恢复模块对异常状态对应故障进行修复以尝试消除电力终端***中的错误,如果电力终端***中错误修复成功,则通过持续服务模块继续提供服务,进而实现电力终端***的容侵容错,能够保证电力终端***在故障存在的情况下仍不失效,从而保护其核心功能不受影响,实现了电力终端***的主动免疫,大大提升了电力终端***的信息安全防护能力。
附图说明
图1是本发明一种应用于电力终端的嵌入式容侵容错装置的结构框图,
图2是本发明中一种应用于电力终端的嵌入式容侵容错处理方法的流程图,
图3是本发明中通过损坏评估模块评估异常状态的方法流程图,
图4是本发明中通过状态修复模块对异常状态进行修复的方法流程图,
图5是本发明中通过持续服务模块为电力终端***持续服务的方法流程图。
图中:1.错误检测模块,2.损坏评估模块,3.状态恢复模块,4.持续服务模块。
具体实施方式
为了使本技术领域的人员更好地理解本发明的技术方案,下面结合附图对本发明作进一步的详细说明。
如图1所示,一种应用于电力终端的嵌入式容侵容错装置,包括嵌入式设于电力终端***中的错误检测模块1、损坏评估模块2、状态恢复模块3和持续服务模块4,其中:
错误检测模块1,用于校验输入数据的合法性和完整性并判断电力终端***运行过程中是否存在的异常状态;
损坏评估模块2,用于接收错误检测模块1所判断的异常状态并评估电力终端***的损坏范围和失效程度;
状态恢复模块3,用于接收损坏评估模块2所评估的电力终端***的损坏范围和失效程度信息,根据失效映射类型进行失效自愈修复管理,并将修复结果上报至电力终端***;
持续服务模块4,用于生成电力终端***运行过程中异常状态的***日志并对所生成的***日志进行离线分析,同时持续为电力终端***提供服务。
本实施例中,所述错误检测模块1、损坏评估模块2、状态恢复模块3和持续服务模块4嵌入式设于电力终端***中。由于嵌入式可信计算具有主动性和安全免疫两个方面的特点,在主动性方面,可信计算的完整性度量、白名单管控以及可信运行日志等机制可实现主动识别、主动控制和主动报警等安全功能,因此所述容侵容错装置首先利用错误检测模块1判断电力终端***运行过程中是否存在的异常状态,再通过损坏评估模块2评估异常状态对应故障所导致的后果,然后状态恢复模块3对异常状态对应故障进行修复以尝试消除电力终端***中的错误,如果电力终端***中错误修复成功,则通过持续服务模块4继续提供服务,进而实现电力终端***的容侵容错,能够保证电力终端***在故障存在的情况下仍不失效,使其核心功能不受影响,实现了电力终端***的主动免疫,大大提升了电力终端***的信息安全防护能力。
如图2所示,一种应用于电力终端的嵌入式容侵容错处理方法,所述方法包括以下步骤:
S1、通过错误检测模块1对输入数据的合法性和完整性进行校验,进而判断电力终端***是否存在异常状态;
S2、利用损坏评估模块2对电力终端***运行过程中存在的异常状态所导致的损坏范围和失效程度进行评估和预警;
S3、利用状态恢复模块3对电力终端***运行过程中存在的异常状态进行修复并上报修复结果,若修复成功则进入步骤S4,若修复失败则返回继续修复,直至修复成功;
S4、通过持续服务模块4持续为电力终端***提供服务,同时生成电力终端***运行过程中的异常状态的***日志和事件报告并进行离线分析。
本实施例中,所述电力终端***的嵌入式容侵容错处理方法包括四个步骤,具体包括:①异常状态的检测和判断;②评估异常状态故障所导致的后果;③对异常状态错误进行修复;④如果修复成功则持续为电力终端***提供服务,同时生成日志和事件报告。通过上述四个容侵容错处理步骤实现了电力终端***容侵容错,保证了电力终端***即使在故障存在的情况下仍不失效,并使其核心功能不受影响,同时也实现了电力终端***的主动免疫,大大提升了电力终端***的信息安全防护能力。
其中,所述错误检测模块1对输入数据的合法性和完整性进行校验主要包括七个方面,具体为:
(1)奇偶校验,奇偶校验可以应用于电力终端***中的处理器的数据总线和处理器的寄存器中,用于判断存储过程中短字长数据是否发生了比特位错误;
(2)ECC(Error Correcting Code,错误检查和纠正)校验,ECC校验是在额外的数据位上存储一个用数据加密的ECC代码,当数据被写入内存时,相应的ECC代码同时也被保存下来;当重新读回刚才存储的数据时,保存下来的ECC代码就会和读数据时产生的ECC代码做比较,如果两个ECC代码不相同,它们则会被解码,以确定数据中的哪一位ECC代码是错误的,然后将这一个错误的ECC代码抛弃,同时通过内存控制器释放出正确的数据;
(3)合法性检查,首先设置一个合理的限值,然后检查外部采集的数据是否超过该设定的限值;
(4)看门狗定时器,首先利用处理器内部软件或硬件设置一个时间值和预期任务,若在设置的时间内预期任务完成,则将看门狗定时器复位;若在设置的时间内预期任务没有完成,看门狗定时器就会发出信号,如果处理器内部硬件或者软件错误导致失效,看门狗定时器就可以检测出这种错误,同时看门狗定时器还可以用来检测和跳出无限循环;
(5)完整性检查,当传输数据来自外部时,利用CRC(Cyclic Redundancy Check,循环冗余校验码)校验对外部传输的数据块进行多项式计算检测,并将得到的检测结果附在数据帧的后面,同时接收设备也执行上述的算法检测,进而可保证数据传输的正确性和完整性,若CRC校验不通过,则可判定数据在传输过程中发生错误;
(6)同源冗余数据检查,对外部不同设备或不同信号点采集的同一实际数据进行比较,进而判断是否存在异常状态,即对不同设备采集的同一实际数据进行比较,或对不同信号点采集的同一实际数据进行比较,从而判断是否存在异常状态;
(7)业务逻辑合法性检查,在逻辑门校验的基础上,设置反向检查机制,对每一道逻辑门的执行情况进行标志记录,只有所有的标志记录齐全,才允许保护命令出口。
通过错误检测模块1在上述七个方面的错误校验和检测,从而辨识电力终端***运行过程中是否存在异常状态,进而判断出电力终端***是否失效。
如图3所示,所述步骤S2的具体实现方式包括:
S21、基于电力终端***中存在的异常状态利用故障树和失效模式严酷度对数据、代码、业务逻辑、维护策略和后勤管理各个环节的安全风险进行分析;
S22、根据步骤S21中安全风险的分析结果识别出电力终端***中各类潜在故障,并根据各类潜在故障对电力终端***进行安全评估和状态分级;
S23、建立基于时空多维度故障分析的电力终端***的风险预警***。
其中,所述步骤S22中电力终端***中的状态分级包括正常、异常、恶劣、严重和危机五级。
其中,所述步骤S23的具体实现方式为:首先将异常状态对应的各类潜在故障信号映射为具体的故障性质、影响范围和故障原因,然后将其结果记录在受安全芯片保护的电力终端***的日志中并通知运维人员,从而完成电力终端***中风险预警***的建立,实现了对电力终端***安全风险全生命周期的把控。
本实施例中,所述电力终端***中的损坏评估模块1对异常状态的评估和预警是以故障树分析和失效模式严酷度分析为主要分析方法,首先,基于电力终端***中存在的异常状态利用故障树和失效模式严酷度对数据、代码、业务逻辑、维护策略和后勤管理各个环节的安全风险进行分析,其中故障树分析包括三个方面,(1)多个异常状态事件的综合分析;(2)长时间尺度分析,根据设备历史异常状态告警信息的频次对设备当前异常状态进行评估,对某些异常状态的告警/异常事件做长时间尺度的统计,定位***潜在的故障点,提醒运维人员进行装置的维护检修;(3)历史运行数据分析,对设备各模块的使用情况和服务年限、服务次数进行定量统计,在统计数据的支持下,判断设备当前寿命,并结合故障树分析可能导致的后果,并作出提前预警;其次,根据单发性故障的失效告警信息和多发性故障的故障树分析结果识别出电力终端***中各类潜在故障,并根据各类潜在故障对电力终端***进行安全评估和状态分级,其中所述电力终端***中的状态分级包括正常、异常、恶劣、严重和危机五级;最后根据电力终端***中异常状态的评估结果和状态分级建立基于时空多维度故障分析的电力终端***的风险预警***,即将异常状态对应的各类潜在故障信号映射为具体的故障性质、影响范围和故障原因,并将结果记录在受安全芯片保护的电力终端***的日志中并通知运维人员,从而完成电力终端***中风险预警***的建立,实现了对电力终端***安全风险全生命周期的把控。
本实施例中,所述电力终端***中设置了一个已经具备单个潜在故障的故障描述、故障原因和处理措施等信息的芯片化保护装置,通过芯片化保护装置即可把故障信号库输出配置工具,配置工具给出单个潜在故障信号的基本属性以及多个潜在故障信号综合分析的结果并形成故障树,故障树信息具体包括:(1)多个故障映射到故障具体描述;(2)多个故障信号的逻辑关系;(3)多个故障信号的危害程度;(4)多个故障信号的原因和处理措施;(5)多个故障的可能影响范围。因此,结合上述故障树信息,所述芯片化保护装置能够实时监控故障的发生,以及实时监控设备寿命,从而提前进行故障风险预警。
如图4所示,所述步骤S3的具体实现方式包括:
S31、构建包括预警描述、预警原因和处理措施的专家库,并根据专家库对电力终端***运行过程中存在的异常状态进行故障处理;
S32、建立多个状态恢复块并选取其中一个状态恢复块对电力终端***进行恢复,如果电力终端***未恢复正常则继续调用其他恢复块对电力终端***进行恢复,直到电力终端***恢复正常或状态恢复块用完,恢复结果上报到运行人员;
S33、通过复位机构对整个电力终端***进行复位以实现电力终端***的自愈恢复。
本实施例中,所述状态恢复模块3包括专家库和多个状态恢复块,专家库的组成要素包括预警描述、预警原因和处理措施,根据专家库对电力终端***运行过程中存在的异常状态进行故障处理,其中异常状态故障处理措施为:当芯片化保护装置能够自动执行则将自动执行后的故障报告上报,当芯片化保护装置无法自行处理,则将故障描述和建议处理措施上报给运行人员;在专家库故障处理措施以外建立多个状态恢复块并尝试调用状态恢复块对电力终端***进行恢复,同时利用验收***验证电力终端***是否恢复正常,如果电力终端***未恢复正常则继续调用其他恢复块进行恢复,直到电力终端***恢复正常或状态恢复块用完,恢复结果上报到运行人员,当完成异常状态故障处理之后,电力终端***通过异常进程检测及复位、芯片接口复位、看门狗定时器或reboot复位对整个电力终端***进行复位,进而帮助电力终端***从“指针跑飞”和“进程卡死”等软件***不正常运行中自愈恢复。
需要说明的是,由于每个故障信号或者存在逻辑关系的多个故障信号都需要配置故障原因描述和故障处理措施,因此故障信号库内包含了专家库这一属性。
如图5所示,所述步骤S4的具体事项方式包括:
S41、对电力终端***运行过程中所存在的异常状态进行日志记录;
S42、对步骤S41中异常状态的日志记录进行整理分析并形成事件报告;
S43、同时持续为电力终端***进行服务。
本实施例中,首先对电力终端***运行过程中识别的各种异常状态数据、模块失效以及各类故障事件进行日志记录,其中日志按照规定格式记录事件对应的具体可执行程序、软件/硬件模块、时间、故障分级和处理措施等基本信息,由于日志受自主安全芯片保护,因此可防止攻击者对日志的篡改;然后整理和分析所有相关设备的日志并形成事件报告,具体为:①对同一事件过程(如一次告警、一次故障跳闸等)进行现场回溯;②将双套保护的录波、告警、变位等日志进行时间顺序排序,复盘事件发生时段内数据的变化,以分析某套保护设备异常、或回路异常等;③将相关联设备的录波、告警、动作、变位等日志进行顺序排列,可分析推断回路完整性、事故定位等信息;同时利用持续服务模块4继续为电力终端***服务。
以上对本发明所提供的一种应用于电力终端的嵌入式容侵容错装置及处理方法进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种应用于电力终端的嵌入式容侵容错装置,其特征在于,包括嵌入式设于电力终端***中的错误检测模块、损坏评估模块、状态恢复模块和持续服务模块,其中:
错误检测模块,用于校验输入数据的合法性和完整性并判断电力终端***运行过程中是否存在的异常状态;
损坏评估模块,用于接收错误检测模块所判断的异常状态并评估电力终端***的损坏范围和失效程度;
状态恢复模块,用于接收损坏评估模块所评估的电力终端***的损坏范围和失效程度信息,根据失效映射类型进行失效自愈修复管理,并将修复结果上报至电力终端***;
持续服务模块,用于生成电力终端***运行过程中异常状态的***日志并对所生成的***日志进行离线分析,同时持续为电力终端***提供服务。
2.一种应用于电力终端的嵌入式容侵容错处理方法,其特征在于,所述方法包括以下步骤:
S1、通过错误检测模块对输入数据的合法性和完整性进行校验,进而判断电力终端***是否存在异常状态;
S2、利用损坏评估模块对电力终端***运行过程中存在的异常状态所导致的损坏范围和失效程度进行评估和预警;
S3、利用状态恢复模块对电力终端***运行过程中存在的异常状态进行修复并上报修复结果,若修复成功则进入步骤S4,若修复失败则返回继续修复,直至修复成功;
S4、通过持续服务模块持续为电力终端***提供服务,同时生成电力终端***运行过程中的异常状态的***日志和事件报告并进行离线分析。
3.如权利要求2所述的应用于电力终端的嵌入式容侵容错处理方法,其特征在于,所述错误检测模块对输入数据的合法性和完整性进行校验具体包括:对电力终端***中的处理器的数据总线和处理器的寄存器进行奇偶校验,用于判断存储过程中短字长数据是否发生了比特位错误;在额外的数据位上存储一个数据加密的ECC代码用于确定数据是否存在错误;通过设定限值的方式对外部采集数据进行合法性检查;在处理器内部的软件或硬件中设置一个预期任务和时间值,利用看门狗定时器监测设置时间内预期任务的完成与否判断处理器内部硬件或者软件是否存在错误;利用CRC校验对外部传输的数据块进行多项式计算检测并将检测结果附在数据帧的后面,然后根据CRC校验通过与否判定传输过程中数据是否发生错误;对外部不同设备或不同信号点采集的同一数据进行比较,判断是否可能存在同源冗余数据异常;在逻辑门校验的基础上设置反向检查机制以进行业务逻辑合法性检查。
4.如权利要求3所述的应用于电力终端的嵌入式容侵容错处理方法,其特征在于,所述步骤S2的具体实现方式包括:
S21、基于电力终端***中存在的异常状态利用故障树和失效模式严酷度对数据、代码、业务逻辑、维护策略和后勤管理各个环节的安全风险进行分析;
S22、根据步骤S21中安全风险的分析结果识别出电力终端***中各类潜在故障,并根据各类潜在故障对电力终端***进行安全评估和状态分级;
S23、建立基于时空多维度故障分析的电力终端***的风险预警***。
5.如权利要求4所述的应用于电力终端的嵌入式容侵容错处理方法,其特征在于,所述步骤S22中电力终端***中的状态分级包括正常、异常、恶劣、严重和危机五级。
6.如权利要求5所述的应用于电力终端的嵌入式容侵容错处理方法,其特征在于,所述步骤S23的具体实现方式为:首先将异常状态对应的各类故障信号映射为具体的故障性质、影响范围和故障原因,然后将其结果记录在受安全芯片保护的电力终端***的日志中并通知运维人员,从而完成电力终端***中风险预警***的建立,实现了对电力终端***安全风险全生命周期的把控。
7.如权利要求6所述的应用于电力终端的嵌入式容侵容错处理方法,其特征在于,所述状态恢复模块包括专家库和状态恢复块,所述步骤S3的具体实现方式包括:
S31、构建包括预警描述、预警原因和处理措施的专家库,并根据专家库对电力终端***运行过程中存在的异常状态进行故障处理;
S32、建立多个状态恢复块并选取其中一个状态恢复块对电力终端***进行恢复,如果电力终端***未恢复正常则继续调用其他恢复块对电力终端***进行恢复,直到电力终端***恢复正常或状态恢复块用完,恢复结果上报到运行人员;
S33、通过复位机构对整个电力终端***进行复位以实现电力终端***的自愈恢复。
8.如权利要求7所述的应用于电力终端的嵌入式容侵容错处理方法,其特征在于,所述步骤S4的具体事项方式包括:
S41、对电力终端***运行过程中所存在的异常状态进行日志记录;
S42、对步骤S41中异常状态的日志记录进行整理分析并形成事件报告;
S43、同时持续为电力终端***进行服务。
CN202110056847.1A 2021-01-15 2021-01-15 一种应用于电力终端的嵌入式容侵容错装置及处理方法 Pending CN112804234A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110056847.1A CN112804234A (zh) 2021-01-15 2021-01-15 一种应用于电力终端的嵌入式容侵容错装置及处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110056847.1A CN112804234A (zh) 2021-01-15 2021-01-15 一种应用于电力终端的嵌入式容侵容错装置及处理方法

Publications (1)

Publication Number Publication Date
CN112804234A true CN112804234A (zh) 2021-05-14

Family

ID=75809797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110056847.1A Pending CN112804234A (zh) 2021-01-15 2021-01-15 一种应用于电力终端的嵌入式容侵容错装置及处理方法

Country Status (1)

Country Link
CN (1) CN112804234A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114876820A (zh) * 2022-04-10 2022-08-09 安徽卧龙泵阀股份有限公司 基于化工泵远程控制***及方法
CN115098306A (zh) * 2022-08-03 2022-09-23 南方电网数字电网研究院有限公司 应用于电力工控终端的嵌入式容错自愈结构、方法及***
CN116049866A (zh) * 2022-06-27 2023-05-02 荣耀终端有限公司 一种数据保护方法、电子设备及芯片***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945009A (zh) * 2010-09-14 2011-01-12 国网电力科学研究院 基于案例和模式匹配的电力通信网故障定位方法及装置
CN102404139A (zh) * 2011-10-21 2012-04-04 浪潮电子信息产业股份有限公司 一种提高容错服务器应用层级容错性能的方法
CN109992963A (zh) * 2019-04-12 2019-07-09 长沙理工大学 一种电力终端及其嵌入式***的信息安全防护方法与体系
CN111985558A (zh) * 2020-08-19 2020-11-24 安徽蓝杰鑫信息科技有限公司 一种电能表异常诊断方法及其***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945009A (zh) * 2010-09-14 2011-01-12 国网电力科学研究院 基于案例和模式匹配的电力通信网故障定位方法及装置
CN102404139A (zh) * 2011-10-21 2012-04-04 浪潮电子信息产业股份有限公司 一种提高容错服务器应用层级容错性能的方法
CN109992963A (zh) * 2019-04-12 2019-07-09 长沙理工大学 一种电力终端及其嵌入式***的信息安全防护方法与体系
CN111985558A (zh) * 2020-08-19 2020-11-24 安徽蓝杰鑫信息科技有限公司 一种电能表异常诊断方法及其***

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114876820A (zh) * 2022-04-10 2022-08-09 安徽卧龙泵阀股份有限公司 基于化工泵远程控制***及方法
CN114876820B (zh) * 2022-04-10 2024-05-03 安徽卧龙泵阀股份有限公司 基于化工泵远程控制***及方法
CN116049866A (zh) * 2022-06-27 2023-05-02 荣耀终端有限公司 一种数据保护方法、电子设备及芯片***
CN116049866B (zh) * 2022-06-27 2024-06-28 荣耀终端有限公司 一种数据保护方法、电子设备及芯片***
CN115098306A (zh) * 2022-08-03 2022-09-23 南方电网数字电网研究院有限公司 应用于电力工控终端的嵌入式容错自愈结构、方法及***

Similar Documents

Publication Publication Date Title
CN112804234A (zh) 一种应用于电力终端的嵌入式容侵容错装置及处理方法
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
KR101856543B1 (ko) 인공지능 기반의 장애 예측 시스템
CN109992963B (zh) 一种电力终端及其嵌入式***的信息安全防护方法与体系
US7774651B2 (en) System and method to detect errors and predict potential failures
CN109328340B (zh) 内存故障的检测方法、装置和服务器
US8108724B2 (en) Field replaceable unit failure determination
US5974576A (en) On-line memory monitoring system and methods
CN110825578A (zh) 用以自动管理发生于数据中心***的硬件错误事件的方法
CN102135925B (zh) 用于检测错误检查和纠正内存的方法和装置
CN111857555B (zh) 避免磁盘阵列的故障事件的方法、设备和程序产品
US20030084376A1 (en) Software crash event analysis method and system
Du et al. Predicting uncorrectable memory errors for proactive replacement: An empirical study on large-scale field data
CN115794588A (zh) 内存故障预测方法、装置、***及监测服务器
CN117076186B (zh) 一种内存故障检测方法、***、装置、介质及服务器
Tsai et al. A study of soft error consequences in hard disk drives
CN117370970A (zh) 基于随机故障注入的故障攻击保护方法
CN117076301A (zh) ***性能测试方法、装置及电子设备
CN101271419B (zh) 随机存储器失效的检测处理方法、装置和***
CN114610560B (zh) ***异常监控方法、装置和存储介质
US10210033B2 (en) Managing component errors with a common software sensor based diagnostic method
CN115562918A (zh) 计算机***故障的测试方法、装置、电子设备及可读介质
CN115333841A (zh) 一种基于ipdrr安全能力框架的数据安全管控平台
CN115098306A (zh) 应用于电力工控终端的嵌入式容错自愈结构、方法及***
CN117874772B (zh) 应用软件漏洞扫描方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210514

RJ01 Rejection of invention patent application after publication