CN108021406B - 一种适用于机载计算机的双余度热备份cpu*** - Google Patents

一种适用于机载计算机的双余度热备份cpu*** Download PDF

Info

Publication number
CN108021406B
CN108021406B CN201711076207.7A CN201711076207A CN108021406B CN 108021406 B CN108021406 B CN 108021406B CN 201711076207 A CN201711076207 A CN 201711076207A CN 108021406 B CN108021406 B CN 108021406B
Authority
CN
China
Prior art keywords
cpu
started
dual
redundancy
enabling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711076207.7A
Other languages
English (en)
Other versions
CN108021406A (zh
Inventor
吴斌
蔡晓乐
任晓琨
向桂林
刘夏青
车炯晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Aeronautics Computing Technique Research Institute of AVIC
Original Assignee
Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Aeronautics Computing Technique Research Institute of AVIC filed Critical Xian Aeronautics Computing Technique Research Institute of AVIC
Priority to CN201711076207.7A priority Critical patent/CN108021406B/zh
Publication of CN108021406A publication Critical patent/CN108021406A/zh
Application granted granted Critical
Publication of CN108021406B publication Critical patent/CN108021406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4405Initialisation of multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明属于计算机应用技术领域,涉及一种为提高机载计算机任务可靠性而设计的双余度热备份CPU***。所述的***包括双余度CPU;***启动后,双余度CPU均保持空闲状态;当软件初始化完成后,两个CPU均开始通过写入特定地址的主控指令来使能CPU输出控制,主控指令中包括决定两个CPU启动顺序的延时处理控制逻辑;先启动的CPU模块的使能信号被设置为有效且取得输出控制权,同时将使能信号连接至后启动CPU的通道逻辑故障电路,后启动的CPU被先启动的CPU模块使能信号钳制处于无效状态。提供一种高可靠、可协调运作的适用于机载计算机的双余度热备份CPU***。

Description

一种适用于机载计算机的双余度热备份CPU***
技术领域
本发明属于计算机应用技术领域,涉及一种为提高机载计算机任务可靠性而设计的双余度热备份CPU***。
背景技术
随着机载电子设备综合化程度的不断提高,机载计算机工作的任务可靠性将直接关系飞机飞行安全,机载计算机一旦运行错误,将造成巨大的生命财产损失。
当前,机载计算机集成度越来越高,例如飞机上重要的机电管理***集成了环控、燃油、供电、液压等实时性要求很高的子***,这样就要求机电管理计算机具有很高的实时处理能力。CPU是整个机电管理计算机的控制核心和运算核心,CPU在运行过程中一旦发生故障或错误,将导致灾难性的后果,所以在提高CPU处理数据能力的同时,对CPU的余度设计方面也提出了新的要求。
传统的机电管理计算机,通常以多机、多通道的方式解决余度问题,本机本通道的运行状态只能通过他机他通道来监控,未能实现单机单通道的CPU多核处理策略。
发明内容
本发明解决的技术问题:提供一种高可靠、可协调运作的适用于机载计算机的双余度热备份CPU***。
本发明的技术方案:一种适用于机载计算机的双余度热备份CPU***,所述的***包括双余度CPU;
***启动后,双余度CPU均保持空闲状态;
当软件初始化完成后,两个CPU均开始通过写入特定地址的主控指令来使能CPU输出控制,主控指令中包括决定两个CPU启动顺序的延时处理控制逻辑;
先启动的CPU模块的使能信号被设置为有效且取得输出控制权,同时将使能信号连接至后启动CPU的通道逻辑故障电路,后启动的CPU被先启动的CPU模块使能信号钳制处于无效状态。
优选地,两个CPU模块主动切换控制权时,由后启动CPU修改控制自身使能信号的地址数据,使自身的使能信号有效;然后先启动CPU模块再将自身的使能信号修改为无效。
优选地,若先启动的CPU模块由于硬件故障需要转移控制权,先启动的CPU主动将自身的使能信号置为无效,先启动的CPU模块对后启动CPU的钳制作用消失,后启动CPU的通道逻辑故障电路根据先启动CPU的状态信息将自身使能信号置为有效,后启动CPU接管输出控制权。
优选地,当两个CPU都放弃控制权时,由上层应用软件裁决对某一CPU进行重启。
本发明的有益效果:本发明提出了一种单机双余度热备份CPU处理机制,主CPU在处理***任务时,从CPU能够实时监控主CPU的运行状态,当主CPU发生故障时,从CPU能够及时抢占***控制权,从而接管***任务,提高机电管理计算机的任务可靠性。
附图说明
图1为本发明原理示意图。
具体实施方式
本发明提供一种机载计算机双余度热备份CPU***,对余度CPU运行过程中不同CPU对外设硬件资源输出控制权的调度方法进行研究。***启动后,双余度CPU均保持空闲状态(不占用外设资源不输出信号),此时两个CPU均不享有外部设备控制权。当软件初始化完成后,两个CPU均开始通过写入特定地址的主控指令来使能CPU输出控制,为了区分两个CPU的输出次序,在控制逻辑中采用一定范围内的随机数对主控指令进行延时处理,因而两个CPU对外部设备的使能信号形成时间差,外在表现为两个CPU启动顺序不同。因此,先启动的CPU模块(称为主机)的使能信号将被设置有效且取得输出控制权,同时通过相互将使能信号连接至对方CPU的通道逻辑故障电路,后启动的CPU(称为从机)由主机使能信号钳制处于无效状态。正常运行时若需要控制权转移,主机主动清除特定地址的特定数即可。若主机由于硬件故障需要控制权转移,通道故障逻辑根据主机的状态信息将主机使能信号置为无效,这样对于从机的钳制作用消失,由于初始从机也进行写入特定地址的特定数来使能CPU输出控制,此时从机使能有效,接管输出控制权。
实施例
上电时,双机CPU的外设使能信号初态均为关闭状态。双机的软件进行初始化时,通过特定数据位向特定地址写入主控指令“0”,使得双机CPU模块的外设使能信号状态均为“0”,双机对外部设备均无控制输出。***任务启动后,双机立即向特定地址写入主控指令“1”,由于控制逻辑中采用了随机数对主控使能指令进行延时处理,因此双机会先后启动,先启动的称为主机,后启动的为从机。启动后,主机CPU模块的外设使能信号状态变为“1”(这里先设定看门狗信号为高电平,硬件无严重故障),主机CPU模块对外部设备使能控制输出;此时,主机CPU模块的外设使能信号作用到从机的通道故障逻辑中,将从机CPU的外设使能信号状态钳制到“0”,从机CPU模块不能使能控制输出。
若主机正常运行一段时间后发生硬件故障(看门狗信号变为低电平),则主机CPU模块的外设使能信号状态变为“0”,其对从机CPU模块的外设使能信号的钳制作用消失,由于此前从机软件曾通过特定地址写入主控指令“1”,此时,从机CPU模块的使能信号状态变为“1”,从机CPU模块的外设使能变为有效,将接管对外部设备的控制输出;同时,反过来钳制主机CPU模块的使能信号状态为“0”。即使主机故障恢复正常,依然是从机控制输出。
若主机正常运行一段时间后,应用软件需要进行CPU控制切换,可通过向特定地址写入主控指令“0”,则主机放弃外部设备的控制权(逻辑方式同步骤4),从机接管外部设备的控制权。
若在某一种情况下,双机先均放弃了通道控制权(例如,双机均认为本机有故障),此时的状态如步骤2,双机均不控制输出。此时,是否需要双机其中一方重新启动,则需要根据***需求由应用软件来进行裁决。

Claims (1)

1.一种适用于机载计算机的双余度热备份CPU***,其特征为:所述的***包括双余度CPU;
***启动后,双余度CPU均保持空闲状态;
当软件初始化完成后,两个CPU均开始通过写入特定地址的主控指令来使能CPU输出控制,主控指令中包括决定两个CPU启动顺序的延时处理控制逻辑;
先启动的CPU模块的使能信号被设置为有效且取得输出控制权,同时将使能信号连接至后启动CPU的通道逻辑故障电路,后启动的CPU被先启动的CPU模块使能信号钳制处于无效状态;
两个CPU模块主动切换控制权时,由后启动CPU修改控制自身使能信号的地址数据,使自身的使能信号有效;然后先启动CPU模块再将自身的使能信号修改为无效;
若先启动的CPU模块由于硬件故障需要转移控制权,先启动的CPU主动将自身的使能信号置为无效,先启动的CPU模块对后启动CPU的钳制作用消失,后启动CPU的通道逻辑故障电路根据先启动CPU的状态信息将自身使能信号置为有效,后启动CPU接管输出控制权;
当两个CPU都放弃控制权时,由上层应用软件裁决对某一CPU进行重启。
CN201711076207.7A 2017-11-03 2017-11-03 一种适用于机载计算机的双余度热备份cpu*** Active CN108021406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711076207.7A CN108021406B (zh) 2017-11-03 2017-11-03 一种适用于机载计算机的双余度热备份cpu***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711076207.7A CN108021406B (zh) 2017-11-03 2017-11-03 一种适用于机载计算机的双余度热备份cpu***

Publications (2)

Publication Number Publication Date
CN108021406A CN108021406A (zh) 2018-05-11
CN108021406B true CN108021406B (zh) 2021-06-01

Family

ID=62080521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711076207.7A Active CN108021406B (zh) 2017-11-03 2017-11-03 一种适用于机载计算机的双余度热备份cpu***

Country Status (1)

Country Link
CN (1) CN108021406B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062184B (zh) * 2018-08-10 2021-05-14 中国船舶重工集团公司第七一九研究所 双机应急救援设备、故障切换方法和救援***
CN109460314B (zh) * 2018-11-13 2022-02-11 天津津航计算技术研究所 一种嵌入式***的双机热备装置
CN109271274B (zh) * 2018-11-13 2022-02-11 天津津航计算技术研究所 一种嵌入式***的双机热备方法
CN109782578A (zh) * 2018-12-24 2019-05-21 中国船舶重工集团公司第七一0研究所 一种高可靠性深海水下自主航行器控制方法
CN109976488B (zh) * 2019-03-15 2023-04-14 西北工业大学 一种具有编程功能的无人机机载计算机软件自动复位电路
CN109976237A (zh) * 2019-04-12 2019-07-05 西安爱生技术集团公司 一种无人机机载计算机余度控制电路
CN111142945B (zh) * 2019-11-28 2023-06-13 中国航空工业集团公司西安航空计算技术研究所 一种双余度计算机的主、从通道动态切换方法
CN111367706B (zh) * 2020-03-31 2023-04-28 西安联飞智能装备研究院有限责任公司 一种多余度计算机的通道控制权切换方法及装置
CN114200820A (zh) * 2021-11-08 2022-03-18 陕西千山航空电子有限责任公司 一种基于机载采集与控制计算机的双余度***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271332A (zh) * 2008-05-09 2008-09-24 北京方天长久科技有限公司 紧凑型一体化冗余控制器及其控制方法
CN101833336A (zh) * 2010-04-28 2010-09-15 北京航空航天大学 一种共轴式无人直升机的双余度姿态控制***及调试方法
CN102541697A (zh) * 2010-12-31 2012-07-04 中国航空工业集团公司第六三一研究所 一种双余度计算机故障处理的切换方法
CN103853622A (zh) * 2012-11-28 2014-06-11 中国航空工业集团公司第六三一研究所 一种互为备份的双余度控制方法
CN105471653A (zh) * 2015-12-09 2016-04-06 中国航空工业集团公司西安飞机设计研究所 一种机载双通道无缝切换方法及***
CN105550053A (zh) * 2015-12-09 2016-05-04 中国航空工业集团公司西安航空计算技术研究所 一种提升可用性的监控对容错***余度管理方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101710299A (zh) * 2009-12-24 2010-05-19 中国航空工业集团公司第六三一研究所 基于单片机自监控的双余度容错计算机***
CN105717787A (zh) * 2014-11-30 2016-06-29 上海航空电器有限公司 用于智能电源配电装置的双余度控制***及其控制方法
CN105550067B (zh) * 2015-12-11 2018-05-08 中国航空工业集团公司西安航空计算技术研究所 一种机载计算机双通道选择方法
CN106649909B (zh) * 2016-08-29 2020-04-03 成都飞机工业(集团)有限责任公司 一种双余度补偿式尾翼舵面故障状态控制方法
CN106444514B (zh) * 2016-10-21 2019-04-30 中国运载火箭技术研究院 一种基于逻辑帧交互的高可靠双余度动力控制器
CN107065830A (zh) * 2017-05-03 2017-08-18 北京电子工程总体研究所 一种基于仲裁方式的双冗余热备份***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271332A (zh) * 2008-05-09 2008-09-24 北京方天长久科技有限公司 紧凑型一体化冗余控制器及其控制方法
CN101833336A (zh) * 2010-04-28 2010-09-15 北京航空航天大学 一种共轴式无人直升机的双余度姿态控制***及调试方法
CN102541697A (zh) * 2010-12-31 2012-07-04 中国航空工业集团公司第六三一研究所 一种双余度计算机故障处理的切换方法
CN103853622A (zh) * 2012-11-28 2014-06-11 中国航空工业集团公司第六三一研究所 一种互为备份的双余度控制方法
CN105471653A (zh) * 2015-12-09 2016-04-06 中国航空工业集团公司西安飞机设计研究所 一种机载双通道无缝切换方法及***
CN105550053A (zh) * 2015-12-09 2016-05-04 中国航空工业集团公司西安航空计算技术研究所 一种提升可用性的监控对容错***余度管理方法

Also Published As

Publication number Publication date
CN108021406A (zh) 2018-05-11

Similar Documents

Publication Publication Date Title
CN108021406B (zh) 一种适用于机载计算机的双余度热备份cpu***
US20190303255A1 (en) Cluster availability management
CN107347018B (zh) 一种三冗余1553b总线动态切换方法
US9542320B2 (en) Multi-node cache coherency with input output virtualization
EP0514075A2 (en) Fault tolerant processing section with dynamically reconfigurable voting
CN106970857A (zh) 一种可重构三冗余计算机***及其重构降级方法
US9195553B2 (en) Redundant system control method
CN102724083A (zh) 基于软件同步的可降级三模冗余计算机***
CN112639640B (zh) 冗余热备控制***、控制设备、冗余热备方法及计算机可读存储介质
CN110427283B (zh) 一种双余度的燃油管理计算机***
CN103853626A (zh) 一种星载电子设备的双工冗余备份总线通信方法及装置
EP3789834A1 (en) Hot-standby redundancy control system, method, control apparatus, and computer readable storage medium
CN104333586A (zh) 一种基于光纤链路的san存储设计方法
US20080263391A1 (en) Apparatus, System, and Method For Adapter Card Failover
CN105717787A (zh) 用于智能电源配电装置的双余度控制***及其控制方法
CN116881053B (zh) 数据处理方法及交换板、数据处理***、数据处理装置
US5406472A (en) Multi-lane controller
KR20090056124A (ko) 듀얼 프로세서 제어 장치의 고장 안전 구조
US9026838B2 (en) Computer system, host-bus-adaptor control method, and program thereof
KR102053849B1 (ko) 항공기 시스템 및 그것의 제어 방법
CN103699461A (zh) 一种双主机相互冗余热备份方法
CN117111525A (zh) 一种基于多cpu的可信冗余控制***及控制方法
JP2007280313A (ja) 冗長化システム
CN112506830A (zh) 一种多路传输数据总线冗余同步通信方法
CN112000286A (zh) 一种四控全闪存储***及其故障处理方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant