RU2569576C1 - Control module - Google Patents
Control module Download PDFInfo
- Publication number
- RU2569576C1 RU2569576C1 RU2014126650/08A RU2014126650A RU2569576C1 RU 2569576 C1 RU2569576 C1 RU 2569576C1 RU 2014126650/08 A RU2014126650/08 A RU 2014126650/08A RU 2014126650 A RU2014126650 A RU 2014126650A RU 2569576 C1 RU2569576 C1 RU 2569576C1
- Authority
- RU
- Russia
- Prior art keywords
- rapidio
- snk
- control module
- microprocessor
- rom
- Prior art date
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Hardware Redundancy (AREA)
Abstract
Description
Изобретение относится к вычислительной технике и может быть использовано при создании высокопроизводительных высоконадежных мультипроцессорных управляющих комплексов и систем цифровой обработки сигналов.The invention relates to computer technology and can be used to create high-performance highly reliable multiprocessor control systems and digital signal processing systems.
Разработанные управляющие модули на основе микропроцессоров обеспечивают возможность построения цифровых вычислительных комплексов (ЦВК), выполняющих в реальном масштабе времени прием по высокоскоростным каналам потоков данных, первичную обработку сигналов (пространственно-временной спектральный анализ, формирование частотных диапазонов, фильтрацию, пороговое обнаружение), вторичную, третичную и общекомплексную обработку информации, включая решение задач отображения, консервации, документирования и управления на рабочих местах операторов, а также обмен данными с другими приборами и системами как в области научного применения, так и другого специального назначения.The developed microprocessor-based control modules provide the ability to build digital computer systems (CVCs) that perform real-time reception on high-speed channels of data streams, primary signal processing (spatial-temporal spectral analysis, frequency band formation, filtering, threshold detection), secondary, tertiary and overall processing of information, including solving problems of display, conservation, documentation and management at workplaces about operators, as well as data exchange with other devices and systems both in the field of scientific application and other special purposes.
Перспективным направлением развития и применения электроники является разработка высокопроизводительных многопроцессорных модулей с повышенной сбоеустойчивостью к внешнему воздействию и экстремальным тепловым режимам эксплуатации.A promising direction in the development and application of electronics is the development of high-performance multiprocessor modules with increased resistance to external influences and extreme thermal operating conditions.
Известен управляющий модуль, в состав которого входит: одна двухъядерная система на кристалле - СНК (далее СНК), оперативно запоминающее устройство (далее ОЗУ) с коррекцией ошибок, постоянно запоминающее устройство (далее ПЗУ), системное и перепрограммируемое ППЗУ (перепрограммируемое постоянно запоминающее устройство - ППЗУ) пользователя типа флеш, несколько каналов Ethernet с различной скоростью передачи, один канал параллельного RapidIO, один канал интерфейса PCI, два канала RS-232C и один канал I2C (PM854 Module, Dynatem, Inc. 23263 Madero, Suite C, Mission Viejo, CA (949) 855-3235).The control module is known, which includes: one dual-core system on a chip - SNK (hereinafter referred to as SNK), random access memory (hereinafter referred to as RAM) with error correction, permanently memory (hereinafter referred to as ROM), system and reprogrammable ROM (reprogrammed permanently memory - EPROM) of a flash type user, several Ethernet channels with different transmission speeds, one parallel RapidIO channel, one PCI interface channel, two RS-232C channels and one I2C channel (PM854 Module, Dynatem, Inc. 23263 Madero, Suite C, Mission Viejo, CA (949) 855-3235).
Недостатком описанного модуля является то, что он выполнен в виде мезонина. При выполнении программы начальной загрузки модуля из системного ПЗУ с низкой помехозащищенностью возможны сбои в СНК при получении данных, т.к. ПЗУ является флеш-памятью.The disadvantage of the described module is that it is made in the form of a mezzanine. When executing the module boot program from the system ROM with low noise immunity, there may be failures in the SNK when receiving data, because ROM is a flash memory.
Изобретение управляющий модуль - это отдельный модуль, предназначенный для построения систем цифровой обработки сигналов и высокопроизводительных однородных мультипроцессорных вычислительных комплексов широкого применения с коммутационной средой стандарта RapidIO в конструктиве Евромеханика 6U, существует в нескольких исполнениях, отличающихся стойкостью к внешним воздействующим факторам, количеством микропроцессоров и тактовой частотой.Invention, the control module is a separate module designed for constructing digital signal processing systems and high-performance homogeneous multiprocessor computer complexes of wide application with a switching environment of the RapidIO standard in the Euromechanics 6U construct. It exists in several versions that are resistant to external factors, the number of microprocessors and the clock frequency .
Задачей изобретения является повышение сбоеустойчивости модуля в момент загрузки управляющих программ из репрограммируемого постоянно запоминающего устройства - РПЗУ пользователя.The objective of the invention is to increase the fault tolerance of the module at the time of loading control programs from a reprogrammable read-only memory device - user RPG.
Технический результат изобретения заключается в повышении сбоеустойчивости начальной загрузки и повышении производительности для каждого микропроцессора управляющего модуля в условиях разрушающего воздействия радиационных факторов при сохранении массогабаритных показателей и ограничении на потребляемую мощность.The technical result of the invention is to increase the fault tolerance of the initial load and increase productivity for each microprocessor of the control module under the conditions of the destructive effect of radiation factors while maintaining weight and size indicators and limiting the power consumption.
Указанный технический результат достигается тем, что в управляющем модуле, содержащем микропроцессоры, сбоеустойчивые резервируемые параллельные каналы RapidIO, выполненные на основе многоканального коммутатора, микросхемы для хранения информации и электрические линии связи, согласно изобретению он дополнительно снабжен последовательными каналами RapidIO LP-Serial, выполненными на основе двуканального коммутатора, встроенного внутрь каждого микропроцессора, при этом управляющий модуль имеет устройства самодиагностики, распределенную систему управления восстановлением «Реаниматор», состоящую из постоянно запоминающих устройств и однотипных блоков, каждый из которых содержит контроллер аварийного маршрутизатора, сторожевой таймер и таймер общего назначения, связанных между собой посредством ядра процессора, и содержит два дополнительных электронных мезонинных модуля в конструктиве стандарта PMC/RMC, связанных с одним из микропроцессоров.The specified technical result is achieved by the fact that in the control module containing microprocessors, fault-tolerant redundant parallel channels RapidIO made on the basis of a multi-channel switch, microchips for storing information and electric communication lines, according to the invention it is additionally equipped with serial channels RapidIO LP-Serial, made on the basis of a two-channel switch embedded inside each microprocessor, while the control module has self-diagnostic devices distributed by the system “Resuscitator” recovery management control, consisting of read-only memory devices and units of the same type, each of which contains an emergency router controller, a watchdog timer and a general purpose timer interconnected via the processor core and contains two additional electronic mezzanine modules in the construct of the PMC / standard RMC associated with one of the microprocessors.
Изобретение поясняется чертежами, где на фиг. 1 представлена функциональная схема управляющего модуля на основе микропроцессоров, на фиг. 2 - структура микропроцессора, на фиг. 3 - структурная схема распределенной системы управления восстановлением, на фиг. 4 - блок-схема подключения двух управляющих модулей и реализации функции восстановления, на фиг. 5 - алгоритм работы системы «Реаниматор», на фиг. 6 - временная диаграмма выработки общего сигнала «готовности».The invention is illustrated by drawings, where in FIG. 1 is a functional diagram of a microprocessor-based control module; FIG. 2 shows the structure of a microprocessor; FIG. 3 is a block diagram of a distributed recovery management system; FIG. 4 is a block diagram of the connection of two control modules and the implementation of the recovery function, FIG. 5 - algorithm of the “Resuscitator” system, in FIG. 6 is a timing chart for generating a general “ready” signal.
Управляющий модуль, предназначенный для построения мультипроцессорных вычислительных комплексов широкого применения с коммутационной средой стандарта RapidIO, содержит: два одинаковых микропроцессора 1 и 2 (системы на кристалле - СНК(I) и СНК(II)), ОЗУ(I) динамического типа 3 с возможностью коррекции ошибок по шине связи 4 для микропроцессора 1; ОЗУ(II) динамического типа 5 с возможностью коррекции ошибок по шине связи 6 для микропроцессора 2; многоканальный коммутатор параллельного RapidIO 7, связанный с микропроцессором 1 по каналу RapidIO 8 и с микропроцессором 2 по каналу RapidIO 9; внутреннюю шину PCI 10 для подключения двух мезонинных модулей 11 и 12 в стандарте РМС или RMC; внутренние шины 13 и 14 параллельного RapidIO для подключения двух мезонинных модулей 11 и 12 к коммутатору параллельного RapidIO 7; перепрограммируемое ППЗУ(I) конфигурации 15, связанное с коммутатором параллельного RapidIO 7 посредством интерфейса I2C(I) 16; системное ПЗУ SYS(I) 17 для микропроцессора 1, репрограммируемое постоянно запоминающее устройство - РПЗУ(I) пользователя 18 для микропроцессора 1, NAND-Flash(I) пользователя 19 для микропроцессора 1, функциональные блоки 17, 18, 19 обмениваются данными с микропроцессором 1 по шине ПЗУ(I) 20; системное ПЗУ SYS(II) 21 для микропроцессора 2, РПЗУ(II) пользователя 22 для микропроцессора 2, NAND-Flash(II) пользователя 23 для микропроцессора 2, функциональные блоки 21, 22, 23 обмениваются информацией с микропроцессором 2 по шине ПЗУ(II) 24; ПП ΕΤΗ приемопередатчики 25 и 26 Ethernet с интерфейсом МП для двух микропроцессоров 1 и 2, шины интерфейса МП 27 и 28; приемопередатчики - ПП RS-232C 29, 30, 31, 32 для каждого микропроцессора, шины связи 33 и 34 с микропроцессором 1, шины связи 35 и 36 с микропроцессором 2; перепрограммируемое ППЗУ(II) 37 для хранения переменных окружения и связанное с микропроцессором 1 посредством интерфейса I2C(II) 38; перепрограммируемое ППЗУ(III) 39, связанное с микропроцессором 2 посредством интерфейса I2C(III) 40; соединители 41, 42 и 43 для связи с другими однородными мультипроцессорными модулями; каналы передачи сигналов JTAG, GPIO, интерфейса RS-232C, параллельного RapidIO и последовательного RapidIO LP-Serial (4x SRIO) 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56 на соединители 41, 42, 43. Последовательный RapidIO (SRIO) выведен на внешний соединитель 41, служебные и диагностические сигналы выведены на внешний соединитель 42.The control module, designed to build multiprocessor computer complexes of wide application with a switching environment of the RapidIO standard, contains: two identical microprocessors 1 and 2 (systems on a chip - SNK (I) and SNK (II)), RAM (I) of dynamic type 3 with the ability error correction on communication bus 4 for microprocessor 1; RAM (II) of dynamic type 5 with the possibility of error correction on
Управляющий модуль в составе каждого микропроцессора 1 и 2 содержит: ядро процессора (CORE) 60; контроллер ПЗУ 61; контроллер динамического ОЗУ 62; контроллер одиночных сбоев 63; контроллер RapidIO 64; контроллер аварийного маршрутизатора А 65, входы которого в управляющем модуле соединены с линиями «географического адреса»; сторожевой таймер - СТ 66; таймер общего назначения - ТОН 67 для подключения внешнего синхросигнала; контроллер портов дискретных сигналов GPIO 68. Контроллер ПЗУ 61 соединен с системным ПЗУ SYS(I) 17, РПЗУ(I) 18, NAND-Flash(I) 19; контроллер динамического ОЗУ 62 соединен с ОЗУ(1) 3; контроллер одиночных сбоев 63 соединен с контроллером динамического ОЗУ 62 и ядром процессора (CORE) 60. Контроллер RapidIO 64 через коммутатор RapidIO 69 подключен к многоканальному коммутатору параллельного RapidIO 7. Контроллер RapidIO 64 и коммутатор RapidIO 69 одного микропроцессора служат для передачи данных через коммутатор параллельного RapidIO 7 в другие микропроцессоры.The control module as part of each microprocessor 1 and 2 contains: processor core (CORE) 60; ROM controller 61; dynamic RAM controller 62; single fault controller 63; RapidIO 64 controller controller of
Структурная схема распределенной системы управления восстановлением «Реаниматор», состоит из: ПЗУ SYS(I,II) 17, 21, РПЗУ(I,II) 18, 22, NAND-Flash(I,II) 19, 23, CHK(I) и СНК(II) (микропроцессоры 1 и 2), соединенные через коммутатор параллельного RapidIO 7. Система также включает в себя: программируемый сторожевой таймер - СТ 66 в составе каждой CHK(I) 1, СНК(II) 2 и контроллер аварийного маршрутизатора А 65. Выход СТ 66 в управляющем модуле подключен к общему сигналу «готовности» 70, один выход контроллера дискретных сигналов GPIO 68 также подключен к общему сигналу «готовности» 70, при этом второй выход GPIO 68 к общему сигналу «восстановления» 71; ТОН 67 подключен к внешнему синхросигналу от системного генератора 72 (фиг. 4). В каждую СНК управляющего модуля заводится географический адрес, который идентифицирует микропроцессор в многомодульной конструкции. Значение географического адреса одной СНК по каналам RapidIO доступно другим СНК.The block diagram of the Reanimator distributed recovery management system consists of: ROM SYS (I, II) 17, 21, RPZU (I, II) 18, 22, NAND-Flash (I, II) 19, 23, CHK (I) and SNK (II) (microprocessors 1 and 2) connected through a parallel switch RapidIO 7. The system also includes: a programmable watchdog timer -
В управляющем модуле CHK(I) 1 и СНК(II) 2 соединяются между собой по каналам параллельного RapidIO 8 и 9, через объединительную плату и с помощью внешнего кабеля по каналу последовательного RapidIO (SRJO).In the control module, CHK (I) 1 and SNK (II) 2 are interconnected via parallel channels of
При построении ЦВК из нескольких управляющих модулей и соответственно из нескольких СНК для реализаций функции восстановления после сбоя используются: система единого времени, включающая в себя один системный генератор 72, к которому подключены все входы таймеров общего назначения - ТОН 67 и система извещений, объединяющая выходные дискретные сигналы каждой СНК в общий сигнал «восстановления» 71.When constructing the CVC from several control modules and, accordingly, from several SNKs, the following functions are used for the implementation of the failure recovery function: a single time system that includes one system generator 72, to which all inputs of general-purpose timers are connected -
В управляющем модуле применяется несколько микросхем для хранения, ввода информации и определения задач мультипроцессорных комплексов: сбоеустойчивые ПЗУ SYS(I) 17 и ПЗУ SYS(II) 21 малого объема, предназначенные для размещения программного обеспечения, содержащие систему «Реаниматор», которая проверяет правильность считываемой информации из флеш-памяти РПЗУ(I) 18 и РПЗУ(II) 22. Если бы ЦВК обработки сигналов был бы ориентирован на решение одной задачи, то было бы достаточной одной РПЗУ и программы ПЗУ SYS(I) 17 и ПЗУ SYS(II) 21 оставались бы также без изменений. Для обеспечения многофункциональности и универсальности ЦВК в РПЗУ(I) 18 (РПЗУ(II) 22) необходимо менять переменные окружения (сколько микропроцессоров включить в задачу, сколько модулей в системе, состав системы, какие идентификаторы) при аппаратной загрузке параметров окружения системы «Реаниматор».The control module uses several microcircuits for storing, entering information and defining the tasks of multiprocessor complexes: fault-tolerant ROMs SYS (I) 17 and ROMs SYS (II) 21 of small volume, designed to accommodate software containing the Resuscitator system, which checks the readability information from the flash memory of RZBU (I) 18 and RZBU (II) 22. If the CVC of signal processing were oriented to the solution of one problem, then one RZBU and program ROM ROM SYS (I) 17 and ROM ROM SYS (II) would be sufficient 21 would also remain unchanged s. To ensure the versatility and versatility of the CVC in RPZU (I) 18 (RPZU (II) 22), it is necessary to change the environment variables (how many microprocessors to include in the task, how many modules in the system, the composition of the system, which identifiers) when hardware loading the environment parameters of the Resuscitate system .
Распределенная система управления восстановлением «Реаниматор» в управляющем модуле работает следующим образом: все СНК модуля начинают выполнять загрузку управляющих программ из ПЗУ SYS и каждая из СНК способна вырабатывать сигнал «готовности» по окончании загрузки; каждая из СНК имеет вход для приема от соседних СНК объединенного сигнала «готовности» 70; если все СНК были загружены без сбоев, то продолжается функционирование модуля в нормальном рабочем режиме; если в какой-либо СНК произошел сбой, срабатывает сторожевой таймер - СТ данной СНК и общий сигнал «готовности» 70 не выдается, то требуется аварийная загрузка. Выходы таймеров СТ 66 каждой СНК объединены с общим сигналом «готовности» 70. Статус о срабатывании СТ доступен управляющей СНК через служебные пакеты, передаваемые по каналам RapidIO. Система на кристалле, в которой произошел сбой, сигнализирует другой СНК об ошибке при загрузке и сама инициирует восстановление. Нормально работающая СЕК при настройке системы опрашивает все соседние СНК и по идентификатору RapidIO определяет, где произошел сбой и выполняет аварийную загрузку в нее управляющих программ, после чего «сбойная» СНК функционирует нормально, а «сбойная» микросхема РПЗУ исключается из работы управляющего модуля и ЦБК. Распределенная система управления восстановлением «Реаниматор» определяет равнозначность СНК и позволяет каждой управляющей CHK(I) 1 или СНК(II) 2 взять на себя функцию восстановления после сбоя.Distributed recovery management system "Resuscitator" in the control module works as follows: all SNKs of the module start loading control programs from SYS ROM and each SNK is capable of generating a “ready” signal at the end of the download; each SNK has an input for receiving from the neighboring SNK the combined signal "readiness" 70; if all SNK were loaded without failures, then the module continues to function in normal operating mode; if a failure occurs in any SNK, the watchdog timer is triggered - the ST of this SNK and the general “ready”
После прохождения сигнала «сброс» выполняется программа инициализации и проверки каждой СНК. После снятия сигнала «сброс» ядро процессора (CORE) 60 выставляет на одном выходе адрес, по которому контроллер ПЗУ 61 в составе микропроцессора запрашивает у ПЗУ SYS(I) 17 данные. ПЗУ SYS(I) 17 передает запрошенную информацию на вход контроллера ПЗУ 61. Далее контроллер ПЗУ 61 передает данные на вход ядра процессора (CORE) 60. Таким образом, микропроцессор выполняет программу инициализации, содержащуюся в ПЗУ SYS(I) 17, тестирование ОЗУ(I) 3 и конфигурирование устройств.After passing the reset signal, the initialization and verification program for each SNK is executed. After removing the “reset” signal, the processor core (CORE) 60 sets the address on which the ROM controller 61 as part of the microprocessor requests data from the ROM SYS (I) 17 at one output. ROM SYS (I) 17 transfers the requested information to the input of ROM controller 61. Next, the ROM controller 61 transfers data to the input of the processor core (CORE) 60. Thus, the microprocessor executes the initialization program contained in ROM SYS (I) 17, testing the RAM ( I) 3 and device configuration.
В тоже время по сбоеустойчивому интерфейсу I2C(I) 16 из ППЗУ(I) конфигурации 15 в коммутатор RapidIO 7 автоматически загружаются таблицы маршрутизации. После выполнения программы инициализации начинается загрузка управляющих программ в каждую CHK(I) 1 и СНК(II) 2 из РПЗУ(I) 18 и РПЗУ(II) 22 соответственно. Если загрузка выполнена успешно, то контроллер дискретных сигналов GPIO 68 устанавливает на своем выходе сигнал «готовности». При успешном выполнении загрузки всех СНК устанавливается общий сигнал «готовности» 70.At the same time, routing tables are automatically loaded into the RapidIO 7 switch from the fail-safe I2C (I) 16 interface from the ROM (I)
Если при загрузке произошел сбой хотя бы в одной из СНК, то срабатывает сторожевой таймер - СТ данной СНК и общий сигнал «готовности» 70 не вырабатывается. При загрузке управляющих программ осуществляется копирование области данных из РПЗУ(I) 18 в ОЗУ(I) 3, используя контроллер динамического ОЗУ 62. При возникновении ошибки в ОЗУ(I) 3 контроллер одиночных сбоев 63 вычисляет ошибочный бит данных и подставляет правильный бит. После выполнения сбоеустойчивого копирования процессор вычисляет контрольную сумму области данных в ОЗУ(I) 3. Если при возникновении сбоя в РПЗУ(I) 18 вычисленная контрольная сумма соответствует эталонной контрольной сумме, хранящейся в ПЗУ SYS(I) 17, то загрузка управляющей программы выполняется из ОЗУ(I) 3. Если сравнения с эталоном не произошло, то дальнейшая загрузка происходит под управлением системы «Реаниматор», алгоритм работы которой представлен на фиг. 5.If at least one of the SNK fails to boot, then the watchdog timer is activated — the ST of this SNK and the general “ready”
Задача системы «Реаниматор» загрузить управляющую программу в ОЗУ, используя дополнительные области данных из РПЗУ и NAND-Flash, а также достоверную копию управляющей программы, размещенную в сбоеустойчивом ОЗУ соседней СНК.The task of the “Resuscitator” system is to load the control program into RAM using additional data areas from the RPZU and NAND-Flash, as well as a reliable copy of the control program located in the fail-safe RAM of the neighboring SNK.
Основные этапами работы системы «Реаниматор» являются: аварийная загрузка из РПЗУ(I) 18; аварийная загрузка из NAND-Flash(I) 19 при неуспешной загрузке из РПЗУ(I) 18; аварийная загрузка с использованием каналов параллельного RapidIO при неуспешной загрузке из NAND-Flash(I) 19 и аварийная загрузка с использованием каналов последовательного RapidIO при неуспешной загрузке с использованием параллельного RapidIO.The main stages of the “Resuscitator” system are: emergency loading from RPZU (I) 18; emergency loading from NAND-Flash (I) 19 upon unsuccessful loading from RZPU (I) 18; emergency boot using parallel RapidIO channels when loading unsuccessfully from NAND-Flash (I) 19 and emergency loading using serial RapidIO channels when loading unsuccessfully using parallel RapidIO.
При возникновении одиночного сбоя во время загрузки управляющих программ, например в CHK(I) 1, «Реаниматор» сначала выполняет аварийную загрузку из микросхемы РПЗУ(I) 18 (фиг. 3). Копируется резервный блок №1 данных из микросхемы РПЗУ(I) 18 в сбоеустойчивое ОЗУ(I) 3 управляющего модуля. Вычисляется контрольная сумма скопированной области и сравнивается с эталонной, которая располагается в ПЗУ SYS(I) 17. При успешном сравнении система «Реаниматор» заканчивает свою работу и управление дальнейшей загрузкой осуществляется из достоверной скопированной области ОЗУ(I) 3. Если сравнения с эталонным значением не произошло, то подсистема аварийной загрузки задействует следующий резервный блок №2 данных из микросхемы РПЗУ(I) 18. Количество резервных блоков в микросхеме РПЗУ(I) 18 хранится в микросхеме перепрограммируемого ППЗУ(II) 37. Алгоритм определения достоверности резервного блока №2 аналогичен описанному алгоритму для блока №1. Если достоверных блоков из числа используемых блоков в РПЗУ(I) 18 не найдено, то «Реаниматор» начинает этап аварийной загрузки из NAND-Flash(I) 19. Алгоритм аварийной загрузки из NAND-Flash(I) 19 с использованием резервных блоков аналогичен алгоритму аварийной загрузки из РПЗУ(I) 18. При неудачной загрузке из всех доступных и определенных в ППЗУ(I) 15 резервных блоков NAND-Flash(I) 19 система «Реаниматор» начинает этап аварийной загрузки с использованием параллельного RapidIO, основные функции которого: определение управляющей СНК; определение СНК, в которых произошел сбой; сбоеустойчивое копирование по каналам параллельного RapidIO; резервная маршрутизация каналов параллельного RapidIO.If a single failure occurs during the loading of control programs, for example, in CHK (I) 1, the “Resuscitator” first performs emergency loading from the RPZU (I) 18 chip (Fig. 3). The backup unit No. 1 of the data is copied from the RPZU (I) 18 microchip into the fail-safe RAM (I) 3 of the control module. The checksum of the copied area is calculated and compared with the reference, which is located in the SYS (I) 17 ROM. If the comparison is successful, the Resuscitator system finishes its work and further loading is controlled from the authentic copied RAM (I) 3 region. If the comparison is with the reference value did not happen, then the emergency loading subsystem activates the next backup block No. 2 of data from the RPZU (I) 18 chip. The number of spare blocks in the RPZU (I) 18 chip is stored in the reprogrammed ROM (II) 37 chip. Al The algorithm for determining the reliability of the reserve block No. 2 is similar to the described algorithm for block No. 1. If there are no reliable blocks from the number of used blocks in RPM (I) 18, then “Resuscitator” starts the emergency loading phase from NAND-Flash (I) 19. The emergency loading algorithm from NAND-Flash (I) 19 using redundant blocks is similar to the algorithm emergency loading from the RPSU (I) 18. If the NAND-Flash (I) 19 redundant blocks available and defined in the ROM (I) 15 fail to load, the Resuscitate system starts the emergency loading phase using parallel RapidIO, the main functions of which are: control SNK; identification of SNK in which there was a failure; fail-safe copying through parallel RapidIO channels; redundant parallel routing of channels RapidIO.
Если при загрузке произошел сбой хотя бы в одной из СНК, то общий сигнал «готовности» 70 не вырабатывается, а нормально работающие СНК (например, СНК(II)) начинают выполнять алгоритм определения, какая из них будет осуществлять функцию восстановления (определения управляющей СНК). ТОН 67 в составе каждой СНК ведут отсчеты времени от начала загрузки. Так как все ТОН подключены к одному системному генератору 72, то временные интервалы отсчитываются для каждой СНК синхронно. If at least one of the SNKs failed to boot, then the general “ready”
На временной диаграмме (фиг. 6) показаны сигналы «готовности» и «восстановления»: к запланированному и задаваемому программно времени t0 окончания загрузки контроллер GPIO 68 в составе СНК(II) 2 проверят наличие общего сигнала «готовности» 70. Каждая нормально работающая СНК в определенный для нее временной интервал (t1=t0+Δt, t2, t3 и т.д…) согласно количеству модулей в ЦБК и количеству СНК проверяет состояние своего входа контроллера GPIO 68 на наличие общего сигнала «восстановления» 71. Временной интервал для каждой СНК зависит от географического адреса («1», «2», «3» и т.д.), чем меньше значение географического адреса, тем раньше временной интервал определения управляющей системы на кристалле. Например, в момент времени t1=t0+Δt контроллер GPIO 68 анализирует состояние CHK(I) 1 и выясняется, что при загрузке произошел сбой, т.е. CHK(I) 1 не может выполнять функцию восстановления, тогда нормально работающая СНК(II) 2, не обнаруживая на своем входе сигнал «восстановления», становится управляющей.The time diagram (Fig. 6) shows the signals of “readiness” and “recovery”: by the scheduled and set software time t 0 of the end of loading, the
Посылка сообщений с использованием параллельного RapidIO функционирует следующим образом: контроллер RapidIO 64 в составе СНК(II) 2 формирует сообщения и через коммутатор RapidIO 69 по каналу RapidIO 9 отправляет в коммутатор параллельного RapidIO 7. Коммутатор параллельного RapidIO 7 доставляет сообщение со входа на один из своих выходов. Номер выхода определяется из сообщения и внутренних таблиц маршрутизации. Сообщение через коммутатор параллельного RapidIO 7 по каналу 8 доставляется на вход контроллера RapidIO 64 в составе CHK(I) 1. Далее CHK(I) 1 передает принятое сообщение в ОЗУ(I) 3, извещает ядро процессора (CORE) 60 о приходе сообщения в ОЗУ(I) 3 и отправляет ответное сообщение контроллеру RapidIO управляющей СНК(II) 2 об успешном получении данных.Sending messages using parallel RapidIO operates as follows: the RapidIO 64 controller as part of SNK (II) 2 generates messages and sends it through the RapidIO 69 switch via the RapidIO 9 channel to the parallel switch RapidIO 7. The parallel switch RapidIO 7 delivers a message from the input to one of its exits. The exit number is determined from the message and internal routing tables. A message through a parallel switch RapidIO 7 through
Сбоеустойчивое копирование по каналам параллельного RapidIO осуществляется следующим образом: контроллер RapidIO 64 в управляющей СНК(II) 2 посылает CHK(I) 1 сообщение о начале загрузки копии управляющей программы в ОЗУ(I) 3. После приема сообщения система «Реаниматор» CHK(I) 1, в которой при загрузке произошла ошибка, активирует сбоеустойчивое копирование по каналам параллельного RapidIO в собственное ОЗУ(I) 3. CHK(I) 1 отправляет ответ управляющей СНК(II) 2 о получении данных. Данные из приемного буфера CHK(I) 1 копируются в область ОЗУ(I) 3, которая будет являться достоверной копией управляющей программы. Контроллер RapidIO 64 управляющей СНК(II) 2 после окончании передачи всего объема программы посылает CHK(I) 1 сообщений об окончании загрузки. Fail-safe copying via parallel RapidIO channels is carried out as follows: the RapidIO 64 controller in the control SNK (II) 2 sends CHK (I) 1 a message about the start of downloading a copy of the control program in RAM (I) 3. After receiving the message, the Resuscitator system CHK (I ) 1, in which an error occurred during loading, activates fail-safe copying via parallel RapidIO channels to its own RAM (I) 3. CHK (I) 1 sends a response to the control SNK (II) 2 about receiving data. Data from the receive buffer CHK (I) 1 is copied to the RAM (I) 3 area, which will be a reliable copy of the control program. The RapidIO 64 controller of the control SNK (II) 2 after the end of the transfer of the entire program volume sends CHK (I) 1 messages about the end of the download.
После приема сообщения об окончании загрузки «Реаниматор» СНК(I) заканчивает копирование по каналам параллельного RapidIO и передает управление достоверной копии управляющей программы в ОЗУ(I) 3. После успешной загрузки управляющей программы контроллер GPIO 68 в восстановленной CHK(I) 1 выставляет свой сигнал «готовности» в активное состояние. Далее управляющая СНК(II) 2 продолжит загружать копию управляющей программы в ОЗУ следующей СНК, где произошел сбой, если таковая имеется. После загрузки копий всем аварийным СНК управляющая СНК(II) 2 завершает сбоеустойчивое копирование и переводит свой сигнал «восстановление» в неактивное состояние. Управляющая СНК(II) 2 во временной интервал t2+Δt извещает другие СНК о том, что алгоритм и реализации функции восстановления завершены. Извещение производится путем выставления на своем выходе сигнала «восстановления», при этом устанавливается общий сигнал «восстановления» 71. Во временной интервал t3+Δt анализа состояния СНК(III) не производится, считая, т.к. сбоя при ее загрузке не произошло. После успешной загрузки управляющей программы во всех СНК устанавливается общий сигнал «готовности» 70, что является индикацией успешного функционирования модулей.After receiving a message about the end of the download, “Resuscitator” SNK (I) finishes copying via parallel RapidIO channels and transfers control of a reliable copy of the control program to RAM (I) 3. After successful loading of the control program, the
При сбое доставки сообщения по каналам параллельного RapidIO система «Реаниматор», исполняемая в управляющей СНК(II) 2, активизирует алгоритм резервной аварийной маршрутизации. Автоматическая маршрутизация пакетов RapidIO достигается через конфигурационное перепрограммируемое ППЗУ(I) 15.If the message delivery via parallel RapidIO channels fails, the Resuscitator system, executed in the control SNK (II) 2, activates the backup emergency routing algorithm. The automatic routing of RapidIO packets is achieved through a configurable reprogrammable EPROM (I) 15.
Коммутаторы RapidIO 69 в составе каждой СНК содержат таблицы маршрутизации. Контроллер RapidIO 64 в составе управляющей СНК(II) изменяет маршрут доставки сообщений от СНК(II) 2 до CHK(I) 1. Для этого контроллер аварийного маршрутизатора А 65 в составе управляющей СНК(II) вычисляет географический адрес получателя и изменяет ячейки таблицы маршрутизации коммутатора RapidIO 69 таким образом, что все исходящие сообщения перенаправляются с одного выхода коммутатора RapidIO 69 в составе СНК(II) на другой выход. Далее все исходящие сообщения от управляющей СНК(II) 2 доставляются по резервному маршруту с использованием каналов последовательного RapidIO: через канал 51 до внешнего соединителя 41, далее через внешний кабель до соединителя 43 и затем через канал 50 на вход коммутатора RapidIO 69 в составе СНК(I). Также все ответные сообщения от СНК(II) 2 к CHK(I) 1 доставляются по резервному маршруту. После окончании успешной передачи всего объема копии управляющей программы СНК(I) посылает сообщение об окончании загрузки. После приема сообщения об окончании загрузки система «Реаниматор» управляющей СНК(II) заканчивает копирование по каналам последовательного RapidIO и передает управление достоверной копии управляющей программы в перепрограммируемой ППЗУ(II) 37, начинается исполнение загруженных управляющих программ.The RapidIO 69 switches in each SNK contain routing tables. The RapidIO 64 controller as part of the control SNK (II) changes the message delivery route from SNK (II) 2 to CHK (I) 1. For this, the emergency
Управляющие модули могут быть использованы при создании высокопроизводительной высоконадежной мультипроцессорной системы цифровой обработки сигналов. Распределенная система управления восстановлением «Реаниматор», которая может быть использована в конструкции управляющего модуля, испытана в модуле ЦП-РИО-64 для использования в мультипроцессорной системе цифровой обработки сигналов для гидроакустического комплекса морского базирования.Control modules can be used to create a high-performance highly reliable multiprocessor system for digital signal processing. Distributed recovery management system "Reanimator", which can be used in the construction of the control module, was tested in the CPU-RIO-64 module for use in a multiprocessor system for digital signal processing for a sea-based sonar system.
ЛитератураLiterature
1. RapidIO specification Revision 2.1, Complete Spec. Stack, 2009. URL: http://www.rapidio.org1. RapidIO specification Revision 2.1, Complete Spec. Stack, 2009. URL: http://www.rapidio.org
2. Dynatem, Inc. 23263 Madero, Suite C, Mission Viejo, CA (949) 855-3235), Computers on Module PM854 http://www.dynatem.com/products/pm854.php2. Dynatem, Inc. 23263 Madero, Suite C, Mission Viejo, CA (949) 855-3235), Computers on Module PM854 http://www.dynatem.com/products/pm854.php
3. MPC8540 PowerQUICC III Integrated Host Processor Reference Manual MPC8540RM Rev. 1 07/20043. MPC8540 PowerQUICC III Integrated Host Processor Reference Manual MPC8540RM Rev. 1 07/2004
4. PCI Express Specification and White Papers. URL: http://www.pcisig.com/URL: http://www.pci-sig.com4. PCI Express Specification and White Papers. URL: http://www.pcisig.com/URL: http://www.pci-sig.com
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014126650/08A RU2569576C1 (en) | 2014-07-01 | 2014-07-01 | Control module |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014126650/08A RU2569576C1 (en) | 2014-07-01 | 2014-07-01 | Control module |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2569576C1 true RU2569576C1 (en) | 2015-11-27 |
Family
ID=54753541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014126650/08A RU2569576C1 (en) | 2014-07-01 | 2014-07-01 | Control module |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2569576C1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU170434U1 (en) * | 2016-05-31 | 2017-04-25 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Поволжский государственный технологический университет" | Programmable JTAG - Diagnostic Module |
CN107920001A (en) * | 2017-12-07 | 2018-04-17 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | The debugging apparatus of RapidIO communication middlewares |
RU195789U1 (en) * | 2019-11-06 | 2020-02-07 | Публичное акционерное общество "Саратовский электроприборостроительный завод имени Серго Орджоникидзе" | COMPUTER-INTERFACE MODULE |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU101225U1 (en) * | 2010-09-06 | 2011-01-10 | Открытое акционерное общество "Научно-конструкторское бюро вычислительных систем" | COMPUTER-INTERFACE MODULE |
RU108868U1 (en) * | 2011-06-01 | 2011-09-27 | Федеральное государственное унитарное предприятие "Государственный научно-исследовательский институт авиационных систем" (ФГУП "ГосНИИАС") | INTEGRATED MODULAR AVIONICS PLATFORM |
-
2014
- 2014-07-01 RU RU2014126650/08A patent/RU2569576C1/en active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU101225U1 (en) * | 2010-09-06 | 2011-01-10 | Открытое акционерное общество "Научно-конструкторское бюро вычислительных систем" | COMPUTER-INTERFACE MODULE |
RU108868U1 (en) * | 2011-06-01 | 2011-09-27 | Федеральное государственное унитарное предприятие "Государственный научно-исследовательский институт авиационных систем" (ФГУП "ГосНИИАС") | INTEGRATED MODULAR AVIONICS PLATFORM |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU170434U1 (en) * | 2016-05-31 | 2017-04-25 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Поволжский государственный технологический университет" | Programmable JTAG - Diagnostic Module |
CN107920001A (en) * | 2017-12-07 | 2018-04-17 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | The debugging apparatus of RapidIO communication middlewares |
RU195789U1 (en) * | 2019-11-06 | 2020-02-07 | Публичное акционерное общество "Саратовский электроприборостроительный завод имени Серго Орджоникидзе" | COMPUTER-INTERFACE MODULE |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101728581B1 (en) | Control computer system, method for controlling a control computer system, and use of a control computer system | |
CN105204965B (en) | Method and apparatus for the dynamic node reparation in multi-node environment | |
CN105607698B (en) | A kind of board computer system Design Method | |
CA1176337A (en) | Distributed signal processing system | |
CA1232688A (en) | Reconfigurable dual processor system | |
EP3198725B1 (en) | Programmable ic with safety sub-system | |
CA2032067A1 (en) | Fault-tolerant computer system with online reintegration and shutdown/restart | |
US9195553B2 (en) | Redundant system control method | |
JP5296036B2 (en) | DMI redundancy in multiprocessor computer systems | |
US9104644B2 (en) | Operating method of software fault-tolerant handling system | |
AU2005246990A1 (en) | Fault tolerant computer system and interrupt control method for the same | |
JP5013324B2 (en) | Computer apparatus and BIOS update method thereof | |
RU2569576C1 (en) | Control module | |
US20130117518A1 (en) | System controller, information processing system and method of saving and restoring data in the information processing system | |
US7861115B2 (en) | Multi-component system | |
JP2012128697A (en) | Information processing unit | |
JP6135403B2 (en) | Information processing system and information processing system failure processing method | |
CN111221683A (en) | Double-flash hot backup method, system, terminal and storage medium for data center switch | |
JP2007011639A (en) | Input/output control apparatus, information control apparatus, input/output control method, and information control method | |
CA2022210A1 (en) | Targeted resets in a data processor | |
US10089200B2 (en) | Computer apparatus and computer mechanism | |
RU2533688C1 (en) | Computer system | |
RU2694008C1 (en) | Method for dynamic reconfiguration of computing systems of modular architecture | |
JP2004013723A (en) | Device and method for fault recovery of information processing system adopted cluster configuration using shared memory | |
CN115794498A (en) | Log management method, system, device and storage medium |