RU2589357C2 - Автоматизированное восстановление и передача по инстанции в комплексных распределенных приложениях - Google Patents

Автоматизированное восстановление и передача по инстанции в комплексных распределенных приложениях Download PDF

Info

Publication number
RU2589357C2
RU2589357C2 RU2012144650/08A RU2012144650A RU2589357C2 RU 2589357 C2 RU2589357 C2 RU 2589357C2 RU 2012144650/08 A RU2012144650/08 A RU 2012144650/08A RU 2012144650 A RU2012144650 A RU 2012144650A RU 2589357 C2 RU2589357 C2 RU 2589357C2
Authority
RU
Russia
Prior art keywords
action
recovery
actions
alert
notification
Prior art date
Application number
RU2012144650/08A
Other languages
English (en)
Other versions
RU2012144650A (ru
Inventor
Джон АВНЕР
Шейн БРЭДИ
Винг Мен ИМ
Харуя СИДА
Селим ЯЗИСИОГЛУ
Андрей ЛУКЯНОВ
Брент АЛИНДЖЕР
Колин НЭШ
Original Assignee
МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи filed Critical МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Publication of RU2012144650A publication Critical patent/RU2012144650A/ru
Application granted granted Critical
Publication of RU2589357C2 publication Critical patent/RU2589357C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Alarm Systems (AREA)

Abstract

Изобретение относится к области сред связи с сетевой структурой. Техническим результатом является сопоставление обнаруженных оповещений с действиями по восстановлению для автоматического разрешения проблем в среде связи с сетевой структурой. Оповещения, основанные на обнаруженных аппаратных и/или программных проблемах в среде комплексного распределенного приложения, сопоставляются с действиями по восстановлению для автоматического разрешения проблем. Несопоставленные оповещения передаются по инстанции назначенным людям или группам посредством циклического способа передачи по инстанции, который включает в себя подтверждающее уведомление о передаче обработки от назначенного человека или группы. Информация, собранная для каждого оповещения, как, впрочем, и решения посредством процесса передачи по инстанции, могут записываться для расширения базы знаний автоматизированного разрешения. 3 н. и 17 з.п. ф-лы, 6 ил.

Description

ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ
В сегодняшних средах связи с сетевой структурой множество используемых услуг, которые ранее предоставлялись посредством локально исполняемых приложений, предоставляются посредством распределенных услуг. Например, услуги электронной почты, услуги работы с календарем/планирования и сопоставимые предоставляются посредством комплексных систем с сетевой структурой, которые задействуют некоторое количество физических и виртуальных серверов, средств хранения и прочих компонентов, невзирая на географические расстояния. Даже организационные системы, такие как корпоративные сети, могут быть реализованы посредством физически разобщенных групп серверов и т.д.
Несмотря на то что распределенные услуги создают условия для более простого управления установкой, обновлением и эксплуатацией приложений (т.е. вместо установки, обновления и эксплуатации сотен, если не тысяч, локальных приложений, услуга с централизованным управлением может позаботиться о данных задачах), такие услуги все же задействуют некоторое количество приложений, исполняемых на нескольких серверах. При непрерывном управлении такими приложениями с крупномасштабным распределением можно ожидать появления целого ряда проблем. Регулярно могут происходить сбои аппаратного обеспечения, проблемы программного обеспечения и прочие непредсказуемые затруднения. Попытка осуществления управления и восстановления после таких проблем вручную может потребовать наличия непомерно дорогого количества специализированных и со знаниями в определенной области операционных инженеров.
КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ
Данное краткое описание сущности изобретения предоставлено в качестве ознакомления в упрощенном виде с подборкой концепций, которые дополнительно описаны ниже в Подробном Описании. Данное Краткое Описание Сущности Изобретения, как не предназначено установить ключевые признаки или неотъемлемые признаки изобретения, так и не предназначено использоваться в качестве средства при определении объема заявленного изобретения.
Варианты осуществления направлены на сопоставление обнаруженных оповещений с действиями по восстановлению для автоматического разрешения проблем в среде связи с сетевой структурой. Несопоставленные оповещения могут передаваться назначенным людям посредством циклического способа передачи по инстанции (эскалации), который включает в себя подтверждающее уведомление о передаче обработки от назначенного человека. В соответствии с некоторыми вариантами осуществления информация, собранная для каждого оповещения, как, впрочем, и решения посредством процесса передачи по инстанции, могут записываться для расширения базы знаний автоматизированного разрешения.
Эти и прочие признаки и преимущества станут очевидны из прочтения нижеследующего подробного описания и рассмотрения связанных с ним чертежей. Должно быть понятно, что предшествующее общее описание и последующее подробное описание служат в качестве объяснения и не ограничивают аспекты в соответствии с тем, что заявлено.
ПЕРЕЧЕНЬ ЧЕРТЕЖЕЙ
Фиг.1 является концептуальной схемой, иллюстрирующей пример среды, в которой обнаружение оповещения может приводить к действию по ремонту или передаче по инстанции оповещения.
Фиг.2 является блок-схемой, иллюстрирующей действия во время передачи по инстанции оповещения.
Фиг.3 является другой концептуальной схемой, иллюстрирующей управление оповещениями в многозонной среде.
Фиг.4 является средой с сетевой структурой, в которой может быть реализована система в соответствии с вариантами осуществления.
Фиг.5 является структурной схемой характерной вычислительной операционной среды, в которой могут быть реализованы варианты осуществления; и
фиг.6 иллюстрирует логическую блок-схему автоматизированного управления оповещениями в среде связи с сетевой структурой в соответствии с вариантами осуществления.
ПОДРОБНОЕ ОПИСАНИЕ
Как кратко описано выше, оповещения в системе с сетевой структурой могут управляться посредством автоматизированного процесса выполнения действий/передачи по инстанции, который использует действия, сопоставленные с оповещениями, и/или передачу по инстанции для разрешения вручную, расширяя при этом базу знаний для части автоматизированных действий и предоставляя собранную информацию назначенным людям, перед которыми поставлена задача решения проблем. В нижеследующем подробном описании делаются ссылки на сопроводительные чертежи, которые составляют его часть и в которых, в качестве иллюстраций, показаны конкретные варианты осуществления или примеры. Эти аспекты могут объединяться, могут использоваться прочие аспекты и могут быть выполнены структурные изменения, не отступая от сущности и объема настоящего раскрытия. Вследствие этого нижеследующее подробное описание не должно рассматриваться как ограничивающее, а объем настоящего изобретения определяется прилагаемой формулой изобретения и ее эквивалентами.
Несмотря на то что варианты осуществления будут описаны в общем контексте программных модулей, которые исполняются совместно с прикладной программой, которая работает в операционной системе на персональном компьютере, специалист в данной области техники должен понимать, что аспекты также могут быть реализованы в сочетании с прочими программными модулями.
Как правило, программные модули включают в себя процедуры, программы, компоненты, структуры данных и структуры прочих типов, которые выполняют конкретные задачи или реализуют конкретные абстрактные типы данных. Более того, специалисту в соответствующей области будет понятно, что варианты осуществления могут быть воплощены на практике при помощи других конфигураций компьютерной системы, включающих в себя переносные устройства, многопроцессорные системы, программируемую или основанную на микропроцессоре потребительскую электронику, мини-компьютеры, компьютеры класса мэйнфрейм и сопоставимые вычислительные устройства. Варианты осуществления также могут быть воплощены на практике в распределенных вычислительных средах, в которых задачи выполняются удаленными устройствами обработки, которые соединены посредством сети связи. В распределенной вычислительной среде программные модули могут размещаться как на локальных, так и удаленных запоминающих устройствах памяти.
Варианты осуществления могут быть реализованы в качестве реализуемого компьютером процесса (способа), вычислительной системы или в качестве изделия, такого как компьютерный программный продукт или машиночитаемый носитель информации. Компьютерный программный продукт может быть компьютерным носителем данных, который читается компьютерной системой и на котором закодирована компьютерная программа, которая содержит инструкции, предписывающие компьютеру или компьютерной системе выполнить характерный процесс(ы). Машиночитаемый носитель данных может быть реализован посредством, например, одного или более из: временной компьютерной памяти, постоянной памяти, накопителя на жестком диске, флэш-накопителя, гибкого диска или компакт-диска и сопоставимого носителя информации. Компьютерный программный продукт также может быть транслируемым по несущей сигналом (например, сигналом с частотной или фазовой модуляцией) или носителем информации, читаемым вычислительной системой, и с закодированной компьютерной программой, состоящей из инструкций для выполнения компьютерного процесса.
На всем протяжении данного описания делаются ссылки на услуги. Используемое здесь понятие услуги описывает любое сетевое/онлайн приложение(я), которое может принимать оповещение в рамках своего обычного функционирования и обрабатывать/сохранять/переадресовывать данную информацию. Такое приложение(ия) может исполняться на одном вычислительном устройстве, нескольких вычислительных устройствах распределенным образом и т.д. Варианты осуществления также могут быть реализованы на размещенной услуге, исполняемой посредством множества серверов или сопоставимых систем. Понятие «сервер» в целом относится к вычислительному устройству, исполняющему одну или более программ собственно программного обеспечения, как правило, в среде с сетевой структурой. Тем не менее, сервер также может быть реализован в качестве виртуального сервера (программного обеспечения), выполняемого на одном или более вычислительных устройствах, рассматриваемых в сети как сервер. Подробности этих технологий и примеры функционирования представлены ниже.
Обращаясь к фиг.1, концептуальная схема 100 иллюстрирует пример среды, в которой обнаружение оповещения может приводить к действию по ремонту или передаче по инстанции оповещения. Как кратко упомянуто ранее, варианты осуществления принимают меры в отношении комплексности услуг технической поддержки посредством автоматизации действий по ремонту и передачи по инстанции оповещений. Например, в распределенной системе услуг технической поддержки машина 103 отслеживания может отправить оповещение 113 машине 102 автоматизации при обнаружении в распределенной системе аппаратной, программной или сочетания аппаратно/программной проблемы. Машина 102 автоматизации может попытаться сопоставить оповещение 113 с действием 112 по ремонту. Если машина 102 автоматизации успешно сопоставляет оповещение 113 с действием 112 по ремонту, то затем машина 102 автоматизации может выполнить действие 112 по ремонту, которое может включать в себя набор инструкций, направленных на разрешение обнаруженной проблемы.
Проблема может быть связана с одним или более устройствами 104 в местоположении 105 географически распределенной услуги. Устройства могут включать в себя любое вычислительное устройство, такое как настольный компьютер, сервер, интеллектуальный телефон, компьютер класса лэптоп и сопоставимые устройства. Устройства 104 могут в дальнейшем включать в себя дополнительные устройства с удаленным доступом, такие как мониторы, аудиооборудование, телевизоры, устройства захвата видео и аналогичные устройства.
Оповещение 113 может включать в себя информацию о состоянии устройства или программы, связанной с обнаруженной проблемой, такую как содержимое памяти устройства, данные сенсоров, последние выполненные инструкции и прочее. Оповещение 113 может дополнительно включать в себя описание проблемы, такое как: при выполнении какой инструкции произошел сбой, исполнение каких инструкций выдает результаты, выходящие за заранее определенные пределы, и аналогичные.
Машина 102 автоматизации может пытаться сопоставить оповещение 113 с действием 112 по ремонту посредством выполнения поиска по базе 114 данных решения проблем. База 114 данных решения проблем может хранить профили оповещений, соотнесенные с действиями по ремонту с дальнейшей классификацией по устройствам или программному обеспечению. Характерным вариантом реализации может быть оповещение устройства связи об «отсутствии соединения», соотнесенное с действием по ремонту, которое заключается в перезапуске сетевого интерфейса устройства связи. Каждое оповещение может быть сопоставлено с одним или более действиями по ремонту. Кроме того, с единым действием по ремонту могут быть сопоставлены одно или более оповещений.
Если машина 102 автоматизации определяет для оповещения нескольких действий по ремонту, то приоритет выполнения может зависеть от заранее определенного приоритета действий по ремонту. Например, в рассматриваемом выше сценарии первичным действием по ремонту может быть перезапуск сетевого интерфейса, за которым следует вторичное действие по ремонту, которое заключается в перезагрузке устройства связи. Заранее определенный приоритет действий по ремонту может вручную вводиться в базу 114 данных решения проблем или определяться автоматически, исходя из схемы оценки успешности действия по ремонту при успешном решении проблемы.
В соответствии с некоторыми вариантами осуществления действие 112 по ремонту может включать в себя сбор дополнительной диагностической информации от устройства и/или программного обеспечения, связанного с проблемой. В соответствии с другими вариантами осуществления дополнительная диагностическая информация может передаваться машине отслеживания в качестве оповещения, повторно запускающего автоматизированный цикл. В ответ на оповещение дополнительная диагностическая информация также может собираться и сохраняться в системе. Сохраненная информация может использоваться для выявления состояния проблемы и обеспечения контекста при передаче по инстанции оповещения назначенному человеку или группе (например, 101).
Если в базе 114 данных решения проблем машиной 102 автоматизации не найдено сопоставленного действия по ремонту, то оповещение 113 может передаваться по инстанции назначенному человеку или группе 101. Назначенный человек или группа 101 могут уведомляться даже в том случае, если сопоставленное действие найдено и выполнено, в целях информирования. Передача оповещения 113 назначенному человеку или группе 101 может определяться из соглашения об именах оповещения 113. Соглашение об именах оповещений может указывать, какой категории персонала поддержки должно передаваться по инстанции оповещение, из таких групп, как: группа поддержки аппаратного обеспечения, группа поддержки программного обеспечения и сопоставимые единицы. Схема соглашения об именах также может использоваться для сопоставления оповещений с действиями по ремонту. Например, имена оповещениям могут быть заданы в иерархическом виде (т.е. система/компонент/имя оповещения), а действия по восстановлению могут сопоставляться с любым из: от всех оповещений для системы (система/*) до специальных действий по восстановлению для конкретного оповещения. В соответствии с некоторыми вариантами осуществления каждое конкретное оповещение может иметь связанную с ним назначенную группу, несмотря на то, что эта группа может по умолчанию быть назначена конкретному значению для всего компонента. Определение того, кому из членов группы должно быть отправлено оповещение, может зависеть от заранее определенного алгоритма сопоставления, который размещается в машине автоматизации для обеспечения осведомленности о графиках групп поддержки. Заранее определенный алгоритм сопоставления может обновляться вручную или автоматически посредством встроенных или внешних систем планирования.
Машина 102 автоматизации может передавать по инстанции оповещение 113 первому назначенному человеку или группе по электронной почте, в виде мгновенного сообщения, текстового сообщения, поискового вызова, голосовой почты или аналогичных средств. Оповещения могут сопоставляться с именами групп, а имена групп могут быть сопоставлены с группами людей, которые дежурят в течение заранее определенных интервалов (например, одного дня, одной недели и т.д.). Часть сопоставления может использоваться для идентификации того, какие люди дежурят в течение заранее заданного интервала. Таким образом, сопоставления оповещений могут быть отделены от отдельных членов группы, состав которых может быть нестабильным. Затем машина 102 автоматизации может ожидать уведомления о передаче обработки от первого назначенного человека или группы. Уведомление о передаче обработки может приниматься машиной 120 автоматизации аналогично тому, каким образом было отправлено оповещение, или оно может приниматься с помощью других средств. Если машина 102 автоматизации не приняла уведомления о передаче обработки в течение заранее определенного времени, то она может выполнить передачу по инстанции оповещения 113 следующему в ротации назначенному человеку или группе в соответствии с тем, как определено заранее определенным алгоритмом сопоставления. Алгоритм автоматизации может продолжать выполнять передачу по инстанции оповещения следующим в ротации назначенным людям или группам до тех пор, пока он не примет уведомления о передаче обработки.
Машина 103 отслеживания может принять ответ обратной связи (например, в виде действия) от устройства или программного обеспечения, после исполнения действия 112 по ремонту, пропуская ответ к машине 102 автоматизации. Затем машина 102 автоматизации может обновить базу 114 данных решения проблем. Статистическая информация, такая как коэффициент успешных попыток для действий по ремонту, может использоваться при изменении приоритета выполнения действий по ремонту. Более того, ответ обратной связи, связанный с действиями, выполненными назначенным человеком или группой, также может записываться в базу 114 данных решения проблем, и таким образом может использоваться алгоритм машинного обучения или аналогичный механизм для: расширения списка действий; сопоставления новых оповещений с существующими действиями; сопоставления существующих оповещений с новыми действиями и т.д. В соответствии с некоторыми вариантами осуществления может выполняться проверка действий машины автоматизации и действий назначенных людей. Система может сохранять регистрационную информацию касаемо того, кто выполнил конкретное действие, когда и в отношении какого устройства или сервера. Затем записи могут использоваться для: устранения проблем, отслеживания изменений в системе и/или разработки новых автоматизированных ответов на оповещение.
В соответствии с дополнительными вариантами осуществления машина 102 автоматизации может выполнить поиск с открытым условием по базе 114 данных решения проблем и определять несколько действий по ремонту в ответ на принятое оповещение. Исполнение одного или группы действий по ремонту может зависеть от заранее определенного приоритета действий по ремонту. С группами оповещений также могут быть сопоставлены группы действий по ремонту. Несмотря на то что оповещение может соотноситься с несколькими сопоставлениями с открытым условием, фактически может применяться наиболее конкретное сопоставление. Например, оповещение обмен/транспортировка/очередность может соотноситься с сопоставлением обмен/*, обмен/транспортировка/* и обмен/транспортировка/очередность. Тем не менее, фактически последнее может быть истинным сопоставлением, так как оно является наиболее конкретным.
Фиг.2 иллюстрирует на схеме 200 действия во время передачи по инстанции оповещения. Машина 202 отслеживания может предоставить (211) обнаруженную проблему в качестве оповещения машине 204 автоматизации. Машина 204 автоматизации может проверить (212) имеющиеся в наличии действия в хранилище 206 действий (базе 114 данных решения проблем на фиг.1) и выполнить (213) действие, если такое имеется в наличии. Если действий в наличии нет, то машина 204 автоматизации может передать (214) по инстанции оповещение владельцу 208 процесса. Оповещение в дальнейшем может быть передано (215) по инстанции другому назначенному лицу 209. Как рассматривалось ранее, передача по инстанции также может выполняться параллельно выполнению определенного действия.
По приему (216, 217) от владельца 208 процесса или другого назначенного лица 209 нового действия, которое должно быть выполнено, машина 204 автоматизации может выполнить (218) новое действие и для дальнейшего использования обновить (219) записи при помощи нового действия. Характерные взаимодействия на схеме 200 иллюстрируют ограниченный сценарий. В функционирование системы автоматизированного восстановления и передачи по инстанции в соответствии с вариантами осуществления также могут быть включены прочие взаимодействия, такие как передача обработки между назначенными людьми, обратная связь от устройств/программного обеспечения, сообщающих о проблеме, и аналогичные взаимодействия.
Фиг.3 является концептуальной схемой, иллюстрирующей на схеме 300 управление оповещением в многозонной среде. В распределенной системе передача по инстанции оповещений может зависеть от заранее определенного приоритета географических зон. Например, заранее определенный приоритет может передавать по инстанции оповещение из зоны, время суток которой соответствует дневному времени, и удерживать оповещение из зоны, время суток которой соответствует ночному времени, когда передачи по инстанции управляются одной группой поддержки для обеих зон. Аналогичным образом, исходя из заранее определенного приоритета, может отдаваться предпочтение действиям по ремонту из разных зон, когда действия по ремонту из разных зон участвуют в праве на решение обнаруженных проблем для одного и того же аппаратного обеспечения, программного обеспечения, ресурсов связи.
Схема 300 иллюстрирует то, каким образом система может реагировать на оповещения из разных зон в соответствии с вариантами осуществления. В соответствии с характерным сценарием машины 303, 313 и 323 отслеживания могут отвечать за отслеживание аппаратных и/или программных проблем в зонах 1, 2 и 3 (304, 314 и 324) соответственно. При обнаружении проблемы каждая из машин отслеживания может передавать оповещения соответствующим машинам 302, 312 и 322 автоматизации, которые могут отвечать за соответствующие зоны. Логика машин автоматизации может распространяться на каждую зону аналогично тому, как распространяется логика отслеживания. В соответствии с некоторыми вариантами осуществления автоматизация может осуществляться между зонами как отслеживание сбоев и восстановление на всей территории. В соответствии с другими вариантами осуществления, машина автоматизации может отвечать за несколько зон. Аналогично цель передачи по инстанции также может быть централизованной или распределенной. Например, система может осуществлять передачу по инстанции разным группам, исходя из времени суток. Машины 303, 313 и 323 отслеживания могут иметь свои собственные отдельные зональные базы данных для управления процессами отслеживания. Машины 302, 312 и 322 автоматизации могут запрашивать базу данных решения проблем (централизованную или распределенную) для сопоставления оповещений с действиями по ремонту.
Если найдено соответствующее действие(я) по ремонту, то машины 302, 312 и 322 автоматизации могут выполнить действие(я) по ремонту на устройствах и/или программах в зонах 304, 314 и 324. Для всех зон также может быть реализована глобальная база 310 данных отслеживания. Если машины 302, 312 и 322 автоматизации не могут найти соотносящиеся действия по ремонту, они могут передать по инстанции оповещения назначенной группе 301 поддержки, исходя из заранее определенных зональных приоритетов, как, например, исходя из организационной структуры. Например, зона 304 может быть сетью акционерного предприятия для организации бизнеса, в то время как зона 324 является сетью обеспечения документооборота. Проблема, обнаруженная в зоне 304, в данном сценарии может иметь более высокий приоритет, чем проблема, обнаруженная в зоне 324. Аналогичным образом при определении зональных приоритетов может учитываться различие во времени суток или рабочих/выходных днях между разными зонами.
В соответствии с некоторыми вариантами осуществления несколько машин автоматизации могут быть назначены разным зонам, и приоритеты передачи по инстанции и/или выполнения действия по ремонту выбираются при помощи алгоритма согласования между машинами автоматизации, как упомянуто выше. В качестве альтернативы решения о приоритетах могут быть получены в ходе процесса наблюдения за зональными машинами автоматизации. Кроме того, машины 302, 312 и 322 автоматизации могут взаимодействовать с зональными базами данных решения проблем, которые включают в себя заданные сопоставления ′действие по ремонту - оповещение′ для разных зон.
Несмотря на то что автоматизация процессов восстановления и передачи по инстанции в распределенных системах были рассмотрены выше, используя характерные сценарии, выполнение конкретных действий по ремонту и передачи по инстанции оповещений совместно с фиг.1, 2 и 3, варианты осуществления этим не ограничиваются. Сопоставление оповещений с действиями по ремонту, задание приоритетов действиям по ремонту, передача по инстанции оповещений и прочие процессы могут быть реализованы, используя прочие операции, приоритеты, оценки и т.д., используя рассмотренные здесь принципы.
Фиг.4 является характерной средой с сетевой структурой, в которой могут быть реализованы варианты осуществления. Сопоставление оповещения с действием по ремонту может быть реализовано через программное обеспечение, выполняемое на одном или более серверах 422, таких как размещенный сервер. Сервер 422 может осуществлять связь с клиентскими приложениями на отдельных вычислительных устройствах, таких как сотовый телефон 411, мобильное вычислительное устройство 412, интеллектуальный телефон 413, компьютер 414 класса лэптоп и настольный компьютер 415 (клиентские устройства) по сети(ям) 410. Клиентские приложения на клиентских устройствах 411-415 могут способствовать взаимодействиям пользователя с услугой, выполняемой на сервере(ах) 422, позволяя осуществлять автоматизированное управление разрешением программных и/или аппаратных проблем, связанных с услугой. Машина(ы) автоматизации и отслеживания может выполняться на любом из серверов 422.
Данные, связанные с операциями, такими как сопоставление оповещения с действием по ремонту, могут храниться в одном или более хранилище данных (например, хранилище 425 или 426 данных), которые могут управляться любым сервером(ами) 422 или сервером 424 базы данных. Автоматизация восстановления и передачи по инстанции обнаруженных проблем в соответствии с вариантами осуществления может инициироваться при обнаружении машиной отслеживания оповещения, как рассматривалось в приведенных выше примерах.
Сеть(и) 410 может быть выполнена в соответствии с любой топологией серверов, клиентов, поставщиков услуги Интернет и средств связи. Система в соответствии с вариантами осуществления может обладать статичной или динамической топологией. Сеть(и) 410 может включать в себя защищенную сеть, такую как корпоративная сеть, незащищенную сеть, такую как беспроводная открытая сеть или Интернет. Сеть(и) 410 обеспечивает связь между описанными здесь узлами. В качестве примера, а не ограничения, сеть(и) 410 может включать в себя беспроводные среды связи, такие как акустические, радиочастотные (RF), инфракрасные или другие беспроводные среды связи.
Для реализации системы автоматизации управления разрешением проблем распределенной системы в соответствии с вариантами осуществления может использоваться множество других конфигураций вычислительных устройств, приложений, источников данных и систем распределения данных. Кроме того, среды с сетевой структурой, рассмотренные на фиг.4, представлены исключительно в целях иллюстрации.
Фиг.5 и связанное с ней рассмотрение предназначены для того, чтобы предоставить краткое, общее описание приемлемой вычислительной среды, в которой могут быть реализованы варианты осуществления. Со ссылкой на фиг.5 проиллюстрирована структурная схема характерной вычислительной операционной среды, такой как вычислительное устройство 500, для приложения услуги в соответствии с вариантами осуществления. В базовой конфигурации вычислительное устройство 500 может быть сервером в системе размещенной услуги и включает в себя, по меньшей мере, один модуль 502 обработки и системную память 504. Вычислительное устройство 500 также может включать в себя множество модулей обработки, которые работают совместно при выполнении программ. В зависимости от конкретной конфигурации и типа вычислительного устройства системная память 504 может быть временной (такой как RAM), постоянной (такой как ROM, флэш-память и т.д.) или неким сочетанием двух вариантов. Системная память 504, как правило, включает в себя операционную систему 505, приемлемую для управления функционированием платформы, такую как операционная система WINDOWS® от MICROSOFT CORPORATION из Редмонда, штат Вашингтон. Системная память 504 также может включать в себя один или более программные модули 506, машину 522 автоматизации и машину 524 отслеживания.
Машины 522 и 524 автоматизации и отслеживания могут быть отдельными приложениями или неотъемлемыми модулями размещенной услуги, которая обрабатывает оповещения системы в соответствии с тем, что рассмотрено выше. Базовая конфигурация проиллюстрирована на фиг.5 компонентами, заключенными внутри пунктирной линии 508.
Вычислительное устройство 500 может иметь дополнительные свойства или функциональные возможности. Например, вычислительное устройство 500 также может включать в себя дополнительные устройства хранения данных (съемные и/или несъемные), такие как, например, магнитные диски, оптические диски или лента. Такие дополнительные запоминающие устройства проиллюстрированы на фиг.5 с помощью съемного запоминающего устройства 509 и несъемного запоминающего устройства 510. Машиночитаемый носитель данных может включать в себя временный или постоянный, съемный или несъемный носитель информации, реализованный любым способом или по любой технологии для хранения информации, такой как машиночитаемые инструкции, структуры данных, программные модули или прочие данные. Системная память 504, съемное запоминающее устройство 509 и несъемное запоминающее устройство 510, все перечисленные компоненты являются примерами машиночитаемого носителя данных. Машиночитаемый носитель данных включает в себя, но не ограничивается, RAM, ROM, EEPROM, флэш-память или другую технологию памяти, CD-ROM, цифровые универсальные диски (DVD) или оптические запоминающие устройства, магнитные кассеты, магнитную ленту, запоминающее устройство на магнитных дисках или прочие магнитные запоминающие устройства или любой другой носитель информации, который может использоваться для хранения требуемой информации и доступ к которому может быть получен вычислительным устройством 500. Любой такой машиночитаемый носитель данных может быть частью вычислительного устройства 500. Вычислительное устройство 500 также может иметь устройство(а) 512 ввода, такие как клавиатура, манипулятор типа мышь, электронное перо, устройство голосового ввода, устройство сенсорного ввода и сопоставимые устройства ввода. Также может быть включено устройство(а) 514 вывода, такое как дисплей, громкоговоритель, принтер и прочие типы устройств вывода. Эти устройства хорошо известны в соответствующей области техники и не требуют здесь подробного рассмотрения.
Вычислительное устройство 500 также может содержать соединения 516 связи, которые позволяют устройству осуществлять связь с прочими устройствами 518, как по беспроводной сети в распределенной вычислительно среде, спутниковой линии связи, сотовой линии связи и посредством сопоставимых механизмов. Прочие устройства 518 могут включать в себя компьютерное устройство(а), которое выполняет распределенные приложения и выполняет сопоставимые операции. Соединение(я) 516 связи является одним примером сред связи. Среды связи в данном случае могут включать в себя машиночитаемые инструкции, структуры данных, программные модули и прочие данные в модулированном сигнале данных, таком как несущая волна или в соответствии с иным механизмом транспортировки, и включают в себя среды доставки информации. Понятие «модулированный сигнал данных» означает сигнал, который обладает одной или более из своих характеристик, устанавливаемых или изменяемых таким образом, чтобы закодировать в сигнале информацию. В качестве примера, а не ограничения среды связи включают в себя проводные среды, такие как проводная сеть или непосредственное проводное соединение, и беспроводные среды, такие как акустические, RF, инфракрасные и прочие беспроводные среды.
Характерные варианты осуществления также включают в себя способы. Эти способы могут быть реализованы любым многообразием вариантов, включая структуры, описанные в данном документе. Одним таким вариантом могут быть машинные операции устройств типов, соответствующих описанным в данном документе.
Другим опциональным вариантом является то, что одна или более отдельных операций способов выполняются совместно с одним или более операторами-людьми, выполняющими часть операции. Не требуется, чтобы эти операторы-люди находились рядом друг с другом, но каждый должен находиться с машиной, которая выполняет часть программы.
Фиг.6 иллюстрирует логическую блок-схему 600 автоматизации управления восстановлением и передачи по инстанции проблем в распределенных системах в соответствии с вариантами осуществления. Процесс 600 может быть реализован на сервере как часть размещенной услуги или на клиентском приложении для взаимодействия с услугой так, как описано ранее.
Процесс 600 начинается с операции 602, на которой машина автоматизации обнаруживает оповещение, отправленное машиной отслеживания в ответ на проблему устройства и/или приложения программного обеспечения внутри системы. На операции 604 машина автоматизации, обладая принятым от машины отслеживания оповещением, может начать сбор информации, связанной с оповещением. Это может сопровождаться попыткой на операции 606 сопоставить оповещение с одним или более действиями по ремонту.
Если на операции 608 принятия решения найдено явное действие, сопоставленное с оповещением, то действие (или действия) может быть выполнено на последующей операции 610. Если в процессе сопоставления не определено явного действия, то на операции 614 оповещение может передаваться по инстанции к назначенному человеку или группе. Операция 614 может сопровождаться опциональными операциями 616 и 618, на которых может быть принято и выполнено новое действие от назначенного человека или группы. На операции 612 при помощи выполненного действия (сопоставленного или нового) могут обновляться записи, и таким образом может расширяться база данных сопоставления или для последующих задач отслеживания и автоматизированного ответа может использоваться статистическая информация, связанная с коэффициентами успешных попыток.
Операции, включенные в процесс 600, представлены в целях иллюстрации. Автоматизация восстановления и передача по инстанции проблем в комплексных распределенных приложениях может быть реализована аналогичными процессами с меньшим числом или с дополнительными этапами, как, впрочем, и в другой очередности операций, используя описанные здесь принципы.
Приведенное выше описание, примеры и данные обеспечивают полное описание изготовления и использования конструкции согласно вариантам осуществления изобретения. Несмотря на то что изобретение было описано языком, присущим структурным признакам и/или методологическим действиям, должно быть понятно, что объем изобретения, определенный в прилагаемой формуле изобретения, не обязательно ограничивается описанными выше конкретными признаками и действиями. Наоборот, описанные выше конкретные признаки и действия раскрыты в качестве характерных форм реализации формулы изобретения и вариантов осуществления.

Claims (20)

1. Способ, выполняемый, по меньшей мере частично, в вычислительном устройстве, для автоматизированного восстановления и передачи по инстанции оповещений в распределенных системах, при этом способ содержит этапы, на которых:
принимают от машины отслеживания оповещение, связанное с обнаруженной проблемой;
выполняют поиск с открытым условием по хранилищу действий для определения действий по восстановлению, сопоставленных с этим оповещением;
осуществляют попытку сопоставить данное оповещение с одним из действий по восстановлению путем применения действия по восстановлению, имеющего специфику, связанную с упомянутым оповещением;
обновляют планы множества назначенных лиц, связанных с упомянутым оповещением, из по меньшей мере одной из встроенной и внешней систем планирования;
определяют назначенное лицо из упомянутого их множества для отправки упомянутого оповещения на основе обновленного плана этого назначенного лица, идентифицируя данное назначенное лицо как дежурное;
если упомянутое оповещение сопоставлено с упомянутым действием по восстановлению из хранилища действий, то выполняют это действие по восстановлению в соответствии с заранее определенным приоритетом действий по восстановлению;
в противном случае, передают по инстанции упомянутое оповещение упомянутому назначенному лицу для выполнения нового действия; и
обновляют этим новым действием записи, связанные с сопоставлением оповещений с действиями по восстановлению, и сохраняют регистрационную информацию о назначенном лице, которое выполнило упомянутое новое действие, времени, когда данное новое действие было выполнено, и устройстве или сервере, на котором это новое действие было выполнено.
2. Способ по п. 1, дополнительно содержащий этапы, на которых:
собирают диагностическую информацию, связанную с обнаруженной проблемой;
предоставляют собранную диагностическую информацию упомянутому назначенному лицу, если упомянутое оповещение передается по инстанции; и
используют собранную диагностическую информацию при обновлении записей.
3. Способ по п. 2, в котором собранная диагностическая информация включает в себя по меньшей мере одно из набора, включающего в себя: содержимое памяти устройства, данные, считанные сенсорами, последние исполненные инструкции, инструкции, при исполнении которых произошел сбой, и результаты сбоя, связанные с обнаруженной проблемой.
4. Способ по п. 1, дополнительно содержащий этапы, на которых:
ожидают ответа передачи обработки от упомянутого назначенного лица после передачи по инстанции упомянутого оповещения; и
если ответ передачи обработки не принят в течение заранее определенного периода, то передают по инстанции данное оповещение другому назначенному лицу.
5. Способ по п. 1, в котором назначенное лицо определяется по одному из заранее определенного списка назначенных лиц и соглашения об именах, связанного с упомянутым оповещением, при этом назначенное лицо включает в себя одно из человека и группы.
6. Способ по п. 1, в котором член группы для приема упомянутого оповещения определяется среди назначенной группы на основе одного из алгоритма ротации и информации планирования для назначенной группы.
7. Способ по п. 1, в котором действие по восстановлению выбирается из множества действий по восстановлению, которые являются одним из заранее определенных и автоматически генерируемых на основе схемы оценки успешности действия.
8. Способ по п. 1, в котором при упомянутой передаче по инстанции оповещения упомянутое оповещение передают упомянутому назначенному лицу посредством по меньшей мере одного из набора, включающего в себя электронную почту, мгновенное сообщение, текстовое сообщение, поисковый вызов и голосовую почту.
9. Способ по п. 1, дополнительно содержащий этапы, на которых:
собирают дополнительную диагностическую информацию, связанную с обнаруженной проблемой; и
осуществляют повторную попытку сопоставить упомянутое оповещение с действием по восстановлению на основе этой дополнительной диагностической информации.
10. Способ по п. 1, дополнительно содержащий этапы, на которых:
принимают действие обратной связи от одного из устройства и программы, связанных с обнаруженной проблемой, после выполнения действия по восстановлению; и
обновляют запись коэффициента успешных попыток, связанную с действием по восстановлению.
11. Система для автоматизированного восстановления и передачи по инстанции оповещений в распределенных системах, содержащая:
сервер, исполняющий машину отслеживания и машину автоматизации, при этом машина отслеживания выполнена с возможностью:
отслеживать процессы, связанные с по меньшей мере одним из устройства и приложения программного обеспечения распределенной системы в отдельной зональной базе данных, ассоциированной с множеством разных географических зон,
обнаруживать проблему, связанную с по меньшей мере одним из устройства и приложения программного обеспечения, в пределах отдельной географической зоны распределенной системы, и
передавать оповещение, исходя из обнаруженной проблемы; и
машина автоматизации выполнена с возможностью:
принимать это оповещение,
собирать диагностическую информацию, связанную с обнаруженной проблемой,
выполнять попытку сопоставить оповещение с действием по восстановлению, используя базу данных действий по восстановлению,
взаимодействовать с зональной базой данных решения проблем, включающей в себя заданные действия по ремонту, для сопоставления оповещения с одним из заданных действий по ремонту, чтобы задать действие по восстановлению,
если оповещение сопоставлено с действием по восстановлению, выполнять действие по восстановлению, иначе
передавать по инстанции оповещение назначенному лицу, совместно с собранной диагностической информацией, для выполнения нового действия,
обновлять записи в базе данных действий по восстановлению, чтобы сохранить регистрационную информацию о назначенном лице, которое выполнило упомянутое новое действие, времени, когда данное новое действие было выполнено, и устройстве или сервере, на котором это новое действие было выполнено, и
использовать алгоритм обучения для расширения списка действий, в котором находится упомянутое действие по восстановлению, в базе данных действий по восстановлению, чтобы сопоставить новые оповещения с существующими действиями в этом списке действий и чтобы сопоставить новое оповещение с упомянутым новым действием.
12. Система по п. 11, дополнительно содержащая множество машин отслеживания, причем каждая машина отслеживания выполнена с возможностью отслеживать каждую отдельную географическую зону, исходя из масштаба системы для каждой географической зоны внутри распределенной системы, и передавать оповещения, исходя из проблем, обнаруженных в их соответствующих зонах, при этом машина автоматизации дополнительно выполнена с возможностью либо выполнять сопоставленное действие по восстановлению, либо осуществлять передачу по инстанции к назначенному лицу, применительно к оповещениям из разных зон, исходя из зонального приоритета.
13. Система по п. 12, в которой зональный приоритет включает в себя по меньшей мере одно из набора, включающего в себя заранее определенный приоритет, время суток, рабочий день, выходной день и организационную структуру, ассоциированную с каждой зоной.
14. Система по п. 13, в которой зональный приоритет дополнительно определяется на основе наличия по меньшей мере одного из набора, включающего в себя назначенную группу поддержки, ресурс аппаратного обеспечения, ресурс программного обеспечения и ресурс связи.
15. Система по п. 11, в которой оповещение сопоставляется с множеством действий по восстановлению и действия по восстановлению выполняются в соответствии с заранее определенным приоритетом выполнения.
16. Система по п. 15, в которой приоритет выполнения корректируется на основе записанного показателя успешности действий по восстановлению.
17. Система по п. 11, в которой устройство включает в себя одно из настольного компьютера, компьютера класса лэптоп, переносного компьютера, сервера, интеллектуального телефона, монитора, аудиооборудования, телевизора и устройства захвата видео.
18. Способ, выполняемый, по меньшей мере частично, в вычислительном устройстве, для автоматизированного восстановления и передачи по инстанции оповещений в распределенных системах, при этом способ содержит этапы, на которых:
обнаруживают в машине отслеживания проблему, связанную с по меньшей мере одним из устройства и приложения программного обеспечения, внутри распределенной системы;
передают из машины отслеживания оповещение, исходя из обнаруженной проблемы;
принимают это оповещение в машине автоматизации из множества машин автоматизации, причем каждая машина автоматизации приписана к отличающейся от других географической зоне;
собирают диагностическую информацию, связанную с обнаруженной проблемой;
выполняют поиск с открытым условием по хранилищу действий для определения действий по восстановлению, сопоставленных с данным оповещением;
осуществляют попытку сопоставить упомянутое оповещение с одним из действий по восстановлению из базы данных действий по восстановлению путем применения действия по восстановлению, имеющего специфику, связанную с этим оповещением, при этом действие по восстановлению включает в себя набор инструкций, направленных на решение обнаруженной проблемы;
взаимодействуют с зональной базой данных решения проблем, включающей в себя заданные действия по ремонту, для сопоставления упомянутого оповещения с одним из заданных действий по ремонту, чтобы задать действие по восстановлению;
обновляют планы множества назначенных лиц, связанных с упомянутым оповещением, из по меньшей мере одной из встроенной и внешней систем планирования;
определяют назначенное лицо из упомянутого их множества для отправки упомянутого оповещения на основе обновленного плана этого назначенного лица, идентифицируя данное назначенное лицо как дежурное;
если упомянутое оповещение сопоставлено с одним действием по восстановлению, выполняют это действие по восстановлению;
если оповещение сопоставлено с множеством действий по восстановлению, выполняют эти действия по восстановлению в одной из упомянутого множества машин автоматизации в соответствии с заранее определенным приоритетом выполнения, причем этот заранее определенный приоритет выполнения описывается посредством алгоритма согласования между этим множеством машин автоматизации;
если оповещение не сопоставлено с действием по восстановлению, передают по инстанции упомянутое оповещение упомянутому назначенному лицу, совместно с собранной диагностической информацией;
принимают ответ передачи обработки от этого назначенного лица;
обновляют записи в базе данных действий по восстановлению, используя собранную диагностическую информацию и ответ обратной связи, связанный с выполненными действиями по восстановлению, чтобы расширить базу данных действий по восстановлению статистической информацией, связанной с показателями успешности, которая будет использоваться для последующих задач отслеживания и автоматизированного ответа; и
используют алгоритм обучения для расширения списка действий, в котором находится упомянутое действие по восстановлению, в базе данных действий по восстановлению, чтобы сопоставить новые оповещения с существующими действиями в этом списке действий и чтобы сопоставить новое оповещение с новым действием.
19. Способ по п. 18, в котором действие по восстановлению сопоставляется с одним из одного оповещения и группы оповещений.
20. Способ по п. 18, в котором назначенное лицо определяется по одному из соглашения об именах, связанного с упомянутым оповещением, и алгоритма ротации, исходя из наличия персонала поддержки.
RU2012144650/08A 2010-04-21 2011-03-30 Автоматизированное восстановление и передача по инстанции в комплексных распределенных приложениях RU2589357C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/764,263 US8823536B2 (en) 2010-04-21 2010-04-21 Automated recovery and escalation in complex distributed applications
US12/764,263 2010-04-21
PCT/US2011/030458 WO2011133299A2 (en) 2010-04-21 2011-03-30 Automated recovery and escalation in complex distributed applications

Publications (2)

Publication Number Publication Date
RU2012144650A RU2012144650A (ru) 2014-04-27
RU2589357C2 true RU2589357C2 (ru) 2016-07-10

Family

ID=44815335

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012144650/08A RU2589357C2 (ru) 2010-04-21 2011-03-30 Автоматизированное восстановление и передача по инстанции в комплексных распределенных приложениях

Country Status (10)

Country Link
US (1) US8823536B2 (ru)
EP (1) EP2561444B1 (ru)
JP (1) JP5882986B2 (ru)
KR (1) KR101824273B1 (ru)
CN (1) CN102859510B (ru)
BR (1) BR112012026917B1 (ru)
ES (1) ES2716029T3 (ru)
HK (1) HK1179724A1 (ru)
RU (1) RU2589357C2 (ru)
WO (1) WO2011133299A2 (ru)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130097272A1 (en) * 2011-10-18 2013-04-18 International Business Machines Corporation Prioritized Alert Delivery In A Distributed Processing System
US9483344B2 (en) * 2012-04-05 2016-11-01 Assurant, Inc. System, method, apparatus, and computer program product for providing mobile device support services
US9413893B2 (en) * 2012-04-05 2016-08-09 Assurant, Inc. System, method, apparatus, and computer program product for providing mobile device support services
KR101426382B1 (ko) 2013-03-29 2014-08-13 케이티하이텔 주식회사 분산 파일 시스템에서 파이프라인을 이용한 자료 복구 방법
US9292402B2 (en) * 2013-04-15 2016-03-22 Century Link Intellectual Property LLC Autonomous service management
US9361184B2 (en) 2013-05-09 2016-06-07 International Business Machines Corporation Selecting during a system shutdown procedure, a restart incident checkpoint of an incident analyzer in a distributed processing system
US9471474B2 (en) * 2013-08-19 2016-10-18 Microsoft Technology Licensing, Llc Cloud deployment infrastructure validation engine
US9602337B2 (en) 2013-09-11 2017-03-21 International Business Machines Corporation Event and alert analysis in a distributed processing system
US9389943B2 (en) 2014-01-07 2016-07-12 International Business Machines Corporation Determining a number of unique incidents in a plurality of incidents for incident processing in a distributed processing system
CN104915219B (zh) * 2014-03-12 2018-11-27 奇点新源国际技术开发(北京)有限公司 单片机程序升级方法及装置
CN104007996B (zh) * 2014-06-16 2016-07-06 南京融教科技有限公司 一种分布式控制***的可靠固件升级实现方法
US9436553B2 (en) * 2014-08-04 2016-09-06 Microsoft Technology Licensing, Llc Recovering usability of cloud based service from system failure
US10108414B2 (en) * 2014-10-09 2018-10-23 International Business Machines Corporation Maintaining the integrity of process conventions within an ALM framework
US10303538B2 (en) 2015-03-16 2019-05-28 Microsoft Technology Licensing, Llc Computing system issue detection and resolution
US9667573B2 (en) * 2015-04-28 2017-05-30 Unisys Corporation Identification of automation candidates using automation degree of implementation metrics
US9686220B2 (en) * 2015-04-28 2017-06-20 Unisys Corporation Debug and verify execution modes for computing systems calculating automation degree of implementation metrics
US10153992B2 (en) * 2015-04-28 2018-12-11 Unisys Corporation Identification of progress towards complete message system integration using automation degree of implementation metrics
US10296717B2 (en) * 2015-05-14 2019-05-21 Salesforce.Com, Inc. Automated prescription workflow for device management
US20170237602A1 (en) * 2016-02-16 2017-08-17 Microsoft Technology Licensing, Llc Computer system monitoring based on entity relationships
US10180869B2 (en) * 2016-02-16 2019-01-15 Microsoft Technology Licensing, Llc Automated ordering of computer system repair
JP6899837B2 (ja) * 2016-03-09 2021-07-07 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited リージョン間にわたるデータ送信
CN108038043B (zh) * 2017-12-22 2021-04-23 郑州云海信息技术有限公司 一种分布式存储集群告警方法、***及设备
US10868711B2 (en) * 2018-04-30 2020-12-15 Splunk Inc. Actionable alert messaging network for automated incident resolution
US10270644B1 (en) * 2018-05-17 2019-04-23 Accenture Global Solutions Limited Framework for intelligent automated operations for network, service and customer experience management
FI128647B (en) 2018-06-29 2020-09-30 Elisa Oyj Automatic monitoring and control of networks
FI129101B (en) * 2018-06-29 2021-07-15 Elisa Oyj Automatic monitoring and control of networks
CN112005221A (zh) * 2018-10-02 2020-11-27 惠普发展公司,有限责任合伙企业 经由跨多个网络与对等设备的通信的自动修复
CN117093434B (zh) * 2023-10-20 2024-01-30 深圳品网科技有限公司 一种用于笔记本电脑的开关机自检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7376969B1 (en) * 2002-12-02 2008-05-20 Arcsight, Inc. Real time monitoring and analysis of events from multiple network security devices
RU2375744C2 (ru) * 2003-10-23 2009-12-10 Майкрософт Корпорейшн Основанное на модели управление компьютерными системами и распределенными приложениями

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0546339B1 (en) * 1991-12-09 1996-07-03 Yokogawa Electric Corporation Distributed control system
JP3449425B2 (ja) * 1993-02-23 2003-09-22 本田技研工業株式会社 コンピュータネットワーク監視支援システム
US5619656A (en) 1994-05-05 1997-04-08 Openservice, Inc. System for uninterruptively displaying only relevant and non-redundant alert message of the highest severity for specific condition associated with group of computers being managed
US6615240B1 (en) 1998-12-18 2003-09-02 Motive Communications, Inc. Technical support chain automation with guided self-help capability and option to escalate to live help
US6918059B1 (en) 1999-04-28 2005-07-12 Universal Music Group Method and system for handling errors in a distributed computer system
US6742141B1 (en) 1999-05-10 2004-05-25 Handsfree Networks, Inc. System for automated problem detection, diagnosis, and resolution in a software driven system
JP2003085003A (ja) * 2001-09-06 2003-03-20 Matsushita Electric Ind Co Ltd 障害復旧援助方法、及び、障害復旧援助システム
US7243124B1 (en) 2002-09-06 2007-07-10 Oracle International Corporation Architecture for general purpose near real-time business intelligence system with client devices and methods therefor
US7137040B2 (en) 2003-02-12 2006-11-14 International Business Machines Corporation Scalable method of continuous monitoring the remotely accessible resources against the node failures for very large clusters
US7089220B2 (en) * 2003-06-24 2006-08-08 Palo Alto Research Center Incorporated Complexity-directed cooperative problem solving
JP4728565B2 (ja) * 2003-07-16 2011-07-20 日本電気株式会社 障害復旧装置および障害復旧方法ならびにプログラム
ES2681522T3 (es) 2004-07-20 2018-09-13 Microsoft Technology Licensing, Llc Procedimiento y sistema para minimizar la pérdida en una aplicación informática
EP1630710B1 (en) 2004-07-21 2019-11-06 Microsoft Technology Licensing, LLC Containment of worms
US20060064481A1 (en) * 2004-09-17 2006-03-23 Anthony Baron Methods for service monitoring and control
JP2006163509A (ja) * 2004-12-02 2006-06-22 Olympus Corp 障害通知システム
US7865888B1 (en) 2004-12-21 2011-01-04 Zenprise, Inc. Systems and methods for gathering deployment state for automated management of software application deployments
JP2007079896A (ja) * 2005-09-14 2007-03-29 Nomura Research Institute Ltd 監視装置及び監視方法
JP2007141007A (ja) * 2005-11-21 2007-06-07 Hitachi Ltd システム運用監視での障害時のサポートシステム化
CN101039498B (zh) * 2007-05-09 2010-06-16 中兴通讯股份有限公司 带有分布式告警处理的基站***及其告警处理方法
US20080281607A1 (en) * 2007-05-13 2008-11-13 System Services, Inc. System, Method and Apparatus for Managing a Technology Infrastructure
US8892719B2 (en) * 2007-08-30 2014-11-18 Alpha Technical Corporation Method and apparatus for monitoring network servers
JP2009099135A (ja) * 2007-09-28 2009-05-07 Fujitsu Ltd 支援管理方法、支援管理システム及び情報処理装置
JP2009087136A (ja) * 2007-10-01 2009-04-23 Nec Corp 障害修復システムおよび障害修復方法
JP4872058B2 (ja) 2008-05-13 2012-02-08 株式会社日立システムズ 自動障害対応システム
US8103909B2 (en) * 2008-09-15 2012-01-24 Juniper Networks, Inc. Automatic hardware-based recovery of a compromised computer
US8074107B2 (en) * 2009-10-26 2011-12-06 Amazon Technologies, Inc. Failover and recovery for replicated data instances

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7376969B1 (en) * 2002-12-02 2008-05-20 Arcsight, Inc. Real time monitoring and analysis of events from multiple network security devices
RU2375744C2 (ru) * 2003-10-23 2009-12-10 Майкрософт Корпорейшн Основанное на модели управление компьютерными системами и распределенными приложениями

Also Published As

Publication number Publication date
JP5882986B2 (ja) 2016-03-09
EP2561444A4 (en) 2017-08-30
US20110260879A1 (en) 2011-10-27
EP2561444B1 (en) 2018-12-19
JP2013527957A (ja) 2013-07-04
ES2716029T3 (es) 2019-06-07
EP2561444A2 (en) 2013-02-27
BR112012026917B1 (pt) 2021-04-20
CN102859510A (zh) 2013-01-02
CN102859510B (zh) 2015-07-15
KR101824273B1 (ko) 2018-01-31
KR20130069580A (ko) 2013-06-26
HK1179724A1 (en) 2013-10-04
BR112012026917A2 (pt) 2016-07-12
WO2011133299A3 (en) 2012-03-01
RU2012144650A (ru) 2014-04-27
US8823536B2 (en) 2014-09-02
WO2011133299A2 (en) 2011-10-27

Similar Documents

Publication Publication Date Title
RU2589357C2 (ru) Автоматизированное восстановление и передача по инстанции в комплексных распределенных приложениях
US11775323B2 (en) Analytics dashboards for critical event management software systems, and related software
Baham et al. An agile methodology for the disaster recovery of information systems under catastrophic scenarios
JP2017062767A (ja) インテリジェントなクラウド計画立案およびデコミッショニングのための方法およびシステム
US10824647B2 (en) Real-time prediction and explanation of sequences of abnormal events
US10684890B2 (en) Network deployment for cellular, backhaul, fiber optic and other network infrastructure
US9639411B2 (en) Impact notification system
US20190286491A1 (en) System and method for analyzing and associating elements of a computer system by shared characteristics
US10372572B1 (en) Prediction model testing framework
US11893548B2 (en) Management of computing devices using employee records
US12034602B2 (en) Management of computing devices via reference to linked employee records
Avanes et al. Adaptive workflow scheduling under resource allocation constraints and network dynamics
Zhu et al. An intelligent collaboration framework of IoT applications based on event logic graph
US11568341B2 (en) Dynamic resource allocation
US11184239B1 (en) Management of computing devices via reference to linked employee records
Liu et al. Dynamic service integration for reliable and sustainable capability provision
US9588861B2 (en) Method and apparatus for automatically identifying components to monitor in an enterprise environment
US20230342694A1 (en) System and method for providing resilient enterprise operation and management
JP2005276068A (ja) 運用管理通知支援システム、運用管理通知支援方法、運用管理通知支援プログラムおよび運用管理通知支援プログラムを記録したコンピュータ読み取り可能な記録媒体
US20230251921A1 (en) Associating capabilities and alarms
CN117389593A (zh) 资源对象更新方法及装置、电子设备和计算机存储介质
WO2023154679A1 (en) Associating capabilities and alarms
CN115098259A (zh) 一种资源管理方法、装置、云平台、设备及存储介质

Legal Events

Date Code Title Description
HZ9A Changing address for correspondence with an applicant