KR101572672B1

KR101572672B1 - 통신망에서 노드 감시 방법 및 시스템

Info

Publication number: KR101572672B1
Application number: KR1020120001688A
Authority: KR
Inventors: 조경섭; 이성근; 이경희; 이현우; 류원
Original assignee: 한국전자통신연구원
Priority date: 2012-01-05
Filing date: 2012-01-05
Publication date: 2015-12-04
Also published as: KR20130080720A

Abstract

통신망에서 노드의 링크 연결에 이상이 있거나 노드가 다운되어 있는지에 대한 장애와 노드에서 필수적으로 동작되어야 하는 프로세스들이 비정상으로 동작하고 있는 장애를 감시할 수 있는 노드 감시 방법 및 시스템이 제공된다. 운용 서버는, 네트워크의 노드들로 핑 요청을 송신하고, 노드들 중 제1 노드로부터 핑 응답을 수신하면 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정한다. 운용 서버는, 제1 노드로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 프로세스 상태 정보를 설정하고, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태를 결정하고 노드 상태를 표시한다.

Description

통신망에서 노드 감시 방법 및 시스템{Method for monitoring node failure on communication network and system thereof}

본 발명은 통신 망에서 운용되는 노드들의 장애를 감시하고 처리하는 방법에 관한 것으로, 운용자가 노드의 장애 유무를 용이하게 인지할 수 있도록 하는 기술에 관한 것이다.

통신 관련 기능을 제공하기 위해서는 일반적으로 액세스 네트워크와 이들을 연결하는 코어 네트워크로 구성되며, 액세스 네트워크에는 기능 수행을 위한 노드들로 구성된다. 노드들이 정상적으로 동작되고 있는지를 감시하는 방법으로 운용 시스템과 노드 간에 Ping과 같은 통신을 사용하여 응답이 있을 경우 노드가 정상이며 응답이 없는 경우는 장애 상태라고 판단한다. 그러나 실제로는 노드가 정상이라 하더라도 노드 내에서 기능을 위해 필수적으로 동작되어야 하는 프로세스들은 비정상 상태일 수 있다. 이런 경우에는 운용 시스템이 정상적이라고 판단한 노드가 실제로는 정상적으로 동작하지 못하여, 운용 시스템의 네트워크 운용에 문제가 발생할 수 있다.

공개번호: 10-2011-0078114, 공개일자: 2011년 7월 7일, 출원인: 텔코웨어 주식회사, 발명의 명칭: 서비스 프로세스 관리 방법 및 시스템, 이를 위한 기록매체

본 발명은 통신망에서 각 노드의 장애가 발생 시 링크 연결이 이상이 있는지 또는 각 노드에서 필수적으로 정상 동작되어야 하는 프로세스들이 비정상적으로 동작하고 있는지를 알기 위하여, 통신망에서 노드의 링크 연결에 이상이 있거나 노드가 다운되어 있는지에 대한 장애와 노드에서 필수적으로 동작되어야 하는 프로세스들이 비정상으로 동작하고 있는 장애를 감시하여, 운용자가 노드 장애를 구별하여 인지할 수 있게 하는 노드 감시 방법 및 시스템에 관한 것이다.

일 측면에 따른 운용 서버에서 네트워크상의 노드들에 대한 장애를 감시하는 방법은, 네트워크의 노드들로 핑 요청을 송신하는 단계와, 노드들 중 제1 노드로부터 핑 응답을 수신하면 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정하는 단계와, 제1 노드로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 프로세스 상태 정보를 설정하는 단계와, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태를 결정하고 노드 상태를 표시하는 단계를 포함한다.

다른 측면에 따른 네트워크상의 노드들에 대한 장애를 감시하는 운용 서버는, 네트워크의 노드들로 핑 응답을 요청하는 핑 메시지를 생성하는 핑 메시지 생성부와, 핑 메시지를 노드들로 전송하고, 노드들로부터 각 노드상의 프로세스들의 상태를 나타내는 프로세스 상태 보고 메시지를 수신하는 통신부와, 노드들 중 제1 노드로부터 핑 응답을 수신하면 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정하고, 제1 노드로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 프로세스 상태 정보를 설정하고, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 노드 상태 정보를 설정하는 상태 관리부와, 설정된 노드 상태 정보를 표시하는 상태 표시부 를 포함한다.

또 다른 측면에 따른 네트워크 노드는, 기능 동작에 필요한 프로세스들에 대한 정보를 저장하는 프로세스 정보 데이터베이스와, 프로세스 정보 데이터베이스로부터 프로세스 정보를 읽어 감시 대상 프로세스 리스트를 생성하고, 감시 대상 프로세스들의 정상 동작 상태를 검사하는 프로세스 상태 검사부와, 검사 결과에 따른 감시 대상 프로세스 상태를 운용 서버로 보고하는 상태 보고부;를 포함한다.

본 발명에 따르면, 통신망에서 노드의 장애 발생시 노드와의 링크 연결 이상이나 노드 자체가 다운으로 발생된 장애인지 노드에서 필수적으로 동작되어야 하는 프로세스들의 비정상 상태로 인한 장애인지를 운용자가 쉽게 구별할 수 있다.

도 1은 본 발명의 일 실시예에 따른 통신망에서 노드 장애 감시가 수행되는 통신망 구성을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 운용 서버와 각 노드에서 수행되는 프로세스를 나타내는 도면이다.
도 3은 노드에서 프로세스 장애를 감시하여 운용 서버로 보고하는 흐름의 일 예를 나타내는 순서도이다.
도 4는 운용 서버에서 노드 장애를 감시하는 흐름의 일 예를 나타내는 순서도이다.
도 5는 도 1의 운용 서버의 구성의 일 예를 나타내는 도면이다.
도 6은 본 발명의 일 실시예에 따른 노드의 구성을 나타내는 도면이다.
도 7은 본 발명의 일 실시예에 따른 운용 서버에서 설정된 노드 상태 정보가 표시되는 화면의 일 예를 나타내는 도면이다.

이하, 첨부된 도면을 참조하여 본 발명의 일 실시예를 상세하게 설명한다. 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.

도 1은 본 발명의 일 실시예에 따른 통신망에서 노드 장애 감시 및 처리 방법을 설명하기 위한 통신망 구성을 나타내는 도면이다.

통신망(100)은, 복수의 액세스 네트워크(110, 120, 130), 코어 네트워크(140) 및 운용 서버(150)를 포함한다.

각 액세스 네트워크(110, 120, 130)는 운용 서버(150)의 감시 대상인 노드 및 다양한 네트워크 장치들을 포함한다. 각 액세스 네트워크(110, 120, 130)에 포함된 복수의 노드들은 통신망에서 목적한 기능을 수행하도록 동작한다. 액세스 네트워크 #1(110)에는 노드 1(111)이 라우터 1(112)을 통해 코어 네트워크(140)와 연결된다. 액세스 네트워크 #2(110)에는 노드 2(121)이 라우터 2(122)을 통해 코어 네트워크(140)와 연결된다. 액세스 네트워크 #3(130)에는 노드 3(131)이 라우터 3(132)을 통해 코어 네트워크(140)와 연결된다.

코어 네트워크(140)는 각 액세스 네트워크들(110, 120, 130) 및 운용 서버(150)를 연결한다.

노드 1(111), 노드 2(121) 및 노드 3(131)은 코어 네트워크(140)를 통해 운용 서버(150)로 각 노드상에서 동작하는 프로세스에 대한 상태를 보고한다. 운용 서버(150)는 각 액세스 네트워크(110, 120, 130)의 노드의 운용 상태를 감시하여 운용자에게 보고한다. 운용 서버(150)는 각 노드(111, 121, 131)로 핑 요청을 각각 송신하고, 각 노드(111, 121, 131)로부터 핑 요청에 대한 핑 응답이 수신되는지를 감시하여 각 노드(111, 121, 131) 다운되거나 각 노드(111, 121, 131)와의 링크 연결에 이상이 있는지 결정할 수 있다.

도 2는 본 발명의 일 실시예에 따른 운용 서버와 각 노드에서 수행되는 프로세스를 나타내는 도면이다.

액세스 네트워크(110)의 노드(111)의 에이전트 프로세스는 기능을 수행하는데 필요한 프로세스들이 정상적으로 동작되고 있는지를 주기적으로 감시하여 정상 유무를 운용 서버(150)에 보고한다.

예를 들어, 노드 1(111)에는 에이전트 프로세스인 AgentProcess1(211-1) 및 기능 동작에 관련된 메인 프로세스 MainProcess1_Node1(211-2) 및 MainProcess2_Node1(211-3)가 동작할 수 있다. 도 2에는 노드 1(111)에 2개의 메인 프로세스가 동작하는 것으로 표시하였으나, 1개 또는 3개 이상의 메인 프로세스가 동작될 수 있다.

운용 서버(150)에는 서버 프로세스(250)가 동작한다. 서버 프로세스(250)는 각 노드(노드 1,...., 노드 n)의 에이전트 프로세스로부터 노드의 프로세스 상태 정보를 주기적으로 수신하고, 각 노드의 상태를 결정하여 노드의 상태를 나타내는 노드 상태 정보를 운용자에게 출력할 수 있다.

도 3은 노드에서 프로세스 장애를 감시하여 운용 서버로 보고하는 흐름의 일 예를 나타내는 순서도이다.

설명의 편의를 위하여, 도 1의 노드 1(111)의 동작을 중심으로 설명한다.

노드 1(111)은 에이전트 프로세스(도 2의 211-1)가 시작되면 자신의 노드에서 기능 동작에 필요한 프로세스들에 대한 정보를 데이터베이스(DB)로부터 읽어 감시 대상 프로세스 리스트를 생성한다(310). 데이터베이스는 노드 1(111)에서 수행되어야 하는 프로세스 리스트 정보를 포함할 수 있다.

노드 1(111)은 소정의 프로세스 상태 검사 주기 동안 감시 대상 프로세스들에 대해 동작 상태를 검사한다(320). 이를 위해, 노드 1(111)은 프로세스들의 상태를 검사하기 위한 타이머를 등록하고, 타이머가 타임 아웃이 되기를 대기하였다가, 정상 동작 상태인지를 검사할 수 있다. 프로세스가 좀비(zombie) 상태이거나 존재하지 않는다면 노드 1(111)은 그 프로세스는 비정상 상태라고 판단할 수 있다. 노드 1(111)은 노드 1(111)에서 수행하는 복수의 프로세스 중 하나의 프로세스라도 비정상인 경우, 노드 1(111)의 프로세스 상태를 비정상이라고 판단할 수 있다. 노드 1(111)은 프로세스 상태를 나타내는 프로세스 상태 보고 메시지를 생성하여 운용 서버(150)로 전송한다.

프로세스 상태가 정상이면(330), 노드 1(111)은 프로세스 상태가 정상임을 나타내는 ACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 운용 서버(150)로 송신한다(340). ACTIVE 값은 '1'로 나타낼 수 있다.

프로세스 상태가 비정상이면(340), 노드 1(111)은 프로세스 상태가 비정상임을 나태나는 INACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 운용 서버(150)로 송신한다(350). INACTIVE 값은 '0'으로 나타낼 수 있다. 노드 1(111)은 프로세스 상태 보고 메시지가 전송되면, 이후 프로세스들의 상태를 주기적으로 감시하기 위해 새로운 프로세스 상태 검사 주기를 시작한다.

도 4는 도 1의 운용 서버(150)에서 노드 장애를 감시하는 흐름의 일 예를 나타내는 순서도이다.

도 4는 운용 서버(150)의 하나의 노드 상태 감시 주기 동안의 동작을 나타낸다. 노드 상태 감시 주기는 네트워크상의 모든 노드들에 대해 동일하게 설정될 수 있고, 각 노드마다 별도로 설정될 수도 있다. 설명의 편의를 위해, 이하에서는 모든 노드들에 대한 감시 주기가 동일하게 설정된 것으로 가정한다.

운용 서버(150)는 서버 프로세스(250)가 시작되면 노드들의 상태를 감시하기 위한 타이머를 등록하고, 노드 상태 감시 주기가 시작되면 노드 장애 감시 동작을 시작한다.

운용 서버(150)의 노드들의 링크가 제대로 연결되어 있지 않거나 노드 자체가 다운된 상태인지를 검사하기 위해 핑 요청을 각 노드들에게 송신한다(410).

운용 서버(150)는 노드 상태 감시 주기가 시작되면, 각 노드의 핑 상태 정보를 초기화할 수 있다. 예를 들어, 핑 상태 정보는 핑 상태 플래그(PingFlag)로 나타낼 수 있으며, 운용 서버(150)는 노드 상태 감시 주기가 시작되면, 핑 상태 플래그(PingFlag)를 핑 응답이 미수신된 상태임을 나타내는 NOK로 설정할 수 있다.

운용 서버(150)는 이후, 노드 상태 감시 주기가 종료(time-out)될 때까지 각 노드에서 응답하는 핑 응답의 수신 또는 노드에서 주기적으로 보고하는 프로세스 상태 보고의 수신을 대기한다. 설명의 편의를 위하여, 노드들 중 노드 1(111)을 중심으로 설명한다.

노드 1(111)로부터 핑 응답을 수신하면(420), 운용 서버(150)는 핑 응답의 정상 수신 상태를 나타내도록 핑 상태 정보를 설정한다. 예를 들어, 운용 서버(150)는 핑 상태 정보에 대응하는 핑 상태 플래그(PingFlag)를 NOK에서 응답이 정상 수신되었음을 나타내는 OK로 변경하고, 다시 대기 상태로 천이할 수 있다. 노드 1(111)로부터 노드 상태 감시 주기가 경과(time-out)될 때까지 핑 응답을 수신하지 못하면(420), 핑 상태 플래그(PingFlag)를 NOK로 남아있게 될 것이다.

운용 서버(150)는 노드 1(111)로부터 프로세스 상태 보고 메시지를 수신하고(440), 프로세스 상태 보고 메시지에 포함된 프로세스 상태 보고 내용이 해당 프로세스가 정상임을 나타내면(450), 프로세스 상태 정보를 정상을 나타내는 값으로 설정한다(460). 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 프로세스 상태 정보로 설정할 수 있다. 프로세스 상태 정보는 프로세스 상태 플래그(ProcStFg)로 나타낼 수 있고, 동작 460에서, 운용 서버(150)는 프로세스 상태 플래그(ProcStFg)에 OK로 설정하고 대기 상태로 천이할 수 있다.

프로세스 상태 보고 내용이, 해당 프로세스가 비정상임을 나타내면(450), 프로세스 상태 정보를 비정상을 나타내는 값으로 설정한다(470). 동작 470에서, 운용 서버(150)는 프로세스 상태 플래그(ProcStFg)에 NOK를 설정하고 대기 상태로 천이할 수 있다.

노드 상태 감시 주기가 경과되면, 운용 서버(150)는 노드 상태를 최종적으로 결정하고, 결정된 노드 상태를 표시한다(480).

운용 서버(150)는 노드 1(111)의 핑 상태 플래그(PingFlag)가 OK인지를 검사하여 NOK이면, 노드 상태 정보(NodeSt)에 노드의 링크 연결이 이상이 있거나 노드 자체가 다운된 상태임을 나타내는 DISCONNECTED를 설정할 수 있다.

핑 상태 정보(PingFlag)가 OK이면, 운용 서버(150)는 프로세스 상태 플래그(ProcStFg)가 ACTIVE인지를 판단하여, 프로세스 상태 플래그(ProcStFg)가 ACTIVE인 경우 노드 상태 정보(NodeSt)에 노드 상태가 정상임을 나타내는 NODE_OK를 설정한다. 핑 상태 정보(PingFlag)가 OK이며 프로세스 상태 플래그(ProcStFg)가 INACTIVE인 경우, 운용 서버(150)는 노드 상태 정보(NodeSt)에 노드 상태가 비정상임을 나타내는 NODE_NOK를 설정한다.

이와 같이, 노드의 상태 정보(NodeSt)에 노드 상태를 설정한 후, 이를 운용자에게 알려주기 위해 운용 단말에 표시하는 기능을 수행하고, 노드의 상태를 주기적으로 감시하기 위해 감시 타이머를 등록하는 과정으로 천이할 수 있다.

설명의 편의를 위하여 노드 1(111)의 동작을 중심으로 설명하였으나, 운용 서버(150)는 각 노드에 대한 핑 상태 정보, 프로세스 상태 정보를 관리하고, 각 노드의 핑 상태 정보 및 프로세스 상태 정보에 따라 각 노드에 대한 노드 상태를 결정하고 관리할 수 있다.

도 5는 도 1의 운용 서버(150)의 구성의 일 예를 나타내는 도면이다.

운용 서버(150)는 상태 관리부(510), 핑 메시지 생성부(520), 통신부(530), 감시 주기 관리부(540) 및 상태 표시부(550)를 포함할 수 있다.

상태 관리부(510)는 서버 프로세스(도 2의 250)를 실행하여, 네트워크상의 각 노드의 상태를 감시하여 각 노드의 상태를 결정하고 각 노드의 상태를 나타내는 노드 상태 정보를 생성한다. 노드 상태 정보는 각 노드마다 생성되어 관리될 수 있다. 상태 관리부(510)는 핑 메시지 생성부(520), 통신부(530), 감시 주기 관리부(540) 및 상태 표시부(550)를 제어할 수 있다.

핑 메시지 생성부(520)는 네트워크의 노드들로 핑 응답을 요청하는 핑 메시지를 생성한다.

통신부(530)는 핑 메시지 생성부(520)에서 생성된 핑 요청 메시지를 노드들로 전송하고, 각 노드들로부터 핑 응답 메시지를 수신하도록 구성될 수 있다. 통신부(530)는 노드들로부터 각 노드상의 프로세스들의 상태를 나타내는 프로세스 상태 보고 메시지를 수신하여 상태 관리부(510)로 전달할 수 있다.

감시 주기 관리부(540)는 노드 상태 감시 주기를 생성한다. 노드 상태 감시 주기는 각 노드들에 대하여 동일하게 설정되거나 별도로 설정될 수 있다. 감시 주기 관리부(540)는 각 노드 상태 감시 주기의 시작 및 종료를 상태 관리부(510)로 통지할 수 있다.

상태 표시부(550)는 상태 관리부(510)에서 결정된 노드 상태를 나태는 노드 상태 정보를 표시한다.

상태 관리부(510)는, 노드 상태 감시 주기가 시작되면, 핑 메시지를 노드들로 전송할 수 있다. 상태 관리부(510)는 노드들 중 노드 1(111)로부터 핑 메시지에 대한 핑 응답(또는 핑 응답 메시지)을 수신하면 핑 응답의 정상 수신을 나타내는 핑 상태 정보를 설정하고, 노드 1(111)로부터 프로세스 상태 보고를 수신하면 프로세스 상태를 나타내는 프로세스 상태 정보를 설정하고, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 노드 상태 정보를 설정한다.

상태 관리부(510)는, 노드 1(111)에 대한 핑 상태 정보를 핑 응답의 수신 상태를 미수신 상태임을 나타내는 NOK로 초기화하고, 노드 1(111)로부터 핑 응답을 수신하면, 핑 상태 정보를 핑 응답이 정상적으로 수신되었음을 나타내는 OK로 변경할 수 있다.

상태 관리부(510)는, 노드 상태 감시 주기가 종료되면, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 각 노드의 노드 상태를 결정하고 각 노드에 대한 노드 상태 정보를 생성할 수 있다. 상태 관리부(510)는 노드 1(111)에 대한 노드 상태 정보를 다음과 같이 설정할 수 있다.

상태 관리부(510)는, 노드 1(111)로부터 핑 응답을 수신하고, 프로세스 상태를 나타내는 값이 프로세스가 정상임을 나타내는 ACTIVE 값인 경우, 노드 1(111)의 노드 상태 정보를 정상임을 나타내는 NODE_OK로 설정할 수 있다. 또한, 상태 관리부(510)는 노드 1(111)로부터 핑 응답을 수신하고, 프로세스 상태를 나타내는 값이 프로세스가 비정상임을 나타내는 INACTIVE 값인 경우, 노드 1(111)의 노드 상태 정보를 비정상임을 나타내는 NODE_NOK로 설정할 수 있다. 또한, 상태 관리부(510)는 노드 1(111)로부터 핑 응답을 수신하지 못한 경우, 노드 1(111)의 노드 상태 정보를 DISCONNECT로 설정할 수 있다.

상태 표시부(550)가 설정된 노드 상태 정보를 표시하면, 감시 주기 관리부(540)는, 새로운 노드 상태 감시 주기를 등록하여 새로운 노드 상태 감시 주기를 개시한다.

도 6은 본 발명의 일 실시예에 따른 노드의 구성을 나타내는 도면이다.

일 실시예에 따른 노드를 노드 1(111)로 가정하면, 노드 1(111)은 프로세스 수행부(610), 프로세스 정보 데이터베이스(620), 검사 주기 관리부(630), 프로세스 상태 검사부(640) 및 상태 보고부(650)를 포함할 수 있다.

프로세스 수행부(610)는 노드 1(111)의 하나 이상의 프로세스를 수행한다. 프로세스 수행부(610)는 도 2의 메인 프로세스들(211-2, 211-3)을 수행할 수 있다.

프로세스 정보 데이터베이스(620)는 노드 1(111)의 기능 동작에 필요한 프로세스들에 대한 정보를 저장한다.

검사 주기 관리부(630)는 프로세스 상태 검사 주기를 생성하고 관리한다.

프로세스 상태 검사부(640)는 에이전트 프로세스(도 2의 211-1)를 실행하여, 프로세스 정보 데이터베이스(620)로부터 프로세스 정보를 읽어 감시 대상 프로세스 리스트를 생성하고, 프로세스 상태 검사 주기 동안 프로세스 수행부(610)에서 수행되는 감시 대상 프로세스들의 정상 동작 상태를 검사하여 검사 결과를 생성한다. 프로세스 상태 검사부(640)는 복수의 프로세스 중 하나의 프로세스라도 비정상인 경우, 프로세스 상태를 비정상으로 결정할 수 있다.

프로세스 상태 검사부(640)는 검사 결과에 따른 감시 대상 프로세스 상태를 나타내는 프로세스 상태 보고 메시지를 생성한다. 프로세스 상태 검사부(640)는 프로세스 상태가 정상이면 프로세스 상태가 정상임을 나타내는 ACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 생성하고, 프로세스 상태가 비정상이면, 프로세스 상태가 비정상임을 나태나는 INACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 생성한다. 상태 보고부(650)는 프로세스 상태 보고 메시지를 운용 서버(150)로 보고한다.

프로세스 상태 검사부(640)가 검사 결과를 생성하면, 검사 주기 관리부(630)는 다음 프로세스 상태 검사 주기를 등록하고, 등록된 검사 주기가 시작됨을 프로세스 상태 검사부(640)로 통지하여 프로세스 상태 검사부(640)가 다음 검사 주기 동안 감시 대상 프로세스들의 정상 동작 상태를 검사하도록 한다.

도 7은 본 발명의 일 실시예에 따른 운용 서버에서 설정된 노드 상태 정보가 표시되는 화면의 일 예를 나타내는 도면이다.

노드 상태 정보는 도 7에 도시된 바와 같은 이미지 정보로 제공될 수 있다. 노드 상태 정보 표시 화면에는, 운용 서버, 코어 라우터, 라우터 1, 라우터 2, 라우터 3, 노드 1, 노드 2 및 노드 3이 포함될 수 있다. 코어 라우터, 라우터 1, 라우터, 2 및 라우터 3는 도 1의 액세스 네트워크 #1(110), 액세스 네트워크 #2(120), 액세스 네트워크 #3(130), 코어 네트워크(140) 각각을 대표하는 이미지이다. 노드 1, 노드 2 및 노드 3은 라우터 1, 라우터 2, 및 라우터 3에 연결된 노드를 나타낸다.

각 노드의 하단에는 노드 상태 정보가 각각 NODE_OK, NODE_NOK, DISCONNECTED로 표시될 수 있다. 또한, 운용 서버의 핑 요청에 대한 핑 응답을 전송하지 않은 노드(도 7의 노드 3)는 핑 응답을 전송한 노드(도 7의 노드 1 및 노드 2)와 구분되도록 표시할 수 있다. 예를 들어, 도 7에 도시된 바와 같이, 다른 노드들이 각 라우터들과 실선으로 연결된 것과 달리 노드 3과 라우터 3과의 연결을 점선으로 나타내어, 노드 3으로부터는 핑 응답을 받지 못하였음을 나타낼 수 있다.

본 발명의 일 양상은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있다. 상기의 프로그램을 구현하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 디스크 등을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드로 저장되고 실행될 수 있다.

이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구범위에 기재된 내용과 동등한 범위 내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.

Claims

운용 서버에서 네트워크상의 노드들에 대한 장애를 감시하는 방법으로서,
네트워크의 노드들로 핑 요청을 송신하는 단계;
상기 노드들 중 제1 노드로부터 핑 응답을 수신하면 상기 제 1 노드가 정상 또는 상기 제 1 노드와의 링크 연결 정상임을 지시하는 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정하는 단계;
제1 노드의 적어도 하나의 에이전트 프로세스로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 상기 프로세스 상태 정보를 설정하는 단계; 및
핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태를 결정하고 노드 상태를 표시하는 단계; 를 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 제1 노드에 대한 핑 상태 정보를 핑 응답이 미수신 상태임을 나타내는 NOK로 초기화하는 단계; 및
상기 제1 노드로부터 핑 응답을 수신하면, 상기 핑 상태 정보를 핑 응답이 정상적으로 수신되었음을 나타내는 OK로 설정하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 프로세스 상태 보고는, 제1 노드에서 동작하는 하나 이상의 프로세스가 정상 상태인지 여부를 나타내는 정보를 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,
핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태 정보를 생성하여 표시하는 단계는,
상기 제1 노드로부터 핑 응답을 수신하고, 상기 프로세스 상태를 나타내는 값이 프로세스가 정상임을 나타내는 ACTIVE 값인 경우, 상기 노드 상태 정보를 정상임을 나타내는 NODE_OK로 설정하는 단계; 및
상기 제1 노드로부터 핑 응답을 수신하고, 상기 프로세스 상태를 나타내는 값이 프로세스가 비정상임을 나타내는 INACTIVE 값인 경우, 상기 노드 상태 정보를 비정상임을 나타내는 NODE_NOK로 설정하는 단계;를 포함하는 것을 특징으로 하는 방법.
제4항에 있어서,
핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태 정보를 생성하여 표시하는 단계는,
상기 제1 노드로부터 핑 응답을 수신하지 못한 경우, 상기 노드 상태 정보를 제1 노드와의 링크 연결에 문제가 있음을 나타내는 DISCONNECT로 설정하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,
노드 상태 감시 주기를 생성하는 단계;를 더 포함하고,
상기 노드 상태 감시 주기가 시작되면, 상기 핑 메시지를 노드들로 전송하는 단계가 수행되고, 상기 노드 상태 감시 주기가 종료되면, 상기 핑 상태 정보 및 상기 프로세스 상태 정보를 이용하여 노드 상태 정보를 생성하여 표시하는 단계가 수행되는 것을 특징으로 하는 방법.
제1항에 있어서,
노드 상태 정보를 표시하면, 새로운 노드 상태 감시 주기를 등록하여 새로운 노드 상태 감시 주기를 개시하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
네트워크상의 노드들에 대한 장애를 감시하는 운용 서버로서,
네트워크의 노드들로 핑 응답을 요청하는 핑 메시지를 생성하는 핑 메시지 생성부;
핑 메시지를 노드들로 전송하고, 상기 노드들로부터 각 노드상의 프로세스들의 상태를 나타내는 프로세스 상태 보고 메시지를 수신하는 통신부;
노드들 중 제1 노드로부터 상기 제 1 노드가 정상 또는 상기 제 1 노드와의 링크 연결 정상임을 지시하는 핑 응답을 수신하면 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정하고, 제1 노드의 적어도 하나의 에이전트 프로세스로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 프로세스 상태 정보를 설정하고, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 노드 상태 정보를 설정하는 상태 관리부; 및
설정된 노드 상태 정보를 표시하는 상태 표시부; 를 포함하는 것을 특징으로 하는 운용 서버.
제8항에 있어서,
상기 상태 관리부는, 상기 제1 노드에 대한 핑 상태 정보를 핑 응답이 미수신된 상태임을 나타내는 NOK로 초기화하고, 상기 제1 노드로부터 핑 응답을 수신하면, 상기 핑 상태 정보를 핑 응답이 정상적으로 수신되었음을 나타내는 OK로 설정하는 것을 특징으로 하는 운용 서버.
제8항에 있어서, 상기 상태 관리부는,
상기 제1 노드로부터 핑 응답을 수신하고, 상기 프로세스 상태를 나타내는 값이 프로세스가 정상임을 나타내는 ACTIVE 값인 경우, 상기 노드 상태 정보를 정상임을 나타내는 NODE_OK로 설정하고,
상기 제1 노드로부터 핑 응답을 수신하고, 상기 프로세스 상태를 나타내는 값이 프로세스가 비정상임을 나타내는 INACTIVE 값인 경우, 상기 노드 상태 정보를 비정상임을 나타내는 NODE_NOK로 설정하고,
상기 제1 노드로부터 핑 응답을 수신하지 못한 경우, 상기 노드 상태 정보를 제1 노드와의 링크 연결에 문제가 있음을 나타내는 DISCONNECT로 설정하는 것을 특징으로 하는 운용 서버.
제8항에 있어서,
노드 상태 감시 주기를 생성하는 감시 주기 관리부;를 더 포함하고,
상기 상태 관리부는, 상기 노드 상태 감시 주기가 시작되면, 상기 핑 메시지를 노드들로 전송하고, 상기 노드 상태 감시 주기가 종료되면, 상기 상태 관리부는 핑 상태 정보 및 프로세스 상태 정보를 이용하여 노드 상태 정보를 설정하는 것을 특징으로 하는 운용 서버.
제9항에 있어서,
상기 상태 표시부가 설정된 노드 상태 정보를 표시하면, 감시 주기 관리부는, 새로운 노드 상태 감시 주기를 등록하여 새로운 노드 상태 감시 주기를 개시하는 것을 특징으로 하는 운용 서버.
기능 동작에 필요한 프로세스들에 대한 정보를 저장하는 프로세스 정보 데이터베이스;
상기 프로세스 정보 데이터베이스로부터 상기 프로세스 정보를 읽어 감시 대상 프로세스 리스트를 생성하고, 감시 대상 프로세스들의 정상 동작 상태를 검사하는 프로세스 상태 검사부; 및
검사 결과에 따른 감시 대상 프로세스 상태를 운영 서버로 보고하는 상태 보고부;를 포함하되,
상기 운영 서버로부터 핑 요청을 수신함에 따라, 다운 여부 또는 상기 운영 서버와의 링크 연결 정상 여부를 지시하는 핑 응답을 상기 운영 서버에 응답함을 특징으로 하는 네트워크 노드.
제13항에 있어서,
프로세스 상태 검사 주기를 생성하는 검사 주기 관리부; 를 더 포함하고,
상기 프로세스 상태 검사부는, 상기 프로세스 상태 검사 주기 동안 감시 대상 프로세스들의 정상 동작 상태를 검사하여 검사 결과를 생성하는 것을 특징으로 하는 네트워크 노드.
제13항에 있어서,
상기 프로세스 상태 검사부는, 프로세스 상태가 정상이면 프로세스 상태가 정상임을 나타내는 ACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 생성하고, 프로세스 상태가 비정상이면, 프로세스 상태가 비정상임을 나태나는 INACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 생성하는 것을 특징으로 하는 네트워크 노드.