KR20130080720A - Method for monitoring node failure on communication network and system thereof - Google Patents

Method for monitoring node failure on communication network and system thereof Download PDF

Info

Publication number
KR20130080720A
KR20130080720A KR1020120001688A KR20120001688A KR20130080720A KR 20130080720 A KR20130080720 A KR 20130080720A KR 1020120001688 A KR1020120001688 A KR 1020120001688A KR 20120001688 A KR20120001688 A KR 20120001688A KR 20130080720 A KR20130080720 A KR 20130080720A
Authority
KR
South Korea
Prior art keywords
node
state
ping
status
information
Prior art date
Application number
KR1020120001688A
Other languages
Korean (ko)
Other versions
KR101572672B1 (en
Inventor
조경섭
이성근
이경희
이현우
류원
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120001688A priority Critical patent/KR101572672B1/en
Publication of KR20130080720A publication Critical patent/KR20130080720A/en
Application granted granted Critical
Publication of KR101572672B1 publication Critical patent/KR101572672B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

PURPOSE: Node monitoring method and system thereof in a communication network are provided to monitor whether link connection of a node has abnormality or a node is down or processes to be essentially operated in a node are abnormally operated. CONSTITUTION: When a ping response is received from a first node in the nodes, a state management unit (510) configures ping state information to show normal reception of the ping response. When a process state report message from the first node is received, the state management unit configures process state information using a value showing a process state included in the process state report message. The state management unit configures node state information using ping state information and process state information. A state display unit (550) displays the configured node state information. [Reference numerals] (510) State management unit; (520) Ping message creating unit; (530) Communication unit; (540) Monitoring period management unit; (550) State display unit

Description

통신망에서 노드 감시 방법 및 시스템{Method for monitoring node failure on communication network and system thereof} Node for monitoring node failure on communication network and system

본 발명은 통신 망에서 운용되는 노드들의 장애를 감시하고 처리하는 방법에 관한 것으로, 운용자가 노드의 장애 유무를 용이하게 인지할 수 있도록 하는 기술에 관한 것이다.The present invention relates to a method for monitoring and handling a failure of nodes operating in a communication network, and more particularly, to a technology for enabling an operator to easily recognize a node's failure.

통신 관련 기능을 제공하기 위해서는 일반적으로 액세스 네트워크와 이들을 연결하는 코어 네트워크로 구성되며, 액세스 네트워크에는 기능 수행을 위한 노드들로 구성된다. 노드들이 정상적으로 동작되고 있는지를 감시하는 방법으로 운용 시스템과 노드 간에 Ping과 같은 통신을 사용하여 응답이 있을 경우 노드가 정상이며 응답이 없는 경우는 장애 상태라고 판단한다. 그러나 실제로는 노드가 정상이라 하더라도 노드 내에서 기능을 위해 필수적으로 동작되어야 하는 프로세스들은 비정상 상태일 수 있다. 이런 경우에는 운용 시스템이 정상적이라고 판단한 노드가 실제로는 정상적으로 동작하지 못하여, 운용 시스템의 네트워크 운용에 문제가 발생할 수 있다. In order to provide communication-related functions, it is generally composed of an access network and a core network connecting them, and the access network is composed of nodes for performing functions. As a way to monitor whether the nodes are operating normally, if there is a response using the communication such as ping between the operating system and the node, it is determined that the node is normal and if there is no response, it is a failure state. In practice, however, even if a node is healthy, processes that are essential to function within the node may be abnormal. In this case, the node that the operating system determines to be normal may not operate normally, and thus a problem may occur in network operation of the operating system.

공개번호: 10-2011-0078114, 공개일자: 2011년 7월 7일, 출원인: 텔코웨어 주식회사, 발명의 명칭: 서비스 프로세스 관리 방법 및 시스템, 이를 위한 기록매체Publication number: 10-2011-0078114, published date: July 7, 2011, Applicant: Telcoware Co., Ltd., the title of the invention: service process management method and system, recording medium therefor

본 발명은 통신망에서 각 노드의 장애가 발생 시 링크 연결이 이상이 있는지 또는 각 노드에서 필수적으로 정상 동작되어야 하는 프로세스들이 비정상적으로 동작하고 있는지를 알기 위하여, 통신망에서 노드의 링크 연결에 이상이 있거나 노드가 다운되어 있는지에 대한 장애와 노드에서 필수적으로 동작되어야 하는 프로세스들이 비정상으로 동작하고 있는 장애를 감시하여, 운용자가 노드 장애를 구별하여 인지할 수 있게 하는 노드 감시 방법 및 시스템에 관한 것이다.According to the present invention, in order to know whether a link connection is abnormal when each node fails in a communication network or whether processes that should be normally operated at each node are abnormally operating, there is an error in a node's link connection in a communication network, or The present invention relates to a method and a system for monitoring a node that allows an operator to distinguish and recognize a node failure by monitoring a failure of a down failure and a failure in which processes essential to a node operate abnormally.

일 측면에 따른 운용 서버에서 네트워크상의 노드들에 대한 장애를 감시하는 방법은, 네트워크의 노드들로 핑 요청을 송신하는 단계와, 노드들 중 제1 노드로부터 핑 응답을 수신하면 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정하는 단계와, 제1 노드로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 프로세스 상태 정보를 설정하는 단계와, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태를 결정하고 노드 상태를 표시하는 단계를 포함한다. According to an aspect of the present invention, a method for monitoring a failure of nodes on a network in a production server includes transmitting a ping request to nodes in a network, and receiving a ping response from a first node among the nodes, and receiving a ping response. Setting the ping state information to indicate a process, setting the process state information using a value indicating a process state included in the process state report message when receiving the process state report message from the first node, and ping state information. And determining the node state of the first node and displaying the node state using the process state information.

다른 측면에 따른 네트워크상의 노드들에 대한 장애를 감시하는 운용 서버는, 네트워크의 노드들로 핑 응답을 요청하는 핑 메시지를 생성하는 핑 메시지 생성부와, 핑 메시지를 노드들로 전송하고, 노드들로부터 각 노드상의 프로세스들의 상태를 나타내는 프로세스 상태 보고 메시지를 수신하는 통신부와, 노드들 중 제1 노드로부터 핑 응답을 수신하면 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정하고, 제1 노드로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 프로세스 상태 정보를 설정하고, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 노드 상태 정보를 설정하는 상태 관리부와, 설정된 노드 상태 정보를 표시하는 상태 표시부 를 포함한다. According to another aspect of the present invention, an operation server for monitoring failures of nodes on a network includes a ping message generator for generating a ping message requesting a ping response to nodes of a network, and transmitting a ping message to the nodes. A communication unit for receiving a process status report message indicating a status of processes on each node from the first node, and when the ping response is received from the first node among the nodes, the ping state information is set to indicate normal reception of the ping response. A status management unit configured to set process status information using a value indicating a process status included in the process status report message, and set node status information using ping status information and process status information when the process status report message is received; And a status display unit for displaying node status information.

또 다른 측면에 따른 네트워크 노드는, 기능 동작에 필요한 프로세스들에 대한 정보를 저장하는 프로세스 정보 데이터베이스와, 프로세스 정보 데이터베이스로부터 프로세스 정보를 읽어 감시 대상 프로세스 리스트를 생성하고, 감시 대상 프로세스들의 정상 동작 상태를 검사하는 프로세스 상태 검사부와, 검사 결과에 따른 감시 대상 프로세스 상태를 운용 서버로 보고하는 상태 보고부;를 포함한다. According to another aspect of the present invention, a network node includes a process information database that stores information on processes required for a function operation, reads process information from the process information database, generates a monitored process list, and monitors the normal operation state of the monitored processes. It includes a process status inspection unit for inspecting, and a status report unit for reporting the status of the monitoring target process according to the inspection result to the operation server.

본 발명에 따르면, 통신망에서 노드의 장애 발생시 노드와의 링크 연결 이상이나 노드 자체가 다운으로 발생된 장애인지 노드에서 필수적으로 동작되어야 하는 프로세스들의 비정상 상태로 인한 장애인지를 운용자가 쉽게 구별할 수 있다.According to the present invention, an operator can easily distinguish a disabled person due to an abnormal state of processes that must be operated at a disabled node having a link failure with the node or a node itself generated when the node fails in the communication network.

도 1은 본 발명의 일 실시예에 따른 통신망에서 노드 장애 감시가 수행되는 통신망 구성을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 운용 서버와 각 노드에서 수행되는 프로세스를 나타내는 도면이다.
도 3은 노드에서 프로세스 장애를 감시하여 운용 서버로 보고하는 흐름의 일 예를 나타내는 순서도이다.
도 4는 운용 서버에서 노드 장애를 감시하는 흐름의 일 예를 나타내는 순서도이다.
도 5는 도 1의 운용 서버의 구성의 일 예를 나타내는 도면이다.
도 6은 본 발명의 일 실시예에 따른 노드의 구성을 나타내는 도면이다.
도 7은 본 발명의 일 실시예에 따른 운용 서버에서 설정된 노드 상태 정보가 표시되는 화면의 일 예를 나타내는 도면이다.
1 is a diagram illustrating a communication network configuration in which node failure monitoring is performed in a communication network according to an embodiment of the present invention.
2 is a diagram illustrating an operation server and a process performed at each node according to an embodiment of the present invention.
3 is a flowchart illustrating an example of a flow of monitoring a process failure in a node and reporting it to a production server.
4 is a flowchart illustrating an example of a flow of monitoring a node failure in an operation server.
5 is a diagram illustrating an example of a configuration of an operation server of FIG. 1.
6 is a view showing the configuration of a node according to an embodiment of the present invention.
7 is a diagram illustrating an example of a screen on which node state information set in an operation server according to an exemplary embodiment of the present invention is displayed.

이하, 첨부된 도면을 참조하여 본 발명의 일 실시예를 상세하게 설명한다. 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear. In addition, the terms described below are defined in consideration of the functions of the present invention, and this may vary depending on the intention of the user, the operator, or the like. Therefore, the definition should be based on the contents throughout this specification.

도 1은 본 발명의 일 실시예에 따른 통신망에서 노드 장애 감시 및 처리 방법을 설명하기 위한 통신망 구성을 나타내는 도면이다. 1 is a diagram illustrating a communication network configuration for explaining a node failure monitoring and processing method in a communication network according to an embodiment of the present invention.

통신망(100)은, 복수의 액세스 네트워크(110, 120, 130), 코어 네트워크(140) 및 운용 서버(150)를 포함한다. The communication network 100 includes a plurality of access networks 110, 120, 130, a core network 140, and an operation server 150.

각 액세스 네트워크(110, 120, 130)는 운용 서버(150)의 감시 대상인 노드 및 다양한 네트워크 장치들을 포함한다. 각 액세스 네트워크(110, 120, 130)에 포함된 복수의 노드들은 통신망에서 목적한 기능을 수행하도록 동작한다. 액세스 네트워크 #1(110)에는 노드 1(111)이 라우터 1(112)을 통해 코어 네트워크(140)와 연결된다. 액세스 네트워크 #2(110)에는 노드 2(121)이 라우터 2(122)을 통해 코어 네트워크(140)와 연결된다. 액세스 네트워크 #3(130)에는 노드 3(131)이 라우터 3(132)을 통해 코어 네트워크(140)와 연결된다. Each access network 110, 120, 130 includes a node and various network devices that are monitored by the operations server 150. A plurality of nodes included in each of the access networks 110, 120, and 130 operates to perform a desired function in a communication network. Node 1 111 is connected to core network 140 via router 1 112 in access network # 1 110. Node 2 121 is connected to core network 140 via router 2 122 in access network # 2 110. Node 3 131 is connected to core network 140 via router 3 132 in access network # 3 130.

코어 네트워크(140)는 각 액세스 네트워크들(110, 120, 130) 및 운용 서버(150)를 연결한다. The core network 140 connects each of the access networks 110, 120, 130 and the operation server 150.

노드 1(111), 노드 2(121) 및 노드 3(131)은 코어 네트워크(140)를 통해 운용 서버(150)로 각 노드상에서 동작하는 프로세스에 대한 상태를 보고한다. 운용 서버(150)는 각 액세스 네트워크(110, 120, 130)의 노드의 운용 상태를 감시하여 운용자에게 보고한다. 운용 서버(150)는 각 노드(111, 121, 131)로 핑 요청을 각각 송신하고, 각 노드(111, 121, 131)로부터 핑 요청에 대한 핑 응답이 수신되는지를 감시하여 각 노드(111, 121, 131) 다운되거나 각 노드(111, 121, 131)와의 링크 연결에 이상이 있는지 결정할 수 있다. Node 1 111, Node 2 121, and Node 3 131 report the status of the process running on each node to operations server 150 via core network 140. The operation server 150 monitors the operation status of the nodes of each access network 110, 120, 130, and reports them to the operator. The operation server 150 transmits a ping request to each node 111, 121, 131, respectively, and monitors whether a ping response to the ping request is received from each node 111, 121, 131. 121, 131 may be down or it may be determined whether there is an error in the link connection with each node 111, 121, 131.

도 2는 본 발명의 일 실시예에 따른 운용 서버와 각 노드에서 수행되는 프로세스를 나타내는 도면이다. 2 is a diagram illustrating an operation server and a process performed at each node according to an embodiment of the present invention.

액세스 네트워크(110)의 노드(111)의 에이전트 프로세스는 기능을 수행하는데 필요한 프로세스들이 정상적으로 동작되고 있는지를 주기적으로 감시하여 정상 유무를 운용 서버(150)에 보고한다. The agent process of the node 111 of the access network 110 periodically monitors whether the processes necessary to perform the function are operating normally and reports the normality to the operation server 150.

예를 들어, 노드 1(111)에는 에이전트 프로세스인 AgentProcess1(211-1) 및 기능 동작에 관련된 메인 프로세스 MainProcess1_Node1(211-2) 및 MainProcess2_Node1(211-3)가 동작할 수 있다. 도 2에는 노드 1(111)에 2개의 메인 프로세스가 동작하는 것으로 표시하였으나, 1개 또는 3개 이상의 메인 프로세스가 동작될 수 있다. For example, the node 1 111 may operate an agent process, AgentProcess1 211-1, and main processes MainProcess1_Node1 211-2 and MainProcess2_Node1 211-3 related to functional operations. In FIG. 2, two main processes are displayed on the node 1 111, but one or more main processes may be operated.

운용 서버(150)에는 서버 프로세스(250)가 동작한다. 서버 프로세스(250)는 각 노드(노드 1,...., 노드 n)의 에이전트 프로세스로부터 노드의 프로세스 상태 정보를 주기적으로 수신하고, 각 노드의 상태를 결정하여 노드의 상태를 나타내는 노드 상태 정보를 운용자에게 출력할 수 있다. The server process 250 operates in the operation server 150. The server process 250 periodically receives process status information of a node from an agent process of each node (nodes 1,..., Node n), and node status information indicating the status of the node by determining the status of each node. Can be output to the operator.

도 3은 노드에서 프로세스 장애를 감시하여 운용 서버로 보고하는 흐름의 일 예를 나타내는 순서도이다. 3 is a flowchart illustrating an example of a flow of monitoring a process failure in a node and reporting it to a production server.

설명의 편의를 위하여, 도 1의 노드 1(111)의 동작을 중심으로 설명한다. For convenience of explanation, the description will be given based on the operation of the node 1 111 of FIG. 1.

노드 1(111)은 에이전트 프로세스(도 2의 211-1)가 시작되면 자신의 노드에서 기능 동작에 필요한 프로세스들에 대한 정보를 데이터베이스(DB)로부터 읽어 감시 대상 프로세스 리스트를 생성한다(310). 데이터베이스는 노드 1(111)에서 수행되어야 하는 프로세스 리스트 정보를 포함할 수 있다. When the agent process 111 (211-1 of FIG. 2) is started, the node 1 111 reads information about processes required for a function operation from its node from the database DB and generates a monitored process list (310). The database may include process list information to be performed at node 1 111.

노드 1(111)은 소정의 프로세스 상태 검사 주기 동안 감시 대상 프로세스들에 대해 동작 상태를 검사한다(320). 이를 위해, 노드 1(111)은 프로세스들의 상태를 검사하기 위한 타이머를 등록하고, 타이머가 타임 아웃이 되기를 대기하였다가, 정상 동작 상태인지를 검사할 수 있다. 프로세스가 좀비(zombie) 상태이거나 존재하지 않는다면 노드 1(111)은 그 프로세스는 비정상 상태라고 판단할 수 있다. 노드 1(111)은 노드 1(111)에서 수행하는 복수의 프로세스 중 하나의 프로세스라도 비정상인 경우, 노드 1(111)의 프로세스 상태를 비정상이라고 판단할 수 있다. 노드 1(111)은 프로세스 상태를 나타내는 프로세스 상태 보고 메시지를 생성하여 운용 서버(150)로 전송한다. The node 1 111 checks an operation state of the monitored processes for a predetermined process state checking period (320). To this end, node 1 111 may register a timer for checking the status of processes, wait for the timer to time out, and check whether it is in a normal operating state. If the process is in a zombie state or does not exist, node 1 111 may determine that the process is in an abnormal state. The node 1 111 may determine that the process state of the node 1 111 is abnormal when even one of the plurality of processes performed by the node 1 111 is abnormal. The node 1 111 generates a process status report message indicating the process status and transmits it to the operation server 150.

프로세스 상태가 정상이면(330), 노드 1(111)은 프로세스 상태가 정상임을 나타내는 ACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 운용 서버(150)로 송신한다(340). ACTIVE 값은 '1'로 나타낼 수 있다. If the process status is normal 330, the node 1 111 transmits a process status report message including the process status information indicating the ACTIVE value indicating that the process status is normal to the operation server 150 (340). The ACTIVE value may be represented by '1'.

프로세스 상태가 비정상이면(340), 노드 1(111)은 프로세스 상태가 비정상임을 나태나는 INACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 운용 서버(150)로 송신한다(350). INACTIVE 값은 '0'으로 나타낼 수 있다. 노드 1(111)은 프로세스 상태 보고 메시지가 전송되면, 이후 프로세스들의 상태를 주기적으로 감시하기 위해 새로운 프로세스 상태 검사 주기를 시작한다. If the process status is abnormal (340), node 1 111 transmits a process status report message including process status information indicating an INACTIVE value indicating that the process status is abnormal to operation server 150 (350). The INACTIVE value may be represented by '0'. Node 1 111, when a process status report message is sent, then starts a new process status check cycle to periodically monitor the status of the processes.

도 4는 도 1의 운용 서버(150)에서 노드 장애를 감시하는 흐름의 일 예를 나타내는 순서도이다. 4 is a flowchart illustrating an example of a flow of monitoring a node failure in the operation server 150 of FIG. 1.

도 4는 운용 서버(150)의 하나의 노드 상태 감시 주기 동안의 동작을 나타낸다. 노드 상태 감시 주기는 네트워크상의 모든 노드들에 대해 동일하게 설정될 수 있고, 각 노드마다 별도로 설정될 수도 있다. 설명의 편의를 위해, 이하에서는 모든 노드들에 대한 감시 주기가 동일하게 설정된 것으로 가정한다. 4 shows the operation during one node state monitoring period of the operation server 150. The node status monitoring period may be set identically for all nodes on the network, or may be set separately for each node. For convenience of explanation, hereinafter, it is assumed that the monitoring period for all nodes is set to be the same.

운용 서버(150)는 서버 프로세스(250)가 시작되면 노드들의 상태를 감시하기 위한 타이머를 등록하고, 노드 상태 감시 주기가 시작되면 노드 장애 감시 동작을 시작한다. The operation server 150 registers a timer for monitoring the status of nodes when the server process 250 starts, and starts a node failure monitoring operation when the node status monitoring cycle starts.

운용 서버(150)의 노드들의 링크가 제대로 연결되어 있지 않거나 노드 자체가 다운된 상태인지를 검사하기 위해 핑 요청을 각 노드들에게 송신한다(410). A ping request is sent to each node to check whether the nodes of the operation server 150 are not properly connected or the node itself is down (410).

운용 서버(150)는 노드 상태 감시 주기가 시작되면, 각 노드의 핑 상태 정보를 초기화할 수 있다. 예를 들어, 핑 상태 정보는 핑 상태 플래그(PingFlag)로 나타낼 수 있으며, 운용 서버(150)는 노드 상태 감시 주기가 시작되면, 핑 상태 플래그(PingFlag)를 핑 응답이 미수신된 상태임을 나타내는 NOK로 설정할 수 있다. The operation server 150 may initialize the ping state information of each node when the node state monitoring cycle starts. For example, the ping status information may be represented by a ping status flag (PingFlag), and when the node status monitoring cycle starts, the operation server 150 uses the ping status flag (PingFlag) as a NOK indicating that the ping response is not received. Can be set.

운용 서버(150)는 이후, 노드 상태 감시 주기가 종료(time-out)될 때까지 각 노드에서 응답하는 핑 응답의 수신 또는 노드에서 주기적으로 보고하는 프로세스 상태 보고의 수신을 대기한다. 설명의 편의를 위하여, 노드들 중 노드 1(111)을 중심으로 설명한다. The operations server 150 then waits for the reception of a ping response from each node or for the process status report periodically reported by the node until the node status monitoring cycle times out. For convenience of explanation, the following description will be made based on the node 1 111 among the nodes.

노드 1(111)로부터 핑 응답을 수신하면(420), 운용 서버(150)는 핑 응답의 정상 수신 상태를 나타내도록 핑 상태 정보를 설정한다. 예를 들어, 운용 서버(150)는 핑 상태 정보에 대응하는 핑 상태 플래그(PingFlag)를 NOK에서 응답이 정상 수신되었음을 나타내는 OK로 변경하고, 다시 대기 상태로 천이할 수 있다. 노드 1(111)로부터 노드 상태 감시 주기가 경과(time-out)될 때까지 핑 응답을 수신하지 못하면(420), 핑 상태 플래그(PingFlag)를 NOK로 남아있게 될 것이다. Upon receiving the ping response from node 1 111 (420), the operations server 150 sets the ping status information to indicate the normal reception status of the ping response. For example, the operation server 150 may change the ping state flag PingFlag corresponding to the ping state information to OK indicating that the response is normally received in the NOK, and then transition back to the standby state. If a ping response is not received from node 1 111 until the node status monitoring period has elapsed (time-out) (420), the ping status flag (PingFlag) will remain NOK.

운용 서버(150)는 노드 1(111)로부터 프로세스 상태 보고 메시지를 수신하고(440), 프로세스 상태 보고 메시지에 포함된 프로세스 상태 보고 내용이 해당 프로세스가 정상임을 나타내면(450), 프로세스 상태 정보를 정상을 나타내는 값으로 설정한다(460). 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 프로세스 상태 정보로 설정할 수 있다. 프로세스 상태 정보는 프로세스 상태 플래그(ProcStFg)로 나타낼 수 있고, 동작 460에서, 운용 서버(150)는 프로세스 상태 플래그(ProcStFg)에 OK로 설정하고 대기 상태로 천이할 수 있다. The operation server 150 receives the process status report message from the node 1 111 (440), and if the process status report included in the process status report message indicates that the process is normal (450), the process status information is normal. Set to a value indicating (460). The value indicating the process status included in the process status report message may be set as process status information. The process status information may be represented by a process status flag ProcStFg, and in operation 460, the production server 150 may set the process status flag ProcStFg to OK and transition to the standby state.

프로세스 상태 보고 내용이, 해당 프로세스가 비정상임을 나타내면(450), 프로세스 상태 정보를 비정상을 나타내는 값으로 설정한다(470). 동작 470에서, 운용 서버(150)는 프로세스 상태 플래그(ProcStFg)에 NOK를 설정하고 대기 상태로 천이할 수 있다. If the process status report indicates that the process is abnormal (450), the process status information is set to a value indicating abnormality (470). In operation 470, the operation server 150 may set NOK in the process status flag ProcStFg and transition to the standby state.

노드 상태 감시 주기가 경과되면, 운용 서버(150)는 노드 상태를 최종적으로 결정하고, 결정된 노드 상태를 표시한다(480). When the node state monitoring period elapses, the operation server 150 finally determines the node state and displays the determined node state (480).

운용 서버(150)는 노드 1(111)의 핑 상태 플래그(PingFlag)가 OK인지를 검사하여 NOK이면, 노드 상태 정보(NodeSt)에 노드의 링크 연결이 이상이 있거나 노드 자체가 다운된 상태임을 나타내는 DISCONNECTED를 설정할 수 있다. The operation server 150 checks whether the ping state flag PingFlag of the node 1 111 is OK, and if it is NOK, it indicates that there is an abnormal link connection of the node in the node state information NodeSt or that the node itself is down. DISCONNECTED can be set.

핑 상태 정보(PingFlag)가 OK이면, 운용 서버(150)는 프로세스 상태 플래그(ProcStFg)가 ACTIVE인지를 판단하여, 프로세스 상태 플래그(ProcStFg)가 ACTIVE인 경우 노드 상태 정보(NodeSt)에 노드 상태가 정상임을 나타내는 NODE_OK를 설정한다. 핑 상태 정보(PingFlag)가 OK이며 프로세스 상태 플래그(ProcStFg)가 INACTIVE인 경우, 운용 서버(150)는 노드 상태 정보(NodeSt)에 노드 상태가 비정상임을 나타내는 NODE_NOK를 설정한다. If the ping state information PingFlag is OK, the operation server 150 determines whether the process state flag ProcStFg is ACTIVE, and if the process state flag ProcStFg is ACTIVE, the node state is normal in the node state information NodeSt. Set NODE_OK to indicate that. If the ping state information PingFlag is OK and the process state flag ProcStFg is INACTIVE, the operation server 150 sets NODE_NOK indicating that the node state is abnormal in the node state information NodeSt.

이와 같이, 노드의 상태 정보(NodeSt)에 노드 상태를 설정한 후, 이를 운용자에게 알려주기 위해 운용 단말에 표시하는 기능을 수행하고, 노드의 상태를 주기적으로 감시하기 위해 감시 타이머를 등록하는 과정으로 천이할 수 있다. As such, after setting the node state in the node state information (NodeSt), it performs a function of displaying to the operating terminal to inform the operator of this, and registers a watchdog timer to periodically monitor the state of the node. You can transition.

설명의 편의를 위하여 노드 1(111)의 동작을 중심으로 설명하였으나, 운용 서버(150)는 각 노드에 대한 핑 상태 정보, 프로세스 상태 정보를 관리하고, 각 노드의 핑 상태 정보 및 프로세스 상태 정보에 따라 각 노드에 대한 노드 상태를 결정하고 관리할 수 있다. For convenience of description, the operation of the node 1 111 has been described, but the operation server 150 manages the ping state information and the process state information for each node, and the ping state information and the process state information of each node. This allows you to determine and manage node status for each node.

도 5는 도 1의 운용 서버(150)의 구성의 일 예를 나타내는 도면이다. FIG. 5 is a diagram illustrating an example of a configuration of the operation server 150 of FIG. 1.

운용 서버(150)는 상태 관리부(510), 핑 메시지 생성부(520), 통신부(530), 감시 주기 관리부(540) 및 상태 표시부(550)를 포함할 수 있다. The operation server 150 may include a state manager 510, a ping message generator 520, a communication unit 530, a monitoring cycle manager 540, and a status display unit 550.

상태 관리부(510)는 서버 프로세스(도 2의 250)를 실행하여, 네트워크상의 각 노드의 상태를 감시하여 각 노드의 상태를 결정하고 각 노드의 상태를 나타내는 노드 상태 정보를 생성한다. 노드 상태 정보는 각 노드마다 생성되어 관리될 수 있다. 상태 관리부(510)는 핑 메시지 생성부(520), 통신부(530), 감시 주기 관리부(540) 및 상태 표시부(550)를 제어할 수 있다. The state manager 510 executes a server process (250 of FIG. 2), monitors the state of each node on the network, determines the state of each node, and generates node state information indicating the state of each node. Node state information may be generated and managed for each node. The state manager 510 may control the ping message generator 520, the communication unit 530, the monitoring cycle manager 540, and the state display unit 550.

핑 메시지 생성부(520)는 네트워크의 노드들로 핑 응답을 요청하는 핑 메시지를 생성한다. The ping message generator 520 generates a ping message requesting a ping response to nodes of a network.

통신부(530)는 핑 메시지 생성부(520)에서 생성된 핑 요청 메시지를 노드들로 전송하고, 각 노드들로부터 핑 응답 메시지를 수신하도록 구성될 수 있다. 통신부(530)는 노드들로부터 각 노드상의 프로세스들의 상태를 나타내는 프로세스 상태 보고 메시지를 수신하여 상태 관리부(510)로 전달할 수 있다. The communication unit 530 may be configured to transmit the ping request message generated by the ping message generator 520 to the nodes and to receive the ping response message from each node. The communication unit 530 may receive a process status report message indicating the status of processes on each node from the nodes and transmit the process status report message to the state manager 510.

감시 주기 관리부(540)는 노드 상태 감시 주기를 생성한다. 노드 상태 감시 주기는 각 노드들에 대하여 동일하게 설정되거나 별도로 설정될 수 있다. 감시 주기 관리부(540)는 각 노드 상태 감시 주기의 시작 및 종료를 상태 관리부(510)로 통지할 수 있다. The watch cycle manager 540 generates a node state watch cycle. The node status monitoring period may be set identically or separately for each node. The monitoring period manager 540 may notify the state manager 510 of the start and end of each node state monitoring cycle.

상태 표시부(550)는 상태 관리부(510)에서 결정된 노드 상태를 나태는 노드 상태 정보를 표시한다. The state display unit 550 displays node state information indicating a node state determined by the state manager 510.

상태 관리부(510)는, 노드 상태 감시 주기가 시작되면, 핑 메시지를 노드들로 전송할 수 있다. 상태 관리부(510)는 노드들 중 노드 1(111)로부터 핑 메시지에 대한 핑 응답(또는 핑 응답 메시지)을 수신하면 핑 응답의 정상 수신을 나타내는 핑 상태 정보를 설정하고, 노드 1(111)로부터 프로세스 상태 보고를 수신하면 프로세스 상태를 나타내는 프로세스 상태 정보를 설정하고, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 노드 상태 정보를 설정한다. The state manager 510 may transmit a ping message to the nodes when the node state monitoring cycle starts. When the state manager 510 receives the ping response (or ping response message) for the ping message from the node 1 111 of the nodes, sets the ping state information indicating the normal reception of the ping response, and from the node 1 111. Upon receiving the process status report, process status information indicating the process status is set, and node status information is set using the ping status information and the process status information.

상태 관리부(510)는, 노드 1(111)에 대한 핑 상태 정보를 핑 응답의 수신 상태를 미수신 상태임을 나타내는 NOK로 초기화하고, 노드 1(111)로부터 핑 응답을 수신하면, 핑 상태 정보를 핑 응답이 정상적으로 수신되었음을 나타내는 OK로 변경할 수 있다. The state manager 510 initializes the ping state information for the node 1 111 to a NOK indicating that the reception state of the ping response is unreceived, and pings the ping state information when receiving the ping response from the node 1 111. You can change it to OK to indicate that the response was received successfully.

상태 관리부(510)는, 노드 상태 감시 주기가 종료되면, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 각 노드의 노드 상태를 결정하고 각 노드에 대한 노드 상태 정보를 생성할 수 있다. 상태 관리부(510)는 노드 1(111)에 대한 노드 상태 정보를 다음과 같이 설정할 수 있다. When the node state monitoring cycle ends, the state manager 510 may determine the node state of each node using the ping state information and the process state information, and generate node state information for each node. The state manager 510 may set node state information of the node 1 111 as follows.

상태 관리부(510)는, 노드 1(111)로부터 핑 응답을 수신하고, 프로세스 상태를 나타내는 값이 프로세스가 정상임을 나타내는 ACTIVE 값인 경우, 노드 1(111)의 노드 상태 정보를 정상임을 나타내는 NODE_OK로 설정할 수 있다. 또한, 상태 관리부(510)는 노드 1(111)로부터 핑 응답을 수신하고, 프로세스 상태를 나타내는 값이 프로세스가 비정상임을 나타내는 INACTIVE 값인 경우, 노드 1(111)의 노드 상태 정보를 비정상임을 나타내는 NODE_NOK로 설정할 수 있다. 또한, 상태 관리부(510)는 노드 1(111)로부터 핑 응답을 수신하지 못한 경우, 노드 1(111)의 노드 상태 정보를 DISCONNECT로 설정할 수 있다. The state manager 510 receives the ping response from the node 1 111, and sets the node state information of the node 1 111 to NODE_OK when the value indicating the process state is an ACTIVE value indicating that the process is normal. Can be. In addition, if the state management unit 510 receives the ping response from the node 1 111, and the value indicating the process state is an INACTIVE value indicating that the process is abnormal, the node state information of the node 1 111 is NODE_NOK indicating the abnormal state. Can be set. In addition, when the state manager 510 does not receive a ping response from the node 1 111, the state manager 510 may set node state information of the node 1 111 to DISCONNECT.

상태 표시부(550)가 설정된 노드 상태 정보를 표시하면, 감시 주기 관리부(540)는, 새로운 노드 상태 감시 주기를 등록하여 새로운 노드 상태 감시 주기를 개시한다. When the status display unit 550 displays the set node status information, the monitoring period manager 540 registers a new node status monitoring period to start a new node status monitoring period.

도 6은 본 발명의 일 실시예에 따른 노드의 구성을 나타내는 도면이다. 6 is a view showing the configuration of a node according to an embodiment of the present invention.

일 실시예에 따른 노드를 노드 1(111)로 가정하면, 노드 1(111)은 프로세스 수행부(610), 프로세스 정보 데이터베이스(620), 검사 주기 관리부(630), 프로세스 상태 검사부(640) 및 상태 보고부(650)를 포함할 수 있다. Assuming a node according to an embodiment as a node 1 (111), the node 1 (111) is a process performing unit 610, a process information database 620, an inspection cycle management unit 630, a process state inspection unit 640 and It may include a status report unit 650.

프로세스 수행부(610)는 노드 1(111)의 하나 이상의 프로세스를 수행한다. 프로세스 수행부(610)는 도 2의 메인 프로세스들(211-2, 211-3)을 수행할 수 있다. The process execution unit 610 performs one or more processes of the node 1 111. The process execution unit 610 may perform the main processes 211-2 and 211-3 of FIG. 2.

프로세스 정보 데이터베이스(620)는 노드 1(111)의 기능 동작에 필요한 프로세스들에 대한 정보를 저장한다. The process information database 620 stores information about processes required for the functional operation of the node 1 111.

검사 주기 관리부(630)는 프로세스 상태 검사 주기를 생성하고 관리한다. The inspection cycle manager 630 generates and manages a process state inspection cycle.

프로세스 상태 검사부(640)는 에이전트 프로세스(도 2의 211-1)를 실행하여, 프로세스 정보 데이터베이스(620)로부터 프로세스 정보를 읽어 감시 대상 프로세스 리스트를 생성하고, 프로세스 상태 검사 주기 동안 프로세스 수행부(610)에서 수행되는 감시 대상 프로세스들의 정상 동작 상태를 검사하여 검사 결과를 생성한다. 프로세스 상태 검사부(640)는 복수의 프로세스 중 하나의 프로세스라도 비정상인 경우, 프로세스 상태를 비정상으로 결정할 수 있다. The process state inspecting unit 640 executes an agent process (211-1 in FIG. 2), reads process information from the process information database 620, generates a monitored process list, and executes the process performing unit 610 during a process state checking cycle. The test results are generated by checking the normal operation status of the monitored processes performed in the C). The process status checker 640 may determine the process status as abnormal when any one of a plurality of processes is abnormal.

프로세스 상태 검사부(640)는 검사 결과에 따른 감시 대상 프로세스 상태를 나타내는 프로세스 상태 보고 메시지를 생성한다. 프로세스 상태 검사부(640)는 프로세스 상태가 정상이면 프로세스 상태가 정상임을 나타내는 ACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 생성하고, 프로세스 상태가 비정상이면, 프로세스 상태가 비정상임을 나태나는 INACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 생성한다. 상태 보고부(650)는 프로세스 상태 보고 메시지를 운용 서버(150)로 보고한다. The process status inspecting unit 640 generates a process status report message indicating the monitored process status according to the inspection result. The process status checker 640 generates a process status report message including process status information indicating an ACTIVE value indicating that the process status is normal when the process status is normal, and an INACTIVE indicating that the process status is abnormal when the process status is abnormal. Generates a process status report message that contains process status information indicating a value. The status report unit 650 reports the process status report message to the operation server 150.

프로세스 상태 검사부(640)가 검사 결과를 생성하면, 검사 주기 관리부(630)는 다음 프로세스 상태 검사 주기를 등록하고, 등록된 검사 주기가 시작됨을 프로세스 상태 검사부(640)로 통지하여 프로세스 상태 검사부(640)가 다음 검사 주기 동안 감시 대상 프로세스들의 정상 동작 상태를 검사하도록 한다. When the process status checker 640 generates the test result, the test cycle checker 630 registers the next process status check cycle, and notifies the process status checker 640 that the registered check cycle is started to process the process checker 640. ) To check the normal operation of the monitored processes during the next inspection cycle.

도 7은 본 발명의 일 실시예에 따른 운용 서버에서 설정된 노드 상태 정보가 표시되는 화면의 일 예를 나타내는 도면이다. 7 is a diagram illustrating an example of a screen on which node state information set in an operation server according to an embodiment of the present invention is displayed.

노드 상태 정보는 도 7에 도시된 바와 같은 이미지 정보로 제공될 수 있다. 노드 상태 정보 표시 화면에는, 운용 서버, 코어 라우터, 라우터 1, 라우터 2, 라우터 3, 노드 1, 노드 2 및 노드 3이 포함될 수 있다. 코어 라우터, 라우터 1, 라우터, 2 및 라우터 3는 도 1의 액세스 네트워크 #1(110), 액세스 네트워크 #2(120), 액세스 네트워크 #3(130), 코어 네트워크(140) 각각을 대표하는 이미지이다. 노드 1, 노드 2 및 노드 3은 라우터 1, 라우터 2, 및 라우터 3에 연결된 노드를 나타낸다. The node state information may be provided as image information as shown in FIG. 7. The node status information display screen may include an operation server, a core router, a router 1, a router 2, a router 3, a node 1, a node 2, and a node 3. Core router, router 1, router 2, and router 3 are images representing each of access network # 1 (110), access network # 2 (120), access network # 3 (130), and core network 140 of FIG. to be. Node 1, node 2 and node 3 represent nodes connected to router 1, router 2, and router 3.

각 노드의 하단에는 노드 상태 정보가 각각 NODE_OK, NODE_NOK, DISCONNECTED로 표시될 수 있다. 또한, 운용 서버의 핑 요청에 대한 핑 응답을 전송하지 않은 노드(도 7의 노드 3)는 핑 응답을 전송한 노드(도 7의 노드 1 및 노드 2)와 구분되도록 표시할 수 있다. 예를 들어, 도 7에 도시된 바와 같이, 다른 노드들이 각 라우터들과 실선으로 연결된 것과 달리 노드 3과 라우터 3과의 연결을 점선으로 나타내어, 노드 3으로부터는 핑 응답을 받지 못하였음을 나타낼 수 있다. At the bottom of each node, node status information may be displayed as NODE_OK, NODE_NOK, and DISCONNECTED, respectively. In addition, a node (node 3 of FIG. 7) that does not transmit the ping response to the ping request of the production server may be displayed to be distinguished from nodes (node 1 and node 2 of FIG. 7) that transmitted the ping response. For example, as shown in FIG. 7, unlike other nodes connected in solid lines with each router, the connection between node 3 and router 3 is indicated by a dotted line, indicating that the node 3 has not received a ping response. have.

본 발명의 일 양상은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있다. 상기의 프로그램을 구현하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 디스크 등을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드로 저장되고 실행될 수 있다.One aspect of the present invention may be embodied as computer readable code on a computer readable recording medium. The code and code segments implementing the above program can be easily deduced by a computer programmer in the field. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical disk, and the like. The computer-readable recording medium may also be distributed over a networked computer system and stored and executed in computer readable code in a distributed manner.

이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구범위에 기재된 내용과 동등한 범위 내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다. It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the invention. Therefore, the scope of the present invention should not be limited to the above-described embodiments, but should be construed to include various embodiments within the scope of the claims.

Claims (15)

운용 서버에서 네트워크상의 노드들에 대한 장애를 감시하는 방법으로서,
네트워크의 노드들로 핑 요청을 송신하는 단계;
상기 노드들 중 제1 노드로부터 핑 응답을 수신하면 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정하는 단계;
제1 노드로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 상기 프로세스 상태 정보를 설정하는 단계; 및
핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태를 결정하고 노드 상태를 표시하는 단계; 를 포함하는 것을 특징으로 하는 방법.
A method of monitoring a failure of nodes on a network in a production server,
Sending a ping request to nodes in the network;
Setting ping state information to indicate normal reception of a ping response upon receiving a ping response from a first one of the nodes;
Setting the process state information by using a value indicating a process state included in a process state report message when receiving a process state report message from a first node; And
Determining a node state of the first node and displaying the node state using the ping state information and the process state information; ≪ / RTI >
제1항에 있어서,
상기 제1 노드에 대한 핑 상태 정보를 핑 응답이 미수신 상태임을 나타내는 NOK로 초기화하는 단계; 및
상기 제1 노드로부터 핑 응답을 수신하면, 상기 핑 상태 정보를 핑 응답이 정상적으로 수신되었음을 나타내는 OK로 설정하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
The method of claim 1,
Initializing the ping state information for the first node to a NOK indicating that a ping response is not received; And
If the ping response is received from the first node, setting the ping status information to OK indicating that the ping response has been successfully received.
제1항에 있어서,
상기 프로세스 상태 보고는, 제1 노드에서 동작하는 하나 이상의 프로세스가 정상 상태인지 여부를 나타내는 정보를 포함하는 것을 특징으로 하는 방법.
The method of claim 1,
The process status report includes information indicating whether at least one process operating at the first node is in a normal state.
제1항에 있어서,
핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태 정보를 생성하여 표시하는 단계는,
상기 제1 노드로부터 핑 응답을 수신하고, 상기 프로세스 상태를 나타내는 값이 프로세스가 정상임을 나타내는 ACTIVE 값인 경우, 상기 노드 상태 정보를 정상임을 나타내는 NODE_OK로 설정하는 단계; 및
상기 제1 노드로부터 핑 응답을 수신하고, 상기 프로세스 상태를 나타내는 값이 프로세스가 비정상임을 나타내는 INACTIVE 값인 경우, 상기 노드 상태 정보를 비정상임을 나타내는 NODE_NOK로 설정하는 단계;를 포함하는 것을 특징으로 하는 방법.
The method of claim 1,
Generating and displaying node state information of the first node using the ping state information and the process state information may include:
Receiving a ping response from the first node, and setting the node state information to NODE_OK indicating that the node state information is normal when the value indicating the process state is an ACTIVE value indicating that the process is normal; And
Receiving a ping response from the first node, and if the value indicating the process state is an INACTIVE value indicating that the process is abnormal, setting the node state information to NODE_NOK indicating abnormality.
제4항에 있어서,
핑 상태 정보 및 프로세스 상태 정보를 이용하여 제1 노드의 노드 상태 정보를 생성하여 표시하는 단계는,
상기 제1 노드로부터 핑 응답을 수신하지 못한 경우, 상기 노드 상태 정보를 제1 노드와의 링크 연결에 문제가 있음을 나타내는 DISCONNECT로 설정하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
5. The method of claim 4,
Generating and displaying node state information of the first node using the ping state information and the process state information may include:
If not receiving a ping response from the first node, setting the node state information to DISCONNECT indicating that there is a problem with a link connection with the first node.
제1항에 있어서,
노드 상태 감시 주기를 생성하는 단계;를 더 포함하고,
상기 노드 상태 감시 주기가 시작되면, 상기 핑 메시지를 노드들로 전송하는 단계가 수행되고, 상기 노드 상태 감시 주기가 종료되면, 상기 핑 상태 정보 및 상기 프로세스 상태 정보를 이용하여 노드 상태 정보를 생성하여 표시하는 단계가 수행되는 것을 특징으로 하는 방법.
The method of claim 1,
Generating a node status monitoring period;
When the node status monitoring cycle starts, transmitting the ping message to the nodes is performed, and when the node status monitoring cycle ends, the node status information is generated using the ping status information and the process status information. And the displaying step is performed.
제1항에 있어서,
노드 상태 정보를 표시하면, 새로운 노드 상태 감시 주기를 등록하여 새로운 노드 상태 감시 주기를 개시하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
The method of claim 1,
If displaying the node status information, registering a new node status monitoring period to initiate a new node status monitoring period.
네트워크상의 노드들에 대한 장애를 감시하는 운용 서버로서,
네트워크의 노드들로 핑 응답을 요청하는 핑 메시지를 생성하는 핑 메시지 생성부;
핑 메시지를 노드들로 전송하고, 상기 노드들로부터 각 노드상의 프로세스들의 상태를 나타내는 프로세스 상태 보고 메시지를 수신하는 통신부;
노드들 중 제1 노드로부터 핑 응답을 수신하면 핑 응답의 정상 수신을 나타내도록 핑 상태 정보를 설정하고, 제1 노드로부터 프로세스 상태 보고 메시지를 수신하면 프로세스 상태 보고 메시지에 포함된 프로세스 상태를 나타내는 값을 이용하여 프로세스 상태 정보를 설정하고, 핑 상태 정보 및 프로세스 상태 정보를 이용하여 노드 상태 정보를 설정하는 상태 관리부; 및
설정된 노드 상태 정보를 표시하는 상태 표시부; 를 포함하는 것을 특징으로 하는 운용 서버.
An operational server that monitors failures of nodes on a network.
Ping message generating unit for generating a ping message requesting a ping response to the nodes of the network;
A communication unit for transmitting a ping message to the nodes and receiving a process status report message indicating the status of processes on each node from the nodes;
If the ping response is received from the first node among the nodes, the ping status information is set to indicate normal reception of the ping response. If the process status report message is received from the first node, the value indicates the process status included in the process status report message. A state manager configured to set process state information using the state, and set node state information using the ping state information and the process state information; And
A status display unit displaying set node status information; Operation server comprising a.
제8항에 있어서,
상기 상태 관리부는, 상기 제1 노드에 대한 핑 상태 정보를 핑 응답이 미수신된 상태임을 나타내는 NOK로 초기화하고, 상기 제1 노드로부터 핑 응답을 수신하면, 상기 핑 상태 정보를 핑 응답이 정상적으로 수신되었음을 나타내는 OK로 설정하는 것을 특징으로 하는 운용 서버.
9. The method of claim 8,
The state manager initializes the ping state information for the first node to a NOK indicating that a ping response has not been received, and when the ping response is received from the first node, the ping state information is normally received. Operation server characterized by setting to OK indicating.
제8항에 있어서, 상기 상태 관리부는,
상기 제1 노드로부터 핑 응답을 수신하고, 상기 프로세스 상태를 나타내는 값이 프로세스가 정상임을 나타내는 ACTIVE 값인 경우, 상기 노드 상태 정보를 정상임을 나타내는 NODE_OK로 설정하고,
상기 제1 노드로부터 핑 응답을 수신하고, 상기 프로세스 상태를 나타내는 값이 프로세스가 비정상임을 나타내는 INACTIVE 값인 경우, 상기 노드 상태 정보를 비정상임을 나타내는 NODE_NOK로 설정하고,
상기 제1 노드로부터 핑 응답을 수신하지 못한 경우, 상기 노드 상태 정보를 제1 노드와의 링크 연결에 문제가 있음을 나타내는 DISCONNECT로 설정하는 것을 특징으로 하는 운용 서버.
The method of claim 8, wherein the state management unit,
When the ping response is received from the first node and the value indicating the process state is an ACTIVE value indicating that the process is normal, the node state information is set to NODE_OK indicating that the process is normal,
When the ping response is received from the first node and the value indicating the process state is an INACTIVE value indicating that the process is abnormal, the node state information is set to NODE_NOK indicating abnormality.
And when the ping response is not received from the first node, set the node state information to DISCONNECT indicating that there is a problem in link connection with the first node.
제8항에 있어서,
노드 상태 감시 주기를 생성하는 감시 주기 관리부;를 더 포함하고,
상기 상태 관리부는, 상기 노드 상태 감시 주기가 시작되면, 상기 핑 메시지를 노드들로 전송하고, 상기 노드 상태 감시 주기가 종료되면, 상기 상태 관리부는 핑 상태 정보 및 프로세스 상태 정보를 이용하여 노드 상태 정보를 설정하는 것을 특징으로 하는 운용 서버.
9. The method of claim 8,
And a watch cycle manager for generating a node state watch cycle.
The state manager transmits the ping message to the nodes when the node state monitoring cycle starts, and when the node state monitoring cycle ends, the state manager uses the ping state information and the process state information. Operation server, characterized in that for setting.
제9항에 있어서,
상기 상태 표시부가 설정된 노드 상태 정보를 표시하면, 상기 감시 주기 관리부는, 새로운 노드 상태 감시 주기를 등록하여 새로운 노드 상태 감시 주기를 개시하는 것을 특징으로 하는 운용 서버.
10. The method of claim 9,
And the monitoring period management unit registers a new node status monitoring period to start a new node status monitoring period.
기능 동작에 필요한 프로세스들에 대한 정보를 저장하는 프로세스 정보 데이터베이스;
상기 프로세스 정보 데이터베이스로부터 상기 프로세스 정보를 읽어 감시 대상 프로세스 리스트를 생성하고, 감시 대상 프로세스들의 정상 동작 상태를 검사하는 프로세스 상태 검사부; 및
검사 결과에 따른 감시 대상 프로세스 상태를 운용 서버로 보고하는 상태 보고부;를 포함하는 것을 특징으로 하는 네트워크 노드.
A process information database for storing information about processes required for functioning;
A process state inspecting unit configured to read the process information from the process information database to generate a monitored process list and to check a normal operation state of the monitored processes; And
And a status reporter for reporting the status of the monitored process according to the inspection result to the operation server.
제13항에 있어서,
프로세스 상태 검사 주기를 생성하는 검사 주기 관리부; 를 더 포함하고,
상기 프로세스 상태 검사부는, 상기 프로세스 상태 검사 주기 동안 감시 대상 프로세스들의 정상 동작 상태를 검사하여 검사 결과를 생성하는 것을 특징으로 하는 네트워크 노드.
The method of claim 13,
An inspection cycle management unit generating a process state inspection cycle; Further comprising:
The process state inspecting unit, the network node, characterized in that for generating a test result by inspecting the normal operation state of the monitored process during the process state inspection period.
제13항에 있어서,
상기 프로세스 상태 검사부는, 프로세스 상태가 정상이면 프로세스 상태가 정상임을 나타내는 ACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 생성하고, 프로세스 상태가 비정상이면, 프로세스 상태가 비정상임을 나태나는 INACTIVE 값을 나타내는 프로세스 상태 정보를 포함하는 프로세스 상태 보고 메시지를 생성하는 것을 특징으로 하는 네트워크 노드.
The method of claim 13,
The process status checker generates a process status report message including process status information indicating an ACTIVE value indicating that the process status is normal when the process status is normal, and an INACTIVE value indicating that the process status is abnormal when the process status is abnormal. And generating a process status report message including process status information indicating the status.
KR1020120001688A 2012-01-05 2012-01-05 Method for monitoring node failure on communication network and system thereof KR101572672B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120001688A KR101572672B1 (en) 2012-01-05 2012-01-05 Method for monitoring node failure on communication network and system thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120001688A KR101572672B1 (en) 2012-01-05 2012-01-05 Method for monitoring node failure on communication network and system thereof

Publications (2)

Publication Number Publication Date
KR20130080720A true KR20130080720A (en) 2013-07-15
KR101572672B1 KR101572672B1 (en) 2015-12-04

Family

ID=48992748

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120001688A KR101572672B1 (en) 2012-01-05 2012-01-05 Method for monitoring node failure on communication network and system thereof

Country Status (1)

Country Link
KR (1) KR101572672B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9584392B2 (en) 2014-01-24 2017-02-28 Electronics Telecommunications Research Institute Method and apparatus for managing segments connected via network
CN106685676A (en) * 2015-11-06 2017-05-17 ***通信集团浙江有限公司 Node switching method and device
CN112202635A (en) * 2020-09-27 2021-01-08 浙江三维利普维网络有限公司 Link monitoring method and device, storage medium and electronic device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105553766A (en) * 2015-12-12 2016-05-04 天津南大通用数据技术股份有限公司 Monitoring method of abnormal node dynamic tracking cluster node state

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9584392B2 (en) 2014-01-24 2017-02-28 Electronics Telecommunications Research Institute Method and apparatus for managing segments connected via network
CN106685676A (en) * 2015-11-06 2017-05-17 ***通信集团浙江有限公司 Node switching method and device
CN106685676B (en) * 2015-11-06 2020-02-11 ***通信集团浙江有限公司 Node switching method and device
CN112202635A (en) * 2020-09-27 2021-01-08 浙江三维利普维网络有限公司 Link monitoring method and device, storage medium and electronic device
CN112202635B (en) * 2020-09-27 2022-05-06 浙江三维利普维网络有限公司 Link monitoring method and device, storage medium and electronic device

Also Published As

Publication number Publication date
KR101572672B1 (en) 2015-12-04

Similar Documents

Publication Publication Date Title
US10592330B2 (en) Systems and methods for automatic replacement and repair of communications network devices
US7281040B1 (en) Diagnostic/remote monitoring by email
US20050108389A1 (en) Network endpoint health check
CN107896172B (en) Monitoring fault processing method and device, storage medium and electronic equipment
WO2012046293A1 (en) Fault monitoring device, fault monitoring method and program
CN111008026B (en) Cluster management method, device and system
TW201003383A (en) System for monitoring and diagnosing remote devices
KR101572672B1 (en) Method for monitoring node failure on communication network and system thereof
JPWO2015037603A1 (en) Remote monitoring system, remote monitoring method, and program
CN112653577A (en) Network element management method, device and storage medium
JPH06236337A (en) Method for controlling computer system
CN110971459B (en) Session fault detection method and device, terminal equipment and readable storage medium
JP2010099211A (en) Game error screen reporting system
JP2008148017A (en) Node detection device and program
CN107426030B (en) Link fault reminding method and device
JP2007228421A (en) Ip network route diagnosis apparatus and ip network route diagnosis system
JP2015082131A (en) Monitoring system, monitoring method, monitoring program, and monitoring device
KR101143922B1 (en) Apparatus for automatically restoring a network
JP2006154991A (en) Information processing system, control method of information processing system, monitoring device, monitoring program, and maintenance program
US11457374B2 (en) Hub device with diagnostic function and diagnostic method using the same
US11916806B2 (en) Monitoring a communication system that is used for control and/or surveillance of an industrial process
JP2015171010A (en) communication path management device and program
WO2009107198A1 (en) Transmission device, method for confirming conductivity, and program for confirming conductivity
JPH1131136A (en) Abnormality monitoring method for distributed processing system
JP5764090B2 (en) Terminal state detection apparatus and terminal state detection method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee