KR20060104032A - Snmp를 이용한 범용 원격 모니터링 시스템 - Google Patents

Snmp를 이용한 범용 원격 모니터링 시스템 Download PDF

Info

Publication number
KR20060104032A
KR20060104032A KR1020050025845A KR20050025845A KR20060104032A KR 20060104032 A KR20060104032 A KR 20060104032A KR 1020050025845 A KR1020050025845 A KR 1020050025845A KR 20050025845 A KR20050025845 A KR 20050025845A KR 20060104032 A KR20060104032 A KR 20060104032A
Authority
KR
South Korea
Prior art keywords
management
snmp
failure
network
remote monitoring
Prior art date
Application number
KR1020050025845A
Other languages
English (en)
Inventor
이상원
Original Assignee
주식회사 티디아이시스템즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 티디아이시스템즈 filed Critical 주식회사 티디아이시스템즈
Priority to KR1020050025845A priority Critical patent/KR20060104032A/ko
Publication of KR20060104032A publication Critical patent/KR20060104032A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

본 발명은 SNMP를 이용한 망 관리 시스템에 관한 것으로서, 특히 본 발명은 전산자원에 대한 종합적인 관리를 위하여 SNMP를 이용하여 분산화된 IT자원 및 NMS를 범용으로 통합 관리할 수 있도록 하기 위하여, SNMP(단순망 관리 규약)를 이용한 네트워크 관리 시스템에 있어서, 관리대상이 되는 네트워크에 설치되어 상기 관리대상 네트워크 및 상기 관리대상 네트워크 상에 연결된 장비들을 포함하는 관리대상 시스템을 감시 및 관리하기 위하여 구성정보를 설정하는 콘솔기능을 수행하며, 상기 SNMP를 이용하여 성능 및 장애 데이터를 감시 분석하는 원격 모니터링 서버와; 관리 네트워크에 설치되어 상기 원격 모니터링 서버와 SNMP를 이용하여 통신하며, 상기 관리대상 시스템의 장애 발생시 상기 원격 모니터링 서버로부터 장애내용을 수신하여 발생한 장애를 인지하고 대응하는 관련 조치사항을 제공하는 장애관리시스템;으로 구성됨을 특징으로 하는 SNMP를 이용한 범용 원격 모니터링 시스템을 제공한다.
SNMP, 범용, 원격, 모니터링

Description

SNMP를 이용한 범용 원격 모니터링 시스템{GENERAL REMOTE MONITORING SYSTEM AND METHOD USING SIMPLE NETWORK MANAGEMENT PROTOCOL}
도 1은 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템에 적용되는 SNMP의 기본적인 관리구조를 나타낸 도면,
도 2는 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템에 적용되는 SNMP의 구성 및 SNMP를 사용한 네트워크 관리방법을 보인 도면,
도 3은 본 발명의 바람직한 실시 예에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 구성도,
도 4는 본 발명의 바람직한 실시 예에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 S/W 블록구성도,
도 5는 도 4의 콘솔의 캐비닛 구성과 전체감시 화면을 로드하기 위한 제어흐름도,
도 6은 도 4의 콘솔의 알람수신에 따른 제어흐름도,
도 7은 도 4의 데몬의 제어흐름도,
도 8은 도 4의 알람의 제어흐름도,
도 9는 도 4의 웹의 제어흐름도.
* 도면의 주요 부분에 대한 부호의 설명 *
10: 관리대상 시스템 100: 원격 모니터링 서버
200: 장애관리시스템 110: 콘솔
120: 데몬 130: 알람
140: 웹 150: 데이터베이스
본 발명은 SNMP를 이용한 망 관리 시스템에 관한 것으로서, 특히 본 발명은 전산자원에 대한 종합적인 관리를 위하여 SNMP를 이용하여 분산화된 IT자원 및 NMS를 범용으로 통합 관리할 수 있는 SNMP를 이용한 범용 원격 모니터링 시스템에 관한 것이다.
일반적으로 통신사업자용 시스템(Solaris, NT), Disk Array, SubRack Chassis, 통신사업자용 각종 보드들을 원격에서 감시 관리하는 종래의 IT자원 또는 망 관리 시스템은 네트워크 장비들의 장애관리를 실행하는 유지보수의 기능만을 수행하였다.
장애관리 기능이란 장애가 발생되었을 때 이를 감지하고, 해당되는 장애의 등급에 따라서 운용자에게 필요한 정보를 제공하며, 필요시 운용자의 지시 없이도 규정된 동작을 실행하며, 원격지 망 관리자에게 해당되는 장애정보를 제공하는 기 능으로서, 장애가 복구되었을 때에도 해당되는 장애복구의 정보에 따라서 위의 기능들을 실행하게 된다.
그러나 점차 산업현장에서도 표준화된 관리 프로토콜이 요구되어 지고, 특히 다수의 임의의 장치들을 원격지에서 제어하는 원격지 장치와 실제의 장치 상호간에 데이터 전송 규약에 의한 망 관리에 대한 필요성이 대두됨으로써 SNMP프로토콜(Simple Network Management Protocol, 단순망관리규약, 이하 "SNMP"라 칭함)의 사용이 증가하고 있다.
이러한 망 관리 시스템에는 SMS(Server Management System), NMS(Network Management System) 등이 있는데, 근래의 기업의 전산자원에 대한 종합적인 관리는 SNMP를 이용하여 분산화된 서버, 네트워크장비, 스토리지 등의 IT자원을 통합 관리한다.
그럼에도 불구하고 국내의 여러 회사에서 외국의 회사들로부터 네트워크 장치의 관리를 위한 NMS관련 보드나 스토리지(Storage)관련 제품을 도입하면서 제조회사가 서로 다른 다양한 방식의 제품들을 통합적으로 관리할 수 없는 문제점이 발생하였다.
즉, 각 제조사의 제품들은 각각의 장비를 관리하기 위한 전용 툴이 제각각이고, 고가이므로 제품의 가격이 필요이상으로 상승되는 요인이 되며, 제조사가 다른 각종 장비들이 연합된 시스템을 통합하여 관리하는 범용 툴이 없기 때문에 시스템 운영이나 유지보수 등에 많은 문제점이 있다.
뿐만 아니라, 각 제품별 전용 툴은 전문적인 지식을 보유하고 있는 전문운영 자에 맞게 고안되어 있어 각 기업의 단순관리자가 운용하기에는 어려움이 있기 때문에 시스템의 작은 장애보고나 예비경보에 있어서 적절한 대응을 할 수 없는 문제점이 있었다.
이에 따라, 실제 고가로 구입한 제품이라 할지라도 효율적인 운용이 불가능하고 시스템 관리를 위해 구매한 관리 시스템을 다시 관리하기 위한 부가비용이 끊임없이 발생하는 불합리한 점이 있었다.
따라서 상기한 문제점을 해결하기 위한 본 발명의 목적은 제조사가 다르고 방식이 다른 통신사업자용 장비들의 성능 및 장애를 범용으로 원격에서 감시 및 분석하여 보다 효율적이고 안정적으로 관리할 수 있는 SNMP를 이용한 범용 원격 모니터링 시스템을 제공하는데 있다.
또한, 본 발명의 다른 목적은 기본적인 네트워크 지식만을 습득한 단순관리자가 쉽게 운용할 수 있도록 식별이 용이한 사용자인터페이스를 제공하는 SNMP를 이용한 범용 원격 모니터링 시스템을 제공하는데 있다.
상기와 같은 목적을 달성하기 위하여 본 발명은 SNMP(단순망 관리 규약)를 이용한 네트워크 관리 시스템에 있어서,
관리대상이 되는 네트워크에 설치되어 상기 관리대상 네트워크 및 상기 관리 대상 네트워크 상에 연결된 장비들을 포함하는 관리대상 시스템(10)을 감시 및 관리하기 위하여 구성정보를 설정하는 콘솔(110)기능을 수행하며, 상기 SNMP를 이용하여 성능 및 장애 데이터를 감시 분석하는 원격 모니터링 서버(100)와;
관리 네트워크에 설치되어 상기 원격 모니터링 서버(100)와 SNMP를 이용하여 통신하며, 상기 관리대상 시스템(10)의 장애 발생시 상기 원격 모니터링 서버(100)로부터 장애내용을 수신하여 발생한 장애를 인지하고 대응하는 관련 조치사항을 제공하는 장애관리시스템(200);으로 구성됨을 특징으로 하는 SNMP를 이용한 범용 원격 모니터링 시스템을 제공한다.
또한, 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템에 있어서 상기 원격 모니터링 서버(100)는;
상기 관리대상 시스템(10)의 장비구성을 검색하고 새로운 기기의 추가 및 기존 기기의 제거에 관한 정보를 수집하고 유지하는 구성관리기능과,
상기 관리대상 시스템(10)의 장비의 성능을 감시하고 제어하여 상기 관리대상 시스템(10)의 자원을 관리하는 성능관리기능과,
상기 관리대상 시스템(10)의 장비에 장애 발생 시 이를 감지하고 장애의 원인과 위치를 판별하여 복구하는 고장관리기능을 수행하는 프로그램을 기록한 기록매체를 구비함을 특징으로 한다.
또한, 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템에 있어서 상기 원격 모니터링 서버(100)는;
상기 관리대상 시스템(10)의 상태를 SNMP를 이용하여 감시하고, 수집한 데이 터를 시스템(10)의 상태를 통계기능과 레포팅 기능을 통하여 제공하는 콘솔수단(110)과,
상기 관리대상 시스템(10)의 상태를 SNMP를 이용하여 수집하고, 장애 발생시 NMS(망 관리 시스템)보드 및 스토리지에서 발생한 TRAP(트랩)을 수신하여 성능 임계치 초과, 보드 설정 변경, 시스템(10)의 프로세스 상태 변경에 따른 알람을 생성하는 데몬수단(120)과,
웹브라우저를 이용하여 상기 NMS보드가 장착된 시스템(10) 정보를 관리하며, 발생한 장애에 대한 이력을 검색 및 출력하는 웹수단(140) 및,
상기 데몬(120)으로부터 장애 발생시 NMS(망 관리 시스템)보드 및 스토리지에서 발생한 TRAP(트랩)을 수신하여 성능 임계치 초과, 보드 설정 변경, 시스템(10)의 프로세스 상태 변경에 따른 알람을 수신하여 상기 콘솔(110)로 통보하고, 이를 데이터베이스(150)에 저장하여 상기 콘솔(110) 및 상기 웹(140)에서 장애보고서에 장애이력을 출력할 수 있도록 하는 알람수단(130)으로 구성됨을 특징으로 한다.
이하 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 우선 각 도면의 구성 요소들에 참조부호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 그리고 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
네트워크를 관리하기 위한 4가지 모델은 관리 시스템, 관리대상 에이전트 (Agent), MIB(Management Information Base, 관리 정보 베이스), 네트워크관리 프로토콜로 구성된다.
상기 관리 시스템은 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템으로서, 네트워크 관리자에게 전 네트워크 상황을 볼 수 있는 인터페이스를 제공하며 관리 데이터의 분석, 장애관리 등의 기능수행을 위한 데이터베이스(150)를 구축한다.
본 발명에 따른 상기 네트워크관리 프로토콜은 SNMP프로토콜(이하 "SNMP"라 칭함)로서 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 이해를 돕기 위하여 도 1 및 도 2를 참조하여 SNMP를 간략히 설명한다.
도 1 및 도 2는 본 발명에 적용되는 SNMP의 기본적인 관리구조와 SNMP의 구성 및 SNMP를 사용한 네트워크 관리방법을 보인 도면으로서, 도시된 바와 같이 SNMP의 기본적인 관리구조는 관리대상이 되는 시스템(10)에 설치되어서 필요한 정보를 수집하기 위한 SNMP모듈인 SNMP 에이전트(Agent, 이하 "에이전트"라 칭함)와, 상기 에이전트가 설치된 시스템(10)에 필요한 정보를 요청하는 SNMP모듈인 SNMP 매니저(Manager, 이하 "매니저"라 칭함)로 구성된다.
상기 에이전트는 서비스 제공자로서 허브(Hub), 라우터(Router), 스위치(Switch)와 같은 네트워크 장비에 설치되어 매니저의 요구에 따라 관리정보를 송달하거나 문제 발생시 자동적으로 장애상황을 매니저에 통보한다.
SNMP를 사용한 통신은 매니저와 에이전트 사이에서 MIB를 기초로 GET, SET, TRAP 등 여러 명령어를 사용하여 네트워크를 관리한다. 이러한 명령어들은 모두 매 니저 측에서 발신되나, 에이전트 측에서는 장애 등의 예상치 못한 사태가 발생했을 때에만 매니저에게 TRAP명령을 통지하는 구조로 되어 있다.
상기 MIB는 SNMP에서 관리하는 정보의 데이터베이스(150)와 같은 것으로서, 어떤 항목에 대하여 문의하면 어떤 대답이 되돌아올지를 각각 정해놓은 것으로서, 네트워크 관리를 위하여 상기 매니저와 에이전트 사이에 주고받는 특정한 정보로서 관리되어야 할 특정한 정보(Information) 및 자원(Resourse)들을 모아놓은 집합체이다.
네트워크를 관리한다는 것은 관리대상인 장비(Workstation, Printer Server, File Server, Hub, Router, Switch 등과 같은 통신장비)들이 제공하는 MIB 중에서 특정 값을 얻어 와서 그 장비의 상태를 파악하거나 그 값을 변경함을 의미한다.
값의 변경은 해당 MIB의 스트링(String)이나 수치를 변경시키는 것은 물론이고 값의 변경을 통하여 그 장비의 상태를 변경시킬 수도 있고 그 장비에 일정한 작동을 지시하여 수행할 수 있게 한다.
즉, 인터페이스의 관리값을 수정하여 해당 장비의 통신을 불가능하게 할 수도 있고 허브의 특정 포트로의 전송을 막을 수도 있다. 또한 특정 MIB의 변경을 통하여 허브를 리셋(Reset)시킬 수도 있다.
이에 따라 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템은 도 3에 도시된 바와 같이 관리대상 네트워크에 설치되는 원격 모니터링 서버(100)와 관리 네트워크에 설치되는 장애관리시스템(200)으로 구성된다. 도 3은 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 구성도이다.
상기 원격 모니터링 서버(100)는 관리대상 네트워크에 설치된 NMS관련 시스템(10)을 감시 및 관리하기 위하여 구성정보를 설정하는 콘솔(110)기능을 수행하며, SNMP를 이용하여 성능 및 장애 데이터를 감시 및 분석한다. 이를 이용하여 보다 신속하고 효율적인 시스템 관리를 수행한다.
또한, NMS관련 시스템(10)의 장애 발생시에 관리 네트워크 상의 장애관리시스템(200)에 장애내용을 송신하여 보다 신속하게 장애를 인지하고 조치할 수 있도록 한다.
이를 위하여 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템은 네트워크 장비 관리를 구성관리(Configuration Management), 성능관리(Performance Management) 및 고장관리(Fault Management) 측면에서 관리한다.
상기 구성관리는 기업 관리대상 장비의 구성을 검색하고 새로운 기기의 추가 및 기존 기기의 제거에 관한 정보를 수집하고 유지하는 기능을 말한다.
기간망에 많은 수의 지선망과 디바이스들이 연결되어 전체적인 생산작업 및 사무작업에 이용된다. NMS의 구성관리기능이 없다면 현재 기업의 시스템(10) 및 네트워크의 상황을 파악하고자 할 때, 설계도면을 살펴보아야 한다.
그러나 네트워크 상황은 항상 고정적인 것이 아니라 고장, 수리, 위치변경 등으로 네트워크의 상태가 바뀌는 동적인 특성을 가지고 있기 때문에 도면만으로 현재의 네트워크 상태를 정확하게 판단할 수가 없다. 따라서 장비 및 네트워크 고장 이력카드 등 관련된 서류도 검토해야 하는데, 실제적으로 이러한 일은 각 분야별 담당자들의 협조가 필요할 뿐만 아니라 상당한 시간이 소요된다.
그러므로 이를 위하여 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템은 단일 화면으로 현재 네트워크의 정확한 구성파악을 가능하게 해 줄 뿐만 아니라 현재 구성되어 있는 네트워크 및 디바이스들의 링크속도나 특성 등의 관리정보도 파악할 수 있게 구성된다.
본 발명에 따른 상기 구성관리의 세부항목은 구성 맵(Map), 장비목록 장표, 조직보기(Organization View), 위치보고(Location View), 디바이스 토폴로지 보기(Device Topology View), 시스템 구성 정보 및 시스템 응용 S/W정보(모델 찾기) 등이다.
다음으로 상기 성능관리는 기업 네트워크에 연결된 관리대상 장비의 성능을 감시하고 제어하는 기능을 말한다. 즉, CPU, 메모리, 디스크 및 네트워크 트래픽 스토리지의 사용량 등 시스템 자원의 관리를 말한다.
예를 들면 점차 개방형 시스템으로 이행되고 있는 기업의 네트워크에 대한 성능관리 소홀로 트래픽 폭주가 발생하거나 미 발생 상태가 발생하면 단위 공장 시스템의 운영에 치명적인 영향을 줄 수 있으므로 이러한 상황을 예방하기 위한 조치가 필요할 뿐만 아니라 현재의 네트워크를 안정적으로 유지하고 효율적으로 관리하기 위해서 성능관리가 필요하다.
네트워크 관리의 성능관리기능은 네트워크의 트래픽에 대한 최대치, 평균치, 경향, 문제점 등을 관리하는데, 이러한 트래픽 통계정보는 현재의 네트워크 성능의 문제점과 잠재적인 문제점을 발견하고 해결하는데 판단근거를 제공한다.
본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 성능관리는 고 장관리기능과 연계하여 네트워크 성능에 대한 상태를 감지하여 성능관리에서 제공된 통계정보와 비교하여 네트워크 상태가 정상인지 비정상인지를 네트워크 관리자에게 알려주는 기능을 제공한다.
따라서, 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 성능관리는 주요 성능항목에 기준치(Threshold)를 설정하고, 데이터가 기준치를 초과했을 경우 고장관리기능과 연계하여 알람을 발생시켜 이상상태를 관리자에게 신속히 알려준다.
상기 성능관리항목을 정리하면, 디스크 사용 비율, 프로세서 부하, 응용 프로그램의 실행 우선순위, 응용 프로그램의 메모리 사용 비율, 전체 메모리 사용 비율, 응용 프로그램의 메모리 사용 추세, 응용 프로그램의 프로세서 사용 비율, Offered Load, Packet Rate Error Rate, Discard Rate, Load_In, Load_Out, Packet_Rate_In, Packet_Rate_Out, Error_Rate_In, Error_rate_Out, Discard_Rate_In, Discard_Rate_Out 등이 된다.
마지막으로 상기 고장관리는 관리장비에 장애가 발생되었을 때, 이를 감지하고 장애의 원인과 위치를 판별하여, 복구하는 기능을 말한다.
예를 들어 네트워크의 연결링크가 끊어졌을 때, 이를 감지하고 연결링크의 위치를 찾아내어 이 정보를 네트워크 관리자에게 알려주어 네트워크 관리자가 끊어진 링크를 다시 연결하도록 하는 것이다.
일반적으로 통신 디바이스에 고장이 발생하면 고장이 발생한 디바이스에만 영향을 미치는 것이 아니라 그와 연결된 여러 개의 디바이스에 영향을 미치는 특성 이 있다. 예를 들며 라우터의 포트에 고장이 발생하면 해당 포트에 연결된 서브 네트워크의 통신에도 장애가 발생하는 것이 그것이다.
따라서 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 고장관리기능은 장애 발생원인을 추적하여 고립시킴으로써 네트워크 관리자가 고장에 대한 조치 범위를 제한하여 빠른 시간 내에 고장에 대한 조치를 취할 수 있게 한다.
상기 고장관리의 세부항목은 Device Contact Lost, UPS전원 이상, UPS배터리 이상, 링크 고장, 포트상태 이상, 디바이스 온도 및 SNMP Agent Lost 등이 된다.
상기한 네트워크 및 네트워크를 구성하는 장비들의 관리를 위하여 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템은 도 4에 도시된 바와 같이 콘솔(110, Console), 데몬(120, Daemon), 알람(130, Alarm), 웹(140, Web) 및 데이터베이스(150, Database)로 구성된다. 도 4는 본 발명의 바람직한 실시 예에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 S/W구성을 보인 블록구성도이다.
도 4에 도시된 바와 같이 상기 콘솔(110)은 네트워크 시스템(10) 및 네트워크 장비들의 상태를 SNMP프로토콜을 이용하여 감시하고, 수집한 데이터를 시스템(10) 및 보드의 상태와 통계, 레포팅 기능을 통하여 제공한다.
상기 데몬(120)은 네트워크 시스템(10) 및 네트워크 장비들의 상태를 SNMP프로토콜을 이용하여 수집하고, 장애시 NMS보드나 스토리지에서 발생한 TRAP을 수신하고 성능 임계치 초과, 보드 설정변경, 시스템(10)의 프로세서 상태 변경에 따른 알람을 생성하여 상기 알람(130)에게 전송한다.
상기 알람(130)은 장애시 NMS보드나 스토리지에서 발생한 TRAP발생, 성능 임 계치 초과, 보드 설정변경, 시스템(10)의 프로세스 상태 변경에 따른 알람을 통보하고 데이터베이스(150)에 저장하여 상기 콘솔(110)이나 상기 웹(140)에서 장애보고서에 장애이력을 출력할 수 있게 한다.
상기 웹(140)은 웹브라우저를 이용하여 NMS보드가 장착된 시스템(10) 정보 등을 관리하며 발생한 장애에 대한 이력을 검색 및 출력할 수 있는 기능을 제공한다.
이하, 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템의 상기 콘솔(110), 데몬(120), 알람 및 웹(140)의 구성 및 동작에 대하여 각각 상세히 설명한다.
1). 콘솔(110, Console)
우선, 상기 콘솔(110)은 캐비닛, 서브랙, 보드 등 관리하고자 하는 장비들을 설정하고 SNMP프로토콜을 이용하여 감시하여 실시간으로 관리대상 장비의 상태를 감시할 수 있는 화면들을 제공하며, 수집된 각종 데이터들을 분석하여 시스템 운영에 활용할 수 있는 각종 통계보고서를 생성한다.
상기 콘솔(110)의 감시기능은 전체감시와 서브랙 감시로 구분되며, 전체감시는 그룹별 캐비닛 별로 전체 시스템(10) 구성내용을 볼 수 있고 상세한 감시 내용은 해당 그림을 마우스로 클릭하거나 팝업 메뉴를 선택하여 볼 수 있다. 또한 장애가 발생시에는 해당 장비 그림에 표시된다.
서브랙 감시는 NMS관련 보드들이 설치되어 있는 서브랙이 그림으로 보여지 고, 각 보드들의 상태를 LED로 볼 수 있다. 또한 시스템(10) 정보, Bus Segment 정보, 보드 정보, 트렁크 정보를 확인할 수 있다.
상기 콘솔(110)의 성능기능은 성능통계와 누적통계로 구분되며, 성능통계는 서브랙에 설치된 시스템(10)의 성능정보인 CPU, 메모리, 부하율, DISK사용, 프로세스 상태 등을 실시간으로 그래프와 문자로 보여준다. 또한, 누적통계는 서브랙에 설치된 시스템(10)의 성능정보를 기간별로 누적하여 보여준다.
상기 콘솔(110)의 보고서 기능은 장애보고서, 일별보고서, 월별보고서로 나눌 수 있으며, 장애보고서는 데이터베이스(150)에 저장된 장비에서 발생된 장애 데이터를 기간별/장비별로 보고서를 생성하고 출력한다. 또한, 일별보고서 및 월별보고서는 서브랙에 설치된 시스템(10)의 성능정보 등을 일자별 및 월별로 평균, 최고, 최소로 통계를 내어 보고서를 생성하고 출력할 수 있다.
상기 콘솔(110)의 도구는 텔넷(Telnet)과 MIB브라우저(Browser)로서, 콘솔(110)은 타겟(Target)시스템(10)의 정보를 조회 및 설정하기 위하여 텔넷 프로그램을 사용할 수 있으며, 타겟시스템(10)의 SNMP 데이터를 조회하기 위하여 SNMP MIB브라우저를 사용한다.
상기 콘솔(110)의 환경설정단계는 하기와 같다.
(1). 호스트 설정 : 관리하기 위한 장비들의 IP주소를 설정한다.
(2). 임계치 설정 : 성능 데이터의 임계치를 Warning과 Critical 등급으로 구분하여 설정한다. 이 임계치를 벗어난 경우에는 알람이 발생한다.
(3). DB 설정 : 본 발명에 따른 범용 원격 모니터링 시스템의 각종 데이터가 저장되는 데이터베이스(150)와 연결을 시험하고, 데이터베이스(150)가 설치되어 있는 서버와 사용자계정 및 비밀번호를 저장한다.
(4). 캐비닛 설정 : 관리하기 위한 장비들을 화면상에 보기 위하여 캐비닛과 서브랙 등의 구성정보를 설정한다.
(5). 서브랙 설정 : 관리하기 위한 서브랙들을 화면상에 보기 위하여 서브랙에 설치된 각종 보드들의 구성정보를 설정한다.
(6). 메일통보 설정 : 장애가 발생하였을 때 메일을 보낼 곳의 주소 등을 미리 설정한다.
(7). 메일계정 설정 : 장애가 발생하였을 때 메일을 보내는 SMTP(Simple Mail Transfer Protocol, 단순우편전송규약)서버를 설정한다.
상기 환경설정단계 후, 캐비닛 구성과 전체감시 화면을 로드하기 위한 상기 콘솔(110)의 제어흐름도를 도 5에 나타내었다.
도 5에 도시된 바와 같이, 상기 콘솔(110)은 기 설정된 그룹의 데이블에서 그룹이름을 가져와서, 그룹선택에 따라 그룹안의 캐비넷을 보여준다. 이어, 캐비넷 선택 후 보기 버튼 클릭에 따라 서브랙 구성을 보여준다.
그리고 보드 설정 클릭에 따라 해당 호스트의 이름으로 구성된 보드의 테이블을 검색하여 보드구성을 출력하며, 보드 구성 변경에 따라 변경된 내용을 저장한다.
이후, 캐비넷 설정 닫기 버튼 입력에 따라 전체감시를 다시 로드하며, 그룹별 캐비넷별로 트리를 다시 구성한다.
그리고 그룹을 클릭하면 해당 그룹의 캐비넷을 로드하고 전체감시에서 트리를 클릭함에 따라 해당 트리를 출력한다.
도 6은 알람수신에 따른 상기 콘솔(110)의 제어흐름도이다.
도 6에 도시된 바와 같이, 상기 콘솔(110)은 Hotswapdkffka, DS1알람, 스토리지 알람/프로세스 알람, 임계치 초과 알람/보드 설정변경 알람 등 각종 알람을 수신하여 이를 분류하고 해당 테이블 또는 전체화면에 알람이 발생한 서브랙에 알람을 표시한다.
2). 데몬(120, Daemon)
도 7은 상기 데몬(120)의 제어흐름도로서, 상기 데몬(120)은 SNMP를 이용해 NMS보드와 시스템(10)의 정보를 수집한다.
도 7에 도시된 바와 같이, 상기 데몬(120)은 네트워크 시스템(10) 및 장비로부터 원하는 데이터를 수집(Gathering)하기 위하여 IP 및 OID를 설정하고 관리정보를 검색하여 수신된 메시지를 분석한다.
그리고 해당 데이터가 마지막 데이터이면 데이터베이스(150)에 저장하고, 상기 콘솔(110)에 보내주기 위하여 해당 데이터를 따로 저장한다. 한편 상기 데이터가 마지막 데이터가 아니면 하부의 모든 데이터를 가져올 수 있도록 관리정보를 연속해서 검색한다.
이후 상기 데몬(120)은 다음 수집할 호스트의 여부에 따라 상기 과정을 반복한다.
또한, 상기 데몬(120)은 상기 콘솔(110)에서 임계치를 설정했을 때, 그 값을 받아서 변수에 저장하고, 수집대상 호스트의 주소 및 임계치를 파일에서 읽어오며, 보드의 변경사항 체크 및 기본정보 테이블과 백업 테이블을 비교하여 알람을 생성한다.
특히, 상기 데몬(120)은 상기 콘솔(110)과 상기 알람(130)으로부터 TRAP 활성화, 수집주기 변경, 임계치값 변경, 이메일 전송 등의 명령을 수신하여 수행한다.
3). 알람(130, Alarm)
도 8은 상기 알람(130)의 제어흐름도로서 상기 알람(130)은 NMS관련 시스템(10)에 장애가 발생하였을 경우에 SNMP TRAP 데이터를 수집하고 또한 이미 설정한 성능관련 임계치를 벗어났을 경우에 발생하는 알람 데이터를 시스템 운영자에게 가시가청으로 알려준다. 또한 이미 설정된 메일주소나 핸드폰으로 알람 메시지를 전송한다.
도 8에 도시된 바와 같이 알람(130)의 기능을 그 단계에 따라 살펴보면 하기와 같다.
(1). 알람 데이터 수집 : NMS관련 시스템(10)에서 장애(Chassis Trap, DS1 Trap, Dothill Storage 등)가 발생하여 송신하는 SNMP Trap 데이터를 수집한다.
(2). 알람 데이터 확인 : 알람이 수집되면 확인시간을 저장한다.
(3). 알람 데이터 저장 : 수집된 알람 데이터를 데이터베이스(150)에 저장하여 장애보고서를 생성할 수 있도록 한다.
(4). 알람 데이터 통보 : 장애가 발생 시 가시가정으로 사용자에게 통보함과 아울러 이미 설정된 이메일 계정으로 장애메일을 송신한다. 또한, 휴대폰이 메일과 연동되어 있는 경우에는 휴대폰으로도 알람 메시지를 받아볼 수 있도록 단문 메시지 형태로 휴대폰에 전송한다.
4). 웹(140, Web)
도 9는 상기 웹(140)의 제어흐름도로서 웹브라우저를 이용하여 NMS보드가 장착된 시스템(10) 정보 등을 기본정보와 관리하며 발생한 장애에 대한 이력을 검색 및 출력할 수 있는 기능을 제공한다.
상기 웹(140)은 현재 가용중인 각종 장비들에 대한 현황파악 및 관리를 위한 자원관리와 장애관리를 인터넷을 통하여 웹(140)에서 관리할 수 있도록 한다.
웹(140)은 크게 사용자 계정 체크, 자원관리, 장애관리, 업무관리, 사용자관리로 구분해 볼 수 있다.
사용자 계정 체크는 세션이 시작함과 동시에 사용자 권한을 데이터베이스(150)에 등록되어 있는 목록에서 체크하고 인증이 완료되면 사용할 수 있도록 한다.
상기 사용자 계정 체크는 하기의 로그인 및 로그아웃으로 구분된다.
(1). 로그인 화면표시 및 로그인 : 허가된 사용자만 웹(140)의 데이터를 조회할 수 있도록 로그인 화면을 제공한다.
(2). 로그아웃 : 웹(140) 사용 종료 시 로그아웃을 한다. 또한 웹(140)에 접속하여 일정시간 아무런 입력이 없으면 자동으로 로그아웃하여 보안을 유지한다.
상기 자원관리의 세부항목은 하기와 같다.
(1). 장비 기본 정보 : 자원관리를 위하여 장비의 기본정보(호스트명, 일련번호, 호스트 아이디, 제조사, 모델명, 유지보수일자, 하자보수일자 등)을 추가/수정/삭제할 수 있다.
(2). 장비 이력 정보 : 장비의 이력사항(호스트명, 일련번호, OS, CPU개수, 메모리 크기, 디스크 크기, 네트워크 번호, 담당자, 사용업체 등)을 추가/수정/삭제 할 수 있다.
(3). 작업 내역 정보 : 관리장비에 대하여 작업을 입력/수정/삭제/조회 할 수 있다.
(4). 담당자 정보 : 장비의 관리 담당자 이름, 전화번호, 업체, 주소 등을 추가/수정/삭제할 수 있다.
(5). 설치 S/W 목록 : 장비에 설치되어 있는 각종 S/W에 대한 정보를 장비별로 추가/수정/삭제 할 수 있다.
(6). S/W 상세 정보 : 사용중인 각종 S/W의 정보(S/W 이름, 일련번호, 라이 센스, 버전 등)을 추가/수정/삭제 할 수 있다.
(7). 시스템 현황 : 현재 보유하고 있는 각종 장비를 전체, 업체별, 도입일별, 지원현황 등으로 구분하여 통계를 볼 수 있다.
상기 웹(140)의 장애관리의 세부항목은 하기와 같다.
(1). 전체장애 : NMS관련 장비의 각종 장애 전체를 조회하거나 레포트를 생성한다.
(2). 장애조회 : NMS관련 장비의 각종 장애를 기기별, 일자별, 장애유형별, 장애등급별로 조회하여 그래프와 목록으로 보거나 레포트를 생성한다.
상기 웹(140)의 업무관리는 사용부서의 장비운영과 관련하여 일일업무보고서를 작성하거나 조회한다. 이를 위해 사용자의 업무관리 정보를 추가/수정/삭제/열람 및 목록작성의 기능을 수행하고, 필요에 따라 사용자의 업무관리 정보 레포트 결과를 생성, 출력한다.
상기 웹(140)의 사용자관리는 웹(140)을 사용하기 위한 관리자들의 아이디와 비밀번호 등을 추가/삭제/수정/열람 및 목록작성의 기능을 수행하며, 사용자 관리 정보 레포트 결과를 생성, 출력한다.
상술한 바와 같이 본 발명에 따른 SNMP를 이용한 범용 원격 모니터링 시스템 은 관리대상 네트워크에 설치되는 원격 모니터링 서버와 관리 네트워크에 설치되는 장애관리시스템으로 구성되며, 상기 원격 모니터링 서버와 상기 장애관리시스템 간에 콘솔(110), 데몬(120), 알람(130) 및 웹(140)으로 구성된 프로그램을 운용함으로써 네트워크 관리 대상의 성능을 감시하고, 관리대상 장비에서 발생하는 각종 장애사항을 수집분석하며, 관리대상 장비의 구성을 검색하고 새로운 장비의 추가 및 기존장비의 제거에 관한 정보를 수집하고 유지하는데 있어서 이를 이용하여 보다 신속하고 효율적인 시스템 관리를 제공한다.
또한, 관리대상 장비의 장애 발생시에 관리 네트워크 상의 장애관리시스템에 장애내용을 송신하여 보다 신속하게 장애를 인지하고 조치할 수 있도록 한다.
한편, 본 발명의 상세한 설명에서는 구체적인 실시 예를 들어 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
상술한 바와 같이 본 발명은 제조사가 다르고 방식이 다른 통신사업자용 장비들의 성능 및 장애를 범용으로 원격에서 감시 및 분석하여 보다 효율적이고 안정적으로 관리할 수 있는 효과가 있다.
이에 따라, 서로 다른 다양한 방식의 제품들을 통합적으로 관리할 수 있는 장점이 있으며, 각 제조사의 제품들은 각각의 장비를 관리하기 위한 고가의 전용 툴을 대체한 범용 툴을 사용함으로써 시스템 운영이나 유지보수에 있어서 경제적인 이점이 있다.
또한, 본 발명은 기본적인 네트워크 지식만을 습득한 단순관리자가 쉽게 운용할 수 있도록 식별이 용이한 사용자인터페이스를 제공할 수 있는 이점이 있다.
이에 따라, 시스템의 일반적인 장애보고나 경보에 있어서 단순관리자가 적절한 대응을 함으로써 고가의 관리장비에 대한 효율적인 운용이 가능하며, 관리 시스템을 다시 관리하기 위한 부가비용이 없는 장점이 있다.

Claims (3)

  1. SNMP(단순망 관리 규약)를 이용한 네트워크 관리 시스템에 있어서,
    관리대상이 되는 네트워크에 설치되어 상기 관리대상 네트워크 및 상기 관리대상 네트워크 상에 연결된 장비들을 포함하는 관리대상 시스템을 감시 및 관리하기 위하여 구성정보를 설정하는 콘솔(110)기능을 수행하며, 상기 SNMP를 이용하여 성능 및 장애 데이터를 감시 분석하는 원격 모니터링 서버와;
    관리 네트워크에 설치되어 상기 원격 모니터링 서버와 SNMP를 이용하여 통신하며, 상기 관리대상 시스템의 장애 발생시 상기 원격 모니터링 서버로부터 장애내용을 수신하여 발생한 장애를 인지하고 대응하는 관련 조치사항을 제공하는 장애관리시스템;으로 구성됨을 특징으로 하는 SNMP를 이용한 범용 원격 모니터링 시스템.
  2. 제 1항에 있어서, 상기 원격 모니터링 서버는,
    상기 관리대상 시스템의 장비구성을 검색하고 새로운 기기의 추가 및 기존 기기의 제거에 관한 정보를 수집하고 유지하는 구성관리기능과,
    상기 관리대상 시스템의 장비의 성능을 감시하고 제어하여 상기 관리대상 시스템의 자원을 관리하는 성능관리기능과,
    상기 관리대상 시스템의 장비에 장애 발생 시 이를 감지하고 장애의 원인과 위치를 판별하여 복구하는 고장관리기능을 수행하는 프로그램을 기록한 기록매체를 구비함을 특징으로 하는 SNMP를 이용한 범용 원격 모니터링 시스템.
  3. 제 1항 또는 제 2항에 있어서, 상기 원격 모니터링 서버는,
    상기 관리대상 시스템의 상태를 SNMP를 이용하여 감시하고, 수집한 데이터를 시스템 및 장비들의 상태를 통계기능과 레포팅 기능을 통하여 제공하는 콘솔(110)수단과,
    상기 관리대상 시스템의 상태를 SNMP를 이용하여 수집하고, 장애 발생시 NMS(망 관리 시스템)보드 및 스토리지에서 발생한 TRAP(트랩)을 수신하여 성능 임계치 초과, 보드 설정 변경, 시스템의 프로세스 상태 변경에 따른 알람을 생성하는 데몬(120)수단과,
    웹브라우저를 이용하여 상기 NMS보드가 장착된 시스템 정보를 관리하며, 발생한 장애에 대한 이력을 검색 및 출력하는 웹(140)수단 및,
    상기 데몬(120)으로부터 장애 발생시 NMS(망 관리 시스템)보드 및 스토리지에서 발생한 TRAP(트랩)을 수신하여 성능 임계치 초과, 보드 설정 변경, 시스템의 프로세스 상태 변경에 따른 알람을 수신하여 상기 콘솔(110)로 통보하고, 이를 데이터베이스(150)에 저장하여 상기 콘솔(110) 및 상기 웹(140)에서 장애보고서에 장애이력을 출력할 수 있도록 하는 알람수단으로 구성됨을 특징으로 하는 SNMP를 이용한 범용 원격 모니터링 시스템.
KR1020050025845A 2005-03-29 2005-03-29 Snmp를 이용한 범용 원격 모니터링 시스템 KR20060104032A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050025845A KR20060104032A (ko) 2005-03-29 2005-03-29 Snmp를 이용한 범용 원격 모니터링 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050025845A KR20060104032A (ko) 2005-03-29 2005-03-29 Snmp를 이용한 범용 원격 모니터링 시스템

Publications (1)

Publication Number Publication Date
KR20060104032A true KR20060104032A (ko) 2006-10-09

Family

ID=37634134

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050025845A KR20060104032A (ko) 2005-03-29 2005-03-29 Snmp를 이용한 범용 원격 모니터링 시스템

Country Status (1)

Country Link
KR (1) KR20060104032A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101327477B1 (ko) * 2013-07-16 2013-11-08 서원기 통합 관제 및 제어 관리 시스템
CN113726587A (zh) * 2021-11-04 2021-11-30 海尔数字科技(青岛)有限公司 网络安全管理方法及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101327477B1 (ko) * 2013-07-16 2013-11-08 서원기 통합 관제 및 제어 관리 시스템
CN113726587A (zh) * 2021-11-04 2021-11-30 海尔数字科技(青岛)有限公司 网络安全管理方法及设备
CN113726587B (zh) * 2021-11-04 2022-02-08 海尔数字科技(青岛)有限公司 网络安全管理方法及设备

Similar Documents

Publication Publication Date Title
US8458301B1 (en) Automated configuration of network devices administered by policy enforcement
US11632320B2 (en) Centralized analytical monitoring of IP connected devices
CN102185709B (zh) 一体化网络服务质量保障管理***
CN117111497A (zh) 远程运维管理***
JP2008519327A (ja) ネットワーク管理アプライアンス
CN105282772A (zh) 无线网数通设备监控***及设备监控方法
CN107947998B (zh) 一种基于应用***的实时监测***
CN102014020A (zh) 一种用于对网络设备进行网络监控的设备及其方法
US8935388B2 (en) Systems and methods of automated event processing
CN114244676A (zh) 一种智能it综合网关***
CN103166788A (zh) 一种集控控制管理***
Safrianti et al. Real-time network device monitoring system with simple network management protocol (SNMP) model
EP1622310B1 (en) Administration method and system for network management systems
US20060053021A1 (en) Method for monitoring and managing an information system
CN114143160B (zh) 一种云平台自动化运维***
KR20060104032A (ko) Snmp를 이용한 범용 원격 모니터링 시스템
Cisco Monitoring the System
Cisco Fault Management
Cisco Fault Management
Cisco Monitoring the System
Cisco Overview
Cisco Fault Management
KR101016444B1 (ko) 텔넷 프로토콜을 이용한 네트워크 관리 시스템
Cisco Overview
Cisco Fault Management

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application