KR100257162B1 - 이중화 시스템에서 상대 시스템의 감시방법 및 장치 - Google Patents

이중화 시스템에서 상대 시스템의 감시방법 및 장치 Download PDF

Info

Publication number
KR100257162B1
KR100257162B1 KR1019970040885A KR19970040885A KR100257162B1 KR 100257162 B1 KR100257162 B1 KR 100257162B1 KR 1019970040885 A KR1019970040885 A KR 1019970040885A KR 19970040885 A KR19970040885 A KR 19970040885A KR 100257162 B1 KR100257162 B1 KR 100257162B1
Authority
KR
South Korea
Prior art keywords
scsi
monitoring
failure
bus
network
Prior art date
Application number
KR1019970040885A
Other languages
English (en)
Other versions
KR19990017828A (ko
Inventor
황병일
Original Assignee
구자홍
엘지전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자주식회사 filed Critical 구자홍
Priority to KR1019970040885A priority Critical patent/KR100257162B1/ko
Publication of KR19990017828A publication Critical patent/KR19990017828A/ko
Application granted granted Critical
Publication of KR100257162B1 publication Critical patent/KR100257162B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0036Small computer system interface [SCSI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)

Abstract

본 발명은 이중화 시스템에서 상대 시스템의 감시방법 및 장치에 관한것으로서 이중화 시스템이 동작중에 어느 하나의 시스템에서 발생되는 장애 부분을 보다 정확하게 파악하여, 상호 감시시에 네트워크 프로토콜에 따른 부하를 줄이도록 한 것이다. 이와 같은 이중화 시스템에서 상대 시스템을 감시하는 과정은 이중화 시스템에서 상대방 시스템을 감시하기 위한 자료구조가 정의된 후, 네트워크을 통한 감시와 스카시 버스를 통한 감시로 나누어져 상호 시스템에 서비스가 제공되는 제 1과정과; 서비스가 제공되고 하나의 시스템에 장애가 발생되면 정의된 자료구조 및 스카시 버스를 통하여 다른 시스템이 장애 내용을 확인하고 복구하는 제 2과정으로 이루어짐을 특징으로 한다.

Description

이중화 시스템에서 상대 시스템의 감시방법 및 장치(The method and apparatus of supervisor for relative system in duplex system)
본 발명은 이중화 시스템의 상호 감시에 관한것으로서, 더욱 상세하게는 시스템 주변기기 제어용 버스인 스카시(SCSI : Small Computer System Interface)버스와 네트워크 채널을 이용하여 상대방 시스템이 정상적으로 가동되는지의 여부를 확인함으로써, 상대 시스템의 장애 내용를 상세하게 파악하고 또한, 장애 감시시의 부하를 최소화하여 정확하게 시스템의 장애 내용을 확인할수 있도록 하는 이중화 시스템에서 상대 시스템의 감시방법 및 장치에 관한 것이다.
일반적으로, 컴퓨터 시스템은 소프트웨어, 하드웨어등에 의한 장애 발생등으로 인한 시스템이 정지되는 것을 방지하고, 프로세서의 내부 동작이 정상적으로 동작하고 있는가등을 검사하는 프로그램을 준비하여 데이터의 완전성을 유지하고, 만일 장애가 발생되면 고장 부위를 조기에 발견하여, 자동적으로 고장 상태를 판단할수 있도록 하여 시스템의 신뢰성, 가용성, 보수성등을 향상시키고 있다.
이와같이 시스템의 성능을 향상시키기 위해서 하드웨어 기술과 소프트웨어 의 기술적인 연계가 필요하게 되었고, 통상 상대 시스템의 상태 감시는 네트워크 채널을 통하여 수행되었다.
도 1은 일반적인 네트워크 채널에 따른 이중화 장치를 개략적으로 도시한 도면이다. 이에 도시된 바와 같이 2개 이상의 시스템(10,12)이 스카시 버스를 통해 상호 연결되고, 이때 각 시스템(10,12)에서 네트워크를 통한 서비스 제공은 네트워크 프로토콜을 모델화 한 OSI(Open System Interconnect)의 7계층에 의하여 규정된다. 이러한 7계층은 도시된 바와 같이 레벨 1부터 레벨 7까지로 구성되고, 레벨 1부터 순차적으로 물리층, 데이터 링크층, 네트워크층, 트랜스포트층, 세션층, 프레센테이션층, 애플리케이션층으로 된다.
여기서, OSI의 7계층으로 구성되는 네트워크 구조는 시스템의 처리 계층을 명확히 하고, 각 계층간의 프로토콜을 정의하여 네트워크의 최적화를 도모한다. 이것은 크게 논리적으로 각 층간 및 대항하는 각 층사이에서 교환 또는 공유하는 메시지 형식 및 요구/응답에 의해 시스템 상태, 서비스 동작등이 수행된다.
이와 같이 구성되는 이중화 시스템은 상대 시스템의 감시를 하기 위해 지속적으로 네트워크 채널을 통하여 일정한 시간 간격으로 수행된다.
즉, 상기한 시스템이 동작되면 사용자에게 동일한 서비스를 제공하면서, 상대 시스템을 감시하고, 감시 도중에 상대방 시스템에 이상이 감지되면 장애 내용에 따라 미리 정의된 소프트웨어 또는 하드웨어적으로 복구 작업이 수행되어 동작 유무를 체크한다. 그러므로, 네트워크를 통하여 두 개 이상의 시스템으로 구성되는 시스템에서 특정 시스템이 서비스를 제공하는 도중에, 이 시스템이 장애가 발생되면 다른 시스템은 이를 감지한후, 공유하고 있던 파일 시스템 및 디스크를 사용하여 중단된 서비스를 계속적으로 수행한다.
그러나, 상기한 바와 같이 일반적인 네트워크 채널를 이용하여 이중화 시스템에서 상대 시스템을 상호 감시하는 과정은 OSI의 7 계층을 구성하는 모든 층을 순차적으로 수행해야 되며, 이러한 작업은 이중화 시스템에서 상대방 시스템을 상호 감시 하는데 불필요한 작업 수행 과정이 포함되어 필요 이상의 부하가 초래됨으로써, 시스템 성능이 저하되는 문제점이 있었다.
또한, 네트워크 채널를 통한 상호 시스템 감시는, 시스템의 장애를 정확하게 파악하기가 어렵고, 이로 인하여 시스템이 정상적으로 동작중인 경우에도 각 시스템을 연결해주는 물리적 계층에 이상이 발생되면 시스템의 장애로 간주되어 서비스가 중단되고, 시스템 동작의 잘못된 진단으로 인한 시스템 정지 및 복구 불가능한 장애시에도 서비스가 계속 제공되어 자원이 낭비되는 문제점이 있었다.
따라서, 본 발명의 목적은 시스템에 주변기기 버스로 사용되는 스카시 버스를 사용하여, 상대방 시스템의 정상 가동여부를 확인하는 경우에 네트워크 프로토콜에서 수반되는 불필요한 계층을 생략하여 상호 감시에 따른 시스템 부하를 최소화 하고, 고가용성 시스템(High availablity system)에서 복구가 불가능한 장애가 발생시에 장애 발생부위를 정확하게 판단하여 서비스를 중단하고, 시스템 점검을 요구하도록 하는 이중화 이중화 시스템에서 상대 시스템의 감시방법 및 장치를 제공함에 있다.
도 1은 일반적인 네트워크 채널에 따른 이중화 장치를 개략적으로 도시한 도면이고,
도 2는 본 발명에 따라 이중화 시스템에서 상대 시스템의 감시장치를 보인 도면이고,
도 3은 도 2에서 이중화 시스템의 스카시 제어 보드를 통해 시스템의 장애 발생을 확인하기 위한 개략적인 블록도이고,
도 4는 도 3의 스카시 제어보드를 보인 상세 블록도이다.
〈도면의 주요부분에 대한 부호의 설명〉
13 : 서비스 네트워크망 14,16 : 제 1시스템, 제 2시스템
18 : 공유 디스크 20 : CPU보드
22, 24 : 제 1,2 시스템의 스카시 제어보드
26 : 명령어 분석기 28 : 스카시 명령어 전달기
30 : 상태정보 수집기 32 : 내부 상태정보 수집기
상기와 같은 목적을 달성하기 위한 본 발명의 일측면에 따른 이중화 시스템에서 상대 시스템의 감시방법은, 이중화 시스템에서 상대방 시스템을 감시하기 위한 자료구조가 정의된 후, 네트워크을 통한 감시와 스카시 버스를 통한 감시로 나누어져 상호 시스템에 서비스가 제공되는 제 1과정과; 상기 서비스가 제공되고 하나의 시스템에 장애가 발생되면 정의된 상기 자료구조 및 스카시 버스를 통하여 다른 시스템이 장애 내용을 확인하고 복구하는 제 2과정으로 이루어짐을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명의 다른 측면에 따른 이중화 시스템에서 상대 시스템의 감시장치는, 서비스 네트워크 망에 인터페이스 연결되는 제 1시스템, 제 2시스템과 상기 제 1시스템, 제 2시스템은 각각 제 1,2스카시 버스를 통해 공유 디스크를 공유하는 이중화 시스템에 있어서: 상기 제 1 시스템, 제 2시스템은 스카시 제어보드를 가지며, 상기 스카시 제어보드는 스카시 버스를 통해 전달되는 명령어를 분석하는 명령어 분석기; 상기 명령어 분석기로부터 전달된 스카시 명령어를 스카시 버스를 통해 상대 시스템에 전송하는 스카시 명령어 전달기; 상기 스카시 명령어 전달기에 의하여 상대 시스템의 상태를 수집하여 상기 명령어 분석기에 보내는 상태정보 수집기; 그리고 자신의 시스템 상태를 수집하여 상기 명령어 분석기와 정보를 교환하는 내부 상태정보 수집기를 포함하는 것을 특징으로 한다.
이하, 본 고안의 바람직한 실시예를 첨부된 도면을 참고하여 상세히 설명하면 다음과 같다.
도 2는 본 발명에 따라 이중화 시스템에서 상대 시스템의 감시장치를 보인 도면으로 이에 도시된 바와 같이, 서비스 네트워크망(13)에 인터페이스를 통해 연결되는 제 1시스템, 제 2시스템(14,16); 제 1시스템, 제 2시스템(14,16)이 각각 제 1,2 스카시 버스를 통해 공유하는 공유 디스크(18)로 구성된다.
또한, 도 3은 도 2에서 이중화 시스템의 스카시 제어 보드를 통해 시스템의 장애 발생을 확인하기 위한 개략적인 블록도이고, 도 4는 도 3의 스카시 제어보드를 보인 상세 블록도이다. 이에 도시된 바와 같이 특정 CPU 보드(20)와 제 1, 2시스템의 스카시 제어보드(22,24)는 스카시 버스로서 연결되며, 이 스카시 제어보드는 스카시 버스를 통해 전달되는 명령어를 분석하는 명령어 분석기(26); 명령어 분석기(26)로부터 전달된 스카시 명령어를 스카시 버스를 통해 상대 시스템에 전송하는 스카시 명령어 전달기(28); 스카시 명령어 전달기(28)에 의하여 상대 시스템의 상태를 수집하여 명령어 분석기(26)에 보내는 상태정보 수집기(32); 그리고 자신의 시스템 상태를 수집하여 명령어 분석기(26)와 정보를 교환하는 내부 상태정보 수집기(32)로 구성된다.
이와 같이 구성된 이중화 시스템에서 상대 시스템의 감시장치는 특정 CPU(20)가 스카시 버스를 통하여 상대 시스템의 상태등을 지속적으로 감시하도록 제 1시스템의 스카시 제어보드(22)를 통해 명령을 전달한다.
이때, 제 1시스템의 스카시 제어보드(22)는 스카시 버스로 연결되는 상대 시스템 즉, 제 2시스템의 스카시 제어보드(24)와 계속 공유 디스크(18)를 공유하면서 서비스를 제공하고 상호 감시작용을 수행한다.
좀더 상세히 설명하면, 이중화 시스템은 동작중에 서비스가 중단되는등의 장애가 발생되면 이를 빠르게 검사하여 공유하고 있던 파일 시스템 또는 디스크등을 사용하여 서비스가 중단되지 않도록 해야 된다. 이를 위해서는 먼저 상대 시스템의 감시에 필요한 자료 구조가 정의되야 한다. 이러한 자료 구조는 시스템이 정상적으로 동작하는 도중에 장애가 발생되면 장애가 발생된 부분 및 장애 성격을 세분화 하여, 시스템의 소프트웨어 또는 하드웨어가 손쉽게 장애를 복구할수 있도록 하기 위해서다.
즉, 장애가 시스템의 소프트웨어 또는 하드웨어중 어디에서 발생되었는지와 CPU보드, 스카시 보드, 네트워크중 장애가 발생된 부분이 어디인지를 손쉽게 알아볼수 있도록 세분화 된다.
한편, 시스템의 상호 감시에서 장애 내용을 세분화한 자료 구조가 시스템의 스카시 버스를 통하여 다른 시스템에 전달되어야 하며, 이를 위해서는 스카시 보드에 스카시 칩의 기능이 추가되야 된다. 즉, 자료 구조를 송수신 하기 위해서는 호스트 어댑터 상호간의 스카시 명령어 수행이 필요하다.
이와 같이, 자료구조가 정의되고 스카시 보드에 스카시 명령어의 수행이 필요한 기능이 제공되면, 이후에는 시스템이 동작중에 상호 감시가 가능하게 된다.
즉, CPU(20)로부터 스카시 버스를 통해 명령이 제 1스카시 제어보드(22)로 전송되고, 제 1스카시 제어보드(22)는 입/출력 장치가 결합되는 스카시 버스에 대한 명령 신호, 제어 신호를 발생시키며, 이를 통하여 시스템 상호간의 감시가 수행된다. 이는 스카시 제어보드의 상태 정보 수집기(30)가 계속적으로 상대 시스템을 감시하면서, 장애가 발생되면 이를 다른 시스템의 CPU로 알리고, 장애 내용을 확인한다.
여기서, 스카시 버스를 통한 시스템 상호 감시도중에 프로세서가 내린 명령에 대하여 일정 시간동안 응답이 없으면 장애가 발생된 것으로 간주되고, 장애 내용을 확인한다.
이때, 시스템에서 발생될수 있는 장애 내용은 네트워크를 통한 시스템 감시 상태와 스카시 버스 상에서의 시스템 감시 내용에 따라 다음 표 1과 같이 구분된다.
[표 1]
네트워크 감시 상태 스카시 버스 감시 상태
1 OK OK
2 FAIL OK
3 OK FAIL
4 FAIL FAIL
표 1에 보인것와 같이 시스템의 상호 감시는 네트워크를 통한 감시와 스카시 버스를 통한 감시로 나뉜다.
여기서, 네트워크 상태 및 스카시 버스 상태가 모두 정상적으로 동작되는 첫번째는 시스템이 정상적으로 서비스를 수행한다. 그리고 네트워크 및 스카시 버스 상태가 모두 장애가 발생되는 네번째 경우에는 사용 가능한 시스템 감시의 경로를 통하여 장애 상황이 확인되었고, 이는 시스템에서 버스 절체, 사용자 프로그램등에 따라 장애 내용을 복구하기 위한 작업이 수행된다.
그러나, 네트워크 감시 상태의 결과 상대 시스템에 장애가 감지되고, 스카시 버스를 통한 시스템은 정상적으로 확인되는 두번째의 경우는 상대방 시스템과 공유하고 있는 공유 디스크에 장애가 없는 것으로 판단되어 계속적으로 시스템은 서비스를 제공한다.
한편, 네트워크 감시 상태 결과로는 상대방 시스템의 장애가 감지되지 않고, 스카시 버스를 통한 상대 시스템의 감시시에 장애가 확인되는 경우에는, 상대방 시스템에서 디스크 서브 시스템에 장애가 발생된 것이다. 이 때문에, 시스템 상호간의 서비스 제공은 할수 없게 된다. 그러므로 장애 시스템에 대한 점검이 요구된다.
이상에서 상세히 설명한 바와 같이, 본 발명에 따른 이중화 장치에서 상대 시스템의 감시 방법은 스카시 버스 및 네트워크 채널을 통한 시스템의 상호 감시가 계속적으로 수행됨으로써, 시스템 동작중에 발생되는 장애 부분을 보다 정확하게 파악할수 있고, 또한 상호 감시시에 네트워크 프로토콜에 따른 부하를 최소화 시킬수 있는 효과가 있다.

Claims (4)

  1. 이중화 시스템에서 상대방 시스템을 감시하기 위한 자료구조가 정의된 후, 네트워크을 통한 감시와 스카시 버스를 통한 감시로 나누어져 상호 시스템에 서비스가 제공되는 제 1과정과; 상기 서비스가 제공되고 하나의 시스템에 장애가 발생되면 정의된 상기 자료구조 및 스카시 버스를 통하여 다른 시스템이 장애 내용을 확인하고 복구하는 제 2과정으로 이루어짐을 특징으로 하는 이중화 시스템에서 상대 시스템의 감시 방법.
  2. 제 1항에 있어서, 상기 제 2과정은 제 1과정의 네트워크 감시 결과 장애가 감지되고, 스카시 버스 감시 결과 정상이면 정상동작으로 판단하고 시스템을 운영하는 제 1단계와; 상기 제 1과정의 네트워크 감시 결과 정상이고, 스카시 버스 감시 결과 장애가 감지되면 시스템 장애를 알리는 제 2단계로 구성되는 것을 특징으로 하는 이중화 시스템에서 상태 시스템의 감시방법.
  3. 제 1항에 있어서, 상기 자료 구조는 네트워크 감시 상태와 스카시 버스의 감시 상태에 따른 장애 내용이 세분화 되고, 상기 장애 내용에 따라 장애 상태를 확인할수 있는 것을 특징으로 하는 이중화 시스템에서 상대 시스템의 감시 방법.
  4. 서비스 네트워크 망에 인터페이스 연결되는 제 1시스템, 제 2시스템과 상기 제 1시스템, 제 2시스템은 각각 제 1,2스카시 버스를 통해 공유 디스크를 공유하는 이중화 시스템에 있어서:
    상기 제 1 시스템, 제 2시스템은 스카시 제어보드를 가지며, 상기 스카시 제어보드는 스카시 버스를 통해 전달되는 명령어를 분석하는 명령어 분석기; 상기 명령어 분석기로부터 전달된 스카시 명령어를 스카시 버스를 통해 상대 시스템에 전송하는 스카시 명령어 전달기; 상기 스카시 명령어 전달기에 의하여 상대 시스템의 상태를 수집하여 상기 명령어 분석기에 보내는 상태정보 수집기; 그리고 자신의 시스템 상태를 수집하여 상기 명령어 분석기와 정보를 교환하는 내부 상태정보 수집기를 포함하는 것을 특징으로 하는 이중화 시스템에서 상대 시스템의 감시 장치.
KR1019970040885A 1997-08-26 1997-08-26 이중화 시스템에서 상대 시스템의 감시방법 및 장치 KR100257162B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970040885A KR100257162B1 (ko) 1997-08-26 1997-08-26 이중화 시스템에서 상대 시스템의 감시방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970040885A KR100257162B1 (ko) 1997-08-26 1997-08-26 이중화 시스템에서 상대 시스템의 감시방법 및 장치

Publications (2)

Publication Number Publication Date
KR19990017828A KR19990017828A (ko) 1999-03-15
KR100257162B1 true KR100257162B1 (ko) 2000-05-15

Family

ID=19518576

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970040885A KR100257162B1 (ko) 1997-08-26 1997-08-26 이중화 시스템에서 상대 시스템의 감시방법 및 장치

Country Status (1)

Country Link
KR (1) KR100257162B1 (ko)

Also Published As

Publication number Publication date
KR19990017828A (ko) 1999-03-15

Similar Documents

Publication Publication Date Title
KR20030067712A (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
JP3211878B2 (ja) 通信処理制御手段及びそれを備えた情報処理装置
KR100257162B1 (ko) 이중화 시스템에서 상대 시스템의 감시방법 및 장치
JP3248485B2 (ja) クラスタシステム、クラスタシステムにおける監視方式およびその方法
JP2956849B2 (ja) データ処理システム
JPH1188471A (ja) 試験方法及び試験装置
JP3420919B2 (ja) 情報処理装置
JPH09274575A (ja) 統合システム管理方式
JPH02132529A (ja) 自動監視切替制御装置
JP2580113B2 (ja) 仮想計算機システム
JP2014164472A (ja) 情報処理システム、及び情報処理装置の障害処理方法
JPH0934852A (ja) クラスタシステム
JPH06290126A (ja) 計算機システム障害監視方式
JPS6112580B2 (ko)
JPH10171769A (ja) 複合計算機システム
KR20020065188A (ko) 컴퓨터 시스템의 장애관리 방법
JPH05224964A (ja) バス異常通知方式
KR100303341B1 (ko) 소형컴퓨터시스템인터페이스버스비지상태회복방법
KR19990050461A (ko) 고 가용성 시스템의 오류 처리방법
JP2559771B2 (ja) 回線ロギング自動停止制御方式
JPH04340630A (ja) マルチプロセッサシステム
JPH06175869A (ja) 二重化計算機システム
JPS63239539A (ja) マルチコンピユ−タシステム制御方式
JPH01279301A (ja) 計算機分散システム
JP2001075830A (ja) 情報処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130108

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20140102

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20141218

Year of fee payment: 16

FPAY Annual fee payment

Payment date: 20160114

Year of fee payment: 17

FPAY Annual fee payment

Payment date: 20161227

Year of fee payment: 18

EXPY Expiration of term