KR19980024086A - 컴퓨터 시스템 및 화일 관리 방법 - Google Patents

컴퓨터 시스템 및 화일 관리 방법 Download PDF

Info

Publication number
KR19980024086A
KR19980024086A KR1019970032528A KR19970032528A KR19980024086A KR 19980024086 A KR19980024086 A KR 19980024086A KR 1019970032528 A KR1019970032528 A KR 1019970032528A KR 19970032528 A KR19970032528 A KR 19970032528A KR 19980024086 A KR19980024086 A KR 19980024086A
Authority
KR
South Korea
Prior art keywords
file
computer
update
checkpoint
standby
Prior art date
Application number
KR1019970032528A
Other languages
English (en)
Inventor
히데아키 히라야마
도시오 시라키하라
Original Assignee
니시무로 타이조
가부시기가이샤 도시바
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 니시무로 타이조, 가부시기가이샤 도시바 filed Critical 니시무로 타이조
Publication of KR19980024086A publication Critical patent/KR19980024086A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1435Saving, restoring, recovering or retrying at system level using file system or storage system metadata
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

화일을 갱신할 때에 갱신전 데이터의 덤프를 대기하는 일없이 장해 발생시의 롤백을 실현하는 컴퓨터 시스템을 제공한다.
화일에 대하여 기록 등이 요구되었을 때, 그 「화일 기록 정보」를 미확정큐(431)에 보존하여 프라이머리 화일(39)만을 즉시 갱신한다. 그리고, 체크포인트가 채취된 후에, 미확정큐(431)에 보존된 「화일 기록 정보」를 확정큐(432)로 이동시켜서 백업 화일(41)로의 반영을 행한다. 한편, 복원을 행할 때에는 미확정큐(431)에 보존된 「화일 기록 정보」에 기초하여, 최후로 채취한 체크포인트 이후에 갱신된 데이터에 대응하는 갱신전의 데이터를 백업 화일(41)로부터 모두 독출하고, 이 독출한 갱신전의 데이터를 이용하여 프라이머리 화일(39)을 체크포인트 시점에 복원한다.

Description

컴퓨터 시스템 및 화일 관리 방법
본 발명은, 예컨대 네트워크 접속된 복수의 컴퓨터에 의해 구성되는 네트워크 컴퓨팅 환경 등에 있어서, 높은 신뢰성을 필요로 하는 그룹 컴퓨팅 처리, 데이터 베이스 처리 및 트랜잭션 처리 등에 적용하기 적합한 컴퓨터 시스템 및 화일 관리 방법에 관한 것이다.
CPU에 의해서 실행되는 공정의 어드레스 공간이나 컨텍스트 및 화일 등의 상태를 정기적으로 채취하여(이것을 체크포인트라 칭함), 장해가 발생했을 때에, 최후로 채취한 체크포인트의 상태를 복원하고, 그 시점에서 공정의 실행을 재개시하는 장해로부터의 회복 기능을 갖는 시스템에 있어서는, 종래부터 외부 입출력 처리에 관한 과제가 있었다. 즉, 장해가 발생했을 때에, 최후로 채취한 체크포인트로부터 공정을 재실행시킬 때, 공정의 어드레스 공간이나 프로세서의 컨텍스트 등의 상태는 복원할 수 있지만, 외부 입력 장치의 상태의 복원은 용이하지 않았다.
예컨대, 화일에 대한 기록을 소거하는 것이 곤란하기 때문에, 화일에 대하여 기록을 행할 때에는 데이터를 화일에 기록하기 전에 기록 이전의 데이터를 사전에 판독하여 보존을 행하고, 그 후에 화일로의 데이터 기록을 행하고 있었다.
도 15는, 화일에 대한 기록을 소거하는 것이 곤란하기 때문에, 화일에 대하여 기록을 행할 때에는 데이터를 화일에 기록하기 전에 기록 이전의 데이터를 사전에 판독하여 보존을 행하고, 그 후에 화일로의 데이터 기록을 행하는 종래의 시스템의 구성을 설명하는 도면이다.
이 예에서는, 시각t1의 체크포인트를 채취한 시점에서 ABCD의 4바이트의 데이터로 이루어진 화일에, 시각 t2에 있어서 1 바이트째에 X를 기록하고 있다(1). 이 경우, 종래에서는, 화일의 1바이트째에 X를 기록하기 전에, 화일의 1바이트째의 데이터 B를 판독해 두고(이것을 undo 로그라 함)(2), 그 후에 화일의 1바이트째에 X를 기록하고 있다(3).
그 후, 시각t3에 있어서 장해가 발생하였기 때문에, 공정을 최후로 채취한 체크포인트의 상태(t1)로 롤백한다. 화일은, 체크포인트 tl 이후에 1바이트째가 X로 갱신되어 있지만, 갱신시에 채취된 undo 로그를 이용함으로써, 체크포인트 t1의 상태를 복원하고 있다. 또, 이 undo 로그는 다음의 체크포인트시에 불필요하게 되어 폐기된다.
또한, 예컨대 2개의 컴퓨터에 의해 구축되어, 그 한쪽(프라이머리 컴퓨터)을 운용계, 다른쪽(백업 컴퓨터)을 대기계로서 배분하여 2중화하고, 프라이머리 컴퓨터에 장해가 발생했을 때에, 백업 컴퓨터가 처리를 이어받음으로서 시스템의 가용성을 높이는 시스템도 존재한다. 그리고, 이러한 시스템에서, 전술한 바와 같이 체크포인트를 정기적으로 채취하여 가면, 신뢰성을 더욱 향상시키는 것이 가능해진다.
이와 같이, 공정의 어드레스 공간이나 컨텍스트 및 화일 등의 상태, 즉, 체크포인트를 정기적으로 채취해 가며, 장해가 발생했을 때에, 최후로 채취한 체크포인트의 상태를 복원하여, 그 시점에서 공정의 실행을 재개시하는 장해로부터의 회복 기능을 갖는 시스템(2중화되어 있는지 어떤지를 문제삼지 않는다)에 있어서는, 그 신뢰성은 향상되지만, 한편으로, 화일의 갱신(예컨대 기록)을 행할 때에, 일단 갱신전의 데이터를 화일로부터 판독하고, 또 화일로의 갱신을 행하지 않으면 안되었기 때문에, 화일의 갱신 성능을 저하시킨다는 과제가 있었다.
본 발명은, 이러한 실정에 감안하여 이루어진 것으로서, 체크포인트를 정기적으로 채취하여, 장해가 발생했을 때에는 최후로 채취한 체크포인트의 상황을 복원하여, 그 시점에서 공정의 실행을 재개시하는 장해로부터의 회복 기능을 갖는 시스템에 있어서, 화일의 갱신을 행할 때에, 갱신전의 데이터를 화일로부터 판독하는 것을 필요로 하지 않으며, 화일의 갱신 성능을 대폭 개선하는 것을 가능하게 하는 컴퓨터 시스템 및 화일 관리 방법을 제공하는 것을 목적으로 한다.
도 1은 본 발명의 기본 원리를 설명하기 위한 개념도.
도 2는 본 발명의 제 1 실시 형태에 관한 컴퓨터 시스템의 시스템 구성을 나타내는 도면.
도 3은 동일 실시 형태를 적용하는 컴퓨터 시스템의 개략 구성을 나타내는 도면.
도 4는 동일 실시 형태에 있어서 화일을 갱신하는 상태를 나타내는 도면.
도 5는 동일 실시 형태에 있어서 장해 발생시에 프라이머리 화일을 복원하는 상태를 나타내는 도면.
도 6은 동일 실시 형태의 화일 조작부가 「화일 기록」을 지시되었을 때의 처리의 흐름을 나타내는 흐름도.
도 7은 동일 실시 형태의 화일 조작부가 「체크포인트 채취」를 지시하였을 때의 처리의 흐름을 나타내는 흐름도.
도 8은 동일 실시 형태의 백업 화일 갱신부의 처리의 흐름을 나타내는 흐름도.
도 9는 동일 실시 형태의 공정에 어보트 등의 장해가 발생하여, 공정을 프라이머리 컴퓨터(30)상에서 최후로 채취한 체크포인트로부터 재실행할 경우의 처리의 흐름을 나타내는 흐름도.
도 l0은 동일 실시 형태의 프라이머리 컴퓨터상의 체크포인트 정보 복원부가 「어드레스 공간과 프로세서 컨텍스트의 복원」을 지시한 경우의 처리의 흐름을 나타내는 흐름도.
도 11은 동일 실시 형태의 프라이머리 화일 복원부가 「프라이머리 화일의 복원」을 지시한 경우의 처리의 흐름을 나타내는 흐름도.
도 12는 동일 실시 형태의 장해가 발생했을 때에 백업 화일로 처리를 이어받은 상태를 나타내는 도면.
도 13은 본 발명의 제 2 실시 형태에 관한 컴퓨터 시스템의 시스템 구성을 나타내는 도면.
도 14는 동일 실시 형태를 적용하는 컴퓨터 시스템의 개략 구성을 나타내는 도면.
도 15는 종전의 화일에 대한 기록을 소거하는 것이 곤란하기 때문에, 화일에 대하여 기록을 행할 때에, 데이터를 화일에 기록하기 전에 기록 이전의 데이터를 사전에 판독하여 보존을 행하고, 그 후에 화일로의 데이터 기록을 행하는 종래의 시스템의 구성을 설명하는 도면.
〈도면의 주요 부분에 대한 부호의 설명〉
10 : 운용계 시스템
11 : 애플리케이션 프로그램
12 : 재킷 루틴
13 : OS 버퍼 캐시
14 : 디스크 장치
20 : 대기계 시스템
21 : 데몬
211 : 미확정큐
212 : 확정큐
22 : OS 버퍼 캐시
23 : 디스크 장치
30 : 프라이머리 컴퓨터
31 : 체크포인트 제어부
32 : 체크포인트 정보 보존부
33 : 체크포인트 정보 복원부
34 : 체크포인트 정보
35 : 공정
36 : 화일 시스템
37 : 프라이머리 화일 복원부
38 : 프라이머리 화일 조작부
39 : 프라이머리 화일
40 : 백업 컴퓨터
41 : 백업 화일
42 : 프라이머리 화일 복원 정보 독출부
43 : 백업 화일 조작부
431 : 미확정큐
432 : 확정큐
44 : 백업 화일 갱신부
45 : 체크포인트 정보
46 : 체크포인트 정보 복원부
47 : 공정
50 : 네트워크
60a,60b : 디스크 장치
본 발명의 컴퓨터 시스템은, 운용계 및 대기계의 2개의 컴퓨터로 2중화된 컴퓨터 시스템으로서, 중단된 처리를 재개시하기 위한 체크포인트를 정기적으로 채취하고, 상기 운용계 및 대기계 쌍방의 컴퓨터 상에 보존하는 컴퓨터 시스템에 있어서, 상기 운용계의 컴퓨터 상에서 실행되는 공정에 의해서 갱신되는 화일을 상기 운용계 및 대기계 쌍방의 컴퓨터로 2중화하여 설치해 두며, 상기 공정으로부터 화일의 갱신이 지시되었을 때에, 그 갱신 정보를 상기 대기계의 컴퓨터 상에 보존하여 운용계의 화일만을 갱신하고, 그 갱신이 완료한 시점에서 그 갱신의 요구원에 대하여 갱신 종료를 통지하는 수단과, 상기 체크포인트가 채취된 후에, 상기 갱신 정보에 표시되는 갱신 내용을 상기 대기계의 화일에 반영시키는 수단을 구비하여 이루어진 것을 특징으로 한다.
본 발명의 컴퓨터 시스템에 있어서는, 공정이 화일의 갱신을 요구했을 때에, 그 갱신 내용을 나타내는 갱신 정보를 취득하여 보존하는 동시에, 운용계의 컴퓨터에 배치된 화일(운용계 화일)만을 즉시 갱신하고, 그 결과를 요구원인 공정에 대답한다. 그리고, 체크포인트가 채취된 후에, 그 보존해 둔 갱신 정보로 표시되는 갱신 내용을, 대기계의 컴퓨터에 배치된 화일(대기계 화일)에 반영시킨다.
한편, 예컨대 공정이 중단(abort)됐을 때 등에는, 보존해 둔 갱신 정보에 기초하여, 최후에 채취한 체크포인트 이후에 갱신된 데이터에 대응하는 갱신전의 데이터를 대기계 화일로부터 모두 독출하고, 이 독출한 갱신전의 데이터를 이용하여 운용계 화일을 체크포인트 시점에 복원한다.
즉, 이 컴퓨터 시스템에 있어서는, 종래와 같이 화일을 갱신할 때에, 갱신전의 데이터를 독출하여 덤프시켜 두는 처리의 완료를 통상 처리에 대기시키는 일없이, 장해시의 화일의 복원이 실현되게 되고, 신뢰성을 손상하는 일없이 화일의 갱신 성능을 비약적으로 향상시키는 것이 가능해진다.
또한, 운용계 화일의 복원에 대신하여, 최종 체크포인트 이전에 보존된 갱신 정보로 표시되는 갱신 내용 전부가 반영된 대기계 화일을 이용한 체크포인트로부터의 공정의 재실행도 유효하다. 즉, 운용계의 컴퓨터의 장해 등에 의해, 운용계 화일을 이용한 재개시가 불가능한 경우 등에 있어서의 처리의 계속성도 확보하게 되어, 시스템의 가용성을 향상시키게 된다. 또한, 이 경우에는, 제 3 컴퓨터에 새롭게 대기계 화일을 확보하면, 시스템의 가용성을 더욱 향상시키는 것이 가능해진다.
우선, 도 1을 참조하여 본 발명의 기본 원리를 설명한다. 도 1에 도시된 바와 같이, 본 발명의 컴퓨터 시스템은, 운용계 시스템(10)과 대기계 시스템(20)으로 다중화된 시스템을 전제로 한다. 이하에 각각의 동작을 설명한다.
(통상 처리)
(1) 운용계 시스템(10)에서 애플리케이션 프로그램(11)이 기록 시스템 콜을 발행한다.
(2) 재킷 루틴(12)이 기록 시스템 콜을 후크하고, 운용계의 오퍼레이팅 시스템에 기록 시스템 콜을 발행하는 동시에 그 기록 요구를 대기계 시스템(20)에 송신한다.
단, 대기계 시스템(20)에 즉시 기록 요구를 송신할 필요는 없으며, 다음의 체크포인트까지 송신하면 좋다. 또한, 대기계 시스템(20)에서는 송신한 기록 요구를 즉시 실행하는 일은 없으며, 일단 미확정큐(211)에 저장한다.
(3) 체크포인트 처리가 지시되면, 운용계 시스템(l0)은, 모여 있는 기록 요구를 전부 대기계 시스템(20)에 송신하여 끝내지 않으면 안된다.
(4) 한편, 대기계 시스템(20)에서는, 미확정큐(211)에 저장된 기록 요구를 확정큐(212)로 이동한다.
(5) 이 확정큐(212)로 옮겨진 기록 요구는, 대기계 시스템(20)의 오퍼레이팅 시스템에 의해서 순차적으로 처리되어 간다.
즉, 통상 처리에 있어서 발생하는 화일 갱신에 있어서는, 갱신전의 데이터를 독출하여 덤프시켜 두는 처리의 완료를 대기하는 일이 없다.
(롤백 처리)
(3)' 장해가 발생했을 때에, 운용계 시스템(l0) 및 대기계 시스템(20)의 쌍방에 롤백 처리가 지시된다.
(4)' 이 때, 운용계 시스템(10)에 잔존하는 기록 요구를, 전부 대기계 시스템(20)에 송신한다. 또한, 대기계의 미확정큐(211)에 저장된 기록 요구는, 최후의 체크포인트 이후에 발행된 것이기 때문에, 반대로 이것을 참조하여 대기계 화일(23)로부터 갱신전의 데이터를 독출하며, 이 독출한 갱신전의 데이터를 이용하여 운용계 화일(14)을 롤백한다. 이것에 의해, 운용계 화일(14) 및 대기계 화일(23)의 쌍방의 화일이 최후의 체크포인트 시점의 상태가 된다.
(5)' 그리고, 대기계 시스템(20)은, 미확정큐(211)에 잔존하는 기록 요구를 전부 소거한다.
이것에 의해, 체크포인트 시점에서의 재개시가 가능해진다.
다음에, 본 발명의 실시 형태를 설명한다.
(제 1 실시 형태)
우선, 본 발명의 제 1 실시 형태를 설명한다. 도 2에는 본 발명의 제 1 실시 형태에 관한 컴퓨터 시스템의 시스템 구성이 표시되어 있다. 도 2에 도시한 바와 같이, 본 실시 형태의 컴퓨터 시스템은, 컴퓨터가 프라이머리 컴퓨터(30)와, 백업 컴퓨터(40)로 2중화되어 있고, 이들은 네트워크(50)로 접속되어 있다. 이 프라이머리 컴퓨터(30)와 백업 컴퓨터(40)는 전술한 운용계 시스템(10) 및 대기계 시스템(20) 쌍방을 각각 구비하고 있으며, 어느 한쪽에서 운용계 시스템(10)이 동작할 때에, 다른쪽에서는 대기계 시스템(20)이 동작한다. 여기서는, 프라이머리 컴퓨터(30)측에서 운용계 시스템(10), 백업 컴퓨터(40)측에서 대기계 시스템(20)을 각각 설명한다.
공정(35)은 프라이머리 컴퓨터(30)상에서 실행되고, 프라이머리 화일(39)과 백업 화일(41)로 2중화된 화일을 갱신한다. 여기서, 프라이머리 화일(39)은 프라이머리 컴퓨터(30)상에, 백업 화일(41)은 백업 컴퓨터(40)상에 배치되며, 프라이머리 컴퓨터(30)상의 화일 시스템(36) 및 백업 컴퓨터(40)상의 화일 시스템(48)을 통해 갱신된다.
프라이머리 컴퓨터(30)상의 화일 시스템(36)은 프라이머리 화일 조작부(38)와 프라이머리 화일 복원부(37)를 포함하고 있다. 한편, 백업 컴퓨터(40)상의 화일 시스템(48)은 백업 화일 조작부(43), 미확정큐(431), 확정큐(432), 백업 화일 갱신부(44) 및 프라이머리 화일 복원 정보 독출부(42)를 포함하고 있다.
공정(35)이 이 2중화된 화일을 갱신할 경우, 프라이머리 화일 조작부(38) 및 백업 화일 조작부(43)를 경유하여 행한다. 공정(35)이 이 2중화된 화일에 대응하는 기록을 행하면, 프라이머리 화일(39)은 그대로 즉시 갱신되지만, 백업 화일(41)은 그 시점에서는 갱신되지 않으며, 「화일 기록 정보」가 백업 화일 조작부(43)를 경유하여 백업 컴퓨터(40)상의 미확정큐(431)에 보존된다.
또한, 공정(35)이 체크포인트를 채취할 경우에는, 체크포인트 제어부(31)가 체크포인트 정보 보존부(32)와 프라이머리 화일 조작부(38)에 그 지시를 보낸다. 체크포인트 정보 보존부(32)는 체크포인트 채취의 지시를 수취하면, 체크포인트 정보(어드레스 공간과 프로세서 컨텍스트)를 프라이머리 컴퓨터(30)상 및 백업 컴퓨터(40)상에 보존한다(프라이머리 컴퓨터(30)상의 체크포인트 정보(34) 및 백업 컴퓨터(40)상의 체크포인트 정보(45)).
한편, 프라이머리 화일 조작부(38)는, 체크포인트 채취의 지시를 수취하면, 백업 화일 조작부(43)를 경유하여, 미확정큐(431)에 보존되고 있던 「화일 기록 정보」를 확정큐(432)로 이동시킨다. 이 확정큐(432)에 이동되어 있는 「화일 기록 정보」는, 체크포인트 채취 후에, 백업 화일 갱신부(44)에 의해서 백업 화일(4l)의 갱신을 위해 사용되고, 백업 화일(41)의 갱신 후에 폐기된다. 이것에 의해, 체크포인트 이후에 프라이머리 화일(39)에 대하여 행해진 것과 동일한 기록 조작이, 백업 화일(41)에 대해서도 행해지게 된다.
공정(35)에 중단 등의 장해가 발생하여, 공정(35)을 프라이머리 컴퓨터(30)상에서 최후로 채취한 체크포인트로부터 재실행할 경우, 어드레스 공간과 프로세서 컨텍스트는 프라이머리 컴퓨터(30)상의 체크포인트 정보 복원부(37)에 의해서 복원된다.
화일에 관해서는, 백업 화일(41)은 체크포인트 이후의 갱신은 아직 미확정큐(431)에 「화일 기록 정보」가 보존되어 있을 뿐이고, 실제로는 갱신되어 있지 않기 때문에 복원은 불필요하다. 그러나, 프라이머리 화일(39)은 체크포인트 이후에 이미 갱신이 행해지고 있기 때문에 복원이 필요하다. 따라서, 미확정큐(431)에 보존된 「화일 기록 정보」에 기초하여, 프라이머리 화일(39)의 갱신전 데이터를 백업 화일(41)로부터 판독하여, 이 판독한 갱신전 데이터를 프라이머리 화일(39)에 기록함으로써 복원한다. 그리고, 이 후, 미확정큐(431)에 보존된 「화일 기록 정보」를 폐기한다. 또, 확정큐(432)에 「화일 기록 정보」가 보존되어 있는 경우에는, 그 「화일 기록 정보」의 백업 화일(41)로의 반영이 완료한 후에, 전술한 복원처리를 개시한다.
한편, 프라이머리 컴퓨터(30) 또는 프라이머리 컴퓨터(30)를 제어하는 오퍼레이팅 시스템이 시스템 다운 등의 장해를 발생시키고, 공정(35)을 백업 컴퓨터(40)상에서 최후로 채취한 체크포인트로부터 재실행할 경우에는, 어드레스 공간과 프로세서 컨텍스트는 체크포인트 정보 복원부(46)에 의해서 공정(47)에 복원된다.
화일에 관해서는, 백업 화일(41)은 체크포인트 이후의 갱신은 아직 미확정큐(431)에 「화일 기록 정보」가 보존되어 있을 뿐이고, 실제로는 갱신되어 있지 않기 때문에 복원은 불필요하다.
또, 이 「 화일 기록 정보」의 프라이머리 컴퓨터(30)로부터 백업 컴퓨터(40)로의 전송에 관해서는 최적화가 가능하다. 장해가 발생했을 때에, 프라이머리 컴퓨터(30)가 다운하지 않은 경우는, 프라이머리 화일(39)을 복원하여, 프라이머리 화일(39)을 이용하여 체크포인트로부터의 처리를 재개한다. 한편, 장해가 발생했을 때에, 프라이머리 컴퓨터(30)가 다운한 경우에는, 백업 화일(41)을 이용하여 체크포인트로부터 처리를 재개한다.
그 때문에, 「화일 기록 정보」는 프라이머리 화일 조작부(38)로부터 백업 화일 조작부(43)에 즉시 보낼 필요는 없다. 즉, 이들 「화일 기록 정보」는 다음의 체크포인트까지 보내면 좋기 때문에, 전송 효율을 고려하면, 일단 프라이머리 화일 조작부(38)에 있어서 축적해 두고, 「일정 용량 축적되었다」, 「일정 시간 경과하였다」 및 「체크포인트 채취가 요구되었다」 라는 사상의 발생을 트리거로서, 백업 화일 조작부(43)에 모아서 보내는 것이 가능하다.
도 3에는, 본 실시 형태를 적용하는 컴퓨터 시스템의 개략 구성이 표시되어 있다. 컴퓨터는 프라이머리 컴퓨터(30)와 백업 컴퓨터(40)로 2중화되어 있고, 프라이머리 컴퓨터(30)에는 디스크 장치(60a)가, 백업 컴퓨터(40)에는 디스크 장치(60b)가 각각 접속되어 있다. 공정(35)은 프라이머리 컴퓨터 상에서 실행되고, 또한, 이 공정(35)이 액세스하는 화일은, 프라이머리 화일(39)과 백업 화일(41)로 2중화되어 있고, 각각 디스크 장치(60a)와 디스크 장치(60b)에 배치되어 있다.
그리고, 체크포인트는, 체크포인트 정보를 프라이머리 컴퓨터(30)측(프라이머리 체크포인트 정보(34))과, 백업 컴퓨터(40)측(백업 체크포인트 정보(45))의 양방에 유지한다. 또, 이 도면에서는, 체크포인트를 디스크 장치 상에 유지하고 있지만, 메모리 상에 유지하여도 상관없다.
만약, 프라이머리 컴퓨터(30) 또는 프라이머리 컴퓨터(30)를 제어하는 오퍼레이팅 시스템에 시스템 다운 등의 장해가 발생했을 경우에는, 백업 컴퓨터(40)측에서 체크포인트 정보(45)를 이용하여 공정(47)을 재실행한다. 이 경우 공정(47)은 백업 화일(41)을 사용하게 된다.
또한, 프라이머리 화일(39) 또는 백업 화일(41)을 복수개 가지며, 3중화 이상의 화일 시스템을 만드는 것도 가능하다. 이 경우, 예컨대 3중화 화일 시스템이면,
(1) 2개의 프라이머리 화일과 1개의 백업 화일
(2) 1개의 프라이머리 화일과 2개의 백업 화일
이란 조합을 생각할 수 있다.
도 4는 본 실시 형태에 있어서 화일을 갱신하는 상태를 나타내는 도면이다. 이 예에서는, 프라이머리 컴퓨터(30)상에서 움직이는 공정(35)이, 4바이트의 데이터 ABCD를 갖는 2중화된 화일(프라이머리 컴퓨터(30)상의 프라이머리 화일(39)과, 백업 컴퓨터(40)상의 백업 화일(41))에 대하여, 시각tl에서 1바이트째에 X를 기록하고 있다(1). 이것에 의해서 프라이머리 화일(39)은 즉시 갱신되지만, 백업 화일(41)은 즉시 갱신되지 않고, 「화일 기록 정보」만을 보존하고 있다.
이 후, 시각t2에 있어서 체크포인트가 채취됨으로써, 앞의 「화일 기록 정보」의 실행이 확정된다(2). 그리고 시각t2 이후에서, 확정된 「화일 기록 정보」에 기초하여, 백업 화일(41)의 갱신을 실행하고 있다.
도 5는, 본 실시 형태에 있어서 장해 발생시에 프라이머리 화일을 복원하는 상태를 나타내는 도면이다. 이 예에서는, 프라이머리 컴퓨터(30)상에서 움직이는 공정(35)이 4바이트의 데이터 ABCD를 갖는 2중화된 화일(프라이머리 컴퓨터(30)상의 프라이머리 화일(39)과, 백업 컴퓨터(40)상의 백업 화일(41))에 대하여, 시각t1에 있어서 1바이트째에 X를 기록하고 있다(1). 이것에 의해서 프라이머리 화일(39)은 즉시 갱신되지만, 백업 화일(41)은 즉시 갱신되지는 않으며, 「화일 기록 정보」만을 보존하고 있다.
이 후, 시각t2에 있어서 장해가 발생하고 있다(2). 즉, 시각tl에 있어서의 「화일 기록 정보」로 프라이머리 화일(39)은 갱신되어 있기 때문에 복원할 필요가 있지만, 백업 화일(41)은 아직 갱신되어 있지 않기 때문에 복원할 필요가 없다. 여기서 시각t1에 있어서 보존된 「화일 기록 정보」에 의해서, 프라이머리 화일(39)의 갱신 부분을 알 수 있다. 그래서, 프라이머리 화일(39)의 복원에 있어서는, 미확정의 「화일 기록 정보」에 표시된 위치의 데이터를 백업 화일(41)로부터 판독하고, 그 판독한 데이터를 프라이머리 화일(39)에 기록함으로써, 프라이머리 화일(39)을 복원한다.
그리고, 프라이머리 컴퓨터(30)상에서 취하고 있는 체크포인트를 이용하여, 프라이머리 컴퓨터(30)상에서 공정(35)을 재실행하고 있다. 이 재실행된 공정(35)은 복원된 프라이머리 화일(39)을 사용한다.
도 6은, 화일 조작부가 「화일 기록」을 지시할 때의 처리의 흐름을 나타내는 흐름도이다. 이 경우, 우선, 「화일 기록 정보」를 보존하고, 미확정큐(431)에 링크한다(단계 Al). 다음에, 「화일 기록 정보」에 따라서, 프라이머리 화일(39)의 갱신을 행한다(단계 A2). 이 시점에서, 「화일 기록」 조작은 완료하였다고 하여, 요구측에 완료 통지를 행한다(단계 A3).
도 7은, 화일 조작부가 「체크포인트 채취」를 지시했을 때의 처리의 흐름을 나타내는 흐름도이다. 이 경우, 보존되어 있는 「화일 기록 정보」를 미확정큐(431)로부터 확정큐(432)로 이동한다(단계 B1).
도 8은, 백업 화일 갱신부의 처리의 흐름을 나타내는 흐름도이다. 이 경우, 우선, 확정큐(432)에 「화일 기록 정보」가 링크되어 있는지 어떤지를 검사한다(단계 C1). 만약, 링크되어 있지 않은 경우(단계 C1의 N), 백업 화일 갱신부(44)는 이 검사를 속행한다. 한편, 링크되어 있는 경우에는(단계 C1의 Y), 확정큐(432)에 링크되어 있는 「화일 기록 정보」에 기초하여, 백업 화일(41)을 갱신한다(단계 C2). 그리고, 실행한 「화일 기록 정보」를 확정큐(432)로부터 폐기한다(단계 C3).
도 9는, 공정(35)에 중단 등의 장해가 발생하여, 공정(35)을 프라이머리 컴퓨터(30)상에서 최후로 채취한 체크포인트로부터 재실행할 경우의 처리의 흐름을 나타내는 흐름도이다.
공정(35)에 장해가 발생하면, 우선, 프라이머리 컴퓨터(30)상의 체크포인트 정보 복원부(33)에, 「어드레스 공간과 프로세서 컨텍스트의 복원」을 지시한다(단계 D1). 다음에, 프라이머리 화일 복원부(33)에, 「프라이머리 화일의 복원」을 지시한다(단계 D2).
도 10은, 프라이머리 컴퓨터(30)상의 체크포인트 정보 복원부가 「어드레스 공간과 프로세서 컨텍스트의 복원」을 지시한 경우의 처리의 흐름을 나타내는 흐름도이다. 이 경우, 우선, 공정(35)의 어드레스 공간을 복원한다(단계 E1). 다음에, 공정(35)의 체크포인트 채취시의 프로세서 컨텍스트의 상태를 복원한다(단계 E2).
도 11은, 프라이머리 화일 복원부(37)가, 「프라이머리 화일의 복원」을 지시한 경우의 처리의 흐름을 나타내는 흐름도이다. 이 경우, 우선, 미확정큐(431)에, 「화일 기록 정보」가 링크되어 있는지 어떤지를 검사한다(단계 Fl). 「화일 기록 정보」가 링크되어 있는 경우에는(단계 Fl의 Y) 미확정큐(431)에 링크되어 있는 「화일 기록 정보」에 따라서, 프라이머리 화일(39) 중의 갱신되어 있는 부분의 데이터를 백업 화일(41)로부터 판독하고, 그 판독한 데이터를 프라이머리 화일(39)에 기록함으로써, 프라이머리 화일(39)의 그 갱신되어 있는 부분의 데이터를 복원한다(단계 F2). 그리고, 복원에 이용한 「화일 기록 정보」를 미확정큐(431)로부터 폐기한다(단계 F3). 이 처리는, 미확정큐(431)에 링크한 「화일 기록 정보」가 없어질 때까지 반복된다.
프라이머리 컴퓨터(30) 또는 프라이머리 컴퓨터(30)를 제어하는 오퍼레이팅 시스템에 시스템 다운 등의 장해가 발생한 경우에는, 공정(35)을 백업 컴퓨터(40)상에서 최후로 채취한 체크포인트로부터 재실행한다. 이 경우는, 백업 화일(41)로 처리를 이어받는다. 도 12는 장해가 발생했을 때에, 백업 화일(41)로 처리를 이어받는 상태를 나타내는 도면이다.
이 예에서는, 프라이머리 컴퓨터(30)상에서 동작하는 공정(35)이, 4바이트의 데이터 ABCD를 갖는 2중화된 화일(프라이머리 컴퓨터(30)상의 프라이머리 화일(39)과, 백업 컴퓨터(40)상의 백업 화일(41))에 대하여, 시각t1에 있어서 1바이트째에 X를 기록하고 있다(1). 이것에 의해서 프라이머리 화일(39)은 즉시 갱신되지만, 백업 화일(41)은 즉시 갱신되지는 않고, 「화일 기록 정보」만을 보존하고 있다.
이 후, 시각 t2에 있어서 프라이머리 컴퓨터(30)에 장해가 발생하고 있다(2). 이 경우, 백업 컴퓨터(40)상에 취해진 체크포인트를 이용하여, 백업 컴퓨터(40)상에서 공정(47)을 재실행하고 있다. 이 때, 공정(47)은 백업 화일(41)을 이용하여 처리를 계속하는 것이고, 시각t1에 있어서 프라이머리 화일(39)은 갱신되어 있지만, 백업 화일(41)은 아직 갱신되어 있지 않기 때문에, 백업 컴퓨터(40)상에서의 공정(47)의 재실행에 있어서는 백업 화일(42)을 그대로 사용할 수 있다.
또, 장해 발생에 의해 백업 화일을 분리한 경우에는, 그 후에 새로운 백업 화일을 작성함으로써, 다시 도 1과 같은 초기 상태를 재현할 수 있으며, 또 장해발생에 대해서도 회복 처리가 가능해진다.
또한, 장해 발생에 의해서 백업 화일로 처리를 이어받고, 체크포인트로부터 처리를 재실행한 경우에는, 그 후, 백업 화일을 프라이머리 화일로서 새로운 백업 화일을 작성함으로써, 다시 도 1과 같은 초기 상태를 재현할 수 있으며, 또 장해발생에 대해서도 회복 처리가 가능해진다. 또 백업 화일을 작성할 경우에는 이하와 같은 2개의 방법이 있다.
(1) 백업 화일 분리 후의 프라이머리 화일의 갱신 정보와 데이터를 보존해 두고, 백업 화일을 재접속할 경우에는, 백업 화일에 상기 분리 후의 프라이머리 화일의 갱신 정보와 데이터를 반영시킨다.
(2) 프라이머리 화일을 백업 화일에 복사한다. 단, 복사 중에도 프라이머리 화일이 계속 갱신되고 있는 경우에는, 복사를 시작하는 동시에 화일의 갱신 정보와 데이터를 백업 화일에도 반영시킨다.
또, 이 2개의 방법을 조합한 이하와 같은 방법도 유효하다.
(3) 분리된 백업 화일(또는 장해 발생전의 프라이머리 화일)을 재접속하는 것을 전제로, 일정 시간이 경과할 때까지는 (1)의 방법이 취해지는 바와 같이, 백업 화일 분리 후의 프라이머리 화일의 갱신 정보와 데이터를 보존해 둔다. 일정 시간을 경과하면, (1)의 방법을 끝내고, 백업 화일 분리 후의 프라이머리 화일의 갱신 정보와 데이터의 보존은 멈추고 (2)의 방법을 취하도록 한다. 또한, 분리된 백업 화일 이외의 화일로 재접속할 경우에도, 백업 화일 분리 후의 프라이머리 화일의 갱신 정보와 데이터의 보존은 멈추고 (2)의 방법을 취한다.
(제 2 실시 형태)
다음에, 본 발명의 제 2 실시 형태를 설명한다. 제 1 실시 형태에서는, 2중화된 컴퓨터 시스템을 설명하였지만, 본 발명은, 2중화되어 있지 않은 컴퓨터상의 화일 시스템에 적용하여도 효과가 있다. 그래서, 본 실시 형태에서는, 2중화되어 있지 않은 컴퓨터상의 화일 시스템에 적용한 경우를 예로 설명한다. 도 13은, 본 발명을 2중화되어 있지 않은 컴퓨터상의 화일 시스템에 적용한 경우의 구성도이다. 이 시스템에서는, 컴퓨터는 2중화되어 있지 않고, 컴퓨터(30)만이 존재한다. 공정(35)은 이 컴퓨터(30)상에서 실행되고, 프라이머리 화일(39)과 백업 화일(41)로 2중화된 화일을 갱신한다. 즉, 이들 프라이머리 화일(39) 및 백업 화일(41)은 모두 컴퓨터(30)상에 배치되어, 화일 시스템(36)을 통해 갱신된다.
컴퓨터(30)상의 화일 시스템(36)은 프라이머리 화일 조작부(38), 프라이머리 화일 복원부(37), 백업 화일 조작부(43), 미확정큐(431), 확정큐(432), 백업 화일 갱신부(44) 및 프라이머리 화일 복원 정보 독출부(42)를 포함하고 있다.
공정(35)이 이 2중화된 화일을 갱신할 때는, 프라이머리 화일 조작부(38) 및 백업 화일 조작부(43)를 경유하여 행한다. 공정(35)이 이 2중화된 화일에 대한 기록을 행하면, 프라이머리 화일(39)은 그대로 갱신되지만, 백업 화일(41)은 갱신되지 않고, 「화일 기록 정보」가 백업 화일 조작부(43)를 경유하여 미확정큐(431)에 보존된다.
또한, 공정(35)이 체크포인트를 채취할 때에는, 체크포인트 제어부(31)가, 체크포인트 정보 보존부(32)와 프라이머리 화일 조작부(43)에 지시를 보낸다. 체크포인트 정보 보존부(32)는 체크포인트 채취의 지시를 받으면, 어드레스 공간과 프로세서 컨텍스트를 컴퓨터(30)상에 행한다(체크포인트 정보(34)).
한편, 프라이머리 화일 조작부(38)는, 체크포인트 채취의 지시를 받으면, 백업 화일 조작부(43)를 경유하여, 미확정큐(431)에 보존되어 있던 「화일 기록 정보」를 확정큐(432)로 이동시킨다. 확정큐(432)로 이동된 「화일 기록 정보」는, 체크포인트 채취 후에, 백업 화일 갱신부(44)에 의해서 백업 화일(41)의 갱신을 위해 사용되고, 백업 화일(41)의 갱신 후에 폐기된다. 이것에 의해, 체크포인트 이후에 프라이머리 화일(39)에 대하여 행해진 것과 같이, 기록 조작이 백업 화일(41)에 대하여 행해진다.
공정(35)에 중단 등의 장해가 발생하여, 공정(35)을 컴퓨터(30)상에서 최후에 채취한 체크포인
트로부터 재실행할 경우, 어드레스 공간과 프로세서 컨텍스트는 컴퓨터(30)상의 체크포인트 정보 복원부(33)에 의해서 복원된다.
화일에 관해서는, 백업 화일(41)은 체크포인트 이후의 갱신이 아직 미확정큐(431)에 「화일 기록 정보」가 보존되어 있을 뿐이고, 실제로는 갱신되어 있지 않기 때문에 복원은 불필요하다. 그러나, 프라이머리 화일(39)은 체크포인트 이후에 이미 갱신이 행해지고 있기 때문에 복원이 필요하다. 따라서, 미확정큐(431)에 보존된 「화일 기록 정보」에 기초하여, 프라이머리 화일(39)의 갱신전 데이터를 백업 화일(41)로부터 판독하고, 이 판독한 갱신전 데이터를 프라이머리 화일(39)에 기록함으로써 복원한다. 그리고, 이 후, 미확정큐(431)에 보존된 「화일 기록 정보」를 폐기한다. 또, 확정큐(432)에 「화일 기록 정보」가 보존되어 있는 경우에는, 그 「화일 기록 정보」의 백업 화일(41)로의 반영이 완료한 후에, 전술한 복원 처리를 개시한다.
도 14에는, 본 실시 형태를 적용하는 컴퓨터 시스템의 개략 구성이 표시되어 있다. 본 실시 형태의 시스템은 컴퓨터(30)만으로 가동하여 2중화되어 있지 않다. 컴퓨터(30)에는 디스크 장치(60a)와 디스크 장치(6Ob)가 접속되어 있다. 공정(35)은 컴퓨터(30)상에서 실행되고, 또한, 이 공정(35)이 액세스하는 화일은 프라이머리 화일(39)과 백업 화일(41)로 2중화되어 있으며, 각각 디스크 장치(60a)와 디스크 장치(60b)에 배치되어 있다.
이와 같이, 본 발명을 적용함으로써, 공정의 어드레스 공간이나 프로세서의 컨텍스트 등의 상태(체크포인트 정보)를 정기적으로 보존하면서 실행을 계속하고, 장해가 발생했을 때에는 최후로 보존한 체크포인트로부터 공정을 재실행시키는 것에 의한 장해시 대책을 행한 시스템에 있어서, 화일의 갱신을 행할 때에, 일단 갱신전 데이터를 화일로부터 판독할 필요가 없어지기 때문에, 화일의 갱신 성능이 대폭 개선된다.
또, 전술의 실시 형태에 기재한 화일의 관리 방법은, 컴퓨터에 실행시킬 수 있는 프로그램으로서 플로피 디스크, 광디스크 및 반도체 메모리 등의 기억 매체에 저장하여 배포하는 것이 가능하다.
이상 상세히 기술한 바와 같이, 본 발명에 의하면, 공정이 화일의 갱신을 요구했을 때에, 그 갱신 내용을 나타내는 갱신 정보를 취득하여 보존하는 동시에 프라이머리 화일만을 즉시 갱신하고, 체크포인트가 채취된 후에, 그 보존해 둔 갱신 정보로 표시되는 갱신 내용을 백업 화일에 반영시킨다. 그리고, 예컨대 공정이 중단됐을 때 등에는, 보존해 둔 갱신 정보에 기초하여, 최후에 채취한 체크포인트 이후에 갱신된 데이터에 대응하는 갱신전의 데이터를 백업 화일로부터 전부 독출하고, 이 독출한 갱신전의 데이터를 이용하여 프라이머리 화일을 체크포인트 시점에 복원하여, 공정의 재실행을 개시한다(백업 화일을 이용한 공정의 재실행의 개시도 가능).
즉, 이 컴퓨터 시스템에 있어서는, 종래와 같이 화일을 갱신할 때에, 갱신전의 데이터를 독출하여 덤프시켜 두는 처리의 완료를 통상 처리에 대기시키는 일없이, 장해시의 화일의 복원이 실현되게 되어, 신뢰성을 손상하는 일없이 화일의 갱신 성능을 비약적으로 향상시키는 것이 가능해진다.

Claims (12)

  1. 운용계 및 대기계의 2개의 컴퓨터로 2중화된 컴퓨터 시스템으로서, 중단된 처리를 재개시하기 위한 체크포인트를 정기적으로 채취하여, 상기 운용계 및 대기계 쌍방의 컴퓨터 상에 보존하는 컴퓨터 시스템에 있어서,
    상기 운용계의 컴퓨터 상에서 실행되는 공정에 의해서 갱신되는 화일을 상기 운용계 및 대기계 쌍방의 컴퓨터로 2중화하여 설치해 두며,
    상기 공정으로부터 화일의 갱신이 지시되었을 때에, 그 갱신 정보를 상기 대기계의 컴퓨터 상에 보존하여 운용계의 화일만을 갱신하고, 그 갱신이 완료한 시점에서 그 갱신의 요구원에 대하여 갱신 완료를 통지하는 수단과,
    상기 체크포인트가 채취된 후에, 상기 갱신 정보에 표시되는 갱신 내용을 상기 대기계의 화일에 반영시키는 수단을 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  2. 제 1 항에 있어서, 상기 갱신 정보를 상기 운용계의 컴퓨터 상에 버퍼링해 두고, 상기 체크포인트의 채취 시점까지 상기 대기계의 컴퓨터에 일괄 전송하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  3. 제 1 항에 있어서, 상기 공정이 중단됐을 때에, 최후의 체크포인트 이후에 실행된 화일의 갱신에 대한 갱신전의 데이터를 상기 갱신 정보에 의해 상기 대기계의 화일로부터 독출하고, 상기 운용계의 화일을 상기 체크포인트 시점의 상태로 복원한 후, 상기 공정을 상기 체크포인트로부터 재실행하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  4. 제 1 항에 있어서, 상기 공정이 중단됐을 때에, 최후의 체크포인트 이후에 보존된 갱신 정보를 삭제하고, 상기 체크포인트 이전의 갱신 정보에 의해 표시되는 갱신을 상기 대기계의 화일에 반영시킨 후, 상기 공정을 상기 대기계의 컴퓨터 상에서 상기 체크포인트로부터 재실행하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  5. 제 1 항에 있어서, 상기 운용계의 컴퓨터 또는 이 운용계의 컴퓨터를 제어하는 오퍼레이팅 시스템에 장해가 발생했을 때에, 최후의 체크포인트 이후에 보존된 갱신 정보를 삭제하고, 상기 체크포인트 이전의 갱신 정보에 의해 표시되는 갱신을 상기 대기계의 화일에 반영시킨 후, 상기 공정을 상기 대기계의 컴퓨터 상에서 상기 체크포인트로부터 재실행하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  6. 제 1 항에 있어서, 상기 대기계의 컴퓨터 또는 이 대기계의 컴퓨터를 제어하는 오퍼레이팅 시스템에 장해가 발생했을 때에, 상기 체크포인트 및 갱신 정보의 대기계의 컴퓨터로의 전송을 정지하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  7. 제 1 항에 있어서, 상기 운용계의 화일에 장해가 발생했을 때에, 최후의 체크포인트 이후에 보존된 갱신 정보를 삭제하고, 상기 체크포인트 이전의 갱신 정보에 의해 표시되는 갱신을 상기 대기계의 화일에 반영시킨 후, 상기 공정을 상기 대기계의 컴퓨터 상에서 상기 체크포인트로부터 재실행하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  8. 제 1 항에 있어서, 상기 대기계의 화일에 장해가 발생했을 때에, 상기 체크포인트 및 갱신 정보의 대기계의 컴퓨터로의 전송을 정지하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  9. 제 1 항에 있어서, 대기계의 화일의 분리가 행해졌을 때에, 제 3 컴퓨터 상에 새롭게 대기계의 화일을 확보하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  10. 제 1 항에 있어서, 대기계의 화일을 이용하여 상기 공정의 상기 체크포인트로부터의 재실행이 행해졌을 때에, 상기 대기계의 화일을 운용계로 전환하여, 상기 운용계의 컴퓨터 상에 새롭게 대기계의 화일을 확보하는 수단을 추가로 구비하는 것을 특징으로 하는 컴퓨터 시스템.
  11. 운용계 및 대기계의 2개의 컴퓨터로 2중화된 컴퓨터 시스템으로서, 중단된 처리를 재개시하기 위한 체크포인트를 정기적으로 채취하고, 상기 운용계 및 대기계 쌍방의 컴퓨터 상에 보존하는 컴퓨터 시스템의 화일 관리 방법에 있어서,
    상기 운용계의 컴퓨터 상에서 실행되는 공정에 의해서 갱신되는 화일은, 상기 운용계 및 대기계 쌍방의 컴퓨터 상에서 2중화되어 설치되고,
    상기 공정으로부터 화일의 갱신이 지시되었을 때에, 그 갱신 정보를 상기 대기계의 컴퓨터 상에 보존하여 운용계의 화일만을 갱신하고, 그 갱신이 완료한 시점에서 그 갱신의 요구원에 대하여 갱신 완료를 통지하는 단계와,
    상기 체크포인트가 채취된 후에, 상기 갱신 정보에 표시되는 갱신 내용을 상기 대기계의 화일에 반영시키는 단계를 구비하는 것을 특징으로 하는 화일 관리 방법.
  12. 운용계 및 대기계의 2개의 컴퓨터로 2중화되고, 중단된 처리를 재개시하기 위한 체크포인트를 정기적으로 채취하여 상기 운용계 및 대기계 쌍방의 컴퓨터 상에 보존하며, 상기 운용계의 컴퓨터 상에서 실행되는 공정에 의해서 갱신되는 화일을 상기 운용계 및 대기계 쌍방의 컴퓨터 상에서 다중화하여 설치한 컴퓨터 시스템의 화일을 관리하기 위한 프로그램으로서,
    상기 공정으로부터 화일의 갱신이 지시되었을 때에, 그 갱신 정보를 상기 대기계의 컴퓨터 상에 보존하여 운용계의 화일만을 갱신하고, 그 갱신이 완료된 시점에서 그 갱신의 요구원에 대하여 갱신 완료를 통지하며,
    상기 체크포인트가 채취된 후에, 상기 갱신 정보에 표시되는 갱신 내용을 상기 대기계의 화일에 반영시키도록 컴퓨터를 제어하기 위한 프로그램을 저장하는 것을 특징으로 하는 컴퓨터 독해 가능한 기억 매체.
KR1019970032528A 1996-09-03 1997-07-14 컴퓨터 시스템 및 화일 관리 방법 KR19980024086A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP96-233021 1996-09-03
JP23302196 1996-09-03

Publications (1)

Publication Number Publication Date
KR19980024086A true KR19980024086A (ko) 1998-07-06

Family

ID=16948571

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970032528A KR19980024086A (ko) 1996-09-03 1997-07-14 컴퓨터 시스템 및 화일 관리 방법

Country Status (5)

Country Link
US (1) US5907673A (ko)
EP (1) EP0827079B1 (ko)
KR (1) KR19980024086A (ko)
CN (1) CN1147788C (ko)
DE (1) DE69712689T2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7191360B2 (en) 2002-11-26 2007-03-13 Samsung Electronics Co., Ltd. Method of data backup and recovery

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185702B1 (en) * 1997-01-24 2001-02-06 Kabushiki Kaisha Toshiba Method and system for process state management using checkpoints
SE510050C2 (sv) * 1997-07-21 1999-04-12 Ericsson Telefon Ab L M Metod för insamlande av logginformation vid förändring av databas
US6182080B1 (en) * 1997-09-12 2001-01-30 Netvoyage Corporation System, method and computer program product for storage of a plurality of documents within a single file
JPH11134235A (ja) * 1997-10-31 1999-05-21 Hitachi Ltd 外部記憶装置故障時の回復支援方法
US7200623B2 (en) * 1998-11-24 2007-04-03 Oracle International Corp. Methods to perform disk writes in a distributed shared disk system needing consistency across failures
US6185695B1 (en) * 1998-04-09 2001-02-06 Sun Microsystems, Inc. Method and apparatus for transparent server failover for highly available objects
US6879571B1 (en) 1998-05-13 2005-04-12 Hitachi, Ltd. Code division multiple access mobile communication system
JP2000010810A (ja) 1998-06-22 2000-01-14 Toshiba Corp トランザクション処理のコミット制御方法および同方法が適用される計算機システム
US6266781B1 (en) * 1998-07-20 2001-07-24 Academia Sinica Method and apparatus for providing failure detection and recovery with predetermined replication style for distributed applications in a network
US6401216B1 (en) 1998-10-29 2002-06-04 International Business Machines Corporation System of performing checkpoint/restart of a parallel program
US6332199B1 (en) * 1998-10-29 2001-12-18 International Business Machines Corporation Restoring checkpointed processes including adjusting environment variables of the processes
US6393583B1 (en) 1998-10-29 2002-05-21 International Business Machines Corporation Method of performing checkpoint/restart of a parallel program
US6338147B1 (en) * 1998-10-29 2002-01-08 International Business Machines Corporation Program products for performing checkpoint/restart of a parallel program
US6256751B1 (en) * 1998-10-29 2001-07-03 International Business Machines Corporation Restoring checkpointed processes without restoring attributes of external data referenced by the processes
US6427213B1 (en) * 1998-11-16 2002-07-30 Lucent Technologies Inc. Apparatus, method and system for file synchronization for a fault tolerate network
US6477544B1 (en) 1999-07-16 2002-11-05 Microsoft Corporation Single instance store for file systems
US6834386B1 (en) * 1999-07-16 2004-12-21 Microsoft Corporation Method and system for regulating background tasks using performance measurements
US6513051B1 (en) 1999-07-16 2003-01-28 Microsoft Corporation Method and system for backing up and restoring files stored in a single instance store
US6389433B1 (en) * 1999-07-16 2002-05-14 Microsoft Corporation Method and system for automatically merging files into a single instance store
US6338126B1 (en) 1999-12-06 2002-01-08 Legato Systems, Inc. Crash recovery without complete remirror
JP4115060B2 (ja) * 2000-02-02 2008-07-09 株式会社日立製作所 情報処理システムのデータ復旧方法及びディスクサブシステム
US6850959B1 (en) 2000-10-26 2005-02-01 Microsoft Corporation Method and system for transparently extending non-volatile storage
US6874138B1 (en) * 2000-11-28 2005-03-29 Hewlett-Packard Development Company, L.P. Method and apparatus for resuming execution of a failed computer program
US7047420B2 (en) * 2001-01-17 2006-05-16 Microsoft Corporation Exclusive encryption
US7089564B2 (en) * 2001-02-22 2006-08-08 International Business Machines Corporation High-performance memory queue
US6728735B1 (en) * 2001-03-12 2004-04-27 Network Appliance, Inc. Restartable dump that produces a consistent filesystem on tapes
US7043637B2 (en) * 2001-03-21 2006-05-09 Microsoft Corporation On-disk file format for a serverless distributed file system
US7478243B2 (en) * 2001-03-21 2009-01-13 Microsoft Corporation On-disk file format for serverless distributed file system with signed manifest of file modifications
US6981138B2 (en) * 2001-03-26 2005-12-27 Microsoft Corporation Encrypted key cache
US7062490B2 (en) * 2001-03-26 2006-06-13 Microsoft Corporation Serverless distributed file system
US20020147739A1 (en) * 2001-04-10 2002-10-10 Netvoyage Corporation Methods and systems for tracking storage resources associated with a document distribution system
US7310644B2 (en) * 2001-06-06 2007-12-18 Microsoft Corporation Locating potentially identical objects across multiple computers
US6988124B2 (en) * 2001-06-06 2006-01-17 Microsoft Corporation Locating potentially identical objects across multiple computers based on stochastic partitioning of workload
US7068604B2 (en) * 2001-08-23 2006-06-27 International Business Machines Corporation Managing memory resident queues to control resources of the systems using the queues
US6901533B2 (en) * 2001-08-23 2005-05-31 International Business Machines Corporation Reconstructing memory residents queues of an inactive processor
KR100441712B1 (ko) * 2001-12-29 2004-07-27 엘지전자 주식회사 확장 가능형 다중 처리 시스템 및 그의 메모리 복제 방법
US7020665B2 (en) * 2002-03-07 2006-03-28 Microsoft Corporation File availability in distributed file storage systems
JP2004046658A (ja) 2002-07-15 2004-02-12 Hitachi Ltd データ転送方法
NZ539138A (en) * 2002-09-23 2006-09-29 Neos Financial Systems Ltd Transaction processing system
EP1484680A1 (en) * 2003-06-02 2004-12-08 Hewlett-Packard Development Company, L.P. Method to perform a non-disruptive backup and data processing system therefor
JP4415610B2 (ja) 2003-08-26 2010-02-17 株式会社日立製作所 系切替方法、レプリカ作成方法、及びディスク装置
US7290166B2 (en) * 2004-07-28 2007-10-30 Intel Corporation Rollback of data
US7761732B2 (en) 2005-12-07 2010-07-20 International Business Machines Corporation Data protection in storage systems
US8589341B2 (en) * 2006-12-04 2013-11-19 Sandisk Il Ltd. Incremental transparent file updating
DE102006057977A1 (de) * 2006-12-08 2008-06-12 Siemens Ag Verfahren und Vorrichtung zum Aktualisieren einer Datenbank und Computerprogrammprodukt
US8436735B2 (en) 2007-02-12 2013-05-07 Radio Systems Corporation System for detecting information regarding an animal and communicating the information to a remote location
US8484637B2 (en) * 2007-04-03 2013-07-09 Microsoft Corporation Parallel installation
US8458403B2 (en) * 2009-11-24 2013-06-04 Honeywell International Inc. Architecture and method for cache-based checkpointing and rollback
US8108721B2 (en) * 2009-11-24 2012-01-31 Honeywell International Inc. Architecture and method for hardware-assisted processor checkpointing and rollback
US9626187B2 (en) 2010-05-27 2017-04-18 International Business Machines Corporation Transactional memory system supporting unbroken suspended execution
US8424015B2 (en) * 2010-09-30 2013-04-16 International Business Machines Corporation Transactional memory preemption mechanism
US8713362B2 (en) 2010-12-01 2014-04-29 International Business Machines Corporation Obviation of recovery of data store consistency for application I/O errors
US8694821B2 (en) 2010-12-03 2014-04-08 International Business Machines Corporation Generation of standby images of applications
JP5759203B2 (ja) * 2011-02-25 2015-08-05 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 反復法の並列コンピュータ計算における非同期なチェックポイント取得とそこからの回復
US9858151B1 (en) 2016-10-03 2018-01-02 International Business Machines Corporation Replaying processing of a restarted application
CN111737056A (zh) * 2020-06-24 2020-10-02 中国银行股份有限公司 文件断点重入方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69021712T2 (de) * 1990-02-08 1996-04-18 Ibm Wiederanlaufkennzeichnungsmechanismus für fehlertolerierende Systeme.
JPH04139544A (ja) * 1990-10-01 1992-05-13 Fujitsu Ltd データ復元方法
DE4217830C2 (de) * 1992-05-29 1996-01-18 Francotyp Postalia Gmbh Verfahren zum Betreiben einer Datenverarbeitungsanlage
US5794252A (en) * 1995-01-24 1998-08-11 Tandem Computers, Inc. Remote duplicate database facility featuring safe master audit trail (safeMAT) checkpointing
US5621885A (en) * 1995-06-07 1997-04-15 Tandem Computers, Incorporated System and method for providing a fault tolerant computer program runtime support environment
US5737514A (en) * 1995-11-29 1998-04-07 Texas Micro, Inc. Remote checkpoint memory system and protocol for fault-tolerant computer system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7191360B2 (en) 2002-11-26 2007-03-13 Samsung Electronics Co., Ltd. Method of data backup and recovery
KR100936390B1 (ko) * 2002-11-26 2010-01-14 삼성전자주식회사 데이터 백업 및 복원 방법

Also Published As

Publication number Publication date
DE69712689T2 (de) 2003-04-03
CN1175739A (zh) 1998-03-11
US5907673A (en) 1999-05-25
EP0827079A1 (en) 1998-03-04
CN1147788C (zh) 2004-04-28
EP0827079B1 (en) 2002-05-22
DE69712689D1 (de) 2002-06-27

Similar Documents

Publication Publication Date Title
KR19980024086A (ko) 컴퓨터 시스템 및 화일 관리 방법
US7225307B2 (en) Apparatus, system, and method for synchronizing an asynchronous mirror volume using a synchronous mirror volume
US7577788B2 (en) Disk array apparatus and disk array apparatus control method
JP3197382B2 (ja) データの増分タイム・ゼロ・バックアップ・コピーの方法及びシステム
JP2559995B2 (ja) データベースのバックアップ方法、復元方法及びデータ記憶システム
US7865678B2 (en) Remote copy system maintaining consistency
US7539703B2 (en) Setup method for disaster recovery system
US6877109B2 (en) Method for the acceleration and simplification of file system logging techniques using storage device snapshots
USRE37364E1 (en) Method and system for sidefile status polling in a time zero backup copy process
US20050283504A1 (en) Disaster recovery system suitable for database system
JPH0823841B2 (ja) データ処理システム及びその方法
JPH07239799A (ja) 遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム
JP2004303025A (ja) 情報処理方法及びその実施システム並びにその処理プログラム並びにディザスタリカバリ方法およびシステム並びにその処理を実施する記憶装置およびその制御処理方法
JP2003223287A (ja) 記憶装置、この記憶装置のバックアップ方法及びプログラム
JP2005135405A (ja) リモートミラーキャッシュ内の論理オブジェクトの完全性を保つシステム
CA2071346A1 (en) Method and means for time zero backup copy of data
US20090248760A1 (en) Backup method of computer system
KR100290057B1 (ko) 파일 시스템 및 파일 관리 방법
JP4095139B2 (ja) コンピュータシステムおよびファイル管理方法
JPH1185594A (ja) リモートコピー用情報処理システム
JP3602001B2 (ja) ディスク装置のデータファイル二重化制御システム
JP2526726B2 (ja) 多重化ファイル復旧方式
CN114253765A (zh) 一种数据恢复方法以及相关设备
JPH09212400A (ja) 耐故障性を備えたファイルシステム
JPH01125631A (ja) システムの障害回復方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20010726

Effective date: 20021031