WO2007116467A1 - Volume managing device and volume managing method - Google Patents

Volume managing device and volume managing method Download PDF

Info

Publication number
WO2007116467A1
WO2007116467A1 PCT/JP2006/306834 JP2006306834W WO2007116467A1 WO 2007116467 A1 WO2007116467 A1 WO 2007116467A1 JP 2006306834 W JP2006306834 W JP 2006306834W WO 2007116467 A1 WO2007116467 A1 WO 2007116467A1
Authority
WO
WIPO (PCT)
Prior art keywords
slice
remote copy
data
detected
abnormality
Prior art date
Application number
PCT/JP2006/306834
Other languages
French (fr)
Japanese (ja)
Inventor
Himiko Kaneko
Toshihide Yanagawa
Naoto Suzuki
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to JP2008509618A priority Critical patent/JP4757300B2/en
Priority to PCT/JP2006/306834 priority patent/WO2007116467A1/en
Publication of WO2007116467A1 publication Critical patent/WO2007116467A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2064Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring while ensuring consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency

Definitions

  • the present invention relates to a volume management apparatus and volume management method for managing a duplicated volume that includes two slices and the same data is asynchronously copied to each slice.
  • the operation system data is remotely copied.
  • the present invention relates to a volume management device and a volume management method capable of guaranteeing data consistency even when a plurality of disk array devices are provided in a backup system.
  • Patent Document 1 Japanese Patent Application Laid-Open No. 2003-99306
  • the data stored in the disk array device in the system is generally mirrored.
  • a remote backup system is used.
  • the same mirroring as the operation system is performed, and the It is conceivable to guarantee the same capacity as the operation system in the backup system.
  • data stored in a plurality of disk array devices provided in the operation system are remotely copied to the disk array devices provided in the backup system.
  • the present invention has been made in view of the strong points, and guarantees data consistency even when a plurality of disk array devices are provided in a backup system in which operation system data is remotely copied.
  • An object of the present invention is to provide a volume management apparatus and a volume management method that can be used.
  • the present invention provides a volume management device for managing a duplex volume that includes two slices and asynchronously copies the same data to each slice. And detecting means for detecting cancellation, and determining means for determining a state indicating whether or not data reading of each slice is possible according to the start or stop of the remote copy detected by the detecting means.
  • the determination unit fixes one slice to a data readable state after the start of remote copy is detected by the detection unit, and sets the other slice to the other slice. It is characterized by being fixed in a state where data cannot be read out.
  • the determination unit includes an abnormality detection unit that detects that a remote copy abnormality has occurred in each slice, and the abnormality is detected by the abnormality detection unit. In such a case, the slice in which an abnormality is detected is fixed to a state in which data cannot be read.
  • the present invention is characterized in that, in the above-mentioned invention, the determination unit determines that two slices are in a readable state after the detection unit detects the stop of the remote copy.
  • the determination unit includes an abnormality detection unit that detects that a remote copy abnormality has occurred in each slice, and the abnormality is detected by the abnormality detection unit.
  • the slice in which an abnormality is detected is determined to be in a state in which data cannot be read out.
  • the present invention is characterized in that, in the above-mentioned invention, copy control means for copying data of one slice to the other slice is further provided.
  • the present invention is characterized in that, in the above-mentioned invention, the copy control means copies data of a slice whose abnormality is not detected by the abnormality detection means to a slice whose abnormality is detected by the abnormality detection means. To do.
  • the abnormality detection unit detects that remote copying to two slices has ended abnormally at the same time, and the copy control unit performs remote copy using the abnormality detection unit.
  • the data of one of the slices is copied to one of the other slices.
  • the present invention is a volume management method for managing a duplex volume that includes two slices and the same data is asynchronously copied to each slice, and detects the start or stop of remote copy. And a determination step of determining a state indicating whether or not data reading of each slice is possible in response to the start or stop of the remote copy detected in the detection step.
  • the determination step after the start of the remote copy is detected in the detection step, one slice is fixed in a data readable state, and the other slice is It is characterized by being fixed in a state where data cannot be read out.
  • the determination step includes an abnormality detection step of detecting that a remote copy abnormality has occurred in each slice, and the abnormality is detected in the abnormality detection step. When detected, the slice in which the abnormality is detected is fixed to a state in which data cannot be read.
  • the present invention is characterized in that, in the above-mentioned invention, the determination step determines that two slices are in a readable state after the detection step detects the stop of the remote copy.
  • the determination step includes an abnormality detection step of detecting that a remote copy abnormality has occurred in each slice, and the abnormality is detected in the abnormality detection step. If detected, the slice in which an abnormality is detected is determined to be in a state in which data cannot be read.
  • the present invention is characterized in that in the above-mentioned invention, it further includes a copy control step of copying the data of one slice to the other slice.
  • the copy control step copies data of a slice in which no abnormality is detected in the abnormality detection step to a slice in which an abnormality is detected in the abnormality detection step.
  • the abnormality detection step detects that remote copying to two slices has ended abnormally at the same time, and the copy control step performs remote control in the abnormality detection step.
  • the copy control step performs remote control in the abnormality detection step.
  • the start or stop of remote copy is detected, and in order to determine the state indicating whether or not data reading of each slice is possible according to the start or stop of the detected remote copy,
  • the slice from which data is read can be selected according to the situation, and even when multiple disk array devices are provided in the backup system where the data of the operating system is remotely copied, data consistency is guaranteed. Togashi.
  • one slice is deleted.
  • the force data is read from only one slice, and the remote copy between slices is not possible. Even if there is a difference in progress, data consistency can be guaranteed.
  • the two slices are determined to be readable, so that if the two slices after the stop of the remote copy are equivalent, For example, it is possible to read data even with a slicing force with a small seek distance, and the time for the reading process can be shortened.
  • data of a slice in which no abnormality is detected is copied to a slice in which an abnormality has been detected. can do.
  • FIG. 1 is a block diagram showing an outline of the entire system according to Embodiment 1.
  • FIG. 2 is a block diagram showing a main configuration of the server device and the disk array device according to the first embodiment.
  • FIG. 3 is a sequence diagram showing a copy volume information registration operation according to the first embodiment.
  • FIG. 4 is a sequence diagram showing a remote copy start operation according to the first embodiment.
  • FIG. 5 is a block diagram showing the main configuration of the server device and the disk array device according to the second embodiment.
  • FIG. 6 is a sequence diagram showing a remote copy cancel operation according to the second embodiment.
  • FIG. 1 is a block diagram showing an outline of the entire system according to Embodiment 1 of the present invention.
  • the active cluster system operation system
  • a standby cluster system backup system
  • an operation management server 100 is provided to manage the operation of these cluster systems.
  • the user switches, for example, between the active system and the standby system.
  • the operation management server 100 includes a remote copy management unit 110 and a remote copy management database (hereinafter abbreviated as “remote copy management DB”) 120.
  • remote copy management DB a remote copy management database
  • the remote copy management unit 110 manages the remote copy of data from the operation system to the backup system, and controls the start and stop of remote copy, and the remote copy source disk array device and the remote copy destination.
  • the remote copy management DB 120 stores information related to other disk array devices. Specifically, when starting or canceling remote copy, the remote copy management unit 110 instructs the operation system to start or stop remote copy, and at the same time, starts or stops remote copy. Send a slice status change request to the backup system to change the status of the slices that make up the volume. Slices are provided in individual disk array devices and store the data itself. Each slice is in an active state where data can be read or an invalid state where data reading is prohibited. It is set. The volume of each cluster system is composed of a set of slices in each disk array device.
  • the remote copy management DB 120 stores information (hereinafter, "copy volume information" t,) about the remote copy source disk array device (slice) and the remote copy destination disk array device (slice).
  • copy volume information information about the remote copy source disk array device (slice) and the remote copy destination disk array device (slice).
  • the operation system includes an active server device 200-1, a standby server device 200-2, a disk array device 300-1, and a disk array device 300-2.
  • the backup system includes an active server device 200-3, a standby server device 200-4, a disk array device 300-3, and a disk array device 300-4.
  • the server apparatus 200-1 when the server apparatus 200-1 is stopped due to maintenance inspection or failure, the server apparatus 200-2 becomes the active system and operates in the same manner as the server apparatus 200-1.
  • the knock-up system when the entire operation system is stopped due to maintenance inspection or failure, the knock-up system becomes the active system and operates in the same way as the operation system. Accordingly, the server devices 200-1 to 200-4 and the disk array devices 300-1 to 300-4 have the same functions, although there is a difference between the active system and the standby system.
  • FIG. 2 is a block diagram showing a main configuration of the active server device 200-3 and the disk array device 300-3 of the backup system according to the present embodiment.
  • the server apparatus 200-3 is also connected to the disk array apparatus 300-4.
  • a server apparatus 200-3 illustrated in FIG. 2 includes an agent execution unit 201, a remote copy start detection unit 202, an abnormality detection unit 203, and a slice state determination unit 204.
  • the remote copy start detection unit 202, the abnormality detection unit 203, and the slice state determination unit 204 constitute a volume management unit that manages the volumes of the disk array device 300-3 and the disk array device 300-4. ing.
  • volume management DB volume management database
  • data storage unit 302 data storage unit
  • remote copy control unit 303 remote copy control unit
  • the disk array device 300-4 (not shown) has the same configuration as the disk array device 300-3.
  • the agent execution unit 201 executes an agent program while the server apparatus 200-3 is in the active system, and controls the operation of the server apparatus 200-3. Specifically, when a slice status change request is received from the remote copy management unit 110 of the operation management server 100, the agent execution unit 201 receives a request from the backup system volume according to the start or stop of remote copy. It grasps that the slice status needs to be changed, and notifies the remote copy start detection unit 202 to that effect.
  • the remote copy start detection unit 202 Based on the notification from the agent execution unit 201, the remote copy start detection unit 202 detects that the remote copy to the operation system capability backup system is started. The Specifically, the remote copy start detection unit 202 detects the start of remote copy from the slice status change notification by the agent execution unit 201, and determines the slice state according to the start of the remote copy. Instructs the state determination unit 204.
  • the abnormality detection unit 203 receives a signal indicating whether or not the remote copy is normally performed from the disk array devices 300-3 and 300-4, and if an abnormality occurs in the remote copy, the abnormality is detected. Detect the occurrence. Specifically, the abnormality detection unit 203 is a remote copy established between, for example, the disk array device 300-1, 300-2 of the operation system and the disk array device 300-3, 300-4 of the backup system. Detects that remote copy is not normally performed for any of the disk array devices 300-3 and 300-4 due to a problem such as a problem with the communication line. Then, when an abnormality has occurred in the remote copy, the abnormality detection unit 203 notifies the slice state determination unit 204 of the disk array device that has not been normally remote copied.
  • any one of the disk array devices 300-3 and 300-4 is selected. Only the slice corresponding to one of the disk array devices is set to an active state where data can be read, and the slice corresponding to one of the other disk array devices is determined to be set to an invalid state where data reading is prohibited. .
  • the slice state determination unit 204 is notified by the abnormality detection unit 203 that an error has occurred in the remote copy in any of the disk array devices, the disk array device in which the remote copy is normally performed The slice corresponding to the disk array is set to the active state, and the slice corresponding to the disk array device in which the remote copy error has occurred is set to the invalid state.
  • the slice state determination unit 204 notifies the disk array devices 300-3 and 300-4 of the determined slice state.
  • the volume management DB 301 of the disk array device 300-3 stores the volume slice status in the backup system.
  • the volume management DB 301 stores whether each of the data storage unit 302 of the disk array device 300-3 and the data storage unit of the disk array device 300-4 is in a force-in-nodled state, which is an active state. To do.
  • the volume management DB 301 is used for the disk array device 300-3. If the data storage unit 302 is in an invalid state, reading of data from the data storage unit 302 is prohibited. Similarly, the volume management DB of the disk array device 300-4 prohibits reading of data from the data storage unit if the data storage unit power invalid state of the disk array device 300-4 is in effect.
  • the data storage unit 302 corresponds to a slice corresponding to the disk array device 300-3, and receives remote copy data remotely copied from the data storage unit (slice) of the disk array device 300-1 of the operation system.
  • the data storage unit 302 and the data storage unit of the disk array device 300-4 correspond to the volume of the backup system.
  • the remote copy control unit 303 is connected to the remote copy control unit of the disk array device 300-1 that is the remote copy source, and receives the remote copy data transmitted from the disk array device 300-1. Write to the data storage unit 302.
  • the remote copy control unit 303 is capable of performing normal remote copy from the disk array device 300-1 to the disk array device 300-3 through communication with the remote copy control unit of the disk array device 300-1. If a remote copy error occurs, a signal indicating that an error has occurred is sent to the error detection unit 203 of the server device 200-3.
  • FIG. 3 is a sequence diagram showing a copy volume information registration operation before the start of remote copy according to the present embodiment. That is, FIG. 3 shows an operation for registering information regarding the volume configuration of the remote copy source and the remote copy destination prior to the start of remote copy.
  • the remote copy management unit 110 of the operation management server 100 uses the remote copy source active server device 200-1 and the remote copy source volume and the remote copy destination active server device 200-3 and the remote copy destination.
  • the information with the volume of is acquired (step S101).
  • the remote copy management unit 110 inquires the volume configuration DB of the disk array devices 300-1, 300-2 via the server device 200-1 (step S102). ).
  • the volume management DB of the disk array device 300-1, 300-2 configures the remote copy source volume from the slicer corresponding to the disk array device 300-1, 300-2. And information such as the size of each slice is returned (step S103).
  • Step S104 the volume management DB 301 of the disk array device 300-3, 300-4, from the volume management DB 301, the volume of the remote copy destination corresponds to the disk array device 300-3, 300-4.
  • Information indicating that the slice is configured is returned, and information such as the size of each slice is returned (step S 105).
  • the remote copy management unit 110 grasps the volume configuration of the remote copy source and the remote copy destination, and the remote copy source slice and the remote copy destination slice are combined in the remote copy destination.
  • the server device 200-3 is inquired whether or not copying is possible (step S106). Then, the server device 200-3 can perform remote copy from the disk array device 300-1 or the disk array device 300-2 to the remote copy control unit 303 of the disk array device 300-3, 300-4. Is inquired (step S107).
  • the remote copy control unit 303 of the disk array device 300-3 gives a response that the remote copy from the disk array device 300-1 is possible, and the remote copy control of the disk array device 300-4 is performed. It is assumed that there is a response indicating that remote copying from the disk array device 300-2 is possible (step S108).
  • the server device 200-3 transmits the response from each of the disk array devices 300-3, 300-4 to the remote copy management unit 110 of the operation management server 100 (step S109).
  • the remote copy management unit 110 performs remote control for each slice combination. If the server device 200-3 returns a response indicating that remote copy is not possible (step S 1 ⁇ ), it is determined to the user that the first copy is possible (step S 110). An error is notified. On the other hand, if a response indicating that remote copy is possible is returned (step Sl lOYes), the copy volume information such as the size of each slice is registered in the remote copy management DB 120. (Step S111).
  • FIG. 4 is a sequence diagram showing a remote copy start operation according to the present embodiment.
  • Step S201 when the operation management server 100 is operated by the user, a remote copy start command is input. Then, the copy volume information stored in the remote copy management DB 120 is acquired by the remote copy management unit 110 of the operation management server 100 (step S201).
  • the backup system server device 200-3 is inquired about which slice combination is to be used for remote copy among the combinations of slices that can be remote copied ( Step S202). In response to this inquiry, the server apparatus 20 0-3 returns a combination of the remote copy source and remote copy destination slices in consideration of the volume configuration in the operation system and the backup system (step S 203).
  • the slicing force corresponding to the disk array device 300-1 is also remotely copied to the slice corresponding to the disk array device 300-3, and the slice from the slice corresponding to the disk array device 300-2 is changed to the disk. It is assumed that remote copy is executed to the slice corresponding to the array device 300-4.
  • the remote copy management unit 110 instructs the server apparatus 200-1 to start remote copy in the combination of slices returned from the server apparatus 200-3 (step S204). Furthermore, the disk device 300-1 and 300-2 helicopter copy destination disk array devices 300-3 and 300-4 are notified by the server device 200-1 that has received the instruction (step S205), and the disk array device 300-1 and 300-2 days Remote copy is started to the disk array devices 300-3 and 300-4 (Step S206).
  • the remote copy is controlled by the remote copy control unit of each of the disk array devices 300-1 to 300-4.
  • the disk array device 300-3 in which data from the disk array device 300-1 is remotely copied.
  • the remote copy data received by the remote copy control unit 303 is written into the data storage unit 302.
  • the remote copy control unit at the remote copy source and the remote copy control unit at the remote copy destination are communicating with each other, and the remote copy control unit at the remote copy destination can detect a remote copy error. Yes. If an abnormality is found in the remote copy destination remote copy control unit, the fact is notified to the abnormality detection unit of the server apparatus.
  • the disk array devices 300-1 and 300-2 notify the server device 200-1 that the remote copy is started (step S207).
  • the operation management server 100 requests the server device 200-3 of the backup system that is the remote copy destination to change the slice state when the remote copy starts (step S209).
  • This slice state change request is received by the agent execution unit 201 of the server device 200-3 that becomes the active system in the knock-up system, and the slice state needs to be changed. Is notified to the remote copy start detection unit 202.
  • the remote copy start detection unit 202 detects that the remote copy has been started, and instructs the slice state determination unit 204 to determine the slice state according to the start of the remote copy.
  • the slice state determination unit 204 sets only one of the slice corresponding to the disk array device 300-3 and the slice corresponding to the disk array device 300-4 to an active state in which reading is possible, and the other is It is determined to set an invalid state in which reading is prohibited (step S210).
  • the abnormality detection unit 203 detects a remote copy abnormality in any slice by a notification from the remote copy control unit 303 or the remote copy control unit of the disk array device 300-4, The state determination unit 204 determines that the slice in which an error has occurred in the remote copy is set to the invalid state.
  • the determined slice state is notified to the volume management DB 301 of the disk array devices 300-3 and 300-4 (step S211), and the state of slices constituting the volume is registered. That is, whether or not data can be read from the data storage unit 302 of the disk array devices 300-3 and 300-4 is registered in the volume management DB 301.
  • the server device 200-3 reads out the volume capacity of the backup system during the remote copy
  • the data storage unit 302 of the disk array device 300-3 and the data of the disk array device 300-4 Data is also read from only one of the storage units. Therefore, even if the remote copy from the disk array device 300-1 to the disk array device 300-3 and the remote copy from the disk array device 300-2 to the disk array device 300-4 are not synchronized, There will be no inconsistencies.
  • data can be read from the slice corresponding to the disk array device that is normally performing remote copy, so data inconsistency does not occur.
  • the latest data can be read without any errors.
  • Embodiment 2 of the present invention is that when remote copying is canceled normally, a knock is If a failure occurs when remote copy is stopped at a timing that guarantees the equivalence of data in the disk array device of the backup system, copy to restore data equivalence in the disk array device of the knockup system This is the point to execute.
  • FIG. 5 is a block diagram showing the main configuration of the active server device 200-3 and the disk array device 300-3 of the backup system according to the present embodiment.
  • the server device 200-3 is also connected to the disk array device 300-4, but is omitted in FIG.
  • a server apparatus 200-3 illustrated in FIG. 5 includes an agent execution unit 201, a remote copy cancellation detection unit 251, an abnormality detection unit 252, a slice state determination unit 253, and a copy control unit 254.
  • the remote copy cancellation detection unit 251, the abnormality detection unit 252, the slice state determination unit 253, and the copy control unit 254 constitute a volume management unit that manages the disk array device 300-3 and the disk array device 300-4. is doing.
  • the disk array device 300-3 shown in FIG. 5 has the same configuration as the disk array device 300-3 shown in FIG.
  • the remote copy cancel detection unit 251 Based on the notification from the agent execution unit 201, the remote copy cancel detection unit 251 detects that remote copy to the operation system capability backup system is cancelled. Specifically, the remote copy cancellation detection unit 251 detects that the remote copy is canceled from the slice status change notification by the agent execution unit 201, and determines the slice status according to the remote copy cancellation. Instructs the state determination unit 253.
  • the abnormality detection unit 252 receives a signal indicating whether or not the remote copy is normally performed from the disk array devices 300-3 and 300-4, and if the remote copy ends abnormally, an abnormality occurs. Detecting that Specifically, the abnormality detection unit 252 detects that the remote copy for the disk array devices 300-3 and 300-4 has been abruptly stopped due to, for example, a damage to the entire operation system. When the remote copy ends abnormally, the abnormality detection unit 252 notifies the slice state determination unit 253 to that effect. In addition, the error detection unit 252 uses any combination of remote copy source and remote copy destination. In this case, if the remote copy has not been executed normally, the slice state determination unit 253 is notified of this.
  • the remote copy cancellation detection unit 251 instructs the slice status determination unit 253 to determine the slice status according to the remote copy cancellation, if the remote copy cancellation is normally performed, It is determined that the slices corresponding to both the disk array devices 300-3 and 300-4 are set to an active state in which data can be read.
  • “remote copy has been canceled normally” means that there is no error in data transmission / reception between the remote copy control units in the combination of the remote copy source and remote copy destination.
  • the remote copy source slice data in the combination is the same, and the data of this slice has been remotely copied to all remote copy destinations. Therefore, if the remote copy is canceled normally, the data of each slice in the backup system is equivalent, and no inconsistency occurs in the data regardless of which slice force data is read.
  • the slice status determination unit 253 If the slice status determination unit 253 is notified from the abnormality detection unit 252 that the remote copy has not been successfully canceled, the slice status determination unit 253 notifies the copy control unit 254 to that effect. Indicates that the slice corresponding to the disk array device for which remote copy was performed normally is active, and that other slice force data is copied to the slice corresponding to the disk array device for which an error occurred in remote copy Set to copy status. In addition, when the abnormal detection unit 252 detects that remote copy has ended abnormally, for example, due to a disaster in the operation system, the slice status determination unit 253 copies that the remote copy has ended abnormally. In addition to notifying the control unit 254, one slice is made active and the other slice is made copy. The slice state determination unit 253 notifies the determined slice state to the disk array devices 300-3 and 300-4.
  • the copy control unit 254 copies the slice data stored in the active slice to the copy status slice. Execute. That is, the copy control unit 254 copies, for example, slice data stored in the data storage unit of the disk array device 300-4 to the data storage unit 302 of the disk array device 300-3.
  • FIG. 6 is a sequence diagram showing a remote copy canceling operation according to the present embodiment.
  • the copy volume information stored in the remote copy management DB 120 is obtained (step S301).
  • the server apparatus 200-1 in the remote copy source operation system is instructed to cancel the remote copy (step S302).
  • the server apparatus 200-1 that has received the instruction instructs the disk array apparatus 300-1, 300-2 to stop remote copy (step S303), and the disk array apparatus 300-1, 300-2, etc. Remote copy to the disk array devices 300-3 and 300-4 is stopped (step S304).
  • the remote copy is controlled by the remote copy control unit of each of the disk array devices 300-1 to 300-4.
  • the remote copy is canceled, the same is applied to all combinations of the remote copy source and the remote copy destination.
  • Each combination of remote copy stops when data is remote copied. For this reason, if remote copy is normally executed for each combination of the remote copy source and remote copy destination, even if the remote copy of each combination is asynchronous, the disk array of the backup system will be used when remote copy is canceled.
  • the same data is remotely copied to devices 300-3 and 300-4, and the equivalence of each slice of the knock-up system is guaranteed.
  • remote copy is not executed normally in any combination of remote copy source and remote copy destination, or the remote copy source operation system is damaged, and remote copy in each combination is interrupted all at once.
  • the equivalence of each slice in the backup system is not guaranteed, and the remote copy control unit at the remote copy destination detects an error in the remote copy cancellation, and notifies the server device error detection unit to that effect.
  • the disk array devices 300-1, 300- 2 notifies the server device 200-1 of the remote copy stop (step S305), and the server device 200-1 notifies the operation management server 100 of the remote copy stop (step S306).
  • the operation management server 100 knows that the remote copy has been canceled, it requests the server device 200-3 of the backup system that is the remote copy destination to change the slice status when the remote copy is canceled (step S307).
  • This slice state change request is received by the agent execution unit 201 of the server device 200-3 that becomes the active system in the knock-up system, and the slice state needs to be changed. Is notified to the remote copy cancel detection unit 251.
  • the remote copy cancellation detection unit 251 detects that the remote copy has been canceled, and instructs the slice state determination unit 253 to determine the slice state according to the remote copy cancellation.
  • the slice state determination unit 253 determines that both the slice corresponding to the disk array device 300-3 and the slice corresponding to the disk array device 300-4 are in an readable active state when remote copy is canceled. (Step S308). In this way, when remote copy is canceled normally, both slices are in an active state that can be read after remote copy is canceled. Therefore, when data is read by the server 200-3, for example, the seek distance is Small slice force data can be read out, and the read processing time can be shortened.
  • the slice state determination unit 253 can read one of the active slices. It is determined that the other slice is being copied and is in a copy-prohibited copy state (step S308).
  • the active state is the slice where the remote copy was executed normally
  • the copy state is the force where the remote copy was executed normally and the strong slice. If remote copy is interrupted suddenly even though remote copy was successfully executed for any slice, etc., either slice becomes active and the other slice is in copy status. Is determined.
  • the determined slice state is the volume management of the disk array devices 300-3 and 300-4.
  • the DB 301 is notified (step S309), and the status of the slices constituting the volume is registered. That is, whether or not data can be read from the data storage unit 302 of the disk array devices 300-3 and 300-4 is registered in the volume management DB 301.
  • the server device 200-3 when data is read from the volume of the backup system by the server device 200-3, if the equivalence of each slice is guaranteed, the data storage unit 302 of the disk array device 300-3 or One force of data storage unit of disk array device 300-4 Data is read appropriately. On the other hand, if the remote copy ends abnormally and the equivalence of each slice is not guaranteed, only one of the data storage unit 302 of the disk array device 300-3 and the data storage unit of the disk array device 300-4 is used. The data is also read out. Therefore, even if an abnormal termination occurs when remote copy is cancelled, there will be no inconsistency in the read data.
  • the slice state determination unit 253 confirms whether or not an abnormal end of the remote copy has occurred (step S310), and if an abnormality is detected (step S310Y es), determines the slice state. This is notified from the unit 253 to the copy control unit 254.
  • the copy control unit 254 then copies the slice data stored in the active slice to the copy slice (step S311). That is, for example, when remote copy to the data storage unit 302 of the disk array device 300-3 is not normally performed and remote copy to the data storage unit of the disk array device 300-4 is normally performed The data storage unit 302 of the disk array device 300-3 is set in the copy state, and the data storage unit of the disk array device 300-4 is set in the active state. Then, the copy control unit 254 copies the slice data stored in the data storage unit of the disk array device 300-4 to the data storage unit 302 of the disk array device 300-3.
  • remote copy when remote copy is canceled, remote copy is continued until the same data is remotely copied for each combination of the remote copy source and the remote copy destination. The same data is remote copied in all combinations.
  • Remote copy stops when Also, if remote copy ends abnormally, only the slice corresponding to one disk array device is made active in the remote copy destination backup system, and the slice corresponding to the other disk array device is set to copy status. At the same time, the resynchronization copy of the data is executed to the slice in the active state. For this reason, multiple disk array devices are provided in the backup system to which the operation system data is remotely copied, and even if remote copying for these disk array devices is canceled, data consistency can be guaranteed. it can.
  • the present invention can be applied to guarantee data consistency even when a plurality of disk array devices are provided in a backup system to which data of an operation system is remotely copied.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Even in the case that a plurality of disc array devices are provided in a backup system in which operating system data are remotely copied, consistency of data is to be guaranteed. A remote copy initiation detecting unit (202) detects the initiation of a remote copy from an operating system to a backup system. When a slice state detecting unit (204) is instructed to determine a slice state in response to the initiation of the remote copy from the remote copy initiation detecting unit (202), a slice corresponding to either one of disc array devices (300-3, 300-4) is set to be an active state which is available for reading out data, while another slice corresponding to the other disc array device is set to be an invalid state which prohibits reading out data.

Description

明 細 書  Specification
ボリューム管理装置およびボリューム管理方法  Volume management apparatus and volume management method
技術分野  Technical field
[0001] 本発明は、 2つのスライスを含み各スライスへ同一データが非同期にリモートコピー される二重化ボリュームを管理するボリューム管理装置およびボリューム管理方法で あって、特に、運用システムのデータがリモートコピーされるバックアップシステムに複 数のディスクアレイ装置が設けられて ヽる場合でも、データの整合性を保証すること ができるボリューム管理装置およびボリューム管理方法に関する。  [0001] The present invention relates to a volume management apparatus and volume management method for managing a duplicated volume that includes two slices and the same data is asynchronously copied to each slice. In particular, the operation system data is remotely copied. The present invention relates to a volume management device and a volume management method capable of guaranteeing data consistency even when a plurality of disk array devices are provided in a backup system.
背景技術  Background art
[0002] 従来、例えば銀行および証券業務などの基幹業務における高信頼性が要求される システムでは、ディスクアレイ装置に保存されるデータをソフトウェアミラー機能によつ て他のディスクアレイ装置にミラーリングすることが一般的である。これにより、一方の ディスクアレイ装置が故障しても、他方のディスクアレイ装置に保存されたデータを用 V、て業務を継続することが可能となる。  [0002] Conventionally, in a system that requires high reliability in core business such as banking and securities business, data stored in a disk array device is mirrored to another disk array device by a software mirror function. Is common. As a result, even if one of the disk array devices fails, it is possible to continue operations using the data stored in the other disk array device.
[0003] また、さらに高度な信頼性が要求されるシステムでは、例えば特許文献 1に記載さ れているように、運用システム全体の被災などに備えて、遠隔地にバックアップシステ ムが用意されることがある。ノ ックアップシステムのディスクアレイ装置には、ディスク アレイ装置に備えられたリモートコピー機能によって、運用システムのディスクアレイ 装置のデータが常時コピーされる。これにより、たとえ運用システムが被災してシステ ム全体が破壊されても、データが失われることがなぐ現用系をバックアップシステム に切り替えることにより、迅速に業務を再開することができる。  [0003] In addition, in a system that requires higher reliability, for example, as described in Patent Document 1, a backup system is prepared in a remote place in preparation for damage to the entire operation system. Sometimes. The data of the disk array device of the operation system is always copied to the disk array device of the knock-up system by the remote copy function provided in the disk array device. As a result, even if the operation system is damaged and the entire system is destroyed, the operation can be resumed quickly by switching the active system that does not lose data to the backup system.
[0004] 特許文献 1 :特開 2003— 99306号公報  [0004] Patent Document 1: Japanese Patent Application Laid-Open No. 2003-99306
発明の開示  Disclosure of the invention
発明が解決しょうとする課題  Problems to be solved by the invention
[0005] ところで、上述したように、システム内のディスクアレイ装置に保存されるデータはミ ラーリングされるのが一般的であり、運用システムでミラーリングが行われている場合 は、遠隔地のバックアップシステムでも運用システムと同様のミラーリングを行い、バッ クアップシステムにも運用システムと同等の能力を保証することが考えられる。このと き、運用システムに設けられた複数のディスクアレイ装置に保存されたデータは、そ れぞれバックアップシステムに設けられたディスクアレイ装置にリモートコピーされるこ とになる。 [0005] By the way, as described above, the data stored in the disk array device in the system is generally mirrored. When mirroring is performed in the operation system, a remote backup system is used. However, the same mirroring as the operation system is performed, and the It is conceivable to guarantee the same capacity as the operation system in the backup system. At this time, data stored in a plurality of disk array devices provided in the operation system are remotely copied to the disk array devices provided in the backup system.
[0006] そして、運用システムからバックアップシステムへのリモートコピーは、通常、非同期 方式で行われるため、バックアップシステムに設けられた複数のディスクアレイ装置に 保存されているデータが常に等価であるとは限らない。このため、例えばバックアップ システムにおいて複数のディスクアレイ装置力もデータが読み出される場合、データ を読み出すディスクアレイ装置によっては、データが不連続になるなどの不整合が生 じることがある。  [0006] Since remote copy from the operation system to the backup system is normally performed in an asynchronous manner, data stored in a plurality of disk array devices provided in the backup system is not always equivalent. Absent. For this reason, for example, when data is read from a plurality of disk array devices in a backup system, inconsistencies such as discontinuity of data may occur depending on the disk array device from which data is read.
[0007] また、例えばリモートコピー用の回線トラブルなどにより、ノ ックアップシステムにお ける 、ずれかのディスクアレイ装置に正常にリモートコピーが実行されて 、な 、場合 や、リモートコピー元の運用システムの被災などによりリモートコピーが中止されてしま う場合にも、バックアップシステムにおける複数のディスクアレイ装置の等価性が保証 されず、データに不整合が生じることになる。  [0007] In addition, for example, when a remote copy is normally performed on one of the disk array devices in the knock-up system due to a line problem for remote copy, or the remote copy source operation system. Even if remote copy is canceled due to a disaster, the equivalence of multiple disk array devices in the backup system is not guaranteed, and data inconsistencies will occur.
[0008] 本発明は力かる点に鑑みてなされたものであり、運用システムのデータがリモートコ ピーされるバックアップシステムに複数のディスクアレイ装置が設けられている場合で も、データの整合性を保証することができるボリューム管理装置およびボリューム管理 方法を提供することを目的とする。 [0008] The present invention has been made in view of the strong points, and guarantees data consistency even when a plurality of disk array devices are provided in a backup system in which operation system data is remotely copied. An object of the present invention is to provide a volume management apparatus and a volume management method that can be used.
課題を解決するための手段  Means for solving the problem
[0009] 上記の課題を解決するために、本発明は、 2つのスライスを含み各スライスへ同一 データが非同期にリモートコピーされる二重化ボリュームを管理するボリューム管理 装置であって、リモートコピーの開始または中止を検知する検知手段と、前記検知手 段によって検知されたリモートコピーの開始または中止に応じて各スライスのデータ 読み出しの可不可を示す状態を決定する決定手段とを有することを特徴とする。  [0009] In order to solve the above problems, the present invention provides a volume management device for managing a duplex volume that includes two slices and asynchronously copies the same data to each slice. And detecting means for detecting cancellation, and determining means for determining a state indicating whether or not data reading of each slice is possible according to the start or stop of the remote copy detected by the detecting means.
[0010] また、本発明は、上記発明において、前記決定手段は、前記検知手段によってリモ 一トコピーの開始が検知された後、一方のスライスをデータ読み出し可の状態に固定 し、他方のスライスをデータ読み出し不可の状態に固定することを特徴とする。 [0011] また、本発明は、上記発明において、前記決定手段は、各スライスにおいてリモート コピーの異常が発生して 、ることを検知する異常検知手段を含み、前記異常検知手 段によって異常が検知された場合は、異常が検知されたスライスをデータ読み出し不 可の状態に固定することを特徴とする。 [0010] Further, in the present invention according to the above-described invention, the determination unit fixes one slice to a data readable state after the start of remote copy is detected by the detection unit, and sets the other slice to the other slice. It is characterized by being fixed in a state where data cannot be read out. [0011] Further, in the present invention according to the above invention, the determination unit includes an abnormality detection unit that detects that a remote copy abnormality has occurred in each slice, and the abnormality is detected by the abnormality detection unit. In such a case, the slice in which an abnormality is detected is fixed to a state in which data cannot be read.
[0012] また、本発明は、上記発明において、前記決定手段は、前記検知手段によってリモ 一トコピーの中止が検知された後、 2つのスライスを読み出し可の状態に決定すること を特徴とする。  [0012] Further, the present invention is characterized in that, in the above-mentioned invention, the determination unit determines that two slices are in a readable state after the detection unit detects the stop of the remote copy.
[0013] また、本発明は、上記発明において、前記決定手段は、各スライスにおいてリモート コピーの異常が発生して 、ることを検知する異常検知手段を含み、前記異常検知手 段によって異常が検知された場合は、異常が検知されたスライスをデータ読み出し不 可の状態に決定することを特徴とする。  [0013] Also, in the present invention according to the above-described invention, the determination unit includes an abnormality detection unit that detects that a remote copy abnormality has occurred in each slice, and the abnormality is detected by the abnormality detection unit. In such a case, the slice in which an abnormality is detected is determined to be in a state in which data cannot be read out.
[0014] また、本発明は、上記発明において、一方のスライスのデータを他方のスライスへコ ピーするコピー制御手段をさらに有することを特徴とする。 [0014] Further, the present invention is characterized in that, in the above-mentioned invention, copy control means for copying data of one slice to the other slice is further provided.
[0015] また、本発明は、上記発明において、前記コピー制御手段は、前記異常検知手段 によって異常が検知されないスライスのデータを前記異常検知手段によって異常が 検知されたスライスへコピーすることを特徴とする。  [0015] Further, the present invention is characterized in that, in the above-mentioned invention, the copy control means copies data of a slice whose abnormality is not detected by the abnormality detection means to a slice whose abnormality is detected by the abnormality detection means. To do.
[0016] また、本発明は、上記発明において、前記異常検知手段は、 2つのスライスへのリ モートコピーが同時に異常終了したことを検知し、前記コピー制御手段は、前記異常 検知手段によってリモートコピーが異常終了したことが検知された場合は、いずれか 一方のスライスのデータをいずれか他方のスライスへコピーすることを特徴とする。  [0016] Also, in the present invention according to the above invention, the abnormality detection unit detects that remote copying to two slices has ended abnormally at the same time, and the copy control unit performs remote copy using the abnormality detection unit. When it is detected that the process is abnormally terminated, the data of one of the slices is copied to one of the other slices.
[0017] また、本発明は、 2つのスライスを含み各スライスへ同一データが非同期にリモート コピーされる二重化ボリュームを管理するボリューム管理方法であって、リモートコピ 一の開始または中止を検知する検知工程と、前記検知工程にて検知されたリモート コピーの開始または中止に応じて各スライスのデータ読み出しの可不可を示す状態 を決定する決定工程とを有することを特徴とする。  [0017] Further, the present invention is a volume management method for managing a duplex volume that includes two slices and the same data is asynchronously copied to each slice, and detects the start or stop of remote copy. And a determination step of determining a state indicating whether or not data reading of each slice is possible in response to the start or stop of the remote copy detected in the detection step.
[0018] また、本発明は、上記発明において、前記決定工程は、前記検知工程にてリモート コピーの開始が検知された後、一方のスライスをデータ読み出し可の状態に固定し、 他方のスライスをデータ読み出し不可の状態に固定することを特徴とする。 [0019] また、本発明は、上記発明において、前記決定工程は、各スライスにおいてリモート コピーの異常が発生して 、ることを検知する異常検知工程を含み、前記異常検知ェ 程にて異常が検知された場合は、異常が検知されたスライスをデータ読み出し不可 の状態に固定することを特徴とする。 [0018] Further, according to the present invention, in the above invention, in the determination step, after the start of the remote copy is detected in the detection step, one slice is fixed in a data readable state, and the other slice is It is characterized by being fixed in a state where data cannot be read out. [0019] Also, in the present invention according to the above invention, the determination step includes an abnormality detection step of detecting that a remote copy abnormality has occurred in each slice, and the abnormality is detected in the abnormality detection step. When detected, the slice in which the abnormality is detected is fixed to a state in which data cannot be read.
[0020] また、本発明は、上記発明において、前記決定工程は、前記検知工程にてリモート コピーの中止が検知された後、 2つのスライスを読み出し可の状態に決定することを 特徴とする。  [0020] Further, the present invention is characterized in that, in the above-mentioned invention, the determination step determines that two slices are in a readable state after the detection step detects the stop of the remote copy.
[0021] また、本発明は、上記発明において、前記決定工程は、各スライスにおいてリモート コピーの異常が発生して 、ることを検知する異常検知工程を含み、前記異常検知ェ 程にて異常が検知された場合は、異常が検知されたスライスをデータ読み出し不可 の状態に決定することを特徴とする。  [0021] Also, in the present invention according to the above invention, the determination step includes an abnormality detection step of detecting that a remote copy abnormality has occurred in each slice, and the abnormality is detected in the abnormality detection step. If detected, the slice in which an abnormality is detected is determined to be in a state in which data cannot be read.
[0022] また、本発明は、上記発明にお 、て、一方のスライスのデータを他方のスライスへコ ピーするコピー制御工程をさらに有することを特徴とする。  [0022] Further, the present invention is characterized in that in the above-mentioned invention, it further includes a copy control step of copying the data of one slice to the other slice.
[0023] また、本発明は、上記発明において、前記コピー制御工程は、前記異常検知工程 にて異常が検知されないスライスのデータを前記異常検知工程にて異常が検知され たスライスへコピーすることを特徴とする。  [0023] In addition, according to the present invention, in the above invention, the copy control step copies data of a slice in which no abnormality is detected in the abnormality detection step to a slice in which an abnormality is detected in the abnormality detection step. Features.
[0024] また、本発明は、上記発明において、前記異常検知工程は、 2つのスライスへのリ モートコピーが同時に異常終了したことを検知し、前記コピー制御工程は、前記異常 検知工程にてリモートコピーが異常終了したことが検知された場合は、 、ずれか一方 のスライスのデータをいずれか他方のスライスへコピーすることを特徴とする。 発明の効果  [0024] In addition, according to the present invention, in the above invention, the abnormality detection step detects that remote copying to two slices has ended abnormally at the same time, and the copy control step performs remote control in the abnormality detection step. When it is detected that the copy has been terminated abnormally, the data of one of the slices is copied to any one of the other slices. The invention's effect
[0025] 本発明によれば、リモートコピーの開始または中止を検知し、検知されたリモートコ ピーの開始または中止に応じて各スライスのデータ読み出しの可不可を示す状態を 決定するため、リモートコピーの状況に応じてデータが読み出されるスライスを選択 することができ、運用システムのデータがリモートコピーされるバックアップシステムに 複数のディスクアレイ装置が設けられて ヽる場合でも、データの整合性を保証するこ とがでさる。  [0025] According to the present invention, the start or stop of remote copy is detected, and in order to determine the state indicating whether or not data reading of each slice is possible according to the start or stop of the detected remote copy, The slice from which data is read can be selected according to the situation, and even when multiple disk array devices are provided in the backup system where the data of the operating system is remotely copied, data consistency is guaranteed. Togashi.
[0026] また、本発明によれば、リモートコピーの開始が検知された後、一方のスライスをデ ータ読み出し可の状態に固定し、他方のスライスをデータ読み出し不可の状態に固 定するため、リモートコピー中は、一方のスライスのみ力 データが読み出されること になり、スライス間でのリモートコピーの進拔に差があってもデータの整合性を保証す ることがでさる。 [0026] Further, according to the present invention, after the start of remote copy is detected, one slice is deleted. During remote copy, the force data is read from only one slice, and the remote copy between slices is not possible. Even if there is a difference in progress, data consistency can be guaranteed.
[0027] また、本発明によれば、各スライスにおいてリモートコピーの異常が発生しているこ とを検知し、異常が検知された場合は、異常が検知されたスライスをデータ読み出し 不可の状態に固定する。このため、正常にリモートコピーされな力つたデータが読み 出し不可となり、適切にリモートコピーされた正しいデータのみを読み出すことが可能 となる。  [0027] Further, according to the present invention, it is detected that a remote copy error has occurred in each slice, and if an error is detected, the slice in which the error has been detected is placed in a state in which data cannot be read. Fix it. This makes it impossible to read powerful data that has not been successfully remote copied, and only correct data that has been properly remote copied can be read.
[0028] また、本発明によれば、リモートコピーの中止が検知された後、 2つのスライスを読 み出し可の状態に決定するため、リモートコピー中止後の 2つのスライスが等価であ れば、例えばシーク距離が小さいスライス力もデータを読み出すことが可能となり、読 み出し処理の時間短縮を図ることができる。  [0028] Further, according to the present invention, after the stop of the remote copy is detected, the two slices are determined to be readable, so that if the two slices after the stop of the remote copy are equivalent, For example, it is possible to read data even with a slicing force with a small seek distance, and the time for the reading process can be shortened.
[0029] また、本発明によれば、各スライスにお 、てリモートコピーの異常が発生して 、るこ とを検知し、異常が検知された場合は、異常が検知されたスライスをデータ読み出し 不可の状態に決定する。このため、正常にリモートコピーされな力つたデータが読み 出し不可となり、適切にリモートコピーされた正しいデータのみを読み出すことが可能 となる。  [0029] Further, according to the present invention, it is detected that a remote copy error has occurred in each slice, and if an error is detected, the slice from which the error has been detected is read out. It is determined to be impossible. This makes it impossible to read powerful data that has not been successfully remote copied, and only correct data that has been properly remote copied can be read.
[0030] また、本発明によれば、一方のスライスのデータを他方のスライスへコピーするため 、 2つのスライスが等価ではない場合にも、データのコピーにより等価性を回復するこ とがでさる。  [0030] Further, according to the present invention, since the data of one slice is copied to the other slice, even when the two slices are not equivalent, the equivalence can be recovered by copying the data. .
[0031] また、本発明によれば、異常が検知されないスライスのデータを異常が検知された スライスへコピーするため、適切にリモートコピーされた正し 、データによって 2つのス ライスの等価性を回復することができる。  [0031] Further, according to the present invention, data of a slice in which no abnormality is detected is copied to a slice in which an abnormality has been detected. can do.
[0032] また、本発明によれば、 2つのスライスへのリモートコピーが同時に異常終了したこと を検知し、リモートコピーが異常終了したことが検知された場合は、いずれか一方の スライスのデータをいずれか他方のスライスへコピーする。このため、例えばリモートコ ピー元の運用システムが被災してリモートコピーが突然中止された場合でも、非同期 にリモートコピーされていた 2つのスライスの等価性を回復することができる。 [0032] Further, according to the present invention, it is detected that remote copying to two slices has ended abnormally at the same time, and if it is detected that remote copying has ended abnormally, the data of either slice is stored. Copy to one of the other slices. For this reason, for example, even if the remote copy source operation system is damaged and remote copy is suddenly stopped, You can restore the equivalence of two slices that were remotely copied to.
図面の簡単な説明  Brief Description of Drawings
[0033] [図 1]図 1は、実施の形態 1に係る全システムの概略を示すブロック図である。 FIG. 1 is a block diagram showing an outline of the entire system according to Embodiment 1.
[図 2]図 2は、実施の形態 1に係るサーバ装置とディスクアレイ装置の要部構成を示す ブロック図である。  FIG. 2 is a block diagram showing a main configuration of the server device and the disk array device according to the first embodiment.
[図 3]図 3は、実施の形態 1に係るコピーボリューム情報登録動作を示すシーケンス図 である。  FIG. 3 is a sequence diagram showing a copy volume information registration operation according to the first embodiment.
[図 4]図 4は、実施の形態 1に係るリモートコピー開始動作を示すシーケンス図である  FIG. 4 is a sequence diagram showing a remote copy start operation according to the first embodiment.
[図 5]図 5は、実施の形態 2に係るサーバ装置とディスクアレイ装置の要部構成を示す ブロック図である。 FIG. 5 is a block diagram showing the main configuration of the server device and the disk array device according to the second embodiment.
[図 6]図 2は、実施の形態 2に係るリモートコピー中止動作を示すシーケンス図である  FIG. 6 is a sequence diagram showing a remote copy cancel operation according to the second embodiment.
符号の説明 Explanation of symbols
[0034] 201 エージェント実行部 [0034] 201 Agent execution unit
202 リモートコピー開始検知部  202 Remote copy start detector
203、 252 異常検知部  203, 252 Anomaly detector
204、 253 スライス状態決定部  204, 253 Slice state determination unit
251 リモートコピー中止検知部  251 Remote copy cancel detection section
254 コピー制御部  254 Copy control section
301 ボリューム管理 DB  301 Volume management DB
302 データ記憶部  302 Data storage
303 リモートコピー制御部  303 Remote copy controller
発明を実施するための最良の形態  BEST MODE FOR CARRYING OUT THE INVENTION
[0035] 以下、本発明の実施の形態について、図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0036] (実施の形態 1) [0036] (Embodiment 1)
図 1は、本発明の実施の形態 1に係る全システムの概略を示すブロック図である。同 図に示すように、本実施の形態においては、現用系のクラスタシステム (運用システム )と予備系のクラスタシステム (バックアップシステム)とが備えられており、これらのクラ スタシステムの運用管理のために、運用管理サーバ 100が設けられている。ユーザ は、運用管理サーバ 100を操作することによって、例えば運用系と予備系とを切り替 える。 FIG. 1 is a block diagram showing an outline of the entire system according to Embodiment 1 of the present invention. As shown in the figure, in this embodiment, the active cluster system (operation system) ) And a standby cluster system (backup system), and an operation management server 100 is provided to manage the operation of these cluster systems. By operating the operation management server 100, the user switches, for example, between the active system and the standby system.
[0037] 運用管理サーバ 100は、リモートコピー管理部 110およびリモートコピー管理デー タベース(以下「リモートコピー管理 DB」と略記する) 120を有して 、る。  The operation management server 100 includes a remote copy management unit 110 and a remote copy management database (hereinafter abbreviated as “remote copy management DB”) 120.
[0038] リモートコピー管理部 110は、運用システムからバックアップシステムへのデータのリ モートコピーを管理しており、リモートコピーの開始'中止を制御したり、リモートコピー 元のディスクアレイ装置とリモートコピー先のディスクアレイ装置とに関する情報をリモ 一トコピー管理 DB120へ記憶させたりする。具体的には、リモートコピー管理部 110 は、リモートコピーを開始または中止する場合に、リモートコピーの開始や中止を運用 システムへ指示するとともに、リモートコピーの開始や中止に伴って、ノ ックアップシス テムのボリュームを構成するスライスの状態の変更を要求するスライス状態変更要求 をバックアップシステムへ送信する。スライスは、個々のディスクアレイ装置に備えられ てデータ本体を保存しており、それぞれデータの読み出しが可能なアクティブ (Activ e)の状態やデータの読み出しが禁止されるインバリッド (Invalid)の状態などに設定さ れて 、る。各ディスクアレイ装置内のスライスの集合によって各クラスタシステムのボリ ユームが構成されている。  [0038] The remote copy management unit 110 manages the remote copy of data from the operation system to the backup system, and controls the start and stop of remote copy, and the remote copy source disk array device and the remote copy destination. The remote copy management DB 120 stores information related to other disk array devices. Specifically, when starting or canceling remote copy, the remote copy management unit 110 instructs the operation system to start or stop remote copy, and at the same time, starts or stops remote copy. Send a slice status change request to the backup system to change the status of the slices that make up the volume. Slices are provided in individual disk array devices and store the data itself. Each slice is in an active state where data can be read or an invalid state where data reading is prohibited. It is set. The volume of each cluster system is composed of a set of slices in each disk array device.
[0039] リモートコピー管理 DB120は、リモートコピー元のディスクアレイ装置(スライス)とリ モートコピー先のディスクアレイ装置 (スライス)とに関する情報(以下「コピーボリユー ム情報」 t 、う)を記憶して 、る。  [0039] The remote copy management DB 120 stores information (hereinafter, "copy volume information" t,) about the remote copy source disk array device (slice) and the remote copy destination disk array device (slice). The
[0040] 運用システムは、現用系のサーバ装置 200—1、予備系のサーバ装置 200— 2、デ イスクアレイ装置 300— 1、およびディスクアレイ装置 300— 2を有している。同様に、 バックアップシステムは、現用系のサーバ装置 200— 3、予備系のサーバ装置 200— 4、ディスクアレイ装置 300— 3、およびディスクアレイ装置 300— 4を有している。  The operation system includes an active server device 200-1, a standby server device 200-2, a disk array device 300-1, and a disk array device 300-2. Similarly, the backup system includes an active server device 200-3, a standby server device 200-4, a disk array device 300-3, and a disk array device 300-4.
[0041] 運用システムにおいて、現用系のサーバ装置 200— 1によるデータの書き込みが 行われる際には、ディスクアレイ装置 300— 1およびディスクアレイ装置 300— 2の双 方にデータが書き込まれ、ミラーリングが行われている。そして、ディスクアレイ装置 3 00— 1に保存されるデータは、ノックアップシステムのディスクアレイ装置 300— 3へ リモートコピーされ、ディスクアレイ装置 300— 2に保存されるデータは、バックアップ システムのディスクアレイ装置 300— 4ヘリモートコピーされる。 [0041] In the operation system, when data is written by the active server device 200-1, data is written to both the disk array device 300-1 and the disk array device 300-2, and mirroring is performed. Has been done. Disk array device 3 Data stored in 00-1 is remotely copied to the disk array unit 300-3 of the knockup system, and data stored in the disk array unit 300-2 is remote copied to the disk array unit 300-4 of the backup system. Is done.
[0042] そして、運用システムにおいて、保守点検や故障によりサーバ装置 200— 1が停止 した場合は、サーバ装置 200— 2が現用系となり、サーバ装置 200— 1と同様に動作 する。また、保守点検や故障により運用システム全体が停止した場合は、ノ ックアツ プシステムが現用系となり、運用システムと同様に動作する。したがって、サーバ装置 200— 1〜200— 4およびディスクアレイ装置 300— 1〜300— 4は、現用系であるか 予備系であるかの相違があるものの、それぞれ同様の機能を備えて 、る。  In the operation system, when the server apparatus 200-1 is stopped due to maintenance inspection or failure, the server apparatus 200-2 becomes the active system and operates in the same manner as the server apparatus 200-1. In addition, when the entire operation system is stopped due to maintenance inspection or failure, the knock-up system becomes the active system and operates in the same way as the operation system. Accordingly, the server devices 200-1 to 200-4 and the disk array devices 300-1 to 300-4 have the same functions, although there is a difference between the active system and the standby system.
[0043] 図 2は、本実施の形態に係るバックアップシステムの現用系のサーバ装置 200— 3 とディスクアレイ装置 300— 3の要部構成を示すブロック図である。サーバ装置 200 —3は、ディスクアレイ装置 300— 4にも接続されている力 図 2では省略している。図 2に示すサーバ装置 200— 3は、エージェント実行部 201、リモートコピー開始検知 部 202、異常検知部 203、およびスライス状態決定部 204を有している。このうち、リ モートコピー開始検知部 202、異常検知部 203、およびスライス状態決定部 204は、 ディスクアレイ装置 300— 3およびディスクアレイ装置 300— 4力 なるボリュームを管 理するボリューム管理部を構成している。また、図 2に示すディスクアレイ装置 300— 3は、ボリューム管理データベース(以下「ボリューム管理 DB」と略記する) 301、デー タ記憶部 302、およびリモートコピー制御部 303を有している。なお、図示しないディ スクアレイ装置 300— 4もディスクアレイ装置 300— 3と同様の構成を有している。  FIG. 2 is a block diagram showing a main configuration of the active server device 200-3 and the disk array device 300-3 of the backup system according to the present embodiment. The server apparatus 200-3 is also connected to the disk array apparatus 300-4. A server apparatus 200-3 illustrated in FIG. 2 includes an agent execution unit 201, a remote copy start detection unit 202, an abnormality detection unit 203, and a slice state determination unit 204. Among these, the remote copy start detection unit 202, the abnormality detection unit 203, and the slice state determination unit 204 constitute a volume management unit that manages the volumes of the disk array device 300-3 and the disk array device 300-4. ing. The disk array device 300-3 shown in FIG. 2 includes a volume management database (hereinafter abbreviated as “volume management DB”) 301, a data storage unit 302, and a remote copy control unit 303. The disk array device 300-4 (not shown) has the same configuration as the disk array device 300-3.
[0044] エージェント実行部 201は、サーバ装置 200— 3が現用系となっている間、エージ ェントプログラムを実行し、サーバ装置 200— 3の動作を制御する。具体的には、ェ ージェント実行部 201は、運用管理サーバ 100のリモートコピー管理部 110からスラ イス状態変更要求が受信されると、リモートコピーの開始や中止に伴って、バックアツ プシステムのボリュームにおけるスライスの状態を変更する必要があることを把握し、 その旨をリモートコピー開始検知部 202へ通知する。  The agent execution unit 201 executes an agent program while the server apparatus 200-3 is in the active system, and controls the operation of the server apparatus 200-3. Specifically, when a slice status change request is received from the remote copy management unit 110 of the operation management server 100, the agent execution unit 201 receives a request from the backup system volume according to the start or stop of remote copy. It grasps that the slice status needs to be changed, and notifies the remote copy start detection unit 202 to that effect.
[0045] リモートコピー開始検知部 202は、エージェント実行部 201からの通知に基づいて 、運用システム力 バックアップシステムへのリモートコピーが開始されることを検知す る。具体的には、リモートコピー開始検知部 202は、エージェント実行部 201によるス ライス状態の変更通知からリモートコピーが開始されることを検知し、リモートコピーの 開始に応じたスライス状態を決定するようスライス状態決定部 204へ指示する。 [0045] Based on the notification from the agent execution unit 201, the remote copy start detection unit 202 detects that the remote copy to the operation system capability backup system is started. The Specifically, the remote copy start detection unit 202 detects the start of remote copy from the slice status change notification by the agent execution unit 201, and determines the slice state according to the start of the remote copy. Instructs the state determination unit 204.
[0046] 異常検知部 203は、ディスクアレイ装置 300— 3、 300— 4からリモートコピーが正常 に行われているか否かを示す信号を受信し、リモートコピーに異常が発生した場合に は異常が発生していることを検知する。具体的には、異常検知部 203は、例えば運 用システムのディスクアレイ装置 300— 1、 300— 2とバックアップシステムのディスク アレイ装置 300— 3、 300— 4との間に確立されているリモートコピー用の回線にトラ ブルが発生したなどの原因により、ディスクアレイ装置 300— 3、 300— 4のいずれ力 に対するリモートコピーが正常に行われていないことを検知する。そして、異常検知 部 203は、リモートコピーに異常が発生している場合、正常にリモートコピーされてい ないディスクアレイ装置をスライス状態決定部 204へ通知する。  [0046] The abnormality detection unit 203 receives a signal indicating whether or not the remote copy is normally performed from the disk array devices 300-3 and 300-4, and if an abnormality occurs in the remote copy, the abnormality is detected. Detect the occurrence. Specifically, the abnormality detection unit 203 is a remote copy established between, for example, the disk array device 300-1, 300-2 of the operation system and the disk array device 300-3, 300-4 of the backup system. Detects that remote copy is not normally performed for any of the disk array devices 300-3 and 300-4 due to a problem such as a problem with the communication line. Then, when an abnormality has occurred in the remote copy, the abnormality detection unit 203 notifies the slice state determination unit 204 of the disk array device that has not been normally remote copied.
[0047] スライス状態決定部 204は、リモートコピー開始検知部 202からリモートコピーの開 始に応じたスライス状態を決定するように指示されると、ディスクアレイ装置 300— 3、 300— 4のうちいずれか一方のディスクアレイ装置に対応するスライスのみをデータ の読み出し可能なアクティブ状態に設定し、いずれか他方のディスクアレイ装置に対 応するスライスをデータの読み出し禁止のインバリッド状態に設定するように決定する 。このとき、スライス状態決定部 204は、異常検知部 203からいずれかのディスクァレ ィ装置におけるリモートコピーに異常が発生していると通知された場合は、リモートコ ピーが正常に行われているディスクアレイ装置に対応するスライスをアクティブ状態と し、リモートコピーに異常が発生しているディスクアレイ装置に対応するスライスをイン バリッド状態とする。スライス状態決定部 204は、決定したスライス状態をディスクァレ ィ装置 300— 3、 300— 4へ通知する。  When the slice status determination unit 204 is instructed by the remote copy start detection unit 202 to determine the slice status according to the start of the remote copy, any one of the disk array devices 300-3 and 300-4 is selected. Only the slice corresponding to one of the disk array devices is set to an active state where data can be read, and the slice corresponding to one of the other disk array devices is determined to be set to an invalid state where data reading is prohibited. . At this time, if the slice state determination unit 204 is notified by the abnormality detection unit 203 that an error has occurred in the remote copy in any of the disk array devices, the disk array device in which the remote copy is normally performed The slice corresponding to the disk array is set to the active state, and the slice corresponding to the disk array device in which the remote copy error has occurred is set to the invalid state. The slice state determination unit 204 notifies the disk array devices 300-3 and 300-4 of the determined slice state.
[0048] 一方、ディスクアレイ装置 300— 3のボリューム管理 DB301は、バックアップシステ ムにおけるボリュームのスライスの状態を記憶する。換言すれば、ボリューム管理 DB 301は、ディスクアレイ装置 300— 3のデータ記憶部 302およびディスクアレイ装置 3 00— 4のデータ記憶部それぞれの状態がアクティブ状態である力インノ リツド状態で あるかを記憶する。そして、ボリューム管理 DB301は、ディスクアレイ装置 300— 3の データ記憶部 302がインバリッド状態であれば、データ記憶部 302からのデータの読 み出しを禁止する。同様に、ディスクアレイ装置 300— 4のボリューム管理 DBは、ディ スクアレイ装置 300— 4のデータ記憶部力インバリッド状態であれば、このデータ記憶 部からのデータの読み出しを禁止する。 On the other hand, the volume management DB 301 of the disk array device 300-3 stores the volume slice status in the backup system. In other words, the volume management DB 301 stores whether each of the data storage unit 302 of the disk array device 300-3 and the data storage unit of the disk array device 300-4 is in a force-in-nodled state, which is an active state. To do. The volume management DB 301 is used for the disk array device 300-3. If the data storage unit 302 is in an invalid state, reading of data from the data storage unit 302 is prohibited. Similarly, the volume management DB of the disk array device 300-4 prohibits reading of data from the data storage unit if the data storage unit power invalid state of the disk array device 300-4 is in effect.
[0049] データ記憶部 302は、ディスクアレイ装置 300— 3に対応するスライスに相当し、運 用システムのディスクアレイ装置 300— 1のデータ記憶部 (スライス)からリモートコピ 一されるリモートコピーデータを記憶する。データ記憶部 302およびディスクアレイ装 置 300— 4のデータ記憶部がバックアップシステムのボリュームに相当する。  [0049] The data storage unit 302 corresponds to a slice corresponding to the disk array device 300-3, and receives remote copy data remotely copied from the data storage unit (slice) of the disk array device 300-1 of the operation system. Remember. The data storage unit 302 and the data storage unit of the disk array device 300-4 correspond to the volume of the backup system.
[0050] リモートコピー制御部 303は、リモートコピー元のディスクアレイ装置 300— 1のリモ 一トコピー制御部と接続されており、ディスクアレイ装置 300— 1から送信されるリモー トコピーデータを受信してデータ記憶部 302に書き込む。また、リモートコピー制御部 303は、ディスクアレイ装置 300— 1のリモートコピー制御部との通信により、ディスク アレイ装置 300— 1からディスクアレイ装置 300— 3へのリモートコピーが正常に行わ れている力否かを監視し、リモートコピーに異常が発生した場合は、異常が発生した 旨の信号をサーバ装置 200— 3の異常検知部 203へ送信する。  [0050] The remote copy control unit 303 is connected to the remote copy control unit of the disk array device 300-1 that is the remote copy source, and receives the remote copy data transmitted from the disk array device 300-1. Write to the data storage unit 302. In addition, the remote copy control unit 303 is capable of performing normal remote copy from the disk array device 300-1 to the disk array device 300-3 through communication with the remote copy control unit of the disk array device 300-1. If a remote copy error occurs, a signal indicating that an error has occurred is sent to the error detection unit 203 of the server device 200-3.
[0051] 次いで、上記のように構成された運用システムおよびバックアップシステムにおける データのリモートコピー動作について、図 3および図 4に示すシーケンス図を参照しな がら説明する。  [0051] Next, the remote copy operation of data in the operation system and the backup system configured as described above will be described with reference to the sequence diagrams shown in FIG. 3 and FIG.
[0052] 図 3は、本実施の形態に係るリモートコピー開始前のコピーボリューム情報登録動 作を示すシーケンス図である。すなわち、図 3は、リモートコピーの開始に先立って、 リモートコピー元とリモートコピー先のボリューム構成に関する情報を登録する動作を 示している。  FIG. 3 is a sequence diagram showing a copy volume information registration operation before the start of remote copy according to the present embodiment. That is, FIG. 3 shows an operation for registering information regarding the volume configuration of the remote copy source and the remote copy destination prior to the start of remote copy.
[0053] まず、ユーザによって運用管理サーバ 100が操作されることにより、リモートコピー 元の運用システムとリモートコピー先のノ ックアップシステムが指定される。すなわち、 運用管理サーバ 100のリモートコピー管理部 110によって、リモートコピー元の現用 系のサーバ装置 200— 1およびリモートコピー元のボリュームと、リモートコピー先の 現用系のサーバ装置 200— 3およびリモートコピー先のボリュームとの情報が取得さ れる (ステップ S101)。このとき、リモートコピー管理部 110においては、運用システム およびバックアップシステムにおけるボリューム構成が不明であるため、リモートコピ 一管理部 110からサーバ装置 200 - 1を介してディスクアレイ装置 300— 1、 300— 2 のボリューム管理 DBへボリューム構成が問い合わせられる(ステップ S102)。この問 い合わせに対して、ディスクアレイ装置 300— 1、 300— 2のボリューム管理 DBからは 、リモートコピー元のボリュームがディスクアレイ装置 300— 1、 300— 2に対応するス ライスカゝら構成されている旨が返信されるとともに、それぞれのスライスのサイズなど の情報が返信される (ステップ S 103)。 First, when the operation management server 100 is operated by a user, a remote copy source operation system and a remote copy destination knockup system are designated. That is, the remote copy management unit 110 of the operation management server 100 uses the remote copy source active server device 200-1 and the remote copy source volume and the remote copy destination active server device 200-3 and the remote copy destination. The information with the volume of is acquired (step S101). At this time, in the remote copy management unit 110, the operation system Since the volume configuration in the backup system is unknown, the remote copy management unit 110 inquires the volume configuration DB of the disk array devices 300-1, 300-2 via the server device 200-1 (step S102). ). In response to this inquiry, the volume management DB of the disk array device 300-1, 300-2 configures the remote copy source volume from the slicer corresponding to the disk array device 300-1, 300-2. And information such as the size of each slice is returned (step S103).
[0054] こうしてリモートコピー元のボリューム構成が判明すると、リモートコピー管理部 110 力らサーバ装置 200— 3を介してディスクアレイ装置 300— 3、 300— 4のボリューム 管理 DB301へボリューム構成が問!、合わせられる(ステップ S 104)。この問!、合わ せに対して、ディスクアレイ装置 300— 3、 300— 4のボリューム管理 DB301からは、 リモートコピー先のボリュームがディスクアレイ装置 300— 3、 300— 4に対応するスラ イスカゝら構成されている旨が返信されるとともに、それぞれのスライスのサイズなどの 情報が返信される (ステップ S 105)。  [0054] When the volume configuration of the remote copy source is found in this way, the volume configuration is asked to the volume management DB 301 of the disk array devices 300-3 and 300-4 via the server device 200-3 from the remote copy management unit 110. (Step S104). In response to this question, the volume management DB 301 of the disk array device 300-3, 300-4, from the volume management DB 301, the volume of the remote copy destination corresponds to the disk array device 300-3, 300-4. Information indicating that the slice is configured is returned, and information such as the size of each slice is returned (step S 105).
[0055] これにより、リモートコピー管理部 110によって、リモートコピー元およびリモートコピ 一先のボリューム構成が把握され、それぞれのリモートコピー元のスライスとリモートコ ピー先のスライスとの組み合わせにお 、て、リモートコピーが可能か否かがサーバ装 置 200— 3へ問い合わせられる(ステップ S 106)。そして、サーバ装置 200— 3によつ て、ディスクアレイ装置 300— 3、 300— 4のリモートコピー制御部 303にディスクァレ ィ装置 300— 1またはディスクアレイ装置 300— 2からのリモートコピーが可能である か否かが問い合わせられる(ステップ S107)。  Thereby, the remote copy management unit 110 grasps the volume configuration of the remote copy source and the remote copy destination, and the remote copy source slice and the remote copy destination slice are combined in the remote copy destination. The server device 200-3 is inquired whether or not copying is possible (step S106). Then, the server device 200-3 can perform remote copy from the disk array device 300-1 or the disk array device 300-2 to the remote copy control unit 303 of the disk array device 300-3, 300-4. Is inquired (step S107).
[0056] ここでは、例えばディスクアレイ装置 300— 3のリモートコピー制御部 303によってデ イスクアレイ装置 300— 1からのリモートコピーが可能である旨の応答があり、ディスク アレイ装置 300— 4のリモートコピー制御部によってディスクアレイ装置 300— 2から のリモートコピーが可能である旨の応答があったものとする (ステップ S108)。サーバ 装置 200— 3は、各ディスクアレイ装置 300— 3、 300— 4からの応答を運用管理サー ノ 100のリモートコピー管理部 110へ伝達する(ステップ S 109)。  Here, for example, the remote copy control unit 303 of the disk array device 300-3 gives a response that the remote copy from the disk array device 300-1 is possible, and the remote copy control of the disk array device 300-4 is performed. It is assumed that there is a response indicating that remote copying from the disk array device 300-2 is possible (step S108). The server device 200-3 transmits the response from each of the disk array devices 300-3, 300-4 to the remote copy management unit 110 of the operation management server 100 (step S109).
[0057] そして、リモートコピー管理部 110によって、各スライスの組み合わせにおいてリモ 一トコピーが可能であるか否かが判定され (ステップ S 110)、サーバ装置 200— 3か らリモートコピーが不可能である旨の応答が返ってきた場合は (ステップ S 1 ΙΟΝο)、 ユーザへエラーが通知される。一方、リモートコピーが可能である旨の応答が帰って きた場合は (ステップ Sl lOYes)、リモートコピー可能なスライスの組み合わせゃ各ス ライスのサイズなどのコピーボリューム情報がリモートコピー管理 DB120に登録され る(ステップ S 111)。 [0057] Then, the remote copy management unit 110 performs remote control for each slice combination. If the server device 200-3 returns a response indicating that remote copy is not possible (step S 1 ΙΟΝο), it is determined to the user that the first copy is possible (step S 110). An error is notified. On the other hand, if a response indicating that remote copy is possible is returned (step Sl lOYes), the copy volume information such as the size of each slice is registered in the remote copy management DB 120. (Step S111).
[0058] これにより、運用管理サーバ 100において、リモートコピーを開始するための事前準 備が完了したことになり、以降、リモートコピーが開始される。  As a result, the preparation for starting remote copy is completed in the operation management server 100, and thereafter remote copy is started.
[0059] 図 4は、本実施の形態に係るリモートコピー開始動作を示すシーケンス図である。 FIG. 4 is a sequence diagram showing a remote copy start operation according to the present embodiment.
[0060] まず、ユーザによって運用管理サーバ 100が操作されることにより、リモートコピー 開始コマンドが入力される。そして、運用管理サーバ 100のリモートコピー管理部 11 0によって、リモートコピー管理 DB120に記憶されているコピーボリューム情報が取 得される(ステップ S201)。リモートコピー管理部 110によってコピーボリューム情報 が取得されると、リモートコピーが可能なスライスの組み合わせのうち、どのスライスの 組み合わせでリモートコピーを実行するかがバックアップシステムのサーバ装置 200 ー3へ問い合わせられる(ステップ S202)。この問い合わせに対して、サーバ装置 20 0— 3からは、運用システムとバックアップシステムにおけるボリューム構成を考慮した リモートコピー元とリモートコピー先のスライスの組み合わせが返信される(ステップ S 203)。 First, when the operation management server 100 is operated by the user, a remote copy start command is input. Then, the copy volume information stored in the remote copy management DB 120 is acquired by the remote copy management unit 110 of the operation management server 100 (step S201). When the copy volume information is acquired by the remote copy management unit 110, the backup system server device 200-3 is inquired about which slice combination is to be used for remote copy among the combinations of slices that can be remote copied ( Step S202). In response to this inquiry, the server apparatus 20 0-3 returns a combination of the remote copy source and remote copy destination slices in consideration of the volume configuration in the operation system and the backup system (step S 203).
[0061] ここでは、例えばディスクアレイ装置 300— 1に対応するスライス力もディスクアレイ 装置 300— 3に対応するスライスへリモートコピーが実行されることとなり、ディスクァ レイ装置 300— 2に対応するスライスからディスクアレイ装置 300— 4に対応するスラ イスへリモートコピーが実行されることとなったものとする。  Here, for example, the slicing force corresponding to the disk array device 300-1 is also remotely copied to the slice corresponding to the disk array device 300-3, and the slice from the slice corresponding to the disk array device 300-2 is changed to the disk. It is assumed that remote copy is executed to the slice corresponding to the array device 300-4.
[0062] そして、リモートコピー管理部 110によって、サーバ装置 200— 3から返信されたス ライスの組み合わせにおけるリモートコピーの開始がサーバ装置 200— 1へ指示され る(ステップ S204)。さらに、指示を受けたサーバ装置 200—1によって、ディスクァレ ィ装置 300— 1、 300— 2ヘリモー卜コピー先のディスクアレイ装置 300— 3、 300—4 がそれぞれ通知され (ステップ S205)、ディスクアレイ装置 300—1、 300— 2のデー タがそれぞれディスクアレイ装置 300— 3、 300— 4ヘリモートコピーされ始める(ステ ップ S 206)。 [0062] Then, the remote copy management unit 110 instructs the server apparatus 200-1 to start remote copy in the combination of slices returned from the server apparatus 200-3 (step S204). Furthermore, the disk device 300-1 and 300-2 helicopter copy destination disk array devices 300-3 and 300-4 are notified by the server device 200-1 that has received the instruction (step S205), and the disk array device 300-1 and 300-2 days Remote copy is started to the disk array devices 300-3 and 300-4 (Step S206).
[0063] リモートコピーは、各ディスクアレイ装置 300— 1〜300—4のリモートコピー制御部 によって制御されており、例えばディスクアレイ装置 300— 1からのデータがリモートコ ピーされるディスクアレイ装置 300— 3においては、リモートコピー制御部 303によつ て受信されるリモートコピーデータがデータ記憶部 302に書き込まれる。このとき、リ モートコピー元のリモートコピー制御部とリモートコピー先のリモートコピー制御部とは 互いに通信しており、リモートコピー先のリモートコピー制御部では、リモートコピーの 異常を発見できるようになつている。そして、リモートコピー先のリモートコピー制御部 において異常が発見された場合は、その旨がサーバ装置の異常検知部へ通知され る。  [0063] The remote copy is controlled by the remote copy control unit of each of the disk array devices 300-1 to 300-4. For example, the disk array device 300-3 in which data from the disk array device 300-1 is remotely copied. , The remote copy data received by the remote copy control unit 303 is written into the data storage unit 302. At this time, the remote copy control unit at the remote copy source and the remote copy control unit at the remote copy destination are communicating with each other, and the remote copy control unit at the remote copy destination can detect a remote copy error. Yes. If an abnormality is found in the remote copy destination remote copy control unit, the fact is notified to the abnormality detection unit of the server apparatus.
[0064] 一方、リモートコピーが開始されると、それぞれディスクアレイ装置 300— 1、 300— 2からサーバ装置 200—1ヘリモートコピー開始の旨が通知され (ステップ S207)、さ らにサーバ装置 200— 1から運用管理サーバ 100ヘリモートコピー開始の旨が通知 される(ステップ S208)。運用管理サーバ 100は、リモートコピーが開始されたことを 把握すると、リモートコピー先となっているバックアップシステムのサーバ装置 200— 3 へ、リモートコピー開始に伴うスライス状態の変更を要求する (ステップ S209)。このス ライス状態変更要求は、ノ ックアップシステムにお 、て現用系となって!/、るサーバ装 置 200— 3のエージェント実行部 201によって受信され、スライスの状態を変更する 必要がある旨がリモートコピー開始検知部 202へ通知される。  On the other hand, when the remote copy is started, the disk array devices 300-1 and 300-2 notify the server device 200-1 that the remote copy is started (step S207). — From 1 the operation management server 100 is notified that the remote copy has started (step S208). When the operation management server 100 recognizes that the remote copy has started, it requests the server device 200-3 of the backup system that is the remote copy destination to change the slice state when the remote copy starts (step S209). . This slice state change request is received by the agent execution unit 201 of the server device 200-3 that becomes the active system in the knock-up system, and the slice state needs to be changed. Is notified to the remote copy start detection unit 202.
[0065] そして、リモートコピー開始検知部 202によって、リモートコピーが開始されたことが 検知され、リモートコピーの開始に応じたスライス状態を決定するようにスライス状態 決定部 204へ指示される。スライス状態決定部 204では、リモートコピーの開始に伴 つて、ディスクアレイ装置 300— 3に対応するスライスとディスクアレイ装置 300— 4に 対応するスライスとの一方のみを読み出し可能のアクティブ状態とし、他方を読み出 し禁止のインバリッド状態とするように決定される (ステップ S210)。  [0065] Then, the remote copy start detection unit 202 detects that the remote copy has been started, and instructs the slice state determination unit 204 to determine the slice state according to the start of the remote copy. At the start of remote copy, the slice state determination unit 204 sets only one of the slice corresponding to the disk array device 300-3 and the slice corresponding to the disk array device 300-4 to an active state in which reading is possible, and the other is It is determined to set an invalid state in which reading is prohibited (step S210).
[0066] 本実施の形態においては、ディスクアレイ装置 300— 3、 300— 4の 2つのスライス のみ力 バックアップシステムのボリュームが構成されて 、る力 3つ以上のスライスか らボリュームが構成されている場合は、このうちの 1つのスライスのみをアクティブ状態 として、残りのスライスとインノ リツド状態とするにょうに決定される。このとき、異常検 知部 203によって、リモートコピー制御部 303またはディスクアレイ装置 300— 4のリ モートコピー制御部からの通知により、いずれかのスライスにおけるリモートコピーの 異常が検知された場合は、スライス状態決定部 204によって、リモートコピーに異常 が発生しているスライスをインバリッド状態とするように決定される。 [0066] In the present embodiment, only the two slices of the disk array device 300-3 and 300-4 are used. If a volume is configured, only one of these slices will be made active, and the remaining slices and in-notified will be determined. At this time, if the abnormality detection unit 203 detects a remote copy abnormality in any slice by a notification from the remote copy control unit 303 or the remote copy control unit of the disk array device 300-4, The state determination unit 204 determines that the slice in which an error has occurred in the remote copy is set to the invalid state.
[0067] 決定されたスライス状態は、ディスクアレイ装置 300— 3、 300— 4のボリューム管理 DB301へ通知され (ステップ S211)、ボリュームを構成するスライスの状態が登録さ れる。すなわち、ディスクアレイ装置 300— 3、 300— 4のデータ記憶部 302からデー タの読み出しが可能か否かがボリューム管理 DB301に登録される。  [0067] The determined slice state is notified to the volume management DB 301 of the disk array devices 300-3 and 300-4 (step S211), and the state of slices constituting the volume is registered. That is, whether or not data can be read from the data storage unit 302 of the disk array devices 300-3 and 300-4 is registered in the volume management DB 301.
[0068] このため、例えばサーバ装置 200— 3によって、リモートコピー中にバックアップシス テムのボリューム力もデータが読み出される際、ディスクアレイ装置 300— 3のデータ 記憶部 302およびディスクアレイ装置 300— 4のデータ記憶部の常にいずれか一方 のみ力もデータが読み出される。したがって、ディスクアレイ装置 300— 1からディスク アレイ装置 300— 3へのリモートコピーとディスクアレイ装置 300— 2からディスクァレ ィ装置 300— 4へのリモートコピーとが同期していなくても、読み出されるデータに不 整合が発生することはない。また、リモートコピーに異常が発生している場合は、正常 にリモートコピーが行われているディスクアレイ装置に対応するスライスがデータ読み 出し可能となって 、るため、データの不整合が発生しな 、とともに誤りがな 、最新の データを読み出すことができる。  [0068] For this reason, for example, when the server device 200-3 reads out the volume capacity of the backup system during the remote copy, the data storage unit 302 of the disk array device 300-3 and the data of the disk array device 300-4 Data is also read from only one of the storage units. Therefore, even if the remote copy from the disk array device 300-1 to the disk array device 300-3 and the remote copy from the disk array device 300-2 to the disk array device 300-4 are not synchronized, There will be no inconsistencies. In addition, if an error has occurred in remote copy, data can be read from the slice corresponding to the disk array device that is normally performing remote copy, so data inconsistency does not occur. In addition, the latest data can be read without any errors.
[0069] 以上のように、本実施の形態によれば、リモートコピーが開始されると、リモートコピ 一先のバックアップシステムにおいては、 1つのディスクアレイ装置に対応するスライ スのみをアクティブ状態として、このスライスのみからのデータ読み出しを可能とする。 このため、データの読み出しは常に同一のディスクアレイ装置力 行われることになり 、運用システムのデータがリモートコピーされるバックアップシステムに複数のディスク アレイ装置が設けられて ヽる場合でも、データの整合性を保証することができる。  [0069] As described above, according to the present embodiment, when remote copy is started, in the remote copy destination backup system, only the slice corresponding to one disk array device is set in an active state. Data can be read from only this slice. For this reason, data reading is always performed by the same disk array device, and even when multiple disk array devices are provided in a backup system to which the operation system data is remotely copied, data consistency Can be guaranteed.
[0070] (実施の形態 2)  [Embodiment 2]
本発明の実施の形態 2の特徴は、リモートコピーを通常通り中止する場合は、ノ ック アップシステムのディスクアレイ装置におけるデータの等価性を保証するタイミングで 停止させ、リモートコピーの中止に異常が発生した場合は、ノ ックアップシステムのデ イスクアレイ装置におけるデータの等価性を回復するためのコピーを実行する点であ る。 The feature of Embodiment 2 of the present invention is that when remote copying is canceled normally, a knock is If a failure occurs when remote copy is stopped at a timing that guarantees the equivalence of data in the disk array device of the backup system, copy to restore data equivalence in the disk array device of the knockup system This is the point to execute.
[0071] 本実施の形態に係る全システムの概略は、実施の形態 1 (図 1)と同様であるため、 その説明を省略する。  [0071] Since the outline of the entire system according to the present embodiment is the same as that of Embodiment 1 (Fig. 1), description thereof is omitted.
[0072] 図 5は、本実施の形態に係るバックアップシステムの現用系のサーバ装置 200— 3 とディスクアレイ装置 300— 3の要部構成を示すブロック図である。同図において、図 2と同じ部分には同じ符号を付し、その説明を省略する。サーバ装置 200— 3は、デ イスクアレイ装置 300— 4にも接続されているが、図 5では省略している。図 5に示す サーバ装置 200— 3は、エージェント実行部 201、リモートコピー中止検知部 251、 異常検知部 252、スライス状態決定部 253、およびコピー制御部 254を有している。 このうち、リモートコピー中止検知部 251、異常検知部 252、スライス状態決定部 253 、およびコピー制御部 254は、ディスクアレイ装置 300— 3およびディスクアレイ装置 3 00— 4を管理するボリューム管理部を構成している。また、図 5に示すディスクアレイ 装置 300— 3は、図 2に示すディスクアレイ装置 300— 3と同様の構成を有して!/、る。  FIG. 5 is a block diagram showing the main configuration of the active server device 200-3 and the disk array device 300-3 of the backup system according to the present embodiment. In this figure, the same parts as those in FIG. The server device 200-3 is also connected to the disk array device 300-4, but is omitted in FIG. A server apparatus 200-3 illustrated in FIG. 5 includes an agent execution unit 201, a remote copy cancellation detection unit 251, an abnormality detection unit 252, a slice state determination unit 253, and a copy control unit 254. Among these, the remote copy cancellation detection unit 251, the abnormality detection unit 252, the slice state determination unit 253, and the copy control unit 254 constitute a volume management unit that manages the disk array device 300-3 and the disk array device 300-4. is doing. Also, the disk array device 300-3 shown in FIG. 5 has the same configuration as the disk array device 300-3 shown in FIG.
[0073] リモートコピー中止検知部 251は、エージェント実行部 201からの通知に基づいて 、運用システム力 バックアップシステムへのリモートコピーが中止されることを検知す る。具体的には、リモートコピー中止検知部 251は、エージェント実行部 201によるス ライス状態の変更通知からリモートコピーが中止されることを検知し、リモートコピーの 中止に応じたスライス状態を決定するようスライス状態決定部 253へ指示する。  [0073] Based on the notification from the agent execution unit 201, the remote copy cancel detection unit 251 detects that remote copy to the operation system capability backup system is cancelled. Specifically, the remote copy cancellation detection unit 251 detects that the remote copy is canceled from the slice status change notification by the agent execution unit 201, and determines the slice status according to the remote copy cancellation. Instructs the state determination unit 253.
[0074] 異常検知部 252は、ディスクアレイ装置 300— 3、 300— 4からリモートコピーが正常 に行われているか否かを示す信号を受信し、リモートコピーが異常終了した場合には 異常が発生したことを検知する。具体的には、異常検知部 252は、例えば運用シス テム全体が被災したなどの原因により、ディスクアレイ装置 300— 3、 300— 4に対す るリモートコピーが突然中止されたことを検知する。そして、異常検知部 252は、リモ 一トコピーが異常終了した場合、その旨をスライス状態決定部 253へ通知する。また 、異常検知部 252は、いずれかのリモートコピー元とリモートコピー先の組み合わせ において、リモートコピーが正常に実行されていなかった場合にも、その旨をスライス 状態決定部 253へ通知する。 [0074] The abnormality detection unit 252 receives a signal indicating whether or not the remote copy is normally performed from the disk array devices 300-3 and 300-4, and if the remote copy ends abnormally, an abnormality occurs. Detecting that Specifically, the abnormality detection unit 252 detects that the remote copy for the disk array devices 300-3 and 300-4 has been abruptly stopped due to, for example, a damage to the entire operation system. When the remote copy ends abnormally, the abnormality detection unit 252 notifies the slice state determination unit 253 to that effect. In addition, the error detection unit 252 uses any combination of remote copy source and remote copy destination. In this case, if the remote copy has not been executed normally, the slice state determination unit 253 is notified of this.
[0075] スライス状態決定部 253は、リモートコピー中止検知部 251からリモートコピーの中 止に応じたスライス状態を決定するように指示されると、リモートコピーの中止が正常 に行われていれば、ディスクアレイ装置 300— 3、 300— 4の双方に対応するスライス をデータの読み出し可能なアクティブ状態に設定するように決定する。このとき、 「リモ 一トコピーの中止が正常に行われている」とは、リモートコピー元とリモートコピー先の 組み合わせにおけるリモートコピー制御部間でデータの送受信に異常が発生してお らず、各組み合わせにおけるリモートコピー元のスライスのデータが同一であり、かつ 、このスライスのデータがリモートコピー先にすベてリモートコピーされた状態を示して いる。したがって、リモートコピーの中止が正常に行われれば、バックアップシステム における各スライスのデータは等価であり、いずれのスライス力 データが読み出され てもデータに不整合が生じることがない。  [0075] When the remote copy cancellation detection unit 251 instructs the slice status determination unit 253 to determine the slice status according to the remote copy cancellation, if the remote copy cancellation is normally performed, It is determined that the slices corresponding to both the disk array devices 300-3 and 300-4 are set to an active state in which data can be read. At this time, “remote copy has been canceled normally” means that there is no error in data transmission / reception between the remote copy control units in the combination of the remote copy source and remote copy destination. The remote copy source slice data in the combination is the same, and the data of this slice has been remotely copied to all remote copy destinations. Therefore, if the remote copy is canceled normally, the data of each slice in the backup system is equivalent, and no inconsistency occurs in the data regardless of which slice force data is read.
[0076] また、スライス状態決定部 253は、異常検知部 252からリモートコピーの中止が正 常に行われな力つたと通知された場合は、その旨をコピー制御部 254へ通知するとと もに、リモートコピーが正常に行われていたディスクアレイ装置に対応するスライスを アクティブ状態とし、リモートコピーに異常が発生していたディスクアレイ装置に対応 するスライスを他のスライス力 データがコピーされることを示すコピー状態とする。さ らに、例えば運用システムの被災などにより、リモートコピーが異常終了したことが異 常検知部 252によって検知された場合にも、スライス状態決定部 253は、リモートコピ 一が異常終了した旨をコピー制御部 254へ通知するとともに、一方のスライスをァク ティブ状態とし、他方のスライスをコピー状態とする。そして、スライス状態決定部 253 は、決定したスライス状態をディスクアレイ装置 300— 3、 300— 4へ通知する。  [0076] If the slice status determination unit 253 is notified from the abnormality detection unit 252 that the remote copy has not been successfully canceled, the slice status determination unit 253 notifies the copy control unit 254 to that effect. Indicates that the slice corresponding to the disk array device for which remote copy was performed normally is active, and that other slice force data is copied to the slice corresponding to the disk array device for which an error occurred in remote copy Set to copy status. In addition, when the abnormal detection unit 252 detects that remote copy has ended abnormally, for example, due to a disaster in the operation system, the slice status determination unit 253 copies that the remote copy has ended abnormally. In addition to notifying the control unit 254, one slice is made active and the other slice is made copy. The slice state determination unit 253 notifies the determined slice state to the disk array devices 300-3 and 300-4.
[0077] コピー制御部 254は、スライス状態決定部 253からリモートコピーが異常終了した旨 が通知されると、アクティブ状態のスライスに記憶されたスライスデータをコピー状態 のスライスにコピーする等価性回復コピーを実行する。すなわち、コピー制御部 254 は、例えばディスクアレイ装置 300— 4のデータ記憶部に記憶されたスライスデータを ディスクアレイ装置 300— 3のデータ記憶部 302にコピーする。 [0078] 次いで、上記のように構成された運用システムおよびバックアップシステムにおける リモートコピー中止時の動作について、図 6に示すシーケンス図を参照しながら説明 する。 [0077] When notified from the slice status determination unit 253 that the remote copy has ended abnormally, the copy control unit 254 copies the slice data stored in the active slice to the copy status slice. Execute. That is, the copy control unit 254 copies, for example, slice data stored in the data storage unit of the disk array device 300-4 to the data storage unit 302 of the disk array device 300-3. Next, operations at the time of remote copy cancellation in the operation system and the backup system configured as described above will be described with reference to the sequence diagram shown in FIG.
[0079] 図 6は、本実施の形態に係るリモートコピー中止動作を示すシーケンス図である。  FIG. 6 is a sequence diagram showing a remote copy canceling operation according to the present embodiment.
[0080] まず、ユーザによって運用管理サーバ 100が操作されることにより、リモートコピー 中止コマンドが入力される。そして、運用管理サーバ 100のリモートコピー管理部 n First, when the operation management server 100 is operated by the user, a remote copy cancel command is input. Then, the remote copy management unit n of the operation management server 100
0によって、リモートコピー管理 DB120に記憶されているコピーボリューム情報が取 得される(ステップ S301)。リモートコピー管理部 110によってコピーボリューム情報 が取得されると、リモートコピー元の運用システムにおけるサーバ装置 200—1へ、リ モートコピーの中止が指示される (ステップ S302)。さらに、指示を受けたサーバ装置 200— 1によって、ディスクアレイ装置 300— 1、 300— 2ヘリモートコピー中止がそれ ぞれ指示され (ステップ S303)、ディスクアレイ装置 300— 1、 300— 2力らディスクァ レイ装置 300— 3、 300— 4へのリモートコピーが中止される(ステップ S304)。 With 0, the copy volume information stored in the remote copy management DB 120 is obtained (step S301). When the copy volume information is acquired by the remote copy management unit 110, the server apparatus 200-1 in the remote copy source operation system is instructed to cancel the remote copy (step S302). Furthermore, the server apparatus 200-1 that has received the instruction instructs the disk array apparatus 300-1, 300-2 to stop remote copy (step S303), and the disk array apparatus 300-1, 300-2, etc. Remote copy to the disk array devices 300-3 and 300-4 is stopped (step S304).
[0081] リモートコピーは、各ディスクアレイ装置 300— 1〜300—4のリモートコピー制御部 によって制御されており、リモートコピー中止時には、リモートコピー元とリモートコピ 一先のすべての組み合わせにおいて、同一のデータがリモートコピーされたときに各 組み合わせのリモートコピーが停止される。このため、リモートコピー元とリモートコピ 一先の各組み合わせにおいてリモートコピーが正常に実行されていれば、各組み合 わせのリモートコピーが非同期であっても、リモートコピー中止時にはバックアップシ ステムのディスクアレイ装置 300— 3、 300— 4に同一のデータがリモートコピーされて おり、ノ ックアップシステムの各スライスの等価性は保証される。  [0081] The remote copy is controlled by the remote copy control unit of each of the disk array devices 300-1 to 300-4. When the remote copy is canceled, the same is applied to all combinations of the remote copy source and the remote copy destination. Each combination of remote copy stops when data is remote copied. For this reason, if remote copy is normally executed for each combination of the remote copy source and remote copy destination, even if the remote copy of each combination is asynchronous, the disk array of the backup system will be used when remote copy is canceled. The same data is remotely copied to devices 300-3 and 300-4, and the equivalence of each slice of the knock-up system is guaranteed.
[0082] ただし、いずれかのリモートコピー元とリモートコピー先の組み合わせにおいてリモ 一トコピーが正常に実行されていなかったり、リモートコピー元の運用システムが被災 して各組み合わせにおけるリモートコピーが一斉に中断されたりした場合は、バックァ ップシステムの各スライスの等価性は保証されず、リモートコピー先のリモートコピー 制御部によってリモートコピー中止の異常が発見され、その旨がサーバ装置の異常 検知部へ通知される。  [0082] However, remote copy is not executed normally in any combination of remote copy source and remote copy destination, or the remote copy source operation system is damaged, and remote copy in each combination is interrupted all at once. In such a case, the equivalence of each slice in the backup system is not guaranteed, and the remote copy control unit at the remote copy destination detects an error in the remote copy cancellation, and notifies the server device error detection unit to that effect.
[0083] 一方、リモートコピーが中止されると、それぞれディスクアレイ装置 300— 1、 300— 2からサーバ装置 200— 1ヘリモートコピー中止の旨が通知され (ステップ S305)、さ らにサーバ装置 200— 1から運用管理サーバ 100ヘリモートコピー中止の旨が通知 される(ステップ S306)。運用管理サーバ 100は、リモートコピーが中止されたことを 把握すると、リモートコピー先となっているバックアップシステムのサーバ装置 200— 3 へ、リモートコピー中止に伴うスライス状態の変更を要求する(ステップ S307)。このス ライス状態変更要求は、ノ ックアップシステムにお 、て現用系となって!/、るサーバ装 置 200— 3のエージェント実行部 201によって受信され、スライスの状態を変更する 必要がある旨がリモートコピー中止検知部 251へ通知される。 [0083] On the other hand, when the remote copy is canceled, the disk array devices 300-1, 300- 2 notifies the server device 200-1 of the remote copy stop (step S305), and the server device 200-1 notifies the operation management server 100 of the remote copy stop (step S306). When the operation management server 100 knows that the remote copy has been canceled, it requests the server device 200-3 of the backup system that is the remote copy destination to change the slice status when the remote copy is canceled (step S307). . This slice state change request is received by the agent execution unit 201 of the server device 200-3 that becomes the active system in the knock-up system, and the slice state needs to be changed. Is notified to the remote copy cancel detection unit 251.
[0084] そして、リモートコピー中止検知部 251によって、リモートコピーが中止されたことが 検知され、リモートコピーの中止に応じたスライス状態を決定するようにスライス状態 決定部 253へ指示される。スライス状態決定部 253では、リモートコピーの中止に伴 つて、ディスクアレイ装置 300— 3に対応するスライスとディスクアレイ装置 300— 4に 対応するスライスとの双方を読み出し可能のアクティブ状態とするように決定される ( ステップ S308)。このように、リモートコピーの中止が正常に行われた場合は、リモー トコピー中止後に双方のスライスが読み出し可能のアクティブ状態となるため、サー バ装置 200— 3によるデータの読み出し時には、例えばシーク距離が小さいスライス 力 データを読み出すことが可能となり、読み出し処理の時間短縮を図ることができ る。 Then, the remote copy cancellation detection unit 251 detects that the remote copy has been canceled, and instructs the slice state determination unit 253 to determine the slice state according to the remote copy cancellation. The slice state determination unit 253 determines that both the slice corresponding to the disk array device 300-3 and the slice corresponding to the disk array device 300-4 are in an readable active state when remote copy is canceled. (Step S308). In this way, when remote copy is canceled normally, both slices are in an active state that can be read after remote copy is canceled. Therefore, when data is read by the server 200-3, for example, the seek distance is Small slice force data can be read out, and the read processing time can be shortened.
[0085] これに対して、異常検知部 252からリモートコピーの中止が正常に行われな力つた 旨が通知された場合は、スライス状態決定部 253によって、一方のスライスを読み出 し可能のアクティブ状態とし、他方のスライスをコピー中であり読み出し禁止のコピー 状態とするように決定される (ステップ S308)。アクティブ状態とされるのは、リモートコ ピーが正常に実行されていたスライスであり、コピー状態とされるのは、リモートコピー が正常に実行されて 、な力つたスライスである力 例えば運用システムの被災などに より、いずれのスライスにもリモートコピーが正常に実行されていたにも拘らず突然リ モートコピーが中断した場合は、いずれか一方のスライスがアクティブ状態とされ、他 方のスライスがコピー状態と決定される。  [0085] On the other hand, when the abnormality detection unit 252 notifies that the remote copy has not been successfully canceled, the slice state determination unit 253 can read one of the active slices. It is determined that the other slice is being copied and is in a copy-prohibited copy state (step S308). The active state is the slice where the remote copy was executed normally, and the copy state is the force where the remote copy was executed normally and the strong slice. If remote copy is interrupted suddenly even though remote copy was successfully executed for any slice, etc., either slice becomes active and the other slice is in copy status. Is determined.
[0086] 決定されたスライス状態は、ディスクアレイ装置 300— 3、 300— 4のボリューム管理 DB301へ通知され (ステップ S309)、ボリュームを構成するスライスの状態が登録さ れる。すなわち、ディスクアレイ装置 300— 3、 300— 4のデータ記憶部 302からデー タの読み出しが可能か否かがボリューム管理 DB301に登録される。 [0086] The determined slice state is the volume management of the disk array devices 300-3 and 300-4. The DB 301 is notified (step S309), and the status of the slices constituting the volume is registered. That is, whether or not data can be read from the data storage unit 302 of the disk array devices 300-3 and 300-4 is registered in the volume management DB 301.
[0087] このため、例えばサーバ装置 200— 3によって、バックアップシステムのボリュームか らデータが読み出される際、各スライスの等価性が保証されていれば、ディスクアレイ 装置 300— 3のデータ記憶部 302またはディスクアレイ装置 300— 4のデータ記憶部 の一方力 適宜データが読み出される。これに対して、リモートコピーが異常終了し、 各スライスの等価性が保証されて 、なければ、ディスクアレイ装置 300— 3のデータ 記憶部 302およびディスクアレイ装置 300— 4のデータ記憶部の一方のみ力もデー タが読み出される。したがって、リモートコピー中止時に、異常終了が発生した場合で も、読み出されるデータに不整合が発生することはない。  Therefore, for example, when data is read from the volume of the backup system by the server device 200-3, if the equivalence of each slice is guaranteed, the data storage unit 302 of the disk array device 300-3 or One force of data storage unit of disk array device 300-4 Data is read appropriately. On the other hand, if the remote copy ends abnormally and the equivalence of each slice is not guaranteed, only one of the data storage unit 302 of the disk array device 300-3 and the data storage unit of the disk array device 300-4 is used. The data is also read out. Therefore, even if an abnormal termination occurs when remote copy is cancelled, there will be no inconsistency in the read data.
[0088] また、スライス状態決定部 253においては、リモートコピーの異常終了が発生したか 否かが確認されており(ステップ S310)、異常が検知された場合は (ステップ S310Y es)、スライス状態決定部 253からコピー制御部 254へその旨が通知される。そして、 コピー制御部 254によって、アクティブ状態のスライスに記憶されたスライスデータが コピー状態のスライスにコピーされる(ステップ S311)。すなわち、例えばディスクァレ ィ装置 300— 3のデータ記憶部 302へのリモートコピーが正常に行われておらず、デ イスクアレイ装置 300— 4のデータ記憶部へのリモートコピーが正常に行われていた 場合は、ディスクアレイ装置 300— 3のデータ記憶部 302がコピー状態とされ、デイス クアレイ装置 300— 4のデータ記憶部がアクティブ状態とされる。そして、コピー制御 部 254によって、ディスクアレイ装置 300— 4のデータ記憶部に記憶されたスライスデ ータがディスクアレイ装置 300— 3のデータ記憶部 302へコピーされる。  [0088] Further, the slice state determination unit 253 confirms whether or not an abnormal end of the remote copy has occurred (step S310), and if an abnormality is detected (step S310Y es), determines the slice state. This is notified from the unit 253 to the copy control unit 254. The copy control unit 254 then copies the slice data stored in the active slice to the copy slice (step S311). That is, for example, when remote copy to the data storage unit 302 of the disk array device 300-3 is not normally performed and remote copy to the data storage unit of the disk array device 300-4 is normally performed The data storage unit 302 of the disk array device 300-3 is set in the copy state, and the data storage unit of the disk array device 300-4 is set in the active state. Then, the copy control unit 254 copies the slice data stored in the data storage unit of the disk array device 300-4 to the data storage unit 302 of the disk array device 300-3.
[0089] これにより、リモートコピーが異常終了した場合でも、ノ ックアップシステムにおける スライスの等価性が回復されることになり、コピー終了後には、コピー状態とされてい たスライスがアクティブ状態とされ、すべてのスライスがデータ読み出し可能となる。  [0089] As a result, even if remote copy ends abnormally, slice equivalence in the knock-up system is restored, and after copying is complete, the slice that was in the copy state is made active, All slices can be read.
[0090] 以上のように、本実施の形態によれば、リモートコピー中止時に、リモートコピー元と リモートコピー先の各組み合わせにお 、て、同一のデータがリモートコピーされるまで はリモートコピーを継続し、すべての組み合わせで同一のデータがリモートコピーさ れたときにリモートコピーが停止する。また、リモートコピーが異常終了した場合は、リ モートコピー先のバックアップシステムにおいて、 1つのディスクアレイ装置に対応す るスライスのみをアクティブ状態とし、他のディスクアレイ装置に対応するスライスをコ ピー状態とするとともに、アクティブ状態のスライス力 コピー状態のスライスへデータ の等価性回復コピーを実行する。このため、運用システムのデータがリモートコピーさ れるバックアップシステムに複数のディスクアレイ装置が設けられており、これらのディ スクアレイ装置に対するリモートコピーが中止される場合でも、データの整合性を保 証することができる。 [0090] As described above, according to the present embodiment, when remote copy is canceled, remote copy is continued until the same data is remotely copied for each combination of the remote copy source and the remote copy destination. The same data is remote copied in all combinations. Remote copy stops when Also, if remote copy ends abnormally, only the slice corresponding to one disk array device is made active in the remote copy destination backup system, and the slice corresponding to the other disk array device is set to copy status. At the same time, the resynchronization copy of the data is executed to the slice in the active state. For this reason, multiple disk array devices are provided in the backup system to which the operation system data is remotely copied, and even if remote copying for these disk array devices is canceled, data consistency can be guaranteed. it can.
産業上の利用可能性 Industrial applicability
本発明は、運用システムのデータがリモートコピーされるバックアップシステムに複 数のディスクアレイ装置が設けられて ヽる場合でも、データの整合性を保証する際に 適用することができる。  The present invention can be applied to guarantee data consistency even when a plurality of disk array devices are provided in a backup system to which data of an operation system is remotely copied.

Claims

請求の範囲 The scope of the claims
[1] 2つのスライスを含み各スライスへ同一データが非同期にリモートコピーされる二重 化ボリュームを管理するボリューム管理装置であって、  [1] A volume management device that manages a duplicated volume that includes two slices and the same data is remotely copied to each slice asynchronously.
リモートコピーの開始または中止を検知する検知手段と、  Detection means for detecting the start or stop of remote copy;
前記検知手段によって検知されたリモートコピーの開始または中止に応じて各スラ イスのデータ読み出しの可不可を示す状態を決定する決定手段と  Determining means for determining a state indicating whether or not data reading of each slice is possible according to the start or stop of the remote copy detected by the detecting means;
を有することを特徴とするボリューム管理装置。  A volume management apparatus comprising:
[2] 前記決定手段は、 [2] The determining means includes:
前記検知手段によってリモートコピーの開始が検知された後、一方のスライスをデ ータ読み出し可の状態に固定し、他方のスライスをデータ読み出し不可の状態に固 定することを特徴とする請求項 1記載のボリューム管理装置。  2. After the start of remote copy is detected by the detecting means, one slice is fixed in a data readable state, and the other slice is fixed in a data readable state. The volume management device described.
[3] 前記決定手段は、 [3] The determining means includes:
各スライスにお 、てリモートコピーの異常が発生して 、ることを検知する異常検知手 段を含み、  Each slice includes an error detection unit that detects when a remote copy error has occurred,
前記異常検知手段によって異常が検知された場合は、異常が検知されたスライス をデータ読み出し不可の状態に固定することを特徴とする請求項 2記載のボリューム 管理装置。  3. The volume management apparatus according to claim 2, wherein when an abnormality is detected by the abnormality detection unit, the slice in which the abnormality is detected is fixed in a state where data cannot be read.
[4] 前記決定手段は、 [4] The determining means includes:
前記検知手段によってリモートコピーの中止が検知された後、 2つのスライスを読み 出し可の状態に決定することを特徴とする請求項 1記載のボリューム管理装置。  2. The volume management apparatus according to claim 1, wherein after the stop of the remote copy is detected by the detecting means, two slices are determined to be readable.
[5] 前記決定手段は、 [5] The determining means includes
各スライスにお 、てリモートコピーの異常が発生して 、ることを検知する異常検知手 段を含み、  Each slice includes an error detection unit that detects when a remote copy error has occurred,
前記異常検知手段によって異常が検知された場合は、異常が検知されたスライス をデータ読み出し不可の状態に決定することを特徴とする請求項 4記載のボリューム 管理装置。  5. The volume management apparatus according to claim 4, wherein, when an abnormality is detected by the abnormality detection unit, the slice in which the abnormality is detected is determined to be in a state in which data cannot be read.
[6] 一方のスライスのデータを他方のスライスへコピーするコピー制御手段をさらに有す ることを特徴とする請求項 5記載のボリューム管理装置。 6. The volume management apparatus according to claim 5, further comprising copy control means for copying data of one slice to the other slice.
[7] 前記コピー制御手段は、 [7] The copy control means includes:
前記異常検知手段によって異常が検知されないスライスのデータを前記異常検知 手段によって異常が検知されたスライスへコピーすることを特徴とする請求項 6記載 のボリューム管理装置。  7. The volume management apparatus according to claim 6, wherein data of a slice in which no abnormality is detected by the abnormality detection unit is copied to a slice in which an abnormality is detected by the abnormality detection unit.
[8] 前記異常検知手段は、 [8] The abnormality detection means includes:
2つのスライスへのリモートコピーが同時に異常終了したことを検知し、  Detecting that remote copy to two slices ended abnormally at the same time,
前記コピー制御手段は、  The copy control means includes
前記異常検知手段によってリモートコピーが異常終了したことが検知された場合は 、 V、ずれか一方のスライスのデータを 、ずれか他方のスライスへコピーすることを特 徴とする請求項 6記載のボリューム管理装置。  7. The volume according to claim 6, wherein when the abnormal detection unit detects that the remote copy has ended abnormally, V and data of one of the slices are copied to the other slice. Management device.
[9] 2つのスライスを含み各スライスへ同一データが非同期にリモートコピーされる二重 化ボリュームを管理するボリューム管理方法であって、 [9] A volume management method for managing a duplicated volume that includes two slices and the same data is asynchronously copied to each slice.
リモートコピーの開始または中止を検知する検知工程と、  A detection process for detecting the start or stop of remote copying;
前記検知工程にて検知されたリモートコピーの開始または中止に応じて各スライス のデータ読み出しの可不可を示す状態を決定する決定工程と  A determination step for determining a state indicating whether or not data reading of each slice is possible in response to the start or stop of the remote copy detected in the detection step;
を有することを特徴とするボリューム管理方法。  A volume management method comprising:
[10] 前記決定工程は、 [10] The determination step includes:
前記検知工程にてリモートコピーの開始が検知された後、一方のスライスをデータ 読み出し可の状態に固定し、他方のスライスをデータ読み出し不可の状態に固定す ることを特徴とする請求項 9記載のボリューム管理方法。  10. After the start of remote copy is detected in the detection step, one slice is fixed in a state where data can be read, and the other slice is fixed in a state where data cannot be read. Volume management method.
[11] 前記決定工程は、 [11] The determination step includes:
各スライスにお 、てリモートコピーの異常が発生して 、ることを検知する異常検知ェ 程を含み、  Each slice includes an error detection process that detects the occurrence of remote copy errors.
前記異常検知工程にて異常が検知された場合は、異常が検知されたスライスをデ ータ読み出し不可の状態に固定することを特徴とする請求項 10記載のボリューム管 理方法。  11. The volume management method according to claim 10, wherein when an abnormality is detected in the abnormality detection step, the slice in which the abnormality is detected is fixed to a state in which data cannot be read.
[12] 前記決定工程は、 [12] The determination step includes:
前記検知工程にてリモートコピーの中止が検知された後、 2つのスライスを読み出し 可の状態に決定することを特徴とする請求項 9記載のボリューム管理方法。 Read two slices after remote copy is detected in the detection process 10. The volume management method according to claim 9, wherein the status is determined to be acceptable.
[13] 前記決定工程は、 [13] The determination step includes:
各スライスにお 、てリモートコピーの異常が発生して 、ることを検知する異常検知ェ 程を含み、  Each slice includes an error detection process that detects the occurrence of remote copy errors.
前記異常検知工程にて異常が検知された場合は、異常が検知されたスライスをデ ータ読み出し不可の状態に決定することを特徴とする請求項 12記載のボリューム管 理方法。  13. The volume management method according to claim 12, wherein when an abnormality is detected in the abnormality detection step, the slice in which the abnormality is detected is determined to be in a state in which data cannot be read.
[14] 一方のスライスのデータを他方のスライスへコピーするコピー制御工程をさらに有す ることを特徴とする請求項 13記載のボリューム管理方法。  14. The volume management method according to claim 13, further comprising a copy control step of copying data of one slice to the other slice.
[15] 前記コピー制御工程は、 [15] The copy control step includes:
前記異常検知工程にて異常が検知されないスライスのデータを前記異常検知工程 にて異常が検知されたスライスへコピーすることを特徴とする請求項 14記載のボリュ ーム管理方法。  15. The volume management method according to claim 14, wherein data of a slice in which no abnormality is detected in the abnormality detection step is copied to a slice in which an abnormality is detected in the abnormality detection step.
[16] 前記異常検知工程は、 [16] The abnormality detection step includes:
2つのスライスへのリモートコピーが同時に異常終了したことを検知し、 前記コピー制御工程は、  Detecting that remote copy to two slices ended abnormally at the same time,
前記異常検知工程にてリモートコピーが異常終了したことが検知された場合は、い ずれか一方のスライスのデータをいずれか他方のスライスへコピーすることを特徴と する請求項 14記載のボリューム管理方法。  15. The volume management method according to claim 14, wherein, when it is detected that the remote copy has ended abnormally in the abnormality detection step, the data of one of the slices is copied to one of the other slices. .
PCT/JP2006/306834 2006-03-31 2006-03-31 Volume managing device and volume managing method WO2007116467A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008509618A JP4757300B2 (en) 2006-03-31 2006-03-31 Volume management apparatus and volume management method
PCT/JP2006/306834 WO2007116467A1 (en) 2006-03-31 2006-03-31 Volume managing device and volume managing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/306834 WO2007116467A1 (en) 2006-03-31 2006-03-31 Volume managing device and volume managing method

Publications (1)

Publication Number Publication Date
WO2007116467A1 true WO2007116467A1 (en) 2007-10-18

Family

ID=38580776

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/306834 WO2007116467A1 (en) 2006-03-31 2006-03-31 Volume managing device and volume managing method

Country Status (2)

Country Link
JP (1) JP4757300B2 (en)
WO (1) WO2007116467A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010066862A (en) * 2008-09-09 2010-03-25 Fujitsu Ltd Data management program, data management device and data management method
JP2011008510A (en) * 2009-06-25 2011-01-13 Fujitsu Ltd Copy control method and storage control apparatus

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08328753A (en) * 1995-05-30 1996-12-13 Nec Software Ltd Mirrored disk management system

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4689137B2 (en) * 2001-08-08 2011-05-25 株式会社日立製作所 Remote copy control method and storage system
IE20000203A1 (en) * 1999-03-25 2001-02-21 Converge Net Technologies Inc Storage domain management system
JP3348420B2 (en) * 1999-11-19 2002-11-20 エヌイーシーコンピュータテクノ株式会社 Information processing device with memory copy function
JP2002014777A (en) * 2000-06-29 2002-01-18 Hitachi Ltd Data moving method and protocol converting device, and switching device using the same
JP3849578B2 (en) * 2002-05-27 2006-11-22 日本電気株式会社 Communication control device
JP3757904B2 (en) * 2002-05-27 2006-03-22 日本電気株式会社 Communication control device
JP4214832B2 (en) * 2002-07-30 2009-01-28 株式会社日立製作所 Storage system
JP4325843B2 (en) * 2002-12-20 2009-09-02 株式会社日立製作所 Logical volume copy destination performance adjustment method and apparatus
JP2005025880A (en) * 2003-07-03 2005-01-27 Toshiba Corp Head positioning control device, its method, and disk storage device
JP2005062928A (en) * 2003-08-11 2005-03-10 Hitachi Ltd Remote copy system using two or more sites
JP2005165444A (en) * 2003-11-28 2005-06-23 Hitachi Ltd Disk array device and method for controlling it
US7600087B2 (en) * 2004-01-15 2009-10-06 Hitachi, Ltd. Distributed remote copy system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08328753A (en) * 1995-05-30 1996-12-13 Nec Software Ltd Mirrored disk management system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010066862A (en) * 2008-09-09 2010-03-25 Fujitsu Ltd Data management program, data management device and data management method
JP2011008510A (en) * 2009-06-25 2011-01-13 Fujitsu Ltd Copy control method and storage control apparatus

Also Published As

Publication number Publication date
JP4757300B2 (en) 2011-08-24
JPWO2007116467A1 (en) 2009-08-20

Similar Documents

Publication Publication Date Title
JP4800046B2 (en) Storage system
KR100324165B1 (en) Method and apparatus for correct and complete transactions in a fault tolerant distributed database system
JP4401895B2 (en) Computer system, computer and its program.
US7114094B2 (en) Information processing system for judging if backup at secondary site is necessary upon failover
JP2006285919A (en) Computer system, computer and remote copy processing method
US20090319702A1 (en) Storage system, storage apparatus, and method for hot swapping of firmware
US20070180307A1 (en) Method & system for resynchronizing data between a primary and mirror data storage system
JP2007164769A (en) Method, system and program for managing failure in mirrored system (management of failure in mirrored system)
JP2010015301A (en) Storage system and remote copy recovery method
JP2008225753A (en) Computer system, access control method and management computer
WO2010116456A1 (en) Method for managing data in operation system and server
JP2006285336A (en) Storage, storage system, and control method thereof
WO2007094041A1 (en) Server managing device and server managing program
WO2007116467A1 (en) Volume managing device and volume managing method
US7194675B2 (en) Backup method, backup system, disk controller and backup program
JP2009151677A (en) Storage control device, storage control program, and storage control method
JP4305007B2 (en) System switching system, processing method therefor, and processing program therefor
JP2001154896A (en) Computer and method for updating file
JP6511737B2 (en) Redundant system, redundant method and redundant program
JP3335779B2 (en) Plant performance monitoring system
JP4721057B2 (en) Data management system, data management method, and data management program
JP4137318B2 (en) Computer backup system
JP6511738B2 (en) Redundant system, redundant method and redundant program
JP2005202532A (en) Batch suspend method and system for a plurality of copy group
JP2003036210A (en) Agent program monitoring method, agent program monitoring system and agent monitoring program

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 06730782

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2008509618

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06730782

Country of ref document: EP

Kind code of ref document: A1