JP2007200182A - ストレージ装置、及びストレージシステム - Google Patents

ストレージ装置、及びストレージシステム Download PDF

Info

Publication number
JP2007200182A
JP2007200182A JP2006020367A JP2006020367A JP2007200182A JP 2007200182 A JP2007200182 A JP 2007200182A JP 2006020367 A JP2006020367 A JP 2006020367A JP 2006020367 A JP2006020367 A JP 2006020367A JP 2007200182 A JP2007200182 A JP 2007200182A
Authority
JP
Japan
Prior art keywords
journal
information
data
block
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006020367A
Other languages
English (en)
Inventor
Hiroshi Mine
博史 峯
Daisuke Yokota
大輔 横田
Shinji Kimura
信二 木村
Taisuke Kaneda
泰典 兼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006020367A priority Critical patent/JP2007200182A/ja
Priority to US11/373,163 priority patent/US20070180000A1/en
Publication of JP2007200182A publication Critical patent/JP2007200182A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2066Optimisation of the communication load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データの書き込み操作をジャーナル情報として記録するストレージ装置において、新たに書き込むデータが過去に書き込んだデータを完全に上書きすることなくジャーナル情報を削減し、また厳密な段階的回復を行えるようにする。
【解決手段】ジャーナル情報を、ブロック単位のジャーナルデータ情報と、それを参照するマップ情報を含むジャーナルログ情報に分けて、ジャーナル記憶領域に格納する。ジャーナルログ情報間で、ジャーナルデータ情報のブロック内容が一致するものが存在する場合、新しいジャーナルログ情報のマップ情報を、古いジャーナルログ情報のマップ情報により参照される内容が一致するブロックを参照するように書き換える。ジャーナルログ情報の表す操作内容を損なうことなく、冗長なジャーナルデータ情報をブロック単位で削減することにより、ジャーナル情報の削減を行う。
【選択図】図4

Description

本発明はストレージ装置及びストレージシステムに係り、データボリュームに対する差分情報をジャーナルボリュームに格納してなる、ストレージ装置及びストレージシステムに関するものである。
データベースシステムにおいて、データベースに格納される情報の損失を防止する技術として、一般に、ジャーナリングが用いられている。ジャーナリングは、データベースに対する更新操作の内容をジャーナル情報としてデータベースとは別の領域に記録し、データベースに障害が発生した場合に、予め取得しておいたデータベースのバックアップに、バックアップ取得後のジャーナル情報を反映することにより、データベースの復元を可能にする技術である。ジャーナル情報は、換言すれば、差分情報である。
データストレージシステムにおいて、バックアップおよびリストア処理を高速に行う技術として、差分バックアップが用いられている。差分バックアップは、最初に全体のデータをバックアップした後に、差分情報をバックアップするものである。データベースに障害が発生した場合に、バックアップした全体のデータに対して差分情報を反映することにより、高速なリストアを可能にする。差分バックアップは、データストレージシステムに対するジャーナリングを応用したものである。
例えば、特許文献1は、データストレージシステムにジャーナリングを適用することにより、ストレージ装置に格納されるデータの損失を防止する技術を開示している。
また、特許文献2には、データストレージシステムに対する災害等による障害の発生に備えて、ストレージ装置に格納されるデータを遠隔地に設置される別のストレージ装置にリストアする場合に、差分情報を用いることにより、ストレージ装置の負担を軽減する技術が開示されている。
さらに、特許文献3には、データストレージシステムに、過去の差分情報による操作を打ち消す新たな差分情報が追加される場合に、過去の差分情報を削除することにより、ジャーナル情報を削減して短時間でリストア処理を可能にする技術が開示されている。
特開2005−18738号広報 特開2005−222110号公報 特開2002−132561号公報
既述の従来の技術のように、差分情報を削減するためには、新たな差分情報が過去の差分情報を打ち消す必要があった。従って、データの書き込み操作をジャーナル情報として記録するストレージ装置において、ジャーナル情報を削減するためには、新たに書き込むデータが過去に書き込んだデータを上書きする必要があり、データを完全には上書きしない場合、即ち、上書きしないデータが一部でも存在する場合は、ジャーナル情報を削減することができなかった。しかしながら、差分情報を削減する処理により、過去の差分情報は削除されるため、差分情報の反映を選択的に行うことにより、差分情報が記録されている過去の任意の時点でのデータの状態を復元しようとする場合に、従来の技術は、削除された過去の差分情報から新たな任意の時点の差分情報までの間のデータイメージを復元することはできなかった。従って、ソフトウェア障害からの回復等のために管理者の指示等に沿ってジャーナル情報を過去のものから逐次記憶デバイスに記憶されたデータに反映していく、段階的回復を目的とした場合、従来の技術は、削除されたジャーナル情報からそれを上書きするジャーナル情報までの間の記憶データの状態を段階的に回復することはできなかった。
このような課題を解決するために、本発明は、差分データ情報を削減しつつ、ジャーナルログ情報の記録を開始した後の任意時点での記憶データの状態を回復可能なストレージ装置を提供することを目的とするものである。さらに、本発明は、複数のストレージ装置を備えたリモートコピーシステムにおいて、ストレージ装置間で伝送されるジャーナル情報から重複するデータブロックを取り除くことにより、リモートコピーの際伝送される情報量を削減することを目的とするものである。
前記目的を達成するために、本発明は、ジャーナル情報を、ジャーナルログ情報とジャーナルデータ情報に分けて、これらを区別して管理することを特徴とするものである。即ち、本発明の第1は、記憶デバイスと、前記記憶デバイスに対する計算機装置からのデータ書き込み要求を制御する制御部と、を備えたストレージ装置において、前記記憶デバイスは、主データ記憶領域と、前記主データ記憶領域に対する差分情報をジャーナル情報として記憶するジャーナル記憶領域とを備え、前記ジャーナル記憶領域は、前記ジャーナル情報のジャーナルログ情報の記憶領域と、前記ジャーナル情報のジャーナルデータ情報の記憶領域と、を含んで構成されることを特徴とする。
本発明の第2は、記憶デバイスと、前記記憶デバイスに対する計算機装置からのデータ書き込み要求を制御する制御部と、を備えたストレージ装置において、前記制御部は、前記主データ記憶領域に対する前記差分情報であるジャーナル情報を、ジャーナルログ情報と、ジャーナルデータ情報に分けて管理し、複数の前記ジャーナルログ間で同一の前記ジャーナルデータ情報を共有する、ことを特徴とする。
さらに、本発明の第3は、上位装置に接続されるストージ装置であって、データボリュームと、コントロールユニットと、前記データボリュームに対するログを記憶する領域と、前記データボリュームに対する差分データを記憶する領域と前記差分データを記憶する領域のブロック番号と前記ログ情報との対応関係を規定したブロックリストと、を備えるジャーナルボリュームとを備え、
前記コントロールユニットは、前記上位装置から書き込み要求があった場合、前記書き込み要求を前記ジャーナルボリュームに書き込み、前記書き込んだ書き込み要求のログが複数となったとき、前記ログのうち最も古いログに対応する差分データに基づき、該最も古い差分データと内容が一致する部分が存在する新しい差分データの有無を検討し、重複しているブロック番号の対応関係を、前記最も古いログに対応するブロック番号に変更するとともに、重複したブロック番号に対応する前記差分データを記憶する領域のブロックを解放するようにした、ことを特徴とするものである。
さらに、本発明の第4は、前記ストレージ装置である第1のストレージ装置と、当該第1のストレージ装置に通信経路を介して接続された第2のストレージ装置と、を備え、前記通信経路を介して、前記第1のストレージ装置から前記第2のストレージ装置に、前記ジャーナル情報を伝送することによって、両方のストレージ装置に格納されるデータ内容の同期化を図るストレージシステムであって、前記第1のストレージ装置が、前記ジャーナル情報を、前記ジャーナルログ情報の列と、請求項記載のマップで参照されるブロック番号の情報の列と、前記ジャーナルデータ情報の列として前記第2のストレージ装置に伝送する際に、前記ブロック番号の情報の列に重複するブロック番号を含めないことにより、前記ジャーナルデータ情報列から重複する内容のデータブロックを省くようにした、ことを特徴とするものである。
本発明によれば、前記主データ記憶領域に対する前記差分情報であるジャーナル情報を、ジャーナルログ情報と、ジャーナルデータ情報に分けて、複数の前記ジャーナルログ間で同一の前記ジャーナルデータ情報を共有することにより、前記ジャーナル情報を圧縮する、ことができる。
以上説明したように、本発明によれば、ジャーナル情報を削減しつつ、ジャーナル情報の記録を開始した後の任意時点での記憶データの状態を回復(ステップリカバリ)可能なストレージ装置を提供することができる。さらに、本発明によれば、複数のストレージ装置を備えたリモートコピーシステムにおいて、ストレージ装置間で伝送されるジャーナル情報から重複するデータブロックを取り除くことにより、リモートコピーの際伝送される情報量を削減することができる。
以下、図面を用いて、本発明の実施の形態について説明する。
実施形態1
図1は、本発明に係わるストレージ装置の第1の実施形態を示した、ストレージ装置の機能ブロック図である。ストレージ装置101は、SAN(Storage Area Network)等を介して、上位装置(ホスト装置)としての計算機装置102に接続され、計算機装置102から発行される、データの読み込み、書き込み等の要求を受け付け、これを処理する。ストレージ装置101は、制御部103、主データ記憶領域(データボリューム)104およびジャーナル記憶領域(ジャーナルボリューム)105からなる。制御部(コントロールユニット)103は、ストレージ装置101全体を制御する。制御部103は、計算機装置102からの記憶デバイスに対する読み込み、書き込み等の要求を処理する。主データ記憶領域104およびジャーナル記憶領域105は、ハードディスク装置または不揮発性メモリ等から構成される。ジャーナリングが行なわれない場合、計算機装置102から書き込まれるデータは、主データ記憶領域104に直接格納される。ジャーナリングが行なわれる場合、ジャーナリング開始後、新たなデータは、ジャーナル情報としてジャーナル記憶領域105に格納される。この場合、主データ記憶領域104にはジャーナリング開始時のスナップショットが、ジャーナル記憶領域105にはジャーナリング開始後の主データ記憶領域104に対する差分データが、それぞれ格納される。
ジャーナル記憶領域105に格納されたジャーナル情報は、管理者の指示等に従って、制御部103によって、主データ記憶領域104に反映される。ジャーナリング実行中に計算機装置102に読み込まれるデータは、制御部103により、主データ記憶領域104およびジャーナル記憶領域105に格納されるデータから構成される。
図2は、本実施例の制御部103の構成を示す。制御部103は、CPU(Central Processing Unit)201、I/O(Input/Output)インタフェース202、RAM(Random Access Memory)等の主記憶メモリ203およびROM(Read Only Memory)等のプログラム記憶領域204からなる。制御部103は、プログラム記憶領域204に格納されたストレージ装置制御プログラム205を主記憶メモリ203に読み出し、CPU201上でこのプログラム実行することにより、ストレージ装置101全体を制御する。制御部103は、計算機装置102との通信、主データ記憶領域104およびジャーナル記憶領域105へのアクセスを、I/Oインタフェース202を介して行う。
図3はジャーナル記憶領域105の構成を示す。ジャーナル記憶領域105は、ジャーナルログ記憶領域301、ジャーナルデータ記憶領域302、ジャーナルログ管理情報303およびジャーナルデータ管理情報304から構成されている。ジャーナルログ記憶領域301は、後述するジャーナルログ情報を、リングバッファとして、格納する領域である。ジャーナルログ記憶領域301は、ジャーナルログ管理情報303により管理される。ジャーナルログ管理情報303は、ジャーナルログ記憶領域301の全体のサイズ、ジャーナルログ記憶領域における使用中の領域の先頭を示すポインタおよび使用中の領域の大きさを示すレングスからなり、ジャーナルログ記憶領域の使用中および未使用の領域を管理するためのものである。ここで、未使用の領域は、使用中の領域の先頭を示すポインタに使用中の領域の大きさを示すレングスを加えた位置から始まり、全体のサイズから使用中の領域の大きさを示すレングスを引いた値の大きさをもつ領域として定義される。
ジャーナルデータ記憶領域302は、後述するジャーナルデータ情報をディスクセクタ単位等のブロック単位で格納する領域であり、ジャーナルデータ管理情報304によって管理される。ジャーナルデータ管理情報304は、ジャーナルデータ領域302について、各ブロックに一対一に対応する参照数を格納する配列の情報を備え、制御部103は、この管理情報によりジャーナルデータ記憶領域の使用中および未使用のブロックを管理する。参照数は負でない整数であり、使用中のブロックは参照数がゼロでないブロックとして、未使用のブロックは参照数がゼロのブロックとして、それぞれ定義される。
図4は、ジャーナル情報がジャーナル記憶領域105に格納される様子を示すブロック図である。ジャーナル情報401は、計算機装置102からストレージ装置101に対する書き込み要求に対応し、例えば、ジャーナル情報を一意に識別するためのIDとしてこの要求を前記制御部103が受け付けた時刻、データを主データ記憶領域104に書き込む位置を示すオフセットとしての主データ記憶領域104のセクタ番号、主データ記憶領域に書き込まれるデータの長さを示すレングスとしてデータのセクタ数、および、書き込まれるデータの内容を格納する可変長のデータブロックからなる。
ジャーナル情報401に含まれる情報のうち、データブロックは、セクタ単位のブロックに分割され、分割されたデータブロックがジャーナルデータ情報402として、ジャーナル記憶領域302の未使用の複数のブロックに分けて格納される。このとき、ジャーナルデータ情報402は、ジャーナル記憶領域302の連続したブロックに格納される必要は必ずしもない。ジャーナルデータ情報402がジャーナル記憶領域302上の格納されたアドレスはジャーナル記憶領域302のブロック番号の配列からなるブロックリスト(マップ情報403)として、ジャーナルログ記憶領域301に格納される。マップ情報403は、ジャーナル情報401からデータブロックを除いた情報(ID、オフセット、レングス)と併せて、可変長のジャーナルログ情報404の一部として、ジャーナルログ記憶領域301に格納される。
図5は、ジャーナル情報をストレージ装置に追加する手順を示すフローチャートである。ストレージ装置101は、計算機装置102からの書き込み要求を、制御部103において受け付け、ジャーナル情報401を生成する(ステップ501)。制御部103は、生成したジャーナル情報401を格納可能な未使用領域が、ジャーナル記憶領域105にあるか判定する(ステップ502)。具体的には、ジャーナル情報401のレングス情報、即ち必要なブロック数を元に、ジャーナルログ情報404の大きさを見積もり、ジャーナルログ管理情報303を参照して、ジャーナルログ記憶領域301に必要な大きさの未使用領域があり、かつ、ジャーナルデータ管理情報304を参照して、ジャーナルデータ記憶領域302に必要な数の未使用ブロックがあるかどうかを判定する。
ジャーナル情報401を格納可能な未使用領域がジャーナル記憶領域105に存在しない場合、計算機装置102に対して書き込み要求の失敗を示す応答を返し(ステップ503)、処理を終了する。ジャーナル情報401を格納可能な未使用領域が存在する場合、ジャーナルデータ管理情報304を参照し、未使用のブロック即ち参照数がゼロのブロックに対応する、ジャーナルデータ記憶領域302のブロックに、ジャーナルデータ情報402をブロック単位に分割して格納する(ステップ504)。
次に、ジャーナルデータ管理情報304を更新し、新たにデータを格納したブロックに対応する参照数について、参照数を1増加すなわちゼロから1にする(ステップ505)。次に、新たにデータを格納したブロックのブロック番号とジャーナルデータ記憶領域のアドレスとの配列としてマップ情報403を生成する(ステップ506)。生成したマップ情報は、ジャーナル情報401のデータブロックを除いた情報と併せて、ジャーナルログ情報404を構成して、制御部103は、ジャーナルログ管理情報303を参照し、ジャーナルログ記憶領域301の未使用の領域、即ちジャーナルログ管理情報303の使用中の領域の先頭を示すポインタに使用中の領域の大きさを示すレングスを加えた値によって示される位置に、新たなジャーナルログ情報を格納する(ステップ507)。
次に、制御部103は、ジャーナルログ管理情報303を更新し、使用中の領域の大きさを示すレングスを、今回のジャーナルログ情報404の大きさを加えたものにする(ステップ508)。最後に、計算機装置102に対して書き込み要求の成功を示す応答を返し(ステップ509)、処理を終了する。
図6は、ジャーナル情報401を削減する手順を示す。ストレージ装置101の制御部103は、新たなジャーナル情報401を、ジャーナルデータ情報402およびジャーナルログ情報404としてジャーナル記憶領域105に格納した後、マップ情報403によって参照される新たに追加されたジャーナルデータ情報402の各ブロックについて、古いジャーナルログ情報のマップ情報によって参照される古いジャーナルデータ情報の各ブロックと、内容が一致するかを判定する(601)。ここで、ブロック内容が同一かどうかの判定には、両ブロックに格納されるビット列が完全に一致するかを判定すればよいが、例えば、誤り訂正のためにブロック毎にCRC(Cyclic Redundancy Check)情報等を付加している場合は、最初にそれらを比較することにより、一致しない場合のビット列の比較を省略する。
制御部103は、内容が一致するブロックが存在しない場合、マップ情報403によって参照される次の新しいブロックについて、既述の比較の処理を繰り返す。内容が一致するブロックが存在する場合、マップ情報403を更新し、古いジャーナルデータ情報のブロックを参照するようにブロック番号を差し替える(ステップ602)。次に、ジャーナルデータ管理情報304を更新し、マップ情報403の変更前に参照されていたブロックの参照数を1減少し、変更後に参照されるブロックの参照数を1増加する(ステップ603)。ここで、参照数がゼロとなったブロックを空き領域とすることができることになり、ジャーナル情報401がジャーナル記憶領域105に占める領域を、空き領域となったブロック分だけ削減できる。
ブロックリスト(マップ情報)の更新を、制御部103は、指定された時刻に実行するか、計算機装置からトランザクションが制御部に送られてこない時に実行するか、ジャーナル情報がある任意の数分溜まった場合に実行するか、など特に制限されない。
以上の手順を、マップ情報403によって参照される新しいブロックについて繰り返し(ステップ604)、全ての新しいブロックの比較が完了した場合、処理を終了する。
図7は、ジャーナル情報を主データ記憶領域104に反映する手順を示す。ジャーナル情報の反映は、管理者の指示等に従って行う。例えば、管理者は、時刻を指定することにより、その時刻までのジャーナル情報の反映を指示する。ストレージ装置101の制御部103は、管理者からの指示を受け、ジャーナル記憶領域105に格納される最も古いジャーナル情報401から指定された時刻までのジャーナル情報によって主データ記憶領域104を更新する。最も古いジャーナル情報401は、ジャーナルログ管理情報303の使用中の領域の先頭を示すポインタによって指されるジャーナルログ記憶領域301に格納される最も古いジャーナルログ情報404、および、そのマップ情報403によって参照されるジャーナルデータ記憶領域302に格納されるジャーナルデータ情報402によって表される。
ジャーナル情報401を主データ記憶領域104に反映することは、制御部103が、ジャーナルログ情報404によって示される主データ記憶領域104の位置に、マップ情報403によって参照される、ジャーナルデータ情報402の内容を書き込むことによって行なわれる(ステップ701)。次いで、制御部103は、ジャーナルデータ管理情報304を更新、すなわち、マップ情報403によって参照されていた各ブロックの参照数を1減少する(ステップ702)。ここで、参照数がゼロになったブロックは未使用となり解放されるが、参照数がゼロでないブロック即ち他のジャーナルログ情報のマップ情報により参照されているブロックは、引き続き使用中のブロックとして非開放となる。
次に、ジャーナルログ管理情報302を更新、すなわち、ジャーナルログ記憶領域301における、使用中の領域の先頭を示すポインタを、ジャーナルログ情報404の大きさを加えたものとし、使用中の領域の大きさを示すレングスを、ジャーナルログ情報404の大きさを減じたものとする(ステップ703)。これにより、ジャーナルログ情報404がジャーナルログ記憶領域301に占めていた領域は未使用となり解放される。以上の手順を、より新しいジャーナル情報について繰り返し(ステップ704)、指定された時刻よりも古いジャーナル情報がなくなった場合、処理を終了する。
図8は、ジャーナリングされている操作の取り消し、即ち、ジャーナル情報を破棄する手順を示す。ジャーナリングされている操作の取り消しは、ジャーナル情報の反映と同様に、管理者の指示等に従って行い、指定された時刻以降のジャーナル情報を破棄するものである。ストレージ装置101の制御部103は、管理者からの指示を受け、ジャーナルログ管理情報303を参照し、古いものから順にジャーナルログ情報をたどっていくことにより、指定された時刻以降のIDをもつジャーナルログ情報404を特定する(ステップ800)。破棄対象となるジャーナル情報401は、ジャーナルログ情報404、および、そのマップ情報403によって参照されるジャーナルデータ情報402によって定義される。ジャーナル情報401の破棄は、制御部103によって、まず、ジャーナルデータ管理情報304を更新し、マップ情報403によって参照される各ブロックの参照数を1減少することによって行なわれる(ステップ801)。
次に、ジャーナルログ管理情報302を更新し、使用中の領域の大きさを示すレングスを、ジャーナルログ情報404の大きさを減じたものとする(ステップ802)。以上の手順を、より新しいジャーナル情報について繰り返し(ステップ803)、指定された時刻よりも新しいジャーナル情報がなくなった場合、処理を終了する。
以上に説明したように、ストレージ装置は、ジャーナル情報に含まれるデータブロックをセクタ単位のブロックに分割し、ブロック単位で内容を比較することによって、ジャーナル情報単位でデータを完全に上書きする場合に限らず、データを部分的に上書きする場合でも、ジャーナル情報を削減することができる。また、ジャーナル情報の削減の際に削減される情報は冗長なデータブロックであり、ジャーナル情報に含まれる情報は完全に再現可能な状態で残るため、ジャーナル情報を削減した場合においても、ジャーナル情報の記録を開始した後の任意時点の状態を段階的に回復することができる。
実施形態2
図9は、本発明の第2の実施形態であるストレージ装置を示す。第1の実施例と同様の構成には同一の符合を付しその説明を省略する。第1のストレージ装置901と、第2のストレージ装置902は、インターネット等のネットワーク903を介して接続されている。第2のストレージ装置902は、第1のストレージ装置902と同一の内容を保持するバックアップシステムとして利用されている。初期状態として、例えば磁気テープによるバックアップとリストア等の手法を用いて、第1のストレージ装置901と第2のストレージ装置902の格納するデータ内容を同期化する。以後、第1のストレージ装置901と第2のストレージ装置902のデータ内容を同期化させるためには、第1のストレージ装置901に対する書き込み操作の内容を、ネットワーク903を介して第2のストレージ装置902に伝送し、第2のストレージ装置において書き込みを実行すればよい。そこで、ネットワーク903を介し伝送される書込み操作の内容として、同期が完了している主データ記憶領域104に対する差分情報、即ち、ジャーナル記憶領域105に格納されるジャーナル情報401が用いられる。
図10は、ネットワークを介して伝送されるジャーナル情報のデータ構成を表現したものである。ジャーナル記憶領域105に格納されるジャーナル情報は、定期的にまたは管理者の指示等によって、ひとつまたは複数のジャーナル情報をまとめて、ネットワーク903を介して、ジャーナルログ情報列1001、ブロック番号情報列1002、ジャーナルデータ情報列1003として伝送される。ジャーナルログ情報列1001は、ジャーナルログ記憶領域301に格納されている、伝送するひとつまたは複数のジャーナルログ情報に、そのサイズを付加したものである。
ブロック番号情報列1002は、伝送するジャーナルログ情報のマップ情報によって参照されるジャーナルデータ情報402が格納されるジャーナルデータ記憶領域302のブロック番号の列に、その数即ち伝送するブロック数を付加したものである。ジャーナルデータ情報列1003は、ブロック番号情報列1002によって示される、ジャーナルデータ記憶領域302のブロックの内容を、ブロック番号情報列1002の順に並べたものであり、その数はブロック番号情報列1002のブロック数に一致する。
ここで、伝送する複数のジャーナルログ情報のマップ情報によって参照されるジャーナルデータ情報は一度だけ伝送すればよく、ブロック番号情報列1002を生成する際に重複するブロック番号を含めないことにより、データ内容の重複するブロックを余分に送信することを防ぐ。従って、ブロック番号情報列1002のブロック数は、ジャーナルログ情報列1001に含まれるジャーナルログ情報のマップ情報の大きさを合計したものよりも、重複するブロックの数だけ少なくなる。なお、ストレージ装置間でジャーナル記憶領域の構成が異なる等の場合は、受信側において、ジャーナルログ情報列1001のマップ情報およびブロック番号情報列1002に含まれるブロック番号を、ジャーナルデータ記憶領域内の絶対的な位置を示すものではなく、個々のブロックを区別するためのタグとして扱えばよい。
以上に説明したように、本実施形態における装置は、ネットワークに伝送するジャーナル情報から重複する余分なデータブロックを取り除くことにより、リモートコピーを行う場合にネットワークに伝送する情報量を削減することができる。
以上説明した実施形態はそれぞれ一例であって、本発明が既述の実施形態に限定されるものではない。
本発明の第1の実施形態に係るストレージ装置の構成を示すブロック図である。 ストレージ装置の制御部の構成を示すブロック図である。 ストレージ装置のジャーナル記憶領域の構成を示すブロック図である。 ジャーナル情報がジャーナル記憶領域に格納される様子を示すブロック図である。 ストレージ装置にジャーナル情報を追加する手順を示すフローチャートである。 ストレージ装置に対して、ジャーナル情報を削減する手順を示すフローチャートである。 ストレージ装置にジャーナル情報を反映する手順を示すフローチャートである。 ストレージ装置において、ジャーナル情報を破棄する手順を示すフローチャートである。 ジャーナル情報を削減可能にしたリモートコピーシステムのブロック図である。 ネットワークを介して、ストレージ装置間で伝送されるジャーナル情報のデータイメージである。
符号の説明
101 ストレージ装置
102 計算機装置
103 制御部
104 主データ記憶領域
105 ジャーナル記憶領域
201 CPU
202 I/Oインタフェース
203 主記憶メモリ
204 プログラム記憶領域
205 ストレージ装置制御プログラム
301 ジャーナルログ記憶領域
302 ジャーナルデータ記憶領域
303 ジャーナルログ管理情報
304 ジャーナルデータ管理情報
401 ジャーナル情報
402 ジャーナルデータ情報
403 マップ情報
404 ジャーナルログ情報
901 第1のストレージ装置
902 第2のストレージ装置
903 ネットワーク
1001 ジャーナルログ情報列
1002 ブロック番号情報列
1003 ジャーナルデータ情報列

Claims (20)

  1. 記憶デバイスと、前記記憶デバイスに対する計算機装置からのデータ書き込み要求を制御する制御部と、を備えたストレージ装置において、
    前記記憶デバイスは、主データ記憶領域と、前記主データ記憶領域に対する差分情報をジャーナル情報として記憶するジャーナル記憶領域とを備え、
    前記ジャーナル記憶領域は、前記ジャーナル情報のジャーナルログ情報の記憶領域と、前記ジャーナル情報のジャーナルデータ情報の記憶領域と、を含んで構成されるストレージ装置。
  2. 前記制御部は、前記計算機装置からの書き込み要求を、前記ジャーナル情報としてジャーナル記憶領域に格納する際に、前記ジャーナル情報を、ジャーナルログ情報とジャーナルデータ情報に分けて、前記ジャーナルログ情報を前記ジャーナルログ記憶領域へ、前記ジャーナルデータ情報を前記ジャーナルデータ記憶領域へ格納する、請求項1記載のストレージ装置。
  3. 前記ジャーナルデータ情報は、前記ジャーナルデータ記憶領域に、固定長単位に分割されて格納され、
    前記分割された各ジャーナルデータ情報の単位が前記ジャーナルデータ記憶領域内の複数のブロックのうちどのブロックに格納されているかのマップ情報が、前記ジャーナルログ記憶領域に格納されている、請求項2記載のストレージ装置。
  4. 前記ジャーナルデータ記憶領域を固定長ブロック単位に分割し、
    前記各ブロック単位について、前記制御部が当該ブロックを参照した参照数からなる配列をジャーナルデータ管理情報として、前記ジャーナル記憶領域に格納した、請求項3記載のストレージ装置。
  5. 前記制御部は、
    前記ジャーナルデータ管理情報を参照し、前記ジャーナルデータ情報を前記参照数がゼロの前記ブロックに格納し、前記ジャーナルデータ管理情報を更新して、前記ジャーナルデータ情報を格納したブロックに対応する参照数を1増加する、請求項4記載のストレージ装置。
  6. 前記制御部は、前記ジャーナルデータ情報を除く前記ジャーナル情報に前記マップ情報を付加し、これを前記ジャーナルログ情報として、前記ジャーナルログ記憶領域の空き領域に格納し、
    前記ジャーナルログ情報の格納後、ジャーナルログ管理情報のうちの前記ジャーナルログ記憶領域における使用中の領域の大きさを示すレングスを、ジャーナルログ情報の大きさを加えたものに更新する、請求項5記載のストレージ装置。
  7. 前記制御部は、新たなジャーナル情報と、既に前記ジャーナル記憶領域に格納されている既存のジャーナル情報とを比較し、前記ジャーナルデータ記憶領域に内容が重複する前記ブロックが存在する場合、前記新たなジャーナル情報のジャーナルログ情報の前記マップ情報を、前記既存のジャーナル情報の内容が一致するブロックを参照するように変更する、請求項4記載のストレージ装置。
  8. 前記制御部は、新たなジャーナル情報と、既に前記ジャーナル記憶領域に格納されている既存のジャーナル情報とを比較し、前記ジャーナルデータ記憶領域に内容が重複する前記ブロックが存在する場合、前記既存のジャーナル情報のジャーナルログ情報の前記マップ情報を、前記新たなジャーナル情報の内容が一致するブロックを参照するように変更する、請求項4記載のストレージ装置。
  9. 前記制御部は、前記ジャーナルデータ管理情報を更新し、変更前の前記マップ情報によって参照されていた前記ブロックの参照数を1減少し、変更後の前記マップ情報によって参照される前記ブロックの参照数を1増加する、請求項7又は8記載のストレージ装置。
  10. 前記制御部は、前記参照数が0になった前記ブロックを、新たな前記ジャーナル情報の前記ジャーナルデータ情報の記憶領域として解放する、請求項9記載のストレージ装置。
  11. 前記制御部が前記主データ記憶領域に前記ジャーナル情報を反映させる場合、前記ジャーナルデータ管理情報を更新して、前記マップ情報によって参照されていた全ての前記ブロックに対応する前記参照数を1ずつ減少させ、前記ジャーナルログ情報の大きさを、前記主データ記憶領域に反映された前記ジャーナル情報の大きさ分減じたものにする、請求項3記載のストレージ装置。
  12. 前記制御部は、前記マップ情報によって参照される前記ブロックの前記ジャーナルデータ情報を、前記ジャーナルログ情報によって指定される前記主データ記憶領域のアドレスに反映させる、請求項11記載のストレージ装置。
  13. 前記制御部は、選択した時点以降の前記ジャーナル情報を破棄するように構成された、破棄される前記ジャーナル情報の前記マップ情報によって参照されていた全ての前記ブロックに対応する前記参照数を1ずつ減少させる、請求項3記載のストレージ装置。
  14. 記憶デバイスと、前記記憶デバイスに対する計算機装置からのデータ書き込み要求を制御する制御部と、を備えたストレージ装置において、前記制御部は、前記主データ記憶領域に対する前記差分情報であるジャーナル情報を、ジャーナルログ情報と、ジャーナルデータ情報に分けて管理し、複数の前記ジャーナルログ間で同一の前記ジャーナルデータ情報を共有する、ストレージ装置。
  15. 上位装置に接続されるストレージ装置であって、
    データボリュームと、
    コントロールユニットと、
    前記データボリュームに対するログを記憶する領域と、前記データボリュームに対する差分データを記憶する領域と前記差分データを記憶する領域のブロック番号と前記ログ情報との対応関係を規定したブロックリストと、を備えるジャーナルボリュームとを備え、
    前記コントロールユニットは、前記上位装置から書き込み要求があった場合、前記書き込み要求を前記ジャーナルボリュームに書き込み、前記書き込んだ書き込み要求のログが複数となったとき、前記ログのうち最も古いログに対応する差分データに基づき、該最も古い差分データと内容が一致する部分が存在する新しい差分データの有無を検討し、重複しているブロック番号の対応関係を、前記最も古いログに対応するブロック番号に変更するとともに、重複したブロック番号に対応する前記差分データを記憶する領域のブロックを解放するようにした、ストレージ装置。
  16. 前記コントロールユニットが前記ブロックリストに参照情報を関連させ、この参照情報に基づいて、前記ブロックの解放を実行する、請求項15記載のストレージ装置。
  17. 前記コントロールユニットが前記ブロックリストを介して、参照した前記差分データを記憶する領域のブロックに参照情報を付加し、参照情報がある値になった場合に、前記ブロックの解放を実行する、請求項15記載のストレージ装置。
  18. 前記コントロールユニットは、指定時刻のタイミングで、前記重複しているブロック番号の対応関係を、前記最も古いログに対応するブロック番号に変更するとともに、重複したブロック番号に対応する前記差分データを記憶する領域のブロックを解放するようにした、請求項15記載のストレージ装置。
  19. 前記コントロールユニットは、前記上位装置からトランザクションが送信されていないタイミングで、前記重複しているブロック番号の対応関係を、前記最も古いログに対応するブロック番号に変更するとともに、重複したブロック番号に対応する前記差分データを記憶する領域のブロックを解放するようにした、請求項15記載のストレージ装置。
  20. 請求項1記載のストレージ装置である第1のストレージ装置と、当該第1のストレージ装置に通信経路を介して接続された第2のストレージ装置と、を備え、前記通信経路を介して、前記第1のストレージ装置から前記第2のストレージ装置に、前記ジャーナル情報を伝送することによって、両方のストレージ装置に格納されるデータ内容の同期化を図るストレージシステムであって、前記第1のストレージ装置が、前記ジャーナル情報を、前記ジャーナルログ情報の列と、請求項3記載のマップで参照されるブロック番号の情報の列と、前記ジャーナルデータ情報の列として前記第2のストレージ装置に伝送する際に、前記ブロック番号の情報の列に重複するブロック番号を含めないことにより、前記ジャーナルデータ情報列から重複する内容のデータブロックを省くようにしたストレージシステム。
JP2006020367A 2006-01-30 2006-01-30 ストレージ装置、及びストレージシステム Pending JP2007200182A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006020367A JP2007200182A (ja) 2006-01-30 2006-01-30 ストレージ装置、及びストレージシステム
US11/373,163 US20070180000A1 (en) 2006-01-30 2006-03-13 Storage apparatus and storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006020367A JP2007200182A (ja) 2006-01-30 2006-01-30 ストレージ装置、及びストレージシステム

Publications (1)

Publication Number Publication Date
JP2007200182A true JP2007200182A (ja) 2007-08-09

Family

ID=38323358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006020367A Pending JP2007200182A (ja) 2006-01-30 2006-01-30 ストレージ装置、及びストレージシステム

Country Status (2)

Country Link
US (1) US20070180000A1 (ja)
JP (1) JP2007200182A (ja)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009123187A (ja) * 2007-10-24 2009-06-04 Hitachi Ltd ストレージシステム
JP2010072746A (ja) * 2008-09-16 2010-04-02 Hitachi Ltd ストレージシステム、及びストレージシステムの運用方法
JP2010170475A (ja) * 2009-01-26 2010-08-05 Nec Corp ストレージシステム、ストレージシステムにおけるデータ書込方法及びデータ書込プログラム
WO2010109568A1 (ja) * 2009-03-24 2010-09-30 日本電気株式会社 ストレージ装置
JP2012003621A (ja) * 2010-06-18 2012-01-05 Nec System Technologies Ltd ディスクアレイ装置間のリモートコピー処理システム、処理方法、及び処理用プログラム
US8285953B2 (en) 2007-10-24 2012-10-09 Hitachi, Ltd. Storage system group
US9164941B2 (en) 2007-10-24 2015-10-20 Hitachi, Ltd. Storage system group
JP2016511495A (ja) * 2013-03-15 2016-04-14 アマゾン・テクノロジーズ・インコーポレーテッド ログレコード管理
JP2017079053A (ja) * 2015-08-24 2017-04-27 エイチジーエスティーネザーランドビーブイ ストレージジャーナリングを改善する方法およびシステム
US9672237B2 (en) 2013-03-15 2017-06-06 Amazon Technologies, Inc. System-wide checkpoint avoidance for distributed database systems
US9699017B1 (en) 2013-09-25 2017-07-04 Amazon Technologies, Inc. Dynamic utilization of bandwidth for a quorum-based distributed storage system
US9760596B2 (en) 2013-05-13 2017-09-12 Amazon Technologies, Inc. Transaction ordering
US9817710B2 (en) 2013-05-28 2017-11-14 Amazon Technologies, Inc. Self-describing data blocks stored with atomic write
US9880933B1 (en) 2013-11-20 2018-01-30 Amazon Technologies, Inc. Distributed in-memory buffer cache system using buffer cache nodes
US10180951B2 (en) 2013-03-15 2019-01-15 Amazon Technologies, Inc. Place snapshots
US10216949B1 (en) 2013-09-20 2019-02-26 Amazon Technologies, Inc. Dynamic quorum membership changes
US10223184B1 (en) 2013-09-25 2019-03-05 Amazon Technologies, Inc. Individual write quorums for a log-structured distributed storage system
US10303564B1 (en) 2013-05-23 2019-05-28 Amazon Technologies, Inc. Reduced transaction I/O for log-structured storage systems
US10437721B2 (en) 2013-09-20 2019-10-08 Amazon Technologies, Inc. Efficient garbage collection for a log-structured data store
US10474547B2 (en) 2013-05-15 2019-11-12 Amazon Technologies, Inc. Managing contingency capacity of pooled resources in multiple availability zones
US10534768B2 (en) 2013-12-02 2020-01-14 Amazon Technologies, Inc. Optimized log storage for asynchronous log updates
US10698881B2 (en) 2013-03-15 2020-06-30 Amazon Technologies, Inc. Database system with database engine and separate distributed storage service
US10747746B2 (en) 2013-04-30 2020-08-18 Amazon Technologies, Inc. Efficient read replicas
US11030055B2 (en) 2013-03-15 2021-06-08 Amazon Technologies, Inc. Fast crash recovery for distributed database systems
US11341163B1 (en) 2020-03-30 2022-05-24 Amazon Technologies, Inc. Multi-level replication filtering for a distributed database
US11914571B1 (en) 2017-11-22 2024-02-27 Amazon Technologies, Inc. Optimistic concurrency for a multi-writer database

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080140963A1 (en) * 2006-12-11 2008-06-12 Thomason Ronald G Methods and systems for storage system generation and use of differential block lists using copy-on-write snapshots
US8239348B1 (en) * 2008-08-14 2012-08-07 Symantec Corporation Method and apparatus for automatically archiving data items from backup storage
US8250031B2 (en) 2008-08-26 2012-08-21 Hitachi, Ltd. Low traffic failback remote copy
US8397051B2 (en) 2009-02-23 2013-03-12 Autonomy, Inc. Hybrid hash tables
US8145598B2 (en) * 2009-02-23 2012-03-27 Iron Mountain Incorporated Methods and systems for single instance storage of asset parts
CN101876949B (zh) * 2009-11-30 2012-04-25 威盛电子股份有限公司 数据储存***与方法
TWI493340B (zh) * 2009-12-28 2015-07-21 Via Tech Inc 資料儲存系統與方法
WO2013070273A1 (en) * 2011-04-01 2013-05-16 Nexsan Corporation Journaling raid system
WO2013118195A1 (en) * 2012-02-10 2013-08-15 Hitachi, Ltd. Storage management method and storage system in virtual volume having data arranged astride storage devices
US9208082B1 (en) * 2012-03-23 2015-12-08 David R. Cheriton Hardware-supported per-process metadata tags
US9398090B2 (en) * 2013-01-07 2016-07-19 Dropbox, Inc. Synchronized content library
JP6378264B2 (ja) * 2016-07-29 2018-08-22 ファナック株式会社 自動バックアップ装置、自動バックアップ方法及びプログラム
JP2021033782A (ja) * 2019-08-27 2021-03-01 株式会社日立製作所 リモートコピーシステム
US11409457B1 (en) * 2021-04-23 2022-08-09 Netapp, Inc. Co-located journaling and data storage for write requests

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06124223A (ja) * 1991-03-28 1994-05-06 Texas Instr Inc <Ti> ディスクファイルシステムのログ装置および方法
US5414840A (en) * 1992-06-25 1995-05-09 Digital Equipment Corporation Method and system for decreasing recovery time for failed atomic transactions by keeping copies of altered control structures in main memory

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009123187A (ja) * 2007-10-24 2009-06-04 Hitachi Ltd ストレージシステム
US8285953B2 (en) 2007-10-24 2012-10-09 Hitachi, Ltd. Storage system group
US8607012B2 (en) 2007-10-24 2013-12-10 Hitachi, Ltd. Storage system group
US9164941B2 (en) 2007-10-24 2015-10-20 Hitachi, Ltd. Storage system group
JP2010072746A (ja) * 2008-09-16 2010-04-02 Hitachi Ltd ストレージシステム、及びストレージシステムの運用方法
US8332600B2 (en) 2008-09-16 2012-12-11 Hitachi, Ltd. Storage system and method for operating storage system
JP2010170475A (ja) * 2009-01-26 2010-08-05 Nec Corp ストレージシステム、ストレージシステムにおけるデータ書込方法及びデータ書込プログラム
WO2010109568A1 (ja) * 2009-03-24 2010-09-30 日本電気株式会社 ストレージ装置
JP2010224845A (ja) * 2009-03-24 2010-10-07 Nec Corp ストレージ装置
US8725969B2 (en) 2009-03-24 2014-05-13 Nec Corporation Distributed content storage system supporting different redundancy degrees
JP2012003621A (ja) * 2010-06-18 2012-01-05 Nec System Technologies Ltd ディスクアレイ装置間のリモートコピー処理システム、処理方法、及び処理用プログラム
JP2018049652A (ja) * 2013-03-15 2018-03-29 アマゾン・テクノロジーズ・インコーポレーテッド ログレコード管理
US10180951B2 (en) 2013-03-15 2019-01-15 Amazon Technologies, Inc. Place snapshots
US9672237B2 (en) 2013-03-15 2017-06-06 Amazon Technologies, Inc. System-wide checkpoint avoidance for distributed database systems
US11500852B2 (en) 2013-03-15 2022-11-15 Amazon Technologies, Inc. Database system with database engine and separate distributed storage service
US11030055B2 (en) 2013-03-15 2021-06-08 Amazon Technologies, Inc. Fast crash recovery for distributed database systems
US10698881B2 (en) 2013-03-15 2020-06-30 Amazon Technologies, Inc. Database system with database engine and separate distributed storage service
US10331655B2 (en) 2013-03-15 2019-06-25 Amazon Technologies, Inc. System-wide checkpoint avoidance for distributed database systems
JP2016511495A (ja) * 2013-03-15 2016-04-14 アマゾン・テクノロジーズ・インコーポレーテッド ログレコード管理
US10031813B2 (en) 2013-03-15 2018-07-24 Amazon Technologies, Inc. Log record management
US10747746B2 (en) 2013-04-30 2020-08-18 Amazon Technologies, Inc. Efficient read replicas
US9760596B2 (en) 2013-05-13 2017-09-12 Amazon Technologies, Inc. Transaction ordering
US10872076B2 (en) 2013-05-13 2020-12-22 Amazon Technologies, Inc. Transaction ordering
US10474547B2 (en) 2013-05-15 2019-11-12 Amazon Technologies, Inc. Managing contingency capacity of pooled resources in multiple availability zones
US10303564B1 (en) 2013-05-23 2019-05-28 Amazon Technologies, Inc. Reduced transaction I/O for log-structured storage systems
US9817710B2 (en) 2013-05-28 2017-11-14 Amazon Technologies, Inc. Self-describing data blocks stored with atomic write
US11120152B2 (en) 2013-09-20 2021-09-14 Amazon Technologies, Inc. Dynamic quorum membership changes
US10437721B2 (en) 2013-09-20 2019-10-08 Amazon Technologies, Inc. Efficient garbage collection for a log-structured data store
US10216949B1 (en) 2013-09-20 2019-02-26 Amazon Technologies, Inc. Dynamic quorum membership changes
US10223184B1 (en) 2013-09-25 2019-03-05 Amazon Technologies, Inc. Individual write quorums for a log-structured distributed storage system
US9699017B1 (en) 2013-09-25 2017-07-04 Amazon Technologies, Inc. Dynamic utilization of bandwidth for a quorum-based distributed storage system
US9880933B1 (en) 2013-11-20 2018-01-30 Amazon Technologies, Inc. Distributed in-memory buffer cache system using buffer cache nodes
US10198356B2 (en) 2013-11-20 2019-02-05 Amazon Technologies, Inc. Distributed cache nodes to send redo log records and receive acknowledgments to satisfy a write quorum requirement
US10534768B2 (en) 2013-12-02 2020-01-14 Amazon Technologies, Inc. Optimized log storage for asynchronous log updates
JP2017079053A (ja) * 2015-08-24 2017-04-27 エイチジーエスティーネザーランドビーブイ ストレージジャーナリングを改善する方法およびシステム
US11914571B1 (en) 2017-11-22 2024-02-27 Amazon Technologies, Inc. Optimistic concurrency for a multi-writer database
US11341163B1 (en) 2020-03-30 2022-05-24 Amazon Technologies, Inc. Multi-level replication filtering for a distributed database

Also Published As

Publication number Publication date
US20070180000A1 (en) 2007-08-02

Similar Documents

Publication Publication Date Title
JP2007200182A (ja) ストレージ装置、及びストレージシステム
US10241873B2 (en) Headstart restore of first volume to a second volume
US8977826B1 (en) Extent commands in replication
JP4142438B2 (ja) 1次およびバックアップシステムの間のデータのリストア
JP5133260B2 (ja) 連続バックアップ方法
JP4550541B2 (ja) ストレージシステム
JP4839091B2 (ja) データベース回復方法及び計算機システム
US6742138B1 (en) Data recovery method and apparatus
JP4267421B2 (ja) リモートサイト及び/又はローカルサイトのストレージシステム及びリモートサイトストレージシステムのファイル参照方法
US20140208012A1 (en) Virtual disk replication using log files
US6701455B1 (en) Remote copy system with data integrity
EP2948849B1 (en) System and method for replicating data
JP2004258944A (ja) ストレージ装置およびその管理方法
JP2005301497A (ja) ストレージ管理装置、リストア方法及びそのプログラム
JP2004038938A (ja) 一次データボリューム上のデータを復元する方法およびシステム
JP2013531840A (ja) バックアップ・プロセスを処理する方法、システム、及びコンピュータ・プログラム
JPH096546A (ja) ディスク制御システム
JP2007323507A (ja) 記憶システム並びにこれを用いたデータの処理方法
CN108604201B (zh) 一种快照回滚方法、装置、存储控制器和***
JP2008033527A (ja) ストレージ装置、ディスク装置及びデータ復元方法
US8151069B1 (en) Multiprotection for snapsnots
US20110264875A1 (en) Storage system and data storage method using storage system
JP2003223350A (ja) データベースシステム
JP4394467B2 (ja) ストレージシステム、サーバ装置及び先行コピーデータ生成方法
US7536507B1 (en) Methods, systems, and computer program products for preserving atomic writes using leaves and bitmaps

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20081215