JP2005276094A - 分散ストレージ装置のファイル管理方法及び分散ストレージシステム並びにプログラム - Google Patents
分散ストレージ装置のファイル管理方法及び分散ストレージシステム並びにプログラム Download PDFInfo
- Publication number
- JP2005276094A JP2005276094A JP2004092060A JP2004092060A JP2005276094A JP 2005276094 A JP2005276094 A JP 2005276094A JP 2004092060 A JP2004092060 A JP 2004092060A JP 2004092060 A JP2004092060 A JP 2004092060A JP 2005276094 A JP2005276094 A JP 2005276094A
- Authority
- JP
- Japan
- Prior art keywords
- file
- group
- storage device
- storage
- file management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000010076 replication Effects 0.000 claims abstract description 87
- 230000008569 process Effects 0.000 claims description 23
- 238000012546 transfer Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 238000007726 management method Methods 0.000 claims 27
- 230000005012 migration Effects 0.000 description 13
- 238000013508 migration Methods 0.000 description 13
- 230000001360 synchronised effect Effects 0.000 description 11
- 230000004044 response Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000011084 recovery Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 241001092360 Vahlia Species 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
- G06F16/184—Distributed file systems implemented as replicated file system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【課題】レプリケーションを有効に利用して、ロケーションデータベースへの問い合わせを低減させてデータのアクセスを迅速に行う。
【解決手段】分散配置された複数のストレージ装置#0〜3を複数のグループA、Bに割り当てて、各グループに属するストレージ装置の全てのファイルの所在を示すファイル管理データベース24を、同一グループのストレージ装置間で同期を取り、グループにファイルのアクセスがあったときには、ファイル管理データベース24に基づいてファイルが格納されているストレージ装置を決定し、アクセスを行い、アクセス要求が更新のときには、ファイルの書き込みを行い、グループが異なるストレージ装置に対して書き込んだファイルのレプリカを転送する。
【選択図】図2
【解決手段】分散配置された複数のストレージ装置#0〜3を複数のグループA、Bに割り当てて、各グループに属するストレージ装置の全てのファイルの所在を示すファイル管理データベース24を、同一グループのストレージ装置間で同期を取り、グループにファイルのアクセスがあったときには、ファイル管理データベース24に基づいてファイルが格納されているストレージ装置を決定し、アクセスを行い、アクセス要求が更新のときには、ファイルの書き込みを行い、グループが異なるストレージ装置に対して書き込んだファイルのレプリカを転送する。
【選択図】図2
Description
本発明は、ネットワークを介して記憶装置を分散して配置し、各記憶装置に格納されたファイルを相互にレプリケーションを行う分散ストレージシステムの改良に関する。
クライアント/サーバ型の分散ストレージシステム(または装置)としては、Andrew File System(以下、AFSという)が知られている(非特許文献1)。
これは、各ファイルにロケーションフィールドを備えた識別子を付加し、このファイルの位置をロケーションフィールドの情報により取得して、目的とするファイルにアクセスするものである。このため、ロケーションフィールドを管理するロケーションデータベースを任意のネットワーク上に設置しておき、クライアントはファイルにアクセスする際に、まず、識別子に含まれたロケーションフィールドについてロケーションデータベースへ問い合わせを行い、ロケーションデータベースが回答した位置に対してアクセスを行っている。
そして、一回アクセスされたファイルは、ストレージ装置やキャッシュサーバなどにキャッシュされ、次回からのアクセス速度を向上させている。
「最前線UNIXのカーネル」 ユーレッシュ・ヴァハリア著、徳田英幸、中村明、戸部義人、津田悦幸 訳、株式会社ピアソン・エデュケーション、2000年5月15日発行、第371頁〜378頁、(原著 UNIX Internals:The New Frontiers by Uresh Vahalia pubkished by Prentice Hall,Inc. 1996)
「最前線UNIXのカーネル」 ユーレッシュ・ヴァハリア著、徳田英幸、中村明、戸部義人、津田悦幸 訳、株式会社ピアソン・エデュケーション、2000年5月15日発行、第371頁〜378頁、(原著 UNIX Internals:The New Frontiers by Uresh Vahalia pubkished by Prentice Hall,Inc. 1996)
しかしながら、上記従来例では、ローカルのストレージ装置にファイルがある場合には、迅速にファイルの読み書きを行うことができるが、ローカルのストレージ装置にファイルがない場合には、ロケーションデータベースへ問い合わせを行い必要があり、ロケーションデータベースからの回答を待って、目的のストレージ装置にリモートアクセスするため、このリモートアクセスを迅速に行うことができないという問題があった。
また、リモートアクセスによりキャッシュへアクセスする場合には、データの整合性を確保するために排他制御を必要としているため、可用性が低下するという問題がある。例えば同一のファイルに対して複数の書き込み要求があったときには、最先のクライアントの書き込み要求を受け付けて、後の書き込み要求を拒否することになる。
さらに、各ストレージ装置のバックアップを取る際には、基準となるストレージ装置のオリジナルのデータを、リモートにある他のストレージ装置に複写するレプリケーションを行うが、ロケーションデータベースに問い合わせを行うと、必ずオリジナルのデータが格納されたストレージ装置を指示されるため、至近のストレージ装置にレプリケーションがあったとしても利用することができない、という問題があった。
そこで本発明は、上記問題点に鑑みてなされたもので、レプリケーションを有効に利用して、ロケーションデータベースへの問い合わせを低減させてデータのアクセスを迅速に行うことを目的とする。
本発明は、分散配置された複数のストレージ装置を複数のグループに割り当てて、前記グループに属するストレージ装置の全てのファイルの所在を示すファイル管理情報を、同一グループのストレージ装置間で同期を取り、前記グループにファイルのアクセスがあったときには、ファイル管理情報に基づいてファイルが格納されているストレージ装置を決定し、アクセスを行う。
また、アクセス要求が更新のときには、ファイルの書き込みを行い、グループが異なるストレージ装置に対して書き込んだファイルのレプリカを転送する。
したがって、本発明は、グループ内のファイル管理情報を同期させることにより、分散レプリケーションシステムに対するアクセス要求が、いずれのストレージ装置に対して行われても処理することが可能となり、特定の装置にアクセスが集中するのを防ぐことができる。
加えて、各グループのストレージ装置は、同一のファイル管理情報を同期して持つため、いずれかのストレージ装置に障害が発生しても、同じグループ内のストレージ装置のファイル管理情報を用いることで、容易かつ迅速に復旧することが可能となり、分散レプリケーションシステムの信頼性を向上させることができる。
そして、各グループには他のグループのレプリカも格納し、アクセス要求に対して提供することができるので、アクセス要求が多数のグループへ発行されるのを抑制でき、アクセス速度の向上を図ることができる。
また、レプリカを他のグループへ格納することで、耐障害性を向上させることができ、分散レプリケーションシステムの信頼性を向上させることができる。
以下、本発明の一実施形態を添付図面に基づいて説明する。
図1は、本発明を適用する分散ストレージシステム(分散レプリケーションシステム)の構成図である。図1では、多数のストレージ装置♯0〜♯5とグループ管理サーバ(またはNISサーバ)1がネットワーク10を介して接続され、分散レプリケーションシステムを構築した例を示している。なお、ネットワーク10はインターネット、WANあるいはLANなどを示す。
ストレージ装置♯0は、データとしてのファイル23を格納するディスク21と、ディスク21に格納されるファイル及び同一のグループのストレージ装置に格納されたファイルの位置を管理するファイル管理データベース24を格納するディスク22を備え、これらディスク21、22はサーバ2によって制御される。
そして、サーバ2は、クライアントコンピュータ(図示省略)や他のサーバまたはストレージ装置からの参照要求や更新要求に応じて、ディスク21のファイル23に対して参照または更新を行う。
他のストレージ装置#1〜#5も同様に構成され、ストレージ装置#1は、サーバ3がディスク31、32内のファイル33、ファイル管理データベース34を制御し、ストレージ装置#2は、サーバ4がディスク41、42内のファイル43、ファイル管理データベース44を制御し、ストレージ装置#3は、サーバ5がディスク51、52内のファイル53、ファイル管理データベース54を制御する。なお、ストレージ装置#4、#5も同様の構成であるので、詳細については省略した。なお、サーバ2〜5は、それぞれ図示しないCPUやメモリ及びインターフェースを備えるものである。
グループ管理サーバ1は、CPU、メモリ及びインターフェース等から構成される制御部11とディスク12を有し、ディスク12には各ストレージ装置#0〜#5を複数のグループ単位で管理するグループ管理データベース13が格納されている。
グループ管理サーバ1は、多数のストレージ装置#0〜#5を、予め設定した複数のグループ単位で管理するもので、図2に示すように、グループ名毎にストレージ装置の識別子(番号)を対応付けたグループ管理データベース13によって、予め設定したグループにストレージ装置をそれぞれ割り当てる。
図1では、ストレージ装置#0、#1がグループAに割り当てられ、ストレージ装置#2、#3がグループBに、ストレージ装置#4、#5がグループCに割り当てられた場合を示す。
これら各グループ内では、物理的に異なるストレージ装置間で、全てのデータ(ファイル)の位置(ディレクトリパスなど)についてファイル管理データベース24、34、44、54によりデータの位置を同期している。
そして、各グループ間では、他のグループへレプリケーションを転送し、転送されたレプリケーションの位置も、ファイル管理データベース24〜54により保持されるとともに、グループ内で同期が行われる。このレプリケーション先は、各ストレージ装置毎に予め設定したり、あるいはグループ管理サーバ1で予め設定しておく。
例えば、図2において、グループAのストレージ装置#0、#1は、グループBのストレージ装置#2へレプリケーションを行う。そして、グループAのファイルの複製は、グループB内のファイル管理データベース44、54にも記載されるので、ファイルの参照要求に対してオリジナルのファイルに加えてレプリケーションも利用することができるので、ファイルのアクセスに要する時間短縮して、アクセスの高速化を図ることができる。
以下、図2を参照しながらグループAとグループBで行われる、データの位置(以下、ファイルの位置とする)の共有と、レプリケーションの生成及び転送について詳述する。
まず、グループ管理サーバ1は、グループの設定と、各グループに所属するストレージ装置及び順位を管理するグループ管理データベース13を備える。
グループ管理データベース13には、管理者などにより予め設定されたグループが格納されており、各グループ毎に所属するストレージ装置が格納されている。図2において、グループAには、ストレージ装置#0、#1の順で所属し、グループBにはストレージ装置#2、#3の順で所属している。グループ管理データベース13が格納するストレージ装置の識別子としては、例えば、図5に示すように、ストレージ装置のIPアドレスを所定の順序で格納する。なお、IPアドレスに代わってMACアドレスなど、ネットワーク上で一意に定まる識別子であればよい。
各グループの先頭に記載されたストレージ装置は、グループの代表となるストレージ装置を示しており、後述するように、グループ管理データベース13は、参照要求や更新要求の問い合わせがあると、先頭のグループに格納された先頭のストレージ装置に対して問い合わせを行うように応答する。
図2において、各ストレージ装置#0〜#3では、それぞれファイル管理データベース24、34、44、54がサーバ2〜5上で稼動しており、同一グループのストレージ装置のファイル管理データベースが相互に同期し、同一グループ内のファイル管理データベースの内容は等しい内容を保持する。すなわち、同一グループ内ではファイル管理データベースを共有することとなる。
例えば、ストレージ装置#0、#1で構成されるグループAでは、ストレージ装置#0のファイル管理データベース24と34は同一の内容となっており、ストレージ装置#0のディスク21のファイル23に変更があると、ファイル管理データベース24を更新するとともに、同一グループ内の他のストレージ装置#1のファイル管理データベースと34にも同一の情報を更新して、相互に同期を取る。
また、図2で示すように、グループAについて見るとストレージ装置#0のディスク21にファイル「AAA」と「BBB」が格納され、ストレージ装置#1のディスク31にファイル「CCC」、「DDD」が格納されている場合、グループA内のファイル管理データベース24、34は、ファイル名「AAA」に対応したストレージ装置の番号「#0」がファイルの識別子として設定される。同様に、ファイル名「BBB」に対応するストレージ装置の番号「#0」と、ファイル名「CCC」に対応するストレージ装置の番号「#1」及びファイル名「DDD」に対応するストレージ装置の番号「#1」がそれぞれ設定される。
そして、ファイル管理データベース24、34は同一の内容となるよう、グループA内のファイルに変化があると同期を取る。したがって、ストレージ装置#0、#1が格納しているファイル23、33はそれぞれ異なるが、ファイル管理データベース24、34は、グループA内の全てのファイル名についてストレージ装置の情報(位置を示す識別子)を保持している。このファイルの位置を示す識別子としては、図4で示すようにファイル名とIPアドレスを対応付けて1レコードとし、ファイルが格納されている位置を示す。
グループBのストレージ装置#2、#3のファイル管理データベース44、54も同様であり、ストレージ装置#3に格納されたファイル「EEE」、「FFF」の位置情報を等しく保持している。
このため、ファイルを検索する際には、同一のグループ内であれば、どのストレージ装置に問い合わせを行っても同じ応答となる。ただし、クライアントコンピュータや他のグループ等からアクセスを受け付ける際に、同一グループ内のどのストレージ装置に問い合わせを行えばよいのかを設定しておく必要があるため、グループ管理データベース13の各グループの先頭に記載されたストレージ装置を、そのグループの代表となるストレージ装置としておき、代表ストレージ装置がダウンした場合には、これに替わってグループ管理データベース13に記載されている次のストレージ装置へアクセスを行う。
ここで、グループとストレージ装置の登録について図6を参照しながら説明する。
図6は、グループ管理サーバ1の図示しないコンソールにおける表示のイメージを示している。
まず、所定の操作を行って、ストレージ装置を登録するグループ名を入力する画面S101を呼び出す。画面上のグループ入力欄131に所望のグループ名を入力する。
次に、ストレージ装置の識別子を登録する画面(S102)に移行して、識別子入力欄132に、ストレージ装置の識別子(ここでは、IPアドレス)を入力する。最後に、識別子入力欄131にリターンを入力して処理を終了する(S103)。
同一のグループに複数のストレージ装置を登録する場合には、上記S102でIPアドレスを複数回入力する。
上記操作によりグループ管理データベース13のグループに対してストレージ装置を割り当てることができる。
<ファイルの更新>
次に、図3を参照しながらファイルの更新要求があったときの各ストレージ装置の動作について説明する。なお、図3は、データの流れを示す説明図である。
次に、図3を参照しながらファイルの更新要求があったときの各ストレージ装置の動作について説明する。なお、図3は、データの流れを示す説明図である。
図3では、グループAのストレージ装置#0に対して、ファイル名「GGG」のファイルが追加された場合を示す。
ストレージ装置#0は、図示しないクライアントコンピュータ等からファイル名「GGG」のファイルの更新要求を受け付けて、ディスク21にファイルGGGを書き込む(S1)。
ストレージ装置#0のファイル管理データベース24は、ファイルGGGが追加されたことから、ファイル名「GGG」のレコードを作成し、対応するストレージ装置番号に#0を書き込んで、ファイルGGGを登録する(S2)。なお、ファイルGGGはオリジナルのファイルであるため、図示はしないが、ファイル管理データベース24にオリジナルであることを示す情報を付加しても良い。
新たなファイルGGGの登録を行ったファイル管理データベース24は、同一グループ内の他のストレージ装置(#1)に対してファイル管理データベースに変更があったことを通知し、変更の内容(ファイル名とストレージ装置番号)を送信し、グループ内でファイル管理データベースの同期を行う(S3)。これにより、グループA内の全てのファイル管理データベース24、34が同一の内容となる。
次に、ストレージ装置#0は、ファイルの追加があったことから、予め設定した転送先(ここではストレージ装置#2)へレプリケーションを転送する(S4)。
レプリケーションを受信したストレージ装置#2は、自分のディスク41にファイルGGGを追加する(S5)。
ストレージ装置#2のファイル管理データベース44は、ファイルGGGが追加されたことから、ファイル名「GGG」のレコードを作成し、対応するストレージ装置番号に自分の装置番号#2を書き込んで、ファイルGGGを登録する(S6)。新たなファイルGGGの登録を行ったファイル管理データベース44は、同一グループB内の他のストレージ装置(#3)に対してファイル管理データベースに変更があったことを通知し、変更の内容(ファイル名とストレージ装置番号)を送信し、グループ内でファイル管理データベースの同期を行う(S7)。これにより、グループB内の全てのファイル管理データベース44、54が同一の内容となる。
ここで、レプリケーションを受信したグループBのストレージ装置#2は、レプリケーションをオリジナルと同様にファイル管理データベース24へ登録することにより、分散レプリケーションシステムに対する参照要求のアクセス速度を向上させることができる。つまり、グループ管理サーバ1は、アクセス要求に対してグループ管理データベース13のグループを順次提供するため、レプリケーションの保存先でも参照を可能にすることで、アクセス回数(問い合わせ回数)を削減することができる。
ただし、レプリケーションの保存先では、このレプリケーションに対して更新を行わないようにするため、ファイル管理データベースにレプリケーションを示すフラグまたはオリジナルかレプリカのいずれかであるかを示す情報を付加しておき、ファイルの更新についてはオリジナルのファイルに行う必要がある。
<アクセス要求>
次に、分散レプリケーションシステムに対するアクセス要求に対する手順について、図7のフローチャートを参照しながら説明する。
次に、分散レプリケーションシステムに対するアクセス要求に対する手順について、図7のフローチャートを参照しながら説明する。
図1のネットワーク10に接続されたクライアントコンピュータ等がファイルを検索する場合、まず、最初にグループ管理サーバ1に問い合わせを行うと、グループ管理サーバ1は最初のグループの代表となるストレージ装置の位置(アドレス)を応答する。
クライアントコンピュータの要求を受けた代表ストレージ装置は、S11において、ファイル管理データベースを検索し、自装置内に要求されたファイルがあれば、S13へ進んでディスクにアクセスを行う。
一方、自装置にない場合は、S12へ進んでファイル管理データベースを検索して自グループ内にあれば、クライアントコンピュータに該当するストレージ装置の識別子を通知する。この通知を受けたクライアントコンピュータは該当するストレージ装置にアクセスし、S13にて要求したファイルに対してアクセスする。
S12において自グループにない場合には、S14へ進み、クライアントコンピュータはグループ管理サーバ1のグループ管理データベース13に、次のグループと代表となるストレージ装置を問い合わせる。
そして、S15で該当するストレージ装置に問い合わせを行い、S16で応答があればS17へ進み、上記S11、S12と同様に選択したグループの代表装置のファイル管理データベースに要求したファイルがあるか否かを判定する。選択したグループにファイルがあれば、S13で該当ストレージ装置に対してアクセスを行う。
一方、上記S16で応答がない場合には、該当するグループの代表となるストレージ装置に障害が発生している可能性が高いので、グループ管理サーバ1に再度問い合わせて、該当するグループの他のストレージ装置を確認する。他のストレージ装置があれば、S15へ戻って問い合わせを行う。
また、上記S17で選択したグループに要求したファイルが存在しない場合には、S14に戻り、グループ管理サーバ1に対して次のグループ及び代表となるストレージ装置を要求する。
以上の手順で、グループ管理サーバ1のグループ管理データベース13に設定されたグループの代表となるストレージ装置を順次検索し、目的とするファイルを検索し、アクセスを行う。
例えば、図示しないクライアントコンピュータがファイル「EEE」にアクセスする場合、グループ管理サーバ1のグループ管理データベース13から、グループAのストレージ装置#0にアクセスする。図2で示したように、ストレージ装置#0のファイル管理データベース24にはグループA内にファイル名「EEE」は存在しないので、クライアントコンピュータは次のグループをグループ管理サーバ1に要求する。
グループ管理サーバ1は、グループ管理データベース13に設定された第2のグループであるグループBの代表となるストレージ装置#2を返す。クライアントコンピュータはストレージ装置#2にファイル名「EEE」の位置を問い合わせると、ファイル管理データベース44は、ストレージ装置#3に存在することを伝える。こうして、クライアントコンピュータは、各グループの代表となるストレージ装置に対して順次問い合わせることで、ファイルの位置を検索するのである。ただし、一度アクセスを行えば、前記従来例と同様にストレージ装置のキャッシュやキャッシュサーバ(図示省略)などにキャッシュされ、次回からのアクセス速度を向上させている。
<ストレージ装置の追加>
次に、図8を参照しながら、グループに新たなストレージ装置を追加する場合について説明する。図8はグループAにストレージ装置#4を追加する一例を示す。
次に、図8を参照しながら、グループに新たなストレージ装置を追加する場合について説明する。図8はグループAにストレージ装置#4を追加する一例を示す。
ストレージ装置#4は、上記ストレージ装置と同様にサーバとディスク61、ファイル管理データベース64を備え、このストレージ装置#4をネットワーク10に接続する。
ファイル管理データベース64に対して、グループAの他のストレージ装置のファイル管理データベース(ここでは、#1のファイル管理データベース34)と同期を取るよう指令する(S21)。なお、この指令は管理者などにより、グループ管理サーバ1やストレージ装置#4等で行われる。
新たに追加するストレージ装置#4は、同一グループ内の他のファイル管理データベース34からファイル名とストレージ装置番号を読み込んで、ファイル管理データベース64に登録する(S22)。
次に、管理者などの操作により上記図6で示した手順で、グループ管理サーバ1のグループ管理データベース13にストレージ装置#4をグループAに登録する(S23)。
グループ管理データベース13は、テーブルが更新されたことから、各グループに対して、ストレージ装置#4がグループAに登録されたことをブロードキャストする(S24)。これにより、各ストレージ装置は、ストレージ装置#4を認識することができる。
新たにストレージ装置を通知する場合では、まず、ファイル管理データベースを所属するグループのファイル管理データベースに一致させておき、その後、グループ管理データベース13へ登録し、同期及び登録が完了した後にブロードキャストを行うことで、新たに加わったストレージ装置にアクセスが発生しても要求に応えることが可能となる。
次に、図9を参照しながら、グループからストレージ装置を削除する場合について説明する。図9はグループBからストレージ装置#3を削除する一例を示す。
ストレージ装置#3を削除する場合には、まず、S31で、グループ管理データベース13のグループBからストレージ装置#3を削除する。以降、グループBに対してアクセス要求があっても、グループ管理サーバ1がストレージ装置#3を通知するのを防止できる。
次に、グループ管理データベース13は、グループBからストレージ装置#3を削除したことを各グループのストレージ装置へブロードキャストする。次に、ストレージ装置#3と同一グループ内のファイル管理データベースから、ストレージ装置#3が格納していたファイルの情報を削除する。この例では、グループBがストレージ装置#2、#3で構成されていたので、ストレージ装置#2のファイル管理データベース44からストレージ装置番号が#3のレコードを削除する(S33)。
次に、削除されるストレージ装置#3内のファイルを他のグループへコピーして待避させる(S34)。ここでは、グループAのストレージ装置#0にファイルEEEをコピーし、ストレージ装置#1にファイルFFFをコピーする例を示す。なお、このコピー先は、グループ管理サーバ1等から指令すればよい。
ストレージ装置#0は、グループBのストレージ装置#3からファイルEEEを読み込んで、自ディスク21へ書き込み、ストレージ装置#1は、グループBのストレージ装置#3からファイルFFFを読み込んで、自ディスク21へ書き込む。
ストレージ装置#0のファイル管理データベース24は、ファイルEEEが追加されたことから、ファイルEEEのレコードを追加し、ストレージ装置#1のファイル管理データベース34は、ファイルFFFが追加されたことから、ファイルFFFのレコードを追加する(S35)。
そして、グループAのファイル管理データベース24、34は互いに変更が生じたことから、相互に同期を取って変更のあったレコードを送信して、同一の内容に更新する(S36、S37)
以上のように、ストレージ装置を削除する場合には、まず、グループ管理サーバ1のグループ管理データベース13から、該当ストレージ装置を削除し、その後、ブロードキャストすることにより、アクセス要求に対して各装置が削除されるストレージ装置を指定するのを防止できる。そして、削除されるストレージ装置と同一グループ内のファイル管理データベースから、該当ストレージ装置のレコードを削除することで、このグループにアクセス要求が発生しても、削除されるストレージ装置を指定するのを防止できる。
以上のように、ストレージ装置を削除する場合には、まず、グループ管理サーバ1のグループ管理データベース13から、該当ストレージ装置を削除し、その後、ブロードキャストすることにより、アクセス要求に対して各装置が削除されるストレージ装置を指定するのを防止できる。そして、削除されるストレージ装置と同一グループ内のファイル管理データベースから、該当ストレージ装置のレコードを削除することで、このグループにアクセス要求が発生しても、削除されるストレージ装置を指定するのを防止できる。
さらに、削除されるストレージ装置のファイルを、異なるグループにコピーし、格納先のストレージ装置をオリジナルの格納位置としてそれぞれファイル管理データベースに登録することで、削除されるストレージ装置が取り外された後でも、分散レプリケーションシステム内で該当ファイルを保持し、アクセス要求に対して応答することができる。
次に、ストレージ装置をグループ間で移動する場合について図10を参照しながら説明する。
なお、削除されるストレージ装置のファイルのコピー先は同一グループ内の他ストレージ装置であっても良い。
<ストレージ装置の移動>
図10は、グループBに所属するストレージ装置#3をグループAに移動する例を示す。
図10は、グループBに所属するストレージ装置#3をグループAに移動する例を示す。
まず、最初に上記削除と同様にして、グループ管理データベース13のグループBから移動するストレージ装置#3を削除する(S41)。
そして、グループBに所属する全てのファイル管理データベースからストレージ装置#3が記載されたレコードを削除する。この例では、ストレージ装置#2のファイル管理データベース44について、ストレージ装置#3が保持しているファイルEEE、FFFのレコードを削除する。同時に、移動するストレージ装置#3のファイル管理データベース54からグループBのストレージ装置(自装置は除く)を含むレコードを削除する(S42)。これにより、移動元のグループBのファイル管理データベースからストレージ装置#3が消去され、移動するストレージ装置#3のファイル管理データベース54からグループBに関する情報が消去される。
次に、ストレージ装置#3の移動先となるグループAのファイル管理データベース24、34とファイル管理データベース54の同期を取る(S43)。ストレージ装置#3は、ファイルEEE、FFFを格納しているので、グループAのファイル管理データベース24、34にファイルEEE、FFFのレコードを追加するとともに、これらのファイルがストレージ装置#3に属するように設定する。同時にストレージ装置#3のファイル管理データベース54にグループAのファイル情報を追加する。すなわち、ストレージ装置#0のファイルAAA、BBBとストレージ装置#1のファイルCCC,DDDのレコードを追加する(S44)。
そして、同期が完了した後に、グループ管理データベース13でグループAにストレージ装置#3を追加し(S45)、その後、各ストレージ装置に対して、ストレージ装置#3がグループAへ移動したことをブロードキャストする(S46)。
図11は、上記ストレージ装置のグループ間で移動させる場合のグループ管理サーバ1で行われる処理の一例を示すフローチャートである。
まず、S141では、グループ管理データベース13から移動するストレージ装置の記録を削除する。次に、S142では、移動するストレージ装置を選択してからS143へ進んで、ファイル管理データベース(この場合ストレージ装置#3のファイル管理データベース54)から移動元のグループのストレージ装置に関するレコードを削除するよう指令する。その後、S144で、移動先のグループのファイル管理データベースと同期を取るように指令する。
同期が完了すると、S145で、ファイル管理データベースに移動先のファイルの情報を追加するように指令を行う。
次に、S146では、グループ管理データベース13に基づいて各ストレージ装置に対して順次アクセスして、移動元と移動先の環境を整えるため、グループ管理データベース13から移動するストレージ装置を除いて順次選択を行う。
S147では、選択したストレージ装置が移動元と同一のグループのストレージ装置であるか否かを判定し、同一グループであれば、S148に進んで、移動元に残るストレージ装置であるから、このファイル管理データベースから移動するストレージ装置の情報を削除する。
そして、S151へ進んで、全てのストレージ装置に検索が終了したか否かを判定し、終了した場合にはS152へ進み、終了していない場合には、グループ管理データベース13から次のストレージ装置を選択するためS146に戻る。
一方、上記S147で同一グループではないと判定された場合には、S149に進んで、移動先のグループに属するストレージ装置であるか否かを判定する。移動先のグループであればS150に進んで、このストレージ装置のファイル管理データベースに移動するストレージ装置が保有するファイルの情報を同期するよう指令するとともに、移動するストレージ装置の情報を登録させる。
そして、再びS151に進んで全てのストレージ装置についてアクセスが終了したかを判定する。なお、上記S149の判定で、移動先のグループではない場合にはS151に進む。
上記S146〜S151のループが終了すると、移動先と移動元のストレージ装置のファイル管理データベースが移動後の状態に更新される。
そして、S152では、グループ管理データベース13の移動先のグループに、移動するストレージ装置を追加し、次に、S153で全ストレージ装置に対して、ストレージ装置の移動があったことをブロードキャストして処理を終了する。
このように、ストレージ装置をグループ間で移動する際には、グループ管理データベース13から移動するストレージ装置を削除した後、移動元、移動先及び移動するストレージ装置の各ファイル管理データベースを更新または同期させ、この後に、グループ管理データベース13の新たなグループにストレージ装置を追加してからブロードキャストを行う。これにより、移動中に移動対象のストレージ装置にアクセスが生じるのを確実に防いで、円滑に移動を完了することができる。
<ストレージ装置の障害復旧>
図12は、ストレージ装置に障害が発生した後の復旧の手順を示す。この例では、グループBのストレージ装置#2に障害が発生し、新たな装置に交換した後に、データの復旧を行う一例を示しており、ストレージ装置#2はレプリケーションにより、ストレージ装置#0、#1に複製を転送しておいたものとする。なお、レプリケーションの情報はグループ管理サーバ1が保持するものとする。
図12は、ストレージ装置に障害が発生した後の復旧の手順を示す。この例では、グループBのストレージ装置#2に障害が発生し、新たな装置に交換した後に、データの復旧を行う一例を示しており、ストレージ装置#2はレプリケーションにより、ストレージ装置#0、#1に複製を転送しておいたものとする。なお、レプリケーションの情報はグループ管理サーバ1が保持するものとする。
まず、グループ管理データベース13は、新たなハードウェアに交換したストレージ装置#2に対し、ファイル管理データベース44を構築するように指令するとともに、各グループのストレージ装置の情報を提供する(S51)。この場合、ストレージ装置#2が所属するグループBのストレージ装置#2、#3の情報を提供する。
次に、ストレージ装置#2のファイル管理データベース44は、同じグループBのストレージ装置#3のファイル管理データベース54から、ファイルの情報を読み込んでファイル管理データベース44を復旧する(S52)
さらに、ストレージ装置#2は、グループ管理サーバ1からレプリケーションの情報を取得して、レプリケーション先のグループAのストレージ装置#0、#1から、障害発生前にストレージ装置#2が格納していたファイルAAAとCCCを読み込み、ディスク41に書き込む。
さらに、ストレージ装置#2は、グループ管理サーバ1からレプリケーションの情報を取得して、レプリケーション先のグループAのストレージ装置#0、#1から、障害発生前にストレージ装置#2が格納していたファイルAAAとCCCを読み込み、ディスク41に書き込む。
こうして、同一グループ内の他のストレージ装置#3のファイル管理データベース54から、ファイルの構成を復旧し、また、レプリケーション先の他のグループから複製を取得することで、容易かつ迅速にストレージ装置#3の復旧を行うことができ、対障害性の高いシステムを提供することができる。なお、復旧の期間中は、グループ管理サーバ1が復旧中のストレージ装置#3に対するアクセスを制限すればよい。あるいは、復旧の期間中は、ストレージ装置#2のサーバ4が、アクセス要求を制限してもよい。
以上のように、各ストレージ装置にファイル管理データベースを備え、グループ管理サーバ1のグループ管理データベース13により、ファイル管理データベースを同期するグループ単位で、グループ内のファイル管理データベースを同期させることにより、分散レプリケーションシステムに対するアクセス要求がグループ管理サーバ1に集中するのを防ぐことができる。
加えて、各グループのストレージ装置は、同一のファイル管理データベースを同期して持つため、いずれかのストレージ装置に障害が発生しても、同じグループ内のストレージ装置のファイル管理データベースを用いることで、容易かつ迅速に復旧することが可能となり、分散レプリケーションシステムの信頼性を向上させることができる。
そして、各グループには他のグループのレプリケーションも格納し、アクセス要求に対して提供することができるので、クライアントコンピュータなどからのアクセス要求が多数のグループへ発行されるのを抑制でき、アクセス速度の向上を図ることができる。
また、レプリケーションを他のグループへ格納することで、耐障害性を向上させることができ、分散レプリケーションシステムの信頼性を向上させることができる。
また、各グループ内では全てのストレージ装置のファイル管理データベースが同一であるため、アクセス要求は各グループに対していずれかひとつのストレージ装置(例えば、代表ストレージ装置)へ要求するだけでよいので、問い合わせの回数を低減し、ネットワークのトラフィックや管理サーバ1の負荷の低減を図ることができる。
図13は、上述したレプリケーションの情報をグループ管理サーバ1で制御する一例を示す。
グループ管理サーバ1は、各ストレージ装置のファイル管理データベースを同期させるグループ管理データベース13に加えて、各ストレージ装置のレプリケーション先を設定するレプリケーショングループ管理データベース130を備える。
上記したように、ファイル管理データベースを同期するグループA、Bを同期グループとすると、各同期グループのストレージ装置のレプリケーションを、他の同期グループのストレージ装置に転送する相手が同一とならないようにグループ化したものが、レプリケーショングループである。このレプリケーショングループを管理するレプリケーショングループ管理データベース130は、管理者などにより予め設定されたものである。
レプリケーショングループ管理データベース130は、レプリケーショングループ名とストレージ装置のリストから構成され、例えば、図示のように、レプリケーショングループA(図中Repli A)には、同期グループAのストレージ装置#0と、同期グループBのストレージ装置#2が所属し、レプリケーショングループBには、同期グループAのストレージ装置#0と、同期グループBのストレージ装置#2が所属する。
各ストレージ装置はレプリケーショングループ管理データベース130から、レプリケーション先を取得して複製を転送する。
例えば、ストレージ装置#0は、ディスク21のファイルが更新されると、レプリケーショングループAの定義に従って同期グループBのストレージ装置#2へレプリケーションを転送する。同様に、同期グループBのストレージ装置#2は同期グループAのストレージ装置#0へレプリケーションを行う。
一方、ストレージ装置#0と同一の同期グループAに属するストレージ装置#1は、ストレージ装置#0とは異なるレプリケーショングループBに属し、同期グループBのストレージ装置#3との間でレプリケーションを行う。
すなわち、レプリケーショングループを構成するストレージ装置が、同一の同期グループとならないようにレプリケーショングループを設定することで、各ストレージ装置のファイルの複製が、異なる同期グループに転送されて参照要求に対して提供することができるので、参照要求の際にはアクセスする同期グループの数(回数)を低減し、アクセス要求に対する応答を好意率良く行うことが可能となる。
また、レプリケーションは必ず他の同期グループに格納されるので、耐障害性を向上させることができ、特に、同一グループ内のストレージ装置のレプリケーション先を、他の同期グループで異なるストレージ装置とすることで、耐障害性をさらに高めることができる。
またレプリケーションの管理は、上述のように各ストレージ装置のファイル管理データベースで行うことができ、分散レプリケーションシステム全体のファイルの数が増えた場合であっても、管理に要する労力が増大するのを防ぐことができる
なお、上記においては、レプリケーショングループに2つのストレージ装置を設けた例を示したが、3つ以上のストレージ装置を設定してもよく、互いにレプリケーションを持つことで、耐障害性をさらに向上させることができる。
なお、上記においては、レプリケーショングループに2つのストレージ装置を設けた例を示したが、3つ以上のストレージ装置を設定してもよく、互いにレプリケーションを持つことで、耐障害性をさらに向上させることができる。
<変形例1>
図14は、各グループのストレージ装置に、グループ管理データベース13のサブセットを備えるようにしたものである。
図14は、各グループのストレージ装置に、グループ管理データベース13のサブセットを備えるようにしたものである。
グループA、Bの各ストレージ装置#0〜#3に備えるグループ管理データベースサブセット13A〜13Dは、自グループ内のストレージ装置リストについては同一であるが、他のグループのストレージ装置には代表するストレージ装置を一つ設定する。
例えば、グループAのストレージ装置#0では、グループ管理データベースサブセット13Aに、隣のグループBについてストレージ装置#2を代表ストレージ装置として設定し、同グループAのストレージ装置#1では、グループ管理データベースサブセット13Bに、隣のグループBについてストレージ装置#3を代表ストレージ装置として設定しておく。
ストレージ装置毎に異なる他のグループの代表ストレージ装置を設定しておくことで、他グループ等からのアクセスがあったときに、ストレージ装置毎に異なる他の代表ストレージ装置を応答することで、特定のストレージ装置にアクセスが集中して負荷が増大するのを防止でき、負荷の分散を図ることができる。
また、グループ管理サーバ1に障害が発生している場合でも、いずれかのストレージ装置に問い合わせることで、アクセス先を検索することができ、耐障害性を向上させることができる。
逆に、他のグループの代表ストレージ装置に障害が発生している場合では、アクセス要求を受けたストレージ装置がグループ管理サーバ1のグループ管理データベース13に問い合わせて、他のストレージ装置のアドレスを応答することができる。
なお、図示はしないが、各ストレージ装置がグループ管理データベース13を持ち、各グループ間及びグループ内で同期を取るようにしても良い。この場合、グループ管理データベース13は不要となり、分散レプリケーションシステムの構成を簡易にすることができる。
<変形例2>
図15は、各グループ間のレプリケーションを上記ファイル単位のレプリケーションに代えてボリューム単位のレプリケーションとしたものである。
図15は、各グループ間のレプリケーションを上記ファイル単位のレプリケーションに代えてボリューム単位のレプリケーションとしたものである。
この例では、グループAのストレージ装置#0がグループXのストレージ装置#5へボリュームベースレプリケーションを行うように設定されている。なお、ストレージ装置#5は、上記図1に示した他のストレージ装置と同様に、サーバ(図示省略)、ディスク71、ファイル管理データベース74を備える。
ストレージ装置#0に更新要求があると、ストレージ装置#0は自ディスク21にファイルGGGを書き込む(S61)
ストレージ装置#0では、ファイル管理データベース24にファイルGGGの名称と、格納したストレージ装置の識別子を登録する(S62)。
ストレージ装置#0では、ファイル管理データベース24にファイルGGGの名称と、格納したストレージ装置の識別子を登録する(S62)。
次に、ストレージ装置#0は、ディスク21の内容をストレージ装置#5のディスク71に転送し、ボリュームベースレプリケーションを実行する(S63)。
次に、ストレージ装置#0は、サーバ2からストレージ装置#5のサーバに対して変更のあったファイルを通知する(S64)。
次に、ストレージ装置#5のサーバは、この通知に基づいて、ファイル管理データベース74に更新のあったファイルGGGを登録する(S65)。
こうして、ストレージ装置#0でファイルの更新があると、ディスク21からディスク71にボリュームベースレプリケーションを実行し、ファイル管理データベース24を更新した後に、ストレージ装置#0のサーバ2がストレージ装置#5のサーバへファイル情報を通知することで、ストレージ装置#5のファイル管理データベース74を更新することができる。
このように、ボリュームベースレプリケーションの場合では、ファイル情報を別途通知することで、レプリケーションを格納するストレージ装置#5のファイル管理データベースを更新することができる。
<変形例3>
図16は、上記変形例2のファイルの通知をディスクから行うようにしたもので、その他は前記変形例2と同様である。
図16は、上記変形例2のファイルの通知をディスクから行うようにしたもので、その他は前記変形例2と同様である。
この場合では、ストレージ装置のサーバとディスクの間に、新たなインターフェースを設けて、ディスク間のボリュームベースレプリケーションが完了すると、ディスク71がサーバ側に変更の通知を行うものである。
ストレージ装置#0に更新要求があると、上記変形例2のS61〜S63と同様に、ストレージ装置#0が自ディスク21にファイルGGGを書き込んだ後、ファイル管理データベース24を更新し、ストレージ装置#0は、ディスク21の内容をストレージ装置#5のディスク71に転送し、ボリュームベースレプリケーションを実行する(S71〜S73)。
次に、ストレージ装置#5のディスク71は、サーバへ変更のあったファイルを通知する(S74)。サーバはこの通知に基づいて、ファイル管理データベース74に更新のあったファイルGGGを登録する(S75)
<変形例4>
上記実施形態では、ストレージ装置をサーバとディスクから構成する例について説明したが、サーバ2〜5をコントローラに置き換え、NAS(Network Attached Storage)としてもよい。
<変形例4>
上記実施形態では、ストレージ装置をサーバとディスクから構成する例について説明したが、サーバ2〜5をコントローラに置き換え、NAS(Network Attached Storage)としてもよい。
あるいは、ストレージ装置内にNASとSAN(Storage Area Network)が内包されていても良い。
以上のように、本発明に係る分散レプリケーションシステムでは、ストレージ装置をグループに分けて、グループ単位でファイルの所在を記述したファイル管理データベースを同期させておくので、アクセス要求に対して少ない問い合わせ回数で応答することができ、また、耐障害性も向上するので、高速かつ信頼性の高いサイトやサービスに適用することができる。
1 グループ管理サーバ
2〜5 サーバ
13 グループ管理データベース
24、34、44、54 ファイル管理データベース
♯0、♯1、♯2、#3 ストレージ装置
2〜5 サーバ
13 グループ管理データベース
24、34、44、54 ファイル管理データベース
♯0、♯1、♯2、#3 ストレージ装置
Claims (16)
- 分散配置された複数のストレージ装置に格納されるファイルの管理方法であって、
前記ストレージ装置を複数のグループに割り当てる処理と、
前記グループに属するストレージ装置の全てのファイルの所在を示すファイル管理情報を、同一グループのストレージ装置間で同期を取る処理と、
前記グループにファイルのアクセスがあったときには、前記ファイル管理情報に基づいてストレージ装置を決定する処理と、
を含むことを特徴とする分散ストレージ装置のファイル管理方法。 - 前記ファイル管理情報は、自グループのストレージ装置に格納された全てのファイルの所在を含み、
前記グループにファイルのアクセスがあったときには、自グループの前記ファイル管理情報に基づいてストレージ装置を検索する処理と、
自グループ内にアクセス対象のファイルがないときには、他のグループに前記ファイルの問い合わせを行う処理と、
を含むことを特徴とする請求項1に記載の分散ストレージ装置のファイル管理方法。 - 前記ストレージ装置を複数のグループに割り当てる処理は、
前記ファイル管理情報を同期させるグループと、
前記グループが異なるストレージ装置間でレプリカを転送するレプリケーショングループと、を有し、
前記レプリケーショングループには、前記グループが異なるストレージ装置を割り当てることを特徴とする請求項1に記載の分散ストレージ装置のファイル管理方法。 - 前記ストレージ装置から他のグループへレプリカを転送する処理と、
前記転送されたレプリカをストレージ装置に格納する処理と、
前記格納したレプリカを前記他のグループのファイル管理情報に追加する処理と、
を含むことを特徴とする請求項1または請求項3に記載の分散ストレージ装置のファイル管理方法。 - 前記ファイル管理情報は、ファイルの所在を示す識別子と、前記ストレージ装置に格納されたファイルがオリジナルかレプリカのいずれであるかを示す情報を有し、
前記グループにファイルのアクセスがあったときには、当該アクセスが参照要求のときには、オリジナルまたはレプリカのいずれかのファイルの所在を通知し、当該アクセスが更新要求のときには、オリジナルのファイルの所在を通知することを特徴とする請求項4に記載の分散ストレージ装置のファイル管理方法。 - 前記ストレージ装置が所属するグループを変更するときには、前記ファイル管理情報から、変更前に属していたグループのファイルの所在に関する情報を削除した後、変更後のグループのファイルの所在に関する情報を前記ファイル管理情報に追加する処理と、
変更があったことを全グループに通知する処理と、
を含むことを特徴とする請求項1に記載の分散ストレージ装置のファイル管理方法。 - 前記ストレージ装置を障害から復旧する際には、同一グループ内の他のストレージ装置のファイル管理情報を取得する処理と、
前記他のグループに格納されたファイルを取得する処理と、
を含むことを特徴とする請求項3に記載の分散ストレージ装置のファイル管理方法。 - アクセス要求を受け付けるサーバと、ファイルを格納するディスク装置とから構成されたストレージ装置を複数分散配置した分散ストレージシステムにおいて、
前記ストレージ装置毎に設定されたグループを識別するグループ識別部と、
同一のグループ内のストレージ装置に格納されたファイルの所在を共有するファイル管理情報格納部と、
前記アクセス要求が更新要求のときには、要求のあったファイルを前記ディスク装置に書き込むとともに、ファイル管理情報格納部のファイルの情報を更新する情報更新部と、
前記ファイルのレプリカを他のグループのストレージ装置に転送するレプリケーション部とを備えたことを特徴とする分散ストレージシステム。 - 前記レプリケーション部は、ディスク装置間でボリューム単位のコピーを行い、
前記サーバはコピー先の他のグループのサーバに対してディスク装置間コピーが発生したことを通知することを特徴とする請求項8に記載の分散ストレージシステム。 - 前記レプリケーション部は、ディスク装置間でボリューム単位のコピーを行い、
前記コピー先のディスク装置が、コピー先のサーバに対して通知を行うインターフェースを備えたことを通知することを特徴とする請求項8に記載の分散ストレージシステム。 - アクセス要求を受け付ける制御部と、ファイルを格納するディスク装置とから構成されたNAS装置を複数分散配置した分散ストレージシステムにおいて、
前記NAS装置毎に設定されたグループを識別するグループ識別部と、
同一のグループ内のNAS装置に格納されたファイルの所在を共有するファイル管理情報格納部と、
前記アクセス要求が更新要求のときには、要求のあったファイルを前記ディスク装置に書き込むとともに、ファイル管理情報格納部のファイルの情報を更新する情報更新部と、
前記ファイルのレプリカを他のグループのNAS装置に転送するレプリケーション部とを備えたことを特徴とする分散ストレージシステム。 - 前記レプリケーション部は、ディスク装置間でボリューム単位のコピーを行い、
前記制御部はコピー先の他のグループの制御部に対してディスク装置間コピーが発生したことを通知することを特徴とする請求項11に記載の分散ストレージシステム。 - アクセス要求を受け付けて、要求されたファイルについて参照または更新を行うディスク装置を備えたストレージ装置において、
予め設定されたグループの情報を格納するグループ情報格納部と、
同一のグループ内のストレージ装置に格納されたファイルの所在を記憶するファイル管理情報格納部と、
前記ファイルを前記ディスク装置に書き込む際には、前記ファイル管理情報格納部のファイルの情報を更新する情報更新部と、
同一グループ内のストレージ装置に対してファイル管理情報格納部を同期させる同期部と、
前記ファイルのレプリカを予め設定された他のグループのストレージ装置に転送するレプリケーション部と、
を備えたことを特徴とするストレージ装置。 - ストレージ装置に格納されたファイルを管理するプログラムであって、
前記ストレージ装置を複数のグループに割り当てる手順と、
前記割り当てられたグループに属するストレージ装置の全てのファイルの所在を示すファイル管理情報を、同一グループの他のストレージ装置との間で同期を取る手順と、
前記ファイルのアクセス要求があったときには、前記ファイル管理情報に基づいてストレージ装置を決定する手順と、
をコンピュータに機能させることを特徴とするプログラム。 - 前記アクセス要求が更新のときには、ファイルの書き込みを行う手順と、
前記グループが異なるストレージ装置に対して前記書き込んだファイルのレプリカを転送する手順と、
を含むことを特徴とする請求項14に記載のプログラム。 - 前記グループが異なるストレージ装置から転送されたファイルのレプリカを書き込む処理と、
当該ファイルの情報を前記ファイル管理情報に追加する手順と、
を含むことを特徴とする請求項14に記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004092060A JP2005276094A (ja) | 2004-03-26 | 2004-03-26 | 分散ストレージ装置のファイル管理方法及び分散ストレージシステム並びにプログラム |
US10/903,006 US20050216523A1 (en) | 2004-03-26 | 2004-08-02 | File management method in a distributed storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004092060A JP2005276094A (ja) | 2004-03-26 | 2004-03-26 | 分散ストレージ装置のファイル管理方法及び分散ストレージシステム並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005276094A true JP2005276094A (ja) | 2005-10-06 |
Family
ID=34991412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004092060A Pending JP2005276094A (ja) | 2004-03-26 | 2004-03-26 | 分散ストレージ装置のファイル管理方法及び分散ストレージシステム並びにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20050216523A1 (ja) |
JP (1) | JP2005276094A (ja) |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008009814A (ja) * | 2006-06-30 | 2008-01-17 | Nec Corp | データレプリケーションシステム及びデータレプリケーション方法 |
JP2008097112A (ja) * | 2006-10-06 | 2008-04-24 | Toshiba Corp | ストレージシステム及び同システムに適用される論理ボリューム管理方法 |
JP2008123198A (ja) * | 2006-11-10 | 2008-05-29 | Toshiba Corp | キャッシュ一貫性保証機能を有するストレージクラスタシステム |
JP2008186141A (ja) * | 2007-01-29 | 2008-08-14 | Hitachi Ltd | データ管理方法、データ管理プログラム、データ管理システム、および、構成管理装置 |
JP2009159127A (ja) * | 2007-12-25 | 2009-07-16 | Murata Mach Ltd | 中継サーバ及び中継通信システム |
KR101150052B1 (ko) | 2007-12-28 | 2012-06-01 | 무라다기카이가부시끼가이샤 | 중계 서버 및 중계 통신 시스템 |
US8499083B2 (en) | 2006-03-29 | 2013-07-30 | Murata Kikai Kabushiki Kaisha | Relay device and communication system |
JP2016018384A (ja) * | 2014-07-08 | 2016-02-01 | 富士通株式会社 | ストレージ制御装置、ストレージシステム、及びプログラム |
JP2016024469A (ja) * | 2014-07-16 | 2016-02-08 | Necエンジニアリング株式会社 | データ管理システム、データ管理装置、プログラム及びデータ管理方法 |
JP2016511495A (ja) * | 2013-03-15 | 2016-04-14 | アマゾン・テクノロジーズ・インコーポレーテッド | ログレコード管理 |
US9672237B2 (en) | 2013-03-15 | 2017-06-06 | Amazon Technologies, Inc. | System-wide checkpoint avoidance for distributed database systems |
US9699017B1 (en) | 2013-09-25 | 2017-07-04 | Amazon Technologies, Inc. | Dynamic utilization of bandwidth for a quorum-based distributed storage system |
US9760596B2 (en) | 2013-05-13 | 2017-09-12 | Amazon Technologies, Inc. | Transaction ordering |
US9817710B2 (en) | 2013-05-28 | 2017-11-14 | Amazon Technologies, Inc. | Self-describing data blocks stored with atomic write |
US9880933B1 (en) | 2013-11-20 | 2018-01-30 | Amazon Technologies, Inc. | Distributed in-memory buffer cache system using buffer cache nodes |
JP2018128882A (ja) * | 2017-02-09 | 2018-08-16 | 三菱電機株式会社 | 遠方監視制御システム及び遠方監視制御方法 |
US10180951B2 (en) | 2013-03-15 | 2019-01-15 | Amazon Technologies, Inc. | Place snapshots |
US10216949B1 (en) | 2013-09-20 | 2019-02-26 | Amazon Technologies, Inc. | Dynamic quorum membership changes |
US10223184B1 (en) | 2013-09-25 | 2019-03-05 | Amazon Technologies, Inc. | Individual write quorums for a log-structured distributed storage system |
US10303564B1 (en) | 2013-05-23 | 2019-05-28 | Amazon Technologies, Inc. | Reduced transaction I/O for log-structured storage systems |
US10437721B2 (en) | 2013-09-20 | 2019-10-08 | Amazon Technologies, Inc. | Efficient garbage collection for a log-structured data store |
US10474547B2 (en) | 2013-05-15 | 2019-11-12 | Amazon Technologies, Inc. | Managing contingency capacity of pooled resources in multiple availability zones |
US10534768B2 (en) | 2013-12-02 | 2020-01-14 | Amazon Technologies, Inc. | Optimized log storage for asynchronous log updates |
US10552039B2 (en) | 2016-12-28 | 2020-02-04 | Fujitsu Limited | Storage control apparatus, storage management system, and non-transitory computer-readable storage medium |
US10698881B2 (en) | 2013-03-15 | 2020-06-30 | Amazon Technologies, Inc. | Database system with database engine and separate distributed storage service |
US10747746B2 (en) | 2013-04-30 | 2020-08-18 | Amazon Technologies, Inc. | Efficient read replicas |
US11030055B2 (en) | 2013-03-15 | 2021-06-08 | Amazon Technologies, Inc. | Fast crash recovery for distributed database systems |
KR20210082481A (ko) * | 2019-01-23 | 2021-07-05 | 가부시끼가이샤 히다치 세이사꾸쇼 | 데이터베이스 관리 서비스 제공 시스템 |
KR102369655B1 (ko) * | 2020-10-28 | 2022-03-03 | 주식회사 마크베이스 | 스냅샷 기반의 데이터 복제 및 복구 방법 |
US11341163B1 (en) | 2020-03-30 | 2022-05-24 | Amazon Technologies, Inc. | Multi-level replication filtering for a distributed database |
US11914571B1 (en) | 2017-11-22 | 2024-02-27 | Amazon Technologies, Inc. | Optimistic concurrency for a multi-writer database |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8688780B2 (en) * | 2005-09-30 | 2014-04-01 | Rockwell Automation Technologies, Inc. | Peer-to-peer exchange of data resources in a control system |
US7640247B2 (en) * | 2006-02-06 | 2009-12-29 | Microsoft Corporation | Distributed namespace aggregation |
SE533007C2 (sv) | 2008-10-24 | 2010-06-08 | Ilt Productions Ab | Distribuerad datalagring |
WO2014010087A1 (ja) * | 2012-07-13 | 2014-01-16 | 株式会社東芝 | 通信制御装置、通信装置およびプログラム |
CN104348793B (zh) * | 2013-07-30 | 2018-04-06 | 阿里巴巴集团控股有限公司 | 存储服务器***及数据信息的存储方法 |
US9557938B2 (en) | 2014-05-13 | 2017-01-31 | Netapp, Inc. | Data retrieval based on storage device activation schedules |
US9436571B2 (en) | 2014-05-13 | 2016-09-06 | Netapp, Inc. | Estimating data storage device lifespan |
US9430152B2 (en) | 2014-05-13 | 2016-08-30 | Netapp, Inc. | Data device grouping across data storage device enclosures for synchronized data maintenance |
US9436524B2 (en) | 2014-05-13 | 2016-09-06 | Netapp, Inc. | Managing archival storage |
US9430321B2 (en) | 2014-05-13 | 2016-08-30 | Netapp, Inc. | Reconstructing data stored across archival data storage devices |
WO2015175720A1 (en) * | 2014-05-13 | 2015-11-19 | Netapp, Inc. | Storage operations utilizing a multiple-data-storage-devices cartridge |
US9766677B2 (en) | 2014-05-13 | 2017-09-19 | Netapp, Inc. | Cascading startup power draws of enclosures across a network |
US9424156B2 (en) | 2014-05-13 | 2016-08-23 | Netapp, Inc. | Identifying a potential failure event for a data storage device |
US9430149B2 (en) | 2014-05-13 | 2016-08-30 | Netapp, Inc. | Pipeline planning for low latency storage system |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0827754B2 (ja) * | 1992-05-21 | 1996-03-21 | インターナショナル・ビジネス・マシーンズ・コーポレイション | コンピュータシステムにおけるファイル管理方法及びファイル管理システム |
US5956489A (en) * | 1995-06-07 | 1999-09-21 | Microsoft Corporation | Transaction replication system and method for supporting replicated transaction-based services |
US5822773A (en) * | 1996-10-17 | 1998-10-13 | Fwb Software Llc | Method and system for accelerating the copying of repetitively copied computer data |
JP3963417B2 (ja) * | 1999-11-19 | 2007-08-22 | 株式会社東芝 | データ同期処理のための通信方法および電子機器 |
US7506034B2 (en) * | 2000-03-03 | 2009-03-17 | Intel Corporation | Methods and apparatus for off loading content servers through direct file transfer from a storage center to an end-user |
US6718361B1 (en) * | 2000-04-07 | 2004-04-06 | Network Appliance Inc. | Method and apparatus for reliable and scalable distribution of data files in distributed networks |
US6886019B1 (en) * | 2000-05-15 | 2005-04-26 | International Business Machines Corporation | Optimized selection and accessing of stored files to avoid mount and position thrashing |
JP2002222107A (ja) * | 2001-01-25 | 2002-08-09 | Fujitsu Ltd | データ同期装置 |
JP4131780B2 (ja) * | 2001-03-30 | 2008-08-13 | 株式会社東芝 | 分散トランザクション処理システム、分散トランザクション処理方法及び分散トランザクション処理プログラム |
-
2004
- 2004-03-26 JP JP2004092060A patent/JP2005276094A/ja active Pending
- 2004-08-02 US US10/903,006 patent/US20050216523A1/en not_active Abandoned
Cited By (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8499083B2 (en) | 2006-03-29 | 2013-07-30 | Murata Kikai Kabushiki Kaisha | Relay device and communication system |
JP2008009814A (ja) * | 2006-06-30 | 2008-01-17 | Nec Corp | データレプリケーションシステム及びデータレプリケーション方法 |
JP2008097112A (ja) * | 2006-10-06 | 2008-04-24 | Toshiba Corp | ストレージシステム及び同システムに適用される論理ボリューム管理方法 |
JP2008123198A (ja) * | 2006-11-10 | 2008-05-29 | Toshiba Corp | キャッシュ一貫性保証機能を有するストレージクラスタシステム |
JP4643543B2 (ja) * | 2006-11-10 | 2011-03-02 | 株式会社東芝 | キャッシュ一貫性保証機能を有するストレージクラスタシステム |
JP2008186141A (ja) * | 2007-01-29 | 2008-08-14 | Hitachi Ltd | データ管理方法、データ管理プログラム、データ管理システム、および、構成管理装置 |
JP2009159127A (ja) * | 2007-12-25 | 2009-07-16 | Murata Mach Ltd | 中継サーバ及び中継通信システム |
JP4591875B2 (ja) * | 2007-12-25 | 2010-12-01 | 村田機械株式会社 | 中継サーバ及び中継通信システム |
US8949419B2 (en) | 2007-12-25 | 2015-02-03 | Murata Machinery, Ltd. | Synchronizing sharing servers |
KR101150052B1 (ko) | 2007-12-28 | 2012-06-01 | 무라다기카이가부시끼가이샤 | 중계 서버 및 중계 통신 시스템 |
US10698881B2 (en) | 2013-03-15 | 2020-06-30 | Amazon Technologies, Inc. | Database system with database engine and separate distributed storage service |
US10331655B2 (en) | 2013-03-15 | 2019-06-25 | Amazon Technologies, Inc. | System-wide checkpoint avoidance for distributed database systems |
JP2016511495A (ja) * | 2013-03-15 | 2016-04-14 | アマゾン・テクノロジーズ・インコーポレーテッド | ログレコード管理 |
US9672237B2 (en) | 2013-03-15 | 2017-06-06 | Amazon Technologies, Inc. | System-wide checkpoint avoidance for distributed database systems |
US11500852B2 (en) | 2013-03-15 | 2022-11-15 | Amazon Technologies, Inc. | Database system with database engine and separate distributed storage service |
US11030055B2 (en) | 2013-03-15 | 2021-06-08 | Amazon Technologies, Inc. | Fast crash recovery for distributed database systems |
US10180951B2 (en) | 2013-03-15 | 2019-01-15 | Amazon Technologies, Inc. | Place snapshots |
US10031813B2 (en) | 2013-03-15 | 2018-07-24 | Amazon Technologies, Inc. | Log record management |
US10747746B2 (en) | 2013-04-30 | 2020-08-18 | Amazon Technologies, Inc. | Efficient read replicas |
US10872076B2 (en) | 2013-05-13 | 2020-12-22 | Amazon Technologies, Inc. | Transaction ordering |
US9760596B2 (en) | 2013-05-13 | 2017-09-12 | Amazon Technologies, Inc. | Transaction ordering |
US10474547B2 (en) | 2013-05-15 | 2019-11-12 | Amazon Technologies, Inc. | Managing contingency capacity of pooled resources in multiple availability zones |
US10303564B1 (en) | 2013-05-23 | 2019-05-28 | Amazon Technologies, Inc. | Reduced transaction I/O for log-structured storage systems |
US9817710B2 (en) | 2013-05-28 | 2017-11-14 | Amazon Technologies, Inc. | Self-describing data blocks stored with atomic write |
US10216949B1 (en) | 2013-09-20 | 2019-02-26 | Amazon Technologies, Inc. | Dynamic quorum membership changes |
US11120152B2 (en) | 2013-09-20 | 2021-09-14 | Amazon Technologies, Inc. | Dynamic quorum membership changes |
US10437721B2 (en) | 2013-09-20 | 2019-10-08 | Amazon Technologies, Inc. | Efficient garbage collection for a log-structured data store |
US10223184B1 (en) | 2013-09-25 | 2019-03-05 | Amazon Technologies, Inc. | Individual write quorums for a log-structured distributed storage system |
US9699017B1 (en) | 2013-09-25 | 2017-07-04 | Amazon Technologies, Inc. | Dynamic utilization of bandwidth for a quorum-based distributed storage system |
US10198356B2 (en) | 2013-11-20 | 2019-02-05 | Amazon Technologies, Inc. | Distributed cache nodes to send redo log records and receive acknowledgments to satisfy a write quorum requirement |
US9880933B1 (en) | 2013-11-20 | 2018-01-30 | Amazon Technologies, Inc. | Distributed in-memory buffer cache system using buffer cache nodes |
US10534768B2 (en) | 2013-12-02 | 2020-01-14 | Amazon Technologies, Inc. | Optimized log storage for asynchronous log updates |
JP2016018384A (ja) * | 2014-07-08 | 2016-02-01 | 富士通株式会社 | ストレージ制御装置、ストレージシステム、及びプログラム |
JP2016024469A (ja) * | 2014-07-16 | 2016-02-08 | Necエンジニアリング株式会社 | データ管理システム、データ管理装置、プログラム及びデータ管理方法 |
US10552039B2 (en) | 2016-12-28 | 2020-02-04 | Fujitsu Limited | Storage control apparatus, storage management system, and non-transitory computer-readable storage medium |
JP2018128882A (ja) * | 2017-02-09 | 2018-08-16 | 三菱電機株式会社 | 遠方監視制御システム及び遠方監視制御方法 |
US11914571B1 (en) | 2017-11-22 | 2024-02-27 | Amazon Technologies, Inc. | Optimistic concurrency for a multi-writer database |
KR20210082481A (ko) * | 2019-01-23 | 2021-07-05 | 가부시끼가이샤 히다치 세이사꾸쇼 | 데이터베이스 관리 서비스 제공 시스템 |
US11797556B2 (en) | 2019-01-23 | 2023-10-24 | Hitachi, Ltd. | Database management service provision system |
KR102598619B1 (ko) * | 2019-01-23 | 2023-11-07 | 가부시끼가이샤 히다치 세이사꾸쇼 | 데이터베이스 관리 서비스 제공 시스템 |
US11341163B1 (en) | 2020-03-30 | 2022-05-24 | Amazon Technologies, Inc. | Multi-level replication filtering for a distributed database |
KR102369655B1 (ko) * | 2020-10-28 | 2022-03-03 | 주식회사 마크베이스 | 스냅샷 기반의 데이터 복제 및 복구 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20050216523A1 (en) | 2005-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005276094A (ja) | 分散ストレージ装置のファイル管理方法及び分散ストレージシステム並びにプログラム | |
JP4297706B2 (ja) | 記憶システム | |
AU2016405587B2 (en) | Splitting and moving ranges in a distributed system | |
JP4749266B2 (ja) | 情報資源の重複を省いたバックアップ制御装置及び方法 | |
JP5727020B2 (ja) | クラウドコンピューティングシステム及びそのデータ同期化方法 | |
US7788303B2 (en) | Systems and methods for distributed system scanning | |
EP2498476B1 (en) | Massively scalable object storage system | |
KR101453425B1 (ko) | 메타데이터 서버 및 메타데이터 관리 방법 | |
JP5411250B2 (ja) | 冗長データ記憶システムへの指示に従ってのデータ配置 | |
US6820099B1 (en) | Instantaneous data updating using snapshot volumes | |
US9031906B2 (en) | Method of managing data in asymmetric cluster file system | |
US7836017B1 (en) | File replication in a distributed segmented file system | |
JP4291077B2 (ja) | 分散ストレージ装置のファイル管理方法及び分散ストレージシステム | |
JP4806572B2 (ja) | データミラーリングによって参照負荷を分散するストレージシステムにおけるアクセスの制御 | |
US20140019495A1 (en) | Processing a file system operation in a distributed file system | |
JP2014503086A (ja) | ファイルシステム及びデータ処理方法 | |
JP2006164169A (ja) | 名前空間を共有するクラスタ構成のネットワークストレージシステム及びその制御方法 | |
JP2009064120A (ja) | 検索システム | |
JP2001306372A (ja) | 文書管理方法およびその方法を実施するためのプログラムを記憶した記憶媒体 | |
JP4247975B2 (ja) | データ管理方法、データ管理システム、およびそのためのプログラムならびに記録媒体 | |
US8516023B1 (en) | Context based file system | |
JP5446378B2 (ja) | ストレージシステム | |
JP4343056B2 (ja) | ストレージ装置割当て方法ならびにそのための管理サーバおよびプログラム | |
JP5956364B2 (ja) | クラスタシステム | |
JP2006004024A (ja) | ディレクトリサーバに実行させるためのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070703 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071211 |