JP5387535B2 - ファイル管理装置、プログラム並びに方法 - Google Patents

ファイル管理装置、プログラム並びに方法 Download PDF

Info

Publication number
JP5387535B2
JP5387535B2 JP2010206454A JP2010206454A JP5387535B2 JP 5387535 B2 JP5387535 B2 JP 5387535B2 JP 2010206454 A JP2010206454 A JP 2010206454A JP 2010206454 A JP2010206454 A JP 2010206454A JP 5387535 B2 JP5387535 B2 JP 5387535B2
Authority
JP
Japan
Prior art keywords
file
duplicate
storage device
network
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010206454A
Other languages
English (en)
Other versions
JP2012063902A (ja
Inventor
慎太郎 相馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010206454A priority Critical patent/JP5387535B2/ja
Publication of JP2012063902A publication Critical patent/JP2012063902A/ja
Application granted granted Critical
Publication of JP5387535B2 publication Critical patent/JP5387535B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はファイル管理装置、プログラム並びに方法に関する。
昨今、情報の電子化、ネットワークの充実により、ユーザは、社内外への情報の共有を電子化されたデータをメールに添付することなどにより、容易に行えるようになった。
ストレージの単価も下がり、PC(Personal Computer)やサーバのストレージ容量も大幅に増加した。ユーザは、データ量を気にせずに保存できるという便宜を謳歌できるようになった。しかし、その一方、PCやサーバに保存されるデータ量が肥大化するという事態も発生している。現在、情報共有のため複製した情報など、同一のデータから成るファイルが組織内で各自のPCや共有ストレージに散乱しているという現象が現実に起こっている。
今後、オフィス環境のクラウド化が進むと、デスクトップ環境・共有ストレージなどがデータセンターに移され、ユーザは、ローカルの端末(PC、シンクライアントシステム、携帯電話など)からクラウドを利用することが想定される。この時、クラウド化したデスクトップ環境・ストレージを、ユーザがサービスとして利用した場合、散乱している同一のファイルが、それぞれ従量課金制度によって課金される。ユーザにとって、同一のファイルに対してそれぞれ料金を支払うのは、無駄なコストをかけることになる。そこで、ユーザが利用するシステム全体において、蓄積されたファイルを最適化することが望まれる。
ここで、クラウドとは、コンピュータのハードウェア、ソフトウェア、データなどを、インターネット介して利用し、その利用に対してサービス利用料金を払う形態を言う。データセンターとはインターネット用のサーバやデータ通信、固定・携帯・IP(Internet Protocol)電話などの装置を設置・運用することに特化した建物の総称である。また、シンクライアントシステムとは、ユーザが使うクライアント端末に必要最小限の処理をさせ、ほとんどの処理をサーバ側に集中させたシステムである。
一般的な重複ファイルの最適化手法は、ストレージ装置内に閉じた手法が主であった。
削除するファイルを選択するためにファイルに優先度を規定している方法については、特許文献1に開示されている。特許文献1は、削除ファイルポリシーテーブル内の優先度を比較し、ファイル受信装置内のファイルのうち、もっとも優先度が低い論理的グループ内のファイルから削除する、という方法を開示している。
特開2004−21303
本発明が解決しようとする課題は、効率的なファイルアクセスを可能とするファイル管理装置を得ることである。ファイルは、ユーザのデスクトップ環境だけでなく、ネットワーク上のストレージ上にも存在しているので、ストレージ装置内だけではなく、企業など組織全体としてファイルを最適に管理することは難しい。特許文献1の技術が最適化する、ファイルの存在場所は、ファイル受信装置内にとどまる。すなわち、この方法をもってしても、ファイル受信装置内でしか最適化を図ることができず、組織全体としての、ファイルの重複排除の最適化はできない。
全体を最適化する手法としては、あるファイルAに対して重複して保存されている別のファイルを削除し、削除されたファイルを有していたストレージに、ファイルAへのリンクを張る、という方法がある。この方法により、全体のデータ量を最適化することが可能ではある。この場合、特定の組織や団体が保有するネットワーク全体に点在している重複ファイルに関し、どのファイルを削除し、どのファイルを残すかによって、ユーザの使い勝手が大幅に変わってくる。
例えば、アクセスに時間のかかるストレージに頻繁に使うファイルが残された場合、ユーザの作業効率は著しく低下する。また、ある特定の個人以外が使用する確率がひじょうに小さいファイルは、その個人の端末に保存されていることが望ましい。逆に不特定多数のユーザに頻繁に使われるファイルは、中央のサーバに保存されていることが望ましい。このようなユーザの便宜を図るためには、どの場所のファイルを残すかについて、一定の優先順位を決めておく必要がある。
これまでの最適化方法は、ストレージ装置内に閉じた手法であった。したがって、ユーザはファイルアクセスの良好な使い勝手を享受しつつ、重複ファイルにかかるコストをシステム全体として低減することはできなかった。
本発明の目的は、上記課題を解決して、効率的なファイルアクセスを可能とするファイル管理装置を得ることである。
本発明によれば、複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイルの内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、
重複ファイル抽出手段と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御手段、と、を有することを特徴とするファイル管理装置が得られる。
本発明によれば、複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、重複ファイル抽出処理と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御処理、と、をコンピュータに実行させることを特徴とするファイル管理プログラムが得られる。
本発明によれば、複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、前記優先度情報に基づいて各ファイル格納装置の優先度を決定し、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力すること、を有することを特徴とするファイル管理方法が得られる。
本発明によれば、重複ファイルにかかるコストをシステム全体として低減するファイル管理装置を得ることができる。
図1は本発明の第1の実施形態の構成を示す。 図2は本発明の第1の実施形態のファイルリストメッセージの一例を示す。 図3は本発明の第1の実施形態の重複データ制御メッセージの一例を示す。 図4は本発明の第1の実施形態の各機器のステータスの一例を示す。 図5は本発明の第1の実施形態の優先度決定木の一例を示す。 図6は本発明の第2の実施形態のネットワークの階層関係の一例を示す。 図7は本発明の第3の実施形態の構成を示すブロック図である。
(第1の実施形態)
以下は、本発明の第1の実施形態についての、図面を参照した詳細な説明である。図1は、発明のシステム構成を示す。本実施形態のファイル管理システム100は、ネットワーク101、ネットワーク102とネットワーク103と、で構成されている。ネットワーク102とネットワーク103はネットワーク101の下位ネットワークである。ネットワーク101は上位ネットワークとルータ114経由で接続されており、ネットワーク102とネットワーク103はネットワーク101とそれぞれルータ115とルータ116経由で接続されている。ネットワークの階層はファイル管理システム100外のネットワークに近い方(経由するルータ数が少ない方)が上位で、遠い方(経由するルータ数が多い方)が下位となる。
ネットワーク101にはストレージサーバ301、端末401(以下端末はPCと略すこともある)、端末402、ファイル管理装置501が接続されている。ファイル管理装置501は、重複ファイル抽出部510とファイル制御部520とで構成されている。重複ファイル抽出部510、ファイル制御部520は、論理回路等のハードウェアで構成されている。重複ファイル抽出部510、ファイル制御部520は、ファイル管理装置501内の、図示されていないプロセッサが、同じく図示されていないメモリに格納されているプログラムを実行することで実現されてもよい。ネットワーク102はストレージサーバ302、端末403と端末404、ネットワーク103には端末405と端末406とが接続されている。
ここで端末(PC)は、仮想デスクトップ環境を含んだデスクトップ環境を指し、物理的、仮想的なハードウェアに依存しない。仮想デスクトップ環境は主にシンクライアントシステムによってクラウド側(データセンター側)にて構築されるデスクトップ環境を言う。なお、ここでは、端末、ストレージサーバ等、ファイルを格納する機能を有する各種別の装置を総称してファイル格納装置とも呼ぶ。
各機器(ストレージサーバ301とストレージサーバ302及び端末401、端末402、端末403、端末404、端末405、端末406)は、それぞれ最適化クライアント部502を備えている。最適化クライアント部502は、例えばソフトウェアとしてインストールされていてもよい。最適化クライアント部502は、自己がインストールされている機器の空き容量と、各ファイルの絶対パス、ファイル内容のハッシュ値、更新日時等の情報を、自己がインストールされている機器から取得し、これらの情報を含むファイルリストメッセージ201を作成する。
最適化クライアント部502は、ファイル管理装置501にファイルリストメッセージ201を送信することで、自機器内に保存されているファイルの情報をファイル管理装置501の重複ファイル抽出部510に通知する。
重複ファイル抽出部510は各機器から送付されたファイルリストメッセージ201の内容を分析し、ネットワーク内に点在する重複ファイルにおいて、どの機器に保存されているファイルを残し、どのファイルを削除するかを決定する。
ファイル管理装置501のファイル制御部520は、重複ファイル抽出部510が決定した内容を、重複データ制御メッセージ202として各機器へ送信し、重複データを保存するか削除するか等を最適化クライアント部502へ通知する。最適化クライアント部502は受信した重複データ制御メッセージ202の指示に従って重複データに対して処理を実行する。
図2は、ファイルリストメッセージ201の例を示す。ファイルリストメッセージ201はメッセージを送信する側のホスト名、ホストのネットワークアドレス(例えばIPアドレス等)、ホスト種別、ストレージ総容量及び空き容量、データリストで構成されている。また、ホスト種別とは、ストレージサーバであるか、PCであるか等の区別である。データリストは、各ファイル単位の情報が含まれており、具体的には、ファイル名、ホスト内の絶対パス、ファイル内容のハッシュ値、更新日時が含まれている。
図3は重複データ制御メッセージ202の例を示す。重複データ制御メッセージ202は、制御対象であるファイル名、ステータス(重複有り または 無を示す)、制御フラグ(保留または 削除の表示)、リンク先(制御フラグが削除の表示の場合)、アクセス権(どの機器に設定するかを表示)が含まれている。ここで重複データ制御メッセージ202は複数のファイルに対する制御の指示も行なうこともできる。
以下は、本発明の第1の実施の形態の動作についての、図面を参照した説明である。
本実施形態の動作については、図1、図2、図3、図4、図5を参照して詳細に説明する。
まず各機器の最適化クライアント部502は、各機器が保持しているファイルについてファイルリストメッセージ201を作成し、ファイル管理装置501の重複ファイル抽出部510に送付する。重複ファイル抽出部510はファイルリストメッセージ201を受信することで、ネットワークの構成及び各機器がどのネットワークに存在しているかを把握することができる。その結果、重複ファイル抽出部510は、複数の機器の点在状況も知ることができる。同時に重複ファイル抽出部510は、各機器のストレージ総容量、空き容量も把握することができる。
図4は、ファイル管理装置501の重複ファイル抽出部510が、取得したファイルリストメッセージ201の内容をもとに作成した、各機器のステータスの一例である。重複ファイル抽出部510は、あらかじめ定められたファイルを記憶するにあたっての各機器の優先度を、各機器のホスト名に関連づけて記憶する。この実施形態1では、重複ファイル抽出部510は、優先度を、優先度情報記憶部511に格納されている、図5に示す優先度決定木に沿って決定している。重複ファイル抽出部510は図5に示した各機器の優先度を図4の表の最右列に追記する。
ここで、図5に示した優先度決定木は、機器種別、ネットワーク階層の上下、ストレージの空き容量によって決定されている。パラメータとして前記以外にも機器コスト(月額ストレージ単価)、機器SLA(Service Level Agreement:可動時間、処理スピードなど、通信サービスの事業者が利用者に保証したサービスの品質)なども含めることができる。
優先度決定木のパラメータ分岐順はユーザによって自由に決めることができる。つまり、ネットワーク階層の上下よりもストレージの空き容量の優先度が高ければ、分岐する順をストレージ空き容量を先にしてもよい。
次に重複ファイル抽出部510は、各機器から取得したファイルリストメッセージ201を比較することで重複ファイルが存在しないかを分析する。具体的にはファイルリストメッセージ201に記載されているファイル内容のハッシュ値、ファイル名、更新日時などを用いて同一ファイルであることを判定する。
重複ファイルが存在した場合、重複ファイル抽出部510は図5の優先度決定木を用いて作成した図4の優先度に従ってファイルを保持する機器を決定する。例として重複ファイルが、全機器に保存されていた場合について、どの機器に保存すべきかの優先度を求める。図5の優先度決定木を基に、端末よりストレージサーバの方が優先される。また、階層が上位のネットワークが下位のネットワークより優先される。また、ストレージ容量が大きいものの方が、小さいものよりも優先される。その結果、もっともネットワーク階層が上にあるストレージサーバのうち、ストレージ容量が最も大きいものが保存する機器として選ばれる。
この実施形態の場合は、図1に示すように、ストレージサーバで、もっとも階層が上にあるものは、ストレージサーバ301であるので、ストレージサーバ301にあるファイルが保持される。すべての残りの機器にあるこのファイルと重複するファイルは削除され、それぞれの残りの機器からストレージサーバ301のファイルへのリンクが張られる。
別の例としてストレージサーバ302、端末403、端末405にファイルが保存されている場合について説明する。図5の優先度決定木を基に、端末よりストレージサーバの方が優先されるので、ストレージサーバ302にあるファイルが保持され、残りの機器端末403、端末405のファイルは削除される。また、これとともに、残りの機器端末403、端末405からストレージサーバ302のファイルへのリンクが張られる。
最初に挙げた、ストレージサーバ301のファイルを保持する例の場合、重複ファイル抽出部510の決定を受けて、ファイル制御部520はファイルを削除し、他の機種へのリンクを張るべき機器に対して重複データ制御メッセージ202を送信する。各機器にインストールされている最適化クライアント部502は受信した重複データ制御メッセージ202に従って、該当するファイルに対して指示通りに削除し、リンクを新規に作成する。
一方、ストレージサーバ301の最適化クライアント部502は、受信した重複データ制御メッセージ202に従って各機器から当該ファイルへの利用が可能なように当該ファイルに必要なアクセス権を付与する。また、必要に応じてファイル制御部520は各機器がストレージサーバ301へアクセス可能なように、ルータ115 及び116の設定を変更する。この実施形態のファイル管理システム100は、ネットワーク階層の最上位にあるストレージサーバ301にファイルを保存するので、いずれの端末からも共通にアクセスし易く、効率的なファイルアクセスが可能となる。
(第2の実施形態)
ネットワークが大きく、重複ファイルを保持している機器がネットワーク内に分散している場合、単なるネットワーク階層の上下だけで優先度を決めるのは、かえってファイルアクセスの効率を下げることがある。このような場合は、ファイルにアクセスする各機器のアクセスし易さを考慮し、ネットワーク帯域、ネットワークコスト、各機器からネットワークへの距離を考慮した優先度決めが有効と考えられる。第2の実施形態ではアクセスする機器へのネットワーク上の距離の大小により、優先度を決定する。第1の実施形態の構成において、ネットワークが図1から図6のように置き換えられる他は、第1の実施形態と装置の基本的な構成は変わらない。
図6のネットワークは、ネットワーク101からネットワーク108までを有し、これらのネットワークは階層構造となっている。ここで、ある重複ファイルを保持している機器がネットワーク105に6台、ネットワーク106に4台、ネットワーク108に2台点在していると仮定する。第1の実施形態で説明した図5の優先度決定木でファイルを残す機器を決定すると、ネットワーク105もしくはネットワーク106に存在する機器の中で空き容量が多い機器が選択されることとなる。しかし、この実施形態では、最適な機器に先んじて、ネットワークを選択する。
選択するネットワークは、以下に述べる手順で決定する。なお、以下の手順で用いられれる図6に示すネットワーク構成情報は、優先度情報記憶部511に格納されている。1)重複ファイル抽出部510は、ファイルを保持している機器が存在するネットワークから各ネットワークへのアクセスコストを算出する。2)重複ファイル抽出部510は、アクセスコストを比較し、ファイルを保持すべき最適なネットワークの優先順位を決定する。3)ファイル管理装置501の重複ファイル抽出部510は、ネットワーク優先順位に従って、該当ネットワーク内の機器優先度よりファイル保持機器を決定する。
この実施形態は、アクセスコストを、「該当ネットワークへのホップ数Xファイルアクセス機器数」と定義する。この実施形態は、アクセスコストの算出方法として、ネットワーク帯域を含める方法として「ネットワーク帯域の逆数」を掛けることも可能である。以下に示すのは、アクセスコストの計算結果である。
・ネットワーク101へのアクセスコスト
ネットワーク105からのアクセスコスト:2HopX6Machines=12
ネットワーク106からのアクセスコスト:2HopX4Machines=8
ネットワーク108からのアクセスコスト:3HopX2Machines=6
合計アクセスコスト数:12+8+6=26
・ネットワーク102へのアクセスコスト
ネットワーク105からのアクセスコスト:3HopX6Machines=18
ネットワーク106からのアクセスコスト:3HopX4Machines=12
ネットワーク108からのアクセスコスト:2HopX2Machines=4
合計アクセスコスト数:18+12+4=34
・ネットワーク103へのアクセスコスト
ネットワーク105からのアクセスコスト:1HopX6Machines=6
ネットワーク106からのアクセスコスト:1HopX4Machines=4
ネットワーク108からのアクセスコスト:4HopX2Machines=8
合計アクセスコスト数:6+4+8=18
・ネットワーク104へのアクセスコスト
ネットワーク105からのアクセスコスト:4HopX6Machines=24
ネットワーク106からのアクセスコスト:4HopX4Machines=16
ネットワーク108からのアクセスコスト:1HopX2Machines=2
合計アクセスコスト数:24+16+2=42
・ネットワーク105へのアクセスコスト
ネットワーク105からのアクセスコスト:0HopX6Machines=0
ネットワーク106からのアクセスコスト:2HopX4Machines=8
ネットワーク108からのアクセスコスト:5HopX2Machines=10
合計アクセスコスト数:0+8+10=18
・ネットワーク106へのアクセスコスト
ネットワーク105からのアクセスコスト:2HopX6Machines=12
ネットワーク106からのアクセスコスト:0HopX4Machines=0
ネットワーク108からのアクセスコスト:5HopX2Machines=10
合計アクセスコスト数:12+0+10=22
・ネットワーク107へのアクセスコスト
ネットワーク105からのアクセスコスト:5HopX6Machines=30
ネットワーク106からのアクセスコスト:5HopX4Machines=20
ネットワーク108からのアクセスコスト:2HopX2Machines=4
合計アクセスコスト数:30+20+4=54
・ネットワーク108へのアクセスコスト
ネットワーク105からのアクセスコスト:5HopX6Machines=30
ネットワーク106からのアクセスコスト:5HopX4Machines=20
ネットワーク108からのアクセスコスト:0HopX2Machines=0
合計アクセスコスト数:30+20+0=50
上記のアクセスコストの結果を反映し、ファイルを保持すべき最適なネットワークの優先度は、次のようになる。
ネットワーク103=ネットワーク105>
ネットワーク106>
ネットワーク101>
ネットワーク102>
ネットワーク104>
ネットワーク108>
ネットワーク107
ネットワーク103とネットワーク105はアクセスコストとしては同値であるが、重複ファイル抽出部510は、ネットワーク階層が高いネットワーク103を最優先するネットワークとして選択する。
重複ファイル抽出部510は、最終的なファイルを保持する機器として最適なものを、ネットワーク103内から選択する。重複ファイル抽出部510は、最適なものがネットワーク103に存在しない場合は、ネットワーク105内から選択する、という形で優先度の高いネットワークから順に、その中にある最適な機器を探索していく。
上記のような選択を行うことで、例えば重複ファイルを保持している機器が端末のみだった場合、重複ファイル抽出部510は、よりアクセスし易いネットワーク上のストレージサーバを、ファイルを保持する機器として選定することができる。ファイルを利用するユーザは、効率的にファイルを利用することができる。
なお、本実施形態では、ファイル管理装置501をネットワーク101においているが、ファイル管理装置501は、どのネットワークに配置しても構わない。
この実施形態のファイル管理システム100は、ネットワークが大きく、アクセス対象のファイルを有する端末が、ネットワークの下位にある場合に、効率的なファイルアクセスが可能とする。その理由は、最上位にあるストレージサーバにアクセスしなくとも、比較的アクセスコストの低いストレージサーバを選択して使用できるからである。
(第3の実施形態)
図7は本発明の第4の実施形態を表すブロック図である。本発明の第4の実施形態は、複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、
前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、重複ファイル抽出部510と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御部520、と、を有することを特徴とするファイル管理装置501である。
以上の実施形態では優先度の決定方針として、ストレージサーバを端末より優先すること、アクセスコストの低い端末を優先することを述べたが、優先度の決定方法はこれらにとどまるものではない。ファイルの利用者数、ファイルの利用頻度、ファイルの機密性により、優先度は、臨機応変に決定することができる。
たとえば、第1の実施形態のようにストレージサーバの優先度を端末より高く設定することには限られず、ファイルの利用者数、ファイルの利用頻度、ファイルの機密性、を考慮して、優先度を決定することができる。具体的には下記のような重み付けを行った、優先度が適用されてもよい。
・ファイル利用者数が少ない場合、端末>ストレージサーバの優先度とする。(しきい値はユーザ定義による)・ファイルの利用頻度が多い場合、ネットワーク帯域、ホップ数のアクセスコストに重み付けをする。また、不特定多数が対象の場合はサーバ>端末の優先順位とする。・ファイルの機密性が高い場合、ネットワークの安全性(暗号化レベル)に重み付けをする。上記手法により、ファイルの特性に最適な重複ファイルの排除及び保持場所を設定することができる。
また、優先度情報記憶部511は、必ずしも使用する必要はない。ネットワークアドレス等で優先度が単純に決まる場合は、重複ファイル抽出部が、決められたルールに従って、優先度を決定してもよい。
100 ファイル管理システム
101 ネットワーク
102 ネットワーク
103 ネットワーク
104 ネットワーク
105 ネットワーク
106 ネットワーク
107 ネットワーク
108 ネットワーク
114 ルータ
115 ルータ
116 ルータ
201 ファイルリストメッセージ
202 重複データ制御メッセージ
301 ストレージサーバ
302 ストレージサーバ
401 端末
402 端末
403 端末
404 端末
405 端末
406 端末
501 ファイル管理装置
502 最適化クライアント部
510 重複ファイル抽出部
520 ファイル制御部

Claims (7)

  1. 複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、ファイル格納装置の位置するネットワーク上の階層と、各階層におけるファイル格納装置の台数とを取得し、優先度を決定する対象のファイル格納装置(優先度決定対象装置)への他の階層の前記優先度決定対象装置の保有する前記重複ファイルと同じ前記重複ファイルを保有するファイル格納装置(重複ファイル装置)からのホップ数をn、前記他の階層における重複ファイル装置の台数をmとし、前記優先度決定対象装置の優先度を、すべての階層に関して各々得られるn×mの総和に基づいて決定する重複ファイル抽出手段と、
    前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存る
    か削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御手段と、
    を有することを特徴とするファイル管理装置。
  2. 請求項1に記載のファイル管理装置と、前記複数のファイル格納装置を包含するファイル管理システム。
  3. 複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、ファイル格納装置の位置するネットワーク上の階層と、各階層におけるファイル格納装置の台数とを取得し、優先度を決定する対象のファイル格納装置(優先度決定対象装置)への他の階層の前記優先度決定対象装置の保有する前記重複ファイルと同じ前記重複ファイルを保有するファイル格納装置(重複ファイル装置)からのホップ数をn、前記他の階層における重複ファイル装置の台数をmとし、前記優先度決定対象装置の優先度を、すべての階層に関して各々得られるn×mの総和に基づいて決定する重複ファイル抽出処理と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御処理と、をコンピュータに実行させることを特徴とするファイル管理プログラム。
  4. 複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、ファイル格納装置の位置するネットワーク上の階層と、各階層におけるファイル格納装置の台数とを取得し、優先度を決定する対象のファイル格納装置(優先度決定対象装置)への他の階層の前記優先度決定対象装置の保有する前記重複ファイルと同じ前記重複ファイルを保有するファイル格納装置(重複ファイル装置)からのホップ数をn、前記他の階層における重複ファイル装置の台数をmとし、前記優先度決定対象装置の優先度を、すべての階層に関して各々得られるn×mの総和に基づいて決定し、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力することを特徴とするファイル管理方法。
  5. 複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得し、前記取得したファイル情報同士を比較し、前記比較の結果に基づいて、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、前記重複ファイルを保有するファイル格納装置である重複ファイル装置が位置するネットワーク上の階層から、優先度を決定する対象のファイル格納装置が位置するネットワーク上の階層へのホップ数をn、前記重複ファイル装置が位置する階層における重複ファイル装置の台数をmとしたとき、前記重複ファイル装置の位置するネットワーク上の階層のそれぞれに対して得られるn×mの総和に基づいて、前記優先度を決定する対象のファイル格納装置の優先度を決定し、前記優先度に応じて、前記重複ファイルを保持するファイル格納装置を決定する、ファイル管理装置。
  6. 複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得し、前記取得したファイル情報同士を比較し、前記比較の結果に基づいて、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、前記重複ファイルを保有するファイル格納装置である重複ファイル装置が位置するネットワーク上の階層から、優先度を決定する対象のファイル格納装置が位置するネットワーク上の階層へのホップ数をn、前記重複ファイル装置が位置する階層における重複ファイル装置の台数をmとしたとき、前記重複ファイル装置の位置するネットワーク上の階層のそれぞれに対して得られるn×mの総和に基づいて、前記優先度を決定する対象のファイル格納装置の優先度を決定し、前記優先度に応じて、前記重複ファイルの格納先を決定する、ファイル管理方法。
  7. 複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得し、前記取得したファイル情報同士を比較し、前記比較の結果に基づいて、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、前記重複ファイルを保有するファイル格納装置である重複ファイル装置が位置するネットワーク上の階層から、優先度を決定する対象のファイル格納装置が位置するネットワーク上の階層へのホップ数をn、前記重複ファイル装置が位置する階層における重複ファイル装置の台数をmとしたとき、前記重複ファイル装置の位置するネットワーク上の階層のそれぞれに対して得られるn×mの総和に基づいて、前記優先度を決定する対象のファイル格納装置の優先度を決定し、前記優先度に応じて、前記重複ファイルの格納先を決定する処理を、
    コンピュータに実行させることを特徴とするプログラム
JP2010206454A 2010-09-15 2010-09-15 ファイル管理装置、プログラム並びに方法 Expired - Fee Related JP5387535B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010206454A JP5387535B2 (ja) 2010-09-15 2010-09-15 ファイル管理装置、プログラム並びに方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010206454A JP5387535B2 (ja) 2010-09-15 2010-09-15 ファイル管理装置、プログラム並びに方法

Publications (2)

Publication Number Publication Date
JP2012063902A JP2012063902A (ja) 2012-03-29
JP5387535B2 true JP5387535B2 (ja) 2014-01-15

Family

ID=46059567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010206454A Expired - Fee Related JP5387535B2 (ja) 2010-09-15 2010-09-15 ファイル管理装置、プログラム並びに方法

Country Status (1)

Country Link
JP (1) JP5387535B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6281333B2 (ja) * 2014-03-11 2018-02-21 日本電気株式会社 ストレージシステム
JP6708948B2 (ja) 2016-01-21 2020-06-10 日本電気株式会社 ブロックストレージ
WO2018092288A1 (ja) * 2016-11-18 2018-05-24 株式会社日立製作所 ストレージ装置及びその制御方法
CN116775508B (zh) * 2023-08-24 2023-10-31 半糖去冰科技(北京)有限公司 一种安卓手机的垃圾清理方法和***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0855049A (ja) * 1994-08-11 1996-02-27 Sony Corp データ蓄積装置
JP2006338461A (ja) * 2005-06-03 2006-12-14 Hitachi Ltd 電子的なファイルの記憶を制御するシステム及び方法
JP2007074213A (ja) * 2005-09-06 2007-03-22 Nikon Corp カメラシステム、カメラおよび外部記憶装置
US20080243769A1 (en) * 2007-03-30 2008-10-02 Symantec Corporation System and method for exporting data directly from deduplication storage to non-deduplication storage
JP5060876B2 (ja) * 2007-08-30 2012-10-31 株式会社日立製作所 ストレージシステム及びストレージシステムの消費電力低減方法
JP2009080671A (ja) * 2007-09-26 2009-04-16 Hitachi Ltd 計算機システム、管理計算機、及びファイル管理方法
JP5136162B2 (ja) * 2008-03-31 2013-02-06 日本電気株式会社 バックアップ管理システム、方法、及び、プログラム

Also Published As

Publication number Publication date
JP2012063902A (ja) 2012-03-29

Similar Documents

Publication Publication Date Title
US10333864B2 (en) Adaptive service chain management
US10911530B2 (en) Content delivery method, virtual server management method, cloud platform, and system
US10237238B2 (en) Regional firewall clustering in a networked computing environment
Gu et al. A general communication cost optimization framework for big data stream processing in geo-distributed data centers
JP6395825B2 (ja) 異なるテナンシーセットのエンドポイントデーターセンター
EP3125505A1 (en) Method, apparatus and system for load balancing of service chain
US20140075048A1 (en) Apparatus, System, and Method for Cloud-Assisted Routing
US20120233315A1 (en) Systems and methods for sizing resources in a cloud-based environment
JP2016521415A (ja) 論理的多次元ラベルベースのポリシーモデルを使用した分散型ネットワークマネージメントシステム
WO2013109344A1 (en) Method and apparatus for network and storage-aware virtual machine placement
WO2012125144A1 (en) Systems and methods for sizing resources in a cloud-based environment
US9537780B2 (en) Quality of service agreement and service level agreement enforcement in a cloud computing environment
US10944723B2 (en) Systems and methods for managing endpoints and security policies in a networked environment
US20220200957A1 (en) Managing Application Access Controls And Routing In Cloud Computing Platforms
US11140220B1 (en) Consistent hashing using the power of k choices in server placement
JP2009295127A (ja) アクセス方法、アクセス装置及び分散データ管理システム
JP5387535B2 (ja) ファイル管理装置、プログラム並びに方法
KR101613513B1 (ko) 네트워크 대역폭 및 cpu 이용률을 고려한 가상머신 배치 방법 및 시스템
JP2015530021A (ja) 一次及び二次コネクション接続テーブルの使用
US11108854B2 (en) Peer-to-peer network for internet of things resource allocation operation
CN106605390A (zh) 控制装置、控制***、控制方法和控制程序
US20220200954A1 (en) Managing Access To Cloud-Hosted Applications Using Domain Name Resolution
US20230344796A1 (en) Secure message exchange between deployments
EP2622499B1 (en) Techniques to support large numbers of subscribers to a real-time event
da Silva et al. Energy-aware migration of groups of virtual machines in distributed data centers

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130423

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130702

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130923

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees