JP4404246B2 - データ特性に基づくバックアップシステム及び方法 - Google Patents

データ特性に基づくバックアップシステム及び方法 Download PDF

Info

Publication number
JP4404246B2
JP4404246B2 JP2003320771A JP2003320771A JP4404246B2 JP 4404246 B2 JP4404246 B2 JP 4404246B2 JP 2003320771 A JP2003320771 A JP 2003320771A JP 2003320771 A JP2003320771 A JP 2003320771A JP 4404246 B2 JP4404246 B2 JP 4404246B2
Authority
JP
Japan
Prior art keywords
backup
data
computer device
file
destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003320771A
Other languages
English (en)
Other versions
JP2005092282A (ja
Inventor
信之 雑賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003320771A priority Critical patent/JP4404246B2/ja
Priority to US10/794,241 priority patent/US7100007B2/en
Publication of JP2005092282A publication Critical patent/JP2005092282A/ja
Priority to US11/486,610 priority patent/US20060259724A1/en
Application granted granted Critical
Publication of JP4404246B2 publication Critical patent/JP4404246B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Description

本発明は、データのバックアップのための技術に関し、具体的には、例えば、通信ネットワークを介して複数のバックアップ先装置のうちの少なくとも1つの装置にデータをバックアップするための技術に関する。
従来、バックアップシステムとして、例えば、インターネット等の通信ネットワーク上に複数のバックアップ先サーバが存在し、それら複数のバックアップ先サーバから少なくとも1つのバックアップ先サーバを選択して、そのバックアップ先サーバにデータを転送することでデータをバックアップするシステムが知られている。このシステムにおいて、例えば、特開2002―215474号公報では、複数のバックアップ先サーバの信頼性、性能或いは処理速度から、バックアップするデータ(以下、バックアップ対象データ)の保存先とするバックアップ先サーバを上記複数のバックアップ先サーバの中から選択し、その選択されたバックアップ先サーバにバックアップ対象データが転送されてバックアップ処理が行なわれる。
特開2002―215474号公報
しかし、上述した従来のバックアップシステムでは、バックアップに際して、バックアップ対象データに関するデータ特性は考慮されていない。バックアップ対象データには、ユーザにとって様々なものがあると考えられる。例えば、他のデータとは区別してバックアップ処理を行なう必要があるバックアップ対象データもあれば、セキュリティを重視してバックアップ処理を行なわなければならないバックアップ対象データもあるであろうし、複数箇所にバックアップするなど信頼性を保たなければならないバックアップ対象データも存在すると考えられる。
このようなバックアップ対象データのデータ特性を考慮したバックアップを行うために、一つ一つのデータに対してどのようにバックアップ処理を行うかの設定を行なうことが考えられるが、そのような小さな単位でのバックアップ処理の設定は、冗長な作業となりユーザにとって面倒である。
従って、本発明の目的は、バックアップ対象データに関するデータ特性に適したバックアップ処理をユーザにとって簡易な方法で行なうことができるようにすることである。
本発明の一つの観点に従うバックアップシステムは、バックアップ対象データを記憶するバックアップ元コンピュータ装置と、バックアップ元コンピュータ装置とネットワークを介してそれぞれ接続された複数のバックアップ先コンピュータ装置と、予め用意された複数のバックアップモードの中からバックアップ対象データのデータ特性に応じて、いずれか1つのバックアップモードを選択するバックアップモード選択手段と、各バックアップ先コンピュータ装置のうち選択されたバックアップモードに基づいて選定されるバックアップ先コンピュータ装置に、バックアップ元コンピュータ装置からバックアップ対象データを転送させて記憶させるバックアップ実行手段と、を備える。
バックアップ元コンピュータ装置とバックアップ先コンピュータ装置とは、例えば、ファイルサーバ(NAS(Network
Attached Storage))等のように、ハードディスクや半導体メモリ装置等の記憶デバイスを利用可能なコンピュータシステムとして構成される。バックアップ元コンピュータ装置は、例えば、複数のユーザにより共有されるファイルシステムを備えることができる。バックアップ対象データとしては、例えば、各ユーザが作成したデータファイル、データベースの内容を構成するデータ群、ユーザシステム等の構成等を定義したシステムファイル等を挙げることができる。実施形態では、ファイル単位でバックアップが行われる。データ特性とは、例えば、バックアップ対象データの有するデータ利用上の特徴を意味する情報として定義可能であり、バックアップ対象データの使用目的や使用態様等に応じて分類することができる。
本発明では、予め定義された複数種類のデータ特性に応じて、それぞれバックアップモードが用意されている。管理者等からバックアップ指示が出されたり、あるいは、予め設定されたバックアップタイミングが到来すると、バックアップモード選択手段は、バックアップ対象データのデータ特性を判別し、このデータ特性に応じたバックアップモードを選択する。バックアップモードが選択されることにより、バックアップ対象データのバックアップ先として使用されるバックアップ先コンピュータ装置が決定される。バックアップ実行手段は、選定されたバックアップ先コンピュータ装置に対し、バックアップ対象データを転送させる。これにより、バックアップ対象データは、バックアップ先コンピュータ装置に記憶される。バックアップ対象データの転送方法としては、2種類に大別することができる。1つの方法は、バックアップ元コンピュータ装置からバックアップ先コンピュータ装置にバックアップ対象データを送信する方法である。他の1つの方法は、バックアップ先コンピュータ装置がバックアップ元コンピュータ装置にアクセスし、バックアップ対象データをダウンロードする方法である。
本発明の一態様では、バックアップモード選択手段は、予め用意された特性分類条件に基づいて、バックアップ対象データがいずれのデータ特性を有するかを決定するようになっている。
特性分類条件とは、バックアップ対象データが、予め定義された複数種類のデータ特性のうちいずれに属するかを判別するための判別情報である。ここで、特性分類条件によって予め分類されているデータ特性を、例えば、定義済データ特性、データ特性種類、データ特性カテゴリ等のように表現することもできる。
本発明の一態様では、バックアップモード選択手段は、バックアップ対象データに関して取得されたメタデータと特性分類条件とを比較することにより、バックアップ対象データがいずれのデータ特性を有するかを決定する。
バックアップ対象データに関して取得されるメタデータとしては、例えば、ファイル名、ファイルサイズ、更新日時、ファイル拡張子(即ちファイル種類)、ファイルに設定されたアクセス権管理情報、ファイルを共有する各ユーザ名、共有ユーザの総数、共有ユーザの属するカテゴリ(例えば、企画部門、経理部門、開発部門等の職域別カテゴリや、主任、課長、部長、役員等の階級別カテゴリ)等を挙げることができる。
データ特性には、データの信頼性確保を優先するデータ特性、または、データのセキュリティ確保を優先するデータ特性のいずれか1つが含まれている。
本発明の実施形態では、データの信頼性を重視するデータ特性及びデータのセキュリティを重視するデータ特性の双方を含んでいる。
データの信頼性確保を優先するデータ特性とは、データの整合性を維持し、破壊や喪失等からの防止が要求されているデータ特性の区分である。データの信頼性確保を優先するデータ特性は、例えば、共有ユーザ数、ファイルの拡張子の種類、ファイル名、書込み許可の有無の各判断要素のうち少なくとも1つ以上の判断要素を考慮して決定することができる。
データのセキュリティ確保を優先するデータ特性とは、データの秘密性を保持し、不正なコピー等からの防止が要求されているデータ特性の区分である。データのセキュリティ確保を優先するデータ特性は、例えば、暗号化の有無、共有ユーザ数、共有ユーザに共通する特徴、アクセス制限の有無、ファイルの拡張子の種類、ファイル名、所定のキーワードの有無の各判断要素のうち少なくとも1つ以上の判断要素を考慮して決定することができる。
本発明の一態様では、バックアップ実行手段は、予め各バックアップモード毎に各バックアップ先コンピュータ装置のうち少なくとも1つ以上のバックアップ先コンピュータ装置をそれぞれ対応付けて構成されたバックアップ先マッピング情報に基づいて、バックアップ先となるバックアップ先コンピュータ装置を選定している。
本発明の一態様では、バックアップ実行手段は、バックアップ先コンピュータ装置が取得すべきバックアップ対象データを特定する情報を含んだバックアップリストを生成するバックアップリスト生成手段と、バックアップリストをバックアップ先コンピュータ装置に送信するバックアップリスト送信手段とを有し、バックアップ先コンピュータ装置は、バックアップ元コンピュータ装置から受信したバックアップリストに基づいて、バックアップ元コンピュータ装置からバックアップ対象データを取得して記憶するデータ取得手段を有する。
ここで、バックアップ対象データを特定する情報としては、バックアップ対象データへのパス情報やファイル名等を挙げることができる。バックアップリストには、各バックアップ先コンピュータ装置毎に用意され、各バックアップリストには、各バックアップ先コンピュータ装置が取得すべきバックアップ対象データがそれぞれ明示されている。従って、バックアップ先コンピュータ装置は、自機宛のバックアップリストのみを参照することで、取得すべきバックアップ対象データを特定し、バックアップ元コンピュータ装置からバックアップ対象データを取得することができる。
本発明の一態様では、バックアップリストには、バックアップ対象データをバックアップ元コンピュータ装置から取得可能なバックアップ可能時期を示す情報が含まれており、バックアップ先コンピュータ装置は、バックアップ可能時期に従って、バックアップ元コンピュータ装置にアクセスし、バックアップ対象データを取得する。
バックアップリストにバックアップ可能時期を含ませることで、バックアップ可能時期以外の時期にバックアップ対象データが読み出されるのを未然に防止し、安全性を高めることができる。
本発明の一態様では、バックアップ先コンピュータ装置は、バックアップ元コンピュータ装置からバックアップリストを受信した場合に、バックアップ対象データのリストアに用いるためのリストア用データを生成し、この生成したリストア用データをバックアップ元コンピュータ装置に送信する。
例えば、リストア用データは、バックアップ先コンピュータ装置にバックアップされたデータ(またはデータ群)を特定するための識別情報を含めることができる。
本発明の一態様では、バックアップリスト送信手段は、バックアップ先コンピュータ装置にバックアップリストを送信する時期を制御する。
例えば、一方のバックアップ先コンピュータ装置に許可するバックアップ可能時期と、他方のバックアップ先コンピュータ装置に許可するバックアップ可能時期とをずらすことにより、各バックアップ先コンピュータ装置によるバックアップ処理の期間を調整し、バックアップ元コンピュータ装置の処理負荷や通信ネットワークのトラフィックを制御することができる。
本発明の別の観点に従うバックアップ方法は、バックアップ対象データを記憶するバックアップ元コンピュータ装置と、このバックアップ元コンピュータ装置とネットワークを介してそれぞれ接続された複数のバックアップ先コンピュータ装置との間でバックアップを行わせるバックアップ方法であって、データ特性を分類するための特性分類条件に基づいて、バックアップ対象データの属するデータ特性を決定するステップと、各データ特性毎にバックアップ先となるバックアップ先コンピュータ装置が少なくとも1つ以上対応付けられて構成されたバックアップ先マッピング情報と決定されたデータ特性とに基づいて、バックアップ対象データ毎にそれぞれバックアップ先コンピュータ装置を決定するステップと、バックアップ先コンピュータ装置に対応付けられた前記バックアップ対象データを、バックアップ先コンピュータ装置毎にまとめるステップと、バックアップ先コンピュータ装置が取得すべきバックアップ対象データを特定する情報を含んだバックアップリストをバックアップ先コンピュータ装置毎にそれぞれ生成するステップと、生成されたバックアップリストをバックアップ先コンピュータ装置に送信するステップと、受信したバックアップリストに基づいて、バックアップ元コンピュータ装置からバックアップ先コンピュータ装置にバックアップ対象データを転送させ記憶させるステップと、を含んだことを特徴とする。
本発明のさらに別の観点に従うコンピュータ装置は、データ特性を分類するための特性分類条件を記憶する手段と、特性分類条件に基づいて、バックアップ対象データの属するデータ特性を決定する手段と、各データ特性毎にバックアップ先となるバックアップ先コンピュータ装置が少なくとも1つ以上対応付けられて構成されたバックアップ先マッピング情報を記憶する手段と、バックアップ先マッピング情報と前記決定されたデータ特性とに基づいて、バックアップ対象データ毎にそれぞれバックアップ先コンピュータ装置を決定する手段と、バックアップ先コンピュータ装置に対応付けられたバックアップ対象データを、バックアップ先コンピュータ装置毎にまとめ、バックアップ先コンピュータ装置が取得すべきバックアップ対象データを特定する情報を含んだバックアップリストをバックアップ先コンピュータ装置毎にそれぞれ生成する手段と、生成されたバックアップリストをバックアップ先コンピュータ装置に送信する手段と、送信したバックアップリストに基づいてバックアップ先コンピュータ装置がバックアップ対象データの取得を要求した場合は、バックアップ対象データをバックアップ先コンピュータ装置に転送する手段と、を備えている。
本発明の他の観点に従うコンピュータプログラムは、バックアップ対象データを記憶するコンピュータ装置にバックアップ要求を発行させる方法を実行させるコンピュータプログラムであって、データ特性を分類するための特性分類条件に基づいて、バックアップ対象データの属するデータ特性を決定するステップと、各データ特性毎にバックアップ先となるバックアップ先コンピュータ装置が少なくとも1つ以上対応付けられて構成されたバックアップ先マッピング情報と前記決定されたデータ特性とに基づいて、バックアップ対象データ毎にそれぞれバックアップ先コンピュータ装置を決定するステップと、バックアップ先コンピュータ装置が取得すべきバックアップ対象データを特定する情報を含んだバックアップリストをバックアップ先コンピュータ装置毎にそれぞれ生成するステップと、生成されたバックアップリストをバックアップ先コンピュータ装置に送信するステップと、を含むバックアップ要求発行方法をコンピュータ装置に実行させる。
以下、図面を参照して本発明の実施の形態について説明する。
図1は、本発明の一実施形態に係るバックアップシステムの全体構成図である。
図1に示すように、本実施形態に係るバックアップシステムでは、1つ(又は複数)のバックアップ元データセンタ1と、複数(例えば3つ)のバックアップ先データセンタ(2A、2B、2C)が存在する。
バックアップ元データセンタ1は、バックアップ対象ファイルのバックアップ元となるデータセンタである。このセンタ1には、バックアップ対象ファイルを保持する1又は複数台のバックアップ元記憶装置4と、そのバックアップ元記憶装置4とSAN(Storage
Area Network)などの通信ネットワーク等を介して通信可能に接続することができるバックアップ元サーバ3とが備えられている。
一方、バックアップ先データセンタ(2A、2B、2C)は、バックアップ元データセンタ1に保存されるファイルのバックアップを保存するためのデータセンタである。例えば、センタ2Aには、バックアップ対象ファイルのバックアップを保存することができる1又は複数のバックアップ先記憶装置5Aと、バックアップ先記憶装置5とSANなどの通信ネットワーク等を介して通信可能に接続することができるバックアップ先サーバ6Aとが備えられている。他のセンタ2B(及び2C)も、図示のように、センタ2Aと同様の記憶装置5B(及び5C)とサーバ6B(及び6C)を備えている。
以下、各サーバ3及び6A〜6Cと、各記憶装置4及び5A〜5Cについて説明する。
バックアップ元サーバ3は、バックアップ元記憶装置4内の1又は複数のバックアップ対象ファイルを、それらバックアップ対象ファイルの各々のデータ特性に基づいて、共通のデータ特性を持つ1以上のファイルグループ(1以上のバックアップ対象ファイルを含んだグループ)に分類する。また、バックアップ元サーバ3は、各ファイルグループに属する1以上のバックアップ対象ファイルを、そのファイルグループにおける共通のデータ特性に基づく1以上のバックアップ先サーバ6A〜6Cに送信する。
バックアップ元記憶装置4は、例えば、外付け式又は内蔵型のハードディスク、或いは、1又は複数のハードディスクをアレイ状に備えた記憶システムであって、バックアップ対象ファイルを記憶することができるものである。このバックアップ元記憶装置4では、各種ファイルは、所定の形式、例えば、第1のディレクトリの下位に第2のディレクトリが属し、第2のディレクトリ内に1又は複数のファイルが格納されるような階層構造の下で管理されている。従って、例えば、バックアップ元サーバ3に対しオペレータが第1のディレクトリをバックアップ対象として指定すれば、第1のディレクトリの下位に存在する全てのディレクトリ及びファイルがバックアップ対象として指定されることになる。
バックアップ先サーバ6A〜6Cは、バックアップ元サーバ3からバックアップ対象ファイルを受信し、そのバックアップ対象ファイルを、通信可能に接続されているバックアップ先記憶装置5A〜5Cに格納する。
バックアップ先記憶装置5A〜5Cは、バックアップ元サーバ3からバックアップ先サーバ5A〜5Cを介してバックアップ対象ファイルが格納される記憶装置、例えば、1又は複数の磁気テープを備えた磁気テープライブラリ、或いは、1又は複数のハードディスクをアレイ状に備えた記憶システムである。
図2は、本実施形態に係るバックアップシステムを構成する各サーバ3及び6A〜6Cの機能を示すブロック図である。
バックアップ元サーバ3は、マイクロソフト社のWindows(登録商標)等のようなオペレーティングシステム(OS)10を備え、且つ、そのOS10の上位のアプリケーションソフトウェアとして、データ特性分類部11、バックアップ要求部12、ダウンロード受付部13及びリストア部14を備えている。
データ特性分類部11は、バックアップ元サーバ3が外部(例えばオペレータ或いは遠隔の外部装置)からバックアップ対象を指定されたとき、所定のタイミングで(例えば、バックアップ対象の指定後直ちに或いは定期的に)、指定されたバックアップ対象のファイルのメタデータ(及び/又は、そのファイルを包含する1以上のディレクトリのメタデータ)をバックアップ元記憶装置4から取得する。そして、データ特性分類部11は、取得したメタデータと、予め用意されているデータ特性分類定義情報とに基づいて、指定されたバックアップ対象ファイルの分類を行う。
ここで、ファイル(及びディレクトリ)の「メタデータ」とは、そのファイル(及びディレクトリ)に関する特性を表すものであって、例えば、以下の(1)〜(7)のサブ情報、
(1)共有ユーザ数(ファイル(及びディレクトリ)にアクセスして中身を閲覧することが許可されているユーザの数)、
(2)拡張子(例えば「jpg」や「gif」等)、
(3)キーワード(例えば、ファイル名、ディレクトリ名及び/又は実データに含まれている文字又は文字列)、
(4)書き込み許可の有無(書込みが許可されているか否か)、
(5)暗号化属性(暗号化されているか否を示す情報)、
(6)ACL(Access Control List)の設定の有無(どのユーザ又はどのユーザグループがどのような態様(例えば、読み込み、書き込み、或いは実行)でアクセス可能であるかを示す情報(つまりACL)が対応付けられているか否か)、
(7)各共有ユーザの特徴(例えば各共有ユーザの役職又は部署)、
のうちの少なくとも1種類の情報を含んでいる(なお、例えば(6)の「ACLの設定の有無」において、ACLの代わりに、アクセス制限に関する他の種類の情報(例えば所定のメッセージデータ)であっても良い)。
また、データ特性分類定義情報とは、バックアップ対象ファイルをどのように分類するかのルールに関する情報であり、所定の人間(例えば運用管理者)によって作成されて、通信ネットワーク上の所定場所(例えばバックアップ元サーバ3内或いはバックアップ元記憶装置4内)に保存されるものである。具体的には、例えば、図3に示すように、データ特性分類定義情報には、1以上のデータ特性種類をそれぞれ識別するための1以上のデータ特性IDと、1以上のデータ特性IDにそれぞれ対応した1以上のルール本体とが含まれている。ルール本体は、それに対応したデータ特性IDが付与されるための条件を表す情報(換言すれば、そのデータ特性IDに対応したデータ特性種類を表す情報)である。各ルール本体は、所定の構成、例えば、複数のサブ条件と、サブ条件間を接続する論理演算子(例えば、AND、OR、XOR等)とから成っている。この図3において、例えば、データ特性「ID−002」のルール本体は、ファイルが暗号化されておらず、かつ、ACLの設定が無く、かつ、アクセス可能なユーザグループに関する制限がなく(つまり共有ユーザは設定されておらず)、かつ、ファイルの拡張子が“.html”又は“.doc”又は“.xls”であることを表している。このルール本体が表す条件に該当するファイル(例えば、このルール本体の条件を満たすメタデータ又は実データを持ったファイル)があれば、そのファイルに対して、データ特性ID「ID―002」が付与される。
データ特性分類定義情報を作成する人間(以下、「作成者」と言う)は、図3に示した例に限らず、どんなサブ条件を用意するかや、用意した複数のサブ条件のうちどれとどれをどのように接続するかによって、様々なルール本体を作成することができる。
例えば、データ特性分類部11に、ファイル(又はディレクトリ)の信頼性を重視してファイルの分類を行なってもらいたい場合、例えば以下の(A)〜(C)の観点の少なくとも1つの観点に基づいてルール本体を作成することができる。
(A)共有ユーザ数に基づくサブ条件を用意し、それにより、データ特性分類部11に、共有ユーザ数に基づくファイル分類を行なわせる。例えば、共有ユーザ数が或る値以上のファイル(又はディレクトリ)は、アクセスするユーザ数が多い(又はアクセス頻度が高い)と考えられ、そうすると、ファイル損失による影響が大きく、信頼性が重視されるファイルであると判断できる。このため、作成者は、ルール本体の中に、サブ条件として「共有ユーザ数」について所望値を設定すると良く、それにより、データ特性分類部11の後に詳述する処理によって、共有ユーザ数が上記所望値以上であるファイル(又はディレクトリ)に、ファイルの信頼性が高いことを表すデータ特性IDが付与されることになる。
(B)拡張子又はキーワード(例えばメタデータ又は実データに含まれる文字列)に基づくサブ条件を用意し、それにより、データ特性分類部11に、拡張子又はファイル名に含まれる文字列に基づくファイル分類を行なわせる。例えば、拡張子“.sys”は、サーバプログラムなどの構成に関する定義ファイル等を保持しており、内容が変更されたり、破壊されたりした場合、サーバが正しく動作しなくなるなど、致命的なエラーを引き起こす原因となり、信頼性が重視されるとデータであると判断できる。一方で、例えば、一時的に作成されるテンポラリファイル(拡張子「tmp」)やワークディレクトリ(拡張子「wrk」)は、一時的なデータであるため、バックアップの必要がなく、バックアップ処理から排除するなどの判断も可能である。このため、作成者は、ルール本体の中に、サブ条件として、分類の際に選択されるための条件としての「拡張子」又は「キーワード」を設定したり、或いは、分類の際にバックアップ対象から外されるための条件としての「拡張子」又は「キーワード」を設定したりすると良く、それにより、データ特性分類部11の後に詳述する処理によって、ファイルの信頼性に基づくファイル分類が行われることになる。
(C)書込み許可されているユーザ数に基づくサブ条件を用意し、それにより、データ特性分類部11に、書込み許可されているユーザ数に基づくファイル分類を行なわせる。例えば、多くの人に共有され、かつ、書き込みが許可されているファイルは、ファイル破壊が引き起こされる可能性が高く、信頼性を重視して安全な状態でバックアップ処理が行なわれる必要があると判断できる。このため、作成者は、ルール本体の中に、サブ条件として、共有ユーザ数及び書込み許可の有無を設定すると良く、それにより、データ特性分類部11の後に詳述する処理によって、その観点に基づくファイル分類が行われることになる。
また、例えば、データ特性分類部11に、ファイル(又はディレクトリ)のセキュリティを重視してファイルの分類を行なってもらいたい場合、例えば以下の(a)〜(f)の観点の少なくとも1つの観点に基づいてルール本体を作成することができる。
(a)暗号化の有無に基づくサブ条件を用意し、それにより、データ特性分類部11に、暗号化の有無に基づくファイル分類を行なわせる。例えば、所定のOS(一例として、マイクロソフト社のWindows2000(登録商標)では、ファイルシステムでファイルの暗号化がサポートされており、ファイルの属性(例えばメタデータ)からそのファイルの暗号化の有無を確認することができるようになっているが、暗号化の設定がされている場合、そのファイルはセキュリティを確保する必要があるデータであると判断することができる。このため、作成者は、ルール本体の中に、サブ条件として「暗号化の有無」として暗号化有りを設定すると良く、それにより、データ特性分類部11の後に詳述する処理によって、高いセキュリティが求められているファイルに、セキュリティが高いことを表すデータ特性IDが付与されることになる。
(b)共有ユーザ数に基づくサブ条件を用意し、それにより、データ特性分類部11に、共有ユーザ数に基づくファイル分類を行なわせる。例えば、「共有ユーザ数」が或る値以下のファイルは、ファイルの公開が限定されていて秘密性が高いと判断することができる。このため、作成者は、ルール本体の中に、サブ条件として「共有ユーザ数」の値を設定すると良く、それにより、データ特性分類部11の後に詳述する処理によって、共有ユーザ数が所望値以上であるファイル(又はディレクトリ)に、セキュリティが高いことを表すデータ特性IDが付与されることになる。
(c)ACL設定の有無に基づくサブ条件を用意し、それにより、データ特性分類部11に、ACL設定の有無に基づくファイル分類を行なわせる。例えば、ACLが設定されているファイルは、アクセス制限が設けられており、セキュリティの確保が必要であるデータであると判断できる。このため、作成者は、ルール本体の中に、サブ条件として「ACL設定の有無」としてACL設定有りを設定すると良く、それにより、データ特性分類部11の後に詳述する処理によって、高いセキュリティが求められているファイルに、セキュリティが高いことを表すデータ特性IDが付与されることになる。
(d)共有ユーザの特徴(例えば部署又は役職)に基づくサブ条件を用意し、それにより、データ特性分類部11に、共有ユーザの特徴に基づくファイル分類を行なわせる。例えば、共有ユーザとして役職が高いユーザが多いなど特徴に偏りがあるファイルは、セキュリティの確保が必要であると判断できる。このため、作成者は、ルール本体の中に、サブ条件として「共有ユーザの特徴」を設定すると良く、それにより、データ特性分類部11の後に詳述する処理によって、高いセキュリティが求められているファイルに、セキュリティが高いことを表すデータ特性IDが付与されることになる。
(e)ファイル名(又はディレクトリ名)に基づくサブ条件を用意し、それにより、データ特性分類部11に、ファイル名(又はディレクトリ名)に基づくファイル分類を行なわせる。例えば、セキュリティの確保が必要だと分かっているファイルがある場合、作成者は、ルール本体の中に、サブ条件として、そのファイルのファイル名(又はそのファイルを持つディレクトリ名)を設定すると良く、それにより、データ特性分類部11の後に詳述する処理によって、そのファイルに、セキュリティが高いことを表すデータ特性IDが付与されることになる。
(f)メタデータ又は実データに含まれるキーワードに基づくサブ条件を用意し、それにより、データ特性分類部11に、メタデータ又は実データに含まれるキーワードに基づくファイル分類を行なわせる。例えば、メタデータ又は実データ内に、「(秘)」や「confidential」等のキーワードが繰り返し出てくるファイルは、セキュリティ確保が必要であると判断することができる。この場合、作成者は、ルール本体の中に、サブ条件として、メタデータ又は実データの「キーワード」として「(秘)」又は「confidential」(或いは、それに加えてそのキーワードの数)を設定すると良く、それにより、データ特性分類部11の後に詳述する処理によって、高いセキュリティが求められているファイルに、セキュリティが高いことを表すデータ特性IDが付与されることになる。
データ特性分類部11は、指定された1以上のバックアップ対象ファイルのメタデータ(及び/又は実データ)と、上述したデータ特性分類定義情報とに基づいて、それら1以上のバックアップ対象ファイルの各々に、そのファイルが満たす1以上のルール本体にそれぞれ対応した1以上のデータ特性IDが付与する(つまりバックアップ対象ファイルの分類を行う)。そして、データ特性分類部11は、分類結果に関するデータ、例えば、図4に例示するように、1以上のバックアップ対象ファイルの各々について、ファイルに関する情報(例えば、各ファイルのファイル名、パス名、データサイズ等)とそのファイルに付与された1以上のデータ特性IDとが関連付けられた分類結果データD21を出力する。なお、この図4に例示するように、ファイル分類に際して、データ特性分類部11は、どのルール本体の条件も満たさないファイルがある場合、そのファイルに対しては、該当無しの旨を表す所定コード(例えば「Default」)をデータ特性IDの代わりに或いはデータ特性IDの一つとして付与する。また、図4には格別示されていないが、複数のルール本体がそれぞれ示す複数の条件を満たすバックアップ対象ファイルが存在する場合があり、その場合には、1つのバックアップ対象ファイルに対して複数のデータ特性IDが付与される。
さて、再び図2を参照する。バックアップ要求部12は、所定タイミング、例えば、外部(例えば運用管理者)からバックアップ要求を受けたときに、データ特性分類部11から出力された分類結果データD21(図4参照)と、予め用意されているバックアップ先マッピング情報とを照合する。そして、バックアップ要求部12は、その分類結果データとバックアップ先マッピング情報とに基づいて、どのバックアップ先サーバにどのバックアップ対象ファイルを送信するかに関する情報、例えば後述のバックアップリストをバックアップ先サーバ6A〜6C毎に用意し、各バックアップリストを、それの宛先のバックアップ先サーバ6A〜6Cに送信する。
ここで、バックアップ先マッピング情報とは、図5に例示するように、どのデータ特性ID(及び上記該当無しの旨を表す「Default」)が付与されたファイルをどのバックアップ先サーバにバックアップするかを示す情報、換言すれば、複数のデータ特性IDの各々に関連付けられている1(又は複数)のバックアップ先サーバに関する情報(例えば、ホスト(サーバ)名、IPアドレス等)を含んだものである。このバップアップ先マッピング情報は、コンピュータによって自動で又は所定の人間(例えば運用管理者)によって手動で作成されて、通信ネットワーク上の所定場所(例えばバックアップ元サーバ3内或いはバックアップ元記憶装置4内)に予め保存されるものである。
また、バックアップリストは、バックアップ先サーバの数と同数個用意されるものであり、例えば、図6に例示する3つのバックアップリスト200A、200B及び200Cは、バックアップ要求部12によって、3つのバックアップ先サーバ6A、6B及び6Cに対してそれぞれ用意されたものである。バックアップリスト200Aについて代表的に説明すると、バックアップリスト200Aには、「受付日時」と、このリスト200Aに対応するバックアップ先サーバに関する情報(例えば図示のように「ホスト名」)と、「ファイルリスト」とが記録される。
「受付日時」は、バックアップ先サーバ6Aがバックアップ元サーバ3にアクセスすることが許可される日時(又は可能な時間帯)を示す情報であり、所定の単位(例えば、年月日時分秒)で表されている。この受付日時は、例えば、バックアップ要求部12によって自動的に割り振られるものであるが、所定のユーザ(例えば運用管理者)によって手動で定められるものであっても良い。バックアップ要求部12は、バックアップリスト200A〜200Cの各々の受付日時を一定の時間間隔(例えば、各バックアップ先サーバ6A〜6Cがバックアップ元サーバ3から所定の1以上のバックアップ対象ファイルを取得するのに必要と推測される時間間隔)でばらつかせることにより、バックアップ先サーバ6A〜6Cに対するバックアップ処理による負荷の集中を回避することができる。なお、所定の1以上のバックアップ対象ファイルを取得するのに必要とされる時間は、例えば、それらのバックアップ対象ファイルのデータサイズの合計から推測することができる。
「ホスト名」は、バックアップ先サーバ6Aの名称を表す情報である。
「ファイルリスト」は、バックアップ先サーバ6Aにバックアップされるものとして分類された1以上のバックアップ対象ファイルに関する情報(例えば、各ファイルのファイル名、パス名、データサイズ等)を一覧形式で表したものである。
他のバックアップリスト200B及び200Cも、上述したバックアップリスト200Aと略同様になっている。バックアップ要求部12は、以下のような流れで、バックアップリスト200A〜200Cを作成する。
図7は、バックアップ要求部12の処理の流れのイメージ図である。
図7に示すように、バックアップ要求部12は、データ特性分類部11が出力した分類結果データD21と、予め用意されているバックアップ先マッピング情報D22とを照合して、分類結果データD21に記述されているデータ特性IDをバックアップ先ホスト名(バックアップ先サーバ名)に置換したデータD23を得る。次に、バックアップ要求部12は、そのデータD23に記録されているファイル名とホスト名とのセットをホスト名でソートすることで、データD23を、それに記録されているファイル名とホスト名とのセットがホスト名でソートされたデータD24に変換する。そして、バックアップ要求部12は、そのデータD24を、ホスト名毎にファイルに分割して出力し、各出力ファイル毎に、上述した受付日時を付加することにより、バックアップ先サーバ6A〜6Cにそれぞれ対応したバックアップリスト200A〜200Cを作成する(なお、バックアップリスト200A〜200Cの各々は、更に小サイズのファイルに分割されても良く、その場合には、更に分割された各々のファイルに、受付日時が付加される)。
バックアップ要求部12は、このようにして作成したバックアップリスト200A〜200Cを、それぞれ対応するバックアップ先サーバ6A〜6Cに送信する。すると、バックアップ先サーバ6A〜6Cが、受信したバックアップリスト200A〜200Cについて識別情報(以下、「バックアップ識別情報」を付与し、そのバックアップ識別情報をバックアップ元サーバ3に送信する。バックアップ元サーバ3は、バックアップ先サーバ6A〜6Cの各々からバックアップ識別情報を受信し、バックアップ要求部12が、そのバックアップ識別情報に基づいて、バックアップ対象ファイルを復元するためのリストア情報を作成する(リストア情報並びにそれを用いた復元の処理については後に詳述する)。
なお、バックアップ要求部12は、バックアップ先サーバ6A〜6Cから後述するダウンロード要求を受けたときに、その要求を受けたときの日時の正当性のチェックを行ったり、その要求元のバックアップ先サーバ6A〜6Cに所定の1以上のバックアップ対象ファイルをバックアップしたり等するために、送信したバックアップリスト200A〜200Cを所定の記憶領域(例えば、バックアップ元サーバ3内又はバックアップ元記憶装置4内の所定の記憶領域)に保存しておく。
再び図2を参照する。ダウンロード受付部13は、バックアップ先サーバ6A〜6Cからバックアップ対象ファイルのダウンロード(転送)要求を受け付け、その要求があった場合、その要求を受けた日時が正当な日時か否かをチェックする。具体的には、例えば、ダウンロード受付部13は、バックアップ先サーバ6Aからダウンロード要求を受けた場合、そのときの日時と、事前にバックアップ先サーバ6Aに対してバックアップ元サーバ3が指定した日時(すなわち、バックアップ要求部12が出力したバックアップリスト200Aに書かれている受付日時)とが完全に或いは実質的に一致している否かどうかを判定する。一致していれば、ダウンロード受付部13は、バックアップファイル200Aに書かれている1以上のファイル名をそれぞれ有する1以上のバックアップ対象ファイルを所定の場所(例えばバックアップ元記憶装置4)から読出し、それらを、ダウンロード要求の要求元であるバックアップ先サーバ6Aに送信する。一方、一致していなければ、ダウンロード受付部13は、所定の処理、例えば、エラーをバックアップ先サーバ6Aに通知する。なお、上記の「実質的に一致」とは、例えば、ダウンロード要求を受けたときの現在日時と上記受付日時との差が所定の誤差範囲内であることを意味し、その所定の誤差範囲は、全てのバックアップリストに共通でも良いし、バックアップリストによって様々であっていても良い。また、その所定の誤差範囲は、所定ユーザが変更可能であっても良いし、変更不可能に固定であっても良い。また、その所定の誤差範囲は、バックアップリストから独立して所定の記憶装置に記憶されていても良いし、バックアップリストに記述されても良い。
リストア部14は、バックアップ要求部12によって作成された上記のリストア情報に基づいて、バックアップ対象ファイルのリストアを行う(リストアの処理については後に詳述する)。
以上が、バックアップ元サーバ3に備えられる各アプリケーションについての説明である。次に、図2を参照して、バックアップ先サーバ6A〜6Cについて、バックアップ先サーバ6Aを代表的に説明する(なお、図2では、バックアップ先サーバ6Aが代表的に示されているが、他のバックアップ先サーバ6B及び6Cもバックアップ元サーバ3と通信することができる)。
バックアップ先サーバ6Aは、オペレーティングシステム(OS)20を備え、且つ、そのOSの上位のアプリケーションソフトウェアとして、バックアップ要求受付部21を備えている。
バックアップ要求受付部21は、バックアップ元サーバ3からバックアップリスト200Aを受信して所定の記憶領域(例えば、バックアップ先サーバ6A内又はバックアップ先記憶装置5A内の所定の記憶領域)に格納すると共に、そのバックアップリスト200に基づくバックアップのバックアップ識別情報を生成して、それも、所定の記憶領域に格納する。そして、バックアップ要求受付部21は、バックアップ処理プロセスを起動後、上記格納したバックアップ識別情報をバックアップ元サーバ3に送信する。ちなみに、バックアップ処理プロセスは、現在の日時が、受信し格納したバックアップリスト200Aに記載の受付日時に達するまで(受付日時が時間帯で表されている場合はその時間帯の範囲内に入るまで)待ち状態となる。バックアップ要求受付部21は、現在の日時が、バックアップリスト200Aの受付日時に達したときに、バックアップ処理プロセスを起動し、バックアップ元サーバ3のダウンロード受付部13に対して、ダウンロード(転送)要求を行なうと共に、上記格納したバックアップ識別情報を持ったアーカイブファイルを作成する。
図8は、バックアップ要求受付部21によって作成されるアーカイブファイルの構成を示す。
例えばバックアップリスト200Aについてのアーカイブファイルには、図示のように、そのバックアップリスト200Aについて生成されたバックアップ識別情報と、バックアップ対象ファイルのエントリ数(すなわち、このアーカイブファイルに格納されるバックアップ対象ファイルの数)と、そのエントリ数分のバックアップ対象情報(例えば、各ファイルのデータサイズ、バックアップ元サーバ3でのパス、及び本体(ファイルの中身))とが格納されるようになっている。
図2に示したバックアップ要求受付部21は、上記ダウンロード要求に応答して、バックアップ元サーバ3から、バックアップリスト200Aに記録されている1以上のバックアップ対象ファイルをダウンロードしたときは、それらを、上記アーカイブファイルに格納する。アーカイブファイルにバックアップ対象ファイルを格納する処理が完了したら、バックアップ要求受付部21は、バックアップ対象ファイルを含んだアーカイブファイルをバックアップ先記憶装置5Aに格納する。
以下、フローチャートを用いて、上述した各アプリケーションの処理の流れを説明する。
図9は、バックアップ元サーバ3に備えられるデータ特性分類部11の処理の流れを示すフローチャートである。
所定ユーザ(例えば運用管理者)は、バックアップ元サーバ3に、バックアップ対象のディレクトリ(或いは、バックアップ対象ファイルを持ったディレクトリ)を入力する(ステップS1)。また、データ特性分類部11は、予め設定し記憶されているデータ特性分類定義情報(図3参照)を読み込む(S2)。
次に、データ特性分類部11は、S1で入力されたディレクトリに含まれる(つまりそのディレクトリの下の階層に存在する)ディレクトリ及びファイルを検索し、検索されたファイル又はディレクトリがあれば(S3でYES)、それら全てのファイル及びディレクトリのメタデータ(及び/又は実データ)を取得する(S4)。
次に、データ特性分類部11は、S4で取得した各ファイル(及びディレクトリ)のメタデータ(及び/又は実データ)と、S2で読み込んだデータ特性分類定義情報とを照合し(S5)、各バックアップ対象ファイルに該当するデータ特性IDを把握しそれをそのファイルに関連付けることで、バックアップ対象ファイルのデータ特性に基づく分類を行い、その分類結果を表す分類結果データ(図4参照)を出力し(S6)、所定の記憶領域に格納する。なお、例えば、データ特性分類部11は、S1で入力されたディレクトリ内にある複数のファイルを1個ずつ読み込み、S4〜S6を繰り返し実行しても良い。すなわち、データ特性分類部11は、S1で入力されたディレクトリ内にある複数のファイルから或る1つのファイルを読み出してS4〜S6を行った後、別の1つのファイルを読み出してS4〜S6を行い、このような処理を、それら複数のファイルの全てについて終了するまで繰り返し行っても良い。
さて、このような分類処理によって、S3で検索された1以上のバックアップ対象ファイルが、それのデータ特性に基づき、所定の基準、例えば上述した(A)〜(C)及び(a)〜(f)のうちの少なくとも1つの基準に従って分類される。すなわち、例えば、ファイルの共有ユーザ数、共有ユーザに共通する特徴、拡張子、キーワード、ACL等のアクセス制限情報の設定の有無、及び暗号化の有無の少なくとも1つに基づいて、各バックアップ対象ファイルに1以上の特性IDデータが付与される。
なお、この分類処理では、バックアップ対象ファイル(及び/又はディレクトリ)のメタデータ(又は実データ)の内容によっては、複数のルール本体が表す条件を満たす場合があり、その場合は、1つのバックアップ対象ファイルに対して複数のデータ特性IDが付与される。また、上記マッピング情報において、1つのデータ特性IDに対して2以上のサーバ情報(例えばホスト名)が対応付けられている場合は、1つのバックアップ対象ファイルが、2以上のサーバにバックアップされることになる。
上述した一連のフローは、バックアップ対象が指定されたとき、所定のタイミング、例えば、その指定の直後に行われるようにすることもできるし、或いは、その指定の後定期的或いは不定期に行われるようにすることもできる。後者の場合、例えば、ユーザは、予め用意した所望ディレクトリをバックアップ対象として指定しておき、その所望ディレクトリにファイルを格納していけば、定期的等の所定タイミングで、自動的に、その所望ディレクトリに格納されたファイルの分類が行われることになる。
図10及び図11は、バックアップ要求部12の処理の流れを示すフローチャートである。
バックアップ要求部12は、所定タイミング、例えば、外部(例えば運用管理者)からバックアップ要求を受けたときに、図10に示すように、データ特性分類部11が出力した分類結果データを所定の記憶領域から読み込む(S11)。
次に、バックアップ要求部12は、予め記憶されているバックアップ先マッピング情報を読み込む(S12)。
次に、バックアップ要求部12は、カウンタの値を「0」に設定し(S13)、分類結果データに記録されているファイルの数と比較する(S14)。バックアップ要求部12は、カウンタの値が分類結果データに記録されているバックアップ対象ファイルのファイル数に達するまで(S14でNO)、以下の(S15)〜(S18)の処理を行う。
(S15) バックアップ要求部12は、分類結果データに記録されているターゲットのファイル名(又はパス名)に対応したデータ特性IDを取得する。
(S16) バックアップ要求部12は、バックアップ先マッピング情報を参照し、S15で取得したデータ特性IDに対応したホスト名を取得する。
(S17) バックアップ要求部12は、S15におけるターゲットのファイル名に、S16で取得したホスト名を関連付け、ファイル名とホスト名との組を1レコードにして、所定の一時ファイル(例えば図8に示したデータファイルD23)に出力する。
(S18) バックアップ要求部12は、カウンタの値を一つインクリメントする。
以上の(S15)〜(S18)の処理によって、カウンタの値が分類結果データに記録されているファイル数に達したら(S14でYES)、バックアップ要求部12は、上記一時ファイルに記録されている1以上のレコードをホスト名でソートする(S19)。
次に、バックアップ要求部12は、ホスト名でレコードがソートされた一時ファイルを、ホスト名に基づいて分割、すなわち、一時ファイルに記録されているホスト名の種類(つまりバックアップ先サーバ6A〜6C)と同数のファイルに分割し、分割されて得られたファイルに上記受信日時を記録することで、バックアップ先サーバ6A〜6Cにそれぞれ対応したバックアップリスト200A〜200Cを作成し、出力する(S20)。
次に、図11に示すように、バックアップ要求部12は、全てのバックアップリスト200A〜200Cについて、以下の処理を行なう。
すなわち、まず、バックアップ要求部12は、バックアップリスト200A〜200Cからホスト名(バックアップ先サーバ名)を取得してバックアップ先サーバ6A〜6Cを把握する(S25)。
次に、バックアップ要求部12は、バックアップリスト200A〜200Cを、それぞれ、S25で把握されたバックアップ先サーバ6A〜6Cに送信する(S26)。また、バックアップ要求部12は、それらバックアップリスト200A〜200Cを、所定の記憶領域に格納する。
その後、バックアップ要求部12は、バックアップ先サーバ6A〜6Cから、上述したバックアップ識別情報を含む応答を受信する(S27)。そしてバックアップ要求部12は、その応答に含まれているバックアップ識別情報と、その情報の送信元のバックアップ先サーバに関する情報(例えばホスト名)とを組にして、所定のファイル(例えば後述するリストアファイル)に出力する(S28)。
図12は、ダウンロード受付部13の処理の流れを示すフローチャートである。
ダウンロード受付部13は、例えばバックアップ先サーバ6Aから、そのサーバ6Aのホスト名を含んだダウンロード要求を受信した場合(S31でYES)、バックアップ要求部12が出力した全てのファイルリスト200A〜200Cから受信日時及びホスト名を取得する(S32)。
ダウンロード受付部13は、S31で受信したダウンロード要求に含まれているホスト名及び現在の日時と、S32で取得したホスト名及び受信日時とを比較し、一致するか否かを判断する(S33)。
S23の判断の結果、一致する場合(S33でYES)、ダウンロード受付部13は、バックアップリスト200Aに記述されている1以上のファイル名をそれぞれ有する1以上のバックアップ対象ファイルをバックアップ元記憶装置4から読み出し、読み出した1以上のバックアップ対象ファイルを、ダウンロード要求の発信元のバックアップ先サーバ6Aに送信する(S34)。
一方、S23の結果、一致しない場合は、ダウンロード受付部13は、エラーをバックアップ先サーバ6Aに送信する(S35)。
図13及び図14は、バックアップ先サーバのバックアップ要求受付部21の処理の流れを示す。以下、そのバックアップ先サーバを、バックアップ先サーバ6Aとして説明する。
図13に示すように、バックアップ先サーバ6Aのバックアップ要求受付部21は、バックアップ元サーバ3のバックアップ要求部12からバックアップリスト200Aを受信し(S41)、所定の記憶領域に格納する。
次に、バックアップ要求受付部21は、そのバックアップリスト200Aに関するバックアップ識別情報を作成する(S42)。
次に、バックアップ要求受付部21は、バックアップ処理プロセスを生成し、起動する(S43)。
次に、バックアップ要求受付部21は、S42で作成したバックアップ識別情報を、バックアップ元サーバ3のバックアップ要求部12へ送信する(S44)。
その後、図14に示すように、バックアップ要求受付部21は、S43で起動したバックアップ処理プロセスにより、現在の日時がバックアップリスト200Aに記述の受付日時に達したことが検出されたときは(S51でYES)、S42で作成したバックアップ識別情報を持つアーカイブファイル(図8参照)を作成する(S52)。
次に、バックアップ要求受付部21は、バックアップリスト200に関する情報をアーカイブファイルに記録する(S53)。例えば、バックアップ要求受付部21は、バックアップリスト200に基づいて、作成したアーカイブファイルに、バックアップリスト200Aに記録されているファイル名の数をエントリ数として登録したり、各ファイルのパス(バックアップ元サーバ3でのパス)を登録したり等する。
次に、バックアップ要求受付部21は、バックアップリスト200Aに書かれている1以上のファイル名をそれぞれ有する1以上のバックアップ対象ファイルをバックアップ元サーバ3から受信し(S54でYES、S55)、受信したバックアップ対象ファイルをアーカイブファイルに格納する(S56)。
バックアップ要求受付部21は、全てのバックアップ対象ファイルをダウンロードしてアーカイブファイルに格納したら(S54でNO)、そのアーカイブファイルをバックアップ先記憶装置5Aに格納する(S57)。
以上、上述した実施形態によれば、1以上のデータ特性種類の各々に1又は複数のデータ特性IDが対応付けられたデータ特性分類定義情報と、1又は複数のデータ特性IDの各々に1又は2以上のバックアップ先サーバ情報(例えばサーバ名)が対応付けられたマッピング情報とが用意されている。バックアップ元サーバ3は、バックアップ対象の指定を受けると、所定のタイミングで、指定されたファイル(及び/又はディレクトリ)のメタデータ(及び/又は実データ)と、上記データ特性分類定義情報とに基づいて、各バックアップ対象ファイルにデータ特性ID(換言すればデータ特性種類)を設定し、更に、その設定したデータ特性IDとマッピング情報とに基づいて、各バックアップ対象ファイルのバックアップ先サーバ6A〜6Cを決定し、各バックアップ対象ファイルを決定したサーバ6A〜6Cに送信する。これにより、上記データ特性分類定義情報及びマッピング情報(代わりに、1以上のデータ特性種類の各々に1又は2以上のバックアップ先サーバ情報が対応付けられた情報)を用意しておきさえすれば、指定されたバックアップ対象は、自動的に、そのバックアップ対象のデータ特性に基づき、そのバックアップ対象のデータ特性種類に応じたバックアップ先にバックアップされる。すなわち、バックアップ対象に関するデータ特性に適したバックアップ処理がユーザにとって簡易な方法で行なわれる。
また、上述した実施形態によれば、バックアップ元サーバ3は、或るバックアップ先サーバ6Aからダウンロード要求を受けたときの現在日時が、そのサーバ6Aのバックアップリスト200Aに割当てた受付日時と一致しない場合、つまり、所定の受付日時以外の日時にダウンロード要求を受けてもバックアップ対象ファイルのバックアップを行わない。これにより、バックアップ対象ファイルが不正にダウンロードされることを未然に防げ、バックアップ対象ファイルのセキュリティを高めることができる。
ところで、上述した実施形態において、バックアップ先サーバ6A〜6Cがバックアップリスト200A〜200Cを受けて作成するバックアップ識別情報は、バックアップ元サーバ3が、そのバックアップリスト200A〜200Cに書かれているバックアップ対象ファイルを復元するために使用されるものである。バックアップリスト200A〜200Cにそれぞれ対応したバックアップ識別情報は、対応したバックアップリストに書かれているバックアップ対象ファイルをバックアップ元サーバ3がバックアップ先サーバ6A〜6Cから取得できるようになっていればどのようなものでも良い。例えば、バックアップ識別情報は、バックアップ先サーバ名、そこにバックアップされるバックアップ対象ファイルの名称、及びデータサイズの少なくとも1つを含んだ情報にすることができ、その場合、バックアップ元サーバ3は、そのような情報を管理することで、どのバックアップ先サーバに、どんなファイルが保存されるかを知ることができる。
バックアップ元サーバ3は、バックアップ先サーバ6A〜6Cからそれぞれバックアップ識別情報を受信した場合、例えば、図15に示すような所定のリストアファイルD30に、複数のバックアップ先サーバ6A〜6Cに関する情報(例えばホスト名)に、サーバ6A〜6Cの各々に対応するバックアップ識別情報を対応付けて記録する。
そして、バックアップ元サーバ3は、上述したリストアファイルD30を用いて、以下のようにして、バックアップ対象ファイルをバックアップ元記憶装置4に復元する。
図16は、バックアップ元サーバ3のリストア処理の流れを示す。
バックアップ元サーバ3は、リストアファイルD30に記録されている全てのホスト名をそれぞれ持つ全てのサーバ6A〜6Cに関して、以下の(S61)〜(S65)の処理を行なう。以下、サーバ6Aについて代表的に説明する。
(S61) バックアップ元サーバ3は、バックアップ先サーバ6Aに接続する。
(S62) バックアップ元サーバ3は、接続先のサーバ6Aのバックアップ識別情報をリストアファイルD30から読み込み、且つ、後にバックアップ先サーバ6Aから取得することになるバックアップ対象ファイルの格納先ディレクトリをバックアップ元記憶装置5に設定して、そのパスを取得する。
(S63) バックアップ元サーバ3は、読み込んだバックアップ識別情報をバックアップ先サーバ6Aに通知して、そのサーバ6に、そのバックアップ識別情報に基づいて、復元対象のバックアップ対象ファイルを格納しているアーカイブファイルを特定させ、特定されたアーカイブファイルからバックアップ対象ファイルを取得させて、その取得されたバックアップ対象ファイルをバックアップ先サーバ6Aから受ける。
(S64) バックアップ元サーバ3は、S62で取得したパスに基づき、バックアップ先サーバ6Aから受けたバックアップ対象ファイルを、S62で設定したディレクトリに格納する。
(S65) バックアップ元サーバ3は、バックアップ先サーバ6Aとの接続を切断する。
以上の処理によって、バックアップ元サーバ3は、バックアップ先サーバ6A〜6Cにそれぞれバックアップされた1以上のバックアップ対象ファイルを、バックアップ元記憶装置5に復元することができる。
以上、本発明の好適な実施形態を説明したが、これは本発明の説明のための例示であって、本発明の範囲をこの実施形態にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。
例えば、バックアップ要求部12は、バックアップリスト200A〜200Cの各々の受付日時を一定の時間間隔(例えば、各バックアップ先サーバ6A〜6Cがバックアップ元サーバ3から所定の1以上のバックアップ対象ファイルを取得するのに必要と推測される時間間隔)でばらつかせることにより、バックアップ先サーバ6A〜6Cに対するバックアップ処理による負荷の集中を回避することができる。この受付時間は、バックアップ要求する人間が、手動で定めたものであっても良いし、バックアップ元サーバ3が自動で定めるものであっても良い。自動で定める場合、例えば、バックアップ元サーバ3は、バックアップ先サーバ6A〜6C毎に、バックアップされる1以上のバックアップ対象ファイルのトータルデータサイズを把握し、そのデータサイズに基づいて、バックアップに要する時間を推測し、その推測された時間に基づいて、受付日時をスケジューリングすることができる(例えば、推測されたバックアップ時間長が短い順又は長い順に受付日時を設定しても良い)。
また、例えば、バックアップ先サーバ6A〜6Cは、バックアップ元サーバ3からバックアップリストを受信した直後に、ダウンロード要求をしても良い。その場合、例えば、バックアップリストには、受付日時は記載されなくても良いし、或いは、上記ダウンロード要求をした場合、通信トラフィックが混雑している場合にのみ、バックアップリストに記述されている受付日時に再度ダウンロード要求するようにしても良い。また、この場合、例えば、バックアップ元サーバ3は、バックアップリスト200A〜200Cの全てを同時にバックアップ先サーバ6A〜6Cに送信しても良いし、バックアップリスト200A〜200を送信するタイミングをスケジューリングし、別々のタイミングで送信しても良い。バックアップリストの受信直後にバックアップ先サーバがダウンロード要求するようになっている場合、バックアップリスト200A〜200Cの送信タイミングを調整することで、バックアップ元サーバ3やネットワークの負荷集中を回避することが可能となる。なお、バックアップリストの送信タイミングは、例えば、バックアップ先サーバ6A〜6C毎の1以上のバックアップ対象ファイルのトータルデータサイズを把握し、そのデータサイズに基づいて、バックアップに要する時間を推測し、その推測された時間に基づいて、スケジューリングされても良い(例えば、推測されたバックアップ時間長が短い順又は長い順に上記送信タイミングを早くしても良い)。
本発明の一実施形態に係るバックアップシステムの全体構成図。 本実施形態に係るバックアップシステムを構成する各サーバ3及び6A〜6Cの機能を示すブロック図。 データ特性分類定義情報の一例を示す。 分類結果データの一例を示す。 バックアップ先マッピング情報の一例を示す。 バックアップリスト200A、200B及び200Cの一例を示す。 バックアップ要求部12の処理の流れのイメージ図。 バックアップ要求受付部21によって作成されるアーカイブファイルの構成を示す。 バックアップ元サーバ3に備えられるデータ特性分類部11の処理の流れを示すフローチャート。 バックアップ要求部12の処理の流れを示すフローチャート。 バックアップ要求部12の処理の流れを示すフローチャート。 ダウンロード受付部13の処理の流れを示すフローチャート。 バックアップ先サーバのバックアップ要求受付部21の処理の流れを示す。 バックアップ先サーバのバックアップ要求受付部21の処理の流れを示す。 リストアファイルの一例を示す。 バックアップ元サーバ3のリストア処理の流れを示す。
符号の説明
3 バックアップ元サーバ
4 バックアップ元記憶装置
5A〜5C バックアップ先記憶装置
6A〜6C バックアップ先サーバ
11 データ特性分類部
12 バックアップ要求部
13 ダウンロード受付部
14 リストア部
21 バックアップ要求受付部

Claims (4)

  1. バックアップ対象ファイルを記憶するバックアップ元コンピュータ装置と、
    前記バックアップ元コンピュータ装置とネットワークを介してそれぞれ接続された複数のバックアップ先コンピュータ装置と
    を備え、
    前記バックアップ元コンピュータ装置は、
    (a)前記バックアップ対象ファイルのメタデータを取得し、データ特性に関する複数の条件を表すルール本体を複数個と各ルール本体に対応付けられたデータ特性IDとを含んだデータ特性分類定義情報と、前記取得したメタデータとを照合することにより、そのメタデータが適合するルール本体に対応したデータ特性IDを選択し、
    (b)データ特性ID毎に少なくとも1つ以上のバックアップ先コンピュータ装置がそれぞれ対応付けられているバックアップ先マッピング情報に基づいて、前記選択されたデータ特性IDに対応するバックアップ先コンピュータ装置を選択し、
    (c)前記選択されたバックアップ先コンピュータ装置が取得すべきバックアップ対象ファイルを特定する情報と前記バックアップ対象ファイルを前記バックアップ元コンピュータ装置から取得可能なバックアップ可能時期を示す情報とを含んだバックアップリストを生成し、前記バックアップリストを、前記選択されたバックアップ先コンピュータ装置に送信し、
    前記選択されたバックアップ先コンピュータ装置が、前記バックアップ元コンピュータ装置から受信したバックアップリスト内の前記バックアップ可能時期に従って、前記バックアップ元コンピュータ装置にアクセスし、そのバックアップリストから特定されるバックアップ対象ファイルを前記バックアップ元コンピュータ装置から取得して記憶する
    バックアップシステム。
  2. 前記バックアップ先コンピュータ装置は、前記バックアップ元コンピュータ装置から前記バックアップリストを受信した場合に、前記バックアップ対象ファイルのリストアに用いるためのリストア用データを生成し、この生成したリストア用データを前記バックアップ元コンピュータ装置に送信する、
    請求項に記載のバックアップシステム。
  3. 前記バックアップ元コンピュータ装置は、前記バックアップ先コンピュータ装置に前記バックアップリストを送信する時期を制御する、
    請求項に記載のバックアップシステム。
  4. バックアップ対象ファイルを記憶するバックアップ元コンピュータ装置と、このバックアップ元コンピュータ装置とネットワークを介してそれぞれ接続された複数のバックアップ先コンピュータ装置との間でバックアップを行わせるバックアップ方法であって、
    前記バックアップ元コンピュータ装置が、データ特性に関する複数の条件を表すルール本体を複数個と各ルール本体に対応付けられたデータ特性IDとを含んだデータ特性分類定義情報と、前記バックアップ対象ファイルのメタデータとを照合することにより、そのメタデータが適合するルール本体に対応したデータ特性IDを選択するステップと、
    前記バックアップ元コンピュータ装置が、データ特性ID毎に少なくとも1つ以上の場バックアップ先コンピュータ装置が対応付けられているバックアップ先マッピング情報に基づいて、前記選択されたデータ特性IDに対応するバックアップ先コンピュータ装置を選択するステップと、
    前記バックアップ元コンピュータ装置が、前記選択されたバックアップ先コンピュータ装置が取得すべきバックアップ対象ファイルを特定する情報と前記バックアップ対象ファイルを前記バックアップ元コンピュータ装置から取得可能なバックアップ可能時期を示す情報とを含んだバックアップリストを生成し、前記バックアップリストを、前記選択されたバックアップ先コンピュータ装置に送信するステップと、
    前記選択されたバックアップ先コンピュータ装置が、前記バックアップ元コンピュータ装置から受信したバックアップリスト内の前記バックアップ可能時期に従って、前記バックアップ元コンピュータ装置にアクセスし、そのバックアップリストから特定されるバックアップ対象ファイルを前記バックアップ元コンピュータ装置から取得して記憶するステップと
    を含んだことを特徴とするバックアップ方法。
JP2003320771A 2003-09-12 2003-09-12 データ特性に基づくバックアップシステム及び方法 Expired - Fee Related JP4404246B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2003320771A JP4404246B2 (ja) 2003-09-12 2003-09-12 データ特性に基づくバックアップシステム及び方法
US10/794,241 US7100007B2 (en) 2003-09-12 2004-03-05 Backup system and method based on data characteristics
US11/486,610 US20060259724A1 (en) 2003-09-12 2006-07-13 Backup system and method based on data characteristics

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003320771A JP4404246B2 (ja) 2003-09-12 2003-09-12 データ特性に基づくバックアップシステム及び方法

Publications (2)

Publication Number Publication Date
JP2005092282A JP2005092282A (ja) 2005-04-07
JP4404246B2 true JP4404246B2 (ja) 2010-01-27

Family

ID=34269936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003320771A Expired - Fee Related JP4404246B2 (ja) 2003-09-12 2003-09-12 データ特性に基づくバックアップシステム及び方法

Country Status (2)

Country Link
US (2) US7100007B2 (ja)
JP (1) JP4404246B2 (ja)

Families Citing this family (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6879988B2 (en) * 2000-03-09 2005-04-12 Pkware System and method for manipulating and managing computer archive files
US8230482B2 (en) * 2000-03-09 2012-07-24 Pkware, Inc. System and method for manipulating and managing computer archive files
US20060143714A1 (en) * 2000-03-09 2006-06-29 Pkware, Inc. System and method for manipulating and managing computer archive files
US8959582B2 (en) 2000-03-09 2015-02-17 Pkware, Inc. System and method for manipulating and managing computer archive files
US7844579B2 (en) * 2000-03-09 2010-11-30 Pkware, Inc. System and method for manipulating and managing computer archive files
US20060173847A1 (en) * 2000-03-09 2006-08-03 Pkware, Inc. System and method for manipulating and managing computer archive files
US20050015608A1 (en) 2003-07-16 2005-01-20 Pkware, Inc. Method for strongly encrypting .ZIP files
US7526795B2 (en) * 2001-03-27 2009-04-28 Micron Technology, Inc. Data security for digital data storage
JP2004015141A (ja) * 2002-06-04 2004-01-15 Fuji Xerox Co Ltd データ伝送システムおよびその方法
WO2004053696A1 (ja) * 2002-12-11 2004-06-24 Fujitsu Limited バックアップシステム,バックアップ制御装置,バックアップデータ管理方法,バックアップ制御プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
JP4354233B2 (ja) * 2003-09-05 2009-10-28 株式会社日立製作所 バックアップシステム及び方法
WO2005050952A1 (en) * 2003-11-21 2005-06-02 Nimcat Networks Inc. Back up of network devices
US8224784B2 (en) * 2004-08-13 2012-07-17 Microsoft Corporation Combined computer disaster recovery and migration tool for effective disaster recovery as well as the backup and migration of user- and system-specific information
US20060070120A1 (en) * 2004-09-02 2006-03-30 Brother Kogyo Kabushiki Kaisha File transmitting device and multi function device
US7567974B2 (en) 2004-09-09 2009-07-28 Microsoft Corporation Method, system, and apparatus for configuring a data protection system
US8145601B2 (en) 2004-09-09 2012-03-27 Microsoft Corporation Method, system, and apparatus for providing resilient data transfer in a data protection system
TWI252413B (en) * 2004-12-10 2006-04-01 Hon Hai Prec Ind Co Ltd System and method for updating remote computer files
US8291160B2 (en) 2005-02-17 2012-10-16 Overland Storage, Inc. Tape library emulation with automatic configuration and data retention
US7600133B2 (en) * 2005-02-24 2009-10-06 Lenovo Singapore Pte. Ltd Backing up at least one encrypted computer file
JP2006236019A (ja) * 2005-02-25 2006-09-07 Hitachi Ltd データコピー方式の切替方法
US20060218435A1 (en) * 2005-03-24 2006-09-28 Microsoft Corporation Method and system for a consumer oriented backup
TW200638190A (en) * 2005-04-28 2006-11-01 Farstone Tech Inc Backup/recovery system and the method thereof
US20060288057A1 (en) * 2005-06-15 2006-12-21 Ian Collins Portable data backup appliance
JP2007025858A (ja) * 2005-07-13 2007-02-01 Konica Minolta Photo Imaging Inc 表示プログラム
US7734589B1 (en) 2005-09-16 2010-06-08 Qurio Holdings, Inc. System and method for optimizing data uploading in a network based media sharing system
US7747574B1 (en) * 2005-09-19 2010-06-29 Qurio Holdings, Inc. System and method for archiving digital media
US7844445B2 (en) * 2005-10-12 2010-11-30 Storage Appliance Corporation Automatic connection to an online service provider from a backup system
US7818160B2 (en) * 2005-10-12 2010-10-19 Storage Appliance Corporation Data backup devices and methods for backing up data
US7899662B2 (en) * 2005-10-12 2011-03-01 Storage Appliance Corporation Data backup system including a data protection component
US20070162271A1 (en) * 2005-10-12 2007-07-12 Storage Appliance Corporation Systems and methods for selecting and printing data files from a backup system
US8195444B2 (en) * 2005-10-12 2012-06-05 Storage Appliance Corporation Systems and methods for automated diagnosis and repair of storage devices
US8069271B2 (en) * 2005-10-12 2011-11-29 Storage Appliance Corporation Systems and methods for converting a media player into a backup device
US7822595B2 (en) * 2005-10-12 2010-10-26 Storage Appliance Corporation Systems and methods for selectively copying embedded data files
US7702830B2 (en) * 2005-10-12 2010-04-20 Storage Appliance Corporation Methods for selectively copying data files to networked storage and devices for initiating the same
US7813913B2 (en) * 2005-10-12 2010-10-12 Storage Appliance Corporation Emulation component for data backup applications
US20080028008A1 (en) * 2006-07-31 2008-01-31 Storage Appliance Corporation Optical disc initiated data backup
US20070091746A1 (en) * 2005-10-12 2007-04-26 Storage Appliance Corporation Optical disc for simplified data backup
US9141825B2 (en) * 2005-11-18 2015-09-22 Qurio Holdings, Inc. System and method for controlling access to assets in a network-based media sharing system using tagging
US7707178B2 (en) 2005-11-28 2010-04-27 Commvault Systems, Inc. Systems and methods for classifying and transferring information in a storage network
US20070136200A1 (en) * 2005-12-09 2007-06-14 Microsoft Corporation Backup broker for private, integral and affordable distributed storage
US20200257596A1 (en) 2005-12-19 2020-08-13 Commvault Systems, Inc. Systems and methods of unified reconstruction in storage systems
US8930496B2 (en) 2005-12-19 2015-01-06 Commvault Systems, Inc. Systems and methods of unified reconstruction in storage systems
US7966513B2 (en) * 2006-02-03 2011-06-21 Emc Corporation Automatic classification of backup clients
CN101025741A (zh) * 2006-02-17 2007-08-29 鸿富锦精密工业(深圳)有限公司 数据库的备份***及方法
JP2007257814A (ja) * 2006-02-27 2007-10-04 Fujitsu Ltd ライブラリ装置およびライブラリ装置制御方法
US20070233828A1 (en) * 2006-03-31 2007-10-04 Jeremy Gilbert Methods and systems for providing data storage and retrieval
US8078580B2 (en) 2006-05-31 2011-12-13 Hewlett-Packard Development Company, L.P. Hybrid data archival method and system thereof
WO2007138463A2 (en) * 2006-05-31 2007-12-06 Pankaj Anand Local data archiving method and system thereof
US20090132621A1 (en) * 2006-07-28 2009-05-21 Craig Jensen Selecting storage location for file storage based on storage longevity and speed
US7536504B2 (en) * 2006-07-28 2009-05-19 Diskeeper Corporation Online storage medium transfer rate characteristics determination
US9052826B2 (en) * 2006-07-28 2015-06-09 Condusiv Technologies Corporation Selecting storage locations for storing data based on storage location attributes and data usage statistics
US7870128B2 (en) * 2006-07-28 2011-01-11 Diskeeper Corporation Assigning data for storage based on speed with which data may be retrieved
US20080082453A1 (en) * 2006-10-02 2008-04-03 Storage Appliance Corporation Methods for bundling credits with electronic devices and systems for implementing the same
JP2008117342A (ja) * 2006-11-08 2008-05-22 Hitachi Ltd ストレージシステムおよびリモートコピーを制御するためのコントローラ
US20080126446A1 (en) * 2006-11-27 2008-05-29 Storage Appliance Corporation Systems and methods for backing up user settings
US20080140960A1 (en) * 2006-12-06 2008-06-12 Jason Ferris Basler System and method for optimizing memory usage during data backup
JP4930031B2 (ja) * 2006-12-13 2012-05-09 富士通株式会社 制御装置及び制御システム
US20080172487A1 (en) * 2007-01-03 2008-07-17 Storage Appliance Corporation Systems and methods for providing targeted marketing
US20080226082A1 (en) * 2007-03-12 2008-09-18 Storage Appliance Corporation Systems and methods for secure data backup
US8924844B2 (en) * 2007-03-13 2014-12-30 Visual Cues Llc Object annotation
DE102007013139A1 (de) * 2007-03-15 2008-09-18 Stefan Kistner Verfahren und Computerprommprodukt zur Klassifizierung elektronischer Daten
WO2008131009A2 (en) * 2007-04-16 2008-10-30 Memeo, Inc. Keyword-based content management
US20090030955A1 (en) * 2007-06-11 2009-01-29 Storage Appliance Corporation Automated data backup with graceful shutdown for vista-based system
US20090031298A1 (en) * 2007-06-11 2009-01-29 Jeffrey Brunet System and method for automated installation and/or launch of software
US20080320053A1 (en) * 2007-06-21 2008-12-25 Michio Iijima Data management method for accessing data storage area based on characteristic of stored data
US8341121B1 (en) * 2007-09-28 2012-12-25 Emc Corporation Imminent failure prioritized backup
US7991972B2 (en) * 2007-12-06 2011-08-02 International Business Machines Corporation Determining whether to use a full volume or repository for a logical copy backup space
FR2924839B1 (fr) * 2007-12-06 2010-03-19 Agematis Procede de sauvegarde automatique de donnees numeriques conservees en memoire dans une installation informatique, support de donnees lisible par un ordinateur, installation informatique et systeme pour la mise en oeuvre de ce procede
US8296301B2 (en) 2008-01-30 2012-10-23 Commvault Systems, Inc. Systems and methods for probabilistic data classification
US7836174B2 (en) 2008-01-30 2010-11-16 Commvault Systems, Inc. Systems and methods for grid-based data scanning
US8819363B2 (en) * 2008-02-12 2014-08-26 Fujitsu Limited Data copying method
US8745001B1 (en) * 2008-03-31 2014-06-03 Symantec Operating Corporation Automated remediation of corrupted and tempered files
JP5348129B2 (ja) * 2008-03-31 2013-11-20 富士通株式会社 統合構成管理装置、異種構成管理装置、バックアップデータ管理システム
WO2009124208A1 (en) * 2008-04-03 2009-10-08 Memeo, Inc. Online-assisted backup and restore
US8307177B2 (en) 2008-09-05 2012-11-06 Commvault Systems, Inc. Systems and methods for management of virtualization data
US8930423B1 (en) * 2008-12-30 2015-01-06 Symantec Corporation Method and system for restoring encrypted files from a virtual machine image
JP5387827B2 (ja) * 2009-03-19 2014-01-15 日本電気株式会社 ネットワーク管理装置、ネットワーク管理システム、ネットワーク管理方法、及びプログラム
US9626305B1 (en) * 2009-03-31 2017-04-18 EMC IP Holding Company LLC Complementary space reduction
US9537705B1 (en) * 2009-03-31 2017-01-03 EMC IP Holding Company LLC Global space reduction groups
US8656057B1 (en) 2009-04-01 2014-02-18 Emc Corporation Opportunistic restore
US8566288B1 (en) * 2009-08-31 2013-10-22 Cms Products, Inc. Organized data removal or redirection from a cloning process to enable cloning a larger system to a smaller system
JP5683088B2 (ja) * 2009-08-31 2015-03-11 沖電気工業株式会社 復旧システム、復旧方法及びバックアップ制御システム
US8745342B2 (en) * 2009-09-24 2014-06-03 Hitachi Ltd. Computer system for controlling backups using wide area network
US8566287B2 (en) * 2010-01-29 2013-10-22 Hewlett-Packard Development Company, L.P. Method and apparatus for scheduling data backups
US8413137B2 (en) * 2010-02-04 2013-04-02 Storage Appliance Corporation Automated network backup peripheral device and method
US11449394B2 (en) 2010-06-04 2022-09-20 Commvault Systems, Inc. Failover systems and methods for performing backup operations, including heterogeneous indexing and load balancing of backup and indexing resources
US8725970B2 (en) * 2011-08-23 2014-05-13 Ca, Inc. System and method for backing up data
US8626714B1 (en) * 2011-09-07 2014-01-07 Symantec Corporation Automated separation of corporate and private data for backup and archiving
WO2013093960A1 (en) 2011-12-20 2013-06-27 Hitachi, Ltd. Storage system and method for controlling storage system
JP5889009B2 (ja) 2012-01-31 2016-03-22 キヤノン株式会社 文書管理サーバ、文書管理方法、プログラム
WO2013128582A1 (ja) * 2012-02-28 2013-09-06 株式会社 日立製作所 ストレージシステム及びストレージシステムの制御方法
US8914663B2 (en) 2012-03-28 2014-12-16 Hewlett-Packard Development Company, L.P. Rescheduling failed backup jobs
CN102750476B (zh) * 2012-06-07 2015-04-08 腾讯科技(深圳)有限公司 鉴定文件安全性的方法和***
US8892523B2 (en) 2012-06-08 2014-11-18 Commvault Systems, Inc. Auto summarization of content
US10581763B2 (en) 2012-09-21 2020-03-03 Avago Technologies International Sales Pte. Limited High availability application messaging layer
US9967106B2 (en) 2012-09-24 2018-05-08 Brocade Communications Systems LLC Role based multicast messaging infrastructure
WO2014084666A1 (en) * 2012-11-30 2014-06-05 Samsung Electronics Co., Ltd. Information storage medium storing content, content providing method, content reproducing method and apparatus therefor
CN103064757A (zh) * 2012-12-12 2013-04-24 鸿富锦精密工业(深圳)有限公司 数据备份方法及***
US9069482B1 (en) * 2012-12-14 2015-06-30 Emc Corporation Method and system for dynamic snapshot based backup and recovery operations
US10725996B1 (en) * 2012-12-18 2020-07-28 EMC IP Holding Company LLC Method and system for determining differing file path hierarchies for backup file paths
US9223597B2 (en) 2012-12-21 2015-12-29 Commvault Systems, Inc. Archiving virtual machines in a data storage system
US20140181044A1 (en) 2012-12-21 2014-06-26 Commvault Systems, Inc. Systems and methods to identify uncharacterized and unprotected virtual machines
US20140196038A1 (en) 2013-01-08 2014-07-10 Commvault Systems, Inc. Virtual machine management in a data storage system
US20140201162A1 (en) 2013-01-11 2014-07-17 Commvault Systems, Inc. Systems and methods to restore selected files from block-level backup for virtual machines
US9286110B2 (en) 2013-01-14 2016-03-15 Commvault Systems, Inc. Seamless virtual machine recall in a data storage system
US20150370645A1 (en) * 2013-02-27 2015-12-24 Hewlett-Packard Development Company, L.P. Selecting a backup type based on changed data
JP6015850B2 (ja) * 2013-03-29 2016-10-26 日本電気株式会社 情報処理システム、サーバ装置、プログラム、および、情報処理方法
US20150074536A1 (en) 2013-09-12 2015-03-12 Commvault Systems, Inc. File manager integration with virtualization in an information management system, including user control and storage management of virtual machines
US9811427B2 (en) 2014-04-02 2017-11-07 Commvault Systems, Inc. Information management by a media agent in the absence of communications with a storage manager
US20160019317A1 (en) 2014-07-16 2016-01-21 Commvault Systems, Inc. Volume or virtual machine level backup and generating placeholders for virtual machine files
US9417968B2 (en) 2014-09-22 2016-08-16 Commvault Systems, Inc. Efficiently restoring execution of a backed up virtual machine based on coordination with virtual-machine-file-relocation operations
US9436555B2 (en) 2014-09-22 2016-09-06 Commvault Systems, Inc. Efficient live-mount of a backed up virtual machine in a storage management system
US9710465B2 (en) 2014-09-22 2017-07-18 Commvault Systems, Inc. Efficiently restoring execution of a backed up virtual machine based on coordination with virtual-machine-file-relocation operations
US10776209B2 (en) 2014-11-10 2020-09-15 Commvault Systems, Inc. Cross-platform virtual machine backup and replication
US9983936B2 (en) 2014-11-20 2018-05-29 Commvault Systems, Inc. Virtual machine change block tracking
JP6511795B2 (ja) * 2014-12-18 2019-05-15 富士通株式会社 ストレージ管理装置、ストレージ管理方法、ストレージ管理プログラムおよびストレージシステム
US9946603B1 (en) * 2015-04-14 2018-04-17 EMC IP Holding Company LLC Mountable container for incremental file backups
US10078555B1 (en) 2015-04-14 2018-09-18 EMC IP Holding Company LLC Synthetic full backups for incremental file backups
US9996429B1 (en) 2015-04-14 2018-06-12 EMC IP Holding Company LLC Mountable container backups for files
JP2016218906A (ja) * 2015-05-25 2016-12-22 パナソニックIpマネジメント株式会社 データ記録再生システム
JP6520448B2 (ja) 2015-06-18 2019-05-29 富士通株式会社 情報処理システム、情報処理装置及び情報処理装置制御方法
US10642633B1 (en) * 2015-09-29 2020-05-05 EMC IP Holding Company LLC Intelligent backups with dynamic proxy in virtualized environment
US10430283B1 (en) * 2015-09-30 2019-10-01 EMC IP Holding Company LLC Intelligent data dissemination
CN105868049A (zh) * 2015-12-15 2016-08-17 乐视移动智能信息技术(北京)有限公司 数据处理方法及装置
US10565067B2 (en) 2016-03-09 2020-02-18 Commvault Systems, Inc. Virtual server cloud file system for virtual machine backup from cloud operations
US10417102B2 (en) 2016-09-30 2019-09-17 Commvault Systems, Inc. Heartbeat monitoring of virtual machines for initiating failover operations in a data storage management system, including virtual machine distribution logic
US10540516B2 (en) 2016-10-13 2020-01-21 Commvault Systems, Inc. Data protection within an unsecured storage environment
US10152251B2 (en) 2016-10-25 2018-12-11 Commvault Systems, Inc. Targeted backup of virtual machine
US10162528B2 (en) 2016-10-25 2018-12-25 Commvault Systems, Inc. Targeted snapshot based on virtual machine location
US10389810B2 (en) 2016-11-02 2019-08-20 Commvault Systems, Inc. Multi-threaded scanning of distributed file systems
US10922189B2 (en) 2016-11-02 2021-02-16 Commvault Systems, Inc. Historical network data-based scanning thread generation
US10678758B2 (en) 2016-11-21 2020-06-09 Commvault Systems, Inc. Cross-platform virtual machine data and memory backup and replication
US10474542B2 (en) 2017-03-24 2019-11-12 Commvault Systems, Inc. Time-based virtual machine reversion
US10387073B2 (en) 2017-03-29 2019-08-20 Commvault Systems, Inc. External dynamic virtual machine synchronization
US10552269B2 (en) * 2017-08-31 2020-02-04 International Business Machines Corporation Backup optimization in hybrid storage environment
US10642886B2 (en) 2018-02-14 2020-05-05 Commvault Systems, Inc. Targeted search of backup data using facial recognition
US20190251204A1 (en) 2018-02-14 2019-08-15 Commvault Systems, Inc. Targeted search of backup data using calendar event data
US10877928B2 (en) 2018-03-07 2020-12-29 Commvault Systems, Inc. Using utilities injected into cloud-based virtual machines for speeding up virtual machine backup operations
US11288385B2 (en) * 2018-04-13 2022-03-29 Sophos Limited Chain of custody for enterprise documents
JP2020047114A (ja) * 2018-09-20 2020-03-26 富士ゼロックス株式会社 データ処理装置、データ処理方法及びデータ処理プログラム
US11200124B2 (en) 2018-12-06 2021-12-14 Commvault Systems, Inc. Assigning backup resources based on failover of partnered data storage servers in a data storage management system
US10768971B2 (en) 2019-01-30 2020-09-08 Commvault Systems, Inc. Cross-hypervisor live mount of backed up virtual machine data
US10996974B2 (en) 2019-01-30 2021-05-04 Commvault Systems, Inc. Cross-hypervisor live mount of backed up virtual machine data, including management of cache storage for virtual machine data
US11709740B2 (en) * 2019-07-18 2023-07-25 EMC IP Holding Company LLC Automatically determining optimal storage medium based on source data characteristics
US11467753B2 (en) 2020-02-14 2022-10-11 Commvault Systems, Inc. On-demand restore of virtual machine data
US11442768B2 (en) 2020-03-12 2022-09-13 Commvault Systems, Inc. Cross-hypervisor live recovery of virtual machines
US11099956B1 (en) 2020-03-26 2021-08-24 Commvault Systems, Inc. Snapshot-based disaster recovery orchestration of virtual machine failover and failback operations
CN111459718B (zh) * 2020-03-31 2024-02-09 珠海格力电器股份有限公司 一种多终端***及其数据备份方法和存储介质
US11748143B2 (en) 2020-05-15 2023-09-05 Commvault Systems, Inc. Live mount of virtual machines in a public cloud computing environment
US11656951B2 (en) 2020-10-28 2023-05-23 Commvault Systems, Inc. Data loss vulnerability detection
US11645175B2 (en) 2021-02-12 2023-05-09 Commvault Systems, Inc. Automatic failover of a storage manager
CN114461762A (zh) * 2022-04-08 2022-05-10 深圳市科力锐科技有限公司 档案变更识别方法、装置、设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204362A (ja) * 1996-01-26 1997-08-05 F I T:Kk ファイルのバックアップシステム
JPH09214935A (ja) * 1996-02-02 1997-08-15 Mitsubishi Electric Corp 映像情報提供システム
FR2762462B1 (fr) * 1997-04-21 1999-05-28 Alsthom Cge Alcatel Systeme a stations receptrices de donnees installees en reseau
US6594677B2 (en) * 2000-12-22 2003-07-15 Simdesk Technologies, Inc. Virtual tape storage system and method
JP2002215474A (ja) 2001-01-15 2002-08-02 Fujitsu Ten Ltd ネットワークデータバックアップシステム
JP4076326B2 (ja) 2001-05-25 2008-04-16 富士通株式会社 バックアップシステム、データベース装置、データベース装置のバックアップ方法、データベース管理プログラム、バックアップ装置、バックアップ方法および、バックアッププログラム
TW505848B (en) 2001-06-01 2002-10-11 Far Stone Tech Inc Backup/recovery system and method regarding the same
US20030126247A1 (en) * 2002-01-02 2003-07-03 Exanet Ltd. Apparatus and method for file backup using multiple backup devices
JP2003330783A (ja) * 2002-05-15 2003-11-21 Secom Co Ltd 文書保管システム、文書保管方法および情報記録媒体
JP3800527B2 (ja) 2002-05-30 2006-07-26 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワークを利用したデータのバックアップ技術
WO2004053696A1 (ja) 2002-12-11 2004-06-24 Fujitsu Limited バックアップシステム,バックアップ制御装置,バックアップデータ管理方法,バックアップ制御プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
US20050081008A1 (en) * 2003-10-10 2005-04-14 Stephen Gold Loading of media

Also Published As

Publication number Publication date
US20050060356A1 (en) 2005-03-17
JP2005092282A (ja) 2005-04-07
US7100007B2 (en) 2006-08-29
US20060259724A1 (en) 2006-11-16

Similar Documents

Publication Publication Date Title
JP4404246B2 (ja) データ特性に基づくバックアップシステム及び方法
US20200364198A1 (en) Method and system for offline indexing of content and classifying stored data
US9639529B2 (en) Method and system for searching stored data
US8099428B2 (en) Managing copies of data
EP3133507A1 (en) Context-based data classification
US20080104145A1 (en) Method and appartus for backup of networked computers
US20100306176A1 (en) Deduplication of files
US20080222513A1 (en) Method and System for Rules-Based Tag Management in a Document Review System
JP2007509410A (ja) コンピュータネットワークにおいて集約されたデータビューを生成するためのシステムおよび方法
JP4705962B2 (ja) データ機密制御システム
US20140380407A1 (en) Role based search
JP4087434B1 (ja) データ機密制御システム
JP2006099795A (ja) 顧客情報管理システム
JP2006079216A (ja) 個人情報管理システム,個人情報管理サーバおよび個人情報管理サーバ用プログラム
CN118113674A (zh) 文件管理***及其方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060706

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091028

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091028

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121113

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121113

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131113

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees