JP6295742B2 - Storage system - Google Patents

Storage system Download PDF

Info

Publication number
JP6295742B2
JP6295742B2 JP2014050104A JP2014050104A JP6295742B2 JP 6295742 B2 JP6295742 B2 JP 6295742B2 JP 2014050104 A JP2014050104 A JP 2014050104A JP 2014050104 A JP2014050104 A JP 2014050104A JP 6295742 B2 JP6295742 B2 JP 6295742B2
Authority
JP
Japan
Prior art keywords
block
file
seed
information
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014050104A
Other languages
Japanese (ja)
Other versions
JP2015176205A (en
Inventor
真人 井上
真人 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014050104A priority Critical patent/JP6295742B2/en
Publication of JP2015176205A publication Critical patent/JP2015176205A/en
Application granted granted Critical
Publication of JP6295742B2 publication Critical patent/JP6295742B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ストレージシステムにかかり、特に、仮想的なボリュームを有するストレージシステムに関する。   The present invention relates to a storage system, and more particularly to a storage system having a virtual volume.

バックアップソフトウェアを用いて、ストレージシステムのボリュームを評価対象のストレージシステムでバックアップする、あるいは、リストアする場合に、バックアップの評価やリストアの評価を行うことがある。バックアップの評価では、ストレージシステム上に作成したテスト用のボリュームを、評価対象のストレージシステムにバックアップする。リストアの評価では、評価対象のストレージシステムにバックアップしたボリュームを元のストレージシステム上にリストアし、バックアップ前のボリュームと比較する。この場合、テスト用のボリュームを作成したり、比較するためのストレージシステム、および、比較ソフトウェアが必要となる。   When a backup system is used to back up or restore a storage system volume in an evaluation target storage system, backup evaluation or restoration evaluation may be performed. In the backup evaluation, the test volume created on the storage system is backed up to the evaluation target storage system. In restoration evaluation, a volume backed up to the storage system to be evaluated is restored to the original storage system and compared with the volume before backup. In this case, a storage system and comparison software for creating or comparing test volumes are required.

特開2012−168906号公報JP 2012-168906 A

ところが、近年、ストレージシステムの高性能化、高機能化により、テストボリュームについて以下の変化が出てきている。第1に、ストレージシステムの高性能化により、高速かつ大容量となったため、ボリュームのサイズが肥大化している。第2に、ストレージシステムが圧縮や重複排除などの機能を持つようになったため、重複排除されないデータの評価を行う際にテストボリュームを毎回作り直さなければならない。これらの変化により、テストボリュームを作成するための高性能、大容量なストレージシステムを用意するコストがかかる。また、巨大なテストボリュームを毎回作成しなおすために膨大な時間がかかる、という問題が出てきている。   However, in recent years, the following changes have occurred in the test volume due to the higher performance and higher functionality of storage systems. First, because the storage system has become high-performance and high-capacity due to high performance, the size of the volume is enlarged. Second, since the storage system has functions such as compression and deduplication, a test volume must be recreated every time when data that is not deduplicated is evaluated. These changes add to the cost of preparing a high-performance, large-capacity storage system for creating test volumes. Another problem is that it takes an enormous amount of time to recreate a huge test volume each time.

また、特に重複排除機能を持つストレージシステムに対してボリュームのフルバックアップを日次や週次で行うシステムの場合、フルバックアップ毎に前回のバックアップと同じ部分は重複排除されることとなる。このようなシステムにおけるバックアップを何度も繰り返して、ストレージシステムへの影響を調べる評価を行う場合、テストボリューム内のシステムの運用状況に合わせてファイルの更新(作成・削除など含む)をシミュレーションする必要がある。しかし、実際のストレージ上に用意したテストボリュームに対してこのファイル更新のシミュレーションを行うと、ボリュームへの多くの書き込み操作が必要なため、シミュレーションに時間がかかる。このため、多くの回数のバックアップの評価を行う場合に、多大な時間を要するという問題が有る。   Further, in the case of a system that performs a full volume backup daily or weekly for a storage system that has a deduplication function, the same part as the previous backup is deduplicated for each full backup. When performing an evaluation to examine the impact on the storage system by repeating backups in such a system many times, it is necessary to simulate file updates (including creation / deletion) according to the operation status of the system in the test volume. There is. However, if this file update simulation is performed on a test volume prepared on an actual storage, many write operations to the volume are required, and the simulation takes time. For this reason, there is a problem that it takes a lot of time to evaluate a large number of backups.

ここで、特許文献1における仮想ファイルシステムでは、ファイルシステム単位のバックアップを行う場合に関して、ファイルの作成、削除等が行え、データ保存用のストレージを必要としない評価用のファイルシステムを提供している。ところが、この技術では、ファイルシステムとしてのみデータ読み込みが可能であるが、ボリュームバックアップ等、物理アドレスによるボリューム操作を行うことができない。以上より、依然として、テストボリューム用のストレージシステムの容量増加や、テストボリュームの作成や変更に多大な時間を要する、という問題が生じる。   Here, the virtual file system disclosed in Patent Document 1 provides an evaluation file system that can create and delete files and does not require storage for data storage when performing backup in units of file systems. . However, with this technology, data can be read only as a file system, but volume operations using physical addresses such as volume backup cannot be performed. As described above, there still remains a problem that it takes much time to increase the capacity of the storage system for the test volume and to create or change the test volume.

このため、本発明の目的は、上述した課題である、ボリューム用のストレージシステムの容量増加や、ボリュームの作成や変更に多大な時間を要する、ということを解決することにある。   For this reason, an object of the present invention is to solve the above-mentioned problems that increase the capacity of a storage system for volumes and that it takes a lot of time to create or change a volume.

本発明の一形態であるストレージシステムは、
ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶するメタデータ記憶手段と、
前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶するブロックマップ記憶手段と、
前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成するブロックデータ生成手段と、
を備えた、
という構成をとる。
A storage system according to an aspect of the present invention
Metadata storage means for storing, for each file, metadata including information on a physical address that specifies a storage area that is a reference destination of a block constituting the file;
Block map storage means for storing information for specifying a block seed that is a source for generating data of the block in the storage area specified by the physical address;
Block data generating means for specifying the block seed based on information for specifying the block seed stored in the storage area specified by the physical address, and generating block data from the block seed;
With
The configuration is as follows.

また、本発明の一形態であるプログラムは、
情報処理装置に、
ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶するメタデータ記憶手段と、
前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶するブロックマップ記憶手段と、
前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成するブロックデータ生成手段と、
を実現させる、
という構成をとる。
In addition, a program which is one embodiment of the present invention is
In the information processing device,
Metadata storage means for storing, for each file, metadata including information on a physical address that specifies a storage area that is a reference destination of a block constituting the file;
Block map storage means for storing information for specifying a block seed that is a source for generating data of the block in the storage area specified by the physical address;
Block data generating means for specifying the block seed based on information for specifying the block seed stored in the storage area specified by the physical address, and generating block data from the block seed;
To realize,
The configuration is as follows.

また、本発明の一形態である情報処理方法は、
ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶すると共に、前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶し、
前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
という構成をとる。
An information processing method according to one aspect of the present invention includes:
For each file, metadata including physical address information that specifies a storage area that is a reference destination of a block that constitutes the file is stored, and data of the block is stored in the storage area that is specified by the physical address. Stores information that identifies the block seed from which to generate,
Identifying the block seed based on information identifying the block seed stored in the storage area identified by the physical address, and generating block data from the block seed,
The configuration is as follows.

本発明は、以上のように構成されることにより、ボリューム用のストレージシステムの容量を低減し、ボリュームの作成や変更にかかる時間を短縮することができる。   With the configuration as described above, the present invention can reduce the capacity of a volume storage system and can shorten the time required to create or change a volume.

本発明の実施形態1におけるストレージシステムを含むシステム全体の構成を示すブロック図である。1 is a block diagram showing a configuration of an entire system including a storage system in Embodiment 1 of the present invention. 図1に開示したストレージシステムにおける仮想ファイルシステム及び仮想ボリュームの構成を示す図である。FIG. 2 is a diagram illustrating a configuration of a virtual file system and a virtual volume in the storage system disclosed in FIG. 1. 図1に開示したストレージシステムにおけるファイル作成時の動作を示すフローチャートである。3 is a flowchart showing an operation when creating a file in the storage system disclosed in FIG. 1. 図1に開示したストレージシステムにおけるブロック読み込み時の動作を示すフローチャートである。3 is a flowchart showing an operation at the time of reading a block in the storage system disclosed in FIG. 1. 本発明の実施形態2におけるストレージシステムを含むシステム全体の構成を示すブロック図である。It is a block diagram which shows the structure of the whole system containing the storage system in Embodiment 2 of this invention. 図5に開示したストレージシステムにおける仮想ファイルシステム及び仮想ボリュームの構成を示す図である。FIG. 6 is a diagram showing a configuration of a virtual file system and a virtual volume in the storage system disclosed in FIG. 5. 図5に開示したストレージシステムにおけるファイル作成時の動作を示すフローチャートである。6 is a flowchart showing an operation when creating a file in the storage system disclosed in FIG. 5. 図5に開示したストレージシステムにおけるブロック読み込み時の動作を示すフローチャートである。6 is a flowchart showing an operation at the time of block reading in the storage system disclosed in FIG. 5. 本発明の付記1におけるストレージシステムの構成を示すブロック図である。It is a block diagram which shows the structure of the storage system in attachment 1 of this invention.

<実施形態1>
本発明の第1の実施形態を、図1乃至図4を参照して説明する。図1は、システム全体の構成を示すブロック図である。図2は、ストレージシステムにおける仮想ファイルシステム及び仮想ボリュームの構成を示す図である。図3は、ストレージシステムにおけるファイル作成時の動作を示すフローチャートであり、図4は、ブロック読み込み時の動作を示すフローチャートである。
<Embodiment 1>
A first embodiment of the present invention will be described with reference to FIGS. FIG. 1 is a block diagram showing the configuration of the entire system. FIG. 2 is a diagram showing a configuration of a virtual file system and a virtual volume in the storage system. FIG. 3 is a flowchart showing an operation when creating a file in the storage system, and FIG. 4 is a flowchart showing an operation when reading a block.

図1に示す情報処理システムは、ランダムデータファイルを持つ仮想ボリュームを構築するストレージシステム10を備えている。そして、このストレージシステム10により、後述するように、ボリュームの実データをストレージ上に格納することなく、仮想的なファイルシステムからファイルの作成、削除といった一般的なファイル操作を行え、かつ、物理アドレスでボリュームに対して読み書き操作ができる仮想的なボリュームを提供する。   The information processing system shown in FIG. 1 includes a storage system 10 that constructs a virtual volume having random data files. As will be described later, the storage system 10 can perform general file operations such as creating and deleting files from a virtual file system without storing the actual volume data on the storage, Provides a virtual volume that can read and write to the volume.

そして、情報処理システムは、ストレージシステム10のボリュームのバックアップ先及びリストア元となり、当該バックアップの評価やリストアの評価対象となる評価対象ストレージ31を有する評価対象ストレージシステム30を備えている。また、情報処理システムは、ボリュームのバックアップやリストアの操作を行うクライアント30を備えている。   The information processing system includes an evaluation target storage system 30 that has an evaluation target storage 31 that becomes a backup destination and a restore source of the volume of the storage system 10 and is an evaluation target of the backup and restore. The information processing system also includes a client 30 that performs volume backup and restore operations.

上記ストレージシステム10は、図1に示すように、装備された演算装置にプログラムが組み込まれることで構築された、仮想ファイルシステム11と仮想ボリュームインタフェース12とを備えている。また、ストレージシステム10は、装備された記憶装置に形成された、ディレクトリツリー構造記憶部13、ファイルメタデータ記憶部14、乱数シードマップ記憶部15、を備えている。以下、各構成について詳述する。   As shown in FIG. 1, the storage system 10 includes a virtual file system 11 and a virtual volume interface 12 that are constructed by incorporating a program into an installed arithmetic device. The storage system 10 also includes a directory tree structure storage unit 13, a file metadata storage unit 14, and a random number seed map storage unit 15 formed in the equipped storage device. Hereinafter, each configuration will be described in detail.

ディレクトリツリー構造記憶部13は、ファイルシステムにおけるディレクトリのツリー構造を保存するための記憶領域である。ディレクトリには、ファイル名と、ファイルに対応するメタデータを識別するための識別子と、がペアで保存されることで、図2に示すように、ファイルとメタデータとが関連付けられる。また、ディレクトリには、サブディレクトリ名と、そのサブディレクトリのデータ(再帰的にサブディレクトリ内の、ファイル名と識別子のペアや、サブディレクトリ名とデータ情報のペアなど)が関連付けられる。   The directory tree structure storage unit 13 is a storage area for storing a directory tree structure in the file system. In the directory, a file name and an identifier for identifying metadata corresponding to the file are stored as a pair, so that the file and the metadata are associated as shown in FIG. A directory is associated with a subdirectory name and data of the subdirectory (recursively, a file name / identifier pair, a subdirectory name / data information pair, etc. in the subdirectory).

ファイルメタデータ記憶部14(メタデータ記憶手段)は、個々のファイルのメタデータを保存する記憶領域で、識別子から対応するメタデータを検索することができる。具体的にメタデータ40は、図2に示すように、ファイルのサイズ、作成日付、属性、アクセス許可設定など、ファイルシステムが一般的に持つファイルの実データ以外の付随情報を含む。そして、本発明におけるメタデータ40は、さらに、ファイルがボリュームのどのブロックを利用しているかを示す、ブロックの物理アドレスリスト41を含む。つまり、物理アドレスリスト41に記憶される各物理アドレスは、ファイルを構成する各ブロックのそれぞれの参照先となる乱数シードマップ50内の記憶領域を特定するアドレスである。   The file metadata storage unit 14 (metadata storage means) is a storage area for storing metadata of individual files, and can search corresponding metadata from the identifier. Specifically, as shown in FIG. 2, the metadata 40 includes accompanying information other than the actual file data that the file system generally has, such as the file size, creation date, attributes, and access permission settings. The metadata 40 according to the present invention further includes a block physical address list 41 indicating which block of the volume is used by the file. That is, each physical address stored in the physical address list 41 is an address that specifies a storage area in the random number seed map 50 that is a reference destination of each block constituting the file.

乱数シードマップ記憶部15は、乱数シードマップ50(S-map)を記憶している。乱数シードマップ50は、ボリュームのブロック毎の乱数シード(ブロックシード)を保存する表であり、ブロックの物理アドレスから乱数シードを求めるのに使用される表である。なお、本実施形態では、ブロックの乱数シードは、当該ブロックの実データを生成するための元となる情報であり、かかる乱数シードから、後述するように疑似乱数アルゴリズムを用いて、ブロックの実データを生成する。つまり、本実施形態では、ブロックの実データは記憶していない。   The random number seed map storage unit 15 stores a random number seed map 50 (S-map). The random number seed map 50 is a table that stores a random number seed (block seed) for each block of the volume, and is a table used to obtain the random number seed from the physical address of the block. In this embodiment, the random number seed of a block is information that is the basis for generating the actual data of the block, and the real data of the block is generated from the random number seed using a pseudo random number algorithm as described later. Is generated. That is, in this embodiment, the actual data of the block is not stored.

仮想ファイルシステム11(ブロックデータ生成手段、仮想ファイルシステム構築部)は、上述したディレクトリツリー構造記憶部13、ファイルメタデータ記憶部14及び乱数シードマップ記憶部15内の情報を参照、更新することで、クライアント20に対してファイルシステムを表現する。そして、仮想ファイルシステム11は、クライアント20がファイル単位の操作を可能としている。   The virtual file system 11 (block data generation means, virtual file system construction unit) refers to and updates the information in the directory tree structure storage unit 13, the file metadata storage unit 14 and the random number seed map storage unit 15 described above. The file system is expressed to the client 20. The virtual file system 11 allows the client 20 to perform file unit operations.

仮想ボリュームインターフェイス12(ブロックデータ生成手段、仮想ボリューム構築部)は、上述した乱数シードマップ記憶部15内の情報を参照することで、ボリュームを表現し、ブロック単位の操作を可能としている。   The virtual volume interface 12 (block data generation means, virtual volume construction unit) expresses a volume by referring to the information in the random number seed map storage unit 15 described above, and enables operations in units of blocks.

クライアント20は、ボリュームを準備するために、仮想ファイルシステム11を用いてファイル、ディレクトリの作成や削除等のファイルシステムを操作するコンピュータである。また、クライアント20は、ボリュームを準備するために、バックアップソフトウェアを用いて、仮想ボリュームインターフェイス12に対してブロック単位の読み込み、書き込みを行ったり、それらのブロック単位のデータを評価対象ストレージシステム30にバックアップ、リストアする操作を行うコンピュータである。   The client 20 is a computer that operates a file system such as creation and deletion of files and directories using the virtual file system 11 in order to prepare a volume. Further, the client 20 reads and writes data in units of blocks to the virtual volume interface 12 using backup software to prepare a volume, and backs up the data in units of blocks to the evaluation target storage system 30. The computer that performs the restore operation.

評価対象ストレージシステム30は、上述したストレージシステム1に記憶されている仮想ボリュームがバックアップされたり、リストアされることにより、バックアップやリストアの評価の対象となるストレージシステムである。   The evaluation target storage system 30 is a storage system that is subject to evaluation of backup or restore by backing up or restoring the virtual volume stored in the storage system 1 described above.

次に、上述したストレージシステム10に構築される仮想ボリュームへの操作、具体的に、ファイルの作成、ファイルの更新/削除、ボリュームの読み込み、ボリュームの書き込み、について、詳しく説明する。なお、ここで説明しないファイルシステム操作(ディレクトリ作成・削除、名前の変更、属性変更など)は、全て通常のファイルシステムと同様に、ディレクトリツリー構造/メタデータを参照、または更新することで可能である。   Next, operations on the virtual volume constructed in the storage system 10 described above, specifically, file creation, file update / deletion, volume read, and volume write will be described in detail. All file system operations (directory creation / deletion, name change, attribute change, etc.) not described here can be performed by referring to or updating the directory tree structure / metadata in the same way as with a normal file system. is there.

まず、「ファイルの作成」について説明する。ファイルは、格納するデータの乱数シード列を与えて作成する。仮想ファイルシステムは、通常のファイルシステムと同様に、仮想ボリューム上のどの部分にファイルのデータを置くかを決定し(ブロックの割り当て)、各々のブロックのデータの元となるブロックシードを更新する。そして、ファイルのメタデータとして、ファイルが使用するブロックの参照先のリスト(物理アドレスのリスト)を保存する。ここで、ブロックの乱数シードに関しては、ファイル名に特定の書式で埋め込まれた乱数シード値から擬似乱数アルゴリズムによって、ファイルが使うブロックの乱数シードをファイルの先頭から順に決定する。   First, “file creation” will be described. The file is created by giving a random number seed sequence of data to be stored. Similar to the normal file system, the virtual file system determines in which part of the virtual volume the file data is to be placed (block allocation), and updates the block seed that is the source of the data of each block. Then, a block reference list (physical address list) of blocks used by the file is stored as file metadata. Here, regarding the random number seed of the block, the random number seed of the block used by the file is determined in order from the top of the file by a pseudo random number algorithm from the random number seed value embedded in the file name in a specific format.

上述した「ファイルの作成」の具体例を、図3のフローチャートを参照して説明する。まず、クライアント20は、仮想ファイルシステム11に対して、「/dir1/file_16KB_12345」という名前のファイルの作成を要求する。仮想ファイルシステム11は、このファイルに対応するファイルメタデータ(識別子500とする)を作成する(ステップS1)。メタデータに含まれる日付、アクセス許可情報や属性等は、一般的なファイルシステムと同様に作成する。ファイルサイズに関しては、ファイル名から16KBであると判定し、それをファイルサイズとして保存する。   A specific example of the “file creation” described above will be described with reference to the flowchart of FIG. First, the client 20 requests the virtual file system 11 to create a file named “/ dir1 / file_16KB_12345”. The virtual file system 11 creates file metadata (identifier 500) corresponding to this file (step S1). The date, access permission information, attributes, and the like included in the metadata are created in the same manner as a general file system. As for the file size, it is determined that the file name is 16 KB, and it is stored as the file size.

そして、16KB分の空きブロックをファイルに割り当て(ステップS2)、それらのブロック群への物理アドレスのリスト41を保存する。なお、一般的には、ファイルシステムは空きブロックをビットマップやリンクリスト等で管理しており、それらを用いて空きブロックを割り当てるが、ここでは本技術に直接関係ないため、詳細な説明は省略する。そして、ブロックサイズを4KBとし、ブロック100,101,102,150の4ブロックが割り当てられたとすると、このファイルのメタデータには、物理アドレスリスト41として、100,101,102,150の4つのアドレスが保存される(ステップS3)。   Then, 16 KB free blocks are allocated to the file (step S2), and a list 41 of physical addresses for those blocks is stored. In general, the file system manages empty blocks using a bitmap or a link list, and assigns empty blocks using them. However, detailed explanation is omitted here because it is not directly related to this technology. To do. Then, assuming that the block size is 4 KB and four blocks 100, 101, 102, and 150 are allocated, four addresses 100, 101, 102, and 150 are stored as the physical address list 41 in the metadata of this file (step S3).

続いて、ファイル名から乱数シード12345を用いて擬似乱数アルゴリズムを初期化し、4つの乱数を計算し、乱数12345, 67890, 35791, 46802を得たとする。この場合には、ブロック100の乱数シードとして12345、ブロック101の乱数シードとして67890、ブロック102の乱数シードとして35791、ブロック150の乱数シードとして46802を使うこととし、乱数シードマップ50(S-map)上のこれら4ブロックの値を更新する(ステップS4)。   Subsequently, it is assumed that the pseudorandom algorithm is initialized from the file name using the random number seed 12345, four random numbers are calculated, and random numbers 12345, 67890, 35791, and 46802 are obtained. In this case, 12345 is used as the random number seed of the block 100, 67890 is used as the random number seed of the block 101, 35791 is used as the random number seed of the block 102, and 46802 is used as the random number seed of the block 150, and the random number seed map 50 (S-map) The values of these four blocks are updated (step S4).

その後、仮想ファイルシステム11は、当該ファイルが作成されるディレクトリ「/dir1」に当該ファイル名「file_16KB_12345」と、当該ファイルのメタデータの識別子50とをペアで登録して、ファイル名とメタデータと関連付ける(ステップS5)。これでファイルの作成が完了したとして、仮想ファイルシステム11はクライアント20にファイル作成成功を返却する。   Thereafter, the virtual file system 11 registers the file name “file_16KB_12345” and the metadata identifier 50 of the file as a pair in the directory “/ dir1” where the file is created, and sets the file name, metadata, Associate (step S5). Assuming that the file creation is completed, the virtual file system 11 returns a file creation success to the client 20.

そして、仮想ファイルシステム11は、以下のようにしてファイルシステムを表現する。例えば、ファイルの読み出しを要求された場合には、まずファイルのメタデータ40を参照して、ファイルを構成するブロックの物理アドレス41を特定する。そして、後述する「ボリュームの読み込み」の処理と同様に、物理アドレス41を用いてブロックの乱数シードを特定し、当該乱数シードからブロックのデータを生成して、ファイルを生成する。これにより、仮想的なファイルシステムを実現する。   The virtual file system 11 represents a file system as follows. For example, when reading of a file is requested, first, the physical address 41 of a block constituting the file is specified by referring to the metadata 40 of the file. Then, similarly to the “volume reading” process described later, the random address seed of the block is specified using the physical address 41, the block data is generated from the random seed, and the file is generated. Thereby, a virtual file system is realized.

次に、「ファイルの更新や削除」について説明する。データを更新する場合、メタデータ40を参照して、ファイルが使用しているブロックの乱数シードを、新しい乱数シードで更新する。ファイルの追記や削除により、ファイルのサイズが変わる場合は、新しいブロックを追加で割り当てたり、不要となるブロックを物理アドレスリスト41から削除したりする。物理アドレスリスト41から削除されたブロックの乱数シードは、特に初期化したりせずにそのままとする。これらの動作は実データをボリューム上に保存しない事以外は、通常のファイルシステムと同等である。   Next, “file update and deletion” will be described. When updating data, the metadata 40 is referred to, and the random number seed of the block used by the file is updated with the new random number seed. When the file size changes due to addition or deletion of a file, a new block is additionally allocated or an unnecessary block is deleted from the physical address list 41. The random number seed of the block deleted from the physical address list 41 is left as it is without being initialized. These operations are the same as those of a normal file system except that actual data is not stored on the volume.

上述した「ファイルの削除」の具体例を説明する。クライアント20が仮想ファイルシステム11にファイル削除(上記ファイル作成の説明で作成した「/dir1/file_16KB_12345」の削除)を要求する。仮想ファイルシステム11は、ディレクトリ「/dir1」からファイル名「file_16KB_12345」を探し、当該ファイル名とメタデータ識別子500のペアを当該ディレクトリから削除する。また、メタデータ識別子500で表される(当該ファイルの)メタデータも削除する。その後、クライアントに削除成功を返却する。このとき、乱数シードマップ50(S-map)に関しては触れない。これは、ファイル削除ではファイルの管理情報が消えるだけで、ボリューム上の実際のデータを削除するわけではない一般的なファイルシステムと同等の動作となる。   A specific example of the “file deletion” described above will be described. The client 20 requests the virtual file system 11 to delete a file (deletion of “/ dir1 / file_16KB_12345” created in the above description of file creation). The virtual file system 11 searches the directory “/ dir1” for the file name “file_16KB_12345” and deletes the pair of the file name and the metadata identifier 500 from the directory. Further, the metadata (of the file) represented by the metadata identifier 500 is also deleted. After that, the deletion success is returned to the client. At this time, the random number seed map 50 (S-map) is not touched. This is equivalent to a general file system that does not delete the actual data on the volume, but only deletes the file management information.

次に、「ボリュームの読み込み」について説明する。ボリュームからデータを読み込む場合は、物理アドレスに対応するブロックの乱数シードを用いて擬似乱数アルゴリズムを初期化する。そして、この擬似乱数アルゴリズムを用いて乱数データを作成し、それをボリュームから読み込まれた当該ブロックのデータとしてクライアントに返却する。   Next, “volume reading” will be described. When reading data from the volume, the pseudorandom algorithm is initialized using the random number seed of the block corresponding to the physical address. Then, random number data is created using this pseudo random number algorithm, and it is returned to the client as data of the block read from the volume.

上述した「ボリュームの読み込み」の具体例を、図4のフローチャートを参照して説明する。クライアント20は仮想ボリュームインターフェイス12に、物理アドレス100で表されるブロック(ブロック100)の読み込みを要求する。仮想ボリュームインターフェイス12は、乱数シードマップ15(S-map)を参照して、物理アドレス100にアクセスして(ステップS11)、当該物理アドレスに対応する乱数シード12345を求め(ステップS12)、この乱数シード12345を用いて擬似乱数アルゴリズムを初期化する。そして、この擬似乱数アルゴリズムを用いて4KB分の乱数データを計算し(ステップS13)、それを当該ブロックのデータとしてクライアントに返却する(ステップS14)。   A specific example of “volume reading” described above will be described with reference to the flowchart of FIG. The client 20 requests the virtual volume interface 12 to read a block (block 100) represented by the physical address 100. The virtual volume interface 12 refers to the random number seed map 15 (S-map), accesses the physical address 100 (step S11), obtains a random number seed 12345 corresponding to the physical address (step S12), and generates the random number. The pseudorandom algorithm is initialized using the seed 12345. Then, 4 KB of random number data is calculated using this pseudo random number algorithm (step S13), and is returned to the client as data of the block (step S14).

次に、「ボリュームへの書き込み」について説明する。ボリュームへデータを書き込む場合、クライアント20が書き込んだデータと、そのブロックに上述の読み出し操作を行った場合に得られるデータとを比較する。データが異なる場合は書き込みエラーとする。   Next, “write to volume” will be described. When writing data to the volume, the data written by the client 20 is compared with the data obtained when the above read operation is performed on the block. If the data is different, a write error occurs.

上述した「ボリュームへの書き込み」の具体例を説明する。クライアント20は仮想ボリュームインターフェイス12に、物理アドレス150で表されるブロックへ、4KBのデータの書き込みを要求する。仮想ボリュームインターフェイス12は乱数シードマップ15(S-map)を参照して、物理アドレス150に対応する乱数シード46802を求め、この乱数シード46802を用いて擬似乱数アルゴリズムを初期化する。そして、擬似乱数アルゴリズムから4KB分の当該ブロックのデータを計算し、そのデータと、クライアント20がから受け取った4KBのデータとを比較する。データが等しい場合は書き込み成功とし、異なっている場合は書き込みエラーをクライアントに返却する。   A specific example of the above-described “write to volume” will be described. The client 20 requests the virtual volume interface 12 to write 4 KB data to the block represented by the physical address 150. The virtual volume interface 12 refers to the random number seed map 15 (S-map), obtains a random number seed 46802 corresponding to the physical address 150, and initializes a pseudo random number algorithm using the random number seed 46802. Then, the block data of 4 KB is calculated from the pseudorandom algorithm, and the data is compared with the 4 KB data received from the client 20. If the data is the same, write is successful. If they are different, a write error is returned to the client.

以上のようにして、実際にブロックの実データを記憶することなく、少ない容量で、仮想ファイルシステムと仮想ボリュームとを実現できる。上述した例では、ブロックサイズを4KB、物理アドレスを32bit(ボリューム容量16TB)、ブロックの乱数シードを64bitとすると、実際に記憶する乱数シードマップ記憶部15(S-map)のサイズは、64bit*2^32=32GBとなる。   As described above, the virtual file system and the virtual volume can be realized with a small capacity without actually storing the actual data of the block. In the above example, if the block size is 4 KB, the physical address is 32 bits (volume capacity 16 TB), and the random number seed of the block is 64 bits, the size of the random number seed map storage unit 15 (S-map) that is actually stored is 64 bits * 2 ^ 32 = 32GB.

また、物理アドレスからブロック単位でボリューム操作も行うことができる。従って、ボリュームをバックアップやリストアの評価用に使用する場合であっても、かかるボリュームの作成や変更を容易に行うことができ、かかる時間の削減を図ることができる。   Also, volume operations can be performed in block units from physical addresses. Therefore, even when a volume is used for backup or restoration evaluation, such volume can be easily created or changed, and the time required can be reduced.

<実施形態2>
次に、本発明の第2の実施形態を説明する。本実施形態におけるストレージシステムは、上述した第1の実施形態とほぼ同様の構成を有しているが、以下の点で異なる。
<Embodiment 2>
Next, a second embodiment of the present invention will be described. The storage system according to the present embodiment has substantially the same configuration as that of the first embodiment described above, but differs in the following points.

ここで、上述した実施形態1では、乱数シードの範囲(最大値)がS-map50のブロック数以上であれば、ボリューム内の全てのブロックをユニークなデータにできる。但し、評価対象ストレージシステム30が重複排除機能をもつ場合、バックアップ等を評価するボリュームごとに、別の乱数シードを使う必要があり、より大きな範囲の乱数シードを使わなければデータが重複してしまう。ところが、ブロック毎の乱数シードの範囲を大きくすると、乱数シードマップ記憶部15に記憶されるS-map全体のサイズが大きくなる。そこで乱数シードを効率的に扱う手法として、本実施形態のようにストレージシステムを構成する。   Here, in Embodiment 1 described above, if the range (maximum value) of the random number seed is equal to or greater than the number of blocks of the S-map 50, all blocks in the volume can be made unique data. However, if the evaluation target storage system 30 has a deduplication function, it is necessary to use a different random number seed for each volume to be evaluated for backup or the like, and data will be duplicated unless a larger random number seed is used. . However, when the range of the random number seed for each block is increased, the size of the entire S-map stored in the random number seed map storage unit 15 is increased. Therefore, as a method for efficiently handling the random number seed, a storage system is configured as in this embodiment.

本実施形態におけるストレージシステム10は、ボリューム毎に、当該ボリューム全体に対して割り当てられた乱数シードを有する。つまり、ストレージシステム10は、乱数シードマップ記憶部15(S-map)に記憶されたブロック毎の乱数シードとは別に、ボリューム全体で1つの乱数シードを記憶している。なお、ボリュームの乱数シードの変更は、例えば、ボリュームのルートディレクトリ上に特殊な名前を持つファイルを作成して記憶し、乱数シード値を書き込むと、それがボリュームの乱数シードとして利用されるようにすることで実現する。   The storage system 10 in this embodiment has a random number seed assigned to the entire volume for each volume. That is, the storage system 10 stores one random number seed for the entire volume separately from the random number seed for each block stored in the random number seed map storage unit 15 (S-map). For example, to change the volume random number seed, create and store a file with a special name on the root directory of the volume, and write the random number seed value so that it is used as the random number seed for the volume. It is realized by doing.

そして、「ボリュームの読み込み」時にブロックの乱数データを読み込む際には、S-map50に格納されているこのブロックに対応する乱数シードと、ボリュームの乱数シードと、を組み合わせて、実際のブロックの乱数シードとする。つまり、S-mapに格納されている乱数シードは、ブロックの乱数シードを特定する情報であり、実際のブロックの乱数シードの一部を形成する情報である。また、ボリュームの乱数シードも、実際のブロックの乱数シードの他の一部を形成する情報である。このため、S-mapに格納された乱数シードとボリュームの乱数シードとを組み合わせることで、実際のブロックの乱数シードを生成する。そして、上記2種類の乱数シードを組み合わせた乱数シードで擬似乱数アルゴリズムを初期化して、ブロックのデータを生成する。   When reading the random number data of the block at the time of “reading the volume”, the random number seed of the actual block is combined by combining the random number seed corresponding to this block stored in the S-map 50 and the random number seed of the volume. Seed. That is, the random number seed stored in the S-map is information that identifies the random number seed of the block, and is information that forms a part of the random number seed of the actual block. The random number seed of the volume is information that forms another part of the random number seed of the actual block. For this reason, a random number seed of an actual block is generated by combining the random number seed stored in the S-map and the random number seed of the volume. Then, a pseudo random number algorithm is initialized with a random number seed obtained by combining the above two types of random number seeds to generate block data.

上記構成のストレージシステム10による「ボリュームの読み込み」の具体例について説明する。なお、ボリューム全体で1つの乱数シードは14825であるとする。クライアント20は仮想ボリュームインターフェイス12に、物理アドレス100で表されるブロック(ブロック100)の読み込みを要求する。このとき、まず、実施形態1と同様に乱数シードマップ記憶部15内のS-map50を参照して、格納されている乱数シード12345を求める。そして、ボリューム全体の乱数シード14825と、求めた乱数シード12345と、を組み合わせた新たな値で、擬似乱数アルゴリズムを初期化する。この擬似乱数アルゴリズムを用いて4KB分の乱数データを計算し、それを当該ブロックのデータとしてクライアントに返却する。   A specific example of “volume reading” by the storage system 10 having the above configuration will be described. It is assumed that one random number seed is 14825 in the entire volume. The client 20 requests the virtual volume interface 12 to read a block (block 100) represented by the physical address 100. At this time, first, the stored random number seed 12345 is obtained by referring to the S-map 50 in the random number seed map storage unit 15 as in the first embodiment. Then, the pseudorandom algorithm is initialized with a new value obtained by combining the random number seed 14825 of the entire volume and the obtained random number seed 12345. Use this pseudo-random algorithm to calculate 4KB of random number data and return it to the client as data for that block.

次に、ボリューム全体の乱数シードの変更の具体例について説明する。クライアント20が特殊なファイル名「/volume_seed」を持つファイルを作成し、データとして34567を書き込むと、ボリューム全体の乱数シードが34567に変更される。   Next, a specific example of changing the random number seed of the entire volume will be described. When the client 20 creates a file having a special file name “/ volume_seed” and writes 34567 as data, the random number seed of the entire volume is changed to 34567.

ここで、ブロックの乱数シードをボリューム内でユニークにするための最低サイズ(=物理アドレスのサイズ)を32bitとし、ボリュームの乱数シードを32bitとする。すると、ブロック毎の実質的な乱数シードは、32(ブロック毎の乱数シード)+32(ボリュームの乱数シード)=64ビットとなる。このため、実施形態1と同等の範囲を維持しているにもかかわらず、S-mapのサイズは32bit*2^32=16GBとなり、実施形態1の半分で済むこととなる。つまり、ブロックの実データを記憶することなく、さらに少ない容量で、仮想ファイルシステムと仮想ボリュームとを実現できる。   Here, the minimum size (= physical address size) for making the random number seed of the block unique within the volume is 32 bits, and the random number seed of the volume is 32 bits. Then, the substantial random number seed for each block is 32 (random number seed for each block) +32 (random number seed for volume) = 64 bits. For this reason, despite maintaining the same range as in the first embodiment, the size of the S-map is 32 bits * 2 ^ 32 = 16 GB, which is half that of the first embodiment. In other words, a virtual file system and a virtual volume can be realized with a smaller capacity without storing actual block data.

また、本実施形態におけるストレージシステム10では、ボリューム全体のデータを以前のデータと異なるデータに変更する場合には、単純にボリューム全体の乱数シードを変更すれば良い。その結果、ボリュームの生成、変更を容易に行うことができ、それにかかる時間を短縮することができる。例えば、評価対象のストレージに対して、まったく異なるデータで構成される複数のボリュームバックアップを繰り返したい時などに有益である。   Further, in the storage system 10 according to the present embodiment, when changing the data of the entire volume to data different from the previous data, the random number seed of the entire volume may be simply changed. As a result, the volume can be easily generated and changed, and the time required for it can be reduced. For example, it is useful when it is desired to repeat a plurality of volume backups composed of completely different data for the storage to be evaluated.

<実施形態3>
次に、本発明の第3の実施形態を、図5乃至図8を参照して説明する。図5は、システム全体の構成を示すブロック図である。図6は、ストレージシステムにおける仮想ファイルシステム及び仮想ボリュームの構成を示す図である。図7は、ストレージシステムにおけるファイル作成時の動作を示すフローチャートであり、図8は、ブロック読み込み時の動作を示すフローチャートである。本実施形態におけるストレージシステムは、上述した第1の実施形態とほぼ同様の構成を有しているが、以下の点で異なる。
<Embodiment 3>
Next, a third embodiment of the present invention will be described with reference to FIGS. FIG. 5 is a block diagram showing the configuration of the entire system. FIG. 6 is a diagram showing a configuration of a virtual file system and a virtual volume in the storage system. FIG. 7 is a flowchart showing an operation when creating a file in the storage system, and FIG. 8 is a flowchart showing an operation when reading a block. The storage system according to the present embodiment has substantially the same configuration as that of the first embodiment described above, but differs in the following points.

本実施形態におけるストレージシステム10は、実施形態1で説明した乱数シードマップ記憶部15の代わりに、メタデータ逆引きマップ60(R-map)を記憶したメタデータ逆引きマップ記憶部16(ブロックマップ記憶手段)を備えている。メタデータ逆引き表60(R-map)は、ブロックの参照先となる物理アドレスに対応する記憶領域を有しており、ブロックのデータがどのファイルとして保存されているデータであるか、を表すための表である。このため、ブロックの物理アドレスが示すメタデータ逆引き表60(R-map)上の記憶領域には、当該ブロックが含まれるファイルに関連付けられたメタデータ40を識別するメタデータ識別子が格納されている。このメタデータ識別子は、ブロックシードを特定する情報として機能し、後述するように、ブロックオフセットと組み合わせられることによりブロックの乱数シード(ブロックシード)となる。   The storage system 10 according to the present embodiment has a metadata reverse lookup map storage unit 16 (block map) that stores a metadata reverse lookup map 60 (R-map) instead of the random number seed map storage unit 15 described in the first embodiment. Storage means). The metadata reverse lookup table 60 (R-map) has a storage area corresponding to a physical address that is a block reference destination, and indicates which file the data of the block is stored as. It is a table for. For this reason, in the storage area on the metadata reverse lookup table 60 (R-map) indicated by the physical address of the block, a metadata identifier for identifying the metadata 40 associated with the file including the block is stored. Yes. This metadata identifier functions as information for specifying the block seed, and becomes a random number seed (block seed) of the block by being combined with the block offset, as will be described later.

また、本実施形態におけるメタデータ40には、対応するファイル毎に固有の乱数シード42(ファイルシード)と、メタデータ逆引き表60(R-map)からのメタデータの参照数を表す参照カウント43と、が記憶されている。なお、メタデータ40には、実施形態1で説明したファイルの属性や、ファイルを構成する各ブロックの参照先となる物理アドレスのリスト41が記憶している。物理アドレスリスト41は、各ブロックのファイル内における位置に対応して形成されているため、ブロックのファイル内における位置を表すオフセット情報(ブロック識別情報)として用いられる。なお、メタデータ40には、オフセット情報とは異なり、ファイルを構成する各ブロックを当該ファイル内において区別できるブロック識別情報を記憶していてもよい。   Further, the metadata 40 in the present embodiment includes a random number seed 42 (file seed) unique to each corresponding file and a reference count representing the number of metadata references from the metadata reverse lookup table 60 (R-map). 43 is stored. The metadata 40 stores the file attributes described in the first embodiment and the physical address list 41 that is a reference destination of each block constituting the file. Since the physical address list 41 is formed corresponding to the position of each block in the file, it is used as offset information (block identification information) indicating the position of the block in the file. Note that, unlike the offset information, the metadata 40 may store block identification information that can distinguish each block constituting the file within the file.

上記構成のストレージシステム10において「ファイルの作成」の具体例を、図7のフローチャートを参照して説明する。ここでは、メタデータ逆引きマップ記憶部16(R-map)のブロック100および150、151には、メタデータ識別子は未登録であるとする(識別子0を未登録であることを表す特別な識別子とする)。一方、ブロック101と102には、メタデータ識別子499が登録されているとし、当該メタデータ識別子499で表されるファイルのメタデータの参照カウントは、2とする。   A specific example of “file creation” in the storage system 10 configured as described above will be described with reference to the flowchart of FIG. Here, it is assumed that the metadata identifier is not registered in the blocks 100, 150, and 151 of the metadata reverse lookup map storage unit 16 (R-map) (the identifier 0 is a special identifier indicating that it is not registered). And). On the other hand, a metadata identifier 499 is registered in the blocks 101 and 102, and the reference count of the metadata of the file represented by the metadata identifier 499 is 2.

まず、クライアント20は仮想ファイルシステム12に対して、「/dir1/file_16KB_12345」という名前のファイルの作成を要求する。仮想ファイルシステム11は、新しくメタデータ(メタデータ識別子500とする)を作成する(ステップS21)。日付、アクセス許可情報や属性等は、一般的なファイルシステムと同様に作成する。そして本実施形態では、メタデータに、さらにファイルの乱数シード12345も保存する(ステップS22)。   First, the client 20 requests the virtual file system 12 to create a file named “/ dir1 / file_16KB_12345”. The virtual file system 11 creates new metadata (referred to as metadata identifier 500) (step S21). The date, access permission information, attributes, and the like are created in the same way as a general file system. In the present embodiment, the random number seed 12345 of the file is also stored in the metadata (step S22).

ファイルサイズに関しては、ファイル名から16KBであると判定し、それをファイルサイズとして保存する。また、16KB分のブロックをR-map上の空きブロックに割り当て、それらのブロック群の物理アドレスを、物理アドレスリスト41に保存する(ステップS23)。ここでは、ブロックサイズを4KBとし、R-map上のブロック100〜102、150の4ブロックが割り当てられたとする。すると、このファイルのメタデータ40には、物理アドレスリスト41として、R-map上の100,101,102,150の4つのアドレスが保存される。このとき、物理アドレスリスト41は、ファイルを構成するブロックの順序で、各ブロックに対応する物理アドレスを並べて形成される。   As for the file size, it is determined that the file name is 16 KB, and it is stored as the file size. Also, blocks of 16 KB are allocated to empty blocks on the R-map, and the physical addresses of those block groups are stored in the physical address list 41 (step S23). Here, it is assumed that the block size is 4 KB and four blocks 100 to 102 and 150 on the R-map are allocated. Then, four addresses 100, 101, 102, and 150 on the R-map are stored as the physical address list 41 in the metadata 40 of this file. At this time, the physical address list 41 is formed by arranging physical addresses corresponding to the blocks in the order of the blocks constituting the file.

続いて、メタデータ逆引きマップ記憶部16(R-map)を参照し、ブロック100のメタデータ識別子を参照する。ここでは、メタデータ識別子は未登録であり、ブロック100に対応するメタデータは存在しないため、単純に新しいメタデータ識別子500でR-mapのブロック100を上書きする(ステップS24)。   Subsequently, the metadata reverse lookup map storage unit 16 (R-map) is referred to, and the metadata identifier of the block 100 is referred to. Here, since the metadata identifier is not registered and there is no metadata corresponding to the block 100, the block 100 of the R-map is simply overwritten with the new metadata identifier 500 (step S24).

続いて、ブロック101のメタデータ識別子499を参照し、メタデータ識別子499に対応するメタデータ内の参照カウントを、2から1減らし、新しいメタデータ識別子500でR-mapのブロック101を上書きする。続いて、ブロック102のメタデータ識別子499を参照し、当該メタデータ識別子499に対応するメタデータ内の参照カウントを1から1減らし、新しいメタデータ識別子500でR-mapのブロック102を上書きする。すると、メタデータ識別子499のメタデータ内の参照カウントが0となったため、メタデータ識別子499のメタデータを削除する。続いて、ブロック150の識別子(未登録)を参照し、新しい識別子500で上書きする。   Subsequently, the metadata identifier 499 of the block 101 is referred to, the reference count in the metadata corresponding to the metadata identifier 499 is reduced by 1, and the block 101 of the R-map is overwritten with the new metadata identifier 500. Subsequently, the metadata identifier 499 of the block 102 is referred to, the reference count in the metadata corresponding to the metadata identifier 499 is reduced by 1, and the block 102 of the R-map is overwritten with the new metadata identifier 500. Then, since the reference count in the metadata of the metadata identifier 499 becomes 0, the metadata of the metadata identifier 499 is deleted. Subsequently, the identifier (unregistered) in block 150 is referred to and overwritten with a new identifier 500.

後は、実施形態1と同様に、当該ファイルが作成されるディレクトリ「/dir1」に当該ファイル名「file_16KB_12345」と、当該ファイルに対応するメタデータのメタデータ識別子50とをペアで登録して、ファイル名とメタデータと関連付ける(ステップS25)。これでファイルの作成が完了したとして、仮想ファイルシステムはクライアントにファイル作成成功を返却する。   After that, as in the first embodiment, the file name “file_16KB_12345” and the metadata identifier 50 of the metadata corresponding to the file are registered as a pair in the directory “/ dir1” where the file is created, The file name is associated with the metadata (step S25). Assuming that file creation is complete, the virtual file system returns file creation success to the client.

次に、「ファイルの削除」の具体例を説明する。実施形態1と同様に、ファイルの削除の場合には、ディレクトリ構造からファイル名とメタデータ識別子のペアを削除する。但し、本実施形態では、メタデータ40自体は削除しない。メタデータ40は、全てのR-map60からの参照がなくなり、参照カウントが0になった時初めて削除される。   Next, a specific example of “file deletion” will be described. As in the first embodiment, when deleting a file, the file name and metadata identifier pair is deleted from the directory structure. However, in the present embodiment, the metadata 40 itself is not deleted. The metadata 40 is deleted only when there is no reference from all the R-maps 60 and the reference count becomes zero.

次に、「ブロックの読み込み」の具体例を、図8のフローチャートを参照して説明する。クライアント20が仮想ボリュームインターフェイス12に、物理アドレス101で表されるブロック(ブロック101)の読み込みを要求する。R-map60上のブロック101の物理アドレスにアクセスして、当該物理アドレスに格納されているメタデータ識別子500を取得し(ステップS32)、当該メタデータ識別子500に対応するメタデータを検索する。   Next, a specific example of “block reading” will be described with reference to the flowchart of FIG. The client 20 requests the virtual volume interface 12 to read a block (block 101) represented by the physical address 101. The physical address of the block 101 on the R-map 60 is accessed, the metadata identifier 500 stored in the physical address is acquired (step S32), and the metadata corresponding to the metadata identifier 500 is searched.

そして、検索したメタデータ40に記憶されているファイルの乱数シード42を取得する。また、検索したメタデータ40の物理アドレスリスト41から、アドレス100が何番目のブロックであるかを検索し、2番目のブロック(ブロックオフセット2)と確認する(ステップS33)。続いて、取得したファイルの乱数シード12345とブロックオフセット2とを組み合わせた新たな乱数シード(ブロックシード)を生成する。そして、新たな乱数シードを用いて擬似乱数アルゴリズムを初期化して、擬似乱数アルゴリズムから4KB分の当該ブロックのデータを計算し(ステップS34)、それをクライアントに返却する(ステップS35)。   Then, the random number seed 42 of the file stored in the searched metadata 40 is acquired. Further, it is searched from the physical address list 41 of the searched metadata 40 what number block the address 100 is, and it is confirmed as the second block (block offset 2) (step S33). Subsequently, a new random number seed (block seed) is generated by combining the random number seed 12345 and the block offset 2 of the acquired file. Then, a pseudo random number algorithm is initialized using a new random number seed, 4 KB worth of data of the block is calculated from the pseudo random number algorithm (step S34), and it is returned to the client (step S35).

また、クライアント20が仮想ボリュームインターフェイス12に、物理アドレス151で表されるブロック(ブロック151)の読み込みを要求したときの動作を説明する。R-mapのブロック151に対応する記憶領域にはメタデータ識別子が登録されておらず、対応するメタデータが無い。この場合、当該ブロックは一度もファイルに割り当てられたことがないことを示すため、全てのビットが0で構成された4KBのデータをクライアントに返却する。   The operation when the client 20 requests the virtual volume interface 12 to read the block (block 151) represented by the physical address 151 will be described. No metadata identifier is registered in the storage area corresponding to the block 151 of the R-map, and there is no corresponding metadata. In this case, in order to show that the block has never been assigned to the file, 4 KB data in which all bits are 0 is returned to the client.

ここで、ファイルの乱数シードを32bit、メタデータ識別子を24bit(ファイルを2^24-1=16777215個作成できると想定)とする。すると、ブロック毎の乱数シードは32(ファイルの乱数シード)+32(ブロックオフセット)=64bitとなる。このため、実施形態1と同等の範囲を維持しているが、R-mapのサイズは24bit*2^32=12GBとなり、実施形態1及び2のS-mapよりも小さくなる。つまり、ブロックの実データを記憶することなく、さらに少ない容量で、仮想ファイルシステムと仮想ボリュームとを実現できる。   Here, the random number seed of the file is 32 bits, and the metadata identifier is 24 bits (assuming that 2 ^ 24-1 = 16777215 files can be created). Then, the random number seed for each block is 32 (random number seed of the file) +32 (block offset) = 64 bits. For this reason, the range equivalent to that of the first embodiment is maintained, but the size of the R-map is 24 bits * 2 ^ 32 = 12 GB, which is smaller than the S-map of the first and second embodiments. In other words, a virtual file system and a virtual volume can be realized with a smaller capacity without storing actual block data.

また、上述したように、本実施形態におけるストレージシステム10では、ブロック毎に当該ブロックのシード自体となる乱数シードを持つのではなく、ファイルのメタデータ40毎に乱数シード42を持ち、各々のブロックはメタデータの識別子を持つこととしている。そして、ファイル毎の乱数シード42とブロックのオフセットとを組み合わせて、ブロックシードとなる新たな乱数シードを生成している。このため、ファイルのデータを変更する場合には、ファイルの乱数シード42を変更すれば良く、R-map60の更新は不要である。例えば、R-map60が補助記憶装置に保存されている場合でもその更新が不要であるため、大量のファイルの更新が効率的に行え、かかる時間の削減を図ることができる。   Further, as described above, the storage system 10 according to the present embodiment does not have a random number seed that becomes the seed of the block itself for each block, but has a random number seed 42 for each metadata 40 of the file. Has a metadata identifier. Then, a new random number seed to be a block seed is generated by combining the random number seed 42 for each file and the block offset. For this reason, when the file data is changed, the random number seed 42 of the file may be changed, and the R-map 60 need not be updated. For example, even when the R-map 60 is stored in the auxiliary storage device, it is not necessary to update the R-map 60. Therefore, a large amount of files can be updated efficiently, and the time required can be reduced.

さらに、ファイルが削除されてもR-map60から参照されている限りメタデータを削除しないようにし、別のメタデータ識別子で当該ブロックが上書きされ、全てのR-map60からの参照がなくなった時に初めて当該メタデータを削除する。R-map60からの参照がなくなったか否かを、参照数をカウントすることで判定するため、メタデータには参照カウント43を追加する。この場合、R-map60はS-map50と同様に巨大になり、補助記憶装置に保存されることが考えられるが、本技術で想定しているボリュームバックアップでは、連続した物理アドレスにシーケンシャルにアクセスするため、空間的な局所性が有り、R-map60を先読みしやすく、アクセス効率が良い。   Furthermore, even if a file is deleted, the metadata is not deleted as long as it is referenced from the R-map 60, and the block is overwritten with another metadata identifier, and the reference from all the R-maps 60 disappears for the first time. Delete the metadata. In order to determine whether or not the reference from the R-map 60 is lost by counting the number of references, a reference count 43 is added to the metadata. In this case, the R-map 60 may be as large as the S-map 50 and stored in the auxiliary storage device. However, in the volume backup assumed in the present technology, sequential physical addresses are accessed sequentially. Therefore, there is a spatial locality, the R-map 60 is easy to read ahead, and the access efficiency is good.

<実施形態4>
次に、本発明の第4の実施形態を説明する。本実施形態におけるストレージシステム10は、実施形態3で説明したものとほぼ同様の構成をとっているが、以下の点で異なる。
<Embodiment 4>
Next, a fourth embodiment of the present invention will be described. The storage system 10 according to the present embodiment has substantially the same configuration as that described in the third embodiment, but differs in the following points.

まず、上述したように、本実施形態におけるメタデータ逆引きマップ記憶部16のR-map60は、対応するブロックが含まれるファイルに対応するメタデータ識別子を記憶している。これに加えて、R-map60は、対応するブロックのファイル内における位置を表すオフセットの一部であるオフセットフラグメント(ブロック識別情報)を記憶している。このとき、オフセットフラグメントとしては、ブロックのオフセットの前後任意数のビットを落とし、残ったビットのみで形成されることとする。なお、オフセットフラグメントは、ファイルを構成する各ブロックを当該ファイル内において区別できる情報であれば、いかなる情報であってもよい。   First, as described above, the R-map 60 of the metadata reverse lookup map storage unit 16 in the present embodiment stores a metadata identifier corresponding to a file including a corresponding block. In addition, the R-map 60 stores an offset fragment (block identification information) that is a part of an offset representing a position of the corresponding block in the file. At this time, as an offset fragment, an arbitrary number of bits are dropped before and after the block offset, and only the remaining bits are formed. Note that the offset fragment may be any information as long as it can distinguish each block constituting the file within the file.

そして、上記オフセットフラグメントは、物理アドレスリストから、元となるオフセットの上位ビット、下位ビットの未知の部分が求められ、当該オフセットに復元される。復元されたオフセットは、上述した実施形態4と同様に、ブロックに対応するメタデータ40に記憶されているファイルの乱数シード42と組み合わせられて、ブロックの乱数シードとして用いられる。   The offset fragment is obtained from the physical address list by obtaining the unknown bits of the upper and lower bits of the original offset and restoring the offset. The restored offset is combined with the random number seed 42 of the file stored in the metadata 40 corresponding to the block and used as the random number seed of the block, as in the fourth embodiment.

上記構成のストレージシステム10において「ファイルの作成」の具体例を説明する。ここでは、ブロックオフセットを32bitとして、前8bit、後ろ8bitを除いたものをオフセットフラグメントとする。   A specific example of “file creation” in the storage system 10 configured as described above will be described. Here, the block offset is set to 32 bits, and the offset fragment is obtained by removing the front 8 bits and the rear 8 bits.

クライアント20が仮想ファイルシステム12にファイル「file_128GB_12345」を作成する場合には、まず、実施形態3と同様に、ディレクトリツリー構造への登録を行い、ファイル識別子500のメタデータを作成する。また、ファイルサイズ128GBに必要な33554432個の空きブロックを割り当て、それらの物理アドレスを当該メタデータ40の物理アドレスリスト41に先頭から順に保存する。ここで、ファイル先頭のブロック(ブロックオフセット0)としてブロック100、ファイルの先頭から601番目(ブロックオフセット600)のブロックとしてブロック200、16780001番目(ブロックオフセット16780000)のブロックとしてブロック201、が割り当てられたとする。   When the client 20 creates the file “file_128GB_12345” in the virtual file system 12, first, as in the third embodiment, registration in the directory tree structure is performed and metadata of the file identifier 500 is created. Further, 35354432 free blocks necessary for the file size of 128 GB are allocated, and their physical addresses are stored in the physical address list 41 of the metadata 40 in order from the top. Here, block 100 is assigned as the first block (block offset 0), block 200 is assigned as the 601st block (block offset 600) from the beginning of the file, and block 201 is assigned as the 16780001th block (block offset 16780000). To do.

続いて、ブロック100に対応するR-map更新では、ファイルのブロックオフセット0から前後8ビットを落としたブロックオフセット0とメタデータ識別子500のペアを、R-map60に保存する。ブロック200に対するR-map更新では、ファイルのブロックオフセット600(0x00000258)から前後8ビットを落とした2(0x0002)とメタデータ識別子500のペアを、R-map60に保存する。ブロック201に対するR-map更新では、ファイルのブロックオフセット16780000(0x01000AE0)から前後8ビットを落とした10(0x000A)とメタデータ識別子500のペアを、R-map60に保存する。   Subsequently, in the R-map update corresponding to the block 100, a pair of the block offset 0 and the metadata identifier 500 obtained by dropping 8 bits before and after the block offset 0 of the file is stored in the R-map 60. In the R-map update for the block 200, a pair of 2 (0x0002) and the metadata identifier 500 obtained by dropping 8 bits before and after the block offset 600 (0x00000258) of the file is stored in the R-map 60. In the R-map update for the block 201, a pair of 10 (0x000A), which is obtained by dropping 8 bits before and after the block offset 16780000 (0x01000AE0) of the file, and the metadata identifier 500 is stored in the R-map 60.

次に、「ブロックの読み込み」の具体例を説明する。クライアント20が仮想ボリュームインターフェイス12を用いて物理アドレス100のブロックを読み込む場合には、まずR-map60からブロック100に対応するメタデータ識別子500とオフセットフラグメント0を求める。そして、メタデータ識別子500に対応するメタデータ40を取得して、ファイルの乱数シード12345を取得する。また、メタデータ内の物理アドレスリスト41を先頭から順次検索し、リストの先頭(ブロックオフセット0)にある当該ブロックの物理アドレス100を見つけ、当該ブロックのブロックオフセットを0と決定する。そして、ファイルの乱数シード12345とブロックオフセット0を組み合わせて、新たな乱数シードとして擬似乱数アルゴリズムを初期化し、4KBの乱数データを計算してクライアントに返却する。   Next, a specific example of “block reading” will be described. When the client 20 reads the block of the physical address 100 using the virtual volume interface 12, first, the metadata identifier 500 and the offset fragment 0 corresponding to the block 100 are obtained from the R-map 60. Then, the metadata 40 corresponding to the metadata identifier 500 is acquired, and the random number seed 12345 of the file is acquired. Further, the physical address list 41 in the metadata is sequentially searched from the head, the physical address 100 of the block at the head (block offset 0) of the list is found, and the block offset of the block is determined to be 0. Then, the random number seed 12345 of the file and the block offset 0 are combined to initialize the pseudo random number algorithm as a new random number seed, and 4 KB random number data is calculated and returned to the client.

クライアント20が仮想ボリュームインターフェイス12を用いて物理アドレス200のブロックを読み込む場合には、まず、R-map60からブロック200に対応するメタデータ識別子500とオフセットフラグメント2を求める。そして、メタデータ識別子500に対応するメタデータを取得し、ファイルの乱数シード12345を取得する。また、オフセットフラグメント2に256(落とした下位ビットのビット数で2をべき乗したもの:2^8=256)を掛けて求めたブロックオフセット512から、物理アドレスリストの256個分を順次検索すると、88番目に物理アドレス200が見つかる。つまり、88+512=600であり、ファイルのブロックオフセットは600であることが計算される。後は、ファイルの乱数シード12345とブロックオフセット600を組み合わせて擬似乱数アルゴリズムを初期化し、4KBの乱数データを計算してクライアントに返却する。   When the client 20 reads the block of the physical address 200 using the virtual volume interface 12, first, the metadata identifier 500 and the offset fragment 2 corresponding to the block 200 are obtained from the R-map 60. Then, the metadata corresponding to the metadata identifier 500 is acquired, and the random number seed 12345 of the file is acquired. In addition, when 256 offsets in the physical address list are sequentially searched from block offset 512 obtained by multiplying offset fragment 2 by 256 (the number of bits of the lower-order bits dropped to the power of 2: 2 ^ 8 = 256) 88th, physical address 200 is found. That is, it is calculated that 88 + 512 = 600 and the block offset of the file is 600. After that, the random number seed 12345 of the file and the block offset 600 are combined to initialize the pseudo random number algorithm, and 4 KB random number data is calculated and returned to the client.

クライアント20が仮想ボリュームインターフェイス12を用いて物理アドレス201のブロックを読み込む場合には、まず、R-map60からブロック200に対応するメタデータ識別子500とオフセットフラグメント10を求める。そして、メタデータ識別子500に対応するメタデータを取得し、ファイルの乱数シード12345を取得する。また、オフセットフラグメント10に256(落とした下位ビットのビット数で2をべき乗したもの:2^8=256)を掛けて求めたブロックオフセット2560から、物理アドレスリストの256個分を順次検索するが、見つからない。続いて、上記ブロックオフセット2560に16777216(ブロックオフセットのビット数から落とした上位ビットのビット数を引いたもので2をべき乗したもの:2^(32-8)=16777216)を足して、その場所(ブロックオフセット16779776)から、もう一度256個分の検索を行うと、224番目に物理アドレス201が見つかる。これにより、ブロックオフセットは、224+16779776=1678000と計算される。その後は、ファイルの乱数シード12345とブロックオフセット1678000を組み合わせて擬似乱数アルゴリズムを初期化し、4KBの乱数データを計算してクライアントに返却する。   When the client 20 reads the block of the physical address 201 using the virtual volume interface 12, first, the metadata identifier 500 and the offset fragment 10 corresponding to the block 200 are obtained from the R-map 60. Then, the metadata corresponding to the metadata identifier 500 is acquired, and the random number seed 12345 of the file is acquired. Also, 256 blocks in the physical address list are sequentially searched from the block offset 2560 obtained by multiplying the offset fragment 10 by 256 (the number of bits of the lower-order bits dropped to the power of 2: 2 ^ 8 = 256). ,can not find. Next, add 16777216 (the block offset bit number minus the number of high-order bits dropped to the power of 2: 2 ^ (32-8) = 16777216) to the block offset 2560, and the location If a search for 256 addresses is performed again from (block offset 16779776), the physical address 201 is found at the 224th position. Thereby, the block offset is calculated as 224 + 16779776 = 1678000. After that, the pseudorandom algorithm is initialized by combining the random number seed 12345 of the file and the block offset 1678000, 4KB random number data is calculated and returned to the client.

なお、上記から分かる通り、ブロックオフセットが16777216以上(64GB以上のファイルで出現)で初めて、上位8ビットが0で無くなるため、このサイズ未満のブロックオフセットでは必ず一回の検索でブロックが見つかる。同様に、128GBまでは高々2回のループで上位の未知ビットが求まる。   As can be seen from the above, for the first time when the block offset is 16777216 or more (appears in a file of 64 GB or more), the upper 8 bits are not 0. Therefore, if the block offset is less than this size, a block is always found by one search. Similarly, up to 128 GB, the upper unknown bits are obtained in two loops at most.

ここで、ファイルの乱数シードを32bit、メタデータ識別子を24bit(ファイルを2^24-1=16777215個作成できると想定)、オフセットフラグメントを16bitとする。すると、ブロック毎の乱数シードは32(ファイルの乱数シード)+32(ブロックオフセット)=64bitとなる。このため、実施形態1と同等の範囲を維持しているが、R-mapのサイズは40bit*2^32=20GBとなり、実施形態1のS-mapよりも小さくなる。つまり、ブロックの実データを記憶することなく、さらに少ない容量で、仮想ファイルシステムと仮想ボリュームとを実現できる。   Here, the random number seed of the file is 32 bits, the metadata identifier is 24 bits (assuming that 2 ^ 24-1 = 16777215 files can be created), and the offset fragment is 16 bits. Then, the random number seed for each block is 32 (random number seed of the file) +32 (block offset) = 64 bits. For this reason, the range equivalent to that of the first embodiment is maintained, but the size of the R-map is 40 bits * 2 ^ 32 = 20 GB, which is smaller than the S-map of the first embodiment. In other words, a virtual file system and a virtual volume can be realized with a smaller capacity without storing actual block data.

また、実施形態3と同様に、ファイルのメタデータ毎に乱数シードを持っているため、ファイルのデータを変更する場合には、ファイルの乱数シードのみを変更すれば良く、R-mapの更新は不要である。つまり、ファイル単位で乱数シードが操作でき、ファイルを少しずつ変更しながらバックアップを重ねる評価ができる。   Further, as in the third embodiment, since each file metadata has a random number seed, when changing the file data, it is only necessary to change the random number seed of the file. It is unnecessary. In other words, random number seeds can be manipulated on a file-by-file basis, and backups can be evaluated while changing files little by little.

ここで、上述した実施形態3では、物理アドレスは単純にブロックの並びの順にリスト化されているため、順次検索が必要で、二分探索やハッシュテーブル等の検索効率化ができない。これに対して、本実施形態では、ブロックのオフセットの前後任意数のビットを落とし、残ったビットをオフセットフラグメントとして、メタデータ識別子とともに、ブロック毎にR-mapに保存している。そして、オフセットフラグメントと物理アドレスリストから上位ビット、下位ビットの未知の部分を求め、オフセットに復元している。このとき、下位の未知のビットを求めるには単純にリストの順次検索を用いるため、空間的な局所性が有り、キャッシュ効率が良い。また、上位の未知のビットを求めるには飛び飛びの検索となるが、ファイルサイズが非常に大きくならないと上位未知ビットは0か小さい値となり、少ない回数のループで見つかる。このように、本実施形態では、オフセット検索のヒントとなるオフセットフラグメントをR-mapに記憶しているため、実施形態3と比較して、ブロックオフセットの計算(検索)効率が良く、性能が良い。   Here, in the above-described third embodiment, since the physical addresses are simply listed in the order of the block arrangement, sequential search is necessary, and search efficiency such as binary search and hash table cannot be achieved. On the other hand, in this embodiment, an arbitrary number of bits are dropped before and after the offset of the block, and the remaining bits are stored as an offset fragment in the R-map together with the metadata identifier for each block. Then, the unknown part of the upper and lower bits is obtained from the offset fragment and the physical address list, and restored to the offset. At this time, since a list sequential search is simply used to obtain lower unknown bits, there is spatial locality and cache efficiency is good. Further, in order to obtain the upper unknown bits, a search is skipped. However, if the file size does not become very large, the upper unknown bits become 0 or a smaller value and are found in a small number of loops. As described above, in this embodiment, offset fragments serving as hints for offset search are stored in the R-map. Therefore, compared to the third embodiment, the block offset calculation (search) efficiency is higher and the performance is better. .

ここで、上述した各実施形態におけるストレージシステムの変形例について説明する。
まず、実施形態1乃至4では、ブロックの乱数シードの計算に使われる、または、メタデータに保存されるファイルの乱数シードは、ファイル名に特定の書式で埋め込まれた値を利用しているが、別の方法でも良い。例えば、ファイル名のハッシュ値を求めて用いても良い。または、ファイルの先頭の特定ビット数分に書き込まれたデータを乱数シードとして用いる方法もある。もしくは、ファイル毎に特定の名前の代替データストリーム(フォークなどとも呼ばれる)でファイルの乱数シードを参照・変更できるようにしても良い。ファイルシステムの機能以外にブロックの乱数を操作するインターフェイスを用意しても良い。
Here, a modified example of the storage system in each embodiment described above will be described.
First, in the first to fourth embodiments, a random number seed of a file used for calculation of a random number seed of a block or stored in metadata uses a value embedded in a file name in a specific format. Another method may be used. For example, a hash value of the file name may be obtained and used. Alternatively, there is a method of using data written for a specific number of bits at the beginning of the file as a random number seed. Alternatively, the random number seed of the file may be referred to and changed with an alternative data stream (also called a fork) having a specific name for each file. In addition to the file system function, an interface for manipulating block random numbers may be prepared.

実施形態1,2では、S-mapに保存するブロックの乱数シードを、ファイルの乱数シードから計算しているが、別の方法でも良い。例えば、ファイルに書き込まれたデータをブロックの乱数シード列としてそのまま扱っても良い。または、ファイルに書き込まれたデータをブロック毎に区切り、ブロック毎に書き込まれたデータのハッシュ値を求めて、それをブロックの乱数シードとする方法もある。もしくは、ファイル毎に特定の名前の代替データストリームでブロック毎の乱数シードを参照・更新できるようにしても良い。ファイルシステムの一般的な機能以外にブロックの乱数を操作するインターフェイスを用意しても良い。   In the first and second embodiments, the random number seed of the block stored in the S-map is calculated from the random number seed of the file, but another method may be used. For example, data written in a file may be handled as it is as a random number seed sequence of blocks. Alternatively, there is a method in which data written to a file is divided into blocks, a hash value of data written for each block is obtained, and this is used as a random number seed for the block. Alternatively, the random number seed for each block may be referred to / updated with an alternative data stream having a specific name for each file. In addition to the general functions of the file system, an interface for manipulating block random numbers may be provided.

実施形態2では、ボリュームの乱数シードを変更するために、ルートディレクトリ上の特定の名前のファイルにシード値を書き込むとしているが、別の方法でも良い。たとえば書き込まれた値をそのまま乱数シード値として用いるのではなく、ハッシュ関数等の変換を行っても良い。もしくは、仮想ボリュームインターフェイスがボリュームラベルをサポートとするようにして、ボリュームラベルに特定の書式で乱数シードを埋め込み、その値をボリュームの乱数シードにする方法がある(「volume_seed_34567」というボリュームラベルを設定すると、ボリュームの乱数シードを34567とするなど)。その他、ボリュームの先頭ブロックなど特定の場所に書き込まれた値を乱数シードとしても良い。もしくは、乱数を操作するためのインターフェイスを仮想ボリュームインターフェイスに用意しても良い。   In the second embodiment, the seed value is written in a file with a specific name on the root directory in order to change the random number seed of the volume. However, another method may be used. For example, instead of using the written value as the random number seed value as it is, conversion such as a hash function may be performed. Alternatively, the virtual volume interface can support volume labels, and a random number seed can be embedded in the volume label in a specific format, and that value can be used as the volume random number seed (if you set the volume label "volume_seed_34567") , And the volume random number seed is 34567). In addition, a value written in a specific location such as the first block of the volume may be used as the random number seed. Alternatively, an interface for manipulating random numbers may be provided in the virtual volume interface.

実施形態2では、ボリューム全体の乱数シードとして1つの値を利用しているが、ボリュームを物理アドレスから容易に識別可能な複数のエリアに分割し、エリア毎に個別の乱数シードを設定しても良い。   In the second embodiment, one value is used as the random number seed for the entire volume. However, even if the volume is divided into a plurality of areas that can be easily identified from the physical address, individual random number seeds are set for each area. good.

実施形態3,4では、ファイルを削除してもブロックのデータが変更されないようにするため、ファイルを削除してもR-mapからの参照が無くなるまではメタデータを削除しないようにしているが、ファイル削除時にブロックのデータが変更されても良い場合には、メタデータを削除し、R-mapからメタデータ識別子を削除しても良い。この場合、削除後のブロックからは全ビットが0のデータが読まれるようにする。   In the third and fourth embodiments, in order to prevent the block data from being changed even if the file is deleted, the metadata is not deleted until the reference from the R-map disappears even if the file is deleted. If the block data may be changed when the file is deleted, the metadata may be deleted and the metadata identifier may be deleted from the R-map. In this case, the data after all bits are read from the deleted block.

ファイルが割り当てられていないブロックからは全ビットが0のデータが読まれることとしているが、再現性のあるデータが読まれるのならば0でなくても良い。例えば、全ブロックで特定のデータを返すようにしても良い。もしくは、物理アドレスを乱数シードとして擬似乱数アルゴリズムで求めたデータを用いても良い。   It is assumed that data with all bits 0 is read from a block to which no file is assigned, but it may not be 0 if reproducible data is read. For example, specific data may be returned in all blocks. Alternatively, data obtained by a pseudorandom algorithm using a physical address as a random number seed may be used.

メタデータに含まれている物理アドレスリストの記憶方法については、単純なリストを想定しているが、次のようにして圧縮することも考えられる。1つのファイルは一般的になるべく連続したブロックに割り当てられるため、物理アドレスリストは連続した数値になっている部分が多い。よってランレングス符号化のように、連続した部分の先頭アドレス、連続しているアドレスの数のペアをリストにすると、物理アドレスリストを単純な方法で効率的に圧縮できる。また、更に一定の単位でアドレスリストを分割しておく(例えば2^12=4096個単位)と、物理アドレスリストをランダムアクセスする場合でもある程度効率的に圧縮データを伸張できる。例えば、10000番目の物理アドレスを参照する場合は、8192番目のブロック(2個めの分割単位)から検索を始める、などである。   As a method for storing the physical address list included in the metadata, a simple list is assumed. However, compression may be performed as follows. Since one file is generally assigned to consecutive blocks as much as possible, the physical address list has a lot of continuous numerical values. Therefore, as in the case of run-length encoding, if the pair of the head address of the continuous part and the number of the continuous addresses are listed, the physical address list can be efficiently compressed by a simple method. Further, if the address list is further divided in a certain unit (for example, 2 ^ 12 = 4096 units), even when the physical address list is randomly accessed, the compressed data can be decompressed to some extent efficiently. For example, when referring to the 10000th physical address, the search is started from the 8192th block (second division unit).

ボリュームへデータを書き込む場合、当該ブロックから読み込まれるはずのデータと比較し、異なる場合にはエラーとしているが、他の方法も考えられる。例えば、何もせずに破棄しても良い。この場合、比較処理のために乱数データを計算する必要がなく、より高い性能が求められる場合に有効である。もしくは、エラーとはしないが、異なった場所の物理アドレスのリストをとっておき、後で参照できるようにしても良い。   When writing data to the volume, it is compared with the data that should be read from the block, and if it is different, it is considered as an error. For example, you may discard without doing anything. In this case, it is not necessary to calculate random number data for the comparison process, which is effective when higher performance is required. Alternatively, although it is not an error, a list of physical addresses at different locations may be kept so that they can be referred to later.

<付記>
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明におけるストレージシステム(図9参照)、プログラム、情報処理方法の構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
<Appendix>
Part or all of the above-described embodiment can be described as in the following supplementary notes. The outline of the configuration of the storage system (see FIG. 9), program, and information processing method in the present invention will be described below. However, the present invention is not limited to the following configuration.

(付記1)
ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶するメタデータ記憶手段と、
前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶するブロックマップ記憶手段と、
前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成するブロックデータ生成手段と、
を備えた、
ストレージシステム。
(Appendix 1)
Metadata storage means for storing, for each file, metadata including information on a physical address that specifies a storage area that is a reference destination of a block constituting the file;
Block map storage means for storing information for specifying a block seed that is a source for generating data of the block in the storage area specified by the physical address;
Block data generating means for specifying the block seed based on information for specifying the block seed stored in the storage area specified by the physical address, and generating block data from the block seed;
With
Storage system.

上記発明によると、ファイルの実データを記憶することなく、仮想ファイルシステムを構築できると共に、物理アドレスからブロック単位でボリューム操作も行うことができる。具体的には、まず、ファイルのメタデータから当該ファイルを構成するブロックの参照先となる物理アドレスを参照して、ブロックシードを特定する情報からブロックシードを特定する。そして、ブロックシードから疑似乱数生成アルゴリズムなどを用いてブロックのデータを生成して、ブロックのデータからファイルを生成する。これにより、仮想ファイルシステムを構築することができる。また、物理アドレスを参照して上述同様にブロックシードを特定し、ブロックのデータを生成することで、仮想ボリュームも構築することができる。   According to the above invention, a virtual file system can be constructed without storing actual file data, and volume operations can be performed in units of blocks from physical addresses. Specifically, first, the block seed is specified from the information for specifying the block seed by referring to the physical address that is the reference destination of the block constituting the file from the metadata of the file. Then, block data is generated from the block seed using a pseudo random number generation algorithm or the like, and a file is generated from the block data. Thereby, a virtual file system can be constructed. A virtual volume can also be constructed by specifying a block seed with reference to a physical address and generating block data in the same manner as described above.

これにより、上記ボリュームをバックアップやリストアの評価用に使用する場合であっても、当該ボリュームを構成するブロックの実データを記憶することがないため、ストレージシステムの容量を低減させることができる。また、ボリュームの作成や変更の際には、ブロックシードを特定する情報を操作すればよいため、かかる時間の低減を図ることができる。   As a result, even when the volume is used for backup or restore evaluation, the actual data of the blocks constituting the volume is not stored, so that the capacity of the storage system can be reduced. In addition, when creating or changing a volume, information for specifying a block seed may be manipulated, so that the time required can be reduced.

(付記2)
付記1に記載のストレージシステムであって、
前記ブロックマップ記憶手段は、前記ブロックシードを特定する情報として、当該ブロックシードそのものを記憶する、
ストレージシステム。
(Appendix 2)
The storage system according to attachment 1, wherein
The block map storage means stores the block seed itself as information for specifying the block seed.
Storage system.

(付記3)
付記1に記載のストレージシステムであって、
前記ブロックマップ記憶手段は、前記ブロックシードを特定する情報として、当該ブロックシードの一部を形成する情報を記憶し、
前記ブロックデータ生成手段は、前記ブロックで形成されるボリュームについて設定された前記ブロックシードの他の一部を形成する情報と、前記ブロックシードを特定する情報である前記ブロックシードの一部を形成する情報と、からブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
ストレージシステム。
(Appendix 3)
The storage system according to attachment 1, wherein
The block map storage means stores information forming a part of the block seed as information specifying the block seed,
The block data generation unit forms information forming another part of the block seed set for the volume formed by the block and a part of the block seed which is information for specifying the block seed. Block seed is identified from the information, and block data is generated from the block seed.
Storage system.

上記発明によると、ブロックシードは、ボリューム毎に定められた情報と物理アドレスに格納された情報とから特定される。このため、ボリューム毎に定められた情報を変更することで、全体的に新たなブロックのデータを生成でき、容易にボリュームの生成、変更を行うことができる。   According to the above invention, the block seed is specified from information determined for each volume and information stored in the physical address. For this reason, by changing the information determined for each volume, data of a new block can be generated as a whole, and the volume can be easily generated and changed.

(付記4)
付記1に記載のストレージシステムであって、
前記ブロックマップ記憶手段は、前記ブロックシードを特定する情報として、ブロックが含まれるファイルに対応する前記メタデータを特定するメタデータ識別子を記憶し、
前記メタデータ記憶手段は、前記メタデータに、少なくともファイル内においてブロック毎に異なる情報であるブロック識別情報と、ファイル毎に異なる情報であるファイルシードと、を記憶し、
前記ブロックデータ生成手段は、前記ブロックシードを特定する情報である前記メタデータ識別子からブロックが含まれるファイルに対応する前記メタデータを参照して、当該メタデータに記憶されている前記ブロック識別情報と前記ファイルシードとから前記ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
ストレージシステム。
(Appendix 4)
The storage system according to attachment 1, wherein
The block map storage means stores, as information for specifying the block seed, a metadata identifier for specifying the metadata corresponding to a file including a block;
The metadata storage means stores, in the metadata, at least block identification information that is information different for each block in the file, and a file seed that is information different for each file,
The block data generation means refers to the metadata corresponding to the file containing the block from the metadata identifier that is information for specifying the block seed, and the block identification information stored in the metadata Identifying the block seed from the file seed and generating block data from the block seed;
Storage system.

(付記5)
付記1に記載のストレージシステムであって、
前記ブロックマップ記憶手段は、前記ブロックシードを特定する情報として、ブロックが含まれるファイルに対応する前記メタデータを特定するメタデータ識別子と、少なくともファイル内においてブロック毎に異なる情報であるブロック識別情報と、を記憶し、
前記メタデータ記憶手段は、前記メタデータに、ファイル毎に異なる情報であるファイルシードを記憶し、
前記ブロックデータ生成手段は、前記ブロックシードを特定する情報である前記メタデータ識別子からブロックが含まれるファイルに対応する前記メタデータを参照して、当該メタデータに記憶されている前記ファイルシードと、前記ブロックシードを特定する情報である前記ブロック識別情報と、から前記ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
ストレージシステム。
(Appendix 5)
The storage system according to attachment 1, wherein
The block map storage means includes, as information for specifying the block seed, a metadata identifier for specifying the metadata corresponding to a file including a block, and block identification information that is at least different information for each block in the file. Remember,
The metadata storage means stores, in the metadata, a file seed that is different information for each file,
The block data generation means refers to the metadata corresponding to a file including a block from the metadata identifier that is information for specifying the block seed, and the file seed stored in the metadata; Identifying the block seed from the block identification information, which is information identifying the block seed, and generating block data from the block seed,
Storage system.

(付記6)
付記4又は5に記載のストレージシステムであって、
前記ブロック識別情報は、ブロックのファイル内における位置を表すオフセット情報の少なくとも一部にて形成された情報である、
ストレージシステム。
(Appendix 6)
The storage system according to appendix 4 or 5, wherein
The block identification information is information formed by at least part of offset information indicating the position of the block in the file.
Storage system.

上記発明によると、ブロックシードは、ファイル毎に定められたファイルシードと、ファイル内におけるブロックを識別する情報(例えば、ファイル内におけるブロックの位置を表すオフセット情報)と、から特定される。このため、ファイルシードを変更することで、ファイル毎にデータの変更等の操作を容易に行うことができる。   According to the above invention, the block seed is specified from the file seed determined for each file and the information for identifying the block in the file (for example, offset information indicating the position of the block in the file). For this reason, by changing the file seed, it is possible to easily perform operations such as changing data for each file.

(付記7)
付記1乃至5のいずれかに記載のストレージシステムであって、
前記メタデータ記憶手段に記憶された前記メタデータを参照して、ファイルを構成するブロックに対応する前記物理アドレスを特定し、当該物理アドレスを用いて前記ブロックデータ生成手段にて生成されたブロックのデータからファイルを生成することにより仮想的なファイルシステムを構築する仮想ファイルシステム構築部と、
前記物理アドレスを用いて前記ブロックデータ生成手段にて生成されたブロックのデータからボリュームを生成することにより仮想的なボリュームを構築する仮想ボリューム構築部と、
を備えたストレージシステム。
(Appendix 7)
The storage system according to any one of appendices 1 to 5,
With reference to the metadata stored in the metadata storage means, the physical address corresponding to the block constituting the file is specified, and the block data generated by the block data generation means is identified using the physical address. A virtual file system construction unit that constructs a virtual file system by generating a file from data;
A virtual volume construction unit that constructs a virtual volume by creating a volume from block data generated by the block data generation means using the physical address;
Storage system with

(付記8)
情報処理装置に、
ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶するメタデータ記憶手段と、
前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶するブロックマップ記憶手段と、
前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成するブロックデータ生成手段と、
を実現させるためのプログラム。
(Appendix 8)
In the information processing device,
Metadata storage means for storing, for each file, metadata including information on a physical address that specifies a storage area that is a reference destination of a block constituting the file;
Block map storage means for storing information for specifying a block seed that is a source for generating data of the block in the storage area specified by the physical address;
Block data generating means for specifying the block seed based on information for specifying the block seed stored in the storage area specified by the physical address, and generating block data from the block seed;
A program to realize

(付記9)
ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶すると共に、前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶し、
前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
情報処理方法。
(Appendix 9)
For each file, metadata including physical address information that specifies a storage area that is a reference destination of a block that constitutes the file is stored, and data of the block is stored in the storage area that is specified by the physical address. Stores information that identifies the block seed from which to generate,
Identifying the block seed based on information identifying the block seed stored in the storage area identified by the physical address, and generating block data from the block seed,
Information processing method.

(付記10)
付記9に記載の情報処理方法であって、
前記ブロックシードを特定する情報として、当該ブロックシードそのものを記憶する、
情報処理方法。
(Appendix 10)
An information processing method according to attachment 9, wherein
As the information specifying the block seed, the block seed itself is stored.
Information processing method.

(付記11)
付記9に記載の情報処理方法であって、
前記ブロックシードを特定する情報として、当該ブロックシードの一部を形成する情報を記憶し、
前記ブロックで形成されるボリュームについて設定された前記ブロックシードの他の一部を形成する情報と、前記ブロックシードを特定する情報である前記ブロックシードの一部を形成する情報と、からブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
情報処理方法。
(Appendix 11)
An information processing method according to attachment 9, wherein
As information for specifying the block seed, storing information forming a part of the block seed,
A block seed is determined from information forming another part of the block seed set for the volume formed by the block and information forming a part of the block seed, which is information for specifying the block seed. Identify and generate block data from the block seed,
Information processing method.

(付記12)
付記9に記載の情報処理方法であって、
前記ブロックシードを特定する情報として、ブロックが含まれるファイルに対応する前記メタデータを特定するメタデータ識別子を記憶し、
前記メタデータに、少なくともファイル内においてブロック毎に異なる情報であるブロック識別情報と、ファイル毎に異なる情報であるファイルシードと、を記憶し、
前記ブロックシードを特定する情報である前記メタデータ識別子からブロックが含まれるファイルに対応する前記メタデータを参照して、当該メタデータに記憶されている前記ブロック識別情報と前記ファイルシードとから前記ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
情報処理方法。
(Appendix 12)
An information processing method according to attachment 9, wherein
As the information for specifying the block seed, a metadata identifier for specifying the metadata corresponding to the file including the block is stored,
In the metadata, at least block identification information that is information different for each block in the file, and file seed that is information different for each file are stored,
By referring to the metadata corresponding to the file including the block from the metadata identifier that is information for specifying the block seed, the block is determined from the block identification information stored in the metadata and the file seed. Identify the seed and generate block data from the block seed.
Information processing method.

(付記13)
付記9に記載の情報処理方法であって、
前記ブロックシードを特定する情報として、ブロックが含まれるファイルに対応する前記メタデータを特定するメタデータ識別子と、少なくともファイル内においてブロック毎に異なる情報であるブロック識別情報と、を記憶し、
前記メタデータに、ファイル毎に異なる情報であるファイルシードを記憶し、
前記ブロックシードを特定する情報である前記メタデータ識別子からブロックが含まれるファイルに対応する前記メタデータを参照して、当該メタデータに記憶されている前記ファイルシードと、前記ブロックシードを特定する情報である前記ブロック識別情報と、から前記ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
情報処理方法。
(Appendix 13)
An information processing method according to attachment 9, wherein
As the information for specifying the block seed, a metadata identifier for specifying the metadata corresponding to the file including the block, and at least block identification information that is different for each block in the file are stored,
In the metadata, a file seed that is different information for each file is stored,
Information for specifying the block seed and the file seed stored in the metadata with reference to the metadata corresponding to the file including the block from the metadata identifier which is information for specifying the block seed Identifying the block seed from the block identification information, and generating block data from the block seed,
Information processing method.

(付記14)
付記12又は13に記載のストレージシステムであって、
前記ブロック識別情報は、ブロックのファイル内における位置を表すオフセット情報の少なくとも一部にて形成された情報である、
情報処理方法。
(Appendix 14)
The storage system according to appendix 12 or 13,
The block identification information is information formed by at least part of offset information indicating the position of the block in the file.
Information processing method.

なお、上述したプログラムは、記憶装置に記憶されていたり、コンピュータが読み取り可能な記録媒体に記録されている。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。   Note that the above-described program is stored in a storage device or recorded on a computer-readable recording medium. For example, the recording medium is a portable medium such as a flexible disk, an optical disk, a magneto-optical disk, and a semiconductor memory.

以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。   Although the present invention has been described with reference to the above-described embodiment and the like, the present invention is not limited to the above-described embodiment. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.

10 ストレージシステム
11 仮想ファイルシステム
12 仮想ボリュームインタフェース
13 ディレクトリツリー構造記憶部
14 ファイルメタデータ記憶部
15 乱数シードマップ記憶部
16 メタデータ逆引きマップ記憶部
20 クライアント
30 評価対象ストレージシステム
31 評価対象ストレージ
40 メタデータ
41 物理アドレスリスト
42 ファイル乱数シード
43 参照カウント
50 乱数シードマップ
60 メタデータ逆引きマップ
100 ストレージシステム
110 ブロックデータ生成手段
120 メタデータ記憶手段
130 ブロックマップ記憶手段
10 Storage System 11 Virtual File System 12 Virtual Volume Interface 13 Directory Tree Structure Storage Unit 14 File Metadata Storage Unit 15 Random Number Seed Map Storage Unit 16 Metadata Reverse Lookup Map Storage Unit 20 Client 30 Evaluation Target Storage System 31 Evaluation Target Storage 40 Meta Data 41 Physical address list 42 File random number seed 43 Reference count 50 Random number seed map 60 Metadata reverse lookup map 100 Storage system 110 Block data generation means 120 Metadata storage means 130 Block map storage means

Claims (10)

ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶するメタデータ記憶手段と、
前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶するブロックマップ記憶手段と、
前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成するブロックデータ生成手段と、
を備えた、
ストレージシステム。
Metadata storage means for storing, for each file, metadata including information on a physical address that specifies a storage area that is a reference destination of a block constituting the file;
Block map storage means for storing information for specifying a block seed that is a source for generating data of the block in the storage area specified by the physical address;
Block data generating means for specifying the block seed based on information for specifying the block seed stored in the storage area specified by the physical address, and generating block data from the block seed;
With
Storage system.
請求項1に記載のストレージシステムであって、
前記ブロックマップ記憶手段は、前記ブロックシードを特定する情報として、当該ブロックシードそのものを記憶する、
ストレージシステム。
The storage system according to claim 1,
The block map storage means stores the block seed itself as information for specifying the block seed.
Storage system.
請求項1に記載のストレージシステムであって、
前記ブロックマップ記憶手段は、前記ブロックシードを特定する情報として、当該ブロックシードの一部を形成する情報を記憶し、
前記ブロックデータ生成手段は、前記ブロックで形成されるボリュームについて設定された前記ブロックシードの他の一部を形成する情報と、前記ブロックシードを特定する情報である前記ブロックシードの一部を形成する情報と、からブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
ストレージシステム。
The storage system according to claim 1,
The block map storage means stores information forming a part of the block seed as information specifying the block seed,
The block data generation unit forms information forming another part of the block seed set for the volume formed by the block and a part of the block seed which is information for specifying the block seed. Block seed is identified from the information, and block data is generated from the block seed.
Storage system.
請求項1に記載のストレージシステムであって、
前記ブロックマップ記憶手段は、前記ブロックシードを特定する情報として、ブロックが含まれるファイルに対応する前記メタデータを特定するメタデータ識別子を記憶し、
前記メタデータ記憶手段は、前記メタデータに、少なくともファイル内においてブロック毎に異なる情報であるブロック識別情報と、ファイル毎に異なる情報であるファイルシードと、を記憶し、
前記ブロックデータ生成手段は、前記ブロックシードを特定する情報である前記メタデータ識別子からブロックが含まれるファイルに対応する前記メタデータを参照して、当該メタデータに記憶されている前記ブロック識別情報と前記ファイルシードとから前記ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
ストレージシステム。
The storage system according to claim 1,
The block map storage means stores, as information for specifying the block seed, a metadata identifier for specifying the metadata corresponding to a file including a block;
The metadata storage means stores, in the metadata, at least block identification information that is information different for each block in the file, and a file seed that is information different for each file,
The block data generation means refers to the metadata corresponding to the file containing the block from the metadata identifier that is information for specifying the block seed, and the block identification information stored in the metadata Identifying the block seed from the file seed and generating block data from the block seed;
Storage system.
請求項1に記載のストレージシステムであって、
前記ブロックマップ記憶手段は、前記ブロックシードを特定する情報として、ブロックが含まれるファイルに対応する前記メタデータを特定するメタデータ識別子と、少なくともファイル内においてブロック毎に異なる情報であるブロック識別情報と、を記憶し、
前記メタデータ記憶手段は、前記メタデータに、ファイル毎に異なる情報であるファイルシードを記憶し、
前記ブロックデータ生成手段は、前記ブロックシードを特定する情報である前記メタデータ識別子からブロックが含まれるファイルに対応する前記メタデータを参照して、当該メタデータに記憶されている前記ファイルシードと、前記ブロックシードを特定する情報である前記ブロック識別情報と、から前記ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
ストレージシステム。
The storage system according to claim 1,
The block map storage means includes, as information for specifying the block seed, a metadata identifier for specifying the metadata corresponding to a file including a block, and block identification information that is at least different information for each block in the file. Remember,
The metadata storage means stores, in the metadata, a file seed that is different information for each file,
The block data generation means refers to the metadata corresponding to a file including a block from the metadata identifier that is information for specifying the block seed, and the file seed stored in the metadata; Identifying the block seed from the block identification information, which is information identifying the block seed, and generating block data from the block seed,
Storage system.
請求項4又は5に記載のストレージシステムであって、
前記ブロック識別情報は、ブロックのファイル内における位置を表すオフセット情報の少なくとも一部にて形成された情報である、
ストレージシステム。
The storage system according to claim 4 or 5,
The block identification information is information formed by at least part of offset information indicating the position of the block in the file.
Storage system.
請求項1乃至5のいずれかに記載のストレージシステムであって、
前記メタデータ記憶手段に記憶された前記メタデータを参照して、ファイルを構成するブロックに対応する前記物理アドレスを特定し、当該物理アドレスを用いて前記ブロックデータ生成手段にて生成されたブロックのデータからファイルを生成することにより仮想的なファイルシステムを構築する仮想ファイルシステム構築部と、
前記物理アドレスを用いて前記ブロックデータ生成手段にて生成されたブロックのデータからボリュームを生成することにより仮想的なボリュームを構築する仮想ボリューム構築部と、
を備えたストレージシステム。
The storage system according to any one of claims 1 to 5,
With reference to the metadata stored in the metadata storage means, the physical address corresponding to the block constituting the file is specified, and the block data generated by the block data generation means is identified using the physical address. A virtual file system construction unit that constructs a virtual file system by generating a file from data;
A virtual volume construction unit that constructs a virtual volume by creating a volume from block data generated by the block data generation means using the physical address;
Storage system with
情報処理装置に、
ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶するメタデータ記憶手段と、
前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶するブロックマップ記憶手段と、
前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成するブロックデータ生成手段と、
を実現させるためのプログラム。
In the information processing device,
Metadata storage means for storing, for each file, metadata including information on a physical address that specifies a storage area that is a reference destination of a block constituting the file;
Block map storage means for storing information for specifying a block seed that is a source for generating data of the block in the storage area specified by the physical address;
Block data generating means for specifying the block seed based on information for specifying the block seed stored in the storage area specified by the physical address, and generating block data from the block seed;
A program to realize
情報処理装置が、ファイル毎に、当該ファイルを構成するブロックの参照先となる記憶領域を特定する物理アドレスの情報を含むメタデータを記憶すると共に、前記物理アドレスにて特定される記憶領域に、前記ブロックのデータを生成するための元となるブロックシードを特定する情報を記憶し、
前記情報処理装置が、前記物理アドレスにて特定される記憶領域に記憶されている前記ブロックシードを特定する情報に基づいて当該ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
情報処理方法。
The information processing apparatus stores, for each file, metadata including information on a physical address that specifies a storage area that is a reference destination of a block constituting the file, and a storage area specified by the physical address, Storing information identifying a block seed that is a source for generating the block data;
The information processing device identifies the block seed based on information identifying the block seed stored in the storage area identified by the physical address, and generates block data from the block seed.
Information processing method.
請求項9に記載の情報処理方法であって、
前記情報処理装置が、前記ブロックシードを特定する情報として、ブロックが含まれるファイルに対応する前記メタデータを特定するメタデータ識別子を記憶すると共に、前記メタデータに、少なくともファイル内においてブロック毎に異なる情報であるブロック識別情報と、ファイル毎に異なる情報であるファイルシードと、を記憶し、
前記情報処理装置が、前記ブロックシードを特定する情報である前記メタデータ識別子からブロックが含まれるファイルに対応する前記メタデータを参照して、当該メタデータに記憶されている前記ブロック識別情報と前記ファイルシードとから前記ブロックシードを特定し、当該ブロックシードからブロックのデータを生成する、
情報処理方法。
An information processing method according to claim 9,
The information processing apparatus stores, as information for specifying the block seed, a metadata identifier for specifying the metadata corresponding to the file including the block, and the metadata is different for each block at least in the file. Storing block identification information, which is information, and file seed, which is different information for each file,
The information processing apparatus refers to the metadata corresponding to a file including a block from the metadata identifier that is information for specifying the block seed, and the block identification information stored in the metadata and the metadata The block seed is identified from the file seed, and block data is generated from the block seed.
Information processing method.
JP2014050104A 2014-03-13 2014-03-13 Storage system Active JP6295742B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014050104A JP6295742B2 (en) 2014-03-13 2014-03-13 Storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014050104A JP6295742B2 (en) 2014-03-13 2014-03-13 Storage system

Publications (2)

Publication Number Publication Date
JP2015176205A JP2015176205A (en) 2015-10-05
JP6295742B2 true JP6295742B2 (en) 2018-03-20

Family

ID=54255396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014050104A Active JP6295742B2 (en) 2014-03-13 2014-03-13 Storage system

Country Status (1)

Country Link
JP (1) JP6295742B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4252102B2 (en) * 1993-06-21 2009-04-08 株式会社日立製作所 Computer system and secondary storage device
US7181641B2 (en) * 2003-09-24 2007-02-20 Hitachi Global Storage Technologies Netherlands, B.V. Data storage verification techniques for disk drivers
JP5664318B2 (en) * 2011-02-17 2015-02-04 日本電気株式会社 Virtual file system
JP5953808B2 (en) * 2012-02-23 2016-07-20 日本電気株式会社 Random number processing apparatus, random number processing method, and program

Also Published As

Publication number Publication date
JP2015176205A (en) 2015-10-05

Similar Documents

Publication Publication Date Title
US10402339B2 (en) Metadata management in a scale out storage system
CN103098035B (en) Storage system
JP6200886B2 (en) Logical sector mapping in flash storage arrays
JP6304406B2 (en) Storage apparatus, program, and information processing method
JP6240071B2 (en) Computer system and method for effectively managing mapping table in storage system
US9430164B1 (en) Memory efficient sanitization of a deduplicated storage system
JP5445682B2 (en) Storage system
JP6124902B2 (en) Variable length coding in storage systems
US7194579B2 (en) Sparse multi-component files
JP5695040B2 (en) File system
US20140297603A1 (en) Method and apparatus for deduplication of replicated file
CN106105161A (en) To cloud data storage device Backup Data while maintaining storage efficiency
US8825653B1 (en) Characterizing and modeling virtual synthetic backup workloads
CN109313538A (en) Inline duplicate removal
US10649682B1 (en) Focused sanitization process for deduplicated storage systems
JP6807395B2 (en) Distributed data deduplication in the processor grid
CN112612576B (en) Virtual machine backup method and device, electronic equipment and storage medium
CN105493080B (en) The method and apparatus of data de-duplication based on context-aware
CN104751076A (en) Method for recovering disk data
CN107798063B (en) Snapshot processing method and snapshot processing device
CN110187834B (en) Data processing method and device for duplicate copies and electronic equipment
CN104484402B (en) A kind of method and device of deleting duplicated data
US9594635B2 (en) Systems and methods for sequential resilvering
JP5664318B2 (en) Virtual file system
JP6295742B2 (en) Storage system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180205

R150 Certificate of patent or registration of utility model

Ref document number: 6295742

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150