WO2015162681A1

WO2015162681A1 - ストレージシステムおよび記憶デバイスの制御方法

Info

Publication number: WO2015162681A1
Application number: PCT/JP2014/061238
Authority: WO
Inventors: 義裕吉井; 和衛弘中; 山本　彰; 紀夫下薗
Original assignee: 株式会社日立製作所
Priority date: 2014-04-22
Filing date: 2014-04-22
Publication date: 2015-10-29
Also published as: US10222988B2; US20170123679A1

Abstract

　本発明は、効率を高めることができるようにしたストレージシステムを提供する。ストレージシステムは、記憶デバイス１０５から一回で読み出せるデータの最大サイズである第１サイズ１２０と、第１サイズ以下の第２サイズ１２２と、第１サイズの約数であって、第１サイズおよび第２サイズよりも小さい値に設定される第３サイズ１２１とを予め定義する。コントローラは、複数の仮想ページで構成される仮想ボリュームを提供し、仮想ボリュームへのライト要求を受けると、第１のサイズを有する複数のストライプで構成されるプール領域を仮想ページサイズで割り当て、ライト要求のデータをキャッシュに格納し、キャッシュに格納されるデータを記憶デバイスに書き込む場合に、データを第３サイズ単位で圧縮して圧縮データを生成し、記憶デバイスの有する記憶領域を第２サイズ単位で選択し、選択した第２サイズの記憶領域へ圧縮データを第２サイズの記憶領域の空き領域の先頭アドレスから順に間を空けずに書き込む。

Description

ストレージシステムおよび記憶デバイスの制御方法

　本発明は、ストレージシステムおよび記憶デバイスの制御方法に関する。

　ストレージのビットコストを削減するため、データ量を削減する技術へのニーズが高くなっている。データ量を削減する技術としては、データ圧縮技術が知られている。一方、データの格納に使用する容量を削減する技術として、容量仮想化技術が知られている。容量の仮想化技術とは、ストレージシステムが利用可能な物理的記憶容量よりも大きな仮想的容量を、ストレージシステムの外側に在るホスト装置などに見せる技術である。

　特許文献１では、データ圧縮技術と容量仮想化技術を用いて、圧縮後のデータサイズに応じて、プール内の格納先領域を動的に、その圧縮後のデータに割当てる。これにより、特許文献１では、記憶容量の使用効率を高めることができる。さらに、特許文献１では、ユーザは、圧縮後のデータサイズに合致するサイズのボリュームを準備する必要がないため、使い勝手も向上する。

米国特許出願公開第２００９／０１４４４９６号明細書

　一般に、データを圧縮伸張する単位とストレージコントローラの処理負荷とは、トレードオフの関係にある。圧縮伸張の単位を小さくする場合を検討する。この場合、ホストから小サイズのデータ読出しを要求される場合には、要求されたデータだけを伸張すればよく、要求されていないデータは伸張する必要がないため、データの読出し性能は向上する。

　しかし、一般に圧縮伸張の単位は、ストレージコントローラが圧縮伸張回路に圧縮伸張の指示を出す単位や、ホストがアクセスする論理アドレスと最終記憶媒体の物理アドレスとの対応付けを行う単位にもなる。従って、圧縮伸張単位を小さくすると、大きいサイズのデータを読み出す場合、圧縮伸張回路に圧縮伸張を指示する回数と最終記憶媒体の物理アドレスとの対応付けを行う回数とが増えるため、ストレージコントローラの負荷が増大する。さらに、ハードディスクなどの最終記憶媒体に対するデータの読み出し回数も増えるため、最終記憶媒体の負荷も増加する。

　一方で、圧縮伸張単位を大きくすれば、読み出しサイズが大きい場合にストレージコントローラの負荷は減少する。しかし、圧縮伸張単位よりも小さいサイズのデータを読み出す場合であっても、圧縮伸張単位でデータを読み出す必要がある。このため、ストレージコントローラは、圧縮伸張単位の全データを読み出して伸張し、その中から小サイズのデータを取り出すことになる。従って、圧縮伸張単位を大きくすると、小サイズのデータの読み出し性能が低下する。

　このように、圧縮伸張単位とストレージコントローラの処理負荷とはトレードオフの関係に立つが、特許文献１では圧縮伸張単位を固定しており、上述のトレードオフについて考慮していない。

　本発明は、上記の問題に鑑みてなされたもので、その目的は、効率を高めることができるようにしたストレージシステムおよび記憶デバイスの制御方法を提供することにある。本発明の他の目的は、小さいサイズでデータを読み書きする場合の性能と、大きいサイズでデータを読み出す場合の性能とを両立できるようにしたストレージシステムおよび記憶デバイスの制御方法を提供することにある。

　本発明の一つの観点では、少なくとも一つの記憶デバイスと、記憶デバイスを制御するコントローラと、キャッシュとを有するストレージシステムであって、記憶デバイスから一回で読み出せるデータの最大サイズである第１サイズと、第１サイズ以下の第２サイズと、第１サイズの約数であって、第１サイズおよび第２サイズよりも小さい値に設定される第３サイズとが予め定義されており、コントローラは、複数の仮想ページで構成される仮想ボリュームを提供し、仮想ボリュームへのライト要求を受けると、第１のサイズを有する複数のストライプで構成されるプール領域を仮想ページサイズで割り当て、ライト要求のデータをキャッシュに格納し、キャッシュに格納されるデータを記憶デバイスに書き込む場合に、データを第３サイズ単位で圧縮して圧縮データを生成し、記憶デバイスの有する記憶領域を第２サイズ単位で選択し、選択した第２サイズの記憶領域へ圧縮データを第２サイズの記憶領域の空き領域の先頭アドレスから順に間を空けずに書き込む。

　本発明によれば、所定の第３サイズを圧縮伸張単位とし、第２サイズの記憶領域内に第２サイズの記憶領域の先頭アドレスから順に間を空けずに圧縮データを書き込むため、第２サイズの記憶領域におけるオフセットを管理するだけで圧縮データの所在を把握できる。従って、管理効率を高めることができる。

図１は、ストレージシステムの構成を示す。図２は、仮想ボリューム、プール、仮想ページ、実ページ、ストライプ、サブストライプ、物理チャンクなどの関係を示す説明図である。図３は、キャッシュメモリの記憶内容を示すブロック図である。図４は、記憶デバイスの一例としてのハードディスクドライブの記憶内容を示すブロック図である。図５は、仮想ボリュームを管理するテーブルの構成例を示す。図６は、ストレージプールを管理するテーブルの構成例を示す。図７は、ＲＡＩＤ（Redundant Arrays of Inexpensive Disks）グループを管理するテーブルの構成例を示す。図８は、ＰＤＥＶ（Physical Device）としてのハードディスクドライブを管理するテーブルの構成例を示す。図９は、仮想ページを管理するテーブルの構成例を示す。図１０は、実ページを管理するテーブルの構成例を示す。図１１は、空き実ページ（フリーの実ページ）を管理するテーブルの構成例を示す。図１２は、ストライプを管理するテーブルの構成例を示す。図１３は、物理チャンクを管理するテーブルの構成例を示す。図１４は、空き物理チャンク（フリーの物理チャンク）を管理するテーブルの構成例を示す。図１５は、ライト処理のフローチャートを示す。図１６は、デステージ処理のフローチャートを示す。図１７は、圧縮データをデステージする処理のフローチャートを示す。図１８は、物理チャンクを割り当てる処理のフローチャートを示す。図１９は、リード処理のフローチャートを示す。図２０は、キャッシュへデータをステージングする処理のフローチャートを示す。図２１は、圧縮データをキャッシュへステージングする処理のフローチャートを示す。

　以下、図面を参照しながら本発明の実施の形態を説明する。なお、以下の説明では、「管理テーブル」等の表現にて各種情報を説明することがあるが、各種情報は、テーブル以外のデータ構造で表現されていてもよい。また、データ構造に依存しないことを示すために「管理テーブル」を「管理情報」と呼ぶことができる。「記憶デバイス」の一例としてハードディスクドライブを挙げて説明するが、本実施形態の少なくとも一部はフラッシュメモリデバイスにも適用することができる。

　また、「プログラム」を主語として処理を説明する場合がある。そのプログラムは、プロセッサ、例えば、ＣＰＵ（Central Processing Unit）によって実行されるもので、定められた処理をするものである。なお、適宜に記憶資源（例えばメモリ）及び通信インタフェース装置（例えば、通信ポート）を用いながら行うため、処理の主語がプロセッサとされてもよい。プロセッサは、ＣＰＵの他に専用ハードウェアを有していても良い。コンピュータプログラムは、プログラムソースから各コンピュータにインストールされても良い。プログラムソースは、例えば、プログラム配布ホストコンピュータ又は記憶メディアなどで提供されるものであっても良い。

　また、各要素は番号などで識別可能であるが、識別可能な情報であれば、名前など他種の識別情報が用いられても良い。本発明の図及び説明において同一部分には同一符号を付与しているが、本発明が本実施例に制限されることは無く、本発明の思想に合致するあらゆる応用例が本発明の技術的範囲に含まれる。また、特に限定しない限り、各構成要素は複数でも単数でも構わない。

　本実施形態では、小さいサイズのデータを読み出す場合に、目的のデータ以外の不要なデータまで伸張してしまうのを抑制し、さらに、大きいサイズのデータを読み出す場合に、コントローラ及びハードディスクドライブの負荷を低減する。

　詳細は後述するが、本実施形態では、論理アドレス領域を、ＲＡＩＤグループを構成するストライプで分割する。ストライプサイズは「第１サイズ」に該当する。ハードディスクの有する物理的記憶領域は、ストライプよりも小さいチャンク（物理チャンク）という単位で分割して管理する。物理チャンクサイズは「第２サイズ」に該当する。ストレージシステムのコントローラは、ストライプに対してデータを圧縮し、圧縮後のデータサイズに応じて必要なだけチャンクを割り当てる。

　コントローラは、ストライプサイズに満たないサイズのデータに対する読み出し要求および書込み要求に対応すべく、ストライプサイズよりもさらに小さいサブストライプサイズ単位で、データの圧縮および伸張を行う。サブストライプサイズは「第３サイズ」に該当する。ストライプはサブストライプ単位で分割されており、サブストライプサイズの領域が圧縮および伸張の単位となっている。

　大きいサイズのデータを読み出すときは、チャンク単位でデータを読み出し、サブストライプ単位で伸張し、キャッシュメモリ上でデータを論理アドレス順に並び替える。大きいサイズのシーケンシャルリード要求をチャンク単位で処理できるため、コントローラの処理負荷を軽減できると共に、ハードディスクへのアクセス回数を削減してハードディスクの負荷を低減することができる。コントローラが圧縮データをシーケンシャルに読み出す場合に、ハードディスクドライブのスループット性能を向上できる。

　さらに、小サイズのデータは、サブストライプ単位でデータを読み書きする。これにより、目的のデータのみを圧縮または伸張すればよく、不要なデータの圧縮または伸張を行う必要がない。従って、処理性能が向上する。

　図１は、ストレージシステム１の全体構成を示すブロック図である。ストレージシステム１は、例えば、コントローラ１０と、ドライブエンクロージャ２０とを備える。ストレージシステム１は、通信ネットワークＮを介して、ホスト計算機２とデータブロックを送受信する。コントローラ１０は、１つであっても良いし、２つ以上であっても良い。ドライブエンクロージャ２０は、１つであっても良いし、２つ以上であっても良い。以下、ホスト計算機２をホスト２と略記する場合がある。

　コントローラ１０は、例えば、ホストＩ／Ｆ（Interface）１１と、ＣＰＵ（Central Processing Unit）１２と、キャッシュメモリ１３（以下、ＣＭと略記する場合がある）と、ドライブＩ／Ｆ１４と、を有する。これらの要素１１～１４は、何れも２つ以上であっても良い。これらの要素１１～１４は、双方向のデータ伝送が可能な内部バス１５によって接続されている。

　通信ネットワークＮは、例えば、ＳＡＮ（Storage Area Network）によって構成することができる。ＳＡＮは、例えば、Ｆｉｂｒｅ　Ｃｈａｎｎｅｌ、Ｅｔｈｅｒｎｅｔ（登録商標）、および／または、Ｉｎｆｉｎｉｂａｎｄ等によって構成することができる。通信ネットワークＮは、ＬＡＮ、インターネット網、専用線網、またはそれらの組み合わせであっても良い。

　ホストＩ／Ｆ１１は、通信ネットワークＮとコントローラ１０とを接続するためのＩ／Ｆである。ホストＩ／Ｆ１１は、例えば、「上位通信部」、「第１通信部」、「上位装置用インターフェース部」等と呼ぶこともできる。ホストＩ／Ｆ１１は、通信ネットワークＮと内部バス１５との間に介在しており、データブロックの送受信を制御する。

　ホストＩ／Ｆ１１は、ホスト２からＩ／Ｏ（Input/Output）要求を受信する。Ｉ／Ｏ要求には、Ｉ／Ｏ先を示す情報（アクセス先情報）と、Ｉ／Ｏコマンドとが関連付けられている。Ｉ／Ｏ先情報は、Ｉ／Ｏ先の論理ボリュームを識別する情報と、その論理ボリュームにおけるＩ／Ｏ先領域を特定するアドレス情報とを含む。Ｉ／Ｏ先の論理ボリュームの識別情報としては、例えば、ＬＵＮ（Logical Unit Number）がある。論理ボリュームにおけるＩ／Ｏ先領域を特定するアドレス情報としては、例えばＬＢＡ（Logical Block Address）がある。Ｉ／Ｏコマンドは、ライトコマンドまたはリードコマンドである。

　ＣＰＵ１２は、所定のコンピュータプログラム（以下「プログラム」という）を実行することで、様々な機能Ｆ１、Ｆ２、Ｆ３を実現する。プログラムは、コントローラ１０内の不揮発性メモリ領域（不図示）に格納されても良いし、コントローラ外のＨＤＤ（Hard Disk Drive）２１等に格納されても良い。ストレージ構成管理部Ｆ１は、例えば、ＲＡＩＤグループの構成、プール構成、仮想ボリューム構成などのストレージの各種構成を管理する機能である。コマンド制御部Ｆ２は、ホスト２から受領したリードコマンドやライトコマンドなどを処理し、その結果をホスト２に返す機能である。圧縮／伸張部Ｆ３は、所定のアルゴリズムに従ってデータを圧縮したり、圧縮データを伸張したりする機能である。なお、以下の説明では、圧縮部Ｆ３と呼ぶ場合がある。圧縮／伸張部Ｆ３は、たとえばＬＺ７７などのような可逆データ圧縮アルゴリズムを備えている。

　ＣＰＵ１２は、ホスト２からＩ／Ｏコマンドを受領すると、Ｉ／Ｏコマンドに関連付けられているＩ／Ｏ先情報を抽出し、Ｉ／Ｏ先情報からＩ／Ｏ先領域を特定する。ＣＰＵ１２は、特定したＩ／Ｏ先領域に対応する１以上の論理ページをそれぞれ提供する１以上のＨＤＤ２１を特定する。そして、ＣＰＵ１２は、特定した各ＨＤＤ２１に対し、論理ページのアドレスが関連付けられたＩ／Ｏコマンドを送信する。各ＨＤＤ２１に送られるＩ／Ｏコマンドには、論理ページのアドレスの他に、そのＩ／Ｏコマンドの送信先ＨＤＤ２１を特定するための識別情報（例えばドライブ番号）が関連付けられてよい。

　ＣＭ１３は、データブロックを一時的に保持する。以下、データブロックをデータと略記する場合がある。ＣＭ１３は、不揮発性メモリによって構成されても良い。不揮発性メモリは、フラッシュメモリ、または磁気ディスクメモリ等であっても良い。若しくは、ＣＭ１３は、揮発性メモリにバックアップ電源を備える構成であっても良い。揮発性メモリは、ＤＲＡＭ（Dynamic Random Access Memory）等であっても良い。バックアップ電源は、例えば、リチウムイオン二次電池などのバッテリであっても良い。ホストＩ／Ｆ１１、ＣＰＵ１２、および／または、ドライブＩ／Ｆ１４は、内部バス１５を介して、ＣＭ１３にデータブロックを入出力してもよい。

　ドライブＩ／Ｆ１４は、コントローラ１０とドライブエンクロージャ２０とを接続するためのＩ／Ｆである。ドライブＩ／Ｆ１４は、例えば、「下位通信部」、「第２通信部」、「記憶デバイス用インターフェース部」等と呼ぶこともできる。

　ドライブＩ／Ｆ１４は、内部バス１５とＨＤＤ２１との間に介在しており、データブロックの送受信を制御する。ドライブＩ／Ｆ１４は、ＳＡＳまたはＦｉｂｒｅ　Ｃｈａｎｎｅｌ等に対応するＩ／Ｆであっても良い。ドライブＩ／Ｆ１４は、ＨＤＤ２１から受信したデータブロックをＣＭ１３に送信しても良い。

　ドライブエンクロージャ２０は、複数の記憶デバイスを有する。図１では、記憶デバイスとして、ＨＤＤ２１（＃０、＃１、＃２、＃３）を示す。以下、各ＨＤＤ２１（＃０、＃１、＃２、＃３）を区別しない場合は、単に「ＨＤＤ２１」という。ドライブエンクロージャ２０の有するＨＤＤ２１の数は、幾つであっても良い。ドライブエンクロージャ２０には、ＨＤＤ２１に代えてまたはＨＤＤ２１と共に、ＳＳＤ（Solid State Drive）等の他の不揮発性メモリが接続されても良い。また、ドライブＩ／Ｆ１４とＨＤＤ２１は、ＳＡＳ（Serial Attached SCSI）、ＦＣ（Fibre Channel）、またはＳＡＴＡ（Serial AT Attachment）によって接続されても良い。

　ドライブエンクロージャ２０のＨＤＤ２１は、そのＨＤＤ２１が提供する論理ページのアドレスが指定されたＩ／Ｏコマンド（ライトコマンドまたはリードコマンド）をコントローラ１０から受信すると、そのＩ／Ｏコマンドに応じた処理を実行する。

　以下では、ＨＤＤ２１のことを、Ｐｈｙｓｉｃａｌ　Ｄｅｖｉｃｅ（ＰＤＥＶ）と呼ぶことがある。また、本実施形態では、データ圧縮によってＰＤＥＶの物理容量以上のデータを格納可能である。すなわち、物理的な容量をそのまま提供するＰＤＥＶと、データ圧縮によって物理容量以上のデータを格納可能な仮想的なＰＤＥＶの二種類が存在する。以下、物理的な容量をそのまま提供するＰＤＥＶを実ＰＤＥＶ１０５と呼び、物理容量以上のデータを格納可能な仮想的なＰＤＥＶを仮想ＰＤＥＶ１０４と呼ぶことにする。

　ストレージシステム１は、２つ以上のドライブエンクロージャ２０を有しても良い。この場合、ドライブＩ／Ｆ１４が複数のポートを有しており、１つのドライブエンクロージャ２０が、ドライブＩ／Ｆ１４の１つのポートに接続されても良い。または、２つ以上のドライブエンクロージャ２０と、１つのドライブＩ／Ｆ１４とが、所定のスイッチ装置（不図示）を介して接続されても良い。または、２つ以上のドライブエンクロージャ２０が、カスケード接続されても良い。

　図２は、仮想ボリューム１０１、ストレージプール１０２、ＲＡＩＤグループ１０３、仮想ＰＤＥＶ１０４、実ＰＤＥＶ１０５、仮想ページ１１０、実ページ１１１、ストライプ１２０、サブストライプ１２１、物理チャンク１２２の関係を示す。本構成により、コントローラ１０は、容量仮想化機能を提供する。なお、ＲＡＩＤグループをパリティグループとも呼ぶ。

　ホスト２に提供される仮想ボリューム１０１は、複数の仮想ページ１１０に分割されている。１以上のＲＡＩＤグループ１０３から構成される記憶領域は、複数の実ページ１１１に分割されている。複数の実ページ１１１の集合をストレージプール１０２と呼ぶ。容量仮想化においては、仮想ボリューム１０１の記憶容量を、実際の容量よりも大きく見せることができる。このため、一般に仮想ページ１１０の数は、実ページ１１１の数よりも多い。

　コントローラ１０は、ホスト２からライト要求されたライト先アドレスに属する仮想ページ１１０に対して、空いている実ページ１１１をストレージプール１０２から割り当て、その実ページ１１１にライトデータを書き込む。ライト処理の詳細は後述する。

　実ページ１１１は、ストライプ１２０と呼ぶ記憶領域の集合である。ストライプ１２０とは、ＲＡＩＤを構成する際に、各ＰＤＥＶに割り当てる最小の連続領域のことを指している。ストライプサイズは「第１サイズ」に該当し、ＰＤＥＶ１０５（ＨＤＤ２１）から一回で読み出すことのできるデータの最大サイズである。

　上述の通り、実ＰＤＥＶ１０５はＨＤＤ２１に対応し、物理的な容量を管理する。実ＰＤＥＶ１０５には、圧縮後のデータが格納される。圧縮後のデータを圧縮データと呼ぶことがある。実ＰＤＥＶ１０５の有する物理的記憶領域は、物理チャンク１２２と呼ぶ単位で分割管理されている。物理チャンク１２２のサイズを、チャンクサイズまたは物理チャンクサイズと呼ぶ場合がある。

　チャンクサイズは「第２サイズ」に該当し、前記ストライプと同じかそれ以下のサイズを有する。例えばストライプサイズと予め設定される所定のデータ圧縮率とから決定することができる。所定のデータ圧縮率とは、本実施形態では、最大圧縮率である。例えば、ストライプサイズが５１２ＫＢ、最大圧縮率が１／８と設定されている場合、チャンクサイズは６４ＫＢ（＝５１２＊１／８）である。チャンクサイズはあらかじめ設定されていても良いし、適切な管理インタフェースによって、ストレージ管理者によって変更されても良い。また、圧縮後のデータ長に応じて可変長にしても良い。たとえば、６４ＫＢ、１２８ＫＢ、２５６ＫＢ、５１２ＫＢなどの複数のチャンクサイズを用意し、ストライプ５１２ＫＢを圧縮した結果によって、適切なサイズの物理チャンクを割り当てても良い。このように、あらかじめ複数のサイズのチャンクを用意しておくことで、複数の物理チャンクを割り当てる処理にかかるオーバヘッドを削減することができる。

　仮想ＰＤＥＶ１０４は、圧縮によって、物理的な容量以上のデータを格納するための記憶空間である。仮想ＰＤＥＶ１０４は、圧縮していないデータ（非圧縮データ）を管理している。仮想ＰＤＥＶ１０４の有する記憶領域は、ストライプ１２０ごとに分割して管理されている。各ストライプ１２０は、さらに細かいサブストライプ１２１と呼ぶ記憶領域ごとに分割して管理されている。

　サブストライプ１２１のサイズは「第３サイズ」に該当し、ストライプサイズの約分であって、かつ、ストライプサイズおよびチャンクサイズのいずれよりも小さい値に設定されている。サブストライプ１２１のサイズは、仮想ボリューム１０１を使用するホスト２の典型的なＩ／Ｏサイズを考慮して設定してもよい。例えば、ホスト２に搭載されたデータベース（不図示）が４ＫＢ単位で仮想ボリューム１０１にアクセスする場合、サブストライプ１２１のサイズを４ＫＢに設定することができる。「４」は、ストライプサイズである５１２ＫＢの約分であり、かつ、ストライプサイズ（５１２ＫＢ）およびチャンクサイズ（６４ＫＢ）のいずれよりも小さい。なお、サブストライプサイズ「４」は、チャンクサイズを割り切ることができると共に、ストライプサイズも割り切ることができる。つまり、サブストライプサイズは、ストライプサイズおよびチャンクサイズの公約数のうち、仮想ボリューム１０１を使用するホスト２のＩ／Ｏサイズに基づいて選択される値である、と定義してもよい。　

　ホスト２が２ＫＢ単位で仮想ボリューム１０１にアクセスすることが多い場合は、サブストライプ１２１のサイズを２ＫＢに設定してもよい。以上のストライプサイズ、サブストライプサイズ、チャンクサイズは、本実施形態を理解するための例示であり、本発明の範囲をそれらの数値に限定する意図はない。

　上述の通り、一般的には、仮想ＰＤＥＶ１０４の容量は、実ＰＤＥＶ１０５の容量よりも大きい値に定義する。或る１つのストライプ１２０に対して、圧縮後のデータサイズに応じて必要なだけの物理チャンク１２２を割り当てる。

　仮想ＰＤＥＶ１０４のストライプ１２０に対する物理チャンク１２２の割り当ては、後述するように、ストライプ管理テーブル２４の中の物理チャンクマッピングテーブル２４１０によって管理される。上述の通り、物理チャンクサイズは、ストライプサイズよりも小さく、１つのストライプ１２０に対して複数の物理チャンク１２２を割り当てることが可能である。ストレージシステム１は、上述の容量仮想化機能により、圧縮後のデータサイズに応じた物理容量だけを消費できるため、容量効率が向上する。

　物理チャンク１２２における圧縮データの書込み位置は、後述するように、ストライプ管理テーブル２４のサブストライプマッピングテーブル２４２０により管理される。サブストライプ１２１のデータは、圧縮されると、物理チャンク１２２内にいわゆる前詰めで格納される。前詰めで格納するとは、ホスト１０２が仮想ボリューム１０１に書き込んだ順番で、圧縮データを間をあけずに物理チャンク１２２に書き込むことである。

　なお、仮想ボリューム１０１とストレージプール１０２との対応関係は、後述する仮想ボリューム管理テーブル３１の仮想ボリューム番号３１１およびプール番号３１４から知ることができる。ストレージプール１０２とＲＡＩＤグループ１０３との対応関係は、後述するストレージプール管理テーブル３２のストレージプール番号３２１およびＲＡＩＤグループリスト３２２から知ることができる。

　非圧縮データを記憶する仮想ＰＤＥＶ１０４と圧縮データを記憶する実ＰＤＥＶ１０５との対応関係は、後述するＰＤＥＶ管理テーブル３４の仮想ＰＤＥＶ番号３４１および実ＰＤＥＶ番号３４２から知ることができる。

　図３は、ＣＭ１３の記憶領域の論理的構成を示す。ＣＭ１３は、その記憶領域の論理的な構成として、例えば、仮想ボリューム管理テーブル３１と、ストレージプール管理テーブル３２と、ＲＡＩＤグループ管理テーブル３３と、ＰＤＥＶ管理テーブル３４と、仮想ページ管理テーブル３５と実ページ管理テーブル３６と、空き実ページ管理テーブル３７と、キャッシュメモリ領域３８と、バッファ領域３９とを有する。各テーブルの詳細は後で図を用いて説明する。

　キャッシュメモリ領域３８は、ホスト２から書き込まれたデータや、ＨＤＤ２１（ＰＤＥＶ）から読み出したデータを一時的に記憶するために利用される。例えば、コントローラ１０は、ライトコマンドおよびライトすべきデータブロック（以下「ライトデータ）をホスト２から受信すると、そのライト用データブロックをキャッシュメモリ領域３８に格納し、ホスト２に対して完了応答を返す。

　つまり、コントローラ１０は、ライトデータをＨＤＤ２１に格納する前に、ホスト２に対して完了応答を返す。一般的にライト性能（ライト速度）は、ＨＤＤ２１よりもキャッシュメモリ領域３８の方が高いので（高速なので）、キャッシュメモリ領域３８にライトデータを書き込んだ時点でホスト２へ完了応答を返すことにより、ストレージシステム１のホスト２に対する応答性能を高めることができる。

　バッファ領域３９は、圧縮データを伸張する場合、もしくは非圧縮データを圧縮する場合の、一時記憶領域として使用される。

　図４は、ＨＤＤ２１の記憶領域の論理的な構成を示すブロック図である。ＨＤＤ２１は、その記憶領域の論理的な構成として、例えば、メタデータ領域（制御情報領域）２２と、データ領域２３とを有する。

　データ領域２３は、コントローラ１０からライトされたデータブロックを格納する。制御情報領域２２には、データ領域２３を制御するための情報が格納される。メタデータ領域２２は、制御情報を記憶する領域であり、例えば、ストライプ管理テーブル２４と、物理チャンク管理テーブル２５と、空き物理チャンク管理テーブル２６とを有する。各テーブル２４～２６の詳細は後述する。これらのテーブル２４～２６の全部または必要な一部を、ＣＭ１３にキャッシュさせることにより、コントローラ１０がテーブル内の情報に高速にアクセスできるようにしてもよい。なお、テーブル２４～２６は、ＨＤＤ２１に代えて、コントローラ１０内のメモリ（例えばＣＭ１３）に格納してもよい。

　図５は、仮想ボリュームを管理するテーブル３１のデータ構成例を示す。仮想ボリューム管理テーブル３１は、仮想ボリューム１０１に関する情報を有する。

　仮想ボリューム管理テーブル３１は、項目として、例えば、ボリューム番号３１１と、ボリューム容量３１２と、割当済み容量３１３と、プール番号３１４と、ボリューム属性３１５とを有する。なお、図中では、「番号」を＃として示す。

　ボリューム番号３１１は、コントローラ１０が提供する各仮想ボリューム１０１を識別するための識別子（ＩＤ）である。コントローラ１０は、複数の仮想ボリューム１０１を作成し、一つまたは複数のホスト２に使用させることができる。

　ボリューム容量３１２は、仮想ボリューム１０１のボリュームサイズである。割当済み容量３１３は、仮想ボリューム１０１に割当済みの容量、すなわち仮想ボリューム１０１に割り当てられている実ページ１１１の合計サイズである。

　プール番号３１４は、仮想ボリューム１０１に関連付けられたストレージプール１０２を識別するＩＤである。プール番号３１４は、図６に示すストレージプール番号３２１に対応する。仮想ボリューム１０１に割り当てる実ページ１１１は、プール番号３１４に含まれる各ＲＡＩＤグループ１０３の有する実ページ１１１の中から選択される。

　ボリューム属性３１５は、仮想ボリューム１０１の性能特性や容量特性を表す情報を格納する。例えば、ボリューム属性３１５には、仮想ボリューム１０１の全体が圧縮されているかどうかを表す情報を格納することができる。ボリューム属性３１５には、仮想ボリューム１０１のデータの処理状態を示す情報を格納してもよい。データの処理状態を示す情報には、データを圧縮中である、もしくはデータを伸張中である、という情報を含めることができる。

　ストレージ管理者は、適切な管理インターフェースを用いることで、ボリューム属性３１５の値を適宜変更することができる。例えば、ストレージ管理者は、仮想ボリューム１０１の状態を「圧縮」と「非圧縮」の間で切り替えることができる。仮想ボリューム１０１が「非圧縮」から「圧縮」に切り替わった場合、仮想ボリューム１０１に格納されている全データを圧縮して格納しなおす処理が実行される。逆に、仮想ボリューム１０１が「圧縮」から「非圧縮」に切り替わった場合、仮想ボリューム１０１に格納されているデータ全体を伸張して格納しなおす処理が実行される。

　一般的に、仮想ボリューム１０１のボリューム属性を「圧縮」にすると、仮想ボリューム１０１へデータをリードまたはライトするたびに、そのデータを伸張または圧縮する処理が発生する。従って、仮想ボリューム１０１のスループット性能が低下する。

　そのため、頻繁にリード要求やライト要求が発生するデータは圧縮対象にならないように設計することが望まれる。ストレージ管理者は、例えば、ある仮想ボリュームにはバックアップデータしか格納されておらず、ほとんどアクセスが発生しないということがわかっている場合に、その仮想ボリュームを圧縮属性にするという性能設計を行う。

　図６は、ストレージプール１０２を管理するテーブル３２のデータ構成例を示す。ストレージプール管理テーブル３２は、ストレージプール１０２に関する情報を有する。ストレージプール管理テーブル３２は、項目として、ストレージプール番号３２１、ＲＡＩＤグループリスト３２２、プール属性３２３、空き仮想ページ数３２４を有する。

　ストレージプール番号３２１は、コントローラ１０の管理下にある各ストレージプール１０２を識別するＩＤである。ＲＡＩＤグループリスト３２２は、ストレージプール１０２を構成している１または複数のＲＡＩＤグループ１０３の番号を保持する。

　プール属性３２３は、ストレージプール１０２の性能特性や容量特性を表す情報を格納する。例えば、ストレージプール１０２に関連付けられているＲＡＩＤグループ１０３を構成している物理的記憶デバイスの種別を示す情報が格納されていても良い。記憶デバイスの種別としては、例えば、ＨＤＤ２１、もしくはＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）がある。

　プール属性３２３には、ストレージプール１０２の全体が圧縮されているかどうかを表す情報を格納してもよい。ストレージプール１０２の全体が圧縮されている場合、そのストレージプール１０２に関連付けられている各仮想ボリューム１０１のボリューム属性は全て「圧縮」になる。ストレージ管理者は、適切な管理インタフェースによって、ストレージプール１０２の属性を「圧縮」と「非圧縮」の間で切り替えることができる。

　ストレージプール１０２の属性を「圧縮」にすると、そのストレージプール１０２に関連する仮想ボリューム１０１へデータをリードまたはライトするたびに、データを伸張または圧縮する処理が発生するため、スループット性能が低下する。そのため、ストレージ管理者は、性能低下を許容できるかどうかという指標に基づいて、ストレージプール１０２の属性を設定する。

　図７は、ＲＡＩＤグループ１０３を管理するテーブル３３のデータ構成例を示す。ＲＡＩＤグループ管理テーブル３３は、ＲＡＩＤグループ１０３に関する情報を有する。ＲＡＩＤグループ管理テーブル３３は、項目として、ＲＡＩＤグループ番号３３１と、ＲＡＩＤレベル３３２と、ＰＤＥＶ番号３３３とを有する。

　ＲＡＩＤグループ番号３３１は、コントローラ１０の管理するＲＡＩＤグループ１０３を識別するＩＤである。ＲＡＩＤレベル３３２は、ＲＡＩＤグループ１０３のＲＡＩＤレベルを表す情報である。ＲＡＩＤレベル“１０”とは、ＲＡＩＤ（１＋０）の構成であることを示す。ＲＡＩＤレベル“５”とは、ＲＡＩＤ５構成であることを示す。ＰＤＥＶ番号３３３は、ＲＡＩＤグループ１０３を構成している仮想ＰＤＥＶ１０４の識別子（ＩＤ）を格納している。こＰＤＥＶ番号３３３には、複数のＰＤＥＶ番号が格納される。ＰＤＥＶ番号３３３に格納されているＰＤＥＶ番号は、ＰＤＥＶ管理テーブル３４の仮想ＰＤＥＶ番号３４１と対応している。

　図８は、仮想ＰＤＥＶ１０４および実ＰＤＥＶ１０５を管理するテーブル３４のデータ構成例を示す。ＰＤＥＶ管理テーブル３４は、仮想ＰＤＥＶ１０４と実ＰＤＥＶ番号１０５との対応関係を管理する。

　ＰＤＥＶ管理テーブル３４は、項目として、仮想ＰＤＥＶ番号３４１と、実ＰＤＥＶ番号３４２と、物理容量３４３番号と、論理使用容量３４４と、物理使用容量３４５とを有する。

　仮想ＰＤＥＶ番号３４１は、コントローラ１０の管理下にある各仮想ＰＤＥＶ１０４を識別するＩＤである。実ＰＤＥＶ番号３４２は、コントローラ１０の管理下にある各実ＰＤＥＶ１０５を識別するＩＤである。図８では、仮想ＰＤＥＶ番号と実ＰＤＥＶ番号とが一致しているが、異なっていてもよい。

　物理容量３４３は、実ＰＤＥＶ１０５に対応するＨＤＤ２１に格納可能なデータの最大サイズを表している。論理使用量３４４は、実ＰＤＥＶ１０５に格納されている圧縮データを非圧縮データに換算した場合のデータ量を表す。物理使用量３４５は、実ＰＤＥＶ１０５に実際に格納されているデータサイズを表す。物理使用量３４５は、圧縮後のデータサイズに相当する。

　図９は、仮想ページ１１０を管理するテーブル３５のデータ構成例を示す。仮想ページ管理テーブル３５は、例えば、仮想ボリューム１０１と、仮想ページ１１０と、実ページ１１１との対応関係を示す。仮想ページ管理テーブル３５は、項目として、仮想ボリューム番号３５１と、実ページポインタ３５２と、ページ属性３５３と、統計情報３５４とを有する。

　仮想ページ管理テーブル３５は、仮想ボリューム１０１をページ単位で分割した領域の１つずつに対応している。よって、仮想ページ管理テーブル３５は、仮想ボリューム１０１を構成する仮想ページ１１０の数だけ存在する。仮想ボリューム番号３５１は、仮想ボリューム１０１を識別するＩＤである。実ページポインタ３５２は、実ページ管理テーブル３６との対応関係を示すためのポインタである。Ｎｕｌｌと入っている場合には、実ページが割り当てられていないことを示す。ページ属性３５３は、仮想ページ１１０の属性を表す。ページ属性としては、仮想ページ１１０が圧縮されていることを示す「圧縮」、非圧縮であることを示す「非圧縮」がある。

　ストレージ管理者は、適切な管理インターフェースを用いることで、ページ属性３５３の値を変更することができる。しかし一般に、管理者が、仮想ページ単位でページ属性を指定するのは煩雑である。

　そこで、前述のとおり、仮想ボリューム単位やストレージプール単位で、圧縮するか否かを指定できるようにしてもよい。ストレージ管理者が、仮想ボリューム１０１のボリューム属性３１５を圧縮から非圧縮、もしくは非圧縮から圧縮に切り替えた場合、その仮想ボリューム１０１に関連付けられている全ての仮想ページ１１０のページ属性３５３も自動的に変更すればよい。このようにして、仮想ボリューム１０１の属性の変更が仮想ページ１１０の属性に反映されてもよい。

　ストレージ管理者が、ストレージプール１０２のプール属性３２３を圧縮から非圧縮に、もしくは非圧縮から圧縮に、切り替えた場合、そのストレージプール１０２に関連付けられている全ての仮想ページ１１０のページ属性３５３も自動的に変更できる。このように、ストレージプール１０２の属性の変更が仮想ページ１１０に反映されてもよい。

　統計情報３５４は、仮想ページ１１０のデータに対するホスト２からのアクセス負荷を示す情報を格納する。アクセス負荷を示す情報として、例えばＩＯＰＳ（Input/Output Per Second）を用いることができる。ＩＯＰＳに代えて、またはＩＯＰＳと共に、最後にアクセスされた時刻（西暦年月日時分秒）を統計情報３５４に格納してもよい。

　コントローラ１０は、統計情報３５４に基づいて仮想ページ１１０を圧縮するか否か判定してもよい。例えば、アクセス負荷が所定値より少ない仮想ページ１１０は圧縮対象とする、また最後のアクセス時から所定期間（例えば１ヶ月）経過している場合には仮想ページ１１０は圧縮対象とする、などの判定基準を挙げることができる。ストレージ管理者が適切な管理インタフェースを用いることで、仮想ページ１１０を圧縮するか否かの判定基準を変更できるようにしてもよい。

　コントローラ１０は、統計情報３５４および判定基準に基づいて、自動で各仮想ページ１１０の属性を圧縮または非圧縮に切り替えることができる。これにより、ストレージシステム１の性能に影響しない範囲で、容量圧縮機能を適切に使用できる。そして、ストレージ管理者は、統計情報３５４を参照しながら各仮想ページ１１０の属性を一つ一つ手動で設定する必要がないため、管理作業の効率が高まり、利便性が改善する。

　図１０は、実ページ１１１を管理するテーブル３６のデータ構成例を示す。実ページ管理テーブル３６は、実ページ１１１に関する情報を有する。実ページ１１１は、ＲＡＩＤグループ１０３をページ単位で分割した領域のことを指す。実ページ管理テーブル３６は、実ページ１１１ごとに設けられている。

　実ページ管理テーブル３６は、項目として、ＲＡＩＤグループ番号３６１と、実ページ先頭アドレス３６２と、空きページポインタ３６３とを有する。ＲＡＩＤグループ番号３６１は、コントローラ１０の管理下にあるＲＡＩＤグループ１０３のＩＤである。実ページ先頭アドレス３６２は、実ページ１１１の先頭アドレスを示す。図２で述べたように、実ページ１１１は、ＲＡＩＤグループ１０３を構成する各仮想ＰＤＥＶ１０４のストライプ１２０を用いて構成されている。

　空きページポインタ３６３は、仮想ボリューム１０１に割り当てられていない状態の実ページ１１１を管理するために使用する。このように、仮想ボリューム１０１に割り当てられていない状態の実ページ１１１のことを、以下では、空き実ページと呼んだり、フリー実ページと呼んだりすることがある。空き実ページを管理するためのデータ構造は、図１１を用いて説明する。

　図１１は、空き実ページを管理するテーブル３７のデータ構成例を示す。空き実ページ管理テーブル３７は、仮想ボリューム１０１に割り当てられていない状態の空き実ページを管理するための連結リストである。空き実ページ管理テーブル３７は、空きページ管理ポインタ３７１によって管理されている。

　空きページ管理ポインタ３７１は、空き実ページ群の中から、先頭の実ページ管理テーブル３６をさす。先頭の実ページ管理テーブル３６の中の空きページポインタ３６２は、空き実ページ群における次の実ページ管理テーブル３６をさす。図１１では、最後の実ページ管理テーブル３６の空きページポインタ３６２が、空きページ管理ポインタ３７１をさしているが、ＮＵＬＬ値でもよい。

　コントローラ１０は、実ページ１１１を割り当てていない仮想ページ１１０に対する書き込み要求をホスト２から受領すると、仮想ボリューム１０１に関連付けられているＲＡＩＤグループ１０３の中のいずれかから、そのＲＡＩＤグループ１０３に関連付けられた空きページ管理ポインタ３７１を用いて空き実ページを探し出す。コントローラ１０は、見つかった空き実ページを、書込み対象の仮想ページ１１０に割り当てる。コントローラ１０は、例えば、仮想ボリューム１０１に対応するＲＡＩＤグループ１０３のうち、空き実ページ数の最も多いＲＡＩＤグループ１０３を選択することができる。

　図１２は、ストライプ１２０を管理するテーブル２４のデータ構成例を示す。ストライプ管理テーブル２４は、圧縮データを実ＰＤＥＶ１０５の記憶領域のうちどのアドレスに格納したかを管理するためのテーブルである。

　ストライプ管理テーブル２４は、ＨＤＤ２１に格納される。これに代えて、ストライプ管理テーブル２４のうちよく使われる一部のデータを、コントローラ１０内のメモリ１３に記憶させてもよい。

　ストライプ管理テーブル２４は、ストライプ物理アドレス２４００と、末尾物理チャンク番号２４０１と、末尾物理チャンクポインタ２４０２と、有効データサイズ（非圧縮）２４０３と、有効データサイズ（圧縮）２４０４と、物理チャンクマッピングテーブル２４１０と、サブストライプマッピングテーブル２４２０とを有する。

　ストライプ物理アドレス２４００は、ストライプ１２０が実ＰＤＥＶ１０５の記憶領域のどこに対応しているかを示すアドレス（またはストライプ番号）である。末尾物理チャンク番号２４０１は、ストライプ物理アドレス２４００で特定されるストライプ１２０に対するライトデータを最後に格納した物理チャンク１２２を特定する番号を示す。末尾物理チャンクポインタ２４０２は、末尾物理チャンクに格納されたライトデータの末尾アドレスを示す。

　このように、末尾物理チャンク番号２４０１と末尾物理チャンクポインタ２４０２とを組み合わせて管理する。これにより、コントローラ１０は、当該ストライプ１２０に対してホスト２から次のライトデータを受領したときに、そのライトデータを格納するべき場所を直ちに特定することができる。

　有効データサイズ（非圧縮）２４０３は、ストライプ１２０にライトされた、非圧縮データの合計値を示す。有効データサイズ（圧縮）２４０４は、ストライプ１２０にライトされた圧縮データの合計値を示す。

　物理チャンクマッピングテーブル２４１０は、ストライプ１２０に割当済みの物理チャンク１２２を管理するためのテーブルである。物理チャンクマッピングテーブル２４１０は、その構成要素として、ストライプ内物理チャンク番号２４１１と、物理チャンクアドレス２４１２とを有する。ストライプ内物理チャンク番号２４１１は、ストライプ１２０に割り当てられている物理チャンク１２２を特定する識別情報である。物理チャンクアドレス２４１２は、ストライプ１２０に割り当てられている物理チャンク１２２の先頭アドレスを示す。Ｎｕｌｌの場合は、物理チャンク１２２が割り当てられていないことを示す。

　サブストライプマッピングテーブル２４２０は、ストライプ１２０を固定長で分割した各サブストライプ１２１に対して、圧縮データをＨＤＤ２１（実ＰＤＥＶ１０５）の記憶領域のうちいずれの領域に格納したかを管理するためのテーブルである。

　サブストライプマッピングテーブル２４２０は、例えば、サブストライプ番号２４２１と、格納先物理チャンク番号２４２２と、物理チャンク内オフセット２４２３と、圧縮有効フラグ２４２４と、圧縮後データ長２４２５とを対応付けている。

　サブストライプ番号２４２１は、各サブストライプ１２１を識別する情報（ＩＤ）である。格納先物理チャンク番号２４２２は、サブストライプ１２１に書き込まれたデータを圧縮して記憶している物理チャンク１２２を特定する識別情報である。物理チャンク内オフセット２４２３は、格納先物理チャンク１２２の先頭アドレスから当該物理チャンク１２２に書き込まれたデータの先頭アドレスまでのオフセット値を示す。

　圧縮有効フラグ２４２４は、物理チャンク１２２に格納されたデータが圧縮されているか否かを示す情報である。圧縮されている場合は「ＯＮ」、非圧縮の場合は「ＯＦＦ」が設定される。圧縮後データ長２４２５は、物理チャンク１２２に書き込まれた圧縮データのサイズを示す。

　図１３は、物理チャンク１２２を管理するテーブル２５のデータ構成例を示す。物理チャンク管理テーブル２５は、物理チャンク１２２に関する情報を有する。物理チャンク１２２は、上述の通り、実ＰＤＥＶ１０５の記憶領域を固定長で分割した領域である。物理チャンク管理テーブル２５は、物理チャンク１２２ごとに設けられる。本実施例では、非圧縮データを圧縮した後のデータサイズに応じて、その圧縮データを格納するのに必要なだけの物理チャンク１２２をストライプ１２０に割り当てる。

　物理チャンク管理テーブル２５は、その構成要素として、物理チャンク先頭アドレス２５００と、空き物理チャンクポインタ２５０１とを有する。物理チャンク先頭アドレス２５００は、物理チャンク１２２がＨＤＤ２１（実ＰＤＥＶ１０５）の記憶領域のうちいずれのアドレスに対応づいているかを示すポインタである。空き物理チャンクポインタ２５０１は、仮想ＰＤＥＶ１０４に割り当てられていない状態の物理チャンク１２２を管理するために使用する。以下、仮想ＰＤＥＶ１０４に割り当てられていない状態の物理チャンク１２２を、空き物理チャンク、フリー物理チャンクと呼ぶ場合がある。空き物理チャンクを管理するためのデータ構造は、図１４を用いて説明する。

　図１４は、空き物理チャンクを管理するテーブル２６のデータ構成例を示す。空き物理チャンク管理テーブル２６は、仮想ＰＤＥＶ１０４に割り当てられていない状態の空き物理チャンクを管理するための連結リストである。空き物理チャンク管理テーブル２６は、空き物理チャンク管理ポインタ２６０１によって管理されている。

　空き物理チャンク管理ポインタ２６０１は、空き物理チャンクの管理テーブルのうち先頭の物理チャンク管理テーブル２５をさす。先頭の物理チャンク管理テーブル２５の中の空き物理チャンクポインタ２５０１は、次の空き物理チャンクの管理テーブル２５を指し示す。図１４では、最後の物理チャンク管理テーブル２５の空き物理チャンクポインタ２５０１が、空き物理チャンク管理ポインタ２６０１を示しているが、これに代えて、ＮＵＬＬ値でもよい。物理チャンクの割り当て方は、後述する。

　空き物理チャンク管理ポインタ２６０１は、複数存在しても良い。ＨＤＤ２１の一般的な性能特性として、近傍のデータを連続して読み出す方がＨＤＤ２１の応答時間が良いことが知られている。そこで、ストライプ１２０に複数の物理チャンク１２２を割り当てる際には、なるべく近傍の物理チャンク１２２を割り当てることが性能上好ましい。しかし、物理チャンクは圧縮率によって、確保と解放を繰り返すため、常に連続した物理アドレスを持つ物理チャンクを割り当てることは難しい。そこで、各ＨＤＤ２１の記憶領域をいくつかの小領域（以下、ゾーン）に分割し、各ゾーンに含まれる物理チャンク１２２毎に異なる物理チャンク管理ポインタ２６０１に関連付けて管理する。なお、ゾーン分割数はたとえば３２などのようにあらかじめ決められていいてもよい。ストライプ１２０に複数の物理チャンク１２２を割り当てる際には、或る空き物理チャンク管理ポインタ２６０１に連結されている物理チャンク１２２を選択する。厳密には確保した複数の物理チャンク１２２は、ＨＤＤ上で連続ではないかもしれないが、その物理アドレスはあるゾーンの範囲に収まっているため、比較的近傍の物理チャンクを確保することが可能であるこれにより、ストライプ１２０に、ＨＤＤ２１上で近傍になる複数の物理チャンク１２２を割り当てることができる。この結果、そのストライプ１２０に格納したデータを読み出す場合（例えばシーケンシャルリード）、連続する複数の物理チャンク１２２からデータを読み出すことができるため、ＨＤＤ２１の応答時間を短くすることができる。

　図１５は、コントローラ１０がホスト２からライトコマンドを受領したときのライト処理を示すフローチャートである。

　コントローラ１０は、ライトコマンドを解析し、ライト対象となる仮想ページ番号を特定する（ステップ５１０１）。ライトコマンドは、例えばライト対象となる仮想ボリューム番号、仮想ボリューム上のＬＢＡ、ライトデータのサイズなどの情報を含む。コントローラ１０は、例えば、ＬＢＡを仮想ページサイズで割った結果から、仮想ページ番号を特定することができる。

　コントローラ１０は、ライト対象の仮想ページ１１０に実ページ１１１を割当済みかどうかを仮想ページ管理テーブル３５の実ページポインタ３５２が入っているかで判断する（ステップ５１０２）。ライト対象の仮想ページ１１０に実ページを割当済みである場合（ステップ５１０２：Ｎｏ）、後述のステップ５１０６に進む。

　ライト対象の仮想ページ１１０に実ページ１１１が割り当てられていない場合（ステップ５１０２：Ｙｅｓ）、コントローラ１０は、ライト対象の仮想ページ１１０に新しく仮想ページと同じサイズの実ページ１１１を割り当てる（ステップ５１０３）。コントローラ１０は、空きページ管理ポインタ３７１を参照し、未使用の実ページ１１１を１つ特定する。コントローラ１０は、特定した未使用の実ページ１１１をライト対象の仮想ページ１１０についての仮想ページ管理テーブル３５に関連付ける。これにより、仮想ページ１１０に実ページ１１１を新たに割り当てることができる。

　コントローラ１０は、ライト対象の仮想ボリューム１０１のボリューム属性３１５、もしくは仮想ボリューム１０１に関連付けられているストレージプール１０２のプール属性３２３が、圧縮であるか否か判断する（ステップ５１０４）。仮想ボリューム１０１のボリューム属性３１５およびストレージプール１０２のプール属性３２３がいずれも圧縮では無い場合（ステップ５１０４：Ｎｏ）、ステップ５１０８に進む。ステップ５１０８では、実ページ１１１のデータの物理格納先が連続領域となるように、ある実ページ１１１に対しては、或る１つの空き物理チャンク管理ポインタ２６０１を関連付け、常にその空き物理チャンク管理ポインタ２６０１に連結されている物理チャンク１２２を割り当てる。連続した物理チャンク１２２を使用してデータを格納することにより、非圧縮時において、ストライプ管理テーブル２４にアクセスするためのオーバヘッドを減らすことができる。

　その理由を説明する。本実施例では、実ページ１１１のデータの物理格納先は、実ページ１１１を構成するストライプ１２０ごとに、ストライプ管理テーブル２４によって管理されている。ストライプ管理テーブル２４は、ＨＤＤ２１上に格納されているため、コントローラ１０がアクセスするには時間がかかる。さらに、サブストライプ１２１ごとに物理格納先を割り当てるため、複数のサブストライプ１２１にまたがるデータを読み出す際は、複数の物理格納先のアドレスを特定しなければならず、コントローラ１０の処理負荷が増える。

　そこで、本実施例では、データの非圧縮時には、実ページ１１１分のサイズの物理チャンク１２２を連続領域で確保し、その先頭アドレスを実ページ管理テーブル３６の実ページ先頭アドレス３６２に格納する。物理チャンク１２２を連続領域で割り当てるために、例えば、仮想ページ１１０の属性が圧縮に設定されている場合（圧縮属性の有効時）と、仮想ページ１１０の属性が非圧縮に設定されている場合（圧縮属性の無効時）とで、それぞれ別々の空き物理チャンク管理ポインタ２６０１を用いてもよい。

　コントローラ１０は、仮想ページ１１０に非圧縮データを格納する場合に、連続領域を構成する物理チャンク１２２を用いることで、ストライプ管理テーブル２４を参照することなく、実ページ管理テーブル３６を参照するだけで、物理格納先を特定できる。これにより、コントローラ１０のオーバヘッドを削減できる。ステップ５１０８の後、ステップ５１０６に進む。　

　仮想ボリューム１０１のボリューム属性３１５またはストレージプール１０２のプール属性３２３のいずれかが圧縮に設定されている場合（ステップ５１０４：Ｙｅｓ）、コントローラ１０は、ライト対象の仮想ページ１１０の属性３５３を圧縮に変更する（ステップ５１０５）。その後、ステップ５１０６に進む。

　コントローラ１０は、ライト対象のデータ（一つ以上のデータブロックから形成されるライトデータ）をキャッシュメモリ領域３８へ転送する（ステップ５１０６）。以下、ＣＭ１３内のキャッシュメモリ領域３８をキャッシュメモリ、またはキャッシュと呼ぶ場合がある。

　最後にコントローラ１０は、ホストＩ／Ｆ１１を介して、ライトデータの書込みが完了した旨をライトコマンドの発行元であるホスト２に通知する（ステップ５１０７）。

　図１６は、デステージ処理を示すフローチャートである。デステージ処理とは、キャッシュ３８に格納されたデータのうちＨＤＤ２１には未だ書き込まれていないデータを、ＨＤＤ２１の所定領域に格納する処理である。デステージ処理は、ホスト２からのライト要求を処理するタイミングとは非同期に実施できる（ステップ５２００）。

　コントローラ１０は、デステージ対象の実ページ１１１に格納されているデータがＲＡＩＤ５、もしくはＲＡＩＤ６に基づいているか判定する（ステップ５２０１）。判定は、実ページ管理テーブル３６のＲＡＩＤグループ＃３６１のＲＡＩＤレベル３３２をＲＡＩＤグループ管理テーブル３３で確認すれば良い。デステージ対象データがＲＡＩＤ５，もしくはＲＡＩＤ６で記憶されている場合、コントローラ１０は、デステージ対象データについてパリティを生成する（ステップ５２０２）。

　コントローラ１０は、デステージ対象の実ページ１１１の属性が圧縮であるか対応づけられる仮想ページ管理テーブル３５のページ属性３５３で判定する（ステップ５２０３）。デステージ対象の実ページ１１１に圧縮属性が設定されている場合（ステップ５２０３：Ｙｅｓ）、コントローラ１０は、実ページ１１１のデータを圧縮してデステージ処理する（ステップ５２０４）。この処理は図１７で後述する。

　デステージ対象の実ページ１１１に圧縮属性が付いていない場合（ステップ５２０３：Ｎｏ）、コントローラ１０は、実ページ管理テーブル３６を参照し、デステージ対象データを格納している物理アドレスを取得する（ステップ５２０５）。このように、圧縮属性がついていない実ページ１１１へデステージする場合は、同じ物理アドレスに対して上書きでデータを格納する。このようにすることで、物理領域を再利用することができるため、物理領域の容量効率が向上する。そして、コントローラ１０は、デステージ対象データをキャッシュ３８からＨＤＤ２１に転送して書き込ませる（ステップ５２０６）。

　図１７は、圧縮データをデステージする処理のフローチャートを示す。本処理は、図１６中のステップ５２０４の詳細である。本フローチャートはキャッシュのダーティデータについて実行され、１回で処理するダーティサイズは最大でストライプサイズである。

　コントローラ１０は、圧縮データを格納するためのバッファ領域３９をＣＭ１３内に確保する（ステップ５３０１）。コントローラ１０は、キャッシュ３８上のデステージ対象データを、所定のアルゴリズムに従って圧縮／伸張部Ｆ３を用いてサブストライプ１２１単位で圧縮し、圧縮データをステップ５３０１で確保したバッファ３９へ格納する（ステップ５３０２）。

　コントローラ１０は、デステージ対象データを有するストライプ１２０に対して、割当済みの物理チャンク１２２が存在するかどうかを物理チャンクアドレス２４１２が管理されているかで判定する（ステップ５３０３）。デステージ対象のストライプ１２０に物理チャンク１２２が一つも割り当てられていない場合（ステップ５３０３：Ｎｏ）、後述のステップ５３０７に進む。対象ストライプ１２０に物理チャンク１２２が１つ以上割り当てられている場合（ステップ５３０３：Ｙｅｓ）、ステップ５３０４に進む。

　コントローラ１０は、対象ストライプ１２０に割り当てられている物理チャンク１２２内に、デステージ対象データを格納できるだけの空き容量があるかを判定する（ステップ５３０４）。その物理チャンク１２２内にデステージ対象データを記憶するための空き容量が無い場合（ステップ５３０４：Ｎｏ）、ステップ５３０７に進む。なお、圧縮データは物理チャンク１２１内で前詰めに格納されるため、当該物理チャンク１２２の物理チャンクアドレス２４１２から末尾物理チャンクポインタ２４０２までが使用済みの領域であり、末尾物理チャンクポインタ２４０２から当該物理チャンク１２２の終端までが当該物理チャンク１２２内の空き容量である。空き容量がある場合（ステップ５３０４：Ｙｅｓ）、ステップ５３０５に進む。

　コントローラ１０は、ストライプ管理テーブル２４の末尾物理チャンクポインタ２４０２が指すアドレスへ圧縮データを書き込む（ステップ５３０５）。

　一方、ステップ５３０７に進んだ場合、コントローラ１０は、物理チャンク割り当て処理（ステップ５３０７）を実行する。この処理は図１８で後述する。コントローラ１０は、物理チャンク１２２を新たに割り当てた後、その割り当てた物理チャンク１２２の先頭に圧縮データを書き込む（ステップ５３０８）。物理チャンク１２２の先頭は物理チャンクアドレス２４１２を参照することによって求められる。最後に、コントローラ１０は、ストライプ管理テーブル２４を更新する（ステップ５３０６）。

　図１８は、物理チャンクを割り当てる処理のフローチャートを示す。本処理は、図１７中のステップ５３０７の詳細を示す。

　コントローラ１０は、デステージ対象データのサイズがストライプサイズに等しいかどうかを判断する（ステップ５４０１）。

　デステージ対象データのサイズがストライプサイズに等しい場合（ステップ５４０１：Ｙｅｓ）、コントローラ１０は、空き物理チャンク管理テーブル２６を参照することによりフリーの物理チャンク１２２を確保して、対象ストライプ１２０に割り当てる（ステップ５４０７）。

　ストライプ１２０全体のデータをＨＤＤ２１へ上書きする場合、既に格納している旧データを全て捨てた後で、そのストライプ１２０へ新しい物理チャンク１２２を割り当てた方が、物理チャンク管理テーブル２５の更新処理が簡単になる。そこで、本実施例では、デステージ対象データのサイズがストライプサイズに一致する場合は、新しいフリーの物理チャンク１２２を対象ストライプ１２０に割当て直す。

　デステージ対象データのサイズがストライプサイズに等しくない場合（ステップ５４０１：Ｎｏ）、コントローラ１０は、対象ストライプ１２０に割り当てられている物理チャンク１２２の数が所定の閾値ＴｈＰＣ以下であるか判定する（ステップ５４０２）。所定の閾値ＴｈＰＣは、例えば、１つのストライプ１２０に割り当てることのできる最大物理チャンク数、つまり、ストライプのサイズとそのストライプに割り当てる物理チャンクの合計サイズとが一致する場合の物理チャンク数である。最大圧縮率を１／８とした場合、閾値ＴｈＰＣは８となる。

　割当済み物理チャンク数が閾値ＴｈＰＣ以下の場合（ステップ５４０２：Ｙｅｓ）、コントローラ１０は、空き物理チャンク管理ポインタ２６０１を参照することで、フリーの物理チャンクを確保する（ステップ５４０３）。コントローラ１０は、すでに割当済みの物理チャンクと、ＨＤＤ２１上で近傍にある物理チャンクとを優先的に確保する。具体的には、すでに割当済みの物理チャンクと同じ空き物理チャンク管理ポインタ２６０１に連結されている物理チャンク１２２を選択して確保する。できるだけ近い場所にある物理チャンク１２２を割り当てる方が、ストライプ１２０のデータを読み出す際に、ＨＤＤ２１のシーク時間を小さくでき、ＨＤＤ２１の応答時間を向上することができる。コントローラ１０は、物理チャンク管理テーブル２５を更新し（ステップ５４０４）、本処理を終了する。

　一方で、物理チャンク割り当て数が閾値ＴｈＰＣを超えていた場合（ステップ５４０２：Ｎｏ）、後述のステップ５４０５に進む。

　本実施例では、ストライプ１２０に格納したデータを更新する際に、既に割り当て済みの物理チャンク内の空き領域の利用を優先させるために、物理チャンク１２２内に旧データが残ってしまう。物理チャンク１２２には、ライトデータがいわゆる前詰めで書き込まれていくため、上書き対象の旧データは物理チャンク１２２内に残ったままである。

　そこで、本実施例では、ストライプ１２０に割り当てる物理チャンク１２２の合計サイズがストライプサイズを超える場合（割当済み物理チャンク数＞ＴｈＰＣ）、対象ストライプに関連する全ての物理チャンク１２２のデータを読み出し（ステップ５４０５）、ストライプ１２０に新規なフリー物理チャンク１２２を割当てし直し（ステップ５４０６）、必要なデータのみを前詰めで格納し直す（ステップ５４０７）。これにより、無駄なデータを除去し、物理チャンク１２２を有効に使用することができる。

　例えば、或るストライプ１２０への更新ライトを繰り返した結果として、不要なデータが蓄積されてしまい、そのストライプ１２０に対して閾値ＴｈＰＣを越える９個目の物理チャンク１２２を割り当てる必要が生じた場合を検討する。この場合、コントローラ１０は、物理チャンクマッピングテーブル２４１０を参照し、対象ストライプ１２０に割当済みの８個の物理チャンク１２２からデータを全て読み出しす。次に、サブストライプマッピングテーブル２４２０を参照し、各サブストライプに対応するデータだけを、新たに割り当てる物理チャンク１２２に前詰めで格納する。不要な旧データが取り除かれる結果、物理チャンク１２２に空き領域が生じる。不要な旧データの合計サイズが物理チャンクサイズ以上である場合、まるまる一つの物理チャンク１２２をフリー物理チャンクとして再利用できる。

　上述のように、ステップ５４０５では、コントローラ１０は、対象ストライプ１２０に関連付けられた全ての物理チャンク１２２のデータをバッファ３９に読み出し、ステップ５４０６に進む。

　コントローラ１０は、ステップ５４０６において、ステップ５４０５でバッファ３９に読み出したデータをバッファ３９上でサブストライプ番号順に並べなおす。このとき、デステージ対象の圧縮データを含むサブストライプについては、ステップ５４０５でバッファ３９に読み出したデータではなく、ステップ５３０２で圧縮した新しいデータに置き換える。

　コントローラ１０は、ステップ５４０７において、空き物理チャンク管理ポインタ２６０１を参照し、ステップ５４０３と同様に圧縮データを格納するのに必要な物理チャンク１２２をできるだけ近い領域の中から新規に確保し、ステップ５４０８に進む。

　コントローラ１０は、ステップ５４０８において、フリーになった物理チャンク１２２を空き物理チャンク管理テーブル２６に登録する。最後にコントローラ１０は、物理チャンク管理テーブル２５を更新する（ステップ５４０４）。

　図１９は、リードコマンドを処理するフローチャートを示す。コントローラ１０は、ホスト２から受領したリードコマンドを解析し、リード対象のＬＢＡを特定する（ステップ５５０１）。

　コントローラ１０は、リード対象データがキャッシュメモリ３８に記憶されているかを判定する（ステップ５５０２）。リード対象データがキャッシュメモリ３８に記憶されている場合（ステップ５５０２：Ｙｅｓ）、コントローラ１０は、キャッシュメモリ３８に記憶されているリード対象データをホストＩ／Ｆ１１を介してホスト２に転送する（ステップ５５０５）。

　一方、リード対象データがキャッシュメモリ３８に記憶されていない場合（ステップ５５０２：Ｎｏ）、コントローラ１０は、キャッシュメモリ３８上にリード対象データを格納するためのキャッシュスロットを新規に確保する（ステップ５５０３）。

　コントローラ１０は、キャッシュメモリ３８へのステージング処理を実行する（ステップ５５０４）。キャッシュメモリ３８へのステージング処理とは、ＨＤＤ２１（実ＰＤＥＶ１０５）内のリード対象データをキャッシュメモリ３８へ転送して記憶させる処理である。この処理については図２０で後述する。コントローラ１０は、ＨＤＤ２１からキャッシュメモリ３８へのリード対象データの転送が完了すると、キャッシュメモリ３８上のリード対象データをホスト２へホストＩ／Ｆ１１を介して転送する。

　図２０は、キャッシュステージング処理のフローチャートを示す。本処理は、図１９中のステップ５５０４の詳細を示す。本処理では、ＨＤＤ２１からリード対象データを読み出して、キャッシュメモリ３８へ格納する。

　コントローラ１０は、リードコマンドから抽出されるリード対象アドレスに基づいて、リード対象となる仮想ページ１１０の番号を算出する（ステップ５６０１）。仮想ページ１１０のサイズが固定である場合、コントローラ１０は、例えば、ＬＢＡを仮想ページサイズで割った結果から、仮想ページ番号を特定することができる。

　コントローラ１０は、仮想ページ管理テーブル３５の中の実ページポインタ３５２を取得する（ステップ５６０２）。コントローラ１０は、実ページポインタ３５２がＮＵＬＬではないか否かを判断する（ステップ５６０３）。実ページポインタ３５２がＮＵＬＬの場合（ステップ５６０３：Ｎｏ）、ステップ５６０７に進む。実ページポインタ３５２がＮＵＬＬの場合とは、ホスト２が仮想ページ１１０にデータを一度も書き込んでおらず、リードすべきデータが存在しないという場合である。そこで、コントローラ１０は、０データをキャッシュメモリ３８に格納し、本処理を終了する。

　ステップ５６０３の判定結果がＹｅｓの場合、すなわち実ページポインタ３５２がＮＵＬＬでない場合、ステップ５６０４に進む。コントローラ１０は、リード対象の仮想ページ１１０の属性が圧縮になっているかどうかを判定する（５６０４）。コントローラ１０は、仮想ページ管理テーブル３５に含まれるページ属性３５３を参照することで、ステップ５６０４を判定する。ステップ５６０４の判定結果がＹｅｓの場合、ステップ５６０５に進み、圧縮データステージング処理（ステップ５６０５）を実行する。ステップ５６０４の判定結果がＮｏの場合、ステップ５６０６に進む。

　コントローラ１０は、ステップ５６０６において、リード対象データをキャッシュメモリ３８に読み出す。この場合、ページ属性は圧縮ではないので、コントローラ１０は、ストライプ管理テーブル２４を参照しなくても、実ページ管理テーブル３６内の実ページ先頭アドレス３６２から、対象データを格納している物理アドレスを特定できる。そして、コントローラ１０は、本処理を終了する。

　図２１は、圧縮データをステージングする処理のフローチャートを示す。本処理は、図２０中のステップ５６０５の詳細を示す。

　コントローラ１０は、リード対象のストライプに対応するストライプ管理テーブル２４を参照することで、リード対象データを格納している物理アドレスを取得する（ステップ５７０１）。コントローラ１０は、ホスト２が要求するデータサイズに応じて、ストライプ単位でデータを読み出すか、それともサブストライプ単位でデータを読み出すかを判断する（ステップ５７０２）。

　ステップ５７０２では、物理チャンクサイズ単位で読み出すか（第１リードモード）、サブストライプサイズ単位で読み出すか（第２リードモード）、いずれの読み出し方法を採用した方が、ＨＤＤ２１へのリード回数を少なくできるかという基準で判断する。リード回数が少なくなるほど、ＨＤＤ２１のデータ読み出し時のスループット性能を向上することができるからである。

　そこで、本実施例では、上述の判定基準を実現すべく、例えば、ホスト２が読み出しを要求するサイズをサブストライプ１２１のサイズで割った値（＝要求サイズ／サブストライプサイズ）の方が、ストライプ１２０に割当済みの物理チャンク１２２の数よりも大きいか判定する（ステップ５７０２）。

　ステップ５７０２の判定式を説明する。ここで、「ストライプ１２０へ割当済みの物理チャンク１２２の数」は、物理チャンク単位でデータを読み出す場合のＨＤＤ２１へのリード回数に等しい。コントローラ１０は物理チャンクマッピングテーブル２４１０を参照し、ストライプ内物理チャンクに対応する物理チャンクアドレス２４１２がＮＵＬＬでない物理チャンクの数を数えることにより、ストライプ１２０へ割当済みの物理チャンクの数を求めることができる。コントローラ１０は、物理チャンク単位でＨＤＤ２１からデータを読み出すことができる。一方、「要求サイズ／サブストライプサイズ」は、サブストライプ単位でデータを読み出す場合のＨＤＤ２１へのリード回数に等しい。従って、ホスト２が読み出しを要求するサイズをサブストライプサイズで割った値と、ストライプ１２０へ割当済みの物理チャンク１２２の数とを比較することで、ＨＤＤ２１へのリード回数の大小を判定することができる。

　（要求サイズ／サブストライプサイズ）の値が割当済み物理チャンク数よりも大きい場合（ステップ５７０２：Ｙｅｓ）、ストライプ単位でデータを読み出した方がＨＤＤ２１へのリード回数が少ない。

　そこで、コントローラ１０は、ストライプサイズ分のデータを読み出すために必要なサイズのバッファ３９を確保する（ステップ５７０３）。コントローラ１０は、物理チャンクマッピングテーブル２４１０を参照し、ストライプ１２０に関連付けられている全ての物理チャンク１２２のデータ（圧縮データ）をバッファ領域３９に読み出す（ステップ５７０４）。コントローラ１０は、サブストライプ番号順に、バッファ３９上に記憶した圧縮データを伸張し、非圧縮状態に戻したリード対象データをキャッシュ３８に格納した後、本処理を終了する。

　一方、（要求サイズ／サブストライプサイズ）の値が割当済み物理チャンク数以下の場合（ステップ５７０２：Ｎｏ）、サブストライプ単位でデータを読み出した方がＨＤＤ２１へのリード回数が少ない。

　そこで、コントローラ１０は、少なくともホスト２が要求するデータサイズに等しいだけのバッファ３９を確保する（ステップ５７０６）。コントローラ１０は、サブストライプマッピングテーブル２４２０を参照することで、リード対象のサブストライプのデータをＨＤＤ２１から読み出してバッファ３９に格納する（ステップ５７０７）。コントローラ１０は、バッファ３９上の圧縮データを伸張し、キャッシュメモリ３８に格納する（ステップ５７０８）。そして、コントローラ１０は本処理を終了する。

　このように構成される本実施例によれば、サブストライプサイズを圧縮伸張単位とし、物理チャンクサイズの記憶領域内に前詰めで圧縮データを書き込むため、コントローラ１０は、物理チャンク内のオフセット値を管理するだけで、圧縮データの所在を把握することができる。従って、圧縮データの物理格納先を効率的に管理することができる。さらに、オフセット値を管理すればよいので、テーブルサイズを小さくすることができ、ＣＭ１２の記憶領域を効率的に使用できる。

　本実施例では、図２１で述べたように、ＨＤＤ２１から圧縮データを読み出す場合のリードモードを２種類用意し、リード時のサイズを最適化することで、ＨＤＤ２１へのリード回数を低減する。従って、ＨＤＤ２１からデータを読み出す場合のスループット性能を改善することができる。

　本実施例では、小さいサイズのデータを読み出す場合に、目的のデータ以外の不要なデータまで伸張してしまうのを抑制でき、さらに、大きいサイズのデータを読み出す場合に、コントローラ１０及びＨＤＤ２１の負荷を低減できる。

　本実施例では、大きいサイズのデータを読み出すときは、チャンク単位でデータを読み出してサブストライプ単位で伸張し、キャッシュメモリ３８上でデータを論理アドレス順に並び替える。本実施例では、大きいサイズのシーケンシャルリード要求をチャンク単位で処理できるため、コントローラ１０の処理負荷を軽減できると共に、ＨＤＤ２１へのアクセス回数を削減してＨＤＤ２１の負荷を低減できる。本実施例では、コントローラ１０が圧縮データをシーケンシャルに読み出す場合に、ＨＤＤ２１のスループット性能を向上できる。

　本実施例では、小サイズのデータの場合、サブストライプ単位でデータを読み書きするため、目的のデータのみを圧縮または伸張すればよく、不要なデータの圧縮または伸張を行う必要がない。従って、処理性能が向上する。

　なお、上記実施例は本発明を理解し、実施するための一例であり、本発明は上述した全ての構成を備えるものに限定されない。実施例の構成の一部を、他の構成に置き換えたり、一部の構成を削除したり、ある構成と他の構成とを結合して一つの構成にまとめたりすることができる場合がある。

　上記の各構成、機能、処理部等は、それらの一部または全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよい。あるいは、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。

　さらに、特許請求の範囲に記載の各構成は、明示した組合せ以外にも種々組み合わせることができる。

　１：ストレージ装置、２：ホスト計算機、１０：コントローラ、１０１：仮想ボリューム、１０２：ストレージプール、１０３：ＲＡＩＤグループ、１０４：仮想ＰＤＥＶ、１０５：実ＰＤＥＶ、１１０：仮想ページ、１１１：実ページ、１２０：ストライプ、１２１：サブストライプ、１２２：物理チャンク

Claims

　少なくとも一つの記憶デバイスと、前記記憶デバイスを制御するコントローラと、キャッシュとを有するストレージシステムであって、
　前記記憶デバイスから一回で読み出せるデータの最大サイズである第１サイズと、前記第１サイズ以下の第２サイズと、前記第１サイズの約数であって、前記第１サイズおよび前記第２サイズよりも小さい値に設定される第３サイズとが予め定義されており、
　前記コントローラは、複数の仮想ページで構成される仮想ボリュームを提供し、
前記仮想ボリュームへのライト要求を受けると、前記第１のサイズを有する複数のストライプで構成されるプール領域を前記仮想ページサイズで割り当て、前記ライト要求のデータを前記キャッシュに格納し、
前記キャッシュに格納される前記データを前記記憶デバイスに書き込む場合に、
　　前記データを前記第３サイズ単位で圧縮して圧縮データを生成し、
　　前記記憶デバイスの有する記憶領域を前記第２サイズ単位で選択し、
　　前記選択した第２サイズの記憶領域へ前記圧縮データを前記第２サイズの記憶領域の空き領域の先頭アドレスから順に間を空けずに書き込む、
ストレージシステム。
　前記キャッシュに格納される前記データを有する前記ストライプのデータを既に格納している前記第２サイズの記憶領域に、前記圧縮データのサイズ以上の空き領域がある場合には、前記既に割り当てられている前記第２サイズの記憶領域の空き領域に前記圧縮データを書き込む、
請求項１記載のストレージシステム。
　前記コントローラは　リード要求に基づいて、予め用意された第１リードモードと第２リードモードのうちいずれか一つを選択し、
　前記第１リードモードを選択した場合は、前記リード要求の対象データを記録する前記第１サイズの記憶領域に関連付けられている全ての前記第２サイズの記憶領域から前記対象データの圧縮データを読み出して、前記リード要求に応答し、
　前記第２リードモードを選択した場合は、前記リード要求の対象データを記録する前記第１サイズの記憶領域に関連付けられている前記第２サイズの記憶領域のうち前記対象データの圧縮データを前記第３サイズ単位で読み出して前記リード要求に応答する、
請求項１に記載のストレージシステム。
　前記コントローラは、前記読み出した圧縮データを前記第３サイズ単位で伸張し、前記伸張したデータを所定の順番に並べ替えて前記リード要求に応答する請求項３に記載のストレージシステム。
　前記コントローラは、前記リード要求の前記対象データのサイズを前記第３サイズで割った値の方が前記第１サイズの記憶領域に割当済みの前記第２サイズの記憶領域の数よりも大きいと判定した場合に前記第１リードモードを選択し、そうではないと判定した場合に前記第２リードモードを選択する、
請求項４に記載のストレージシステム。
　前記記憶デバイスはディスクドライブであって、
　前記コントローラは、前記ディスクドライブの有する記憶領域を前記第２サイズ単位で選択する場合に、前記キャッシュに格納される前記データを有する前記ストライプのデータを既に格納している前記第２サイズの記憶領域と前記ディスクドライブ上で物理的距離が近い第２サイズの記憶領域を優先的に選択する、
請求項１に記載のストレージシステム。
　前記コントローラは、前記選択した第２サイズの記憶領域へ前記圧縮データを書き込む場合に、前記ストライプのデータを既に格納している前記第２サイズの記憶領域へ書込み済みのデータのうち不要なデータを除去し、有効なデータだけを新たに選択された前記第２サイズの記憶領域の先頭アドレスから順に間を空けずに書き込む、
請求項６に記載のストレージシステム。
　前記コントローラは、前記記憶デバイスへ前記圧縮データを書き込む場合において、前記圧縮データのサイズが前記第１サイズに一致する場合、前記記憶デバイスの物理的記憶領域から前記第２サイズの記憶領域を新規に選択する、
請求項１に記載のストレージシステム。
　前記仮想ボリューム単位で、または、前記プール単位で、データを圧縮して管理するか否かを指定することができる、
請求項１に記載のストレージシステム。
　前記仮想ボリュームを構成する仮想ページ単位で、前記データを圧縮して管理するか否かを指定することができる、
請求項１に記載のストレージシステム。
　前記コントローラは、前記仮想ページの利用状況に応じて、前記データを圧縮して管理するか否かを自動的に決定する、
請求項１０に記載のストレージシステム。
　少なくとも一つの記憶デバイスをコントローラにより制御するための方法であって、
　前記記憶デバイスから一回で読み出せるデータの最大サイズである第１サイズと、前記第１サイズ以下の第２サイズと、前記第１サイズの約数であって、前記第１サイズおよび前記第２サイズよりも小さい値に設定される第３サイズとが予め定義されており、
　前記コントローラは、複数の仮想ページで構成される仮想ボリュームを提供し、
前記仮想ボリュームへのライト要求を受けると、前記第１のサイズを有する複数のストライプで構成されるプール領域を前記仮想ページサイズで割り当て、前記ライト要求のデータをキャッシュに格納し、
前記キャッシュに格納される前記データを前記記憶デバイスに書き込む場合に、
　　前記データを前記第３サイズ単位で圧縮して圧縮データを生成し、
　　前記記憶デバイスの有する記憶領域を前記第２サイズ単位で選択し、
　　前記選択した第２サイズの記憶領域へ前記圧縮データを前記第２サイズの記憶領域の空き領域の先頭アドレスから順に間を空けずに書き込む、
記憶デバイスの制御方法。
　前記コントローラは、前記キャッシュに格納される前記データを有する前記ストライプのデータを既に格納している前記第２サイズの記憶領域に、前記圧縮データのサイズ以上の空き領域がある場合には、前記既に割り当てられている前記第２サイズの記憶領域の空き領域に前記圧縮データを書き込む、
請求項１２記載の記憶デバイスの制御方法。
　前記コントローラは　リード要求に基づいて、予め用意された第１リードモードと第２リードモードのうちいずれか一つを選択し、
　前記第１リードモードを選択した場合は、前記リード要求の対象データを記録する前記第１サイズの記憶領域に関連付けられている全ての前記第２サイズの記憶領域から前記対象データの圧縮データを読み出して、前記リード要求に応答し、
　前記第２リードモードを選択した場合は、前記リード要求の対象データを記録する前記第１サイズの記憶領域に関連付けられている前記第２サイズの記憶領域のうち前記対象データの圧縮データを前記第３サイズ単位で読み出して前記リード要求に応答する、
請求項１に記載のストレージシステム。
請求項１２に記載の記憶デバイスの制御方法。
　前記コントローラは、前記読み出した圧縮データを前記第３サイズ単位で伸張し、前記伸張したデータを所定の順番に並べ替えて前記リード要求に応答する請求項１４に記載の記憶デバイスの制御方法。