JP6011349B2 - ストレージ装置、およびデータ圧縮方法 - Google Patents

ストレージ装置、およびデータ圧縮方法 Download PDF

Info

Publication number
JP6011349B2
JP6011349B2 JP2013003910A JP2013003910A JP6011349B2 JP 6011349 B2 JP6011349 B2 JP 6011349B2 JP 2013003910 A JP2013003910 A JP 2013003910A JP 2013003910 A JP2013003910 A JP 2013003910A JP 6011349 B2 JP6011349 B2 JP 6011349B2
Authority
JP
Japan
Prior art keywords
file
compression
data
determination
management information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013003910A
Other languages
English (en)
Other versions
JP2014135699A (ja
Inventor
吉成 大野
吉成 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013003910A priority Critical patent/JP6011349B2/ja
Priority to US14/098,658 priority patent/US9684665B2/en
Publication of JP2014135699A publication Critical patent/JP2014135699A/ja
Application granted granted Critical
Publication of JP6011349B2 publication Critical patent/JP6011349B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1744Redundancy elimination performed by the file system using compression, e.g. sparse files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、ストレージ装置、およびデータ圧縮方法に関する。
近年の仮想化システムや、クラウドシステム、仮想化デスクトップの積極的な導入を背景として、ファイルサーバ(ストレージ装置)は、より一層のデータの集約化が図られ、より多くのサーバをサポートする要請が強くなってきている。
このように、ファイルサーバの負担が益々大きくなるなかで、各サーバに対するレスポンスの向上も求められることから、ファイルサーバは、CPU(Central Processing Unit)資源(演算資源)を無暗に消費できない状況になっている。
このような状況下で、ファイルサーバの高機能化もすすんでいる。たとえば、ファイルサーバは、HDD(Hard Disk Drive)などの記憶媒体に大容量のデータを効率的に格納するために、データの容量圧縮や、データ内の重複したデータを排除する重複排除技術(デデュープ)などを搭載する。ファイルサーバは、このような処理にもCPU資源を消費する。
しかしながら、ファイルサーバは、データ容量あたりの価格が性能指標の1つとなることから、大容量のデータを格納しつつも、低コストであることが求められる。したがって、ファイルサーバは、データの効率的な格納と、データの効率的な格納をおこなうためのCPU資源の消費量の改善を両立することが望ましい。
たとえば、データの効率的な格納をおこなう機能の1つとして、ファイルサーバは、データを圧縮して格納する機能を有する。ファイルサーバは、書き込み要求に対してデータを圧縮して格納し、読み出し要求に対してデータを展開(伸張)して応答する。
このように、データの圧縮機能は、サーバからアクセスされる都度、ファイルの圧縮/展開を実行することになり、圧縮機能を利用しない場合と比較して多くのCPU資源を消費する。しかしながら、すでに高度のデータ圧縮が施されたデータ(たとえば、jpegなどの画像データ)は、データの圧縮効果がほとんど無い場合や、余計にデータが大きくなってしまう場合がある。このような場合に、ファイルサーバは、CPU資源を無駄に消費したことになる。
このようなCPU資源の無駄を避ける技術として、特定ディレクトリを圧縮対象としたり、ファイルの拡張子によって圧縮の実施可否を判断したりする技術が知られている。
特開2003−338761号公報 特開2000−358144号公報 特開平06−324925号公報
しかしながら、圧縮対象の選択をユーザ側に委ねる場合、ユーザには適切な判断が求められる。ユーザの不適切な判断は一層の非効率を招く恐れがあるほか、運用に対するユーザにかかる負担も大きい。
また、ファイルの拡張子によって判断する場合、同一の拡張子であってもデータの圧縮効果が異なる場合があり、取り扱うデータによっては非効率な運用となりかねない。また、ファイルフォーマットの変更や追加などがあった場合、適切な拡張子を随時登録する必要があり、メンテナンス性が悪いという問題もある。
1つの側面では、本発明は、運用負担を軽減して、演算資源を効率的に使用したデータ圧縮ができるストレージ装置、およびデータ圧縮方法を提供することを目的とする。
上記目的を達成するために、以下に示すような、ストレージ装置が提供される。ストレージ装置は、データ記憶部と、管理情報記憶部と、圧縮判定部と、圧縮制御部とを備える。データ記憶部は、ファイルのデータを記憶する。管理情報記憶部は、ファイルの管理情報を記憶する。圧縮判定部は、所定の実行契機において、ファイルの圧縮効果を評価してファイルの圧縮の可否を判定する。圧縮制御部は、判定の結果を含めて管理情報を更新するとともに、判定の結果がファイルの圧縮を可とする場合にファイルを圧縮した圧縮データをデータ記憶部に記憶させ、判定の結果がファイルの圧縮を否とする場合にファイルを圧縮しない非圧縮データをデータ記憶部に記憶させる。
また、上記目的を達成するために、データ圧縮方法が提供される。データ圧縮方法は、以下に示すような処理を、ファイルのデータを記憶するデータ記憶部とファイルの管理情報を記憶する管理情報記憶部とを備えるコンピュータに実行させる。コンピュータは、所定の実行契機において、ファイルの圧縮効果を評価してファイルの圧縮の可否を判定し、判定の結果を含めて管理情報を更新するとともに、判定の結果がファイルの圧縮を可とする場合にファイルを圧縮した圧縮データをデータ記憶部に記憶させ、判定の結果がファイルの圧縮を否とする場合にファイルを圧縮しない非圧縮データをデータ記憶部に記憶させる、処理を実行する。
1態様によれば、ストレージ装置、およびデータ圧縮方法において、運用負担を軽減して、演算資源を効率的に使用したデータ圧縮ができる。
第1の実施形態のストレージ装置の構成例を示す図である。 第2の実施形態のファイルサーバのシステム接続例を示す図である。 第2の実施形態のファイルサーバのハードウェア構成例を示す図である。 第2の実施形態のファイルサーバのブロック構成例を示す図である。 第2の実施形態のファイル管理テーブルの一例を示す図である。 第2の実施形態のデータ書き込み処理のフローチャートを示す図である。 第2の実施形態のデータ読み出し処理のフローチャートを示す図である。 第2の実施形態の圧縮判定処理のフローチャートを示す図である。 第2の実施形態の設定テーブルの一例を示す図である。 第2の実施形態の圧縮再判定決定処理のフローチャートを示す図である。
以下、実施の形態を図面を参照して詳細に説明する。
[第1の実施形態]
まず、第1の実施形態のストレージ装置について図1を用いて説明する。図1は、第1の実施形態のストレージ装置の構成例を示す図である。
ストレージ装置1は、所要の情報を記録可能な物理資源(記憶媒体)へのアクセス制御をおこなう制御装置である。ストレージ装置1は、ファイルシステムを管理し、ファイルサーバとして機能する。なお、物理資源は、たとえば、HDDやSSD(Solid State Drive:フラッシュメモリドライブ)などである。なお、物理資源は、複数のHDDやSSDを束ねたストレージプールであってもよい。
ストレージ装置1は、物理資源へのデータの効率的な格納のために、データの容量圧縮をおこなう。ストレージ装置1は、物理資源への書き込み時のデータの圧縮と、物理資源からの読み出し時のデータの展開にCPU資源を消費する。ストレージ装置1は、データの圧縮と展開に消費するCPU資源と物理資源の格納効率とを比較考量してデータの圧縮制御をおこなう。
ストレージ装置1は、データ記憶部2と、管理情報記憶部3と、圧縮判定部4と、圧縮制御部5とを備える。データ記憶部2は、ファイルのデータを記憶する。データ記憶部2は、物理資源上の記憶領域である。管理情報記憶部3は、ファイルの管理情報を記憶する。管理情報記憶部3は、物理資源上の記憶領域である。なお、管理情報記憶部3は、RAM(Random Access Memory)などのワークメモリ上の記憶領域としてもよい。ファイルのデータは、保存対象となる情報であり、ファイルの管理情報は、保存対象となるデータの管理あるいは制御に用いる情報である。
圧縮判定部4は、ファイルの圧縮効果を評価してファイルの圧縮の可否を判定する。圧縮判定部4は、所定の実行契機でファイルの圧縮の可否を判定する。所定の実行契機は、たとえば、新規ファイル(新規のファイル)の書き込み時がある。圧縮判定部4は、書き込み対象のファイルを圧縮して圧縮効果を評価する。たとえば、圧縮判定部4は、ファイルA6を圧縮してファイルA(圧縮)6aを得たとき、ファイルA(圧縮)6aのファイルサイズがファイルA6のファイルサイズに対して100%であればファイルの圧縮効果がないと評価する。また、圧縮判定部4は、ファイルB7を圧縮してファイルB(圧縮)7aを得たとき、ファイルB(圧縮)7aのファイルサイズがファイルB7のファイルサイズに対して20%であればファイルの圧縮効果があると評価する。
なお、ファイルの圧縮効果は、所定の評価基準にしたがい評価することができる。たとえば、圧縮判定部4は、ファイルサイズの圧縮量、ファイルサイズの圧縮率などにより圧縮効果を評価して、評価結果と所定の閾値と比較してファイルの圧縮の可否を判定することができる。たとえば、ファイルA(圧縮)6aのファイルサイズの圧縮率は、ファイルA6のファイルサイズに対して100%であるから、あらかじめ定めた閾値100%を下回らない(すなわち、圧縮効果がない)ため、ファイルA6の圧縮の可否を「否」として判定する。また、ファイルB(圧縮)7aのファイルサイズの圧縮率は、ファイルB7のファイルサイズに対して20%であるから、あらかじめ定めた閾値100%を下回る(すなわち、圧縮効果がある)ため、ファイルB7の圧縮の可否を「可」として判定する。
圧縮制御部5は、管理情報記憶部3が記憶する管理情報を記録(更新)する。圧縮制御部5は、圧縮判定部4の判定結果を含めて管理情報を更新する。すなわち、圧縮制御部5は、管理情報の1つであるファイルの圧縮の可否を更新する。圧縮制御部5は、圧縮判定部4の判定結果がファイルの圧縮の可否を「可」とする場合にファイルを圧縮した圧縮データをデータ記憶部2に記憶させる。圧縮制御部5は、圧縮判定部4の判定結果がファイルの圧縮の可否を「否」とする場合にファイルを圧縮しない非圧縮データをデータ記憶部2に記憶させる。
たとえば、圧縮制御部5は、ファイルA6の圧縮の可否が「否」であるから、管理情報記憶部3にファイルA(圧縮否)6bを記憶させ、データ記憶部2にファイルA(非圧縮)6cを記憶させる。また、圧縮制御部5は、ファイルB7の圧縮の可否が「可」であるから、管理情報記憶部3にファイルB(圧縮可)7bを記憶させ、データ記憶部2にファイルB(圧縮)7cを記憶させる。
これにより、ストレージ装置1は、運用に対するユーザにかかる負担を軽減して効率的なデータ圧縮をおこなうことができる。また、ストレージ装置1は、圧縮効果を評価できないファイルの圧縮と展開の実行を抑制することから、ファイルの圧縮と展開に費やす演算資源の浪費を抑制できる。
このように、ストレージ装置1は、運用負担を軽減して、演算資源を効率的に使用したデータ圧縮ができる。
[第2の実施形態]
次に、第2の実施形態のファイルサーバを備えるシステムについて図2を用いて説明する。図2は、第2の実施形態のファイルサーバのシステム接続例を示す図である。
ファイルサーバ10は、ネットワーク12を介して1または複数のサーバ11と通信可能に接続する。図2に示す接続例は、ファイルサーバ10がネットワーク12を介して2台のサーバ11a,11bに接続する。ネットワーク12は、LAN(Local Area Network)、またはWAN(Wide Area Network)などである。
ファイルサーバ10、ネットワーク12、およびサーバ11a,11bは、ファイルサーバシステムを構成する。ファイルサーバ10は、サーバ11a,11bに対してファイルサービスを提供する。ファイルサーバ10は、サーバ11からの書き込み要求に応じてストレージにデータを書き込み、サーバ11からの読み出し要求に応じてストレージからデータを読み出す。ファイルサーバ10は、データを集約化して多数のサーバ11のファイルサービスをサポートすることで、仮想化システムや、クラウドシステム、仮想化デスクトップの実現を支援する。
ファイルサーバ10は、大容量のストレージ(物理資源)を備えるストレージ装置であり、たとえば、NAS(Network Attached Storage)である。ファイルサーバ10は、ファイルシステムを管理する。ファイルサーバ10は、複数のHDDやSSDを束ねてRAID(Redundant Arrays of Inexpensive Disks)上にファイルシステムを構築しており、RAID制御とファイルシステム管理とをおこなう。ファイルサーバ10は、ファイルの圧縮と圧縮したファイルの展開とをおこない、ストレージを効率的に利用することができる。
次に、第2の実施形態のファイルサーバのハードウェア構成について図3を用いて説明する。図3は、第2の実施形態のファイルサーバのハードウェア構成例を示す図である。
ファイルサーバ10は、プロセッサ20、シリアルポート21、ワークメモリ22、ネットワーク制御部23、ストレージ制御部24、ストレージ25、不揮発性メモリ26、バス27を備える。ファイルサーバ10は、プロセッサ20によって装置全体が制御されている。プロセッサ20には、バス27を介して複数の周辺機器が接続されている。プロセッサ20は、マルチプロセッサであってもよい。プロセッサ20は、例えばCPU、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、またはPLD(Programmable Logic Device)である。またプロセッサ20は、CPU、MPU、DSP、ASIC、PLDのうちの2以上の要素の組み合わせであってもよい。
シリアルポート21は、外部制御端末装置13とのシリアルポート経由の通信を制御する。ネットワーク制御部23は、外部制御端末装置13とのネットワークポート経由の通信を制御する。ファイルサーバ10は、シリアルポート経由とネットワークポート経由の2系統で、外部制御端末装置13と通信可能に接続する。外部制御端末装置13は、ファイルサーバ10のメンテナンスをおこなうための端末装置であり、外部制御端末装置13によってファイルサーバ10の設定や操作をおこなうことができる。
ストレージ制御部24は、1または複数のストレージ25を制御する。ストレージ25は、データを格納可能な物理資源であり、HDDやSSDなどのストレージデバイスである。ストレージ25は、ファイルシステムやファイル管理領域、ファイルのデータなどを格納する。
ワークメモリ22は、たとえばRAMであって、ファイルサーバ10の主記憶装置として使用される。ワークメモリ22には、プロセッサ20に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、ワークメモリ22には、プロセッサ20による処理に必要な各種データが格納される。ワークメモリ22は、ストレージ25からデータを読み出したときにデータを保持するほか、ストレージ25にデータを書き込むときのバッファとなる。また、ワークメモリ22は、ストレージ25から読み出したファイルの管理情報を格納する。
不揮発性メモリ26は、ファイルサーバ10の電源遮断時において記憶内容を保持する。不揮発性メモリ26は、たとえば、EEPROM(Electrically Erasable Programmable Read-Only Memory)やフラッシュメモリなどの半導体記憶装置や、HDDなどである。また、不揮発性メモリ26は、ファイルサーバ10の補助記憶装置として使用される。不揮発性メモリ26には、OSのプログラムやファームウェア、アプリケーションプログラム、および各種データが格納される。
なお、ファイルサーバ10は、図示しない機器接続インタフェースを設けてもよい。機器接続インタフェースは、ファイルサーバ10に周辺機器を接続するための通信インタフェースである。たとえば機器接続インタフェースには、メモリ装置やメモリリーダライタを接続することができる。メモリ装置は、機器接続インタフェースとの通信機能を搭載した記録媒体である。メモリリーダライタは、メモリカードへのデータの書き込み、またはメモリカードからのデータの読み出しをおこなう装置である。メモリカードは、カード型の記録媒体である。
以上のようなハードウェア構成によって、第2の実施形態の処理機能を実現することができる。なお、第1の実施形態に示したストレージ装置1も、ファイルサーバ10と同様のハードウェアにより実現することができる。
ファイルサーバ10は、たとえばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第2の実施形態の処理機能を実現する。ファイルサーバ10(コンピュータ)に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。たとえば、ファイルサーバ10に実行させるプログラムを不揮発性メモリ26に格納しておくことができる。プロセッサ20は、不揮発性メモリ26内のプログラムの少なくとも一部をワークメモリ22にロードし、プログラムを実行する。またファイルサーバ10に実行させるプログラムを、メモリ装置、メモリカードなどの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、たとえばプロセッサ20からの制御により、不揮発性メモリ26にインストールされた後、実行可能となる。またプロセッサ20が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。またファイルサーバ10に実行させるプログラムを、通信可能に接続された外部制御端末装置13などの外部装置から送信することもできる。外部制御端末装置13から受信したプログラムは、たとえばプロセッサ20からの制御により、不揮発性メモリ26にインストールされた後、実行可能となる。
次に、第2の実施形態のファイルサーバのブロック構成について図4を用いて説明する。図4は、第2の実施形態のファイルサーバのブロック構成例を示す図である。
ファイルサーバ10は、RAID制御部31と、ファイルシステム制御部32と、重複排除制御部33と、データ記憶部34と、管理情報記憶部35と、データ再配置制御部36と、データ圧縮制御部37を備える。RAID制御部31は、複数のストレージ25をRAIDとして制御する。ファイルシステム制御部32は、ファイルシステムを制御する。重複排除制御部33は、ストレージ25に格納するデータの重複を排除(デデュープ)する重複排除機能を制御する。データ再配置制御部36は、ストレージ25に格納するデータの再配置をおこなうデータ再配置機能を制御する。データ圧縮制御部37は、ストレージ25に格納するデータの圧縮と展開をおこなうデータ圧縮機能を制御する。
ファイルサーバ10は、RAID制御部31、ファイルシステム制御部32、重複排除制御部33、データ再配置制御部36、およびデータ圧縮制御部37が各処理機能を実現するための制御手順(プログラム)を不揮発性メモリ26に格納する。ファイルサーバ10は、不揮発性メモリ26に格納された制御手順を必要に応じてワークメモリ22に展開する。
データ記憶部34は、データを記憶する。管理情報記憶部35は、管理情報を記憶する。データ記憶部34は、たとえば、ストレージ25により実現できる。管理情報記憶部35は、ストレージ25により実現できる。また、管理情報記憶部35は、ファイルサーバ10の起動時にストレージ25から管理情報を取得して格納することで、ワークメモリ22や不揮発性メモリ26によっても実現できる。
データ圧縮制御部37は、圧縮判定部38と、圧縮制御部39と、圧縮再判定決定部40とを備える。圧縮判定部38は、所定の実行契機にファイルの圧縮効果を評価してファイルの圧縮の可否を判定する。所定の実行契機は、新規ファイルの書き込み時、圧縮再判定決定部40による圧縮再判定の決定時などがある。圧縮制御部39は、管理情報記憶部35が記憶する管理情報を記録(更新)する。圧縮制御部39は、圧縮判定部38の判定結果を含めて管理情報を更新する。圧縮制御部39は、圧縮判定部38の判定結果がファイルの圧縮の可否を「可」とする場合にファイルを圧縮した圧縮データをデータ記憶部34に記憶させる。圧縮制御部39は、圧縮判定部38の判定結果がファイルの圧縮の可否を「否」とする場合にファイルを圧縮しない非圧縮データをデータ記憶部34に記憶させる。
これにより、ファイルサーバ10は、運用に対するユーザにかかる負担を軽減して効率的なデータ圧縮をおこなうことができる。また、ファイルサーバ10は、圧縮効果を評価できないファイルの圧縮と展開の実行を抑制することから、ファイルの圧縮と展開に費やす演算資源の浪費を抑制できる。
このように、ファイルサーバ10は、運用負担を軽減して、演算資源を効率的に使用したデータ圧縮ができる。
次に、第2の実施形態のファイル管理テーブルについて図5を用いて説明する。図5は、第2の実施形態のファイル管理テーブルの一例を示す図である。
ファイルサーバ10のファイルシステム制御部32は、ファイルを実際のデータ領域と、データを管理または制御するための管理領域とに分けて管理している。管理領域とデータ領域は、それぞれUNIX(登録商標)系ファイルシステムで用いられるinodeとデータブロックが知られている。
ファイルシステム制御部32は、ファイルに少なくとも1つのinodeを割り当てて管理情報を管理する。ファイルシステム制御部32は、inodeを参照することで、ファイルのメタデータを含む管理情報や、データの格納場所(データブロックのアドレス)を把握可能にしている。ファイルシステム制御部32は、ファイル管理の便宜上、inodeをワークメモリ22上で管理する。
inodeは、メタデータとして、ファイルシステム内でファイルを識別可能なinode番号(識別情報)、ファイルのサイズ、ファイルのタイムスタンプ、アクセス権限やアクセス属性などを保持する。ファイルサーバ10は、ファイルごとのメタデータをファイル管理テーブル100に保持する。ファイルサーバ10は、ファイル管理テーブル100をワークメモリ22に記憶する。
ファイル管理テーブル100は、ファイルの作成日時、最終更新日時、サイズ、圧縮の有無、非圧縮状態での更新回数、最終圧縮判定日時、最終圧縮日時を含む。作成日時は、ファイルの作成日時を示す情報である。最終更新日時は、ファイルの最終更新日時を示す情報である。サイズは、ファイルのサイズ(大きさ)を示す情報である。圧縮の有無は、ファイルの圧縮の有無を示す情報であり、ファイルが圧縮されていることを示す「有」、またはファイルが圧縮されていないことを示す「無」がある。非圧縮状態での更新回数は、ファイルが圧縮されていない状態で更新のあった回数を示す情報である。最終圧縮判定日時は、ファイルの圧縮の判定をおこなった最新の日時を示す情報である。圧縮の有無、非圧縮状態での更新回数、最終圧縮判定日時は、データ圧縮制御部37がファイルのデータ圧縮を効率的におこなうための制御情報である。最終圧縮日時は、データ圧縮制御部37がファイルの圧縮をおこなった最新の日時を示す情報である。
したがって、ファイルサーバ10は、従来のファイルシステムと同様にして、ファイルごとにデータ圧縮をおこなうための制御情報にアクセスできる。
次に、第2の実施形態のデータ書き込み処理について図6を用いて説明する。図6は、第2の実施形態のデータ書き込み処理のフローチャートを示す図である。
データ書き込み処理は、書き込み要求のあったデータを圧縮して、または非圧縮でストレージ25に格納する処理である。データ書き込み処理は、ファイルサーバ10がホスト(サーバ11)からのデータ書き込み要求を受け付けて実行する処理である。
[ステップS11]ファイルサーバ10のデータ圧縮制御部37は、書き込み要求のあったデータが新規ファイルであるか否かを判定する。ファイルシステム制御部32は、書き込み要求のあったデータが新規ファイルである場合にステップS14にすすみ、新規ファイルでない場合にステップS12にすすむ。
[ステップS12]データ圧縮制御部37は、圧縮再判定決定処理を実行する。圧縮再判定決定処理は、後述するステップS14で実行する圧縮判定処理の実行の要否を決定する処理である。すなわち、ファイルの状況の変化からファイルのデータ圧縮の是非を見直すタイミングを決定する処理である。圧縮再判定決定処理は、図10を用いて後で詳細に説明する。
[ステップS13]データ圧縮制御部37は、圧縮再判定決定処理が圧縮判定処理の実行(圧縮判定要)を決定した場合にステップS14にすすみ、圧縮再判定決定処理が圧縮判定処理の実行を否定した場合にステップS15にすすむ。
[ステップS14]データ圧縮制御部37は、圧縮判定処理を実行する。圧縮判定処理は、データ圧縮したファイルの圧縮効果を評価して、ファイルのデータ圧縮の是非を判定する処理である。データ圧縮制御部37は、ファイルのデータ圧縮をおこなうとした場合にデータ圧縮した圧縮ファイルをストレージ25に格納し、ファイルのデータ圧縮をおこなわないとした場合にデータ圧縮のない非圧縮ファイルをストレージ25に格納する。圧縮判定処理は、図8を用いて後で詳細に説明する。データ圧縮制御部37は、圧縮判定処理を実行してデータ書き込み処理を終了する。
[ステップS15]データ圧縮制御部37は、データ圧縮のない非圧縮ファイルをストレージ25に保存する。
[ステップS16]データ圧縮制御部37は、対象ファイルのファイル管理テーブル100の非圧縮状態での更新回数を1インクリメントして更新する。
[ステップS17]データ圧縮制御部37は、対象ファイルのファイル管理テーブル100の最終更新日時を更新する。
[ステップS18]データ圧縮制御部37は、対象ファイルのファイル管理テーブル100のサイズを更新してデータ書き込み処理を終了する。
これにより、ファイルサーバ10は、新規ファイルについてデータ圧縮したファイルの圧縮効果を評価して、圧縮ファイルまたは非圧縮ファイルをストレージ25に格納することができる。このように、ファイルサーバ10は、新規ファイルについて圧縮効果を評価してファイル圧縮の是非を決定するため、圧縮対象の選択をユーザ側に委ねることのない圧縮対象ファイルの適切な選択や、運用に対するユーザにかかる負担の軽減を図ることができる。また、ファイルサーバ10は、圧縮効果を評価できないファイルを非圧縮ファイルでストレージ25に格納するため、演算資源の浪費を抑制できる。
また、ファイルサーバ10は、更新ファイルについて圧縮効果を再評価する機会を設けることができる。これにより、ファイルサーバ10は、環境変化に追随してファイル圧縮の非効率の是正、運用に対するユーザにかかる負担の軽減、および演算資源の浪費の抑制をおこなうことができる。
次に、第2の実施形態のデータ読み出し処理について図7を用いて説明する。図7は、第2の実施形態のデータ読み出し処理のフローチャートを示す図である。
データ読み出し処理は、読み出し要求のあったデータをストレージ25から読み出して、必要に応じて展開する処理である。データ読み出し処理は、ファイルサーバ10がホスト(サーバ11)からのデータ書き込み要求を受け付けて実行する処理である。
[ステップS21]ファイルサーバ10のデータ圧縮制御部37は、読み出し要求のあったファイルをストレージ25から読み出す。
[ステップS22]データ圧縮制御部37は、対象ファイルのファイル管理テーブル100の圧縮の有無から、読み出し要求のあったファイルの圧縮の有無を判定する。データ圧縮制御部37は、読み出し要求のあったファイルの圧縮の有無が「有」であった場合にステップS23にすすみ、読み出し要求のあったファイルの圧縮の有無が「無」であった場合にデータ読み出し処理を終了する。
[ステップS23]データ圧縮制御部37は、読み出し要求のあったファイルが圧縮データであることから圧縮データを展開して、データ読み出し処理を終了する。
このように、ファイルサーバ10は、ファイルの圧縮効果があるファイルについて圧縮がされ、ファイルの圧縮効果がないファイルについて圧縮がされていないため、データ読み出し時の演算資源の浪費を抑制できる。
次に、第2の実施形態の圧縮判定処理について図8を用いて説明する。図8は、第2の実施形態の圧縮判定処理のフローチャートを示す図である。
圧縮判定処理は、データ圧縮したファイルの圧縮効果を評価して、ファイルのデータ圧縮の是非を判定する処理である。データ圧縮制御部37は、ファイルのデータ圧縮をおこなうとした場合にデータ圧縮した圧縮ファイルをストレージ25に格納し、ファイルのデータ圧縮をおこなわないとした場合にデータ圧縮のない非圧縮ファイルをストレージ25に格納する。圧縮判定処理は、ファイルサーバ10のデータ圧縮制御部37のうち圧縮判定部38がデータ書き込み処理のステップS14で実行する処理である。
[ステップS31]ファイルサーバ10の圧縮判定部38(データ圧縮制御部37)は、対象ファイルのデータ圧縮をおこなう。
[ステップS32]圧縮判定部38は、対象ファイルのファイル管理テーブル100の最終圧縮判定日時を更新する。
[ステップS33]圧縮判定部38は、対象ファイルのファイル管理テーブル100の最終更新日時を更新する。
[ステップS34]圧縮判定部38は、対象ファイルの圧縮効果を評価する。圧縮判定部38は、対象ファイルの圧縮前後のファイルサイズを比較して圧縮後のファイルサイズが圧縮前のファイルサイズと比較して減少していれば圧縮効果ありと評価する。一方、圧縮判定部38は、対象ファイルの圧縮前後のファイルサイズを比較して圧縮後のファイルサイズが圧縮前のファイルサイズと比較して変化なしまたは増大していれば圧縮効果なしと評価する。
[ステップS35]圧縮判定部38は、対象ファイルの圧縮効果の有無を判定する。圧縮判定部38は、対象ファイルの圧縮効果がある場合にステップS36にすすみ、対象ファイルの圧縮効果がない場合にステップS40にすすむ。
[ステップS36]圧縮判定部38は、対象ファイルのファイル管理テーブル100の圧縮の有無を「有」に更新する。
[ステップS37]圧縮判定部38は、対象ファイルの圧縮ファイルをストレージ25に保存する。
[ステップS38]圧縮判定部38は、対象ファイルのファイル管理テーブル100のサイズを圧縮ファイルのサイズに更新する。
[ステップS39]圧縮判定部38は、対象ファイルのファイル管理テーブル100の非圧縮状態での更新回数をリセットして、圧縮判定処理を終了する。
[ステップS40]圧縮判定部38は、対象ファイルのファイル管理テーブル100の圧縮の有無を「無」に更新する。
[ステップS41]圧縮判定部38は、対象ファイルの非圧縮ファイルをストレージ25に保存する。
[ステップS42]圧縮判定部38は、対象ファイルのファイル管理テーブル100のサイズを非圧縮ファイルのサイズに更新する。
[ステップS43]圧縮判定部38は、対象ファイルのファイル管理テーブル100の非圧縮状態での更新回数を1インクリメントして更新して、圧縮判定処理を終了する。
これにより、ファイルサーバ10は、データ圧縮したファイルの圧縮効果を評価して、圧縮効果を評価できるファイルを圧縮ファイルにしてストレージ25に格納することができる。このように、ファイルサーバ10は、圧縮効果を評価してファイル圧縮の是非を決定するため、ファイル圧縮の対象ファイルを適切に選択することができる。また、ファイルサーバ10は、運用に対するユーザにかかる負担の軽減を図ることができる。また、ファイルサーバ10は、圧縮効果を評価できないファイルを非圧縮ファイルでストレージ25に格納するため、演算資源の浪費を抑制できる。また、ファイルサーバ10は、圧縮判定処理の実行契機を限定(新規ファイルの書き込み時と、圧縮再判定決定処理による圧縮判定用の決定時)することにより、圧縮効果の評価にかかる演算資源の消費を抑制できる。また、ファイルサーバ10は、圧縮再判定決定処理に用いるパラメータ(最終圧縮判定日時、非圧縮状態での更新回数、サイズなど)を更新することにより、適宜に圧縮効果を再評価する機会を設けることができる。これにより、ファイルサーバ10は、環境変化に追随してファイル圧縮の非効率の是正、運用に対するユーザにかかる負担の軽減、および演算資源の浪費の抑制をおこなうことができる。
次に、第2の実施形態の設定テーブルについて図9を用いて説明する。図9は、第2の実施形態の設定テーブルの一例を示す図である。
設定テーブル110は、圧縮再判定決定処理に用いるパラメータとの比較に用いる閾値となる設定値を保持するデータテーブルである。設定テーブル110は、ワークメモリ22または不揮発性メモリ26に格納される。
設定テーブル110は、ファイルの更新回数、最終更新日時からの経過時間、更新ファイルサイズの差分、更新データ量、最終圧縮日時からの経過時間、圧縮率を含む。更新回数は、非圧縮状態での更新回数との比較に用いる閾値となる設定値であり、単位は回数である。最終更新日時からの経過時間は、ファイルの最終更新日時から現在時刻までの経過時間との比較に用いる閾値となる設定値であり、単位は時間である。更新ファイルの差分は、更新によって生ずるファイルサイズの差の比較に用いる閾値となる設定値であり、単位は割合(大きさの割合)である。更新データ量は、更新ファイルの更新データ量との比較に用いる閾値となる設定値であり、単位は大きさである。最終圧縮日時からの経過時間は、ファイルの最終圧縮日時から現在時刻までの経過時間との比較に用いる閾値となる設定値であり、単位は時間である。圧縮率は、圧縮ファイルサイズの圧縮率との比較に用いる閾値となる設定値であり、単位は割合である。
なお、設定テーブル110が保持する閾値は、あらかじめデフォルトの値を保持するが、ユーザの利用環境によって設定変更可能である。
次に、設定テーブル110が保持する設定値を用いた圧縮再判定決定処理について図10を用いて説明する。図10は、第2の実施形態の圧縮再判定決定処理のフローチャートを示す図である。圧縮再判定決定処理は、ファイルの状況の変化からファイルのデータ圧縮の是非を見直すタイミングを決定(圧縮判定処理の実行契機の決定)、つまり、圧縮判定処理の実行の要否を決定する処理である。圧縮再判定決定処理は、ファイルサーバ10のデータ圧縮制御部37のうち圧縮再判定決定部40がデータ書き込み処理のステップS12で実行する処理である。
[ステップS51]圧縮再判定決定部40は、対象ファイルのファイル管理テーブル100の圧縮の有無を参照して、対象ファイルの圧縮の有無を判定する。圧縮再判定決定部40は、対象ファイルの圧縮の有無が「有」であればステップS52にすすみ、対象ファイルの圧縮の有無が「無」であればステップS53にすすむ。
[ステップS52]圧縮再判定決定部40は、圧縮判定処理の実行を要とする圧縮判定要を決定して、圧縮再判定決定処理を終了する。
[ステップS53]圧縮再判定決定部40は、対象ファイルのファイル管理テーブル100の非圧縮状態での更新回数を1インクリメントする。
[ステップS54]圧縮再判定決定部40は、対象ファイルのファイル管理テーブル100の非圧縮状態での更新回数(管理情報)と、設定テーブル110の更新回数(設定値)を取得して比較する。圧縮再判定決定部40は、非圧縮状態での更新回数(管理情報)>更新回数(設定値)である場合にステップS55にすすみ、非圧縮状態での更新回数(管理情報)≦更新回数(設定値)である場合にステップS56にすすむ。圧縮再判定決定部40による非圧縮状態での更新回数(管理情報)と更新回数(設定値)の比較は、更新ファイルの更新回数の評価に相当する。
[ステップS55]圧縮再判定決定部40は、対象ファイルのファイル管理テーブル100の非圧縮状態での更新回数をリセットして、ステップS52にすすむ。
[ステップS56]圧縮再判定決定部40は、対象ファイルのファイル管理テーブル100の最終更新日時(管理情報)と、設定テーブル110の最終更新日時からの経過時間(設定値)と、現在時刻を取得する。圧縮再判定決定部40は、最終更新日時からの経過時間(現在時刻最終更新日時(管理情報))>最終更新日時からの経過時間(設定値)である場合にステップS52にすすむ。一方、圧縮再判定決定部40は、最終更新日時からの経過時間(現在時刻最終更新日時(管理情報))≦最終更新日時からの経過時間(設定値)である場合にステップS57にすすむ。圧縮再判定決定部40による最終更新日時からの経過時間(現在時刻最終更新日時(管理情報))と最終更新日時からの経過時間(設定値)との比較は、更新ファイルの最終更新日時からの経過時間の評価に相当する。
[ステップS57]圧縮再判定決定部40は、対象ファイルのファイル管理テーブル100のサイズ(管理情報)と、設定テーブル110の更新ファイルサイズの差分(設定値)を取得する。圧縮再判定決定部40は、{対象ファイルの更新後のサイズ(管理情報)−対象ファイルの更新前のサイズ}/対象ファイルの更新前のサイズ>更新ファイルサイズの差分(設定値)である場合にステップS52にすすむ。一方、圧縮再判定決定部40は、{対象ファイルの更新後のサイズ(管理情報)−対象ファイルの更新前のサイズ}/対象ファイルの更新前のサイズ≦更新ファイルサイズの差分(設定値)である場合にステップS58にすすむ。圧縮再判定決定部40による{対象ファイルの更新後のサイズ(管理情報)−対象ファイルの更新前のサイズ}/対象ファイルの更新前のサイズと更新ファイルサイズの差分(設定値)との比較は、更新ファイルの更新前後のファイルサイズの差分の評価に相当する。
[ステップS58]圧縮再判定決定部40は、対象ファイルのファイル管理テーブル100のサイズ(管理情報)と、設定テーブル110の更新データ量(設定値)を取得する。圧縮再判定決定部40は、対象ファイルの更新後のサイズ(管理情報)−対象ファイルの更新前のサイズ>更新データ量(設定値)である場合にステップS52にすすむ。一方、圧縮再判定決定部40は、対象ファイルの更新後のサイズ(管理情報)−対象ファイルの更新前のサイズ≦更新データ量(設定値)である場合にステップS59にすすむ。圧縮再判定決定部40による対象ファイルの更新後のサイズ(管理情報)−対象ファイルの更新前のサイズと更新データ量(設定値)との比較は、更新ファイルの更新データ量の評価に相当する。
[ステップS59]圧縮再判定決定部40は、対象ファイルのファイル管理テーブル100の最終圧縮日時(管理情報)と、設定テーブル110の最終圧縮日時からの経過時間(設定値)と、現在時刻を取得する。圧縮再判定決定部40は、最終圧縮日時からの経過時間(現在時刻最終圧縮日時(管理情報))>最終圧縮日時からの経過時間(設定値)である場合にステップS52にすすむ。一方、圧縮再判定決定部40は、最終圧縮日時からの経過時間(現在時刻最終圧縮日時(管理情報))≦最終圧縮日時からの経過時間(設定値)である場合にステップS60にすすむ。圧縮再判定決定部40による最終圧縮日時からの経過時間(現在時刻最終圧縮日時(管理情報))と最終圧縮日時からの経過時間(設定値)との比較は、更新ファイルの最終圧縮日時からの経過時間の評価に相当する。
[ステップS60]圧縮再判定決定部40は、ユーザからのデータ圧縮の指示の有無を判定する。圧縮再判定決定部40は、ユーザからのデータ圧縮の指示があればステップS52にすすみ、ユーザからのデータ圧縮の指示がなければステップS61にすすむ。
なお、ファイルサーバ10は、ユーザからのデータ圧縮の指示を、データの書き込み指示と併せて受け付けてもよいし、あらかじめ設定などにより予約を受け付けるものなどであってもよい。
[ステップS61]圧縮再判定決定部40は、圧縮判定処理の実行を不要とする圧縮判定不要を決定して、圧縮再判定決定処理を終了する。
このように、ファイルサーバ10は、対象ファイルの変化に応じて圧縮判定処理の実行契機を決定することができる。したがって、ファイルサーバ10は、対象ファイルの更新の都度に圧縮判定処理を実行することによる演算資源の浪費を抑制することができる。また、ファイルサーバ10は、対象ファイルの更新により、対象ファイルに変化が生じているにもかかわらず、これを放置してストレージ25の非効率な運用を見過ごすことを防止できる。また、ファイルサーバ10は、ストレージ25の効率的な利用と、演算資源の効率的利用を図りながらも、ユーザにかかる運用負担を軽減できる。また、ファイルサーバ10は、設定テーブル110の管理により、ユーザの利用環境に適合する設定をおこなうことができる。
[第2の実施形態の変形例]
第2の実施形態の圧縮判定処理において、圧縮判定部38は、対象ファイルの圧縮前後のファイルサイズを比較して圧縮後のファイルサイズが圧縮前のファイルサイズと比較して減少していれば圧縮効果ありと評価した。
第2の実施形態の変形例は、圧縮後のファイルサイズが圧縮前のファイルサイズと比較して減少していても、設定テーブル110の圧縮率に達していない場合、圧縮効果ありと評価しない点で異なる。
したがって、第2の実施形態の変形例においては、圧縮判定部38は、対象ファイルの圧縮後のファイルサイズ/圧縮前のファイルサイズと圧縮率(設定値)を比較して圧縮効果を評価する。すなわち、圧縮判定部38は、圧縮後のファイルサイズ/圧縮前のファイルサイズ<圧縮率(設定値)の場合に圧縮効果ありと評価する。一方、圧縮判定部38は、圧縮後のファイルサイズ/圧縮前のファイルサイズ≧圧縮率(設定値)の場合に圧縮効果なしと評価する。
これにより、ファイルサーバ10は、ストレージ25の一層の効率的な利用と、演算資源の一層の効率的利用を図ることができる。また、ストレージ25の残容量が十分な場合は、ストレージ25の効率的な利用への要請が小さくなることから演算資源の有効活用を優先して圧縮効果の大きな圧縮率(設定値)を設定することができる。また、ストレージ25の残容量が十分でない場合は、ストレージ25の効率的な利用への要請が大きくなることから演算資源の有効活用を軽視して圧縮効果の小さな圧縮率(設定値)を設定することができる。また、演算資源が十分な場合は、演算資源の有効活用を軽視して圧縮効果の小さな圧縮率(設定値)を設定することができる。また、演算資源が十分でない場合は、演算資源の有効活用を優先して圧縮効果の大きな圧縮率(設定値)を設定することができる。
以上、ストレージ装置1、ファイルサーバ10を例示して説明したが、その他の情報処理装置においても適用可能である。また、ストレージ制御部24が圧縮制御をおこなうものであってもよいし、ファイルサーバ10のプロセッサ20と圧縮制御を分担するものであってもよい。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、ストレージ装置1、ファイルサーバ10、ストレージ制御部24が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD、DVD−RAM、CD−ROM/RWなどがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
プログラムを流通させる場合には、たとえば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
また、上記の処理機能の少なくとも一部を、DSP、ASIC、PLDなどの電子回路で実現することもできる。
1 ストレージ装置
2,34 データ記憶部
3,35 管理情報記憶部
4,38 圧縮判定部
5,39 圧縮制御部
6 ファイルA
6a ファイルA(圧縮)
6b ファイルA(圧縮否)
6c ファイルA(非圧縮)
7 ファイルB
7a,7c ファイルB(圧縮)
7b ファイルB(圧縮可)
10 ファイルサーバ
11,11a,11b サーバ
12 ネットワーク
13 外部制御端末装置
20 プロセッサ
21 シリアルポート
22 ワークメモリ
23 ネットワーク制御部
24 ストレージ制御部
25 ストレージ
26 不揮発性メモリ
31 RAID制御部
32 ファイルシステム制御部
33 重複排除制御部
36 データ再配置制御部
37 データ圧縮制御部
40 圧縮再判定決定部
100 ファイル管理テーブル
110 設定テーブル

Claims (9)

  1. ファイルのデータを記憶するデータ記憶部と、
    前記ファイルの更新回数を含む管理情報を記憶する管理情報記憶部と、
    前記管理情報に含まれる前記更新回数とあらかじめ設定する設定値との比較にもとづいて実行契機を決定する実行契機決定部と、
    前記決定した実行契機において、前記ファイルの圧縮効果を評価して前記ファイルの圧縮の可否を判定する圧縮判定部と、
    前記判定の結果を含めて前記管理情報を更新するとともに、前記判定の結果が前記ファイルの圧縮を可とする場合に前記ファイルを圧縮した圧縮データを前記データ記憶部に記憶させ、前記判定の結果が前記ファイルの圧縮を否とする場合に前記ファイルを圧縮しない非圧縮データを前記データ記憶部に記憶させる圧縮制御部と、
    を備えることを特徴とするストレージ装置。
  2. 前記圧縮判定部は、前記データ記憶部が新規ファイルのデータを記憶する場合、前記新規ファイルの圧縮の可否を判定することを特徴とする請求項1記載のストレージ装置。
  3. ファイルのデータを記憶するデータ記憶部と、
    前記ファイルの更新タイミングを含む管理情報を記憶する管理情報記憶部と、
    前記管理情報に含まれる前記更新タイミングからの経過時間とあらかじめ設定する設定値との比較にもとづいて実行契機を決定する実行契機決定部と、
    前記決定した実行契機において、前記ファイルの圧縮効果を評価して前記ファイルの圧縮の可否を判定する圧縮判定部と、
    前記判定の結果を含めて前記管理情報を更新するとともに、前記判定の結果が前記ファイルの圧縮を可とする場合に前記ファイルを圧縮した圧縮データを前記データ記憶部に記憶させ、前記判定の結果が前記ファイルの圧縮を否とする場合に前記ファイルを圧縮しない非圧縮データを前記データ記憶部に記憶させる圧縮制御部と、
    を備えることを特徴とするストレージ装置。
  4. ファイルのデータを記憶するデータ記憶部と、
    前記ファイルのサイズを含む管理情報を記憶する管理情報記憶部と、
    前記ファイルの更新前後のサイズの差分とあらかじめ設定する設定値との比較にもとづいて実行契機を決定する実行契機決定部と、
    前記決定した実行契機において、前記ファイルの圧縮効果を評価して前記ファイルの圧縮の可否を判定する圧縮判定部と、
    前記判定の結果を含めて前記管理情報を更新するとともに、前記判定の結果が前記ファイルの圧縮を可とする場合に前記ファイルを圧縮した圧縮データを前記データ記憶部に記憶させ、前記判定の結果が前記ファイルの圧縮を否とする場合に前記ファイルを圧縮しない非圧縮データを前記データ記憶部に記憶させる圧縮制御部と、
    を備えることを特徴とするストレージ装置。
  5. ファイルのデータを記憶するデータ記憶部と、
    前記ファイルの圧縮タイミングを含む管理情報を記憶する管理情報記憶部と、
    前記管理情報に含まれる前記圧縮タイミングからの経過時間とあらかじめ設定する設定値との比較にもとづいて実行契機を決定する実行契機決定部と、
    前記決定した実行契機において、前記ファイルの圧縮効果を評価して前記ファイルの圧縮の可否を判定する圧縮判定部と、
    前記判定の結果を含めて前記管理情報を更新するとともに、前記判定の結果が前記ファイルの圧縮を可とする場合に前記ファイルを圧縮した圧縮データを前記データ記憶部に記憶させ、前記判定の結果が前記ファイルの圧縮を否とする場合に前記ファイルを圧縮しない非圧縮データを前記データ記憶部に記憶させる圧縮制御部と、
    を備えることを特徴とするストレージ装置。
  6. 前記圧縮判定部は、前記ファイルの圧縮前後のファイルサイズを比較して圧縮後のファイルサイズが圧縮前のファイルサイズに対してあらかじめ定めた圧縮率に達していれば圧縮効果ありと評価することを特徴とする請求項1乃至請求項のいずれか1つに記載のストレージ装置。
  7. 前記圧縮判定部は、前記ファイルの圧縮前後のファイルサイズを比較して圧縮後のファイルサイズが圧縮前のファイルサイズと比較して減少していれば圧縮効果ありと評価することを特徴とする請求項1乃至請求項のいずれか1つに記載のストレージ装置。
  8. 前記圧縮制御部は、前記ファイルのアクセス要求を受け付けて前記管理情報に含まれる前記判定の結果と、前記データ記憶部が記憶する前記データとを読み出して、前記判定の結果が前記ファイルの圧縮を可とする場合に前記データを展開することを特徴とする請求項1乃至請求項のいずれか1つに記載のストレージ装置。
  9. ファイルのデータを記憶するデータ記憶部と、前記ファイルの更新回数を含む管理情報を記憶する管理情報記憶部と、を備えるコンピュータが実行するデータ圧縮方法であって、
    前記コンピュータが、
    前記管理情報に含まれる前記更新回数とあらかじめ設定する設定値との比較にもとづいて実行契機を決定し、
    前記決定した実行契機において、前記ファイルの圧縮効果を評価して前記ファイルの圧縮の可否を判定し、
    前記判定の結果を含めて前記管理情報を更新するとともに、前記判定の結果が前記ファイルの圧縮を可とする場合に前記ファイルを圧縮した圧縮データを前記データ記憶部に記憶させ、前記判定の結果が前記ファイルの圧縮を否とする場合に前記ファイルを圧縮しない非圧縮データを前記データ記憶部に記憶させる、
    処理を実行することを特徴とするデータ圧縮方法。
JP2013003910A 2013-01-11 2013-01-11 ストレージ装置、およびデータ圧縮方法 Active JP6011349B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013003910A JP6011349B2 (ja) 2013-01-11 2013-01-11 ストレージ装置、およびデータ圧縮方法
US14/098,658 US9684665B2 (en) 2013-01-11 2013-12-06 Storage apparatus and data compression method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013003910A JP6011349B2 (ja) 2013-01-11 2013-01-11 ストレージ装置、およびデータ圧縮方法

Publications (2)

Publication Number Publication Date
JP2014135699A JP2014135699A (ja) 2014-07-24
JP6011349B2 true JP6011349B2 (ja) 2016-10-19

Family

ID=51166010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013003910A Active JP6011349B2 (ja) 2013-01-11 2013-01-11 ストレージ装置、およびデータ圧縮方法

Country Status (2)

Country Link
US (1) US9684665B2 (ja)
JP (1) JP6011349B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844766A (zh) * 2017-02-23 2017-06-13 郑州云海信息技术有限公司 一种压缩文件解压的方法以及装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015115652A (ja) * 2013-12-09 2015-06-22 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
CN106933494B (zh) * 2015-12-31 2019-10-18 伊姆西公司 混合存储设备的操作方法和装置
US11100156B2 (en) * 2016-06-20 2021-08-24 David Klausner System and method for determining an origin of and identifying a group for digital content items
KR102611638B1 (ko) 2016-09-27 2023-12-08 삼성전자주식회사 스토리지 장치의 동작 방법 및 스토리지 장치를 포함하는 데이터 저장 시스템
JP6794782B2 (ja) * 2016-11-02 2020-12-02 富士通株式会社 情報処理装置、情報処理プログラム、及び情報処理方法
US11119681B2 (en) * 2018-04-28 2021-09-14 Hewlett Packard Enterprise Development Lp Opportunistic compression
US11146663B2 (en) * 2019-07-18 2021-10-12 EMC IP Holding Company LLC Facilitating improved overall performance of remote data facility replication systems
JP2022075261A (ja) * 2020-11-06 2022-05-18 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
US11977525B2 (en) * 2021-03-04 2024-05-07 EMC IP Holding Company LLC Method to optimize ingest in dedupe systems by using compressibility hints

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3704483B2 (ja) * 1992-10-22 2005-10-12 日本電気株式会社 ファイル圧縮処理装置
JPH06324925A (ja) 1993-05-13 1994-11-25 Hitachi Ltd データ圧縮機能付ファイルシステム
JP3216606B2 (ja) * 1998-07-13 2001-10-09 日本電気株式会社 ファイル圧縮管理方法
US7538694B2 (en) * 1999-01-29 2009-05-26 Mossman Holdings Llc Network device with improved storage density and access speed using compression techniques
JP2000358144A (ja) 1999-06-17 2000-12-26 Canon Inc 画像入出力システム及びその制御方法
US6802031B2 (en) * 2001-05-24 2004-10-05 International Business Machines Corporation Method and apparatus for increasing the effectiveness of system debug and analysis
US7065588B2 (en) * 2001-08-10 2006-06-20 Chaavi, Inc. Method and system for data transformation in a heterogeneous computer system
JP3857611B2 (ja) 2002-05-20 2006-12-13 富士通株式会社 データ圧縮プログラム、データ圧縮方法、およびデータ圧縮装置
JP2004258861A (ja) * 2003-02-25 2004-09-16 Canon Inc 情報処理方法
US20050219076A1 (en) * 2004-03-22 2005-10-06 Michael Harris Information management system
US8751616B2 (en) * 2004-06-08 2014-06-10 Siemens Industry, Inc. System for accessing and browsing a PLC provided within a network
US7873782B2 (en) * 2004-11-05 2011-01-18 Data Robotics, Inc. Filesystem-aware block storage system, apparatus, and method
EP1842140A4 (en) * 2005-01-19 2012-01-04 Truecontext Corp APPLICATIONS BASED ON MOBILE FORMS ORDERED BY RULES
US20070271046A1 (en) * 2006-05-16 2007-11-22 Texas Instruments Incorporated Scheme for improving bandwidth by identifying specific fixed pattern sequences as header encoding followed by the pattern count
JP5217155B2 (ja) * 2006-11-17 2013-06-19 日本電気株式会社 ファイル圧縮自動判定方式および方法、並びに、プログラム
US8484214B2 (en) * 2007-03-28 2013-07-09 Cisco Technology, Inc. Record compression using incremental reverse templating
US7952499B1 (en) * 2010-01-29 2011-05-31 Microsoft Corporation Random access in run-length encoded structures
JP2011215986A (ja) * 2010-04-01 2011-10-27 Hitachi Solutions Ltd ファイル圧縮管理システム
US8326811B2 (en) * 2010-10-26 2012-12-04 Hitachi, Ltd. File management method and computer system
US8566336B2 (en) * 2011-03-30 2013-10-22 Splunk Inc. File identification management and tracking
EP2724278B1 (en) * 2011-06-21 2020-09-16 Illumina Cambridge Limited Methods and systems for data analysis
EP2637148B1 (en) * 2012-03-08 2022-06-01 LTG Rastatt GmbH Transportation system arrival and departure time calculation and display system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844766A (zh) * 2017-02-23 2017-06-13 郑州云海信息技术有限公司 一种压缩文件解压的方法以及装置

Also Published As

Publication number Publication date
US9684665B2 (en) 2017-06-20
US20140201175A1 (en) 2014-07-17
JP2014135699A (ja) 2014-07-24

Similar Documents

Publication Publication Date Title
JP6011349B2 (ja) ストレージ装置、およびデータ圧縮方法
US10474397B2 (en) Unified indirection in a multi-device hybrid storage unit
JP5955870B2 (ja) 仮想ディスクの最適圧縮のための方法、コンピュータ可読記憶媒体及びシステム
US9256542B1 (en) Adaptive intelligent storage controller and associated methods
JP5445463B2 (ja) 計算機システム、データ保存方法およびプログラム
US20130282997A1 (en) Computer system, storage apparatus and data transfer method
JP5944502B2 (ja) 計算機システム及び制御方法
US9778927B2 (en) Storage control device to control storage devices of a first type and a second type
US8850148B2 (en) Data copy management for faster reads
US20110191555A1 (en) Managing copy-on-writes to snapshots
KR20140060308A (ko) 사용 비트맵을 갖는 저장 장치에 대한 효율적 액세스 기법
EP3364303B1 (en) Data arrangement method, storage apparatus, storage controller and storage array
US20160196085A1 (en) Storage control apparatus and storage apparatus
US20100306484A1 (en) Heterogeneous storage array optimization through eviction
US20210374107A1 (en) Distributed file system and distributed file managing method
KR20220134769A (ko) 온도 기반 데이터 저장 처리
JP6582721B2 (ja) 制御装置、ストレージシステム、及び制御プログラム
US10089125B2 (en) Virtual machines accessing file data, object data, and block data
US9778870B2 (en) Power management for a distributed storage system accessible by a cluster in a virtualized computing environment
US10324660B2 (en) Determining whether to compress data prior to storage thereof
US20180307565A1 (en) Storage control apparatus and storage control method
JP2008257584A (ja) Ramディスクの処理方法及びシステム
US11797208B2 (en) Backend deduplication awareness
US20230214142A1 (en) System configuration management device, system configuration management method, and system configuration management program
JP5287374B2 (ja) ストレージシステム、領域回収方法及び領域回収プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160905

R150 Certificate of patent or registration of utility model

Ref document number: 6011349

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150