JPH04505979A

JPH04505979A - 圧縮データ・アクセス

Info

Publication number: JPH04505979A
Application number: JP3503453A
Authority: JP
Inventors: バン・マーレン，デイビッド
Original assignee: ヒューレット・パッカード・リミテッド
Priority date: 1990-01-19
Filing date: 1991-01-18
Publication date: 1992-10-15
Anticipated expiration: 2016-11-05
Also published as: EP0464191B1; WO1991010999A1; US5298895A; DE69118250D1; EP0464191A1; JP3224813B2; DE69118250T2

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】ｍ−・ア　セス本発明は、圧縮データへのアクセスを改善するやり方で、テープへの記憶のため、ユーザ・データを圧縮する方法に関する。ホストからデータが到達したとき、それをテープに書き込む前に圧縮してテープ記憶容量を増大させるために、データ圧縮能力を有するテープ・ドライブ（ＤＣドライブ）を備えることが知られている。ＤＣドライブは、テープから圧縮データを読み取り、ホストに送る前にデータを復元する（ｄｅｃｏａ＋ｐｒｅｓｓ）こともできる。ホストは、また、ユーザ・データのソフトウェア圧縮および／または復元をすることもできる。２つ以上のタイプのデータ圧縮がある。例えば、指定レコード、ファイルなどの分離マークをデータストリームから除去して、該マークの位置に関する情報をインデックスに記憶することにより、ユーザ・データを効率的に圧縮する。別の全く異なるアプローチでは、データの冗長性を除去することにより、例えば、ユーザ・データ・ワードを、元のデータを回復することのできるコード・ワードまたは記号と置き換えることにより、ユーザ・データを圧縮する。用語“データ圧縮 “または略号ＤＣを用いるとき、本書で言及されるのは後者のタイプである。データを圧縮するための幾つかの異なるアルゴリズムが知られている。あるアプローチでは、データを圧縮するときに動的に作成される辞書（ｄｉｃｔｉｏｎａｒｙ）を用いて、ユーザ・データをコード・ワードに変換する。辞書は、復元中に、再び動的に、再生成される。このアプローチヲ用イルアルコリスムハ、ＬＥＭＰＥＬ　ＺＩＶ　ＷＥＬＣＨフルゴリズムまたはＬＺＷアルゴリズムである。データ圧縮中、ＬＺＷアルゴリズムに従って動作するＤＣドライブは、新しい辞書がいつスタートされるか（ＲＥＳＥＴコード・ワード）、およびデータがいつフラッシュされるか、すなわち、バッファに保持された、圧縮を待つ小量のデータが、それ以上の入力データが該バッファに送られる前にいつ送られるか（ＦＬＵＳＨコード・ワード）を示すコード・ワードをデータストリームに挿入する。ＬＺＷアルゴリズムを用いて、テープ上の圧縮データの一部の復元を達成するため、関連辞書を再生成することができるようにするのにＲＥＳＥＴコード・ワードから復元を開始することが必要である。一般に、新しい辞書を、データの便宜的なポイント、例えばレコードのはじめにおいてスタートすることができるように、新しい辞書を始める前にＦＬＵＳＨ操作が行われる。データ圧縮の別のアプローチでは、選択された量の最新非圧縮データストリーム（′　ヒストリ・バッファ°または′スライディング・ウィンドウ゛または゛スライディング辞書゛と呼ばれる）を参照し、ヒストリ・バッファに現れる入力データストリームの項目を、ヒストリ・バッファの中のどこに位置するのかを示すコード・ワード／トークンと置き換える。このアプローチは、第−Ｌｅｍｐｅｌ　ＺｉｖアルゴリズムまたはＬＺＩとして知られている。復元中に、ヒストリ・バッファも参照され、コード・ワード／トークンに遭遇すると、ヒストリ・バッファからの関連ストリングが置き換えられて、元のデータストリームが再構成される。このアプローチでは、ＲＥＳＥＴコマンドにはヒストリ・バッファをクリアする作用があり、ＦＬＵＳＨコマンドにはルックアヘッド・バッファをクリアする作用がある。したがって、フラッシュ操作は一般に、比較的わずかな生データを通したり、またはデータストリームの便宜的なポイントにおいてデータ圧縮を再開する前に、圧縮を待っているデータにおいて圧縮操作を完了させるものと考えることができる。これは、ソフトウェアまたはハードウェアにより圧縮が行われる場合でも適用される。本発明に依れば、下記のステップを備えた、ユーザ・データをテープ上に記憶するための圧縮方法が提供される：すなわち、複数のレコードに構成されたユーザ・データ・ワードのストリームを受信するためのステップと：該データから得られる辞書を用いて、ユーザ・データの少なくとも一部をコード・ワードに変換することを含む圧縮アルゴリズムに従って前記ユーザ・データを圧縮するステップと：を備え、開始連続辞書間で複数のフラッシュ動作を実行することにより特徴づけられる。本書では、用語゛　コード・ワード°は、ＬｚＷアルゴリズムとともに広く用いられる。一般に、この用語は、いずれかの記号またはトークン、またはデータ圧縮中にユーザ・データの一部を置き換えるために用いる他の表記を扱うために意図されている。用語°辞書′は、バイト・ストリングの集まりおよび圧縮データを非圧縮データに変換する際に用いるための対応するコード・ワードを扱うように意図されている。すでに述べたデータ圧縮アルゴリズムのいずれにおいても、辞書は、データ圧縮中に生成され、圧縮データ自体に含まれている。本発明の利点は、辞書を作るために用いる量よりも少ないデータのセグメントを、その圧縮された形式のテープから選択的に回復することができることである。言い換えれば、辞書内のＦＬＵＳＨコード・ワードは、コンパイルするために用いたり、または該辞書を用いるところの、データのセグメント間に“クリーン・ブレーク（ｃｌｅａｎｂｒｅａｋ）”をもたらすことである。たとえば、ＦＬＵＳＨコート・ワードは、各レコードの終わりにおいてデータストリームに挿入することができる。該方法は、ユーザ・データと区別することができるような方法で、フラッシュ動作が起きた位置の表示を、モータ上に記憶することを含むことが望ましい。この特徴を実施する１つの方法は、各レコードに関する圧縮バイト・カウント（ＣＢＣ）　、または１対のＦＬＵＳＨ動作問で定義される他のデータ・セグメントを記憶することである。該方法は、ユーザ・データと区別することができるような方法で、新しい辞書の始めの位置の表示を、テープに記憶することを含むことが望ましい。この特徴を実施する１つの方法は、各折しい辞書の始めに用いられる特定圧縮アルゴリズムについての情報をテープに記憶することである。説明するある実施例では、該方法は、ユーザ・データのレコード構造とは無関係に、圧縮ユーザ・データを複数のグループとしてテープに書き込み、各グループの始めまたはその近くで新しい辞書を始めることを含む。該方法は、各グループの最初の新しいレコードの始めにおいて新しい辞書を始めることを含むことが望ましい。この特徴は、データ・グループの間のリンケージを減らすことによりデバイス・コントローラで要求されるバッファ・スペースの量を減少させる一部になること、すなわち２つ以上のデータ・グループをバッファに記憶するために必要とする可能性を少なくするという点である。さらに、該グループのデータ・セグメントを復元するために、特定グループの外側を見る必要のないことも利点である。説明する別の実施例では、方法は、ユーザ・データ・レコードを、１つのエンティティが１つ以上のレコードを含む複数のエンティティに組織し、各エンティティの終わりでフラッシュ動作を実行することを備えている。この特徴により、１つのエンティティ毎にデータを選択的に復元することができる。さらに、この方法は、すでに述べた理由により、各グループの最初の新しいエンティティの始めにおいて新しい辞書を始めることを含むことができる。本発明は、さらに前に定義したような方法に従って動作する、ユーザ・データを圧縮したり、圧縮ユーザ・データをテープに記憶するための記憶装置を機供する。本発明の特定の実施例を、添付の図面を参照して、−例としてここに記述する。第八図及び第８図は、ＬＺＷデータ圧縮アルゴリズムに関する図である。第Ｃ図はＬＺＩアルゴリズムに従って使用されるバッファの図式的表現図である。第り図はＲＩＮＴＴＮＴＩＮがＬＺ１アルゴリズムに従ってどのように圧縮されるかを示す図表である。第１図はコンピュータ・データを記憶する構成を示す複部分図であって、（ａ）はユーザ（ホスト）によってデータ記憶装置に送られる論理的分離マーク及びデータ・レコードのシーケンスを表す図である。（ｂ）及び（Ｃ）は、第１図（ａ）のシーケンスをテープ上に記憶する２つの異なる構成を示す図である。第２図はグループ・インデックスの図である。第３図及び第３Ａ図は、一般のブロック・アクセス・テーブル図である。第４図及び第４Ａ図は特定のブロック・アクセス・テーブル図である。第５図乃至第７図はコンピュータ・データを記憶するさらなる構成図である。第８図はグループのブロック・アクセス・テーブルに関する可能な有効エントリ（ｅｎｔｒｙ　）を示す図である。第９図及び第１０図は、コンピュータ・データを記憶する構成のさらなる図である。第１１図は、ヘリカル走査を用い、本発明を具現化するデータ記憶装置の部分を形成するテープ・デツキの主な物理的コンポーネントを示す図である。第１２図はヘリカル走査を使ってテープ上に記録された２つのデータ・トラックの図式的表現図である。第１３図は本データ記憶方法に従って記録されたデータ・トラックの主なデータ領域のフォーマットの図式的表現図である。第１４図は本発明のデータ記憶方法に従って記録されたデータ・トランクのサブ・データ領域のフォーマットの図式的表現図である。第１５図は、本方法、すなわちデータ領域内のグループにおけるデータ・フレームの構成及び各グループのフレームに記録されたインデックスの詳細の両方を示す図である。第１６図は本発明を具現化するデータ記憶装置の主なコンポーネントのブロック図である。第１７図及び第１８図はデータ圧縮プロセッサに関するブロック図である。第１９図はデータ記憶装置のグループ・プロセッサの、より詳細な機能ブロック図である。第２０Ａ図及び第２０Ｂ図は、テープ上の特定のレコードに関する探索において、ドライブ装置により実施されるアルゴリズムの流れ図である。特定のＤＣアルゴリズムの詳細を含むデータ圧縮に関するさらなる情報がまず与えられる。データ圧縮プロセスの目的は、データから冗長性を除去することにある。圧縮効率の測度の１つは、“圧縮比”と呼ばれ、′−れ　の圧縮される入力の長さとして定義される。これは、データ圧縮プロセスの達成測度である。圧縮比が大きくなれば、圧縮効率もそれだけ高くなる。データ圧縮を実施する方法の１つでは、入力文字のパターンを認識して、コート化する、すなわち、置換方法が用いられる。ＬＺＷアルゴリズムによれば、独特なストリングをなす入力文字が見つかると、それらは辞書に入力され、数値が割り当てられる。辞書は、データの圧縮時に、動的に形成され、復元時に、データから再生成される。一旦、辞書エントリが存在すると、データ・ストリーム内にその後に発生する該エントリは、数値またはコード・ワードに置き換えることができる。留意すべきは、このアルゴリズムは、ＡＳＣＩＩテキスト・データの圧縮に制限されるものではないという点である。その原理は、２進フアイル・データ・ベース、イメージング・データ等にも等しく当てはまる。各辞書エントリは、２つの項目、すなわち、（１）アルゴリズムがデータ内で見つけた独特なストリングをなすデータ・バイトと、（２）このバイトの組合せを表わしたコード・ワードから構成される。辞書には、４０９６までのエントリを納めることができる。第１の８つのエントリは、特定の条件のフラグを立て、その制御を行なうために用いられる予約コード・ワードである。次の２５６のエントリには、０〜２５５のバイト値が含まれている。従って、これら２５６の項目のい（つかは、ＡＳＣＩＩテキスト文字に関するコード・ワードである。残りの位置は、他の辞書位置を指示し、結局は、バイト値０〜２５５の１つを指示することによって終了する連係リスト・エントリである。この連係リスト・データを用いることによって、可能性のあるバイトの組合せは、２バイト〜１２８バイトの長さの範囲内になるので、その記憶に過剰に広いメモリ・アレイを用いなくてもすむようにすることができる。さらに詳細に後述するハードウェアの実施案の場合、辞書は、構築してから、２３ピツト幅のランダム・アクセス・メモリ（ＲＡＭ）のハングに記憶される。各メモリ・アドレスには、下位８ビツトによるバイト値、次の１２ビツトによるエントリを表わすコード・ワードまたはポインタ、及び、上位３ビツトによる３つの条件フラグを含むことができる。コード・ワードを表わすのに用いられる出力バイト・ストリームにおけるビット数は、９ビツト〜１２ビツトの範囲であり、０〜４０９５の範囲の辞書エントリに対応する。辞書構築段階において、辞書に５１２のエントリが作成されるまで、各コード・ワード毎に、９ビツトが用いられ、５１２番目のエントリの後は、コード・ワードに１０ピツトが用いられ、１０２４番目のエントリの後は、コード・ワードに１１ビツトが用いられ、最後の２０４８エントリについては、コード・ワードに１２ビツトが用いられる。辞書が満杯になると、それ以上のエントリは、作成されず、後続の全てのコード・ワードは、長さが１２ビツトになる。任意の辞書エントリに関するメモリ・アドレスは、エントリ値に対して複雑な操作を施すことによって決定される。辞書には、４０９６のエントリを納めることができるので、辞書全体の支援には、４にバイトのＲＡＭｔ、か必要ないように思われる。これは、実際、復元時にはあてはまることである。しかし、圧縮時には、辞書の構築段階において生じる辞書の“ 衝突”のため、４にバイトを超えるＲＡＭが必要になる。これは、２つの異なるストリング／文字の組合せが、辞書ＲＡＭ内における同じ場所にマツピングが施される場合があり、辞書ＲＡＭにおける資源は有限であることと、圧縮時における辞書構築のプロセスが複雑であるためである。辞書の衝突か生じると、２つの衝突値が、２つの新しい位置について再計算され、もとの位置に衝突位置のフラグが立てられる。アルゴリズムの重要な特性は、圧縮と復元との結合である。これら２つの動作は、圧縮及び復元プロセス時と、バイト・ストリームに対するコード・ワードのバッキング及びアンバッキング時の両方において結びつけられる。圧縮アルゴリズムの特性により、圧縮プロセスと復元プロセスを同期させることが必要になる。別の言い方をすると、復元は、圧縮データの任意のポイントから開始させることはできない。復元は、辞書が空またはリセットされていることが分っているポイントから開始する。この結合によって、アルゴリズムの基本的な利点の１つが得られる。すなわち、辞書は、コード・ワードに組み込まれているので、圧縮データと共に転送する必要はない。同様に、バッキングとアンバッキングのプロセスも同期させなければならない。復元ハードウェアに対して圧縮データを適正な順序で提示しなければならない点に留意のこと。第八図は、上述の圧縮アルゴリズムに関する略グラフィック図である。この例には、次の文字から成る入力データ・ストリームが示されている：　ＲＩ　ＮＴ　Ｉ　ＮＴ　Ｉ　Ｎ０圧縮プロセスの流れをたどるには、第八図を上から下へ検分し、左から始めて右へ進めるのが望ましい。辞書は、リセットされ、８つの予約コード・ワード、及び、全てのＡＳＣＩＩ文字に関するコード・ワードを含む０〜２５５の第１の２５６エントリを納めるように初期設定されているものと仮定する。圧縮アルゴリズムは、データ・ストリーム内の各バイト毎に下記のプロセスを実行する：１、入力バイトを取る。２、現在の入力シーケンスに関して辞書の探索を行ない、一致すれば、別の入力バイトを取り、現在のシーケンスに加え、一致した最大のシーケンスを記憶しておく。３、一致するものがなくなるまで、ステップ２を繰り返す。４、現在の“不一致”シーケンスの新辞書エントリを作成する。５、一致した最大シーケンスに関するコード・ワードを出力する。この例では、圧縮アルゴリズムは、圧縮エンジンが最初のＲを受け取った後、開始する。入力文字Ｒは、その初期設定時に納められた文字Ｒに一致する。一致したので、ＤＣエンジンは、別のハイドを受け取るが、これは文字Ｉである。次に、シーケンスＲＩをめて辞書の探索を行なうが、一致するものは見あたらない。従って、新しい辞書エントリはＲＩか作成され、最大の一致シーケンスに関するコード・ワード（すなわち、文字Ｒに関するコード・ワード）が、出力される。次に、ＤＣエンジンは、■をめて辞書を探索し、Ｒの場合とちょうど同じように、一致を見つけ出す。もう１つの文字が入力され（Ｎ）、シーケンスＩＮに関して探索を開始する。ＩＮは、どのエントリとも一致しないので、新しいエントリが作成され、最大の一致シーケンスに関するコード・ワード（すなわち、文字Ｉに関するコード・ワード）が、出力される。このプロセスは、続行され、文字Ｎの探索が行なわれる。Ｎが見つかると、次の文字が入力され、ＮＴをめて辞書の探索が行なわれる。これは見つからないので、ＮＴに関する辞書エントリが作成され、Ｎに関するコード・ワードが出力される。同じシーケンスが、文字Ｔ及びＩについても生じる。Ｔに関するコード・ワードが出力され、ＴＩに関する辞書エントリが作成される。この時点まで、複数文字の一致がなかったので、圧縮は行なわれなかった。実際、４つの８ビツト文字が４つの９ビツト・コード・ワードに置き換えられたということであって、出力ストリームは、わずかに拡張されただけである。（これは、３２ビツト対３６ビツトの拡張、すなわち、１．１２５：１の圧縮比を表わしている。）しかし、次の文字が入力されると、データ圧縮が開始する。この時点で、ＤＣエンジンは、ＩＮシーケンスの探索を行なう。一致を見つけると、ＤＣエンジンは、別の文字を受け取り、ＩＮＴの探索を開始する。一致が見つからなれければ、ＩＮＴに関する辞書エントリを作成し、シーケンスＩＮに関してあらかじめ生成されたコード・ワードを出力する。この場合、２つの８ビツト文字が１つの９ビツト・コート・ワードに置き換えられ、圧縮比は１６／９すなわち１．７７８：ｌになっている。このプロセスが、続行され、再び、２つの文字が単一のコート・ワードに置き換えられる。ＤＣエンジンは、前のシーケンスからのＴで開始され、続いて、次の文字Ｉを受け取る。ＤＣエンジンは、ＴＩクシ−ンスを探索し、一致するので、別のバイトが、入力される。次に、該チップは、ＴＩＮシーケンスの探索を行なう。一致するものがないので、ＴＩＮエントリが作成され、ＴＩに関するコード・ワードが出力される。このシーケンスも、ＩＮシーケンスが示した１、７７８：１の圧縮比を示す。この９バイトからなるストリングに関する正味の圧縮比は、１．１４３：１である。この例は、極めて少数のバイトからなるため、これは、特に大きい圧縮比ではない。データのサンプルが増えると、記憶されるデータのシーケンスも増し、単一のコード・ワードによって置き換えられるバイトのシーケンスも増す。１：１〜１１０：１の範囲の圧縮比を得ることが可能になる。第８図には、復元プロセスの略図が示されている。この例では、入力として前の圧縮例の出力が用いられる。復元プロセスは、圧縮プロセスに極めてよく似ているが、所定の辞書エントリの存在を探索する必要がないので、復元に関するアルゴリズムは、圧縮に関するアルゴリズムはど複雑ではない。２つのプロセスを結合することによって、復元時における適合する辞書エントリの存在が保証される。該アルゴリズムは、入力コード・ワードを利用して、辞書内のバイト・シーケンスを参照し、次に、圧縮アルゴリズムと同じ規則を利用して、新しいエントリを作成するだけである。このようにして、復元アルゴリズムでは、データ・パケットとともに特別辞書を送ることなく、圧縮データを回復することができる。圧縮例の場合のように、辞書はリセットされ、０〜２５５の最初の２５６エントリを納めるように初期設定されているものと仮定する。復元エンジンは、Ｒに関するコード・ワードを受け取ることから開始する。復元エンジンは、このコード・ワードを利用して、バイト値Ｒを参照する。この値は、後入れ先出しくＬ　Ｉ　ＦＯ）スタックに納められ、チップから出力されるのを待つ。Ｒは、根コード・ワード（最初の２５６エントリの１つ）であるため、このコート・ワードについて、リストの終端に達したことになる。次に、チップから出力スタックがダンプされる。復元エンジンは、さらに、■に関するコード・ワードを入力し、それを利用して、バイト値Ｉを参照する。やはり、この値は、根コード・ワードであるため、このコード・ワードに関する出力シーケンスが、完了し、■に関するバイト値が、出力スタックからポツプされる。この時点で、出力スタック（Ｉ）にブツシュされた最後のバイト値と、前のコード・ワード（Ｒに関するコード・ワード）を利用して、新しい辞書エントリが作成される。各エントリは、こうして作成され、１つのバイト値と、シーケンスをなす次のバイト（前のコード・ワード）に対するポインタを含んでいる。こうして、各辞書エントリ毎に、連係リストが生成される。次のコード・ワードが入力されて（Ｎに関するコード・ワード）、該プロセスが反復される。今度は、Ｎが出力され、バイト値Ｎと、■に関するコード・ワードを含む新しい辞書エントリが、作成される。Ｔに関するコード・ワードが入力されると、Ｔが出力され、別の辞書エントリが作成される。入力される次のコード・ワードは、バイト・シーケンスＩＮを表わす。復元エンジンは、このコード・ワードを利用して、本例において前に生成された第２の辞書エントリを参照する。このエントリには、出力スタックに納められたバイト値Ｎと、現在のコート・ワードになるＩに関するコード・ワードに対するポインタが含まれている。この新しいコート・ワードは、出力スタックに納められる次のバイト（Ｉ）を見つけるために用いられる。これは、根コード・ワードであるので、参照プロセスは、完了し、出力スタックが、逆の順序でダンプされる。すなわち、まず■が出力され、これにＮが続くことになる。次の２つのコード・ワードに関して、同じプロセスが反復され、もとのバイト・シーケンスＲＩＮＴＩＮＴＩＮが回？ｉすることになる。データ圧縮中にデータストリームに書き込まれる上述した予約出−ド・ワードのうちの２つは、ＲＥＳＥＴおよびＦＬＵＳＨ条件に関するコード・ワードである。ＲＥＳＥＴコード・ワードは、新辞書の開始を意味する。ＦＬＵＳＨコード・ワードは、ＤＣチップがそのバッファをフラッシュ・アウトしたこと、すなわち連続データでバッファを再び一杯にする前に、バッファに現在保持されているデータ（現在の最長の一致を表す）に関するコード・ワードを出力することを意味する。ＤＣチップは、ＲＥＳＥＴおよびＦＬＵＳＨコード・ワードを、アルゴリズム従属方式でデータストリームに書き込む。しがし、圧縮データへのアクセスを改善するために、ＲＥＳＥＴおよびＦＬＵＳＨコード・ワードのうちのある１つを利用することができるように、テープ・フォーマットは、特定ＲＥＳＥＴおよびＦＬＵＳＨコード・ワードを用いなければならないときに関する制約を課し、特定情報の書込みも確実にする。ＬＺＷアルゴリズム・プロセッサによるコート・ワード出力は、各々８または１６ビツト以外にすることができるので、“バッカー”は普通、システムに含まれ、コード・ワードを受け入れ、バックされたコード・ワードのバイトを出力する。このバッキング・プロセスは、その出力からの部分的バイトを必然的に制止して、圧縮アルゴリズムにより次のコード・ワードが生成されるのを待つ。この部分的コードワードは、圧縮システムに取り込まれているが、その出力にまだ反映されていない追加データを表す。あるポイントでは、圧縮エンノンを実施するシステムで、圧縮装置に入るすべてのバイトをその出力で表すことが要求される。これは、見つけたなかで現在の一致が最長のものであること、したがってその現在の突合せコード・ワードを出力すべきことを圧縮装置に知らせなければならないということを意味する。これは、いずれかの部分的コート・ワードが圧縮システムからの出力であることも意味している。これは、受信したすべてのハイドがその出力で表されるときに、圧縮装置が“フラッシュ”されるＦＬＵＳＨ動作である。これは、その出力からのデータは制止しない。辞書は、データから再構築しなければならないので、復元は、コード・ワードＲＥＳＥＴからしか開始されることができない。一方、復元の停止は、それが、特定の辞書の終端でなかったとしても、後続の任意のＦＬＵＳＨコード・ワードで行なうことができる。これが、各レコードの終りにコード・ワードＦＬＵＳＨを配置し、辞書の構築に用いられるものより小さいデータ・セグメントの選択的復元を可能にすることが有利な理由である。復元システムは、コード・ワードを復元装置に与えるアンバッキング・セクションを含む。復元装置には最長一致を見つけるタスクがなく、したがって固有のバッファリングを伴わないが、アンパッカーは一度に１バイトのデータを外界から取り込むことができるので、一般に復元装置からの部分的コード・ワードを制止する。圧縮中に“フラッシュ′状態の前の最終コード・ワードが復元装置に与えられたならば、アンパッカーは残されたビットを放棄しなければならない。これらのビットは、次のコード・ワードの一部ではなく、むしろ圧縮中にフラッシュ動作により導入されるパディングである。したがって、アンパッカーは、圧縮中にどこでフラッシュが起こったかを知らなければならない。はとんどのデータは、それまで参照されることがないので、辞書の開始時に、データの大部分は、圧縮せずに排出される。この段階では、圧縮比は比較的小さい。従って、圧縮効率を低下させるほど頻繁に辞書の再開を繰り返すのは望ましくない。現行辞書が一杯であるにもかかわらず圧縮比が高い場合には、辞書をその静的状態に保つことができる。すなわち、圧縮比が下がり、新辞書を開始することがより効率的になるまで、エントリを１つも追加することはできない。ＬＺＩアルゴリズムに従う際の基本的な考えは、テキストの共通ストリングを特別記号と置き換えることである。この記号は、ストリングがより早くに伝送または記憶されたこと、および復元装置が特別記号の代りに前の発生を用いることのみ必要であることを知らせる。さらにはっきり述べると、圧縮装置の出力は、サイチージョン（ｃｉｔａｔｉｏｎ）と呼ばれるストリングの前の出現の参照と、イノベーションと呼ばれる非圧縮文字の参照とを交互にすることにより得られる。イノベーションは、圧縮出力では明らかに変化しない文字であり、復元装置で、新しい、前に見えなかった文字の使用を認識することができるようにするため、備えられている。アルゴリズムは、バッファ（“ウィンドウ′として知られている）を必要とし、２つの部分に分けられる。大部分のバッファには入力の過去のヒストリが含まれ、これはすでに圧縮されている文字である。ウィンドウの終わりの小さな部分は、ルックアヘッド・バッファと呼ばれ、圧縮すべき今後の文字を含む。この構造を用いるときには、ルックアヘッド・バッファは残りのウィンドウと比較される。第Ｃ図を参照するが、バッファＢは、ウィンドウ・バッファＷおよびルックアヘッド・バッファＬに分けて示しである。圧縮すべき入力データは、幾つかの文字、例えば２０文字の容量を有するルックアヘッド・バッファＬに記憶される。ウィンドウ・バッファＷには、最も新しい過去のデータのヒストリが含まれ、数千文字、例えば４０９６文字の容量がある。生データは、ルックアヘッド・バッファＬからウィンドウ・バッファＷに入り、ウィンドウ・バッファＷの最も古いデータが捨てられる（ウィンドウ・バッファＷが一杯になったとき）。こうした理由により、ウィンドウ・バッファＷは時々゛　スライディング・ウィンドウ°と呼ばれる。ＬＺＩアルゴリズムのある実施にしたがい、データがルックアヘッド・バッファしに入れられると、各文字はウィンドウ・バッファＷの内容と比較される。ある文字で一致が見つからなければ、その文字は、その生の状態、すなわちイノベーションとして出力される。該文字は、次にウィンドウ・バッファＷにも入れられる。ルックアヘッド・バッファＬのある文字で一致が見つかったならば、より長い一致を見つけることができるかどうかを確認するために、次の文字も、−数文字と組み合わせて考えられる。このプロセスは、別の文字を追加することが、ウィンドウ・バッファＷにもはや一致がないということを、意味するまで、繰り返される。コード・ワード／記号は一致の長さを示し、ウィンドウ・バッファＷのその位置は出力され、関連ストリングがウィンドウ・バッファＷに追加される。コード・ワード／記号は、参照の最初の文字がバッファよりも前にある限り、ルックアヘッド・バッファに達するストリングを参照することが許容される。一致がルックアヘッド・バッファに達すると、ＬＺＬｆＥＭ装置は一種のラン・レングス（ｒｕｎ−１ｅｎｇｔｈ）ｓンコーディングを行っている。一致がバッファよりも前の文字で始まる場合には、圧縮装置は”ａａａａａａ、、、”などの− 続き（ｒｕｎ）を圧縮している。同様に、一致の最初の文字がバッファの前の幾つかの文字を始める場合には、圧縮装置は”ａｂａｂａｂ、、、”または”ａｂｃａｂｃａｂｃ、、、”などの−続きを圧縮している。ＲｒＮＴＩＮＴｒＮ例は、第り図に示すようなこのアプローチに従って圧縮され、これが圧縮すべき最初のデータであること、すなわち最初にウィンドウ・バッファＢが空であることを想定している。最初の４文字はイノベーションとしての出力である。５番目の文字■はウィンドウ・バッファＷにあるので、次の文字− Ｎは、ＩＮがすでにウィンドウ・バッファＷにあるかどうかをチェックするためのものあると考えられる。ストリングＩＮＴも考えられるが、それもまたウィンドウ・バッファにある。しかし、次の文字Ｉを追加することにより、ウィンドウ・バッファＷにないストリングｌＮＴｌを生成する。したがって、コード・ワードは、ウィンドウ・バッファＷのＩＮＴの位置を示す出力であり、長さ３である。位置は°オフセット°により示され、すなわち、ウィンドウ・バッファＷにおいて、現在の文字からどれくらい離れたところで一致がスタートするかを示す。次の文字Ｉは、ウィンドウ・バッファの前のＩと一致し、最終ストリングＩＮは、ウィンドウ・バッファの３文字戻った該ストリングの場合と一致するので、出力コート・ワードは＜３．２＞である。復元中に、ウィンドウ・バッファも保たれ、復元すべき入力データにコード・ワードが見つかると、復元は、そのオフセットおよび長さにしたがってウィンドウ・バッファの適切なストリングを捜すこと、およびストリングを出力することが伴う。したがって、ＲＩ　ＮＴ　Ｉ　ＮＴＩＮ例では、最初のコード・ワード＜３．３＞に遭遇すると、３文字戻って始まる長さ３のストリング、すなわちＩＮＴが出力される。次のコードワード＜３．２＞に遭遇すると、３文字戻って始まる長さ２のストリング、すなわちＩＮが出力される。ＲＥＳＥＴコマンドには、ＬＺＩアプローチにしたがって、ウィンドウ・バッファをクリアする作用がある。ＦＬＵＳＨコマンドには、ルックアヘッド・バッファをクリアする作用がある。したがって、ＬＺ１アプローチの゛辞書゛は、２つの連続するＲＥＳＥＴコマンドの間でウィンドウ・バッファを゛スライド°するデータ量により表される。ＬＺＷアルゴリズムに関しては、復元は最後のＲＥＳＥＴから始めなければならない。多数のレコードにわたり辞書を共用する際、すなわち各レコードの終わりでウィンドウ・バッファをリセットすることのないときに、比較的短い一連のレコードに対して圧縮比を改善することができるという利点かある。ＦＬＵＳＨコマンドの作用は、すてに述ぺたようにルックアヘッド・バッファのすべての内容を一致させることであり、それ以上のデータよりも前の出力をルックアヘッド・バッファに入れることか許容される。連続ＲＥｓＥＴコマンド間でこのようにしてルックアヘッド・バッファをフラッシュする際の利点は、辞書を作るために用いるよりも小さなデータ・セグメントを、選択的に復元することができる点である。これは、データ・レコードを、テープに記憶された圧縮データに付加することが望まれる場合に特に有益である。各データ・レコードの後でルックアヘッド・バッファをフラッシュする場合には、現行レコードの終わりよりも後で、それ以上のレコードを明らかに付加することができるように、テープ上のいずれかの圧縮レコードの終わりを見つけることかできる。第Ｃ図は説明のために全く簡略化されていることが分かる。ウィンドウ・バッファは、過去のデータのセグメントを定義する２つのポインタの形で実行するか、実際に、他の適切な構成を用いることができる。次に、圧縮か非圧縮かはともかくとして、テープに対するデータ記憶の方法について説明する。ユーザ（ホスト・コンピュータ）からテープ記憶装置へのデータ供給には、記憶装置に送られる離散的パンケージ（レコード）にするためのデータの物理的分離であるか、あるいは、特定の信号によってホストが表現する高レベルな記録の概念的編成であるかはともかく、データのユーザ分離を伴うのが普通である。このデータのユーザ分離は、ホストにとって特に意味かある（この意味は、テープ記憶装置には分らないのが普通であるか）。従って、その存在が、入力データの物理的分離によって記憶装置に伝えられたとしても、ユーザ分離を論理的セグメンテーションとみなすことか適切である。第１図（ａ）には、既存のタイプのホストかテープ記憶装置に対して供給できるユーザ・データと特殊な分離信号のシーケンスが示されている。この例では、データは、可変長レコードＲ１〜Ｒ９として供給されるか、この物理的分離の論理的意味は、ホストには分るが、記憶装置には分らない。物理的分離以外に、ユーザ分離情報は、特殊な“ファイル・マーク”信号ＦＭの形で供給される。ファイル・マークＦＭは、データ・レコードの間に挿入して、記憶装置に与えられるが、やはり、この分離の意味は、記憶装置には分らない。レコードに対する物理的分離によって、第ルヘルの分離が得られ、一方、ファイル・マークによって、第ルベルの分離と階層をなす第２レヘルの分離が得られる。第１図（ｂ）には、テープ１０に対して第１図（ａ）のユーザ・データ及びユーザ分離情報を記憶するための可能性のある物理的編成の１つが示されているが、この編成は、既知のデータ記憶方法に基づくものである。第１図（ａ）と第１図（ｂ）との間におけるマツピングは、簡単なものであるーファイル・マークＦＭは、一定周期のバースト１として記録されるが、さもなければ、データ・レコードとして扱われ、レコードＲ１〜Ｒ９とファイル・マークＦＭは、信号の記録されていないブロック間ギャップ２によって互いに隔てられる。ブロック間ギャップ２は、記憶データを分離して、ユーザに分る論理単位のレコードにすることを可能ならしめ、ファイル・マークＦＭ（一定周期のバースト１）は、レコードをレコードの論理的集合に分割する第２レヘルの分離マークを形成する。第１図（Ｃ）には、テープＩＯに第１図（ａ）のユーザ・データ及びユーザ分離情報を記憶するための、可能性のある周知の第２の編成が示されている。この場合、ユーザ・データは、それぞれ、グループの内容に関する情報を含むインデックス４を備えた固定サイズのグループ３に編成される。２つのグループ３間における境界は、一定周期のバースト５によって表示することができる。データをグループに分割するのは、純粋に、関係する記憶装置の都合に合わせたものであり、ホストには明らかなはずである。グループ内のユーザ・データは、いかなる点においても物理的に分離しておらず、各レコードは、先行レコードの終端からとぎれることなく続いているだけであり、グループ内のデータを分離して、レコードにし、さらに、ファイル・マークで区切られたレコードの集合にすることに関した全ての情報が、グループのインデックスに含まれている。本例の場合、レコードＲ１〜Ｒ８とＲ９の第１の部分が、例示のグループ３に保持されている。インデックス４の長さは、グループ内に存在する分離マークの数及びレコードの数によって変動するのが一般であるが、グループの終端に対するインデックス内の所定位置にインデックス長を記録することによって、インデックスと最後のバイトとの境界を識別することができる。例えば、パディングといった未定義内容を有するスペースが、データ領域の終端とインデックスの第１のバイトの間に存在する可能性がある。第２図には、インデックス４の内容が示されているが、見ての通り、インデックスは、２つの主データ構造、すなわち、グループ情報テーブル６及びブロック・アクセス・テーブル７から構成される。ブロック・アクセス・テーブル７のエントリ数は、グループ情報テーブル６におけるブロック・アクセス・テーブル・エントリ（ＢＡＴ　ＥＮＴＲＹ）カウント・フィールドに記憶されている。グループ情報テーブル６には、ファイル・マーク・カウントＦＭＣ（記録の終端（ＢＯＲ）マークには、現在のグループに納められた任意のものが含まれるので、ファイル・マークの数）、及び、レコード・カウントＲＣ（定義される）といった、各種カウントが含まれている。ブロック・アクセス・テーブル７は、一連のアクセス・エントリとして、グループの内容、及び、とりわけ、グループに保持されたユーザ・データの論理的セグメンテーションを示している（すなわち、グループ内における各レコード境界及び分離マークを表わしたエントリを保持している）。アクセス・エントリは、グループ内容の順番に並んでいる。第３図を参照すると、ブロック・アクセス・テーブル内のエントリは、それぞれ、エントリのタイプを示すＦＬＡＧエントリと、その値を示すＣ０ＵＮＴエントリから構成される。ＦＬＡＧフィールドは、８ビツトであり、Ｃ０ＵＮＴフイールドは、２４ビツトである。ＦＬＡＧフィールド内のビットは、下記の意味を有している：５ＫＰ−セットされると、“スキップ・エントリ”を示す５ＫＩＰビツト。スキップ・エントリは、ユーザ・データによって取り上げられないグループ内のバイト数、すなわち、（グループのサイズ）−（ユーザ・データ領域のサイズ）を示す。ＸＦＲ−セットされると、テープに対するユーザ・データの書込みを表わすＤＡＴＡ　ＴＲＡＮＳＦＥＲビット。ＥＯＸ−セットされると、テープに対するユーザ・データ・レコードの書込みの終了を示すＥＮＤ　ＯＦ　ＤＡＴＡ　ＴＲＡＮＳＦＥＲヒツト。ＣＭＰ−セットされると、エントリが圧縮データに関連したものであることを示すＣＯＭＰＲＥＳＳ　ＩＯＮビット。ＥＯＴ−このビット値は、この説明の目的には、関係がない。ＭＲＫ−セットされると、エントリが、データ・レコードではなく、分離マークに関係していることを示すＳＥＰＡＲＡＴＯＲＭＡＲＫビット。ＢＯＲ−セットされると、データ・レコードの始端位置を示すＢＥＧＩＮＮＩＮＧ　ＯＦ　ＲＥＣＯＲＤビット。ＥＯＲ−セットされると、テープ上におけるデータ・レコードの終端位置を示すＥＮＤ　ＯＦ　ＲＥＣＯＲＤビット。第３図には、ブロック・アクセス・テーブル中に作成可能なエントリの７つのタイプが示されている。５ＥＰＡＲＡＴＯＲＭＡＲＫエントリは、ドライブによってレコードとして扱われるので、ＢＯＲ及びＥＯＲビットがセットされる。次の４つのエントリは、データ転送に関する情報を表わしているので、それぞれ、ＸＦＲビットがセットされる。５ＴＡＲＴ　ＰＡＲＴ　ＯＦ　ＲＥＣＯＲＤエントリは、レコードの始端だけが、グループに入っており、レコードの次の部分が、後続のグループにはみ出している場合に関するものである。そのグループにはレコードの始端または終端がないので、ＭＩＤＤＬＥ　ＰＡＲＴ　ＯＦ　ＲＥＣＯＲＤエントリにセットされる唯一のビットは、データ転送ビットである。ＥＮＤ　ＰＡＲＴ　ＯＦ　ＲＥＣＯＲＤエントリは、ＦＬＡＧにＥＯＲビットがされておらず一代りに、ＥＯＲビットは、総レコード・バイト・カウントを示すＴＯＴＡＬ　Ｃ０ＵＮＴエントリにセットされる。グループに関するブロック・アクセス・テーブルの最後のエントリは、常に、ユーザ・データによって取り上げられないグループ内のスペース量を示す５ＫＩＰエントリである、す体わち、５ＫＩＰエントリに関するＣｏｕｎｔフィールド内のエントリは、グループ・サイズ（例えば、１２６６３２バイト）からデータ領域サイズを引いたものである。第１図（Ｃ）に示すレコードのグループ３に関するブロック・アクセス・テーブルの一例が、第４図に示されている。レコードＲ１〜８に関するカウント・エントリは、該レコードに関する総バイト・カウントであるが、レコードＲ９に関するカウント・エントリは、Ｒ９のグループ３内にある部分のバイト・カウントである。ファイル・マークＦＭに関するカウント・エントリは、フォーマットに従って０またはｌになる。５ＫＩＰエントリに関するカウント・エントリは、１２６６３２からテーブルに既に現われたバイト・カウントの和を引いたものである（ＴＯＴＡＬ　Ｃ０ＵＮＴエントリは含まない）。別の実施例では、第３Ａ図に示すようなグループのデータを圧縮するために用いるアルゴリズムを示している、ブロック・アクセス・テーブルにさらに可能なエントリがある。Ｃ０ＵＮＴフイールドに入力されるアルゴリズム番号は、ＤＣアルゴリズム番号の基準に準拠する望ましい番号である。グループとしての圧縮レコードのためのデータ転送およびトータル・カウントＦＬＡＧエントリには、ＣＭＰビット・セットがある。したがって、グループの中の圧縮および非圧縮レコードは、ＣＭＰビットに基づいてドライブにより区別することができる。例えば、第１図（Ｃ）において、偶数番号のレコードを圧縮レコードおよび奇数番号のレコードを非圧縮レコードと仮定すると、ブロック・アクセス・テーブルのエントリは第４Ａ図に示す通りである。第４Ａ図では、ＵＢＣＸはレコードＸの非圧縮バイトを示し、ＣＢＣＸはレコードＸの圧縮バイトを示す。第５図は、ユーザ・データおよび関連情報をテープに記憶するための別の可能な構成を示す。再び、ユーザ・データは、グループに、グループの内容についての情報を含めるためのブロック・アクセス・テーブルを構成する圧縮データを含む場合でも、各グループに非圧縮されたインデックスを含んだ、固定サイズのグループに構成される。グループ間の境界は、一定周期のバーストにより示すことができる。しかし、レコードだけによりグループ・インデックスに情報を記憶することよりも、この実施例では、１つのエンティティが１つ以上のレコードから成る”エンティティ”によって、グループの内容についての情報を記憶することが必要である。この実施例では、エンティティに、各々が同じ非圧縮長を有するｎ個の圧縮レコードを含めることができる（ｎは１以上の数）。第５図において、グループＧは、圧縮データの４つの完全なレコードＣＲ，〜ＣＲ４と、８バイトのヘッダ一部分Ｈから成る単一のエンティティＥＮＴＩＴＹＩ　（またはＥｌ）によって構成される。レコードＣＲ＋〜ＣＲ，は、同じ非圧縮長を有しているが、データ圧縮後は、当然具なる長さになる。データ・ストリーム内における非圧縮状態のままのヘッダ一部分Ｈには、下記の情報が含まれている：ＨＬ　−ヘッダー長（４ビツト）。（次の１２ビツトは、予約されている）。ＡＬＧ＃　−データの圧縮に用いられる圧縮アルゴリズムを表わした記憶数１バイト）。ＵＢＣ−エンティティ内のレコードに関する非圧縮バイト・カウント（３バイト）。＃ＲＥＣ３−エンティティ内のレコード数（２バイト）。任意選択により、エンティティ内における各レコードの終端には、各レコードの圧縮バイト・カウントを納める後書き（ｔｒａｉｌｅｒ　）部分を含むことが可能である。例えば、後書き部分は、“レコードの終端”　（ＥＯＲ）のコード・ワードのすぐ後に配置されることになる。この特徴が存在する場合、ヘッダ一部分において、ヘッダー長ＨＬの後に予約された１２ビツト中に、後書き部分の長さ、例えば、３ビツトを示すこともできる。エンティティの各レコードに後書き（ｔｒａｉｌｅｒ　）部分を有する実施例の一例を第５Ａ図に示す。後書き部分は、各圧縮レコードの終わりにおいて、非圧縮データストリームに書き込まれる。したがって、第５Ａ図のエンティティには。ヘッダ一部Ｈおよび、各々に非圧縮後書き部Ｔを有し、非圧縮されたときに同じ長さの４つの圧縮レコードＣＲ１〜ＣＲ，を含む。各レコードの後書き部分子Ｒには、レコードの圧縮バイト・カウント（ＣＢＣ）および巡回冗長検査（ＣＲＣ）を含んでいる。後書き部分は、この例では各レコードの終わりの６ビツトを占める。後書き部分の長さくＴＬ）は、ヘッダ一部Ｈに含まれ、ヘッダ一部Ｈの最初のバイトの最後の４ビツトを占める。後書き部分を含めることにより、５ＫＩＰカウント・エントリはそれに応じて小さくなるが、ブロック・アクセス・テーブルＴのエントリの特性を変えることはない。データストリームへの圧縮バイト・カウントの書込みは、ＤＣドライブまたは適するように構成された非ＤＣドライブで、リンク・リストにおけるポインタとして用いて、各圧縮レコードが始まったり終わる位置を推定することができる。ヘッダーにヘッダ一部分（及び、適合すれば、後書き部分）の長さを含む利点は、それによって、この長さを変えることが可能になり、同時に、所望の場合には、ドライブにヘッダーをスキップさせることができるということである。ブロック・アクセス・テーブルにおける各グループのインデックスには、レコードの形ではなく、エンティティの形で、ただし、別様の場合には、第２図〜第４図に関連して前述のように、情報が記録される。第５図には、エンティティＥ１に関するブロック・アクセス・テーブルのエントリも示されいる。ブロック・アクセス・テーブルＴ内に作成されるエントリのタイプは、第２図〜第４図に関連して解説のものと同様である。その相違は、この場合、ＦＬＡＧフィールドにＣＭＰビットをセットすることによって、エントリがレコードではなく、エンティティに関するバイト・カウントに関連したものであることが示されるという点である。１つの可能性として、エンティティに圧縮レコードだけしか含めることができな（なるが、これは、望ましい。従って、これは、ＦＬＡＧフィールドにＣＭＰビットをセットすると、やはり、Ｃ０ＵＮＴエントリが圧縮バイト・カウントであることを表わすことになる。一方、もう１つの可能性として、エンティティに圧縮データと非圧縮データのいずれかを含み、例えば、エンティティ内のデータが非圧縮データであることを表わす、全てゼロといった特定のアルゴリズム数を予約することが可能になる。レコードではなく、エンティティの形で、ブロック・アクセス・テーブルＴに情報を記憶することによって、テープにレコードを書き込み、テープからレコードを読み取ることに関連した記憶管理のオーバヘッドが減少する。第２図〜第４図に示す案を用いる場合には、グループＧに関して、ブロック・アクセス・テーブル中の５つのエントリが必要になるが、この場合には、２つのエントリしか必要ない。レコードをエンティティに編成すると、読取り及び書込み時に必要なプロセッサの介入度が低下するので、同じ非圧縮サイズの複数レコードを転送するのが容易になる。エンティティに含まれるレコードのシーケンスの書込みに必要なプロセッサの介入は、ヘッダ一部分の形成と、ブロック・アクセス・テーブル内における適合するエントリの作成だけということになる。対照的に、第１図〜第４図に関連して説明した既知の案を用いると、各レコード毎にプロセッサの介入が必要になる。圧縮されたバイト・カウントは、圧縮プロセスの終了後まで未知のため、これは、データ圧縮に関してとりわけ重要である。従って、あるグループをデータで満たそうとする場合、適合するレコード（及び対応するブロック・アクセス・テーブルのエンティティ）数が、分らない。あるエントリにブロック・アクセス・テーブルの要件を固定することによって、どれだけのデータのレコードがグループに納まるかに関係なく、グループ全体を１回のプロセッサ介入で満たすことができるる。データの読取り時にも、同様の利点が得られる。第６図を参照すると、エンティティ（Ｅｎ）は２つ以上のグループにまたがる場合もある、例えば、単一の比較的長いレコードＣＲ，を含むエンティティＥ、が、グループＧ１を充填して、グループＧ２にまで入り込む。第６図には、グループＧ、、Ｇ２のブロック・アクセス・テーブル内のエントリも示されている。グループ間の連係度を弱めるため、新しいエンティティは、グループ内において、できるだけ早（開始する、すなわち、前のレコードが圧縮されていなければ、グループの開始部において、または、グループ内における最初の圧縮レコードの始端において、あるいは、前のレコードが圧縮されており、前のグループからはみ出してきたものである場合には、最初の新しい圧縮レコードの始端において開始する。従って、圧縮レコードＣＲ。の終端において、次のエンティティＥ２が開始する。エンティティＥ２には、非圧縮長の等しい、４つの圧縮レコードＣＲ２〜ＣＲ５か含まれている。グループには、圧縮データを含むエンティティと、非圧縮データを含む“裸のレコード”とを混合したものを納めることができるように企図されている。この構成の一例が、ブロック・アクセス・テーブル内の対応するエントリも示す第７図に示されている。グループＧには、ヘッダ一部分Ｈと、３つの圧縮レコードＣＲ，。ＣＲ２、及び、ＣＲｓから成るエンティティが含まれている。グループＧは、また、非圧縮レコードＲ４（ヘッダ一部分を備えていない）も含んでいる。グループＧのブロック・アクセス・テーブルＴには、４つのエントリが含まれている：第１のエントリは、グループ内のエンティティの全バイト・カウント、第２のエントリは、ファイル・マーク・エントリ（レコードＲ４の開始前に入力データ内におけるファイル・マークの存在を示す）、第３のエントリは、非圧縮レコードＲ４の全バイト・カウント、最後のエントリは、５ＫＴＰエントリ。第７図から注目されるのは、ＣＭＰビット（ＦＬＡＧフィールドの第４のビット）は、エンティティ・ハイド・カウント・エントリに対してセットされているが、裸のレコード・バイト・カウント・エントリに対してはセットされていないという点である。適切に構成された非ＤＣドライブは、ＣＭＰビットが関連するブロック・アクセス・テーブル・エントリにセットされているか否かをチェックすることによって、圧縮データと非圧縮データが混在したテープ上において、前記データの識別を行なうことができる。この案では、エンティティ内の分離マークが認められない。例えば、ホストが、シーケンスをなす長さの等しいレコードを送信中で、そのシーケンス内にファイル・マークまたは他の分離マークが存在する場合、分離マークの前の第１組のレコードが、１つのエンティティに納められ、分離マークが、テープに書き込まれ、ファイル・マークに続くシーケンス内の１組のレコードが、第２のエンティティに納められる。もちろん、２つのエンティティに関した対応するエントリと分離マークが、関連グループのブロック・アクセス・テーブル内に作成される（この例には、１つのグループしか含まれていないものと仮定する）。第８図には、グループのブロック・アクセス・テーブルにおいて可能性のある有効なエントリのシーケンスが示されている。第８図では、状態及びアクションが矩形で指定され、ブロック・アクセス・テーブルのエントリが楕円で示されている。“スパン”レコード／エンティティは、１つのグループから別のグループへ延びるものである。エンティティの存在、及び、エンティティ内において許容される複数圧縮レコードの存在を考慮に入れて、各グループのインデックスにおけるグループ情報テーブルのいくつかのフィールドは、次のように定義される。レコード・カウント一二のフィールドは、ＢＯＲ以後、現在のグループまで書き込まれた全てのグループに関するグループ情報テーブルの現在グループ・エントリ（下記参照）におけるレコード数の値の合計を指定する４バイト・フィールドである。現在グループ内のレコード数−このフィールドは、下記の合計を指定する２ハイドのフィールドである：ｉ）現在グループのブロック・アクセス・テーブルにおける分離マーク・エントリの数。ｌｉ）現在グループのブロック・アクセス・テーブルにおける非圧縮レコード・エントリの総カウント数。１１１）現在グループのブロック・アクセス・テーブル内における非圧縮レコード・エントリの全カウント数。ｉｖ）現在グループのブロック・アクセス・テーブルにおけるエンティティ・エントリの総カウントまたはエンティティ・エントリの全カウントが存在する、全てのエンティティ内における圧縮レコード数の合計。Ｖ）こうしたエントリが存在する場合、現在グループのブロック・アクセス・テーブルにエンティティ・エントリの開始部分が存在する、エンティティ内の圧縮レコード数−１゜ｖｉ）現在グループのブロック・アクセス・テーブルにおけるエンティティ・エントリの総カウント数。前レコードのグループ数−このフィールドは、分離マーク、アクセス・ポイント・または、非圧縮レコードの始端が生じた最高番号の前グループの実行番号を指定する２バイト・フィールドである。それには、こうした前グループが存在しない場合、全てのゼロ・ビットが含まれることになる。第１図〜第８図に関して解説した固定サイズのグループにおけるレコードの編成に関連し、一般に、グループは、復元目的のため、互いに独立した状態に保つことが望ましい。すなわち、一般に、ＲＥＳＥＴコード・ワードは、各グループの始端またはその近（に配置することが望ましい。これに関する２つの主たる理由のうち１つは、グループ間の連係を弱めることによって、コントローラにおいて必要とされるバッファ・スペース量の減少に役立つ、すなわち、任意の時点においてバッファ内に２つ以上のグループを納めなければならない可能性を低下させることになるためである。グループの始めにおける辞書ＲＥＳＥＴに対する別の理由は、グループの中央でレコードを選択的に復元することが所望されるときに、グループの外側に出て関連辞書を開始させる必要のないことである。圧縮データへのアクセスを改善するように、各レコードの後にＦＬＵＳＨ条件を付けることには利点がある（ＦＬＵＳＨコード・ワードは”レコードの終わり（ＥＯＲ）”コード・ワードとも呼ばれる）。この特徴により、レコードの前にあるＲＥＳＥＴポイントから復元する必要性に応じて、レコードを個々に復元することができる。各レコードの終わりにＦＬＵＳＨ条件を付けることは、次のレコードからのデータに入れることなく、各レコードのデータを復元することができることを意味している。この特徴は、新しいレコードを現行レコードの中心のポイントに付加することを所望する場合にも有益である。データ辞書を構成する圧縮データ量は、“圧縮オブジェクト”と呼ばれる。圧縮オブジェクトは、第９図に示すように、２グル一プ以上のデータにまたがる可能性がある。レコードが１つのグループからもう１つのグループにオーバラップする場合、ＲＥＳＥＴコード・ワードは、すぐ隣の圧縮レコードの始端において、データ・ストリーム内に配置される。第９図において、グループＧ１は、３つの完全な圧縮レコードＣＲ１、ＣＲ２、ＣＲｓ　、及び、第４の圧縮レコードＣＲ＜の最初の部分から構成される。レコードＣＲ，の最後の部分は、次のグループＧ２に入り込んでいる。この例の場合、レコードは、エンティティをなすようには編成されない。データ圧縮時、グループＧ、の始端において、辞書がリセットされる（第９図のＲで表示）。ＦＬＵＳＨコード・ワード（Ｆで表示）が、各レコードの終端に位置するようにデータ・ストリームに挿入される。現在の辞書は、レコードＣＲ４が終了するまで継続し、その時点で、辞書がリセットされる。従って、現在の圧縮オブジェクトは、レコードＣＲ，−ＣＲ，から構成される。したがって、増大した効率のデータ圧縮により、辞書を、２つ以上の等しくない非圧縮長のレコードにわたり拡張して用いることができるという利点がある。後で、例えば、レコードＣＲ，を選択的に復元することが所望の場合、これは、レコードＣＲ，の開始部、すなわち、レコードＣＲ，を含む圧縮オブジェクトの開始部で復元を開始し、レコードＣＲｓの終端まで、データの復元を行なうことによって可能となる。レコードＣＲ１の終端において“明確な中断”が得られるようにする、すなわち、レコードＣＲ，の終端において、ＦＬＵＳＨコード・ワードのために、レコードＣＲ４の始端に入り込まないようにすることが可能になる。したがって、”アクセス・ポイント°間に点在されるフォーマットによりアクセス可能なＦＬＵＳＨコード・ワード（フォーマットによりアクセス可能なＲＥＳＥＴコード・ワード）を与えることにより、データ圧縮中に辞書を作成するために用いるデータ量よりも小さなデータ・セグメントの選択的復元をすることができる。各レコードの圧縮バイト・カウントはブロック・アクセス・テーブルに記憶されるので、レコードの終わりにあるＦＬＵＳＨコード・ワードにアクセス可能である。該フォーマットでは、°アクセス・ポイント°を形成する圧縮対象の始点、すなわちドライブで復元動作を開始することのできるポイントは、幾つかの方法のうちの１つにより示すことができる。アクセス・ポイントは、各グループのブロック・アクセス・テーブルにおいて明示的に記すことができる。この他に、アクセス・ポイントの存在は、ブロック・アクセス・テーブルの別のエントリにより示唆することができ、例えば、アルゴリズム番号エントリの存在でさえ、該グループの最初の新レコードのはじめにアクセス・ポイントを含むことがある。また、アルゴリズム番号のビットは、新しい辞書が、該グループの最初の新レコードのはじめにおいて開始することを示すために確保しておくこともある。レコードが、エンティティをなすように編成され、エンティティが第５図〜第７図に関連して解説のグループをなすように編成される場合、比較的少量のデータを納めたエンティティを共用する辞書の利点が得られるようにするため、圧縮オブジェクトが、第１Ｏ図に示すように、２つ以上のエンティティにまたがるようにすることも可能である。第１０図には、圧縮データに関する３つの定サイズのグループＧ。、Ｇｚ　、Ｇｓが示されている。グループＧ、には、完全なレコードＣＲ０と、次のレコードＣＲ２の最初の部分が含まれている。レコードＣＲ，は、エンティティＥ１における唯一のレコードである。グループＧ２には、レコードＣＲ２の中間部分が含まれている。グループＧ、には、レコードＣＲ２の終端部分が含まれ、さらに、レコードＣＲ１等も含まれている。エンティティＥ２には、単一の比較的長いレコードＣＲ，が含まれている。圧縮時、辞書は、グループＧ１の始端でリセットされるが（Ｒで表示）、レコードＣＲ，は比較的短いので、圧縮オブジェクトは、レコードＣＲ，及びエンティティを越えて延び、レコードＣＲ，及びエンティティＥ２を含んでいる。圧縮オブジェクトは、レコードＣＲ２の終端で終了し、新しい圧縮オブジェクトが、レコードＣＲ，の始端で開始する。他の可能性には、新辞書の開始を示すための、エンティティ・ヘッグーの非ゼロ・アルゴリズム番号の存在、およびその他に、予め定められた値、例えばゼロなどを用いるためのアルゴリズム番号ヘッダー・エントリがある。ブロック・アクセス・テーブルのエンティティの圧縮バイト・カウントを書き込むことによりアクセス可能な、各エンティティの終わりにあるＦＬＵＳＨコード・ワードの存在によって、■エンティティ毎に、レコードの選択的復元をすることができる。例えば、第１０図を参照するが、エンティティＥ２　（この例ではたまたま１つのレコードＣＲ，）の内容は、レコードＣＲ，のはじめからデータを得ることなく復元することができる。しかし、テープ・フォーマットでアクセス可能な最も近い前の辞書の始点であるエンティティＥ１のはじめにあるＲＥＳＥＴコード・ワードから復元を開始しなければならない。第２０Ａ図および第２０Ｂ図に関して記述するエンティティ・ヘッダーの情報を利用して１つのレコード毎にデータを復元することもできる。エンティティの各レコードに、レコードの圧縮バイト・カウントを含む後書き部分（第５Ａ図に関してすでに述べた通り）を含み、各レコードの終わりにＦＬＵＳＨコード・ワードがある場合、この特徴は、１つのレコード毎に復元を達成するときに用いることができる。各圧縮レコードでその固有のエンティティを有するように、テープ全体を書き込むことができる。これは、選択的復元のためのレコードへのアクセスを改善するが、８バイト・ヘッダー／レコードおよび４バイト・インデックス・エントリ／レコードのオーバヘッドを伴う。また、各エンティティのヘッダーを（少なくとも）スキップするためにプロセッサの介在が要求されるので、多重レコード転送も遅くなる。もちろん、ＤＣチップはレコードの中間部であっても、アルゴリズムに従って、データ・ストリームにＲＥＳＥＴコード・ワードを挿入する。以上の説明は、テープ・フォーマットによって強制され、認識され、利用されるＲＥＳＥＴコード・ワードに関するものである。分かりやすくするために、第５図〜第１０図では、エンティティおよび圧縮対象に、関連グループのインデックスを含まない。次に、本発明のヘリカル走査を実施するためのテープ・フォーマットについて解説する。後述の記憶方法及び装置は、ＤＡＴ　Ｃｏｎｆｅｒｅｎｃｅ　５ｔａｎｄａ　ｒｄ　（１９８８年３月、日本の東京にあるＥｌｅｃｔｒｏｎｉｃ　Ｉｎｄｕｓｔｒｉｅｓ　Ａｓ５ｏｃｉａｔｉｏｎ　ｏｆ　Ｊａｐａｎで決定）に基づ＜ＰＣＭオーディオ・データの記憶に用いられるのと同様のフォーマットでデータを記憶するヘリカル走査技法を利用する。ただし、本方法及び装置は、デジタル化オーディオ情報よりもコンピュータ・データの記憶に適したものである。第１１図には、テープ・カートリッジ１７からのテープｌＯが、巻き角が９０° になるように、回転ヘッド・ドラム１２を所定の角度で通過するヘリカル走査テープ・デツキ１１の基本レイアウトが示されている。動作時、テープｌＯは、ピンチ・ローラ１６がテープを押しつけるキャプスタン１５の回転によって、矢印Ｔが示す方向に、繰出しリール１３から巻取リリール１４に移動し、同時に、ヘッド・ドラムは、矢印Ｒで示す方向に回転する。ヘッド・ドラム１２には、角度的に１８０°間隔をあけて配置された２つの読取り／書込みヘッドＨＡ、ＨＢが収容される。既知の方法では、これらのヘッドＨＡ、ＨＢは、第１２図に示すように、オーバラップする斜めトラック２０．２１を、それぞれ、テープ１０に書き込むように構成されている。ヘッドＨＡが書き込むトラックは、正のアジマスを有しており、一方、ＨＢが書き込むトラックは、負のアジマスを有している。各対をなす正と負のアジマス・トラック２０．２１が、フレームを構成する。　第１２図には、本発明の装置によって書き込まれるようになっている各トラックの基本フォーマットが示されている。各トラックは、２つのマージン区域２２．２つのサブ区域２３．２つのＡＴＦ　（自動トラック追従）区域２４、及び、主区域２５から構成される。ＡＴＦ区域２４は、ヘッドＨＡ、ＨＢが、既知の方法で正確にトラックを追従できるようにする信号を供給する。主区域２５には、いくつかの補助的な情報も記憶されるが、主として、該装置に供給されるデータ（ユーザ・データ）の記憶に用いられる。主区域及びサブ区域に記憶される補助的情報の項目は、サブ・コードとして知られており、例えば、ユーザ・データ、テープに対するそのマツピング、いくつかの記録パラメータ（フォーマットのアイデンティティ、テープ・パラメータ他）、及び、テープの使用記録の論理的編成に関するものである。次に、前述のＤＡＴ　Ｃｏｎｆｅｒｅｎｃｅ　５ｔａｎｄａｒｄに適合するブロック・サイズに関する詳細を含む、主区域２５及びサブ区域２３、発明の詳細な説明を行なうものとする。第１３図には、トラックの主区域２５に関するデータ・フォーマットが示されている。主区域は、それぞれ、長さが３６バイトの１３０のブロックから構成されている。最初の２つのブロック２６は、再生時におけるタイミングの同期を容易にするタイミング・データ・パターンを納めたプリアンプルである。残りの１２８のブロック２７が、“主データ区域”を構成する。主データ区域の各ブロック２７は、４バイトの“主ＩＤ”領域２８と、３２バイトの“主データ”領域２９から構成され、その構成は、第１３図の下部に示されている。主ＩＤ領域２８は、同期バイト、２つの情報を納めたバイトＷ１、Ｗ２、及びパリティ・バイトから構成される。バイトＷ２は、全体としてブロックに関連した情報（タイプ及びアドレス）の記憶に用いられ、一方、バイトＷ１は、サブ・コードの記憶に用いられる。各ブロック２７の主データ領域２９は、一般に、ユーザ・データとユーザ・データ・パリティの両方または一方によって構成される３２のバイトから構成される。ただし、所望の場合には、主データ領域にサブ・コードを記憶することも可能である。第１４図には、トラックの各サブ区域２３におけるデータ・フォーマットが示されている。サブ領域は、それぞれ、長さが３６ハイトの１１のブロックから構成される。最初の２ブロツク３０は、プリアンプルであり、一方、最後のブロック３１は、ポストアンブルである。残りの８ブロツク３２は、“サブ・データ区域”を構成する。各ブロック３２は、４バイトの“サブＩＤ”領域３３と、３２バイトの“サブ・データ”領域３４から構成され、その構成は、第１４図の下部に示されている。サブＩＤ領域３３は、同期バイト、２つの情報を納めたバイトＳＷ１、ＳＷ２、及び、パリティ・バイトから構成される。バイトＳＷ２は、全体としてブロックに関する情報（タイプ及びアドレス）及びサブ・データ領域３４の構成を記憶するのに用いられる。バイトＳＷ１は、サブ・コードの記憶に用いられる。各ブロック３２のサブ・データ領域３４は、４つの８バイトの“パック”３５にまとめられた３２バイトから構成される。これらのパック３５は、サブ・コードの記憶に用いられ、記憶されるサブ・コードのタイプは、各パックの最初の半バイトを占めるパック・タイプ・ラベルによって表示される。全偶数ブロックの第４のパック３５は、ゼロにセットすることもできるし、さもなければ、第３のパックと同じにする場合もあり、一方、全奇数ブロックの第４のパックについては、そのブロック及び先行ブロックの両方に関する最初の３つのパックについて、パリティ・チェック・データを記憶するために用いられる。要するに、ユーザ・データは、各トラックの主データ領域ブロック２７の主データ領域２９に記憶され、一方、サブ・コードは、サブ・データ領域ブロック３２のサブＩＤ及びサブ・データ領域３３．３４と、主データ区域ブロック２７の主データ領域２８．２９の両方に記憶することができる。本説明のため間層となるサブ・コードは、特定のトラックが属しているテープ区域の識別に用いられる区域ＩＤサブ・コードと、レコード及び分離マークのカウントの記憶に用いられるいくつかのサブ・コートである。区域ＩＤサブ・コードは、３つの位置に記憶される４ヒツト・コードである。まず、該サブ・コートは、トラックのサブ・データ区域における全ブロックのサブ・データ領域３４の第３と第４のパックに記憶される。次に、それは、最初のブロックから始まる、トープ区域については、第１５図に関連して後述する。レコード及び分離マークのカウントを記憶するために用いられるサブ・コードが、テープのデータ区域内における各トラックのサブ・データ区域における全ブロックのサブ・データ領域３４の最初の２つのパック３５に記憶される（第１５図に関して後で参照のこと）。これらのカウントは、前述のグループ情報テーブルにおけるカウントと同じ累積カウントである。これらのカウントは、テープの高速探索に用いられ、このプロセスを容易にするため、グループを構成する１組のフレームにわたって一定しており、グループをなすフレームのトラックに記憶されるカウントは、グループの終端に適用可能なカウントである。次に、本記憶方法及び装置によって実現するテープに沿ったフレームの一般的な編成について考察する。例えば、第１５図を参照すると、テープは、３つの主たる区域、すなわち、リート・イン区域３６、データ区域３７、及び、データの終り（ＥＯＤ）区域３８に編成されることが分る。テープの両端は、ＲＯＭ（媒体の始端）及びＥＯＭ（媒体の終端）と呼ばれる。ユーザ・データは、データ区域３７のフレームに記録される。リード・イン区域３６には、記録の始端ＢＯＲマークと、システム情報か記憶されているデータ区域３７の間の区域が含まれている。区域ＩＤサブ・コートは、システム区域、データ区域３７、及び、ＥＯＤ区域３８を互いに区別できるようにする。データ区域のフレーム４８は、それぞれ、一定数のフレーム（例えば、２２）からなるグループ３９にまとめられ、任意選択により、これらのグループ３９は、所定の内容を備えた１つ以上のアングル・フレームによって互いに分離される。ユーザ・データ・レコードの編成に関連して、これらのグループは、第１図（Ｃ）に関連して解説のグループ３に対応する。従って、こうしたグループ３９にユーザ・データを組み入れても、ユーザ・データの論理セグメンテーションとは無関係であり、このセグメンテーションに関する情報（レコード・マーク、分離マーク）は、グループ内のユーザ・データの端に位置するインデックス４０に納められる（インデックスは、実際には、グループ内におけるユーザ・データ空間を占有する）。第１５図には、グループの最後のフレームの最終部分を占めるインデックスが示されているが、これが正しいのは、データがテープに記録される前に通常実施されるバイトのインターリーブ動作に先立つデータ構成に関してのみであるが、本目的のため、インターリーブ動作を無視することができる。実際には、インデックス内の情報は、グループにおけるトラックの主データ区域内で物理的に分散している。第２図には、インデックス４の内容が示されており、前述のように、インデックスは、２つの主データ構造、すなわち、グループ情報テーブル及びブロック・アクセス・テーブルから構成される。グループ情報テーブルは、グループの終端における定位置に記憶され、グループの内容と関係な（同じサイズである。対照的に、ブロック・アクセス・テーブルは、グループの内容に従ってサイズが変動し、グループ情報テーブルから逆方向に延びて、グループのフレームにおけるユーザ・データ区域の残りの部分内に入り込む。ブロック・アクセス・テーブル内において、エントリはグループ情報テーブルから実際のユーザ・データすなわち゛パット°との境界へと逆方向に作成される。第１５図には、データ区域グループ３９内におけるサブ・データ区域ブロック３２の内容も示されている。前述のように、最初の２つのパックには、分離マーク・カウントか含まれ、第２のベック３５には、レコード・カウントＲＣ（定義済み）も含まれ、第３のパック３５には、区域ＩＤ及び絶対フレーム・カウントＡＦＣが含まれている。グループ内の全てのトラックに関して、カウントＦＭＣ，及び、サブ、データ区域ブロックに保持されたＲＣは、グループ・インデックス４０のグループ情報テーブル４１に保持されたものと同じである。第１６図は、上述のテープ・フォーマットに従ってユーザ・データを圧縮し、記録するための記憶装置のブロック図である。該装置には、第１１図に関連して部分的に既述したテープ・デツキ１１か含まれている。テープ・デツキ以外に、該装置には、バス５５を介して該装置とホスト・コンピュータ（不図示）のインターフェイスを行なうインターフェイス・ユニット５０、主データ区域及びサブ・データ区域ブロック２Ｔ及び３２に納められ、そこから取り出されるユーザ・レコード・データ及び分離データに処理を施すデータ圧縮プロセッサ（ＤＣＰ）及びフレーム・データ・プロセッサ５２から構成されるグループ・プロセッサ５１、トラックの書込み／読取りを行ない、２つのヘッド）（Ａ、ＨＢを適宜スイッチするための信号を合成／分解する信号編成器５３、及び、インターフェイス・ユニット５０を介してコンピュータから受信する指令に応答し、該装置の動作を制御するためのシステム・コントローラが含まれている。該装置の主コンポーネント・ユニットのそれぞれについて、以下でさらに説明を行なうものとする。まず、データ圧縮プロセッサ（ＤＣＰ）またはデータ圧縮エンジンの構造及び動作について述べることにする。第１７図を参照するが、エンジンの中心部は、ＬＺＷアルゴリズムにしたがって、与えられたデータに圧縮および復元を行うことのできるＶＬＳ　Ｉデータ圧縮チップ（ＤＣチップ）である。しかし、一度に、２つのプロセス（圧縮または復元）のうちの１つだけしかすることができない。チップを流れるデータの速度を平滑にするために、ＤＣチップの入力および主力に、２つの先入れ先出しくＦ　Ｉ　ＦＯ）メモリがある。一部のデータ・パターンでは、処理するのに、他のパターンよりも多（のクロック・サイクル／バイトを要するので、チップを流れるデータ速度は一定ではない。瞬間データ速度は、現在の圧縮比および辞書エントリの衝突回数により決まるが、そのいずれも、現在のデータおよび最後の辞書ＲＥＳＥＴ以来のデータの全シーケンスにより異なる。サブシステムの第三セクションは、現在の辞書エントリの局所記憶のために使用する外部辞書メモリ（ＥＤＭ）を形成するスタティックＲＡＭ列である。該エントリには、文字、コード・ワード・ポインタ、および制御フラグを含む。第１８図には、ＤＣ集積回路のブロック図が示されている。ＤＣチップは、３つのブロック、すなわち、入力／出力変換器（ＩＯＣ）、圧縮及び復元変換器（ＣＤＣ）　、及び、マイクロプロセッサ・インターフェイス（ＭＰＩ）に分割される。ＭＰＩセクションは、ＤＣチップを制御し、観測するための機能を提供する。該セクションには、６つの制御レジスタ、８つの状態レジスタ、２つの２０ビツト入力及び出力バイト・カウンタ、及び、プログラマブル自動辞書リセット回路が含まれている。制御及び状態レジスタに対するアクセスは、汎用８ビツト・マイクロプロセッサ・インターフェイス・バスを介して行なわれる。制御レジスタは、各種チップ機能を使用可能及び使用禁止にし、該チップをさまざまな動作モード（圧縮、復元、排出、または、モニタ）にする。状態レジスタは、チップ内の２０ビツト・カウンタ及び各種状況フラグにアクセスする。辞書をかなり頻繁にリセットすることによって、圧縮比の改善が可能であることが分った。これは、特に、圧縮されるデータ・ストリームに同様のバイト・ストリングがごくわずかしか含まれていない場合にあてはまる。頻繁な辞書のりセットには、２つの重要な利点がある。第１に、辞書をリセットすると、コード・ワード長が９ビツトに戻る。第２に、このデータ・ストリームを反映した新しい辞書エントリを作成することができる（一種の適応）。ＤＣチップのインターフェイス・セクションには、圧縮比を動的にモニタし、適合すると、辞書を自動的にリセットする回路要素が含まれている。データに冗長性がほとんどないか、あるいは、全くなければ、はとんどのデータ圧縮アルゴリズムは、その出力を拡張する。ＩＯＣセクションは、バイト・ストリームと可変長コード・ワード（９ヒツト〜１２ヒツトの範囲）のストリームとの間における変換プロセスを管理する。８つの予約コード・ワードのうちの２つが、ＩＯＣによって排他的に用いられる。これらのコード・ワードの１つは、ＩＯＣに対し、コード・ワードの長さを１つだけインクリメントしなければならないことを命じるために用いられる。例えば、コード・ワード・サイズのプロセスは、ＣＤＣセクションから切り離される一ＩＯＣは、独立したパイプ・ライン・プロセスに従って処理を行なうので、ＣＤＣは、ＩＯＣによって減速することなく、圧縮または復元を行なうことが可能になる。ＦＬＵＳＨ（または“　レコードの終わり゛　（ＦＯＲ））コード・ワードである第二予約コード・ワードは、次のコード・ワードがデータの現在のパケットに関連する最後のコード・ワードであること、すなわちＦＬＵＳＨコード・ワードが実際には圧縮レコードの最後から２番目であることをＩＯＣに警告する。この情報から、ＩＯＣは、そのバッキング・ルーチンを終了し、バイト境界で終わることを知る。この特徴により、このパケットをその構成パケットに復元する機能を維持しながら、多数の入力パケットを１つの隣接出力パケットに圧縮することができる。ＩＯＣは、警告することなく、データを入力から出力に直接送ったり、データの可能な圧縮比をモニタしながらデータを送ることもできる。これらの特徴は、別のレヘルの拡張保護として用いることかできる。ＣＤＣセクションは、復元データから圧縮データへの変換、及び、この逆を実施するエンジンである。このセクションは、最大データ・スループットに合わせて調整された制御、データ経路、及び、メモリ素子から構成される。ＣＤＣは、２つの１２ビツト・ハスを介してＩＯＣとインターフェイスする。圧縮時、ＩＯＣは、入力バイトをＣＤＣセクションへ排出し、そこでコート・ワードに変換する。これらのコード・ワードは、ＩＯＣに送られ、ハイドをなすようにバックされて、チップから送り出される。逆に、復元時に、ＩＯＣは、入力バイト・ストリームをコード・ワードのストリームに変換し、これらのコード・ワードをＣＤＣセクションに送って、これらがバイト・ストリームに変換され、ＩＯＣに送られるようにする。ＣＤＣセクションは、また、辞書エントリの記憶に用いられる外部ＲＡＭに対して直接インターフェイスする。ＣＤＣは、２つの予約コート・ワードを利用する。第１の予約コート・ワードは、辞書がリセットされた場合にはいつでも用いられる。このコード・ワードの発生によって、２つのアクションが生じる。すなわち、ＩＯＣは、９ビツトのコード・ワードをバックまたはアンバックする状態に戻り、ＣＤＣは、現在の辞書をリセットし、新しい辞書の構築を開始する。辞書のリセットは、マイロプロセッサの制御を介してＭＰＩによって、あるいは、自動リセット回路要素によって要求される。第２の予約コード・ワードは、ＣＤＣが新しい辞書エントリを構築しようとしていて、利用可能な外部ＲＡＭを使い果たすと、いつでも圧縮時に生成されることになる。この事象は、外部ＲＡＭが十分であれば、めったに生じることはない。ただし、メモリの量か減少すると、ＣＤＣが遭遇する辞書衝突が多くなりすぎて、新しい辞書エントリの構築かできなくなる可能性か高くなる。外部メモリが小さくなり、不可避的に辞書の衝突が増すと、データ・スループット及び圧縮性能は、わずかに劣化する。ＣＤＣによる復元時には、復元プロセスが、圧縮プロセスと同じポイント辞書エントリの構築を停止することを保証するため、この“全辞書”コートも用いられる。次に、第１６図に戻ると、データ記憶装置は、コンピュータからの指令に応答して、テープをロート／アンロードし、データ・レコードまたは分離マークを記憶し、データ圧縮を可能にし、選択された分離マークまたはレコードを探索し、次のレコードを読み返すように構成されている。インターフェイス・ユニット５０は、コンピュータから指令を受けて、装置をコンピュータの間におけるデータ・レコード及び分離マークの転送を管理するようになっている。コンピュータから指令を受信すると、インターフェイス・ユニット５０は、システム・コントローラ５４に送り、該コントローラは、そのうち、インターフェイス・ユニット５０を介して、もとの指令に従うか否かを表わす返答をコンピュータに送り返す。該装置が、システム・コントローラ５４によって、コンピュータからの指令に応答し、データの記憶または読取りを行なうようにセット・アップされると、インターフェイス・ユニット５０は、コンピュータとグループ・プロセッサ５１の間におけるレコード及び分離マークの移送も制御する。データ記憶時、グループ・プロセッサ５１は、必要があれば、ユーザ・データを圧縮し、データ・レコードの形でそれに与えられるユーザ・データを、それぞれ、データ・グループに対応するデータ・パッケージに編成するように構成されている。プロセッサ５１は、また、各グループ毎に、インデックスと、対応するサブ・コートを構成するようになっている。読取り時には、グループ・プロセッサは、復元前に、テープから読み取られたグループからデータ・レコード及び分離マークを回復できるようにする逆プロセスを実施する。グループ・プロセッサ５１の形態が、第１９図に示されている。グループ・プロセッサ５１の中心をなすのは、２つ以上（例えば２つ）のグループをなすデータ量を保持するようになっているバッファ５６である。入力データ及び出力データに対するバッファ空間の割当ては、バッファ空間マネージャ５７によって制御される。プロセッサ５１は、第１のインターフェイス・マネーンヤ５８を介してインターフェイス５０と、第２のインターフェイス・マネージャ５９を介してフレーム・データ・プロセッサ５２と通信する。グループ化プロセスの全体的な制御は、記録時にグループ・インデックス及び関連コートを生成しく機能ブロック６１）、読取り時にサブ・コードを生成する（機能ブロック６２）グループ化マネージャ６０によって実施される。グループ化マネージャ６０は、システム・コントローラ５４と協調信号を交換するようになっている。ＤＣプロセッサＤＣＰは、テープに記憶するためにデータを圧縮したり、あるいは、ホストによる読取りのためにデータを復元したりする働きをする。制御信号の交換のため、ＤＣプロセッサＤＣＰと、インターフェイス・マネージャ５８、バッファ５６、バッファ空間マネージャ５７、及び、グループ化マネージャ６０との間で、相互接続が行なわれている。グループ化マネージャ６０は、また、圧縮データをエンティティに編集して、エンティティに関するヘッダ一部分を生成するエンティティ・マネージャ（ＥＭ）から構成される。グループ化マネージャ６０及びバッファ空間マネージャ５７は、制御コンポーネントであり、テープに書き込むデータは、それらを介して送られるのではなく、バッファ５６からインターフェイス・マネージャ５９へ直接送られる。記録時に、ホストが、データ・レコードを送り出す際、インターフェイス・ユニット５０は、バッファ空間マネージャ５７に対しくインターフェイス・マネージャ５８を介して）、プロセッサ５１がレコードを受（ｊ取る準備が整ったか否かを問い合わせる１、）＼ソファ空間マネージャ５７は、最初、゛待機°応答を送るが、そのうち、ホス１−からハファ５６へのデータ・レコー　ドの転送を可能にする４゜データが圧縮される場合（システム・コントローラ５４からの制御信号に従って）、ＤＣプロセッサは、前述のように、データ圧縮アルゴリズムに基づき、レコード内のデータの一部の代りにコート・ワードを用いる。データストリームの特定ポイントでの、アクセス可能なＲＥＳＥＴおよびＦＬＵＳＨコード・ワードの書込みは、簡単な方法、例えば各レコード後のりセント、などにより指定することができるならば、ＤＣプロセッサＤＣＰにプログラムすることができる。この他に、あるいは同様に、フォーマットにしたがうＲＥＳＥＴおよびＦＬＵＳＨコート・ワードの書込みは、システム・コントローラ５４により制御することができ、例えば、各レコードの終わりに自動的に書き込まれるＦＬＵＳＨコード・ワード、およびシステム・コントローラ５４からの信号にしたがって書込まれるＲＥＳＥＴコード・ワードがある。第１９図は、゛　インライン′　システムと呼ぶことがあり、ここではＤＣプロセッサＤＣＰがインタフェース・マネージャ５８とバッファ５６の間に置かれている。圧縮中に、データは、インタフェース・マネージャ５８からＤＣプロセッサを通りバッファ５６に流れる。復元中に、データは、バッファ５６からＤＣプロセッサを通りインタフェース・マネージャ５６に流れる。インタフェース・マネージャ５６とＤＣプロセッサＤＣＰとの間に著しいバッファリングはない。システム透視図から圧縮中に“フラッシュ”状態が都合よく得られる。Ｘハイドが入力し、Ｙハイドが出力する。復元中の同じフラッシュ状態も同様に都合よく得られる。Ｙノ・イトが入力し、Ｘバイトが出力する。これらの起こることができたり起こらなければならない境界は、圧縮中のそれと同じである。圧縮中に特別Ｆ　Ｌ　Ｕ　Ｓ　Ｈコード・ワードを出力し、復元中の検出されたときにいつでもフラッシュすることにより、圧縮／復元システムで幾つかの利点か得られる。ＤＣ／ステムを用いないバッファへの書込みでは、インタフェース・マネージャからバッファへのＮハイドの転送をセットアツプおよび完了することが伴う。ＤＣシステムを用いると、これは２回の転送になり、ＤＣプロセッサへのＮバイトの転送、およびそこからバッファへのＭバイトの転送がある。転送が完了したならば、転送に対応するすべてのデータをバッファの中に入れることが望ましい。したがって、ＤＣシステムをフラッシュしなければならない。バッファからの読取りでは、バッファからインタフェース・マネージャへのＮバイトの転送をセットアツプすることが必要である。ＤＣシステムを用いるときには、バッファ５６からＤＣプロセッサへのＭバイトの転送、およびそこからインタフェース・マネージャ５８への転送になる。転送が完了したならば、再び、ＤＣプロセッサをフラッシュすることが望ましい。一般に、複数レコードの転送は、レコードがより短かければ道理にかなうが、ホストは、１度に１つずつレコードを転送する。本システムでは、ＲＥＳＥＴおよびＦＬＵＳＨ機能が分離している。これまでの記述では辞書のリセットについて何も示唆していないことを書き留めておく。ＦＬＵＳＨ機能は、ＲＥＳＥＴ機能と全く分離されている。これらを分離することにより、辞書に影響を及ぼしたり、圧縮比および処理量に及ぼされるそれ以後の影響もなく、転送間の境界をデータに導入することができる。ＤＣシステムは辞書を完全に作成する前にフラッシュすることができるので、類レコード・システムでさえ完全な辞書を用いることかできる。非常に優れた圧縮比をもたらす“優れた”辞書が作成されたならば、それ以上のレコード中に再び作成する必要はない。ＲＥＳＥＴとＦＬＵＳＨとを結合すると、これらの利点は失われる。グループ化マネージャ６０は、バッファ空間マネージャ５７に接続されており、バッファ空間マネージャ５７に対して、グループのインデックス区域内に入り込む前に、グループがどれだけのデータを受け入れることができるかを知らせる。バッファ空間マネージャ５７は、最大数のバイトを現在グループに転送したか、あるいは、ホストから最後のハイドを受け取った場合には、必ず、グルニブ化マネージャに通告する。ホストから転送される全てをグループ内に納めることができない場合、グループの境界に“またがる“と言う。転送の最初の部分は、１つのグループに納められ、残りの部分は、後続のグループに納められる。バッファ空間マネージャ５７は、ホストが構築される現在グループに納まる量を超えるデータを供給しようとする場合、グループ化マネージャ６０に知らせる。またがらなければ、グループ・インデックスか更新され、グループ化マネージャ６０は、別の書込み指令を待つ。またがることになれば、現在グループのインデックスが更新され、そのグループは、テープに対する書込みに利用できる。次のグループが開始され、ホストからのデータは、その新しいグループの始端に直接入り込む。レコードは、その一部を形成することになるグループ内における、レコード・データの最終的な位置決めに対応するバッファ位置へ転送される。レコード・サイズの情報は、グループ化マネージャ６０に送られる。ホストが分離表示を送ると、これも、グループ化マネージャ６０に対して経路指定される。グループ化マネージャは、分離マーク及びＢＯＲからのレコード・カウントを記憶しておき、グループのインデックス及び分離カウンタ及びレコード・カウントのサブ・コードの構成時にこの情報を利用する。インデックスは、グループの終端におけるその位置に適合するバッファ内の位置に構成される。並行して、エンティティ・マネージャＥＭは、圧縮レコード・データを含む、現在エンティティに関するエンティティ・ヘッダ一部分を生成する。ヘッダ一部分は、圧縮されない。エンティティ・マネージャＥＭは、エンティティ情報を管理する規則を確実に遵守する責任がある。該規則は、次の通りである。ａ）：１）グループの始端後、できるだけ早く、１１）ホストから送られるレコードの非圧縮サイズが、変化すると、１ｉｉ）圧縮アルゴリズムが、変化すると、新しいエンティティを開始する。（上記ｌ）及び１ｉｉ）に関して、アクセス・ポイントの必要から、新しいエンティティの開始が必要になり、適合する信号が、グループ化マネージャ６０からデータ圧縮プロセッサＤＣＰに送られる。）ｂ）：１）非圧縮レコードの記憶が必要な場合、１１）分離マークの記憶が必要な場合、エンティティを終了する。各エンティティの形成によってＢＡＴエントリがトリガされる。グループが一杯になると、新しいグループが開始されるまで、データ圧縮及びエンティティ構築のプロセスが停止する。入力データを圧縮すべきでない場合、データは、不変のまま、ＤＣプロセッサＤＣＰを通過し、エンティティ°マネージャＥＭは、非活動状態になる。復元レコードは、エンティティの一部を形成することなく、直接グループをなすように編成され、レコードに関する情報は、グループ・インデックスに納められる。グループ（そのインデックス及びサブ・コードを含む）がアセンブルされると、フレーム・データ・プロセッサ５２に転送されて、２２の順次フレームの主データ区域及びサブ・データ区域を構成するブロツクに編成される。フレームＩＤに関する情報は、データ・ストリーム内にある。３フレ一ム分のデータ量の記憶が可能なフレーム・データ・プロセッサ５２において、グループ・プロセッサと小形バッファの間には、連続したデータ・ストリームがある。前述のように、テープに記録されたフレームのグループ間に、１つ以上のアンプル・フレームを挿入するのが望ましい場合ある。これは、フレーム・データ・プロセッサ５２が、グループ・プロセッサ５１からの命令によって、あるいは、プロセッサ５２がグループ構造を承知している場合には、自動的に、グループの終端にこうしたアンプル・フレームを生成するように構成することによって、可能になる。バッファ５６を、２グループに相当するデータを保持することができるようなサイズにすることにより、プロセッサ５１の全体の動作では、１つのグループを読み込み、１つのグループを処理および出力して、できる限り容易に保つことができる。書込み中には、ホストからのデータを用いて１つのグループを作成し、別のグループはテープに書き込まれる。テープからデータを読み取っている間、グループ・プロセッサ５１は、フレーム・データ・プロセッサ５２からフレーム毎にユーザ・データとサブ・コートを受け取るようになっており、該データは、バッファ５６に書き込まれて、グループを形成する。次に、グループ・プロセッサ５１はグループ・インデックスにアクセスして、グループ内におけるユーザ・データの論理的編成（レコード／エンティティ構造、分離マーク）に関する情報、及び、データが圧縮されているか否かの表示を回復することかできる。データが復元されると、あるいは、データは、圧縮されているが、圧縮形式でホストに読み返されて、ソフトウェア復元か施されると、グループ・プロセッサ５１は、インターフェイス５０を介してホストに要求されたレコードまたは分離マークを送ることが可能になるが、この場合、データは、不変のままＤＣプロセッサＤＣＰを通過する。圧縮データのエンティティ・ヘッダ一部分は、非ＤＣドライブによってホストに送り返され、ホストによって利用される。データを圧縮して復元する場合、データは、すてに述ぺたようにしてＤＣプロセッサＤＣＰにより復元してから、ホストに送られる。各エンティティからのヘッダ部は、ＤＣドライブで使用されるが、ＤＣプロセッサＤＣＰに送られない。ヘッダ部のアルゴリズム番号は、ＤＣプロセッサＤＣＰで用いるアルゴリズムと一致しているかどうかがチェックされる。さらに、エンティティの圧縮レコード数はヘッダ部から得られ、エンティティ・データをＤＣプロセッサＤＣＰに送るときに行われるレコードのカウントダウンをすることができる。フレーム・データをアセンブルして、１グル一プ分のデータに戻すのを容易化するため、フレームがテープに書き込まれる時、各フレーム毎に、グループ内シーケンス番号のタグを付けることができる。このグループ内番号は、例えば、フレームの各トラックの主データ区域における第１ブロツクの主データ領域のヘッダーに含まれるサブ・コードとして示すことができる。このサブ・コードは、読取りの際、グループ・プロセッサ５１に送られると、関連フレームがバッファ５６内のどの位置に納められるか判定するために用いられる。フレーム・データ・プロセッサ５２は、機能的に、主データ区域（ＭＤＡ）プロセッサ６５、サブ・データ区域（ＳＤＡ）プロセッサ６６、及び、サブ・コード・ユニット６７から構成される（実際、これらの機能素子は、適合するプロセスを実行する単一のマイクロプロセッサで構成することができる）。サブ・コード・ユニット６７は、書込み時には、必要に応じてプロセッサ６５及び６６にサブ・コードを与え、読取り時には、プロセッサ６５．６６からサブ・コートを受け取って、分配するようになっている。情報の内容に応じて、サブ・コートは、グループ・プロセッサ５１またはシステム・コントローラ５４が生成／要求することができ、分離マーク・カウント・サブ・コードは、例えば、グループ・プロセッサ５１によって判定／利用され、一方、区域ＩＤサブ・コートは、コントローラ５４によって判定／利用される。いくつかの書込みパラメータのような非変動サブ・コードの場合、ユニット６７にサブ・コードを永久記憶することもできる。さらに、サブ・コート・ユニット６７自体によって、便宜上、フレーム従属サブ・コードを生成することも可能である。ＭＤＡプロセッサ６５は、関連するサブ・コードと共に、１フレ一ム分のユーザ・データを１度に処理するようになっている。例えば、−プロセッサ６５は、記録時、ユニット６７からのサブ・コートと共にグループ・プロセッサ５１から１フレ一ム分のユーザ・データを受け取る。ユーザ・データを受け取ると、プロセッサ６５は、データをインターリーブし、結果得られるデータ及びサブ・コードをアセンブルして、フレームを構成する２つのトラックに関する主データ区域ブロックを出力する前に、エラー補正コードの計算を行なう。実際、ユーザ・データとサブ・コートのアセンブル前に、データのスクランプリング（ランダム化）を実施することで、トラック信号のデータ内容に関係なく、−貫したＲＦエンベロープを確保することができる。読取り時、プロセッサ６５は、同じフレームに関連した２組の主データ区域ブロックに対して逆のプロセスを実施する。スクランプリングを施していない、エラー補正を加えた、ディンターリーブされたユーザ・データが、グループ・プロセッサ５１に送られ、サブ・コードが、ユニット６７によって切り離され、必要に応じて、プロセッサ５１とシステム・コントローラ５４のいずれかに分配される。ＳＤＡプロセッサ６６の動作は、トラックのサブ・データ区域に関連したサブ・コードに従って動作し、これらのサブ・コートをサブ・データ区域ブロックに合成したり、サブ・データ区域ブロックを分解して、サブ・コードにしたりするという点を除けば、プロセッサ６５と同様である。信号編成器５３は、記録（データ書込み）時に、ＡＴＦ回路８０からのＡＴＦ信号と共に、フレーム・データ・プロセッサ５２によって与えられる主データ区域ブロック及びサブ・データ・区域ブロックをアセンブルし、各順次トラックに記録される信号を形成するようになっているフォーマツタ／セパレータ・ユニット７０から構成される。ユニット７０が必要とする場合には、トラック信号に、必要なブリアセンブル及びポストアンブル・パターンも挿入される。ヘッド・ドラムの回転に応答してパルス発生器８１の出力か供給されるタイミング発生器７１によって、ユニット７０の動作とヘッドＨＡ、ＨＢの回転を協調させるタイミング信号が加えられる。ユニットから回線７２に出力されるトラック信号は、ヘッド・スイッチ７３、それぞれのヘッド駆動増幅器７４、及び、記録位置にセットされた記録／再生スイッチ７５を介して、ヘッドＨＡ及びヘッドＨＢに対し交互に送られる。ヘッド・スイッチ７３は、適正に調時されたタイミング発生器７１からの信号によって動作する。再生（データ読取り）時、ヘッドＨＡ及びＨＢによって交互に発生するトラック信号は、記録／再生スイッチ７５（この場合、再生位置にセットされている）、それぞれの読取り増幅器７６、第２のヘッド・スイッチ７７、及び、クロック回復回路７８を介して、フォーマ・ｙり／セパレータ・ユニット７０に送られる。ヘッド・スイッチ７７の動作は、ヘッド・スイッチ７３と同じやり方で制御される。この場合、ユニット７０は、ＡＴＦ信号を切り離して、回路８０に送り、主データ区域ブロック及びサブ・データ区域ブロックをフレーム・データ・プロセッサ５２に送る働きをする。プロセッサ５２には、クロック回復回路７８からクロック信号も送られる。スイッチ７５は、システム・コントローラ５４の制御を受ける。テープ・デツキ１１は、４つのサーボ、すなわち、キャプスタン１５の回転を制御するためのキャブズタン・サーボ８２、それぞれ、リール１４．１５の回転を制御する第１と第２のリール・サーボ８３．８４、及び、ヘット・ドラム１２の回転を制御するドラム・サーボ８５から構成される。各サーボには、両方とも、サーボによって制御される素子に結合された、モータＭ及び回転検出器りが含まれている。リール・サーボ８３．８４には、媒体の始端（ＢＯＭ）及び媒体の終端（ＥＯＭ）の検知手段８６が連係しているが、これらの手段８６は、例えば、どちらであれ、テープの巻取りのために駆動されているリール（テープの移動方向によって決まる）のモータ電流は、ＢＯＭ／ＥＯＭにおけるモータの停動時には大幅に増加するので、モータ電流の検知に基づくことが可能である。テープ・デツキ１１には、さらに、データ記録時に、テープに対する記録のためのＡＴＦ信号を発生する自動トラック追従回路８ｏが設けられている。読取り時、ＡＴＦ回路８０は、テープから読み取られたＡＴＦ　ｌ−ラック信号に応答して、キャブズタン・サーボ８２に調整信号を加え、ヘッドＨＡＳＨＢとテープに記録されたトラックとの適正なアライメントがとれるようにする。テープ・デツキ１１には、ヘッドＨＡＳＨＢの回転に同期したタイミング・パルスを発生するパルス発生器８１も含まれている。テープ・デツキ１１の動作は、サーボ８２〜８５及びＢＯＭ／ＥＯＭ検知手段８６に接続されたデツキ・コントローラ８７の制御を受ける。コントローラ８７は、サーボに必要な距離だけテープを進めさせる働きをする（公称速度または高速度で）。この制御は、設定されたテープ速度に適した時間間隔だけサーボに付勢するか、あるいは、サーボに連係した回転検出器りのうち１つ以上の検出器からテープ変位情報をフィードバックすることによって行なわれる。デツキ・コントローラ８７は、それ自（本、システム・コントローラ５４が送り出す制御信号によって管理される。デツキ・コントローラ８７は、ＢＯＭ及びＥＯＭに達したことを表わす信号をコントローラ５４に対して出力するようになっている。システム・コントローラ５４は、コンピュータと記憶装置の間における高レベルの対話を管理し、コンピュータが要求するロード／書込み／圧縮／復元／探索／読取り／アンロードといった基本操作の実施時に、記憶装置の他のユニットの機能に調整を施すという両方の働きをする。この後者に関して、コントローラ５４は、デツキ１１の動作と記憶装置のデータ処理部分との調整を行なう働きをする。テープ・デツキ１１の制御において、システム・コントローラは、デツキ・コントローラ８７に対し、通常読取り／書込み速度（Ｎｏｒｍａｔ）でテープを移動させる要求、あるいは、高速度でテープを順方向または逆方向に移動させる要求、すなわち高速送り（Ｆ、ＦＷＤ）または高速巻戻しくＦ、ＲＷＤ）の要求を行なうことができる。デツキ・コントローラ８７は、ＲＯＭまたはＥＯＭに到達すると、システム・コントローラ５４に報告するようになっている。次に、復元のためにレコードの位置を突きとめる動作について、第２０Ａ図及び第２０Ｂ図に関連して解説する。ホストがレコードを復元するように指令を出すと、コントローラ５４は、復元すべきレコードのレコード・カウントに等しい値を備えた探索キーを生成する。現在のレコード・カウントは、グループ・プロセッサ５１のグループ化マネージャ６ｏに保持されている。次に、テープが高速度で（通常の何倍も速い）進められ（あるいは、適切であれば、巻き戻され）、一方、ヘッド・ドラムは、テープに対してヘッドＨＡ、ＨＢの相対速度を一定値に維持する速度で回転するが、このモードの場合、３００毎に約１つのトラックのサブ区域を読み取ることが可能である（ステップ９１ａ及び９１ｂ）。トラックのサブ区域の高速読取りは、既知の技法であり、従って、詳細な説明は行なゎな第２０Ａ図には、高速順方向探索が示され、第２０Ｂ図には、高速逆方向探索か示されている。高速順方向探索時には（第２０Ａ図）、順次読み取られる各サブ区域毎に、各サブ・データ区域ブロックの第２のパックに保持されたレコード・カウントと探索キーが、コントローラ５４によって比較される（ステップ９２ａ）。レコード・カウントが、探索キー未満の場合、探索は続行されるが、レコード・カウントが、探索キー以上の場合、高速順方向探索が終了し、テープは、高速順方向読取り間の距離にほぼ等しい距離だけ後退する（ステップ９３）。この結果、現在、ヘット・ドラムと向かい合ったトラックのサブ区域に保持されたレコード・カウントが、必ず探索キー未満になる。高速逆方向探索時には（第２０Ｂ図）、順次読み取られる各サブ区域毎に、各サブ・データ・ブロックの第２のバックに保持されたレコード・カウントと探索キーが、コントローラ５４によって比較される（ステップ９２ｂ）。レコード・カウントが探索キーを超える場合、探索は続行されるが、レコード・カウントが探索キー以下の場合、高速巻戻しが停止される。次に、高速正方向および高速逆方向探索では、テープはその通常の読取り速度で前進され（ステップ９４）、各連続するグループは次にテープから読み取られ、グループ・プロセッサ５１のバッファ５６に一時的に記憶される。各グループのインデックスに保持されるレコード・カウントは、カウントが最初にサーチ・キーと等しくなるか越えるまで、サーチ・キー（ステップ９５）と比較される。この時、レコード・カウントをちょうど試験したばかりのバッファ５６のグループに、探索していたレコードが存在するときに、読み取りか停止する。１つのレコード毎にブロック・アクセス・テーブルにエントリをする場合には、このグループのインデックスのブロック・アクセス・テーブルが検査されて、重要なレコードを識別しくステップ９６）、最初のデータ・レコード・バイトのバッファの中のアドレスが計算される（ステップ９７）。その後で、グループ・プロセッサ５１は、検索していたレコードを見つけたこと、および次のデータ・レコードを復元および読み込むことかできることを、システム・コントローラ５４に通知する。すなわち、これはコントローラからさらにホストに通知される（ステップ９８）。探索動作はこれで終了する。もちろん、他の探索方法を実施することができるのは、明らかである。高速で探索中に、テープのデータ区域の墳界を越えると、その検出を行なうため、サブ区域の読取り時には、必ず、システム・コントローラ５４によって区域ＩＤサブ・コードのチェックが行なわれる。このサブ・コードによって、テープのデータ区域を越えて探索が行なわれたことが示されると、テープ方向が逆転し、一般に、低速度で探索が再開される。分りやすくするため、１２０Ａ図及び第２０Ｂ［ｆｆｌからこの区域ＩＤチェックは省略されている。関係するレコードの位置を突きとめると、次のステップは、レコード内におけるデータ圧縮にどのアルゴリズムが用いられたかを示す、アルゴリズム番号をチェックすることである。これは、アルゴリズム番号が関連グループのブロック・アクセス・テーブルに記憶されている場合、該テーブルを調べることによって行なわれる。アルゴリズム番号が、テープ・ドライブのＤＣチップ（または、２つ以上のＤＣチップがある場合には、その一方）が用いるアルゴリズムに対応する場合、次のステップは、関係するレコードを含む圧縮オブジェクトの始端を突きとめることである。これは、特定の記録フォーマットに従って、さまざまな方法で実施することができる。関係するレコードを含む圧縮オブジェクトの始端が見つかると、復元が開始され、そのレコードの終端にあるＦＬＵＳＨ（または、ＥＯＲ）コード・ワードに達するまで、続行される。次に、復元レコードをホストに送ることが可能になる。レコードの終端におけるＦＬＵＳＨコード・ワードの存在は、次のレコードの始端からデータをめなくても、レコードの復元が確実に行なえることを表わしている。圧縮レコードがエンティティをなすように編成されると、関係するグループは、第２０Ａ図及び第２０Ｂ図に関連して既述のように位置が突きとめられる。従って、グループ内におけるエンティティ・ヘッダー中の＃ＲＥＣＳエントリを用いることによって、関連するエンティティの位置を突きとめることができる。復元は、関連エンティティ内のアルゴリズムＩＤエントリをチェックすることにはよって見つけることが可能なすぐ前のアクセス・ポイントから開始され、そのエンティティ内の圧縮データが、既に開始された辞書から続いていることが示されると、アクセス・ポイントが見つかるまで、スキップして、前のエンティティ・ヘッダー等に戻る。関連するレコードから得られる復元データだけしか保持されない。従って、エンティティ・ヘッダーにデータが存在することには、関連レコード及びアクセス・ポイントが容易に見つかり、データ管理のプロセスを復元プロセスから切り離すことが可能になるという利点がある。レコードの圧縮バイト・カウントを含むエンティティにおいて、各圧縮レコードの後に後書きがあれば、これらのＣＢＣは、復元時におけるＦＬＵＳＨコード・ワードのカウントではなく（あるいは、だけではなく）、復元データの保持の開始時点を確認するのに有効に役立てることができる。従って、データ・ストリームにおける補助的情報の存在は、選択されたレコード・すぐ前のアクセス・ポイントを見つけ、復元データを保持すべきポイントを確認するのに有効に利用することができる。該探索手順は、特定の現行レコードを重ね書きするために、新しいレコードを付加するためにポイントを見つけるときに同様に用いることができる。本発明は、ヘリカル走査データ記録に限定されないことが理解される。説明した圧縮アルゴリズムは例として述べたものであり、本発明は、ユーザー・データから得られる辞書を伴う異なるアルゴリズムにしたがって圧縮されるデータの記憶にも適用することができる。ＩＧ　１特表千４−５０５９７９　（１Ｂ）ＦＩＧ４ＩＧ４Ａマイクロッ゛口で、ツブＦＩＧ１７りＶ９？　メ七り・イン５’−７，イス２要　約　書複数のレコードＣＲ，に編成されたユーザ・データ・ワードのストリームを受信するステップと、前記ユーザ・データを、該データから得られる辞書を用いて前記ユーザ・データの少なくとも幾つかをコード・ワードに変換する圧縮アルゴリズムに従って圧縮するステップと、を備えて成り、始動連続辞書間で複数のフラッシュ動作（Ｆ）を実行することを特徴とする、テープに記憶するために、ユーザ・データを圧縮する方法。国際調査報告１ｍａｍｓｌｌｓｓ＊１ＡＩＩｌｋｌ＋４ＭＭｅＰＣＴ／ＧＢ９１１０００８４Ｓ＾　４４１２９

Claims

【特許請求の範囲】

１．複数のレコード（ＣＲｎ）に編成されたユーザ・データ・ワードのストリームを受信する段階と、前記データから得られる辞書を用いてコード・ワードへ前記ユーザ・データの少なくともいくつかを変換することを含む圧縮アルゴリズムに従って前記ユーザ・データを圧縮する段階と、を備え、開始連続辞書間で複数のフラッシュ動作（Ｆ）を実行することによって特徴づけられる、ユーザ・データをテープ（１０）上に記憶するために圧縮する方法。
２．各データ・レコード（ＣＲｎ）の終りでフラッシュ動作（Ｆ）を実行する段階を備えた請求の範囲第１項記載の方法。
３．前記ユーザ・データから区別できる方法で、前記フラッシュ動作（Ｆ）が発生した位置を示す指示をテープ（１０）上に記憶する段階を備えた、請求の範囲第１項または第２項記載の方法。
４．前記ユーザ・データから区別できる方法で新しい辞書の始めの位置を示す指示をテープ（１０）上に記憶する段階を備えた、前述の請求の範囲のいずれかに記載の方法。
５．前記ユーザ・データのレコード構造とは関係なく、各グループ（Ｇｎ）の始めまたはその近くで新しい辞書を開始して、圧縮されたユーザ・データをテープへ複数のグループ（Ｇｎ）に書込む段階を備えた、前述の請求の範囲のいずれかに記載の方法。
６．各グループ（Ｇｎ）の第１番目の新しいレコード（ＣＲｎ）の始めで新しい辞書を始める段階を備えた、請求の範囲第５項記載の方法。
７．ユーザ・データ・レコードを１つのエンティティが１つ以上のレコード（Ｒｎ）を有する複数のエンティティ（Ｅｎ）に編成し、各エンティティ（Ｅｎ）の終りでフラッシュ動作（Ｆ）を実行する段階を備えた、請求の範囲第５項記載の方法。
８．ユーザ・データ・レコードを１つのエンティティが１つ以上のレコード（Ｒｎ）を有する複数のエンティティ（Ｅｎ）に編成し、各グループ（Ｇｎ）の第１番目の新しいエンティティの始めで新しい辞書を始める段階を備えた、請求の範囲第５項記載の方法。
９．前述の請求範囲のいずれかに請求された方法に従って動作する、圧縮されたユーザ・データをテープ上に記憶するためにユーザ・データを圧縮する記憶装置。