JPH09505707A

JPH09505707A - データ圧縮

Info

Publication number: JPH09505707A
Application number: JP7515623A
Authority: JP
Inventors: グリンバーグ，デニス，ネイル; ラヤゴプラン，シヴァラマクリシュナン; ヴェンカテサン，ラマラスナム; ウェイ，ヴィクター，ケーウェイ
Original assignee: ベルコミュニケーションズリサーチ，インコーポレイテッド
Priority date: 1993-12-02
Filing date: 1994-11-14
Publication date: 1997-06-03
Anticipated expiration: 2014-11-15
Also published as: CA2176479A1; EP0732008A1; JP2979106B2; CA2176479C; EP0732008A4; US5384568A; WO1995015617A1

Abstract

(57)【要約】着信するデータ・ストリームを発信する圧縮データ・ストリームに圧縮する方法並びにこれに付随する回路であって、複数のメモリまたはリストを使用する。着信データ・ストリームは一連のトークンに分割される。１次メモリ（３２６２）は各トークンを記憶し、最も最近出現したトークンがそのリストの先頭ランクを占める。２次メモリ（３２８２）はトークンのそれぞれの部分集合の前記１次メモリでの記憶位置を記憶する。圧縮データ・ストリームはトークンそれ自身、１次メモリに於けるトークンの位置、または１次メモリに於けるトークンの記憶位置についての２次メモリ内での位置の符号化表現として生成される。３次リストも２次リストの３次リストに於ける位置の符号化表現を生成するために使用することができる。リストの探索はハッシュ関数で達成される。リストの更新は木の拡張を使用する。

Description

【発明の詳細な説明】データ圧縮発明の属する分野本発明は、一般にデジタル・システムに関し、さらに詳しくは、複数リストによる先頭移動を用いてデータ・ストリームを符号化し復号するデータ圧縮信号処理回路およびこれに付随する方法に関する。発明の背景通信ネットワークと相互接続されたコンピュータによる情報システムの使用が急速に拡大したことで、デジタル記憶およびデジタル伝送システムの使用が劇的に増加した。データ圧縮は記憶前のまたは伝送前のデータの短縮に関係する。このような短縮はメモリまたは通信資源の保全に役立つ。データ情報源を統計的方法でモデル化できた場合は、最適なコード体系が所望の圧縮基準を達成するように構築されたこととなる。しかし、現実世界のデータでは、情報源の統計データを必ずしもデータ圧縮器に分かっているとは限らない。実際に、現実世界のデータは何らかの統計的モデルに適合しないのが普通である。したがって大半の現実的データ圧縮技術においてはデータ供給源の統計データを知ることなく、データを圧縮できる適応型配列構成を有することが重要である。記憶されるまたは伝送されるデータの多くは冗長である。たとえば英語、またはプログラミング言語はしばしば再使用される「ワード（複数）」を含む。この冗長性を利用する符号化の典型が周知のハフマン符号である。ハフマン方式では可変長符号語を使用し、符号語の長さは符号化した記号の出現頻度（生起確立）に相関する。あいにく、ハフマンのアプローチでは記号またはトークン（字句）の出現頻度を設定するために１回また実際の符号化を行なうためにもう１回、２回にわたってデータをパス（受け渡し）する必要がある。さらに、ハフマンの手法では１回目のパスを行なう間データブロック全体から一時記憶域が必要とされ、これに対応して遅延が発生する。１９８４年６月、ウェルチ（Welch）は"A Technique for High Performance D ata Compression"（高性能データ圧縮の技術）と題する論文をIEEE Computer Ma gazineに発表した。この論文は実用的な方法として知られるようになったLempel -Zivアルゴリズムを扱っており、高速オンライン処理のためのハッシングに基づくデータ圧縮のための（アルゴリズムの）実装を提案した。米国特許第４，５５８，３０２号はウェルチが単独の発明者となっており、彼の論文における理論的な形態で最初に導入した実装の詳細を含んでいる。さらに最近では、Fiala Gree ne（フィラーとグリーン）に交付された米国特許第４，９０６，９９１号がLemp el-Zivアルゴリズムの精巧な修正を開示しており、多くのテキスト・ファイルで良好な圧縮を実現している−−が引き替えに複雑さが大幅に増加している。１９８６年４月、Bentley，Sleator，Tarjan and Wei（ベントレイ、スレータ、ターハンおよびワイ）は"A Locally AdaptiveData Compresson Scheme"（局部適応型データ圧縮方式）と題する論文をＡＣＭ（米国計算機学会）Communicatio nsに発表した。この論文では、著者らはテキスト・データのデータ圧縮を達成するための自己調整データ構造の使用を提案している。彼らの主要な方式（スキーム）の１つは「先頭移動」ルールを使用していた。この概念については詳述する。さらに最近では、Bentley，Sleator and Tarjan（ベントレーら）に交付された米国特許第４，７９６，００３号の開示は、ハフマン符号に匹敵する短縮率（圧縮率）で、しかも１回のパスでデータ圧縮が可能であることを示している。さらに詳しくは、ワードリスト（単語リスト）を保持しており、ワードリストの各語の位置が可変長符号で符号化され、もっとも短い符号がリストの先頭を表わすような体系（システム）ならびにアルゴリズムを使用している。ある語（ワード）を通信の適用において送信しようとする（またはメモリの適用において記憶する）場合、その語についてのリストすなわちコードブックを走査する。その語がリスト上にあれば、リスト上のその語の位置を表わす可変長符号をその語自身の代わりに送信（または記憶）し、その語をワードリストの先頭に移動する。その語がワードリストになければ、そのワード自身を送信（または記憶）し、それからその語をワードリストの先頭に移動して、相対的順序を維持しながらワードリスト内の他の全ての語を「押し下げ(pushed down)」る。受信先（メモリ記憶に適用の場合には読み出し先）では送信側（または記憶機構）で実行したのと同じ動作を反復（繰返）してデータを復号する。つまり、ワードリストを構築し、可変長符号を用いてワードリストから適正な語を復元する。ベントレーらの方式では、もっとも頻繁に使用される語（複数）がワードリストの先頭の方に自動的に集るので、最小のビット数で送信または記憶される。さらに、任意の接頭語符号（接頭符号）をリスト上の単語位置を送信または記憶するのに使用でき、低い位置が最短の符号語で符号化される。また、リスト構成のヒューリスティックは、例えば選択した語を一定数の位置だけ前よりに移動する、または１つ前の位置と入れ換える等により変化させることができる。最終的に、リスト位置それ自身が新規入力データとして扱うことができ、これ自身の出力に圧縮方式を再帰的に適用して新規のリストと新規の可変長符号を作成する。暗示されているように、ベントレーらの先頭移動を実施したエンコーダ（符号器）は２種類のオペレーション（操作）を有する。すなわち、（１）探索：各入力語についてコードブック内でその語を探索する、（２）更新：将来の使用のためにコードブックを再構成する。ベントレーらのインプリメンテーションはコードブックを線形リストとして構成する。探索と更新両方の操作は直線的に行なわれる、すなわち線型探索と線型更新アルゴリズムを使用する。各操作の時間的複雑性はコードブックの大きさに比例し、一般にコードブックは数千から数万の単位である。つまり、複雑性は大きい。Bentley，Sleator，Tarjan，および Weiの先の論文では、コードブックは２重リンクの２重木として構成している。木は各入力語の後で深さバランスを維持するように調節される。つまりコードブックの大きさの対数に比例する複雑性で探索または更新のどちらかの操作を遂行することができる。しかしデータ構造が複雑なため非常に大きなメモリを必要とし、対数的な複雑性の係数も大きくなる。つまり後者の方法の複雑性は現実的に注目されるコードブックの大きさでの線型方法より低いこともある。さらに最近、Wei（ワイ）に交付される米国特許第５，２３９，２３８号の開示では、各情報源シンボルの処理に非常に少ない一定のステップ数しか必要としないような方法を示している。ワイの特許では、コードブックを多２重リンク（ＭＤＬ）リストと呼ばれる可変寸法の２重リンクリストの集りとして構成している。２のｍ乗−１の大きさのコードブックの場合、１つのリストがあり、そのリストは２の０乗＝１、２の１乗＝２、２の３乗＝８、．．．２の（ｍ乗−１）の大きさのサブリストに分割されている。探索操作では、連想メモリを探索してそれぞれの着信した記号がコードブックでの有無を判別する。連想メモリはアドレスよりもむしろ、記号によりアクセスされるメモリの配置のことである。ハードウェア・インプリメンテーションにおいて、連想メモリは連想記憶（ＣＡＭ）で実現され、一方ソフトウェアで実現する際に連想メモリはハッシング関数操作によって実施される。記号が存在する場合、その記号についての新しいランク情報がデータ・ストリームに変換されて通信媒体で伝播される。さらに、記号の新しいランクはその最近の出現率を反映するように変更される。新しいランクはＭＤＬリスト内のエントリを単に変更することで変更する。これらのような変化は、例えば、任意の記号が存在する場合にこの記号が一般に次に高いクラスの最上位に移動するクラス導入技術を用いて実施される。それまでこの最上位の位置を占めていた記号は、たとえば任意の記号がそれまで占めていたクラスの下部分に移動する。別の例として、記号をクラスリストの上部までの中間のところに移動して、その中間の位置を占めている記号を記号が空いた位置に移動する。記号が存在しない場合、その記号は連想メモリの空き位置に記憶するか、または連想メモリが満杯の場合、占有位置の上書きが発生する。探索の時間的複雑性は１ステップ、すなわちハードウェアＣＡＭの読み込みが１回だけまたはメモリのソフトウェア版ではハッシングが１回である。更新操作はＭＤＬの一定数のポインタ操作を単に更新するだけである。基本的に従来技術は「参照の時間的局在」を示すデータ・ストリームをアドレスする、すなわち語（ワード）がデータストリームある点を現す場合には、そのあと同じ語がその後にすぐにまた現れる可能性が有る。語がデータ・ストリームに１回以上現れる場合、従来技術の各種圧縮技術では、２回目およびそれ以降の場合に出現するその語を表わすのに、その語が繰り返し現れる時点と最後に出現した時点のと間に現れる別の語の数を表わす圧縮データブロックによっている。従来技術は「参照の空間的局在」と呼ばれるものを活用する教示または示唆が欠除している、すなわちデータ・ストリーム内の第１の語が第２の語の付近に出現した場合には第１の語がデータ・ストリーム内にふたたび出現する場合には第２の語の付近にまた出現する可能性がある。発明の要約本発明によれば、以上の欠点ならびにその他の制限や不足が参照の空間的局在を活用する方法ならびにそれに付随する回路により回避される。概して本方法の１つの態様によれば、、データ・ストリームに出現するトークンの１次リストが一時リストに出現するトークンのアドレスの２次リストとともに維持される。１次および２次リストは、符号器の出力が（１）トークンが１次リストに出現しない場合にはトークン自体、または（２）トークンが１次リストに出現しトークンの位置が２次リストに出現しない時には１次リスト内のトークンの位置、またそれ以外では（３）１次リストのエントリの２次リスト内での位置、の符号化表現となるような方法で使用される。概して本方法の別の態様によれば、データ・ストリームに出現するトークンの１次リストが１次リストに出現するトークンの位置の２次リストならびに２次位置の３次リストとともに維持される。１次、２次、３次リストは、符号器出力が（１）トークンが１次リストに出現しない場合にはトークン自身、または（２）トークンが１次リストに出現し、トークン位置が２次リストに出現しない場合には１次リスト内のトークン位置、または（３）トークンが１次リストに出現し、１次リスト内のトークン位置が２次リストに出現するが、３次リストには出現しない場合には常に１次リストのエントリの２次リスト位置、またそれ以外の場合には、（４）３次リスト内の２次リストの場所の位置、の符号化表現となるような方法で使用する。例証的に、リストの探索には、ハッシング操作を用いてトークン（１次リスト）またはアドレス（２次リスト）または場所（３次リスト）の出現を特定し立証する。例証的に、リストの更新には、木を拡張する操作を行なって１次リストのアドレス、２次リストの場所、または３次リストの位置を対応するリストの先頭へ移動させ、対応するリストの最上位ランクをリストの先頭に関連させる。本発明の構成ならびに動作は、添付の図面を参照して後述の図示した実施例の詳細な説明を熟読することにより理解されよう。図面の簡単な説明図１はベントレーらの符号器の従来技術のブロック図である。図２は共通の互いに隣接して出現する典型的な記号パターンについての１次リストと２次リストの略図である。図３は記号の１つを処理した後で共通に互いに隣接して出現する典型的な記号パターンについての１次リストと２次リストの略図である。図４は別の記号を処理した後で共通に互いに隣接して出現する典型的な記号パターンについての１次リストと２次リストの略図である。図５はデータ構造で定義されるフィールドを表わす任意のトークンの典型的なデータ構造の略図である。図６は典型的な木の略図で図示したトークンの相互に対する関連を表わす。図７は図６の木に対応する物理メモリ内容の略図で、それぞれのエントリは図５のデータ構造に準拠している。図８は、左の子のランク＜親のランク＜右の子のランク（左−中央−右）の規則によるトークンランクの略図である図９は回転（原子（アトミック）木を拡張する「ジグ」操作に対応する）を所望する典型的な木の略図である。図１０はジグ操作で図９の典型的な木構造が影響を受ける方法を示す。図１１はジグ操作の前に図９の木構造に対応するデータ構造の詳細を表わす図９の同等物である。図１２はジグ操作の後でランクの保存を示す図１０の木構造に対応するデータ構造の詳細を表わす図１０の同等物である。図１３は原子（アトミック）の「ジグ−ジグ」操作の前の別の典型的な木構造を表わす。図１４はジグ−ジグ操作により図１３の典型的な木構造が影響される様式を示す。図１５は原子（アトミック）の「ジグ−ザグ」操作の前のさらに別の典型的な木構造を表わす。図１６はジグ−ザグ操作で図１５の典型的な木構造が影響される様式を示す。図１７はジグ−ジグ操作およびジグ−ザグ操作で木の最上部にノード「ａ」を移動する前の最終的な典型的木構造を表わす。図１８はジグ−ジグ操作とジグ−ザグ操作で図１７の典型的な木構造が影響される様式を表わす。図１９と図２０はそれぞれトークンを木の最上部に挿入する前後の木構造を表わす。図２１と図２２はそれぞれ木から子孫のない最下位のノードを削除する前後での木構造を表わす。図２３と図２４はそれぞれ木から子孫のない最下位ノードを削除する前後での木構造を表わす。図２５と図２６はそれぞれ最下位から最上位のノードに左側の子を有するノードａを移動する前後の木構造を表わす。図２７は最上位ノードを最高ランクに移動する前に最上位ノードが左右に子を有している木構造を表わす。図２８は図２７の木において右側の分木（サブツリー）から最高ランクのノードを抽出することにより得られた木構造を表わす。図２９は図２８の木構造を回転させることによってノードａを最高ランクのノードに押し上げることにより得られた木構造を表わす。図３０は１次および２次メモリの両方を使用して着信トークンを処理するための流れ図である。図３１は１次、２次、３次メモリを使用して着信トークンを処理するための流れ図である。図３２は本発明の２メモリ実施例による典型的な符号器のブロック図である。図３３は本発明の２メモリ実施例による典型的な復号器のブロック図である。発明の詳細な説明本発明を理解する上で有用な術語と標記を導入する方法として代表的な従来技術の概要説明を第１に行なう。以下、概要に続けて本発明による図示の実施例を説明する。従来技術（米国特許第４，７９６，００３号）たとえばベントレーらが開示しているような（米国特許第４，７９６，００３号）局部適応型データ圧縮システムは最近の従来技術の圧縮方式の１つを表わすものと考えられるのでここで説明する。考察するシステムは通信システムで、着信データ・ストリームが送信器で符号化され、符号化されたストリームが通信媒体を介して受信機へ伝播し、受信機が伝播するデータ・ストリームを復号する。図１のブロック図はベントレーらによる従来技術の構成を示す。本システムの説明に係る原理は他のシステム、例えばデータ記憶システムにも適用できるものである。最初の説明として術語「語」は着信データ・ストリームからの英数字のグループ化を定義するものとして使用すると−−図１の拡張データ入力１３に着信する任意の「語」が送信用に符号化される場合、システム内に維持されている語のリスト（プッシュ・ダウン記憶１０）をその任意の「語」の出現について走査する。その語が存在する場合、「語」に関連する符号をその「語」自身のＡＳＣＩＩ表現の代わりに使用する。語リスト内での各「語」の位置はデータ・ストリーム内でのその「語」の出現回数を表わすので、最近出現した「語」はしばらく前に出現した「語」よりも語のリスト内で高い位置にある。語リスト内での「語」の位置は可変長符号に符号化されて可変長符号記憶１４に記憶され、もっとも短い符号がリストの先頭、すなわちもっとも最近出現した「語」を表わすようにする。つまり、「語」それ自身を含む記号についてのＡＳＣＩＩビットを送信するのではなく、リスト内の「語」の位置が実際には送信されることになる。このような位置符号は一般に「語」それ自身のＡＳＣＩＩ表現より少ないビット数を必要とするので、システムはデータの効率的伝送を行う。「語」がリスト内にない場合、これをリストに追加して、その「語」の各記号のＡＳＣＩＩ表現を出力２８から圧縮データとして送信する。符号化データ・ストリームから語リストをコンパイルして符号化操作の逆を遂行すれば受信機で元のデータが復元される。データ圧縮方式から最大の利点を導き出すには、着信デジタル・データ・ストリームを最大の冗長性に達するような「データのグループ」（上記で「語」と言われる）に分割しなければならない。英語テキストでは、例えば、実際の英語のワード間の空白（「空白文字」）を用いて冗長性が高い「データのグループ」にデータ・ストリームを分割することができる。コンピュータ・プログラムも同様に自然言語の分割子としての句読点や空白文字を用いて「データのグループ」に分割できる。データ・ストリームを「データのグループ」に分割する処理は語彙解析と呼ばれており得られる「データのグループ」はソース記号と呼ばれる。このような処理は周知であり全般にコンピュータ・プログラム・コンパイラおよびアセンブラならびに大半のワード・プロセッシング・パッケージで見うけられる。符号化した音声等ある種のデータ・ストリームは冗長性が高いデータ・ビットにすでに分割されておりこれ以上の語彙解析を必要としない。表記において、節のワードリストのことを、代表的な従来技術の説明ではさらに特定的に用語辞書 −−ソース記号を記憶している辞書−−と呼ぶことにする。符号化処理がどのように機能するかの特定の例を上げるには、語彙分析によって得られたソース記号の次のようなストリームを送信器で処理することにする： that that is is that that is not is not is not that it it is （このようなストリームは考案によるものではなく、次の文章に由来する： "that that is，is; that that is not，is not; is not that it? it is!" ここで記号のストリームは単に句読点を除去して得られており、句読点は別に処理することができる）。第１の記号は"that"である。辞書は最初にからなので、辞書内には何の記号も現れない。つまり、記号"that"が辞書に追加される。次に３つの部分に分割された一連のビットが通信路上を介してシステムの受信器へ送信される。３つの部分は、（１）デリミタ記号の符号、（２）語の文字数を指定する（この場合には４）一定数のビット（この例では８）、したがってビット・ストリームは０００００１００となる）および（３）拡張ＡＳＣＩＩ符号または記号"that"を含む文字についての８ビット符号から構成される（ベントレー特許では項目（２）すなわちデリミタとＡＳＣＩＩ符号の間の固定長の語を含めることを教示または示唆していないが、このような標識は新規の記号を表わすビットの分割とそれにより復号化をするように実際には必要とされるものである）。デリミタ記号は初めに送信され、新しいソース記号が続くことを示す。デリミタ記号は独自のものでそれに応じて復号できる。デリミタ記号を判断する手順について簡単に説明する。特定すると、１つの例示的符号では（エリアス符号と呼ばれる）、デリミタ記号がビット表現０１１０１を有している。"that"に対応する拡張ＡＳＣＩＩストリングは、01110100011010000110000101110100となる。処理すべき次のソース記号は再び"that"である。この記号について辞書を調べると、辞書の先頭にまたは最高位のエントリとしてこの語が出現するので、この特定の"that"についての可変長符号を送信する。例証的な符号では、１ビットの１が送信される。処理すべき次のソース記号は"is"である。この記号について辞書を調べると辞書にはないので、これを辞書の先頭に追加して"that"記号を第２のエントリに順位を下げる。この時点で"is"記号には１ビットの符号１が関係しており"that"記号は辞書内の第２の位置を表わす符号０１００を有する。デリミタ記号を送信し、これに続けてバイト００００００１０（二文字が続く）、さらに"is"のＡＳＣＩＩビットストリングすなわち０１１０１００１０１１１００１１が続く。処理すべき次のソース記号は"is"である。この記号について辞書を調べると辞書の先頭エントリにあるので、１ビットの１を送信する。辞書エントリは同じまま、すなわち"is"には符号１が関係し、"that"には符号０１００が関係する。処理すべき次のソース記号は"that"である。この記号について辞書を調べると辞書の第２の最も新しいエントリにあるので、符号０１００を送信する。さらに、"that"がエントリとして最も新しい"it"に置き換えられ、"it"は辞書内でランクが下がる。したがって、"that"には符号１が関係し、"is"には符号０１００が関係する。この方法でソース記号全体に逐次的に処理を続ける。ベントレーらによる上記の概要説明から示唆されるように、送信器でデータを圧縮する処理は、（１）着信ソース記号のそれぞれについて辞書を探索するステップと、（２）辞書内のソース記号を追加／削除／再編成することにより辞書を更新するステップと、着信ソース記号それぞれについて適切な符号を送信するステップとを含む。探索と更新はどちらも線型的に行なわれる、すなわち辞書は線形リストである。したがって探索および更新アルゴリズムが辞書の大きさに比例する時間の複雑性を生じる。エントリが幾千から幾万になる大きな辞書では、ステップ（１）と（２）を完了する時間は極端に大きくなり、したがって重要な多数の高速用途では実施が現実的ではない。本発明図２を参照すると、ここには本発明による１次リスト２００と２次リスト２１０の典型的な構成が図示してあり、処理しているテキスト（文書）資料に語のグループ"personal computer"がすでに出現したものと仮定して、各リスト内に含まれるデータを図示している。図示したように、"personal"は１次リスト２００において位置Ｐに出現し、一方"computer"は位置（Ｐ−１）に出現している。２次リスト２１０は、１次リスト２００にトークンが現れる時のトークンの位置（「トークン」の用語は、ここでは「語」の代わりに使用しているが、説明している処理において「トークン（字句）」という概念がより一般的であることによる）から構成される。つまり、１次リストにおける"personal"と"computer" の出現位置に対応させることで、２次リスト２１０は図示において２次リスト内の位置「Ｓ−１」に１次リストのエントリ（Ｐ−１）を有し、一方１次リストからのエントリＰは２次リストの位置「Ｓ」に出現している。ここで、テキストストリーム内でトークンのグループ"personal computer"に再び遭遇したものと仮定する。トークン"personal"に最初に遭遇するので、１次リスト２００を探索して１次リスト上に"personal"があるか否かを判別する。探索の結果、１次リスト上の位置Ｐに"personal"を突き止める。Ｐが２次リスト２１０の大きさＮsを越えないものと仮定すれば、２次リスト２１０を探索してＰが２次リスト内のエントリにあるか否かを調べる。この例では、エントリＰは２次リスト内の位置Ｓにみつかるので、処理結果として生ずる実際の出力は２次リスト内の位置Ｓの符号化表現となる。２次リスト２００（正しくは２１０）上の位置Ｓが１次リスト２００の位置Ｐよりも小さい場合は、その結果生ずる符号化表現は一般に関連データを表現するのにより少ないビット数で済む。１次リスト２００の更新で１次リストの最初の位置（先頭位置）へ"personal"を移動し、同様に２次リスト２１０の更新で２次リスト内の最初の位置（先頭位置）にＰを移動する。この処理段階でのリストの状態を図３に示す。更新の結果として、トークン"computer"が１次リスト内で押し下げられて位置Ｐを現在占有しており、一方２次リスト内の位置（Ｐ−１）は２次リストの位置Ｓを現在占有していることには注目すべきである。また、１次リスト２００で位置（Ｐ−１）を占有するトークンはこれまでの説明には関連がないことも注目すべきである。さて、テキスト内で"computer"トークンに次に遭遇し、このトークンが処理に供される。１次リスト２００を探索し、トークン"computer"が１次リスト内の位置Ｐに捜し出される。次に、２次リスト２１０でＰの出現を探索し、Ｐは２次リスト内の最初の位置に出現している。したがって、処理出力として位置「１」の符号化表現を出す。１次リスト２００の更新で"computer"が１次リストの最初の位置に移動される。２次リスト内の最初の位置をすでにＰが占有しているので２次リスト２１０の更新は不要である。この処理段階でのリストの状態を図４に描いてある。新たなトークンが１次リスト２００の位置（Ｐ−１）とＰに現在移動されているが、これらはこれまでの説明とは関連がない。１次リストおよび２次リストを用いてトークン・ストリームを処理することにより得られる符号化表現の比較において、１次リストだけを用いた処理と比較して、前者は符号化表現「Ｓ，１」を生成するのに対し、後者は符号化表現「Ｐ，Ｐ」を生成する。本発明の基本的方法の理解を得るため、１次メモリ（一般に１次リストとも称する）における探索および更新操作の一例を呈示することで複数メモリでの探索と更新操作を説明する。実質的に同じ原理が本発明の別のメモリに適用できる。（一般性を失うことなく説明の複雑性を軽減するために、小数のソース・トークンだけを本実施例では用いている）。本実施例の前置きとして、探索および更新操作の原理を理解するのに概要を示すことがためになる。それ故、一般的なコンテキスト（文脈）において、各メモリはデータ構造内の各トークンの「先頭移動」を行なう関連した概念データの構造を有する。先頭移動データ構造を用いて、そのデータ構造に対して呼び出し機構から呈示されるトークンを処理し、次の２つの操作の内の１つを実行することが目的である。すなわち、（ｉ）データ構造内にトークンが存在しない場合はそのトークンをデータ構造内の先頭すなわちフロントに挿入し、また（ｉｉ）そのデータ構造内のトークンが存在する場合は、データ構造を再構築してそのトークンをデータ構造内の先頭すなわちフロントに移動する。先頭移動は探索および更新として総称した２つの関連操作により達成する。トークンの操作を遂行する場合、入力トークンを得ると、次の２つの結果の１つを生ずる：（ａ）そのトークンがデータ構造に存在している場合は、データ構造内の位置情報が物理アドレス等で呼び出し機構へ戻され、あるいは（ｂ）そのトークンがデータ構造内に存在していない場合には、この結果のインディケータが呼び出し機構に戻される。トークンについての更新を遂行する場合は、入力トークンを得ると、次の２つの結果の１つを生ずる：（１）そのトークンがデータ構造内に存在している場合は、そのトークンのそのデータ構造の先頭ランク（先頭列）に割り当てる（これは一般に「先頭移動」と呼ばれる操作のためであるが、概念データ構造に対応する物理メモリではトークンは必ずしも移動されず、むしろ詳細に後述するようにメモリ内のトークンに関連したポインタ情報が移動される）、または（２）トークンがデータ構造内に存在しない場合、トークンを先頭ランクの位置に新規トークンとして挿入し、これに対応して、新規トークンの追加によりデータ構造内のトークン数がデータ構造の容量すなわちサイズを超過してしまう場合にはデータ構造内の最下位ランクのトークンを削除する（新規トークンを含めてトークンの数がデータ構造の容量すなわちサイズを越えない場合にはトークンの削除は不要である）。探索操作次に具体例に移り、図５および図７を参照する。図５では、データ構造５００内の各項目（アイテム）のレイアウトが、各データ構造の場所に６つのフィールドからなるように図示してある。図７のメモリレイアウトを例にすると、記憶位置３０に関連したノードの位置では、次が得られる：フィールド１（要素５０１）−−関連する木の左の子の位置へのポインタ（例：１０）フィールド２（要素５０２）−−関連する木の右の子の位置へのポインタ（例：４０）フィールド３（要素５０３）−−関連する木の親の位置へのポインタ（例：５０）フィールド４（要素５０４）−−トークン自身（例："Warren"）フィールド５（要素５０５）−−トークン内の文字数（例：６）；およびフィールド６（要素５０６）−−関連する木のこの場所（ノード）で経路選択される分木（サブツリー）のノード数（例：５）この６つのフィールドの説明に示したように、データ構造内のエントリで要約された情報を含む関連木構造で参照がされる。典型的な木６００が図６に図示してある（図５のデータは図６の木から抜粋してある）。通常の規則と同様に、木６００は根ノード６０１（エントリ"Bob"がある）を有し、木の各ノードは左の子を、右の子を、左と右の子の両方を、有するか、あるいはいずれの子も有さない。例えば、ノード６０２（"Warren"）は左の子（ノード６０４−−"Alice"）と右の子（ノード６０５−−"Edward"）とを有しているが、ノード６０５は左の子も右の子も有していない。さらに、図６の木と図５の付随するデータ構造に関連した物理メモリ７００の実際の内容を図７に描いてある。図７のメモリ７００におけるデータで要約された木６００に関する情報のタイプの別の例として、"Peter"は左右に子ノード"He rman"と"Chris"をそれぞれ有しており、関連するポインタはそれぞれ７０、１００である。さらに、"Peter"は親として"Gary"（位置６０）を有し、"Peter自身はメモリ位置８０にある。根は"Bob"で、根のメモリ位置は５０である。上記のデータ構造５００、木６００、メモリ７００を念頭において、入力トークンについての探索操作の例を次に説明する。第１ステップとして、入力トークンを「ハッシング」して"hash（トークン）=物理アドレス"として書き込まれる物理アドレスを導出する。ハッシング技術によりできるかぎり無作意な方法でメモリ内容をアドレス中に割り当てる従来のハッシング関数ｆに換算して指定することができる。トークンｔの探索時に、ハッシングの経路指定でｆ（ｔ）を計算して、メモリ内のｆ（ｔ）位置がｔを含むか否かを確認する。もしこれを含む場合、ハッシング関数は物理アドレスｆ（ｔ）を出力する。例えば、予め設定してあるハッシング関数により次の情報が得られたと仮定する。 hash(Alice)=10、 hash(Warren)=30、 hash(Bob)=50、等。第２のステップとして、「ハッシュした」メモリ位置におけるエントリをハッシュしたトークンに対応するものとして確認する（所望のトークンは衝突によって上書きされていることが考えられる、つまりハッシング関数は必ずしも独自の場所を得るものではないので、二つのトークンが同じ「ハッシング」結果を得る可能性がある。「上書き（オーバライト」は衝突の取り扱いの従来の方法であってここでは詳しく説明しない）。最後のステップとして、確認したとすると、ランク情報はデータ構造５００の６番目のフィールド（例：５０６）にあるエントリに含まれる情報を使って復元される。例えば、トークン"Warren"はハッシュアドレス＝３０を有しているので、"Warren"が実際に位置３０のエントリであることが確認される。ランクを計算し、左に子を有するノードの場合だと次のようになる：ランク＝１＋Warrenの左の子を根とする分木（サブツリー）のノード数 Warrenの左側の子はAliceで、Aliceは位置４０に出現するので、６番目のエントリは「３」である。したがってWarrenの「ランク」＝１＋３＝４となる。さらに完全にランクの概念を伝えるため、ランクの機構を示した図８を参照する。ランクは左側−中央−右側（ＬＣＲ）の順番で木に保持されている。すなわち、あるノードＮでは、Ｎの左の子とその子の子孫全部のランク＜Ｎのランクとなり、同時にＮのランク＜Ｎの右側の子とその子の子孫全部のランクである。つまり、図８に明示するように、WarrenがノードＮの場合、ＬＣＲの順番から要求されるように、これの左の子はAliceでランク＝１、またAliceの子孫はIngr id（ランク３）とFrank（ランク２）、一方Warren自身のランク＝４で、これの右の子はEdwardでランク＝５となる。ノードＮのランクを計算するためには、木のそのノードの位置から根までのノードＮの径路全体を横断しなければならない。計算は次のようにコード化することができる。ランク＝１ノード＝Ｎ if(ノードが左の子を有する),ランク＝ランク＋wt（ノードの左の子） /*wt(m)はmを根とする分木のノード数/* while(ノードが根ではない) {if(ノードが左の子) ノード＝ノードの親 else/*ノードが右の子/* ランク＝ランク＋wt（ノードの親）-wt(ノード) ノード＝ノードの親｝計算例として、Peterのランク付けが所望されたものと想定する。最初に、上記のコード化にしたがって、ランクを１に設定し、最初に注目するノードはPete rである。Peterは左の子を有するので、ランクの中間計算は次のようになる：ランク＝１＋wt(Herman)＝１＋１＝２ /*(wt--図７のフィールド６、位置７０)*/ Peterは根ではないので、計算を継続する。Peterは左の子ではないので、ランクの他の計算を次のようになる：ランク＝２＋wt(Gary)-wt(Peter)＝２＋４−３＝３ここで注目している次のノードとしてPeterをPeterの親すなわちGaryと入れ換える。Garyは根ではないので、計算を続行する。Garyは右の子であるから、ランクの他の計算は次のようになる：ランク＝３＋wt(Bob)-wt(Gary)＝３＋１０−４＝９ここで注目している次のノードとしてGaryをGaryの親、すなわちBobと入れ換える。Bobは根ノードなので、計算が停止し、最終的結果としてPeterのランクが９となる。これが図８では♯９をノード６０６のとなりに配置して図示してある。トークン探索とトークンランク取得の手順の説明はこれで終る。更新操作繰返し（反復）に基づいてメモリの先頭にトークンを配置する、またはこれに対応して木および関連するデータ構造内にトークンを配置するのには、次の２つの手順のうちの一方が必要である：（１）トークンが存在していなければランク番号の最上位にトークンを挿入する、または（２）トークンが存在しているなら現在のランクから最上位のランクにトークンを移動する。これらの２つの手順は「木の拡張(tree splaying)」と呼ばれる手順で遂行する。木の拡張はスレーターとターハンによる「自己調整２進探索木」（Communications of the ＡＣＭ、３２（３）、６５２〜６８３ページ、１９８５年７月）と題する論文（Sleator and Tarjan，"Self-adjusting Binary Search Trees"，Communications of the ACM32(3)，pp652-683，July 1985）に記載されている。この詳細な記述が本発明の作成と使用を教示することを確実にするため、この参考文献から充分な資料を本明細書に含めてこの開示を基本的に自己内包(self-contained)とするようにしてある。したがって、図９を参照すると、「ジグ(jig)」すなわち回転操作（回転オペレーション）と呼ばれるひとつの原子（atomic）木拡張操作の前の木９００が図示してある。ノードｙ（参照番号９０１）はノードｘ（参照番号９０２）並びに分木Ｃ（参照番号９０５）とに接続されるように図示してある。表記規則に従い、ノードは円で図示し、また分木は三角形で図示してある。同様に、ノードｘは分木ＡとＢ（それぞれ参照番号９０２、９０３）とに接続されている。木９００の右回転すなわち右ジグでは、図１０に描いた木１０００が得られる。ここでノードｘ（参照番号１００１）は木の根に移動されており、ノードｙ（参照番号１００２）はノードｘの右の子になっている。さらに、分木Ｂ（参照番号１００４）はノードｙの左の子になっている。しかし、分木Ａと分木Ｃ（参照番号１００３と１００５）は親子関係がそのまま残っている。ジグ操作の利点は、ＬＣＲ規則によるランクが保存されることで、これはさらにそれぞれの影響を受けるデータ構造の６番目のフィールドの情報の生成または変更が拡張処理の基本的なサブプロセスとして含まれることを暗に意味している。図９および図１０に図示したジグ操作の詳細を探求するため図１１と図１２を参照する。これらの図１１、図１２はそれぞれが図９と図１０に対応するデータ構造である。図１１のデータ構造１１００はトークンｙを有するデータ構造１１０１、トークンｘを有するデータ構造１１０２、およびトークンａ、ｂ、ｃをそれぞれ有するデータ構造１１０３〜１１０５から構成されるているように図示されている。さらに、左側、右側、親のポインタの意味(sense)も図示してある。例えば、データ構造１１０１の左の子ポインタ１１０１１はデータ構造１１０２を指している。さらに、データ構造１１０２の親ポインタはデータ構造１１０１を指している。ジグ操作のあと、図１２のデータ構造１２００が得られる。所望のように、データ構造１２０３、１２０４、１２０５（それぞれトークンａ、ｂ、ｃに関連する）で経路された分木はそのまま残り、これら後者３つのデータ構造の６番目のフィールドは同一に残る。他方、データ構造１２０１（トークンｘ）の６番目のフィールドはこれが根であることを反映するように変更しなければならない。つまりトークンｘの６番目のエントリはこれまでｎ2だったが現在ではｎ1になっており、このエントリは勿論トークンｙが根だった時のトークンｙのこれまでのエントリであったものである。トークンｙの６番目のフィールドの新規エントリはトークンｂとｃが現在トークンｙの子であることを反映しなければならない。この新規の木構造を反映するようにポインタ情報も変更する必要がある。例示のように、トークンｙは現在左の子としてトークンｂを有しており、このトークンをポインタ１２０２１が指している。他に２つの原子拡張操作があり、これらにより木のトークン位置更新を起動できる。これらの操作の最初の操作は「ジグ−ジグ(jig-jig)」操作と呼ばれるもので、図１３の木１３００に図示したように、ノードが「直線」径路に出現した場合に適用される。図１３では、ノード１３０１〜１３０３（ｘ−ｙ−ｚ）が直線径路に出現しており、木１３００の拡張の結果により図１４の木１４００が導かれる。いま、トークンｘは木の最上部にあり、このトークンがノード１４０１に関連している。さらに、分木の幾つかが再配列されている。例えば、分木１４０５（Ｂ）は現在はノード１４０２（ｙ）の左の子だが、以前の分木１３０６（Ｂ）はノード１３０１（ｘ）の右の子だった。「ジグ−ザグ」操作と呼ばれる第２の操作は、図１５の木１５００に図示するようにノードが「ジグザグ線」の径路（パス）上に出現する場合に適用される。図１５において、ノード１５０１〜１５０３（ｘ−ｙ−ｚ）はジグザグ径路上に現れており、木１５００の拡張の結果として図１６の木１６００が導かれる。ここで、トークンｘは木の先頭に現出し、ノード１６０１に関連している。さらに、分木の幾つかが再配置されている。例えば、分木１６０５（Ｂ）はノード１６０２（ｙ）の右の子だが、それまでの分木１５０５（Ｂ）はノード１５０１（ｘ）の左の子だった。原子操作を適用する最後の例として、図１７および図１８のそれぞれの木１７００と１８００を参照する。目的は木１７００のノード１７０１（トークンａ）をノード１８０１として木１８００の先頭に拡張することである。原子操作の順序は次のようなものである。まず、ノード１７０１は８の深さにある、すなわちノード１７０１から根ノード１７０２までに８つのノードを通過しなければならない。ジグ−ジグ操作でトークンａを深さ６に移動し、ジグ−ザグ操作でトークンａを深さ４に移動し、ジグ−ザグ操作でトークンａを深さ２に移動し、最後にジグ−ジグ操作でトークンａを深さ０、すなわち根に移動する。これら４つの連続原子操作の結果を図１８の木１８００で図示してある。図示したように、ノードと分木の多数の再配列が起こっているが、ＬＣＲ規則で測ると木構造のランクは拡張処理の一部として保存されている。木の拡張処理を説明したので、注目しているトークンを１次メモリの先頭へ移動または挿入し、それに対応して特定のトークンを最高ランクへ移動するのも容易に解明できる。考慮する最初の操作はメモリの先頭はまたは関連する木の最上部へのトークンａの挿入であり、この挿入前の木を図１９の三角形１９０１で総括的に図示してあり、ここでＴは挿入前に存在する木全体を表わす。図２０の木２０００は木１９０１がノードａの右の子になることを表わし、ＬＣＲ規則にしたがってトークンａが最新のランクを有する必要がある、すなわちランク（ａ）＜ランク（Ｔ）となる。挿入後、メモリが一杯ならば最低ランクのトークンの必要な削除も処理しなければならない。２つの場合が考えられる、すなわち最も古いランクのノードが子孫(offspring)のない右の子（図２１）の場合、または最も古いノードが子孫を有する場合（図２２）とが考えられる。図２１を参照すると、楕円２１０１はノード２１０２および２１０３（ｙおよびｘ）と分木２１０４（Ａ）を除く木の残りの部分を含む部分的な木を表わす。ノード２１０３（ｘ）は子孫のない最古ランクのノードであり、ノード２１０２の６番目のフィールドを１だけ減らし、ノード２１０１の右の子のポインタを「ヌル化（空白化）」することだけで削除される。図２２の木はノード２１０１を削除した結果である。図２３を参照すると、ここでも楕円２３０１がノード２３０２および２３０３（ｙおよびｘ）と分木２３０４（Ａ）を除く木の残りの部分を含む部分的な木を表わしている。ノード２３０３（ｘ）は子孫（Ａ）を有する最古のランクのノードで、ノード２３０３はノード２１０２の６番目のフィールドを１だけ減らし、また木２３０４の先頭ノード（図示していない）を指すようにノード２１０１の右の子ポインタを入れ換えるだけで削除される。図２４の木はノード２３０３の削除の結果である。メモリ先頭へのトークンの移動とそのトークンのランクの更新について、特にここで拡張の概念を用いて説明する。この手順は次のような幾つかのステップからなり、ここではトークンａに注目しているものとする。（１）トークンａを木の先頭に拡張する。この拡張ステップの結果、２つの可能な構成が得られ、これらをそれぞれステップ（２）とステップ（３）で取り扱う。（２）トークンａが図２５のノード２５０１で示したように右の子を有していない場合、ランク（ａ）はＬＣＲ規則により最後となる。ランク（ａ）は、木２５０２をノード２５０１の左の子から、子のポインタ情報を変更してノード２５０１の右の子になるように移動することで（図２６）、最も新しいランクへ容易に変換できる。ここでノード２５０１は右の子だけを有し規則によりランク（ａ）＝１である。（３）最も一般的な場合を図２７に示す。ノード２７０１は左右の子を両方とも有し（それぞれ木２７０２と２７０３（ＡおよびＢ））ている。最初に、木２７０３だけに注目する。木２７０３内部の最初にランクされるノードは木２７０３の根から明示的に引き出される。この引き出し操作の結果により図２８の木構造が生成され、ノード２７０４（ｂ）が木２７０３の第１ランクのノードとなり、木２７０５（Ｂ’）が木２７０３からノード２７０４を引き出した残りとなる。最終ステップとして、別の拡張操作により図２９の木構造が導かれ、ここでノード２７０１は右の子孫だけを有しており、したがってノード２７０１はＬＣＲ規則により最も新しいランクのノードとなる。これで先頭移動と最初のランク移動の両方が同時に行なわれる更新操作の説明を終る。流れ図図３０を参照すると、ここには１次メモリおよび２次メモリの組み合せを使用して着信トークンを処理するための流れ図が図示してある。開始ブロック３００５で処理が始まると、処理ブロック３０１０が起動されて着信データを解析してトークンストリームを取得する。各トークンが順次処理され、各トークンは判断ブロック３０１５で処理されトークンが１次メモリにあるか否かを判別する。１次メモリに存在しない場合、ブロック３０２５の処理が起動され、最初に新規トークンが続くことの識別データと、第２にトークンの符号化表現とを出力する。トークンは処理ブロック３０３０で実行されて１次メモリの先頭に挿入される。このような処理は上記の詳細な説明で詳述した原子木拡張操作を用いてトークンを挿入することを含む。トークンが１次メモリに存在する場合は、ブロック３０２０の処理が起動されてトークンの１次メモリのアドレスを判別する。次に、判断ブロック３０３５が実行されて、１次メモリのアドレスが２次メモリにあるか否かを判別する。存在しない場合にはブロック３０４０、３０４５、３０５０の一連の処理が起動される。ブロック３０４０は１次メモリのトークンのランクを圧縮した出力データ・ストリーム内のデータ・ブロックとして伝送する。トークンは２次メモリに存在しなかったので、処理ブロック３０４５に要約してあるようにトークン（の１次メモリのアドレス）を２次メモリの先頭に挿入する。挿入は最新ランクの２次メモリ内の先頭エントリのランクづけを含む原子拡張操作を用いて成し遂げられる。ブロック３０５０では１次メモリの先頭にトークンを移動し、再び木の拡張技術を使用する。１次メモリのアドレスが２次メモリに存在する場合は、処理ブロック３０５５に示してあるように、１次メモリ・アドレスの２次メモリ内の記憶位置が有効になる。処理ブロック３０６０を用いて２次メモリの記憶位置のランク（順位）をトークンの符号化表現として出力データ・ストリームに出力する。処理ブロック３０６５と３０７０により、それぞれ、トークンを１次メモリの先頭に移動することと、トークンの１次メモリ・アドレスの２次メモリでの記憶位置を２次メモリの先頭に移動することにより、トークンへの処理を完了する。それぞれの移動は木の拡張を使用する。図３１を参照すると、ここでは１次、２次、３次メモリの組み合せを用いて着信トークンを処理するための流れ図３１００が図示してある。開始ブロック３１０５で処理を開始すると、処理ブロック３１１０が起動されて着信データを解析しトークンのストリームを取得する。各トークンは逐次処理されて、各トークンを判断ブロック３１１５により処理しトークンが１次メモリにあるか判別する。１次メモリに存在しない場合には、ブロック３１２５の処理が起動されて、最初に新規トークンが続くことの識別データと、第２にトークンの符号化表現を出力する。トークンはブロック３１３０で処理されて１次メモリの先頭に挿入される。このような処理は前述の詳細な説明で詳述した原子木拡張操作を使用してトークンを挿入することを含む。トークンが１次メモリに存在する場合には、ブロック３１２０の処理が起動されて１次メモリ・アドレスを判別する。次に、判断ブロック３１３５を遂行して１次メモリ・アドレスが２次メモリにあるか否かを判別する。存在しない場合には、ブロック３１４０、３１４５、３１５０の一連の処理を起動する。ブロック３１４０は１次メモリのトークンのランクを圧縮した出力データ・ストリーム内のデータ・ブロックとして伝送する。トークンが２次メモリに存在しなかったので、ブロック３１４５に要約したように２次メモリの先頭にトークン（の１次メモリのアドレス）を挿入する。挿入は最も新しいランクで２次メモリ内の先頭エントリのランクづけを含む原子拡張操作を用いて成し遂げられる。ブロック３１５０では１次メモリの先頭にトークンを移動し、再び木の拡張技術を使用する。１次メモリ・アドレスが２次メモリに存在する場合には、ブロック３１５５に示したように、１次メモリ・アドレスの２次メモリの記憶位置が有効になる。次に、処理ブロック３１６０が起動されて１次メモリの先頭にトークンを移動する。判断ブロック３１６１に入ると、１次メモリ・アドレスの２次メモリ記憶位置が３次メモリに存在するか否かを判別する。存在しない場合には、ブロック３１６５、３１７０、３１７５で行なわれる一連の処理で、それぞれ、出力ストリームとして２次メモリランクの符号化表現を伝送し、３次メモリの先頭に２次メモリ記憶位置を挿入し、２次メモリの先頭に２次メモリの記憶位置を移動する。１次メモリ・アドレスの２次メモリ記憶位置が３次メモリ内に存在する場合は、ブロック３１８０に入って２次メモリの記憶位置の３次メモリの位置を判別する。このあと、３次メモリ位置のランクを処理ブロック３１８５で用いて出力データ・ストリームにトークンの符号化表現で供給する。処理ブロック３１９０と３１９５では、それぞれ、３次メモリの位置を３次メモリの先頭に移動し、トークンの１次メモリ・アドレスの２次メモリの位置を２次メモリの先頭に移動することにより、トークンの処理を完了する。それぞれの移動は木の拡張を使用する。トークンと整数の符号化／復号化圧縮した出力データ・ストリームは整数（最近のランクを表わす）とトークンからなる一連のものである。これらの整数とトークンは圧縮処理を完成するために適切な表現に符号化しなければならない。周知の従来技術において、速度と圧縮率とが引き替えになるような符号化方式は存在していた。例えば、いつ整数を予測するのか、またいつトークンを予測するのかが復号器または伸長器に分るように符号化を構成することが可能であるので、それぞれを独立に取り扱うことができる。復号器に知らせる１つの方法は各トークンのまえに整数０を置き、これによって次にトークンが現れることを表わし、これによって復号器は０を受信した場合を除き、最近のランクを表わす整数を常に予測する。符号化すべき整数はリスト内のアドレス、記憶位置、または位置を表わす。一般に良好な圧縮を達成するには可変長符号化を使用する必要がある、すなわち小さい整数程少ないビット数に符号化されることが知られている。しかし可変長符号化は、可変量だけビット数をシフトしなければならないため、効果的な実行が困難になり、また出力バイトがデータで埋められている度合を判別するためのチェックを行なわなければならない。本発明の好適な実施例における妥協として、整数の可変長符号化を使用している演算結果コード(resulting codes)が常にニブル(nibbles)の整数倍（４ビット）となっている。この符号化技術はシフトが一定のビット数だけに発生するので高速な符号化および復号化を提供できる。さらに、あるバイトが空か、あるバイトが一杯か、またはあるバイトが半分埋っているか、の３つの可能性だけがある。本発明の図示したような符号化方式は、データとしてニブルの下３桁ビットを用いること、また符号化している現在の整数（またはそれに対応する符号中の整数）がさらにニブルを含むか否かを知らせるフラグとして高次ビットを使用することにより、４［Ｋ／３］ビットを用いるＫ２進数字の整数を出現する。トークン自身の符号化については、典型的にはトークンの符号化は行なわないことが有効である。むしろ、トークン内の各文字のバイト表現を送信する。本発明の好適な実施例では、この技法を１つの変形として使用している、すなわち符号器がトークンを出力する前に、トークンのランクを表わす整数の符号化に関して上述した可変長整数符号化を用いて、バイト数でのトークンの長さを伝送する。復号または伸長に関しては、圧縮ストリーム内の整数は１次リスト内の入力トークンの出現するアドレス（すなわち最新ランク）、または１次リスト内の入力トークンのアドレスの２次リスト内の記憶位置（または一部の実施例では、１次リスト内の入力トークンのアドレスの２次リスト内の記憶位置の３次リスト内の記憶位置）を表わすことが可能なので、適切な対応付けを行ない、必要とされるそれぞれアドレス、記憶位置、または位置をアクセスするために整数が使用できるようにする必要がある。好適な実施例の手法では、整数が２次リストの最大のサイズすなわち長さよりも小さいか、または等しければ整数と２次リストとを対応付け、それ以外の場合には整数と１次リストとを対応付けるものである。データ／ストリームの再構成のためにアクセスするリストを選択するこの手順は、トークンのアドレスが、上記に詳述したような、２次リスト内に挿入および／または更新される方法に全く直接的に従う。図示した回路の実施例本発明の１次−２次メモリ形態による図３２の符号器（エンコーダ）３２００はリード線（導線）３２０１に加えられるDATA IN（データ入力）を受信する入力解析部（パーサ）３２１０を含む。解析部３２１０は適切な字句解析技術を使用してリード線３２０１の着信データ・ストリームをトークンに分割するのに用いる。リード線３２０１上のデータ・ストリームは、またタイミング回路３２３０への入力としても供され、タイミング回路ではタイミング情報を再現してバス３２３３経由で符号器３２００を制御する。ＦＩＦＯ３２２０のシフト・イン（ SI）ポートへ伝送されるリード線３２３１のタイミング信号の制御下に、トークンはリード線３２１４を経由してＦＩＦＯ３２２０のDATAポートへ伝送される。つまり着信トークンは先入れ先出し方式で連続的に配列される。タイミング回路３２２０からリード線３２３２で受信したシフト・アウト（SO）信号はバス３２２１経由でハッシュ発生器３２５０とバッファ３２４０の両方へ次に利用可能なトークンを配信させる。バッファ３２４０は処理段階の期間にこのトークンを記憶する。ハッシュ発生器３２５０は所定のハッシュ関数を用いてトークンを１次メモリアドレスに変換し、これがバス３２５１から１次回路３２６０の制御装置３２６１へ転送される。１次回路３２６０も１次メモリ３２６２（１次リストとしても公知である）から構成される。制御装置３２６１は双方向制御バス３２６３経由でメモリ３２６２の探索を行なって、トークンがメモリ３２６２に記憶されているか否かを判別する。トークンがメモリ３２６２に存在しない場合、制御装置３２６１は線３２６４経由でバッファに信号を送出して出力制御装置３０９０へバス３２４１経由で記憶してあるトークンを伝送し、新規トークンを表わす適当な識別データが出力バス３２９１へ伝播し、これにトークンの符号化表現が続く。さらに、バッファ３２４０からトークンが抽出されて制御装置３２６１へバス３２４１経由で伝送され、制御装置３２６１の制御下にメモリ３２６２の先頭に挿入される。制御装置３２６１は原子木拡張操作を行なって新規トークンをメモリ３２６２の先頭に挿入し、メモリ３２６２の最新のランクにトークンをランク付ける。タイミング回路３２３０には線３２６５経由で信号が入り、ＦＩＦＯ３２２０に記憶してある次のトークンの処理を開始する。トークンがメモリ３２６２に存在する場合、トークンの１次メモリ・アドレスの探索が２次回路３２８０の２次メモリ３２８２で行なわれる。この探索を開始するには、１次メモリ・アドレスをバス３２６６上で制御装置３２６１からハッシュ発生器３２７０へ渡して、ハッシュ発生器３２７０は所定のハッシュ関数により１次メモリ・アドレスをハッシングする。ハッシュ発生器３２７０の出力は出力バス３２７１経由で２次制御装置３２８１へ提供される。制御装置３２８１はチェックを行ない１次メモリ・アドレスが２次メモリ３２８２に存在するか否かを双方向バス３２８３経由で判別する。１次メモリ・アドレスが存在しない場合、このことを表わす適当な信号をバス３２８３経由で１次制御装置３２６１へ伝送し、制御装置３２６１がトークンのランクをバス３２６４経由で出力制御装置３２９０へ供給できるようにし、出力制御装置ではこのランクが出力バス３２９１上で圧縮データ・ストリーム内へ出力ブロックとして伝送される。さらに、トークンが制御装置３２６１により木の拡張操作を用いてメモリ３２６２の先頭へ移動される。１次メモリ・アドレスが２次記憶位置で２次メモリ３２８２に存在する場合、その２次記憶位置に関連するに時ランクがバス３２８４経由で出力制御装置３２９０へ供給され、２次ランクがここから出力バス３２９１上で圧縮データ・ストリーム内に出力ブロックとして伝送される。符号器３２００で行なわれる最終的操作には、メモリ３２６２の先頭へトークンを移動する制御装置３２６１の動作、２次メモリ３２８２の先頭へ１次メモリ・アドレスを移動する制御装置３２８１の動作、線３２８５でタイミング回路３２３０へ信号を送出し、次に処理するトークンを供給するようにＦＩＦＯ３２２０をトリガする制御装置３２８１の動作を含む。本発明による図３３の復号器３３００はＦＩＦＯ３３１０と、例えば転送媒体または記憶装置から線３３０１に供給されたDATA INを受信する解析部３３３０を含む。ＦＩＦＯ３３１０は着信データの断片を「新規」トークンまたは「既存の」トークン分類に分類する中間処理段階で任意の速度で着信するデータを記憶するためのバッファとして用いる。解析部３３３０は着信データに操作を行ないタイミング復号器３３００用のクロックを復元し、また逐次的に「既存」のトークンから「新規」トークンを分離する。「新規」トークンは３つの情報のグループ、すなわち、デリミタ（０）、新規トークンの大きさニブル、および新規トークン・バイトを特徴としているので、解析部３３３０は各デリミタ（区切り）を検出するように構成してある。デリミタが通常は着信データ・ストリーム内の伝送された起始データであると仮定して、解析部３３３０はこのデリミタを検出し、「新規」トークン信号をこれに対応するNEW FLAGポートから制御装置３３２０のNEWポートへ線３３３１経由で伝送する。制御装置３３２０は解析部３３３０から線３３３３経由でCLポートにクロック信号も受信する。制御装置３３２０は、「新規」トークン・フラグに応じて、ＦＩＦＯ３３１０を作動させ、DEL SOポートからＦＩＦＯ３３１０のSOポートに接続された線３３２１経由で、新規トークンの大きさを含むビット位置をシフトする。ビットはＦＩＦＯ３３１０のOUT ートからＡＮＤゲート３３１５の一方の入力として用いられる線３３１１に伝送される。ゲート３３１５のもう一方の入力は、線３３２２上の制御装置３３２０からのイネーブル信号（EN）である。新規トークンの大きさを含むビットはゲート３３１５の作動中に制御装置３３１０のSIZEポートへ供給される。新規トークンの大きさが既知になれば、制御装置３３２０はこの情報を線３３２３経由でＦＩＦＯ３３１０へ供給される別のシフト信号に変換する。同時に、線３３２４上の対応するイネーブル信号がＡＮＤゲート３３１６の一方の入力に供給されて、ＦＩＦＯ３３１０から線３３１１に伝送されたビットをゲート３３１６とこれに対応する出力線３３１３を介して新規トークン記憶３３４０へ供給することができる。新規トークン記憶３３４０からのバス３３４１上の情報はハッシュ発生器３３５０への入力として用いる。発生器３３５０は所定のハッシュ関数（図３２に図示のハッシュ発生器３２５０に対応する）を用いて新規トークンを１次メモリ３３７２に記憶するための１次回路３３７０の制御装置３３７１で使用するアドレスを生成する。生成したアドレスはバス３３５１に現れ、これは新規トークンが符号器３２００の１次メモリ３２６１に書き込まれたアドレスと同一である。このアドレス情報によって、制御装置３３７１の入力でバス３３４１上に現れる新規トークンをメモリ３３７２に書き込むことができる。新規トークンの挿入で制御装置３３７１は符号器３２００に対応する方法で木の拡張を用いメモリ３３７２の内容を更新する、すなわち復号器３３００は符号器３２００で実行した操作を複製するように構成される。更新操作と同時に、新規トークンは新規シンボル記憶から線３３４１経由で出力プロセッサ３３９０へも伝播する。出力プロセッサ３３９０は必要な場合に速度変更とデータ平滑化を行なって新規記号を表わすビット列をフォーマットし伸長文字列を線３３９１に出力する。着信データの解析の時点に戻って、今度は「既存の」トークンが着信データ文字列に検出されたと仮定する。「既存の」トークン情報はバス３３３２経由でランクロケータ３３６０に伝送され、ロケータは既知の大きさの２次リストと整数を比較することによってランクが１次回路３３７０で処理すべきものかまたは２次回路３３８０で処理すべきものか否かを判別する。任意のランクを有するトークンはバス３３７５経由で通信しメモリ３３７２内で探索されて、このトークンがバス３３７６経由で出力プロセッサ３３９０に渡される。メモリ３３７２の更新は木の拡張操作によって行なう。さらに、新規トークンを記憶している１次メモリ・アドレスは２次回路３３８０の２次メモリ３３８２にも記憶する必要があり、これはバス３３７４上で受信した１次メモリ・アドレスをハッシュ発生器３３５５においてハッシュし、またハッシュしたアドレスをバス３３５６から制御装置３３８１へ供給することによって行なう。ハッシュ発生器３３５５は符号器３２００のハッシュ発生器３２７０と同一のハッシュ関数を有する。ランク情報を回路３３８０で処理すべき場合には、ランク情報はバス３３６１経由で処理のために制御装置３３８１へ伝送される。任意のランクを有する２次メモリ・アドレスが制御装置３３８１と双方向バス３３８５を経由してメモリ３３８２内で探索され、今度は２次メモリ・アドレスの内容が所望のトークンを含む１次メモリ３３７１のアドレスを指す。情報および制御信号の通信は双方向バス３３７３で行なわれる。さらに、探索したトークンはバス３３７６経由で出力プロセッサ３３９０に渡される。メモリ３３７２、３３８２の更新は符号器３２００の動作を反映するような方法で木の拡張操作により行なわれる。上記の説明はハッシュ技術を使用してリストまたはメモリ内のトークンを探索する実施例に着目しているが、他の種類の探索がさらに効果的または効率的であれば、特に２次リスト（または３次リスト）の最大長が小さい場合に、このような探索を用いることができることは明らかである。前述の実施例は本発明による原理を単に図示するものでしかないことは理解されるべきである。本発明の主旨と範囲に於いて原理を実現するようなその他の実施例は当業者が簡単に考案することができよう。本明細書で説明した回路構成は図示を目的として示した特定の態様に制限されるものではなく、添付の請求の範囲によってのみ制限されるその他の実施例を仮定し得ることはさらに理解されるべきものである。

【手続補正書】【提出日】１９９６年１０月３日【補正内容】請求の範囲１．トークンを圧縮する方法であって、トークンが１次リストに現れない場合には該トークンの符号化表現を伝播するステップと、トークンが前記１次リストには現れているが該１次リスト内の該トークンの位置が２次リストには現れない場合には該１次リスト内の該トークンの位置の符号化表現を伝播するステップと、トークンが前記１次リストに現れていて、かつ該１次リストでの該トークンの位置が前記２次リストに現れる場合には該トークンに対応する該２次リスト内の位置の符号化表現を伝播するステップとを含む圧縮方法。２．着信データ・ストリームを圧縮して発信圧縮データ・ストリームを作成する方法であって、（ａ）着信データ・ストリームを解析して対応するトークンのストリームを生成するステップと、（ｂ）前記トークンのストリームからの各トークンが１次メモリに記憶されているか否かを逐次判別し、記憶されている場合にはステップ（ｆ）を呼び出し、それ以外の場合にはステップ（ｃ）へ続行するステップと、（ｃ）新規トークンを示す識別データを送信し、前記圧縮データ・ストリーム内の対応する発信データセグメントとして該新規トークンの表現を送信するステップと、（ｄ）前記１次メモリの先頭に前記新規トークンを挿入するステップと、（ｅ）ステップ（ｂ）に戻るステップと、（ｆ）前記１次メモリ内の前記各トークンの該１次メモリ・アドレスを判別するステップと、（ｇ）前記１次メモリ・アドレスが２次メモリ内に存在するか否かを判別し、存在する場合にはステップ（ｌ）を呼び出し、それ以外の場合にはステップ（ｈ）へ続行するステップと、（ｈ）前記圧縮データ・ストリーム内の発信セグメントとして前記１次メモリ・アドレスに対応するデータ・ブロックを送信するステップと、（ｉ）前記２次メモリの先頭に前記１次メモリ・アドレスを挿入するステップと、（ｊ）前記１次メモリの先頭に前記各トークンを移動するステップと、（ｋ）ステップ（ｂ）に戻るステップと、（ｌ）前記１次メモリ・アドレスの前記２次メモリ記憶位置を判別するステップと、（ｍ）前記１次メモリの先頭に前記各トークンを移動するステップと、（ｎ）前記２次メモリ記憶位置が３次メモリに存在するか否かを判別し、存在する場合にはステップ（ｓ）を呼び出し、それ以外の場合にはステップ（ｏ）へ続行するステップと、（ｏ）前記圧縮データ・ストリーム内の発信セグメントとして前記２次メモリ記憶位置に対応するデータ・ブロックを送信するステップと、（ｐ）前記３次メモリの先頭に前記２次メモリ記憶位置を挿入するステップと、（ｑ）前記２次メモリの先頭に前記２次メモリ記憶位置を移動するステップと、（ｒ）ステップ（ｂ）に戻るステップと、（ｓ）前記２次メモリ記憶位置の前記３次メモリ位置を判別するステップと、（ｔ）前記圧縮データ・ストリーム内の発信セグメントとして前記３次メモリ位置に対応するデータ・ブロックを送信するステップと、（ｕ）前記３次メモリの先頭に前記３次メモリ位置を移動するステップと、（ｖ）前記２次メモリの先頭に前記２次メモリ記憶位置を移動するステップと、（ｗ）ステップ（ｂ）に戻るステップとを含む圧縮方法。３．入力トークンを圧縮する回路であって、トークンの１次リストと２次リストを記憶するメモリと、前記メモリに接続され、前記入力トークンが前記１次リストに現れないたびに前記入力トークンの符号化表現を伝播する手段と、前記メモリに接続され、前記入力トークンが前記１次リストには現れるが該入力トークンの該１次リストでの位置が前記２次リストには現れないたびに前記１次リストでの該入力トークンの前記位置の符号化表現を伝播する手段と、前記メモリに接続され、前記入力トークンが前記１次リストに現れており該入力トークンの該１次リストでの位置が前記２次リストに現れる場合に該入力トークンに対応する前記２次リストでの位置の符号化表現を伝播する手段とを含む圧縮回路。

───────────────────────────────────────────────────── フロントページの続き (72)発明者ラヤゴプラン，シヴァラマクリシュナンアメリカ合衆国 02146 マサチューセッツ州，ブルックライン，エグレモントロード 28，アパートメント３ (72)発明者ヴェンカテサン，ラマラスナムアメリカ合衆国 07960 ニュージャージー州，モーリスタウン，コンクリンアヴェニュ９ (72)発明者ウェイ，ヴィクター，ケーウェイアメリカ合衆国 07058 ニュージャージー州，ワレン，オークウッドパス７

Claims

【特許請求の範囲】１．トークンを圧縮する方法であって、トークンが１次リストに現れない場合には該トークンの符号化表現を伝播するステップと、トークンが前記１次リストには現れているが該１次リスト内の該トークンの位置が２次リストには現れない場合には該１次リスト内の該トークンの位置の符号化表現を伝播するステップと、トークンが前記１次リストに現れていて、かつ該１次リストでの該トークンの位置が前記２次リストに現れる場合には該トークンに対応する該２次リスト内の位置の符号化表現を伝播するステップとを含む圧縮方法。２．トークンを圧縮する方法であって、トークンが１次リストに現れない場合には該トークンの符号化表現を伝播するステップと、トークンが前記１次リストには現れるが該トークンの該１次リスト内の位置が２次リストに現れない場合には該１次リスト内の該トークンの位置の符号化表現を伝播するステップと、前記トークンが前記１次リストに現れていて、かつ該１次リストでの該トークンの位置が前記２次リストに現れているが、該２次リスト内の該位置が３次リストには現れない場合には該トークンに対応する該２次リスト内の前記位置の符号化表現を伝播するステップと、トークンが前記１次リストに現れ、該１次リストでの該トークンの位置が前記２次リストに現れ、かつ該２次リストの該位置が前記３次リストに現れる場合には、該トークンに対応する該３次リスト内の位置の符号化表現を伝播するステップとを含む圧縮方法。３．着信データ・ストリームを圧縮して発信圧縮データ・ストリームを作成する方法であって、（ａ）着信データ・ストリームを解析して対応するトークンのストリームを生成するステップと、（ｂ）前記トークンのストリームからの各トークンが１次メモリに記憶されているか否かを逐次判別し、記憶されている場合にはステップ（ｆ）を呼び出し、それ以外の場合にはステップ（ｃ）へ続行するステップと、（ｃ）新規トークンを示す識別データを送信し、前記圧縮データ・ストリーム内の対応する発信データセグメントとして該新規トークンの表現を送信するステップと、（ｄ）前記１次メモリの先頭に前記新規トークンを挿入するステップと、（ｅ）ステップ（ｂ）に戻るステップと、（ｆ）前記１次メモリ内の前記各トークンの該１次メモリ・アドレスを判別するステップと、（ｇ）前記１次メモリ・アドレスが２次メモリ内に存在するか否かを判別し、存在する場合にはステップ（１）を呼び出し、それ以外の場合にはステップ（ｈ）へ続行するステップと、（ｈ）前記圧縮データ・ストリーム内の発信セグメントとして前記１次メモリ・アドレスに対応するデータ・ブロックを送信するステップと、（ｉ）前記２次メモリの先頭に前記１次メモリ・アドレスを挿入するステップと、（ｊ）前記１次メモリの先頭に前記各トークンを移動するステップと、（ｋ）ステップ（ｂ）に戻るステップと、（ｌ）前記１次メモリ・アドレスの前記２次メモリ記憶位置を判別するステップと、（ｍ）前記圧縮データ・ストリーム内の発信セグメントとして前記２次メモリ記憶位置に対応するデータ・ブロックを送信するステップと、（ｎ）前記１次メモリの先頭に前記各トークンを移動するステップと、（ｏ）前記２次メモリの先頭に前記２次メモリ記憶位置を移動するステップと、（ｐ）ステップ（ｂ）に戻るステップとを含む圧縮方法。４．請求項３に記載の圧縮方法に於いて、前記１次メモリの先頭に前記新規トークンを挿入する前記ステップ（ｄ）は該１次メモリを表わす木を拡張するステップを含む圧縮方法。５．請求項３に記載の圧縮方法に於いて、前記２次メモリの先頭に前記１次メモリ・アドレスを挿入する前記ステップ（ｉ）は該２次メモリを表わす木を拡張するステップを含む圧縮方法。６．請求項３に記載の圧縮方法に於いて、前記１次メモリの先頭に前記各トークンを移動する前記ステップ（ｊ）は該１次メモリを表わす木を拡張するステップを含む圧縮方法。７．請求項３に記載の圧縮方法に於いて、前記１次メモリの先頭に前記各トークンを移動する前記ステップ（ｎ）は該１次メモリを表わす木を拡張するステップを含む圧縮方法。８．請求項３に記載の圧縮方法に於いて、前記２次メモリの先頭に前記２次メモリ記憶位置を移動する前記ステップ（ｏ）は該２次メモリを表わす木を拡張するステップを含む圧縮方法。９．請求項３に記載の圧縮方法に於いて、前記トークンのストリームからの各トークンが１次メモリに記憶されているか否かを逐次判別する前記ステップ（ｂ）は該トークンをハッシュするステップを含む圧縮方法。１０．請求項３に記載の圧縮方法に於いて、前記１次メモリ・アドレスの前記２次メモリ記憶位置を判別する前記ステップ（ｇ）は前記１次メモリ・アドレスをハッシュするステップを含む圧縮方法。１１．着信データ・ストリームを圧縮して発信圧縮データ・ストリームを作成する方法であって、（ａ）着信データ・ストリームを解析して対応するトークンのストリームを生成するステップと、（ｂ）前記トークンのストリームからの各トークンが１次メモリに記憶されているか否かを逐次判別し、記憶されている場合にはステップ（ｆ）を呼び出し、それ以外の場合にはステップ（ｃ）へ続行するステップと、（ｃ）新規トークンを示す識別データを送信し、前記圧縮データ・ストリーム内の対応する発信データセグメントとして該新規トークンの表現を送信するステップと、（ｄ）前記１次メモリの先頭に前記新規トークンを挿入するステップと、（ｅ）ステップ（ｂ）に戻るステップと、（ｆ）前記１次メモリ内の前記各トークンの該１次メモリ・アドレスを判別するステップと、（ｇ）前記１次メモリ・アドレスが２次メモリ内に存在するか否かを判別し、存在する場合にはステップ（ｌ）を呼び出し、それ以外の場合にはステップ（ｈ）へ続行するステップと、（ｈ）前記圧縮データ・ストリーム内の発信セグメントとして前記１次メモリ・アドレスに対応するデータ・ブロックを送信するステップと、（ｉ）前記２次メモリの先頭に前記１次メモリ・アドレスを挿入するステップと、（ｊ）前記１次メモリの先頭に前記各トークンを移動するステップと、（ｋ）ステップ（ｂ）に戻るステップと、（ｌ）前記１次メモリ・アドレスの前記２次メモリ記憶位置を判別するステップと、（ｍ）前記１次メモリの先頭に前記各トークンを移動するステップと、（ｎ）前記２次メモリ記憶位置が３次メモリに存在するか否かを判別し、存在する場合にはステップ（ｓ）を呼び出し、それ以外の場合にはステップ（ｏ）へ続行するステップと、（ｏ）前記圧縮データ・ストリーム内の発信セグメントとして前記２次メモリ記憶位置に対応するデータ・ブロックを送信するステップと、（ｐ）前記３次メモリの先頭に前記２次メモリ記憶位置を挿入するステップと、（ｑ）前記２次メモリの先頭に前記２次メモリ記憶位置を移動するステップと、（ｒ）ステップ（ｂ）に戻るステップと、（ｓ）前記２次メモリ記憶位置の前記３次メモリ位置を判別するステップと、（ｔ）前記圧縮データ・ストリーム内の発信セグメントとして前記３次メモリ位置に対応するデータ・ブロックを送信するステップと、（ｕ）前記３次メモリの先頭に前記３次メモリ位置を移動するステップと、（ｖ）前記２次メモリの先頭に前記２次メモリ記憶位置を移動するステップと、（ｗ）ステップ（ｂ）に戻るステップとを含む圧縮方法。１２．請求項１１に記載の圧縮方法に於いて、前記１次メモリの先頭に前記新規トークンを挿入する前記ステップ（ｄ）は該１次メモリを表わす木を拡張するステップを含む圧縮方法。１３．請求項１１に記載の圧縮方法に於いて、前記２次メモリの先頭に前記１次メモリ・アドレスを挿入する前記ステップ（ｉ）は該２次メモリを表わす木を拡張するステップを含む圧縮方法。１４．請求項１１に記載の圧縮方法に於いて、前記３次メモリの先頭に前記２次メモリ記憶位置を挿入する前記ステップ（ｐ）は前記３次メモリを表わす木を拡張するステップを含む圧縮方法。１５．請求項１１に記載の圧縮方法に於いて、前記１次メモリの先頭に前記各トークンを移動する前記ステップ（ｊ）は該１次メモリを表わす木を拡張するステップを含む圧縮方法。１６．請求項１１に記載の圧縮方法に於いて、前記１次メモリの先頭に前記各トークンを移動する前記ステップ（ｍ）は該１次メモリを表わす木を拡張するステップを含む圧縮方法。１７．請求項１１に記載の圧縮方法に於いて、前記３次メモリの先頭に前記３次メモリ位置を移動する前記ステップ（ｕ）は該３次メモリを表わす木を拡張するステップを含む圧縮方法。１８．請求項１１に記載の圧縮方法に於いて、前記２次メモリの先頭に前記２次メモリ記憶位置を移動する前記ステップ（ｖ）は該２次メモリを表わす木を拡張するステップを含む圧縮方法。１９．請求項１１に記載の圧縮方法に於いて、前記２次メモリの先頭に前記２次メモリ記憶位置を移動する前記ステップ（ｑ）は該２次メモリを表わす木を拡張するステップを含む圧縮方法。２０．請求項１１に記載の圧縮方法に於いて、前記トークンのストリームからの各トークンが１次メモリに記憶されているか否かを逐次判別する前記ステップ（ｂ）は該トークンをハッシュするステップを含む圧縮方法。２１．請求項１１に記載の圧縮方法に於いて、前記１次メモリ・アドレスの前記２次メモリ記憶位置を判別する前記ステップ（ｇ）は該１次メモリ・アドレスをハッシュするステップを含む圧縮方法。２２．請求項１１に記載の圧縮方法に於いて、前記２次メモリ記憶位置の前記３次メモリ位置を判別する前記ステップ（ｎ）は該２次メモリ記憶位置をハッシュするステップを含む圧縮方法。２３．１次メモリと２次メモリとを用いて圧縮データ・ストリームを出力データ・ストリームに伸長する方法であって、先頭移動データ構造を用いて一連のトークンに分割された着信データ・ストリームを圧縮することにより形成された前記圧縮データ・ストリームは前記１次メモリ内の反復トークンのまたは前記反復トークンの前記１次メモリ内のアドレスの最も新しい出現の最新ランクを前記２次メモリ内のエントリとして備え、前記圧縮データ・ストリームは各新規トークンを各反復トークンから区別するための区切りと、各トークンの長さを与えるトークン標識を有し、反復トークンの場合には、該反復トークンの符号化表現として前記メモリからの前記最新ランクが機能し、前記１次メモリは各アドレスにいずれかの反復トークンの最も新しい出現を記憶し、前記２次メモリは前記反復トークンの前記最も新しい出現の前記１次メモリ内の前記アドレスをメモリ記憶位置に記憶し、（ａ）前記圧縮データ・ストリームを逐次解析して前記トークンの次に着信するトークンが新規トークンかまたは反復トークンかを判別し、前記次のトークンが新規トークンの場合にはステップ（ｅ）に進み、それ以外の場合にはステップ（ｂ）へ続行するステップと、（ｂ）前記圧縮データ・ストリーム内の前記最新ランクが前記１次メモリに存在することを前記トークン標識が示している場合にはステップ（ｃ）へ続行し、それ以外の場合にはステップ（ｄ）に進むステップと、（ｃ）前記圧縮データ・ストリームに含まれる前記最新ランク情報に基づいて前記１次メモリ内の前記反復トークンの前記記憶アドレスを判別し、該反復トークンを前記出力データ・ストリームに引き渡して、ステップ（ｆ）に進むステップと、（ｄ）前記圧縮データ・ストリーム内に含まれる前記最新ランク情報に基づいて前記２次メモリ内の前記反復トークンの前記記憶位置を判別し、前記反復トークンの前記２次メモリ記憶位置に基づいて前記１次メモリ内の前記反復トークンの前記記憶アドレスを判別し、前記反復トークンを前記出力データ・ストリームに引き渡して、ステップ（ｆ）へ進むステップと、（ｅ）前記トークン長の標識から前記新規トークンの長さを判別し、該新規トークンの長さに基づいて前記圧縮データ・ストリームからのデータを前記出力データ・ストリームへ提供するステップと、（ｆ）前記先頭移動データ構造を用いて前記メモリを更新し、ステップ（ａ）に戻るステップとを含む伸長方法。２４．入力トークンを圧縮する回路であって、トークンの１次リストと２次リストを記憶するメモリと、前記メモリに接続され、前記入力トークンが前記１次リストに現れないたびに前記入力トークンの符号化表現を伝播する手段と、前記メモリに接続され、前記入力トークンが前記１次リストには現れるが該入力トークンの該１次リストでの位置が前記２次リストには現れないたびに前記１次リストでの該入力トークンの前記位置の符号化表現を伝播する手段と、前記メモリに接続され、前記入力トークンが前記１次リストに現れており該入力トークンの該１次リストでの位置が前記２次リストに現れる場合に該入力トークンに対応する前記２次リストでの位置の符号化表現を伝播する手段とを含む圧縮回路。２５．入力トークンを圧縮する回路であって、トークンの１次リストと、２次リストと、３次リストを記憶するメモリと、前記メモリに接続され、前記入力トークンが前記１次リストに現れないたびに該入力トークンの符号化表現を伝播する手段と、前記メモリに接続され、前記入力トークンが前記１次リストには現れるが該入力トークンの該１次リストでの位置が前記２次リストに現れないたびに前記入力トークンの前記位置の符号化表現を伝播する手段と、前記メモリに接続され、前記入力トークンが前記１次リストに現れており、該入力トークンの該１次リストでの位置が前記２次リストに現れ、かつ前記２次リストの位置が前記３次リストに現れないたびに前記入力トークンに対応する前記２次リストでの位置の符号化表現を伝播する手段と、前記メモリに接続され、前記入力トークンが前記１次リストに現れており、該入力トークンの該１次リストでの位置が前記２次リストに現れ、かつ前記２次リストの位置が前記３次リストに現れるたびに前記入力トークンに対応する前記３次リストの位置の符号化表現を伝播する手段とを含む圧縮回路。