JP3083550B2

JP3083550B2 - データ圧縮及び復元方法

Info

Publication number: JP3083550B2
Application number: JP31520690A
Authority: JP
Inventors: 佳之岡田; 広隆千葉; 茂吉田; 泰彦中野
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1990-11-20
Filing date: 1990-11-20
Publication date: 2000-09-04
Anticipated expiration: 2015-09-04
Also published as: JPH04185117A

Description

【発明の詳細な説明】〔目次〕概要産業上の利用分野従来の技術（第13図乃至第18図）発明が解決しようとする課題課題を解決するための手段（第１図）作用実施例（ａ）第１の実施例の説明（第２図乃至第５図）（ｂ）第２の実施例の説明（第６図乃至第８図）（ｃ）第３の実施例の説明（第９図乃至第11図）（ｄ）第４の実施例の説明（第12図）（ｅ）他の実施例の説明発明の効果〔概要〕ユニバーサル符号化によりデータ圧縮するデータ圧縮
及び復元方法に関し，無関係なデータ系列間のデータを登録することを防
ぎ，圧縮率を向上することを目的とし，符号化済データを相異なる部分列に分けて，該部分列
を辞書に登録しておき，入力データで辞書に登録された
部分列を検索し，該入力データを該辞書に登録された部
分列の内，最大長一致するものの参照番号で指定して符
号化し，該辞書に登録するデータ圧縮方法において，該
入力データから該入力データの区切りを検出し，該区切
りを境にして，該区切り以降の入力データを新たな該辞
書登録の対象とする。

〔産業上の利用分野〕

本発明は，ユニバーサル符号化によりデータ圧縮する
データ圧縮及び復元方法に関する。

近年，文字コード，ベクトル情報，画像等様々な種類
のデータがコンピュータで扱われるようになっており，
扱われるデータ量も急速に増加してきている。大量のデ
ータを扱うときは，データの中の冗長な部分を省いてデ
ータ量を圧縮することで，記憶容量を減らしたり，速く
伝送したりできるようになる。

様々なデータを１つの方式でデータ圧縮できる方法と
してユニバーサル符号化が提案されている。ここで，本
発明の分野は，文字コードの圧縮に限らず，様々なデー
タに適用できるが，以下では，情報理論で用いられてい
る呼称を踏襲し，データの1word単位を文字と呼び，デ
ータが任意wordつながったものを文字列と呼ぶことにす
る。

ユニバーサル符号の代表的な方法として,Ziv−Lempel
（ジブ−レンペル）符号がある（詳しくは，例えば，宗
像「Ziv−Lempelのデータ圧縮法」，情報処理,Vol.26,N
o.1,1985年を参照のこと）。

Ziv−Lempel符号ではユニバーサル型と，増分分
解型（Incremental parsing）の２つのアルゴリズムが
提案されている。さらに，ユニバーサル型アルゴリズム
の改良として,LZSS符号がある（T.C.Bell,“Better OPM
/1.Text Compression",IEEE Trans.on Commun.,Vol.COM
−34,No.12,Dec.1986参照）。また，増分分解型アルゴ
リズムの改良としては,LZW（Lempel−Ziv−Welch）符号
がある（T.A.Welch,“A Technique for High−Performa
nce Data Compression",Computer,June 1984参照）。

このようなユニバーサル符号化を用いたデータ圧縮方
法では，圧縮率の向上が求められる。

〔従来の技術〕

第13図は従来技術の説明図である。

元来，ユニバーサル符号は，情報保存型のデータ圧縮
方法であり，データ圧縮時に情報源の統計的な性質を予
め仮定しないため，種々のタイプ（文字コード，オプジ
ェクトコードなど）のデータに適用することができる。

文書画像では，文字の文字線の直線性や曲がり具合に
は類似性がある。また，網点画像は，画像全体が網点分
散するため膨大な数の変化点が出現するが，網点周期
性，網点形状の同一性から輪郭線の接続関係は類似して
いる。この類似性のもつ冗長性をユニバーサル符号化に
より削減し，有効な圧縮ができる。

このように，画像データに対しユニバーサル符号化が
有効なため，第13図に示すように，画像データをMMR方
式等により二次元的な情報（中間データ）に変換する前
処理を行い，次にLZW符号を用いてユニバーサル符号化
を行う本処理を行って，画像に対するユニバーサル符号
化の圧縮効率をより一層高める方法を既に提案した。

この既提案の方法は，入力した画像を変化画素の相対
アドレスデータに変換し，その変換データから走査線方
向の変換画素の連続性等の統計的性質をユニバーサル符
号化の手法により学習しながら符号の最良化を図り，種
々の性質の画像において効率の良い圧縮を行うようにす
るものである。

即ち,MMR方式（標準方式を変形）を変化画素のモード
の検出を前処理として用い，それにユニバーサル符号化
（Ziv−Lempel符号）を適用し，変化画素の連続性や輪
郭線の直線性，曲がり具合の大域的性質をユニバーサル
符号のインデックスで表すようにする。

このユニバーサル符号化をLZW符号を例に説明する。

第14図はLZW符号化処理フロー図，第15図はLZW復号化
処理フロー図である。

LZW符号化は，書き替え可能な辞書をもち，入力文字
コード，データ中を相異なる文字列に分け，この文字例
を出現した順に番号を付けて辞書に登録するとともに，
現在入力している文字列を辞書に登録いてある最長一致
文字列の番号（インデックス）で表して，符号化するも
のである。

第14図のフロー図により符号化処理を説明する。

先ずステップS1（以下「ステップ」を省略）で予め全
文字につき一文字からなる文字列を初期値として登録し
てから符号化を始める。S1の符号化は，入力した最初の
文字Ｋにより辞書を検索して参照番号ωを求め，これを
語頭文字列（prefix string）とする。

次にS2で入力データの次の文字を読み込み,S3で文字
入力が終了したか否かをチェックした後,S4に進んでS1
で求めた語頭文字列ω又はS5のωにS2で読み込んだ文字
Ｋを加えた（ωＫ）が辞書にあるか否か探す。

S4で文字列（ωＫ）が辞書になければ,S6に進んでS1
で求めた文字Ｋの参照番号ωを符号語code（ω）として
出力し，また文字列（ωＫ）に新たな参照番号を付加し
て辞書に登録し，さらにS2の入力文字Ｋを参照番号ωに
置き換えるとともに，辞書アドレスｎをインクリメント
してS2に戻って次の文字Ｋを読み込む。

一方,S4で文字列（ωＫ）が辞書にあれば,S5で文字列
（ωＫ）を参照番号ωに置き換え，再びS2に戻って文字
列（ωＫ）が辞書から探せなくなるまで最大一致長の探
索を続ける。

第15図の復号化処理は第14図の符号化の逆の操作を行
う。

第15図の復号化では，符号化と同様に予め辞書に全文
字につき一文字から成る文字列を初期値として登録して
から復号を始める。

先ずS1で最初の符号（参照番号）を読み込み，現在の
CODEをOLDcodeとし，最初の符号は既に辞書に登録され
た一文字の参照番号いずれかに該当することから，入力
符号CODEに一致する文字code（Ｋ）を探し出し，文字Ｋ
を出力する。なお，出力した文字（Ｋ）は後述するS8の
例外処理のためFINcharにセットしておく。

次にS2に進んで次の符号を読み込んでCODEにINcodeと
してセットする。

S3で新たな符号があるか否か，すなわち符号入力の終
了の有無をチェックしてS4に進み,S3で入力された符号C
ODEが辞書に定義（登録）されているか否かチェックす
る。

通常，入力した符号語は前回までの処理で辞書に登録
されているため,S5に進んで符号CODEに対応する文字列c
ode（ωＫ）を辞書から読み出し,S6で文字列Ｋを一時的
にスタックし，参照番号code（ω）を新たなCODEとして
再度S5に戻り，このS5,S6の手順を再帰的に参照番号ω
が一文字に至るまで繰り返し，最後にS7に進んでS6でス
タックした文字をLIFO（Last In Fast Out）形式でポッ
プアップして出力する。同時にS7において，前回使った
符号ωと今回復元した文字列の最初の一文字Ｋを組
（ω,K）と表した文字列に，新たな参照番号を付加して
辞書に登録する。

このような画像のユニバーサル符号化のメリットを高
めるための，画像データの前処理方法について既提案の
ものを例に第16図，第17図により説明する。

第16図は既提案の画像データの二次元符号化説明図，
第17図はその符号化例説明図である。

第16図（Ｂ）に示すように，モード情報として，各々
１バイトの水平モードH,垂直モードV,バスモードＰを割
り当てる。

次に，水平モードランレングス情報としては，白／黒
ランレングスを長さに応じ１バイト又は２バイト用い，
垂直モードズレレングス情報としては，変化点ズレレン
グスを長さに応じ,1バイト又は２バイト用いる。

符号化は,MMR方式と同様に，第１ライン目の水平ラン
レングスで符号化し，第２ライン目以降は変化点におけ
る前のラインとの垂直ズレレングス及びパスモードで符
号化する。

例えば，第16図（Ａ）の画像に対しては，第17図のよ
うな二次元符号化データが得られる。

即ち，第１ライン目では，水平モードＨと白のランレ
ングスRL1,水平モードH2と黒のランレングスRL2に，第
２ライン目では，変化点（白→黒）の第１ライン目の変
化点からの垂直ズレレングスV1−ZL21と，変化点（黒→
白）の垂直ズレレングスV2−ZL22に，第３ライン目で
は，変化点の垂直ズレレングスV2−ZL31,V2−ZL32と，
水平モードH3と白のランレングスRL3,水平モードH4と黒
のランレングスRL4に符号化される。

このような画像の二次元符号化を行い，ユニバーサル
符号化を行った例を第18図に示す。

同図中，入力シンボルが，二次元符号化結果であり，
出力符号がそのユニバーサル符号化結果である。

例えば，入力シンボル“10000000"はインデックス「1
28」で符号化され，辞書へは（既登録データ＋次のデー
タ）が登録される。

〔発明が解決しようとする課題〕

ところで，ユニバーサル符号化は，データ系列に関係
なく，最大長一致既登録データに次の１シンボルを加え
たものを辞書に登録する。

このため，第18図の登録番号258,260,264,266,268,27
2,274,277等のように全く無関係なデータ系列の組合せ
も登録することになる。

これによって，従来技術では，無関係なデータ系列間
のデータも組合せて，登録するため，出現頻度の極めて
少ないものを数多く登録してしまい，学習効果の遅れや
インデックス（登録番号）の増加による圧縮率の低下を
招くという問題があった。

従って，本発明は，無関係なデータ系列間のデータを
登録することを防ぎ，圧縮率を向上することのできるデ
ータ圧縮及び復元方法を提供することを目的とする。

〔課題を解決するための手段〕

第１図は本発明の原理図である。

本発明は，第１図に示すように，符号化済データを相
異なる部分列に分けて，該部分列を辞書に登録してお
き，入力データで辞書に登録された部分列を検索し，該
入力データを該辞書に登録された部分列の内，最大長一
致するものの参照番号で指定して符号化し，該辞書に登
録するデータ圧縮方法において，該入力データから該入
力データの区切りを検出し，該区切りを境にして，該区
切り以降の入力データを新たな該辞書の登録の対象とす
るものである。

又，本発明は，請求項（１）の符号化データを辞書に
登録された部分列の参照番号と比較し，該符号化データ
を一致する参照番号の部分列に復元するデータ復元方法
において，復元された部分列からデータの区切りを検出
し，該区切りを境に，新部分列を該辞書に登録するもの
である。

〔作用〕

本発明では，データ系列の区切りを検出し，区切りを
境にして，区切り以降の入力データを新データ系列とし
て登録の対象とするので，データ系列の異なる組合せデ
ータを登録することを防止し，出現頻度の低い無駄と思
われる登録をなくし，有用な登録を早くできるようにし
て学習効果を促進し，また無駄な登録をなくし，インデ
ックス（のビット数）の増加を抑え，圧縮率を向上させ
る。

〔実施例〕

（ａ）第１の実施例の説明第２図は，本発明の第１の実施例処理フロー図であ
る。

画像データを，第16図，第17図で説明したように，
二次元的な情報に変換して前処理する。

次に，変換されたデータの切れ目（区切り）を認識
（検出）し，辞書への登録選択しながら，前述のユニバ
ーサル符号化を行い本処理する。

この本処理は次のようにして行う。

入力文次（データ）系列と同じ文字（データ）系列
を辞書内において検索する（辞書検索ステップ）。

次に辞書内で検索一致した文字（データ）系列のイ
ンデックスを符号化する（インデックス符号化ステッ
プ）。

文字（データ）列の切れ目を認識し，辞書に登録す
る（辞書登録ステップ）。

第３図は本発明の第１の実施例符号化処理フロー図で
あり，第４図はその動作説明図，第５図はその復号化処
理フロー図である。

尚，符号化，復号化とも，図示しないプロセッサがメ
モリに辞書を作成して実行するものとする。

符号化処理について，第３図を用いて説明する。

尚，第14図で示したステップと同一のものは，同一の
記号で示してある。

S1）辞書の初期化として，第１番目の256文字（ワー
ド）を登録し，辞書の先頭アドレスＮを256とする。

次に，最初の文字Ｋを入力し，辞書中のそのアドレス
をω_１に代入する。

S2）次の文字Ｋを入力し,S4に進む。

S4）文字列ω_１と文字Ｋとの組合せが辞書にあるかど
うかを調べる。

S5）辞書にω₁ Kが存在するならば，ω₁ Kの登録アド
レスに代入する。

S3）次にデータが終了かを調べ，データ終了ならS7
へ，データ終了でないならS2へ戻る。

これによって辞書内にある最長一致文字列を検索す
る。

S7）データ終了なら，アドレスω_１を符号として出力
し，終了する。

S8）ステップS4で，辞書にω₁ Kが存在しないなら
ば，ω_１とＫとの間がデータの切れ目かを判定する。

例えば,Kが水平モードコード（10000000），パスモー
ドコード（00000001）であることやデータ構成上Ｋがズ
レレングスコードであることによって，データの切れ目
と判定する。

S6）従来通り，データの切れ目でなければ，アドレス
ω_１を符号として出力し，ω₁ Kを辞書のアドレスＮに
登録し，先頭アドレスＮを（Ｎ＋１）にインクリメント
し,Kの辞書アドレスをω_１に代入し，ステップS3へ進
む。

S9）一方，データの切れ目であれば，アドレスω_１を
符号として出力し，辞書の登録はせずに,Kの辞書アドレ
スをω_１に代入し，ステップS3へ進む。

このように，ステップS8,S9を設け，データの切れ目
なら，辞書登録を打ち切り,Kをω_１として切れ目以降の
データを新規の辞書登録の対象とする。

第４図の例で圧縮（符号化）処理について具体的に説
明する。

ここで，入力シンボルを前述の第18図と同一のもので
説明し，矢印が区切り位置である。

先づ，第１ライン目は水平モードと白黒ランレングス
との組み合わせであるから，水平モード（10000000）と
２バイトの白ランレングス（RL W128）で区切りとな
る。

ここで，白黒ランレングスは，第16図（Ｂ）のよう
に，先頭“0"の１バイトコード又は先頭“1"の２バイト
コードが割当てられるので，ここではランレングスの先
頭が“1"のため２バイトコードと認識できる。

次の水平モードと２バイトの黒ランレングスも１つの
データ系列としてまとめられ，区切りとなる。

従って，第１ライン目では，水平モードが出力符号
「128」とし，白ランレングスの第１バイト目が出力符
号「128」として出力され，これらをまとめて登録番号
「256」として辞書登録される。

次に，白ランレングスの第２バイト目が出力符号
「１」として出力され，前の登録辞書内容（10000000）
との組合せが，辞書に登録番号「257」として登録され
る。

次に,2番目の水平モードに対しては，前に区切りがあ
るため，白ランレングスと続けて組合わせて，登録され
ず,2番目の水平モード以降を新規登録，検索の対象とす
る。

即ち，水平モードと黒ランレングスの第１バイト目の
内容が先づ検索の対象とされ，これは辞書に登録番号
「256」として存在するので，出力符号「256」として出
力される。そして，黒ランレングスの第２バイト目の内
容は出力符号「72」として出力され，前の辞書内容「25
6」出力符号「72」が登録番号「258」として辞書登録さ
れる。

同様に，第２ライン目以降は，基本的にはズレレング
スのため，ズレレングスの境を見付けて，切れ目を検出
する。

ズレレングスは，第16図（Ｂ）のように，先頭２ビッ
トが“00",“01",“10",“11"の１バイト,2バイトコー
ドであり，水平モード（10000000），垂直モード（0000
0000），パスモード（00000001）は割当てられないた
め，これらと区別できる。

従って，同様にして，ズレレングスの切れ目を第４図
のように検出でき，切れ目を境に新規に，辞書検索，登
録を行う。

以下，第３ライン目以降も同様に行う。

このようにして，入力シンボルの符号形式から区切り
を検出する。

従って，この例では，各区切り毎に辞書検索登録が行
われ，無関係なデータ系列の組み合わせを登録しなくて
済み，学習効果が向上し，インデックス（登録番号）の
ビット数の増加も最小限で抑えられる。

次に，復元処理について，第５図を用いて説明する。

尚，第15図で示したステップと同一のものは，同一の
記号で示してある。

S1）符号化と同様に予め辞書に第１番目の256文字を
登録し，辞書の先頭アドレスｎを「256」としてから復
号を始める。

先づ，最初の符号（参照番号）を読み込み，現在のCO
DEをOLDcodeとし，最初の符号は既に辞書に登録された
一文字の参照番号いずれかに該当することから，入力符
号CODEに一致する文字code（Ｋ）を探し出し，文字Ｋを
出力する。なお，出力した文字（Ｋ）は後の例外処理の
ためFINcharにセットしておく。

S2）次にS2に進んで次の符号を読み込んでCODEにINco
deとしてセットする。

S4）次にS4に進み,S2で入力された符号CODEが辞書に
定義（登録）されているか否かチェックする。

S5）通常，入力した符号語は前回までの処理で辞書に
登録されているため,S5に進んで符号CODEに対応する文
字列code（ωＫ）を辞書から読み出す。

S6） S6で文字列Ｋを一時的にスタックし，参照番号co
de（ω）を新たなCODEとして再度S5に戻し，このS5,S6
の手順を再帰的に参照番号ωが一文字にいたるまで繰り
返す。

S9）最後にS9に進んで，文字Ｋを出力し,KをFINchar
にセットした後,S6でスタックした文字をLIFO（Last In
Fast Out）形式でポップアップして出力する。

S10）次に，復元された文字を前述の符号化のステッ
プS8と同様に，構文解析し，データの切れ目があるかを
チェックする。データの切れ目の場合は，ステップS12
へ，データの切れ目でない場合は，ステップS11へ進
む。

S11）データの切れ目でないなら，前回使った符号OLD
codeと今回復元した文字列の最初の一文字Ｋを組（OLDc
ode,K）と表わした文字列を，新たな参照番号で辞書に
登録し，参照番号（アドレス）ｎをｎ＋１にインクリメ
ントとし,INcodeをOLDcodeにセットして，ステップS3に
進む。

S12）データの切れ目なら，辞書登録は行わず,INcode
をOLDcodeにセットし，ステップS3へ進む。

S3）データが終了かをチェックし，終了でなければ,S
2へ戻り，終了なら復号化を終了する。

S8）なお,S4において登録されていない符号（符号化
において直前の参照番号を参照する場合に起きる）場
合,S8にて,FINcharを出力し,OLDcodeをCODEに,code（OL
Dcode,FINchar）をINcodeに戻した後にS5へ進むように
する。

即ち，第15図の従来例に対し，ステップS10,S11,S12
が加わり，データの切れ目でなければ，従来通り，新規
辞書登録を行い，データの切れ目なら新規辞書登録を行
なわず，データの切れ目で登録内容を区切っている。

（ｂ）第２の実施例の説明第６図は本発明の第２の実施例符号化処理フロー図，
第７図はその動作説明図，第８図はその復号化処理フロ
ー図である。

尚，第３図乃至第５図で説明したステップと同一のも
のは，同一の記号で示してあり，説明は省略する。

この例は，第１の実施例が，区切り間において，辞書
登録を前の出力符号に今回の文字（データ）を組合わせ
たもので行うのに対し，辞書登録を区切りの先頭文字
（データ）から今回の文字まで連続させたものを行うも
のであり，この連続登録により圧縮率が高くなる。

符号化処理について，第６図を用いて説明する。

S1）第３図のステップS1と基本的に同一である。

但し，最初の文字Ｋを入力し，それを，登録する時に
利用する文字列ω_１と符号化する時に利用する文字列ω
_２に代入する。

尚，ここでは，ω_１＝ω_２となる。

S2,S4,S8）第３図のステップS2,S4,S8と同一である。

S6） S9でデータの切れ目でない場合は，データの区切
り目ではないので，符号文字列ω_２に対応する符号code
（ω_２）を出力すると共にω₁Kの組合せを辞書に登録，
登録アドレスをインクリメントした後，ω₁Kが登録され
ているアドレスを新たなω_１（これによって連続登録が
可能）,Kを新たなω_２として,S3へ進む。

S7）データの切れ目である場合は，符号code（ω_２）
を出力するとともに,Kを新たなω₁,ω_２とし，ステップ
S3へ進む。

これによってデータの切れ目で検索，登録を区切る。

S5） S4でω₁Kが辞書にある場合は，ω₁ Kが登録され
ているアドレスを新たなω_１に，ω₂Kが登録されている
アドレスを新たなω_２に代入し,S3へ進む。

S3,S7）第３図のS3,S7と同一である。

第７図の例で符号化処理について具体的に説明する。

ここで，第４図の例と異なるのは，データの区切り間
で検索，登録を行うのは，同一であるが，登録内容が全
て区切りの先頭から出発している点であり，例えば，登
録番号「257」では，先頭の水平モードからランレング
スの２バイト目までを登録する。

これは，ステップS6で，ω₁ Kをω_１としているため
である。

次に，復号化処理を第８図を用いて説明する。

S1,S2,S4,S5,S6,S8,S9,S10）第５図のステップS1,S2,
S4,S5,S6,S8,S9,S10と同一である。

S11） S11では，前回使った符号OLDcodeと今回復元し
た文字列の最初の一文字Ｋを組（OLDcode,K）と表した
文字列を，新たな参照番号で辞書に登録し，参照番号ｎ
をｎ＋１にインクリメントし,code（OLDcode,K）をOLDc
odeとしてS3に進む。

OLDcodeを（OLDcode,K）に更新するので，復元におい
て，連続登録ができる。

S12,S3）第５図のステップS12,S3と同一である。

（ｃ）第３の実施例の説明第９図は本発明の第３の実施例符号化処理フロー図，
第10図はその動作説明図，第11図はその復号化処理フロ
ー図である。

尚，第６図，第８図で説明したステップと同一のもの
は，同一の記号で示してあり，説明は省略する。

この例は，データの切れ目を先頭にするのに変りはな
いが，第２の実施例に加えて，連続登録を切れ目以降ま
で延長するようにし，連続登録の長さがよく長くし，圧
縮率をより向上するものである。

符号化処理について，第９図を用いて説明する。

S1,S2,S3,S4,S5,S6,S8）第６図のステップS1,S2,S3,S
4,S5,S6,S8と同一である。

S7） S8でデータの切れ目が検出された場合は，符号co
de（ω_２）を出力すると，ω₁ Kを辞書に登録する。

即ち，区切りがあっても，連続登録が行われる。

そして，アドレスＮをＮ＋１にインクリメントし,Kを
ω₁,ω_２に代入して，ステップS3へ進む。

Ｋをω_１とするので，延長は区切りから１文字目まで
である。

第10図の例で符号化処理について具体的に説明する。

ここで，第７図の例と異なるのは，区切りがあっても
連続登録は打ち切られない点である。

例えば，登録番号「258」では，区切りがあっても，
連続登録は打ち切られず，区切りの第１バイト目である
第２番目の水平モードまで延長される。

これと同時にこの水平モードを先頭にして，登録番号
「259」のように連続登録が行なわれる。

これらは，ステップS6,S7でω₁ Kを辞書登録している
ためである。

次に復号化処理について第11図を用いて説明する。

S1,S2,S3,S4,S5,S6,S8,S9,S10,S11）第８図のS1,S2,S
3,S4,S5,S6,S8,S9,S10,S11と同一である。

S12） S10でデータの切れ目を検出すると,S11と同様
に，前回使った符号OLDcodeと今回復元した文字列の最
初の一文字Ｋを組（OLDcode,K）と表した文字列を，新
たな参照番号で辞書に登録し，参照番号ｎをｎ＋１にイ
ンクリメントし,INcodeをOLDcodeとしてS3へ進む。

これによって，区切りがあっても，連続登録が可能と
なるとともに,INcodeをOLDcodeとしているので，区切り
以降１文字目で連続登録が打ち切られる。

（ｄ）第４の実施例の説明第12図は本発明の第４図の実施例処理フロー図であ
る。

この実施例では，第２図の実施例に比し，画像データ
を二次元情報に変換する際に区切り位置に区切り（切れ
目）符号を挿入するものであり，本処理において，区切
り符号を検出し，第１乃至第３の実施例で説明した符号
化，符号化を行うものである。

このようにすると，区切りの検出に構文解析しなくて
よいので，符号化，復号化時間が短縮できるという利点
がある。

（ｅ）他の実施例の説明上述の実施例の他に，本発明は次のような変形が可能
である。

画像データを対象としたが，他のデータであっても
よい。

画像データを二次元情報に変換して符号化している
が，原データを符号化してもよい。

以上本発明を実施例により説明したが，本発明は本発
明の主旨に従い種々の変形が可能であり，本発明からこ
れらを排除するものではない。

〔発明の効果〕

以上説明した様に，本発明によれば，次の効果を奏す
る。

データ系列の区切りを検出し，区切りを境にして，
区切り以降の入力データを新データ系列として登録の対
象とするので，データ系列の異なる組合せデータの辞書
への登録を防ぎ，出現頻度の低い無駄と思われる登録を
なくし，有用な登録を早くできるようにして学習効果を
促進する。

無駄な登録をなくし，インデックスのビット数の増
加を抑え，圧縮率を向上できる。

【図面の簡単な説明】

第１図は本発明の原理図，第２図は本発明の第１の実施例処理フロー図，第３図は本発明の第１の実施例符号化処理フロー図，第４図は本発明の第１の実施例動作説明図，第５図は本発明の第１の実施例復号化処理フロー図，第６図は本発明の第２の実施例符号化処理フロー図，第７図は本発明の第２の実施例動作説明図，第８図は本発明の第２の実施例復号化処理フロー図，第９図は本発明の第３の実施例符号化処理フロー図，第10図は本発明の第３の実施例動作説明図，第11図は本発明の第３の実施例復号化処理フロー図，第12図は本発明の第４の実施例処理フロー図，第13図乃至第18図は従来技術の説明図である。

───────────────────────────────────────────────────── フロントページの続き (72)発明者中野泰彦神奈川県川崎市中原区上小田中1015番地富士通株式会社内 (56)参考文献特開昭60−116228（ＪＰ，Ａ) 特開昭61−242122（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 7/40

Claims

(57)【特許請求の範囲】

【請求項１】符号化済データを相異なる部分列に分け
て，該部分列を辞書に登録しておき，入力データで辞書に登録された部分列を検索し，該入力
データを該辞書に登録された部分列の内，最大長一致す
るものの参照番号で指定して符号化し，該辞書に登録す
るデータ圧縮方法において，該入力データから該入力データの区切りを検出し，該区切りを境にして，該区切り以降の入力データを新た
な該辞書登録の対象とすることを特徴とするデータ圧縮方法。
【請求項２】請求項（１）の符号化データを辞書に登録
された部分列の参照番号と比較し，該符号化データを一致する参照番号の部分列に復元する
データ復元方法において，復元された部分列からデータの区切りを検出し，該区切
りを境に，新部分列を該辞書に登録することを特徴とするデータ復元方法。