JP3117760B2

JP3117760B2 - データ復元方式

Info

Publication number: JP3117760B2
Application number: JP03275292A
Authority: JP
Inventors: 泰彦中野; 茂吉田; 佳之岡田; 広隆千葉
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1991-10-23
Filing date: 1991-10-23
Publication date: 2000-12-18
Anticipated expiration: 2015-12-18
Also published as: JPH05113998A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は圧縮されたデータを復号
化するデータ復元方式に関し、特にユニバーサル符号化
の一種である増分分解型の改良としてのＬＺＷ符号によ
る圧縮されたデータのデータ復元方式に関する。

【０００２】近年、文字コード、ベクトル情報、画像デ
ータなど各種のデータがコンピュータで扱われるように
なっており、扱われるデータ量も急速に増加してきてい
る。大量のデータを扱うときは、データの中の冗長な部
分を省いてデータ量を圧縮することで、記憶容量を減ら
したり、速く伝送したりすることが望まれる。

【０００３】このような様々なデータを１つの方式でデ
ータ圧縮する方法をしてユニバーサル符号化が提案され
ている。ユニバーサル符号化の代表的な方法として、Zi
v-Lempel符号を用いた方法が知られている（例えば、宗
像清治著、「Ziv-Lempelデータ圧縮法」、情報処理、p
p.2〜6 , Vol.26,No.1,1985を参照のこと）。Ziv-Lempe
l符号では、ユニバーサル型と、増分分解型（Increment
al persing ）の２つのアルゴリズムが提案されてい
る。

【０００４】本発明は増分分解型アルゴリズムを改良し
たＬＺＷ(Lempel-Ziv-Welch)符号によって圧縮されたデ
ータの復号化をさらに改善したものに関わるものであ
る。なお、「文字（Character ）」及び「文字列（Char
acter String）」の定義はＪＩＳ−Ｃ６２３０に従うほ
か、情報理論で用いられている呼称を踏襲し、１ワード
単位で構成されるデータを「文字」と呼び、任意のワー
ド単位で構成されるデータを「文字列」と呼んで、本発
明を圧縮されたデータの復号化に関わるものとして説明
する。

【０００５】

【従来の技術】従来のＬＺＷ符号の符号化アルゴリズム
によれば、入力文字列を互いに異なる部分文字列に分け
て符号化し、これらの部分文字列と符号との対応を辞書
に登録するとともに、入力文字列を、辞書中に登録され
た部分文字列と比較し、入力文字列と一致する部分文字
列の内、最大長の部分文字列を選択し、選択された部分
文字列に対応する符号によって入力文字列を符号化し、
これによってデータを圧縮することが行われている。

【０００６】図７は、例えばａ，ｂ，ｃの３文字だけの
組み合わせからなる入力文字列７１を、ＬＺＷ符号の符
号化アルゴリズムによって符号化する場合の具体例を示
す図である。予め辞書に、初期化によって、１文字の
ａ，ｂ，ｃだけをそれぞれ符号１，２，３に対応づけて
登録しておく。

【０００７】まず、入力文字列７１を左から右へ一字ず
つ読み込む。最初の文字ａを読んで、このａを語頭文字
（列）(prefix string) とする。次に、２番目の文字ｂ
を読み、先の語頭文字ａにこのｂを加えたａｂを辞書の
登録文字列と照合する。辞書にはａｂに一致する文字列
がないから、このときは辞書を参照し、先の語頭文字ａ
の対応符号１を符号化出力として出力する（出力符号欄
７２）とともに、文字列ａｂを符号４に対応させて辞書
に登録する（登録内容欄７３）。そして今度は２番目の
入力文字ｂを語頭文字とする。

【０００８】次に、入力文字列７１の３番目の文字ａを
読み、語頭文字ｂにこのａを加えたｂａを辞書の登録文
字列と照合する。辞書にはｂａに一致する文字列がない
から、このときも辞書から語頭文字ｂの対応符号２を符
号化出力として出力するとともに、文字列ｂａを符号５
に対応させて辞書に登録する。そして今度は３番目の入
力文字ａを語頭文字とする。

【０００９】さらに、４番目の文字ｂを読み、語頭文字
ａにこのｂを加えたａｂを辞書の登録文字列と照合す
る。辞書にはａｂに一致する文字列があるから、このと
きはａｂを語頭文字列とし、続けて、５番目の入力文字
ｃを読み、語頭文字列ａｂにこのｃを加えたａｂｃを辞
書の登録文字列と照合する。辞書にはａｂｃに一致する
文字列がないから、このときは辞書から語頭文字列ａｂ
の対応符号４を符号化出力として出力するとともに、文
字列ａｂｃを符号６に対応させて辞書に登録する。そし
て、今度はｃを語頭文字とする。

【００１０】以下、同様にこうしたアルゴリズムにより
符号化と辞書登録を続ける。このようにして入力文字列
ａ，ｂ，ａ，ｂ，ｃ・・・に対して符号化が行われ、図
７の出力符号欄７２に示すような符号１，２，４，３・
・・が符号化出力として出力される。そして、図９
（Ａ）に示すような登録文字列９１と対応符号９２との
対応関係が辞書に登録される。

【００１１】図１０は、以上に例示したＬＺＷ符号の符
号化の処理手順を示すフローチャートである。図中、Ｓ
に続く数字はステップ番号を示す。〔Ｓ１０１〕予め初期化によって、入力される可能性の
ある全一文字に対しそれぞれ符号を対応させて辞書に登
録する。また、辞書において次に登録すべきアドレスｎ
を例えば２５６に設定する（図７の例では４）。ｎは、
辞書に登録される文字列に対応して符号を０，１，２・
・・と付した場合、登録文字列の総数に相当する。さら
に、入力文字列を読み込み、入力した最初の文字を語頭
文字列（prefix string ）ωとする。

【００１２】〔Ｓ１０２〕次の入力文字Ｋを読み込む。〔Ｓ１０３〕ステップＳ１０２において入力文字データ
が存在したか否かを判別する。存在すればステップＳ１
０５へ進み、存在しなければステップＳ１０４へ進む。

【００１３】〔Ｓ１０４〕語頭文字列ωを辞書と照合
し、対応する符号code（ω）を読み出し、符号化出力と
して出力する。このときの符号code（ω）のビット数
は、log₂ｎ以上の最小の整数に相当する。このステップ
では文字列が入力しないから、本ステップを実行後、本
処理手順を終了する。

【００１４】〔Ｓ１０５〕語頭文字列ωに、ステップＳ
１０２で読み込んだ文字Ｋを加えた文字列ωＫを辞書と
照合し、文字列ωＫが辞書に登録されているか否かを判
別する。登録されていればステップＳ１０６に進み、登
録されていなければステップＳ１０７に進む。

【００１５】〔Ｓ１０６〕文字列ωＫを改めて語頭文字
列ωとする。そして、再びステップＳ１０２に戻る。ス
テップＳ１０２乃至ステップＳ１０６を繰り返すことに
より、入力文字列と一致する文字列として、辞書に登録
された文字列のうちの最大長の文字列が探索される。

【００１６】〔Ｓ１０７〕語頭文字列ωを辞書と照合
し、対応する符号code（ω）を読み出し、符号化出力と
して出力する。このときの符号code（ω）のビット数
は、log₂ｎ以上の最小の整数に相当する。また、文字列
ωＫにｎの値を対応させて辞書に登録する（実際には辞
書のアドレスｎに文字列ωＫを記憶する）。さらに、ス
テップＳ１０２で読み込んだ文字Ｋを語頭文字列ωとす
るとともに、辞書アドレスｎをインクリメントして、つ
ぎの新たな入力文字列に対するステップＳ１０２以降の
実行に備える。

【００１７】図８は、図７に例示された符号化出力を今
度は復号化する場合の具体例を示す図である。予め復号
化側の辞書に、初期化によって、符号１，２，３だけが
それぞれ文字ａ，ｂ，ｃに対応づけられて登録されてい
る。

【００１８】まず、入力符号８１を左から右へ一つずつ
読み込む。最初の符号１を読み、辞書を参照して文字列
ａを復元する（復元文字列欄８２１）。最初の符号は、
初期化によって必ず辞書に登録されている。次に、２番
目の符号２を読み、辞書を参照して文字列ｂを復元す
る。このとき、前回の入力符号１と今回復号した文字列
の最初の一文字ｂ（今回の復号文字列は単に文字ｂのみ
であるが）とを組み合わせた（１ｂ）に符号４を対応さ
せて辞書に登録する（登録内容欄８３）。

【００１９】次に、入力文字列８１の３番目の符号４を
読み、辞書を参照して対応する１ｂを読み出し、さらに
１ｂの符号１を、辞書を参照して対応する文字ａを読み
出す（この一連の読み出し繰り返し動作を「再帰的な復
号化」と呼ぶ。再帰的復号化欄８２を参照）。これによ
って、文字列ａｂを復号化された文字列として出力する
（復元文字列欄８３１）。同時に、前回の入力符号２と
今回復号した文字列の最初の一文字ａとを組み合わせた
（２ａ）に符号５を対応させて辞書に登録する（登録内
容欄８３）。

【００２０】以下、同様にこうしたアルゴリズムにより
復号化と辞書登録を続ける。このようにして入力符号
１，２，４，３，５・・・に対して復号化が行われ、図
８の復元文字列欄８２１に示すような文字列ａ，ｂ，ａ
ｂ，ｃ，ｂａ・・・が復号化出力として出力される。そ
して、図９（Ｂ）に示すような登録符号９３と対応文字
列９４との対応関係が辞書に登録される。

【００２１】図１１は、以上に例示した復号化の処理手
順を示すフローチャートである。図中、Ｓに続く数字は
ステップ番号を示す。〔Ｓ１１１〕予め初期化によって、入力される可能性の
ある符号に対しそれぞれ文字を対応させて辞書に登録す
る。また、辞書において次に登録すべきアドレスｎを例
えば２５６に設定する（図８の例では４）。ｎは、辞書
に登録される文字列に対応して符号を０，１，２・・・
と付した場合、登録文字列の総数に相当する。次に、入
力符号を読み込み、最初の入力符号CODE（バイナリコー
ド）を１０進数の入力符号ωに変換する（図１０の符号
化ではωは入力文字列であったが、復号化ではωは入力
符号である点に注意されたい）。このωをOLDωとする
とともに、最初に入力する符号は既に辞書に登録されて
いるから、入力符号ωに対応する文字Ｄ（ω）を辞書か
ら探し出し、復号化された文字として出力する。なお、
出力した文字を後述のステップＳ１１６の例外処理のた
めにFINchar にセットしておく。

【００２２】〔Ｓ１１２〕次の入力符号CODEを読み込
む。〔Ｓ１１３〕ステップＳ１１２において入力符号データ
が存在したか否かを判別する。存在すればステップＳ１
１５へ進み、存在しなければ本処理手順を終了する。

【００２３】〔Ｓ１１４〕読み込んだ入力符号CODEから
入力符号ωに変換するとともに、この入力符号ωをINω
にセットする。〔Ｓ１１５〕入力符号ωをｎと比較する。このステップ
は、入力符号が辞書に登録されているか否か（ω≧ｎ）
を判別するものである。ωがｎより小さい場合が通常で
あり、このときにはステップＳ１１７へ進み、ωがｎ以
上のときには（図８の入力符号欄８１が「８」のときが
これに相当する）ステップＳ１１６へ進む。

【００２４】〔Ｓ１１６〕ステップＳ１１１または前回
にステップＳ１１９で設定されたOLD ωおよびFINchar
の組（OLD ω，FINchar ）をωＫと置き換える。すなわ
ち、OLD ωにセットされた値をωに、FINchar にセット
された値をＫにセットする。そして、Ｋをスタックにプ
ッシュ（ＰＵＳＨ）する。ωはステップＳ１１７で復号
化される。（図８の入力符号欄８１が「８」のとき、OL
D ω（ω）は５であり、FINchar （Ｋ）はｂである。）〔Ｓ１１７〕通常、入力符号ωは前回までの処理で辞書
に登録されているため、入力符号ωに対応する文字列Ｄ
（ω）を辞書から読み出す。読み出した文字列Ｄ（ω）
をω_iＫに分解する。ω_iは符号、Ｋは復号化文字であ
る。そして、文字列Ｄ（ω）が、ω_iＫに分解できない
１文字であるか否かを判別する。Ｄ（ω）がω_iＫに分
解できるならばステップＳ１１８に進み、Ｄ（ω）が１
文字であるならばステップＳ１１９へ進む。

【００２５】〔Ｓ１１８〕文字Ｋを一時的にスタックに
プッシュし、また符号ω_iを新たなωとし、再度ステッ
プＳ１１７に戻る。このステップＳ１１７およびステッ
プＳ１１８の実行を、Ｄ（ω）が１文字に至るまで繰り
返す。ステップＳ１１７およびステップＳ１１８の処理
を前述のように「再帰的復号化」と呼ぶ。

【００２６】〔Ｓ１１９〕ステップＳ１１８でスタック
にプッシュした各文字をＬＩＦＯ（Last In Fast Out）
形式でポップ（ＰＯＰ）して復元文字列を出力する。例
えば、図８の入力符号欄８１が「５」の場合ならば、
ａ，ｂの順でスタックにプッシュされ、ｂａという復元
文字列が出力される。同時に、今回復元した文字列の最
初の一文字をFINchar とし、前回セットされた OLDωと
FINchar との組（ OLDω，FINchar ）からなる文字列
を、ｎの値に対応させて辞書に登録する（実際には、こ
の文字列を辞書のアドレスｎに記憶する）。さらに、ｎ
をインクリメントし、ステップＳ１１４でセットされた
INωをOLD ωにセットして、次のステップＳ１１２以降
の実行に備える。

【００２７】上述のように従来の復号化では、図１１の
ステップＳ１１７〜ステップＳ１１９を繰り返し行うこ
とによって符号化前のデータに復元していた。すなわ
ち、入力符号ωは前回までの処理で辞書に登録されてい
るため、入力符号ωに対応する文字列Ｄ（ω）を辞書か
ら読み出す。また、読み出した文字列Ｄ（ω）をω_iＫ
に分解し、この文字Ｋを一時的にスタックに退避させ
る。そして、符号ω_iを新たな入力符号ωとして、再度
入力符号ωに対応する文字列Ｄ（ω）を辞書から読み出
す。これらの手順を、新たな入力符号ωが一文字になる
まで再帰的に繰り返す。そして、スタックに退避させた
文字をＬＩＦＯ形式でポップして出力するという方式で
あった。

【００２８】

【発明が解決しようとする課題】しかし、このような方
式では、何度も復元される同一の文字列でも、上述のよ
うに再帰的な処理をその都度行わなければならない。し
たがって、辞書からの読み出し、一時的なスタックへの
退避及び退避させた文字のポップといった一連の処理が
必要であり、この処理のために無駄な時間が費やされる
という問題点があった。

【００２９】本発明はこのような点に鑑みてなされたも
のであり、一度再帰的な復号化処理によって復元された
文字列を有効に利用し、復号化処理時間を短縮するデー
タ復元方式を提供することを目的とする。

【００３０】

【課題を解決するための手段】本発明では上記目的を達
成するために、図１に示すように、入力符号を第１の辞
書を用いて再帰的に復号化する第１の復号化手段２と、
前回入力符号と今回復号化された文字列の第１文字とを
組にし、この組に新たな符号を対応させて第１の辞書に
登録する第１の辞書登録手段１とを備え、入力符号に基
づき復号化された文字列を、入力符号とともに第２の辞
書に登録する第２の辞書登録手段４と、第２の復号化手
段３とを備える。

【００３１】第２の復号化手段３は、検索手段３ａと文
字列出力手段３ｂとを有する。すなわち、検索手段３ａ
は第１の復号化手段２に基づき復号化を行う前に、入力
符号を第２の辞書から検索する。また、文字列出力手段
３ｂは検索手段３ａにより入力符号が検出された場合、
第２の辞書から入力符号に対応する復号化された文字列
を出力する。

【００３２】また、第１の辞書に登録されている入力符
号を参照した頻度を表す参照頻度をさらに設け、第２の
辞書登録手段４は新たに新規入力符号が入力されるごと
に、この新規入力符号に対応する参照頻度をカウントす
るカウント手段を有し、文字列出力手段３ｂは、参照頻
度が所定値を超えた場合は、第２の辞書から入力符号に
対応する復号化された文字列を出力する選択手段を有す
る。

【００３３】さらに、検索手段３ａは入力符号を第２の
辞書から一度だけ検索し、第１の辞書から検索する。そ
して、第２の辞書登録手段４、検索手段３ａ及び文字列
出力手段３ｂは、いずれもハッシュ関数に基づいて、第
２の辞書とアクセスする。

【００３４】それから、第２の辞書登録手段４は、入力
符号に対応する文字列が第２の辞書に既に存在し、か
つ、第２の辞書に登録されている文字列よりも今回復号
化された文字列のほうが長い文字列である場合、今回復
号化された文字列を第２の辞書に登録する。

【００３５】

【作用】第１の復号化手段２は、入力符号を第１の辞書
を用いて再帰的に復号化する。第１の辞書登録手段１
は、前回入力符号と今回復号化された文字列の第１文字
とを組にし、この組に新たな符号を対応させて第１の辞
書に登録する。

【００３６】一方、第２の辞書登録手段４は、入力符号
に基づき復号化された最終的に文字列を、入力符号とと
もに第２の辞書に登録する。第２の復号化手段３は、検
索手段３ａと文字列出力手段３ｂとを有し、第１の復号
化手段２による復号化前に入力符号に対応する文字列が
第２の辞書に登録されている場合、この文字列を出力す
る。すなわち、検索手段３ａは第１の復号化手段２に基
づき復号化を行う前に、入力符号を第２の辞書から検索
する。そして、文字列出力手段３ｂは検索手段３ａによ
り入力符号が検出された場合、第２の辞書から入力符号
に対応する復号化された文字列を出力する。

【００３７】また、第１の辞書に登録されている入力符
号を参照した頻度を表す参照頻度をさらに設け、第２の
辞書登録手段４は新たに新規入力符号が入力されるごと
に、この新規入力符号に対応する参照頻度をカウントす
るカウント手段を設ける。文字列出力手段３ｂは、参照
頻度が所定値を超えた場合は、第２の辞書から入力符号
に対応する復号化された文字列を出力する選択手段を設
けて、第２の辞書の検索を最小限度に抑える。

【００３８】さらに、検索手段３ａは、入力符号を第２
の辞書から一度だけ検索し、その後に第１の辞書から検
索するようにして、第１の辞書に蓄積された文字列を有
効に活用する。

【００３９】そして、第２の辞書登録手段４、検索手段
３ａ及び文字列出力手段３ｂに、いずれもハッシュ関数
に基づいて、第２の辞書とアクセスするようにして、第
２の辞書への登録及び検索の処理速度を短縮する。

【００４０】それから、第２の辞書登録手段４は、入力
符号に対応する文字列が第２の辞書に既に存在し、か
つ、第２の辞書に登録されている文字列よりも今回復号
化された文字列のほうが長い文字列である場合、今回復
号化された文字列を第２の辞書に登録するようにして、
復号化の効率を上げる。

【００４１】

【実施例】以下、本発明の一実施例を図面に基づいて説
明する。図２は復号化の第１の実施例の処理手順を示す
フローチャートである。図において、図１１に示したス
テップと同一の内容を持つステップには図１１のステッ
プ番号と同じ番号を付し、その説明も省略する。ただ
し、図１１の説明にある辞書は全て第１の辞書とする。
なお、Ｓに続く数字はステップ番号を示す。

【００４２】〔Ｓ２１〕ハッシュ関数に基づいて入力符
号ωに対応するハッシュアドレスＨ（ω）を求め、第２
の辞書に入力符号ωが登録されているか否かを判別す
る。もし、入力符号ωが登録されている（ＹＥＳ）なら
ばステップＳ２２に進み、入力符号ωが登録されていな
い（ＮＯ）ならばステップＳ１１７に進む。なお、ハッ
シュアドレスＨ（ω）は入力符号ωを第２の辞書の最大
登録可能数で割った余りで演算される。

【００４３】〔Ｓ２２〕入力符号ωに対応する復元文字
列を第２の辞書から読み出す。すなわち、ステップＳ２
１で求めたハッシュアドレスＨ（ω）に登録されている
登録文字列を読み出す。読み出し後、ステップＳ２４に
進む。

【００４４】〔Ｓ２３〕ステップＳ１１８でスタックに
プッシュした各文字をＬＩＦＯ形式でポップして復元文
字列を出力する。また、第２の辞書上のステップＳ２１
で求めたハッシュアドレスＨ（ω）に、この復元文字列
を入力符号ωとともに、第２の辞書に登録する。すなわ
ち、後述する図６において、入力符号ωは符号code（Ｈ
（ω））として、復元文字列は str（Ｈ（ω））として
登録される。

【００４５】〔Ｓ２４〕今回復元した文字列の最初の一
文字をFINcharとし、前回セットされた OLDωとFINchar
との組（ OLDω，FINchar ）からなる文字列を、ｎの
値に対応させて第１の辞書に登録する（実際には、この
文字列を第１の辞書のアドレスｎに登録する）。さら
に、ｎをインクリメントし、ステップＳ１１４でセット
されたINωをOLD ωにセットして、次のステップＳ１１
２以降の実行に備える。

【００４６】ただし、図１１ではステップＳ１１８の次
のステップがステップＳ１１７であるのに対して、本第
１の実施例ではステップＳ１１８の次のステップはステ
ップＳ２１である。これにより、逐次的にハッシュ関数
に基づき第２の辞書にアクセスされ、従来の復号化と比
べて速く得ることができる。

【００４７】図３は復号化の第２の実施例の処理手順を
示すフローチャートである。図において、図２及び図１
１に示したステップと同一の内容を持つステップには図
２及び図１１のステップ番号と同じ番号を付し、その説
明も省略する。ただし、図１１の説明にある辞書は全て
第１の辞書とする。なお、Ｓに続く数字はステップ番号
を示す。

【００４８】図２の第１の実施例と異なるのは、図２で
はステップＳ１１８の次のステップがステップＳ２１で
あるのに対して、本第２の実施例ではステップＳ１１８
の次のステップはステップＳ１１７である。これによ
り、第２の辞書へのアクセスは最初の入力符号ωに対し
てのみ行われる。このステップＳ２１に要する処理時間
は第２の辞書の登録数が増加するごとに長くなる。した
がって、ステップＳ２１を排除することによって復元化
の処理時間が抑えられ、第１の実施例と比べて速く復元
文字列を得ることができる。

【００４９】図４は復号化の第３の実施例の処理手順を
示すフローチャートである。図において、図３及び図１
１に示したステップと同一の内容を持つステップには図
３及び図１１のステップ番号と同じ番号を付し、その説
明も省略する。ただし、図１１の説明にある辞書は全て
第１の辞書とする。なお、Ｓに続く数字はステップ番号
を示す。

【００５０】〔Ｓ４１〕ステップＳ１１８でスタックに
プッシュした各文字をＬＩＦＯ形式でポップして復元文
字列を出力する。そして、文字出力後はステップＳ４２
に進む。

【００５１】〔Ｓ４２〕２種の判別を行う。すなわち、
一つは入力符号ωと、後述する図６に示す第２の辞書の
内容において、ステップＳ２１で求めたハッシュアドレ
スＨ（ω）に登録されている参照番号の符号code（Ｈ
（ω））とが同じか否かの判別である。もう一つは、今
回復元した文字列の長さが、同じく入力符号ωに対応す
るハッシュアドレスＨ（ω）に登録されている登録文字
列str（Ｈ（ω））の長さよりも長いか否かの判別であ
る。もし、入力符号ωと符号code（Ｈ（ω））が同じで
なく、かつ、今回復元した文字列の長さが第２の辞書に
登録されている登録文字列 str（Ｈ（ω））の長さより
も長い（ＹＥＳ）ならばステップＳ４３に進み、短い
（ＮＯ）ならばステップＳ２４に進む。

【００５２】〔Ｓ４３〕ステップＳ２１で求めたハッシ
ュアドレスＨ（ω）に、今回復元した文字列を復元文字
列として入力符号ωとともに第２の辞書に登録する。す
なわち、後述する図６において、入力符号ωは符号code
（Ｈ（ω））にとして、復元文字列は str（Ｈ（ω））
として登録される。辞書登録後、ステップＳ２４に進
む。

【００５３】したがって、ハッシュ関数に基づき第２の
辞書への登録する場合、第２の辞書内においては同一の
登録箇所に、より長い文字列を登録することになるた
め、効率よく復元文字列を得ることができる。

【００５４】図５は復号化の第４の実施例の処理手順を
示すフローチャートである。図において、図２及び図１
１に示したステップと同一の内容を持つステップには図
２及び図１１のステップ番号と同じ番号を付し、その説
明も省略する。ただし、図１１の説明にある辞書は全て
第１の辞書とする。なお、Ｓに続く数字はステップ番号
を示す。そして、第１の辞書には、既に登録されている
入力符号ωを参照した頻度を表す参照頻度ｃ（ω）をさ
らに設ける。

【００５５】〔Ｓ５１〕第１の辞書から入力符号ωに対
応する参照頻度ｃ（ω）を読み出し、所定値Ｔより大き
いか否か判別する。もし、参照頻度ｃ（ω）が所定値Ｔ
より大きい（ＹＥＳ）ならばステップＳ２１に進み、参
照頻度ｃ（ω）が所定値Ｔより小さい（ＮＯ）ならばス
テップＳ１１７に進む。

【００５６】〔Ｓ５２〕入力符号ωに対応する参照頻度
ｃ（ω）をインクリメントする。その後、ステップＳ５
１に戻る。ただし、図１１ではステップＳ１１８の次の
ステップがステップＳ１１７であるのに対して、本第４
の実施例ではステップＳ１１８の次のステップはステッ
プＳ５２である。したがって、参照頻度の高い入力符号
ωのみに対応して第２の辞書にアクセスされるため、効
率よく第２の辞書とアクセスすることができ、復号化処
理も速くなる。

【００５７】図６は第２の辞書の内容の一例を示す図で
ある。第２の辞書は、ハッシュアドレスＨ（ω）に基づ
いて、参照番号および登録文字列から構成される。参照
番号は入力符号ωに相当し、登録文字列は復号化処理に
よって復号された文字列が登録される。なお、ハッシュ
アドレスＨ（ω）は入力符号ωを辞書最大登録可能数
（図６では１０００）で割った余りで求められる。

【００５８】上記の説明では、第２の辞書はハッシュ関
数に基づき構築したが、他の構築法に基づき構築しても
よい。例えば、二進分木（バイナリ・ツリー）法によっ
て第２の辞書を構築し、二進探索（バイナリ・サーチ）
により復元文字列の探索を行なってもよい。

【００５９】上述の各実施例は、ワークステーション等
における文字コード、ベクトル情報、画像データなどを
圧縮したデータの復元に応用され、記憶容量を大幅に削
減することができる。また、通信回線を利用したデータ
送受信（例えば、モデム、ファックス等）においても応
用でき、通信時間の短縮を図ることができる。

【００６０】

【発明の効果】以上説明したように本発明では、第２の
復号化手段の検索手段によって入力符号を第２の辞書か
ら検索し、検出されたときは文字列出力手段が第２の辞
書から入力符号に対応する復号化文字列を出力し、検出
されない場合は第１の復号化手段が入力符号を第１の辞
書を用いて再帰的に復号化して出力し、その後第２の辞
書登録手段がこの復号化された文字列に所定の処理を施
して第２の辞書に登録して次の復号化処理に備えるよう
に構成したので、入力符号に対応する復元文字列を大幅
に速く得ることができる。

【００６１】また、第２の辞書に最終的な復元文字列を
登録するので、再帰的な復号化処理をその都度行うこと
なく復元文字列を得ることができる。しかも、第２の辞
書の登録をハッシュ関数に基づき行うので、さらに速く
復元文字列を得ることができる。

【図面の簡単な説明】

【図１】本発明の原理説明図である。

【図２】第１の復号化の処理手順を示す図である。

【図３】第２の復号化の処理手順を示す図である。

【図４】第３の復号化の処理手順を示す図である。

【図５】第４の復号化の処理手順を示す図である。

【図６】第２の辞書の内容の一例を示す図である。

【図７】ＬＺＷ符号化の具体例を示す図である。

【図８】復号化の具体例を示す図である。

【図９】文字列と符号との対応関係を示す図である。

【図１０】従来の符号化の処理手順を示す図である。

【図１１】従来の復号化の処理手順を示す図である。

【符号の説明】

１第１の辞書登録手段２第１の復号化手段３第１の復号化手段３ａ検索手段３ｂ文字列出力手段４第２の辞書登録手段

───────────────────────────────────────────────────── フロントページの続き (72)発明者千葉広隆神奈川県川崎市中原区上小田中1015番地富士通株式会社内 (56)参考文献特開昭60−116228（ＪＰ，Ａ) 特開平３−68219（ＪＰ，Ａ) 特開平３−179520（ＪＰ，Ａ) 特開平３−204233（ＪＰ，Ａ) 特開平３−204235（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 7/40

Claims

(57)【特許請求の範囲】

【請求項１】入力符号を第１の辞書を用いて再帰的に
復号化する第１の復号化手段（２）と、前回入力符号と
今回復号化された文字列の第１文字とを組にし、この組
に新たな符号を対応させて前記第１の辞書に登録する第
１の辞書登録手段（１）とを備え、入力符号の復号化を
行うデータ復元方式において、前記入力符号に基づき復号化された文字列を、前記入力
符号とともに第２の辞書に登録する第２の辞書登録手段
（４）と、前記第１の復号化手段（２）に基づき復号化を行う前
に、前記入力符号を前記第２の辞書から検索する検索手
段（３ａ）と、前記検索手段（３ａ）により前記入力符
号が検出された場合、前記第２の辞書から前記入力符号
に対応する前記復号化された文字列を出力する文字列出
力手段（３ｂ）とを有する第２の復号化手段（３）と、を有することを特徴とするデータ復元方式。
【請求項２】前記第１の辞書には登録されている入力
符号を参照した頻度を表す参照頻度をさらに設け、前記
第２の辞書登録手段（４）は新たに入力される新規入力
符号が入力されるごとに、前記新規入力符号に対応する
前記参照頻度をカウントするカウント手段を有し、前記文字列出力手段（３ｂ）は、前記参照頻度が所定値
を超えた場合は、前記第２の辞書から前記入力符号に対
応する前記復号化された文字列を出力する選択手段を有
することを特徴とする請求項１記載のデータ復元方式。
【請求項３】前記検索手段（３ａ）は、前記入力符号
を前記第２の辞書から一度だけ検索し、前記第１の辞書
から検索することを特徴とする請求項１記載のデータ復
元方式。
【請求項４】前記第２の辞書登録手段（４）、前記検
索手段（３ａ）及び前記文字列出力手段（３ｂ）は、い
ずれもハッシュ関数に基づいて、前記第２の辞書とアク
セスすることを特徴とする請求項１，２又は３記載のデ
ータ復元方式。
【請求項５】前記第２の辞書登録手段（４）は、前記
入力符号に対応する文字列が前記第２の辞書に既に存在
し、かつ、前記第２の辞書に登録されている文字列より
も今回復号化された文字列のほうが長い文字列である場
合、前記今回復号化された文字列を前記第２の辞書に登
録することを特徴とする請求項４記載のデータ復元方
式。