JP3001519B1 - データ圧縮方法およびデータ圧縮方式 - Google Patents

データ圧縮方法およびデータ圧縮方式

Info

Publication number
JP3001519B1
JP3001519B1 JP23552098A JP23552098A JP3001519B1 JP 3001519 B1 JP3001519 B1 JP 3001519B1 JP 23552098 A JP23552098 A JP 23552098A JP 23552098 A JP23552098 A JP 23552098A JP 3001519 B1 JP3001519 B1 JP 3001519B1
Authority
JP
Japan
Prior art keywords
dictionary
data
compressed
encoding
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23552098A
Other languages
English (en)
Other versions
JP2000068857A (ja
Inventor
久幸 山中
Original Assignee
日本電気アイシーマイコンシステム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気アイシーマイコンシステム株式会社 filed Critical 日本電気アイシーマイコンシステム株式会社
Priority to JP23552098A priority Critical patent/JP3001519B1/ja
Application granted granted Critical
Publication of JP3001519B1 publication Critical patent/JP3001519B1/ja
Publication of JP2000068857A publication Critical patent/JP2000068857A/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【要約】 【課題】 LZW符号化方式によるデータ圧縮方式であ
って、従来の方法で行っていた全ての被圧縮データなら
びに全ての専用辞書による符号化処理を削減し、符号化
処理の高速化を図ることができるデータ圧縮方式を提供
する。 【解決手段】 LZW符号化方式によるデータ圧縮方式
において、学習用辞書(12−1)と1つまたはそれ以
上の専門辞書(12−2〜12−4)とを設けるととも
に、符号化される被圧縮データの一部分を前記辞書の全
てを用いて圧縮学習した後、その被圧縮データ内容から
最も近い分野の前記専用辞書を選択、固定し、この選
択、固定した専用辞書により残された被圧縮データの圧
縮を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユニバーサル符号
化方式の1つであるLZW符号化によるデータ圧縮方法
およびデータ圧縮方式に関するものである。
【0002】
【従来の技術】ユニバーサル符号化方式の1つである増
分分解型のLZW符号化におけるデータ圧縮方法、特に
圧縮時における符号化方法において、従来方式の符号化
処理は、学習用辞書ならびに数種の専用辞書を設け、圧
縮対象となる全ての被圧縮データに対し全ての学習用辞
書ならびに専用辞書において符号化および辞書学習を行
っていた。そして、その内の最も圧縮率の高い値を示し
た専用辞書により符号化された圧縮データに、復号器で
該圧縮データがどの専用辞書で符号化されたかを判断で
きる辞書選択データを付与し復号器に送るなどして、符
号復号化処理の削減を図っていた(図21参照)。
【0003】しかしながら、従来の方法は、全ての被圧
縮データと全ての辞書を用いて符号化し、符号化動作を
完了した時点で使用した数種の辞書の圧縮率を求めると
いう方法のため、辞書選択までの時間に無駄があった。
【0004】
【発明が解決しようとする課題】そこで、本発明は、L
ZW符号化によるデータ圧縮方法およびデータ圧縮方式
であって、従来の方法で行っていた全ての被圧縮データ
ならびに全ての専用辞書による符号化処理を削減し、符
号化処理の高速化を図ることができるデータ圧縮方法お
よびデータ圧縮方式を提供することを目的とする。
【0005】本発明者は、前記目的を達成するために鋭
意検討を行った結果、ユニバーサル符号化方式の1つで
あるLZW符号化において、本来の学習用辞書と1つま
たはそれ以上の専門辞書を設け、符号化効率を高めると
ともに、ある一定量の被圧縮データを全ての辞書を用い
て圧縮学習することにより、符号化される被圧縮データ
の一部分から被圧縮データの傾向を掴み、その傾向に特
化した専門辞書を選択し、それによる符号化を行うこと
で、符号化処理時間の削減を図ることができることに想
到し、本発明をなすに至った。
【0006】したがって、本発明は、LZW符号化に
るデータ圧縮方法において、学習用辞書と1つまたはそ
れ以上の専門辞書とを設けるとともに、符号化される被
圧縮データの一部分を前記辞書の全てを用いて圧縮学習
した後、その被圧縮データ内容から最も近い分野の前記
専用辞書を選択、固定し、この選択、固定した専用辞書
により残された被圧縮データの圧縮を行うことを特徴と
するデータ圧縮方法を提供する。
【0007】ユニバーサル符号化方式の1つである増分
分解型のLZW(ジフ・レンペルと称す。以降LZWと
呼ぶ)符号化におけるデータ圧縮方法の特に圧縮時にお
ける符号化方法において、従来方法の符号化処理は、前
述したように学習用辞書ならびに数種の専用辞書を設
け、圧縮対象となる全ての被圧縮データに対し全ての学
習用辞書ならびに専用辞書において符号化および辞書学
習を行った後、その内の最も圧縮率の高い値を示した専
用辞書により符号化された圧縮データに、復号器で該圧
縮データがどの専用辞書で符号化されたかを示す辞書選
択データを付与し復号器に送るなどして、符号復号化処
理の削減を図っていた。
【0008】本発明は、辞書形態は同様であるが、従来
が全ての被圧縮データと全ての辞書を用い符号化してい
たのに対し、ある一定量の被圧縮データを全ての辞書を
用いて圧縮学習した後、その被圧縮データ内容から最も
近い分野の専用辞書を選択、固定し、残された該被圧縮
データの圧縮を行うことにより、従来の方法で行ってい
た全ての被圧縮データならびに全ての専用辞書による符
号化処理を削減し、符号化処理の高速化を図ったもので
ある。
【0009】
【発明の実施の形態】本発明の構成を図1本発明のLZ
W符号器および図2本発明のLZW復号器を用いて説明
する。
【0010】本発明の第1の構成は、図4第1の実施例
の被圧縮データフレームの被圧縮データ42を蓄える文
字列入力バッファ10と、学習用辞書12−1、通信分
野に適した通信専用辞書12−2、音声分野に適した音
声専用辞書12−3および画像分野に適した画像専用辞
書12−4を備えた符号化辞書12と、前記各辞書に対
応した学習用辞書符号列出力バッファ14、通信専用辞
書符号列出力バッファ15、音声専用辞書符号列出力バ
ッファ16および画像専用辞書符号列出力バッファ17
と、辞書選択器13と、前記各辞書を使用してLZW法
により入力バッファ10からの被圧縮データ42の符号
化を行い、該符号化データを前記出力バッファへ出力す
る機能、および、前記各専用辞書において学習した登録
文字と該登録文字が被圧縮データにどれだけ出現したか
を示すデータを蓄積する前記学習用辞書と専用辞書とか
ら被圧縮データの符号化を行う際に最も適した辞書を選
択し、辞書選択器13へ選択信号18を出力する機能を
有するLZW符号化部11とからなるデータ圧縮方式で
ある。
【0011】本発明の第2の構成は、前記第1の構成に
おいて、図6第2の実施例の被圧縮データフレームに示
すように、予めどの分野の被圧縮データかを示す辞書選
択フラグがつけられた該被圧縮データ43を符号化する
機能を有するLZW符号化部11を含むデータ圧縮方式
である。
【0012】一般にユニバーサル符号化方式では、図7
に示す辞書構成により辞書作成が行われる。通常、LZ
W法の場合、辞書には基本となる英数字(基本登録文字
92)と若干の制御語が登録される。なお、本発明の請
求範囲は圧縮動作に限定されるため、LZW方式での例
外処理の説明についてはここでは割愛する。したがっ
て、制御語についての説明は行わない。
【0013】最初に、図1を用いて第1の実施例である
LZW符号器の動作を符号器の学習用辞書を用いて説明
する。LZW符号化部11は図15の符号化手順に従い
被圧縮データ42の符号化を行う。以下この手順に従っ
て動作を説明する。
【0014】まず、LZW符号化部11は図7の学習用
辞書に示すような259(0〜258)個の基本登録文
字(a,b,c,d,…・0,1,2,…・・)92の
登録を行う(ステップ100)。
【0015】ここで、LZW符号器の文字列入力バッフ
ァ10には被圧縮データ42として被圧縮データフレー
ム(abcabcabcaabbcc……)が保持され
ているものとする。次に、該フレームの最初の一文字a
を読み込み(ステップ101)、学習用辞書12−1に
登録されているどうか検索する(ステップ102)。こ
の場合、aは基本登録文字92として登録されているの
で検索が一致するため、次の文字bをポイントする(ス
テップ103)。次のポイントされた被圧縮文字bを読
み込み、学習用辞書12−1にabが登録されているか
どうかを検索する(ステップ101〜102)。検索文
字列abは登録されていないため、新規登録文字93と
して学習用辞書12−1に登録され、次の接点番号25
9が付与される(ステップ104)。
【0016】次に、前回の検索で一致した文字aを図1
2のLZW復号器の通信専用辞書に示す符号語(000
000000)に変換し、学習用辞書符号列出力バッフ
ァ14へ出力する(ステップ105)。次に、被圧縮文
字列が終わりでないので(ステップ106)、被圧縮文
字列の読み込み(ステップ101)に戻り、前回読み込
んだ文字bの文字検索を行う。この場合、文字bは基本
登録文字92として登録されているので何も出力せず、
次の文字cをポイントしbcが学習用辞書12―1に登
録されているか検索を行う。文字bcは登録されていな
いので、新規登録文字93として登録され、次の接点番
号260が付与される。この場合も文字bの符号語(0
00000001)が符号列出力バッファ14に出力さ
れる。
【0017】以下同様に続く被圧縮文字列の増分分解型
の符号化が行われ、図7に示すような学習用辞書の作成
が行われるとともに、符号語列(000000000、
000000001,000000010、10000
0011、…・・)が該符号列出力バッファより対向す
る復号器へ出力される(ステップ101〜106)。ま
た、上記符号化動作は通信専用辞書12−2、音声専用
辞書12−3(図10)および画像専用辞書12−4
(図11)についても辞書選択がなされるまで同様に行
われる。
【0018】次に、図2本発明のLZW復号器により、
復号化について符号化と同様に復号器の学習用辞書22
−1を用いて説明する。LZW復号化部21は図16の
復号化手順に従い圧縮データの復号化を行う。以下この
手順に従って動作を説明する。
【0019】最初に、LZW復号化部21は符号化と同
様に図12の通信専用辞書に示すような259(0〜2
58)個の基本登録文字(a,b,c,d,…・0,
1,2,…・・)83の登録を行う(ステップ20
0)。この場合、符号化辞書と異なるところは、これか
ら復号しようとする符号語80に対応した接点番号列8
1と該接点番号に対応した文字および文字列82が割り
当てられていることである。
【0020】ここで、上記符号化の動作説明で符号化さ
れ出力された符号列(000000000、00000
0001,000000010、100000011、
…・・)が符号列入力バッファ20に蓄えられているも
のとする。
【0021】まず、符号列入力バッファ20から符号語
(000000000)を読み込む(ステップ20
1)。読み込まれた符号語(000000000)を接
点番号(0)に変換し(ステップ202)、学習用辞書
22−1(図8)に登録されているか検索を行う(ステ
ップ203)。この場合、接点番号(0)は登録されて
いるので一致した接点番号(0)に対応した文字aを音
声用辞書文字列出力バッファ24へ出力する(ステップ
204)。
【0022】続いて、文字aが新規文字であるかどうか
検索する(ステップ205)。文字aは基本登録文字9
8であるので新規文字登録をスキップし、次の符号語を
ポイントする(206、207)。ポイントされた次の
符号語(000000001)を読み込み、前回と同様
に辞書検索を行う。符号語(000000001)は接
点番号(1)に対応しており、基本登録文字bと一致す
るので、学習用辞書文字列出力バッファ24へ文字bを
出力する(ステップ201〜204)。ここでLZW復
号化部21は、これまでの復号文字列abはこの場合辞
書に登録されていないので、文字列abに符号語(10
0000011)、接点番号(259)を付与し、新規
文字列99として辞書に登録する(ステップ205、2
06)。
【0023】次にポイントされた符号語(000000
010)は接点番号(2)で文字cに、続く符号語(1
00000011)は接点番号(259)のabに対応
しているので、学習用辞書文字列出力バッファ24へそ
れぞれ出力する。ここで、文字cと次に続く文字列ab
のaからなる文字列caは辞書に登録されていないの
で、符号語(100000100)、接点番号260が
付与され、新規文字列99として辞書に登録される(ス
テップ201〜207)。この様にして符号語の復号
(abcabcabcaabbcc…・・)と復号化学
習用辞書22−1の作成が圧縮ファイルの終わりまで行
われる。
【0024】また、上記復号化動作は符号化の動作説明
と同様にLZW復号器の通信専用辞書22−2、音声専
用辞書22―3および画像専用辞書22―4についても
辞書選択がなされるまで同様に行われる。なお、符号語
が復号辞書に登録されていない場合は例外処理(ステッ
プ203、209)が行われるが本特許請求範囲ではな
いのでここでは説明を割愛する。以上のようにしてLZ
W法による文字列の符号化と復号化が行われる。
【0025】次に、専用辞書を使った場合の本発明の符
号化および復号化動作を説明する。まず、符号化動作を
図17専用辞書による符号化手順のフローチャートに従
って通信専用辞書を用いて説明する。図9は通信分野の
用語が予め通信専用辞書12―2に登録されている内容
を示しており、接点番号50、登録文字列51、出現カ
ウンタ52で構成されている。
【0026】まず、LZW符号化部11は、符号化処理
に先立ち辞書検索カウンタ、出現カウンタ、文字ポイン
タの初期化(ここでは0クリア)を行う(ステップ30
1)。次に、基本登録文字53および各分野に対応した
専用登録文字54の登録を行う(ステップ302)。こ
こで、LZW符号器11の文字列入力バッファ10には
図3に示した一連の被圧縮データが第1ブロック〜第N
+2ブロックに区切られ蓄積されている。該ブロックご
との被圧縮データサイズは任意であるが、ここでは10
Kバイト分とする。また、第1ブロックには、前記学習
用辞書12―1による符号化の説明と同様に、被圧縮デ
ータとして図4に示す被圧縮データフレーム(abca
bcabcaabbcc……)42が保持されているも
のとする。
【0027】続いて、どの専用辞書を用いて符号化を行
うかを決定する専用辞書選択値を求める符号化範囲を決
定する辞書検索カウント値(ここでは1Kバイト分・T
0)を調べる(ステップ303)が、初期化後であるの
で該被圧縮データフレーム42から最初の文字aの読み
込みに入る(ステップ304)。次に、文字aが通信専
用辞書12―2に登録されているかどうか検索する(ス
テップ305)。文字aは基本登録文字53として登録
されているので出現カウンタをカウントアップ(+1)
し(ステップ306)、次の文字をポイントする(ステ
ップ307)。ポイントされた次の文字bを読み込む。
文字列abが通信専用辞書22―2に登録されているか
どうか検索する。通信専用辞書では文字列abは通信分
野の専用文字列として登録されているため、文字列ab
の出現カウンタをカウントアップし、次の文字をポイン
トする(ステップ304〜307)。次にポイントされ
た文字cを読み込む。文字列abcが通信専用辞書12
―2に登録されているかどうか検索する。文字abcは
登録されているので文字列abcの出現カウンタをカウ
ントアップし、さらに次の文字をポイントする(ステッ
プ304〜307)。ポイントされた文字cを読み込み
文字列abcaが通信専用辞書12−2に登録されてい
るかどうか検索する。この場合、文字列abcaは辞書
に登録されていないので、接点番号(266)が付与さ
れ通信専用辞書12−2に登録される(ステップ304
〜308)。次に、1つ前の一致した文字列abcの符
号語を通信専用符号列出力バッファ15へ出力する(ス
テップ309)。
【0028】上述した一連の文字列の符号化(ステップ
304〜309)は、学習用辞書12−1による符号化
と同様に行われ、辞書検索カウント値が1Kバイトにな
るまで続けられる(ステップ303)。また、辞書検索
カウント値が1Kバイト分T0になるまでは学習用辞書
12−1、通信専用辞書12−2、音声専用辞書12−
3および画像専用辞書12−4のすべての辞書も新規の
文字列を同じように登録して行くとともに、該辞書それ
ぞれに登録された文字に対する被圧縮データの出現カウ
ント数が出現カウンタ52に記録される。辞書検索カウ
ント値が1Kバイトに達する(ステップ303)と、L
ZW符号化部11は通信専用辞書ヒット率演算を行う
(ステップ311)。この演算は図14本発明の実施例
における辞書選択値と閾値に示されているように、通信
専用辞書ヒット率=専用登録文字出現カウント数の総和
÷専用辞書接点数で計算される。図9符号化通信専用辞
書では、専用登録文字出現カウント数の総和=2+3+
6+8+7+5+4=35、専用辞書接点数=7である
ので、通信専用辞書ヒット率=5.0となる。同様に音
声専用辞書12−3および画像専用辞書12―4につい
て求めたものが図14に示されており、音声専用辞書1
2―3が0.0、画像専用辞書12−4が1.7となっ
ている。
【0029】続いて、該通信専用辞書ヒット率から、符
号化している被圧縮データがどの分野に最も適している
かを決定する。この場合、辞書選択閾値≧3.0で一番
高いヒット率を示しているのは通信専用辞書であるの
で、LZW符号化部11は残る9Kバイトの被圧縮デー
タの符号化に通信専用辞書12―2を選択する選択信号
18を辞書選択器13に出力するとともに、図13辞書
選択データとその対応辞書テーブルに示したように、通
信専用辞書12−2に対応した符号語(1000000
00)も通信専用符号列出力バッファ15へ出力する。
該選択信号18を受けた辞書選択器13は、現ブロック
の符号化が終わるまで符号化辞書として通信専用辞書1
2−2を固定し、他の専用辞書には変えない(ステップ
314)。次に、符号化する第1ブロックが終了する
と、次のブロックでの通信専用辞書ヒット率を求める準
備として、それぞれの専用辞書の出現カウンタと辞書検
索ポインタとを初期化するとともに、辞書選択器13へ
の選択信号18をリセットし終了する(ステップ31
5、316)。
【0030】以上のように、第1ブロックの被圧縮デー
タは専用辞書内に予め登録された専用登録文字により、
通常のLZW法による符号化よりも高い圧縮率で符号化
され、図5の圧縮データフレームに組み立てられ、通信
辞書符号化列出力バッファ15から対向する復号器へ出
力される。なお、閾値3.0に満たない場合は、どの専
用辞書による圧縮もその効果が得られないものとし、学
習用辞書12―1によ
【0031】次に、本発明の復号化動作を図18専用辞
書による復号化手順に従って通信専用辞書を用いて説明
する。図12は通信分野の用語が予め登録された通信専
用辞書内容で符号語80、接点番号81および登録文字
列82で構成されている。
【0032】LZW復号化部21は、辞書選択器23へ
の辞書選択信号28リセットと接点番号カウンタをクリ
アする(ステップ400)。次に、基本登録文字83お
よび通信分野に対応した専用登録文字84の登録を行う
(ステップ401)。辞書選択データ40は1Kバイト
分の被圧縮データが圧縮されるまで送られてこないの
で、復号化辞書の選択はここでは行われない(ステップ
402、403)。辞書選択データ40がLZW符号器
から送られてくるまでは、学習用辞書22−1、通信専
用辞書22−2、音声専用辞書22−3および画像専用
辞書22−4の全ての辞書により復号化が行われ、復号
文字列はそれぞれ学習用辞書文字列出力バッファ24と
通信用辞書文字列出力バッファ25と音声用辞書文字列
出力バッファ26と画像用辞書文字列出力バッファ28
とに蓄えられる。
【0033】辞書選択データ40が来ると、LZW復号
化部21は図13に示した辞書選択データとその対応辞
書テーブルから該辞書選択データ40以降の圧縮データ
がどの符号化辞書により符号化されているかを判断し
(ステップ402)、復号化辞書を設定するために辞書
選択信号28をLZW復号器の辞書選択器23に出力す
る。辞書選択器23は、復号化辞書の中から通知を受け
た専用辞書を選択する(ステップ403)。この場合、
符号語(100000000)を受けているので通信専
用辞書22−2が選択され、次に辞書選択データ40が
来るまで固定する。
【0034】辞書選択データ40に続く圧縮データが読
み込まれる(ステップ404)と、それに対応する接点
番号に変換され(ステップ405)、該接点番号に対応
した文字列が通信専用辞書22―2で検索される(ステ
ップ406)。ここで、辞書選択データ40に続く符号
語(…・・100001000、000000100、
…・・)が来たとすると、まず符号語(1000010
00)が読み込まれ、接点番号(264)が通信専用辞
書22―2に登録されているかどうか検索する。接点番
号264に対応した文字列abccは通信専用辞書に登
録されているので、この文字列を文字列出力バッファに
出力する(ステップ404〜407)とともに、辞書選
択データの1つ前で復号された文字(ここではfと仮定
する)との組み合わせfabccが通信用辞書22―2
に登録されているかどうか検索する(ステップ40
8)。もし登録されてなければ、新規登録文字85とし
て符号語(100101011)、接点番号(299)
を付与して通信専用辞書22―2に登録する(ステップ
408、409)。登録されていれば何もしない。次に
ポイントされる符号語(000000100)を読み込
み、同様に接点番号(4)に対応した文字eを検索す
る。これは基本登録語として登録されているので、文字
eを通信用辞書文字列出力バッファ25へ出力し、1つ
前の復号文字との組み合わせであるabcceが通信専
用辞書22−2に登録されているかどうか検索する。登
録されていなければ新規登録文字85として同じく通信
専用辞書22―1に登録する。以降同様にして続く符号
語の復号動作(402〜409)が行われ、圧縮データ
ファイルが終わりになったら復号化処理を終了する(ス
テップ411)。なお、符号語が復号辞書に登録されて
いない場合は例外処理(ステップ406、412)が行
われるが、本特許請求範囲ではないのでここでは説明を
割愛する。
【0035】本発明の第2の実施例を図19第2の実施
例専用辞書の符号化手順に従って説明する。ここで、第
2の実施例の符号復号器の構成は第1の実施例のものと
同じである。図9は通信分野の用語が予め通信専用辞書
12―2に登録されている内容を示しており、接点番号
50、登録文字列51、出現カウンタ52で構成されて
いる。
【0036】まず、LZW符号化部11は符号化処理に
先立ち、辞書検索カウンタ、出現カウンタ、文字ポイン
タの初期化(ここでは0クリア)を行う(ステップ50
0)。次に、基本登録文字53および各分野に対応した
専用登録文字54の登録を行う(ステップ501)。こ
こで、LZW符号器11の文字列入力バッファ10に
は、図6に示した一連の被圧縮データが蓄積されてい
る。また、前記学習用辞書12―1による符号化の説明
と同様に、被圧縮データとして図4に示す被圧縮データ
フレーム(abcabcabcaabbcc……)42
が保持されているものとする。
【0037】続いて、該被圧縮データフレームに辞書選
択フラグが付与または既に辞書選択モードに設定されて
いるかどうか調べる(ステップ502)。この場合、辞
書選択フラグが付与されているので、辞書選択フラグモ
ードの設定を行うとともに、辞書選択を図20辞書選択
でフラグとその対応辞書に示す図から辞書選択を行う。
ここでは、通信専用辞書12―2を選択する辞書選択フ
ラグ(00)が指定されてきたとする。なお、辞書選択
フラグも辞書選択フラグモードも設定されていない場合
は、どの専用辞書を用いて符号化を行うかを決定する専
用辞書選択値を求める符号化範囲を決定する辞書検索カ
ウント値(ここでは1Kバイト分・T0)を調べる(ス
テップ504)が、この場合の符号化処理は第1の実施
例と同様であるのでここでの説明は割愛する。
【0038】辞書選択フラグモードに入ると、被圧縮デ
ータフレーム42から最初の文字aの読み込みに入る
(ステップ505)。次に、文字aが通信専用辞書12
―2に登録されているかどうか検索する(ステップ50
6)。文字aは基本登録文字53として登録されている
ので、出現カウンタをカウントアップ(+1)し(ステ
ップ507)、次の文字をポイントする(ステップ50
8)。ポイントされた次の文字bを読み込む。文字列a
bが通信専用辞書22―2に登録されているかどうか検
索する。通信専用辞書では文字列abは通信分野の専用
文字列として登録されているため、文字列abの出現カ
ウンタをカウントアップし、次の文字をポイントする
(ステップ505〜508)。次にポイントされた文字
cを読み込む。文字列abcが通信専用辞書12―2に
登録されているかどうか検索する。文字abcは登録さ
れているので、文字列abcの出現カウンタをカウント
アップし、さらに次の文字をポイントする(ステップ5
05〜508)。ポイントされた文字cを読み込み、文
字列abcaが通信専用辞書12−2に登録されている
かどうか検索する。この場合、文字列abcaは辞書に
登録されていないので、接点番号(266)が付与さ
れ、通信専用辞書12−2に登録される(ステップ50
5〜509)。次に、1つ前の一致した文字列abcの
符号語を通信専用符号列出力バッファ15へ出力する
(ステップ510)。なお、本発明の第2の実施例にお
ける復号動作は前記第1の実施例の専用辞書を使用した
復号動作と同じであるので、ここでの説明は割愛する。
【0039】以上のように、予め符号化する被圧縮デー
タに、符号化する際に使用する専用辞書選択情報である
辞書選択フラグを付与することにより、被圧縮データに
適した専用辞書を演算、選択する処理が不要となり、専
用辞書を使用する場合の符号化処理が軽減される。
【0040】
【発明の効果】以上説明したように、本発明のLZW符
号化方法は、図3辞書選択データの符号化範囲に示した
ように辞書形態は従来と同様であるが、従来が全ての被
圧縮データと全ての辞書を用い符号化していたのに対
し、本発明ではある一定量の被圧縮データを全ての辞書
を用いて圧縮学習した後、その被圧縮データ内容から最
も近い分野の専用辞書を選択、固定し、残された該被圧
縮データの圧縮を行うことにより、従来の方法で行って
いた全ての被圧縮データならびに全ての専用辞書による
符号化処理を削減し、符号化処理の高速化を図ることが
出来る。符号化削減時間は図3において従来方法による
符号化時間をTa、本発明において一連のブロック番号
iを0、1、2、3、……n+2とし各ブロックの符号
化時間をTiで表すと、下記式のようになる。
【数1】
【図面の簡単な説明】
【図1】本発明のLZW符号器の一例を示すブロック図
である。
【図2】本発明のLZW復号器の一例を示すブロック図
である。
【図3】辞書選択データの符号化範囲を示す図である。
【図4】第1の実施例の被圧縮データフレームを示す図
である。
【図5】圧縮データフレームを示す図である。
【図6】第2の実施例の被圧縮データフレームを示す図
である。
【図7】符号化学習用辞書を示す図である。
【図8】復号化学習用辞書を示す図である。
【図9】符号化通信専用辞書を示す図である。
【図10】符号化音声専用辞書を示す図である。
【図11】符号化画像専用辞書を示す図である。
【図12】LZW復号器の通信専用辞書を示す図であ
る。
【図13】辞書選択データとその対応辞書を示す表であ
る。
【図14】本発明の実施例における辞書選択値と閾値を
示す式および表である。
【図15】学習用辞書による符号化手順を示すフローチ
ャートである。
【図16】学習用辞書による復号化手順を示すフローチ
ャートである。
【図17】専用辞書による符号化手順を示すフローチャ
ートである。
【図18】専用辞書による復号化手順を示すフローチャ
ートである。
【図19】第2の実施例専用辞書の符号化手順を示すフ
ローチャートである。
【図20】第2の実施例辞書選択でフラグとその対応辞
書を示す表である。
【図21】従来の符号化システムのブロック図である。
【符号の説明】
10 文字列入力バッファ 11 LZW符号化部 12 符号化辞書 12−1 学習用辞書 12−2 通信専用辞書 12−3 音声専用辞書 12−4 画像専用辞書 13 辞書選択器 14 学習用辞書符号列出力バッファ 15 通信専用辞書符号列出力バッファ 16 音声専用辞書符号列出力バッファ 17 画像専用辞書符号列出力バッファ 18 選択信号 20 符号列入力バッファ 21 LZW復号化部 22 復号化辞書 22−1 学習用辞書 22−2 通信専用辞書 22−3 音声専用辞書 22−4 画像専用辞書 23 辞書選択器 24 学習用辞書文字列出力バッファ 25 通信専用辞書文字列出力バッファ 26 音声専用辞書文字列出力バッファ 27 画像専用辞書文字列出力バッファ 28 選択信号
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 7/40 - 7/42

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 LZW符号化によるデータ圧縮方法にお
    いて、学習用辞書と1つまたはそれ以上の専門辞書とを
    設けるとともに、符号化される被圧縮データの一部分を
    前記辞書の全てを用いて圧縮学習した後、その被圧縮デ
    ータ内容から最も近い分野の前記専用辞書を選択、固定
    し、この選択、固定した専用辞書により残された被圧縮
    データの圧縮を行うことを特徴とするデータ圧縮方法
  2. 【請求項2】 被圧縮データを蓄える文字列入力バッフ
    ァと、学習用辞書と1つまたはそれ以上の専門辞書とを
    備えた符号化辞書と、前記各辞書に対応した符号列出力
    バッファと、辞書選択器と、前記各辞書を使用して入力
    バッファからの被圧縮データの符号化を行い、該符号化
    データを前記出力バッファへ出力する機能、および、前
    記各辞書において学習した登録文字と該登録文字が被圧
    縮データにどれだけ出現したかを示すデータを蓄積する
    前記学習用辞書と専用辞書とから被圧縮データの符号化
    を行う際に最も適した辞書を選択し、辞書選択器へ選択
    信号を出力する機能を有するLZW符号化部とからなる
    請求項1に記載のデータ圧縮方法
  3. 【請求項3】 LZW符号化部が、予めどの分野の被圧
    縮データかを示す辞書選択フラグがつけられた該被圧縮
    データを符号化する機能を有する請求項2に記載のデー
    タ圧縮方法
  4. 【請求項4】 圧縮データを蓄える符号列入力バッファ
    と、学習用辞書と1つまたはそれ以上の専門辞書とを備
    えた復号化辞書と、前記各辞書に対応した文字列出力バ
    ッファと、辞書選択器と、前記各辞書を使用して入力バ
    ッファからの圧縮データの復号化を行い、該復号化デー
    タを前記出力バッファへ出力する機能、および、前記各
    辞書において学習した登録文字と該登録文字が圧縮デー
    タにどれだけ出現したかを示すデータを蓄積する前記学
    習用辞書と専用辞書とから圧縮データの復号化を行う際
    に最も適した辞書を選択し、辞書選択器へ選択信号を出
    力する機能を有するLZW復号化部とからなる請求項1
    に記載のデータ圧縮方法
  5. 【請求項5】 被圧縮データを蓄える文字列入力バッフ
    ァと、学習用辞書、通信分野に適した通信専用辞書、音
    声分野に適した音声専用辞書および画像分野 に適した画
    像専用辞書を備えた符号化辞書と、前記各辞書に対応し
    た学習用辞書符号列出力バッファ、通信専用辞書符号列
    出力バッファ、音声専用辞書符号列出力バッファおよび
    画像専用辞書符号列出力バッファと、辞書選択器と、前
    記各辞書を使用してLZW法により入力バッファからの
    被圧縮データの符号化を行い、該符号化データを前記出
    力バッファへ出力する機能、および、前記各専用辞書に
    おいて学習した登録文字と該登録文字が被圧縮データに
    どれだけ出現したかを示すデータを蓄積する前記学習用
    辞書と専用辞書とから被圧縮データの符号化を行う際に
    最も適した辞書を選択し、辞書選択器へ選択信号を出力
    する機能を有するLZW符号化部とからなるデータ圧縮
    方式。
  6. 【請求項6】 予めどの分野の被圧縮データかを示す辞
    書選択フラグがつけられた該被圧縮データを符号化する
    機能を有するLZW符号化部を含む請求項5に記載のデ
    ータ圧縮方式。
JP23552098A 1998-08-21 1998-08-21 データ圧縮方法およびデータ圧縮方式 Expired - Fee Related JP3001519B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23552098A JP3001519B1 (ja) 1998-08-21 1998-08-21 データ圧縮方法およびデータ圧縮方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23552098A JP3001519B1 (ja) 1998-08-21 1998-08-21 データ圧縮方法およびデータ圧縮方式

Publications (2)

Publication Number Publication Date
JP3001519B1 true JP3001519B1 (ja) 2000-01-24
JP2000068857A JP2000068857A (ja) 2000-03-03

Family

ID=16987203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23552098A Expired - Fee Related JP3001519B1 (ja) 1998-08-21 1998-08-21 データ圧縮方法およびデータ圧縮方式

Country Status (1)

Country Link
JP (1) JP3001519B1 (ja)

Also Published As

Publication number Publication date
JP2000068857A (ja) 2000-03-03

Similar Documents

Publication Publication Date Title
Salomon A concise introduction to data compression
CA2438309C (en) Method and apparatus for adaptive data compression
US6633242B2 (en) Entropy coding using adaptable prefix codes
EP0903866B1 (en) Method and apparatus for data compression
JPH07502632A (ja) ハフマンコードの復号化のための回路
JPH1065551A (ja) データ圧縮方法
US5594435A (en) Permutation-based data compression
EP0127815B1 (en) Data compression method
US6225922B1 (en) System and method for compressing data using adaptive field encoding
JPWO2009095956A1 (ja) データ圧縮・復元方法及び圧縮・復元プログラム
JPH1079672A (ja) メッセージの圧縮及び圧縮解除の方法及び装置
JPH07226846A (ja) 入力データストリームの処理方法及び圧縮フォーマットの生成方法
JP2003524983A (ja) 複数コーダを用いる最適化ロスレス圧縮のための方法及び装置
KR100906041B1 (ko) 폰트 압축 및 검색 방법 및 장치
JP2836467B2 (ja) 2値シンボルの符号化・復号化回路
JP3960629B2 (ja) 可変長符号器を使用する伝送システム
JP3080149B2 (ja) パタン符号化方法及び復号化方法とこの方法を用いた符号化装置及び復号化装置
JP3001519B1 (ja) データ圧縮方法およびデータ圧縮方式
JP3256121B2 (ja) データ符号化装置およびデータ復号装置およびその方法
JP4093200B2 (ja) データ圧縮方法及びプログラムならびにデータ復元方法及び装置
JP4093193B2 (ja) データ圧縮方法及びプログラムならびにデータ復元方法及び装置
JPS6352812B2 (ja)
JPH1155226A (ja) データ伝送装置
JPS62209948A (ja) デ−タ圧縮伝送方法
JP2002344326A (ja) 合成インデックスによるデータ圧縮方法及び圧縮データの完全復元方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees