JPH0936748A

JPH0936748A - ハフマン符号化方法及びその装置並びにハフマン復号化方法及びその装置

Info

Publication number: JPH0936748A
Application number: JP18296795A
Authority: JP
Inventors: Masaya Tomono; 将也伴野; Atsuko Toda; 亜津子戸田
Original assignee: Toshiba Corp; Toshiba Computer Engineering Corp
Current assignee: Toshiba Corp; Toshiba Computer Engineering Corp
Priority date: 1995-07-19
Filing date: 1995-07-19
Publication date: 1997-02-07

Abstract

(57)【要約】【課題】ハフマン符号化データファイルの一部分とし
て出力するハフマン木情報のデータ量を極力少なくす
る。【解決手段】本発明のハフマン符号化方法は、圧縮前
のデータファイル中における各コードの出現頻度に応じ
て作成されたハフマン符号表に基づいて上記データファ
イルの各コードをハフマン符号化することにより、ハフ
マン符号化データファイルを作成してデータ圧縮する方
法において、出現したコードの種類数を格納するデータ
領域と、出現したコードを出現頻度の順に並べて成る第
１のデータ配列と、ビット長が同じハフマン符号の種類
数を格納するデータ領域をハフマン符号のビット長の順
に並べて成る第２のデータ配列とをハフマン符号化デー
タファイルの先頭部分に配設するように構成したもので
ある。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ハフマン符号化方
法及びその装置並びにハフマン復号化方法及びその装置
に関する。

【０００２】

【従来の技術】文字を表わすコードを並べて成るデータ
ファイルのデータ量を圧縮する方法として、従来より、
ハフマン符号化方法が使用されている。このハフマン符
号化方法では、データファイル中における各コードの出
現頻度に応じて作成したハフマン符号表に基づいて各コ
ードをハフマン符号化することにより、ハフマン符号化
データファイルを作成している。この場合、出現頻度の
高いコードほど短いビット列のハフマン符号に置き換え
られるようになっており、これによりデータ量が圧縮さ
れるのである。

【０００３】また、上記ハフマン符号化データファイル
を元のデータファイルに戻す場合、即ち、ハフマン符号
を元のコードに復号する場合、ハフマン木情報のデータ
が必要である。このハフマン木情報は、ハフマン符号化
前のコードと、ハフマン符号化後のコード（即ちハフマ
ン符号）と、ハフマン符号のビット長とから構成された
データである。具体的には、ハフマン符号のデータとハ
フマン符号のビット長のデータとを並べたデータをハフ
マン符号化前のコードの順番（予め決めた順番）で並べ
て構成したデータ配列を、ハフマン木情報のデータとし
ている。この場合、上記データ配列の順番でハフマン符
号化前のコードがわかるようになっている。そして、上
記ハフマン木情報のデータをハフマン符号化データファ
イルの先頭部分に配設するように構成されている。

【０００４】

【発明が解決しようとする課題】上記従来構成では、ハ
フマン木情報のデータ量は、ハフマン符号化前のコード
の種類数をχとすると、次式で表現されるビット数とな
る。

【０００５】（ハフマン符号を格納するのに必要なデー
タ領域のビット数＋ハフマン符号のビット長を格納する
のに必要なデータ領域のビット数）×χ この場合、コードの種類数がある程度多くなると、ハフ
マン木情報のデータ量がかなり多くなってしまうという
不具合があった。これに対して、ハフマン木情報のデー
タ量を少なくする構成として、特公平２−５０６６７号
公報に記載された装置がある。

【０００６】上記装置においては、ハフマン符号のデー
タを省略し、ハフマン符号のビット長のデータだけを並
べたデータの配列だけでハフマン木情報のデータを構成
するようにしている。この構成の場合、符号化のときと
復号化のときとで同じアルゴリズムを用いてハフマン符
号の割り当てを行うことにより、ハフマン符号のデータ
がなくても復号化可能な構成となっている。これによっ
て、上記公報の装置では、ハフマン符号化前のコードの
全種類数をαとすると、ハフマン木情報のデータ量は次
式で表現されるビット数となる。

【０００７】（ハフマン符号のビット長を格納するのに
必要なデータ領域の最大ビット数）×α これにより、ハフマン木情報のデータ量をかなり少なく
することができる。しかし、上記装置の場合、データフ
ァイル中に出現しない文字のコードについてのデータを
ハフマン木情報のデータの中に含めて出力する構成とな
っている。具体的には、符号化前のコードがｍビットの
データで表現されているとした場合、データファイル中
に出現する文字のコードの種類数に関係なく、常に（２
のｍ乗）個の要素から成るデータ配列をハフマン木情報
のデータとして出力している。このため、データファイ
ル中に出現する文字のコードの種類数が少ない場合に
は、ハフマン木情報のデータとして無駄なデータをかな
り多く出力しているという不具合があり、改善の余地が
あった。

【０００８】そこで、本発明の目的は、ハフマン木情報
のデータ量を極力少なくすることができるハフマン符号
化方法及びその装置並びにハフマン復号化方法及びその
装置を提供するにある。

【０００９】

【課題を解決するための手段】本発明のハフマン符号化
方法は、文字を表わすコードを並べて成るデータファイ
ルを、該データファイル中における各コードの出現頻度
に応じて作成されたハフマン符号表に基づいて各コード
をハフマン符号化することにより、ハフマン符号化デー
タファイルを作成する方法において、出現したコードの
種類数を格納するデータ領域と、出現したコードを出現
頻度の順に並べて成る第１のデータ配列と、ビット長が
同じハフマン符号の種類数を格納するデータ領域をハフ
マン符号のビット長の順に並べて成る第２のデータ配列
とを前記ハフマン符号化データファイルの先頭部分に配
設するように構成したところに特徴を有する。そして、
この方法において、出現したコードの種類数が１である
場合には、前記第２のデータ配列を省略するように構成
することが好ましい。

【００１０】また、本発明のハフマン符号化装置は、文
字を表わすコードを並べて成るデータファイルを、該デ
ータファイル中における各コードの出現頻度に応じて作
成されたハフマン符号表に基づいて各コードをハフマン
符号化することによりハフマン符号化データファイルを
作成するものにおいて、出現したコードの種類数を格納
するデータ領域を作成する手段と、出現したコードを出
現頻度の順に並べて成る第１のデータ配列を作成する手
段と、ビット長が同じハフマン符号の種類数を格納する
データ領域をハフマン符号のビット長の順に並べて成る
第２のデータ配列を作成する手段と、前記データ領域、
前記第１のデータ配列及び前記第２のデータ配列を前記
ハフマン符号化データファイルの先頭部分に配設する手
段とを備えたところに特徴を有する。そして、この装置
において、出現したコードの種類数が１である場合に
は、前記第２のデータ配列を省略するように構成するこ
とが良い構成である。

【００１１】一方、本発明のハフマン符号復号方法は、
ハフマン符号化データファイルをハフマン復号表に基づ
いて元のコードへ復号することにより、元のデータファ
イルを復元する方法において、出現したコードの種類数
を格納するデータ領域と、出現したコードを出現頻度の
順に並べて成る第１のデータ配列と、ビット長が同じハ
フマン符号の種類数を格納するデータ領域をハフマン符
号のビット長の順に並べて成る第２のデータ配列とに基
づいて前記ハフマン復号表を作成するように構成したと
ころに特徴を有する。この方法において、出現したコー
ドの種類数が１である場合には、前記データ領域と前記
第１のデータ配列とから前記ハフマン復号表を作成する
ように構成することが一層好ましい。

【００１２】そして、本発明のハフマン符号復号装置
は、ハフマン符号化データファイルをハフマン復号表に
基づいて元のコードへ復号することにより、元のデータ
ファイルを復元するものにおいて、出現したコードの種
類数を格納するデータ領域を読み込む手段と、出現した
コードを出現頻度の順に並べて成る第１のデータ配列を
読み込む手段と、ビット長が同じハフマン符号の種類数
を格納するデータ領域をハフマン符号のビット長の順に
並べて成る第２のデータ配列を読み込む手段と、前記デ
ータ領域と前記第１のデータ配列と前記第２のデータ配
列とに基づいて前記ハフマン復号表を作成する手段とを
備えたところに特徴を有する。この装置において、出現
したコードの種類数が１である場合には、前記データ領
域と前記第１のデータ配列とから前記ハフマン復号表を
作成する手段を備えることがより一層好ましい。

【００１３】上記手段によれば、データファイル中に出
現したコードだけについて、その種類数を格納したデー
タ領域と、出現したコードを出現頻度の順に並べた第１
のデータ配列と、ビット長が同じハフマン符号の種類数
を格納するデータ領域をハフマン符号のビット長の順に
並べた第２のデータ配列とを、ハフマン木情報としてハ
フマン符号化データファイルの先頭部分に配設するよう
に構成したので、出現したコードについてのデータだけ
がハフマン木情報のデータの中に含まれるようになる。
このため、出現しないコードについてのデータをハフマ
ン木情報のデータの中に含めて出力する従来構成に比べ
て、ハフマン木情報のデータ量を少なくすることが可能
となる。

【００１４】そして、上記方法において、出現したコー
ドの種類数が１である場合には、第２のデータ配列が不
要であるから、この第２のデータ配列を省略するように
構成すると、ハフマン木情報のデータ量をより一層少な
くすることが可能となる。

【００１５】

【発明の実施の形態】以下、本発明の一実施例について
図面を参照しながら説明する。まず、図１はハフマン符
号化装置であると共にハフマン復号装置であるデータ処
理装置の概略電気的構成を示すブロック図である。この
図１に示すように、データ処理装置１は、ＣＰＵ２、記
憶装置３、ＲＯＭ４及びＲＡＭ５をバス６を介して接続
して構成されている。この場合、ＣＰＵ２は、マイクロ
プロセッサから構成されており、データ処理装置１全体
を制御する機能を有している。また、記憶装置３は、例
えばハードディスクやフロッピーディスク等から構成さ
れている。

【００１６】この記憶装置３には、データ圧縮する対象
のデータファイル（即ち、文字を表わすコード（例えば
ＥＢＣＤＩＣコードやＪＩＳコードや漢字コード等）を
並べて成るデータファイル）が記憶されていると共に、
データ圧縮した後のデータファイル（即ち、ハフマン符
号化データファイル）が出力されて記憶されるようにな
っている。更に、ＲＯＭ４には、ハフマン符号化処理及
びハフマン復号化処理を実行するためのプログラムが記
憶されている。そして、ＲＡＭ５には、ハフマン符号化
処理時及びハフマン復号化処理時に生成したり、使用し
たりする各種のデータ配列やデータテーブル等を書き込
むための領域が確保されるようになっている。

【００１７】次に、上記構成の作用を図２ないし図７も
参照して説明する。まず、ハフマン符号化処理を実行し
てデータを圧縮する場合について述べる。ここで、デー
タ圧縮した後のデータファイル、即ち、ハフマン符号化
データファイルの具体的構成を図２に従って説明する。
図２に示すように、ハフマン符号化データファイル７
は、先頭から順に、出現したコードの全データ数を格納
するデータ領域８と、出現したコードの種類数を格納す
るデータ領域９と、出現したコードを出現頻度順に並べ
て成る第１のデータ配列１０と、ビット長が同じハフマ
ン符号の種類数を格納するデータ領域をハフマン符号の
ビット長の順に並べて成る第２のデータ配列１１と、コ
ードをハフマン符号化したハフマン符号から成るハフマ
ン符号化データ１２とを並べて構成されている。

【００１８】この場合、データ領域８には、圧縮前のデ
ータファイル中に出現するコードの各出現回数の総和、
即ち、データファイル中に存在するコードの総数（全デ
ータ数）が格納されている。このデータ領域８のデータ
長は、対象とするデータファイルの許容最大値を格納可
能な大きさに設定されるようになっている。また、デー
タ領域９には、圧縮前のデータファイル中に出現するコ
ードの種類数が格納されており、この格納されている数
値により、この後に続く第１のデータ配列１０の長さ
（コードの個数）がわかるようになっている。本実施例
の場合、コードとして例えば１バイトのコードを対象と
しているので、コードの種類数は最大でも２５６種類
（「０」Ｈ〜「ＦＦ」Ｈ、尚、Ｈは１６進数を示す）で
ある。従って、データ領域９のデータ長は、１バイトま
たは２バイトで良い。

【００１９】そして、第１のデータ配列１０は、圧縮前
のデータファイル中に出現したコードを出現頻度の順
に、この場合、出現頻度の昇順に並べて構成されたデー
タ配列である。具体的には、圧縮前のデータファイル中
に出現したコードのうちで出現頻度が最小のコードが
「Ｄ」、その次のコードが「Ｓ」、その次のコードが
「Ａ」、その次のコードが「Ｃ」、………であったとす
ると、第１のデータ配列１０は、図３（ａ）に示すよう
なデータ構成となる。そして、圧縮前のデータファイル
中に出現したコードの種類数がａ個であったとすると、
第１のデータ配列１０のデータ長はａバイトとなる。

【００２０】また、第２のデータ配列１１は、ビット長
が同じハフマン符号の種類数を格納するデータ領域をハ
フマン符号のビット長の順に、この場合、ビット長の昇
順に並べて構成された配列である。具体的には、今、コ
ードの種類数がａ個であったときに、ビット長が１６ビ
ットのハフマン符号までで出現したコードをすべてハフ
マン符号に割り当てることができたとする。そして、０
ビットのハフマン符号の種類数が０、１ビットのハフマ
ン符号の種類数が０、２ビットのハフマン符号の種類数
が２、………、１４ビットのハフマン符号の種類数が
１、１５ビットのハフマン符号の種類数が１、１６ビッ
トのハフマン符号の種類数が２であったとする。する
と、第２のデータ配列１１は、図３（ｂ）に示すような
データ構成となる。尚、この場合、２個の１６ビットの
ハフマン符号が「Ｄ」と「Ｓ」のコードに対応し、１個
の１５ビットのハフマン符号が「Ａ」のコードに対応
し、１個の１４ビットのハフマン符号が「Ｃ」のコード
に対応し、………、２個の２ビットのハフマン符号が出
現頻度が最も高い２個のコードに対応するということを
示している。そして、各ビット長のハフマン符号の個数
を格納するデータ領域の長さを１バイトとしているか
ら、上記第２のデータ配列１１のデータ長は、１７×１
バイトとなる。ここで、第２のデータ配列１１のデータ
長は出現したコードの種類数ａによって決まるようにな
っている。即ち、１ビットのハフマン符号の個数から順
に個数を加算していき、加算値が種類数ａに達したとこ
ろで第２のデータ配列１１の出力（作成）を終了するよ
うに構成されているのである。

【００２１】そして、ハフマン符号化データ１２は、デ
ータ圧縮前のデータファイルの各コードを出現順にハフ
マン符号化したハフマン符号をその出現順に並べて構成
されたデータである。

【００２２】次に、ハフマン符号化処理を実行する場合
について、図４及び図５も参照して述べる。これら図４
及び図５のフローチャートは、ハフマン符号化処理のプ
ログラムの概略制御内容を示すものである。ハフマン符
号化処理を実行する場合、まず、図４のステップＳ１に
示すように、ハフマン符号（ハフマンコード）を生成す
る処理を実行する。この場合、データ圧縮前のデータフ
ァイルを一通り読み込むことにより、各コードの出現回
数（頻度）をカウントする。続いて、周知のハフマン符
号化方法により、カウントした出現回数のデータに基づ
いてハフマン符号生成のために必要な一般的なハフマン
木を作成する。このとき、ハフマン木を作成する際に
は、通常、出現回数の少ない順にコードを取り出す処理
を行うので、コードを取り出す毎に、そのコードを第１
のデータ配列１０の先頭から順にセットしていくように
構成することが可能である。

【００２３】これにより、上記ハフマン木が完成した時
点で、第１のデータ配列１０の作成も完了する。次い
で、上記ハフマン木に基づいて第２のデータ配列１１を
作成する。具体的には、上記ハフマン木をｒｏｏｔ側か
ら順にたどっていくことにより、ハフマン符合のビット
長毎に何個のハフマン符合が存在するのかをカウントし
ていく。そして、これら各カウント値をビット長の昇順
に第２のデータ配列１１の先頭から順にセットしていく
ことにより、第２のデータ配列１１の作成が完了するよ
うになっている。

【００２４】続いて、上記したように作成した第１のデ
ータ配列１０と第２のデータ配列１１とに基づいて、ハ
フマン符合のビット長のデータ配列から成る第３のデー
タ配列１３（図３（ｃ）参照）と、ハフマン符合のデー
タ配列から成る第４のデータ配列１４（図３（ｄ）参
照）とを作成する。このうちの第３のデータ配列１３
は、圧縮前のコードに割り当てられたハフマン符合のビ
ット長を格納したデータ領域（例えば１バイトのデー
タ）を予め決めた順（例えばコードの値の昇順）に並べ
て構成されたものである。この場合、圧縮前のコードの
全種類、本実施例の場合、２５６種類のコード「０」Ｈ
〜「ＦＦ」Ｈのすべてについて、上記第３のデータ配列
１３が作成されるように構成されている。

【００２５】従って、第３のデータ配列１３の配列の順
番によりコードの種類を特定することができると共に、
その特定したコードに割り当てられたハフマン符合のビ
ット長がわかるようになっている。具体的には、図３
（ｃ）に示すように、第３のデータ配列１３において、
例えばコード「Ａ」に対応する順番の１バイトのデータ
領域内にはビット長が１５ビットであることを示す数値
が格納され、例えばコード「Ｃ」に対応する順番の１バ
イトのデータ領域内にはビット長が１６ビットであるこ
とを示す数値が格納されている。尚、上記第３のデータ
配列１３において、ハフマン符合が割り当てられていな
いコード（圧縮前のデータファイルに出現しないコー
ド）に対応する順番の１バイトのデータ領域にはそれぞ
れ「０」が格納されており、これにより、そのコードが
出現しないコードであることがわかる構成となってい
る。

【００２６】また、第４のデータ配列１４は、圧縮前の
コードに割り当てられたハフマン符合を格納したデータ
領域（例えば２バイトのデータ）を上記第３のデータ配
列の順序と同じ順序、即ち、コードの値の昇順に並べて
構成されたものである。この場合、圧縮前のコードの全
種類、つまり、２５６種類のコード「０」Ｈ〜「ＦＦ」
Ｈのすべてについて上記第４のデータ配列１４が作成さ
れている。これにより、第４のデータ配列１４の配列の
順番によりコードの種類を特定することができると共
に、その特定したコードに割り当てられたハフマン符合
がわかるようになっている。具体的には、図４（ｄ）に
示すように、第４のデータ配列１４において、例えばコ
ード「Ａ」に対応する順番の２バイトのデータ領域内に
はビット長が１５ビットのハフマン符合がその先頭から
格納され、例えばコード「Ｃ」に対応する順番の２バイ
トのデータ領域内にはビット長が１６ビットのハフマン
符合がその先頭から格納されている。尚、上記第４のデ
ータ配列１４において、ハフマン符合が割り当てられて
いないコード（圧縮前のデータファイルに出現しないコ
ード）に対応する順番のデータ領域にはそれぞれ「０」
が格納されている。また、本実施例では、上記各データ
領域の先頭からハフマン符合を格納する構成としたが、
これに代えて、各データ領域内に後詰め方式でハフマン
符合を格納する構成としても良い。更に、本実施例で
は、ハフマン符合を格納する各データ領域の長さを２バ
イトに設定したが、ハフマン符合のビット長が１６ビッ
トを越える場合には、その越えた長さを格納可能な長さ
のデータ領域を設定するように構成すれば良い。

【００２７】そして、上記第３のデータ配列１３と第４
のデータ配列１４とに基づいてハフマン符合化処理を実
行することが可能である。この場合、上記第３のデータ
配列１３と第４のデータ配列１４とからハフマン符合表
が構成されるようになっている。そして、上記ハフマン
木、第１のデータ配列１０、第２のデータ配列１１、第
３のデータ配列１３及び第４のデータ配列１４を作成完
了することにより、ハフマン符合生成処理（ステップＳ
１）が完了する。尚、上記ハフマン木、第１のデータ配
列１０、第２のデータ配列１１、第３のデータ配列１３
及び第４のデータ配列１４は、いずれもＲＡＭ５内の適
当な領域に作成されるように構成されている。

【００２８】次に、データ領域８、並びに、「元情報」
であるデータ領域９、第１のデータ配列１０及び第２の
データ配列１１を記憶装置３へ出力して、出力ファイル
（ハフマン符号化データファイル）の先頭部分を作成す
る処理を実行する（ステップＳ２）。この処理は、図５
に示すサブルーチンＡで実行される。具体的には、ま
ず、データ領域８、即ち、出現したコードの全データ数
をハフマン符号化データファイルの先頭に出力する（ス
テップＳ２００）。続いて、上記データ領域８の後にデ
ータ領域９、即ち、出現したコードの種類数ａを出力す
る（ステップＳ２０１）。

【００２９】そして、上記データ領域９に続いて第１の
データ配列１０を出力する。この場合、第１のデータ配
列１０の先頭の出現コードから順に出力していく。具体
的には、出現コードを全て出力したか否かを判断し（ス
テップＳ２０２）、全て出力してないければ、ステップ
Ｓ２０２にて「ＮＯ」へ進み、出現コードをハフマン符
号化データファイルに出力する（ステップＳ２０３）。
そして、第１のデータ配列１０の最後の出現コードを出
力すると、ステップＳ２０２にて「ＹＥＳ」へ進み、上
記第１のデータ配列１０に続いて第２のデータ配列１１
を出力する処理を実行する。

【００３０】この場合、まず、出現したコードの種類数
ａが１であるか否かを判断し（ステップＳ２０４）、２
種類以上である場合には、ステップＳ２０３にて「Ｎ
Ｏ」へ進む。そして、第２のデータ配列１１の全ての有
効データを出力したか否かを判断し（ステップＳ２０
５）、出力していない場合には、ステップＳ２０５にて
「ＮＯ」へ進む。続いて、第２のデータ配列１１の先頭
のデータ、即ち、ビット長が０ビットのハフマン符合の
種類数から順にハフマン符号化データファイルに出力す
る（ステップＳ２０６）。そして、出力したハフマン符
合の種類数を積算してその和を求める（ステップＳ２０
７）。この場合、上記積算した和の値が出現コードの種
類数ａに等しくなることにより、第２のデータ配列１１
の全ての有効データを出力したことがわかる。この後、
第２のデータ配列１１の全ての有効データを出力する
と、ステップＳ２０５にて「ＹＥＳ」へ進み、図４のス
テップＳ３へ進む。これにより、データ領域８並びに
「元情報」（データ領域９、第１のデータ配列１０及び
第２のデータ配列１１）をハフマン符号化データファイ
ルの先頭部分に配設（出力）する処理が完了する。

【００３１】また、ステップＳ２０４において、出現し
たコードの種類数ａが１である場合には、第２のデータ
配列１１を出力する必要がないから、ステップＳ２０４
にて「ＹＥＳ」へ進み、データ領域８並びに「元情報」
の出力処理を完了し、図４のステップＳ３へ進むように
構成されている。

【００３２】次に、上記したようにして「元情報」の出
力処理を完了したら、圧縮前のデータファイル中のコー
ドを先頭から順にハフマン符合化すると共に、符号化し
たハフマン符合をハフマン符号化データファイルのハフ
マン符号化データ１２として出力する処理を実行する。
具体的には、まず、圧縮前のデータファイルの最後のコ
ードを符号化したか否かを判断し（ステップＳ３）、符
号化していない場合には、ステップＳ３にて「ＮＯ」へ
進む。そして、圧縮前のデータファイルの先頭のコード
から順にハフマン符号化する（ステップＳ４）。この場
合、ハフマン符合表である前記第３のデータ配列１３
（図３（ｃ）参照）と前記第４のデータ配列１４（図３
（ｄ）参照）とに基づいてハフマン符号化処理を行うよ
うに構成されている。そして、符号化したハフマン符合
をハフマン符号化データファイルのハフマン符号化デー
タ１２として逐次出力するように構成されている。

【００３３】この後、圧縮前のデータファイルの最後の
コードのハフマン符号化を完了すると、ステップＳ３に
て「ＹＥＳ」へ進む。これにより、ハフマン符号化デー
タファイルの作成処理が完了する。

【００３４】次に、ハフマン復号化処理を実行する場合
について、図６及び図７を参照して説明する。これら図
６及び図７のフローチャートは、ハフマン復号化処理の
プログラムの概略制御内容を示すものである。ハフマン
復号化処理を実行する場合、まず、図６のステップＴ１
に示すように、データ領域８、並びに、「元情報」であ
るデータ領域９、第１のデータ配列１０及び第２のデー
タ配列１１を記憶装置３内のハフマン符号化データファ
イルから読み込む処理を実行する。この処理は、図７に
示すサブルーチンＢで実行される。具体的には、まず、
データ領域８、即ち、出現したコードの全データ数をハ
フマン符号化データファイルの先頭から読出し、ＲＡＭ
５内の適当な領域に書き込む（ステップＴ１００）。続
いて、上記データ領域８の後に続くデータ領域９、即
ち、出現したコードの種類数ａを読出し、ＲＡＭ５内の
適当な領域に書き込む（ステップＴ１０１）。

【００３５】そして、上記データ領域９に続く第１のデ
ータ配列１０を読み込む。この場合、第１のデータ配列
１０の先頭の出現コードから順に読み込んでいく。具体
的には、出現コードを全て読み込んだか否かを判断し
（ステップＴ１０２）、全て読み込んでいなければ、ス
テップＴ１０２にて「ＮＯ」へ進み、出現コードをハフ
マン符号化データファイルから読み込み、ＲＡＭ５内の
適当な領域に書き込む（ステップＴ１０３）。この後、
第１のデータ配列１０の最後の出現コードを読み込む
と、ステップＴ１０２にて「ＹＥＳ」へ進み、上記第１
のデータ配列１０に続く第２のデータ配列１１を読み込
む処理を実行する。

【００３６】この場合、まず、データ領域９に格納され
たデータに基づいて出現したコードの種類数ａが１であ
るか否かを判断し（ステップＴ１０４）、２種類以上で
ある場合には、ステップＴ１０３にて「ＮＯ」へ進む。
そして、第２のデータ配列１１の全ての有効データを読
み込んだか否かを判断し（ステップＴ１０５）、読み込
んでいない場合には、ステップＴ１０５にて「ＮＯ」へ
進む。続いて、第２のデータ配列１１の先頭のデータ、
即ち、ビット長が０ビットのハフマン符合の個数から順
にハフマン符号化データファイルから読み込み、ＲＡＭ
５内の適当な領域に書き込む（ステップＴ１０６）。そ
して、読み込んだハフマン符合の個数を積算してその和
を求める（ステップＴ１０７）。この場合、上記積算し
た和の値が出現コードの種類数ａに等しくなることによ
り、第２のデータ配列１１の全ての有効データを読み込
んだことがわかる。この後、第２のデータ配列１１の全
ての有効データを読み込むと、ステップＴ１０５にて
「ＹＥＳ」へ進み、図６のステップＴ２へ進む。これに
より、データ領域８並びに「元情報」（データ領域９、
第１のデータ配列１０及び第２のデータ配列１１）をハ
フマン符号化データファイルの先頭部分から読み込む処
理が完了する。

【００３７】また、ステップＴ１０４において、出現し
たコードの種類数ａが１である場合には、第２のデータ
配列１１を読み込む必要がないから、ステップＴ１０４
にて「ＹＥＳ」へ進み、データ領域８並びに「元情報」
を読み込む処理を完了し、図６のステップＴ２へ進むよ
うに構成されている。

【００３８】次に、ステップＴ２において、ハフマン復
号表を作成する処理を実行する。この場合、ハフマン復
号表とは、ハフマン符合のビット長の配列から成る第３
のデータ配列１３（図３（ｃ）参照）と、ハフマン符合
の配列から成る第４のデータ配列１４（図３（ｄ）参
照）とのことである。そして、上記ステップＴ２では、
上述したように読み込んだ第１のデータ配列１０と第２
のデータ配列１１とに基づいてハフマン符号化時と同様
にして、第３のデータ配列１３と第４のデータ配列１４
とを作成する。これにより、ハフマン復号表の作成処理
が完了する。

【００３９】続いて、上記したようにしてハフマン復号
表（第３のデータ配列１３及び第４のデータ配列１４）
を作成したら、圧縮後のハフマン符号化データファイル
中のハフマン符号化データ１２を読み込むと共に、読み
込んだハフマン符合を元のコードに復号する処理を実行
する。具体的には、まず、上記ハフマン符号化データ１
２の最後のハフマン符合を復号したか否かを判断し（ス
テップＴ３）、復号していない場合には、ステップＴ３
にて「ＮＯ」へ進む。そして、ハフマン符号化データ１
２の先頭のハフマン符合から順に復号する（ステップＴ
４）。この場合、ハフマン復号表である上記第３のデー
タ配列１３（図３（ｃ）参照）と上記第４のデータ配列
１４（図３（ｄ）参照）とに基づいて周知のアルゴリズ
ムに従ってハフマン復号化処理を行うようになってい
る。そして、復号したコードを圧縮前のデータファイル
としてその先頭から逐次出力し、記憶装置３に書き込む
ように構成されている。

【００４０】この後、ハフマン符号化データ１２の最後
のハフマン符号の復号を完了すると、ステップＴ３にて
「ＹＥＳ」へ進む。これにより、ハフマン符号化データ
ファイルを圧縮前のデータファイルに戻す（復号する）
処理が完了する。

【００４１】このような構成の本実施例によれば、圧縮
前のデータファイル中に出現したコードだけについて、
その種類数ａを格納したデータ領域９と、出現したコー
ドを出現頻度順に並べた第１のデータ配列１０と、ビッ
ト長が同じハフマン符号の種類数を格納するデータ領域
をハフマン符号のビット長の順に並べた第２のデータ配
列１１とを、ハフマン木情報（「元情報」）として圧縮
後のハフマン符号化データファイルの先頭部分に配設す
るように構成したので、出現しないコードについてのデ
ータをハフマン木情報のデータの中に含めて出力する従
来構成に比べて、ハフマン木情報のデータ量を少なくす
ることができる。

【００４２】ここで、本実施例において、出現したコー
ドの種類数ａが例えば１００の場合におけるハフマン木
情報のデータ量を求めて見る。この場合、ビット長が１
６ビットのハフマン符号までで出現したコードをすべて
ハフマン符号に割り当てることができたとすると共に、
第２のデータ配列１１が図３（ｂ）で示すように構成さ
れたとする。このような場合、ハフマン木情報のデータ
量は、次の式で計算された通りとなる。

【００４３】８ビット×１００＋８ビット×１７＝９３
６ビット＝１１７バイト上記ハフマン木情報のデータ量は、出現コードの種類数
ａが１００の場合のデータ量であり、種類数ａが１００
よりも少ないときは、ハフマン木情報のデータ量は上記
計算結果よりも更に少なくなる。一方、種類数ａが１０
０よりも多いときは、ハフマン木情報のデータ量は上記
計算結果よりも多くなる。

【００４４】これに対して、特公平２−５０６６７号公
報に記載された装置におけるハフマン木情報のデータ量
は、次の式で計算された通りとなる。

【００４５】４ビット×２５６＝９８４ビット＝１２８バイト従って、出現コードの種類数ａが１００を少し越える数
値までは、本発明の方がハフマン木情報のデータ量が少
なくなることがわかる。特に、出現コードの種類数ａが
少ないときには、上記公報の装置に比べてハフマン木情
報のデータ量が大幅に少なくなることがわかる。

【００４６】尚、上記公報に記載された装置におけるハ
フマン木情報において、ハフマン符合のビット長を上記
４ビットのデータ領域に代えて８ビットのデータ領域に
格納する構成とした場合には、ハフマン木情報のデータ
量は、次の式で計算された通りとなる。

【００４７】８ビット×２５６＝２５６バイト従って、この場合には、出現コードの種類数ａが１００
をかなり越える数値まで、本発明の方がハフマン木情報
のデータ量が少なくなることがわかる。

【００４８】また、本実施例では、出現したコードの種
類数ａが１である場合には、第２のデータ配列１１の出
力を省略するように構成したので、ハフマン木情報のデ
ータ量をより一層少なくすることができる。

【００４９】尚、上記実施例では、データ圧縮後のハフ
マン符号化データファイルにおいて、データ領域９、第
１のデータ配列１０及び第２のデータ配列１１をこの順
に並べる構成としたが、これに限られるものではなく、
例えば第１のデータ配列１０と第２のデータ配列１１を
逆に並べる構成としても良い。また、上記実施例では、
データ圧縮前のデータファイル中のコードとして１バイ
トのコードをハフマン符合化する場合について適用した
が、これに代えて、２バイト或いは３バイト以上のコー
ドをハフマン符合化する場合、または、１バイト未満の
コードをハフマン符合化する場合について適用しても良
い。

【００５０】

【発明の効果】本発明は、以上の説明から明らかなよう
に、データファイル中に出現したコードだけについて、
その種類数を格納したデータ領域と、出現したコードを
出現頻度順に並べた第１のデータ配列と、ビット長が同
じハフマン符号の種類数を格納するデータ領域をハフマ
ン符号のビット長の順に並べた第２のデータ配列とを、
ハフマン木情報としてハフマン符号化データファイルの
先頭部分に配設するように構成したので、出現しないコ
ードについてのデータをハフマン木情報のデータの中に
含めて出力する従来構成に比べて、ハフマン木情報のデ
ータ量を少なくすることができるという優れた効果を奏
する。

【００５１】また、上記構成の場合、出現したコードの
種類数が１である場合には、第２のデータ配列の出力を
省略するように構成したので、ハフマン木情報のデータ
量を更に一層少なくすることができると共に、ハフマン
符号化処理及びハフマン復号化処理に要する時間を短縮
することができる。

【図面の簡単な説明】

【図１】本発明の一実施例を示すブロック図

【図２】ハフマン符号化データファイルの構成を示す図

【図３】（ａ）は第１のデータ配列の構成を示す図、
（ｂ）は第２のデータ配列の構成を示す図、（ｃ）は第
３のデータ配列の構成を示す図、（ｄ）は第４のデータ
配列の構成を示す図

【図４】ハフマン符号化処理のフローチャート

【図５】サブルーチンＡのフローチャート

【図６】ハフマン復号化処理のフローチャート

【図７】サブルーチンＢのフローチャート

【符号の説明】

１はデータ処理装置、２はＣＰＵ、３は記憶装置、４は
ＲＯＭ、５はＲＡＭ、６はバス、７はハフマン符号化デ
ータファイル、８はデータ領域、９はデータ領域、１０
は第１のデータ配列、１１は第２のデータ配列、１２は
ハフマン符号化データ、１３は第３のデータ配列、１４
は第４のデータ配列を示す。

Claims

【特許請求の範囲】

【請求項１】文字を表わすコードを並べて成るデータ
ファイルを、該データファイル中における各コードの出
現頻度に応じて作成されたハフマン符号表に基づいて各
コードをハフマン符号化することにより、ハフマン符号
化データファイルを作成するハフマン符号化方法におい
て、出現したコードの種類数を格納するデータ領域と、出現したコードを出現頻度の順に並べて成る第１のデー
タ配列と、ビット長が同じハフマン符号の種類数を格納するデータ
領域をハフマン符号のビット長の順に並べて成る第２の
データ配列とを前記ハフマン符号化データファイルの先
頭部分に配設するようにしたことを特徴とするハフマン
符号化方法。
【請求項２】出現したコードの種類数が１である場
合、前記第２のデータ配列を省略するように構成したこ
とを特徴とする請求項１記載のハフマン符号化方法。
【請求項３】文字を表わすコードを並べて成るデータ
ファイルを、該データファイル中における各コードの出
現頻度に応じて作成されたハフマン符号表に基づいて各
コードをハフマン符号化することによりハフマン符号化
データファイルを作成するハフマン符号化装置におい
て、出現したコードの種類数を格納するデータ領域を作成す
る手段と、出現したコードを出現頻度の順に並べて成る第１のデー
タ配列を作成する手段と、ビット長が同じハフマン符号の種類数を格納するデータ
領域をハフマン符号のビット長の順に並べて成る第２の
データ配列を作成する手段と、前記データ領域、前記第１のデータ配列及び前記第２の
データ配列を前記ハフマン符号化データファイルの先頭
部分に配設する手段とを備えたことを特徴とするハフマ
ン符号化装置。
【請求項４】出現したコードの種類数が１である場
合、前記第２のデータ配列を省略するように構成したこ
とを特徴とする請求項３記載のハフマン符号化装置。
【請求項５】ハフマン符号化データファイルをハフマ
ン復号表に基づいて元のコードへ復号することにより、
元のデータファイルを復元するハフマン符号復号方法に
おいて、出現したコードの種類数を格納するデータ領域と、出現したコードを出現頻度の順に並べて成る第１のデー
タ配列と、ビット長が同じハフマン符号の種類数を格納するデータ
領域をハフマン符号のビット長の順に並べて成る第２の
データ配列とに基づいて前記ハフマン復号表を作成する
ようにしたことを特徴とするハフマン符号復号方法。
【請求項６】出現したコードの種類数が１である場
合、前記データ領域と前記第１のデータ配列とから前記
ハフマン復号表を作成するようにしたことを特徴とする
請求項５記載のハフマン符号復号方法。
【請求項７】ハフマン符号化データファイルをハフマ
ン復号表に基づいて元のコードへ復号することにより、
元のデータファイルを復元するハフマン符号復号装置に
おいて、出現したコードの種類数を格納するデータ領域を読み込
む手段と、出現したコードを出現頻度の順に並べて成る第１のデー
タ配列を読み込む手段と、ビット長が同じハフマン符号の種類数を格納するデータ
領域をハフマン符号のビット長の順に並べて成る第２の
データ配列を読み込む手段と、前記データ領域と前記第１のデータ配列と前記第２のデ
ータ配列とに基づいて前記ハフマン復号表を作成する手
段とを備えたことを特徴とするハフマン符号復号装置。
【請求項８】出現したコードの種類数が１である場
合、前記データ領域と前記第１のデータ配列とから前記
ハフマン復号表を作成する手段を備えたことを特徴とす
る請求項７記載のハフマン符号復号装置。