JP3593244B2 - データ圧縮装置 - Google Patents

データ圧縮装置 Download PDF

Info

Publication number
JP3593244B2
JP3593244B2 JP26445797A JP26445797A JP3593244B2 JP 3593244 B2 JP3593244 B2 JP 3593244B2 JP 26445797 A JP26445797 A JP 26445797A JP 26445797 A JP26445797 A JP 26445797A JP 3593244 B2 JP3593244 B2 JP 3593244B2
Authority
JP
Japan
Prior art keywords
node
dictionary
data
level
link information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26445797A
Other languages
English (en)
Other versions
JPH11110187A (ja
Inventor
修 萬羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP26445797A priority Critical patent/JP3593244B2/ja
Publication of JPH11110187A publication Critical patent/JPH11110187A/ja
Application granted granted Critical
Publication of JP3593244B2 publication Critical patent/JP3593244B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、連続するデータを圧縮するデータ圧縮装置、特にデータ通信などのために、リアルタイムで文字列データなどを圧縮伸長するシステムのためのデータ圧縮装置に関する。
【0002】
【従来の技術】
従来から、データ通信の分野では、CCITTと略称される国際電信電話諮問委員会からのVシリーズ勧告に基づくデータ回線終端装置(DCE)がモデムとして用いられている。図5は、CCITT勧告V.42bisに基づくデータ圧縮機能とエラー訂正制御機能とを有するデータ回線終端装置1の概略的な構成を示す。データ回線終端端装置1は、ワークステーションやパーソナルコンピュータなどのデータ終端装置2と、公衆電話網3との間に設けられる。DTEと略称されるデータ終端装置2との接続は、相互接続回路4を介して行われる。公衆電話網3との間の信号の変換は、信号変換部5によって行われる。エラー訂正およびデータ圧縮は、制御部6によって制御されるエラー訂正部7およびデータ圧縮部8によってそれぞれ行われる。
【0003】
データ圧縮部8は、辞書9を有し、文字列の符号化による圧縮と、符号化されたデータの復号による伸長とを行う。
【0004】
図6は、辞書9のデータ構造を示す。辞書9はツリー構造10によって表現される。このツリー構造10は、複数の節点を有し、アルファベットA,B,C,D,…に対応するルート節点11a,11b,11c,11d,…が最上位となって、複数の節点が連なって文字列を表現する。図6は、「A」、「B」、「BA」、「BAG」、「BAR」、「BAT」、「BI」、「BIN」、「C」、「D」、「DE」、「DO」および「DOG」の各文字列を表現している状態を示す。節点12ba,12bi,12doは、ツリー構造10の途中にあり、文字列の最後の文字を示すリーフ節点12de,13bag,13bar,13bat,13bin,13dogは中間の節点12ba,12bi,12doよりも下位レベルの階層にある。各節点には、節点を識別するための符号語が割当てられる。このツリー構造10の辞書9の内容は、公衆電話網3を介してデータ通信を行う相手側の辞書9における符号語の割当てと一致させる。
【0005】
図6(b)に示すように、一般に、ツリー構造10の途中にある節点14に対しては、1つの親15と1または複数の子16が存在する。図6(a)に示すルート節点11a〜11dに対しては親は存在しない。またルート節点11a,11cは子も存在せず、独立した節点となっている。したがって、図6(b)に示すツリー構造10上の各節点14では、自己に対応する符号語と、自己に対応する文字と、親15の符号語と、子供16の有無を示す情報とを備えている必要がある。
【0006】
図7は、CCITT勧告V.42bisに従って文字列検索を行って圧縮する手順を示す。ステップa0から手順を開始し、ステップa1では文字列の最初の文字に対応するルート節点の情報を獲得する。ステップa2では対象とする節点に対し、子供となる節点が存在しているか否かを判断する。子供が存在していると判定されれば、ツリー構造10でこの節点から次の符号語の情報を獲得する。ステップa4では、獲得された次の符号語の情報のうち、文字が一致するか否かを判断する。文字が一致するときには、ステップa2に戻り、さらに子供の有無を判断する。ステップa4で文字が一致しないときには、ステップa5で子供となる節点についての辞書の範囲を一周しているか否かを判断する。一周していないと判断されるときには、ステップa3に戻り、次の子供の符号語の情報を獲得する。ステップa5で辞書を一周して、文字が一致する子供の符号語がないと判断されるときには、ステップa6で、一致しない文字を辞書に追加する処理を行う。ステップa2で子供がいないと判断されるときには、ステップa8で文字の辞書への追加を行う。ステップa6またはステップa7の辞書への追加が終了すると、ステップa8で文字列が一致した範囲の符号語の出力を行い、ステップa9で手順を終了する。
【0007】
図7の手順に従って、データ通信用の信号ストリームを圧縮する典型的な先行技術は、たとえば特公平5−68893に開示されている。また辞書を用いてデータ圧縮を行う考え方は、特開昭60−241157、特開昭61−232724、特開平1−102613、特開平2−144661、特開平3−038772、特開平4−116690、特開平4−123619、特開平4−217021、特開平4−223556、特開平4−340156および特開平7−23238などにも開示されている。
【0008】
【発明が解決しようとする課題】
従来からの図6に示すようなツリー構造10の辞書は、各節点の親となる節点へのリンクでツリー構造10を表現しているので、文字列検索時には辞書内に記憶されている符号語を端から端まで確認する必要があり、時間がかかっている。そのためリアルタイム処理を行う場合には、高速な演算装置等が必要となる。
【0009】
本発明の目的は、CCITTの勧告V.42bis等の圧縮伸長処理に高速な演算装置等を必要とせず、辞書構造の変更による記憶容量の増加を可能な限り抑えることができる辞書構造を有するデータ圧縮装置を提供することである。
【0010】
【課題を解決するための手段】
本発明は、入力されるデータ列の圧縮伸長用に、予め設定される規格に従うツリー構造を有し、最上位レベルの節点から各節点までの経路に応じて見出しデータが表現され、各節点毎に上位レベルの節点に対するリンク情報と下位レベルの節点の有無情報とを有する辞書を検索し、見出しデータに一致する入力データの部分列の符号化と、見出しデータに一致しない入力データの辞書への追加とを繰返すデータ圧縮装置において、
辞書の各節点には、自分のレベルの次のレベルでの最初の節点、および自分と同一のレベルでの次の節点へのリンク情報が付加されており、
付加されたリンク情報も使用して辞書の検索を行う辞書検索手段と、
入力データの辞書への追加の際に、予め定められる範囲の複数レベルで、節点に対するリンク情報を付加するリンク付加手段とを含むことを特徴とするデータ圧縮装置である。
【0011】
本発明に従えば、ツリー構造の辞書の最上位レベルの節点から各節点までの経路に応じて見出しデータが表現され、入力されるデータ列が見出しデータに一致する範囲で符号化されてデータ圧縮が行われる。辞書の各節点には、自分のレベルの次のレベルでの最初の節点、および自分と同一のレベルでの次の節点へのリンク情報が付加され、辞書検索手段は付加されたリンク情報も使用して辞書の検索を行うので、データ列が辞書に記憶されている見出しデータに一致するか否かの判断を行う際の検索時間を短縮することができる。リンク付加手段は、入力データの辞書への追加の際に、予め定められる範囲の複数レベルで節点に対するリンク情報を付加するので、追加されたデータを含む見出しデータの検索でも、付加されたリンク情報を用いて迅速な検索を行うことができる。辞書の検索が高速化されるので、高速な演算装置等を必要とせずに圧縮伸長処理を高速化することができる。ツリー構造の辞書に対して付加するリンク情報を少なくすることができるので、辞書の記憶容量の増大を抑えることができる。
【0012】
また本発明で前記データ列は、データ通信用の文字列であり、
前記予め設定される規格に従って、前記辞書を用いて文字列を符号化して通信路に送信し、通信路から受信される信号を辞書を用いて復号化する処理手段を備えることを特徴とする。
【0013】
本発明に従えば、データ通信の際に、文字列を圧縮伸長するための辞書の検索が高速となり、高速度の通信速度に対しても辞書を用いる圧縮伸長処理を充分に対応させることができる。
【0014】
また本発明で前記付加されるリンク情報は、
ツリー構造で親となる上位レベルの節点から最初に追加された下位レベルの子である長男の節点へのリンク情報と、
同一の節点を親として共有する同一レベルの節点間で、追加された順序が連続し、先行する兄の節点から後続の弟の節点へのリンク情報とであることを特徴とする。
【0015】
本発明に従えば、親から長男へのリンク情報と、兄弟間で兄から弟へのリンク情報とが付加されるので、文字列の検索の際に次の節点を探す時間が短縮され、迅速な検索を行うことができ、圧縮または伸長に要する時間の短縮を図ることができる。
【0016】
また本発明で前記予め設定される規格は、国際電信電話諮問委員会の勧告V.42bisであることを特徴とする。
【0017】
本発明に従えば、国際電信電話諮問委員会の勧告V.42bisに基づくデータ圧縮を、辞書の検索時間を短縮して高速化することができる。
【0018】
【発明の実施の形態】
図1は、本発明の実施の一形態としてのデータ回線終端装置21の概略的な電気的構成を示す。データ回線終端装置21は、DCEとして、DTEであるデータ終端装置22と公衆電話網23との間に設けられる。データ終端装置22は、パーソナルコンピュータやPEDと称される各種形態情報端末装置などである。公衆電話網23は、公衆電話回線やISDN、あるいはPHSなどの無線公衆電話網である。
【0019】
データ回線終端装置21には、データ終端装置22との間に相互接続回路24、公衆電話網23との間に信号変換部25、内部の制御用に制御部26、エラー訂正用にエラー訂正部27、およびデータの圧縮伸長用にデータ圧縮部28を含む。データ圧縮部28は、ツリー構造の辞書29、辞書検索手段30およびリンク付加手段31を含む。
【0020】
図2は、図1の辞書29の基本的なツリー構造40を示す。図2(a)は、ツリー構造40の表現例を示し、図2(b)は各節点に対応して記憶されている符号語情報の内容を示す。ツリー構造40の途中の節点が自分41である場合を想定すると、ツリー構造40の上位側のレベルに親42となる節点が存在する。自分41から親42へは、親へのリンク43でさかのぼることができる。同一の親42からは、自分41および弟44を含む複数の子が分岐し得る。親42に対する複数の子は、辞書に追加された順に従って兄弟の関係を有し、自分41に対して弟41が存在するときには、弟へのリンク45で参照可能である。自分41が、リーフ節点でないときには、1または複数個の子となる節点が存在する。そのうち最初に追加される節点は、長男46であり、次男以降の子供48が存在することもある。次男以降の子供48が存在するときには、長男46には弟へのリンクが設けられるので、自分41からは長男46へのリンクである長男へのリンク47を記憶しておくだけで、複数の長男46および子供48を順に示すことができる。
【0021】
図2(b)は、各節点に記憶されている符号語情報の内容の例を示す。図2(a)に示す自分41についての符号語情報の場合、先頭12ビットは自分41に対応する符号語41aであり、次の8ビットは自分41に対応する文字41bであり、次の12ビットは親42の符号語42aであり、次の1ビットで長男46あるいは子供48など、子供がいるか否かを示すフラグ41cとなる。符号語41a、文字41b、親の符号語42aおよび子供がいるか否かのフラグ41cは、従来からV.42bis用の辞書には記憶されている。本実施形態のツリー構造40に対応する辞書では、網かけを施して示す次の12ビットの長男の符号語46a、1ビットの弟がいるか否かを示すフラグ41d、および12ビットの弟の符号語44aを付加する。この結果、従来は33ビットであった符号語情報が、25ビット付加され、58ビットに増大する。しかしながら、辞書29に記憶する容量の増加は2倍には達していない。
【0022】
図3は、図5と同様な文字列に対応する辞書29のツリー構造50を示す。図3(a)は、ツリー構造50による表現例を示し、図3(b)は各節点に記憶されている符号語情報の内容例を示す。図3(b)で、本発明による付加情報の部分は、網かけを施して示す。
【0023】
図3(a)に示すツリー構造50では、ルート節点51a,51b,51c,51dでアルファベットのA,B,C,Dに対応させ、途中の節点52ba,52bi,52doからリーフ節点52de,53bag,53bar,53bat,53bin,53dogに対し、従来からの親へのリンク43に加えて、弟へのリンク45および長男へのリンク47を付加している。
【0024】
図4は、図3に示すようなツリー構造50の辞書で文字列検索を行ってデータ圧縮を行う手順を示す。ステップb0から手順を開始し、ステップb1で文字列の最初の文字に対応するルート節点51a〜51dの情報を獲得する。ステップb2では、図2(b)の子供がいるか否かのフラグ41cに従って、子供の有無を判断する。子供がいると判断されるときには、長男の符号語46aを長男へのリンク47として用いて、長男の情報を獲得する。ステップb4では、長男の節点についての文字41bが、入力された文字列で検索の対象となっている文字と一致しているか否かを判断する。一致していないと判断されるときには、ステップb5で長男の節点に対して弟となる節点がいるか否かのフラグ41dを参照し、弟がいればステップb6で次の弟の情報を獲得する。ステップb5で弟がいないと判断されるときには、ステップb7で一致しない文字を辞書に追加する処理を行う。ステップb5で子供がいないと判断されるときには、ステップb8で最後の文字についての辞書への追加を行う。この追加の際に、リンク付加手段31は、新たな節点に文字を割当て、その節点の直前の兄となる節点に対応する節点の符号語情報に対し、弟がいるか否かのフラグ41dと弟の符号語48aとを変更する。
【0025】
ステップb8の辞書追加では、新たに長男となる節点を追加し、長男の符号語46aを設定するとともに、子供がいるか否かのフラグ41cを変更する。ステップb7またはステップb8が終了すると、ステップb9で辞書と一致する範囲の文字列に対応して符号語を出力し、ステップb10で手順を終了する。
【0026】
以下具体的に、図4の手順で「BIN」という文字列を検索する状態を示す。ステップb1では図3(a)のルート節点51bから、「B」の情報を獲得する。CCITTの勧告V.42bisから、ルート節点「B」は符号語「045」であることが分かるので、図3(b)から符号語「045」の情報を獲得する。図4のステップb2では、ルート節点「045」に子供がいるか否かを確認する。図3(b)では符号語「045」に対する子供がいるか否かのフラグが○印になっているので、子供がいることが確認される。ステップb3では、長男に対応する符号語として「符号語2」が検索文字の2番目の文字である「I」と一致しているか否か確認される。この場合長男の文字は、「A」であるので、検索文字の2文字目「I」とは一致していないことが確認される。ステップb5では、弟がいるか否かのフラグを確認する。図3(b)では○印となっているので、弟がいることが確認される。ステップb6では、「符号語2」の弟の情報から「符号語8」の情報を獲得する。次にステップb4に戻り、「符号語8」が検索文字の2文字目「I」と一致していることを確認する。さらにステップb2に戻り、「符号語8」に子供がいるかを確認する。図3(b)では○印であるので子供がいることを確認する。ステップb3で、「符号語8」の長男の情報を、「符号語6」として獲得する。ステップb4では、「符号語6」が検索文字の3文字目「N」と一致していることを確認し、文字列「BIN」の検索を終了する。したがって文字列「BIN」の符号語は「符号語6」となる。
【0027】
【発明の効果】
以上のように本発明によれば、データ列の圧縮伸長用の辞書にリンク情報を付加して検索を高速化することができ、演算装置等の高速化を図る必要がないので消費電力の増加を抑えることができる。このため、携帯情報端末装置等の電源の負担を軽減し、小形軽量化を図ることができる。
【0028】
また本発明によれば、辞書を用いて文字列の圧縮伸長を伴って、高い伝送速度でデータ通信を容易に行うことができる。
【0029】
また本発明によれば、親から長男へのリンク情報と、兄から弟へのリンク情報とを付加することで辞書の検索の際の高速化を図るので、辞書の記憶容量の増加を抑え、携帯情報端末装置等に組込む際の小形化に対する障害となることを防ぐことができる。
【0030】
また本発明によれば、国際電信電話諮問委員会の勧告V.42bisに従うデータ通信の際の辞書の検索を迅速に行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の一形態の概略的な電気的構成を示すブロック図である。
【図2】図1の辞書29の基本的なツリー構造10を示す図および図表である。
【図3】図2のツリー構造40に対し、特定の文字列を対応させている状態を示すツリー構造50の図および図表である。
【図4】図1の辞書29を検索してデータ圧縮処理を行う手順を示すフローチャートである。
【図5】従来からのデータ圧縮装置の概略的な電気的構成を示すブロック図である。
【図6】図5に示す辞書9のツリー構造を示す図である。
【図7】図5の辞書9を検索してデータ圧縮を行う手順を示すフローチャートである。
【符号の説明】
21 データ回線終端装置
22 データ終端装置
23 公衆電話網
26 制御部
28 データ圧縮部
29 辞書
30 辞書検索手段
31 リンク付加手段
40,50 ツリー構造
41 自分
42 親
43 親へのリンク
44 弟
45 弟へのリンク
46 長男
47 長男へのリンク
48 子供
51a,51b,51c,51d ルート節点
52ba,52bi,52do 節点
52de,53bag,53bar,53bat,53bin,53dog リーフ節点

Claims (4)

  1. 入力されるデータ列の圧縮伸長用に、予め設定される規格に従うツリー構造を有し、最上位レベルの節点から各節点までの経路に応じて見出しデータが表現され、各節点毎に上位レベルの節点に対するリンク情報と下位レベルの節点の有無情報とを有する辞書を検索し、見出しデータに一致する入力データの部分列の符号化と、見出しデータに一致しない入力データの辞書への追加とを繰返すデータ圧縮装置において、
    辞書の各節点には、自分のレベルの次のレベルでの最初の節点、および自分と同一のレベルでの次の節点へのリンク情報が付加されており、
    付加されたリンク情報も使用して辞書の検索を行う辞書検索手段と、
    入力データの辞書への追加の際に、予め定められる範囲の複数レベルで、節点に対するリンク情報を付加するリンク付加手段とを含むことを特徴とするデータ圧縮装置。
  2. 前記データ列は、データ通信用の文字列であり、
    前記予め設定される規格に従って、前記辞書を用いて文字列を符号化して通信路に送信し、通信路から受信される信号を辞書を用いて復号化する処理手段を備えることを特徴とする請求項1記載のデータ圧縮装置。
  3. 前記付加されるリンク情報は、
    ツリー構造で親となる上位レベルの節点から最初に追加された下位レベルの子である長男の節点へのリンク情報と、
    同一の節点を親として共有する同一レベルの節点間で、追加された順序が連続し、先行する兄の節点から後続の弟の節点へのリンク情報とであることを特徴とする請求項1または2記載のデータ圧縮装置。
  4. 前記予め設定される規格は、国際電信電話諮問委員会の勧告V.42bisであることを特徴とする請求項1〜3のいずれかに記載のデータ圧縮装置。
JP26445797A 1997-09-29 1997-09-29 データ圧縮装置 Expired - Fee Related JP3593244B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26445797A JP3593244B2 (ja) 1997-09-29 1997-09-29 データ圧縮装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26445797A JP3593244B2 (ja) 1997-09-29 1997-09-29 データ圧縮装置

Publications (2)

Publication Number Publication Date
JPH11110187A JPH11110187A (ja) 1999-04-23
JP3593244B2 true JP3593244B2 (ja) 2004-11-24

Family

ID=17403482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26445797A Expired - Fee Related JP3593244B2 (ja) 1997-09-29 1997-09-29 データ圧縮装置

Country Status (1)

Country Link
JP (1) JP3593244B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2775406A4 (en) 2011-11-04 2015-07-08 Fujitsu Ltd MATCHING CONTROL PROGRAM, MATCHING CONTROL DEVICE, AND MATCHING CONTROL METHOD
JP6296044B2 (ja) * 2015-12-07 2018-03-20 富士通株式会社 符号処理のためのプログラム及びデータ構造

Also Published As

Publication number Publication date
JPH11110187A (ja) 1999-04-23

Similar Documents

Publication Publication Date Title
US4814746A (en) Data compression method
US6563438B2 (en) Encoding and decoding apparatus with matching length means for symbol strings
US5999949A (en) Text file compression system utilizing word terminators
US20110283183A1 (en) Method for compressing/decompressing structured documents
US8819287B2 (en) System and method for compressing URL request parameters
US9185182B2 (en) Determining a property of a communication device
EP1122655A2 (en) Data compression apparatus, database system, data communication system, data compression method, storage medium and program transmission apparatus
JPH04500571A (ja) 圧縮された状態におけるデータをエンコードし、デコードし、伝送する方法と装置
EP0127815B1 (en) Data compression method
JP2979106B2 (ja) データ圧縮
EP0138080A2 (en) Communication system using variable length character code and coding method
JP3593244B2 (ja) データ圧縮装置
US6112208A (en) Data compressing method and apparatus to generate bit maps in accordance with extracted data symbols
CN108573069B (zh) 一种加速压缩流量正则表达式匹配的Twins方法
EP0721699B1 (en) Method and apparatus for a unique and efficient use of a data structure for compressing data
CN115149962A (zh) 确定性有限自动机压缩方法、装置、设备及存储介质
JP3199292B2 (ja) ハフマン符号の符号化でのランレングス抽出方法、ハフマン符号変換方法およびmh符号化処理方法
JP3132774B2 (ja) データ圧縮・復元装置
Mukherjee et al. Improving bandwidth of communication controllers
JPS62209948A (ja) デ−タ圧縮伝送方法
Salomon et al. Dictionary methods
CN1111467A (zh) 数据通信中编码和解码压缩数据的方法和装置
CN115987973A (zh) 基于文件传输多文件流的压缩组装下载的实现方法及***
JPH10301959A (ja) データ圧縮/復元装置およびデータ圧縮/復元方法
Ong Text compression for transmission and storage

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040827

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees