JP3344755B2

JP3344755B2 - 昇順整数列データの圧縮および復号システム

Info

Publication number: JP3344755B2
Application number: JP07093793A
Authority: JP
Inventors: 克信柴田
Original assignee: NS Solutions Corp
Current assignee: NS Solutions Corp
Priority date: 1993-03-05
Filing date: 1993-03-05
Publication date: 2002-11-18
Anticipated expiration: 2017-11-18
Also published as: JPH06259222A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、単調増加的に配列され
た昇順整数列データの圧縮および復号システムに関し、
特にデータベースから必要な情報を取り出すためのデー
タベース検索システムにおいて検索されるデータが単調
増加的に配列された整数列データである場合のそのデー
タの圧縮および復号システムに関する。

【０００２】

【従来の技術】従来、データを圧縮および復号する方法
の代表的なものとしては、ハフマン法、シャノン・ファ
ノ法、ギルバート・ムーア法、ランレングス符号化法な
どが知られている。たとえばハフマン法を用いたものと
しては特開平２−７８３２３号などが挙げられる。

【０００３】

【発明が解決しようとする課題】これらの方法は主とし
て、データの文字ごとの出現頻度を測定し、頻度の高い
ものから優先的にデータのサイズを圧縮するものであ
る。これらの方法は、任意の形態のデータに適用できる
利点がある反面、圧縮、復号に数段階の処理を必要とす
るため、特に速度が要求される際には不向きである。

【０００４】本発明は、上記のような問題に鑑み、単調
増加的（昇順）に配列された整数列データを高速で圧縮
するとともに、圧縮されたデータを記憶する記憶手段の
容量を小さくすることのできる圧縮および復号システム
を提供することを目的とする。

【０００５】

【課題を解決するための手段】本発明の圧縮および復号
システムは、昇順に配列された整数列データの圧縮およ
び復号において、昇順に配列された整数列データのｎ番
目のデータから、第１の記憶手段に記憶されたｎ−１番
目のデータの減算を行うとともに、ｎ番目のデータを第
１の記憶手段に送る減算手段と、減算手段により得られ
た差分値を被除数として除算を行い、商および余りを出
力する第１の除算手段と、第１の除算手段により得られ
た商を０と比較する商比較手段と、商比較手段による比
較の結果０でない商を被除数として除算を行い、商およ
び桁上がりマークとともに余りを出力する第２の除算手
段と、第２の除算手段から出力される桁上がりマークお
よび余りを記憶するとともに、第１の除算手段から出力
される余りを記憶する第２の記憶手段と、第２の記憶手
段に記憶された桁上がりマークおよび２つの余りのデー
タから元の整数列データを復号する復号手段とを具備す
る。

【０００６】

【作用】本発明によれば、圧縮時に昇順データを、すで
に記憶された古い整数データと減算を行い、減算により
得られた差分を被除数として除算を行いその余りを出力
するとともに、その商を０と比較し、０でない商につい
てはこれを被除数として除算を行い、桁上がりマークと
ともに余りを出力し、商が０になるまでこの除算を繰り
返し、後者の除算により得られる桁上がりマーク、余
り、前者の除算により得られる余りを保存するようにし
ている。したがって、差分値を除算し、得られたデータ
を保存するようにしているから、従来の一般的な圧縮符
号化方法に比べて計算量を大幅に節約でき、高速で圧縮
および復号を行うことができる。また、統計量のような
データ全体にわたるパラメータを必要としないため、デ
ータの追加や削除を容易に実施することができる。

【０００７】

【実施例】図１には、本発明によるシステムの一実施例
が示されている。同図に示すように、昇順整数列データ
Ｄ１は３２０、３３３、４０１．．．と、単調増加的
（昇順）に配列されている。これらのデータはたとえば
３２ビットで表される。整数列データＤ１は圧縮装置に
おいて、減算部２２に送られる。減算部２２はそのデー
タの前に送られているデータの整数値によって減算を行
うとともに、今回送られた整数値を記憶部１１に送る。
すなわち、記憶部１１には、今回送られてきたデータの
直前に送られているデータが記憶されているから、これ
が減算部２２に読み出され、減算部２２は今回送られて
きたデータから直前に送られているデータを減算し、そ
の減算結果を除算部１２に送る。

【０００８】減算部２２はこの減算を行うとともに、今
回送られてきたデータを記憶部１１に送る。記憶部１１
には、減算部２２から送られた最新のデータが記憶され
る。なお、記憶部１１の初期値は０とする。

【０００９】除算部１２は減算部２２から送られた減算
データを所定の値で除算する。本実施例では入力された
減算データを２５５で割る。得られた商は商比較部１３
に送られ、余りは圧縮数列Ｄ２処理部１６に送られる。

【００１０】商比較部１３は入力された商を０と比較
し、商が０でない場合にはこれを除算部１４へ送る。商
が０である場合には除算部１４へ何らデータを送らず、
昇順整数列データＤ１の次のデータを減算部２２へ入力
するよう指示を与える。除算部１４は、商比較部１３か
ら入力された商を所定の値、本実施例では２５６で除算
し、得られた商は再び商比較部１３に送られ、余りは桁
上がりを示すマーク文字Ｃとともに圧縮数列Ｄ２処理部
１６へ送られる。商比較部１３に送られた商が０と判定
されるまで除算部１４での除算が繰り返される。

【００１１】以上のようにして昇順整数列データの圧縮
処理が行われ、圧縮されたデータ列が圧縮数列処理部１
６に記憶される。

【００１２】次に具体的な例により説明する。最初のデ
ータ３２０が減算部２２に送られると、記憶部１１に記
憶された初期値が０であるから、３２０から０が減算さ
れ、差分値は３２０となり、除算部１２に送られる。除
算部１２では差分値３２０を２５５で除算し、商１、余
り６５が得られる。商比較部１３は入力された商を０と
比較し、商が０でないため、除算部１４に商１が送られ
る。除算部１４で商１が２５６によって除算され、商
０、余り１となるから、除算部１４は桁上がりマークＣ
とともに余り１を圧縮数列処理部１６に送り、次の整数
値を読むように通知する。

【００１３】圧縮数列処理部１６は、除算部１４から送
られた桁上がりマーク文字Ｃと余り１および除算部１２
から送られた余り６５を記憶する。

【００１４】次に整数列データＤ１からデータ３３３が
送られると、減算部２２は３３３を記憶部１１に記憶さ
れていた３２０で減算し、差分１３を得る。差分１３は
除算部１２に送られ、除算部１２は２５５で除算し、商
０、余り１３を得る。商０は商比較部１３に送られ、商
比較部１３は商０が判定され、整数列Ｄ１から次の整数
値を読み込むように指示が出される。この場合には商比
較部１３で商０が判定されているから、圧縮数列処理部
１６には除算部１２から送られた余り１３のみが送ら
れ、記憶される。

【００１５】同様の動作が繰り返されることにより、圧
縮されたデータが圧縮数列Ｄ２処理部１６に順次送られ
る。これらの圧縮データは保存部１５に記憶される。

【００１６】このように圧縮処理は、昇順整数列の先頭
から順に数列の差分Ｄを算出し、これを定数Ｌ(0)で割
った商Ｐ(0)、剰余Ｑ(0)を求め、商Ｐ(0)が０である場
合には、剰余Ｑ(0)のみを記憶手段に格納し、０でない
場合には、商Ｐ(0)をさらに定数Ｌ(1)で割り、商Ｐ
(1)、剰余Ｑ(1)を算出する。その後、この商Ｐ(i)(i=1,
2,...)が０になるまで、直前に算出された商Ｐ(i-1)を
被除数として除算を繰り返す。

【００１７】漸化式で表すとＤ＝Ｌ(0)×Ｐ(0)＋Ｑ(0) Ｐ(i-1)＝Ｌ(i)×Ｐ(i)＋Ｑ(i)(i=1,2,...) この時、１つの差分値Ｄに対して以下のように数値が格
納される。Ｐ(0)＝０の場合、Ｑ(0)のみＰ(n)＝０（ｎ＞１）の場合、Ｃ、Ｑ(1)、Ｃ、Ｑ(2)、．．．Ｃ、Ｑ(n)、Ｑ(0) ただし、ＣはＱ(0)と区別可能なマーク文字である。ま
た、上記整数列の先頭の値については、その値自身を差
分値とする。除数Ｌ(i)は予め定義しておく。

【００１８】Ｌ(i)を大きく設定すれば、除算の結果、
商が０になる場合が増加し、演算コストを下げることが
できる。逆にＬ(i)を小さく設定すれば、除算の回数が
増加し、演算コストが上がるが余りを小さくおさえるこ
とができ、記憶領域を小さくすることができる。

【００１９】次に復号においては、直前に復号された数
値を保存しておき、これを利用する。最初の整数値に対
してはあらかじめ保持された値として０を用いる。

【００２０】まず保存部１５に記憶された圧縮データが
圧縮数列Ｄ２処理部１６に取り出され、読み取り部１７
により読み取られる。読み取り部１７は、圧縮データに
桁上がりを示すマーク文字Ｃが出現した場合には、その
直後のデータをバイアス処理部１８に送る。また、マー
ク文字Ｃの出現の有無にかかわらず、余りのデータを加
算部１９に送り、バイアス処理部１８に通知する。

【００２１】たとえば本実施例における最初の圧縮デー
タは、桁上がりを示すマーク文字Ｃであるから、読み取
り部１７はその直後のデータ１を読み取り、バイアス処
理部１８に送る。次に、読み取り部１７は余りのデータ
６５を読み取り、加算部１９に送る。

【００２２】バイアス処理部１８は、読み取り部１７か
ら送られてきたデータが何番目のマーク文字の後のデー
タであるかをカウントする。カウント数に応じて、バイ
アスが算出され、加算部に送られる。カウント数は読み
取り部１７から余り読み取りの通知がくると０に初期化
される。

【００２３】本実施例では、バイアス処理部１８に１番
目に送られてきたデータに対しては２５５を乗算し、２
番目以降のｎ（ｎ＝２，３，．．．）番目のデータに対
しては２５５×２５６^(n-1)を乗算して加算部１９に送
る。したがって、本実施例では１番目に送られてきたデ
ータ１に２５５を掛けて得られた２５５が加算部１９に
送られる。

【００２４】加算部１９では、バイアス処理部１８から
送られてきたバイアス値を順次加算するとともに、読み
取り部１７から送られてくる余りを加算し、さらにその
前に復号され記憶部２３に記憶されている整数を読み出
して加算する。記憶部２３の初期値は０にされている。

【００２５】本実施例ではバイアス処理部１８から送ら
れてきた２５５と読み取り部１７から送られてきた６５
とを加算し、さらに記憶部２３の初期値０を加算して、
復号データ３２０を得る。得られた復号データは復元整
数列Ｄ３保持部２１に送られ、必要に応じて出力され
る。

【００２６】このように、

【数１】

【００２７】を定義すれば、ｎ個のマーク文字および剰
余が読み込まれた時、差分Ｄは、Ｄ＝Ｑ(0)または

【００２８】

【数２】

【００２９】として差分Ｄが復号でき、この差分Ｄを、
保持していた直前の復号された整数値に加えてもとの整
数値が復号できる。

【００３０】本実施例によれば、上記のように圧縮時に
昇順データを、すでに記憶された古い整数データと減算
を行い、減算により得られた差分を被除数として除算を
行いその余りを出力するとともに、その商を０と比較
し、０でない商についてはこれを被除数として除算を行
い、桁上がりマークとともに余りを出力し、商が０にな
るまでこの除算を繰り返し、後者の除算により得られる
桁上がりマーク、余り、前者の除算により得られる余り
を保存するようにしている。したがって、差分値を除算
し、得られたデータを保存するようにしているから、従
来の一般的な圧縮符号化方法に比べて計算量を大幅に節
約できるから、高速で圧縮および復号を行うことができ
る。また、統計量のようなデータ全体にわたるパラメー
タを必要としないため、データの追加や削除を容易に実
施することができる。

【００３１】本発明による圧縮および復号システムは、
各種の昇順に配列された整数列データの圧縮および復号
に適用できる。たとえば次のようなデータ検索システム
におけるデータの処理に適用できる。

【００３２】図２は、本発明が適用される一実施例を示
す近傍特徴量の抽出によるパターン検索システムのデー
タフロー図である。この検索システムでは、予め全対象
物件から事象（情報）の位相情報を全て捨象した近傍特
徴量データを作成し、そのデータ群に対して全物件検索
を行なう。検索のアルゴリズムは、学習ステップと検索
ステップとからなる。学習ステップでは、物件毎に近傍
特徴量行列が位相情報として作成される。図２では、検
索対象１０から近傍特徴量行列３０を作成し、それを構
造ファイル４０に保存するまでのステップに該当する。
また、検索ステップでは、検索キーに対して学習ステッ
プと同様の処理を行って検索キーの近傍特徴量が求めら
れ、物件の近傍特徴量行列とのマッチング演算が行なわ
れ、物件ごとにマッチング度（類似度）を示す評価結果
を得る。図２では、検索キー５０をもとに検索Ｓ４にて
構造ファイル４０の物件データとのマッチング演算を行
い、評価結果リスト７０あるいはソート済みリスト８０
のように結果を出力するまでのステップに該当する。以
下、各ステップについて説明する。

【００３３】（１）、学習ステップ図２に於いて、検索対象１０は、例えば日本語、英語、
ドイツ語、フランス語、ヘブライ語、ロシア語などの文
書データ、或いは量子化された波形数値データ、化学構
造式、遺伝子情報などである。このような検索対象に対
して、まず正規化手段Ｓ１により正規化の処理を行な
う。一般に検索対象は、情報の最小単位（文書であれば
アルファベットなどの文字、数値チャートであれば、あ
る時刻における実数値など）の列で表現されている。そ
れをなんらかの方法でｎ階調の整数列に変換する。これ
をデータの正規化と呼ぶ。

【００３４】例えば、英文書データの場合、ＡＳＣＩＩ
コード表をそのまま用いることにより、次のような２５
６階調の数値表現として実現される。 …… This is a pen. …… 84｜104｜105｜115｜32｜105｜115｜32｜97｜32｜112｜101｜110｜46｜

【００３５】上記のコードにおいては、Ｔが84、ｈが10
4．．と対応している。

【００３６】次に、正規化されたデータ２０から、学習
手段Ｓ２により近傍特徴量が算出され、以下に説明する
手順で近傍特徴量行列３０の形式に畳込まれる。ここで
近傍特徴量をとる演算式は種々考えられる。この演算式
は検索の鋭さ（過検出の少なさ）にも影響を与える。

【００３７】学習手段Ｓ２の一例として、正規化された
データ２０から量子化量を求め、この量子化量を用いて
近傍特徴量行列３０を得る手順を説明する。例えば図４
に示すように、検索される対象物件（文書）が複数ある
とし、そのうちのｉ番目の物件の量子化について考え
る。ここで、ｉ番目の物件（文書）のｊ番目のデータ
（文字）をＣ_i,jとし、Ｃ_i,jのｋ近傍に関するデータを
Ｃ_i,j+1,Ｃ_i,j+2,....,Ｃ_i,j+kとする。ｉ番目の物件に
おいて、図３に示すように正規化された数値列135,64,3
7,71,101,...が並んでいるとすると、Ｃ_i,jに関する量
子化量ｘおよびＣ_i,jの前方ｋ近傍に関する量子化量ｙ
は、ｘ＝f(Ｃ_i,j) ｙ＝g(Ｃ_i,j,Ｃ_i,j+1,Ｃ_i,j+2,....,Ｃ_i,j+k) …式（１）で求められる。

【００３８】ここで、f(Ｃ_i,j)はＣ_i,jに関するｎ段階
量子化関数である。すなわち、ｉ番目の物件のｊ番目の
データＣ_i,jについて所定の演算を行って得られる値で
あり、１〜ｎのいずれかの整数で表される。したがっ
て、このｎ段階量子化関数ｆの演算により得られた量子
化量ｘの値によって、図４に示す行列（座標）において
ｘ軸方向の位置が１〜ｎの範囲で定まる。

【００３９】また、g(Ｃ_i,j,Ｃ_i,j+1,Ｃ_i,j+2,....,Ｃ
_i,j+k)は、Ｃ_i,jの前方ｋ近傍に関するｍ段階量子化関
数である。すなわち、ｉ番目の物件のｊ番目のデータＣ
_i,jと、そのデータＣ_i,jの近傍の所定の数のデータＣ
_i,j+1,Ｃ_i,j+2,....,Ｃ_i,j+kとについて所定の演算を行
って得られる値であり、１〜ｍのいずれかの整数で表さ
れる。たとえば図３に示すようにｊ番目のデータＣ_i,j
が１３５であり、ｋが３の場合には、Ｃ_i,j+1,Ｃ_i,j+2,
Ｃ_i,j+3としてデータ１３５に続くデータ６４、３７、
７１を抽出し、これらのデータとデータ１３５との相関
について所定の演算を行う。ｊ番目のデータＣ_i,jが次
の６４の場合には、Ｃ_i,j+1,Ｃ_i,j+2,Ｃ_i,j+3としてデ
ータ６４に続くデータ３７、７１、１０１を抽出し、こ
れらのデータとデータ６４との相関について所定の演算
を行う。このようにしてｍ段階量子化関数ｇの演算によ
り得られた量子化量ｙの値によって、図４に示す行列
（座標）におけるｙ軸方向の位置が１〜ｍの範囲で定ま
る。

【００４０】したがって、上記のように正規化されたデ
ータ２０から量子化量ｘ、ｙを求めることによって図４
に示す行列（座標）における位置が定まる。量子化量を
求める演算式ｆ()、ｇ()としては種々あるが、例えば、 f: x→x g: (x,y)→x-y（または｜x-y｜） …式（２）のように、演算式ｆ()は入力された値をそのまま量子化
量とし、演算式ｇ()は入力された２つの値の差、或いは
差の絶対値を量子化量とする例が考えられる。この場
合、正規化されたデータ２０が先の例84｜104｜105｜11
5.....では、データＣ_i,jを84とすると、Ｃ_i,jとＣ_i,j
の前方ｋ近傍に関する量子化量ｘ，ｙの座標位置は、(8
4,20)、(84,21)、(84,31)、.....となる。また、この式
（２）以外にも、幾つかの文字列の個々の文字整数値に
対し四則演算を施すことにより近傍特徴量を取り出して
もよい。図３中に示した量子化量ｘ，ｙの座標位置(51,
71)、(32,103)、.....は、上記式（２）とは異なる手法
によって求めたものである。

【００４１】本システムでは、各物件情報は、上記のよ
うにして求めた量子化量ｘ、ｙに対して物件の通番ｉと
重みｗ（x,y,i）の組として記憶される。重みｗ（x,y,
i）は、データｘ、ｙ、ｉから所定の演算によって求め
られるが、通常は重みｗ（x,y,i）の値は１に固定して
もよい。

【００４２】上記のようにして各物件についてデータＣ
_i,jごとに求められた量子化量ｘ、ｙの値に基づき図４
に棒によって示されるように、データを記憶する。すな
わち、データＣ_i,jの量子化量ｘ、ｙの値によって定め
られる座標の位置に、その物件の通番ｉとその重みｗ
（x,y,i）を組みとしたデータを記憶する。同図ではこ
のようなデータが記憶されるごとに棒の長さが延びるよ
うに表されている。もし重みｗ（x,y,i）を１とした場
合には、物件の通番ｉのデータのみがｘ、ｙの値によっ
て定められる座標の位置に記憶されてゆく。物件の通番
ｉのデータが図１に示す整数列データＤ１のように昇順
に配列された整数データであれば、前述の方法による圧
縮および復号に適している。したがって、前述の圧縮を
行うことにより、高速でデータを圧縮し、データの記憶
容量を小さくすることができる。

【００４３】この様にして作成された近傍特徴量行列に
物件の識別番号を付加して構造ファイル４０として保存
する。

【００４４】（２）、検索ステップまず検索キー５０を入力する。例えば、"This is a pe
n."を検索キーとする。この検索キー５０に対して学習
ステップでの正規化手段Ｓ１と同一の正規化方法に基づ
く正規化手段Ｓ３によりキー情報を以下の整数列に正規
化する。 84｜104｜105｜115｜32｜105｜115｜32｜97｜32｜112｜101｜110｜46｜

【００４５】次に、検索手段Ｓ４において、学習ステッ
プでの学習手段Ｓ２と同一の自己相関計算式f()、g()を
用いて正規化された検索キー５０の数値列の先頭から量
子化量ｘ、ｙの組の系列を作成する。次に、この検索キ
ー５０の量子化量ｘ、ｙの組の系列に基づいて、構造フ
ァイル４０内から取り出した物件ｋに対する検索キー５
０の含有度数ω_kとして、Ｖ（ｘ_j,ｙ_j,ｋ）をｊ＝１〜
ｍについて合計することにより算出する。

【００４６】ただし、Ｖ（ｘ_j,ｙ_j,ｋ）は、構造ファイ
ル４０に記憶された物件ｉの重みに等しく、重みを持た
ない場合には０と定める。

【００４７】したがって、検索すべきキー５０の数値列
から求めた量子化量ｘ、ｙの組に対応する図４の量子化
量のｘ、ｙの位置にデータがある場合（棒がある場合）
には、別に設けられた記憶手段のそのデータに示される
物件の通番ｉの格納箇所にその重みの値を構造評価値sc
ore（合致度）として記憶させる。

【００４８】次に、評価結果出力手段Ｓ５において、構
造ファイル４０内の各物件毎に得られた構造評価値scor
e（合致度）を完全一致の場合の評価値（この場合は、
文字数−ｋ、）で割って、検索キー５０の含有確率を求
め、評価結果のリスト７０を得る。更にソート手段Ｓ６
において、このリスト７０を含有確率の降順にソートし
ソート済みリスト８０を得る。

【００４９】このソート済みリスト８０が検索結果であ
り、その上位物件を参照することにより、検索キーが物
件中に含まれている確率が高い物件名を知ることができ
る。含有確率は、完全一致及び不完全一致の全てについ
て求まるから、あいまい一致検索を行なうことができ
る。

【００５０】また、検索キーの全情報についての全物件
探索であるから、検索もれが発生する確率は、本質的に
零であると言う特徴がある。

【００５１】また、１つの物件に対する検索キーの評価
時間は、キーの文字数のみに依存し、物件の大きさには
依存しない。従って、非常に高速に検索を行なうことが
できる。

【００５２】また検索結果のリストどうしの論理演算を
行うことにより、検索条件に対するＡＮＤ、ＯＲなどの
検索演算処理も高速に実行できる。

【００５３】近傍特徴量は、各物件の全データを対象と
し取り出さなくてもよい。例えば、物件データ中の特定
の一つまたは一つ以上の整数値、特定の範囲の整数値、
或いはデータ列を構成する各バイト中の特定の１つまた
は一つ以上のビットを除外して近傍特徴量を捨象しても
よい。また日本語文書のように２バイト文字で構成され
ている場合には、例えば上位バイトを除外して下位バイ
トを対象として近傍特徴量を取り出してもよい。

【００５４】上述の例では、近傍特徴量によって生成さ
れる行列は、２５６次のビット行列であり、これは８Ｋ
バイトに相当する。従って、１物件のデータが１Ｋバイ
ト程度であるデータベースでは、効率のよいシステムで
あるとは言えない。そこで上記のようなデータ圧縮手段
Ｓ７を設けてデータ圧縮を行なって構造ファイル４０の
容量を減らすのがよい。

【００５５】上述の実施例において，正規化手段Ｓ１、
学習手段Ｓ２、正規化手段Ｓ３、検索手段Ｓ４、評価結
果出力手段Ｓ５、ソート手段Ｓ６、データ圧縮手段Ｓ７
は、コンピュータプログラムによって構成することがで
きるが、論理回路素子を用いて専用のハードウエアを構
成してもよい。

【００５６】

【発明の効果】このように本発明によれば、差分を計算
しこれを基にして圧縮することにより格納される最大数
を抑えるから、圧縮率の向上を図ることができるととも
に、従来の一般的な圧縮符号化方法に比べて計算量を大
幅に節約できる。従って、高速で圧縮および復号を行う
ことができる。また、統計量のようなデータ全体にわた
るパラメータを必要としないため、データの追加や削除
を容易に実施することができる。

【図面の簡単な説明】

【図１】本発明による圧縮復号システムの一実施例のデ
ータフロー図である。

【図２】本発明による圧縮復号システムを適用するデー
タベース検索システムのデータフロー図である。

【図３】近傍情報の量子化を示す図である。

【図４】記憶される情報構造を示す図である。

【符号の説明】

１０検索対象１１記憶部１２除算部１３商比較部１４除算部１５保存部１６圧縮数列Ｄ２処理部１７読み取り部１８バイアス処理部１９加算部２０正規化データ２１復元数列Ｄ３保持部２２減算部２３記憶部３０近傍特徴量行列４０構造ファイル５０検索キー６０正規化キー７０評価結果リスト８０ソート済みリストＳ１正規化手段Ｓ２学習手段Ｓ３正規化手段Ｓ４検索手段Ｓ５評価結果出力手段Ｓ６ソート手段Ｓ７データ圧縮手段

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭64−23623（ＪＰ，Ａ) 特開平４−326164（ＪＰ，Ａ) 特開平５−174067（ＪＰ，Ａ) 特開平５−181719（ＪＰ，Ａ) 特開平５−225238（ＪＰ，Ａ) 特開平５−225248（ＪＰ，Ａ) 特開平６−274193（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 5/00 G06F 17/30 H03M 7/18 G06F 12/00 511

Claims

(57)【特許請求の範囲】

【請求項１】昇順に配列された整数列データの圧縮お
よび復号システムにおいて、昇順に配列された整数列データのｎ番目のデータから、
第１の記憶手段に記憶されたｎ−１番目のデータの減算
を行うとともに、前記ｎ番目のデータを前記第１の記憶
手段に送る減算手段と、前記減算手段により得られた差分値を被除数として除算
を行い、商および余りを出力する第１の除算手段と、前記第１の除算手段により得られた商を０と比較する商
比較手段と、前記商比較手段による比較の結果０でない商を被除数と
して除算を行い、商および桁上がりマークとともに余り
を出力する第２の除算手段と、前記第２の除算手段から出力される桁上がりマークおよ
び余りを記憶するとともに、前記第１の除算手段から出
力される余りを記憶する第２の記憶手段と、前記第２の記憶手段に記憶された前記桁上がりマークお
よび２つの余りのデータから元の整数列データを復号す
る復号手段とを具備することを特徴とする昇順整数列デ
ータの圧縮および復号システム。
【請求項２】前記第２の除算手段は、前記商比較手段
から送られた０でない商を除算した場合に前記桁上がり
マークを出力することを特徴とする請求項１の昇順整数
列データの圧縮および復号システム。
【請求項３】検索対象の物件毎にその近傍特徴量を記
憶した第３の記憶手段と、検索キーの近傍特徴量と検索対象の上記近傍特徴量との
合致度からあいまい検索する検索手段とを具備し、前記第３の記憶手段に記憶されたデータに対して、前記
減算手段、第１及び第２の除算手段、商比較手段、並び
に第２の記憶手段を用いてデータ圧縮することを特徴と
する請求項１の昇順整数列データの圧縮および復号シス
テム。
【請求項４】検索対象のｉ番目の物件のｊ番目のデー
タ列Ｃ_i,jに関する量子化量ｘとその近傍のｋ個のデー
タ列Ｃ_i,j+1,Ｃ_i,j+2,....,Ｃ_i,j+kに関する量子化量ｙ
とをｘ＝f(Ｃ_i,j) ｙ＝g(Ｃ_i,j,Ｃ_i,j+1,Ｃ_i,j+2,....,Ｃ_i,j+k) によって求め、得られたｘ、ｙの値に基づいて定められ
る前記第３の記憶手段の位置にその物件の通番ｉを記憶
するデータベース検索に用いられることを特徴とする請
求項３の昇順整数列データの圧縮および復号システム。