JP3344755B2 - 昇順整数列データの圧縮および復号システム - Google Patents

昇順整数列データの圧縮および復号システム

Info

Publication number
JP3344755B2
JP3344755B2 JP07093793A JP7093793A JP3344755B2 JP 3344755 B2 JP3344755 B2 JP 3344755B2 JP 07093793 A JP07093793 A JP 07093793A JP 7093793 A JP7093793 A JP 7093793A JP 3344755 B2 JP3344755 B2 JP 3344755B2
Authority
JP
Japan
Prior art keywords
data
quotient
decoding
remainder
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07093793A
Other languages
English (en)
Other versions
JPH06259222A (ja
Inventor
克信 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Original Assignee
NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp filed Critical NS Solutions Corp
Priority to JP07093793A priority Critical patent/JP3344755B2/ja
Publication of JPH06259222A publication Critical patent/JPH06259222A/ja
Application granted granted Critical
Publication of JP3344755B2 publication Critical patent/JP3344755B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、単調増加的に配列され
た昇順整数列データの圧縮および復号システムに関し、
特にデータベースから必要な情報を取り出すためのデー
タベース検索システムにおいて検索されるデータが単調
増加的に配列された整数列データである場合のそのデー
タの圧縮および復号システムに関する。
【0002】
【従来の技術】従来、データを圧縮および復号する方法
の代表的なものとしては、ハフマン法、シャノン・ファ
ノ法、ギルバート・ムーア法、ランレングス符号化法な
どが知られている。たとえばハフマン法を用いたものと
しては特開平2−78323号などが挙げられる。
【0003】
【発明が解決しようとする課題】これらの方法は主とし
て、データの文字ごとの出現頻度を測定し、頻度の高い
ものから優先的にデータのサイズを圧縮するものであ
る。これらの方法は、任意の形態のデータに適用できる
利点がある反面、圧縮、復号に数段階の処理を必要とす
るため、特に速度が要求される際には不向きである。
【0004】本発明は、上記のような問題に鑑み、単調
増加的(昇順)に配列された整数列データを高速で圧縮
するとともに、圧縮されたデータを記憶する記憶手段の
容量を小さくすることのできる圧縮および復号システム
を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明の圧縮および復号
システムは、昇順に配列された整数列データの圧縮およ
び復号において、昇順に配列された整数列データのn番
目のデータから、第1の記憶手段に記憶されたn−1番
目のデータの減算を行うとともに、n番目のデータを第
1の記憶手段に送る減算手段と、減算手段により得られ
た差分値を被除数として除算を行い、商および余りを出
力する第1の除算手段と、第1の除算手段により得られ
た商を0と比較する商比較手段と、商比較手段による比
較の結果0でない商を被除数として除算を行い、商およ
び桁上がりマークとともに余りを出力する第2の除算手
段と、第2の除算手段から出力される桁上がりマークお
よび余りを記憶するとともに、第1の除算手段から出力
される余りを記憶する第2の記憶手段と、第2の記憶手
段に記憶された桁上がりマークおよび2つの余りのデー
タから元の整数列データを復号する復号手段とを具備す
る。
【0006】
【作用】本発明によれば、圧縮時に昇順データを、すで
に記憶された古い整数データと減算を行い、減算により
得られた差分を被除数として除算を行いその余りを出力
するとともに、その商を0と比較し、0でない商につい
てはこれを被除数として除算を行い、桁上がりマークと
ともに余りを出力し、商が0になるまでこの除算を繰り
返し、後者の除算により得られる桁上がりマーク、余
り、前者の除算により得られる余りを保存するようにし
ている。したがって、差分値を除算し、得られたデータ
を保存するようにしているから、従来の一般的な圧縮符
号化方法に比べて計算量を大幅に節約でき、高速で圧縮
および復号を行うことができる。また、統計量のような
データ全体にわたるパラメータを必要としないため、デ
ータの追加や削除を容易に実施することができる。
【0007】
【実施例】図1には、本発明によるシステムの一実施例
が示されている。同図に示すように、昇順整数列データ
D1は320、333、401...と、単調増加的
(昇順)に配列されている。これらのデータはたとえば
32ビットで表される。整数列データD1は圧縮装置に
おいて、減算部22に送られる。減算部22はそのデー
タの前に送られているデータの整数値によって減算を行
うとともに、今回送られた整数値を記憶部11に送る。
すなわち、記憶部11には、今回送られてきたデータの
直前に送られているデータが記憶されているから、これ
が減算部22に読み出され、減算部22は今回送られて
きたデータから直前に送られているデータを減算し、そ
の減算結果を除算部12に送る。
【0008】減算部22はこの減算を行うとともに、今
回送られてきたデータを記憶部11に送る。記憶部11
には、減算部22から送られた最新のデータが記憶され
る。なお、記憶部11の初期値は0とする。
【0009】除算部12は減算部22から送られた減算
データを所定の値で除算する。本実施例では入力された
減算データを255で割る。得られた商は商比較部13
に送られ、余りは圧縮数列D2処理部16に送られる。
【0010】商比較部13は入力された商を0と比較
し、商が0でない場合にはこれを除算部14へ送る。商
が0である場合には除算部14へ何らデータを送らず、
昇順整数列データD1の次のデータを減算部22へ入力
するよう指示を与える。除算部14は、商比較部13か
ら入力された商を所定の値、本実施例では256で除算
し、得られた商は再び商比較部13に送られ、余りは桁
上がりを示すマーク文字Cとともに圧縮数列D2処理部
16へ送られる。商比較部13に送られた商が0と判定
されるまで除算部14での除算が繰り返される。
【0011】以上のようにして昇順整数列データの圧縮
処理が行われ、圧縮されたデータ列が圧縮数列処理部1
6に記憶される。
【0012】次に具体的な例により説明する。最初のデ
ータ320が減算部22に送られると、記憶部11に記
憶された初期値が0であるから、320から0が減算さ
れ、差分値は320となり、除算部12に送られる。除
算部12では差分値320を255で除算し、商1、余
り65が得られる。商比較部13は入力された商を0と
比較し、商が0でないため、除算部14に商1が送られ
る。除算部14で商1が256によって除算され、商
0、余り1となるから、除算部14は桁上がりマークC
とともに余り1を圧縮数列処理部16に送り、次の整数
値を読むように通知する。
【0013】圧縮数列処理部16は、除算部14から送
られた桁上がりマーク文字Cと余り1および除算部12
から送られた余り65を記憶する。
【0014】次に整数列データD1からデータ333が
送られると、減算部22は333を記憶部11に記憶さ
れていた320で減算し、差分13を得る。差分13は
除算部12に送られ、除算部12は255で除算し、商
0、余り13を得る。商0は商比較部13に送られ、商
比較部13は商0が判定され、整数列D1から次の整数
値を読み込むように指示が出される。この場合には商比
較部13で商0が判定されているから、圧縮数列処理部
16には除算部12から送られた余り13のみが送ら
れ、記憶される。
【0015】同様の動作が繰り返されることにより、圧
縮されたデータが圧縮数列D2処理部16に順次送られ
る。これらの圧縮データは保存部15に記憶される。
【0016】このように圧縮処理は、昇順整数列の先頭
から順に数列の差分Dを算出し、これを定数L(0)で割
った商P(0)、剰余Q(0)を求め、商P(0)が0である場
合には、剰余Q(0)のみを記憶手段に格納し、0でない
場合には、商P(0)をさらに定数L(1)で割り、商P
(1)、剰余Q(1)を算出する。その後、この商P(i)(i=1,
2,...)が0になるまで、直前に算出された商P(i-1)を
被除数として除算を繰り返す。
【0017】漸化式で表すと D=L(0)×P(0)+Q(0) P(i-1)=L(i)×P(i)+Q(i)(i=1,2,...) この時、1つの差分値Dに対して以下のように数値が格
納される。 P(0)=0の場合、 Q(0)のみ P(n)=0(n>1)の場合、 C、Q(1)、C、Q(2)、...C、Q(n)、Q(0) ただし、CはQ(0)と区別可能なマーク文字である。ま
た、上記整数列の先頭の値については、その値自身を差
分値とする。除数L(i)は予め定義しておく。
【0018】L(i)を大きく設定すれば、除算の結果、
商が0になる場合が増加し、演算コストを下げることが
できる。逆にL(i)を小さく設定すれば、除算の回数が
増加し、演算コストが上がるが余りを小さくおさえるこ
とができ、記憶領域を小さくすることができる。
【0019】次に復号においては、直前に復号された数
値を保存しておき、これを利用する。最初の整数値に対
してはあらかじめ保持された値として0を用いる。
【0020】まず保存部15に記憶された圧縮データが
圧縮数列D2処理部16に取り出され、読み取り部17
により読み取られる。読み取り部17は、圧縮データに
桁上がりを示すマーク文字Cが出現した場合には、その
直後のデータをバイアス処理部18に送る。また、マー
ク文字Cの出現の有無にかかわらず、余りのデータを加
算部19に送り、バイアス処理部18に通知する。
【0021】たとえば本実施例における最初の圧縮デー
タは、桁上がりを示すマーク文字Cであるから、読み取
り部17はその直後のデータ1を読み取り、バイアス処
理部18に送る。次に、読み取り部17は余りのデータ
65を読み取り、加算部19に送る。
【0022】バイアス処理部18は、読み取り部17か
ら送られてきたデータが何番目のマーク文字の後のデー
タであるかをカウントする。カウント数に応じて、バイ
アスが算出され、加算部に送られる。カウント数は読み
取り部17から余り読み取りの通知がくると0に初期化
される。
【0023】本実施例では、バイアス処理部18に1番
目に送られてきたデータに対しては255を乗算し、2
番目以降のn(n=2,3,...)番目のデータに対
しては255×256(n-1)を乗算して加算部19に送
る。したがって、本実施例では1番目に送られてきたデ
ータ1に255を掛けて得られた255が加算部19に
送られる。
【0024】加算部19では、バイアス処理部18から
送られてきたバイアス値を順次加算するとともに、読み
取り部17から送られてくる余りを加算し、さらにその
前に復号され記憶部23に記憶されている整数を読み出
して加算する。記憶部23の初期値は0にされている。
【0025】本実施例ではバイアス処理部18から送ら
れてきた255と読み取り部17から送られてきた65
とを加算し、さらに記憶部23の初期値0を加算して、
復号データ320を得る。得られた復号データは復元整
数列D3保持部21に送られ、必要に応じて出力され
る。
【0026】このように、
【数1】
【0027】を定義すれば、n個のマーク文字および剰
余が読み込まれた時、差分Dは、D=Q(0)または
【0028】
【数2】
【0029】として差分Dが復号でき、この差分Dを、
保持していた直前の復号された整数値に加えてもとの整
数値が復号できる。
【0030】本実施例によれば、上記のように圧縮時に
昇順データを、すでに記憶された古い整数データと減算
を行い、減算により得られた差分を被除数として除算を
行いその余りを出力するとともに、その商を0と比較
し、0でない商についてはこれを被除数として除算を行
い、桁上がりマークとともに余りを出力し、商が0にな
るまでこの除算を繰り返し、後者の除算により得られる
桁上がりマーク、余り、前者の除算により得られる余り
を保存するようにしている。したがって、差分値を除算
し、得られたデータを保存するようにしているから、従
来の一般的な圧縮符号化方法に比べて計算量を大幅に節
約できるから、高速で圧縮および復号を行うことができ
る。また、統計量のようなデータ全体にわたるパラメー
タを必要としないため、データの追加や削除を容易に実
施することができる。
【0031】本発明による圧縮および復号システムは、
各種の昇順に配列された整数列データの圧縮および復号
に適用できる。たとえば次のようなデータ検索システム
におけるデータの処理に適用できる。
【0032】図2は、本発明が適用される一実施例を示
す近傍特徴量の抽出によるパターン検索システムのデー
タフロー図である。この検索システムでは、予め全対象
物件から事象(情報)の位相情報を全て捨象した近傍特
徴量データを作成し、そのデータ群に対して全物件検索
を行なう。検索のアルゴリズムは、学習ステップと検索
ステップとからなる。学習ステップでは、物件毎に近傍
特徴量行列が位相情報として作成される。図2では、検
索対象10から近傍特徴量行列30を作成し、それを構
造ファイル40に保存するまでのステップに該当する。
また、検索ステップでは、検索キーに対して学習ステッ
プと同様の処理を行って検索キーの近傍特徴量が求めら
れ、物件の近傍特徴量行列とのマッチング演算が行なわ
れ、物件ごとにマッチング度(類似度)を示す評価結果
を得る。図2では、検索キー50をもとに検索S4にて
構造ファイル40の物件データとのマッチング演算を行
い、評価結果リスト70あるいはソート済みリスト80
のように結果を出力するまでのステップに該当する。以
下、各ステップについて説明する。
【0033】(1)、学習ステップ 図2に於いて、検索対象10は、例えば日本語、英語、
ドイツ語、フランス語、ヘブライ語、ロシア語などの文
書データ、或いは量子化された波形数値データ、化学構
造式、遺伝子情報などである。このような検索対象に対
して、まず正規化手段S1により正規化の処理を行な
う。一般に検索対象は、情報の最小単位(文書であれば
アルファベットなどの文字、数値チャートであれば、あ
る時刻における実数値など)の列で表現されている。そ
れをなんらかの方法でn階調の整数列に変換する。これ
をデータの正規化と呼ぶ。
【0034】例えば、英文書データの場合、ASCII
コード表をそのまま用いることにより、次のような25
6階調の数値表現として実現される。 …… This is a pen. …… 84|104|105|115|32|105|115|32|97|32|112|101|110|46|
【0035】上記のコードにおいては、Tが84、hが10
4..と対応している。
【0036】次に、正規化されたデータ20から、学習
手段S2により近傍特徴量が算出され、以下に説明する
手順で近傍特徴量行列30の形式に畳込まれる。ここで
近傍特徴量をとる演算式は種々考えられる。この演算式
は検索の鋭さ(過検出の少なさ)にも影響を与える。
【0037】学習手段S2の一例として、正規化された
データ20から量子化量を求め、この量子化量を用いて
近傍特徴量行列30を得る手順を説明する。例えば図4
に示すように、検索される対象物件(文書)が複数ある
とし、そのうちのi番目の物件の量子化について考え
る。ここで、i番目の物件(文書)のj番目のデータ
(文字)をCi,jとし、Ci,jのk近傍に関するデータを
i,j+1,Ci,j+2,....,Ci,j+kとする。i番目の物件に
おいて、図3に示すように正規化された数値列135,64,3
7,71,101,...が並んでいるとすると、Ci,jに関する量
子化量xおよびCi,jの前方k近傍に関する量子化量y
は、 x=f(Ci,j) y=g(Ci,j,Ci,j+1,Ci,j+2,....,Ci,j+k) …式(1) で求められる。
【0038】ここで、f(Ci,j)はCi,jに関するn段階
量子化関数である。すなわち、i番目の物件のj番目の
データCi,jについて所定の演算を行って得られる値で
あり、1〜nのいずれかの整数で表される。したがっ
て、このn段階量子化関数fの演算により得られた量子
化量xの値によって、図4に示す行列(座標)において
x軸方向の位置が1〜nの範囲で定まる。
【0039】また、g(Ci,j,Ci,j+1,Ci,j+2,....,C
i,j+k)は、Ci,jの前方k近傍に関するm段階量子化関
数である。すなわち、i番目の物件のj番目のデータC
i,jと、そのデータCi,jの近傍の所定の数のデータC
i,j+1,Ci,j+2,....,Ci,j+kとについて所定の演算を行
って得られる値であり、1〜mのいずれかの整数で表さ
れる。たとえば図3に示すようにj番目のデータCi,j
が135であり、kが3の場合には、Ci,j+1,Ci,j+2,
i,j+3としてデータ135に続くデータ64、37、
71を抽出し、これらのデータとデータ135との相関
について所定の演算を行う。j番目のデータCi,jが次
の64の場合には、Ci,j+1,Ci,j+2,Ci,j+3としてデ
ータ64に続くデータ37、71、101を抽出し、こ
れらのデータとデータ64との相関について所定の演算
を行う。このようにしてm段階量子化関数gの演算によ
り得られた量子化量yの値によって、図4に示す行列
(座標)におけるy軸方向の位置が1〜mの範囲で定ま
る。
【0040】したがって、上記のように正規化されたデ
ータ20から量子化量x、yを求めることによって図4
に示す行列(座標)における位置が定まる。量子化量を
求める演算式f()、g()としては種々あるが、例えば、 f: x→x g: (x,y)→x-y(または|x-y|) …式(2) のように、演算式f()は入力された値をそのまま量子化
量とし、演算式g()は入力された2つの値の差、或いは
差の絶対値を量子化量とする例が考えられる。この場
合、正規化されたデータ20が先の例84|104|105|11
5.....では、データCi,jを84とすると、Ci,jとCi,j
の前方k近傍に関する量子化量x,yの座標位置は、(8
4,20)、(84,21)、(84,31)、.....となる。また、この式
(2)以外にも、幾つかの文字列の個々の文字整数値に
対し四則演算を施すことにより近傍特徴量を取り出して
もよい。図3中に示した量子化量x,yの座標位置(51,
71)、(32,103)、.....は、上記式(2)とは異なる手法
によって求めたものである。
【0041】本システムでは、各物件情報は、上記のよ
うにして求めた量子化量x、yに対して物件の通番iと
重みw(x,y,i)の組として記憶される。重みw(x,y,
i)は、データx、y、iから所定の演算によって求め
られるが、通常は重みw(x,y,i)の値は1に固定して
もよい。
【0042】上記のようにして各物件についてデータC
i,jごとに求められた量子化量x、yの値に基づき図4
に棒によって示されるように、データを記憶する。すな
わち、データCi,jの量子化量x、yの値によって定め
られる座標の位置に、その物件の通番iとその重みw
(x,y,i)を組みとしたデータを記憶する。同図ではこ
のようなデータが記憶されるごとに棒の長さが延びるよ
うに表されている。もし重みw(x,y,i)を1とした場
合には、物件の通番iのデータのみがx、yの値によっ
て定められる座標の位置に記憶されてゆく。物件の通番
iのデータが図1に示す整数列データD1のように昇順
に配列された整数データであれば、前述の方法による圧
縮および復号に適している。したがって、前述の圧縮を
行うことにより、高速でデータを圧縮し、データの記憶
容量を小さくすることができる。
【0043】この様にして作成された近傍特徴量行列に
物件の識別番号を付加して構造ファイル40として保存
する。
【0044】(2)、検索ステップ まず検索キー50を入力する。例えば、"This is a pe
n."を検索キーとする。この検索キー50に対して学習
ステップでの正規化手段S1と同一の正規化方法に基づ
く正規化手段S3によりキー情報を以下の整数列に正規
化する。 84|104|105|115|32|105|115|32|97|32|112|101|110|46|
【0045】次に、検索手段S4において、学習ステッ
プでの学習手段S2と同一の自己相関計算式f()、g()を
用いて正規化された検索キー50の数値列の先頭から量
子化量x、yの組の系列を作成する。次に、この検索キ
ー50の量子化量x、yの組の系列に基づいて、構造フ
ァイル40内から取り出した物件kに対する検索キー5
0の含有度数ωkとして、V(xj,yj,k)をj=1〜
mについて合計することにより算出する。
【0046】ただし、V(xj,yj,k)は、構造ファイ
ル40に記憶された物件iの重みに等しく、重みを持た
ない場合には0と定める。
【0047】したがって、検索すべきキー50の数値列
から求めた量子化量x、yの組に対応する図4の量子化
量のx、yの位置にデータがある場合(棒がある場合)
には、別に設けられた記憶手段のそのデータに示される
物件の通番iの格納箇所にその重みの値を構造評価値sc
ore(合致度)として記憶させる。
【0048】次に、評価結果出力手段S5において、構
造ファイル40内の各物件毎に得られた構造評価値scor
e(合致度)を完全一致の場合の評価値(この場合は、
文字数−k、)で割って、検索キー50の含有確率を求
め、評価結果のリスト70を得る。更にソート手段S6
において、このリスト70を含有確率の降順にソートし
ソート済みリスト80を得る。
【0049】このソート済みリスト80が検索結果であ
り、その上位物件を参照することにより、検索キーが物
件中に含まれている確率が高い物件名を知ることができ
る。含有確率は、完全一致及び不完全一致の全てについ
て求まるから、あいまい一致検索を行なうことができ
る。
【0050】また、検索キーの全情報についての全物件
探索であるから、検索もれが発生する確率は、本質的に
零であると言う特徴がある。
【0051】また、1つの物件に対する検索キーの評価
時間は、キーの文字数のみに依存し、物件の大きさには
依存しない。従って、非常に高速に検索を行なうことが
できる。
【0052】また検索結果のリストどうしの論理演算を
行うことにより、検索条件に対するAND、ORなどの
検索演算処理も高速に実行できる。
【0053】近傍特徴量は、各物件の全データを対象と
し取り出さなくてもよい。例えば、物件データ中の特定
の一つまたは一つ以上の整数値、特定の範囲の整数値、
或いはデータ列を構成する各バイト中の特定の1つまた
は一つ以上のビットを除外して近傍特徴量を捨象しても
よい。また日本語文書のように2バイト文字で構成され
ている場合には、例えば上位バイトを除外して下位バイ
トを対象として近傍特徴量を取り出してもよい。
【0054】上述の例では、近傍特徴量によって生成さ
れる行列は、256次のビット行列であり、これは8K
バイトに相当する。従って、1物件のデータが1Kバイ
ト程度であるデータベースでは、効率のよいシステムで
あるとは言えない。そこで上記のようなデータ圧縮手段
S7を設けてデータ圧縮を行なって構造ファイル40の
容量を減らすのがよい。
【0055】上述の実施例において,正規化手段S1、
学習手段S2、正規化手段S3、検索手段S4、評価結
果出力手段S5、ソート手段S6、データ圧縮手段S7
は、コンピュータプログラムによって構成することがで
きるが、論理回路素子を用いて専用のハードウエアを構
成してもよい。
【0056】
【発明の効果】このように本発明によれば、差分を計算
しこれを基にして圧縮することにより格納される最大数
を抑えるから、圧縮率の向上を図ることができるととも
に、従来の一般的な圧縮符号化方法に比べて計算量を大
幅に節約できる。従って、高速で圧縮および復号を行う
ことができる。また、統計量のようなデータ全体にわた
るパラメータを必要としないため、データの追加や削除
を容易に実施することができる。
【図面の簡単な説明】
【図1】本発明による圧縮復号システムの一実施例のデ
ータフロー図である。
【図2】本発明による圧縮復号システムを適用するデー
タベース検索システムのデータフロー図である。
【図3】近傍情報の量子化を示す図である。
【図4】記憶される情報構造を示す図である。
【符号の説明】
10 検索対象 11 記憶部 12 除算部 13 商比較部 14 除算部 15 保存部 16 圧縮数列D2処理部 17 読み取り部 18 バイアス処理部 19 加算部 20 正規化データ 21 復元数列D3保持部 22 減算部 23 記憶部 30 近傍特徴量行列 40 構造ファイル 50 検索キー 60 正規化キー 70 評価結果リスト 80 ソート済みリスト S1 正規化手段 S2 学習手段 S3 正規化手段 S4 検索手段 S5 評価結果出力手段 S6 ソート手段 S7 データ圧縮手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭64−23623(JP,A) 特開 平4−326164(JP,A) 特開 平5−174067(JP,A) 特開 平5−181719(JP,A) 特開 平5−225238(JP,A) 特開 平5−225248(JP,A) 特開 平6−274193(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 5/00 G06F 17/30 H03M 7/18 G06F 12/00 511

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 昇順に配列された整数列データの圧縮お
    よび復号システムにおいて、 昇順に配列された整数列データのn番目のデータから、
    第1の記憶手段に記憶されたn−1番目のデータの減算
    を行うとともに、前記n番目のデータを前記第1の記憶
    手段に送る減算手段と、 前記減算手段により得られた差分値を被除数として除算
    を行い、商および余りを出力する第1の除算手段と、 前記第1の除算手段により得られた商を0と比較する商
    比較手段と、 前記商比較手段による比較の結果0でない商を被除数と
    して除算を行い、商および桁上がりマークとともに余り
    を出力する第2の除算手段と、 前記第2の除算手段から出力される桁上がりマークおよ
    び余りを記憶するとともに、前記第1の除算手段から出
    力される余りを記憶する第2の記憶手段と、 前記第2の記憶手段に記憶された前記桁上がりマークお
    よび2つの余りのデータから元の整数列データを復号す
    る復号手段とを具備することを特徴とする昇順整数列デ
    ータの圧縮および復号システム。
  2. 【請求項2】 前記第2の除算手段は、前記商比較手段
    から送られた0でない商を除算した場合に前記桁上がり
    マークを出力することを特徴とする請求項1の昇順整数
    列データの圧縮および復号システム。
  3. 【請求項3】 検索対象の物件毎にその近傍特徴量を記
    憶した第3の記憶手段と、 検索キーの近傍特徴量と検索対象の上記近傍特徴量との
    合致度からあいまい検索する検索手段とを具備し、 前記第3の記憶手段に記憶されたデータに対して、前記
    減算手段、第1及び第2の除算手段、商比較手段、並び
    第2の記憶手段を用いてデータ圧縮することを特徴と
    する請求項1の昇順整数列データの圧縮および復号シス
    テム。
  4. 【請求項4】 検索対象のi番目の物件のj番目のデー
    タ列Ci,jに関する量子化量xとその近傍のk個のデー
    タ列Ci,j+1,Ci,j+2,....,Ci,j+kに関する量子化量y
    とを x=f(Ci,j) y=g(Ci,j,Ci,j+1,Ci,j+2,....,Ci,j+k) によって求め、得られたx、yの値に基づいて定められ
    前記第3の記憶手段の位置にその物件の通番iを記憶
    するデータベース検索に用いられることを特徴とする請
    求項3の昇順整数列データの圧縮および復号システム。
JP07093793A 1993-03-05 1993-03-05 昇順整数列データの圧縮および復号システム Expired - Fee Related JP3344755B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07093793A JP3344755B2 (ja) 1993-03-05 1993-03-05 昇順整数列データの圧縮および復号システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07093793A JP3344755B2 (ja) 1993-03-05 1993-03-05 昇順整数列データの圧縮および復号システム

Publications (2)

Publication Number Publication Date
JPH06259222A JPH06259222A (ja) 1994-09-16
JP3344755B2 true JP3344755B2 (ja) 2002-11-18

Family

ID=13445922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07093793A Expired - Fee Related JP3344755B2 (ja) 1993-03-05 1993-03-05 昇順整数列データの圧縮および復号システム

Country Status (1)

Country Link
JP (1) JP3344755B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4987912B2 (ja) * 2009-06-02 2012-08-01 株式会社東芝 データ圧縮装置、データ伸長装置、データ圧縮方法及びデータ伸長方法

Also Published As

Publication number Publication date
JPH06259222A (ja) 1994-09-16

Similar Documents

Publication Publication Date Title
EP0510634B1 (en) Data base retrieval system
EP0293161B1 (en) Character processing system with spelling check function
US20100131476A1 (en) Computer product, information retrieval method, and information retrieval apparatus
US20160321282A1 (en) Extracting method, information processing method, computer product, extracting apparatus, and information processing apparatus
US20080319987A1 (en) System, method and program for creating index for database
JPH07244671A (ja) 文書検索装置
WO2004062110A1 (ja) データ圧縮方法、プログラム及び装置
JP2833580B2 (ja) 全文インデックス作成装置および全文データベース検索装置
US5347652A (en) Method and apparatus for saving and retrieving functional results
JP3258063B2 (ja) データベース検索システム及び方法
JP3333549B2 (ja) 文書検索方式
JPH09245043A (ja) 情報検索装置
JP3545007B2 (ja) データベース検索システム
JP3151730B2 (ja) データベース検索システム
JP3344755B2 (ja) 昇順整数列データの圧縮および復号システム
JP2993540B2 (ja) 昇順整数列データの圧縮および復号システム
US7433880B2 (en) Method and system for high speed encoding, processing and decoding of data
JP4208326B2 (ja) 情報索引装置
JP3288063B2 (ja) 可変長データの格納および参照システム
JP3259781B2 (ja) データベース検索システムおよびデータベース検索方法
JP2993539B2 (ja) データベース検索システムおよびその方法
US6526401B1 (en) Device for processing strings
JPH0554077A (ja) 単語辞書検索装置
JPH06162096A (ja) レコード検索方法
JP3019286B2 (ja) 文書検索装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020723

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees