JP2588261B2 - Ocrによる住所データベース検索装置 - Google Patents

Ocrによる住所データベース検索装置

Info

Publication number
JP2588261B2
JP2588261B2 JP63300746A JP30074688A JP2588261B2 JP 2588261 B2 JP2588261 B2 JP 2588261B2 JP 63300746 A JP63300746 A JP 63300746A JP 30074688 A JP30074688 A JP 30074688A JP 2588261 B2 JP2588261 B2 JP 2588261B2
Authority
JP
Japan
Prior art keywords
keyword
search
address
keywords
state name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63300746A
Other languages
English (en)
Other versions
JPH02148174A (ja
Inventor
悦生 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP63300746A priority Critical patent/JP2588261B2/ja
Publication of JPH02148174A publication Critical patent/JPH02148174A/ja
Application granted granted Critical
Publication of JP2588261B2 publication Critical patent/JP2588261B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、各々複数のキーワードを有する複数のデー
タの中から入力された所望のキーワードに対応するデー
タを検索するデータ検索装置に関する。
特に欧文住所情報をキーワードとしてデータベースの
検索を行うOCRによる住所データベース検索装置に関す
る。
(従来の技術) この種のデータ検索装置は、各キーワードに対応して
データを記憶したテーブルを有し、入力されたキーワー
ドと一致するキーワードを前記テーブルに記憶されたす
べてのキーワードの中から検索し、この検索したキーワ
ードに対応するデータを出力するようになっている。各
データを識別するためのキーワードは、各データに対し
て1つのみ存在するのでなく、通常は各データに対して
複数のキーワードが存在する。例えば、英文レターの住
所において、米国の州であるニューヨーク州に対するキ
ーワードとしては、例えば正式名の「NY」、フルスペル
の「New York」、または省略形の「N.Y.」等のように複
数の変形したキーワードが存在するため、この複数のキ
ーワード毎にニューヨークとしてデータを記憶すること
が必要である。
このように各データに対してそれぞれ複数のキーワー
ドが存在するために、入力されたキーワードと一致する
キーワードを検索する動作は、各データに対して複数存
在するすべてのキーワードに対して行う必要があるた
め、その検索時間は、全データ数に比較して複数存在す
るキーワードの数倍となる。
(発明が解決しようとする課題) 上述したように、各データに対してそれぞれ複数のキ
ーワードが存在する場合、検索動作は従来すべてのキー
ワードに対して行う必要があるため、検索時間が大幅に
かかるという問題がある。
本発明は、上記に鑑みてなされたもので、その目的と
するところは、検索を短時間で効率的に行うことができ
るOCRによる住所データベース検索装置を提供すること
にある。
[発明の構成] (課題を解決するための手段) 上記目的を達成するため、本発明のOCRによる住所デ
ータベース検索装置は、郵便物の欧文住所のOCRによる
文字認識結果に基づいて住所情報をキーワードとしてデ
ータベースの検索を行うものであって、州の名称を表す
キーワードを2文字の正式名である「標準州名検索テ
ーブル」、3文字以上の「フルスペル州名検索テーブ
ル」、1文字の組合わせの省略形である「省略形州名
検索テーブル」に分類して記憶しておくキーワード分類
記憶手段と、前記OCRによる文字認識の結果入力された
前記州の名称を表すキーワードの文字列から文字数が、
2文字であるか、3文字以上であるか、あるいは1文字
の組合わせであるかを判断する州名検索テーブル判断手
段と、この判断手段で判断された一つの前記州名検索テ
ーブルに記憶されているキーワードの中から前記入力さ
れたキーワードに一致するキーワードを検索し、この検
索したキーワードに対応する住所データを出力する検索
手段とを有することを要旨とする。
(作用) 本発明のデータ検索装置では、複数のキーワードをキ
ーワード分類情報毎に分類して記憶するとともに、入力
されたキーワードに対応するキーワード分類情報を決定
し、この決定されたキーワード分類情報に対応して記憶
されているキーワードの中から一致するキーワードを検
索している。
(実施例) 以下、図面を用いて本発明の実施例を説明する。
第1図は本発明の一実施例に係わるデータ検索装置に
使用されるキーワード情報テーブル1、検索テーブル3a
〜3nおよびデータテーブル5を示す説明図である。キー
ワード情報テーブル1は、入力されたキーワードをキー
ワード分類情報のいずれに該当するかを決定するための
キーワード分類情報を記憶しているテーブルであり、こ
のキーワード分類情報は分類したキーワードのすべてに
対して共通な情報である。例えば、このキーワード情報
テーブル1に記憶されるキーワード分離情報は、各キー
ワードを特徴づける情報であり、キーワードの総文字
数、文字の種類、例えば大文字、小文字、数字、特殊文
字、漢字、仮名文字等またはキーワード中の共通文字
列、例えばキーワードの先頭の文字が「A」で始まる共
通文字列等の情報である。これは通常データベースでは
ある程度似た性質のキーワードを用いていることが多
く、検索テーブルを作成する時に容易にこのような情報
を抽出することができる。
キーワード情報テーブル1に記憶されたキーワード分
類情報に各々に対応して検索テーブル3a〜3nがそれぞれ
設けられている。すなわち、検索テーブル3aは、キーワ
ード情報テーブル1の最初に記憶されているキーワード
分類情報によって分類された各キーワードが記憶され、
この各キーワードに対応するデータのアドレスを示すポ
インタが各キーワードに対応して右側に示されている。
また、検索テーブル3bは、キーワード情報テーブル1の
二番目に記憶されているキーワード分類情報によって分
類された各キーワードおよび対応するポインタが記憶さ
れ、以下同様にして検索テーブル3nは、キーワード情報
テーブル1の第n番目に記憶されているキーワード分類
情報によって分類された各キーワードおよび対応するポ
インタが記憶されている。
また、各検索テーブル3a〜3nに記憶されているポイン
タはそれぞれデータテーブル5に記憶されている各デー
タのアドレスを示しており、このアドレスのデータを読
み出すことにより検索したキーワードに対するデータを
得ることができるのである。
第2図は第1図に示す各テーブルを使用した検索動作
を示すフローチャートである。同図において、まず、入
力されたキーワードに対してキーワード情報テーブル1
の最初のキーワード分類情報を抽出し(ステップ11
0)、この最初のキーワード分類情報に対応して検索テ
ーブルの番号を1とし(ステップ120)、キーワード分
類情報が一致するかどうか調べる(ステップ130)。一
致しない場合には、次のキーワードが分類情報をキーワ
ード情報テーブル1から抽出するとともに、検索テーブ
ルの番号をインクリメントし(ステップ140,150)、キ
ーワード分類情報が一致するかどうか調べるという動作
を繰り返し行う(ステップ160)。
一致するキーワード分類情報があった場合には、この
一致したキーワード分類情報に対応する検索テーブルを
選択し(ステップ180)、該検索テーブルの最初のキー
ワードのポインタで示すデータの番号を1とし(ステッ
プ190)、該検索テーブルの最初のキーワードが入力キ
ーワードと一致するかどうか調べる(ステップ200)。
キーワードが一致しない場合には、データの番号をイン
クリメントし(ステップ210,220)、検索テーブルの次
のキーワードと入力キーワードとが一致するかどうか調
べるという動作を繰り返し行う(ステップ230)。キー
ワードが一致する場合には、そのキーワードに対応する
ポインタのデータ、すなわちステップ190または220で示
すデータ番号のデータが該入力キーワードに対するデー
タとして出力されるのである。
以上説明したように、キーワード分類情報に従って検
索テーブルを分けて複数設け、入力キーワードに対応す
るキーワード分類情報の検索テーブルのみを検索するこ
とによりキーワードによる検索時間を大幅に短縮するこ
とができるのである。具体的には、総キーワード数をN
とし、選択された検索テーブルのキーワード数をMとす
ると、検索時間はN/Mに低減されることになる。
第3図は本発明の他の実施例の構成を示すブロック図
である。同図は、一例としてOCRを使用したデータベー
ス検索、特に書状上に記載されたデータを読み取り、住
所データベースを検索して書状をソートするシステムを
示しているものである。同図において、書状搬送路11に
沿って搬送される書状21は光学系13によって読み取ら
れ、A/D変換された後、画像パターン信号として文字認
識部15に供給される。文字認識部15は、例えば複合類似
度法等により文字を認識して、例えばASCIIコードとし
てその他の住所情報、例えば文字の位置情報等ととも
に、データベース検索部17に供給される。データベース
検索部17は、供給された文字コードと文字位置情報を用
いて書状21のデータの単語データを生成し、この単語デ
ータをキーワードとして住所データベース23を検索す
る。そして、住所データベース23を検索することにより
書状21に記載された住所を読み取り、例えば郵便番号に
相当する住所コードを生成する。この住所コードは搬送
制御部19に供給される。搬送制御部19はこの住所コード
に対応するスタッカー制御信号をスタッカー部25に供給
し、書状21を所定のスタッカーに格納する。
前記書状21は、第4図に示すように、一例として米国
の書状を示しており、図示のように宛名31、宛先住所の
ハウス番号33、ストリート各35、都市名37、州名39、ZI
P41が示されているが、前記データベース検索部17はZIP
41、州名39、都市名37、ストリート名35、ハウス番号33
の順に住所データベース23を検索して対応する住所コー
ドを生成する。
書状21には、例えば州名39として、正式名で「NY」と
記載されているが、これは、フルスペルでは「New Yor
k」と記載されたり、または省略形の「N Y」と間隔
をあけて記載されたり、いくつかの変形がある。従っ
て、州名の検索では、「ニューヨーク州」に対しては、
次に示す複数のキーワードが必要となる。
NY New−York N_Y(注意_はスペースを示す) ここで、に示す標準名のキーワードは全州について
2文字であり、の省略形では1文字の組合せであり、
のフルスペルでは3文字以上の単語の組合せからなっ
ていることがわかる。従って、上述したように、キーワ
ードとして「NY」が入力された場合には、その文字数か
らの標準型の州名テーブルのみを検索すればよいこと
になる。
第5図はこのような構造のキーワード情報テーブル5
0、検索テーブル51,52,53および都市名リストポインタ
のデータテーブル55を示している。キーワード情報テー
ブル50はキーワード分類情報として2文字、3文字以
上、1文字を設け、これらの各キーワード分類情報に対
してそれぞれ標準州名検索テーブル51、フルスペル州名
検索テーブル52、州略形州名検索テーブル53を設けられ
ている。
従って、上述したように、書状21に「NY」の2文字が
記載されている場合には、「NY」の文字を読み取ると、
2文字であることがわかるので、キーワード情報テーブ
ル50をひいて、標準州名検索テーブル51を選択する。そ
れから、この検索テーブルをキーワードで検索し、都市
テーブルのポインタを得るものである。このように構成
することによりフルスペルや省略形のテーブルを検索す
る必要がないので、高速な検索を行うことができる。
[発明の効果] 以上説明したように、本発明によれば、複数のキーワ
ードをキーワード分類情報毎に分類して記憶するととも
に、入力されたキーワードに対応するキーワード分類情
報を決定し、この決定されたキーワード分類情報に対応
して記憶されているキーワードの中から一致するキーワ
ードを検索しているので、すべてのキーワードを検索す
る必要がなく、決定されたキーワード分類情報に対応し
て記憶されているキーワードのみ検索すればよいため、
検索時間を大幅に短縮し、高速化、効率化を達成するこ
とができる。
【図面の簡単な説明】
第1図は本発明の一実施例に係わるデータ検索装置に使
用される検索テーブルの構成を示す説明図、第2図は第
1図の検索テーブルによる検索動作を示すフローチャー
ト、第3図は本発明の他の実施例の構成を示すブロック
図、第4図は第3図の実施例に使用される書状を示す
図、第5図は第3図の実施例に使用される検索テーブル
の構成を示す説明図である。 1……キーワード情報テーブル 3a〜3n……検索テーブル 5……データテーブル 15……文字認識部 17……データベース検索部 21……書状 23……住所データベース

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】郵便物の欧文住所のOCRによる文字認識結
    果に基づいて住所情報をキーワードとしてデータベース
    の検索を行う住所データベース検索装置であって、 州の名称を表すキーワードを2文字の正式名である
    「標準州名検索テーブル」、3文字以上の「フルスペ
    ル州名検索テーブル」、1文字の組合わせの省略形で
    ある「省略形州名検索テーブル」に分類して記憶してお
    くキーワード分類記憶手段と、 前記OCRによる文字認識の結果入力された前記州の名称
    を表すキーワードの文字列から文字数が、2文字である
    か、3文字以上であるか、あるいは1文字の組合わせで
    あるかを判断する州名検索テーブル判断手段と、 この州名検索テーブル判断手段で判断された一つの前記
    州名検索テーブルに記憶されているキーワードの中から
    前記入力されたキーワードに一致するキーワードを検索
    し、この検索したキーワードに対応する住所データを出
    力する検索手段とを有することを特徴とするOCRによる
    住所データベース検索装置。
JP63300746A 1988-11-30 1988-11-30 Ocrによる住所データベース検索装置 Expired - Fee Related JP2588261B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63300746A JP2588261B2 (ja) 1988-11-30 1988-11-30 Ocrによる住所データベース検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63300746A JP2588261B2 (ja) 1988-11-30 1988-11-30 Ocrによる住所データベース検索装置

Publications (2)

Publication Number Publication Date
JPH02148174A JPH02148174A (ja) 1990-06-07
JP2588261B2 true JP2588261B2 (ja) 1997-03-05

Family

ID=17888605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63300746A Expired - Fee Related JP2588261B2 (ja) 1988-11-30 1988-11-30 Ocrによる住所データベース検索装置

Country Status (1)

Country Link
JP (1) JP2588261B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2801602B2 (ja) 1988-06-30 1998-09-21 株式会社東芝 単語認識装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0493899U (ja) * 1991-01-08 1992-08-14
JP3228249B2 (ja) 1998-12-04 2001-11-12 日本電気株式会社 ルータ装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4771385A (en) * 1984-11-21 1988-09-13 Nec Corporation Word recognition processing time reduction system using word length and hash technique involving head letters
JPS61267828A (ja) * 1985-05-23 1986-11-27 Matsushita Electric Ind Co Ltd 情報登録検索装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2801602B2 (ja) 1988-06-30 1998-09-21 株式会社東芝 単語認識装置

Also Published As

Publication number Publication date
JPH02148174A (ja) 1990-06-07

Similar Documents

Publication Publication Date Title
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
JPH06162098A (ja) 類義語生成処理方法
JP2693914B2 (ja) 検索システム
JPH0782504B2 (ja) 情報検索処理方式および検索ファイル作成装置
JP2588261B2 (ja) Ocrによる住所データベース検索装置
JP3784060B2 (ja) データベース検索システム、その検索方法及びプログラム
JPS60105039A (ja) 文字列照合方式
JPH1011434A (ja) 情報認識装置
JPH04326164A (ja) データベース検索システム
JPH11219367A (ja) 住所情報による異種データの結合処理方法および装置
JPH0441388B2 (ja)
JPH11353316A (ja) 省略語補完装置
JPH10198688A (ja) 定型文書読み取り装置
JPH07296005A (ja) 日本語テキスト登録・検索装置
JP2996823B2 (ja) 文字認識装置
JPH07109603B2 (ja) 情報検索処理方式および検索ファイル作成装置
JP2000251017A (ja) 単語辞書作成装置および単語認識装置
JP2773657B2 (ja) 文字列検索装置
JP2839515B2 (ja) 文字読取システム
JPH0646423B2 (ja) 単語辞書照合装置
JPS63138479A (ja) 文字認識装置
JPH02173883A (ja) 住所検索方式
JPH05258100A (ja) 文字認識装置
JPH05242303A (ja) 宛名読取装置
Boyce et al. A sort procedure for the superintendent of documents classification

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees