JPH0739822A - 単語認識装置および宛名読取区分機 - Google Patents

単語認識装置および宛名読取区分機

Info

Publication number
JPH0739822A
JPH0739822A JP5187987A JP18798793A JPH0739822A JP H0739822 A JPH0739822 A JP H0739822A JP 5187987 A JP5187987 A JP 5187987A JP 18798793 A JP18798793 A JP 18798793A JP H0739822 A JPH0739822 A JP H0739822A
Authority
JP
Japan
Prior art keywords
character
address
word
recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5187987A
Other languages
English (en)
Inventor
Kazumi Saito
和美 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5187987A priority Critical patent/JPH0739822A/ja
Publication of JPH0739822A publication Critical patent/JPH0739822A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】この発明は、文字列が長い単語のように、認識
しづらい文字が含まれる可能性が大きい場合でも、単語
の認識が可能となり、区分率の向上につながることを目
的とする。 【構成】この発明は、従来まで全ての単語について固定
であった平均値の足切値をその単語の文字数により変更
するようにしたものである。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、搬送される郵便物か
らその上に記載されている住所等の宛名としての単語を
認識する単語認識装置と、この単語認識装置により認識
した宛名を用いて区分を行う宛名読取区分機に関する。
【0002】
【従来の技術】郵便区分業務を大別すると、取集めた郵
便物を相手先の郵便局に送るための区分作業である差立
区分業務と、到着した郵便物を配達するための区分業務
である配達区分業務がある。
【0003】従来、差立区分業務については、郵便番号
自動読取区分機により大幅に自動化が図られてきたが、
配達区分業務については自動化が遅れていた。ところが
近年、郵便番号自動読取区分機の機能に加え、郵便物に
記載された町名、丁目、街区符号の漢字などの宛名つま
り住所を直接OCRで読取ることによって、郵便物を配
達区レベルまでの区分を自動化(配達区分業務の自動
化)するものが開発されている。
【0004】一般的に郵便物に記載されている文字列
(町名大口名)を認識する場合、誤読防止のため各文字
ごとの点数の平均値に対し足切値を設定し、それ以上の
点数の場合のみ単語として認識している。
【0005】従来までの足切値の設定法はすべての文字
列に対し、共通であった。したがって、上記のようなも
のでは、すべての文字列に対し共通の足切値を設定した
場合、文字列の文字数が長くなれば長くなるほど文字列
中に評価値の低い文字(読みにくい文字)が含まれる可
能性が高くなり、平均値が低下し足切値に満たない場合
が発生する。この結果、文字数が長いほど文字列の認識
が困難となり区分率低下の原因となっていた。
【0006】
【発明が解決しようとする課題】この発明は、上記した
ように、文字数が多いほど文字列の認識が困難となり、
区分率低下の原因となってしまうという欠点を除去する
もので、文字列が長い単語のように、認識しづらい文字
が含まれる可能性が大きい場合でも、単語の認識が可能
となり、区分率の向上につながる単語認識装置および宛
名読取区分機を提供することを目的とする。
【0007】
【課題を解決するための手段】この発明の単語認識装置
は、郵便物からその上に記載されている宛名を読取る読
取手段、この読取手段による読取内容に応じて文字認識
するとともに、文字の確からしさを点数として算出する
文字認識部、およびこの文字認識部から供給される認識
文字に対して住所辞書と照合し、あらかじめ登録されて
いる文字列を生成し、この文字列の文字の確からしさの
点数が文字列の長さに応じて異るあらかじめ設定された
足切値以上の文字列を単語候補とし、その中で最も点数
の高い単語を認識結果として出力する町名大口名認識部
から構成されている。
【0008】この発明の宛名読取区分機は、搬送される
郵便物からその上に記載されている宛名を読取り、この
読取った宛名を用いて区分を行うものにおいて、上記郵
便物からその上に記載されている宛名を読取る読取手
段、この読取手段による読取内容に応じて文字認識する
とともに、文字の確からしさを点数として算出する文字
認識部、この文字認識部から供給される認識文字に対し
て住所辞書と照合し、あらかじめ登録されている文字列
を生成し、この文字列の文字の確からしさの点数が文字
列の長さに応じて異るあらかじめ設定された足切値以上
の文字列を単語候補とし、その中で最も点数の高い単語
を認識結果として出力する町名大口名認識部、およびこ
の町名大口名認識部により認識された宛名に応じて区分
を行う区分手段から構成されている。
【0009】
【作用】この発明は、上記のような構成において、郵便
物からその上に記載されている宛名を読取る読取手段、
この読取手段による読取内容に応じて文字認識するとと
もに、文字の確からしさを点数として算出する文字認識
部、およびこの文字認識部から供給される認識文字に対
して住所辞書と照合し、あらかじめ登録されている文字
列を生成し、この文字列の文字の確からしさの点数が文
字列の長さに応じて異るあらかじめ設定された足切値以
上の文字列を単語候補とし、その中で点数の最も高い単
語を認識結果として出力するようにしたものである。
【0010】
【実施例】以下、この発明の一実施例について図面を参
照して説明する。図2はこの発明の単語認識装置を有す
る宛名読取区分機としての郵便物自動区分機を示し、次
のような構成となっている。すなわち、供給部1には一
括かつ立位状態で葉書、封書などの郵便物P…がセット
される。この供給部1の郵便物P…は、取出部2により
最前端の郵便物Pから順次1枚づつ取出し搬送され取込
搬送路3の途中に配置された読取部4によって郵便物P
に付与された郵便番号、住所情報(宛名情報)が読取ら
れる。上記読取部4は郵便物P上の郵便番号、住所情報
を光電変換する光電変換部4a、この光電変換部4aの
出力に応じて文字パタ―ンの認識を行うことにより郵便
番号、住所情報を判別する単語認識装置を有する判別部
4bとからなる周知のものである。
【0011】つぎに、読取部4を通過した郵便物Pは搬
送路3を介して区分部11に搬送されるようになってい
る。この区分部11は、図示しないゲ―ト機構部によっ
て鉛直方向に複数段設けられた区分搬送路5a、〜5g
に上記郵便番号、住所情報の読取結果等に基づいて選択
的に振分けられるようになっている。
【0012】上記区分搬送路5a、〜5fの下方にはそ
の下面側に沿ってそれぞれ複数のポケット(集積箱)6
…が複数段(A段、〜G段)に配設されており、区分搬
送路5a、〜5gに送り込まれた郵便物Pは上記読取部
4の読取結果に基づいて所定のポケット6内に区分集積
されるようになっている。
【0013】なお、上記搬送路3、5a、…上には、そ
の搬送路上の郵便物Pの搬送を検知する搬送検知器群
(図示しない)が設けられている。上記郵便物Pの表面
には住所情報等が記載されている。上記住所情報は、そ
れぞれ複数行の文字情報によって構成されている。この
ような郵便物Pにおいて、住所情報Aとして読取るべき
「都道府県名」、「区、市名」、「町名」、「番地」な
どの宛名(東京都 足立区 千住寿町 1−2−3)が
記載されている。
【0014】また、上記供給部1の上部には操作パネル
としてのオペレ―タパネル7が設けられている。図3は
電気回路を示すものである。すなわち、制御部31はメ
モリ32に記憶されている区分指定テ―ブルを用いて、
上記判別部4bから供給される郵便番号、住所情報に対
応する区分指定デ―タを読出し、この読出した区分指定
デ―タ(ポケット6、…のアドレス)に対応するポケッ
ト6、…に上記郵便物Pを搬送せしめるものである。た
とえば、搬送路3の途中の搬送検知器(図示しない)か
らの搬送検知信号に応じて区分ゲ―ト制御信号を出力す
ることにより、ドライバ33を用いて区分ゲ―ト9、…
を制御せしめるようになっている。上記メモリ32に
は、区分指定テ―ブルとして各郵便番号、各住所情報に
対応するポケット6、…のアドレス(区分指定デ―タ)
が記憶されている。
【0015】さらに、上記制御部31はドライバ35に
より上記搬送路3等の搬送機構部36を駆動することに
より、搬送系全体の制御を行うようになっている。次
に、読取部4の光電変換部4aと判別部4bについて、
図1を用いて説明する。
【0016】すなわち、光電変換部4aは、郵便物P上
を光学的に走査して光電変換することによりパタ―ン信
号を得るものであり、たとえば郵便物P上に光を照射す
る光源、およびその反射光を受けて電気信号に変換する
自己走査形のCCDイメ―ジセンサ等によって構成され
る。
【0017】上記光電変換部4aの出力は判別部4bに
供給されるようになっている。この判別部4bは、住所
領域検出部42と文字認識部43に供給されるようにな
っている。この住所領域検出部42は、上記郵便物Pに
記載されている各情報のなかから、領域の形、位置等
で、住所情報が記載されている領域を検出する周知のも
のである。
【0018】上記住所領域検出部42の判断結果、たと
えばその判断した領域の座標値が文字認識部43内の選
択回路51に出力されるようになっている。また、上記
光電変換部4aの出力は文字認識部43内の2値化回路
50に出力されるようになっている。
【0019】上記文字認識部43は、上記光電変換部4
aからの読取信号を2値化する2値化回路20、上記住
所領域検出部42から供給される座標情報に対応する上
記2値化回路20からの2値化信号を選択的に出力する
選択回路51、この選択回路51から供給される住所領
域(郵便番号領域)に対応する住所情報(郵便番号)の
文字を1文字ずつ検出切出しする、つまり住所(郵便番
号)に対応する文字情報を検出切出しする文字検出切出
回路52、この文字検出切出回路52から供給されるつ
まり検出切出された文字情報を正規化し、サンプリング
する正規化回路53、および正規化回路53から供給さ
れる文字情報を、たとえば辞書55内の各文字に対する
基準パタ―ンとのマッチング法などによって文字を認識
する認識回路54によって構成されている。認識回路5
4は、文字の確からしさを点数として算出し、その算出
結果も認識結果に付与して出力されるようになってい
る。
【0020】上記文字認識部43つまり認識回路54の
出力は町名・大口名認識部44に供給される。上記町名
・大口名認識部44は、上記文字認識部43から供給さ
れる認識文字に対して住所辞書45から読出される住所
により町名・大口名(東京都足立区 千住寿町)を認識
するものである。
【0021】すなわち、町名・大口名認識部44は、住
所辞書45と照合し、あらかじめ登録されている文字列
を生成し、あらかじめ設定された足切値以上の文字列を
単語候補とし、その中で点数の最も高い単語を認識結果
として出力するものである。上記足切値は、文字列の長
さつまり文字数により変更されるようになっている。た
とえば、1文字から3文字までの足切値を60、4文字
以上の足切値を50としている。
【0022】上記町名・大口名認識部44からの出力は
住所認識部48に供給される。この住所認識部48は、
上記町名・大口名認識部44から供給される町名・大口
名により住所を認識し、住所に対する区分指定デ―タつ
まり後段の区分部11におけるポケット6、…を示すデ
―タを出力するものである。
【0023】次に、上記のような構成において、文字認
識部43と町名・大口名認識部44の動作を、図4に示
すフローチャートを参照しつつ説明する。すなわち、文
字認識部43において各文字ごとに評価点を算出し(S
T1)、次に住所辞書45と照合し連接した文字であら
かじめ住所辞書45に登録されている単語を生成する
(ST2)。また、あらかじめ住所辞書45に登録され
ている単語に対し足切値を設定する。この足切値は従来
まですべての単語に対し共通であったが、この発明では
文字列長が長ければ長いほど足切値を低くなるように設
定する(ST3)。たとえば、1文字から3文字までの
足切値を60、4文字以上の足切値を50としている。
また、1文字から1文字増えるごとに足切値を少なくす
るようにしても良い。また、町名と大口名とで足切値を
変更するようにしても良い、この場合も、1文字から1
文字増えるごとに足切値を少なくする。
【0024】次に各文字ごとの評価点と足切値を比較し
(ST4)、評価点が高ければ認識可能とみなし認識区
分へ(ST5)、足切値が高ければ認識不可能とみなし
リジェクト区分へ区分する(ST6)。
【0025】次に、図5に従来方式とこの発明の方式に
よる違いを例を用いて説明する。例1に示す“日暮”の
ような文字数が少ない場合、この発明との違いはない
が、例2に示す“常磐平陣屋前”のように文字数が多い
場合、認識しにくい文字などが含まれる場合も多く文字
列全体として見た場合でも、評価点が低くなってしま
う。
【0026】そこで、足切値を低めに設定することによ
り、認識可能となり、認識率向上に繋がる。最後に、図
6に誤読の側からみた足切値の設定について説明する。
例1のように単語の文字数が少なく1文字、評価値の低
い文字が存在する場合、誤読の可能性は十分あるが、例
2のように単語の文字数が多い場合、他の文字がある程
度の評価値を持てば、1文字、評価値の低い文字が存在
しても、誤読の可能性は少ないと考えることができる。
【0027】以上より、誤読に関しては文字数が少なけ
れば少ないほど足切値を高めることが有効である。結論
として、足切値の初期値としてある程度高めの値を設定
しておけば、文字数が多ければ多いほど足切り値を低く
することは区分率向上、誤読減少の両者に対し有効であ
る。
【0028】上記したように、従来まで全ての単語につ
いて固定であった単語の足切値を、その単語の文字数に
より変更するようにしたので、文字列が長い単語のよう
に、認識しづらい文字が含まれる可能性が大きい場合で
も、単語の認識が可能となり、区分率の向上につなが
る。
【0029】すなわち、従来、足切値を固定とした場
合、“日暮”のように文字数が少ない場合、問題はない
が、“常磐平陣屋前”のように文字数が多い場合、全て
の文字が平均点以上にならない場合も多く、不採用とな
ってしまうのに対して、この発明のように足切値を文字
数が長いほど低く設定することにより、採用可能とな
り、単語の認識率向上につながる。
【0030】また、文字数が長ければ長いほど、不確定
要素が多くても違った単語を生成する可能性は少なく、
足切値をある程度下げても、大きな影響はないと考えら
れる。なお、初期状態における足切値は文字数により確
定するが、その値はファイル等に格納されていてエディ
タ等を用いることにより、容易に変更できる。
【0031】
【発明の効果】以上詳述したようにこの発明によれば、
単語の認識が可能となり、区分率の向上につながる単語
認識装置および宛名読取区分機を提供できる。
【図面の簡単な説明】
【図1】この発明の一実施例における読取部の構成を示
すブロック図。
【図2】郵便物自動区分機の構成を示す平面図。
【図3】図2の郵便物自動区分機の全体の構成を示すブ
ロック図。
【図4】文字認識部と町名・大口名認識部の動作を説明
するためのフローチャート。
【図5】従来方式とこの発明の方式による違いを例を用
いて説明するための図。
【図6】誤読の側からみた足切値の設定について説明す
るための図。
【符号の説明】
4…読取部 P…郵便物 4a…光電変換部 42…住所領域検出部 43…文字認識部 44…町名・大口名認識部 45…住所辞書 48…住所認識部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 郵便物からその上に記載されている宛名
    を読取る読取手段と、 この読取手段による読取内容に応じて文字認識するとと
    もに、文字の確からしさを点数として算出する文字認識
    部と、 この文字認識部から供給される認識文字に対して住所辞
    書と照合し、あらかじめ登録されている文字列を生成
    し、この文字列の文字の確からしさの点数が文字列の長
    さに応じて異るあらかじめ設定された足切値以上の文字
    列を単語候補とし、その中で点数の最も高い単語を認識
    結果として出力する町名大口名認識部と、 を具備したことを特徴とする単語認識装置。
  2. 【請求項2】 搬送される郵便物からその上に記載され
    ている宛名を読取り、この読取った宛名を用いて区分を
    行う宛名読取区分機において、 上記郵便物からその上に記載されている宛名を読取る読
    取手段と、 この読取手段による読取内容に応じて文字認識するとと
    もに、文字の確からしさを点数として算出する文字認識
    部と、 この文字認識部から供給される認識文字に対して住所辞
    書と照合し、あらかじめ登録されている文字列を生成
    し、この文字列の文字の確からしさの点数が文字列の長
    さに応じて異るあらかじめ設定された足切値以上の文字
    列を単語候補とし、その中で点数の最も高い単語を認識
    結果として出力する町名大口名認識部と、 この町名大口名認識部により認識された宛名に応じて区
    分を行う区分手段と、 を具備したことを特徴とする宛名読取区分機。
JP5187987A 1993-07-29 1993-07-29 単語認識装置および宛名読取区分機 Pending JPH0739822A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5187987A JPH0739822A (ja) 1993-07-29 1993-07-29 単語認識装置および宛名読取区分機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5187987A JPH0739822A (ja) 1993-07-29 1993-07-29 単語認識装置および宛名読取区分機

Publications (1)

Publication Number Publication Date
JPH0739822A true JPH0739822A (ja) 1995-02-10

Family

ID=16215640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5187987A Pending JPH0739822A (ja) 1993-07-29 1993-07-29 単語認識装置および宛名読取区分機

Country Status (1)

Country Link
JP (1) JPH0739822A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990252A (zh) * 2019-12-18 2021-06-18 株式会社东芝 信息处理装置、信息处理方法以及程序

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990252A (zh) * 2019-12-18 2021-06-18 株式会社东芝 信息处理装置、信息处理方法以及程序

Similar Documents

Publication Publication Date Title
US6327373B1 (en) Mail address reading apparatus and mail sorting apparatus
KR19990072627A (ko) 수신처정보인식방법및메일처리장치
US7580544B2 (en) Addressee recognizing apparatus
JPH0739820A (ja) 街区認識装置および宛名読取区分機
JPH01159088A (ja) 郵便物自動区分機
JPH0739822A (ja) 単語認識装置および宛名読取区分機
JPH05307639A (ja) 郵便物の宛名領域検出装置
JP3710866B2 (ja) 郵便物区分装置、郵便物処理システム及び郵便物処理方法
JPH07271899A (ja) 文字認識装置
JPH0957199A (ja) 宛名読取装置及び郵便物区分装置
JP3088038B2 (ja) 郵便物区分装置と郵便物区分方法
JP3088036B2 (ja) 宛名読取区分機
EP1496460A1 (en) Sorting apparatus and address information determination method
JPH0739819A (ja) 宛名読取区分機
JPH0739816A (ja) 宛名読取装置
JPH0739821A (ja) 宛名読取装置および宛名読取区分機
JP4659947B2 (ja) 読取装置、読取方法、区分装置、及び区分方法
JPH0478475A (ja) 郵便物自動区分機
JP2988784B2 (ja) 郵便物処理装置
JPH08103730A (ja) 住所認識方法,住所認識装置および紙葉類自動処理システム
JP2914765B2 (ja) 宛名読取区分機及び宛名認識装置
JPH0739817A (ja) 宛名読取装置
JP2868930B2 (ja) 郵便物処理装置
JPH0747334A (ja) 住所認識装置および住所読取区分機
JP3660405B2 (ja) 区分機、宛名認識装置及び宛名認識方法