JPS6262387B2 - - Google Patents

Info

Publication number
JPS6262387B2
JPS6262387B2 JP56022557A JP2255781A JPS6262387B2 JP S6262387 B2 JPS6262387 B2 JP S6262387B2 JP 56022557 A JP56022557 A JP 56022557A JP 2255781 A JP2255781 A JP 2255781A JP S6262387 B2 JPS6262387 B2 JP S6262387B2
Authority
JP
Japan
Prior art keywords
word
keyword
code
line
postal code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56022557A
Other languages
English (en)
Other versions
JPS57137976A (en
Inventor
Kazunari Egami
Tetsuo Umeda
Naoto Tsukagoshi
Yasuo Nishijima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56022557A priority Critical patent/JPS57137976A/ja
Priority to US06/349,938 priority patent/US4524453A/en
Publication of JPS57137976A publication Critical patent/JPS57137976A/ja
Publication of JPS6262387B2 publication Critical patent/JPS6262387B2/ja
Granted legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/10Apparatus characterised by the means used for detection ofthe destination
    • B07C3/14Apparatus characterised by the means used for detection ofthe destination using light-responsive detecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/274Syntactic or semantic context, e.g. balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Sorting Of Articles (AREA)

Description

【発明の詳細な説明】 本発明は単語認識を用いて、住所情報中に含ま
れるキーワードを認識し読取対象行を絞ることに
より郵便番号を識別する郵便番号識別装置に関す
る。
従来の郵便番号読取装置において、郵便物の住
所記載面を広範囲にわたり走査するような場合、
次に説明するような問題があつた。
(1) 第1図aは米国郵便物住所記載の一例であ
り、図において1は私書箱を示す単語であり、
2は私書番号であり、そして3は郵便番号であ
る。この場合郵便番号と同一桁数の私書箱番号
2があるため番号読取だけでは、2と3両者の
識別が不可能である。第1図bも米国郵便物住
所記載の一例であり、4は郵便番号、5は「気
付」を示す単語、6は気付欄に記載された郵便
番号以外のコードである。この場合も郵便番号
と同一桁数のコード6があり番号読取だけで4
と6両者の識別は不可能である。
(2) 前述の第1図a,bは郵便番号の位置が相反
する例であり、第1図aは郵便番号3が最下行
にあり、同一桁数の私書箱番号が下から2行目
にある例である。そして第1図bは郵便番号4
が下から2行目にあり、同一桁数の郵便番号以
のコード6が最下行にある例である。従来の
郵便番号読取装置においては、住所記載の一般
的規則から、例えば郵便番号は最下行にあるも
のを優先的に読取る方式であつたため、第1図
bにおいてはコード6を郵便番号として誤認識
してしまう。
(3) 第1図cの例のように、窓付の郵便物等で最
下行10が窓桁9の外にかくれてしまい、下か
ら2行目だけが郵便物の窓から見えて私書箱番
号8を郵便番号と誤認識してしまう。
(4) 第1図dの例は米国から航空便としてイタリ
アへ出された郵便物の住所記載の例であり、1
1は国名、12はイタリアの郵便番号である。
従来の郵便番号読取では外国郵便物であること
を識別不可能であり、イタリアの郵便番号12
を米国内の対応する郵便番号として読み取るの
で、その結果読取エラーとなる。
したがつて、本発明の目的は読み取つた文字情
報から、行の属性を示す特定のキーワードを検知
し、これを参照して郵便番号を識別する郵便番号
識別装置を提供することである。
本発明においては公知の単語認識手法により、
行の属性を示すようなキーワードを、まず最初に
認識することにより、前記(1)〜(4)のような欠点を
除去することができる。尚、ここで言う行の属性
とは第1図aの例では私書箱表示が下から2行目
の行属性であり、1の「P.O.BOX」がキーワー
ドである。第1図bでは、気付欄が最下行の行属
性であり5の「ATTENTION」がキーワードで
ある。また公知の単語認識の手法としては、特に
動的計画法(Dynamic Programing)を応用した
DPマツチング手法が一般的である。これは、あ
る入力文字列に対して予め用意された単語辞書と
文字対文字を一対一に照合するだけでなく、各文
字毎にある一定幅ずらした文字に対しても照合を
とり最もよく一致する(最大一致)部分を抽出し
ていく方法である。この方式によれば、単語内に
読めない文字等がいくつか存在したり、文字のセ
グメンテーシヨンエラー等により文字数が多少増
減しても、単語の持つ冗長度によりある程度吸収
され辞書上の単語と完全一致ではなくとも非常に
よく一致する単語として抽出することができる。
本発明の郵便番号識別装置の処理過程は、(1)キ
ーワードを認識することにより、行の属性を認識
する。(2)次に行の属性認識により、その行が読取
り有効行かを判断し、有効行でなければ、読取対
象から除外することにより行なわれる。
本発明の効果は、読取対象行を限定することに
より処理時間の無駄を省くことができること、更
に読取対象コードを類似のコードが存在する場合
は行の属性認識により従来のような読取エラーを
防止することにより、郵便番号を識別し、処理性
能の改善をはかることができる点である。
以下、本発明の一実施例を示した図面を用いて
本発明を詳細に説明する。第2図は本発明の一実
施例の構成図である。第3図は第1図aの住所の
単語配列を図式化したもので、以下の詳細説明例
に用いる。本例では「PO BOX」をコードの属
性を示すキーワードとする。
第2図において、文字認識部1からは第3図の
住所に対応する文字列が単語抽出部2に入力され
る。このとき、語順については上行と下行を区別
して左端また右端から順次送られてくる。また、
単語の区切りについては、余白部やカンマ、ピリ
オド及びハイフオン等の記号により検出されるの
が一般的であり、文字認識部1ではこれを検出
し、単語区切り情報として一文字分送出する。本
例では郵便番号の読取処理を上行から順に実行す
る場合を示す。なお、下行から順に処理する場合
でも全く同様である。
単語抽出部2においては、入力文字列から単語
区切り情報により単語を抽出し、第3図に図式化
したような形に、コード以外の単語については並
びを示す一連番号を付して記憶する。
次に抽出された単語列は入力単語選択部3に入
力される。ここでは、各コードの属性を示すキー
ワード抽出のための入力単語組合せを決定し、次
の最大一致検出部4に入力する。
第3図において、コード1の属性を示すキーワ
ード抽出エリアとして単語1から単語3を選び、
またコード2の属性を示すキーワード抽出エリア
として単語4から単語6を選択する。第4図aに
第3図における上行のコード1に対するキーワー
ド抽出の単語組合せを、また第4図bに第3図に
おける下行のコード2に対するキーワード抽出の
単語組合せを示す。
入力単語選択部3はキーワード辞書記憶部5に
対して、照合をとる辞書を索引する情報(キー)
を与える。当該情報としては入力単語の語長をキ
ーとする方法や、入力単語の語頭の数文字の読取
結果をキーとする方法等が一般に用いられてお
り、照合する辞書の範囲を制限するものである。
もし、辞書の容量のそのものが小さければ、辞書
全体を照合範囲として選んでもよい。
キーワード辞書記憶部5から選択される照合辞
書は照合辞書記憶部6に与えられ、最大一致検出
部4に入力され、入力単語列と照合をとる。最大
一致検出部4では前述の公知のDPマツチング手
法により入力単語列とキーワード辞書との照合を
行い、最もよく一致(最大一致)するキーワード
候補を選びキーワード判定部7に出力する。
キーワード判定部7では入力したキーワード候
補を一時記憶し次の単語の組合せで前記最大一致
検出を行うか否かを判断する。判断に際しては、
上行の場合第4図aの単語組合せ(下行の場合第
4図b)をすべて終了したか、またはキーワード
辞書5に登録されたキーワードの最大語長と比較
し、最大一致検出部4に入力した単語組合せの文
字数の総和が長くなつたか否かを調べる。すべて
の単語組合せが未終了であるか、または、入力単
語列文字数総和がキーワード最大語長に達してな
いとき、入力単語選択部3に戻り次の単語組合せ
でキーワード認識を繰返す。
前記以外のとき、キーワード候補の抽出を終了
し、これまでに得られたキーワード候補の中から
最も一致度の高い候補を選び一定スレシヨールド
を満足するものをキーワードとして行属性判定部
8に出力する。第3図に示す単語配列の例では
{P.O BOX」をキーワードとしてキーワード辞書
5に登録しておくことにより、第4図の単語組合
せによるキーワード認識の結果第4図aの(ii)の組
合せによる単語が、最も一致度の高い候補として
抽出される。
行属性判定部8においては第3図の住所単語配
列における上行のキーワードとして「P.O
BOX」が入力されると上行の属性が住所の中の
「私書箱」を示す情報を含む行であることを識別
できコード1が「私書箱番号」であり「郵便番
号」ではないと判定する。その結果、上行は郵便
番号を含まないとしてスキツプされ、制御ライン
10を通つて文字認識部1に戻り下行について前
記上行と同様にキーワード抽出を行う。下行にお
いて、該当するキーワードが検出できなかつた場
合特殊な行属性を持たない一般的住所を示す行と
見なし、郵便番号判定部9において郵便番号を識
別する。なお、郵便番号であるコード2を含む下
行のキーワードとして地名であるNEW YORK等
をキーワード辞書5に登録しておけば下行の属性
が住所を示す行であることも当然識別できる。し
かし、地名は多数(数千又は数万)存在し、キー
ワード辞書の容量としては極めて大となる。また
処理時間も大となる。
以上第1図aについて説明したが、第1図cに
ついては「P.O BOX」が認識できることによ
り、8の私書箱番号を郵便番号として誤認識する
ことはない。第1図bについては
「ATTENTION」をキーワードとして登録するこ
とにより、最下行が住所として無効行であること
を認識し、下から2行目の4を郵便番号として識
別できる。第1図dについては「ITALY」等の
国名(たかだか100〜200)を登録しておけば、外
国行郵便物として識別できる。
以上詳細に説明したように本発明によれば(1)走
査域内に多数の行が存在し、郵便番号とそれ以外
の類似したコードが存在するとき、そのコードを
含む行の属性を示す何らかの情報があれば郵便番
号を識別できる。(2)走査域内に、郵便番号と全く
同一の桁数のコードが唯一あり、性格は本来の郵
便番号と全く異なつていてもそのコードを含む行
の属性を示す何らかの情報があれば郵便番号以外
のコードとして識別できる。(3)さらに、本発明の
他の効果として走査域内に多数の行が存在する場
合、読取対象行を絞ることにより、無効行をスキ
ツプすることによつて、郵便番号読取処理の効率
アツプをはかることができる。
【図面の簡単な説明】
第1図は読取対象となる帳票類の単語及びコー
ドの記載例であり、aは類似したコードを含む例
で、郵便番号及び同一桁数の私書箱番号を持つ郵
便物、bは類似したコードを含む例で、郵便番号
及び同一桁数のコードを持つ住所以外の行を含む
郵便物、cはaと同一であるが最下行が郵便物の
窓桁の外にかくれている例、dはa,bと同一桁
の郵便番号を持つが国が異なる郵便物の例であ
る。第2図は本発明の一実施例の装置構成図であ
る。第3図は第1図bの例を単語配列に図式化し
たものである。第4図は第3図の例でキーワード
抽出を行うときの単語組合せ例である。 図において、1……文字認識部、2……単語抽
出部、3……入力単語選択部、4……最大一致検
出部、5……キーワード辞書、6……照合辞書記
憶部、7……キーワード判定部、8……行属性判
定部、9……郵便番号判定部。

Claims (1)

    【特許請求の範囲】
  1. 1 郵便物上に記載されている複数の行にわたつ
    ている単語を抽出する抽出手段と、前記抽出手段
    で抽出された単語とあらかじめ定められた行の属
    性を示す辞書とを比較する比較手段と、前記比較
    手段からの出力を受け前記単語を含む行の属性を
    決定する属性判定部とを具備し、前記属性判定部
    の結果から郵便番号を含む行を識別することを特
    徴とする郵便番号識別装置。
JP56022557A 1981-02-18 1981-02-18 Zip code discriminating device Granted JPS57137976A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP56022557A JPS57137976A (en) 1981-02-18 1981-02-18 Zip code discriminating device
US06/349,938 US4524453A (en) 1981-02-18 1982-02-18 Postal code distinguishing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56022557A JPS57137976A (en) 1981-02-18 1981-02-18 Zip code discriminating device

Publications (2)

Publication Number Publication Date
JPS57137976A JPS57137976A (en) 1982-08-25
JPS6262387B2 true JPS6262387B2 (ja) 1987-12-25

Family

ID=12086149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56022557A Granted JPS57137976A (en) 1981-02-18 1981-02-18 Zip code discriminating device

Country Status (2)

Country Link
US (1) US4524453A (ja)
JP (1) JPS57137976A (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59225487A (ja) * 1983-06-07 1984-12-18 Nec Corp パタ−ン認識方式
JPH0731713B2 (ja) * 1983-09-07 1995-04-10 株式会社東芝 キ−ワ−ド検出方式
JPH07107694B2 (ja) * 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
FR2589267B1 (fr) * 1985-10-25 1991-05-31 Bertin & Cie Procede de traitement d'images, notamment dans une installation de tri postal
JPS62190575A (ja) * 1986-02-18 1987-08-20 Mitsubishi Electric Corp 文字パタ−ン切り出し装置
US4817166A (en) * 1986-05-05 1989-03-28 Perceptics Corporation Apparatus for reading a license plate
JPH069053B2 (ja) * 1986-08-26 1994-02-02 日本電気株式会社 住所辞書照合装置
US5050218A (en) * 1986-08-26 1991-09-17 Nec Corporation Apparatus for recognizing address appearing on mail article
JP2671311B2 (ja) * 1986-08-26 1997-10-29 日本電気株式会社 住所読取装置
US5081685A (en) * 1988-11-29 1992-01-14 Westinghouse Electric Corp. Apparatus and method for reading a license plate
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
US5034985A (en) * 1989-11-13 1991-07-23 Pitney Bowes Inc. Matched mailing system employing address print array recognition
JPH03202966A (ja) * 1989-12-28 1991-09-04 Toshiba Corp 電子ファイリング装置
US5146512A (en) * 1991-02-14 1992-09-08 Recognition Equipment Incorporated Method and apparatus for utilizing multiple data fields for character recognition
JPH0773171A (ja) * 1994-07-29 1995-03-17 Casio Comput Co Ltd 文書処理装置
JP3375766B2 (ja) * 1994-12-27 2003-02-10 松下電器産業株式会社 文字認識装置
US5610995A (en) * 1995-06-06 1997-03-11 United Parcel Service Of America, Inc. Method and apparatus for compressing images containing optical symbols
JP2738383B2 (ja) * 1996-02-29 1998-04-08 日本電気株式会社 宛名読み取り装置
US7120302B1 (en) 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes
GB2392514A (en) * 2002-05-30 2004-03-03 Mike Adams Address identification within an electronic document
EP1496460A1 (en) * 2003-07-08 2005-01-12 Kabushiki Kaisha Toshiba Sorting apparatus and address information determination method
JP2007233913A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP6900164B2 (ja) * 2016-09-27 2021-07-07 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3651459A (en) * 1970-05-15 1972-03-21 Philco Ford Corp Character distance coding
JPS55110B2 (ja) * 1972-06-19 1980-01-05
US3842402A (en) * 1973-10-25 1974-10-15 Ibm Bayesian online numeric discriminator
US4034341A (en) * 1973-12-17 1977-07-05 Nippon Electric Company, Ltd. Automatic postal-code-number reading system
US4013999A (en) * 1974-08-15 1977-03-22 Recognition Equipment Incorporated Single read station acquisition for character recognition
US4105997A (en) * 1977-01-12 1978-08-08 United States Postal Service Method for achieving accurate optical character reading of printed text
JPS5854433B2 (ja) * 1980-09-11 1983-12-05 日本電気株式会社 相違度検出装置
US4400828A (en) * 1981-03-27 1983-08-23 Bell Telephone Laboratories, Incorporated Word recognizer

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AN APPROACH TO ADDRESS IDENTIFICATION FROM DEGRADED ADDRESS DATA NATIONAL COMPUTER CONFERENCE=1977 *

Also Published As

Publication number Publication date
JPS57137976A (en) 1982-08-25
US4524453A (en) 1985-06-18

Similar Documents

Publication Publication Date Title
JPS6262387B2 (ja)
KR100401685B1 (ko) 소재정보의 인식장치, 소재정보의 인식방법 및 기록매체
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
AU606623B2 (en) Character recognition apparatus
JP3106994B2 (ja) 住所読み取り装置
JP2738383B2 (ja) 宛名読み取り装置
JPS6262388B2 (ja)
JP3145071B2 (ja) 文字認識方法および装置
JP2671311B2 (ja) 住所読取装置
JPH0441388B2 (ja)
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JP2655087B2 (ja) 文字認識後処理方式
JP2795003B2 (ja) 文字認識処理装置
JP2007511842A (ja) スマートポーリングに対するシステム及び方法
JPS63303481A (ja) 住所読取装置
JPH11120294A (ja) 文字認識装置および媒体
JP2839515B2 (ja) 文字読取システム
JPH07271920A (ja) 文字認識装置
JPH08249427A (ja) 文字認識方法および装置
JPH04318687A (ja) 文字認識装置
JPH0793467A (ja) 住所読取システム
JPS60138689A (ja) 文字認識方法
JPS5847066B2 (ja) 文字認識装置
JPH0514953B2 (ja)
JPH07105225A (ja) 辞書検索装置