JP4706379B2 - Address recognition device - Google Patents

Address recognition device Download PDF

Info

Publication number
JP4706379B2
JP4706379B2 JP2005226635A JP2005226635A JP4706379B2 JP 4706379 B2 JP4706379 B2 JP 4706379B2 JP 2005226635 A JP2005226635 A JP 2005226635A JP 2005226635 A JP2005226635 A JP 2005226635A JP 4706379 B2 JP4706379 B2 JP 4706379B2
Authority
JP
Japan
Prior art keywords
address
reading
database
registered
reading result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005226635A
Other languages
Japanese (ja)
Other versions
JP2007041919A (en
Inventor
章仁 榊原
直之 高橋
克彦 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005226635A priority Critical patent/JP4706379B2/en
Publication of JP2007041919A publication Critical patent/JP2007041919A/en
Application granted granted Critical
Publication of JP4706379B2 publication Critical patent/JP4706379B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は住所認識装置に関し、特に、郵便物に記載された宛先の住所を光学的に読み取り、住所データベースを参照することによって記載住所の最終判定を行うとともに、住所データベースの更新を行う住所認識装置に関するものである。   The present invention relates to an address recognition device, and more particularly to an address recognition device that optically reads an address of a destination described in a mail piece, makes a final determination of the written address by referring to the address database, and updates the address database. It is about.

従来、郵便自動区分機においては、配達対象となる地域に存在する住所の一覧情報が住所データベースに格納されている。そして、郵便物に記載された宛先の住所を光学的に読み取った結果が、住所データベースに存在するか否かを照合し、最終結果を判定するために用いられる。ここで、読み取り結果を住所データベースに照合した結果、読み取り結果が登録されていなかった場合は、読み取った住所はその地域に存在しない扱いとなり、区分不可能となる。
この住所データベースの作成には、一般に人による住所要素の登録作業が必要であり、作成当初から全ての住所要素を完備することは非常に困難である。さらに、市町村の統廃合等により実際に存在する住所が変化することから、データベースの定期的メンテナンスに関する必要性は大きい。例えば、2つの市が統合し新しい市名になった場合、市2つ分の住所がデータベースに存在しない状態になってしまう。
実作業上で、住所データベースに新しい候補を登録する場合、宛先の住所を読み取ることができなかった郵便物に記載された実際の住所を、住所データベースと照合し、登録されていないことを確認した後、手動による登録作業を行う。
また、宛名辞書の更新動作を開始する前に、宛名データベース内の宛名データから宛名辞書への登録条件(読み取り回数条件)の調整入力を要求し、入力された登録条件に適合する宛名データのみを宛名辞書に登録することにより、誤ったデータが宛名辞書に追加されてしまうことを防ぐことができるようにしたものがある(例えば、特許文献1参照)。
また、ビデオコーディングでの入力情報(正解宛名コード)および認識情報(リジェクトされた郵便物の文字パターン画像データ)を収集し、収集された情報に基づいて、宛名の認識に用いる辞書(宛名知識データベース)の内容を補充・更新する。そして、この内容補充・更新(つまり学習)された宛名知識データベースを参照することにより、郵便物に記載された宛名が高い正答率で自動的に認識されるようにしたものがある(例えば、特許文献2参照)。
特開2000−279894号公報 特開平9−57204号公報
Conventionally, in an automatic mail sorting machine, address list information existing in an area to be delivered is stored in an address database. Then, the result of optically reading the address of the destination described in the postal matter is used to collate whether or not it exists in the address database and determine the final result. Here, if the read result is not registered as a result of collating the read result with the address database, the read address is treated as not existing in the area and cannot be classified.
Creation of this address database generally requires registration of address elements by a person, and it is very difficult to complete all address elements from the beginning. Furthermore, since the address that actually exists changes due to the consolidation of municipalities, etc., there is a great need for regular database maintenance. For example, when two cities are integrated to become a new city name, the addresses for the two cities do not exist in the database.
In practice, when registering a new candidate in the address database, the actual address listed in the mail piece for which the destination address could not be read was checked against the address database to confirm that it was not registered. Later, manual registration is performed.
In addition, before starting the address dictionary update operation, it requests the adjustment input of the registration condition (reading number condition) to the address dictionary from the address data in the address database, and only the address data that meets the input registration condition is requested. There is one that can prevent erroneous data from being added to the address dictionary by registering it in the address dictionary (see, for example, Patent Document 1).
It also collects input information (correct answer address code) and recognition information (character pattern image data of rejected postal items) in video coding, and a dictionary (address knowledge database) used for address recognition based on the collected information. ) Is replenished / updated. Then, by referring to the address knowledge database supplemented / updated (that is, learned), the address described in the mail is automatically recognized with a high correct answer rate (for example, patents) Reference 2).
JP 2000-279894 A JP-A-9-57204

しかしながら、背景技術には次のような問題点があった。
第1の問題点は、未登録の住所登録候補を高い信頼性を持って、簡単な手順で住所データベースに登録するシステムが確立されていないことである。その理由は、ビデオコーディングシステム(郵便自動区分機において、郵便物に記載された宛先の読み取り結果を用いて最終結果判定を自動的に導く処理に失敗した場合にオペレータにより記載住所の正解入力を可能とする機能)の正解入力を単純に用いた場合、郵便番号のみの入力や頭文字入力等、オペレータの負荷を減らすために省略された入力方法を用いることが多いため、郵便物に記載されている住所文字列を正確に収集することが難しいからである。
第2の問題点は、住所データベースの更新作業を行うまでは、住所データベースに未登録の住所が記載されている郵便物は、正しく宛先が読み取られている場合でも、全て区分不可能として扱われ続けてしまうことである。その理由は、信頼性を高めるためある程度の期間は住所登録候補のデータを蓄積する必要があるが、その間は住所データベースへの更新が行われず、読み取り不可判定の状態が続くからである。
第3の問題点は、住所データベースの更新作業を行うにあたり、住所データベースに特定の未登録住所を登録した場合に、読み取り性能に与える効果が予測できないということである。その理由は、通常、住所データベースの更新には、読み取り不可であった郵便物の中から未登録住所の候補を探す作業が必要であるが、未登録の場合でも定量的な数値として実際の郵便物中にどの程度の割合、同じ住所が含まれているかわからないからである。
本発明の目的は、郵便自動区分機の宛先読み取りで、記載住所を正しく読み取ることができたが住所データベースに未登録のため読み取り不可判定となる住所登録候補を、オペレータの簡易な作業を介して住所データベースに登録することである。それにより、住所データベースの精度が向上し、記載住所を正しく読み取れている場合の読み取り不可判定が減少するため、郵便自動区分機の区分性能の向上が図れる。同時に、従来より行われていた住所データベース更新作業の簡略化が図れるため、保守性の向上にも繋がる。
本発明のその他の目的は、住所登録候補をオペレータの簡易な作業を介して、さらに読み取り頻度、読み取り性能改善割合に基づき情報住所データベースに登録することにより、誤った住所登録候補を排除し信頼性の高い住所登録候補のみを住所データベースに登録することができるようにすることである。
本発明のさらにその他の目的は、読み取り結果が住所データベースに登録されていない場合でも、過去の読み取り結果に基づき信頼性の高い場合に最終判定可能とすることである。
本発明のさらにその他の目的は、ビデオコーディングシステムを用いた記載住所の入力作業において記載住所が住所データベースに未登録であった場合に住所の入力の操作性を向上させることである。
However, the background art has the following problems.
The first problem is that a system for registering unregistered address registration candidates with high reliability in the address database with a simple procedure has not been established. The reason for this is that the video coding system (in the automatic mail sorter, the operator can input the correct address of the written address when the process of automatically deriving the final result determination using the reading result of the address written in the mail piece fails. When the correct answer input is used simply, the input method that is omitted to reduce the burden on the operator, such as inputting only the zip code or initials, is often used. This is because it is difficult to accurately collect existing address strings.
The second problem is that until the address database is updated, all mail items with unregistered addresses in the address database are treated as unclassifiable even if the address is read correctly. It is to continue. The reason is that address registration candidate data needs to be accumulated for a certain period of time in order to improve reliability, but the address database is not updated during that period, and the unreadable determination state continues.
The third problem is that when a specific unregistered address is registered in the address database, the effect on the reading performance cannot be predicted when the address database is updated. The reason for this is that updating the address database usually requires searching for unregistered address candidates from postal items that could not be read. This is because it is unclear how much the same address is included in the object.
An object of the present invention is to read address registration candidates that can be read correctly by the automatic mail sorting machine, but are unregistered because they are not registered in the address database, through simple operations of the operator. It is to register in the address database. As a result, the accuracy of the address database is improved, and the non-readability determination is reduced when the written address is read correctly, so that the sorting performance of the automatic mail sorting machine can be improved. At the same time, it is possible to simplify the address database update operation that has been performed conventionally, leading to improvement in maintainability.
Another object of the present invention is to eliminate the possibility of erroneous address registration candidates by registering the address registration candidates in the information address database based on the reading frequency and the reading performance improvement rate through a simple operation of the operator. It is to be able to register only high address registration candidates in the address database.
Still another object of the present invention is to make final determination possible when the reading result is not registered in the address database and the reliability is high based on the past reading result.
Still another object of the present invention is to improve the operability of inputting an address when the described address is not registered in the address database in the input operation of the described address using the video coding system.

請求項1に記載の住所認識装置は、郵便物に記載された宛先の住所を光学的に読み取り、住所データベースを参照することにより前記住所の最終判定結果を導く機能を有する住所認識装置であって、前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記郵便物の画像と、読み取り結果および前記住所の階層の読み取り位置情報を所定の表示装置に表示させる表示制御手段と、前記表示装置に表示された前記読み取り結果に対してユーザによって入力される正誤判定を取得する入力手段と、前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記読み取り結果および前記入力手段によって取得された正誤判定に基づいて、前記読み取り結果が前記読み取り結果を記憶する住所登録候補データベースに登録されているときに、前記読み取り結果の総数に対して前記正誤判定で正と判定された割合と前記読み取り結果の総数に対して前記正誤判定で誤と判定された割合とを示す読み取り性能改善割合を算出し、前記読み取り結果に対応する前記住所データベースの未登録の住所登録候補を前記住所データベースに登録したときの前記読み取り性能改善割合を最終登録手段に提示する提示手段と、前記読み取り性能改善割合の前記正と判定された割合が第1基準値以上であり前記誤と判定された割合が第2基準値以下であるときに前記未登録の住所登録候補を前記住所データベースに登録する最終登録手段とを備えることを特徴とする。
また、前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記住所データベースに登録されていない前記読み取り結果について前記入力手段によって取得された正誤判定に基づいて一定頻度以上で正しく読み取られているときに、前記住所を前記住所データベースに登録されていない未登録の住所登録候補として前記住所データベースに仮登録する登録手段をさらに備えるようにすることができる。
また、住所登録候補には、既に住所データベースに登録されている住所の変形住所も含まれるようにすることができる。
また、前記住所が光学的に読み取られた読み取り結果と該読み取り結果に対する読み取り頻度と前記読み取り結果を正しく読んだ割合とを記憶する住所登録候補データベースを備え、読み取り結果が前記住所データベースに登録されていない場合、前記住所登録候補データベースに記憶された前記読み取り結果に基づいて一定頻度以上で正しく読み取られているときに最終判定出力を可能とすることができる。
請求項5に記載の住所認識方法は、郵便物に記載された宛先の住所を光学的に読み取り、住所データベースを参照することにより前記住所の最終判定結果を導く機能を有する住所認識装置における住所認識方法であって、前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記郵便物の画像と、読み取り結果および前記住所の階層の読み取り位置情報を所定の表示装置に表示させる表示制御ステップと、前記表示装置に表示された前記読み取り結果に対してユーザによって入力される正誤判定を取得する入力ステップと、前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記読み取り結果および前記入力手段によって取得された正誤判定に基づいて、前記読み取り結果が前記読み取り結果を記憶する住所登録候補データベースに登録されているときに、前記読み取り結果の総数に対して前記正誤判定で正と判定された割合と前記読み取り結果の総数に対して前記正誤判定で誤と判定された割合とを示す読み取り性能改善割合を算出し、前記読み取り結果に対応する前記住所データベースの未登録の住所登録候補を前記住所データベースに登録したときの前記読み取り性能改善割合を最終登録ステップに提示する提示ステップと、
前記読み取り性能改善割合の前記正と判定された割合が第1基準値以上であり前記誤と判定された割合が第2基準値以下であるときに前記未登録の住所登録候補を前記住所データベースに登録する最終登録ステップとを備えることを特徴とする。
請求項6に記載の住所認識プログラムは、郵便物に記載された宛先の住所を光学的に読み取り、住所データベースを参照することにより前記住所の最終判定結果を導く機能を有する住所認識装置を制御する住所認識プログラムであって、前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記郵便物の画像と、読み取り結果および前記住所の階層の読み取り位置情報を所定の表示装置に表示させる表示制御ステップと、前記表示装置に表示された前記読み取り結果に対してユーザによって入力される正誤判定を取得する入力ステップと、前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記読み取り結果および前記入力手段によって取得された正誤判定に基づいて、前記読み取り結果が前記読み取り結果を記憶する住所登録候補データベースに登録されているときに、前記読み取り結果の総数に対して前記正誤判定で正と判定された割合と前記読み取り結果の総数に対して前記正誤判定で誤と判定された割合とを示す読み取り性能改善割合を算出し、前記読み取り結果に対応する前記住所データベースの未登録の住所登録候補を前記住所データベースに登録したときの前記読み取り性能改善割合を最終登録ステップに提示する提示ステップと、前記読み取り性能改善割合の前記正と判定された割合が第1基準値以上であり前記誤と判定された割合が第2基準値以下であるときに前記未登録の住所登録候補を前記住所データベースに登録する最終登録ステップとを備えることを特徴とする。
The address recognition apparatus according to claim 1 is an address recognition apparatus having a function of optically reading an address of a destination described in a mail piece and deriving a final determination result of the address by referring to an address database. When the reading result obtained by optically reading the address is not registered in the address database, the image of the mail piece, the reading result, and the reading position information of the hierarchy of the address are displayed on a predetermined display device. Display control means, input means for acquiring a correct / incorrect determination input by the user for the reading result displayed on the display device, and a reading result obtained by optically reading the address are registered in the address database. If not, on the basis of the right or wrong decision acquired by the read result and the input means, the reading results before When registered in the address registration candidate database for storing the reading results, the ratio determined to be correct in the correctness determination with respect to the total number of the reading results and the error in the correctness determination with respect to the total number of the reading results calculating the read performance improvement ratio shown and the determined ratio, a final registration means said read performance improvement rate when registering an unregistered address candidate for the address database corresponding to the read result to the address database Presenting means for presenting and registering the unregistered address when the ratio of the reading performance improvement ratio determined to be positive is equal to or higher than a first reference value and the ratio determined to be incorrect is equal to or lower than a second reference value And final registration means for registering candidates in the address database.
Further, when a reading result obtained by optically reading the address is not registered in the address database, the reading result that is not registered in the address database is fixed based on a correctness determination acquired by the input unit. It may further comprise a registration means for temporarily registering the address in the address database as an unregistered address registration candidate not registered in the address database when it is correctly read at a frequency or higher.
Further, the address registration candidates may include modified addresses of addresses already registered in the address database.
And an address registration candidate database for storing a reading result obtained by optically reading the address, a reading frequency with respect to the reading result, and a ratio of correctly reading the reading result, and the reading result is registered in the address database. If there is not, the final determination output can be made when the reading is correctly performed at a certain frequency or more based on the reading result stored in the address registration candidate database.
6. The address recognition method according to claim 5, wherein the address recognition apparatus has a function of optically reading an address of a destination described in a mail piece and deriving a final determination result of the address by referring to an address database. In the method, when a reading result obtained by optically reading the address is not registered in the address database, an image of the mail piece, a reading result, and reading position information of the hierarchy of the address are displayed in a predetermined manner. A display control step for displaying on the device; an input step for acquiring a correct / incorrect determination input by a user for the reading result displayed on the display device; and a reading result obtained by optically reading the address. If not registered in the database, based on the accuracy judgment obtained by the read result and said input means There are, when the reading result has been registered in the address registration candidate database storing the read result, to the total number of the right or wrong decision in positive and determined to be the ratio between the read result of the total number of the reading results the read performance when the correctness calculates the read performance improvement ratio shown and proportions it is determined that erroneous determination, were enrolled unregistered address candidate for the address database corresponding to the read result to the address database Te A presentation step that presents the improvement percentage in the final registration step ;
The unregistered address registration candidate is stored in the address database when the ratio of the read performance improvement ratio determined to be positive is equal to or greater than a first reference value and the ratio determined to be incorrect is equal to or less than a second reference value. And a final registration step of registration.
The address recognition program according to claim 6 controls an address recognition apparatus having a function of optically reading an address of a destination described in a mail piece and deriving a final determination result of the address by referring to an address database. In the address recognition program, when a reading result obtained by optically reading the address is not registered in the address database, an image of the postal matter, a reading result, and reading position information of the address hierarchy are predetermined. A display control step for displaying on the display device, an input step for obtaining a correct / incorrect determination input by the user with respect to the read result displayed on the display device, and a read result obtained by optically reading the address. If not registered in the address database, acquired by the read result and said input means Based on the accuracy determination, the reading when the result is registered in the address registration candidate database storing the read result, the correctness determination positive and determined to be the ratio between the reading result with respect to the total number of the reading results Calculating a reading performance improvement ratio indicating a ratio determined to be incorrect in the correctness determination with respect to the total number, and registering unregistered address registration candidates in the address database corresponding to the reading result in the address database wherein the presenting step of presenting the read performance improvement rate in the final registration step, the read performance improvement rate the positive and the determined ratio is higher than the first reference value the erroneous judgment has been percentage second reference value of and wherein said unregistered addresses registered candidate to and a final registration step of registering the address database when it is less That.

本発明によれば、住所が光学的に読み取られた読み取り結果が住所データベースに登録されていない場合に、郵便物の画像と、読み取り結果および付加情報を所定の表示装置に表示させ、表示装置に表示された読み取り結果に対して正誤判定を入力するようにしたので、高い信頼性を持って読み取られた結果が住所データベースに登録されていなかった場合に、対象郵便物の画像上に読み取り結果と読み取り位置をわかりやすく表示してオペレータが住所登録候補を簡易に確認することができ、正誤判定の入力のみで住所登録候補の登録が可能となる。
また、住所が光学的に読み取られた読み取り結果が住所データベースに登録されていない場合に、読み取り結果および入力された正誤判定に基づいて、住所を住所データベースに登録されていない未登録の住所登録候補として住所データベースに登録することにより、高い信頼性を持って読み取られた結果が住所データベースに登録されていなかった場合に、信頼性の高い住所登録候補を住所データベースに登録することができる。
また、住所登録候補には、既に住所データベースに登録されている住所の変形住所も含まれるようにすることにより、読み取り精度を向上させることができる。
また、住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、読み取り結果および入力手段によって入力された正誤判定に基づいて、住所を住所データベースに登録されていない未登録の住所登録候補として住所データベースに登録したときの効果を提示するようにすることにより、高い信頼性を持って読み取られた結果を住所データベースに登録することができる。
また、読み取り結果が前記住所データベースに登録されていない場合、過去の読み取り結果に基づいて信頼性が高いとき最終判定出力を可能とすることにより、信頼性の高い読み取り結果を住所データベースに登録することができる。
According to the present invention, when a reading result obtained by optically reading an address is not registered in the address database, an image of a mail piece, a reading result, and additional information are displayed on a predetermined display device, and the display device Since correct / incorrect judgment is input to the displayed reading result, when the result read with high reliability is not registered in the address database, the reading result is displayed on the image of the target mail piece. The reading position is displayed in an easy-to-understand manner, so that the operator can easily confirm the address registration candidates, and the address registration candidates can be registered only by inputting correctness / incorrectness.
In addition, when the reading result obtained by optically reading the address is not registered in the address database, an unregistered address registration candidate whose address is not registered in the address database based on the reading result and the entered correctness determination By registering in the address database, if the result read with high reliability is not registered in the address database, a highly reliable address registration candidate can be registered in the address database.
In addition, it is possible to improve the reading accuracy by including the modified address of the address already registered in the address database in the address registration candidate.
In addition, when the reading result obtained by optically reading the address is not registered in the address database, the address is not registered in the address database based on the reading result and the correctness determination input by the input unit. By presenting the effect of registering in the address database as an address registration candidate, it is possible to register the result read with high reliability in the address database.
In addition, when the reading result is not registered in the address database, the highly reliable reading result is registered in the address database by enabling the final determination output when the reliability is high based on the past reading result. Can do.

以下、本発明の実施の形態の構成および動作について図面を参照して詳細に説明する。図1を参照すると、本発明の実施の形態は、配達地域内の住所の一覧情報を記憶する住所データベース4と、図示しない光学式文字読み取り装置(OCR:Optical Character Reader、バーコードリーダー等)を用いて住所を読み取り、住所データベース4および住所登録候補データベース3を参照し、読み取り結果の妥当性を判定する住所読み取り・判定部1と、住所読み取り・判定部1で高い信頼性を持って読み取られた結果が住所データベース4に登録されていなかった場合にオペレータが判定結果を確認する住所登録候補判定部2と、住所登録候補判定部2により判定された正誤情報、読み取り情報、頻度、および各住所登録候補を登録した場合の読み取り性能の改善割合を住所登録候補データベース3に登録する住所登録候補登録部5と、住所登録候補の情報を保持する住所登録候補データベース3と、予め定められた頻度以上の読み取り頻度、もしくは性能改善割合を持ち、住所データベース4に未登録の住所を、住所データベース4に登録する住所データ更新部6とを有する。   Hereinafter, the configuration and operation of an embodiment of the present invention will be described in detail with reference to the drawings. Referring to FIG. 1, an embodiment of the present invention includes an address database 4 for storing list information of addresses in a delivery area, and an optical character reader (OCR: Optical Character Reader, bar code reader, etc.) not shown. Using the address reading / determination unit 1 and the address reading / determination unit 1 to read the address and refer to the address database 4 and the address registration candidate database 3 to determine the validity of the read result, the address is read with high reliability. Address registration candidate determination unit 2 in which the operator confirms the determination result when the result is not registered in the address database 4, correct / incorrect information determined by the address registration candidate determination unit 2, read information, frequency, and each address An address registration candidate registration unit 5 that registers the improvement rate of the reading performance when registering registration candidates in the address registration candidate database 3, and an address registration Address registration candidate database 3 that holds information on record candidates, and address data update that has a reading frequency or performance improvement ratio that is equal to or higher than a predetermined frequency, and registers an unregistered address in the address database 4 in the address database 4 Part 6.

次に、図1に示した実施の形態の動作について説明する。   Next, the operation of the embodiment shown in FIG. 1 will be described.

1.住所読み取り・判定部1において、光学式文字読み取り装置(OCR:Optical Character Reader、バーコードリーダー等)を用いて郵便物に記載されている宛先住所またはそれに相当するバーコードを読み取る(例:日本の住所の場合は、郵便番号、都道府県、市町村、丁目、番地等)。   1. The address reading / determination unit 1 uses an optical character reader (OCR: Optical Character Reader, bar code reader, etc.) to read a destination address written in a mail piece or a bar code corresponding thereto (eg, Japan) In the case of an address, postal code, prefecture, municipality, chome, street address, etc.).

2.住所読み取り・判定部1において、読み取った結果を住所データベース4と照合し、登録済みの場合は読み取り完了となる。また、住所データベース4に登録されていない場合は、住所登録候補データベース3を照合し、過去の読み取りにおいて同様の読み取り結果が一定頻度以上で正しく読み取れている場合は読み取り完了とする。ここで、読み取り結果が高い信頼性を持って読み取られているにも関わらず、住所データベース4に存在していない場合は読み取り結果、読み取り付加情報が郵便物の画像と共に住所登録候補判定部2に送られる(住所登録候補データベース3を照合し、読み取り完了となった場合も送られる。)。住所結果判定のフローを図2に示す。   2. In the address reading / determining unit 1, the read result is checked against the address database 4, and if registered, the reading is completed. If it is not registered in the address database 4, the address registration candidate database 3 is collated, and if the same reading result is read correctly at a certain frequency or more in the past reading, the reading is completed. Here, when the read result is read with high reliability but does not exist in the address database 4, the read result and the read additional information are sent to the address registration candidate determination unit 2 together with the mail image. (Sent when the address registration candidate database 3 is collated and reading is completed.) The flow of address result determination is shown in FIG.

3.住所登録候補判定部2において住所読み取り・判定部1から送られた住所読み取り結果に基づき、読み取り結果が表示され(例えば画像中の読み取り位置を赤枠表示、その下に読み取り結果表示を行う)、オペレータは、表示された読み取り情報を確認し、正誤判定を行い、正誤判定結果を入力する。   3. Based on the address reading result sent from the address reading / determination unit 1 in the address registration candidate determination unit 2, the reading result is displayed (for example, the reading position in the image is displayed in a red frame, and the reading result is displayed below). The operator confirms the displayed reading information, makes a correct / incorrect determination, and inputs the correct / incorrect determination result.

4.住所登録候補判定部2で入力された正誤判定結果および読み取り情報が、住所登録候補登録部5に送られる。   4). The correctness / incorrectness determination result and the read information input by the address registration candidate determination unit 2 are sent to the address registration candidate registration unit 5.

5.住所登録候補登録部5は、住所登録候補判定部2で確認された住所登録候補が、住所登録候補データベース3に登録されているか否かを検索して確認し、登録されていない場合は登録する。また、登録されている場合は、その登録候補の読み取り頻度、読み取り性能改善割合の情報を更新する。   5. The address registration candidate registration unit 5 searches and confirms whether the address registration candidate confirmed by the address registration candidate determination unit 2 is registered in the address registration candidate database 3, and registers if it is not registered. . If registered, the information on the reading frequency and reading performance improvement ratio of the registration candidate is updated.

6.住所データ更新部6では、住所登録候補データベース3を任意のタイミングで検索し、設定された認識頻度を越える住所登録候補が存在する場合、もしくは設定された読み取り性能改善割合を越える住所登録候補が存在する場合、住所データベース4にその住所登録候補を登録する。住所データベースの登録フローを図3に示す。   6). The address data update unit 6 searches the address registration candidate database 3 at an arbitrary timing, and when there is an address registration candidate exceeding the set recognition frequency, or there is an address registration candidate exceeding the set reading performance improvement rate. If so, the address registration candidate is registered in the address database 4. The registration flow of the address database is shown in FIG.

図1における住所登録候補判定部2は、郵便自動区分機においてビデオコーディングシステムを備えている場合、ビデオコーディングシステムにおける記載住所の入力と同時に住所登録候補の登録を行うことができる。   The address registration candidate determination unit 2 in FIG. 1 can register an address registration candidate simultaneously with the input of a written address in the video coding system when the automatic mail sorting machine includes a video coding system.

住所データ更新部6における住所データベース4への登録処理は、より信頼性を高めるため、信頼性および読み取り性能改善割合の高い候補から優先的に人が確認し、手動登録を行う形式にすることも可能である。また、その際、追加の付加情報を入力できるようにすることも可能である。   The registration process to the address database 4 in the address data update unit 6 may be in a format in which a person is preferentially confirmed from candidates with a high reliability and reading performance improvement ratio and is subjected to manual registration in order to improve reliability. Is possible. At that time, additional additional information can be input.

次に、図2のフローチャートを参照して、本実施の形態における宛先読み取りから読み取り結果判定までの流れを説明する。   Next, the flow from destination reading to reading result determination in the present embodiment will be described with reference to the flowchart of FIG.

1.住所読み取り・判定部1において、光学式文字読み取り装置(OCR:Optical Character Reader、バーコードリーダー等)を用いて郵便物に記載されている各住所階層(郵便番号、都道府県、市町村、丁目、番地等)を読み取る(ステップA1)。   1. In the address reading / determining section 1, each address hierarchy (postal code, prefecture, municipality, chome, street address) described in the mail using an optical character reader (OCR: Optical Character Reader, barcode reader, etc.) Etc.) is read (step A1).

2.読み取り結果文字列の単語単位での読み取りの確からしさを、予め設定された基準値と比較して、信頼性が高い読み取り結果が得られたかどうかの判定を行う(ステップA2)。ここで、単語読み取りの信頼性が設定された基準値より低い場合は、最終出力なしとなり、「読み取り不可(1)」となる(ステップA8)。   2. The probability of reading the read result character string in units of words is compared with a preset reference value to determine whether or not a read result with high reliability has been obtained (step A2). If the word reading reliability is lower than the set reference value, there is no final output and “reading is impossible (1)” (step A8).

3.ステップA2において、信頼性が高いと判断された場合、住所読み取り・判定部1において、読み取った結果を住所データベース4と照合する(ステップA3)。ステップA3において、読み取り結果が住所データベース4に登録されている場合は、読み取り結果を最終判定出力とし、「読み取り完了(1)」となる(ステップA7)。   3. If it is determined in step A2 that the reliability is high, the address reading / determination unit 1 checks the read result against the address database 4 (step A3). In step A3, when the reading result is registered in the address database 4, the reading result is set as a final determination output, and “reading completion (1)” is obtained (step A7).

4.住所データベース4に登録されていない場合は、住所登録候補データベース3と照合し、過去の読み取りにおいて同様の読み取り結果が一定頻度以上で正しく読み取られたかを判定する(ステップA4)。ステップA4において、一定頻度以上で正しく読み取れている場合は、読み取り結果を最終判定結果として出力し「読み取り完了(2)」とする(ステップA6)。ただし、この場合は後で述べる住所登録候補データベース3への更新処理を行った後に処理終了となる(ステップA9)。   4). If it is not registered in the address database 4, it is checked against the address registration candidate database 3 to determine whether or not the same reading result has been correctly read in a past reading (step A 4). In step A4, when the reading is correctly performed at a certain frequency or more, the reading result is output as the final determination result and is set as “reading completion (2)” (step A6). However, in this case, the processing ends after performing update processing to the address registration candidate database 3 described later (step A9).

「読み取り完了(2)」の対象となる住所登録候補は住所データベース4に仮登録されている状態となり、この場合の最終判定出力を仮登録出力と呼ぶこととする。ステップA6における区分により、仮登録の住所登録候補に対する信頼性の検証および最終判定の許可が行われ、読み取り性能の向上が図れる。また、最終的に住所データベース4に登録するかどうかの判断は、後で述べる有効性(仮登録の住所登録候補を住所データベース4に登録した場合に読み取り性能がどう変化するか)の検討を行った後に判断することができる。   The address registration candidate subject to “reading completion (2)” is temporarily registered in the address database 4, and the final determination output in this case is referred to as temporary registration output. By the classification in step A6, the verification of the reliability and the final determination are permitted for the temporary registration address registration candidate, and the reading performance can be improved. In addition, whether or not to finally register in the address database 4 is determined by examining the effectiveness described later (how the reading performance changes when a temporary registration address registration candidate is registered in the address database 4). Can be judged after.

5.ステップA4において、一定頻度以上で正しく読めていないと判断された場合は、最終判定結果なしとなり「読み取り不可(2)」となる(ステップA5)。その後、住所登録候補データベース3更新処理(ステップA9)の後、処理終了となる(ステップA9)。   5. If it is determined in step A4 that reading is not correctly performed at a certain frequency or more, there is no final determination result and “reading is not possible (2)” (step A5). Thereafter, after the address registration candidate database 3 update process (step A9), the process ends (step A9).

次に、図3のフローチャートを参照して、住所登録候補データベース3への更新処理について説明する。   Next, update processing to the address registration candidate database 3 will be described with reference to the flowchart of FIG.

6.読み取り結果が高い信頼性を持って読み取られているにも関わらず、住所データベース4に存在していない場合(ステップA3において、ノーの判定の場合)は、住所登録候補データベース3の更新処理が必ず行われる(ステップA9)。各住所階層の読み取り結果、読み取り位置情報が郵便物のスキャン画像と共に住所登録候補判定部2に送られる(例えば、読み取り結果が、「183−0036、東京都、府中市、日新町、1丁目」であり、日新町が住所データベースに存在しない場合、「183−0036、東京都、府中市、日新町」の各階層の読み取り情報、位置情報が送られる)。   6). If the reading result is read with high reliability but does not exist in the address database 4 (in the case of no determination in step A3), the address registration candidate database 3 is always updated. Performed (step A9). The reading result of each address hierarchy and the reading position information are sent to the address registration candidate determination unit 2 together with the scanned image of the mail (for example, the reading results are “183-0036, Tokyo, Fuchu City, Nisshincho, 1-chome”). If Nisshincho does not exist in the address database, the reading information and position information of each layer of “183-0036, Tokyo, Fuchu City, Nisshincho” are sent).

さらに、住所読み取り・判定部1において、各判定結果(「読み取り完了(1)」、「読み取り完了(2)」、「読み取り不可(1)」、および、「読み取り不可(2)」)の総数をカウントし、住所登録候補登録部5にカウント情報が送られる。     Further, in the address reading / determination unit 1, the total number of determination results (“read complete (1)”, “read complete (2)”, “unreadable (1)”, and “unreadable (2)”). And the count information is sent to the address registration candidate registration unit 5.

7.住所登録候補判定部2において住所読み取り・判定部1から送られた住所読み取り結果、読み取り位置結果に基づき、郵便物の画像上の読み取り位置、読み取り結果がオペレータの操作画面上に表示される(例えば、183−0036、東京都、府中市は青枠表示、日新町は赤枠表示とし、その下に読み取り結果表示を行う)。   7. Based on the address reading result and the reading position result sent from the address reading / determination unit 1 in the address registration candidate determination unit 2, the reading position and the reading result on the mail image are displayed on the operation screen of the operator (for example, 183-0036, Tokyo and Fuchu City are displayed in a blue frame, Nisshincho is displayed in a red frame, and the reading result is displayed below.

8.オペレータは、住所登録候補判定部2において、表示された各読み取り情報を確認し、正解している場合は「イエス」キー、誤っている場合は「ノー」キーをキーボードより入力する(ステップB1)。この正誤判定により、「読み取り完了(2)」が、「読み取り完了(2)(正)」と「読み取り完了(2)誤)」に分けられ、「読み取り不可(2)」が、「読み取り不可(2)(正)」と「読み取り不可(2)(誤)」に分類される。   8). The operator confirms each displayed reading information in the address registration candidate determination unit 2, and inputs the “yes” key from the keyboard if correct and the “no” key if incorrect (step B1). . By this correctness determination, “reading completion (2)” is divided into “reading completion (2) (correct)” and “reading completion (2) error)”, and “reading impossible (2)” is “reading impossible” (2) (Correct) "and" Unreadable (2) (Error) ".

ところで、この工程は、ビデオコーディングシステム(住所読み取り・判定部1で住所読み取りできなかった場合に、オペレータにより記載住所情報を入力するシステム、通常は郵便物のスキャン画像のみ表示)を搭載したシステムの場合、住所入力作業と同時に行うことができる。   By the way, this process is performed by a system equipped with a video coding system (a system for inputting address information by an operator when the address reading / determination unit 1 cannot read an address, usually displaying only a scanned image of mail). In this case, it can be performed simultaneously with the address input work.

また、従来、データベースに登録されていない住所をビデオコーディングシステムでオペレータが入力した場合、文字列入力を行った後に入力エラーとなり、数回入力エラーを繰り返すか、未登録判定をオペレータが行った場合に区分不可能の判定がなされる。   Also, conventionally, when an operator inputs an address that is not registered in the database with a video coding system, an input error occurs after inputting a character string, and the input error is repeated several times or an unregistered determination is made by the operator It is determined that the classification is impossible.

ここで、本発明により、住所読み取り・判定部1での読み取り結果を表示し、オペレータが正誤判定を行った場合、例えば、1度の「イエス」キー、或いは「ノー」キーの入力で入力を完了することができるため、住所データベース4に未登録の郵便物に対する住所入力を簡略化することができる。   Here, according to the present invention, when the reading result in the address reading / determination unit 1 is displayed and the operator makes a correct / incorrect determination, for example, the input is performed by inputting “yes” key or “no” key once. Since it can be completed, it is possible to simplify address input for mail that is not registered in the address database 4.

9.ステップB1の結果が住所登録候補登録部5に送られる。住所登録候補登録部5は、住所登録候補判定部2で確認された住所登録候補が、住所登録候補データベース3に登録されているかを検索し(ステップB2)、登録されていない場合は登録し認識回数を1回とする(ステップB3)。また、登録されている場合は、その登録候補の認識回数を1回増やす(ステップB4)。   9. The result of step B1 is sent to the address registration candidate registration unit 5. The address registration candidate registration unit 5 searches whether the address registration candidate confirmed by the address registration candidate determination unit 2 is registered in the address registration candidate database 3 (step B2). If it is not registered, it is registered and recognized. The number of times is set to 1 (step B3). If registered, the registration candidate recognition count is increased by one (step B4).

さらに、仮登録の住所登録候補(「読み取り完了(2)(正)」および「読み取り完了(2)(誤)」となった候補)に対し、読み取り性能改善割合(住所読み取り・判定部1より送られたカウント情報を用いて、仮登録候補を正しく読んだ割合、間違って読んだ割合)を計算し、住所登録候補データベース3に登録する(ステップB5およびB6)。計算式は下記に示す。   Further, for the temporary registration address registration candidates (candidates for “reading completion (2) (correct)” and “reading completion (2) (incorrect))”, the reading performance improvement ratio (from the address reading / determination unit 1) Using the sent count information, the provisional registration candidates are read correctly and the wrong reading ratios are calculated and registered in the address registration candidate database 3 (steps B5 and B6). The calculation formula is shown below.

正しく読んだ割合=「読み取り完了(2)(正)」/(「読み取り完了(1)」+「読み取り完了(2)」+「読み取り不可(1)」+「読み取り不可(2)」)   Proper reading rate = “reading completion (2) (correct)” / (“reading completion (1)” + “reading completion (2)” + “reading impossible (1)” + “reading impossible (2)”)

誤って読んだ割合=「読み取り完了(2)(誤)」/(「読み取り完了(1)」+「読み取り完了(2)」+「読み取り不可(1)」+「読み取り不可(2)」)   Ratio of erroneous reading = “read complete (2) (false)” / (“read complete (1)” + “read complete (2)” + “unreadable (1)” + “unreadable (2)”)

ここで、例えば、10000通供給して、「読み取り完了(1)」が7000通、「読み取り不可(1)」が1000通、「183−0036、東京都、府中市、日新町」の「読み取り完了(2)(正)」が150通、「読み取り完了(2)(誤)」が5通、その他の「読み取り完了(2)」が845通、「読み取り不可(2)」が1000通の場合は、下記のようになる。   Here, for example, 10000 messages are supplied, “read completed (1)” is 7000, “unreadable (1)” is 1000, “183-0036, Tokyo, Fuchu, Nisshincho” 150 completed (2) (correct), 5 received “read completed (2) (false)”, 845 received “read completed (2)”, and 1000 received “unreadable (2)” The case is as follows.

正しく読んだ割合=(150/(7000+(150+5+845)+1000+1000))*100=1.5パーセント(%)
上記式において、「*」は乗算を表す。
Proportion read correctly = (150 / (7000+ (150 + 5 + 845) + 1000 + 1000)) * 100 = 1.5 percent (%)
In the above formula, “*” represents multiplication.

誤って読んだ割合=(5/(7000+(150+5+845)+1000+1000))*100=0.05パーセント(%)
上記式において、「*」は乗算を表す。
Ratio read in error = (5 / (7000+ (150 + 5 + 845) + 1000 + 1000)) * 100 = 0.05 percent (%)
In the above formula, “*” represents multiplication.

また、従来「読み取り完了(1)」以外は全て「読み取り不可」となっていたため、元の住所データベース4における読み取り率は、1000通供給して「読み取り完了(1)」が7000通より70%となる。つまり、元の住所データベース4の認識率70%に対して、「183−0036、東京都、府中市、日新町」を登録した場合、正しく読み取る割合が1.5%上昇し、間違って読み取る割合が0.05%上昇することが事前に検証できる。   In addition, since all except “Reading completion (1)” is conventionally “Unreadable”, the reading rate in the original address database 4 is supplied by 1000, and “Reading completion (1)” is 70% from 7000. It becomes. In other words, when “183-0036, Tokyo, Fuchu City, Nisshincho” is registered against the recognition rate of 70% in the original address database 4, the rate of correct reading increases by 1.5%, and the rate of incorrect reading Can be verified in advance by 0.05%.

住所登録候補データベース3への登録時は、未登録候補、その上位階層の読み取り結果をまとめて1つの候補とする(例えば、データベース未登録候補である「日新町」を登録する場合、「183−0036、東京都、府中市、日新町」までを1セットとして、1つの候補とする。別の組み合わせ「東京都、調布市、日新町」等は、別候補とする)。   When registering in the address registration candidate database 3, the unregistered candidates and the reading results of the higher layers are collected as one candidate (for example, when registering “Nisshincho” which is a database unregistered candidate, “183- “0036, Tokyo, Fuchu City, Nisshincho” is one candidate, and another combination “Tokyo, Chofu, Nisshincho” is another candidate).

10.住所データ更新部6では、任意のタイミングで住所データベース4への更新処理を起動することができ、住所登録候補データベース3に登録された登録候補を、読み取り頻度、正しく読み取る割合、間違って読み取る割合、同名の市や町等をキーとして検索し、整列された状態でオペレータに表示することができる。   10. The address data update unit 6 can start update processing to the address database 4 at an arbitrary timing. The registration candidate registered in the address registration candidate database 3 is read frequency, read correctly, read incorrectly, A city or town with the same name can be searched for as a key and displayed to the operator in an aligned state.

オペレータは、表示された住所登録候補を登録した場合の効果や、頻繁に未登録となる市名等を確認し、任意の候補を選択し登録することができる(ステップB8)(例えば、毎月1日に住所登録候補データベース3を検索し、正しく読んだ割合が多い候補から優先的に表示し、正しく読んだ割合1%以上、間違って読んだ割合0.01%以下の候補を住所データベース4に登録する)。   The operator can confirm the effect when the displayed address registration candidate is registered, the city name that is frequently unregistered, etc., and can select and register any candidate (step B8) (for example, 1 every month). The address registration candidate database 3 is searched on a day, and the candidates that are read correctly are displayed preferentially, and candidates that are read correctly 1% or more and read incorrectly 0.01% or less are stored in the address database 4 sign up).

また、住所データベース4に既に登録されている住所で、未登録候補と上位の階層が同一の住所(例の場合は、「東京都、府中市」の下階層にある町名)の一覧を合わせて表示した場合、変形住所(同じ住所を表す別の呼び方)の登録も容易となる(例えば、「東京都、府中市」の下階層に「日新町」が既に登録されており、信頼度の高い登録候補として「日新」が出てきた場合は変形住所として、登録する)。   In addition, a list of addresses that are already registered in the address database 4 and whose upper level is the same as an unregistered candidate (in the example, a town name in the lower level of “Tokyo, Fuchu City”) is combined. When displayed, it becomes easy to register a modified address (another name that represents the same address) (for example, “Nisshincho” is already registered under “Tokyo, Fuchu City” and If “Nisshin” appears as a high registration candidate, register it as a modified address).

複数候補を同時に選択した場合は、各候補の登録情報を足し合わせることにより登録時の総合的な効果も確認することができる。   When a plurality of candidates are selected at the same time, the total effect at the time of registration can be confirmed by adding the registration information of each candidate.

住所登録候補を住所データベース4に登録した際には、その候補は住所登録候補データベース3からは削除される。   When an address registration candidate is registered in the address database 4, the candidate is deleted from the address registration candidate database 3.

また、以後、住所読み取り・判定部1において同様の読み取り結果が読み取られた場合は「読み取り完了(1)」として出力される。   Thereafter, when the address reading / determination unit 1 reads the same reading result, it is output as “reading completion (1)”.

住所データベース4の更新に関して、ビデオコーディングシステムにおける入力により、同様の宛先記載情報が得られる場合は、ビデオコーディングシステムにより入力された結果を用いても同様の更新作業を行うことができる。   When the address database 4 is updated, if similar destination description information is obtained by input in the video coding system, the same update operation can be performed using the result input by the video coding system.

以上説明したように、本実施の形態により、以下のような効果を奏する。第1の効果は、住所読み取り・判定部1で高い信頼性を持って読み取られた結果が住所データベース4に登録されていなかった場合に、オペレータが住所登録候補を簡易に確認可能とすることである。その理由は、住所登録候補判定部2において対象郵便物画像上の読み取り結果、読み取り位置をわかりやすく表示し、正誤判定の入力のみで住所登録候補の登録が可能となるためである。   As described above, according to this embodiment, the following effects can be obtained. The first effect is that the operator can easily confirm address registration candidates when the result read with high reliability by the address reading / determination unit 1 is not registered in the address database 4. is there. The reason is that the address registration candidate determination unit 2 displays the reading result and the reading position on the target mail image in an easy-to-understand manner, and the address registration candidate can be registered only by inputting correctness / incorrectness.

第2の効果は、住所読み取り・判定部1で高い信頼性を持って読み取られた結果が住所データベース4に登録されていなかった場合に、信頼性の高い住所登録候補を住所データベース4に登録することである。その理由は、読み取り結果が住所データベース4に登録されていない場合に、住所読み取り・判定部の読み取り結果に基づき、オペレータによる確認作業を介すること、および住所登録候補データベース3に蓄えられた頻度情報、読み取り性能改善割合に基づく信頼性の検証が行われるためである。   The second effect is that a highly reliable address registration candidate is registered in the address database 4 when the result read by the address reading / determination unit 1 with high reliability is not registered in the address database 4. That is. The reason for this is that when the reading result is not registered in the address database 4, based on the reading result of the address reading / determination unit, the operator performs confirmation work, and the frequency information stored in the address registration candidate database 3, This is because the reliability is verified based on the reading performance improvement ratio.

第3の効果は、住所読み取り・判定部1における読み取り性能の向上である。その理由は、読み取り結果が住所データベース4に登録されていない場合でも、住所登録候補データベース3に蓄えられた過去の読み取り結果の情報に基づき、信頼性の高い場合に最終判定可能とする郵便物の住所読み取り・判定システムを提供するためである。   A third effect is an improvement in reading performance in the address reading / determination unit 1. The reason is that even if the read result is not registered in the address database 4, the postal item that can be finally determined when the reliability is high based on the information of the past read result stored in the address registration candidate database 3. This is to provide an address reading / determination system.

第4の効果は、記載住所が住所データベース4に未登録であった場合のビデオコーディングシステム入力に関する入力作業の効率化である。その理由は、従来、住所データベース4に登録されていない住所をビデオコーディングシステムでオペレータが入力した場合、文字列入力を行った後に入力エラーとなり、数回入力エラーを繰り返すか、未登録判定をオペレータが行った場合に区分不可能の判定がなされるが、本発明により、住所読み取り結果を表示しオペレータが正誤判定を行った場合、1度のイエス、ノーの判定入力で入力を完了できるため、住所データベース未登録の郵便物に対する住所入力を簡略化することができるからである。   The fourth effect is the efficiency of input work related to video coding system input when the written address is not registered in the address database 4. The reason for this is that when an operator inputs an address that has not been registered in the address database 4 with a video coding system, an input error occurs after a character string is input, and the input error is repeated several times or an unregistered determination is made by the operator. However, according to the present invention, since the address reading result is displayed and the operator makes a correct / incorrect determination, the input can be completed with a single yes / no determination input. This is because it is possible to simplify address input for postal items not registered in the address database.

なお、上記実施の形態の構成及び動作は例であって、本発明の趣旨を逸脱しない範囲で適宜変更することができることは言うまでもない。   It should be noted that the configuration and operation of the above-described embodiment are examples, and it goes without saying that they can be changed as appropriate without departing from the spirit of the present invention.

本発明の活用例として、例えば、郵便の宛先の住所を読み取る郵便自動区分機だけでなく、文字認識を行う他の装置にも本発明を適用することができる。   As an application example of the present invention, for example, the present invention can be applied not only to an automatic mail sorting machine that reads an address of a postal address but also to other devices that perform character recognition.

本発明の構成図である。It is a block diagram of the present invention. 本発明における、住所結果判定の処理フロー図である。It is a processing flow figure of address result judgment in the present invention. 本発明における、住所データベースの登録フロー図である。It is a registration flow figure of an address database in the present invention.

符号の説明Explanation of symbols

1 住所読み取り・判定部
2 住所登録候補判定部
3 住所登録候補データベース
4 住所データベース
5 住所登録候補登録部
6 住所データ更新部
1 Address Reading / Determination Unit 2 Address Registration Candidate Determination Unit 3 Address Registration Candidate Database 4 Address Database 5 Address Registration Candidate Registration Unit 6 Address Data Update Unit

Claims (6)

郵便物に記載された宛先の住所を光学的に読み取り、住所データベースを参照することにより前記住所の最終判定結果を導く機能を有する住所認識装置であって、
前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記郵便物の画像と、読み取り結果および前記住所の階層の読み取り位置情報を所定の表示装置に表示させる表示制御手段と、
前記表示装置に表示された前記読み取り結果に対してユーザによって入力される正誤判定を取得する入力手段と、
前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記読み取り結果および前記入力手段によって取得された正誤判定に基づいて、前記読み取り結果が前記読み取り結果を記憶する住所登録候補データベースに登録されているときに、前記読み取り結果の総数に対して前記正誤判定で正と判定された割合と前記読み取り結果の総数に対して前記正誤判定で誤と判定された割合とを示す読み取り性能改善割合を算出し、前記読み取り結果に対応する前記住所データベースの未登録の住所登録候補を前記住所データベースに登録したときの前記読み取り性能改善割合を最終登録手段に提示する提示手段と、
前記読み取り性能改善割合の前記正と判定された割合が第1基準値以上であり前記誤と判定された割合が第2基準値以下であるときに前記未登録の住所登録候補を前記住所データベースに登録する最終登録手段と
を備えることを特徴とする住所認識装置。
An address recognition apparatus having a function of optically reading an address of a destination described in a mail piece and deriving a final determination result of the address by referring to an address database,
Display that displays an image of the postal matter, the reading result, and reading position information of the address hierarchy on a predetermined display device when a reading result obtained by optically reading the address is not registered in the address database Control means;
An input means for acquiring a correct / incorrect determination input by a user with respect to the reading result displayed on the display device;
When the reading result obtained by optically reading the address is not registered in the address database, the reading result stores the reading result based on the reading result and the correctness determination acquired by the input unit. When registered in the address registration candidate database, a ratio determined to be correct in the correctness determination with respect to the total number of the read results and a ratio determined to be incorrect in the correctness determination with respect to the total number of the read results; calculating the read performance improvement ratio shown and a presentation means for presenting an unregistered address candidate for the address database corresponding to the read result to the final registration means said read performance improvement rate when registered in the address database ,
The unregistered address registration candidate is stored in the address database when the ratio of the read performance improvement ratio determined to be positive is equal to or greater than a first reference value and the ratio determined to be incorrect is equal to or less than a second reference value. An address recognition apparatus comprising: a final registration unit for registration.
前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記住所データベースに登録されていない前記読み取り結果について前記入力手段によって取得された正誤判定に基づいて一定頻度以上で正しく読み取られているときに、前記住所を前記住所データベースに登録されていない未登録の住所登録候補として前記住所データベースに仮登録する登録手段をさらに備える
ことを特徴とする請求項1に記載の住所認識装置。
When the reading result obtained by optically reading the address is not registered in the address database, the reading result that is not registered in the address database is more than a certain frequency based on the correctness determination acquired by the input unit. The registration device according to claim 1, further comprising: a registration unit that temporarily registers the address in the address database as an unregistered address registration candidate that is not registered in the address database when the address is correctly read. Address recognition device.
前記住所登録候補には、既に住所データベースに登録されている住所の変形住所も含まれる
ことを特徴とする請求項2に記載の住所認識装置。
The address recognition apparatus according to claim 2, wherein the address registration candidate includes a modified address of an address already registered in the address database.
前記住所が光学的に読み取られた読み取り結果と該読み取り結果に対する読み取り頻度と前記読み取り結果を正しく読んだ割合とを記憶する住所登録候補データベースを備え、
読み取り結果が前記住所データベースに登録されていない場合、前記住所登録候補データベースに記憶された前記読み取り結果に基づいて一定頻度以上で正しく読み取られているときに最終判定出力を可能とする
ことを特徴とする請求項1乃至3のいずれか一項に記載の住所認識装置。
An address registration candidate database for storing a reading result obtained by optically reading the address, a reading frequency for the reading result, and a rate of reading the reading result correctly;
When a reading result is not registered in the address database, a final determination output is enabled when the reading result is correctly read based on the reading result stored in the address registration candidate database at a certain frequency or more. The address recognition apparatus according to any one of claims 1 to 3.
郵便物に記載された宛先の住所を光学的に読み取り、住所データベースを参照することにより前記住所の最終判定結果を導く機能を有する住所認識装置における住所認識方法であって、
前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記郵便物の画像と、読み取り結果および前記住所の階層の読み取り位置情報を所定の表示装置に表示させる表示制御ステップと、
前記表示装置に表示された前記読み取り結果に対してユーザによって入力される正誤判定を取得する入力ステップと、
前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記読み取り結果および前記入力手段によって取得された正誤判定に基づいて、前記読み取り結果が前記読み取り結果を記憶する住所登録候補データベースに登録されているときに、前記読み取り結果の総数に対して前記正誤判定で正と判定された割合と前記読み取り結果の総数に対して前記正誤判定で誤と判定された割合とを示す読み取り性能改善割合を算出し、前記読み取り結果に対応する前記住所データベースの未登録の住所登録候補を前記住所データベースに登録したときの前記読み取り性能改善割合を最終登録ステップに提示する提示ステップと、
前記読み取り性能改善割合の前記正と判定された割合が第1基準値以上であり前記誤と判定された割合が第2基準値以下であるときに前記未登録の住所登録候補を前記住所データベースに登録する最終登録ステップと
を備えることを特徴とする住所認識方法。
An address recognition method in an address recognition apparatus having a function of optically reading an address of a destination described in a mail piece and referring to an address database to derive a final determination result of the address,
Display that displays an image of the postal matter, the reading result, and reading position information of the address hierarchy on a predetermined display device when a reading result obtained by optically reading the address is not registered in the address database Control steps;
An input step of acquiring a correct / incorrect determination input by a user with respect to the reading result displayed on the display device;
When the reading result obtained by optically reading the address is not registered in the address database, the reading result stores the reading result based on the reading result and the correctness determination acquired by the input unit. When registered in the address registration candidate database, a ratio determined to be correct in the correctness determination with respect to the total number of the read results and a ratio determined to be incorrect in the correctness determination with respect to the total number of the read results; calculating the read performance improvement ratio shown and a presentation step of presenting the read performance improvement rate when the unregistered address candidate for the address database corresponding to the reading result has been registered in the address database in the final registration step ,
The unregistered address registration candidate is stored in the address database when the ratio of the read performance improvement ratio determined to be positive is equal to or greater than a first reference value and the ratio determined to be incorrect is equal to or less than a second reference value. An address recognition method comprising: a final registration step of registration.
郵便物に記載された宛先の住所を光学的に読み取り、住所データベースを参照することにより前記住所の最終判定結果を導く機能を有する住所認識装置を制御する住所認識プログラムであって、
前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記郵便物の画像と、読み取り結果および前記住所の階層の読み取り位置情報を所定の表示装置に表示させる表示制御ステップと、
前記表示装置に表示された前記読み取り結果に対してユーザによって入力される正誤判定を取得する入力ステップと、
前記住所が光学的に読み取られた読み取り結果が前記住所データベースに登録されていない場合に、前記読み取り結果および前記入力手段によって取得された正誤判定に基づいて、前記読み取り結果が前記読み取り結果を記憶する住所登録候補データベースに登録されているときに、前記読み取り結果の総数に対して前記正誤判定で正と判定された割合と前記読み取り結果の総数に対して前記正誤判定で誤と判定された割合とを示す読み取り性能改善割合を算出し、前記読み取り結果に対応する前記住所データベースの未登録の住所登録候補を前記住所データベースに登録したときの前記読み取り性能改善割合を最終登録ステップに提示する提示ステップと、
前記読み取り性能改善割合の前記正と判定された割合が第1基準値以上であり前記誤と判定された割合が第2基準値以下であるときに前記未登録の住所登録候補を前記住所データベースに登録する最終登録ステップと
を備えることを特徴とする住所認識プログラム。
An address recognition program for controlling an address recognition apparatus having a function of optically reading an address of a destination described in a postal matter and deriving a final determination result of the address by referring to an address database,
Display that displays an image of the postal matter, the reading result, and reading position information of the address hierarchy on a predetermined display device when a reading result obtained by optically reading the address is not registered in the address database Control steps;
An input step of acquiring a correct / incorrect determination input by a user with respect to the reading result displayed on the display device;
When the reading result obtained by optically reading the address is not registered in the address database, the reading result stores the reading result based on the reading result and the correctness determination acquired by the input unit. When registered in the address registration candidate database, a ratio determined to be correct in the correctness determination with respect to the total number of the read results and a ratio determined to be incorrect in the correctness determination with respect to the total number of the read results; calculating the read performance improvement ratio shown and a presentation step of presenting the read performance improvement rate when the unregistered address candidate for the address database corresponding to the reading result has been registered in the address database in the final registration step ,
The unregistered address registration candidate is stored in the address database when the ratio of the read performance improvement ratio determined to be positive is equal to or greater than a first reference value and the ratio determined to be incorrect is equal to or less than a second reference value. An address recognition program comprising: a final registration step of registration.
JP2005226635A 2005-08-04 2005-08-04 Address recognition device Expired - Fee Related JP4706379B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005226635A JP4706379B2 (en) 2005-08-04 2005-08-04 Address recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005226635A JP4706379B2 (en) 2005-08-04 2005-08-04 Address recognition device

Publications (2)

Publication Number Publication Date
JP2007041919A JP2007041919A (en) 2007-02-15
JP4706379B2 true JP4706379B2 (en) 2011-06-22

Family

ID=37799833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005226635A Expired - Fee Related JP4706379B2 (en) 2005-08-04 2005-08-04 Address recognition device

Country Status (1)

Country Link
JP (1) JP4706379B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100926565B1 (en) 2007-12-13 2009-11-12 한국전자통신연구원 Apparatus for Building Address Database and Method Therefor
JP2009163689A (en) * 2008-01-10 2009-07-23 Nec Corp Address recognition method and device, and postal address sorter
KR101044806B1 (en) 2008-12-08 2011-06-27 한국전자통신연구원 System and method for address registration
JP5433470B2 (en) * 2010-03-17 2014-03-05 株式会社東芝 Address database construction device and address database construction method
KR101904440B1 (en) * 2011-02-09 2018-11-30 한국전자통신연구원 System and method for decreasing of postal resorting and missorting
JP6222699B2 (en) * 2014-03-05 2017-11-01 株式会社東芝 Address database construction device, address database construction system, and address database construction method
JP2019095833A (en) * 2017-11-17 2019-06-20 株式会社ショーケース・ティービー Address management system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022887A (en) * 1999-07-09 2001-01-26 Toshiba Corp Address row detecting method and address recognizing method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6030993B2 (en) * 1980-03-25 1985-07-19 富士通株式会社 Real-time handwritten character recognition device
JPH02220187A (en) * 1989-02-22 1990-09-03 Fujitsu Ltd Name recognizing device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022887A (en) * 1999-07-09 2001-01-26 Toshiba Corp Address row detecting method and address recognizing method

Also Published As

Publication number Publication date
JP2007041919A (en) 2007-02-15

Similar Documents

Publication Publication Date Title
JP4706379B2 (en) Address recognition device
JP5204208B2 (en) Receipt data collation support device and receipt data collation support program
US7869098B2 (en) Scanning verification and tracking system and method
US20210012138A1 (en) Image processing device, image processing method, and storage medium storing program
US20110229018A1 (en) Centralized information processing apparatus and centralized information processing system
CN113841156B (en) Control method and device based on image recognition
JP2008020506A (en) Image processor and image processing program
JP3291642B2 (en) Failure support method
JP5433470B2 (en) Address database construction device and address database construction method
JP6217407B2 (en) Information processing system, information processing apparatus, and program
JP4104617B2 (en) Product information management system and product information management program
US6947574B1 (en) Method and system for interleaving OCR and ABL for automated mail sorting
CN111860412A (en) License plate information repairing method and system based on historical data
JP2001005804A (en) Data base registering method utilizing character recognizing device
JP5253788B2 (en) Image recognition apparatus, image recognition program, and image recognition method
JP2018190064A (en) Accounting processing system
JP2010237909A (en) Knowledge correction program, knowledge correcting device and knowledge correction method
JP5056502B2 (en) RECEPT PROCESSING PROGRAM, RECEPT PROCESSING METHOD, AND RECEPT PROCESSING DEVICE
JP6759955B2 (en) Place name extraction program, place name extraction device and place name extraction method
JPH05119896A (en) Character string input system
KR20120019706A (en) System for recognizing adress of mailings
JPH10187318A (en) Automatic setting processing system for customer attribute information
JP4938422B2 (en) Human resource management apparatus, human resource management method and program
JP2010072817A (en) System for supporting evaluation of design document quality
JP2002015105A (en) Electronic decision system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110228

R150 Certificate of patent or registration of utility model

Ref document number: 4706379

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees