JP7408327B2 - Address database generation device and program - Google Patents

Address database generation device and program Download PDF

Info

Publication number
JP7408327B2
JP7408327B2 JP2019171145A JP2019171145A JP7408327B2 JP 7408327 B2 JP7408327 B2 JP 7408327B2 JP 2019171145 A JP2019171145 A JP 2019171145A JP 2019171145 A JP2019171145 A JP 2019171145A JP 7408327 B2 JP7408327 B2 JP 7408327B2
Authority
JP
Japan
Prior art keywords
address
address database
database
setting
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019171145A
Other languages
Japanese (ja)
Other versions
JP2021047765A (en
Inventor
英 朴
倫行 浜村
琢磨 赤木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2019171145A priority Critical patent/JP7408327B2/en
Publication of JP2021047765A publication Critical patent/JP2021047765A/en
Application granted granted Critical
Publication of JP7408327B2 publication Critical patent/JP7408327B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は、住所データベース生成装置及びプログラムに関する。 Embodiments of the present invention relate to an address database generation device and a program.

郵便物又は帳票等の紙葉類に記載された住所を認識する住所認識装置は、住所から文字や単語ごとの候補を抽出し、抽出された文字や単語と住所データベースに登録された文字や単語とを照合する。数百万件を超える膨大な数の住所が登録された住所データベースを利用する場合、住所認識装置による照合処理の負荷は重く、照合処理に多くの時間が必要となる。 An address recognition device that recognizes addresses written on paper sheets such as mail or forms extracts candidates for each character or word from an address, and combines the extracted characters and words with the characters and words registered in the address database. Verify with. When using an address database in which a huge number of addresses, exceeding several million, are registered, the burden of verification processing by the address recognition device is heavy, and a lot of time is required for the verification processing.

そこで、住所データベースから書き換えられるOCR(Optical Character Recognition)住所データベースが利用される。例えば、OCR住所データベースは、住所データベースに含まれる複数の住所に対応する木構造の住所階層のデータベースである。住所階層としては、国、県、区、市、町、村、及び郵便番号などがある。このようなOCR住所データベースは、住所データベースの情報量を維持しつつ、住所データベースと比較してデータサイズを数分の一~数十分の一のデータサイズに圧縮することができる。 Therefore, an OCR (Optical Character Recognition) address database that is rewritten from the address database is used. For example, an OCR address database is a tree-structured address hierarchy database corresponding to a plurality of addresses included in the address database. The address hierarchy includes country, prefecture, ward, city, town, village, and postal code. Such an OCR address database can compress the data size to one to several tenths of the data size of the address database while maintaining the amount of information in the address database.

特開平8-278965号公報Japanese Patent Application Publication No. 8-278965

コンピュータ等の情報処理装置により、住所データベースの住所階層の構造を分析し、住所データベースからOCR住所データベースを生成すること要求されているが、国や地域によって住所階層の構造が異なるため、情報処理装置の製造元で設定された固定の分析方法で高い分析精度を得ることは難しい。また、実際の住所データベースは個人情報を含むため、情報処理装置の製造元がこのような個人情報を含む実際の住所データベースを入手し分析することも難しい。このように、国や地域によって住所階層の構造が異なり、加えて、実際の住所データベースを入手し分析することも難しい状況下で、住所データベースから適切なOCR住所データベースを生成する技術が望まれている。 An information processing device such as a computer is required to analyze the structure of the address hierarchy in an address database and generate an OCR address database from the address database, but since the structure of the address hierarchy differs depending on the country or region, the information processing device It is difficult to obtain high analytical accuracy using the fixed analysis method set by the manufacturer. Furthermore, since the actual address database includes personal information, it is difficult for manufacturers of information processing devices to obtain and analyze the actual address database that includes such personal information. As described above, the structure of address hierarchies differs depending on the country and region, and in addition, it is difficult to obtain and analyze an actual address database, so there is a need for technology to generate an appropriate OCR address database from an address database. There is.

本発明の目的は、複数の住所を含む住所データベースから信頼性の高いOCR住所データベースを生成する住所データベース生成装置及びプログラムを提供することである。 An object of the present invention is to provide an address database generation device and program that generates a highly reliable OCR address database from an address database containing a plurality of addresses.

実施形態に係る住所データベース生成装置は、取得部、設定部、及び生成部を備える。前記取得部は、複数の住所を含む第1の住所データベースを取得する。前記設定部は、住所の構成に関する情報を設定する。前記生成部は、前記情報を含む設定ファイルに基づき、前記第1の住所データベースから前記複数の住所に対応する木構造の住所階層を含む第2の住所データベースを生成する。 The address database generation device according to the embodiment includes an acquisition section, a setting section, and a generation section. The acquisition unit acquires a first address database including a plurality of addresses. The setting unit sets information regarding the structure of an address. The generation unit generates a second address database including a tree-structured address hierarchy corresponding to the plurality of addresses from the first address database based on a configuration file including the information.

図1は、実施形態に係る区分システムの概略構成の一例を示すブロック図である。FIG. 1 is a block diagram showing an example of a schematic configuration of a sorting system according to an embodiment. 図2は、実施形態に係るOCR住所データベース生成装置の概略構成の一例を示すブロック図である。FIG. 2 is a block diagram showing an example of a schematic configuration of an OCR address database generation device according to an embodiment. 図3は、区分システムにより区分される紙葉類等の住所表記の一例を示す図である。FIG. 3 is a diagram showing an example of address notation on paper sheets and the like that are sorted by the sorting system. 図4は、実施形態に係るOCR住所データベース生成装置により生成されるOCR住所データベースの木構造の第1例を示す概念図である。FIG. 4 is a conceptual diagram showing a first example of a tree structure of an OCR address database generated by the OCR address database generation device according to the embodiment. 図5は、実施形態に係るOCR住所データベース生成装置により生成されるOCR住所データベースの木構造の第2例を示す概念図である。FIG. 5 is a conceptual diagram showing a second example of the tree structure of the OCR address database generated by the OCR address database generation device according to the embodiment. 図6は、実施形態に係るOCR住所データベース生成装置によるOCR住所データベースの生成の第1例を示す図である。FIG. 6 is a diagram showing a first example of generation of an OCR address database by the OCR address database generation device according to the embodiment. 図7は、実施形態に係るOCR住所データベース生成装置で利用される住所階層設定ファイルの一例を示す図である。FIG. 7 is a diagram illustrating an example of an address hierarchy setting file used in the OCR address database generation device according to the embodiment. 図8は、実施形態に係るOCR住所データベース生成装置で利用される出力言語設定ファイルの一例を示す図である。FIG. 8 is a diagram illustrating an example of an output language setting file used in the OCR address database generation device according to the embodiment. 図9は、実施形態に係るOCR住所データベース生成装置によるOCR住所データベースの生成の第2例を示す図である。FIG. 9 is a diagram showing a second example of generation of an OCR address database by the OCR address database generation device according to the embodiment. 図10は、実施形態に係るOCR住所データベース生成装置によるOCR住所データベースの生成の第3例を示す図である。FIG. 10 is a diagram illustrating a third example of generation of an OCR address database by the OCR address database generation device according to the embodiment. 図11は、実施形態に係る住所データベース生成装置による住所データベースの生成処理の一例を示すフローチャートである。FIG. 11 is a flowchart illustrating an example of address database generation processing by the address database generation device according to the embodiment.

以下、図面を用いて実施形態について説明する。
図1は、実施形態に係る区分システムの概略構成の一例を示すブロック図である。
区分システム1は、区分対象物から住所を読み取り、読み取った住所を認識し、認識結果に基づき区分対象物を区分する。例えば、区分対象物は、郵便物又は帳票等の紙葉類である。区分システム1は、複数の住所を含む住所データベース(第1の住所データベース)DB1から、これら複数の住所に対応する木構造の住所階層を含むOCR住所データベース(第2の住所データベース)DB2を生成する。
Hereinafter, embodiments will be described using the drawings.
FIG. 1 is a block diagram showing an example of a schematic configuration of a sorting system according to an embodiment.
The sorting system 1 reads addresses from objects to be sorted, recognizes the read addresses, and sorts the objects based on the recognition results. For example, the objects to be sorted are paper sheets such as mail or forms. The classification system 1 generates an OCR address database (second address database) DB2 including a tree-structured address hierarchy corresponding to the plural addresses from an address database (first address database) DB1 including a plurality of addresses. .

区分システム1を適用する国又は地域によって異なるが、住所データベースDB1は、数百万件を超える住所を含む。住所データベースDB1から生成されるOCR住所データベースDB2は、区分対象物から読み取られた住所の認識処理に利用され、住所データベースDB1の情報量を維持しつつ、住所データベースDB1と比較してデータサイズが大幅に圧縮されている。本実施形態の区分システム1に含まれる住所データベース生成装置18は、国又は地域によって階層構造が異なる住所データベースDB1から、信頼性の高いOCR住所データベースDB2を生成することができる。 Although it differs depending on the country or region to which the classification system 1 is applied, the address database DB1 includes more than several million addresses. The OCR address database DB2 generated from the address database DB1 is used to recognize addresses read from classified objects, and while maintaining the amount of information in the address database DB1, the data size is significantly larger than that of the address database DB1. is compressed into. The address database generation device 18 included in the classification system 1 of this embodiment can generate a highly reliable OCR address database DB2 from the address database DB1, which has a different hierarchical structure depending on the country or region.

図1に示すように、区分システム1は、オペレーション入出力部11、供給部12、区分部13、区分制御部14、バーコードリーダ(BCR)15、画像撮影部16、住所認識部17、OCR住所データベース生成装置18、及びバーコードライター(BCW)19等を備える。 As shown in FIG. 1, the sorting system 1 includes an operation input/output section 11, a supply section 12, a sorting section 13, a sorting control section 14, a barcode reader (BCR) 15, an image capturing section 16, an address recognition section 17, an OCR It includes an address database generation device 18, a barcode writer (BCW) 19, and the like.

オペレーション入出力部11は、ユーザインタフェースであり、ディスプレイ、タッチセンサ、キーボード、及びマウス等を備える。ディスプレイは、各種情報を表示する。タッチセンサは、ディスプレイに対向配置される。タッチセンサ、キーボード、及びマウス等の入力デバイスは、オペレータからの各種入力を受け付ける。後に詳しく説明するが、ディスプレイは、OCR住所データベースDB2を生成するための条件を設定する設定画面を表示し、オペレータは、入力デバイスを介して、設定画面に対して条件を入力することができる。 The operation input/output unit 11 is a user interface and includes a display, a touch sensor, a keyboard, a mouse, and the like. The display displays various information. The touch sensor is arranged to face the display. Input devices such as touch sensors, keyboards, and mice accept various inputs from an operator. As will be described in detail later, the display displays a settings screen for setting conditions for generating the OCR address database DB2, and the operator can input the conditions to the settings screen via an input device.

供給部12は、郵便番号、住所、及び宛名などの文字、数字、及び記号等からなる住所情報が記載又は添付された紙葉類を収容し、紙葉類を区分部13へ供給する。また、紙葉類には、住所情報以外に、紙葉類の住所情報を示す宛先バーコード、又は住所情報が認識されなかった紙葉類に割り当てられる識別情報(書状ID)としてのIDバーコードが印刷されることがある。 The supply section 12 stores paper sheets on which address information including letters, numbers, symbols, etc. such as a postal code, address, and addressee is written or attached, and supplies the paper sheets to the sorting section 13 . In addition to address information, paper sheets also include a destination barcode indicating the address information of the paper sheet, or an ID barcode as identification information (letter ID) assigned to paper sheets for which address information has not been recognized. may be printed.

BCR15は、紙葉類に記録された宛先バーコード、又はIDバーコードを読み取る。BCW19は、必要に応じて紙葉類に宛先バーコード、又はIDバーコードを印刷する。例えば、BCW19は、住所認識部17により紙葉類の住所情報が認識された場合、認識された住所情報をバーコード化した宛先バーコードをこの紙葉類に対して印刷する。また、BCW19は、住所認識部17により紙葉類の住所情報が認識されなかった場合、区分制御部14から与えられる識別情報をバーコード化したIDバーコードをこの紙葉類に対して印刷する。つまり、BCW19は、住所情報が認識できた紙葉類にはその認識結果を宛先バーコードとして印刷し、住所情報が認識できなかった紙葉類には識別情報をIDバーコードとして印刷する。 The BCR 15 reads the destination barcode or ID barcode recorded on the paper sheet. The BCW 19 prints a destination barcode or an ID barcode on the paper sheet as necessary. For example, when the address recognition unit 17 recognizes address information on a paper sheet, the BCW 19 prints a destination barcode, which is a barcode of the recognized address information, on the paper sheet. Furthermore, if the address recognition unit 17 does not recognize the address information on the paper sheet, the BCW 19 prints an ID barcode, which is a barcode of the identification information given from the sorting control unit 14, on the paper sheet. . That is, the BCW 19 prints the recognition result as a destination barcode on paper sheets for which address information can be recognized, and prints identification information as an ID barcode on paper sheets for which address information cannot be recognized.

画像撮影部16は、住所情報が記載又は添付された紙葉類を撮影し、紙葉類の画像を出力する。住所認識部17は、画像撮影部16から出力される画像を処理し、画像上の住所情報とOCR住所データベースDB2との照合により、住所情報を認識する。 The image photographing unit 16 photographs a paper sheet on which address information is written or attached, and outputs an image of the paper sheet. The address recognition unit 17 processes the image output from the image capturing unit 16 and recognizes the address information by comparing the address information on the image with the OCR address database DB2.

OCR住所データベース生成装置18は、設定ファイルに基づき、住所データベースDB1からOCR住所データベースDB2を生成し、OCR住所データベースDB2を住所認識部17へ提供する。OCR住所データベース生成装置18によるOCR住所データベースDB2の生成については後に詳しく説明する。 The OCR address database generation device 18 generates an OCR address database DB2 from the address database DB1 based on the configuration file, and provides the OCR address database DB2 to the address recognition unit 17. Generation of the OCR address database DB2 by the OCR address database generation device 18 will be explained in detail later.

区分制御部14は、紙葉類の住所情報の認識結果に基づき区分制御信号を出力する。区分部13は、区分制御信号に基づき紙葉類を区分する。 The sorting control unit 14 outputs a sorting control signal based on the recognition result of the address information on the paper sheets. The sorting unit 13 sorts paper sheets based on the sorting control signal.

図2は、実施形態に係るOCR住所データベース生成装置の概略構成の一例を示すブロック図である。
図2に示すように、OCR住所データベース生成装置18は、制御部181、ROM(read-only memory)182、RAM(random-access memory)183、補助記憶デバイス184、通信インタフェース185、及び入出力部186を備える。
FIG. 2 is a block diagram showing an example of a schematic configuration of an OCR address database generation device according to an embodiment.
As shown in FIG. 2, the OCR address database generation device 18 includes a control section 181, a ROM (read-only memory) 182, a RAM (random-access memory) 183, an auxiliary storage device 184, a communication interface 185, and an input/output section. 186.

制御部181は、OCR住所データベースDB2の生成に必要な演算及び制御などの処理を行うコンピュータの中枢部分に相当する。制御部181は、ROM182及び補助記憶デバイス184の少なくとも一方に記憶されたシステムソフトウェア、アプリケーションソフトウェア又はファームウェアなどのプログラムに基づいて、各種の機能を実現するべく演算及び制御を実行する。例えば、制御部181は、CPU(central processing unit)、MPU(micro processing unit)、又はDSP(digital signal processor)などである。あるいは、制御部181は、これらのうちのいくつかのプロセッサを組み合わせたものである。制御部181は、OCR住所データベース生成エンジン1811を含む。 The control unit 181 corresponds to the central part of a computer that performs processing such as calculation and control necessary for generating the OCR address database DB2. The control unit 181 executes calculations and control to realize various functions based on programs such as system software, application software, or firmware stored in at least one of the ROM 182 and the auxiliary storage device 184. For example, the control unit 181 is a CPU (central processing unit), an MPU (micro processing unit), a DSP (digital signal processor), or the like. Alternatively, the control unit 181 is a combination of several of these processors. The control unit 181 includes an OCR address database generation engine 1811.

ROM182は、コンピュータ可読記憶媒体であり、制御部181を中枢とするコンピュータの主記憶装置に相当する。ROM182は、専らデータの読み出しに用いられる不揮発性メモリ(非一時的記憶媒体)である。ROM182は、上記のプログラムの少なくとも一部を記憶してもよい。また、ROM182は、制御部181が各種の処理を行う上で使用するデータ又は各種の設定値などを記憶する。 The ROM 182 is a computer-readable storage medium, and corresponds to the main storage device of a computer in which the control unit 181 is the core. The ROM 182 is a non-volatile memory (non-temporary storage medium) used exclusively for reading data. The ROM 182 may store at least a portion of the above program. Further, the ROM 182 stores data or various setting values used by the control unit 181 to perform various processes.

RAM183は、コンピュータ可読記憶媒体であり、制御部181を中枢とするコンピュータの主記憶装置に相当する。RAM183は、データの読み書きに用いられるメモリである。RAM183は、制御部181が各種の処理を行う上で一時的に使用するデータを記憶しておく、いわゆるワークエリアなどとして利用される。 The RAM 183 is a computer-readable storage medium, and corresponds to the main storage of a computer in which the control unit 181 is the core. The RAM 183 is a memory used for reading and writing data. The RAM 183 is used as a so-called work area for storing data temporarily used by the control unit 181 in performing various processes.

補助記憶デバイス184は、コンピュータ可読記憶媒体であり、制御部181を中枢とするコンピュータの補助記憶装置に相当する。補助記憶デバイス184は、例えばEEPROM(electric erasable programmable read-only memory)(登録商標)、HDD(hard disk drive)又はSSD(solid state drive)などの非一時的記憶媒体である。補助記憶デバイス184は、上記のプログラムの少なくとも一部を記憶してもよい。また、補助記憶デバイス184は、制御部181が各種の処理を行う上で使用するデータ、制御部181での処理によって生成されたデータ又は各種の設定値などを保存する。例えば、補助記憶デバイス184は、各種設定ファイル、住所データベースDB1、及びOCR住所データベースDB2を記憶する。 The auxiliary storage device 184 is a computer-readable storage medium, and corresponds to an auxiliary storage device of a computer in which the control unit 181 is the core. The auxiliary storage device 184 is a non-temporary storage medium such as, for example, EEPROM (electric erasable programmable read-only memory) (registered trademark), HDD (hard disk drive), or SSD (solid state drive). Auxiliary storage device 184 may store at least a portion of the program described above. Further, the auxiliary storage device 184 stores data used by the control unit 181 in performing various processes, data generated by processing in the control unit 181, various setting values, and the like. For example, the auxiliary storage device 184 stores various setting files, an address database DB1, and an OCR address database DB2.

ROM182及び補助記憶デバイス184の少なくとも一方に記憶されるプログラムは、OCR住所データベースDB2の生成のためのプログラムを含む。一例として、区分システム1又はOCR住所データベース生成装置18は、当該プログラムがROM182及び補助記憶デバイス184の少なくとも一方に記憶された状態で区分システム1又はOCR住所データベース生成装置18の管理者などへ譲渡される。或いは、当該プログラムが記憶された非一時的なコンピュータ可読記憶媒体により、当該管理者などへ譲渡されてもよい。この場合、当該管理者又はサービスマンなどによる操作の下に、非一時的なコンピュータ可読記憶媒体に記憶された当該プログラムが補助記憶デバイス184等に書き込まれる。当該プログラムが記憶された非一時的なコンピュータ可読記憶媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク又は半導体メモリなどのようなリムーバブルな記憶媒体である。或いは、ネットワークなどを介して当該プログラムをダウンロードし補助記憶デバイス184に書き込んでもよい。 The programs stored in at least one of the ROM 182 and the auxiliary storage device 184 include a program for generating the OCR address database DB2. As an example, the sorting system 1 or the OCR address database generating device 18 may be transferred to an administrator of the sorting system 1 or the OCR address database generating device 18 with the program stored in at least one of the ROM 182 and the auxiliary storage device 184. Ru. Alternatively, the program may be transferred to the administrator using a non-transitory computer-readable storage medium in which the program is stored. In this case, the program stored in the non-temporary computer-readable storage medium is written to the auxiliary storage device 184 or the like under the operation of the administrator, service person, or the like. The non-transitory computer-readable storage medium in which the program is stored is, for example, a removable storage medium such as a magnetic disk, a magneto-optical disk, an optical disk, or a semiconductor memory. Alternatively, the program may be downloaded via a network or the like and written to the auxiliary storage device 184.

通信インタフェース185は、ネットワークなどを介して他の装置と有線又は無線で通信し、他の装置から送信される各種情報を受信し、また、他の装置に各種情報を送信するためのインタフェースである。例えば、通信インタフェース185は、通信部として機能し、他のOCR住所データベース生成装置18と通信する。また、通信インタフェース185は、住所データベースDB1を取得する取得部として機能してもよく、上位機器等から住所データベースDB1を受信し、補助記憶デバイス184に住所データベースDB1を書き込む。 The communication interface 185 is an interface for communicating with other devices via a network or the like by wire or wirelessly, receiving various information transmitted from other devices, and transmitting various information to other devices. . For example, the communication interface 185 functions as a communication unit and communicates with other OCR address database generation devices 18 . Furthermore, the communication interface 185 may function as an acquisition unit that acquires the address database DB1, receives the address database DB1 from a host device, etc., and writes the address database DB1 to the auxiliary storage device 184.

入出力部186は、オペレーション入出力部11に対して信号を出力したり、オペレーション入出力部11からの信号を入力したりする。また、入出力部186は、住所データベースDB1を取得する取得部として機能してもよく、リムーバブルな記憶媒体から住所データベースDB1を読み取り、補助記憶デバイス184に住所データベースDB1を書き込む。 The input/output unit 186 outputs a signal to the operation input/output unit 11 and inputs a signal from the operation input/output unit 11. The input/output unit 186 may also function as an acquisition unit that acquires the address database DB1, reads the address database DB1 from a removable storage medium, and writes the address database DB1 to the auxiliary storage device 184.

ここで本実施形態における各用語について説明する。国、県、区、市、町、村、及び郵便番号等のそれぞれを住所セグメントと称し、住所セグメントのそれぞれが住所階層に相当する。住所セグメントの幾つかの組み合わせ、つまり住所階層の幾つかの組み合わせを住所と称する。住所データベースDB1は住所の集合体である。例えば、住所データベースDB1に含まれる市名ファイルに各市名データが登録され、住所データベースDB1に含まれる町名ファイルに各町名データが登録される。OCR住所データベースDB2は、住所データベースDB1から生成されるデータベースであり、住所データベースDB1の複数の住所に対応する木構造の住所階層を含む。 Here, each term in this embodiment will be explained. Country, prefecture, ward, city, town, village, postal code, etc. are each referred to as an address segment, and each address segment corresponds to an address hierarchy. Several combinations of address segments, ie, several combinations of address hierarchies, are called addresses. Address database DB1 is a collection of addresses. For example, each city name data is registered in a city name file included in the address database DB1, and each town name data is registered in a town name file included in the address database DB1. The OCR address database DB2 is a database generated from the address database DB1, and includes a tree-structured address hierarchy corresponding to a plurality of addresses in the address database DB1.

図3は、区分システムにより区分される紙葉類等の住所表記の一例を示す図である。図4は、実施形態に係るOCR住所データベース生成装置により生成されるOCR住所データベースの木構造の第1例を示す概念図である。図4に示すOCR住所データベースDB2は、市、区、町、番地、建物名、部屋番号、及び氏名の木構造を有する。また、図5は、実施形態に係るOCR住所データベース生成装置により生成されるOCR住所データベースの木構造の第2例を示す概念図である。図5に示すOCR住所データベースDB2は、市、郵便番号、町、番地、建物名、部屋番号、及び氏名の木構造を有する。 FIG. 3 is a diagram showing an example of address notation on paper sheets and the like that are sorted by the sorting system. FIG. 4 is a conceptual diagram showing a first example of a tree structure of an OCR address database generated by the OCR address database generation device according to the embodiment. The OCR address database DB2 shown in FIG. 4 has a tree structure of city, ward, town, street address, building name, room number, and name. Further, FIG. 5 is a conceptual diagram showing a second example of the tree structure of the OCR address database generated by the OCR address database generation device according to the embodiment. The OCR address database DB2 shown in FIG. 5 has a tree structure of city, postal code, town, street address, building name, room number, and name.

例えば、OCR住所データベース生成装置18は、第1の設定情報を含む設定ファイルSFに基づき、住所データベースDB1に含まれる複数の住所を木構造化することにより、図4に示すOCR住所データベースDB2を生成し、第2の設定情報を含む設定ファイルSFに基づき、住所データベースDB1に含まれる複数の住所を木構造化することにより、図5に示すOCR住所データベースDB2を生成する。このように、OCR住所データベース生成装置18は、設定ファイルSFに応じたOCR住所データベースDB2を生成することができる。 For example, the OCR address database generation device 18 generates the OCR address database DB2 shown in FIG. 4 by creating a tree structure of a plurality of addresses included in the address database DB1 based on the configuration file SF including the first configuration information. Then, the OCR address database DB2 shown in FIG. 5 is generated by arranging a plurality of addresses included in the address database DB1 into a tree structure based on the configuration file SF containing the second configuration information. In this way, the OCR address database generation device 18 can generate the OCR address database DB2 according to the setting file SF.

図4又は図5に示すOCR住所データベースDB2のデータサイズは、住所データベースDB1のデータサイズに比べて、大幅に圧縮される。図4に示すOCR住所データベースDB2が、郵便番号を除く木構造であるのに対して、図5に示すOCR住所データベースDB2は、郵便番号を木構造の上位階層に含め、郵便番号への依存度を高くしている。例えば、郵便番号の信頼性の低い国又は地域では図4に示すOCR住所データベースDB2を利用し、郵便番号の信頼性の高い国又は地域では図5に示すOCR住所データベースDB2を利用することができる。 The data size of the OCR address database DB2 shown in FIG. 4 or 5 is significantly compressed compared to the data size of the address database DB1. While the OCR address database DB2 shown in FIG. 4 has a tree structure excluding postal codes, the OCR address database DB2 shown in FIG. is increasing. For example, in countries or regions with low reliability of postal codes, the OCR address database DB2 shown in FIG. 4 can be used, and in countries or regions with high reliability of postal codes, the OCR address database DB2 shown in FIG. 5 can be used. .

画像撮影部16は、図3に示す紙葉類等から住所を読み取り、住所認識部17は、図4又は図5に示すOCR住所データベースDB2に基づき、読み取った住所を認識する。例えば、郵便番号の信頼性の低い国又は地域では図4に示すOCR住所データベースDB2を利用することにより認識精度を高めることができ、郵便番号の信頼性の高い国又は地域では図5に示すOCR住所データベースDB2を利用することにより認識精度を高めることができる。 The image capturing section 16 reads an address from a paper sheet or the like shown in FIG. 3, and the address recognition section 17 recognizes the read address based on the OCR address database DB2 shown in FIG. 4 or 5. For example, in countries or regions where the reliability of postal codes is low, recognition accuracy can be improved by using the OCR address database DB2 shown in Figure 4, and in countries or regions where the reliability of postal codes is high, the OCR address database DB2 shown in Figure 5 can be used. Recognition accuracy can be improved by using the address database DB2.

次に、OCR住所データベース生成装置18によるOCR住所データベースDB2の生成について詳細に説明する。
図6は、実施形態に係るOCR住所データベース生成装置によるOCR住所データベースの生成の第1例を示す図である。
補助記憶デバイス184は、住所の構成に関する情報を含む設定ファイルSF1を記憶する。設定ファイルSF1は、住所階層設定ファイルSF1-1、参照先設定ファイルSF1-2、及び出力言語設定ファイルSF1-3等を含む。住所階層設定ファイルSF1-1は、住所を構成する各住所階層の有効又は無効の設定、及び住所を構成する各住所階層の順位の設定を含む。参照先設定ファイルSF1-2は、各国言語に対応するファイル等の参照先を含む。出力言語設定ファイルSF1-3は、住所を構成する1以上の言語の有効又は無効の設定を含む。オペレータは、オペレーション入出力部11の入力デバイスを介して、設定ファイルSF1の情報を書き換えることができる。
Next, generation of the OCR address database DB2 by the OCR address database generation device 18 will be explained in detail.
FIG. 6 is a diagram showing a first example of generation of an OCR address database by the OCR address database generation device according to the embodiment.
The auxiliary storage device 184 stores a configuration file SF1 containing information regarding the configuration of addresses. The configuration file SF1 includes an address hierarchy configuration file SF1-1, a reference destination configuration file SF1-2, an output language configuration file SF1-3, and the like. The address hierarchy setting file SF1-1 includes settings for enabling or disabling each address hierarchy that constitutes an address, and setting the order of each address hierarchy that constitutes an address. The reference destination setting file SF1-2 includes reference destinations such as files corresponding to each country's language. The output language setting file SF1-3 includes settings for enabling or disabling one or more languages constituting the address. The operator can rewrite the information in the configuration file SF1 via the input device of the operation input/output unit 11.

入出力部186は、取得部として機能し、住所データベースDB1を取得し、補助記憶デバイス184は、取得された住所データベースDB1を記憶する。例えば、住所データベースDB1は、都市名ファイルDB1-1、町名ファイルDB1-2、番地名ファイルDB1-3、郵便番号ファイルDB1-4、法人名ファイルDB1-5、氏名ファイルDB1-6を含む。 The input/output unit 186 functions as an acquisition unit and acquires the address database DB1, and the auxiliary storage device 184 stores the acquired address database DB1. For example, the address database DB1 includes a city name file DB1-1, a town name file DB1-2, a street name file DB1-3, a postal code file DB1-4, a corporate name file DB1-5, and a name file DB1-6.

OCR住所データベース生成エンジン1811は、補助記憶デバイス184に記憶された住所データベースDB1を読み出す。また、OCR住所データベース生成エンジン1811は、設定部として機能し、オペレーション入出力部11を介して入力される、住所の構成に関する情報を設定ファイルSFに設定する。また、OCR住所データベース生成エンジン1811は、生成部として機能し、住所の構成に関する情報を含む設定ファイルSFに基づき、住所データベースDB1からOCR住所データベースDB2を生成する。補助記憶デバイス184は、生成されたOCR住所データベースDB2を記憶する。なお、住所認識部17は、OCR住所データベースDB2に基づき、紙葉類から読み取られた住所を認識する。言い換えれば、住所の構成に関する情報は、OCR住所データベースDB2を生成するための情報であるとともに、住所認識精度及び住所認識効率を高めるための情報である。 The OCR address database generation engine 1811 reads out the address database DB1 stored in the auxiliary storage device 184. Further, the OCR address database generation engine 1811 functions as a setting section, and sets information regarding the structure of an address, which is input via the operation input/output section 11, in the setting file SF. Further, the OCR address database generation engine 1811 functions as a generation unit and generates the OCR address database DB2 from the address database DB1 based on the setting file SF containing information regarding the structure of addresses. The auxiliary storage device 184 stores the generated OCR address database DB2. Note that the address recognition unit 17 recognizes addresses read from paper sheets based on the OCR address database DB2. In other words, the information regarding the address structure is information for generating the OCR address database DB2, and is information for increasing address recognition accuracy and address recognition efficiency.

図7は、実施形態に係るOCR住所データベース生成装置で利用される住所階層設定ファイルの一例を示す図である。
OCR住所データベース生成エンジン1811は、補助記憶デバイス184に記憶された住所階層設定ファイルSF1-1に基づき、入出力部186を介してオペレーション入出力部11に対して、住所を構成する各住所階層の有効(ON)又は無効(OFF)を設定するための画面を表示する表示制御信号を出力する。図7に示すように、オペレーション入出力部11のディスプレイは、表示制御信号に基づき、住所を構成する各住所階層の有効又は無効を設定するための画面を表示する。
FIG. 7 is a diagram illustrating an example of an address hierarchy setting file used in the OCR address database generation device according to the embodiment.
Based on the address hierarchy setting file SF1-1 stored in the auxiliary storage device 184, the OCR address database generation engine 1811 sends information to the operation input/output unit 11 via the input/output unit 186 for each address hierarchy making up the address. Outputs a display control signal to display a screen for setting enable (ON) or disable (OFF). As shown in FIG. 7, the display of the operation input/output unit 11 displays a screen for setting validity or invalidation of each address hierarchy configuring the address based on the display control signal.

オペレータは、オペレーション入出力部11の入力デバイスを介して、各住所階層の有効又は無効を入力する。オペレーション入出力部11は、各住所階層の有効又は無効を受け付ける。OCR住所データベース生成エンジン1811は、オペレーション入出力部11で受け付けられた入力に基づき、住所階層設定ファイルSF1-1を更新し、住所を構成する各住所階層の有効又は無効の設定を完了する。例えば、図7に示すように、OCR住所データベース生成エンジン1811は、都市名(ON)、区名(ON)、町名(ON)、番地名(ON)、建物名(OFF)、氏名(OFF)、及び郵便番号(ON)の設定を完了する。 The operator inputs whether each address hierarchy is valid or invalid via the input device of the operation input/output unit 11. The operation input/output unit 11 accepts whether each address hierarchy is valid or invalid. The OCR address database generation engine 1811 updates the address hierarchy setting file SF1-1 based on the input received by the operation input/output unit 11, and completes the setting of validity or invalidity of each address hierarchy constituting the address. For example, as shown in FIG. 7, the OCR address database generation engine 1811 generates city name (ON), ward name (ON), town name (ON), street name (ON), building name (OFF), and name (OFF). , and complete the postal code (ON) settings.

OCR住所データベース生成エンジン1811は、更新された住所階層設定ファイルSF1-1に基づき、住所データベースDB1からOCR住所データベースDB2を生成する。OCR住所データベース生成エンジン1811は、更新された住所階層設定ファイルSF1-1に基づき、全住所階層のうち、都市名(ON)、区名(ON)、町名(ON)、番地名(ON)、及び郵便番号(ON)に対応する木構造の住所階層を含むOCR住所データベースDB2を生成する。例えば、住所階層設定ファイルSF1-1は、国際基準である所定数の住所階層を含み、これら所定数の住所階層に対して有効又は無効の設定を可能とする。国又は地域のオペレータは、所定数の住所階層の一覧から、自分の国又は地域で利用されている住所階層を有効にして、利用されていない住所階層を無効にするだけでよい。又は、初期状態で所定数の住所階層を全て無効に設定し、オペレータが、自分の国又は地域で利用されている住所階層を有効にしてもよい。 The OCR address database generation engine 1811 generates the OCR address database DB2 from the address database DB1 based on the updated address hierarchy setting file SF1-1. Based on the updated address hierarchy setting file SF1-1, the OCR address database generation engine 1811 generates city name (ON), ward name (ON), town name (ON), street name (ON), and an OCR address database DB2 including a tree-structured address hierarchy corresponding to postal codes (ON). For example, the address hierarchy setting file SF1-1 includes a predetermined number of address hierarchies based on international standards, and enables setting of validity or invalidity for these predetermined number of address hierarchies. From a list of a predetermined number of address hierarchies, the country or region operator only needs to enable address hierarchies that are used in his or her country or region and disable address hierarchies that are not used. Alternatively, a predetermined number of address hierarchies may all be set to invalid in the initial state, and the operator may enable the address hierarchies used in his/her own country or region.

例えば、国名、都市名、区名、町名、通り名、建物名、及び部屋番号などの住所階層を有効に設定し、これら住所階層に絞り込むことが考えられる。又は、郵便番号を活用し、国名、都市名、郵便番号、町名、通り名、建物名、及び部屋番号などの住所階層を有効に設定し、これら住所階層に絞り込むことが考えられる。住所階層設定ファイルSF1-1により、国又は地域の実情に合わせた住所階層に絞り込むことにより、住所データベースDB1からOCR住所データベースDB2を精度良く生成することができる。 For example, it is possible to effectively set address hierarchies such as country name, city name, ward name, town name, street name, building name, and room number, and narrow down the search to these address hierarchies. Alternatively, it is possible to effectively set address hierarchies such as country name, city name, postal code, town name, street name, building name, and room number using postal codes, and narrow down the search to these address hierarchies. By narrowing down the address hierarchy to match the actual situation of the country or region using the address hierarchy setting file SF1-1, it is possible to generate the OCR address database DB2 from the address database DB1 with high accuracy.

或いは、OCR住所データベース生成エンジン1811は、補助記憶デバイス184に記憶された住所階層設定ファイルSF1-1に基づき、入出力部186を介してオペレーション入出力部11に対して、住所を構成する各住所階層の順位を設定するための画面を表示する表示制御信号を出力するようにしてもよい。オペレーション入出力部11のディスプレイは、表示制御信号に基づき、住所を構成する各住所階層の順位を設定するための画面を表示する。 Alternatively, the OCR address database generation engine 1811 sends each address constituting the address to the operation input/output unit 11 via the input/output unit 186 based on the address hierarchy setting file SF1-1 stored in the auxiliary storage device 184. A display control signal for displaying a screen for setting the hierarchy order may be output. The display of the operation input/output unit 11 displays a screen for setting the order of each address hierarchy composing an address based on the display control signal.

オペレータは、オペレーション入出力部11の入力デバイスを介して、各住所階層の順位を入力する。マウスのドラッグ及びドロップの操作で、各住所階層の順位を入力するようにしてもよい。オペレーション入出力部11は、各住所階層の順位の入力を受け付ける。OCR住所データベース生成エンジン1811は、オペレーション入出力部11で受け付けられた入力に基づき、住所階層設定ファイルSF1-1を更新し、住所を構成する各住所階層の順位の設定を完了する。 The operator inputs the rank of each address hierarchy via the input device of the operation input/output unit 11. The order of each address hierarchy may be input by dragging and dropping the mouse. The operation input/output unit 11 receives input of the rank of each address hierarchy. The OCR address database generation engine 1811 updates the address hierarchy setting file SF1-1 based on the input received by the operation input/output unit 11, and completes the setting of the ranking of each address hierarchy constituting the address.

OCR住所データベース生成エンジン1811は、更新された住所階層設定ファイルSF1-1に基づき、住所データベースDB1からOCR住所データベースDB2を生成する。OCR住所データベース生成エンジン1811は、更新された住所階層設定ファイルSF1-1に基づき、設定された順位に対応する木構造の住所階層を含むOCR住所データベースDB2を生成する。国又は地域のオペレータは、所定数の住所階層の一覧から、自分の国又は地域における住所階層の順位に応じた順位を設定するだけでよい。例えば、国名、都市名、郵便番号、及び町名の順に住所を絞るように設定しても良い。又は、郵便番号の優先度を高くして、国名、郵便番号、都市名、及び町名の順に住所を絞るように設定しても良い。住所階層別の認識精度が異なるため(例えば、長い文字列の認識精度より、桁数一定な郵便番号の認識精度が高い)、住所階層の順位を変更することにより、認識性能の向上に繋がるOCR住所データベースDB2を作成することができる。住所階層設定ファイルSF1-1により、国又は地域の実情に合わせた住所階層の順位で絞り込むことにより、住所データベースDB1からOCR住所データベースDB2を精度良く生成することができる。 The OCR address database generation engine 1811 generates the OCR address database DB2 from the address database DB1 based on the updated address hierarchy setting file SF1-1. The OCR address database generation engine 1811 generates an OCR address database DB2 including a tree-structured address hierarchy corresponding to the set order based on the updated address hierarchy setting file SF1-1. An operator in a country or region only needs to set a ranking according to the ranking of address hierarchies in his or her country or region from a list of a predetermined number of address hierarchies. For example, addresses may be narrowed down in the order of country name, city name, postal code, and town name. Alternatively, the priority may be given to the postal code, and the addresses may be narrowed down in the order of country name, postal code, city name, and town name. Since recognition accuracy differs depending on address hierarchy (for example, recognition accuracy for postal codes with a fixed number of digits is higher than recognition accuracy for long character strings), changing the order of address hierarchy can improve recognition performance. An OCR address database DB2 can be created. The address hierarchy setting file SF1-1 allows the OCR address database DB2 to be generated from the address database DB1 with high precision by narrowing down the address hierarchy according to the actual situation of the country or region.

或いは、設定ファイルSF1は、郵便番号設定ファイルを含み、OCR住所データベース生成エンジン1811は、郵便番号設定ファイルに基づき、入出力部186を介してオペレーション入出力部11に対して、住所を構成する郵便番号の信頼桁数を設定するための画面を表示する表示制御信号を出力するようにしてもよい。オペレーション入出力部11のディスプレイは、表示制御信号に基づき、住所を構成する郵便番号の信頼桁数を設定するための画面を表示する。 Alternatively, the setting file SF1 includes a postal code setting file, and the OCR address database generation engine 1811 sends the operation input/output unit 11 via the input/output unit 186 to the postal code forming the address based on the postal code setting file. A display control signal may be output that displays a screen for setting the number of reliable digits of the number. The display of the operation input/output unit 11 displays a screen for setting the number of reliable digits of the postal code that constitutes the address, based on the display control signal.

オペレータは、オペレーション入出力部11の入力デバイスを介して、郵便番号の信頼桁数を入力する。例えば、郵便番号の上位3桁を信頼桁数として入力する。オペレーション入出力部11は、郵便番号の信頼桁数の入力を受け付ける。OCR住所データベース生成エンジン1811は、オペレーション入出力部11で受け付けられた入力に基づき、郵便番号設定ファイルを更新し、郵便番号の信頼桁数の設定を完了する。 The operator inputs the number of reliable digits of the postal code via the input device of the operation input/output unit 11. For example, input the top three digits of the postal code as the number of reliable digits. The operation input/output unit 11 accepts input of the number of reliable digits of a postal code. The OCR address database generation engine 1811 updates the postal code setting file based on the input received by the operation input/output unit 11, and completes setting of the number of reliable digits of the postal code.

OCR住所データベース生成エンジン1811は、更新された郵便番号設定ファイルに基づき、住所データベースDB1からOCR住所データベースDB2を生成する。OCR住所データベース生成エンジン1811は、更新された郵便番号設定ファイルに基づき、設定された信頼桁数に対応する木構造の住所階層を含むOCR住所データベースDB2を生成する。国又は地域のオペレータは、自分の国又は地域における郵便番号の信頼性に応じた信頼桁数を設定するだけでよい。郵便番号設定ファイルにより、国又は地域の実情に合わせた郵便番号の信頼桁数で絞り込みができ、OCR住所データベースDB2を精度良く生成することができる。例えば、特定の国又は地域で、郵便番号の7桁のうち上位3桁の信頼性が高く、下位4桁の信頼性が低い場合に、上位3桁に絞り込むことにより、文字認識に優れたOCR住所データベースDB2を生成することができる。 The OCR address database generation engine 1811 generates an OCR address database DB2 from the address database DB1 based on the updated postal code setting file. The OCR address database generation engine 1811 generates an OCR address database DB2 including a tree-structured address hierarchy corresponding to the set number of reliable digits based on the updated postal code setting file. The country or region operator only needs to set the number of reliable digits according to the reliability of the postal code in his or her country or region. By using the postal code setting file, it is possible to narrow down the number of reliable digits of the postal code according to the actual situation of the country or region, and it is possible to generate the OCR address database DB2 with high accuracy. For example, in a particular country or region, if the first three digits of the seven digits of a postal code are highly reliable and the last four digits are unreliable, narrowing down to the first three digits will allow OCR to improve character recognition. Address database DB2 can be generated.

或いは、住所階層の順位と信頼桁数を組み合わせるようにしてもよい。例えば、国名、郵便番号(上位3桁)、都市名、郵便番号(全桁)、町名の順に住所を絞るように設定しても良い。信頼性の高い郵便番号の上位3桁を優先的に利用することにより、文字認識に優れたOCR住所データベースDB2を生成することができる。 Alternatively, the order of the address hierarchy and the number of reliable digits may be combined. For example, addresses may be narrowed down in the following order: country name, postal code (top three digits), city name, postal code (all digits), and town name. By preferentially using the top three digits of highly reliable postal codes, it is possible to generate an OCR address database DB2 with excellent character recognition.

或いは、設定ファイルSF1は、代替表記ファイルを含み、OCR住所データベース生成エンジン1811は、代替表記ファイルに基づき、入出力部186を介してオペレーション入出力部11に対して、基準表記に対応する代替表記を設定するための画面を表示する表示制御信号を出力するようにしてもよい。基準表記及び代替表記の何れも住所を構成する情報である。オペレーション入出力部11のディスプレイは、表示制御信号に基づき、基準表記に対応する代替表記を設定するための画面を表示する。 Alternatively, the configuration file SF1 includes an alternative notation file, and the OCR address database generation engine 1811 sends an alternative notation corresponding to the standard notation to the operation input/output unit 11 via the input/output unit 186 based on the alternative notation file. A display control signal for displaying a screen for setting the settings may be output. Both the standard notation and the alternative notation are information that constitutes an address. The display of the operation input/output unit 11 displays a screen for setting an alternative notation corresponding to the standard notation based on the display control signal.

オペレータは、オペレーション入出力部11の入力デバイスを介して、基準表記に対応する代替表記の有効又は無効を入力する。例えば、基準表記がアラビア数字で、代替表記が漢数字である。日本では、アラビア数字又は漢数字で番地又は部屋番号等が記載されることがある(アラビア数字と漢数字の番地又は部屋番号が混在することがあるが)。また、基準表記が新しい都市名で、代替表記が古い都市名である。その他、基準表記が任意の文字列で、代替表記が異なる任意の文字列である。また、基準表記に対して、複数の代替表記が存在する場合には、各代替表記に優先順位を設定することができる。基準表記に対応する代替表記を有効にすると、OCR住所データベース生成エンジン1811は、基準表記と代替表記とを同一と見なして、住所データベースDB1からOCR住所データベースDB2を生成する。OCR住所データベース生成エンジン1811は、オペレーション入出力部11で受け付けられた入力に基づき、代替表記ファイルを更新し、基準表記に対応する代替表記の設定を完了する。 The operator inputs whether the alternative notation corresponding to the reference notation is valid or invalid via the input device of the operation input/output unit 11. For example, the standard notation is Arabic numerals and the alternative notation is Chinese numerals. In Japan, house numbers or room numbers are sometimes written in Arabic numerals or Chinese numerals (although sometimes Arabic numerals and Chinese numerals are used for house addresses or room numbers). Also, the standard notation is the new city name, and the alternative notation is the old city name. In addition, the standard notation is any character string, and the alternative notation is any character string that is different. Furthermore, if there are multiple alternative notations for the standard notation, a priority can be set for each alternative notation. When the alternative notation corresponding to the standard notation is enabled, the OCR address database generation engine 1811 considers the standard notation and the alternative notation to be the same and generates the OCR address database DB2 from the address database DB1. The OCR address database generation engine 1811 updates the alternative notation file based on the input received by the operation input/output unit 11, and completes setting of the alternative notation corresponding to the standard notation.

OCR住所データベース生成エンジン1811は、更新された代替表記ファイルに基づき、住所データベースDB1からOCR住所データベースDB2を生成する。国又は地域のオペレータは、その国又は地域に特有の代替表記を設定することにより、住所表記のゆらぎに影響されることなく、住所データベースDB1からOCR住所データベースDB2を生成することができる。 The OCR address database generation engine 1811 generates an OCR address database DB2 from the address database DB1 based on the updated alternative notation file. By setting an alternative notation specific to that country or region, an operator in a country or region can generate an OCR address database DB2 from the address database DB1 without being affected by fluctuations in address notation.

また、OCR住所データベース生成エンジン1811は、代替表記に処理コードを関連付けて、オペレーション入出力部11から入力される処理コードにより、代替表記の有効又は無効を設定するようにしてもよい。 Further, the OCR address database generation engine 1811 may associate a processing code with the alternative notation, and enable or disable the alternative notation based on the processing code input from the operation input/output unit 11.

或いは、OCR住所データベース生成エンジン1811は、補助記憶デバイス184に記憶された出力言語設定ファイルSF1-3に基づき、入出力部186を介してオペレーション入出力部11に対して、住所を構成する1以上の言語を設定するための画面を表示する表示制御信号を出力するようにしてもよい。図8に示すように、オペレーション入出力部11のディスプレイは、表示制御信号に基づき、住所を構成する1以上の言語を設定するための画面を表示する。 Alternatively, based on the output language setting file SF1-3 stored in the auxiliary storage device 184, the OCR address database generation engine 1811 sends one or more information forming the address to the operation input/output unit 11 via the input/output unit 186. A display control signal may be output for displaying a screen for setting the language of the computer. As shown in FIG. 8, the display of the operation input/output unit 11 displays a screen for setting one or more languages composing the address based on the display control signal.

オペレータは、オペレーション入出力部11の入力デバイスを介して、各言語に対して有効(ON)又は無効(OFF)を入力する。オペレーション入出力部11は、各言語の有効又は無効を受け付ける。OCR住所データベース生成エンジン1811は、オペレーション入出力部11で受け付けられた入力に基づき、出力言語設定ファイルSF1-3を更新し、言語の設定を完了する。 The operator inputs whether each language is enabled (ON) or disabled (OFF) via the input device of the operation input/output unit 11. The operation input/output unit 11 accepts whether each language is valid or invalid. The OCR address database generation engine 1811 updates the output language setting file SF1-3 based on the input received by the operation input/output unit 11, and completes the language setting.

OCR住所データベース生成エンジン1811は、更新された出力言語設定ファイルSF1-3に基づき、住所データベースDB1からOCR住所データベースDB2を生成する。出力言語設定ファイルSF1-3により、国又は地域の実情に合わせた言語に絞り込むことにより、住所データベースDB1からOCR住所データベースDB2を精度良く生成することができる。 The OCR address database generation engine 1811 generates the OCR address database DB2 from the address database DB1 based on the updated output language setting file SF1-3. The OCR address database DB2 can be generated from the address database DB1 with high accuracy by narrowing down the language to match the actual situation of the country or region using the output language setting file SF1-3.

国又は地域によって、住所情報を含む住所データベースDB1の形式は異なるが、その国又は地域の実情を知るオペレータが、オペレーション入出力部11を介して、住所データベースDB1に応じた各種条件を設定ファイルSF1に入力することにより、OCR住所データベース生成装置18は、設定ファイルSF1に基づき、国又は地域によって異なる住所データベースDB1から信頼性の高いOCR住所データベースDB2を生成することができる。例えば、設定ファイルSF1には、住所の構成に関する様々な情報を設定することができる。例えば、以下のような住所の構成に関する情報を設定することができる。
・各住所階層の有効又は無効
・各住所階層の順位
・郵便番号の信頼桁数
・基準表記と基準表記に対応する代替表記
・1以上の言語
・住所データベースDB1のファイルの形式
・住所データベースDB1で使用されている区切り文字コード
・住所データベースDB1で使用されている住所階層の数
また、OCR住所データベース生成装置18又は区分システム1の製造元ではなく、OCR住所データベース生成装置18又は区分システム1を導入する国又は地域のオペレータが、条件ファイルSF1へ情報を入力するので、国又は地域の実情に応じた住所の構成に関する情報の設定が可能になるだけでなく、氏名などの個人情報関連の住所階層の設定も可能となる。これにより、個人情報を含むOCR住所データベースDB2を作成することが可能となる。また、個人情報関連を製造元に渡す必要がないので、個人情報関連の流出リスクの低減を図ることもできる。
Although the format of the address database DB1 containing address information differs depending on the country or region, an operator who knows the actual situation of the country or region can input various conditions according to the address database DB1 via the operation input/output unit 11 into the setting file SF1. By inputting , the OCR address database generation device 18 can generate a highly reliable OCR address database DB2 from the address database DB1, which differs depending on the country or region, based on the setting file SF1. For example, various information regarding the structure of an address can be set in the setting file SF1. For example, the following information regarding the address structure can be set.
・Validity or invalidity of each address hierarchy ・Order of each address hierarchy ・Number of reliable digits of postal code ・Standard notation and alternative notation corresponding to standard notation ・One or more languages ・File format of address database DB1 ・In address database DB1 Delimiter code used/Number of address hierarchies used in address database DB1 In addition, the OCR address database generation device 18 or classification system 1 is introduced instead of the manufacturer of the OCR address database generation device 18 or classification system 1. Since the national or regional operator inputs information to the condition file SF1, it is possible not only to set information regarding the address structure according to the actual situation of the country or region, but also to set the address hierarchy related to personal information such as names. Settings are also possible. This makes it possible to create an OCR address database DB2 containing personal information. Furthermore, since there is no need to hand over personal information to the manufacturer, it is possible to reduce the risk of leakage of personal information.

図9は、実施形態に係るOCR住所データベース生成装置によるOCR住所データベースの生成の第2例を示す図である。
図9に示すように、OCR住所データベース生成装置18が、複数の異なる設定ファイルを記憶することにより、住所データベースDB1から、複数の異なるOCR住所データベースを生成することができる。例えば、OCR住所データベース生成装置18は、n個の設定ファイル(設定ファイルSF1~SFn(n:2以上の整数))を記憶する。設定ファイルSF1は、住所階層設定ファイルSF1-1、参照先設定ファイルSF1-2、及び出力言語設定ファイルSF1-3等を含み、設定ファイルSFnは、住所階層設定ファイルSFn-1、参照先設定ファイルSFn-2、及び出力言語設定ファイルSFn-3等を含む。OCR住所データベース生成エンジン1811は、設定ファイルSF1に基づき、住所データベースDB1からOCR住所データベースDB21を生成し、また、設定ファイルSFnに基づき、住所データベースDB1からOCR住所データベースDB2nを生成する。例えば、各地域に応じた設定ファイルを用意するだけで、一つの住所データベースDB1から、各地域に応じたOCR住所データベースを生成することができる。
FIG. 9 is a diagram showing a second example of generation of an OCR address database by the OCR address database generation device according to the embodiment.
As shown in FIG. 9, the OCR address database generation device 18 can generate a plurality of different OCR address databases from the address database DB1 by storing a plurality of different setting files. For example, the OCR address database generation device 18 stores n configuration files (configuration files SF1 to SFn (n: an integer of 2 or more)). The setting file SF1 includes an address hierarchy setting file SF1-1, a reference setting file SF1-2, an output language setting file SF1-3, etc., and the setting file SFn includes an address hierarchy setting file SFn-1, a reference setting file Contains SFn-2, output language setting file SFn-3, etc. The OCR address database generation engine 1811 generates an OCR address database DB21 from the address database DB1 based on the configuration file SF1, and generates an OCR address database DB2n from the address database DB1 based on the configuration file SFn. For example, an OCR address database suitable for each region can be generated from one address database DB1 by simply preparing a configuration file corresponding to each region.

図10は、実施形態に係るOCR住所データベース生成装置によるOCR住所データベースの生成の第3例を示す図である。
図10に示すように、OCR住所データベース生成装置18が、複数の異なる設定ファイルを記憶することにより、複数の異なる住所データベースから、複数の異なるOCR住所データベースを生成することができる。例えば、OCR住所データベース生成装置18は、n個の設定ファイル(設定ファイルSF1~SFn(n:2以上の整数))を記憶する。また、OCR住所データベース生成装置18は、n個の住所データベース(住所データベースDB11~DB1n(n:2以上の整数))を記憶する。住所データベースDB11は、都市名ファイルDB11-1、町名ファイルDB11-2、番地名ファイルDB11-3、郵便番号ファイルDB11-4、法人名ファイルDB11-5、氏名ファイルDB11-6を含む。住所データベースDB1nは、都市名ファイルDB1n-1、町名ファイルDB1n-2、番地名ファイルDB1n-3、郵便番号ファイルDB1n-4、法人名ファイルDB1n-5、氏名ファイルDB1n-6を含む。OCR住所データベース生成エンジン1811は、設定ファイルSF1に基づき、住所データベースDB11からOCR住所データベースDB21を生成し、また、設定ファイルSFnに基づき、住所データベースDB1nからOCR住所データベースDB2nを生成する。例えば、各地域に応じた設定ファイルにより、各地域に応じた住所データベースから、各地域に応じたOCR住所データベースを生成することができる。
FIG. 10 is a diagram illustrating a third example of generation of an OCR address database by the OCR address database generation device according to the embodiment.
As shown in FIG. 10, the OCR address database generation device 18 can generate a plurality of different OCR address databases from a plurality of different address databases by storing a plurality of different setting files. For example, the OCR address database generation device 18 stores n configuration files (configuration files SF1 to SFn (n: an integer of 2 or more)). Further, the OCR address database generation device 18 stores n address databases (address databases DB11 to DB1n (n: an integer of 2 or more)). The address database DB11 includes a city name file DB11-1, a town name file DB11-2, a street name file DB11-3, a postal code file DB11-4, a corporate name file DB11-5, and a name file DB11-6. The address database DB1n includes a city name file DB1n-1, a town name file DB1n-2, a street name file DB1n-3, a postal code file DB1n-4, a corporate name file DB1n-5, and a name file DB1n-6. The OCR address database generation engine 1811 generates an OCR address database DB21 from the address database DB11 based on the configuration file SF1, and generates an OCR address database DB2n from the address database DB1n based on the configuration file SFn. For example, an OCR address database suitable for each region can be generated from an address database suitable for each region using a setting file corresponding to each region.

図11は、実施形態に係る住所データベース生成装置による住所データベースの生成処理の一例を示すフローチャートである。
例えば、オペレータは、オペレーション入出力部11を介して、OCR住所データベースDB2の生成を要求する。住所データベース生成エンジン1811は、OCR住所データベースDB2の生成要求に基づき(ST1、YES)、OCR住所データベースDB2の生成を開始する。
FIG. 11 is a flowchart illustrating an example of address database generation processing by the address database generation device according to the embodiment.
For example, the operator requests generation of the OCR address database DB2 via the operation input/output unit 11. Address database generation engine 1811 starts generating OCR address database DB2 based on the generation request for OCR address database DB2 (ST1, YES).

住所データベース生成エンジン1811は、通信インタフェース185を介して、上位機器に住所データベースDB1を要求し、住所データベースDB1を取得する(ST2)。通信インタフェース185は、上位機器等から住所データベースDB1を受信し、補助記憶デバイス184に住所データベースDB1を書き込む。或いは、入出力部186が、リムーバブルな記憶媒体から住所データベースDB1を読み取り、補助記憶デバイス184に書き込むようにしてもよい。 Address database generation engine 1811 requests address database DB1 from the host device via communication interface 185, and acquires address database DB1 (ST2). The communication interface 185 receives the address database DB1 from a host device, etc., and writes the address database DB1 into the auxiliary storage device 184. Alternatively, the input/output unit 186 may read the address database DB1 from a removable storage medium and write it to the auxiliary storage device 184.

住所データベース生成エンジン1811は、補助記憶デバイス184に記憶された設定ファイルSFに基づき、OCR住所データベースDB2を生成するために必要な情報、つまり住所の構成に関する情報を設定するための画面を表示する表示制御信号を出力する(ST3)。オペレーション入出力部11のディスプレイは、表示制御信号に基づき住所の構成に関する情報を設定するための画面を表示する(ST4)。オペレータは、オペレーション入出力部11の入力デバイスを介して、住所の構成に関する情報を入力し(ST5、YES)、住所データベース生成エンジン1811は、住所の構成に関する情報の入力に基づき、設定ファイルSFを更新する(ST6)。 The address database generation engine 1811 displays a screen for setting information necessary to generate the OCR address database DB2, that is, information regarding the address structure, based on the configuration file SF stored in the auxiliary storage device 184. A control signal is output (ST3). The display of the operation input/output unit 11 displays a screen for setting information regarding the address structure based on the display control signal (ST4). The operator inputs information regarding the address configuration through the input device of the operation input/output unit 11 (ST5, YES), and the address database generation engine 1811 generates the configuration file SF based on the input of the information regarding the address configuration. Update (ST6).

住所データベース生成エンジン1811は、更新された設定ファイルSFに基づき、住所データベースDB1からOCR住所データベースDB2を生成し(ST7)、生成したOCR住所データベースDB2を補助記憶デバイス184に書き込む。なお、一定時間、住所の構成に関する情報の入力がなければ(ST5、NO)、既存の設定ファイルSFに基づき、住所データベースDB1からOCR住所データベースDB2を生成するようにしてもよい。 The address database generation engine 1811 generates the OCR address database DB2 from the address database DB1 based on the updated configuration file SF (ST7), and writes the generated OCR address database DB2 to the auxiliary storage device 184. Note that if no information regarding the address structure is input for a certain period of time (ST5, NO), the OCR address database DB2 may be generated from the address database DB1 based on the existing setting file SF.

また、住所データベース生成エンジン1811は、OCR住所データベースDB2を生成してから更新条件を満たすか否かを監視し、更新条件を満たすことを検出した場合には(ST8、YES)、通信インタフェース185等が住所データベースDB1を再取得する(ST9)。 Further, the address database generation engine 1811 monitors whether the update conditions are satisfied after generating the OCR address database DB2, and if it is detected that the update conditions are satisfied (ST8, YES), the communication interface 185, etc. acquires the address database DB1 again (ST9).

例えば、更新条件は、以下の更新条件1乃至5のうちのいずれか1つでも良いし、これらの2以上の組み合わせでも良い。
(更新条件1)住所データベースDB1に追加された住所件数が一定値を越えた場合(新規住所が生じた場合など)
(更新条件2)住所データベースDB1の更新された住所件数が一定値を越えた場合(住所情報が訂正及び整備された場合など)
(更新条件3)OCR住所認識性能(認識率)が一定値を下回った場合(住所データベースDB1の情報が古くなった場合など)
(更新条件4)新規要求が追加された場合(郵便番号の桁数増加(5桁から6桁に変更)、住所階層の増加(特定住所階層の新設)など)
(更新条件5)更新時間に到達した場合(時間経過により情報の更新、修正、又は追加等が生じると想定)
For example, the update condition may be any one of update conditions 1 to 5 below, or a combination of two or more of these conditions.
(Update condition 1) When the number of addresses added to address database DB1 exceeds a certain value (such as when a new address occurs)
(Update condition 2) When the number of updated addresses in address database DB1 exceeds a certain value (such as when address information is corrected and maintained)
(Update condition 3) When OCR address recognition performance (recognition rate) falls below a certain value (such as when the information in address database DB1 becomes outdated)
(Update condition 4) When a new request is added (increase in the number of digits in the postal code (changed from 5 digits to 6 digits), increase in address hierarchy (new establishment of specific address hierarchy), etc.)
(Update condition 5) When the update time is reached (assuming that information will be updated, modified, or added as time passes)

例えば、ST8の監視において、更新条件3乃至5の少なくとも一つが含まれる場合、住所データベース生成エンジン1811は、ST2で取得された住所データベースDB1と、ST9で再取得された住所データベースDB1とを比較し、取得された住所データベースDB1と、再取得された住所データベースDB1との差分が更新判定値(閾値)を超える場合に(ST10、YES)、設定ファイルSFに基づき、再取得された住所データベースDB1からOCR住所データベースDB2を再生成し(ST11)、生成したOCR住所データベースDB2を補助記憶デバイス184に書き込む。このように、一定の条件を満たす場合に、OCR住所データベースDB2を再生成することで、OCR住所データベースDB2による住所認識精度及び住所認識効率の向上を図ることができる。 For example, in the monitoring of ST8, if at least one of update conditions 3 to 5 is included, the address database generation engine 1811 compares the address database DB1 acquired in ST2 and the address database DB1 reacquired in ST9. , if the difference between the acquired address database DB1 and the re-acquired address database DB1 exceeds the update judgment value (threshold) (ST10, YES), based on the configuration file SF, from the re-acquired address database DB1. The OCR address database DB2 is regenerated (ST11), and the generated OCR address database DB2 is written to the auxiliary storage device 184. In this way, by regenerating the OCR address database DB2 when certain conditions are met, it is possible to improve the address recognition accuracy and address recognition efficiency by the OCR address database DB2.

住所データベース生成エンジン1811は、動作停止要求を受信すると(ST12、YES)、動作を停止する。なお、住所データベース生成エンジン1811が、更新条件を満たすことを検出した場合に、住所データベースDB1を再取得し、ST10を省略し、設定ファイルSFに基づき、再取得された住所データベースDB1からOCR住所データベースDB2を再生成してもよい。 When the address database generation engine 1811 receives the operation stop request (ST12, YES), it stops its operation. Note that when the address database generation engine 1811 detects that the update conditions are met, it re-acquires the address database DB1, skips ST10, and generates an OCR address database from the re-acquired address database DB1 based on the configuration file SF. DB2 may be regenerated.

また、住所データベース生成装置18は、通信インタフェース185を介して他の住所データベース生成装置18に対して条件ファイルを送信するようにしてもよい。これにより、他の国又は地域などに設置される他の住所データベース生成装置18は、通信インタフェース185を介して条件ファイルを受信し、受信した条件ファイルに基づき、住所データベースDB1からOCR住所データベースDB2を生成することができる。或いは、住所データベース生成装置18は、通信インタフェース185を介して他の住所データベース生成装置18に対してOCR住所データベースDB2を送信するようにしてもよい。複数台の区分システム1が導入されるケースで、OCR住所データベースDB2を効率良く利用することができる。 Further, the address database generation device 18 may transmit the condition file to other address database generation devices 18 via the communication interface 185. As a result, another address database generating device 18 installed in another country or region receives the condition file via the communication interface 185 and converts the OCR address database DB2 from the address database DB1 based on the received condition file. can be generated. Alternatively, the address database generation device 18 may transmit the OCR address database DB2 to other address database generation devices 18 via the communication interface 185. In a case where a plurality of classification systems 1 are introduced, the OCR address database DB2 can be used efficiently.

本実施形態では、オペレーション入出力部11のディスプレイにより設定画面を表示し、設定画面を介して条件の入力を受け付けるケースについて説明したが、音声により設定を案内し、音声により条件の入力を受け付けるようにしてもよい。 In this embodiment, a case has been described in which a setting screen is displayed on the display of the operation input/output unit 11 and input of conditions is accepted via the setting screen. You may also do so.

以上により、本実施形態の区分システム又は住所データベース生成装置18によれば、複数の住所を含む住所データベースから信頼性の高いOCR住所データベースを生成することができる。 As described above, according to the classification system or address database generation device 18 of this embodiment, a highly reliable OCR address database can be generated from an address database including a plurality of addresses.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
以下、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
複数の住所を含む第1の住所データベースを取得する取得部と、
住所の構成に関する情報を設定する設定部と、
前記情報を含む設定ファイルに基づき、前記第1の住所データベースから前記複数の住所に対応する木構造の住所階層を含む第2の住所データベースを生成する生成部と、
を備える住所データベース生成装置。
[C2]
前記設定部は、住所を構成する各住所階層の有効又は無効を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記有効又は前記無効を設定する、[C1]の住所データベース生成装置。
[C3]
前記設定部は、住所を構成する各住所階層の順位を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記順位を設定する、[C1]又は[C2]の住所データベース生成装置。
[C4]
前記設定部は、住所を構成する郵便番号の信頼桁数を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記信頼桁数を設定する、[C1]乃至[C3]の何れか一つの住所データベース生成装置。
[C5]
前記設定部は、住所を構成する基準表記に対応する代替表記を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記代替表記を設定する、[C1]乃至[C4]の何れか一つの住所データベース生成装置。
[C6]
前記設定部は、住所を構成する1以上の言語を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき1以上の言語を設定する、[C1]乃至[C5]の何れか一つの住所データベース生成装置。
[C7]
前記取得部は、前記第2の住所データベースを生成してから更新条件を満たすことの検出に基づき、前記第1の住所データベースを再取得し、
前記生成部は、前記情報に基づき、再取得された前記第1の住所データベースから前記第2の住所データベースを再生成する、[C1]乃至[C6]の何れか一つの住所データベース生成装置。
[C8]
前記取得部は、前記第2の住所データベースを生成してから更新条件を満たすことの検出に基づき、前記第1の住所データベースを再取得し、
前記生成部は、取得された前記第1の住所データベースと再取得された前記第1の住所データベースとの差分が更新判定値を超える場合に、前記情報に基づき、再取得された前記第1の住所データベースから前記第2の住所データベースを再生成する、[C1]乃至[C6]の何れか一つの住所データベース生成装置。
[C9]
他の住所データベース生成装置に対して前記設定ファイルを送信する通信部を備える[C1]乃至[C8]の何れか一つの住所データベース生成装置。
[C10]
コンピュータに、
複数の住所を含む第1の住所データベースを取得する手順と、
住所の構成に関する情報を設定する手順と、
前記情報を含む設定ファイルに基づき、前記第1の住所データベースから前記複数の住所に対応する木構造の住所階層を含む第2の住所データベースを生成する手順と、
を実行させるためのプログラム。
Although several embodiments of the invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, substitutions, and changes can be made without departing from the gist of the invention. These embodiments and their modifications are included within the scope and gist of the invention, as well as within the scope of the invention described in the claims and its equivalents.
Hereinafter, the invention described in the original claims of this application will be additionally described.
[C1]
an acquisition unit that acquires a first address database including a plurality of addresses;
a setting section for setting information regarding the structure of the address;
a generation unit that generates a second address database including a tree-structured address hierarchy corresponding to the plurality of addresses from the first address database based on a configuration file including the information;
An address database generation device comprising:
[C2]
[C1], wherein the setting unit outputs a signal for displaying a screen for setting validity or invalidity of each address hierarchy constituting the address, and sets the validity or invalidation based on input from the screen. Address database generator.
[C3]
The setting unit outputs a signal for displaying a screen for setting the order of each address hierarchy constituting the address, and sets the order based on the input from the screen, [C1] or [C2] address. Database generator.
[C4]
The setting unit outputs a signal for displaying a screen for setting the number of reliable digits of a postal code constituting an address, and sets the number of reliable digits based on input from the screen, [C1] to [C3] ] Any one address database generation device.
[C5]
The setting unit outputs a signal for displaying a screen for setting an alternative notation corresponding to a standard notation constituting an address, and sets the alternative notation based on input from the screen, [C1] to [C4] ] Any one address database generation device.
[C6]
[C1] to [C5], wherein the setting unit outputs a signal for displaying a screen for setting one or more languages constituting the address, and sets the one or more languages based on input from the screen. Any one address database generation device.
[C7]
The acquisition unit re-acquires the first address database based on the detection that an update condition is satisfied after generating the second address database;
The address database generation device according to any one of [C1] to [C6], wherein the generation unit regenerates the second address database from the re-acquired first address database based on the information.
[C8]
The acquisition unit re-acquires the first address database based on the detection that an update condition is satisfied after generating the second address database,
When the difference between the acquired first address database and the re-acquired first address database exceeds an update determination value, the generating unit is configured to generate the re-acquired first address database based on the information. The address database generation device according to any one of [C1] to [C6], which regenerates the second address database from an address database.
[C9]
The address database generation device according to any one of [C1] to [C8], including a communication unit that transmits the configuration file to another address database generation device.
[C10]
to the computer,
obtaining a first address database including a plurality of addresses;
Steps for setting information about address configuration;
a step of generating a second address database including a tree-structured address hierarchy corresponding to the plurality of addresses from the first address database based on a configuration file including the information;
A program to run.

1…区分システム
11…オペレーション入出力部
12…供給部
13…区分部
14…区分制御部
15…バーコードリーダ(BCR)
16…画像撮影部
17…住所認識部
18…住所データベース生成装置
19…バーコードライター(BCW)
181…制御部
182…ROM
183…RAM
184…補助記憶デバイス
185…通信インタフェース
186…入出力部
1811…住所データベース生成エンジン
1... Sorting system 11... Operation input/output section 12... Supply section 13... Sorting section 14... Sorting control section 15... Barcode reader (BCR)
16...Image capturing unit 17...Address recognition unit 18...Address database generation device 19...Barcode writer (BCW)
181...Control unit 182...ROM
183...RAM
184... Auxiliary storage device 185... Communication interface 186... Input/output unit 1811... Address database generation engine

Claims (11)

国又は地域によって階層構造が異なるデータベースであって、複数の住所を含む第1の住所データベースを取得する取得部と、
国又は地域のオペレータにより住所の構成に関する情報を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記情報を設定する設定部と、
前記情報を含む設定ファイルに基づき、前記第1の住所データベースから前記複数の住所に対応する木構造の住所階層を含む第2の住所データベースを生成する生成部と、
を備える住所データベース生成装置。
an acquisition unit that acquires a first address database that has a hierarchical structure that differs depending on the country or region and that includes a plurality of addresses;
a setting unit that outputs a signal to display a screen for setting information regarding the address structure by a national or regional operator , and sets the information based on input from the screen;
a generation unit that generates a second address database including a tree-structured address hierarchy corresponding to the plurality of addresses from the first address database based on a configuration file including the information;
An address database generation device comprising:
前記設定部は、住所を構成する各住所階層の有効又は無効を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記有効又は前記無効を設定する、請求項1の住所データベース生成装置。 2. The setting unit according to claim 1, wherein the setting unit outputs a signal for displaying a screen for setting validity or invalidation of each address hierarchy constituting an address, and sets the validity or invalidation based on input from the screen. Address database generator. 前記設定部は、住所を構成する各住所階層の順位を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記順位を設定する、請求項1又は2の住所データベース生成装置。 3. The address database generation device according to claim 1, wherein the setting unit outputs a signal for displaying a screen for setting the ranking of each address hierarchy constituting the address, and sets the ranking based on input from the screen. Device. 前記設定部は、住所を構成する郵便番号の信頼桁数を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記信頼桁数を設定する、請求項1乃至3の何れか一つの住所データベース生成装置。 4. The setting unit according to claim 1, wherein the setting unit outputs a signal for displaying a screen for setting the number of reliable digits of a postal code constituting an address, and sets the number of reliable digits based on input from the screen. Any one address database generation device. 前記設定部は、住所を構成する基準表記に対応する代替表記を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記代替表記を設定する、請求項1乃至4の何れか一つの住所データベース生成装置。 5. The setting unit according to claim 1, wherein the setting unit outputs a signal for displaying a screen for setting an alternative notation corresponding to a reference notation constituting an address, and sets the alternative notation based on input from the screen. Any one address database generation device. 前記設定部は、住所を構成する1以上の言語を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき1以上の言語を設定する、請求項1乃至5の何れか一つの住所データベース生成装置。 Any one of claims 1 to 5, wherein the setting unit outputs a signal to display a screen for setting one or more languages constituting the address, and sets the one or more languages based on input from the screen. One address database generator. 前記取得部は、前記第2の住所データベースを生成してから更新条件を満たすことの検出に基づき、前記第1の住所データベースを再取得し、
前記生成部は、前記情報に基づき、再取得された前記第1の住所データベースから前記第2の住所データベースを再生成する、請求項1乃至6の何れか一つの住所データベース生成装置。
The acquisition unit re-acquires the first address database based on the detection that an update condition is satisfied after generating the second address database;
7. The address database generation device according to claim 1, wherein the generation unit regenerates the second address database from the re-acquired first address database based on the information.
前記取得部は、前記第2の住所データベースを生成してから更新条件を満たすことの検出に基づき、前記第1の住所データベースを再取得し、
前記生成部は、取得された前記第1の住所データベースと再取得された前記第1の住所データベースとの差分が更新判定値を超える場合に、前記情報に基づき、再取得された前記第1の住所データベースから前記第2の住所データベースを再生成する、請求項1乃至6の何れか一つの住所データベース生成装置。
The acquisition unit re-acquires the first address database based on the detection that an update condition is satisfied after generating the second address database;
When the difference between the acquired first address database and the re-acquired first address database exceeds an update determination value, the generation unit is configured to generate the re-acquired first address database based on the information. 7. The address database generation device according to claim 1, wherein the second address database is regenerated from an address database.
前記取得部は、前記第1の住所データベースに追加された住所件数が一定値を越えた場合、又は前記第1の住所データベースの更新された住所件数が一定値を越えた場合に前記更新条件を満たすことを検出する、請求項7又は8の住所データベース生成装置。 The acquisition unit sets the update condition when the number of addresses added to the first address database exceeds a certain value, or when the number of updated addresses in the first address database exceeds a certain value. The address database generation device according to claim 7 or 8, which detects that the address database is satisfied. 他の住所データベース生成装置に対して前記設定ファイルを送信する通信部を備える請求項1乃至の何れか一つの住所データベース生成装置。 10. The address database generating device according to claim 1, further comprising a communication unit configured to transmit the configuration file to another address database generating device. コンピュータに、
国又は地域によって階層構造が異なるデータベースであって、複数の住所を含む第1の住所データベースを取得する手順と、
国又は地域のオペレータにより住所の構成に関する情報を設定するための画面を表示する信号を出力し、前記画面からの入力に基づき前記情報を設定する手順と、
前記情報を含む設定ファイルに基づき、前記第1の住所データベースから前記複数の住所に対応する木構造の住所階層を含む第2の住所データベースを生成する手順と、
を実行させるためのプログラム。
to the computer,
A step of acquiring a first address database that is a database that has a different hierarchical structure depending on the country or region and that includes a plurality of addresses;
outputting a signal for displaying a screen for setting information regarding address structure by a national or regional operator , and setting the information based on input from the screen;
a step of generating a second address database including a tree-structured address hierarchy corresponding to the plurality of addresses from the first address database based on a configuration file including the information;
A program to run.
JP2019171145A 2019-09-20 2019-09-20 Address database generation device and program Active JP7408327B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019171145A JP7408327B2 (en) 2019-09-20 2019-09-20 Address database generation device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019171145A JP7408327B2 (en) 2019-09-20 2019-09-20 Address database generation device and program

Publications (2)

Publication Number Publication Date
JP2021047765A JP2021047765A (en) 2021-03-25
JP7408327B2 true JP7408327B2 (en) 2024-01-05

Family

ID=74876459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019171145A Active JP7408327B2 (en) 2019-09-20 2019-09-20 Address database generation device and program

Country Status (1)

Country Link
JP (1) JP7408327B2 (en)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029873A (en) 1998-07-10 2000-01-28 Hitachi Ltd Address book conversion method, address book converter and recording medium recording address book conversion program for the address book converter
JP2000285166A (en) 1999-03-31 2000-10-13 Sanyo Electric Co Ltd Member information managing device
JP2001134716A (en) 1999-11-09 2001-05-18 Toshiba Corp Location information recognizing method, recognition application, recording medium and location information recognizing device
JP2007240438A (en) 2006-03-10 2007-09-20 Pioneer Electronic Corp Moving passage searching device, method, and program, recording medium recording program, and guidance device
CN101984432A (en) 2010-11-10 2011-03-09 百度在线网络技术(北京)有限公司 Method and device for constructing address database
JP2011197823A (en) 2010-03-17 2011-10-06 Toshiba Corp Address database construction apparatus and address database construction method
JP2012194676A (en) 2011-03-15 2012-10-11 Ntt Comware Corp Information processing system, information generation device, information providing device, information generation method, information providing method, information generation program, and information providing program
JP2015155077A (en) 2014-02-20 2015-08-27 株式会社東芝 Paper sorting device
JP2015176241A (en) 2014-03-13 2015-10-05 株式会社東芝 Database management device and address recognition device
JP2019095833A (en) 2017-11-17 2019-06-20 株式会社ショーケース・ティービー Address management system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6318438A (en) * 1986-07-10 1988-01-26 Nec Corp Address data accumulating form conversion system
JPH09274620A (en) * 1996-04-05 1997-10-21 Casio Comput Co Ltd Data output device
KR101430454B1 (en) * 2007-10-16 2014-08-21 엘지전자 주식회사 Communication device and method of providing location information thereof

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029873A (en) 1998-07-10 2000-01-28 Hitachi Ltd Address book conversion method, address book converter and recording medium recording address book conversion program for the address book converter
JP2000285166A (en) 1999-03-31 2000-10-13 Sanyo Electric Co Ltd Member information managing device
JP2001134716A (en) 1999-11-09 2001-05-18 Toshiba Corp Location information recognizing method, recognition application, recording medium and location information recognizing device
JP2007240438A (en) 2006-03-10 2007-09-20 Pioneer Electronic Corp Moving passage searching device, method, and program, recording medium recording program, and guidance device
JP2011197823A (en) 2010-03-17 2011-10-06 Toshiba Corp Address database construction apparatus and address database construction method
CN101984432A (en) 2010-11-10 2011-03-09 百度在线网络技术(北京)有限公司 Method and device for constructing address database
JP2012194676A (en) 2011-03-15 2012-10-11 Ntt Comware Corp Information processing system, information generation device, information providing device, information generation method, information providing method, information generation program, and information providing program
JP2015155077A (en) 2014-02-20 2015-08-27 株式会社東芝 Paper sorting device
JP2015176241A (en) 2014-03-13 2015-10-05 株式会社東芝 Database management device and address recognition device
JP2019095833A (en) 2017-11-17 2019-06-20 株式会社ショーケース・ティービー Address management system

Also Published As

Publication number Publication date
JP2021047765A (en) 2021-03-25

Similar Documents

Publication Publication Date Title
CN105468318B (en) Information processing unit and display methods
JP2005135211A (en) Method and apparatus for managing document
JP6736012B2 (en) Information processing apparatus, information processing method, program, and form reading system
JP7408327B2 (en) Address database generation device and program
KR102201930B1 (en) Device and method for generating document automatically information recorded in the image file
JP2020095374A (en) Character recognition system, character recognition device, program and character recognition method
CN113569996B (en) Method, device, equipment and storage medium for classifying medical records information
JP2016018279A (en) Document file search program, document file search device, document file search method, document information output program, document information output device, and document information output method
WO2022266218A1 (en) Method and system for extracting information from a document
CN106776510A (en) Word embeds form generation method and device
JP2015052873A (en) Method of automatically generating test data comprising character string, method of identifying signature embedded in test data comprising character string, and computer and computer program of these method
JP5443788B2 (en) Formal name determination system and formal name determination program
WO2021140682A1 (en) Information processing device, information processing method, and information processing program
JP7271987B2 (en) Information processing device and program
JP7160432B2 (en) Image processing device, image processing method, program
CN113434413A (en) Data testing method, device and equipment based on data difference and storage medium
JP5348964B2 (en) Information processing apparatus, information processing method, information processing system, and program
JPH10187751A (en) Recognition data processor and its program recording medium
JP7491022B2 (en) Document identification device, document identification method, and computer program
JP7215722B2 (en) Sorted data generation device, sorted data production method, program and recording medium
JP2015106715A (en) Form data management system, method, program, and form data management apparatus
AU2021214042B2 (en) Information processing device, program, computer-readable storage medium, and information processing method
JP4278524B2 (en) Image processing apparatus, method and program, and image processing system
JP2009230705A (en) Template preparation device, device and method for preparing document data, and program
JP4069093B2 (en) REPLACEMENT PATTERN GENERATION DEVICE, METHOD, AND PROGRAM

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220810

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231220

R150 Certificate of patent or registration of utility model

Ref document number: 7408327

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150