JP2007066098A - Form recognition device, method and program - Google Patents

Form recognition device, method and program Download PDF

Info

Publication number
JP2007066098A
JP2007066098A JP2005252604A JP2005252604A JP2007066098A JP 2007066098 A JP2007066098 A JP 2007066098A JP 2005252604 A JP2005252604 A JP 2005252604A JP 2005252604 A JP2005252604 A JP 2005252604A JP 2007066098 A JP2007066098 A JP 2007066098A
Authority
JP
Japan
Prior art keywords
data
image
input
identified
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005252604A
Other languages
Japanese (ja)
Inventor
Shinichi Washida
真一 鷲田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005252604A priority Critical patent/JP2007066098A/en
Publication of JP2007066098A publication Critical patent/JP2007066098A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To automatically associate an image of an attached material inputted at an optional time with intended form data in form processing. <P>SOLUTION: In this method, for an image which is identified by an attached document or cannot be identified as a form by a document identification means is used, the content thereof is analyzed by an analysis means, a retrieval means retrieves whether data related to the analysis result is inputted or not, and the input image is generated as one composed format data with the retrieved data. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は1枚または複数枚で構成されたすでに認識済みの帳票に対し、その構成頁や添付資料の関連付けを自動で行う帳票認識装置に関する。   The present invention relates to a form recognizing apparatus that automatically associates constituent pages and attached materials with a form that has already been recognized and is composed of one or more sheets.

あらかじめ決められたフォーマットを登録しておき、そのフォーマットに一致した入力画像を検出する帳票処理において、複数枚の入力画像をまとめて1つの帳票(データ)としてデータベースに保存する技術は数多く存在する。そして、前記帳票に、既定フォーマットもしくはフリーフォーマットの添付資料が存在する場合、それを関連付ける技術も存在する。   In a form process for registering a predetermined format and detecting an input image that matches the format, there are many techniques for collectively storing a plurality of input images as one form (data) in a database. There is also a technique for associating a document with a default format or a free format attached to the form.

例えば、特許文献1のようにユーザに添付資料の画像として扱うかどうかを指示させた上、その関連付けが正しいかどうかを示す参考情報をUIに表示することで入力を補助しようと動作するものがある。   For example, as in Patent Document 1, the user operates to try to assist the input by displaying on the UI reference information indicating whether the association is correct after instructing the user whether to handle the image as an attached material. is there.

また、特許文献2のように帳票の構成情報として何枚の画像から構成されるかを既定しておき、連続して画像が入力された場合のみ、自動で関連付け1つの帳票とする技術が存在する。   In addition, as in Patent Document 2, there is a technique in which the number of images configured as the form configuration information is predetermined and only one image is automatically associated only when images are continuously input. To do.

特開2003−233773号公報JP 2003-233773 A 特開2001−5831号公報JP 2001-5831 A

帳票処理において添付資料を自動で関連付けながら入力する際には、あらかじめ既定した枚数分の添付資料が存在しなくてはならず、後で添付資料が追加で存在した場合や、入力の順序を多少間違えただけで、自動では正しく関連付けすることができなかった。   When entering data while automatically associating attachments in the form processing, there must be a predetermined number of attachments in advance, and if there are additional attachments later or if the order of entry is somewhat Just by making a mistake, it was not possible to automatically associate it correctly.

本発明においては、既にデータベースに登録された帳票の中から、該当帳票に自動で関連付けを行うことを可能とし、書類をデータベースに登録する係員の作業を簡潔に行うことのできる信頼性の高い帳票処理装置及び方法を提供することを目的とする。   In the present invention, it is possible to automatically associate with a corresponding form from among forms already registered in the database, and a highly reliable form that can easily perform the work of an attendant who registers a document in the database. It is an object of the present invention to provide a processing apparatus and method.

本発明の帳票処理装置は、帳票画像を入力する画像入力手段と、入力された前記帳票画像を登録済み帳票の書式データと比較して帳票を識別する識別手段と、前記識別手段で添付資料と識別された、または登録済み帳票と識別できなかった画像に対し、その内容を解析する解析手段と、前記解析結果に関連する入力済みデータがすでにあるかどうかを検索する検索手段と、前記入力された複数の画像を一つの合体データとして生成するデータ生成手段とを有する。   The form processing apparatus of the present invention includes an image input means for inputting a form image, an identification means for comparing the inputted form image with format data of a registered form, and an attached material by the identification means. Analyzing means for analyzing the contents of an image that has been identified or could not be identified as a registered form, search means for searching whether input data related to the analysis result already exists, and the input Data generating means for generating a plurality of images as one united data.

本発明の帳票処理方法は、帳票画像を入力する画像入力工程と、入力された前記帳票画像を登録済み帳票の書式データと比較して帳票を識別する識別工程と、前記識別手段で添付資料と識別された、または登録済み帳票と識別できなかった画像に対し、その内容を解析する解析工程と、前記解析結果に関連する入力済みデータがすでにあるかどうかを検索する検索工程と、前記入力された複数の画像を一つの合体データとして生成するデータ生成工程とを有する。   The form processing method of the present invention includes an image input step of inputting a form image, an identification step of identifying the form by comparing the inputted form image with format data of a registered form, and an attachment by the identification means. An analysis process for analyzing the contents of an image that has been identified or could not be identified as a registered form, a search process for searching whether input data related to the analysis result already exists, and the input And a data generation step of generating a plurality of images as one united data.

本発明によれば、既にデータベースに登録された帳票の中から、該当帳票に自動で関連付けを行うことを可能とし、書類をデータベースに登録する係員の作業を簡潔に行うことのできる信頼性の高い帳票処理装置が実現する。 According to the present invention, it is possible to automatically associate a corresponding form from among forms already registered in the database, and it is possible to perform work of a staff member who registers a document in the database with high reliability. A form processing apparatus is realized.

次に、本発明に係る帳票処理装置の一実施形態を図面に基づいて説明する。
(第1の実施形態)
図1は本発明を実施するための装置の構成を示すブロック図である。101は本装置全体の制御を行うCPU、102は本装置を制御するプログラム等が格納されたメモリ、103は外部記憶装置、104はディスプレイ、105はキーボード・マウス等の入力装置、106はスキャナ等の画像入力装置である。
Next, an embodiment of a form processing apparatus according to the present invention will be described with reference to the drawings.
(First embodiment)
FIG. 1 is a block diagram showing the configuration of an apparatus for carrying out the present invention. 101 is a CPU for controlling the entire apparatus, 102 is a memory storing a program for controlling the apparatus, 103 is an external storage device, 104 is a display, 105 is an input device such as a keyboard / mouse, 106 is a scanner, etc. This is an image input device.

図2は本発明の実施形態におけるシステム全体の動作を示すフローチャートである。ユーザが画像入力装置106を使用する等の指示によりステップS201において画像が入力されると、CPU101はステップS202において帳票認識手段を用い帳票認識を行なう。
CPU101はステップS203において該当する帳票がある場合、ステップS204においてOCR処理をするなどし、図3に示すようなデータを生成する。
FIG. 2 is a flowchart showing the operation of the entire system in the embodiment of the present invention. When the user inputs an image in step S201 by an instruction such as using the image input device 106, the CPU 101 performs form recognition using the form recognition means in step S202.
If there is a corresponding form in step S203, the CPU 101 performs OCR processing in step S204 and generates data as shown in FIG.

ステップS205において、外部記憶装置103に存在するデータベースにレコードを追加し、図3のデータを追加し、ステップS206において外部記憶装置103に保存する。
ステップS203において該当する登録済みの帳票が存在しなかった場合、ステップS207において、現在処理中の画像が以前データベースに保存された帳票データの添付資料であるかを判定する(詳細は図4参照)。
In step S205, a record is added to the database existing in the external storage device 103, the data shown in FIG. 3 is added, and the data is stored in the external storage device 103 in step S206.
If there is no corresponding registered form in step S203, it is determined in step S207 whether the currently processed image is an attachment of form data previously stored in the database (see FIG. 4 for details). .

ステップS208において、該当する保存済み親データが存在するならば、CPU101はステップS209において、合体書式データ生成手段を用いデータを合成し、ステップS206において外部記憶装置103に保存する。   If the corresponding saved parent data exists in step S208, the CPU 101 synthesizes the data using the combined format data generation means in step S209, and stores it in the external storage device 103 in step S206.

図3は、CPU101が帳票認識を行ない、該当帳票を発見した際に、外部記憶装置103のデータベースに保存するデータフォーマットのうち、「解約申請書」という帳票を一例にとった表である。以後、このフォーマットを例に取り、説明をする。   FIG. 3 is a table showing an example of a “cancellation application” form among the data formats stored in the database of the external storage device 103 when the CPU 101 recognizes the form and finds the corresponding form. Hereinafter, this format will be described as an example.

図4は、ステップS207の処理をさらに詳細に示したフローチャートである。
ステップS401において、CPU101は入力された画像を解析(詳細は図5参照)し、ステップS402において外部記憶装置103内のデータベースと比較検討すべき内容があるかどうかを判定する。
存在する場合には、ステップS403において、データベース内の情報と照合し、親データとなるべき登録済みデータがあるかどうかの処理を行う(詳細は図11参照)。
FIG. 4 is a flowchart showing the process of step S207 in more detail.
In step S401, the CPU 101 analyzes the input image (see FIG. 5 for details), and determines in step S402 whether there is content to be compared with the database in the external storage device 103.
If it exists, in step S403, it is checked against information in the database, and processing is performed to determine whether there is registered data that should become parent data (see FIG. 11 for details).

図5は、ステップS401の処理をさらに詳細に示したフローチャートである。
ステップS501において、CPU101は、画像解析手段を用いて文字がある領域を識別し、ステップS502において、領域毎にOCR処理をする。その結果は、図6に示すような形式の情報としてメモリ102に保存する。なお、この時点では図6の例で示す最後の3項目、「対象帳票の限定」「検索対象データベース項目」「一致データの固有ID」に該当するデータはまだ存在しない。
FIG. 5 is a flowchart showing the process of step S401 in more detail.
In step S501, the CPU 101 identifies an area where the character is present using the image analysis unit, and performs OCR processing for each area in step S502. The result is stored in the memory 102 as information in the format shown in FIG. At this point, there is no data corresponding to the last three items shown in the example of FIG. 6, “Limitation of target form”, “Search target database item”, and “Unique ID of matching data”.

ステップS503において、のちにデータベースを検索する際に、対象とすべき帳票種を判別する処理を行う(詳細は図7参照)。
ステップS504において、のちにデータベースを検索する際に、対象とすべきデータベースの項目を判別する処理を行う(詳細は図9参照)。
ステップS505において、ステップS501およびステップS502によって得られた図6に示すデータレコード数を判定し、ステップS503およびステップS504の処理を繰り返し行う。
これによって、入力画像の特徴抽出が終了する。
In step S503, when searching the database later, a process for determining the form type to be targeted is performed (refer to FIG. 7 for details).
In step S504, when the database is searched later, a process for determining the database item to be processed is performed (refer to FIG. 9 for details).
In step S505, the number of data records shown in FIG. 6 obtained in steps S501 and S502 is determined, and the processes in steps S503 and S504 are repeated.
This completes the feature extraction of the input image.

図6は、画像解析手段によって解析しOCR処理を行った処理結果を格納するデータフォーマットの例を示した表である。このデータはメモリ102上に保持される。
図7は、ステップ503の処理をさらに詳細に示したフローチャートである。
ステップS701において、CPU101は、あらかじめ外部記憶装置103に用意された図8に示すような検索対象帳票を絞り込む条件を記載した条件に基づき、図3や図6に示すデータを参照して条件に合うものがあるかどうかを判定する。
FIG. 6 is a table showing an example of a data format for storing a processing result analyzed by the image analysis means and subjected to the OCR processing. This data is held on the memory 102.
FIG. 7 is a flowchart showing the process of step 503 in more detail.
In step S701, the CPU 101 meets the conditions by referring to the data shown in FIG. 3 and FIG. 6 based on the conditions describing the conditions for narrowing down the search target form as shown in FIG. Determine if there is something.

ステップS702において、上記で絞込み条件が1つでも存在すれば、ステップS703において、その絞込条件を図6に示すようなデータの「対象帳票の限定」の項目に条件を追加しメモリ102に保存する。   If at least one narrowing condition exists in step S702, in step S703, the narrowing condition is added to the item “Limit target form” in the data as shown in FIG. To do.

例えば、図8の1レコード目の情報からは、図6に示す各レコードの文字列情報内に、「解約申請」という文字列が含まれていれば、後の検索対象を「解約申請書」という帳票種のデータに絞ることとなる。図6には、3番目のレコードの文字列内に「解約申請」という文字列が含まれているため、検索帳票を「解約申請書」に絞るため「対象帳票の限定」にその旨保存されている例となっている。   For example, from the information of the first record in FIG. 8, if the character string information of each record shown in FIG. 6 includes the character string “cancellation application”, the subsequent search object is “cancellation application form”. It will be narrowed down to the data of the form type. In FIG. 6, since the character string “cancellation application” is included in the character string of the third record, the search form is saved in “Limitation of target form” to narrow down the search form to “cancellation application form”. It is an example.

また例えば、図8の2レコード目の情報からは、図3に示すデータベース項目のうち、「登録日時」に焦点をあて、過去一週間以内に登録されたもののみを検索対象として絞ることとなる。   Further, for example, from the information of the second record in FIG. 8, the database items shown in FIG. 3 are focused on “registration date” and only those registered within the past week are narrowed down as search targets. .

図8は、検索対象帳票を絞り込む条件を記載した条件を保存するデータフォーマットの例を示した表である。このデータは外部記憶装置103にあらかじめ保存しておく。
図9は、ステップS504の処理をさらに詳細に示したフローチャートである。
ステップS901、およびステップS902、およびステップS903において、あらかじめ外部記憶装置103に用意した図10に示すようなフォーマットで記載された条件情報を用い、図6に示すような画像解析結果の各フレームごとに、「字種」「字数」「文字列の特徴」を使用して、図9の条件に合うものがあるかどうかを検証する。
FIG. 8 is a table showing an example of a data format for storing conditions describing conditions for narrowing down a search target form. This data is stored in the external storage device 103 in advance.
FIG. 9 is a flowchart showing the process of step S504 in more detail.
In step S901, step S902, and step S903, the condition information described in the format as shown in FIG. 10 prepared in advance in the external storage device 103 is used for each frame of the image analysis result as shown in FIG. , “Character type”, “number of characters”, “characteristic of character string” are used to verify whether there is a character that satisfies the condition of FIG.

ステップS904において、すべての条件をみたすものがあったかどうかを判定し、あれば、ステップS905において、図10に示す「検索対象データベース項目」の内容を、図6に示す「検索対象データベース項目」に追加しメモリ102に保存する。   In step S904, it is determined whether or not all the conditions are satisfied. If there is, in step S905, the contents of the “search target database item” shown in FIG. 10 are added to the “search target database item” shown in FIG. And stored in the memory 102.

例えば、図10の1つめのレコードでは、記号と数字のみで構成され、4番目にハイフンの存在する8文字の文字列は、郵便番号である可能性が極めて高いため、データベースと照合する際に郵便番号の項目の部分と照合することとなる。
図10は、図6に示すレコード別に、検索対象のデータベース項目を決定するために使用するデータフォーマットの一例を示す表である。このデータは外部記憶装置103にあらかじめ保存しておく。
For example, in the first record in FIG. 10, an 8-character string consisting of only symbols and numbers and having a fourth hyphen is very likely to be a zip code. It will be checked against the postal code item.
FIG. 10 is a table showing an example of a data format used for determining a database item to be searched for each record shown in FIG. This data is stored in the external storage device 103 in advance.

図11は、ステップS403の処理をさらに詳細に示したフローチャートである。
ステップS1101において、図6に示したデータを用いながら、データベース内の項目と照合し一致するものがないか検証する。
FIG. 11 is a flowchart showing the process of step S403 in more detail.
In step S1101, using the data shown in FIG. 6, the items in the database are checked to see if there is a match.

ステップS1102において、一致するものがあったかどうかを判定し、一致するものがあったならば、ステップS1103において、一致したデータが一意に持つデータ固有IDを図3に示すデータベースから取得し、図6に示すデータフォーマットの「一致データの固有ID」に保存する。なお、この処理は複数の一致データを検出する可能性がある。従って、図6の「一致データの固有ID」は複数個存在する可能性もある。   In step S1102, it is determined whether or not there is a match. If there is a match, in step S1103, the data unique ID that the matched data uniquely has is obtained from the database shown in FIG. Saved in the "matching data unique ID" in the data format shown. Note that this processing may detect a plurality of matching data. Accordingly, there may be a plurality of “unique IDs of matching data” in FIG.

ステップS1104の判定によって、図6に示すデータフォーマットの中で、「検索対象データベース項目」に記載があるものすべてにおいて、ステップS1101の照合処理を繰り返す。
すべてにおいて処理が終了したら、ステップS1105において、最終的に一致データを一意に決定する。
As a result of the determination in step S1104, the collation process in step S1101 is repeated for all of the data formats shown in FIG.
When all the processes are completed, finally, in step S1105, matching data is uniquely determined.

因みに、ステップS1105の時点において、複数の親データ候補が存在する可能性が十分に考えられる。この時、最終的な決定方法には、いくつかの手法が考えられる。
登録日時が一番最新のものにする。
個々の照合データ内容に重み付けを行い、一番照合していると思われるものを親データとする。
すべての候補をUI表示し、ユーザの指示をまち、最終決定する。
また、上記2の重み付け等から、ある一定値以下の一致では、親データとしないという処理も当然可能である。
Incidentally, it is fully possible that a plurality of parent data candidates exist at the time of step S1105. At this time, several methods can be considered as a final determination method.
Make the registration date and time the latest.
The contents of each collation data are weighted, and the data that seems to be most collated is used as parent data.
All candidates are displayed on the UI, the user's instructions are waited, and the final decision is made.
Further, from the above weighting 2 and the like, it is of course possible to perform processing in which the parent data is not used if there is a match below a certain value.

なお、図2、図4、図5、図7、図9及び図11のフローチャートにおけるプログラムコードは、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び当該プログラムを記録したコンピュータ読み取り可能な記憶媒体は本発明の実施形態に含まれる。   The program code in the flowcharts of FIGS. 2, 4, 5, 7, 9, and 11 can be realized by operating a program stored in a RAM or ROM of a computer. This program and a computer-readable storage medium storing the program are included in the embodiment of the present invention.

具体的に、前記プログラムは、例えばCD−ROMのような記録媒体に記録し、或いは各種伝送媒体を介し、コンピュータに提供される。前記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。他方、上記プログラムの伝送媒体としては、プログラム情報を搬送波として伝搬させて供給するためのコンピュータネットワーク(LAN、インターネット等のWAN、無線通信ネットワーク等)システムにおける通信媒体(光ファイバ等の有線回線や無線回線等)を用いることができる。   Specifically, the program is recorded on a recording medium such as a CD-ROM or provided to a computer via various transmission media. As a recording medium for recording the program, besides a CD-ROM, a flexible disk, a hard disk, a magnetic tape, a magneto-optical disk, a nonvolatile memory card, or the like can be used. On the other hand, as the transmission medium of the program, a communication medium (wired line such as an optical fiber or wireless) in a computer network (LAN, WAN such as the Internet, wireless communication network, etc.) system for propagating and supplying program information as a carrier wave. Line).

また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。   In addition, the functions of the above-described embodiments are realized by executing a program supplied by a computer, and the program is used in cooperation with an OS (operating system) or other application software running on the computer. When the functions of the above-described embodiment are realized, or when all or part of the processing of the supplied program is performed by a function expansion board or a function expansion unit of the computer, the function of the above-described embodiment is realized. Such a program is included in the embodiment of the present invention.

例えば、図12は、パーソナルユーザ端末装置の内部構成を示す模式図である。この図12において、1200はコンピュータPCである。PC1200は、CPU1201を備え、ROM1202またはハードディスク(HD)1211に記憶された、あるいはフレキシブルディスクドライブ(FD)1212より供給されるデバイス制御ソフトウェアを実行し、システムバス1204に接続される各デバイスを総括的に制御する。   For example, FIG. 12 is a schematic diagram illustrating an internal configuration of a personal user terminal device. In FIG. 12, reference numeral 1200 denotes a computer PC. The PC 1200 includes a CPU 1201, executes device control software stored in the ROM 1202 or the hard disk (HD) 1211, or supplied from the flexible disk drive (FD) 1212, and collects all devices connected to the system bus 1204. To control.

PC1200のCPU1201、ROM1202またはハードディスク(HD)1211に記憶されたプログラムにより、図2におけるステップS201〜S206の手順、図4におけるステップS401〜S403の手順、図5におけるステップS501〜S505の手順、図7におけるステップS701〜S703の手順、図9におけるステップS901〜S905の手順、図11におけるステップS1101〜S1105の手順等が実現される。   The program stored in the CPU 1201, the ROM 1202 or the hard disk (HD) 1211 of the PC 1200, the procedure of steps S201 to S206 in FIG. 2, the procedure of steps S401 to S403 in FIG. 4, the procedure of steps S501 to S505 in FIG. Steps S701 to S703 in FIG. 9, steps S901 to S905 in FIG. 9, steps S1101 to S1105 in FIG.

1203はRAMで、CPU1201の主メモリ、ワークエリア等として機能する。1205はキーボードコントローラ(KBC)で、キーボード(KB)1209や不図示のデバイス等からの指示入力を制御する。   A RAM 1203 functions as a main memory, work area, and the like for the CPU 1201. A keyboard controller (KBC) 1205 controls instruction input from a keyboard (KB) 1209, a device not shown, or the like.

1206はCRTコントローラ(CRTC)で、CRTディスプレイ(CRT)1210の表示を制御する。1207はディスクコントローラ(DKC)で、ブートプログラム(起動プログラム:パソコンのハードやソフトの実行(動作)を開始するプログラム)、複数のアプリケーション、編集ファイル、ユーザファイルそしてネットワーク管理プログラム等を記憶するハードディスク(HD)1211、及びフレキシブルディスク(FD)1212とのアクセスを制御する。   Reference numeral 1206 denotes a CRT controller (CRTC) which controls display on a CRT display (CRT) 1210. A disk controller (DKC) 1207 is a hard disk (boot program (start program: a program that starts execution (operation) of personal computer hardware and software)), a plurality of applications, editing files, user files, a network management program, and the like. HD) 1211 and flexible disk (FD) 1212 are controlled.

1208はネットワークインタフエースカード(NIC)で、LAN1220を介して、ネットワークプリンタ、他のネットワーク機器、あるいは他のPCと双方向のデータのやり取りを行う。   Reference numeral 1208 denotes a network interface card (NIC) that performs bidirectional data exchange with a network printer, other network devices, or other PCs via the LAN 1220.

本発明の実施形態の環境を示すシステム構成図である。It is a system configuration figure showing the environment of the embodiment of the present invention. 本発明の実施形態におけるシステム全体の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the whole system in embodiment of this invention. 帳票認識結果をデータベースに保存するデータフォーマット例を示す図である。It is a figure which shows the example of a data format which preserve | saves a form recognition result in a database. 添付画像となりうる親データ判別の処理を示したフローチャートである。It is the flowchart which showed the process of the parent data discrimination | determination which can become an attached image. 入力画像の特徴抽出の処理をさらに詳細に示したフローチャートである。It is the flowchart which showed the process of the feature extraction of the input image in detail. 入力画像の解析・OCR処理結果を格納するデータフォーマット例を示す図である。It is a figure which shows the example of a data format which stores the analysis and OCR process result of an input image. 検索対象帳票種判定の処理をさらに詳細に示したフローチャートである。It is the flowchart which showed the process of search object form kind determination further in detail. 検索対象帳票絞り込み条件を保存するデータフォーマットの例を示した図である。It is the figure which showed the example of the data format which preserve | saves search object form filter conditions. 検索データベース項目判定の処理をさらに詳細に示したフローチャートである。It is the flowchart which showed the process of search database item determination further in detail. 検索対象データベース項目決定に使用するデータフォーマットの一例を示す図である。It is a figure which shows an example of the data format used for search object database item determination. 検索対象データベース項目決定に使用するデータフォーマットの一例を示す図である。It is a figure which shows an example of the data format used for search object database item determination. パーソナルユーザ端末装置の内部構成を示す模式図である。It is a schematic diagram which shows the internal structure of a personal user terminal device.

符号の説明Explanation of symbols

101 CPU
102 メモリ
103 外部記憶装置
104 ディスプレイ
105 入力装置
106 画像入力装置
101 CPU
102 memory
103 External storage
104 display
105 Input device
106 Image input device

Claims (5)

帳票画像を入力する画像入力手段と、
入力された前記帳票画像を登録済み帳票の書式データと比較して帳票を識別する識別手段と、
前記識別手段で添付資料と識別された、または登録済み帳票と識別できなかった画像に対し、その内容を解析する解析手段と、
前記解析結果に関連する入力済みデータがすでにあるかどうかを検索する検索手段と、
前記入力された複数の画像を一つの合体データとして生成するデータ生成手段と
を有することを特徴とする帳票認識装置。
An image input means for inputting a form image;
An identification means for comparing the input form image with the format data of the registered form to identify the form;
Analyzing means for analyzing the contents of an image identified as an attachment by the identifying means or could not be identified as a registered form,
Search means for searching whether there is already input data related to the analysis result;
A form recognition apparatus comprising: a data generation unit configured to generate the plurality of input images as one united data.
前記解析手段は、画像内文字領域判別手段と、文字認識手段と、その結果に基づく検索対象決定手段とを有することを特徴とする請求項1に記載の帳票認識装置。   The form recognition apparatus according to claim 1, wherein the analysis unit includes a character region determination unit in the image, a character recognition unit, and a search target determination unit based on the result. 前記検索手段は、入力済みデータと入力データの照合手段と、合体させるデータを決定する手段とを有することを特徴とする請求項1に記載の帳票認識装置。   2. The form recognition apparatus according to claim 1, wherein the search means includes input data, input data collating means, and means for determining data to be merged. 帳票画像を入力する画像入力工程と、
入力された前記帳票画像を登録済み帳票の書式データと比較して帳票を識別する識別工程と、
前記識別手段で添付資料と識別された、または登録済み帳票と識別できなかった画像に対し、その内容を解析する解析工程と、
前記解析結果に関連する入力済みデータがすでにあるかどうかを検索する検索工程と、
前記入力された複数の画像を一つの合体データとして生成するデータ生成工程と
を有することを特徴とする帳票認識方法。
An image input process for inputting a form image;
An identification process for identifying the form by comparing the input form image with the format data of the registered form;
An analysis step of analyzing the content of the image identified as an attachment by the identification means or not identified as a registered form;
A search step for searching whether input data related to the analysis result already exists;
A form recognition method comprising: a data generation step of generating the plurality of inputted images as one united data.
請求項4に記載の方法の各工程をコンピュータにて実施させるプログラム。   The program which makes a computer implement each process of the method of Claim 4.
JP2005252604A 2005-08-31 2005-08-31 Form recognition device, method and program Pending JP2007066098A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005252604A JP2007066098A (en) 2005-08-31 2005-08-31 Form recognition device, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005252604A JP2007066098A (en) 2005-08-31 2005-08-31 Form recognition device, method and program

Publications (1)

Publication Number Publication Date
JP2007066098A true JP2007066098A (en) 2007-03-15

Family

ID=37928199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005252604A Pending JP2007066098A (en) 2005-08-31 2005-08-31 Form recognition device, method and program

Country Status (1)

Country Link
JP (1) JP2007066098A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021051364A (en) * 2019-09-20 2021-04-01 富士ゼロックス株式会社 Information processing device and program
JP7480536B2 (en) 2020-03-12 2024-05-10 富士フイルムビジネスイノベーション株式会社 Document processing device and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021051364A (en) * 2019-09-20 2021-04-01 富士ゼロックス株式会社 Information processing device and program
JP7480536B2 (en) 2020-03-12 2024-05-10 富士フイルムビジネスイノベーション株式会社 Document processing device and program

Similar Documents

Publication Publication Date Title
WO2017216980A1 (en) Machine learning device
US20070098263A1 (en) Data entry apparatus and program therefor
WO2019024692A1 (en) Speech input method and device, computer equipment and storage medium
JP5832980B2 (en) Handwriting input support device, method and program
CN106164932B (en) The method and apparatus of music symbol for identification
EP2806336A1 (en) Text prediction in a text input associated with an image
JP2010049357A (en) Authentication device, authentication system, and authentication method
JP5687312B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
JP5229102B2 (en) Form search device, form search program, and form search method
TWI794547B (en) Document retrieval device, document retrieval program, document retrieval method
US11797551B2 (en) Document retrieval apparatus, document retrieval system, document retrieval program, and document retrieval method
JP4715704B2 (en) Speech recognition apparatus and speech recognition program
JP4747828B2 (en) History management device
JP2007066098A (en) Form recognition device, method and program
JP5357711B2 (en) Document processing device
US20210406451A1 (en) Systems and Methods for Extracting Information from a Physical Document
JP2020095374A (en) Character recognition system, character recognition device, program and character recognition method
KR101725354B1 (en) Method for managing named entity dictionary and apparatus therefor
WO2022004097A1 (en) Information processing device, information processing method, and computer program
JP2006085234A (en) Electronic document forming device, electronic document forming method, and electronic document forming program
JP2006227914A (en) Information search device, information search method, program and storage medium
JP2008176625A (en) Device and method for managing character recognition result, and computer program
JP5188290B2 (en) Annotation apparatus, annotation method and program
JP2008176764A (en) Image processing system, image processing method and image processing program
JP2019204363A (en) Slip processing apparatus and slip processing method