JP2007052682A - Form processing apparatus - Google Patents

Form processing apparatus Download PDF

Info

Publication number
JP2007052682A
JP2007052682A JP2005238137A JP2005238137A JP2007052682A JP 2007052682 A JP2007052682 A JP 2007052682A JP 2005238137 A JP2005238137 A JP 2005238137A JP 2005238137 A JP2005238137 A JP 2005238137A JP 2007052682 A JP2007052682 A JP 2007052682A
Authority
JP
Japan
Prior art keywords
group
processing means
forms
image data
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005238137A
Other languages
Japanese (ja)
Inventor
Takehiko Ichikura
岳彦 市倉
Yoshimasa Iwata
義正 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2005238137A priority Critical patent/JP2007052682A/en
Publication of JP2007052682A publication Critical patent/JP2007052682A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a form processing apparatus capable of collectively performing input error check/read/display/correction/output for group forms. <P>SOLUTION: The form processing apparatus is provided with a form input means 17 for previously determining the head of each group form consisting of a plurality of forms as a header form and collectively inputting at least one group form, a grouping processing means 18 for recognizing forms from the header form inputted by the form input means 17 up to a form just before a succeeding header form as a group form and outputting image data in each group, an OCR reading processing means 19 for reading out the image data of each group obtained by the grouping processing means 18 in accordance with a previously determined form model, and a data output processing means 20 for displaying and correcting the image data read out by the OCR reading processing means 19 in each group and outputting the image data to a file of a fixed format. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、OCRを利用して帳票のイメージデータを読み込み帳票処理を行うための帳票処理装置に関する。   The present invention relates to a form processing apparatus for reading form image data using OCR and performing form processing.

帳票処理装置として、帳票をOCRにより読取処理させる際に、情報を最小限にしてオペレータによるマニュアル作業を軽減させて正確でかつ効率的にしたものがある(例えば、特許文献1参照)。このような帳票処理装置では、単一帳票ごとに読み取りや訂正出力が行われる。従って、複数枚で意味をなす帳票や、纏めて管理を行いたい帳票等であってもOCRで入力する場合には、単一帳票ごとに読み取りや訂正出力を行い、出力後に、後方アプリケーションによりエラーチェックやデータの結合を行うようにしている。
特開2004−158030号公報
As a form processing apparatus, there is a form processing apparatus that is accurate and efficient by minimizing information and reducing manual work by an operator when a form is read and processed by OCR (see, for example, Patent Document 1). In such a form processing apparatus, reading and correction output are performed for each single form. Therefore, even if a form that makes sense with multiple sheets or a form that you want to manage collectively is input with OCR, read and correct output for each single form, and after output, an error will occur by the back application. Check and combine data.
JP 2004-158030 A

ところが、複数枚で意味のある帳票(以下グループ帳票と記す)であっても単一帳票としてOCRでは処理しているので、読み取りは単一帳票でしか処理が行えず、グループ帳票としてのエラーチェック/読取り/表示/訂正/出力ができない。そのためOCR装置単独での運用には限界があった。   However, even multiple forms that are meaningful (hereinafter referred to as group forms) are processed as a single form in OCR, so they can only be processed in a single form, and check for errors as a group form. / Cannot read / display / correct / output. Therefore, there is a limit to the operation of the OCR device alone.

本発明の目的は、グループ帳票としての入力エラーチェック/読取り/表示/訂正/出力が纏めて行える帳票処理装置を提供することである。   An object of the present invention is to provide a form processing apparatus that can collectively perform input error check / read / display / correction / output as a group form.

本発明の帳票処理装置は、複数の帳票からなるグループ帳票の先頭を予めヘッダ帳票として定め少なくとも1以上のグループ帳票を一括して入力する帳票入力手段と、前記帳票入力手段で入力した前記ヘッダ帳票から次のヘッダ帳票の一つ前の帳票までをグループ帳票として認識してグループ単位のイメージデータを出力するグルーピング処理手段と、前記グルーピング処理手段で得られたグループ単位のイメージデータを予め定めた帳票モデルに従い読み取りを行うOCR読取り処理手段と、前記OCR読取り処理手段で読み取られたイメージデータをグループ単位で表示訂正し所定の形式のファイルにデータ出力するデータ出力処理手段とを備えたことを特徴とする。   The form processing apparatus according to the present invention includes a form input unit that predetermines a head of a group form composed of a plurality of forms as a header form and inputs at least one group form at a time, and the header form that is input by the form input unit. Grouping processing means for recognizing from the first to the next form of the next header form as a group form and outputting group unit image data, and for the group unit image data obtained by the grouping unit, a predetermined form OCR reading processing means for reading in accordance with a model; and data output processing means for displaying and correcting image data read by the OCR reading processing means in groups and outputting the data to a file of a predetermined format. To do.

本発明によれば、複数の帳票を1つのグループとして読み取りを行うことができるので、OCRによる入力が単票単位でなく、複数枚で1帳票というような感覚で入力が行える。また、帳票イメージやOCRで認識した文字なども、グループ単位で一括して表示し訂正でき、データ出力に関してもグループ単位のまま所定の形式に出力できる。   According to the present invention, since a plurality of forms can be read as one group, the input by OCR can be performed as if one form is a single form instead of a single form. In addition, a form image, characters recognized by OCR, and the like can be collectively displayed and corrected in units of groups, and data can be output in a predetermined format in units of groups.

以下、本発明の実施の形態を説明する。図1は本発明の実施の形態に係わる帳票処理装置のハードウエア構成図である。帳票処理装置11は、OCR端末装置12およびページスキャナ装置13からなっている。OCR端末装置12はコンピュータにより構成され、OCR端末装置12にページスキャナ装置13が接続されている。ページスキャナ装置13は帳票14を入力し、ページスキャナ装置13より入力された帳票イメージはOCR端末装置12に入力される。OCR端末装置12では、帳票定義や処理が指定されている帳票モデル15に従い帳票イメージの読み取りを行い、読取り確認や訂正処理を経た後に出力データ16を出力する。   Embodiments of the present invention will be described below. FIG. 1 is a hardware configuration diagram of a form processing apparatus according to an embodiment of the present invention. The form processing device 11 includes an OCR terminal device 12 and a page scanner device 13. The OCR terminal device 12 is configured by a computer, and a page scanner device 13 is connected to the OCR terminal device 12. The page scanner device 13 inputs a form 14, and the form image input from the page scanner device 13 is input to the OCR terminal device 12. The OCR terminal device 12 reads a form image in accordance with a form model 15 in which form definition and processing are specified, and outputs output data 16 after reading confirmation and correction processing.

ページスキャナ装置13で入力する帳票14には、複数枚で意味のあるグループ帳票が含まれる。図2はグループ帳票の説明図である。図2(a)は、申込用紙、問診表、エコー、X線画像、総合検査結果等の複数の帳票からなる健康診断書であり、図2(b)は、受験票、国語テスト、数学テスト、理科テスト、社会テスト、英語テスト、総合結果等の複数の帳票からなる受験用紙であり、図2(c)は、課税資料表、第1表、第2表、第3表等の複数の帳票からなる確定申告書であり、図2(d)は、総括票ヘッダ、日報1〜日報n等の複数の帳票からなる日報の束である。これら健康診断書、受験用紙、確定申告書、日報の束は、それぞれグループ帳票であり、複数枚で一つの意味をなす帳票や、複数の同一帳票を一つのグループとして読み取りから出力までの処理を行う。すなわち、本発明の実施の形態では、グループ帳票ごとに以下の処理により帳票を入力する。   The form 14 input by the page scanner device 13 includes a plurality of meaningful group forms. FIG. 2 is an explanatory diagram of a group form. Fig. 2 (a) is a health certificate consisting of multiple forms such as application forms, questionnaires, echoes, X-ray images, comprehensive examination results, etc. Fig. 2 (b) is an exam card, Japanese language test, mathematical test , Examination test form consisting of multiple forms such as science test, social test, English test, comprehensive results, etc. Figure 2 (c) is a tax examination data table, the first table, the second table, the third table, etc. FIG. 2D is a bundle of daily reports including a plurality of forms such as a summary form header and daily reports 1 to n. Each of these medical checkup forms, examination forms, final return forms, and daily report bundles is a group form, and processes from reading to output as a group of forms that make one meaning with multiple sheets and the same form. Do. That is, in the embodiment of the present invention, a form is input for each group form by the following processing.

図3は、本発明の実施の形態に係わる帳票処理装置の機能ブロック図である。帳票処理装置11は、帳票入力手段17と、グルーピング処理手段18と、OCR読取り処理手段19と、データ出力処理手段20とから構成される。   FIG. 3 is a functional block diagram of the form processing apparatus according to the embodiment of the present invention. The form processing apparatus 11 includes a form input unit 17, a grouping processing unit 18, an OCR reading processing unit 19, and a data output processing unit 20.

帳票のグループ先頭にヘッダ帳票を挟みスキャナ装置13に積み上げる。帳票入力手段17は、複数の帳票からなるグループ帳票を一括して入力する。すなわち、入力する帳票をグループ単位になるようにヘッダ帳票を先頭に挿入する。このヘッダ帳票は新たに追加してもよいし、グループ帳票の先頭となる既存の帳票を指定してもよい。また、グループ帳票は複数セットをスキャナ装置13に積み上げることが可能であり、一括して複数グループを入力することができる。   A header form is sandwiched at the top of the form group and stacked on the scanner device 13. The form input means 17 inputs a group form consisting of a plurality of forms at once. That is, the header form is inserted at the head so that the form to be input is in group units. This header form may be newly added, or an existing form that is the head of the group form may be designated. In addition, a plurality of group forms can be stacked on the scanner device 13, and a plurality of groups can be input at once.

グルーピング処理手段18は、帳票入力手段17で入力したヘッダ帳票から次のヘッダ帳票の一つ前の帳票までをグループ帳票として認識してグループ単位のイメージデータを出力する。   The grouping processing means 18 recognizes from the header form input by the form input means 17 to the form immediately before the next header form as a group form, and outputs group unit image data.

グルーピング処理手段18は、スキャナ装置13により入力された帳票イメージを識別しヘッダ帳票か判断を行う。帳票イメージの識別は、帳票モデル15に定義した帳票サイズや識別IDなどに基いて行う。ヘッダ帳票と判断した場合には、次に出現するヘッダ帳票以前までをグループ帳票と判断し、帳票モデル15やヘッダ帳票に定義した枚数などが正しく入力されたかチェックを行う。   The grouping processing means 18 identifies the form image input by the scanner device 13 and determines whether it is a header form. The form image is identified based on the form size and the identification ID defined in the form model 15. If it is determined that the form is a header form, it is determined that the part before the next appearing header form is a group form, and it is checked whether the form model 15 and the number of sheets defined in the header form are correctly input.

エラーの場合は帳票入力エラーとし、即座にグループ単位での帳票再入力をユーザに促す。従来のOCR装置では単票単位での入力しか行えないため、データ出力後の後方アプリケーションでのチェックは可能であるが、このタイミングでのエラーチェックは行えず帳票再入力は不可能であった。グループ帳票が正常に読み込めた場合、OCR読取り処理にグルーピングデータとして複数イメージを渡す。   In the case of an error, it is determined as a form input error, and prompts the user to re-enter the form in groups. Since the conventional OCR device can only input in single-sheet units, it can be checked by a backward application after data output. However, an error check cannot be performed at this timing, and re-entry of the form is impossible. When the group form is successfully read, a plurality of images are passed as grouping data to the OCR reading process.

次に、OCR読取り処理手段19は、グルーピング処理手段18で得られたグループ単位のイメージデータを予め定めた帳票モデル15に従い読み取りを行う。そして、データ出力処理手段20は、OCR読取り処理手段20で読み取られたイメージデータをグループ単位で表示訂正し、所定の形式のファイルにデータ出力する。   Next, the OCR reading processing means 19 reads the group unit image data obtained by the grouping processing means 18 in accordance with a predetermined form model 15. The data output processing unit 20 corrects the display of the image data read by the OCR reading processing unit 20 in units of groups, and outputs the data to a predetermined format file.

データ出力処理手段20での読取りデータ表示/訂正処理は、従来では読み取った単一帳票ごとに処理を行っていたため、イメージの表示やOCR読み取りの結果確認および訂正も単一帳票ごとに行っていた。本発明の実施の形態では、グルーピング処理でグループ帳票をグループ化したことにより、グループ単位のイメージ表示や読取り結果確認/訂正、帳票間でのデータエラーチェックが行えるようになり、データエントリが分かり易く間違いなく簡単に行えるようになる。また、データ出力でも、グルーピングしたデータを単一帳票であったかのように扱え、その後のデータエントリシステムへの入力が安易になる。標準的に使われているファイルフォーマット、例えばマルチTIFFやXML、PDFなどへ変換出力することにより、外部ツールを使い出力ファイルを安易に管理、確認することが可能となる。   Since the read data display / correction processing in the data output processing means 20 has been conventionally performed for each read single form, image display and OCR reading result confirmation and correction are also performed for each single form. . In the embodiment of the present invention, group forms are grouped by grouping processing, so that group-unit image display, reading result confirmation / correction, and data error check between forms can be performed, and data entries are easy to understand. It will definitely be easy. Also, in data output, the grouped data can be handled as if it were a single form, and subsequent input to the data entry system becomes easy. By converting and outputting to a standard file format such as multi-TIFF, XML, PDF, etc., it becomes possible to easily manage and check the output file using an external tool.

このように、本発明の実施の形態では、帳票ベースのOCR端末装置における複数の帳票を1つのグループと捉えるので、グループ単位の入力機構(グルーピング処理)によりスキャナ装置13での入力時にエラーチェックとリカバリ処理とが行える。また、グルーピングした帳票単位で読取りができ、帳票イメージや読取り結果の表示/訂正が行え、イメージおよび認識結果(訂正結果も含む)をグループ単位のまま任意の形式のファイルに出力する機能を具備している。   As described above, in the embodiment of the present invention, since a plurality of forms in the form-based OCR terminal apparatus are regarded as one group, an error check is performed at the time of input by the scanner apparatus 13 by a group unit input mechanism (grouping process). Recovery processing can be performed. In addition, it can be read in grouped form units, can display / correct form images and reading results, and has a function to output images and recognition results (including correction results) to files of any format in group units. ing.

本発明の実施の形態によれば、複数の帳票を1つのグループとして読み取りを行なう機能を具備したことにより、OCR端末装置12による入力が従来の単票単位でなく、複数枚で1帳票というような感覚で入力が行えるようになる。帳票入力時にグループ内での帳票枚数チェックなどが行え、エラーが発生した場合即座にグループ単位での帳票再エントリが行えるようになる。   According to the embodiment of the present invention, since the function of reading a plurality of forms as one group is provided, the input by the OCR terminal device 12 is not a unit of a conventional single form but a single form of a single form. Input can be done with a sense. When entering a form, the number of forms in the group can be checked. If an error occurs, the form can be re-entry in groups immediately.

また、従来では1帳票ずつでしか表示できなかった帳票イメージやOCRで認識した文字なども、グループ単位で一括して表示/訂正できるようになりわかり易くデータエントリができるようになる。データ出力に関しても、グループ単位のまま任意の形式に出力できることにより、その後のデータエントリシステムへの入力が安易になる。また、標準的に使われている形式(TIFFやXMLなど)へ変換出力することにより、外部ツールを使いグループ化された出力ファイルを安易に管理、確認することが可能となる。これらグループ単位で扱いのできる機能を有するOCR端末装置により、データエントリを行う全工程において、ユーザの利便性が向上する。   In addition, a form image, which has conventionally been displayed only on a form-by-form basis, and characters recognized by OCR can be displayed / corrected in a batch unit, making data entry easy to understand. As for data output, since it can be output in an arbitrary format as a group unit, subsequent input to the data entry system becomes easy. In addition, by converting and outputting to a standard format (TIFF, XML, etc.), it becomes possible to easily manage and check grouped output files using an external tool. With the OCR terminal device having a function that can be handled in units of groups, the convenience of the user is improved in all the steps for performing data entry.

本発明の実施の形態に係わる帳票処理装置のハードウエア構成図。The hardware block diagram of the form processing apparatus concerning embodiment of this invention. 本発明の実施の形態におけるグループ帳票の説明図。Explanatory drawing of the group form in embodiment of this invention. 本発明の実施の形態に係わる帳票処理装置の機能ブロック図。The functional block diagram of the form processing apparatus concerning embodiment of this invention.

符号の説明Explanation of symbols

11…帳票処理装置、12…OCR端末装置、13…スキャナ装置、14…帳票、15…帳票モデル、16…出力データ、17…帳票入力手段、18…グルーピング処理手段、19…OCR読取り処理手段、20…データ出力処理手段
DESCRIPTION OF SYMBOLS 11 ... Form processing apparatus, 12 ... OCR terminal apparatus, 13 ... Scanner apparatus, 14 ... Form, 15 ... Form model, 16 ... Output data, 17 ... Form input means, 18 ... Grouping processing means, 19 ... OCR reading processing means, 20: Data output processing means

Claims (1)

複数の帳票からなるグループ帳票の先頭を予めヘッダ帳票として定め少なくとも1以上のグループ帳票を一括して入力する帳票入力手段と、前記帳票入力手段で入力した前記ヘッダ帳票から次のヘッダ帳票の一つ前の帳票までをグループ帳票として認識してグループ単位のイメージデータを出力するグルーピング処理手段と、前記グルーピング処理手段で得られたグループ単位のイメージデータを予め定めた帳票モデルに従い読み取りを行うOCR読取り処理手段と、前記OCR読取り処理手段で読み取られたイメージデータをグループ単位で表示訂正し所定の形式のファイルにデータ出力するデータ出力処理手段とを備えたことを特徴とする帳票処理装置。
One of the following header forms from the form input means for inputting at least one group form at a time by predetermining the head of a group form consisting of a plurality of forms in advance as a header form and at least one group form. Grouping processing means for recognizing up to the previous form as a group form and outputting group unit image data, and OCR reading process for reading the group unit image data obtained by the grouping process unit according to a predetermined form model And a data output processing means for displaying and correcting the image data read by the OCR reading processing means in units of groups and outputting the data to a file of a predetermined format.
JP2005238137A 2005-08-19 2005-08-19 Form processing apparatus Withdrawn JP2007052682A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005238137A JP2007052682A (en) 2005-08-19 2005-08-19 Form processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005238137A JP2007052682A (en) 2005-08-19 2005-08-19 Form processing apparatus

Publications (1)

Publication Number Publication Date
JP2007052682A true JP2007052682A (en) 2007-03-01

Family

ID=37917077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005238137A Withdrawn JP2007052682A (en) 2005-08-19 2005-08-19 Form processing apparatus

Country Status (1)

Country Link
JP (1) JP2007052682A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011164765A (en) * 2010-02-05 2011-08-25 Oki Software Co Ltd Form reader and program
JP2015222556A (en) * 2014-04-30 2015-12-10 キヤノンマーケティングジャパン株式会社 Document system, processing method therefor, and program
JP2017151627A (en) * 2016-02-23 2017-08-31 沖電気工業株式会社 Slip data creating system, slip data creating device, slip data creating method and control program of slip data creating device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011164765A (en) * 2010-02-05 2011-08-25 Oki Software Co Ltd Form reader and program
JP2015222556A (en) * 2014-04-30 2015-12-10 キヤノンマーケティングジャパン株式会社 Document system, processing method therefor, and program
JP2017151627A (en) * 2016-02-23 2017-08-31 沖電気工業株式会社 Slip data creating system, slip data creating device, slip data creating method and control program of slip data creating device

Similar Documents

Publication Publication Date Title
US20170011732A1 (en) Low-vision reading vision assisting system based on ocr and tts
EP2333655A2 (en) Printed matter examination apparatus, a printed matter examination method, a storage medium, and a printed matter examination system
US8280175B2 (en) Document processing apparatus, document processing method, and computer readable medium
JP2006259830A (en) Optical character recognition device and optical character recognition result confirmation method
JP2835178B2 (en) Document reading device
CN111950557A (en) Error problem processing method, image forming apparatus and electronic device
JP2018063707A (en) Image analysis system
US8985458B2 (en) System and method for conversion of fingerprint cards into digital format using machine readable code
US11336788B2 (en) Information processing apparatus and non-transitory computer readable medium for combining written information with image of document
JP7006246B2 (en) Test paper processing equipment
US8068261B2 (en) Image reading apparatus, image reading method, and image reading program
JP2007052682A (en) Form processing apparatus
CN110956087B (en) Method and device for identifying table in picture, readable medium and electronic equipment
JP2019159629A (en) Information processing system, information processing apparatus, and information processing program
JP2007233671A (en) Image processing apparatus, image processing method and image processing program
US20080263403A1 (en) Conversion of Mathematical Statements
WO2020147140A1 (en) Phrase code generation method and apparatus, phrase code recognition method and apparatus, and storage medium
US20090015875A1 (en) Image manipulation of digitized images of documents
JP2007087238A (en) Data conversion program, method and device
JP6325218B2 (en) Character recognition result verification device and character reading system
JP2016004335A (en) Character recognition processing method
JP2017228092A (en) Examination business support device and examination business support method
JP5251652B2 (en) Form image filing system
CN113139071B (en) File processing system and method for classifying files by machine learning
CN113221608A (en) Information processing apparatus, information processing method, and computer readable medium

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081104