JP2007052682A - Form processing apparatus - Google Patents
Form processing apparatus Download PDFInfo
- Publication number
- JP2007052682A JP2007052682A JP2005238137A JP2005238137A JP2007052682A JP 2007052682 A JP2007052682 A JP 2007052682A JP 2005238137 A JP2005238137 A JP 2005238137A JP 2005238137 A JP2005238137 A JP 2005238137A JP 2007052682 A JP2007052682 A JP 2007052682A
- Authority
- JP
- Japan
- Prior art keywords
- group
- processing means
- forms
- image data
- ocr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Character Input (AREA)
Abstract
Description
本発明は、OCRを利用して帳票のイメージデータを読み込み帳票処理を行うための帳票処理装置に関する。 The present invention relates to a form processing apparatus for reading form image data using OCR and performing form processing.
帳票処理装置として、帳票をOCRにより読取処理させる際に、情報を最小限にしてオペレータによるマニュアル作業を軽減させて正確でかつ効率的にしたものがある(例えば、特許文献1参照)。このような帳票処理装置では、単一帳票ごとに読み取りや訂正出力が行われる。従って、複数枚で意味をなす帳票や、纏めて管理を行いたい帳票等であってもOCRで入力する場合には、単一帳票ごとに読み取りや訂正出力を行い、出力後に、後方アプリケーションによりエラーチェックやデータの結合を行うようにしている。
ところが、複数枚で意味のある帳票(以下グループ帳票と記す)であっても単一帳票としてOCRでは処理しているので、読み取りは単一帳票でしか処理が行えず、グループ帳票としてのエラーチェック/読取り/表示/訂正/出力ができない。そのためOCR装置単独での運用には限界があった。 However, even multiple forms that are meaningful (hereinafter referred to as group forms) are processed as a single form in OCR, so they can only be processed in a single form, and check for errors as a group form. / Cannot read / display / correct / output. Therefore, there is a limit to the operation of the OCR device alone.
本発明の目的は、グループ帳票としての入力エラーチェック/読取り/表示/訂正/出力が纏めて行える帳票処理装置を提供することである。 An object of the present invention is to provide a form processing apparatus that can collectively perform input error check / read / display / correction / output as a group form.
本発明の帳票処理装置は、複数の帳票からなるグループ帳票の先頭を予めヘッダ帳票として定め少なくとも1以上のグループ帳票を一括して入力する帳票入力手段と、前記帳票入力手段で入力した前記ヘッダ帳票から次のヘッダ帳票の一つ前の帳票までをグループ帳票として認識してグループ単位のイメージデータを出力するグルーピング処理手段と、前記グルーピング処理手段で得られたグループ単位のイメージデータを予め定めた帳票モデルに従い読み取りを行うOCR読取り処理手段と、前記OCR読取り処理手段で読み取られたイメージデータをグループ単位で表示訂正し所定の形式のファイルにデータ出力するデータ出力処理手段とを備えたことを特徴とする。 The form processing apparatus according to the present invention includes a form input unit that predetermines a head of a group form composed of a plurality of forms as a header form and inputs at least one group form at a time, and the header form that is input by the form input unit. Grouping processing means for recognizing from the first to the next form of the next header form as a group form and outputting group unit image data, and for the group unit image data obtained by the grouping unit, a predetermined form OCR reading processing means for reading in accordance with a model; and data output processing means for displaying and correcting image data read by the OCR reading processing means in groups and outputting the data to a file of a predetermined format. To do.
本発明によれば、複数の帳票を1つのグループとして読み取りを行うことができるので、OCRによる入力が単票単位でなく、複数枚で1帳票というような感覚で入力が行える。また、帳票イメージやOCRで認識した文字なども、グループ単位で一括して表示し訂正でき、データ出力に関してもグループ単位のまま所定の形式に出力できる。 According to the present invention, since a plurality of forms can be read as one group, the input by OCR can be performed as if one form is a single form instead of a single form. In addition, a form image, characters recognized by OCR, and the like can be collectively displayed and corrected in units of groups, and data can be output in a predetermined format in units of groups.
以下、本発明の実施の形態を説明する。図1は本発明の実施の形態に係わる帳票処理装置のハードウエア構成図である。帳票処理装置11は、OCR端末装置12およびページスキャナ装置13からなっている。OCR端末装置12はコンピュータにより構成され、OCR端末装置12にページスキャナ装置13が接続されている。ページスキャナ装置13は帳票14を入力し、ページスキャナ装置13より入力された帳票イメージはOCR端末装置12に入力される。OCR端末装置12では、帳票定義や処理が指定されている帳票モデル15に従い帳票イメージの読み取りを行い、読取り確認や訂正処理を経た後に出力データ16を出力する。
Embodiments of the present invention will be described below. FIG. 1 is a hardware configuration diagram of a form processing apparatus according to an embodiment of the present invention. The
ページスキャナ装置13で入力する帳票14には、複数枚で意味のあるグループ帳票が含まれる。図2はグループ帳票の説明図である。図2(a)は、申込用紙、問診表、エコー、X線画像、総合検査結果等の複数の帳票からなる健康診断書であり、図2(b)は、受験票、国語テスト、数学テスト、理科テスト、社会テスト、英語テスト、総合結果等の複数の帳票からなる受験用紙であり、図2(c)は、課税資料表、第1表、第2表、第3表等の複数の帳票からなる確定申告書であり、図2(d)は、総括票ヘッダ、日報1〜日報n等の複数の帳票からなる日報の束である。これら健康診断書、受験用紙、確定申告書、日報の束は、それぞれグループ帳票であり、複数枚で一つの意味をなす帳票や、複数の同一帳票を一つのグループとして読み取りから出力までの処理を行う。すなわち、本発明の実施の形態では、グループ帳票ごとに以下の処理により帳票を入力する。
The
図3は、本発明の実施の形態に係わる帳票処理装置の機能ブロック図である。帳票処理装置11は、帳票入力手段17と、グルーピング処理手段18と、OCR読取り処理手段19と、データ出力処理手段20とから構成される。
FIG. 3 is a functional block diagram of the form processing apparatus according to the embodiment of the present invention. The
帳票のグループ先頭にヘッダ帳票を挟みスキャナ装置13に積み上げる。帳票入力手段17は、複数の帳票からなるグループ帳票を一括して入力する。すなわち、入力する帳票をグループ単位になるようにヘッダ帳票を先頭に挿入する。このヘッダ帳票は新たに追加してもよいし、グループ帳票の先頭となる既存の帳票を指定してもよい。また、グループ帳票は複数セットをスキャナ装置13に積み上げることが可能であり、一括して複数グループを入力することができる。
A header form is sandwiched at the top of the form group and stacked on the
グルーピング処理手段18は、帳票入力手段17で入力したヘッダ帳票から次のヘッダ帳票の一つ前の帳票までをグループ帳票として認識してグループ単位のイメージデータを出力する。 The grouping processing means 18 recognizes from the header form input by the form input means 17 to the form immediately before the next header form as a group form, and outputs group unit image data.
グルーピング処理手段18は、スキャナ装置13により入力された帳票イメージを識別しヘッダ帳票か判断を行う。帳票イメージの識別は、帳票モデル15に定義した帳票サイズや識別IDなどに基いて行う。ヘッダ帳票と判断した場合には、次に出現するヘッダ帳票以前までをグループ帳票と判断し、帳票モデル15やヘッダ帳票に定義した枚数などが正しく入力されたかチェックを行う。
The grouping processing means 18 identifies the form image input by the
エラーの場合は帳票入力エラーとし、即座にグループ単位での帳票再入力をユーザに促す。従来のOCR装置では単票単位での入力しか行えないため、データ出力後の後方アプリケーションでのチェックは可能であるが、このタイミングでのエラーチェックは行えず帳票再入力は不可能であった。グループ帳票が正常に読み込めた場合、OCR読取り処理にグルーピングデータとして複数イメージを渡す。 In the case of an error, it is determined as a form input error, and prompts the user to re-enter the form in groups. Since the conventional OCR device can only input in single-sheet units, it can be checked by a backward application after data output. However, an error check cannot be performed at this timing, and re-entry of the form is impossible. When the group form is successfully read, a plurality of images are passed as grouping data to the OCR reading process.
次に、OCR読取り処理手段19は、グルーピング処理手段18で得られたグループ単位のイメージデータを予め定めた帳票モデル15に従い読み取りを行う。そして、データ出力処理手段20は、OCR読取り処理手段20で読み取られたイメージデータをグループ単位で表示訂正し、所定の形式のファイルにデータ出力する。
Next, the OCR reading processing means 19 reads the group unit image data obtained by the grouping processing means 18 in accordance with a predetermined
データ出力処理手段20での読取りデータ表示/訂正処理は、従来では読み取った単一帳票ごとに処理を行っていたため、イメージの表示やOCR読み取りの結果確認および訂正も単一帳票ごとに行っていた。本発明の実施の形態では、グルーピング処理でグループ帳票をグループ化したことにより、グループ単位のイメージ表示や読取り結果確認/訂正、帳票間でのデータエラーチェックが行えるようになり、データエントリが分かり易く間違いなく簡単に行えるようになる。また、データ出力でも、グルーピングしたデータを単一帳票であったかのように扱え、その後のデータエントリシステムへの入力が安易になる。標準的に使われているファイルフォーマット、例えばマルチTIFFやXML、PDFなどへ変換出力することにより、外部ツールを使い出力ファイルを安易に管理、確認することが可能となる。 Since the read data display / correction processing in the data output processing means 20 has been conventionally performed for each read single form, image display and OCR reading result confirmation and correction are also performed for each single form. . In the embodiment of the present invention, group forms are grouped by grouping processing, so that group-unit image display, reading result confirmation / correction, and data error check between forms can be performed, and data entries are easy to understand. It will definitely be easy. Also, in data output, the grouped data can be handled as if it were a single form, and subsequent input to the data entry system becomes easy. By converting and outputting to a standard file format such as multi-TIFF, XML, PDF, etc., it becomes possible to easily manage and check the output file using an external tool.
このように、本発明の実施の形態では、帳票ベースのOCR端末装置における複数の帳票を1つのグループと捉えるので、グループ単位の入力機構(グルーピング処理)によりスキャナ装置13での入力時にエラーチェックとリカバリ処理とが行える。また、グルーピングした帳票単位で読取りができ、帳票イメージや読取り結果の表示/訂正が行え、イメージおよび認識結果(訂正結果も含む)をグループ単位のまま任意の形式のファイルに出力する機能を具備している。
As described above, in the embodiment of the present invention, since a plurality of forms in the form-based OCR terminal apparatus are regarded as one group, an error check is performed at the time of input by the
本発明の実施の形態によれば、複数の帳票を1つのグループとして読み取りを行なう機能を具備したことにより、OCR端末装置12による入力が従来の単票単位でなく、複数枚で1帳票というような感覚で入力が行えるようになる。帳票入力時にグループ内での帳票枚数チェックなどが行え、エラーが発生した場合即座にグループ単位での帳票再エントリが行えるようになる。
According to the embodiment of the present invention, since the function of reading a plurality of forms as one group is provided, the input by the
また、従来では1帳票ずつでしか表示できなかった帳票イメージやOCRで認識した文字なども、グループ単位で一括して表示/訂正できるようになりわかり易くデータエントリができるようになる。データ出力に関しても、グループ単位のまま任意の形式に出力できることにより、その後のデータエントリシステムへの入力が安易になる。また、標準的に使われている形式(TIFFやXMLなど)へ変換出力することにより、外部ツールを使いグループ化された出力ファイルを安易に管理、確認することが可能となる。これらグループ単位で扱いのできる機能を有するOCR端末装置により、データエントリを行う全工程において、ユーザの利便性が向上する。 In addition, a form image, which has conventionally been displayed only on a form-by-form basis, and characters recognized by OCR can be displayed / corrected in a batch unit, making data entry easy to understand. As for data output, since it can be output in an arbitrary format as a group unit, subsequent input to the data entry system becomes easy. In addition, by converting and outputting to a standard format (TIFF, XML, etc.), it becomes possible to easily manage and check grouped output files using an external tool. With the OCR terminal device having a function that can be handled in units of groups, the convenience of the user is improved in all the steps for performing data entry.
11…帳票処理装置、12…OCR端末装置、13…スキャナ装置、14…帳票、15…帳票モデル、16…出力データ、17…帳票入力手段、18…グルーピング処理手段、19…OCR読取り処理手段、20…データ出力処理手段
DESCRIPTION OF
Claims (1)
One of the following header forms from the form input means for inputting at least one group form at a time by predetermining the head of a group form consisting of a plurality of forms in advance as a header form and at least one group form. Grouping processing means for recognizing up to the previous form as a group form and outputting group unit image data, and OCR reading process for reading the group unit image data obtained by the grouping process unit according to a predetermined form model And a data output processing means for displaying and correcting the image data read by the OCR reading processing means in units of groups and outputting the data to a file of a predetermined format.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005238137A JP2007052682A (en) | 2005-08-19 | 2005-08-19 | Form processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005238137A JP2007052682A (en) | 2005-08-19 | 2005-08-19 | Form processing apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007052682A true JP2007052682A (en) | 2007-03-01 |
Family
ID=37917077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005238137A Withdrawn JP2007052682A (en) | 2005-08-19 | 2005-08-19 | Form processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007052682A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011164765A (en) * | 2010-02-05 | 2011-08-25 | Oki Software Co Ltd | Form reader and program |
JP2015222556A (en) * | 2014-04-30 | 2015-12-10 | キヤノンマーケティングジャパン株式会社 | Document system, processing method therefor, and program |
JP2017151627A (en) * | 2016-02-23 | 2017-08-31 | 沖電気工業株式会社 | Slip data creating system, slip data creating device, slip data creating method and control program of slip data creating device |
-
2005
- 2005-08-19 JP JP2005238137A patent/JP2007052682A/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011164765A (en) * | 2010-02-05 | 2011-08-25 | Oki Software Co Ltd | Form reader and program |
JP2015222556A (en) * | 2014-04-30 | 2015-12-10 | キヤノンマーケティングジャパン株式会社 | Document system, processing method therefor, and program |
JP2017151627A (en) * | 2016-02-23 | 2017-08-31 | 沖電気工業株式会社 | Slip data creating system, slip data creating device, slip data creating method and control program of slip data creating device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20170011732A1 (en) | Low-vision reading vision assisting system based on ocr and tts | |
EP2333655A2 (en) | Printed matter examination apparatus, a printed matter examination method, a storage medium, and a printed matter examination system | |
US8280175B2 (en) | Document processing apparatus, document processing method, and computer readable medium | |
JP2006259830A (en) | Optical character recognition device and optical character recognition result confirmation method | |
JP2835178B2 (en) | Document reading device | |
CN111950557A (en) | Error problem processing method, image forming apparatus and electronic device | |
JP2018063707A (en) | Image analysis system | |
US8985458B2 (en) | System and method for conversion of fingerprint cards into digital format using machine readable code | |
US11336788B2 (en) | Information processing apparatus and non-transitory computer readable medium for combining written information with image of document | |
JP7006246B2 (en) | Test paper processing equipment | |
US8068261B2 (en) | Image reading apparatus, image reading method, and image reading program | |
JP2007052682A (en) | Form processing apparatus | |
CN110956087B (en) | Method and device for identifying table in picture, readable medium and electronic equipment | |
JP2019159629A (en) | Information processing system, information processing apparatus, and information processing program | |
JP2007233671A (en) | Image processing apparatus, image processing method and image processing program | |
US20080263403A1 (en) | Conversion of Mathematical Statements | |
WO2020147140A1 (en) | Phrase code generation method and apparatus, phrase code recognition method and apparatus, and storage medium | |
US20090015875A1 (en) | Image manipulation of digitized images of documents | |
JP2007087238A (en) | Data conversion program, method and device | |
JP6325218B2 (en) | Character recognition result verification device and character reading system | |
JP2016004335A (en) | Character recognition processing method | |
JP2017228092A (en) | Examination business support device and examination business support method | |
JP5251652B2 (en) | Form image filing system | |
CN113139071B (en) | File processing system and method for classifying files by machine learning | |
CN113221608A (en) | Information processing apparatus, information processing method, and computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081104 |