JPH1166228A - Method for generating format information of document for optical character reader - Google Patents

Method for generating format information of document for optical character reader

Info

Publication number
JPH1166228A
JPH1166228A JP9227717A JP22771797A JPH1166228A JP H1166228 A JPH1166228 A JP H1166228A JP 9227717 A JP9227717 A JP 9227717A JP 22771797 A JP22771797 A JP 22771797A JP H1166228 A JPH1166228 A JP H1166228A
Authority
JP
Japan
Prior art keywords
frame
line
range
format information
entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9227717A
Other languages
Japanese (ja)
Other versions
JP3524339B2 (en
Inventor
Katsumi Fukuchi
克己 福地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP22771797A priority Critical patent/JP3524339B2/en
Publication of JPH1166228A publication Critical patent/JPH1166228A/en
Application granted granted Critical
Publication of JP3524339B2 publication Critical patent/JP3524339B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To generate format information on a document for OCR having no entry by using this document. SOLUTION: The document for OCR with no entry, which is inputted from an image input part 21, is read by an image read part 22 and displayed at a display part 25 from an image display part 24. In the document image displayed at the display part 25, an entry frame range is specified by a range input part 27. A detection range calculation part 28 calculates a frame line detection range which is wider than the range specified at an entry range specification part 26 and a frame line detection part 29 detects the frame line present in the frame line detection range. A line kind decision part 30 decides whether the frame line is a solid or a dotted line, and position information on the detected frame line and the kind of the frame line are displayed at the display part 25 from a format display part. The generated format information is further registered as format information 33 by a registration part 32.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、光学式文字読取装
置(以下、「OCR」という)用帳票における認識対象
文字の記入位置に関する情報を生成するOCR用帳票の
フォーマット情報生成方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for generating format information of an OCR form for generating information relating to the entry position of a character to be recognized in a form for an optical character reader (hereinafter referred to as "OCR"). .

【0002】[0002]

【従来の技術】図2は、OCR用の帳票の一例を示す図
である。この帳票10上には、認識対象となる文字を記
入するための記入枠11,12,…が印刷されている。
例えば、記入枠11は、手書き文字を1文字ずつ区切っ
て記入するために上枠a、下枠b、左枠c、及び右枠d
の4本の囲み線で形成された文字枠が一定の間隔で複数
個配列された普通枠である。記入枠12は、プリンタ等
によって印字を行うためのフリーピッチのものであり、
長方形の各辺を形成する上枠a、下枠b、左枠c、及び
右枠dの4本の囲み線で構成されている。記入枠13
は、複数の数字等を手書きで記入するための表形式のも
のであり、4本の囲み線の他に各桁を区切るための複数
の区切り線eが設けられている。また、記入枠14のよ
うに、枠内に文字が印字されている場合もある。このよ
うな、上枠a、下枠b、左枠c、及び右枠dの囲み線
や、区切り線eは、実線で印刷されているもののほか、
記入枠15のように点線で印刷されたものや、ドロップ
アウト・カラーで印刷されたものがある。このような帳
票10がOCRによって読取られると、この帳票10の
全体が複数の画素に分解され、その各画素毎に白または
黒に区分されたイメージデータがOCR内のイメージメ
モリに格納される。そして、イメージメモリに格納され
たイメージデータの中から、帳票10の記入枠11,1
2,…に対応する記憶領域に格納されたイメージデータ
が切出されて、文字認識が行われる。このイメージデー
タの切出し及び文字認識の際に、帳票10における認識
対象となる文字の記入位置や記入枠等に関する情報、即
ち帳票10のフォーマット情報に基づいて、イメージメ
モリの該当する記憶領域に格納されたイメージデータが
読出され、文字認識が行われるようになっている。
2. Description of the Related Art FIG. 2 shows an example of an OCR form. On the form 10, entry frames 11, 12, ... for entering characters to be recognized are printed.
For example, the entry frame 11 is composed of an upper frame a, a lower frame b, a left frame c, and a right frame d in order to write handwritten characters one by one.
Is a normal frame in which a plurality of character frames formed by the four surrounding lines are arranged at regular intervals. The entry frame 12 has a free pitch for printing by a printer or the like.
It is composed of four surrounding lines, an upper frame a, a lower frame b, a left frame c, and a right frame d that form each side of the rectangle. Box 13
Is a table format for writing a plurality of numbers and the like by hand, and includes a plurality of dividing lines e for separating each digit in addition to the four surrounding lines. In some cases, characters are printed in the frame as in the entry frame 14. Such an enclosing line of the upper frame a, the lower frame b, the left frame c, and the right frame d, and the separator line e are printed in solid lines,
Some are printed with a dotted line like the entry frame 15, and others are printed with a dropout color. When such a form 10 is read by the OCR, the entire form 10 is decomposed into a plurality of pixels, and image data divided into white or black for each pixel is stored in an image memory in the OCR. Then, from the image data stored in the image memory, the entry frames 11 and 1 of the form 10 are entered.
Image data stored in the storage areas corresponding to 2,... Is cut out and character recognition is performed. At the time of extracting and character recognition of the image data, the image data is stored in a corresponding storage area of the image memory based on information on the entry position and entry frame of the character to be recognized in the form 10, that is, the format information of the form 10. The read image data is read and character recognition is performed.

【0003】従来、このような帳票10のフォーマット
情報は、次のような方法で作成されていた。即ち、帳票
10における各記入枠11,12,…の四隅の座標を物
差し等ではかり、その座標の値と、記入枠11,12,
…のそれぞれの形態(普通枠、表形式、フリーピッチ、
枠線の印刷色等)を登録するとともに、該記入枠11等
の中に記入される文字の種別(漢字、英数字、かな文
字、単語照合等)の情報を、キーボード等からの指示に
よって予めフォーマット情報として登録するようにして
いた。
Conventionally, such format information of the form 10 has been created by the following method. That is, the coordinates of the four corners of each of the entry boxes 11, 12,... In the form 10 are measured with a ruler or the like, and the values of the coordinates and the entry boxes 11, 12,.
... each form (normal frame, table format, free pitch,
In addition to registering the print color of the frame line, etc., the information of the type of the character (kanji, alphanumeric character, kana character, word collation, etc.) to be entered in the entry frame 11 or the like is previously registered by an instruction from a keyboard or the like. It was registered as format information.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来の
OCR用帳票のフォーマット情報の作成方法では、人手
作業によって帳票10の各記入枠11,12,…の四隅
の座標を測定して入力する必要があり、その測定と入力
作業に長時間を要するとともに、測定誤差や入力誤りが
発生する等の課題があった。本発明は、前記従来技術が
持っていた課題を解決し、未記入の帳票をイメージ読取
装置で読取り、その読取ったデータからフォーマット情
報を生成することができるOCR用帳票のフォーマット
情報生成方法を提供するものである。
However, in the conventional method of creating the format information of the OCR form, it is necessary to measure and input the coordinates of the four corners of each of the entry boxes 11, 12,... In addition, there is a problem that it takes a long time for the measurement and the input operation, and a measurement error and an input error occur. SUMMARY OF THE INVENTION The present invention solves the problems of the prior art, and provides an OCR form format information generation method capable of reading a blank form with an image reading device and generating format information from the read data. Is what you do.

【0005】[0005]

【課題を解決するための手段】前記課題を解決するた
め、本発明の内の第1の発明は、OCRで読取られる帳
票上に予め印刷された文字記入用の記入枠の位置を登録
するフォーマット情報の生成方法において、次のような
処理を順次行っている。まず、認識対象となる文字が記
入されていない前記帳票のイメージデータを読取るイメ
ージ読取り処理と、前記イメージ読取り処理で読取られ
た前記帳票のイメージデータを表示するイメージ表示処
理と、前記イメージ表示処理で表示された前記帳票のイ
メージデータに基づいて、前記認識対象となる文字が記
入されるべき指定範囲を指定する範囲指定処理と、前記
範囲指定処理で指定された指定範囲に基づいて、該指定
範囲に対応する記入枠の位置を検出するための枠線検出
範囲を算出する検出範囲算出処理とを行う。そして、前
記検出範囲算出処理で算出された前記枠線検出範囲に存
在する前記記入枠の枠線を検出する枠線検出処理と、前
記枠線検出処理で検出された枠線の位置の情報を含む前
記帳票のフォーマット情報を表示するフォーマット情報
表示処理と、前記フォーマット情報表示処理で表示され
たフォーマット情報を登録するフォーマット情報登録処
理とを行う。
According to a first aspect of the present invention, there is provided a format for registering the position of an entry frame for pre-printed characters on a form read by an OCR. In the information generation method, the following processing is sequentially performed. First, an image reading process for reading image data of the form in which characters to be recognized are not entered, an image display process for displaying the image data of the form read in the image reading process, and an image display process. A range designation process for designating a designated range in which the characters to be recognized are to be entered based on the displayed image data of the form; and a designated range designated based on the designated range designated in the range designated process. And a detection range calculation process of calculating a frame line detection range for detecting the position of the entry frame corresponding to. Then, a frame line detection process for detecting a frame line of the entry frame present in the frame line detection range calculated in the detection range calculation process, and information on a position of the frame line detected in the frame line detection process are A format information display process for displaying format information of the form including the format information; and a format information registration process for registering the format information displayed in the format information display process.

【0006】第2の発明は、OCRで読取られる帳票上
に予め印刷された文字記入用の記入枠の位置及び該記入
枠の枠線の種別を登録するフォーマット情報の生成方法
において、次のような処理を順次行っている。まず、第
1の発明と同様のイメージ読取り処理と、イメージ表示
処理と、範囲指定処理と、検出範囲算出処理と、枠線検
出処理とを行う。そして、前記枠線検出処理で検出され
た枠線の線種が、実線であるか点線であるかを判定する
線種判定処置と、前記枠線検出処理で検出された枠線の
位置と、前記線種判定処理で判定された前記枠線の線種
を含む前記帳票のフォーマット情報を表示するフォーマ
ット情報表示処理と、前記フォーマット情報表示処理で
表示されたフォーマット情報を登録するフォーマット情
報登録処理とを行う。第3の発明は、第2の発明中の線
種判定処理において、前記範囲指定処理で指定された指
定範囲を示す境界線、及び該境界線に対応して前記枠線
検出処理で検出された枠線の向かい合う距離と、それら
の向かい合う境界線と枠線で形成される台形部分の面積
に基づいて、該枠線が実線であるか否かを判定するよう
にしている。
A second invention relates to a method of generating format information for registering the position of an entry frame for character entry preprinted on a form read by an OCR and the type of the frame line of the entry frame, as follows. Process is sequentially performed. First, the same image reading processing, image display processing, range designation processing, detection range calculation processing, and frame line detection processing as those of the first invention are performed. Then, the line type of the frame line detected in the frame line detection process is a line type determination process of determining whether the line type is a solid line or a dotted line, and the position of the frame line detected in the frame line detection process, Format information display processing for displaying format information of the form including the line type of the frame line determined in the line type determination processing, and format information registration processing for registering the format information displayed in the format information display processing I do. According to a third aspect, in the line type determination process according to the second aspect, a boundary line indicating the designated range designated in the range designation process, and the boundary line detected corresponding to the boundary line in the frame line detection process. It is determined whether or not the frame line is a solid line based on the distance between the frame lines and the area of the trapezoid formed by the facing boundary line and the frame line.

【0007】第4の発明は、第2の発明中の線種判定処
理において、点線を構成する複数の点の図形を抽出し、
抽出した複数の点の図形の中心の座標に基づいてこれら
の点の図形で構成される近似直線を求め、該各点の図形
の中心が該近似直線から一定の距離内に入っている場合
に、該枠線が点線であると判定するようにしている。第
1の発明によれば、以上のようにOCR用帳票のフォー
マット情報生成方法を構成したので、次のような作用が
行われる。イメージ読取り処理及びイメージ表示処理に
よって、認識対象となる文字が記入されていない帳票の
イメージデータが読取られて表示される。範囲指定処理
によって、該表示されたイメージデータに対して、文字
が記入されるべき指定範囲が指定されると、検出範囲算
出処理によってその指定された指定範囲に基づいて記入
枠の位置を検出するための枠線検出範囲が算出される。
枠線検出処理によって、該算出された枠線検出範囲内に
存在する記入枠の枠線が検出され、その検出された枠線
の位置がフォーマット情報として表示されるとともに、
フォーマット情報登録処理によってOCR用帳票のフォ
ーマット情報として登録される。
According to a fourth aspect of the present invention, in the line type determining process according to the second aspect of the present invention, a figure of a plurality of points constituting a dotted line is extracted,
Based on the coordinates of the centers of the extracted figures of a plurality of points, an approximate straight line composed of the figures of these points is obtained, and when the center of the figure of each point is within a certain distance from the approximate straight lines, , The frame line is determined to be a dotted line. According to the first aspect, since the format information generating method of the OCR form is configured as described above, the following operation is performed. By the image reading process and the image display process, image data of a form in which characters to be recognized are not entered is read and displayed. When a designated range in which characters are to be entered is specified in the displayed image data by the range designation process, the position of the entry frame is detected based on the designated range by the detection range calculation process. Line detection range is calculated.
By the frame line detection processing, the frame line of the entry frame present in the calculated frame line detection range is detected, and the position of the detected frame line is displayed as format information,
The format information is registered as format information of the OCR form by the format information registration process.

【0008】第2の発明によれば、次のような作用が行
われる。イメージ読取り処理及びイメージ表示処理によ
って、認識対象となる文字が記入されていない帳票のイ
メージデータが読取られて表示される。範囲指定処理に
よって、該表示されたイメージデータに対して、文字が
記入されるべき指定範囲が指定されると、検出範囲算出
処理によってその指定された指定範囲に基づいて記入枠
の位置を検出するための枠線検出範囲が算出される。枠
線検出処理によって、該算出された枠線検出範囲内に存
在する記入枠の枠線が検出され、更に、線種判定処理に
よって、該検出された枠線が実線か点線かが判定され
る。検出された枠線の位置と枠線の線種の情報がフォー
マット情報として表示されるとともに、フォーマット情
報登録処理によってOCR用帳票のフォーマット情報と
して登録される。
According to the second aspect, the following operation is performed. By the image reading process and the image display process, image data of a form in which characters to be recognized are not entered is read and displayed. When a designated range in which characters are to be entered is specified in the displayed image data by the range designation process, the position of the entry frame is detected based on the designated range by the detection range calculation process. Line detection range is calculated. The frame line detection processing detects the frame line of the entry frame existing within the calculated frame line detection range, and further, the line type determination processing determines whether the detected frame line is a solid line or a dotted line. . Information on the detected position of the frame line and the line type of the frame line is displayed as format information, and is registered as format information of the OCR form by the format information registration process.

【0009】第3の発明によれば、第2の発明中の線種
判定処理において、次のような作用が行われる。範囲指
定処理で指定された指定範囲を示す境界線、及び該境界
線に対応して前記枠線検出処理で検出された枠線の向か
い合う距離が計算される。また、それらの向かい合う境
界線と枠線で形成される台形部分の面積が計算され、こ
れらの計算結果に基づいて、該枠線が実線であるか否か
が判定される。その他の作用は、第2の発明と同様であ
る。第4の発明によれば、第2の発明中の線種判定処理
において、次のような作用が行われる。点線を構成する
複数の点の図形が抽出され、抽出された複数の点の図形
の中心の座標に基づいてこれらの点の図形で構成される
近似直線が求められる。そして、各点の図形の中心が該
近似直線から一定の距離内に入っているか否かが判定さ
れ、一定の距離内に入っている場合に、該枠線が点線で
あると判定される。その他の作用は、第2の発明と同様
である。
According to the third invention, the following operation is performed in the line type determination processing in the second invention. A boundary line indicating the specified range specified in the range specification process, and the distance between the border lines detected in the frame line detection process corresponding to the boundary line are calculated. Further, the area of the trapezoidal portion formed by the facing boundary line and the frame line is calculated, and it is determined whether or not the frame line is a solid line based on the calculation results. Other operations are the same as those of the second invention. According to the fourth aspect, the following operation is performed in the line type determination processing in the second aspect. A figure of a plurality of points constituting the dotted line is extracted, and an approximate straight line composed of the figures of these points is obtained based on the coordinates of the center of the extracted plurality of points. Then, it is determined whether or not the center of the figure at each point is within a certain distance from the approximate straight line. If the center is within a certain distance, it is determined that the frame line is a dotted line. Other operations are the same as those of the second invention.

【0010】[0010]

【発明の実施の形態】図1は、本発明の実施形態のOC
R用帳票のフォーマット情報生成方法で用いられるフォ
ーマット情報生成装置の構成図である。このフォーマッ
ト情報生成装置は、フォーマット情報登録の対象となる
OCR用帳票10のイメージを入力するために、例え
ば、イメージスキャナ等によるイメージ入力部21を有
している。イメージ入力部21は、イメージ読取部22
に接続されている。イメージ読取部22は、イメージ入
力部21から入力された帳票10のイメージをイメージ
データとしてイメージデータ記憶部23に書込む機能を
有している。イメージ読取部22及びイメージデータ記
憶部23には、イメージ表示部24が接続されている。
イメージ表示部24は、イメージデータ記憶部23に記
憶された帳票10のイメージデータを読出して、その帳
票10のイメージを表示部25に表示するものである。
FIG. 1 is a block diagram of an OC according to an embodiment of the present invention.
FIG. 2 is a configuration diagram of a format information generating device used in a method for generating format information of an R form. The format information generating apparatus has an image input unit 21 such as an image scanner for inputting an image of the OCR form 10 to be registered with the format information. The image input unit 21 includes an image reading unit 22
It is connected to the. The image reading unit 22 has a function of writing the image of the form 10 input from the image input unit 21 into the image data storage unit 23 as image data. An image display unit 24 is connected to the image reading unit 22 and the image data storage unit 23.
The image display unit 24 reads out the image data of the form 10 stored in the image data storage unit 23 and displays the image of the form 10 on the display unit 25.

【0011】イメージ表示部24には記入範囲指定部2
6が接続され、更に記入範囲指定部26には範囲入力部
27が接続されている。範囲入力部27は、表示部25
に表示された帳票10のイメージ上の記入枠11等の位
置をこの表示部25に連動して指定するため入力装置で
あり、例えば、マウス等の座標入力装置によって構成さ
れている。記入範囲指定部26には、更に、検出範囲算
出部28が接続されている。検出範囲算出部28は、記
入範囲指定部26で指定された記入枠11等の範囲に基
づいて、帳票10の読取時の傾斜等の誤差範囲を考慮し
て、一定の余裕を含む記入枠検出範囲を算出するもので
ある。検出範囲算出部28には、枠線検出部29が接続
されている。枠線検出部29は、検出範囲算出部28で
算出された記入枠検出範囲に存在する記入枠11等の枠
線、即ち、上枠a、下枠b、左枠c、及び右枠dの囲み
線をすべて検出する機能を有している。枠線検出部29
には、線種判定部30が接続されている。線種判定部3
0は、枠線検出部29で検出された枠線の線種が、実線
であるか点線であるかを判定するものであり、この線種
判定部30に、フォーマット表示部31が接続されてい
る。フォーマット表示部31は、枠線検出部29で検出
された枠線の位置、及び線種判定部30で判定されたそ
の枠線の線種等のフォーマット情報を生成して、表示部
25に表示する機能を有している。更に、フォーマット
表示部31には、登録部32が接続されている。登録部
32は、フォーマット表示部31で生成されたフォーマ
ット情報をフォーマット情報記憶部33に登録するもの
である。
The image display unit 24 has an entry range designating unit 2
6 is connected, and a range input unit 27 is connected to the entry range designation unit 26. The range input unit 27 is a display unit 25
Is an input device for designating the position of the entry frame 11 and the like on the image of the form 10 displayed in association with the display unit 25, and is constituted by a coordinate input device such as a mouse, for example. The entry range designation unit 26 is further connected to a detection range calculation unit 28. The detection range calculation unit 28 detects an entry frame including a certain margin based on the range of the entry frame 11 and the like designated by the entry range designation unit 26 and considering an error range such as a tilt at the time of reading the form 10. The range is calculated. The detection range calculation unit 28 is connected to a frame line detection unit 29. The frame line detection unit 29 is configured to detect the frame lines of the entry frame 11 and the like existing in the entry frame detection range calculated by the detection range calculation unit 28, ie, the upper frame a, the lower frame b, the left frame c, and the right frame d. It has a function to detect all surrounding lines. Frame line detector 29
Is connected to a line type determination unit 30. Line type determination unit 3
0 determines whether the line type of the frame line detected by the frame line detecting unit 29 is a solid line or a dotted line. The format display unit 31 is connected to the line type determining unit 30. I have. The format display unit 31 generates format information such as the position of the frame line detected by the frame line detection unit 29 and the line type of the frame line determined by the line type determination unit 30, and displays the format information on the display unit 25. It has the function to do. Further, a registration unit 32 is connected to the format display unit 31. The registration unit 32 registers the format information generated by the format display unit 31 in the format information storage unit 33.

【0012】次に、図1の各部の動作(1)〜(5)
を、図3〜図13を参照しつつ説明する。 (1) イメージ入力部21〜範囲入力部27の動作 図3は、表示部25に表示された帳票10のイメージデ
ータの表示例を示す図である。まず、フォーマット情報
を登録しようとする帳票10で、まだ文字が記入されて
いないものを用意し、イメージ入力部21から入力す
る。これにより、イメージ入力部21から入力された帳
票10のイメージ情報がイメージ読取部22に与えられ
る。イメージ読取部22に与えられた帳票10のイメー
ジ情報は、逐次、所定の形式のイメージデータに変換さ
れてイメージデータ記憶部23に格納される。帳票10
のイメージ入力が終了し、この帳票10のイメージデー
タがすべてイメージデータ記憶部23に格納されると、
イメージ読取部22からイメージ表示部24が起動され
る。イメージ表示部24によって、イメージデータ記憶
部23中の帳票10のイメージデータが読出され、図3
に示すように表示部25に表示される。表示部25にイ
メージデータが表示された後、記入範囲指定部26が起
動される。これにより、オペレータは、マウス等の範囲
入力部27を用いて、表示部25に表示された画面上
で、記入枠11等の存在範囲の指定を行う。例えば、オ
ペレータは、図3において帳票10の記入枠13の存在
範囲を指定するために、矩形状の指定範囲13Xの左上
の点13aと右下の点13bを指定する。これにより、
記入範囲指定部26によって画面上の指定範囲13X
に、例えばハッチが付けられ、記入枠13が指定範囲1
3Xによって指定されたことが表示される。
Next, the operations (1) to (5) of each unit in FIG.
Will be described with reference to FIGS. (1) Operation of Image Input Unit 21 to Range Input Unit 27 FIG. 3 is a diagram illustrating a display example of image data of the form 10 displayed on the display unit 25. First, a form 10 for which format information is to be registered, in which characters have not been entered yet, is prepared and input from the image input unit 21. Thus, the image information of the form 10 input from the image input unit 21 is given to the image reading unit 22. The image information of the form 10 given to the image reading unit 22 is sequentially converted into image data of a predetermined format and stored in the image data storage unit 23. Form 10
Is completed, and all the image data of the form 10 is stored in the image data storage unit 23.
The image display unit 24 is activated from the image reading unit 22. The image data of the form 10 in the image data storage unit 23 is read out by the image display unit 24, and FIG.
Are displayed on the display unit 25 as shown in FIG. After the image data is displayed on the display unit 25, the entry range designating unit 26 is activated. Thus, the operator uses the range input unit 27 such as a mouse to specify the existing range of the entry frame 11 and the like on the screen displayed on the display unit 25. For example, the operator specifies the upper left point 13a and the lower right point 13b of the rectangular specified range 13X in order to specify the existing range of the entry frame 13 of the form 10 in FIG. This allows
The specified range 13X on the screen by the writing range specifying unit 26
, For example, is hatched, and the entry frame 13
3X indicates that the designation has been made.

【0013】(2) 検出範囲算出部28の動作 指定範囲13Xが指定された後、具体的方法は図示して
いないが、オペレータによってキーボートまたはマウス
から「確認」の入力が行われると、検出範囲算出部28
が起動される。検出範囲算出部28によって、指定範囲
13Xの範囲が上側、下側、左側、及び右側にそれぞれ
一定寸法(例えば、10mm)だけ拡張されて、枠線検
出範囲13Yの位置が算出される。これは、図3に示す
ように、帳票10を読取った時に傾斜等によって読取位
置がずれることを考慮して、指定範囲13Xよりも若干
広い範囲の中から枠線を検出するために、枠線検出範囲
13Yを設定する処理である。
(2) Operation of the detection range calculation unit 28 After the specified range 13X is specified, a specific method is not shown, but when an operator inputs "confirmation" from a keyboard or a mouse, the detection range is calculated. Calculation unit 28
Is started. The detection range calculation unit 28 extends the range of the designated range 13X upward, downward, leftward, and rightward by a certain dimension (for example, 10 mm), and calculates the position of the frame line detection range 13Y. In order to detect a frame line from a range slightly larger than the specified range 13X, as shown in FIG. This is a process for setting the detection range 13Y.

【0014】(3) 枠線検出部29の動作 図4は、ヒストグラム法による枠線検出方法の説明図で
ある。枠線検出部29では、例えば、図4に示すような
方法で枠線検出が行われる。検出範囲算出部28で算出
された枠線検出範囲13Yのイメージを構成する画素の
黒点数が、検出しようとする枠線と同一方向(例えば、
図4におけるx方向及びy方向)に集計されて、ヒスト
グラムHG1,HG2がそれぞれ作成される。例えば、
ヒストグラムHG1におけるHxは度数、即ちx方向に
集計された黒点数を示す座標軸であり、yは上下位置を
示す座標軸である。x方向のヒストグラムHG1には、
記入枠13の上枠aに対応する棒状の黒点数分布Hxa
と、下枠bに対応する棒状の黒点数分布Hxbが出来
る。また、y方向のヒストグラムHG2には、記入枠1
3の左枠cに対応する棒状の黒点数分布Hycと、右枠
dに対応する棒状の黒点数分布Hydの他、複数の区切
り線eに対応する複数の棒状の黒点数分布Hyeが出来
る。これらの黒点数分布Hxa等は、枠線の無い部分の
黒点数に比べて大きな値となっているので、適切な閾値
でヒストグラムHG1,HG2を2値化することによ
り、記入枠13を構成する上枠a、下枠b、右枠c、左
枠d、及び区切り線eの枠線の位置を検出することがで
きる。このようにして検出された複数の枠線に基づい
て、記入枠の形態が表形式であるか、記入枠内に既に文
字が印刷されている特殊枠であるかの判定処理が行われ
る。次に、(3−1)表形式の判定方法と、(3−2)
特殊枠の判定方法に分けて説明する。
(3) Operation of the Frame Line Detector 29 FIG. 4 is an explanatory diagram of a frame line detection method by the histogram method. In the frame line detection section 29, for example, frame line detection is performed by a method as shown in FIG. The number of black points of the pixels constituting the image of the frame line detection range 13Y calculated by the detection range calculation unit 28 is in the same direction as the frame line to be detected (for example,
The histograms HG1 and HG2 are respectively created by summing up in the x direction and the y direction in FIG. For example,
Hx in the histogram HG1 is a coordinate axis indicating the frequency, that is, the number of black spots totaled in the x direction, and y is a coordinate axis indicating the vertical position. In the histogram HG1 in the x direction,
Bar-shaped black point number distribution Hxa corresponding to the upper frame a of the entry frame 13
Then, a bar-shaped black spot number distribution Hxb corresponding to the lower frame b is formed. The histogram HG2 in the y direction has an entry box 1
In addition to the bar-shaped black point number distribution Hyc corresponding to the left frame c and the bar-shaped black point number distribution Hyd corresponding to the right frame d, a plurality of bar-shaped black point number distributions Hye corresponding to a plurality of dividing lines e can be obtained. Since these black point number distributions Hxa and the like have a larger value than the number of black points in a portion without a frame line, the entry frame 13 is formed by binarizing the histograms HG1 and HG2 with an appropriate threshold value. The positions of the frame lines of the upper frame a, the lower frame b, the right frame c, the left frame d, and the dividing line e can be detected. Based on the plurality of frame lines detected in this way, a determination process is performed to determine whether the form of the entry frame is a table format or a special frame in which characters are already printed in the entry frame. Next, (3-1) a determination method in a table format, and (3-2)
The method for determining the special frame will be described separately.

【0015】(3−1) 表形式の判定方法 図5は、記入枠の形態が表形式であるか否かの判定方法
を説明するための図であり、記入範囲指定部26の処理
において指定した帳票10の記入枠13に対する指定範
囲13Xと、枠線検出部29で検出された縦方向の枠線
FLi(但し、i=1〜m)の位置関係が示されてい
る。図5のxy平面において、指定範囲13Xの上端U
Sのy座標をya、下端DSのy座標をybとする。ま
た、指定範囲13Xの左端LSのx座標をxa、右端R
Sのx座標をxbとする。更に、枠線FLiの一端FL
iaの座標を(xia,yia)、他端FLibの座標
を(xib,yib)とする。まず、枠線FLiが次の
条件を満たしているか否かが判定される。 条件1: xa<xia<xb 条件2: xa<xib<xb 条件3: yia<(ya+K1) 条件4: yib>(yb−K1) 但し、K1:枠線検出処理の誤差の許容値(例えば、K
1=1mm) 複数の縦方向の枠線FLiに対して、それぞれ前記条件
1〜4が満たされているか否かが判定され、すべての条
件1〜4が満たされていない枠線は、記入枠13を構成
する枠線ではないと見なされて廃棄される。
(3-1) Determination Method in Tabular Format FIG. 5 is a diagram for explaining a method for determining whether or not the form of the entry frame is in a tabular form. The positional relationship between the designated range 13X for the entry frame 13 of the form 10 and the vertical frame line FLi (i = 1 to m) detected by the frame line detection unit 29 is shown. In the xy plane of FIG. 5, the upper end U of the designated range 13X
Let the y coordinate of S be ya and the y coordinate of the lower end DS be yb. The x coordinate of the left end LS of the specified range 13X is xa, and the right end R is
Let the x coordinate of S be xb. Further, one end FL of the frame line FLi
Let the coordinates of ia be (xia, yia) and the coordinates of the other end FLib be (xib, yib). First, it is determined whether or not the frame FLi satisfies the following condition. Condition 1: xa <xia <xb Condition 2: xa <xib <xb Condition 3: yia <(ya + K1) Condition 4: yib> (yb-K1) where K1: an allowable value of an error in the frame line detection processing (for example, K
1 = 1 mm) For each of the plurality of vertical frame lines FLi, it is determined whether or not the above-described conditions 1 to 4 are satisfied. 13 and is discarded because it is not a frame line.

【0016】次に、前記条件1〜4をすべて満たしてい
る枠線FLiについて、各枠線FLiのx座標の平均値
xaviが次式により計算される。 xavi=(xia+xib)/2 ・・・(1) そして、計算された各枠線FLiの平均値xaviは、
昇順に並べられて、数列xav1,xav2,xav
3,…が作成される。次に、この数列xav1,xav
2,xav3,…の隣合う要素同志の差分数列xd1,
xd2,xd3,…が作成される。この差分数列数列x
d1,xd2,xd3,…の各要素の値の偏差(各要素
の値とその平均値との差)がすべて、表形式の判定基準
値K2(例えば、K2=1mm)以下であれば、複数の
縦方向の枠線FLiが等間隔に並んでいると見なされ
て、この記入枠13の形態は表形式であると判定され
る。
Next, for the frame lines FLi satisfying all of the above conditions 1 to 4, the average value xavi of the x coordinate of each frame line FLi is calculated by the following equation. xavi = (xia + xib) / 2 (1) Then, the calculated average value xavi of each frame line FLi is:
Arranged in ascending order, the sequence xav1, xav2, xav
3,... Are created. Next, the sequence xav1, xav
2, xav3,..., The difference sequence xd1,
xd2, xd3,... are created. This difference sequence number sequence x
If all deviations of the values of the elements d1, xd2, xd3,... (differences between the values of the elements and their average values) are equal to or smaller than the table-based determination reference value K2 (for example, K2 = 1 mm), Are considered to be arranged at equal intervals, and the form of the entry frame 13 is determined to be a table format.

【0017】(3−2) 特殊枠の判定方法 例えば、帳票10の記入枠14のように、枠内に文字
「金額」が予め印刷されている場合、この記入枠14の
中の印刷文字の部分を読取範囲から除外しておかなけれ
ならない。このために、文字枠14が内部に文字が印刷
された特殊枠であるか否かが判定され、特殊枠であれ
ば、その読取範囲を特定するための処理が行われる。図
6は、この特殊枠の判定処理の手順を示すフローチャー
トであり、図7(a)〜(c)及び図8は、特殊枠判定
処理の各段階における説明図(その1),(その2)で
ある。まず、図6のステップS11において、囲み線の
除去処理が行われる。即ち、表示部25に表示された帳
票10の表示画面上で、オペレータから指定された指定
範囲14Xに基づいて検出範囲14Yが算出され、この
検出範囲14Yの範囲内の記入枠14等の枠線が消去さ
れる。枠線の検出は、例えば、図4に示したようなヒス
トグラム法によって行われる。ステップS11の結果、
図7(a)に示される指定範囲14Xが得られる。この
指定範囲14Xには、印刷文字14aの他、汚れ14
b,14c等の不純物が含まれることがある。ステップ
S11の後、ステップS12へ進む。
(3-2) Method of Determining Special Frame For example, when the character "money" is printed in advance in the frame, such as the entry frame 14 of the form 10, the print characters in the entry frame 14 The part must be excluded from the reading range. For this reason, it is determined whether or not the character frame 14 is a special frame in which characters are printed. If the character frame 14 is a special frame, a process for specifying the reading range is performed. FIG. 6 is a flowchart showing the procedure of the special frame determination process. FIGS. 7A to 7C and FIG. 8 are explanatory diagrams (part 1) and (part 2) in each stage of the special frame determination process. ). First, in step S11 of FIG. 6, a surrounding line removal process is performed. That is, on the display screen of the form 10 displayed on the display unit 25, the detection range 14Y is calculated based on the specified range 14X specified by the operator, and the frame line such as the entry frame 14 within the range of the detection range 14Y is calculated. Is erased. The detection of the frame line is performed, for example, by a histogram method as shown in FIG. As a result of step S11,
The designated range 14X shown in FIG. 7A is obtained. In the designated range 14X, in addition to the print character 14a,
b, 14c and the like may be included. After step S11, the process proceeds to step S12.

【0018】ステップS12において、指定範囲14X
のイメージを構成する画素の黒点数が縦方向(即ち、y
方向)に集計されて、ヒストグラムHG3が作成され
る。図7(b)は、ステップS12で作成されたヒスト
グラムHG3である。ヒストグラムHG3におけるHy
は黒点数を示す座標軸であり、xは横方向の位置を示す
座標軸である。図7(b)に示すように、ヒストグラム
HG3上には、印刷文字14aの「金」「額」、及び汚
れ14b,14cのx座標に対応した黒点数が示されて
いる。ステップS12の後、ステップS13へ進む。ス
テップS13において、2値化処理が行われる。この2
値化処理では、ヒストグラムHG3上の黒点数が、次の
(2)式によって定められる閾値TH1によって、論理
値“0”,“1”のいずれかに分類される。 TH1=K3/(イメージ1画素の寸法) ・・・(2) ここで、(イメージ1画素の寸法)は、イメージ入力部
21の分解能から算出される値であり、例えば、分解能
が8ドット/mmであれば、(イメージ1画素の寸法)
=1mm/8=0.125mmとなる。また、K3は、
指定範囲14X内に存在する汚れ14b等の不純物の大
きさ(高さ)の許容値であり、例えば、K3=1mmに
設定される。この2値化処理によって、大きさがK3
(=1mm)以下の不純物が除去され、図7(c)に示
す2値化された画素レベルによって、分割された複数の
横方向ブロックbl1,bl2,bl3が得られる。ス
テップS13の後、ステップS14へ進む。
In step S12, the designated range 14X
The number of black points of pixels constituting the image of the vertical direction (that is, y
Direction), and a histogram HG3 is created. FIG. 7B shows the histogram HG3 created in step S12. Hy in histogram HG3
Is a coordinate axis indicating the number of black points, and x is a coordinate axis indicating a position in the horizontal direction. As shown in FIG. 7B, on the histogram HG3, "gold" and "amount" of the print character 14a and the number of black points corresponding to the x-coordinates of the stains 14b and 14c are shown. After step S12, the process proceeds to step S13. In step S13, a binarization process is performed. This 2
In the binarization process, the number of black points on the histogram HG3 is classified into one of logical values “0” and “1” according to a threshold value TH1 determined by the following equation (2). TH1 = K3 / (dimension of one pixel of an image) (2) Here, (dimension of one pixel of an image) is a value calculated from the resolution of the image input unit 21. For example, the resolution is 8 dots / mm, (dimension of one pixel of the image)
= 1 mm / 8 = 0.125 mm. K3 is
This is an allowable value of the size (height) of impurities such as the dirt 14b existing in the designated range 14X, and is set, for example, to K3 = 1 mm. By this binarization processing, the size is K3
(= 1 mm) or less are removed, and a plurality of divided horizontal blocks bl1, bl2, and bl3 are obtained by the binarized pixel levels shown in FIG. 7C. After step S13, the process proceeds to step S14.

【0019】ステップS14において、不純物除去処理
が行われる。この不純物除去処理は、ステップS13で
除去されなかった大きさK3以上の汚れ14c等の不純
物を除去する処理である。このステップS14では、ス
テップS13で得られた複数の横方向ブロックbl1,
bl2,bl3の中から、横幅がK3以下の横方向ブロ
ックと、2値化する以前の黒画素数の合計が次の(3)
式で定められる一定数K4以下の横方向ブロックが不純
物と見なされて除去される。 K4=K5/(イメージ1画素の寸法) ・・・(3) 但し、K5:不純物の面積の許容値(例えば、K5=2
mm) このステップS14の不純物除去処理によって、汚れ1
4cによる横方向ブロックbl3が除去され、ステップ
S15へ進む。ステップS15において、横方向のブロ
ック統合処理が行われる。このブロック統合処理は、隣
合うブロックとの間隔が一定値K6以下である場合、そ
の両隣のブロックを連結して1つの大きなブロックに統
合する処理である。ここで、一定値K6は、記入枠の横
幅として必要な最小限度の寸法であり、例えば、K6=
10mmに設定される。
In step S14, an impurity removing process is performed. This impurity removing process is a process of removing impurities such as the stain 14c having a size of K3 or more that has not been removed in step S13. In this step S14, the plurality of horizontal blocks bl1, obtained in step S13
Out of bl2 and bl3, the sum of the horizontal block whose horizontal width is K3 or less and the number of black pixels before binarization is given by the following (3).
Lateral blocks equal to or less than a predetermined number K4 determined by the equation are regarded as impurities and removed. K4 = K5 / (dimension of one pixel of an image) 2 ... (3) where K5 is an allowable value of an impurity area (for example, K5 = 2)
mm 2 ) Dirt 1 is obtained by the impurity removing process in step S14.
The horizontal block bl3 by 4c is removed, and the process proceeds to step S15. In step S15, horizontal block integration processing is performed. In the block integration process, when the interval between adjacent blocks is equal to or smaller than a fixed value K6, the adjacent blocks are connected and integrated into one large block. Here, the constant value K6 is the minimum dimension required as the width of the entry frame. For example, K6 =
It is set to 10 mm.

【0020】このようにして統合されて出来た単数また
は複数のブロックの内の最左端のブロックと、指定範囲
14Xの左端との間でもブロック統合処理が行われる。
即ち、最左端のブロックと指定範囲14Xの左端の間隔
が一定値K6以下であれば、この間隔は最左端のブロッ
クの範囲に統合される。また、最右端のブロックと指定
範囲14Xの右端の間隔が一定値K6以下であれば、こ
の間隔は最右端のブロックの範囲に統合される。図7
(d)は、ステップS15のブロック統合処理によって
生成された横ブロックBL1,BL2を示している。ス
テップS15の後、ステップS16へ進む。ステップS
16では、ステップS15で生成された横ブロックBL
1,BL2に対して、その横ブロックBL1,BL2の
イメージを構成する画素の黒点数が、横方向(即ち、x
方向)に集計されてヒストグラムHG4が作成される。
図8は、ステップS16で作成されたヒストグラムHG
4である。ヒストグラムHG4におけるHxは黒点数を
示す座標軸であり、yは縦方向の位置を示す座標軸であ
る。図8に示すように、ヒストグラムHG4上には、印
刷文字14aの「金額」のy座標に対応する黒点数が示
されている。ステップS16の後、ステップS17へ進
む。
The block integration process is also performed between the leftmost block of the single or multiple blocks integrated as described above and the left end of the designated range 14X.
That is, if the interval between the leftmost block and the left end of the designated range 14X is equal to or smaller than the fixed value K6, this interval is integrated into the range of the leftmost block. If the interval between the rightmost block and the right end of the designated range 14X is equal to or smaller than the fixed value K6, this interval is integrated into the range of the rightmost block. FIG.
(D) shows the horizontal blocks BL1 and BL2 generated by the block integration processing in step S15. After step S15, the process proceeds to step S16. Step S
At 16, the horizontal block BL generated at step S15
1 and BL2, the number of black points of the pixels forming the image of the horizontal blocks BL1 and BL2 is in the horizontal direction (ie, x
Direction), and a histogram HG4 is created.
FIG. 8 shows the histogram HG created in step S16.
4. Hx in the histogram HG4 is a coordinate axis indicating the number of black points, and y is a coordinate axis indicating a position in the vertical direction. As shown in FIG. 8, on the histogram HG4, the number of black points corresponding to the y coordinate of the “money” of the print character 14a is shown. After step S16, the process proceeds to step S17.

【0021】ステップS17において、2値化処理が行
われる。この2値化処理では、ヒストグラムHG4上の
黒点数が、次の(4)式によって定められる閾値TH2
によって、論理値“0”,“1”のいずれかに分類され
る。 TH2=K7/(イメージ1画素の寸法) ・・・(4) ここで、(イメージ1画素の寸法)は、前記ステップS
13における(イメージ1画素の寸法)と同じである。
また、K7は、横方向ブロック内に存在する汚れ等の不
純物の大きさ(横幅)の許容値であり、例えば、K7=
1mmに設定される。この2値化処理によって、大きさ
がK7(=1mm)以下の不純物が除去され、図8に示
す2値化された画素レベルによって、分割された単数ま
たは複数の縦ブロックが得られる。ステップS17の
後、ステップS18へ進む。ステップS18において、
ステップS17で分割された単数または複数の縦ブロッ
クの内の各白領域のy方向の距離(即ち、高さ)が算出
され、ステップS19へ進む。ステップS19におい
て、ステップS18で算出された1つの白領域について
の判定処理が行われる。即ち、白領域の高さHW(例え
ば、l1)が一定値K8よりも大きいか否かが判定され
る。ここで、一定値K8は、文字を記入する記入枠とし
ての最小限度の高さであり、例えば、K8=3mmが設
定される。ステップS19の判定処理により、HW(=
l1)≧K8と判定されれば、ステップS20へ進み、
HW(=l1)<K8と判定されれば、ステップS21
へ進む。
In step S17, a binarization process is performed. In this binarization process, the number of black points on the histogram HG4 is determined by a threshold value TH2 determined by the following equation (4).
Depending on the logical value “0” or “1”. TH2 = K7 / (dimension of one pixel of image) (4) Here, (dimension of one pixel of image)
13 (the size of one pixel of the image).
K7 is an allowable value of the size (lateral width) of impurities such as dirt present in the horizontal block. For example, K7 =
It is set to 1 mm. By this binarization processing, impurities having a size of K7 (= 1 mm) or less are removed, and one or a plurality of vertical blocks divided by the binarized pixel level shown in FIG. 8 are obtained. After step S17, the process proceeds to step S18. In step S18,
The distance (that is, height) in the y direction of each white region in the single or plural vertical blocks divided in step S17 is calculated, and the process proceeds to step S19. In step S19, a determination process is performed on one white region calculated in step S18. That is, it is determined whether or not the height HW (for example, l1) of the white area is larger than the fixed value K8. Here, the constant value K8 is the minimum height as an entry frame for entering characters, and for example, K8 = 3 mm is set. By the determination processing in step S19, HW (=
l1) If it is determined that ≧ K8, the process proceeds to step S20,
If it is determined that HW (= 11) <K8, step S21
Proceed to.

【0022】ステップS20では、ステップS19で判
定された白領域が記入枠と判定されて、分割記入枠とし
て登録される。一方、ステップS21では、ステップS
19で判定された白領域は非記入枠と判定されて除去さ
れる。ステップS20,S21の後、ステップS22へ
進む。ステップS22では、横ブロックBL1,BL2
に対するすべての白領域の処理が終了したか否かが判定
され、もし未処理のものが残っていれば、ステップS1
9へ戻る。すべての白領域に対する処理が終了していれ
ば、ステップS23へ進む。ステップS23では、すべ
ての横ブロックBL1,BL2に対するステップS16
〜S22の処理が終了したか否かが判定され、もし未処
理のものが残っていれば、ステップS16へ戻る。すべ
ての横ブロックBL1,BL2に対する処理が終了して
いれば、特殊枠の判定処理は終了する。この特殊枠の判
定処理により、印刷文字を含む記入枠は、複数の矩形状
の分割記入枠に分割され、これらの分割されて出来た分
割記入枠がフォーマット情報として生成される。
In step S20, the white area determined in step S19 is determined as an entry frame and registered as a divided entry frame. On the other hand, in Step S21, Step S
The white area determined in 19 is determined as a non-entry frame and is removed. After steps S20 and S21, the process proceeds to step S22. In step S22, the horizontal blocks BL1, BL2
It is determined whether or not the processing of all the white areas for has been completed. If any unprocessed areas remain, the process proceeds to step S1.
Return to 9. If the processing for all the white areas has been completed, the process proceeds to step S23. In step S23, step S16 is performed for all the horizontal blocks BL1 and BL2.
It is determined whether or not the processing of steps S22 to S22 has been completed. If any unprocessed parts remain, the process returns to step S16. If the processing for all the horizontal blocks BL1 and BL2 has been completed, the special frame determination processing ends. By this special frame determination process, the entry frame including the print character is divided into a plurality of rectangular divided entry frames, and these divided entry frames are generated as format information.

【0023】(4) 線種判定部30の動作 線種判定部30では、前記枠線検出部29で検出された
各枠線について、その枠線が実線であるか、点線である
かの線種判定が行われる。次に、(4−1)直線の判定
方法と、(4−2)点線の判定方法に分けて説明する。 (4−1) 直線の判定方法 図9は、直線の判定方法を説明するための図であり、記
入範囲指定部26の処理において指定された帳票10の
記入枠13に対する指定範囲13Xと、枠線検出部29
で検出された枠線の位置関係を示している。図9におい
て、水平方向の上端USまたは下端DSの長さL1と、
この上端USまたは下端DSと枠線aとが水平方向軸
(x座標)上で重なり合う部分の長さL2とが求められ
る。また、上端USまたは下端DSと枠線aとが水平方
向軸上で重なり合う部分の面積Sが求められる。このよ
うにして求められた長さL1,L2、及び面積Sについ
て、次の条件5,6が成立するか否かが調べられる。 条件5: L2>(L1×K9) 条件6: S<(L2×K10) 但し、K9:重なり程度の判定基準値(例えば、K9=
0.8) K10:線間平均距離の判定基準値(例えば、K10=
2mm) ここで、条件5,6が同時に成立していれば、枠線aは
直線であると判定される。
(4) Operation of Line Type Determining Unit 30 The line type determining unit 30 determines whether each of the frame lines detected by the frame line detecting unit 29 is a solid line or a dotted line. A species determination is made. Next, (4-1) a straight line determination method and (4-2) a dotted line determination method will be described separately. (4-1) Straight Line Judgment Method FIG. 9 is a diagram for explaining a straight line judgment method. The designated range 13X for the entry frame 13 of the form 10 designated in the process of the entry range designation unit 26, and the frame Line detector 29
Shows the positional relationship of the frame lines detected by. In FIG. 9, the length L1 of the upper end US or the lower end DS in the horizontal direction,
The length L2 of the portion where the upper end US or lower end DS and the frame line a overlap on the horizontal axis (x coordinate) is obtained. Further, the area S of the portion where the upper end US or the lower end DS and the frame line a overlap on the horizontal axis is obtained. With respect to the lengths L1 and L2 and the area S thus obtained, it is checked whether the following conditions 5 and 6 are satisfied. Condition 5: L2> (L1 × K9) Condition 6: S <(L2 × K10) where K9: a judgment reference value for the degree of overlap (for example, K9 =
0.8) K10: Reference value for determining the average distance between lines (for example, K10 =
2 mm) Here, if the conditions 5 and 6 are simultaneously satisfied, it is determined that the frame line a is a straight line.

【0024】(4−2) 点線の判定方法 図10は、点線の判定方法を説明するための図であり、
記入範囲指定部26の処理において指定された帳票10
の記入枠15に対する指定範囲15Xと、指定範囲15
Xの下側の指定範囲枠15DSに沿って印刷された点線
15DLが示されている。また、図11は点線の判定方
法の処理手順を示すフローチャートであり、図12は点
線を構成する「点」の図形の一例を示す図である。図1
1のステップS31において、オペレータによって指定
された指定範囲枠15DSに基づいて点線検出領域15
Yが設定される。即ち、この点線検出領域15Yの左端
及び右端は、指定範囲15Xの左端及び右端に等しく設
定される。また、点線検出領域15Yの上端及び下端
は、指定範囲枠15DSを検出位置の誤差の許容値とし
てK11(例えば、K11=2mm)だけ、上側及び下
側に移動した位置にそれぞれ設定される。ステップS3
1の後、ステップS32へ進む。ステップS32におい
て、設定された点線検出領域15Yの中にあるすべての
図形の輪郭が抽出され、ステップS33へ進む。
(4-2) Dotted Line Judging Method FIG. 10 is a diagram for explaining a dotted line judging method.
Form 10 specified in the process of entry range specifying unit 26
Range 15X for the entry frame 15 of the
A dotted line 15DL printed along the designated range frame 15DS below X is shown. FIG. 11 is a flowchart illustrating a processing procedure of a method of determining a dotted line, and FIG. 12 is a diagram illustrating an example of a “dot” figure forming the dotted line. FIG.
In step S31, the dotted line detection area 15 is determined based on the specified range frame 15DS specified by the operator.
Y is set. That is, the left end and the right end of the dotted line detection area 15Y are set equal to the left end and the right end of the designated range 15X. The upper and lower ends of the dotted line detection area 15Y are set to positions shifted upward and downward by K11 (for example, K11 = 2 mm) using the designated range frame 15DS as an allowable value of the detection position error. Step S3
After 1, the process proceeds to step S32. In step S32, the outlines of all the figures in the set dotted line detection area 15Y are extracted, and the process proceeds to step S33.

【0025】ステップS33において、図12に示すよ
うに、抽出された各図形の上端、下端、左端、及び右端
の位置が求められ、抽出された各図形の中から、次の条
件7,8に基づいて、点線を構成する「点」の図形15
Dと推定されるものが取出される。即ち、抽出された図
形15Dの上端のy座標をyu、下端のy座標をyd、
右端のx座標をxr、及び左端のxl座標をxとして、
次の条件7,8が成立するか否かが調べられる。 条件7: (yd−yu)<K12 条件8: K13<(xr−xl)<K14 但し、K12:「点」の最大の太さ(例えば、K12=
0.75mm) K13:「点」の最小の長さ(例えば、K13=0.5
mm) K14:「点」の最大の長さ(例えば、K14=2m
m) そして、条件7,8が同時に成立していれば、その抽出
された図形15Dは、点線を構成する「点」であると見
なされる。すべての抽出された図形について「点」であ
るか否かが調べられた後、ステップS34へ進む。
In step S33, as shown in FIG. 12, the positions of the upper end, the lower end, the left end, and the right end of each of the extracted figures are obtained. From the extracted figures, the following conditions 7 and 8 are satisfied. Based on the figure 15 of the "dot" forming the dotted line
What is presumed to be D is retrieved. That is, the upper y coordinate of the extracted figure 15D is yu, the lower y coordinate is yd,
The x coordinate of the right end is xr, and the xl coordinate of the left end is x,
It is checked whether the following conditions 7 and 8 are satisfied. Condition 7: (yd-yu) <K12 Condition 8: K13 <(xr-xl) <K14 where K12: maximum thickness of “point” (for example, K12 =
K13: Minimum length of “point” (for example, K13 = 0.5)
mm) K14: Maximum length of “point” (for example, K14 = 2m)
m) If the conditions 7 and 8 are satisfied at the same time, the extracted figure 15D is regarded as a “point” forming a dotted line. After it is checked whether or not all the extracted figures are "points", the process proceeds to step S34.

【0026】ステップS34において、「点」と見なさ
れた図形15Dのすべてについて、次の(5)式により
横幅の合計値SWが計算される。 SW=Σ(xd−xu) ・・・(5) ステップS35において、(5)式で算出された横幅の
合計値SWが、次の条件9を満たしているか否かが調べ
られる。 条件9: SW>W0×K15 但し、W0:指定範囲15Xの横幅 K15:点線判定基準値(例えば、K15=0.25) 条件9が満たされていれば、次のステップS36へ進
み、条件9が満たされていなければ、点線でないと判断
されて処理は終了する。ステップS36において、
「点」と見なされた各図形15Dの中心座標(xi,y
i)が求められ、ステップS37へ進む。
In step S34, the total value SW of the width is calculated by the following equation (5) for all of the figures 15D regarded as "points". SW = Σ (xd−xu) (5) In step S35, it is checked whether or not the total width SW calculated by the equation (5) satisfies the following condition 9. Condition 9: SW> W0 × K15 where W0: width of the specified range 15X K15: dotted line determination reference value (for example, K15 = 0.25) If condition 9 is satisfied, the process proceeds to the next step S36, and condition 9 If is not satisfied, it is determined that it is not a dotted line, and the process ends. In step S36,
The center coordinates (xi, y) of each figure 15D regarded as a “point”
i) is obtained, and the process proceeds to step S37.

【0027】ステップS37において、各図形15Dの
中心座標(xi,yi)を通る直線の近似式が、最小2
乗法を用いて算出される。即ち、直線の近似式は次の
(6)式のように仮定される。 y=(1/α)×x+β ・・・(6) そして、(6)式中の係数α,βは、次の(7)〜(1
2)式に従って求められる。 Sx=Σxi ・・・(7) Sxx=Σ(xi×xi) ・・・(8) Sxy=Σ(xi×yi) ・・・(9) Sy=Σyi ・・・(10) α=(n×Sxx−Sx×Sx)/(n×Sxy−Sx×Sy) ・・・(11) β=(Sxx×Sy−Sxy×Sx) /(n×Sxx−Sx×Sx) ・・・(12) 但し、n:図形15Dの個数 ステップS38において、(6)式の直線の近似式の算
出に使用された図形15Dの中心座標(xi,yi)
が、この近似式(6)にそれぞれ代入されて、次の(1
3)式によって、この直線からの距離eiが計算され
る。 ei=yi−{(1/α)×xi+β} ・・・(13) ステップS39において、各図形15Dが点線15DL
を構成する「点」であるか、否かの判定が行われる。即
ち、(13)式で求められた距離eiの絶対値が、判定
基準値K16(例えば、K16=0.5mm)より大き
ければ、点線15DL上の「点」ではないと判定され
て、次のステップS40へ進み、判定基準値K16より
も小さければ、ステップS41へ進む。
In step S37, the approximate expression of a straight line passing through the center coordinates (xi, yi) of each figure 15D is a minimum of 2
Calculated using multiplication. That is, the approximate expression of the straight line is assumed as in the following expression (6). y = (1 / α) × x + β (6) Then, the coefficients α and β in the equation (6) are expressed by the following equations (7) to (1)
2) It is obtained according to the equation. Sx = Σxi (7) Sxx = Σ (xi × xi) (8) Sxy = Σ (xi × yi) (9) Sy = Σyi (10) α = (n × Sxx−Sxx × Sx) / (n × Sxy−Sxx × Sy) (11) β = (Sxx × Sy−Sxy × Sx) / (n × Sxx−Sxx × Sx) (12) Here, n: the number of figures 15D In step S38, the center coordinates (xi, yi) of the figure 15D used for calculating the approximate expression of the straight line of expression (6)
Are respectively substituted into the approximate expression (6), and the following (1)
The distance ei from this straight line is calculated by the equation 3). ei = yi − {(1 / α) × xi + β} (13) In step S39, each figure 15D is represented by a dotted line 15DL.
Is determined as to whether or not it is a “point” constituting That is, if the absolute value of the distance ei obtained by Expression (13) is larger than the determination reference value K16 (for example, K16 = 0.5 mm), it is determined that the distance ei is not a “point” on the dotted line 15DL, and the next The process proceeds to step S40, and if it is smaller than the determination reference value K16, the process proceeds to step S41.

【0028】ステップS40において、図形15Dは、
点線を構成する「点」ではないと見なされて除外され、
ステップS41へ進む。ステップS31において、すべ
ての「点」を構成すると見なされる図形15Dに対して
判定基準値K16による判定が終了したか否かがチェッ
クされ、判定されていない図形15Dが残っていれば、
ステップS38へ戻る。すべての図形15Dの判定処理
が終了していれば、ステップS42へ進む。ステップS
42では、前記ステップS40において除外された図形
15Dがあるか否かが判断される。もし、除外された図
形15Dがあれば、ステップS37へ戻る。除外された
図形15Dがなければ、枠線は点線であると判定されて
処理は終了する。
In step S40, FIG.
They are not considered "dots" that make up the dotted line,
Proceed to step S41. In step S31, it is checked whether or not the determination based on the determination criterion value K16 has been completed for the graphic 15D regarded as constituting all the "points".
It returns to step S38. If the determination processing for all the figures 15D has been completed, the process proceeds to step S42. Step S
At 42, it is determined whether there is a figure 15D excluded in step S40. If there is an excluded figure 15D, the process returns to step S37. If there is no excluded figure 15D, the frame is determined to be a dotted line, and the process ends.

【0029】(5) フォーマット表示部31〜登録部
32の動作 フォーマット表示部31では、前記枠線検出部29で検
出された枠線の位置や、線種判定部30で判定された枠
線の種別が、表示部25に表示される。図13は、フォ
ーマット情報生成処理によって得られた帳票10のフォ
ーマット情報の一例(一部)を示す図である。この図1
3に示すように、枠線の四隅座標(左端座標、上端座
標、右端座標、及び下端座標)や囲み線形状として実線
や点線の線種等が表示され、オペレータによって確認ま
たは訂正等の処置をとることが出来るようになってい
る。フォーマット表示部31での表示結果が、正しけれ
ば、オペレータの操作に基づいて、登録部32が起動さ
れ、帳票10のフォーマット情報はフォーマット情報記
憶部33に登録され、フォーマット情報生成処理が終了
する。
(5) Operation of the Format Display Units 31 to 32 The format display unit 31 displays the positions of the frame lines detected by the frame line detection unit 29 and the frame lines determined by the line type determination unit 30. The type is displayed on the display unit 25. FIG. 13 is a diagram illustrating an example (part) of the format information of the form 10 obtained by the format information generation process. This figure 1
As shown in FIG. 3, the four corner coordinates (left end coordinate, upper end coordinate, right end coordinate, and lower end coordinate) of the frame line and the type of solid line or dotted line are displayed as the enclosing line shape. Can be taken. If the display result on the format display unit 31 is correct, the registration unit 32 is activated based on the operation of the operator, the format information of the form 10 is registered in the format information storage unit 33, and the format information generation processing ends.

【0030】以上のように、この実施形態では、次の
(i)〜(iv)のような利点がある。 (i) 検出範囲算出部28では、記入範囲指定部26
でオペレータが指定した記入枠11の指定範囲11X等
に基づいて、これより若干広い記入枠の検出範囲11Y
が算出されるので、オペレータは指定作業を厳密に行う
必要がなくなり、作業が楽になる。 (ii) 枠線検出部29では、未記入の帳票10のイメ
ージデータから記入枠11等の枠線が検出されるので、
記入枠11等の位置の座標を測定して入力する作業がな
くなり、迅速かつ正確なフォーマット情報の生成が可能
になる。 (iii) 線種判定部30では、イメージデータに基づい
て記入枠11等の枠線の種別が直線か点線かが判定され
るので、線種を入力する作業がなくなり、迅速なフォー
マット情報の生成が可能になる。 (iv) フォーマット表示部31では、検出結果や判定
結果が表示されるので、オペレータはその表示内容を確
認して、もしも誤った結果が表示されているときには、
再処理や訂正等の処置を行うことが可能になる。
As described above, this embodiment has the following advantages (i) to (iv). (I) In the detection range calculation unit 28, the entry range designation unit 26
Based on the designated range 11X of the entry frame 11 designated by the operator, the detection range 11Y of the entry frame slightly larger than this.
Is calculated, the operator does not need to strictly perform the designated work, and the work becomes easier. (Ii) Since the frame line detection unit 29 detects a frame line such as the entry frame 11 from the image data of the blank form 10,
There is no need to measure and input the coordinates of the position of the entry frame 11 and the like, and it is possible to generate format information quickly and accurately. (Iii) The line type determination unit 30 determines whether the type of the frame line such as the entry frame 11 is a straight line or a dotted line based on the image data. Becomes possible. (Iv) Since the format display section 31 displays the detection result and the judgment result, the operator checks the display contents and if an incorrect result is displayed,
Actions such as reprocessing and correction can be performed.

【0031】なお、本発明は、上記実施形態に限定され
ず、種々の変形が可能である。この変形例としては、例
えば、次の(a)〜(e)のようなものがある。 (a) 枠線の線種を判定する必要がない場合には、線
種判定部30を省略しても良い。 (b) 各種の判定基準用の値K1〜K16は一例であ
り、実際の帳票10にあわせて任意に設定することがで
きる。 (c) 枠線検出方法は図4の方法に限定されず、例え
ば、記入枠13等が傾斜して入力されたときでも、その
傾斜を補正して枠線を検出する方法を採用することもで
きる。 (d) 特殊枠の判定処理の手順は図6の手順に限定さ
れず、予め文字が印刷された部分を記入枠から除去する
ことができるものであれば、どのような方法でも適用可
能である。 (e) 点線の判定方法の処理手順は図11の手順に限
定されず、記入枠の形態が点線であることを判定できる
ものであれば、どのような方法でも適用可能である。
The present invention is not limited to the above embodiment, and various modifications are possible. For example, there are the following modifications (a) to (e). (A) When it is not necessary to determine the line type of the frame line, the line type determination unit 30 may be omitted. (B) The values K1 to K16 for various criteria are merely examples, and can be set arbitrarily according to the actual form 10. (C) The frame line detection method is not limited to the method shown in FIG. 4. For example, even when the entry frame 13 or the like is input with an inclination, a method of detecting the frame line by correcting the inclination may be adopted. it can. (D) The procedure of the special frame determination process is not limited to the procedure of FIG. 6, and any method can be applied as long as a portion in which characters are printed in advance can be removed from the entry frame. . (E) The processing procedure of the method of determining a dotted line is not limited to the procedure of FIG. 11, and any method can be applied as long as it can determine that the form of the entry frame is a dotted line.

【0032】[0032]

【発明の効果】以上詳細に説明したように、第1の発明
によれば、検出範囲算出処理によって、範囲指定処理で
指定された指定範囲に基づいて、これより若干広い記入
枠の枠線検出範囲が算出されるので、オペレータは指定
作業を厳密に行う必要がなくなり、作業が楽になる。更
に、枠線検出処理によって、未記入の帳票のイメージデ
ータから記入枠の枠線が検出されるので、記入枠の位置
の座標を測定して入力する作業が不要で、迅速かつ正確
なフォーマット情報の生成が可能になる。第2の発明に
よれば、検出された枠線が実線か点線かの線種判定処理
が行われるので、第1の発明の効果に加えて、オペレー
タが線種の情報を入力する必要がなくなり、更に迅速な
フォーマット情報の生成が可能になる。第3の発明によ
れば、指定範囲を示す境界線と、検出された枠線の向か
い合う長さと面積によって、その枠線が直線であるか否
かを判定するので、正確な判定が可能になる。第4の発
明によれば、点線を構成する複数の点の図形による近似
直線を求め、それらの複数の点と該近似直線との距離を
判定することによって、その枠線が点線であるか否かを
判定するので、正確な判定が可能になる。
As described above in detail, according to the first aspect, the detection range calculation processing detects the frame line of a slightly wider entry frame based on the specified range specified in the range specification processing. Since the range is calculated, the operator does not need to strictly perform the specified work, and the work becomes easier. Furthermore, since the frame line detection processing detects the frame line of the entry frame from the image data of the blank form, there is no need to measure and input the coordinates of the position of the entry frame, and quick and accurate format information can be obtained. Can be generated. According to the second aspect, the line type determination processing is performed to determine whether the detected frame line is a solid line or a dotted line. Therefore, in addition to the effect of the first aspect, it is not necessary for the operator to input line type information. Thus, format information can be generated more quickly. According to the third aspect, it is determined whether or not the frame line is a straight line based on the length and area of the boundary line indicating the designated range and the detected frame line, so that accurate determination can be made. . According to the fourth aspect of the present invention, an approximate straight line of a plurality of points constituting a dotted line is determined by a graphic, and a distance between the plurality of points and the approximate straight line is determined, thereby determining whether the frame line is a dotted line. Is determined, accurate determination is possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施形態のOCR用帳票のフォーマッ
ト情報生成方法で用いられるフォーマット情報生成装置
の構成図である。
FIG. 1 is a configuration diagram of a format information generating device used in a method for generating format information of an OCR form according to an embodiment of the present invention.

【図2】OCR用帳票の一例を示す図である。FIG. 2 is a diagram illustrating an example of an OCR form.

【図3】表示部25に表示された帳票10のイメージデ
ータの表示例を示す図である。
3 is a diagram showing a display example of image data of a form 10 displayed on a display unit 25. FIG.

【図4】ヒストグラム法による枠線検出方法の説明図で
ある。
FIG. 4 is an explanatory diagram of a frame line detection method using a histogram method.

【図5】記入枠の形態が表形式であるか否かの判定方法
を説明するための図である。
FIG. 5 is a diagram for explaining a method of determining whether or not the form of the entry frame is a table format.

【図6】特殊枠の判定処理の手順を示すフローチャート
である。
FIG. 6 is a flowchart illustrating a procedure of a special frame determination process.

【図7】特殊枠判定処理の各段階における説明図(その
1)である。
FIG. 7 is an explanatory diagram (part 1) of each stage of the special frame determination process.

【図8】特殊枠判定処理の各段階における説明図(その
2)である。
FIG. 8 is an explanatory diagram (part 2) of each stage of the special frame determination process.

【図9】直線の判定方法を説明するための図である。FIG. 9 is a diagram for explaining a straight line determination method.

【図10】点線の判定方法を説明するための図である。FIG. 10 is a diagram illustrating a method for determining a dotted line.

【図11】点線の判定方法の処理手順を示すフローチャ
ートである。
FIG. 11 is a flowchart illustrating a processing procedure of a method for determining a dotted line.

【図12】点線を構成する「点」の図形の一例を示す図
である。
FIG. 12 is a diagram showing an example of a “dot” figure forming a dotted line.

【図13】フォーマット情報生成処理によって得られた
帳票10のフォーマット情報の一例(一部)を示す図で
ある。
FIG. 13 is a diagram showing an example (part) of format information of a form 10 obtained by a format information generation process.

【符号の説明】[Explanation of symbols]

10 帳票 11,12,13,14,15 記入枠 13X 指定範囲 13Y 枠線検出範囲 21 イメージ入力部 22 イメージ読取部 23 イメージデータ記憶
部 24 イメージ表示部 25 表示部 26 記入範囲指定部 27 範囲入力部 28 検出範囲算出部 29 枠線検出部 30 線種判定部 31 フォーマット表示部 32 登録部 33 フォーマット情報記
憶部
10 Form 11, 12, 13, 14, 15 Entry Frame 13X Specified Range 13Y Border Line Detection Range 21 Image Input Unit 22 Image Reading Unit 23 Image Data Storage Unit 24 Image Display Unit 25 Display Unit 26 Entry Range Designation Unit 27 Range Input Unit 28 detection range calculation unit 29 frame line detection unit 30 line type determination unit 31 format display unit 32 registration unit 33 format information storage unit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 光学式文字読取装置で読取られる帳票上
に予め印刷された文字記入用の記入枠の位置を登録する
フォーマット情報の生成方法において、 認識対象となる文字が記入されていない前記帳票のイメ
ージデータを読取るイメージ読取り処理と、 前記イメージ読取り処理で読取られた前記帳票のイメー
ジデータを表示するイメージ表示処理と、 前記イメージ表示処理で表示された前記帳票のイメージ
データに基づいて、前記認識対象となる文字が記入され
るべき指定範囲を指定する範囲指定処理と、 前記範囲指定処理で指定された指定範囲に基づいて、該
指定範囲に対応する記入枠の位置を検出するための枠線
検出範囲を算出する検出範囲算出処理と、 前記検出範囲算出処理で算出された前記枠線検出範囲に
存在する前記記入枠の枠線を検出する枠線検出処理と、 前記枠線検出処理で検出された枠線の位置の情報を含む
前記帳票のフォーマット情報を表示するフォーマット情
報表示処理と、 前記フォーマット情報表示処理で表示されたフォーマッ
ト情報を登録するフォーマット情報登録処理とを、 順次行うことを特徴とする光学式文字読取装置用帳票の
フォーマット情報生成方法。
1. A method for generating format information for registering a position of an entry frame for character entry pre-printed on a form read by an optical character reading device, wherein the form without a character to be recognized is not entered. Image reading processing for reading the image data of the form, image display processing for displaying the image data of the form read in the image reading processing, and recognition based on the image data of the form displayed in the image display processing. A range designation process for designating a designated range in which a target character is to be entered; and a frame line for detecting a position of an entry frame corresponding to the designated range based on the designated range designated in the range designation process. A detection range calculation process for calculating a detection range, and a frame of the entry frame existing in the frame detection range calculated in the detection range calculation process , A format line display process for displaying format information of the form including information on the position of the frame line detected in the frame line detection process, and a format displayed in the format information display process. And a format information registering process for registering information is sequentially performed, the method for generating format information of a form for an optical character reader.
【請求項2】 光学式文字読取装置で読取られる帳票上
に予め印刷された文字記入用の記入枠の位置及び該記入
枠の枠線の種別を登録するフォーマット情報の生成方法
において、 認識対象となる文字が記入されていない前記帳票のイメ
ージデータを読取るイメージ読取り処理と、 前記イメージ読取り処理で読取られた前記帳票のイメー
ジデータを表示するイメージ表示処理と、 前記イメージ表示処理で表示された前記帳票のイメージ
データに基づいて、前記認識対象となる文字が記入され
るべき指定範囲を指定する範囲指定処理と、 前記範囲指定処理で指定された指定範囲に基づいて、該
指定範囲に対応する記入枠の位置を検出するための枠線
検出範囲を算出する検出範囲算出処理と、 前記検出範囲算出処理で算出された前記枠線検出範囲に
存在する前記記入枠の枠線を検出する枠線検出処理と、 前記枠線検出処理で検出された枠線の線種が、実線であ
るか点線であるかを判定する線種判定処置と、 前記枠線検出処理で検出された枠線の位置と、前記線種
判定処理で判定された前記枠線の線種を含む前記帳票の
フォーマット情報を表示するフォーマット情報表示処理
と、 前記フォーマット情報表示処理で表示されたフォーマッ
ト情報を登録するフォーマット情報登録処理とを、 順次行うことを特徴とする光学式文字読取装置用帳票の
フォーマット情報生成方法。
2. A method for generating format information for registering a position of an entry frame for character entry preprinted on a form read by an optical character reader and a type of a frame line of the entry frame, the method comprising: Image reading processing for reading the image data of the form in which no characters are written, image display processing for displaying the image data of the form read in the image reading processing, and the form displayed in the image display processing A range specification process for specifying a specified range in which the characters to be recognized are to be written, based on the image data of (a), and an input frame corresponding to the specified range based on the specified range specified in the range specification process. Detection range calculation processing for calculating a frame line detection range for detecting the position of the frame, and the frame line detection range calculated in the detection range calculation processing A frame line detection process for detecting a frame line of the existing entry frame, and a line type determination process for determining whether the line type of the frame line detected in the frame line detection process is a solid line or a dotted line, A format information display process for displaying format information of the form including the position of the frame line detected in the frame line detection process and the line type of the frame line determined in the line type determination process; And a format information registering process for registering the format information displayed in the process. The format information generating method for a form for an optical character reader.
【請求項3】 前記線種判定処理は、前記範囲指定処理
で指定された指定範囲を示す境界線、及び該境界線に対
応して前記枠線検出処理で検出された枠線の向かい合う
距離と、それらの向かい合う境界線と枠線で形成される
台形部分の面積に基づいて、該枠線が実線であるか否か
を判定することを特徴とする請求項2記載の光学式文字
読取装置用帳票のフォーマット情報生成方法。
3. The line type determination processing includes: a boundary line indicating a specified range specified in the range specification processing; and a distance between the frame lines detected in the frame line detection processing corresponding to the boundary line. 3. The optical character reading device according to claim 2, wherein it is determined whether or not the frame line is a solid line based on the area of a trapezoid formed by the facing boundary line and the frame line. Form information generation method.
【請求項4】 前記線種判定処理は、点線を構成する複
数の点の図形を抽出し、抽出した複数の点の図形の中心
の座標に基づいてこれらの点の図形で構成される近似直
線を求め、該各点の図形の中心が該近似直線から一定の
距離内に入っている場合に、該枠線が点線であると判定
することを特徴とする請求項2記載の光学式文字読取装
置用帳票のフォーマット情報生成方法。
4. The line type determination processing includes extracting a figure of a plurality of points forming a dotted line, and calculating an approximate straight line composed of the figures of the points based on the coordinates of the center of the extracted plurality of points. 3. The optical character reading device according to claim 2, wherein when the center of the figure at each point is within a certain distance from the approximate straight line, the frame line is determined to be a dotted line. A method for generating format information of a device form.
JP22771797A 1997-08-25 1997-08-25 Form information generation method for form for optical character reader Expired - Fee Related JP3524339B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22771797A JP3524339B2 (en) 1997-08-25 1997-08-25 Form information generation method for form for optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22771797A JP3524339B2 (en) 1997-08-25 1997-08-25 Form information generation method for form for optical character reader

Publications (2)

Publication Number Publication Date
JPH1166228A true JPH1166228A (en) 1999-03-09
JP3524339B2 JP3524339B2 (en) 2004-05-10

Family

ID=16865258

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22771797A Expired - Fee Related JP3524339B2 (en) 1997-08-25 1997-08-25 Form information generation method for form for optical character reader

Country Status (1)

Country Link
JP (1) JP3524339B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030585A (en) * 2001-07-12 2003-01-31 Canon Inc Image processor and image processing method, and program and storage medium therefor
US7106904B2 (en) 2001-04-25 2006-09-12 Hitachi, Ltd. Form identification method
JP2009031937A (en) * 2007-07-25 2009-02-12 Fuji Xerox Co Ltd Form image processing apparatus and form image processing program
JP2009245036A (en) * 2008-03-31 2009-10-22 Fujitsu Frontech Ltd Character recognition device
JP6374079B1 (en) * 2017-12-27 2018-08-15 AI inside株式会社 Character recognition apparatus, method and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7106904B2 (en) 2001-04-25 2006-09-12 Hitachi, Ltd. Form identification method
JP2003030585A (en) * 2001-07-12 2003-01-31 Canon Inc Image processor and image processing method, and program and storage medium therefor
JP2009031937A (en) * 2007-07-25 2009-02-12 Fuji Xerox Co Ltd Form image processing apparatus and form image processing program
JP2009245036A (en) * 2008-03-31 2009-10-22 Fujitsu Frontech Ltd Character recognition device
US8189921B2 (en) 2008-03-31 2012-05-29 Fujitsu Frontech Limited Character recognition device
JP6374079B1 (en) * 2017-12-27 2018-08-15 AI inside株式会社 Character recognition apparatus, method and program
JP2019117520A (en) * 2017-12-27 2019-07-18 AI inside株式会社 Character recognition device, method and program

Also Published As

Publication number Publication date
JP3524339B2 (en) 2004-05-10

Similar Documents

Publication Publication Date Title
US7684646B2 (en) System and method of determining image skew using connected components
US4408342A (en) Method for recognizing a machine encoded character
US5091964A (en) Apparatus for extracting a text region in a document image
RU2621601C1 (en) Document image curvature eliminating
JP3113827B2 (en) Method and apparatus for recognizing rectangular object
JPH03144863A (en) Detecting method and correcting method for inclination of picture and picture information processor
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
JP2008217833A (en) Document image recognition system and storage medium for document image recognition program
JPH08287184A (en) Picture cutting-out device and character recognition device
JP3471578B2 (en) Line direction determining device, image tilt detecting device, and image tilt correcting device
JPH1166228A (en) Method for generating format information of document for optical character reader
JPH0410087A (en) Base line extracting method
JP4281236B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JPH11265422A (en) Method and device for recognizing mark and recording medium
JP4070486B2 (en) Image processing apparatus, image processing method, and program used to execute the method
JPH07182459A (en) Table structure extracting device
JPH0916713A (en) Image area dividing method
JPH117493A (en) Character recognition processor
JP3521606B2 (en) Character reader
JP3019897B2 (en) Line segmentation method
JP2011003022A (en) Image processing apparatus and program
JPH03263282A (en) Character segmenting method for character reader
JPH10143606A (en) Character recognition device and character recognition method
JP2954218B2 (en) Image processing method and apparatus
JPH0573718A (en) Area attribute identifying system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040212

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100220

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees