JP2001297302A - Character reader - Google Patents

Character reader

Info

Publication number
JP2001297302A
JP2001297302A JP2000110112A JP2000110112A JP2001297302A JP 2001297302 A JP2001297302 A JP 2001297302A JP 2000110112 A JP2000110112 A JP 2000110112A JP 2000110112 A JP2000110112 A JP 2000110112A JP 2001297302 A JP2001297302 A JP 2001297302A
Authority
JP
Japan
Prior art keywords
character
misreading
characters
determination
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000110112A
Other languages
Japanese (ja)
Other versions
JP4544691B2 (en
Inventor
Hiroichi Iwashita
博一 岩下
Kazuhiro Ishikawa
和弘 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000110112A priority Critical patent/JP4544691B2/en
Publication of JP2001297302A publication Critical patent/JP2001297302A/en
Application granted granted Critical
Publication of JP4544691B2 publication Critical patent/JP4544691B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To discriminate possibility that a character is erroneously recognized. SOLUTION: A recognizing part 5 recognizes a character from image data acquired by an image input part 1. Concerning the character coordinates of a rectangle surrounding this recognized character, a size deciding part 6 calculates a condition while using size decision data stored in a decision data storage memory 24. The size decision data contain a conditional expression and a processing method such as non-read processing, no processing or deletion corresponding to that conditional expression. On the basis of this conditional expression, the size deciding part 6 calculates the condition. When the calculated result of this conditional expression is true, possibility in erroneous reading is decided and post-processing corresponding to the conditional expression, with which the calculated result becomes true, is performed.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、読み取った文字、
あるいは文字列に対して誤って文字を認識した可能性を
判別し、誤認識したときは、読み取られた文字列につい
て知識処理あるいは後処理を行うような文字読取装置に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to read characters,
Alternatively, the present invention relates to a character reading device that determines the possibility of erroneously recognizing a character from a character string and, when erroneous recognition is performed, performs knowledge processing or post-processing on the read character string.

【0002】[0002]

【従来の技術】従来より、帳票イメージ上に記録された
文字を読み取る文字読取装置が知られている。
2. Description of the Related Art Conventionally, there has been known a character reading apparatus for reading characters recorded on a form image.

【0003】従来の文字読取装置では、画像上の指定さ
れた領域を走査し、行切り出し処理によって行の座標を
切り出し、文字切り出し処理によって行の座標内の文字
の座標を検出する。そして、検出後、各文字の座標の画
像についての文字認識処理を行う。
In a conventional character reading apparatus, a designated area on an image is scanned, line coordinates are cut out by line cutout processing, and character coordinates within the line coordinates are detected by character cutout processing. After the detection, a character recognition process is performed on the image of the coordinates of each character.

【0004】文字読取装置では、一般に、行の切り出
し、文字の切り出しを行ってから文字認識が行われる。
行の切り出しを行うには、画像を横方向に走査し、黒画
素数のヒストグラムを作成し、ヒストグラムの値が0に
なった箇所で各行を区切る。
[0004] In a character reading device, character recognition is generally performed after cutting out lines and characters.
To cut out a row, the image is scanned in the horizontal direction, a histogram of the number of black pixels is created, and each row is separated at a point where the value of the histogram becomes 0.

【0005】また、文字の切り出しを行うには、画像を
縦方向に走査し、黒画素数のヒストグラムを作成し、ヒ
ストグラムの値が0になった箇所で区切り、各文字に分
離する。誤って文字を認識したときは、単語照合辞書等
を用いた知識処理あるいは後処理と呼ばれる処理を行う
ことにより、誤読や不読の文字を置換して認識率を向上
させる。
In order to cut out characters, the image is scanned in the vertical direction, a histogram of the number of black pixels is created, and the image is separated at each point where the value of the histogram becomes 0 to separate each character. If a character is erroneously recognized, a process called a knowledge process or a post-process using a word collation dictionary or the like is performed to replace a misread or unread character, thereby improving the recognition rate.

【0006】[0006]

【発明が解決しようとする課題】ところで、かかる従来
の文字読取装置では、ヒストグラムを作成して行あるい
は文字の切り出しを行うようにしているので、正しく行
切り出し、文字切り出しを行えない場合がある。
In such a conventional character reading apparatus, since a line or a character is cut out by creating a histogram, a line or a character may not be cut out correctly.

【0007】図2は、かかる従来の説明図である。例え
ば、図2(a)は、複数の文字に対して抹消線が施され
ている例を示す。尚、図中、破線で示す矩形は、1文字
の正しい区分を示す。この場合、抹消線があるために文
字間を正しく識別できなくなってしまう。従って、すべ
ての文字を1つの文字と誤認識してしまい、正しく行切
り出しを行えない。
FIG. 2 is an explanatory diagram of such a conventional art. For example, FIG. 2A shows an example in which a strike-through is given to a plurality of characters. In the drawing, the rectangle indicated by the broken line indicates the correct division of one character. In this case, since there is a strike-through line, it becomes impossible to correctly distinguish between characters. Therefore, all characters are erroneously recognized as one character, and line segmentation cannot be performed correctly.

【0008】また、図2(b)は、複数の文字を丸囲い
した例を示す。この場合、丸囲い線のために、2行の文
字を縦長の1文字と認識してしまい、正しい行切り出し
を行うことができない。
FIG. 2B shows an example in which a plurality of characters are circled. In this case, two lines of characters are recognized as one vertically long character due to the encircled line, and a correct line cutout cannot be performed.

【0009】また、図2(c)は、印字にずれが生じた
例を示す。この場合、行間に間隙がなくなってしまい、
行を正しく識別できず、2行の文字を縦長の1文字とし
て切り出してしまう。
FIG. 2 (c) shows an example in which printing has shifted. In this case, there is no gap between the lines,
Lines cannot be identified correctly, and two lines of characters are cut out as one vertically long character.

【0010】また、図2(d)は、桁区切りの線が行に
含まれている例を示す。この場合、文字認識処理には不
要である桁線が文字として切り出されてしまう。このよ
うに行切り出しや文字切り出し結果に誤りがあると、明
らかに文字サイズや文字の位置が正しくなくても、検出
された文字の矩形を各文字としてそのまま文字認識の処
理がなされ、誤読が生じたり不要な文字が出力されたり
して文字認識装置としての信頼性が低下する。
FIG. 2D shows an example in which a line for separating digits is included in a row. In this case, a digit line unnecessary for the character recognition processing is cut out as a character. If there is an error in the line segmentation or character segmentation results, even if the character size and character position are obviously incorrect, the character recognition process is performed as it is with the detected character rectangle as each character, causing misreading. Or unnecessary characters are output, thereby lowering the reliability as a character recognition device.

【0011】また、このような認識結果の修正するに
は、オペレータが手作業で行う必要があり、オペレータ
の負担も増大する。従って、誤って文字を認識した可能
性があるか否かを正しく判断し、誤って文字を認識した
ときは、後処理を自動的に行えるようにする必要があ
る。
Further, to correct such a recognition result, it is necessary for the operator to manually perform the correction, which increases the burden on the operator. Therefore, it is necessary to correctly determine whether or not there is a possibility that a character has been incorrectly recognized, and to automatically perform post-processing when a character is incorrectly recognized.

【0012】[0012]

【課題を解決するための手段】本発明は以上の点を解決
するため次の構成を採用する。 〈構成1〉請求項1の発明に係る文字読取装置は、所定
の用紙に印字された文字を画像データとして取得する画
像入力手段と、該画像入力手段により取得された画像デ
ータから各文字の位置及び大きさを文字座標で特定し、
各文字を認識して文字コードに変換する認識手段と、該
認識手段により認識された各文字の位置及び大きさに対
し、文字座標を用いて所定の誤読判定条件を設定し、当
該各文字の位置及び大きさが誤読判定条件に該当すると
きは、誤って文字を認識した可能性があると判定し、当
該文字については、認識結果に対する後処理を行う誤読
判定処理手段と、を備えるようにした。
The present invention employs the following structure to solve the above problems. <Structure 1> A character reading device according to the first aspect of the present invention is a character reading device, comprising: image input means for acquiring a character printed on a predetermined sheet as image data; and a position of each character based on the image data acquired by the image input means. And the size is specified by character coordinates,
Recognition means for recognizing each character and converting it to a character code, and for the position and size of each character recognized by the recognition means, set predetermined misreading determination conditions using character coordinates, and When the position and the size correspond to the misreading determination condition, it is determined that there is a possibility that the character is erroneously recognized, and for the character, misreading determination processing means for performing post-processing on the recognition result is provided. did.

【0013】〈構成2〉請求項2の発明に係る文字読取
装置では、画像データの中で同じ誤読可能性判定条件が
適用される所定の読み取り領域を設定し、前記誤読可能
性判定手段は、読み取った文字が誤読判定条件に該当す
るか否かを読み取り領域毎に判定するように構成されて
いる。
<Structure 2> In the character reading device according to the second aspect of the present invention, a predetermined reading area to which the same misreadability determination condition is applied is set in the image data, and the misreadability determination means includes: It is configured to determine whether or not the read character satisfies an erroneous reading determination condition for each reading area.

【0014】〈構成3〉請求項3の発明に係る文字読取
装置では、前記誤読可能性判定手段が、各文字の文字座
標に基づいて認識対象の文字の幅、高さ及び位置を算出
し、算出された認識対象の文字の幅、高さ及び位置に誤
読判定条件を設定し、これらの文字の幅、高さ及び位置
のうちいずれか1つが誤読判定条件に該当したときに誤
って文字を認識した可能性があると判定するように構成
されている。
<Structure 3> In the character reading apparatus according to the third aspect of the present invention, the misreadability determining means calculates the width, height and position of the character to be recognized based on the character coordinates of each character. Misreading determination conditions are set for the calculated width, height, and position of the character to be recognized, and when one of the width, height, and position of the character meets the misreading determination condition, the character is erroneously detected. It is configured to determine that there is a possibility of recognition.

【0015】〈構成4〉請求項4の発明に係る文字読取
装置では、前記誤読可能性判定手段が、各文字の文字座
標に基づいて認識対象の文字の幅、高さ及び位置を算出
し、算出された認識対象の文字の幅、高さ及び位置に誤
読判定条件を設定し、これらの文字の幅、高さ及び位置
のうち少なくとも1つが誤読判定条件に該当したときに
誤って文字を認識した可能性があると判定するように構
成されている。
<Structure 4> In the character reading apparatus according to the invention of claim 4, the misreadability determining means calculates the width, height and position of the character to be recognized based on the character coordinates of each character, Misreading determination conditions are set for the calculated width, height, and position of the recognition target character, and the character is erroneously recognized when at least one of the width, height, and position of the character meets the misreading determination condition. It is configured to determine that there is a possibility of having done this.

【0016】〈構成5〉請求項5の発明に係る文字読取
装置では、前記誤読可能性判定手段が、各文字の文字座
標に基づいて認識対象の文字の前後関係を算出し、算出
された認識対象の文字の前後関係に誤読判定条件を設定
し、当該前後関係が誤読判定条件に該当したときに誤っ
て文字を認識した可能性があると判定するように構成さ
れている。
<Structure 5> In the character reading apparatus according to the fifth aspect of the present invention, the misreadability determining means calculates the context of the character to be recognized based on the character coordinates of each character, and calculates the calculated recognition. A misreading determination condition is set in the context of the target character, and when the context matches the misreading determination condition, it is determined that there is a possibility that the character is erroneously recognized.

【0017】〈構成6〉請求項6の発明に係る文字読取
装置では、前記誤読可能性判定手段が、各文字の文字座
標に基づいてその行の全ての文字を含む行を作成し、行
の位置関係及びその行に含まれている文字の位置、文字
数に誤読判定条件を設定し、行の位置関係及びその行に
含まれている文字の位置、文字数のうちのいずれか1つ
が誤読判定条件に該当したときに誤って文字を認識した
可能性があると判定するように構成されている。
<Structure 6> In the character reading apparatus according to the sixth aspect of the present invention, the misreadability determining means creates a line including all the characters of the line based on the character coordinates of each character, and The misreading determination condition is set for the positional relationship, the position of the character included in the line, and the number of characters, and any one of the positional relationship of the line, the position of the character included in the line, and the number of characters is determined as the misreading determination condition. Is configured to determine that there is a possibility that a character has been erroneously recognized when に.

【0018】〈構成7〉請求項7の発明に係る文字読取
装置では、前記誤読可能性判定手段が、各文字の文字座
標に基づいてその行の全ての文字を含む行を作成し、行
の位置関係及びその行に含まれている文字の位置、文字
数に誤読判定条件を設定し、行の位置関係及びその行に
含まれている文字の位置、文字数のうちの少なくとも1
つが誤読判定条件に該当したときに誤って文字を認識し
た可能性があると判定するように構成されている。
<Structure 7> In the character reading apparatus according to the seventh aspect of the present invention, the misreadability determining means creates a line including all the characters of the line based on the character coordinates of each character, and A misreading determination condition is set for the positional relationship and the position and the number of characters included in the line, and at least one of the positional relationship of the line and the position and the number of characters included in the line is set.
It is configured to determine that there is a possibility that a character has been erroneously recognized when one of the conditions matches the misreading determination condition.

【0019】〈構成8〉請求項8の発明に係る文字読取
装置では、前記誤読判定処理手段が、各文字の文字座標
に基づいて同一行で同じ条件を有する文字が連続してい
るとき、当該連続した複数の文字をブロックにまとめ、
ブロックの位置関係及びそのブロックに含まれている文
字の位置、文字数に誤読判定条件を設定し、認識対象の
ブロックの位置関係及びそのブロックに含まれている文
字の位置、文字数のうちいずれか1つが誤読判定条件に
該当したときに誤って文字を認識した可能性があると判
定するように構成されている。
<Structure 8> In the character reading device according to the invention of claim 8, when the misreading determination processing means determines that characters having the same condition are consecutive in the same line on the same line based on the character coordinates of each character, Combine multiple consecutive characters into a block,
An erroneous reading determination condition is set for the positional relationship of the block, the position of the character included in the block, and the number of characters, and any one of the positional relationship of the block to be recognized, the position of the character included in the block, and the number of characters is set. It is configured to determine that there is a possibility that a character has been erroneously recognized when one of the conditions matches the misreading determination condition.

【0020】〈構成9〉請求項9の発明に係る文字読取
装置では、前記誤読判定処理手段が、各文字の文字座標
に基づいて同一行で同じ条件を有する文字が連続してい
るとき、当該連続した複数の文字をブロックにまとめ、
ブロックの位置関係及びそのブロックに含まれている文
字の位置、文字数に誤読判定条件を設定し、認識対象の
ブロックの位置関係及びそのブロックに含まれている文
字の位置、文字数のうち少なくとも1つが誤読判定条件
に該当したときに誤って文字を認識した可能性があると
判定するように構成されている。
<Structure 9> In the character reading device according to the ninth aspect of the invention, when the misreading determination processing means determines that characters having the same condition are consecutive in the same line on the same line based on the character coordinates of each character, Combine multiple consecutive characters into a block,
An erroneous reading determination condition is set for the positional relationship of the block, the position of the character included in the block, and the number of characters, and at least one of the positional relationship of the block to be recognized, the position of the character included in the block, and the number of characters is set. It is configured to determine that there is a possibility that a character has been erroneously recognized when the misreading determination condition is met.

【0021】〈構成10〉請求項10の発明に係る文字
読取装置では、前記誤読判定処理手段が、誤読判定条件
をスクリプトで記述した。
<Structure 10> In the character reading apparatus according to the tenth aspect of the present invention, the misreading determination processing means describes the misreading determination condition in a script.

【0022】〈構成11〉請求項11の発明に係る文字
読取装置では、前記誤読判定処理手段が、誤って文字を
読み取った可能性に応じて、当該文字を別の文字に置換
する処理、未処理、削除処理のうち、いずれか1つを選
択処理するように構成されている。
<Structure 11> In the character reading apparatus according to the eleventh aspect, the misreading determination processing means replaces the character with another character in accordance with the possibility that the character is erroneously read. It is configured to select one of the processing and the deletion processing.

【0023】[0023]

【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて説明する。 〈具体例1〉具体例1は、画像データから文字を認識
し、認識された文字の位置及び大きさに対して、読み取
り領域に適応したサイズ判定データを誤読判定条件とし
て指定してサイズ判定を行い、誤読の可能性があるとき
は、不読等の後処理を行うようにしたものである。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below using specific examples. <Specific example 1> In specific example 1, a character is recognized from image data, and size determination data adapted to a reading area is specified as a misreading determination condition with respect to the position and size of the recognized character to determine a size. When there is a possibility of erroneous reading, post-processing such as unreading is performed.

【0024】図1は、具体例1の構成を示すブロック図
である。具体例1の文字読取装置は、画像入力部1と、
表示部2と、入力部3と、制御部4と、認識部5と、サ
イズ判定部6と、画像メモリ21と、読み取り領域情報
格納メモリ22と、認識結果格納メモリ23と、判定デ
ータ格納メモリ24と、判定結果格納メモリ25と、参
照座標格納メモリ26と、を備えて構成されている。
FIG. 1 is a block diagram showing the configuration of the first embodiment. The character reading device according to the first specific example includes an image input unit 1,
Display unit 2, input unit 3, control unit 4, recognition unit 5, size determination unit 6, image memory 21, read area information storage memory 22, recognition result storage memory 23, determination data storage memory 24, a determination result storage memory 25, and a reference coordinate storage memory 26.

【0025】画像入力部1は、イメージスキャナおよび
FAX等のように、帳票上に記入された文字、図形を画
像データとして入力する機能を有する画像入力手段であ
る。表示部2は、ディスプレイ等のように、オペレータ
に対して情報を表示する機能を有するものである。入力
部3は、キーボード、マウス等のように、オペレータか
らの入力を受け付ける機能を有するものである。
The image input unit 1 is an image input means such as an image scanner and a facsimile which has a function of inputting characters and figures written on a form as image data. The display unit 2 has a function of displaying information to an operator, such as a display. The input unit 3 has a function of receiving input from an operator, such as a keyboard and a mouse.

【0026】認識部5は、画像メモリ21に格納されて
いる画像データを参照して読み取り領域を走査し、行の
切り出し及び文字の切り出しを行って各文字の位置及び
大きさを文字座標で特定し、各文字の認識を行い、認識
した文字を文字コードに変換する機能を有する認識手段
である。
The recognition unit 5 scans the reading area with reference to the image data stored in the image memory 21, cuts out lines and cuts out characters, and specifies the position and size of each character by character coordinates. This is a recognition means having a function of recognizing each character and converting the recognized character into a character code.

【0027】図3は文字座標の説明図である。この図3
に示すように、文字「あ」は認識対象の文字であって、
この文字の位置及び大きさは、図中、破線で示すように
文字「あ」を囲む矩形によって特定される。この矩形
は、所定の位置を原点とし、図中、左上の座標を(l,
t)、右下の座標を(r,b)として、座標(l,t)−(r,
b)で表され、この座標が文字座標となる。
FIG. 3 is an explanatory diagram of character coordinates. This figure 3
As shown in the figure, the character "A" is a character to be recognized,
The position and size of this character are specified by a rectangle surrounding the character "A" as shown by a broken line in the figure. This rectangle has the origin at a predetermined position, and the upper left coordinate in the figure is (l,
t), the lower right coordinate is (r, b), and the coordinates (l, t)-(r,
These coordinates are character coordinates.

【0028】サイズ判定部6は、認識部5によって認識
された結果に対して、文字の位置及びサイズについての
サイズ判定を行い、これにより誤読の可能性を判定する
機能を有する誤読判定処理手段である。
The size judging section 6 is an erroneous reading judgment processing means having a function of judging the size of the position and size of the character on the result recognized by the recognizing section 5 and thereby judging the possibility of erroneous reading. is there.

【0029】図4は、具体例1のサイズ判定に用いるサ
イズ判定データの一例を示す説明図である。この図4に
示すように、サイズ判定データには、複数の条件式及び
その条件式に該当したときの処理方法が含まれている。
FIG. 4 is an explanatory diagram showing an example of size determination data used for size determination in the first embodiment. As shown in FIG. 4, the size determination data includes a plurality of conditional expressions and a processing method when the conditional expression is satisfied.

【0030】ここで、処理方法としての不読は、認識さ
れて変換された文字コードを、例えば「?」などの認識
結果として含まれるべきでない文字に置換してオペレー
タによる認識結果の修正作業を容易にするための処理で
ある。
Here, the unread as a processing method is performed by replacing the recognized and converted character code with a character that should not be included as a recognition result, such as "?", And corrects the recognition result by the operator. This is processing for facilitation.

【0031】未処理は、予め後処理を行わないように指
定条件が設定された文字を不読や削除などの処理から除
外するための処理である。削除は、不要と考えられる文
字を削除する処理である。尚、処理方法は条件式に応じ
て適宜、設定される。
The unprocessed process is a process for excluding a character for which a designated condition is set so that post-processing is not performed in advance from processes such as unread and deletion. Deletion is processing for deleting characters that are considered unnecessary. The processing method is appropriately set according to the conditional expression.

【0032】制御部4は、文字読取装置の各ブロックを
制御する機能を有するものである。画像メモリ21は、
画像入力部1によって入力された画像データを格納する
ためのメモリである。
The control section 4 has a function of controlling each block of the character reading device. The image memory 21
This is a memory for storing image data input by the image input unit 1.

【0033】読み取り領域情報格納メモリ22は、読み
取り処理を行うための領域情報を格納するためのメモリ
である。図5は具体例1の読み取り領域の説明図であ
る。一例として帳票を示す。この帳票には、文字が印字
された読み取り領域A〜Fが設定されている。認識対象
の文字の大きさ、字体等は各領域毎に異なっており、サ
イズ判定は、この読み取り領域A〜F毎に行われる。領
域情報は、この領域の座標を指定するための領域指定情
報とこの領域に適用されるサイズ判定用の条件式等を指
定するためのサイズ判定データ指定情報とであり、読み
取り領域A〜F毎に格納されている。
The read area information storage memory 22 is a memory for storing area information for performing a reading process. FIG. 5 is an explanatory diagram of a reading area according to the first embodiment. A form is shown as an example. In this form, reading areas A to F on which characters are printed are set. The size, font, and the like of the character to be recognized are different for each area, and the size determination is performed for each of the reading areas A to F. The area information is area specifying information for specifying coordinates of this area and size determination data specifying information for specifying a conditional expression for size determination and the like applied to this area. Is stored in

【0034】認識結果格納メモリ23は、各領域の座標
及び、認識部5によって認識された文字座標及び文字コ
ードを格納するものである。判定データ格納メモリ24
は、図4に示すようなサイズ判定データを格納するため
のメモリである。
The recognition result storage memory 23 stores the coordinates of each area and the character coordinates and character codes recognized by the recognition unit 5. Judgment data storage memory 24
Is a memory for storing size determination data as shown in FIG.

【0035】判定結果格納メモリ25は、サイズ判定を
行った結果、最終的に得られた文字コード及びその文字
座標を格納するためのメモリであり、この判定結果格納
メモリ25に格納されるこの文字コード及びその文字座
標は、認識結果格納メモリ23に格納されているデータ
形式と同じ形式で格納される。
The determination result storage memory 25 is a memory for storing a character code and its character coordinates finally obtained as a result of the size determination, and the character code stored in the determination result storage memory 25 is stored. The codes and their character coordinates are stored in the same format as the data format stored in the recognition result storage memory 23.

【0036】参照座標格納メモリ26は、サイズ判定部
6が認識結果格納メモリ23を参照するための参照座標
及び文字位置を格納するためのメモリである。具体例1
では、参照座標として、認識部5によって認識された文
字の文字座標が格納される。文字位置は、認識部5に格
納されている文字のうち、参照する文字の位置を示すデ
ータであり、参照する文字が例えば1文字目のときは1
となる。
The reference coordinate storage memory 26 is a memory for storing reference coordinates and character positions for the size determination unit 6 to refer to the recognition result storage memory 23. Example 1
Here, the character coordinates of the character recognized by the recognition unit 5 are stored as reference coordinates. The character position is data indicating the position of the character to be referenced among the characters stored in the recognition unit 5. For example, when the character to be referenced is the first character, the character position is 1
Becomes

【0037】〈動作〉次に具体例1の動作を説明する。
制御部4は各ブロックを制御して文字の読み取りを実行
する。
<Operation> Next, the operation of the first embodiment will be described.
The control unit 4 controls each block to read characters.

【0038】図6は具体例1の動作を示すフローチャー
トである。ステップ(図中、ステップを「S」と記
す。)1では、画像入力部1が帳票等から画像データを
読み込む。画像データは画像メモリ21に格納され、そ
の領域情報は読み取り領域情報格納メモリ22に格納さ
れる。
FIG. 6 is a flowchart showing the operation of the first embodiment. In step (in the figure, the step is referred to as “S”) 1, the image input unit 1 reads image data from a form or the like. The image data is stored in the image memory 21, and its area information is stored in the read area information storage memory 22.

【0039】制御部4は、読み取り領域情報格納メモリ
22に領域情報が格納されているか否かを判定する(ス
テップ2)。最初は、図5に示すように読み取り領域A
が指定される。認識部5は、画像メモリ21に格納され
ている画像データを参照し、読み取り領域Aの領域指定
情報に基づいてこの読み取り領域A内の画像イメージに
対して行の切り出し、文字の切り出しを行い、各文字の
座標を検出する。そして、この文字の認識を行う。認識
された文字は文字コードに変換され、この文字座標及び
変換された文字コードは認識結果格納メモリ23に格納
される(ステップ3)。
The control section 4 determines whether or not area information is stored in the read area information storage memory 22 (step 2). Initially, as shown in FIG.
Is specified. The recognizing unit 5 refers to the image data stored in the image memory 21 and cuts out lines and characters from the image in the reading area A based on the area designation information of the reading area A. Detect the coordinates of each character. Then, the character is recognized. The recognized character is converted into a character code, and the character coordinates and the converted character code are stored in the recognition result storage memory 23 (step 3).

【0040】サイズ判定部6は、この認識結果に対して
サイズ判定を行う(ステップ4)。図7は、具体例1の
サイズ判定部6が行うサイズ判定処理を示すフローチャ
ートである。ステップ11では、認識結果格納メモリ2
3から判定対象の文字座標及びその文字位置を取得し、
取得した文字座標及び文字位置を参照座標格納メモリ2
6に格納する。尚、最初の文字位置は1である。また、
次の判定対象となる文字の文字座標及び文字位置がなけ
れば、例えば文字座標及び文字位置をすべて0にした
「矩形なし」の情報を参照座標格納メモリ26に格納す
る。
The size judging section 6 judges the size of the recognition result (step 4). FIG. 7 is a flowchart illustrating a size determination process performed by the size determination unit 6 of the first specific example. In step 11, the recognition result storage memory 2
The character coordinates to be determined and their character positions are obtained from 3 and
The obtained character coordinates and character positions are stored in a reference coordinate storage memory 2.
6 is stored. Note that the first character position is 1. Also,
If there is no character coordinate and character position of the next character to be determined, for example, information of “no rectangle” in which the character coordinate and character position are all set to 0 is stored in the reference coordinate storage memory 26.

【0041】ステップ12では、参照座標格納メモリ2
6に格納されている文字座標を参照し、判定対象となる
次の文字座標の有無を判定する。参照座標格納メモリ2
6に「矩形なし」の情報が格納されていなければ、ステ
ップ13に進む。
In step 12, the reference coordinate storage memory 2
6, the presence / absence of the next character coordinate to be determined is determined. Reference coordinate storage memory 2
If the information of “no rectangle” is stored in 6, the process proceeds to step 13.

【0042】ステップ13では、サイズ判定データを用
いて条件計算を行う。サイズ判定の条件は便宜上、数式
によって記述される。次式(1)〜(3)は、そのサイ
ズ判定に用いる条件式の一例である。 (b−t+1)>Wth …(1) (r−l+1)>Hth …(2) t<tmin …(3) 但し、l、r:矩形のx座標 t,b:矩形のy座標 Wth:幅(x)方向の矩形の下限値(例えば40) Hth:高さ(y)方向の矩形の下限値(例えば40) tmin:座標tの最小値(例えば1200)
In step 13, a condition calculation is performed using the size determination data. The size determination condition is described by a mathematical expression for convenience. The following expressions (1) to (3) are examples of conditional expressions used for the size determination. (B−t + 1)> Wth (1) (rl + 1)> Hth (2) t <tmin (3) where 1, r: x coordinate of rectangle t, b: y coordinate of rectangle Wth: width The lower limit of the rectangle in the (x) direction (for example, 40) Hth: The lower limit of the rectangle in the height (y) direction (for example, 40) tmin: The minimum value of the coordinate t (for example, 1200)

【0043】式(1)は文字座標から得られる矩形の高
さ(y方向)による誤読判定条件を示し、式(2)は文
字座標から得られる矩形の幅(x方向)による誤読判定
条件を示し、式(3)は文字座標自体を誤読判定条件に
したものである。
Equation (1) shows the misreading determination condition based on the height (y direction) of the rectangle obtained from the character coordinates, and equation (2) shows the misreading determination condition based on the width (x direction) of the rectangle obtained from the character coordinates. Equation (3) shows that the character coordinates themselves are used as the misreading determination condition.

【0044】尚、次式(4)に示すように、2つ以上の
条件式を論理積(AND)あるいは、論理和(OR)で
複合化してもよい。 (b−t+1)>40 AND(r−l+1)>40 …(4)
Incidentally, as shown in the following expression (4), two or more conditional expressions may be compounded by a logical product (AND) or a logical sum (OR). (Bt + 1)> 40 AND (rl + 1)> 40 (4)

【0045】このサイズ判定データは判定データ格納メ
モリ24に格納されている。読み取り領域情報格納メモ
リ22に格納されているサイズ判定データ指定情報を参
照し、このサイズ判定データ指定情報を用いて読み取り
領域Aに適応したサイズ判定データが指定される。文字
座標は参照座標格納メモリ26から取り出され、この文
字座標にこの読み取り領域Aのサイズ判定データを適用
して誤読判定のための条件計算を行う。
The size determination data is stored in the determination data storage memory 24. With reference to the size determination data specification information stored in the read area information storage memory 22, size determination data adapted to the read area A is specified using the size determination data specification information. The character coordinates are taken out from the reference coordinate storage memory 26, and the size determination data of the reading area A is applied to the character coordinates to calculate a condition for erroneous reading determination.

【0046】この装置には、これらの条件式の真偽を計
算する制御プログラムが格納されている。条件計算は、
まず、図4に示す最初の条件式に文字座標を代入するこ
とにより行われる。計算の結果、偽のとき、即ち、条件
式を満足しないときは、次の条件式に文字座標を代入す
る。このように、順次、文字座標を条件式に代入し、真
になったとき、そこで計算を終了させる。
This device stores a control program for calculating the truth of these conditional expressions. The condition calculation is
First, this is performed by substituting the character coordinates into the first conditional expression shown in FIG. If the result of the calculation is false, that is, if the conditional expression is not satisfied, the character coordinates are substituted into the following conditional expression. In this way, the character coordinates are sequentially substituted into the conditional expression, and when it becomes true, the calculation is terminated there.

【0047】例えば、図2(a)、(b)に示すよう
に、複数の文字に対して抹消線が施されている場合、複
数の文字を丸囲いした場合には、式(1)、(2)を満
足するようになる。また、図2(c)、(d)に示すよ
うに、印字がずれた場合、桁区切りの線が行に含まれて
いる場合には、式(3)を満足するようになる。このよ
うな場合、各条件式の計算結果は真となる。所定の条件
式の計算結果が真となったとき、誤読の可能性があると
判定され、それ以上の条件計算は行わない。
For example, as shown in FIGS. 2 (a) and 2 (b), when a plurality of characters are struck through, and when a plurality of characters are circled, equation (1) (2) is satisfied. Further, as shown in FIGS. 2C and 2D, when printing is shifted or when a line for separating digits is included in the line, the expression (3) is satisfied. In such a case, the calculation result of each conditional expression is true. When the calculation result of the predetermined conditional expression becomes true, it is determined that there is a possibility of misreading, and no further conditional calculation is performed.

【0048】一方、すべての条件式についての計算結果
が偽となったとき、このサイズ判定データによる条件計
算は偽となる。このときは、誤読の可能性はないと判定
される。この計算結果は、判定結果格納メモリ25に格
納される。
On the other hand, when the calculation results for all the conditional expressions become false, the condition calculation based on the size determination data becomes false. At this time, it is determined that there is no possibility of misreading. This calculation result is stored in the determination result storage memory 25.

【0049】ステップ14では、まず、計算結果の真偽
を判別する。計算結果が偽のときは、ステップ15に進
む。ステップ15では、偽となった文字の文字位置を参
照座標格納メモリ26から取得し、誤読の可能性はない
と判定されているので、認識結果格納メモリ23に格納
されているその文字位置の文字座標及び文字コードをそ
のまま判定結果格納メモリ25へコピーする。また、ス
テップ14において、条件計算の結果が真となったとき
は、ステップ16に進む。
In step 14, first, it is determined whether the calculation result is true or false. When the calculation result is false, the process proceeds to step 15. In step 15, the character position of the false character is acquired from the reference coordinate storage memory 26, and it is determined that there is no possibility of misreading. Therefore, the character position of the character position stored in the recognition result storage memory 23 is determined. The coordinates and the character code are directly copied to the determination result storage memory 25. If the result of the condition calculation is true in step 14, the process proceeds to step 16.

【0050】ステップ16では、処理方法を判別する。
例えば、図4において、認識対象文字の文字座標が条件
式2を満足することにより計算結果が偽になったとき、
処理方法は未処理となる。
In step 16, the processing method is determined.
For example, in FIG. 4, when the character coordinate of the recognition target character satisfies conditional expression 2, and the calculation result becomes false,
The processing method is unprocessed.

【0051】処理方法が未処理のときは、ステップ15
に進み、予め設定された指定条件を満足する文字を不読
や削除などの処理から除外するために認識結果格納メモ
リ23に格納されているその文字位置の文字座標及び文
字コードをそのまま判定結果格納メモリ25へコピーす
る。
If the processing method is unprocessed, step 15
The character coordinates and character codes of the character positions stored in the recognition result storage memory 23 are stored as they are in the recognition result storage memory 23 in order to exclude characters satisfying the preset designated conditions from processing such as unreading or deletion. Copy to memory 25.

【0052】また、条件式1を満足することにより計算
結果が偽になったとき、処理方法は不読となる。処理方
法が不読のときは、ステップ17に進み、その文字の文
字位置を参照座標格納メモリ26から取得し、認識結果
格納メモリ23に格納されているその文字位置の文字座
標を判定結果格納メモリ25へコピーし、その文字の文
字コードを、例えば「?」などの認識結果として含まれ
るべきでない文字に置換して判定結果格納メモリ25に
格納する。従って、オペレータは、この文字を視認する
ことにより誤読の可能性を一目で識別できる。また、処
理方法が削除のときは、例えばゴミ等によってイメージ
化され、誤読されたと考えられる不要な文字あるいは記
号を削除する。
When the calculation result becomes false by satisfying conditional expression 1, the processing method becomes unread. If the processing method is unreadable, the process proceeds to step 17 where the character position of the character is obtained from the reference coordinate storage memory 26, and the character coordinate of the character position stored in the recognition result storage memory 23 is determined. 25, and the character code of the character is replaced with a character that should not be included as a recognition result, such as “?”, And stored in the determination result storage memory 25. Therefore, by visually recognizing this character, the operator can identify the possibility of misreading at a glance. When the processing method is deletion, unnecessary characters or symbols that are imaged by dust or the like and are considered to be erroneously read are deleted.

【0053】最初の文字についてのこのような処理が終
了した後、ステップ11に戻り、次の文字座標及び文字
位置を取得して同じようにステップ12〜17を実行す
る。そして、参照座標格納メモリ26に「矩形なし」の
情報が格納されたときは、ステップ12において、読み
取り領域Aにおいて認識された全ての文字について、サ
イズ判定が行われたと判定し、ステップ2に戻る。この
ような処理は、読み取り領域B〜Fについても行われ、
全ての読み取り領域についてこのような処理が行われた
とき、処理が完了する。
After such processing for the first character is completed, the process returns to step 11 to acquire the next character coordinates and character position and execute steps 12 to 17 in the same manner. Then, when the information “no rectangle” is stored in the reference coordinate storage memory 26, it is determined in step 12 that the size determination has been performed for all the characters recognized in the reading area A, and the process returns to step 2. . Such processing is also performed for the reading areas B to F,
When such processing has been performed for all reading areas, the processing is completed.

【0054】〈具体例1の効果〉以上、説明したように
具体例1によれば、文字認識対象の文字の読み取りを行
うときに、各文字の座標および座標から求められる高さ
や幅等に対してサイズ判定データを設定し、サイズ判定
を行うようにしたので、その文字座標から認識結果の各
文字の誤読の可能性についての評価を適切に行うことが
できる。
<Effects of Specific Example 1> As described above, according to Specific Example 1, when a character to be recognized is read, the coordinates of each character and the height and width obtained from the coordinates are different. Since the size determination data is set and the size determination is performed, it is possible to appropriately evaluate the possibility of misreading of each character of the recognition result from the character coordinates.

【0055】また、処理方法が未処理のときは、予め不
読処理を行わないように設定された指定条件を満足する
ような文字に対しては、未処理とすることにより、この
文字を不読処理、削除処理から除外することができる。
When the processing method is unprocessed, a character satisfying a designated condition set in advance so as not to perform the unread processing is unprocessed so that this character is unprocessed. It can be excluded from reading processing and deletion processing.

【0056】また、認識結果に誤読の可能性が高いと考
えられる文字に対しては、不読処理を行うことにより、
その対象となった文字が「?」のような含まれるべきで
ない文字に置換されるので、オペレータは一目で視認で
き、オペレータによる認識結果の修正作業が容易とな
る。
Also, by performing unread processing on characters that are likely to be misread in the recognition result,
Since the target character is replaced with a character that should not be included, such as "?", The operator can see at a glance, and the operator can easily correct the recognition result.

【0057】また、例えばゴミ等によってイメージ化さ
れて誤読されたと考えられる明らかに不要な文字、記号
に対しては、この文字を削除することにより、オペレー
タによる修正作業の負荷を軽減できる。
For unnecessary characters and symbols which are considered to be erroneously read by being imaged due to dust or the like, for example, by deleting these characters, the burden of correction work by the operator can be reduced.

【0058】さらに、このようなサイズ判定を読み取り
領域毎に行うようにしたので、読み取り領域毎に字体、
文字種、大きさ異なっているような帳票においても各領
域毎に適切な文字認識、サイズ判定を行うことができ、
文字認識精度が向上する。
Further, since such a size determination is performed for each reading area, the font,
Appropriate character recognition and size judgment can be performed for each area even in forms with different character types and sizes,
Character recognition accuracy is improved.

【0059】〈具体例2〉具体例2は、文字座標に基づ
いて3つの文字の前後関係を算出し、この前後関係に対
して誤読判定条件を設定し、サイズ判定を行うようにし
たものである。具体例2の文字読取装置は、具体例1と
同様に、画像入力部1と、表示部2と、入力部3と、制
御部4と、認識部5と、サイズ判定部6と、画像メモリ
21と、読み取り領域情報格納メモリ22と、認識結果
格納メモリ23と、判定データ格納メモリ24と、判定
結果格納メモリ25と、参照座標格納メモリ26と、を
備えて構成されている。
<Specific Example 2> In specific example 2, the context of three characters is calculated based on the character coordinates, an erroneous reading determination condition is set for the context, and the size is determined. is there. As in the specific example 1, the character reading device according to the specific example 2 includes an image input unit 1, a display unit 2, an input unit 3, a control unit 4, a recognition unit 5, a size determination unit 6, an image memory 21, a read area information storage memory 22, a recognition result storage memory 23, a determination data storage memory 24, a determination result storage memory 25, and a reference coordinate storage memory 26.

【0060】但し、参照座標格納メモリ26には3つの
格納エリアが備えられている。図8は、その参照座標格
納メモリ26の説明図である。格納エリアbは、認識対
象である現在文字の文字座標及び文字位置を格納するた
めのエリアであり、格納エリアa,cは、それぞれ現在
文字の1つ前の文字座標及び文字位置、その次の文字の
文字座標及び文字位置を格納するためのエリアである。
尚、具体例1と同一要素については同一符号を付して説
明を省略する。
However, the reference coordinate storage memory 26 has three storage areas. FIG. 8 is an explanatory diagram of the reference coordinate storage memory 26. The storage area b is an area for storing the character coordinates and the character position of the current character to be recognized, and the storage areas a and c are respectively the character coordinates and the character position immediately before the current character, and the next. This is an area for storing character coordinates and character positions of characters.
Note that the same elements as those in the first embodiment are denoted by the same reference numerals, and description thereof is omitted.

【0061】〈動作〉次に具体例2の動作を説明する。
具体例2においても、具体例1と同様に、図6のフロー
チャートを実行し、ステップ4においてサイズ判定処理
を実施する。
<Operation> Next, the operation of the embodiment 2 will be described.
Also in the specific example 2, similarly to the specific example 1, the flowchart of FIG. 6 is executed, and the size determination process is performed in step 4.

【0062】図9は具体例2のサイズ判定処理を示すフ
ローチャートである。ステップ21では、先頭文字の文
字座標及び文字位置を取得する。取得した文字座標及び
文字位置は参照座標格納メモリ26の格納エリアcに格
納され、格納エリアa、bにはともに「矩形なし」の情
報が格納される。
FIG. 9 is a flowchart showing the size determination processing of the second embodiment. In step 21, the character coordinates and character position of the first character are obtained. The acquired character coordinates and character positions are stored in the storage area c of the reference coordinate storage memory 26, and information of "no rectangle" is stored in both the storage areas a and b.

【0063】ステップ22では、次の文字の文字座標及
び文字位置を取得する。次の文字座標及び文字位置が取
得されたとき、参照座標格納メモリ26の格納エリアc
に格納されていた先頭文字の文字座標及び文字位置は格
納エリアbに格納され、取得した次の文字座標及び文字
位置が格納エリアcに格納される。
In step 22, the character coordinates and character position of the next character are obtained. When the next character coordinate and character position are obtained, the storage area c of the reference coordinate storage memory 26
Are stored in the storage area b, and the acquired next character coordinates and character position are stored in the storage area c.

【0064】以後、文字座標及び文字位置を取得する毎
に、格納エリアb,cに格納されている文字座標及び文
字位置をそれぞれ格納エリアa,bに格納し、取得した
文字座標及び文字位置を格納エリアcに格納する。
Thereafter, each time the character coordinates and the character position are obtained, the character coordinates and the character position stored in the storage areas b and c are stored in the storage areas a and b, respectively. Store in storage area c.

【0065】尚、次にサイズ判定を行う文字の文字座標
及び文字位置がなければ、例えば文字座標及び文字位置
をすべて0にした「矩形なし」の情報を格納エリアcに
格納する。
If there is no character coordinate and character position of the character whose size is to be determined next, for example, information of "no rectangle" in which the character coordinate and character position are all 0 is stored in the storage area c.

【0066】ステップ23では、判定対象の現在の文字
の有無を判定する。格納エリアbに「矩形なし」の情報
が格納されていないときは、判定対象の現在の文字があ
ると判定してステップ24に進む。
In step 23, it is determined whether there is a current character to be determined. When the information of “no rectangle” is not stored in the storage area b, it is determined that there is a current character to be determined, and the process proceeds to step 24.

【0067】ステップ24では、3つの文字の文字座標
に対し、サイズ判定データを用いて条件計算を行う。図
10は具体例2の説明図である。3つの文字座標を図1
0(a)に示すように設定する。この3つの文字座標か
ら文字間の間隔を算出し、この間隔に誤読判定条件とし
てのサイズ判定データを適用してサイズ判定を行う。式
(5)、(6)は、サイズ判定データとしての条件式の
一例である。 l−pr−1=0 …(5) nl−r−1=0 …(6)
In step 24, condition calculation is performed on the character coordinates of the three characters using the size determination data. FIG. 10 is an explanatory diagram of the specific example 2. Figure 1 shows three character coordinates
Set as shown in FIG. An interval between characters is calculated from the three character coordinates, and size determination is performed by applying size determination data as an erroneous reading determination condition to the interval. Expressions (5) and (6) are examples of conditional expressions as size determination data. l-pr-1 = 0 (5) nl-r-1 = 0 (6)

【0068】式(5)は、図10(b)に示すように、
現在の文字と前の文字の間隔が0となる条件式であり、
式(6)は、図10(c)に示すように、現在の文字と
次の文字の間隔が0となる条件式である。
The equation (5) is obtained as shown in FIG.
This is a conditional expression in which the interval between the current character and the previous character is 0,
Expression (6) is a conditional expression in which the interval between the current character and the next character is 0, as shown in FIG.

【0069】尚、式(5)及び(6)を具体例1と同様
に論理積(AND)あるいは論理和(OR)で複合化し
てもよい。また、3つの文字の前後関係は各文字の間隔
に限られるものではなく、3つの文字の大きさの関係等
を条件にしてもよい。
Expressions (5) and (6) may be compounded by logical product (AND) or logical sum (OR) as in the first embodiment. The order of the three characters is not limited to the interval between the characters, but may be based on the size of the three characters.

【0070】このサイズ判定データは判定データ格納メ
モリ24に格納されており、具体例1と同じように、読
み取り領域情報格納メモリ22に格納されているサイズ
判定データ指定情報を参照し、このサイズ判定データ指
定情報を用いて図5に示す読み取り領域Aに適応したサ
イズ判定データを指定し、参照座標格納メモリ26から
3つの文字座標を取り出して、この読み取り領域Aのサ
イズ判定データを適用して誤読判定のための条件計算を
行う。
The size determination data is stored in the determination data storage memory 24. As in the first embodiment, the size determination data is referred to the size determination data designation information stored in the read area information storage memory 22, and the size determination data is stored. Using the data designation information, size determination data adapted to the reading area A shown in FIG. 5 is designated, three character coordinates are extracted from the reference coordinate storage memory 26, and erroneous reading is performed by applying the size determination data of the reading area A. The condition calculation for the judgment is performed.

【0071】条件計算の方法は具体例1と同様であり、
計算結果は判定結果格納メモリ25に格納される。但
し、参照座標格納メモリ26の格納エリアa、または格
納エリアcに「矩形なし」の情報が格納されているとき
は、その条件式の計算結果は偽となる。
The method of calculating the condition is the same as that of the first embodiment.
The calculation result is stored in the determination result storage memory 25. However, when the information “no rectangle” is stored in the storage area a or the storage area c of the reference coordinate storage memory 26, the calculation result of the conditional expression is false.

【0072】ステップ25では、計算結果の真偽を判別
する。計算結果が偽のときは、どの条件式にも該当しな
いので誤読の可能性はないと判定し、ステップ26に進
んで参照座標格納メモリ26の格納エリアbに格納され
ている文字位置を取得し、具体例1と同様に認識結果格
納メモリ23に格納されているその文字位置の文字座標
及び文字コードを判定結果格納メモリ25にそのままコ
ピーする。
In step 25, it is determined whether the calculation result is true or false. If the calculation result is false, it does not correspond to any of the conditional expressions, so it is determined that there is no possibility of erroneous reading, and the process proceeds to step 26 to obtain the character position stored in the storage area b of the reference coordinate storage memory 26. The character coordinates and the character code of the character position stored in the recognition result storage memory 23 are copied to the determination result storage memory 25 as they are in the same manner as in the first embodiment.

【0073】また、計算結果が真のときは、誤読の可能
性があると判定し、ステップ27に進んで条件式に対応
する処理方法を判別し、処理方法が未処理のときは、格
納エリアbに格納されている現在の文字の文字座標及び
文字コードをそのまま判定結果格納メモリ25へコピー
する(ステップ26)。
If the result of the calculation is true, it is determined that there is a possibility of erroneous reading, and the process proceeds to step 27 to determine the processing method corresponding to the conditional expression. The character coordinates and character code of the current character stored in b are directly copied to the determination result storage memory 25 (step 26).

【0074】処理方法が不読のときは、ステップ28に
進み、その文字の文字位置を参照座標格納メモリ26か
ら取得し、認識結果格納メモリ23に格納されているそ
の文字位置の文字座標を判定結果格納メモリ25へコピ
ーし、その文字の文字コードを、例えば「?」などのよ
うに認識結果として含まれるべきでない文字に置換して
判定結果格納メモリ25に格納する。そして、処理方法
が削除のときは、不要と考えられる文字あるいは記号を
削除する。
If the processing method is unreadable, the process proceeds to step 28, where the character position of the character is obtained from the reference coordinate storage memory 26, and the character coordinate of the character position stored in the recognition result storage memory 23 is determined. The result is copied to the result storage memory 25, and the character code of the character is replaced with a character that should not be included as a recognition result, such as “?”, And stored in the determination result storage memory 25. When the processing method is deletion, characters or symbols considered unnecessary are deleted.

【0075】このような処理を全ての文字について行
い、全ての文字についてサイズ判別が行われたとき(ス
テップ23)、このサイズ判定処理を終了させ、全ての
読み取り領域についてこのような処理が行われたとき
(ステップ2)、処理が完了する。
When such processing is performed for all characters and the size determination is performed for all characters (step 23), the size determination processing is terminated, and such processing is performed for all reading areas. (Step 2), the process is completed.

【0076】〈具体例2の効果〉以上、説明したように
具体例2によれば、3つの文字の前後関係に対してサイ
ズ判定を行うようにしたので、具体例1と同様の効果が
得られるだけでなく、誤読の可能性を、より的確に判別
することができる。
<Effects of Specific Example 2> According to the specific example 2, as described above, the size is determined with respect to the context of three characters, so that the same effect as that of the specific example 1 is obtained. In addition, the possibility of misreading can be determined more accurately.

【0077】〈具体例3〉具体例3は、文字座標に基づ
いて算出された現在文字の行位置、文字位置、行先頭か
らの文字位置、その行の文字数に誤読判定条件を設定
し、サイズ判定を行うようにしたものである。
<Specific Example 3> In specific example 3, an erroneous reading determination condition is set for the line position of the current character, the character position, the character position from the head of the line, and the number of characters in the line, which are calculated based on the character coordinates. The judgment is made.

【0078】図11は、具体例3の構成を示すブロック
図である。具体例3の文字読取装置は、画像入力部1
と、表示部2と、入力部3と、制御部4と、認識部5
と、サイズ判定部6と、画像メモリ21と、読み取り領
域情報格納メモリ22と、認識結果格納メモリ23と、
判定データ格納メモリ24と、判定結果格納メモリ25
と、参照座標格納メモリ26と、関連情報格納メモリ2
7と、を備えて構成されている。
FIG. 11 is a block diagram showing the configuration of the third embodiment. The character reading device according to the third embodiment includes an image input unit 1
, Display unit 2, input unit 3, control unit 4, recognition unit 5
A size determination unit 6, an image memory 21, a read area information storage memory 22, a recognition result storage memory 23,
Determination data storage memory 24 and determination result storage memory 25
, Reference coordinate storage memory 26, and related information storage memory 2
7 are provided.

【0079】この関連情報格納メモリ27は、現在文字
に関する情報として、現在文字の行位置、文字位置、行
先頭からの文字位置およびその行の文字数などの関連情
報を格納するメモリである。
The related information storage memory 27 is a memory for storing related information such as the line position of the current character, the character position, the character position from the head of the line, and the number of characters in the line as information on the current character.

【0080】図12は具体例3の関連情報の説明図であ
る。この行位置L、文字位置I、行先頭からの文字位置
LI、その行の文字数LNは1以上の値とする。尚、具
体例1及び具体例2と同一要素については同一符号を付
して説明を省略する。
FIG. 12 is an explanatory diagram of the related information of the third embodiment. The line position L, the character position I, the character position LI from the head of the line, and the number LN of characters in the line are values of 1 or more. Note that the same reference numerals are given to the same elements as those in the first and second examples, and the description will be omitted.

【0081】〈動作〉次に具体例3の動作を説明する。
具体例3においても、具体例1と同様に、図6のフロー
チャートを実行し、ステップ4においてサイズ判定処理
を実施する。
<Operation> Next, the operation of the embodiment 3 will be described.
In the specific example 3, as in the specific example 1, the flowchart of FIG. 6 is executed, and the size determination process is performed in the step 4.

【0082】図13は具体例3のサイズ判定処理を示す
フローチャートである。ステップ31〜33では、具体
例2のステップ21〜23と同様に先頭文字及び次の文
字の文字座標及び文字位置を取得し、それぞれ参照座標
格納メモリ26の格納エリアb,cに格納し、ステップ
34に進む。
FIG. 13 is a flowchart showing the size determination processing of the third embodiment. In steps 31 to 33, the character coordinates and the character position of the first character and the next character are acquired and stored in the storage areas b and c of the reference coordinate storage memory 26, respectively, as in steps 21 to 23 of the specific example 2. Proceed to 34.

【0083】ステップ34では、判定対象である現在文
字の関連情報を設定する。即ち、認識結果格納メモリ2
3を参照し、図12に示すように、判定対象の文字につ
いての行位置L、文字位置L、行先頭からの文字位置L
I、その行の文字数LN等を取得する。そして、これら
の関連情報を関連情報メモリS13に格納する。
In step 34, related information of the current character to be determined is set. That is, the recognition result storage memory 2
3, the line position L, the character position L, and the character position L from the head of the line for the character to be determined as shown in FIG.
I, the number of characters LN in the line, etc. are obtained. Then, the related information is stored in the related information memory S13.

【0084】ステップ35では、判定対象である現在の
文字の文字座標及びその関連情報に対し、サイズ判定デ
ータを用いて条件計算を行う。式(7)、(8)は、サ
イズ判定データとしての条件式の一例である。 I=2 …(7) LN = 3 …(8) 式(7)は2文字目の場合の条件式であり、式(8)は
行文字数が3の場合の条件式である。
In step 35, a condition calculation is performed on the character coordinates of the current character to be determined and its related information using the size determination data. Expressions (7) and (8) are examples of conditional expressions as size determination data. I = 2 ... (7) LN = 3 ... (8) Expression (7) is a conditional expression for the second character, and Expression (8) is a conditional expression for the case where the number of line characters is three.

【0085】尚、具体例1、2と同様に、これら2つの
条件式を論理積(AND)あるいは論理和(OR)で複
合化してもよい。このサイズ判定データは判定データ格
納メモリ24に格納されており、具体例1、2と同じよ
うに、読み取り領域情報格納メモリ22に格納されてい
るサイズ判定データ指定情報を参照し、このサイズ判定
データ指定情報を用いて読み取り領域に適応したサイズ
判定データを指定し、参照座標格納メモリ26から3つ
の文字座標を取り出して、この読み取り領域のサイズ判
定データを適用して誤読判定のための条件計算を行う。
As in the first and second embodiments, these two conditional expressions may be combined with a logical product (AND) or a logical sum (OR). The size determination data is stored in the determination data storage memory 24. As in the first and second examples, the size determination data is referred to the size determination data designation information stored in the read area information storage memory 22. The size determination data adapted to the reading area is specified using the specification information, the three character coordinates are extracted from the reference coordinate storage memory 26, and the size calculation data for the reading area is applied to calculate the condition for erroneous reading determination. Do.

【0086】条件計算の方法は具体例1と同様であり、
計算結果は判定結果格納メモリ25に格納される。但
し、具体例2と同様に、参照座標格納メモリ26の格納
エリアa、または格納エリアcに「矩形なし」の情報が
格納されているときは、その条件式の計算結果は偽とな
る。そして、ステップ36〜39では、具体例1,2と
同様に後処理を行う。
The condition calculation method is the same as that of the first embodiment.
The calculation result is stored in the determination result storage memory 25. However, as in the specific example 2, when the information “no rectangle” is stored in the storage area a or the storage area c of the reference coordinate storage memory 26, the calculation result of the conditional expression is false. Then, in steps 36 to 39, post-processing is performed as in the first and second specific examples.

【0087】このような処理を全ての文字について行
い、全ての文字についてサイズ判別が行われたとき(ス
テップ33)、このサイズ判定処理を終了させ、全ての
読み取り領域についてこのような処理が行われたとき
(ステップ2)、処理が完了する。
When such processing is performed for all characters and the size determination is performed for all characters (step 33), the size determination processing is terminated, and such processing is performed for all reading areas. (Step 2), the process is completed.

【0088】〈具体例3の効果〉以上、説明したように
具体例3によれば、現在文字と前後の文字との位置関係
だけでなく、現在文字の関連情報として行位置L、文字
位置L、行先頭からの文字位置LI、その行の文字数L
Nに対してサイズ判定を行うようにしたので、具体例
1,2の効果が得られるとともに、特定の行や文字につ
いて処理条件を設定でき、行切り出し処理や文字切り出
し処理の誤りによる誤読や不要な文字への、より的確な
処理を適用することができる。
<Effects of Specific Example 3> As described above, according to Specific Example 3, not only the positional relationship between the current character and the preceding and following characters but also the line position L and the character position L as related information of the current character. , Character position LI from the beginning of the line, number of characters L in the line
Since the size determination is performed for N, the effects of the specific examples 1 and 2 can be obtained, and the processing conditions can be set for a specific line or character. More accurate processing can be applied to a proper character.

【0089】〈具体例4〉具体例4は、文字座標に基づ
いて3つの文字の行座標を算出し、この行座標に誤読判
定条件を設定し、サイズ判定を行うようにしたものであ
る。
<Example 4> In Example 4, the line coordinates of three characters are calculated based on the character coordinates, an erroneous reading judgment condition is set for the line coordinates, and the size judgment is performed.

【0090】具体例4の文字読取装置は、具体例3と同
様に、画像入力部1と、表示部2と、入力部3と、制御
部4と、認識部5と、サイズ判定部6と、画像メモリ2
1と、読み取り領域情報格納メモリ22と、認識結果格
納メモリ23と、判定データ格納メモリ24と、判定結
果格納メモリ25と、参照座標格納メモリ26と、関連
情報格納メモリ27と、を備えて構成されている。尚、
具体例1〜3と同一要素については同一符号を付して説
明を省略する。
The character reading apparatus according to the fourth embodiment has an image input unit 1, a display unit 2, an input unit 3, a control unit 4, a recognizing unit 5, a size determining unit 6 similar to the third embodiment. , Image memory 2
1, a read area information storage memory 22, a recognition result storage memory 23, a determination data storage memory 24, a determination result storage memory 25, a reference coordinate storage memory 26, and a related information storage memory 27. Have been. still,
The same elements as those in the first to third examples are denoted by the same reference numerals, and description thereof will be omitted.

【0091】〈動作〉次に具体例4の動作を説明する。
具体例4においても、具体例1と同様に、図6のフロー
チャートを実行し、ステップ4においてサイズ判定処理
を実施する。
<Operation> Next, the operation of the embodiment 4 will be described.
In the specific example 4, similarly to the specific example 1, the flowchart of FIG. 6 is executed, and the size determination process is performed in the step 4.

【0092】図14は具体例4のサイズ判定処理を示す
フローチャートである。ステップ41では、先頭行の矩
形領域を作成する。図15は具体例4の行座標の作成方
法を示す説明図である。この図15に示すように、破線
で示す矩形領域、、はそれぞれ1つの文字を囲む
矩形領域を示す。
FIG. 14 is a flowchart showing the size determination processing of the fourth embodiment. In step 41, a rectangular area in the first row is created. FIG. 15 is an explanatory diagram illustrating a method of creating row coordinates according to the fourth embodiment. As shown in FIG. 15, rectangular areas indicated by broken lines indicate rectangular areas each surrounding one character.

【0093】矩形領域〜は例えば、以下の文字座標
によって表す。 矩形領域の文字座標:(pl,pt)−(pr,pb) 矩形領域の文字座標:(l,t)−(r,b) 矩形領域の文字座標:(nl,nt)−(nr,nb)
The rectangular area is represented by the following character coordinates, for example. Character coordinates of rectangular area: (pl, pt)-(pr, pb) Character coordinates of rectangular area: (l, t)-(r, b) Character coordinates of rectangular area: (nl, nt)-(nr, nb )

【0094】先頭行の行座標を作成するには、この全文
字を含むようにして最小の矩形領域を設定する。この
矩形領域〜の文字座標を認識結果格納メモリ23か
ら取り出して、行座標(nl,pt)−(nr,b)が作成され
る。
To create the line coordinates of the first line, a minimum rectangular area is set so as to include all the characters. The character coordinates of this rectangular area are extracted from the recognition result storage memory 23, and line coordinates (nl, pt)-(nr, b) are created.

【0095】また、この行の最終文字の文字位置をこの
行の文字位置として、作成された先頭行の行座標(nl,p
t)−(nr,b)及びこの文字位置を参照座標格納メモリ
26の格納エリアcに格納し、格納エリアa,bには
「矩形なし」の情報を格納する。
The character position of the last character of this line is set as the character position of this line, and the line coordinates (nl, p
t)-(nr, b) and this character position are stored in the storage area c of the reference coordinate storage memory 26, and the information of "no rectangle" is stored in the storage areas a and b.

【0096】ステップ42では、ステップ41と同様
に、次の行の矩形領域を作成する。次の行の矩形領域が
作成されたとき、参照座標格納メモリ26の格納エリア
cに格納されていた先頭行の行座標及びその行の最終文
字の文字位置は格納エリアbに格納され、作成された次
の行座標及びその行の最終文字の文字位置が格納エリア
cに格納される。
At step 42, as in step 41, a rectangular area of the next row is created. When the rectangular area of the next row is created, the row coordinates of the first row stored in the storage area c of the reference coordinate storage memory 26 and the character position of the last character of the row are stored and created in the storage area b. The next line coordinate and the character position of the last character of the line are stored in the storage area c.

【0097】以後、行座標が作成される毎に、格納エリ
アb,cに格納されているデータをそれぞれ格納エリア
a,bに格納し、作成した文字座標及び文字位置を格納
エリアcに格納する。
Thereafter, every time row coordinates are created, data stored in storage areas b and c are stored in storage areas a and b, respectively, and the created character coordinates and character positions are stored in storage area c. .

【0098】尚、次にサイズ判定を行うべき行の行座標
がなければ、例えば行座標及びその行の最終文字の文字
位置をすべて0にした「矩形なし」の情報を格納エリア
cに格納する。
If there is no line coordinate of the line for which the size determination is to be performed next, for example, the information of "no rectangle" in which the line coordinates and the character position of the last character of the line are all 0 is stored in the storage area c. .

【0099】ステップ43では、判定対象である現在の
行の有無を判定する。格納エリアbに「矩形なし」の情
報が格納されていないときは、判定対象の現在の行があ
ると判定してステップ44に進む。
In step 43, it is determined whether there is a current line to be determined. When the information of “no rectangle” is not stored in the storage area b, it is determined that there is a current line to be determined, and the process proceeds to step 44.

【0100】ステップ44では、判定対象の現在行の関
連情報を設定する。即ち、現在行の最終文字を参照座標
格納メモリ26の格納エリアbから取得し、その文字位
置の文字に関して認識結果格納メモリ23を参照し、そ
の行位置L、文字位置L、行先頭からの文字位置LI、
その行の文字数LN等を取得する。そして、これらの関
連情報を関連情報メモリS13に格納する。
In step 44, related information of the current line to be determined is set. That is, the last character of the current line is acquired from the storage area b of the reference coordinate storage memory 26, the character at that character position is referred to the recognition result storage memory 23, and the line position L, character position L, character from the line head, Position LI,
The number of characters LN and the like in the line are acquired. Then, the related information is stored in the related information memory S13.

【0101】ステップ45では、現在行及びその関連情
報に対し、サイズ判定データを用いて条件計算を行う。
条件式については、現在行の位置関係、現在行の大きさ
等について設定することができる。また、具体例1〜3
と同様に、2つの条件式を論理積(AND)あるいは論
理和(OR)で複合化してもよい。
In step 45, condition calculation is performed on the current line and its related information using the size determination data.
As for the conditional expression, the positional relationship of the current line, the size of the current line, and the like can be set. Further, specific examples 1 to 3
Similarly to the above, two conditional expressions may be compounded by a logical product (AND) or a logical sum (OR).

【0102】サイズ判定データは判定データ格納メモリ
24に格納されており、具体例1〜3と同じように、読
み取り領域情報格納メモリ22に格納されているサイズ
判定データ指定情報を参照し、このサイズ判定データ指
定情報を用いて読み取り領域に適応したサイズ判定デー
タを指定し、参照座標格納メモリ26から3つの文字座
標を取り出して、この読み取り領域のサイズ判定データ
を適用して誤読判定のための条件計算を行う。
The size determination data is stored in the determination data storage memory 24. As in the first to third examples, the size determination data is referred to the size determination data designation information stored in the read area information storage memory 22, and the size determination data is stored. The size determination data adapted to the reading area is specified using the determination data specification information, the three character coordinates are extracted from the reference coordinate storage memory 26, and the size determination data of the reading area is applied to determine the condition for erroneous reading determination. Perform calculations.

【0103】サイズ判定データには、具体例1(図4)
と同じような条件式とそれに対応した処理方法が含まれ
ている。条件計算の方法は具体例1と同様であり、計算
結果は判定結果格納メモリ25に格納される。
Specific example 1 (FIG. 4) is included in the size determination data.
And a processing method corresponding to the conditional expression. The condition calculation method is the same as that of the first embodiment, and the calculation result is stored in the determination result storage memory 25.

【0104】但し、具体例2と同様に、参照座標格納メ
モリ26の格納エリアa、または格納エリアcに「矩形
なし」の情報が格納されているときは、その条件式の計
算結果は偽となる。
However, as in the specific example 2, when the information “no rectangle” is stored in the storage area a or the storage area c of the reference coordinate storage memory 26, the calculation result of the conditional expression is false. Become.

【0105】ステップ46では、計算結果を判別し、計
算結果が偽のときは、ステップ47に進む。ステップ4
7では、関連情報格納メモリ27から現在行の文字位置
I、即ち、現在行の最終文字位置とその行の文字数LN
を取得し、この行の開始文字位置(I−LN+1)から
最終文字位置Iまでの文字座標及び文字コードを認識結
果格納メモリ23から判定結果格納メモリ25へそのま
まコピーする。
At step 46, the calculation result is determined. If the calculation result is false, the process proceeds to step 47. Step 4
7, the character position I of the current line from the related information storage memory 27, that is, the last character position of the current line and the number of characters LN of the line
Is obtained, and the character coordinates and the character code from the start character position (I-LN + 1) to the last character position I of this line are directly copied from the recognition result storage memory 23 to the determination result storage memory 25.

【0106】また、計算結果が真のときは、誤読の可能
性があると判定してステップ48に進んで条件式に対応
する処理方法を判別する。処理方法が未処理のときは、
ステップ47に進み、判定結果が偽のときと同じ処理を
行う。処理方法が不読のときは、ステップ49に進む。
If the result of the calculation is true, it is determined that there is a possibility of erroneous reading, and the routine proceeds to step 48, where a processing method corresponding to the conditional expression is determined. If the processing method is unprocessed,
Proceeding to step 47, the same processing as when the determination result is false is performed. If the processing method is unread, the process proceeds to step 49.

【0107】ステップ49では、関連情報格納メモリ2
7から現在行の文字位置I、即ち、最終文字位置とその
行の文字数LNを取得し、この行の開始文字位置(I−
LN+1)から最終文字位置Iまでの文字座標を認識結
果格納メモリ23から判定結果格納メモリ25へコピー
し、文字コードを、例えば「?」などのように認識結果
として含まれるべきでない文字に置換して判定結果格納
メモリ25に格納する。処理方法が削除のときは、その
文字を削除する。
In step 49, the related information storage memory 2
7, the character position I of the current line, that is, the last character position and the number of characters LN of the line are obtained, and the start character position (I-
The character coordinates from (LN + 1) to the final character position I are copied from the recognition result storage memory 23 to the determination result storage memory 25, and the character code is replaced with a character that should not be included as a recognition result, such as "?" Stored in the determination result storage memory 25. If the processing method is delete, the character is deleted.

【0108】このような処理を全ての行について行い、
全ての行についてサイズ判別が行われたとき(ステップ
43)、このサイズ判定処理を終了させ、全ての読み取
り領域についてこのような処理が行われたとき(ステッ
プ2)、処理が完了する。
This process is performed for all rows.
When the size determination is performed on all the rows (step 43), the size determination process is terminated, and when such a process is performed on all the read areas (step 2), the process is completed.

【0109】〈具体例4の効果〉以上、説明したように
具体例4によれば、現在行前後の位置関係を算出し、こ
の位置関係に対してサイズ判定を行うようにしたので、
行単位で行の切り出し処理や文字の切り出し処理の誤り
を判別し、後処理を行うことができる。
<Effects of Specific Example 4> As described above, according to Specific Example 4, the positional relationship before and after the current line is calculated, and the size is determined based on this positional relationship.
Post-processing can be performed by determining an error in the line cutout process or the character cutout process in line units.

【0110】〈具体例5〉具体例5は、同一行で同じ位
置条件の文字が連続したとき、これらの文字をブロック
にまとめ、ブロック単位でサイズ判定を行うようにした
ものである。
<Example 5> In Example 5, when characters having the same position condition are consecutive on the same line, these characters are combined into blocks, and the size is determined for each block.

【0111】具体例5の関連情報格納メモリ27には、
前後の文字間隔に基づいてブロックにまとめるための条
件式が格納されている。例えば、文字位置i,i+1の
文字座標をそれぞれ(L(i),T(i))−(R(i),B
(i))、文字座標(L(i+1),T(i+1))−(R(i+1),B
(i+1))とすると、間隔Dは以下の式(9)によって計
算される。 D=L(i+1)−R(i)−1 …(9)
In the related information storage memory 27 of the fifth embodiment,
A conditional expression for grouping into blocks based on the preceding and following character intervals is stored. For example, the character coordinates of the character positions i and i + 1 are represented by (L (i), T (i))-(R (i), B
(i)), character coordinates (L (i + 1), T (i + 1))-(R (i + 1), B
(i + 1)), the interval D is calculated by the following equation (9). D = L (i + 1) -R (i) -1 (9)

【0112】式(10)〜(15)は、間隔Dに基づい
てブロックを作成する条件を示す式である。 D=Dthl …(10) D≠Dthl …(11) D<Dthl …(12) D≦Dthl …(13) D>Dthl …(14) D≧Dthl …(15) 但し、Dthl:所定値
Expressions (10) to (15) are expressions showing conditions for creating a block based on the interval D. D = Dthl (10) D ≠ Dthl (11) D <Dthl (12) D ≦ Dthl (13) D> Dthl (14) D ≧ Dthl (15) where Dthl: predetermined value

【0113】これらの式(10)〜(15)が関連情報
格納メモリ27に格納されている。具体例5の判定デー
タ格納メモリ24には、このブロックに対して適用され
るサイズ判定データが格納されている。
The equations (10) to (15) are stored in the related information storage memory 27. The determination data storage memory 24 of the specific example 5 stores the size determination data applied to this block.

【0114】図16は具体例5のサイズ判定データの一
例を示す説明図である。具体例5の参照座標格納メモリ
26は、具体例2と同様に3つの格納エリアa〜cを有
している。尚、具体例1〜4と同一要素については同一
符号を付して説明を省略する。
FIG. 16 is an explanatory diagram showing an example of the size determination data of the specific example 5. The reference coordinate storage memory 26 of the specific example 5 has three storage areas a to c as in the specific example 2. In addition, the same reference numerals are given to the same elements as those in the specific examples 1 to 4, and the description is omitted.

【0115】〈動作〉次に具体例5の動作を説明する。
具体例5においても、具体例1と同様に、図6のフロー
チャートを実行し、ステップ4においてサイズ判定処理
を実施する。
<Operation> Next, the operation of the embodiment 5 will be described.
In the specific example 5, as in the specific example 1, the flowchart of FIG. 6 is executed, and the size determination process is performed in the step 4.

【0116】図17は具体例5のサイズ判定処理を示す
フローチャートである。ステップ51では、認識結果格
納メモリ23から取得したその領域の文字を先頭から参
照して、その間隔Dを計算し、条件式(10)〜(1
5)を評価して、いずれかの条件が同一行で連続して該
当するときは、これらの文字を含む最小の矩形領域を1
つのブロックとする。
FIG. 17 is a flowchart showing the size determination processing of the fifth embodiment. In step 51, the interval D is calculated by referring to the character of the area acquired from the recognition result storage memory 23 from the top, and the conditional expressions (10) to (1)
5) is evaluated, and if any of the conditions is successively satisfied on the same line, the smallest rectangular area including these characters is set to 1
One block.

【0117】図18はこのブロックの説明図である。こ
の図18に示すように、同一行に文字P,Q,Rが並ん
でいる場合、文字P,Qの間隔Dは、前述のように式
(9)によって表される。
FIG. 18 is an explanatory diagram of this block. As shown in FIG. 18, when characters P, Q, and R are arranged on the same line, the interval D between the characters P and Q is expressed by Expression (9) as described above.

【0118】例えば、文字P,Qの間隔Dが式(10)
〜(15)のいずれか1つに該当しているときは文字
P,Qが1つのブロックにまとめられる。図18の破線
で示す領域がこのようにして作成された1つのブロック
を示す。
For example, the interval D between the characters P and Q is given by the following equation (10).
If any one of (15) to (15) is satisfied, the characters P and Q are combined into one block. The area shown by the broken line in FIG. 18 shows one block created in this way.

【0119】尚、文字が、図15に示すように領域、
、に印字されているときは、実線で示す領域が最
小の矩形領域となり、これが1つのブロックになる。こ
のブロックはブロック座標(L(i),T(i))−(R(i+
1),B(i+1))によって特定される。
Note that, as shown in FIG.
, The area indicated by the solid line is the minimum rectangular area, which is one block. This block is represented by block coordinates (L (i), T (i))-(R (i +
1), B (i + 1)).

【0120】まず、最初、参照座標格納メモリ26の格
納エリアa、bには、「矩形なし」の情報を格納し、格
納エリアcにこの先頭ブロックのブロック座標をそのブ
ロックの最終文字位置とともに格納する。
First, information of "no rectangle" is stored in the storage areas a and b of the reference coordinate storage memory 26, and the block coordinates of the first block are stored together with the last character position of the block in the storage area c. I do.

【0121】ステップ52では、次のブロックをステッ
プ51と同じように作成する。参照座標格納メモリ26
の格納エリアa,b,cに格納されている参照情報を1
つずつ移動させ、次のブロックの参照座標を認識結果格
納メモリ23から取得し、このブロックの参照座標を格
納エリアcにそのブロックの最終文字位置とともに格納
する。もし次の行がないときは、「矩形なし」の情報を
格納する。
In step 52, the next block is created in the same manner as in step 51. Reference coordinate storage memory 26
Reference information stored in storage areas a, b, and c of
The reference coordinates of the next block are acquired from the recognition result storage memory 23, and the reference coordinates of this block are stored in the storage area c together with the last character position of the block. If there is no next line, the information of "no rectangle" is stored.

【0122】ステップ53では、サイズ判定を行うべき
ブロックの有無を判定する。サイズ判定を行うべきブロ
ックがあるときは、ステップ54に進む。ステップ54
では、判定対象である現在ブロックの関連情報を設定す
る。この関連情報を設定するには、現在ブロックの最終
文字の文字位置を、参照座標格納メモリ26に格納され
ている現在ブロックの文字位置から取得し、その文字位
置の文字について認識結果格納メモリ23を参照し、行
位置L、文字位置I、行先頭からの文字位置LI,その
行の文字数LNおよびブロック文字数BNを取得し、関
連情報格納メモリ27に格納する。尚、L,I,LI,
LN、BNは1以上の値とする。
In step 53, it is determined whether or not there is a block whose size is to be determined. When there is a block to be subjected to size determination, the process proceeds to step 54. Step 54
Then, related information of the current block to be determined is set. To set the relevant information, the character position of the last character of the current block is obtained from the character position of the current block stored in the reference coordinate storage memory 26, and the recognition result storage memory 23 is stored in the recognition result storage memory 23 for the character at that character position. By referring to the information, the line position L, the character position I, the character position LI from the head of the line, the number of characters LN of the line, and the number of block characters BN are acquired and stored in the related information storage memory 27. Note that L, I, LI,
LN and BN are one or more values.

【0123】ステップ55では、参照座標格納メモリ2
6のエリアa,b,cに格納されている現在ブロックの
1つ前のブロック、現在ブロック、その次のブロックの
ブロック座標、及び関連情報格納メモリ27に格納され
ているブロック関連情報を参照し、読み取り領域情報格
納メモリ22に格納されているその領域の領域情報に従
って、判定データ格納メモリ24に格納されているサイ
ズ判定データを参照し、このサイズ判定データの条件式
の真偽を計算する。尚、条件式は、具体例1〜4と同じ
ような条件式であってもよいし、論理積(AND)や論理
和(OR)によって複合化させたものでもよい。
In step 55, the reference coordinate storage memory 2
6, the block coordinates immediately before the current block stored in the areas a, b, and c, the current block, the block coordinates of the next block, and the block related information stored in the related information storage memory 27 are referred to. In accordance with the area information of the area stored in the reading area information storage memory 22, the size determination data stored in the determination data storage memory 24 is referred to, and the true / false of the conditional expression of the size determination data is calculated. Note that the conditional expressions may be the same conditional expressions as in the specific examples 1 to 4, or may be compounded by logical product (AND) or logical sum (OR).

【0124】サイズ判定データには、具体例1(図4)
と同じような条件式とそれに対応した処理方法が含まれ
ている。条件計算の方法は具体例1と同様であり、計算
結果は判定結果格納メモリ25に格納される。
Specific example 1 (FIG. 4) is included in the size determination data.
And a processing method corresponding to the conditional expression. The condition calculation method is the same as that of the first embodiment, and the calculation result is stored in the determination result storage memory 25.

【0125】但し、具体例2と同様に、参照座標格納メ
モリ26の格納エリアa、または格納エリアcに「矩形
なし」の情報が格納されているときは、その条件式の計
算結果は偽となる。
However, as in the specific example 2, when the information “no rectangle” is stored in the storage area a or the storage area c of the reference coordinate storage memory 26, the calculation result of the conditional expression is false. Become.

【0126】ステップ56では、計算結果の真偽を判別
し、計算結果が偽のときは、ステップ57に進む。ステ
ップ57では、関連情報格納メモリ27から現在ブロッ
クの文字位置I、即ち、現在ブロックの最終文字位置と
そのブロックの文字数BNを取得し、このブロックの開
始文字位置(I−BN+1)から最終文字位置Iまでの
文字座標及び文字コードを認識結果格納メモリ23から
判定結果格納メモリ25へそのままコピーする。
At step 56, it is determined whether the calculation result is true or false. If the calculation result is false, the process proceeds to step 57. In step 57, the character position I of the current block, that is, the last character position of the current block and the number of characters BN of the block are obtained from the related information storage memory 27, and the start character position (I-BN + 1) and the last character position of this block are obtained. The character coordinates and character codes up to I are copied from the recognition result storage memory 23 to the determination result storage memory 25 as they are.

【0127】また、計算結果が真のときは、誤読の可能
性があると判定してステップ58に進んで条件式に対応
する処理方法を判別する。処理方法が未処理のときは、
ステップ57に進み、判定結果が偽のときと同じ処理を
行う。処理方法が不読のときは、ステップ59に進む。
If the result of the calculation is true, it is determined that there is a possibility of erroneous reading, and the routine proceeds to step 58, where the processing method corresponding to the conditional expression is determined. If the processing method is unprocessed,
Proceeding to step 57, the same processing as when the determination result is false is performed. If the processing method is not read, the process proceeds to step 59.

【0128】ステップ59では、関連情報格納メモリ2
7から現在ブロックの文字位置I、即ち、最終文字位置
とそのブロックの文字数BNを取得し、このブロックの
開始文字位置(I−BN+1)から最終文字位置Iまで
の文字座標を認識結果格納メモリ23から判定結果格納
メモリ25へコピーし、その文字コードを、例えば
「?」などのように認識結果として含まれるべきでない
文字に置換して判定結果格納メモリ25に格納する。処
理方法が削除のときは、その文字を削除する。
In the step 59, the related information storage memory 2
7, the character position I of the current block, that is, the last character position and the number of characters BN of the block are obtained, and the character coordinates from the start character position (I-BN + 1) of this block to the last character position I are obtained. To the determination result storage memory 25, and replaces the character code with a character that should not be included as a recognition result, such as “?”, And stores the character code in the determination result storage memory 25. If the processing method is delete, the character is deleted.

【0129】このような処理を全てのブロックについて
行い、全てのブロックについてのサイズ判定が終了した
とき(ステップ53)、ステップ2に戻り、全ての領域
情報について認識処理(ステップ3)、サイズ判定処理
(ステップ4)が行われたとき(ステップ2)、すべて
の処理を終了させる。
When such processing is performed for all the blocks and the size determination for all the blocks is completed (step 53), the process returns to step 2, where the recognition processing for all the area information (step 3), the size determination processing When (Step 4) is performed (Step 2), all the processes are terminated.

【0130】〈具体例5の効果〉以上、説明したように
具体例5によれば、同一行で同じ条件の文字が連続した
とき、これらの文字をブロックにまとめ、このブロック
に対してサイズ判定を行うようにしたので、ブロック単
位で行の切り出し処理や文字の切り出し処理の誤りを判
別し、後処理を行うことができる。
<Effects of Specific Example 5> As described above, according to Specific Example 5, when characters of the same condition continue on the same line, these characters are combined into a block, and the size of this block is determined. Is performed, it is possible to determine an error in the line cutout processing and the character cutout processing in block units and perform post-processing.

【0131】〈具体例6〉具体例6は、サイズ判定デー
タをスクリプトデータで記述するようにしたものであ
る。
<Example 6> In Example 6, the size determination data is described in script data.

【0132】図19は、具体例6の構成を示すブロック
図である。具体例6の文字読取装置は、画像入力部1
と、表示部2と、入力部3と、制御部4と、認識部5
と、サイズ判定部6と、スクリプトデータ解析部7と、
画像メモリ21と、読み取り領域情報格納メモリ22
と、認識結果格納メモリ23と、判定データ格納メモリ
24と、判定結果格納メモリ25と、参照座標格納メモ
リ26と、関連情報格納メモリ27と、スクリプトデー
タ格納メモリ28と、を備えて構成されている。
FIG. 19 is a block diagram showing the configuration of the sixth embodiment. The character reading device according to the specific example 6 includes the image input unit 1
, Display unit 2, input unit 3, control unit 4, recognition unit 5
, A size determination unit 6, a script data analysis unit 7,
Image memory 21 and read area information storage memory 22
, A recognition result storage memory 23, a determination data storage memory 24, a determination result storage memory 25, a reference coordinate storage memory 26, a related information storage memory 27, and a script data storage memory 28. I have.

【0133】スクリプトデータ格納メモリ28は、スク
リプトで記述されたサイズ判定データを格納するメモリ
であり、このスクリプトはテキストで記述されている。
スクリプトデータ解析部7は、スクリプトデータ格納メ
モリ28に格納されているサイズ判定データを参照し、
構文解析を行い、サイズ判定部6が使用できる内部的な
サイズ判定データに変換する機能を有する解析部であ
る。尚、具体例1〜5と同一要素については同一符号を
付して説明を省略する。
The script data storage memory 28 is a memory for storing size determination data described in a script, and the script is described in text.
The script data analysis unit 7 refers to the size determination data stored in the script data storage memory 28,
The analyzing unit has a function of performing syntax analysis and converting the data into internal size determining data that can be used by the size determining unit 6. Note that the same elements as those of the first to fifth embodiments are denoted by the same reference numerals, and description thereof will be omitted.

【0134】〈動作〉次に具体例6の動作を説明する。
具体例2においても、具体例1と同様に、図6のフロー
チャートを実行し、ステップ4においてサイズ判定処理
を実施する。
<Operation> Next, the operation of the embodiment 6 will be described.
Also in the specific example 2, similarly to the specific example 1, the flowchart of FIG. 6 is executed, and the size determination process is performed in step 4.

【0135】図20は具体例6のサイズ判定処理を示す
フローチャートである。ステップ61では、スクリプト
で記述されたサイズ判定データを解析する。サイズ判定
データを解析するには、読み取り領域情報格納メモリ2
2に格納されているその領域の情報に従ってスクリプト
データ格納メモリ28からスクリプトを取得する。
FIG. 20 is a flowchart showing the size determination processing of the sixth embodiment. In step 61, the size determination data described in the script is analyzed. To analyze the size determination data, the read area information storage memory 2
The script is acquired from the script data storage memory 28 in accordance with the information of the area stored in the area 2.

【0136】スクリプトデータ解析部7はこのスクリプ
トを構文解析し、サイズ判定部6が使用できる内部的な
サイズ判定データに変換し、変換されたサイズ判定デー
タを判定データ格納メモリ24に格納する。
The script data analysis unit 7 analyzes the syntax of the script, converts the syntax into internal size determination data that can be used by the size determination unit 6, and stores the converted size determination data in the determination data storage memory 24.

【0137】式(16)は、このスクリプトで記述され
たサイズ判定データの一例を示す式である。 処理単位,(条件1)処理1|(条件2)処理2|…|(条件n)処理n …(16)
Expression (16) is an expression showing an example of the size determination data described in this script. (Condition 1) Process 1 | (Condition 2) Process 2 | ... | (Condition n) Process n ... (16)

【0138】処理単位には、文字単位、行単位等の処理
単位が記述され、条件1〜nには、例えば、条件式(1
0)〜(15)が記述される。そして、その条件1〜n
に対応した処理1〜nを列挙する。
The processing unit describes a processing unit such as a character unit or a line unit. Conditions 1 to n include, for example, a conditional expression (1
0) to (15) are described. Then, the conditions 1 to n
Are enumerated.

【0139】ステップ62〜66では、具体例5のステ
ップ52〜55と同様に現在行の関連情報を設定し、判
定データ格納メモリ24に格納されているサイズ判定デ
ータを用いて条件計算を行う。そして、ステップ67〜
70では、具体例5と同じような後処理を行う。
In steps 62 to 66, related information of the current row is set in the same manner as in steps 52 to 55 of the specific example 5, and a condition calculation is performed using the size determination data stored in the determination data storage memory 24. And step 67-
At 70, the same post-processing as in the fifth embodiment is performed.

【0140】このような処理を全てのブロックについて
行い、全てのブロックについてのサイズ判定が終了した
とき(ステップ64)、ステップ2に戻り、全ての領域
情報について認識処理(ステップ3)、サイズ判定処理
(ステップ4)が行われたとき(ステップ2)、すべて
の処理を終了させる。
Such processing is performed for all blocks, and when the size determination for all blocks is completed (step 64), the flow returns to step 2 to perform recognition processing for all area information (step 3) and size determination processing. When (Step 4) is performed (Step 2), all the processes are terminated.

【0141】〈具体例6の効果〉以上、説明したように
具体例6によれば、サイズ判定データをスクリプトで記
述することにより、具体例1〜5と同様の効果を得るこ
とができるとともに、条件式を容易に定義できる。この
ため、サイズ判定データの誤り等による変更に容易に対
応することができる。
<Effects of Specific Example 6> According to the specific example 6, as described above, the same effects as those of the specific examples 1 to 5 can be obtained by describing the size determination data in a script. Conditional expressions can be easily defined. Therefore, it is possible to easily cope with a change due to an error or the like of the size determination data.

【図面の簡単な説明】[Brief description of the drawings]

【図1】具体例1の構成を示すブロック図である。FIG. 1 is a block diagram illustrating a configuration of a specific example 1.

【図2】従来の説明図である。FIG. 2 is a conventional explanatory diagram.

【図3】具体例1の文字座標の説明図である。FIG. 3 is an explanatory diagram of character coordinates in a specific example 1.

【図4】具体例1のサイズ判定データの一例を示す説明
図である。
FIG. 4 is an explanatory diagram illustrating an example of size determination data of a specific example 1.

【図5】具体例1の読み取り領域の説明図である。FIG. 5 is an explanatory diagram of a reading area according to a specific example 1.

【図6】具体例1の動作を示すフローチャートである。FIG. 6 is a flowchart illustrating an operation of a specific example 1.

【図7】具体例1のサイズ判定処理を示すフローチャー
トである。
FIG. 7 is a flowchart illustrating a size determination process of a specific example 1.

【図8】具体例2の参照座標格納メモリの説明図であ
る。
FIG. 8 is an explanatory diagram of a reference coordinate storage memory of a specific example 2.

【図9】具体例2のサイズ判定処理を示すフローチャー
トである。
FIG. 9 is a flowchart illustrating a size determination process of a specific example 2.

【図10】具体例2の説明図である。FIG. 10 is an explanatory diagram of a specific example 2.

【図11】具体例3の構成を示すブロック図である。FIG. 11 is a block diagram illustrating a configuration of a specific example 3.

【図12】具体例3の関連情報の説明図である。FIG. 12 is an explanatory diagram of related information in a specific example 3.

【図13】具体例3のサイズ判定処理を示すフローチャ
ートである。
FIG. 13 is a flowchart illustrating a size determination process according to a third example.

【図14】具体例4のサイズ判定処理を示すフローチャ
ートである。
FIG. 14 is a flowchart illustrating a size determination process of Example 4;

【図15】具体例4の行座標の作成方法を示す説明図で
ある。
FIG. 15 is an explanatory diagram illustrating a method of creating row coordinates in a specific example 4.

【図16】具体例5のサイズ判定データの一例を示す説
明図である。
FIG. 16 is an explanatory diagram showing an example of size determination data of a specific example 5.

【図17】具体例5のサイズ判定処理を示すフローチャ
ートである。
FIG. 17 is a flowchart illustrating a size determination process of Example 5;

【図18】具体例5のブロックの説明図である。FIG. 18 is an explanatory diagram of a block of Example 5;

【図19】具体例6の構成を示す説明図である。FIG. 19 is an explanatory diagram showing a configuration of a specific example 6.

【図20】具体例6のサイズ判定処理を示すフローチャ
ートである。
FIG. 20 is a flowchart illustrating a size determination process of Example 6;

【符号の説明】 1 画像入力部 4 制御部 5 認識部 6 サイズ判定部 22 読み取り領域情報格納メモリ 23 認識結果格納メモリ 24 判定データ格納メモリ 25 判定結果格納メモリ 26 参照座標格納メモリ[Description of Signs] 1 Image input unit 4 Control unit 5 Recognition unit 6 Size determination unit 22 Reading area information storage memory 23 Recognition result storage memory 24 Determination data storage memory 25 Determination result storage memory 26 Reference coordinate storage memory

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 所定の用紙に印字された文字を画像デー
タとして取得する画像入力手段と、 該画像入力手段により取得された画像データから各文字
の位置及び大きさを文字座標で特定し、各文字を認識し
て文字コードに変換する認識手段と、 該認識手段により認識された各文字の位置及び大きさに
対し、文字座標を用いて所定の誤読判定条件を設定し、
当該各文字の位置及び大きさが誤読判定条件に該当する
ときは、誤って文字を認識した可能性があると判定し、
当該文字については、認識結果に対する後処理を行う誤
読判定処理手段と、を備えたことを特徴とする文字読取
装置。
An image input means for acquiring a character printed on a predetermined sheet as image data, and a position and a size of each character are specified by character coordinates from the image data acquired by the image input means. Recognizing means for recognizing a character and converting it to a character code; and setting predetermined misreading determination conditions using character coordinates for the position and size of each character recognized by the recognizing means;
When the position and size of each character correspond to the misreading determination condition, it is determined that there is a possibility that the character is erroneously recognized,
A character reading device comprising: an erroneous reading determination processing unit that performs post-processing on a recognition result for the character.
【請求項2】 画像データの中で同じ誤読可能性判定条
件が適用される所定の読み取り領域を設定し、前記誤読
可能性判定手段は、読み取った文字が誤読判定条件に該
当するか否かを読み取り領域毎に判定するように構成さ
れたことを特徴とする請求項1に記載の文字読取装置。
2. A predetermined reading area to which the same misreadability determination condition is applied in image data is set, and the misreadability determination means determines whether the read character corresponds to the misreadability determination condition. The character reading device according to claim 1, wherein the character reading device is configured to make a determination for each reading area.
【請求項3】 前記誤読判定処理手段は、各文字の文字
座標に基づいて認識対象の文字の幅、高さ及び位置を算
出し、算出された認識対象の文字の幅、高さ及び位置に
誤読判定条件を設定し、これらの文字の幅、高さ及び位
置のうちいずれか1つが誤読判定条件に該当したときに
誤って文字を認識した可能性があると判定するように構
成されたことを特徴とする請求項1又は請求項2に記載
の文字読取装置。
3. The misreading determination processing means calculates the width, height, and position of the character to be recognized based on the character coordinates of each character, and calculates the width, height, and position of the calculated character to be recognized. A misreading determination condition is set, and when any one of the width, height, and position of the character corresponds to the misreading determination condition, it is configured to determine that there is a possibility that the character is erroneously recognized. The character reading device according to claim 1 or 2, wherein:
【請求項4】 前記誤読判定処理手段は、各文字の文字
座標に基づいて認識対象の文字の幅、高さ及び位置を算
出し、算出された認識対象の文字の幅、高さ及び位置に
誤読判定条件を設定し、これらの文字の幅、高さ及び位
置のうち少なくとも1つが誤読判定条件に該当したとき
に誤って文字を認識した可能性があると判定するように
構成されたことを特徴とする請求項1又は請求項2に記
載の文字読取装置。
4. The misreading determination processing means calculates the width, height, and position of the character to be recognized based on the character coordinates of each character, and calculates the width, height, and position of the calculated character to be recognized. A misreading determination condition is set, and when at least one of the width, height, and position of the character corresponds to the misreading determination condition, it is configured to determine that there is a possibility that the character is erroneously recognized. The character reading device according to claim 1 or 2, wherein
【請求項5】 前記誤読判定処理手段は、各文字の文字
座標に基づいて認識対象の文字の前後関係を算出し、算
出された認識対象の文字の前後関係に誤読判定条件を設
定し、当該前後関係が誤読判定条件に該当したときに誤
って文字を認識した可能性があると判定するように構成
されたことを特徴とする請求項1又は請求項2に記載の
文字読取装置。
5. The misreading determination processing means calculates the context of the character to be recognized based on the character coordinates of each character, and sets a misreading determination condition in the calculated context of the character to be recognized. The character reading device according to claim 1, wherein the character reading device is configured to determine that there is a possibility that a character has been erroneously recognized when the context corresponds to an erroneous reading determination condition.
【請求項6】 前記誤読判定処理手段は、各文字の文字
座標に基づいてその行の全ての文字を含む行を作成し、
行の位置関係及びその行に含まれている文字の位置、文
字数に誤読判定条件を設定し、行の位置関係及びその行
に含まれている文字の位置、文字数のうちのいずれか1
つが誤読判定条件に該当したときに誤って文字を認識し
た可能性があると判定するように構成されたことを特徴
とする請求項1又は請求項2に記載の文字読取装置。
6. The misreading determination processing means creates a line including all the characters in the line based on the character coordinates of each character,
A misreading determination condition is set for the positional relationship of the line and the position and the number of characters included in the line, and any one of the positional relationship of the line and the position or the number of characters included in the line is set.
The character reading device according to claim 1, wherein it is configured to determine that there is a possibility that a character has been erroneously recognized when one of the conditions corresponds to an erroneous reading determination condition.
【請求項7】 前記誤読判定処理手段は、各文字の文字
座標に基づいてその行の全ての文字を含む行を作成し、
行の位置関係及びその行に含まれている文字の位置、文
字数に誤読判定条件を設定し、行の位置関係及びその行
に含まれている文字の位置、文字数のうちの少なくとも
1つが誤読判定条件に該当したときに誤って文字を認識
した可能性があると判定するように構成されたことを特
徴とする請求項1又は請求項2に記載の文字読取装置。
7. The misreading determination processing means creates a line including all the characters of the line based on the character coordinates of each character,
A misreading determination condition is set for the positional relationship of the line, the position of the character included in the line, and the number of characters, and at least one of the positional relationship of the line and the position of the character included in the line, the number of characters is determined to be misread. The character reading device according to claim 1, wherein the character reading device is configured to determine that there is a possibility that a character is erroneously recognized when a condition is satisfied.
【請求項8】 前記誤読判定処理手段は、各文字の文字
座標に基づいて同一行で同じ条件を有する文字が連続し
ているとき、当該連続した複数の文字をブロックにまと
め、ブロックの位置関係及びそのブロックに含まれてい
る文字の位置、文字数に誤読判定条件を設定し、認識対
象のブロックの位置関係及びそのブロックに含まれてい
る文字の位置、文字数のうちいずれか1つが誤読判定条
件に該当したときに誤って文字を認識した可能性がある
と判定するように構成されたことを特徴とする請求項1
又は請求項2に記載の文字読取装置。
8. When the characters having the same condition are continuous on the same line based on the character coordinates of each character, the misreading determination processing means collects the plurality of continuous characters into a block, And a misreading determination condition is set for the position and the number of characters included in the block, and any one of the positional relationship of the block to be recognized and the position and the number of characters included in the block is determined as the misreading determination condition. 2. The apparatus according to claim 1, wherein it is determined that there is a possibility that the character is erroneously recognized when the condition (1) is satisfied.
Or the character reading device according to claim 2.
【請求項9】 前記誤読判定処理手段は、各文字の文字
座標に基づいて同一行で同じ条件を有する文字が連続し
ているとき、当該連続した複数の文字をブロックにまと
め、ブロックの位置関係及びそのブロックに含まれてい
る文字の位置、文字数に誤読判定条件を設定し、認識対
象のブロックの位置関係及びそのブロックに含まれてい
る文字の位置、文字数のうち少なくとも1つが誤読判定
条件に該当したときに誤って文字を認識した可能性があ
ると判定するように構成されたことを特徴とする請求項
1又は請求項2に記載の文字読取装置。
9. When the characters having the same condition are consecutive on the same line based on the character coordinates of each character, the misreading determination processing means collects the plurality of consecutive characters into a block, and determines a positional relationship between the blocks. And misreading determination conditions are set for the position and the number of characters included in the block, and at least one of the positional relationship of the block to be recognized and the position and the number of characters included in the block is included in the misreading determination condition. The character reading device according to claim 1, wherein it is configured to determine that there is a possibility that a character has been erroneously recognized when the character is recognized.
【請求項10】 前記誤読判定処理手段は、誤読判定条
件をスクリプトで記述したことを特徴とする請求項1〜
9のいずれか1つに記載の文字読取装置。
10. The erroneous reading judgment processing means described in a script for erroneous reading judgment conditions.
10. The character reading device according to any one of 9 above.
【請求項11】 前記誤読判定処理手段は、誤って文字
を読み取った可能性に応じて、当該文字を別の文字に置
換する処理、未処理、削除処理のうち、いずれか1つを
選択処理するように構成されたことを特徴とする請求項
1〜10のいずれか1つに記載の文字読取装置。
11. The erroneous reading determination processing means selects one of a process of replacing the character with another character, an unprocessed process, and a deleting process according to a possibility that the character is erroneously read. The character reading device according to any one of claims 1 to 10, wherein the character reading device is configured to perform the following.
JP2000110112A 2000-04-12 2000-04-12 Character reader Expired - Fee Related JP4544691B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000110112A JP4544691B2 (en) 2000-04-12 2000-04-12 Character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000110112A JP4544691B2 (en) 2000-04-12 2000-04-12 Character reader

Publications (2)

Publication Number Publication Date
JP2001297302A true JP2001297302A (en) 2001-10-26
JP4544691B2 JP4544691B2 (en) 2010-09-15

Family

ID=18622684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000110112A Expired - Fee Related JP4544691B2 (en) 2000-04-12 2000-04-12 Character reader

Country Status (1)

Country Link
JP (1) JP4544691B2 (en)

Also Published As

Publication number Publication date
JP4544691B2 (en) 2010-09-15

Similar Documents

Publication Publication Date Title
US6385338B1 (en) Image processing method and apparatus
JP3805005B2 (en) Image processing apparatus, optical character recognition apparatus, and methods thereof
EP0054439A2 (en) Character segmentation method
JP3294995B2 (en) Form reader
US8452133B2 (en) Underline removal apparatus
JPS6159568A (en) Document understanding system
US7680329B2 (en) Character recognition apparatus and character recognition method
CN113378839A (en) Information processing apparatus, information processing method, and computer readable medium
JPH10171922A (en) Ruled line eraser and recording medium
JP2002015280A (en) Device and method for image recognition, and computer- readable recording medium with recorded image recognizing program
JP3571128B2 (en) Method and apparatus for recognizing dimensions of drawings
JP4544691B2 (en) Character reader
KR100834602B1 (en) Character recognition apparatus and character recognition method
JP4810853B2 (en) Character image cutting device, character image cutting method and program
JP2003030654A (en) Pattern identification device, pattern identification method and program for pattern identification
JP3090070B2 (en) Form identification method and device
JP3157530B2 (en) Character extraction method
JP3848792B2 (en) Character string recognition method and recording medium
JPH0490083A (en) Character recognizing device
JP2002366900A (en) Optical character reader
JPS6136874A (en) Corrected character processing method for optical character reader
JPH0816719A (en) Character segmenting character recognition method, method and device by using same
JPH06251187A (en) Method and device for correcting character recognition error
JP3919390B2 (en) Character recognition device
JPH04260980A (en) Device for recognizing graphic

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060413

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080908

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081201

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090120

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100604

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100629

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4544691

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees