JPH11338969A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH11338969A
JPH11338969A JP10147224A JP14722498A JPH11338969A JP H11338969 A JPH11338969 A JP H11338969A JP 10147224 A JP10147224 A JP 10147224A JP 14722498 A JP14722498 A JP 14722498A JP H11338969 A JPH11338969 A JP H11338969A
Authority
JP
Japan
Prior art keywords
entry
character
recognition result
memory
frame line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10147224A
Other languages
Japanese (ja)
Inventor
Katsumi Fukuchi
克己 福地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10147224A priority Critical patent/JPH11338969A/en
Publication of JPH11338969A publication Critical patent/JPH11338969A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To make a correct recognition result acquirable to be able to output it to the outside even in the case of being in contact of frame lines of an entry column with characters by detecting the entry column, whose frame lines don't come into contact with characters, by a discrimination means at the time when plural entry columns, where the same contents are written, exist in a business form. SOLUTION: A frame line removing part 15 specifies positions of two entry columns, where the same contents are written, of a business form 10 from the format of the business form 10 read out from a storage means. Thereafter, pictures in two entry columns where the same contents are written of the form 10 are read out from the entire picture of the form 10 stored in an image memory 14, and frame line parts are removed from pictures in two entry columns to generate image data, and thus data is outputted to a pattern memory 16. At this time, the frame line removing part 15 discriminates whether frame lines of first and second entry columns come into contact with characters or not and detects the entry column whose frame lines don't come into contact with characters, and a result discrimination part 22 outputs the recognition result of characters written in the entry column to the outside.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、同一の内容が記さ
れる記入欄が複数存在する帳票の読取を可能とする光学
式文字読取装置(Optical Character Reader:以下、O
CRという)に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader (hereinafter referred to as O) capable of reading a form having a plurality of entry fields in which the same contents are written.
CR).

【0002】[0002]

【従来の技術】例えば、OCRによって図2に示すよう
な帳票を読み取らせる場合がある。図2は帳票の構成を
示す図であり、ミシン目入りの切り取り線が設けられた
帳票を示している。このような帳票は、例えば銀行等の
金融機関で振込業務等に活用され、切り取り線で切り離
された一部(図中の左側の票)が振込先の取扱票として
取り扱われ、一部(図中の中央の票)が金融機関の受領
証として取り扱われ、一部(図中の右側の票)が振込人
の領収書として取り扱われる。なお、金額のような重要
な内容は、同一の内容が帳票に設けられた複数箇所(図
2の例では振込先の取扱票と金融機関の受領証に1箇所
づつ、合計2箇所)の記入欄に記される。
2. Description of the Related Art For example, a form as shown in FIG. 2 may be read by OCR. FIG. 2 is a view showing the configuration of a form, and shows a form provided with perforated cutout lines. Such a form is used in a transfer business or the like by a financial institution such as a bank, for example, and a part (a form on the left side in the figure) separated by a cutoff line is treated as a transfer form of a transfer destination, and a part (a figure The middle vote in the middle is treated as a receipt for the financial institution, and a part (the right vote in the figure) is treated as the receipt of the transferor. Important contents such as the amount of money are entered in a plurality of places where the same contents are provided in the form (in the example of FIG. 2, two places, one each for the handling slip of the transfer destination and the receipt of the financial institution). It is written in.

【0003】OCRは、このような帳票を読み取る場合
に、同一の内容が記される複数箇所(図2の例では2箇
所)の記入欄の内容を読み取って認識処理を行い、認識
結果を比較して、比較が一致した場合にのみ認識結果を
外部に出力し、一致しない場合は認識結果が不明である
として処理する。
[0003] When reading such a form, the OCR reads the contents of a plurality of entry fields (two places in the example of FIG. 2) where the same contents are written, performs recognition processing, and compares the recognition results. Then, only when the comparisons match, the recognition result is output to the outside. When the comparisons do not match, the recognition result is determined to be unknown.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、OCR
は、記入欄の枠線と文字が接触する場合に、記入欄に記
入された文字をそれとは異なる文字として認識すること
がある。同一の内容が記された2箇所の記入欄の一方が
このように認識された場合、2箇所の記入欄の認識結果
の比較が一致しなくなる。この場合、OCRは、認識結
果が不明であるとして処理する。このような現象が、ど
のようにして起こるのかを図3〜6を用いて以下に説明
する。
SUMMARY OF THE INVENTION However, OCR
In some cases, when a character touches a frame of an entry column, the character entered in the entry column may be recognized as a different character. If one of the two entry fields with the same content is recognized in this way, the comparison of the recognition results of the two entry fields will not match. In this case, the OCR processes the recognition result as unknown. How such a phenomenon occurs will be described below with reference to FIGS.

【0005】図3と図4は、記入欄の枠線と記入欄に記
された文字の関係を示す図である。図3は、図2の左側
の票(振込先の取扱票)の記入欄(以下、第1の記入欄
という)を拡大して示すものであり、枠線と文字が接触
していない例を示している。図4は、図2の中央の票
(金融機関の受領証)の記入欄(以下、第2の記入欄と
いう)を拡大して示すものであり、枠線と文字が接触し
ている例を示している。図中、1は枠線、2は文字
「2」、3は枠線、4は枠線3と接触している文字
「2」である。図5と図6は、図4の枠線の除去前と除
去後の文字のイメージを示す図である。図中、5は枠線
3を除去した後の文字「2」のイメージである。
FIGS. 3 and 4 are diagrams showing the relationship between the frame of the entry column and the characters entered in the entry column. FIG. 3 is an enlarged view of an entry column (hereinafter referred to as a first entry column) of a vote (transfer destination handling slip) on the left side of FIG. Is shown. FIG. 4 is an enlarged view of an entry column (hereinafter referred to as a second entry column) of a central vote (a receipt of a financial institution) in FIG. 2, showing an example in which a frame line and a character are in contact. ing. In the figure, 1 is a frame line, 2 is a character “2”, 3 is a frame line, and 4 is a character “2” in contact with the frame line 3. FIG. 5 and FIG. 6 are views showing the image of the character before and after the removal of the frame line in FIG. In the figure, reference numeral 5 denotes an image of the character “2” after removing the frame 3.

【0006】OCRは、第1と第2の2箇所の記入欄に
記載された文字2と文字4を認識処理するに当たり、図
3から枠線1を除去した文字のイメージ(文字「2」の
イメージ)と図4から枠線3を除去した文字のイメージ
(図6に示す文字5のイメージ)を抽出し、これらを図
示しない認識手段によって認識処理する。このとき、前
者は文字「2」と認識されるが、後者は文字「2」の最
下部の線が枠線とともに除去されるため文字「7」と認
識処理される。この場合、OCRは、2箇所の記入欄の
認識結果の比較が一致しなくなるので、認識結果が不明
であるとして処理する。
In recognizing the characters 2 and 4 described in the first and second entry columns, the OCR recognizes the image of the character with the frame 1 removed from FIG. 4), and a character image (image of character 5 shown in FIG. 6) from which the frame 3 is removed from FIG. 4 and are subjected to recognition processing by recognition means (not shown). At this time, the former is recognized as the character "2", but the latter is recognized as the character "7" because the bottom line of the character "2" is removed together with the frame line. In this case, the OCR processes the recognition result as unknown because the comparison of the recognition result in the two entry fields does not match.

【0007】本発明は、このように記入欄の枠線と文字
が接触する場合でも正しい認識結果を取得でき、その認
識結果を外部に出力できる光学式文字読取装置を提供す
る。
The present invention provides an optical character reading apparatus capable of acquiring a correct recognition result even when the character of the entry box is in contact with the frame line, and outputting the recognition result to the outside.

【0008】[0008]

【課題を解決するための手段】上記課題を解決するため
に、本発明は、帳票に記された文字を読み取り、認識結
果を外部に出力する光学式文字読取装置において、文字
が記された記入欄の枠線と文字が接触するのか否かを判
定する判定手段を有し、同一の内容が記される記入欄が
帳票の中に複数存在する場合に、前記判定手段によって
枠線と文字が接触しない記入欄を検出し、当該記入欄に
記された文字の認識結果を外部に出力できることを特徴
とする。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, the present invention provides an optical character reader for reading characters recorded on a form and outputting a recognition result to an external device. A determination unit that determines whether or not the frame line of the column and the character are in contact with each other, and when there is a plurality of entry columns in the form where the same content is written, the determination unit determines whether the frame line and the character are in contact with each other. It is characterized in that an entry field that does not touch is detected, and a recognition result of characters written in the entry field can be output to the outside.

【0009】[0009]

【発明の実施の形態】以下、本発明の実施の形態を説明
する。
Embodiments of the present invention will be described below.

【0010】<実施例の構成>図1は本発明の光学式文
字読取装置(以下、OCRという)の機能ブロックを示
す図である。
<Structure of Embodiment> FIG. 1 is a diagram showing functional blocks of an optical character reader (hereinafter referred to as OCR) of the present invention.

【0011】図中、10は帳票であり、11は光電変換
部、12はAD変換回路、13は2値化回路、14はイ
メージメモリ、15は枠線除去部、16はパターンメモ
リ、17は文字認識部、18は第1の記入欄の認識結果
を格納するメモリ、19は第2の記入欄の認識結果を格
納するメモリ、20は第1の記入欄の枠線と文字の接触
状態を示すフラグを格納するメモリ、21は第2の記入
欄の枠線と文字の接触状態を示すフラグを格納するメモ
リである。なお、帳票10は、同一の内容が記された記
入欄が複数設けられた帳票である。本実施例では、図2
に示すように、同一の内容が記された記入欄が2箇所設
けられた帳票を例にして説明する。
In the figure, 10 is a form, 11 is a photoelectric conversion unit, 12 is an AD conversion circuit, 13 is a binarization circuit, 14 is an image memory, 15 is a frame line removing unit, 16 is a pattern memory, and 17 is a pattern memory. A character recognition unit, 18 is a memory for storing the recognition result of the first entry box, 19 is a memory for storing the recognition result of the second entry box, and 20 is a contact state between the frame line of the first entry box and the character. And a memory 21 for storing a flag indicating a contact state between the frame line of the second entry column and the character. The form 10 is a form provided with a plurality of entry fields in which the same contents are described. In this embodiment, FIG.
As shown in FIG. 2, a description will be given by taking as an example a form provided with two entry fields in which the same contents are described.

【0012】<実施例の動作>本実施例のOCRは、あ
らかじめ、帳票の種類と帳票のフォーマットが対応付け
られて図示しない記憶手段に記憶されている。この帳票
のフォーマットには、同一の内容が記された記入欄がど
の位置に存在するのかを特定する情報が含まれる。この
情報は、例えば、帳票10の同一の内容が記された2箇
所の記入欄の位置は帳票10に設けられた左上の角の基
点(図2における太線と太線が交わる部分)から「下に
○○ミリ〜○○ミリ、右に○○ミリ〜○○ミリ」および
「下に××ミリ〜××ミリ、右に××ミリ〜××ミリ」
に存在する、旨を示すように設定されている。
<Operation of Embodiment> The OCR of this embodiment is stored in advance in a storage unit (not shown) in which a form type and a form format are associated with each other. The format of the form includes information for specifying the position where the entry column in which the same content is described exists. This information is obtained, for example, from the base point of the upper left corner provided in the form 10 (the portion where the thick lines intersect with the thick line) shown in FIG. XX mm to XX mm, XX mm to XX mm to the right and XX mm to XX mm below, XX mm to XX mm to the right
Is set to indicate that it exists.

【0013】以下に、本実施例のOCRが、どのように
して帳票10を読み取るのかを説明する。
Hereinafter, how the OCR of this embodiment reads the form 10 will be described.

【0014】まず、オペレータが帳票10をOCRの図
示しない搬送機構にセットする。続いて、オペレータが
OCRの図示しない入力手段によって読み取るべき帳票
の種類が帳票10である旨を入力して読み取り開始を入
力する。
First, the operator sets the form 10 on a transport mechanism (not shown) of the OCR. Subsequently, the operator inputs that the type of the form to be read is the form 10 by input means (not shown) of the OCR, and inputs the start of reading.

【0015】これにより、OCRは、前述の記憶手段か
ら帳票の種類に対応する帳票のフォーマットを読み出
す。
As a result, the OCR reads the form format corresponding to the form type from the storage means.

【0016】続いて、OCRは、図示しない光源によっ
て帳票10に光を照射しながら、搬送機構によって帳票
10を光電変換部11の光軸に対して垂直の方向に搬送
する。帳票10に照射された光は帳票10の表面で反射
する。光電変換部11は、帳票10の表面で反射した光
を検知し、電気信号に変換してAD変換回路12に出力
する。AD変換回路12は電気信号をAD変換して2値
化回路13に出力する。2値化回路13はその信号を2
値化してイメージメモリ14に出力し、イメージメモリ
14はその信号を格納する。イメージメモリ14に格納
される信号は帳票10の全体の画像を示すデータであ
る。
Subsequently, the OCR transports the form 10 in a direction perpendicular to the optical axis of the photoelectric conversion unit 11 by irradiating the form 10 with light from a light source (not shown). The light applied to the form 10 is reflected on the surface of the form 10. The photoelectric conversion unit 11 detects light reflected on the surface of the form 10, converts the light into an electric signal, and outputs the electric signal to the AD conversion circuit 12. The AD conversion circuit 12 AD-converts the electric signal and outputs it to the binarization circuit 13. The binarizing circuit 13 outputs the signal
The value is converted to a value and output to the image memory 14. The image memory 14 stores the signal. The signal stored in the image memory 14 is data indicating the entire image of the form 10.

【0017】次に、枠線除去部15は、記憶手段から読
み出した帳票10のフォーマットから、帳票10の同一
の内容が記された2箇所の記入欄の位置、すなわち、帳
票10の左上の角に設けられた基点から「下に○○ミリ
〜○○ミリ、右に○○ミリ〜○○ミリ」および「下に×
×ミリ〜××ミリ、右に××ミリ〜××ミリ」とする位
置を特定する。
Next, based on the format of the form 10 read from the storage means, the frame line removing unit 15 determines the positions of the two entry fields where the same contents of the form 10 are written, that is, the upper left corner of the form 10. From the base point provided in `` mm mm down to mm mm to the right, mm mm to mm mm to the right, '' and `` ×
Xx mm to xx mm, right to xx mm to xx mm ".

【0018】その後、枠線除去部15は、イメージメモ
リ14に格納された帳票10の全体の画像の中から、帳
票10の同一の内容が記された2箇所の記入欄の画像を
読み出す。2箇所の記入欄の画像は例えば図3や図4の
ようになっている。図3は、図2の左側の票(振込先の
取扱票)の記入欄(以下、第1の記入欄という)のイメ
ージを示す図である。また、図4は、図2の中央の票
(金融機関の受領証)の記入欄(以下、第2の記入欄と
いう)のイメージを示す図である。図3や図4に示すよ
うに2箇所の記入欄の画像には枠線が含まれている。そ
こで、枠線除去部15は2箇所の記入欄の画像から枠線
部分を除去したイメージデータを作成してパターンメモ
リ16に出力する。
After that, the frame line removing unit 15 reads out the images of the two entry columns in which the same contents of the form 10 are written from the entire image of the form 10 stored in the image memory 14. The images of the two entry columns are, for example, as shown in FIGS. FIG. 3 is a diagram showing an image of an entry column (hereinafter, referred to as a first entry column) of a vote (transfer destination handling slip) on the left side of FIG. FIG. 4 is a diagram showing an image of an entry column (hereinafter, referred to as a second entry column) of a vote (a receipt of a financial institution) in the center of FIG. As shown in FIGS. 3 and 4, the images of the two entry columns include a frame line. Therefore, the frame line removing unit 15 creates image data in which the frame lines are removed from the images of the two entry columns and outputs the image data to the pattern memory 16.

【0019】例えば、第1の記入欄を処理する場合、枠
線除去部15は、枠線を含む文字のイメージデータをイ
メージメモリ14から読み出し、枠線部分を除去したイ
メージデータ(すなわち、正常な文字「2」のイメージ
データ)を作成してパターンメモリ16に出力する。ま
た、第2の記入欄を処理する場合、枠線除去部15は、
枠線を含む文字のイメージデータ(すなわち、図5に示
すイメージデータ)をイメージメモリ14から読み出
す。そして、枠線部分を除去したイメージデータ(すな
わち、図6に示すイメージデータ)を作成してパターン
メモリ16に出力する。パターンメモリ16はこれらイ
メージデータを格納する。
For example, when processing the first entry field, the frame line removing unit 15 reads out the image data of the character including the frame line from the image memory 14 and removes the frame line portion from the image data (ie, the normal image data). The image data of the character “2” is created and output to the pattern memory 16. When processing the second entry column, the frame line removing unit 15
The image data of the character including the frame (that is, the image data shown in FIG. 5) is read from the image memory 14. Then, image data from which the frame portion is removed (that is, the image data shown in FIG. 6) is created and output to the pattern memory 16. The pattern memory 16 stores these image data.

【0020】なお、このとき、枠線除去部15は、第1
の記入欄と第2の記入欄の枠線が文字と接触しているの
か否かを判定する。この判定は、例えば図7や図8に示
すように、水平方向に記入欄周辺の画素のヒストグラム
をとることにより行われる。図7は第1の記入欄の枠線
と文字の関係を示す図であり、図8は第2の記入欄の枠
線と文字の関係を示す図である。図7に示すように、第
1の記入欄は、枠線1と文字2が非接触な状態になって
いるので、枠線1の部分と文字2の部分のヒストグラム
が所定間隔以上、分離した状態になる。また、図8に示
すように、第2の記入欄は、枠線3と文字4が接触した
状態になっているので、枠線3の部分と文字4の部分の
ヒストグラムが接合した状態になる。枠線除去部15
は、これら記入欄周辺の画像のヒストグラムが分離した
状態になるのか否かを識別することによって、枠線が文
字と接触しているのか否かを判定する。
At this time, the frame line removing section 15
It is determined whether or not the frame lines of the entry column and the second entry column are in contact with the characters. This determination is made by taking a histogram of the pixels around the entry column in the horizontal direction, for example, as shown in FIGS. FIG. 7 is a diagram showing the relationship between the frame line of the first entry column and the characters, and FIG. 8 is a diagram showing the relationship between the frame line of the second entry column and the characters. As shown in FIG. 7, in the first entry column, since the frame 1 and the character 2 are in a non-contact state, the histograms of the frame 1 and the character 2 are separated by a predetermined interval or more. State. In addition, as shown in FIG. 8, the second entry column is in a state where the frame 3 and the character 4 are in contact with each other, so that the histogram of the portion of the frame 3 and the histogram of the character 4 are joined. . Border removal unit 15
Determines whether or not the frame lines are in contact with characters by identifying whether or not the histograms of the images around these entry columns are separated.

【0021】その後、枠線除去部15は、枠線と文字の
接触状態を示すフラグをメモリ20または21に出力す
る。この出力先は第1の記入欄を認識処理したときはメ
モリ20であり、第2の記入欄を認識処理したときはメ
モリ21である。例えば、第1の記入欄を処理する場
合、枠線除去部15は、枠線と文字の接触状態を示すフ
ラグとして「非接触」を示すコードをメモリ20に出力
する。また、第2の記入欄を処理する場合、枠線除去部
15は、枠線と文字の接触状態を示すフラグとして「接
触」を示すコードをメモリ21に出力する。メモリ20
または21はこれらフラグを格納する。
Thereafter, the frame line removing section 15 outputs a flag indicating the contact state between the frame line and the character to the memory 20 or 21. This output destination is the memory 20 when the first entry column is recognized, and is the memory 21 when the second entry column is recognized. For example, when processing the first entry column, the frame line removing unit 15 outputs to the memory 20 a code indicating “non-contact” as a flag indicating a contact state between the frame line and the character. When processing the second entry field, the frame line removing unit 15 outputs a code indicating “contact” to the memory 21 as a flag indicating a state of contact between the frame line and the character. Memory 20
Or 21 stores these flags.

【0022】次に、文字認識部17は、パターンメモリ
16に格納された文字のイメージデータを認識処理す
る。文字認識部17は、第1の記入欄に記された文字を
認識処理した場合はその認識結果をメモリ18に出力
し、第2の記入欄に記された文字を認識処理した場合は
その認識結果をメモリ19に出力する。メモリ18また
は19はこれら認識結果を格納する。本実施例の場合、
メモリ18は文字2の認識結果「2」を格納し、メモリ
19は文字4の認識結果「7」を格納する。
Next, the character recognizing unit 17 recognizes the image data of the character stored in the pattern memory 16. The character recognizing unit 17 outputs the recognition result to the memory 18 when the character described in the first entry column is recognized, and outputs the recognition result when the character described in the second entry column is recognized. The result is output to the memory 19. The memory 18 or 19 stores these recognition results. In the case of this embodiment,
The memory 18 stores the recognition result “2” of the character 2, and the memory 19 stores the recognition result “7” of the character 4.

【0023】次に、結果判定部22は、以下に示す
(1)〜(4)に場合分けして、判定処理を行う。
Next, the result determination unit 22 performs a determination process in the following cases (1) to (4).

【0024】(1)メモリ20、21に格納されたフラ
グが両方とも「非接触」の場合は、メモリ18の認識結
果とメモリ19の認識結果を比較し、両方の認識結果が
一致していれば、その認識結果を外部に出力する。一致
していなければ、認識結果が不明であることを外部に出
力する。
(1) When the flags stored in the memories 20 and 21 are both "non-contact", the recognition result of the memory 18 is compared with the recognition result of the memory 19, and if both the recognition results match. If so, the recognition result is output to the outside. If they do not match, the fact that the recognition result is unknown is output to the outside.

【0025】(2)メモリ20に格納されたフラグが
「非接触」で、メモリ21に格納されたフラグが「接
触」の場合は、メモリ18の認識結果が「2」であれ
ば、認識結果「2」を外部に出力する。メモリ18の認
識結果が「2」でなければ、枠線の下部と文字の下部が
重なっている可能性があるので、正しい認識結果を取得
するために以下のように処理する。すなわち、メモリ1
8の認識結果とメモリ19の認識結果を比較し、両方の
認識結果が一致していれば、その認識結果を外部に出力
する。一致していなければ、認識結果が不明であること
を外部に出力する。
(2) When the flag stored in the memory 20 is “non-contact” and the flag stored in the memory 21 is “contact”, if the recognition result of the memory 18 is “2”, the recognition result is "2" is output to the outside. If the recognition result in the memory 18 is not “2”, the lower part of the frame and the lower part of the character may overlap, so the following processing is performed to obtain a correct recognition result. That is, the memory 1
The recognition result of No. 8 is compared with the recognition result of the memory 19, and if both the recognition results match, the recognition result is output to the outside. If they do not match, the fact that the recognition result is unknown is output to the outside.

【0026】(3)メモリ20に格納されたフラグが
「接触」で、メモリ21に格納されたフラグが「非接
触」の場合は、メモリ19の認識結果が「2」であれ
ば、認識結果「2」を外部に出力する。メモリ19の認
識結果が「2」でなければ、枠線の下部と文字の下部が
重なっている可能性があるので、正しい認識結果を取得
するために以下のように処理する。すなわち、メモリ1
8の認識結果とメモリ19の認識結果を比較し、両方の
認識結果が一致していれば、その認識結果を外部に出力
する。一致していなければ、認識結果が不明であること
を外部に出力する。
(3) When the flag stored in the memory 20 is “contact” and the flag stored in the memory 21 is “non-contact”, if the recognition result of the memory 19 is “2”, the recognition result is “2”. "2" is output to the outside. If the recognition result of the memory 19 is not "2", the lower part of the frame and the lower part of the character may be overlapped. Therefore, the following processing is performed to obtain a correct recognition result. That is, the memory 1
The recognition result of No. 8 is compared with the recognition result of the memory 19, and if both the recognition results match, the recognition result is output to the outside. If they do not match, the fact that the recognition result is unknown is output to the outside.

【0027】(4)メモリ20、21に格納されたフラ
グが両方とも「接触」の場合は、メモリ18の認識結果
とメモリ19の認識結果のどちらかが「2」であれば、
認識結果「2」を外部に出力する。メモリ18の認識結
果とメモリ19の認識結果の両方とも「7」であれば、
認識結果が不明であることを外部に出力する。
(4) If the flags stored in the memories 20 and 21 are both “contact”, if either the recognition result of the memory 18 or the recognition result of the memory 19 is “2”,
The recognition result “2” is output to the outside. If both the recognition result of the memory 18 and the recognition result of the memory 19 are “7”,
Outputs that the recognition result is unknown to the outside.

【0028】なお、本実施例は、メモリ20に格納され
たフラグが「非接触」であり、メモリ21に格納された
フラグが「接触」、メモリ18の認識結果が「2」、メ
モリ19の認識結果が「7」である。したがって、前記
の(2)に該当する。そのため、結果判定部22は認識
結果として「2」を外部に出力する。
In this embodiment, the flag stored in the memory 20 is "non-contact", the flag stored in the memory 21 is "contact", the recognition result of the memory 18 is "2", The recognition result is “7”. Therefore, it corresponds to the above (2). Therefore, the result determination unit 22 outputs “2” to the outside as a recognition result.

【0029】以上、本発明を詳述したが、本発明は、本
実施例に限定されることなく、本発明の要旨を逸脱しな
い範囲で種々の応用及び変形が考えられる。例えば、本
実施例では、文字「2」と文字「7」の場合を例にして
説明したが、文字「L」と文字「1」のように、他の文
字の場合にも応用することができる。また、本実施例で
は、枠線の下部と文字の下部が接触する場合を例にして
説明したが、枠線と文字が下部以外の部分で接触する場
合にも応用することができる。さらに、本実施例では、
同一の内容が記された記入欄が2箇所存在する場合を例
にして説明したが、3箇所以上存在する場合にも応用す
ることができる。また、本実施例では、オペレータが図
示しない入力手段によって読み取るべき帳票の種別を入
力することによって同一の内容が記された記入欄の位置
を特定するようにしているが、帳票に帳票の種別を示す
情報等を付し、OCRがこの情報等を読み取ることによ
って同一の内容が記された記入欄の位置を特定するよう
に変形することができる。
Although the present invention has been described in detail above, the present invention is not limited to the present embodiment, and various applications and modifications can be considered without departing from the gist of the present invention. For example, in the present embodiment, the case of the character “2” and the character “7” has been described as an example, but the present invention can be applied to the case of other characters such as the character “L” and the character “1”. it can. Further, in the present embodiment, the case where the lower part of the frame line and the lower part of the character contact is described as an example, but the present invention can be applied to the case where the frame line and the character contact at a part other than the lower part. Further, in this embodiment,
The case where there are two entry columns in which the same contents are described has been described as an example, but the present invention can be applied to a case where there are three or more entry columns. Further, in the present embodiment, the position of the entry column in which the same contents are written is specified by the operator by inputting the type of the form to be read by the input means (not shown). The information can be modified such that the OCR reads the information or the like and specifies the position of the entry column where the same content is written by reading the information or the like.

【0030】[0030]

【発明の効果】以上、説明したように、本発明は、記入
欄の枠線と文字が接触する場合でも正しい認識結果を取
得でき、その認識結果を外部に出力できる。
As described above, according to the present invention, a correct recognition result can be obtained even when the frame line of the entry column touches a character, and the recognition result can be output to the outside.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の光学式文字読取装置の機能ブロックを
示す図である。
FIG. 1 is a diagram showing functional blocks of an optical character reading device according to the present invention.

【図2】帳票の構成を示す図である。FIG. 2 is a diagram showing a configuration of a form.

【図3】記入欄の枠線と記入欄に記された文字の関係を
示す図である。
FIG. 3 is a diagram showing a relationship between a frame line of an entry column and characters written in the entry column.

【図4】記入欄の枠線と記入欄に記された文字の関係を
示す図である。
FIG. 4 is a diagram showing a relationship between a frame line of an entry column and characters written in the entry column.

【図5】枠線の除去前の文字のイメージを示す図であ
る。
FIG. 5 is a diagram illustrating an image of a character before removal of a frame line.

【図6】枠線の除去後の文字のイメージを示す図であ
る。
FIG. 6 is a diagram illustrating an image of a character after removal of a frame line.

【図7】枠線と文字の関係を示す図である。FIG. 7 is a diagram illustrating a relationship between a frame line and characters.

【図8】枠線と文字の関係を示す図である。FIG. 8 is a diagram illustrating a relationship between a frame line and a character.

【符号の説明】[Explanation of symbols]

11 光電変換部 12 AD変換回路 13 2値化回路 14 イメージメモリ 15 枠線除去部 16 パターンメモリ 17 文字認識部 18 第1の記入欄の認識結果を格納するメモリ 19 第2の記入欄の認識結果を格納するメモリ 20 第1の記入欄の枠線と文字の接触状態を格納する
メモリ 21 第2の記入欄の枠線と文字の接触状態を格納する
メモリ
REFERENCE SIGNS LIST 11 photoelectric conversion unit 12 AD conversion circuit 13 binarization circuit 14 image memory 15 frame line removal unit 16 pattern memory 17 character recognition unit 18 memory storing recognition result in first entry field 19 recognition result in second entry field 20 A memory for storing the contact state between the frame line and the character in the first entry column 21 A memory for storing the contact state between the frame line and the character in the second entry column

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 帳票に記された文字を読み取り、認識結
果を外部に出力する光学式文字読取装置において、 文字が記された記入欄の枠線と文字が接触するのか否か
を判定する判定手段を有し、 同一の内容が記される記入欄が帳票の中に複数存在する
場合に、前記判定手段によって枠線と文字が接触しない
記入欄を検出し、当該記入欄に記された文字の認識結果
を外部に出力できることを特徴とする光学式文字読取装
置。
1. An optical character reading device for reading a character written on a form and outputting a recognition result to an external device, wherein a determination is made as to whether or not the frame line of the entry column where the character is written contacts the character. Means, and when there are a plurality of entry fields in which the same content is recorded in the form, the determination means detects the entry field in which the frame line and the character do not touch, and detects the character written in the entry field. An optical character reader capable of outputting a recognition result of a character to the outside.
JP10147224A 1998-05-28 1998-05-28 Optical character reader Withdrawn JPH11338969A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10147224A JPH11338969A (en) 1998-05-28 1998-05-28 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10147224A JPH11338969A (en) 1998-05-28 1998-05-28 Optical character reader

Publications (1)

Publication Number Publication Date
JPH11338969A true JPH11338969A (en) 1999-12-10

Family

ID=15425388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10147224A Withdrawn JPH11338969A (en) 1998-05-28 1998-05-28 Optical character reader

Country Status (1)

Country Link
JP (1) JPH11338969A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10796143B2 (en) 2017-03-16 2020-10-06 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, and non-transitory computer readable medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10796143B2 (en) 2017-03-16 2020-10-06 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
JP2553608B2 (en) Optical character reader
JPH11338969A (en) Optical character reader
JPS6074094A (en) Character recognizing device
JPS5949671A (en) Optical character reader
JPH11184965A (en) Slip identification register device
JP4580520B2 (en) Character recognition method and character recognition apparatus
JPS5836391B2 (en) optical character reader
JP2768814B2 (en) Optical character reader
JP2925275B2 (en) Optical character reader
JP3191265B2 (en) Image input device and image input control method thereof
KR100447140B1 (en) storage apparatus and method for fingerprint characteristic data
JPS63137383A (en) Character reader
JPH0744682A (en) Picture reader
JPH05274473A (en) Optical character reader
JPS62267890A (en) Graphic recognizing device
JPS63120387A (en) Optical character reader
JPH02195430A (en) Character segmenting circuit
JPH0652351A (en) Optical character reader
JPH0272497A (en) Optical character reader
JPH10254981A (en) Image processor
JPH0478981A (en) Optical character reader
JPH01199285A (en) Optical character reader
JPS63251874A (en) Segmenting method for contact character
JPS63229583A (en) Method and device for fingerprint image collation
JPS6361387A (en) Character segmenting system

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050802