JPS6224378A - Deciding system for character area - Google Patents

Deciding system for character area

Info

Publication number
JPS6224378A
JPS6224378A JP60163675A JP16367585A JPS6224378A JP S6224378 A JPS6224378 A JP S6224378A JP 60163675 A JP60163675 A JP 60163675A JP 16367585 A JP16367585 A JP 16367585A JP S6224378 A JPS6224378 A JP S6224378A
Authority
JP
Japan
Prior art keywords
character
frame
characters
loop
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60163675A
Other languages
Japanese (ja)
Inventor
Masahiko Yoshimoto
雅彦 吉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP60163675A priority Critical patent/JPS6224378A/en
Publication of JPS6224378A publication Critical patent/JPS6224378A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To set or change a character frame in a free form and a free size by adding a character frame having a color different from those of characters around the characters on a form and recognizing the character frame. CONSTITUTION:A character/frame detecting sensor 1 reads the characters and character frames and a character pattern detecting sensor 2 detects only the characters on a form. A frame recognizing part 3 receives the signals from both sensors 1 and 2 to obtain the difference between both output signals and delivers the frame data to store it in a frame storage memory 5. The part 3 uses a loop detecting method to the data recorded to the memory 5 to detect a closed loop and calculates a rectangle which is circumscribed to said loop. Then the position of the upper left apex of the rectangle together with the vertical and horizontal lengths are determined. The information on these factors are sent to a character segmenting part 4 in the form of character frame codes. A code showing the end of the form is delivered when no closed loop is detected any more at the part 3.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、光学式文字読取装置における文字領域決定方
式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a character area determination method in an optical character reading device.

[従来の技術] 従来の光学式文字読取装置において文字枠を削除するに
は、その文字枠にドロップアウトカラーを用いることに
よって、読取以前にその文字枠を削除してしまう方法が
ある。
[Prior Art] In order to delete a character frame in a conventional optical character reading device, there is a method of using a dropout color for the character frame to delete the character frame before reading.

また1文字枠を認識する方法としては、帳票上の水平方
向の長線分と、その垂直方向の長線分とを検出し1両長
線分の位置関係を調べることによって、文字枠の認識を
行なう方法がある。
Another method for recognizing a single character frame is to detect a long line segment in the horizontal direction and a long line segment in the vertical direction on a form, and to check the positional relationship between both long line segments. There is.

しかし、上記方法においては、文字枠の位置、形状、大
きさに制限があり、自由度が少ないという問題がある。
However, the above method has a problem in that there are restrictions on the position, shape, and size of the character frame, and the degree of freedom is limited.

また、帳票自体の複写を行なうことができないという問
題がある。
Another problem is that the form itself cannot be copied.

[発明の目的] 本発明は、上記従来例の問題点に若目してなされたもの
であり、自由な形状、自由な大きさで文字枠を設定また
は変更することができる光学式文字読取装置における文
字領域決定方式を提供するものである。
[Object of the Invention] The present invention has been made to address the above-mentioned problems of the conventional example, and provides an optical character reading device that can set or change a character frame in any shape and size. This provides a character area determination method for.

【発明の実施例] 第1図は、本発明の一実施例を示すブロック図である。[Embodiments of the invention] FIG. 1 is a block diagram showing one embodiment of the present invention.

文字および枠検出用センサ1は、帳票からの反射光を受
け、この反射光をラスター走査し、光電変換するもので
ある。
The character and frame detection sensor 1 receives reflected light from a form, raster scans the reflected light, and photoelectrically converts the reflected light.

文字図形検出用センサ2は、文字図形のみを選択的に検
出するものであり1文字枠と同じ色の反射光のみを遮断
する光学フィルタを介して、帳票からの反射光を受け、
この反射光をラスター走査し光電変換するものである。
The character/figure detection sensor 2 selectively detects only character/figures, and receives reflected light from the form via an optical filter that blocks only the reflected light of the same color as one character frame.
This reflected light is raster scanned and photoelectrically converted.

たとえば1文字枠に赤色を使用しである場合には1文字
図形検出用センサ2に設けられたフィルタは、赤色光を
遮断し他の色の光を透過する特性のものが使用されてい
る。
For example, when red is used for one character frame, the filter provided in the sensor 2 for detecting one character and figure is of a characteristic of blocking red light and transmitting light of other colors.

枠認識部3は、2つのセンサ1,2からの信号の差を求
め、予め設定しである閾値によって、上記差の信号を二
値化処理するものである。枠記憶用メモリ5は、枠認識
部3の出力信号を記憶するものである。また、枠認識部
3は、1枚の帳票の入力が完了した後に1画像記録用メ
モリ5に記録されたデータについて、公知のループ検出
方法を用いることによって、閉ループを検出するもので
ある。
The frame recognition unit 3 determines the difference between the signals from the two sensors 1 and 2, and binarizes the difference signal using a preset threshold. The frame storage memory 5 stores the output signal of the frame recognition section 3. Furthermore, the frame recognition unit 3 detects a closed loop in the data recorded in the one-image recording memory 5 after the input of one form is completed, by using a known loop detection method.

文字切り出し部4は、枠認識部3において得られた文字
枠の位1面と大きさに基づいて、文字図形記憶用メモリ
6に蓄えられた画像から、1文字毎に切り出しを行なう
ものである。
The character cutting unit 4 cuts out each character from the image stored in the character/figure storage memory 6 based on the character frame digit and size obtained by the frame recognition unit 3. .

特徴抽出部7は、文字切り出し部4から送られた1文字
のデータから、特徴を抽出するものである。a刷部8は
、特徴抽出部7からの特徴データと、辞書部9からのデ
ータとを比較することによって、認識処理を行なうもの
である。
The feature extractor 7 extracts features from the data of one character sent from the character cutter 4. The a printing section 8 performs recognition processing by comparing the feature data from the feature extraction section 7 and the data from the dictionary section 9.

次に、上記実施例の動作について説明する。Next, the operation of the above embodiment will be explained.

まず、第2図に示す@票があったとする。この帳票は、
所定の色を使用した文字「た」 「こ」「い」 「か」
が描かれており、この帳票に、2つの文字枠を追加した
とする。この文字枠は、上記文字の色とは異なる色(た
とえば赤色)で描かれ、丸と四角とで構成されている。
First, let us assume that there is an @ vote as shown in FIG. This form is
Characters “ta”, “ko”, “i” and “ka” using specified colors
Assume that two character frames are added to this form. This character frame is drawn in a color different from the color of the characters (for example, red) and is composed of circles and squares.

そして、第2図に示す帳票を読み取る。この場合、文字
および枠検出用センサlによって、上記文字と上記文字
枠とが読取られ1文字図形検出用センサ2によって1文
字「た」 「こ」 「い」「か」のみが検出される。こ
こで1文字図形検出用センサ2が、文字枠を読取らない
のは、文字枠に使用されている赤色の光を通過させない
光学フィルタを有するためである。
Then, the form shown in FIG. 2 is read. In this case, the character and frame detection sensor 1 reads the character and the character frame, and the single character figure detection sensor 2 detects only the characters ``ta'', ``ko'', ``i'', and ``ka''. The reason why the single character figure detection sensor 2 does not read the character frame is because it has an optical filter that does not allow the red light used in the character frame to pass through.

そして、枠認識部3が、センサlと2からの信号を受け
1両出力信号の差を求めることによって、枠のデータを
出力し、この枠のデータが枠記憶用メモリ5に記憶され
る。
Then, the frame recognition unit 3 receives the signals from the sensors 1 and 2 and calculates the difference between the output signals of both sensors, thereby outputting frame data, and this frame data is stored in the frame storage memory 5.

つまり、枠認識部3は、枠記憶用メモリ5に記録された
データに対して、ループ検出方法を用いて閉ループを検
出する。そして、閉ループが検出されたならば、この閉
ループに外接する矩形を算出し、この矩形の左上の頂点
の位置と、その矩形の縦および横の長さを求め、これら
の情報を文字枠のコードとして1文字切り出し部4へ送
る。
That is, the frame recognition unit 3 detects a closed loop in the data recorded in the frame storage memory 5 using a loop detection method. If a closed loop is detected, calculate the rectangle that circumscribes this closed loop, find the position of the top left vertex of this rectangle, and the length and width of that rectangle, and use this information as the character frame code. The character is sent to the character extraction unit 4 as a character.

そして、枠認識部3における閉ループの検出がなくなっ
たときに、帳票の終了を示すコードが出力される。
Then, when the frame recognition unit 3 no longer detects a closed loop, a code indicating the end of the form is output.

一方1文字図形検出用センサ2からの文字図形データが
、文字図形記憶用メモリ6に記憶される。なお、枠記憶
用メモリ5には、第3図に示す枠3a、3bのデータと
して、枠が記憶されている。
On the other hand, character/graphic data from the single character/graphic detection sensor 2 is stored in the character/graphic storage memory 6. Note that frames are stored in the frame storage memory 5 as data for frames 3a and 3b shown in FIG.

そして、文字切り出し部4が文字図形記憶用メモリ6か
ら、1文字分を切り出す、この場合は。
Then, the character cutting section 4 cuts out one character from the character/figure storage memory 6, in this case.

まず1文字「た」のデータが取り出され、特徴抽出部7
によってその特徴が抽出され、その特徴データと辞書部
9からのデータとを識別部8によって1別し、文字「た
」の認識結果を出力する。同様にして、文字「か」のデ
ータも識別部8から出力される。
First, the data of one character "ta" is extracted, and the feature extraction unit 7
The characteristic data is extracted by the character recognition unit 8, and the recognition unit 8 separates the characteristic data from the data from the dictionary unit 9, and outputs the recognition result of the character “ta”. Similarly, data for the character "ka" is also output from the identification section 8.

なお、識別部8における認識結果は、第4図に示すよう
に文字「た」の情報4aと、文字「か」の情報4bが得
られる。
As shown in FIG. 4, the recognition result in the identification unit 8 is information 4a for the character "ta" and information 4b for the character "ka".

上記11例において、文字枠の形状は矩形に限定される
ことはなく、閉ループでありさえすれば、丸、四角以外
の他の形状であってもよい。
In the above 11 examples, the shape of the character frame is not limited to a rectangle, and may be any shape other than round or square as long as it is a closed loop.

また、その文字枠は、定型枠、手書きの自由枠のいずれ
にも適用でき、帳票毎に自由に文字枠を設定等できる。
Further, the character frame can be applied to either a fixed frame or a free handwritten frame, and the character frame can be freely set for each form.

すなわち1文字枠の大きさおよび位置を任意に設定でき
る。したがって、文字の大きさまたは@票の形式につい
ての制限がなく、より実用的な光学式文字認識装置を構
成することが可能である。
That is, the size and position of one character frame can be set arbitrarily. Therefore, there are no restrictions on the size of characters or the format of @ votes, and it is possible to construct a more practical optical character recognition device.

なお、文字図形検出用センサ2において、光学フィルタ
の透過波長を変更する機構を追加すれば、文字枠として
用いることのできる色の種類が多くなる。また、既存の
文字枠が存在している場合、それと同一の帳票内に、既
存の文字枠の色とは異なる色の文字枠を用いることによ
って、上記既存の文字枠を変更せずに、新たな文字枠を
設定しそれを認識することができる。
Note that if a mechanism for changing the transmission wavelength of the optical filter is added to the character/figure detection sensor 2, the types of colors that can be used as the character frame will increase. In addition, if an existing character frame exists, by using a character frame in a different color from the existing character frame in the same document, you can create a new character frame without changing the existing character frame. You can set a character frame and recognize it.

[発明の効果] 本発明によれば、光学式文字読取装置における文字領域
決定方式において自由な形状、自由な大きさで文字枠を
設定または変更することができ、また、その文字枠は、
定型枠1手書きの自由枠のいずれにも適用でき、@票毎
に自由に文字枠を設定等できるという効果を有する。
[Effects of the Invention] According to the present invention, a character frame can be set or changed in a free shape and size in a character area determination method in an optical character reading device, and the character frame can be
The fixed form frame 1 can be applied to any handwritten free frame, and has the effect of freely setting a character frame for each @ vote.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は5本発明の一実施例を示すブロック図である。 第2図は、上記実施例の動作を説明するための帳票の一
例を示す図である。 第3図は、第2図に示した帳票を読取った結果、文字枠
を検出した場合の例を示す図である。 第4図は、第2図に示す帳票から切り出された文字図形
を示す図である。 1・・・文字および枠検出用センサ、 2・・・文字図形検出用センナ。 3・・・枠認識部、 4・・・文字切り出し部。 5・・・枠記憶用メモリ、 6・・・文字図形記憶用メモリ。
FIG. 1 is a block diagram showing an embodiment of the present invention. FIG. 2 is a diagram showing an example of a form for explaining the operation of the above embodiment. FIG. 3 is a diagram showing an example of a case where a character frame is detected as a result of reading the form shown in FIG. FIG. 4 is a diagram showing character figures cut out from the form shown in FIG. 2. 1...Sensor for character and frame detection, 2...Sensor for character/figure detection. 3... Frame recognition section, 4... Character cutting section. 5...Memory for frame memory, 6...Memory for character/figure memory.

Claims (1)

【特許請求の範囲】[Claims] 未知文字の字形を読取る光学式文字読取装置において、
前記文字の色と異なる色を有する文字枠を、帳票上にお
ける前記文字の周囲に付し、前記文字枠を認識すること
によって、文字領域の決定を行うことを特徴とする文字
領域決定方式。
In an optical character reader that reads the shape of unknown characters,
A character area determination method characterized in that a character frame having a color different from the color of the characters is attached around the characters on a form, and a character area is determined by recognizing the character frame.
JP60163675A 1985-07-24 1985-07-24 Deciding system for character area Pending JPS6224378A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60163675A JPS6224378A (en) 1985-07-24 1985-07-24 Deciding system for character area

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60163675A JPS6224378A (en) 1985-07-24 1985-07-24 Deciding system for character area

Publications (1)

Publication Number Publication Date
JPS6224378A true JPS6224378A (en) 1987-02-02

Family

ID=15778457

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60163675A Pending JPS6224378A (en) 1985-07-24 1985-07-24 Deciding system for character area

Country Status (1)

Country Link
JP (1) JPS6224378A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291392A (en) * 1988-05-19 1989-11-22 Nec Corp Character frame position storage circuit

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4933852A (en) * 1972-07-29 1974-03-28
JPS4945936A (en) * 1972-09-08 1974-05-02
JPS5731185A (en) * 1980-07-31 1982-02-19 Matsushita Electric Ind Co Ltd Light-emitting device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4933852A (en) * 1972-07-29 1974-03-28
JPS4945936A (en) * 1972-09-08 1974-05-02
JPS5731185A (en) * 1980-07-31 1982-02-19 Matsushita Electric Ind Co Ltd Light-emitting device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291392A (en) * 1988-05-19 1989-11-22 Nec Corp Character frame position storage circuit

Similar Documents

Publication Publication Date Title
JPS6224378A (en) Deciding system for character area
JPH0548510B2 (en)
JPH0291789A (en) Character recognizing system
JPS61296481A (en) Document reader
JPH0564396B2 (en)
JP2877380B2 (en) Optical character reader
JP3162575B2 (en) Character recognition device
JP3160458B2 (en) Character reading device and character reading method
JP2722549B2 (en) Optical character reader
JPS6045884A (en) Character frame delecting device for character recognizer
JPH0373916B2 (en)
JPH0576674B2 (en)
JP2659182B2 (en) Character recognition device
JPH04192090A (en) Optical character reader
JPH0475557B2 (en)
JP2669434B2 (en) Optical character reader
JPS61187086A (en) Optical character reader
JPH0426153B2 (en)
JPH0528314A (en) Optical character reader
JP2925270B2 (en) Character reader
JPS62194590A (en) Character recognizing system
JPH03161888A (en) Optical character reader
JPH034386A (en) Optical character reader
JPH06301813A (en) Character read method
JPH05298484A (en) Optical character reader