JPH11265424A - Method and device for recognizing character and recording medium - Google Patents

Method and device for recognizing character and recording medium

Info

Publication number
JPH11265424A
JPH11265424A JP10065369A JP6536998A JPH11265424A JP H11265424 A JPH11265424 A JP H11265424A JP 10065369 A JP10065369 A JP 10065369A JP 6536998 A JP6536998 A JP 6536998A JP H11265424 A JPH11265424 A JP H11265424A
Authority
JP
Japan
Prior art keywords
character
character string
handwritten
characters
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10065369A
Other languages
Japanese (ja)
Inventor
Shinobu Yamamoto
忍 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10065369A priority Critical patent/JPH11265424A/en
Publication of JPH11265424A publication Critical patent/JPH11265424A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To discriminate whether character strings inputted for one line are printed characters or handwritten characters and to provide character segmenting and recognizing method suitable for the respective characters. SOLUTION: A printed/ handwritten character string discriminating means 2 finds a feature amount concerning a stroke over the entire inputted character string pattern and discriminates whether the character string is printed or handwritten based on that feature amount. In the case of the printed character string as a result of discrimination, a character segmenting and recognizing means 3 for printed character is executed while collating that character string with a dictionary 5 for printed character but in the case of the handwritten character, a character segmenting and recognizing means 4 for handwritten character is executed while collating that character string with a dictionary 6 for handwritten character.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票などに記入さ
れた複数の文字からなる文字列を読み取る文字切り出し
方法および文字認識方法において、特に活字文字である
のか手書き文字であるのかが前もって明らかでない文字
列や、それらが混在する文字列について、精度よく文字
切り出しを行い認識する文字認識方法、装置および記録
媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character extracting method and a character recognizing method for reading a character string composed of a plurality of characters written on a form or the like, and it is not clear in advance whether a character is a print character or a handwritten character. The present invention relates to a character recognition method, apparatus, and recording medium for accurately extracting and recognizing a character string or a character string in which the character string is mixed.

【0002】[0002]

【従来の技術】従来、帳票の住所、所属氏名や電話番号
等を記入する欄は、主に手書き文字で書かれることを想
定していて、通常、手書き文字用の文字認識方法によっ
て読み取られる。また、上記した欄に、例えば住所が刻
印されたスタンプや住所が印刷されたシールなどによっ
て活字で記入されることもよくある。
2. Description of the Related Art Conventionally, columns for entering addresses, affiliations, telephone numbers, etc. of forms are assumed to be mainly written with handwritten characters, and are usually read by a character recognition method for handwritten characters. Further, in the above-mentioned fields, for example, a stamp with an address stamped thereon or a sticker on which the address is printed are often written in print.

【0003】ところで、一般に、活字の文字認識方法と
手書き文字の認識方法は、辞書やアルゴリズムが共通で
ない場合が多く、活字を手書き文字用の文字認織方法で
認識したり、あるいはその逆の方法では、認識誤りが増
加する結果となる。したがって、記入された文字が活字
であるか手書き文字であるかを判定することができれ
ば、それぞれに対応した文字認識方法を利用することが
でき、認識誤りの増加を防止できる。
In general, the character recognition method for printed characters and the method for recognizing handwritten characters often do not use the same dictionary or algorithm, and the characters are recognized by the character recognition method for handwritten characters or vice versa. This results in increased recognition errors. Therefore, if it is possible to determine whether the entered character is a printed character or a handwritten character, it is possible to use a character recognition method corresponding to each character, and it is possible to prevent an increase in recognition errors.

【0004】また、例えば記入する住所の番地部分や、
所属の部課名など、一部分を空白にしたスタンプやシー
ルで記入し、空白部分を手書き文字で補うことも多い。
したがって、1つの記入欄内の部分ごとに活字であるか
手書き文字であるかを判定できれば、そのような混在し
た文字列でも認識誤りを抑えることができる。
[0004] For example, the address part of the address to be filled in,
Often, the names of the departments to which they belong are filled in with stamps or stickers that are partially blank, and the blanks are often supplemented with handwritten characters.
Therefore, if it is possible to determine whether each part in one entry field is a printed character or a handwritten character, it is possible to suppress a recognition error even in such a mixed character string.

【0005】[0005]

【発明が解決しようとする課題】活字文字であるか手書
き文字かを判定する従来の文字認識装置として、例えば
特開平5−189604号公報に記載された光学的文字
読み取り装置がある。この装置では、活字文字か手書き
文字かの判定が1行分の文字列には対応していない。ま
た、複数の文字の高さのばらつきのみで判定しているた
め、文字数が少ない場合には正しい判定ができなくなる
可能性が高く、活字文字と手書き文字が混在している文
字列には適用できないという問題がある。
As a conventional character recognition device for determining whether a character is a printed character or a handwritten character, for example, there is an optical character reading device described in Japanese Patent Application Laid-Open No. Hei 5-189604. In this device, the determination of whether the character is a print character or a handwritten character does not correspond to a character string for one line. In addition, since the determination is made only based on the variation in the height of a plurality of characters, when the number of characters is small, there is a high possibility that a correct determination cannot be made, and the method cannot be applied to a character string in which printed characters and handwritten characters are mixed. There is a problem.

【0006】本発明の目的は、1行分の入力された文字
列に対して活字文字か手書き文字かを判定し、それぞれ
に適した文字切り出し方法と認識方法を実行するため、
予め記入される文字列の種類が分からなくても誤りの少
ない文字認識方法、装置および記録媒体を提供すること
にある。
SUMMARY OF THE INVENTION It is an object of the present invention to judge whether a character string of one line is a printed character or a handwritten character, and to execute a character cutout method and a recognition method suitable for each character string.
It is an object of the present invention to provide a character recognition method, apparatus, and recording medium with few errors even if the type of a character string to be entered in advance is unknown.

【0007】本発明の他の目的は、活字文字と手書き文
字が混在していても、部分文字列毎に活字文字か手書き
文字かを判定することにより、誤りの少ない文字認識方
法、装置および記録媒体を提供することにある。
Another object of the present invention is to provide a character recognition method, an apparatus, and a recording method that can determine whether a character is a handwritten character or a handwritten character, even if the characters are mixed with a handwritten character. To provide a medium.

【0008】[0008]

【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、帳票などに記入された文
字列パターンから文字パターンを切り出し、切り出され
た文字パターン毎に文字認識処理を行い、前記文字列パ
ターンに対応する文字認識結果を出力する文字認識方法
であって、前記入力された文字列パターンが活字である
か手書き文字であるかを判定し、前記文字列パターンが
活字からなる文字列であると判定されたとき、活字用の
文字認識処理を実行し、前記文字列パターンが手書き文
字からなる文字列であると判定されたとき、手書き文字
用の文字認識処理を実行することを特徴としている。
In order to achieve the above object, according to the first aspect of the present invention, a character pattern is cut out from a character string pattern written in a form or the like, and a character recognition process is performed for each cut out character pattern. And a character recognition method that outputs a character recognition result corresponding to the character string pattern, wherein it is determined whether the input character string pattern is a print character or a handwritten character, and the character string pattern is a print character. When it is determined that the character string is composed of a character string, a character recognition process for printed characters is performed. When the character string pattern is determined to be a character string composed of handwritten characters, a character recognition process for handwritten characters is performed. It is characterized by doing.

【0009】請求項2記載の発明では、帳票などに記入
された文字列パターンから文字パターンを切り出し、切
り出された文字パターン毎に文字認識処理を行い、前記
文字列パターンに対応する文字認識結果を出力する文字
認識方法であって、1文字単位で活字であるか手書き文
字であるかを判定し、該判定結果を基に、1つ以上の連
続する活字からなる部分活字列と1つ以上の連続する手
書き文字からなる部分手書き文字列とを作成し、前記部
分活字列に対して活字用の文字認識処理を実行し、前記
部分手書き文字列に対して手書き文字用の文字認識処理
を実行することを特徴としている。
According to the second aspect of the present invention, a character pattern is cut out from a character string pattern written on a form or the like, a character recognition process is performed for each cut character pattern, and a character recognition result corresponding to the character string pattern is obtained. A character recognition method to be output, in which it is determined whether a character is a character or a handwritten character on a character-by-character basis, and a partial character string consisting of one or more continuous characters and one or more characters are determined based on the determination result. A partial handwritten character string composed of continuous handwritten characters is created, a character recognition process for printed characters is performed on the partial printed character string, and a character recognition process for handwritten characters is performed on the partial handwritten character string. It is characterized by:

【0010】請求項3記載の発明では、帳票などに記入
された文字列パターンから文字パターンを切り出す手段
と、切り出された文字パターン毎に文字認識処理を行う
手段と、前記文字列パターンに対応する文字認識結果を
出力する手段とを備えた文字認識装置であって、前記入
力された文字列パターンが活字であるか手書き文字であ
るかを判定する手段と、前記文字列パターンが活字から
なる文字列であると判定されたとき、活字用の辞書と照
合しながら活字用の認識処理を行う手段と、前記文字列
パターンが手書き文字からなる文字列であると判定され
たとき、手書き用の辞書と照合しながら手書き文字用の
認識処理を行う手段とを備えたことを特徴としている。
According to the third aspect of the present invention, a means for cutting out a character pattern from a character string pattern entered in a form or the like, a means for performing a character recognition process for each cut out character pattern, and a method corresponding to the character string pattern Means for outputting a character recognition result, comprising: means for determining whether the input character string pattern is a printed character or a handwritten character; and Means for performing a type recognition process while collating with a dictionary for type when determined to be a string; and a dictionary for handwriting when the character string pattern is determined to be a character string composed of handwritten characters. Means for performing recognition processing for handwritten characters while collating with.

【0011】請求項4記載の発明では、帳票などに記入
された文字列パターンから文字パターンを切り出す手段
と、切り出された文字パターン毎に文字認識処理を行う
手段と、前記文字列パターンに対応する文字認識結果を
出力する手段とを備えた文字認識装置であって、1文字
単位で活字であるか手書き文字であるかを判定する手段
と、該判定結果を基に、1つ以上の連続する活字からな
る部分活字列と1つ以上の連続する手書き文字からなる
部分手書き文字列とを作成する手段と、前記作成された
部分活字列に対して、活字用の辞書と照合しながら活字
用の認識処理を行う手段と、前記作成された部分手書き
文字列に対して、手書き用の辞書と照合しながら手書き
文字用の認識処理を行う手段とを備えたことを特徴とし
ている。
According to the invention described in claim 4, means for cutting out a character pattern from a character string pattern entered in a form or the like, means for performing a character recognition process for each cut-out character pattern, and corresponding to the character string pattern A character recognition device comprising means for outputting a character recognition result, a means for determining whether a character is a printed character or a handwritten character, and one or more continuous characters based on the determination result. Means for creating a partial print string composed of prints and a partial handwritten character string consisting of one or more continuous handwritten characters; and comparing the created partial print strings with a dictionary for prints, It is characterized by comprising means for performing recognition processing, and means for performing recognition processing for handwritten characters on the created partial handwritten character string while collating it with a dictionary for handwriting.

【0012】請求項5記載の発明では、帳票などに記入
された文字列パターンから文字パターンを切り出す機能
と、切り出された文字パターン毎に文字認識処理を行う
機能と、前記文字列パターンに対応する文字認識結果を
出力する機能をコンピュータに実現させるためのプログ
ラムを記録したコンピュータ読み取り可能な記録媒体で
あって、前記入力された文字列パターンが活字であるか
手書き文字であるかを判定する機能と、前記文字列パタ
ーンが活字からなる文字列であると判定されたとき、活
字用の辞書と照合しながら活字用の認識処理を行う機能
と、前記文字列パターンが手書き文字からなる文字列で
あると判定されたとき、手書き用の辞書と照合しながら
手書き文字用の認識処理を行う機能をコンピュータに実
現させるためのプログラムを記録したコンピュータ読み
取り可能な記録媒体であることを特徴としている。
According to the fifth aspect of the present invention, there is provided a function of extracting a character pattern from a character string pattern entered in a form or the like, a function of performing a character recognition process for each extracted character pattern, and a function corresponding to the character string pattern. A computer-readable recording medium storing a program for causing a computer to output a function of outputting a character recognition result, wherein a function of determining whether the input character string pattern is a printed character or a handwritten character is provided. When the character string pattern is determined to be a character string composed of printed characters, a function of performing recognition processing for printed characters while collating with a dictionary for printed characters, and the character string pattern is a character string composed of handwritten characters. Is a program for realizing a function of performing a recognition process for handwritten characters while collating with a dictionary for handwriting. It is characterized by a computer-readable recording medium recording a gram.

【0013】請求項6記載の発明では、帳票などに記入
された文字列パターンから文字パターンを切り出す機能
と、切り出された文字パターン毎に文字認識処理を行う
機能と、前記文字列パターンに対応する文字認識結果を
出力する機能をコンピュータに実現させるためのプログ
ラムを記録したコンピュータ読み取り可能な記録媒体で
あって、1文字単位で活字であるか手書き文字であるか
を判定する機能と、該判定結果を基に、1つ以上の連続
する活字からなる部分活字列と1つ以上の連続する手書
き文字からなる部分手書き文字列とを作成する機能と、
前記作成された部分活字列に対して、活字用の辞書と照
合しながら活字用の認識処理を行う機能と、前記作成さ
れた部分手書き文字列に対して、手書き用の辞書と照合
しながら手書き文字用の認識処理を行う機能をコンピュ
ータに実現させるためのプログラムを記録したコンピュ
ータ読み取り可能な記録媒体であることを特徴としてい
る。
According to the present invention, a function of extracting a character pattern from a character string pattern written on a form or the like, a function of performing a character recognition process for each of the extracted character patterns, and a function corresponding to the character string pattern are provided. A computer-readable recording medium storing a program for causing a computer to output a function of outputting a character recognition result, the function of determining whether a character is a printed character or a handwritten character in units of one character, A function of creating a partial print string consisting of one or more continuous print letters and a partial hand print string consisting of one or more continuous hand print characters based on
A function of performing a type recognition process on the created partial print string while comparing it with a dictionary for print, and a function of writing on the created partial handwritten character string while checking it against a dictionary for handwriting It is a computer-readable recording medium on which a program for causing a computer to perform a function of performing character recognition processing is recorded.

【0014】[0014]

【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。 〈実施例1〉図1は、本発明の実施例1の構成を示す。
図において、1は文字画像を入力する入力手段、2は入
力された文字列パターンが活字からなるか手書き文字か
らなるかを判定する活字手書き文字列判定手段、3は活
字用の文字切り出しおよび認識手段、4は手書き文字用
の文字切り出しおよび認識手段、5は活字用辞書、6は
手書き用辞書、7は出力手段である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be specifically described below with reference to the drawings. <Embodiment 1> FIG. 1 shows the structure of Embodiment 1 of the present invention.
In the figure, 1 is an input means for inputting a character image, 2 is a printed handwritten character string determining means for determining whether an input character string pattern is composed of printed characters or handwritten characters, and 3 is character cutout and recognition for printed characters. Means 4, character extraction and recognition means for handwritten characters, reference numeral 5, reference character dictionary, reference numeral 6, handwriting dictionary, and reference numeral 7, output means.

【0015】図2は、実施例1の処理フローチャートで
ある。入力手段1は、1つの記入枠に1行分の複数の文
字を書くことができる帳票などに記入された文字列パタ
ーンから1文字以上の文字パターンを切り出し、活字手
書き文字列判定手段2に文字パターンを入力する(ステ
ップ101)。
FIG. 2 is a processing flowchart of the first embodiment. The input means 1 cuts out one or more character patterns from a character string pattern written in a form or the like in which a plurality of characters for one line can be written in one entry frame, and outputs the character pattern to the printed handwritten character string determination means 2. A pattern is input (step 101).

【0016】活字手書き文字列判定手段2として、本出
願人が先に提案した特願平8−323009号に記載の
方法を用いる。図3は、活字手書き文字列判定手段2の
構成を示し、画像データのノイズ除去や傾き補正などの
前処理を実行する前処理部21と、画像データから1文
字ごとの文字データを抽出し、大きさの正規化を行う文
字データ抽出部22と、1文字の文字データの中から、
文字が活字であるか手書き文字であるかを判定するため
の特徴を抽出する特徴抽出部23と、その特徴に基いて
文字列が活字であるか手書き文字であるかを判定する文
字種類判定部24からなる。
As the printed handwritten character string determination means 2, a method described in Japanese Patent Application No. 8-323909 previously proposed by the present applicant is used. FIG. 3 shows a configuration of the printed handwritten character string determination unit 2, a preprocessing unit 21 for performing preprocessing such as noise removal and inclination correction of image data, and extracting character data for each character from the image data. From the character data extraction unit 22 for normalizing the size and the character data of one character,
A feature extracting unit 23 for extracting a feature for determining whether a character is a printed character or a handwritten character, and a character type determining unit for determining whether a character string is a printed character or a handwritten character based on the feature 24.

【0017】図4は、活字の文字データの例を示し、図
5は、手書き文字の文字データの例を示す。特徴抽出部
23は、文字データから、水平方向と垂直方向に連続す
る画素の並び(ラン)を抽出する。図6は、図4の一部
を拡大して画素単位で表したものであり、図7は、図5
の一部を拡大して画素単位で表したものである。図6、
図7において、黒く塗りつぶした画素の並びが、それぞ
れの水平方向ランの一つを表している。
FIG. 4 shows an example of character data of printed characters, and FIG. 5 shows an example of character data of handwritten characters. The feature extraction unit 23 extracts, from the character data, a row (run) of pixels that are continuous in the horizontal and vertical directions. FIG. 6 is an enlarged view of a part of FIG. 4 and expressed in pixel units.
Are enlarged and expressed in pixel units. FIG.
In FIG. 7, the arrangement of pixels painted black represents one of the horizontal runs.

【0018】このランの長さを、ランに含まれる画素の
数で表し、文字の全体にわたって水平方向ラン、垂直方
向ランの長さとランの数の分布を求める。そして、予め
定められたしきい値t1以上の長さをもつランの数とラ
ンの総数との比rを求め、ストロークの方向性に関する
特徴量とする。
The length of the run is represented by the number of pixels included in the run, and the distribution of the lengths of the horizontal run and the vertical run and the number of runs over the entire character is obtained. Then, a ratio r between the number of runs having a length equal to or longer than a predetermined threshold value t1 and the total number of runs is obtained, and is set as a feature amount relating to the directionality of the stroke.

【0019】通常、活字は水平方向の直線や垂直方向の
直線を含むことが多いが、手書き文字は右上がりなどの
筆記癖のために、水平方向や垂直方向の直線を書いたつ
もりでもその方向が水平方向や垂直方向からずれること
が多い。そのため、手書き文字は、活字に比べて長い水
平方向ランや長い垂直方向ランが少なくなる。
Normally, printed characters often include a horizontal straight line and a vertical straight line. However, handwritten characters tend to write in a horizontal or vertical direction due to writing habits such as rising to the right. Often deviates from the horizontal and vertical directions. For this reason, handwritten characters have fewer horizontal runs and longer vertical runs than printed characters.

【0020】したがって、長いランの数とランの総数と
の比を特徴量とすることによって、対象文字が、活字で
あるか手書き文字であるかを効果的に判定することがで
きる。本実施例では、上記したように、1つの文字に対
して実行しているストロークに関する特徴量を、入力さ
れた文字列パターン全体にわたって求める(ステップ1
02)。そして、文字種類判定部24では、このストロ
ークの方向性に関する特徴量rが、予め定められたしき
い値t2より大きければ活字列であると判定し(ステッ
プ103、104)、小さければ手書き文字列であると
判定する(ステップ103、106)。
Therefore, by using the ratio between the number of long runs and the total number of runs as the feature quantity, it is possible to effectively determine whether the target character is a printed character or a handwritten character. In the present embodiment, as described above, the feature amount relating to the stroke executed for one character is obtained over the entire input character string pattern (step 1).
02). Then, the character type determination unit 24 determines that the character string r is a printed character string if the characteristic amount r relating to the directionality of the stroke is larger than a predetermined threshold value t2 (steps 103 and 104). Is determined (steps 103 and 106).

【0021】上記判定の結果、活字列であれば、活字用
辞書5と照合しながら活字用の文字切り出しおよび認識
手段3を実行し(ステップ105)、手書き文字列であ
れば、手書き文字用辞書6と照合しながら手書き文字用
の文字切り出しおよび認識手段4を実行し(ステップ1
07)、認識結果を出力手段7に出力する(ステップ1
08)。
If the result of the determination is that the character string is a character string, the character extracting and recognizing means 3 is executed while comparing it with the character dictionary 5 (step 105). The character extracting and recognizing means 4 for handwritten characters is executed while collating with step 6 (step 1).
07), and outputs the recognition result to the output means 7 (step 1).
08).

【0022】このように、本実施例では、入力された文
字列に対して、活字列か手書き文字列かを判定し、適切
な文字切り出しおよび認識手段を実行しているので、誤
りの少ない文字切り出しおよび認識方法を実現できる。
なお、上記した実施例では、文字のストロークの方向性
に関する特徴量を求めているが、本実施例はこれに限定
されず、文字のストロークの太さ、ストロークの直線
性、ストロークの角に関する特徴量などを用いてもよ
い。
As described above, in the present embodiment, a character string or a handwritten character string is determined for an input character string, and appropriate character cutout and recognition means are executed. A clipping and recognition method can be realized.
In the above-described embodiment, the characteristic amount relating to the directionality of the stroke of the character is obtained. However, the present embodiment is not limited to this, and the characteristics relating to the thickness of the character stroke, the linearity of the stroke, and the angle of the stroke are obtained. A quantity or the like may be used.

【0023】〈実施例2〉図8は、本発明の実施例2の
構成を示す。図8において、32は1文字単位で活字で
あるか手書き文字であるかを判定する活字手書き文字判
定手段、33は活字手書き文字判定手段による判定結果
を基に、1つ以上の連続する活字からなる部分活字列と
1つ以上の連続する手書き文字からなる部分手書き文字
列とを作成する部分文字列構成手段である。他の構成は
実施例1と同様である。
<Embodiment 2> FIG. 8 shows the configuration of Embodiment 2 of the present invention. In FIG. 8, reference numeral 32 denotes a printed handwritten character determination unit that determines whether a character is a printed character or a handwritten character, and reference numeral 33 denotes one or more continuous printed characters based on the determination result by the printed handwritten character determination unit. This is a partial character string forming means for creating a partial print character string and a partial handwritten character string composed of one or more continuous handwritten characters. Other configurations are the same as in the first embodiment.

【0024】図9は、実施例2の処理フローチャートで
ある。図8の活字手書き文字判定手段32では、まず、
図10(a)に示すような入力文字列の周辺分布を求
め、文字間の空白を表す度数によって文字列を、(b)
に示すように1つ以上の文字候補の組に分割する(ステ
ップ202)。この処理においては、分離文字などの文
字が分割されたとしても(図の例では、「都」、「筑」
など)、それぞれを適切に活字か手書き文字かを判定す
れば同じ部分文字列に含まれるため、厳密な文字切り出
し結果を得る必要はない。
FIG. 9 is a processing flowchart of the second embodiment. In the print type handwritten character determination means 32 of FIG.
A marginal distribution of the input character string as shown in FIG. 10A is obtained, and the character string is represented by a frequency representing a space between characters.
(Step 202). In this processing, even if a character such as a separated character is divided (in the example of the figure, “Mitsuto”, “Chiku”
Etc.), it is not necessary to obtain a strict character cut-out result since each is properly included in the same partial character string if it is determined whether it is a printed character or a handwritten character.

【0025】そして、実施例1で説明したと同様に、活
字手書き文字判定手段32は、1つの文字に対して実行
しているストロークに関する特徴量を、個々の文字候補
に対して求め(ステップ203)、予め定められた閾値
を基に、それぞれの文字候補が活字か(ステップ20
4、205)、手書き文字かを判定する(ステップ20
4、208)。
Then, in the same manner as described in the first embodiment, the printed handwritten character determination means 32 obtains a characteristic amount related to a stroke executed for one character for each character candidate (step 203). ), Based on a predetermined threshold, whether each character candidate is a print type (step 20).
4, 205), it is determined whether the character is a handwritten character (step 20).
4, 208).

【0026】次に、部分文字列構成手段33では、図1
1に示すように、1つ以上の活字が連続する文字候補の
組を部分活字列として組み合わせ(ステップ206)、
1つ以上の手書き文字が連続する文字候補の組を部分手
書き文字列として組み合わせる(ステップ209)。そ
して、部分活字列に対しては、活字用辞書34と照合す
ることにより、活字用の文字切り出しおよび認識手段3
5を実行し(ステップ207)、部分手書き文字列に対
しては、手書き文字用辞書36と照合することにより、
手書き文字用の文字切り出しおよび認識手段37を実行
し(ステップ210)、認識結果を出力手段38に出力
する(ステップ211)。
Next, in the partial character string forming means 33, FIG.
As shown in FIG. 1, a combination of character candidates in which one or more characters are continuous is combined as a partial character string (step 206).
A set of character candidates in which one or more handwritten characters are continuous is combined as a partial handwritten character string (step 209). Then, by comparing the partial print string with the print dictionary 34, the character cutout and recognition means 3 for print is used.
5 (step 207), and the partial handwritten character string is collated with the handwritten character dictionary 36,
The character extraction and recognition means 37 for handwritten characters is executed (step 210), and the recognition result is output to the output means 38 (step 211).

【0027】このように、実施例2では、文字単位で活
字か手書き文字かを判定し、それらの組み合わせで部分
文字列を構成し、部分文字列ごとに適切な文字切り出し
および認識手段を実行しているので、活字と手書き文字
が混在している文字列に対しても、誤りの少ない文字切
り出しおよび認識方法を実現できる。
As described above, in the second embodiment, it is determined whether a character is a printed character or a handwritten character, and a partial character string is formed by a combination thereof, and an appropriate character extracting and recognizing means is executed for each partial character string. Therefore, even for a character string in which printed characters and handwritten characters are mixed, a character extraction and recognition method with few errors can be realized.

【0028】〈実施例3〉本発明は上記した実施例に限
定されず、ソフトウェアによっても実現することができ
る。本発明をソフトウェアによって実現する場合には、
図12に示すように、CPU、メモリ、表示装置、ハー
ドディスク、キーボード、CD−ROMドライブ、スキ
ャナなどからなるコンピュータシステムを用意し、CD
−ROMなどのコンピュータ読み取り可能な記録媒体に
は、本発明の文字認識機能を実現するプログラムなどが
記録されている。また、認識対象となる帳票などの文字
画像はハードディスクなどに格納されている。そして、
該プログラムが起動されると、文字画像データが読み込
まれて、活字か手書き文字かを判定する文字認識処理を
実行し、その認識結果をディスプレイなどに出力する。
<Embodiment 3> The present invention is not limited to the above-described embodiment, but can be realized by software. When the present invention is realized by software,
As shown in FIG. 12, a computer system including a CPU, a memory, a display device, a hard disk, a keyboard, a CD-ROM drive, a scanner, and the like is prepared.
-A computer-readable recording medium such as a ROM stores a program for realizing the character recognition function of the present invention. In addition, a character image such as a form to be recognized is stored in a hard disk or the like. And
When the program is started, the character image data is read, a character recognition process for determining whether the character is a printed character or a handwritten character is executed, and the recognition result is output to a display or the like.

【0029】[0029]

【発明の効果】以上、説明したように、請求項1、3、
5記載の発明によれば、入力された文字列に対して、活
字列か手書き文字列かを判定し、その判定結果を基に適
切な文字切り出しおよび認識手段を実行しているので、
誤りの少ない文字切り出しおよび認識方法を実現するこ
とができる。
As described above, claims 1 and 3,
According to the fifth aspect of the invention, it is determined whether the input character string is a character string or a handwritten character string, and appropriate character cutout and recognition means are executed based on the determination result.
A character extraction and recognition method with few errors can be realized.

【0030】請求項2、4、6記載の発明によれば、文
字単位で活字か手書き文字かを判定し、それらの組み合
わせで部分文字列を構成し、部分文字列ごとに適切な文
字切り出しおよび認識手段を実行しているので、活字と
手書き文字が混在している文字列に対しても、誤りの少
ない文字切り出しおよび認識方法を実現することができ
る。
According to the second, fourth and sixth aspects of the present invention, it is determined whether a character is a printed character or a handwritten character, and a partial character string is formed by combining the characters. Since the recognizing means is executed, it is possible to realize a character extracting and recognizing method with less errors even for a character string in which printed characters and handwritten characters are mixed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例1の構成を示す。FIG. 1 shows a configuration of a first exemplary embodiment of the present invention.

【図2】本発明の実施例1の処理フローチャートであ
る。
FIG. 2 is a processing flowchart according to the first embodiment of the present invention.

【図3】活字手書き文字列判定手段の構成を示す。FIG. 3 shows a configuration of a printed handwritten character string determination unit.

【図4】活字の文字データの例を示す。FIG. 4 shows an example of character data of printed characters.

【図5】手書き文字データの例を示す。FIG. 5 shows an example of handwritten character data.

【図6】図4の一部を拡大して画素単位で表した図であ
る。
FIG. 6 is an enlarged view of a part of FIG.

【図7】図5の一部を拡大して画素単位で表した図であ
る。
FIG. 7 is a diagram in which a part of FIG. 5 is enlarged and represented in pixel units.

【図8】本発明の実施例2の構成を示す。FIG. 8 shows a configuration of a second exemplary embodiment of the present invention.

【図9】本発明の実施例2の処理フローチャートであ
る。
FIG. 9 is a processing flowchart according to a second embodiment of the present invention.

【図10】入力された文字列を文字候補に分割した図で
ある。
FIG. 10 is a diagram in which an input character string is divided into character candidates.

【図11】部分文字列の構成例を示す。FIG. 11 shows a configuration example of a partial character string.

【図12】本発明の実施例3の構成を示す。FIG. 12 shows a configuration of a third exemplary embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 入力手段 2 活字手書き文字列判定手段 3 活字用文字切り出しおよび認識手段 4 手書き文字用文字切り出しおよび認識手段 5 活字用辞書 6 手書き用辞書 7 出力手段 DESCRIPTION OF SYMBOLS 1 Input means 2 Printed handwritten character string judgment means 3 Printed character cutout and recognition means 4 Handwritten character cutout and recognition means 5 Printed dictionary 6 Handwritten dictionary 7 Output means

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 帳票などに記入された文字列パターンか
ら文字パターンを切り出し、切り出された文字パターン
毎に文字認識処理を行い、前記文字列パターンに対応す
る文字認識結果を出力する文字認識方法であって、前記
入力された文字列パターンが活字であるか手書き文字で
あるかを判定し、前記文字列パターンが活字からなる文
字列であると判定されたとき、活字用の文字認識処理を
実行し、前記文字列パターンが手書き文字からなる文字
列であると判定されたとき、手書き文字用の文字認識処
理を実行することを特徴とする文字認識方法。
1. A character recognition method for extracting a character pattern from a character string pattern written in a form or the like, performing a character recognition process for each of the extracted character patterns, and outputting a character recognition result corresponding to the character string pattern. Then, it is determined whether the input character string pattern is a printed character or a handwritten character, and when it is determined that the character string pattern is a character string composed of printed characters, a character recognition process for printed characters is executed. When the character string pattern is determined to be a character string composed of handwritten characters, a character recognition process for handwritten characters is performed.
【請求項2】 帳票などに記入された文字列パターンか
ら文字パターンを切り出し、切り出された文字パターン
毎に文字認識処理を行い、前記文字列パターンに対応す
る文字認識結果を出力する文字認識方法であって、1文
字単位で活字であるか手書き文字であるかを判定し、該
判定結果を基に、1つ以上の連続する活字からなる部分
活字列と1つ以上の連続する手書き文字からなる部分手
書き文字列とを作成し、前記部分活字列に対して活字用
の文字認識処理を実行し、前記部分手書き文字列に対し
て手書き文字用の文字認識処理を実行することを特徴と
する文字認識方法。
2. A character recognition method for extracting a character pattern from a character string pattern written in a form or the like, performing a character recognition process for each of the extracted character patterns, and outputting a character recognition result corresponding to the character string pattern. Then, it is determined whether a character is a character or a handwritten character on a character-by-character basis, and based on the result of the determination, a character string consisting of one or more continuous characters and one or more continuous handwritten characters Creating a partially handwritten character string, performing a character recognition process for the type on the partial character string, and performing a character recognition process for the handwritten character on the partial handwritten character string. Recognition method.
【請求項3】 帳票などに記入された文字列パターンか
ら文字パターンを切り出す手段と、切り出された文字パ
ターン毎に文字認識処理を行う手段と、前記文字列パタ
ーンに対応する文字認識結果を出力する手段とを備えた
文字認識装置であって、前記入力された文字列パターン
が活字であるか手書き文字であるかを判定する手段と、
前記文字列パターンが活字からなる文字列であると判定
されたとき、活字用の辞書と照合しながら活字用の認識
処理を行う手段と、前記文字列パターンが手書き文字か
らなる文字列であると判定されたとき、手書き用の辞書
と照合しながら手書き文字用の認識処理を行う手段とを
備えたことを特徴とする文字認識装置。
3. A means for cutting out a character pattern from a character string pattern entered in a form, a means for performing a character recognition process for each cut out character pattern, and outputting a character recognition result corresponding to the character string pattern. Means for determining whether the input character string pattern is a printed character or a handwritten character,
When the character string pattern is determined to be a character string composed of printed characters, means for performing a recognition process for printed characters while collating with a dictionary for printed characters, and that the character string pattern is a character string composed of handwritten characters Means for performing recognition processing for handwritten characters while collating with a dictionary for handwriting when the judgment is made.
【請求項4】 帳票などに記入された文字列パターンか
ら文字パターンを切り出す手段と、切り出された文字パ
ターン毎に文字認識処理を行う手段と、前記文字列パタ
ーンに対応する文字認識結果を出力する手段とを備えた
文字認識装置であって、1文字単位で活字であるか手書
き文字であるかを判定する手段と、該判定結果を基に、
1つ以上の連続する活字からなる部分活字列と1つ以上
の連続する手書き文字からなる部分手書き文字列とを作
成する手段と、前記作成された部分活字列に対して、活
字用の辞書と照合しながら活字用の認識処理を行う手段
と、前記作成された部分手書き文字列に対して、手書き
用の辞書と照合しながら手書き文字用の認識処理を行う
手段とを備えたことを特徴とする文字認識装置。
4. A means for cutting out a character pattern from a character string pattern entered in a form or the like, a means for performing a character recognition process for each cut out character pattern, and outputting a character recognition result corresponding to the character string pattern. Means for determining whether a character is a printed character or a handwritten character on a character-by-character basis, based on the determination result,
Means for creating a partial character string consisting of one or more continuous characters and a partial handwriting character string consisting of one or more consecutive handwritten characters; and a dictionary for type characters for the created partial character string. Means for performing recognition processing for printed characters while collating, and means for performing recognition processing for handwritten characters while collating the created partial handwritten character string with a dictionary for handwriting. Character recognition device.
【請求項5】 帳票などに記入された文字列パターンか
ら文字パターンを切り出す機能と、切り出された文字パ
ターン毎に文字認識処理を行う機能と、前記文字列パタ
ーンに対応する文字認識結果を出力する機能をコンピュ
ータに実現させるためのプログラムを記録したコンピュ
ータ読み取り可能な記録媒体であって、前記入力された
文字列パターンが活字であるか手書き文字であるかを判
定する機能と、前記文字列パターンが活字からなる文字
列であると判定されたとき、活字用の辞書と照合しなが
ら活字用の認識処理を行う機能と、前記文字列パターン
が手書き文字からなる文字列であると判定されたとき、
手書き用の辞書と照合しながら手書き文字用の認識処理
を行う機能をコンピュータに実現させるためのプログラ
ムを記録したコンピュータ読み取り可能な記録媒体。
5. A function for extracting a character pattern from a character string pattern written on a form or the like, a function for performing a character recognition process for each of the extracted character patterns, and outputting a character recognition result corresponding to the character string pattern. A computer-readable recording medium recording a program for realizing a function in a computer, wherein the function is to determine whether the input character string pattern is a printed character or a handwritten character, and the character string pattern is When it is determined that it is a character string consisting of print characters, a function of performing a recognition process for print characters while collating with a dictionary for print characters, and when it is determined that the character string pattern is a character string consisting of handwritten characters,
A computer-readable recording medium in which a program for causing a computer to perform a function of performing recognition processing for handwritten characters while collating with a dictionary for handwriting is recorded.
【請求項6】 帳票などに記入された文字列パターンか
ら文字パターンを切り出す機能と、切り出された文字パ
ターン毎に文字認識処理を行う機能と、前記文字列パタ
ーンに対応する文字認識結果を出力する機能をコンピュ
ータに実現させるためのプログラムを記録したコンピュ
ータ読み取り可能な記録媒体であって、1文字単位で活
字であるか手書き文字であるかを判定する機能と、該判
定結果を基に、1つ以上の連続する活字からなる部分活
字列と1つ以上の連続する手書き文字からなる部分手書
き文字列とを作成する機能と、前記作成された部分活字
列に対して、活字用の辞書と照合しながら活字用の認識
処理を行う機能と、前記作成された部分手書き文字列に
対して、手書き用の辞書と照合しながら手書き文字用の
認識処理を行う機能をコンピュータに実現させるための
プログラムを記録したコンピュータ読み取り可能な記録
媒体。
6. A function for extracting a character pattern from a character string pattern written on a form or the like, a function for performing a character recognition process for each of the extracted character patterns, and outputting a character recognition result corresponding to the character string pattern. A computer-readable recording medium in which a program for causing a computer to realize a function is provided. A function of determining whether a character is a printed character or a handwritten character in units of one character, and one based on the determination result. A function of creating a partial print string consisting of the above continuous print characters and a partial handwritten character string consisting of one or more continuous handwritten characters, and comparing the created partial print string with a dictionary for print use. And a function of performing a recognition process for handwritten characters while comparing the created partial handwritten character string with a dictionary for handwriting. Computer-readable recording medium on which a program for causing a computer to realize the above is recorded.
JP10065369A 1998-03-16 1998-03-16 Method and device for recognizing character and recording medium Pending JPH11265424A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10065369A JPH11265424A (en) 1998-03-16 1998-03-16 Method and device for recognizing character and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10065369A JPH11265424A (en) 1998-03-16 1998-03-16 Method and device for recognizing character and recording medium

Publications (1)

Publication Number Publication Date
JPH11265424A true JPH11265424A (en) 1999-09-28

Family

ID=13284994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10065369A Pending JPH11265424A (en) 1998-03-16 1998-03-16 Method and device for recognizing character and recording medium

Country Status (1)

Country Link
JP (1) JPH11265424A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100428271C (en) * 2005-09-22 2008-10-22 夏普株式会社 Image determinant method, image processing apparatus and image output apparatus
US20150356761A1 (en) * 2014-06-09 2015-12-10 Ricoh Company, Ltd. Information processing apparatus, information processing method and recording medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100428271C (en) * 2005-09-22 2008-10-22 夏普株式会社 Image determinant method, image processing apparatus and image output apparatus
US20150356761A1 (en) * 2014-06-09 2015-12-10 Ricoh Company, Ltd. Information processing apparatus, information processing method and recording medium
US9363413B2 (en) * 2014-06-09 2016-06-07 Ricoh Company, Ltd. Information processing apparatus, information processing method and recording medium for distinguishing handwritten text applied to a printed document

Similar Documents

Publication Publication Date Title
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
JP3445394B2 (en) How to compare at least two image sections
JP5500480B2 (en) Form recognition device and form recognition method
JP3904840B2 (en) Ruled line extraction device for extracting ruled lines from multi-valued images
JP3452774B2 (en) Character recognition method
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP3294995B2 (en) Form reader
JP2004139484A (en) Form processing device, program for implementing it, and program for creating form format
JP2001283152A (en) Device and method for discrimination of forms and computer readable recording medium stored with program for allowing computer to execute the same method
JP4280355B2 (en) Character recognition device
JPH10116340A (en) Bit map comparing device and method therefor
JP2000293626A (en) Method and device for recognizing character and storage medium
US7680329B2 (en) Character recognition apparatus and character recognition method
JP2989495B2 (en) Document paper recognition method and system
JP5041775B2 (en) Character cutting method and character recognition device
CN115880708A (en) Method for detecting character paragraph spacing compliance in APP (application) aging-adapted mode
JPH11265424A (en) Method and device for recognizing character and recording medium
JP3467437B2 (en) Character recognition apparatus and method and program recording medium
JP3730073B2 (en) Template creation method, apparatus, and recording medium recording template creation program
JPH10162102A (en) Character recognition device
JP2751865B2 (en) String recognition device
JPH11328306A (en) Method and device for extracting logical element of document image, and record medium
JP2004046723A (en) Method for recognizing character, program and apparatus used for implementing the method
JP3090070B2 (en) Form identification method and device
JPH11184976A (en) Dictionary learning system and character recognition device