JPH0816724A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH0816724A
JPH0816724A JP6144245A JP14424594A JPH0816724A JP H0816724 A JPH0816724 A JP H0816724A JP 6144245 A JP6144245 A JP 6144245A JP 14424594 A JP14424594 A JP 14424594A JP H0816724 A JPH0816724 A JP H0816724A
Authority
JP
Japan
Prior art keywords
character
dictionary
field
characters
typical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6144245A
Other languages
Japanese (ja)
Other versions
JP3292595B2 (en
Inventor
Yasuhiro Ura
康裕 浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP14424594A priority Critical patent/JP3292595B2/en
Publication of JPH0816724A publication Critical patent/JPH0816724A/en
Application granted granted Critical
Publication of JP3292595B2 publication Critical patent/JP3292595B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To properly recognize a handwritten character without being affected by the habit of a person who writes the character by recognizing the character by extracting any typical character from characters to be inputted, registering that typical character and collating the characters to be inputted with the registered typical character. CONSTITUTION:Concerning the character recognition device for recognizing the character by segmenting the character to be inputted and collating it with a dictionary 1, this device is provided with a dictionary registering means 18 for extracting and registering the typical character among characters, second dictionary means 19 on which the typical character is registered by the dictionary registering means 18, and second recognition means 20 for recognizing the character by collating the character to be inputted with the typical character. Then, the typical character such as a character in the shortest distance from the dictionary 17 is extracted among the characters to be inputted, for example, and registered on the second dictionary 19 and the character recognition is performed by collating the registered typical character with the characters to be inputted. Thus, the handwritten character can be properly recognized without being affected by the habit of the person who writes the character.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字を入力して文字認
識結果を出力する文字認識装置に関する。文字認識装置
として、例えば保険契約書,売上伝票,払込取扱書など
の帳票上に印刷または記入された文字を読み取り、認識
した結果を画面上やプリンタに出力、またはメモリ上に
保存する装置がある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device for inputting characters and outputting a character recognition result. As a character recognition device, for example, there is a device that reads characters printed or entered on forms such as insurance contracts, sales slips, payment handling manuals, etc., and outputs the recognized results on a screen or a printer or in a memory. .

【0002】手書き文字を認識する場合には、手書き文
字の字形がその文字を書いた人の癖に左右されやすく、
正確に識別するのは困難であった。したがって、手書き
文字の認識を正確に行うことができる文字認識装置の開
発が要望されていた。
When recognizing a handwritten character, the shape of the handwritten character is easily influenced by the habit of the person who wrote the character,
It was difficult to identify accurately. Therefore, it has been desired to develop a character recognition device that can accurately recognize handwritten characters.

【0003】[0003]

【従来の技術】従来の文字認識装置としては、例えば図
7に示すようなものがある。図7において、1は帳票の
入力部であり、入力部1はイメージスキャナよりなり、
帳票の入力を行う。2はフィールド検出部であり、フィ
ールド検出部2は、入力部1より入力された帳票のフィ
ールドを検出する。フィールドは、例えば郵便番号のよ
うなひとまとまりの記入単位を指す。
2. Description of the Related Art As a conventional character recognition device, for example, there is one shown in FIG. In FIG. 7, reference numeral 1 denotes a form input unit, and the input unit 1 is an image scanner,
Enter the form. Reference numeral 2 denotes a field detection unit, and the field detection unit 2 detects a field of the form input from the input unit 1. A field refers to a unit of entry, such as a postal code.

【0004】3は文字切出し部であり、文字切出し部3
はフィールド検出部2で検出したフィールド内から1文
字ごとのイメージを切り出す。4は認識部であり、認識
部4はフィールド上の切り出された文字と辞書5とをテ
ンプレートを用いて照合し、文字認識を行う。認識部4
で文字認識した認識結果は、文字コードとして出力部6
に送られる。出力部6は表示部またはプリンタよりな
り、文字コードに対応する認識文字を表示または印字す
る。
Reference numeral 3 is a character cutout portion, and the character cutout portion 3
Cuts out an image for each character from the field detected by the field detector 2. Reference numeral 4 is a recognition unit, and the recognition unit 4 collates the cut out characters on the field with the dictionary 5 using a template to perform character recognition. Recognition unit 4
The recognition result obtained by recognizing the characters is output as a character code by the output unit 6.
Sent to The output unit 6 includes a display unit or a printer, and displays or prints a recognized character corresponding to the character code.

【0005】ここで、前記辞書5は、文字認識装置の作
成者によって用意されており、辞書5の内容は作成者の
判断によって作成されていた。したがって、文字を書く
人の字形の癖は考慮されることがなかった。
Here, the dictionary 5 was prepared by the creator of the character recognition device, and the contents of the dictionary 5 were created by the creator's judgment. Therefore, the glyphistic habit of the person who writes the character was not considered.

【0006】[0006]

【発明が解決しようとする課題】このような従来の文字
認識装置にあっては、辞書の内容は、作成者の判断によ
って作成され、文字を書く人の字形の癖には一切関与し
ないようになっているため、文字を書く人の癖によって
左右されやすい手書き文字を、自動的に正しく識別する
ことは困難であった。
In such a conventional character recognizing device, the contents of the dictionary are created by the creator's judgment so as not to be involved in the character shape habit of the person who writes the character. Therefore, it is difficult to automatically and correctly identify handwritten characters that are easily influenced by the habit of the person who writes the characters.

【0007】本発明は、このような従来の問題点に鑑み
てなされたものであって、文字を書く人の癖に左右され
ず、手書き文字を正しく認識することができる文字認識
装置を提供することを目的とする。
The present invention has been made in view of such conventional problems, and provides a character recognition device which can recognize handwritten characters correctly without being influenced by the habit of the person who writes the characters. The purpose is to

【0008】[0008]

【課題を解決するための手段】図1は本発明の原理説明
図である。本発明は、入力する文字を切り出して辞書1
7と照合して文字認識を行う文字認識装置において、前
記文字のうち典型的な文字を取り出して登録する辞書登
録手段18と、該辞書登録手段18によって前記典型的
な文字が登録される第2の辞書19と、前記入力する文
字と前記典型的な文字とを照合し文字認識を行う第2の
認識手段20を備えたことを特徴とする。
FIG. 1 is a diagram illustrating the principle of the present invention. The present invention cuts out characters to be input and extracts the dictionary 1
In the character recognition device for character recognition by collating with 7, the dictionary registration means 18 for extracting and registering a typical character among the characters, and the dictionary registration means 18 for registering the typical character And a second recognition means 20 for performing character recognition by collating the input character with the typical character.

【0009】また、本発明は、帳票上の特定の領域をフ
ィールドとして検出するフィールド検出手段を設け、該
フィールド検出手段により検出されたフィールド上の文
字と前記辞書17とを照合して文字認識を行った後、前
記第2の辞書19には前記フィールドごとに前記典型的
な文字を登録することを特徴とする。また、本発明は、
前記典型的な文字が、前記辞書17と距離が最も小さい
文字であることを特徴とする。
Further, according to the present invention, field detecting means for detecting a specific area on a form as a field is provided, and the character on the field detected by the field detecting means is collated with the dictionary 17 for character recognition. After the execution, the typical character is registered in the second dictionary 19 for each field. Also, the present invention
The typical character is a character having the smallest distance from the dictionary 17.

【0010】[0010]

【作用】このような構成を備えた本発明の文字認識装置
によれば、入力する文字のうち典型的な文字、例えば辞
書17との距離が最も小さい文字を取り出して、第2の
辞書19に登録し、登録した典型的な文字と入力する文
字とを照合して文字認識を行うようにしたため、文字を
書く人の癖に左右されることなく手書き文字を正しく認
識することができる。
According to the character recognition apparatus of the present invention having such a configuration, of the characters to be input, a typical character, for example, a character having the smallest distance from the dictionary 17, is taken out and is stored in the second dictionary 19. Since the character recognition is performed by registering and registering the registered typical character with the input character, the handwritten character can be correctly recognized without being influenced by the habit of the person who writes the character.

【0011】また、帳票上の特定の領域をフィールドと
して検出し、フィールドごとに第2の辞書19を生成す
るため、例えば一枚の帳票上で異なるフィールドを別の
人が書いているような場合にも、手書き文字を正しく認
識することができる。
Further, since a specific area on the form is detected as a field and the second dictionary 19 is generated for each field, for example, when another person writes different fields on one form. Also, handwritten characters can be correctly recognized.

【0012】[0012]

【実施例】以下、本発明の実施例を図面に基づいて説明
する。図2〜図6は本発明の一実施例を示す図である。
図2は本発明の一実施例に係る文字認識装置のブロック
図である。図2において、11はイメージスキャナより
なる入力部であり、入力部11は帳票の入力を行う。1
2はフィールド検出手段としてのフィールド検出部であ
り、フィールド検出部12は、帳票内の任意のフィール
ドの検出を行う。すなわち、フィールド検出部12は、
帳票のフォーマットを、フィールドの位置や大きさなど
の既知情報として与えておくことにより、入力された帳
票のフィールドを検出する。ここでいうフィールドと
は、住所,名前,金額欄といった、ひとまとまりの記入
単位を指す。
Embodiments of the present invention will be described below with reference to the drawings. 2 to 6 are views showing an embodiment of the present invention.
FIG. 2 is a block diagram of a character recognition device according to an embodiment of the present invention. In FIG. 2, reference numeral 11 denotes an input unit including an image scanner, and the input unit 11 inputs a form. 1
Reference numeral 2 denotes a field detecting unit as a field detecting unit, and the field detecting unit 12 detects an arbitrary field in the form. That is, the field detector 12
By inputting the format of the form as known information such as the position and size of the field, the field of the input form is detected. The field here refers to a unit of entry such as address, name, and amount column.

【0013】図3に帳票の例を示す。図3の帳票13は
保険契約申込書の例であり、郵便番号,都道府県,市郡
区,町村字,丁番号などのひとまとまりの記入単位14
A〜14Qがそれぞれフィールド14を構成する。郵便
番号は2つのフィールド14A,14Bよりなり、住所
は5つのフィールド14C〜14Gよりなり、保険契約
申込者は、氏,名の2つのフィールド14H,14Iよ
りなり、被保険者は、氏,名の2つのフィールド14
J,14Kよりなり、電話番号は、市外,市内,番号の
3つのフィールド14L〜14Nよりなり、申込年月日
は、年,月,日の3つのフィールド14O〜14Qより
なるが、郵便番号,住所,保険契約申込者,被保険者,
電話番号,申込年月日を1つのフィールドとして取り扱
っても良い。
FIG. 3 shows an example of a form. The form 13 shown in FIG. 3 is an example of an insurance contract application form, and is a unit of a unit 14 such as a postal code, a prefecture, a city / ward, a town / village, and a number.
Each of A to 14Q constitutes the field 14. The postal code consists of two fields 14A and 14B, the address consists of five fields 14C to 14G, the insurance contract applicant consists of two fields 14H and 14I of name and name, and the insured person consists of name and name. Two fields of 14
J, 14K, the telephone number consists of three fields 14L to 14N for out-of-city, local, and number, and the application date consists of three fields 14O to 14Q for year, month, and day. Number, address, insurance contract applicant, insured,
The telephone number and the date of application may be treated as one field.

【0014】さらに、また、帳票13全体を一つのフィ
ールドとして取り扱うようにしても良い。図2におい
て、15は文字切出し部であり、文字切出し部15はフ
ィールド検出部12により検出したフィールド14内か
ら1文字ごとのイメージを切り出す。
Furthermore, the entire form 13 may be treated as one field. In FIG. 2, reference numeral 15 is a character cutout unit, and the character cutout unit 15 cuts out an image for each character from the field 14 detected by the field detection unit 12.

【0015】16は第1の認識部であり、第1の認識部
16はあらかじめ組み込まれている大分類用の第1の辞
書17を用いて、対象となるフィールド14上の文字の
認識を行う。第1の認識部16は、認識結果と、テンプ
レートとの距離を出力結果として辞書登録手段としての
辞書登録部18に出力する。辞書登録部18は、第1の
辞書17との距離が最も小さい文字を典型的な文字とし
てフィールド14ごとに第2の辞書19に登録する。ま
た、第2の辞書19内にはあらかじめ第1の辞書17と
同じものを登録しておく。
Reference numeral 16 is a first recognition unit, and the first recognition unit 16 recognizes the character on the target field 14 by using a first-classified dictionary 17 for large classification. . The first recognition unit 16 outputs the recognition result and the distance between the template and the template to the dictionary registration unit 18 as a dictionary registration unit as an output result. The dictionary registration unit 18 registers the character having the smallest distance from the first dictionary 17 as a typical character in the second dictionary 19 for each field 14. In addition, the same dictionary as the first dictionary 17 is registered in the second dictionary 19 in advance.

【0016】図4はフィールドと認識結果と距離の説明
図である。図4において、A,A,B,C,A,Cは、
フィールド14内の文字の認識結果を示す。a1
2 ,b1 ,c1 ,am ,cn は第1の辞書17との各
距離を示す。したがって、カテゴリAと認識された文字
がm個あり、また、カテゴリCと認識された文字がn個
あり、また、カテゴリBと認識された文字が1個あるこ
とを示す。
FIG. 4 is an explanatory diagram of fields, recognition results, and distances. In FIG. 4, A, A, B, C, A and C are
The recognition result of the character in the field 14 is shown. a 1 ,
a 2, b 1, c 1 , a m, is c n indicating the respective distances between the first dictionary 17. Therefore, it indicates that there are m characters recognized as category A, n characters recognized as category C, and 1 character recognized as category B.

【0017】カテゴリAと認識された文字がm個ある場
合、その中の距離a1 ,a2 ,amのうち最も距離が小
さい文字、例えば距離a1 に対応する文字パターンAを
第2の辞書19のカテゴリの部分に登録する。また、カ
テゴリCと認識された文字がn個ある場合、その中の距
離c1 ,cnのうち最も距離が小さい文字、例えば距離
1 に対応する文字パターンCを第2の辞書19のカテ
ゴリCの部分に登録する。
The character is recognized category A may of m is, the distance a 1 therein, a 2, a whose distance is small characters of m, for example, the distance a 1 character pattern A of the second corresponding to It is registered in the category portion of the dictionary 19. Further, when a character is recognized category C there are n, whose distance is small character among distances c 1, c n therein, a character pattern C corresponding to the example, the distance c 1 of the second dictionary 19 categories Register in part C.

【0018】また、カテゴリBと認識された文字が1個
しかない場合、その距離b1 に対応する文字パターンB
を第2の辞書19のカテゴリBの部分に登録する。ま
た、図5はフィールドと認識結果と距離の他の説明図で
ある。図5において、14はフィールドであり、このフ
ィールド14は6つの枠より構成され、フィールド14
内には手書き文字が書かれる。
When there is only one character recognized as category B, the character pattern B corresponding to the distance b 1
Is registered in the category B portion of the second dictionary 19. FIG. 5 is another explanatory diagram of fields, recognition results, and distances. In FIG. 5, 14 is a field, and this field 14 is composed of 6 frames.
Handwritten characters are written inside.

【0019】0,0,1,2,0,2はフィールド14
内の文字の認識結果である。a1 ,a2 ,b1 ,c1
3 ,c2 は第1の辞書17との距離を示す。したがっ
て、カテゴリ0と認識された文字が3個あり、カテゴリ
1と認識された文字が1個あり、カテゴリ2と認識され
た文字が2個あることを示す。カテゴリ0と認識された
文字が3個ある場合、その中の距離a1 ,a2 ,a3
うち最も距離が小さい文字、例えば距離a1 に対応する
文字が第2の辞書19のカテゴリ0の部分に登録され
る。
0, 0, 1, 2, 0, 2 is field 14
It is the recognition result of the character inside. a 1 , a 2 , b 1 , c 1 ,
a 3 and c 2 indicate the distance from the first dictionary 17. Therefore, it indicates that there are three characters recognized as category 0, one character recognized as category 1, and two characters recognized as category 2. When there are three characters recognized as category 0, the character having the smallest distance among the distances a 1 , a 2 , and a 3 , among them, for example, the character corresponding to the distance a 1 is the category 0 of the second dictionary 19. Will be registered in the part.

【0020】また、カテゴリ2と認識された文字が2個
ある場合、その中の距離c1 ,c2のうち距離が小さい
方の文字、例えば距離c1 に対応する文字が第2の辞書
19のカテゴリ2の部分に登録される。また、カテゴリ
1と認識された文字は1個しかないので、その文字(距
離b1に対応する文字)が第2の辞書19のカテゴリ1
の部分に登録される。
When there are two characters recognized as category 2, the character having the smaller distance out of the distances c 1 and c 2 , for example, the character corresponding to the distance c 1 is the second dictionary 19 Is registered in the category 2 part of the. Further, since there is only one character recognized as category 1, that character (character corresponding to the distance b 1 ) is the category 1 of the second dictionary 19.
Will be registered in the part.

【0021】図2に戻り、20は第2の認識手段として
の第2の認識部であり、第2の認識部20はフィールド
14のすべての文字に対して第2の辞書19を用いて文
字認識を行う。すなわち、第2の認識部20は、第2の
辞書19にフィールド14ごとに登録された、第1の辞
書17との距離が最も小さい文字、すなわち典型的な文
字と再度入力したフィールド14内の文字とを照合し、
その認識結果を出力部21に与える。出力部21は表示
部またはプリンタよりなり、認識結果を表示または印刷
する。
Returning to FIG. 2, reference numeral 20 denotes a second recognition unit as a second recognition unit, and the second recognition unit 20 uses the second dictionary 19 for all the characters in the field 14. To recognize. That is, the second recognizing unit 20 registers the character registered in the second dictionary 19 for each field 14 and having the smallest distance from the first dictionary 17, that is, the typical character in the field 14 that has been re-input. Match the character,
The recognition result is given to the output unit 21. The output unit 21 includes a display unit or a printer, and displays or prints the recognition result.

【0022】次に、動作を説明する。図6は動作を説明
するためのフローチャートである。図6において、ま
ず、ステップS1で入力部11により帳票13の入力を
行う。帳票13としては、例えば図3に示すような保険
契約申込書がある。この帳票13のフィールド14には
郵便番号などが手書きされる。
Next, the operation will be described. FIG. 6 is a flowchart for explaining the operation. In FIG. 6, first, in step S1, the input unit 11 inputs the form 13. As the form 13, for example, there is an insurance contract application form as shown in FIG. A postal code or the like is handwritten in the field 14 of the form 13.

【0023】次に、ステップS2でフィールド検出部1
2により入力された帳票13のフィールド14の検出を
行う。フィールド14の検出は、帳票13上の規定の領
域である、郵便番号,都道府県などのように、ひとまと
まりの記入単位14A〜14Qごとに行うが、住所,保
険契約申込書,被保険者,電話番号などのように複数の
フィールド14をまとめてひとつのフィールドとしても
良い。
Next, in step S2, the field detector 1
The field 14 of the form 13 input by 2 is detected. The field 14 is detected for each unit of the entry unit 14A to 14Q, such as a postal code or a prefecture, which is a prescribed area on the form 13, but the address, insurance contract application form, insured person, A plurality of fields 14 such as a telephone number may be combined into one field.

【0024】さらに、帳票13全体を一つのフィールド
として取り扱うようにしても良い。この場合には、フィ
ールド検出部12を省略することができる。次に、ステ
ップS3で文字切出し部15によりフィールド検出部1
2で検出したフィールド14内から一文字ごとのイメー
ジを切り出す。次に、ステップS4で第1の認識部16
により第1の辞書17を用いて対象となるフィールド1
4内の手書き文字の認識を行う。そして、ステップS5
で第1の認識部16により認識した結果とテンプレート
との距離を辞書登録部18に出力する。すなわち、認識
対象文字と第1の辞書17を照合し、テンプレートから
はみ出る部分の距離が最も小さい文字パターンを認識結
果として距離とともに出力する。
Further, the entire form 13 may be treated as one field. In this case, the field detector 12 can be omitted. Next, in step S3, the field detecting unit 1 is operated by the character extracting unit 15.
An image for each character is cut out from the field 14 detected in 2. Next, in step S4, the first recognition unit 16
By using the first dictionary 17 the target field 1
The handwritten characters in 4 are recognized. Then, step S5
Then, the distance between the result recognized by the first recognition unit 16 and the template is output to the dictionary registration unit 18. That is, the recognition target character is collated with the first dictionary 17, and the character pattern having the smallest distance of the portion protruding from the template is output together with the distance as the recognition result.

【0025】次に、ステップS6で1つのフィールド1
4内のすべての文字の認識が終了したか否かを判別し、
終了していない場合には、ステップS3に戻り、ステッ
プS3で次の文字を切り出し、終了した場合にはステッ
プS7に進む。ステップS7ではカテゴリ数iを設定
し、順次取り込む。カテゴリ数iとしては、例えば図5
に示すようにカテゴリが数字の場合には、1,2,3,
4,5,6,7,8,9,0がカテゴリ数iとなる。
Next, in step S6, one field 1
Determine whether all the characters in 4 have been recognized,
If not completed, the process returns to step S3, the next character is cut out in step S3, and if completed, the process proceeds to step S7. In step S7, the number of categories i is set and sequentially fetched. The number of categories i is, for example, as shown in FIG.
When the category is a number as shown in, 1, 2, 3,
The number of categories i is 4, 5, 6, 7, 8, 9, and 0.

【0026】次に、ステップS8ではフィールド内文字
数jを設定し、順次取り込む。フィールド内文字数jと
しては、例えば図5に示すように、フィールド14のブ
ロックが6個の場合には1,2,3,4,5,6がフィ
ールド内文字数jとなる。次に、ステップS9でカテゴ
リ数Ciと認識結果数Ajが一致するか判別する。カテ
ゴリ数Ciとしては、図5の場合を例にとると、C1
1、C2 は2、C3 は3、C4 は4、C5 は5、C6
6、C7 は7、C8 は8、C9 は9、C0 は0となる。
Next, in step S8, the number j of characters in the field is set and sequentially fetched. For example, as shown in FIG. 5, when the number of blocks in the field 14 is 6, the number of characters in the field j is 1, 2, 3, 4, 5, 6 as the number of characters in the field j. Next, in step S9, it is determined whether the number of categories Ci and the number of recognition results Aj match. As an example of the number of categories Ci in the case of FIG. 5, C 1 is 1, C 2 is 2, C 3 is 3, C 4 is 4, C 5 is 5, C 6 is 6, and C 7 is 7. , C 8 is 8, C 9 is 9, and C 0 is 0.

【0027】また、認識結果数Ajとしては、図5の場
合を例にとると、A1 は0、A2 は0、A3 は1、A4
は2、A5 は0、A6 は2となる。したがって、C0
1、C0 =A2 、C0 =A5 、C1 =A3 、C2 =A
4 、C2 =A6 のとき、Ci=Ajとなる。次に、ステ
ップS10でどのAjの距離がCiの中で最小であるか
否かを判別し、ステップS11でAiの距離が最小のも
のをmi とする。
As the recognition result number Aj, taking the case of FIG. 5 as an example, A 1 is 0, A 2 is 0, A 3 is 1, and A 4 is
Is 2, A 5 is 0, and A 6 is 2. Therefore, C 0 =
A 1 , C 0 = A 2 , C 0 = A 5 , C 1 = A 3 , C 2 = A
When C 4 and C 2 = A 6 , Ci = Aj. Next, in step S10, it is determined which Aj distance is the smallest in Ci, and in step S11, the Ai distance is set to mi.

【0028】A1 の距離はa1 、A2 の距離はa2 、A
5 の距離はa3 であり、a1 ,a2,a3 のうち、例え
ばa1 が最小であると判別された場合には、A1 をm1
とする。また、A4 の距離はc1 、A6 の距離はc2
あり、例えばc1 <c2 のときはA4 をm4 とする。ま
た、C1 は1個しかなく、A3 の距離はb1 であるの
で、A3 をm3 とする。
The distance A 1 is a 1 , the distance A 2 is a 2 , A
The distance of 5 is a 3 , and when it is determined that, for example, a 1 is the smallest among a 1 , a 2 , and a 3 , A 1 is set to m 1
And The distance A 4 is c 1 and the distance A 6 is c 2. For example, when c 1 <c 2 , A 4 is m 4 . Since there is only one C 1 and the distance of A 3 is b 1 , A 3 is m 3 .

【0029】次に、ステップS12でフィールド14内
の典型的な文字の取出しが終了したら、ステップS13
でmi に対応するカテゴリを第2の辞書19に登録す
る。すなわち、距離a1 に対応する文字0、距離b1
対応する文字1、距離C1 に対応する文字2をそれぞれ
第2の辞書19の各カテゴリの部分に登録する。次に、
ステップS14で再度帳票13の入力を行い、フィール
ド14を検出し、一文字の切り出しを行う。
Next, when the extraction of typical characters in the field 14 is completed in step S12, step S13
The category corresponding to mi is registered in the second dictionary 19. That is, the character 0 corresponding to the distance a 1 , the character 1 corresponding to the distance b 1 , and the character 2 corresponding to the distance C 1 are registered in the respective category portions of the second dictionary 19. next,
In step S14, the form 13 is input again, the field 14 is detected, and one character is cut out.

【0030】次に、ステップS15で再入力した文字と
第2の辞書19とを照合する。すなわち、再入力した文
字と第2の辞書19に登録された、第1の辞書17との
距離が最も小さい文字、すなわち、典型的な文字とを照
合する。そして、ステップS16で全てのフィールド1
4について第1の認識部16および第2の認識部20に
よる文字認識が終了したら、ステップS17で認識結果
を出力部21に与え、ステップS18で出力部21は認
識結果を表示または印刷する。
Next, the characters re-entered in step S15 are collated with the second dictionary 19. That is, the re-entered character and the character registered in the second dictionary 19 and having the smallest distance from the first dictionary 17, that is, a typical character is collated. Then, in step S16, all fields 1
When the character recognition by the first recognition unit 16 and the second recognition unit 20 for 4 is completed, the recognition result is given to the output unit 21 in step S17, and the output unit 21 displays or prints the recognition result in step S18.

【0031】このように、手書き文字の詳細識別のため
の第2の辞書19を、フィールド14内の文字から第1
の辞書17との距離が最も小さい文字である典型的な文
字を取り出して生成するようにしたため、すなわち、フ
ィールド14ごとに典型的な文字が登録された第2の辞
書19を生成するようにしたため、文字を書いた人の癖
がそのまま第2の辞書19に反映されることになり、文
字を書く人の癖に左右されることなく、手書き文字を正
しく認識することができる。
As described above, the second dictionary 19 for the detailed identification of the handwritten character is firstly selected from the characters in the field 14.
Since a typical character that is the character with the smallest distance from the dictionary 17 is extracted and generated, that is, the second dictionary 19 in which the typical character is registered for each field 14 is generated. , The habit of the person who wrote the character is reflected in the second dictionary 19 as it is, and the handwritten character can be correctly recognized without being influenced by the habit of the person who writes the character.

【0032】また、フィールド14ごとに詳細識別用の
第2の辞書19を生成するため、例えば一枚の帳票13
上に異なるフィールド14を別の人が書いているような
場合でも対応することができる。なお、本実施例におい
ては、フィールド検出部12によって帳票13上の特定
の領域をフィールド14として検出するようにしたが、
帳票全体を一つのフィールドとみなすことによりフィー
ルド検出部12を省略しても良い。帳票全体の文字数が
少ない場合には、こうした方が能率的である。
Since the second dictionary 19 for detailed identification is generated for each field 14, for example, one form 13 is used.
Even if another field 14 is written by another person, it can be dealt with. In this embodiment, the field detector 12 detects a specific area on the form 13 as the field 14.
The field detection unit 12 may be omitted by regarding the entire form as one field. This is more efficient when the total number of characters in the form is small.

【0033】[0033]

【発明の効果】以上説明してきたように、本発明によれ
ば、入力する文字のうち典型的な文字を取り出して第2
の辞書に登録し、入力する文字と登録した典型的な文字
とを照合して文字認識を行うようにしたため、文字を書
く人の癖に左右されず、手書き文字を正しく識別するこ
とができる。
As described above, according to the present invention, a typical character is extracted from the characters to be input and the second character is extracted.
Since the character recognition is performed by registering in the dictionary and collating the input character with the registered typical character, the handwritten character can be correctly identified regardless of the habit of the person who writes the character.

【0034】また、フィールドごとに詳細識別用の第2
の辞書を生成するため、例えば一枚の帳票上で異なるフ
ィールドを別の人が書いているような場合でも、手書き
文字を正しく識別することができる。
The second field for detailed identification is provided for each field.
Since the dictionary is generated, handwritten characters can be correctly identified even when another person writes different fields on one form.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理説明図FIG. 1 is a diagram illustrating the principle of the present invention.

【図2】本発明の一実施例を示すブロック図FIG. 2 is a block diagram showing an embodiment of the present invention.

【図3】帳票の例を示す図FIG. 3 is a diagram showing an example of a form.

【図4】フィールド、認識結果、距離の説明図FIG. 4 is an explanatory diagram of fields, recognition results, and distances.

【図5】フィールド、認識結果、距離の他の説明図FIG. 5 is another explanatory diagram of fields, recognition results, and distances.

【図6】動作を説明するフローチャートFIG. 6 is a flowchart illustrating the operation.

【図7】従来例を示す図FIG. 7 shows a conventional example.

【符号の説明】[Explanation of symbols]

11:入力部 12:フィールド検出部(フィールド検出手段) 13:帳票 14:フィールド 14A〜14Q:記入単位 15:文字切出し部 16:第1の認識部 17:第1の辞書 18:辞書登録部(辞書登録手段) 19:第2の辞書 20:第2の認識部(第2の認識手段) 21:出力部 11: input unit 12: field detection unit (field detection means) 13: form 14: field 14A to 14Q: entry unit 15: character cutout unit 16: first recognition unit 17: first dictionary 18: dictionary registration unit ( Dictionary registration unit) 19: Second dictionary 20: Second recognition unit (second recognition unit) 21: Output unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】入力する文字を切り出して辞書(17)と
照合して文字認識を行う文字認識装置において、 前記文字のうち典型的な文字を取り出して登録する辞書
登録手段(18)と、 該辞書登録手段(18)によって前記典型的な文字が登
録される第2の辞書(19)と、 前記入力する文字と前記典型的な文字とを照合し文字認
識を行う第2の認識手段(20)を備えたことを特徴と
する文字認識装置。
1. A character recognition device for recognizing characters by cutting out input characters and collating them with a dictionary (17), and dictionary registration means (18) for extracting and registering typical characters of the characters, A second dictionary (19) in which the typical character is registered by the dictionary registration means (18), and a second recognition means (20) for performing character recognition by collating the input character with the typical character. ) Is provided with a character recognition device.
【請求項2】帳票上の特定の領域をフィールドとして検
出するフィールド検出手段を設け、該フィールド検出手
段により検出されたフィールド上の文字と前記辞書(1
7)とを照合して文字認識を行った後、前記第2の辞書
(19)には前記フィールドごとに前記典型的な文字を
登録することを特徴とする請求項1記載の文字認識装
置。
2. A field detecting means for detecting a specific region on a form as a field is provided, and the character on the field detected by the field detecting means and the dictionary (1
The character recognition device according to claim 1, wherein after the character recognition is performed by collating with 7), the typical character is registered for each field in the second dictionary (19).
【請求項3】前記典型的な文字が、前記辞書(17)と
距離が最も小さい文字であることを特徴とする請求項
1,2記載の文字認識装置。
3. The character recognition device according to claim 1, wherein the typical character is a character having a smallest distance from the dictionary (17).
JP14424594A 1994-06-27 1994-06-27 Character recognition device Expired - Lifetime JP3292595B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14424594A JP3292595B2 (en) 1994-06-27 1994-06-27 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14424594A JP3292595B2 (en) 1994-06-27 1994-06-27 Character recognition device

Publications (2)

Publication Number Publication Date
JPH0816724A true JPH0816724A (en) 1996-01-19
JP3292595B2 JP3292595B2 (en) 2002-06-17

Family

ID=15357621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14424594A Expired - Lifetime JP3292595B2 (en) 1994-06-27 1994-06-27 Character recognition device

Country Status (1)

Country Link
JP (1) JP3292595B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100718191B1 (en) * 1999-12-02 2007-05-15 하이모 가부시키가이샤 Precast polyacrylamide electrophoresis gel, production method thereof and electrophoresis using the gel

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100718191B1 (en) * 1999-12-02 2007-05-15 하이모 가부시키가이샤 Precast polyacrylamide electrophoresis gel, production method thereof and electrophoresis using the gel

Also Published As

Publication number Publication date
JP3292595B2 (en) 2002-06-17

Similar Documents

Publication Publication Date Title
US8171391B2 (en) Method of describing the structure of graphical objects
JP2007004584A (en) Information processor
KR102282025B1 (en) Method for automatically sorting documents and extracting characters by using computer
JP7338135B2 (en) Recognition processing device and program
JP2003242441A (en) Document processing method, apparatus and program
JPH0816724A (en) Character recognition device
JPH07114616A (en) Slip document information system
JP4160206B2 (en) Database registration method using character recognition device
JP2019175317A (en) Character recognition device, character recognition method, and program
JP4807486B2 (en) Teaching material processing apparatus, teaching material processing method, and teaching material processing program
JP4379038B2 (en) Image collation apparatus, image collation method, and image collation program
JP4224914B2 (en) Character reading system and character reading method
JP3360030B2 (en) Character recognition device, character recognition method, and recording medium recording character recognition method in program form
JP2984287B2 (en) Optical character reader
JP2001312694A (en) Method and device for recognizing many kinds of slips
JP2005301477A (en) Address recognition system and method
JPH0696272A (en) Business form format definition body generating device
JP2008083783A (en) Receipt processor
JP2731394B2 (en) Character input device
JP3339122B2 (en) Driver&#39;s license recognition device
JPH117492A (en) Method and device for editing key entry
JPH0475184A (en) Input device
JP3028557B2 (en) Address recognition method
JP2006163445A (en) Business form reader and reading system, and reading method using them
JPH1040401A (en) Format analytic method in family register data preparation

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020226

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080329

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090329

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100329

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100329

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110329

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140329

Year of fee payment: 12

EXPY Cancellation because of completion of term