JPH0554193A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH0554193A
JPH0554193A JP3247707A JP24770791A JPH0554193A JP H0554193 A JPH0554193 A JP H0554193A JP 3247707 A JP3247707 A JP 3247707A JP 24770791 A JP24770791 A JP 24770791A JP H0554193 A JPH0554193 A JP H0554193A
Authority
JP
Japan
Prior art keywords
character
recognition
density
recognition result
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3247707A
Other languages
Japanese (ja)
Inventor
Akiko Konno
章子 紺野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP3247707A priority Critical patent/JPH0554193A/en
Publication of JPH0554193A publication Critical patent/JPH0554193A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To improve the recognition accuracy by performing a recognition again by changing the density of a picture input device and selecting an optimum recognition result from plural ones when a recognition result peculiar to a character collapse or a recognition result peculiar to the thinning of lines are included in the recognition result by an OCR. CONSTITUTION:A decision/control part 5 detects a character collapse or a thinning by referring to a collapsed character table 6 or a thinning pattern table 7. The decision/control part 5 controls the density of a picture input device in the direction that it is thinned when a collapse is detected and the part 5 controls the density in the direction that it is thickened when a thinning is detected. Thus, a recognition is performed by inputting a picture again by a new density. By this, a recognition accuracy is improved since an optimum recognition result can be selected from plural recognition results.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、文字認識精度を向上
させることが可能な光学式文字読取装置(OCR)に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader (OCR) capable of improving character recognition accuracy.

【0002】[0002]

【従来の技術】従来、例えば漢字OCRでは、より高精
度の認識を行なうため、認識結果中の各文字とその候補
文字を用いたり、字形類似文字テーブルを用いたりして
単語照合や文法接続チェックを行なうことにより、誤読
文字を検出,修正する各種の手法が提案されている。
2. Description of the Related Art Conventionally, for example, in Kanji OCR, in order to perform recognition with higher accuracy, word matching and grammatical connection check are performed by using each character in the recognition result and its candidate character, or by using a character shape similar character table. Various methods for detecting and correcting misread characters have been proposed.

【0003】[0003]

【発明が解決しようとする課題】OCRを用いる従来方
式の誤読の理由としては、主として次の3つが考えられ
る。 1)認識辞書による誤読(字形類似文字への誤読) 2)文字のつぶれによる誤読 3)線のかすれによる誤読 これらのうち、1)の認識辞書による誤読は従来技術で
も十分修正可能であるが、2),3)の誤読については
従来技術だけでは修正困難な場合が往々にして発生す
る。すなわち、 (イ)従来方式では、誤読が文字のつぶれに起因する場
合、認識結果中に正解が存在しないことがあり、また、
字形類似文字を利用するとしても、文字のつぶれの場合
は必ずしも字形の類似した文字に誤読するとは限らな
い。つまり、上述の如き従来方式では候補文字を使用し
ても修正が不可能な誤読文字が依然として存在する。 (ロ)従来方式では、誤読がパターンのかすれに起因す
る場合、認識結果には誤読ミスだけでなく誤った文字切
り出しの結果も含まれ、文字切り出しを誤った場合を考
慮に入れた後処理も提案されてはいるが、切り出し方法
の誤り方やそれぞれのパターンの認識結果の組み合わせ
の数が膨大であるため、これを修正するのが困難な場合
がある。 (ハ)さらに、文字のつぶれに起因する誤読と線のかす
れに起因する誤読が一枚の文書中に共存する場合もあ
る。具体的には、複雑な漢字はつぶれが原因で誤読とな
り、ひらがな,カタカナ,特殊記号等の単純な字形の文
字は、線のかすれが原因で誤読となることが多い。この
ような場合、1種類の濃度の画像を認識した結果だけか
らでは、正しい認識結果を得るのは極めて困難である。 したがって、この発明の課題は従来のものよりも認識精
度を向上させることにある。
The following three reasons can be considered as the reasons for erroneous reading in the conventional method using OCR. 1) Misreading by the recognition dictionary (misreading to glyph-like characters) 2) Misreading due to crushed characters 3) Misreading due to faint lines Among these, 1) misreading by the recognition dictionary can be sufficiently corrected by the conventional technology, Regarding the erroneous readings of 2) and 3), it is often difficult to correct with the conventional technique alone. That is, (a) in the conventional method, when the misreading is caused by the collapse of the character, there may be no correct answer in the recognition result.
Even if a character similar to a glyph is used, when the character is crushed, it is not always misread as a character having a similar glyph. That is, in the conventional method as described above, there are still misread characters that cannot be corrected even if the candidate characters are used. (B) In the conventional method, when the misreading is caused by the faint pattern, the recognition result includes not only the misreading error but also the result of the incorrect character cutout, and the post-processing that considers the case of the incorrect character cutout is also performed. Although it has been proposed, it may be difficult to correct it because of a large number of error detection methods and combinations of recognition results of each pattern. (C) Further, there are cases where erroneous reading due to crushed characters and erroneous reading due to blurred lines coexist in a single document. Specifically, complicated kanji are often misread due to crushing, and characters with simple glyphs such as hiragana, katakana, and special symbols are often misread due to faint lines. In such a case, it is extremely difficult to obtain a correct recognition result only from the result of recognizing an image of one type of density. Therefore, an object of the present invention is to improve the recognition accuracy as compared with the conventional one.

【0004】[0004]

【課題を解決するための手段】このような課題を解決す
るため、第1の発明では、画像入力装置を介して入力さ
れる文書を認識する文字認識装置に対し、その認識結果
に文字つぶれ特有の認識結果が含まれるか否か、また同
じく線のかすれに特有の認識結果が含まれるか否かをそ
れぞれ所定のテーブルを参照して検出する検出手段と、
検出の結果、文字つぶれがあると判断したときは前記画
像入力装置の濃度を薄くして再度認識を行なわせ、線の
かすれがあると判断したときは前記画像入力装置の濃度
を濃くして再度認識を行なわせる制御手段と、最初の濃
度における認識結果と濃度変更後の認識結果について単
語辞書および文法辞書を参照して最適な認識結果を選択
する選択手段とを設けたことを特徴としている。第2の
発明では、画像入力装置を介して入力される文書を認識
する文字認識装置に対し、その認識結果に文字つぶれ特
有の認識結果が含まれるか否か、また同じく線のかすれ
に特有の認識結果が含まれるか否かをそれぞれ所定のテ
ーブルを参照して検出する検出手段と、検出の結果、文
字つぶれ特有の認識結果パターンが多いと判断したとき
は、文字のつぶれにもとづく誤読を所定のテーブルを参
照して重点的に検出,修正する第1の誤読検出修正手段
と、検出の結果、線の切れ,かすれ特有の認識結果パタ
ーンが多いと判断したときは、文字の切れ,かすれによ
る誤読および画像濃度が薄いために生じる文字切り出し
ミスを所定のテーブルを参照して重点的に検出,修正す
る第2の誤読検出修正手段とを設けたことを特徴として
いる。
In order to solve such a problem, according to the first invention, a character recognition device for recognizing a document inputted through an image input device is provided with a character crushing characteristic in a recognition result. A detection means for detecting whether or not the recognition result of the above is included, and also whether or not the recognition result peculiar to the line blur is included,
When it is determined that the characters are crushed as a result of the detection, the density of the image input device is reduced to perform recognition again, and when it is determined that the lines are blurred, the density of the image input device is increased and the image is again detected. It is characterized in that a control means for recognizing and a selection means for selecting an optimum recognition result with reference to the word dictionary and the grammar dictionary for the recognition result at the first density and the recognition result after the density change are provided. According to the second aspect of the present invention, the character recognition device for recognizing a document input through the image input device determines whether or not the recognition result includes a recognition result peculiar to the character collapse, and also the line recognition peculiar to faint lines. Detecting means for detecting whether or not the recognition result is included by referring to a predetermined table, respectively, and if the result of the detection indicates that there are many recognition result patterns peculiar to character crushing, erroneous reading based on character crushing is specified. The first erroneous reading detection / correction means for intensively detecting and correcting with reference to the table of No. 1 and the recognition result pattern peculiar to line breaks and blurs when it is determined that there are many recognition result patterns. A second erroneous reading detection / correction unit is provided which mainly detects and corrects erroneous reading and character cutout error caused by low image density by referring to a predetermined table.

【0005】[0005]

【作用】文字認識装置による認識結果に文字つぶれ特有
の認識結果、または線のかすれに特有の認識結果が含ま
れるか否か(画像濃度が濃いか薄いかを示す濃度)を検
出し、文字つぶれまたは線のかすれが検出されたときは
画像入力装置の濃度をそれぞれ変えて再度認識し、複数
の認識結果から最適なものを選択できるようにして認識
精度の向上を図る。また、画像濃度に応じた誤読検出修
正処理を実行可能とすることにより、認識精度の向上を
図る。
[Function] It is detected whether the recognition result by the character recognition device includes a recognition result peculiar to character collapse or a recognition result peculiar to faint lines (density indicating whether the image density is dark or light), and the character collapse is detected. Alternatively, when a blur of a line is detected, the density of the image input device is changed and recognition is performed again, and the optimum one can be selected from a plurality of recognition results to improve the recognition accuracy. In addition, the recognition accuracy is improved by enabling the misreading detection and correction process according to the image density.

【0006】[0006]

【実施例】図1はこの発明の実施例を示すブロック図で
ある。同図において、1はOCRに入力される日本語文
書である。2は画像入力装置(イメージスキャナ等)
で、文書画像1をまず濃度Dで入力する。3は文字認識
装置としての漢字OCRで、画像入力装置2からの文書
画像を認識する。4はOCRによる日本語文書1の濃度
Dにおける、画像の認識結果を示す。なお、この中には
若干の誤読が含まれているものとする。5はその認識結
果から文字のつぶれや線のかすれを検知し、イメージス
キャナ2の読み取り濃度を制御する判定・制御部であ
り、その検知または判断に当たっては潰れ文字テーブル
6やかすれパターンテーブル7が参照される。そして、
文字のつぶれを検知した場合は判定・制御部5は画像入
力装置の濃度を薄くする方向に濃度を制御し、濃度(D
−ΔD)で再度画像を入力し、認識を行なうようにす
る。なお、濃度の変更は例えば2値化レベルを自動的に
変える等の方法により行なわれる。その認識結果が符号
8で示される認識結果2である。また、判定・制御部5
において線のかすれが検知された場合は、画像入力装置
の濃度を濃くする方向に濃度を制御して濃度(D+Δ
D)で再度画像を入力し、認識を行なう。最適文字列選
択部9は複数の濃度における認識結果(ここでは認識結
果1,2)から、単語辞書10および文法辞書11を用
いて最適な認識結果を選択し、最終結果として出力す
る。
1 is a block diagram showing an embodiment of the present invention. In the figure, 1 is a Japanese document input to the OCR. 2 is an image input device (image scanner, etc.)
Then, the document image 1 is first input with the density D. Reference numeral 3 is a Kanji character OCR as a character recognition device for recognizing a document image from the image input device 2. Reference numeral 4 shows the result of image recognition by the OCR in the density D of the Japanese document 1. It should be noted that this includes some erroneous readings. Reference numeral 5 denotes a determination / control unit that detects a crushed character or a blurred line on the basis of the recognition result and controls the reading density of the image scanner 2. In the detection or judgment, the blurred character table 6 or the blurred pattern table 7 is referred to. To be done. And
When the crushed character is detected, the determination / control unit 5 controls the density in the direction of decreasing the density of the image input device, and the density (D
-[Delta] D) Input the image again and recognize it. The density is changed by, for example, automatically changing the binarization level. The recognition result is recognition result 2 indicated by reference numeral 8. Also, the determination / control unit 5
If a faint line is detected in, the density is controlled in the direction of increasing the density of the image input device, and the density (D + Δ
The image is input again in D) and recognition is performed. The optimum character string selection unit 9 selects the optimum recognition result from the recognition results (here, recognition results 1 and 2) at a plurality of densities using the word dictionary 10 and the grammar dictionary 11, and outputs it as the final result.

【0007】図2は図1の動作を説明するためのフロー
チャートである。すなわち、ステップS1において入力
され認識された画像に対し、ステップS2で文字のつぶ
れがあるかどうかを検知し、あるとき(Y)はステップ
S3で画像濃度を薄くし(D−ΔD)、ステップS4で
再度画像を入力し認識を行なう。また、ステップS5で
線のかすれがあるかどうかを検知し、あるとき(Y)は
ステップS6で濃度を濃くし(D+ΔD)、ステップS
7で再度画像を入力し認識を行なう。ステップS8では
複数の濃度における認識結果から、単語辞書および文法
辞書を用いて最適な認識結果を選択する。なお、上記で
は文字つぶれの検知の方を先にしたがこの順序は逆でも
良く、また認識結果は2回に限らず3回以上実行しその
中から最適なものを選択するようにしても良いものであ
る。
FIG. 2 is a flow chart for explaining the operation of FIG. That is, it is detected in step S2 whether or not there is a crushed character in the image input and recognized in step S1, and if there is (Y), the image density is reduced in step S3 (D-ΔD), and in step S4. Input the image again and recognize. Further, in step S5, it is detected whether or not the line is blurred, and if there is (Y), the density is increased in step S6 (D + ΔD), and then in step S5.
At 7, the image is input again and recognition is performed. In step S8, an optimum recognition result is selected from the recognition results at a plurality of densities using the word dictionary and the grammar dictionary. In the above, the detection of the character collapse is performed first, but the order may be reversed, and the recognition result is not limited to two times and may be executed three times or more to select the most suitable one. It is a thing.

【0008】図3に文字のつぶれを検知するためのテー
ブルの例を示す。ただし、ここに示された漢字群は一般
の文書中での出現頻度がかなり低いと思われる複雑な漢
字の例である。これらの文字が文章中に出現したとき
は、前後の文字を検索し、前後の文字と単語を形成する
ようになっている場合は妥当と判断するが、前後の文字
との繋がりがなく、孤立して出現する場合は文字つぶれ
であると判断する。例えば、「鬱」という文字の場合、
「噪鬱」,「憂鬱」,「鬱病」という単語の一部として
出現した場合は、この「鬱」という文字は妥当であると
あると判断するが、それ以外の文字の間に孤立して出現
した場合、例えば「この鬱物は」等という文字列中に出
現した場合は、文字つぶれとするようにする。
FIG. 3 shows an example of a table for detecting character collapse. However, the kanji group shown here is an example of a complicated kanji character that appears to have a fairly low frequency of appearance in general documents. When these characters appear in the sentence, the characters before and after are searched, and it is judged to be valid when it forms a word with the characters before and after, but there is no connection with the characters before and after, and it is isolated. If it appears again, it is determined that the character is crushed. For example, in the case of the letter "depression",
If the word "depressive", "depressive", or "depressive" appears as part of the word, the word "depressive" is considered valid, but it is isolated between the other characters. When it appears, for example, when it appears in a character string such as "This depression", it is considered as a character collapse.

【0009】図4に線のかすれを検知するためのテーブ
ルの例を示す。線のかすれは認識結果だけでなく文字切
出しにも影響するため、ここでは誤分割の結果生じる認
識パターンを使用して線のかすれを検出する。例えば、
縦書き文書の認識結果中でカタカナ文字列中に「一フ」
というパターンが出現した場合、これは「ラ」という文
字を誤って分割している可能性が大きい。また、一般文
章中で「、、」というように読点が連続することはない
が、句点「。」がかすれた場合「、、」というパターン
が生じる。そこで、このようなパターンを調べることに
より、線のかすれの有無を検知することができる。
FIG. 4 shows an example of a table for detecting blurring of lines. Since the blurring of the line affects not only the recognition result but also the character cut-out, here, the blurring of the line is detected by using the recognition pattern resulting from the erroneous division. For example,
In the recognition result of the vertical writing document, "1" is included in the katakana character string.
If this pattern appears, it is likely that the letter “la” has been mistakenly divided. In addition, the reading marks are not continuous like ",," in the general sentence, but when the punctuation mark "." Is faint, the pattern ",," occurs. Therefore, by checking such a pattern, it is possible to detect the presence or absence of line blurring.

【0010】次に、具体例について説明する。図5に文
字のつぶれを検知した場合の例を示す。これは、「電子
製品の取扱には十分御注意下さい。」という入力文字列
に対して、或る濃度Dで画像を入力し認識した結果(認
識結果1)が「璽子闘品の取扱には十分醐注愈下さ
い。」となった場合を示している。したがって、この場
合は図3のテーブルを利用する上述の文字潰れ検知手法
により、「璽」,「闘」,「醐」の3文字が文字つぶれ
であると判断されるので、画像入力装置の濃度をD−Δ
Dとしてもう一度画像入力し認識を行なう。このときの
結果が認識結果2として示すように、「電子製品の取及
に1よ十分御注意下さい。」となったとすると、最適文
字列の選択では濃度Dにおける認識結果で文字つぶれと
判断された文字については、濃度D−ΔDでの認識結果
を優先的に採用して単語照合,文法接続チェックを行な
うことにより、最適な文字列「電子製品の取扱には十分
御注意下さい。」を得ることが可能となる。
Next, a specific example will be described. FIG. 5 shows an example of the case where the character collapse is detected. This is because the result (recognition result 1) of inputting an image with a certain density D and recognizing the input character string "Please be careful when handling electronic products.""Please pay enough". Therefore, in this case, it is determined by the above-described character crushing detection method using the table of FIG. 3 that the three characters “seal”, “fight”, and “Daigo” are character crushed, and thus the density of the image input device is reduced. D-Δ
The image is input again as D and recognition is performed. As shown in the recognition result 2 at this time, if the result is “Please pay attention to the electronic product, please pay attention to 1”. In the selection of the optimum character string, the recognition result in the density D is judged to be a character collapse. For the characters, the recognition result in the density D-ΔD is preferentially adopted to perform the word matching and the grammatical connection check to obtain the optimum character string "Please be careful when handling electronic products." It becomes possible.

【0011】図6に線のかすれを検知した場合の例を示
す。これは、「自動車メーカーの責任が問われてい
る。」という入力文字列に対して、或る濃度Dで画像を
入力し認識した結果(認識結果1)が「自動申メーーカ
責任か問われている、、」となった場合を示しており、
「車」→「申」,「が」→「か」の誤読の他に「ー」→
「ーー」,「。」→「、、」の切出しミスも生じてい
る。そこで、線のかすれを検出するパターンとして図4
のデータを参照すると、「、、」が検出されるので、画
像入力装置の濃度をD+ΔDとしてもう一度画像入力し
認識を行なう。その結果は、認識結果2の如く「自動車
メーカーの貴任が問われている。」となる。線のかすれ
の場合は切出しミスがからんでいることが多いので、濃
度を濃くした方の認識結果を基準にして最適な結果を求
める方が効率的である。したがって、この場合も濃度D
+ΔDの認識結果(認識結果2:「責」→「貴」の誤読
を含んでいる)を基準にして、単語照合,文法接続チェ
ック(品詞接続等)を行なうことにより、「自動車メー
カーの責任が問われている。」という最適結果を得るこ
とができる。
FIG. 6 shows an example in which a blur of a line is detected. This is because the result (recognition result 1) of inputting an image with a certain density D and recognizing the input character string "The responsibility of the automobile manufacturer is questioned." ,,,,,,
In addition to misreading "car" → "shin", "ga" → "ka", "-" →
There is also a mistake in cutting out "-", "." → ",,". Therefore, as a pattern for detecting the blurring of lines, FIG.
Referring to the data of, the ",," are detected, so the image is input again for recognition with the density of the image input device as D + ΔD. As a result, the recognition result 2 is "The automaker's appointment is questioned." In the case of a faint line, cutting errors are often involved, so it is more efficient to obtain the optimum result based on the recognition result of the one with higher density. Therefore, in this case as well, the density D
By performing word matching and grammatical connection check (part-of-speech connection, etc.) on the basis of the recognition result of + ΔD (recognition result 2: erroneous reading of “responsibility” → “ki” is included), It is possible to obtain the optimum result.

【0012】以上のようにすると、処理時間が長くなる
だけでなく、もとの文書(原稿)の品質が悪い場合は認
識を何回繰り返しても認識精度が向上しない、という問
題が依然として残ることになる。そこで、次のようにす
ることもできる。図7はこの発明の他の実施例を示すブ
ロック図である。同図からも明らかなように、この実施
例は図1に示すものに対し画像濃度判定部13、誤読検
出修正部14、高濃度画像用誤読検出修正部15、低濃
度画像用誤読検出修正部16、高濃度画像用字形類似文
字テーブル17および低濃度画像用字形類似文字テーブ
ル18などを付加して構成されている。なお、その他の
点は図1に示すものと同様であり、以下、主としてその
相違点について説明する。画像濃度判定部13は図1の
判定・制御部5に対応し、図3,図4に示すような潰れ
文字テーブル6、およびかすれパターンテーブル7を参
照して文字のつぶれ,または線のかすれを検出し、全体
として画像濃度が(a)濃い、(b)薄いまたは(c)
どちらとも言えない、のいずれであるかを判断する。
[0012] By the above, not only the processing time becomes long, but also when the quality of the original document (original) is poor, the recognition accuracy does not improve no matter how many times the recognition is repeated. become. Therefore, you can also do the following. FIG. 7 is a block diagram showing another embodiment of the present invention. As is apparent from the figure, this embodiment is different from that shown in FIG. 1 in that the image density determination unit 13, the misreading detection correction unit 14, the high density image misreading detection correction unit 15, and the low density image misreading detection correction unit. 16, a high density image character shape similar character table 17 and a low density image character shape similar character table 18 are added. The other points are the same as those shown in FIG. 1, and the differences will be mainly described below. The image density determination unit 13 corresponds to the determination / control unit 5 of FIG. 1, and refers to the blurred character table 6 and the blurred pattern table 7 as shown in FIGS. 3 and 4 to remove a blurred character or a blurred line. The detected image density is (a) dark, (b) light or (c) as a whole.
Judge whether it is neither.

【0013】誤読検出修正部14は画像濃度判定部13
において画像の濃度が濃い,薄いのどちらとも言えない
と判断されたときに、高濃度画像用字形類似文字テーブ
ル17,低濃度画像用字形類似文字テーブル18,単語
辞書10および文法辞書11等を参照して誤読検出,修
正を行なう。高濃度画像用誤読検出修正部15は画像濃
度判定部13において画像の濃度が濃いと判断されたと
きに、潰れ文字テーブル6,高濃度画像用字形類似文字
テーブル17,単語辞書10および文法辞書11等を使
用して認識結果4に対する誤読検出,修正を行なう。同
様に、低濃度画像用誤読検出修正部16は画像濃度判定
部13において画像の濃度が薄いと判断されたときに、
かすれパターンテーブル7,低濃度画像用字形類似文字
テーブル18,単語辞書10および文法辞書11等を使
用して認識結果4に対する誤読検出,修正を行なう。1
2は誤読検出修正部14,高濃度画像用誤読検出修正部
15および低濃度画像用誤読検出修正部16のいずれか
より得られた最終認識結果を示す。図8に図7の処理フ
ローを示す。すなわち、ステップS1はイメージスキャ
ナ2および漢字OCR3による画像入力,認識処理を示
す。ステップS2は画像濃度判定部13における画像濃
度判定処理を示しており、その結果、画像濃度が(a)
濃い、(b)薄い、(c)どちらとも言えないのいずれ
かに応じてステップS4,S5,S3へとそれぞれ進
み、通常の誤読修正検出処理,高濃度画像用誤読修正検
出処理および低濃度画像用誤読修正検出処理が行なわれ
ることを示している。
The erroneous reading detection / correction unit 14 includes an image density determination unit 13
When it is determined that the density of the image is neither dense nor light, the high density image character similar character table 17, the low density image character similar character table 18, the word dictionary 10 and the grammar dictionary 11 are referred to. Then, misreading is detected and corrected. When the image density determination unit 13 determines that the image density is high, the high-density image misreading detection / correction unit 15 includes a collapsed character table 6, a high-density image glyph-like character table 17, a word dictionary 10, and a grammar dictionary 11. Etc. are used to detect and correct misreading of recognition result 4. Similarly, the low-density image misreading detection / correction unit 16, when the image density determination unit 13 determines that the image density is low,
The recognition result 4 is erroneously detected and corrected using the faint pattern table 7, the low-density image glyph-like character table 18, the word dictionary 10, the grammar dictionary 11, and the like. 1
Reference numeral 2 denotes a final recognition result obtained by any one of the misreading detection / correction unit 14, the high-density image misreading detection / correction unit 15, and the low-density image misreading detection / correction unit 16. FIG. 8 shows the processing flow of FIG. That is, step S1 shows the image input and recognition processing by the image scanner 2 and the Chinese character OCR 3. Step S2 shows the image density determination processing in the image density determination unit 13, and as a result, the image density is (a).
Depending on which of dark, (b) light, and (c) neither can be said, the process proceeds to steps S4, S5, and S3, respectively, and normal misreading correction detection processing, high-density image misreading correction detection processing, and low-density image It indicates that the misread reading correction detection process is performed.

【0014】図9に高濃度画像用字形類似文字テーブル
の例を示す。すなわち、画像の濃度が濃い場合、認識結
果中の文字は、それよりも単純な文字を誤読している可
能性が高い。したがって、例えば認識結果に「聞」があ
る場合、同図のようなテーブル17を参照して、これは
「間」や「問」の如く認識結果の文字よりも単純な字形
の類似文字に誤読している可能性が高いとして、優先的
に誤読修正を行なうようにする。図10に低濃度画像用
字形類似文字テーブルの例を示す。すなわち、画像の濃
度が薄い場合、線の切れやかすれが原因での誤読が多い
はずなので、認識結果中の文字は、その文字よりも複雑
な文字を誤読している可能性が高い。したがって、例え
ば認識結果に「杏」がある場合、同図のようなテーブル
18を参照して、これは「査」の如く認識結果の文字よ
りも複雑な字形の類似文字に誤読している可能性が高い
として、優先的に誤読修正を行なうようにする。
FIG. 9 shows an example of a high density image character shape similar character table. That is, when the density of the image is high, the characters in the recognition result are likely to be erroneously read as simpler characters. Therefore, for example, when the recognition result has "hear", the table 17 as shown in the figure is referred to, and this is misread as a similar character having a simple glyph such as "between" and "question". It is highly possible that the wrong reading is corrected. FIG. 10 shows an example of a low density image character shape similar character table. That is, when the density of the image is low, there are many erroneous readings due to line breaks or blurring, and thus the character in the recognition result is likely to be a erroneous reading of a more complicated character than the character. Therefore, for example, when the recognition result has "Kyoto", it is possible that the table 18 as shown in the figure is referred and this is misread as a similar character having a more complicated character shape than the character of the recognition result, such as "Check". It is highly likely that the misreading correction will be given priority.

【0015】図11は図7で入力画像の濃度が濃い場合
の作用を具体的に説明するための説明図である。同図
(イ)は入力画像の濃度が濃い場合の認識結果を示して
おり、入力文字列である「昭和の最期を飾るような出来
事であった。」に対し、「和→棚」,「期→醐」,「事
→璽」の3ヵ所で誤読が生じており、これらは文字のつ
ぶれが原因と考えられる。さらに、「棚」,「醐」は候
補文字の中にも正解が存在せず、いわゆる候補モレを起
こしている。このような認識結果に対して、従来の誤読
修正手段を作用させた結果を示すのが同図(ロ)であ
る。ここでは、「璽」が候補文字を用いて「事」と修正
されてはいるものの、「昭」の候補文字の「船」と次の
「棚」から単語「船棚」が照合できることからそちらを
選択し、結果として「昭→船」という誤修正を引き起こ
している。「最醐」も同様に「醍醐」に誤修正されてい
る。同図(ハ)にこの発明による誤読検出修正手段を作
用させた結果を示す。この場合は、同図(イ)の認識結
果に対して画像濃度の判定が行なわれるので、この認識
結果を図3の如き潰れ文字テーブルと照合させることに
より、「棚」,「醐」,「璽」の3文字がつぶれ文字と
して検出される。一方、かすれパターンとして検出され
るものはないので、この文書画像はつぶれが多い、つま
り画像濃度が濃いと判定する。そこで、高濃度画像用誤
読修正検出処理を行なうが、この処理は次のような特徴
を有している。 (1)つぶれ文字として検出された認識結果に対して
は、修正よりも検出を優先して行ない、つぶれ文字の第
1位候補と他の文字の候補文字(第1位以外)から成立
する単語は使用しない。 (2)各文字に対して、図9に示す高濃度画像用の字形
類似文字テーブルを優先的に用いて修正を行なう。画像
の濃度が濃いはずであるから誤読文字はつぶれが多く、
認識結果の字形類似文字は認識結果よりつぶれを取り除
いた文字のはずであるから、一般には字形類似文字の中
でも認識結果よりも字形の単純な文字を優先して使用す
ることとする。
FIG. 11 is an explanatory diagram for specifically explaining the operation when the density of the input image is high in FIG. The figure (a) shows the recognition result when the density of the input image is high. In response to the input character string "It was an event that marked the end of the Showa era", "Wa → Shelf", " Misreading occurs in three places, "period → Dai" and "thing → 璽", and these are thought to be due to the characters being crushed. Furthermore, “shelf” and “Daigo” have no correct answer in the candidate characters, causing so-called candidate leaks. The result of applying the conventional misreading correction means to such a recognition result is shown in FIG. In this case, although the word "Hi" has been corrected to "Thing" using the candidate characters, the word "Ship" can be matched from the candidate character "Ship" of "Aki" and the next "Shelf". Is selected, and as a result, an erroneous correction of "Akira → Ship" is caused. "Saigo" has also been erroneously corrected to "Daigo". FIG. 3C shows the result of applying the misread detection / correction means according to the present invention. In this case, since the image density is determined with respect to the recognition result of FIG. 9A, the recognition result is collated with the collapsing character table as shown in FIG. The three characters of “nor” are detected as the collapsed characters. On the other hand, since there is nothing detected as a blur pattern, it is determined that this document image has a lot of crushing, that is, the image density is high. Therefore, a high-density image erroneous reading correction detection process is performed, and this process has the following features. (1) For a recognition result detected as a collapsed character, the detection is prioritized over the correction, and a word formed of a candidate for the first place of the collapsed character and a candidate character of another character (other than the first place) Is not used. (2) Each character is corrected by preferentially using the glyph-like character table for high density images shown in FIG. Since the density of the image should be high, misread characters are often crushed,
Since the glyph-like characters in the recognition result should be the characters from which the crushing has been removed from the recognition result, in general, among the glyph-like characters, simple characters having a glyph rather than the recognition result are preferentially used.

【0016】図12は図7で入力画像の濃度が薄い場合
の作用を具体的に説明するための説明図である。同図
(イ)は入力画像の濃度が低い場合の認識結果を示す。
ここでは、入力文字列である「セーターを編むには根気
が必要です。」の中には「に→1こ」および外1の2ヵ
所で誤読が生じており、かすれのからんだ切り出しミス
(分割による)による誤読である。
FIG. 12 is an explanatory diagram for specifically explaining the operation when the density of the input image is low in FIG. The figure (a) shows the recognition result when the density of the input image is low.
Here, in the input string "I need patience to knit a sweater", there are misreads in two places, "ni → 1 ko" and outside 1. Misreading (due to division).

【外1】 同図(ロ)は上記文字列に対し、従来の誤読修正手段を
作用させた結果を示している。従来方式でも切り出しミ
ス(誤分割)を考慮した手段はあるが、この例では「1
こ」,「に」のいずれを選択しても文法チェックをパス
してしまう。意味的なチェックまですれば正しい方を選
択できる可能性があるが、そのためには膨大な作業や大
容量の辞書を必要とし、処理時間も長くなる。したがっ
て、ここでは修正は行なわない。また、外2の如き文字
を含む単語はないため、この外2は誤読として検出され
る。
[Outer 1] The figure (b) shows the result of applying the conventional erroneous reading correction means to the character string. Even in the conventional method, there is a method that considers a cutting error (mis-division), but in this example, “1
The grammar check will be passed regardless of whether "ko" or "ni" is selected. There is a possibility that you can choose the right one if you make a semantic check, but this requires a huge amount of work, a large-capacity dictionary, and takes a long processing time. Therefore, no correction is made here. Further, since there is no word containing a character such as outer 2, this outer 2 is detected as misread.

【外2】 同図(ハ)はにこの発明による誤読検出修正手段を作用
させた結果を示す。この場合は、認識結果について図4
に示す如きかすれパターンテーブルと照合すると、「1
こ」というところがかすれパターンとマッチングする。
一方、潰れ文字テーブルと一致する認識結果はないた
め、この文書画像は濃度が薄いと判断される。そこで、
そこで、低濃度画像用誤読修正検出処理を行なうが、こ
の処理は次のような特徴を有している。 (1)かすれパターンとして検出されたパターンに対し
ては、2文字を1文字に統合する方を優先して処理す
る。2文字にしても1文字にしても単語照合,文法チェ
ックをパスする場合は修正はせずに検出だけを行なう。 (2)各文字に対して、図10に示す低濃度画像用の字
形類似文字テーブルを優先的に用いて修正を行なう。画
像の濃度が薄いはずであるから誤読文字は線の切れ,か
すれが原因のものが多く、認識結果の字形類似文字は認
識結果にかすれたり切れたりした線を加えた文字だと考
えられるから、一般には字形類似文字の中でも認識結果
よりも字形の複雑な文字を優先して使用することとす
る。
[Outside 2] FIG. 11C shows the result of operating the misread detection / correction means according to the present invention. In this case, the recognition result is shown in FIG.
When compared with the fading pattern table as shown in,
The "ko" matches the fading pattern.
On the other hand, since there is no recognition result that matches the blurred character table, it is determined that this document image has low density. Therefore,
Therefore, the low-density image erroneous reading correction detection process is performed, and this process has the following features. (1) For a pattern detected as a faint pattern, the process of integrating two characters into one character is processed with priority. If two characters or one character passes word matching and grammar check, only detection is performed without correction. (2) Each character is corrected by preferentially using the glyph-like character table for the low-density image shown in FIG. Since the density of the image should be light, misread characters are often caused by broken lines or blurring, and glyph-like characters in the recognition result are considered to be characters with faint or broken lines added to the recognition result. In general, among the glyph-like characters, the character with a complicated glyph is given priority over the recognition result.

【0017】[0017]

【発明の効果】この発明によれば、OCRによる認識結
果に対し文字つぶれ特有の認識結果または線のかすれに
特有の認識結果が含まれるか否かを検出し、文字つぶれ
または線のかすれが検出されたときは画像入力装置の濃
度を変えて再度認識し、複数の認識結果から最適なもの
を選択できるようにしたので、従来のものよりも認識精
度を向上させることが可能となる。また、画像の濃度に
応じた誤読検出修正処理を施すようにすれば、従来の如
く単一の手段で誤読検出修正を行なうものに比べて認識
精度を向上させることができる。
According to the present invention, whether or not a recognition result peculiar to character crushing or a recognition result peculiar to line blurring is included in the recognition result by OCR is detected, and character crushing or line blurring is detected. If so, the density of the image input device is changed and recognition is performed again, and the optimum one can be selected from a plurality of recognition results. Therefore, the recognition accuracy can be improved as compared with the conventional one. If the misreading detection / correction process is performed according to the density of the image, the recognition accuracy can be improved as compared with the conventional method in which the misreading detection / correction is performed by a single means.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の実施例を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of the present invention.

【図2】図1の動作を説明するためのフローチャートで
ある。
FIG. 2 is a flow chart for explaining the operation of FIG.

【図3】文字つぶれを検知するためのテーブル例を説明
するための説明図である。
FIG. 3 is an explanatory diagram for explaining an example of a table for detecting character collapse.

【図4】線のかすれを検知するためのテーブル例を説明
するための説明図である。
FIG. 4 is an explanatory diagram for explaining an example of a table for detecting blurring of a line.

【図5】文字つぶれが検知された場合のこの発明による
動作を説明するための説明図である。
FIG. 5 is an explanatory diagram for explaining an operation according to the present invention when a character collapse is detected.

【図6】線のかすれが検知された場合のこの発明による
動作を説明するための説明図である。
FIG. 6 is an explanatory diagram for explaining an operation according to the present invention when a blur of a line is detected.

【図7】この発明の他の実施例を示すブロック図であ
る。
FIG. 7 is a block diagram showing another embodiment of the present invention.

【図8】図7の動作を説明するためのフローチャートで
ある。
FIG. 8 is a flow chart for explaining the operation of FIG.

【図9】高濃度画像用字形類似文字テーブル例を説明す
るための説明図である。
FIG. 9 is an explanatory diagram illustrating an example of a high-density image character shape similar character table.

【図10】低濃度画像用字形類似文字テーブル例を説明
するための説明図である。
FIG. 10 is an explanatory diagram illustrating an example of a low-density image character shape similar character table.

【図11】画像濃度が濃い場合のこの発明による処理を
具体的に説明するための説明図である。
FIG. 11 is an explanatory diagram for specifically explaining the process according to the present invention when the image density is high.

【図12】画像濃度が薄い場合のこの発明による処理を
具体的に説明するための説明図である。
FIG. 12 is an explanatory diagram for specifically explaining the process according to the present invention when the image density is low.

【符号の説明】[Explanation of symbols]

1 文書 2 画像入力装置(イメージスキャナ) 3 漢字OCR 4 認識結果1 5 判定・制御部 6 潰れ文字テーブル 7 かすれパターンテーブル 8 認識結果2 9 最適文字列選択部 10 単語辞書 11 文法辞書 12 最終認識結果 13 画像濃度判定部 14 誤読検出修正部 15 高濃度画像用誤読検出修正部 16 低濃度画像用誤読検出修正部 17 高濃度画像用字形類似文字テーブル 18 低濃度画像用字形類似文字テーブル 1 Document 2 Image Input Device (Image Scanner) 3 Kanji OCR 4 Recognition Result 1 5 Judgment / Control Unit 6 Crushed Character Table 7 Blurred Pattern Table 8 Recognition Result 2 9 Optimal Character String Selection Unit 10 Word Dictionary 11 Grammar Dictionary 12 Final Recognition Result 13 Image Density Determining Section 14 Misreading Detection Correction Section 15 High Density Image Misreading Detection Correction Section 16 Low Density Image Misreading Detection Correction Section 17 High Density Image Character Similar Characters Table 18 Low Density Image Character Similar Characters Table

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 画像入力装置を介して入力される文書を
認識する文字認識装置に対し、 その認識結果に文字つぶれ特有の認識結果が含まれるか
否か、また同じく線のかすれに特有の認識結果が含まれ
るか否かをそれぞれ所定のテーブルを参照して検出する
検出手段と、 検出の結果、文字つぶれがあると判断したときは前記画
像入力装置の濃度を薄くして再度認識を行なわせ、線の
かすれがあると判断したときは前記画像入力装置の濃度
を濃くして再度認識を行なわせる制御手段と、 最初の濃度における認識結果と濃度変更後の認識結果に
ついて単語辞書および文法辞書を参照して最適な認識結
果を選択する選択手段と、 を設けてなることを特徴とする文字認識装置。
1. A character recognition device for recognizing a document input through an image input device, whether or not the recognition result includes a recognition result peculiar to character collapse, and also recognition peculiar to faint lines. Detection means for detecting whether or not the result is included by referring to a predetermined table, respectively, and when it is determined that there is a crushed character as a result of the detection, the density of the image input device is reduced and recognition is performed again. , When it is determined that the lines are faint, the control means for increasing the density of the image input device to perform the recognition again, and the word dictionary and the grammar dictionary for the recognition result at the first density and the recognition result after the density change A character recognition device comprising: a selection unit for selecting an optimum recognition result with reference to the character recognition unit.
【請求項2】 画像入力装置を介して入力される文書を
認識する文字認識装置に対し、 その認識結果に文字つぶれ特有の認識結果が含まれるか
否か、また同じく線のかすれに特有の認識結果が含まれ
るか否かをそれぞれ所定のテーブルを参照して検出する
検出手段と、 検出の結果、文字つぶれ特有の認識結果パターンが多い
と判断したときは、文字のつぶれにもとづく誤読を所定
のテーブルを参照して重点的に検出,修正する第1の誤
読検出修正手段と、 検出の結果、線の切れ,かすれ特有の認識結果パターン
が多いと判断したときは、文字の切れ,かすれによる誤
読および画像濃度が薄いために生じる文字切り出しミス
を所定のテーブルを参照して重点的に検出,修正する第
2の誤読検出修正手段と、 を設けてなることを特徴とする文字認識装置。
2. A character recognition device for recognizing a document input via an image input device, whether or not the recognition result includes a recognition result peculiar to a character collapse, and also a recognition peculiar to faint lines. The detection means that detects whether or not the result is included by referring to a predetermined table, and if the result of the detection indicates that there are many recognition result patterns that are specific to character crushing, erroneous reading based on the character crushing is specified. First misreading detection and correction means that detects and corrects with emphasis by referring to a table, and if it is determined that there are many recognition result patterns that are peculiar to line breaks and blurs, the misreads due to character breaks and blurs And a second erroneous reading detection / correction means for intensively detecting and correcting a character segmentation error caused by a low image density by referring to a predetermined table. Identification equipment.
JP3247707A 1991-06-10 1991-09-26 Character recognition device Pending JPH0554193A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3247707A JPH0554193A (en) 1991-06-10 1991-09-26 Character recognition device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP3-163361 1991-06-10
JP16336191 1991-06-10
JP3247707A JPH0554193A (en) 1991-06-10 1991-09-26 Character recognition device

Publications (1)

Publication Number Publication Date
JPH0554193A true JPH0554193A (en) 1993-03-05

Family

ID=26488816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3247707A Pending JPH0554193A (en) 1991-06-10 1991-09-26 Character recognition device

Country Status (1)

Country Link
JP (1) JPH0554193A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008980A (en) * 2010-06-28 2012-01-12 Fuji Xerox Co Ltd Information processor and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008980A (en) * 2010-06-28 2012-01-12 Fuji Xerox Co Ltd Information processor and program

Similar Documents

Publication Publication Date Title
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
EP1703444A2 (en) Detecting an orientation of characters in a document image
JPH1139428A (en) Direction correcting method for document video
JPH04195692A (en) Document reader
US5625710A (en) Character recognition apparatus using modification of a characteristic quantity
JPH0554193A (en) Character recognition device
JPH02293989A (en) Character recognizing device
JPH07220023A (en) Method and device for table recognition
JP3457376B2 (en) Character correction method in optical reader
JP2002207960A (en) Method and program for recognized character correction
JP2002366900A (en) Optical character reader
JP3710164B2 (en) Image processing apparatus and method
JP4633246B2 (en) Recognized character correction method and computer-readable recording medium recording a recognized character correction program
JP3310063B2 (en) Document processing device
JPH0757049A (en) Character recognition device
JPH03172982A (en) Character recognizing device
JP2002074262A (en) Method for correcting recognition character
JPH01171080A (en) Recognizing device for error automatically correcting character
JPH10134145A (en) Character segmenting method, character recognition device using the same, and computer-readable storage medium where program implementing the same character segmenting method is stored
JPH06301814A (en) Character reader
JPH08123872A (en) Optical character reader
JPH076207A (en) Character recognition device
JPH0498586A (en) Image forming device
JPH0620096A (en) Character recognition device