JP3914592B2 - Character pattern circumscribing frame determination method, character normalization device - Google Patents
Character pattern circumscribing frame determination method, character normalization device Download PDFInfo
- Publication number
- JP3914592B2 JP3914592B2 JP17993296A JP17993296A JP3914592B2 JP 3914592 B2 JP3914592 B2 JP 3914592B2 JP 17993296 A JP17993296 A JP 17993296A JP 17993296 A JP17993296 A JP 17993296A JP 3914592 B2 JP3914592 B2 JP 3914592B2
- Authority
- JP
- Japan
- Prior art keywords
- character pattern
- center
- frame
- pattern
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Input (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は文字認識処理の前段処理として文字パターンの移動、拡大、縮小等の正規化処理を行うための文字パターンの外接枠決定方式および文字正規化装置に関する。
【0002】
【従来の技術】
文字認識処理技術では、安定した文字の特徴を得るために読取り系から出力された2値の文字パターンの大きさおよび文字枠内の位置を揃える正規化処理を行っている。従来の文字正規化方法では文字パターンの外接枠を求め、外接枠が文字枠の中心でかつ文字枠一杯に納るような文字パターンの移動及び伸縮を行っていた。また、外接枠は文字枠の各辺について文字枠の外側から内側に向って走査し、最初に文字パターンに接した位置を枠とすることで求めていた。従って、上記従来の文字正規化方法では帳票の汚れやインクのこすれなどにより、読取った文字パターンの外側にノイズがある場合にはノイズが文字パターンの一部とみなされて正しい外接枠が得られないため、正規化が十分に行われず、このような正規化方法によって処理された正規化後の文字パターンを用いて文字認識を行っても高い認識精度を得ることはできない、といった問題点があった(「パターン認識」(社)電気情報通信学会(森健一監修)1990年3月10日第2版42〜43頁)。
【0003】
図7は、文字パターンの外側にノイズがある場合の外接枠検出例であり、外接枠601はノイズ602と文字パターン603を取囲んだものとなっている。図8は図7の文字パターンの上記従来の文字正規化方法による正規化結果を示す図であり、文字パターン603’が枠601’一杯には拡大されず、また文字パターン603’の位置が本来あるべき位置(中央)からずれている。
【0004】
【発明が解決しようとする課題】
上記問題点の解決策として、従来は、文字パターンの連続した画素数を求め、画素数が所定の数以下の場合はノイズとみなして除去するといった処理がなされていた。しかしながら、この方法ではノイズとみなす画素数を決定することが困難であり、例えば、文字パターンがかすれている場合に画素数の少ないブロックが文字パターン中に生じるので、これがノイズとみなされて除去される、といった問題点があった。
【0005】
本発明は上記の問題点を解消するために創案されたものであり、入力した文字パターンの外側にあるノイズを排除した文字パターンの外接枠決定方式、文字パターンの外側にあるノイズに影響されない正規化処理の可能な文字正規化装置の提供を目的とする。
【0006】
【課題を解決するための手段】
上記の目的を達成するために、請求項1に記載の発明の文字パターンの外接枠決定方式では、2値化された文字パターンの外接枠を求め、前記文字パターンの重心と前記外接枠の中心を求め、前記文字パターンの重心が前記外接枠の中心と一致するように前記文字パターンを移動し、移動後の文字パターンについて前記外接枠の外側にはみ出しているパターン部分があるか否かを調べ、前記外接枠の外側にはみ出したパターン部分がある場合にはそれを除去し、外接枠内の文字パターンを補正文字パターンとして該補正文字パターンについて外接枠を求める、ことを特徴とする。
【0007】
また、請求項2に記載の発明の文字パターンの外接枠決定方式では、2値化された文字パターンの外接枠を求め、前記文字パターンの重心と前記外接枠の中心を求め、前記文字パターンの重心が前記外接枠の中心と一致するように前記文字パターンを移動し、移動後の文字パターンについて前記外接枠から所定値だけ広くした範囲の外側にはみ出しているパターン部分があるか否かを調べ、前記範囲の外にはみ出したパターン部分がある場合にはそれを除去し、該範囲内の文字パターンを補正文字パターンとして該補正文字パターンについて外接枠を求める、ことを特徴とする。
【0008】
また、請求項3に記載の発明の文字パターンの外接枠決定方式では、2値化された文字パターンの外接枠を求め、前記文字パターンの重心と前記外接枠の中心を求め、前記文字パターンの重心と前記外接枠の中心との距離が所定値以上の場合に、前記文字パターンの重心が前記外接枠の中心と一致するように前記文字パターンを移動し、移動後の文字パターンについて前記外接枠の外側にはみ出しているパターン部分があるか否かを調べ、前記外接枠の外側にはみ出したパターン部分がある場合にはそれを除去し、外接枠内の文字パターンを補正文字パターンとして該補正文字パターンについて外接枠を求める、ことを特徴とする。
【0009】
また、請求項4に記載の発明の文字パターンの外接枠決定方式では、2値化された文字パターンの外接枠を求め、前記文字パターンの重心と前記外接枠の中心を求め、前記文字パターンの重心と前記外接枠の中心との距離が所定値以上の場合に、前記文字パターンの重心が前記外接枠の中心と一致するように前記文字パターンを移動して、移動後の文字パターンについて前記外接枠から所定値だけ広くした範囲の外側にはみ出しているパターン部分があるか否かを調べ、前記範囲の外にはみ出したパターン部分がある場合にはそれを除去し、該範囲内の文字パターンを補正文字パターンとして該補正文字パターンについて外接枠を求める、ことを特徴とする。
【0010】
また、請求項5に記載の発明では、 請求項1乃至4のいずれか1項に記載の発明の文字パターンの外接枠決定方式において、補正文字パターンの重心と外接枠の中心との距離が閾値以下になるまで、補正文字パターンの移動およびはみ出したパターン部分の除去を行い、新たに得た補正文字パターンについて外接枠を求め、該文字パターンの重心と該外接枠の中心を求めることを繰返す、ことを特徴とする。
【0011】
また、請求項6に記載の発明の文字正規化装置では、2値化された文字パターンの外接枠を求める外接枠検出部と、前記文字パターンの重心と前記外接枠の中心を求める重心・中心計算部と、前記文字パターンの重心が前記外接枠の中心と一致するように前記文字パターンを移動すると共に、前記外接枠の外側にはみ出しているパターン部分を除去して補正文字パターンを得て前記外接枠検出部に出力する移動・切取り部と、前記外接枠の外側にはみ出したパターン部分がなかった場合に前記外接枠検出部からの出力を得て、前記外接枠を用いて文字パターンの正規化を行う正規化部と、を有することを特徴とする。
【0012】
また、請求項7に記載の発明では、請求項6記載の発明の文字正規化装置において、移動・切取り部が、前記文字パターンの重心が前記外接枠の中心と一致するように前記文字パターンを移動すると共に、前記外接枠より所定値だけ広くした範囲の外側にはみ出しているパターン部分を除去して補正文字パターンを得て外接枠検出部に出力する、ことを特徴とする文字正規化装置。
【0013】
また、請求項8に記載の発明では、請求項6記載の発明の文字正規化装置において、移動・切取り部が、前記文字パターンの重心と前記外接枠の中心との距離が所定値より大きい場合にのみ前記外接枠の外側にはみ出しているパターン部分を除去して補正文字パターンを得て外接枠検出部に出力する、ことを特徴とする。
【0014】
また、請求項9に記載の発明では、請求項6記載の発明の文字正規化装置において、移動・切取り部が、前記文字パターンの重心と前記外接枠の中心との距離が所定値より大きい場合にのみ前記外接枠より所定値だけ広くした範囲の外側にはみ出しているパターン部分を除去して補正文字パターンを得て外接枠検出部に出力する、ことを特徴とする。
【0015】
また、請求項10に記載の発明では、 請求項6乃至9のいずれか1項に記載の文字正規化装置において、補正文字パターンの重心と外接枠の中心との距離が閾値以下になるまで、移動・切取り部,外接枠検出部,および重心・中心計算部による処理を繰返す、ことを特徴とする。
【0020】
【発明の実施の形態】
図1(a)は文字認識処理プロセスにおける本発明の位置付けを示し、図1(b)は本発明の文字パターン外接枠決定方式の基本的構成を示すフローチャートであり、図1(a)のプロセスP2に相当する。
【0021】
図1(a)で、読取り装置で読取られた原稿上の文字は光電変換されて2値化された文字パターンとして出力され(P1)、本発明の文字パターン外接枠決定方式により文字パターンの外側のノイズが除去された文字パターンとその外接枠が決定され(P2)、正規化処理を経て(P3)、文字認識が行われる(P4)。
【0022】
図1(b)のステップS1では、2値化された文字パターンについて外接枠を設定する。外接枠は、図3に示すように文字枠201の各辺について文字枠201の外側から内側に向って走査し、最初に文字パターン203に接した位置をそれぞれ枠とすることで求めることができる。ステップS2では、外接枠202の中心座標Cを算出し、ステップS3で文字パターン203の重心座標Gを算出する。
【0023】
ステップS4では、文字パターン203の重心座標Gが外接枠202の中心座標Cと一致するように文字パターン203を移動させ、ステップS5で、外接枠202の外側にパターンがあるか否かを調べて、外側にパターンがある場合にはステップS6に移行し外側にパターンがない場合には正規化処理のため、プロセスP3に処理を移す。
【0024】
ステップS6では、外接枠202の外側にあるパターンをノイズとみなして除去し、外接枠202内の文字パターンを補正文字パターンとしてステップS1に戻る。外接枠202の外側にあるパターンの除去は、例えば、そのパターンを反転(黒画素→白画素)することにより行うことができる。
【0025】
上記構成により、文字パターン203の重心座標Gが外接枠202の中心座標Cと一致するように文字パターンを移動させたとき、外接枠202の外側に出るパターン(ノイズ)がなくなるまで、外接枠202の外側にあるパターンの除去、外接枠の再設定、外接枠の中心および補正文字パターンの重心の計算、補正文字パターンの移動を繰返すことができ、最終的には外接枠の外側にあるパターンが除去されることとなる。
【0026】
なお、上記文字パターン外接枠決定方式を文字認識装置等に適用する場合には文字パターン外接枠決定方式をプログラムで構成し、ROM,磁気ディスク,フロッピーディスク等の媒体に格納して、文字正規化の前処理としてコンピュータを用いた文字認識装置等の制御回路(CPU)で実行するように構成してもよく、専用のハードウエアで構成してもよい。
【0027】
図2は、本発明の文字正規化装置を用いた文字認識システムの一実施例の構成を示すブロック図であり、1は文字正規化装置、100は文字認識システム、101は光電変換部、102は第1のスイッチ、103は外接枠検出部、104は第2のスイッチ、105は重心・中心計算部、106は移動・切取り部、107は正規化部、108は認識部である。なお、図2で、制御回路および制御線は図示を省略してある。
【0028】
光電変換部101は、入力された文字パターンを電気信号に変換し、第1のスイッチ102へ出力する。このとき、第1のスイッチは接点a側に切換えられており、外接枠検出部103に文字パターンを出力する。外接枠検出部103では文字パターンの外接枠を求める。外接枠は、図3に示すように文字枠201の各辺について文字枠201の外側から内側に向って走査し、最初に文字パターン203に接した位置をそれぞれ枠とすることで外接枠202を求めることができる。
【0029】
第2のスイッチ104は接点d側に切換えられており、外接枠検出部103で検出された外接枠の座標と文字パターン203を重心・中心計算部105に出力する。重心・中心計算部105では文字パターンの重心座標および外接枠の中心座標を計算し、移動・切取り部106に出力する。移動・切取り部106では、文字パターン203の重心座標Gが外接枠の中心座標Cと一致するように文字パターンを移動すると共に、移動した文字パターンが外接枠からはみ出た場合に、はみ出たパターン部分を除去し、補正文字パターンを生成する。
【0030】
図2で、原点Oを文字枠201の左上とし、文字パターン203の重心Gの座標を(gx,gy)、外接枠202の中心Cの座標を(cx,cy)とすると、重心Gの移動量dx,dyは式(1)および式(2)で表わされる。
dx=gx−cx (1)
dy=gy−cy (2)
また、文字枠201内のある点(x,y)の値をV(x,y)とし、V(x,y)=0を白、V(x,y)=1を黒(文字パターン)と定義し、移動前の座標を(x1,y1)、移動後の座標を(x2,y2)、外接枠202の左上の座標を(xs,ys)、右下の座標を(xe,ye)とすると、移動・切取り部106で行う文字パターンの移動・切取り処理は、式(3)で表わされる。
V(x2,y2)=V((x1−dx),(y1−dy)):条件1 〃 =0 :条件2 但し、条件1は、(x1−dx)xs,(y1−dy)ys且つ (x1−dx)xe,(y1−dy)yeであり、 条件2は、条件1以外の場合である。 (3)
式(3)は、移動後の座標の値V(x2,y2)は、条件1が満たされる場合には右辺V((x1−dx),V(y1−dy))で示され、条件2の場合は0(白)とされることを意味する。ここで、条件1は移動後の文字パターンの座標が外接枠202の外側ではないことを意味し、条件2は移動後の文字パターンの座標が外接枠202の外側であることを意味する。
【0031】
図4は式(3)を用いた移動・切取り処理の例であり、図3において、文字パターン203の左上にあったノイズ204が切取られている。移動・切取り部105で生成された補正文字パターンは前記外接枠検出部103で再び外接枠の検出を行う(この時、第1のスイッチは接点b側に切換えられている)。移動・切取り部105で切取るノイズがなかった場合には第2のスイッチは接点c側に切換えられ、外接枠検出部103で検出された補正文字パターンの外接枠情報と補正文字パターンが正規化部107に出力される。
【0032】
なお、後述の式(5)または式(6)の移動・切取り処理では、文字パターンの重心と外接枠の中心の距離dが閾値Dth以下になるまで第2のスイッチを接点d側に切換えて移動・切取り処理を繰返すことにより、長いノイズや複数のブロックのノイズを効率的に除去できる。
【0033】
図5は移動・切取り処理を複数回行った例であり、図5(a)は光電変換部101から出力された文字パターン、図5(b),(c),(d)はそれぞれ図5(a)の文字パターンに移動・切取り処理を1回,2回,3回行った結果を示す図である。正規化部107では外接枠検出部103から出力される補正文字パターンの外接枠情報を用いて補正文字パターンの大きさと位置の正規化を行う。図6に図4および図5(d)の補正文字パターンの正規化結果を示す。認識部108では正規化部107から出力された正規化後の文字パターンを用いて文字認識処理を行い、候補文字を出力する。文字パターンの移動・切取り処理は、また、式(4)に示すように、切取る条件を外接枠202から一定の幅(水平距離)dwおよび一定の高さ(垂直距離)dhだけ距離をおいた範囲まで拡張することができる。
【0034】
V(x2,y2)=V((x1−dx),(y1−dy)):条件1 〃 =0 :条件2 但し、条件1は、(x1−dx)(xs−dw), (y1−dy)(ys−dh)且つ (x1−dx)(xe+dw), (y1−dy)(ye+dh)であり、 条件2は、条件1以外の場合である。 (4)
【0035】
さらに、式(5)に示すように、文字パターン203の重心Gと外接枠202の中心Cとの距離dが閾値Dthより大きい場合に移動・切取り処理を行ってもよい。
V(x2,y2)=V(x1,y1) :条件1 〃 =V((x1−dx),(y1−dy)):条件1 〃 =0 :条件2 但し、条件1は、dDth 条件1は、(x1−dx)xs,(y1−dy)ys且つ (x1−dx)xe,(y1−dy)ye且つ d>Dthであり、 条件2は、条件1および条件1以外の場合である。 (5)
【0036】
また、さらに、式(6)に示すように式(3)と式(5)の条件を組合せてもよい。
V(x2,y2)=V(x1,y1) :条件1 〃 =V((x1−dx),(y1−dy)):条件1 〃 =0 :条件2 但し、条件1はdDth 条件1は、(x1−dx)(xs−dw), (y1−dy)(ys−dh)且つ (x1−dx)(xs+dw), (y1−dy)(ye+dh)且つ d>Dthであり、 条件2は、条件1および条件1以外の場合である。 (6)
なお、上記各式において距離dは式(7)で表わされる。
d=(dx2+dy2)1/2 (7)
【0037】
本発明の文字正規化装置1はそれを構成する各手段、すなわち、第1のスイッチ102,外接枠検出部103,第2のスイッチ104,重心中心計算部105,移動・切取り部106,および正規化部107を専用のハードウエアによって実現することができる。また、これら各手段をプログラムで構成し、ROM,磁気ディスク,フロッピーディスク等の媒体に格納して、コンピュータを用いて文字正規化を実現することもできる。
【0038】
【発明の効果】
以上説明したように、本発明の文字パターンの外接枠決定方式および文字正規化装置によれば、文字パターンの外側にノイズがある場合でも、ノイズを取除いた補正文字パターンを作成し、当該補正文字パターンを用いて正規化を行うことができるので、文字パターン周辺のノイズに影響されることのない文字正規化が実現できる。
【図面の簡単な説明】
【図1】本発明の文字パターン外接枠決定方式の基本的構成を示すフローチャートである。
【図2】本発明の文字正規化装置を用いた文字認識システムの一実施例の構成を示すブロック図である。
【図3】ノイズのある文字パターンの例、文字パターンの重心および外接枠の中心の説明図である。
【図4】図2の文字パターンについて、移動・切取り処理を施した結果の説明図である。
【図5】移動・切取り処理を繰返して行った結果の説明図である。
【図6】図4および図5の文字パターンについて正規化処理を施した結果の説明図である。
【図7】ノイズのある入力文字パターンの例および外接枠の説明図である。
【図8】図7の文字パターンについて、従来の正規化処理を施した結果の説明図である。
【符号の説明】
1 文字正規化装置
101 光電変換部
102 第1のスイッチ
103 外接枠検出部
104 第2のスイッチ
105 重心・中心計算部
106 移動・切取り部
107 正規化部
108 認識部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a character pattern circumscribing frame determination method and a character normalization apparatus for performing normalization processing such as movement, enlargement, and reduction of a character pattern as pre-processing of character recognition processing.
[0002]
[Prior art]
In the character recognition processing technique, in order to obtain stable character characteristics, normalization processing is performed to align the size of the binary character pattern output from the reading system and the position in the character frame. In the conventional character normalization method, the circumscribed frame of the character pattern is obtained, and the character pattern is moved and stretched so that the circumscribed frame is the center of the character frame and fills the character frame. The circumscribing frame is obtained by scanning each side of the character frame from the outside to the inside of the character frame, and using the position first contacting the character pattern as the frame. Therefore, in the conventional character normalization method, if there is noise outside the read character pattern due to stains on the form or rubbing ink, the noise is regarded as a part of the character pattern and a correct circumscribing frame is obtained. Therefore, normalization is not performed sufficiently, and there is a problem that high recognition accuracy cannot be obtained even if character recognition is performed using a normalized character pattern processed by such a normalization method. ("Pattern Recognition", The Institute of Electrical, Information and Communication Engineers (supervised by Kenichi Mori), March 10, 1990, 2nd edition, pages 42-43).
[0003]
FIG. 7 is an example of circumscribed frame detection when there is noise outside the character pattern. The
[0004]
[Problems to be solved by the invention]
As a solution to the above problem, conventionally, processing has been performed in which the number of consecutive pixels of a character pattern is obtained, and when the number of pixels is equal to or less than a predetermined number, it is regarded as noise and removed. However, with this method, it is difficult to determine the number of pixels to be regarded as noise.For example, when a character pattern is faint, a block with a small number of pixels is generated in the character pattern. There was a problem such as.
[0005]
The present invention was devised in order to solve the above-described problems, and is a character pattern circumscribing frame determination method that eliminates noise outside the input character pattern, and is not affected by noise outside the character pattern. and to provide the possible character regular KaSo location of treatment.
[0006]
[Means for Solving the Problems]
To achieve the above object, the bounding box method of determining the character pattern of the invention according to
[0007]
Further, the bounding box method of determining the character pattern of the invention according to
[0008]
Further, the bounding box method of determining the character pattern of the invention according to
[0009]
Further, the bounding box method of determining the character pattern of the invention according to
[0010]
According to a fifth aspect of the present invention, in the character pattern circumscribing frame determination method according to any one of the first to fourth aspects, the distance between the center of the corrected character pattern and the center of the circumscribed frame is a threshold value. Until the following, the correction character pattern is moved and the protruding pattern portion is removed, a circumscribed frame is obtained for the newly obtained corrected character pattern, and the center of the character pattern and the center of the circumscribed frame are repeatedly determined. It is characterized by that.
[0011]
Further, the character normalization device of the invention described in claim 6 obtains a circumscribing frame detector for determining the bounding box of the binarized character patterns, the center of the center of gravity and the bounding box of the previous Kibun shaped pattern The center of gravity / center calculation unit and the character pattern are moved so that the center of gravity of the character pattern coincides with the center of the circumscribed frame, and the correction character pattern is removed by removing the pattern portion that protrudes outside the circumscribed frame. a moving-cut portion to be output to the bounding box detection unit obtains, with the output from said circumscribing frame detection unit if there is no protruding pattern portion on the outside of the bounding box, text using said circumscribing frame And a normalization unit that performs pattern normalization.
[0012]
Further, in the invention according to claim 7, the character normalization device of the invention of claim 6, wherein the movement-cut part, said character pattern as the center of gravity of the character pattern is matched with the center of the bounding box A character normalizing apparatus that moves and removes a pattern portion that protrudes outside the bounding frame by a predetermined value to obtain a corrected character pattern and outputs the corrected character pattern to the circumscribing frame detection unit .
[0013]
Further, in the invention according to claim 8, in the character normalization device of the invention of claim 6, wherein the movement-cut portion, when the distance between the center of the center of gravity and the bounding box of the character pattern is greater than a predetermined value In this case, the pattern portion protruding only outside the circumscribed frame is removed to obtain a corrected character pattern, which is output to the circumscribed frame detection unit .
[0014]
Further, in the invention according to claim 9, the character normalization device of the invention of claim 6, wherein the movement-cut portion, when the distance between the center of the center of gravity and the bounding box of the character pattern is greater than a predetermined value In this case, a pattern portion protruding outside a range wider than the circumscribing frame by a predetermined value is removed to obtain a corrected character pattern, which is output to the circumscribing frame detection unit .
[0015]
Further, in the invention according to claim 10, in the character normalization device according to any one of claims 6 to 9, until the distance between the center of gravity of the corrected character pattern and the center of the circumscribed frame is equal to or less than a threshold value, The processing by the moving / cutting unit , circumscribed frame detecting unit , and center of gravity / center calculating unit is repeated.
[0020]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1A shows the position of the present invention in the character recognition processing process, and FIG. 1B is a flowchart showing the basic configuration of the character pattern circumscribing frame determination method of the present invention. The process of FIG. Corresponds to P2.
[0021]
In FIG. 1A, characters on a document read by a reading device are photoelectrically converted and output as a binarized character pattern (P1), and the outside of the character pattern is determined by the character pattern circumscribing frame determination method of the present invention. The character pattern from which the noise is removed and its circumscribed frame are determined (P2), and after normalization processing (P3), character recognition is performed (P4).
[0022]
In step S1 in FIG. 1B, a circumscribed frame is set for the binarized character pattern. The circumscribing frame can be obtained by scanning each side of the
[0023]
In step S4, the
[0024]
In step S6, the pattern outside the circumscribed
[0025]
With the above configuration, when the character pattern is moved so that the center-of-gravity coordinate G of the
[0026]
When the character pattern circumscribing frame determination method is applied to a character recognition device or the like, the character pattern circumscribing frame determination method is configured by a program and stored in a medium such as a ROM, a magnetic disk, or a floppy disk to normalize characters. The preprocessing may be executed by a control circuit (CPU) such as a character recognition device using a computer, or may be constituted by dedicated hardware.
[0027]
FIG. 2 is a block diagram showing the configuration of an embodiment of a character recognition system using the character normalization apparatus of the present invention, wherein 1 is a character normalization apparatus, 100 is a character recognition system, 101 is a photoelectric conversion unit, 102 Is a first switch, 103 is a circumscribed frame detection unit, 104 is a second switch, 105 is a center of gravity / center calculation unit, 106 is a moving / cutting unit, 107 is a normalization unit, and 108 is a recognition unit. In FIG. 2, the control circuit and the control line are not shown.
[0028]
The
[0029]
The
[0030]
In FIG. 2, when the origin O is the upper left of the
dx = gx−cx (1)
dy = gy-cy (2)
Further, the value of a certain point (x, y) in the
V (x2, y2) = V ((x1-dx), (y1-dy)):
In the expression (3), the coordinate value V (x2, y2) after movement is indicated by the right side V ((x1-dx), V (y1-dy)) when the
[0031]
FIG. 4 shows an example of the movement / cut-off process using the expression (3). In FIG. 3, the
[0032]
Note that in the movement / cut-off process of formula (5) or formula (6) described later, the second switch is switched to the contact d side until the distance d between the center of gravity of the character pattern and the center of the circumscribing frame is equal to or less than the threshold Dth. By repeating the moving / cutting process, it is possible to efficiently remove long noise and noise of a plurality of blocks.
[0033]
FIG. 5 shows an example in which the moving / cutting process is performed a plurality of times. FIG. 5A shows a character pattern output from the
[0034]
V (x2, y2) = V ((x1-dx), (y1-dy)):
[0035]
Further, as shown in Expression (5), the movement / cut-off process may be performed when the distance d between the center of gravity G of the
V (x2, y2) = V (x1, y1):
[0036]
Furthermore, the conditions of the expressions (3) and (5) may be combined as shown in the expression (6).
V (x2, y2) = V (x1, y1):
In the above equations, the distance d is expressed by equation (7).
d = (dx2 + dy2) 1/2 (7)
[0037]
The
[0038]
【The invention's effect】
As described above, according to the character pattern circumscribing frame determination method and the character normalization apparatus of the present invention, even when there is noise outside the character pattern, a corrected character pattern from which noise has been removed is created and the correction is performed. Since normalization can be performed using a character pattern, character normalization that is not affected by noise around the character pattern can be realized.
[Brief description of the drawings]
FIG. 1 is a flowchart showing a basic configuration of a character pattern circumscribing frame determination method of the present invention.
FIG. 2 is a block diagram showing a configuration of an embodiment of a character recognition system using the character normalization apparatus of the present invention.
FIG. 3 is an explanatory diagram of an example of a noisy character pattern, the center of gravity of the character pattern, and the center of a circumscribed frame.
4 is an explanatory diagram of a result of moving / cutting the character pattern of FIG. 2; FIG.
FIG. 5 is an explanatory diagram of a result of repeated movement / cutting processing;
6 is an explanatory diagram of a result obtained by performing normalization processing on the character patterns of FIGS. 4 and 5. FIG.
FIG. 7 is an explanatory diagram of an example of a noisy input character pattern and a circumscribed frame.
FIG. 8 is an explanatory diagram of a result obtained by performing a conventional normalization process on the character pattern of FIG.
[Explanation of symbols]
1
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17993296A JP3914592B2 (en) | 1996-06-20 | 1996-06-20 | Character pattern circumscribing frame determination method, character normalization device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17993296A JP3914592B2 (en) | 1996-06-20 | 1996-06-20 | Character pattern circumscribing frame determination method, character normalization device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1011535A JPH1011535A (en) | 1998-01-16 |
JP3914592B2 true JP3914592B2 (en) | 2007-05-16 |
Family
ID=16074459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17993296A Expired - Lifetime JP3914592B2 (en) | 1996-06-20 | 1996-06-20 | Character pattern circumscribing frame determination method, character normalization device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3914592B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103246636B (en) * | 2013-04-19 | 2016-05-04 | 厦门大学 | A kind of definite method of Chinese character pattern vision center of gravity |
-
1996
- 1996-06-20 JP JP17993296A patent/JP3914592B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH1011535A (en) | 1998-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9135489B2 (en) | System for decoding two dimensional code and method thereof | |
JP3735893B2 (en) | Face image processing method and face image processing apparatus | |
JP3904840B2 (en) | Ruled line extraction device for extracting ruled lines from multi-valued images | |
JP6115214B2 (en) | Pattern processing apparatus, pattern processing method, and pattern processing program | |
JPH1139469A (en) | Face image processor | |
JP2008040693A (en) | Line noise removal device, line noise removal method and line noise removal program | |
JP6177541B2 (en) | Character recognition device, character recognition method and program | |
CN111539238A (en) | Two-dimensional code image restoration method and device, computer equipment and storage medium | |
CN110555863A (en) | moving object detection method and device and computer readable storage medium | |
JP3438440B2 (en) | Image processing device | |
CN106663317B (en) | Morphological processing method and digital image processing device for digital image | |
CN111524171B (en) | Image processing method and device and electronic equipment | |
JP3914592B2 (en) | Character pattern circumscribing frame determination method, character normalization device | |
JP2006337167A (en) | Inspection method of low-contrast flaw under cyclic noise, and inspection method of low-contrast flaw under repeated pattern | |
JP2871601B2 (en) | Character string detecting apparatus and method | |
JP3698867B2 (en) | Circular pattern determination method, apparatus and recording medium | |
JP2868134B2 (en) | Image processing method and apparatus | |
JP2002133424A (en) | Detecting method of inclination angle and boundary of document | |
JP4257264B2 (en) | Pattern matching device, image quality verification method, and image quality verification program | |
JP2899383B2 (en) | Character extraction device | |
KR100493718B1 (en) | Method for pursuiting posture of golf swinger feature | |
US11640535B2 (en) | Probability acquisition apparatus and probability acquisition method | |
JP7459151B2 (en) | Information processing device, information processing system, information processing method, and program | |
JP3534997B2 (en) | Ruled line extraction device and method | |
JP2715930B2 (en) | Line detection method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040608 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040608 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070205 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130209 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160209 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |