JPH1063779A - 文字認識方法および装置 - Google Patents

文字認識方法および装置

Info

Publication number
JPH1063779A
JPH1063779A JP8223873A JP22387396A JPH1063779A JP H1063779 A JPH1063779 A JP H1063779A JP 8223873 A JP8223873 A JP 8223873A JP 22387396 A JP22387396 A JP 22387396A JP H1063779 A JPH1063779 A JP H1063779A
Authority
JP
Japan
Prior art keywords
character
image
outline
contour
binarized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8223873A
Other languages
English (en)
Inventor
Kazuo Shimura
一男 志村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP8223873A priority Critical patent/JPH1063779A/ja
Publication of JPH1063779A publication Critical patent/JPH1063779A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字認識装置において、反転文字を含む画像
から精度良く文字認識を行う。 【解決手段】 反転文字2を含む原画像1から2値化画
像作成手段30によって画像の輪郭を抽出2値化して2値
化画像3を作成し、塗りつぶし手段35によって、輪郭抽
出された文字の輪郭内部の閉領域の各画素の画素値を輪
郭の画素値と同じ値として輪郭内部を塗りつぶす。その
後、マッチング手段40により輪郭内部を塗りつぶした2
値化画像3’に対してテンプレート7を用いてパターン
マッチングを行い文字を認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字を含む画像中
から文字を認識する方法および装置に関するものであ
り、詳細にはテンプレートを用いたパターンマッチング
による文字認識を行う文字認識方法および装置に関する
ものである。
【0002】
【従来の技術】従来より、人体等の被写体をCT、MR
I等によって撮影して得られた医用画像の画像データ
を、各画像データに適切な画像処理を施した後、画像を
再生記録することが行われており、これらの画像データ
に基づき被写体の画像を写真感光材料等の記録材料、C
RT等に可視像として出力させる画像記録再生システム
がすでに実用化されている。
【0003】通常医用画像には、患者名、ID番号、撮
影日、生年月日等のID情報が付されており、これらの
ID情報は、一般に英文字、数字、記号等(以下「文
字」と総称する)から構成されている。従って、医用画
像には絵柄と文字とが混在している。この絵柄と文字が
混在した医用画像から自動的に文字のみを識別すること
が望まれる場合がある。それは、例えば以下のような場
合である。
【0004】通常、画像記録再生システムにおいては、
撮影された画像データが検索情報となるID情報と関連
づけてファイリング装置に記憶されている。このファイ
リング装置への画像データファイリング時における画像
データとID情報との関連づけは、外部入力により行わ
れており操作者側の負担となっていた。そのため、撮影
時に画像中に付されたID情報を自動的に認識できるよ
うにすることが望まれている。
【0005】従来、文字を含む画像から文字を認識する
ための方法としては、認識すべき文字のテンプレートを
用意し、画像と比較して認識を行うテンプレートマッチ
ングという方法が知られている。この方法は、画像上の
認識対象領域と全てのテンプレートとを順次マッチング
させ、マッチング結果が最も良いテンプレートを認識結
果とするものであり、認識対象領域が指定されていない
場合は画像上での認識対象領域を順次ずらして、画像全
面に対してマッチングをとっていく必要がある。
【0006】以下、一般的なテンプレートマッチングに
よる認識方法を説明する。画像パターンfとテンプレー
トパターンgが、それぞれ図4に示すような大きさと位
置関係にあるとき、画像の点(m,n)における画像パタ
ーンfと、テンプレートパターンgの類似度は、以下に
示す評価関数で表される。
【0007】
【数1】
【0008】ここで通常、R(m,n)は相互相関係数と呼
ばれ、領域Dは、|i-m|<M/2,|j-n|<N/2を満たす
(i,j) の範囲である。画像上でテンプレートを動か
して順次、画像とテンプレートとの類似度を上記の相互
相関係数Rにより判別する。相互相関係数Rの値は大き
いほど画像の(m,n)を中心としてテンプレートに近い
図形が存在すること、すなわち、画像とテンプレートと
の相関が強いことを示し、画像とテンプレートとが完全
一致で1の値、全くの不一致で0の値をとる。通常、最
も相互相関係数Rの大きいものを認識結果とする。
【0009】しかしながら、上記のテンプレートマッチ
ング方法では、上記式に示されるように2乗や平方根の
計算が必要であること、また、通常多階調の画像に対し
てマッチングを行うことから、計算量が多くなり認識に
時間がかかるという欠点がある。
【0010】そこで、高速な認識処理のため、画像を2
値化して、2値化画像に対してマッチングを行う文字認
識装置、更には、文字が絵柄と重なった部分についても
精度良く認識可能とするため、画像の輪郭抽出した2値
化画像に対してマッチングを行う文字認識装置が、既に
本出願人により、提案されている(特願平8−167302号
等)。
【0011】
【発明が解決しようとする課題】上述の輪郭抽出した2
値化画像におけるマッチングにより、認識の精度はある
程度向上する。しかし、図2に示すような反転文字2を
含む画像1を輪郭抽出2値化すると、2値化画像3にお
いて文字の輪郭内部にもエッジ4が残る。そのため、テ
ンプレートとマッチングが完全なものとならず、上述の
評価関数の評価値が下がってしまうという欠点がある。
この評価値の低下は誤認識の原因となりうるものであ
る。
【0012】そこで、本発明は上記事情に鑑み、反転文
字を含む画像からも精度良く文字を認識する文字認識方
法および装置を提供することを目的とする。
【0013】
【課題を解決するための手段】本発明の文字認識方法
は、文字を含む画像中から該文字を認識する文字認識方
法であって、前記画像から画像の輪郭を抽出した2値化
画像を作成し、前記輪郭に囲まれた閉領域を前記輪郭の
画素値と同じ値とし、2値化された文字のテンプレート
を有する辞書を用意し、前記2値化画像に対して前記テ
ンプレートの文字を用いてパターンマッチングを行い文
字を認識することを特徴とするものである。
【0014】本発明の文字認識装置は、文字を含む画像
中から該文字を認識する文字認識装置であって、前記画
像から画像の輪郭を抽出した2値化画像を生成する2値
化画像生成手段と、前記輪郭に囲まれた閉領域の画素値
を前記輪郭の画素値と同じ値にする手段と、2値化され
た文字のテンプレートを有する辞書と、前記2値化画像
に対して前記テンプレートを用いてパターンマッチング
させることにより文字を認識するマッチング手段とを備
えることを特徴とするものである。
【0015】前記画像の輪郭を抽出した2値化画像の生
成により、画像中の文字は、一般に中抜き文字、若しく
は袋文字と呼ばれる文字として抽出される。それ故、前
記「輪郭に囲まれた閉領域」とは、主として中抜き文字
の中抜き部分をいう。しかし、例えば図3の2値化画像
3に示す中抜き文字「A」,「B」等のように外側の輪
郭によって囲まれた閉領域の内部にさらに閉領域を有す
る輪郭(内部輪郭)がある文字の場合、該内部輪郭に囲
まれた閉領域をも前記「輪郭に囲まれた閉領域」に相当
する。そのため、これらの文字に関しては、通常の中抜
き文字の中抜き部だけでなく内部輪郭に囲まれた閉領域
をも輪郭の画素値と同じ値としているテンプレートを用
いてマッチングすることが望ましい。
【0016】前記「閉領域を前記輪郭の画素値と同じ値
とし」とは、例えば、画像が「0」、「1」に2値化さ
れており、輪郭の画素値が「1」である場合、閉領域の
画素値を「1」とすることを意味する。
【0017】すなわち、本発明の文字認識方法および装
置においては、中抜き部分を輪郭部の画素値と同じ画素
値とすることによって、画像の輪郭抽出2値化の際に抽
出された中抜き文字の内部に生じうるエッジによるマッ
チング誤差をなくし、マッチング精度の向上を図ったも
のである。
【0018】なお、「画像の輪郭を抽出した2値化」の
方法としては、例えば、特願平8−167302号に開示され
ている2値化方法を用いればよく、また文字の輪郭抽出
方法としては、その他に一次微分フィルタ(ロバーツの
フィルタ、ブレヴィットのフィルタ、ソーベルのフィル
タ等)あるいはラプラシアンフィルタ等を用いる方法が
挙げられる。
【0019】ここで画像とは文字と絵柄が混在したもの
をいう。
【0020】
【発明の効果】本発明の文字認識方法および装置では、
画像の輪郭を抽出2値化した2値化画像において、抽出
されている輪郭に囲まれる閉領域を、該輪郭の画素値と
同じ画素値として文字のテンプレートを用いてパターン
マッチングを行うので、反転文字等を輪郭抽出2値化す
る際に中抜き文字の中抜き部分に生じうるエッジによる
マッチング評価値の低下を防ぐことができ、誤認識を低
減した高精度な文字認識を行うことができる。
【0021】
【発明の実施の形態】以下、本発明の文字認識方法およ
び装置の具体的な実施の形態を図面を用いて説明する。
【0022】図1に示すように、本発明の文字認識装置
10は、各種撮影装置9から入力された原画像データSに
基づく原画像の文字領域を認識する文字領域認識手段20
と、該文字領域認識手段20により認識された文字領域の
画像の輪郭を抽出すると共に2値化して2値化画像を生
成する2値化画像生成手段30と、該2値化画像生成手段
30によって生成された2値化画像において抽出された輪
郭で囲まれた閉領域の画素値をエッジ部の画素値と同じ
値とする塗りつぶし手段35と、辞書45の有する各種、各
サイズの文字のテンプレート7を用いてパターンマッチ
ングさせることにより文字を認識するマッチング手段40
とから成る。
【0023】文字領域認識手段20は、詳しくは、画像構
成判定手段22を備え、該画像構成判定手段22は、原画像
を複数の領域に分割し各領域の画像構成を表すデータを
作成するデータ作成手段24と、該データ作成手段24によ
り作成されたデータを基に、各領域が文字領域であるか
否かを判定する判定手段26とからなる。
【0024】2値化画像生成手段30は、原画像の各画素
毎に該画素の所定近傍範囲中の画素濃度の最大値と最小
値との差を求める演算手段32と、該演算手段32によって
求められた濃度差と所定の閾値との比較により各画素を
2値化して画像の輪郭を抽出する2値化手段34とから成
る。
【0025】以下に、本文字認識装置の作用を説明す
る。
【0026】各種撮影装置9によって撮影された原画像
を担持する画像データはデジタル化されて原画像データ
Sとして文字認識装置10に入力される。文字認識装置10
においては、まず、文字領域認識手段20による文字領域
の認識が行われる。文字領域の認識は例えば、特願平8
−179344号記載の画像判定装置等を用いて行うことがで
きる。
【0027】画像を複数の領域に分割し、画像判定手段
22内のデータ作成手段24により各領域の画像構成を表す
ヒストグラムデータを作成する。
【0028】ヒストグラムデータは、一般に、絵柄領域
については中間濃度域の頻度が大きく低濃度および高濃
度の頻度が小さいグラフ、文字領域については中間濃度
域の頻度が小さく低濃度および高濃度に大きな頻度を持
つグラフとなる。なお、文字と絵柄の組み合わさった領
域(以下、混合領域という)は全体的に頻度を持つグラ
フとなる。そこで、判定手段24においては、各領域のヒ
ストグラムデータを基に、各領域が文字を含む領域(文
字領域あるいは混合領域)であるか否かを判定する。こ
のように文字を含む領域を予め識別することにより、マ
ッチング範囲を限定することを可能とし、処理の高速化
を図っている。
【0029】文字領域判定手段20によって文字を含む領
域であると判定された領域(以下、文字付与領域とい
う)の画像について、2値化画像生成手段30による2値
化が行われる。画像の輪郭抽出2値化は例えば、特願平
8−167302号等に開示されている方法を用いて行う。
【0030】文字付与領域の画像データについて、まず
演算手段32において画像の各画素の所定の近傍範囲中に
おける濃度の最大値と最小値との差が求められる。例え
ば注目画素を2×2画素マスク中の左下に位置させた場
合、その2×2画素マスク(所定近傍範囲)中の計4画
素における階調濃度(原画像データS)の最大値および
最小値を求め、これを注目画素の濃度差とする。当然な
がら、2×2という範囲は一例であり、これに限る必要
はない。次に、2値化手段34において、前記演算手段32
によって求められた前記濃度差を所定の閾値と比較し
て、例えば閾値より濃度差が大きい場合を「1」、小さ
い場合を「0」として注目画素を2値化する。この2値
化を画像中の各画素について行うことにより、画像中の
近傍画素同志の濃度差の大きい部分、すなわち画像の輪
郭が抽出され、2値化画像が生成される。通常、文字と
周辺画像の濃度差は大きいため、文字の輪郭が抽出され
る。なお、反転文字を含む場合には、例えば、図2に示
すような反転文字Eを含む原画像文字領域1からは2値
化画像3が生成され、2値化画像3には中抜き文字
「E」の中抜き部に反転境界線がエッジ4として抽出さ
れる。
【0031】その他、輪郭抽出2値化処理として、注目
画素とその周囲の各画素の信号(濃度)差(S(i,j)−
S(i+m,j+n))を求め、この信号差の絶対値(|S(i,j)
−S(i+m,j+n)|)が最大のもの(max|S(i,j)−S(i+m,
j+n)|)を注目画素における信号差とみなして、この濃
度差が所定の閾値(Th)よりも大きい場合に注目画素の
画素値を「1」、濃度差が所定の閾値以下であれば、
「0」とする、即ち、 S'(i,j)=max(|S(i,j)−S(i+m,j+n)|), (m=-1,0,
+1,n=-1,0,1) if S'(i,j)>Th, S"(i,j)=1 else S"(i,j)=0 なる演算により2値化してもよい。
【0032】次に、塗りつぶし手段35において、図2の
2値化画像3において抽出された輪郭に囲まれた部分
(閉領域)の各画素の画素値を該輪郭の画素値(ここで
は、「1」)と同じ値にする。即ち、輪郭抽出されて中
抜き文字となっている2値化画像中の中抜き文字「E」
の輪郭内部(中抜き部)を塗り潰した2値化画像3’と
する。これによって、輪郭抽出時に生じる輪郭内部のエ
ッジ4は見かけ上なくなる。
【0033】その後、辞書45の有する各種、各サイズの
文字のテンプレート7を用いてマッチング手段40におい
てパターンマッチングが行われる。
【0034】ここで、マッチングは2値化された画像に
対して行うため、排他的積和(exclusive or)による類
似度評価関数R’を用いることができ、既述の評価関数
Rを用いる場合と比較して計算時間を短縮することがで
きる。なお、画像上の点(m,n)における画像パターン
fとテンプレートgのR'(m,n)は、
【0035】
【数2】
【0036】で表され、前述の相互相関係数Rの場合と
は逆に、R’が最も小さいテンプレートが認識結果とさ
れる。
【0037】なお、上述の2値化の際に、「1」,
「0」ではなく、「1」,「−1」に2値化して単純な
積和値を評価関数に用いてもよい。その場合の評価関数
R"(m,n)は、
【0038】
【数3】
【0039】で表され、R”が最も大きいテンプレート
が認識結果とされる。
【0040】ここで、領域Dは、|i-m|<M/2,|j-n|
<N/2を満たす(i,j) の範囲である。
【0041】このように、本発明の文字認識装置におい
ては、画像の輪郭抽出2値化により抽出された文字の輪
郭の内部を塗りつぶした上でマッチングを行うので、輪
郭抽出2値化時に文字の輪郭内部に生じるエッジにより
マッチング評価値が下がることはない。
【0042】なお、A,B,D,等の中抜き文字のよう
に、外側の輪郭に囲まれる閉領域内に内側の輪郭に囲ま
れる閉領域が存在する場合があり、図3にこの例を示
す。図3に示すように、反転文字Aを含む原画像1は、
画像の輪郭抽出2値化により、2値化画像3とされる。
このとき、中抜き文字「A」の外側の輪郭5aおよび該輪
郭5a内部にある輪郭5bおよび反転境界エッジ4がそれぞ
れ抽出される。その後、塗りつぶし手段35によって、輪
郭に囲まれた閉領域を塗りつぶす場合、外側輪郭5aおよ
び内部輪郭5bに囲まれる領域、即ちこれが中抜き文字の
中抜き部分であるが、本来この部分のみ塗りつぶすこと
が理想的である。しかしながら、該塗りつぶし手段35に
よって、内部輪郭5bに囲まれる領域も「輪郭で囲まれる
閉領域」と認識される場合には、この部分も塗りつぶし
てしまうこととなり2値化画像3’となる。このような
2値化画像3’に対して通常の文字のテンプレート7を
用いてマッチングを行ったのでは、マッチング評価値が
低くなりマッチング精度の向上が図れない。そこで、テ
ンプレート7’のように、内部輪郭に囲まれる領域を塗
りつぶした文字のテンプレートを予め用意しておき、こ
れを用いてマッチングを行うこととする。これにより、
完全なマッチングが可能となる。ただし、このような内
部輪郭による閉領域をも塗りつぶして、マッチング可能
なものは、アルファベット、数字、平仮名等の平易な文
字に限られ、漢字等の複雑な文字の認識には適さない。
しかしながら、一般に医用画像中にID情報として用い
られるのは、アルファベット、数字程度に限られるため
上記方法を用いることができる。
【0043】上述のようにして、画像の文字付与領域か
ら文字認識が行われ、認識されたID番号等の文字情報
Iは、原画像データSと共にファイリング装置50へ出力
される。
【0044】このようにして、認識結果である文字情報
Iを自動的にCT、MRI等の医用画像データと対応付
けてファイリングすることができ、各画像データの検索
情報として用いることができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置の概略ブロック図。
【図2】本発明の文字認識装置におけるマッチングの一
例を説明する図。
【図3】本発明の文字認識装置におけるマッチングの別
の一例を説明する図。
【図4】マッチング方法を説明する図。
【符号の説明】
1 原画像 2 反転文字 3 輪郭抽出2値化画像 3’ 閉領域塗りつぶし2値化画像 4 エッジ 5 輪郭 6 閉領域塗りつぶし文字 7,7’ テンプレート 9 撮影装置 10 文字認識装置 20 文字領域認識手段 22 画像構成判定手段 30 2値化画像生成手段 35 塗りつぶし手段 40 マッチング手段 45 辞書 50 ファイリング装置

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文字を含む画像中から該文字を認識する
    文字認識方法であって、 前記画像から画像の輪郭を抽出した2値化画像を作成
    し、 前記輪郭に囲まれた閉領域を前記輪郭の画素値と同じ値
    とし、 2値化された文字のテンプレートを有する辞書を用意
    し、 前記2値化画像に対して前記テンプレートの文字を用い
    てパターンマッチングを行い文字を認識することを特徴
    とする文字認識方法。
  2. 【請求項2】 文字を含む画像中から該文字を認識する
    文字認識装置であって、 前記画像から画像の輪郭を抽出した2値化画像を生成す
    る2値化画像生成手段と、 前記輪郭に囲まれた閉領域の画素値を前記輪郭の画素値
    と同じ値にする手段と、 2値化された文字のテンプレートを有する辞書と、 前記2値化画像に対して前記テンプレートを用いてパタ
    ーンマッチングさせることにより文字を認識するマッチ
    ング手段とを備えることを特徴とする文字認識装置。
JP8223873A 1996-08-26 1996-08-26 文字認識方法および装置 Withdrawn JPH1063779A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8223873A JPH1063779A (ja) 1996-08-26 1996-08-26 文字認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8223873A JPH1063779A (ja) 1996-08-26 1996-08-26 文字認識方法および装置

Publications (1)

Publication Number Publication Date
JPH1063779A true JPH1063779A (ja) 1998-03-06

Family

ID=16805054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8223873A Withdrawn JPH1063779A (ja) 1996-08-26 1996-08-26 文字認識方法および装置

Country Status (1)

Country Link
JP (1) JPH1063779A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015179336A (ja) * 2014-03-18 2015-10-08 株式会社リコー 画像処理装置、画像処理方法、およびプログラム
CN111060527A (zh) * 2019-12-30 2020-04-24 歌尔股份有限公司 一种字符缺陷检测方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015179336A (ja) * 2014-03-18 2015-10-08 株式会社リコー 画像処理装置、画像処理方法、およびプログラム
CN111060527A (zh) * 2019-12-30 2020-04-24 歌尔股份有限公司 一种字符缺陷检测方法及装置
US12002198B2 (en) 2019-12-30 2024-06-04 Goertek Inc. Character defect detection method and device

Similar Documents

Publication Publication Date Title
CN112150428B (zh) 一种基于深度学习的医学图像分割方法
JP3619270B2 (ja) ヒストグラム領域を検知し、ディジタル放射線撮影画像のトーンスケールの再現を改善する方法
CN110310287B (zh) 基于神经网络的危及器官自动勾画方法、设备和存储介质
US8103077B2 (en) Method and system for locating opaque regions in chest X-ray radiographs
US7221787B2 (en) Method for automated analysis of digital chest radiographs
Masood et al. Brain tumor localization and segmentation using mask RCNN.
CN105719243A (zh) 图像处理装置和方法
US20220398737A1 (en) Medical image segmentation method based on u-network
US11915465B2 (en) Apparatus and methods for converting lineless tables into lined tables using generative adversarial networks
KR20200087427A (ko) 딥러닝을 이용한 갑상선 암의 림프절 전이 진단 방법
CN113793301A (zh) 基于稠密卷积网络模型的眼底影像分析模型的训练方法
WO2023047118A1 (en) A computer-implemented method of enhancing object detection in a digital image of known underlying structure, and corresponding module, data processing apparatus and computer program
KR20150059860A (ko) 형태학적 연산을 이용한 이미지 분할 처리방법
CN111401102A (zh) 深度学习模型训练方法及装置、电子设备及存储介质
CN111445456A (zh) 分类模型、网络模型的训练方法及装置、识别方法及装置
JPH1063779A (ja) 文字認識方法および装置
JPH11272800A (ja) 文字認識装置
JPH1063787A (ja) 文字認識方法および装置
Liao et al. Image segmentation of thyroid nodule and capsule for diagnosing central compartment lymph node metastasis
JP3819074B2 (ja) 文字認識装置
JPH1011536A (ja) 文字認識装置
JP3786221B2 (ja) 画像データ管理装置
JPH1021334A (ja) 文字認識装置
JP2004145592A (ja) 移動ベクトル抽出装置及び方法及びプログラム及びその記録媒体
JPH1020422A (ja) 画像構成判定装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20031104