JP6744126B2 - 文字認識装置、文字認識プログラム、文字認識方法 - Google Patents

文字認識装置、文字認識プログラム、文字認識方法 Download PDF

Info

Publication number
JP6744126B2
JP6744126B2 JP2016099709A JP2016099709A JP6744126B2 JP 6744126 B2 JP6744126 B2 JP 6744126B2 JP 2016099709 A JP2016099709 A JP 2016099709A JP 2016099709 A JP2016099709 A JP 2016099709A JP 6744126 B2 JP6744126 B2 JP 6744126B2
Authority
JP
Japan
Prior art keywords
image
character
unit
character recognition
partial images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016099709A
Other languages
English (en)
Other versions
JP2017207910A (ja
Inventor
佳憲 沖
佳憲 沖
藤田 稔
稔 藤田
佐藤 義之
義之 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Digital Solutions Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Digital Solutions Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Digital Solutions Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Digital Solutions Corp
Priority to JP2016099709A priority Critical patent/JP6744126B2/ja
Publication of JP2017207910A publication Critical patent/JP2017207910A/ja
Application granted granted Critical
Publication of JP6744126B2 publication Critical patent/JP6744126B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明の実施形態は、文字を認識する技術に関する。
従来、電力、水道、ガスなどを供給する事業者による課金業務は、作業員がその供給量を示すメータを検針することによって行われる。このようなメータの検針作業は、メータにおいて並列された複数の数字ドラムにより数値を示すカウンタ部を作業員が目視することによってなされるため、数値の読み間違えなどの人為的なミスが起こり得る。
これに対し、0から9の数字を縦に並べた照合用モデル画像を用意し、現字形計器の指示値表示部を撮像した画像データから各桁の画像領域を個別に切り出し、切り出した画像から数字部分を抽出し、この数字部分と照合用モデル画像とを比較して照合を行い、指示値を読み取る現字形計器認識処理装置、が知られている(特許文献1)。
特開2003−242444号公報
しかしながら、上述の技術によれば、認識対象とするカウンタ部における各数値の位置を人手で設定する必要があり、カウンタ部の数値の認識に際して作業が発生して煩雑である、という問題があった。
本発明の実施形態は、上述した問題点を解決するためになされたものであり、より容易にカウンタ部の数値を認識することができる技術を提供することを目的とする。
上述した課題を解決するため、本発明の実施形態は、並列する複数の文字を含む領域が階調で撮像された撮像画像を取得する画像取得部と、前記撮像画像を二値化した二値化画像を生成するフィルタ処理部と、前記二値化画像の縦座標毎に合計輝度値を算出した縦方向射影と、前記二値化画像の横座標毎に合計輝度値を算出した横方向射影とに基づいて、前記撮像画像における複数の文字のそれぞれを含む複数の部分画像を抽出する文字抽出部と、前記複数の部分画像のそれぞれと予め記憶された辞書データとをマッチングして文字を認識するマッチング処理部とを備える。
実施形態に係る文字認識装置が組み込まれたメータ読取装置を含むメータ読取システムの全体構成を示す図である。 水道メータの構成を示す概略図である。 水道メータの表示部の構成を示す概略図である。 文字認識装置のハードウェア構成を示すブロック図である。 文字認識装置の機能構成を示すブロック図である。 文字認識装置の全体動作を示すフローチャートである。 撮像画像を示す図である。 フィルタ処理の動作を示すフローチャートである。 ソーベルフィルタのカーネルを示す図である。 エッジ強調画像を示す図である。 二値化画像を示す図である。 細線化画像を示す図である。 回転補正処理の動作を示すフローチャートである。 境界線L及び回転角θを示す図である。 文字領域抽出処理の動作を示すフローチャートである。 二値化画像における対象領域を示す図である。 撮像画像における対象領域を示す図である。 二値化画像におけるノイズを示す図である。 y方向射影を示す図である。 第1文字領域抽出処理の動作を示すフローチャートである。 x方向射影を示す図である。 部分撮像画像を示す図である。 位置補正処理の動作を示すフローチャートである。 並列文字領域抽出処理の動作を示すフローチャートである。 文字判定処理の動作を示すフローチャートである。 右上角と左下角とを結ぶ対角線により分割された2つの領域を示す図である。 左上角と右下角とを結ぶ対角線により分割された2つの領域を示す図である。 左右に分割された2つの領域を示す図である。 合計輝度値による文字判定に用いられる画像を示す図である。 文字領域抽出処理による抽出結果を示す図である。 文字高さと抽出ウィンドウ間の距離との相関関係を示すグラフである。 部分撮像画像を二値化した二値画像及び特徴量算出処理結果を画像で表わした結果を示す図である。 特徴量パターンを示す図である。 マッチング処理の動作を示すフローチャートである。 数字の変形箇所を示す図である。 マッチング処理に用いられるカーネル関数を示す図である。 特徴量画像で表現された5と6との違いを示す図である。 カウンタ値判定処理の動作を示すフローチャートである。 499から500に変化するカウンタ部を示す図である。 回転が不十分なカウンタ部を示す図である。
以下、本発明の実施形態について図面を参照しつつ説明する。
(全体構成)
実施形態に係る文字認識装置が組み込まれたメータ読取装置を含むメータ読取システム、文字認識装置による文字認識対象である水道メータの構成、水道メータの表示部の構成について説明する。図1は、実施形態に係るメータ読取装置を含むメータ読取システムを含む検針システムの全体構成を示す図である。図2は、水道メータの構成を示す概略図である。図3は、水道メータの表示部の構成を示す概略図である。
図1に示すように、メータ読取システムは、水道メータ9の表示部93に表示される水の流量を読み取り、読み取った流量を無線通信により送信するメータ読取装置1と、送信された流量を受信するスマートフォン2とを備える。
水道メータ9は、図2に示すように、水の流量を計測する本体部90と、本体部90に水を流入させる流入口91と、本体部90から水を流出させる流出口92と、本体部90の上部に設けられて本体部90により計測された水の流量に係る情報を表示する表示部93とを備える。水道メータ9は、使用時には表示部93が上方を向くように設置される。
表示部93は、図3に示すように、円盤状に構成された表示盤930、視認可能に表示盤930に設けられたパイロット931、1L単位の積算値メータ932、10L単位の積算値メータ933、流量を立方メートル単位の数値により示すカウンタ部934を備える。表示盤930は、少なくともカウンタ部934が設けられる領域が半円状に黒に着色され、それ以外の領域が白に着色され、これらの領域の境界部は直線となっている。カウンタ部934は、4桁もしくは5桁の整数と1桁の小数により流量を示し、これらの数値は、それぞれ、側面部に0〜9の数値が円環状に配置された数字ドラムが回転することにより変化される。4桁もしくは5桁の整数を示す数字ドラムはそれぞれ背景色が黒に着色されるとともに数字が白に着色され、1桁の小数を示す数字ドラムは背景色が白に着色されるとともに数字が赤に着色されているものとする。なお、整数を示す数字ドラムは、背景色の輝度と数字の色の輝度とが互いに異なるものであればよい。また、これらの数字ドラムは、本体部90と表示盤930とにより構成される空間に内蔵されており、表示盤930に設けられた開口から外部より視認可能となっているものとする。また、水道メータ9の設置時には、表示盤930の面方向は水平方向を向くものとする。
メータ読取装置1は、図1に示すように、本体部10と、本体部10に内蔵される文字認識装置11と、本体部10の下部に設けられた略円筒状の撮像フード12と、撮像フード12内に設けられたカメラ13と、カメラ13による撮像対象に対して赤色光を照射するLED13aと、メータ読取装置1を操作するための操作部14と、メータ読取装置1に係る各種情報を表示するディスプレイ15とを備える。メータ読取装置1は、水道メータ9の表示部93におけるカウンタ部934の整数部を読み取るものであり、そのため、撮像フード12は本体部9上に載置可能に構成され、カメラ13は撮像フード12に対して表示盤930の略全体を撮像可能に設けられるものとする。また、メータ読取装置1の使用者は、カメラ13の撮像領域内にカウンタ部934と表示盤930における境界部とが含まれるようにメータ読取装置1を水道メータ9上に載置するものとする。
(文字認識装置の構成)
文字認識装置のハードウェア構成及び機能構成について説明する。図4は、文字認識装置のハードウェア構成を示すブロック図である。図5は、文字認識装置の機能構成を示すブロック図である。
文字認識装置11は、図4に示すように、ハードウェアとして、MPU(Micro Processing Unit)110、メモリ111、記憶装置112、通信部113、入出力I/F(interface)114を備える。MPU110及びメモリ111は、協働して各種機能を実行し、記憶装置112は各種機能により実行される処理に用いられる各種データを記憶する。通信部113は、スマートフォン2との通信を行う。入出力I/F114は、カメラ13、LED13a、操作部14、ディスプレイ15とのデータ入出力を行う。
また、文字認識装置11は、図5に示すように、MPU110及びメモリ111により実行される機能として、画像取得部101、フィルタ処理部102、回転補正部103、文字抽出部104、スケール調整部105、特徴量算出部106、マッチング処理部107、カウンタ値判定部108、カウンタ値送信部109を備える。画像取得部101は、カメラ13により撮像された撮像画像を取得する。フィルタ処理部102は、取得された撮像画像に各種フィルタを適用する。回転補正部103は、フィルタが適用された画像に基づいて、撮像された表示部93が正立するように撮像画像を回転させる。文字抽出部104は、撮像画像からカウンタ部934における個々の数値を含む部分画像を抽出する。スケール調整部105は、部分画像のスケールを調整する。特徴量算出部106は、部分画像から特徴量を算出する。マッチング処理部107は、部分画像の特徴量と予め用意された特徴量辞書とのマッチングを行うことにより部分画像内の数値を認識する。カウンタ値判定部108は、認識されたカウンタ部934の数値に対する判定を行う。カウンタ値送信部109は、通信部113を介して、認識され判定されたカウンタ部934の数値をスマートフォン2へ送信する。
(文字認識装置の全体動作)
文字認識装置の全体動作について説明する。図6は、文字認識装置の全体動作を示すフローチャートである。図7は、撮像画像を示す図である。
図6に示すように、まず、画像取得部101がカメラ13により撮像された撮像画像として、図7に示すようなモノクロ濃淡画像を取得する(S101)。ここで、撮像画像におけるカウンタ部934における小数部の数字は白の背景に赤で着色されているため、LED13aにより照射される赤色光により、白の矩形部となっており、従って、本実施形態においては認識対象とせず数字でない領域として扱われるものとする。
次に、フィルタ処理部102が後述するフィルタ処理を実行し(S102)、回転補正部103が後述する回転補正処理を実行する(S103)。
次に、文字抽出部104が回転補正処理により正立された撮像画像に対して、後述する文字領域抽出処理を実行し(S104)、スケール調整部105が文字領域抽出処理により抽出された各部分画像のスケールを調整し(S105)、特徴量算出部106が後述する特徴量算出処理を実行し(S106)、マッチング処理部107が各部分画像における数値を認識する(S107)。
次に、カウンタ値判定部108が後述するカウンタ値判定処理を行い(S108)、カウンタ値送信部109がカウンタ値判定処理により確定されたカウンタ部934のカウンタ値をスマートフォン2へ送信する(S109)。
(フィルタ処理)
フィルタ処理について説明する。図8は、フィルタ処理の動作を示すフローチャートである。図9は、ソーベルフィルタのカーネルを示す図である。図10は、エッジ強調画像を示す図である。図11は、二値化画像を示す図である。図12は、細線化画像を示す図である。
図8に示すように、まず、フィルタ処理部102は、撮像画像取得部101により取得された撮像画像に対して、図9(a)に示すような縦方向のカーネルと図9(b)に示すような横方向のカーネルとを用いたソーベルフィルタを適用して、図10に示すような輝度の変化が大きいエッジ箇所が強調されたエッジ強調画像を生成する(S201)。
次に、フィルタ処理部102は、エッジ強調画像を所定の閾値により二値化して、図11に示すような二値化画像を生成し(S202)、更に、この二値化画像に対して、線を1ピクセル幅だけ残す細線化処理を行い、図12に示すような細線化画像を生成する(S203)。
このように、フィルタ処理によれば、後述する処理に用いられる二値化画像及び細線化画像が生成される。
(回転補正処理)
回転補正処理の動作について説明する。図13は、回転補正処理の動作を示すフローチャートである。図14は、境界線L及び回転角θを示す図である。
図13に示すように、まず、回転補正部103は、細線化画像に基づいて、表示盤930における境界部を検出する(S301)。ここで、回転補正部103は、ハフ変換によって、細線化画像において図14に示すような最長の直線を境界線Lとして検出することによって、表示盤930における境界部、すなわち、黒に着色された半円状の領域の直線部分を検出する。
次に、回転補正部103は、水平線y=0と境界線Lとのなす角θを検出し(S302)、この角θが0となるように、撮像画像及び二値化画像を−θ回転させる(S303)。ここで、二値化画像は、上述したステップS202において生成された画像である。また、以降の説明において、画像の左上隅を原点とし、水平方向右向きにx軸、垂直方向下向きにy軸をとるものとする。
画像の回転後、回転補正部103は、回転補正した撮像画像について、倒立状態であるか否かを判定する(S304)。ここで、倒立状態とは、回転補正した撮像画像において表示部93が倒立している状態、即ち、境界線が平行となっているものの、カウンタ部934における数字が上下に反転している状態を示し、回転補正部103は、細線化画像における境界線Lが回転された線に相当する撮像画像における境界線上の点から上方側の10ピクセル、下方側の10ピクセルについて、それぞれ輝度値の加算を行い、上方の合計値が下方の合計値より大きい場合に倒立状態と判定する。
倒立状態である場合(S304,YES)、回転補正部103は、回転補正した撮像画像及び回転補正した二値化画像を180°回転させ(S305)、回転補正処理を終了する。
一方、倒立状態ではない場合(S304,NO)、回転補正部103は、回転補正処理を終了する。
このように、回転補正処理によれば、メータ読取装置1の使用者は、水道メータ9のカウンタ値の読み取りにおいて、撮像画像上において表示部93が正立するように、即ちカウンタ部934における数字の上下方向と撮像画像の上下方向とが一致するように、メータ読取装置1を設置する必要がない。
(文字領域抽出処理)
文字領域抽出処理の動作について説明する。図15は、文字領域抽出処理の動作を示すフローチャートである。図16は、二値化画像における対象領域を示す図である。図17は、撮像画像における対象領域を示す図である。図18は、二値化画像におけるノイズを示す図である。図19は、y方向射影を示す図である。
図15に示すように、文字抽出部104は、回転補正部103により表示部93が正立するように回転された撮像画像及び二値化画像から、図16、図17に示すように対象領域を抽出する(S401)。ここで、対象領域は境界線から上方に位置して上下方向に所定距離を有し、かつカウンタ部934が含まれる領域である。このとき小数点が対象領域に含まれないように対象領域下端と境界線との距離を設定する。例えば小数点部分が境界線から10ピクセル上にある場合、境界線から60ピクセル上方の位置から、境界線から10ピクセル上方の位置までの領域を対象領域として設定する。
次に、文字抽出部104は、対象領域として抽出した二値化画像(以後、単に二値化画像と称する。撮像画像も同様。)から図18に示すようなノイズNを除去する(S402)。ノイズNは、表示盤930に設けられた開口部に起因するものであり、文字抽出部104は、横方向に所定幅以上連続する白画素をノイズNと判定し、該当箇所を黒画素に変更する。ここで、所定幅は、少なくともカウンタ部934における一桁分の文字幅以上とすると良く、例えば30ピクセルに設定される。更に、文字抽出部104は、所定幅以上連続する白画素から上下1ピクセルに存在する白画素についてもノイズNと判定して黒画素に変更する。
ノイズNの除去後、文字抽出部104は、二値化画像のy方向射影Pを以下の式により算出する(S403)。ここで、射影Pは、y座標毎に算出される合計輝度値を示す。

は二値化画像、Wは二値化画像の幅。図19に射影Pの例を示す。
次に、文字抽出部104は、予め設定された所定の閾値Tと射影Pとに基づいて文字高さHを算出する(S404)。ここで、文字抽出部104は、P(y)≧Tとなるような、2つのy座標により示されるy方向の区間を探索し、該当する区間のうち、最大の区間を文字高さHとする。なお、この文字高さHは、対象領域のy方向の範囲として用いられる。これによって、処理対象領域に占める文字を構成する領域の割合を増加させることができ、延いては、文字の認識の精度を高めることができる。
次に、文字抽出部104は、後述する第1文字領域抽出処理を実行し(S405)、更に、後述する並列文字領域抽出処理を実行し(S406)、文字領域抽出処理を終了する。
(第1文字領域抽出処理)
第1文字領域抽出処理の動作について説明する。図20は、第1文字領域抽出処理の動作を示すフローチャートである。図21は、x方向射影を示す図である。図22は、部分撮像画像を示す図である。
図20に示すように、文字抽出部104は、まず、二値化画像のx方向射影Pを以下の式により算出する(S501)。ここで、射影Pは、x座標毎に算出される合計輝度値を示す。

は二値化画像の高さ。図21に射影Pの例を示す。
次に、文字抽出部104は、射影Pのx方向の重心座標xgを以下の式により算出する(S502)。
次に、文字抽出部104は、x方向に予め設定されたウィンドウ幅Wsを用いて、幅(2・Ws)を持つ抽出ウィンドウを射影Pに設け、その抽出ウィンドウの中心をx方向にxg−Wsからxg+Wsの間を1ピクセルごと左から右に移動しながら抽出ウィンドウ内の射影Pの合計を算出する。この抽出ウィンドウ内の射影Pの合計が最大となる抽出ウィンドウの中心座標xを算出する(S504)。
次に、文字抽出部104は、後述する位置補正処理により抽出ウィンドウの中心座標xのx方向位置を補正し(S505)、撮像画像における抽出ウィンドウ内の領域の画像を図22に示すような部分撮像画像として抽出し(S506)、文字領域抽出処理を終了する。図22には、カウンタ値における一の位の”5”を含む部分画像が示される。
このように、二値化画像における射影Pの重心座標Xgを初期値として抽出ウィンドウの中心座標xを算出することにより、重心座標Xgを抽出ウィンドウの中心にセットする場合に比べ、より文字が存在する可能性が高い領域に対して、最初に抽出ウィンドウをセットすることができる。なお、この抽出ウィンドウは、並列文字領域抽出処理により左右に移動し最適位置に補正される。
(位置補正処理)
位置補正処理について説明する。図23は、位置補正処理の動作を示すフローチャートである。
図23に示すように、まず、文字抽出部104は、中心座標xを中心としてウィンドウ幅Wsを左右に有する抽出ウィンドウを回転補正された撮像画像にセットし、この抽出ウィンドウ内の回転補正された撮像画像を部分撮像画像として抽出し(S601)、この部分撮像画像を判別分析法により二値化する(S602)。
次に、文字抽出部104は、二値化された部分撮像画像におけるx方向の重心座標xgを以下の式により算出する(S603)。

2Bは二値化された部分撮像画像、Hは部分撮像画像の高さ。
次に、文字抽出部104は、中心座標xと重心座標xgとが一致するか否かを判定する(S604)。ここで、文字抽出部104は、xg−Ws=0である場合に中心座標xと重心座標xgとが一致すると判定する。
中心座標xと重心座標xgとが一致する場合(S604,YES)、文字抽出部104は、位置補正処理を終了する。
一方、中心座標xと重心座標xgとが一致しない場合(S604,NO)、文字抽出部104は、中心座標xをx方向にシフトして抽出ウィンドウを移動させ(S605)、移動された抽出ウィンドウ内の回転補正した撮像画像を部分撮像画像として抽出する(S601)。抽出ウィンドウの移動においては、中心座標xには、重心座標xgからウィンドウ幅Wsを減算した値に中心座標xを加算した値が代入される。
このように、位置補正処理によれば、中心座標xと重心座標xgとが一致するように抽出ウィンドウのx方向位置を変化させることにより、抽出ウィンドウにより抽出される部分撮像画像による文字抽出の精度を向上させることができる。
(並列文字領域抽出処理)
並列文字領域抽出処理の動作について説明する。図24は、並列文字領域抽出処理の動作を示すフローチャートである。
図24に示すように、まず、文字抽出部104は、二値化画像及び撮像画像に設定された抽出ウィンドウの中心座標xを予め設定された文字間隔値分右方向へ動かし(S701)、後述する文字判定処理を実行し(S702)、この文字判定処理により抽出ウィンドウ内に文字があると判定されたか否かを判定する(S703)。
抽出ウィンドウ内に文字があると判定されない場合(S703,NO)、文字抽出部104は、第1文字領域抽出処理により二値化画像及び撮像画像に設定された抽出ウィンドウの中心座標xを文字間隔値分左方向へ動かし(S704)、文字判定処理を実行し(S705)、この文字判定処理により抽出ウィンドウ内に文字があると判定されたか否かを判定する(S706)。
抽出ウィンドウ内に文字があると判定されない場合(S706,NO)、文字抽出部104は、並列文字領域抽出処理を終了する。
一方、抽出ウィンドウ内に文字があると判定された場合(S706,YES)、文字抽出部104は、上述した位置補正処理により抽出ウィンドウの中心座標xの位置を補正し(S707)、抽出ウィンドウ内の領域の撮像画像を部分撮像画像として抽出し(S708)、再度、抽出ウィンドウの中心座標xを文字間隔値分左方向へ動かす。(S704)。
また、ステップS703において、抽出ウィンドウ内に文字があると判定された場合(S703,YES)、文字抽出部104は、上述した位置補正処理により抽出ウィンドウの中心座標xの位置を補正し(S709)、抽出ウィンドウ内の回転補正された撮像画像を部分撮像画像として抽出し(S710)、再度、抽出ウィンドウの中心座標xを文字間隔値分右方向へ動かす(S701)。
このように、並列文字領域抽出処理によれば、第1文字領域抽出処理により決定された抽出ウィンドウを左右に動かして、第1文字領域抽出処理により特定された領域に並列する数値の領域を特定することができる。また、並列文字領域抽出処理による左右方向それぞれへの探索は、文字判定処理により抽出ウィンドウ内に文字が存在しないと判定された場合に抽出ウィンドウがカウンタ部934の数値部分よりも外方の端部側へ達したと見做され終了される。
(文字判定処理)
文字判定処理の動作について説明する。図25は、文字判定処理の動作を示すフローチャートである。図26は、右上角と左下角とを結ぶ対角線により分割された2つの領域を示す図である。図27は、左上角と右下角とを結ぶ対角線により分割された2つの領域を示す図である。図28は、左右に分割された2つの領域を示す図である。図29は、合計輝度値による文字判定に用いられる画像を示す図である。図30は、文字領域抽出処理による抽出結果を示す図である。
図25に示すように、まず、文字抽出部104は、二値化画像における抽出ウィンドウ内の合計輝度値が所定比率未満であるかを判定する(S801)。ここで、文字抽出部104は、具体的には、白画素の数が抽出ウィンドウ内の総画素数の16分の1未満であるか否かを判定する。この判定によれば、抽出ウィンドウ内に白画素が極端に少ない場合に抽出ウィンドウ内に文字が存在しないと判定される。
合計輝度値が所定比率未満ではない場合(S801,NO)、文字抽出部104は、図26に示すように、二値化画像における抽出ウィンドウ内の領域を右上角から左下角への対角線により分割した領域A、領域Bとし(S802)、これらの領域間に合計輝度値の偏りがあるか否かを判定する(S803)。ここで、文字抽出部104は、具体的には、領域Aにおける合計輝度値をS、領域Bにおける合計輝度値をSとした際、SがSの5倍以上である場合、または、SがSの5倍以上である場合に領域Aと領域Bとの間に合計輝度値の偏りがあると判定する。
領域間に輝度値の偏りがない場合(S803,NO)、文字抽出部104は、図27に示すように、二値化画像における抽出ウィンドウ内の領域を左上角から右下角への対角線により分割した領域A、領域Bとし(S804)、これらの領域間に合計輝度値の偏りがあるか否かを判定する(S805)。ここで、文字抽出部104は、具体的には、上述の判定と同様に、領域Aにおける合計輝度値をS、領域Bにおける合計輝度値をSとした際、SがSの5倍以上である場合、または、SがSの5倍以上である場合に領域Aと領域Bとの間に合計輝度値の偏りがあると判定する。
領域間に輝度値の偏りがない場合(S805,NO)、文字抽出部104は、図28に示すように、二値化画像における抽出ウィンドウ内の領域を中心縦線に分割した領域A、領域Bとし(S806)、これらの領域間に合計輝度値の偏りがあるか否かを判定する(S807)。ここで、文字抽出部104は、具体的には、領域Aにおける合計輝度値をS、領域Bにおける合計輝度値をSとした際、SがSの10倍以上である場合、または、SがSの10倍以上である場合に領域Aと領域Bとの間に合計輝度値の偏りがあると判定する。
領域間に合計輝度値の偏りがない場合(S807,NO)、文字抽出部104は、撮像画像における抽出ウィンドウ内の領域について、ソーベルフィルタを適用した画像と元画像とを加算し、更に判定判別法により二値化した判定用部分画像を生成する(S808)。生成後、文字抽出部104は、図29(a)に示すような二値化画像における抽出ウィンドウ内の合計輝度値と、図29(b)に示すような判定用部分画像における合計輝度値との差が、予め設定された所定値以上であるか否かを判定する(S809)。本実施の形態においては、この判定に用いる所定値を175とする。
合計輝度値の差が所定値以上ではない場合(S809,NO)、文字抽出部104は、抽出ウィンドウ内の領域に文字があると判定し(S810)、文字判定処理を終了する。
一方、合計輝度値の差が所定値以上である場合(S809,YES)、文字抽出部104は、抽出ウィンドウ内の領域に文字がないと判定し(S811)、文字判定処理を終了する。
また、ステップS807において、領域間に合計輝度値の偏りがある場合(S807,YES)、文字抽出部104は、抽出ウィンドウ内の領域に文字がないと判定する(S811)。
また、ステップS805において、領域間に合計輝度値の偏りがある場合(S805,YES)、文字抽出部104は、抽出ウィンドウ内の領域に文字がないと判定する(S811)。
また、ステップS803において、領域間に合計輝度値の偏りがある場合(S803,YES)、文字抽出部104は、抽出ウィンドウ内の領域に文字がないと判定する(S811)。
また、ステップS801において、合計輝度値が所定比率未満である場合(S801,YES)、文字抽出部104は、抽出ウィンドウ内の領域に文字がないと判定する(S811)。
このように、文字判定処理によれば、抽出ウィンドウ内の合計輝度値に基づいて、抽出ウィンドウ内に文字が存在するか否かを判定することができる。また、位置補正処理を含む第1文字領域抽出処理と、文字判定処理及び位置補正処理を含む並列文字領域抽出処理とを含む文字抽出処理によれば、図30に示すように、例えば、W1〜W6の順に抽出ウィンドウの位置が移動される。このうち、W1、W3、W4、W5は文字があると判定され、W2はステップS809の判定により文字がないと判定され、W6は、ステップS803の判定により文字がないと判定される。なお、抽出ウィンドウW1、W3、W4、W5により抽出された部分撮像画像は、桁数を示す桁値が対応付けられるものとし、この桁値は、最も右側に位置するものを0として、1ずつ増加するようになっている。
(スケール調整処理)
スケール処理について説明する。図31は、文字高さと抽出ウィンドウ間の距離との相関関係を示すグラフである。
カメラ13と表示部93との距離や、水道メータ9の種別の違いなどによって、撮像画像における文字の大きさが特徴量辞書を作成するときに使用した文字の大きさと異なる状況が存在する。これに対し、スケール調整部105は、スケール調整処理により部分撮像画像のスケールを調整する。ここで、スケール調整に係る倍率は、図31に示すような事前に計測された文字同士の間隔と文字高さとの相関関係から得られた近似直線によって決定され、本実施の形態において、この近似直線はy=0.9709x−5.3309とする。
スケール調整部105は、まず、文字として判定された複数の抽出ウィンドウにおいて、隣り合う抽出ウィンドウの中心座標x間の距離をそれぞれ算出し、算出した距離の平均値を近似直線に代入することによって文字高さを算出する。更に、スケール調整部105は、算出された文字高さに基づいて、部分撮像画像のスケールを調整する。
(特徴量算出処理)
特徴量算出処理について説明する。図32は、部分撮像画像を二値化した二値画像及び特徴量算出処理結果を画像で表わした結果を示す図である。図33は、特徴量パターンを示す図である。
特徴量算出部106は、まず、例えば微分ヒストグラム法によって、図32(a)に示すように部分撮像画像を二値化し、この二値化画像を図32(b)に示すように特徴量算出する。ここで特徴量算出部106は、二値化画像をx方向に、左領域、中領域、右領域に三分割し、y座標(行)毎にそれぞれの領域内に含まれる輝度値に基づいて、各領域を0または1に設定する。本実施形態においては、白画素が3ピクセル以上続く場合に1と設定し、それ以外の場合に0と設定する。このように行ごとに算出した特徴量集合を作成する。これを以後特徴量画像と呼ぶ。この特徴量画像において、各y座標(行)は、図33において3ビット(0〜7の値)で表現される。このように、部分撮像画像を特徴量の集合として表わすことによりマッチング処理における堅牢性が向上するとともに、部分撮像画像を後述するマッチング処理に適したものとすることができる。
(マッチング処理)
マッチング処理について説明する。図34は、マッチング処理の動作を示すフローチャートである。図35は、数字の変形箇所を示す図である。図36は、マッチング処理に用いられるカーネル関数を示す図である。図37は、特徴量化された5と6との違いを示す図である。
図34に示すように、まず、マッチング処理部107は、未選択の特徴量画像を選択し(S901)、未選択の特徴量辞書を選択する(S902)。
ここで、特徴量辞書について説明する。特徴量辞書は、円筒状の数字ドラムの側面を円周方向に3°ずつずらして全周を撮像した120枚の画像をそれぞれの特徴量算出を行い集合としたものである。図35に示すように、カウンタ部934の文字は数字ドラムの側面に表示され、この側面の断面形状は円弧を描いているため、数字ドラム中心から上下に離れるにつれ文字の変形が増大する。また、数字ドラムの側面には0〜9の数値が配置されており、カウンタ値の変化途中においては、例えば、隣り合って配置される2つの数値が同時に視認可能となる。そのため、このように個々の数字を撮像した画像だけでなく、変化途中も考慮した画像をも用いることによって、より精度の高いマッチングを行うことができる。なお、これら120個の特徴量辞書のそれぞれには、0.0〜9.9の値が対応付けられており、この値において、整数部はカウンタ値として表示される数字を示し、小数部は数字ドラムの回転方向に隣り合う数字への変化度合を示す。例えば、9から0へ変化する途中の状態であって、上方に9の一部と下方に0の一部とが撮像された特徴量辞書には9.5が設定される。この特徴量辞書に対応付けられる値はカウンタ値判定処理に用いられる。
次に、マッチング処理部107は、選択した特徴量画像及び特徴量辞書との類似度Rを以下の式により算出する(S903)。

I(h)はh行における特徴量画像の特徴量、T(h)はh行における特徴量辞書の特徴量を示す。テルソン積記号は特徴量の組み合わせに対して設定されたカーネル値を決定する演算を示し、後述するカーネル関数が用いられる。また、

であり、この処理によればh行とマッチングする対象を特徴量辞書h−Δh行〜h+Δh行の合計2・Δh+1行の中で演算値が最大のものがマッチング結果として採用される。これにより、スケール調整処理によりスケール調整の誤差が生じた場合であっても、この誤差がマッチングに及ぼす影響を低減することができる。
類似度Rの算出に用いられるカーネル関数は、図36に示すように、特徴量の組み合わせに対して、個々に重みを設定したものであり、区別すべき特徴量の組み合わせに対しては小さな値がセットされる。例えば、図37に示すような特徴量画像で表現された5と6とでは、その違いは一部分のみとなっているが、ここで、特徴量[001]=1と特徴量[101]=5に対して小さな値を設定することによって、マッチング処理における5と6の判別性能を向上させることができる。
類似度Rの算出後、マッチング処理部107は、未選択の特徴量辞書があるか否かを判定する(S904)。
未選択の特徴量辞書がない場合(S904,NO)、マッチング処理部107は、算出された類似度Rが最大である特徴量辞書を選択し(S905)、この特徴量辞書に対応付けられた値を取得し(S906)、未選択の特徴量画像があるか否かを判定する(S907)。
未選択の特徴量画像がない場合(S907,NO)、マッチング処理を終了する。
一方、未選択の特徴量画像がある場合(S907,YES)、マッチング処理部107は、再度、未選択の特徴量画像を選択する(S901)。
また、ステップS904において、未選択の特徴量辞書がある場合(S904,YES)、マッチング処理部107は、再度、未選択の特徴量辞書を選択する(S902)。
(カウンタ値判定処理)
カウンタ値判定処理について説明する。図38は、カウンタ値判定処理の動作を示すフローチャートである。図39は、499から500に変化するカウンタ部を示す図である。
図38に示すように、まず、カウンタ値判定部109は、最下位の桁を0とした変数nに0を代入し(S1001)、nがカウンタ値の桁数を示し、予め設定される設定桁数(本実施形態においては4)より小さいか否かを判定する(S1002)。
nが設定桁数より小さい場合(S1002,YES)、n桁についてマッチング処理により取得された取得値(類似度Rが最大となる特徴量辞書に対応付けられた値)が9+Δnから10−Δnの区間内であるか否かを判定する(S1003)。ここで、Δnは予め設定する値であり桁上がりが発生しているかの判定を調整するパラメータとなっており、本実施の形態においては、0.3に設定されているものとする。
取得値が9+Δnから10−Δnの区間内である場合(S1003,YES)、カウンタ値判定部109は、n桁を後に判定の対象とする桁である判定保留桁に追加し(S1004)、nをインクリメントし(S1005)、再度、nが設定桁数より小さいか否かを判定する(S1002)。
一方、取得値が9+Δnから10−Δnの区間外である場合(S1003,NO)、カウンタ値判定部109は、n桁目の取得値の小数部が(1−Δn)以下であるか否かを判定する(S1006)。
n桁についての取得値の小数部が(1−Δn)以下である場合(S1006,YES)、カウンタ値判定部109は、n桁目の取得値の整数部をn桁目の読取値とし(S1007)、変数mに0を代入し(S1008)、mが判定保留桁のうち最大のものである最大判定保留桁より小さいか否かを判定する(S1009)。
mが最大判定保留桁より小さい場合(S1009,YES)、カウンタ値判定部109は、m桁が判定保留桁かどうかを判定する(S1010)。
m桁が判定保留桁である場合(S1010,YES)、m桁の読取値を9としてm桁を判定保留桁から解除し(S1011)、mをインクリメントし(S1012)、再度、mが最大判定保留桁より小さいか否かを判定する(S1009)。ここで、読取値とは、最終的にカウンタ部932のカウンタ値として読み取られる値である。
一方、m桁が判定保留桁ではない場合(S1010,NO)、カウンタ値判定部109は、mをインクリメントする(S1012)。
また、ステップS1009において、mが最大判定保留桁以上である場合(S1009,NO)、カウンタ値判定部109は、nをインクリメントする(S1005)。
また、ステップS1006において、n桁についての取得値の小数部が(1−Δn)より大きい場合(S1006,NO)、カウンタ値判定部109は、n桁目の取得値の整数部+1をn桁目の読取値とし(S1013)、mに0を代入し(S1014)、mが最大判定保留桁より小さいか否かを判定する(S1015)。
mが最大判定対象保留桁より小さい場合(S1015,YES)、カウンタ値判定部109は、m桁が判定保留桁かどうかを判定する(S1016)。
m桁が判定保留桁である場合(S1016,YES)、カウンタ値判定部109は、m桁の読取値を0としてm桁を判定保留桁から解除し(S1017)、mをインクリメントし(S1018)、再度、mが最大判定保留桁より小さいか否かを判定する(S1015)。
一方、m桁が判定保留桁ではない場合(S1016,NO)、カウンタ値判定部109は、mをインクリメントする(S1018)。
また、ステップS1015において、mが最大判定保留桁以上である場合(S1015,NO)、カウンタ値判定部109は、nをインクリメントする(S1005)。
また、ステップS1002において、nが設定桁数より小さくない場合(S1002、NO)、カウンタ値判定部109は、カウンタ値判定処理を終了する。
このように、カウンタ値判定処理によれば、図39に示すような、カウンタ値が[0499]から[0500]に変化している際の撮像画像について、0と9との間にある桁(判定対象桁)よりも上位の桁がより大きな数字へ変化中であるか否かを判定することによって、判定対象桁の数字を正しく読み取ることができる。なお、回転が不十分なカウンタ部を示す図40からわかるように、数字が変化途中でなくとも数字の上下方向における重心が中心位置から大きくずれている水道メータも存在するため、カウンタ値判定処理における小数部の閾値Δnを0.3程度に設定することが望ましい。
本実施の形態において、文字認識プログラムは上述した文字認識装置の内部に予めインストールされているものとして記載したが、本発明における文字認識プログラムは記憶媒体に記憶されたものも含まれる。ここで記憶媒体とは、磁気テープ、磁気ディスク(ハードディスクドライブ等)、光ディスク(CD−ROM、DVDディスク等)、光磁気ディスク(MO等)、フラッシュメモリ等、欠陥検査装置に対し脱着可能な媒体や、さらにネットワークを介することで伝送可能な媒体等、上述した文字認識装置としてのコンピュータで読み取りや実行が可能な全ての媒体をいう。
発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
11 文字認識装置、101 画像取得部、102 フィルタ処理部、104 文字抽出部、107 マッチング処理部。

Claims (8)

  1. 並列する複数の文字を含む半円状に着色された領域における文字の認識を行う文字認識装置であって、
    前記半円状に着色された領域が階調で撮像された撮像画像を取得する画像取得部と、
    前記撮像画像を二値化した二値化画像を生成するフィルタ処理部と、
    前記二値化画像における半円状の領域の直線部が水平となるように前記二値化画像を回転補正する回転補正部と、
    前記回転補正された二値化画像の縦座標毎に合計輝度値を算出した縦方向射影と、前記二値化画像の横座標毎に合計輝度値を算出した横方向射影とに基づいて、前記撮像画像における複数の文字のそれぞれを含む複数の部分画像を抽出する文字抽出部と、
    前記回転補正された二値化画像における隣り合う部分画像間の距離と、予め設定された隣り合う部分画像間の距離と該部分画像の高さとの相関関係とに基づいて、前記複数の部分画像のスケールを調整するスケール調整部と、
    前記スケールが調整された複数の部分画像のそれぞれと予め記憶された辞書データとをマッチングして文字を認識するマッチング処理部と
    を備える文字認識装置。
  2. 前記文字抽出部は、前記縦方向射影に基づく縦方向範囲と所定の横幅とを有する第1抽出ウィンドウの横方向位置を前記横方向射影の重心に基づいて決定し、該第1抽出ウィンドウを前記撮像画像にセットし、前記第1抽出ウィンドウ内の画像を部分画像として抽出することを特徴とする請求項1に記載の文字認識装置。
  3. 前記文字抽出部は、前記第1抽出ウィンドウと同等の縦方向範囲及び横幅とを有し、該第1抽出ウィンドウに対して横方向に所定距離単位で順次移動される第2抽出ウィンドウを前記撮像画像にセットし、前記第2抽出ウィンドウ内の画像を部分画像として抽出することを特徴とする請求項2に記載の文字認識装置。
  4. 前記文字抽出部は、前記第2抽出ウィンドウを前記第1抽出ウィンドウに対して横方向一方へ順次移動させ、該第2抽出ウィンドウ内の領域画像が文字を含むか否かを該領域画像の合計輝度値に基づいて判定し、該領域画像が文字を含まない場合、前記第1抽出ウィンドウに対して横方向逆方へ順次移動させることを特徴とする請求項3に記載の文字認識装置。
  5. 前記複数の部分画像のそれぞれの特徴量を算出して特徴量の集合である特徴量集合を生成する特徴量算出部を更に備え、
    前記マッチング処理部は、予め記憶された特徴量の集合である前記辞書データと、前記特徴量集合との類似度を算出することにより文字を認識することを特徴とする請求項1〜請求項のいずれか一項に記載の文字認識装置。
  6. 前記マッチング処理部は、前記辞書データに含まれる特徴量と前記特徴量集合に含まれる特徴量との組み合わせに対して予め設定された重みに基づいて、前記類似度を算出することを特徴とする請求項5に記載の文字認識装置。
  7. 並列する複数の文字を含む半円状に着色された領域における文字の認識を行う文字認識プログラムであって、
    前記半円状に着色された領域が階調で撮像された撮像画像を取得し、
    前記撮像画像を二値化した二値化画像を生成し、
    前記二値化画像における半円状の領域の直線部が水平となるように前記二値化画像を回転補正し、
    前記回転補正された二値化画像の縦座標毎に合計輝度値を算出した縦方向射影と、前記二値化画像の横座標毎に合計輝度値を算出した横方向射影とに基づいて、前記撮像画像における複数の文字のそれぞれを含む複数の部分画像を抽出し、
    前記回転補正された二値化画像における隣り合う部分画像間の距離と、予め設定された隣り合う部分画像間の距離と該部分画像の高さとの相関関係とに基づいて、前記複数の部分画像のスケールを調整し、
    前記スケールが調整された複数の部分画像のそれぞれと予め記憶された辞書データとをマッチングして文字を認識する
    処理をコンピュータに実行させる文字認識プログラム。
  8. 並列する複数の文字を含む半円状に着色された領域における文字の認識をコンピュータに行わせる文字認識方法であって、
    前記コンピュータが、
    前記半円状に着色された領域が階調で撮像された撮像画像を取得し、
    前記撮像画像を二値化した二値化画像を生成し、
    前記二値化画像における半円状の領域の直線部が水平となるように前記二値化画像を回転補正し、
    前記回転補正された二値化画像の縦座標毎に合計輝度値を算出した縦方向射影と、前記二値化画像の横座標毎に合計輝度値を算出した横方向射影とに基づいて、前記撮像画像における複数の文字のそれぞれを含む複数の部分画像を抽出し、
    前記回転補正された二値化画像における隣り合う部分画像間の距離と、予め設定された隣り合う部分画像間の距離と該部分画像の高さとの相関関係とに基づいて、前記複数の部分画像のスケールを調整し、
    前記スケールが調整された複数の部分画像のそれぞれと予め記憶された辞書データとをマッチングして文字を認識する文字認識方法。
JP2016099709A 2016-05-18 2016-05-18 文字認識装置、文字認識プログラム、文字認識方法 Active JP6744126B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016099709A JP6744126B2 (ja) 2016-05-18 2016-05-18 文字認識装置、文字認識プログラム、文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016099709A JP6744126B2 (ja) 2016-05-18 2016-05-18 文字認識装置、文字認識プログラム、文字認識方法

Publications (2)

Publication Number Publication Date
JP2017207910A JP2017207910A (ja) 2017-11-24
JP6744126B2 true JP6744126B2 (ja) 2020-08-19

Family

ID=60417250

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016099709A Active JP6744126B2 (ja) 2016-05-18 2016-05-18 文字認識装置、文字認識プログラム、文字認識方法

Country Status (1)

Country Link
JP (1) JP6744126B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969063B (zh) * 2018-09-30 2023-08-18 中移物联网有限公司 抄表方法、抄表设备、远程抄表装置、***及存储介质
JP7093321B2 (ja) * 2019-03-19 2022-06-29 株式会社Third 計器読取システム
CN110781901B (zh) * 2019-10-29 2023-04-28 湖北工业大学 基于bp神经网络预测阈值的仪表重影字符识别方法
CN111832561B (zh) * 2020-07-03 2021-06-08 深圳思谋信息科技有限公司 基于计算机视觉的字符序列识别方法、装置、设备和介质
CN118072312A (zh) * 2024-04-19 2024-05-24 深圳拓安信物联股份有限公司 一种水表读数方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP2017207910A (ja) 2017-11-24

Similar Documents

Publication Publication Date Title
JP6744126B2 (ja) 文字認識装置、文字認識プログラム、文字認識方法
Hoang et al. Metaheuristic optimized edge detection for recognition of concrete wall cracks: a comparative study on the performances of roberts, prewitt, canny, and sobel algorithms
TWI579775B (zh) A matching processing device, a matching processing method and an inspection device using the same
JP2018102916A (ja) 制御方法、情報端末、及びプログラム
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2008217347A (ja) ナンバープレート認識装置、その制御方法、コンピュータプログラム
CN110765992B (zh) ***鉴别方法、介质、设备及装置
JP6352695B2 (ja) 文字検出装置、方法およびプログラム
CN109727279B (zh) 一种矢量数据与遥感影像的自动配准方法
CN107067536A (zh) 一种图像边界确定方法、装置、设备和存储介质
CN103136760B (zh) 一种基于fast与daisy的多传感器图像匹配方法
Moradi et al. Automated anomaly detection and localization in sewer inspection videos using proportional data modeling and deep learning–based text recognition
CN109389165A (zh) 基于巡检机器人的变压器油位计识别方法
CN108182691B (zh) 识别限速标志的方法、装置及车辆
JP2012043436A (ja) 対象検出装置、対象検出方法、分類器作成装置及び分類器作成方法
CN110348307B (zh) 一种起重机金属结构攀爬机器人的路径边缘识别方法及***
JP2010211460A (ja) 識別モデル生成装置、対象物検出装置、及び識別モデル生成プログラム
EP3955207A1 (en) Object detection device
CN105809657A (zh) 一种角点检测方法和装置
JP2011107878A (ja) 位置検出装置、位置検出方法
CN109359646A (zh) 基于巡检机器人的液位型仪表识别方法
KR100194583B1 (ko) 얼굴 구성요소 추출시스템 및 그 추출방법
JP5708305B2 (ja) 画像認識装置、画像認識方法及び画像認識用コンピュータプログラム
Ai et al. Geometry preserving active polygon-incorporated sign detection algorithm
JP7418158B2 (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20180406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180406

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200730

R150 Certificate of patent or registration of utility model

Ref document number: 6744126

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350