JP2018055496A - 媒体認識装置および媒体認識方法 - Google Patents
媒体認識装置および媒体認識方法 Download PDFInfo
- Publication number
- JP2018055496A JP2018055496A JP2016192187A JP2016192187A JP2018055496A JP 2018055496 A JP2018055496 A JP 2018055496A JP 2016192187 A JP2016192187 A JP 2016192187A JP 2016192187 A JP2016192187 A JP 2016192187A JP 2018055496 A JP2018055496 A JP 2018055496A
- Authority
- JP
- Japan
- Prior art keywords
- projection
- medium
- evaluation value
- rotation angle
- end points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000011156 evaluation Methods 0.000 claims abstract description 116
- 238000012545 processing Methods 0.000 claims abstract description 66
- 238000001514 detection method Methods 0.000 claims abstract description 24
- 230000015572 biosynthetic process Effects 0.000 abstract 1
- 230000000452 restraining effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20068—Projection on vertical or horizontal image axis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/247—Aligning, centring, orientation detection or correction of the image by affine transforms, e.g. correction due to perspective effects; Quadrilaterals, e.g. trapezoids
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
【課題】演算負荷を軽減でき、ひいてはコスト上昇を抑止することが可能な媒体認識装置および媒体認識方法を提供する。【解決手段】媒体認識装置10のデータ処理部60は、処理対象画像の水平軸および垂直軸のそれぞれに対して輝度投影による画素値の射影を生成する射影生成部630、水平軸への射影および垂直軸への射影のそれぞれについて、その射影波形の台形パターンの両端点を決定する端点検出部640、水平軸に関する射影波形の台形パターンの両端点の間隔Wおよび、垂直軸に関する台形パターンの両端点の間隔Hを求め、そのデータと、対象媒体の幅と高さを用いて所定の評価値を取得する評価値取得部650、およびこの評価値をキーとして、あらかじめ設定しておいた参照テーブルRTBLから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする回転角度決定部660を有する。【選択図】図3
Description
本発明は、たとえば、カード媒体の画像上の回転角度を検出し、検出した回転角度を参照してカード媒体上の情報を認識する媒体認識装置および媒体認識方法に関するものである。
デジタル画像を用いて、処理対象媒体上の直線あるいは直線で構成される特定の幾何学図形を検出し、認識する手法として、ハフ(Hough)変換がよく知られており、さまざまな産業分野で広く用いられている。
この方法は、一般には、認識対象図形を含む画像にノイズ除去やエッジ強調等の前処理を施したのち、抽出された画像パターンに対してハフ変換を施して累積点に変換し、その後、最大の累積度数をもつ累積点に関して逆ハフ変換を行い、画像空間上の直線を求める、という手順をとる(たとえば、特許文献1,2参照)。
特許文献1に記載の技術では、半導体デバイスの製造工程におけるワークの位置決めについて、位置座標をハフ変換を用いて検出し、位置補正に用いるものであるが、最大累積点を求めて、不要パターン除去を行った後、逆ハフ変換して基準となる直線を求め、ワークの角度補正を得るようにしている。
特許文献2に記載の技術では、多角形形状の形状特徴量を算出する場合に、物体の周囲の一部を構成する線分を推定するためにハフ変換を適用している。極座標に変換される点の個数を数え上げ、頻度が多い極座標を選択する。選択された極座標毎に逆ハフ変換で直線の式を算出するとともに回転角の検出を行っている。
しかしながら、ハフ空間上の最大累積点を求めることは、二次元空間上の極大点を求めることであり、不要パターンに起因するノイズを除去する必要があるなど、一般には容易ではなく、かつ演算負荷が大きい。そのため高速処理を行おうとすると、高性能なプロセッサを用いる必要があり、コスト上昇につながるという問題がある。
本発明の目的は、演算負荷を軽減でき、ひいてはコスト上昇を抑止することが可能な媒体認識装置および媒体認識方法を提供することにある。
本発明の第1の観点は、デジタル画像を用いて、媒体の画像上の回転角度を検出し、検出した回転角度を参照して媒体上の情報を認識する媒体認識装置であって、処理対象画像の水平軸および垂直軸のそれぞれに対して輝度投影による画素値の射影を生成する射影生成部と、前記水平軸への射影および前記垂直軸への射影のそれぞれについて、その射影波形の射影パターンの両端点を決定する端点検出部と、前記水平軸に関する射影波形の射影パターンの両端点の間隔および前記垂直軸に関する射影波形の射影パターンの両端点の間隔を求め、その間隔データと認識対象媒体の幅と高さに関連付けて所定の評価値を取得する評価値取得部と、前記評価値取得部による評価値に基づいて媒体の回転角度を決定する回転角度決定部とを有する。
これにより、ハフ変換行列から極大点を解析的に抽出する必要もなく、ハフ変換を用いることなく、従来よりも低コストで高速に矩形媒体の回転角度を検出できる。
好適には、前記回転角度決定部は、前記評価値取得部による評価値に基づいて、あらかじめ設定しておいた参照テーブルから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする。
これにより、演算負荷を軽減でき、安価な処理系を実現することができる。
好適には、前記評価値取得部は、前記認識対象媒体の幅と前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第1値と前記認識対象媒体の高さと前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第2値との差に応じた評価値を求める。
これにより、高い精度で評価値を取得することができる。
好適には、前記評価値取得部は、前記認識対象媒体の幅と前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第1値と前記認識対象媒体の高さと前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第2値との差に応じた第1評価値と、前記認識対象媒体の高さと前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第3値と前記認識対象媒体の幅と前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第4値との差に応じた第2評価値との割合に応じて回転角度を求め、前記回転角度決定部は、前記評価値取得部による評価値としての回転角度を媒体の回転角度として決定する。
これにより、演算負荷が若干大きくなるものの、実際の回転角度を高い精度で取得することができ、回転角度決定処理の高速化を図ることが可能となる。
本発明の第2の観点は、デジタル画像を用いて、媒体の画像上の回転角度を検出し、検出した回転角度を参照して媒体上の情報を認識する媒体認識方法であって、処理対象画像の水平軸および垂直軸のそれぞれに対して輝度投影による画素値の射影を生成する射影生成ステップと、前記水平軸への射影および前記垂直軸への射影のそれぞれについて、その射影波形の射影パターンの両端点を決定する端点検出ステップと、前記水平軸に関する射影波形の射影パターンの両端点の間隔および前記垂直軸に関する射影波形の射影パターンの両端点の間隔を求め、その間隔データと認識対象媒体の幅と高さに関連付けて所定の評価値を取得する評価値取得ステップと、前記評価値取得ステップによる評価値に基づいて媒体の回転角度を決定する回転角度決定ステップとを有する。
これにより、ハフ変換行列から極大点を解析的に抽出する必要もなく、ハフ変換を用いることなく、従来よりも低コストで高速に矩形媒体の回転角度を検出できる媒体認識装置を提供することが可能となる。
好適には、前記回転角度決定ステップは、前記評価値取得ステップによる評価値に基づいて、あらかじめ設定しておいた参照テーブルから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする。
これにより、演算負荷を軽減でき、安価な処理系を実現することができる媒体認識装置を提供することが可能となる。
好適には、前記評価値取得ステップは、前記認識対象媒体の幅と前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第1値と前記認識対象媒体の高さと前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第2値との差に応じた評価値を求める。
これにより、高い精度で評価値を取得することができる媒体認識装置を提供することが可能となる。
好適には、前記評価値取得ステップは、前記認識対象媒体の幅と前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第1値と前記認識対象媒体の高さと前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第2値との差に応じた第1評価値と、前記認識対象媒体の高さと前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第3値と前記認識対象媒体の幅と前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第4値との差に応じた第2評価値との割合に応じて回転角度を求め、前記回転角度決定ステップは、前記評価値取得ステップによる評価値としての回転角度を媒体の回転角度として決定する。
これにより、演算負荷が若干大きくなるものの、実際の回転角度を高い精度で取得することができ、回転角度決定処理の高速化を図ることができる媒体認識装置を提供することが可能となる。
本発明によれば、演算負荷を軽減でき、ひいてはコスト上昇を抑止することができる。
以下、本発明の実施形態を図面に関連付けて説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る媒体認識装置の主要部の構成例を示す図である。
図2は、認識対象の一例であるカード媒体の外観を模式的に示す図である。
図1は、本発明の第1の実施形態に係る媒体認識装置の主要部の構成例を示す図である。
図2は、認識対象の一例であるカード媒体の外観を模式的に示す図である。
本実施形態に係る媒体認識装置10は、デジタル画像を用いて、カード等の矩形をなす媒体100の画像上の回転角度を検出し、検出した回転角度を参照して媒体100上に記録されている文字あるいはバーコード等の情報110を認識する。
なお、図2において、媒体100の幅方向をX軸方向としている。このX軸方向に直交する方向をY軸方向とする。また、本実施形態では、説明を簡単にするために、図2に示すように、情報(たとえばOCR文字)記録領域120に形成されている文字列等の情報110の方向、すなわち、文字が並んでいる方向をX軸方向としている。そして、X軸方向に直交する方向をY軸方向としている。具体的には、文字が並んでいる方向と直交する方向はY軸方向である。
なお、図2において、媒体100の幅方向をX軸方向としている。このX軸方向に直交する方向をY軸方向とする。また、本実施形態では、説明を簡単にするために、図2に示すように、情報(たとえばOCR文字)記録領域120に形成されている文字列等の情報110の方向、すなわち、文字が並んでいる方向をX軸方向としている。そして、X軸方向に直交する方向をY軸方向としている。具体的には、文字が並んでいる方向と直交する方向はY軸方向である。
媒体100は、JISに準拠している一般的なカードであってもよく、たとえば、幅(a)126mm,高さ(b)80mm,厚み0.76mm、あるいは幅86mm,高さ54mm,厚み0.76mmというサイズのプラスチックカードでもよく、IDカードやパスポートブック、あるいは運転免許証などでもよい。
図1の媒体認識装置10は、媒体100が載置されるテーブル20、画像データ入力部としての画像読取部30、アナログデジタルコンバータ(A/Dコンバータ)40、画像メモリ50、およびデータ処理部60を有している。
画像読取部30は、光を検出して電荷を発生させる光電変換素子を用いた固体撮像装置(イメージセンサ)としてのCCD(Charge Coupled Device)イメージセンサやCMOS(Complementary Metal Oxide Semiconductor)イメージセンサ、イメージセンサの画素領域に入射光を導く(被写体像を結像する)光学系(レンズ等)を有し、テーブル20上に載置され、照明光源31で照明される矩形状媒体(たとえばカード状媒体)100の全体を含む所定の領域を撮像する。
A/Dコンバータ40は、画像読取部30によって撮像された媒体100を含む画像をデジタル画像データに変換し、画像メモリ50に格納する。
なお、A/Dコンバータ40は、画像読取部30にその機能を含ませることも可能である。
なお、A/Dコンバータ40は、画像読取部30にその機能を含ませることも可能である。
画像メモリ50は、画像読取部30で撮像されたOCR文字列等の情報110を含む媒体100のデジタル化された画像データを記憶(格納)する。画像メモリ50に格納される原画像は、複数の画素がマトリクス状に配列されて形成され、具体的には、図示していないが、X軸方向にM行、Y軸方向にN列の画素が配置されている。各画素はそれぞれ画素値(輝度値)を有する。
本実施形態では、各画素値は、たとえば8ビットで表現すると0〜255の間のいずれかの値をとり、画素値は黒に近いほど小さく、白に近いほど大きな値をとる。
なお、この画像メモリ50は、RAM,SDRAM,DDRSDRAM,RDRAMなど、画像データを記憶しうるものであれば如何なるものであってもよい。
本実施形態では、各画素値は、たとえば8ビットで表現すると0〜255の間のいずれかの値をとり、画素値は黒に近いほど小さく、白に近いほど大きな値をとる。
なお、この画像メモリ50は、RAM,SDRAM,DDRSDRAM,RDRAMなど、画像データを記憶しうるものであれば如何なるものであってもよい。
データ処理部60は、デジタル画像を用いて、カード等の矩形をなす媒体100の画像上の回転角度を検出し、検出した回転角度を参照して媒体100上に記録されている文字あるいはバーコード等の情報110を認識する機能を有する。データ処理部60は、媒体認識装置10の全体的な制御を司るCPU等の一部として構成される。
[データ処理部60の各部の構成および機能]
次に、データ処理部60の各部の基本的な構成および機能について説明する。
データ処理部60は、画像メモリ50から多値化された画像データ(多階調の濃淡画像、たとえば、256階調)を読み出す。
次に、データ処理部60の各部の基本的な構成および機能について説明する。
データ処理部60は、画像メモリ50から多値化された画像データ(多階調の濃淡画像、たとえば、256階調)を読み出す。
図3は、本第1の実施形態に係る媒体認識装置10におけるデータ処理部60の構成例を示すブロック図である。
図4は、カード状媒体を撮像した画像の一例を示す図である。
図5は、図4の画像にエッジ強調処理、二値化処理を行った後の画像の一例を示す図である。
図4は、カード状媒体を撮像した画像の一例を示す図である。
図5は、図4の画像にエッジ強調処理、二値化処理を行った後の画像の一例を示す図である。
データ処理部60は、エッジ強調部610、二値化処理部620、射影生成部630、端点検出部640、評価値取得部650、回転角度決定部660、情報認識部670、および角度参照テーブルRTBLを有する。
ここでは、図4に示すような、画像空間上に描かれた長方形を例にあげて、回転角度の検出処理および媒体100上の情報の認識処理について説明する。
図4の長方形は一般的なカード媒体を撮像した画像IMGを例示しているが、認識対象画像は撮像条件によってノイズやひずみが存在することがあり、前処理段階でノイズ除去処理が行われることが多い。そのうえでエッジ強調処理が行われ、さらに二値化処理が行われ、図5の画像が得られる。この例では直線が黒に背景が白として二値化されている。直線が白、背景が黒という設定もされることもある。
図4の長方形は一般的なカード媒体を撮像した画像IMGを例示しているが、認識対象画像は撮像条件によってノイズやひずみが存在することがあり、前処理段階でノイズ除去処理が行われることが多い。そのうえでエッジ強調処理が行われ、さらに二値化処理が行われ、図5の画像が得られる。この例では直線が黒に背景が白として二値化されている。直線が白、背景が黒という設定もされることもある。
以上を踏まえて、エッジ強調部610は、画像メモリ50から読み出された256階調の濃淡画像データに対するエッジ強調処理を施し、その画像を二値化処理部620に出力する。
二値化処理部620は、画像メモリ50から読み出され、エッジ強調処理が施された256階調の濃淡画像データに対する二値化処理を施し、その画像情報をたとえば端点検出部640に供給する。
二値化処理部620は、適当な方法によってしきい値を求め、元の多値の濃淡画像を白黒2値の画像に変換する。
二値化処理部620は、適当な方法によってしきい値を求め、元の多値の濃淡画像を白黒2値の画像に変換する。
射影生成部630は、図6に例示するような、処理対象画像IMGの水平軸(X軸)および垂直軸(Y軸)のそれぞれに対して輝度投影による画素値の第1射影prjXおよび第2射影prjYを生成する。
ここで、第1射影prjXとは、X軸に垂直方向にラインごとの輝度値の平均をとったものである。第2射影prjYとは、Y軸に垂直方向にラインごとの輝度値の平均をとったものである。
図6は、本第1の実施形態に係る射影生成部による射影プロファイルを示す図である。図6(A)が処理対象画像を示し、図6(B)はX軸への第1射影prjXのプロファイルを示し、図6(C)はY軸への第2射影prjYのプロファイルを示している。
なお、射影プロファイルは、射影波形の射影パターンに相当する。
なお、射影プロファイルは、射影波形の射影パターンに相当する。
本例において、第1射影prjXには出力が増加し始める点Xiとして左右に2個の端点X1(=30)、X2(=184)が存在し、第1射影prjXは台形状(台形パターン)に形成されている。
第2射影prjYには出力が増加し始める点Yiとして上下に2個の端点Y1(=20)、Y2(=143)が存在し、第2射影prjYは台形状(台形パターン)に形成されている。
第2射影prjYには出力が増加し始める点Yiとして上下に2個の端点Y1(=20)、Y2(=143)が存在し、第2射影prjYは台形状(台形パターン)に形成されている。
端点検出部640は、X軸(水平軸)への第1射影prjXおよびY軸(垂直軸)への第2射影prjYのそれぞれについて、その射影波形の射影パターン(射影プロファイル)の両端点を決定する。
本例では、端点検出部640は、第1射影prjXについては2個の端点X1(=30)、X2(=184)を決定し、第2射影prjYについては2個の端点Y1(=20)、Y2(=143)を決定する。
本例では、端点検出部640は、第1射影prjXについては2個の端点X1(=30)、X2(=184)を決定し、第2射影prjYについては2個の端点Y1(=20)、Y2(=143)を決定する。
評価値取得部650は、X軸(水平軸)に関する第1射影prjXの射影波形の射影パターンの両端点X1,X2の間隔W(=X2−X1)およびY軸(垂直軸に関する第2射影prjYの射影波形の射影パターンの両端点Y1、Y2の間隔H(=Y2−Y1)を求め、その間隔データW,Hと認識対象媒体100の幅aと高さbに関連付けて所定の評価値を取得する。
図7は、図4の画像にエッジ強調処理、二値化処理を行った後の画像に対して評価値取得に適用される各射影パターンの間隔W,H、認識対象媒体100の幅aと高さbの幾何学的関係を示す図である。
この図7の各射影パターンの間隔W,H、認識対象媒体100の幅aと高さbの幾何学的関係は、たとえば端点検出部640、評価値取得部650等において参照される。
この図7の各射影パターンの間隔W,H、認識対象媒体100の幅aと高さbの幾何学的関係は、たとえば端点検出部640、評価値取得部650等において参照される。
本第1の実施形態に係る評価値取得部650は、認識対象媒体100の幅aとX軸(水平軸)に関する第1射影prjXの射影波形の射影パターンの両端点X1,X2の間隔Wに基づく第1値(a・W)と認識対象媒体100の高さbとY軸(垂直軸)に関する第2射影prjYの射影波形の射影パターンの両端点Y1,Y2の間隔Hに基づく第2値(b・H)との差(a・W−b・H)に応じた評価値を求める。
評価値取得部650は、取得した評価値を回転角度決定部660に供給する。
評価値取得部650は、取得した評価値を回転角度決定部660に供給する。
回転角度決定部660は、評価値取得部650による評価値に基づいて媒体の回転角度ν(θ)を決定する。
本第1の実施形態に係る回転角度決定部660は、評価値取得部650による評価値に基づいて、あらかじめ設定しておいた角度参照テーブルRTBLから評価値に対応する角度を検索し、その結果をもって媒体の回転角度として決定する。
本第1の実施形態に係る回転角度決定部660は、評価値取得部650による評価値に基づいて、あらかじめ設定しておいた角度参照テーブルRTBLから評価値に対応する角度を検索し、その結果をもって媒体の回転角度として決定する。
情報認識部670は、回転角度決定部660で決定された回転角度ν(θ)を参照して媒体100上の情報110の認識処理を行う。
たとえば、情報認識部670は、図4または図5の画像データから認識対象媒体100における情報記録領域120の画像上の傾きを、検出された回転角度ν(θ)に応じて修正(補正)し、修正後の画像における情報記録領域120の情報、たとえば文字認識処理を行う。
たとえば、情報認識部670は、図4または図5の画像データから認識対象媒体100における情報記録領域120の画像上の傾きを、検出された回転角度ν(θ)に応じて修正(補正)し、修正後の画像における情報記録領域120の情報、たとえば文字認識処理を行う。
文字認識処理においては、撮像された画像内の文字列の文字間の区切り位置を検索して文字を認識する。
情報認識部670においては、たとえば、二値化しきい値に基づき文字区切り位置が求められる。文字切り出し処理が終了すると、認識対象となっている文字の外接矩形領域(上下左右の座標値)が求められる。
そして、特徴抽出処理として、上述した外接矩形領域を任意のサブ領域に分割、たとえば1個の外接矩形領域を5×5の領域に分割し、そのうち1個の領域をサブ領域とし、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。
次いで、求められた特徴ベクトルと、あらかじめこの記録媒体で使用される全文字について求めておいた基準特徴ベクトルとが比較されて、類似度(たとえば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定される。
なお、基準特徴ベクトルは、あらかじめ格納されているものであって、特徴比較が行われる際に、格納部から類似度が高い文字のデータが読み出され、特徴比較が行われる。
そして、基本的に、特徴比較によって設定された候補文字が、記録媒体に用いられた文字として認識される。
そして、特徴抽出処理として、上述した外接矩形領域を任意のサブ領域に分割、たとえば1個の外接矩形領域を5×5の領域に分割し、そのうち1個の領域をサブ領域とし、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。
次いで、求められた特徴ベクトルと、あらかじめこの記録媒体で使用される全文字について求めておいた基準特徴ベクトルとが比較されて、類似度(たとえば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定される。
なお、基準特徴ベクトルは、あらかじめ格納されているものであって、特徴比較が行われる際に、格納部から類似度が高い文字のデータが読み出され、特徴比較が行われる。
そして、基本的に、特徴比較によって設定された候補文字が、記録媒体に用いられた文字として認識される。
ここで、本第1の実施形態に係るデータ処理部60の処理を回転角度検出処理の具体例を中心に、図4〜図8に関連付けて説明する。
図8は、本第1の実施形態に係るデータ処理部60の処理を回転角度検出処理の具体例を中心に説明するためのフローチャートである。
図8は、本第1の実施形態に係るデータ処理部60の処理を回転角度検出処理の具体例を中心に説明するためのフローチャートである。
データ処理部60においては、エッジ強調部610で、画像メモリ50から読み出された256階調の濃淡画像データに対してエッジ強調処理が施され(ステップST1)、二値化処理部620で、画像メモリ50から読み出され、エッジ強調処理が施された256階調の濃淡画像データに対して二値化処理され(ステップST2)、その画像情報はたとえば端点検出部640に供給される。
次に、射影生成部630において、図6に例示するような、処理対象画像IMGのX軸(水平軸)およびY軸(垂直軸)のそれぞれに対して輝度投影による画素値の第1射影prjXおよび第2射影prjYが生成される(ステップST3)。
前述したように、第1射影prjXとは、X軸に垂直方向にラインごとの輝度値の平均をとったものである。第2射影prjYとは、Y軸に垂直方向にラインごとの輝度値の平均をとったものである。
前述したように、第1射影prjXとは、X軸に垂直方向にラインごとの輝度値の平均をとったものである。第2射影prjYとは、Y軸に垂直方向にラインごとの輝度値の平均をとったものである。
次に、端点検出部640において、X軸(水平軸)への第1射影prjXおよびY軸(垂直軸)への第2射影prjYのそれぞれについて、その射影波形の射影パターン(射影プロファイル)の両端点が検出される(ステップST4)。
第1射影prjXにおいて、出力値が増加し始める点Xiが求められる。図6(B)に示すように、点Xiは左右に2個存在し、それを左から順にX1,X2とすると、この例ではX1=30,X2=184となる。
同様に、第2prjYにおいて、出力値が増加し始める点Yjが求められる。点Yiは上下に2個存在し、それを上からY1,Y2とすると、この例ではY1=20,Y2=143となる。
本例では、端点検出部640では、第1射影prjXについては2個の端点X1(=30)、X2(=184)が決定され、第2射影prjYについては2個の端点Y1(=20)、Y2(=143)が決定される。
第1射影prjXにおいて、出力値が増加し始める点Xiが求められる。図6(B)に示すように、点Xiは左右に2個存在し、それを左から順にX1,X2とすると、この例ではX1=30,X2=184となる。
同様に、第2prjYにおいて、出力値が増加し始める点Yjが求められる。点Yiは上下に2個存在し、それを上からY1,Y2とすると、この例ではY1=20,Y2=143となる。
本例では、端点検出部640では、第1射影prjXについては2個の端点X1(=30)、X2(=184)が決定され、第2射影prjYについては2個の端点Y1(=20)、Y2(=143)が決定される。
次に、評価値取得部650において、X軸(水平軸)に関する第1射影prjXの射影波形の射影パターンの両端点X1,X2の間隔W(=X2−X1)およびY軸(垂直軸に関する第2射影prjYの射影波形の射影パターンの両端点Y1、Y2の間隔H(=Y2−Y1)が求められ、その間隔データW,Hと認識対象媒体100の幅aと高さbに関連付けて所定の評価値が取得される(ステップST5)。
評価値取得部650では、認識対象媒体100の幅aとX軸(水平軸)に関する第1射影prjXの射影波形の射影パターンの両端点X1,X2の間隔Wに基づく第1値(a・W)と認識対象媒体100の高さbとY軸(垂直軸)に関する第2射影prjYの射影波形の射影パターンの両端点Y1,Y2の間隔Hに基づく第2値(b・H)との差(a・W−b・H)に応じた評価値が求められる。
回転角度決定部660において、評価値取得部650による評価値に基づいて媒体の回転角度ν(θ)が決定される。
本第1の実施形態に係る回転角度決定部660においては、評価値取得部650による評価値に基づいて、あらかじめ設定しておいた参照テーブルRTBLから評価値に対応する角度が検索され(ステップST6)、その結果をもって媒体の回転角度として決定される(ステップST7)。
本第1の実施形態に係る回転角度決定部660においては、評価値取得部650による評価値に基づいて、あらかじめ設定しておいた参照テーブルRTBLから評価値に対応する角度が検索され(ステップST6)、その結果をもって媒体の回転角度として決定される(ステップST7)。
評価値取得部650では、まず図7において、画像内の長方形の長辺長さをa、短辺長さをbとし、
とおくと、幾何学的考察から、次式が得られる。
式3と式4を変形して、次式を得る。
ゆえに次式より角度θが求められる。
また、式3、式4より、次式が導かれる。
よって、角度θは次式によっても求められる。
ここで、a=126、b=80、W=184−30=154、H=143−20=123を式7に代入すると、θ=18.4が得られる。
角度決定は、式7または式6によって算術的に行ってもよいが、本第1の実施形態においては、機器への実装を考慮すると、tan-1の計算はコストを要するため、次に示すような角度決定処理を行うように構成されている。
式5の左辺をν(θ)とおくと、ν(θ)はθの関数であり、たとえば10度刻みで、ν(θ)を計算し、次のような数値リストを作成し、角度参照テーブルRTBLとしてメモリ等に保存しておく。
式5の右辺に実際のW,Hの値を代入して計算した結果、
となったとすると、この値はν(20)に近いので、回転角度はθ=20°であることがわかる。
CPUの性能も飛躍的に向上しているので、直接cos-1から求めてもよいが、上述の方法も実装条件に制約がある場合には有効な代替手段となりうる。
そして、情報認識部670において、回転角度決定部660で決定された回転角度ν(θ)を参照して媒体100上の情報110の認識処理が行われる(ステップST8)。
たとえば、情報認識部670では、図4または図5の画像データから認識対象媒体100における情報記録領域120の画像上の傾きが、検出された回転角度ν(θ)に応じて修正され、修正後の画像における情報記録領域120の情報、たとえば文字認識処理が行われる。
たとえば、情報認識部670では、図4または図5の画像データから認識対象媒体100における情報記録領域120の画像上の傾きが、検出された回転角度ν(θ)に応じて修正され、修正後の画像における情報記録領域120の情報、たとえば文字認識処理が行われる。
このように、本第1の実施形態のデータ処理部60においては、デジタル画像を用いて、矩形媒体の画像上の回転角度を検出するに際し、ハフ変換行列から極大点を解析的に抽出する代わりに、処理対象画像のX軸(水平軸)および垂直軸のそれぞれに対して輝度投影による画素値の射影を生成する射影生成部630、X軸(水平軸)への射影およびY軸(垂直軸)への射影のそれぞれについて、その射影波形の台形パターンの両端点を決定する端点検出部640、X軸(水平軸)に関する射影波形の台形パターンの両端点の間隔Wおよび、Y軸(垂直軸)に関する台形パターンの両端点の間隔Hを求め、そのデータと、対象媒体の幅と高さを用いて所定の評価値を取得する評価値取得部650、およびこの評価値をキーとして、あらかじめ設定しておいた参照テーブルRTBLから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする回転角度決定部660を有することから、ハフ変換を用いることなく、従来よりも低コストで高速な矩形媒体の回転角度を検出できる。
[媒体認識装置10の全体的な動作]
次に、本第1の実施形態に係る媒体認識装置10の全体的な動作について図9に関連付けて説明する。
図9は、本第1の実施形態に係る媒体認識装置10の全体的な動作を説明するためのフローチャートである。
次に、本第1の実施形態に係る媒体認識装置10の全体的な動作について図9に関連付けて説明する。
図9は、本第1の実施形態に係る媒体認識装置10の全体的な動作を説明するためのフローチャートである。
まず、たとえば矩形のカード状媒体100がテーブル20に載置される(ステップST11)。
この状態で、画像読取部30において、照明光源31で照明される矩形状媒体(たとえばカード状媒体)100の全体を含む所定の領域が撮像される(ステップST12)。
そして、A/Dコンバータ40において画像読取部30によって撮像された媒体100を含む画像がデジタル画像データに変換され、画像メモリ50に格納される(ステップST13)。
そして、A/Dコンバータ40において画像読取部30によって撮像された媒体100を含む画像がデジタル画像データに変換され、画像メモリ50に格納される(ステップST13)。
次いで、データ処理部60において、画像メモリ50に格納されたデジタル画像を用いて、カード等の矩形をなす媒体100の画像上の回転角度が検出される(ステップST14)。
この回転角度の検出処理は、主として以下の処理ステップで行われる。
最初に処理対象画像のX軸(水平軸)およびY軸(垂直軸)のそれぞれに対して輝度投影を行って射影を形成する(射影生成ステップ)。
次に,X軸(水平軸)への射影および垂直軸への射影のそれぞれについて、その両端点を決定する(端点検出ステップ)。
さらにX軸(水平軸)に関する両端点の間隔Wおよび、Y軸(垂直軸)に関する両端点の間隔Hを求め、そのデータと、あらかじめわかっている対象媒体の幅と高さを用いて所定の評価値を取得(計算)する(評価値取得ステップ)。
最後に、この評価値をキーとして、あらかじめ用意しておいた参照テーブルRTBLから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする(角度決定ステップ)。
最初に処理対象画像のX軸(水平軸)およびY軸(垂直軸)のそれぞれに対して輝度投影を行って射影を形成する(射影生成ステップ)。
次に,X軸(水平軸)への射影および垂直軸への射影のそれぞれについて、その両端点を決定する(端点検出ステップ)。
さらにX軸(水平軸)に関する両端点の間隔Wおよび、Y軸(垂直軸)に関する両端点の間隔Hを求め、そのデータと、あらかじめわかっている対象媒体の幅と高さを用いて所定の評価値を取得(計算)する(評価値取得ステップ)。
最後に、この評価値をキーとして、あらかじめ用意しておいた参照テーブルRTBLから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする(角度決定ステップ)。
そして、データ処理部60において、検出した回転角度を参照して媒体100上に記録されている文字あるいはバーコード等の情報110が認識される(ステップST15)。
(本第1の実施形態の主な効果)
以上説明したように、本第1の実施形態によれば、デジタル画像を用いて、矩形媒体の画像上の回転角度を検出するに際し、ハフ変換行列から極大点を解析的に抽出する代わりに、処理対象画像のX軸(水平軸)およびY軸(垂直軸)のそれぞれに対して輝度投影による画素値の射影を生成する射影生成部630、X軸(水平軸)への射影およびY軸(垂直軸)への射影のそれぞれについて、その射影波形の台形パターンの両端点を決定する端点検出部640、X軸(水平軸)に関する射影波形の台形パターンの両端点の間隔Wおよび、Y軸(垂直軸)に関する台形パターンの両端点の間隔Hを求め、そのデータと、対象媒体の幅と高さを用いて所定の評価値を取得する評価値取得部650、およびこの評価値をキーとして、あらかじめ設定しておいた参照テーブルRTBLから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする回転角度決定部660を有する。
以上説明したように、本第1の実施形態によれば、デジタル画像を用いて、矩形媒体の画像上の回転角度を検出するに際し、ハフ変換行列から極大点を解析的に抽出する代わりに、処理対象画像のX軸(水平軸)およびY軸(垂直軸)のそれぞれに対して輝度投影による画素値の射影を生成する射影生成部630、X軸(水平軸)への射影およびY軸(垂直軸)への射影のそれぞれについて、その射影波形の台形パターンの両端点を決定する端点検出部640、X軸(水平軸)に関する射影波形の台形パターンの両端点の間隔Wおよび、Y軸(垂直軸)に関する台形パターンの両端点の間隔Hを求め、そのデータと、対象媒体の幅と高さを用いて所定の評価値を取得する評価値取得部650、およびこの評価値をキーとして、あらかじめ設定しておいた参照テーブルRTBLから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする回転角度決定部660を有する。
したがって、本第1の実施形態によれば、以下の効果を得ることができる。
本第1の実施形態の媒体認識装置10によれば、ハフ変換行列から極大点を解析的に抽出する必要もなく、ハフ変換を用いることなく、従来よりも低コストで高速に矩形媒体の回転角度を検出できる。
本第1の実施形態の媒体認識装置10によれば、ハフ変換行列から極大点を解析的に抽出する必要もなく、ハフ変換を用いることなく、従来よりも低コストで高速に矩形媒体の回転角度を検出できる。
また、本第1の実施形態の回転角度決定部660は、評価値取得部650による評価値に基づいて、あらかじめ設定しておいた参照テーブルから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とすることから、演算負荷を軽減でき、安価な処理系を実現することができる。
また、本第1の実施形態の評価値取得部650は、認識対象媒体100の幅aとX軸(水平軸)に関する射影波形の射影パターンの両端点X1,X2の間隔Wに基づく第1値(a・W)と認識対象媒体100の高さbとY軸(垂直軸)に関する射影波形の射影パターンの両端点Y1,Y2の間隔Hに基づく第2値(b・H)との差(a・W−b・H)に応じた評価値を求めることから、高い精度で評価値を取得することができる。
(第2の実施形態)
図10は、本第2の実施形態に係る媒体認識装置におけるデータ処理部の構成例を示すブロック図である。
図10は、本第2の実施形態に係る媒体認識装置におけるデータ処理部の構成例を示すブロック図である。
本第2の実施形態のデータ処理部60Aが上述した第1の実施形態のデータ処理部60と異なる点は以下のとおりである。
第1の実施形態のデータ処理部60では、回転角度決定部660は、評価値取得部650による評価値に基づいて、あらかじめ設定しておいた参照テーブルから評価値に対応する角度を検索し、その結果をもって媒体の回転角度としている。
これに対して、本第2の実施形態のデータ処理部60Aでは、評価値取得部650Aが計算により回転角度ν(θ)を求め、回転角度決定部660Aは、評価値取得部650Aによる評価値としての回転角度を媒体の回転角度として決定する。
第1の実施形態のデータ処理部60では、回転角度決定部660は、評価値取得部650による評価値に基づいて、あらかじめ設定しておいた参照テーブルから評価値に対応する角度を検索し、その結果をもって媒体の回転角度としている。
これに対して、本第2の実施形態のデータ処理部60Aでは、評価値取得部650Aが計算により回転角度ν(θ)を求め、回転角度決定部660Aは、評価値取得部650Aによる評価値としての回転角度を媒体の回転角度として決定する。
第2の実施形態の評価値取得部650Aは、上述した式7に示すように(下記式7)、認識対象媒体100の幅aとX軸(水平軸)に関する射影波形の射影パターンの両端点X1,X2の間隔Wに基づく第1値(a・W)と認識対象媒体100の高さbとY軸(直軸)に関する射影波形の射影パターンの両端点Y1,Y2の間隔Hに基づく第2値(b・H)との差(a・W−b・H)に応じた第1評価値と、認識対象媒体100の高さbとX軸(水平軸)に関する射影波形の射影パターンの両端点X1,X2の間隔Wに基づく第3値(b・W)と認識対象媒体100の幅aとY軸(垂直軸)に関する射影波形の射影パターンの両端点Y1,Y2の間隔Hに基づく第4値(a・H)との差に応じた第2評価値との割合に応じて回転角度を求める。
本第2の実施形態によれば、演算負荷が若干大きくなるものの、実際の回転角度を高い精度で取得することができ、回転角度決定処理の高速化を図ることができる。
(第3の実施形態)
図11は、本第3の実施形態に係る射影生成部による射影プロファイルを示す図である。
図11(A)が処理対象画像を示し、図11(B)はX軸への第1射影prjXのプロファイルを示し、図11(C)はY軸への第2射影prjYのプロファイルを示している。
図11は、本第3の実施形態に係る射影生成部による射影プロファイルを示す図である。
図11(A)が処理対象画像を示し、図11(B)はX軸への第1射影prjXのプロファイルを示し、図11(C)はY軸への第2射影prjYのプロファイルを示している。
本第3の実施形態が上述した第1および第2の実施形態と異なる点は、以下のとおりである。
第1および第2の実施形態における射影生成の対象画像は、媒体が白で背景が黒に設定されている。
これに対して、本第3の実施形態における射影生成の対象画像は、媒体が黒で背景が白に設定されている。
これに対して、本第3の実施形態における射影生成の対象画像は、媒体が黒で背景が白に設定されている。
本第2の実施形態によれば、このような画像であっても、第1の実施形態と同様の射影プロファイルを得ることができ、上述した第1および第2の実施形態と同様の効果を得ることができる。
(応用例)
本実施形態の媒体認識装置10では、ハフ変換を用いることなく、画像の水平軸・垂直軸の射影を用いた直線・図形パターン角度の検出方法は、単独で用いることのほか、ハフ変換を使った直線・図形パターン検出処理において、累積点を探索する処理に先行して、おおよその角度を求めておく、といった使い方も可能である。
本実施形態の媒体認識装置10では、ハフ変換を用いることなく、画像の水平軸・垂直軸の射影を用いた直線・図形パターン角度の検出方法は、単独で用いることのほか、ハフ変換を使った直線・図形パターン検出処理において、累積点を探索する処理に先行して、おおよその角度を求めておく、といった使い方も可能である。
これにより、回転角度の検出精度を高く保持することが可能となる。
なお、以上詳細に説明した方法は、上記手順に応じたプログラムとして形成し、CPU等のコンピュータで実行するように構成することも可能である。
また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
10・・・媒体認識装置、20・・・テーブル、30・・・画像読取部、40・・・アナログデジタルコンバータ(A/Dコンバータ)、50・・・画像メモリ、60,60A・・・データ処理部、610・・・エッジ強調部、620・・・二値化処理部、630・・・射影生成部、640・・・端点検出部、650,650A・・・評価値取得部、660,660A・・・回転角度決定部、670・・・情報認識部、RTBL・・・角度参照テーブル、100・・・媒体、110・・・情報。
Claims (8)
- デジタル画像を用いて、媒体の画像上の回転角度を検出し、検出した回転角度を参照して媒体上の情報を認識する媒体認識装置であって、
処理対象画像の水平軸および垂直軸のそれぞれに対して輝度投影による画素値の射影を生成する射影生成部と、
前記水平軸への射影および前記垂直軸への射影のそれぞれについて、その射影波形の射影パターンの両端点を決定する端点検出部と、
前記水平軸に関する射影波形の射影パターンの両端点の間隔および前記垂直軸に関する射影波形の射影パターンの両端点の間隔を求め、その間隔データと認識対象媒体の幅と高さに関連付けて所定の評価値を取得する評価値取得部と、
前記評価値取得部による評価値に基づいて媒体の回転角度を決定する回転角度決定部と
を有することを特徴とする媒体認識装置。 - 前記回転角度決定部は、
前記評価値取得部による評価値に基づいて、あらかじめ設定しておいた参照テーブルから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする
ことを特徴とする請求項1記載の媒体認識装置。 - 前記評価値取得部は、
前記認識対象媒体の幅と前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第1値と前記認識対象媒体の高さと前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第2値との差に応じた評価値を求める
ことを特徴とする請求項2記載の媒体認識装置。 - 前記評価値取得部は、
前記認識対象媒体の幅と前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第1値と前記認識対象媒体の高さと前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第2値との差に応じた第1評価値と、前記認識対象媒体の高さと前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第3値と前記認識対象媒体の幅と前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第4値との差に応じた第2評価値との割合に応じて回転角度を求め、
前記回転角度決定部は、
前記評価値取得部による評価値としての回転角度を媒体の回転角度として決定する
ことを特徴とする請求項1記載の媒体認識装置。 - デジタル画像を用いて、媒体の画像上の回転角度を検出し、検出した回転角度を参照して媒体上の情報を認識する媒体認識方法であって、
処理対象画像の水平軸および垂直軸のそれぞれに対して輝度投影による画素値の射影を生成する射影生成ステップと、
前記水平軸への射影および前記垂直軸への射影のそれぞれについて、その射影波形の射影パターンの両端点を決定する端点検出ステップと、
前記水平軸に関する射影波形の射影パターンの両端点の間隔および前記垂直軸に関する射影波形の射影パターンの両端点の間隔を求め、その間隔データと認識対象媒体の幅と高さに関連付けて所定の評価値を取得する評価値取得ステップと、
前記評価値取得ステップによる評価値に基づいて媒体の回転角度を決定する回転角度決定ステップと
を有することを特徴とする媒体認識方法。 - 前記回転角度決定ステップは、
前記評価値取得ステップによる評価値に基づいて、あらかじめ設定しておいた参照テーブルから評価値に対応する角度を検索し、その結果をもって媒体の回転角度とする
ことを特徴とする請求項5記載の媒体認識方法。 - 前記評価値取得ステップは、
前記認識対象媒体の幅と前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第1値と前記認識対象媒体の高さと前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第2値との差に応じた評価値を求める
ことを特徴とする請求項6記載の媒体認識方法。 - 前記評価値取得ステップは、
前記認識対象媒体の幅と前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第1値と前記認識対象媒体の高さと前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第2値との差に応じた第1評価値と、前記認識対象媒体の高さと前記水平軸に関する射影波形の射影パターンの両端点の間隔に基づく第3値と前記認識対象媒体の幅と前記垂直軸に関する射影波形の射影パターンの両端点の間隔に基づく第4値との差に応じた第2評価値との割合に応じて回転角度を求め、
前記回転角度決定ステップは、
前記評価値取得ステップによる評価値としての回転角度を媒体の回転角度として決定する
ことを特徴とする請求項5記載の媒体認識方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016192187A JP2018055496A (ja) | 2016-09-29 | 2016-09-29 | 媒体認識装置および媒体認識方法 |
US16/337,401 US20190279392A1 (en) | 2016-09-29 | 2017-09-22 | Medium recognition device and medium recognition method |
PCT/JP2017/034184 WO2018061997A1 (ja) | 2016-09-29 | 2017-09-22 | 媒体認識装置および媒体認識方法 |
EP17855951.4A EP3522115A4 (en) | 2016-09-29 | 2017-09-22 | MEDIA RECOGNITION DEVICE AND MEDIA RECOGNITION METHOD |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016192187A JP2018055496A (ja) | 2016-09-29 | 2016-09-29 | 媒体認識装置および媒体認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018055496A true JP2018055496A (ja) | 2018-04-05 |
Family
ID=61762578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016192187A Withdrawn JP2018055496A (ja) | 2016-09-29 | 2016-09-29 | 媒体認識装置および媒体認識方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20190279392A1 (ja) |
EP (1) | EP3522115A4 (ja) |
JP (1) | JP2018055496A (ja) |
WO (1) | WO2018061997A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019187966A1 (ja) * | 2018-03-29 | 2019-10-03 | 日本電産サンキョー株式会社 | 磁気情報読取装置および磁気情報読取装置の制御方法 |
CN111290582A (zh) * | 2020-02-29 | 2020-06-16 | 华南理工大学 | 一种基于改进型直线检测的投影交互区域定位方法 |
CN112229331A (zh) * | 2020-09-22 | 2021-01-15 | 南京理工大学 | 基于单目视觉的物体旋转角度与平移距离的测量方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2530955B2 (ja) * | 1990-12-27 | 1996-09-04 | インターナショナル・ビジネス・マシーンズ・コーポレイション | リ―ド付き部品の検査装置及び検査方法 |
US5422962A (en) * | 1992-03-19 | 1995-06-06 | Fujitsu Limited | Method and apparatus for extracting line segments from an image of an object |
JP3349292B2 (ja) * | 1994-10-19 | 2002-11-20 | 三洋電機株式会社 | 部品位置認識装置 |
US7650015B2 (en) * | 1997-07-22 | 2010-01-19 | Image Processing Technologies. LLC | Image processing method |
JPH1197512A (ja) | 1997-07-25 | 1999-04-09 | Nikon Corp | 位置決め装置及び位置決め方法並びに位置決め処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6201901B1 (en) * | 1998-06-01 | 2001-03-13 | Matsushita Electronic Industrial Co., Ltd. | Border-less clock free two-dimensional barcode and method for printing and reading the same |
JP2000341501A (ja) * | 1999-03-23 | 2000-12-08 | Minolta Co Ltd | 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体 |
JP2006155126A (ja) * | 2004-11-29 | 2006-06-15 | Mitsubishi Heavy Ind Ltd | 車両番号認識装置 |
JP4600019B2 (ja) * | 2004-12-07 | 2010-12-15 | カシオ計算機株式会社 | 撮影装置、画像処理方法及びプログラム |
US7380718B2 (en) * | 2004-12-21 | 2008-06-03 | Nidec Sankyo Corporation | Method for reading out symbol information and device for reading out symbol information |
JP2007306500A (ja) * | 2006-05-15 | 2007-11-22 | Sanyo Electric Co Ltd | 画像傾き補正装置及び画像傾き補正方法 |
US9547799B2 (en) * | 2008-07-17 | 2017-01-17 | Sharp Laboratories Of America, Inc. | Methods and systems for content-boundary detection |
JP5182879B2 (ja) | 2008-09-26 | 2013-04-17 | Kddi株式会社 | 情報端末装置 |
US8873864B2 (en) * | 2009-12-16 | 2014-10-28 | Sharp Laboratories Of America, Inc. | Methods and systems for automatic content-boundary detection |
TWI439788B (zh) * | 2010-01-04 | 2014-06-01 | Ind Tech Res Inst | 投影校正系統及方法 |
US20120087537A1 (en) * | 2010-10-12 | 2012-04-12 | Lisong Liu | System and methods for reading and managing business card information |
CN102789658B (zh) * | 2012-03-02 | 2015-02-18 | 成都三泰电子实业股份有限公司 | 紫外防伪支票真伪验证方法 |
US9288362B2 (en) * | 2014-02-03 | 2016-03-15 | King Fahd University Of Petroleum And Minerals | Technique for skew detection of printed arabic documents |
CN105303189B (zh) * | 2014-07-29 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种用于检测预定区域中特定标识图像的方法及装置 |
US11158057B2 (en) * | 2016-12-30 | 2021-10-26 | Huawei Technologies Co., Ltd. | Device, method, and graphical user interface for processing document |
-
2016
- 2016-09-29 JP JP2016192187A patent/JP2018055496A/ja not_active Withdrawn
-
2017
- 2017-09-22 EP EP17855951.4A patent/EP3522115A4/en not_active Withdrawn
- 2017-09-22 WO PCT/JP2017/034184 patent/WO2018061997A1/ja unknown
- 2017-09-22 US US16/337,401 patent/US20190279392A1/en not_active Abandoned
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019187966A1 (ja) * | 2018-03-29 | 2019-10-03 | 日本電産サンキョー株式会社 | 磁気情報読取装置および磁気情報読取装置の制御方法 |
CN111290582A (zh) * | 2020-02-29 | 2020-06-16 | 华南理工大学 | 一种基于改进型直线检测的投影交互区域定位方法 |
CN112229331A (zh) * | 2020-09-22 | 2021-01-15 | 南京理工大学 | 基于单目视觉的物体旋转角度与平移距离的测量方法 |
CN112229331B (zh) * | 2020-09-22 | 2022-01-07 | 南京理工大学 | 基于单目视觉的物体旋转角度与平移距离的测量方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3522115A4 (en) | 2020-05-27 |
US20190279392A1 (en) | 2019-09-12 |
WO2018061997A1 (ja) | 2018-04-05 |
EP3522115A1 (en) | 2019-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8306327B2 (en) | Adaptive partial character recognition | |
JP4284288B2 (ja) | パターン認識装置及びその方法 | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
JP6099686B2 (ja) | 画像処理装置、領域検出方法及びコンピュータプログラム | |
JP4658848B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6487255B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
JP6039413B2 (ja) | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム | |
US9858477B2 (en) | Character segmenting apparatus, character recognition apparatus, and character segmenting method | |
WO2018061997A1 (ja) | 媒体認識装置および媒体認識方法 | |
WO2019187967A1 (ja) | 画像処理装置および画像処理方法 | |
Nandini et al. | Estimation of skew angle in binary document images using hough transform | |
JP5160366B2 (ja) | 電子部品のパターンマッチング方法 | |
Chethan et al. | Graphics separation and skew correction for mobile captured documents and comparative analysis with existing methods | |
WO2019107141A1 (ja) | 画像処理装置および画像処理方法 | |
CN114332108B (zh) | 一种图片中的虚实线局部区域的提取方法 | |
Kim et al. | Document capturing method with a camera using robust feature points detection | |
Guru et al. | Skew Estimation in Digitised Documents: A Novel Approach. | |
Kao et al. | Skew detection of document images using line structural information | |
JP2023094844A (ja) | 画像処理装置、方法及びプログラム | |
Chethan et al. | Obliterable of graphics and correction of skew using Hough transform for mobile captured documents | |
CN117252767A (zh) | 文本图片矫正方法及装置 | |
WO2016151706A1 (ja) | 画像処理装置、領域決定方法及びコンピュータプログラム | |
Guo et al. | Fast algorithm for document skew detection method using run-length smoothing, Hough transform, mathematical morphology and wavelet |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20171121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190902 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20200217 |