JP4834693B2 - パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 - Google Patents
パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 Download PDFInfo
- Publication number
- JP4834693B2 JP4834693B2 JP2008137303A JP2008137303A JP4834693B2 JP 4834693 B2 JP4834693 B2 JP 4834693B2 JP 2008137303 A JP2008137303 A JP 2008137303A JP 2008137303 A JP2008137303 A JP 2008137303A JP 4834693 B2 JP4834693 B2 JP 4834693B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- filter
- mask
- feature
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
Feature Extraction Based on Minimum Classification Error / Generalized Probabilistic Descent Method",A。 Biem et。al。,Proc。 IEEE Int。 Conf。 Acoust。,Speech,Signal Processing,Vol。2,pp275-278,(1993) "Filter Bank Design Based on Discriminative Feature Extraction",A。 Biem et。al。,Proc。 IEEE Int。 Conf。 Acoust。,Speech,Signal Processing,Vol。1,pp485-488,(1994) "Minimum Classification Error Training Algorithm for Feature Extractor and Pattern Classifier in Speech Recognition",K。K。 paliwal et。al,EUROSPEECH’95,vol。1,pp541-544,(1995) 「最小分類誤り学習による特徴選択型文字認識」河村他、電子情報通信学会論文誌D-II,Vol。J81-D-II,No。12,pp。2749-2756,(1998)
(第1実施形態)
図1は本発明の第1実施形態に係るパターン認識装置の構成を示すブロック図である。図1に示すように、第1実施形態のパターン認識装置は、辞書学習部23、フィルタ・マスク学習部24、部分領域特徴量計算部26、パターン識別部28および特徴ベクトル生成部29を有している。
辞書ベクトル記憶部21には、パターン画像から求められた特徴ベクトルとマッチング処理(比較)して類似度または相違度を計算するための基準となる辞書ベクトルが記憶されている。
パターン画像の画素の値を、
z(i,j),(i=0,…,N−1;j=0,…,M−1)
とする。i,jは、それぞれ縦位置、横位置である。一方、パターン画像上に複数のサンプル点を設定し、その位置を、
ra,sb(a=0,…,n−1;b=0,…,m−1)
とする。この位置におけるフィルタ・マスクを、
Ftab(k,h),(h=−L,…,L;k=−L,…,L)
とする。このフィルタ・マスクはT個有り、上記の式で、t=0,1,…T−1で表す。
特徴抽出は、まずフィルタ・マスク毎の内積の計算を行なうことによって始まる。マスクサイズを(2L+1)×(2L+1)とし、内積の値をΧtabとするとき、これを
Xab=fab(X0ab,X1ab,…,XT−1ab) (2)
χab=ρ(Xab)
とする。ここで出力ベクトルの要素値χabは、各位置ra,sbについて求めるため、この出力ベクトルの次元はn×mとなる。
Δφ=±2αw(d)(χ−φ)
ここで、w(d)は窓関数である。w(d)は、d=0付近で大きな値,その他は0に近い値に設定するのが普通である。例えば区間[−A,+A]で1、それ以外で0の関数やシグモイドの微分、すなわち、1/(1+e−Aχ)の微分などが窓関数として使える。
Δφ=±Σ2αw(d)(χ−φ)
では記述していないが、実際にはこの形式で更新を行なう。もちろん、積算せずに1パターン毎に更新する手段を取ることもできる。以下の説明でもこれは同様である。
フィルタ・マスクの要素値Ftab(k,h)を更新する量を次のようにして決める。
ある入力zが与えられたとき、あるカテゴリの辞書ベクトルφで相違度を計算したとする。このとき、Ftab(k,h)の添え字のa,bに対応する出力ベクトルの要素値χabの変化に対する相違度Dの変化を表す値をPとして求める。これはDの変動をχabの変動で割った値に基づく数値である。Dをχabで偏微分したものはその1例である。Pを出力変化量と呼ぶ。
この例において、出力変化量Pは、辞書ベクトルと特徴ベクトルとによって計算される。また入力変化量Rは入力パターン、すなわち学習パターンである。
以下、図5を参照して第2実施形態のパターン認識装置について説明する。なお第1実施形態と同じ構成には同一の符号を付しその説明は省略する。
この第2実施形態では、パターン識別部28は、辞書ベクトル記憶部30と複数の内積計算部46〜49とを有している。
辞書ベクトル記憶部30には、1つの相違度または類似度を求める上で必要な複数の辞書ベクトル42〜45が記憶されている。
内積計算部46は、辞書ベクトル記憶部30に記憶された辞書ベクトル42を読み出し、特徴ベクトル生成部29により生成された特徴ベクトルを用いて内積計算を行なう。
内積計算部47は、辞書ベクトル記憶部30に記憶された辞書ベクトル43を読み出し、特徴ベクトル生成部29により生成された特徴ベクトルを用いて内積計算を行なう。
内積計算部48は、辞書ベクトル記憶部30に記憶された辞書ベクトル44を読み出し、特徴ベクトル生成部29により生成された特徴ベクトルを用いて内積計算を行なう。
内積計算部49は、辞書ベクトル記憶部30に記憶された辞書ベクトル45を読み出し、特徴ベクトル生成部29により生成された特徴ベクトルを用いて内積計算を行なう。
パターン識別部28は、類似度または相違度の計算結果によってパターンの識別を行なう。
とする。図6のフィルタ・マスクの組12〜15では、フィルタ・マスクを複数として図示したが、この第2実施形態では、これを1個とする。また、部分領域特徴量計算部26は、単なる内積演算を行うものとする。内積の値をΧabとし、これを
χab=ρ(Xab)
とする。
ΔφP=±2αw(d)μP(χ,φP)χ
である。これは学習部分空間法として知られる方式である。従ってこの第2実施形態はこの学習部分空間法に次のフィルタ・マスク学習を導入した方式と考えることもできる。
(第3実施形態)
この第3実施形態は、第2実施形態と同様の構成で、文字認識に異なる式を使う例である。
(第4実施形態)
すなわち、M次元ベクトルである(q=を、…、M−1)。
Δφ=±2αw(d)(y−φ)
そして、Hqabの変化に対するyqの変化を表す値をVとして求める。これはyqの変動をHqabの変動で割った値に基づく数値である。yqをHqabで偏微分したものはその1例である。Vを特徴変換入力変化量と呼ぶ。
この第5実施形態は、フィルタ・マスクエリア変更部50を有している。上記フィルタ・マスク学習部24が、部分領域毎の画素に対応したフィルタ・マスクの値について、学習パターンの認識結果に基づいて、辞書ベクトルと、学習パターンと、それに対応する特徴ベクトルに基づいて決まるフィルタ・マスク更新量によってフィルタ・マスク記憶部25の該当フィルタ・マスクを更新したときに、フィルタ・マスク更新部50は、フィルタ・マスクの更新結果に基づいてフィルタ・マスク内の不要なエリアを決定し、その不要部分を取り除く処理、および/または隣接するエリアを付加する処理の少なくとも一方を含む処理によってマスクの位置とサイズの少なくとも一方を変更する処理を含むフィルタ・マスクの更新処理を繰り返し行なう。
第1実施形態から第5実施形態は、認識部を1段構成の単純な形態で構成した。そこで、この第6実施形態は、認識部を2段構成とした。
上記実施例ではフィルタ・マスクや辞書ベクトルなどを作成する機能をパターン認識装置の中に設置せず、予め記憶しておくという前提で説明してきたが、このような作成機能をパターン認識装置に組み込むこともできる。
Claims (6)
- 入力されたパターン画像を分割してできる複数の部分領域内の画素値または画素に対応した値と、画素に対応したフィルタ・マスクの値とを積和して前記各部分領域に対応した特徴値を前記各フィルタ・マスク毎に複数個計算する部分領域特徴量計算部と、
1個の部分領域に複数のフィルタ・マスクが記憶されたフィルタ・マスク記憶部と、
前記部分領域特徴量計算部により1個の部分領域に複数設定されたフィルタ・マスク毎に求められた特徴値複数個を非線形関数に代入することによって1個の新たな特徴値を求め、各部分領域毎に求められたこの新たな特徴値複数個から前記パターン画像の特徴ベクトルを生成する特徴ベクトル生成部と、
パターン識別の基準となる辞書ベクトルが記憶された辞書ベクトル記憶部と、
前記特徴ベクトル生成部により生成された特徴ベクトルと前記辞書ベクトル記憶部に記憶された辞書ベクトルとの類似度または相違度を計算することでパターンの識別を行なうパターン識別部と、
前記部分領域毎の画素に対応したフィルタ・マスクの値について、前記パターン画像の識別結果に基づいて前記辞書ベクトルと、前記パターン画像に対応する前記特徴ベクトルと、前記非線形関数に基づく非線形関数の変化量とからフィルタ・マスク更新量を求め、求めたフィルタ・マスク更新量によって前記フィルタ・マスク記憶部の該当フィルタ・マスクを繰り返し更新するフィルタ・マスク学習部と、
前記辞書ベクトルと前記パターン画像に対応する前記特徴ベクトルとから辞書ベクトル更新量を求め、求めた辞書ベクトル更新量によって前記辞書ベクトル記憶部の該当辞書ベクトルを繰り返し更新する辞書ベクトル学習部と
を具備することを特徴とするパターン認識パラメータ学習装置。 - 入力されたパターン画像を分割してできる複数の部分領域内の画素値または画素に対応した値と、画素に対応したフィルタ・マスクの値とを積和して前記各部分領域に対応した特徴値を前記各フィルタ・マスク毎に複数個計算する部分領域特徴量計算部と、
フィルタ・マスクが記憶されたフィルタ・マスク記憶部と、
前記部分領域特徴量計算部によりフィルタ・マスク毎に求められた特徴値複数個から前記パターン画像の特徴ベクトルを生成する特徴ベクトル生成部と、
パターン識別の基準となる辞書ベクトルとして、1つの類似度または相違度を求めるために、N次元の特徴ベクトルに対して、N次元の辞書ベクトルが2個以上のr個記憶され、P番目の辞書ベクトルと特徴ベクトルから求まる前記P毎の値r個に基づいて類似度または相違度を計算するように構成された辞書ベクトル記憶部と、
前記特徴ベクトル生成部により生成された特徴ベクトルと前記辞書ベクトル記憶部に記憶された辞書ベクトルとの類似度または相違度を計算することでパターンの識別を行なうパターン識別部と、
前記部分領域毎の画素に対応したフィルタ・マスクの値について、前記パターン画像の識別結果に基づいて前記P番目の辞書ベクトルと特徴ベクトルから求まる前記P毎の値r個と、r個の辞書ベクトルと、前記パターン画像に対応する前記特徴ベクトルからフィルタ・マスク更新量を求め、求めたフィルタ・マスク更新量によって前記フィルタ・マスク記憶部の該当フィルタ・マスクを繰り返し更新するフィルタ・マスク学習部と、
前記辞書ベクトルと前記パターン画像に対応する前記特徴ベクトルとから辞書ベクトル更新量を求め、求めた辞書ベクトル更新量によって前記辞書ベクトル記憶部の該当辞書ベクトルを繰り返し更新する辞書ベクトル学習部と
を具備することを特徴とするパターン認識パラメータ学習装置。 - 入力されたパターン画像を分割してできる複数の部分領域内の画素値または画素に対応した値と、画素に対応したフィルタ・マスクの値とを積和して前記各部分領域に対応した特徴値を前記各フィルタ・マスク毎に複数個計算する部分領域特徴量計算部と、
フィルタ・マスクが記憶されたフィルタ・マスク記憶部と、
前記部分領域特徴量計算部によりフィルタ・マスク毎に求められた特徴値複数個から前記パターン画像の特徴ベクトルを生成する特徴ベクトル生成部と、
前記特徴ベクトル生成部により生成された前記パターン画像の特徴ベクトルを、予め設定された特徴変換行列により変換済特徴ベクトルに変換する特徴ベクトル変換部と、
パターン識別の基準となる辞書ベクトルが記憶された辞書ベクトル記憶部と、
前記特徴ベクトル変換部により生成された変換済特徴ベクトルと前記辞書ベクトル記憶部に記憶された辞書ベクトルとの類似度または相違度を計算することでパターンの識別を行なうパターン識別部と、
前記特徴ベクトル変換部により変換された変換済特徴ベクトルと前記特徴ベクトルと前記辞書ベクトルから特徴変換行列更新量を求め、求めた特徴変換行列更新量よって特徴変換行列を繰り返し更新する特徴変換行列学習部と、
前記特徴ベクトル変換部により変換された変換済特徴ベクトルと前記特徴ベクトルと前記特徴変換行列と前記辞書ベクトルとから該フィルタ・マスク更新量を求め、求めたフィルタ・マスク更新量よって前記フィルタ・マスク記憶部の該当フィルタ・マスクを繰り返し更新するフィルタ・マスク学習部と、
前記辞書ベクトルと前記パターン画像に対応する前記変換済特徴ベクトルとから該辞書ベクトル更新量を求め、求めた辞書ベクトル更新量によって前記辞書ベクトル記憶部の該当辞書ベクトルを繰り返し更新する辞書ベクトル学習部と
を具備することを特徴とするパターン認識パラメータ学習装置。 - 入力されたパターン画像を分割してできる複数の部分領域内の画素値または画素に対応した値と、画素に対応したフィルタ・マスクの値とを積和して前記各部分領域に対応した特徴値を前記各フィルタ・マスク毎に複数個計算する部分領域特徴量計算部と、
フィルタ・マスクが記憶されたフィルタ・マスク記憶部と、
前記部分領域特徴量計算部によりフィルタ・マスク毎に求められた特徴値複数個から前記パターン画像の特徴ベクトルを生成する特徴ベクトル生成部と、
パターン識別の基準となる辞書ベクトルが記憶された辞書ベクトル記憶部と、
前記特徴ベクトル生成部により生成された特徴ベクトルと前記辞書ベクトル記憶部に記憶された辞書ベクトルとの類似度または相違度を計算することでパターンの識別を行なうパターン識別部と、
前記部分領域毎の画素に対応したフィルタ・マスクの値について、前記パターン画像の識別結果と、前記辞書ベクトルと、前記パターン画像に対応する前記特徴ベクトルとを用いてフィルタ・マスク更新量を求め、求めたフィルタ・マスク更新量によって前記フィルタ・マスク記憶部の該当フィルタ・マスクを繰り返し更新するフィルタ・マスク学習部と、
前記辞書ベクトルと前記パターン画像に対応する前記特徴ベクトルとから辞書ベクトル更新量を求め、求めた辞書ベクトル更新量によって前記辞書ベクトル記憶部の該当辞書ベクトルを繰り返し更新する辞書ベクトル学習部と、
前記フィルタ・マスク学習部により求められた前記フィルタ・マスク更新量に基づいて不要と判断される画素を判定し、この判定の結果に基づいてフィルタ・マスクのエリア内の不要な部分を決定し、その部分を取り除く処理および隣接するエリアを付加する処理のうちの少なくとも一つの処理を行うことによって、マスクの位置とサイズのうちの少なくとも一方を変更するフィルタ・マスク更新処理を繰り返し行なうフィルタ・マスク変更部と
を具備することを特徴とするパターン認識パラメータ学習装置。 - 前記請求項1乃至4いずれか1記載のパターン認識パラメータ学習装置によって生成されたフィルタ・マスクと辞書ベクトルとを、特徴抽出およびパターン照合に用いることを特徴とするパターン認識装置。
- 入力されたパターン画像を分割してできる複数の部分領域内の画素値または画素に対応した値と、画素に対応したフィルタ・マスクの値を積和して前記各部分領域に対応した特徴値を前記各フィルタ・マスク毎に複数個計算するステップと、
計算された前記特徴値複数個を非線形関数に代入することによって1個の新たな特徴値を求め、各部分領域毎に求められたこの新たな特徴値複数個から前記パターン画像の特徴ベクトルを生成するステップと、
生成された前記特徴ベクトルと、パターン識別の基準となる辞書ベクトルが記憶された辞書ベクトル記憶部の辞書ベクトルとの類似度または相違度を計算することでパターンの識別を行なうステップと、
前記部分領域毎の画素に対応したフィルタ・マスクの値について、前記パターン画像の識別結果に基づいて前記辞書ベクトルと、前記パターン画像に対応する前記特徴ベクトルと、前記非線形関数に基づく非線形関数の変化量とからフィルタ・マスク更新量を求め、求めたフィルタ・マスク更新量によってフィルタ・マスクが記憶されたフィルタ・マスク記憶部の該当フィルタ・マスクを繰り返し更新するステップと、
前記辞書ベクトルと前記パターン画像に対応する前記特徴ベクトルとから辞書ベクトル更新量を求め、求めた辞書ベクトル更新量によって前記辞書ベクトル記憶部の該当辞書ベクトルを繰り返し更新するステップと
を具備することを特徴とするパターン認識パラメータ学習方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008137303A JP4834693B2 (ja) | 2008-05-26 | 2008-05-26 | パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008137303A JP4834693B2 (ja) | 2008-05-26 | 2008-05-26 | パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009282940A JP2009282940A (ja) | 2009-12-03 |
JP4834693B2 true JP4834693B2 (ja) | 2011-12-14 |
Family
ID=41453291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008137303A Active JP4834693B2 (ja) | 2008-05-26 | 2008-05-26 | パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4834693B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6235368B2 (ja) * | 2014-02-17 | 2017-11-22 | 株式会社東芝 | パターン認識装置、パターン認識方法およびプログラム |
WO2023157093A1 (ja) * | 2022-02-15 | 2023-08-24 | 三菱電機株式会社 | 画像フィルタ生成システム、画像フィルタ生成装置、学習装置、学習方法及びプログラム |
JP7166505B1 (ja) * | 2022-02-15 | 2022-11-07 | 三菱電機株式会社 | 画像フィルタ生成システム、画像フィルタ生成装置、推論装置、推論方法及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4701518B2 (ja) * | 2001-03-02 | 2011-06-15 | 日本電気株式会社 | パターン認識装置、パターン認識方法及びプログラム |
JP2007179413A (ja) * | 2005-12-28 | 2007-07-12 | Toshiba Corp | パターン認識装置、パターン認識方法、および特徴抽出パラメータの生成方法 |
-
2008
- 2008-05-26 JP JP2008137303A patent/JP4834693B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009282940A (ja) | 2009-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959246B (zh) | 基于改进的注意力机制的答案选择方法、装置和电子设备 | |
Qiao et al. | Mango: A mask attention guided one-stage scene text spotter | |
CN112232149B (zh) | 一种文档多模信息和关系提取方法及*** | |
Gallego et al. | Staff-line removal with selectional auto-encoders | |
JP2005182730A (ja) | ドキュメントの自動分離 | |
CN110287952B (zh) | 一种维语图片字符的识别方法及*** | |
WO2019167784A1 (ja) | 位置特定装置、位置特定方法及びコンピュータプログラム | |
Asha et al. | Kannada handwritten document recognition using convolutional neural network | |
KR20120066397A (ko) | 텍스트 영역의 추출 방법, 추출 장치 및 이를 이용한 번호판 자동 인식 시스템 | |
CN111488732A (zh) | 一种变形关键词检测方法、***及相关设备 | |
CN111680684B (zh) | 一种基于深度学习的书脊文本识别方法、设备及存储介质 | |
CN111694954B (zh) | 图像分类方法、装置和电子设备 | |
JP4834693B2 (ja) | パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 | |
JP6174466B2 (ja) | 帳票認識装置、帳票認識方法、及びプログラム | |
CN114492581A (zh) | 基于迁移学习和注意力机制元学习应用在小样本图片分类的方法 | |
CN112084944B (zh) | 一种动态演化表情的识别方法与*** | |
CN112365451B (zh) | 图像质量等级的确定方法、装置、设备及计算机可读介质 | |
CN114373092A (zh) | 一种基于拼图排列学习的渐进式训练细粒度视觉分类方法 | |
JP2007179413A (ja) | パターン認識装置、パターン認識方法、および特徴抽出パラメータの生成方法 | |
CN117115824A (zh) | 一种基于笔划区域分割策略的视觉文本检测方法 | |
JP5445062B2 (ja) | 情報処理装置及び情報処理プログラム | |
Neme et al. | Authorship attribution as a case of anomaly detection: A neural network model | |
CN113642480A (zh) | 一种字符识别方法、装置、设备及存储介质 | |
CN112613341A (zh) | 训练方法及装置、指纹识别方法及装置、电子设备 | |
JP4852086B2 (ja) | パターン認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110405 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110606 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110830 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110926 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4834693 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140930 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |