JP2004126774A - パターン認識装置 - Google Patents

パターン認識装置 Download PDF

Info

Publication number
JP2004126774A
JP2004126774A JP2002287365A JP2002287365A JP2004126774A JP 2004126774 A JP2004126774 A JP 2004126774A JP 2002287365 A JP2002287365 A JP 2002287365A JP 2002287365 A JP2002287365 A JP 2002287365A JP 2004126774 A JP2004126774 A JP 2004126774A
Authority
JP
Japan
Prior art keywords
vector
pattern
learning
slice
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002287365A
Other languages
English (en)
Inventor
Naoki Natori
名取 直毅
Bunpei Irie
入江 文平
Hideo Horiuchi
堀内 秀雄
Akihiko Nakao
中尾 昭彦
Takuma Akagi
赤木 琢磨
Yasuhiro Aoki
青木 泰浩
Tomoyuki Hamamura
浜村 倫行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002287365A priority Critical patent/JP2004126774A/ja
Publication of JP2004126774A publication Critical patent/JP2004126774A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】この発明は、認識対象の特徴と、背景の特徴とを別々に扱うことができ、高精度なパターン認識を行うことができる。
【解決手段】この発明は、学習パターンと複数のスライス辞書パターンφij(ベクトル)とのユークリッド距離を求め、カテゴリごとの学習パターンxl(ベクトル)と重み係数ベクトルとユークリッド距離との演算結果を求め、この演算結果の最大値に対応するカテゴリを、上記学習パターンxl(ベクトル)の認識結果とするものである。
【選択図】  図6

Description

【0001】
【発明の属する技術分野】
この発明は、等濃度特徴とパラメータ学習によるパターン認識装置に関する。
【0002】
【従来の技術】
今、学習パターンの例として、画素数Mの2次元濃淡画像を考える。各画素には、その画素の濃淡を表す値がセットされている。すると、学習パターンは、 Rのxl(ベクトル)とみなすことができる。すなわち、
xl(ベクトル)={x1、x2、…、xM}∈R
である。図1は、学習パターンxl(ベクトル)の例を示したものである。ここでは、濃淡レベルを0〜5の6段階とする。同様に、辞書パターンを、Rのξi(ベクトル)として表す。
【0003】
ξi(ベクトル)={ξi1、ξi2、…、ξiM}∈R
ただし、iは辞書パターン数を表し、1≦i≦Nであるものとする。図2から図4は、N=3としたときのN個の辞書パターンξi(ベクトル)の例を示したものである。ここでも、濃淡レベルを0〜5の6段階とする。
【0004】
従来の典型的なパターン認識アルゴリズムは、以下の通りである。すなわち、
1.あらかじめ、辞書パターンξi(ベクトル)を登録しておく。
2.ある学習パターンxl(ベクトル)を入力する。
3.学習パターンxl(ベクトル)と辞書パターンξi(ベクトル)とのユークリッド距離Diを求める。
4.ユークリッド距離Diの最小値D*を求める。
5.ユークリッド距離Diの最小値D*を与えた辞書パターンの属するカテゴリを、学習パターンxl(ベクトル)の認識結果とする。
【0005】
ここで、ユークリッド距離Diは、以下の式により求められる。
【数1】
Figure 2004126774
ただし、1≦i≦Nである。
【0006】
図5は、従来の技術を説明するための図である。一般に、矩形領域として切り出され与えられる学習パターンxl(ベクトル)は、認識対象とそれ以外〔背景〕とが混在したものである。登録されている辞書パターンξi(ベクトル)についても同様のことが言える。今、ここでは、濃淡レベル3以上の領域が認識対象、濃淡レベル2以下の領域が背景であるものとする。すると、従来の技術によれば、認識対象、背景に関わらず、領域全体が平均的に扱われていることが分かる。
【0007】
これも図5により説明する。まず、辞書パターンξi2(ベクトル)の属するカテゴリを学習パターンxl(ベクトル)の正解カテゴリとし、それ以外の辞書パターンξi(ベクトル)(i≠2)の属するカテゴリを別カテゴリ(不正解カテゴリ)として考える。辞書パターンξi1(ベクトル)は、図5を見ても明らかなように学習パターンxl(ベクトル)とは別の特徴を持つパターンの例であり、
D1≫D2
であると言える。これについては、従来の技術でも問題ない。しかし、辞書パターンξi2(ベクトル)と類似したパターンとして辞書パターンξi3(ベクトル)があると考える。確かに、認識対象のみに着目すると、学習パターンxl(ベクトル)に近いのは、辞書パターンξi3(ベクトル)よりも辞書パターンξi2(ベクトル)であるが、従来の技術では、領域全体で平均化されるため、場合によっては、
D2≒D3
さらには、
D2>D3
ということも起こり得る。すなわち、認識対象が、ある特定の濃淡分布を持っていると先見的に分かっている場合、または、そのような傾向が実験的に得られる場合においても、従来の技術では全ての濃淡値を均一に扱うため、パターン認識装置としての能力に限界があった。
【0008】
【発明が解決しようとする課題】
この発明は、認識対象の特徴と、背景の特徴とを別々に扱うことができ、高精度なパターン認識を行うことができるパターン認識装置を提供することを目的としている。
【0009】
【課題を解決するための手段】
この発明のパターン認識装置は、学習パターンを複数のカテゴリに分類するものにおいて、カテゴリ代表パターンを濃淡値レベルにしたがって分解し、分解された前記カテゴリ代表パターンにそれぞれ重み係数を与え、重み係数を与えられた前記カテゴリ代表パターンと前記学習パターンとの初期分類誤差を算出し、算出された初期分類誤差を減らす方向へ重み係数またはカテゴリ代表パターンの認識パラメータを逐次学習修正して決定し、逐次学習修正して決定された前記カテゴリ代表パターンと前記学習パターンとの非線形な類似度と重み係数とを乗じたものの和の値によって、学習パターンの属するカテゴリを判断する手段を有するものである。
【0010】
この発明のパターン認識装置は、複数画素の2次元濃淡画像により構成される学習パターンxl(ベクトル)を複数のカテゴリのいずれかに分類するものにおいて、カテゴリごとにあらかじめH個のスライスレベルθj(1≦j≦H)を定義し、N*H個のスライス辞書パターンを登録し、上記学習パターンxl(ベクトル)を入力し、この入力された学習パターンxl(ベクトル)と上記スライス辞書パターンφij(ベクトル)とのユークリッド距離dijを求め、カテゴリごとの学習パターンxl(ベクトル)と重み係数ベクトルとユークリッド距離との演算結果を求め、この演算結果の最大値に対応するカテゴリを、上記学習パターンxl(ベクトル)の認識結果とするものである。
【0011】
この発明のパターン認識装置は、複数画素の2次元濃淡画像により構成される学習パターンxl(ベクトル)を複数のカテゴリのいずれかに分類するものにおいて、カテゴリごとにあらかじめH個のスライスレベルθj(1≦j≦H)を定義し、N*H個のスライス辞書パターンを登録し、あらかじめ重み係数ベクトルをランダムな値で初期化し、あらかじめサンプル数L個の学習パターンxl(ベクトル)とその教師信号yl(ベクトル)の組を定義し、上記学習パターンxl(ベクトル)を入力し、この入力された学習パターンxl(ベクトル)と上記教師信号yl(ベクトル)とにより学習誤差を求め、この学習誤差を減らす方向へ重み係数の値を修正するための誤差修正項を求め、上記重み係数ベクトルを修正する学習フェーズと、上記学習パターンxl(ベクトル)を入力し、この入力された学習パターンxl(ベクトル)とスライス辞書パターンφij(ベクトル)とのユークリッド距離dijを求め、カテゴリごとの学習パターンxl(ベクトル)と重み係数ベクトルとユークリッド距離との演算結果を求め、この演算結果の最大値に対応するカテゴリを、上記学習パターンxl(ベクトル)の認識結果とする認識フェーズとからなるものである。
【0012】
この発明のパターン認識装置は、複数画素の2次元濃淡画像により構成される学習パターンxl(ベクトル)を複数のカテゴリのいずれかに分類するものにおいて、カテゴリごとにあらかじめH個のスライスレベルθj(1≦j≦H)を定義し、あらかじめ重み係数ベクトルをランダムな値で初期化し、あらかじめサンプル数L個の学習パターンxl(ベクトル)とその教師信号yl(ベクトル)の組を定義し、あらかじめN*H個のスライス辞書パターンを初期化し、上記学習パターンxl(ベクトル)を入力し、この入力された学習パターンxl(ベクトル)と上記教師信号yl(ベクトル)とにより学習誤差を求め、この学習誤差を減らす方向へ重み係数の値を修正するための第1の誤差修正項を求め、上記重み係数ベクトルを修正し、上記学習誤差を減らす方向へするための第2の誤差修正項を求め、上記スライス辞書パターンを修正する学習フェーズと、上記学習パターンxl(ベクトル)を入力し、この入力された学習パターンxl(ベクトル)とスライス辞書パターンφij(ベクトル)とのユークリッド距離dijを求め、カテゴリごとの学習パターンxl(ベクトル)と重み係数ベクトルとユークリッド距離との演算結果を求め、この演算結果の最大値に対応するカテゴリを、上記学習パターンxl(ベクトル)の認識結果とする認識フェーズとからなるものである。
【0013】
【発明の実施の形態】
以下、図面を参照してこの発明の実施形態のパターン認識装置を説明する。
(第1の実施形態)
この発明のパターン認識装置におけるパターン認識アルゴリズムについて、図6に示すフローチャートを参照しつつ説明する。すなわち、
1.あらかじめ、H個のスライスレベルθj(1≦j≦H)を定義し(ST1)、N*H個のスライス辞書パターンφij(ベクトル)(1≦i≦N、1≦j≦H)を登録しておく(ST2〜4)。
2.ある学習パターンxl(ベクトル)を入力する(ST5)。
3.学習パターンxl(ベクトル)とスライス辞書パターンφij(ベクトル)との距離dijを求める(ST6)。なお、距離dijの定義は、距離の性質(非負、可換、三角不等式)を満たしていれば、任意でよい。
4.カテゴリ数をCとし、C個の関数f(c)=f(xl(ベクトル),w(c)(ベクトル))の値を求める(ST7)。ここで、w(c)(ベクトル)は重み係数ベクトル、1≦c≦Cである。
5.関数f(c)の最大値fを求める(ST8)。
6.関数の最大値fの属するカテゴリを、学習パターンxl(ベクトル)の認識結果とする(ST9)。
【0014】
次の学習パターンがある場合には(ST10)、ステップ5に戻り、次の学習パターンがない場合には(ST10)、処理を終了する。
スライスレベルθj(1≦j≦H)およびスライス辞書パターンφij(ベクトル)(1≦i≦N、1≦j≦H)について説明する。
【0015】
スライスレベルθjの値は、
0≦θ1≦θ2≦…≦θH∈R
のような関係にある濃淡値定数である。スライス辞書パターンφij(ベクトル)は、辞書パターンξi(ベクトル)を元に、以下のようにして作られる。すなわち、
【数2】
Figure 2004126774
【0016】
ただし、1≦i≦N、1≦j≦H、1≦k≦Mである。なお、上式の計算上、
θ0=0
と定義する。
図7は、スライス辞書パターンを説明するための図である。今、ここでは、説明を分かりやすくするためH=6とし、
θj=j
と定める。ただし、1≦j≦Hである。すなわち、スライスレベルの数が濃淡レベルの数と等しくなるようにした。すると、N*H=18個のスライス辞書パターンφij(ベクトル)が得られる。
【0017】
次に、距離dijについて説明する。前述したように、距離dijとしては任意の距離尺度を採用することができるが、ここでは、最も典型的なユークリッド距離を応用することにする。すなわち、
【数3】
Figure 2004126774
【0018】
である。距離dijは、ある特定の濃淡レンジでマスク処理を施したときのパターン間の距離であるとも言える。
次に、関数f(c)と重み係数ベクトルw(c)(ベクトル)について説明する。ここでは、以下のように定めた。
【数4】
Figure 2004126774
【0019】
という性質を持つ非線形関数である。距離dijがゼロ、すなわちパターンが全く同一のときに最大値1をとる。そして、パターン間の違いが大きいほど小さくなっていき、無限遠でゼロとなる、類似度であるとも言える。重み係数ベクトルw(c)(ベクトル)は、これらN*H個の距離dijを加算する際の重み付けを行うためのものである。w(c)ij(ベクトル)の平均値をw(c)(ベクトル)とすると、
【数5】
Figure 2004126774
【0020】
のように値をセットする。こうして、関数f(c)の最大値fを求め、その属するカテゴリを学習パターンxl(ベクトル)の認識結果とすれば、認識対象の濃淡分布に対して適応的なパターン認識能力が得られる。図8は、上記した本発明を説明するための図である。すなわち、学習パターンと18個のスライス辞書パターンφij(ベクトル)とのユークリッド距離を求め、カテゴリごとの学習パターンxl(ベクトル)と重み係数ベクトルとユークリッド距離との演算結果を求め、この演算結果の最大値に対応するカテゴリを、上記学習パターンxl(ベクトル)の認識結果とするものである。
【0021】
本実施例の適用分野としては、あらかじめ認識対象の性質がよく分かっている場合、すなわち、紙幣や券などの鑑査や郵便物の切手の識別など、主に印刷パターンの認識が挙げられる。
【0022】
(第2の実施形態)
第1の実施形態では、認識対象の濃淡分布が先験的に分かっている場合である。しかし、あらかじめ認識対象の濃淡分布が分かっていない場合、あるいは分かっていてもよりロバストなパターン認識能力を要求する場合、ある程度の量の学習パターンサンプルがあれば、この第2の実施形態で示す重み係数の学習アルゴリズムにより、高精度な重み係数を自動的に決定できる。
【0023】
この重み係数の学習アルゴリズムについて、図9に示すフローチャートを参照しつつ説明する。すなわち、
1.〔学習フェーズ〕
あらかじめ、H個のスライスレベルθj(1≦j≦H)を定義し(ST11)、N*H個のスライス辞書パターンφij(ベクトル)(1≦i≦N、1≦j≦H)を定義する(ST12)。
2.あらかじめ、重み係数ベクトルw(c)(ベクトル)を適当にランダムな値で初期化しておく(ST13)。ただし、1≦c≦Cである。
【0024】
3.あらかじめ、サンプル数L個の学習パターンxl(ベクトル)とその教師信号yl(ベクトル)の組を定義しておく(ST14)。ただし、yl(ベクトル)∈Rである。
N*H個のスライス辞書パターンφij(ベクトル)(1≦i≦N、1≦j≦H)を作成する(ST15)。
4.ある学習パターンxl(ベクトル)を入力する(ST16)。
【0025】
5.学習誤差εl=ε(xl(ベクトル),yl(ベクトル))を求める(ST17)。
6.誤差修正項Δwl(c)(ベクトル)を求め、重み係数ベクトルw(c)(ベクトル)を逐次修正する(ST17)。ただし、1≦c≦Cである。
7.全てのサンプルxl(ベクトル)(1≦l≦L)について、上記4〜6を繰り返す(ST18、19)。
【0026】
8.〔認識フェーズ〕
ある学習パターンxl(ベクトル)を入力する(ST5)。
9.学習パターンxl(ベクトル)とスライス辞書パターンφij(ベクトル)との距離dijを求める(ST6)。なお、dijの定義は、距離の性質(非負、可換、三角不等式)を満たしていれば、任意でよい。
10.カテゴリ数をCとし、C個の関数f(c)=f(xl(ベクトル),w(c)(ベクトル))値を求める(ST7)。ここで、w(c)(ベクトル)は重み係数ベクトル、1≦c≦Cである。
【0027】
11.関数f(c)の最大値fを求める(ST8)。
12.関数の最大値fの属するカテゴリを、学習パターンxl(ベクトル)の認識結果とする(ST9)。
次の学習パターンがある場合には(ST10)、ステップ5に戻り、次の学習パターンがない場合には(ST10)、処理を終了する。
【0028】
まず、教師信号yl(ベクトル)について説明する。教師信号yl(c)は、関数f(c)の理想とすべき値である。今、ここでは、学習パターンxl(ベクトル)の正解カテゴリに対応する関数f(c)の値を1とし、それ以外を−1とする。例えば、カテゴリ数C=3、学習パターンxl(ベクトル)の正解カテゴリ番号を2とすると、教師信号yl(ベクトル)は、
yl(ベクトル)={y(1),y(2),y(3)}={−1,1,−1}となる。
【0029】
次に、学習誤差εlと誤差修正項Δwl(c)(ベクトル)について説明する。学習誤差は、理想とする教師信号と実際の関数の値とがどれだけ違っているかを表すものである。また、誤差修正項は、学習誤差を減らす方向へ重み係数の値を修正するためのものである。ここでは、学習パターンxl(ベクトル)と教師信号yl(ベクトル)に対する学習誤差εlを以下のように定義する。
【数6】
Figure 2004126774
【0030】
すると、誤差修正項Δwl(c)(ベクトル)は以下のようになる。
【数7】
Figure 2004126774
【0031】
ただし、1≦i≦N、1≦j≦H、1≦c≦Cである。このようにして求められた誤差修正項Δwl(c)(ベクトル)に適当な係数を掛けて重み係数ベクトルw(c)(ベクトル)に加算することで、学習誤差を減らす方向へ重み係数ベクトルw(c)(ベクトル)が逐次修正されていく。
【0032】
認識フェーズについては、実施例1と同様である。本実施例の適用分野としては、理想的な特徴が分かっているとしてもカメラからノイズ変形を合音画像が連続的に入力されるような場合に、それに対するロバストな認識システムの構築が挙げられる。
【0033】
(第3の実施形態)
第1の実施形態は、重み係数を学習によって求めるものである。この第3の実施形態では、重み係数に加え、スライス辞書パターンも学習により自動的に決定するアルゴリズムを示す。
【0034】
この重み係数に加え、スライス辞書パターンも学習により自動的に決定するアルゴリズムについて、図10に示すフローチャートを参照しつつ説明する。すなわち、
1.〔学習フェーズ〕
あらかじめ、H個のスライスレベルθj(1≦j≦H)を定義しておく(ST21)。
【0035】
N*H個のスライス辞書パターンφij(ベクトル)(1≦i≦N、1≦j≦H)を定義する(ST22)。
2.あらかじめ、重み係数ベクトルw(c)(ベクトル)を適当にランダムな値で初期化しておく(ST23)。ただし、1≦c≦Cである。
【0036】
3.あらかじめ、サンプル数L個の学習パターンxl(ベクトル)とその教師信号yl(ベクトル)の組を定義しておく(ST24)。ただし、yl(ベクトル)∈R、1≦l≦Lである。
【0037】
4.あらかじめ、N*H個のスライス辞書パターンφij(ベクトル)(1≦i≦N、1≦j≦H)を初期化しておく(ST25)。初期値は、例えば、学習パターンサンプルの中のどれか1個を適当に選んで採用するか、いくつかの学習パターンサンプルの平均値などで決める。
【0038】
5.ある学習パターンxl(ベクトル)を入力する(ST26)。
6.学習誤差εl=ε(xl(ベクトル),yl(ベクトル))を求める。
7.誤差修正項Δwl(c)(ベクトル)を求め、重み係数ベクトルw(c)(ベクトル)を逐次修正する。ただし、1≦c≦Cである。
8.誤差修正項Δφl(ベクトル)を求め、スライス辞書パターンφij(ベクトル)を逐次修正する(ST27)。ただし、1≦i≦N、1≦j≦Hである。
9.全てのサンプルxl(ベクトル)(1≦l≦L)について、上記5〜8を繰返す(ST28、29)。
【0039】
10.〔認識フェーズ〕
ある学習パターンxl(ベクトル)を入力する(ST5)。
11.学習パターンxl(ベクトル)とスライス辞書φij(ベクトル)との距離dijを求める(ST6)。なお、距離dijの定義は、距離の性質(非負、可換、三角不等式)を満たしていれば、任意でよい。
【0040】
12.カテゴリ数をCとし、C個の関数f(c)f(xl(ベクトル),w(c)(ベクトル))の値を求める(ST7)。ここで、w(c)(ベクトル)は重み係数ベクトル、1≦c≦Cである。
13.関数f(c)の最大値fを求める(ST8)。
14.関数の最大値fの属するカテゴリを、学習パターンxl(ベクトル)の認識結果とする(ST9)。
次の学習パターンがある場合には(ST10)、ステップ5に戻り、次の学習パターンがない場合には(ST10)、処理を終了する。
【0041】
誤差修正項Δφl(ベクトル)について説明する。ここでは、以下のように定めた。
【数8】
Figure 2004126774
【0042】
ただし、1≦i≦N、1≦j≦Hである。このようにして求められた誤差修正項Δφlに適当な係数を掛けてスライス辞書パターンφij(ベクトル)に加算することで、学習誤差を減らす方向ヘスライス辞書パターンφij(ベクトル)が逐次修正されていく。
【0043】
認識フェーズについては、実施例1と同様である。本実施例の適用分野としては、理想的な認識対象の特徴というものが経時変化等により徐々に変化してしまうような場合に、それに対するロバストな認識システムの構築が挙げられる。
【0044】
(第4の実施形態)
スライスレベルθj(1≦j≦H)の決め方について説明する。
上記第1の実施形態で採用したような単純で線形的な決め方ではなく、パターンの濃淡頻度を用いて決める。
このスライスレベルθj(1≦j≦H)の決定方法について、図11に示すフローチャートを参照しつつ説明する。すなわち、
1.パターンのヒストグラムを求める(ST31)。
【0045】
2.とりうる濃淡レベル全体のレンジが分かっているものとして〔あるいは分かっていなければ適当に決めて〕、ヒストグラム上で、最も低い濃淡レベルから100/H*j%の頻度のところの濃淡レベルをスライスレベルθjとする(ST32)。なお、下限値アンダーや上限値オーバーの処理は適当に行う。これにより、濃淡頻度に対して適応的なスライスレベルが得られる。
【0046】
(第5の実施形態)
スライス辞書パターンφij(ベクトル)の決め方について説明する。
微小な濃淡変動を想定する場合、スライス辞書パターンφij(ベクトル)を以下のように決めると効果的である。このスライス辞書パターンφij(ベクトル)決定方法について、図12に示すフローチャートを参照しつつ説明する。すなわち、
1.スライスレベルθjにマージンをつけて定義する(ST41)。
【0047】
2.マージンを加味してスライスレベルθjのスライス辞書パターンφij(ベクトル)を求める(ST42)。
【数9】
Figure 2004126774
【0048】
ただし、α、βは適当な正定数であり、スライスレベルθjの絶対値に対しては十分小さいものであるとする。このように、微小な濃淡変動を加味してスライス辞書パターンを作成することにより、よりロバストなパターン認識が期待できる。
【0049】
(第6の実施形態)
距離dijの決め方について説明する。
上記の実施例ではユークリッド距離を応用したが、カテゴリ間の特徴について比較的包含関係が少ないような場面では、全く別の求め方もある。パターンの各画素について濃淡差を求め、その差の全画素についての分散値を距離尺度とする。
【0050】
この距離dijの決め方について、図13に示すフローチャートを参照しつつ説明する。すなわち、
スライス辞書パターンφij(ベクトル)を定義する(ST51)。
ある学習パターンxl(ベクトル)を入力する(ST52)。
【0051】
1.ある位置の画素値(濃淡値)の差〔xlk−φijk〕を求める(ST53)。あるいは、その1点だけからではなく近傍画素を用いても良い。
2.対象となる全画素について1を繰り返す(ST54)。
3.得られた差のデータの分散値を求める(ST55)。
この求め方によるメリットは、照明条件や気象条件などの外的要因によって濃淡変動が発生した場合でも、ロバストなパターン認識能力が保てることである。
【0052】
(実施形態の効果)
従来、認識対象の特徴が、背景の特徴と同等に扱われていたため、パターン認識装置としての能力に限界があった。
そこで、第1の実施形態によれば、まず、スライスという概念を導入し濃淡レベルごとに辞書パターンを分解した。次に、重み係数を導入し、それをスライス分解された辞書パターンごとに付し、認識対象の特徴がより引き出せるようにした。これにより、従来よりも高精度なパターン認識装置が実現できる。
【0053】
また、第2の実施形態によれば、上記の重み係数を学習によって求めるため、あらかじめ認識対象の濃淡分布が分かっていない場合でも、重み係数の獲得が可能となる。
さらに、第3の実施形態によれば、上記の重み係数に加え、スライス分解された辞書パターンも学習によって獲得可能とし、認識対象が経時によって変化してしまうような場合でも、ロバストな認識性能を保てることが可能となる。
第4の実施形態によれば、スライスレベルをパターンの濃淡頻度をもとに求めるため、認識対象の濃淡頻度に応じて適したスライスレベルが得られる。
【0054】
第5の実施形態によれば、スライス辞書パターンを求める際に、学習パターンの微小な濃淡変動があることを想定して求めるため、よりロバストなパターン認識が期待できる。
第6の実施形態によれば、パターン間の各画素の濃淡差を求め、その差の分散値から距離を定義するため、照明条件や気象条件などの外的要因によって濃淡変動が発生した場合でも、ロバストなパターン認識能力が保てる。
【0055】
【発明の効果】
以上詳述したように、この発明によれば、認識対象の特徴と、背景の特徴とを別々に扱うことができ、高精度なパターン認識を行うことができるパターン認識装置を提供できる。
【図面の簡単な説明】
【図1】学習パターンxl(ベクトル)の例を示す図。
【図2】辞書パターンξi(ベクトル)の例を示す図。
【図3】辞書パターンξi(ベクトル)の例を示す図。
【図4】辞書パターンξi(ベクトル)の例を示す図。
【図5】従来の技術を説明するための図。
【図6】この発明のパターン認識装置におけるパターン認識アルゴリズムを説明するためのフローチャート。
【図7】スライス辞書パターンを説明するための図。
【図8】パターン認識アルゴリズムを説明するための図。
【図9】重み係数の学習アルゴリズムを説明するためのフローチャート。
【図10】重み係数に加え、スライス辞書パターンも学習により自動的に決定するアルゴリズムを説明するためのフローチャート。
【図11】スライスレベルθj(1≦j≦H)の決定方法を説明するためのフローチャート。
【図12】スライス辞書パターンφij(ベクトル)の決定方法を説明するためのフローチャート。
【図13】距離dijの決定方法を説明するためのフローチャート。
【符号の説明】
θj…スライスレベル、φij(ベクトル)…スライス辞書パターン、f(c)…関数、f…関数の最大値。

Claims (11)

  1. 学習パターンを複数のカテゴリに分類するパターン認識装置において、
    カテゴリ代表パターンを濃淡値レベルにしたがって分解し、
    分解された前記カテゴリ代表パターンにそれぞれ重み係数を与え、
    重み係数を与えられた前記カテゴリ代表パターンと前記学習パターンとの初期分類誤差を算出し、
    算出された初期分類誤差を減らす方向へ重み係数またはカテゴリ代表パターンの認識パラメータを逐次学習修正して決定し、
    逐次学習修正して決定された前記カテゴリ代表パターンと前記学習パターンとの非線形な類似度と重み係数とを乗じたものの和の値によって、学習パターンの属するカテゴリを判断する手段を有することを特徴とするパターン認識装置。
  2. 前記学習パターンの濃淡頻度を算出し、この濃淡頻度に基づく頻度分布情報にしたがって、前記学習パターンを不等な刻み幅をもって量子化することを特徴とする請求項1に記載のパターン認識装置。
  3. パターン認識の前処理において、スライス閾値にマージン幅を持たせ、ローレベル側とハイレベル側との間にオーバラップする範囲を持たせることを特徴とする請求項1に記載のパターン認識装置。
  4. パターン間の距離を算出する際に、パターン間の対応各画素について濃淡差を算出し、その濃淡差の分散値を入力として距離を算出することを特徴とする請求項1に記載のパターン認識装置。
  5. 複数画素の2次元濃淡画像により構成される学習パターンxl(ベクトル)を複数のカテゴリのいずれかに分類するパターン認識装置において、
    カテゴリごとにあらかじめH個のスライスレベルθj(1≦j≦H)を定義し、N*H個のスライス辞書パターンを登録し、
    前記学習パターンxl(ベクトル)を入力し、
    この入力された学習パターンxl(ベクトル)と前記スライス辞書パターンφij(ベクトル)とのユークリッド距離dijを求め、
    カテゴリごとの学習パターンxl(ベクトル)と重み係数ベクトルとユークリッド距離との演算結果を求め、
    この演算結果の最大値に対応するカテゴリを、前記学習パターンxl(ベクトル)の認識結果とする手段を有することを特徴とするパターン認識装置。
  6. 複数画素の2次元濃淡画像により構成される学習パターンxl(ベクトル)を複数のカテゴリのいずれかに分類するパターン認識装置において、
    カテゴリごとにあらかじめH個のスライスレベルθj(1≦j≦H)を定義し、N*H個のスライス辞書パターンを登録し、
    あらかじめ重み係数ベクトルをランダムな値で初期化し、
    あらかじめサンプル数L個の学習パターンxl(ベクトル)とその教師信号yl(ベクトル)の組を定義し、
    前記学習パターンxl(ベクトル)を入力し、
    この入力された学習パターンxl(ベクトル)と前記教師信号yl(ベクトル)とにより学習誤差を求め、
    この学習誤差を減らす方向へ重み係数の値を修正するための誤差修正項を求め、前記重み係数ベクトルを修正する学習フェーズと、
    前記学習パターンxl(ベクトル)を入力し、
    この入力された学習パターンxl(ベクトル)とスライス辞書パターンφij(ベクトル)とのユークリッド距離dijを求め、
    カテゴリごとの学習パターンxl(ベクトル)と重み係数ベクトルとユークリッド距離とユークリッド距離との演算結果を求め、
    この演算結果の最大値に対応するカテゴリを、前記学習パターンxl(ベクトル)の認識結果とする認識フェーズとを有することを特徴とするパターン認識装置。
  7. 前記教師信号は、前記演算結果の理想とすべき値であることを特徴とする請求項6に記載のパターン認識装置。
  8. 前記学習誤差は、理想とする教師信号と、前記演算結果の値とが、どれだけ違っているかを表すものであることを特徴とする請求項6に記載のパターン認識装置。
  9. 複数画素の2次元濃淡画像により構成される学習パターンxl(ベクトル)を複数のカテゴリのいずれかに分類するパターン認識装置において、
    カテゴリごとにあらかじめH個のスライスレベルθj(1≦j≦H)を定義し、 あらかじめ重み係数ベクトルをランダムな値で初期化し、
    あらかじめサンプル数L個の学習パターンxl(ベクトル)とその教師信号yl(ベクトル)の組を定義し、
    あらかじめN*H個のスライス辞書パターンを初期化し、
    前記学習パターンxl(ベクトル)を入力し、
    この入力された学習パターンxl(ベクトル)と前記教師信号yl(ベクトル)とにより学習誤差を求め、
    この学習誤差を減らす方向へ重み係数の値を修正するための第1の誤差修正項を求め、前記重み係数ベクトルを修正し、
    前記学習誤差を減らす方向へするための第2の誤差修正項を求め、前記スライス辞書パターンを修正する学習フェーズと、
    前記学習パターンxl(ベクトル)を入力し、
    この入力された学習パターンxl(ベクトル)とスライス辞書パターンφij(ベクトル)とのユークリッド距離dijを求め、
    カテゴリごとの学習パターンxl(ベクトル)と重み係数ベクトルとユークリッド距離との演算結果を求め、
    この演算結果の最大値に対応するカテゴリを、前記学習パターンxl(ベクトル)の認識結果とする認識フェーズとを有することを特徴とするパターン認識装置。
  10. 前記教師信号は、前記演算結果の理想とすべき値であることを特徴とする請求項9に記載のパターン認識装置。
  11. 前記スライス辞書パターンの初期化は、学習パターンサンプルの中のどれか1個を適当に選ぶか、またはいくつかの学習パターンサンプルの平均値で決めることを特徴とする請求項9に記載のパターン認識装置。
JP2002287365A 2002-09-30 2002-09-30 パターン認識装置 Pending JP2004126774A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002287365A JP2004126774A (ja) 2002-09-30 2002-09-30 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002287365A JP2004126774A (ja) 2002-09-30 2002-09-30 パターン認識装置

Publications (1)

Publication Number Publication Date
JP2004126774A true JP2004126774A (ja) 2004-04-22

Family

ID=32280192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002287365A Pending JP2004126774A (ja) 2002-09-30 2002-09-30 パターン認識装置

Country Status (1)

Country Link
JP (1) JP2004126774A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102474A (ja) * 2006-09-22 2008-05-01 Ricoh Co Ltd 画像形成装置
JP2010231256A (ja) * 2009-03-25 2010-10-14 Hitachi Ltd データ認識装置、データ認識方法及びプログラム
JP4886844B2 (ja) * 2006-03-29 2012-02-29 コグネックス・コーポレイション マシンビジョンツールパラメータの自動決定
CN109522778A (zh) * 2017-09-20 2019-03-26 顾泽苍 一种可达到图像理解水平的图像识别方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4886844B2 (ja) * 2006-03-29 2012-02-29 コグネックス・コーポレイション マシンビジョンツールパラメータの自動決定
JP2008102474A (ja) * 2006-09-22 2008-05-01 Ricoh Co Ltd 画像形成装置
US7962054B2 (en) 2006-09-22 2011-06-14 Ricoh Company, Limited Image forming apparatus having a function of predicting device deterioration based on a plurality of types of operation control information
US8175470B2 (en) 2006-09-22 2012-05-08 Ricoh Company, Limited Image forming apparatus having a function of predicting device deterioration based on a plurality of types of operation control information
JP2010231256A (ja) * 2009-03-25 2010-10-14 Hitachi Ltd データ認識装置、データ認識方法及びプログラム
CN109522778A (zh) * 2017-09-20 2019-03-26 顾泽苍 一种可达到图像理解水平的图像识别方法

Similar Documents

Publication Publication Date Title
He et al. Learning and incorporating top-down cues in image segmentation
US6442555B1 (en) Automatic categorization of documents using document signatures
CN108647583B (zh) 一种基于多目标学习的人脸识别算法训练方法
Garg et al. Binarization techniques used for grey scale images
US7983486B2 (en) Method and apparatus for automatic image categorization using image texture
CN110647795A (zh) 一种表格识别方法
CN110826458A (zh) 一种基于深度学习的多光谱遥感图像变化检测方法及***
CN111553837A (zh) 一种基于神经风格迁移的艺术文本图像生成方法
CN111652213A (zh) 一种基于深度学习的船舶水尺读数识别方法
Akhtar et al. Optical character recognition (OCR) using partial least square (PLS) based feature reduction: an application to artificial intelligence for biometric identification
CN112307919A (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
CN112561881A (zh) 基于评价模型的红外图像自适应数据增强方法
CN116258874A (zh) 基于深度条件扩散网络的sar识别数据库样本姿态扩充方法
CN113392854A (zh) 一种图像纹理特征提取分类方法
CN115565009A (zh) 基于深度去噪稀疏自编码器及issvm的电子元件分类方法
CN114373079A (zh) 一种快速准确的探地雷达目标检测方法
US7181062B2 (en) Modular classification architecture for a pattern recognition application
CN105160666B (zh) 基于非平稳分析与条件随机场的sar图像变化检测方法
Xu et al. Automatic segmentation of cervical vertebrae in X-ray images
JP2004126774A (ja) パターン認識装置
Mai et al. Vietnam license plate recognition system based on edge detection and neural networks
US6694059B1 (en) Robustness enhancement and evaluation of image information extraction
EP0632404B1 (en) Pattern recognition by generating and using zonal features and anti-features
CN114067165A (zh) 一种含噪声标记分布的图像筛选和学习方法与装置
Sang et al. Segmentation of FLIR images by Hopfield neural network with edge constraint

Legal Events

Date Code Title Description
A621 Written request for application examination

Effective date: 20050922

Free format text: JAPANESE INTERMEDIATE CODE: A621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080924

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090203