JPH0573687A - 自動分類方法 - Google Patents

自動分類方法

Info

Publication number
JPH0573687A
JPH0573687A JP3259784A JP25978491A JPH0573687A JP H0573687 A JPH0573687 A JP H0573687A JP 3259784 A JP3259784 A JP 3259784A JP 25978491 A JP25978491 A JP 25978491A JP H0573687 A JPH0573687 A JP H0573687A
Authority
JP
Japan
Prior art keywords
data
sample data
subclass
category
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3259784A
Other languages
English (en)
Other versions
JP3118725B2 (ja
Inventor
Yutaka Sako
裕 酒匂
Masahiro Abe
正博 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP03259784A priority Critical patent/JP3118725B2/ja
Priority to GB9218944A priority patent/GB2259599A/en
Priority to US07/943,688 priority patent/US5329596A/en
Publication of JPH0573687A publication Critical patent/JPH0573687A/ja
Application granted granted Critical
Publication of JP3118725B2 publication Critical patent/JP3118725B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】 【目的】 処理時間が短く、非線形分離問題への適用が
可能であり、しかも、類似度の計算ができる自動分類方
法を提供することにある。 【構成】 次のステップを有する。(1)複数の既知の
カテゴリのサンプルデータを複数のクラスに分割する、
(2)分割されたサンプルデータが同一のカテゴリでな
い場合、サブクラス内のサンプルデータが同一のカテゴ
リになるまで、再分割を繰り返す、(3)得られたクラ
ス、サブクラスの関係を木構造により表現し、各クラ
ス、各サブクラス毎にそこに含まれるサンプルデータか
ら標準データを求める、(4)未知カテゴリの入力デー
タに対し、木構造のクラスの内、どのクラスに一番近い
かを各クラスの標準データとの距離により判定し、次
に、そのクラスに葉(サブクラス)がある場合には、ど
のサブクラスに一番近いかを、最端の葉(サブクラス)
に到達するまで、同様の判定を行い、最端の葉のカテゴ
リを入力データのカテゴリとする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、多くのサンプルデータ
から母集団を推定し、入力データのカテゴリを決める方
法に係り、特に、画像データまたは画像から得られた特
徴量等を用いて画像の種類を同定・分類する方法に関す
るものである。
【0002】
【従来の技術】パターン認識において、カテゴリの既知
の大量サンプルデータによる学習を行い、パターン空間
上に占める各カテゴリの領域を求めた後、カテゴリが未
知の入力データのカテゴリを決定する方法の代表例とし
て、次の2つの方法(人工知能学会編:人工知能ハンド
ブック(オーム社)/パターンマッチング(p.32
4)、D.E.ラメルハート他:PDPモデル(産業図
書))がある。 (1)パターンマッチング:各カテゴリに対する標準デ
ータを用意しておき、入力データと最も近い標準データ
のカテゴリを入力データのカテゴリとする。標準データ
を用意せずに、カテゴリの既知のサンプルデータそのも
のを用い、入力データと最も近いサンプルデータのカテ
ゴリを入力データのカテゴリとすることもある(最短距
離法)。 (2)層状ニューラルネット:ニューロンと呼ばれる非
線形入出力素子を層状にならべ、各サンプルデータとそ
のカテゴリ間の変換ルールをニューロン間の重み係数と
して学習する。学習法は、最急降下法を基本としたバッ
クプロパゲーション法がよく使用される。未知の入力デ
ータをニューラルネットに与えた時の出力データがカテ
ゴリとなる。
【0003】
【発明が解決しようとする課題】データの分類や同定を
行なう時、留意すべき点は判定の精度と判定に必要な処
理時間である。特に、判定精度に関しては、期待するカ
テゴリ以外のパターンが入力された場合、そのパターン
の類似度を調べてリジェクトする機能が実用面で必要不
可欠となる。従来方法のこれらの点に関する課題とし
て、 (1)パターンマッチングでは、標準パターンとの距離
を計算することにより、類似度が得られるが、最も近い
標準データを求めるためにすべての標準データとの照合
が必要となるため、処理時間が一般に莫大となってしま
う。さらに、この方法は、パターン空間上の距離により
判定しているため、サンプルデータが入れ子状態で分布
している問題、すなわち、非線形分離問題には適用でき
ない場合が多い。 (2)層状ニューラルネットでは、非線形問題を含むカ
テゴライズのための分離面が求まる。たとえば、図11
に示したようなデータ群Aとデータ群Bの分離を目的と
する2次元問題の場合、学習により分離線L0が得られ
る。そして、図内に示したニューラルネットの各出力等
高線(点線)は分離線L0に対して線対称となる。従っ
て、未知の入力データ、例えば、図内の点aと点bの層
状ニューラルネットの出力値は同じであり、分離線L0
に対して同じ側にあるデータ群Aのカテゴリに分類され
る。一方、入力データのサンプルデータに対する類似度
は、通常、サンプルデータの分布中心cからの距離と定
義できるため、点bのデータは点aのデータより類似度
はかなり低いはずである。それにもかかわらず、図内の
点aと点bの層状ニューラルネットの出力値は同じとな
り、この場合、類似度が計算できたとはいえない。この
ように、層状ニューラルネットは紋切り型の分類に適用
できても、類似度の判定による分類には適用しずらいこ
とが分かる。本発明の目的は、従来方式が持っている上
述した課題を解決し、処理時間が短く、非線形分離問題
への適用が可能であり、しかも、類似度の計算ができる
自動分類方法を提供することにある。
【0004】
【課題を解決するための手段】上記の課題を解決するた
めに、本発明は、次のステップを有する。(1)複数の
既知のカテゴリのサンプルデータを複数のクラスに分割
するステップ、(2)分割されたサンプルデータが同一
のカテゴリでない場合、そのデータを再度複数のサブク
ラスに分割し、サブクラス内のサンプルデータが同一の
カテゴリになるまで、再分割を繰り返すステップ、
(3)得られたクラス、サブクラスの関係を木構造によ
り表現し、各クラス、各サブクラス毎にそこに含まれる
サンプルデータから標準データを求めるステップ、
(4)未知カテゴリの入力データに対し、木構造のクラ
スの内、どのクラスに一番近いかを各クラスの標準デー
タとの距離により判定し、次に、そのクラスに葉(サブ
クラス)がある場合には、再度、どのサブクラスに一番
近いかを各サブクラスの標準データとの距離により判定
していき、最端の葉(サブクラス)に到達するまで、こ
の判定を行い、最端の葉(サブクラス)のカテゴリを入
力データのカテゴリとするステップ。
【0005】
【作用】上記(1)(2)により、たとえ、サンプルデ
ータが入れ子状態であっても、いわゆる、非線形分離問
題を、データを分割することにより、複数の部分的線形
問題に帰着できるので、非線形分離問題への適用が可能
となり、しかも、高速に類似度の計算ができる。(3)
により、データ分類のための木構造と標準データが得ら
れ、(4)により、得られた木構造にしたがった判定を
行うので、予期しない未知データについてすべての標準
データとの照合が必要でなくなり、処理の高速化が図ら
れ、また、標準データとの距離計算により入力データの
類似度を求めることができる。
【0006】
【実施例】以下、本発明の実施例を図1、図2、図3、
図4、図5、図6、図7、図8を用いて詳細に説明す
る。まず、図5、図6、図7を用いて、本発明のサンプ
ルデータを用いた学習、すなわち、データ分類のための
木構造と標準データの作成のための原理の概要を説明す
る。図5は、測定した2つの物理量の軸からなる2次元
空間上のサンプルデータの分布を示したものである。こ
れらのサンプルデータは、2つの既知のカテゴリ(白丸
と黒丸)に属しており、非線形分離問題である。これら
のサンプルデータを、図6に示すように、複数のクラス
C1、C2、C3、C4、C5に分類する。これらのク
ラスの内、例えば、クラスC1内のサンプルデータが同
一カテゴリでない場合、そのデータを再度複数のサブク
ラスC11、C12、C13、C14、C15に分割す
る。他のクラスC2、C3、C4、C5についても同様
である。この場合、たとえぱ、サブクラスC32が同一
カテゴリでないとき、サンプルデータが同一カテゴリに
なるまで、サブクラスC321、C322のように再分
割を繰り返す。同様に、サブクラスC411、C41
2、あるいは、C511、C512、C513、C51
4はそれぞれCC41、C51の再分割を示す。なお、
C1、C2、C3…、C12、C22、…、C514の
記号は、便宜上に使用するクラス、サブクラスの名称で
ある。つぎに、各クラス及びサブクラス毎にそこに含ま
れるサンプルデータから標準データを求める。この標準
データは、クラス又はサブクラス内のサンプルデータの
分布中心(大きい黒丸で示す)とする。一方、クラスC
1〜C5、サブクラスC11〜C55の関係を、図7に
示すように、木構造により表現する。ここで、カテゴリ
1は白丸、カテゴリ2は黒丸を指し、図5と対応する。
なお、図6は、単純化するため、全て黒丸を用いて図示
した。
【0007】つぎに、図1は、サンプルデータを用いた
学習、すなわち、データ分類のための木構造と標準デー
タの作成のためのフローチャートである。ステップ1
は、初めに全サンプルデータを対称に複数のクラスに分
類し、クラス内のサンプルデータのカテゴリの同一性を
判定する。ステップ2は、クラス内のサンプルデータが
同一でない場合は、同一カテゴリになるまでクラスを分
割し、サブクラス内のサンプルデータが同一カテゴリに
なるまでこの再分割を繰返して、サブクラスを発生し、
そのサブクラスに含まれるサンプルデータから標準デー
タを決定する。ステップ3は、サブクラスの数およびサ
ブクラスデータ(標準データ)を格納先ポインタ群に登
録し、格納先ポインタ先へ標準データを登録する(木構
造の形成)。ステップ4は、サブクラスに含まれるサン
プルデータを引き数とした本フローの再帰コールを行
う。ステップ5は、すべてのサブクラス分の再帰コール
が終了したかを判定する。ステップ6は、最端のサブク
ラス(葉)の標準データとカテゴリ名の登録である。な
お、ステップ2に関しては、その具体的方法を後で詳細
に説明する。このフローチャートで示した手順によれ
ば、複数のサンプルデータを最端葉のサブクラスのデー
タが同一となるまで分割していきながら、データ分類の
ための木構造と標準データが作成できる。図3は、この
フローチャートで得られる計算機のメモリー上に作成さ
れた木構造と標準データを示したものである。つぎに、
このようにサンプルデータの学習によって得られた木構
造に従って未知のカテゴリの入力データのカテゴリを判
定する方法を説明する。
【0008】図2は、この判定するためのフローチャー
トである。ステップ7は、サブクラス数があるかない
か、すなわち、木構造の最端葉かどうかを判定する。ス
テップ8は、サブクラスの標準データと入力データとの
距離の計算、すなわち、類似度を計算する。ステップ9
は、サブクラス数分の距離計算を終了したかどうかを判
定する。ステップ10は、計算した距離の最小値が一定
値以下かどうかの判定、すなわち、入力データと各標準
データとの距離が大であって、類似度がない場合には、
リジェクトとするような判定を行う。ステップ11は、
最小距離の標準データを持つサブクラスに関して、本フ
ローの再帰コールを行う。一方、ステップ12は、最端
葉のサブクラスの標準データと入力データとの距離計算
を行う。ステップ13は、計算した距離が一定値以下か
どうかを判定する。すなわち、入力データと標準データ
との距離が大の場合にはリジェクトとするような判定を
行う。ステップ14は、最端葉のサブクラスのカテゴリ
名の登録、すなわち、入力データのカテゴリを最端葉の
サブクラスのカテゴリ名とするものである。このフロー
チャートで示した手順により、未知のカテゴリの入力デ
ータを再帰的に各サブクラスの標準データと比較してカ
テゴリを決定できる。また、学習したサンプルパターン
と大きく異なる場合にはリジェクトすることができる。
ここでの入力データと標準データとの距離として、例え
ば、ユークリッド距離、サブクラスに属するサンプルデ
ータの分散共分散行列を用いたマハラノビス距離などを
用いる。
【0009】図8(a)は、図1のフローにより得られ
た木構造と標準データを用いて、この図2のフローにし
たがい、未知のカテゴリの入力データのカテゴリを判定
した結果を示している。小さい方の白丸と黒丸がサンプ
ルデータ、大きめの白丸と黒丸が試行した未知のカテゴ
リの入力データを示している。この図8(a)から明ら
かなように、丸印の色分け(黒丸と白丸)は、判定され
た結果のカテゴリの違いを示し、大きめの白丸の入力デ
ータは、小さい方の白丸のサンプルデータのカテゴリ
に、大きめの黒丸の入力データは、小さい方の黒丸のサ
ンプルデータのカテゴリに正しく判定されている。図内
の周辺の空白の領域はリジェクト領域を示している。す
なわち、サンプルデータから遠く離れた入力データは適
格な距離(類似度)判定によりリジェクトされる。図8
(b)は、距離(類似度)判定をややゆるくしたもの
(図2の距離判定の一定値を大きくしたもの)である。
2つのカテゴリ領域が図8(a)に比べ広がっている。
【0010】図4は、図1のステップ2のサブクラスの
発生とそのサブクラスに含まれるサンプルデータおよび
標準データの決定のための具体的方法を示したものであ
る。ステップ15は、サンプルデータの分布中心付近に
ランダムに複数(N個)の標準データを配置する。ステ
ップ16は、各サンプルデータに関して最も近い距離の
標準データを決定し、それによってそれぞれの標準デー
タを代表とする各サブクラスに属するサンプルデータを
求める。ステップ17は、各標準データとそのサブクラ
スに属するサンプルデータとの誤差Eを図13の〈数
1〉のようにして求める。ステップ18は、誤差E=|
E(t+1)−E(t)|が一定値より小さいかどうか
を判定する。ここで、E(t)は前回の誤差、E(t+
1)は今回の誤差を表す。ステップ19は、誤差Eが一
定値より大きい場合に、図13の〈数2〉にしたがって
各標準データを移動させ、ステップ16に戻る。すなわ
ち、標準データとそれに所属するサンプルデータの差の
総和を各次元毎に計算して、それらの総和値で表現され
た方向に標準データを移動させ、再度、各サンプルデー
タと各標準データの距離を計算して、各サンプルデータ
毎に最も近い標準データを求め、それに各サンプルデー
タが所属するとし、標準データとそれに所属するサンプ
ルデータの差の総和が各次元毎に一定値以下になるま
で、このような各標準データの移動を繰り返す。誤差E
が一定値より小さくなった場合は、その時の各標準デー
タを最終の標準データとし、各サンプルデータはそれに
最も近い標準データのサブクラスに属しているものとし
て、このフローを終了する。なお、図6の各サブクラス
の標準データを表す大きめの黒丸およびそのサブクラス
に属する実線で囲んだ範囲内のサンプルデータは、この
フローにより決定されるものである。
【0011】上記の実施例では2次元の分離問題を説明
したが、本発明を多次元空間上における分離問題に適用
することもできる。この場合、数1のデータの次元iを
増やすだけでよい。
【0012】図9、図10は、顔画像の分類に本発明を
適用した実施例である。ここでのサンプルデータは濃淡
顔画像そのものであり、縦横それぞれ16画素の大き
さ、すなわち、256次元のパターン空間上における分
離問題である。図9は、パターン空間上のサンプルデー
タ(白丸、白角、黒丸)の分布とサブクラスの包含関
係、すなわち、クラスC1はサブクラスC11、C1
2、C13を包含し、同様に、クラスC3はサブクラス
C31、C32、C33、および、クラスC4はサブク
ラスC41、C42、C43、C44をそれぞれ包含
し、クラスC2はサブクラスを包含しないことを示す。
そして、それぞれの標準データとして標準パターン(サ
ンプル顔画像)を示してある。サンプル顔画像のカテゴ
リは“人間”(白丸)“犬”(白角)“猫”(黒丸)の
3つである。ただし、256次元パターン空間を紙上に
表現できないため模式的に表現してある。図10は、各
サブクラスの木構造とそのサブクラスに所属するサンプ
ルデータを表現したものである。すなわち、クラスC1
属するサブクラスC11には猫2の顔2つ、サブクラス
C12には犬1の顔1つ、サブクラスC13には猫3の顔
1つを表現している。以下、同様に図示の如くである。
この木構造と各標準データを用いて、未知の顔画像デー
タがどのサブクラス領域内に入るかを調べれば、高速
に、しかも、正確に顔画像データのカテゴリを判定する
ことができる。
【0013】つぎに、本発明を実施するシステム構成に
ついて、図12を用いて説明する。1はスキャナー、2
は学習部、3は判定部、4は画像記憶部と標準データ記
憶部を有する記憶部、5はCPUである。予め学習用の
画像サンプルデータを、スキャナー1から入力し、記憶
部4の画像記憶部に格納する。学習部2では、画像記憶
部の学習用の画像サンプルデータを用いて、図1の学習
手順および図4の標準データの作成手順にしたがって、
図3に示した木構造をもった標準データを作る。それら
のデータは、記憶部4の標準データ記憶部に格納する。
そこで、スキャナー1から未知カテゴリの画像データを
採り込む。この未知カテゴリの画像データは、判定部3
において、図2の入力データのカテゴリ判定手順にした
がって、標準データ記憶部の標準データと比較し、その
カテゴリを決定する。なお、CPU5は、全体の動作手
順、すなわち、画像の採り込み、学習部3、判定部3お
よび記憶部4の起動などを制御する。
【0014】
【発明の効果】以上、実施例で説明したように、本発明
によれば、たとえ、サンプルデータが入れ子状態であ
る、いわゆる、非線形分離問題でも、データをサブクラ
スに分割するので、複数の部分的線形問題に帰着でき
る。この結果、本発明は、非線形分離問題への適用が可
能となり、しかも、高速に類似度の計算ができる。ま
た、本発明によれば、データ分類のための木構造が得ら
れ、その木構造にしたがった判定を行うので、予期しな
い未知データを標準データのすべてと照合する必要がな
くなり、処理の高速化が図られる。また、標準データと
の距離計算により入力データの類似度を求めることがで
きる。そして、サブクラス内における標準データと入力
データの距離による類似度判定を行うことにより、予期
しない未知データのリジェクトが可能となり、判定の精
度が向上する。
【図面の簡単な説明】
【図1】サンプルデータを用いた学習、すなわち、デー
タ分類のための木構造と標準データの作成のためのフロ
ーチャート
【図2】得られた木構造に従って未知のカテゴリの入力
データのカテゴリを判定するためのフローチャート。
【図3】計算機のメモリー上に作成された木構造と標準
データの例を示す。
【図4】図1aのステップ2のサブクラスの発生とその
サブクラスに含まれるサンプルデータおよび標準データ
の決定フローの例を示す。
【図5】2つの物理量の軸からなる2次元空間上のサン
プルデータの分布を示す。
【図6】図4の実際のサンプルデータを用いて、サンプ
ルデータのサブクラス分割の原理の概要を示す。
【図7】図4の実際のサンプルデータを用いて、サブク
ラス間の木構造を示す。
【図8】(a)は、得られた木構造と標準データを用い
て未知のカテゴリの入力データのカテゴリを判定した結
果を示し、(b)は、距離(類似度)判定をややゆるく
した結果を示す。
【図9】顔画像を用いた実施例におけるパターン空間上
でのサンプルデータの分布とサブクラスの包含関係、お
よび、幾つかの標準データを示す。
【図10】各サブクラスの木構造とそのサブクラスに属
するサンプルデータを示す。
【図11】従来方法の1つである層状ニューラルネット
の課題を説明するためのもの。
【図12】本発明を実施するシステム構成例を示す。
【図13】〈数1〉、〈数2〉を示す。
【符号の説明】
ステップ1 クラス内のサンプルデータのカテゴリの同
一性の判定 ステップ2 サブクラスの発生と標準データの決定 ステップ3 サブクラスの数およびサブクラスデータ
(標準データ)格納先ポインタ群の登録、格納先ポイン
タ先への標準データの登録 ステップ4 本フローの再帰コール ステップ5 すべてのサブクラス分の再帰コールが終了
したかの判定 ステップ6 標準データとカテゴリ名の登録 ステップ7 サブクラス数があるかないかの判定 ステップ8 サブクラスの標準データと入力データとの
距離の計算 ステップ9 サブクラス数分の距離計算を終了したかど
うかの判定 ステップ10 計算した距離の最小値が一定値以下かど
うかの判定 ステップ11 本フローの再帰コール ステップ12 最端葉サブクラスの標準データと入力デ
ータとの距離計算 ステップ13 計算した距離が一定値以下かどうかの判
定 ステップ14 最端葉のサブクラスのカテゴリ名の登録

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 n次元データのカテゴリを決定する方法
    に於いて、カテゴリが既知である複数のサンプルデータ
    を用意し、n次元空間内において互いに距離が近いデー
    タが同一のクラス(グループ)となるように、サンプル
    データを複数のクラスに分割するステップと、クラス内
    に属するサンプルデータが同一のカテゴリでない場合、
    そのサンプルデータのうちn次元空間内において互いに
    近いデータが同一のサブクラスとなるように、サンプル
    データを複数のサブクラスに分割し、サブクラス内のサ
    ンプルデータが同一のカテゴリになるまで、この再分割
    を繰り返すステップと、得られたクラス、サブクラスの
    関係を木構造により表現し、各クラスおよび各サブクラ
    ス毎にそれに含まれるサンプルデータから標準データを
    求めるステップを有することを特徴とするデータの自動
    分類方法。
  2. 【請求項2】 請求項1に記載の自動分類方法におい
    て、クラスまたはサブクラスの標準データを多次元空間
    におけるそのクラスまたはサブクラス内のサンプルデー
    タの分布中心とすることを特徴とするデータの自動分類
    方法。
  3. 【請求項3】 n次元データのカテゴリを決定する方法
    に於いて、カテゴリが既知である複数のサンプルデータ
    を用意し、n次元空間内のサンプルデータの分布中心付
    近の任意位置に複数の標準データを発生し、各サンプル
    データと標準データの距離を計算して、各サンプルデー
    タ毎に最も近い標準データを求め、一旦、それに各サン
    プルデータが所属するとした後、標準データとそれに所
    属するサンプルデータの差の総和を各次元毎に計算し
    て、それらの総和値で表現された方向に標準データを移
    動させ、再度、各サンプルデータと各標準データの距離
    を計算して、各サンプルデータ毎に最も近い標準データ
    を求め、それに各サンプルデータが所属するとし、標準
    データとそれに所属するサンプルデータの差の総和が各
    次元毎に一定値以下になるまで、このような各標準デー
    タの移動を繰り返して、各標準データの最終的位置とそ
    れに代表されるクラス(グループ)に所属するサンプル
    データを決定するステップと、クラス内に属するサンプ
    ルデータが同一のカテゴリでない場合、そのサンプルデ
    ータのうちn次元空間内で互いに近いデータが同一のサ
    ブクラスとなるように、前記ステップと同様に、サンプ
    ルデータを複数のサブクラスに分割し、サブクラス内の
    サンプルデータが同一のカテゴリになるまで、この再分
    割を繰り返すステップと、前記両ステップにおいて得ら
    れた標準データとクラスまたはサブクラスを木構造に関
    連付けて記憶するステップを有することを特徴とするデ
    ータの自動分類方法。
  4. 【請求項4】 請求項1ないし請求項3に記載のいずれ
    かの自動分類方法において、未知カテゴリの入力データ
    に対し、木構造にあるクラスの内、どのクラスに一番近
    いかを各クラスの標準データとの距離により判定し、次
    に、そのクラスに葉(サブクラス)がある場合には、再
    度、どのサブクラスに一番近いかを各サブクラスの標準
    データとの距離により判定し、最端の葉(サブクラス)
    に到達するまでこの判定を行い、最端の葉(サブクラ
    ス)のカテゴリを入力データのカテゴリとするステップ
    を有することを特徴とするデータの自動分類方法。
  5. 【請求項5】 請求項4に記載の自動分類方法におい
    て、未知カテゴリの入力データとクラスまたはサブクラ
    スの標準データとの距離が一定値以上の場合、この入力
    データのカテゴリをサンプルデータのカテゴリ以外の
    “不明”とすることを特徴とするデータの自動分類方
    法。
JP03259784A 1991-09-11 1991-09-11 自動分類方法 Expired - Lifetime JP3118725B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP03259784A JP3118725B2 (ja) 1991-09-11 1991-09-11 自動分類方法
GB9218944A GB2259599A (en) 1991-09-11 1992-09-08 Automatic clustering method
US07/943,688 US5329596A (en) 1991-09-11 1992-09-11 Automatic clustering method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03259784A JP3118725B2 (ja) 1991-09-11 1991-09-11 自動分類方法

Publications (2)

Publication Number Publication Date
JPH0573687A true JPH0573687A (ja) 1993-03-26
JP3118725B2 JP3118725B2 (ja) 2000-12-18

Family

ID=17338936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03259784A Expired - Lifetime JP3118725B2 (ja) 1991-09-11 1991-09-11 自動分類方法

Country Status (3)

Country Link
US (1) US5329596A (ja)
JP (1) JP3118725B2 (ja)
GB (1) GB2259599A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008112211A (ja) * 2006-10-27 2008-05-15 Toshiba Corp 姿勢推定装置及びその方法
JP2010026782A (ja) * 2008-07-18 2010-02-04 Nippon Telegr & Teleph Corp <Ntt> 文書分類装置、文書分類方法、プログラム及び記録媒体
WO2018155412A1 (ja) * 2017-02-21 2018-08-30 日本電気株式会社 分類装置と分類方法並びにプログラム

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4130631A1 (de) * 1991-09-14 1993-03-18 Philips Patentverwaltung Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal
JPH06223198A (ja) * 1993-01-26 1994-08-12 Hitachi Ltd 光線追跡による画像生成装置及び方法
JP2522154B2 (ja) * 1993-06-03 1996-08-07 日本電気株式会社 音声認識システム
FI100366B (fi) * 1994-09-01 1997-11-14 Spectra Physics Visiontech Oy Menetelmä poikkeamien tunnistamiseksi tarkastettavasta pinnasta
JP3630734B2 (ja) * 1994-10-28 2005-03-23 キヤノン株式会社 情報処理方法
US5497430A (en) * 1994-11-07 1996-03-05 Physical Optics Corporation Method and apparatus for image recognition using invariant feature signals
US5821945A (en) * 1995-02-03 1998-10-13 The Trustees Of Princeton University Method and apparatus for video browsing based on content and structure
US5708767A (en) * 1995-02-03 1998-01-13 The Trustees Of Princeton University Method and apparatus for video browsing based on content and structure
US5864839A (en) * 1995-03-29 1999-01-26 Tm Patents, L.P. Parallel system and method for generating classification/regression tree
US5764824A (en) * 1995-08-25 1998-06-09 International Business Machines Corporation Clustering mechanism for identifying and grouping of classes in manufacturing process behavior
KR19990014752A (ko) * 1996-03-13 1999-02-25 요트.게.아.롤페즈 필터링 방법 및 대응 필터링 시스템
US5832182A (en) * 1996-04-24 1998-11-03 Wisconsin Alumni Research Foundation Method and system for data clustering for very large databases
US6046740A (en) * 1997-02-07 2000-04-04 Seque Software, Inc. Application testing with virtual object recognition
JP2002501637A (ja) * 1997-03-10 2002-01-15 フラウンホーファー−ゲゼルシャフト ツル フェルデング デル アンゲヴァンテン フォルシュング エー.ファー. 前選択と棄却クラスによる確実な識別
US5848404A (en) * 1997-03-24 1998-12-08 International Business Machines Corporation Fast query search in large dimension database
US6263337B1 (en) * 1998-03-17 2001-07-17 Microsoft Corporation Scalable system for expectation maximization clustering of large databases
US6581058B1 (en) 1998-05-22 2003-06-17 Microsoft Corporation Scalable system for clustering of large databases having mixed data attributes
JP4432262B2 (ja) * 1999-03-12 2010-03-17 ソニー株式会社 画像処理装置、画像処理方法及び記録媒体
US6549907B1 (en) * 1999-04-22 2003-04-15 Microsoft Corporation Multi-dimensional database and data cube compression for aggregate query support on numeric dimensions
WO2001009821A1 (en) * 1999-07-30 2001-02-08 Litton Systems, Inc. Automatic image characterization by class correlation processing
US6671680B1 (en) * 2000-01-28 2003-12-30 Fujitsu Limited Data mining apparatus and storage medium storing therein data mining processing program
JP2002099916A (ja) * 2000-09-25 2002-04-05 Olympus Optical Co Ltd パターン分類方法及びその装置、コンピュータにより読み取り可能な記憶媒体
US6507675B1 (en) * 2001-03-23 2003-01-14 Shih-Jong J. Lee Structure-guided automatic learning for image feature enhancement
US6751348B2 (en) 2001-03-29 2004-06-15 Fotonation Holdings, Llc Automated detection of pornographic images
US6873743B2 (en) * 2001-03-29 2005-03-29 Fotonation Holdings, Llc Method and apparatus for the automatic real-time detection and correction of red-eye defects in batches of digital images or in handheld appliances
US6684177B2 (en) * 2001-05-10 2004-01-27 Hewlett-Packard Development Company, L.P. Computer implemented scalable, incremental and parallel clustering based on weighted divide and conquer
US20020183984A1 (en) * 2001-06-05 2002-12-05 Yining Deng Modular intelligent multimedia analysis system
US7246125B2 (en) * 2001-06-21 2007-07-17 Microsoft Corporation Clustering of databases having mixed data attributes
KR100571813B1 (ko) * 2003-07-28 2006-04-17 삼성전자주식회사 로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치
JP3861157B2 (ja) * 2004-02-27 2006-12-20 国立大学法人広島大学 参照データ最適化装置とパターン認識システム
CN1755796A (zh) 2004-09-30 2006-04-05 国际商业机器公司 文本到语音转换中基于统计技术的距离定义方法和***
CN100369051C (zh) * 2005-01-11 2008-02-13 富士通株式会社 灰度字符词典的生成装置
JP5401096B2 (ja) 2005-12-08 2014-01-29 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー コンテキストの動的作成のための方法及びシステム
US7483866B2 (en) * 2005-12-19 2009-01-27 Trw Automotive U.S. Llc Subclass partitioning in a pattern recognition classifier for controlling deployment of an occupant restraint system
US8060451B2 (en) * 2007-06-15 2011-11-15 International Business Machines Corporation System and method for facilitating skill gap analysis and remediation based on tag analytics
US20090273597A1 (en) * 2008-05-05 2009-11-05 International Business Machines Corporation User interface screen layout analysis using hierarchical geometric features
US20110184995A1 (en) * 2008-11-15 2011-07-28 Andrew John Cardno method of optimizing a tree structure for graphical representation
CN101707532B (zh) * 2009-10-30 2012-08-15 中山大学 一种未知应用层协议自动分析方法
KR101546619B1 (ko) * 2014-04-07 2015-08-21 김기남 송수신이 가능한 헬멧
CN110348465B (zh) * 2018-04-03 2022-10-18 富士通株式会社 用于标注样本的方法
CN112463334B (zh) * 2020-12-04 2023-08-18 苏州浪潮智能科技有限公司 一种训练任务排队原因分析方法、***、设备以及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1333440A (en) * 1969-12-30 1973-10-10 Texas Instruments Inc Probability sort in a storage minimized optimum processor
US3810162A (en) * 1970-06-01 1974-05-07 Texas Instruments Inc Nonlinear classification recognition system
US4773099A (en) * 1985-10-10 1988-09-20 The Palantir Corporation Pattern classification means for use in a pattern recognition system
US4975975A (en) * 1988-05-26 1990-12-04 Gtx Corporation Hierarchical parametric apparatus and method for recognizing drawn characters
US5075896A (en) * 1989-10-25 1991-12-24 Xerox Corporation Character and phoneme recognition based on probability clustering

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008112211A (ja) * 2006-10-27 2008-05-15 Toshiba Corp 姿勢推定装置及びその方法
JP4709723B2 (ja) * 2006-10-27 2011-06-22 株式会社東芝 姿勢推定装置及びその方法
JP2010026782A (ja) * 2008-07-18 2010-02-04 Nippon Telegr & Teleph Corp <Ntt> 文書分類装置、文書分類方法、プログラム及び記録媒体
WO2018155412A1 (ja) * 2017-02-21 2018-08-30 日本電気株式会社 分類装置と分類方法並びにプログラム
US11443233B2 (en) 2017-02-21 2022-09-13 Nec Corporation Classification apparatus, classification method, and program

Also Published As

Publication number Publication date
JP3118725B2 (ja) 2000-12-18
GB9218944D0 (en) 1992-10-21
GB2259599A (en) 1993-03-17
US5329596A (en) 1994-07-12

Similar Documents

Publication Publication Date Title
JPH0573687A (ja) 自動分類方法
JP2894113B2 (ja) 画像クラスタリング装置
US8139852B2 (en) Color classification method, color recognition method, color classification apparatus, color recognition apparatus, color recognition system, computer program, and recording medium
Joanes Reject inference applied to logistic regression for credit scoring
CN111028305A (zh) 表情生成方法、装置、设备及存储介质
US20040264741A1 (en) Region detecting method and region detecting apparatus
JPH09508739A (ja) 指紋一致装置
CN110532920A (zh) 基于FaceNet方法的小数量数据集人脸识别方法
KR20040037180A (ko) 학습 모델 부분들을 사용하는 안면 인식 시스템 및 방법
EP1191459A1 (en) Data clustering methods and applications
CN109284757A (zh) 一种车牌识别方法、装置、计算机装置及计算机可读存储介质
CN114331946A (zh) 一种图像数据处理方法、设备以及介质
US6885772B2 (en) Process for cyclic, interactive image analysis, and also computer system and computer program for performing the process
JPH09171552A (ja) 画像認識装置
JP4397667B2 (ja) 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JPH08287258A (ja) カラー画像認識装置
CN113837236B (zh) 图像中目标对象的识别方法、装置、终端设备及存储介质
EP0435099B1 (en) A method of selecting characteristics data for a data processing system
US20210073586A1 (en) Learning device, learning method, and storage medium
Ghosh et al. A detail analysis and implementation of Haar cascade classifier
JP3065332B2 (ja) 画像処理方法
US11270163B2 (en) Learning device, learning method, and storage medium
JPH08167028A (ja) 画像処理方法
Castleman et al. Object Classification
JPH07160879A (ja) 画像処理方法

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071013

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081013

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 11

EXPY Cancellation because of completion of term