JP5725576B2 - Pattern recognition and learning method thereof - Google Patents

Pattern recognition and learning method thereof Download PDF

Info

Publication number
JP5725576B2
JP5725576B2 JP2013143460A JP2013143460A JP5725576B2 JP 5725576 B2 JP5725576 B2 JP 5725576B2 JP 2013143460 A JP2013143460 A JP 2013143460A JP 2013143460 A JP2013143460 A JP 2013143460A JP 5725576 B2 JP5725576 B2 JP 5725576B2
Authority
JP
Japan
Prior art keywords
category
pattern recognition
learning
identification
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013143460A
Other languages
Japanese (ja)
Other versions
JP2015018312A (en
Inventor
健 星野
健 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2013143460A priority Critical patent/JP5725576B2/en
Publication of JP2015018312A publication Critical patent/JP2015018312A/en
Application granted granted Critical
Publication of JP5725576B2 publication Critical patent/JP5725576B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明はパターン認識の学習装置、学習方法及び学習プログラム、並びに学習機能を備えたパターン認識装置に関する。   The present invention relates to a pattern recognition learning device, a learning method and a learning program, and a pattern recognition device having a learning function.

パターン認識では、ニューラルネットのパーセプトロンなどを用いて音声、文字、画像などのデータから特定のパターンを認識する。パターン認識では、認識対象のデータを特定の種類のパターンに対応付ける識別関数が用いられる。識別関数はパターンの種類毎に識別境界によってデータ空間を分割し、分割された領域に属するデータが当該種類のパターンに対応する。例えば、対象データが2次元データの場合には、識別関数が与える識別境界は識別線になり、3次元データの場合には識別面になり、一般にn次元データの場合には識別n次平面(「識別高次平面」ともいう)になる。   In pattern recognition, a specific pattern is recognized from data such as speech, characters, and images using a perceptron of a neural network. In pattern recognition, an identification function that associates recognition target data with a specific type of pattern is used. The identification function divides the data space by the identification boundary for each type of pattern, and the data belonging to the divided area corresponds to the pattern of the type. For example, when the target data is two-dimensional data, the identification boundary given by the identification function is an identification line. When the target data is three-dimensional data, the identification boundary is an identification plane. Also referred to as “identified higher-order plane”.

例えば、2次元データの場合、パターン認識装置は、識別関数が与える識別線によって、複数の点からなる一つのデータ群(「カテゴリ」ともいう)を他のデータ群から分離し、2次元データ面上にそのデータ群の領域を作る。そして、新たに未知のデータが入力されると、そのデータが分離された領域内に存在するかどうか確認し、領域内に存在する場合、未知のデータは事前に分離したデータ群と同じ種類であると識別される。もし、領域外である場合は、別の種類であると識別される。   For example, in the case of two-dimensional data, the pattern recognition apparatus separates one data group (also referred to as “category”) composed of a plurality of points from other data groups by an identification line given by an identification function, and generates a two-dimensional data surface. Create an area for the data group above. Then, when new unknown data is input, it is confirmed whether the data exists in the separated area. If it is present in the area, the unknown data is the same type as the previously separated data group. Is identified. If it is out of the area, it is identified as another type.

図1は、データ群Aをデータ群Bとデータ群Cから分離する識別線を表しており、図中の未知データは、識別線よりデータ群A側の領域に存在するため、データ群Aのデータであると識別される。   FIG. 1 shows an identification line that separates the data group A from the data group B and the data group C, and the unknown data in the figure exists in an area closer to the data group A than the identification line. Identified as data.

関連技術では、パーセプトロンの学習完了時、識別関数が与える識別高次平面は、学習データ(「学習パターン」ということがある)の近傍に配置されることが多く、すなわち、未知のデータを入力した際に間違えやすい位置に配置され、必ずしも識別能力の高い位置に配置されなかった。そのため、カルバック・ライブラー・ダイバージェンスや距離関数等を用いて、学習完了後の識別高次平面を学習データから遠ざけるような識別能力向上法が用いられてきた。例えば、特許文献1には、クロスエントロピー誤差を最小化するようにパターン認識システムのトレーニング可能パラメータを更新することが開示されている。   In related technologies, the discriminating higher-order plane given by the discriminant function at the completion of learning of the perceptron is often placed in the vicinity of the learning data (sometimes referred to as “learning pattern”), that is, unknown data is input. It was placed at a position where it was easy to make a mistake, and was not necessarily placed at a position with high discrimination ability. For this reason, a discriminating ability improvement method has been used in which the discriminating higher-order plane after completion of learning is moved away from the learning data by using a Cullback, a librarian divergence, a distance function, or the like. For example, Patent Document 1 discloses updating a trainable parameter of a pattern recognition system so as to minimize a cross-entropy error.

しかし、その際、各学習データ群の中間位置に識別高次平面を配置しようとするため、大きく分散の異なるデータ群を分離する識別高次平面の場合、最適な位置に配置されない場合があった。例えば、図2に示されるように、識別高次平面に対して、垂直方向に分散が大きい学習データ群(カテゴリk)と、垂直方向に分散が小さい学習データ群(カテゴリk’)の中央に識別高次平面を配置した場合、カテゴリkの未知データは、識別高次平面に対して垂直方向に散らばったデータ(すなわち、図2において点線で表される領域に存在するデータ)となることが予想されるため、カテゴリk’と誤認識される可能性があった。   However, in that case, since the identification higher-order plane is arranged at the intermediate position of each learning data group, there is a case where the identification higher-order plane separating the data groups having greatly different variances is not arranged at the optimum position. . For example, as shown in FIG. 2, the learning data group (category k) having a large variance in the vertical direction and the learning data group (category k ′) having a small variance in the vertical direction with respect to the identified higher-order plane When the identified higher-order plane is arranged, the unknown data of category k may be data scattered in a direction perpendicular to the identified higher-order plane (that is, data existing in a region represented by a dotted line in FIG. 2). As expected, there was a possibility of being mistakenly recognized as category k ′.

特開2003−296737号公報JP 2003-296737 A

関連技術の方法では、カテゴリ内の学習データの分散を考慮せずに、識別高次平面を設定していたため、最適な位置に識別高次平面が設定されず、未知データを正しく判定できないという問題があった。   In the related art method, the discriminating higher-order plane is set without considering the variance of the learning data within the category, so the discriminating higher-order plane is not set at the optimal position, and unknown data cannot be correctly determined. was there.

本発明は、上記問題を解決し、パターン認識の識別関数を最適化することを目的とする。   An object of the present invention is to solve the above-described problems and to optimize a discrimination function for pattern recognition.

本発明のパターン認識学習装置は、パターン認識を学習するためのパターン認識学習装置であって、パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、を含み、前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする。 The pattern recognition learning device according to the present invention is a pattern recognition learning device for learning pattern recognition, and includes a determination unit that determines an identification function for identifying a category of each learning data from pattern learning learning data, see containing and optimizing means for optimizing the discriminant function by considering the dispersion characteristics of the learning data, and the optimization means, the distance from the decision boundary of the category of the identification function gives up training data belonging to that category The discrimination boundary is moved so as to maximize the value of the discriminating ability evaluation function in consideration of the variance of .

本発明のパターン認識学習方法は、パターン認識の識別関数を決定する決定手段と、前記識別関数を最適化する最適化手段とを有するパターン認識学習装置におけるパターン認識を学習するパターン認識学習方法であって、前記決定手段において、パターン認識の学習データから各学習データのカテゴリを識別する前記識別関数を決定する決定ステップと、前記最適化手段において、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、を含み、前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする。 The pattern recognition learning method of the present invention is a pattern recognition learning method for learning pattern recognition in a pattern recognition learning apparatus having a determining means for determining a discrimination function for pattern recognition and an optimization means for optimizing the discrimination function. Te, in the determination unit, a determining step of determining the identification function of identifying a category of the learning data from the learning data pattern recognition, in the optimizing means, taking into account the dispersion characteristics of the learning data in the category the see containing and optimization step of optimizing the identification function, and in the optimization step, the decision boundary of the category of the discriminant function gives discriminating ability evaluation function considering the variance of the distance to the learning data belong to the category The identification boundary is moved so as to maximize the value .

本発明のプログラムは、コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、前記コンピュータを、パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、として機能させ、前記最適化手段により、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするA program according to the present invention is a program for causing a computer to function as a pattern recognition learning device for learning pattern recognition, wherein the computer identifies the category of each learning data from the pattern recognition learning data. And determining means for optimizing the discriminant function in consideration of the dispersion characteristics of the learning data in the category, and by the optimizing unit, from the discriminant boundary of the category given by the discriminant function The discrimination boundary is moved so as to maximize the value of the discrimination ability evaluation function considering the dispersion of the distance to the learning data belonging to the category .

本発明により、パターン認識の識別関数を最適化することができる。   According to the present invention, the discrimination function for pattern recognition can be optimized.

パターン認識における識別線の説明図である。It is explanatory drawing of the identification line in pattern recognition. パターン認識において起こり得る誤認識の説明図である。It is explanatory drawing of the misrecognition which may occur in pattern recognition. パターン認識装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of a pattern recognition apparatus. 記憶部の構成例を示すブロック図である。It is a block diagram which shows the structural example of a memory | storage part. パターン認識の学習方法のフローチャートである。It is a flowchart of the learning method of pattern recognition. 学習完了直後(最適化前)の識別高次平面の配置を示す。The arrangement of the discriminating higher-order plane immediately after completion of learning (before optimization) is shown. 識別能力評価関数のグラフである。It is a graph of a discrimination ability evaluation function. カテゴリ間の中央付近に識別高次平面が存在する場合を示す(最適化前)。The case where a discriminating higher-order plane exists near the center between categories (before optimization) is shown. カテゴリの重心間の距離についての説明図である。It is explanatory drawing about the distance between the gravity centers of a category. 最適化後の識別高次平面の配置を示す。The arrangement of the discriminating higher-order plane after optimization is shown.

以下、本発明の実施の形態について図面を参照して説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図3は本発明の実施の形態におけるパターン認識装置の構成を示すブロック図である。パターン認識装置100は、データ入力部110とデータ処理部120とデータ出力部130と記憶部140とを備える。   FIG. 3 is a block diagram showing the configuration of the pattern recognition apparatus according to the embodiment of the present invention. The pattern recognition apparatus 100 includes a data input unit 110, a data processing unit 120, a data output unit 130, and a storage unit 140.

データ入力部110は、認識対象のデータ、学習データ、及び必要に応じて各種パラメータを受け取り、必要に応じて記憶部140に記憶する。データ処理部120はパターン認識学習部122とパターン認識部124とを備える。パターン認識学習部122は、学習段階において、学習データから識別関数を取得すると共に、識別関数の最適化を行う。パターン認識部124は、データ入力部110で受けた認識対象データについて、記憶部140に記憶された識別関数に関する情報を用いてパターン認識を行い、認識結果をデータ出力部130に送る。データ出力部130は、認識結果を表示器(図示せず)等に送る。   The data input unit 110 receives data to be recognized, learning data, and various parameters as necessary, and stores them in the storage unit 140 as necessary. The data processing unit 120 includes a pattern recognition learning unit 122 and a pattern recognition unit 124. In the learning stage, the pattern recognition learning unit 122 obtains an identification function from the learning data and optimizes the identification function. The pattern recognition unit 124 performs pattern recognition on the recognition target data received by the data input unit 110 using information regarding the identification function stored in the storage unit 140, and sends the recognition result to the data output unit 130. The data output unit 130 sends the recognition result to a display (not shown) or the like.

図3では、データ処理部120がパターン認識部124を含んでいるが、パターン認識部124を含まない構成、あるいはパターン認識部124の機能をパターン認識学習部122に含める構成とすることもできる。この場合には、パターン認識装置100は、学習によりパターン認識用の識別関数を取得する機能を有するパターン認識学習装置となる。   In FIG. 3, the data processing unit 120 includes the pattern recognition unit 124. However, the pattern recognition unit 124 may not be included, or the pattern recognition learning unit 122 may include the function of the pattern recognition unit 124. In this case, the pattern recognition apparatus 100 is a pattern recognition learning apparatus having a function of acquiring a discrimination function for pattern recognition by learning.

図4に示すように、記憶部140は、結合係数記憶部142、閾値記憶部144、学習データ記憶部146、カテゴリ重心記憶部148、パーセプトロン出力データ記憶部150、正解信号記憶部152などを必要に応じて備え、識別関数の取得や最適化において使用する。また、記憶部140は最適化された識別関数(又は識別高次平面)を記憶するための識別関数記憶部(図示せず)を備える構成とし、パターン認識部124がパターン認識を実行する際に使用するようにしてもよい。   As shown in FIG. 4, the storage unit 140 requires a coupling coefficient storage unit 142, a threshold storage unit 144, a learning data storage unit 146, a category centroid storage unit 148, a perceptron output data storage unit 150, a correct signal storage unit 152, and the like. And is used in the acquisition and optimization of discriminant functions. The storage unit 140 includes an identification function storage unit (not shown) for storing an optimized discrimination function (or an identification higher-order plane), and the pattern recognition unit 124 performs pattern recognition. It may be used.

本発明の実施の形態におけるパターン認識器は、例えば、顔画像を認識するために、画像データが学習データとして記憶されているパーソナルコンピュータ上などに構築することが可能である。この場合、データ処理部120はCPU、RAM、ROMなどから構成でき、記憶部140はRAM、ROMなどから構成できる。   The pattern recognizer in the embodiment of the present invention can be constructed on, for example, a personal computer in which image data is stored as learning data in order to recognize a face image. In this case, the data processing unit 120 can be configured from a CPU, RAM, ROM, and the like, and the storage unit 140 can be configured from RAM, ROM, and the like.

(原理及び動作の説明)
C個の学習データ群(カテゴリ)に属する複数の学習データをカテゴリ毎に分離する課題を例として、図5のフローチャートを参照して、本発明の原理及び動作を説明する。ここでは、C個のカテゴリに分類されるN個のデータを学習データI(n=1,…,N)で表す。
(Description of principle and operation)
The principle and operation of the present invention will be described with reference to the flowchart of FIG. 5 by taking as an example the problem of separating a plurality of learning data belonging to C learning data groups (categories) for each category. Here, N data classified into C categories is represented by learning data I n (n = 1,..., N).

カテゴリcを分離する識別高次平面の式を式(1)に示す。式(1)中、w(c)はパーセプトロンの結合係数、θ(c)は閾値、u(c)は出力を表す。 Equation (1) shows the expression of the discriminating higher-order plane that separates category c. In equation (1), w (c) represents the perceptron coupling coefficient, θ (c) represents the threshold value, and u (c) represents the output.

例として、図6は、2次元平面上の3個のカテゴリについてパーセプトロンで学習処理を行い、カテゴリkを線形分離した状態を示す(図5のステップS10)。パーセプトロンは、識別能力を考慮せずカテゴリの分離のみを行うため、学習完了直後は、図6に示されるように識別高次平面が学習データの近傍に配置されてしまい、未知データを誤認識しやすくなる。   As an example, FIG. 6 shows a state in which learning processing is performed with a perceptron for three categories on a two-dimensional plane, and category k is linearly separated (step S10 in FIG. 5). Since the perceptron only separates the categories without considering the discriminating ability, immediately after the learning is completed, the discriminating higher-order plane is arranged near the learning data as shown in FIG. It becomes easy.

学習データの近傍に存在している識別高次平面を学習データから遠ざけて識別能力を向上させるために、パーセプトロンで線形分離した識別高次平面を、カルバック・ライブラー・ダイバージェンスを用いて再配置する。   In order to improve the discrimination ability by moving the discriminating higher-order planes that exist in the vicinity of the training data away from the training data, the discriminating higher-order planes linearly separated by the perceptron are rearranged by using the Cullback liber divergence. .

具体的には、識別能力評価関数Eとして、式(2)を定義し、Eを最大化することによって、識別高次平面を各学習データから遠ざけることが出来る。   Specifically, by defining Equation (2) as the discrimination ability evaluation function E and maximizing E, the discrimination higher-order plane can be moved away from each learning data.

式(2)中、r (c)は下記式(3)のシグモイド関数値、u (c)は下記式(4)で算出されるパーセプトロンの出力である。t (c)は正解信号を表し、学習データIがカテゴリcに属する場合は“1”、カテゴリc以外に属する場合は“0”となる。 In the formula (2), r n (c) is a sigmoid function value of the following formula (3), and u n (c) is an output of the perceptron calculated by the following formula (4). t n (c) represents the correct signal, when the learning data I n belongs to the category c is "1", if belong to other categories c "0".

識別能力評価関数E(式(2))のΣ中の項をグラフに表すと、図7に示すようなグラフになる。このグラフは、出力と正解信号との絶対誤差と共に単調減少する関数であることがわかる。   When the term in Σ of the discrimination ability evaluation function E (formula (2)) is represented in a graph, a graph as shown in FIG. 7 is obtained. It can be seen that this graph is a function that decreases monotonically with the absolute error between the output and the correct signal.

上記識別能力評価関数を表す式(2)に対して、最大傾斜法を用いて、結合係数w(c)及び閾値θ(c)を逐次計算し、識別能力評価関数Eの値を最大化する。実際の計算では、式(5)及び(6)を用いて、逐次結合係数と閾値を変化させて、識別能力評価関数値を最大化する。ここで、εは1回で更新する割合を決めるパラメータであり、状況に応じて調節する。 For the equation (2) representing the discrimination ability evaluation function, the coupling coefficient w (c) and the threshold θ (c) are sequentially calculated using the maximum gradient method, and the value of the discrimination ability evaluation function E is maximized. . In the actual calculation, using Equations (5) and (6), the sequential coupling coefficient and the threshold value are changed to maximize the discriminating ability evaluation function value. Here, ε is a parameter that determines the rate of updating at one time, and is adjusted according to the situation.

ここで、上記の識別能力評価関数の式(2)を最大化するように識別高次平面を移動すると、図8に示すように各カテゴリ間の中央付近に識別高次平面が存在してしまうという問題が発生する。図8を見てみると、カテゴリkは、識別高次平面に対して垂直方向に分散が大きく、カテゴリk’は、識別高次平面に対して平行方向に分散が大きくなっている。この様な場合、カテゴリkに属する未知のデータは、識別高次平面に対して垂直方向へ散らばったデータになり、逆にカテゴリk’に属する未知のデータは、識別高次平面に対して水平方向に散らばったデータになると考えられる。したがって、このようなカテゴリ間の中央に、識別高次平面を配置することは、識別能力の点から最適ではない。そこで、本実施形態では、カテゴリkを分離する識別高次平面から最も近いカテゴリk’に着目し、カテゴリkとカテゴリk’の分散値に応じて、識別能力評価関数E(式(2))を変形し、識別高次平面を最適な位置に移動する方法を採る。   Here, if the discriminating higher-order plane is moved so as to maximize the discriminating ability evaluation function equation (2), the discriminating higher-order plane exists near the center between the categories as shown in FIG. The problem occurs. Referring to FIG. 8, the category k has a large variance in the direction perpendicular to the discriminating higher-order plane, and the category k ′ has a variance in the direction parallel to the discriminating higher-order plane. In such a case, the unknown data belonging to the category k is data scattered in the vertical direction with respect to the identified higher-order plane, and conversely, the unknown data belonging to the category k ′ is horizontal to the identified higher-order plane. The data will be scattered in the direction. Therefore, it is not optimal from the point of discrimination capability to arrange the discriminating higher-order plane in the center between such categories. Therefore, in the present embodiment, attention is paid to the category k ′ closest to the discriminating higher-order plane separating the category k, and the discriminating ability evaluation function E (formula (2)) according to the variance values of the category k and the category k ′. Is used to move the discrimination higher-order plane to the optimum position.

まず、各カテゴリの重心g(c)を式(7)で計算し、次に図9に示すように、識別高次平面によって分離されているカテゴリkの重心g(k)からカテゴリk以外のカテゴリの重心g(c)までの距離l (k)を式(8)で算出する。式(7)で、M(c)は、カテゴリcに属する学習データの個数を示す。この距離l (k)のうち、最小の値を持つカテゴリをカテゴリk’とする(図5のステップS20)。 First, the centroid g (c) of each category is calculated by the equation (7), and then, as shown in FIG. 9, from the centroid g (k) of the category k separated by the discriminating higher-order plane, The distance l c (k) to the center of gravity g (c) of the category is calculated by equation (8). In Expression (7), M (c) represents the number of learning data belonging to the category c. Among the distances l c (k), the category having the smallest value is set as the category k ′ (step S20 in FIG. 5).

次に、カテゴリkとk’に属する全学習データについて、カテゴリkを分離する識別高次平面からの距離p (k),p (k’)を式(10)及び(11)により算出する。ここで、<・>は、内積を表す。 Next, for all learning data belonging to categories k and k ′, distances p m (k) and p m (k ′) from the discriminating higher-order plane that separates category k are calculated by equations (10) and (11). To do. Here, <•> represents an inner product.

求めた距離p (k),p (k’)から標本分散s(k)2,s(k’)2を式(12)及び(13)により算出する(図5のステップS30)。ここで、μ(k),μ(k’)は、それぞれカテゴリk,k’に属する学習データの識別高次平面からの距離の平均を示す。 Determined distance p m (k), p m (k ') from the sample variance s (k) 2, s ( k') is calculated by 2 Equation (12) and (13) (step S30 in FIG. 5). Here, μ (k) and μ (k ′) indicate the average distances of the learning data belonging to the categories k and k ′ from the identified higher-order plane, respectively.

上記の標本分散を用いて、識別能力評価関数の式(2)を、式(14)のような式に変更することによって、分散を考慮した識別能力評価関数(「分散考慮型カルバック・ライブラ・ダイバージェンス」ともいう)になる。   By using the above sample variance, the discriminating ability evaluation function equation (2) is changed to an equation like the equation (14), whereby the discriminating ability evaluation function considering the variance (“dispersion-considering Cullback library Also called “divergence”).

式(14)の識別能力評価関数を式(5)及び式(6)で最大化することによって、分散を考慮した最適な位置に識別高次平面を移動させることが出来る(図5のステップS40)。この例では、図10に示すように若干カテゴリk’に近い位置に識別高次平面が配置される。   By maximizing the discriminating ability evaluation function of Equation (14) with Equation (5) and Equation (6), the discriminating higher-order plane can be moved to an optimal position in consideration of dispersion (step S40 in FIG. 5). ). In this example, as shown in FIG. 10, the identification higher-order plane is arranged at a position slightly close to the category k ′.

以上述べたように、本発明の実施形態では、一つのデータ群(カテゴリ)を複数のデータ群から分離する識別境界(識別線や識別高次平面)を決定する方式のパターン認識装置において、識別境界によるデータ群の分離後、識別境界をデータ群から遠ざけるような処理(識別能力向上処理)を行い、その際、各データ群に属するデータの分散度合いを考慮して、識別境界を各データ群に最適な位置に配置することによって、より高い識別能力を得ることができる。   As described above, according to the embodiment of the present invention, in a pattern recognition apparatus that determines an identification boundary (an identification line or an identification higher-order plane) that separates one data group (category) from a plurality of data groups, After separation of the data group by the boundary, a process is performed to move the identification boundary away from the data group (discriminating ability improvement process). At this time, considering the degree of dispersion of data belonging to each data group, the identification boundary is set to each data group. It is possible to obtain a higher discrimination ability by arranging at an optimal position.

具体的には、ニューラルネットのパーセプトロンを用いたパターン認識学習装置において、識別線を高次元化した識別高次平面による高次元データ群分離後、各学習データの分散を考慮したカルバック・ライブラー・ダイバージェンス(式(14))に対して最大傾斜法を用いて、識別高次平面を学習データ群から遠ざけることにより、高い識別能力を得ることができる。   Specifically, in a pattern recognition learning device using a perceptron of a neural network, after separation of high-dimensional data groups by higher-order discriminating planes with higher-order discriminating lines, Cullback-liver By using the maximum gradient method with respect to the divergence (formula (14)), it is possible to obtain a high discrimination ability by moving the discriminating higher-order plane away from the learning data group.

(発明の他の実施形態)
上記実施形態では、識別高次平面に最も近いカテゴリを1つ選択したが、識別高次平面に近いカテゴリを複数選択することによって、更に識別能力の高い位置へ識別高次平面を設定することが可能となる。例えば、特定のカテゴリに近いもの順に所定個数の複数のカテゴリを選択してもよい。識別能力評価関数は、特定のカテゴリの識別境界から、そのカテゴリに属する学習データまでの距離の分散と、選択した複数のカテゴリに属する学習データまでの距離の分散とを考慮したものに変更し得る。
(Other Embodiments of the Invention)
In the above-described embodiment, one category closest to the identification higher-order plane is selected. However, by selecting a plurality of categories close to the identification higher-order plane, it is possible to set the identification higher-order plane to a position with higher identification capability. It becomes possible. For example, a predetermined number of a plurality of categories may be selected in the order close to a specific category. The discriminating ability evaluation function can be changed to take into account the variance of the distance from the identification boundary of a specific category to the learning data belonging to that category and the variance of the distance to the learning data belonging to a plurality of selected categories. .

また、上記実施形態では、識別能力評価関数としてカルバック・ライブラー・ダイバージェンスを用いたが、識別高次平面から学習データへのユークリッド距離の総和の逆数を識別能力評価関数として用いることも可能である。   Further, in the above embodiment, the Cullback-Liber divergence is used as the discriminating ability evaluation function, but it is also possible to use the reciprocal of the sum of the Euclidean distances from the discriminating higher-order plane to the learning data as the discriminating ability evaluation function. .

また、上記実施形態では、顔認証を例に説明したが、画像データから2次元バーコードを解析する際に、初期処理段階で上記実施形態の手法を用いて、コード種類を大分類することによって、その後の処理を簡略化でき、バーコード解析処理を高速化することが可能となる。   In the above embodiment, face authentication has been described as an example. However, when analyzing a two-dimensional barcode from image data, by using the method of the above embodiment at the initial processing stage, the code types are classified roughly. The subsequent processing can be simplified, and the barcode analysis processing can be speeded up.

また、上記実施形態では、顔認証を例に説明したが、上記実施形態の手法によって、文字認識用のパーセプトロンの識別能力を向上させておくことによって、画像データから抽出された、汚れや書き損じがある文字を認識する装置を構築することが可能となる。   In the above embodiment, face authentication has been described as an example. However, by improving the recognition ability of the perceptron for character recognition by the method of the above embodiment, dirt and writing defects extracted from image data can be reduced. It is possible to construct a device that recognizes certain characters.

顔認証以外の上記適用例においても、パーセプトロンを用いて識別高次平面を決定した後、分散を考慮したカルバック・ライブラー・ダイバージェンスを用い、カテゴリ内の学習データの分散が異なっているデータ群に対し、識別高次平面を最適な位置に再設定することによって、識別能力を向上することが可能となる。   Even in the above application examples other than face recognition, after determining the discriminating higher-order plane using a perceptron, using the Cullback-Liber divergence considering the variance, the data group in which the variance of the learning data in the category is different On the other hand, it is possible to improve the discrimination capability by resetting the discrimination higher-order plane to the optimum position.

なお、上記のパターン認識学習装置及びパターン認識装置の全部又は一部は、ハードウェア、ソフトウェア又はこれらの組合せにより実現することができる。また、上記のパターン認識学習方法及びパターン認識方法も、ハードウェア、ソフトウェア又はこれらに組合せにより実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。   Note that all or part of the pattern recognition learning device and the pattern recognition device described above can be realized by hardware, software, or a combination thereof. The pattern recognition learning method and the pattern recognition method described above can also be realized by hardware, software, or a combination thereof. Here, “realized by software” means realized by a computer reading and executing a program.

プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。   The program may be stored using various types of non-transitory computer readable media and supplied to a computer. Non-transitory computer readable media include various types of tangible storage media. Examples of non-transitory computer-readable media include magnetic recording media (for example, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (for example, magneto-optical disks), CD-ROMs (Read Only Memory), CD-ROMs. R, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (random access memory)). The program may also be supplied to the computer by various types of transitory computer readable media. Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。   A part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.

(付記1)
パターン認識を学習するためのパターン認識学習装置であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、
を含むことを特徴とするパターン認識学習装置。
(Appendix 1)
A pattern recognition learning device for learning pattern recognition,
A determination means for determining an identification function for identifying a category of each learning data from the learning data for pattern recognition;
Optimization means for optimizing the discriminant function in consideration of the dispersion characteristics of the learning data in the category;
A pattern recognition learning apparatus comprising:

(付記2)
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記1に記載のパターン認識学習装置。
(Appendix 2)
The optimization means moves the identification boundary so as to maximize the value of the identification ability evaluation function considering the variance of the distance from the classification boundary of the category given by the identification function to the learning data belonging to the category. The pattern recognition learning device according to Supplementary Note 1, which is characterized.

(付記3)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記2に記載のパターン認識学習装置。
(Appendix 3)
The pattern recognition learning device according to appendix 2, wherein a Cullback-Librer divergence considering the variance is used as the discrimination ability evaluation function.

(付記4)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記2に記載のパターン認識学習装置。
(Appendix 4)
3. The pattern recognition learning apparatus according to appendix 2, wherein an inverse number of a sum of Euclidean distances from an identification boundary of the category to learning data belonging to the category is used as the identification ability evaluation function.

(付記5)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記2〜4のいずれか1に記載のパターン認識学習装置。
(Appendix 5)
The optimization means determines another category that is closest to a specific category among the categories, a variance of a distance from an identification boundary of the specific category to learning data belonging to the specific category, and from the identification boundary The pattern according to any one of appendices 2 to 4, wherein the discrimination boundary is moved so as to maximize the value of the discrimination ability evaluation function in consideration of the dispersion of distances to learning data belonging to another category. Recognition learning device.

(付記6)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記2〜4のいずれか1に記載のパターン認識学習装置。
(Appendix 6)
The optimization means determines a predetermined number of different categories in order of the category closest to the specific category, and distributes the distance from the identification boundary of the specific category to the learning data belonging to the specific category. The identification boundary is moved so as to maximize the value of the identification ability evaluation function considering the variance of the distance from the identification boundary to the learning data belonging to the plurality of different categories. The pattern recognition learning device according to any one of the above.

(付記7)
前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記5又は6に記載のパターン認識学習装置。
(Appendix 7)
The pattern recognition according to claim 5 or 6, wherein the optimization unit determines proximity between categories based on a distance between a centroid of the specific category and a centroid of a category other than the specific category. Learning device.

(付記8)
前記最適化手段は、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記2〜7のいずれか1に記載のパターン認識学習装置。
(Appendix 8)
The pattern recognition learning according to any one of appendices 2 to 7, wherein the optimization means moves the identification boundary so that a value of the discrimination ability evaluation function is maximized based on a maximum gradient method. apparatus.

(付記9)
前記決定手段は、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記1〜8のいずれか1に記載のパターン認識学習装置。
(Appendix 9)
9. The pattern recognition learning apparatus according to any one of appendices 1 to 8, wherein the determining unit determines the discriminant function using a perceptron.

(付記10)
付記1〜9のいずれか1に記載のパターン認識学習装置と、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段と、
を含むことを特徴とするパターン認識装置。
(Appendix 10)
The pattern recognition learning device according to any one of appendices 1 to 9,
Pattern recognition means for performing pattern recognition of input data using a discrimination function optimized by the optimization means;
A pattern recognition apparatus comprising:

(付記11)
パターン認識を学習するパターン認識学習方法であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定ステップと、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、
を含むことを特徴とするパターン認識学習方法。
(Appendix 11)
A pattern recognition learning method for learning pattern recognition,
A determination step for determining an identification function for identifying a category of each learning data from the learning data for pattern recognition;
An optimization step of optimizing the discriminant function in consideration of the dispersion characteristics of the learning data in the category;
A pattern recognition learning method comprising:

(付記12)
前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記11に記載のパターン認識学習方法。
(Appendix 12)
In the optimization step, the identification boundary is moved so as to maximize the value of the identification ability evaluation function considering the dispersion of the distance from the classification boundary of the category given by the identification function to the learning data belonging to the category. The pattern recognition learning method according to Supplementary Note 11, which is a feature.

(付記13)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記12に記載のパターン認識学習方法。
(Appendix 13)
13. The pattern recognition learning method according to appendix 12, wherein a Cullback liber divergence considering the variance is used as the discrimination ability evaluation function.

(付記14)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記12に記載のパターン認識学習方法。
(Appendix 14)
13. The pattern recognition learning method according to appendix 12, wherein an inverse number of a sum of Euclidean distances from an identification boundary of the category to learning data belonging to the category is used as the identification ability evaluation function.

(付記15)
前記最適化ステップでは、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記12〜14のいずれか1に記載のパターン認識学習方法。
(Appendix 15)
In the optimization step, another category that is closest to a specific category among the categories is determined, a dispersion of a distance from an identification boundary of the specific category to learning data belonging to the specific category, and from the identification boundary, the The pattern according to any one of appendices 12 to 14, wherein the discrimination boundary is moved so as to maximize the value of the discrimination ability evaluation function in consideration of the dispersion of the distance to learning data belonging to another category. Cognitive learning method.

(付記16)
前記最適化ステップは、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記12〜14のいずれか1に記載のパターン認識学習方法。
(Appendix 16)
In the optimization step, a predetermined number of different categories are determined in order from the category closest to the specific category, and the distance from the identification boundary of the specific category to the learning data belonging to the specific category is determined. The identification boundary is moved so as to maximize the value of the identification ability evaluation function considering the dispersion of the distance from the identification boundary to the learning data belonging to the plurality of different categories. The pattern recognition learning method according to any one of the above.

(付記17)
前記最適化ステップでは、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記15又は16に記載のパターン認識学習方法。
(Appendix 17)
The pattern recognition according to claim 15 or 16, wherein, in the optimization step, proximity between categories is determined based on a distance between a centroid of the specific category and a centroid of a category other than the specific category. Learning method.

(付記18)
前記最適化ステップでは、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記12〜17のいずれか1に記載のパターン認識学習方法。
(Appendix 18)
The pattern recognition learning according to any one of appendices 12 to 17, wherein, in the optimization step, the discrimination boundary is moved so that the value of the discrimination ability evaluation function is maximized based on a maximum gradient method. Method.

(付記19)
前記決定ステップでは、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記11〜18のいずれか1に記載のパターン認識学習方法。
(Appendix 19)
The pattern recognition learning method according to any one of appendices 11 to 18, wherein in the determining step, the discriminant function is determined using a perceptron.

(付記20)
付記11〜19のいずれか1に記載のパターン認識学習方法に加え、
前記最適化ステップにより最適化された識別関数を用いて入力データのパターン認識を行うパターン認識ステップ、
を含むことを特徴とするパターン認識方法。
(Appendix 20)
In addition to the pattern recognition learning method according to any one of appendices 11 to 19,
A pattern recognition step for pattern recognition of input data using the discriminant function optimized in the optimization step;
A pattern recognition method comprising:

(付記21)
コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、
前記コンピュータを、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、
として機能させるためのプログラム。
(Appendix 21)
A program for causing a computer to function as a pattern recognition learning device for learning pattern recognition,
The computer,
A determining means for determining a discriminant function for identifying a category of each learning data from learning data for pattern recognition; and an optimizing means for optimizing the discriminant function in consideration of a dispersion characteristic of the learning data in the category,
Program to function as.

(付記22)
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記21に記載のプログラム。
(Appendix 22)
The optimization means moves the identification boundary so as to maximize the value of the identification ability evaluation function considering the variance of the distance from the classification boundary of the category given by the identification function to the learning data belonging to the category. The program according to appendix 21, which is characterized.

(付記23)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記22に記載のプログラム。
(Appendix 23)
23. The program according to appendix 22, wherein Cullback liber divergence considering the variance is used as the discrimination ability evaluation function.

(付記24)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記22に記載のプログラム。
(Appendix 24)
23. The program according to appendix 22, wherein a reciprocal number of a sum of Euclidean distances from an identification boundary of the category to learning data belonging to the category is used as the identification ability evaluation function.

(付記25)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記22〜24のいずれか1に記載のプログラム。
(Appendix 25)
The optimization means determines another category that is closest to a specific category among the categories, a variance of a distance from an identification boundary of the specific category to learning data belonging to the specific category, and from the identification boundary The program according to any one of appendices 22 to 24, wherein the identification boundary is moved so as to maximize the value of the discrimination ability evaluation function in consideration of the dispersion of distances to learning data belonging to another category. .

(付記26)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記22〜24のいずれか1に記載のプログラム。
(Appendix 26)
The optimization means determines a predetermined number of different categories in order of the category closest to the specific category, and distributes the distance from the identification boundary of the specific category to the learning data belonging to the specific category. Additional notes 22 to 24, wherein the identification boundary is moved so as to maximize the value of the identification ability evaluation function considering the dispersion of the distance from the identification boundary to the learning data belonging to the plurality of different categories. The program according to any one of the above.

(付記27)
前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記25又は26に記載のプログラム。
(Appendix 27)
27. The program according to appendix 25 or 26, wherein the optimization unit determines proximity between categories based on a distance between a centroid of the specific category and a centroid of a category other than the specific category.

(付記28)
前記最適化手段は、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記22〜27のいずれか1に記載のプログラム。
(Appendix 28)
The program according to any one of appendices 22 to 27, wherein the optimization means moves the identification boundary so that the value of the discrimination ability evaluation function is maximized based on a maximum gradient method.

(付記29)
前記決定手段は、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記21〜28のいずれか1に記載のプログラム。
(Appendix 29)
29. The program according to any one of appendices 21 to 28, wherein the determining means determines the discriminant function using a perceptron.

(付記30)
付記21〜29のいずれか1に記載のプログラムにおいて、
前記コンピュータを、更に、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段として機能させることを特徴とするプログラム。
(Appendix 30)
In the program according to any one of appendices 21 to 29,
Said computer further
A program that functions as a pattern recognition unit that performs pattern recognition of input data using a discrimination function optimized by the optimization unit.

本発明は画像認識、音声認識、文字認識などのパターン認識に利用できる。   The present invention can be used for pattern recognition such as image recognition, voice recognition, and character recognition.

100 パターン認識装置
110 データ入力部
120 データ処理部
122 パターン認識学習部
124 パターン認識部
130 データ出力部
140 記憶部
DESCRIPTION OF SYMBOLS 100 Pattern recognition apparatus 110 Data input part 120 Data processing part 122 Pattern recognition learning part 124 Pattern recognition part 130 Data output part
140 Storage unit

Claims (9)

パターン認識を学習するためのパターン認識学習装置であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、
を含み、
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするパターン認識学習装置。
A pattern recognition learning device for learning pattern recognition,
A determination means for determining an identification function for identifying a category of each learning data from the learning data for pattern recognition;
Optimization means for optimizing the discriminant function in consideration of the dispersion characteristics of the learning data in the category;
Including
The optimization means moves the identification boundary so as to maximize the value of the identification ability evaluation function considering the variance of the distance from the classification boundary of the category given by the identification function to the learning data belonging to the category. features and be Rupa turn recognition learning device.
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする請求項に記載のパターン認識学習装置。 The pattern recognition learning apparatus according to claim 1 , wherein a Cullback liber divergence considering the variance is used as the discrimination ability evaluation function. 前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする請求項に記載のパターン認識学習装置。 The pattern recognition learning apparatus according to claim 1 , wherein a reciprocal number of a sum of Euclidean distances from an identification boundary of the category to learning data belonging to the category is used as the identification ability evaluation function. 前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする請求項のいずれか1項に記載のパターン認識学習装置。 The optimization means determines another category that is closest to a specific category among the categories, a variance of a distance from an identification boundary of the specific category to learning data belonging to the specific category, and from the identification boundary according to any one of claims 1 to 3, characterized in that moving the identifying boundary to maximize the value of the identification performance evaluation function considering the variance and the distance to the training data belonging to a different category Pattern recognition learning device. 前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする請求項のいずれか1項に記載のパターン認識学習装置。 The optimization means determines a predetermined number of different categories in order of the category closest to the specific category, and distributes the distance from the identification boundary of the specific category to the learning data belonging to the specific category. , claim 1, characterized in that moving the identifying boundary to maximize the value of the identification performance evaluation function considering the variance and the distance to the training data belonging to the plurality of different categories from the decision boundary ~ pattern recognition learning device according to any one of 3. 前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする請求項又はに記載のパターン認識学習装置。 Said optimization means, the pattern according to claim 4 or 5, characterized in that determining the closeness between categories based on the distance between the specific category of centroid and the centroid of a particular category of non Categories Recognition learning device. 請求項1〜のいずれか1項に記載のパターン認識学習装置と、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段と、
を含むことを特徴とするパターン認識装置。
The pattern recognition learning device according to any one of claims 1 to 6 ,
Pattern recognition means for performing pattern recognition of input data using a discrimination function optimized by the optimization means;
A pattern recognition apparatus comprising:
パターン認識の識別関数を決定する決定手段と、前記識別関数を最適化する最適化手段とを有するパターン認識学習装置におけるパターン認識を学習するパターン認識学習方法であって、
前記決定手段において、パターン認識の学習データから各学習データのカテゴリを識別する前記識別関数を決定する決定ステップと、
前記最適化手段において、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、
を含み、
前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするパターン認識学習方法。
A pattern recognition learning method for learning pattern recognition in a pattern recognition learning apparatus having a determination means for determining a discrimination function for pattern recognition and an optimization means for optimizing the discrimination function ,
In the determination unit, a determining step of determining the identification function of identifying a category of the learning data from the learning data pattern recognition,
An optimization step of optimizing the discriminant function in consideration of a dispersion characteristic of learning data in the category in the optimization means ;
Only including,
In the optimization step, the identification boundary is moved so as to maximize the value of the identification ability evaluation function considering the dispersion of the distance from the classification boundary of the category given by the identification function to the learning data belonging to the category. Characteristic pattern recognition learning method.
コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、
前記コンピュータを、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、
として機能させ
前記最適化手段により、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするプログラム。
A program for causing a computer to function as a pattern recognition learning device for learning pattern recognition,
The computer,
A determining means for determining a discriminant function for identifying a category of each learning data from learning data for pattern recognition; and an optimizing means for optimizing the discriminant function in consideration of a dispersion characteristic of the learning data in the category,
To function as,
Moving the discriminating boundary by the optimizing means so as to maximize the value of the discriminating ability evaluation function considering the variance of the distance from the discriminating boundary of the category given by the discriminant function to the learning data belonging to the category A featured program.
JP2013143460A 2013-07-09 2013-07-09 Pattern recognition and learning method thereof Active JP5725576B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013143460A JP5725576B2 (en) 2013-07-09 2013-07-09 Pattern recognition and learning method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013143460A JP5725576B2 (en) 2013-07-09 2013-07-09 Pattern recognition and learning method thereof

Publications (2)

Publication Number Publication Date
JP2015018312A JP2015018312A (en) 2015-01-29
JP5725576B2 true JP5725576B2 (en) 2015-05-27

Family

ID=52439268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013143460A Active JP5725576B2 (en) 2013-07-09 2013-07-09 Pattern recognition and learning method thereof

Country Status (1)

Country Link
JP (1) JP5725576B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7198432B2 (en) * 2019-01-30 2023-01-04 京セラドキュメントソリューションズ株式会社 Image processing device, image reading device, image forming device, image processing method, and image processing program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005198970A (en) * 2004-01-19 2005-07-28 Konica Minolta Medical & Graphic Inc Medical image processor

Also Published As

Publication number Publication date
JP2015018312A (en) 2015-01-29

Similar Documents

Publication Publication Date Title
JP6781415B2 (en) Neural network learning device, method, program, and pattern recognition device
CN110362677B (en) Text data category identification method and device, storage medium and computer equipment
US11341770B2 (en) Facial image identification system, identifier generation device, identification device, image identification system, and identification system
US9002101B2 (en) Recognition device, recognition method, and computer program product
JP5214760B2 (en) Learning apparatus, method and program
US9600745B2 (en) Image recognition system, image recognition method, and non-transitory computer readable medium storing image recognition program
JP2019028839A (en) Classifier, method for learning of classifier, and method for classification by classifier
US11126827B2 (en) Method and system for image identification
US20240185604A1 (en) System and method for predicting formation in sports
JP6003492B2 (en) Character recognition device and program
US11449706B2 (en) Information processing method and information processing system
KR20160011916A (en) Method and apparatus of identifying user using face recognition
JPWO2008059624A1 (en) Two-class classification prediction model creation method, classification prediction model creation program, and two-class classification prediction model creation apparatus
JP6128910B2 (en) Learning device, learning method and program
KR20170108339A (en) Method for recognizing plural object in image
JPWO2015146113A1 (en) Identification dictionary learning system, identification dictionary learning method, and identification dictionary learning program
WO2021111622A1 (en) Parameter decision device, parameter decision method, and non-transitory computer-readable medium
CN108615006A (en) Method and apparatus for output information
KR101805437B1 (en) Speaker verification method using background speaker data and speaker verification system
CN113947209A (en) Integrated learning method, system and storage medium based on cloud edge cooperation
JP2015225410A (en) Recognition device, method and program
CN113762005B (en) Feature selection model training and object classification methods, devices, equipment and media
US10007842B2 (en) Same person determination device and method, and control program therefor
US10943099B2 (en) Method and system for classifying an input data set using multiple data representation source modes
JP5725576B2 (en) Pattern recognition and learning method thereof

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150326

R150 Certificate of patent or registration of utility model

Ref document number: 5725576

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150