JPS6355686A - Pattern recognizing method - Google Patents

Pattern recognizing method

Info

Publication number
JPS6355686A
JPS6355686A JP61199066A JP19906686A JPS6355686A JP S6355686 A JPS6355686 A JP S6355686A JP 61199066 A JP61199066 A JP 61199066A JP 19906686 A JP19906686 A JP 19906686A JP S6355686 A JPS6355686 A JP S6355686A
Authority
JP
Japan
Prior art keywords
pattern
categories
distance
category
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61199066A
Other languages
Japanese (ja)
Inventor
Yoshihiko Hamamoto
義彦 浜本
Yasumasa Murai
村井 康眞
Toshifumi Yamauchi
山内 俊史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61199066A priority Critical patent/JPS6355686A/en
Publication of JPS6355686A publication Critical patent/JPS6355686A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To highly accurately recognize resembling characters as well by employing a suitable identification processing corresponding to the presence/ absence of approaching to other categories in terms of distance. CONSTITUTION:An input pattern is converted to a binary pattern by a binarization part 1, subjected to the processings of noise removal, normalization, etc., in a pre-processing part 2, and its size of image is converted by a blurring part 3. In a matching part 4, the matching between the input pattern and a standard pattern from a dictionary 7 is executed, and the distance of the input pattern from the standard patterns of respective categories is calculated. Based on thus calculated distances, a distance checking part 5 detects such category classes that their varied distance-difference of category are smaller than a prescribed threshold, as resembling character classes to transfer them to a pair decision part 8. If the varied distances between categories are larger than the prescribed threshold, the result of the pattern matching is outputted to a decision part 6 as a recognition result. The pair decision part 8 identifies the resembling characters by using the learning data of category as referring with a pair decision dictionary 9.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字や音声の入力パターンを高精度で認識で
きる実用性の高いパターン認識方法に関するものである
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a highly practical pattern recognition method that can recognize input patterns of characters and sounds with high accuracy.

〔従来の技術〕[Conventional technology]

パターン認識方法の従来例の1つにパターンマツチング
法がある。これは、予め各カテゴリーに対して学習デー
タを用いて作成された標準パターンと入力パターンとの
間で距離計算を行ない、最小距離(最大類似度)を有す
るカテゴリーを認識結果とするもので、かすれ文字等に
有用な方法である。
One of the conventional pattern recognition methods is a pattern matching method. This method calculates the distance between the input pattern and a standard pattern created in advance using learning data for each category, and uses the category with the minimum distance (maximum similarity) as the recognition result. This method is useful for characters, etc.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

しかしながら、パターンマツチング法では、標準パター
ンを作成する際、一般に、他カテゴリーとの関係を考慮
に入れておらず、また、類似文字の距離の接近により識
別不能となるいわゆるリジェクトが発生するという問題
があった。
However, pattern matching methods generally do not take into account relationships with other categories when creating standard patterns, and there is also the problem that so-called rejects occur where similar characters become indistinguishable due to their proximity. was there.

〔問題点を解決するための手段〕[Means for solving problems]

このような問題点を解決するために本発明は、パターン
マツチングの結果により距離チェ・ツクを行ない、他カ
テゴリーとの距離の接近がない場合はパターンマツチン
グの結果を認識結果とし、他カテゴリーとの距離の接近
がある場合は接近するカテゴリーの組を類似文字の組と
して検出し、予め学習データを用いて作成しておいた対
判定辞書により人カバターンがどのカテゴリーであるか
の識別を行ない、すべての識別で否定されないカテゴリ
ーを認識結果とするようにしたものである。
In order to solve such problems, the present invention performs a distance check based on the result of pattern matching, and when there is no closeness to other categories, the result of pattern matching is used as the recognition result, and the result of pattern matching is used as the recognition result. If the distance between the character and character is approaching, the group of categories approaching is detected as a group of similar characters, and the category to which the human cover turn belongs is identified using a pair judgment dictionary created in advance using learning data. , the recognition result is a category that is not denied in all identifications.

〔作用〕[Effect]

本発明においては、類似文字に対しても高精度の認識を
行なうことができる。
In the present invention, even similar characters can be recognized with high precision.

〔実施例〕〔Example〕

第1図は、本発明に係わるパターン認識方法の一実施例
を説明するためのパターン認識系を示す系統図である。
FIG. 1 is a system diagram showing a pattern recognition system for explaining an embodiment of the pattern recognition method according to the present invention.

入力パターンは2値化部1で多値パターンから2値パタ
ーンへ変換され、前処理部2でノイズ除去・正規化等の
処理が施され、ボカシ部3で例えばガウス型フィルタに
より入力パターンの画像サイズを変換する。予め学習デ
ータを用いて各カテゴリーの標準パターンを作成し、得
られた標準パターンを辞書7に格納しておく。マツチン
グ部4では、入力パターンと標準パターンとのマツチン
グが行なわれ、各カテゴリーの標準パターンに対する入
力パターンの距離が計算される。
The input pattern is converted from a multi-value pattern to a binary pattern in the binarization unit 1, subjected to processing such as noise removal and normalization in the pre-processing unit 2, and the image of the input pattern is converted into an image by a Gaussian filter in the blurring unit 3. Convert size. A standard pattern for each category is created in advance using learning data, and the obtained standard pattern is stored in the dictionary 7. The matching section 4 performs matching between the input pattern and the standard pattern, and calculates the distance of the input pattern to the standard pattern of each category.

前記距離を基に、距離チェック部5で、相異なるカテゴ
リーの距離差が予め定めておいた闇値より小さいカテゴ
リーの組を類似文字の組として検出し、対判定部8へ転
送する。相異なるカテゴリー間の距離差が上記闇値以上
であれば、パターンマツチングの結果を認識結果として
判定部6へ出力する。
Based on the distance, the distance checking unit 5 detects a set of categories in which the distance difference between different categories is smaller than a predetermined darkness value as a set of similar characters, and transfers the detected set to the pair determining unit 8. If the distance difference between the different categories is equal to or greater than the darkness value, the pattern matching result is output to the determination section 6 as the recognition result.

対判定部8では、予め類似文字の組として検出されたカ
テゴリーの学習データを用いてオフライン時に対判定辞
書作成部10で作成しておいた対判定辞書9により類似
文字間の識別を行なう。判定部6では、入力パターンの
属するカテゴリーが決定される。
The pair determination section 8 discriminates between similar characters using the pair determination dictionary 9, which has been created by the pair determination dictionary creation section 10 during off-line using learning data of categories detected in advance as sets of similar characters. The determining unit 6 determines the category to which the input pattern belongs.

第1図の構成のうち対判定部8および対判定辞書作成部
10以外の部分は公知の技術から比較的容易に構成でき
るので説明を省略し、対判定部8および対判定辞書作成
部10について詳細に説明する。
Of the configuration shown in FIG. 1, the parts other than the pair determination section 8 and the pair determination dictionary creation section 10 can be configured relatively easily using known techniques, so the explanation will be omitted. Explain in detail.

まず、対判定辞書作成部10について説明する。First, the pair determination dictionary creation section 10 will be explained.

第2図は、対判定辞書作成部10の詳細な構成を示す系
統図である。以下、各処理について説明する。カテゴリ
ーiとカテゴリーj (i≠j)とが類似文字の組とし
て距離チェック部5より送られてきたとする。クラス内
共分散行列計算部11では、次式によりクラス内共分散
行列Σ8を求める。
FIG. 2 is a system diagram showing the detailed configuration of the pair determination dictionary creation section 10. Each process will be explained below. Assume that category i and category j (i≠j) are sent from the distance check unit 5 as a set of similar characters. The intra-class covariance matrix calculation unit 11 calculates the intra-class covariance matrix Σ8 using the following equation.

Σw= (N、Σ<+ NjΣi) / (N1+Nj
) ・・−・(1)ここで、Σi、Σjはそれぞれカテ
ゴリーi、jの共分散行列で、N、、 NJはそれぞれ
カテゴリーi、jの学習データ数である。
Σw= (N, Σ<+ NjΣi) / (N1+Nj
) ... (1) Here, Σi and Σj are the covariance matrices of categories i and j, respectively, and N,, NJ are the numbers of learning data of categories i and j, respectively.

クラス間共分散行列計算部12では、次式によりクラス
間共分散行列Σ8を求める。
The inter-class covariance matrix calculation unit 12 calculates the inter-class covariance matrix Σ8 using the following equation.

Σm= (uニーJ」)(#ニーJユ)T・・・・(2
)ここで、Jユ、LLはそれぞれカテゴリーi、jの平
均ベクトルで、Tは転置を表わす。
Σm= (u knee J") (#nee J yu) T... (2
) Here, Jyu and LL are the average vectors of categories i and j, respectively, and T represents transposition.

判別ベクトル計算部13では、判別分析により判別ベク
トル、W−を求める。判別分析は、相異なるカテゴリー
を識別する上で有用な特徴を抽出する手法である。判別
分析の評価基準J (W)を次式で定義する。
The discriminant vector calculation unit 13 calculates a discriminant vector, W-, by discriminant analysis. Discriminant analysis is a method for extracting features useful in distinguishing between different categories. The evaluation criterion J (W) for discriminant analysis is defined by the following equation.

J (異)=異7ΣmW/ (wTΣ、w)、、、、(
31J (W)を最大とする判別ベクトル!は最大識別
能力を有するベクトルで、次式により与えられる。
J (different) = different7ΣmW/ (wTΣ, w),,,,(
Discrimination vector that maximizes 31J (W)! is the vector with the maximum discriminative ability, and is given by the following equation.

先=Σ8(L、−ム)・・・・(4) ここで、αをスカラー量としたときのJ(αW)=J(
光)より、J (W)は、W−の大きさに対し不変であ
るので、異を次式により正規化する。
Ahead = Σ8(L, -m) (4) Here, J (αW) = J( when α is a scalar quantity)
Since J (W) is invariant to the magnitude of W-, the difference is normalized using the following equation.

!=Σ%、l(ムーム)/11Σ賀ムーム)11・・・
・(5)ここでIt x Ifはベクトル五〇ノルムで
ある。
! =Σ%, l (moum)/11Σgamoum) 11...
・(5) Here, It x If is the vector 50 norm.

闇値設定部14では、判別ベクトル計算部13で得られ
たベクトル立上にカテゴリーi、jの全学習データを射
影して一次元データ分布を形成し、−次元データ分布上
で誤り率が最小となるように閾値W0を設定する。
The dark value setting unit 14 projects all learning data of categories i and j onto the vector obtained by the discriminant vector calculation unit 13 to form a one-dimensional data distribution, and calculates the error rate to be the minimum on the -dimensional data distribution. The threshold value W0 is set so that.

例として第3図に二次元空間(xi、x2)内のカテゴ
リーi、jに対して得られた判別ベクトル、W−を示し
、第4図に判別ベクトルW、上に2つのカテゴリーの学
習データを射影することにより形成された一次元データ
分布上での閾値w0を示す。
As an example, Fig. 3 shows the discriminant vectors W- obtained for categories i and j in the two-dimensional space (xi, x2), Fig. 4 shows the discriminant vector W, and the training data of the two categories are shown above. The threshold value w0 on the one-dimensional data distribution formed by projecting is shown.

第4図においては、入力パターン五と判別へクトル豊と
の内積値異丁五が閾値w0より小さい場合は入力パター
ン玉はカテゴリーiに属すと決定され、閾値w0より大
きい場合は入力パターンエはカテゴリーjに属すと決定
される。
In FIG. 4, if the inner product value of the input pattern 5 and the discrimination Hector Yutaka is smaller than the threshold w0, the input pattern ball is determined to belong to category i, and if it is larger than the threshold w0, the input pattern 5 is determined to belong to the category i. It is determined that it belongs to category j.

次に、例として数字・カタカナ混在の認識系を用いて対
判定辞書9の構成を説明する。例えば、1とノ、7とり
、コとワ、工とユが類似文字の組として登録されたとす
る。このとき対判定辞書9の構成は表のようになる。
Next, the configuration of the pair judgment dictionary 9 will be explained using a recognition system that uses mixed numbers and katakana as an example. For example, assume that 1 and ノ, 7-tori, ko and wa, and ko and yu are registered as a set of similar characters. At this time, the configuration of the pair judgment dictionary 9 is as shown in the table.

カテゴリー1とノの組に対し、Wl/は1とノとを識別
する判別ベクトルで、w、1ノはそれの闇値である。他
の類似文字の組に対しても同様に判別ベクトルと閾値と
が格納されている。
For the pair of categories 1 and 2, Wl/ is a discrimination vector that discriminates between 1 and 1, and w and 1 are their darkness values. Discrimination vectors and threshold values are similarly stored for other similar character sets.

最後に対判定部8について説明する。対判定部8では、
距離チェック部5で検出された類似文字の組が対判定辞
書9内に登録されていた場合、その判別ベクトル立と入
力パターン五との内積演算が行なわれ、次に、内積値、
菫T五To閾値W0との大小関係により、カテゴリーi
t  jのどちらのカテゴリーのパターン”であるか識
別される。その際、入力パターンが属さないと判定され
たカテゴリーは否定される。一般に、複数個の類似文字
の組が登1景されている場合、すべての識別で否定され
ないカテゴリーが認識結果として出力される。
Finally, the pair determination section 8 will be explained. In the pair determination section 8,
If the set of similar characters detected by the distance check unit 5 is registered in the pair judgment dictionary 9, an inner product calculation of the discrimination vector set and the input pattern 5 is performed, and then the inner product value,
Depending on the size relationship with SumitomoT5To threshold W0
It is identified to which category of tj the pattern belongs.At this time, the category to which it is determined that the input pattern does not belong is rejected.In general, multiple sets of similar characters are registered. In this case, categories that are not denied in all identifications are output as recognition results.

このことを表の対判定辞書9の構成を用いて具体的に説
明する。正解が7であるパターンが入力され、パターン
マツチングにより計算された距離に対し、距離チェック
部5で7.り、ワの距離が接近しているとして出力され
、対判定部8にパターンが入力されたとする。表に示す
ように、対判定辞書9には7とり、7とワという2つの
類似文字の組が登録されている。まず、入力パターンが
7とりのいずれであるかということが1.■、とWoq
  とを用いて識別され、続いて7とワのいずれである
かということが、W−1とwo、  とを用いて識別さ
れる。このとき、7とりでりが否定され、7とワでワが
否定されたときだけ、7が認識出力として出力される。
This will be specifically explained using the configuration of the table pair judgment dictionary 9. A pattern whose correct answer is 7 is input, and the distance check unit 5 calculates 7 for the distance calculated by pattern matching. Assume that the pattern is output as being close to the wa and the pattern is input to the pair determination unit 8. As shown in the table, two sets of similar characters, 7 and wa, are registered in the pair judgment dictionary 9. First, the input pattern is 1. ■, and Woq
Then, whether it is 7 or wa is identified using W-1 and wo. At this time, only when 7 is negated and 7 and wa are negated, 7 is output as a recognition output.

もし、7とりでりが否定され、7とワで7が否定された
ならば、7は認識結果として出力されない。本実施例の
場合、対判定部8が積和演算主体であるので、積和演算
型の汎用パターンマツチング回路により対判定部8を容
易に構成できるという利点がある。
If 7 is negated and 7 and wa are negated, 7 will not be output as a recognition result. In the case of this embodiment, since the pair determining section 8 mainly performs the product-sum operation, there is an advantage that the pair determining section 8 can be easily configured with a general-purpose pattern matching circuit of the product-sum operation type.

本実施例では、第4図に示すように、1つの閾値W0に
より入力パターンが2つのカテゴリーのうちのいずれに
入るかという識別を行なったが、誤読率低減のため、2
つに闇値を用いて一次元データ分布を3つの領域に分割
しリジェクHI域を設定することも可能である。
In this embodiment, as shown in FIG. 4, one threshold value W0 is used to identify which of two categories an input pattern falls into.
It is also possible to divide the one-dimensional data distribution into three regions using the darkness value and set a reject HI region.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、他カテゴリーとの距離の
接近がない場合はパターンマツチングの結果を認識結果
とし、他カテゴリーとの距離の接近がある場合は接近す
るカテゴリーの組を類似文字の組として検出し、対判定
辞書により入力パターンがどのカテゴリーであるかの識
別を行ない、すべての識別で否定されないカテゴリーを
認識結果とすることにより、類似文字の距離が接近して
も識別不能となることがなくなり、高精度のパターン認
識を行なうことができる効果がある。
As explained above, the present invention uses the result of pattern matching as the recognition result when the distance from other categories is not close, and when the distance from other categories is close, the set of approaching categories is used as the recognition result. By detecting them as a pair, identifying which category the input pattern belongs to using a pair judgment dictionary, and using the category that is not denied in all identifications as the recognition result, it becomes impossible to distinguish similar characters even if they are close to each other. This has the effect of making it possible to perform highly accurate pattern recognition.

また、類似文字の組を増加すれば、パターン認識を更に
高精度のものとすることができる効果がある。
Furthermore, increasing the number of sets of similar characters has the effect of making pattern recognition even more accurate.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明に係わるパターン認識方法の一実施例を
説明するためのパターン認識系を示す系統図、第2図は
第1図のパターン認識系を構成する対判定辞書作成部の
構成を示す系統図、第3図は二次元空間内の2つのカテ
ゴリーに対して得られた判別ベクトル−■を示す図表、
第4図は判別ベクトル立上に射影して得られた一次元デ
ータ分布と閾値W0とを示す図表である。 1・・・2値化部、2・・・前処理部、3・・・ボカシ
部、4・・・マツチング部、5・・・距離チェック部、
6・・・判定部、7・・・辞書、8・・・対判定部、9
・・・対判定辞書、10・・・対判定辞書作成部、11
・・・クラス内共分散行列計算部、12・・・クラス間
共分散行列計算部、13・・・判別ベクトル計算部、1
4・・・闇値設定部。
FIG. 1 is a system diagram showing a pattern recognition system for explaining one embodiment of the pattern recognition method according to the present invention, and FIG. Figure 3 is a diagram showing the discriminant vectors -■ obtained for two categories in a two-dimensional space.
FIG. 4 is a chart showing the one-dimensional data distribution obtained by projecting onto the discriminant vector and the threshold value W0. 1... Binarization section, 2... Preprocessing section, 3... Blurring section, 4... Matching section, 5... Distance check section,
6... Judgment section, 7... Dictionary, 8... Pair judgment section, 9
... Pair judgment dictionary, 10... Pair judgment dictionary creation unit, 11
... Intra-class covariance matrix calculation unit, 12... Inter-class covariance matrix calculation unit, 13... Discriminant vector calculation unit, 1
4...Dark value setting section.

Claims (1)

【特許請求の範囲】[Claims] パターンマッチングの結果により距離チェックを行ない
、他カテゴリーとの距離の接近がない場合はパターンマ
ッチングの結果を認識結果とし、他カテゴリーとの距離
の接近がある場合は接近するカテゴリーの組を類似文字
の組として検出し、予め学習データを用いて作成してお
いた対判定辞書により入力パターンがどのカテゴリーで
あるかの識別を行ない、すべての識別で否定されないカ
テゴリーを認識結果とすることを特徴とするパターン認
識方法。
A distance check is performed based on the result of pattern matching. If the distance to other categories is not close, the result of pattern matching is used as the recognition result, and if the distance to other categories is close to each other, the set of approaching categories is used as a recognition result. It is characterized by detecting the input pattern as a pair, identifying which category the input pattern belongs to using a pair judgment dictionary created in advance using learning data, and taking the category that is not denied by all identifications as the recognition result. Pattern recognition method.
JP61199066A 1986-08-27 1986-08-27 Pattern recognizing method Pending JPS6355686A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61199066A JPS6355686A (en) 1986-08-27 1986-08-27 Pattern recognizing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61199066A JPS6355686A (en) 1986-08-27 1986-08-27 Pattern recognizing method

Publications (1)

Publication Number Publication Date
JPS6355686A true JPS6355686A (en) 1988-03-10

Family

ID=16401541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61199066A Pending JPS6355686A (en) 1986-08-27 1986-08-27 Pattern recognizing method

Country Status (1)

Country Link
JP (1) JPS6355686A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03217996A (en) * 1990-01-12 1991-09-25 Internatl Business Mach Corp <Ibm> Method of discriminating handwritten character

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58207183A (en) * 1982-05-27 1983-12-02 Nec Corp Character discriminating system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58207183A (en) * 1982-05-27 1983-12-02 Nec Corp Character discriminating system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03217996A (en) * 1990-01-12 1991-09-25 Internatl Business Mach Corp <Ibm> Method of discriminating handwritten character

Similar Documents

Publication Publication Date Title
Ismail et al. Off-line Arabic signature recognition and verification
Besbes et al. Multimodal biometric system based on fingerprint identification and iris recognition
Jain et al. Deformable matching of hand shapes for user verification
Coetzer et al. Offline signature verification using the discrete radon transform and a hidden Markov model
Arora et al. Recognition of non-compound handwritten devnagari characters using a combination of mlp and minimum edit distance
US3755780A (en) Method for recognizing characters
EP0436819B1 (en) Handwriting recognition employing pairwise discriminant measures
CN101408929A (en) Multiple-formwork human face registering method and apparatus for human face recognition system
Ismail et al. An efficient off line signature identification method based on fourier descriptor and chain codes
CN110826408A (en) Face recognition method by regional feature extraction
Fernando et al. Novel approach to use HU moments with image processing techniques for real time sign language communication
Upadhyay et al. A review on different facial feature extraction methods for face emotions recognition system
Paul et al. Component-based face recognition using statistical pattern matching analysis
Han et al. Off-line cursive handwriting segmentation
Toh Fingerprint and speaker verification decisions fusion
Bulugu et al. Higher-order local autocorrelation feature extraction methodology for hand gestures recognition
JPS6355686A (en) Pattern recognizing method
Aravinth et al. A novel feature extraction techniques for multimodal score fusion using density based gaussian mixture model approach
Sharma et al. Multimodal biometric system fusion using fingerprint and face with fuzzy logic
Tariq et al. An automated system for fingerprint classification using singular points for biometric security
Peng et al. A score level fusion method on fingerprint and finger vein
Xu et al. Coin recognition method based on SIFT algorithm
CN111428670A (en) Face detection method, face detection device, storage medium and equipment
Javed et al. Computerized system for fingerprint classification using singular points
Tutsoy et al. Analysis of facial characteristics