JP2923295B2 - Pattern identification processing method - Google Patents

Pattern identification processing method

Info

Publication number
JP2923295B2
JP2923295B2 JP63264458A JP26445888A JP2923295B2 JP 2923295 B2 JP2923295 B2 JP 2923295B2 JP 63264458 A JP63264458 A JP 63264458A JP 26445888 A JP26445888 A JP 26445888A JP 2923295 B2 JP2923295 B2 JP 2923295B2
Authority
JP
Japan
Prior art keywords
identification
pattern
recognition
category
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63264458A
Other languages
Japanese (ja)
Other versions
JPH02110795A (en
Inventor
洋 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63264458A priority Critical patent/JP2923295B2/en
Publication of JPH02110795A publication Critical patent/JPH02110795A/en
Application granted granted Critical
Publication of JP2923295B2 publication Critical patent/JP2923295B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔概要〕 文字,図形,および音声等のパターン認識装置におけ
るパターン同定処理方式に関し, 人間が見ても一意に決定出来ない類似パターンは何れ
も同順位の認識結果として得るようにして, 後の処理において入力パターンの規則性等を考慮して
一意に決定することを可能にし,正確なパターン認識を
行うことを目的とし, 入力パターンに同定条件を適用し認識結果を求めるパ
ターン認識装置において,入力パターン中の所定の特徴
を同定条件として用いるとともに,同定条件の判定結果
に,「同定対象カテゴリと共に特定の別カテゴリに属す
る」なる同定種別を設け,入力パターンに同定条件を適
用した結果として上記同定種別が得られた場合,認識結
果の同定対象カテゴリと特定の別カテゴリとを同一順位
の認識結果とするよう構成した。
DETAILED DESCRIPTION OF THE INVENTION [Overview] Regarding a pattern identification processing method in a pattern recognition apparatus for characters, figures, voices, etc., any similar patterns that cannot be uniquely determined even by humans are obtained as recognition results of the same rank. In this way, it is possible to make a unique decision taking into account the regularity of the input pattern, etc. in the subsequent processing, and aim to perform accurate pattern recognition. Apply the identification conditions to the input pattern and obtain the recognition result. In the pattern recognition device, a predetermined feature in the input pattern is used as an identification condition, and an identification type “belongs to a specific category together with the category to be identified” is provided in the determination result of the identification condition. If the above identification type is obtained as a result of application, the identification target category of the recognition result and a specific different category have the same rank. It was adapted to the identification result.

〔産業上の利用分野〕[Industrial applications]

本発明は文字,図形及び音声等のパターン認識装置に
おける同定処理方式に関する。
The present invention relates to an identification processing method in a pattern recognition device for characters, figures, sounds, and the like.

パターン認識装置は文字(手書き文字を含む)や,図
形等の視覚的なパターンや,音声等の可聴的なパターン
の認識に用いられる。
The pattern recognition device is used for recognition of characters (including handwritten characters), visual patterns such as figures, and audible patterns such as voice.

一般に,パターン認識装置は認識候補を出力する大分
類部と該認識候補を入力として認識結果を出力する同定
部から構成され,年々,性能が向上してきている。
In general, a pattern recognition apparatus is composed of a large classification unit that outputs recognition candidates and an identification unit that outputs recognition results using the recognition candidates as input, and the performance is improving year by year.

しかし,パターン認識装置において類似するパターン
の文字等を誤って認識結果とする場合がまだ多くあり,
類似パターンに対する同定性能の向上が強く要求されて
いる。人間が見た場合いづれとも認識できないような曖
昧なパターンに対してはいずれとも認識結果を出さず曖
昧である旨をそのまま残しておく認識自由度の高いより
人間に近い性能も要求されている。
However, there are still many cases where characters of similar patterns are mistakenly used as recognition results in a pattern recognition device.
There is a strong demand for improved identification performance for similar patterns. For an ambiguous pattern that cannot be recognized when viewed by a human, there is also a demand for a performance that has a high degree of freedom of recognition and that is closer to that of a human, in which no recognition result is output and the fact that it is ambiguous is left as it is.

本発明は,このような要求に応えるための改良された
同定処理方式を提供する。
The present invention provides an improved identification processing method to meet such a demand.

〔従来の技術〕[Conventional technology]

第6図に,従来のパターン認識装置の構成を示す。図
示されたパターン認識装置は,パターン入力1,大分類部
2,認識対象入力3,同定部4,認識結果出力5より構成され
る。
FIG. 6 shows the configuration of a conventional pattern recognition device. The pattern recognition device shown is a pattern input 1, a large classification unit
2, a recognition target input 3, an identification unit 4, and a recognition result output 5.

また同定部4内には条件判定の出力論理がフローで示
されている。
In the identification unit 4, the output logic of the condition determination is shown by a flow.

次に,第6図を参照して,従来のパターン認識装置の
動作を説明する。
Next, the operation of the conventional pattern recognition device will be described with reference to FIG.

認識すべきパターンはパターン入力1に入力される。 The pattern to be recognized is input to pattern input 1.

認識対象入力3からは認識対象の種別,例えば,ひら
がな,漢字,アルファベット,カタカナ,数字,記号等
の認識すべきパターンの群種別に関する情報が入力され
る。
From the recognition target input 3, information on the type of the recognition target, for example, the group type of the pattern to be recognized, such as hiragana, kanji, alphabet, katakana, numbers, and symbols, is input.

パターン入力1及び認識対象入力3の情報は大分類部
2に入力される。大分類部2は,認識候補を求めて内蔵
している辞書を用いおおまかなパターン認識(入力パタ
ーンの特徴を表すデータと辞書のデータを比較する等の
公知の技術による精度の低い認識)を行い,ある程度以
上辞書のパターンと近似している(公知のDP法等により
入力パターンと辞書のパターンの距離が一定の範囲内で
ある)とそれを認識候補として絞り,複数個の認識候補
を得る。
Information on the pattern input 1 and the recognition target input 3 is input to the large classification unit 2. The large classification unit 2 performs rough pattern recognition (low-precision recognition using a known technique such as comparing data representing the characteristics of an input pattern with dictionary data) using a built-in dictionary for recognition candidates. If the pattern is more or less approximate to the dictionary pattern (the distance between the input pattern and the dictionary pattern is within a certain range by a well-known DP method or the like), it is narrowed down as a recognition candidate to obtain a plurality of recognition candidates.

大分類部2で得られた認識候補は,認識される確率の
高い順位を付して同定部4に入力される。同定部4では
認識候補についてそれに付随した同定条件を用いて詳細
な同定処理を行い,認識結果出力5を得る。
Recognition candidates obtained by the large classification unit 2 are input to the identification unit 4 with an order of high recognition probability. The identification unit 4 performs a detailed identification process on the recognition candidate using the identification conditions attached thereto, and obtains a recognition result output 5.

次に,第7図の手書きパターンの例を用いて従来のパ
ターン認識方式を具立的に説明する。
Next, the conventional pattern recognition method will be described in detail using the example of the handwritten pattern in FIG.

パターン入力1は大分類部2に送られる。大分類部2
は認識対象入力3の情報を参照して第1順位「ナ」,第
2順位「十(漢字)」を認識する。
The pattern input 1 is sent to the large classification unit 2. Major Classification Division 2
Recognizes the first rank “na” and the second rank “ten (kanji)” with reference to the information of the recognition target input 3.

第7図の手書きパターンを同定する条件の1例を第8
図及び第9図に示す。この同定条件は,2画目の曲がり度
により判定するものである。ここで,パターンは第2
画目の曲がり度がS1より小さいものであり,パターン
は第7図の入力パターンである。パターンは曲がり度
Bが第7図の入力パターンより大きい場合である。従来
の同定条件は,曲がり度Bに対し, 曲がり度B<閾値S1の時,「入力パターンは,
「ナ」に属さない。」 閾値S1≦曲がり度Bの時,「入力パターンは,
「ナ」に属する。」 の2つの同定種別よりなる。
An example of the condition for identifying the handwritten pattern in FIG.
This is shown in FIG. 9 and FIG. The identification condition is determined based on the degree of curvature of the second stroke. Here, the pattern is
The degree of curvature of the stroke is smaller than S1, and the pattern is the input pattern of FIG. The pattern is a case where the degree of curvature B is larger than the input pattern of FIG. The conventional identification condition is as follows: When the degree of curvature B is smaller than the threshold value S1, the input pattern is
Does not belong to "na". When the threshold value S1 ≦ the degree of curvature B, “the input pattern is
Belongs to "na". ".

第8図に「ナ」に対する同定条件をまとめて表にして
示す。簡単に,入力パターンを「ナ」と認識する同定条
件は「十(漢字)」と識別すべきものだけであるとす
る。同定部4は第7図の入力パターンに対しては,同定
条件に従って入力パターンは「ナ」に属すると認識
し,認識結果出力5を得る。
FIG. 8 is a table summarizing the identification conditions for “na”. It is assumed that the identification condition for simply recognizing the input pattern as “na” is only the one that should be identified as “ten (kanji)”. The identification unit 4 recognizes that the input pattern belongs to "n" according to the identification condition with respect to the input pattern of FIG.

入力パターンが第9図のパターンのようなものであ
る時,同定部4は入力パターンは「ナ」に属さないと判
定する。そして,次に第2順位の候補「十」について同
定処理を行う。
When the input pattern is like the pattern in FIG. 9, the identification unit 4 determines that the input pattern does not belong to "na". Then, an identification process is performed on the second-rank candidate “ten”.

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

上記のように,従来のパターン認識方式では入力パタ
ーンに同定条件を適用した結果として,その入力パター
ンは,認識候補との同定条件を満たすか満たさないか何
れかに結論していた。同定条件を満たさない場合には,
次の順位の文字等の認識コードの同定条件を参照し,必
ず1つの認識結果を得るようにしていた。
As described above, in the conventional pattern recognition method, as a result of applying the identification condition to the input pattern, it has been concluded that the input pattern satisfies or does not satisfy the identification condition with the recognition candidate. If the identification conditions are not satisfied,
By referring to the identification condition of the recognition code such as the next character in the order, one recognition result is always obtained.

しかし,手書き文字等における「ア」,「マ」あるい
は,前述の「ナ」,「十(漢字)」のようにパターンに
よっては人間でも何れを意味するパターンであるのか決
め難いものが多い。
However, depending on the pattern, such as "a" and "ma" in handwritten characters or the above-mentioned "na" and "ten (kanji)", it is often difficult for a human to determine which pattern means.

一般的に,いま,パターンC1,C2を類似パターンカテ
ゴリとする。入力パターンをIとし,人間が見た時C1に
もC2にも属するように見えるとする。大分類部2の第1
順位の認識候補をC1とする。簡単化のため入力パターン
と,C1の同定条件は,C1をC2と識別するための条件のみか
ら成るものとする。従来の認識方式では,入力パターン
Iに該同定条件を適用した結果は,次の何れかである。
Generally, the patterns C1 and C2 are assumed to be similar pattern categories. It is assumed that the input pattern is I, and that when viewed by a human, it appears to belong to both C1 and C2. Major Classification Division 2 First
The recognition candidate for the ranking is C1. For simplicity, it is assumed that the input pattern and the conditions for identifying C1 consist only of conditions for identifying C1 from C2. In the conventional recognition method, the result of applying the identification condition to the input pattern I is one of the following.

(1)IはC1に属さない。(1) I does not belong to C1.

(2)IはC1に属する。(2) I belongs to C1.

同定部4における結果が(1)の場合には,C1は認識
結果でなくなる。結果が(2)の場合には,C1のみが認
識結果とされ,C2は認識結果でなくなる。
When the result in the identification unit 4 is (1), C1 is not a recognition result. When the result is (2), only C1 is regarded as a recognition result, and C2 is not a recognition result.

本来,パターンIはカテゴリC1にもC2にも属する可能
性のあるものであるから,何れにも同定されるべきもの
である。従って,このような結果は,不正確である。
Originally, the pattern I is likely to belong to the categories C1 and C2, and thus should be identified by any of them. Therefore, such results are inaccurate.

本発明のパターン同定処理方式は,人間が見ても一意
に決定できないような類似したパターンは何れも同順位
の認識結果とし得るようにする。そして,後の処理にお
いて例えば一連の入力パターン間に存在する種々の規則
性を考慮して一意に決定することを可能にし,正確なパ
ターン認識を行うことを目的とする。
According to the pattern identification processing method of the present invention, any similar pattern that cannot be uniquely determined even when viewed by a human can be regarded as a recognition result having the same rank. Then, in the subsequent processing, for example, it is possible to uniquely determine in consideration of various regularities existing between a series of input patterns, and to perform accurate pattern recognition.

〔課題を解決するための手段〕[Means for solving the problem]

本発明では,前述した課題を解決するため入力パター
ンに同定条件を適用した結果として,従来の同定種別で
ある 同定対象カテゴリに属さない, 同定対象カテゴリに属する, に加えて, 同定対象のカテゴリと共に特定の別カテゴリにも属
する, を同定種別として認識結果を出力できるようにしたもの
である。ここで「同定対象カテゴリ」は,未知の入力パ
ターンの認識する同定処理で候補として使用された参照
用の既知パターンを意味している。
In the present invention, as a result of applying the identification condition to the input pattern in order to solve the above-described problem, in addition to the conventional identification types, which do not belong to the identification target category, belong to the identification target category, and Recognition results can be output as an identification type that belongs to a specific category. Here, the “identification target category” refers to a reference known pattern used as a candidate in the identification process for recognizing an unknown input pattern.

第1図は本発明によるパターン認識装置の原理的構成
図である。
FIG. 1 is a diagram showing the basic configuration of a pattern recognition apparatus according to the present invention.

図示されている本発明によるパターン認識装置の全体
構成は,第6図の従来例の構成と同定部を除いて基本的
には同じである。
The entire configuration of the illustrated pattern recognition apparatus according to the present invention is basically the same as that of the conventional example shown in FIG. 6 except for the identification unit.

第1図において, 1はパターン入力であり,音声や文字,図形などの認
識しようとする未知のパターン情報が入力される。
In FIG. 1, reference numeral 1 denotes a pattern input in which unknown pattern information to be recognized, such as voices, characters, and figures, is input.

2は大分類部であり,認識処理効率を上げるため予め
粗い情報のパターン認識を行い,認識候補としてある程
度類似している一定範囲のものに絞る。
Reference numeral 2 denotes a large classification unit, which performs coarse information pattern recognition in advance in order to increase recognition processing efficiency, and narrows down to a certain range of recognition candidates that are similar to some extent.

3は認識対象入力であり,認識しようとする未知の入
力パターンが属するパターン群の種別,たとえば文字の
場合は「漢字」,「カタカナ」,「英数字」,などの文
字属性や品詞,文法規則などの種別を示す認識対象カテ
ゴリが指定される。これらは認識効率と精度を上げるた
めに使用される。
Reference numeral 3 denotes a recognition target input, which is a type of a pattern group to which an unknown input pattern to be recognized belongs, for example, in the case of a character, character attributes such as “Kanji”, “Katakana”, and “Alphanumeric”, part of speech, and grammatical rules. For example, a recognition target category indicating a type, such as a category, is specified. These are used to increase recognition efficiency and accuracy.

4は同定部であり,大分類部2が作成した認識候補の
各々について本発明に基づく入力パターンの同定処理を
行い,結果を出力する。
Reference numeral 4 denotes an identification unit that performs input pattern identification processing based on the present invention for each of the recognition candidates created by the large classification unit 2, and outputs the result.

認識対象入力3から指定される認識対象カテゴリは,
大分類部2と同定部4にそれぞれ入力される。大分類部
2では処理の結果複数の認識候補に属するものを高位に
順位付けるように使用され,また同定部4では適用する
同定条件の範囲を,指定されている認識対象カテゴリが
関係するものに限定するように使用される。
The recognition target category specified from the recognition target input 3 is
These are input to the large classification unit 2 and the identification unit 4, respectively. The large classification unit 2 is used to rank those belonging to a plurality of recognition candidates as a result of the processing, and the identification unit 4 sets the range of the identification condition to be applied to the one related to the specified recognition target category. Used to limit.

第1図における同定部4内に本発明による同定処理の
出力論理を示す。以下にその論理を説明する。
The output logic of the identification processing according to the present invention is shown in the identification unit 4 in FIG. The logic will be described below.

条件判定により,入力パターンIは同定対象カテゴリ
C1に属するかどうかを判定する。その結果がNOの場合に
は,入力パターンIは,「同定対象カテゴリに属さな
い」を認識結果として出力する。
By the condition judgment, the input pattern I is identified category
Determine whether it belongs to C1. If the result is NO, the input pattern I outputs "does not belong to the category to be identified" as a recognition result.

入力パターンIが,同定対象カテゴリC1に属すると判
定した場合には,さらにC1に類似の特定の別カテゴリC2
に属するかどうかの判定処理を行う。その結果がNOの場
合には入力パターンIは,「同定対象カテゴリC1に属
する」を認識結果として出力する。他方,その結果がYE
Sの場合には入力パターンIは,「同定対象カテゴリC
1と共に他の特定の別カテゴリC2にも属する」を認識結
果として出力する。
When it is determined that the input pattern I belongs to the identification target category C1, the input pattern I further includes a specific another category C2 similar to C1.
A determination process is performed to determine whether the item belongs to If the result is NO, the input pattern I outputs "belongs to the identification target category C1" as the recognition result. On the other hand, the result is YE
In the case of S, the input pattern I is “identification target category C
1 also belongs to another specific category C2 together with 1) as a recognition result.

〔作用〕[Action]

このようにして,特定のパターンに属すると人間でも
決められない入力パターンについては,属する可能性の
あるパターンを全て認識結果第1位とするようにしたも
のである。そして,後の処理でパターンの順序の規則性
に従って認識結果を一意に決定することを可能にした。
In this way, for an input pattern that cannot be determined by a human even if it belongs to a specific pattern, all the patterns that may belong to the input pattern are set to the first recognition result. In a later process, the recognition result can be uniquely determined according to the regularity of the pattern order.

例えば,入力パターンをI,類似したカテゴリパターン
をC1,C2(例えば,「ア」と「マ」,「ナ」と「十(漢
字)」等)とする。人間がみた時は,入力パターンは,C
1にもC2にも属するように見えるものとする。そして,
大分類における認識候補第1位をC1とする。簡単化のた
め,入力パターンIをC1とする同定条件は,C2と認識す
るための条件のみから成るものとする。入力パターンに
該同定条件を適用した結果を,次の何れかとする。
For example, the input pattern is I, and the similar category patterns are C1 and C2 (for example, "A" and "MA", "NA" and "ten (kanji)", etc.). When viewed by humans, the input pattern is C
Let it appear to belong to both 1 and C2. And
Let C1 be the first recognition candidate in the large classification. For the sake of simplicity, it is assumed that the identification condition in which the input pattern I is C1 consists only of the condition for recognizing C2. The result of applying the identification condition to the input pattern is one of the following.

IはC1に属さない。 I does not belong to C1.

IはC1に属する。 I belongs to C1.

IはC1にもC2にも属する。 I belongs to both C1 and C2.

そして,入力パターンIが人間が見た時C1ともC2とも
見えるようなものである時は,を結論し,C1,C2を同順
位に認識結果とする。そして,後の処理で,C1,C2の使わ
れ方の規則性に従って一意に決定するようにする。
If the input pattern I looks like C1 and C2 when viewed by a human, the following is concluded, and C1 and C2 are regarded as the recognition result in the same rank. Then, in a later process, it is determined uniquely according to the regularity of how C1 and C2 are used.

次に,具体的に,第7図の手書き文字の入力パターン
により説明する。人間が見た時この手書き文字は,
「ナ」とも「十(漢字)」とも読めるものである。そし
て,大分類部により,認識候補として,第1位「ナ」,
第2位「十」が求められたとする。
Next, a specific description will be given with reference to the input pattern of handwritten characters in FIG. When humans see this handwritten character,
It can be read as "na" or "ten (kanji)". Then, by the large classification unit, the first place "na" as a recognition candidate,
It is assumed that the second place "ten" was required.

同定部は,まず入力パターンに認識候補第1位「ナ」
の同定条件を適用する。入力パターンを「ナ」と認識す
る「ナ」の同定条件は「十(漢字)」と識別するための
条件のみから成るものとする。
The identification unit first recognizes the first candidate “N” in the input pattern.
Is applied. It is assumed that the identification condition of “na” for recognizing the input pattern as “na” includes only the condition for identifying “10 (kanji)”.

この同定条件を第2図に表にして示す。第3図にこの
手書きパターンの第二画目の曲がり度とパターンカテゴ
リの関係を示す。この同定条件は,第2画の時計回り方
向の曲がり度Bをパラメータとして,閾値で判定するも
のとする。第3図でパターンは,第2画目の曲がり度
が閾値S1より小さいものである。パターンは第7図の
パターンで,その第2画目の曲がり度が閾値S1より大き
くS2より小さい。パターンは,第2画目の曲がり度が
閾値S2より大きい。
The identification conditions are shown in a table in FIG. FIG. 3 shows the relationship between the degree of curvature of the second stroke of the handwritten pattern and the pattern category. This identification condition is determined by a threshold using the degree of curvature B of the second image in the clockwise direction as a parameter. In FIG. 3, the pattern has a curvature of the second stroke smaller than the threshold value S1. The pattern is the pattern shown in FIG. 7, and the degree of curvature of the second stroke is larger than the threshold value S1 and smaller than S2. In the pattern, the degree of curvature of the second stroke is larger than the threshold value S2.

即ち, 曲がり度B<閾値S1 の時,「入力パター
ンは,「ナ」に属さない。」 閾値S1≦曲がり度B<閾値S2 の時,「入
力パターンは,「ナ」に属すると共に,「十」に属す
る。」 閾値S2≦曲がり度B の時,「入力パター
ンは,「ナ」に属する。」 第7図の入力パターンにこの同定条件を適用した結果
は,条件により,「入力パターンは,「ナ」とともに
「十」に属する。」であり,認識結果として,「ナ」及
び「十」が得られる。
That is, when the degree of curvature B <the threshold value S1, “the input pattern does not belong to“ na ”. When threshold value S1 ≦ degree of curvature B <threshold value S2, “the input pattern belongs to“ na ”and belongs to“ ten ”. When the threshold value S2 ≦ the degree of curvature B, the “input pattern belongs to“ na ”. The result of applying this identification condition to the input pattern of FIG. 7 is that the input pattern belongs to “ten” together with “na” depending on the condition. ”, And“ na ”and“ ten ”are obtained as recognition results.

入力パターンは,「ナ」とも「十」とも同じ程度に確
からしく見えるのでこの結果は適切である。
This result is appropriate because the input pattern looks as good as both "na" and "ten".

本発明のパターン同定方式によれば,人間でも,特定
のパターンに属すると判定出来ない曖昧な入力パターン
については,属する可能性のあるパターンを全て同順位
の認識結果とすることができる。そのため,その後の処
理において,語順等の規則性を考慮して一意に決定する
ようにしたので,より人間に近い正確なパターン認識が
できる。
According to the pattern identification method of the present invention, for an ambiguous input pattern that cannot be determined to belong to a specific pattern even by a human, all the patterns that may belong can be regarded as the same rank recognition result. Therefore, in the subsequent processing, the pattern is uniquely determined in consideration of the regularity such as the word order, so that an accurate pattern recognition closer to a human can be performed.

(第1の実施例) 第4図に本発明によるパターン認識装置の第1の実施
例の構成を示す。
First Embodiment FIG. 4 shows the configuration of a first embodiment of the pattern recognition device according to the present invention.

第4図において10は認識対象入力部,11は認識対象格
納部,12はパターン入力部,13は入力パターン格納部,14
は大分類部,15は認識候補格納部,16は同定部,17は認識
結果格納部である。
In FIG. 4, 10 is a recognition target input unit, 11 is a recognition target storage unit, 12 is a pattern input unit, 13 is an input pattern storage unit, 14
Is a large classification unit, 15 is a recognition candidate storage unit, 16 is an identification unit, and 17 is a recognition result storage unit.

また同定部16において,161は候補コード格納部,162は
同定条件検索部,163は条件判定部,164は同定条件格納
部,165は同一順位候補格納部を表す。
In the identification unit 16, reference numeral 161 denotes a candidate code storage unit; 162, an identification condition search unit; 163, a condition determination unit; 164, an identification condition storage unit;

動作を説明すると,パターン入力部12から未知のパタ
ーンを入力し,入力パターン格納部13に格納する。
In operation, an unknown pattern is input from the pattern input unit 12 and stored in the input pattern storage unit 13.

認識対象入力部10からは認識対象カテゴリ,すなわち
認識すべきパターンが属するカテゴリの種類に属する情
報を入力し,認識対象格納部11に格納しておく。認識対
象格納部11に格納された認識対象カテゴリの種類情報は
大分類部14に入力される。入力パターン格納部13からの
入力パターンは大分類部14において認識候補を求める大
まかなパターン認識(入力パターンの特徴を表すデータ
と辞書のデータを比較する等の公知の技術による精度の
低い認識)を行い,ある程度以上辞書のパターンと近似
している(公知のDP法等により入力パターンと辞書のパ
ターンの距離が一定の範囲内である)とそれを認識候補
とし,1つないし複数個の認識候補を得る。1つの場合は
詳細同定を行う必要がない。
A recognition target category, that is, information belonging to a type of a category to which a pattern to be recognized belongs is input from the recognition target input unit 10 and stored in the recognition target storage unit 11. The type information of the recognition target category stored in the recognition target storage unit 11 is input to the large classification unit 14. The input pattern from the input pattern storage unit 13 is subjected to rough pattern recognition (recognition with low accuracy by a known technique such as comparing data representing the characteristics of the input pattern with data in a dictionary) for obtaining a recognition candidate in the large classification unit 14. If the pattern is approximate to the dictionary pattern to some extent (the distance between the input pattern and the dictionary pattern is within a certain range by the well-known DP method, etc.), it is regarded as one or more recognition candidates. Get. In one case, there is no need to perform detailed identification.

認識候補格納部15には大分類部14から,認識する確率
の高い順に認識候補が格納され,同定部16ではその認識
候補について同定条件を用いて,入力パターン格納部13
に格納されたパターンが条件を満たすかどうかを判別
し,条件を満たさないと,別の候補についての同定条件
により同様の処理を行って,条件を全て満たす認識候補
のコードを認識結果コードとして出力し,認識結果格納
部17に格納する。
Recognition candidates are stored in the recognition candidate storage unit 15 in the descending order of the probability of recognition from the large classification unit 14, and the identification unit 16 uses the identification conditions for the recognition candidates and stores them in the input pattern storage unit 13.
Determines whether the pattern stored in the satisfies the condition. If the condition is not satisfied, performs the same processing under the identification condition of another candidate, and outputs the code of the recognition candidate that satisfies all the conditions as the recognition result code. Then, it is stored in the recognition result storage unit 17.

次に同定部16の動作を説明すると,まず認識候補格納
部15に格納した認識候補第1位のコードを,候補コード
格納部161に格納する。同定条件検索部162は候補コード
格納部161に格納したパターンの候補コードに対応する
同定条件プログラムを同定条件格納部164から検索し,
条件判定部163中のメモリ(図示せず)に格納する。
Next, the operation of the identification unit 16 will be described. First, the first code of the recognition candidate stored in the recognition candidate storage unit 15 is stored in the candidate code storage unit 161. The identification condition search unit 162 searches the identification condition program corresponding to the pattern candidate code stored in the candidate code storage unit 161 from the identification condition storage unit 164,
It is stored in a memory (not shown) in the condition determination unit 163.

同定条件格納部164には,候補コードと識別コードの
対ごとに同定条件プログラム(実際にはその格納アドレ
ス)が対応づけられている。
The identification condition storage unit 164 is associated with an identification condition program (actually, a storage address thereof) for each pair of a candidate code and an identification code.

多くの場合,1つの認識候補パターン(1つの候補コー
ドが対応)に対してそれと区別されるべき1つないし複
数の類似パターンが存在する。そこでそれらを識別コー
ドで別々に指定して,各候補コードごとに1つないし複
数の組み合わせを作り,それらの各組み合わせごとに1
つの同定条件プログラムを作成して同定条件格納部164
に格納してある。
In many cases, one recognition candidate pattern (one candidate code corresponds) has one or more similar patterns to be distinguished therefrom. Therefore, they are separately specified by identification codes, and one or more combinations are made for each candidate code, and one combination is made for each combination.
One identification condition program is created and the identification condition storage unit 164 is created.
It is stored in.

したがって同定条件検索部162は,候補コード格納部1
61の1つの候補コードについて,組み合わされている異
なる識別コードに対応する1つないし複数の同定条件プ
ログラムを,同定条件格納部164から順次検索し,条件
判定部163に格納して実行させる。
Therefore, the identification condition search unit 162 stores in the candidate code storage unit 1
For one candidate code 61, one or more identification condition programs corresponding to different identification codes combined are sequentially searched from the identification condition storage unit 164, stored in the condition determination unit 163, and executed.

条件判定部163に格納された同定条件プログラムは,
従来のパターン認識装置の場合の候補コードに属さな
い,候補コードに属する,という結果の他に,候補
コードと識別コードの両方に属するという結果を返すこ
とができる。
The identification condition program stored in the condition determination unit 163 is
In addition to the result of not belonging to the candidate code or belonging to the candidate code in the case of the conventional pattern recognition device, the result of belonging to both the candidate code and the identification code can be returned.

条件判定部163はの結果が返ってきた時に,同定条
件に付随する識別コードを同一順位候補格納部165に格
納する。
When the result of the condition determination unit 163 is returned, the identification code associated with the identification condition is stored in the same rank candidate storage unit 165.

同一の候補コードに対して,各同定条件プログラムの
結果が全てかであり,新たに適用する同定条件プロ
グラムが無くなった時にその候補コード及び同一順位候
補格納部165中に格納されている識別コードを,同一順
位の認識結果として認識結果格納部17に格納する。
If the result of each identification condition program is all for the same candidate code, and when there is no more identification condition program to be newly applied, the candidate code and the identification code stored in the same rank candidate storage unit 165 are replaced by Are stored in the recognition result storage unit 17 as recognition results of the same rank.

以上述べた実施例は,同定対象カテゴリのコードであ
る候補コードと同定対象カテゴリに付随する識別対象カ
テゴリのコードである識別コードとの対毎に同定条件を
設け,付随する各同定条件を全て満たす同定対象カテゴ
リを認識結果とするものであった。
In the embodiment described above, an identification condition is provided for each pair of a candidate code that is a code of the identification target category and an identification code that is a code of the identification target category attached to the identification target category, and all the associated identification conditions are satisfied. The identification target category was used as the recognition result.

しかし,容易に類推できるように,同定対象カテゴリ
のみ毎に,入力パターンが該同定対象カテゴリに属する
ことを判定する同定条件を設けたパターン認識装置につ
いても,本発明が適用できることは明らかである。
However, as can be easily analogized, it is clear that the present invention can be applied to a pattern recognition device provided with an identification condition for determining that an input pattern belongs to the identification target category only for each identification target category.

具体的には,同定対象カテゴリ毎に,入力パターンが
その同定対象カテゴリに属することを判定する同定条件
を設けたパターン認識装置において,入力パターンに文
字同定条件を適用した結果として, ′その同定対象カテゴリに属さない, ′その同定対象カテゴリに属する, ′その同定対象カテゴリと共に特定の別カテゴリにも
属する, のいずれかを返し,′の場合にはその同定対象カテゴ
リと特定の別カテゴリを同一順位の認識結果とするもの
である。
Specifically, in a pattern recognition device that has set an identification condition for determining that an input pattern belongs to the category to be identified for each category to be identified, the result of applying the character identification condition to the input pattern is as follows. Returns the category that does not belong to the category, ′ belongs to the category to be identified, ′ belongs to the category to be identified as well as to another specific category, Is the recognition result.

(第2の実施例) 第5図は本発明の同定部を備えた第2の実施例であ
り,第4図の第1の実施例の構成から大分類部14と認識
候補格納部15を取り除いたものである。
(Second Embodiment) FIG. 5 shows a second embodiment having an identification unit according to the present invention. The large classification unit 14 and the recognition candidate storage unit 15 are different from the configuration of the first embodiment in FIG. It has been removed.

本実施例における同定部の条件判定は,第4図の同定
部16の条件判定と同じである。
The condition judgment of the identification unit in the present embodiment is the same as the condition judgment of the identification unit 16 in FIG.

認識対象のカテゴリが限られているような場合には
(例えば,数字のみから成るような場合),大分類を行
う必要が無く,同定部だけでパターンを識別できる。こ
のような時,第5図のパターン認識装置が用いられる。
When the category to be recognized is limited (for example, when the category consists only of numbers), there is no need to perform large classification, and the pattern can be identified only by the identification unit. In such a case, the pattern recognition device shown in FIG. 5 is used.

この場合には認識対象カテゴリに属する全てのパター
ンのコードをそのまま認識候補(数字なら0〜9)とし
て,それぞれの同定条件に基づいて同定部16において順
次入力パターンの同定処理を行う。
In this case, the codes of all the patterns belonging to the recognition target category are used as recognition candidates as they are (numbers are 0 to 9), and the identification unit 16 sequentially performs the input pattern identification processing based on the respective identification conditions.

同定部16の条件判定は第4図の同定部16と同じである
のでその動作の説明は省略する。
Since the condition judgment of the identification unit 16 is the same as that of the identification unit 16 in FIG. 4, the description of the operation is omitted.

〔発明の効果〕〔The invention's effect〕

本発明によれば,人間でも,特定のパターンに属する
と判定出来ない曖昧な入力パターンについては,属する
可能性のあるパターンを全て同順位の認識結果とし,そ
の後の処理において,語順等の規則性を考慮して一意に
決定するようにしたので,従来のものよりも正確なパタ
ーン認識ができる。
According to the present invention, for an ambiguous input pattern that cannot be determined to belong to a specific pattern even by a human, all the patterns that may belong are regarded as recognition results of the same rank, and the regularity such as word order is determined in the subsequent processing. Is uniquely determined in consideration of the above, so that more accurate pattern recognition can be performed than the conventional one.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明によるパターン認識装置の原理的構成
図, 第2図は本発明における「十」と識別するための「ナ」
の同定条件の説明図, 第3図は本発明における「十」と「ナ」を識別するため
の曲がり度の条件説明図, 第4図は本発明によるパターン認識装置の第1の実施例
の構成図, 第5図は本発明によるパターン認識装置の第2の実施例
の構成図, 第6図は従来のパターン認識装置の構成図, 第7図は手書きパターンの例の説明図, 第8図は従来の「十」と識別するための「ナ」の同定条
件説明図, 第9図は従来の,「十」と「ナ」を識別するための曲が
り度の条件説明図である。 第1図中,1:パターン入力,2:大分類部,3:認識対象入力,
4:同定部,5:認識結果出力。
FIG. 1 is a diagram showing the basic configuration of a pattern recognition apparatus according to the present invention, and FIG. 2 is a diagram showing "na" for identifying "ten" in the present invention.
FIG. 3 is an explanatory view of a condition of a degree of curvature for identifying “ten” and “na” in the present invention, and FIG. 4 is a diagram of a first embodiment of a pattern recognition device according to the present invention. FIG. 5 is a block diagram of a second embodiment of a pattern recognition device according to the present invention, FIG. 6 is a block diagram of a conventional pattern recognition device, FIG. 7 is an explanatory diagram of an example of a handwritten pattern, FIG. FIG. 9 is an explanatory diagram of a conventional identification condition of “na” for identifying “ten”, and FIG. 9 is an explanatory diagram of a conventional condition of a degree of curvature for identifying “ten” and “na”. In Fig. 1, 1: pattern input, 2: large classification unit, 3: recognition target input,
4: Identification part, 5: Recognition result output.

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入力パターンに同定条件を適用し認識結果
を求めるパターン認識装置において,入力パターン中の
所定の特徴を同定条件として用いるとともに,同定条件
の判定結果に,「同定対象カテゴリと共に特定の別カテ
ゴリに属する」なる同定種別を設け,入力パターンに同
定条件を適用した結果として上記同定種別が得られた場
合,認識結果の同定対象カテゴリと特定の別カテゴリと
を同一順位の認識結果とするパターン同定処理方式。
In a pattern recognition apparatus which applies an identification condition to an input pattern and obtains a recognition result, a predetermined feature in the input pattern is used as an identification condition, and a determination result of the identification condition includes "a specific feature together with a category to be identified". If an identification type “belongs to another category” is provided and the above-mentioned identification type is obtained as a result of applying the identification condition to the input pattern, the recognition target category of the recognition result and a specific different category are regarded as the same rank recognition result. Pattern identification processing method.
【請求項2】請求項1において,同定対象カテゴリ毎
に,入力パターンが該同定対象カテゴリ毎に属すること
を判定する同定条件を設け,入力パターンに同定条件を
適用した結果の同定種別として, 該同定対象カテゴリに属さない, 該同定対象カテゴリに属する, 該同定対象カテゴリと共に特定の別カテゴリにも属
する, のいずれかを返し,上記の場合にはその同定対象カテ
ゴリと特定の別カテゴリとを同一順位の認識結果とする
ことを特徴とするパターン同定処理方式。
2. An identification condition for judging that an input pattern belongs to each identification target category according to claim 1, and an identification type as a result of applying the identification condition to the input pattern is provided as an identification type. Returns one of the following: does not belong to the category to be identified, belongs to the category to be identified, belongs to a specific category together with the category to be identified, and in the above case, the category to be identified and the specific another category are the same. A pattern identification processing method characterized by using the result of rank recognition.
JP63264458A 1988-10-20 1988-10-20 Pattern identification processing method Expired - Fee Related JP2923295B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63264458A JP2923295B2 (en) 1988-10-20 1988-10-20 Pattern identification processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63264458A JP2923295B2 (en) 1988-10-20 1988-10-20 Pattern identification processing method

Publications (2)

Publication Number Publication Date
JPH02110795A JPH02110795A (en) 1990-04-23
JP2923295B2 true JP2923295B2 (en) 1999-07-26

Family

ID=17403489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63264458A Expired - Fee Related JP2923295B2 (en) 1988-10-20 1988-10-20 Pattern identification processing method

Country Status (1)

Country Link
JP (1) JP2923295B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2644859B2 (en) 1988-11-14 1997-08-25 富士通株式会社 Identification processing method of detailed pattern identification device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6089290A (en) * 1983-10-19 1985-05-20 Ricoh Co Ltd Pattern recognition method
JPS6089291A (en) * 1983-10-19 1985-05-20 Sharp Corp Character recognition method
JPS61272887A (en) * 1985-05-28 1986-12-03 Toshiba Corp Character recognition system
JPS6228889A (en) * 1985-07-31 1987-02-06 Canon Inc Information recognizing device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2644859B2 (en) 1988-11-14 1997-08-25 富士通株式会社 Identification processing method of detailed pattern identification device

Also Published As

Publication number Publication date
JPH02110795A (en) 1990-04-23

Similar Documents

Publication Publication Date Title
EP0355748B1 (en) A pattern recognition apparatus and method for doing the same
CN110851590A (en) Method for classifying texts through sensitive word detection and illegal content recognition
JPS6120038B2 (en)
JP2923295B2 (en) Pattern identification processing method
JPS6262388B2 (en)
JP2002183667A (en) Character-recognizing device and recording medium
JPS59197974A (en) Character recognizing device
JP3419251B2 (en) Character recognition device and character recognition method
JPS63268082A (en) Pattern recognizing device
JP2637762B2 (en) Pattern detail identification method
JP4215385B2 (en) PATTERN RECOGNIZING DEVICE, PATTERN RECOGNIZING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
JP2644859B2 (en) Identification processing method of detailed pattern identification device
JP2827066B2 (en) Post-processing method for character recognition of documents with mixed digit strings
JPS61114388A (en) Character input device
JPH03150692A (en) Word collation system
JPS6344287A (en) Character reader
JPS646514B2 (en)
JP2851865B2 (en) Character recognition device
JP2639314B2 (en) Character recognition method
JPH056464A (en) Method and device for character string recognition
JPS62285189A (en) Character recognition post processing system
JPH03189890A (en) Compound word collating method
JP2001266074A (en) Device for recognizing character
JPS60138689A (en) Character recognizing method
JPH06195508A (en) Character segmenting method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees