JP3095599B2 - Online character recognition device - Google Patents

Online character recognition device

Info

Publication number
JP3095599B2
JP3095599B2 JP05319565A JP31956593A JP3095599B2 JP 3095599 B2 JP3095599 B2 JP 3095599B2 JP 05319565 A JP05319565 A JP 05319565A JP 31956593 A JP31956593 A JP 31956593A JP 3095599 B2 JP3095599 B2 JP 3095599B2
Authority
JP
Japan
Prior art keywords
character
dictionary
partial pattern
registered
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05319565A
Other languages
Japanese (ja)
Other versions
JPH07175889A (en
Inventor
英里 一井
浩司 松本
健治 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP05319565A priority Critical patent/JP3095599B2/en
Publication of JPH07175889A publication Critical patent/JPH07175889A/en
Application granted granted Critical
Publication of JP3095599B2 publication Critical patent/JP3095599B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、手書き入力文字をスト
ロークの情報を利用して認識するオンライン文字認識装
置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an online character recognition apparatus for recognizing handwritten input characters by using stroke information.

【0002】[0002]

【従来の技術】図2は、従来のオンライン文字認識装置
の概略構成を示すものである(特開昭62−22938
3号公報には図2以上に詳細に記載されている)。図2
において、従来のオンライン文字認識装置は、タブレッ
ト(座標入力手段)1と、特徴点抽出手段2と、ストロ
ーク抽出手段3と、認識手段4と、辞書5とから構成さ
れている。
2. Description of the Related Art FIG. 2 shows a schematic structure of a conventional on-line character recognition apparatus (Japanese Patent Laid-Open No. 62-22938).
No. 3 discloses this in more detail than FIG. 2). FIG.
The conventional online character recognition device includes a tablet (coordinate input means) 1, a feature point extracting means 2, a stroke extracting means 3, a recognizing means 4, and a dictionary 5.

【0003】タブレット1から時系列的に出力された例
えばxy直交座標系に従う座標データは、特徴点抽出手
段2に入力され、特徴点抽出手段2によってストローク
の始点、終点、屈曲点等の特徴を表す極点座標データが
抽出される。
[0003] Coordinate data according to, for example, an xy orthogonal coordinate system output in time series from the tablet 1 is input to a feature point extracting means 2, and the feature point extracting means 2 determines features such as a stroke start point, an end point, and a bending point. The pole coordinate data to be represented is extracted.

【0004】ここで、極点とは、タブレット1から送出
された座標系列をxy直交座標上の曲線とみなし、x
軸、y軸に対する極大値及び極小値をとる点、座標系列
を45度回転したときのx軸、y軸に対する極大値及び
極小値をとる点、並びに、1ストロークの座標系列の始
点及び終点を言う。
Here, the extreme point refers to a coordinate sequence sent from the tablet 1 as a curve on xy orthogonal coordinates,
Axis, the point at which the maximum value and the minimum value with respect to the y-axis are taken, the point at which the maximum value and the minimum value with respect to the x-axis and y-axis are taken when the coordinate series is rotated by 45 degrees, and the start point and end point of the coordinate series of one stroke. To tell.

【0005】抽出された1ストローク分の極点座標デー
タ(以下、単に座標データと呼ぶ)は、ストローク抽出
手段3に入力され、ストローク抽出手段3は、この座標
データに基づいて、各ストロークを分類して予め決めら
れているストロークコードを付与する。
The extracted pole coordinate data for one stroke (hereinafter, simply referred to as coordinate data) is input to a stroke extracting means 3, which classifies each stroke based on the coordinate data. To give a predetermined stroke code.

【0006】特徴点抽出手段2が抽出した1ストローク
分の座標データ、及び、ストローク抽出手段3が得たス
トロークコードが認識手段4に入力される。
[0006] The coordinate data for one stroke extracted by the feature point extracting means 2 and the stroke code obtained by the stroke extracting means 3 are input to the recognizing means 4.

【0007】認識手段4は、筆記者が手書きした文字を
認識するものであり、以下、この認識手段4の機能につ
いて詳述する。
The recognizing means 4 is for recognizing a character handwritten by a writer. Hereinafter, the function of the recognizing means 4 will be described in detail.

【0008】認識手段4は、まず、筆記された文字のス
トローク数(画数)を検出し、辞書5内のその画数に応
じた画数辞書部を選択する。例えば、入力文字「沖」が
筆記された場合には画数が7画であるので、7画で構成
されている文字情報を格納している画数辞書部が選択さ
れる。
The recognizing means 4 first detects the number of strokes (number of strokes) of the written character, and selects a stroke number dictionary section in the dictionary 5 corresponding to the stroke number. For example, when the input character “Oki” is written, the number of strokes is seven, and the stroke number dictionary unit storing character information composed of seven strokes is selected.

【0009】なお、辞書(以下、本発明との関係から固
定辞書と呼ぶ)5には、標準文字について予め得た後述
するようなパラメータの値が、文字の画数毎に固定的に
格納されている。
In a dictionary (hereinafter, referred to as a fixed dictionary in relation to the present invention) 5, parameter values, which will be described later, obtained in advance for standard characters are fixedly stored for each number of strokes of characters. I have.

【0010】認識手段4は、筆記文字に対する部分パタ
ーン間ベクトルを算出し、算出した部分パターン間ベク
トルと、選択された画数辞書部に格納されている各文字
の部分パターン間ベクトルとを照合する。そして、部分
パターン間ベクトルの照合結果(マッチング距離)Vが
閾値TH1より小さい文字に候補を絞り込む。同様に、
認識手段4は、筆記文字に対するQ値を算出し、算出さ
れたQ値と、候補としてまだ残っている各文字のQ値と
を照合し、照合結果(マッチング距離)Qが閾値TH2
より小さい文字に候補をさらに絞り込む。このような照
合結果と閾値TH3との大小比較による絞り込みを、ス
トロークコード値の分布(照合結果をSとする)の面か
らも行なう。
The recognizing means 4 calculates a partial pattern vector for the written character, and compares the calculated partial pattern vector with the partial pattern vector of each character stored in the selected stroke count dictionary. Then, candidates are narrowed down to characters whose matching result (matching distance) V of the partial pattern vector is smaller than the threshold value TH1. Similarly,
The recognizing means 4 calculates a Q value for the written character, compares the calculated Q value with the Q value of each character still remaining as a candidate, and sets the matching result (matching distance) Q to a threshold value TH2.
Refine the candidates to smaller characters. Such narrowing down by comparing the collation result with the threshold value TH3 is also performed from the viewpoint of the distribution of the stroke code value (the collation result is S).

【0011】そして、認識手段4は、残った候補文字に
対してそれぞれ、(1) 式に従う総合マッチング距離値D
を求め、この値Dによって、残った候補文字の順位付け
を行なう(候補を1個にすることも含む)。総合マッチ
ング距離値Dが小さいものほど候補順位は高い。
Then, the recognizing means 4 calculates a total matching distance value D according to the equation (1) for each of the remaining candidate characters.
Is determined, and the remaining candidate characters are ranked according to the value D (including one candidate). The candidate ranking is higher as the total matching distance value D is smaller.

【0012】 D=V+aQ+bS …(1) (但し、a及びbはそれぞれ画数によって定まる定数)
ここで、部分パターン間ベクトルとは、筆記文字(例え
ば漢字)を、それを構成するブロックとして部首を基本
とした部分パターンに分け、各部分パターンの重心をそ
の筆記順序に従って結んだベクトルである。例えば、文
字「沖」は、「さんずい」部分と「中」の部分とに分け
られ、最初に筆記された「さいずい」部分の重心から次
に筆記された「中」部分の重心を結ぶベクトルが部分パ
ターン間ベクトルである。部分パターン間ベクトルは、
文字「沖」について図3に示すように、x方向及びy方
向の成分Xv及びYv(明細書においては図面と異な
り、vを付与して表す)に分けて考えられる。
D = V + aQ + bS (1) (where a and b are constants determined by the number of strokes, respectively)
Here, the vector between partial patterns is a vector obtained by dividing a written character (for example, a kanji) into partial patterns based on radicals as constituent blocks, and connecting the centers of gravity of the respective partial patterns in the writing order. . For example, the character "Oki" is divided into a "sanzui" part and a "medium" part, and a vector connecting the center of gravity of the first "saizui" part and the center of gravity of the next "middle" part Is a vector between partial patterns. The vector between partial patterns is
As shown in FIG. 3, the character “Oki” can be considered as being divided into components Xv and Yv in the x and y directions (v is different from the drawing and is given in the specification).

【0013】図4は、固定辞書5内の10画の画数辞書
部の構成例を示したものである。この画数辞書部は、1
0画の各文字を構成する部分パターンのコードと、部分
パターンに分けるための情報であるカット位置と、部分
パターン間ベクトルとを格納している。カット位置は、
筆記された入力文字をどのように部分パターンに分ける
かを規定したものであり、例えば、カット位置の情報が
(3,7)であるものは、筆記文字の3番目のストロー
クまでで1個の部分パターンとし、残りの7個のストロ
ークの部分を他の部分パターンとすることを意味する。
FIG. 4 shows an example of the configuration of a stroke number dictionary section of 10 strokes in the fixed dictionary 5. This stroke count dictionary unit is 1
It stores a code of a partial pattern constituting each character of a zero stroke, a cut position which is information for dividing into partial patterns, and a vector between partial patterns. The cutting position is
This defines how the written input character is divided into partial patterns. For example, when the cut position information is (3, 7), one character is written up to the third stroke of the written character. This means that a partial pattern is used, and the remaining seven strokes are used as other partial patterns.

【0014】入力文字の部分パターン間ベクトルをX
v,Yvとし、固定辞書5に登録されている文字の標準
部分パターン間ベクトルをXvd,Yvdとすると、マ
ッチング距離は、|Xv−Xvd|+|Yv−Yvd|
となる。一般に、筆記した文字の部分パターン数が複数
の場合は、部分パターン数bで正規化を行ない、マッチ
ング距離Vは、 V={Σ|Xvi−Xvdi|+|Yvi−Yvdi|}/(b−1) …(2) となる(但し、総和Σはiが1〜b−1について)。
The vector between the partial patterns of the input character is X
v, Yv, and Xvd, Yvd the vectors between the standard partial patterns of the characters registered in the fixed dictionary 5, the matching distance is | Xv-Xvd | + | Yv-Yvd |
Becomes In general, when the number of partial patterns of a written character is plural, normalization is performed using the number b of partial patterns, and the matching distance V is given by: V = {| Xvi−Xvdi | + | Yvi−Yvdi |} / (b− 1) ... (2) (However, the sum Σ is when i is 1 to b-1).

【0015】また、Q値は、筆記方向の変化分布を例え
ば部分パターンを単位に総合化した値であり、例えば各
部分パターンについては16個の値Q1 〜Q16の組(部
分パターンQ値;実施例の説明における部分パターンQ
値も同じものを表している)で与えられる。例えば、漢
数字「一」を筆記する場合、→方向に筆記し、←方向に
筆記することはほとんどない。x方向の+方向成分が、
x方向のどの位置に分布しているかをイメージ的な特徴
で表した値がQ1 であり、各極点間のX,Y成分の長さ
と中心値の積和として定義されている。
The Q value is a value obtained by integrating the change distribution in the writing direction, for example, in units of partial patterns. For example, for each partial pattern, a set of 16 values Q1 to Q16 (partial pattern Q value ; Partial pattern Q in the description of the example
Values represent the same thing ). For example, when writing the Chinese numeral "1", writing is performed in the right direction, and is hardly performed in the left direction. The + direction component in the x direction is
The value representing the position in the x direction as an image feature is represented by Q1 and is defined as the product sum of the length of the X and Y components between the poles and the center value.

【0016】ここで、図5(a)に示すように、左下部
Oを原点とし、特徴点抽出手段2によって得られた各極
点の座標をXj ,Yj (jは1〜n;jが1は始点、j
がnは終点)とし、x方向及びy方向の文字幅をそれぞ
れHx ,Hy とすると、値Q1 〜Q8 は、次の(3) 式で
表される。
As shown in FIG. 5 (a), the coordinates of each pole obtained by the characteristic point extracting means 2 are defined as Xj and Yj (j is 1 to n; Is the starting point, j
Where n is the end point) and the character widths in the x and y directions are Hx and Hy, respectively, the values Q1 to Q8 are expressed by the following equation (3).

【0017】 x(+)方向成分のx方向位置の加算値Q1 =Σ(Xj+1 −Xj )(Xj +Xj+1 )/2Hx x(−)方向成分のx方向位置の加算値Q2 =Σ(Xj −Xj+1 )(Xj +Xj+1 )/2Hx y(+)方向成分のy方向位置の加算値Q3 =Σ(Yj+1 −Yj )(Yj +Yj+1 )/2Hy y(−)方向成分のy方向位置の加算値Q4 =Σ(Yj −Yj+1 )(Yj +Yj+1 )/2Hy x(+)方向成分のy方向位置の加算値Q5 =Σ(Xj+1 −Xj )(Yj +Yj+1 )/2Hx Hy x(−)方向成分のy方向位置の加算値Q6 =Σ(Xj −Xj+1 )(Yj +Yj+1 )/2Hx Hy y(+)方向成分のx方向位置の加算値Q7 =Σ(Yj+1 −Yj )(Xj +Xj+1 )/2Hx Hy y(−)方向成分のx方向位置の加算値Q8 =Σ(Yj −Yj+1 )(Xj +Xj+1 )/2Hx Hy …(3) (但し、総和Σはjが1〜n−1について)また、図5
(b)に示すような、右上部Oを原点とした座標系で同
様な演算で求めた値がQ9 〜Q16である。
[0017] x (+) the sum of x position of the directional component Q1 = Σ (Xj + 1 -Xj ) (Xj + Xj + 1) / 2Hx 2 x (-) the sum of x position of the directional component Q2 = Σ (Xj -Xj + 1) ( Xj + Xj + 1) / 2Hx 2 y (+) the sum of y position of the directional component Q3 = Σ (Yj + 1 -Yj ) (Yj + Yj + 1) / 2Hy 2 y (-) the sum of y position of the directional component Q4 = Σ (Yj -Yj + 1 ) (Yj + Yj + 1) / 2Hy 2 x (+) the sum of y position of the directional component Q5 = sigma (Xj + 1−Xj) (Yj + Yj + 1) / 2HxHy The sum of the components in the y direction of the x (−) direction Q6 = Σ (Xj−Xj + 1) (Yj + Yj + 1) / 2HxHyy (+) direction Addition value of the component in the x direction Q7 = Σ (Yj + 1−Yj) (Xj + Xj + 1) / 2HxHy Addition value of the x direction position of the y (−) component Q8 = Σ (Yj−Yj + 1) (Xj + Xj + 1) / 2HxHy (3) However, the sum Σ is j is 1 to n-1) Further, FIG. 5
Q9 to Q16 are values obtained by similar calculations in a coordinate system having the origin at the upper right portion O as shown in FIG.

【0018】Q値の照合結果(マッチング距離値)Q
は、各部分パターンの画数Kで重み付けを行ない、次の
(4) 式で与えられる。
Matching result of Q value (matching distance value) Q
Is weighted by the number of strokes K of each partial pattern, and
It is given by equation (4).

【0019】 Q=ΣΣ|Qdik −Qik|・Ki /N …(4) ここで、Qdik は、固定辞書5に格納されている文字の
i(iは1〜b)番目の部分パターンの値Qk (kは1
〜16)であり、Qikは、筆記文字のi番目の部分パタ
ーンの値Qk であり、Ki はi番目の部分パターンの画
数であり、Nは総画数である。また、総和ΣΣは、部分
パターンiと、Q値成分kとについてである。
Q = ΣΣ | Qdik−Qik | · Ki / N (4) where Qdik is the value Qk of the i-th (i is 1 to b) -th partial pattern of the character stored in the fixed dictionary 5 (K is 1
16), Qik is the value Qk of the i-th partial pattern of the written character, Ki is the number of strokes of the i-th partial pattern, and N is the total number of strokes. The sum ΣΣ is for the partial pattern i and the Q-value component k.

【0020】図6は、固定辞書5内の部分パターン辞書
部の構成例を示すものである。この図6に示すように、
部分パターン辞書部は、部分パターン毎にQ値(部分パ
ターンQ値)Q1 〜Q16が格納されている。どの部分パ
ターンQ値Q1 〜Q16を取出すかは、上述した画数辞書
部(図4参照)の部分パターンコードによる。なお、部
分パターン辞書部には、ストロークコード値の照合結果
Sを得る際に必要なストロークコード分布も格納されて
いる。
FIG. 6 shows an example of the configuration of the partial pattern dictionary section in the fixed dictionary 5. As shown in FIG.
The partial pattern dictionary section stores Q values (partial pattern Q values) Q1 to Q16 for each partial pattern. Which partial pattern Q value Q1 to Q16 is extracted depends on the partial pattern code of the stroke number dictionary unit (see FIG. 4). Note that the partial pattern dictionary section also stores a stroke code distribution necessary for obtaining a collation result S of the stroke code value.

【0021】ストロークコード値Sは、部分パターン毎
にストロークコードの本数分布を求め、各部分パターン
のマッチング結果を足し合わせたものである。例えば、
ある入力文字の部分パターンの1個が3画であって、入
力文字の部分パターンと辞書5の部分パターンのストロ
ークコードが図7に示すような場合には、この部分パタ
ーンについてのマッチング結果Sは0+1+1+0で2
となる。
The stroke code value S is obtained by obtaining the distribution of the number of stroke codes for each partial pattern and adding the matching results of each partial pattern. For example,
If one of the partial patterns of a certain input character is three strokes and the stroke codes of the partial pattern of the input character and the partial pattern of the dictionary 5 are as shown in FIG. 7, the matching result S for this partial pattern is 2 with 0 + 1 + 1 + 0
Becomes

【0022】以上詳述したようにして求められた部分パ
ターン間ベクトルの照合結果V、Q値の照合結果Q、及
び、ストロークコード値の照合結果Sを利用して、認識
手段4は、上述のように候補文字を絞り込む。
Using the comparison result V of the vector between partial patterns, the comparison result Q of the Q value, and the comparison result S of the stroke code value obtained as described above, the recognizing means 4 performs the above-described operation. To narrow down the candidate characters.

【0023】[0023]

【発明が解決しようとする課題】以上のように、従来の
オンライン文字認識装置においては、種々の観点からの
値を総合的に考慮して認識率を高めるようにしている。
As described above, in the conventional online character recognition apparatus, the recognition rate is increased by comprehensively considering values from various viewpoints.

【0024】しかし、オンライン文字認識装置は手書き
文字を対象としているため、筆記者の癖や、筆記者が誤
って記憶している筆順等によっては認識率が低下する恐
れがある。例えば、筆記者が筆順を誤って記憶している
文字が筆記された場合にも、上述したカット位置の情報
(図4参照)によって部分パターンに分けられる。すな
わち、当該オンライン文字認識装置が意図している部分
パターンと異なる部分パターンに分けられることがあ
る。上述のように、認識の基本的パラメータである部分
パターン間ベクル、Q値、ストロークコード値は、部
分パターン毎の値を利用するものであるので、部分パタ
ーンへの分割が誤っていると、正しく文字認識を行なう
ことができない。
However, since the on-line character recognition apparatus targets handwritten characters, the recognition rate may decrease depending on the habit of the writer or the stroke order that the writer incorrectly memorizes. For example, even when a writer writes a character in which the stroke order is erroneously stored, the character is divided into partial patterns by the above-described cut position information (see FIG. 4). That is, the on-line character recognition device may be divided into partial patterns different from the intended partial patterns. As mentioned above, the basic parameter is a partial pattern among vector preparative Le recognition, Q value, the stroke code values, since the advantage of the value of each partial pattern and is incorrect division into partial patterns Character cannot be correctly recognized.

【0025】そのため、認識率の優れたオンライン文字
認識装置を実現するためには、筆記者の癖による字形の
違いや筆順誤りを緩和するような装置にしなければなら
ない。筆記者の癖や筆順誤りを緩和する方法としては、
筆記者が筆記した文字の情報を辞書に登録できるように
することが考えられる。
Therefore, in order to realize an on-line character recognition device having an excellent recognition rate, the device must be designed to alleviate differences in character shapes and stroke order errors due to habits of a writer. To mitigate writer habits and stroke order errors,
It is conceivable to enable information of characters written by a scribe to be registered in a dictionary.

【0026】ところで、従来のオンライン文字認識装置
では、固定辞書5を図4及び図6に示すように、文字を
構成するブロックとして部首を基本とした部分パターン
に分けて各種情報を格納している。登録しようとして筆
記された文字については、当然に固定辞書5を利用でき
ないので、筆記された文字を部首を基本とした部分パタ
ーンに分けることができず、そのため、従来のオンライ
ン文字認識装置では文字の登録機能を備えていない。
By the way, in the conventional online character recognition device, as shown in FIGS. 4 and 6, the fixed dictionary 5 is divided into partial patterns based on radicals as blocks constituting characters, and various types of information are stored. I have. Naturally, the fixed dictionary 5 cannot be used for the characters written for registration, and thus the written characters cannot be divided into partial patterns based on radicals. Does not have a registration function.

【0027】本発明は、以上の点を考慮してなされたも
のであり、辞書登録機能を備えたオンライン文字認識装
置を提供しようとするものである。
The present invention has been made in view of the above points, and aims to provide an online character recognition device having a dictionary registration function.

【0028】[0028]

【課題を解決するための手段】かかる課題を解決するた
め、本発明のオンライン文字認識装置は、照合用情報を
格納する固定辞書と、認識のために筆記された文字のス
トローク情報を筆記文字の部分パターン毎のパラメータ
に変換して、固定辞書の照合用情報と類似度判定を行
い、筆記文字の固定辞書候補文字を認識し、認識した固
定辞書候補文字を固定辞書から抽出する認識手段と、筆
記文字を、固定辞書の格納情報を用いずに、下記に示し
た所定ルールRで分割部分パターンに分割する部分パタ
ーン自動分割手段と、登録のために筆記された文字のス
トローク情報と、部分パターン自動分割手段による分割
部分パターンの情報とから、認識時に必要となる類似度
判定用の分割部分パターン毎のパラメータを得る文字登
録手段と、この文字登録手段で得られた分割部分パター
ン毎のパラメータを格納する登録辞書と、認識のために
筆記された文字のストローク情報と、部分パターン自動
分割手段による分割部分パターンの情報とから、分割
分パターン毎にパラメータを得て、登録辞書に格納され
ている対応情報との類似度判定を行い筆記文字の登録
辞書候補文字を認識し、認識した登録辞書候補文字を
出する登録文字認識手段と、認識手段が抽出した固定辞
書候補文字と登録文字認識手段が抽出した登録辞書候補
文字の中から1又は複数の候補文字を出力する出力手段
とを有する。
In order to solve the above problem, an on-line character recognition apparatus according to the present invention comprises a fixed dictionary for storing collation information, and stroke information of a character written for recognition. It is converted into parameters for each partial pattern, and the matching information of the fixed dictionary and similarity determination are performed. The fixed dictionary candidate characters of the written characters are recognized, and the recognized fixed
A recognition unit for extracting a fixed dictionary candidate character from the fixed dictionary , a partial pattern automatic dividing unit for dividing a written character into divided partial patterns according to a predetermined rule R shown below without using storage information of the fixed dictionary, Character registration means for obtaining a parameter for each divided partial pattern required for similarity determination at the time of recognition from stroke information of a character written for the above and information on divided partial patterns by the partial pattern automatic dividing means, from a registration dictionary for storing the parameters of the resulting divided portion patterns each in character registration means, and the character of the stroke information written for recognition, a division portion pattern information by the partial pattern automatically dividing unit, the dividing unit < br /> to obtain the parameters for each minute pattern, performs the similarity determination and corresponding information stored in the registration dictionary, registration dictionary candidate characters written character Recognized, the registered character recognition means for recognizing the registration dictionary candidate characters to extract <br/>, 1 or more from among the registration dictionary candidate characters fixed dictionary candidate characters and registered character recognition means recognizing means extracted is extracted Output means for outputting the candidate character of

【0029】なお、部分パターン自動分割手段が適用す
る所定ルールRは、以下の(1)〜(3)の分割方法を
総画数に使い分けるものである。 (1)低画数の文字に対しては1個のストロークをm個
に分割する。 (2)中画数の文字に対しては総画数を筆順に従ってm
個に分割する。 (3)高画数の文字に対しては総画数を筆順に従ってm
画ずつ分割する。 ここで、部分パターン自動分割手段により固定辞書に情
報を設定する文字を複数の分割部分パターンに分割し、
文字のストローク情報と、部分パターン自動分割手段に
よる分割部分パターンの情報とから、認識時に必要とな
る類似度判定用の部分パターン毎のパラメータを得て、
固定辞書は作成されたものであり、認識手段は、認識の
ために筆記された文字のストローク情報と、部分パター
ン自動分割手段による分割部分パターンの情報とから、
部分パターン毎のパラメータを得て、固定辞書に格納さ
れている対応情報との類似度判定を行い筆記文字の固定
辞書候補文字を認識し、認識した固定辞書候補文字を固
定辞書から抽出することは好ましい。また、文字登録手
段が、登録のために筆記された文字のストローク情報
と、部分パターン自動分割手段による分割部分パターン
の情報とから、認識手段が抽出した固定辞書候補文字と
登録文字認識手段が抽出した登録辞書候補文字との優先
順位を決定するための登録文字優先判定用閾値をも求め
て、登録辞書に格納させると共に、登録辞書に格納され
ている対応情報に基づいて登録文字認識手段が得た筆記
文字と登録文字との類似度と、登録文字優先判定用閾値
とを比較して、認識手段が求めた固定辞書候補文字と登
録文字認識手段が求めた登録辞書候補文字との優先順位
を決定する優先順位判定手段を設け、出力手段が、上記
優先順位調整手段が得た優先順位に従って候補文字を1
又は複数出力することは好ましい。
The predetermined rule R applied by the partial pattern automatic dividing means is based on the following dividing methods (1) to (3).
It depends on the total number of strokes . (1) For one stroke character, one stroke is divided into m strokes. (2) For characters with the number of medium strokes, the total number of strokes is m according to the stroke order.
Divide into pieces. (3) For characters with a high number of strokes, the total number of strokes is calculated according to the stroke order.
Divide each image. Here, the characters for which information is set in the fixed dictionary are divided into a plurality of divided partial patterns by the partial pattern automatic dividing means,
From the stroke information of the character and the information of the divided partial pattern by the partial pattern automatic dividing means, a parameter for each partial pattern for similarity determination required at the time of recognition is obtained,
The fixed dictionary is created, and the recognition unit uses stroke information of a character written for recognition and information on a divided partial pattern by the partial pattern automatic dividing unit.
Obtain parameters for each partial pattern, determine the similarity with the corresponding information stored in the fixed dictionary, recognize fixed dictionary candidate characters of writing characters, and fix the recognized fixed dictionary candidate characters.
It is preferable to extract from the fixed dictionary . The character registration means, the stroke information of a character that has been written for registration, and a divided portion patterns information by the partial pattern automatically dividing unit, a fixed dictionary candidate characters and registered character recognition means recognizing means extracted is extracted A registered character priority determination threshold value for determining the priority order with the registered dictionary candidate character is also obtained and stored in the registered dictionary, and the registered character recognition means is obtained based on the correspondence information stored in the registered dictionary. By comparing the similarity between the written character and the registered character with the threshold value for the registered character priority determination, the priority order between the fixed dictionary candidate character obtained by the recognition means and the registered dictionary candidate character obtained by the registered character recognition means is determined. A priority determining unit for determining the priority character, and the output unit determines one candidate character according to the priority obtained by the priority adjusting unit.
Alternatively, it is preferable to output a plurality.

【0030】この場合において、文字登録手段が、登録
のために筆記された文字のストローク情報について得た
分割部分パターン毎のパラメータと、その筆記された文
字を所定角度だけ回転させた際のストローク情報につい
て得た分割部分パターン毎のパラメータとの類似度を、
登録文字優先判定用閾値とすることは好ましい。
In this case, the character registration means obtains stroke information of a character written for registration.
And parameters of each divided partial patterns, the similarity between the parameter of the obtained divided portion patterns each for stroke information when the writing character is rotated by a predetermined angle,
It is preferable to use the threshold value for the registered character priority determination.

【0031】[0031]

【作用】筆記文字のストローク情報を認識手段が筆記文
字の部分パターン毎のパラメータに変換して、固定辞書
の照合用格納内容と類似度判定することで筆記文字を認
識するオンライン文字認識装置において、従来、文字登
録機能を持たせることができなかった一番の理由は、登
録のために筆記された文字を部分パターンにどのように
分割すれば良いかが提案されていないためである。すな
わち、固定辞書が不満足であるために登録が望まれてい
るので、登録時には、固定辞書を利用できず、部分パタ
ーンへの分割が問題になっていた。
In an online character recognition device, a recognition unit converts stroke information of a written character into parameters for each partial pattern of the written character, and determines the similarity with the stored contents of the fixed dictionary for comparison. Conventionally, the main reason why the character registration function could not be provided is that it has not been proposed how to divide characters written for registration into partial patterns. That is, since registration is desired because the fixed dictionary is unsatisfactory, the fixed dictionary cannot be used at the time of registration, and division into partial patterns has been a problem.

【0032】そこで、本発明では、筆記文字を、固定辞
書の格納情報を用いずに、上述した所定ルールRで部分
パターンに分割する部分パターン自動分割手段を設け
。このように、部分パターン自動分割手段を設けたこ
とによって、部分パターンへの分割の問題が解決される
と、文字登録手段、登録辞書、登録文字認識手段を設け
ることによって、文字登録機能を有するオンライン文字
認識装置を容易に実現できる。
Therefore, in the present invention, there is provided a partial pattern automatic dividing means for dividing a written character into partial patterns according to the above-mentioned predetermined rule R without using information stored in the fixed dictionary . As this, by providing the partial pattern automatic splitting means, a problem of division into partial patterns are resolved, character registration unit, registration dictionary, by providing the registered character recognition means, having a character registration function An online character recognition device can be easily realized.

【0033】すなわち、文字登録手段は、登録のために
筆記された文字のストローク情報と、部分パターン自動
分割手段による分割部分パターンの情報とから、認識時
に必要となる類似度判定用の分割部分パターン毎のパラ
メータを得て登録辞書に登録する。また、登録文字認識
手段は、認識のために筆記された文字のストローク情報
と、部分パターン自動分割手段による分割部分パターン
の情報とから、分割部分パターン毎のパラメータを得
て、登録辞書に格納されている対応情報との類似度判定
を行なって筆記文字を認識する。
That is, the character registering means uses the stroke information of the character written for registration and the information on the divided partial patterns by the automatic partial pattern dividing means to determine the divided partial patterns necessary for similarity determination at the time of recognition. Each parameter is obtained and registered in the registration dictionary. The registered character recognizing means obtains parameters for each divided partial pattern from stroke information of a character written for recognition and information on a divided partial pattern by the partial pattern automatic dividing means, and stores the parameter in the registered dictionary. The written character is recognized by determining the similarity with the corresponding information.

【0034】認識のために筆記された文字に対しては、
認識手段が固定辞書を用いて求めた固定辞書候補文字
と、登録文字認識手段が登録辞書を用いて求めた登録辞
書候補文字とが得られ、出力手段はこれら候補文字の1
又は複数を出力する。 なお、従来は、固定辞書は、部首
等で分割された部分パターンの情報を格納していたが、
登録辞書との整合を考慮すると、登録辞書に格納する情
報を得たと同じ方法で得た情報を固定辞書に格納し、認
識手段も、登録文字認識手段と同じ方法で認識すること
が好ましい。オンライン文字認識装置に文字登録機能を
持たせた場合、認識手段が固定辞書を用いて求めた固定
辞書候補文字と、登録文字認識手段が登録辞書を用いて
求めた登録辞書候補文字との間の優先順位が問題とな
る。
For the characters written for recognition,
Fixed dictionary candidate characters obtained by the recognition means using the fixed dictionary
And the registered word obtained by the registered character recognition means using the registered dictionary
And the output unit outputs one of these candidate characters.
Or output a plurality. Conventionally, fixed dictionaries are
Stored information on partial patterns divided by
Considering the consistency with the registered dictionary, the information stored in the registered dictionary
Information obtained in the same way as information was stored in a fixed dictionary and
Recognition means should be recognized in the same way as registered character recognition means.
Is preferred. If which gave character registration function online character recognition device, a fixed recognition means is determined using a fixed dictionary
A dictionary candidate characters, the priority between the registration dictionary candidate characters registered character recognition means is determined using the registered dictionary becomes a problem.

【0035】そこで、文字登録手段が、分割部分パター
ンのパラメータを求めて登録辞書に登録させる際に、認
識手段が求めた固定辞書候補文字と登録文字認識手段が
求めた登録辞書候補文字との優先順位を決定するための
登録文字優先判定用閾値をも求めて、登録辞書に格納さ
せるようにし、優先順位判定手段が、登録辞書に格納さ
れている対応情報に基づいて登録文字認識手段が得た筆
記文字と登録文字との類似度と、登録文字優先判定用閾
値とを比較して、認識手段が抽出した固定辞書候補文字
と登録文字認識手段が抽出した登録辞書候補文字との優
先順位を決定するようにすることが好ましい。
Therefore, when the character registration means obtains the parameters of the divided partial patterns and registers them in the registration dictionary, priority is given to the fixed dictionary candidate characters obtained by the recognition means and the registered dictionary candidate characters obtained by the registration character recognition means. A registered character priority determination threshold value for determining the order is also obtained and stored in the registered dictionary, and the registered character recognition unit obtains the priority order determining unit based on the correspondence information stored in the registered dictionary. By comparing the similarity between the written character and the registered character and the threshold value for determining the priority of the registered character, the priority of the fixed dictionary candidate character extracted by the recognition unit and the registered dictionary candidate character extracted by the registered character recognition unit is determined. It is preferable to do so.

【0036】登録文字の筆跡の特徴を活かしつつ筆跡の
変動を予測、吸収できることに鑑みると、文字登録手段
が、登録のために筆記された文字のストローク情報につ
いて得た分割部分パターン毎のパラメータと、その筆記
された文字を所定角度だけ回転させた際のストローク情
報について得た分割部分パターン毎のパラメータとの類
似度を、登録文字優先判定用閾値とすることは好まし
い。
In view of the fact that handwriting fluctuations can be predicted and absorbed while making use of the characteristics of handwriting of registered characters, the character registration means uses parameters for each divided partial pattern obtained for stroke information of characters written for registration. It is preferable that the similarity between the stroke information obtained when the written character is rotated by a predetermined angle and the parameter obtained for each of the divided partial patterns is used as the registered character priority determination threshold value.

【0037】[0037]

【実施例】(A)第1実施例 以下、本発明によるオンライン文字認識装置の第1実施
例を図面を参照しながら詳述する。ここで、図1がこの
第1実施例のオンライン文字認識装置の機能ブロック構
成を示すものであり、図2との同一、対応部分には同一
符号を付して示している。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS (A) First Embodiment Hereinafter, a first embodiment of an online character recognition device according to the present invention will be described in detail with reference to the drawings. Here, FIG. 1 shows a functional block configuration of the online character recognition apparatus of the first embodiment, and the same and corresponding parts as those in FIG. 2 are denoted by the same reference numerals.

【0038】図1において、この第1実施例のオンライ
ン文字認識装置も、タブレット(座標入力手段)1、特
徴点抽出手段2及びストローク抽出手段3を備えてい
る。また、第1実施例のオンライン文字認識装置は、認
識手段4に代えて認識・登録手段4aを備え、固定辞書
5(図4及び図6参照)に代えて別構成の辞書5aを備
えている。さらに、第1実施例のオンライン文字認識装
置は部分パターン自動分割手段7を備えている。
In FIG. 1, the online character recognition apparatus of the first embodiment also includes a tablet (coordinate input means) 1, a feature point extracting means 2, and a stroke extracting means 3. Further, the online character recognition device of the first embodiment includes a recognition / registration unit 4a instead of the recognition unit 4, and a dictionary 5a of another configuration instead of the fixed dictionary 5 (see FIGS. 4 and 6). . Further, the online character recognition device of the first embodiment is provided with an automatic partial pattern dividing means 7.

【0039】第1実施例のオンライン文字認識装置は、
筆記文字の認識機能だけではなく、筆記文字の登録機能
をも備えており、この登録機能を実現できるように、図
2に示した従来の構成とは異なるようになされている。
The online character recognition device of the first embodiment is
It has not only a function of recognizing written characters but also a function of registering written characters, and is configured differently from the conventional configuration shown in FIG. 2 so as to realize this registered function.

【0040】なお、実際上、特徴点抽出手段2、ストロ
ーク抽出手段3、認識・登録手段4a及び部分パターン
自動分割手段7は、ソフトウェアによって構成されるこ
とが多い。
In practice, the feature point extracting means 2, the stroke extracting means 3, the recognition / registering means 4a and the partial pattern automatic dividing means 7 are often constituted by software.

【0041】ストローク抽出手段3に至るまでの接続構
成及び各部での処理は、従来と同様である。
The connection configuration up to the stroke extracting means 3 and the processing in each section are the same as in the prior art.

【0042】すなわち、この第1実施例においても、タ
ブレット1から時系列的に出力された座標データから、
特徴点抽出手段2はストロークの始点、終点、屈曲点等
の特徴を表す座標データ(極点座標データ)を抽出し、
このようにして抽出された1ストローク分の座標データ
から、ストローク抽出手段3は各ストロークを分類して
予め決められているストロークコードを付与するように
なされている。
That is, also in the first embodiment, the coordinate data output in time series from the tablet 1
The feature point extracting means 2 extracts coordinate data (polar coordinate data) representing features such as a starting point, an ending point, and a bending point of a stroke.
From the coordinate data of one stroke extracted in this way, the stroke extracting means 3 classifies each stroke and assigns a predetermined stroke code.

【0043】タブレット1、特徴点抽出手段2及びスト
ローク抽出手段3は、当該オンライン文字認識装置が登
録モードでも認識モードでも機能するものであり、上述
の処理を行なう。なお、図示は省略するが、登録モード
か認識モードかは、例えばメニューボタンによって選択
できるようになされている。
The tablet 1, the feature point extracting means 2, and the stroke extracting means 3 function in both the registration mode and the recognition mode of the online character recognition device, and perform the above-described processing. Although not shown, the user can select the registration mode or the recognition mode by using, for example, a menu button.

【0044】部分パターン自動分割手段7は、登録モー
ドでも認識モードでも機能するものであり、筆記文字を
部分パターンに自動的に分割するものである。なお、特
許請求の範囲では、部分パターン自動分割手段が分割し
て得た部分パターンを分割部分パターンと表現している
(他の実施例に関しても同様)。部分パターン自動分割
手段7は、まず筆記された文字の画数を検出し、その画
数に応じて、以下のような所定ルールに従って部分パタ
ーンに分割する。すなわち、筆記文字の部首を考慮する
ことなく分割を行なう。
The automatic partial pattern dividing means 7 functions in both the registration mode and the recognition mode, and automatically divides a written character into partial patterns. In addition,
In the claims, the partial pattern automatic division means
Is expressed as a divided partial pattern
(The same applies to other embodiments). The partial pattern automatic division means 7 first detects the number of strokes of the written character, and divides the character into partial patterns according to the following rule according to the number of strokes. That is, division is performed without considering the radical of the written character.

【0045】部分パターン自動分割手段7が採用する分
割ルールは、以下に例示したいずれであっても良い。
The division rule adopted by the partial pattern automatic division means 7 may be any of the following examples.

【0046】(1)低画数の文字に対しては1個のスト
ロークをm個に分割する。
(1) For a character with a small number of strokes, one stroke is divided into m strokes.

【0047】(2)総画数を筆順に従ってm個に分割す
る。
(2) The total number of strokes is divided into m pieces according to the stroke order.

【0048】(3)総画数を筆順に従ってm画ずつ分割
する。
(3) The total number of strokes is divided into m strokes according to the stroke order.

【0049】(4)上記(1)〜(3)の分割方法を総
画数に応じて使い分ける。
(4) The above-mentioned dividing methods (1) to (3) are properly used according to the total number of strokes.

【0050】ここで、分割ルール(4)について、具体
的な例を挙げれば、(i) 総画数が1画の文字に対しては
1個のストロークを始点から終点への座標列の中間の座
標点で2分割し、(ii)総画数が2〜6画の場合には総画
数を筆順に従って3分割し(なお、2画の場合は座標列
に基づいて3分割し、3画以上の場合にはストローク単
位に3分割する)、(iii) 総画数が7画以上の場合には
総画数を筆順に従って3画ずつ分割する。
Here, a specific example of the division rule (4) is as follows: (i) For a character having a total stroke number of one stroke, one stroke is placed in the middle of the coordinate sequence from the start point to the end point. (Ii) When the total number of strokes is two to six, the total number of strokes is divided into three according to the stroke order. In this case, the stroke is divided into three strokes.) (Iii) When the total stroke number is 7 or more, the total stroke number is divided into three strokes according to the stroke order.

【0051】但し、このようにストロークの途中で分割
を行なう場合は、極点座標データではなく、元のXY座
標データを用いる。
However, when the division is performed in the middle of the stroke, the original XY coordinate data is used instead of the extreme point coordinate data.

【0052】このような分割ルールに従う場合におい
て、筆記文字が1画の「2」であれば、図8(a)に示
すように中間座標点に基づいて2分割され、筆記文字が
5画の「本」であれば、図8(b)に示すように2画、
2画、1画に3分割され、筆記文字が10画の「株」で
あれば、図8(c)に示すように、基本的には3画ずつ
で3画より少ない残った画数部分はその画数で、すなわ
ち3画、3画、3画、1画に4分割される。このような
各分割パターンが部分パターンとなる。
In the case of following such a division rule, if the writing character is "2" of one stroke, it is divided into two based on the intermediate coordinate points as shown in FIG. If it is a "book", as shown in FIG.
If the stroke is divided into two strokes and one stroke and the writing character is “stock” with ten strokes, as shown in FIG. The number of strokes is divided into four, ie, three, three, three, and one strokes. Each such divided pattern is a partial pattern.

【0053】認識・登録手段4aは、登録モードでも認
識モードでも機能するものである。まず、認識・登録手
段4aの登録モードでの動作を説明する。
The recognition / registration means 4a functions in both the registration mode and the recognition mode. First, the operation of the recognition / registration unit 4a in the registration mode will be described.

【0054】当該オンライン文字認識装置が登録モード
のときには、部分パターン自動分割手段7が分割して得
た部分パターンの情報が、特徴点抽出手段2が抽出した
各ストロークの座標データやストローク抽出手段3が分
類したストロークコードの情報と共に、認識・登録手段
4aに与えられる。
When the on-line character recognition device is in the registration mode, the information on the partial pattern obtained by the division by the partial pattern automatic dividing means 7 is used as the coordinate data of each stroke extracted by the feature point extracting means 2 and the stroke extracting means 3. Is given to the recognizing / registering means 4a together with the information on the stroke codes classified by the.

【0055】認識・登録手段4aは、入力された情報を
処理し、認識処理で必要となる部分パターン毎のパラメ
ータを得て辞書5a内の登録辞書部5a2に格納させ
る。この第1実施例の場合、求める部分パターン毎のパ
ラメータを、部分パターン間ベクトル、部分パターンQ
値(Q1 〜Q16)及び部分パターンストロークコード分
布とする。これらパラメータは、部分パターン自動分割
手段7が分割して得た部分パターン毎に求められるとい
う点では従来とは異なるが、従来のオンライン文字認識
装置が認識時に求めると同様な処理によって求められ
る。
The recognition / registration means 4a processes the input information, obtains parameters for each partial pattern required for the recognition processing, and stores the parameters in the registered dictionary section 5a2 in the dictionary 5a. In the case of the first embodiment, the parameters for each of the partial patterns to be obtained are defined as a vector between partial patterns, a partial pattern Q
Values (Q1 to Q16) and partial pattern stroke code distribution. These parameters are different from the conventional one in that they are obtained for each partial pattern obtained by division by the automatic partial pattern dividing means 7, but are obtained by the same processing as that performed by the conventional online character recognition apparatus at the time of recognition.

【0056】登録文字に対しては、部分パターンが部首
等に無関係に決定されるので、辞書5aの登録辞書5a
2を従来装置の固定辞書5(図4及び図6参照)と同様
な構成にすることはできない。そのため、図9に例示す
るように、各文字毎に、部分パターン間ベクトル、部分
パターンQ値(Q1 〜Q16)及び部分パターンストロー
クコード分布を持たせる構成となる。この他、検索が容
易になるように総画数等の情報を持たせる。
For the registered characters, the partial pattern is determined irrespective of the radical, etc., so that the registered dictionary 5a of the dictionary 5a
2 cannot have the same configuration as the fixed dictionary 5 of the conventional device (see FIGS. 4 and 6). Therefore, as shown in FIG. 9, each character has a partial pattern vector, a partial pattern Q value (Q1 to Q16) and a partial pattern stroke code distribution. In addition, information such as the total number of strokes is provided to facilitate retrieval.

【0057】なお、登録時には、登録モードを指示し、
登録しようとする文字の情報(例えばJISコード)を
入力し、その後、タブレット1に筆記することを行なう
ように、ユーザに予め指示しておく。
At the time of registration, a registration mode is instructed.
The user is instructed in advance to input information (for example, JIS code) of the character to be registered, and then to write on the tablet 1.

【0058】この第1実施例の場合、辞書5aの固定辞
書部5a1も、従来装置の辞書5(図4及び図6参照)
と異なる構成を有する(なお、同じでも良いが)。辞書
5aの固定辞書部5a1は、画数毎に分けられている点
は従来装置の辞書5と同様であるが、各文字毎に、部分
パターン間ベクトル、部分パターンQ値(Q1 〜Q16)
及び部分パターンストロークコード分布を持たせる構成
を有し、この点では、登録辞書部5a2と同様な構成を
有する。
In the case of the first embodiment, the fixed dictionary section 5a1 of the dictionary 5a is also the dictionary 5 of the conventional device (see FIGS. 4 and 6).
(Although it may be the same). The fixed dictionary section 5a1 of the dictionary 5a is the same as the dictionary 5 of the conventional apparatus in that it is divided according to the number of strokes. However, for each character, a vector between partial patterns and a partial pattern Q value (Q1 to Q16) are provided.
And a configuration in which a partial pattern stroke code distribution is provided. In this respect, the configuration is the same as that of the registered dictionary unit 5a2.

【0059】すなわち、この第1実施例においては、固
定辞書部5a1を形成する際にも、部分パターン自動分
割手段7が行なう部分パターンへの分割方法を採用し
て、格納する各種パラメータを得るようにしている。
That is, in the first embodiment, even when the fixed dictionary section 5a1 is formed, various parameters to be stored are obtained by adopting the method of dividing into partial patterns performed by the automatic partial pattern dividing means 7. I have to.

【0060】認識・登録手段4aは、当該オンライン文
字認識装置が認識モードでは、従来の認識手段4とほぼ
同様な動作を行なう。すなわち、辞書の情報を利用した
部分パターンの分割を行なわず、部分パターン自動分割
手段7が分割した部分パターンの情報を利用する点を除
き、従来の認識手段4とほぼ同様な動作を行なう。
The recognizing / registering means 4a performs almost the same operation as the conventional recognizing means 4 when the on-line character recognition device is in the recognition mode. That is, the operation is substantially the same as that of the conventional recognition means 4 except that the partial pattern is not divided using the dictionary information and the partial pattern automatic dividing means 7 uses the information of the divided partial patterns.

【0061】認識・登録手段4aは、特徴点抽出手段2
が抽出した各ストロークの座標データと、ストローク抽
出手段3が分類したストロークコードの情報と、部分パ
ターン自動分割手段7が分割した部分パターンの情報
と、辞書5aの格納内容とから、従来と同様な方法によ
り認識を行なう。このようにして得られた筆記文字に対
する候補文字の情報は、出力端子6を介して外部装置
(例えば表示装置)に与えられる。
Recognition / registration means 4 a
From the coordinate data of each of the strokes extracted, the information on the stroke codes classified by the stroke extracting means 3, the information on the partial patterns divided by the automatic partial pattern dividing means 7, and the contents stored in the dictionary 5a. Recognition is performed by the method. Information on candidate characters for the written characters obtained in this manner is provided to an external device (for example, a display device) via the output terminal 6.

【0062】より具体的に説明すると、認識・登録手段
4aは、筆記文字の総画数に基づいて、固定辞書部5a
1及び登録辞書部5a2に格納されている文字のうち候
補にできるものを絞り込んだ後、部分パターン自動分割
手段7が分割して得た部分パターンの情報、特徴点抽出
手段2が抽出した各ストロークの座標データ、ストロー
ク抽出手段3が分類したストロークコードの情報に基づ
いて、筆記文字についての部分パターン間ベクトル、部
分パターンQ値(Q1 〜Q16)及び部分パターンストロ
ークコード分布を求めながら、従来の認識手段4が実行
すると同様にして、固定辞書部5a1及び登録辞書部5
a2に格納されている文字とのマッチングを行ない(上
記(1) 式参照)、総合マッチング距離値Dが小さいもの
ほど高い候補順位を付与する。
More specifically, the recognizing / registering means 4a determines whether the fixed dictionary unit 5a
1 and the characters stored in the registered dictionary section 5a2 are narrowed down to those that can be candidates, information on partial patterns obtained by division by the partial pattern automatic division means 7, and each stroke extracted by the feature point extraction means 2 While obtaining the inter-pattern vector, the partial pattern Q value (Q1 to Q16) and the partial pattern stroke code distribution for the written characters based on the coordinate data of The fixed dictionary unit 5a1 and the registered dictionary unit 5
Matching with the character stored in a2 is performed (see the above equation (1)), and the smaller the total matching distance value D is, the higher the candidate rank is given.

【0063】従って、上記第1実施例によれば、部分パ
ターン自動分割手段7を設けて、辞書(固定辞書)を参
照しないでも筆記文字を部分パターンに分割できるよう
にしたので、登録機能をオンライン文字認識装置に持た
せることができるようになった。その結果、固定辞書だ
けでは認識率が低くなるような筆記者の癖や筆順の記憶
違いの文字をも、登録機能を使うことで高い認識率にし
得る。
Therefore, according to the first embodiment, the partial pattern automatic dividing means 7 is provided so that the written characters can be divided into the partial patterns without referring to the dictionary (fixed dictionary). Character recognition devices can now be used. As a result, by using the registration function, it is possible to increase the recognition rate even for characters having a writer's habit or a miswritten stroke order whose recognition rate is low only with the fixed dictionary.

【0064】(B)第2実施例 次に、本発明によるオンライン文字認識装置の第2実施
例を図面を参照しながら詳述する。ここで、図10がこ
の第2実施例のオンライン文字認識装置の機能ブロック
構成を示すものであり、図1、図2との同一、対応部分
には同一符号を付して示している。
(B) Second Embodiment Next, a second embodiment of the online character recognition device according to the present invention will be described in detail with reference to the drawings. Here, FIG. 10 shows a functional block configuration of the online character recognition device of the second embodiment, and the same and corresponding parts as in FIGS. 1 and 2 are denoted by the same reference numerals.

【0065】図10において、この第2実施例のオンラ
イン文字認識装置も、従来装置と同様に、タブレット
(座標入力手段)1、特徴点抽出手段2、ストローク抽
出手段3、認識手段4及び固定辞書5を備えている。こ
れに加えて、第2実施例のオンライン文字認識装置は、
部分パターン自動分割手段7、文字登録手段8、登録辞
書9及び登録文字認識・優先順位調整手段10を備えて
いる。
Referring to FIG. 10, the on-line character recognition apparatus of the second embodiment also has a tablet (coordinate input means) 1, a feature point extraction means 2, a stroke extraction means 3, a recognition means 4, and a fixed dictionary, like the conventional apparatus. 5 is provided. In addition to this, the online character recognition device of the second embodiment
The apparatus includes an automatic partial pattern dividing unit 7, a character registering unit 8, a registered dictionary 9, and a registered character recognition / priority adjusting unit 10.

【0066】なお、実際上、特徴点抽出手段2、ストロ
ーク抽出手段3、認識手段4、部分パターン自動分割手
段7、文字登録手段8及び登録文字認識・優先順位調整
手段10は、ソフトウェアによって構成されることが多
い。
In practice, the feature point extracting means 2, the stroke extracting means 3, the recognizing means 4, the automatic partial pattern dividing means 7, the character registering means 8, and the registered character recognizing / priority adjusting means 10 are constituted by software. Often.

【0067】第1実施例では、固定辞書部5a1をも新
たに構成したものであるが、固定辞書を新たに形成する
ことは大変であるので、この第2実施例では、従来装置
の固定辞書5をそのまま用いている。
In the first embodiment, the fixed dictionary section 5a1 is also newly constructed. However, it is difficult to form a new fixed dictionary. 5 is used as it is.

【0068】ストローク抽出手段3に至るまでの接続構
成及び各部での処理は、従来と同様である。
The connection configuration up to the stroke extracting means 3 and the processing in each section are the same as in the prior art.

【0069】すなわち、この第2実施例においても、タ
ブレット1から時系列的に出力された座標データから、
特徴点抽出手段2はストロークの始点、終点、屈曲点等
の特徴を表す座標データ(極点座標データ)を抽出し、
このようにして抽出された1ストローク分の座標データ
から、ストローク抽出手段3は各ストロークを分類して
予め決められているストロークコードを付与するように
なされている。タブレット1、特徴点抽出手段2及びス
トローク抽出手段3は、当該オンライン文字認識装置が
登録モードでも認識モードでも機能するものであり、上
述の処理を行なう。
That is, also in the second embodiment, the coordinate data output in time series from the tablet 1
The feature point extracting means 2 extracts coordinate data (polar coordinate data) representing features such as a starting point, an ending point, and a bending point of a stroke.
From the coordinate data of one stroke extracted in this way, the stroke extracting means 3 classifies each stroke and assigns a predetermined stroke code. The tablet 1, the feature point extracting unit 2 and the stroke extracting unit 3 function in both the registration mode and the recognition mode of the online character recognition device, and perform the above-described processing.

【0070】また、この第2実施例の部分パターン自動
分割手段7も、第1実施例の部分パターン自動分割手段
7と同一の動作を行なう。
The automatic partial pattern dividing means 7 of the second embodiment performs the same operation as the automatic partial pattern dividing means 7 of the first embodiment.

【0071】当該オンライン文字認識装置が登録モード
のときには、部分パターン自動分割手段7が分割して得
た部分パターンの情報が、特徴点抽出手段2が抽出した
各ストロークの座標データやストローク抽出手段3が分
類したストロークコードの情報と共に、文字登録手段8
に与えられる。
When the online character recognition device is in the registration mode, the information on the partial pattern obtained by the division by the partial pattern automatic dividing means 7 is used as the coordinate data of each stroke extracted by the feature point extracting means 2 and the stroke extracting means 3. Along with the stroke code information classified by
Given to.

【0072】文字登録手段8は、入力された情報を処理
し、認識処理で必要となる部分パターン毎のパラメータ
を得て登録辞書9に格納させる。この第2実施例の場合
も、求める部分パターン毎のパラメータを、部分パター
ン間ベクトル、部分パターンQ値(Q1 〜Q16)及び部
分パターンストロークコード分布である。これらパラメ
ータは、部分パターン自動分割手段7が分割して得た部
分パターン毎に求められるという点では従来とは異なる
が、従来のオンライン文字認識装置が認識時に求めると
同様な処理によって求められる。
The character registration means 8 processes the input information, obtains parameters for each partial pattern required for the recognition processing, and stores the parameters in the registration dictionary 9. Also in the case of the second embodiment, the parameters for each partial pattern to be obtained are a partial pattern vector, a partial pattern Q value (Q1 to Q16) and a partial pattern stroke code distribution. These parameters are different from the conventional one in that they are obtained for each partial pattern obtained by division by the automatic partial pattern dividing means 7, but are obtained by the same processing as that performed by the conventional online character recognition apparatus at the time of recognition.

【0073】第1実施例と同様に、登録文字に対して
は、部分パターンが部首等に無関係に決定されるので、
登録辞書9を固定辞書5(図4及び図6参照)と同様な
構成にすることはできず、この第2実施例の登録辞書9
も、上述した図9に例示するように、各文字(JISコ
ード)毎に、部分パターン間ベクトル、部分パターンQ
値(Q1 〜Q16)及び部分パターンストロークコード分
布を持たせる構成を有し、この他、検索が容易になるよ
うに総画数等の情報を有する。
As in the first embodiment, since a partial pattern is determined for a registered character regardless of the radical or the like,
The configuration of the registered dictionary 9 cannot be the same as that of the fixed dictionary 5 (see FIGS. 4 and 6).
Also, as illustrated in FIG. 9 described above, for each character (JIS code), a vector between partial patterns, a partial pattern Q
It has a configuration for giving values (Q1 to Q16) and a partial pattern stroke code distribution, and also has information such as the total number of strokes for easy retrieval.

【0074】なお、登録時には、登録モードを指示し、
登録しようとする文字の情報(例えばJISコード)を
入力し、その後、タブレット1に筆記することを行なう
ように、ユーザに予め指示しておく。
At the time of registration, a registration mode is instructed.
The user is instructed in advance to input information (for example, JIS code) of the character to be registered, and then to write on the tablet 1.

【0075】認識手段4は、当該オンライン文字認識装
置が認識モードで機能するものであり、従来と同様な動
作を行なうものである。すなわち、部分パターン自動分
割手段7が分割した部分パターンの情報は利用しない
で、認識手段4は、特徴点抽出手段2が抽出した各スト
ロークの座標データと、ストローク抽出手段3が分類し
たストロークコードの情報と、辞書5の格納内容とか
ら、従来と同様な方法により認識を行なう。このように
して得られた筆記文字に対する候補文字の情報は、登録
文字認識・優先順位調整手段10に与えられる。
The recognizing means 4 functions as the on-line character recognizing device operates in the recognizing mode, and performs the same operation as the conventional one. That is, the information of the partial pattern divided by the automatic partial pattern dividing means 7 is not used, and the recognizing means 4 uses the coordinate data of each stroke extracted by the feature point extracting means 2 and the stroke code of the stroke code classified by the stroke extracting means 3. Recognition is performed from the information and the contents stored in the dictionary 5 in the same manner as in the related art. The information on the candidate characters for the written characters obtained in this way is given to the registered character recognition / priority adjusting means 10.

【0076】登録文字認識・優先順位調整手段10も、
当該オンライン文字認識装置が認識モードで機能するも
のである。
The registered character recognition / priority adjusting means 10 also
The online character recognition device functions in a recognition mode.

【0077】登録文字認識・優先順位調整手段10に
は、部分パターン自動分割手段7が分割して得た部分パ
ターンの情報、特徴点抽出手段2が抽出した各ストロー
クの座標データ、ストローク抽出手段3が分類したスト
ロークコードの情報が与えられる。登録文字認識・優先
順位調整手段10は、総画数に基づいて、登録辞書9に
格納されている文字を絞り込んだ後、部分パターン自動
分割手段7が分割して得た部分パターンの情報、特徴点
抽出手段2が抽出した各ストロークの座標データ、スト
ローク抽出手段3が分類したストロークコードの情報に
基づいて、筆記文字についての部分パターン間ベクト
ル、部分パターンQ値(Q1 〜Q16)及び部分パターン
ストロークコード分布を求めながら、認識手段4が実行
すると同様にして、登録辞書9に格納されている文字と
のマッチングを行ない(上記(1) 式参照)、登録辞書9
に筆記文字が登録されているか否か、登録されていると
捕えられる文字が複数あればその候補順位を決定する。
The registered character recognition / priority adjusting means 10 includes information on partial patterns obtained by division by the partial pattern automatic dividing means 7, coordinate data of each stroke extracted by the feature point extracting means 2, and stroke extracting means 3. Is given. The registered character recognition / priority order adjusting means 10 narrows down the characters stored in the registered dictionary 9 based on the total number of strokes, and then obtains information on partial patterns and feature points obtained by the automatic division of the partial pattern by the partial pattern dividing means 7. Based on the coordinate data of each stroke extracted by the extracting means 2 and the information of the stroke code classified by the stroke extracting means 3, the partial pattern vector, the partial pattern Q value (Q1 to Q16) and the partial pattern While obtaining the distribution, the matching with the characters stored in the registered dictionary 9 is performed in the same manner as the recognition unit 4 executes (see the above equation (1)).
If there is more than one character that can be captured as a registered character, the candidate order is determined.

【0078】そして、登録文字認識・優先順位調整手段
10は、認識手段4が得た1以上の候補文字と、登録辞
書9に登録されていた1以上の候補文字との出力順序を
決定して出力端子6から次の装置(例えば表示装置)に
出力する。
Then, the registered character recognition / priority adjusting means 10 determines the output order of the one or more candidate characters obtained by the recognition means 4 and the one or more candidate characters registered in the registration dictionary 9. Output from the output terminal 6 to the next device (for example, a display device).

【0079】ここで、常に、認識手段4が得た候補文字
を登録辞書9とのマッチングで得た候補文字より優先さ
せても良く、また、登録辞書9とのマッチングで得た候
補文字を認識手段4が得た候補文字より優先させても良
い。さらに、この第2実施例の場合には、登録文字につ
いても総合マッチング距離値D(上記(1) 式参照)が得
られるので、両者の候補文字を、総合マッチング距離値
Dで順位付けを行なうようにしても良い。
Here, the candidate character obtained by the recognizing means 4 may always be given priority over the candidate character obtained by matching with the registered dictionary 9, or the candidate character obtained by matching with the registered dictionary 9 may be recognized. The priority may be given to the candidate character obtained by the means 4. Further, in the case of the second embodiment, since the total matching distance value D (refer to the above equation (1)) is obtained also for the registered characters, both candidate characters are ranked by the total matching distance value D. You may do it.

【0080】従って、この第2実施例によっても、部分
パターン自動分割手段7を設けて、辞書を参照しないで
も筆記文字を部分パターンに分割できるようにしたの
で、登録機能をオンライン文字認識装置に持たせること
ができるようになった。しかも、第2実施例によれば、
既存の固定辞書5は、そのまま用いることができる。
Therefore, according to the second embodiment as well, the automatic partial pattern dividing means 7 is provided so that the written character can be divided into the partial patterns without referring to the dictionary. You can now let. Moreover, according to the second embodiment,
The existing fixed dictionary 5 can be used as it is.

【0081】(C)第3実施例 次に、本発明によるオンライン文字認識装置の第3実施
例を図面を参照しながら詳述する。ここで、図11がこ
の第3実施例のオンライン文字認識装置の機能ブロック
構成を示すものであり、図10との同一、対応部分には
同一符号を付して示している。
(C) Third Embodiment Next, a third embodiment of the online character recognition device according to the present invention will be described in detail with reference to the drawings. Here, FIG. 11 shows a functional block configuration of the online character recognition device of the third embodiment, and the same and corresponding parts as in FIG. 10 are denoted by the same reference numerals.

【0082】この第3実施例は、第2実施例と比較し
て、文字登録手段8に代えて文字登録・閾値設定手段8
aが設けられている点、及び、登録辞書9a及び登録文
字認識・優先順位調整手段10aの処理が異なってい
る。
The third embodiment is different from the second embodiment in that the character registration / threshold setting means 8 is used instead of the character registration means 8.
a is provided, and the processing of the registered dictionary 9a and the registered character recognition / priority adjusting means 10a is different.

【0083】この第3実施例においては、文字登録・閾
値設定手段8aに、少なくとも部分パターン自動分割手
段7が分割して得た部分パターンの情報と特徴点抽出手
段2が抽出した各ストロークの座標データが与えられ
る。
In the third embodiment, the character registration / threshold setting means 8a stores at least information on partial patterns obtained by division by the partial pattern automatic division means 7 and coordinates of each stroke extracted by the feature point extraction means 2. Data is given.

【0084】文字登録・閾値設定手段8aは、部分パタ
ーンの情報と各ストロークの座標データとから、筆記文
字の総画数、部分パターン毎のQ値(Q1 〜Q16)、及
び、登録文字優先判定用閾値を求めて登録辞書9aに、
文字情報(登録モードの指示と併せて入力されたJIS
コード)に対応させて格納させる。図12は、この第3
実施例での登録辞書9aの構成を示すものである。
The character registration / threshold setting means 8a calculates the total number of strokes of the written characters, the Q value for each partial pattern (Q1 to Q16), and the registered character priority determination from the information on the partial pattern and the coordinate data of each stroke. The threshold value is obtained and registered in the registered dictionary 9a.
Character information (JIS data entered with the registration mode instruction)
Code). FIG.
3 shows a configuration of a registration dictionary 9a in the embodiment.

【0085】文字登録・閾値設定手段8aが、筆記文字
の総画数及び部分パターン毎のQ値(Q1 〜Q16)を求
める方法は、従来と同様であり、その説明は省略する
(Q値成分については(3) 式参照)。
The method by which the character registration / threshold setting means 8a obtains the total number of strokes of the written characters and the Q value (Q1 to Q16) for each partial pattern is the same as the conventional method, and the description is omitted (for the Q value component). Is the formula (3)).

【0086】この第3実施例においては、登録文字に対
する認識処理は、総画数を除けば、部分パターン毎のQ
値(Q1 〜Q16)だけで行なうようにしている。これ
は、固定辞書5は不特定多数の筆記者を対象としている
ので、多くの観点(パラメータ)から認識する必要があ
るが、登録文字に対しては登録した筆記者だけを対象に
すれば良いので、認識のためのパラメータが少なくても
高い認識率で認識できること、及び、このようにする
と、登録辞書9aの必要容量を削減できると共に、文字
登録・閾値設定手段8a及び登録文字認識・優先順位調
整手段10aの処理量を削減できることに鑑みてなされ
ている。
In the third embodiment, the recognition process for the registered characters is performed by using the Q for each partial pattern except for the total number of strokes.
Only the values (Q1 to Q16) are used. This is because the fixed dictionary 5 is intended for an unspecified number of writers, and therefore needs to be recognized from many viewpoints (parameters). However, the registered characters need only be registered for the registered writers. Therefore, it is possible to perform recognition with a high recognition rate even if the number of parameters for recognition is small, and in this way, it is possible to reduce the required capacity of the registration dictionary 9a, and to perform character registration / threshold setting means 8a and registered character recognition / priority. This is done in view of the fact that the processing amount of the adjusting means 10a can be reduced.

【0087】登録文字優先判定用閾値は、登録辞書9a
に格納されていた候補文字を固定辞書5に格納されてい
た候補文字より高い順位で出力させるのか、固定辞書5
に格納されていた候補文字を登録辞書9aに格納されて
いた候補文字より高い順位で出力させるのかを判定させ
るための情報であり、登録文字認識・優先順位調整手段
10aが利用するものである。
The registered character priority determination threshold is determined by the registered dictionary 9a.
Output the candidate characters stored in the fixed dictionary 5 in a higher order than the candidate characters stored in the fixed dictionary 5.
Is used to determine whether or not to output the candidate characters stored in the registered dictionary 9a in a higher order than the candidate characters stored in the registered dictionary 9a, and is used by the registered character recognition / priority adjusting means 10a.

【0088】文字登録・閾値設定手段8aは、入力され
た座標データXj ,Yj から部分パターンQ値(これは
登録辞書9aに登録されるものであり、Qd1〜Qd16 で
表す)を求め、また、登録文字の筆跡の特徴を活かしつ
つ筆跡の変動を予測、吸収するために、各座標データX
j ,Yj を角度θだけ回転させて得られた座標データX
θj ,Yθj から部分パターンQ値(以下、q1 〜q16
で表す)を求め、もとの座標データXj ,Yj から求め
られた部分パターンQ値Qd1〜Qd16 と、回転させた座
標データXθj ,Yθj から求められた部分パターンQ
値q1 〜q16とのマッチング距離値を登録文字優先判定
用閾値kとする。
The character registration / threshold setting means 8a calculates a partial pattern Q value (which is registered in the registration dictionary 9a and is represented by Qd1 to Qd16) from the input coordinate data Xj and Yj. To predict and absorb handwriting fluctuations while utilizing the characteristics of handwriting of registered characters, coordinate data X
coordinate data X obtained by rotating j and Yj by an angle θ
From the θj and Yθj, the partial pattern Q value (hereinafter, q1 to q16)
), And the partial pattern Q values Qd1 to Qd16 obtained from the original coordinate data Xj and Yj, and the partial pattern Q obtained from the rotated coordinate data Xθj and Yθj.
A matching distance value between the values q1 to q16 is set as a registered character priority determination threshold value k.

【0089】図13は、各座標データXj ,Yj を角度
θだけ回転させても、登録文字の筆跡の特徴を残って筆
跡の変動を予測、吸収できることの説明図である。
FIG. 13 is an explanatory diagram showing that even if each of the coordinate data Xj and Yj is rotated by the angle θ, the variation of the handwriting can be predicted and absorbed while retaining the characteristics of the handwriting of the registered character.

【0090】回転前後の座標データXj ,Yj 及びXθ
j ,Yθj には、周知のように(5)式に示す関係があ
る。また、上述のように求められる登録文字優先判定用
閾値kは、式で表すと(6) 式の通りである。
Coordinate data Xj, Yj and Xθ before and after rotation
As is well known, j and Yθj have the relationship shown in equation (5). In addition, the threshold value k for determining a registered character priority determined as described above is represented by Expression (6).

【0091】 Xθj =Xj ・cos θ−Yj ・sin θ Yθj =Xj ・sin θ+Yj ・cos θ …(5) k=ΣΣ|Qdik −qik| …(6) (総和ΣΣは、部分パターンi(1〜b)と、部分パタ
ーンQ値k(1〜16)とについてである)なお、低画
数の文字では筆跡の変動が大きいので、閾値kを大きく
して良く、例えば、1画の文字に対してはθを30度、
2画以上の文字に対してはθを20度にするようにして
も良い。また、筆記者がθを任意に選定できるようにし
ても良い。
Xθj = Xj · cos θ−Yj · sin θ Yθj = Xj · sin θ + Yj · cos θ (5) k = {| Qdik−qik | (6) (The sum is the partial pattern i (1 to b) and the partial pattern Q value k (1 to 16). Note that, for a character with a small number of strokes, the handwriting fluctuates greatly, so that the threshold k may be increased. Is θ 30 degrees,
For characters with two or more strokes, θ may be set to 20 degrees. Also, the writer may be able to arbitrarily select θ.

【0092】従って、この第3実施例の登録文字認識・
優先順位調整手段10aは、以下のように動作する。
Therefore, the registered character recognition and
The priority order adjusting means 10a operates as follows.

【0093】登録文字認識・優先順位調整手段10aに
は、部分パターン自動分割手段7が分割して得た部分パ
ターンの情報、及び、特徴点抽出手段2が抽出した各ス
トロークの座標データが与えられる。登録文字認識・優
先順位調整手段10aは、総画数に基づいて、登録辞書
9aに格納されている文字を絞り込んだ後、部分パター
ン自動分割手段7が分割して得た部分パターンの情報、
及び、特徴点抽出手段2が抽出した各ストロークの座標
データに基づいて、筆記文字についての部分パターンQ
値(Q1 〜Q16)を求め、その後、登録辞書9aに格納
されている文字の部分パターンQ値(Qd1〜Qd16 )と
のマッチング距離値Qを求め、このマッチング距離値Q
を候補にできるか否かの閾値TH2と比較し、候補文字
になり得るものに対してはさらに登録文字優先判定用閾
値kと比較する。勿論、マッチング距離値Qが小さいも
のほど優先順位を高くする。
The registered character recognizing / priority adjusting means 10a is provided with information on the partial pattern obtained by division by the partial pattern automatic dividing means 7 and coordinate data of each stroke extracted by the feature point extracting means 2. . The registered character recognition / priority order adjusting means 10a narrows down the characters stored in the registered dictionary 9a based on the total number of strokes, and then obtains information on partial patterns obtained by the automatic partial pattern dividing means 7;
And, based on the coordinate data of each stroke extracted by the feature point extracting means 2, the partial pattern Q
Values (Q1 to Q16) are obtained, and then a matching distance value Q with the partial pattern Q value (Qd1 to Qd16) of the character stored in the registration dictionary 9a is obtained.
Is compared with a threshold value TH2 for determining whether or not a character can be a candidate, and for a character that can be a candidate character, the threshold value is further compared with a threshold k for determining a registered character priority. Of course, the smaller the matching distance value Q, the higher the priority.

【0094】そして、登録文字認識・優先順位調整手段
10aは、認識手段4が得た1以上の候補文字と、登録
辞書9に登録されていた1以上の候補文字との出力順序
を決定して出力端子6から次の装置(例えば表示装置)
に出力する。この際、登録文字優先判定用閾値kより小
さい登録文字に対しては、認識手段4が得た候補文字よ
り高い優先順位で出力し、登録文字優先判定用閾値kよ
り大きい登録文字に対しては、認識手段4が得た候補文
字より低い優先順位で出力する。
The registered character recognizing / priority adjusting means 10a determines the output order of the one or more candidate characters obtained by the recognizing means 4 and the one or more candidate characters registered in the registration dictionary 9. From the output terminal 6 to the next device (for example, a display device)
Output to At this time, for a registered character smaller than the registered character priority determination threshold k, the recognition unit 4 outputs the registered character with higher priority than the candidate character obtained, and for a registered character larger than the registered character priority determination threshold k, , And output with a lower priority than the candidate character obtained by the recognition means 4.

【0095】従って、この第3実施例によっても、第2
実施例と同様な効果を得ることができる。これに加え
て、第3実施例によれば、登録辞書9aには、Q値と総
画数とを登録して候補文字を得るようにしたので、登録
文字に対する認識処理を第2実施例より高速に実行でき
る。また、第3実施例によれば、登録辞書9aに、登録
文字優先判定用閾値kも格納し、登録文字の優先性を判
定できるようにしたので、文字登録機能を持たせても出
力順位を適切にできる。
Therefore, according to the third embodiment, the second
An effect similar to that of the embodiment can be obtained. In addition, according to the third embodiment, the Q value and the total number of strokes are registered in the registration dictionary 9a to obtain candidate characters, so that the recognition process for the registered characters can be performed faster than in the second embodiment. Can be executed. Further, according to the third embodiment, the registered character priority determination threshold value k is also stored in the registered dictionary 9a so that the priority of the registered character can be determined. I can do it properly.

【0096】(D)他の実施例認識処理に供するパラメ
ータとして、第1及び第2実施例では、部分パターン間
ベクトル、部分パターンQ値及び部分パターンストロー
クコード分布のものを示し、第3実施例では、部分パタ
ーンQ値だけのものを示したが、部分パターン間ベクト
ル及び部分パターンQ値や、部分パターンQ値及び部分
パターンストロークコード分布のような2個のパラメー
タ等であっても良い。
(D) Other Embodiments In the first and second embodiments, parameters used in the recognition processing are those of a partial pattern vector, a partial pattern Q value, and a partial pattern stroke code distribution. In the above, only the partial pattern Q value is shown, but two parameters such as the partial pattern vector and the partial pattern Q value and the partial pattern Q value and the partial pattern stroke code distribution may be used.

【0097】上記第3実施例においては、登録文字優先
判定用閾値kを座標データの回転処理を利用して求める
ものを示したが、他の方法で求めるようにしても良い。
例えば、総画数によって固定的に決定するようにしても
良い。また、例えば、登録辞書(登録辞書部)に格納す
る部分パターン毎のパラメータが、部分パターン間ベク
トル、部分パターンQ値及び部分パターンストロークコ
ード分布である装置であれば、登録文字優先判定用閾値
kを、回転座標データと元の座標データとの総合マッチ
ング距離値で求めるようにしても良い。さらに、登録用
に筆記された文字の座標データ等から求めた部分パター
ンQ値と、その登録用筆記文字に対して固定辞書を用い
た認識処理を実行させて得た第1候補の文字について固
定辞書に格納されている部分パターンQ値とのマッチン
グ距離値を、登録文字優先判定用閾値kとしても良い。
請求項の表現は、このような種々の場合をも含むもの
とする。
In the third embodiment, the registration character priority determination threshold value k is obtained by using the rotation process of the coordinate data. However, the threshold value k may be obtained by another method.
For example, it may be fixedly determined by the total number of strokes. For example, if the parameter for each partial pattern to be stored in the registered dictionary (registered dictionary unit) is a partial pattern vector, a partial pattern Q value, and a partial pattern stroke code distribution, the registered character priority determination threshold k May be obtained as a total matching distance value between the rotation coordinate data and the original coordinate data. Furthermore, a partial pattern Q value obtained from coordinate data of a character written for registration and a first candidate character obtained by executing a recognition process using a fixed dictionary on the registered written character are fixed. A matching distance value with the partial pattern Q value stored in the dictionary may be used as the registered character priority determination threshold value k.
The expression of claim 3 includes such various cases.

【0098】[0098]

【発明の効果】以上のように、本発明によれば、筆記文
字を、固定辞書の格納情報を用いずに、筆順に対する所
定ルールで分割部分パターンに分割する部分パターン自
動分割手段と、登録のために筆記された文字のストロー
ク情報と、部分パターン自動分割手段による分割部分パ
ターンの情報とから、認識時に必要となる類似度判定用
分割部分パターン毎のパラメータを得る文字登録手段
と、この文字登録手段で得られた分割部分パターン毎の
パラメータを格納する登録辞書と、認識のために筆記さ
れた文字のストローク情報と、部分パターン自動分割手
段による分割部分パターンの情報とから、分割部分パタ
ーン毎のパラメータを得て、登録辞書に格納されている
対応情報との類似度判定を行い筆記文字の登録辞書候
補文字を認識し、認識した登録辞書候補文字を登録辞書
から抽出する登録文字認識手段とを設けたので、文字登
録機能を有するオンライン文字認識装置を実現できる。
As described above, according to the present invention, a partial pattern automatic dividing means for dividing a written character into divided partial patterns according to a predetermined rule for a stroke order without using information stored in a fixed dictionary; Character registration means for obtaining a parameter for each divided partial pattern required for similarity determination at the time of recognition from stroke information of a character written in order to obtain the information and information on divided partial patterns by automatic partial pattern dividing means; A registered dictionary storing parameters for each divided partial pattern obtained by the registering means, stroke information of characters written for recognition, and information on divided partial patterns by the automatic partial pattern dividing means are used for each divided partial pattern. to obtain a parameter, performs similarity determination and corresponding information stored in the registration dictionary to recognize the registered dictionary candidate characters written characters, Registering the identification and registration dictionary candidate character dictionary
And an on-line character recognition device having a character registration function can be realized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1実施例の構成を示すブロック図である。FIG. 1 is a block diagram illustrating a configuration of a first embodiment.

【図2】従来の構成を示すブロック図である。FIG. 2 is a block diagram showing a conventional configuration.

【図3】部分パターン間ベクトルの説明図である。FIG. 3 is an explanatory diagram of a vector between partial patterns.

【図4】固定辞書の画数辞書部の説明図である。FIG. 4 is an explanatory diagram of a stroke count dictionary unit of a fixed dictionary.

【図5】部分パターンQ値の算出方法の説明図である。FIG. 5 is an explanatory diagram of a calculation method of a partial pattern Q value.

【図6】固定辞書の部分パターン辞書部の説明図であ
る。
FIG. 6 is an explanatory diagram of a partial pattern dictionary section of the fixed dictionary.

【図7】ストロークコードマッチングの説明図である。FIG. 7 is an explanatory diagram of stroke code matching.

【図8】第1実施例の部分パターンへの分割方法の説明
図である。
FIG. 8 is an explanatory diagram of a method for dividing into partial patterns according to the first embodiment.

【図9】第1実施例の登録辞書の説明図である。FIG. 9 is an explanatory diagram of a registered dictionary according to the first embodiment.

【図10】第2実施例の構成を示すブロック図である。FIG. 10 is a block diagram showing a configuration of a second embodiment.

【図11】第3実施例の構成を示すブロック図である。FIG. 11 is a block diagram showing a configuration of a third embodiment.

【図12】第3実施例の登録辞書の説明図である。FIG. 12 is an explanatory diagram of a registered dictionary according to the third embodiment.

【図13】第3実施例の登録文字優先判定用閾値の算出
方法の説明図である。
FIG. 13 is an explanatory diagram of a method for calculating a registered character priority determination threshold according to the third embodiment.

【符号の説明】[Explanation of symbols]

1…タブレット、2…特徴点抽出手段、3…ストローク
抽出手段、4…認識手段、5…固定辞書、5a1…固定
辞書部、5a2…登録辞書部、7…部分パターン自動分
割手段、8…文字登録手段、8a…文字登録・閾値設定
手段、9、9a…登録辞書、10、10a…登録文字認
識・優先順位調整手段。
DESCRIPTION OF SYMBOLS 1 ... Tablet, 2 ... Feature point extraction means, 3 ... Stroke extraction means, 4 ... Recognition means, 5 ... Fixed dictionary, 5a1 ... Fixed dictionary part, 5a2 ... Registration dictionary part, 7 ... Partial pattern automatic division means, 8 ... Character Registering means, 8a: character registration / threshold setting means, 9, 9a: registered dictionary, 10, 10a: registered character recognition / priority adjusting means.

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−62186(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/62 G06K 9/68 JICSTファイル(JOIS)──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-3-62186 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G06K 9/62 G06K 9/68 JICST file ( JOIS)

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 照合用情報を格納する固定辞書と、 認識のために筆記された文字のストローク情報を筆記文
字の部分パターン毎のパラメータに変換して、上記固定
辞書の照合用情報と類似度判定を行い、筆記文字の固定
辞書候補文字を認識し、認識した固定辞書候補文字を固
定辞書から抽出する認識手段と、 筆記文字を、上記固定辞書の格納情報を用いずに、下記
に示した所定ルールRで分割部分パターンに分割する部
分パターン自動分割手段と、 登録のために筆記された文字のストローク情報と、上記
部分パターン自動分割手段による分割部分パターンの情
報とから、認識時に必要となる類似度判定用の分割部分
パターン毎のパラメータを得る文字登録手段と、 上記文字登録手段で得られた分割部分パターン毎のパラ
メータを格納する登録辞書と、 認識のために筆記された文字のストローク情報と、上記
部分パターン自動分割手段による分割部分パターンの情
報とから、分割部分パターン毎のパラメータを得て、上
記登録辞書に格納されている対応情報との類似度判定を
行い筆記文字の登録辞書候補文字を認識し、認識した
登録辞書候補文字を登録辞書から抽出する登録文字認識
手段と、 上記認識手段が抽出した固定辞書候補文字と上記登録文
字認識手段が抽出した登録辞書候補文字の中から1又は
複数の候補文字を出力する出力手段とを有することを特
徴とするオンライン文字認識装置。所定ルールRは、以
下の(1)〜(3)の分割方法を総画数に使い分けるも
のである。 (1)低画数の文字に対しては1個のストロークをm個
に分割する。 (2)中画数の文字に対しては総画数を筆順に従ってm
個に分割する。 (3)高画数の文字に対しては総画数を筆順に従ってm
画ずつ分割する。
1. A fixed dictionary for storing collation information, and the stroke information of a character written for recognition is converted into a parameter for each partial pattern of a written character, and the collation information and similarity of the fixed dictionary are converted. Make a determination , recognize the fixed dictionary candidate characters of the written characters, and fix the recognized fixed dictionary candidate characters.
Recognizing means for extracting from a fixed dictionary, automatic partial pattern dividing means for dividing a written character into divided partial patterns according to a predetermined rule R shown below without using information stored in the fixed dictionary, and writing for registration Character registration means for obtaining a parameter for each divided partial pattern required for similarity determination required for recognition from stroke information of the extracted character and information on the divided partial pattern by the partial pattern automatic dividing means; a registration dictionary for storing the parameters of the divided partial patterns each obtained in the character of the stroke information written for recognition, from the divided partial pattern information by the partial pattern automatically dividing unit, divided portion patterns each of to obtain a parameter, performs similarity determination and corresponding information stored in the registration dictionary, sure registration dictionary candidate characters written character Informed and recognized
A registered character recognizing means for extracting registered dictionary candidate characters from the registered dictionary; and outputting one or more candidate characters from the fixed dictionary candidate characters extracted by the recognizing means and the registered dictionary candidate characters extracted by the registered character recognizing means. An online character recognition device, comprising: The predetermined rule R uses the following division methods (1) to (3) for the total number of strokes.
It is. (1) For one stroke character, one stroke is divided into m strokes. (2) For characters with the number of medium strokes, the total number of strokes is m according to the stroke order.
Divide into pieces. (3) For characters with a high number of strokes, the total number of strokes is calculated according to the stroke order.
Divide each image.
【請求項2】 上記部分パターン自動分割手段により上
記固定辞書に情報を設定する文字を複数の分割部分パタ
ーンに分割し、文字のストローク情報と、上記部分パタ
ーン自動分割手段による分割部分パターンの情報とか
ら、認識時に必要となる類似度判定用の部分パターン毎
のパラメータを得て、上記固定辞書は作成されたもので
あり、 上記認識手段は、認識のために筆記された文字のストロ
ーク情報と、上記部分パターン自動分割手段による分割
部分パターンの情報とから、部分パターン毎のパラメー
タを得て、上記固定辞書に格納されている対応情報との
類似度判定を行い筆記文字の固定辞書候補文字を認識
し、認識した固定辞書候補文字を固定辞書から抽出する
ことを特徴とする請求項1に記載のオンライン文字認識
装置。
2. The partial pattern automatic dividing means divides a character whose information is set in the fixed dictionary into a plurality of divided partial patterns, and stores stroke information of the character and information on the divided partial pattern by the partial pattern automatic dividing means. From the above, a parameter for each partial pattern for similarity determination required at the time of recognition is obtained, and the fixed dictionary is created.The recognition means includes stroke information of a character written for recognition, A parameter for each partial pattern is obtained from the information on the partial pattern divided by the partial pattern automatic dividing means, and a similarity determination with the corresponding information stored in the fixed dictionary is performed to perform a fixed dictionary of written characters. Recognize candidate characters
2. The online character recognition device according to claim 1 , wherein the recognized fixed dictionary candidate characters are extracted from the fixed dictionary .
【請求項3】 上記文字登録手段が、登録のために筆記
された文字のストローク情報と、上記部分パターン自動
分割手段による分割部分パターンの情報とから、上記認
識手段が抽出した固定辞書候補文字と上記登録文字認識
手段が抽出した登録辞書候補文字との優先順位を決定す
るための登録文字優先判定用閾値をも求めて、上記登録
辞書に格納させると共に、 上記登録辞書に格納されている対応情報に基づいて上記
登録文字認識手段が得た筆記文字と登録文字との類似度
と、上記登録文字優先判定用閾値とを比較して、上記認
識手段が抽出した固定辞書候補文字と上記登録文字認識
手段が抽出した登録辞書候補文字との優先順位を決定す
る優先順位調整手段を設け、 上記出力手段が、上記優先順位調整手段が得た優先順位
に従って候補文字を1又は複数出力することを特徴とす
る請求項1又は2に記載のオンライン文字認識装置。
3. The fixed dictionary candidate character extracted by the recognizing means from the stroke information of a character written for registration and the information on the divided partial pattern by the partial pattern automatic dividing means. A registered character priority determination threshold value for determining a priority order with the registered dictionary candidate characters extracted by the registered character recognition means is also obtained and stored in the registered dictionary, and the correspondence information stored in the registered dictionary Based on the similarity between the written character and the registered character obtained by the registered character recognition means and the threshold for the registered character priority determination, the fixed dictionary candidate character extracted by the recognition means and the registered character recognition means provided priority adjustment means for determining the priority of the registration dictionary candidate characters are extracted, said output means, candidate characters according to the priority which the priority adjustment means to obtain Online character recognition apparatus according to claim 1 or 2, characterized in that one or more outputs.
【請求項4】 上記文字登録手段が、登録のために筆記
された文字のストローク情報について得た分割部分パタ
ーン毎のパラメータと、その筆記された文字を所定角度
だけ回転させた際のストローク情報について得た分割
分パターン毎のパラメータとの類似度を、上記登録文字
優先判定用閾値としたことを特徴とする請求項3に記載
のオンライン文字認識装置。
4. A method according to claim 1, wherein said character registration means obtains a parameter for each divided partial pattern obtained from stroke information of a character written for registration, and stroke information obtained by rotating the written character by a predetermined angle. 4. The online character recognition device according to claim 3, wherein the obtained similarity with the parameter for each divided pattern is used as the registered character priority determination threshold.
JP05319565A 1993-12-20 1993-12-20 Online character recognition device Expired - Fee Related JP3095599B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05319565A JP3095599B2 (en) 1993-12-20 1993-12-20 Online character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05319565A JP3095599B2 (en) 1993-12-20 1993-12-20 Online character recognition device

Publications (2)

Publication Number Publication Date
JPH07175889A JPH07175889A (en) 1995-07-14
JP3095599B2 true JP3095599B2 (en) 2000-10-03

Family

ID=18111690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05319565A Expired - Fee Related JP3095599B2 (en) 1993-12-20 1993-12-20 Online character recognition device

Country Status (1)

Country Link
JP (1) JP3095599B2 (en)

Also Published As

Publication number Publication date
JPH07175889A (en) 1995-07-14

Similar Documents

Publication Publication Date Title
JP2007317022A (en) Handwritten character processor and method for processing handwritten character
JP2947170B2 (en) Line-symmetric figure shaping device
JPH05189617A (en) Method and apparatus for arc segmentation in handwritten-character recognition
JPH0981730A (en) Method and device for pattern recognition and computer controller
US6035062A (en) Character recognition method and apparatus
JP2785776B2 (en) Figure shaping device
JP3095599B2 (en) Online character recognition device
JP2718391B2 (en) Line-symmetric figure shaping device
CN115311674A (en) Handwriting processing method and device, electronic equipment and readable storage medium
US5991702A (en) Axisymmetric figure shaping device for generating curvilinear figure precisely axisymmetric with respect to axis of symmetry and method therefor
JP3419251B2 (en) Character recognition device and character recognition method
JP3817281B2 (en) Information processing apparatus and method
US5790700A (en) Method for automatically recognizing line symmetry of a figure
JP3657077B2 (en) Online character recognition device
JPS60247793A (en) On-line recognition device for handwritten character
KR100290606B1 (en) Method for recognizing cursive of hangul in online system
JPH0896079A (en) Hand-written character recognizing device
Xue et al. Incorporating contextual character geometry in word recognition
JP2824704B2 (en) Character recognition device
JPH0210473B2 (en)
JPH081660B2 (en) Online handwritten figure recognition device
JP2637762B2 (en) Pattern detail identification method
JP2905334B2 (en) Online handwritten character recognition dictionary creation method and online handwritten character recognition dictionary creation device
JP2519782B2 (en) Character separation method
JPH09114928A (en) Character recognizing device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070804

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080804

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090804

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees