JP4787275B2

JP4787275B2 - セグメント化ベースの認識

Info

Publication number: JP4787275B2
Application number: JP2007557965A
Authority: JP
Inventors: シュテルンビー、ヤコブ
Original assignee: ザイデクマアクチボラゲット
Priority date: 2005-02-28
Filing date: 2006-02-24
Publication date: 2011-10-05
Anticipated expiration: 2026-02-24
Also published as: RU2007135946A; JP2008532175A; US7596272B2; CN101128837A; EP1854047A1; TW200701096A; TWI319861B; KR20070110398A; WO2006091155A1; KR101145986B1; US20060193519A1

Description

本発明は、複数の記号を表す１つ又は複数の曲線を含む手書きパターンの認識のための方法に関する。

今日、手書きは、データ処理ユニットに、特に、移動電話機及びＰＤＡ（パーソナル・デジタル・アシスタント）にデータを入力するための、ますます一般的な方法となっている。入力されたデータを扱うために、手書きは、認識され、解釈されなければならない。手書きを認識するためのほとんどの既存の方法は、入力されるべき文字が、１つずつ書き込まれ、別々に認識されることを要求する。そのような方法の実施例が、米国特許第４７３１８５７号で与えられているが、最も有名なのが、パーム社によって製造されるＧｒａｆｆｉｔｉ（登録商標）である。

データの入力をスピードアップするために、筆記体の手書きが許されることが望ましい。しかし、筆記体手書き認識は、別々の文字の認識より、はるかに複雑である。筆記体手書き認識に関して複雑さが増大することは、つなげられた文字をセグメント化することの、即ち、手書きパターン内で１つの文字から別の文字への遷移を識別することの問題に帰せられる。そのため、筆記体手書き認識における誤りは、２つのレベルで生じる可能性があり、これにより、明快な順次認識システムの構築が大いに難しくなる。

筆記体手書き認識のための方法は、一般に、手書きパターンの可能なセグメント化の組合せの爆発的増加を生じる、隣接する文字間における多数の可能なセグメント化が存在するという問題に悩まされている。

したがって、今日のほとんどの市販のシステムは、ニューラル・ネットワーク、及び隠れマルコフ・モデルを、組み込まれた辞書と一緒に使用する、複雑な統計システムを使用する。そのようなシステムの実施例が、Ｐ．Ｎｅｓｋｏｖｉｃ及びＬ．Ｃｏｏｐｅｒ、「Ｎｅｕｒａｌｎｅｔｗｏｒｋ−ｂａｓｅｄｃｏｎｔｅｘｔｄｒｉｖｅｎｒｅｃｏｇｎｉｔｉｏｎｏｆｏｎ−ｌｉｎｅｃｕｒｓｉｖｅｓｃｒｉｐｔ」、ＳｅｖｅｎｔｈＩｎｔｅｒｎａｔｉｏｎａｌＷｏｒｋｓｈｏｐｏｎＦｒｏｎｔｉｅｒｓ、ＨａｎｄｗｒｉｔｉｎｇＲｅｃｏｇｎｉｔｉｏｎＰｒｏｃｅｅｄｉｎｇｓ、３５２〜３６２ページ、２０００年９月、及びＭ．Ｓｃｈｅｎｋｅｌ及びＩ．Ｇｕｙｏｎ、「Ｏｎ−ｌｉｎｅｃｕｒｓｉｖｅｓｃｒｉｐｔｒｅｃｏｇｎｉｔｉｏｎｕｓｉｎｇｔｉｍｅｄｅｌａｙｎｅｔｗｏｒｋｓａｎｄｈｉｄｄｅｎｍａｒｋｏｖｍｏｄｅｌｓ」、ＭａｃｈｉｎｅＶｉｓｉｏｎａｎｄＡｐｐｌｉｃａｔｉｏｎｓ、ｖｏｌ．８、２１５〜２２３ページ、１９９５年において提示されている。それらのシステムの大きな欠点は、それらのシステムが、大きく、大量の訓練セットを要求することである。更に、それらのシステムは、使用される辞書に大きく依存する。

本発明の目的は、筆記体手書き認識のための改良された方法を提供することである。本発明の別の目的は、手書きパターンを迅速にセグメント化して、認識する方法を提供することである。本発明の更なる目的は、多大な学習を要求せず、非常に高い処理能力を必要としない方法を提供することである。

以上の諸目的の少なくとも幾つかは、独立請求項による方法、デバイス、及びコンピュータ・プログラム製品によって達せられる。本発明の特定の諸実施例は、従属請求項に記載される。

したがって、本発明は、１つ又は複数の曲線を含み、複数の記号を表す手書きパターンの認識のための方法を提供する。手書きパターンを、その手書きパターンの１つ又は複数の曲線に沿ったポイント・シーケンスとして検出すること、手書きパターンの、そのポイント・シーケンスにおいて可能な区別符号を識別すること、そのポイント・シーケンスの中で、手書きパターンをセグメント化して、手書きパターンのこれらのセグメントを記号として認識する際に使用するために選択される、コア・ポイントを選択すること、各コア・ポイントにおいて、又は各コア・ポイントの近傍において、１つ又は複数の曲線の特徴を判定すること、識別された可能な区別符号に関連する少なくとも１つの特徴を、コア・ポイント・サブセットの各コア・ポイントに割り当てること、及び手書きパターンを、少なくとも１つの記号、又は或る記号の一部をそれぞれが表すテンプレートと比較することを含む方法。比較することは、シーケンスにおけるコア・ポイントを段階的に解析することを含み、コア・ポイントは、可能なセグメント化ポイントを表し、第１の可能なセグメント化ポイントから第２の可能なセグメント化ポイントまでのコア・ポイント・シーケンスは、可能な記号を表し、前記解析することは、前のコア・ポイント・シーケンスの最初のコア・ポイント又は最後のコア・ポイントで始まるコア・ポイント・シーケンスの特徴を、前記テンプレートとマッチさせて、距離値を計算し、累積距離値を、マッチしたコア・ポイント・シーケンスにおける最後のコア・ポイントに割り当てることによって実行され、前記累積距離値は、そのシーケンスにおける最初のコア・ポイントに割り当てられた距離値と、計算されて距離値との合計であり、すべての順次コア・ポイントに関する最小の累積距離値が、最後のコア・ポイントに割り当てられ、複数の記号を手書きパターンの可能な認識結果として表すマッチしたテンプレートのシーケンスに対応する。

また、本発明は、複数の記号を表す１つ又は複数の曲線を含む手書きパターンの認識のためのデバイスも提供し、前記デバイスは、前述した方法の諸動作を実行するための手段を含む。

また、本発明は、前段で定義された方法を実行するためのソフトウェア・コード部分を含む、データ処理ユニットの内部メモリに直接に読み込まれることが可能なコンピュータ・プログラム製品も提供する。

本発明のお陰で、幾つかの記号を表す手書きパターンは、迅速に認識されることが可能である。セグメント化と認識の両方のためにコア・ポイントを使用することにより、計算は、手書きパターンを分離することと、そのパターンをテンプレートとマッチさせることを同時に行う。そのため、手書きパターンをテンプレートと比較するプロセスは、非常に迅速である。すべてのコア・ポイントが、解析された後、累積距離値が、最後のコア・ポイントに割り当てられ、手書きパターンとマッチさせられているテンプレートのシーケンスに関連付けられる。このため、最後のコア・ポイントに割り当てられた情報は、手書きパターンの可能な認識結果を得るために、容易に使用されることが可能である。更に、可能な区別符号を識別して、それらの区別符号を、コア・ポイント・サブセットに割り当てることにより、高いヒット率、即ち、正しい解釈を見出すことが、円滑にされることが可能であり、認識は、それでも、非常に迅速であることが可能である。

幾つかの基準に従って、限られた数の可能なセグメント化ポイントを選択することにより、手書きパターンのセグメントが、それらの可能なセグメント化ポイントだけと関係がある情報を使用することによって認識されることが可能であることが、認識されている。このため、筆記体の手書きを認識するために、ニューラル・ネットワーク又は隠れマルコフ・モデルを使用する必要は、存在しないことが、認識されている。代わりに、可能なセグメント化ポイントが、選択され、同一の可能なセグメント化ポイントが、手書きパターン内の記号の認識のために使用される。

コア・ポイントの選択により、多数のポイントが、検出されたシーケンスから破棄される。このため、扱いやすい数のコア・ポイントが、選択され、これにより、コア・ポイント・シーケンスをテンプレートと比較するために必要とされる計算作業が抑えられる。検出されたポイント・シーケンスにおける情報の相当な部分は、手書きパターンを認識するためには、冗長であることが、認識されている。したがって、多数のポイントを破棄することは、手書きパターンを正しく認識する可能性にほとんど影響を及ぼさない。また、限られた数のポイントが、認識において使用されるので、幾つかのテンプレートが、同一の記号を認識するために使用されることが可能である。このため、テンプレートは、異書体、即ち、同一の記号の筆記の異なる外観、又は異なるスタイルを表すことが可能である。

有利には、手書きされた記号における可能なセグメント化ポイントを構成するコア・ポイントだけが、選択される。これにより、解析されるべきコア・ポイントの数が、確かに低く抑えられ、そのため、方法は、高速である。

本明細書で使用される、「記号」という用語は、ラテン文字、漢字、又は他の任意の種類の文字、文字の間、前、又は後のつなぎ、数字、或いは任意の句読点などの、特定の意味を有する任意の形態として解釈されるべきである。更に、「手書きパターン」という用語は、個人によって書かれた特定の形態の記号、又は記号シーケンスとして解釈されるべきである。

或る実施例によれば、比較することは、手書きパターンにおける２つの記号間の可能なセグメント化ポイントに対応するコア・ポイントをそれぞれが表すノード群と、それらのノードを接続する、１つのノードから別のノードに至る、コア・ポイント・シーケンスに沿った、手書きパターンにおける可能な記号に対応するパスをそれぞれが表すアーチとを有するグラフを形成すること、コア・ポイント・シーケンスの特徴を前記テンプレートとマッチさせることによって、各パスに少なくとも１つの距離値を割り当てること、及び最小の累積距離値でグラフを通って最初のノードから最後のノードに至る、手書きパターンの可能な認識結果を表すマッチしたテンプレートのシーケンスに対応するパスを少なくとも特定することによって実行される。

グラフを形成することにより、順次コア・ポイントの段階的な解析が、構造化されることが可能である。このことは、実行されるべき計算の良好な制御が得られ、累積距離の結果が、ノード群及びアーチ群に関連して構造的に格納されることが可能であることを意味する。更に、グラフは、効果的に使用されることが可能である。というのは、グラフのサイズは、多数のポイントが、コア・ポイントの選択の際に破棄されることが可能であるので、扱うのが容易だからである。

幾つかの可能な認識結果が、閾値未満の累積距離値を有する、グラフを通るパスに対応して、特定されることが可能である。このことは、手書きパターンをテンプレートと比較することにより、幾つかの候補が、手書きパターンの認識結果として戻されることが可能であることを意味する。それらの候補は、幾つかの異なる形で扱われることが可能である。最小の累積距離値に対応する最良の候補が、ユーザに提示されることが可能である。その候補が拒否された場合、その他の候補が、提示されることが可能である。代替として、幾つかの候補が、最初に提示されてもよい。

グラフは、コア・ポイントをノードとして順次に追加することによって形成されることが可能であり、各パスに少なくとも１つの距離値を前記割り当てることは、グラフの形成中に実行される。要求される計算は、グラフが形成されるにつれ、実行される。このことは、可能な認識結果は、グラフが形成されるとすぐに、グラフから得られることが可能であることを意味する。

少なくとも１つの距離値を割り当てることは、コア・ポイント・シーケンスの特徴と最もよくマッチするテンプレートに対応する最低の距離値を各パスに割り当てることを含む。このことは、グラフが、使用される特徴に応じて、コア・ポイント・シーケンスと最もよくマッチするテンプレートの情報を、常に保持することを意味する。

検出された区別符号に関連する少なくとも１つの特徴を割り当てることは、手書きパターンをテンプレートと比較する動作より前に実行される。このため、区別符号は、コア・ポイントをテンプレートと比較している間に、パスの距離値に影響を与えることが可能であり、そのため、認識が、更により効果的であることを可能にする。

選択されるコア・ポイントの数は、前記１つ又は複数の曲線の形状によって制限されることが可能である。このことは、曲線の形状により、選択されるコア・ポイントの数が規定されることを意味する。このようにして、曲線の形状が単純である場合、より少ない数のコア・ポイントが、選択されることが可能であるのに対して、複雑な曲線の場合、より多数のコア・ポイントが、選択される。

選択されるコア・ポイントの数は、前記１つ又は複数の曲線の方向変化の情報を保持するポイントに限定されることが可能である。このため、曲線が、曲げられる、又は向きを変えられるポイントだけが、コア・ポイントとして使用される。これにより、限られた数のコア・ポイントが使用されるにもかかわらず、コア・ポイントが、１つ又は複数の曲線の形状を記述することが可能になる。

コア・ポイントを選択することは、手書きパターンの主な筆記方向と直交する方向における前記１つ又は複数の曲線の局所極限ポイントであるポイントを選択することを含むことが可能である。それらの選択されたコア・ポイントは、しばしば、可能なセグメント化ポイントに対応することが可能である。このため、以上の選択基準により、セグメント化ポイントの大部分を保持する確率が高いコア・ポイント・セットが選択される。更に、それらの局所極限ポイントは、記号の形状に関して有意であり、したがって、認識の際に使用するのにも適している。

コア・ポイントは、Ｎコア・ポイント、Ｓコア・ポイント、及びＭコア・ポイントとして分類されることが可能であり、ただし、Ｎコア・ポイントは、主な筆記方向と直交する方向における局所極大コア・ポイントであり、Ｓコア・ポイントは、主な筆記方向と直交する方向における局所極小コア・ポイントであり、Ｍコア・ポイントは、Ｎコア・ポイントとＳコア・ポイントの中間コア・ポイントであり、前記コア・ポイント・サブセットのコア・ポイントをＮコア・ポイント及びＭコア・ポイントとして選択する動作を更に含む。このため、区別符号特徴が割り当てられることが可能な、コア・ポイント・サブセットのコア・ポイントを限定すること、及び、多くのケースで、コア・ポイントに区別符号特徴を割り当てるプロセスをスピードアップすること。

本発明の或る実施例によれば、局所極限ポイントを選択することによって作成されるコア・ポイント・セットは、各局所極限ポイント・ペアの間における１つ乃至３つのコア・ポイントを選択することにより、拡張される。それらの更なるコア・ポイントは、他の基準を使用することによって選択される。そのようなコア・ポイント・セットは、ラテン文字から成る手書きパターンをセグメント化して、認識する際に使用するのに適している。

コア・ポイントを選択することは、１つ又は複数の曲線の微分の絶対値が、閾値を超えるポイントを選択することを含むことが可能である。このことは、曲線又は曲線群が、急な方向転換を行う場合に、コア・ポイントが選択されることを意味する。これにより、記号を認識するための有用な情報がもたらされ、可能なセグメント化ポイントが、更に選択される。

コア・ポイントを選択することは、隣接する２つのコア・ポイント間の直線からの１つ又は複数の曲線の逸脱が、閾値を超える場合に、コア・ポイントを選択することを含むことが可能である。このことは、１つ又は複数の曲線の或る曲率を記述するコア・ポイントが、選択されることを意味する。このため、曲線又は曲線群の形状に関する情報が、保存され、このことは、認識のために役立つ。また、このように選択されたコア・ポイントは、セグメント化ポイントである確率も高い。

コア・ポイントを選択することは、前述した選択基準の任意の組合せを含むことが可能であり、或いは可能なセグメント化ポイントを選択することになっている、更なる選択基準を使用することが可能である。

特徴を特定することは、主な筆記方向と直交する方向における或る位置を定義する、コア・ポイントのｙ座標を特定することを含むことが可能である。このことは、主にサイズが異なる文字を区別する際に役立つ。

特徴を特定することは、コア・ポイントに向かう曲線の方向と、コア・ポイントからの曲線の方向とを特定することを含むことが可能である。これは、曲線の形状に関する情報を与え、したがって、手書きパターンをテンプレートと比較する際に非常に役立つ。

特徴を特定することは、主な筆記方向と平行な方向における或る位置を定義する、前のコア・ポイントからのｘ座標変位を特定することを含むことが可能である。このことは、それらのコア・ポイントが、互いに関係していることを意味する。そのため、テンプレートは、コア・ポイント・シーケンスと正しくマッチさせられるために、移動されなくてもよい。

ｘ座標の最高値を有する、前のコア・ポイントからのｘ座標変位を特定することが、特に好適であることが分かっている。

特徴を特定することは、コア・ポイントにおいて、ペンが持ち上げられているか、又は押し下げられているかを判定することを含むことが可能である。その特徴は、しばしば、セグメント化ポイントを示すが、或る記号における２つのストローク間の中断を示すことも可能である。したがって、その特徴は、コア・ポイントにおいて、ペンが持ち上げられる、又は押し下げられることを許す記号を認識するために使用されることが可能である。

手書きパターンにおける或るコア・ポイントと、或るテンプレートの或るポイントとの間の距離値は、そのコア・ポイントの各特徴と、そのテンプレートの、そのポイントとの間の距離の重み付き合計として計算されることが可能である。このため、特定された特徴には、認識のための、それらの特徴の重要度に応じて、異なる重みが与えられることが可能である。更に、すべての特徴が、距離値に寄与する。

手書きパターンは、テンプレートと比較されることが可能であり、複数のテンプレートは、同一の記号の様々な外観を表す。同一の記号を表す複数のテンプレートにより、様々な異書体が、認識されることが可能であるようになる。更に、テンプレートは、限られた数の特徴だけによって表現されるので、扱いやすいサイズのテンプレート・データベースを有しながら、極めて多数のテンプレートを格納することが可能である。

手書きパターンの可能な認識結果は、辞書と比較されることが可能である。このことは、手書きパターンをテンプレートと比較することによって特定された候補が、辞書と比較されることによって更に評価されることが可能であることを意味する。その結果、ユーザに提示される候補は、例えば、最小の累積距離値を有する候補、又は辞書の中に存在する候補の中で最小の累積距離値を有する候補であることが可能である。しかし、辞書を使用する、この更なる評価は、可能な認識結果を得るために必要ではない。したがって、手書きパターンをテンプレートと比較することは、辞書の使用なしに、認識結果をもたらす。

手書きパターンによって何が意図されているかを常に正しく解釈することは、本発明の事前目標ではない。このため、本方法は、或る文字が、手書きパターンから抜けている場合、又は手書きパターンが誤って綴られている場合などの、手書きパターンが、何らかの情報を欠いている、又は誤った情報を含む場合を独立に識別することはない。しかし、本方法は、他の文脈で補足する堅固な基礎、及びストリング・マッチング・ルーチンを提供して、手書きパターン自体を調べるだけでは、正しく認識することが可能でない語も、認識されることが可能であるようにする。

更に、特定のマッチするテンプレート・シーケンスが、禁止されることも可能である。そうすることは、手書きパターンにおける情報が正しくない状況を補償する際に役立つ可能性がある。しかし、そうすることは、不可能な候補、又は可能性の低い候補を拒否することにより、認識結果を向上させるために使用されることも可能である。例えば、２つのつなぎのシーケンスが、禁止されることが可能である。

或る重みが、特定のマッチするテンプレート・シーケンスに関する累積距離値に与えられることが可能である。このことは、可能性の低いテンプレート・シーケンスを含む認識結果が、完全に拒否されるのではなく、それらの認識結果が、最小の累積距離値を有するのをより困難にする重みが、それらの認識結果に与えられることが可能であることを意味する。

手書きパターンは、筆記体で書かれることが可能である。本方法は、筆記体の手書きパターンの認識に特に適している。しかし、本方法は、記号が、別々に書かれる手書きパターンを認識するために使用されることも可能である。特に、本方法は、手書きパターンが、１ストロークで書かれることを要求しない。

次に、本発明を、添付の図面を参照して、例示として、更に詳細に説明する。

図１を参照して、手書きパターンを認識するための方法を、次に説明する。まず、手書きパターンが、検出される（ステップ１０２）。通常、ユーザは、感圧スクリーン上でスタイラスを使用して手書きパターンを書くことが可能であり、そのため、手書きは、規則的な間隔でスタイラスの位置をサンプリングすることによって検出される。このようにして、ポイントの時間シーケンスが、獲得される。手書きは、例えば、ペンと、筆記面との間で形成される電気的接続を検出するセンサ群、又はペンの動きを検出するセンサ群を使用することなどにより、他の幾つかの仕方で検出されてもよい。また、手書きパターンは、手書きパターンが書き込まれている用紙を走査することによって検出されてもよい。その場合、手書きは、筆記面上のポイント・シーケンスとして検出されることが可能であり、そのシーケンスは、それらのポイントが、互いに対してどこに位置付けられるか、即ち、空間的ポイント・シーケンスに依存する。

次に、以降、コア・ポイントと呼ばれる可能なセグメント化ポイントが、手書きパターンを検出した際に作成されたポイント・シーケンスの中で選択される（ステップ１０４）。コア・ポイントは、手書きパターンの次元、即ち、パターンにおけるストロークのサンプリングされるポイントの数を減らすために選択される。それでも、コア・ポイントは、手書きパターンが正しく認識されることが可能であるように選択されなければならない。

図２は、スウェーデン語の語「ｅｋ」を形成する手書きパターン１０を示す。図２では、選択されたコア・ポイント１２も示され、１つおきのコア・ポイントに番号が付けられている。図２から、この筆記体の語の最初の部分は、文字「ｄ」の外観を有する可能性があることが明白である。問題は、認識方法が、その「ｄ」のエンドポイントで、その語を２つの文字セグメントにセグメント化した場合、それらのセグメントのいずれも、意図されていた語の文字を含まないことである。したがって、認識方法は、筆記体の手書きをセグメント化する際、複数のセグメント化の可能性を考慮する必要があることが明らかである。したがって、幾つかのコア・ポイント１２が、２つの文字間で手書きパターン１０におけるセグメント化を示す可能なポイントとして選択される。そのため、コア・ポイント１２は、別々の記号又は文字への手書きパターン１０の正しいセグメント化を特定するように選択される。しかし、コア・ポイント１２は、手書きパターン１０のセグメントの認識のためにも使用される。

コア・ポイント１２の選択は、実際のいずれのセグメント化ポイントも破棄すべきではない。しかし、手書きパターン１０の可能なセグメント化を定義するコア・ポイント１２の数は、コア・ポイント１２の数を可能な限り低く保つように選択されなければならない。したがって、コア・ポイント１２の選択は、幾つかの選択基準を使用する。

選択されるコア・ポイント１２の数は、手書きパターン１０の１つ又は複数の曲線の形状によって限定されることが可能である。このことは、曲線の形状により、選択されるコア・ポイント１２の数が規定されることを意味する。このようにして、曲線の形状が単純である場合、より少ない数のコア・ポイント１２が、選択されることが可能であるのに対して、複雑な曲線の場合、より多数のコア・ポイントが、選択される。

選択されるコア・ポイント１２の数は、前記１つ又は複数の曲線の方向変化の情報を保持するポイントに限られることが可能である。このため、曲線が曲がる、又は方向転換するポイントだけが、コア・ポイントとして使用される。これにより、限られた数のコア・ポイント１２が使用されるにもかかわらず、コア・ポイント１２が、１つ又は複数の曲線の形状を記述することができるようになる。

現在の好ましい実施例によれば、以下の選択基準が、使用される。第１の選択基準は、主な筆記方向と直交する方向において局所極限ポイントを抽出する。それらのポイントをそれぞれ、Ｎ（ノース）コア・ポイント及びＳ（サウス）コア・ポイントで表す。図２の手書きパターン１０では、Ｎコア・ポイント及びＳコア・ポイントには、円でマークが付けられている。各Ｎ−Ｓポイント・ペアは、それらの中間にある１つ乃至３つの更なるポイントによって補足されている。それらの更なるポイントは、更なる２つの基準、曲率基準及び鋭度基準によって選択されている。追加のポイントをＭ（中間）コア・ポイントと呼ぶ。図２の手書きパターン１０では、Ｍコア・ポイントには、星印でマークが付けられている。曲率基準により、手書きパターン１０が、隣接する２つのコア・ポイント間の直線から大きく逸脱しているかどうかが判定される。次に、直線から最も逸脱している位置において、Ｍコア・ポイントが選択される。鋭度基準により、手書きパターンが、急な方向転換を行うかどうかが判定される。次に、Ｍコア・ポイントが、その位置において選択される。鋭度基準が満たされるかどうかの判定は、検出された各ポイントにおいて手書きパターン１０の微分を計算することによって行われる。急な方向転換が行われる箇所では、微分は、大きい値をとる。鋭度基準及び曲率基準は、Ｎ−Ｓコア・ポイント・ペアの間における、幾つかのＭコア・ポイントを選択するために使用されることが可能である。鋭度基準又は曲率基準に従って、関心対象となるポイントが全く見出されなかった場合、Ｎコア・ポイントとＳコア・ポイントの間の曲線の長さの半分に相当する中間ポイントが、Ｍコア・ポイントとして選択される。

本方法は、各コア・ポイントにおいて、又は各コア・ポイントの近傍において、手書きパターンの特徴を特定することを更に含む（ステップ１０６）。抽出されたコア・ポイント１２の座標値を、認識目的で直接に使用することが考えられる。しかし、コア・ポイント１２の周囲も、手書きパターン１０の形状のいくらかの情報を含む。その追加の形状情報を含めるため、現在の好ましい実施例によれば、各コア・ポイントに関して５つの特徴のセットが、特定される。各コア・ポイント１２には、そのコア・ポイント１２が、どのように選択されたかに応じて、或るラベル・セットからの或るラベルが与えられる。この場合、３つのラベルＮ、Ｓ、及びＭが、使用される。コア・ポイント１２の、そのラベルは、コア・ポイント・シーケンスをテンプレートとマッチさせるための基礎を形成する。更に、それらの特徴は、コア・ポイント１２に向かう、又はコア・ポイント１２から出る方向ベクトル、コア・ポイント１２のｙ座標値、即ち、主な筆記方向と直交する方向における値と、コア・ポイント１２から、右側の最も遠い前のコア・ポイントまでの、主な筆記方向と平行なｘ座標に沿った符号付きの距離ｄｘとを含む。更に、ペンが、コア・ポイント１２において持ち上げられているか、又は押し下げられているかが判定されることが可能である。その特徴は、しばしば、セグメント化ポイントを示すが、或る記号における２つのストローク間の中断を示すことも可能である。したがって、その特徴は、コア・ポイント１２において、ペンが持ち上げられる、又は押し下げられることを許す記号を認識するために使用されることが可能である。

次に、手書きパターン１０の選択されたコア・ポイント１２の特定された特徴が、その手書きパターン１０の認識のための候補又は候補群を見出すために、テンプレートと比較される（ステップ１０８）。テンプレートは、データベースの中で提供され、順次コア・ポイントの特徴によって表現される。このため、特定された特徴は、テンプレートの特徴と直接にマッチさせられる。データベースは、ユーザが、様々な筆記スタイルを有するにもかかわらず、パターンを認識するために、同一の記号の異書体を表す、幾つかのテンプレートを含むことが可能である。更に、データベースは、つなぎ、即ち、２つの文字を通常、一緒に結合し、実際の文字の一部ではないストロークを表すテンプレートも含む。筆記体の語の途中のすべての文字は、つなぎを有するのに対して、語の始めの文字は、つなぎを有することも、有さないことも可能である。また、筆記体の語は、やはり、つなぎで終わることが可能である。一部のテンプレートは、つなぎが含まれた文字を表すことが可能である。このことは、文字「ｅ」、「ｒ」、「ｃ」、「ｘ」、及び「ｓ」のテンプレートに関して有利に使用されることが可能である。

次に、図３及び図４を参照して、手書きパターン１０の選択されたコア・ポイント１２の特徴をテンプレートと比較することを説明する。コア・ポイント１２は、手書きパターン１０の可能なセグメント化ポイントと考えられる。更に、第１の可能なセグメント化ポイントから第２の可能なセグメント化ポイントまでのコア・ポイント１２のシーケンスは、手書きパターンにおける可能な記号の表現と考えられる。このため、コア・ポイント１２のシーケンスの特徴は、テンプレートと比較される。

選択されたコア・ポイント１２は、テンプレートと比較されることが可能なコア・ポイント１２の比較的多数の異なるシーケンスを表す。比較を構造化するため、コア・ポイント１２は、シーケンスで解析される。最初のコア・ポイント１２から始めて、コア・ポイント１２の任意の可能なシーケンスが、テンプレートとマッチさせられる。テンプレートとマッチするシーケンスのエンド・コア・ポイント１２が、グラフにおけるノードとして格納される（ステップ１１０）。このようにして、テンプレートに関連付けられたセグメント候補が、コア・ポイント１２のシーケンスによって表現される手書きパターン１０のセグメントの可能な認識として選択される。コア・ポイント・シーケンスとセグメント候補の間のマッチの測度を与える距離値が、最初のコア・ポイントとノードの間のパスを表すノードの中に格納される（ステップ１１２）。最初のコア・ポイントからのコア・ポイント１２のすべての可能なシーケンスが、テンプレートとマッチさせられると、グラフにおけるノードとして格納されたコア・ポイント１２から始めて、更なるマッチングが行われる。次に、テンプレートと更なるコア・ポイント・シーケンスの間の距離値が、更なるコア・ポイント・シーケンスの開始ノードにおいて格納された最初の距離値に追加される。このため、累積距離値が、グラフにおけるノードにおいて格納される。このようにして、非循環グラフが、すべてのコア・ポイント１２に関して形成され、グラフにおける最後のコア・ポイントは、グラフを通る様々なパスに関する累積距離値の情報を保持する。その時点で、セグメント候補のシーケンスが、手書きパターン１０の可能な認識結果として特定されており（ステップ１１４）、グラフを通るパスとして表現される。ユーザに提示するために認識候補として戻されるべき選択されたパスは、以下に更に詳細に説明する通り、辞書との比較によって特定されることが可能である。

図４に、図２の手書きパターン１０の、テンプレートとのマッチングを表すグラフ２０が、示されている。グラフ２０は、番号が付けられた円として表されるノード群２２と、それらのノード間のエッジ２４とを含む。見て取ることができる通り、手書きパターンの様々なセグメント化を表す、グラフを通る幾つかのパスが、存在する。このため、手書きパターン１０とテンプレートのマッチングにより、手書きパターン１０の可能なセグメント化も同時に定義され、セグメント化された手書きパターン１０とセグメント候補シーケンスの間の類似の尺度がもたらされる。

手書きパターンにおける１つのコア・ポイントと、テンプレートにおける１つのポイントとの間の距離値は、それらのポイントの特徴の間の差の絶対値の重み付き合計である。コア・ポイント・シーケンスとテンプレートの間の距離値は、個々のポイント間の距離値の合計である。しかし、グラフにおけるノードを形成するコア・ポイントの距離は、１回だけしか計算されるべきでない。このため、ノードを形成するコア・ポイントと、テンプレートとの間の距離は、ノードに至るパス、又はノードからのパスに割り当てられることが可能であり、コア・ポイントと、ノードに至るパス、及びノードからのパスに対応する両方のテンプレートとの間の平均距離を反映する。

しかし、特定のセグメント候補シーケンスは、禁止されることが可能である。そうすることは、手書きパターン１０における情報が正しくない状況を補償する際に役立つ可能性がある。しかし、そうすることは、不可能な候補、又は可能性の低い候補を拒否することにより、認識結果を向上させるために使用されることも可能である。例えば、２つのつなぎのシーケンスが、禁止されることが可能である。更に、或る重みが、特定のセグメント候補シーケンスに関する累積距離値に与えられることが可能である。このことは、可能性の低いテンプレート・シーケンスを含む認識結果が、完全に拒否されるのではなく、それらの認識結果が、最小の累積距離値を有するのをより困難にする重みが、それらの認識結果に与えられることが可能であることを意味する。

この時点で、手書きパターン１０の幾つかの異なる可能な認識が、図４に示される通り、特定されている。手書きパターン１０の最も可能性の高い認識を選択するため、グラフ２０におけるセグメント候補シーケンスが、辞書と比較されることが可能である。次に、図５〜図７を参照して、辞書との比較を実行することの実施例を説明する。

辞書との比較を実行するために、様々な可能なセグメント候補シーケンスを表す認識グラフ４０が、形成されることが可能である（ステップ１２０）。次に図６を参照して、認識グラフ４０を説明する。図６は、図２に示される手書きパターン１０の認識に関して作成された認識グラフ４０の例を示す。認識グラフ４０は、手書きパターン１０のセグメントを認識するために使用されるグラフ２０とよく似た仕方で構築される。しかし、認識グラフ４０の中に含められる情報は、減らされることが可能である。例えば、グラフ２０は、手書きパターン全体とは合わないセグメント化ポイントを含む可能性がある。そのようなセグメント化ポイント、及び不完全なセグメント候補シーケンスは、認識グラフ４０を形成する際、無視されることが可能である。更に、グラフ２０は、同一のセグメント候補シーケンスをもたらす、異なるセグメント化を含む可能性がある。それらのセグメント候補シーケンス・ダブレットも、認識グラフを形成する際、無視されることが可能である。

認識グラフ４０は、手書きパターン１０をテンプレートと比較する際に、可能なセグメント化ポイントとして識別されているセグメント化ポイントを表すノード群４２で構築される。ノード群４２は、ノード群４２によって表されるコア・ポイント１２の番号に応じて番号が付けられた、番号付きの円として図６に示される。ノード４２は、ノード４２間の手書きパターンのセグメントに関するセグメント候補の情報を有する後続のノード群へのリファレンスを有する。ノード４２のリファレンスは、エッジ４４によって表される。エッジ４４は、図６のホワイト・ボックス内に示される通り、セグメント候補の記号の情報と、手書きパターンのセグメントとセグメント候補をマッチさせる距離値とを含む。また、各ノード４２は、そのノード４２から派生するセグメント候補（図示せず）の最小数及び最大数も含むことが可能である。ノード４２の中に限れた数のセグメント候補が入ることを許す認識グラフ４０が、構築されることが可能である。ノード４２の中に入るセグメント候補の最大許容数を設定することにより、認識グラフ４０を辞書と比較する際の処理時間を制限するために、認識グラフ４０のサイズが制限される。代替として、閾値未満の距離値を有するセグメント候補だけが、許されてもよい。また、認識グラフ４０は、辞書を考慮に入れることなしに、手書きパターンと最もよくマッチするセグメント候補のシーケンスを迅速に戻すために使用されることも可能である。そうすることは、ノードの中に入ることが許されるセグメント候補の最大数を１に設定することによって達せられることが可能である。すると、認識グラフ４０は、最低の距離値を有するセグメント候補シーケンスだけを含む。

図７に、辞書５０の単純化された例が、示されている。示される辞書５０は、幾つかの語だけを含むが、辞書５０の現在、好ましい構造を示す。辞書５０は、Ｔｒｉｅグラフとして形成される。グラフ５０は、記号を表すノード群５２を含む。ノード群５２は、許される記号シーケンスが、グラフ５０を通るストリングとして形成されるように、エッジ５４によって接続される。ルート・ノードは、空のストリングを表し、したがって、すべての記号シーケンスは、ルート・ノードを共有する。シーケンスの中の最後の記号を表すノード群には、図３においてグレーでマークが付けられている。また、各ノード５２は、そのノード５２から派生する記号（図示せず）の最小数及び最大数の情報も含むことが可能である。

認識グラフ４０は、認識グラフ４０のノード群４２を辞書５０と段階的に比較することにより、辞書５０と比較される（ステップ１２２）。最初の認識グラフ・ノードで開始して、そのノードからのエッジのセグメント候補の妥当性が、同一の記号から始まる語が、辞書５０の中に存在するかどうかをチェックすることによって判定される。次に、最初の認識グラフ・ノードからのエッジが、妥当な記号の情報で更新され、つまり、辞書５０の中に対応物を有するセグメント候補が保持され、その一方で、その他のセグメント候補は、破棄される。エッジの更新された情報は、図６にグレーでマークが付けられたボックス内に示される。また、エッジは、認識グラフ４０におけるセグメント候補シーケンスにおけるそれぞれの位置に対応する、辞書５０の中のノード群へのリファレンスで更新もされる。その後、比較は、認識グラフ４０におけるすべてのノード４２にわたって続けられ、辞書５０の中で対応物を有さないすべてのセグメント候補シーケンスが破棄される。各認識グラフ・ノード４２に関して、そのノードからのエッジのセグメント候補の妥当性が、辞書５０の中に、認識グラフ・ノードの中に入るようにエッジによって参照される、そのノードからのエッジにおける対応する記号が存在するかどうかをチェックすることによって判定される。

セグメント候補シーケンスに記号の最小数及び最大数の情報を使用して、妥当性検査は、或る語の、それらの長さ境界が、辞書５０の中の該当するノードによって満たされるかどうかをチェックすることも含むことが可能である。長さ境界が、満たされない場合、そのセグメント候補シーケンスは、破棄されることが可能である。

更に、時間の複雑さを制御するため、認識グラフ４０におけるすべてのノード４２に関して、Ｔｒｉｅグラフ５０の中に入るリファレンスの数の上限が、設定されることが可能である。こうして、時間の複雑さの制御が、得られる。しかし、不良な初期マッチを有するセグメント候補シーケンスが、破棄されるリスクが、存在する。

認識グラフ４０のすべてのノードが、解析されると、認識グラフ４０の最後のノードは、辞書の中にも存在する手書きパターン１０の最良の認識候補の情報を保持する。その時点で、手書きパターン１０に関する認識候補が、ユーザに提示されるように、戻されることが可能である（ステップ１２４）。最低の累積距離値を有する認識候補が、手書きパターンの解釈としてユーザに提示されることが可能である。代替として、幾つかの認識候補が、ユーザに提示されてもよく、したがって、ユーザは、正しい解釈を選択することができる。

次に図８を参照して、手書きパターンの認識のためのデバイス３０を説明する。デバイス３０は、手書きパターンをポイント・シーケンスとして記録するための検出器３２を含む。検出器３２は、ユーザが書き込むことができる感圧スクリーンとして実施されることが可能である。デバイス３０は、検出された手書きパターンを解析するためのアナライザ３４を更に含む。アナライザ３４は、コンピュータの中央処理装置上で実行されるプログラムとして実施されることが可能である。アナライザ３４は、手書きパターンのコア・ポイントを選択するための手段と、コア・ポイントにおいて、又はコア・ポイントの近傍において手書きパターンの特徴を特定するための手段とを含む。デバイス３０は、コア・ポイントの特徴として表現されたテンプレートを含むデータベース３６を更に含む。アナライザ３４は、手書きパターンのコア・ポイント・シーケンスの特徴とテンプレートの間の距離値を計算するための手段を更に含む。アナライザ３４は、手書きパターンをテンプレートと構造的に比較するためにグラフを形成するように構成される。アナライザ３４は、手書きパターンの可能な認識を形成するセグメント候補シーケンスを表す認識グラフを形成するように更に構成される。デバイス３０は、許される語又は記号シーケンスを表すＴｒｉｅグラフを含む辞書３８を更に含む。アナライザ３４は、手書きパターンと最もよくマッチする記号シーケンスを特定するために、認識グラフを辞書と比較するように更に構成される。それらの可能な認識結果は、ディスプレイ上で提示されることが可能であり、ディスプレイは、感圧スクリーンと別個であっても、手書きパターンが入力された感圧スクリーンに組み込まれていてもよい。

別の実施例によれば、前述した方法及びデバイスの実施の際に、手書きパターンの区別符号に、特別な考慮が与えられることが可能である。本願明細書の文脈では、区別符号という用語は、記号の近くの、又は記号と交差するマーク又はストロークとして解釈されるべきであり、一部のケースにおけるマーク又はストロークは、そのマーク又はストロークを有する記号が、そのマーク又はストロークを有さない記号とは別の記号であることを示し、例えば、

とｅ、

とａ、

とｏ、ｔとｌ、一部のケースでは、区別符号なしに、記号が、それでも正しい記号と解釈されることが可能な、記号の特徴である、例えば、ｉ及びｊ。筆記体の手書きでは、多くの区別符号は、語の残りの部分が書かれた後に、引かれる。区別符号は、認識のために重要である。そうである１つの理由は、筆記体の語における多くのセグメントが、区別符号なしの記号とマッチする可能性があることであり、例えば、ドットなしの「ｉ」は、別の文字の一部であると解釈される可能性がある。

筆記体の語を、時間的に並べ替えられた文字セグメントに分解するセグメント化ベースの方法、例えば、本願明細書で前述した方法の場合、正しい認識を可能にするために、区別符号を考慮することが重要である可能性がある。

区別符号の情報を利用する一実施例では、図１のステップ１０６で、区別符号に関する情報は、特徴として、コア・ポイント・サブセットに割り当てられる。したがって、区別符号と関係する情報は、コア・ポイントに存在し、そのため、可能な記号をテンプレートと比較することの結果に影響を与える要因として、認識中に利用されることが可能である。

区別符号は、手書きパターンにおいて、結合されていないつなぎの線として、即ち、いずれのセグメントにも結合されておらず、つなぎとして識別されているストロークとして識別されることが可能である。

コア・ポイント・サブセットのコア・ポイントに割り当てられる特徴において使用されることが可能な特性は、区別符号の位置、即ち、ｘ座標とｙ座標、その特定のコア・ポイントから区別符号までの絶対距離、ｘ方向におけるコア・ポイントから区別符号までの距離、ｙ方向におけるコア・ポイントから区別符号までの距離、区別符号の長さ、区別符号の形状などであることが可能である。コア・ポイントに割り当てられた区別符号と関係する特徴は、以上の特性の１つだけ、又は複数の特性の組合せを含むことが可能である。

区別符号が割り当てられたコア・ポイント・サブセットは、そのサブセットが、Ｎ又はＭとラベルが付けられたコア・ポイント１２だけを含むように構成されることが可能である。これにより、本方法は、すべてのコア・ポイントが含まれたとした場合より、高速になる。

区別符号特徴は、逐次解析における現在のノード２２の距離値にペナルティを与えるために、コア・ポイント１２の逐次解析中に使用されることが可能である。例えば、現在のノード２２に関して、示唆される記号、即ち、候補が、「ｉ」であり、区別符号が、そのノード２２に関連するコア・ポイント１２に適度に近い場合、そのノード２２には、比較的小さいペナルティが与えられることが可能である。コア・ポイント１２と区別符号の間のより大きい距離は、より大きいペナルティをもたらす。最大のペナルティは、区別符号を有すべき候補の欠落した区別符号に関して与えられるペナルティに相当する値に設定されることが可能であり、そのような最大のペナルティは、区別符号までの距離が、或る特定の値を超える場合の候補に与えられることが可能である。逐次解析中の区別符号特徴の使用により、区別符号が、グラフ２０の形成中にグラフ２０の累積距離値に影響を与えるようにさせることが可能になる。このことは、文字「ｉ」及び「ｊ」に関して特に関心を引く。というのは、それらの文字の構造の単純さのため、区別符号が考慮されない場合、他の文字／記号の諸部分が、「ｉ」又は「ｊ」として誤って解釈されるという潜在的なリスクがもたらされるからである。したがって、前述のスキームにより、「ｉ」及び／又は「ｊ」を候補／候補群として含み、その候補の最初のコア・ポイントから適当な距離の範囲内に位置する区別符号を有するパスが、有利にされる。また、逐次解析中の区別符号特徴の使用は、他の記号又は文字に関して実施されることも可能である。

認識プロセスにおいて区別符号に関する情報を利用する方法は、一実施例によれば、Ｎ又はＭというラベルを有する各コア・ポイント１２に関して、最も近い区別符号ポイントを特定し、区別符号特徴を、前述した通り、そのような各コア・ポイントに関連付けることであることが可能である。別の実施例によれば、最も近い区別符号ポイントの特徴は、Ｎ又はＭというラベルを有する各コア・ポイント１２に割り当てられ、最も近い区別符号ポイントは、コア・ポイントから所定の距離の範囲内である。区別符号特徴を割り当てた後、手書きパターン１０のセグメント化を表すグラフ２０の構築中、区別符号を含む記号とマッチしたセグメント化、即ち、候補記号は、そのセグメント化の開始Ｎコア・ポイント又は開始Ｍコア・ポイントまでの距離と関係する値によってペナルティが与えられることが可能である。必要なすべてのＮコア・ポイント及びＭコア・ポイントに区別符号の特徴が割り当てられるわけではない実施例において、最大のペナルティは、区別符号を有することになっており、その候補のＮコア・ポイント又はＭコア・ポイントに区別符号の特徴が割り当てられていないノードに与えられる。

更に、区別符号が明らかに必要とされていない箇所で区別符号を有する、セグメント化グラフにおけるパスからもたらされる候補語には、そのような候補語を辞書とマッチさせた後、ペナルティが与えられることが可能である。辞書の使用については、本願明細書において前段で説明した。候補語が、区別符号が明らかに必要とされていない箇所で区別符号を含むかどうかを判定するのに使用されることが可能な一方法は、その候補語が、多過ぎる区別符号を含むかどうかをチェックすることである。そうすることは、候補語に含まれる区別符号の数を、その候補語をもたらすパスにおいて識別される区別符号の数と比較し、次に、その候補語の余剰の区別符号にペナルティを与えることによって達せられることが可能である。

例えば、
Ａ−Ｂ＞０の場合、ペナルティ＝係数・（Ａ−Ｂ）
Ａ−Ｂ＜０の場合、ペナルティ＝０
Ａ＝区別符号の最大数（候補語）
Ｂ＝区別符号の観察される数（候補語をもたらすパス）

候補語をもたらすパスにおける区別符号の観察される数は、結合されていないつなぎの線、即ち、いずれのセグメントにも結合されておらず、つなぎとして識別されているストロークの数を数えることによって得られることが可能である。

更なる実施例によれば、未使用の区別符号には、もたらされる候補語と、その候補語をもたらすパスの間で区別符号マッチ検査を適用することによってペナルティが与えられることが可能である。そうすることは、候補語に含まれる区別符号の数を、その候補語をもたらすパスにおいて識別された区別符号の数と比較し、次に、その候補語において欠落している区別符号にペナルティを与えることによって達せられることが可能である。

例えば、
Ｂ−Ａ＞０の場合、ペナルティ＝係数・（Ｂ−Ａ）
Ｂ−Ａ＜０の場合、ペナルティ＝０
Ａ＝区別符号の数（候補語）
Ｂ＝区別符号の観察される数（候補語をもたらすパス）

以上のスキームを使用することにより、システムは、例えば、「ｂｌｉｎｄ」という語をｂｌｉｎｄとして認識することが、その書かれたテキストの文字「ｉ」が、文字「ｅ」によりよく似ており、「ｂｌｅｎｄ」という語をもたらす可能性があるケースでも、更に、ドットが、多少、誤った位置に置かれている場合でも、できる。

本願明細書で説明する好ましい実施例は、全く限定するものではなく、多数の代替の実施例が、添付の特許請求の範囲によって定義される保護の範囲内で可能であることが、強調されなければならない。

手書きパターンを認識するための方法を示す流れ図である。手書きパターンをテンプレートと比較するために使用されるべき、選択されたセグメント化ポイントを示す手書きパターンの例を示す図である。手書きパターンをテンプレートと比較するための方法を示す流れ図である。テンプレートと手書きパターンの間の距離値を特定するために形成されているグラフのチャートである。認識グラフを辞書と比較するための方法を示す流れ図である。手書きパターンの可能な認識から形成されている認識グラフの実施例を示す図である。辞書の実施例を示す図である。本発明の或る実施例による、手書きパターンを認識するためのデバイスを示す概略図である。

Claims

１つ又は複数の曲線を含み、複数の記号を表す手書きパターンの認識のための方法であって、
前記手書きパターンを、前記手書きパターンの前記１つ又は複数の曲線に沿ったポイント・シーケンスとして検出すること、
前記手書きパターンの前記ポイント・シーケンスにおける可能な区別符号を識別すること、
前記ポイント・シーケンスの中で、前記手書きパターンをセグメント化して、前記手書きパターンのこれらのセグメントを記号として認識する際に使用するために選択されるコア・ポイントを選択すること、
各コア・ポイントにおいて、又は各コア・ポイントの近傍において、前記１つ又は複数の曲線の特徴を特定すること、
識別された可能な区別符号に関連する少なくとも１つの特徴を、コア・ポイント・サブセットの各コア・ポイントに割り当てること、及び
前記手書きパターンを、少なくとも１つの記号、又は或る記号の一部をそれぞれが表すテンプレートと比較することであって、
コア・ポイントが、可能なセグメント化ポイントを表し、第１の可能なセグメント化ポイントから第２の可能なセグメント化ポイントまでのコア・ポイント・シーケンスが、可能な記号を表す、シーケンスにおける前記コア・ポイントを段階的に解析することを、
前のコア・ポイント・シーケンスの最初のコア・ポイント、又は最後のコア・ポイントから始まるコア・ポイント・シーケンスの前記特徴を、前記テンプレートとマッチさせて、距離値を計算すること、及び
前記マッチしたコア・ポイント・シーケンスにおける最後のコア・ポイントに、前記シーケンスにおける最初のコア・ポイントに割り当てられた距離値と、前記計算された距離値の合計である累積距離値を割り当てることによって実行し、これにより、すべての順次コア・ポイントに関する最小の累積距離値が、前記最後のコア・ポイントに割り当てられ、複数の記号を前記手書きパターンの可能な認識結果として表すマッチしたテンプレートのシーケンスに対応することを含む、比較することを含む方法。
前記比較することは、
前記手書きパターンにおける２つの記号間の可能なセグメント化ポイントに対応するコア・ポイントをそれぞれが表すノードと、それらのノードを接続する、１つのノードから別のノードに至る、コア・ポイント・シーケンスに沿った、前記手書きパターンにおける可能な記号に対応するパスをそれぞれが表すアーチとを有するグラフを形成すること、
前記コア・ポイント・シーケンスの前記特徴を前記テンプレートとマッチさせることによって、各パスに少なくとも１つの距離値を割り当てること、及び
前記最小の累積距離値で前記グラフを通って、最初のノードから最後のノードに至る、複数の記号を前記手書きパターンの可能な認識結果として表すマッチしたテンプレートのシーケンスに対応するパスを少なくとも特定することによって実行される、請求項１に記載の方法。
閾値未満の累積距離値を有する、前記グラフを通るパスに対応する、幾つかの可能な認識結果が、特定される、請求項２に記載の方法。
前記グラフは、コア・ポイントをノードとして順次に追加することによって形成され、各パスに少なくとも１つの距離値を前記割り当てることは、前記グラフの形成中に実行される、請求項２又は３に記載の方法。
少なくとも１つの距離値を前記割り当てることは、前記コア・ポイント・シーケンスの前記特徴に最もよくマッチするテンプレートに対応する最低の距離値を各パスに割り当てることを含む、請求項２から４までのいずれか一項に記載の方法。
検出された区別符号に関連する少なくとも１つの特徴を割り当てる前記動作は、前記手書きパターンをテンプレートと比較する前記動作より前に実行される、請求項１から５までのいずれか一項に記載の方法。
選択されるコア・ポイントの数は、前記１つ又は複数の曲線の形状によって限定される、請求項１から６までのいずれか一項に記載の方法。
選択されるコア・ポイントの前記数は、前記１つ又は複数の曲線の方向変化の情報を保持するポイントに限定される、請求項７に記載の方法。
コア・ポイントを前記選択することは、前記手書きパターンの主な筆記方向と直交する方向において前記１つ又は複数の曲線の局所極限ポイントであるポイントを選択することを含む、請求項１から８までのいずれか一項に記載の方法。
前記コア・ポイントは、Ｎコア・ポイント、Ｓコア・ポイント、及びＭコア・ポイントとして分類され、Ｎコア・ポイントは、主な筆記方向と直交する方向における局所極大コア・ポイントであり、Ｓコア・ポイントは、主な筆記方向と直交する方向における局所極小コア・ポイントであり、Ｍコア・ポイントは、Ｎコア・ポイントとＳコア・ポイントの中間コア・ポイントである、請求項９に記載の方法であって、
前記コア・ポイント・サブセットの前記コア・ポイントをＮコア・ポイント及びＭコア・ポイントとして選択する動作を更に含む方法。
コア・ポイントを前記選択することは、前記１つ又は複数の曲線の微分の絶対値が、閾値を超えるポイントを選択することを含む、請求項１から１０までのいずれか一項に記載の方法。
コア・ポイントを前記選択することは、隣接する２つのコア・ポイント間の直線からの前記１つ又は複数の曲線の逸脱が、閾値を超えるコア・ポイントを選択することを含む、請求項１から１１までのいずれか一項に記載の方法。
特徴を前記特定することは、主な筆記方向と直交する方向における位置を定義する、前記コア・ポイントのｙ座標を特定することを含む、請求項１から１２までのいずれか一項に記載の方法。
特徴を前記特定することは、前記コア・ポイントに向かう前記曲線の方向、及び前記コア・ポイントからの前記曲線の方向を特定することを含む、請求項１から１３までのいずれか一項に記載の方法。
特徴を前記特定することは、主な筆記方向と平行な方向における位置を定義する、前のコア・ポイントからのｘ座標の変位を特定することを含む、請求項１から１４までのいずれか一項に記載の方法。
特徴を前記特定することは、前記コア・ポイントにおいてペンが持ち上げられているか、又は押し下げられているかを判定することを含む、請求項１から１５までのいずれか一項に記載の方法。
前記手書きパターンにおける或るコア・ポイントと、或るテンプレートの或るポイントとの間の距離値は、前記コア・ポイントの各特徴と、前記テンプレートの前記ポイントとの間の距離の重み付き合計として計算される、請求項１から１６までのいずれか一項に記載の方法。
前記手書きパターンは、テンプレートと比較され、複数のテンプレートは、同一の記号の様々な外観を表す、請求項１から１７までのいずれか一項に記載の方法。
前記手書きパターンの可能な認識結果は、辞書と比較される、請求項１から１８までのいずれか一項に記載の方法。
特定のマッチするテンプレート・シーケンスが、禁止される、請求項１から１９までのいずれか一項に記載の方法。
或る重みが、特定のマッチするテンプレート・シーケンスに関する累積距離値に与えられる、請求項１から２０までのいずれか一項に記載の方法。
前記手書きパターンは、筆記体で書かれる、請求項１から２１までのいずれか一項に記載の方法。
１つ又は複数の曲線を含み、複数の記号を表す手書きパターンの認識のためのデバイスであって、
請求項１から２２までのいずれか一項に記載の動作を実行する手段を含むデバイス。