JP4787275B2 - セグメント化ベースの認識 - Google Patents

セグメント化ベースの認識 Download PDF

Info

Publication number
JP4787275B2
JP4787275B2 JP2007557965A JP2007557965A JP4787275B2 JP 4787275 B2 JP4787275 B2 JP 4787275B2 JP 2007557965 A JP2007557965 A JP 2007557965A JP 2007557965 A JP2007557965 A JP 2007557965A JP 4787275 B2 JP4787275 B2 JP 4787275B2
Authority
JP
Japan
Prior art keywords
core
point
core point
handwritten pattern
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007557965A
Other languages
English (en)
Other versions
JP2008532175A (ja
Inventor
シュテルンビー、ヤコブ
Original Assignee
ザイ デクマ アクチボラゲット
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザイ デクマ アクチボラゲット filed Critical ザイ デクマ アクチボラゲット
Publication of JP2008532175A publication Critical patent/JP2008532175A/ja
Application granted granted Critical
Publication of JP4787275B2 publication Critical patent/JP4787275B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2272Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

本発明は、複数の記号を表す1つ又は複数の曲線を含む手書きパターンの認識のための方法に関する。
今日、手書きは、データ処理ユニットに、特に、移動電話機及びPDA(パーソナル・デジタル・アシスタント)にデータを入力するための、ますます一般的な方法となっている。入力されたデータを扱うために、手書きは、認識され、解釈されなければならない。手書きを認識するためのほとんどの既存の方法は、入力されるべき文字が、1つずつ書き込まれ、別々に認識されることを要求する。そのような方法の実施例が、米国特許第4731857号で与えられているが、最も有名なのが、パーム社によって製造されるGraffiti(登録商標)である。
データの入力をスピードアップするために、筆記体の手書きが許されることが望ましい。しかし、筆記体手書き認識は、別々の文字の認識より、はるかに複雑である。筆記体手書き認識に関して複雑さが増大することは、つなげられた文字をセグメント化することの、即ち、手書きパターン内で1つの文字から別の文字への遷移を識別することの問題に帰せられる。そのため、筆記体手書き認識における誤りは、2つのレベルで生じる可能性があり、これにより、明快な順次認識システムの構築が大いに難しくなる。
筆記体手書き認識のための方法は、一般に、手書きパターンの可能なセグメント化の組合せの爆発的増加を生じる、隣接する文字間における多数の可能なセグメント化が存在するという問題に悩まされている。
したがって、今日のほとんどの市販のシステムは、ニューラル・ネットワーク、及び隠れマルコフ・モデルを、組み込まれた辞書と一緒に使用する、複雑な統計システムを使用する。そのようなシステムの実施例が、P.Neskovic及びL.Cooper、「Neural network−based context driven recognition of on−line cursive script」、Seventh International Workshop on Frontiers、Handwriting Recognition Proceedings、352〜362ページ、2000年9月、及びM.Schenkel及びI.Guyon、「On−line cursive script recognition using time delay networks and hidden markov models」、Machine Vision and Applications、vol.8、215〜223ページ、1995年において提示されている。それらのシステムの大きな欠点は、それらのシステムが、大きく、大量の訓練セットを要求することである。更に、それらのシステムは、使用される辞書に大きく依存する。
本発明の目的は、筆記体手書き認識のための改良された方法を提供することである。本発明の別の目的は、手書きパターンを迅速にセグメント化して、認識する方法を提供することである。本発明の更なる目的は、多大な学習を要求せず、非常に高い処理能力を必要としない方法を提供することである。
以上の諸目的の少なくとも幾つかは、独立請求項による方法、デバイス、及びコンピュータ・プログラム製品によって達せられる。本発明の特定の諸実施例は、従属請求項に記載される。
したがって、本発明は、1つ又は複数の曲線を含み、複数の記号を表す手書きパターンの認識のための方法を提供する。手書きパターンを、その手書きパターンの1つ又は複数の曲線に沿ったポイント・シーケンスとして検出すること、手書きパターンの、そのポイント・シーケンスにおいて可能な区別符号を識別すること、そのポイント・シーケンスの中で、手書きパターンをセグメント化して、手書きパターンのこれらのセグメントを記号として認識する際に使用するために選択される、コア・ポイントを選択すること、各コア・ポイントにおいて、又は各コア・ポイントの近傍において、1つ又は複数の曲線の特徴を判定すること、識別された可能な区別符号に関連する少なくとも1つの特徴を、コア・ポイント・サブセットの各コア・ポイントに割り当てること、及び手書きパターンを、少なくとも1つの記号、又は或る記号の一部をそれぞれが表すテンプレートと比較することを含む方法。比較することは、シーケンスにおけるコア・ポイントを段階的に解析することを含み、コア・ポイントは、可能なセグメント化ポイントを表し、第1の可能なセグメント化ポイントから第2の可能なセグメント化ポイントまでのコア・ポイント・シーケンスは、可能な記号を表し、前記解析することは、前のコア・ポイント・シーケンスの最初のコア・ポイント又は最後のコア・ポイントで始まるコア・ポイント・シーケンスの特徴を、前記テンプレートとマッチさせて、距離値を計算し、累積距離値を、マッチしたコア・ポイント・シーケンスにおける最後のコア・ポイントに割り当てることによって実行され、前記累積距離値は、そのシーケンスにおける最初のコア・ポイントに割り当てられた距離値と、計算されて距離値との合計であり、すべての順次コア・ポイントに関する最小の累積距離値が、最後のコア・ポイントに割り当てられ、複数の記号を手書きパターンの可能な認識結果として表すマッチしたテンプレートのシーケンスに対応する。
また、本発明は、複数の記号を表す1つ又は複数の曲線を含む手書きパターンの認識のためのデバイスも提供し、前記デバイスは、前述した方法の諸動作を実行するための手段を含む。
また、本発明は、前段で定義された方法を実行するためのソフトウェア・コード部分を含む、データ処理ユニットの内部メモリに直接に読み込まれることが可能なコンピュータ・プログラム製品も提供する。
本発明のお陰で、幾つかの記号を表す手書きパターンは、迅速に認識されることが可能である。セグメント化と認識の両方のためにコア・ポイントを使用することにより、計算は、手書きパターンを分離することと、そのパターンをテンプレートとマッチさせることを同時に行う。そのため、手書きパターンをテンプレートと比較するプロセスは、非常に迅速である。すべてのコア・ポイントが、解析された後、累積距離値が、最後のコア・ポイントに割り当てられ、手書きパターンとマッチさせられているテンプレートのシーケンスに関連付けられる。このため、最後のコア・ポイントに割り当てられた情報は、手書きパターンの可能な認識結果を得るために、容易に使用されることが可能である。更に、可能な区別符号を識別して、それらの区別符号を、コア・ポイント・サブセットに割り当てることにより、高いヒット率、即ち、正しい解釈を見出すことが、円滑にされることが可能であり、認識は、それでも、非常に迅速であることが可能である。
幾つかの基準に従って、限られた数の可能なセグメント化ポイントを選択することにより、手書きパターンのセグメントが、それらの可能なセグメント化ポイントだけと関係がある情報を使用することによって認識されることが可能であることが、認識されている。このため、筆記体の手書きを認識するために、ニューラル・ネットワーク又は隠れマルコフ・モデルを使用する必要は、存在しないことが、認識されている。代わりに、可能なセグメント化ポイントが、選択され、同一の可能なセグメント化ポイントが、手書きパターン内の記号の認識のために使用される。
コア・ポイントの選択により、多数のポイントが、検出されたシーケンスから破棄される。このため、扱いやすい数のコア・ポイントが、選択され、これにより、コア・ポイント・シーケンスをテンプレートと比較するために必要とされる計算作業が抑えられる。検出されたポイント・シーケンスにおける情報の相当な部分は、手書きパターンを認識するためには、冗長であることが、認識されている。したがって、多数のポイントを破棄することは、手書きパターンを正しく認識する可能性にほとんど影響を及ぼさない。また、限られた数のポイントが、認識において使用されるので、幾つかのテンプレートが、同一の記号を認識するために使用されることが可能である。このため、テンプレートは、異書体、即ち、同一の記号の筆記の異なる外観、又は異なるスタイルを表すことが可能である。
有利には、手書きされた記号における可能なセグメント化ポイントを構成するコア・ポイントだけが、選択される。これにより、解析されるべきコア・ポイントの数が、確かに低く抑えられ、そのため、方法は、高速である。
本明細書で使用される、「記号」という用語は、ラテン文字、漢字、又は他の任意の種類の文字、文字の間、前、又は後のつなぎ、数字、或いは任意の句読点などの、特定の意味を有する任意の形態として解釈されるべきである。更に、「手書きパターン」という用語は、個人によって書かれた特定の形態の記号、又は記号シーケンスとして解釈されるべきである。
或る実施例によれば、比較することは、手書きパターンにおける2つの記号間の可能なセグメント化ポイントに対応するコア・ポイントをそれぞれが表すノード群と、それらのノードを接続する、1つのノードから別のノードに至る、コア・ポイント・シーケンスに沿った、手書きパターンにおける可能な記号に対応するパスをそれぞれが表すアーチとを有するグラフを形成すること、コア・ポイント・シーケンスの特徴を前記テンプレートとマッチさせることによって、各パスに少なくとも1つの距離値を割り当てること、及び最小の累積距離値でグラフを通って最初のノードから最後のノードに至る、手書きパターンの可能な認識結果を表すマッチしたテンプレートのシーケンスに対応するパスを少なくとも特定することによって実行される。
グラフを形成することにより、順次コア・ポイントの段階的な解析が、構造化されることが可能である。このことは、実行されるべき計算の良好な制御が得られ、累積距離の結果が、ノード群及びアーチ群に関連して構造的に格納されることが可能であることを意味する。更に、グラフは、効果的に使用されることが可能である。というのは、グラフのサイズは、多数のポイントが、コア・ポイントの選択の際に破棄されることが可能であるので、扱うのが容易だからである。
幾つかの可能な認識結果が、閾値未満の累積距離値を有する、グラフを通るパスに対応して、特定されることが可能である。このことは、手書きパターンをテンプレートと比較することにより、幾つかの候補が、手書きパターンの認識結果として戻されることが可能であることを意味する。それらの候補は、幾つかの異なる形で扱われることが可能である。最小の累積距離値に対応する最良の候補が、ユーザに提示されることが可能である。その候補が拒否された場合、その他の候補が、提示されることが可能である。代替として、幾つかの候補が、最初に提示されてもよい。
グラフは、コア・ポイントをノードとして順次に追加することによって形成されることが可能であり、各パスに少なくとも1つの距離値を前記割り当てることは、グラフの形成中に実行される。要求される計算は、グラフが形成されるにつれ、実行される。このことは、可能な認識結果は、グラフが形成されるとすぐに、グラフから得られることが可能であることを意味する。
少なくとも1つの距離値を割り当てることは、コア・ポイント・シーケンスの特徴と最もよくマッチするテンプレートに対応する最低の距離値を各パスに割り当てることを含む。このことは、グラフが、使用される特徴に応じて、コア・ポイント・シーケンスと最もよくマッチするテンプレートの情報を、常に保持することを意味する。
検出された区別符号に関連する少なくとも1つの特徴を割り当てることは、手書きパターンをテンプレートと比較する動作より前に実行される。このため、区別符号は、コア・ポイントをテンプレートと比較している間に、パスの距離値に影響を与えることが可能であり、そのため、認識が、更により効果的であることを可能にする。
選択されるコア・ポイントの数は、前記1つ又は複数の曲線の形状によって制限されることが可能である。このことは、曲線の形状により、選択されるコア・ポイントの数が規定されることを意味する。このようにして、曲線の形状が単純である場合、より少ない数のコア・ポイントが、選択されることが可能であるのに対して、複雑な曲線の場合、より多数のコア・ポイントが、選択される。
選択されるコア・ポイントの数は、前記1つ又は複数の曲線の方向変化の情報を保持するポイントに限定されることが可能である。このため、曲線が、曲げられる、又は向きを変えられるポイントだけが、コア・ポイントとして使用される。これにより、限られた数のコア・ポイントが使用されるにもかかわらず、コア・ポイントが、1つ又は複数の曲線の形状を記述することが可能になる。
コア・ポイントを選択することは、手書きパターンの主な筆記方向と直交する方向における前記1つ又は複数の曲線の局所極限ポイントであるポイントを選択することを含むことが可能である。それらの選択されたコア・ポイントは、しばしば、可能なセグメント化ポイントに対応することが可能である。このため、以上の選択基準により、セグメント化ポイントの大部分を保持する確率が高いコア・ポイント・セットが選択される。更に、それらの局所極限ポイントは、記号の形状に関して有意であり、したがって、認識の際に使用するのにも適している。
コア・ポイントは、Nコア・ポイント、Sコア・ポイント、及びMコア・ポイントとして分類されることが可能であり、ただし、Nコア・ポイントは、主な筆記方向と直交する方向における局所極大コア・ポイントであり、Sコア・ポイントは、主な筆記方向と直交する方向における局所極小コア・ポイントであり、Mコア・ポイントは、Nコア・ポイントとSコア・ポイントの中間コア・ポイントであり、前記コア・ポイント・サブセットのコア・ポイントをNコア・ポイント及びMコア・ポイントとして選択する動作を更に含む。このため、区別符号特徴が割り当てられることが可能な、コア・ポイント・サブセットのコア・ポイントを限定すること、及び、多くのケースで、コア・ポイントに区別符号特徴を割り当てるプロセスをスピードアップすること。
本発明の或る実施例によれば、局所極限ポイントを選択することによって作成されるコア・ポイント・セットは、各局所極限ポイント・ペアの間における1つ乃至3つのコア・ポイントを選択することにより、拡張される。それらの更なるコア・ポイントは、他の基準を使用することによって選択される。そのようなコア・ポイント・セットは、ラテン文字から成る手書きパターンをセグメント化して、認識する際に使用するのに適している。
コア・ポイントを選択することは、1つ又は複数の曲線の微分の絶対値が、閾値を超えるポイントを選択することを含むことが可能である。このことは、曲線又は曲線群が、急な方向転換を行う場合に、コア・ポイントが選択されることを意味する。これにより、記号を認識するための有用な情報がもたらされ、可能なセグメント化ポイントが、更に選択される。
コア・ポイントを選択することは、隣接する2つのコア・ポイント間の直線からの1つ又は複数の曲線の逸脱が、閾値を超える場合に、コア・ポイントを選択することを含むことが可能である。このことは、1つ又は複数の曲線の或る曲率を記述するコア・ポイントが、選択されることを意味する。このため、曲線又は曲線群の形状に関する情報が、保存され、このことは、認識のために役立つ。また、このように選択されたコア・ポイントは、セグメント化ポイントである確率も高い。
コア・ポイントを選択することは、前述した選択基準の任意の組合せを含むことが可能であり、或いは可能なセグメント化ポイントを選択することになっている、更なる選択基準を使用することが可能である。
特徴を特定することは、主な筆記方向と直交する方向における或る位置を定義する、コア・ポイントのy座標を特定することを含むことが可能である。このことは、主にサイズが異なる文字を区別する際に役立つ。
特徴を特定することは、コア・ポイントに向かう曲線の方向と、コア・ポイントからの曲線の方向とを特定することを含むことが可能である。これは、曲線の形状に関する情報を与え、したがって、手書きパターンをテンプレートと比較する際に非常に役立つ。
特徴を特定することは、主な筆記方向と平行な方向における或る位置を定義する、前のコア・ポイントからのx座標変位を特定することを含むことが可能である。このことは、それらのコア・ポイントが、互いに関係していることを意味する。そのため、テンプレートは、コア・ポイント・シーケンスと正しくマッチさせられるために、移動されなくてもよい。
x座標の最高値を有する、前のコア・ポイントからのx座標変位を特定することが、特に好適であることが分かっている。
特徴を特定することは、コア・ポイントにおいて、ペンが持ち上げられているか、又は押し下げられているかを判定することを含むことが可能である。その特徴は、しばしば、セグメント化ポイントを示すが、或る記号における2つのストローク間の中断を示すことも可能である。したがって、その特徴は、コア・ポイントにおいて、ペンが持ち上げられる、又は押し下げられることを許す記号を認識するために使用されることが可能である。
手書きパターンにおける或るコア・ポイントと、或るテンプレートの或るポイントとの間の距離値は、そのコア・ポイントの各特徴と、そのテンプレートの、そのポイントとの間の距離の重み付き合計として計算されることが可能である。このため、特定された特徴には、認識のための、それらの特徴の重要度に応じて、異なる重みが与えられることが可能である。更に、すべての特徴が、距離値に寄与する。
手書きパターンは、テンプレートと比較されることが可能であり、複数のテンプレートは、同一の記号の様々な外観を表す。同一の記号を表す複数のテンプレートにより、様々な異書体が、認識されることが可能であるようになる。更に、テンプレートは、限られた数の特徴だけによって表現されるので、扱いやすいサイズのテンプレート・データベースを有しながら、極めて多数のテンプレートを格納することが可能である。
手書きパターンの可能な認識結果は、辞書と比較されることが可能である。このことは、手書きパターンをテンプレートと比較することによって特定された候補が、辞書と比較されることによって更に評価されることが可能であることを意味する。その結果、ユーザに提示される候補は、例えば、最小の累積距離値を有する候補、又は辞書の中に存在する候補の中で最小の累積距離値を有する候補であることが可能である。しかし、辞書を使用する、この更なる評価は、可能な認識結果を得るために必要ではない。したがって、手書きパターンをテンプレートと比較することは、辞書の使用なしに、認識結果をもたらす。
手書きパターンによって何が意図されているかを常に正しく解釈することは、本発明の事前目標ではない。このため、本方法は、或る文字が、手書きパターンから抜けている場合、又は手書きパターンが誤って綴られている場合などの、手書きパターンが、何らかの情報を欠いている、又は誤った情報を含む場合を独立に識別することはない。しかし、本方法は、他の文脈で補足する堅固な基礎、及びストリング・マッチング・ルーチンを提供して、手書きパターン自体を調べるだけでは、正しく認識することが可能でない語も、認識されることが可能であるようにする。
更に、特定のマッチするテンプレート・シーケンスが、禁止されることも可能である。そうすることは、手書きパターンにおける情報が正しくない状況を補償する際に役立つ可能性がある。しかし、そうすることは、不可能な候補、又は可能性の低い候補を拒否することにより、認識結果を向上させるために使用されることも可能である。例えば、2つのつなぎのシーケンスが、禁止されることが可能である。
或る重みが、特定のマッチするテンプレート・シーケンスに関する累積距離値に与えられることが可能である。このことは、可能性の低いテンプレート・シーケンスを含む認識結果が、完全に拒否されるのではなく、それらの認識結果が、最小の累積距離値を有するのをより困難にする重みが、それらの認識結果に与えられることが可能であることを意味する。
手書きパターンは、筆記体で書かれることが可能である。本方法は、筆記体の手書きパターンの認識に特に適している。しかし、本方法は、記号が、別々に書かれる手書きパターンを認識するために使用されることも可能である。特に、本方法は、手書きパターンが、1ストロークで書かれることを要求しない。
次に、本発明を、添付の図面を参照して、例示として、更に詳細に説明する。
図1を参照して、手書きパターンを認識するための方法を、次に説明する。まず、手書きパターンが、検出される(ステップ102)。通常、ユーザは、感圧スクリーン上でスタイラスを使用して手書きパターンを書くことが可能であり、そのため、手書きは、規則的な間隔でスタイラスの位置をサンプリングすることによって検出される。このようにして、ポイントの時間シーケンスが、獲得される。手書きは、例えば、ペンと、筆記面との間で形成される電気的接続を検出するセンサ群、又はペンの動きを検出するセンサ群を使用することなどにより、他の幾つかの仕方で検出されてもよい。また、手書きパターンは、手書きパターンが書き込まれている用紙を走査することによって検出されてもよい。その場合、手書きは、筆記面上のポイント・シーケンスとして検出されることが可能であり、そのシーケンスは、それらのポイントが、互いに対してどこに位置付けられるか、即ち、空間的ポイント・シーケンスに依存する。
次に、以降、コア・ポイントと呼ばれる可能なセグメント化ポイントが、手書きパターンを検出した際に作成されたポイント・シーケンスの中で選択される(ステップ104)。コア・ポイントは、手書きパターンの次元、即ち、パターンにおけるストロークのサンプリングされるポイントの数を減らすために選択される。それでも、コア・ポイントは、手書きパターンが正しく認識されることが可能であるように選択されなければならない。
図2は、スウェーデン語の語「ek」を形成する手書きパターン10を示す。図2では、選択されたコア・ポイント12も示され、1つおきのコア・ポイントに番号が付けられている。図2から、この筆記体の語の最初の部分は、文字「d」の外観を有する可能性があることが明白である。問題は、認識方法が、その「d」のエンドポイントで、その語を2つの文字セグメントにセグメント化した場合、それらのセグメントのいずれも、意図されていた語の文字を含まないことである。したがって、認識方法は、筆記体の手書きをセグメント化する際、複数のセグメント化の可能性を考慮する必要があることが明らかである。したがって、幾つかのコア・ポイント12が、2つの文字間で手書きパターン10におけるセグメント化を示す可能なポイントとして選択される。そのため、コア・ポイント12は、別々の記号又は文字への手書きパターン10の正しいセグメント化を特定するように選択される。しかし、コア・ポイント12は、手書きパターン10のセグメントの認識のためにも使用される。
コア・ポイント12の選択は、実際のいずれのセグメント化ポイントも破棄すべきではない。しかし、手書きパターン10の可能なセグメント化を定義するコア・ポイント12の数は、コア・ポイント12の数を可能な限り低く保つように選択されなければならない。したがって、コア・ポイント12の選択は、幾つかの選択基準を使用する。
選択されるコア・ポイント12の数は、手書きパターン10の1つ又は複数の曲線の形状によって限定されることが可能である。このことは、曲線の形状により、選択されるコア・ポイント12の数が規定されることを意味する。このようにして、曲線の形状が単純である場合、より少ない数のコア・ポイント12が、選択されることが可能であるのに対して、複雑な曲線の場合、より多数のコア・ポイントが、選択される。
選択されるコア・ポイント12の数は、前記1つ又は複数の曲線の方向変化の情報を保持するポイントに限られることが可能である。このため、曲線が曲がる、又は方向転換するポイントだけが、コア・ポイントとして使用される。これにより、限られた数のコア・ポイント12が使用されるにもかかわらず、コア・ポイント12が、1つ又は複数の曲線の形状を記述することができるようになる。
現在の好ましい実施例によれば、以下の選択基準が、使用される。第1の選択基準は、主な筆記方向と直交する方向において局所極限ポイントを抽出する。それらのポイントをそれぞれ、N(ノース)コア・ポイント及びS(サウス)コア・ポイントで表す。図2の手書きパターン10では、Nコア・ポイント及びSコア・ポイントには、円でマークが付けられている。各N−Sポイント・ペアは、それらの中間にある1つ乃至3つの更なるポイントによって補足されている。それらの更なるポイントは、更なる2つの基準、曲率基準及び鋭度基準によって選択されている。追加のポイントをM(中間)コア・ポイントと呼ぶ。図2の手書きパターン10では、Mコア・ポイントには、星印でマークが付けられている。曲率基準により、手書きパターン10が、隣接する2つのコア・ポイント間の直線から大きく逸脱しているかどうかが判定される。次に、直線から最も逸脱している位置において、Mコア・ポイントが選択される。鋭度基準により、手書きパターンが、急な方向転換を行うかどうかが判定される。次に、Mコア・ポイントが、その位置において選択される。鋭度基準が満たされるかどうかの判定は、検出された各ポイントにおいて手書きパターン10の微分を計算することによって行われる。急な方向転換が行われる箇所では、微分は、大きい値をとる。鋭度基準及び曲率基準は、N−Sコア・ポイント・ペアの間における、幾つかのMコア・ポイントを選択するために使用されることが可能である。鋭度基準又は曲率基準に従って、関心対象となるポイントが全く見出されなかった場合、Nコア・ポイントとSコア・ポイントの間の曲線の長さの半分に相当する中間ポイントが、Mコア・ポイントとして選択される。
本方法は、各コア・ポイントにおいて、又は各コア・ポイントの近傍において、手書きパターンの特徴を特定することを更に含む(ステップ106)。抽出されたコア・ポイント12の座標値を、認識目的で直接に使用することが考えられる。しかし、コア・ポイント12の周囲も、手書きパターン10の形状のいくらかの情報を含む。その追加の形状情報を含めるため、現在の好ましい実施例によれば、各コア・ポイントに関して5つの特徴のセットが、特定される。各コア・ポイント12には、そのコア・ポイント12が、どのように選択されたかに応じて、或るラベル・セットからの或るラベルが与えられる。この場合、3つのラベルN、S、及びMが、使用される。コア・ポイント12の、そのラベルは、コア・ポイント・シーケンスをテンプレートとマッチさせるための基礎を形成する。更に、それらの特徴は、コア・ポイント12に向かう、又はコア・ポイント12から出る方向ベクトル、コア・ポイント12のy座標値、即ち、主な筆記方向と直交する方向における値と、コア・ポイント12から、右側の最も遠い前のコア・ポイントまでの、主な筆記方向と平行なx座標に沿った符号付きの距離dxとを含む。更に、ペンが、コア・ポイント12において持ち上げられているか、又は押し下げられているかが判定されることが可能である。その特徴は、しばしば、セグメント化ポイントを示すが、或る記号における2つのストローク間の中断を示すことも可能である。したがって、その特徴は、コア・ポイント12において、ペンが持ち上げられる、又は押し下げられることを許す記号を認識するために使用されることが可能である。
次に、手書きパターン10の選択されたコア・ポイント12の特定された特徴が、その手書きパターン10の認識のための候補又は候補群を見出すために、テンプレートと比較される(ステップ108)。テンプレートは、データベースの中で提供され、順次コア・ポイントの特徴によって表現される。このため、特定された特徴は、テンプレートの特徴と直接にマッチさせられる。データベースは、ユーザが、様々な筆記スタイルを有するにもかかわらず、パターンを認識するために、同一の記号の異書体を表す、幾つかのテンプレートを含むことが可能である。更に、データベースは、つなぎ、即ち、2つの文字を通常、一緒に結合し、実際の文字の一部ではないストロークを表すテンプレートも含む。筆記体の語の途中のすべての文字は、つなぎを有するのに対して、語の始めの文字は、つなぎを有することも、有さないことも可能である。また、筆記体の語は、やはり、つなぎで終わることが可能である。一部のテンプレートは、つなぎが含まれた文字を表すことが可能である。このことは、文字「e」、「r」、「c」、「x」、及び「s」のテンプレートに関して有利に使用されることが可能である。
次に、図3及び図4を参照して、手書きパターン10の選択されたコア・ポイント12の特徴をテンプレートと比較することを説明する。コア・ポイント12は、手書きパターン10の可能なセグメント化ポイントと考えられる。更に、第1の可能なセグメント化ポイントから第2の可能なセグメント化ポイントまでのコア・ポイント12のシーケンスは、手書きパターンにおける可能な記号の表現と考えられる。このため、コア・ポイント12のシーケンスの特徴は、テンプレートと比較される。
選択されたコア・ポイント12は、テンプレートと比較されることが可能なコア・ポイント12の比較的多数の異なるシーケンスを表す。比較を構造化するため、コア・ポイント12は、シーケンスで解析される。最初のコア・ポイント12から始めて、コア・ポイント12の任意の可能なシーケンスが、テンプレートとマッチさせられる。テンプレートとマッチするシーケンスのエンド・コア・ポイント12が、グラフにおけるノードとして格納される(ステップ110)。このようにして、テンプレートに関連付けられたセグメント候補が、コア・ポイント12のシーケンスによって表現される手書きパターン10のセグメントの可能な認識として選択される。コア・ポイント・シーケンスとセグメント候補の間のマッチの測度を与える距離値が、最初のコア・ポイントとノードの間のパスを表すノードの中に格納される(ステップ112)。最初のコア・ポイントからのコア・ポイント12のすべての可能なシーケンスが、テンプレートとマッチさせられると、グラフにおけるノードとして格納されたコア・ポイント12から始めて、更なるマッチングが行われる。次に、テンプレートと更なるコア・ポイント・シーケンスの間の距離値が、更なるコア・ポイント・シーケンスの開始ノードにおいて格納された最初の距離値に追加される。このため、累積距離値が、グラフにおけるノードにおいて格納される。このようにして、非循環グラフが、すべてのコア・ポイント12に関して形成され、グラフにおける最後のコア・ポイントは、グラフを通る様々なパスに関する累積距離値の情報を保持する。その時点で、セグメント候補のシーケンスが、手書きパターン10の可能な認識結果として特定されており(ステップ114)、グラフを通るパスとして表現される。ユーザに提示するために認識候補として戻されるべき選択されたパスは、以下に更に詳細に説明する通り、辞書との比較によって特定されることが可能である。
図4に、図2の手書きパターン10の、テンプレートとのマッチングを表すグラフ20が、示されている。グラフ20は、番号が付けられた円として表されるノード群22と、それらのノード間のエッジ24とを含む。見て取ることができる通り、手書きパターンの様々なセグメント化を表す、グラフを通る幾つかのパスが、存在する。このため、手書きパターン10とテンプレートのマッチングにより、手書きパターン10の可能なセグメント化も同時に定義され、セグメント化された手書きパターン10とセグメント候補シーケンスの間の類似の尺度がもたらされる。
手書きパターンにおける1つのコア・ポイントと、テンプレートにおける1つのポイントとの間の距離値は、それらのポイントの特徴の間の差の絶対値の重み付き合計である。コア・ポイント・シーケンスとテンプレートの間の距離値は、個々のポイント間の距離値の合計である。しかし、グラフにおけるノードを形成するコア・ポイントの距離は、1回だけしか計算されるべきでない。このため、ノードを形成するコア・ポイントと、テンプレートとの間の距離は、ノードに至るパス、又はノードからのパスに割り当てられることが可能であり、コア・ポイントと、ノードに至るパス、及びノードからのパスに対応する両方のテンプレートとの間の平均距離を反映する。
しかし、特定のセグメント候補シーケンスは、禁止されることが可能である。そうすることは、手書きパターン10における情報が正しくない状況を補償する際に役立つ可能性がある。しかし、そうすることは、不可能な候補、又は可能性の低い候補を拒否することにより、認識結果を向上させるために使用されることも可能である。例えば、2つのつなぎのシーケンスが、禁止されることが可能である。更に、或る重みが、特定のセグメント候補シーケンスに関する累積距離値に与えられることが可能である。このことは、可能性の低いテンプレート・シーケンスを含む認識結果が、完全に拒否されるのではなく、それらの認識結果が、最小の累積距離値を有するのをより困難にする重みが、それらの認識結果に与えられることが可能であることを意味する。
この時点で、手書きパターン10の幾つかの異なる可能な認識が、図4に示される通り、特定されている。手書きパターン10の最も可能性の高い認識を選択するため、グラフ20におけるセグメント候補シーケンスが、辞書と比較されることが可能である。次に、図5〜図7を参照して、辞書との比較を実行することの実施例を説明する。
辞書との比較を実行するために、様々な可能なセグメント候補シーケンスを表す認識グラフ40が、形成されることが可能である(ステップ120)。次に図6を参照して、認識グラフ40を説明する。図6は、図2に示される手書きパターン10の認識に関して作成された認識グラフ40の例を示す。認識グラフ40は、手書きパターン10のセグメントを認識するために使用されるグラフ20とよく似た仕方で構築される。しかし、認識グラフ40の中に含められる情報は、減らされることが可能である。例えば、グラフ20は、手書きパターン全体とは合わないセグメント化ポイントを含む可能性がある。そのようなセグメント化ポイント、及び不完全なセグメント候補シーケンスは、認識グラフ40を形成する際、無視されることが可能である。更に、グラフ20は、同一のセグメント候補シーケンスをもたらす、異なるセグメント化を含む可能性がある。それらのセグメント候補シーケンス・ダブレットも、認識グラフを形成する際、無視されることが可能である。
認識グラフ40は、手書きパターン10をテンプレートと比較する際に、可能なセグメント化ポイントとして識別されているセグメント化ポイントを表すノード群42で構築される。ノード群42は、ノード群42によって表されるコア・ポイント12の番号に応じて番号が付けられた、番号付きの円として図6に示される。ノード42は、ノード42間の手書きパターンのセグメントに関するセグメント候補の情報を有する後続のノード群へのリファレンスを有する。ノード42のリファレンスは、エッジ44によって表される。エッジ44は、図6のホワイト・ボックス内に示される通り、セグメント候補の記号の情報と、手書きパターンのセグメントとセグメント候補をマッチさせる距離値とを含む。また、各ノード42は、そのノード42から派生するセグメント候補(図示せず)の最小数及び最大数も含むことが可能である。ノード42の中に限れた数のセグメント候補が入ることを許す認識グラフ40が、構築されることが可能である。ノード42の中に入るセグメント候補の最大許容数を設定することにより、認識グラフ40を辞書と比較する際の処理時間を制限するために、認識グラフ40のサイズが制限される。代替として、閾値未満の距離値を有するセグメント候補だけが、許されてもよい。また、認識グラフ40は、辞書を考慮に入れることなしに、手書きパターンと最もよくマッチするセグメント候補のシーケンスを迅速に戻すために使用されることも可能である。そうすることは、ノードの中に入ることが許されるセグメント候補の最大数を1に設定することによって達せられることが可能である。すると、認識グラフ40は、最低の距離値を有するセグメント候補シーケンスだけを含む。
図7に、辞書50の単純化された例が、示されている。示される辞書50は、幾つかの語だけを含むが、辞書50の現在、好ましい構造を示す。辞書50は、Trieグラフとして形成される。グラフ50は、記号を表すノード群52を含む。ノード群52は、許される記号シーケンスが、グラフ50を通るストリングとして形成されるように、エッジ54によって接続される。ルート・ノードは、空のストリングを表し、したがって、すべての記号シーケンスは、ルート・ノードを共有する。シーケンスの中の最後の記号を表すノード群には、図3においてグレーでマークが付けられている。また、各ノード52は、そのノード52から派生する記号(図示せず)の最小数及び最大数の情報も含むことが可能である。
認識グラフ40は、認識グラフ40のノード群42を辞書50と段階的に比較することにより、辞書50と比較される(ステップ122)。最初の認識グラフ・ノードで開始して、そのノードからのエッジのセグメント候補の妥当性が、同一の記号から始まる語が、辞書50の中に存在するかどうかをチェックすることによって判定される。次に、最初の認識グラフ・ノードからのエッジが、妥当な記号の情報で更新され、つまり、辞書50の中に対応物を有するセグメント候補が保持され、その一方で、その他のセグメント候補は、破棄される。エッジの更新された情報は、図6にグレーでマークが付けられたボックス内に示される。また、エッジは、認識グラフ40におけるセグメント候補シーケンスにおけるそれぞれの位置に対応する、辞書50の中のノード群へのリファレンスで更新もされる。その後、比較は、認識グラフ40におけるすべてのノード42にわたって続けられ、辞書50の中で対応物を有さないすべてのセグメント候補シーケンスが破棄される。各認識グラフ・ノード42に関して、そのノードからのエッジのセグメント候補の妥当性が、辞書50の中に、認識グラフ・ノードの中に入るようにエッジによって参照される、そのノードからのエッジにおける対応する記号が存在するかどうかをチェックすることによって判定される。
セグメント候補シーケンスに記号の最小数及び最大数の情報を使用して、妥当性検査は、或る語の、それらの長さ境界が、辞書50の中の該当するノードによって満たされるかどうかをチェックすることも含むことが可能である。長さ境界が、満たされない場合、そのセグメント候補シーケンスは、破棄されることが可能である。
更に、時間の複雑さを制御するため、認識グラフ40におけるすべてのノード42に関して、Trieグラフ50の中に入るリファレンスの数の上限が、設定されることが可能である。こうして、時間の複雑さの制御が、得られる。しかし、不良な初期マッチを有するセグメント候補シーケンスが、破棄されるリスクが、存在する。
認識グラフ40のすべてのノードが、解析されると、認識グラフ40の最後のノードは、辞書の中にも存在する手書きパターン10の最良の認識候補の情報を保持する。その時点で、手書きパターン10に関する認識候補が、ユーザに提示されるように、戻されることが可能である(ステップ124)。最低の累積距離値を有する認識候補が、手書きパターンの解釈としてユーザに提示されることが可能である。代替として、幾つかの認識候補が、ユーザに提示されてもよく、したがって、ユーザは、正しい解釈を選択することができる。
次に図8を参照して、手書きパターンの認識のためのデバイス30を説明する。デバイス30は、手書きパターンをポイント・シーケンスとして記録するための検出器32を含む。検出器32は、ユーザが書き込むことができる感圧スクリーンとして実施されることが可能である。デバイス30は、検出された手書きパターンを解析するためのアナライザ34を更に含む。アナライザ34は、コンピュータの中央処理装置上で実行されるプログラムとして実施されることが可能である。アナライザ34は、手書きパターンのコア・ポイントを選択するための手段と、コア・ポイントにおいて、又はコア・ポイントの近傍において手書きパターンの特徴を特定するための手段とを含む。デバイス30は、コア・ポイントの特徴として表現されたテンプレートを含むデータベース36を更に含む。アナライザ34は、手書きパターンのコア・ポイント・シーケンスの特徴とテンプレートの間の距離値を計算するための手段を更に含む。アナライザ34は、手書きパターンをテンプレートと構造的に比較するためにグラフを形成するように構成される。アナライザ34は、手書きパターンの可能な認識を形成するセグメント候補シーケンスを表す認識グラフを形成するように更に構成される。デバイス30は、許される語又は記号シーケンスを表すTrieグラフを含む辞書38を更に含む。アナライザ34は、手書きパターンと最もよくマッチする記号シーケンスを特定するために、認識グラフを辞書と比較するように更に構成される。それらの可能な認識結果は、ディスプレイ上で提示されることが可能であり、ディスプレイは、感圧スクリーンと別個であっても、手書きパターンが入力された感圧スクリーンに組み込まれていてもよい。
別の実施例によれば、前述した方法及びデバイスの実施の際に、手書きパターンの区別符号に、特別な考慮が与えられることが可能である。本願明細書の文脈では、区別符号という用語は、記号の近くの、又は記号と交差するマーク又はストロークとして解釈されるべきであり、一部のケースにおけるマーク又はストロークは、そのマーク又はストロークを有する記号が、そのマーク又はストロークを有さない記号とは別の記号であることを示し、例えば、
Figure 0004787275

とe、
Figure 0004787275

とa、
Figure 0004787275

とo、tとl、一部のケースでは、区別符号なしに、記号が、それでも正しい記号と解釈されることが可能な、記号の特徴である、例えば、i及びj。筆記体の手書きでは、多くの区別符号は、語の残りの部分が書かれた後に、引かれる。区別符号は、認識のために重要である。そうである1つの理由は、筆記体の語における多くのセグメントが、区別符号なしの記号とマッチする可能性があることであり、例えば、ドットなしの「i」は、別の文字の一部であると解釈される可能性がある。
筆記体の語を、時間的に並べ替えられた文字セグメントに分解するセグメント化ベースの方法、例えば、本願明細書で前述した方法の場合、正しい認識を可能にするために、区別符号を考慮することが重要である可能性がある。
区別符号の情報を利用する一実施例では、図1のステップ106で、区別符号に関する情報は、特徴として、コア・ポイント・サブセットに割り当てられる。したがって、区別符号と関係する情報は、コア・ポイントに存在し、そのため、可能な記号をテンプレートと比較することの結果に影響を与える要因として、認識中に利用されることが可能である。
区別符号は、手書きパターンにおいて、結合されていないつなぎの線として、即ち、いずれのセグメントにも結合されておらず、つなぎとして識別されているストロークとして識別されることが可能である。
コア・ポイント・サブセットのコア・ポイントに割り当てられる特徴において使用されることが可能な特性は、区別符号の位置、即ち、x座標とy座標、その特定のコア・ポイントから区別符号までの絶対距離、x方向におけるコア・ポイントから区別符号までの距離、y方向におけるコア・ポイントから区別符号までの距離、区別符号の長さ、区別符号の形状などであることが可能である。コア・ポイントに割り当てられた区別符号と関係する特徴は、以上の特性の1つだけ、又は複数の特性の組合せを含むことが可能である。
区別符号が割り当てられたコア・ポイント・サブセットは、そのサブセットが、N又はMとラベルが付けられたコア・ポイント12だけを含むように構成されることが可能である。これにより、本方法は、すべてのコア・ポイントが含まれたとした場合より、高速になる。
区別符号特徴は、逐次解析における現在のノード22の距離値にペナルティを与えるために、コア・ポイント12の逐次解析中に使用されることが可能である。例えば、現在のノード22に関して、示唆される記号、即ち、候補が、「i」であり、区別符号が、そのノード22に関連するコア・ポイント12に適度に近い場合、そのノード22には、比較的小さいペナルティが与えられることが可能である。コア・ポイント12と区別符号の間のより大きい距離は、より大きいペナルティをもたらす。最大のペナルティは、区別符号を有すべき候補の欠落した区別符号に関して与えられるペナルティに相当する値に設定されることが可能であり、そのような最大のペナルティは、区別符号までの距離が、或る特定の値を超える場合の候補に与えられることが可能である。逐次解析中の区別符号特徴の使用により、区別符号が、グラフ20の形成中にグラフ20の累積距離値に影響を与えるようにさせることが可能になる。このことは、文字「i」及び「j」に関して特に関心を引く。というのは、それらの文字の構造の単純さのため、区別符号が考慮されない場合、他の文字/記号の諸部分が、「i」又は「j」として誤って解釈されるという潜在的なリスクがもたらされるからである。したがって、前述のスキームにより、「i」及び/又は「j」を候補/候補群として含み、その候補の最初のコア・ポイントから適当な距離の範囲内に位置する区別符号を有するパスが、有利にされる。また、逐次解析中の区別符号特徴の使用は、他の記号又は文字に関して実施されることも可能である。
認識プロセスにおいて区別符号に関する情報を利用する方法は、一実施例によれば、N又はMというラベルを有する各コア・ポイント12に関して、最も近い区別符号ポイントを特定し、区別符号特徴を、前述した通り、そのような各コア・ポイントに関連付けることであることが可能である。別の実施例によれば、最も近い区別符号ポイントの特徴は、N又はMというラベルを有する各コア・ポイント12に割り当てられ、最も近い区別符号ポイントは、コア・ポイントから所定の距離の範囲内である。区別符号特徴を割り当てた後、手書きパターン10のセグメント化を表すグラフ20の構築中、区別符号を含む記号とマッチしたセグメント化、即ち、候補記号は、そのセグメント化の開始Nコア・ポイント又は開始Mコア・ポイントまでの距離と関係する値によってペナルティが与えられることが可能である。必要なすべてのNコア・ポイント及びMコア・ポイントに区別符号の特徴が割り当てられるわけではない実施例において、最大のペナルティは、区別符号を有することになっており、その候補のNコア・ポイント又はMコア・ポイントに区別符号の特徴が割り当てられていないノードに与えられる。
更に、区別符号が明らかに必要とされていない箇所で区別符号を有する、セグメント化グラフにおけるパスからもたらされる候補語には、そのような候補語を辞書とマッチさせた後、ペナルティが与えられることが可能である。辞書の使用については、本願明細書において前段で説明した。候補語が、区別符号が明らかに必要とされていない箇所で区別符号を含むかどうかを判定するのに使用されることが可能な一方法は、その候補語が、多過ぎる区別符号を含むかどうかをチェックすることである。そうすることは、候補語に含まれる区別符号の数を、その候補語をもたらすパスにおいて識別される区別符号の数と比較し、次に、その候補語の余剰の区別符号にペナルティを与えることによって達せられることが可能である。
例えば、
A−B>0の場合、ペナルティ=係数・(A−B)
A−B<0の場合、ペナルティ=0
A=区別符号の最大数(候補語)
B=区別符号の観察される数(候補語をもたらすパス)
候補語をもたらすパスにおける区別符号の観察される数は、結合されていないつなぎの線、即ち、いずれのセグメントにも結合されておらず、つなぎとして識別されているストロークの数を数えることによって得られることが可能である。
更なる実施例によれば、未使用の区別符号には、もたらされる候補語と、その候補語をもたらすパスの間で区別符号マッチ検査を適用することによってペナルティが与えられることが可能である。そうすることは、候補語に含まれる区別符号の数を、その候補語をもたらすパスにおいて識別された区別符号の数と比較し、次に、その候補語において欠落している区別符号にペナルティを与えることによって達せられることが可能である。
例えば、
B−A>0の場合、ペナルティ=係数・(B−A)
B−A<0の場合、ペナルティ=0
A=区別符号の数(候補語)
B=区別符号の観察される数(候補語をもたらすパス)
以上のスキームを使用することにより、システムは、例えば、「blind」という語をblindとして認識することが、その書かれたテキストの文字「i」が、文字「e」によりよく似ており、「blend」という語をもたらす可能性があるケースでも、更に、ドットが、多少、誤った位置に置かれている場合でも、できる。
本願明細書で説明する好ましい実施例は、全く限定するものではなく、多数の代替の実施例が、添付の特許請求の範囲によって定義される保護の範囲内で可能であることが、強調されなければならない。
手書きパターンを認識するための方法を示す流れ図である。 手書きパターンをテンプレートと比較するために使用されるべき、選択されたセグメント化ポイントを示す手書きパターンの例を示す図である。 手書きパターンをテンプレートと比較するための方法を示す流れ図である。 テンプレートと手書きパターンの間の距離値を特定するために形成されているグラフのチャートである。 認識グラフを辞書と比較するための方法を示す流れ図である。 手書きパターンの可能な認識から形成されている認識グラフの実施例を示す図である。 辞書の実施例を示す図である。 本発明の或る実施例による、手書きパターンを認識するためのデバイスを示す概略図である。

Claims (23)

  1. 1つ又は複数の曲線を含み、複数の記号を表す手書きパターンの認識のための方法であって、
    前記手書きパターンを、前記手書きパターンの前記1つ又は複数の曲線に沿ったポイント・シーケンスとして検出すること、
    前記手書きパターンの前記ポイント・シーケンスにおける可能な区別符号を識別すること、
    前記ポイント・シーケンスの中で、前記手書きパターンをセグメント化して、前記手書きパターンのこれらのセグメントを記号として認識する際に使用するために選択されるコア・ポイントを選択すること、
    各コア・ポイントにおいて、又は各コア・ポイントの近傍において、前記1つ又は複数の曲線の特徴を特定すること、
    識別された可能な区別符号に関連する少なくとも1つの特徴を、コア・ポイント・サブセットの各コア・ポイントに割り当てること、及び
    前記手書きパターンを、少なくとも1つの記号、又は或る記号の一部をそれぞれが表すテンプレートと比較することであって、
    コア・ポイントが、可能なセグメント化ポイントを表し、第1の可能なセグメント化ポイントから第2の可能なセグメント化ポイントまでのコア・ポイント・シーケンスが、可能な記号を表す、シーケンスにおける前記コア・ポイントを段階的に解析することを、
    前のコア・ポイント・シーケンスの最初のコア・ポイント、又は最後のコア・ポイントから始まるコア・ポイント・シーケンスの前記特徴を、前記テンプレートとマッチさせて、距離値を計算すること、及び
    前記マッチしたコア・ポイント・シーケンスにおける最後のコア・ポイントに、前記シーケンスにおける最初のコア・ポイントに割り当てられた距離値と、前記計算された距離値の合計である累積距離値を割り当てることによって実行し、これにより、すべての順次コア・ポイントに関する最小の累積距離値が、前記最後のコア・ポイントに割り当てられ、複数の記号を前記手書きパターンの可能な認識結果として表すマッチしたテンプレートのシーケンスに対応することを含む、比較することを含む方法。
  2. 前記比較することは、
    前記手書きパターンにおける2つの記号間の可能なセグメント化ポイントに対応するコア・ポイントをそれぞれが表すノードと、それらのノードを接続する、1つのノードから別のノードに至る、コア・ポイント・シーケンスに沿った、前記手書きパターンにおける可能な記号に対応するパスをそれぞれが表すアーチとを有するグラフを形成すること、
    前記コア・ポイント・シーケンスの前記特徴を前記テンプレートとマッチさせることによって、各パスに少なくとも1つの距離値を割り当てること、及び
    前記最小の累積距離値で前記グラフを通って、最初のノードから最後のノードに至る、複数の記号を前記手書きパターンの可能な認識結果として表すマッチしたテンプレートのシーケンスに対応するパスを少なくとも特定することによって実行される、請求項1に記載の方法。
  3. 閾値未満の累積距離値を有する、前記グラフを通るパスに対応する、幾つかの可能な認識結果が、特定される、請求項2に記載の方法。
  4. 前記グラフは、コア・ポイントをノードとして順次に追加することによって形成され、各パスに少なくとも1つの距離値を前記割り当てることは、前記グラフの形成中に実行される、請求項2又は3に記載の方法。
  5. 少なくとも1つの距離値を前記割り当てることは、前記コア・ポイント・シーケンスの前記特徴に最もよくマッチするテンプレートに対応する最低の距離値を各パスに割り当てることを含む、請求項2から4までのいずれか一項に記載の方法。
  6. 検出された区別符号に関連する少なくとも1つの特徴を割り当てる前記動作は、前記手書きパターンをテンプレートと比較する前記動作より前に実行される、請求項1から5までのいずれか一項に記載の方法。
  7. 選択されるコア・ポイントの数は、前記1つ又は複数の曲線の形状によって限定される、請求項1から6までのいずれか一項に記載の方法。
  8. 選択されるコア・ポイントの前記数は、前記1つ又は複数の曲線の方向変化の情報を保持するポイントに限定される、請求項7に記載の方法。
  9. コア・ポイントを前記選択することは、前記手書きパターンの主な筆記方向と直交する方向において前記1つ又は複数の曲線の局所極限ポイントであるポイントを選択することを含む、請求項1から8までのいずれか一項に記載の方法。
  10. 前記コア・ポイントは、Nコア・ポイント、Sコア・ポイント、及びMコア・ポイントとして分類され、Nコア・ポイントは、主な筆記方向と直交する方向における局所極大コア・ポイントであり、Sコア・ポイントは、主な筆記方向と直交する方向における局所極小コア・ポイントであり、Mコア・ポイントは、Nコア・ポイントとSコア・ポイントの中間コア・ポイントである、請求項9に記載の方法であって、
    前記コア・ポイント・サブセットの前記コア・ポイントをNコア・ポイント及びMコア・ポイントとして選択する動作を更に含む方法。
  11. コア・ポイントを前記選択することは、前記1つ又は複数の曲線の微分の絶対値が、閾値を超えるポイントを選択することを含む、請求項1から10までのいずれか一項に記載の方法。
  12. コア・ポイントを前記選択することは、隣接する2つのコア・ポイント間の直線からの前記1つ又は複数の曲線の逸脱が、閾値を超えるコア・ポイントを選択することを含む、請求項1から11までのいずれか一項に記載の方法。
  13. 特徴を前記特定することは、主な筆記方向と直交する方向における位置を定義する、前記コア・ポイントのy座標を特定することを含む、請求項1から12までのいずれか一項に記載の方法。
  14. 特徴を前記特定することは、前記コア・ポイントに向かう前記曲線の方向、及び前記コア・ポイントからの前記曲線の方向を特定することを含む、請求項1から13までのいずれか一項に記載の方法。
  15. 特徴を前記特定することは、主な筆記方向と平行な方向における位置を定義する、前のコア・ポイントからのx座標の変位を特定することを含む、請求項1から14までのいずれか一項に記載の方法。
  16. 特徴を前記特定することは、前記コア・ポイントにおいてペンが持ち上げられているか、又は押し下げられているかを判定することを含む、請求項1から15までのいずれか一項に記載の方法。
  17. 前記手書きパターンにおける或るコア・ポイントと、或るテンプレートの或るポイントとの間の距離値は、前記コア・ポイントの各特徴と、前記テンプレートの前記ポイントとの間の距離の重み付き合計として計算される、請求項1から16までのいずれか一項に記載の方法。
  18. 前記手書きパターンは、テンプレートと比較され、複数のテンプレートは、同一の記号の様々な外観を表す、請求項1から17までのいずれか一項に記載の方法。
  19. 前記手書きパターンの可能な認識結果は、辞書と比較される、請求項1から18までのいずれか一項に記載の方法。
  20. 特定のマッチするテンプレート・シーケンスが、禁止される、請求項1から19までのいずれか一項に記載の方法。
  21. 或る重みが、特定のマッチするテンプレート・シーケンスに関する累積距離値に与えられる、請求項1から20までのいずれか一項に記載の方法。
  22. 前記手書きパターンは、筆記体で書かれる、請求項1から21までのいずれか一項に記載の方法。
  23. 1つ又は複数の曲線を含み、複数の記号を表す手書きパターンの認識のためのデバイスであって、
    請求項1から22までのいずれか一項に記載の動作を実行する手段を含むデバイス。
JP2007557965A 2005-02-28 2006-02-24 セグメント化ベースの認識 Expired - Fee Related JP4787275B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0500466-8 2005-02-28
SE0500466 2005-02-28
PCT/SE2006/000240 WO2006091155A1 (en) 2005-02-28 2006-02-24 Segmentation-based recognition

Publications (2)

Publication Number Publication Date
JP2008532175A JP2008532175A (ja) 2008-08-14
JP4787275B2 true JP4787275B2 (ja) 2011-10-05

Family

ID=36927694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007557965A Expired - Fee Related JP4787275B2 (ja) 2005-02-28 2006-02-24 セグメント化ベースの認識

Country Status (8)

Country Link
US (1) US7596272B2 (ja)
EP (1) EP1854047A1 (ja)
JP (1) JP4787275B2 (ja)
KR (1) KR101145986B1 (ja)
CN (1) CN101128837A (ja)
RU (1) RU2007135946A (ja)
TW (1) TWI319861B (ja)
WO (1) WO2006091155A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US7881936B2 (en) 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
NZ519928A (en) 1999-05-27 2004-07-30 America Online Inc Keyboard system with automatic correction
US7821503B2 (en) 2003-04-09 2010-10-26 Tegic Communications, Inc. Touch screen and graphical user interface
US7030863B2 (en) 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7750891B2 (en) 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
US7610194B2 (en) * 2002-07-18 2009-10-27 Tegic Communications, Inc. Dynamic database reordering system
US7286115B2 (en) 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
US8583440B2 (en) 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
US7636083B2 (en) * 2004-02-20 2009-12-22 Tegic Communications, Inc. Method and apparatus for text input in various languages
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
RU2007135945A (ru) * 2005-02-28 2009-04-10 Зи Декума Аб (Se) Граф распознавания
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
US7587378B2 (en) 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
US7580925B2 (en) * 2006-04-19 2009-08-25 Tegic Communications, Inc. Efficient storage and search of word lists and other text
US20080030502A1 (en) * 2006-08-04 2008-02-07 Monotype Imaging, Inc. Diacritics positioning system for digital typography
US7907783B2 (en) * 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
US8201087B2 (en) * 2007-02-01 2012-06-12 Tegic Communications, Inc. Spell-check for a keyboard system with automatic correction
US8225203B2 (en) 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8299943B2 (en) 2007-05-22 2012-10-30 Tegic Communications, Inc. Multiple predictions in a reduced keyboard disambiguating system
TWI385584B (zh) * 2008-11-05 2013-02-11 Avermedia Information Inc 自動排列手寫字串之裝置及方法
CN102292700A (zh) * 2009-01-24 2011-12-21 惠普开发有限公司 用于增强安全印刷的***和方法
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
US20110254765A1 (en) * 2010-04-18 2011-10-20 Primesense Ltd. Remote text input using handwriting
US20120281919A1 (en) * 2011-05-06 2012-11-08 King Abdul Aziz City For Science And Technology Method and system for text segmentation
US8965127B2 (en) * 2013-03-14 2015-02-24 Konica Minolta Laboratory U.S.A., Inc. Method for segmenting text words in document images
WO2014204337A1 (en) * 2013-06-18 2014-12-24 Abbyy Development Llc Methods and systems that convert document images to electronic documents using a trie data structure containing standard feature symbols to identify morphemes and words in the document images
RU2625020C1 (ru) * 2013-06-18 2017-07-11 Общество с ограниченной ответственностью "Аби Девелопмент" Устройства и способы, которые порождают параметризованные символы для преобразования изображений документов в электронные документы
US9384409B1 (en) 2015-01-29 2016-07-05 Konica Minolta Laboratory U.S.A., Inc. Word segmentation for document image using recursive segmentation
US10332628B2 (en) * 2016-09-30 2019-06-25 Sap Se Method and system for control of an electromechanical medical device
US10438098B2 (en) * 2017-05-19 2019-10-08 Hand Held Products, Inc. High-speed OCR decode using depleted centerlines
TWI676919B (zh) * 2018-08-02 2019-11-11 義守大學 一種電腦化寫字評估與訓練方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59161779A (ja) * 1983-03-04 1984-09-12 Oki Electric Ind Co Ltd オンライン文字認識ストロ−ク抽出方法
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
JPH08153164A (ja) * 1994-09-29 1996-06-11 Nippon Steel Corp 手書き文字認識方法及び装置
JPH10162104A (ja) * 1996-11-27 1998-06-19 Hitachi Ltd 文字認識装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4611346A (en) 1983-09-29 1986-09-09 International Business Machines Corporation Method and apparatus for character recognition accommodating diacritical marks
US5392363A (en) 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
IL110137A (en) * 1994-06-27 2000-06-29 Advanced Recognition Tech Handwriting recognition system
DE69428527T2 (de) * 1994-07-04 2002-05-08 Hewlett Packard Co Kritzlervergleich
US6202060B1 (en) * 1996-10-29 2001-03-13 Bao Q. Tran Data management system
US6453070B1 (en) * 1998-03-17 2002-09-17 Motorola, Inc. Diacritical processing for unconstrained, on-line handwriting recognition using a forward search
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
US6920247B1 (en) * 2000-06-27 2005-07-19 Cardiff Software, Inc. Method for optical recognition of a multi-language set of letters with diacritics
US7336827B2 (en) * 2000-11-08 2008-02-26 New York University System, process and software arrangement for recognizing handwritten characters

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59161779A (ja) * 1983-03-04 1984-09-12 Oki Electric Ind Co Ltd オンライン文字認識ストロ−ク抽出方法
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
JPH08153164A (ja) * 1994-09-29 1996-06-11 Nippon Steel Corp 手書き文字認識方法及び装置
JPH10162104A (ja) * 1996-11-27 1998-06-19 Hitachi Ltd 文字認識装置

Also Published As

Publication number Publication date
RU2007135946A (ru) 2009-04-10
JP2008532175A (ja) 2008-08-14
US7596272B2 (en) 2009-09-29
CN101128837A (zh) 2008-02-20
EP1854047A1 (en) 2007-11-14
TW200701096A (en) 2007-01-01
TWI319861B (en) 2010-01-21
KR20070110398A (ko) 2007-11-16
WO2006091155A1 (en) 2006-08-31
KR101145986B1 (ko) 2012-05-21
US20060193519A1 (en) 2006-08-31

Similar Documents

Publication Publication Date Title
JP4787275B2 (ja) セグメント化ベースの認識
JP5071914B2 (ja) 認識グラフ
US7302099B2 (en) Stroke segmentation for template-based cursive handwriting recognition
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
EP1374148B1 (en) Method and device for recognition of a handwritten pattern
US9711117B2 (en) Method and apparatus for recognising music symbols
JPH08161429A (ja) 文字を認識するための方法および装置
US7580573B2 (en) Segmentation-based recognition
EP2138959B1 (en) Word recognizing method and word recognizing program
JP6735775B2 (ja) 重畳手書き入力認識技術のためのシステム及び方法
JP3675511B2 (ja) 手書き文字認識方法及び装置
JP2014092817A (ja) 文字認識装置及びプログラム
JP7095450B2 (ja) 情報処理装置、文字認識方法、および文字認識プログラム
Mandal et al. Slant Estimation and Correction for Online Handwritten Bengali Words
JP2000090203A (ja) 文字認識方法及びその装置
JPH1049630A (ja) オンライン手書き文字認識方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090116

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110708

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110714

R150 Certificate of patent or registration of utility model

Ref document number: 4787275

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees