JPH09128485A - 不変な特徴を使用する手書文を認識のための改良された方法および装置 - Google Patents

不変な特徴を使用する手書文を認識のための改良された方法および装置

Info

Publication number
JPH09128485A
JPH09128485A JP8236230A JP23623096A JPH09128485A JP H09128485 A JPH09128485 A JP H09128485A JP 8236230 A JP8236230 A JP 8236230A JP 23623096 A JP23623096 A JP 23623096A JP H09128485 A JPH09128485 A JP H09128485A
Authority
JP
Japan
Prior art keywords
signal
feature
handwritten
feature signal
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8236230A
Other languages
English (en)
Inventor
Michael Kenneth Brown
ケネス ブラウン マイケル
Hu Jianying
フー ジェニング
William Turin
チューリン ウィリアム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH09128485A publication Critical patent/JPH09128485A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/186Extraction of features or characteristics of the image by deriving mathematical or geometrical properties from the whole image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 本発明は、筆者によるサンプル間のバラツキ
に起因する手書文認識の困難さを解決する。 【解決手段】 平行移動、回転およびスケールに対して
不変な手書文認識のための、新たな特徴信号、つまり、
接線の比の特徴信号について、並びに、旧来の正規化さ
れた曲率の特徴の新たな使用方法について開示される。
これら特徴の使用を、適当な重みを割当てることによっ
て、最適化するための方法についても開示される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、一般的には、手書文を
認識するための方法、つまり、不変な特徴を使用して、
幾何学的な歪みを低減あるいは削除することに関する。
【0002】
【従来の技術】コンピュータによるパターン認識におけ
る最も困難な問題は、パターンから抽出される測定値あ
るいは特徴が、サンプル間でバラツキ、これにどのよう
に対処するかである。抽出される特徴は、処理されるパ
ターンデータのタイプに依存する様々な異なる理由によ
って変動する。手書文の認識においては、これら変動源
としては、入力デバイスのノイズ、時間的空間的な量子
化誤差、筆者による入力表現のバラツキなどが含まれ
る。パターン認識におけるバラツキを扱うための二つの
方法が存在する。第一の方法においては、パターンが、
あるセットの前処理変換によって特徴の抽出の前に正規
化され、第二の方法においては、特徴が望ましくないバ
ラツキに対して強くなるように(過敏でなくなるよう
に)選択される。
【0003】筆者によるバラツキは、時間的成分および
空間的成分の両方を持つが、時間的成分は、文字を構成
するストローク(字画)のシーケンス;単語を構成する
複数の文字のシーケンス;および任意の定義された文法
に従う文の要素のシーケンスと関連する。筆者によるバ
ラツキの内の時間的成分に関しては、前処理の際に正規
化され、最尤シーケンスが、当分野において周知のプロ
セスであるHidden Markov Model (HMM)によって近
似される。本発明は、筆者によるバラツキの内の、特
に、空間的成分、つまり、回転(rotation)、スケール
(scale) 、および平行移動(translation) による文
字および単語の幾何学的歪みに関するもので、本発明
は、平行移動、スケールおよび回転に対して不変な、手
書文認識のための新たな特徴、および従来の特徴の新た
な使用方法に関して教示する。
【0004】特徴の空間的変動を除去するためには、必
然的に平行移動、スケールおよび回転を伴うシミリチュ
ード変換が遂行された場合でも不変な特徴を選択するこ
とが要求される。特徴は、手書きサンプルを、平坦な平
面上のそれらの位置、サイズ、方位と独立して、認識で
きることを要求される。当分野において周知のベーシッ
クなHMMに基づく手書文認識システムは、手書きサン
プルの特徴として、接線の傾きの角度を使用するが、こ
れは、平行移動およびスケーリングに対しては不変であ
るが、ただし、回転に対しては不変でない。もう一つの
特徴として、曲率があるが、これは、平行移動および回
転に対しては不変であるが、スケールに対しては、不変
でない。一般的に、平行移動に対して不変である特徴を
選択することは簡単であるが、スケールおよび回転に対
して不変な特徴、およびこれら3つの全ての要素に対し
て不変な特徴を見つけることはより困難である。
【0005】ユークリッド平面のシンプリチュード変換
R2→R2は、以下によって定義される。
【数1】 ここで、cは、正のスカラーであり、
【数2】 は、cのスケーリング、角度ωの回転およびvの平行移
動を含む変換を表す。二つの曲線は、それらがシンプリ
チュード変換を通じて互いに得られる場合に、等価であ
る。不変な特徴とは、異なる等価な曲線上の対応するポ
イントの所に同一の値を持つような特徴である。
【0006】滑らかな平坦な曲線P(t)=(x
(t)、y(t))は、以下のようにマッピングするこ
とができる:
【数3】 再パラメータ化およびシンプリチュード変換の結果とし
て、以下が得られる:
【数4】 一般性を失うことなしに、両方の曲線は、弧の長さによ
ってパラメータ化できるものと想定され、これから、以
下が得られる。
【数5】 そして、二つの曲線上の対応するポイント間の関係は、
以下によって表される。
【数6】 二つの曲線の対応するポイントにおける曲率κは、1/
cだけスケールされ、従って、
【数7】 のようになることが知られている。
【0007】シンプリチュード変換の下で不変な、正規
化された曲率と呼ばれる特徴は、以下の式によって定義
される:
【数8】 ここで、プライム記号(prime notation)は、導関数を
示す。この式のより詳細な説明および誘導に関しては、
A.M.Bruckstein,R.J.Holt,A.N.NetravaliおよびT.J.Ric
hardsonらによるInvariant Signatures for Planar Sha
pe Recognition Under Partial Occlusion,58 CVGIP:Im
age Understanding 49-65 (July 1993)、において示さ
れているので、これらの全文を参照されたい。上に定義
される正規化された曲率の計算には、最高三次までの導
関数の推定が必要である。不変な特徴に関しては、コン
ピュータビジョンに関する文献において精力的に議論さ
れているが、ただし、これらは、高次の導関数の推定に
伴う困難さのために、実際のアプリケーションには殆ど
使用されてないのが現状である。以下において示される
ように、高次の不変な特徴が、導関数推定値の注意深い
フィルタリングによって利用できるようにされる。
【0008】
【発明が解決しようとする課題】不変な特徴(featur
e) は、不変な特徴のパターン(signature) であると
みなすことができる。つまり、全ての二つの等価な曲線
は、同一の特徴のパターン(signature) を有する。任
意の曲線は、等価な曲線のクラスから、その特徴のパタ
ーン(signature) を、そのクラスのモデル曲線である
とみなすことができる各クラスのメンバーの一つの特徴
のパターン(signature) と比較することによって認識
および区別することが可能である。サンプル曲線が一つ
のモデル曲線のみに対応する場合、換言すれば、そのサ
ンプルが常に同一であるとみられる場合は、サンプル曲
線とそれと対応するモデル曲線との間に完全な一致が存
在する。この場合は、多数の大域的に不変な特徴、つま
り、大域的な測定値、例えば、弧の全長によって正規化
された特徴を比較のために使用することが可能である。
例えば、手書文認識のために単語モデル全体を使用する
方法がこのケースに当たる。ただし、筆者に独立して
(筆者に関係なく)、手書文を認識することを目的とす
る大きなフレキシブルな語彙を使用するシステムに対し
ては、通常、文字モデル(letter model)、あるいはサ
ブキャラクタモデル(sub-character model) が使用さ
れる。この場合は、各サンプル曲線、例えば、単語は、
未知の境界ポイントの所で接続された数個のモデル曲
線、例えば、複数の文字に対応し、このために、大域的
に不変な特徴を計算することがより困難になる。従っ
て、大域的な測定値に依存しない不変な特徴を開発する
ことが重要である。これら特徴は、しばしば、大域的な
特徴と区別するために、局所的あるいは半局所的な特徴
と呼ばれる。
【0009】実際のアプリケーションにおいては、モデ
ルの特徴のパターンとサンプルの特徴のパターンの間の
完全なマッチを不可能にする二つの要因が存在する。第
一は、手書きサンプルは連続的な曲線ではなく、信号の
シーケンス、つまり、サンプルポイントから成るため
に、各サンプルポイントに対するモデル曲線上の完全な
マッチングポイントが決定できないことである。第二
は、シミリチュード変換の場合でさえも、同一記号の手
書きサンプルが、理想画像を変換したコピーとは完全に
は一致しないことである。異なる筆者によって書かれた
サンプル間、あるいは同一筆者ではあるが異なる時間に
書かれたサンプル間には、シンプリチュード変換によっ
て扱うことが不可能な形状の変動が発生する。従って、
サンプル曲線とモデル曲線との間には、概ねの一致を見
つけることができるのみである。このような概ねの一致
を決定するための一つの方法は、特徴に対して類似性尺
度を定義し、次に、動的時間ラッピングを適用する方法
である。動的時間ラッピングおよびそのサンプル曲線と
モデル曲線との間の概ねの対応を決定するための応用に
関してのより詳細な説明については、C.C.Tappertによ
Cursive Script Recognition by Elastic Matching,2
6 IBM Journal of Research and Development 765-71(N
ov.1982) 、において説明されているので、この全文を
参照されたい。もう一つの方法は、曲線のセグメント
(区間)を、特徴の確率分布によって特性化し、曲線の
セグメント間の対応度を統計的に見つける方法である。
後者のアプローチは、HMMに基づくシステムによって
採られるが、この改善されたシステムが、合衆国特許出
願第08/290623号およびこれと関連する特許出
願において開示および請求されている。
【0010】
【課題を解決するための手段】従って、本発明の一つの
目的は、曲線を認識するための方法を提供することにあ
る。本発明の方法は、曲線を、サイズ、位置、あるいは
方位と独立して表す曲線の新たな特徴信号を提供するこ
とによって達成される。この方法は、高次の導関数を計
算することを必要としない。この新たな特徴は、曲線上
の二つのポイントを選択し、これら二つのポイントの接
線の交点を求め、各ポイントから交点までの距離を計算
し、これら距離の比を取ることによって生成される。曲
線に沿っての接線の比が定義できない全てのポイントに
対しては、特別の定数値が指定される。この新たな特徴
は、ここでは、接線の比と呼ばれる。本発明のさらにも
う一つの特徴は、スケールと方位に、無関係に手書文を
認識するための方法を提供することにあるが、この方法
は、手書きサンプルを、スケールと回転、に対して独立
した特徴信号にて表すことによって達成される。本発明
の目的を促進するために、手書きサンプルを表すため
に、接線の比の特徴信号と正規化された曲率の特徴信号
が、単独あるいは一緒に使用される。手書文の認識が、
サンプルを、接線の比によって表し、これを、局所的な
曲率の符号の特徴信号、正規化された曲率の特徴信号、
および接線の傾きの角度の特徴信号によって増強するこ
とによって最適化される。増強された接線の比は、ここ
では、符号付きの接線の比と呼ばれる。各特徴信号は、
さらに、他の特徴信号に対するその相対的な弁別能力に
従って重みを付けられる。本発明のさらにもう一つの目
的は、上の方法に従って手書文を認識するための装置を
提供することにある。この装置は、Hidden Markov Mode
l に基づくシステムである得る。手書文認識システムを
上の方法に従って手書きサンプルを認識するために訓練
するための方法についても教示される。
【0011】
【実施例】手書文を認識するためのシステムが、合衆国
特許出願第08/290623号に説明されているため
に、この全文についても参照されたい。手書きサンプル
をサンプルを表す入力された特徴から認識するためのシ
ステムおよび方法に関するこれら知識を前提として以下
の説明が行なわれる。図1において、P1 およびP2
は、接線の傾きの角度(tangent slope angles)がΘだ
け異なる2点であり、Pは、P(t)上の二つの接線の
交点である。同様に、P1 およびP2 は、曲線P(t)
上のこれもまた接線の傾きの角度がΘだけ異なる2点で
あり、PはP(t)上のこれら二つの接線の交点であ
る。曲線の角度、従って、回転量(ターン)は、シミリ
チュード変換(similitude transformation) の下では
不変であるために、点P1が点P1に対応すれば、点P2
およびPは、それぞれ、点P2 およびPに対応すること
が示される。シミリチュード変換の式から、以下が簡単
に証明され:
【数9】 従って、
【数10】 となる。この最後の式は、接線の比(ratio of tangent
s)と呼ばれる新たな不変な特徴を定義する。
【0012】図2に示されるように、接線の比は、任意
の接線の傾きの角度差にて計算することができる。P1
およびP2 が曲線10に沿ってのそれらの接線の傾きが
Θだけ異なる2点であるものと仮定し、Pは、二つの接
線20と30の交点を表すものとすると、P1 における
これら接線の比は、以下のように定義される:
【数11】 1 およびu2 が、それぞれ、P1 およびP2 における
単位法線ベクトルであるものと仮定すると、サインの法
則を使用して、Pにおける接線の比に対する以下の式を
導くことができる:
【数12】 便宜的に、以下においては、P2 は、P1 のΘ境界であ
ると呼ばれる。
【0013】スクリプトと称される手書きサンプルの手
書文認識において不変な特徴信号として接線の比を使用
するためには、全てのスクリプト内の全てのサンプルポ
イントに対して固定された角度差Θ0 を使用することが
必要である。実際のアプリケーションにおいては、連続
曲線ではなく、散在するサンプルポイントのみが得られ
るために、通常、それらの角度差が実際にΘ0 に等しい
ような二つのサンプルポイントは存在しない。従って、
接線の比を推定することが必要となる。ポイントPj
j+1 との間のサンプルポイントPj のΘ0 境界に対し
て、接線の比Rt Θ0 (Pi )を推定するために幾つか
の方法を使用することができる。一つの方法において
は、Pi のΘ0 境界の位置がPi とPj+1 との間のスプ
ラインを挿間し、このスプライン区間に沿って接線の傾
きの条件を満足するポイントを求めることによって明示
的に推定される。ただし、一つの好ましい方法において
は、単純な挿間が使用される。Pj がPi のΘ1 境界で
あり、Pj+1 がそのΘ2 境界でり、Θ1 <Θ0 <Θ2
あるものと想定すると、Pi における接線の比の推定値
は、以下の式を使用して見つけることができる:
【数13】 Θ0 の選択によって接線の比の値が大きく影響されるこ
とは明らかである。Θ0 が小さすぎる場合は、特徴は、
ノイズに対して敏感すぎることとなる。反対に、Θ0
大きすぎる場合は、特徴は大域的すぎて、重要な局所的
な形状の特性を見逃すこととなる。Θ0 に対する好まし
い値は、約、10度である。
【0014】本発明の一つの好ましい実施例において
は、接線の比が、曲率の符号(“+”あるいは“−”)
によって増強される。結果としての特徴は、増強された
弁別能力を持ち、ここでは、符号付きの接線の比と呼ば
れる。上に説明された不変な特徴を正確に評価するため
には、三次までの高品質の導関数推定値(derivative e
stimates)をサンプルポイントから得ることが必要であ
る。ただし、導関数推定のための単純な有限差に基づく
方法では、空間量子化エラーあるいはノイズに対して必
要とされる不敏感性(頑丈さ)を提供することが不可能
である。一方、ベーシックなHMMに基づく手書文認識
システムは、既に、前処理の際のデータフィルタリング
を提供するためのスプライン平滑化オペレータを使用す
る。導関数推定のためにも類似するオペレータを使用す
ることできる。
【0015】スプライン平滑近似(smoothing spline a
pproximation)は、離散性のノイズに富むサンプルか
ら、滑らかな連続関数および導関数の推定値を得るため
に、多くの問題へのアプリケーションから証明されるよ
うに、非常に望ましい特性を持つ。スプライン平滑近似
に関しては、W.E.L.Grimson によるAn Implementationo
f a Computational Theory of Visual Surface Interpo
lation,22 Comp.Vision,Graphics,Image Proc.,39-69(1
983);B.Shahraray によるOptimal Smoothing of Digit
ized Contours,IEEE Comp.Vision and Pattern Rec.(CV
PR)210-218(June22-26,1986);およびB.Shahrary and
M.K.BrownによるRobust Depth Estimationfrom Optical
Flow,Second Int.Conf.on Computer Vision(ICCV88)64
1-650(Dec.5-8,1988) 、において説明されているので、
これらの全文を参照されたい。サンプルポイントにおけ
スプライン近似動作の任意の程度の出力の導関数を推定
するためのオペレータを、それらサンプルポイントにお
けるスプライン近似の導関数を評価することによって生
成することができる。導関数を三次まで得るために、4
つのオペレータ、つまり、A(λ)、A1 (λ)、A2
(λ)およびA3 (λ)が生成される。これらオペレー
タが、各サンプルポイントに適用され、サンプル座標の
平滑化された推定値およびそれらの一次、二次および三
次の導関数が得られ、次に、これらが、接線の比および
正規化された曲率を計算するために使用される。
【0016】滑らかさを表すパラメータλは、サンプリ
ングされたデータに対するスプライン近似の近さ(clos
eness )とスプラインの滑らかさ(smoothness)との間
のトレードオフを制御し、従って、スプライン平滑化オ
ペレータを低域フィルタとしてみた場合、λは、遮断周
波数fc を制御する。手書文信号は、尖点を除いて、主
として低周波数成分から成り、主要なノイズ源は、殆
ど、量子化エラーおよびジッタから成るために、スプラ
インフィルタが信号の著しい歪みを与えることなしに殆
どのノイズが遮断されるようにλを比較的簡単に選択す
ることが可能である。本発明の一つの実施例において
は、手書きスクリプトが、特徴の抽出の前に0.2mm
の間隔にて再サンプリングすることによって弧長の観点
からパラメータ化される。このサンプリング速度におい
ては、殆どの手書きサンプルの主な正規化された空間周
波数成分は、0.08Hz、つまり、0.4mm-1ある
いは2.5mmの空間波長以下である。実際の用途に
は、約0.425mm-1の遮断周波数に対応するλ=2
0、三次オペレータを反映するm=3、およびスプライ
ンのサイズを表すn=15を使用するのが適当である。
【0017】信号周波数は尖点の所で、スクリプトの残
りの部分よりもかなり高いために、尖点は、通常、これ
らオペレータが適用されるときに平滑化される。これら
尖点を捜し出すために、接線の傾きの角度の特徴が、接
線の比の特徴および正規化された曲率の特徴と共に使用
される。尖点は、接線の傾きの角度の特徴の抽出の際に
検出および保存できるために、尖点に関する情報は、こ
の特徴によって捕捉することができる。
【0018】接線の比の特徴および正規化された曲率の
特徴は、常に高信頼度にて評価できるとは限られない。
例えば、ストロークの後端に沿ってのサンプルポイント
に対する接線の比は、それらのΘ0境界が存在しないた
めに定義できない場合がある。これはまた、半曲点の周
りではうまく定義することができない。また、正規化さ
れた曲率は、ほぼゼロに近い曲率を持つ平坦な区間に沿
ってのポイントにおいては高度に不安定な傾向を持つ。
これら例外を扱うために、特徴が高信頼度にて評価でき
ない場合は、特別な特徴値“ボイド(void)”が割り当
てられる。つまり、状態尤度スコアの計算において、特
徴値“ボイド”に遭遇すると、常に、一定なスコアが生
成される。これは、特徴がボイドである確率を全ての状
態に対して一定に割り当てるのと等価であり、この処置
はある特定のサンプルポイントにおいて、特徴が定義で
きない場合、あるいは、高い信頼度にて評価できない場
合、これは識別情報を提供しないという観察によって正
当化されるものである。
【0019】離散HMMシステムにおいては、これら3
つの特徴、つまり、接線の傾きの角度、接線の比、およ
び正規化された曲率、のおのおのが固定された数のビン
に量子化され、単純に、ビンに対応するインデックスに
よって表される。特徴が互いに独立であるとみなされる
場合は、訓練の際に、各状態内の各特徴に対して別個の
確率分布が評価される。状態j内の記号ベクトルS
k1,k2,k3=[K1,K2,K3]が観察される同時確率は以
下の通りである:
【数14】 ここでbji(ki )は、i番目の特徴の確率分布に従っ
て状態j内において記号ki が観察される確率である。
これから、状態jにおける対応する対数尤度は以下のよ
うに表される:
【数15】
【0020】従来のViterbi スコアを用いるHMMにお
いては、この対数尤度が訓練および認識において直接的
に使用される。このケースにおいては、これら3つの特
徴のおのおのが、組合せ対数尤度(combined log-likel
ihood )に等しく貢献し、従って、累積されたスコアお
よび最適パスに対して同一の影響を持つ。図3は、(処
理後の)“三角形”のサンプルを示し、図4は、図3の
サンプルから抽出された接線の傾きの角度、接線の比、
および正規化された曲率を示す。正規化された曲率の値
は、±50の所で切り取られている。これらのプロット
からわかるように、正規化された曲率の値と接線の比の
値は、高い相関を持つが、ただし、幾つかの差異が存在
する。
【0021】本発明の一つの好ましい実施例において
は、前の二つの式が、異なる特徴の影響をそれらの弁別
能力に従って調節するために修正される。実際のアプリ
ケーションにおいては、異なる特徴は異なる弁別能力を
持つ。換言すれば、これらは、サンプル曲線を表す確率
モデル曲線に同一に影響することはない。これを考慮す
るために、前の二つの式が、それぞれ、重みを与えられ
た確率および重みを与えられた対数尤度を計算するため
に以下のように修正される:
【数16】 ここで、Nj は、状態正規化係数である。特徴iに対す
るビンの数がni であるものと仮定すると、Ni は、以
下によって定義される:
【数17】 従って、重みを与えられたこれら確率は以下の条件を満
足する:
【数18】 そして、このために、重みを与えられた対数尤度が任意
の特定の状態に対してバイアスすることが回避される。
【0022】重みwi は、各特徴の相対的な優勢を示
す。訓練および認識において使用された場合は、(他の
重みと比較して)重みが大きければ大きなほど、対応す
る特徴成分は、組合せ対数尤度により大きく貢献し、従
って、Viterbi アルゴリズムによって選択されたパスに
対してより大きな影響を持つ。このようなアプローチに
おいては、各状態内の特徴ベクトルの推定された真の分
布(estimated true distribution )が各特徴成分の分
布から誘導された歪みを与えられた確率分布(distorte
d probability distribution)によって置換される。個
々の特徴の重み付けに加えて、ベクトル量子化技法ある
いは多次元連続密度関数を使用して、ここに説明された
3つの特徴を表すことによってより正確なモデルを達成
することが可能である。
【0023】本発明を実現する一例においては、2つの
不変な特徴、つまり、符号付きの接線の比の特徴、およ
び正規化された曲率の特徴が、接線の傾きの角度の特徴
と共に使用され、各特徴が20のビンに量子化された。
各特徴に対して別個の確率分布が推定され、組合せ対数
尤度スコアが正規化係数なしに計算された。重みとし
て、接線の傾きの角度に対して1.0、符号付きの接線
比に対して0.5、そして、正規化された曲率に対して
0.5が割当てられた。上記は、単に、本発明の原理を
解説するためのものである。当業者においては、個々に
具体的には説明されなかったが、本発明の原理を具現す
る様々な修正を考案することが可能であり、従って、そ
れらもまた、本発明の精神および範囲から逸脱しないこ
とを理解できるものである。
【図面の簡単な説明】
【図1】各曲線上の2点の所に描かれた、それらの接線
の傾きの角度がΘだけ異なる接線を持つ2つの曲線を示
す。
【図2】2点の所に描かれた、ポイントPにて交差し、
接線の傾きの角度の差がΘである接線を持つ曲線を示
す。
【図3】前処理後の手書きサンプルを示す。
【図4】図3に示されるサンプルから抽出された3つの
特徴のプロットを示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェニング フー アメリカ合衆国 07030 ニュージャーシ ィ,ホボークン,アパートメント 3,ワ シントン ストリート 219 (72)発明者 ウィリアム チューリン アメリカ合衆国 08816 ニュージャーシ ィ,イースト ブランズウィック,ヒルウ ッド ロード 25

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 曲線をそのサイズ、位置、あるいは方位
    と独立して認識するための方法、より具体的には、曲線
    に沿うポイントのシーケンスを接線の比のシーケンスに
    よって表すことによって曲線を認識するための方法であ
    って、この方法が:前記の曲線に沿うポイントのシーケ
    ンスから第一と第二のポイントから成る連続するペア
    を、この第一と第二のポイントの連続ペアが結果として
    同一の接線の傾きの角度差を与えるように選択するステ
    ップを含み、ここで、前記の第一と第二のポイントの接
    線が、第三のポイントと交差し;この方法がさらに前記
    の第一と第三のポイントのおのおのの間の距離および前
    記の第二と第三のポイントのおのおのの間の距離を測定
    するステップ;および前記の接線の比のシーケンスを、
    前記の第一と第二のペアのポイントの各々に対して接線
    の比を計算することによって得るステップ、より具体的
    には、それぞれ前記の第二と第三のポイントの間の距離
    の前記の連続する第一と第三のポイントの間の距離に対
    する比を決定することによって前記の接線の比のシーケ
    ンスを得るステップ;および前記の曲線を認識するステ
    ップ、より具体的には、前記のポイントのシーケンスの
    前記の接線の比のシーケンスを、既知のポイントのシー
    ケンスの事前に決定されている接線の比のシーケンスと
    比較することによって曲線を認識するステップを含むこ
    とを特徴とする方法。
  2. 【請求項2】 前記の接線の比が定義できない(計算で
    きない)場合、前記の計算して得られる接線の比の代わ
    りに一定の値を割当てるステップがさらに含まれること
    を特徴とする請求項1の方法。
  3. 【請求項3】 手書きサンプルの手書文を認識するため
    の方法であって、この方法が:前記の手書きサンプルを
    表す特徴信号を生成するステップを含み、この特徴信号
    が、スケールおよび回転に対して不変であり;この方法
    がさらに前記の手書きサンプルを前記の生成された特徴
    信号に基づいて認識するステップを含むことを特徴とす
    る方法。
  4. 【請求項4】 手書きサンプルの手書文を認識するため
    の方法であって、この方法が:前記の手書きサンプルを
    表す特徴信号を生成するステップを含み、この特徴信号
    が、スケール、回転、および平行移動に対して不変であ
    り;この方法がさらに前記の手書きサンプルを前記の生
    成された特徴信号に基づいて認識するステップを含むこ
    とを特徴とする方法。
  5. 【請求項5】 前記の生成ステップがさらに:前記の手
    書きサンプルを表す信号シーケンスを得るステップ;前
    記の信号シーケンスを前処理することによって前記の信
    号シーケンス内の異常な信号を除去し、これによって前
    記の信号シーケンスの高次導関数を形成するステップ;
    および前記の不変な特徴信号を前記の高次導関数に基づ
    いて生成するステップを含むことを特徴とする請求項3
    の方法。
  6. 【請求項6】 前記の生成ステップがさらに:前記の手
    書きサンプルを表す信号シーケンスを得るステップ;前
    記の信号シーケンスを前処理することによって前記の信
    号シーケンス内の異常な信号を除去し、これによって前
    記の信号シーケンスの高次導関数を形成するステップ;
    および前記の不変な特徴信号を前記の高次導関数に基づ
    いて生成するステップを含むことを特徴とする請求項4
    の方法。
  7. 【請求項7】 前記の前処理ステップが:スプライン近
    似技法を利用して前記の異常な信号を遮断するステッ
    プ;および前記の信号シーケンスの前記のスプライン近
    似の前記の高次導関数を評価するステップを含むことを
    特徴とする請求項5の方法。
  8. 【請求項8】 前記の前処理ステップが:スプライン近
    似技法を利用して前記の異常な信号を遮断するステッ
    プ;および前記の信号シーケンスの前記のスプライン近
    似の前記の高次導関数を評価するステップを含むことを
    特徴とする請求項5の方法。
  9. 【請求項9】 前記のスプライン近似技法を使用するス
    テップが前記のスプライン近似の各導関数に対してスプ
    ライン近似オペレータを使用するステップを含むことを
    特徴とする請求項7の方法。
  10. 【請求項10】 前記のスプライン近似技法を使用する
    ステップが前記のスプライン近似の各導関数に対してス
    プライン近似オペレータを使用するステップを含むこと
    を特徴とする請求項8の方法。
  11. 【請求項11】 さらに第一のスプライン近似オペレー
    タを使用して、前記の異常な信号が遮断された前記の信
    号シーケンスを得るステップ;第二のスプライン近似オ
    ペレータを使用して、前記の異常な信号が遮断された前
    記の信号シーケンスの一次導関数を得るステップ;第三
    のスプライン近似オペレータを使用して、前記の異常な
    信号が遮断された前記の信号シーケンスの二次導関数を
    得るステップ;および第四のスプライン近似オペレータ
    を使用して、前記の異常な信号が遮断された前記の信号
    シーケンスの三次導関数を得るステップが含まれること
    を特徴とする請求項9の方法。
  12. 【請求項12】 さらに第一のスプライン近似オペレー
    タを使用して、前記の異常な信号が遮断された前記の信
    号シーケンスを得るステップ;第二のスプライン近似オ
    ペレータを使用して、前記の異常な信号が遮断された前
    記の信号シーケンスの一次導関数を得るステップ;第三
    のスプライン近似オペレータを使用して、前記の異常な
    信号が遮断された前記の信号シーケンスの二次導関数を
    得るステップ;および第四のスプライン近似オペレータ
    を使用して、前記の異常な信号が遮断された前記の信号
    シーケンスの三次導関数を得るステップが含まれること
    を特徴とする請求項10の方法。
  13. 【請求項13】 前記の不変な特徴信号が前記の手書き
    サンプルの接線の比の特徴信号を含むことを特徴とする
    請求項3の方法。
  14. 【請求項14】 前記の不変な特徴信号が前記の手書き
    サンプルの接線の比の特徴信号を含むことを特徴とする
    請求項4の方法。
  15. 【請求項15】 前記の不変な特徴信号が前記の手書き
    サンプルの符号付きの接線の比の特徴信号を含むことを
    特徴とする請求項3の方法。
  16. 【請求項16】 前記の不変な特徴信号が前記の手書き
    サンプルの符号付きの接線の比の特徴信号を含むことを
    特徴とする請求項4の方法。
  17. 【請求項17】 前記の不変な特徴信号が前記の手書き
    サンプルの正規化された曲率の特徴信号を含むことを特
    徴とする請求項3の方法。
  18. 【請求項18】 前記の不変な特徴信号が前記の手書き
    サンプルの正規化された曲率の特徴信号を含むことを特
    徴とする請求項4の方法。
  19. 【請求項19】 前記の手書きサンプルを表す特徴信号
    を生成するステップがさらに含まれ、ここで、前記の手
    書きサンプル内の尖点に関する情報が保存され検出可能
    であることを特徴とする請求項3の方法。
  20. 【請求項20】 前記の手書きサンプルを表す特徴信号
    を生成するステップがさらに含まれ、ここで、前記の手
    書きサンプル内の尖点に関する情報が保存され検出可能
    であることを特徴とする請求項4の方法。
  21. 【請求項21】 前記の特徴信号が接線の傾きの角度か
    ら成る特徴信号であることを特徴とする請求項19の方
    法。
  22. 【請求項22】 接線の比の特徴信号、正規化された曲
    率の特徴信号および接線の傾きの角度の特徴信号が、前
    記の手書きサンプルを表すために集合的に使用されるこ
    とを特徴とする請求項3の方法。
  23. 【請求項23】 接線の比の特徴信号、正規化された曲
    率の特徴信号および接線の傾きの角度の特徴信号が、前
    記の手書きサンプルを表すために集合的に使用されるこ
    とを特徴とする請求項4の方法。
  24. 【請求項24】 手書文認識システムを訓練するための
    方法であって、この方法が:モデルの手書きサンプルを
    複数の特徴信号にて表すステップを含み、ここでおのお
    のの特徴信号がある弁別能力を持ち、この方法がさら
    に;前記の複数の特徴信号のおのおのに前記の弁別能力
    に比例する重みを割当てるステップを含むことを特徴と
    する方法。
  25. 【請求項25】 前記の複数の特徴信号が接線の比の特
    徴信号、正規化された曲率の特徴信号および接線の傾き
    の角度の特徴信号から成ることを特徴とする請求項24
    の方法。
  26. 【請求項26】 前記の複数の特徴信号が符号付きの接
    線の比の特徴信号、正規化された曲率の特徴信号および
    接線の傾きの角度の特徴信号から成ることを特徴とする
    請求項24の方法。
  27. 【請求項27】 手書きサンプルの手書文を認識するた
    めの装置であって、この装置が:前記の手書きサンプル
    を表す特徴信号を生成するための手段を含み、ここで、
    これら特徴信号が、スケールおよび回転に対して不変で
    あり;この装置がさらに前記の手書きサンプルを前記の
    生成された特徴信号に基づいて認識するための手段を含
    むことを特徴とする装置。
  28. 【請求項28】 手書きサンプルの手書文を認識するた
    めの装置であって、この装置が:前記の手書きサンプル
    を表す特徴信号を生成するための手段を含み、ここで前
    記の特徴信号が、スケール、回転、および平行移動に対
    して不変であり、この装置がさらに前記の手書きサンプ
    ルを前記の生成された特徴信号に基づいて認識するため
    の手段を含むことを特徴とする装置。
  29. 【請求項29】 前記の手書きサンプルを認識するため
    の手段が、HiddenMarkov Model に基づく手書文認識シ
    ステムを採用することを特徴とする請求項27の装置。
  30. 【請求項30】 前記の手書きサンプルを認識するため
    の手段が、HiddenMarkov Model に基づく手書文認識シ
    ステムを採用することを特徴とする請求項28の装置。
JP8236230A 1995-09-07 1996-09-06 不変な特徴を使用する手書文を認識のための改良された方法および装置 Pending JPH09128485A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/525441 1995-09-07
US08/525,441 US5768420A (en) 1994-01-21 1995-09-07 Method and apparatus for handwriting recognition using invariant features

Publications (1)

Publication Number Publication Date
JPH09128485A true JPH09128485A (ja) 1997-05-16

Family

ID=24093273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8236230A Pending JPH09128485A (ja) 1995-09-07 1996-09-06 不変な特徴を使用する手書文を認識のための改良された方法および装置

Country Status (3)

Country Link
US (1) US5768420A (ja)
EP (1) EP0762313A3 (ja)
JP (1) JPH09128485A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002523844A (ja) * 1998-08-26 2002-07-30 デクマ アクチボラゲット 文字認識
JP2012516432A (ja) * 2009-01-30 2012-07-19 シーメンス アクティエンゲゼルシャフト 物体の振動特性の測定

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6243493B1 (en) * 1994-01-21 2001-06-05 At&T Corp. Method and apparatus for handwriting recognition using invariant features
US6363381B1 (en) * 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching
US6931351B2 (en) * 2001-04-20 2005-08-16 International Business Machines Corporation Decision making in classification problems
US7146046B2 (en) * 2002-06-24 2006-12-05 Microsoft Corporation Method and apparatus for scale independent cusp detection
US7167849B2 (en) * 2003-10-29 2007-01-23 Microsoft Corporation Invariant pattern recognition
US20050207653A1 (en) * 2004-03-16 2005-09-22 Nikitin Alexei V Method for analysis of line objects
CN104995664B (zh) * 2013-03-15 2017-10-31 英特尔公司 实时的连续交互学习及检测
US9466009B2 (en) 2013-12-09 2016-10-11 Nant Holdings Ip. Llc Feature density object classification, systems and methods
WO2015123646A1 (en) 2014-02-14 2015-08-20 Nant Holdings Ip, Llc Edge-based recognition, systems and methods
WO2017197178A1 (en) 2016-05-11 2017-11-16 OgStar Reading, LLC Interactive multisensory learning process and tutorial device
CN107016414A (zh) * 2017-04-10 2017-08-04 大连海事大学 一种脚印的识别方法
US11386636B2 (en) 2019-04-04 2022-07-12 Datalogic Usa, Inc. Image preprocessing for optical character recognition
US10748031B1 (en) * 2019-05-22 2020-08-18 Read-Ink Corporation Handwriting recognition systems and methods

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3863218A (en) * 1973-01-26 1975-01-28 Hitachi Ltd Pattern feature detection system
US3868636A (en) * 1973-06-18 1975-02-25 Isotec Inc Optical character reader having feature recognition capability
US4365235A (en) * 1980-12-31 1982-12-21 International Business Machines Corporation Chinese/Kanji on-line recognition system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002523844A (ja) * 1998-08-26 2002-07-30 デクマ アクチボラゲット 文字認識
JP2012516432A (ja) * 2009-01-30 2012-07-19 シーメンス アクティエンゲゼルシャフト 物体の振動特性の測定

Also Published As

Publication number Publication date
EP0762313A3 (en) 1998-04-01
US5768420A (en) 1998-06-16
EP0762313A2 (en) 1997-03-12

Similar Documents

Publication Publication Date Title
JP2815045B2 (ja) 画像特徴抽出装置,画像特徴解析装置,および画像照合システム
Holden et al. Australian sign language recognition
JPH09128485A (ja) 不変な特徴を使用する手書文を認識のための改良された方法および装置
Kashi et al. On-line handwritten signature verification using hidden Markov model features
Brault et al. Segmenting handwritten signatures at their perceptually important points
JP2699241B2 (ja) アクセス制御方法とそのシステム
Liu et al. Partial shape classification using contour matching in distance transformation
Ong et al. A boosted classifier tree for hand shape detection
Ashbrook et al. Robust Recognition of Scaled Shapes Using Pairwise Geometric Histograms.
JP2977032B2 (ja) 距離及び方向に鑑みたパターン整合装置及びその方法
WO2002037933A2 (en) System, process and software arrangement for recognizing handwritten characters
JP2004054956A (ja) 顔/類似顔映像で学習されたパターン分類器を利用した顔検出方法及びシステム
Bourennane et al. Comparison of shape descriptors for hand posture recognition in video
CN108647597B (zh) 一种手腕识别方法、手势识别方法、装置和电子设备
Nel et al. Estimating the pen trajectories of static signatures using hidden Markov models
JPH11202888A (ja) 否定標本を使用するマルコフモデル弁別器
US6243493B1 (en) Method and apparatus for handwriting recognition using invariant features
JP6434718B2 (ja) 顔画像認識装置及び顔画像認識プログラム
Holden et al. Automatic recognition of colloquial Australian sign language
CN115240279A (zh) 基于节奏特征的仿写签名检测方法、设备及存储介质
US8352489B1 (en) Conditioning multi-class input data for a computer-implemented data classification system
EP0602311B1 (en) Character recognizing apparatus
Kihl et al. Multivariate orthogonal polynomials to extract singular points
JP4509512B2 (ja) スキュー検知
Bashir et al. Area bound dynamic time warping based fast and accurate person authentication using a biometric pen