JP2003308484A - 手書き文字認識装置及び方法 - Google Patents
手書き文字認識装置及び方法Info
- Publication number
- JP2003308484A JP2003308484A JP2002112237A JP2002112237A JP2003308484A JP 2003308484 A JP2003308484 A JP 2003308484A JP 2002112237 A JP2002112237 A JP 2002112237A JP 2002112237 A JP2002112237 A JP 2002112237A JP 2003308484 A JP2003308484 A JP 2003308484A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- recognition target
- character
- target field
- handwritten
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
野を選択することができる手書き文字認識装置及び方法
を提供する。 【解決手段】 少なくとも手書き文字を入力し、入力さ
れた手書き文字を認識して、認識された結果が正しいか
否かを確認し、認識された結果を出力する手書き文字認
識装置であって、手書き文字認識の際に、手書き文字を
認識して、その認識結果に基づいて認識対象分野を推定
して絞り込み、絞り込まれた認識対象分野の中から手書
き文字の認識に用いる認識対象分野を特定して、特定さ
れた認識対象分野に基づいて文脈後処理を行う。
Description
を用いて筆記された手書き文字を認識して文字コードに
変換し、コンピュータ上のプログラムで利用できるよう
にする手書き文字認識装置に関する。特に、文字認識対
象文字種や認識対象分野を特定する手段を有する手書き
文字認識装置に関する。
コンピュータ等における表示画面上に手書き文字を入力
する領域を表示し、当該領域に入力された手書き文字を
認識することによって、表示画面上の所定の領域に認識
結果文字列を表示することになる。例えば、図1に従来
の手書き文字認識装置における画面表示例を示す。
ている領域が、入力したい文字を表示する入力文字表示
領域11であり、表示画面下部における手書き文字入力
領域12の中に設定されている文字枠内に入力された手
書き文字を認識した結果が入力文字表示領域11に表示
されることになる。
識文字がユーザの期待する入力文字である場合を示して
おり、図1(b)は一文字目と三文字目がユーザの期待
する入力文字と異なっている場合を示している。
「ζ」という記号であると誤認識されている。例えば、
入力したい文字列が住所や氏名等であることが事前に判
明している場合には、このような記号として認識される
可能性はない。なぜなら、かかる記号を認識パターンと
して認識辞書に登録しておく必要がないからである。
じめ漢字、平仮名、片仮名、数字、記号等の文字種で指
定することによって、手書き文字の認識精度を向上させ
る方法が良く用いられている。図2は、従来の手書き文
字認識装置であって、文字種の指定が可能となっている
場合の手書き文字入力領域12の表示例を示している。
は、文字種を指定する文字種指定ボタン13が追加され
ている。図2の例においては、認識対象である文字種を
「英字」、「平仮名」、「片仮名」、及び「漢字」と
し、「数字」と「記号」を認識対象から外した状態を示
している。すなわち、図2に示す状態では、記号「ζ」
は認識対象外であることから、図1(b)における一文
字目のように「手」を「ζ」に誤認識される可能性は無
いことになる。
る他の文字に誤認識することは起こり得るが、認識対象
文字が限定されるために認識文字がユーザの期待する入
力文字である可能性は高くなる。
は、それぞれペンやマウス等で選択することによって、
認識対象である文字種とするか否かを選択できるように
なっている。
識は、文字「き」を他の文字「も」に誤認識したもので
あり、上述したような文字種の指定だけでは改善できな
い。そこで、認識精度を向上するために、文字間の並び
に関する情報を用いる方法が良く用いられている。例え
ば「手書も」という並びよりも「手書き」という並びの
方がより日本語らしいという情報を用いることによっ
て、認識結果をより日本語として自然なものに修正する
方法であり、「文脈後処理」と呼ばれているものであ
る。
いて認識結果を改善することから、例えば入力したい文
字列が何の分野の文字列かが事前に判明していると、よ
り良い認識結果が得られることになる。例えば、入力文
字列が「氏名」であるか「住所」、あるいは「駅名」で
あるか等によって文字の並びの傾向は異なる。
るが、このような名前の人はそう多くはないことから、
「静」という文字と「岡」という文字の並びは、「駅
名」や「住所」では出現確率が高いが、「氏名」では出
現確率が低いことになる。
ことが考えられる。例えば、電子メールアドレスや、ウ
ェブページにおけるURL名の文字の並びは、特殊な形
態を有している。すなわち、いずれもネットワークのド
メイン表記(FQDN)が良く用いられることから、英
数字の比較的短い単語がドットで区切られた形態の文字
列が頻繁に使われることになる。したがって、ドットと
英数字の並びの頻度は高いが、一方でドットが二つ以上
連続することは少ない。
り合った文字の並びの頻度を用いて文字列の自然性を判
定しているが、その他にも単語辞書や形態素解析技術を
用いる等、様々な文脈後処理の方法が知られている。い
ずれの方法も、入力したい文字列の分野を判別すること
によって、認識精度を向上させることが可能である。
字種指定ボタン13を押す方法の他に、アプリケーショ
ン上で入力文字表示領域11ごとに入力可能な文字種を
設定することも考えられる。例えば図3に示すように、
電話番号を入力する他の入力文字表示領域14が選択さ
れている場合、自動的に文字種として「数字」のみが選
択されるようにするものである。
ケーションプログラムが、文字認識インタフェースプロ
グラム(以下、「認識パッド」という。)に対して、認
識可能な文字種を指定することによって実現可能であ
る。入力文字表示領域が切り替わることによって、認識
対象文字種を示すボタンについても自動的に変更され
る。
識対象分野を指定するか、入力文字表示領域ごとに設定
しておくという方法も考えられる。例えば、図4に、認
識対象分野を指定するボタンを押した後、指定可能な認
識対象分野リスト15を表示する例を示す。図4におい
ては、表示された認識対象分野リスト15の中から認識
対象分野(住所、氏名等)を指定することにより、その
分野に適した文脈後処理を実行することが可能となる。
たような従来の認識対象分野の指定方法によれば、認識
対象となる分野の種類が増えるに伴って、適切な認識対
象分野を選択することが非常に困難になってしまうとい
う問題点があった。例えば、図4に示す認識対象分野リ
スト15の要素数が非常に多くなってしまうと、認識対
象分野リスト15を表示するウィンドウが画面を占有し
てしまい、その中から目的とする認識対象分野を探し出
して指定することは非常に困難になってしまう。
考えられ、文字認識プログラムがどのような認識対象分
野を扱うことができるか予測することも困難である。す
なわち、ある文字認識プログラムでは「住所」、「氏
名」、「電話番号」だけしか指定できないかも知れず、
またある文字認識プログラムでは数十種類にも及ぶ多彩
な分野を扱える可能性もある。また図4において「組織
(富士通)」とあるように、ユーザが属する組織名を新た
な認識対象分野とすることも可能であり、認識対象分野
の種類は無限に考えることができるからである。
分野の中に存在しなければ、その分野を入力するのに適
した文字種を指定する必要が生じる。しかし、認識対象
分野として選択可能な分野の種類が過大である場合に
は、目的とする分野が存在するか否かを判定すること自
体が困難になってしまうという問題点があった。
すると、ユーザが入力したい分野を選択すること自体が
難しくなり、認識対象分野の選択効率が著しく低下す
る。そして、認識対象分野の選択が困難になればなるほ
ど、ユーザは認識対象分野の選択行為自体を避けること
が予想され、結果的に認識対象分野を指定することによ
る認識精度の向上を図ることができなくなってしまうお
それがある。
ユーザが意識することなく適切な認識対象分野を選択す
ることができる手書き文字認識装置及び方法を提供する
ことを目的とする。
に本発明にかかる手書き文字認識装置は、手書き文字を
入力する手書き文字入力部と、手書き文字を認識する手
書き文字認識部と、認識された結果が正しいか否かを確
認する認識結果確認部と、認識された結果を出力する認
識結果出力部を少なくとも含む手書き文字認識装置であ
って、手書き文字認識部が、手書き文字を認識する初期
手書き文字認識部と、初期手書き文字認識部における認
識結果に基づいて認識対象分野を推定して絞り込む認識
対象分野推定部と、絞り込まれた認識対象分野の中から
手書き文字の認識に用いる認識対象分野を特定する認識
対象分野特定部と、認識対象分野特定部において特定さ
れた認識対象分野に基づいて文脈後処理を行う文脈後処
理部とを含むことを特徴とする。
に推定することによって文脈後処理を行うことができる
ことから、ユーザが特に意識することなく認識精度の向
上を図ることが可能となる。
は、絞り込まれた認識対象分野の中から手書き文字の認
識に用いる認識対象分野を自動的に特定する認識対象分
野自動選定部をさらに含むことが好ましい。認識対象分
野の特定を完全に自動化することができるからである。
は、認識対象文字種と認識対象分野とを関連付けて記憶
する認識対象文字種記憶部と、認識対象文字種を選択す
る認識対象文字種選択部とをさらに含み、選択された認
識対象文字種をキー情報として認識対象文字種選択部を
照会することによって、認識対象分野をあらかじめ絞り
込むことが好ましい。様々な種類の認識対象分野を認識
対象文字種と関連付けておくことによって、認識対象文
字種を指定することで認識対象分野を迅速に絞り込むこ
とができ、認識対象分野の種類が多くなった場合であっ
ても、より認識精度の高い認識対象分野を確実に指定す
ることができるからである。
は、認識対象分野特定部において、特定する対象候補と
なる認識対象分野を、認識対象分野の使用履歴に基づく
優先度順に表示することが好ましい。使用頻度の高い、
あるいは直近に使用した認識対象分野を優先して表示す
ることができることから、適切な認識対象分野を選択す
ることができる可能性がより高まるからである。
は、認識対象分野特定部において、特定する対象候補と
なる認識対象分野を、認識対象分野と認識対象文字種の
一致度に基づいて計算された優先度順に表示することが
好ましい。一致度が高い認識対象分野であるほど認識精
度が高いものと考えられることから、より認識精度が高
いものと期待できる認識対象分野から選択することがで
きるからである。
認識装置の機能をコンピュータの処理ステップとして実
行するソフトウェアを特徴とするものであり、具体的に
は、手書き文字を入力する工程と、手書き文字を認識す
る工程と、認識された結果が正しいか否かを確認する工
程と、認識された結果を出力する工程を少なくとも含む
手書き文字認識方法であって、手書き文字を認識する工
程が、手書き文字を認識する工程と、手書き文字を認識
する工程における認識結果に基づいて認識対象分野を推
定して絞り込む工程と、絞り込まれた認識対象分野の中
から手書き文字の認識に用いる認識対象分野を特定する
工程と、特定された認識対象分野に基づいて文脈後処理
を行う工程とを含む手書き文字認識方法並びにそのよう
な工程を具現化するコンピュータ実行可能なプログラム
であることを特徴とする。
プログラムをロードさせ実行することで、認識対象分野
を客観的に推定することによって文脈後処理を行うこと
ができることから、ユーザが特に意識することなく認識
精度の向上を図ることができる手書き文字認識装置を実
現することが可能となる。
実施の形態1にかかる手書き文字認識装置について、図
面を参照しながら説明する。図5は本発明の実施の形態
1にかかる手書き文字認識装置の構成図である。
を、52は手書き文字認識部を、58は認識結果確認部
を、59は認識結果出力部を、それぞれ示している。ま
た手書き文字認識部52は、初期手書き文字認識部5
3、認識対象分野推定部54、認識対象分野記憶部5
5、認識対象分野特定部56、及び文脈後処理部57か
ら構成されている。
ペンやペン型タブレット等の入力媒体を用いて、手書き
文字を入力するものである。入力媒体としては、特にこ
れらに限定されるものではない。
を行う。まず初期手書き文字認識部53においては、入
力された手書き文字について、認識対象分野を特定する
ことなく、従来の方法によって認識する。そして、認識
対象分野推定部54では、初期手書き文字認識部53に
おいて認識された結果に基づいて、認識対象分野を推定
することになる。
及びハイフンのみで筆記されていることが所定の時点で
判明した場合、現在入力対象となっている手書き文字列
が電話番号であることが推定できる。
でいない等、特定の条件を具備している場合には、初期
手書き文字認識部53を省略して、直接認識対象分野推
定部54において認識対象分野を推定することも考えら
れる。
部55に事前に記憶しておき、認識対象分野推定部54
における認識対象分野の推定時に照会することになる。
認識対象分野記憶部55は、例えば「住所」、「電話番
号」、「e-mail」等の認識対象分野の名称と、その分野
の文字を入力するのに必要な文字あるいは文字種のリス
トとの対応表が記憶されている。
1にかかる手書き文字認識装置における認識対象分野記
憶部55のデータ構成例示図を示す。図6において、記
号<、>で囲まれている部分は文字種名を示しており、
記号「、」で囲まれている部分は具体的な文字を示して
いる。図6に示すように、認識対象分野名と、当該認識
対象分野において使用される可能性のある文字種リスト
との対応表が記憶されている。
には、それぞれ独特の文字種や文字の並びの傾向が存在
する。例えば、上述した例のように認識対象分野が「電
話番号」である場合には、文字種は数字や括弧、ハイフ
ンのいずれかに限定される。また、これらの文字種の中
でも、括弧やハイフンが連続して出現することは無く、
さらにハイフンが文字列の先頭又は末尾に出現すること
がないという所定の記載ルールが存在することになる。
には、認識対象分野が「電話番号」ほどの明確な傾向を
得ることは困難である。しかしながら、地名として良く
用いられる文字の並びの頻度(例えば、2文字の組み合
わせが出現する頻度を「バイグラム」と呼んでいる。)
と実際に入力された文字列とを比較することにより、入
力文字列が住所らしいか否かを判定することは可能であ
る。以下、汎用性に富むバイグラムを用いた判定方法に
ついて説明する。
i(i=1...N)を文字種とする。所定の認識対象分野
において、CiとCjが続けて出現する確率をP(Ci,
Cj)=P ijと表すものとする。長さLの認識文字列X
={Xk}(k=1...L)=“X1X2...XL”が与えら
れた時、認識文字列Xが当該認識対象分野に属する尤度
Sを以下の(数1)で定義する。
である場合には、認識文字列Xが当該認識対象分野と一
致すると推定することができる。なお、当該しきい値
は、認識対象分野ごとに用意された文章コーパスで学習
して求めることができ、例えば当該認識対象分野に属す
る文字列うちの9割以上から得られる尤度値をしきい値
として設定すれば良い。
Pijのいずれかが‘0(ゼロ)’である場合、尤度Sは
無限小の値となる。これは、所定の認識対象分野では存
在し得ない文字の並びが現れたことを示している。
る場合に、文字列中に“ab”という文字並びが出現し
た場合、バイグラム確率Pijが‘0(ゼロ)’となり、
「電話番号」の文字列ではないことが分かる。
場合には、学習コーパス中に存在しない文字の並びでも
実際に生じ得ないものかどうかは確定できない。コーパ
スの量自体が不足していることが原因とも考えられるか
らである。そのため、バイグラム確率Pijが‘0(ゼ
ロ)’である場合には、あらかじめ十分に小さな値を設
定しておき、(数1)におけるlog(Pij)を無限小
の値にはしないようにすることも考えられる。すなわ
ち、各々の認識対象分野ごとに、適当な値を設定してお
けば良い。
認識対象分野を選択等することによって特定することに
なる。例えば、ユーザが「電話番号」を認識対象分野と
して選択すれば、認識対象分野として「電話番号」が特
定されたことになる。
に認識対象分野を選定する方法も考えられる。この場
合、図7に示すように、認識対象分野自動選定部71を
設けることにより、認識対象分野を特にユーザが指定し
なかった場合であっても自動的に認識対象分野を特定す
ることが可能となる。
識対象分野推定部54により得られた認識対象分野の候
補から適当な認識対象分野を選択する方法としては、様
々な方法が考えられる。最も一般的な方法としては、認
識対象分野として推定された候補の中で、一番尤もらし
い認識対象分野、すなわち(数1)における尤度が最も
高い候補を認識対象分野として確定させる方法である。
号」と「郵便番号」のように認識対象文字種や文字の並
びが似ているものも存在する。このような場合には、判
定自体が誤りとなる可能性も考慮する必要がある。そこ
で、例えば1位と2位の尤度値の差が十分に大きい場合
にのみ自動的に尤度値が1位の候補を認識対象分野とし
て確定し、その他の場合には通常の認識対象分野特定部
54による分野選定処理を行うようにする。このように
することで、自動的に選定された認識対象分野の誤りが
生じるのを、未然に回避することが可能となる。
認識対象分野における文字の並び方の傾向に基づいて行
う文脈後処理を行って、最終的な手書き文字認識処理を
行う。したがって、認識候補文字列が限定されると共
に、認識精度自体を大きく改善することになる。
識結果がユーザが期待している結果であるか否かを確認
し、期待している結果として認識されていると確定され
た場合には認識結果出力部59において認識結果として
表示出力等を行うことになる。
き文字認識装置を実現するプログラムの処理の流れにつ
いて説明する。図8に本発明の実施の形態1にかかる手
書き文字認識装置を実現するプログラムの処理の流れ図
を示す。
(ステップS801)、通常の認識方法を用いて手書き
文字を認識する(ステップS802)。そして、当該認
識結果に基づいて認識対象分野を推定し、認識対象分野
となる可能性の高い候補分野を抽出する(ステップS8
03)。
って特定し(ステップS804)、特定された認識対象
分野における文字の並び方の傾向に基づいて文脈後処理
を行い、最終的な手書き文字認識処理を行うことになる
(ステップS805)。
ている結果であるか否かを確認し(ステップS80
6)、期待している結果として認識されていると確定さ
れた場合には(ステップS806:Yes)、認識結果
として表示出力等を行うことになる(ステップS80
7)。また、期待している結果と異なる認識結果となっ
ている場合には(ステップS806:No)、認識結果
自体を修正することになる(ステップS808)。
識対象分野を客観的に推定することによって文脈後処理
を行うことができることから、ユーザが特に意識するこ
となく認識精度の向上を図ることが可能となる。
態2にかかる手書き文字認識装置について、図面を参照
しながら説明する。図9は本発明の実施の形態2にかか
る手書き文字認識装置の構成図である。
対象分野を指定する方法よりも広い範囲をカバーする。
例えば認識対象分野として「郵便番号」を指定すれば、
文字種は「数字とハイフン」というように一義的に決定
する。しかしながら、同じ文字種を指定しても、それが
郵便番号を入力するためのものかどうかは定まらない。
例えば、認識対象分野「電話番号」においても、同じ文
字種の設定が可能だからである。
グラムがサポートしていない場合には、その分野の文字
を入力するのに十分な文字種を指定する必要がある。も
ちろん、全文字種を指定するものであっても良い。
指定は比較的容易であるのに対して、認識対象分野の指
定は比較的困難であるものと考えられる。換言すれば、
文字種を指定することによって、認識対象分野もある程
度限定することができるものと考えられる。したがっ
て、文字種と認識対象分野との関係を文字認識プログラ
ムが認知していれば、まず文字種を指定し、続いて認識
対象分野を指定することによって、適切な認識対象分野
を指定することがより容易にできるものと考えられる。
対象文字種と認識対象分野とを関連付けて記憶させてお
くことによって、認識対象分野を効率良く指定できるよ
うに構成されている。例えば「郵便番号」という認識対
象分野で使われる文字種が「数字、ハイフン」であると
いう関係を知っていれば、ユーザが「数字」、「ハイフ
ン」を含む文字種を指定した場合には、認識対象分野と
して「郵便番号」を候補に入れることが可能となる。
1と認識対象文字種記憶部92とを設けており、認識対
象文字種記憶部92には、文字認識プログラムが認識で
きる文字種が認識対象分野と関連付けられて記憶されて
いる。図10に、本発明の実施の形態2にかかる手書き
文字認識装置における認識対象文字種記憶部92のデー
タ構造の例示図を示す。図10に示すように、認識対象
分野に関連付けられて、文字認識プログラムが認識でき
る文字種が列挙されている。すなわち、認識対象文字種
記憶部92には、例えば「数字」、「漢字」等の文字種
の名称と、その文字種に属する文字コードのリストとの
対応が記憶されることになる。
プログラムが認識できる文字種の中から、認識の対象と
なる文字種を選択し、認識対象文字種記憶部92を参照
することによって、選択された認識対象文字種を含む認
識対象分野が、認識対象分野推定部54における推定の
対象として絞り込まれることになる。
うに文字種が表示され、ペンやマウス等で表示されてい
る文字種を選択することによって、各文字種の選択状態
のON/OFFを制御するようになっている。つまり、
図11(a)に示すように、文字種が何も選択されてい
ない場合には、表示されている文字種は全てOFF状態
であるのに対して、例えば認識対象文字種として図11
(b)のように「英字」及び「数字」が選択された場合
には、選択された文字種である「英字」及び「数字」ボ
タンが強調表示され、ON状態であることを示すことに
なる。もちろん、画面表示方法や選択方法は、上述した
方法に限定されるものではない。なお、選択された文字
種は、認識対象分野推定部54に渡されることになる。
識対象文字種をキー情報として認識対象分野記憶部55
を照会することによって、選択された文字種で認識する
ことが可能である認識対象分野を候補として抽出するこ
とになる。ここで、認識対象分野が選択されなかった場
合、例えば目的とする認識対象分野が存在しなかった場
合等においては、最初に選択された認識対象文字種に基
づいて抽出される認識対象分野を認識対象分野の候補と
みなすものとする。
ーザに認識対象分野の候補を提示して選択させることに
よって認識対象分野を特定し、その結果を出力すること
になる。図12に、本発明の実施の形態2にかかる手書
き文字認識装置における認識対象分野特定部56の画面
操作例示図を示す。
れると、認識対象分野推定部54によって候補となる認
識対象分野が抽出される。そこで、選択可能な認識対象
分野が存在する場合には、図12に示すような認識分野
ボタン16が表示される。かかる認識分野ボタン16が
選択されると、図4と同様に表示画面上に選択可能な認
識対象分野リスト15が表示され、ユーザはその中から
適切な認識対象分野を容易に指定することが可能とな
る。
定についてもユーザの入力によって行なうことも考えら
れる。この場合には、認識対象文字種選択部91におい
てユーザが文字種の入力を行うことができるようにする
必要がある。
って、文字種が自動的に選択される構成も考えられる。
この場合、認識した文字列を挿入する入力文字表示領域
11が入力可能な文字種の情報を有することから、入力
文字表示領域11の文字種を判定する入力文字表示領域
文字種判定部(図示せず)を設けることによって、認識
対象文字種を選択することが可能となる。
き文字認識装置を実現するプログラムの処理の流れにつ
いて説明する。図13に本発明の実施の形態2かかる手
書き文字認識装置を実現するプログラムの処理の流れ図
を示す。
(ステップS1301)、通常の認識方法を用いて手書
き文字を認識する(ステップS1302)。そして、当
該認識結果に基づいて、文字認識プログラムが認識でき
る文字種の中から、認識の対象となる文字種を選択し
(ステップS1303)。そして、認識対象文字種記憶
部92を参照することによって、選択された認識対象文
字種を含む認識対象分野を抽出することになる(ステッ
プS1304)。
識対象分野を推定し、認識対象分野となる可能性の高い
候補分野を抽出する(ステップS1305)。
って特定し(ステップS1306)、特定された認識対
象分野における文字の並び方の傾向に基づいて行う文脈
後処理を含めた手書き文字認識処理を行う(ステップS
1307)。そして、認識結果についてユーザが期待し
ている結果であるか否かを確認し(ステップS130
8)、期待している結果として認識されていると確定さ
れた場合には(ステップS1308:Yes)、認識結
果として表示出力等を行うことになる(ステップS13
09)。また、期待している結果と異なる認識結果とな
っている場合には(ステップS1308:No)、認識
結果自体を修正することになる(ステップS131
0)。
が文字種を選択する操作を行うと共に認識分野ボタン1
6が表示されるように説明しているが、入力文字表示領
域11が選択された時点で文字種が限定されているので
あれば、ユーザが特に文字種を指定することなく、文字
種が指定された場合と同様に認識分野ボタン16が表示
され、認識対象分野を選択することができるようにする
ことも可能である。
々な種類の認識対象分野を認識対象文字種と関連付けて
おくことによって、認識対象文字種を指定することで認
識対象分野を迅速に絞り込むことができる。これによ
り、認識対象分野の種類が多くなった場合であっても、
より認識精度の高い認識対象分野を確実に指定すること
が可能となる。
態3にかかる手書き文字認識装置について、図面を参照
しながら説明する。本発明の実施の形態3にかかる手書
き文字認識装置においては、認識対象分野特定部56に
おいて、ユーザに認識対象分野を表示する方法について
説明する。
は、実施の形態2においても説明したように、認識対象
分野推定部54によって抽出された認識対象分野につい
て、図12に示すような認識分野ボタン16が表示され
る。かかる認識分野ボタン16が選択されると、図4と
同様に表示画面上に選択可能な認識対象分野リスト15
が表示され、ユーザはその中から適切な認識対象分野を
指定することになる。
特定部56における認識対象分野表示部60において表
示順序等が制御されている。図14は、本発明の実施の
形態3にかかる手書き文字認識装置における認識対象分
野表示部60の構成例示図である。
60は、認識対象分野履歴記憶部61と認識対象分野表
示制御部62とで構成されている。そして、認識対象分
野履歴記憶部61においては、過去に指定した認識対象
分野の履歴を記憶しておき、認識対象分野表示制御部6
2において認識対象分野履歴記憶部61を参照すること
により、過去の履歴に基づいて認識対象分野を表示する
順序を制御することになる。
記憶している内容がどのように変化するかを例示したも
のである。実際に手書き文字認識に用いられた、すなわ
ちユーザによって選択された認識対象分野は、選択され
た順にリスト構造で記憶されており、図15(a)に示
すように、一番最近選択された認識対象分野が認識対象
分野リスト15の先頭に配置されることになる。この状
態で、以前に選択されたことのある認識対象分野が再び
指定された場合には、図15(b)に示すように、当該
認識対象分野を認識対象分野リスト15の先頭に移動す
ることになる。そして、別の認識対象分野が選択された
場合には、図15(c)に示すように、当該認識対象分
野が認識対象分野リスト15の先頭に追加されることに
なる。
認識対象分野リスト15の先頭に配置するように制御す
ることによって、使われる機会の少ない認識対象分野は
認識対象分野リスト15の末尾方向へと移動し、ユーザ
に表示される場合にはあまり目立たない位置に移動する
ことになる。認識対象分野表示制御部62は、以上のよ
うに制御された認識対象分野リスト15の順番に基づい
てユーザに認識対象分野名を表示することになる。
認識対象文字種との一致度に基づいた評価値によって表
示順序を制御する方法も考えられる。この場合の認識対
象分野表示部60の構成例示図を図16に示す。
60は、認識対象分野評価部63と認識対象分野表示制
御部62とで構成されている。認識対象分野評価部63
においては、認識対象文字種と認識対象分野の一致度を
評価することになる。例えば認識対象分野の一致度を計
算するには、その認識対象分野で使用される文字種セッ
トと実際に指定された文字種とを比較し、その差が小さ
いほど評価値が高くなるように計算すれば良い。
種の間で一致度を計算し、その評価値に基づいて認識対
象分野を表示する。認識対象分野表示制御部62では、
認識対象分野を評価値の順に並べかえて表示することに
なる。
算される評価値について説明する。以下、当該評価値を
「一致度」という。一致度は、現在選択されている認識
対象文字種と認識対象分野が示す文字のセットとがどの
程度一致しているかを示す値である。
={C1,C2,...,CN}とする。また、当該認識対象
文字種との一致度を計算したい認識対象分野で使われる
文字の集合をD={D1,D2,...,DM}とする。ここ
で、Ci(i=1...N)及びDj(j=1...M)はそれ
ぞれの文字種又は文字集合に属する文字を示している。
種Cが選択されている場合に、認識対象分野の中でC⊃
Dとなる認識対象分野を表示することになる。
集合をEとすると、E=C∩Dである。ここでE={E
1,E2,...,EL}とするとLはCとDの両方に存在す
る文字の数であり、もちろんL≦NかつL≦Mである。
識対象をCの範囲に絞っている。これはユーザが入力し
たい認識対象分野の文字集合に近いものだと思われる
(例えば電話番号を入力したい場合に、文字種として漢
字を選択するユーザはごくわずかであろう)。すなわ
ち、CとDが示す文字集合に違いが少ないほど、ユーザ
の意図に近い認識対象分野であるものと推測することが
できる。換言すれば、Eの文字集合のサイズLが大きい
ほど、ユーザにとって望ましい認識対象である可能性が
高いと考えることができる。
しては、Lが大きくなるものを一致度が高いものである
と評価するようにすれば良い。ここでは一致度Tの値を
(数2)のように定義する。
子の第1項Lは文字集合CとDが一致した数を評価し、
第2項のw(L−M)の部分は、認識対象分野で必要な
文字で文字種Cの中に存在しない文字の数を示してい
る。先に述べたように本発明ではC⊃Dとなる認識対象
分野を表示するため、一般にLとMは同じ値を取り、第
2項は常に‘0(ゼロ)’となる。
の場合の一致度Tは負の値となるため、認識対象分野表
示制御部62は、一致度の評価値が正の値のものだけを
表示するようにすれば良い。
択の候補として表示されている認識対象分野の中に、目
的とする分野が存在するか否かの判断がより容易にな
り、認識対象文字種及び認識対象分野をより確実に指定
することができることから、ユーザが高い認識性能を享
受できるようになり、文字認識システムの使い勝手が向
上する。
文字認識装置を実現するプログラムは、図17に示すよ
うに、CD−ROM172−1やフレキシブルディスク
172−2等の可搬型記録媒体172だけでなく、通信
回線の先に備えられた他の記憶装置171や、コンピュ
ータ173のハードディスクやRAM等の記録媒体17
4のいずれに記憶されるものであっても良く、プログラ
ム実行時には、プログラムはローディングされ、主メモ
リ上で実行される。
文字認識装置により生成された認識対象分野に関するデ
ータや認識対象文字種に関するデータ等についても、図
17に示すように、CD−ROM172−1やフレキシ
ブルディスク172−2等の可搬型記録媒体172だけ
でなく、通信回線の先に備えられた他の記憶装置171
や、コンピュータ173のハードディスクやRAM等の
記録媒体174のいずれに記憶されるものであっても良
く、例えば本発明にかかる手書き文字認識装置を利用す
る際にコンピュータ173により読み取られる。
文字入力部と、前記手書き文字を認識する手書き文字認
識部と、認識された結果が正しいか否かを確認する認識
結果確認部と、前記認識された結果を出力する認識結果
出力部を少なくとも含む手書き文字認識装置であって、
前記手書き文字認識部が、前記手書き文字を認識する初
期手書き文字認識部と、前記初期手書き文字認識部にお
ける認識結果に基づいて認識対象分野を推定して絞り込
む認識対象分野推定部と、絞り込まれた前記認識対象分
野の中から手書き文字の認識に用いる前記認識対象分野
を特定する認識対象分野特定部と、前記認識対象分野特
定部において特定された前記認識対象分野に基づいて文
脈後処理を行う文脈後処理部とを含むことを特徴とする
手書き文字認識装置。
野の中から手書き文字の認識に用いる前記認識対象分野
を自動的に特定する認識対象分野自動選定部をさらに含
む付記1に記載の手書き文字認識装置。
野とを関連付けて記憶する認識対象文字種記憶部と、認
識対象文字種を選択する認識対象文字種選択部とをさら
に含み、選択された前記認識対象文字種をキー情報とし
て、前記認識対象文字種選択部を照会することによっ
て、前記認識対象分野をあらかじめ絞り込む付記1又は
2に記載の手書き文字認識装置。
いて、特定する対象候補となる前記認識対象分野を、前
記認識対象分野の使用履歴に基づく優先度順に表示する
付記1から3のいずれか一項に記載の手書き文字認識装
置。
いて、特定する対象候補となる前記認識対象分野を、前
記認識対象分野と認識対象文字種の一致度に基づいて計
算された優先度順に表示する付記1から3のいずれか一
項に記載の手書き文字認識装置。
と、前記手書き文字を認識する工程と、認識された結果
が正しいか否かを確認する工程と、前記認識された結果
を出力する工程を少なくとも含む手書き文字認識方法で
あって、前記手書き文字を認識する工程が、前記手書き
文字を認識する工程と、前記手書き文字を認識する工程
における認識結果に基づいて認識対象分野を推定して絞
り込む工程と、絞り込まれた前記認識対象分野の中から
手書き文字の認識に用いる前記認識対象分野を特定する
工程と、特定された前記認識対象分野に基づいて文脈後
処理を行う工程とを含むことを特徴とする手書き文字認
識方法。
プと、前記手書き文字を認識するステップと、認識され
た結果が正しいか否かを確認するステップと、前記認識
された結果を出力するステップを少なくとも含む手書き
文字認識方法を具現化するコンピュータ実行可能なプロ
グラムであって、前記手書き文字を認識するステップ
が、前記手書き文字を認識するステップと、前記手書き
文字を認識するステップにおける認識結果に基づいて認
識対象分野を推定して絞り込むステップと、絞り込まれ
た前記認識対象分野の中から手書き文字の認識に用いる
前記認識対象分野を特定するステップと、特定された前
記認識対象分野に基づいて文脈後処理を行うステップと
を含むことを特徴とするコンピュータ実行可能なプログ
ラム。
認識装置によれば、ユーザが意識することなく適切な認
識対象分野を推定することができ、手書き文字の認識精
度を向上させることが可能となる。
によれば、様々な種類の認識対象分野を認識対象文字種
と関連付けておくことによって、認識対象文字種を指定
することで認識対象分野を迅速に絞り込むことができ
る。これにより、認識対象分野の種類が多くなった場合
であっても、より認識精度の高い認識対象分野を確実に
指定することが可能となる。
置によれば、選択の候補として表示されている認識対象
分野の中に、目的とする分野が存在するか否かの判断が
より容易になり、認識対象文字種及び認識対象分野をよ
り確実に指定することができることから、ユーザが高い
認識性能を享受できるようになり、文字認識システムの
使い勝手が向上する。
字入力領域の表示例示図
例示図
字入力領域の表示例示図
識装置の構成図
識装置における認識対象分野記憶部のデータ構造例示図
識装置の他の構成図
識装置における処理の流れ図
識装置の構成図
認識装置における認識対象文字種記憶部のデータ構造例
示図
認識装置における手書き文字入力領域の表示例示図
認識装置における手書き文字入力領域の表示例示図
認識装置における処理の流れ図
認識装置における認識対象分野表示部の構成図
認識装置における認識対象分野リストの例示図
認識装置における認識対象分野表示部の構成図
型記録媒体 172−1 CD−ROM 172−2 フレキシブルディスク 173 コンピュータ 174 コンピュータ上のRAM/ハードディスク等の
記録媒体
Claims (5)
- 【請求項1】 手書き文字を入力する手書き文字入力部
と、 前記手書き文字を認識する手書き文字認識部と、 認識された結果が正しいか否かを確認する認識結果確認
部と、 前記認識された結果を出力する認識結果出力部を少なく
とも含む手書き文字認識装置であって、 前記手書き文字認識部が、 前記手書き文字を認識する初期手書き文字認識部と、 前記初期手書き文字認識部における認識結果に基づいて
認識対象分野を推定して絞り込む認識対象分野推定部
と、 絞り込まれた前記認識対象分野の中から手書き文字の認
識に用いる前記認識対象分野を特定する認識対象分野特
定部と、 前記認識対象分野特定部において特定された前記認識対
象分野に基づいて文脈後処理を行う文脈後処理部とを含
むことを特徴とする手書き文字認識装置。 - 【請求項2】 絞り込まれた前記認識対象分野の中から
手書き文字の認識に用いる前記認識対象分野を自動的に
特定する認識対象分野自動選定部をさらに含む請求項1
に記載の手書き文字認識装置。 - 【請求項3】 認識対象文字種と認識対象分野とを関連
付けて記憶する認識対象文字種記憶部と、認識対象文字
種を選択する認識対象文字種選択部とをさらに含み、 選択された前記認識対象文字種をキー情報として、前記
認識対象文字種選択部を照会することによって、前記認
識対象分野をあらかじめ絞り込む請求項1又は2に記載
の手書き文字認識装置。 - 【請求項4】 手書き文字を入力する工程と、 前記手書き文字を認識する工程と、 認識された結果が正しいか否かを確認する工程と、 前記認識された結果を出力する工程を少なくとも含む手
書き文字認識方法であって、 前記手書き文字を認識する工程が、 前記手書き文字を認識する工程と、 前記手書き文字を認識する工程における認識結果に基づ
いて認識対象分野を推定して絞り込む工程と、 絞り込まれた前記認識対象分野の中から手書き文字の認
識に用いる前記認識対象分野を特定する工程と、 特定された前記認識対象分野に基づいて文脈後処理を行
う工程とを含むことを特徴とする手書き文字認識方法。 - 【請求項5】 手書き文字を入力するステップと、 前記手書き文字を認識するステップと、 認識された結果が正しいか否かを確認するステップと、 前記認識された結果を出力するステップを少なくとも含
む手書き文字認識方法を具現化するコンピュータ実行可
能なプログラムであって、 前記手書き文字を認識するステップが、 前記手書き文字を認識するステップと、 前記手書き文字を認識するステップにおける認識結果に
基づいて認識対象分野を推定して絞り込むステップと、 絞り込まれた前記認識対象分野の中から手書き文字の認
識に用いる前記認識対象分野を特定するステップと、 特定された前記認識対象分野に基づいて文脈後処理を行
うステップとを含むことを特徴とするコンピュータ実行
可能なプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002112237A JP3950357B2 (ja) | 2002-04-15 | 2002-04-15 | 手書き文字認識装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002112237A JP3950357B2 (ja) | 2002-04-15 | 2002-04-15 | 手書き文字認識装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003308484A true JP2003308484A (ja) | 2003-10-31 |
JP3950357B2 JP3950357B2 (ja) | 2007-08-01 |
Family
ID=29394798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002112237A Expired - Fee Related JP3950357B2 (ja) | 2002-04-15 | 2002-04-15 | 手書き文字認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3950357B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004355518A (ja) * | 2003-05-30 | 2004-12-16 | Sharp Corp | 携帯通信機器 |
CN108027665A (zh) * | 2015-10-30 | 2018-05-11 | 大陆汽车有限公司 | 改善字母数字字符和手势的手写输入识别精度的方法和设备 |
-
2002
- 2002-04-15 JP JP2002112237A patent/JP3950357B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004355518A (ja) * | 2003-05-30 | 2004-12-16 | Sharp Corp | 携帯通信機器 |
CN108027665A (zh) * | 2015-10-30 | 2018-05-11 | 大陆汽车有限公司 | 改善字母数字字符和手势的手写输入识别精度的方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
JP3950357B2 (ja) | 2007-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105830011B (zh) | 用于交叠手写文本输入的用户界面 | |
US9589200B2 (en) | Handwriting input conversion apparatus, computer-readable medium, and conversion method | |
US20170206002A1 (en) | User-centric soft keyboard predictive technologies | |
CN102830924B (zh) | 一种调整输入法键盘的方法及装置 | |
JP2007317022A (ja) | 手書文字処理装置及び手書文字処理方法 | |
JP2003162687A (ja) | 手書き文字入力装置、手書き文字認識プログラム | |
US20050268231A1 (en) | Method and device for inputting Chinese phrases | |
JP4891438B2 (ja) | キーパッドテキスト入力の多義性解消 | |
US9286288B2 (en) | Method of learning character segments during text input, and associated handheld electronic device | |
JP6155821B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN101984389B (zh) | 输入汉语字符的方法、装置及终端设备 | |
US9171234B2 (en) | Method of learning a context of a segment of text, and associated handheld electronic device | |
JP2000122768A (ja) | 文字入力装置、方法および記録媒体 | |
CN111142683B (zh) | 输入辅助程序、输入辅助方法以及输入辅助装置 | |
US20130073572A1 (en) | Method of learning character segments from received text, and associated handheld electronic device | |
JP2003308484A (ja) | 手書き文字認識装置及び方法 | |
JP2013214187A (ja) | 文字入力装置、文字入力装置の制御方法、制御プログラム、および記録媒体 | |
JP6655331B2 (ja) | 電子機器及び方法 | |
CN110942068B (zh) | 信息处理装置、存储介质及信息处理方法 | |
KR20180007183A (ko) | 대표문자와 공백 입력을 통한 둘 이상의 단어로 구성된 문장입력방법 및 장치 | |
EP3537341A1 (en) | Character input device, character input method, and character input program | |
CN104268131B (zh) | 用于加速中文输入中的候选选择的方法 | |
JP7268316B2 (ja) | 情報処理装置及びプログラム | |
JPH07302306A (ja) | 文字入力装置 | |
JP2002279353A (ja) | 文字認識装置、その方法、および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070417 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070420 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110427 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110427 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120427 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130427 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140427 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |