JP5897725B2 - ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体 - Google Patents

ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体 Download PDF

Info

Publication number
JP5897725B2
JP5897725B2 JP2014539803A JP2014539803A JP5897725B2 JP 5897725 B2 JP5897725 B2 JP 5897725B2 JP 2014539803 A JP2014539803 A JP 2014539803A JP 2014539803 A JP2014539803 A JP 2014539803A JP 5897725 B2 JP5897725 B2 JP 5897725B2
Authority
JP
Japan
Prior art keywords
character
characters
sequentially
predetermined
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014539803A
Other languages
English (en)
Other versions
JPWO2014054716A1 (ja
Inventor
宗 益子
宗 益子
正人 萩原
正人 萩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP5897725B2 publication Critical patent/JP5897725B2/ja
Publication of JPWO2014054716A1 publication Critical patent/JPWO2014054716A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Character Discrimination (AREA)
  • Position Input By Displaying (AREA)

Description

本発明はユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体に関し、特に、空中に手書きジェスチャを行うことで文字入力するユーザインタフェース技術に関する。
空中に手書きジェスチャを行うことで文字入力するシステムが検討されている(下記非特許文献1参照)。このシステムでは、ユーザがウェアラブルカメラを頭部に装着し、眼前にて指で空中に1つの文字を書く動作を行うと、手の動きが解析され、解析結果から文字が特定される。またこのシステムでは、文字を書き始めるタイミング及び書き終わったタイミングにおいて、システムに対して明示的な操作を行って、文字認識の対象を明確化する必要がある。
園田智也,村岡洋一,「空中での手書き文字入力システム」,電子情報通信学会論文誌,一般社団法人電子情報通信学会,2003年7月1日,D-II J86-D-II(7),p. 1015-1025
上述のように従来技術では、1文字入力する毎に入力開始及び入力終了をシステムに対して知らせる必要がある。このため、入力操作が煩雑であり、複数の文字からなる語や文を入力するのに適さないという問題がある。
本発明は上記課題に鑑みてなされたものであって、その目的は、空中に手書きジェスチャを行うことにより複数の文字を簡単に入力することができるユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体を提供することにある。
上記課題を解決するために、本発明に係るユーザインタフェース装置は、複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段と、ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段と、前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段と、順次出力される前記各文字に係る前記類似度評価情報に基づいて、前記ユーザのジェスチャに係る文字列を決定する文字列決定手段と、を含む。
また、本発明の一態様では、順次出力される前記各文字に係る前記類似度評価情報に基づいて文字判定期間を決定する期間決定手段を含んでよい。また、前記文字列決定手段は、所定基準を満たす前記類似度評価情報が前記文字判定期間内に出力される文字のうち、1以上を前記ユーザのジェスチャに係る文字列に含まれる文字として決定してよい。
この場合、前記文字列決定手段は、1つの文字についてのみ前記所定基準を満たす類似度評価情報が前記文字判定期間内に複数回連続して出力される場合に、該1つの文字を前記ユーザのジェスチャに係る文字列に含まれると判断してよい。
また、前記文字列決定手段は、前記文字列判定期間内において、前記所定値基準を満たす類似度評価情報が連続して出力される期間が重複する複数の文字があると判断される場合に、前記ユーザのジェスチャに係る文字列に、それら複数の文字のうちいずれかが択一的に含まれると判断してよい。
また、前記文字列決定手段は、互いに関連する関連文字を記憶してよい。そして、前記文字列判定期間内において、前記所定基準を満たす類似度評価情報が連続して出力される期間が重複する複数の文字があると判断される場合に、それら複数の文字が前記関連文字であれば、予め定められたそのうち1つを前記ユーザのジェスチャに係る文字列に含まれると判断してよい。
また、前記位置取得手段は、前記所定の筆記位置の3次元座標を順次取得し、そのうち少なくとも3つにより定まる平面に対する投影位置を示す2次元座標を順次取得してよい。
また、前記文字列決定手段は、順次出力される類似度評価情報に基づいて選択される文字を連結してなる一次文字列を複数決定する手段と、前記複数の一次文字列のそれぞれに基づいて、前記ユーザのジェスチャに係る文字列の候補を1以上決定する手段と、前記各候補の評価値である候補評価値を、該候補に対応する前記一次文字列に含まれる文字に係る類似度評価値に基づいて算出する手段と、算出される候補評価値に基づいて、前記ユーザのジェスチャに係る1以上の文字列を出力する手段と、を含んでよい。
また、本発明に係るユーザインタフェース方法は、ユーザが空中に文字を順に書くジェスチャをする場合に、所定の筆記位置を順次取得する位置取得ステップと、前記位置取得ステップで前記所定の筆記位置が取得されるごとに、複数文字のそれぞれを空中に書くジェスチャをした場合における前記所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段を参照して、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力ステップと、順次出力される前記各文字に係る前記類似度評価情報に基づいて、前記ユーザのジェスチャに係る文字列を決定する文字列決定ステップと、を含む。
また、本発明に係るプログラムは、複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段、ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段、前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段、及び順次出力される前記各文字に係る前記類似度評価情報に基づいて、前記ユーザのジェスチャに係る文字列を決定する文字列決定手段としてコンピュータを機能させるためのプログラムである。このプログラムはコンピュータ可読情報記憶媒体に格納されてよい。
本発明の実施形態に係るユーザインタフェース装置の外観斜視図である。 画面に表示されるユーザインタフェース画像の一例を示す図である。 本発明の実施形態に係るユーザインタフェース装置の機能ブロック図である。 文字認識処理を示すフロー図である。 手の軌跡を示す3次元座標列の計測を説明する図である。 3次元座標列の投影を示す図である。 投影面に投影された手の軌跡を示す図である。 投影面の変形例を示す図である。 文字のテンプレートの一例を示す図である。 DPマッチングに用いるコストテーブルの一例を模式的に示す図である。 DPマッチングを説明する図である。 入力データと各文字のテンプレートとの類似度評価値の推移を示す図である。 候補文字の判定基準を説明する図である。 文字認識部から出力される候補文字データを示す図である。 基本辞書を示す図である。 文字変換テーブルを示す図である。 変換済み辞書を示す図である。 変換処理を示すフロー図である。 変換語候補のグラフ構造を示す図である。 ユーザインタフェース処理を示すフロー図である。 腕の長さを入力するためのユーザインタフェース画面の一例を示す図である。
以下、本発明の実施形態について図面に基づき詳細に説明する。
図1は、本発明の実施形態に係るユーザインタフェース装置の外観斜視図である。同図に示されるように、ユーザインタフェース装置10は、テレビ受像機やパーソナルコンピュータ用モニタなどの表示装置12と、空間計測装置14と、本体16と、を含んでいる。本体16はパーソナルコンピュータやコンピュータゲームシステムなどのコンピュータであり、表示装置12及び空間計測装置14が接続されている。
空間計測装置14は、正面をリアルタイムに撮像し、2次元画像を取得する動画カメラとしての機能と、動画カメラにより映し出される2次元画像(フレーム画像)の各位置までの距離の情報(距離画像)を取得する距離センサ(デプスセンサ)としての機能と、を有している。距離センサは、例えば正面側に特定の2次元パターンの赤外光を照射し、それを赤外線カメラで撮影し、映し出される2次元パターンと元の2次元パターンとの相違から、正面を映し出した画像の各位置までの距離を計算するものであってよい。或いは、距離センサからレーザ光を出射し、レーザ光が正面の物体により反射され、再び距離センサまで戻ってくるまでの時間を計測して、その時間から距離をしてもよい。この場合、レーザ光を走査すれば、広範囲について距離情報を得ることができる。他にも、種々の方式の距離センサが知られており、これらを適宜採用することができる。空間計測装置14は、上記2つの機能により、正面を映し出した動画像と、動画像を構成するフレーム画像に表れた各位置の3次元座標の情報(距離画像)と、を取得できる。
空間計測装置14は、表示装置12の上に、表示装置12の表示面が向く方向に向けて配置されている。ユーザUが表示装置12の前に立つか、又は座って、空中で文字を書く動作(ジェスチャ)をすれば、その様子を示す動画像及び距離画像が本体16に入力される。本体16では、これら動画像及び距離画像から、後述のようにユーザUの利き手(ここでは右手とする)の位置の3次元座標列を認識するようになっており、その手の位置の軌跡18に基づいて、ユーザが書いた文字が認識される。
図2は、表示装置12の画面に映し出されるユーザインタフェース画像の一例を示している。同図に示されるように、画面には空間計測装置14で撮影された動画像を左右反転させた動画像(鏡像)が背景として全面に表示されている。ここでは動画像にユーザUが映し出されている。
ユーザUの利き手側の肩、すなわち右肩(基準部位)が映し出された位置22を中心とした仮想的な円26(不可視)の周上には、変換文字列の候補を示す選択候補画像(選択要素)20が略等間隔に配置されており、ユーザUはそれらのうち1つに右手の表示位置を重ねることにより、当該1つの選択候補画像20が示す変換文字列を選択することができる。選択された変換文字列は、例えば他のプログラムに渡され、検索キーワードなどとして用いられたり、メールなどのコミュニケーションツールの送信メッセージに用いられたりする。なお、選択要素としては、上記のような変換文字列の候補を示すものに限らず、他の文字列を示す画像やテキストデータそのものであってもよい。或いは、電子商取引サイトで取り扱う商品などの写真画像であってもよい。円26の外側には、さらに入力済みの文字を削除するためのバックスペースボタンの画像など、特定機能を発動するためのボタン画像28が配置されている。ユーザUは、ボタン画像28に右手を重ねることにより、特定機能を発動させることができる。ここで、円26の径は、ユーザUの腕が画面に表示されたときの長さを基準に、例えばその8割と決定されてよい。或いは、平均的な人の腕が画面に表示されたときの長さを基準として、例えばその8割と決定されてもよい。
また、円26の内側には、ユーザUが利き手で文字を書く動作をする領域(空書領域)が設定されている。この空書領域は円形領域であってよい。また、該円形領域は円26と同心であってよく、また、円26より小径であってよい。ユーザUは、自分の右手が映し出された位置24が空書領域内に収まるようにして、右手で任意の文字を書く。右手の位置24の所定時間ごとに本体16で認識されており、新しく認識されたものから順に所定数の位置は、画面に丸印等の識別画像により表示される(図中黒丸)。なお、空所領域から右手の位置24が出た場合には、認識された位置24に基づく文字の認識処理を停止してよい。こうすれば、ユーザUが選択候補画像20に右手を重ねる動きを、文字を書く動きと認識せずに済み、処理効率を向上させることができる。
同図に示されるユーザインタフェースによれば、左右反転したユーザUの画像を表示しつつ、利き手の位置24の軌跡が丸印等の画像群により示されるので、ユーザUは自分が空書領域にどのような文字を書いているかを、画面内容から容易に理解できる。また、ユーザUは腕を伸ばさないと、自分の利き手の位置24を選択項目画像20やボタン画像28に重ねられないので、文字を書いている途中に誤って選択項目画像20やボタン画像28を選択してしまうことが無くなる。
なお、本体16では、空間計測装置14により取得された動画像及び距離画像に基づき、動画像に表れた人の主要部位の3次元位置座標を計算する。動画像及び距離画像から人の主要部位(左右の肩及び手の位置を含む。)の3次元位置座標を計算するには、例えば動画像に表れた人の主要部位を認識し、その3次元座標を動画像及び距離画像から取得する。また、動画像に表れない部位については、時間的に前後する動画像及び距離画像から補間したり、同部位に連結された部位の3次元位置座標から推定したりできる。この計算結果は、例えばマイクロソフトコーポレーションのキネクト(商標)を用いることで、容易に利用できる。そして、認識された位置を、空間計測装置14の正面に仮想的に配置される投影面に投影することにより、利き手側の肩の位置22及び利き手の位置24を取得する。
なお、ここではユーザUの右手を、文字を書くジェスチャを書く際の筆記部位や、選択項目画像20を選択するための選択部位とし、その位置24を筆記位置や選択位置としたが、ユーザUの利き手が左の場合には、左手を筆記部位や選択部位とし、左手の位置を筆記位置や選択位置としてよい。また、手以外にも、指などの他の体の部位を筆記部位や選択部位としてよい。また、以上の説明では利き手の位置を選択位置とし、利き手側の肩を基準部位としたが、選択位置よりも体幹側であって、選択位置を動かすための関節が存在する部位を、選択位置の種類に応じて基準部位として適宜選択してよい。例えば、指先の位置を選択位置とし、手首を基準部位としてよい。また、手が表示される位置の認識は、以上の方法に限らない。例えば、特定色の手袋をユーザUが装着し、該特定色の位置を筆記位置や選択位置として動画像から認識してよい。また、手で直接文字を書いたり選択項目画像20を選択しなくても、何らかの物体(筆記具に似せた棒状の物体など)で文字を書いたり選択項目画像20を選択するようにしてよい。この場合、当該物体の先端位置が筆記位置や選択位置となる。例えば、特定色及び/又は特定形状の物体を手に持ってユーザUが文字を書く場合には、色又は形状を頼りに当該物体の先端の表示位置を筆記位置や選択位置として認識してよい。こうした場合、空間計測装置14は必ずしも必要無く、動画カメラで代用できる。
図3は、ユーザインタフェース装置10の機能ブロック図である。同図に示されるように、ユーザインタフェース装置10は、モーション取得部30、文字認識部32、変換部34、ユーザインタフェース部36、アプリケーション部38、文字テンプレート記憶部40、コストテーブル記憶部42、基本辞書記憶部44、変換済み辞書記憶部46及び文字変換テーブル記憶部48を含んでいる。これらの要素は、本体16に本発明の実施形態に係るプログラムが実行されることにより実現される。このプログラムは、CD−ROMやDVD−ROMなどのコンピュータ可読情報記憶媒体に格納され、そこから本体16にインストールされてもよいし、インターネットなどの情報通信ネットワークを介して本体16にダウンロードされ、インストールされてもよい。
モーション取得部30は、空間計測装置14からユーザUの動画像及び距離画像を取得する。また、それら画像に基づいて、ユーザUの利き手側の肩及び利き手の3次元座標を計算する。
文字認識部32は、ユーザの利き手の3次元座標に基づき、ユーザUが書く文字を順次認識する。変換部34は、文字認識部32により順次認識される文字を順次文字列(単語や文)に変換する。ユーザインタフェース部36は、図2に示されるユーザインタフェース画像を表示装置12の画面に表示する。このため、変換部34により変換された文字列を取得し、それを選択候補画像20として表示する。また、モーション取得部30により取得される動画像を背景として表示するとともに、ユーザUの利き手の位置を表示する。さらに、利き手の位置が選択候補画像20の位置から所定距離内にある場合には、同選択候補画像20に対応する変換文字列が選択されたことをアプリケーション部38に通知する。
アプリケーション部38は、ユーザインタフェース部36から通知される変換文字列に基づき、所定の情報処理を実行する。この情報処理は、どのような処理であってもよいが、例えば通知される変換文字列を検索キーとしてデータベースから情報を検索する処理や、通知される変換文字列に基づいて送信メッセージを生成する処理であってよい。
文字テンプレート記憶部40及びコストテーブル記憶部42は、後述する文字テンプレート(図9参照)及びコストテーブル(図10参照)をそれぞれ記憶する。これらは、文字認識部32における文字認識処理に用いられる。また、基本辞書記憶部44、変換済み辞書記憶部46及び文字変換テーブル記憶部48は、後述する基本辞書(図15参照)、変換済み辞書(図17参照)及び文字変換テーブル(図16参照)をそれぞれ記憶する。これらは、変換部34における変換処理に用いられる。
ここで、文字認識部34による文字認識処理を詳細に説明する。図4は、文字認識部34よる文字認識処理を示すフロー図であり、同図に示される処理は所定時間ごとに実行される。同図に示されるように、まず文字認識部34はモーション取得部30により取得される最新の利き手の3次元位置座標を取得する(S101)。次に、S101で取得した3次元位置座標を所定の投影面に投影する(S102)。具体的には、図5に示されるように、ユーザUの利き手の3次元位置の軌跡18が存在する空間領域と、空間計測装置14の位置と、の間に投影面50が設定される。投影面50は、空間計測装置14の正面方向と垂直に予め設けられ、左右方向にX軸が設定され、上下方向にY軸が設定される。そして、図6に示されるように、S101で取得されたユーザUの利き手の3次元位置52は、投影面50に垂直投影される。図7は、投影面50に投影された、ユーザUの利き手の位置の軌跡18の一例を示しており、同図にはユーザUが空所領域に「R」の文字を書いた場合の投影面50が示されている。
なお、ここでは図5に示されるように、空間計測装置14の前方に、該空間計測方向14の正面方向と垂直となるよう投影面50が設定されるようにしたが、ユーザUが空間計測装置14に正しく向かって字を書くとは限らない。例えば、ユーザUが横を向いて字を書くと、投影面50に投影された利き手の位置の軌跡18は、左右に縮小されてしまい、どの文字をユーザUが書いたかを判別するのが困難となる。
そこで、図8に示されるように、ユーザUの利き手の軌跡18を構成する3次元位置52のうち、3以上を選択し、それらの3次元位置52から決まる平面を投影面50aとしてもよい。この場合、投影面50aは空間計測装置14の正面方向と垂直に設定されるとは限らない。投影面50aは、選択された3次元位置52の全ての座標を含む平面であってもよいし、選択された3次元位置52の平均などの統計的位置を含む平面であってよい。或いは、それら平面に平行な平面であってよい。また、選択される3次元位置52は、軌跡18からランダムに選択されてもよいし、取得された時間が所定時間間隔となるように選択されてもよい。或いは、選択される3次元位置52の間の距離ができるだけ大きくなるように、互いの距離に従って選択されてもよい。さらに、軌跡18における特徴点を通過する平面を投影面50aとしてもよい。特徴点は、軌跡18の各部の曲率に基づいて判断してよい。或いは、ハフ変換を用いて、軌跡における特徴点を通過する平面を投影面50aとして算出してもよい。このようにすれば、ユーザUがどのような方向を向いて字を書いても、正しく文字を認識することができる。
図4に戻り、文字認識部34は、次に各時刻における投影後の位置座標から、直前に取得された投影後の位置座標を減算し、ユーザUが文字を書く位置の移動方向を示すベクトルデータを得る。さらに、このベクトルデータを9種類の方向のうちいずれかに分類することにより、方向分類データを得る(S103)。すなわち、ベクトルデータの大きさが所定値未満であれば、移動していない旨を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では点(・)で示す。また、ベクトルデータの大きさが所定値以上であれば、ベクトルデータの向きにより8方向のいずれかを示すベクトルデータであると分類する。すなわち、ベクトルデータの方向が、上方向(Y方向)を基準として−23度以上+22度未満であれば、上方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では上方向の矢印で示す。+22度以上+67度未満であれば、右斜め上方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では右斜め上方向の矢印で示す。+67度以上+112度未満であれば、右方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では右方向の矢印で示す。+112度以上+157度未満であれば、右斜め下方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では右斜め下方向の矢印で示す。+157度以上+202度未満であれば、下方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では下方向の矢印で示す。+202度以上+247度未満であれば、左斜め下方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では左斜め下方向の矢印で示す。+247度以上+292度未満であれば、左方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では左方向の矢印で示す。+292度以上+337度未満であれば、左斜め上方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では左斜め上方向の矢印で示す。
次に、最新の方向分類データを一端とする、所定数の時間的に連続する方向分類データからなる入力データ(評価対象データ)と、各文字のテンプレートと、の類似度評価値(類似度評価情報)を計算する。なお、文字認識処理の開始時には、所定数の時間的に連続する方向分類データが存在しないが、その場合にはS104以降の処理は実行せず、処理を終了する。
類似度評価値の計算のため、文字テンプレート記憶部40には、図9に模式的に示されるテンプレートのデータが全ての文字(ここでは、アルファベット23文字、0から9までの数字、長音を示すハイフン(「−」)の合計34種の文字)について記憶されている。テンプレートは、各文字を空中に書く動作をした場合の利き手の位置の推移を示しており、図9に示されるように、上述した方向分類データを時間順に並べたものとなっている。各文字のテンプレートは、標準的な体格を有する者が空中で該文字を書く動作を行い、それに対してS101乃至S103の処理を所定時間ごとに繰り返して適用することにより容易に得ることができる。なお、テンプレートは各文字について複数用意されてもよい。
また、コストテーブル記憶部42には、図10に模式的に示されるコストテーブルのデータが記憶されているコストテーブルは、方向分類データ間のコスト(かい離度)を示しており、ここでは、同じ方向分類データ間のコストは0であり、隣り合う方向を示す方向分類データ間のコストは1であり、90度以上135度以下のずれで異なる方向を示す方向分類データ間のコストは2であり、反対方向を示す方向分類データ間のコストは3である。また、移動していない旨の方向分類データ(・)と他の種類の方向分類データとの間のコストは、いずれも1である。類似度評価値の計算のため、文字認識部12はこれらのデータにアクセスすることができるようになっている。
DPマッチングでは、概念的には、図11に示されるように、入力データを構成する方向分類データを横軸に時刻順に並べられるとともに、任意の1文字のテンプレートデータを構成する方向分類データも同様に縦軸に時刻順に並べられたマトリックスが用意される。そして、入力データを構成する方向分類データと、テンプレートデータを構成する方向分類データとのすべての組み合わせに対し、コストテーブルからコストを読み出し、図11に示されるマトリックスにおける、対応するマトリックス要素にそれぞれ格納する。その後、入力データを構成する方向分類データのうち最も遅い(新しい)時刻に取得された方向分類データと、テンプレートデータを構成する方向分類データのうち最も遅い時刻に取得された方向分類データの組に対応するマトリックス要素(図中右下)を注目要素とし、そこに格納されたコスト(ここでは0)を取得する。次に、同マトリックス要素の上、左斜め上、左のいずれかにあるマトリックス要素に注目要素を推移させ、そこに格納されたコストを取得するとともに、既に取得されたコストに加算する。こうして、注目要素を、最上行のマトリックス要素、すなわち、テンプレートを構成する方向分類データのうち時間的に最も早い(古い)時刻に取得された方向分類データに対応するマトリックス要素まで移動させ、コストの総和を得る。このとき、複数の注目要素の経路のうち、コストの総和を最小化するよう経路を選択する。そして、同経路のコストの総和(つまりコストの総和の最小値)を、入力データと当該文字のテンプレートの類似度評価値とする。なお、ここでは類似度評価値の値が小さいほど類似していることとなる。文字認識部12では、図4のS101において、入力データと各文字のテンプレートとの類似度評価値を上述のようにして計算する。上述のDPマッチングによれば、テンプレートを生成した際の文字を書くスピードと、ユーザUが文字を書くスピードと、にずれがある場合にも、適切に文字認識することができる。
文字認識部12では、次に所定値以下の類似度評価値のテンプレートが存在するか否かを判断する(S105)。そして、そのようなテンプレートが存在すれば、同テンプレートに対応する文字及び類似度評価値を本体のメモリに用意されたバッファに格納してから(S106)。処理を終了する。なお、所定値以下の類似度評価値のテンプレートが複数存在する場合には、それらに対応する全ての文字及び類似度評価値をバッファに格納する。以下では、所定値以下の類似度評価値のテンプレートに対応する文字を、「検出された文字」と記すことにする。S105において、所定値以下の類似度評価値のテンプレートが存在しないと判断されれば、変換部34を起動し、該変換部34が、バッファに既に格納されている文字及び類似度評価値に基づき、候補文字のデータを出力する(S107)。
図12は、入力データと各文字のテンプレートとの類似度評価値の推移の一例を示す図である。同図において横軸は時間を示しており、縦軸は類似度評価値を示している。上述のように、文字認識部12は、所定時間ごとに入力データと各文字のテンプレートとの類似度評価値を計算しており、ユーザUが文字を書き終わるタイミングにて、類似度評価値が所定値以下となるテンプレートが発生することになる。ここでは、ユーザUがR、K、Tの文字を順に空中に書いた場合を示しており、これらの文字に対応する類似度評価値が順に、所定値以下となり、再び所定値を超えている。すなわち、R、K、Tの文字が順に検出されている。
図13は、S107における候補文字の出力方法を説明する図である。同図には、何らかの文字が検出され、どの文字も検出されなくなるまでの間、検出された文字を左から右に順に示している。本実施形態では、何らかの文字が検出され、どの文字も検出されなくなるまでの期間を、文字判定期間としている。
同図(a)に示されるように、文字判定期間において、1つの文字(ここでは「A」)だけが連続して検出される場合、S107において、文字認識部12は当該文字及びその類似度評価値を、候補文字のデータとして出力する。候補データは、例えば({文字:類似度評価値})のような所定の形式をとってよい(同図(a)の場合、({A:1.5})のようになる。)。また、類似度評価値は、バッファに格納される同文字に対する類似度評価値のうち、最小のものであってもよいし、平均値などの統計値であってもよい。また、文字認識部12は、同図(a)の場合、2以上の所定回数(例えば3回)以上にわたり連続して1つの文字が検出される場合にだけ、その文字及びその類似度評価値を候補文字のデータと出力し、所定回数未満しか連続して検出されない場合には、候補文字のデータを出力しないようにしてよい。こうすれば、誤認識を防止できる。
また、同図(b)に示されるように、文字判定期間において、1つの文字(ここでは「F」)が連続して検出され、その途中から、別の文字(ここでは「E」)が検出される場合、後に検出された文字についてのみ、文字及びその類似度評価値を候補文字データとして出力してよい。この場合は、後に検出された文字の一部に先に検出された文字が含まれる場合と推定されるからである。同図(b)では、「E」を書く途中で「F」が検出された例を示している。なお、後に検出された文字の一部に先に検出された文字が含まれる場合は、「E」と「F」など特定の文字対に限られる。そこで、こうした先に検出される文字(先文字)とその直後に検出される文字(後文字)の対を関連文字として予め記憶しておいてよい。そして、文字判定期間において、予め記憶された先文字が連続して検出され、その途中から、対応する後文字が検出される場合に、後文字及びその類似度評価値を候補文字データとして出力してよい。
また、同図(c)に示されるように、文字判定期間において、1つの文字(ここでは「1」)が連続して検出され、その途中から、別の文字(ここでは「H」)が検出され、さらにその途中から、さらに別の文字(ここでは「2」)が検出される場合、2番目の文字(ここでは「H」)を書いたのか、1番目の文字(ここでは「1」)と3番目の文字(ここでは「2」)を連続して書いたのか、不明である。そこで、同図(c)の場合には、上記2つの可能性を両方とも候補文字データとして出力する。例えば、({文字2:類似度評価値2}|{文字1:類似度評価値1}{文字3:類似度評価値3})のような形式であってよい(同図(c)の場合、({H:2.0}|{1:1.3}{2:1.0})のようになる。)。
このように、文字認識部12では、何らかの文字が検出され、どの文字も検出されなくなるまでの間を文字判定期間とし、該文字判定期間における文字の検出パターンに応じて候補文字データを生成している。このようにすることで、より尤もらしい候補文字データを生成することができるようになる。
図14は、文字認識部12から順に出力される候補文字データを模式的に示している。同図は、図13(a)の状況が生じてAの文字についての候補文字データが出力され、次に図13(b)の状況が生じてEの文字について候補文字データが出力され、最後に図13(c)の状況が生じてH、1及び2の文字について候補文字データが出力された例を示している。この場合、文字認識部12からは、例えば({A:1.5})({E:1.3})({H:2.0}|{1:1.3}{2:1.0})のように、候補文字データが順に出力される。
変換部34では、以上のようにして候補文字データが出力される度に、既に出力された候補文字データに基づいて、ユーザUのジェスチャに係る文字列を生成する。変換部34における変換処理のために、上述のように基本辞書記憶部44、変換済み辞書記憶部46及び文字変換テーブル記憶部48は、基本辞書、変換済み辞書、文字変換テーブルをそれぞれ記憶している。基本辞書は、図15に示されるように、多数の単語のそれぞれに関連づけて、読み仮名及び品詞を記憶している。また、文字変換テーブルは、図16にその一部が示されるように、全ての仮名文字について、そのアルファベット表記を関連づけて記憶している。ここで、か行〜わ行の文字については、少なくとも2つのアルファベット表記が関連づけられている。すなわち、ヘボン式の表記、つまり子音とそれに続く母音から構成される表記と、母音を省略して子音のみから構成される表記と、の2つの表記が少なくとも関連づけられている。また、仮名文字の「し」のように、ヘボン式では「Shi」と表記されるものの、他の方式(訓令式)で「Si」とも表記される場合、それぞれについて母音を省略し、「Sh」や「S」も、仮名文字「し」に関連づけられている。また、変換済み辞書は、基本辞書に収録される各単語に関連づけて、その単語のアルファベット表記を記憶している。これは、変換済み辞書は、変換部34が文字変換テーブルを参照しながら基本辞書を変換することにより生成されるものである。具体的には、ある単語についての読み仮名を基本辞書から読み出し、読み仮名を構成する各仮名文字を、文字変換テーブルに従ってアルファベット表記に変換する。上述のように、多くの仮名文字には複数のアルファベット表記が関連づけられており、変換済み辞書では、1つの単語に対して、その読み仮名を構成する仮名文字のアルファベット表記のすべての組み合わせが関連づけられている。つまり、1つの単語について、変換済み辞書では、Πn(i)個のアルファベット表記が関連づけて記憶されている。ここでn(i)は、文字変換テーブルにおいて、単語の読み仮名を構成するi番目の仮名文字に関連付けられたアルファベット表記の数である。また、Πは、iが1〜N(N:読み仮名の文字数)までの積を示している。
図18は、変換部34による変換処理を示すフロー図である。この処理は、文字認識部32から文字候補データが出力される度に実行される。まず、既に文字認識部32から出力された文字候補データから生成されるアルファベット文字列のうち1つを選択する(S201)。例えば、図14に示される文字候補データからは、「AEH」と「AE12」の2つのアルファベット文字列が生成されるが、そのうち1つが選択される。つまり、変換部34は、文字候補データにより示されるアルファベット文字を順に連結することによりアルファベット文字列を生成する。また、1つの文字候補データにより複数のアルファベット文字又は文字列が書かれた可能性が示されている場合には、それらを選択的に用いて、他の文字候補データにより示されるアルファベット文字又は文字列と連結することにより、複数のアルファベット文字列(一次文字列)を生成し、そのうち1つを選択する。
次に、S201で選択されたアルファベット文字列の第1のスコアを算出する(S202)。例えば、アルファベット文字列を構成する各文字に対応する類似度評価値を文字候補データから抽出し、それらの逆数を乗算することにより第1のスコアを算出する。さらに、S201で選択されたアルファベット文字列に対応する単語又は単語列を判断し、それらのグラフ、つまり連結状態を示すデータを生成する(図19参照)。
具体的には、S201で選択されたアルファベット文字列の全体又は任意の長さの先頭部分に一致するアルファベット文字列を変換済み辞書から検索し、該アルファベット文字列に関連づけられた単語(変換辞書の見出し語)を取得する。S201で選択されたアルファベット文字列の先頭部分に一致するアルファベット文字列が変換済み辞書に記憶されている場合には、残りの部分の全体又は任意の長さの先頭部分に一致するアルファベット文字列を変換済み辞書から検索し、該アルファベット文字列に関連づけられた単語を取得する。こうして、S201で選択されたアルファベット文字列に対応する単語又は単語列(ユーザUのジェスチャに係る文字列の候補)を取得する。
次に変換部34では、S201で選択されたアルファベット文字列に対応する全ての単語又は単語列について第2のスコアを算出する(S204)。例えば、各単語又は単語列について、それら単語や単語列の出現頻度、日本語としての尤もらしさ、各単語の品詞の並び順などに基づいて、第2のスコアを算出することができる。さらに、S201で選択されたアルファベット文字列に対応する全ての単語又は単語列について、総合スコア(候補評価値)を算出する。総合スコアは、例えば第1のスコアと第2のスコアとを乗算したり、又は加算したりすることにより算出することができる。その後、S201で生成される全てのアルファベット文字列についてS201〜S204の処理を繰り返す(S205)。そして、総合スコアの大きいな順から所定個数の単語又は単語列を出力する(S206)。
ユーザインタフェース部36は、上述したように、変換部34により出力される単語又は単語列、モーション取得部30により取得される動画像に基づき、図2に示されるユーザインタフェース画像を表示装置12の画面に表示する。また、モーション取得部30により取得されるユーザUの利き手の位置を表示する。
図20は、ユーザインタフェース部36によるユーザインタフェース処理を示すフロー図である。同図に示される処理は、所定時間ごとに実行されるものであり、まずモーション取得部30から出力される動画像を構成する最新のフレーム画像をメモリに背景として描画する(S301)。次に、モーション取得部30から取得される、フレーム画像におけるユーザUの利き手側の肩の位置座標を取得する(S302)。さらに、フレーム画像におけるユーザUの利き手の位置座標を取得する(S303)。そして、S302で取得される利き手側の肩の位置座標を中心とした円26の周上に、選択項目画像20を配置する位置を決定する(S304)。選択項目画像20の位置は、例えば上記円26の周上に等間隔に設定してよい。さらに、S303で取得される利き手の位置と、S304で決定された各位置と、の距離を計算し、S303で決定された各位置を、計算された距離に従ってソートする(S305)。そして、総合スコアが高いほど利き手の位置に近い位置に配置されるよう、変換部34から出力される単語又は単語列をS303で決定された位置に配置する(S306)。さらに、特定機能を発動するためのボタン画像28を円26の外側に配置する(S307)。また、S303で取得されるユーザUの利き手の位置に丸印などの識別画像を配置する(S308)。以上のようにして、図2に示されるユーザインタフェース画像を生成し、これを表示装置12の画面に表示する。
なお、上述のように円26の径は、ユーザUの腕が画面に表示されたときの長さを基準に決定してもよいし、平均的な人の腕が画面に表示されたときの長さを基準として決定してもよい。ユーザUの腕が画面に表示されたときの長さを基準とする場合には、図21に示されるように利き手を伸ばすようユーザUに要求するメッセージを画面に表示して、利き手の位置24と利き手側の肩の位置22との距離を取得すればよい。
以上説明したユーザインタフェース装置10では、筆記位置である利き手の位置が取得されるごとに、新しく取得されたものから順に所定数の利き手の位置からなる入力データを生成し、該入力データと各文字に係るテンプレートとの類似度評価値を算出している。そして、筆記位置である利き手の位置が取得されるごとに、類似度評価値に基づいてユーザUのジェスチャに係る文字列を決定している。このため、各文字を書き始めるタイミングや書き終わったタイミングで明示的な操作をしなくても、複数の文字を順に認識させることができ、極めて使い勝手の良いユーザインタフェースを実現できる。
また、変換済み辞書には、各見出し語に関連付けて、子音のみを含むアルファベット文字列が記憶されているので、ユーザUは少数の文字を入力するだけで、意図した文字列を得ることができる。また、各見出し語に関連づけて、子音のみを含むアルファベット文字列のみならず、子音と母音を含むアルファベット文字列が記憶されているので、ユーザUが誤って子音と母音とを含むアルファベット文字列を入力したとしても、ユーザUが意図した文字列を得ることができる。
また、ユーザUの利き手側の肩の位置を基準として、選択要素である選択項目画像20を画面に表示するようにしているので、ユーザUは容易に各選択項目画像20を選択することができる。
なお、本発明は上記実施形態に限定されず、種々の変形実施が可能である。
例えば、以上の説明では、ユーザUの肩の位置を中心とした円周上に選択項目画像20を配置したが、楕円弧上に選択項目画像20を配置してもよい。また、ユーザUの肩の位置を基準として該位置から離間して配置された種々の曲線や直線上に選択項目画像20を配置してよい。また、利き手側の肩の位置を基準とする代わりに、利き手側の肘の位置を基準としてもよい。筆記位置や選択位置である手、指、筆記具の位置よりも体幹側に位置する、肩や肘などの関節の位置を基準として、そこから離間した位置に選択項目画像20を配置すれば、ユーザUは容易に同選択項目画像20を選択できるようになる。
また、以上の説明では基本辞書及び文字変換テーブルから変換済み辞書を生成するようにしたが、生成された変換済み辞書のみをユーザインタフェース装置10に記憶しておいてもよい。また、基本辞書の見出し語及び読み仮名をユーザが任意に追加する場合には、追加された見出し語に対応するアルファベット文字列を、文字変換テーブルに基づいて生成し、それらを変換済み辞書に登録するようにしてもよい。また、変換済み辞書の見出し語は、基本辞書の見出し語に限らず、任意の文字列であってよい。
また、子音のみを用いて文字列の入力を正しく行い、子音と母音とを用いた入力は利用しないユーザも存在する。逆に、子音と母音を用いた入力だけを行い、子音のみを用いた入力を利用しないユーザも存在する。そこで、ユーザUのジェスチャにより入力される文字に基づいて、変換済み辞書の見出し語に対応するアルファベット文字列のうち、子音と母音の両方を含むアルファベット文字列、又は子音のみを含むアルファベット文字列のいずれかを除去するようにしてよい。この場合、変換済み辞書から、それらアルファベット文字列を直接消去してよい。或いは、子音と母音の両方を含むアルファベット文字列、又は子音のみを含むアルファベット文字列の一方のみを含むよう、変換済み辞書を基本辞書及び文字変換テーブルから再度生成してもよい。
また、以上の説明では、アルファベット、数字及びハイフンをユーザのジェスチャにより入力し、日本語の文字列に変換する例について説明したが、本発明は種々の文字、種々の言語に適用できる。例えば、日本語その他の言語のあらゆる文字からテンプレートを用意する文字を選んでよい。こうすれば、テンプレートが用意された様々な文字を、ユーザUのジェスチャから判断できるようになる。
また、変換済み辞書の見出し語は、日本語以外の、子音と母音の区別がある言語であってよい。例えば、見出し語を英単語のフルスペルとし、それに対応する子音のみを含むアルファベット文字列、及び子音及び少なくとも1つ母音を含むアルファベット文字列を、該見出し語に関連づけて変換済み辞書に記憶しておけば、子音のみからなるアルファベット文字列、或いは子音及び少なくとも1つの母音を含むアルファベット文字列をジェスチャで順に入力することで、任意の英単語をシステムに入力することができる。例えば、「Japan」の見出し語に、「Jpn」「Japn」「Jpan」「Japan」を関連づけて変換済み辞書に記憶しておけば、ユーザUが想定に反して、「Japn」などの母音を含むアルファベット文字列を入力したとしても、正しく「Japan」と変換されることになる。なお、見出し語を英単語とする場合、「image」のように語頭に母音が配置された単語については、子音のみからなるアルファベット文字列「mg」に代えて、語頭だけは母音をそのまま含み、それ以外の母音が省略されたアルファベット文字列「img」を変換済み辞書に記憶するようにしてよい。

Claims (15)

  1. 複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段と、
    ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段と、
    前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段と、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて文字判定期間を決定する期間決定手段と、
    1つの文字についてのみ所定基準を満たす類似度評価情報が前記文字判定期間内に複数回連続して出力される場合に、該1つの文字を前記ユーザのジェスチャに係る文字列に含まれると判断する文字列決定手段と、
    を含むことを特徴とするユーザインタフェース装置。
  2. 複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段と、
    ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段と、
    前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段と、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて文字判定期間を決定する期間決定手段と、
    前記文字列判定期間内において、所定基準を満たす類似度評価情報が連続して出力される期間が重複する複数の文字があると判断される場合に、前記ユーザのジェスチャに係る文字列に、それら複数の文字のうちいずれかが択一的に含まれると判断する文字列決定手段と、
    を含むことを特徴とするユーザインタフェース装置。
  3. 請求項2に記載のユーザインタフェース装置において、
    前記文字列決定手段は、互いに関連する関連文字を記憶し、前記文字列判定期間内において、前記所定基準を満たす類似度評価情報が連続して出力される期間が重複する複数の文字があると判断される場合に、それら複数の文字が前記関連文字であれば、予め定められたそのうち1つを前記ユーザのジェスチャに係る文字列に含まれると判断する、
    ことを特徴とするユーザインタフェース装置。
  4. 複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段と、
    ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段と、
    前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段と、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて、前記ユーザのジェスチャに係る文字列を決定する文字列決定手段と、を含み、
    前記位置取得手段は、前記所定の筆記位置の3次元座標を順次取得し、そのうち少なくとも3つにより定まる平面に対する投影位置を示す2次元座標を順次取得する、
    ことを特徴とするユーザインタフェース装置。
  5. 複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段と、
    ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段と、
    前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段と、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて、何らかの文字が検出され、どの文字も検出されなくなるまでの期間である、文字判定期間を決定する期間決定手段と、
    所定基準を満たす前記類似度評価情報が前記文字判定期間内に出力される複数の文字のうち、それらの文字の検出パターンに応じて、1以上を前記ユーザのジェスチャに係る文字列に含まれる文字として決定する文字列決定手段と、
    を含むことを特徴とするユーザインタフェース装置。
  6. 請求項1乃至5のいずれかに記載のユーザインタフェース装置において、
    前記文字列決定手段は、
    順次出力される類似度評価情報に基づいて選択される文字を連結してなる一次文字列を複数決定する手段と、
    前記複数の一次文字列のそれぞれに基づいて、前記ユーザのジェスチャに係る文字列の候補を1以上決定する手段と、
    前記各候補の評価値である候補評価値を、該候補に対応する前記一次文字列に含まれる文字に係る類似度評価値に基づいて算出する手段と、
    算出される候補評価値に基づいて、前記ユーザのジェスチャに係る1以上の文字列を出力する手段と、
    を含むことを特徴とするユーザインタフェース装置。
  7. ユーザが空中に文字を順に書くジェスチャをする場合に、所定の筆記位置を順次取得する位置取得ステップと、
    前記位置取得ステップで前記所定の筆記位置が取得されるごとに、複数文字のそれぞれを空中に書くジェスチャをした場合における前記所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段を参照して、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力ステップと、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて文字判定期間を決定する期間決定ステップと、
    1つの文字についてのみ所定基準を満たす類似度評価情報が前記文字判定期間内に複数回連続して出力される場合に、該1つの文字を前記ユーザのジェスチャに係る文字列に含まれると判断する文字列決定ステップと、
    を含むことを特徴とするユーザインタフェース方法。
  8. ユーザが空中に文字を順に書くジェスチャをする場合に、所定の筆記位置を順次取得する位置取得ステップと、
    前記位置取得ステップで前記所定の筆記位置が取得されるごとに、複数文字のそれぞれを空中に書くジェスチャをした場合における前記所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段を参照して、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力ステップと、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて文字判定期間を決定する期間決定ステップと、
    前記文字列判定期間内において、所定基準を満たす類似度評価情報が連続して出力される期間が重複する複数の文字があると判断される場合に、前記ユーザのジェスチャに係る文字列に、それら複数の文字のうちいずれかが択一的に含まれると判断する文字列決定ステップと、
    を含むことを特徴とするユーザインタフェース方法。
  9. ユーザが空中に文字を順に書くジェスチャをする場合に、所定の筆記位置を順次取得する位置取得ステップと、
    前記位置取得ステップで前記所定の筆記位置が取得されるごとに、複数文字のそれぞれを空中に書くジェスチャをした場合における前記所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段を参照して、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力ステップと、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて、前記ユーザのジェスチャに係る文字列を決定する文字列決定ステップと、を含み、
    前記位置取得ステップは、前記所定の筆記位置の3次元座標を順次取得し、そのうち少なくとも3つにより定まる平面に対する投影位置を示す2次元座標を順次取得する、
    ことを特徴とするユーザインタフェース方法。
  10. ユーザが空中に文字を順に書くジェスチャをする場合に、所定の筆記位置を順次取得する位置取得ステップと、
    前記位置取得ステップで前記所定の筆記位置が取得されるごとに、複数文字のそれぞれを空中に書くジェスチャをした場合における前記所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段を参照して、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力ステップと、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて、何らかの文字が検出され、どの文字も検出されなくなるまでの期間である、文字判定期間を決定する期間決定ステップと、
    所定基準を満たす前記類似度評価情報が前記文字判定期間内に出力される複数の文字のうち、それらの文字の検出パターンに応じて、1以上を前記ユーザのジェスチャに係る文字列に含まれる文字として決定する文字列決定ステップと、
    を含むことを特徴とするユーザインタフェース方法。
  11. 複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段、
    ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段、
    前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて文字判定期間を決定する期間決定手段、及び
    1つの文字についてのみ所定基準を満たす類似度評価情報が前記文字判定期間内に複数回連続して出力される場合に、該1つの文字を前記ユーザのジェスチャに係る文字列に含まれると判断する文字列決定手段
    としてコンピュータを機能させるためのプログラム。
  12. 複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段、
    ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段、
    前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて文字判定期間を決定する期間決定手段、及び
    前記文字列判定期間内において、所定基準を満たす類似度評価情報が連続して出力される期間が重複する複数の文字があると判断される場合に、前記ユーザのジェスチャに係る文字列に、それら複数の文字のうちいずれかが択一的に含まれると判断する文字列決定手段
    としてコンピュータを機能させるためのプログラム。
  13. 複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段、
    ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段、
    前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて、前記ユーザのジェスチャに係る文字列を決定する文字列決定手段
    としてコンピュータを機能させるためのプログラムであって、
    前記位置取得手段は、前記所定の筆記位置の3次元座標を順次取得し、そのうち少なくとも3つにより定まる平面に対する投影位置を示す2次元座標を順次取得する、プログラム。
  14. 複数文字のそれぞれを空中に書くジェスチャをした場合における所定の筆記位置の推移を示すテンプレートデータを記憶するテンプレートデータ記憶手段、
    ユーザが空中に文字を順に書くジェスチャをする場合に、前記所定の筆記位置を順次取得する位置取得手段、
    前記位置取得手段により前記所定の筆記位置が取得されるごとに、新しく取得されたものから順に所定数の前記所定の筆記位置からなる評価対象データと、前記各文字に係るテンプレートデータと、の類似度を示す類似度評価情報を順次出力する類似度評価情報出力手段、
    順次出力される前記各文字に係る前記類似度評価情報に基づいて、何らかの文字が検出され、どの文字も検出されなくなるまでの期間である、文字判定期間を決定する期間決定手段、及び
    所定基準を満たす前記類似度評価情報が前記文字判定期間内に出力される複数の文字のうち、それらの文字の検出パターンに応じて、1以上を前記ユーザのジェスチャに係る文字列に含まれる文字として決定する文字列決定手段
    としてコンピュータを機能させるためのプログラム。
  15. 請求項11乃至14のいずれかに記載のプログラムを格納したコンピュータ可読情報記憶媒体。
JP2014539803A 2012-10-03 2013-10-03 ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体 Active JP5897725B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261709199P 2012-10-03 2012-10-03
US61/709,199 2012-10-03
PCT/JP2013/076901 WO2014054716A1 (ja) 2012-10-03 2013-10-03 ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体

Publications (2)

Publication Number Publication Date
JP5897725B2 true JP5897725B2 (ja) 2016-03-30
JPWO2014054716A1 JPWO2014054716A1 (ja) 2016-08-25

Family

ID=50435036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014539803A Active JP5897725B2 (ja) 2012-10-03 2013-10-03 ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体

Country Status (3)

Country Link
US (1) US10591998B2 (ja)
JP (1) JP5897725B2 (ja)
WO (1) WO2014054716A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160022832A (ko) * 2013-06-25 2016-03-02 톰슨 라이센싱 문자 입력을 위한 방법 및 디바이스
US10796669B2 (en) * 2014-08-27 2020-10-06 Sony Corporation Method and apparatus to control an augmented reality head-mounted display
CN105302298B (zh) * 2015-09-17 2017-05-31 深圳市国华识别科技开发有限公司 空中书写断笔***和方法
US10627910B2 (en) * 2017-02-21 2020-04-21 Adobe Inc. Stroke operation prediction for three-dimensional digital content
US10657682B2 (en) 2017-04-12 2020-05-19 Adobe Inc. Drawing curves in space guided by 3-D objects
JP2019061590A (ja) * 2017-09-28 2019-04-18 富士ゼロックス株式会社 情報処理装置、情報処理システム及びプログラム
US11720222B2 (en) * 2017-11-17 2023-08-08 International Business Machines Corporation 3D interaction input for text in augmented reality
CN109614414B (zh) * 2018-09-11 2023-05-23 创新先进技术有限公司 一种用户信息的确定方法及装置
US10877568B2 (en) * 2018-12-19 2020-12-29 Arizona Board Of Regents On Behalf Of Arizona State University Three-dimensional in-the-air finger motion based user login framework for gesture interface
US10739864B2 (en) * 2018-12-31 2020-08-11 International Business Machines Corporation Air writing to speech system using gesture and wrist angle orientation for synthesized speech modulation
US11126885B2 (en) * 2019-03-21 2021-09-21 Infineon Technologies Ag Character recognition in air-writing based on network of radars
JP6698908B1 (ja) * 2019-04-08 2020-05-27 三菱電機株式会社 手書き文字認識装置および手書き文字認識方法
WO2020252918A1 (zh) * 2019-06-20 2020-12-24 平安科技(深圳)有限公司 基于人体的姿态识别方法、装置、设备及存储介质
US11948237B2 (en) * 2021-12-30 2024-04-02 Samsung Electronics Co., Ltd. System and method for mimicking user handwriting or other user input using an avatar

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110041100A1 (en) * 2006-11-09 2011-02-17 Marc Boillot Method and Device for Touchless Signing and Recognition
WO2011024282A1 (ja) * 2009-08-27 2011-03-03 株式会社 東芝 情報検索装置
JP2011258130A (ja) * 2010-06-11 2011-12-22 Namco Bandai Games Inc プログラム、情報記憶媒体及び画像生成システム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS584424A (ja) 1981-07-01 1983-01-11 Toshiba Corp 日本語入力装置
JPH08211979A (ja) * 1995-02-02 1996-08-20 Canon Inc 手振り入力装置及び方法
JP3974359B2 (ja) * 2000-10-31 2007-09-12 株式会社東芝 オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム
JP2002259046A (ja) * 2001-02-28 2002-09-13 Tomoya Sonoda 空中で手描きした文字・記号入力システム
US7667686B2 (en) * 2006-02-01 2010-02-23 Memsic, Inc. Air-writing and motion sensing input for portable devices
US8060841B2 (en) 2007-03-19 2011-11-15 Navisense Method and device for touchless media searching
US8726194B2 (en) 2007-07-27 2014-05-13 Qualcomm Incorporated Item selection using enhanced control
US8908973B2 (en) * 2008-03-04 2014-12-09 Apple Inc. Handwritten character recognition interface
JP4221445B1 (ja) 2008-06-11 2009-02-12 株式会社ベイビッグ テレビ電話端末、テレビ電話端末制御方法及びプログラム
US8514251B2 (en) * 2008-06-23 2013-08-20 Qualcomm Incorporated Enhanced character input using recognized gestures
US8402391B1 (en) 2008-09-25 2013-03-19 Apple, Inc. Collaboration system
TW201015382A (en) * 2008-10-09 2010-04-16 Univ Nat Chiao Tung Virtual input system and method
US8773355B2 (en) 2009-03-16 2014-07-08 Microsoft Corporation Adaptive cursor sizing
US8549432B2 (en) 2009-05-29 2013-10-01 Apple Inc. Radial menus
JP5547466B2 (ja) 2009-12-15 2014-07-16 京セラ株式会社 携帯電子機器及び携帯電子機器の制御方法
JP2011253292A (ja) 2010-06-01 2011-12-15 Sony Corp 情報処理装置および方法、並びにプログラム
US20120038652A1 (en) * 2010-08-12 2012-02-16 Palm, Inc. Accepting motion-based character input on mobile computing devices
US9292093B2 (en) * 2010-11-18 2016-03-22 Alpine Electronics, Inc. Interface method and apparatus for inputting information with air finger gesture
JP5604279B2 (ja) * 2010-12-08 2014-10-08 日本システムウエア株式会社 ジェスチャー認識装置、方法、プログラム、および該プログラムを格納したコンピュータ可読媒体
US8311973B1 (en) 2011-09-24 2012-11-13 Zadeh Lotfi A Methods and systems for applications for Z-numbers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110041100A1 (en) * 2006-11-09 2011-02-17 Marc Boillot Method and Device for Touchless Signing and Recognition
WO2011024282A1 (ja) * 2009-08-27 2011-03-03 株式会社 東芝 情報検索装置
JP2011258130A (ja) * 2010-06-11 2011-12-22 Namco Bandai Games Inc プログラム、情報記憶媒体及び画像生成システム

Also Published As

Publication number Publication date
WO2014054716A1 (ja) 2014-04-10
US20160147307A1 (en) 2016-05-26
US10591998B2 (en) 2020-03-17
JPWO2014054716A1 (ja) 2016-08-25

Similar Documents

Publication Publication Date Title
JP5897725B2 (ja) ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体
JP5208267B2 (ja) 入力装置
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
US20150278167A1 (en) Automatic measure of visual similarity between fonts
CN114365075B (zh) 用于选择图形对象的方法和对应装置
JP2008250374A (ja) 筆跡判定装置、方法およびプログラム
JP6355823B2 (ja) 入力表示制御装置、入力表示制御方法及び入力表示システム
WO2017114002A1 (zh) 一维手写文字输入设备和一维手写文字输入方法
JP5897726B2 (ja) ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体
JP2019508770A (ja) デジタルインクを美しくするためのシステム及び方法
Plouffe et al. Natural human-computer interaction using static and dynamic hand gestures
JP6055065B1 (ja) 文字認識プログラム、文字認識装置
JP5774235B2 (ja) ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体
TWI303783B (en) Method and device for recognition of a handwritten pattern, and computer program product
K Jabde et al. A Comprehensive Literature Review on Air-written Online Handwritten Recognition
US20160202899A1 (en) Handwritten music sign recognition device and program
JP2021009552A (ja) 情報処理装置、情報処理方法およびプログラム
US20210264681A1 (en) Input display control device, input display control method, and input display system
KR102677199B1 (ko) 그래픽 객체를 선택하기 위한 방법 및 대응하는 디바이스
JP7095450B2 (ja) 情報処理装置、文字認識方法、および文字認識プログラム
JP6448838B2 (ja) 表示制御装置、表示制御方法及びプログラム
Kurosu Human-Computer Interaction. Interaction Technologies: 20th International Conference, HCI International 2018, Las Vegas, NV, USA, July 15–20, 2018, Proceedings, Part III
JP2021149296A (ja) 現実物体に対するクラスタリングの可視化システム、可視化制御装置、可視化方法および可視化制御用プログラム
KR20030090381A (ko) 문자 인식방법 및 문자 인식장치
JP2018018366A (ja) 情報処理装置、文字入力プログラムおよび文字入力方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160223

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160302

R150 Certificate of patent or registration of utility model

Ref document number: 5897725

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250