JP2002116793A - データ入力システム及びその方法 - Google Patents

データ入力システム及びその方法

Info

Publication number
JP2002116793A
JP2002116793A JP2001218638A JP2001218638A JP2002116793A JP 2002116793 A JP2002116793 A JP 2002116793A JP 2001218638 A JP2001218638 A JP 2001218638A JP 2001218638 A JP2001218638 A JP 2001218638A JP 2002116793 A JP2002116793 A JP 2002116793A
Authority
JP
Japan
Prior art keywords
character
input
user
displayed
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001218638A
Other languages
English (en)
Other versions
JP2002116793A5 (ja
Inventor
Paul Michael Tapper
マイケル タッパー ポール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2002116793A publication Critical patent/JP2002116793A/ja
Publication of JP2002116793A5 publication Critical patent/JP2002116793A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 (修正有) 【課題】精度に制限のある認識エンジンから得られる結
果を最大限利用することが可能な効率的なユーザインタ
ーフェースを提供する。 【解決手段】文字を表す入力音声信号を受信する手段
と、受信した音声信号を処理し、記憶文字ライブラリか
らの文字を入力音声信号に割り当てるために、処理後の
入力音声信号をライブラリと比較する手段とを含む音声
起動式データ入力システムであって、割当てられた文字
候補を表示する手段と、検索可能なデータストリームと
して表示された文字を格納する手段を具備し、ユーザが
誤認識と判断し再度音声入力が繰りかえされた場合異な
る文字候補を表示し、ユーザからの入力によって正しい
文字として選択されるまで繰り返し表示、選択可能であ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ入力に関
し、特に、ごく限られた個数のキーを有する装置に関す
るが、これに限定されない。
【0002】
【従来の技術】電子装置の小型化が進むにつれ、利用可
能な空間内にフルキーボードを設けることは、ますます
困難になってきている。
【0003】このような装置の典型的な例として携帯電
話がある。別の例としては、CanonInc製造のHome-Fax(T
M)があり、この装置は名前と、名前に関連する電話番号
とを「電話帳」メモリーに記憶することができる。この
ような装置では利用可能なキーセットが限られているた
め、テキストと数字の入力は、かなり複雑な操作であ
る。
【0004】
【発明が解決しようとする課題】従って、テキスト及び
数字の入力を音声により行なうことが出来れば、キーボ
ードを持たない小型装置の多くが恩恵を受けるだろう。
しかしながら、キー操作による名前と番号との入力を音
声認識インタフェースによる入力に置き換えると、数々
の問題点が生じる。装置を小型で且つ比較的安価なもの
にしようとする場合、これらの問題点は更に顕著にな
る。
【0005】まず、これらの装置の音声品質の低さが考
えられる。これには幾つかの理由がある。言うまでもな
く、安価な装置では、コストが制限的な要素となる。ま
た、携帯電話では、バックグラウンドノイズが大きくな
る恐れがある。例えば、ユーザは列車に乗車中のことも
ある。更に、装置の使用環境が毎回異なる可能性が高
く、ノイズ特性の正確なモデリングが困難である。ハン
ズフリーマイクが使用される場合、ユーザとマイクとの
距離により、装置のバックグラウンドノイズの除去能力
が制限される可能性がある。音声インタフェースを備え
る目的は、実行頻度が比較的低いタスクの簡易化である
ので、ユーザに訓練手順を受けるように要求するのは難
しいかもしれない。別の問題点として、非特定話者のソ
リューションが要求される可能性があげられる。装置は
複数のユーザによって使用される可能性があり、この場
合、完全に話者独立型の解決法が好ましい。
【0006】安価な装置の更なる問題点は、装置の備え
る処理能力が、コスト、電池寿命の要件及び物理的寸法
などのその他の要因により制限される可能性があること
である。従って、認識アルゴリズムの一部として行われ
るであろう計算の複雑さのみならず、プログラムにより
利用可能な事前に計算済のデータの量が制限されるのと
同様に、ワーキングメモリの容量も制限される。
【0007】上述の理由により、消費者装置上で小量の
テキスト入力を行なうための音声インタフェースは、困
難な課題であり、認識精度が低い可能性が高い。
【0008】本発明の課題は、精度に制限のある認識エ
ンジンから得られる結果を最大限利用することが可能な
効率的なユーザインタフェースを提供することである。
【0009】
【課題を解決するための手段】本発明によれば、文字を
表す入力音声信号を受信する手段と、前記受信した音声
信号を処理し、記憶文字ライブラリからの文字を前記入
力音声信号に割当てるために、前記処理後の音声信号を
前記ライブラリと比較する手段と、前記割当てられた文
字を文字候補として表示する手段と、検索可能なデータ
ストリームの一部として前記表示された文字を格納する
ために、装置のユーザから入力される別の入力に応答す
る手段とを具備し、ユーザが前記表示された文字が最初
の入力音声信号に対応しないと決定する場合、選択入力
なしでユーザによる前記入力音声信号が繰り返される
と、前記処理手段及び前記表示手段が、前記記憶ライブ
ラリから前記前に表示された文字と異なる別の文字候補
を表示し、この過程は、ユーザからの選択入力により表
示文字が正しい文字として選択されるまで繰り返し可能
であることを特徴とするデータ入力システムが提供され
る。
【0010】
【発明の実施の形態】本発明を容易に理解するために、
一例として添付図面を参照することで本発明の実施例に
ついて説明する。
【0011】添付図面の図1は、1で示す主ケースと電
話の送受話器2とを有するHome-Faxシステムを示す。本
実施例では、それぞれ10個の整数を表すプッシュボタ
ンと*及び#の入力部との合計12個のボタンを有する
数値キーパッド3が設けられる。本体は、モード選択ス
イッチ及びON/OFFボタンなどのその他の入力部も
有する。これらの入力部は、通常4で示される。図1に
示すFAXは、例えば、100個の電話番号及びその番
号と対応付けられた名前を記憶することができる。制約
されたキーボードでの手操作入力に関して既に説明した
問題点を軽減するために、FAXは、5で示す簡易マイ
ク及び6で示す液晶英数字ディスプレイを含む。
【0012】この装置では音声認識アルゴリズムを使用
する。
【0013】ユーザは、音声入力の受付け可能な状態へ
と装置を適切に切替えた後、FAXメモリに入力する英
字、音節又は数字を発音する。以下、このような入力の
ことを文字と呼ぶ。音声認識インタフェースは、音声入
力を分析し、その音声入力に応じて文字候補を表示す
る。現在行われている入力は、最新の結果を表すものと
してディスプレイ6上に強調表示される。これにより、
現在の入力は、表示されるその他の文字と区別される。
この処理は、複数の適切な方法のうちのいずれか1つに
おいて行なうことができる。例えば、文字候補は、下側
にカーソルを置いたり、点滅表示にしたり、あるいは、
色を反転させたりして表示することができる。言うまで
もなく、この他の強調表示方法も使用可能である。
【0014】表示結果が誤っている場合、ユーザは元の
数字を繰り返すだけである。そうすれば、音声認識イン
タフェースは表示を更新する。前回の表示結果が誤りで
あったという事前の知識を伴って、新しい結果が計算さ
れる。変形の一例において、入力された前の音声を利用
することも可能である。
【0015】一方、文字候補が正しいものであった場
合、又は繰り返された数字が正しく識別された場合、ユ
ーザは、その文字候補が所要の文字であることを示すた
めに、キーワードの発音、もしくは適切なキーの押圧の
いずれかを行なうことができる。文字を選択してデータ
入力が終了した場合、表示文字列を格納して後で使用で
きるように、ユーザは、別のキーワードを発音するか、
もしくはキーを再度押圧するかしてデータ入力が終了し
たことを示す。あるいは、別の英字、音節又は数字を入
力する場合は、それを発音することでユーザは処理を継
続する。
【0016】上記のステップは、一般的に、アルゴリズ
ムの動作の通常モードを表す。
【0017】これらの基本的な特徴に加え、アルゴリズ
ムは、プロセスの制御に使用可能な幾つかのその他の特
徴を含んでも良い。含まれる特徴には以下のようなもの
がある。
【0018】第1に、操作全体を取り消すためのキーワ
ード又はキー押圧。
【0019】第2に、現在の入力項目を最初から入力し
直すためのキーワード又はキー押圧。項目としては、現
在の入力語、電話番号、テキスト行などが挙げられるだ
ろう。
【0020】第3に、1つ前の文字に戻り、この文字を
再入力するためのキーワード又はキー押圧。
【0021】第4に、現在の入力文字の入力手順を再度
行なう必要があることを示すためのキーワード又はキー
押圧。この操作を行なう理由の1つとして、ユーザが誤
って所望の文字を訂正してしまった場合がある。
【0022】第5に、現在の入力文字に対して表示され
た前の結果に戻るためのキーワード又はキー押圧。これ
も、現在の入力文字を誤って新しい文字と置換した場合
に行われるだろう。
【0023】第6に、表示中の現在の入力文字を受け入
れ、データ入力が終了したことを示すためのキーワード
又はキー押圧。この手順は、2つのステップの使用より
も好ましいかもしれない。
【0024】最後に、現在の入力文字をクリアし、シス
テムを、文字を再入力することができる状態、もしくは
前の入力文字を完全な入力として受け入れることができ
る状態にしておくためのキーワード又はキー押圧。
【0025】以上の説明に関して、使用される1組のキ
ーワードは、入力される数字、音節又は英字よりも優れ
た正確さで認識され得ると考えられるだろう。これは、
キーワードが残りの語彙と十分に区別されるように、前
もって選択することができるからこそ達成することが可
能である。また、アルゴリズムは、キーワードが語彙中
のその他の語と比較して、より高い信頼度で認識される
ことを要求する場合がある。
【0026】音声認識アルゴリズムの概要の記述を行な
ってきたので、次に、添付の図面の図2を参照する。図
2は、図1の実施例で使用される音声認識インタフェー
スのブロック図である。言うまでもなく、この音声認識
インタフェースは、限られた数のキーで英数字データを
入力することが要求される携帯電話などの幅広い範囲の
その他の装置において使用することができる。
【0027】従って、図2に示す音声認識インタフェー
スは、マイク10を含む。マイク10の出力は、フィル
タリング/AD変換回路11に送られ、この回路11で
は、マイクからのアナログ信号が不要な周波数を除去す
るためにフィルタリングされ、12で示す中央処理装置
で処理を行なうためにデジタル形式へと変換される。音
声認識に有用な情報の大部分は、300Hzから4KH
zの間の周波数帯域に含まれる。従って、回路11のフ
ィルタリング部は、この周波数帯域の範囲外の全ての周
波数を除去する。音声認識に有用な情報は、フィルタに
よりフィルタリングされないので、認識性能の損失はな
い。更に、いくつかの環境、例えば自動車の環境におい
ては、バックグラウンドノイズの大部分は、300Hz
未満であり、フィルタリングが、約10dB以上のSN
比の効率的な増加につながることもある。続いてフィル
タリング済の音声信号は、回路11のA/D要素により
16ビットのデジタルサンプルに変換される。ナイキス
ト標本抽出基準を固守するために、回路は、毎秒800
0回の速度でフィルタリング済の信号をサンプリングす
る。
【0028】中央処理装置12において、デジタル化さ
れた音声は、特徴抽出回路13により特徴抽出される。
入力音声データから特徴を抽出し、抽出した特徴を使用
してテンプレートと照合する概念はよく知られており、
抽出される特徴の数及び関係する詳細の度合いは、計算
能力及び利用可能なメモリ空間によって決まる。基本的
に、特徴抽出回路13の機能は、必要とされる情報を入
力音声から抽出し、認識エンジン14で処理すべきデー
タ量を削減することである。入力信号から抽出可能な情
報には様々な種類のものがある。本実施例において、特
徴抽出回路13は、「フォルマント」関連の情報を抽出
するように設計されている。フォルマントは、ユーザの
声道の共振周波数として定義されており、声道の形状の
変化に伴って変化する。
【0029】抽出された特徴は、インタフェースメモリ
16の一部をなすバッファ15に格納される。また、メ
モリ16は、アドレッシングレジュメによりコンパート
メント化された単一のメモリチップであっても良いし、
複数の独立メモリチップで構成されても良い。
【0030】また、メモリ16は、アクティブワードモ
デルのリストを含むメモリ領域17を含む。従って、こ
のリストは、音声認識インタフェースによって認識され
る英数字、記号又は数字のみならず、全てのキーワード
を含む。最後に、メモリ16は、ノイズのレベルとノイ
ズのスペクトル特性を表すデータを格納する格納領域1
8をも含む。このデータは、バックグラウンドノイズの
典型を示す。3つのメモリ領域15、17及び18の出
力の全てが、認識エンジン14に接続される。
【0031】その必要条件が特別であるため、本実施例
の語彙が比較的少ないことは理解されるだろう。例え
ば、英語では、10個の数字と26個の文字がある。こ
れらの文字は、選択されたキーワードで補う必要がある
だろう。日本語の場合、文字と数字が110個近く必要
である。
【0032】音声認識インタフェースには特徴抽出部が
あるので、抽出された特徴とアクティブワードモデルの
リストとを比較する際の認識エンジンの動作は、完全な
従来型である。
【0033】好適な実施例において、バッファ15から
の前の音声入力例の全てが使用され、既に説明したよう
に、語彙から全ての既知の誤った結果を一時的に削除し
た新しい結果を生成する。従って、本好適な実施例で
は、ユーザによる発話が音声認識インタフェースを通る
時、語彙中の残りの各語及び各前発話に対するスコアが
生成される。最も単純な場合では、全ての入力例のうち
の語彙中に残存する各語に対するスコアが付加される。
最終的に最高のスコアになる語が、次の認識結果にな
る。スコアを組み合わせるためのより複雑な代替方法
は、中央値を取って、各語に対するワード値を廃棄し
て、残りの値を付加することなどを含む。
【0034】認識エンジン14の動作の結果は、制御ア
ルゴリズム部19に供給される。制御アルゴリズム部1
9の動作の詳細は、後続する図3A,Bの流れ図の説明
において行なう。
【0035】キーボード20が、制御アルゴリズム部に
接続され、次に、その制御アルゴリズム部が、ディスプ
レイ21と、メモリ16のバッファ領域15と、メモリ
16のアクティブワードモデル領域17のリストとに接
続される。マイク、キーボード及びディスプレイが、図
1の実施例で示されるのと同様の装置に対応することは
理解されるだろう。
【0036】次に、図3A,Bの流れ図において、この
図は、リセットステップを伴ったステップS1で開始さ
れる。このステップでは、バッファ15がクリアされ、
アクティブワードの全てがメモリ領域17中に存在する
ように、メモリ領域17中のアクティブワードモデルの
リストがリセットされる。
【0037】ステップS2では、音声入力に応じて音声
認識が実行される。既に説明したように、認識エンジン
14は、現在の入力文字に対して、全ての前の入力を利
用しても良い。ステップS3は、判定ステップであり、
認識エンジンの出力が認識された文字(以下、数字を含
む)又は認識されたキーワードであるのか、あるいは、
同等のキーボード入力が発生したのかが判定される。
【0038】文字が認識された場合、アルゴリズムは、
ステップS4に進む。ステップS4では、認識された文
字が候補としてディスプレイ上に表示される。また、説
明したことであるが、この表示された文字は、その正誤
が確定されていないので、その他の文字とは区別可能に
なっている。ステップS5において、認識されたばかり
の文字は、認識プロセスで使用中のアクティブワードモ
デルのリストから削除され、ステップS6において、そ
の文字の認識に使用されるデータが格納される。格納さ
れたデータは、生のデジタル化された音声データ又は認
識エンジンにより使用される抽出された特徴であるかも
しれない。
【0039】表示された候補が正しい場合、先に説明し
たように、ユーザは、キーワードの使用又は適切なキー
ストロークによってそれを示す。正しくない場合、ユー
ザは、その音声入力を繰り返すことによってそれを示
す。認識エンジンは、認識手順を繰り返すが、言うまで
もなく、ステップS5があるために、新しい入力音声デ
ータを廃棄した文字を用いて識別することはできない。
【0040】既に説明したように、入力文字が一旦正し
く識別されると、認識エンジンが認識対象の文字を表さ
ないキーワード又は同等のキーボード入力を認識するま
で、認識手順は、次の入力文字に対してステップS2、
S3、S4、S5及びS6を通して継続される。このよ
うな場合、流れ図のB経路が後に続く。この経路におけ
る最初の選択機能は、ステップS7であり、前に表示さ
れた結果が現在の候補結果として表示される。このステ
ップの目的は、何らかの理由でこの文字を飛ばしてしま
った場合に、ユーザが前の文字に確実に戻ることができ
るようにすることである。ユーザが、表示の文字を受け
入れる場合は、ステップS8が後に続く。このステップ
において、それまで仮のものであった文字の強調表示が
解除され、カーソルは次の文字へ移る。ステップS9
は、ユーザが適切なキーストローク又はキーワードによ
り文字のリセットを要求した場合を表す。このステップ
では、現在表示されている出力が削除される。ステップ
S10において、インタフェースは、適切なキーストロ
ーク及び適切なキーワードを介しての「1文字後退」の
コマンド入力に応答し、現在のカーソル位置の文字(文
字が存在する場合)を削除すべく動作する。インタフェ
ースは、ディスプレイ上のカーソルを1文字分後退さ
せ、また、再入力の可能性に備えて、その文字を削除す
る。ステップS11は、行再入力コマンドに応答して起
こる。このステップでは、表示されている文字列全体が
廃棄され、カーソルは、新しい文字列の入力を開始でき
るようにディスプレイの最初の文字位置へと移される。
【0041】最後の3つのステップは、認識エンジンの
動作には関係しない。ステップS12は、受入れ/終了
コマンドに応答するものであり、現在表示されている文
字を受け入れ、完成した文字列を完了入力として格納す
る。
【0042】ステップS13は、現在の入力文字以外の
全ての文字が完了入力として格納される点を除けば、ス
テップS12と同じである。最後に、S14は、取消し
処理コマンドへの応答であり、前に入力されていた文字
列全体が廃棄される。
【0043】ここで説明したシステムは、各文字を認識
しようとする逐次的な試みにおいて、前の認識の試みか
ら得られる情報の全てを利用することができるという点
で数多くの利点を有する。例えば、前の結果は、語彙か
ら取り出され、前の音声入力及び新しい入力は認識エン
ジンに送られる。非常に混同されやすいものから始まっ
て、誤った結果は徐々に削除されるので、非常に不正確
な認識エンジンをもってしても、プロセスが最終的に正
確な結果を生じることが保証される。更に、誤りを訂正
するプロセスは、ユーザが認識対象の文字を繰り返すだ
けであるので、極めて簡単である。最後に、この訂正プ
ロセスは、文字を入力する通常のプロセスの一部となっ
ているので、ユーザは、装置の不実行を感じることがな
い。
【0044】認識が良好である場合、各文字を受け付け
なければならないことによるオーバヘッドは、より重要
性を増すが、認識が良くない場合は、重要性が低いこと
は理解されるだろう。これにより、例えば、バックグラ
ウンドノイズのレベルがまちまちである場合に、認識エ
ンジンの性能において生じる差異はより目立たなくなる
であろう。
【図面の簡単な説明】
【図1】卓上FAXシステムの斜視図である。
【図2】装置の音声認識サブシステムのブロック図であ
る。
【図3A】図2に示すブロック図の操作の基本ステップ
を説明する流れ図である。
【図3B】図2に示すブロック図の操作の基本ステップ
を説明する流れ図である。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 3/00 551A

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 文字を表す入力音声信号を受信する手段
    と、 前記受信した入力音声信号を処理し、記憶文字ライブラ
    リからの文字を前記入力音声信号に割当てるために、前
    記処理後の入力音声信号を前記ライブラリと比較する手
    段と、 前記割当てられた文字を文字候補として表示する手段
    と、 検索可能なデータストリームの一部として前記表示され
    た文字を格納するために、ユーザから入力される別の入
    力に応答する手段とを具備し、 前記表示された文字が前記最初の入力音声信号に対応し
    ないとユーザが決定する場合に、選択入力なしでユーザ
    による前記入力音声信号が繰り返されると、前記処理手
    段及び前記表示手段が、前記記憶ライブラリから前記前
    に表示された文字と異なる別の文字候補を表示し、この
    過程は、ユーザからの選択入力により表示文字が正しい
    文字として選択されるまで繰り返し可能であることを特
    徴とするデータ入力システム。
  2. 【請求項2】 表示された文字に対する選択入力がない
    場合のユーザからの別の入力に対する応答として、前記
    記憶ライブラリから得られる選択肢の中から表示に続け
    て前記選択入力が行われなかったその文字を削除するよ
    うに、前記処理手段及び表示手段が構成されることを特
    徴とする請求項1に記載のシステム。
  3. 【請求項3】 表示された文字に応答して選択入力が1
    度行われた場合、前記記憶ライブラリからの選択が禁止
    されていたいずれの文字も再度選択可能になることを特
    徴とする請求項2に記載のシステム。
  4. 【請求項4】 ユーザが少なくとも1つの前の文字を格
    納するために既に選択していた場合、文字候補が前記既
    に選択された文字とは区別されるように表示されること
    を特徴とする請求項1又は3に記載のシステム。
  5. 【請求項5】 文字が選択されていない場合、前記ライ
    ブラリから新しい文字を前記音声入力に割当てるため
    に、前記繰り返される音声入力のみならず前記非選択文
    字候補に対する音声入力も利用するように、前記処理手
    段が構成されることを特徴とする請求項1乃至4のいず
    れか1項に記載のシステム。
  6. 【請求項6】 前記ライブラリは、複数の英数字を格納
    するように構成されることを特徴とする請求項1乃至5
    のいずれか1項に記載のシステム。
  7. 【請求項7】 文字候補は、特定キーワードの発話によ
    り選択されることを特徴とする請求項1乃至6のいずれ
    か1項に記載のシステム。
  8. 【請求項8】 前記キーワードの認識に対する信頼レベ
    ルが、文字の割当てのための文字認識に必要とされる信
    頼レベルより高いことを特徴とする請求項7に記載のシ
    ステム。
  9. 【請求項9】 文字候補は、キーストロークにより選択
    可能であることを特徴とする請求項1乃至6のいずれか
    1項に記載のシステム。
  10. 【請求項10】 文字候補は、キーワード又はキースト
    ロークのいずれかにより選択可能であることを特徴とす
    る請求項1乃至9のいずれか1項に記載のシステム。
  11. 【請求項11】 文字を表す入力音声信号を受信する手
    段と、 前記受信した入力音声信号を記憶ライブラリと比較する
    手段と、 前記比較結果に基づいて文字候補を表示する手段と、 ユーザから入力される別の入力に応答する手段とを具備
    し、 前記文字候補を表示した状態で、ユーザによる前記入力
    音声信号が繰り返し入力された場合、該文字候補と異な
    る別の文字候補を表示し、この過程は、ユーザからの選
    択入力により表示文字が正しい文字として選択されるま
    で繰り返し可能であることを特徴とするデータ入力シス
    テム。
  12. 【請求項12】 文字を表す入力音声信号を受信する工
    程と、 前記受信した入力音声信号を処理し、記憶文字ライブラ
    リからの文字を前記入力音声信号に割当てるために、前
    記処理後の入力音声信号を前記ライブラリと比較する工
    程と、 前記割当てられた文字を文字候補として表示する工程
    と、 検索可能なデータストリームの一部として前記表示され
    た文字を格納するために、ユーザから入力される別の入
    力に応答する工程とを具備し、 前記表示された文字が前記最初の入力音声信号に対応し
    ないとユーザが決定する場合に、選択入力なしでユーザ
    による前記入力音声信号が繰り返されると、前記処理工
    程及び前記表示工程で、前記記憶ライブラリから前記前
    に表示された文字と異なる別の文字候補を表示し、この
    過程は、ユーザからの選択入力により表示文字が正しい
    文字として選択されるまで繰り返し可能であることを特
    徴とするデータ入力方法。
  13. 【請求項13】 文字を表す入力音声信号を受信する工
    程と、 前記受信した入力音声信号を記憶ライブラリと比較する
    工程と、 前記比較結果に基づいて文字候補を表示する工程と、 ユーザから入力される別の入力に応答する工程とを具備
    し、 前記文字候補を表示した状態で、ユーザによる前記入力
    音声信号が繰り返し入力された場合、該文字候補と異な
    る別の文字候補を表示し、この過程は、ユーザからの選
    択入力により表示文字が正しい文字として選択されるま
    で繰り返し可能であることを特徴とするデータ入力方
    法。
  14. 【請求項14】 請求項12又は13に記載のデータ入
    力方法を実行するプログラムを格納し、コンピュータが
    読み取り可能な記憶媒体。
JP2001218638A 2000-07-20 2001-07-18 データ入力システム及びその方法 Pending JP2002116793A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0017887.1 2000-07-20
GB0017887A GB2365188B (en) 2000-07-20 2000-07-20 Method for entering characters

Publications (2)

Publication Number Publication Date
JP2002116793A true JP2002116793A (ja) 2002-04-19
JP2002116793A5 JP2002116793A5 (ja) 2008-08-14

Family

ID=9896059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001218638A Pending JP2002116793A (ja) 2000-07-20 2001-07-18 データ入力システム及びその方法

Country Status (3)

Country Link
US (1) US7035800B2 (ja)
JP (1) JP2002116793A (ja)
GB (1) GB2365188B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113470638A (zh) * 2021-05-28 2021-10-01 荣耀终端有限公司 槽位填充的方法、芯片、电子设备和可读存储介质

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7263483B2 (en) * 2003-04-28 2007-08-28 Dictaphone Corporation USB dictation device
DE10337822A1 (de) * 2003-08-18 2004-03-25 Siemens Ag Sprachunterstützte Texteingabe bei vorinstallierten Anwendungen auf mobilen Geräten
US20050049858A1 (en) * 2003-08-25 2005-03-03 Bellsouth Intellectual Property Corporation Methods and systems for improving alphabetic speech recognition accuracy
KR100554442B1 (ko) * 2003-10-06 2006-02-22 주식회사 팬택앤큐리텔 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법
US7363224B2 (en) * 2003-12-30 2008-04-22 Microsoft Corporation Method for entering text
US20050240406A1 (en) * 2004-04-21 2005-10-27 David Carroll Speech recognition computing device display with highlighted text
US7895039B2 (en) * 2005-02-04 2011-02-22 Vocollect, Inc. Methods and systems for optimizing model adaptation for a speech recognition system
US7827032B2 (en) 2005-02-04 2010-11-02 Vocollect, Inc. Methods and systems for adapting a model for a speech recognition system
US8200495B2 (en) 2005-02-04 2012-06-12 Vocollect, Inc. Methods and systems for considering information about an expected response when performing speech recognition
US7865362B2 (en) 2005-02-04 2011-01-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US7949533B2 (en) 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US20070180384A1 (en) * 2005-02-23 2007-08-02 Demetrio Aiello Method for selecting a list item and information or entertainment system, especially for motor vehicles
TW200733059A (en) * 2006-02-17 2007-09-01 Inventec Appliances Corp Method of using voice recognition measure to input characters and its hand-held apparatus
ES2386673T3 (es) * 2008-07-03 2012-08-24 Mobiter Dicta Oy Procedimiento y dispositivo de conversión de voz
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US9093075B2 (en) 2012-04-20 2015-07-28 Google Technology Holdings LLC Recognizing repeated speech in a mobile computing device
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US10714121B2 (en) 2016-07-27 2020-07-14 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH644246B (fr) * 1981-05-15 1900-01-01 Asulab Sa Dispositif d'introduction de mots a commande par la parole.
US4914704A (en) * 1984-10-30 1990-04-03 International Business Machines Corporation Text editor for speech input
US4837842A (en) * 1986-09-19 1989-06-06 Holt Arthur W Character and pattern recognition machine and method
US5208897A (en) * 1990-08-21 1993-05-04 Emerson & Stern Associates, Inc. Method and apparatus for speech recognition based on subsyllable spellings
US5210689A (en) * 1990-12-28 1993-05-11 Semantic Compaction Systems System and method for automatically selecting among a plurality of input modes
TW268115B (ja) * 1991-10-14 1996-01-11 Omron Tateisi Electronics Co
JP3131287B2 (ja) * 1992-05-27 2001-01-31 株式会社日立製作所 パターン認識装置
JP2817776B2 (ja) * 1995-05-25 1998-10-30 日本電気株式会社 単語変換装置
US6104381A (en) * 1995-12-28 2000-08-15 King Jim Co., Ltd. Character input apparatus
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
US5857099A (en) * 1996-09-27 1999-01-05 Allvoice Computing Plc Speech-to-text dictation system with audio message capability
US5781887A (en) * 1996-10-09 1998-07-14 Lucent Technologies Inc. Speech recognition method with error reset commands
US6169789B1 (en) * 1996-12-16 2001-01-02 Sanjay K. Rao Intelligent keyboard system
JPH1115914A (ja) * 1997-06-09 1999-01-22 Internatl Business Mach Corp <Ibm> 文字データ入力装置およびその方法
US6223158B1 (en) * 1998-02-04 2001-04-24 At&T Corporation Statistical option generator for alpha-numeric pre-database speech recognition correction
US6205261B1 (en) * 1998-02-05 2001-03-20 At&T Corp. Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6438523B1 (en) * 1998-05-20 2002-08-20 John A. Oberteuffer Processing handwritten and hand-drawn input and speech input
US6782131B2 (en) * 1999-12-29 2004-08-24 Honeywell International Inc. System, method and apparatus for pattern recognition with application to symbol recognition and regeneration for a display

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113470638A (zh) * 2021-05-28 2021-10-01 荣耀终端有限公司 槽位填充的方法、芯片、电子设备和可读存储介质

Also Published As

Publication number Publication date
GB2365188B (en) 2004-10-20
GB2365188A (en) 2002-02-13
GB0017887D0 (en) 2000-09-06
US20020026312A1 (en) 2002-02-28
US7035800B2 (en) 2006-04-25

Similar Documents

Publication Publication Date Title
JP5048174B2 (ja) ユーザの発話を認識するための方法及び装置
JP4468264B2 (ja) 多言語による名称の音声認識のための方法とシステム
JP2002116793A (ja) データ入力システム及びその方法
US8606582B2 (en) Multimodal disambiguation of speech recognition
RU2379767C2 (ru) Коррекция ошибок для систем распознавания речи
CA2567958C (en) Multimodal disambiguation of speech recognition
KR101109265B1 (ko) 텍스트 입력 방법
JP2011254553A (ja) 小型キーパッド用日本語入力メカニズム
JP2006031092A (ja) 音声文字入力プログラム及び携帯端末装置
WO2001003123A1 (en) Multimodal data input device
JP4230142B2 (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
JP2004170466A (ja) 音声認識方法と電子装置
EP1617635A2 (en) Speech recognition by a portable terminal for voice dialing
JP2002189490A (ja) ピンイン音声入力の方法
JP2002073081A (ja) 音声認識方法と電子装置
JP2024082673A (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
JPH11338493A (ja) 情報処理装置および方法、並びに提供媒体
CN111857362A (zh) 文字输入方法及文字输入装置
KR20050051239A (ko) 이동통신 단말기에서의 음성에 의한 키명령어 입력 방법
JP2001067097A (ja) 文書作成装置および文書作成方法
JP2001249687A (ja) ディクテーション方法、ディクテーションシステム及び携帯端末装置
JP2000010588A (ja) 音声認識方法及び装置
JPH11352991A (ja) 音声認識装置
JP2000250582A (ja) 音声認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101029

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110304