JP4502567B2

JP4502567B2 - 音声認識装置の訓練又は適応を行う方法

Info

Publication number: JP4502567B2
Application number: JP2002136073A
Authority: JP
Inventors: シュタインビスフォルカー; アイゼレトーマス
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2001-05-11
Filing date: 2002-05-10
Publication date: 2010-07-14
Anticipated expiration: 2022-05-10
Also published as: US7050550B2; ATE354156T1; CN1220176C; DE10122828A1; JP2003044081A; DE50209455D1; CN1391210A; EP1256936B1; EP1256936A3; US20030012347A1; EP1256936A2

Description

【０００１】
【発明の属する技術分野】
本発明は、電化製品の機能に作用するよう使用される音声認識装置を訓練する又は適応させる方法に関する。
【０００２】
【従来の技術】
具体的には、電化製品は移動電話機であり、音声ダイアルを実行することにより、デバイスの機能に作用し、音声入力によって別の加入者にダイアルされる。自動車に使用される場合は、ハンズフリーセットが一般的に設けられてユーザをアシストし、ユーザの操作の快適性は、別の加入者へのダイアリングをトリガするのにキーパッド入力を行う必要がなくなるので、改善される。本発明の他に適用可能な分野には、テレビ受像機、ビデオレコーダ、ハイファイ音楽システム、台所電化製品、又は、音声制御を有する他の電化製品といった電子消費者電化製品の制御が含まれ、音声が、例えば、音量制御、テレビのチャンネル又はラジオ局の選択、又は、台所電化製品のモータ速度の調節といった様々な電化製品の機能に作用する。
【０００３】
音声認識装置は、訓練及び／又は適応されることが可能であり、音響モデルと関連付けられるパラメータが新しい単語、ユーザ、必要である場合は、周囲の雑音又は当該のマイクロホンの位置に適応される。本願では、音響モデルによって表される音声認識装置の語彙を含む音声認識装置の用語集に新しいエントリが追加されるか、又は、現行の語彙エントリが適応される。隠れマルコフ・モデル（ＨＨＭ）を使用する音声認識装置では、隠れマルコフ・モデルの遷移確率と出力分布は調節される。
【０００４】
音声認識装置は、訓練時に、装置をまだ操作したことのないユーザの音声入力に適応される。これは、音声認識装置をユーザが初めて利用する前に行われるか、まだ作動されていない音声入力を初めて使用した後にも行うことが可能である。更に、古い音声データを使用して、再訓練を行うことも可能である。訓練を実行するための様々な方法が既知であり、例えば、固定ＨＭＭトポロジーでは分布の混合の推定が行われ、或いは、ＨＭＭ状態の数の変更又は切替えが行われる。
【０００５】
音声認識装置の１つの適応において、音声認識装置の所定のパラメータが適応且つ最適化されるが、これらのパラメータは、ユーザによって行われる訓練において予め決められるか、又は、適切である場合、既に行われた適応処理に基づいて予め決められる。しかし、パラメータは、ユーザとは関係なく予め決められることも可能である。ユーザに対し音響適応する際に、システムは、収集されたユーザに特有の音声データによって改善される。即ち、誤差率は適応する過程において小さくなる。多数の適応方法が既知である。例えば、ＭＡＸ（最大事後（maximum a posteriori））、ＭＬＬＲ（最尤線形回帰）、及び、自分の音声（この方法は、現在、複雑に構造化されるシステムにのみ使用される）がある。また、音響適応以外の適用の形も可能であり、従って、例えば、使用頻度の統計をとることにより（例えば、どのくらいの頻度でコマンド又は電話番号が話されたか、そして、どのような組合せでそれらのコマンド又は電話番号が話されたかを評価することにより）システムの性能及びデータの解析を改善することができる。
【０００６】
ＵＳ５，８０５，６７２は、音声認識装置を有する補助装置によって、自動車における移動電話機装置に音声ダイアル機能を与えることを開示する。自動車で使用される場合は、ハンズフリーセットを使用する。音声ダイアルが必要なときは、最初に音声ダイアルモードを作動させなくてはならない。補助装置は次に、音声認識装置によって音声入力のうちの学習した単語を認識し、関連の電話番号を認識した単語に割当て、関連の加入者が自動的にダイアルされる。訓練モードが設けられており、このモードが作動している間に、音声認識装置は訓練される。訓練モードは、キーを押すことにより作動する。訓練時には、ユーザは、名前を２回言い、関連付けられる電話番号を入力するよう要求される。次に、ユーザは確認キーを押し、その後に、システムは音声認識結果（認識された名前）と関連付けられる電話番号を、音声出力によりユーザに出力する。その後、ユーザは、別の名前での訓練を続けることができる。
【０００７】
ＷＯ００／１４７２９は、音声認識装置と音声ダイアル機能を有する移動電話機装置を開示する。ここでも、スイッチを動作することにより作動する訓練モードが設けられる。訓練モード時に、従来の訓練動作が行われ、音声認識装置の語彙は、新しいワードを入力することにより拡充される。
【０００８】
【発明が解決しようとする課題】
本発明は、ユーザの快適性を高める音声認識装置の訓練及び／又は適応方法を設計することを目的とする。
【０００９】
【課題を解決するための手段】
上記目的は、以下の段階を有する本発明の方法によって達成される。
【００１０】
本発明の方法は、音声入力を実行する段階と、音声認識装置によって音声入力を処理し、音声認識結果を生成する段階と、音声認識結果が、電化製品の機能に割当てられると、電化製品の割当て可能な機能を作動させる段階と、電化製品の割当て可能な機能の作動に対しユーザが拒絶を表す入力を行わない場合、音声入力に関連付けられる音声認識結果に基づいて音声認識装置の訓練又は適応を行う段階とを含む。
【００１１】
本発明の方法による訓練及び適応は、訓練又は適応モードを作動させる必要がない。訓練又は適応のために使用前のユーザ入力の確認も必要としない。訓練及び適応のために音声入力と関連付けられる音声認識結果が適切であるか否かは、音声認識結果に基づいて、例えば、音声ダイアル処理の実行といった割当て可能な装置機能が作動され、ユーザが、例えば、装置機能を停止する（請求項２）ことにより拒絶を表す入力を与えず、音声認識結果は正確に音声入力を表し、訓練又は適応に使用できるとみなされるという事実により確立される。ユーザは、音声又はキーパッド入力を介しても拒絶を表すことができる。
【００１２】
請求項３は、音声認識結果が訓練及び適応に使用される前の追加のセキュリティ手段に関する。このセキュリティ手段が設けられることにより、音声認識結果が音声入力を正確に表さないにも関わらず、ユーザが拒絶を示さないとき、この音声認識結果に基づいての訓練動作又は適応は行われない。このセキュリティ手段は、音声認識結果が不十分であるにも関わらず、単にユーザが何かに関心をそがれて拒絶を表さなかったという場合に対する保護を与え、従って、目的の装置機能も作動しない。
【００１３】
請求項４は、請求項３に記載するセキュリティ手段が、不十分な信頼度に基づいて訓練又は適応を阻止する場合に関する。音声入力の直後に、別の入力方法、例えば、キーパッド入力によって入力が行われると、前の音声入力と別の入力方法によるエントリが一致する可能性が高い。この一致を評価するために、音声入力と別の入力方法による後続の入力が一致しない場合を検出することを観点に、信頼度が確立される。この信頼度が所定のターゲット範囲内にある場合に、音声認識結果と、別の入力方法による入力を考慮しながら訓練又は適応が行われる。
【００１４】
請求項４と同様に、請求項５では、音声入力は、最初は訓練又は適応に好適ではないと考えられるが、別の入力方法によって次の入力が行われると、別の入力方法による入力と、前の音声入力は一致する可能性が高くなる。請求項４とは対照的に、請求項５では、ユーザは、音声入力の後に拒絶を表す入力を行い、その結果、訓練又は適応は最初に行われない場合を組込む。ここでも、別の入力方法による入力に続く訓練及び適応の前に、音声入力と別の入力方法による後続の入力が一致しない場合を検出する観点から信頼度を使用して評価が行われる。
【００１５】
請求項６に示す実施例では、各音声認識結果に対し少なくとも１つの代替となる音声認識結果が生成される。最近の音声入力及び関連の音声認識結果に基づいて訓練動作及び適応が行われ、前回の音声入力では訓練又は適応が行われなかった場合、音声認識結果が、前回の音声入力に対する代替の音声認識結果の最近の音声入力に対応するか否かが確認される。対応する場合、前回の音声入力と最近の音声入力とは互いに対応するとみなされる。後続の追加の訓練動作又は後続の追加の適応では、音声認識装置のパラメータは、前回の音声入力と最近の音声入力は、新しい入力動作において正しい音声認識結果となるよう設定される。即ち、最近の音声入力に対し判断された音声認識結果となるよう設定される。
【００１６】
請求項７に記載する実施例では、ユーザに、音声認識結果が音響的又は視覚的に伝えられる。従って、音声認識結果の精度を評価するには、ユーザは単に装置機能が実行したことを認識するだけではない。ユーザが、装置機能が実行したことを認識することができない場合は、ユーザは追加の情報を必要とする。さもなければ、ユーザには音声認識装置によって生成される音声認識結果に関し与えられる情報は不十分となる。
【００１７】
請求項８及び請求項９は、本発明を移動電話機に適用した場合に関する。ここでは、音声認識装置は、音声ダイアリングのために特に使用される。
【００１８】
請求項１０は、本発明の方法を実行する電化製品に関する。請求項１１では、電化製品は、移動電話機端末の形をとる。
【００１９】
【発明の実施の形態】
本発明を、図面に示す実施例を参照しながら詳細に説明するが、本発明は実施例に制限されるものではない。
【００２０】
図１は、移動電話機端末として形成される電化製品１を示し、この製品１は、第１に、音声符号化／復号化及びハンズフリー信号処理（機能ブロック３に組込む）のためにアセンブルされ、第２に、音声認識装置（機能ブロック４）の音声認識手順の実行のためにアセンブルされるデジタル信号プロセッサ２を有する。移動電話機端末１は、マイクロホン５及びスピーカ６を有し、これらは、アナログ／デジタル変換器７及び８を介し、デジタル信号プロセッサ２に接続される。移動電話機端末１は更に、移動電話機端末１の機能を中央制御するマイクロコントローラ９を含む。更に、記憶装置１０が設けられ、音声認識装置４の用語集１１と他のデータ１２を記憶する。他のデータは、本発明において必要不可欠ではないので、簡潔となるよう組み合わされて機能ブロック１２に示す。用語集１１は、隠れマルコフ・モデルとして形成される音響モデルの形の音声認識装置４の語彙を含む。用語集１１は、音声認識装置４の一部と考えなくてはならない。移動電話機端末１は更に、キーパッド入力ユニット１３及びディスプレイユニット１４を含む。アンテナ１５を介して高周波信号を送受し、この信号は送受信器ユニット１６により処理される。チャネル符号化／復号化ユニット１７を使用して、送信されるべき信号のチャネル符号化又は受信した信号のチャネル復号化を行う。バスシステム１８が、デジタル信号プロセッサ２、マイクロコントローラ９、記憶装置１０、キーパッド入力ユニット１３、ディスプレイユニット１４、及び、チャネル符号化／復号化ユニット１７を相互に接続する。
【００２１】
音声認識装置４を使用することにより、マイクロホン５を介し与えられた音声入力が、移動電話機端末１の機能に作用する。上記実施例では、音声入力によって、別の加入者へのダイアリングがトリガされる（音声ダイアリング）。この過程において、ユーザは、その電話をかける別の加入者の電話番号か、又は、その別の加入者の名前を言い、後者の名前を言う場合、その名前に対し、関連付けられる電話番号が事前に割当てられていなければならない。割当てには、音声入力のみ、又は、キーパッド入力ユニット１３を介してのキーパッド入力のみ、或いは、キーパッド入力と音声入力の両方を使用することができる。音声認識装置４の滑らかな作動を確保するには、音声認識装置４を訓練する必要があり、即ち、関心の適用に適応され用語集１１に格納される語彙が確立されなければならない。更に、音声認識装置を別の適用条件において適応させることを考慮し、既に訓練された音声認識装置４の音響モデルを後から適応させることも可能である。
【００２２】
図２乃至図５は音声認識装置４の訓練及び適応のための様々な実施例を示す。
【００２３】
図２に示す配置では、ステップ２００において、例えば、当該の作動ボタンを押すことにより音声入力モードが作動される。ステップ２０１において、ユーザは、電話をかける相手である別の加入者の名前を音声入力として入力する。ステップ２０２において、音声認識装置４に支援されて、自動音声認識動作が行われ、音声認識結果が生成される。ステップ２０３において、この音声認識結果は、例えば、ディスプレイユニット１４を介し視覚的な出力として又はスピーカ６を介し音響的な出力として、ユーザに出力される。電話番号が既に、認識された名前に割当てられているものとすると、ステップ２０４では、その電話番号が自動的にダイアルされる。ステップ２０５において、自動ダイアリングが、ユーザによって（例えば、音声認識結果が間違っており、その結果を拒絶するために特定のボタンを押すか又は「止める」といった音声コマンドを話すことにより）中断されたか否かが問合せされる。中断された場合、ステップ２００とステップ２０１との間の点に戻り、音声認識装置は更なる音声入力を受け取る準備が整う。自動ダイアリングが中断されない場合、ステップ２０５において、問合せに対し否定の応答を与え、音声認識装置４の訓練及び適応は、ステップ２０２において判断される音声認識結果に基づいて行われる。その後、ステップ２００とステップ２０１との間の点に戻り、更なる音声入力ができるようになる。
【００２４】
図３に示す実施例では、最初にステップ３００において、移動電話機端末１の音声入力モードが作動される。その後、ステップ３０１において、本実施例では、名前である音声入力が話される。ステップ３０２において音声認識動作が行われた後、ステップ３０３において、音声認識結果が、音響的又は視覚的にユーザに再生される。次に、図２において既に示したように、認識された名前を有する加入者への自動ダイアリングがトリガされる。ステップ３０５において、ユーザによって自動ダイアリングが中断されたか否かが問合せされる。中断された場合は、ステップ３００とステップ３０１との間の点に戻る。中断されたのは、ユーザが、音声認識結果が間違っていることを認識し、それを拒絶したものと思われる。自動ダイアリングが中断されない場合、ステップ３０６において、音声認識結果の信頼度の計算が行われる。ステップ３０７において、その信頼度が、所定のターゲット範囲内にあるか否か問合せされる。所定のターゲット範囲内にない場合は、ステップ３００とステップ３０１との間の点に戻る。信頼度が所定のターゲット範囲内にある場合は、音声認識結果は、実際に、音声入力を正しく表すとみなされ、ステップ３０８において、この音声認識結果に基づいて訓練動作又は適応が行われる。
【００２５】
図４に示す実施例では、最初にステップ４００において、音声入力モードが作動される。次に、ステップ４０１において、ここでは、電話をかける相手である加入者の名前である音声入力が話される。ステップ４０２において、その音声入力に関する音声認識動作が行われる。ステップ４０３において、音声認識結果がユーザに、音響的又は視覚的に出力される。ステップ４０４において、認識された名前を有する加入者の自動ダイアリングがトリガされる。ステップ４０５において、ダイアリングがユーザによって中断されたか否かが確認される。音声認識結果がユーザによって間違っていると認識され中断される場合、ステップ４００とステップ４０１との間の点に戻る。自動ダイアリングがユーザによって中断されない場合、ステップ４０６において、音声認識結果の第１の信頼度が決定される。ステップ４０７において、第１の信頼度が第１の所定のターゲット範囲内にあるか否かが問合せされる。所定のターゲット範囲内にある場合は、ステップ４０８において、音声認識結果に基づいて音声認識装置４の訓練及び適応が行われる。ステップ４０７において、第１の信頼度が第１のターゲット範囲内にない場合は、ステップ４０９において、別の入力方法、例えば、キーパッド入力を介して、後続の入力が行われたか否かが確認される。別の入力方法により後続の入力が行われていない場合、ステップ４００とステップ４０１との間の点に戻る。ステップ４０９において、音声入力の直後に、別の入力方法、即ち、特に、キーパッド入力を介して入力が行われたと確認される場合、前の音声入力と別の入力方法による後続の入力は互いに対応する可能性が高く、即ち、ユーザが音声ダイアルを失敗した後に、別の入力方法による入力によって同一の加入者へのダイアリングをトリガした可能性が高い。他の方法による入力の後、ステップ４１０において、前の音声認識結果に対する第２の信頼度が、別の入力方法による入力を考慮しながら決定される。ステップ４１１において、第２の信頼度が、第２の所定のターゲット範囲内にあるか否かが確認される。所定のターゲット範囲内にある場合、ステップ４０８において、別の入力方法によるユーザ入力を考慮しながら、音声認識結果に基づいて、音声認識装置の訓練及び適応が行われる。ステップ４１１において、第２の信頼度が第２の所定のターゲット範囲内にない場合、別の入力方法による入力と、前の音声入力は互いに対応しないことを表し、ステップ４００とステップ４０１との間の点に戻る。
【００２６】
原則的に、ステップ４０５において、ユーザが加入者へのダイアリングを中断し、従って、音声認識結果に対し拒絶を示した場合も、ステップ４００とステップ４０１との間の点に戻るかわりに、ステップ４０９の問合せに進むことが可能であり、これは、点線４１２により示す。従って、音声入力の直後に別の入力方法によって入力が行われると、別の入力方法による入力と前の音声入力は互いに対応する可能性が非常に高く、音声認識結果は音声入力を正確に表していないとみなすことができる。しかし、音声認識結果は、それが完全に正確でなくとも、音声入力及び／又は別の入力方法による入力に対し適度な類似性がある場合は、音声認識装置の訓練又は適応に使用できる。この類似性は、信頼度に基づいて行われる確認により推定される。従って、訓練動作には、音声認識結果に含まれる情報と、別の入力方法による入力に含まれる情報の両方を含む。
【００２７】
最後に、図５は、特殊な訓練又は適用が行われる本発明の実施例を示す。ステップ５００において、音声入力モードが作動され、ステップ５０１において、ここでは名前である音声入力が話され、ステップ５０２において、音声認識装置４によって音声認識動作が行われ、ここでは、音声認識結果に加えて、少なくとも１つの更なる音声認識結果案が生成される。ステップ５０３において、音声認識結果はユーザに、音響的又は視覚的に出力される。ステップ５０４において、音声認識結果に関し、認識された名前を有する加入者への自動ダイアリングが行われる。ステップ５０５において、ダイアリングがユーザによって中断されたか否かが確認される。中断された場合は、ステップ５００とステップ５０１との間の点に戻る。中断されていない場合は、ステップ５０６において、この最近の音声認識結果に基づいて、音声認識装置４の訓練又は適応が行われる。ステップ５０７では、この最近の音声認識結果が、前回の音声入力に対し決められた音声認識結果案に対応するか否か、そして、前回の音声入力に対し、ユーザが自動ダイアリングを停止したか否かが更に確認される。これらの条件のうちの１つが満たされないと、ステップ５００とステップ５０１との間の点に戻る。これらの条件の両方が満たされると、前回の音声入力に対する音声認識案は、実際に、前回の音声入力に対し正しい音声認識結果を表すものとみなされる。この場合、ステップ５０８において、最近の音声入力と前回の音声入力は、同一の単語又は同一の単語列を表すとして、特殊な訓練又は適応が行われる。用語集１１に入力される対応する語彙に関連付けられる音響モデルは、音声認識装置４が、最近の音声入力及び前回の音声入力の両方に対し正しい音声認識結果を生成するよう適応される。ステップ５０８が行われる後、ステップ５００とステップ５０１との間の点に戻る。
【００２８】
本発明は、移動電話機端末又は音声ダイアリングの適用に制限されるものではない。音声入力によって、例えば、音声出力の音量設定といった電化製品の他の機能を作動させることもできる。更に、ユーザに対し、音声認識の音響的又は視覚的な出力を行うことが完全に必要な訳ではない。特に、音声認識結果の精度といった更なる情報を必要とすることなく、ユーザが音声入力に対応する装置の機能の実行から判断できる場合にはなくてもよい。更に、ユーザは、既に始まっている装置の機能を中断することのない所定の入力（例えば、所定の音声又はキーパッド入力）を介し、拒絶を、追加的又は選択的に示すことができる。
【図面の簡単な説明】
【図１】移動電話機端末を示すブロック回路図である。
【図２】本発明の異なる実施例を示すフローチャートである。
【図３】本発明の異なる実施例を示すフローチャートである。
【図４】本発明の異なる実施例を示すフローチャートである。
【図５】本発明の異なる実施例を示すフローチャートである。
【符号の説明】
１移動電話機端末
２デジタル信号プロセッサ
３音声符号化／復号化、ハンズフリー信号処理
４音声認識装置
５マイクロホン
６スピーカ
Ａ／Ｄ変換器
９マイクロコントローラ
１０記憶装置
１１用語集
１２他のデータ
１３キーアッド入力ユニット
１４ディスプレイユニット
１５アンテナ
１６送受信器
１７チャネル符号化／復号化ユニット

Claims

電化製品の機能に作用するために使用される音声認識装置の訓練又は適応を行う方法であって、
音声入力を実行する段階と、
上記音声認識装置によって、上記入力音声を処理し、音声認識結果を生成する段階と、
上記音声認識結果を上記電化製品の機能に割当てることが可能である場合には、上記電化製品の上記割当て可能な機能を作動させる段階と、
上記電化製品の上記割当て可能な機能の作動に対し拒絶を表すようにみえるユーザ入力が行われない場合には、上記実行された音声入力に関連付けられる上記音声認識結果に基づいて上記音声認識装置の訓練又は適応を行う段階とを含み、
ユーザが拒絶を表さない場合には、
上記音声認識装置の音声認識結果に対し第１の信頼度が決定され、
上記音声認識装置の上記訓練又は適応を行う段階は、上記音声認識結果の上記第１の信頼度が第１の所望の所定範囲内にある場合に、発話された音声の入力に対応する上記音声認識結果に基づいて行われ、
上記第１の信頼度が上記第１の所望の所定範囲にないことが分かり、更に、別の入力方法により、次のユーザ入力が行われた場合には、上記別の入力方法によって行われる上記ユーザ入力を考慮して、上記音声認識結果に対し第２の信頼度が決定され、上記訓練及び適応を行う段階は、上記第２の信頼度が第２の所望の範囲内にあることが分かった場合に、上記別の入力方法によって行われる上記ユーザ入力を考慮して、上記音声認識結果に基づいて行われることを特徴とする方法。
電化製品の機能に作用するために使用される音声認識装置の訓練又は適応を行う方法であって、
音声入力を実行する段階と、
上記音声認識装置によって、上記入力音声を処理し、音声認識結果を生成する段階と、
上記音声認識結果を上記電化製品の機能に割当てることが可能である場合には、上記電化製品の上記割当て可能な機能を作動させる段階と、
上記電化製品の上記割当て可能な機能の作動に対し拒絶を表すようにみえるユーザ入力が行われない場合には、上記実行された音声入力に関連付けられる上記音声認識結果に基づいて上記音声認識装置の訓練又は適応を行う段階とを含み、
音声入力の後に、音声認識結果の拒絶を表すユーザ入力が行われ、更に、これに関連して、別の入力方法によりユーザ入力が行われた場合、上記別の入力方法によって行われる上記ユーザ入力を考慮して、上記音声認識結果に対する第２の信頼度が決定され、上記音声認識装置の上記訓練及び適応を行う段階は、上記音声入力と、上記別の入力方法により行われる上記ユーザ入力が、同一の単語列を表すとみなされる場合に行われることを特徴とする方法。
電化製品の機能に作用するために使用される音声認識装置の訓練又は適応を行う方法であって、
音声入力を実行する段階と、
上記音声認識装置によって、上記入力音声を処理し、音声認識結果を生成する段階と、
上記音声認識結果を上記電化製品の機能に割当てることが可能である場合には、上記電化製品の上記割当て可能な機能を作動させる段階と、
上記電化製品の上記割当て可能な機能の作動に対し拒絶を表すようにみえるユーザ入力が行われない場合には、上記実行された音声入力に関連付けられる上記音声認識結果に基づいて上記音声認識装置の訓練又は適応を行う段階とを含み、
上記音声認識装置は、音声認識結果に加えて、少なくとも１つの代替の音声認識結果を毎回、生成し、
上記音声認識装置の上記訓練又は適応を行う段階は、上記音声認識結果に割当可能な上記電化製品の上記機能の作動に対し上記音声認識結果に対する拒絶を表すユーザ入力が行われず、
上記音声認識結果が、2番目に直近の音声入力に対する代替の音声認識結果に対応し、
上記2番目に直近の音声認識結果に対する拒絶を表すユーザ入力が行われた場合に、最も直近の音声入力に関連付けられた上記音声認識結果に基づいて行われ、
上記最も直近の音声認識結果、及び上記2番目に直近の音声入力が同一の単語又は単語列を表すとみなされる場合、上記音声認識装置の更なる訓練又は適応を行う段階が行われることを特徴とする方法。
上記音声認識装置の上記訓練又は適応を行う段階は、上記電化製品の上記機能の実行がユーザ入力によって中断されない場合に行われることを特徴とする請求項１乃至３の何れか一項に記載の方法。
音声認識結果の音響的又は視覚的な再現が与えられることを特徴とする請求項１乃至３の何れか一項に記載の方法。
上記電化製品は、移動電話機であることを特徴とする請求項１乃至３の何れか一項記載の方法。
音声入力により、ダイアリング処理がトリガされることを特徴とする請求項６記載の方法。
電化製品の機能に作用するよう使用される音声認識装置を有する電化製品であって、上記電化製品及び上記音声認識装置は、
実行された音声入力を受け取る手段が備えられ、
上記入力音声の処理からの音声認識結果を生成するために上記音声認識装置が備えられ、
上記電化製品の機能の上記音声認識結果が割当て可能である場合には、上記電化製品の上記割当て可能な機能を作動させる手段が備えられ、
上記電化製品の上記割当て可能な機能の作動に対し拒絶を表すようにみえるユーザ入力が行われない場合には、上記音声認識装置は、上記実行された音声入力に関連付けられた上記音声認識結果に基づいて訓練又は適応を行う
ように上記音声認識装置の訓練又は適応を行うよう構成され、
音声入力の後に、音声認識結果の拒絶を表すユーザ入力が行われ、更に、これに関連して、別の入力方法によりユーザ入力が行われた場合、上記別の入力方法により行われる上記ユーザ入力を考慮しながら、上記音声認識結果に対する信頼度が決定され、上記音声認識装置の上記訓練及び適応は、上記音声入力と、上記別の入力方法により行われる上記ユーザ入力が、同一の単語列を表すとみなされる間に行われることを特徴とする電化製品。
電化製品の機能に作用するよう使用される音声認識装置を有する電化製品であって、上記電化製品及び上記音声認識装置は、
実行された音声入力を受け取る手段が備えられ、
上記入力音声の処理からの音声認識結果を生成するために上記音声認識装置が備えられ、
上記電化製品の機能の上記音声認識結果が割当て可能である場合には、上記電化製品の上記割当て可能な機能を作動させる手段が備えられ、
上記電化製品の上記割当て可能な機能の作動に対し拒絶を表すようにみえるユーザ入力が行われない場合には、上記音声認識装置は、上記実行された音声入力に関連付けられた上記音声認識結果に基づいて訓練又は適応を行う
ように上記音声認識装置の訓練又は適応を行うよう構成され、
ユーザが拒絶を表さない場合には、
上記音声認識装置の音声認識結果に対し第１の信頼度が決定され、
上記音声認識装置の上記訓練又は適応は、上記音声認識結果の上記第１の信頼度が第１の所望の所定範囲内にある場合に、上記実行された音声入力に対応する上記音声認識結果に基づいて行われ、
上記第１の信頼度が上記第１の所望の所定範囲にないことが分かり、更に、別の入力方法により、次のユーザ入力が行われた場合には、上記別の入力方法による上記ユーザ入力を考慮しながら、上記音声認識結果に対し第２の信頼度が決定され、上記訓練及び適応は、上記第２の信頼度が第２の所望の所定範囲内にあることが分かった場合に、上記別の入力方法によって行われる別の音声入力を考慮しながら、上記音声認識結果に基づいて行われることを特徴とする電化製品。
電化製品の機能に作用するよう使用される音声認識装置を有する電化製品であって、上記電化製品及び上記音声認識装置は、
実行された音声入力を受け取る手段が備えられ、
上記入力音声の処理からの音声認識結果を生成するために上記音声認識装置が備えられ、
上記電化製品の機能の上記音声認識結果が割当て可能である場合には、上記電化製品の上記割当て可能な機能を作動させる手段が備えられ、
上記電化製品の上記割当て可能な機能の作動に対し拒絶を表すようにみえるユーザ入力が行われない場合には、上記音声認識装置は、上記実行された音声入力に関連付けられた上記音声認識結果に基づいて訓練又は適応を行う
ように上記音声認識装置の訓練又は適応を行うよう構成され、
上記音声認識装置は、音声認識結果に加えて、少なくとも１つの代替の音声認識結果を生成し、
上記音声認識装置の上記訓練又は適応は、上記音声認識結果に割当可能な上記電化製品の上記機能の作動に対し上記音声認識結果に対する拒絶を表すようにみえるユーザ入力が行われず、
上記音声認識結果が、2番目に直近の音声入力に対する代替の音声認識結果に対応し、
上記2番目に直近の音声認識結果に対する拒絶を表すユーザ入力が行われた場合に、最も直近の音声入力に関連付けられた上記音声認識結果に基づいて行われ、
上記最も直近の音声入力、及び上記2番目に直近の音声入力が同一の単語又は単語列を表すとみなされる場合、上記音声認識装置の更なる訓練又は適応が行われることを特徴とする電化製品。
上記電化製品が移動電話機端末である請求項８乃至１０の何れか一項に記載の電化製品。