JP2003255987A - 音声認識を利用した機器の制御方法、制御装置及び制御プログラム - Google Patents

音声認識を利用した機器の制御方法、制御装置及び制御プログラム

Info

Publication number
JP2003255987A
JP2003255987A JP2002056793A JP2002056793A JP2003255987A JP 2003255987 A JP2003255987 A JP 2003255987A JP 2002056793 A JP2002056793 A JP 2002056793A JP 2002056793 A JP2002056793 A JP 2002056793A JP 2003255987 A JP2003255987 A JP 2003255987A
Authority
JP
Japan
Prior art keywords
state
voice
voice recognition
instruction
recognition means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002056793A
Other languages
English (en)
Inventor
Yasuyuki Masai
康之 正井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002056793A priority Critical patent/JP2003255987A/ja
Publication of JP2003255987A publication Critical patent/JP2003255987A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 従来の方法では機器の操作を行なうたびにス
イッチを操作する、あるいは表示を確認するなどの副次
的な作業をともない、音声による制御の優位さが損なわ
れてしまうことが多かった。誤作動しにくく、物理的な
スイッチ操作を伴わず音声のみよる機器の制御が行なえ
る機器の制御方法、制御装置及び制御プログラムを提供
することを目的とする。 【解決手段】 平時の状態である第1の状態から動作待
機状態である第2の状態および動作状態である第3の状
態をとる該機器の制御方法であって、第2の状態にから
前記第3の状態に遷移させる作動指示を認識した場合に
は、第3の状態に遷移させ、他方、作動指示を認識しな
かった場合には、第1の状態に遷移させることを有する
ことを特徴とする機器の制御装置とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識により機
器の制御を行なうときの該機器の制御方法、制御装置及
び制御プログラムに関する。
【0002】
【従来の技術】現実の作業場面において、ある種の工作
機械や自動車、あるいは家庭電化製品などのような被制
御機器の操作を音声によって行なうことはその使用者に
とって有益である。たとえば両手がふさがっている場合
や、制御盤等に視線をそらすことが難しいような場合で
ある。または携帯電話など昨今のモバイル機器の発展に
より可搬性に優れた電子機器が作られるようになってき
たことに伴い、スイッチ類の操作によらないハンズフリ
ーな利用環境が望まれるようにもなっている。
【0003】工作機械等への音声による指示で重要とな
るのは、音声の誤認識の低減と正当な権限をもつ音声指
示者かどうかの認識である。本来の指示者以外の者の音
声や風切り音、近接する装置の動作音が誤って投入、認
識され該機器が誤った指示に従って動作してしまうと大
変危険である。
【0004】従来の技術では上記のような雑音等の外部
の要因を極力排除するために、操作者が音声指示を与え
るタイミングでスイッチを操作する、いわゆるトークス
イッチを採用していた。これは意図しない音声や雑音に
よって装置が誤認識を起こさないようにするものであ
る。あるいは音声による指示が正確に認識されたかを、
該機器に備えられた表示板等で確認し、そこで正しい認
識がされていることが確認された後目的の動作を行なわ
せるものなどがある。
【0005】
【発明が解決しようとする課題】しかしながら従来の方
法では機器の操作を行なうたびにスイッチを操作する、
あるいは表示を確認するなどの副次的な作業をともな
い、音声による制御の優位さが損なわれてしまうことが
多かった。本発明は誤作動しにくく、副次的な作業を不
要とする音声のみによる機器の制御を行なう機器の制御
方法、制御装置及び制御プログラムを提供することを目
的とする。
【0006】
【課題を解決するための手段】第1の発明によれば、音
声認識手段を有し、音声認識した結果によって機器を制
御するための制御方法であって、平時の状態である第1
の状態と動作状態である第3の状態との間に、さらに動
作待機状態である第2の状態を取り、前記第1の状態に
おいて、前記音声認識手段が特定の動作待機を指示する
音声を認識した場合には、前記第2の状態に移行する第
1のステップと、前記第2の状態において、前記音声認
識手段が特定の作動指示音声を認識した場合に、前記機
器の動作を許可し、前記第3の状態に移行する第2のス
テップとを有することを特徴とする音声認識を利用した
機器の制御方法が提供される。
【0007】第2の発明によれば、音声認識手段を有
し、音声認識した結果によって機器を制御するための制
御方法であって、平時の状態である第1の状態と動作状
態である第3の状態との間に、さらに動作待機状態であ
る第2の状態を取り、前記第1の状態において、前記音
声認識手段が特定の動作待機を指示する音声を認識した
場合には、前記第2の状態に移行する第1のステップ
と、前記第2の状態において、前記音声認識手段が特定
の作動指示音声を認識した場合に、前記機器の動作を許
可し、前記第3の状態に移行するが、他方、前記音声認
識手段は該音声認識手段が前記作動指示を認識しなかっ
た場合には、前記機器を前記第2の状態から前記第1の
状態に移行する第2のステップとを有することを特徴と
する音声認識を利用した機器の制御方法が提供される。
【0008】第3の発明によれば音声認識手段を有し、
音声認識した結果によって機器を制御するための制御方
法であって、平時の状態である第1の状態と動作状態で
ある第3の状態との間に、さらに動作待機状態である第
2の状態を取り、前記第1の状態において、前記音声認
識手段が特定の動作待機を指示する音声を認識した場合
には、前記第2の状態に移行する第1のステップと、前
記第2の状態において、前記音声認識手段が特定の作動
指示音声を認識した場合に、前記音声認識手段が該動作
指示を与えた話者と前記動作待機指示を与えた話者とが
同一であることを認識した場合に限り前記機器の動作を
許可し、前記第3の状態に移行するが、他方、前記音声
認識手段は該音声認識手段が該動作指示を与えた話者と
前記動作待機指示を与えた話者とが同一でないと認識し
た場合には、前記機器を前記第2の状態のまま維持する
第2のステップとを有することを特徴とする音声認識を
利用した機器の制御方法が提供される。
【0009】第4の発明によれば、音声認識手段を有
し、音声認識した結果によって機器を制御するための制
御方法であって、平時の状態である第1の状態と動作状
態である第3の状態との間に、さらに動作待機状態であ
る第2の状態を取り、前記第1の状態において、前記音
声認識手段が特定の動作待機を指示する音声を認識した
場合には、前記第2の状態に移行する第1のステップ
と、前記第2の状態において、前記音声認識手段が特定
の作動指示音声を認識した場合に、前記音声認識手段が
該動作指示を与えた話者と前記動作待機指示を与えた話
者とが同一であることを認識した場合に限り前記機器の
動作を許可し、前記第3の状態に移行するが、他方、前
記音声認識手段は該音声認識手段が該動作指示を与えた
話者と前記動作待機指示を与えた話者とが同一でないと
認識した場合には、前記機器を前記第2の状態のまま維
持する第2のステップと、それ以外の場合には前記制御
手段が前記機器を前記第2の状態から前記第1の状態に
移行させる第3のステップとを有することを特徴とする
音声認識を利用した機器の制御方法が提供される。
【0010】またそれぞれの発明について、各方法を実
現する制御装置と制御プログラムが提供される。
【0011】上記の各手段により音声指示の誤認識(た
とえば指示の聞き取り誤りによる誤作動や他者の音声に
応答してしまうなど)を抑え、かつ制御対象となる機器
の意図したとおりの確実な操作を、音声によって行なわ
せることが可能となる。
【0012】
【発明の実施の形態】次に本発明の実施形態の例につい
て図示しながら説明する。
【0013】(第1の実施形態)図1は本発明を利用し
た音声認識による機器の制御装置の第1の実施形態にお
けるブロック構成図である。当該制御装置は音声認識部
11、認識対象判定部12、状態変化信号入力部13と
それらを制御する制御部14、および操作対象機器15
が示されている。音声による操作者(話者)が当該機器
の操作のための指示を与えると、音声認識部11が解析
を始める。解析には該音声信号をディジタル化し、それ
がどのような発声内容であるかを判断する。認識対象判
定部12は解析後に該判断した音声が当該機器に対する
指示をしたものであるかどうかを判定する。その判定結
果は、状態変化信号入力部13および制御部14に伝達
され、その結果に基づいて制御部14が操作対象機器1
5を操作する。
【0014】このとき制御部14は平時(非アクティ
ブ)の状態、待機(リザーブ)の状態、および作動(ア
クティブ)の状態というように複数の状態を持つ。たと
えば機器の電源をオフするような比較的慎重に行なわね
ばならない操作の場合を想定する。初期の状態、つまり
平時の状態では電源がオンであり、指示を待っている状
態である。話者は該機器をオフにするため該機器に対し
音声にて「パワーオフ」と発音する。すると該機器は自
らが備える表示装置上に電源オフの指示を認識した旨を
表示するか、あるいはアラーム音を発するなど話者が知
得できる方法でその指示が正しいことを話者に対して確
認をする。この状態が待機の状態である。待機の状態で
は指示が受け入れられたにも関わらず直ぐには操作が行
なわれない。この状態の時に、該機器がどのような指示
を受け取ったか及びその指示が正しいのかを話者に対し
て確認をする。話者は“電源オフ”の指示が正しいもの
であるからその旨を回答する。たとえば「はい」と発声
する。すると状態変化信号入力部13は待機の状態から
作動の状態へと操作対象機器15を操作する。つまりこ
の場合には操作対象機器15の電源をオフすることにな
る。
【0015】この待機の状態のとき、作動の状態にする
ことを指示する音声を話者が発声しなかった場合には、
状態変化信号入力部13は制御部14に対して操作対象
機器15を作動の状態に移行することなく平時の状態に
戻すように指示する。たとえば上記の例でいえば、“電
源オフ”を指示した後の待機の状態で、「いいえ」もし
くは周囲の雑音等の認識対象判定部12が作動の状態に
する音声指示以外の音声信号が与えられたときである。
【0016】上記のように構成すると、話者が発した音
声による該機器に対する操作を、該機器の作動前に当該
話者が確認することができる。機器の作動前に確認する
ことで音声指示に対する音声認識の誤認識による該機器
の誤作動を防止することができる。さらに上記のように
該機器を待機の状態から作動の状態にするのに、認識し
やすい音声指示(たとえば「はい」、「いいえ」などの
特定の音声指示)を採用すれば、作動の状態への遷移の
指示も高い確度を維持しながら音声指示にて行なうこと
ができる。このことからわずらわしい手順を踏むことな
く、完全にハンズフリーな機器の操作環境を提供するこ
とが可能となる。
【0017】また待機の状態のとき、必ずしも上記の例
のように予期しない音声信号または周囲の雑音信号を認
識対象判定部12が認識しなくともよい。たとえば状態
変化信号入力部13に計時機能を設け、待機の状態が一
定の間継続したことを検出したら、状態変化信号入力部
13は制御部14に対して操作対象機器15を作動の状
態に移行することなく最初の平時の状態に戻すように指
示するようにしてもかまわない。上記のように状態変化
信号入力部13に計時機能を設けると操作の途中で機器
が放置されてしまった場合でも、待機の状態を続けるこ
となく自動的に平時の状態に復帰する。よってこのよう
な場合であっても、一定時間の経過後には操作対象機器
15を平時の状態で使用することができるようになる。
【0018】図2に音声認識部11の内部ブロック構成
図の一例を示す。話者が発した音声信号をマイクロフォ
ン21にて電気信号に変換したものが、増幅部22にて
該信号の増幅処理等のレベル調整が行なわれる。その
後、該音声信号はAD変換部23にてディジタル信号に変
換する。ディジタル化された信号は、次の音響分析部2
4でその信号に含まれる特徴を分析し、いわゆる特徴パ
ラメータを出力する。音声認識に使用される代表的な特
徴パラメータには、たとえばバンドパスフィルタ処理や
フーリエ変換を行なうことで求められるパワースペクト
ルがある。またはLPC(線形予測)分析手法によって
求めるケプストラム係数などが良く用いられている。し
かしながら本願発明では音声指示の認識が行なわれれば
どのような方法によってもかまわないため、ここではこ
れら分析手法のいかんは問わない。
【0019】音響分析部24は求めた特徴パラメータの
値を、モデル照合部25に出力する。モデル照合部25
は、予め作成した認識対象音声の各音声モデルと特徴パ
ラメータの値の類似度を計算する。当該音声モデルはモ
デル記憶部26に格納され、モデル照合部25からの求
めに応じて適宜読み出されて使用される。モデル照合部
25の照合の方法には、音声モデルを特徴パラメータ値
として作成しておきDP(動的計画)法で音声モデルの
特徴パラメータと入力音声から求めた特徴パラメータと
の距離を求める方法がある。またはHMM(隠れマルコ
フモデル)を用いて統計的に音声モデルを作成してお
き、入力音声の特徴パラメータ値が入力されたときこれ
ら各音声モデルとの適合確率を計算する方法などが広く
使用されている。ただし特徴パラメータと同様に、照合
の方法についてここに例示したものには限定しない。適
切に音声指示が分別、識別されれば足りるためである。
【0020】最後に、照合結果出力部27が音声の照合
結果をコード化して出力する。この値が既述のように認
識対象判定部12の入力となり、音声指示の識別に使用
される。
【0021】図3は第1の実施形態における動作フロー
図の一例である。平時状態31、たとえば電源が入って
いる通常の使用状態にある操作対象機器15に、該機器
への指示を与える話者から最初の音声指示(たとえば
「パワーオフ」)が与えられる。その指示が該機器を平
時状態31から待機状態33(たとえば、受け取った音
声指示の話者への確認状態)に遷移させるのに適法な音
声指示であったとステップ32で判断された場合には、
該機器は待機状態33に遷移する。それ以外の場合は平
時状態31のまま次の音声指示を待つ。待機状態33に
あるとき、作動状態35(たとえば電源オフ状態)に遷
移させる音声指示が与えられるとステップ34の判断に
より、該機器は作動状態になる。このとき上記音声指示
以外の音声指示、あるいは周囲の雑音が入力として与え
られたと判断された場合には、該機器は動作状態になる
ことなくステップ34の判断により再び平時状態31に
戻る。そして平時状態31に戻った該機器は、再び最初
の音声指示が与えられるのを待つ。
【0022】このようにすると、話者が発した音声によ
る該機器に対する操作を、該機器の作動前に当該話者が
確認することができる。機器の作動前に確認することで
音声認識の誤認識による該機器の誤作動を防止すること
ができる。さらに上記のように該機器を待機の状態から
作動の状態にするのに認識しやすい音声指示を採用すれ
ば、作動の状態への遷移の指示も高い確度を維持しなが
ら音声指示とすることができる。このことからわずらわ
しい手順を踏むことなく、完全にハンズフリーな機器の
操作環境を提供することが可能となる。
【0023】ここで何らかの指示が与えられたとき以外
にも、何ら指示が与えられないまま操作の流れに支障を
与えない適当な時間(たとえば1分程度)を経過した場
合には、上記のように期待する音声指示が与えられなか
ったと判断するようにしてもかまわない。このように計
時機能を設けると操作の途中で機器が放置されてしまっ
た場合でも、該機器は待機の状態を続けることなく自動
的に平時の状態に復帰する。よってこのような場合であ
っても、一定時間の経過後には該機器を平時の状態で使
用することができるようになる。
【0024】加えて、このような図3に示した動作フロ
ーに従った動作をするプログラムとしても良い。該機器
に当該制御プログラムを適用すれば、既述のような効果
を得ることができる。
【0025】(第2の実施形態)図4は本発明を利用し
た音声認識による機器の制御装置の第2の実施形態にお
けるブロック構成図である。当該制御装置は音声認識部
41、認識対象判定部42、同一話者判定部43、状態
変化信号入力部44とそれらを制御する制御部45、お
よび操作対象機器46が示されている。音声による操作
者(話者)が当該機器の操作のための指示を与えると、
音声認識部41が解析を始める。解析には該音声信号を
ディジタル化し、それがどのような発声内容であるかを
判断する。認識対象判定部42は解析後に該判断した音
声が当該機器に対する指示をしたものであるかどうかを
判定する。その判定結果は、状態変化信号入力部44お
よび同一話者判定部43に伝達される。同一話者判定部
43は音声指示が同一の話者から発せられたものかどう
かを判定する。ここでの判定結果は状態変化信号入力部
44および制御部45に伝達され、その結果に基づいて
制御部45が操作対象機器46を操作する。
【0026】同一話者の発した音声指示かどうかを判定
するには、たとえば比較する二つの音声信号から同一要
素を切り出していわゆる特徴パラメータを作成する。こ
のパラメータをDPマッチング法などで演算処理し、こ
の二つのパラメータの距離が許容範囲あるか否かを見る
方法が考えられる。許容範囲内であれば、同一人から発
せられ音声指示である可能性が高いと判定できる。な
お、判定の方法は同一人かどうかを判定できれば足りる
ため、ここに示した方法以外のものであってもかまわな
い。
【0027】このとき制御部45は平時(非アクティ
ブ)の状態、待機(リザーブ)の状態、および作動(ア
クティブ)の状態というように複数の状態を持つ。たと
えば機器の電源をオフするような比較的慎重に行なわね
ばならない操作の場合を想定する。初期の状態、つまり
平時の状態では電源がオンであり、指示を待っている状
態である。話者は該機器をオフにするため該機器に対し
音声にて「パワーオフ」と発音する。すると該機器は自
らが備える表示装置上に電源オフの指示を認識した旨を
表示するか、あるいはアラーム音を発するなど話者が知
得できる方法で、その指示が正しいことを話者に対して
確認をする。この状態が待機の状態である。待機の状態
では指示が受け入れられたにも関わらず直ぐには操作が
行なわれない。この状態の時に、該機器がどのような指
示を受け取ったか及びその指示が正しいのかを話者に対
して確認をする。話者は“電源オフ”の指示が正しいも
のであるからその旨を回答する。たとえば「はい」と発
声する。すると次に、操作対象機器46を平時の状態か
ら待機の状態にしたときの音声指示を与えた話者と、上
記指示が正しいものである旨を回答した音声指示(ここ
では「はい」)を発した話者が同一であるかを同一話者
判定部43によって判定する。このとき同一人物より発
せられた音声指示であることが判定された時のみ、操作
対象機器46を作動の状態に遷移させる。つまり状態変
化信号入力部44は待機の状態から作動の状態へと操作
対象機器46を操作する。つまりこの場合には操作対象
機器46の電源をオフすることになる。
【0028】待機の状態のとき、作動の状態にすること
を指示する音声あるいは適切な音声指示を話者が発しな
かった場合には、状態変化信号入力部44は待機の状態
を維持したまま、次の音声指示を待つ。たとえば上記の
例でいえば、“電源オフ”を指示した後の待機の状態
で、周囲の雑音等の認識対象判定部42が次の状態に遷
移する音声指示以外の音声信号が与えられたときであ
る。平時の状態ではなく待機の状態を維持することによ
って、作業の戻りを最小限に抑えることができる。
【0029】作動の状態にすることを指示する音声を話
者が発した場合であっても、同一話者判定部43が最初
の音声指示を与えた者と次の音声指示を与えた者とが同
一でなかったと判定したときは、状態変化信号入力部4
4は制御部45に対して操作対象機器46を作動の状態
に移行することなく平時の状態に遷移させるよう指示す
る。上記のように構成すると、話者が発した音声による
該機器に対する操作を、該機器の作動前に当該話者が確
認することができる。作動前の事前の確認と、他人の音
声指示による音声認識の誤認識による該機器の誤作動を
防止することができる。さらに上記のように該機器を待
機の状態から作動の状態にするのに、認識しやすい音声
指示(たとえば「はい」、「いいえ」などの特定の音声
指示)を採用すれば、作動の状態への遷移の指示も高い
確度を維持しながら音声指示にて行なうことができる。
このことからわずらわしい手順を踏むことなく、完全に
ハンズフリーな機器の操作環境を提供することが可能と
なる。
【0030】また待機の状態のとき、必ずしも上記の例
のように予期しない音声信号または周囲の雑音信号を認
識対象判定部42が認識しなくともよい。たとえば状態
変化信号入力部44に計時機能を設け、待機の状態が一
定の間継続したことを検出したら、状態変化信号入力部
44は制御部45に対して操作対象機器46を作動の状
態に移行することなく最初の平時の状態に戻すように指
示するようにしてもかまわない。上記のように状態変化
信号入力部44に計時機能を設けると操作の途中で機器
が放置されてしまった場合でも、待機の状態を続けるこ
となく自動的に平時の状態に復帰する。よってこのよう
な場合であっても、一定時間の経過後には操作対象機器
46を平時の状態で使用することができるようになる。
【0031】図5は第2の実施形態における動作フロー
図の一例である。平時状態51、たとえば電源が入って
いる通常の使用状態にある操作対象機器46に、該機器
への指示を与える話者から最初の音声指示(たとえば
「パワーオフ」)が与えられる。その指示が該機器を平
時状態51から待機状態53(たとえば、受け取った音
声指示の話者への確認状態)に遷移させるのに適法な音
声指示であった場合には、ステップ52で判断され該機
器は待機状態53に遷移する。それ以外の場合は平時状
態51のまま次の音声指示を待つ。待機状態53にある
ときに音声指示が与えられたときには、その音声指示が
ステップ54で、作動状態56(たとえば電源オフ状
態)に遷移させるものかどうかが判断される。作動状態
56に遷移させる音声指示と判断された場合には、次の
ステップ55で、平時状態51から待機状態53に遷移
する指示を行なった音声信号と、作動状態56に遷移さ
せようとする音声指示とが同一人から発せられたものか
どうかを判定する。ここで同一人から発せられたもので
あると判定されたときに限り、該機器は作動状態にな
る。このとき上記音声指示以外の音声指示、あるいは周
囲の雑音が入力として与えられたと判断された場合に
は、待機状態53のまま適切な音声指示が与えられるの
を待つ。また上記のとき同一人から発せられたものでは
ないと判定された場合は、該機器は動作状態になること
なく平時状態51に戻る。そして平時状態51に戻った
該機器は、再び最初の音声指示が与えられるのを待つ。
【0032】このようにすると、話者が発した音声によ
る該機器に対する操作を、該機器の作動前に当該話者が
確認することができる。機器の作動前に確認すること
と、同一人の音声指示であることを判定することで音声
指示に対する音声認識の誤認識による該機器の誤作動を
防止することができる。さらに上記のように該機器を待
機の状態から作動の状態にするのに認識しやすい音声指
示を採用すれば、作動の状態への遷移の指示も高い確度
を維持しながら音声指示とすることができる。このこと
からわずらわしい手順を踏むことなく、完全にハンズフ
リーな機器の操作環境を提供することが可能となる。
【0033】ここで何らかの指示が与えられたとき以外
にも、何ら指示が与えられないまま操作の流れに支障を
与えない適当な時間(たとえば1分程度)を経過した場
合にも、上記のように期待する音声指示が与えられなか
ったと判断するようにしてもかまわない。このように計
時機能を設けると操作の途中で機器が放置されてしまっ
た場合でも、該機器は待機の状態を続けることなく自動
的に平時の状態に復帰する。よってこのような場合であ
っても、一定時間の経過後には該機器を平時の状態で使
用することができるようになる。
【0034】加えて、このような図5に示した動作フロ
ーに従った動作をするプログラムとしても良い。該機器
に当該制御プログラムを適用すれば、既述のような効果
を得ることができる。
【0035】(第3の実施形態)図6は本発明を利用し
た音声認識による機器の制御装置の第3の実施形態にお
けるブロック構成図である。当該制御装置は音声認識部
61、認識対象判定部62、同一話者判定部63、状態
変化信号入力部64とそれらを制御する制御部65、お
よび操作対象機器66が示されている。音声による操作
者(話者)が当該機器の操作のための指示を与えると、
音声認識部61が解析を始める。解析には該音声信号を
ディジタル化し、それがどのような発声内容であるかを
判断する。認識対象判定部62は解析後に該判断した音
声が当該機器に対する指示をしたものであるかどうかを
判定する。その判定結果は、状態変化信号入力部64お
よび同一話者判定部63に伝達される。同一話者判定部
63は音声指示が同一の話者から発せられたものかどう
かを判定する。ここでの判定結果は状態変化信号入力部
64および制御部65に伝達され、その結果に基づいて
制御部65が操作対象機器66を操作する。
【0036】同一話者の発した音声指示かどうかを判定
するには、たとえば比較する二つの音声信号から同一要
素を切り出していわゆる特徴パラメータを作成する。こ
のパラメータをDPマッチング法などで演算処理し、こ
の二つのパラメータの距離が許容範囲あるか否かを見る
方法が考えられる。許容範囲内であれば、同一人から発
せられ音声指示である可能性が高いと判定できる。な
お、判定の方法は同一人かどうかを判定できれば足りる
ため、ここに示した方法以外のものであってもかまわな
い。
【0037】このとき制御部65は平時(非アクティ
ブ)の状態、待機(リザーブ)の状態、および作動(ア
クティブ)の状態というように複数の状態を持つ。たと
えば機器の電源をオフするような比較的慎重に行なわね
ばならない操作の場合を想定する。初期の状態、つまり
平時の状態では電源がオンであり、指示を待っている状
態である。話者は該機器をオフにするため該機器に対し
音声にて「パワーオフ」と発音する。すると該機器は自
らが備える表示装置上に電源オフの指示を認識した旨を
表示するか、あるいはアラーム音を発するなど話者が知
得できる方法でその指示が正しいことを話者に対して確
認をする。この状態が待機の状態である。待機の状態で
は指示が受け入れられたにも関わらず直ぐには操作が行
なわれない。この状態の時に、該機器がどのような指示
を受け取ったか及びその指示が正しいのかを話者に対し
て確認をする。話者は“電源オフ”の指示が正しいもの
であるからその旨を回答する。たとえば「はい」と発声
する。すると次に、操作対象機器66を平時の状態から
待機の状態にしたときの音声指示を与えた話者と、上記
指示が正しいものである旨を回答した音声指示(ここで
は「はい」)を発した話者が同一であるかを同一話者判
定部63によって判定する。このとき同一人物より発せ
られた音声指示であることが判定された時のみ、操作対
象機器66を作動の状態に遷移させる。つまり状態変化
信号入力部64は待機の状態から作動の状態へと操作対
象機器66を操作する。つまりこの場合には操作対象機
器66の電源をオフすることになる。
【0038】待機の状態のとき、作動の状態にすること
を指示する音声あるいは適切な音声指示を話者が発しな
かった場合には、状態変化信号入力部64は待機の状態
を維持したまま次の音声指示を待つ。たとえば上記の例
でいえば、“電源オフ”を指示した後の待機の状態で、
周囲の雑音等の認識対象判定部62が次の状態に遷移す
る音声指示以外の音声信号が与えられたときである。こ
のように待機の状態を維持することで、平時の状態まで
戻ることがなく、作業の戻りを最小限に抑えることがで
きる。
【0039】作動の状態にすることを指示する音声を話
者が発した場合であっても、同一話者判定部63が最初
の音声指示を与えた者と次の音声指示を与えた者とが同
一でなかったと判定したときは、状態変化信号入力部6
4は制御部65に対して操作対象機器66を作動の状態
に移行することなく待機の状態のまま維持する。上記の
ように構成すると、話者が発した音声による該機器に対
する操作を、該機器の作動前に当該話者が確認すること
ができる。作動前の事前の確認と、他人の音声指示によ
る音声認識の誤認識による該機器の誤作動を防止するこ
とができる。さらに上記のように該機器を待機の状態か
ら作動の状態にするのに、認識しやすい音声指示(たと
えば「はい」、「いいえ」などの特定の音声指示)を採
用すれば、作動の状態への遷移の指示も高い確度を維持
しながら音声指示にて行なうことができる。また作動の
状態に移行させる適法な指示が同一でない話者によって
与えられた場合にも、最初の平時の状態まで戻ることが
なく、作業の戻りを最小に抑えることができる。このこ
とからわずらわしい手順を踏むことなく、完全にハンズ
フリーな機器の操作環境を提供することが可能となる。
【0040】また待機の状態のとき、必ずしも上記の例
のように予期しない音声信号または周囲の雑音信号を認
識対象判定部62が認識しなくともよい。たとえば状態
変化信号入力部64に計時機能を設け、待機の状態が一
定の間継続したことを検出したら、状態変化信号入力部
64は制御部65に対して操作対象機器66を作動の状
態に移行することなく最初の平時の状態に戻すように指
示するようにしてもかまわない。上記のように状態変化
信号入力部64に計時機能を設けると操作の途中で機器
が放置されてしまった場合でも、待機の状態を続けるこ
となく自動的に平時の状態に復帰する。よってこのよう
な場合であっても、一定時間の経過後には操作対象機器
66を平時の状態で使用することができるようになる。
【0041】図7は第3の実施形態における動作フロー
図の一例である。平時状態71、たとえば電源が入って
いる通常の使用状態にある操作対象機器66に、該機器
への指示を与える話者から最初の音声指示(たとえば
「パワーオフ」)が与えられる。その指示が該機器を平
時状態から待機状態に遷移させるのに適法な音声指示で
あった場合には、ステップ72で判断され待機状態73
(たとえば、受け取った音声指示の話者への確認状態)
に遷移する。それ以外の場合は平時状態71のまま次の
音声指示を待つ。待機状態73にあるときに音声指示が
与えられたときには、作動状態76(たとえば電源オフ
状態)に遷移させる音声指示かどうかがステップ74で
判断される。作動状態76に遷移させる音声指示であっ
た場合には、次にステップ75で、平時状態71から待
機状態73に遷移する指示を行なった音声信号と、作動
状態76に遷移させようとする音声指示とが同一人から
発せられたものかどうかを判定する。ここで同一人から
発せられたものであると判定されたときに限り、該機器
は作動状態になる。このとき上記音声指示以外の音声指
示、あるいは周囲の雑音が入力として与えられたと判断
された場合には、待機状態73のまま適切な音声指示が
与えられるのを待つ。また上記のとき同一人から発せら
れたものではないと判定された場合は、該機器は動作状
態になることなく待機状態73を維持する。そして待機
状態73に戻った該機器は、再び音声指示が与えられる
のを待つ。平時の状態ではなく待機の状態を維持するこ
とによって、作業の戻りを最小限に抑えることができ
る。
【0042】このようにすると、話者が発した音声によ
る該機器に対する操作を、該機器の作動前に当該話者が
確認することができる。機器の作動前に確認すること
と、同一人の音声指示であることを判定することで音声
指示に対する音声認識の誤認識による該機器の誤作動を
防止することができる。さらに上記のように該機器を待
機の状態から作動の状態にするのに認識しやすい音声指
示を採用すれば、作動の状態への遷移の指示も高い確度
を維持しながら音声指示とすることができる。このこと
からわずらわしい手順を踏むことなく、完全にハンズフ
リーな機器の操作環境を提供することが可能となる。
【0043】ここで何らかの指示が与えられたとき以外
にも、何ら指示が与えられないまま操作の流れに支障を
与えない適当な時間(たとえば1分程度)を経過した場
合にも、上記のように期待する音声指示が与えられなか
ったと判断するようにしてもかまわない。このように計
時機能を設けると操作の途中で機器が放置されてしまっ
た場合でも、待機の状態を続けることなく自動的に平時
の状態に復帰する。よってこのような場合であっても、
一定時間の経過後には該機器を平時の状態で使用するこ
とができるようになる。
【0044】加えて、このような図7に示した動作フロ
ーに従った動作をするプログラムとしても良い。該機器
に当該制御プログラムを適用すれば、既述のような効果
を得ることができる。
【0045】(第4の実施形態)図8は本発明を利用し
た音声認識による機器の制御装置の第4の実施形態にお
けるブロック構成図である。当該制御装置は音声認識部
81、認識対象判定部82、同一話者判定部83、状態
変化信号入力部84とそれらを制御する制御部85、お
よび操作対象機器86が示されている。音声による操作
者(話者)が当該機器の操作のための指示を与えると、
音声認識部81が解析を始める。解析には該音声信号を
ディジタル化し、それがどのような発声内容であるかを
判断する。認識対象判定部82は解析後に該判断した音
声が当該機器に対する指示をしたものであるかどうかを
判定する。その判定結果は、状態変化信号入力部84お
よび同一話者判定部83に伝達される。同一話者判定部
83は音声指示が同一の話者から発せられたものかどう
かを判定する。ここでの判定結果は状態変化信号入力部
84および制御部85に伝達され、その結果に基づいて
制御部85が操作対象機器86を操作する。
【0046】同一話者の発した音声指示かどうかを判定
するには、たとえば比較する二つの音声信号から同一要
素を切り出していわゆる特徴パラメータを作成する。こ
のパラメータをDPマッチング法などで演算処理し、こ
の二つのパラメータの距離が許容範囲あるか否かを見る
方法が考えられる。許容範囲内であれば、同一人から発
せられ音声指示である可能性が高いと判定できる。な
お、判定の方法は同一人かどうかを判定できれば足りる
ため、ここに示した方法以外のものであってもかまわな
い。
【0047】このとき制御部85は平時(非アクティ
ブ)の状態、待機(リザーブ)の状態、および作動(ア
クティブ)の状態というように複数の状態を持つ。たと
えば機器の電源をオフするような比較的慎重に行なわね
ばならない操作の場合を想定する。初期の状態、つまり
平時の状態では電源がオンであり、指示を待っている状
態である。話者は該機器をオフにするため該機器に対し
音声にて「パワーオフ」と発音する。すると該機器は自
らが備える表示装置上に電源オフの指示を認識した旨を
表示するか、あるいはアラーム音を発するなど話者が知
得できる方法でその指示が正しいことを話者に対して確
認をする。この状態が待機の状態である。待機の状態で
は指示が受け入れられたにも関わらず直ぐには操作が行
なわれない。この状態の時に、該機器がどのような指示
を受け取ったか及びその指示が正しいのかを話者に対し
て確認をする。話者は“電源オフ”の指示が正しいもの
であるからその旨を回答する。たとえば「はい」と発声
する。ここで受け取った音声指示が該機器を作動の状態
にするもの(ここでは「はい」)であった場合には、制
御部85は待機の状態から作動の状態へと遷移操作対象
機器86を遷移させる。つまり状態変化信号入力部84
は待機の状態から作動の状態へと操作対象機器86を操
作する。つまりこの場合には操作対象機器86の電源を
オフすることになる。
【0048】待機の状態のとき、作動の状態にすること
を指示する音声あるいは適切な音声指示を話者が発しな
かった場合には、次にステップ96で平時の状態から待
機状態に遷移させた音声指示を発した話者と作動の状態
に遷移する音声指示を発した話者とが同一人であるかど
うかを判定する。このとき少なくとも同一人であると判
定されれば待機の状態を維持するが、そうでない場合は
平時の状態に戻される。
【0049】前述したように同一人の音声指示であった
場合には、状態変化信号入力部84は待機の状態を維持
したまま、次の音声指示を待つ。たとえば上記の例でい
えば、“電源オフ”を指示した後の待機の状態で、周囲
の雑音等の認識対象判定部82が次の状態に遷移する音
声指示以外の音声信号が与えられたときである。このよ
うに待機の状態を維持することで、平時の状態まで戻る
ことがなく、作業の戻りを最小限に抑えることができ
る。
【0050】このように構成すると、話者が発した音声
による該機器に対する操作を、該機器の作動前に当該話
者が確認することができる。作動前の事前の確認をする
ことによって音声認識の誤認識による該機器の誤作動を
防止することができる。さらに上記のように該機器を待
機の状態から作動の状態にするのに、認識しやすい音声
指示(たとえば「はい」、「いいえ」などの特定の音声
指示)を採用すれば、作動の状態への遷移の指示も高い
確度を維持しながら音声指示とすることができる。また
作動の状態に移行させる適法な指示が与えられなかった
としても、それが同一の話者によって与えられたと判定
された場合には、最初の平時の状態まで戻ることをしな
い。このことから作業の戻りを最小に抑えることができ
る。よってわずらわしい手順を踏むことなく、完全にハ
ンズフリーな機器の操作環境を提供することが可能とな
る。
【0051】また待機の状態のとき、必ずしも上記の例
のように予期しない音声信号または周囲の雑音信号を認
識対象判定部82が認識しなくともよい。たとえば状態
変化信号入力部84に計時機能を設け、待機の状態が一
定の間継続したことを検出したら、状態変化信号入力部
84は制御部85に対して操作対象機器86を作動の状
態に移行することなく最初の平時の状態に戻すように指
示するようにしてもかまわない。上記のように状態変化
信号入力部84に計時機能を設けると操作の途中で機器
が放置されてしまった場合でも、待機の状態を続けるこ
となく自動的に平時の状態に復帰する。よってこのよう
な場合であっても、一定時間の経過後には操作対象機器
66を平時の状態で使用することができるようになる。
【0052】図9は第4の実施形態における動作フロー
図の一例である。平時状態91、たとえば電源が入って
いる通常の使用状態にある操作対象機器86に、該機器
への指示を与える話者から最初の音声指示(たとえば
「パワーオフ」)が与えられる。その指示が該機器を平
時状態から待機状態に遷移させるのに適法な音声指示で
あった場合には、ステップ92で判断され該機器は待機
状態93(たとえば、受け取った音声指示の話者への確
認状態)に遷移する。それ以外の場合は平時状態91の
まま次の音声指示を待つ。待機状態93にあるときに音
声指示が与えられたときには、作動状態95(たとえば
電源オフ状態)に遷移させる音声指示かどうかがステッ
プ94で判断される。作動状態95に遷移させる音声指
示であった場合には、その音声指示に従って作動状態9
5に遷移させる。もしもこれが適法な作動指示ではなか
った場合、次のステップ96で、平時状態91から待機
状態93に遷移する指示を行なった音声指示と、作動状
態95に遷移させようとする音声指示とが同一人から発
せられたものかどうかを判定する。ここで少なくとも同
一人から発せられたものであると判定されたときは、該
機器は待機状態93を維持する。平時の状態ではなく待
機の状態を維持することによって、作業の戻りを最小限
に抑えることができる。また上記のとき同一人から発せ
られたものではないと判定された場合は、該機器は動作
状態になることなく平時状態91へ戻る。そして平時状
態91に戻った該機器は、再び音声指示が与えられるの
を待つ。
【0053】このようにすると、話者が発した音声によ
る該機器に対する操作を、該機器の作動前に当該話者が
確認することができる。機器の作動前に確認すること
と、同一人の音声指示であることを判定することで音声
指示に対する音声認識の誤認識による該機器の誤作動を
防止することができる。さらに上記のように該機器を待
機の状態から作動の状態にするのに、認識しやすい音声
指示を採用すれば、作動の状態への遷移の指示も高い確
度を維持しながら音声指示とすることができる。このこ
とからわずらわしい手順を踏むことなく、完全にハンズ
フリーな機器の操作環境を提供することが可能となる。
【0054】ここで何らかの指示が与えられたとき以外
にも、何ら指示が与えられないまま操作の流れに支障を
与えない適当な時間(たとえば1分程度)を経過した場
合にも、上記のように期待する音声指示が与えられなか
ったと判断するようにしてもかまわない。このように計
時機能を設けると操作の途中で機器が放置されてしまっ
た場合でも、待機の状態を続けることなく自動的に平時
の状態に復帰する。よってこのような場合であっても、
一定時間の経過後には該機器を平時の状態で使用するこ
とができるようになる。
【0055】加えて、このような図9に示した動作フロ
ーに従った動作をするプログラムとしても良い。該機器
に当該制御プログラムを適用すれば、既述のような効果
を得ることができる。
【0056】
【発明の効果】本発明は、音声による操作の優位さを損
なうことなく、さらに誤認識を起こしにくい、物理的な
スイッチ操作を伴わない音声のみよる機器の制御が行な
える音声認識による機器の制御方法、制御装置及び制御
プログラムが提供できる。
【図面の簡単な説明】
【図1】 本発明の第1の実施形態にかかるブロック図
の一例を示す図である。
【図2】 音声認識部のブロック図の一例を示す図であ
る。
【図3】 本発明の第1の実施形態にかかる処理フロー
図の一例を示す図である。
【図4】 本発明の第2の実施形態にかかるブロック図
の一例を示す図である。
【図5】 本発明の第2の実施形態にかかる処理フロー
図の一例を示す図である。
【図6】 本発明の第3の実施形態にかかるブロック図
の一例を示す図である。
【図7】 本発明の第3の実施形態にかかる処理フロー
図の一例を示す図である。
【図8】 本発明の第4の実施形態にかかるブロック図
の一例を示す図である。
【図9】 本発明の第4の実施形態にかかる処理フロー
図の一例を示す図である。
【符号の説明】
11 音声認識部 12 認識対象判定部 13 状態変化信号入力部 14 制御部 15 操作対象機器 24 音響分析部 25 モデル照合部 43 同一話者判定部

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 音声認識手段を有し、音声認識した結果
    によって機器を制御するための制御方法であって、平時
    の状態である第1の状態と動作状態である第3の状態と
    の間に、さらに動作待機状態である第2の状態を取り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記機器の動作を許可
    し、前記第3の状態に移行する第2のステップとを有す
    ることを特徴とする音声認識を利用した機器の制御方
    法。
  2. 【請求項2】 音声認識手段を有し、音声認識した結果
    によって機器を制御するための制御方法であって、 平時の状態である第1の状態と動作状態である第3の状
    態との間に、さらに動作待機状態である第2の状態を取
    り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記機器の動作を許可
    し、前記第3の状態に移行するが、 他方、所定の時間内に前記機器の動作を許可する音声指
    示を認識できなかった場合には、前記第1の状態に移行
    する第2のステップとを有することを特徴とする音声認
    識を利用した機器の制御方法。
  3. 【請求項3】 音声認識手段を有し、音声認識した結果
    によって機器を制御するための制御方法であって、 平時の状態である第1の状態と動作状態である第3の状
    態との間に、さらに動作待機状態である第2の状態を取
    り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記機器の動作を許可
    し、前記第3の状態に移行するが、 他方、前記音声認識手段は該音声認識手段が前記作動指
    示を認識しなかった場合には、前記機器を前記第2の状
    態から前記第1の状態に移行する第2のステップとを有
    することを特徴とする音声認識を利用した機器の制御方
    法。
  4. 【請求項4】 音声認識手段を有し、音声認識した結果
    によって機器を制御するための制御方法であって、 平時の状態である第1の状態と動作状態である第3の状
    態との間に、さらに動作待機状態である第2の状態を取
    り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記音声認識手段が該動
    作指示を与えた話者と前記動作待機指示を与えた話者と
    が同一であることを認識した場合に限り前記機器の動作
    を許可し、前記第3の状態に移行するが、 他方、前記音声認識手段は該音声認識手段が該動作指示
    を与えた話者と前記動作待機指示を与えた話者とが同一
    でないと認識した場合には、前記機器を前記第2の状態
    のまま維持する第2のステップとを有することを特徴と
    する音声認識を利用した機器の制御方法。
  5. 【請求項5】 音声認識手段を有し、音声認識した結果
    によって機器を制御するための制御方法であって、 平時の状態である第1の状態と動作状態である第3の状
    態との間に、さらに動作待機状態である第2の状態を取
    り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記音声認識手段が該動
    作指示を与えた話者と前記動作待機指示を与えた話者と
    が同一であることを認識した場合に限り前記機器の動作
    を許可し、前記第3の状態に移行するが、 他方、前記音声認識手段は該音声認識手段が該動作指示
    を与えた話者と前記動作待機指示を与えた話者とが同一
    でないと認識した場合には、前記機器を前記第2の状態
    のまま維持する第2のステップと、 それ以外の場合には前記制御手段が前記機器を前記第2
    の状態から前記第1の状態に移行させる第3のステップ
    とを有することを特徴とする音声認識を利用した機器の
    制御方法。
  6. 【請求項6】 音声認識した結果によって機器を制御す
    るための制御装置であって、 平時の状態である第1の状態と動作状態である第3の状
    態との間に、さらに動作待機状態である第2の状態を取
    り、 前記第1の状態において、特定の動作待機を指示する音
    声を認識した場合には、前記機器を前記第2の状態に移
    行し、 前記第2の状態においては、特定の作動指示音声を認識
    した場合に、前記機器の動作を許可し、前記第3の状態
    に移行する音声認識手段とを具備し、 他方、前記音声認識手段は所定の時間内に前記機器の動
    作を許可する音声指示を認識できなかった場合には、前
    記第1の状態に移行することを特徴とする、音声認識を
    利用した機器の制御装置。
  7. 【請求項7】 音声認識した結果によって機器を制御す
    るための制御装置であって、平時の状態である第1の状
    態と動作状態である第3の状態との間に、さらに動作待
    機状態である第2の状態を取り、 前記第1の状態において、特定の動作待機を指示する音
    声を認識した場合には、前記機器を前記第2の状態に移
    行し、 前記第2の状態においては、特定の作動指示音声を認識
    した場合に、前記機器の動作を許可し、前記第3の状態
    に移行する音声認識手段とを具備し、 他方、前記音声認識手段は該音声認識手段が前記作動指
    示を認識しなかった場合には、前記機器を前記第2の状
    態から前記第1の状態に移行することを特徴とする、音
    声認識を利用した機器の制御装置。
  8. 【請求項8】 音声認識した結果によって機器を制御す
    るための制御装置であって、平時の状態である第1の状
    態と動作状態である第3の状態との間に、さらに動作待
    機状態である第2の状態を取り、 前記第1の状態において、特定の動作待機を指示する音
    声を認識した場合には、前記機器を前記第2の状態に移
    行し、 前記第2の状態においては、特定の作動指示音声を認識
    した場合に、更に、該動作指示を与えた話者と前記動作
    待機指示を与えた話者とが同一であることを認識した場
    合には、前記機器を前記第2の状態から前記第3の状態
    に移行する音声認識手段とを具備し、 他方、前記音声認識手段は該音声認識手段が該動作指示
    を与えた話者と前記動作待機指示を与えた話者とが同一
    であることを認識しなかった場合には、前記機器を前記
    第2の状態のまま維持することを特徴とする、音声認識
    を利用した機器の制御装置。
  9. 【請求項9】 音声認識した結果によって機器を制御す
    るための制御装置であって、平時の状態である第1の状
    態と動作状態である第3の状態との間に、さらに動作待
    機状態である第2の状態を取り、 前記第1の状態において、特定の動作待機を指示する音
    声を認識した場合には、前記機器を前記第2の状態に移
    行し、 前記第2の状態において、特定の作動指示音声を認識し
    た場合には、前記機器を前記第2の状態から前記第3の
    状態に移行する音声認識手段とを具備し、 前記音声認識手段は、前記特定の作動指示音声が認識で
    きなかったときは前記機器を前記第2の状態から第1の
    状態に移行するが、 少なくとも該音声認識手段が該動作指示を与えた話者と
    前記動作待機指示を与えた話者とが同一であることを認
    識した場合には、前記機器を前記第2の状態のまま維持
    することを特徴とする、音声認識を利用した機器の制御
    装置。利用した機器の制御装置。
  10. 【請求項10】 音声認識手段を有し、音声認識した結
    果によって機器を制御するための制御プログラムであっ
    て、平時の状態である第1の状態と動作状態である第3
    の状態との間に、さらに動作待機状態である第2の状態
    を取り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記機器の動作を許可
    し、前記第3の状態に移行するが、 他方、所定の時間内に前記機器の動作を許可する音声指
    示を認識できなかった場合には、前記第1の状態に移行
    する第2のステップとを有することを特徴とする音声認
    識を利用した機器の制御プログラム。
  11. 【請求項11】 音声認識手段を有し、音声認識した結
    果によって機器を制御するための制御プログラムであっ
    て、平時の状態である第1の状態と動作状態である第3
    の状態との間に、さらに動作待機状態である第2の状態
    を取り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記機器の動作を許可
    し、前記第3の状態に移行するが、 他方、前記音声認識手段は該音声認識手段が前記作動指
    示を認識しなかった場合には、前記機器を前記第2の状
    態から前記第1の状態に移行する第2のステップとを有
    することを特徴とする音声認識を利用した機器の制御プ
    ログラム。
  12. 【請求項12】 音声認識手段を有し、音声認識した結
    果によって機器を制御するための制御プログラムであっ
    て、平時の状態である第1の状態と動作状態である第3
    の状態との間に、さらに動作待機状態である第2の状態
    を取り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記音声認識手段が該動
    作指示を与えた話者と前記動作待機指示を与えた話者と
    が同一であることを認識した場合に限り前記機器の動作
    を許可し、前記第3の状態に移行するが、 他方、前記音声認識手段は該音声認識手段が該動作指示
    を与えた話者と前記動作待機指示を与えた話者とが同一
    でないと認識した場合には、前記機器を前記第2の状態
    のまま維持する第2のステップとを有することを特徴と
    する音声認識を利用した機器の制御プログラム。
  13. 【請求項13】 音声認識手段を有し、音声認識した結
    果によって機器を制御するための制御プログラムであっ
    て、 平時の状態である第1の状態と動作状態である第3の状
    態との間に、さらに動作待機状態である第2の状態を取
    り、 前記第1の状態において、前記音声認識手段が特定の動
    作待機を指示する音声を認識した場合には、前記第2の
    状態に移行する第1のステップと、 前記第2の状態において、前記音声認識手段が特定の作
    動指示音声を認識した場合に、前記音声認識手段が該動
    作指示を与えた話者と前記動作待機指示を与えた話者と
    が同一であることを認識した場合に限り前記機器の動作
    を許可し、前記第3の状態に移行するが、 他方、前記音声認識手段は該音声認識手段が該動作指示
    を与えた話者と前記動作待機指示を与えた話者とが同一
    でないと認識した場合には、前記機器を前記第2の状態
    のまま維持する第2のステップと、 それ以外の場合には前記制御手段が前記機器を前記第2
    の状態から前記第1の状態に移行させる第3のステップ
    とを有することを特徴とする音声認識を利用した機器の
    制御プログラム。
JP2002056793A 2002-03-04 2002-03-04 音声認識を利用した機器の制御方法、制御装置及び制御プログラム Pending JP2003255987A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002056793A JP2003255987A (ja) 2002-03-04 2002-03-04 音声認識を利用した機器の制御方法、制御装置及び制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002056793A JP2003255987A (ja) 2002-03-04 2002-03-04 音声認識を利用した機器の制御方法、制御装置及び制御プログラム

Publications (1)

Publication Number Publication Date
JP2003255987A true JP2003255987A (ja) 2003-09-10

Family

ID=28667218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002056793A Pending JP2003255987A (ja) 2002-03-04 2002-03-04 音声認識を利用した機器の制御方法、制御装置及び制御プログラム

Country Status (1)

Country Link
JP (1) JP2003255987A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2965314A4 (en) * 2013-03-04 2016-11-09 Rawles Llc IDENTIFICATION USING AUDIO SIGNATURES AND ADDITIONAL FEATURES
JP2017117371A (ja) * 2015-12-25 2017-06-29 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 制御方法、制御装置およびプログラム
CN111916078A (zh) * 2020-07-30 2020-11-10 青岛海信智慧家居***股份有限公司 一种语音控制方法及设备
CN111916077A (zh) * 2020-07-24 2020-11-10 青岛海信智慧家居***股份有限公司 一种语音控制方法及设备
US11011172B2 (en) 2014-01-21 2021-05-18 Samsung Electronics Co., Ltd. Electronic device and voice recognition method thereof

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2965314A4 (en) * 2013-03-04 2016-11-09 Rawles Llc IDENTIFICATION USING AUDIO SIGNATURES AND ADDITIONAL FEATURES
US11011172B2 (en) 2014-01-21 2021-05-18 Samsung Electronics Co., Ltd. Electronic device and voice recognition method thereof
US11984119B2 (en) 2014-01-21 2024-05-14 Samsung Electronics Co., Ltd. Electronic device and voice recognition method thereof
JP2017117371A (ja) * 2015-12-25 2017-06-29 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 制御方法、制御装置およびプログラム
CN111916077A (zh) * 2020-07-24 2020-11-10 青岛海信智慧家居***股份有限公司 一种语音控制方法及设备
CN111916077B (zh) * 2020-07-24 2024-03-05 青岛海信智慧家居***股份有限公司 一种语音控制方法及设备
CN111916078A (zh) * 2020-07-30 2020-11-10 青岛海信智慧家居***股份有限公司 一种语音控制方法及设备
CN111916078B (zh) * 2020-07-30 2024-01-30 海信家电集团股份有限公司 一种语音控制方法及设备

Similar Documents

Publication Publication Date Title
US6584439B1 (en) Method and apparatus for controlling voice controlled devices
US6839670B1 (en) Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process
US20020193989A1 (en) Method and apparatus for identifying voice controlled devices
JP4837917B2 (ja) 音声に基づく装置制御
US20030093281A1 (en) Method and apparatus for machine to machine communication using speech
EP1562180B1 (en) Speech dialogue system and method for controlling an electronic device
US20030138118A1 (en) Method for control of a unit comprising an acoustic output device
US20080249779A1 (en) Speech dialog system
EP1054387A2 (en) Method and apparatus for activating voice controlled devices
US20070198268A1 (en) Method for controlling a speech dialog system and speech dialog system
JP5431282B2 (ja) 音声対話装置、方法、プログラム
EP1063636A2 (en) Method and apparatus for standard voice user interface and voice controlled devices
JP2008033198A (ja) 音声対話システム、音声対話方法、音声入力装置、プログラム
JPH11231896A (ja) 音声起動システム
JP2006208486A (ja) 音声入力装置
JP2003255987A (ja) 音声認識を利用した機器の制御方法、制御装置及び制御プログラム
JP2006251061A (ja) 音声対話装置および音声対話方法
JP2011039222A (ja) 音声認識システム、音声認識方法および音声認識プログラム
US7636661B2 (en) Microphone initialization enhancement for speech recognition
JP2001154694A (ja) 音声認識装置及び方法
JP2010206365A (ja) 対話装置
JP5173895B2 (ja) 音声認識装置
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP4765394B2 (ja) 音声対話装置
JP2019020475A (ja) 音声認識装置、音声認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040601

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050414

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060908

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070105