JPH07219584A - 音声処理装置及び方法 - Google Patents

音声処理装置及び方法

Info

Publication number
JPH07219584A
JPH07219584A JP956194A JP956194A JPH07219584A JP H07219584 A JPH07219584 A JP H07219584A JP 956194 A JP956194 A JP 956194A JP 956194 A JP956194 A JP 956194A JP H07219584 A JPH07219584 A JP H07219584A
Authority
JP
Japan
Prior art keywords
command
user
voice
reconfirmation
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP956194A
Other languages
English (en)
Inventor
Michio Aizawa
道雄 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP956194A priority Critical patent/JPH07219584A/ja
Publication of JPH07219584A publication Critical patent/JPH07219584A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声により入力されたコマンドに応じて処理
を実行する装置において、音声の誤認識による重大な誤
処理を防ぎ、また、確認操作を複雑にしないこと。 【構成】 コマンドごとに再確認が必要であるか否かを
定めて記憶しているコマンド辞書109と、この辞書を
用いて、認識結果が再確認を必要とするコマンドである
か否か判定する再確認判定部108と、再確認が必要で
あるときに確認を行うコマンド実行確認部110を有す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声により入力された
コマンドを用いてコンピュータを操作する音声情報処理
装置及び方法に関する。
【0002】
【従来の技術】近年、コンピュータの操作に音声を用い
る音声情報処理装置が研究開発されている。これらの装
置では、キーボードでコマンドを入力したり、マウスで
コマンドを選択する代わりに、音声でコマンドを入力す
る。従来の音声情報処理装置について図5を用いて説明
する。
【0003】図5は、従来の音声情報処理装置の構成を
示す図である。
【0004】501は、マイク等により入力された音声
を装置内部に取り込む音声入力部である。502は、5
01により入力された音声を音声認識しコマンドに変換
する音声認識部である。503は、502で認識したコ
マンドをアプリケーションプログラムに渡すコマンド出
力部である。
【0005】ユーザーが音声情報処理装置を使って、ア
プリケーションプログラムのシェルを利用している場合
について具体的に説明する。
【0006】ユーザがマイクに向かって「ログアウト」
と発声する。音声入力部501は、発声された音声を音
声波形の形で装置内部に取り込む。音声認識部502
は、この音声波形をコマンド“logout”と認識す
る。コマンド出力部503は、コマンド“logou
t”をシェルに渡す。そしてシェルは、システムから渡
されたコマンド“logout”を実行する。
【0007】
【発明が解決しようとする課題】しかしながら、音声認
識は誤る可能性があるので、音声認識に誤りが生じた場
合、以下のような欠点があった。
【0008】ユーザーが「アールログイン」と発声した
としても、システムが“logout”と誤認識する
と、シェルは“logout”を実行する。
【0009】特に“ファイルの削除”や“ログアウト”
のような危険なコマンドが誤認識の結果実行されてしま
うと取り返しのつかないことになる。
【0010】
【課題を解決するための手段】かかる問題点を解決する
ために、本発明では、システムが認識したコマンドの再
確認をユーザーにおこなうかどうかをコマンドごとに登
録したコマンド辞書と、システムが認識したコマンドを
ユーザーに再確認するかどうかを判定する再確認判定部
と、認識したコマンドをユーザーに確認するコマンド実
行確認部を備えることにより、システムの誤認識により
危険なコマンドを実行することを防ぐことをできるよう
にしたものである。
【0011】
【実施例】以下、図面を参照して本発明を詳細に説明す
る。
【0012】図1は、本発明の一実施例に係る装置の構
成を示すブロック図である。
【0013】101は、マイク等により入力された音声
を装置内部に取り込む音声入力部である。102は、音
声出力を行う音声出力部である。103は、文字出力、
画像出力等を行う表示部である。104は、キーボード
を用いた入力を行うキーボード入力部である。105
は、マウスを用いた入力を行うマウス入力部である。1
06は、101から入力された音声を音声認識しコマン
ドに変換する音声認識部である。107は、106で認
識したコマンドを保持する認識コマンド保持部である。
108は、コマンド辞書109を用いて107に保持し
たコマンドをユーザーに再確認するかどうか判定する再
確認判定部である。109は、それぞれのコマンドにつ
いて、ユーザーに再確認するかどうかを登録しておくコ
マンド辞書である。110は、106で認識したコマン
ドをアプリケーションプログラムに渡してよいかどうか
ユーザーに確認するコマンド実行確認部である。111
は、107に保持したコマンドをアプリケーションプロ
グラムに渡すコマンド出力部である。
【0014】図2は、図1の構成で、音声情報処理装置
が動作する過程を表わしたフローチャートである。
【0015】S1では、音声入力部101よりの音声入
力を待ち、音声の入力が行われると、この入力情報を音
声認識部106に送る。S2では、音声認識部106が
入力情報を音声認識しコマンドに変換する。また、変換
したコマンドを認識コマンド保持部107に保持する。
S3では、認識コマンド保持部に保持したコマンドをユ
ーザーに再確認するかどうかを、コマンド辞書109を
参照し判定する。再確認を“行う”と判定された場合
は、S4へ処理を移動する。再確認を“行わない”と判
定された場合は、S5へ処理を移動する。S4では、認
識コマンド保持部107に保持したコマンドをアプリケ
ーションプログラムへ渡す。そして、認識コマンド保持
部に保持しているコマンドを捨て、S1の処理へ戻る。
S5では、コマンド実行確認部110が、認識コマンド
保持部107に保持したコマンドをユーザに示し、アプ
リケーションプログラムに渡してよいかどうかユーザー
に再確認する。コマンドを実行してよいとのユーザから
の指示が入力された場合は、S4の処理へ移動する。コ
マンドを実行してはいけないとのユーザからの指示が入
力された場合は、認識コマンド保持部107に保持した
コマンドを捨て、S1の処理へ戻る。
【0016】図3は、コマンド実行確認部110が動作
するステップS5の詳細を表したフローチャートであ
る。
【0017】S6では、認識コマンド保持部107に保
持しているコマンドを表示部103に出力し、このコマ
ンドをアプリケーションプログラムに渡してよいかどう
かユーザーの返事を待つ。S7では、ユーザがマウス入
力部105を用いてシステムに返事をする。その結果は
S5へ渡し、処理を終了する。
【0018】図4は、コマンド辞書109の例である。
【0019】コマンド辞書109には、各アプリケーシ
ョンの各コマンド毎に、コマンドの再確認を行なうかど
うかを設定する。その場合、例えば“logout”や
“ファイルの削除”のように誤って実行されると危険な
コマンドの再確認を“する”に設定する。
【0020】以下、ユーザーが音声情報処理装置を使っ
て、アプリケーションプログラムのシェルを利用してい
る場合について具体的に説明する。
【0021】ユーザがマイクに向かって「アールログイ
ン」と発声する。音声認識部106は音声認識をおこな
い入力音声をコマンドに変換する。ここでシステムが
“logout”と誤認識したとする。再確認判定部1
08はコマンド辞書109で“logout”を調べ、
その結果再確認を“する”と判定する。コマンド実行確
認部11は、まず「“logout”をおこないますか
?(はい/いいえ)」という内容を表示部103へ出力
し、ユーザーの返事を待つ。ユーザーはマウスを使い
“いいえ”を選ぶ、システムは、音声認識に失敗したと
し、コマンド認識コマンド保持部に保持している“lo
gout”を捨て、新たな入力を待つ。このように、誤
認識による危険なコマンドの実行を防ぐことができる。
【0022】尚、本実施例では、コマンド実行確認部1
10において、表示部103を用いてユーザーに確認を
求めていたが、音声出力部102を用いて音声でユーザ
ーに確認を求めてもよい。
【0023】尚、本実施例では、コマンド実行確認部1
10において、ユーザーはマウス入力部105を用いて
システムに返事をしたが、キーボード入力部104を用
いて返事をしてもよい。
【0024】尚、本実施例では、コマンド実行確認部1
10において、ユーザーはマウス入力部105を用いて
システムに返事をしたが、音声入力部101を用いて返
事をしてもよい。その場合、システムは、音声認識部1
06において入力音声を認識する。
【0025】尚、本実施例では、ユーザーがあらかじめ
設定したコマンド辞書109を用いていた。しかし、シ
ステムが動的にコマンド所書109の内容を変更するこ
とも可能である。
【0026】例えば、システムが認識したコマンドが
“ファイル”のとき、次に認識されるコマンドとして
“キャンセル”の割合が高いとする。この場合、コマン
ド“ファイル”が御認識されやすい単語であると考え、
システムがコマンド辞書109のコマンド“ファイル”
の再確認を“する”に変更することにより、システムの
誤認識によるコマンド実行に対し、ユーザーがキャンセ
ルしなおすという無駄を減らすことが可能となる。
【0027】尚、本実施例では、誤って実行すると危険
なコマンドに対し、コマンド辞書109の再確認を“す
る”に設定した。しかし、アプリケーション自身で再確
認を行うコマンドもある。このようなコマンドについて
は再確認を“しない”に設定しておくことで、音声情報
処理装置とアプリケーションの両方で再確認を行うとい
う二度手間をなくすことができる。
【0028】例えば、コマンド“logout”に対し
シェルアプリケーションプログラム自身が再確認を行う
設定だとする。ユーザーが“logout”をしたい場
合、音声情報処理装置とシェルの両方で再確認をおこな
うことになる。
【0029】本実施例では、これを防ぐことが可能とな
る。
【0030】
【発明の効果】以上説明したように、本発明では、再確
認判定部108とコマンド実行確認部110を用いて、
危険なコマンドに対し、システムが認識したコマンドを
本当に実行してよいかどうかユーザーに再確認するよう
にしたので、システムの誤認識で危険なコマンドを実行
することを防ぐという効果が得られる。
【0031】さらに、本発明では、ユーザーに対する再
確認を一部のコマンドに限定することでシステムの操作
性をよくしている。
【図面の簡単な説明】
【図1】本発明に係る音声情報処理装置のブロック図
【図2】本発明の実施例の処理手順を示す動作フローチ
ャート
【図3】コマンド実行再確認部110の処理手順を示す
動作フローチャート
【図4】コマンド辞書109の例を示す図
【図5】従来の音声情報処理装置のブロック図

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する入力手段、 前記入力した音声を認識する認識手段、 前記認識結果が再確認を必要とするコマンドであるか否
    か判断する判断手段、 前記判断手段により再確認を必要とするコマンドである
    と判断される場合に、該コマンドの実行を確認する確認
    手段を有することを特徴とする音声処理装置。
  2. 【請求項2】 前記判断手段の判断に用いる基準を可変
    とすることを特徴とする請求項1に記載の音声処理装
    置。
  3. 【請求項3】 音声を入力し、 前記入力した音声を認識し、 前記認識した結果が再確認を必要とするコマンドである
    か否かを判断し、 前記認識結果が再確認を必要とするコマンドであると判
    断される場合に、該コマンドの実行を確認することを特
    徴とする音声処理方法。
  4. 【請求項4】 前記判断の基準を可変とすることを特徴
    とする請求項3に記載の情報処理方法。
JP956194A 1994-01-31 1994-01-31 音声処理装置及び方法 Withdrawn JPH07219584A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP956194A JPH07219584A (ja) 1994-01-31 1994-01-31 音声処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP956194A JPH07219584A (ja) 1994-01-31 1994-01-31 音声処理装置及び方法

Publications (1)

Publication Number Publication Date
JPH07219584A true JPH07219584A (ja) 1995-08-18

Family

ID=11723710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP956194A Withdrawn JPH07219584A (ja) 1994-01-31 1994-01-31 音声処理装置及び方法

Country Status (1)

Country Link
JP (1) JPH07219584A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004226698A (ja) * 2003-01-23 2004-08-12 Yaskawa Electric Corp 音声認識装置
JP2009251019A (ja) * 2008-04-01 2009-10-29 Toyota Motor Corp 音声認識装置
JP2016505897A (ja) * 2013-01-04 2016-02-25 コピン コーポレーション 二分岐音声認識
CN115294976A (zh) * 2022-06-23 2022-11-04 中国第一汽车股份有限公司 一种基于车载语音场景的纠错交互方法、***及其车辆

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004226698A (ja) * 2003-01-23 2004-08-12 Yaskawa Electric Corp 音声認識装置
JP2009251019A (ja) * 2008-04-01 2009-10-29 Toyota Motor Corp 音声認識装置
JP2016505897A (ja) * 2013-01-04 2016-02-25 コピン コーポレーション 二分岐音声認識
CN115294976A (zh) * 2022-06-23 2022-11-04 中国第一汽车股份有限公司 一种基于车载语音场景的纠错交互方法、***及其车辆

Similar Documents

Publication Publication Date Title
EP1920321B1 (en) Selective confirmation for execution of a voice activated user interface
JP4942970B2 (ja) 音声認識における動詞誤りの回復
JP3088739B2 (ja) 音声認識システム
WO2016110068A1 (zh) 语音识别设备语音切换方法及装置
JP4667085B2 (ja) 音声対話システム、コンピュータプログラム、対話制御装置及び音声対話方法
JP2006208486A (ja) 音声入力装置
JPH07219584A (ja) 音声処理装置及び方法
JP4042360B2 (ja) 自動通訳システム及びその方法並びにプログラム
JP3962904B2 (ja) 音声認識システム
WO2020225949A1 (ja) 誤変換辞書作成システム
JP3088399B2 (ja) 文書データ音声合成方式
JP2006184371A (ja) 音声認識装置および音声認識方法
JPS60120429A (ja) 音声入力装置
JPH07219586A (ja) 情報処理方法及び装置
JP2000259632A (ja) 自動通訳システム、通訳プログラム伝送システム、記録媒体および情報伝送媒体
JP3299418B2 (ja) 音声認識の方法及び装置
JP2007272123A (ja) 音声操作システム
JP2005234136A (ja) 音声認識サーバ、音声入力システム、及び、音声入力方法
WO2015084141A1 (en) Voice controlled navigation and data entry system and method
JP2002244696A (ja) 音声認識による制御装置
JPS5961899A (ja) 日本語音声入力装置
JP2008046570A (ja) 音声入力システム
JP2002006881A (ja) 音声認識による制御装置
JP2009037433A (ja) ナンバーボイスブラウザ、およびナンバーボイスブラウザの制御方法
JPH10301592A (ja) 音声入力装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010403