JP3384165B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3384165B2
JP3384165B2 JP01486495A JP1486495A JP3384165B2 JP 3384165 B2 JP3384165 B2 JP 3384165B2 JP 01486495 A JP01486495 A JP 01486495A JP 1486495 A JP1486495 A JP 1486495A JP 3384165 B2 JP3384165 B2 JP 3384165B2
Authority
JP
Japan
Prior art keywords
recognition
unit
voice
utterance
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01486495A
Other languages
English (en)
Other versions
JPH08211892A (ja
Inventor
照博 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP01486495A priority Critical patent/JP3384165B2/ja
Publication of JPH08211892A publication Critical patent/JPH08211892A/ja
Application granted granted Critical
Publication of JP3384165B2 publication Critical patent/JP3384165B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、話者の発声音を言葉と
して認識する音声認識装置、特に誤認識の検出に関す
る。 【0002】 【従来の技術】従来より、マンマシンインターフェース
の非常に優れた(操作者にとって負担が少ない)ものと
して、音声認識を利用したものが考えられている。例え
ば、各種の操作を操作者の発声によって指示できれば、
非常に操作性がよい。そこで、従来より、音声認識につ
いての各種の研究がなされ、各種音声認識装置について
の提案もある。 【0003】例えば、自動車などの車両において、オー
ディオ、エアコンディショナー、ナビゲーションシステ
ム等の機器を音声によって制御できれば、非常に便利で
あり、かつ運転者の負担を軽減できる。このためには、
発声音を音声認識装置によい制御のための言葉と認識
し、認識結果に基づいて、機器を制御すればよい。 【0004】しかし、音声認識は、その入力音声が雑音
を含まず、かつ発音明瞭な発音であれば、かなりの精度
で正しい認識が行われるが、走行中の車両では入力音声
がエンジン音等の雑音を含む可能性が高い。特に、アク
セルやブレーキを強く踏み込んだり、ギアチェンジをす
ると、車両内の雑音レベルが大きく変化する可能性が高
い。 【0005】そこで、特開平4ー24696号公報にお
いては、車両のアクセルブレーキなどの運転操作状態を
検出する手段を設け、車両内の雑音が大きく変化すると
考えられる操作を検出した場合に、音声認識装置にこれ
についての信号を送る。そして、この場合には、音声認
識装置への音声信号の入力をキャンセルして誤認識を防
止する。このような装置によって、運転操作に起因する
車内騒音の増加に伴う誤認識を低減することができる。 【0006】 【発明が解決しようとする課題】しかし、上記従来の音
声認識装置においては、通常走行時におけるエンジン音
その他の雑音が考慮されていない。音声認識における正
しい認識の確率を上昇するためには、できるだけ多くの
雑音を排除することが望ましい。また、自動車の場合、
音声認識の対象は、運転者の発声である場合が多い。運
転者は、アクセル、ブレーキ、ステアリング操作などの
各種の操作を行っており、その操作状態によっては、十
分明確な発声が行えない場合もある。例えば、発声の途
中で急ブレーキをかけたときなどは、その発声音声は正
しい認識を行えないものである場合が多い。従って、こ
のような場合も考慮して音声認識を行うことが望まれ
る。 【0007】本発明は、上記課題に鑑みなされたもので
あり、雑音や話者の発声状態を考慮してより正しい認識
が行える音声認識装置を提供することを目的とする。 【0008】 【課題を解決するための手段】本発明は、話者の発声音
声から音声信号を発生する音声入力部と、前記音声入力
部から入力された音声信号を所定の言葉として認識処理
する認識部と、車両の操作状況を検出して、話者が正常
な発声を行える状態にあるか否かという話者の発声状態
を検出する発声状態検出部と、発声状態検出部における
検出結果に基づき、話者の誤発声レベルを判断する発声
状態判断部と、前記認識部での認識結果における一致度
と前記発声状態判断部における誤発声レベルに基づき認
識部における認識結果についての誤認識の確率を判断す
る認識結果判断部と、を含み、前記認識結果判断部が誤
認識が高いと判断したときにはその時の認識部の出力を
キャンセルすることを特徴とする。 【0009】 【0010】 【作用】本発明によれば、認識部において上述の場合と
同様の普通の音声認識を行う。そして、発声状態検出部
において話者の発声の状態を検出する。例えば、高速で
カーブしているときであり、運転者が緊張しているとき
には、声がうわずって、正常なときの音声とは異なる場
合もある。このようなことを発声状態検出部において検
出し、この検出結果に応じて正常な発声が行われないと
判断された場合には、その時に認識部における認識結果
をキャンセルする。 【0011】このようにして、本出願の発明によって、
誤認識の発声を効果的に防止して効率的な音声認識が行
える。 【0012】 【実施例】以下、本発明の実施例について、図面に基づ
いて説明する。 【0013】「実施例」 図1は、実施例の全体構成を示すブロック図であり、マ
イクロフォン30には、認識部32が接続されており、
マイクロフォン30で収集された音声が音声信号として
認識部32に供給される。認識部32には、認識辞書3
4が接続されており、認識部32は、入力音声を後述の
主認識部12と同様に音声認識する。そして、認識した
言葉についてのデータとその距離が認識結果として、認
識結果判断部36に供給される。認識結果判断部36に
は、発声状態判断部38が接続されており、認識結果判
断部36は発声状態判断部38からの情報に基づき認識
部32における認識結果の信頼性を判定する。そして、
認識結果判断部36における判断結果において信頼性が
高いとされた場合には、認識部32における認識結果を
そのまま出力する。一方、信頼性が低いと判断された場
合には、認識部32における認識結果を無効として、音
声の再入力を促す。 【0014】そして、本実施例では、発声状態判断部3
8に各種センサからの信号が供給されている。すなわ
ち、ステアリングセンサ40からの操舵情報、アクセル
センサ42からのアクセル操作状況についての情報、ク
ラッチセンサ44からのクラッチ操作状況についての情
報、ブレーキセンサ46からのブレーキ操作状況につい
ての情報、シフトレバーセンサ48からのシフトレバー
の操作状況についての情報、コンビスイッチセンサ50
からのワイパーやウインカーの操作状況についての情
報、シートセンサ52からのシート位置を移動させてい
るかの情報、車速センサ54からの車両の速度、加速度
についての情報、心拍センサ56からの運転者の心拍数
についての情報等が発声状態判断部38に供給される。
なお、運転者の瞬きの状態なども、運転者の緊張度と関
係があるためこれを検出するとよい。 【0015】発声状態判断部38は、各種センサから供
給される情報に基づいて、発声者のの状態を判定する。
例えば、急加速、急ブレーキ、急ハンドルなどの運転状
態では、運転者は通常通りの発声はできないと考えられ
る。また、シフトチェンジ時、ウインカー操作時、シー
ト移動操作時、高速走行時、高心拍数時等にも発声が正
常でなくなる確率が高い。発声状態判断部38は、これ
らの情報に基づいて、発声者が正しく発声したかを判定
する。この判定は、例えば、ファジー推論によったり、
各種センサからの出力状態に応じたマップを予め作成し
ておきこれに基づいて行う。そして、発声状態の判断結
果が認識結果判断部に送られ、認識結果判断部36が認
識部32の信頼性を発声状態判断部38からの情報に基
づいて判定する。すなわち、認識部32から供給される
認識結果における距離がある程度大きい場合であって、
発声状態がある程度以上正常でない場合には、認識結果
が信頼できないとして、この出力を無効にする。一方、
発声状態が正常であれば、認識結果をそのまま出力す
る。 【0016】また、発声状態によって、声の質が異なる
場合も多い。例えば、緊張している場合には、声が上ず
ることが多い。そこで、このような状態に応じた複数の
辞書を用意しておくことが好適である。すなわち、認識
辞書34内に、正常状態の時に使用する辞書の他に、緊
張した状態における標準音声についてのデータを記憶す
る辞書を設けておき、発声状態判断部38の判断結果に
基づき、使用する辞書を切り換えることで、音声認識の
精度を向上することができる。 【0017】さらに、認識が正常に行えなかった場合
に、再度の入力を促し、入力された音声を分析した結果
から1回目の判定結果を評価し、この評価内容を学習し
ていき、認識結果判断部36の判断に反映させてもよ
い。学習によって、辞書を書き換えることも好適であ
る。 【0018】「関連構成例」 図2は、本発明に関連する雑音低減のための構成例の全
体構成を示すブロック図であり、運転者などの発声音声
を電気信号である音声信号に変換するマイクロフォン1
0を音声入力部として有している。マイクロフォン10
から出力された音声信号は、主認識部12に入力され
る。この主認識部12には、認識辞書14が接続されて
おり、主認識部12は、認識辞書14を利用して、入力
される音声信号の音声認識を行う。そして、主認識部1
2は、主認識結果を出力する。一方、音声信号は副認識
部16にも入力される。この副認識部16には、リジェ
クト辞書18が接続されており、副認識部16はリジェ
クト辞書18を利用して、入力される音声信号の音声認
識を行う。そして、副認識部16は、副認識結果を出力
する。 【0019】主認識部12および副認識部16は、認識
結果判断部20が接続されており、この主認識結果およ
び副認識結果はこの認識結果判断部20に供給される。
そして、認識結果判断部20は、主、副認識結果から主
認識結果の信頼性を判定し、主認識結果を出力するか否
かを判定する。そして、信頼性が所定以上であった場合
には、主認識結果を出力し、信頼性が所定以下であった
場合には、主認識結果をキャンセルし、音声信号の再度
の入力を求める。 【0020】ここで、主認識部12における音声認識処
理について説明する。主認識部12に接続されている認
識辞書14には、認識の対象となっている言葉(例え
ば、「エアコン」「ラジオ」「オン」「オフ」等の言
葉)についての標準音声についてのデータが記憶されて
いる。このデータの形式としては各種のものが考えられ
るが、例えば、線形予測コーディング(LPC)による
係数列(LPCケプストラム)のように、音声信号の周
波数特性を表す係数群を数値として持つことが好適であ
る。なお、車両の場合、その車両を使用する人間はある
程度限られる場合が多い。そこで、認識辞書14に記憶
するデータは、その特定人の音声から作成したものにす
るとよい。例えば、使用開始当初に、利用者に認識対象
となっている言葉について発声させ、これに基づいて認
識辞書14のデータを作成する。また、この場合利用者
は複数でもよい。 【0021】そして、主認識部12では、入力される音
声信号からLPCケプストラムを得ると共に、得られた
LPCケプストラムと認識辞書に記憶されている各単語
のLPCケプストラムとの差を距離として算出し、最も
近いものを選択する。そして、選択された言葉について
のデータとその距離を主認識部12における認識結果と
する。なお、ここで算出される距離は、選択された言葉
と入力音声の一致度が高いほど小さくなる。また、距離
が最短のものでもその距離が所定値以上であった場合に
は、認識不能とするとよい。 【0022】一方、副認識部16に接続されているリジ
ェクト辞書18には、「えー」、「あのー」、くしゃみ
の音、ゴットンという音等、マイクロフォン10から入
力されると考えられる認識辞書14にない(認識対象で
ない)音についてのデータ(LPCケプストラム)が記
憶されている。そして、副認識部16は、入力されてく
る音声信号のLPCケプストラムを算出すると共に、こ
れをリジェクト辞書18に記憶されているデータとの距
離を演算算出し、最も近いもの選択する。そして、選択
された言葉についてのデータとその距離を主認識部12
における認識結果とする。なお、入力音声信号について
のLPCケプストラムの算出は、これのための算出部を
設け、算出結果を主認識部12および副認識部16に供
給するとよい。 【0023】そして、認識結果判断部20は、主認識部
12および副認識部16から出力される距離を比較し、
副認識部16において得た距離の方が小さいときには、
主認識部12における認識結果を無効にする。そして、
スピーカを通じて、再度の発声を促す。一方、主認識部
12において得た距離の方が小さいときには、主認識部
12において得た認識結果を採用し、これを出力する。
例えば、認識結果がエアコンをオンする指令であれば、
この認識結果に基づきエアコンをオンする。 【0024】また、副認識部16において、「えー」、
「あのー」、くしゃみの音等通常の音声に追加されるよ
うな言葉については、入力音声における該当区間を検出
するとよい。そして、追加された言葉について認識でき
たときには、このデータを主認識部12に伝える。主認
識部12は、このデータに基づいて、入力音声の中から
のこの区間を除外して、音声認識処理を行う。これによ
って、主認識部12における音声認識の信頼性を大幅に
上昇することができる。このような処理は、副認識部1
6から主認識部12に直接信号を供給して行ってもよい
し、認識結果判断部20が主副認識部12、16の認識
結果から判定し、主認識部12に音声区間の再設定の指
令を送り、主認識部12が音声区間を再設定して、音声
認識をやり直してもよい。 【0025】 【発明の効果】以上説明したように、本発明によれば、
発声状態検出部において、話者の状態を検出し、この検
出結果に応じて正常な発声が行われないと判断された場
合には、その時に認識部における認識結果をキャンセル
する。これによって、誤認識の発声を効果的に防止する
ことができる。
【図面の簡単な説明】 【図1】 実施例の構成を示すブロック図である。 【図2】 関連構成例の構成を示すブロック図である。 【符号の説明】 10 マイクロフォン、12 主認識部、14 認識辞
書、16 副認識部、18 リジェクト辞書、20 認
識結果判断部、30 マイクロフォン、32認識部、3
4 認識辞書、36 認識結果判断部、38 発声状態
判断部。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 3/00 561A (56)参考文献 特開 平1−158498(JP,A) 特開 昭61−57996(JP,A) 特開 昭63−132300(JP,A) 特開 昭58−76893(JP,A) 特開 昭63−191198(JP,A) 特開 平3−129400(JP,A) 特開 平2−308299(JP,A) 特開 平5−119792(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 G10L 15/28

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 話者の発声音声から音声信号を発生する
    音声入力部と、 前記音声入力部から入力された音声信号を所定の言葉と
    して認識処理する認識部と、車両の操作状況を検出して、 話者が正常な発声を行える
    状態にあるか否かという話者の発声状態を検出する発声
    状態検出部と、 発声状態検出部における検出結果に基づき、話者の誤発
    声レベルを判断する発声状態判断部と、 前記認識部での認識結果における一致度と前記発声状態
    判断部における誤発声レベルに基づき認識部における認
    識結果についての誤認識の確率を判断する認識結果判断
    部と、 を含み、 前記認識結果判断部が誤認識が高いと判断したときには
    その時の認識部の出力をキャンセルすることを特徴とす
    る音声認識装置。
JP01486495A 1995-02-01 1995-02-01 音声認識装置 Expired - Fee Related JP3384165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01486495A JP3384165B2 (ja) 1995-02-01 1995-02-01 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01486495A JP3384165B2 (ja) 1995-02-01 1995-02-01 音声認識装置

Publications (2)

Publication Number Publication Date
JPH08211892A JPH08211892A (ja) 1996-08-20
JP3384165B2 true JP3384165B2 (ja) 2003-03-10

Family

ID=11872899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01486495A Expired - Fee Related JP3384165B2 (ja) 1995-02-01 1995-02-01 音声認識装置

Country Status (1)

Country Link
JP (1) JP3384165B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015068033A1 (en) * 2013-11-05 2015-05-14 Toyota Jidosha Kabushiki Kaisha Voice recognition device for vehicle
WO2017108142A1 (en) * 2015-12-24 2017-06-29 Intel Corporation Linguistic model selection for adaptive automatic speech recognition

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3157788B2 (ja) 1998-11-12 2001-04-16 埼玉日本電気株式会社 携帯型情報端末
JP4652504B2 (ja) * 1999-09-09 2011-03-16 クラリオン株式会社 音声認識装置および音声認識ナビゲーション装置
JP3567864B2 (ja) 2000-07-21 2004-09-22 株式会社デンソー 音声認識装置及び記録媒体
JP4784056B2 (ja) * 2004-08-18 2011-09-28 パナソニック電工株式会社 音声認識機能付制御装置
JP4608670B2 (ja) * 2004-12-13 2011-01-12 日産自動車株式会社 音声認識装置および音声認識方法
JP4727330B2 (ja) * 2005-07-15 2011-07-20 三菱電機株式会社 音声認識装置及び音声認識プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015068033A1 (en) * 2013-11-05 2015-05-14 Toyota Jidosha Kabushiki Kaisha Voice recognition device for vehicle
WO2017108142A1 (en) * 2015-12-24 2017-06-29 Intel Corporation Linguistic model selection for adaptive automatic speech recognition

Also Published As

Publication number Publication date
JPH08211892A (ja) 1996-08-20

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
JP4859982B2 (ja) 音声認識装置
US8005673B2 (en) Voice recognition device, voice recognition method, and voice recognition program
JP3567864B2 (ja) 音声認識装置及び記録媒体
EP2051241B1 (en) Speech dialog system with play back of speech output adapted to the user
JP3322140B2 (ja) 車両用音声案内装置
JP4357867B2 (ja) 音声認識装置、音声認識方法、並びに、音声認識プログラムおよびそれを記録した記録媒体
US20230102157A1 (en) Contextual utterance resolution in multimodal systems
WO2007069377A1 (ja) 音声認識装置
JP4104313B2 (ja) 音声認識装置、プログラム及びナビゲーションシステム
JP3384165B2 (ja) 音声認識装置
JP2000322078A (ja) 車載型音声認識装置
JP3119510B2 (ja) 音声認識装置
US20070043570A1 (en) Method of controlling a dialoging process
JP7392827B2 (ja) 音声認識装置及び音声認識方法
JP6644455B1 (ja) 自動車の加速制御システム、方法、プログラム
JPS59180600A (ja) 車載用音声認識制御装置
JP2002149191A (ja) 音声入力装置
JPS59180599A (ja) 車載用音声認識制御装置
JP2004184803A (ja) 車両用音声認識装置
JPH09127979A (ja) 車両用音声認識装置
KR102527346B1 (ko) 차량용 음성 인식 장치, 이를 이용한 차량의 주행상태를 고려한 응답 제공 방법 및 컴퓨터 프로그램
JP4190735B2 (ja) 音声認識方法および装置とナビゲーション装置
US20210303263A1 (en) Dialogue system and vehicle having the same, and method of controlling dialogue system
US20230238020A1 (en) Speech recognition system and a method for providing a speech recognition service

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091227

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees