JPH03160499A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03160499A
JPH03160499A JP1301133A JP30113389A JPH03160499A JP H03160499 A JPH03160499 A JP H03160499A JP 1301133 A JP1301133 A JP 1301133A JP 30113389 A JP30113389 A JP 30113389A JP H03160499 A JPH03160499 A JP H03160499A
Authority
JP
Japan
Prior art keywords
voice
section
pattern
acoustic
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1301133A
Other languages
English (en)
Inventor
Shinichi Tsurufuji
鶴藤 真一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP1301133A priority Critical patent/JPH03160499A/ja
Publication of JPH03160499A publication Critical patent/JPH03160499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は音声や音楽などの音響を出力する音響機器、例
えばTV、ステレオなどの周囲雑音源の近傍でも有効な
音声認識を可能とできる音声認識装置に関する。
(ロ)従来の技術 従来の音声認識装置は、ステレオなどの音響機器の近傍
では、この機器の出力音響が周囲雑音となり、誤認識を
多発する危惧があった。特に、このような機器自体を音
声認識装置で操作使用とする場合は、音響機器が発する
音声や音楽で音声認識装置が勝手に動作する危惧を免れ
ることはでさなかった。
従って、このような誤動作防止の為に、例えば音声入力
を行う場合には、その音声入力期間だけ音響機器の出力
音を小さくするようになした音声認識装置が提案されて
いる[特開昭63−29755号公報]。しかしながら
、このような装置では、音響機器からの音声や音楽の中
断を強いられる不都合があるばかりか、以下の問題が残
る。
即ち、上述の装置では、音声入力期間を指定するための
スイッチ操作が必要であり、また、このスイッチ操作を
回避してマイクロホンへの音声入力の音圧レベルにて音
声入力期間を検出するようにしても、やはり音響機器か
らの音響がこの検出動作を妨げる危惧を完全には回避で
きない。
(ハ)発明が解決しようとする課題 本発明は、雑音源たる音響機器の音量制御を行うことな
しにこの雑音による誤認識を回避できる音声認識装置を
提供するものである。
(二)課題を解決するための手段 本発明の音声認識装置は、入力された音声を分折する音
声分析部と該音声分析部で分析された音声から音声パタ
ンを作成する第1パタン作成部、該第1パタン作底部で
作威された音声パタンをあらかじめ用意された標準的な
音声パタンと比較して認識結果を出力する識別部を有す
るものであって、更に、上記音声分析部とは別に周囲音
響を分析する音響分析部と該音響分析部で分析された周
囲音響から音響パタンを作成する第2パタン作成部、該
第2パタン作成部で作威された音響パタンと上記第1パ
タン作成部で作成された音声パタンとの一致を判定する
判定部を設け、該判定部にて第1パタン作成部で作成さ
れた音声パタンと第2パタン作成部で作成された音響パ
タンとか一致すると判定した場合には、上記識別部の比
較処理を禁止あるいはその出力を無効にするものである
(ホ)作用 本発明の音声認識装置によれば、音声認識用の音声分析
部とは別に周囲音響音響を分析する音響分析部を設け、
音声認識用の音声と音響機器から出力される音響との一
致の度合いにより、音声分析部に入力された音が周囲音
響であるかどうかを判定する手段を設け、この判定手段
により上記音声分析部が音声でなくて周囲雑音を分析し
ていると見做せる場合には、この時の音声パタンに対す
る音声認識を行わないようにしたので、音声の誤認識を
回避することができる。
(へ)実施例 第1図に、本発明の音声認識装置の構戊のブロック図を
示す。同図に於で、1は音声分析部であり、話者に向け
られてセットされたマイク9によって入力された音響信
号から音声時間領域を切り出し、この領域の音声信号を
周波数分析してスペクトル分析あるいはケプスドラム分
析などの音声分析を行う。2は第1パタン作成部であり
、音声分析部lでの分析結果をサンプリング正規化して
ベクトルパタンあるいはケプストラムパタンなどで表さ
れる音声パタンを得る。3は音声パタン格納部であり、
あらかじめ標準的な特定あるいは不特定の音声を分析し
て抽出した複数の音声パタンを認識時の標準パタンとし
て格納している。4は識別部であり、第1パタン作成部
2で作成された音声パタンをあらかじめ音声パタン格納
部3に格納されている複数の標準パタンと順番にマッチ
ングを行い、最も類似しているものを認識結果として出
力するところである。
以上の溝或は従来装置の構戊と同じであり、本発明装置
が特徴とするところは、以下の構戒を付設した点にある
同図の5は音響分析部であり、カーステレオなどの音響
機器8で出力された音声あるいは音楽を分析するところ
であり、その分析手法は上記音声分析部5と同一のスペ
クトル分析あるいはケプストラム分析が採用される。
6は第2パタン作成部であり、該音響分析部5で分析さ
れた音響に対して上記第1パタン作成部2と同様のサン
プリング正規化によって音響パタンを得る。
7は音声判定部であり、第1パタン作成部2と第2パタ
ン作成部6で同時に作成された両パタンを比較して上記
識別部4の識別処理を行うかどうかを判定するところで
ある。
以下に、これら音響分析部5、第2パタン作成部6、音
声判定部7の処理を中心に本発明装置の動作について解
説する。
まず、音声分析部1及び音響分析部5について説明する
これら音声分析部1及び音響分析部5は同一構或であり
、同時に一定時間毎(例えば5 msec)にサンプリ
ングされる。これらの分析部1.5の構戊は、従来装置
の分析部と同様に、第2図に示す如く、アンブ101、
ブリエンファシス102、バンドバスフィルタ103、
ADコンハータlO4、音声検出回路105、バツファ
106などで構或される。即ち、音声分析部1ではマイ
ク9から入力された音はこのアンプ101で増幅され、
プリエンファシス102で高城強調がかけられ、バンド
パスフィルタ103によりフィルタ分析されADコンバ
ータ104でデイジタル値に変換される。一方の音声検
出回路105ではADコンバータ104でデイジタル値
に変換されたデータから音声の語頭をチェックし、切り
出しのしきい値を越えた場合には、データをバツファ1
06に貯える。これと同時に音響分析部5に音声の取り
組みの開始を伝達する。
基本的に音声分析部1と同溝戊の音響分析部5では、上
記音声分析部lから音声の取り組みの開始の伝達を受け
ると音響出力装置10から出力された音響信号を受信し
て、これを上述と同様に分析した分析データをそのバッ
ファ106に取り込む。
続いて、音声分析部1は分析を継続しながら音声検出回
路105において語尾の検出を行い、語尾と判定される
までそのバッファ106にデータを取り込み、語尾と判
定されると取り込みを終了するとともに音響分析部5に
取り込みの終了を伝達する。このように音声分析部1か
ら取り込みの終了の伝達をうけた音響分析部5はカース
テレオからの音の分析を終了し、そのバツファ106の
取り込みを終了する。
上述の如くして、音声分析部lと音響分析部5との分析
時間を同期せしめることができる。
なお、これら両分析部は、個別の7)一ド構或で示した
が、ディジタル回路部分は時分割的に共通使用できる。
次に、第1パタン作成部2及び第2ノ{タン作成部6に
ついて説明する。
これらのパタン作成部2,6もまた、従米装置のパタン
作底部を採用でき、ともに同一構戊で実現できる。該第
1パタン作成部2では、上記音声分析部lで分析された
分析結果を音声認識に適する音声パタンに変換される。
一方、音響分析部5で分析された分析結果は第2パタン
作成部6で、第1パタン作成部2と同じ手法で音響ノく
タンに変換される。従って、これらのパタン作成部もま
た同一ハードを時分割使用しても良b)。
更に、音声判定部7について説明する。この音声判定部
7では、第1パタン作成部2で作成された音声パタンと
第2パタン作成部6で作成された音響パタンのマッチン
グを行う。このマ・ノチングは通常は線形マッチングを
行い、二つのノく夕冫の類似度を計算する。この類似度
とあらかじめ定められたしきい値により音声であるかど
うかの判定を行う。
即ち、類似度がしきい値より小さく両者が類似している
時、これを一致と判定し、音声パタンがカーステレオか
らの音響によるものと見做せるので、この場合は識別部
4の処理動作を禁止する。
あるいは、この場合識別部4からの識別結果の出力を遮
断して無効にしてもよい。一方、これとは逆に、類似度
がしきい値より大きく両者が類似していない時は、これ
を不一致と判定し、話者がマイクに音声入力したものと
見做せるので、この場合は識別部4にその胸の信号が伝
達され、該識別部4は識別動作を行う。従って、この識
別部4の動作禁止、あるいは出力無効によって、音響機
唇8がどんなに大出力でマイク9への音響の回り込みが
あっても、これとは別のマイク9への入力があるまでは
、音声認識しないことになる。
府して、該識別部4は上記判定部7の結果が、音声入力
を表しているという判断を受けて初めて音声パタン格納
部3から順次パタンを取り出しマッチングを行い、最も
類似しているパタンを認識結果として出力する。
更に、具体例を挙げて、説明を加える。
該実施例の場合の前提条件としては、音声認識による操
作制御の対称が周囲雑音を発する音響機器8であるカー
ステレオそのちとする。この場合カーステレオからの音
響信号の音響分析部5への送信は、カーステレオのスピ
ーカ付近に設けたマイクを用いてもよいが、直接カース
テレオのオーディオ出力端子から音響分析部5の入力に
結線するすれば、上記のマイクは不要になる。
まず、カーステレオ(8)からの音楽により音声分析部
1が音声の切り出しを行った場合について説明する。
ここで音声分析部lのアンプは、通常の音楽の音圧に対
しては音声分析部1が音声時間領域をしてそれを切り出
さないようなレベルに設定しておけば、音楽を分析して
しまう可能性を低減できることになる。斯して、カース
テレオ(8)から大きな音が出力されるとドライバー用
にセットされたマイク9にこれが入力され、音声分析部
lは、カーステレオ(8)からの音声の取り込みを開始
して、音響分析部5に於ても同時に取り込みを開始する
そして分析を続けて語尾のチェックを行い語尾を検出す
ると音声判定部7により音声の判定を行う。この場合に
は、音声分析部1の入力もカーステレオ8のみであるた
め、第1パタン作成部2で作威された音声パタンと第2
パタン作成部6で作成された音響パタンは一致するため
類似度は大きくなり、音声判定部7は、音声認識の為の
ドライバーの音声ではないと判断する。ここでカーステ
レオ(8)の出力がマイク9に入力されるまでの時間的
な誤差により完全には一致しないが、音響分析部5に時
rrI遅れの回路を付加することによりこの誤差を少な
くすることが可能である。
また音声判定部7のマッチングに線形シフトマッチング
などを用いることにより誤差を吸収することも可能であ
る。
次に、カーステレオ(8)が音響を出力中に音声により
制御を行う場合について説明する。
音声パタン格納部3には「イジエクト」、「ブレイ」、
「停止」、r巻戻し」、「早送りj等があらかじめカー
ステレオの音声制御用に分析されたパタンが格納されて
いるとする。ドライバーがマイク9に「停止」と発声す
ると音声分析部1はカーステレオ(8)からの例えば音
楽とマイク9からのドライバーの音声「停止」が混在し
たものの分析を行う。音声分析部lの音声検出回路l0
5は、「停止」の語頭を検出して音声の取り込みを開始
すると同時に、音響分析部5に取り込み開始を伝達する
。これを受けた音響分析部5はカーステレオ(8)の出
力音を音声分析部1の音声検出回路105が語尾の検出
するまで分析し、これを取り込む。
このようにして音声分析部lと音響分析部5での分析が
終了すると第1パタン作成部2及び第2パタン作成部6
でそれぞれパタンに変換される。
変換されたパタンは音声判定部7により音声であるかど
うかが判定されるが、音声分析部1で分析されたパタン
はドライバーの音声とカーステレオ(8)の音響とが混
在されているので、音響分析部5で分析されたパタンと
は一致せず、ドライバーの音声入力があったと判断し、
識別部4に識別動作の開始を実行させる信号を伝達する
。識別部4は音声パタン格納部3からまず”イジエクト
”のパタンを取り込んでマッチングを行い、続いて「プ
レイ」、「停止」と順次パタンの最後までマッチングを
行い、最も類似度が大きい「停止」を認識結果として出
力する。この結果、ドライバーの意図どおり、カーステ
レオ(8)の動作を停止させることができる。
ここでは、第1パタン作成部2で作成されたパタンをそ
のまま用いたが、第1パタン作成部2で作處されたパタ
ンから第2パタン作成部で作成されたパタンを引いたも
のを識別部4の処理に用いると雑音戊分が相殺された音
声底分だけのパタンか得られ、これによって更に高い認
識性能が得られる。
上述の説明では、音声認識装置の音声制御対象自身が周
囲音響雑音源である場合を示したが、本発明はこれに限
定されるのもでなく、例えば、カーステレオの音響下で
パワーウィンドの開閉動作を音声制御する場合であって
も本発明を採用できる。
(ト)発明の効果 本発明の音声認識装置によれば、話者の音声入力がない
かぎり、周囲雑音を認識する不都合を回避でき、誤認識
の低減が図れる。
【図面の簡単な説明】
第1図は本発明の音声認識装置の構戊を示すブロック図
、第2図は第1図の本発明装置の要部の構戊図である。 1・・・音声分析部、2・・・第1パタン作成部、3・
・・音声パタン格納部、4・・・識別部、5・・・音響
分析部6・・・第2パタン作成部、7・・・音声判定部
、8・・・音響出力装置、9・・・マイク。

Claims (3)

    【特許請求の範囲】
  1. (1)入力された音声を分析する音声分析部と該音声分
    析部で分析された音声から音声パタンを作成する第1パ
    タン作成部、該第1パタン作成部で作成された音声パタ
    ンをあらかじめ用意された標準的な音声パタンと比較し
    て認識結果を出力する識別部を有する音声認識装置に於
    て、 上記音声分析部とは別に周囲音響を分析する音響分析部
    と該音響分析部で分析された周囲音響から音響パタンを
    作成する第2パタン作成部、該第2パタン作成部で作成
    された音響パタンと上記第1パタン作成部で作成された
    音声パタンとの一致を判定する判定部を設け、該判定部
    にて第1パタン作成部で作成された音声パタンと第2パ
    タン作成部で作成された音響パタンとが一致すると判定
    した場合には、上記識別部の比較処理を禁止あるいはそ
    の出力を無効にすることを特徴とした音声認識装置。
  2. (2)上記音響分析部の分析時間領域を上記音声分析部
    の分析時間領域に同期せしめることを特徴とした請求項
    1記載の音声認識装置。
  3. (3)上記音響分析部は、第1音声分析部に入力される
    音声に影響を及ぼす音響機器の出力信号が直接入力され
    ることを特徴とした音声認識装置。
JP1301133A 1989-11-20 1989-11-20 音声認識装置 Pending JPH03160499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1301133A JPH03160499A (ja) 1989-11-20 1989-11-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1301133A JPH03160499A (ja) 1989-11-20 1989-11-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03160499A true JPH03160499A (ja) 1991-07-10

Family

ID=17893212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1301133A Pending JPH03160499A (ja) 1989-11-20 1989-11-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPH03160499A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171077A (ja) * 2004-12-13 2006-06-29 Nissan Motor Co Ltd 音声認識装置および音声認識方法
JP4704609B2 (ja) * 2001-05-31 2011-06-15 九州日立マクセル株式会社 マッサージ機
WO2014103099A1 (ja) * 2012-12-28 2014-07-03 パナソニック株式会社 音声認識付き機器及び音声認識方法
WO2020128552A1 (ja) * 2018-12-18 2020-06-25 日産自動車株式会社 音声認識装置、音声認識装置の制御方法、コンテンツ再生装置、及びコンテンツ送受信システム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4704609B2 (ja) * 2001-05-31 2011-06-15 九州日立マクセル株式会社 マッサージ機
JP2006171077A (ja) * 2004-12-13 2006-06-29 Nissan Motor Co Ltd 音声認識装置および音声認識方法
JP4608670B2 (ja) * 2004-12-13 2011-01-12 日産自動車株式会社 音声認識装置および音声認識方法
WO2014103099A1 (ja) * 2012-12-28 2014-07-03 パナソニック株式会社 音声認識付き機器及び音声認識方法
CN104956436A (zh) * 2012-12-28 2015-09-30 株式会社索思未来 带有语音识别功能的设备以及语音识别方法
JPWO2014103099A1 (ja) * 2012-12-28 2017-01-12 株式会社ソシオネクスト 音声認識付き機器及び音声認識方法
US9792902B2 (en) 2012-12-28 2017-10-17 Socionext Inc. Device including speech recognition function and method of recognizing speech
US10262653B2 (en) 2012-12-28 2019-04-16 Socionext Inc. Device including speech recognition function and method of recognizing speech
WO2020128552A1 (ja) * 2018-12-18 2020-06-25 日産自動車株式会社 音声認識装置、音声認識装置の制御方法、コンテンツ再生装置、及びコンテンツ送受信システム
CN113168834A (zh) * 2018-12-18 2021-07-23 日产自动车株式会社 声音识别装置、声音识别装置的控制方法、内容播放装置以及内容发送接收***
JPWO2020128552A1 (ja) * 2018-12-18 2021-11-18 日産自動車株式会社 音声認識装置、音声認識装置の制御方法、コンテンツ再生装置、及びコンテンツ送受信システム
US11922953B2 (en) 2018-12-18 2024-03-05 Nissan Motor Co., Ltd. Voice recognition device, control method of voice recognition device, content reproducing device, and content transmission/reception system

Similar Documents

Publication Publication Date Title
US12026241B2 (en) Detection of replay attack
US10586534B1 (en) Voice-controlled device control using acoustic echo cancellation statistics
US9881616B2 (en) Method and systems having improved speech recognition
US4811399A (en) Apparatus and method for automatic speech recognition
EP0077194B1 (en) Speech recognition system
KR102374054B1 (ko) 음성 인식 방법 및 이에 사용되는 장치
CN105049802B (zh) 一种语音识别执法记录仪及其识别方法
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP3838159B2 (ja) 音声認識対話装置およびプログラム
US7177806B2 (en) Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system
JP2002236494A (ja) 音声区間判別装置、音声認識装置、プログラム及び記録媒体
JPH03160499A (ja) 音声認識装置
JP2701431B2 (ja) 音声認識装置
JP2005338454A (ja) 音声対話装置
KR100587260B1 (ko) 음향 기기의 음성인식장치
JP4143487B2 (ja) 時系列情報制御システム及びその方法並びに時系列情報制御プログラム
JPS6367197B2 (ja)
JP2010164992A (ja) 音声対話装置
JP2000039900A (ja) 自己診断機能付き音声対話装置
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
JPS5914769B2 (ja) 音声機器
JPS6126678B2 (ja)
JPH0535294A (ja) 音声認識装置
US20200321022A1 (en) Method and apparatus for detecting an end of an utterance
JPH05197385A (ja) 音声認識装置