JP2754960B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2754960B2
JP2754960B2 JP3187944A JP18794491A JP2754960B2 JP 2754960 B2 JP2754960 B2 JP 2754960B2 JP 3187944 A JP3187944 A JP 3187944A JP 18794491 A JP18794491 A JP 18794491A JP 2754960 B2 JP2754960 B2 JP 2754960B2
Authority
JP
Japan
Prior art keywords
level
voice
similarity
audio
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3187944A
Other languages
English (en)
Other versions
JPH0535294A (ja
Inventor
文男 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP3187944A priority Critical patent/JP2754960B2/ja
Publication of JPH0535294A publication Critical patent/JPH0535294A/ja
Application granted granted Critical
Publication of JP2754960B2 publication Critical patent/JP2754960B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を用いて外部装置
の制御を行うことができるようにした音声認識装置に係
わり、特に雑音や騒音が大きな状況下のように音声を誤
認識しやすい状況で、外部装置の制御の誤りを防止でき
るようにした音声認識装置に関する。
【0002】
【従来の技術】音声の認識を行って外部装置の制御を行
う音声認識装置が各種実用化されている。このような装
置では、すべての音あるいは音声を認識の対象とすると
雑音等に影響されやすいという問題がある。そこで、従
来からある種の音声認識装置では、音声を検出する閾値
を高く設定し、大きな音声が入力した場合のみ音声認識
を行って外部装置の制御を行うという方法を採用してい
た。また、他の音声認識装置では、音声検出のための閾
値を通常レベルに設定する一方、予め定めた命令語等の
言葉が認識されるまでは音声認識の際の類似度の判定を
厳しくして誤認識の減少を図り、外部装置の制御を行う
といった方法を採用していた。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
このような音声認識装置のうち前者の装置では、音声検
出のための閾値を越える大きな雑音が入力されると、外
部装置が動作してしまうことがあった。また後者の装置
では、音声のレベルを問題としていないので、騒音や装
置の周囲で生じた会話等が命令語と誤認識さる場合があ
り、このような場合には使用者が外部装置の制御を望ま
ないときであっても外部装置が誤動作してしまうことが
あるといった不都合があった。
【0004】そこで本発明の目的は、誤認識による外部
装置の誤った制御を防止することのできる音声認識装置
を提供することにある。
【0005】
【課題を解決するための手段】本発明では、音声の検出
を行う音声検出部と、この音声検出部が音声を検出した
時点の直前の雑音信号レベルに連動させて最小音声レベ
ルを設定する最小音声レベル設定手段と、音声検出部が
音声の検出を終了させた時点でこの音声の最大レベルが
最小音声レベルよりも大きいか否かを比較するレベル比
較手段と、音声の最大レベルが最小音声レベルよりも大
きいと判定されたときその音声と予め登録された音声標
準パタンとの類似度を判定する類似度判定手段と、類似
度の判定結果を音声の認識結果として出力する認識結果
出力手段とを音声認識装置に具備させる。
【0006】すなわち請求項1記載の発明では、音声検
出部が音声を検出した時点の直前の雑音信号レベルに連
動させて最小音声レベルを設定し、音声が検出されたら
その音声における最大レベルが最小音声レベルよりも大
きい場合のみ、音声標準パタンとの類似度を判定するよ
うにし、誤認識による外部装置の誤った制御を防止でき
るようにした。さらに請求項2記載の発明では、請求項
1記載の音声認識装置で、音声を分析し符号化する音声
分析部と、装置が認識対象とする音声を符号化して音声
標準パタンとして記憶する記憶部とを備え、類似度判定
手段はこの記憶部に記憶されている音声標準パタンと前
記音声分析部で符号化された音声とを比較して類似度を
判定することを特徴としている。 さらに請求項3記載の
発明では、請求項1記載の音声認識装置で、最小音声レ
ベル設定手段によって最小音声レベルが設定されたとき
音声検出中に予め登録された音声標準パタンとこの音声
との類似度を算出する類似度算出手段とを備え、類似度
判定手段は、レベル比較手段によって音声の最大レベル
が最小音声レベルよりも大きいと判定されたときこの類
似度算出手段によって算出された類似度が予め設定した
類似度判定値より高い類似度が得られたか否かを判定す
ることを特徴としている。 すなわち請求項3記載の発明
では、音声検出部が音声を検出した時点の直前の雑音信
号レベルに連動させて最小音声レベルを設定し、音声が
検出されたらその音声と予め登録された音声標準パタン
との類似度を算出するようにした。そして、音声の検出
が終了してその音声における最大レベルが最小音声レベ
ルよりも大きい場合のみ、この音声標準パタンとの類似
度を予め設定された類似度判定値と比較することにより
検出された音声が標準パタンと類似しているか否かを判
定するようにし、誤認識による外部装置の誤った制御を
防止できるようにした。
【0007】
【実施例】以下実施例につき本発明を詳細に説明する。
【0008】図1は本発明の一実施例における音声認識
装置の構成の概要を表わしたものである。話者の音声を
とらえるマイクロホン11から出力された音声信号12
は音声検出部13に入力される。レベル監視部14は、
この音声信号12の入力信号レベルを常時監視してい
る。検出された音声信号15は音声分析部16に入力さ
れて符号化され音声パタン17が抽出される。抽出され
た音声パタン17は類似度算出部18に入力される。類
似度算出部18は記憶部19に記憶された標準パタン2
1を用いて音声パタン17との類似度を算出する。ここ
で、標準パタン21とは命令音声の他に、数字等を符号
化したものである。
【0009】類似度算出部18で算出された類似度につ
いての結果22は、類似度判定部23に送られる。類似
度判定部23では予め設定した値よりも音声パタン17
の類似度が高い場合に、話者の音声が標準パタン21と
一致したものと判定する。この場合には認識結果24を
認識結果送出部25に送る。認識結果送出部25ではこ
れを基にして図示しない外部装置の制御のための制御信
号26を出力する。以上説明したレベル監視部14、音
声分析部16、類似度算出部18、記憶部19、類似度
判定部23および認識結果送出部25はそれぞれ制御部
27に接続されており、これによって制御が行われるよ
うになっている。
【0010】図2は、図1に示したレベル監視部を具体
的に表わしたものである。レベル監視部14は、音声検
出部13と接続されたレベル監視回路31と、レベル記
憶回路32およびレベル比較回路33によって構成され
ている。レベル監視回路31は、音声検出部13の入力
信号レベルを常時監視している。このレベル監視回路3
1に接続されたレベル記憶回路32では、音声の検出が
開始されるとこの音声検出の雑音信号のレベルに連動し
た最小音声レベルを設定し、これを記憶する。レベル比
較回路33は、音声検出中にレベル監視回路31が検出
した音声信号レベルとレベル記憶回路32の記憶した最
小音声レベルとを比較する。そして、音声検出の終了時
に、音声検出中の音声信号の最大レベルが最小音声レベ
ルを越えた場合に、制御部27に対して類似度判定を行
わせるための信号を送出するようになっている。なお、
このレベル監視部14は、図1に示した音声認識装置に
おける他の回路部分と共に、図示しないCPU(中央処
理装置)によって制御されている。この制御のためのプ
ログラムは、同じく図示しないROM(リード・オンリ
・メモリ)に格納されている。
【0011】以上のように構成された音声認識装置の動
作を図3と共に具体的に説明する。図1に示した音声認
識装置の記憶部19に記憶された制御音声の標準パタン
が「キドウ」であるとする。音声認識の制御動作が開始
されると、図3に示したように音声検出待ちの状態にな
る(ステップS101)。この状態で音声検出部13は
マイクロホン11からの信号を常に監視する。音声の検
出が開始されると(Y)、図2に示したレベル監視回路
31は音声分析部16の信号レベルを監視し、音声検出
開始直前の雑音信号のレベルに連動した最小音声レベル
を設定する(ステップS102)。すなわち、話者が
「○○○」と発声して、その音声の時間的に先端の部分
が検出されると、それと同時に最小音声レベルの設定が
行われる。この最小音声レベルは図2のレベル記憶回路
32に記憶される。
【0012】最小音声レベルが設定されると、レベル監
視回路31は音声レベルの監視を行い、レベル比較回路
33は、音声検出中にレベル監視回路31が検出した音
声信号レベルとレベル記憶回路32の記憶した最小音声
レベルとを比較する。これと同時に、記憶部19に記憶
された標準パタンと入力された音声パタンとの類似度の
算出が類似度算出部18で行われる(ステップS10
3)。
【0013】音声のレベル監視と音声パタンとの類似度
の算出は、音声の検出が終了するまで行われる(ステッ
プS104)。音声の検出が終了したら(Y)、レベル
比較回路33は、話者の発声した「○○○」における音
声の最大レベルが前記した最小音声レベルよりも高いか
どうかを判定する(ステップS105)。この結果とし
て、最小音声レベルと等しいかこれよりも低いと判定さ
れた場合には(N)、類似度判定部23で類似度の判定
を行うことなく、再びステップS101に戻って次の音
声の入力待ちの状態になる。
【0014】これに対して、話者の発声した「○○○」
における音声の最大レベルが最小音声レベルよりも高か
った場合には(ステップS105;Y)、類似度判定部
23で類似度の判定が行われる。そして、話者が登録し
た標準パタンと類似していない音声を発したと判定され
た場合には(ステップS106;N)、ステップS10
1に戻って次の音声の入力待ちの状態になる。
【0015】一方、話者が「キドウ」という音声を発し
た場合のように、予め設定した類似度判定値よりも高い
類似度が得られたような場合には標準パタンと類似であ
ると判定される(ステップS106;Y)。この場合、
認識結果24を受け取った認識結果送出部25は認識結
果に応じた制御信号26を外部装置に出力する(ステッ
プS107)。これにより、一連の動作が終了する(エ
ンド)。
【0016】
【発明の効果】以上説明したように本発明によれば、音
を検出した時点の直前における雑音レベルに連動させ
て最小音声レベルを設定し、これを越える音声信号が入
力した場合のみ音声標準パタンとの類似度を判定するこ
とにしたので、雑音の多い環境下や、周囲の会話による
雑音が発生した場合であっても、音声の誤検出による誤
認識を防止することができ、外部装置の誤制御を確実に
防止することができるという効果がある。さらに請求項
3記載の発明によれば、音声を検出した時点の直前にお
ける雑音レベルに連動させて最小音声レベルを設定し、
音声検出中に予め登録された音声標準パタンとの類似度
を算出するようにした。音声検出が終了すると、検出し
た音声の最大レベルがその最小音声レベルを越える場合
のみ、この類似度と予め設定された類似度判定値とを比
較して音声標準パタンと類似しているか否かを判定する
ようにして、音声の検出が終了した後に音声認識をさせ
るようにしたので、音声認識中にも他の音声検出を行う
ことができるようになる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声認識装置の構成
の概要を表わしたブロック図である。
【図2】図1に示したレベル監視部を具体的に表わした
ブロック図である。
【図3】本実施例の音声認識装置の制御の様子を表わし
た流れ図である。
【符号の説明】
11 マイクロホン 13 音声検出部 14 レベル監視部 16 音声分析部 18 類似度算出部 19 記憶部 23 類似度判定部 25 認識結果送出部 27 制御部 31 レベル監視回路 32 レベル記憶回路 33 レベル比較回路

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声の検出を行う音声検出部と、 この音声検出部が音声を検出した時点の直前の雑音信号
    レベルに連動させて最小音声レベルを設定する最小音声
    レベル設定手段と、 前記音声検出部が音声の検出を終了させた時点でこの音
    声の最大レベルが前記最小音声レベルよりも大きいか否
    かを比較するレベル比較手段と、 音声の最大レベルが最小音声レベルよりも大きいと判定
    されたときその音声と予め登録された音声標準パタンと
    の類似度を判定する類似度判定手段と、 類似度の判定結果を音声の認識結果として出力する認識
    結果出力手段とを具備することを特徴とする音声認識装
    置。
  2. 【請求項2】 音声を分析し符号化する音声分析部と、 装置が認識対象とする音声を符号化して音声標準パタン
    として記憶する記憶部とを備え、 前記類似度判定手段はこの記憶部に記憶されている音声
    標準パタンと前記音声分析部で符号化された音声とを比
    較して類似度を判定することを特徴とする請求項1記載
    の音声認識装置。
  3. 【請求項3】 前記最小音声レベル設定手段によって最
    小音声レベルが設定されたとき音声検出中に予め登録さ
    れた音声標準パタンとこの音声との類似度を算出する類
    似度算出手段とを備え、 前記類似度判定手段は、前記レベル比較手段によって音
    声の最大レベルが最小音声レベルよりも大きいと判定さ
    れたときこの類似度算出手段によって算出された類似度
    が予め設定した類似度判定値より高い類似度が得られた
    か否かを判定することを特徴とする請求項1記載の音声
    認識装置。
JP3187944A 1991-07-26 1991-07-26 音声認識装置 Expired - Fee Related JP2754960B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3187944A JP2754960B2 (ja) 1991-07-26 1991-07-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3187944A JP2754960B2 (ja) 1991-07-26 1991-07-26 音声認識装置

Publications (2)

Publication Number Publication Date
JPH0535294A JPH0535294A (ja) 1993-02-12
JP2754960B2 true JP2754960B2 (ja) 1998-05-20

Family

ID=16214908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3187944A Expired - Fee Related JP2754960B2 (ja) 1991-07-26 1991-07-26 音声認識装置

Country Status (1)

Country Link
JP (1) JP2754960B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08115096A (ja) * 1994-10-14 1996-05-07 Sanyo Electric Co Ltd 音声処理装置
JP3853858B2 (ja) * 1995-05-24 2006-12-06 株式会社デンソー 自動変速機の油圧制御装置
JP4028010B2 (ja) * 1995-12-11 2007-12-26 株式会社デンソー 車両用自動変速機制御装置
JPH11352987A (ja) * 1998-06-04 1999-12-24 Toyota Motor Corp 音声認識装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4684599A (en) * 1986-07-14 1987-08-04 Eastman Kodak Company Photoresist compositions containing quinone sensitizer
JPH0823756B2 (ja) * 1988-08-09 1996-03-06 沖電気工業株式会社 音声区間検出方式

Also Published As

Publication number Publication date
JPH0535294A (ja) 1993-02-12

Similar Documents

Publication Publication Date Title
US6826533B2 (en) Speech recognition apparatus and method
JP3363630B2 (ja) 音声認識方法
US4829578A (en) Speech detection and recognition apparatus for use with background noise of varying levels
EP0077194B1 (en) Speech recognition system
JP2964518B2 (ja) 音声制御方式
JPH09106296A (ja) 音声認識装置及び方法
US20010003173A1 (en) Method for increasing recognition rate in voice recognition system
JP2008033198A (ja) 音声対話システム、音声対話方法、音声入力装置、プログラム
JP2754960B2 (ja) 音声認識装置
JP2001154694A (ja) 音声認識装置及び方法
JPH08263092A (ja) 応答音声生成方法および音声対話システム
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
JP2019132997A (ja) 音声処理装置、方法およびプログラム
JP3023365B2 (ja) 音声認識制御装置
JPH01321499A (ja) 音声認識装置
JPS60205600A (ja) 音声認識装置
JP3360978B2 (ja) 音声認識装置
KR102052634B1 (ko) 호출음 인식장치 및 호출음 인식방법
JPH02103599A (ja) 音声認識装置
JPH08263093A (ja) 音声認識制御装置
JPH0754434B2 (ja) 音声認識装置
JPH0119597B2 (ja)
JPS58125099A (ja) 音声認識装置
JP3023137B2 (ja) 音声認識制御装置
JPS6039695A (ja) 自動音声アクチビテイ検出方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080306

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090306

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090306

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100306

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100306

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110306

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees