JPH04238399A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH04238399A
JPH04238399A JP3022970A JP2297091A JPH04238399A JP H04238399 A JPH04238399 A JP H04238399A JP 3022970 A JP3022970 A JP 3022970A JP 2297091 A JP2297091 A JP 2297091A JP H04238399 A JPH04238399 A JP H04238399A
Authority
JP
Japan
Prior art keywords
noise
frequency spectrum
input
speech recognition
stationary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3022970A
Other languages
English (en)
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3022970A priority Critical patent/JPH04238399A/ja
Publication of JPH04238399A publication Critical patent/JPH04238399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、音声認識装置、より詳細には、
騒音下での音声認識に好適な音声認識装置に関する。
【0002】
【従来技術】音声認識装置の騒音に関する対策として一
般的に行われている方法には、スペクトルサブトラクシ
ョン法(S.F.Boll,”Suppression
 of Acoustic Noise in Spe
ech Using Spectral Subtra
ction”,IEEE Trans.ASSP Vo
l.27−2,Apr.1979)やアダプティブノイ
ズキャンセリング(B.Widraw,”Adapti
ve noise canceling:Princi
ples and applications”,Pr
oc.IEEE,Vol.63,Dec.1975)な
どの雑音除去技術を用いる方法などがある。
【0003】しかし、アダプティブノイズキャンセリン
グは、複数の入力部、特徴抽出部が必要になるので、コ
ストが高くなるという欠点がある。一方、スペクトルサ
ブトラクション法は、音声入力前の入力信号から推定し
た雑音の周波数スペクトルを音声の周波数スペクトルか
ら減算するものなので、非定常雑音の場合、雑音推定時
の雑音のスペクトルと音声入力時の雑音のスペクトルが
大きく異なるために、スペクトルサブトラクションする
ことにより、かえって、音声の周波数スペクトルを崩し
てしまい、認識率が低下するという欠点がある。
【0004】図3は、雑音除去が適切に行なえなかった
場合の一例を示したもので、図のように、音声入力時(
a)と雑音推定時(雑音入力時)(b)の雑音スペクト
ルが大きく異なる場合、スペクトルサブトラクションす
ると、(d)のようになり、スペクトルサブトラクショ
ンする前のスペクトル(c)の方が(d)よりも真の入
力音声のスペクトル(e)似ているという結果になる。
【0005】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、特に、非定常雑音下において、スペクトルサブ
トラクションを行うことによる音声の周波数スペクトル
の崩れを無くすことを目的としてなされたものである。
【0006】
【構成】本発明は、上記目的を達成するために、(1)
入力信号の周波数スペクトルを求める手段と、音声入力
前の入力信号から雑音の周波数スペクトルを求める手段
と、音声入力時の入力信号の周波数スペクトルから上記
雑音の周波数スペクトルを減算する手段とを有し、上記
減算手段により得られた周波数スペクトルを用いて音声
認識をする音声認識装置において、雑音が定常か非定常
かを判定する判定手段を有し、該判定手段で定常である
と判定した場合のみ、雑音の周波数スペクトルを減算す
ることを特徴としたものであり、更には、(2)前記(
1)において、雑音が定常か非定常かを判定する判定手
段は、雑音入力時の入力信号の周波数スペクトルの時間
変化分が予め定めておいた閾値以上の場合、非定常とす
ることを特徴とするものである。以下、本発明の実施例
に基づいて説明する。
【0007】図1は、本発明の一実施例を説明するため
のブロック図、図2はその動作原理を説明するための1
フレーム毎のフローチャートで、図中、1は音響入力部
、2は周波数スペクトル検出部、3は区間検出部、4は
定常/非定常判定部、5は雑音スペクトル推定部、6は
雑音補正部、7は音声認識部である。
【0008】音響入力部1では、マイクロフォンのよう
な音響・電気信号変換器を用いて、音を電気信号x(t
)に変換する。周波数スペクトル検出部2は、バンドパ
スフィルタ群、或いは、FFTなどを用いて、音響入力
部1で得られた電気信号x(t)の10msec程度の
短時間周波数スペクトルX(t,f)を検出する。区間
検出部3は、音声入力中であるかどうかを検出するもの
で、例えば、前記のx(t)が予め定めておいた閾値以
上の区間を音声入力中であるとする方法を用いる。また
、その他の方法としては、音声入力スイッチを設けてお
き、スイッチをオンさせている区間を音声入力中とする
方法を用いるが、他の方法を用いても実現可能である。 定常/非定常判定部4は、区間検出部3で検出された音
声入力中でない区間の入力信号を用いて、周囲の雑音が
定常であるか、非定常であるかを判定するもので、例え
ば、周波数スペクトル検出部2で検出された短時間周波
数スペクトルX(t,f)を用いて、D(t,f)=X
(t,f)−X(t−△,f)      (△:10
msec程度) で、各帯域毎の変化分を求めてから、
【0009】
【数1】
【0010】で、全帯域の変化分の絶対値の総和E(t
)を求め、これが予め定めておいた閾値を超えた場合、
非定常雑音であると判定する方法を用いる。雑音スペク
トル推定部5は、区間検出部3で検出された音声入力中
でない区間の短時間周波数スペクトルX(t,f)を用
いて、周囲の雑音の周波数スペクトルを推定するもので
【0011】
【数2】
【0012】として、時間Tの間の平均をとる方法を用
いる。雑音補正部6は、定常/非定常判定部4で周囲の
雑音が定常であると判定された場合のみ、入力信号から
雑音成分を除去するもので、 Y(t,f)=X(t,f)−N(f)のように、各帯
域毎に、入力音声の周波数スペクトルX(t,f)から
、雑音スペクトル推定部5で推定された雑音スペクトル
N(f)を減算して、入力信号を補正する。なお、定常
/非定常判定部4で、周囲の雑音が非定常であると判定
された場合は、入力音声の周波数スペクトルX(t,f
)をそのままY(t,f)として、出力する。音声認識
部7は、雑音補正部6の出力信号Y(t,f)を用いて
音声認識を行なうもので、例えば、「2値のTSPを用
いた単語音声認識システムの開発」(安田  他、電気
学会論文誌C108巻、昭和63年10月号p.858
〜865)記載の音声認識システムを用いるが、他の音
声認識システムを用いても実現可能である。
【0013】
【効果】周囲の雑音が非定常の場合に、スペクトルサブ
トラクション法を用いて、雑音除去を行なうと、雑音推
定時の雑音のスペクトルと音声入力時の雑音のスペクト
ルが大きく異なる場合に、適切な雑音除去が行なえずに
、スペクトルサブトラクションすることにより、かえっ
て、音声の周波数スペクトルを崩してしまい、認識率が
低下するという欠点があったが、本発明では、周囲の雑
音が定常の場合のみ、スペクトルサブトラクション法を
行なっているので、従来の方法よりも誤認識する可能性
が少なくなる。
【図面の簡単な説明】
【図1】本発明の一実施例を説明するためのブロック図
である。
【図2】図1の動作説明をするためのフローチャートで
ある。
【図3】サブトラクション法によって雑音除去が適切に
行えない場合の一例を説明するための図である。
【符号の説明】
1  音響入力部 2  周波数スペクトル検出部 3  区間検出部 4  定常/非定常判定部 5  雑音スペクトル推定部 6  雑音補正部 7  音声認識部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  入力信号の周波数スペクトルを求める
    手段と、音声入力前の入力信号から雑音の周波数スペク
    トルを求める手段と、音声入力時の入力信号の周波数ス
    ペクトルから上記雑音の周波数スペクトルを減算する手
    段とを有し、上記減算手段により得られた周波数スペク
    トルを用いて音声認識をする音声認識装置において、雑
    音が定常か非定常かを判定する判定手段を有し、該判定
    手段で定常であると判定した場合のみ、雑音の周波数ス
    ペクトルを減算することを特徴とする音声認識装置。
  2. 【請求項2】  請求項1に記載の音声認識装置におい
    て、前記雑音が定常か非定常かを判定する判定手段は、
    雑音入力時の入力信号の周波数スペクトルの時間変化分
    が予め定めておいた閾値以上の場合、非定常とすること
    を特徴とする音声認識装置。
JP3022970A 1991-01-22 1991-01-22 音声認識装置 Pending JPH04238399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3022970A JPH04238399A (ja) 1991-01-22 1991-01-22 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3022970A JPH04238399A (ja) 1991-01-22 1991-01-22 音声認識装置

Publications (1)

Publication Number Publication Date
JPH04238399A true JPH04238399A (ja) 1992-08-26

Family

ID=12097432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3022970A Pending JPH04238399A (ja) 1991-01-22 1991-01-22 音声認識装置

Country Status (1)

Country Link
JP (1) JPH04238399A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007147736A (ja) * 2005-11-24 2007-06-14 Nec Access Technica Ltd 音声通信装置
JP2010154092A (ja) * 2008-12-24 2010-07-08 Fujitsu Ltd 雑音検出装置及び雑音検出方法
JP2010217552A (ja) * 2009-03-17 2010-09-30 Yamaha Corp 音処理装置およびプログラム
JP2010230814A (ja) * 2009-03-26 2010-10-14 Fujitsu Ltd 音声信号評価プログラム、音声信号評価装置、音声信号評価方法
WO2013125257A1 (ja) * 2012-02-20 2013-08-29 株式会社Jvcケンウッド 雑音信号抑制装置、雑音信号抑制方法、特殊信号検出装置、特殊信号検出方法、報知音検出装置、および、報知音検出方法
JP2020134887A (ja) * 2019-02-25 2020-08-31 富士通株式会社 音信号処理プログラム、音信号処理方法及び音信号処理装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007147736A (ja) * 2005-11-24 2007-06-14 Nec Access Technica Ltd 音声通信装置
JP4527654B2 (ja) * 2005-11-24 2010-08-18 Necアクセステクニカ株式会社 音声通信装置
JP2010154092A (ja) * 2008-12-24 2010-07-08 Fujitsu Ltd 雑音検出装置及び雑音検出方法
JP2010217552A (ja) * 2009-03-17 2010-09-30 Yamaha Corp 音処理装置およびプログラム
JP2010230814A (ja) * 2009-03-26 2010-10-14 Fujitsu Ltd 音声信号評価プログラム、音声信号評価装置、音声信号評価方法
US8532986B2 (en) 2009-03-26 2013-09-10 Fujitsu Limited Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method
WO2013125257A1 (ja) * 2012-02-20 2013-08-29 株式会社Jvcケンウッド 雑音信号抑制装置、雑音信号抑制方法、特殊信号検出装置、特殊信号検出方法、報知音検出装置、および、報知音検出方法
US9734841B2 (en) 2012-02-20 2017-08-15 JVC Kenwood Corporation Device and method for suppressing noise signal, device and method for detecting special signal, and device and method for detecting notification sound
JP2020134887A (ja) * 2019-02-25 2020-08-31 富士通株式会社 音信号処理プログラム、音信号処理方法及び音信号処理装置

Similar Documents

Publication Publication Date Title
EP1065656B1 (en) Method for reducing noise in an input speech signal
AU740951B2 (en) Method for Noise Reduction, Particularly in Hearing Aids
Woo et al. Robust voice activity detection algorithm for estimating noise spectrum
Plapous et al. A two-step noise reduction technique
US6023674A (en) Non-parametric voice activity detection
EP2788979A1 (en) Low power voice detection
KR20090012154A (ko) 통합적 순음 감소 방식의 노이즈 감소 방법
EP3428918B1 (en) Pop noise control
Ramirez et al. Voice activity detection with noise reduction and long-term spectral divergence estimation
JPH04238399A (ja) 音声認識装置
JPH04245300A (ja) 雑音除去装置
JPH04340599A (ja) 雑音除去装置
JP2001215992A (ja) 音声認識装置
JPH06303689A (ja) ノイズ除去装置
JP2859634B2 (ja) 雑音除去装置
JPH056193A (ja) 音声区間検出方式及び音声認識装置
JPH04163497A (ja) 音声区間検出方法
JPH01146413A (ja) 音響信号処理回路
JPH03122699A (ja) 雑音除去装置及び該装置を用いた音声認識装置
US11763820B2 (en) Monitoring method and system based on magnetic field of loudspeaker
JPH08313659A (ja) 信号時間差検出装置
CA2406754C (en) Method and apparatus for noise reduction, particularly in hearing aids
JPH0424692A (ja) 音声区間検出方式
JPS6217800A (ja) 音声区間判定方式
JPH09198079A (ja) 音声認識装置