JP2002149200A

JP2002149200A - 音声処理装置及び音声処理方法

Info

Publication number: JP2002149200A
Application number: JP2001259473A
Authority: JP
Inventors: Yoka O; 幼華王; Koji Yoshida; 幸司吉田
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2000-08-31
Filing date: 2001-08-29
Publication date: 2002-05-24
Also published as: US7286980B2; GB2374265B; GB2374265A; WO2002019319A1; US20030023430A1; GB0210536D0; AU2001282568A1

Abstract

(57)【要約】【課題】音声の歪みが少なくかつノイズを十分に
除去すること【解決手段】音声非音声識別部１０６は、音声スペク
トル信号とノイズベースの値の差が所定の閾値以上であ
る場合、音声成分を含む有音部分と判定し、それ以外の
場合、音声成分を含まない雑音のみの無音部分であると
判定する。コムフィルタ生成部１０７は、各周波数成分
における音声成分の有無に基づいて音声ピッチを強調す
るコムフィルタを生成する。減衰係数計算部１０８は、
コムフィルタに周波数特性に基づいた減衰係数を乗算し
て、各周波数成分毎に入力信号の減衰係数の設定を行
い、各周波数成分の減衰係数を乗算部１０９に出力す
る。乗算部１０９は、音声スペクトルに減衰係数を周波
数成分単位で乗算する。周波数合成部１１０は、乗算の
結果得られた周波数成分単位のスペクトルを所定の処理
時間単位で、周波数領域で連続する音声スペクトルに合
成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、雑音を抑圧する音
声処理装置及び音声処理方法に関し、特に通信システム
における音声処理装置及び音声処理方法に関する。

【０００２】

【従来の技術】従来の音声符号化技術では、雑音のない
音声に対しては高品質な音声で通話することができる
が、雑音等が含まれた音声に対してはデジタル通話特有
の耳障りな雑音が生じ、音質が劣化する問題があった。

【０００３】このような雑音を抑圧する音声強調技術と
してスペクトルサブトラクション法、コムフィルタ法が
ある。

【０００４】スペクトルサブトラクション法は、雑音情
報に着目して無音区間で雑音の性質を推定して雑音を含
む音声信号の短時間パワースペクトルから雑音の短時間
パワースペクトルを減算する、または減衰係数を乗算す
ることにより音声信号のパワースペクトルを推定して雑
音を抑圧する方法である。スペクトルサブトラクション
法は、例えば、文献（S.Boll,Suppression of acoustic
noise in speech using spectral subtraction,IEEE T
rans.Acoustics,Speech,and Signal Processing,vol.AS
SP-27,pp.113-120,1979）、文献(R.J.McAulay,M.L.Malp
ass,Speech enhancement using a soft-decision noise
suppression filter,IEEE.Trans.Acoustics,Speech,an
d Signal Processing,vol.ASSP-28,pp.137-145.1980)、
特許第２７１４６５６号と、特願平９−５１８８２０号
に記載されているものがある。

【０００５】一方、コムフィルタ法は、音声情報に着目
し、音声スペクトルのピッチにコムフィルタをかけるこ
とにより雑音減衰を行う。コムフィルタ法に関する文献
として、例えば、文献(J.S.Lim etc.,Evaluation of an
adaptive comb filtering method for enhancing spee
ch degraded by white noise addition,IEEE Trans.Aco
ustics,Speech,and Signal Processing,vol.ASSP26,pp.
354-358,1978)がある。

【０００６】コムフィルタとは、周波数領域単位で入力
された信号を所定の比率で減衰させ、または減衰させず
に信号を出力するフィルタであり、櫛状の減衰特性をも
つ。デジタルデータ処理でコムフィルタ法を実現する場
合、コムフィルタの減衰特性を周波数領域毎に減衰特性
のデータを作成し、周波数毎に音声スペクトルを乗算す
ることにより雑音を抑圧できる。

【０００７】図２８は、従来のコムフィルタ法を用いた
音声処理装置の例を示す図である。図２８において、切
り替え器１１は、入力信号に準周期性を持たない音声成
分（例えば子音）が含まれている場合、入力信号をその
まま出力し、入力信号に準周期性を持つ音声成分が含ま
れている場合、入力信号をコムフィルタ１２に出力す
る。コムフィルタ１２は、ピッチ周期の情報に基づいた
減衰特性で入力信号に対して周波数領域で雑音部分に減
衰を行って出力する。

【０００８】図２９は、コムフィルタの減衰特性を示す
図である。縦軸は信号の減衰特性を示し、横軸は周波数
を示す。図２９においてコムフィルタには、周波数領域
毎に信号を減衰させる領域と信号を減衰させない領域が
存在する。

【０００９】コムフィルタ法では、入力された信号にコ
ムフィルタをかけることにより、入力信号の中で音声成
分の存在する周波数領域を減衰せず、音声成分の存在し
ない周波数領域を減衰することにより雑音を抑圧して音
声を強調する。

【００１０】

【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声処理方法には次のような解決すべき課題
があった。まず、文献１に示したＳＳ法は、ノイズ情報
のみに着目し、短時間のノイズ特性を定常と見なして、
音声とノイズを区別せず、一律にノイズベース（推定さ
れたノイズのスペクトル特性）を差し引く方法である。
音声の情報（例えば、音声のピッチ）は利用されていな
い。実際には、ノイズの特性は定常でないため、差し引
かれた後の残留ノイズ、特にピッチ調波間の残留ノイズ
は処理方法によって、いわゆる「ミュジカルノイズ」と
呼ばれる不自然な歪のある雑音を生じる原因と考えられ
る。

【００１１】その改善法として、音声パワー対ノイズパ
ワー比（ＳＮＲ）に基づき、減衰係数を乗じてノイズを
減衰する方法、例えば、特許第２７１４６５６号と、特
願平９−５１８８２０号に示したものが提案された。音
声の大きい帯域（ＳＮＲは大きい）とノイズの大きい帯
域（ＳＮＲは小さい）を区別して異なる減衰係数を用い
るため、ミュジカルノイズを抑制し、音質を向上させ
た。しかし、特許第２７１４６５６号と、特願平９−５
１８８２０号に示した方法は、音声情報の一部（ＳＮ
Ｒ）が利用されているものの、処理する周波数チャネル
数（１６チャネル）は十分でないので、ピッチ調波情報
を雑音から分離し抽出することは困難であり、また、音
声とノイズ両方の帯域に減衰係数を用いるため、互いに
影響を及ぼし合う結果、減衰係数は大きくすることがで
きない。つまり、減衰係数を大きくすると、ＳＮＲ推定
の誤りによって、音声の歪みを生じる可能性がある。結
果として、ノイズの減衰は不十分である。

【００１２】また、従来のコムフィルタ法では、基本周
波数であるピッチに推定誤差があると、その高調波では
誤差分が拡大し、本来の高調波成分がその通過帯域から
はずれる可能性がより大きくなる。また、準周期性を持
つ音声とそうでない音声を判別する必要があるため、実
現性に問題がある。

【００１３】本発明は、かかる点に鑑みてなされたもの
であり、音声の歪みが少なくかつノイズを十分に除去す
ることができる音声処理装置及び音声処理方法を提供す
ることを目的とする。

【００１４】

【課題を解決するための手段】本発明の音声処理装置
は、入力音声信号の音声スペクトルを所定の周波数単位
で分割する周波数分割手段と、前記周波数分割手段にお
いて周波数分割された音声スペクトル及び雑音成分のス
ペクトルであるノイズベースに基づいて前記音声スペク
トルに音声成分が含まれているか否か識別する音声識別
手段と、前記音声識別手段の識別結果に基づいて所定の
周波数単位でスペクトルパワの減衰を行う第一コムフィ
ルタを生成する第一コムフィルタ生成手段と、前記第一
コムフィルタを用いて前記音声スペクトルの雑音成分を
抑圧する雑音抑圧手段と、前記雑音成分が抑圧された音
声スペクトルを周波数領域で連続した音声スペクトルに
合成する周波数合成手段と、前記音声識別手段により音
声成分が含まれないとされた音声スペクトルを用いて前
記ノイズベースを更新するノイズベース推定手段と、を
具備する構成を採る。

【００１５】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。

【００１６】本発明の音声処理装置は、ノイズベース推
定手段は、過去に推定したノイズベースの平均値と処理
する音声スペクトルのパワを加重平均した平均値に基づ
いてノイズベースを推定して更新する構成を採る。

【００１７】この構成によれば、各周波数成分における
音声スペクトルのパワ平均値又は過去に処理を行ったフ
レームと処理を行うフレームのパワ平均値を求めること
により、突発性雑音成分の影響は小さくなり、正確なコ
ムフィルタを構成することができる。

【００１８】本発明の音声処理装置は、音声識別手段
は、音声スペクトルのパワとノイズベースのパワとの差
分値が所定の閾値より大きい場合に音声スペクトルに音
声成分が含まれていると判断し、前記差分値が前記閾値
以下の場合に音声スペクトルに音声成分が含まれていな
いと判断する構成を採る。

【００１９】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。

【００２０】本発明の音声処理装置は、音声識別手段
は、音声スペクトルのパワとノイズベースのパワとの差
分値が所定の第一閾値より大きい場合には音声スペクト
ルに音声成分が含まれていると判断し、前記第一閾値よ
り小さい第二閾値より前記差分値が小さい場合には音声
スペクトルに音声成分が含まれていないと判断し、上記
いずれの条件をも満たさない場合には過去に行った判断
を判断結果とする構成を採る。

【００２１】この構成によれば、２つの閾値を設けるこ
とにより、精度の高い音声非音声の判別ができる。

【００２２】本発明の音声処理装置は、第一コムフィル
タ生成手段は、音声成分の含まれる周波数領域のスペク
トルを強調し、雑音成分の含まれる周波数領域のスペク
トルを減衰する構成を採る。

【００２３】本発明の音声処理装置は、所定の周波数単
位でスペクトルパワの減衰の度合いである減衰係数を設
定する減衰係数計算手段を具備し、雑音抑圧手段は、音
声スペクトルに前記減衰係数を乗算して雑音を抑圧する
構成を採る。

【００２４】これらの構成によれば、周波数成分単位で
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調を
行うことができる。

【００２５】本発明の音声処理装置は、所定の時間単位
で音声信号に音声成分が含まれているか否かを判断する
第二音声識別手段を具備し、ノイズベース推定手段は、
音声信号が音声を含む音声区間から音声を含まない無音
区間に移った場合に、無音区間の音声スペクトルに基づ
いてノイズベースを推定して更新する構成を採る。

【００２６】この構成によれば、入力された信号から推
定した雑音スペクトルの値を大きく反映させてノイズベ
ースの更新を行うことにより、ノイズレベルの急激な変
化に対応したノイズベースの更新を行うことができ、音
声歪の少ない音声強調を行うことができる。

【００２７】本発明の音声処理装置は、所定の周波数単
位で音声スペクトルのパワの平均値をとる第一平均値計
算手段を具備し、ノイズベース手段は、前記平均値に基
づいてノイズベースを推定して更新する構成を採る。

【００２８】本発明の音声処理装置は、音声識別手段
は、音声スペクトルのパワの平均値に基づいて音声信号
に音声成分が含まれているか否か識別する構成を採る。

【００２９】これらの構成によれば、各周波数成分にお
ける音声スペクトルのパワ平均値又は過去に処理を行っ
たフレームと処理を行うフレームのパワ平均値を求める
ことにより、突発性雑音成分の影響は小さくなり、より
正確なコムフィルタを構成することができる。

【００３０】本発明の音声処理装置は、雑音抑圧手段
は、音声成分を含まない音声スペクトルの全周波数領域
に減衰を行う構成を採る。

【００３１】この構成によれば、音声成分を含まないフ
レームに全周波数成分で減衰を行い、音声を含まない信
号区間でノイズを全帯域でカットすることにより、音声
抑圧処理に起因するノイズの発生を防ぐことができるの
で、音声歪の少ない音声強調を行うことができる構成を
採る。

【００３２】本発明の音声処理装置は、生成された第一
コムフィルタのピッチ周期情報に基づいて失われたコム
フィルタのピッチ調波情報を修正する第一ピッチ修正手
段を具備する構成を採る。

【００３３】この構成によれば、ピッチ周期情報を推定
して、ノイズと判別されて失われたピッチ調波情報を補
うことにより、原音声に近い音声の状態で、かつ音声歪
の少ない音声強調を行うことができる。

【００３４】本発明の音声処理装置は、生成された第一
コムフィルタにおいて減衰を行わない周波数成分の数が
所定の数より大きい場合、第一識別手段の閾値を大きく
し、前記減衰を行わない周波数成分の数が前記所定の数
以下の場合、前記第一識別手段の閾値を小さくする閾値
調整手段を具備する構成をとる。

【００３５】この構成によれば、音声を含まないフレー
ムの中で音声が含まれると誤って判断される周波数成分
の数に基づいて、音声スペクトルの音声非音声識別に用
いる閾値の変更を行うことにより、ノイズの種類に対応
した音声の判別を行い、音声歪の少ない音声強調を行う
ことができる。

【００３６】本発明の音声処理装置は、生成された第一
コムフィルタにおいて減衰を行わない周波数成分の数が
所定の数以下の場合、コムフィルタを音声スペクトルの
全周波数領域に対して減衰を行う第一コムフィルタリセ
ット手段を具備する構成を採る。

【００３７】本発明の音声処理装置は、第一コムフィル
タにおいて音声を通過する帯域が所定の数以下である場
合、突発性のノイズが発生していると判断し、生成され
たコムフィルタを全ての領域の入力音声信号を減衰する
コムフィルタに設定する第一ミュジカルノイズ抑圧手段
を具備する構成を採る。

【００３８】この構成によれば、コムフィルタの生成結
果からミュジカルノイズ発生を判断することにより、ノ
イズが音声信号と誤判断されることを防ぎ、音声歪の少
ない音声強調を行うことができる。

【００３９】本発明の音声処理装置は、所定の周波数単
位で音声スペクトルとノイズベースに基づいて音声識別
手段と異なる条件で前記音声スペクトルに音声成分が含
まれているか否か識別する第三音声識別手段と、前記第
三音声識別手段の識別結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行う第二コムフィルタを生成
する第二コムフィルタ生成手段と、音声スペクトルから
入力音声信号のピッチ周期を推測する音声ピッチ推測手
段と、前記音声ピッチ推測手段において推測されたピッ
チ周期に基づいて第二コムフィルタのピッチ調波構造を
修復してピッチ修復コムフィルタを生成する音声ピッチ
修復手段と、ピッチ修復コムフィルタに基づいて第一コ
ムフィルタの修正を行うコムフィルタ修正手段とを具備
する構成を採る。

【００４０】この構成によれば、コムフィルタ作成に用
いるノイズベースと、ピッチ調波構造修復に用いるノイ
ズベースをそれぞれ異なる条件で生成することにより、
音声情報を多く抽出し、かつ雑音情報の影響を受け難い
コムフィルタを生成して正確なピッチ調波構造の修復を
行うことができる。

【００４１】本発明の音声処理装置は、第三音声識別手
段は、音声スペクトルに音声が含まれると判断する条件
を音声識別手段が音声スペクトルに音声が含まれると判
断する条件より厳しくする構成を採る。

【００４２】この構成によれば、コムフィルタのピッチ
幅をピッチ周期の推定結果から調整することにより正確
にピッチ調波構造を修復することができる。音声と厳し
く判断して作成したコムフィルタのピッチ調波構造を修
復したコムフィルタの通過領域と音声と緩く判断して作
成したコムフィルタの通過領域の重複部分を通過領域と
し、この重複する通過領域以外を阻止領域とするコムフ
ィルタを作成することにより、ピッチ周期の推定の誤差
による影響を低減することができ、正確なピッチ調波構
造の修復ができる。

【００４３】本発明の音声処理装置は、第三音声識別手
段は、音声スペクトルのパワとノイズベースのパワとの
差分値が所定の閾値より大きい場合に音声スペクトルに
音声成分が含まれていると判断し、前記差分値が前記閾
値以下の場合に音声スペクトルに音声成分が含まれてい
ないと判断する構成を採る。

【００４４】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。

【００４５】本発明の音声処理装置は、第三音声識別手
段は、音声スペクトルのパワとノイズベースのパワとの
差分値が所定の第三閾値より大きい場合には音声スペク
トルに音声成分が含まれていると判断し、前記第三閾値
より小さい第四閾値より前記差分値が小さい場合には音
声スペクトルに音声成分が含まれていないと判断し、上
記いずれの条件をも満たさない場合には過去に行った判
断を判断結果とする構成を採る。

【００４６】この構成によれば、２つの閾値を設けるこ
とにより、精度の高い音声非音声の判別ができる。

【００４７】本発明の音声処理装置は、第二コムフィル
タ生成手段は、音声成分の含まれる周波数領域のスペク
トルを強調し、雑音成分の含まれる周波数領域のスペク
トルを減衰する構成を採る。

【００４８】本発明の音声処理装置は、雑音抑圧された
音声スペクトルのパワの平均値を所定の周波数単位で算
出する第二平均値計算手段を具備する構成を採る。

【００４９】本発明の音声処理装置は、第二音声識別手
段は、音声スペクトルのパワの平均値に基づいて音声信
号に音声成分が含まれているか否か識別する構成を採
る。

【００５０】これらの構成によれば、周波数成分単位で
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調を
行うことができる。

【００５１】本発明の音声処理装置は、生成された第二
コムフィルタのピッチ周期情報に基づいて失われた第二
コムフィルタのピッチ調波情報を修正する第二ピッチ修
正手段を具備する構成を採る。

【００５２】この構成によれば、ピッチ周期情報を推定
して、ノイズと判別されて失われたピッチ調波情報を補
うことにより、原音声に近い音声の状態で、かつ音声歪
の少ない音声強調を行うことができる。

【００５３】本発明の音声処理装置は、入力音声信号の
音声スペクトルと生成されたコムフィルタとから入力音
声信号の信号対雑音比を算出するＳＮＲ算出手段と、信
号対雑音比から入力音声信号の音声スペクトルから音声
成分を検出する音声検出手段と、前記音声検出手段にお
いて検出された音声スペクトルからピッチ周期を推定す
る音声ピッチ推定手段と、を具備し、第二ピッチ修正手
段は、音声ピッチ推定手段において推定されたピッチ周
期でコムフィルタのピッチ調波情報を修正する構成を採
る。

【００５４】この構成によれば、コムフィルタの通過領
域に対応する音声スペクトルのパワの和と、コムフィル
タの阻止領域に対応する音声スペクトルのパワの和との
比を求めてＳＮＲ（信号対雑音比）とし、このＳＮＲが
所定の閾値以上であるフレームのみを用いてピッチ周期
を推定することにより、雑音によるピッチ周期推定の誤
りを低減することができ、音声歪の少ない音声強調を行
うことができる。

【００５５】本発明の音声処理装置は、音声検出部にお
いて音声成分が検出された場合、第二コムフィルタを音
声スペクトルの全周波数領域に対して減衰を行う第二コ
ムフィルタリセット手段を具備する構成を採る。

【００５６】この構成によれば、音声成分を含まないフ
レームに全周波数成分で減衰を行い、音声を含まない信
号区間でノイズを全帯域でカットすることにより、音声
抑圧処理に起因するノイズの発生を防ぐことができるの
で、音声歪の少ない音声強調を行うことができる。

【００５７】本発明の音声処理装置は、コムフィルタ修
正手段は、ピッチ修復コムフィルタの通過領域と第二コ
ムフィルタの通過領域の重複する部分を修正後の第二コ
ムフィルタの通過領域とし、この通過領域以外の周波数
領域を阻止領域とする構成を採る。

【００５８】この構成によれば、コムフィルタのピッチ
幅をピッチ周期の推定結果から調整することにより正確
にピッチ調波構造を修復することができる。音声と厳し
く判断して作成したコムフィルタのピッチ調波構造を修
復したコムフィルタの通過領域と音声と緩く判断して作
成したコムフィルタの通過領域の重複部分を通過領域と
し、この重複する通過領域以外を阻止領域とするコムフ
ィルタを作成することにより、ピッチ周期の推定の誤差
による影響を低減することができ、正確なピッチ調波構
造の修復ができる。

【００５９】本発明の音声処理装置は、第二コムフィル
タにおいて音声を通過する帯域が所定の数以下である場
合、突発性のノイズが発生していると判断し、生成され
たコムフィルタを全ての領域の入力音声信号を減衰する
コムフィルタに設定する第二ミュジカルノイズ抑圧手段
を具備する構成を採る。

【００６０】この構成によれば、第一コムフィルタと第
二コムフィルタの生成結果からミュジカルノイズ発生を
判断することにより、ノイズが音声信号と誤判断される
ことを防ぎ、音声歪の少ない音声強調を行うことができ
る。

【００６１】本発明の音声処理装置は、入力音声信号の
音声スペクトルを所定の周波数単位で分割する周波数分
割手段と、前記周波数分割手段において周波数分割され
た音声スペクトル及び雑音成分のスペクトルであるノイ
ズベースに基づいて前記音声スペクトルに音声成分が含
まれているか否か識別する音声識別手段と、前記音声識
別手段の識別結果に基づいて所定の周波数単位でスペク
トルパワの減衰を行う第一コムフィルタを生成する第一
コムフィルタ生成手段と、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抽出する雑音抽出手
段と、前記雑音成分が抽出された音声スペクトルを周波
数領域で連続した音声スペクトルに合成する周波数合成
手段と、前記音声識別手段により音声成分が含まれない
とされた音声スペクトルを用いて前記ノイズベースを更
新するノイズベース推定手段と、を具備する構成を採
る。

【００６２】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。

【００６３】本発明の音声処理装置は、第三コムフィル
タ生成手段は、第三コムフィルタの通過域においてノイ
ズベースの推定値と乱数を乗算して再構成する構成を採
る。

【００６４】この構成によれば、コムフィルタの阻止域
において雑音成分を減衰せず、コムフィルタの通過域に
おいて雑音成分をノイズベースの推定値と乱数を乗算し
て再構成することにより良好な雑音分離特性を得ること
ができる。

【００６５】本発明の音声処理装置は、コムフィルタを
用いた音声処理後の音声スペクトルの周波数平均及び時
間平均を算出するスペクトル平均手段を具備する構成を
採る。

【００６６】この構成によれば、各周波数成分における
音声スペクトルのパワ平均値又は過去に処理を行ったフ
レームと処理を行うフレームのパワ平均値を求めること
により、突発性雑音成分の影響は小さくなり、音声情報
のみをとりだす第二コムフィルタをより正確に生成する
ことができる。

【００６７】本発明の無線通信装置は、上記いずれかの
音声処理装置を有する構成を採る。

【００６８】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調また
は雑音抽出を行った音声を送信又は受信することができ
る。

【００６９】本発明の音声処理プログラムは、入力音声
信号の音声スペクトルを所定の周波数単位で分割する周
波数分割手順と、前記周波数分割手順において周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別する音声識別手順と、前記
音声識別手順の識別結果に基づいて所定の周波数単位で
スペクトルパワの減衰を行う第一コムフィルタを生成す
る第一コムフィルタ生成手順と、前記第一コムフィルタ
を用いて前記音声スペクトルの雑音成分を抑圧する雑音
抑圧手順と、前記雑音成分が抑圧された音声スペクトル
を周波数領域で連続した音声スペクトルに合成する周波
数合成手順と、前記音声識別手順により音声成分が含ま
れないとされた音声スペクトルを用いて前記ノイズベー
スを更新するノイズベース推定手順と、を含む構成を採
る。

【００７０】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。

【００７１】本発明の音声処理プログラムは、入力音声
信号の音声スペクトルを所定の周波数単位で分割する周
波数分割手順と、前記周波数分割手順において周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別する音声識別手順と、前記
音声識別手順の識別結果に基づいて所定の周波数単位で
スペクトルパワの減衰を行う第一コムフィルタを生成す
る第一コムフィルタ生成手順と、前記第一コムフィルタ
を用いて前記音声スペクトルの雑音成分を抽出する雑音
抽出手順と、前記雑音成分が抽出された音声スペクトル
を周波数領域で連続した音声スペクトルに合成する周波
数合成手順と、前記音声識別手順により音声成分が含ま
れないとされた音声スペクトルを用いて前記ノイズベー
スを更新するノイズベース推定手順と、を含む構成をと
る。

【００７２】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。

【００７３】本発明のサーバは、入力音声信号の音声ス
ペクトルを所定の周波数単位で分割する周波数分割手順
と、前記周波数分割手順において周波数分割された音声
スペクトル及び雑音成分のスペクトルであるノイズベー
スに基づいて前記音声スペクトルに音声成分が含まれて
いるか否か識別する音声識別手順と、前記音声識別手順
の識別結果に基づいて所定の周波数単位でスペクトルパ
ワの減衰を行う第一コムフィルタを生成する第一コムフ
ィルタ生成手順と、前記第一コムフィルタを用いて前記
音声スペクトルの雑音成分を抑圧する雑音抑圧手順と、
前記雑音成分が抑圧された音声スペクトルを周波数領域
で連続した音声スペクトルに合成する周波数合成手順
と、前記音声識別手順により音声成分が含まれないとさ
れた音声スペクトルを用いて前記ノイズベースを更新す
るノイズベース推定手順と、を含む音声処理プログラム
を記録し、要求に応じて前記音声処理プログラムを要求
元に転送する構成を採る。

【００７４】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。

【００７５】本発明のサーバは、入力音声信号の音声ス
ペクトルを所定の周波数単位で分割する周波数分割手順
と、前記周波数分割手順において周波数分割された音声
スペクトル及び雑音成分のスペクトルであるノイズベー
スに基づいて前記音声スペクトルに音声成分が含まれて
いるか否か識別する音声識別手順と、前記音声識別手順
により音声成分が含まれないとされた音声スペクトルを
用いてノイズベースを推定して更新するノイズベース推
定手順と、前記識別の結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行うコムフィルタを生成する
コムフィルタ生成手順と、前記コムフィルタを用いて所
定の周波数単位で前記音声スペクトルの雑音成分を抽出
する雑音抽出手順と、前記雑音成分が抽出された音声ス
ペクトルを周波数領域で連続した音声スペクトルに合成
する周波数合成手順と、を含む音声処理プログラムを記
録し、要求に応じて前記音声処理プログラムを要求元に
転送する構成を採る。

【００７６】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。

【００７７】本発明のクライアント装置は、上記のサー
バより転送された音声処理プログラムを実行する構成を
採る。

【００７８】これらの構成によれば、周波数成分単位で
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調ま
たは雑音抽出を行うことができる。

【００７９】本発明の音声処理方法は、入力音声信号の
音声スペクトルを所定の周波数単位で分割し、周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別し、前記識別の結果に基づ
いて所定の周波数単位でスペクトルパワの減衰を行う第
一コムフィルタを生成し、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抑圧し、前記雑音成
分が抑圧された音声スペクトルを周波数領域で連続した
音声スペクトルに合成し、前記音声識別の結果が音声成
分を含まないと識別された音声スペクトルを用いて前記
ノイズベースを更新するようにした。

【００８０】この方法によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。

【００８１】本発明の音声処理方法は、入力音声信号の
音声スペクトルを所定の周波数単位で分割し、周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別し、前記識別の結果に基づ
いて所定の周波数単位でスペクトルパワの減衰を行う第
一コムフィルタを生成し、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抽出し、前記雑音成
分が抽出された音声スペクトルを周波数領域で連続した
音声スペクトルに合成し、前記音声識別の結果が音声成
分を含まないと識別された音声スペクトルを用いて前記
ノイズベースを更新するようにした。

【００８２】この方法によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。

【００８３】

【発明の実施の形態】本発明の骨子は、音声スペクトル
を周波数領域単位で音声成分のある領域と音声成分のな
い領域に識別して、この識別情報から得られる精度の高
いピッチ周期に基づいて音声情報のみを強調するコムフ
ィルタを周波数領域で生成して雑音を抑圧することであ
る。

【００８４】（実施の形態１）図１は、本発明の実施の
形態１に係る音声処理装置の構成を示すブロック図であ
る。図１において、音声処理装置は、時間分割部１０１
と、窓掛け部１０２と、ＦＦＴ部１０３と、周波数分割
部１０４と、ノイズベース推定部１０５と、音声非音声
識別部１０６と、コムフィルタ生成部１０７と、減衰係
数計算部１０８と、乗算部１０９と、周波数合成部１１
０と、ＩＦＦＴ部１１１と、から主に構成される。

【００８５】時間分割部１０１は、入力された音声信号
から所定時間単位で区切られたフレームを構成し、窓掛
け部１０２に出力する。窓掛け部１０２は、時間分割部
１０１から出力されたフレームにハニングウインドウを
利用したウインドウ処理を行ってＦＦＴ部１０３に出力
する。ＦＦＴ部１０３は、窓掛け部１０２から出力され
た音声信号にＦＦＴ（Fast Fourier Transform）を行
い、音声スペクトル信号を周波数分割部１０４に出力す
る。

【００８６】周波数分割部１０４は、ＦＦＴ部１０３か
ら出力された音声スペクトルを所定の周波数領域単位の
周波数成分に分割して、各周波数成分毎に音声スペクト
ルをノイズベース推定部１０５と音声非音声識別部１０
６と、乗算部１０９とに出力する。なお、周波数成分
は、所定の周波数単位で分割された音声スペクトルを示
すものである。

【００８７】ノイズベース推定部１０５は、音声非音声
識別部１０６からフレームに音声成分が含まれている判
定結果が出力された場合、過去に推定したノイズベース
を音声非音声識別部１０６に出力する。また、ノイズベ
ース推定部１０５は、音声非音声識別部１０６からフレ
ームに音声成分が含まれていない判定結果が出力された
場合、周波数分割部１０４から出力された音声スペクト
ルの周波数成分毎の短時間パワースペクトルとスペクト
ルの変化の平均量を表す移動平均値を算出して、過去に
算出した移動平均値とパワースペクトルの加重平均値を
とり、新しい移動平均値を算出する。

【００８８】具体的には、式（１）を用いて各周波数成
分におけるノイズベースを推定して音声非音声識別部１
０６に出力する。Ｐ_base(n,k)=(1-α(k))・Ｐ_base(n-1,k)+α(k)・Ｓ² _f(n-τ,k) …（１）ここで、ｎは処理を行うフレームを特定する番号、ｋは
周波数成分周波数成分を特定する番号、τは遅延時間を
示す。また、Ｓ² _f(n,k)は、入力された音声信号のパワ
ースペクトル、Ｐ_base(n,k)はノイズベースの移動平均
値、α(k)は移動平均係数を示す。

【００８９】音声非音声識別部１０６は、周波数分割部
１０４から出力された音声スペクトル信号とノイズベー
ス推定部１０５から出力されるノイズベースの値の差が
所定の閾値以上である場合、音声成分を含む有音部分と
判定し、それ以外の場合、音声成分を含まない雑音のみ
の無音部分であると判定する。そして、音声非音声識別
部１０６は、判定結果をノイズベース推定部１０５とコ
ムフィルタ生成部１０７に出力する。

【００９０】コムフィルタ生成部１０７は、各周波数成
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して、このコムフィルタを減衰
係数計算部１０８に出力する。具体的には、コムフィル
タ生成部１０７は、コムフィルタの有音部分の周波数成
分をオン、無音部分の周波数成分をオフにする。

【００９１】減衰係数計算部１０８は、コムフィルタ生
成部１０７において生成されたコムフィルタに、周波数
特性に基づいた減衰係数を乗算して、各周波数成分毎に
入力信号の減衰係数の設定を行い、各周波数成分の減衰
係数を乗算部１０９に出力する。

【００９２】例えば、以下の式（２）から減衰係数gain
(k)を算出して入力信号に乗算することもできる。 gain(k)=gc・k/HB …（２）ここでgcは定数、kはビンを特定する変数、HBは、ＦＦ
Ｔ変換長つまり高速フーリエ変換を行うデータ数であ
る。

【００９３】乗算部１０９は、周波数分割部１０４から
出力された音声スペクトルに減衰係数計算部１０８から
出力された減衰係数を周波数成分単位で乗算する。そし
て、乗算の結果得られたスペクトルを周波数合成部１１
０に出力する。

【００９４】周波数合成部１１０は、乗算部１０９から
出力された周波数成分単位のスペクトルを所定の処理時
間単位で周波数領域で連続する音声スペクトルに合成し
てＩＦＦＴ部１１１に出力する。ＩＦＦＴ部１１１は、
周波数合成部１１０から出力された音声スペクトルにＩ
ＦＦＴ（Inverse Fast Fourier Transform）を行っ
て音声信号に変換した信号を出力する。

【００９５】次に、上記構成を有する音声処理装置の動
作について図２に示すフロー図を用いて説明する。図２
において、ステップ（以下「ＳＴ」という）２０１で
は、入力信号に前処理を行う。この場合、前処理とは、
入力信号から所定の時間単位のフレームを構成して窓か
け処理を行い、音声スペクトルに高速フーリエ変換を行
うことである。

【００９６】ＳＴ２０２では、周波数分割部１０４が音
声スペクトルを周波数成分に分割する。ＳＴ２０３で
は、ノイズベース推定部１０５が、α(k)=0であるか否
か、つまりノイズベース更新を停止するか否かを判断し
て、α(k)=0の場合、ＳＴ２０５に進み、α(k)=0でない
場合、ＳＴ２０４に進む。

【００９７】ＳＴ２０４では、ノイズベース推定部１０
５が音声成分の含まれていない音声スペクトルからノイ
ズベースを更新し、その後ＳＴ２０５に進む。ＳＴ２０
５では、音声非音声識別部１０６が、Ｓ_f ²(n,k)＞Ｑ_up・
Ｐ_base(n,k)であるか否か、つまり音声スペクトルのパ
ワーがノイズベースに所定の閾値を乗算した値より大き
いか否かを判断し、Ｓ_f ²(n,k)＞Ｑ_up・Ｐ_base(n,k)であ
る場合、ＳＴ２０６に進み、Ｓ_f ²(n,k)＞Ｑ_up・Ｐ
_base(n,k)でない場合、ＳＴ２０８に進む。

【００９８】ＳＴ２０６では、音声非音声識別部１０６
が、ノイズベース更新停止を示すα(k)=0を設定する。
ＳＴ２０７では、コムフィルタ生成部１０７が、音声ス
ペクトルを減衰せずに出力することを示すSP_SWITCH(k)
=ONを設定して、ＳＴ２１１に進む。ＳＴ２０８では、
音声非音声識別部１０６が、Ｓ_f ²(n,k)＜Ｑ_down・Ｐ_ba _se
(n,k)であるか否か、つまり音声スペクトルのパワーが
ノイズベースに所定の閾値を乗算した値より小さいか否
かを判断し、Ｓ_f ²(n,k)＜Ｑ_down・Ｐ_base(n,k)である場
合、ＳＴ２０９に進み、Ｓ_f ²(n,k)＜Ｑ_down・Ｐ_base(n,
k)でない場合、ＳＴ２１１に進む。

【００９９】ＳＴ２０９では、音声非音声識別部１０６
が、ノイズベース更新を示すα(k)=SLOWを設定する。こ
こで、SLOWは所定の定数である。ＳＴ２１０では、コム
フィルタ生成部１０７が音声スペクトルを減衰して出力
することを示すSP_SWITCH(k)=ＯＦＦを設定して、ＳＴ
２１１に進む。

【０１００】ＳＴ２１１では、減衰係数計算部１０８
が、音声スペクトルを減衰しないか減衰か、つまりSP_S
WITCH(k)=ONであるか否かを判断する。ＳＴ２１１にお
いてSP_SWITCH(k)=ONである場合、ＳＴ２１２では、減
衰係数計算部１０８が減衰係数を１に設定し、ＳＴ２１
４に進む。ＳＴ２１１においてSP_SWITCH(k)=ONでない
場合、ＳＴ２１３では、減衰係数計算部１０８が周波数
に応じた減衰係数を計算して設定し、ＳＴ２１４に進
む。

【０１０１】ＳＴ２１４では、乗算部１０９が周波数分
割部１０４から出力された音声スペクトルに減衰係数計
算部１０８から出力された減衰係数を周波数成分単位で
乗算する。ＳＴ２１５では、周波数合成部１１０が乗算
部１０９から出力された周波数成分単位のスペクトルを
所定の処理時間単位で周波数領域で連続する音声スペク
トルに合成する。ＳＴ２１６では、IＦＦＴ部１１１
が、周波数合成部１１０から出力された音声スペクトル
にＩＦＦＴを行って雑音を抑圧した信号を出力する。

【０１０２】次に、本実施の形態の音声処理装置で用い
るコムフィルタについて説明する。図３は、本実施の形
態にかかる音声処理装置で作成されるコムフィルタの例
を示す図である。図３において、縦軸はスペクトルのパ
ワ及び、フィルタの減衰度を示し、横軸は周波数を示
す。

【０１０３】コムフィルタは、Ｓ１に示す減衰特性を持
ち、減衰特性は、周波数成分毎に設定される。コムフィ
ルタ生成部１０７は、音声成分を含まない周波数領域の
信号を減衰し、音声信号を含む周波数領域の信号を減衰
しない減衰特性のコムフィルタを作成する。

【０１０４】雑音成分を含む音声スペクトルＳ２は、Ｓ
１の減衰特性を持つコムフィルタをかけることにより、
雑音成分を含む周波数領域の信号が減衰されてパワが小
さくなり、音声信号を含む部分は減衰されずパワが変化
しない。得られた音声スペクトルは、雑音成分の周波数
領域がより低くなりピークが失われずに強調されたスペ
クトル形状となり、ピッチ調波情報が失われない雑音を
抑圧した音声スペクトルＳ３が出力される。

【０１０５】このように、本発明の実施の形態１に係る
音声処理装置によれば、周波数成分単位でスペクトル信
号の音声非音声を判別して、周波数成分単位で判別結果
に基づいた周波数特性の減衰を行うことにより、正確な
ピッチ情報を得ることができるので、大きな減衰で雑音
抑圧を行っても音声歪の少ない音声強調を行うことがで
きる。

【０１０６】また、音声識別において２つの閾値を設け
ることにより、精度の高い音声非音声を判別することが
できる。

【０１０７】なお、減衰係数計算部１０８において、雑
音の周波数特性に応じた減衰係数の計算を行うことによ
り、高い周波数にある子音を損なわずに音声強調を行う
こともできる。

【０１０８】また、各周波数成分において入力信号の減
衰を二値で行い、音声と判別する場合、減衰を行わず、
雑音と判別する場合、減衰を行うこともできる。この場
合、強い雑音抑圧を行っても音声のある周波数成分は減
衰されないので音声の歪の少ない音声強調を行うことが
できる。

【０１０９】（実施の形態２）図４は、実施の形態２に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図１と共通する構成については図１と同一番
号を付し、詳しい説明を省略する。

【０１１０】図４の音声処理装置は、ノイズ区間判別部
４０１とノイズベース追跡部４０２と、を具備してフレ
ーム単位で信号の音声非音声判別を行い、ノイズレベル
の急激な変化を検出して、速やかにノイズベースを推定
して更新する点が図１と異なる。

【０１１１】図４において、ＦＦＴ部１０３は、窓掛け
部１０２から出力された音声信号にＦＦＴ（Fast Four
ier Transform）を行い、音声スペクトルを周波数分割
部１０４とノイズ区間判別部４０１に出力する。

【０１１２】ノイズ区間判別部４０１は、ＦＦＴ部１０
３から出力された音声スペクトルからフレーム単位で信
号のパワーと移動平均値を算出して、入力信号のパワー
の変化率からフレームが音声を含むか否か判別する。

【０１１３】具体的には、ノイズ区間判別部４０１は、
以下の式（３）及び式（４）を用いて入力信号のパワー
の変化率を算出する。 Ratio=P(n-τ)/P(n) …（４）ここで、P(n)は、１フレームの信号パワー、S² _f(n,k)
は、入力信号パワースペクトル、Ratioは、過去に処理
を行ったフレームと処理を行うフレームの信号パワー
比、τは遅延時間である。

【０１１４】ノイズ区間判別部４０１は、Ratioがあら
かじめ設定した閾値を一定時間連続して超えた場合、入
力信号を音声信号と判断し、連続して超えない場合をノ
イズ区間と判断する。

【０１１５】ノイズベース追跡部４０２は、音声区間か
らノイズ区間に移ったと判断した場合、所定のフレーム
数の処理を行う間、ノイズベースの更新における処理フ
レームからノイズベースの推定する影響の度合いを大き
くする。

【０１１６】具体的には式（１）においてα(k)=FAST、
（０＜SLOW＜FAST＜１）に設定する。α(k)の値が大き
いほど、移動平均値が入力された音声信号の影響を受け
やすくなり、ノイズベースの急激な変化に対応すること
ができる。

【０１１７】ノイズベース推定部１０５は、音声非音声
識別部１０６又はノイズベース追跡部４０２からフレー
ムに音声成分が含まれていない判定結果が出力された場
合、周波数分割部１０４から出力された音声スペクトル
の周波数成分毎の短時間パワースペクトルとスペクトル
の変化の平均量を表す移動平均値を算出して、これらの
値から各周波数成分におけるノイズベースを推定して音
声非音声識別部１０６に出力する。

【０１１８】このように、本発明の実施の形態２に係る
音声処理装置によれば、入力された信号から推定した雑
音スペクトルの値を大きく反映させてノイズベースの更
新を行うことにより、ノイズレベルの急激な変化に対応
したノイズベースの更新を行うことができ、音声歪の少
ない音声強調を行うことができる。

【０１１９】（実施の形態３）図５は、実施の形態３に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図１と共通する構成については図１と同一番
号を付し、詳しい説明を省略する。

【０１２０】図５の音声処理装置は、ミュジカルノイズ
抑制部５０１とコムフィルタ修正部５０２を具備してフ
レームに突発性ノイズが含まれる場合に、生成されたコ
ムフィルタを修正して突発性ノイズに起因するミュジカ
ルノイズの発生を抑圧する点が、図１と異なる。

【０１２１】図５において、コムフィルタ生成部１０７
は、各周波数成分における音声成分の有無に基づいてピ
ッチ調波を強調するコムフィルタを生成してミュジカル
ノイズ抑制部５０１、及びコムフィルタ修正部５０２に
出力する。

【０１２２】ミュジカルノイズ抑制部５０１は、コムフ
ィルタ生成部１０７から出力されたコムフィルタの各周
波数成分の状態の中でオン、つまり信号を減衰せずに出
力する状態の数が一定の閾値以下である場合、フレーム
に突発性ノイズが含まれていると判断し、判断結果をコ
ムフィルタ修正部５０２に出力する。

【０１２３】例えば、以下の式（５）を用いてコムフィ
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値（例えば１０)より小さい場合、ミュ
ジカルノイズが発生していると判断する。コムフィルタ修正部５０２は、ミュジカルノイズ抑制部
５０１からフレームに突発性ノイズが含まれるコムフィ
ルタ生成部１０７から出力されたコムフィルタの生成結
果に基づいてコムフィルタにミュジカルノイズの発生を
防ぐ修正を行い、減衰係数計算部１０８にコムフィルタ
を出力する。

【０１２４】具体的には、コムフィルタのすべての周波
数成分の状態をオフつまり信号を減衰して出力する状態
に設定してコムフィルタを減衰係数計算部１０８に出力
する。

【０１２５】減衰係数計算部１０８は、コムフィルタ修
正部５０２から出力されたコムフィルタに周波数特性に
基づいた減衰係数を乗算して、各周波数成分毎に入力信
号の減衰係数の設定を行い、各周波数成分の減衰係数を
乗算部１０９に出力する。

【０１２６】このように、本発明の実施の形態３に係る
音声処理装置によれば、コムフィルタの生成結果からミ
ュジカルノイズ発生を判断することにより、ノイズが音
声信号と誤判断されることを防ぎ、音声歪の少ない音声
強調を行うことができる。

【０１２７】なお、実施の形態３は、実施の形態２と組
み合わせることができる。すなわち、図５の音声処理装
置にノイズ区間判別部４０１及びノイズベース追跡部４
０２を追加することにより実施の形態２の効果も得るこ
とができる。

【０１２８】（実施の形態４）図６は、実施の形態４に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図１と共通する構成については図１と同一番
号を付し、詳しい説明を省略する。図６の音声処理装置
は、平均値計算部６０１を具備し、周波数成分単位で音
声スペクトルのパワの平均値を求める点が、図１と異な
る。

【０１２９】図６において、周波数分割部１０４は、Ｆ
ＦＴ部１０３から出力された音声スペクトルを所定の周
波数単位で分割された音声スペクトルを示す周波数成分
に分割して、各周波数成分毎に音声スペクトルを音声非
音声識別部１０６と、乗算部１０９と、平均値計算部６
０１に出力する。

【０１３０】平均値計算部６０１は、周波数分割部１０
４から出力された音声スペクトルのパワについて、近辺
の周波数成分との平均値及び過去に処理したフレームと
の平均値をとり、得られた平均値をノイズベース推定部
１０５と音声非音声識別部１０６に出力する。

【０１３１】具体的には、以下に示す式（６）を用いて
音声スペクトルの平均値を算出する。ここで、k1、k2は周波数成分を示し、k1＜ｋ＜k2であ
る。n1は過去に処理を行ったフレームを示す番号、ｎは
処理を行うフレームを示す番号を示す。

【０１３２】ノイズベース推定部１０５は、音声非音声
識別部１０６からフレームに音声成分が含まれていない
判定結果が出力された場合、平均値計算部６０１から出
力された音声スペクトルの平均値の周波数成分毎に短時
間パワースペクトルとスペクトルの変化の平均量を表す
移動平均値を算出して、各周波数成分におけるノイズベ
ースを推定して音声非音声識別部１０６に出力する。

【０１３３】音声非音声識別部１０６は、平均値計算部
６０１から出力された音声スペクトル信号の平均値とノ
イズベース推定部１０５から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部１０５とコムフィル
タ生成部１０７に出力する。

【０１３４】このように、本発明の実施の形態４に係る
音声処理装置によれば、各周波数成分における音声スペ
クトルのパワ平均値又は過去に処理を行ったフレームと
処理を行うフレームのパワ平均値を求めることにより、
突発性雑音成分の影響は小さくなり、より正確なコムフ
ィルタを構成することができる。

【０１３５】なお、実施の形態４は、実施の形態２ある
いは実施の形態３と組み合わせることができる。すなわ
ち、図５の音声処理装置にノイズ区間判別部４０１及び
ノイズベース追跡部４０２を追加することにより実施の
形態２の効果も得ることができ、図６の音声処理装置に
ミュジカルノイズ抑制部５０１及びコムフィルタ修正部
５０２を追加することにより実施の形態３の効果も得る
ことができる。

【０１３６】（実施の形態５）図７は、実施の形態５に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図１と共通する構成については図１と同一番
号を付し、詳しい説明を省略する。

【０１３７】図７の音声処理装置は、区間判別部７０１
とコムフィルタリセット部７０２を具備し、音声成分を
含まないフレームに対して全周波数成分で減衰を行うコ
ムフィルタを生成する点が、図１と異なる。

【０１３８】図７において、ＦＦＴ部１０３は、窓掛け
部１０２から出力された音声信号にＦＦＴを行い、音声
スペクトル信号を周波数分割部１０４と区間判別部７０
１に出力する。

【０１３９】区間判別部７０１は、ＦＦＴ部１０３から
出力された音声スペクトルが音声を含むか否か判断して
判断結果をコムフィルタリセット部７０２に出力する。

【０１４０】コムフィルタリセット部７０２は、区間判
別部７０１から出力された判断結果に基づいて、音声ス
ペクトルが音声成分を含まないノイズ成分のみと判断さ
れた場合、コムフィルタ生成部１０７にすべての周波数
成分のコムフィルタをオフにする指示を出力する。

【０１４１】コムフィルタ生成部１０７は、各周波数成
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して減衰係数計算部１０８に出
力する。また、コムフィルタ生成部１０７は、コムフィ
ルタリセット部７０２の指示に従い音声スペクトルが音
声成分を含まないノイズ成分のみと判断された場合に、
すべての周波数成分でオフにしたコムフィルタを生成し
て減衰係数計算部１０８に出力する。

【０１４２】このように、本発明の実施の形態５に係る
音声処理装置によれば、音声成分を含まないフレームに
全周波数成分で減衰を行い、音声を含まない信号区間で
ノイズを全帯域でカットすることにより、音声抑圧処理
に起因するノイズの発生を防ぐことができるので、音声
歪の少ない音声強調を行うことができる。

【０１４３】なお、実施の形態５は、実施の形態２ある
いは実施の形態３と組み合わせることができる。

【０１４４】すなわち、図７の音声処理装置にノイズ区
間判別部４０１及びノイズベース追跡部４０２を追加す
ることにより実施の形態２の効果も得ることができ、図
７の音声処理装置にミュジカルノイズ抑制部５０１及び
コムフィルタ修正部５０２を追加することにより実施の
形態３の効果も得ることができる。

【０１４５】また、実施の形態５は、実施の形態４と組
み合わせることができる。すなわち、図７の音声処理装
置に平均値計算部６０１を追加することにより実施の形
態４の効果も得ることができる。

【０１４６】この場合、周波数分割部１０４は、ＦＦＴ
部１０３から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部１０６と、乗算部１０９と、平均値計算部６０１
に出力する。

【０１４７】音声非音声識別部１０６は、平均値計算部
６０１から出力された音声スペクトル信号の平均値とノ
イズベース推定部１０５から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部１０５とコムフィル
タ生成部１０７に出力する。

【０１４８】（実施の形態６）図８は、実施の形態６に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図１と共通する構成については図１と同一番
号を付し、詳しい説明を省略する。

【０１４９】図８の音声処理装置は、音声ピッチ周期推
定部８０１と音声ピッチ修復部８０２を具備し、音声と
ノイズの判定が難しい周波数領域でノイズと判断されて
失われるピッチ調波情報を補う点が、図１と異なる。

【０１５０】図８において、周波数分割部１０４は、Ｆ
ＦＴ部１０３から出力された音声スペクトルを所定の周
波数単位で分割された音声スペクトルを示す周波数成分
に分割して、各周波数成分毎に音声スペクトルをノイズ
ベース推定部１０５と音声非音声識別部１０６と、乗算
部１０９と、音声ピッチ周期推定部８０１と、音声ピッ
チ修復部８０２に出力する。

【０１５１】コムフィルタ生成部１０７は、各周波数成
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して音声ピッチ周期推定部８０
１、及び音声ピッチ修復部８０２に出力する。

【０１５２】音声ピッチ周期推定部８０１は、コムフィ
ルタ生成部１０７から出力されたコムフィルタと周波数
分割部１０４から出力された音声スペクトルからピッチ
周期を推定し、推定結果を音声ピッチ修復部８０２に出
力する。

【０１５３】例えば、生成されたコムフィルタの中でオ
ンの状態が連続せずに一つの周波数成分をオフにする。
次に、コムフィルタの中でパワーの大きい周波数成分を
二本抽出したピッチ周期推定用コムフィルタを生成し
て、以下に示す自己相関関数の式（７）からピッチ周期
を求める。ここで、PITCH(k)は、ピッチ周期推定用コムフィルタの
状態を表し、k1は周波数の上限、τはピッチの周期を表
し、τは、０からピッチの最大周期であるτ１までの値
をとる。

【０１５４】式（７）のγ（τ）が最大値をとるτをピ
ッチ周期として求める。実際には、高周波数領域におい
て周波数ピッチの形状は、不明確になりやすいのでk1に
中間の周波数の値を用いる。例えば、k1=2kHzと設定す
る。また、PITCH(k)の取りうる値を０と１にすることに
より式（７）の計算を簡単に行うこともできる。

【０１５５】音声ピッチ修復部８０２は、音声ピッチ周
期推定部８０１から出力された推定結果に基づいてコム
フィルタの修正を行い、減衰係数計算部１０８に出力す
る。具体的には、推定されたピッチ周期情報に基づいて
一定の周波数成分毎にピッチを補う、又はピッチ周期毎
に存在するコムフィルタがオンになった周波数成分の連
続である櫛状の帯域の幅を広げるなどの処理を行い、ピ
ッチ調波構造の修復を行う。

【０１５６】減衰係数計算部１０８は、音声ピッチ修復
部８０２から出力されたコムフィルタに周波数特性に基
づいた減衰係数を乗算して、各周波数成分毎に入力信号
の減衰係数の設定を行い、各周波数成分の減衰係数を乗
算部１０９に出力する。

【０１５７】図９に、本実施の形態にかかる音声処理装
置におけるコムフィルタの修復の例を示す。図９におい
て、縦軸は減衰度を示し、横軸は、周波数成分を示す。
具体的には、横軸には、２５６の周波数成分があり、0k
Hzから4kHzの領域を示す。

【０１５８】Ｃ１は生成されたコムフィルタを、Ｃ２は
コムフィルタＣ１にピッチの修復を行ったコムフィルタ
を、Ｃ３は、コムフィルタＣ２にピッチの幅を修正した
コムフィルタを示す。

【０１５９】コムフィルタＣ１は、１００から１４０ま
での周波数成分でピッチ情報が失われている。音声ピッ
チ修復部８０２は、音声ピッチ周期推定部８０１におい
て推定されたピッチ周期情報に基づいてコムフィルタＣ
１の１００から１４０までの周波数成分にあるピッチ情
報を補う。これによりコムフィルタＣ２が得られる。

【０１６０】次に、音声ピッチ修復部８０２は、周波数
分割部１０４から出力された音声スペクトルに基づいて
コムフィルタＣ２のピッチ調波の幅を修正する。これに
よりコムフィルタＣ３が得られる。

【０１６１】このように、本発明の実施の形態６に係る
音声処理装置によれば、ピッチ周期情報を推定して、ノ
イズと判別されて失われたピッチ調波情報を補うことに
より、原音声に近い音声の状態で、かつ音声歪の少ない
音声強調を行うことができる。

【０１６２】なお、実施の形態６は、実施の形態２ある
いは実施の形態５と組み合わせることができる。

【０１６３】すなわち、図８の音声処理装置にノイズ区
間判別部４０１及びノイズベース追跡部４０２を追加す
ることにより実施の形態２の効果も得ることができ、図
８の音声処理装置に区間判別部７０１及び、コムフィル
タリセット部７０２を追加することにより実施の形態５
の効果も得ることができる。

【０１６４】また、実施の形態６は、実施の形態３と組
み合わせることができる。すなわち、図８の音声処理装
置にミュジカルノイズ抑制部５０１及びコムフィルタ修
正部５０２を追加することにより実施の形態３の効果も
得ることができる。

【０１６５】この場合、ミュジカルノイズ抑制部５０１
は、コムフィルタ生成部１０７から出力されたコムフィ
ルタの各周波数成分の中でオン、つまり信号を減衰せず
に出力する状態の数が一定の閾値以下である場合、フレ
ームに突発性ノイズが含まれていると判断し、判断結果
を音声ピッチ周期推定部８０１に出力する。

【０１６６】コムフィルタ修正部５０２は、音声ピッチ
修復部８０２からフレームに突発性ノイズが含まれるコ
ムフィルタ生成部１０７から出力されたコムフィルタの
生成結果に基づいてコムフィルタにミュジカルノイズの
発生を防ぐ修正を行い、減衰係数計算部１０８にコムフ
ィルタを出力する。

【０１６７】また、実施の形態６は、実施の形態４と組
み合わせることができる。すなわち、図８の音声処理装
置に平均値計算部６０１を追加することにより実施の形
態４の効果も得ることができる。

【０１６８】この場合、周波数分割部１０４は、ＦＦＴ
部１０３から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部１０６と、乗算部１０９と、平均値計算部６０１
に出力する。

【０１６９】音声非音声識別部１０６は、平均値計算部
６０１から出力された音声スペクトル信号の平均値とノ
イズベース推定部１０５から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部１０５とコムフィル
タ生成部１０７に出力する。

【０１７０】（実施の形態７）図１０は、実施の形態７
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図１及び図４と共通する構成については図１
及び図４と同一番号を付し、詳しい説明を省略する。図
１０の音声処理装置は、閾値自動調整部１００１を具備
し、ノイズの種類に応じて音声識別の閾値を調整する点
が、図１又は図４と異なる。

【０１７１】図１０において、コムフィルタ生成部１０
７は、各周波数成分における音声成分の有無に基づいて
ピッチ調波を強調するコムフィルタを生成して閾値自動
調整部１００１に出力する。

【０１７２】ノイズ区間判別部４０１は、ＦＦＴ部１０
３から出力された音声スペクトルからフレーム単位で信
号のパワーと移動平均値を算出して、入力信号のパワー
の変化率からフレームが音声を含むか否か判別し、判別
結果を閾値自動調整部１００１に出力する。

【０１７３】閾値自動調整部１００１は、ノイズ区間判
別部４０１から出力された判別結果からフレームに音声
信号が含まれていない場合、コムフィルタ生成部１０７
から出力されたコムフィルタに基づいて音声非音声識別
部１０６の閾値を変更する。

【０１７４】具体的には、以下の式（８）を用いて生成
されたコムフィルタのオンの状態である周波数成分の数
の総和を算出する。この総和が所定の上限値より大きくなった場合、音声非
音声識別部１０６の閾値を大きくする指示を、この総和
が所定の下限値より小さくなった場合、音声非音声識別
部１０６の閾値を小さくする指示を音声非音声識別部１
０６に出力する。

【０１７５】ここで、ｎ１は、過去に処理を行ったフレ
ームを特定する番号であり、ｎ２は処理を行うフレーム
を特定する番号である。

【０１７６】例えば、フレームに振幅のばらつきの小さ
いノイズが含まれる場合、音声非音声識別の閾値を低く
設定し、フレームに振幅のばらつきの大きいノイズが含
まれる場合、音声非音声識別の閾値を高く設定する。

【０１７７】このように、本発明の実施の形態に係る音
声処理装置によれば、音声を含まないフレームの中で音
声が含まれると誤って判断される周波数成分の数に基づ
いて、音声スペクトルの音声非音声識別に用いる閾値の
変更を行うことにより、ノイズの種類に対応した音声の
判別を行い、音声歪の少ない音声強調を行うことができ
る。

【０１７８】なお、実施の形態７は、実施の形態２ある
いは実施の形態３と組み合わせることができる。

【０１７９】すなわち、図１０の音声処理装置にノイズ
区間判別部４０１及びノイズベース追跡部４０２を追加
することにより実施の形態２の効果も得ることができ、
図１０の音声処理装置にミュジカルノイズ抑制部５０１
及びコムフィルタ修正部５０２を追加することにより実
施の形態３の効果も得ることができる。

【０１８０】また、実施の形態７は、実施の形態４と組
み合わせることができる。すなわち、図１０の音声処理
装置に平均値計算部６０１を追加することにより実施の
形態４の効果も得ることができる。

【０１８１】この場合、周波数分割部１０４は、ＦＦＴ
部１０３から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部１０６と、乗算部１０９と、平均値計算部６０１
に出力する。

【０１８２】音声非音声識別部１０６は、平均値計算部
６０１から出力された音声スペクトル信号の平均値とノ
イズベース推定部１０５から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部１０５とコムフィル
タ生成部１０７に出力する。

【０１８３】また、実施の形態７は、実施の形態５ある
いは実施の形態６と組み合わせることができる。すなわ
ち、図１０の音声処理装置に区間判別部７０１及び、コ
ムフィルタリセット部７０２を追加することにより実施
の形態５の効果も得ることができ、図１０の音声処理装
置に音声ピッチ周期推定部８０１及び音声ピッチ修復部
８０２を追加することにより実施の形態６の効果も得る
ことができる。

【０１８４】（実施の形態８）図１１は、実施の形態８
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図１と共通する構成については図１と同一番
号を付し、詳しい説明を省略する。

【０１８５】図１１の音声処理装置は、ノイズベース推
定部１１０１と、第一音声非音声識別部１１０２と、第
二音声非音声識別部１１０３と、音声ピッチ推定部１１
０４と、第一コムフィルタ生成部１１０５と、第二コム
フィルタ生成部１１０６と、音声ピッチ修復部１１０７
と、コムフィルタ修正部１１０８と、音声分離係数計算
部１１０９とを具備し、コムフィルタ作成に用いるノイ
ズベースと、ピッチ調波構造の修復に用いるノイズベー
スをそれぞれ異なる条件で生成する点が、図１の音声処
理装置と異なる。

【０１８６】図１１において、周波数分割部１０４は、
ＦＦＴ部１０３から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部１１０１、第一音声非音声識別部１１
０２、第二音声非音声識別部１１０３、及び音声ピッチ
推定部１１０４に出力する。

【０１８７】ノイズベース推定部１１０１は、第一音声
非音声識別部１１０２からフレームに音声成分が含まれ
ている判定結果が出力された場合、過去に推定したノイ
ズベースを第一音声非音声識別部１１０２に出力する。
また、ノイズベース推定部１１０１は、第二音声非音声
識別部１１０３からフレームに音声成分が含まれている
判定結果が出力された場合、過去に推定したノイズベー
スを第二音声非音声識別部１１０３に出力する。

【０１８８】また、ノイズベース推定部１１０１は、第
一音声非音声識別部１１０２または第二音声非音声識別
部１１０３からフレームに音声成分が含まれていない判
定結果が出力された場合、周波数分割部１０４から出力
された音声スペクトルの周波数成分毎の短時間パワース
ペクトルとスペクトルの変化の平均量を表す移動平均値
を算出して、過去に算出した移動平均値とパワースペク
トルの加重平均値をとり、新しい移動平均値を算出す
る。

【０１８９】具体的には、ノイズベース推定部１１０１
は、式（９）または式（１０）を用いて各周波数成分に
おけるノイズベースを推定して第一音声非音声識別部１
１０２または第二音声非音声識別部１１０３に出力す
る。Ｐ_base(n,k)=(1-α)・Ｐ_base(n-1,k)+α・Ｓ² _f(n-τ,k) …（９）Ｐ_base(n,k)=Ｐ_base(n-1,k) …（１０）ここで、ｎは処理を行うフレームを特定する番号、ｋは
周波数成分を特定する番号、τは遅延時間を示す。ま
た、Ｓ² _f(n,k)は、入力された音声信号のパワースペク
トル、Ｐ_base(n,k)はノイズベースの移動平均値、α(k)
は移動平均係数を示す。

【０１９０】入力された音声信号のパワースペクトル
が、音声とノイズを判別する閾値と先に入力された音声
信号のパワースペクトルとの乗算結果以下である場合、
ノイズベース推定部１１０１は、式（９）より得られた
ノイズベースを出力する。また、入力された音声信号の
パワースペクトルが、音声とノイズを判別する閾値と先
に入力された音声信号のパワースペクトルとの乗算結果
より大きい場合、ノイズベース推定部１１０１は、式
（１０）より得られたノイズベースを出力する。

【０１９１】第一音声非音声識別部１１０２は、周波数
分割部１０４から出力された音声スペクトル信号とノイ
ズベース推定部１１０１から出力されるノイズベースの
値の差が所定の第一閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。

【０１９２】第一音声非音声識別部１１０２では、第一
コムフィルタ生成部１１０５がピッチ調波情報を出来る
限り多く抽出するフィルタを生成するために、第一閾値
を後述する第二音声非音声識別部１１０３が用いる第二
閾値より低い値に設定する。そして、第一音声非音声識
別部１１０２は、判定結果を第一コムフィルタ生成部１
１０５に出力する。

【０１９３】第二音声非音声識別部１１０３は、周波数
分割部１０４から出力された音声スペクトル信号とノイ
ズベース推定部１１０１から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部１１０３は、判定結果を第二コムフ
ィルタ生成部１１０６に出力する。

【０１９４】第一コムフィルタ生成部１１０５は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部１１０８に出力する。

【０１９５】具体的には、第一音声非音声識別部１１０
２において、入力された音声信号のパワースペクトル
が、音声とノイズを判別する第一閾値と、入力された音
声信号のパワースペクトルとの乗算結果以上である場
合、すなわち、式（１１）Ｓ² _f(n,k)≧θ_low・Ｐ_base(n,k) …（１１）を満たす場合、第一コムフィルタ生成部１１０５は、当
該周波数成分のフィルタの値を「１」とする。

【０１９６】また、第一音声非音声識別部１１０２にお
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果より小さい場合、すなわ
ち、式（１２）Ｓ² _f(n,k)＜θ_low・Ｐ_base(n,k) …（１２）を満たす場合、第一コムフィルタ生成部１１０５は、当
該周波数成分のコムフィルタの値を「０」とする。

【０１９７】ここで、ｋは、周波数成分を特定する番号
であり、以下に示す式（１３）の値を満たす。ＨＢは、
音声信号に高速フーリエ変換を行う場合のデータ点数を
示す。０≦ｋ＜ＨＢ／２ …（１３）第二コムフィルタ生成部１１０６は、各周波数成分にお
ける音声成分の有無に基づいてピッチ調波を強調する第
二コムフィルタを生成して音声ピッチ修復部１１０７に
出力する。

【０１９８】具体的には、第二音声非音声識別部１１０
３において、入力された音声信号のパワースペクトル
が、音声とノイズを判別する第二閾値と、入力された音
声信号のパワースペクトルとの乗算結果以上である場
合、すなわち、式（１１）Ｓ² _f(n,k)≧θ_low・Ｐ_base(n,k) …（１１）を満たす場合、第二コムフィルタ生成部１１０６は、当
該周波数成分のフィルタの値を「１」とする。

【０１９９】また、第二音声非音声識別部１１０３にお
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第二閾値と、入力された音声信号の
パワースペクトルとの乗算結果より小さい場合、すなわ
ち、式（１２）Ｓ² _f(n,k)＜θ_low・Ｐ_base(n,k) …（１２）を満たす場合、第二コムフィルタ生成部１１０６は、当
該周波数成分のフィルタの値を「０」とする。

【０２００】音声ピッチ推定部１１０４は、周波数分割
部１０４から出力された音声スペクトルからピッチ周期
を推定し、推定結果を音声ピッチ修復部１１０７に出力
する。

【０２０１】例えば、音声ピッチ推定部１１０４は、生
成されたコムフィルタの通過域における音声スペクトル
パワに以下に示す自己相関関数の式（１４）を用いてピ
ッチ周期を求める。ここで、ＣＯＭＢ_low(k)は、第一コムフィルタ生成部
１１０５において生成された第一コムフィルタを示す。
ｋ１は、周波数の上限値を示す。また、τは、ピッチの
周期を示し、「０」からピッチの最大周期までの値をと
る。

【０２０２】そして、音声ピッチ推定部１１０４は、γ
（τ）が、最大値をとるτを音声ピッチ周期として求め
る。実際の処理では、高周波数領域においてピッチ調波
の形状は不明確になることが多いので、ｋ１に中間の周
波数の値を用い、音声信号の周波数領域のうち、低周波
数側半分についてピッチ周期の推定を行う。例えば、音
声ピッチ推定部１１０４は、ｋ１＝２ｋＨｚに設定して
音声ピッチ周期の推定を行う。

【０２０３】音声ピッチ修復部１１０７は、音声ピッチ
推定部１１０４から出力された推定結果に基づいて第二
コムフィルタの修正を行い、コムフィルタ修正部１１０
８に出力する。

【０２０４】以下、図を用いて音声ピッチ修復部１１０
７の具体的な動作について説明する。図１２、図１３、
図１４、及び図１５は、コムフィルタの一例を示す図で
ある。

【０２０５】音声ピッチ修復部１１０７は、第二コムフ
ィルタの通過領域のピークを抽出し、ピッチ基準コムフ
ィルタを生成する。図１２のコムフィルタは、第二コム
フィルタ生成部１１０６において生成された第二コムフ
ィルタの一例である。また、図１３のコムフィルタは、
ピッチ基準コムフィルタの一例である。図１３のコムフ
ィルタでは、図１２のコムフィルタからピークの情報の
みを抽出し、通過領域の幅の情報がなくなっている。

【０２０６】そして、音声ピッチ修復部１１０７は、ピ
ッチ基準コムフィルタのピークとピークの間隔を算出
し、ピークとピークの間隔が、所定の閾値、例えばピッ
チ周期の１５倍の値、を超えた場合、音声ピッチ推定部
１１０４のピッチの推定結果から欠落したピッチの挿入
を行い、ピッチ挿入コムフィルタを生成する。図１４の
コムフィルタは、ピッチ挿入コムフィルタの一例であ
る。図１４のコムフィルタでは、５０ｋHzから１００ｋ
Hz付近及び２００ｋHzから２５０ｋHzにピークが挿入さ
れている。

【０２０７】そして、音声ピッチ修復部１１０７は、ピ
ッチの値に応じてピッチ挿入コムフィルタの通過領域の
ピークの幅を広げてピッチ修復コムフィルタを生成し、
コムフィルタ修正部１１０８に出力する。図１５のコム
フィルタは、ピッチ修復コムフィルタの一例である。図
１５のコムフィルタでは、図１４のピッチ挿入コムフィ
ルタに通過領域の幅の情報が付加されている。

【０２０８】コムフィルタ修正部１１０８は、音声ピッ
チ修復部１１０７において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部１１０５におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部１１０９に出力する。

【０２０９】具体的には、コムフィルタ修正部１１０８
は、ピッチ修復コムフィルタと第一コムフィルタの通過
領域を比較して両方のコムフィルタにおいて通過領域と
なっている部分を通過領域とし、この通過領域以外を、
信号を減衰する阻止領域としてコムフィルタを生成す
る。

【０２１０】以下、コムフィルタ修正の一例を示す。図
１６、図１７、及び図１８は、コムフィルタの一例を示
す図である。図１６のコムフィルタは、第一コムフィル
タ生成部１１０５において生成された第一コムフィルタ
である。また、図１７のコムフィルタは、音声ピッチ修
復部１１０７において生成されたピッチ修復コムフィル
タである。図１８は、コムフィルタ修正部１１０８にお
いて修正されたコムフィルタの一例である。

【０２１１】音声分離係数計算部１１０９は、コムフィ
ルタ修正部１１０８において修正されたコムフィルタに
周波数特性に基づいた分離係数を乗算し、各周波数成分
毎に入力信号の分離係数を算出して乗算部１０９に出力
する。

【０２１２】例えば、音声分離係数計算部１１０９は、
ある周波数成分を特定する番号ｋにおいて、コムフィル
タ修正部１１０８において修正されたコムフィルタCOMB
_res(k)の値が１、すなわち通過領域である場合、分散
係数seps（ｋ）を１とする。また、音声分離係数計算部
１１０９は、コムフィルタCOMB_res(k)の値が０、すな
わち阻止領域である場合、以下の式（１５）から分散係
数seps(k)を算出する。 seps(k)＝gc・ｋ/HB …（１５）ここで、gcは定数、ｋは周波数成分を特定する番号、HB
は、ＦＦＴ変換長つまり高速フーリエ変換を行うデータ
数を示す。

【０２１３】乗算部１０９は、周波数分割部１０４から
出力された音声スペクトルに音声分離係数計算部１１０
９から出力された減衰係数を周波数成分単位で乗算す
る。そして、乗算の結果得られたスペクトルを周波数合
成部１１０に出力する。

【０２１４】このように、本実施の形態の音声処理装置
によれば、コムフィルタ作成に用いるノイズベースと、
ピッチ調波構造修復に用いるノイズベースをそれぞれ異
なる条件で生成することにより、音声情報を多く抽出
し、かつ雑音情報の影響を受け難いコムフィルタを生成
して正確なピッチ調波構造の修復を行うことができる。

【０２１５】具体的には、本実施の音声処理装置によれ
ば、音声と判断する条件を厳しくした第二コムフィルタ
を基準にしたピッチ周期の推定結果を反映させて欠落し
たと推測されるピッチを挿入してコムフィルタのピッチ
調波構造を修復することにより、ピッチ調波の欠落によ
る音声歪を減少することができる。

【０２１６】また、本実施の形態の音声処理装置によれ
ば、コムフィルタのピッチ幅をピッチ周期の推定結果か
ら調整することにより正確にピッチ調波構造を修復する
ことができる。音声と厳しく判断して作成したコムフィ
ルタのピッチ調波構造を修復したコムフィルタの通過領
域と音声と緩く判断して作成したコムフィルタの通過領
域の重複部分を通過領域とし、この重複する通過領域以
外を阻止領域とするコムフィルタを作成することによ
り、ピッチ周期の推定の誤差による影響を低減すること
ができ、正確なピッチ調波構造の修復ができる。

【０２１７】なお、本実施の形態の音声処理装置は、コ
ムフィルタの阻止領域の音声分離係数を、音声スペクト
ルに分離係数を乗算して算出し、コムフィルタの通過領
域の音声分離係数を、音声スペクトルからノイズベース
を減算して算出することもできる。

【０２１８】例えば、音声分離係数計算部１１０９は、
コムフィルタCOMB_res(k)の値が０、すなわち阻止領域
である場合、以下の式（１６）から分散係数seps(k)を
算出する。ここで、P_max（n）は、所定の範囲の周波数成分ｋでのP
_base(n、ｋ)の最大値を示す。式（１６）では、フレー
ム毎にノイズベース推定値の正規化を行い、その逆数を
用いて分離係数とする。

【０２１９】そして、コムフィルタCOMB_res(k)の値が
１、すなわち通過領域である場合、以下の式（１７）か
ら分散係数seps(k)を算出する。ここで、γは、ノイズベースを差し引く量を示す係数で
あり、P_max（n）は、所定の範囲の周波数成分ｋでのP
_base(n，ｋ)の最大値を示す。

【０２２０】このように、本実施の形態の音声処理装置
は、ピッチ修正を行ったコムフィルタの阻止領域にノイ
ズベースの情報から算出した分離係数を乗算することに
より、異なるノイズ特性に対しても最適な分離係数を算
出することができ、ノイズ特性に対応した音声強調を行
うことができる。また、本実施の形態の音声処理装置
は、ピッチ修正を行ったコムフィルタの通過領域に音声
スペクトルからノイズベースを減算して算出した分離係
数を乗算することにより、音声歪みの少ない音声強調を
行うことができる。

【０２２１】また、本実施の形態は、実施の形態２と組
み合わせることもできる。すなわち、図１１の音声処理
装置にノイズ区間判別部４０１及びノイズベース追跡部
４０２を追加することにより実施の形態２の効果も得る
ことができる。

【０２２２】（実施の形態９）図１９は、実施の形態９
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図１及び図１１と共通する構成については図
１及び図１１と同一番号を付し、詳しい説明を省略す
る。

【０２２３】図１９の音声処理装置は、ＳＮＲ計算部１
９０１と、音声雑音フレーム検出部１９０２とを具備
し、音声信号のＳＮＲ（Signal Noise Ratio）を計算
し、ＳＮＲからフレーム単位で音声信号から音声フレー
ムまたは雑音フレームを区別して検出し、音声フレーム
のみピッチ周期の推定を行う点が、図１又は図１１と異
なる。

【０２２４】図１９において、周波数分割部１０４は、
ＦＦＴ部１０３から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部１０５と、第一音声非音声識別部１１
０２と、第二音声非音声識別部１１０３と、乗算部１０
９と、ＳＮＲ計算部１９０１に出力する。

【０２２５】第一コムフィルタ生成部１１０５は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部１１０８とＳＮＲ計算部１９０１に出力する。

【０２２６】ＳＮＲ計算部１９０１は、周波数分割部１
０４から出力された音声スペクトルと第一コムフィルタ
生成部１１０５から出力された第一コムフィルタから音
声信号のＳＮＲを計算して音声雑音フレーム検出部１９
０２に出力する。例えば、ＳＮＲ計算部１９０１は、以
下の式（１８）を用いてＳＮＲを計算する。ここで、ＣＯＭＢ＿ｌｏｗ（ｋ）は、第一コムフィルタ
を示す。また、ｋは周波数成分を示し、０以上かつ音声
信号に高速フーリエ変換を行う場合のデータ点数の半数
より小さい値をとる。

【０２２７】音声雑音フレーム検出部１９０２は、ＳＮ
Ｒ計算部１９０１から出力されたＳＮＲからフレーム単
位で入力信号が音声信号か雑音信号かを判断し、判断結
果を音声ピッチ推定部１９０３に出力する。具体的に
は、音声雑音フレーム検出部１９０２は、ＳＮＲが所定
の閾値より大きい場合、入力した信号を音声信号（音声
フレーム）と判断し、ＳＮＲが所定の閾値以下であるフ
レームが所定の数以上連続して発生した場合、入力した
信号を雑音信号（雑音フレーム）と判断する。

【０２２８】図２０に、上記音声雑音フレーム検出部１
９０２の音声／雑音判断の動作をプログラムで表現した
例を示す。図２０は、本実施の形態の音声処理装置の音
声雑音判断プログラムの一例を示す図である。図２０の
プログラムでは、ＳＮＲが所定の閾値以下であるフレー
ムが１０以上連続して発生した場合、入力した信号を雑
音信号（雑音フレーム）と判断する。

【０２２９】音声ピッチ推定部１９０３は、音声雑音フ
レーム検出部１９０２が音声フレームと判断する場合、
周波数分割部１０４から出力された音声スペクトルから
ピッチ周期を推定し、推定結果を音声ピッチ修復部１１
０７に出力する。ピッチ周期推定の動作は、実施の形態
８の音声ピッチ推定部１１０４と同様の動作を行う。

【０２３０】音声ピッチ修復部１１０７は、音声ピッチ
推定部１９０３から出力された推定結果に基づいて第二
コムフィルタの修正を行い、コムフィルタ修正部１１０
８に出力する。

【０２３１】このように、本実施の形態の音声処理装置
によれば、コムフィルタの通過領域に対応する音声スペ
クトルのパワの和と、コムフィルタの阻止領域に対応す
る音声スペクトルのパワの和との比を求めてＳＮＲと
し、このＳＮＲが所定の閾値以上であるフレームのみを
用いてピッチ周期を推定することにより、雑音によるピ
ッチ周期推定の誤りを低減することができ、音声歪の少
ない音声強調を行うことができる。

【０２３２】なお、本実施の形態の音声処理装置は、第
一コムフィルタからＳＮＲを計算しているが、第二コム
フィルタを用いてＳＮＲを計算してもよい。この場合、
第二コムフィルタ生成部１１０６は、作成した第二コム
フィルタをＳＮＲ計算部１９０１に出力する。そして、
ＳＮＲ計算部１９０１は、周波数分割部１０４から出力
された音声スペクトルと第二コムフィルタから音声信号
のＳＮＲを計算して音声雑音フレーム検出部１９０２に
出力する。

【０２３３】（実施の形態１０）図２１は、実施の形態
１０にかかる音声処理装置の構成の例を示すブロック図
である。但し、図１及び図１１と共通する構成について
は図１及び図１１と同一番号を付し、詳しい説明を省略
する。図２１の音声処理装置は、第一コムフィルタ生成
部２１０１と、第一ミュジカルノイズ抑圧部２１０２
と、第二コムフィルタ生成部２１０３と、第二ミュジカ
ルノイズ抑圧部２１０４とを具備し、第一コムフィルタ
と第二コムフィルタの生成結果からミュジカルノイズ発
生を判断する点が、図１又は図１１と異なる。

【０２３４】図２１において、第一音声非音声識別部１
１０２は、周波数分割部１０４から出力された音声スペ
クトル信号とノイズベース推定部１１０１から出力され
るノイズベースの値の差が所定の第一閾値以上である場
合、音声成分を含む有音部分と判定し、それ以外の場
合、音声成分を含まない雑音のみの無音部分であると判
定する。

【０２３５】第一音声非音声識別部１１０２では、第一
コムフィルタ生成部２１０１がピッチ調波情報を出来る
限り多く抽出するフィルタを生成するために、第一閾値
を後述する第二音声非音声識別部１１０３が用いる第二
閾値より低い値に設定する。そして、第一音声非音声識
別部１１０２は、判定結果を第一コムフィルタ生成部２
１０１に出力する。

【０２３６】第二音声非音声識別部１１０３は、周波数
分割部１０４から出力された音声スペクトル信号とノイ
ズベース推定部１１０１から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部１１０３は、判定結果を第二コムフ
ィルタ生成部２１０３に出力する。

【０２３７】第一コムフィルタ生成部２１０１は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成して第一ミュジカル
ノイズ抑圧部２１０２に出力する。第一コムフィルタ生
成の具体的な動作は、実施の形態８の第一コムフィルタ
生成部１１０５と同様の動作を行う。そして、第一コム
フィルタ生成部２１０１は、第一ミュジカルノイズ抑圧
部２１０２において修正された第一コムフィルタをコム
フィルタ修正部１１０８に出力する。

【０２３８】第一ミュジカルノイズ抑圧部２１０２は、
第一コムフィルタの各周波数成分の状態の中でオン、つ
まり信号を減衰せずに出力する状態の数が一定の閾値以
下である場合、フレームに突発性ノイズが含まれている
と判断する。例えば、以下の式（５）を用いてコムフィ
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値（例えば１０)より小さい場合、ミュ
ジカルノイズが発生していると判断する。そして、第一ミュジカルノイズ抑圧部２１０２は、コム
フィルタのすべての周波数成分の状態をオフつまり信号
を減衰して出力する状態に設定してコムフィルタを第一
コムフィルタ生成部２１０１に出力する。

【０２３９】第二コムフィルタ生成部２１０３は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第二コムフィルタを生成して第二ミュジカル
ノイズ抑圧部２１０４に出力する。第二コムフィルタ生
成の具体的な動作は、実施の形態８の第二コムフィルタ
生成部１１０６と同様の動作を行う。そして、第二コム
フィルタ生成部２１０３は、第二ミュジカルノイズ抑圧
部２１０４において修正された第二コムフィルタを音声
ピッチ修復部１１０７に出力する。

【０２４０】第二ミュジカルノイズ抑圧部２１０４は、
第一コムフィルタの各周波数成分の状態の中でオン、つ
まり信号を減衰せずに出力する状態の数が一定の閾値以
下である場合、フレームに突発性ノイズが含まれている
と判断する。

【０２４１】例えば、以下の式（５）を用いてコムフィ
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値（例えば１０)より小さい場合、ミュ
ジカルノイズが発生していると判断する。そして、第二ミュジカルノイズ抑圧部２１０４は、コム
フィルタのすべての周波数成分の状態をオフつまり信号
を減衰して出力する状態に設定してコムフィルタを第二
コムフィルタ生成部２１０３に出力する。

【０２４２】音声ピッチ修復部１１０７は、音声ピッチ
推定部１１０４から出力された推定結果に基づいて第二
コムフィルタ生成部２１０３から出力された第二コムフ
ィルタの修正を行い、コムフィルタ修正部１１０８に出
力する。

【０２４３】コムフィルタ修正部１１０８は、音声ピッ
チ修復部１１０７において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部２１０１におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部１１０９に出力する。

【０２４４】このように、本実施の形態の音声処理装置
によれば、第一コムフィルタと第二コムフィルタの生成
結果からミュジカルノイズ発生を判断することにより、
ノイズが音声信号と誤判断されることを防ぎ、音声歪の
少ない音声強調を行うことができる。

【０２４５】（実施の形態１１）図２２は、実施の形態
１１にかかる音声処理装置の構成の例を示すブロック図
である。但し、図１及び図１１と共通する構成について
は図１及び図１１と同一番号を付し、詳しい説明を省略
する。図２２の音声処理装置は、平均値計算部２２０１
を具備し、周波数成分単位で音声スペクトルのパワの平
均値を求める点が、図１又は図１１と異なる。

【０２４６】図２２において、周波数分割部１０４は、
ＦＦＴ部１０３から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部１１０１と、第一音声非音声識別部１
１０２と、乗算部１０９と、平均値計算部２２０１に出
力する。

【０２４７】平均値計算部２２０１は、周波数分割部１
０４から出力された音声スペクトルのパワーについて、
近辺の周波数成分との平均値及び過去に処理したフレー
ムとの平均値をとり、得られた平均値を第二音声非音声
識別部１１０３に出力する。

【０２４８】具体的には、以下に示す式（１９）を用い
て音声スペクトルの平均値を算出する。ここで、k1、k2は周波数成分を示し、k1＜ｋ＜k2であ
る。n1は過去に処理を行ったフレームを示す番号、ｎは
処理を行うフレームを示す番号を示す。

【０２４９】第二音声非音声識別部１１０３は、平均値
計算部２２０１から出力された音声スペクトル信号の平
均値とノイズベース推定部１１０１から出力されるノイ
ズベースの値の差が所定の第二閾値以上である場合、音
声成分を含む有音部分と判定し、それ以外の場合、音声
成分を含まない雑音のみの無音部分であると判定する。
そして、第二音声非音声識別部１１０３は、判定結果を
第二コムフィルタ生成部１１０６に出力する。

【０２５０】このように、本発明の実施の形態１１に係
る音声処理装置によれば、各周波数成分における音声ス
ペクトルのパワ平均値又は過去に処理を行ったフレーム
と処理を行うフレームのパワ平均値を求めることによ
り、突発性雑音成分の影響は小さくなり、音声情報のみ
をとりだす第二コムフィルタをより正確に生成すること
ができる。

【０２５１】（実施の形態１２）図２３は、実施の形態
１２にかかる音声処理装置の構成の例を示すブロック図
である。但し、図１、図１１及び図１９と共通する構成
については図１、図１１及び図１９と同一番号を付し、
詳しい説明を省略する。図２３の音声処理装置は、コム
フィルタリセット部２３０１を具備し、音声成分を含ま
ないフレームに対して全周波数成分で減衰を行うコムフ
ィルタを生成する点が、図１、図１１又は図１９と異な
る。

【０２５２】図２３において、音声雑音フレーム検出部
１９０２は、ＳＮＲ計算部１９０１から出力されたＳＮ
Ｒからフレーム単位で入力信号が音声信号か雑音信号か
を判断し、判断結果を音声ピッチ推定部１１０４に出力
する。

【０２５３】具体的には、音声雑音フレーム検出部１９
０２は、ＳＮＲが所定の閾値より大きい場合、入力した
信号を音声信号（音声フレーム）と判断し、ＳＮＲが所
定の閾値以下であるフレームが所定の数以上連続して発
生した場合、入力した信号を雑音信号（雑音フレーム）
と判断する。そして、音声雑音フレーム検出部１９０２
は、判断結果を、音声ピッチ推定部１１０４とコムフィ
ルタリセット部２３０１に出力する。

【０２５４】コムフィルタリセット部２３０１は、音声
雑音フレーム検出部１９０２から出力された判断結果に
基づいて、音声スペクトルが音声成分を含まないノイズ
成分のみと判断された場合、コムフィルタ修正部１１０
８にすべての周波数成分のコムフィルタをオフにする指
示を出力する。

【０２５５】コムフィルタ修正部１１０８は、音声ピッ
チ修復部１１０７において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部１１０５におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部１１０９に出力する。

【０２５６】また、コムフィルタ修正部１１０８は、コ
ムフィルタリセット部２３０１の指示に従い音声スペク
トルが音声成分を含まないノイズ成分のみと判断された
場合に、すべての周波数成分でオフにした第一コムフィ
ルタを生成して音声分離係数計算部１１０９に出力す
る。

【０２５７】このように、本実施の形態の音声処理装置
によれば、音声成分を含まないフレームに全周波数成分
で減衰を行い、音声を含まない信号区間でノイズを全帯
域でカットすることにより、音声抑圧処理に起因するノ
イズの発生を防ぐことができるので、音声歪の少ない音
声強調を行うことができる。

【０２５８】（実施の形態１３）図２４は、実施の形態
１３にかかる音声処理装置の構成の例を示すブロック図
である。但し、図１と共通する構成については図１と同
一番号を付し、詳しい説明を省略する。

【０２５９】図２４の音声処理装置は、雑音分離コムフ
ィルタ生成部２４０１と、雑音分離係数計算部２４０２
と、乗算部２４０３と、雑音周波数合成部２４０４とを
具備し、周波数成分単位でスペクトル信号の音声非音声
を判別して、周波数成分単位で判別結果に基づいた周波
数特性の減衰を行い、正確なピッチ情報を得て雑音成分
のみを取り出すコムフィルタを作成して雑音の特性を抽
出する点が、図１の音声処理装置と異なる。

【０２６０】音声非音声識別部１０６は、周波数分割部
１０４から出力された音声スペクトル信号とノイズベー
ス推定部１０５から出力されるノイズベースの値の差が
所定の閾値以上である場合、雑音成分を含む有音部分と
判定し、それ以外の場合、音声成分を含まない雑音のみ
の無音部分であると判定する。そして、音声非音声識別
部１０６は、判定結果をノイズベース推定部１０５と雑
音分離コムフィルタ生成部２４０１に出力する。

【０２６１】雑音分離コムフィルタ生成部２４０１は、
各周波数成分における音声成分の有無に基づいてピッチ
調波を強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部２４０２に出力する。

【０２６２】具体的には、音声非音声識別部１０６にお
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果以上である場合、すなわ
ち、式（２０）Ｓ² _f(k)≧θ_nos・Ｐ_base(n,k) …（２０）を満たす場合、雑音分離コムフィルタ生成部２４０１
は、当該周波数成分のフィルタの値を「１」とする。

【０２６３】また、音声非音声識別部１０６において、
入力された音声信号のパワースペクトルが、音声とノイ
ズを判別する第一閾値と、入力された音声信号のパワー
スペクトルとの乗算結果より小さい場合、すなわち、式
（２１）Ｓ² _f(k)＜θ_nos・Ｐ_base(n,k) …（２１）を満たす場合、雑音分離コムフィルタ生成部２４０１
は、当該周波数成分のコムフィルタの値を「０」とす
る。ここで、θ_nosは、雑音分離に用いる閾値である。

【０２６４】雑音分離係数計算部２４０２は、雑音分離
コムフィルタ生成部２４０１において生成されたコムフ
ィルタに、周波数特性に基づいた減衰係数を乗算して、
各周波数成分毎に入力信号の減衰係数の設定を行い、各
周波数成分の減衰係数を乗算部２４０３に出力する。具
体的には、雑音分離係数計算部２４０２は、コムフィル
タCOMB_nos(k)の値が０、すなわち阻止領域である場
合、雑音分離係数sepn(k)＝１とする。

【０２６５】そして、コムフィルタCOMB_nos(k)の値が
１、すなわち通過領域である場合、以下の式（２２）か
ら雑音分離係数sepn(k)を算出する。ここで、ｒ_d（ｉ）は、ランダム関数で均一分布の乱数
で構成される。また、kはビンを特定する変数であり、k
のとりうる範囲は０以上、ＦＦＴ変換長つまり高速フー
リエ変換を行うデータ数の半数未満である。

【０２６６】乗算部２４０３は、周波数分割部１０４か
ら出力された音声スペクトルに雑音分離係数計算部２４
０２から出力された雑音分離係数を周波数成分単位で乗
算する。そして、乗算の結果得られたスペクトルを雑音
周波数合成部２４０４に出力する。

【０２６７】雑音周波数合成部２４０４は、乗算部２４
０３から出力された周波数成分単位のスペクトルを所定
の処理時間単位で、周波数領域で連続する音声スペクト
ルに合成してＩＦＦＴ部１１１に出力する。ＩＦＦＴ部
１１１は、雑音周波数合成部２４０４から出力された音
声スペクトルにＩＦＦＴを行って音声信号に変換した信
号を出力する。

【０２６８】このように、本実施の形態の音声処理装置
は、周波数成分単位でスペクトル信号の音声非音声を判
別して、周波数成分単位で判別結果に基づいた周波数特
性の減衰を行うことにより、正確なピッチ情報を得て雑
音成分のみを取り出すコムフィルタを作成でき、雑音の
特性を抽出することができる。また、コムフィルタの阻
止域において雑音成分を減衰せず、コムフィルタの通過
域において雑音成分をノイズベースの推定値と乱数を乗
算して再構成することにより良好な雑音分離特性を得る
ことができる。

【０２６９】（実施の形態１４）図２５は、実施の形態
１４にかかる音声処理装置の構成の例を示すブロック図
である。但し、図１及び図２４と共通する構成について
は図１及び図２４と同一番号を付し、詳しい説明を省略
する。

【０２７０】図２５の音声処理装置は、ＳＮＲ計算部２
５０１と、音声雑音フレーム検出部２５０２と、雑音コ
ムフィルタリセット部２５０３と、雑音分離コムフィル
タ生成部２５０４とを具備し、入力音声信号において音
声成分を含まないフレームに対する雑音分離コムフィル
タの周波数通過域を全て阻止域とする点が、図１及び図
２４の音声処理装置と異なる。

【０２７１】ＳＮＲ計算部２５０１は、周波数分割部１
０４から出力された音声スペクトルから出力された第一
コムフィルタから音声信号のＳＮＲを計算し、計算結果
を音声雑音フレーム検出部２５０２に出力する。

【０２７２】音声雑音フレーム検出部２５０２は、ＳＮ
Ｒ計算部２５０１から出力されたＳＮＲからフレーム単
位で入力信号が音声信号か雑音信号かを判断し、判断結
果を雑音コムフィルタリセット部２５０３に出力する。
具体的には、音声雑音フレーム検出部２５０２は、ＳＮ
Ｒが所定の閾値より大きい場合、入力した信号を音声信
号（音声フレーム）と判断し、ＳＮＲが所定の閾値以下
であるフレームが所定の数以上連続して発生した場合、
入力した信号を雑音信号（雑音フレーム）と判断する。

【０２７３】雑音コムフィルタリセット部２５０３は、
音声雑音フレーム検出部２５０２における判定結果が、
入力音声信号のフレームに音声成分が含まれず雑音成分
のみである判定結果である場合、雑音分離コムフィルタ
生成部２５０４にコムフィルタの全ての周波数通過域を
阻止域に変換する指示を出力する。

【０２７４】雑音分離コムフィルタ生成部２５０４は、
各周波数成分における音声成分の有無に基づいてピッチ
調波を強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部２４０２に出力する。

【０２７５】具体的には、音声非音声識別部１０６にお
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果以上である場合、すなわ
ち、式（２０）Ｓ² _f(k)≧θ_nos・Ｐ_base(n,k) …（２０）を満たす場合、雑音分離コムフィルタ生成部２５０４
は、当該周波数成分のフィルタの値を「１」とする。

【０２７６】また、音声非音声識別部１０６において、
入力された音声信号のパワースペクトルが、音声とノイ
ズを判別する第一閾値と、入力された音声信号のパワー
スペクトルとの乗算結果より小さい場合、すなわち、式
（２１）Ｓ² _f(k)＜θ_nos・Ｐ_base(n,k) …（２１）を満たす場合、雑音分離コムフィルタ生成部２５０４
は、当該周波数成分のコムフィルタの値を「０」とす
る。ここで、θ_nosは、雑音分離に用いる閾値である。

【０２７７】また、雑音分離コムフィルタ生成部２５０
４は、雑音コムフィルタリセット部２５０３からコムフ
ィルタの全ての周波数通過域を阻止域に変換する指示を
受け取った場合、指示に従いコムフィルタの全ての周波
数通過域を阻止域に変換する。

【０２７８】このように、本実施の形態の音声処理装置
によれば、入力音声信号のフレームが音声を含まず、雑
音成分のみと判断した場合、コムフィルタの全ての周波
数通過域を阻止域に変換することにより、音声を含まな
い信号区間でノイズを全帯域でカットすることができ、
良好な雑音分離特性が得られる。

【０２７９】（実施の形態１５）図２６は、実施の形態
１５にかかる音声処理装置の構成の例を示すブロック図
である。但し、図１及び図２４と共通する構成について
は図１及び図２４と同一番号を付し、詳しい説明を省略
する。図２６の音声処理装置は、平均値計算部２６０１
を具備し、各周波数成分における音声スペクトルのパワ
平均値又は過去に処理を行ったフレームと処理を行うフ
レームのパワ平均値を求める点が、図１及び図２４の音
声処理装置と異なる。

【０２８０】平均値計算部２６０１は、乗算部２４０３
から出力された音声スペクトルのパワについて、近辺の
周波数成分との平均値及び過去に処理したフレームとの
平均値をとり、得られた平均値を雑音周波数合成部２４
０４に出力する。具体的には、以下に示す式（６）を用
いて音声スペクトルの平均値を算出する。ここで、k1、k2は周波数成分を示し、k1＜ｋ＜k2であ
る。n1は過去に処理を行ったフレームを示す番号、ｎは
処理を行うフレームを示す番号を示す。

【０２８１】このように、本発明の実施の形態１５に係
る音声処理装置によれば、各周波数成分における音声ス
ペクトルのパワ平均値又は過去に処理を行ったフレーム
と処理を行うフレームのパワ平均値を求めることによ
り、突発性雑音成分の影響は小さくなる。

【０２８２】（実施の形態１６）図２７は、実施の形態
１６にかかる音声処理装置の構成の例を示すブロック図
である。但し、図１と共通する構成については図１と同
一番号を付し、詳しい説明を省略する。図２７の音声処
理装置は、図１１の音声処理装置と図２４の音声処理装
置を組み合わせて、音声強調と雑音抽出とを行う例であ
る。

【０２８３】図２７において、周波数分割部１０４は、
ＦＦＴ部１０３から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部１１０１、第一音声非音声識別部１１
０２、第二音声非音声識別部１１０３、音声ピッチ推定
部１１０４、乗算部２４０３、及び第三音声非音声識別
部２７０１に出力する。

【０２８４】ノイズベース推定部１１０１は、第一音声
非音声識別部１１０２からフレームに音声成分が含まれ
ている判定結果が出力された場合、過去に推定したノイ
ズベースを第一音声非音声識別部１１０２に出力する。
また、ノイズベース推定部１１０１は、第二音声非音声
識別部１１０３からフレームに音声成分が含まれている
判定結果が出力された場合、過去に推定したノイズベー
スを第二音声非音声識別部１１０３に出力する。同様
に、ノイズベース推定部１１０１は、第三音声非音声識
別部２７０１からフレームに音声成分が含まれている判
定結果が出力された場合、過去に推定したノイズベース
を第三音声非音声識別部２７０１に出力する。

【０２８５】また、ノイズベース推定部１１０１は、第
一音声非音声識別部１１０２、第二音声非音声識別部１
１０３、または第三音声非音声識別部２７０１からフレ
ームに音声成分が含まれていない判定結果が出力された
場合、周波数分割部１０４から出力された音声スペクト
ルの周波数成分毎の短時間パワースペクトルとスペクト
ルの変化の平均量を表す移動平均値を算出して、過去に
算出した移動平均値とパワースペクトルの加重平均値を
とり、新しい移動平均値を算出する。

【０２８６】第一音声非音声識別部１１０２は、周波数
分割部１０４から出力された音声スペクトル信号とノイ
ズベース推定部１１０１から出力されるノイズベースの
値の差が所定の第一閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。第一音声非
音声識別部１１０２では、第一コムフィルタ生成部１１
０５が音声ピッチ情報を出来る限り多く抽出するフィル
タを生成するために、第一閾値を後述する第二音声非音
声識別部１１０３が用いる第二閾値より低い値に設定す
る。

【０２８７】そして、第一音声非音声識別部１１０２
は、判定結果を第一コムフィルタ生成部１１０５に出力
する。

【０２８８】第二音声非音声識別部１１０３は、周波数
分割部１０４から出力された音声スペクトル信号とノイ
ズベース推定部１１０１から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部１１０３は、判定結果を第二コムフ
ィルタ生成部１１０６に出力する。

【０２８９】第一コムフィルタ生成部１１０５は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部１１０８に出力する。

【０２９０】音声ピッチ推定部１１０４は、周波数分割
部１０４から出力された音声スペクトルから音声ピッチ
周期を推定し、推定結果を音声ピッチ修復部１１０７に
出力する。音声ピッチ修復部１１０７は、音声ピッチ推
定部１１０４から出力された推定結果に基づいて第二コ
ムフィルタの修正を行い、コムフィルタ修正部１１０８
に出力する。

【０２９１】コムフィルタ修正部１１０８は、音声ピッ
チ修復部１１０７において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部１１０５におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部１１０９に出力する。

【０２９２】音声分離係数計算部１１０９は、コムフィ
ルタ修正部１１０８において修正されたコムフィルタに
周波数特性に基づいた分離係数を乗算し、各周波数成分
毎に入力信号の分離係数を算出して乗算部１０９に出力
する。乗算部１０９は、周波数分割部１０４から出力さ
れた音声スペクトルに音声分離係数計算部１１０９から
出力された減衰係数を周波数成分単位で乗算する。そし
て、乗算の結果得られたスペクトルを周波数合成部１１
０に出力する。

【０２９３】第三音声非音声識別部２７０１は、周波数
分割部１０４から出力された音声スペクトル信号とノイ
ズベース推定部１１０１から出力されるノイズベースの
値の差が所定の閾値以上である場合、雑音成分を含む有
音部分と判定し、それ以外の場合、音声成分を含まない
雑音のみの無音部分であると判定する。そして、第三音
声非音声識別部２７０１は、判定結果をノイズベース推
定部１１０１と雑音分離コムフィルタ生成部２４０１に
出力する。

【０２９４】雑音分離コムフィルタ生成部２４０１は、
各周波数成分における音声成分の有無に基づいて音声ピ
ッチを強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部２４０２に出力する。雑音分
離係数計算部２４０２は、雑音分離コムフィルタ生成部
２４０１において生成されたコムフィルタに、周波数特
性に基づいた減衰係数を乗算して、各周波数成分毎に入
力信号の減衰係数の設定を行い、各周波数成分の減衰係
数を乗算部２４０３に出力する。

【０２９５】乗算部２４０３は、周波数分割部１０４か
ら出力された音声スペクトルに雑音分離係数計算部２４
０２から出力された雑音分離係数を周波数成分単位で乗
算する。そして、乗算の結果得られたスペクトルを雑音
周波数合成部２４０４に出力する。雑音周波数合成部２
４０４は、乗算部２４０３から出力された周波数成分単
位のスペクトルを所定の処理時間単位で、周波数領域で
連続する音声スペクトルに合成してＩＦＦＴ部２７０２
に出力する。

【０２９６】ＩＦＦＴ部２７０２は、雑音周波数合成部
２４０４から出力された音声スペクトルにＩＦＦＴを行
って音声信号に変換した信号を出力する。

【０２９７】このように、本実施の形態の音声処理装置
によれば、周波数成分単位でスペクトル信号の音声非音
声を判別して、周波数成分単位で判別結果に基づいた周
波数特性の減衰を行うことにより、正確なピッチ情報を
得ることができるので、大きな減衰で雑音抑圧を行って
も音声歪の少ない音声強調を行うことができる。また、
同時に雑音抽出を行うこともできる。

【０２９８】なお、本発明の音声処理装置は、実施の形
態１６の音声処理装置の例に限らず、上記各実施の形態
は、それぞれ組み合わせて適用することができる。

【０２９９】また、上記いずれかの実施の形態に係る音
声強調及び雑音抽出は、音声処理装置として説明してい
るが、この音声強調及び雑音抽出をソフトウェアにより
実現することもできる。例えば、上記音声強調及び雑音
抽出を行うプログラムを予めＲＯＭ（Read Only Memo
ry）に格納しておき、そのプログラムをＣＰＵ（Centra
l Processor Unit）によって動作するようにしてもよ
い。

【０３００】また、上記音声強調及び雑音抽出を行うプ
ログラムをコンピュータ読み取り可能な記憶媒体に格納
し、記憶媒体に格納されたプログラムをコンピュータの
ＲＡＭ（Random Access Memory）に記録して、コンピ
ュータをそのプログラムに従って実行させてもよい。こ
のような場合においても、上記実施の形態と同様の作用
及び効果を呈する。

【０３０１】また、上記音声強調を行うプログラムをサ
ーバに格納し、サーバに格納されたプログラムをクライ
アントに転送して、クライアント上でそのプログラムを
実行させてもよい。このような場合においても、上記実
施の形態と同様の作用及び効果を呈する。

【０３０２】また、上記いずれかの実施の形態に係る音
声処理装置は、無線通信装置、通信端末、基地局装置等
に搭載することもできる。この結果、通信時の音声を音
声強調または雑音抽出できる。

【０３０３】

【発明の効果】以上説明したように、音声スペクトルを
周波数領域単位で音声成分のある領域と音声成分のない
領域に識別して、この識別情報から得られる精度の高い
ピッチ周期に基づいて雑音を抑圧して、音声の歪みが少
なくかつノイズを十分に除去することができる。

【図面の簡単な説明】

【図１】本発明の実施の形態１に係る音声処理装置の構
成を示すブロック図

【図２】上記実施の形態における音声処理装置の動作を
示すフロー図

【図３】上記実施の形態における音声処理装置で作成さ
れるコムフィルタの例を示す図

【図４】実施の形態２にかかる音声処理装置の構成の例
を示すブロック図

【図５】実施の形態３にかかる音声処理装置の構成の例
を示すブロック図

【図６】実施の形態４にかかる音声処理装置の構成の例
を示すブロック図

【図７】実施の形態５にかかる音声処理装置の構成の例
を示すブロック図

【図８】実施の形態６にかかる音声処理装置の構成の例
を示すブロック図

【図９】上記実施の形態における音声処理装置における
コムフィルタの修復の例を示す図

【図１０】実施の形態７にかかる音声処理装置の構成の
例を示すブロック図

【図１１】実施の形態８にかかる音声処理装置の構成の
例を示すブロック図

【図１２】コムフィルタの一例を示す図

【図１３】コムフィルタの一例を示す図

【図１４】コムフィルタの一例を示す図

【図１５】コムフィルタの一例を示す図

【図１６】コムフィルタの一例を示す図

【図１７】コムフィルタの一例を示す図

【図１８】コムフィルタの一例を示す図

【図１９】実施の形態９にかかる音声処理装置の構成の
例を示すブロック

【図２０】本実施の形態の音声処理装置の音声雑音判断
プログラムの一例を示す図

【図２１】実施の形態１０にかかる音声処理装置の構成
の例を示すブロック図

【図２２】実施の形態１１にかかる音声処理装置の構成
の例を示すブロック図

【図２３】実施の形態１２にかかる音声処理装置の構成
の例を示すブロック図

【図２４】実施の形態１３にかかる音声処理装置の構成
の例を示すブロック図

【図２５】実施の形態１４にかかる音声処理装置の構成
の例を示すブロック図

【図２６】実施の形態１５にかかる音声処理装置の構成
の例を示すブロック図

【図２７】実施の形態１６にかかる音声処理装置の構成
の例を示すブロック図

【図２８】従来のコムフィルタ法を用いた音声処理装置
の例を示す図

【図２９】コムフィルタの減衰特性を示す図

【符号の説明】

１０４周波数分割部１０５、１１０１ノイズベース推定部１０６音声非音声識別部１０７コムフィルタ生成部１０８減衰係数計算部１０９、２４０３乗算部１１０周波数合成部４０１ノイズ区間判別部４０２ノイズベース追跡部５０１ミュジカルノイズ抑制部５０２、１１０８コムフィルタ修正部６０１、２２０１、２６０１平均値計算部７０１区間判別部７０２、２３０１コムフィルタリセット部８０１音声ピッチ周期推定部８０２、１１０７音声ピッチ修復部１００１閾値自動調整部１１０２第一音声非音声識別部１１０３第二音声非音声識別部１１０４、１９０３音声ピッチ推定部１１０５、２１０１第一コムフィルタ生成部１１０６、２１０３第二コムフィルタ生成部１１０９音声分離係数計算部１９０１、２５０１ＳＮＲ計算部１９０２、２５０２音声雑音フレーム検出部２１０２第一ミュジカルノイズ抑圧部２１０４第二ミュジカルノイズ抑圧部２４０１雑音分離コムフィルタ生成部２４０２雑音分離係数計算部２４０４雑音周波数合成部２５０３雑音コムフィルタリセット部２５０４雑音分離コムフィルタ生成部２７０１第三音声非音声識別部

Claims

【特許請求の範囲】

【請求項１】入力音声信号の音声スペクトルを所定の
周波数単位で分割する周波数分割手段と、前記周波数分
割手段において周波数分割された音声スペクトル及び雑
音成分のスペクトルであるノイズベースに基づいて前記
音声スペクトルに音声成分が含まれているか否か識別す
る音声識別手段と、前記音声識別手段の識別結果に基づ
いて所定の周波数単位でスペクトルパワの減衰を行う第
一コムフィルタを生成する第一コムフィルタ生成手段
と、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抑圧する雑音抑圧手段と、前記雑音成分が
抑圧された音声スペクトルを周波数領域で連続した音声
スペクトルに合成する周波数合成手段と、前記音声識別
手段により音声成分が含まれないとされた音声スペクト
ルを用いて前記ノイズベースを更新するノイズベース推
定手段と、を具備することを特徴とする音声処理装置。
【請求項２】ノイズベース推定手段は、過去に推定し
たノイズベースの平均値と処理する音声スペクトルのパ
ワを加重平均した平均値に基づいてノイズベースを推定
して更新することを特徴とする請求項１に記載の音声処
理装置。
【請求項３】音声識別手段は、音声スペクトルのパワ
とノイズベースのパワとの差分値が所定の閾値より大き
い場合に音声スペクトルに音声成分が含まれていると判
断し、前記差分値が前記閾値以下の場合に音声スペクト
ルに音声成分が含まれていないと判断することを特徴と
する請求項１又は請求項２に記載の音声処理装置。
【請求項４】音声識別手段は、音声スペクトルのパワ
とノイズベースのパワとの差分値が所定の第一閾値より
大きい場合には音声スペクトルに音声成分が含まれてい
ると判断し、前記第一閾値より小さい第二閾値より前記
差分値が小さい場合には音声スペクトルに音声成分が含
まれていないと判断し、上記いずれの条件をも満たさな
い場合には過去に行った判断を判断結果とすることを特
徴とする請求項１又は請求項２に記載の音声処理装置。
【請求項５】第一コムフィルタ生成手段は、音声成分
の含まれる周波数領域のスペクトルを強調し、雑音成分
の含まれる周波数領域のスペクトルを減衰することを特
徴とする請求項１から請求項４のいずれかに記載の音声
処理装置。
【請求項６】所定の周波数単位でスペクトルパワの減
衰の度合いである減衰係数を設定する減衰係数計算手段
を具備し、雑音抑圧手段は、音声スペクトルに前記減衰
係数を乗算して雑音を抑圧することを特徴とする請求項
１から請求項５のいずれかに記載の音声処理装置。
【請求項７】所定の時間単位で音声信号に音声成分が
含まれているか否かを判断する第二音声識別手段を具備
し、ノイズベース推定手段は、音声信号が音声を含む音
声区間から音声を含まない無音区間に移った場合に、無
音区間の音声スペクトルに基づいてノイズベースを推定
して更新することを特徴とする請求項１から請求項６の
いずれかに記載の音声処理装置。
【請求項８】所定の周波数単位で音声スペクトルのパ
ワの平均値をとる第一平均値計算手段を具備し、ノイズ
ベース手段は、前記平均値に基づいてノイズベースを推
定して更新することを特徴とする請求項１から請求項７
のいずれかに記載の音声処理装置。
【請求項９】音声識別手段は、音声スペクトルのパワ
の平均値に基づいて音声信号に音声成分が含まれている
か否か識別することを特徴とする請求項１から請求項８
のいずれかに記載の音声処理装置。
【請求項１０】雑音抑圧手段は、音声成分を含まない
音声スペクトルの全周波数領域に減衰を行うことを特徴
とする請求項１から請求項９のいずれかに記載の音声処
理装置。
【請求項１１】生成された第一コムフィルタのピッチ
周期情報に基づいて失われたコムフィルタのピッチ調波
情報を修正する第一ピッチ修正手段を具備することを特
徴とする請求項１から請求項１０のいずれかに記載の音
声処理装置。
【請求項１２】生成された第一コムフィルタにおいて
減衰を行わない周波数成分の数が所定の数より大きい場
合、第一識別手段の閾値を大きくし、前記減衰を行わな
い周波数成分の数が前記所定の数以下の場合、前記第一
識別手段の閾値を小さくする閾値調整手段を具備するこ
とを特徴とする請求項１から請求項１１のいずれかに記
載の音声処理装置。
【請求項１３】生成された第一コムフィルタにおいて
減衰を行わない周波数成分の数が所定の数以下の場合、
コムフィルタを音声スペクトルの全周波数領域に対して
減衰を行う第一コムフィルタリセット手段を具備するこ
とを特徴とする請求項１から請求項１２のいずれかに記
載の音声処理装置。
【請求項１４】第一コムフィルタにおいて音声を通過
する帯域が所定の数以下である場合、突発性のノイズが
発生していると判断し、生成されたコムフィルタを全て
の領域の入力音声信号を減衰するコムフィルタに設定す
る第一ミュジカルノイズ抑圧手段を具備することを特徴
とする請求項１から請求項１３のいずれかに記載の音声
処理装置。
【請求項１５】所定の周波数単位で音声スペクトルと
ノイズベースに基づいて音声識別手段と異なる条件で前
記音声スペクトルに音声成分が含まれているか否か識別
する第三音声識別手段と、前記第三音声識別手段の識別
結果に基づいて所定の周波数単位でスペクトルパワの減
衰を行う第二コムフィルタを生成する第二コムフィルタ
生成手段と、音声スペクトルから入力音声信号のピッチ
周期を推測する音声ピッチ推測手段と、前記音声ピッチ
推測手段において推測されたピッチ周期に基づいて第二
コムフィルタのピッチ調波構造を修復してピッチ修復コ
ムフィルタを生成する音声ピッチ修復手段と、ピッチ修
復コムフィルタに基づいて第一コムフィルタの修正を行
うコムフィルタ修正手段とを具備することを特徴とする
請求項１から請求項１４のいずれかに記載の音声処理装
置。
【請求項１６】第三音声識別手段は、音声スペクトル
に音声が含まれると判断する条件を音声識別手段が音声
スペクトルに音声が含まれると判断する条件より厳しく
することを特徴とする請求項１５に記載の音声処理装
置。
【請求項１７】第三音声識別手段は、音声スペクトル
のパワとノイズベースのパワとの差分値が所定の閾値よ
り大きい場合に音声スペクトルに音声成分が含まれてい
ると判断し、前記差分値が前記閾値以下の場合に音声ス
ペクトルに音声成分が含まれていないと判断することを
特徴とする請求項１５又は請求項１６に記載の音声処理
装置。
【請求項１８】第三音声識別手段は、音声スペクトル
のパワとノイズベースのパワとの差分値が所定の第三閾
値より大きい場合には音声スペクトルに音声成分が含ま
れていると判断し、前記第三閾値より小さい第四閾値よ
り前記差分値が小さい場合には音声スペクトルに音声成
分が含まれていないと判断し、上記いずれの条件をも満
たさない場合には過去に行った判断を判断結果とするこ
とを特徴とする請求項１５又は請求項１６に記載の音声
処理装置。
【請求項１９】第二コムフィルタ生成手段は、音声成
分の含まれる周波数領域のスペクトルを強調し、雑音成
分の含まれる周波数領域のスペクトルを減衰することを
特徴とする請求項１５から請求項１８のいずれかに記載
の音声処理装置。
【請求項２０】雑音抑圧された音声スペクトルのパワ
の平均値を所定の周波数単位で算出する第二平均値計算
手段を具備することを特徴とする請求項１５から請求項
１９のいずれかに記載の音声処理装置。
【請求項２１】第二音声識別手段は、音声スペクトル
のパワの平均値に基づいて音声信号に音声成分が含まれ
ているか否か識別することを特徴とする請求項１５から
請求項２０のいずれかに記載の音声処理装置。
【請求項２２】生成された第二コムフィルタのピッチ
周期情報に基づいて失われた第二コムフィルタのピッチ
調波情報を修正する第二ピッチ修正手段を具備すること
を特徴とする請求項１５から請求項２１のいずれかに記
載の音声処理装置。
【請求項２３】入力音声信号の音声スペクトルと生成
されたコムフィルタとから入力音声信号の信号対雑音比
を算出するＳＮＲ算出手段と、信号対雑音比から入力音
声信号の音声スペクトルから音声成分を検出する音声検
出手段と、前記音声検出手段において検出された音声ス
ペクトルからピッチ周期を推定する音声ピッチ推定手段
と、を具備し、第二ピッチ修正手段は、音声ピッチ推定
手段において推定されたピッチ周期でコムフィルタのピ
ッチ調波情報を修正することを特徴とする請求項２２に
記載の音声処理装置。
【請求項２４】音声検出部において音声成分が検出さ
れた場合、第二コムフィルタを音声スペクトルの全周波
数領域に対して減衰を行う第二コムフィルタリセット手
段を具備することを特徴とする請求項１５から請求項２
３のいずれかに記載の音声処理装置。
【請求項２５】コムフィルタ修正手段は、ピッチ修復
コムフィルタの通過領域と第二コムフィルタの通過領域
の重複する部分を修正後の第二コムフィルタの通過領域
とし、この通過領域以外の周波数領域を阻止領域とする
ことを特徴とする請求項１５から請求項２４のいずれか
に記載の音声処理装置。
【請求項２６】第二コムフィルタにおいて音声を通過
する帯域が所定の数以下である場合、突発性のノイズが
発生していると判断し、生成されたコムフィルタを全て
の領域の入力音声信号を減衰するコムフィルタに設定す
る第二ミュジカルノイズ抑圧手段を具備することを特徴
とする請求項１５から請求項２５のいずれかに記載の音
声処理装置。
【請求項２７】入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手段と、前記周波数
分割手段において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手段と、前記音声識別手段の識別結果に基
づいて所定の周波数単位でスペクトルパワの減衰を行う
第一コムフィルタを生成する第一コムフィルタ生成手段
と、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抽出する雑音抽出手段と、前記雑音成分が
抽出された音声スペクトルを周波数領域で連続した音声
スペクトルに合成する周波数合成手段と、前記音声識別
手段により音声成分が含まれないとされた音声スペクト
ルを用いて前記ノイズベースを更新するノイズベース推
定手段と、を具備することを特徴とする音声処理装置。
【請求項２８】第三コムフィルタ生成手段は、第三コ
ムフィルタの通過域においてノイズベースの推定値と乱
数を乗算して再構成することを特徴とする請求項２７に
記載の音声処理装置。
【請求項２９】コムフィルタを用いた音声処理後の音
声スペクトルの周波数平均及び時間平均を算出するスペ
クトル平均手段を具備することを特徴とする請求項２７
又は請求項２８に記載の音声処理装置。
【請求項３０】請求項１から請求項２９のいずれかに
記載の音声処理装置を有することを特徴とする無線通信
装置。
【請求項３１】入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手順と、前記周波数
分割手順において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手順と、前記音声識別手順の識別結果に基
づいて所定の周波数単位でスペクトルパワの減衰を行う
第一コムフィルタを生成する第一コムフィルタ生成手順
と、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抑圧する雑音抑圧手順と、前記雑音成分が
抑圧された音声スペクトルを周波数領域で連続した音声
スペクトルに合成する周波数合成手順と、前記音声識別
手順により音声成分が含まれないとされた音声スペクト
ルを用いて前記ノイズベースを更新するノイズベース推
定手順と、を含む音声処理プログラム。
【請求項３２】入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手順と、前記周波数
分割手順において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手順と、前記識別の結果に基づいて所定の
周波数単位でスペクトルパワの減衰を行うコムフィルタ
を生成するコムフィルタ生成手順と、前記コムフィルタ
を用いて所定の周波数単位で前記音声スペクトルの雑音
成分を抽出する雑音抽出手順と、前記雑音成分が抽出さ
れた音声スペクトルを周波数領域で連続した音声スペク
トルに合成する周波数合成手順と、前記音声識別手順に
より音声成分が含まれないとされた音声スペクトルを用
いて前記ノイズベースを更新するノイズベース推定手段
と、を含む音声処理プログラム。
【請求項３３】入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手順と、前記周波数
分割手順において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手順と、前記音声識別手順の識別結果に基
づいて所定の周波数単位でスペクトルパワの減衰を行う
第一コムフィルタを生成する第一コムフィルタ生成手順
と、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抑圧する雑音抑圧手順と、前記雑音成分が
抑圧された音声スペクトルを周波数領域で連続した音声
スペクトルに合成する周波数合成手順と、前記音声識別
手順により音声成分が含まれないとされた音声スペクト
ルを用いて前記ノイズベースを更新するノイズベース推
定手順と、を含む音声処理プログラムを記録し、要求に
応じて前記音声処理プログラムを要求元に転送すること
を特徴とするサーバ。
【請求項３４】入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手順と、前記周波数
分割手順において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手順と、前記音声識別手順により音声成分
が含まれないとされた音声スペクトルを用いてノイズベ
ースを推定して更新するノイズベース推定手順と、前記
識別の結果に基づいて所定の周波数単位でスペクトルパ
ワの減衰を行うコムフィルタを生成するコムフィルタ生
成手順と、前記コムフィルタを用いて所定の周波数単位
で前記音声スペクトルの雑音成分を抽出する雑音抽出手
順と、前記雑音成分が抽出された音声スペクトルを周波
数領域で連続した音声スペクトルに合成する周波数合成
手順と、を含む音声処理プログラムを記録し、要求に応
じて前記音声処理プログラムを要求元に転送することを
特徴とするサーバ。
【請求項３５】請求項３３又は請求項３４に記載のサ
ーバより転送された音声処理プログラムを実行すること
を特徴とするクライアント装置。
【請求項３６】入力音声信号の音声スペクトルを所定
の周波数単位で分割し、周波数分割された音声スペクト
ル及び雑音成分のスペクトルであるノイズベースに基づ
いて前記音声スペクトルに音声成分が含まれているか否
か識別し、前記識別の結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行う第一コムフィルタを生成
し、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抑圧し、前記雑音成分が抑圧された音声ス
ペクトルを周波数領域で連続した音声スペクトルに合成
し、前記音声識別の結果が音声成分を含まないと識別さ
れた音声スペクトルを用いて前記ノイズベースを更新す
ることを特徴とする音声処理方法。
【請求項３７】入力音声信号の音声スペクトルを所定
の周波数単位で分割し、周波数分割された音声スペクト
ル及び雑音成分のスペクトルであるノイズベースに基づ
いて前記音声スペクトルに音声成分が含まれているか否
か識別し、前記識別の結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行う第一コムフィルタを生成
し、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抽出し、前記雑音成分が抽出された音声ス
ペクトルを周波数領域で連続した音声スペクトルに合成
し、前記音声識別の結果が音声成分を含まないと識別さ
れた音声スペクトルを用いて前記ノイズベースを更新す
ることを特徴とする音声処理方法。