JPH06289897A - 音声信号処理装置 - Google Patents

音声信号処理装置

Info

Publication number
JPH06289897A
JPH06289897A JP7463693A JP7463693A JPH06289897A JP H06289897 A JPH06289897 A JP H06289897A JP 7463693 A JP7463693 A JP 7463693A JP 7463693 A JP7463693 A JP 7463693A JP H06289897 A JPH06289897 A JP H06289897A
Authority
JP
Japan
Prior art keywords
component
frequency
filter
formant
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7463693A
Other languages
English (en)
Inventor
Masami Miura
雅美 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7463693A priority Critical patent/JPH06289897A/ja
Publication of JPH06289897A publication Critical patent/JPH06289897A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【目的】 音声信号の強調やノイズ除去を行う場合に、
音声を歪ませることのない良好な処理ができるようにす
る。 【構成】 入力音声信号から抽出した第1フォルマント
成分と第2フォルマント成分とを、この第1フォルマン
ト成分及び第2フォルマント成分の検出周波数などに基
づいて強調,減衰などの処理を行い、処理された各帯域
の信号を合成するようにした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、補聴器,電話機,拡声
器などの各種音声信号処理を行う機器に適用して好適な
音声信号処理装置に関する。
【0002】
【従来の技術】従来、電話回線のように比較的帯域幅の
狭い伝送路で音声信号を伝送させたり、記録させるとき
の記録系のSN比が比較的悪い場合や、再生装置のダイ
ナミックレンジが十分に広くない場合、或いは難聴者が
使用する補聴器の場合のように受聴可能なダイナミック
レンジが狭い場合には、元の音声信号の中のレベルの小
さい高域成分を強調してから伝送や記録などの処理を行
い、再生時に高域成分が欠落しないようにしている。
【0003】また、このような音声信号の伝送,記録,
再生等を行う場合に、ノイズが再生されるのを防止する
ために、音声信号からノイズ成分を除去する信号処理方
法が各種開発されている。
【0004】
【発明が解決しようとする課題】ところが、単純に高域
成分を強調させる高域補正を行うと、音声の音色などが
変化して、再生される音声に歪みが生じてしまう不都合
があった。特に、何らかの話し声が音声信号化された場
合には、この音声信号で伝えられる言語の明晰度が低下
して、この処理が行われた音声信号を再生させても、言
葉を判別するのが困難になることが多々あった。特に、
難聴者が使用する補聴器の場合には、この点が非常に重
要で、単純に高域強調などを行うと非常に聞き取り難い
音声が再生されてしまう。
【0005】また、何らかの話し声が音声信号化された
場合には、音声の高域成分とノイズとしての高域成分と
を完全に分離するのは困難で、例えば単純に一定周波数
以上の高域成分をカットすると、音声情報としての高域
成分もカットされ、音声信号で伝えられる言語の明晰度
が低下して、この点からも聞き取り難い音声になってし
まう。
【0006】本発明はかかる点に鑑み、この種の音声信
号処理を行う場合に、音声を歪ませることのない良好な
処理ができるようにすることを目的とする。
【0007】
【課題を解決するための手段】本発明は、例えば図1に
示すように、入力端子1に得られる入力音声信号から、
少なくとも第1フォルマント成分を含む周波数帯域を抽
出する第1のフィルタ12と、少なくとも第2フォルマ
ント成分を含む周波数帯域を抽出する第2のフィルタ1
3と、第1のフィルタ12の出力が供給される第1の強
調回路40と、第2のフィルタ13の出力が供給される
第2の強調回路50と、入力音声信号から、第1フォル
マント成分の周波数を検出する第1の検出回路40と、
第2フォルマント成分の周波数を検出する第2の検出回
路50とを設け、第1及び第2の検出回路40及び50
の検出周波数に基づいて、それぞれの強調回路40,5
0で第1フォルマント成分又は第2フォルマント成分を
強調し、それぞれの強調回路40,50の出力を加算す
るようにしたものである。
【0008】また本発明は、例えば図1に示すように、
入力端子1に得られる入力音声信号から、少なくとも第
1フォルマント成分を含む周波数帯域を抽出する第1の
フィルタ12と、少なくとも第2フォルマント成分を含
む周波数帯域を抽出する第2のフィルタ13と、第1の
フィルタ12の出力が供給される第1の減衰回路40
と、第2のフィルタ13の出力が供給される第2の減衰
回路50とを設け、それぞれの減衰回路40,50で経
時的にレベルが大きい成分を減衰させ、それぞれの減衰
回路40,50の出力を加算するようにしたものであ
る。
【0009】また本発明は、例えば図1に示すように、
入力端子1に得られる入力音声信号から、少なくとも第
1フォルマント成分を含む周波数帯域を抽出する第1の
フィルタ12と、少なくとも第2フォルマント成分を含
む周波数帯域を抽出する第2のフィルタ13と、第1の
フィルタ12の出力が供給される第1の減衰回路40
と、第2のフィルタの出力が供給される第2の減衰回路
50と、入力音声信号より何れかのフォルマント成分の
周波数の変動を検出する検出回路4,5を設け、この検
出回路4,5の検出周波数の変動に同期していない成分
を、それぞれの減衰回路40,50で減衰させ、それぞ
れの減衰回路40,50の出力を加算するようにしたも
のである。
【0010】また、これらの場合に入力音声信号のピッ
チ周波数成分を、第1フォルマント成分と同様に処理し
た後、各フォルマント成分と加算するようにしたもので
ある。
【0011】さらに、これらの場合にフィルタの出力の
FM変調成分の短時間平均周波数を、フォルマント成分
の周波数と判断するようにしたものである。
【0012】さらに、これらの場合に入力音声信号のピ
ッチ周波数の検出により、各フォルマント成分の存在す
る帯域を判断するようにしたものである。
【0013】さらにまた、これらの場合に第1及び第2
のフィルタの出力を加算する前に、それぞれの帯域で第
1又は第2のフィルタと同じ特性のフィルタを通過させ
るようにしたものである。
【0014】また、経時的にレベルが大きい成分を減衰
させる場合の経時的にレベルが大きい成分の判断を、フ
ィルタの出力のFM変調成分の平均周波数より行うよう
にしたものである。
【0015】さらに、フォルマント成分の周波数の変動
に同期していない成分を減衰させる場合において、第1
フォルマント成分の周波数の変動を検出して、各フォル
マント成分の減衰処理を行うようにしたものである。
【0016】
【作用】本発明によると、第1フォルマント成分や第2
フォルマント成分を強調して出力させることで、音声に
よる言語認識に必要な高域の成分が強調され、良好な音
声認識が可能になる。
【0017】また本発明によると、経時的にレベルが大
きい成分を減衰させることで、通常の会話などによる音
声では現れないハウリングなどのノイズ成分が良好に減
衰され、ノイズ除去が良好に行える。
【0018】また本発明によると、フォルマント成分の
周波数の変動に同期していない成分を減衰させること
で、高域成分として音声成分であるフォルマント成分だ
けが残り、高域のノイズ除去が良好に行われる。
【0019】また、これらの場合に入力音声信号のピッ
チ周波数成分を、第1フォルマント成分と同様に処理し
た後、各フォルマント成分と加算することで、ピッチ周
波数成分と各フォルマント成分とで構成される音声構造
が保たれる。
【0020】さらに、これらの場合にフィルタの出力の
FM変調成分の短時間平均周波数を、フォルマント成分
の周波数と判断することで、各フォルマント周波数の判
断が容易にできる。
【0021】さらに、これらの場合に入力音声信号のピ
ッチ周波数の検出により、各フォルマント成分の存在す
る帯域を判断することで、男性,女性,子供の区別など
の音声種類に応じた適切なフォルマント成分の抽出処理
が行われるようになる。
【0022】さらにまた、これらの場合に第1及び第2
のフィルタの出力を加算する前に、それぞれの帯域で第
1又は第2のフィルタと同じ特性のフィルタを通過させ
ることで、強調や減衰などの処理により生じた高調波成
分が加算前のフィルタで除去され、より高音質な音声が
再生できるようになる。
【0023】また、経時的にレベルが大きい成分を減衰
させる場合の経時的にレベルが大きい成分の判断を、フ
ィルタの出力のFM変調成分の平均周波数より行うよう
にしたことで、経時的にレベルが大きい成分の判断が簡
単な構成の回路で実現できる。さらに、フォルマント成
分の周波数の変動に同期していない成分を減衰させる場
合において、第1フォルマント成分の周波数の変動を検
出して、各フォルマント成分の減衰処理を行うようにし
たことで、最も適切に処理が行われる。
【0024】
【実施例】以下、本発明の一実施例を、添付図面を参照
して説明する。
【0025】本例においては、人間の話し声などの音声
を処理する音声信号処理回路として構成したものであ
り、図1に示すように構成する。図1において1は音声
信号入力端子を示し、この入力端子1に得られる音声信
号を、ピッチ周波数検出回路2に供給する。このピッチ
周波数検出回路2は、供給される音声信号のピッチ周波
数を検出する回路である。
【0026】ここで、音声信号のピッチ周波数について
説明すると、人間が話す会話の音声は、主として母音の
場合にピッチ周波数成分と第1フォルマント成分,第2
フォルマント成分‥‥とに解析することができる。即
ち、例えば図9に「あ」と発音した音声のパワースペク
トルを示すと、周波数の低い方から順にピッチ周波数成
分P,第1フォルマント成分F1 ,第2フォルマント成
分F2 ,第3フォルマント成分F3 ‥‥とエネルギーの
集中している箇所が存在する。この場合、通常はピッチ
周波数成分P,第1フォルマント成分F1 ,第2フォル
マント成分F2 ‥‥と周波数が高くなるに従ってエネル
ギーが減少する。なお、ピッチ周波数成分や各フォルマ
ント成分が存在する周波数位置は、発音する音により異
なる。従って通常の会話では、各成分の周波数位置は逐
次変化している。また、同じ音でも、発生する者(男
女,子供の区別など)によって変化する。
【0027】ここで、本例の回路の説明に戻ると、ピッ
チ周波数検出回路2では、最も低い周波数帯域でエネル
ギーの集中している箇所であるピッチ周波数成分Pの検
出を行う。このピッチ周波数検出回路2でのピッチ周波
数の検出方法としては、線形予測分析法,PARCOR
方式(偏自己相関方式),ケプスペクトラム法,解析信
号法などの従来から知られた各種処理による検出方法が
適用できる。
【0028】そして、このピッチ周波数検出回路2で検
出されたピッチ周波数の情報を、フィルタ通過帯域制御
回路3に供給する。このフィルタ通過帯域制御回路3で
は、供給されるピッチ周波数の情報に基づいて、第1フ
ォルマント成分,第2フォルマント成分や子音成分が存
在する周波数を予測し、予測した結果に基づいて後述す
る各バンドパスフィルタ4,11,12,13,14,
21,22,23,24の係数を制御させ、各バンドパ
スフィルタ4,11,12,13,14,21,22,
23,24で抽出させる周波数帯域を制御させる。
【0029】この具体的な通過帯域の制御について説明
すると、ここではピッチ検出回路2で検出されたピッチ
周波数が、男性の話し声のピッチ周波数であると判断し
た場合と、女性の話し声のピッチ周波数であると判断し
た場合と、子供の話し声のピッチ周波数であると判断し
た場合とで、各フィルタ4,11,12,13,14,
21,22,23,24の通過帯域を変化させるように
してある。それぞれの場合での通過帯域の制御の一例を
次の〔表1〕に示す。
【0030】
【表1】
【0031】なお、最も高域を通過させるフィルタ1
4,24の高域側のカットオフ周波数は、この回路で処
理される周波数帯域の上限に対応した周波数とする。
【0032】また、入力端子1に得られる音声信号をバ
ンドパスフィルタ4に供給し、上述したフィルタ通過帯
域制御回路3からの制御に基づいて、このバンドパスフ
ィルタ4で第1フォルマント成分を抽出させる。この場
合、このバンドパスフィルタ4は、FIR型フィルタや
IIR型フィルタなどのデジタルフィルタで構成され、
フィルタの係数の選定により、通過帯域が決まる。そし
て、このバンドパスフィルタ4で抽出した第1フォルマ
ント成分を、瞬時周波数検出回路5に供給する。この瞬
時周波数検出回路5は、供給される第1フォルマント成
分の帯域の音声信号からヒルベルト変換対を作成し、こ
のヒルベルト変換対のデータを使用して第1フォルマン
トF1 の瞬時周波数f(t)を検出する回路である。
【0033】そして、検出した第1フォルマントF1
瞬時周波数のデータを、重み係数算出回路6に供給し、
この重み係数算出回路6での演算処理で、第1フォルマ
ントF1 の変動(ゆらぎ)の重み係数wfl(t)を得
る。そして、この重みデータwfl(t)を、後述する
各フォルマント成分及び子音成分の音声処理回路40,
50,60に供給する。
【0034】また、入力端子1に得られる音声信号をバ
ンドパスフィルタ11,12,13,14に供給する。
このそれぞれのバンドパスフィルタ11,12,13,
14は、上述したフィルタ通過帯域制御回路3からの制
御に基づいて、通過帯域が決まるフィルタで、上述した
バンドパスフィルタ4と同様に、FIR型フィルタやI
IR型フィルタなどのデジタルフィルタで構成され、フ
ィルタの係数の選定により、通過帯域が決まる。そし
て、フィルタ通過帯域制御回路3による制御で、バンド
パスフィルタ11ではピッチ周波数成分の周波数帯域の
抽出が行われ、バンドパスフィルタ12では第1フォル
マント成分の周波数帯域の抽出が行われ、バンドパスフ
ィルタ13では第2フォルマント成分の周波数帯域の抽
出が行われ、バンドパスフィルタ14では子音成分の周
波数帯域の抽出が行われる。
【0035】そして、バンドパスフィルタ11で抽出し
たピッチ周波数成分を含む音声信号を音声処理回路30
に供給し、バンドパスフィルタ12で抽出した第1フォ
ルマント成分を含む音声信号を音声処理回路40に供給
し、バンドパスフィルタ13で抽出した第2フォルマン
ト成分を含む音声信号を音声処理回路50に供給し、バ
ンドパスフィルタ14で抽出した子音成分を含む音声信
号を音声処理回路60に供給する。このそれぞれの音声
処理回路30,40,50,60は、該当する帯域内の
主要成分(ピッチ周波数成分,各フォルマント成分,子
音成分)を強調すると共に、ノイズ成分を減衰させる回
路で、各音声処理回路30〜60はほぼ同様に構成され
る。
【0036】このは、各音声処理回路30〜60の構成
を図2に示すと、入力端子30aに得られる該当する帯
域の音声信号を、ヒルベルト変換対作成回路31に供給
する。このヒルベルト変換対作成回路31は、図3に示
すように構成される。即ち、入力端子31aに得られる
帯域分割音声信号s(t)をIIR型フィルタ31b,
31cに供給し、それぞれのフィルタ31b,31cで
の処理により原信号s(t)と位相の合ったヒルベルト
変換対sh (t)を作成して、両信号を出力端子31
d,31eに得る。ここでは、IIR型フィルタ31
b,31c内の各係数乗算器a0 〜an 及びb0 〜bn
(ここではan はa6 ,bn はb6 )の係数を、次の
〔表2〕に示すように選定する。
【0037】
【表2】
【0038】そして、このヒルベルト変換対作成回路3
1で得た信号s(t)及びヒルベルト変換対sh (t)
を、瞬時周波数検出回路32と包絡線検出回路33とに
供給する。この音声信号s(t)及びそのヒルベルト変
換対sh (t)が供給される瞬時周波数検出回路32
は、図4に示すように構成する。即ち、入力端子32
a,32bに得られるヒルベルト変換対s(t),sh
(t)を、直接演算回路32eに供給すると共に、遅延
回路32c,32dを介して演算回路32eに供給す
る。そして、この演算回路32eで、次の〔数1〕式に
基づいた演算処理を行い、該当する帯域内での瞬時周波
数f(t)を算出し、出力端子32fにこの瞬時周波数
f(t)を得る。
【0039】
【数1】
【0040】また、包絡線検出回路33では、音声信号
s(t)及びそのヒルベルト変換対sh (t)より、包
絡線データe(t)を検出する。この包絡線データe
(t)の検出は、次の〔数2〕式に基づいた演算処理で
行われる。
【0041】
【数2】
【0042】そして、このようにして検出される包絡線
データe(t)を、後述する乗算処理回路39に供給
し、この乗算処理回路39に供給される各係数を乗算す
る。
【0043】そして、瞬時周波数検出回路32で検出さ
れた瞬時周波数f(t)のデータを、長時間平均周波数
検出回路34と短時間平均周波数検出回路35とに供給
し、それぞれの回路で帯域内の長時間平均周波数fla
(t)及び短時間平均周波数fsa(t)を得る。ここ
で、長時間平均周波数検出回路34の構成を図6に示す
と、入力端子34aに得られる瞬時周波数f(t)のデ
ータを、直列に接続された遅延回路34b,34c,3
4d,34e,34f,34gに供給し、入力端子34
aに得られるデータ及び各遅延回路34b〜34gの出
力データを加算器34hで加算させた後、アンプ34i
で1/7のレベルとして、長時間平均周波数fla
(t)を出力端子34jに得る。従って、直列に接続さ
れた遅延回路34b〜34gによる遅延時間に相当する
時間だけ平均化されることになる。ここでは、この検出
時間を数十m秒程度(但し短時間平均周波数検出回路3
5での検出時間よりも十分に長い時間)とする。
【0044】また、短時間平均周波数検出回路35の構
成を図7に示すと、入力端子35aに得られる瞬時周波
数f(t)のデータを、直列に接続された遅延回路35
b,35c,35dに供給し、入力端子35aに得られ
るデータ及び各遅延回路35b〜35dの出力データを
加算器35eで加算させた後、アンプ34fで1/4の
レベルとして、短時間平均周波数fsa(t)を出力端
子35gに得る。従って、直列に接続された遅延回路3
5b〜35dによる遅延時間に相当する時間だけ平均化
されることになる。ここでは、この検出時間を0.5m
秒〜20m秒程度とする。ここでは、このようにして得
た短時間平均周波数fsa(t)を、該当する帯域内の
主要周波数成分とする。
【0045】そして、このようにして得た帯域内の長時
間平均周波数fla(t)と短時間平均周波数fsa
(t)とを、重み係数検出回路36に供給する。この重
み係数検出回路36では、図7のフローチャートに示す
処理が行われる。即ち、まず長時間平均周波数fla
(t)が“0”か否かの判断を行い、“0”の場合には
重み係数wl (t)=0とする。そして、長時間平均周
波数fla(t)が“0”でない場合には、次の〔数
3〕式に基づいた演算処理を行い、重み係数wl (t)
を算出する。
【0046】
【数3】
【0047】このような処理で求まる重み係数w
l (t)は、長時間平均周波数fla(t)と短時間平
均周波数fsa(t)とが等しい場合、継続的に大きな
振幅を持つ成分がこの帯域内に存在すると判断し、音声
の主要周波数成分(ピッチ周波数や各フォルマント成
分)ではないと見なして、係数値が小さくなるようにし
てあり、両平均周波数の差が大きい場合には音声の主要
周波数成分であると見なして係数値が大きくなる。そし
て、この重み係数wl (t)を乗算処理回路39に供給
し、上述した包絡線データe(t)に乗算させる。
【0048】また、短時間平均周波数検出回路35で得
た短時間平均周波数fsa(t)と、瞬時周波数検出回
路32で検出された瞬時周波数f(t)とを、重み係数
検出回路37に供給する。この重み係数検出回路37で
は、図8のフローチャートに示す処理が行われる。即
ち、まず短時間平均周波数fsa(t)が“0”か否か
の判断を行い、“0”の場合には重み係数ws (t)=
1とする。そして、短時間平均周波数fsa(t)が
“0”でない場合には、次の〔数4〕式に基づいた演算
処理を行い、重み係数ws (t)を算出する。
【0049】
【数4】
【0050】このようにして求まる重み係数ws (t)
は、瞬時周波数f(t)が短時間平均周波数fsa
(t)から離れている場合には、主要周波数成分でない
と見なして係数値が小さくなり、瞬時周波数f(t)が
短時間平均周波数fsa(t)に近い場合には、主要周
波数成分であると見なして係数値が大きくなる。そし
て、この重み係数ws (t)を乗算処理回路39に供給
し、上述した包絡線データe(t)に乗算させる。
【0051】また、瞬時周波数検出回路32で検出され
た瞬時周波数f(t)を、FM成分検出回路38に供給
する。このFM成分検出回路38では、次の〔数5〕式
に基づいた演算処理で、FM成分fm(t)を算出す
る。
【0052】
【数5】
【0053】そして、このようにして得られるFM成分
fm(t)を、乗算処理回路39に供給する。また、上
述した重み係数算出回路6が出力する第1フォルマント
1の変動(ゆらぎ)の重み係数wfl(t)を、乗算
処理回路39に供給する。そして、この乗算処理回路3
9では、供給される各データを乗算処理して、処理され
た音声信号を出力端子30cに得る。即ち、この乗算処
理回路39には、包絡線データe(t)と、FM成分f
m(t)と、第1フォルマントF1 の変動の重み係数w
fl(t)と、長時間平均周波数及び短時間平均周波数
に基づいた重み係数wl (t)と、瞬時周波数と短時間
平均周波数とに基づいた重み係数ws (t)とが供給さ
れ、それぞれを乗算(即ちe(t)×fm(t)×wf
l(t)×wl (t)×ws (t)を求める)させる。
【0054】そして、この出力端子30cに得られる音
声信号を、音声処理回路30の出力とする。なお、ピッ
チ周波数を含む帯域の音声信号を処理する音声処理回路
30の場合には、重み係数算出回路6からの重み係数w
fl(t)は供給されず、この重み係数wfl(t)の
乗算処理回路39での乗算処理は行われない。他の音声
処理回路40,50,60では、図2に示すように、重
み係数wfl(t)が乗算される。
【0055】そして、各音声処理回路30,40,5
0,60が出力する各帯域の音声信号を、それぞれの帯
域のバンドパスフィルタ21,22,23,24を通過
させた後、加算器7で加算させて各帯域を合成し、音声
信号出力端子8に供給する。そして、この出力端子8か
ら後段の音声処理回路(再生系回路,伝送系回路など)
に供給する。この場合、加算器7の前段に配されたそれ
ぞれのバンドパスフィルタ21,22,23,24は、
各音声処理回路30,40,50,60の前段に配され
たバンドパスフィルタ11,12,13,14と同じ帯
域を通過させるフィルタとなるように、フィルタ通過帯
域制御回路3で制御を行うようにしてある。このため、
各音声処理回路30,40,50,60の後に設けられ
たバンドパスフィルタ21,22,23,24では、各
音声処理回路30〜60での処理で発生した高調波を除
去する処理が行われる。
【0056】このように処理されて出力端子8に得られ
る音声信号によると、音声を構成する各成分毎に適切な
強調処理やノイズの除去処理が行われ、音声言語の認識
が良好にできる音声信号となる。
【0057】この強調やノイズ除去処理を説明すると、
音声処理回路30内の乗算処理回路39での乗算処理乗
算処理により帯域内の音声信号中の主要成分が強調され
ると共に、ノイズ成分の抑圧が行われる。即ち、瞬時周
波数と短時間平均周波数との差に基づいた重み係数ws
(t)の乗算により、瞬時周波数と短時間平均周波数と
の差が少ない場合には、主要成分(ピッチ成分,フォル
マント成分,子音成分)であると見なして強調する処理
が行われる。従って、例えば図10に実線で示すパワー
スペクトルの音声信号S1 がこの回路に入力した場合、
出力信号としては破線で示すパワースペクトルの音声信
号S2 となり、ピッチ周波数Pや各フォルマント成分F
1 ,F2 ,F3 が強調される。
【0058】このようにして主要成分の強調処理が行わ
れることで、時間的に変化する音声のピッチやフォルマ
ント成分に追随しながら強調処理が行われ、常に音声の
フォルマント構造が保たれ、自然な音質による明瞭度の
高い音声が再生される。また、このように主要な成分だ
けが強調されることで、ノイズレベルが相対的に下が
り、ノイズがそれだけ抑圧されたことになる。
【0059】また、乗算処理回路39での長時間平均周
波数及び短時間平均周波数に基づいた重み係数w
l (t)の乗算により、時間的に周波数が変化しない主
要成分がある場合には減衰され、ハウリングなどの継続
的に周波数が同じノイズ成分が混入した場合には、この
ノイズ成分が減衰処理される。この場合、このノイズ減
衰処理により、音声のフォルマント構造を乱すことがな
いので、このノイズが音声の明瞭度を低下させることは
ない。
【0060】さらに、ピッチ成分以外の帯域では、第1
フォルマントF1 の変動の重み係数wfl(t)の乗算
により、この第1フォルマントF1 の変動(ゆらぎ)に
同期していない成分が減衰され、ピッチ成分と第1フォ
ルマント成分との間のノイズ成分や、各フォルマント成
分間のノイズ成分が減衰され、音声のフォルマント構造
を乱すことなくノイズだけを良好に除去できる。例えば
図10に示すように、ピッチPと第1フォルマントF1
との間や、各フォルマント間のパワーが、入力信号S1
に比べ出力信号S2 では減衰している。
【0061】この点を詳しく説明すると、例えば入力し
た音声信号(「み」と喋った場合の音声信号)の全帯域
の包絡線が図11に示す状態であるとき、この全帯域の
包絡線は、第1フォルマント成分F1 等のフォルマント
成分の変化に連動してレベルが上下する。そして、第1
フォルマント成分の瞬時周波数の変化も、図12に示す
ように同様に上下する。従って、この瞬時周波数の変動
に同期した成分が音声の主要なフォルマント成分である
と判断でき、この瞬時周波数の変動に同期していない成
分を減衰させることで、音声のフォルマント構造を乱す
ことなくノイズだけを良好に除去できる。但し、図11
から判るように、ピッチ成分には、このような変動はな
く、ピッチ成分を扱う音声処理回路30では重み係数w
fl(t)の乗算によるノイズ除去を行わない。
【0062】また本例においては、各フィルタで抽出さ
せる帯域を入力音声信号のピッチ周波数に応じて変化さ
せようにしたことで、ピッチ周波数成分の抽出と、第1
フォルマント成分の抽出と、第2フォルマント成分の抽
出とが高い精度で正確に行え、上述した強調やノイズ除
去などの処理が高精度にできるようになる。
【0063】なお、本例の回路での処理で、ピッチ成分
や各フォルマント成分などの主要成分が強調されると共
にノイズ成分が減衰されることで、会話などの内容の判
断がし易くなる効果は、難聴者が音声を聞き取る場合に
顕著に表れる。従って、本例の回路を難聴者が使用する
補聴器の音声処理回路に適用することで、きわめて大き
な効果が得られる。但し、各種記録・再生装置や伝送装
置などの他の音声処理装置にも適用できることは勿論で
ある。
【0064】また、上述実施例では第1フォルマントの
変動の重み係数を乗算して、第1フォルマントの変動に
同期していない成分を減衰させるようにしたが、第2フ
ォルマントなどの他のフォルマント成分の変動状態を検
出して、この検出した変動状態に同期していない成分を
減衰させるようにしても良い。但し、第1フォルマント
が最も高いレベルなので、最も制御し易い。
【0065】また、上述実施例で示したフィルタのカッ
トオフ周波数の値は、一例を示したもので、他の値に選
定するようにしても良い。
【0066】さらに、上述実施例ではピッチ周波数成分
と第1フォルマント成分と第2フォルマント成分と子音
成分とを、それぞれ別の音声処理回路で処理するように
したが、近い周波数帯域の信号を同じ音声処理回路で処
理するようにしても良い。例えば、第2フォルマント成
分と子音成分とを同じ系の回路で処理して、音声処理回
路やバンドパスフィルタを1系統削減させるようにして
も良い。但し、図1に示すように分けて処理するのが、
音質を確保する上からは最も好ましい。
【0067】
【発明の効果】本発明によると、第1フォルマント成分
や第2フォルマント成分を強調して出力させることで、
音声による言語認識に必要な高域の成分が強調され、良
好な音声認識が可能になる。
【0068】また本発明によると、経時的にレベルが大
きい成分を減衰させることで、通常の会話などによる音
声では現れないハウリングなどのノイズ成分が良好に減
衰され、ノイズ除去が良好に行える。
【0069】また本発明によると、フォルマント成分の
周波数の変動に同期していない成分を減衰させること
で、高域成分として音声成分であるフォルマント成分だ
けが残り、高域のノイズ除去が良好に行われる。
【0070】また、これらの場合に入力音声信号のピッ
チ周波数成分を、第1フォルマント成分と同様に処理し
た後、各フォルマント成分と加算することで、ピッチ周
波数成分と各フォルマント成分とで構成される音声構造
が保たれる。
【0071】さらに、これらの場合にフィルタの出力の
FM変調成分の短時間平均周波数を、フォルマント成分
の周波数と判断することで、各フォルマント周波数の判
断が容易にできる。
【0072】さらに、これらの場合に入力音声信号のピ
ッチ周波数の検出により、各フォルマント成分の存在す
る帯域を判断することで、男性,女性,子供の区別など
の音声種類に応じた適切なフォルマント成分の抽出処理
が行われるようになる。
【0073】さらにまた、これらの場合に第1及び第2
のフィルタの出力を加算する前に、それぞれの帯域で第
1又は第2のフィルタと同じ特性のフィルタを通過させ
ることで、強調や減衰などの処理により生じた高調波成
分が加算前のフィルタで除去され、より高音質な音声が
再生できるようになる。
【0074】また、経時的にレベルが大きい成分を減衰
させる場合の経時的にレベルが大きい成分の判断を、フ
ィルタの出力のFM変調成分の平均周波数より行うよう
にしたことで、経時的にレベルが大きい成分の判断が簡
単な構成の回路で実現できる。さらに、フォルマント成
分の周波数の変動に同期していない成分を減衰させる場
合において、第1フォルマント成分の周波数の変動を検
出して、各フォルマント成分の減衰処理を行うようにし
たことで、最も適切に処理が行われる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す構成図である。
【図2】一実施例の音声処理回路を示す構成図である。
【図3】一実施例のヒルベルト変換対作成回路を示す構
成図である。
【図4】一実施例の瞬時周波数検出回路を示す構成図で
ある。
【図5】一実施例の長時間平均周波数検出回路を示す構
成図である。
【図6】一実施例の短時間平均周波数検出回路を示す構
成図である。
【図7】一実施例の瞬時周波数と短時間平均周波数との
差の重み係数の算出処理を示すフローチャート図であ
る。
【図8】一実施例の短時間平均周波数と長時間平均周波
数との差の重み係数の算出処理を示すフローチャート図
である。
【図9】音声信号のパワースペクトルを示す特性図であ
る。
【図10】一実施例による音声信号のパワースペクトル
の変化を示す特性図である。
【図11】一実施例による各帯域の包絡線検出状態を示
す波形図である。
【図12】一実施例による第1フォルマントの瞬時周波
数の検出例を示す波形図である。
【符号の説明】
1 音声信号入力端子 2 ピッチ周波数検出回路 3 フィルタ通過帯域制御回路 4,12,22 第1フォルマント成分抽出用バンドパ
スフィルタ 5 瞬時周波数検出回路 6 重み係数算出回路 7 加算器 8 音声信号出力端子 11,21 ピッチ成分抽出用バンドパスフィルタ 13,23 第2フォルマント成分抽出用バンドパスフ
ィルタ 14,24 子音成分抽出用バンドパスフィルタ 30,40,50,60 音声処理回路 31 ヒルベルト変換対作成回路 32 瞬時周波数検出回路 33 包絡線検出回路 34 長時間平均周波数検出回路 35 短時間平均周波数検出回路 36,37 重み係数検出回路 38 FM成分検出回路 39 乗算処理回路

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号から、少なくとも第1フォ
    ルマント成分を含む周波数帯域を抽出する第1のフィル
    タと、少なくとも第2フォルマント成分を含む周波数帯
    域を抽出する第2のフィルタと、 上記第1のフィルタの出力が供給される第1の強調回路
    と、上記第2のフィルタの出力が供給される第2の強調
    回路と、 上記入力音声信号から、第1フォルマント成分の周波数
    を検出する第1の検出回路と、第2フォルマント成分の
    周波数を検出する第2の検出回路とを設け、 上記第1及び第2の検出回路の検出周波数に基づいて、
    上記それぞれの強調回路で第1フォルマント成分又は第
    2フォルマント成分を強調し、それぞれの強調回路の出
    力を加算するようにした音声信号処理装置。
  2. 【請求項2】 入力音声信号から、少なくとも第1フォ
    ルマント成分を含む周波数帯域を抽出する第1のフィル
    タと、少なくとも第2フォルマント成分を含む周波数帯
    域を抽出する第2のフィルタと、 上記第1のフィルタの出力が供給される第1の減衰回路
    と、上記第2のフィルタの出力が供給される第2の減衰
    回路とを設け、 上記それぞれの減衰回路で経時的にレベルが大きい成分
    を減衰させ、それぞれの減衰回路の出力を加算するよう
    にした音声信号処理装置。
  3. 【請求項3】 入力音声信号から、少なくとも第1フォ
    ルマント成分を含む周波数帯域を抽出する第1のフィル
    タと、少なくとも第2フォルマント成分を含む周波数帯
    域を抽出する第2のフィルタと、 上記第1のフィルタの出力が供給される第1の減衰回路
    と、上記第2のフィルタの出力が供給される第2の減衰
    回路と、 上記入力音声信号より何れかのフォルマント成分の周波
    数の変動を検出する検出回路を設け、 該検出回路の検出周波数の変動に同期していない成分
    を、上記それぞれの減衰回路で減衰させ、それぞれの減
    衰回路の出力を加算するようにした音声信号処理装置。
  4. 【請求項4】入力音声信号のピッチ周波数成分を、第1
    フォルマント成分と同様に処理した後、各フォルマント
    成分と加算するようにした請求項1,2又は3記載の音
    声信号処理装置。
  5. 【請求項5】 フィルタの出力のFM変調成分の短時間
    平均周波数を、フォルマント成分の周波数と判断するよ
    うにした請求項1,2又は3記載の音声信号処理装置。
  6. 【請求項6】 入力音声信号のピッチ周波数の検出によ
    り、各フォルマント成分の存在する帯域を判断するよう
    にした請求項1,2又は3記載の音声信号処理装置。
  7. 【請求項7】 第1及び第2のフィルタの出力を加算す
    る前に、それぞれの帯域で第1又は第2のフィルタと同
    じ特性のフィルタを通過させるようにした請求項1,2
    又は3記載の音声信号処理装置。
  8. 【請求項8】 経時的にレベルが大きい成分の判断を、
    フィルタの出力のFM変調成分の平均周波数より行うよ
    うにした請求項2記載の音声信号処理装置。
  9. 【請求項9】 検出回路で、第1フォルマント成分の周
    波数の変動を検出するようにした請求項3記載の音声信
    号処理装置。
JP7463693A 1993-03-31 1993-03-31 音声信号処理装置 Pending JPH06289897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7463693A JPH06289897A (ja) 1993-03-31 1993-03-31 音声信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7463693A JPH06289897A (ja) 1993-03-31 1993-03-31 音声信号処理装置

Publications (1)

Publication Number Publication Date
JPH06289897A true JPH06289897A (ja) 1994-10-18

Family

ID=13552898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7463693A Pending JPH06289897A (ja) 1993-03-31 1993-03-31 音声信号処理装置

Country Status (1)

Country Link
JP (1) JPH06289897A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09294168A (ja) * 1996-04-26 1997-11-11 Matsushita Electric Works Ltd 拡声通話装置
WO2003019535A1 (fr) * 2000-02-28 2003-03-06 Linguamaster Corporation Structure de donnees, procede de production, procede de lecture, procede d'enregistrement, support d'enregistrement et procede de distribution de donnees vocales, et procede de lecture de donnees multimedia
WO2003019530A1 (fr) * 2001-08-31 2003-03-06 Kenwood Corporation Dispositif et procede de generation d'un signal a forme d'onde affecte d'un pas ; programme
JP2004507141A (ja) * 2000-08-14 2004-03-04 クリアー オーディオ リミテッド 音声強調システム
JP2005070779A (ja) * 2003-08-25 2005-03-17 Microsoft Corp 調波モデルに基づくフロントエンドを使用する頑強な音声認識のための方法および装置
JP2010191302A (ja) * 2009-02-20 2010-09-02 Sharp Corp 音声出力装置
JP2015177602A (ja) * 2014-03-13 2015-10-05 株式会社東芝 列車制御車上装置
JP6177480B1 (ja) * 2016-12-08 2017-08-09 三菱電機株式会社 音声強調装置、音声強調方法、及び音声処理プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09294168A (ja) * 1996-04-26 1997-11-11 Matsushita Electric Works Ltd 拡声通話装置
WO2003019535A1 (fr) * 2000-02-28 2003-03-06 Linguamaster Corporation Structure de donnees, procede de production, procede de lecture, procede d'enregistrement, support d'enregistrement et procede de distribution de donnees vocales, et procede de lecture de donnees multimedia
JP2004507141A (ja) * 2000-08-14 2004-03-04 クリアー オーディオ リミテッド 音声強調システム
WO2003019530A1 (fr) * 2001-08-31 2003-03-06 Kenwood Corporation Dispositif et procede de generation d'un signal a forme d'onde affecte d'un pas ; programme
JP2005070779A (ja) * 2003-08-25 2005-03-17 Microsoft Corp 調波モデルに基づくフロントエンドを使用する頑強な音声認識のための方法および装置
JP4731855B2 (ja) * 2003-08-25 2011-07-27 マイクロソフト コーポレーション 調波モデルに基づくフロントエンドを使用する頑強な音声認識のための方法およびコンピュータ可読記録媒体
JP2010191302A (ja) * 2009-02-20 2010-09-02 Sharp Corp 音声出力装置
JP2015177602A (ja) * 2014-03-13 2015-10-05 株式会社東芝 列車制御車上装置
JP6177480B1 (ja) * 2016-12-08 2017-08-09 三菱電機株式会社 音声強調装置、音声強調方法、及び音声処理プログラム
WO2018105077A1 (ja) * 2016-12-08 2018-06-14 三菱電機株式会社 音声強調装置、音声強調方法、及び音声処理プログラム

Similar Documents

Publication Publication Date Title
US5757937A (en) Acoustic noise suppressor
KR101989062B1 (ko) 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템
US8582792B2 (en) Method and hearing aid for enhancing the accuracy of sounds heard by a hearing-impaired listener
US6246773B1 (en) Audio signal processors
US8306821B2 (en) Sub-band periodic signal enhancement system
US5572593A (en) Method and apparatus for detecting and extending temporal gaps in speech signal and appliances using the same
KR20160113224A (ko) 오디오 신호를 압축하는 오디오 압축 시스템
JP2002015522A (ja) 音声帯域拡張装置及び音声帯域拡張方法
JPH06289897A (ja) 音声信号処理装置
JPH0968997A (ja) 音声処理方法及び装置
JP4070835B2 (ja) オーディオ信号のフィルタリングのための方法及び装置
JP2002189498A (ja) デジタル音声処理装置及びコンピュータプログラム記録媒体
JP3888239B2 (ja) デジタル音声処理方法及び装置、並びにコンピュータプログラム
JP4147445B2 (ja) 音響信号処理装置
JP5058844B2 (ja) 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
JPH06289898A (ja) 音声信号処理装置
JP2003131686A (ja) 音声と音楽の混合比推定方法及び装置並びにそれを用いたオーディオ装置
JP3303446B2 (ja) 音声信号処理装置
JP5202021B2 (ja) 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
KR100754558B1 (ko) 주기 신호 향상 시스템
KR100883896B1 (ko) 음성명료도 향상장치 및 방법
JP3128870B2 (ja) ノイズ低減装置
JP3847989B2 (ja) 信号抽出装置
JPH06334457A (ja) 自動音量制御装置
JP3596580B2 (ja) 音声信号の処理回路