JP3596580B2 - 音声信号の処理回路 - Google Patents
音声信号の処理回路 Download PDFInfo
- Publication number
- JP3596580B2 JP3596580B2 JP18614197A JP18614197A JP3596580B2 JP 3596580 B2 JP3596580 B2 JP 3596580B2 JP 18614197 A JP18614197 A JP 18614197A JP 18614197 A JP18614197 A JP 18614197A JP 3596580 B2 JP3596580 B2 JP 3596580B2
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- level
- frequency component
- signal
- signal processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
【発明の属する技術分野】
この発明は、補聴器、電話、拡声器、音声通信などの分野で用いられる、音声信号の処理装置に関する。
【0002】
【従来の技術】
音声を伝送あるいは再生する場合、その伝送系あるいは再生系に残響やエコーが多いと、音声の明瞭度が低下してしまう。そこで、そのようなときには、発話速度を遅くする、連続して発声される語音を細かく分解し、時間をあけて再生するなどの処理が行われている。
【0003】
また、子音のような高域周波数の語音が聞き取りにくいときには、周波数イコライザ処理により高域周波数の強調を行うこともある。さらに、いわゆる継時マスキング(子音がエネルギーの大きい母音に続くとき、その母音により子音がマスクされる現象)を考慮した重み関数をかける処理も試みられている。
【0004】
さらに、以上の処理は難聴者や老人を対象に行われることもある。
【0005】
【発明が解決しようとする課題】
ところが、前述したように、発話速度を遅くしたり、連続して発声される語音を分解したりすると、次のような問題点を生じてしまう。
【0006】
1.原音声との間に時間のずれを生じ、即時性がなくなってしまう。したがって、会話などを行うときには使えない。また、放送などを聞く場合であっても、聞き終わるまでの時間が長くなってしまう。
2.語音の知覚判断には音声成分の変化速度も重要な手がかりになっているので、発話速度を遅くすると、この手がかりが変化して別な語音に知覚されてしまうことがある。
3.語音を分解してゆっくり再生すると、語音のまとまりとしての情報や過渡的な変化部分の情報が失われ、明瞭度の悪くなることがある。
4.周波数イコライザ処理により常に高域周波数を増幅した音声は、音色のバランスがくずれて不快であったり、聞き取りにくいことがある。
5.継時マスキングを考慮した重み関数をかける処理は、少なくとも重み関数の時間長の遅延が生じてしまい、即時性が失われてしまう。この結果、口の動きと処理音との間に時間ずれを生じて明瞭度に悪い影響を与えることがある。また、イヤホンからマイクロフォンへの音響的フィードバックがあるときには、その時間遅れによって残響音のような現象が引き起こされてしまう。
【0007】
そこで、上述のような問題点に対処するため、本出願人は、「特願平9−99144号」において、音声の低域成分による高域成分へのマスキングを補償する方式として、低域成分が存在する時間帯のみ高域の増幅率を大きくするようにした「音声信号の処理回路」を提案している。
【0008】
しかしながら、この「音声信号の処理回路」においては、高域の増幅率を大きくするので、アンプの利得および最大出力に余裕が必要になるとともに、ハウリングを起こさないようにハウリングマージンの余裕が必要になり、難聴が重い場合に適さない。
【0009】
この発明は、以上のような問題点を一掃しようとするものである。
【0010】
【課題を解決するための手段】
このため、この発明においては、
入力された音声信号の低域成分に対してレベルの低減を行うレベル低減回路と、
上記音声信号について高域成分の開始点を検出する第1の検出回路と、
上記音声信号について高域成分の終了点を検出する第2の検出回路と、
上記第1の検出回路および第2の検出回路の検出出力にしたがって上記レベル低減回路のレベル低減度を制御するレベル制御回路と
を有し、
このレベル制御回路は、上記第1の検出回路が上記高域成分の開始点を検出したとき、上記低域レベル低減回路に対して上記レベル低減度を大きくするように制御信号を供給するとともに、
上記第2の検出回路が上記高域成分の終了点を検出したとき、上記低域レベル低減回路に対して上記レベル低減度を戻すように制御信号を供給する
ようにした音声信号の処理回路
とするものである。
したがって、音声の低域成分による高域成分へのマスキングや継時マスキングに見合う大きさだけ、低域成分のレベルが低減されて、処理後の音声の明瞭度が改善される。
【0011】
【発明の実施の形態】
ところで、通常の会話の音声は、無声音と有声音との組み合わせ、すなわち、低い周波数の成分と高い周波数の成分との組み合わせで構成されている。また、一般の生活環境に存在する音も、低い周波数の成分と高い周波数の成分との組み合わせになっていることが多い。
【0012】
そして、聴覚では、低域成分が高域成分をマスクすることが知られており、音声を知覚するときにも、このマスキングが働いている。健聴者では、このマスキングによる妨害は小さく、マスキングがあっても正しく音声を知覚できるが、難聴者では、マスキングによる妨害が大きく、時間的にも長く続くことがあり、言葉の聞き取りを悪くする原因の一つになっている。
【0013】
また、健聴者でも低域成分の大きい雑音があると、言葉の聞き取りが低下することがある。さらに、いわゆる継時マスキングによっても、言葉の明瞭度が低下する。
【0014】
そこで、この発明は、このようなマスキングあるいは継時マスキングに起因する明瞭度の低下を抑えようとするものである。
【0015】
そして、このため、この発明の一形態においては、音声の高域成分の開始点から数ミリ秒〜十数ミリ秒の期間を開始期間とし、音声の高域成分の終了点から十数ミリ秒〜数十ミリ秒の期間を終了期間とするとき、この開始期間から終了期間までの処理期間には、音声信号の低域成分に対してレベルの低減を行うものである。
【0016】
図1は、この発明の一形態の構成を示すもので、処理前の音声信号S11が、入力端子11を通じて2つのバンドパスフィルタ12、13に共通に供給され、これらのバンドパスフィルタ12、13の出力信号S12、S13が、固定利得および可変利得のアンプ14、15を通じて加算回路16に供給される。
【0017】
この場合、ここでは、音声の第1フォルマント成分を音声の低域成分とし、第2フォルマント成分および子音成分を音声の高域成分として扱うものである。このため、バンドパスフィルタ12の通過帯域は、音声の第2フォルマント成分および子音成分の帯域、例えば1.2 kHz〜8kHzとされ、バンドパスフィルタ13の通過帯域は、音声のピッチ成分および第1フォルマント成分の帯域、例えば200Hz 〜1.2 kHzとされる。
【0018】
したがって、固定利得アンプ14の利得と、可変利得アンプ15の基準利得とが等しい場合、加算回路16からは、入力された音声信号S11に含まれる高域信号成分S12および低域信号成分S13を、等しい割り合いで有する音声信号S16が得られることになる。そして、この信号S16が出力端子17に取り出される。
【0019】
さらに、入力端子11からの音声信号S11が、前処理のため、バンドパスフィルタ21およびレベル算出回路22に順に供給される。この場合、バンドパスフィルタ21は、高域信号成分の開始点および終了点を検出しやすくし、かつ、雑音による影響が小さくなるように、入力された音声信号S11の第2フォルマント成分と子音成分とを、信号S21として抽出するものである。したがって、バンドパスフィルタ21の通過帯域は、バンドパスフィルタ12の通過帯域と例えば等しく設定される。
【0020】
また、レベル算出回路22は、例えば、信号S21を両波整流するとともに、その低域成分(例えば60Hz以下の成分)を取り出すことにより、バンドパスフィルタ12から出力される高域信号成分S12のレベルを示す信号S22を形成するものである。
【0021】
そして、このレベル算出回路22の算出信号S22が検出回路23に供給されて、高域信号成分S12の開始点および終了点が検出され、その検出信号S23がレベル制御回路24に供給されてレベル制御信号S24が形成され、この信号S24が可変利得アンプ15に利得G15の制御信号として供給される。
【0022】
この場合、高域信号成分S12の開始点および終了点の検出と、可変利得アンプ15の利得G15の大きさとは、例えば、図2に示すような関係とされる。すなわち、算出信号S22の示す高域信号成分S12のレベルが開始点判定のしきい値より小さいときには、アンプ15の利得G15は、アンプ14の利得と等しい基準値とされているが、時点t1 に高域信号成分S12のレベルがその開始点判定のしきい値よりも大きくなると、利得G15は、時点t1 から数ミリ秒ないし十数ミリ秒後の時点t2 までの期間Ts をもって所定値まで次第に小さくされる。
【0023】
また、算出信号S22の示す高域信号成分S12のレベルが終了点判定のしきい値よりも大きいときには、利得G15は小さいままに保持されるが、時点t3 に高域信号成分S12のレベルがその終了点判定のしきい値よりも小さくなると、利得G15は、時点t3 から数十ミリ秒ないし200 ミリ秒後の時点t4 までの期間Te をもって基準値まで次第に大きくされる。
【0024】
このような構成によれば、処理前の音声信号S11に高域信号成分S12が含まれているとき、その開始点から終了点までの期間t1 〜t4 には、レベル制御信号S24によりアンプ15の利得G15が小さくなるので、このアンプ15を通じる低域信号成分S13のレベルが低減される。
【0025】
したがって、高域信号成分S12の開始点から終了点までの期間、端子17に出力される音声信号S16の高域信号成分S12のレベルが相対的に高くなるので、信号S16の再生音にマスキングを生じても、そのマスキングに見合うだけ、再生音の高域成分が相対的に大きくなり、したがって、言葉の聞き取りが改善される。また、継時マスキングの場合、高域成分の開始点の近傍でマスキングの程度が大きいが、図2に示すように、高域信号成分S12の開始点の近傍で、低域信号成分のレベルが比較的速やかに低減されて高域信号成分S12のレベルが相対的に高くなるので、継時マスキングに対しても明瞭度を有効に高めることができる。
【0026】
図3は、検出回路23およびレベル制御回路24が、算出信号S22からレベル制御信号S24を形成する方法の一形態を示す。すなわち、この場合には、図1に示した回路の全部がデジタル化されるとともに、例えばDSPにより構成される。また、音声信号S11はもとの処理前のアナログ音声信号をA/D変換したデジタル音声信号とされる。
【0027】
そして、検出回路23およびレベル制御回路24においては、デジタル音声信号S11の1サンプルごとに、図3のレベル制御ルーチン100が実行され、可変利得アンプ15の利得G15が、例えば図2に示すように制御される。なお、ルーチン100および以下の説明において、各変数の意味は以下のとおりである。
【0028】
e(i) :音声信号S11の第i番目のサンプルの示すレベル。
threshold1:高域成分の終了点判定のしきい値。
信号S11がこの値よりも小さくなったとき、高域成分の終了点と判定する。
threshold2:高域成分の開始点判定のしきい値。
信号S11がこの値よりも大きくなったとき、高域成分の開始点と判定する。
threshold1≦threshold2に設定される。
w :利得G15を制御するための重み係数。0≦w ≦1
w =0のとき、G15=基準利得
w =1のとき、G15=最小利得
d1 :係数w を減少させるときのステップ幅。
d2 :係数w を増加させるときのステップ幅。
【0029】
すなわち、レベル制御ルーチン100においては、まず、ステップ101において、第i番目のサンプルの信号レベルe(i)が開始点判定のしきい値threshold2よりも小さいかどうかが判別され、小さいときには、処理はステップ101からステップ102に進む。
【0030】
そして、このステップ102において、第i番目のサンプルの信号レベルe(i)が終了点判定のしきい値threshold1よりも小さいかどうかが判別され、小さいときには、処理はステップ102からステップ103に進み、このステップ103において、係数w がステップ幅d1だけ小さくされ、ルーチン100を終了する。したがって、図2に示すように、高域成分の終了点が検出されたときには、以後、利得G15は次第に大きくなっていき、低域成分のレベルが次第に高くなっていく。
【0031】
また、ステップ102において、第i番目のサンプルの信号レベルe(i)が終了点判定のしきい値threshold1以上のときには、処理はステップ102からこのルーチン100を終了する。したがって、図2に示すように、高域成分の終了点が検出されるまでの期間(利得G15の小さい期間)は、その利得G15が保持されて、低域成分のレベルが低く保持される。
【0032】
さらに、ステップ101において、第i番目のサンプルの信号レベルe(i)が開始点判定のしきい値threshold2以上のときには、処理はステップ101からステップ104に進み、このステップ104において、係数w がステップ幅d2だけ大きくされ、ルーチン100を終了する。したがって、図2に示すように、高域成分の開始点が検出されたときには、以後、利得G15は次第に小さくなっていき、低域成分のレベルが次第に低くなっていく。
【0033】
こうして、レベル制御ルーチン100によれば、低域成分用のアンプ15の利得G15を低減方向に制御することにより、高域成分のレベルを相対的に上昇させているので、マスキングや継時マスキングによる高域成分の聴感上の減衰を補うことができ、会話の子音部分など音声の明瞭度を向上させることができる。
【0034】
図4は、音声波形の観測結果を示すもので、図4Aは上述のルーチン100による処理を行っていない入力音声信号S11の波形、図4Bはルーチン100による処理を行った出力音声信号S16の波形の観測例である。なお、このときの発声内容は、「1行目に書いてください」である。
【0035】
そして、高域成分の開始点から終了点までの期間(矢印A、B、C、D、Eの部分)は、低域成分のレベルが低くなって、高域成分のレベルが相対的に上昇している。特に、矢印A、B、Cの部分では、音節が区切れて強調されたようになり、あたかも、はっきり発音したかのように聞こえる。
【0036】
したがって、上述の処理回路によれば、音声を残響やエコーなどのある系で伝送あるいは再生するとき、あるいは難聴者や老人が音声を聞くとき、以下のような効果を得ることができる。
1.発声された音声のうち、高域成分へのマスキングが軽減されるように低域成分のレベルが低減され、聴感的に子音が強調されるとともに、音節が強調されるので、音声がはっきりし、明瞭度を改善できる。
2.マスキングを軽減するために高域成分を増強する必要がないので、高域成分用のアンプの利得や最大出力、あるいはハウリングマージンに余裕がなくてもよい。したがって、高域成分用のアンプは、常時最大利得状態で動作させることができる。
3.マスキングが起きているときだけ、聴感的に高域成分が強調されるので、高域成分が常に強調されるときのように、音色のバランスが崩れたような不快感がない。
4.原理的に即時処理ができるので、発声者の口の動きと処理音との間に時間差の生じることがない。また、イヤホンからマイクロフォンへの音響的フィードバックがあっても、残響音のような音にはならないので、聞きやすい。
5.語音の知覚判断にとって重要な音声成分の変化速度や、語音のまとまりとしての情報および過渡的な変化部分の情報が失われない。
【0037】
6.ルーチン100は、その処理のステップ数が少ないので、処理が多少遅いDSPであっても、十分に対応することができる。
【0038】
図5に示すレベル制御ルーチン200は、
threshold=threshold1=threshold2
とすることにより、レベル制御ルーチン100を簡略化した場合である。すなわち、ルーチン200においては、
threshold :高域成分の開始点判定および終了点判定のしきい値。
信号S11がこの値よりも小さいと終了点と判定し、この値よりも大きいと開始点と判定する。
とされ、他はルーチン100と同様とされる。
【0039】
そして、ステップ201において、第i番目のサンプルの信号レベルe(i)がしきい値threshold と比較され、レベルe(i)がしきい値threshold よりも小さければ、ステップ202において、係数w がステップ幅d1だけ小さくされ、そうでなければ、ステップ203において、係数w がステップ幅d2だけ大きくされる。
【0040】
したがって、このレベル制御処理ルーチン200によれば、処理がさらに簡単であり、DSPの負担がより軽くなる。
【0041】
なお、上述においては、入力音声信号S11の低域成分のレベルを低減するために、可変利得アンプ15を用いたが、これに代えて、固定利得アンプと可変アッテネータ回路(いわゆる電子ボリューム)との組み合わせとすることもできる。また、上述においては、いわゆる本線用と前処理用とに、同じ特性の2つのバンドパスフィルタ12、21を用いているが、前処理用のバンドパスフィルタ21を省くとともに、バンドパスフィルタ12からの高域成分S12をレベル算出回路22に分配することにより、より簡単な構成とすることができる。
【0042】
さらに、レベル算出回路22の算出信号S22を、レベル制御回路24に供給することにより、可変利得アンプ15における低域成分のレベル低減度を、入力音声信号S11の高域成分S12のレベルに応じて制御することもできる。
【0043】
【発明の効果】
この発明によれば、音声がはっきりし、明瞭度を改善することができる。また、高域成分用のアンプに対する要求を軽減できる。さらに、常に音声の高域を強調するときのような不快感がない。また、発声者の口の動きと処理音との間に時間差の生じることがない。
【0044】
さらに、イヤホンからマイクロフォンへの音響的フィードバックがあっても、残響音のようにならず、聞きやすい。また、語音の知覚判断などに有効な情報が損なわれない。しかも、デジタル処理する場合の負担を少なくすることができる。
【図面の簡単な説明】
【図1】この発明の一形態を示す系統図である。
【図2】この発明を説明するための図である。
【図3】この発明の一形態を示すフローチャートである。
【図4】この発明を説明するための波形図である。
【図5】この発明の一形態を示すフローチャートである。
【符号の説明】
11=入力端子、12=バンドパスフィルタ、13=バンドパスフィルタ、14=固定利得アンプ、15=可変利得アンプ、16=加算回路、17=出力端子、21=バンドパスフィルタ、22=レベル算出回路、23=検出回路、24=レベル制御回路、100および200=レベル制御ルーチン
Claims (5)
- 入力された音声信号を低域成分と高域成分とに分割する帯域分割回路と、
この帯域分割回路によって分割された上記低域成分のレベルを可変するレベル可変回路と、
上記帯域分割回路によって抽出した高域成分の開始点を検出する第1の検出回路と、
上記帯域分割回路によって抽出した高域成分の終了点を検出する第2の検出回路と、
上記第1の検出回路および上記第2の検出回路の検出出力にしたがって上記レベル可変回路を制御するレベル制御回路と
を有し、
上記第1の検出回路が上記高域成分の開始点を検出したとき、上記レベル可変回路に対してレベルを低減させるように上記レベル制御回路から制御信号を供給するとともに、
上記第2の検出回路が上記高域成分の終了点を検出したとき、上記レベル可変回路に対してレベルの低減を解除するように上記レベル制御回路から制御信号を供給する
ことを特徴とする音声信号の処理回路。 - 請求項1に記載の音声信号の処理回路において、
上記第1の検出回路は、上記高域成分の信号レベルが所定のしきい値を越えたとき、これを検出して上記開始点の検出信号を出力する
ようにした音声信号の処理回路。 - 請求項1に記載の音声信号の処理回路において、
上記第2の検出回路は、上記高域成分の信号レベルが所定のしきい値を下回ったとき、これを検出して上記終了点の検出信号を出力する
ようにした音声信号の処理回路。 - 請求項1に記載の音声信号の処理回路において、
上記第1の検出回路が上記高域成分の開始点を検出した時点からの経過時間に応じてレベルを大きくするように上記レベル制御回路から制御信号を上記レベル可変回路に供給する
ようにした音声信号の処理回路。 - 請求項1に記載の音声信号の処理回路において、
上記第2の検出回路が上記高域成分の終了点を検出した時点からの経過時間に応じてレベルを小さくするように上記レベル制御回路から制御信号を上記レベル可変回路に供給する
ようにした音声信号の処理回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18614197A JP3596580B2 (ja) | 1997-07-11 | 1997-07-11 | 音声信号の処理回路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18614197A JP3596580B2 (ja) | 1997-07-11 | 1997-07-11 | 音声信号の処理回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1132395A JPH1132395A (ja) | 1999-02-02 |
JP3596580B2 true JP3596580B2 (ja) | 2004-12-02 |
Family
ID=16183105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18614197A Expired - Fee Related JP3596580B2 (ja) | 1997-07-11 | 1997-07-11 | 音声信号の処理回路 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3596580B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8374877B2 (en) | 2009-01-29 | 2013-02-12 | Panasonic Corporation | Hearing aid and hearing-aid processing method |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPQ366799A0 (en) * | 1999-10-26 | 1999-11-18 | University Of Melbourne, The | Emphasis of short-duration transient speech features |
JP4939259B2 (ja) * | 2007-03-05 | 2012-05-23 | パイオニア株式会社 | 音響装置及び音声補正方法 |
-
1997
- 1997-07-11 JP JP18614197A patent/JP3596580B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8374877B2 (en) | 2009-01-29 | 2013-02-12 | Panasonic Corporation | Hearing aid and hearing-aid processing method |
Also Published As
Publication number | Publication date |
---|---|
JPH1132395A (ja) | 1999-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100283421B1 (ko) | 음성 속도 변환 방법 및 그 장치 | |
KR100860805B1 (ko) | 음성 강화 시스템 | |
US9591410B2 (en) | Hearing assistance apparatus | |
US7302062B2 (en) | Audio enhancement system | |
US8170221B2 (en) | Audio enhancement system and method | |
KR930002041B1 (ko) | 고 잡음 주위 환경내에서 음성 명료도를 향상시키기 위한 장치 및 방법 | |
JP2003520469A (ja) | 雑音低減装置及び方法 | |
US20080082327A1 (en) | Sound Processing Apparatus | |
US8538052B2 (en) | Generation of probe noise in a feedback cancellation system | |
WO2002093876A2 (en) | Final signal from a near-end signal and a far-end signal | |
JP2002051392A (ja) | 車内会話補助装置 | |
JPH0968997A (ja) | 音声処理方法及び装置 | |
JP4774255B2 (ja) | 音声信号処理方法、装置及びプログラム | |
JP3789503B2 (ja) | 音声処理装置 | |
JP2000152394A (ja) | 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置 | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 | |
JP3596580B2 (ja) | 音声信号の処理回路 | |
JP2000278786A (ja) | マイクロホン装置 | |
JP4079478B2 (ja) | 音声信号の処理回路および処理方法 | |
JP2006333396A (ja) | 音声信号拡声装置 | |
JP5188558B2 (ja) | 音声処理装置 | |
JP3303446B2 (ja) | 音声信号処理装置 | |
KR20080068397A (ko) | 음성명료도 향상장치 및 방법 | |
JPH06289897A (ja) | 音声信号処理装置 | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040818 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040831 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080917 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090917 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |