JP4850191B2 - 自動音量制御装置及びそれを用いた音声通信装置 - Google Patents

自動音量制御装置及びそれを用いた音声通信装置 Download PDF

Info

Publication number
JP4850191B2
JP4850191B2 JP2008006823A JP2008006823A JP4850191B2 JP 4850191 B2 JP4850191 B2 JP 4850191B2 JP 2008006823 A JP2008006823 A JP 2008006823A JP 2008006823 A JP2008006823 A JP 2008006823A JP 4850191 B2 JP4850191 B2 JP 4850191B2
Authority
JP
Japan
Prior art keywords
level
ratio
amplification factor
volume control
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008006823A
Other languages
English (en)
Other versions
JP2009171208A (ja
Inventor
正清 田中
猛 大谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008006823A priority Critical patent/JP4850191B2/ja
Publication of JP2009171208A publication Critical patent/JP2009171208A/ja
Application granted granted Critical
Publication of JP4850191B2 publication Critical patent/JP4850191B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Control Of Amplification And Gain Control (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、入力音声信号の音量制御を行う自動音量制御装置及びそれを用いた音声通信装置に関する。
近年、FTTH(Fiber To The Home)、公衆無線網、高速移動体通信網といったネットワークの整備により、様々な場所で音声通信機器を用いた音声通信が増加し、テレビ音声会議システム等の多地点(3地点以上)の通話が可能な音声通信システムがコスト削減等を目的に普及しつつある。
多地点通話では、利用するマイクロホンの感度や指向性の違い、マイクロホンと話者の距離等により、話者によって音量レベルが様々に異なっている。このため、受話側での音量調節が困難となっている。
受話側のユーザが調節できる音量は、各話者の音声がミックスされた後の音声だけであることが多く、ある話者の音量に合わせて音量を調節すると、別の話者の音量が不適切になるという問題が生じやすい。
これを解決するため、音声通信システムでは、受信した音声が予め定めておいた目標音量レベルになるよう、音量を調節する自動音量制御装置(Automatic Gain Control:AGC)が搭載されていることが多い。自動音量制御装置は、図1に示すように、AGC部1において、入力音声信号の音量を予め定めておいた目標音量レベルに調節して出力する技術である。
図2は、多地点音声通信システムに用いられる音声通信装置の受話側部分の一例のブロック図を示す。同図中、ある話者からの音声信号はAGC部2で目標音量レベルに調節されてミキシング部4に供給され、他の話者からの音声信号はAGC部3で目標音量レベルに調節されてミキシング部4に供給されて、ミキシング部4から合成音声信号が出力される。
なお、特許文献1には、信号を音声区間と雑音区間に分類し、SN比に応じて雑音区間の増幅率を音声区間の増幅率以下にすることで、雑音の増幅による耳障り感を抑えることが記載されている。
また、特許文献2には、複数の入力信号のうち1つの信号を用いて基準となる利得を決定し、その他の信号の利得を、前述の基準となる利得をベースとして自動的に微調節を行って決定することにより、全ての音声信号を容易に同じ音量に調節することが記載されている。
特開2003−60459号公報 特開2006−287716号公報
3地点以上の多地点通話時にSN比が悪い音声の話者が存在する場合について考える。図3に示すように、第1話者の入力音声信号はSN比が高く、第2話者の入力音声信号はSN比が中くらい、第3話者の入力音声信号はSN比が低いとする。
各話者の入力音声信号はそれぞれAGC部において目標音量レベルまで増幅されるため、第3話者の音声信号の雑音レベルは第1,第2話者の音声信号の雑音レベルに比して大きくなる。このため、増幅後の第1〜第3話者の音声信号をミキシングした音声信号における雑音レベルが大きくなり、第1,第2話者の音声信号のSN比までも悪化して、音声が聞き取りにくくなるという問題がある。
本発明は、上記の点に鑑みなされたものであり、雑音レベルが大きくなりすぎることを抑制し、SN比の悪い話者が存在しても他の話者の音声が聞き取り難くなることを低減する自動音量制御装置及びそれを用いた音声通信装置を提供することを目的とする。
本発明の一実施態様による自動音量制御装置は、入力音声信号の音声部分と非音声部分を判定する音声判定手段と、
前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、
前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、
前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、
前記音声レベルと前記雑音レベルと前記SN比と予め設定されている目標音量レベルから前記入力音声信号の増幅率を算出する増幅率算出手段と、
前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、
を有し、
前記増幅率算出手段は、前記SN比が閾値以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比が閾値未満のとき前記雑音レベルが前記目標音量レベルから前記閾値だけ低い値となるように増幅率を算出する
本発明の他の一実施態様による自動音量制御装置は、入力音声信号の音声部分と非音声部分を判定する音声判定手段と、
前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、
前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、
前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、
前記音声レベルと前記雑音レベルと前記SN比算出手段で算出したSN比と予め設定されている目標音量レベルと一又は複数の他の自動音量制御装置から供給されるSN比から前記入力音声信号の増幅率を算出する増幅率算出手段と、
前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、
を有し、
前記増幅率算出手段は、前記SN比算出手段で算出したSN比が前記一又は複数の他の自動音量制御装置から供給されるSN比以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比算出手段で算出したSN比が前記一又は複数の他の自動音量制御装置から供給されるSN比未満のとき前記雑音レベルが前記目標音量レベルから最も高いSN比だけ低い値となるように増幅率を算出する
また、前記自動音量制御装置において、
前記増幅率算出手段は、前記SN比算出手段で算出したSN比が閾値以上のとき又は前記一又は複数の他の自動音量制御装置から供給されるSN比以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比算出手段で算出したSN比が閾値以下かつ前記一又は複数の他の自動音量制御装置から供給されるSN比のいずれかが前記閾値以上のとき前記雑音レベルが前記目標音量レベルから前記閾値だけ低い値となるように増幅率を算出し、前記SN比算出手段で算出したSN比が閾値以下かつ前記一又は複数の他の自動音量制御装置から供給されるSN比が全て前記閾値未満のとき前記雑音レベルが前記目標音量レベルから前記一又は複数の他の自動音量制御装置から供給されるSN比のうち最も高いSN比だけ低い値となるように増幅率を算出する。
また、前記自動音量制御装置において、
前記音声レベル算出手段は、今回の入力音声信号フレームで算出した音声レベルを前回までの入力音声信号フレームで得た音声レベルにより平滑化して出力する。
また、前記自動音量制御装置において、
前記雑音レベル算出手段は、今回の入力音声信号フレームで算出した雑音レベルを前回までの入力音声信号フレームで得た雑音レベルにより平滑化して出力する。
また、前記自動音量制御装置において、
前記増幅率算出手段は、今回の入力音声信号フレームで算出した増幅率を前回までの入力音声信号フレームで得た増幅率により平滑化して出力する。
また、本発明の一実施態様による音声通信装置は、前記自動音量制御装置を複数備え、
前記複数の自動音量制御装置から出力される音声信号を混合するミキシング手段を、
有する。
本発明によれば、雑音レベルが大きくなりすぎることを抑制できる。
ひいては、SN比の悪い話者が存在しても他の話者の音声が聞き取り難くなることを低減することができる。
以下、図面に基づいて本発明の実施形態について説明する。
<第1実施形態>
図4は、自動音量制御装置の第1実施形態の構成例を示す。同図中、端子11からの入力音声信号をVAD(Voice Activity Detection:音声活動判定)部12に供給する。なお、音声信号は、例えばサンプリング周波数8KHzでサンプリングされ、160サンプル(20msecに相当)を1フレームとするデジタル音声信号である。
VAD部12は、例えば特許第3849116号に記載されたものであり、入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期等を用いて音声の特徴量を算出し、パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出し、上記2つの特徴量を基に音声か非音声(すなわち雑音)であるかを判定して、判定結果を音声信号と共に音声レベル更新部13及び雑音レベル更新部14に供給する。
音声レベル更新部13は、今回フレームnで音声部分と判定された場合、まず、今回フレームにおける音声レベルVを(1)式にて求める。
Figure 0004850191
(1)式において、input(k)は入力音声信号の振幅を、Mはフレーム長をそれぞれ表す。次に、音声レベルVと、前回フレームの平均音声レベルV_ave(n−1)とを、平滑化係数COF1を用いて平滑化を行い、今回フレームの平均音声レベルV_ave(n)を求める。なお、今回フレームが非音声部分と判定された場合は、平均音声レベルV_ave(n)は更新しない。この今回フレームの平均音声レベルV_ave(n)を増幅率決定部15に供給する。なお、平滑化係数COF1は例えば0.90〜0.99程度の値である。
V_ave(n)=V_ave(n−1)×COF1+V×(1.0−COF1)
…(2)
雑音レベル更新部14は、今回フレームnで非音声部分と判定された場合、まず、今回フレームにおける雑音レベルNを(3)式にて求める。
Figure 0004850191
次に、雑音レベルNと、前回フレームの平均雑音レベルN_ave(n−1)とを、平滑化係数COF1を用いて平滑化を行い、今回フレームの平均雑音レベルN_ave(n)を求める。なお、今回フレームが音声部分と判定された場合は、平均雑音レベルN_ave(n)は更新しない。この今回フレームの平均雑音レベルN_ave(n)を増幅率決定部15に供給する。
N_ave(n)=N_ave(n−1)×COF1+N×(1.0−COF1)
…(4)
増幅率決定部15は、平均音声レベルV_ave(n)と、平均雑音レベルN_ave(n)と、予め決定されており上位装置から端子16を介して供給される目標音量レベルから、今回フレームのゲインs_gainを決定してゲイン乗算部17に供給する。
ゲイン乗算部17は、端子11から供給される入力音声信号に増幅率決定部15からの増幅率を乗算して端子18から出力音声信号ouput(k)を出力する。
output(k)=input(k)×s_gain
(ただし、k=1,2…M) …(5)
なお、増幅率決定部15は、フレーム境界で増幅率が急激に変化することを防ぐため、例えば以下のように増幅率をサンプル単位で滑らかに変動させる構成としても良い。ここで、nフレームのkサンプル目におけるゲインをgain(n,k)とし、nフレームのみで求めた瞬時ゲインをs_gainとし、平滑化係数をCOF2とする。なお、平滑化係数COF2は例えば0.90〜0.99程度の値である。
gain(n,k)=gain(n,k−1)×COF2
+s_gain×(1.0−COF2) …(6)
この場合、出力音声信号output(k)は以下のようになる。
output(k)=input(k)×gain(n,k)
(ただし、k=1,2…M) …(7)
<増幅率決定部の構成>
図5は、増幅率決定部15の一実施形態の構成例を示す。同図中、増幅率決定部15は、SN比算出部21と増幅率算出部22から構成されている。
SN比算出部21は、音声レベル更新部13からの今回フレームの平均音声レベルV_ave(n)と、雑音レベル更新部14からの今回フレームの平均雑音レベルN_ave(n)からSN比を算出して増幅率算出部22に供給する。
増幅率算出部22は、音声レベル更新部13からの今回フレームの平均音声レベルV_ave(n)と、雑音レベル更新部14からの今回フレームの平均雑音レベルN_ave(n)と、SN比算出部21からのSN比と、上位装置からの目標音量レベルから今回フレームのゲインs_gainを算出する。
<増幅率算出部22の動作>
図6は、増幅率算出部22が実行する処理の一例のフローチャートを示す。同図中、ステップS1で、増幅率算出部22は、SN比算出部21から供給されるSN比が閾値以上か否かを判別する。ここで、閾値は例えば12dB程度の値として予め設定されている。
SN比が閾値以上であれば、ステップS2で今回フレームの平均音声レベルV_ave(n)が、目標音量レベルとなるような今回フレームのゲインs_gainを算出する。
一方、SN比が閾値未満であれば、ステップS3で今回フレームの平均雑音レベルN_ave(n)が、目標音量レベルから閾値を減算した値(目標音量レベル−閾値)となるよう今回フレームのゲインs_gainを算出する。
<多地点音声通信システムの音声通信装置の構成>
図7は、多地点音声通信システムにおける音声通信装置の受話側部分の第1実施形態のブロック図を示す。同図中、音声通信装置20の端子21−1〜21−nには複数の話者から受信した符号化音声信号が供給され、各符号化音声信号は音声復号部22−1〜22−nそれぞれで復号される。復号された各音声信号はAGC部23−1〜23−nそれぞれに供給される。
AGC部23−1〜23−nそれぞれは、図4及び図5に示す構成で図6に示す動作を行う自動音量制御装置であり、各音声信号の音量制御を行って出力音声信号をミキシング部24に供給する。ミキシング部24は、AGC部23−1〜23−nそれぞれから供給される音声信号を混合して端子25から出力する。
<具体的な音量制御動作>
ここで、図7において、n=3とした場合の具体的な音量制御動作について説明する。AGC部23−1〜23−3それぞれに与える目標音量レベルを−24dBov(ov:overload,最大値と比較してどれだけ小さいかのdB表示)、SN比の閾値=12dBとする。
図8に示すように、AGC部23−1に入力される第1話者の音声レベルが−30dBovで、雑音レベルが−54dBovで、SN比が24dBであり、AGC部23−2に入力される第2話者の音声レベルが−42dBovで、雑音レベルが−48dBovで、SN比が6dBであり、AGC部23−3に入力される第3話者の音声レベルが−18dBovで、雑音レベルが−36dBovで、SN比が18dBである場合を考える。
AGC部23−1では、SN比=24dBが閾値=12dB以上であるため、音声レベル=−30dBovを目標音量レベル=−24dBovとするように、増幅率=6dB(増幅)が算出される。この結果、AGC部23−1の出力する第1話者の音声レベルは−24dBov、雑音レベルが−48dBov、SN比が24dBとなる。
AGC部23−2では、SN比=6dBが閾値=12dB未満であるため、雑音レベル=−48dBovを目標音量レベル−12dB=−36dBovとするように、増幅率=12dB(増幅)が算出される。この結果、AGC部23−2の出力する第2話者の音声レベルは−30dBov、雑音レベルが−36dBov、SN比が6dBとなる。
AGC部23−3では、SN比=18dBが閾値=12dB以上であるため、音声レベル=−18dBovを目標音量レベル=−24dBovとするように、増幅率=−6dB(減衰)が算出される。この結果、AGC部23−3の出力する第3話者の音声レベルは−24dBov、雑音レベルが−42dBov、SN比が18dBとなる。
このように、SN比が良い話者に対しては音声レベルが目標音量レベルとなるようにゲインを決定し、SN比が悪い話者に対しては雑音レベルが目標音量レベルから閾値を減算した値より大きくならないようにゲインを決定することで、第1話者と第3話者について一定以上のSN比を確保でき、SN比が悪い第2話者の影響によって他の話者の音声が聞き取りにくくなる問題を生じず、良好な通話が可能となる。
これに対し、従来のように入力音声を目標音量レベルに調節するだけの技術では、図9に示すように、目標音量レベルを−24dBovとして、第1〜第3話者から図8と同様の入力音声があった場合、第1,第3話者の増幅率は図8の例と変わらないものの、第2話者の増幅率は18dBとなって雑音レベルが−30dBovとなり、この結果、第1,第3話者の音声が聞き取りにくくなる。
<第2実施形態>
図10は、自動音量制御装置の第2実施形態の構成例を示す。同図中、図4と同一部分には同一符号を付す。
図10において、端子11からの入力音声信号をVAD(Voice Activity Detection:音声活動判定)部12に供給する。なお、音声信号は、例えばサンプリング周波数8KHzでサンプリングされ、160サンプル(20msecに相当)を1フレームとするデジタル音声信号である。
VAD部12は、例えば特許第3849116号に記載されたものであり、入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期等を用いて音声の特徴量を算出し、パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出し、上記2つの特徴量を基に音声か非音声(すなわち雑音)であるかを判定して、判定結果を音声信号と共に音声レベル更新部13及び雑音レベル更新部14に供給する。
音声レベル更新部13は、今回フレームnで音声部分と判定された場合、まず、今回フレームにおける音声レベルVを(1)式にて求める。
次に、音声レベルVと、前回フレームの平均音声レベルV_ave(n−1)とを、平滑化係数COF1を用いて平滑化を行い、今回フレームの平均音声レベルV_ave(n)を求める。なお、今回フレームが非音声部分と判定された場合は、平均音声レベルV_ave(n)は更新しない。この今回フレームの平均音声レベルV_ave(n)を増幅率決定部35に供給する。なお、平滑化係数COF1は例えば0.90〜0.99程度の値である。
V_ave(n)=V_ave(n−1)×COF1+V×(1.0−COF1)
…(2)
雑音レベル更新部14は、今回フレームnで非音声部分と判定された場合、まず、今回フレームにおける雑音レベルNを(3)式にて求める。
次に、雑音レベルNと、前回フレームの平均雑音レベルN_ave(n−1)とを、平滑化係数COF1を用いて平滑化を行い、今回フレームの平均雑音レベルN_ave(n)を求める。なお、今回フレームが音声部分と判定された場合は、平均雑音レベルN_ave(n)は更新しない。この今回フレームの平均雑音レベルN_ave(n)を増幅率決定部35に供給する。
N_ave(n)=N_ave(n−1)×COF1+N×(1.0−COF1)
…(4)
増幅率決定部35は、平均音声レベルV_ave(n)と、平均雑音レベルN_ave(n)と、予め決定されており上位装置から端子16を介して供給される目標音量レベルと、端子36を介して供給される他の自動音量制御装置から供給される他の話者のSN比から、今回フレームのゲインs_gainを決定してゲイン乗算部17に供給する。
ゲイン乗算部17は、端子11から供給される入力音声信号に増幅率決定部35からの増幅率を乗算して端子18から出力音声信号ouput(k)出力する。
output(k)=input(k)×s_gain
(ただし、k=1,2…M) …(5)
なお、増幅率決定部35は、フレーム境界で増幅率が急激に変化することを防ぐため、例えば以下のように増幅率をサンプル単位で滑らかに変動させる構成としても良い。ここで、nフレームのkサンプル目におけるゲインをgain(n,k)とし、nフレームのみで求めた瞬時ゲインをs_gainとし、平滑化係数をCOF2とする。なお、平滑化係数COF2は例えば0.90〜0.99程度の値である。
gain(n,k)=gain(n,k−1)×COF2
+s_gain×(1.0−COF2) …(6)
この場合、出力音声信号output(k)は以下のようになる。
output(k)=input(k)×gain(n,k)
(ただし、k=1,2…M) …(7)
<増幅率決定部の構成>
図11は、増幅率決定部35の一実施形態の構成例を示す。同図中、図5と同一部分には同一符号を付す。図11において、増幅率決定部35は、SN比算出部21とSN比比較部37と増幅率算出部38から構成されている。
SN比算出部21は、音声レベル更新部13からの今回フレームの平均音声レベルV_ave(n)と、雑音レベル更新部14からの今回フレームの平均雑音レベルN_ave(n)からSN比を算出してSN比比較部37に供給する。
SN比比較部37は、SN比算出部21で算出した自装置の話者のSN比を閾値及び他の話者のSN比と比較して、比較結果を自装置の話者のSN比と閾値と他の話者のSN比と共に増幅率算出部38に供給する。
増幅率算出部38は、音声レベル更新部13からの今回フレームの平均音声レベルV_ave(n)と、雑音レベル更新部14からの今回フレームの平均雑音レベルN_ave(n)と、SN比算出部21からのSN比と、上位装置からの目標音量レベルと、SN比比較部37からの比較結果と、自装置の話者のSN比と、閾値と、一又は複数の他の話者のSN比から今回フレームのゲインs_gainを算出する。
<増幅率算出部38の動作>
図12は、増幅率算出部38が実行する処理の一例のフローチャートを示す。同図中、ステップS11で、増幅率算出部38は、SN比算出部21から供給される比較結果から自装置の話者のSN比が一又は複数の他の話者のSN比の中で最も高いか否かを判別し、自装置の話者のSN比が最も高い場合には、ステップS12で今回フレームの平均音声レベルV_ave(n)が目標音量レベルとなるような今回フレームのゲインs_gainを算出する。
一方、自装置の話者のSN比より他の話者のSN比が高い場合には、ステップS13で今回フレームの平均雑音レベルN_ave(n)が目標音量レベルからSN比が最も高い他の話者のSN比を減算した値(目標音量レベル−SN比が最大の話者のSN比)となるような今回フレームのゲインs_gainを算出する。
<多地点音声通信システムの音声通信装置の構成>
図13は、多地点音声通信システムにおける音声通信装置の受話側部分の第2実施形態のブロック図を示す。同図中、図7と同一部分には同一符号を付す。
図13において、音声通信装置20の端子21−1〜21−nには複数の話者から受信した符号化音声信号が供給され、各符号化音声信号は音声復号部22−1〜22−nそれぞれで復号される。復号された各音声信号はAGC部43−1〜43−nそれぞれに供給される。
AGC部43−1〜43−nそれぞれは、図10及び図11に示す構成で図12(又は図15)に示す動作を行う自動音量制御装置であり、各音声信号の音量制御を行って出力音声信号をミキシング部24に供給すると共に、自装置の話者のSN比を求めて他の全ての自動音量制御装置に供給する。ミキシング部24は、AGC部43−1〜43−nそれぞれから供給される音声信号を混合して端子25から出力する。
<具体的な音量制御動作>
ここで、図13において、n=3とした場合の具体的な音量制御動作について説明する。AGC部43−1〜23−3それぞれに与える目標音量レベルを−24dBov(ov:overload,最大値と比較してどれだけ小さいかのdB表示)、SN比の閾値=12dBとする。
図14に示すように、AGC部43−1に入力される第1話者の音声レベルが−30dBovで、雑音レベルが−40dBovで、SN比が10dBであり、AGC部43−2に入力される第2話者の音声レベルが−42dBovで、雑音レベルが−48dBovで、SN比が6dBであり、AGC部43−3に入力される第3話者の音声レベルが−18dBovで、雑音レベルが−26dBovで、SN比が8dBである場合を考える。
この場合、AGC部43−1の出力する第1話者のSN比が最も高い。AGC部43−1では、SN比が最も高いため、音声レベル=−30dBovを目標音量レベル=−24dBovとするように、増幅率=6dB(増幅)が算出される。この結果、AGC部43−1の出力する第1話者の音声レベルは−24dBov、雑音レベルが−34dBov、SN比が10dBとなる。
AGC部43−2では、自装置の第2話者のSN比(6dB)より第1話者のSN比(10dB)が高いため、雑音レベル=−48dBovを目標音量レベル(−24dBov)−第1話者のSN比(10dB)=−34dBovとするように、増幅率=14dB(増幅)が算出される。この結果、AGC部43−2の出力する第2話者の音声レベルは−28dBov、雑音レベルが−34dBov、SN比が6dBとなる。
AGC部43−3では、自装置の第3話者のSN比(8dB)より第1話者のSN比(10dB)が高いため、雑音レベル=−26dBovを目標音量レベル(−24dBov)−第1話者のSN比(10dB)=−34dBovとするように、増幅率=−8dB(減衰)が算出される。この結果、AGC部43−3の出力する第3話者の音声レベルは−26dBov、雑音レベルが−34dBov、SN比が8dBとなる。
このように、SN比が良い話者に対しては音声レベルが目標音量レベルとなるようにゲインを決定し、SN比が悪い話者に対しては雑音レベルが目標音量レベルからSN比が最も高い話者のSN比を減算した値より大きくならないようにゲインを決定することで、SN比が最も高い話者のSN比を維持することができ、SN比が悪い話者の影響によって他の話者の音声が聞き取りにくくなる問題を生じず、良好な通話が可能となる。
<増幅率算出部38の他の動作>
図15は、増幅率算出部38が実行する処理の他の例のフローチャートを示す。同図中、ステップS21で、増幅率算出部38は、SN比算出部21から供給される比較結果からSN比が閾値以上か否かを判別する。ここで、閾値は例えば12dB程度の値として予め設定されている。
SN比が閾値以上であれば、ステップS22で今回フレームの平均音声レベルV_ave(n)が目標音量レベルとなるような今回フレームのゲインs_gainを算出する。
一方、SN比が閾値未満であれば、ステップS23で自装置の話者のSN比が一又は複数の他の話者のSN比の中で最も高いか否かを判別し、自装置の話者のSN比が最も高い場合にはステップS22で今回フレームの平均音声レベルV_ave(n)が目標音量レベルとなるような今回フレームのゲインs_gainを算出する。
ステップS23で自装置の話者のSN比より他の話者のSN比が高い場合にはステップS24でSN比が閾値以上の他の話者が存在するか否かを判別し、閾値以上の他の話者が存在する場合には、ステップS25で今回フレームの平均雑音レベルN_ave(n)が目標音量レベルから閾値を減算した値(目標音量レベル−閾値)となるような今回フレームのゲインs_gainを算出する。
ステップS24で閾値以上の他の話者が存在しない場合には、ステップS26で今回フレームの平均雑音レベルN_ave(n)が目標音量レベルからSN比が最も高い他の話者のSN比を減算した値(目標音量レベル−SN比が最大の話者のSN比)となるような今回フレームのゲインs_gainを算出する。
つまり、全ての話者のSN比が閾値未満のときはSN比が最も高い話者のSN比を閾値とみなして、全ての自動音量制御装置のSN比を最も高い話者のSN比に合わせるようにしている。
このように、SN比が良い話者に対しては音声レベルが目標音量レベルとなるようにゲインを決定し、SN比が悪い話者に対しては雑音レベルが目標音量レベルからSN比が最も高い話者のSN比を減算した値より大きくならないようにゲインを決定することで、SN比が良好な話者について一定以上のSN比を確保でき、SN比が悪い話者の影響によって他の話者の音声が聞き取りにくくなる問題を生じず、良好な通話が可能となる。
従来の自動音量制御装置の一例のブロック図である。 従来の音声通信装置の受話側部分の一例のブロック図である。 従来の音声通信装置の問題を説明するための図である。 自動音量制御装置の第1実施形態の構成例を示す図である。 増幅率決定部15の一実施形態の構成例を示す図である。 増幅率算出部22が実行する処理の一例のフローチャートである。 多地点音声通信システムにおける音声通信装置の受話側部分の第1実施形態のブロック図である。 第1実施形態の自動音量制御の様子を説明するための図である。 従来の自動音量制御の様子を説明するための図である。 自動音量制御装置の第2実施形態の構成例を示す図である。 増幅率決定部35の一実施形態の構成例を示す図である。 増幅率算出部38が実行する処理の一例のフローチャートである。 多地点音声通信システムにおける音声通信装置の受話側部分の第2実施形態のブロック図である。 第2実施形態の自動音量制御の様子を説明するための図である。 増幅率算出部38が実行する処理の他の例のフローチャートである。
符号の説明
12 VAD部
13 音声レベル更新部
14 雑音レベル更新部
15,35 増幅率決定部
17 ゲイン乗算部
21 SN比算出部
22,38 増幅率算出部
23−1〜23−n,43−1〜43−n AGC部
24 ミキシング部
37 SN比比較部
12 サービスエリア

Claims (7)

  1. 入力音声信号の音声部分と非音声部分を判定する音声判定手段と、
    前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、
    前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、
    前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、
    前記音声レベルと前記雑音レベルと前記SN比と予め設定されている目標音量レベルから前記入力音声信号の増幅率を算出する増幅率算出手段と、
    前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、
    を有し、
    前記増幅率算出手段は、前記SN比が閾値以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比が閾値未満のとき前記雑音レベルが前記目標音量レベルから前記閾値だけ低い値となるように増幅率を算出する、
    ことを特徴とする自動音量制御装置。
  2. 入力音声信号の音声部分と非音声部分を判定する音声判定手段と、
    前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、
    前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、
    前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、
    前記音声レベルと前記雑音レベルと前記SN比算出手段で算出したSN比と予め設定されている目標音量レベルと一又は複数の他の自動音量制御装置から供給されるSN比から前記入力音声信号の増幅率を算出する増幅率算出手段と、
    前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、
    を有し、
    前記増幅率算出手段は、前記SN比算出手段で算出したSN比が前記一又は複数の他の自動音量制御装置から供給されるSN比以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比算出手段で算出したSN比が前記一又は複数の他の自動音量制御装置から供給されるSN比未満のとき前記雑音レベルが前記目標音量レベルから最も高いSN比だけ低い値となるように増幅率を算出する、
    ことを特徴とする自動音量制御装置。
  3. 請求項記載の自動音量制御装置において、
    前記増幅率算出手段は、前記SN比算出手段で算出したSN比が閾値以上のとき又は前記一又は複数の他の自動音量制御装置から供給されるSN比以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比算出手段で算出したSN比が閾値以下かつ前記一又は複数の他の自動音量制御装置から供給されるSN比のいずれかが前記閾値以上のとき前記雑音レベルが前記目標音量レベルから前記閾値だけ低い値となるように増幅率を算出し、前記SN比算出手段で算出したSN比が閾値以下かつ前記一又は複数の他の自動音量制御装置から供給されるSN比が全て前記閾値未満のとき前記雑音レベルが前記目標音量レベルから前記一又は複数の他の自動音量制御装置から供給されるSN比のうち最も高いSN比だけ低い値となるように増幅率を算出する、
    ことを特徴とする自動音量制御装置。
  4. 請求項1乃至のいずれか1項記載の自動音量制御装置において、
    前記音声レベル算出手段は、今回の入力音声信号フレームで算出した音声レベルを前回までの入力音声信号フレームで得た音声レベルにより平滑化して出力する、
    ことを特徴とする自動音量制御装置。
  5. 請求項1乃至のいずれか1項記載の自動音量制御装置において、
    前記雑音レベル算出手段は、今回の入力音声信号フレームで算出した雑音レベルを前回までの入力音声信号フレームで得た雑音レベルにより平滑化して出力する、
    ことを特徴とする自動音量制御装置。
  6. 請求項1乃至のいずれか1項記載の自動音量制御装置において、
    前記増幅率算出手段は、今回の入力音声信号フレームで算出した増幅率を前回までの入力音声信号フレームで得た増幅率により平滑化して出力する、
    ことを特徴とする自動音量制御装置。
  7. 請求項1乃至のいずれか1項記載の自動音量制御装置を複数備え、
    前記複数の自動音量制御装置から出力される音声信号を混合するミキシング手段を、
    有することを特徴とする音声通信装置。
JP2008006823A 2008-01-16 2008-01-16 自動音量制御装置及びそれを用いた音声通信装置 Expired - Fee Related JP4850191B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008006823A JP4850191B2 (ja) 2008-01-16 2008-01-16 自動音量制御装置及びそれを用いた音声通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008006823A JP4850191B2 (ja) 2008-01-16 2008-01-16 自動音量制御装置及びそれを用いた音声通信装置

Publications (2)

Publication Number Publication Date
JP2009171208A JP2009171208A (ja) 2009-07-30
JP4850191B2 true JP4850191B2 (ja) 2012-01-11

Family

ID=40971904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008006823A Expired - Fee Related JP4850191B2 (ja) 2008-01-16 2008-01-16 自動音量制御装置及びそれを用いた音声通信装置

Country Status (1)

Country Link
JP (1) JP4850191B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5477854B2 (ja) * 2010-01-22 2014-04-23 株式会社タムラ製作所 ゲイン自動設定装置およびゲイン自動設定方法
WO2012074503A1 (en) * 2010-11-29 2012-06-07 Nuance Communications, Inc. Dynamic microphone signal mixer
WO2012109385A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
JP6135106B2 (ja) * 2012-11-29 2017-05-31 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
EP3053356B8 (en) 2013-10-30 2020-06-17 Cerence Operating Company Methods and apparatus for selective microphone signal combining
US9484043B1 (en) * 2014-03-05 2016-11-01 QoSound, Inc. Noise suppressor
JP6451079B2 (ja) * 2014-05-14 2019-01-16 沖電気工業株式会社 音声強調装置及びプログラム、並びに、音声復号装置及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03145811A (ja) * 1989-10-31 1991-06-21 Toshiba Corp 音声出力レベル制御装置
JP2547649B2 (ja) * 1990-04-03 1996-10-23 岩崎通信機株式会社 電話会議装置
JP3441112B2 (ja) * 1993-06-22 2003-08-25 三菱電機株式会社 多地点間通信制御装置
AUPM900594A0 (en) * 1994-10-24 1994-11-17 Cochlear Pty. Limited Automatic sensitivity control
JP2003060459A (ja) * 2001-08-21 2003-02-28 Oki Electric Ind Co Ltd 自動利得制御増幅器
JP2003218652A (ja) * 2002-01-23 2003-07-31 Oki Electric Ind Co Ltd 自動利得制御増幅器

Also Published As

Publication number Publication date
JP2009171208A (ja) 2009-07-30

Similar Documents

Publication Publication Date Title
US7630887B2 (en) Enhancing the intelligibility of received speech in a noisy environment
KR101184402B1 (ko) 복수의 마이크로폰들로부터의 신호들 중에서 지능적으로 선택함으로써 사운드 품질을 개선하는 방법 및 장치
KR101311028B1 (ko) 주변 잡음 검출을 이용한 요해도 제어
CN101669284B (zh) 移动音频装置的自动音量及动态围调整的方法和设备
JP4850191B2 (ja) 自動音量制御装置及びそれを用いた音声通信装置
JP4580409B2 (ja) 音量制御装置および方法
US6785381B2 (en) Telephone having improved hands free operation audio quality and method of operation thereof
US8718562B2 (en) Processing audio signals
EP1969721B1 (en) Telecommunications terminal and method of operation of the terminal
EP2663979B1 (en) Processing audio signals
JP2008148179A (ja) 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法
JP5853540B2 (ja) 音声通信装置及びプログラム
JPH05235789A (ja) 音声通信端末装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111018

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees