JP6105929B2 - 音声処理装置及びその制御方法 - Google Patents

音声処理装置及びその制御方法 Download PDF

Info

Publication number
JP6105929B2
JP6105929B2 JP2012286160A JP2012286160A JP6105929B2 JP 6105929 B2 JP6105929 B2 JP 6105929B2 JP 2012286160 A JP2012286160 A JP 2012286160A JP 2012286160 A JP2012286160 A JP 2012286160A JP 6105929 B2 JP6105929 B2 JP 6105929B2
Authority
JP
Japan
Prior art keywords
gain
level
amplitude level
amplitude
control means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012286160A
Other languages
English (en)
Other versions
JP2014126854A (ja
JP2014126854A5 (ja
Inventor
池田 信吾
信吾 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012286160A priority Critical patent/JP6105929B2/ja
Priority to US14/139,058 priority patent/US9319015B2/en
Priority to CN201310741393.7A priority patent/CN103905008B/zh
Publication of JP2014126854A publication Critical patent/JP2014126854A/ja
Publication of JP2014126854A5 publication Critical patent/JP2014126854A5/ja
Application granted granted Critical
Publication of JP6105929B2 publication Critical patent/JP6105929B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • H03G3/301Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers the gain being continuously variable
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

本発明は、音声処理装置及びその制御方法に関する。
従来、入力した音声の大きさを適正なレベルに制御する自動レベル制御(ALC)機能を有する音声処理装置が知られている(例えば特許文献1参照。)。ALCは概略、入力音が過大であればレベルを抑圧し(リミット動作)、過小であればレベルを増幅させる(リカバリ動作)、という制御を行う。ここで、突発的な音、すなわち急激に立ち上がり、直後に急激に立ち下がるような音が入力された場合の対処が問題となる。このような音は一般に「アタック音」と呼ばれている。具体的には、アタック音の立ち上がり部が入力されると、リミット動作によりレベルが抑制される。その後、アタック音の立ち下がり部が入力されると、リカバリ動作によりレベルが増大されることになる。しかしアタック音の立ち下がりは急激であるためリカバリの反応が遅く、その立ち下がり部直後の音声のレベルが小さくて聞き取りにくくなるという問題がある。
そこで、アタック音検出時のリカバリ動作においては通常よりレベルの増幅率を上げることでリカバリの反応を速めることが考えられる。
特開2008−129107号公報
しかし、アタック音が短い周期で連続して入力された場合、1つアタック音でのリカバリ動作において通常よりレベルの増幅率を上げると、それ以降のアタック音の立ち上がり部で音声がクリップして歪んでしまうという問題がある。
本発明は、かかる問題を解決するためになされたものである。すなわち本発明は、アタック音が短い周期で連続して入力された場合でも歪みが生じない良好な自動レベル制御を実現する。
本発明の一側面によれば、力された音声信号の振幅レベルを、ゲインを用いて調整する第1のレベル制御手段であって、前記第1のレベル制御手段からの音声信号の振幅レベルが所定範囲の上限値を超えた場合はゲインを低下させるリミット動作を行い、前記第1のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の下限値より小さい場合はゲインを増加させるリカバリ動作を行う、第1のレベル制御手段と、前記第1のレベル制御手段からの音声信号の振幅レベルを、ゲインを用いて調整する第2のレベル制御手段であって、前記第2のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の上限値を超えた場合はゲインを低下させるリミット動作を行い、前記第2のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の下限値より小さい場合はゲインを増加させるリカバリ動作を行う、第2のレベル制御手段とを有し、前記第1のレベル制御手段でのリカバリ動作時のゲインの増加の時定数を、前記第2のレベル制御手段でのリカバリ動作時のゲインの増加の時定数より大きくすることを特徴とする音声処理装置が提供される。
本発明によれば、アタック音が短い周期で連続して入力された場合でも歪みが生じない良好な自動レベル制御を実現することができる。
第1実施形態に係る音声処理装置のALC部の構成を示す図。 第1実施形態に係るALC部の動作を示すフローチャート。 ゼロクロス検出部の動作を示すフローチャート。 振幅レベル判定部の動作を示すフローチャート。 第1実施形態に係る第1及び第2振幅調整部の動作を示すフローチャート。 第1実施形態に係る第1振幅ゲイン決定部の動作を示すフローチャート。 第1実施形態において、複数のアタック音が連続的に入力された場合のALC動作を示す図。 第2実施形態に係る音声処理装置のALC部の構成を示す図。 第2実施形態に係るALC部の動作を示すフローチャート。 第3実施形態における音声処理装置のALC部の構成を示す図。 第3実施形態に係るALC部の動作を示すフローチャート。 第3実施形態に係る振幅ゲイン調整部の動作を示すフローチャート。 第3実施形態に係る第2振幅ゲイン決定部の動作を示すフローチャート。 音声処理装置の自動レベル制御部の構成例を示す図。 図14のALC部の動作を示すフローチャート。 アタック音判定部の動作を示すフローチャート。 振幅ゲイン決定部の動作を示すフローチャート。 (a)はアタック音の時のALC動作、(b)はアタック音ではないときのALC動作を示す図。 複数のアタック音が連続的に入力された場合のALC動作を示す図。
以下、添付の図面を参照して、本発明の実施形態を詳しく説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
以下の実施形態では音声処理装置について説明を行うが、音声を処理することができる装置であればどのような装置であってもよい。音声処理装置は例えば、撮像装置、携帯電話、スマートフォン、パーソナルコンピュータ、ICレコーダ、カーナビゲーションシステム、音声認識機能を備えた車などでありうる。これらの音声処理装置には、例えばマイクロホンなどの集音部により集音された音声信号を制御するブロックが含まれる。
<アタック音検出時のリカバリ動作の説明>
本発明は、入力された音声信号の振幅レベルが所定範囲内に収まるように振幅レベルを調整する自動レベル制御(ALC)の機能を有する音声処理装置に関する。本発明の実施形態を詳しく説明する前に、音声処理装置の自動レベル制御における、アタック音検出時のリカバリ動作について説明しておく。
図14に音声処理装置のALC部の構成の一例を示す。図14において、音声入力部1501は、マイクロホンまたは音声再生装置等の音声取込部からの音声信号を入力する。音声入力部1501には、DC成分を除去された音声信号が入力される。従って0を中心に正負の値の音声信号が入力される。なお、本明細書において「音声信号」とは、人の声に限らず様々な音を含むものとする。振幅調整部1502は、入力した音声信号をゲイン1507ゲインによって振幅を調整し音声出力部1503へ出力する。振幅レベル判定部1509は、音声出力部1503の音声信号の振幅レベルを判定する。ゼロクロス検出部1504は、音声入力部1501の音声信号の値のゼロクロスを検出する。アタック音判定部1510は、振幅レベル判定部1509から出力される振幅レベル1508が急に大きくなってから小さくなるまでの期間を測定し、それがアタック音かどうかを判定する。振幅ゲイン決定部1506は、ゼロクロス検出結果1505、振幅レベル1508、アタック音判定結果1511により、振幅レベル1508が下限値TH_MIN〜上限値TH_MAXの間になるように制御を行う。この制御により振幅ゲイン決定部1506は、振幅調整部1502のゲインを決定して、ゲイン1507を出力する。
以下、図14のALC部の動作について説明する。ここでは音声をサンプリング周波数Fsでデジタル信号に変換した場合について説明するが、アナログ信号であっても同様である。図15は、図14のALC部の動作を示すフローチャートである。まず、現在時刻がサンプリングタイミングであるか否かを判定し(S1601)、サンプリングタイミングである場合には、音声入力部1501からの音声信号の入力及び音声出力部1503への音声信号の出力を行う(S1602)。次に振幅レベル判定部1509で音声信号の振幅レベル判定を行い(S1603)、ゼロクロス検出部1504で音声信号のゼロクロス検出を行う(S1604)。次にアタック音判定部1510でアタック音の判定を行い(S1605)、振幅ゲイン決定部1506で振幅ゲインを決定(S1606)する。その後、振幅調整部1502で、振幅ゲイン決定部1506の出力であるゲイン1507を用いて音声信号の振幅調整を行い(S1607)、次のサンプルタイミングが来るまで待機する。
図3は、ゼロクロス検出部1504の動作を示すフローチャートである。まず、音声入力部1501を介して入力された音声信号のサンプル値をDINとする(S301)。DINが、前回のサンプリングタイミングの入力であるDIN_Dと符号が異なる場合、すなわち、DIN>0かつDIN_D<0である場合(S302YES)、ゼロクロス検出結果として、ゼロクロス検出を示す値1を出力する(S305)。また、DIN<0かつDIN_D>0である場合(S303YES)も、ゼロクロス検出を示す値1を出力する(S305)。DINが0である場合も、同様に、ゼロクロス検出結果としてゼロクロス検出を示す値1を出力する(S305)。それ以外の場合はゼロクロス検出結果としてゼロクロス非検出を示す値0を出力する(S305)。こうして得られたゼロクロス検出結果1505は、振幅ゲイン決定部1506に伝達される。そして次の処理のために現在のDINをDIN_Dに代入して(S307)、処理を終了する。
図4は、振幅レベル判定部1509の動作を示すフローチャートである。まず、振幅調整部1502から音声出力部1503へと出力される音声サンプルの絶対値をDINとする(S401)。DINが前回の判定結果である振幅レベルDLEVEL以上かどうかを判定する(S402)。DINがDLEVEL以上の場合、DLEVELにDINを代入する(S404)。S402でDINがDLEVEL以上でなければ、DINが前回の判定結果である振幅レベルDLEVELからK1を減じた値以下かどうかを判定する(S403)。その判定がNOであれば、DLEVELにDINを代入する(S404)。その判定がYESであれば、DLEVELからK1を減じた値をDLEVELに代入する(S405)。このときDLEVELがDINより小さくならないように制限する。そして、こうして得たDLEVELを今回の振幅レベル1508として出力する(S406)。以上のようにすることで、音声信号のエンベロープ値が得られるためこれを振幅レベルとする。S401では入力した音声サンプルはそのまま処理してもよいが絶対値をとった方が、正負が非対称の場合でも大きいレベルを反映できるため、ALCの性能が向上する。
図16は、アタック音判定部1510の動作を示すフローチャートである。振幅調整部1502で振幅を調整する場合に、大きい音声から小さい音声になった場合のゲインの変化量を大きい音声の期間に応じて変えるために、短く大きい音声(アタック音)を判定する。まず、振幅レベル判定部1509で判定された振幅レベル1508をDLEVELとする(S1701)。DLEVELがしきい値TH_MAXより大きい場合(S1702YES)、ATT_CNTに固定値K2を加算する(S1703)。DLEVELがTH_MAXと等しいか小さい場合は(S1702NO)、ATT_CNTが0になるまで(S1704でYESとなるまで)、ATT_CNTから固定値K3を差し引く(S1705)。突然音声が大きくなった場合に、ALCが振幅レベルをTH_MAX以下にするまでATT_CNTがK2ずつ増加し続ける(S1703)。その後振幅レベルがTH_MAX以下であればATT_CNTがK3ずつ減少する(S1705)。したがって、ATT_CNTが0か否かを判定し(S1706)、ここでATT_CNTが0であればアタック音非検出を表す0を出力し(S1707)、ATT_CNTが0でなければアタック音検出を表す1を出力する(S1708)。
図17は、振幅ゲイン決定部1506の動作を示すフローチャートである。振幅ゲイン決定部1506では振幅レベル1508がTH_MIN〜TH_MAX(ただしTH_MIN<TH_MAX)の間になるように制御を行う。振幅レベル1508がTH_MINより小さい場合にゲイン1507を増加させる動作の場合をリカバリ動作、振幅レベル1508がTH_MAXより大きい場合にゲイン1507を低下させる動作の場合をリミット動作と呼ぶ。図17のフローチャートにおいて、変数GAINは出力されるゲイン1507を表す。また、S_CNTはサンプル周波数タイミングのカウンタを表す変数である。M_LIMITモードまたはM_RECOVモードの開始時はゼロであり、サンプル周波数タイミング毎にカウントアップする。
振幅ゲイン決定部1506はまず、ゼロクロス検出結果1505、振幅レベル1508、アタック音判定結果1511をそれぞれ、変数Z_DET、DLEVEL、ATT_DETに入力する(S1801)。その後、モード(MODE)の判定を行いその判定に応じた処理を行う。MODEは、M_IDLE、M_LIMIT、M_RECOVの3つのモードをもつ。リカバリ動作の時はMODE=M_RECOV、リミット動作の時はMODE=M_LIMITとなる。また、振幅レベルがTH_MIN〜TH_MAXの範囲内の場合はMODE=M_IDLEとして、ゲインを保つ。M_LIMIT、M_RECOVは、1サンプル〜複数サンプル期間をかけて処理を行う。
MODE=M_IDLEの場合において、現在の音声の振幅レベルDLEVEL>TH_MAXの場合は(S1803YES)、MODE=M_LIMITに変更し(S1804)、再度、S1802に戻る。一方、DLEVEL<TH_MINの場合は(S1805YES)、MODE=M_RECOVに変更し、再度S1802に戻る。DLEVELがTH_MIN〜TH_MAXの範囲にある場合は(S1803NOかつS1805NO)、GAINの値をそのままゲイン1507として出力して(S1807)、処理を終了する。
MODE=M_RECOVの場合、リカバリ動作を行うが、DLEVELがTH_MAXを超えた場合は(S1808YES)、MODEをM_LIMITに変更してリミット動作を行う(S1809)。これは、リカバリ動作が終了するまでリミット動作をいっさい行わないとすると音声信号が大きくなりすぎて歪む可能性があるからである。また、MODEをM_RECOVからM_LIMITに変更した場合はS_CNTを0にリセットする(S1809)。
MODE=M_LIMITの場合、C_MIN、C_MAX、ADD_GAINをそれぞれ、L_C_MAIN、L_C_MAX、L_ADD_GAINに設定する(S1810)。
MODE=M_RECOVの場合で、DLEVELがTH_MAXを超えなければ(S1808NO)、アタック音の検出結果を判定する(S1811)。ここでアタック音未検出(ATT_DET=0)の場合は(S1811NO)、C_MIN、C_MAX、ADD_GAINをそれぞれ、R_C_MAIN、R_C_MAX、R_ADD_GAINに設定する(S1812)。一方、アタック音検出(ATT_DET=1)の場合は(S1811YES)、C_MIN、C_MAX、ADD_GAINをそれぞれ、ATT_C_MAIN、ATT_C_MAX、ATT_ADD_GAINに設定する(S1813)。アタック音検出時のリカバリ動作を「ファーストリカバリ動作」と呼ぶ。C_MINはゲインを変更する最小のサンプル期間を設定するパラメータであり、通常C_MIN<C_MAXの条件で設定するが、ゼロクロス検出結果を使用しない場合、C_MINはどのような値でもかまわない。
S_CNT>C_MAXのときは(S1814YES)は、GAINの値を、現在のGAINの値にADD_GAINを加算した値に更新する(S1815)。S_CNT>C_MINかつZ_DET=1(ゼロクロス検出)のとき(S1816YES)も、同様に、GAINの値を、現在のGAINの値にADD_GAINを加算した値に更新する(S1815)。その後、S_CNTを0にリセットするとともに、MODEをM_IDLEにして(S1817)、GAINを出力して(S1807)、処理を終了する。それ以外のときはS_CNTを1インクリメントして(S1818)、MODEを維持したまま、GAINを出力して(S1807)、処理を終了する。
以上の処理において、C_MINは、GAIN変更の時定数に相当する。C_MINが大きくなるとDLEVELがTH_MIN〜TH_MAXの範囲に収まるまでの時間がかかるようになる。これは、GAIN変更の時定数が大きくなることに相当する。C_MAXは低周波数の音声の場合に、GAIN変更の時定数が大きくなりすぎないようにするリミッタの働きをしている。GAINの変更はGAINにADD_GAINを加算することで行われる(S1815)。従ってM_LIMIT(リミット動作)時、ADD_GAINはマイナス値、M_RECOV(リカバリ動作)時、ADD_GAINはプラス値となる。
ゲインの変化分はできるだけ小さくした方が音質に与える影響が少ない。そこで、ここでは以下のようにする。
R_ADD_GAIN = −L_ADD_GAIN1 = ATT_ADD_GAIN2
なお、R_ADD_GAINは正の値である。リミット動作時は音声信号のレベルが大きくなって歪むので、できるだけ速くゲインを減らした方がよい。一方、リカバリ動作時はレベルの変動が目立たないようにできるだけゲインをゆっくり増加させた方がよい。そこで、
R_C_MIN > L_C_MIN
とする。さらに、アタック音の場合は、リカバリ動作の時定数を小さくして、アタック音直後の音声レベルをできるだけ早く適正レベルにすることが望まれる。そこで、
R_C_MIN > ATT_C_MIN
とする。
図18において、(a)はアタック音の時のALC動作、(b)はアタック音ではないときのALC動作を示す図である。「入力音エンベロープ」は、音声入力部1501に入力された音声信号のエンベロープ波形であり、(a)は、急に振幅レベルが大きくなりすぐに振幅レベルが小さくなるアタック音を示す。これに対し、(b)は、急に振幅レベルが大きくなるがしばらくしてから振幅レベルが小さくなる、アタック音ではない音声を示す。「出力音エンベロープ」は、音声出力部1503の音声信号のエンベロープ波形であり、ALC実行後の出力である。「ゲイン」は、振幅ゲイン決定部1506で決定されたゲイン1507の変化を示す。「ATT_CNT」は、アタック音判定部1510により図16のフローに従い算出されたATT_CNTの変化を示している。前述したように、アタック音検出時のリカバリ動作を「ファーストリカバリ動作」という。ATT_CNT>0の時にアタック音検出とされるので(S1708)、図18(a)において、T3a〜T4aの期間にファーストリカバリ動作が行われ、T4a〜T5aの期間に通常のリカバリ動作が行われる。(b)においては、T3b〜T4bの期間中はATT_CNT=0であるため、通常のリカバリ動作が行われ、ファーストリカバリ動作は行われない。
図19は、複数のアタック音が連続的に入力された場合のALC動作を示す図である。図19に示したファーストリカバリ期間ではファーストリカバリ動作が実行されるため、入力が小さくなった場合のゲイン変化の時定数が小さく復帰が早い。このため次のアタック音が来るまでにリカバリ動作が終了しているので、アタック音が連続した場合、複数のアタック音の応答は図示の如く、同じになる。
しかし、アタック音が短い周期で連続して入力された場合、1つアタック音でのリカバリ動作において通常よりレベルの増幅率を上げると、それ以降のアタック音の立ち上がり部で音声がクリップして歪んでしまうという問題がある。
そこで以下では、このような問題を解決するための実施形態を説明する。
<第1実施形態>
図1は、本実施形態に係る音声処理装置のALC部の構成を示す図である。図1において、音声入力部101は、マイクロホンまたは音声再生装置等からの音声信号を入力する。音声入力部101には、DC成分を除去された音声信号が入力される。従って0を中心に正負の値の音声信号が入力される。本実施形態におけるALC部は、図示の如く、第1のALC機能部11と、その後段に設けられた第2のALC機能部12とを含む。音声出力部105からは、振幅レベルがTH_MIN〜TH_MAX(ただしTH_MIN<TH_MAX)の間になるように調整された音声信号が出力される。
第1のレベル制御手段としての第1のALC機能部11は、第1振幅調整部102、第1振幅ゲイン決定部108、第1振幅レベル判定部110を有する。第2のレベル制御手段としての第2のALC機能部12は、第2振幅調整部104、第2振幅ゲイン決定部112、第2振幅レベル判定部114を有する。本実施形態におけるALC部は更に、ゼロクロス検出部106も備える。なお、ゼロクロス検出部106を設けることは音質向上のために有利であるが、必須ではない。
まず、第1のALC機能部11について説明する。第1振幅調整部102は、音声入力部101からの音声信号を第1振幅ゲイン決定部108で決定されたゲイン111に応じて増幅又は減衰させる。第1振幅レベル判定部110は、第1振幅調整部102の出力信号103の振幅レベルを判定する。第1振幅ゲイン決定部108は、第1振幅レベル判定部110で判定された振幅レベル109とゼロクロス検出部106からのゼロクロス検出結果107に応じて、第1振幅調整部102に提供するゲイン111を決定する。
第1振幅ゲイン決定部108がゲイン111を変更する場合、音声入力部101からの音声信号の振幅レベルの絶対値が大きいタイミングで変更すると、音声波形に段差ができてしまい、音質が劣化する。そこで本実施形態では、ゼロクロス検出部106で、音声入力部101からの音声信号の振幅レベルが0レベルと交差する点(以下「ゼロクロス」という。)を検出し、第1振幅ゲイン決定部108はそのタイミングでゲイン111を変更する。これにより音質の劣化を少なくすることができる。これは、ゼロクロスのタイミングでは音声信号の振幅レベルの絶対値が小さくなる傾向があることを利用している。ゼロクロス検出結果107は、第1振幅ゲイン決定部108に提供される。第1振幅ゲイン決定部108はそのゼロクロス検出結果107に基づいてゲイン111を変更する。また、第1振幅ゲイン決定部108は、第1振幅レベル判定部110から受信した振幅レベル109がTH_MIN〜TH_MAX(ただしTH_MIN<TH_MAX)の間になるようにゲイン111を制御する。
次に、第2のALC機能部12について説明する。第2振幅調整部104は、第1振幅調整部102の出力信号103を第2振幅ゲイン決定部112で決定されたゲイン115に応じて増幅又は減衰させる。第2振幅レベル判定部114は、第2振幅調整部104の出力信号の振幅レベルを判定する。第2振幅ゲイン決定部112は、第2振幅レベル判定部114で判定された振幅レベル113とゼロクロス検出結果107とに基づいて、第2振幅調整部104に提供するゲイン115を決定する。
第1のALC機能部11と同様に、第2振幅ゲイン決定部112は例えば、ゼロクロス検出部106で検出されたゼロクロスのタイミングでゲイン115を変更する。第1振幅調整部102の出力信号103は、音声入力部101に入力された音声信号の振幅が調整されただけであり、出力信号103のゼロクロスのタイミングと音声入力部101に入力された音声信号のゼロクロスのタイミングは同一である。そこで、第1のALC機能部11で使用したゼロクロス検出結果107を活用している。すなわち、ゼロクロス検出結果107は、第2振幅ゲイン決定部112にも伝達される。第2振幅ゲイン決定部112はそのゼロクロス検出結果107に基づいてゲイン115を変更する。また、第2振幅ゲイン決定部112は、第2振幅レベル判定部114から受信した振幅レベル113がTH_MIN〜TH_MAX(ただしTH_MIN<TH_MAX)の間になるようにゲイン115を制御する。
以下、各部の動作をフローチャート用いて説明する。本実施形態におけるALC部の処理は、デジタル信号処理、アナログ信号処理どちらでも実現可能であるが、ここでは、アナログ音声信号をサンプリング周波数Fsでデジタル信号に変換した場合について説明する。従って、音声入力部101に入力されるのはデジタル化された音声信号であり、音声出力部105からはデジタル音声信号が出力される。
図2は、図1のALC部の動作を示すフローチャートである。まず、現在時刻がサンプリングタイミングであるか否かを判定し(S201)、サンプリングタイミングである場合には、音声入力部101からの音声信号の入力、及び音声出力部105への音声信号の出力を行う(S202)。次に、第1振幅レベル判定部110及び第2振幅レベル判定部114で振幅レベルの判定を行い(S203)、ゼロクロス検出部106でゼロクロス検出を行う(S204)。次に、第1振幅ゲイン決定部108及び第2振幅ゲイン決定部112で振幅ゲインを決定する(S205)。その後、第1振幅調整部102で、決定されたゲイン111を用いて振幅調整を行うとともに、第2振幅調整部104で、決定されたゲイン115を用いて振幅調整を行い(S206)、次のサンプルタイミングが来るまで待機する。
ゼロクロス検出部106の動作は、ゼロクロス検出部1504の動作と同様であり、図3のフローチャートに従い動作する。また、第1及び第2振幅レベル判定部110、114の動作は、振幅レベル判定部1509の動作と同様であり、図4のフローチャートに従い動作する。
図5は、第1及び第2振幅調整部102、104の動作を示すフローチャートである。ここでは第1振幅調整部102の動作を説明する。第2振幅調整部104の動作も同様である。まず、入力した音声信号のサンプル値を変数DINとし、ゲイン111を変数GAINに入力する(S501)。次に、DIN*GAINを演算し、その結果を出力する(S502)。GAINがLOGスケールのデシベルである場合は、比率(10^(GAIN/20))に変換する。変換方法はテーブルとシフト演算の組み合わせなど様々な方法があるがどのような方法でもよい。
図6は、第1振幅ゲイン決定部108の動作を示すフローチャートである。第1振幅ゲイン決定部108では振幅レベル109がTH_MIN〜TH_MAX(ただしTH_MIN<TH_MAX)の間になるように制御を行う。上述のように、振幅レベル109がTH_MINより小さい場合にゲイン111を増加させる動作の場合をリカバリ動作、振幅レベル109がTH_MAXより大きい場合にゲイン111を低下させる動作の場合をリミット動作と呼ぶ。図6のフローチャートの中において、変数GAINは出力されるゲイン111を表す。また、S_CNTはサンプル周波数タイミングのカウンタを表す変数である。M_LIMITモードまたはM_RECOVモードの開始時はゼロであり、サンプル周波数タイミング毎にカウントアップする。
第1振幅ゲイン決定部108はまず、ゼロクロス検出結果107及び振幅レベル109をそれぞれ、変数Z_DET、DLEVELに入力する(S601)。その後、モード(MODE)の判定を行いその判定に応じた処理を行う。MODEは、M_IDLE、M_LIMIT、M_RECOVの3つのモードをもつ。リカバリ動作の時はMODE=M_RECOV、リミット動作の時はMODE=M_LIMITとなる。また、振幅レベルがTH_MIN〜TH_MAXの範囲内の場合はMODE=M_IDLEとして、ゲインを保つ。M_LIMIT、M_RECOVは、1サンプル〜複数サンプル期間をかけて処理を行う。
MODE=M_IDLEの場合において、現在の音声の振幅レベルDLEVEL>TH_MAXの場合は(S603YES)、MODE=M_LIMITに変更し(S604)、再度、S602に戻る。一方、DLEVEL<TH_MINの場合は(S605YES)、MODE=M_RECOVに変更し、再度、S602に戻る。DLEVELがTH_MIN〜TH_MAXの範囲にある場合は(S603NOかつS605NO)、GAINの値をそのままゲイン111として出力して(S607)、処理を終了する。
MODE=M_RECOVの場合はリカバリ動作を行うが、DLEVELがTH_MAXを超えた場合は(S608YES)、MODEをM_LIMITに変更してリミット動作を行う(S609)。これは、リカバリ動作が終了するまでリミット動作をいっさい行わないとすると音声信号が大きくなりすぎて歪む可能性があるからである。また、MODEをM_RECOVからM_LIMITに変更した場合はS_CNTを0にリセットする(S609)。
MODE=M_LIMITの場合、C_MIN、C_MAX、ADD_GAINをそれぞれ、L_C_MAIN、L_C_MAX、L_ADD_GAINに設定する(S610)。
MODE=M_RECOVの場合で、DLEVELがTH_MAXを超えなければ(S608NO)、C_MIN、C_MAX、ADD_GAINをそれぞれ、R_C_MAIN、R_C_MAX、R_ADD_GAINに設定する(S613)。
C_MINはゲインを変更する最小のサンプル期間を設定するパラメータであり、通常C_MIN<C_MAXの条件で設定するが、ゼロクロス検出結果を使用しない場合、C_MINはどのような値でもかまわない。
S_CNT>C_MAXのときは(S614YES)は、GAINの値を、現在のGAINの値にADD_GAINを加算した値に更新する(S615)。S_CNT>C_MINかつZ_DET=1(ゼロクロス検出)のとき(S616YES)も、同様に、GAINの値を、現在のGAINの値にADD_GAINを加算した値に更新する(S615)。その後、S_CNTを0にリセットするとともに、MODEをM_IDLEにして(S617)、処理を終了する。それ以外のときはS_CNTを1インクリメントして(S618)、MODEを維持したまま、GAINを出力して(S607)、処理を終了する。
以上の処理において、C_MINは、GAIN変更の時定数に相当する。C_MINが大きくなるとDLEVELがTH_MIN〜TH_MAXの範囲に収まるまでの時間がかかるようになる。これは、GAIN変更の時定数が大きくなることに相当する。C_MAXは低周波数の音声の場合に、GAIN変更の時定数が大きくなりすぎないようにするリミッタの働きをしている。GAINの変更はGAINにADD_GAINを加算することで行われる(S615)。従ってM_LIMIT(リミット動作)時、ADD_GAINはマイナス値、M_RECOV(リカバリ動作)時、ADD_GAINはプラス値となる。
以上が、第1振幅ゲイン決定部108の動作フローである。第2振幅ゲイン決定部112の動作フローも第1振幅ゲイン決定部108と同様である。
ただし、R_C_MIN、R_C_MAX、R_ADD_GAIN、L_C_MIN、L_C_MAX、L_ADD_GAINは、第1のALC機能部11と第2のALC機能部12との間で異なる値に設定する。ここで、第1のALC機能部11側の値を、R_C_MIN1、R_C_MAX1、R_ADD_GAIN1、L_C_MIN1、L_C_MAX1、L_ADD_GAIN1とする。一方、第2のALC機能部12側の値を、R_C_MIN2、R_C_MAX2、R_ADD_GAIN2、L_C_MIN2、L_C_MAX2、L_ADD_GAIN2とする。この場合に、例えば以下のような設定とすることで、アタック音が連続した場合でも良好なALC動作を実現できる。
ゲインの変化分はできるだけ小さくした方が音質に与える影響が少ないため、本実施形態では、
R_ADD_GAIN1 = −L_ADD_GAIN1 = R_ADD_GAIN2 = −L_ADD_GAIN2
とする。なお、R_ADD_GAIN1は正の値である。
リミット動作時は、音声信号のレベルが大きくなって歪むので、できるだけ速くゲインを減らした方がよい。一方、リカバリ動作時はレベルの変動が目立たないようにできるだけゲインをゆっくり増加させた方がよいそこで、
R_C_MIN1 > L_C_MIN1、
R_C_MIN2 > L_C_MIN2
とする。
また、第1のALC機能部11のリカバリ動作時のゲイン増加の時定数を、第2のALC機能部12のゲイン増加の時定数より大きくすることで、アタック音が連続した場合に良好な特性を得ることができる。従って以下のような関係を設定する。
R_C_MIN1 > R_C_MIN2
リミット動作時におけるゲイン変化については、設定値によって動作が変わるが、概ね以下の関係にあれば問題はない。(L_C_MIN1 < L_C_MIN2でもかまわない。)
L_C_MIN1 ≧ L_C_MIN2
ゼロクロス検出を行わない場合は、
R_C_MIN1=R_C_MAX1、
L_C_MIN1=L_C_MAX1、
R_C_MIN2=R_C_MAX2、
L_C_MIN2=L_C_MAX2
とする。これにより、Z_DETに関係なく動作する。
本実施形態において、
L_C_MIN1 > L_C_MIN2
とした場合に、複数のアタック音が連続的に入力された場合の動作を図7に示す。図7において、「入力音エンベロープ」は、音声入力部101に入力された音声信号のエンベロープ波形であり、複数のアタック音が連続して入力されている。「出力音エンベロープ」は、音声出力部105に出力される音声信号のエンベロープ波形であり、本実施形態のALC実行後の音声信号のエンベロープ波形である。「ゲイン1」は、第1振幅ゲイン決定部108で決定されたゲイン111の変化を示し、「ゲイン2」は、第2振幅ゲイン決定部112で決定されたゲイン115の変化を示している。「合計ゲイン」は、ゲイン1とゲイン2との合計値であり、ALC部全体のゲインに相当する。
R_C_MIN1>R_C_MIN2であるため、アタック音が連続した場合にゲイン1が減少していき、応答の速い第2のALC機能部12側のゲイン2の値は、入力音エンベロープの振幅が急に大きくなる部分で変更される割合が減っていく。このため、アタック音が連続した場合に、アタック音の突入部分での出力音声の歪みを抑制することができる。なお、アタック音が1回だけであった場合は、第2のALC機能部12側の速い時定数によってリカバリが行われるので、従来と同等の特性を得ることができる。
<第2実施形態>
図8は、第2実施形態に係る音声処理装置のALC部の構成を示す図である。図8において、音声入力部801は、マイクロホンまたは音声再生装置等からの音声信号を入力する。音声入力部801には、DC成分を除去された音声信号が入力される。従って0を中心に正負の値の音声信号が入力される。音声出力部803からは、振幅レベルがTH_MIN〜TH_MAX(ただしTH_MIN<TH_MAX)の間になるように調整された音声信号が出力される。
本実施形態は、第1実施形態と等価な動作を提供するものである。本実施形態におけるALC部は、振幅レベル判定部804、振幅調整部802、ゼロクロス検出部810、第1及び第2振幅ゲイン決定部812,814を含む。本実施形態におけるALC部は更に、第1の予測手段としての第1振幅レベル予測部806、第2の予測手段としての第2振幅レベル予測部808、振幅ゲイン演算部816を含む。
図9は、図8のALC部の動作を示すフローチャートである。まず、現在時刻がサンプリングタイミングであるか否かを判定し(S901)、サンプリングタイミングである場合には、音声入力部801からの音声信号の入力、及び音声出力部803への音声信号の出力を行う(S902)。次に、振幅レベル判定部804で振幅レベルの判定を行い(S903)、ゼロクロス検出部810でゼロクロス検出を行う(S904)。次に、第1振幅レベル予測部806で振幅レベル予測を行った後、更に第2振幅レベル予測部808で振幅レベル予測を行う(S905)。次に、第1のゲイン制御手段としての第1振幅ゲイン決定部812及び第2のゲイン制御手段としての第2振幅ゲイン決定部814で振幅ゲインを決定する(S906)。その後、振幅ゲイン演算部816で、第1振幅ゲイン決定部812で決定された第1ゲイン813と、第2振幅ゲイン決定部814で決定された第2ゲイン815とを加算する(S907)。そして、振幅調整部802で、加算結果である合計ゲイン817を用いて振幅調整を行い(S908)、次のサンプルタイミングが来るまで待機する。
ゼロクロス検出部810の動作は、ゼロクロス検出部1504の動作と同様であり、図3のフローチャートに従い動作する。また、振幅レベル判定部804の動作は、振幅レベル判定部1509の動作と同様であり、図4のフローチャートに従い動作する。振幅調整部802の動作は、第1実施形態における第1及び第2振幅調整部102、104の動作と同様であり、図5のフローチャートに従い動作する。第1及び第2振幅ゲイン決定部812,814の動作は、第1及び第2振幅ゲイン決定部108,112の動作と同様であり、図6のフローチャートに従い動作する。
R_C_MIN、R_C_MAX、R_ADD_GAIN、L_C_MIN、L_C_MAX、L_ADD_GAINは、第1振幅ゲイン決定部812と第2振幅ゲイン決定部814との間で異なる値に設定する。ここで、第1振幅ゲイン決定部812側の値を、R_C_MIN1、R_C_MAX1、R_ADD_GAIN1、L_C_MIN1、L_C_MAX1、L_ADD_GAIN1とする。一方、第2振幅ゲイン決定部814側の値を、R_C_MIN2、R_C_MAX2、R_ADD_GAIN2、L_C_MIN2、L_C_MAX2、L_ADD_GAIN2とする。これらの値を第1実施形態と同様にすることで、第1実施形態と同様にアタック音が連続した場合でも良好なALC動作を実現できる。
<第3実施形態>
上述の第2実施形態において、合計ゲイン817は、図7の期間1〜4では一定であることが望ましい。しかし、ゲイン1とゲイン2は独立に動作しているため、合計ゲインがゲイン可変幅の最小単位で変動する可能性がある。本実施形態は、その対策を施すものである。
図10は、第3実施形態における音声処理装置のALC部の構成を示す図である。図10の構成は、図8の構成に対して、第1振幅ゲイン決定部812で決定されたゲインを調整する振幅ゲイン調整部850が付加された構成となっている。図8の構成要素と同一の構成要素については共通の参照符号を付し、それらの説明は省略する。ただし、第2振幅ゲイン決定部814は、振幅ゲイン調整部850で調整されたゲインに基づいてゲインを決定する構成となっている。
図11は、図10のALC部の動作を示すフローチャートである。図9のフローチャートにおけるステップと同一のステップについては共通の参照符号を付し、それらの説明は省略する。図11において、図10との違いは、S906の代わりにS1101が実行される点である。S1101では、まず、第1振幅ゲイン決定部812が振幅ゲインを決定する。次に、振幅ゲイン調整部850が、後述する図12のフローに従う動作により、その決定された振幅ゲインを調整する。その後、第2振幅ゲイン決定部814でその調整結果を用いて振幅ゲインを決定する。
図12は、振幅ゲイン調整部850の動作を示すフローチャートである。まず、第1振幅レベル予測部806で予測された振幅レベルを変数DINに入力し、第1振幅ゲイン決定部812で決定されたゲイン813を変数GAINに入力する(S1201)。DINの値が、TH_MIN〜TH_MAX(ただしTH_MIN<TH_MAX)の間の場合(S1202,S1203ともにNOの場合)、変数ADJ_GAINにGAIN_D−GAINを代入する(S1204)。そうでなければ、変数ADJ_GAINに0を代入する(S1205)。GAIN_Dは前回のサンプルタイミングで入力されたゲイン813である。次のサンプリングタイミングの処理のためにGAIN_DにGAINを代入する(S1206)。そして、ADJ_GAINを第2振幅ゲイン決定部814に出力する(S1207)。
図13は、第2振幅ゲイン決定部814の動作を示すフローチャートである。図6のフローチャートにおけるステップと同一のステップについては共通の参照符号を付し、それらの説明は省略する。図13において、図6との違いは、S601の代わりにS1301が実行される点、及び、S607の代わりにS1302が実行される点である。S1301では、ゼロクロス検出部810でのゼロクロス検出結果を変数Z_DETに入力し、振幅レベル判定部804で判定された振幅レベルを変数DLEVELに入力する。更に、振幅ゲイン調整部850で調整された振幅ゲイン(調整ゲイン)を変数ADV_GAINに入力する。また、S1302では、現在のGAINにADJ_GAINを加算した値を新たなGAINに更新し、その更新後のGAINを出力する。
第3実施形態によれば、第2振幅レベル予測部808で予測された振幅レベルがTH_MIN〜TH_MAXの範囲にある場合、第1振幅ゲイン決定部812で決定されたゲインが変化すると、その変化分が振幅ゲイン調整部850で調整される。この調整により、ゲイン1+ゲイン2が変化しない。これにより図7の期間1〜4でゲイン可変幅の最小単位での変動を抑制することができる。
<他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。

Claims (9)

  1. 力された音声信号の振幅レベルを、ゲインを用いて調整する第1のレベル制御手段であって、前記第1のレベル制御手段からの音声信号の振幅レベルが所定範囲の上限値を超えた場合はゲインを低下させるリミット動作を行い、前記第1のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の下限値より小さい場合はゲインを増加させるリカバリ動作を行う、第1のレベル制御手段と、
    前記第1のレベル制御手段からの音声信号の振幅レベルを、ゲインを用いて調整する第2のレベル制御手段であって、前記第2のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の上限値を超えた場合はゲインを低下させるリミット動作を行い、前記第2のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の下限値より小さい場合はゲインを増加させるリカバリ動作を行う、第2のレベル制御手段と、を有し、
    前記第1のレベル制御手段でのリカバリ動作時のゲインの増加の時定数を、前記第2のレベル制御手段でのリカバリ動作時のゲインの増加の時定数より大きくすることを特徴とする音声処理装置。
  2. 前記入力された音声信号の振幅レベルが0レベルと交差するゼロクロスを検出するゼロクロス検出手段を更に有し、
    前記第1のレベル制御手段及び前記第2のレベル制御手段はそれぞれ、前記ゼロクロスが検出されたタイミングで前記ゲインを変化させることを特徴とする請求項1に記載の音声処理装置。
  3. 前記第1のレベル制御手段及び前記第2のレベル制御手段はそれぞれ、前記リカバリ動作時におけるゲインの増加の時定数を、前記リミット動作時におけるゲインの低下の時定数より大きくすることを特徴とする請求項1または2に記載の音声処理装置。
  4. 入力された音声信号の振幅レベルが所定範囲内に収まるように前記振幅レベルを調整する音声処理装置であって、
    入力された音声信号の振幅レベルを判定する判定手段と、
    前記判定された振幅レベルに第1ゲインを乗じて得た振幅レベルを予測する第1の予測手段と、
    前記第1の予測手段で予測された振幅レベルに第2ゲインを乗じて得た振幅レベルを予測する第2の予測手段と、
    前記第1の予測手段で予測された振幅レベルが前記所定範囲の上限値を超えた場合は前記第1ゲインを低下させるリミット動作を行い、前記第1の予測手段で予測された振幅レベルが前記所定範囲の下限値より小さい場合は前記第1ゲインを増加させるリカバリ動作を行う、第1のゲイン制御手段と、
    前記第2の予測手段で予測された振幅レベルが前記所定範囲の上限値を超えた場合は前記第2ゲインを低下させるリミット動作を行い、前記第2の予測手段で予測された振幅レベルが前記所定範囲の下限値より小さい場合は前記第2ゲインを増加させるリカバリ動作を行う、第2のゲイン制御手段と、
    前記第1のゲイン制御手段により制御された前記第1ゲインと前記第2のゲイン制御手段により制御された前記第2ゲインとを合計した合計ゲインにより、前記入力された音声信号の振幅レベルを調整する調整手段と、を有し、
    前記第1のゲイン制御手段でのリカバリ動作時の前記第1ゲインの増加の時定数を、前記第2のゲイン制御手段でのリカバリ動作時の前記第2ゲインの増加の時定数より大きくすることを特徴とする音声処理装置。
  5. 前記第2の予測手段で予測された振幅レベルが前記所定範囲内に収まっている場合に、前記第1ゲインが変化しても前記合計ゲインが変化しないように前記第1ゲインを調整する手段を更に有することを特徴とする請求項に記載の音声処理装置。
  6. 前記入力された音声信号の振幅レベルが0レベルを交差するゼロクロスを検出するゼロクロス検出手段を更に有し、
    前記第1のゲイン制御手段及び前記第2のゲイン制御手段はそれぞれ、前記ゼロクロスが検出されたタイミングで前記第1ゲイン及び前記第2ゲインを変化させることを特徴とする請求項又はに記載の音声処理装置。
  7. 1のレベル制御手段が、入力された音声信号の振幅レベルを、ゲインを用いて調整する第1のレベル制御ステップであって、前記第1のレベル制御手段からの音声信号の振幅レベルが所定範囲の上限値を超えた場合はゲインを低下させるリミット動作を行い、前記第1のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の下限値より小さい場合はゲインを増加させるリカバリ動作を行う、第1のレベル制御ステップと、
    第2のレベル制御手段が、前記第1のレベル制御手段からの音声信号の振幅レベルを、ゲインを用いて調整する第2のレベル制御ステップであって、前記第2のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の上限値を超えた場合はゲインを低下させるリミット動作を行い、前記第2のレベル制御手段からの音声信号の振幅レベルが前記所定範囲の下限値より小さい場合はゲインを増加させるリカバリ動作を行う、第2のレベル制御ステップと、を有し、
    前記第1のレベル制御ステップでのリカバリ動作時のゲインの増加の時定数を、前記第2のレベル制御ステップでのリカバリ動作時のゲインの増加の時定数より大きくすることを特徴とする音声処理装置の制御方法。
  8. 入力された音声信号の振幅レベルが所定範囲内に収まるように前記振幅レベルを調整する音声処理装置の制御方法であって、
    判定手段が、入力された音声信号の振幅レベルを判定する判定ステップと、
    第1の予測手段が、前記判定された振幅レベルに第1ゲインを乗じて得た振幅レベルを予測する第1の予測ステップと、
    第2の予測手段が、前記第1の予測ステップで予測された振幅レベルに第2ゲインを乗じて得た振幅レベルを予測する第2の予測ステップと、
    第1のゲイン制御手段が、前記第1の予測ステップで予測された振幅レベルが前記所定範囲の上限値を超えた場合は前記第1ゲインを低下させるリミット動作を行い、前記第1の予測ステップで予測された振幅レベルが前記所定範囲の下限値より小さい場合は前記第1ゲインを増加させるリカバリ動作を行う、第1のゲイン制御ステップと、
    第2のゲイン制御手段が、前記第2の予測ステップで予測された振幅レベルが前記所定範囲の上限値を超えた場合は前記第2ゲインを低下させるリミット動作を行い、前記第2の予測ステップで予測された振幅レベルが前記所定範囲の下限値より小さい場合は前記第2ゲインを増加させるリカバリ動作を行う、第2のゲイン制御ステップと、
    調整手段が、前記第1のゲイン制御ステップで制御された前記第1ゲインと前記第2のゲイン制御ステップで制御された前記第2ゲインとを合計した合計ゲインにより、前記入力された音声信号の振幅レベルを調整する調整ステップと、を有し、
    前記第1のゲイン制御ステップでのリカバリ動作時の前記第1ゲインの増加の時定数を、前記第2のゲイン制御ステップでのリカバリ動作時の前記第2ゲインの増加の時定数より大きくすることを特徴とする音声処理装置の制御方法。
  9. コンピュータを、請求項1から6のいずれか1項に記載の音声処理装置が有する各手段として機能させるためのプログラム。
JP2012286160A 2012-12-27 2012-12-27 音声処理装置及びその制御方法 Active JP6105929B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012286160A JP6105929B2 (ja) 2012-12-27 2012-12-27 音声処理装置及びその制御方法
US14/139,058 US9319015B2 (en) 2012-12-27 2013-12-23 Audio processing apparatus and method
CN201310741393.7A CN103905008B (zh) 2012-12-27 2013-12-27 音频处理设备和音频处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012286160A JP6105929B2 (ja) 2012-12-27 2012-12-27 音声処理装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2014126854A JP2014126854A (ja) 2014-07-07
JP2014126854A5 JP2014126854A5 (ja) 2016-02-18
JP6105929B2 true JP6105929B2 (ja) 2017-03-29

Family

ID=50996186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012286160A Active JP6105929B2 (ja) 2012-12-27 2012-12-27 音声処理装置及びその制御方法

Country Status (3)

Country Link
US (1) US9319015B2 (ja)
JP (1) JP6105929B2 (ja)
CN (1) CN103905008B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015130547A (ja) * 2014-01-06 2015-07-16 パナソニックIpマネジメント株式会社 記録装置
WO2016179647A1 (en) * 2015-05-08 2016-11-17 Barratt Lachlan Normalised attack in digital signal processing
EP3133736A1 (en) * 2015-08-17 2017-02-22 Nxp B.V. Gain control apparatus
JP6518957B2 (ja) 2015-09-14 2019-05-29 パナソニックIpマネジメント株式会社 音声信号処理装置及びそれを用いた撮像装置
CN106504765B (zh) * 2016-10-20 2019-08-13 广州视源电子科技股份有限公司 一种音频信号的自动增益控制方法和装置
JP2019062514A (ja) * 2016-12-26 2019-04-18 キヤノン株式会社 音声処理装置及びその制御方法
JP6570577B2 (ja) * 2017-05-19 2019-09-04 キヤノン株式会社 音声処理装置、音声処理方法、およびプログラム
JP6878137B2 (ja) 2017-05-19 2021-05-26 キヤノン株式会社 音声処理装置、音声処理方法およびプログラム
JP6887315B2 (ja) * 2017-06-05 2021-06-16 キヤノン株式会社 音声処理装置およびその制御方法、プログラム並びに記憶媒体
US11039246B2 (en) * 2017-08-18 2021-06-15 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Volume adjusting method, device, and terminal device
CN114915275A (zh) * 2021-02-08 2022-08-16 祖玛视频通讯公司 两级数字自动增益控制

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100286006B1 (ko) * 1993-03-31 2001-04-16 윤종용 자동이득 조절장치
JPH07193446A (ja) * 1993-12-24 1995-07-28 Nec Corp 予測ゲイン自動切替回路
JPH08274558A (ja) * 1995-03-28 1996-10-18 Kokusai Electric Co Ltd 移動通信機用agc回路
JPH09258782A (ja) * 1996-03-08 1997-10-03 Sony United Kingdom Ltd デジタル音声処理装置
US6535846B1 (en) * 1997-03-19 2003-03-18 K.S. Waves Ltd. Dynamic range compressor-limiter and low-level expander with look-ahead for maximizing and stabilizing voice level in telecommunication applications
US7058188B1 (en) * 1999-10-19 2006-06-06 Texas Instruments Incorporated Configurable digital loudness compensation system and method
JP2001298340A (ja) * 2000-04-17 2001-10-26 Sanyo Electric Co Ltd 自動レベル調整回路
US7248702B2 (en) * 2003-01-06 2007-07-24 Thomas Nelson Packard Sound enhancement system
US7353169B1 (en) * 2003-06-24 2008-04-01 Creative Technology Ltd. Transient detection and modification in audio signals
JP4578169B2 (ja) * 2004-07-23 2010-11-10 三洋電機株式会社 自動レベル調整回路
CN100581052C (zh) * 2004-08-13 2010-01-13 深圳赛意法微电子有限公司 具有自适应的爬升和衰减时间的自动增益控制***
US8290181B2 (en) * 2005-03-19 2012-10-16 Microsoft Corporation Automatic audio gain control for concurrent capture applications
JP5038417B2 (ja) * 2006-08-09 2012-10-03 ドルビー ラボラトリーズ ライセンシング コーポレイション 緩慢段階と急速段階の音声ピーク値制限
JP4123486B2 (ja) * 2006-10-02 2008-07-23 日本ビクター株式会社 デジタル音声処理方法及びデジタル音声処理装置、並びにコンピュータプログラム
ATE415010T1 (de) * 2006-11-17 2008-12-15 Akg Acoustics Gmbh Audiokompressor
JP2008129107A (ja) 2006-11-17 2008-06-05 Sanyo Electric Co Ltd オートゲインコントロール装置、音声記録装置、映像・音声記録装置および通話装置
GB2455742B (en) * 2007-12-19 2011-11-02 Wolfson Microelectronics Plc Dynamic range controller
US8315411B2 (en) * 2008-11-14 2012-11-20 That Corporation Dynamic volume control and multi-spatial processing protection
JP5394905B2 (ja) * 2009-01-14 2014-01-22 ローム株式会社 自動レベル制御回路およびそれを用いたオーディオ用デジタル信号プロセッサならびに可変利得増幅器の利得制御方法
JP5120288B2 (ja) 2009-02-16 2013-01-16 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
JP5556673B2 (ja) * 2011-01-11 2014-07-23 株式会社Jvcケンウッド 音声信号補正装置、音声信号補正方法及びプログラム
DK2512157T3 (en) * 2011-04-13 2014-02-17 Oticon As Hearing aid with automatic speech clipping prevention and similar procedure
US8582786B2 (en) 2011-06-15 2013-11-12 Alpine Electronics, Inc. Automatic gain control of amplifier by dynamic suppressing and output control at multiple stages
CN202334444U (zh) 2011-10-31 2012-07-11 四川和芯微电子股份有限公司 可调增益音频功率放大电路

Also Published As

Publication number Publication date
JP2014126854A (ja) 2014-07-07
US20140185833A1 (en) 2014-07-03
US9319015B2 (en) 2016-04-19
CN103905008A (zh) 2014-07-02
CN103905008B (zh) 2017-03-01

Similar Documents

Publication Publication Date Title
JP6105929B2 (ja) 音声処理装置及びその制御方法
US9064497B2 (en) Method and apparatus for audio intelligibility enhancement and computing apparatus
US9614489B2 (en) Sound producing system and audio amplifying method thereof
WO2010131470A1 (ja) ゲイン制御装置及びゲイン制御方法、音声出力装置
JP5381982B2 (ja) 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体
US10200000B2 (en) Handheld electronic apparatus, sound producing system and control method of sound producing thereof
WO2009130388A1 (en) Calibrating multiple microphones
US8600078B2 (en) Audio signal amplitude adjusting device and method
WO2013054458A1 (ja) ハウリング抑圧装置、補聴器、ハウリング抑圧方法、及び集積回路
US20230164480A1 (en) Audio processing method and electronic device
CN102610232B (zh) 一种自适应音频感知响度调整方法
JP5975290B2 (ja) ハウリング抑圧装置、補聴器、ハウリング抑圧方法、及び集積回路
JP2011150060A (ja) 録音装置
JP2009171057A (ja) 増幅回路
JP5762797B2 (ja) 信号処理装置及び信号処理方法
JP4746498B2 (ja) 単一指向性マイクロホン
JP4814861B2 (ja) 音量調整装置、方法及びプログラム
JP6887315B2 (ja) 音声処理装置およびその制御方法、プログラム並びに記憶媒体
US20180183399A1 (en) Audio processing apparatus and method of controlling same
JP5857216B2 (ja) 自動利得制御装置
US20230262389A1 (en) Acoustic processing device and acoustic processing method
US9407231B2 (en) Apparatus and method of multi-sensor sound recording
JP5346350B2 (ja) 反響消去装置とその方法とプログラム
JP2006279157A (ja) ハウリング抑制システム
KR101981487B1 (ko) 주파수대역별 역동범위처리장치 및 주파수대역별 역동범위처리장치의 동작 방법

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170303

R151 Written notification of patent or utility model registration

Ref document number: 6105929

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151