JP5834948B2 - 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム - Google Patents

残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム Download PDF

Info

Publication number
JP5834948B2
JP5834948B2 JP2012011856A JP2012011856A JP5834948B2 JP 5834948 B2 JP5834948 B2 JP 5834948B2 JP 2012011856 A JP2012011856 A JP 2012011856A JP 2012011856 A JP2012011856 A JP 2012011856A JP 5834948 B2 JP5834948 B2 JP 5834948B2
Authority
JP
Japan
Prior art keywords
reverberation
sound
audio signal
distance
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012011856A
Other languages
English (en)
Other versions
JP2013153254A (ja
Inventor
太郎 外川
太郎 外川
猛 大谷
猛 大谷
鈴木 政直
政直 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012011856A priority Critical patent/JP5834948B2/ja
Priority to EP12192177.9A priority patent/EP2626857B1/en
Priority to US13/674,479 priority patent/US9160404B2/en
Publication of JP2013153254A publication Critical patent/JP2013153254A/ja
Application granted granted Critical
Publication of JP5834948B2 publication Critical patent/JP5834948B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Description

本発明は、例えば、マイクロホンを用いて集音した音声信号に含まれる残響成分を抑制する残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラムに関する。
音を反射しやすい物体に囲まれた空間に配置されたマイクロホンでそのマイクロホンの周囲の音を集音する場合、音源から直接マイクロホンに到達する音と、音源から発した音がその物体で1回以上反射されてから間接的にマイクロホンに到達する音がある。この間接的にマイクロホンに到達する音は残響音と呼ばれる。残響音がマイクロホンに達するタイミングは、音源からの音が直接マイクロホンに達するタイミングよりも遅いため、残響音が存在すると、マイクロホンで集音された音と残響音とが重畳されて、その音は聞き取り難くなる。特に近年、防水機能を備えた携帯電話機が利用可能となっている。このような携帯電話機が浴室といった残響が生じ易い空間で使用されると、その携帯電話機により集音された音は残響音のために非常に聞き取り難くなるおそれがある。そこで、残響音を抑制する技術が研究されている(例えば、特許文献1を参照)。
例えば、特許文献1に開示された残響除去方法は、スピーカとマイクロホンとの音響結合によって形成される帰還経路のインパルス応答を適応フィルタにより適応的に同定してマイクロホンで集音した残響音声信号から帰還経路のエコー成分を推定する。そしてこの残響除去方法は、推定されたエコー成分を帰還経路の出力信号より減算し、その減算結果に含まれたエコー成分推定値の推定誤差が最小となるように適応フィルタのフィルタ係数を更新する。さらにこの残響除去方法は、エコー成分推定値の推定誤差が最小となったときのフィルタ係数を残響空間のインパルス応答に代用し、そのフィルタ係数から求めた残響空間の伝達関数とマイクロホンで集音した残響音声信号との演算から元の音声信号を求める。
特許文献1に開示された技術は、上記のように、スピーカから発してマイクロホンにより集音される音の残響特性によって、音源からマイクロホンに達する音の残響特性を近似している。しかし、携帯電話機のハンズフリー機能を用いてユーザが通話する場合のように、音源からマイクロホンまでの距離がスピーカからマイクロホンまでの距離に対して非常に大きくなったり、逆に小さくなることがある。このような場合、スピーカから発してマイクロホンにより集音される音の残響特性は、音源であるユーザの口からマイクロホンに達する音の残響特性と大きく異なり、その結果として、音源から発した音の残響成分が適切に除去されないことがあった。
一方、マイクロホンアレーを用いて音源との間の距離を推定する技術も提案されている(例えば、特許文献2を参照)。特許文献2に開示された音源距離測定装置は、複数のマイクロホンで受音された受音信号をそれぞれ周波数領域の信号に変換し、その周波数領域の信号をベクトル化して空間相関行列を算出する。そしてこの音源距離測定装置は、空間相関行列とマイクロホンの配置情報とから直接音のパワーと残響音のパワーを求め、距離−直間比データベースを参照して、直接音パワーを残響音パワーで除した直間比と対応する音源距離推定値を求める。
特開2006−67127号公報 特開2011−53062号公報
特許文献2に開示された技術では、マイクロホンから音源までの距離を推定するために、複数のマイクロホンが用いられる。しかし、携帯電話機のような携帯可能な小型の機器では、筺体内のスペースが限られており、その距離を推定するために用いられる複数のマイクロホンを筺体内に配置することが困難なことがある。
そこで本明細書は、一つのマイクロホンを用いて、マイクロホンから音源までの距離が変動してもそのマイクロホンで集音した音に含まれる残響成分を抑制可能な残響抑制装置を提供することを目的とする。
一つの実施形態によれば、残響抑制装置が提供される。この残響抑制装置は、第1の音声信号と、音声出力部により再生された第1の音声信号を音声入力部により集音した音を表す第2の音声信号とから、音声出力部から音声入力部への音の経路のインパルス応答を求め、そのインパルス応答に応じて残響特性を算出する残響特性算出部と、音源からの音を音声入力部により集音した音を表す第3の音声信号の音量及び周波数特性のうちの少なくとも一方に基づいて音声入力部から音源までの距離を推定する距離推定部と、距離の推定値が長くなるほど、残響特性を大きくするよう補正する残響特性補正部と、補正された残響特性に応じて第3の音声信号に含まれる残響成分の周波数スペクトルを推定し、第3の音声信号の周波数スペクトルと残響成分の周波数スペクトルの差が小さいほど第3の音声信号を減衰させる残響抑制部とを有する。
本発明の目的及び利点は、請求項において特に指摘されたエレメント及び組み合わせにより実現され、かつ達成される。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
本明細書に開示された残響抑制装置は、一つのマイクロホンを用いて、マイクロホンから音源までの距離が変動してもそのマイクロホンで集音した音に含まれる残響成分を抑制できる。
第1の実施形態による残響抑制装置が実装された携帯電話機の概略構成図である。 第1の実施形態による残響抑制装置の概略構成図である。 音の経路のインパルス応答の一例を示す図である。 入力音量及び低域パワー比率と距離との関係を示す参照テーブルの一例である。 (a)及び(b)は、それぞれ、音源からマイクロホンに達する音の経路の一例を示す図である。 (a)及び(b)は、それぞれ、マイクロホンから音源までの推定距離と補正ゲインとの関係の一例を示す図である。 入力音のパワースペクトルと残響スペクトルの差分に対する抑制ゲインの関係の一例を示す図である。 第1の実施形態による残響抑制処理の動作フローチャートである。 接話時の平均音量とハンズフリー時の入力音量の差と、マイクロホンから音源までの距離との関係の一例を示す図である。 第2の実施形態による残響抑制装置の距離推定部により実行される距離推定処理の動作フローチャートである。 各実施形態またはその変形例による残響抑制装置の各部の機能を実現するコンピュータプログラムが動作することにより、残響抑制装置として動作するコンピュータの構成図である。
以下、図を参照しつつ、様々な実施形態による残響抑制装置について説明する。
この残響抑制装置は、スピーカから出力される再生音をマイクロホンで集音した音を用いて、音源から発してマイクロホンで集音される入力音の残響特性を近似的に求める。さらにこの残響抑制装置は、音源からマイクロホンまでの距離に応じて変化する入力音の特徴量を求めて、その特徴量により音源からマイクロホンまでの距離を推定し、その推定距離に応じて残響特性を補正する。そしてこの残響抑制装置は、補正された残響特性に従って入力音に含まれる残響成分を抑制する。
図1は、第1の実施形態による残響抑制装置が実装された携帯電話機の概略構成図である。図1に示されるように、携帯電話機1は、制御部2と、通信部3と、マイクロホン4と、アナログ/デジタル変換器5と、残響抑制装置6と、デジタル/アナログ変換器7と、スピーカ8とを有する。
このうち、制御部2、通信部3及び残響抑制装置6は、それぞれ別個の回路として形成される。あるいはこれらの各部は、その各部に対応する回路が集積された一つの集積回路として携帯電話機1に実装されてもよい。さらに、これらの各部は、携帯電話機1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
制御部2は、少なくとも一つのプロセッサ、不揮発性のメモリ及び揮発性のメモリ及びその周辺回路を有する。制御部2は、携帯電話機1が有するキーパッドなどの操作部(図示せず)を介した操作により通話が開始されると、携帯電話機1と基地局装置(図示せず)との間における、無線接続、切断などの呼制御処理を携帯電話機1が準拠する通信規格に従って実行する。そして制御部2は、その呼制御処理の結果に応じて、通信部3に対して音声通話の開始または終了を指示する。さらに、制御部2は、通信部3を介して基地局装置から受信したダウンリンク信号に含まれる符号化された音声信号を取り出し、その音声信号を復号する。そして制御部2は、復号した音声信号を再生音声信号として、デジタル/アナログ変換器7及び残響抑制装置6へ出力する。
また制御部2は、残響抑制装置6がマイクロホン4を介して入力された入力音声信号に含まれる残響成分を抑制することで生成した出力音声信号を符号化し、その符号化された出力音声信号を含むアップリンク信号を生成する。そして制御部2は、そのアップリンク信号を通信部3へ渡す。なお、音声信号に対する符号化方式としては、例えば、Third Generation Partnership Project(3GPP)により標準化されたAdaptive Multi-Rate-NarrowBand(AMR-NB)方式、またはAdaptive Multi-Rate-WideBand(AMR-WB)方式などが用いられる。
通信部3は、基地局装置との間で無線通信する。そして通信部3は、基地局装置から無線信号を受信して、その無線信号をベースバンド周波数を持つダウンリンク信号に変換する。そして通信部3は、ダウンリンク信号に対して分離、復調、誤り訂正復号などの受信処理を行った後、そのダウンリンク信号を制御部2へ渡す。また通信部3は、制御部2から受け取ったアップリンク信号に対して誤り訂正符号化、変調及び多重化などの送信処理を行った後、そのアップリンク信号を無線周波数を持つ搬送波に重畳して基地局装置へ送信する。
マイクロホン4は、音声入力部の一例であり、携帯電話機1の周囲の音を集音し、その音の強度に応じたアナログ音声信号を生成する。マイクロホン4にて集音される音には、例えば、音源から直接マイクロホン4に達する直接音だけでなく、音源からの音声が携帯電話機1の周囲の壁などによって反射されてからマイクロホン4に間接的に達する残響音が含まれることがある。なお、音源は、例えば、携帯電話機1を用いて通話するユーザの口である。そしてマイクロホン4は、そのアナログ音声信号をアナログ/デジタル変換器5へ出力する。
アナログ/デジタル変換器5は、マイクロホン4から受け取ったアナログ音声信号を所定のサンプリングピッチでサンプリングすることによりデジタル化された入力音声信号を生成する。また、アナログ/デジタル変換器5は、増幅器を有し、アナログ音声信号を増幅した後にデジタル化してもよい。
アナログ/デジタル変換器5は、入力音声信号を残響抑制装置6へ出力する。
残響抑制装置6は、入力音声信号に含まれる残響成分を抑制する。そして残響抑制装置6は、残響成分が抑制された出力音声信号を制御部2へ出力する。なお、残響抑制装置6の詳細については後述する。
デジタル/アナログ変換器7は、制御部2から受け取った再生音声信号をデジタル−アナログ変換することでアナログ化する。なお、デジタル/アナログ変換器7は、増幅器を有し、その増幅器により、アナログ化された再生音声信号を増幅してもよい。そしてデジタル/アナログ変換器7は、アナログ化された再生音声信号をスピーカ8へ出力する。
スピーカ8は、音声出力部の一例であり、デジタル/アナログ変換器7から受け取った再生音声信号を再生する。
以下、残響抑制装置6の詳細について説明する。
図2は、第1の実施形態による残響抑制装置6の概略構成図である。残響抑制装置6は、残響特性算出部11と、距離推定部12と、残響特性補正部13と、残響抑制部14とを有する。
残響抑制装置6が有するこれらの各部は、それぞれ、別個の回路として残響抑制装置6に実装されてもよく、あるいはそれらの各部の機能を実現する一つの集積回路であってもよい。
残響特性算出部11は、再生音声信号と、その再生音声信号がスピーカ8により再生され、マイクロホン4により集音されることにより得られた入力音声信号とに基づいて、スピーカ8からマイクロホン4への経路を含む音の経路のインパルス応答を求める。そして残響特性算出部11は、そのインパルス応答に応じて、携帯電話機1の外部に位置する音源からの音の残響特性を近似的に求める。
本実施形態では、残響特性算出部11は、有限インパルス応答型の適応フィルタを用いて、音の経路のインパルス応答を算出する。インパルス応答を表す適応フィルタの係数を、最小二乗法を用いて更新する場合、インパルス応答は次式に従って算出される。
Figure 0005834948
ここで、s(t)は、再生音声信号を表し、x(t)は、入力音声信号を表す。そしてw(t)は音の経路のインパルス応答を表す。またe(t)は、誤差信号を表す。さらに係数μは、インパルス応答w(t)の更新速度を決めるための収束係数であり、例えば、0.01〜0.1に設定される。演算子'*'は、畳み込み演算を表す。
図3は、音の経路のインパルス応答の一例を示す図である。図3において、横軸は音がマイクロホン4に入力されてからの経過時間を表し、縦軸は音のパワーを表す。そしてグラフ300がインパルス応答w(t)を表す。グラフ300に示されるように、時刻0〜時刻t1までは音のパワーは急激に減少する。これは、音源から直接マイクロホン4に達する直接音の経路についてのインパルス応答に相当する。これに対し、時刻t1以降、時刻t2までの期間では、音源から発し、壁などで反射されてからマイクロホン4に達する残響音が含まれるため、パワーは緩やかに減少する。そして時刻t2において残響音がほとんど消失する。
なお、時刻t1は、例えば、以下のように、予め実験的に決定される。残響がほとんど生じない環境下に携帯電話機1を置いて(1)式により求めたインパルス応答w(t)に対して、残響が生じ易い環境下に環境下に携帯電話機1を置いて(1)式により求めたインパルス応答w(t)が大きくなる最初の時刻がt1として決定される。また時刻t2も、残響が生じ易い環境下に環境下に携帯電話機1を置いて(1)式により求めたインパルス応答w(t)がほぼ無視できる大きさとなる最初の時刻として実験的に定められる。例えば、時刻t1=50msec、時刻t2=400msecである。
上記のように、インパルス応答の成分のうち、時刻t1までの成分については直接音が支配的であり、時刻t1以降の成分については残響音が支配的である。そこで残響特性算出部11は、インパルス応答w(t)のうちの時刻0〜t1までの成分w1(t)を直接音の成分、時刻t1〜t2までの成分w2(t)を残響音の成分とする。そして残響特性算出部11は、直接音の成分w1(t)及び残響音の成分w2(t)をそれぞれ時間周波数変換することにより、直接音スペクトルW1(f)及び残響音スペクトルW2(f)を求める。なお、時間周波数変換として、残響特性算出部11は、例えば、高速フーリエ変換または修正離散コサイン変換を用いることができる。
残響特性算出部11は、直接音スペクトルW1(f)の実数成分の自乗と虚数成分の自乗とを加算することで、直接音のパワー|W1(f)|2を求める。同様に、残響特性算出部11は、残響音スペクトルW2(f)の実数成分の自乗と虚数成分の自乗とを加算することで、残響音のパワー|W2(f)|2を求める。そして残響特性算出部11は、次式に従って直接音スペクトルの振幅の絶対値と残響音スペクトルの振幅の絶対値の比を求めることで残響特性H(f)を算出する。
Figure 0005834948
残響特性算出部11は、インパルス応答w(t)を更新する度に、残響特性H(f)も更新する。そして残響特性算出部11は、残響特性H(f)を残響特性補正部13へ出力する。
距離推定部12は、再生音声信号の音量が無視できるほど小さいときの入力音声信号の音量及び周波数特性のうちの少なくとも一方に基づいて、マイクロホン4から音源までの距離を推定する。
一般に、音源がマイクロホンに近づくほど、マイクロホンで集音されるその音源からの音のパワーが大きくなる。そこで距離推定部12は、次式に従って、再生音声信号及び入力音声信号の音量を、それぞれ、所定長を持つフレームごとに算出する。
Figure 0005834948
ここでLは一つのフレームに含まれるサンプリング点の数である。サンプリング点の数Lは、例えば、16msec、32msecあるいは64msecを持つフレームに対して、128、256あるいは1024に設定される。またnは、0以上の整数であり、入力音声信号が入力開始されてからのフレーム数を表す。x(t)、s(t)は、それぞれ、入力音声信号、再生音声信号を表す。そしてPx(n)、Ps(n)は、それぞれ、フレームnにおける入力音声信号の音量、再生音声信号の音量を表す。
また、音源がマイクロホンに近づくほど、マイクロホンで集音されるその音源からの音のスペクトルのパワーに占める、低域成分のパワーの比が大きくなることが、マイクロホンの近接効果として知られている。そのため、距離推定部12は、このパワーの比をマイクロホン4から音源までの距離を推定するために利用できる。
そこで距離推定部12は、上記の比を求めるために、フレームごとに、入力音声信号を周波数領域の入力音スペクトルに変換する。なお、入力音スペクトルを算出するために、距離推定部12は、例えば、高速フーリエ変換あるいは修正離散コサイン変換といった時間周波数変換を用いることができる。
距離推定部12は、さらに、入力音スペクトルに基づいて、次式に従って入力音の全周波数帯域のパワースペクトルを算出する。
Figure 0005834948
ここでX(n,f)は、n番目のフレームについての入力音スペクトルであり、PX(n,f)は、n番目のフレームの入力音のパワースペクトルである。またfは周波数を表す。
距離推定部12は、全周波数帯域についての入力音のパワースペクトルの平均値に対する、低周波数帯域についての入力音のパワースペクトルの平均値の比である低域パワー比率rp(n)を、例えば、次式に従って算出する。
Figure 0005834948
ここで、Mは、周波数帯域の総数であり、mlowは、低周波数帯域の上限の周波数帯域を表す。例えば、入力音スペクトルが128個の周波数帯域の成分で表される場合(M=128)、mlowは16に設定される。すなわち、入力音スペクトルが0〜4kHzの周波数成分を有する場合、低周波数帯域は、0〜500Hzの周波数帯域に相当する。mlowは、例えば、マイクロホン4の近接効果によって入力音声信号のうちのパワーが増幅する周波数成分に対応する周波数の上限値に相当する値に設定される。
距離推定部12は、フレームごとに、再生音声信号の音量Ps(n)が所定の音量閾値Thp未満か否か判定する。そして距離推定部12は、音量Ps(n)が音量閾値Thp以上である場合、マイクロホン4から音源までの距離を推定しない。これにより、距離推定部12は、スピーカ8により再生された再生音声信号がマイクロホン4によって集音されたことによってマイクロホン4から音源までの距離の推定値の誤差が大きくなることを防止できる。
一方、距離推定部12は、音量Ps(n)が音量閾値Thp未満である場合、入力音声信号の音量Px(n)及び低域パワー比率rp(n)と、マイクロホン4から音源までの距離との関係を表す参照テーブルを参照する。これにより、距離推定部12は、そのフレームの入力音声信号の音量Px(n)及び低域パワー比率rp(n)に対応するマイクロホン4から音源までの距離を推定できる。なお、音量閾値Thpは、スピーカ8から出力された再生音声信号がマイクロホン4を介して入力されても、音源までの距離の推定に影響しない再生音声信号の音量の上限値、例えば、-48dBovに設定される。
図4は、入力音量及び低域パワー比率と距離との関係を示す参照テーブルの一例である。参照テーブル400において、一番上の行401の各欄は入力音声信号の音量Px(n)の値の範囲を表し、二番目の行402の各欄は低域パワー比率rp(n)の値の範囲を表す。そして三番目の行403の各欄は、その欄と同じ列に示された入力音声信号の音量Px(n)の値の範囲及び低域パワー比率rp(n)の値の範囲に対応する、マイクロホン4から音源までの推定距離を表す。なお、参照テーブル400は、例えば、距離推定部12が有する、不揮発性の半導体メモリに予め記憶される。
例えば、入力音声信号の音量Px(n)が-25dBovであり、かつ、低域パワー比率rp(n)が1dBであれば、参照テーブル400を参照することにより、マイクロホン4から音源までの距離は10cmと推定される。また、入力音声信号の音量Px(n)が-31dBovであり、かつ、低域パワー比率rp(n)が-5dBであれば、参照テーブル400を参照することにより、マイクロホン4から音源までの距離は40cmと推定される。
なお、距離推定部12は、マイクロホン4の近接効果による低域パワー比率の変化が大きい場合、低域パワー比率のみに基づいてマイクロホン4から音源までの距離を推定してもよい。この場合も、距離推定部12は、低域パワー比率とマイクロホン4から音源までの距離との関係を表す参照テーブルを参照することにより、低域パワー比率に応じてマイクロホン4から音源までの距離を推定すればよい。
距離推定部12は、マイクロホン4から音源までの推定距離を求める度に、その推定距離を残響特性補正部13に通知する。
残響特性補正部13は、マイクロホン4から音源までの推定距離に応じて残響特性を補正する。
図5(a)及び図5(b)は、それぞれ、音源からマイクロホンに達する音の経路の一例を示す図である。図5(a)では、音源501から発し、マイクロホン4に入力される直接音の経路502の距離は0.1mである。一方、音の経路のインパルス応答に含まれる直接音の成分と残響音の成分との区切りの時刻t1が上記のように50msecである場合、空気中の音速は約340m/secであるので、音源501から発した音は時刻t1までに約17m進む。そのため、音源501から発し、マイクロホン4の周囲の壁面503で1回以上反射してからマイクロホン4に入力される残響音の経路504の長さは約17.1mとなる。
一方、図5(b)では、音源511から発し、マイクロホン4に入力される直接音の経路512の距離は1mである。また時刻t1が上記のように50msecである場合、音源501から発し、マイクロホン4の周囲の壁面513で1回以上反射してからマイクロホン4に入力される残響音の経路514の長さは約18mとなる。
ここで、点音源からの距離r0の地点における、その点音源からの音に対する、点音源からの距離r1(ただし、r1>r0)の地点における、その点音源からの音の減衰量Aは、次式で表される。
Figure 0005834948
そこで、図5(a)に示された音源の位置から図5(b)に示された音源の位置へ音源が移動した場合、マイクロホン4に達する直接音は、(6)式により、-20dB減衰する。一方、図5(a)に示された音源の位置から図5(b)に示された音源の位置へ音源が移動しても、マイクロホン4に達する残響音は、(6)式により、-0.45dBしか減少しない。したがって、マイクロホン4から音源までの距離が長いほど、残響成分の影響が大きくなる。
したがって、残響特性補正部13は、マイクロホン4から音源までの推定距離が長くなるほど、残響特性が大きくなるように残響特性を補正する。
残響特性補正部13は、 マイクロホン4から音源までの推定距離が長くなるほど、値が小さくなり、かつ正の値を持つ補正ゲインαを求める。例えば、マイクロホン4から音源までの推定距離と補正ゲインαとの関係を表す関係式の係数が、残響特性補正部13が有する不揮発性の半導体メモリに予め記憶される。そして残響特性補正部13は、その関係式にしたがって、その推定距離に対応する補正ゲインαの値を求める。あるいは、マイクロホン4から音源までの推定距離と補正ゲインαとの関係を表す参照テーブルが、残響特性補正部13が有する不揮発性の半導体メモリに予め記憶される。そして残響特性補正部13は、その参照テーブルを参照することにより、推定距離に対応する補正ゲインαの値を求めてもよい。
図6(a)及び図6(b)は、それぞれ、マイクロホンから音源までの推定距離と補正ゲインαとの関係の一例を示す図である。図6(a)において、横軸はマイクロホン4から音源までの推定距離を表し、縦軸は補正ゲインαの値を表す。そしてグラフ601は、それぞれ、推定距離に対する補正ゲインαの値を表す。グラフ601に示されるように、推定距離が長くなるにつれて単調減少するように、補正ゲインαの値は決定される。
図6(b)は、周波数帯域ごとに補正ゲインαを決定する場合の推定距離と補正ゲインαの関係を示す。図6(b)においても、横軸はマイクロホン4から音源までの推定距離を表し、縦軸は補正ゲインαの値を表す。そしてグラフ602〜604は、それぞれ、周波数50Hz、100Hz、及び1kHzにおける、推定距離に対する補正ゲインαの値を表す。マイクロホン4から音源までの距離が近いと、直接音に占める低域成分がより増幅されるので、残響音の影響も低下する。そこでグラフ602〜604に示されるように、残響特性補正部13は、周波数が低いほど、補正ゲインαの値を大きくする。
残響特性補正部13は、次式に従って、推定された残響特性を補正する。
Figure 0005834948
ここで、H(f)は、残響特性算出部11により推定された残響特性であり、H'(f)は、補正後の残響特性である。またαは補正ゲインである。(7)式より、マイクロホン4から音源までの推定距離が長くなり、補正ゲインαが小さくなるほど、補正後の残響特性が大きくなることが分かる。
なお、残響特性補正部13は、一旦特定した補正ゲインαを、残響特性補正部13が有する揮発性または不揮発性の半導体メモリに記憶しておいてもよい。そして残響特性補正部13は、次に距離推定部12から推定距離が通知され、補正ゲインαが再度求められるまで、記憶された補正ゲインαを用いて残響特性を補正してもよい。
残響特性補正部13は、補正された残響特性H'(f)を残響抑制部14へ出力する。
残響抑制部14は、残響特性補正部13から受け取った、補正された残響特性H'(f)に基づいて、入力音声信号に含まれる残響成分を抑制する。
残響抑制部14は、フレームごとに、入力音声信号を周波数領域の入力音スペクトルに変換する。なお、入力音スペクトルを算出するために、残響抑制部14は、距離推定部12と同様に、例えば、高速フーリエ変換あるいは修正離散コサイン変換を用いることができる。
次に、残響抑制部14は、次式のように、入力音スペクトルに補正された残響特性を乗じることにより、残響音のスペクトルを推定する。
Figure 0005834948
ここで、X(n,f)は、n番目のフレームについての入力音スペクトルであり、H'(f)は、補正された残響特性である。そしてR(n,f)は、n番目のフレームについての推定された残響音のスペクトルである。
残響抑制部14は、入力音スペクトルから推定された残響音のスペクトルを減算した差分値(δ(n,f)=X(n,f)-R(n,f))に基づいて、入力音スペクトルの減衰量を表す抑制ゲインG(f)を決定する。例えば、残響抑制部14は、その差分値δ(n,f)が小さいほど、すなわち、入力音スペクトルに占める残響成分が多いほど、抑制ゲインを大きくする。
図7は、入力音スペクトルと推定された残響のスペクトル間の差分値δ(n,f)に対する抑制ゲインG(f)の関係の一例を示す図である。図7において、横軸は差分値δ(n,f)を表し、縦軸は抑制ゲインG(f)を表す。グラフ700は、差分値δ(n,f)と抑制ゲインG(f)の関係を表す。
グラフ700に示されるように、例えば、差分値δ(n,f)が6dB以下であれば、抑制ゲインG(f)は10dBに設定される。そして差分値δ(n,f)が6dBから12dBの間であれば、その差分値δ(n,f)が増加するにつれて抑制ゲインG(f)は線形に減少し、その差分値δ(n,f)が12dB以上となると、抑制ゲインG(f)は0dB、すなわち、入力音スペクトルを全く減衰させない値に設定される。
例えば、差分値δ(n,f)と抑制ゲインG(f)との関係を表す関係式の係数が、残響抑制部14が有する不揮発性の半導体メモリに予め記憶される。そして残響抑制部14は、その関係式にしたがって、差分値δ(n,f)に対応する抑制ゲインG(f)を決定する。あるいは、差分値δ(n,f)と抑制ゲインG(f)との関係を表す参照テーブルが、残響抑制部14が有する不揮発性の半導体メモリに予め記憶される。そして残響抑制部14は、その参照テーブルを参照することにより、差分値δ(n,f)に対応する抑制ゲインG(f)を決定してもよい。
残響抑制部14は、例えば、次式に従って、入力音スペクトルのうちの残響成分を抑制したスペクトルである出力音スペクトルを算出する。
Figure 0005834948
ここで、Y(n,f)は出力音スペクトルである。(9)式から明らかなように、抑制ゲインG(f)が大きいほど、出力音スペクトルY(n,f)も小さくなる。
残響抑制部14は、出力音スペクトルY(n,f)を、入力音スペクトルを算出する際に用いた時間周波数変換の逆変換を用いて時間領域の信号に変換することにより、出力音声信号を得る。
そして残響抑制部14は、出力音声信号を携帯電話機1の制御部2へ出力する。
図8は、残響抑制装置6により実行される残響抑制処理の動作フローチャートである。
残響特性算出部11は、再生音声信号と、スピーカ8で再生された再生音声信号をマイクロホン4により集音して得られた入力音声信号とから、適応フィルタを用いてスピーカ8からマイクロホン4の音の経路のインパルス応答w(t)を求める(ステップS101)。残響特性算出部11は、インパルス応答w(t)のうち、直接音に相当する成分と残響音に相当する成分とをそれぞれ時間周波数変換して得られた直接音スペクトルW1(f)と残響音スペクトルW2(f)の絶対値の比|W2(f)/W1(f)|を残響特性H(f)として推定する(ステップS102)。残響特性算出部11は、残響特性H(f)を残響特性補正部13へ出力する。
距離推定部12は、再生音声信号が無視できるほど小さいときの、携帯電話機1の外部の音源からの音をマイクロホン4で集音した入力音声信号の音量と周波数特性とを求める(ステップS103)。そして距離推定部12は、その音量と周波数特性に基づいてマイクロホン4から音源までの距離を推定する(ステップS104)。距離推定部12は、その推定距離を残響特性補正部13へ通知する。
残響特性補正部13は、推定距離が長くなるほど、残響特性H(f)が大きくなるように、残響特性H(f)を補正する(ステップS105)。そして残響特性補正部13は、補正された残響特性H'(f)を残響抑制部14へ出力する。
残響抑制部14は、入力音声信号を時間周波数変換することで入力音スペクトルを求め、その入力音スペクトルに補正された残響特性H'(f)を乗じることで残響音のスペクトルを推定する(ステップS106)。そして残響抑制部14は、入力音スペクトルと推定された残響音スペクトルの差が小さいほど、抑制ゲインG(f)を大きな値に設定する(ステップS107)。残響抑制部14は、抑制ゲインG(f)が大きいほど、入力音スペクトルを減衰させることで、出力音スペクトルを算出する(ステップS108)。そして残響抑制部14は、出力音スペクトルを周波数時間変換することで、出力音声信号を得る(ステップS109)。そして残響抑制装置6は、その出力音声信号を出力し、残響抑制処理を終了する。
以上に説明してきたように、この残響抑制装置は、マイクロホンから音源までの距離を推定し、その推定距離に応じて、再生音声信号に基づいて近似的に算出された残響特性を補正する。そのため、この残響抑制装置は、マイクロホンから音源までの距離が変化しても、残響特性を適切に求めることができるので、入力音声信号中の残響成分を抑制できる。またこの残響抑制装置は、マイクロホンから音源までの距離を推定するのに入力音声信号の音量及び周波数特性を利用するので、1本のマイクロホンだけでその距離を推定できる。
次に、第2の実施形態による残響抑制装置について説明する。第2の実施形態による残響抑制装置は、その残響抑制装置が実装された携帯電話機の制御部から、接話状態かハンズフリー状態かを表す情報を取得する。そしてこの残響抑制装置は、接話状態における入力音声信号の音量を基準として、ハンズフリー状態における入力音声信号の音量との差に基づいてマイクロホンから音源までの距離を推定する。
第2の実施形態による残響抑制装置は、第1の実施形態による残響抑制装置と比較して、距離推定部12の処理が異なる。そこで以下では、距離推定部12について説明する。第2の実施形態による残響抑制装置のその他の構成要素については、第1の実施形態による残響抑制装置の対応する構成要素についての説明を参照されたい。また以下では、第2の実施形態による残響抑制装置も、図1に示された携帯電話機1に実装されたものとして説明する。
携帯電話機1の制御部2は、キーパッドまたはタッチパネルといった携帯電話機1の操作部(図示せず)を介した操作により、通話が開始されると、その開始時点での通話距離設定を表す通話距離設定情報を残響抑制装置6へ通知する。なお、通話距離設定として、例えば、接話設定とハンズフリー設定とが含まれる。接話設定は、スピーカ8から出力される音の音量が、ユーザがスピーカ8に耳を近づけなければ聞こえないほど小さく設定されることで、ユーザにマイクロホン4に近接した状態で通話させる設定である。一方、ハンズフリー設定は、スピーカ8から出力される音の音量が大きく、ユーザが携帯電話機1から離れていても通話できる設定である。そのため、ハンズフリー設定では、ユーザとマイクロホン4間の距離は、接話設定時のその距離よりも大きくなる可能性がある。
また制御部2は、操作部を介して接話設定とハンズフリー設定とが切り替えられると、切替後の通話距離設定を表す通話距離設定情報を残響抑制装置6へ通知する。
距離推定部12は、第1の実施形態と同様に、入力音声信号の音量を、(3)式に従って、所定長を持つフレームごとに算出する。
また距離推定部12は、制御部2から通知された通話距離設定情報により、接話設定がなされていると判断している期間中、マイクロホン4から音源までの推定距離として、予め設定された値、例えば、5cmを残響特性補正部13へ出力する。この値は、例えば、複数のユーザのそれぞれについて、接話時における、マイクロホン4からそのユーザの口までの距離を測定し、その測定値の平均値を求めることにより決定され、距離推定部12が有する不揮発性の半導体メモリに予め記憶される。
さらに、距離推定部12は、接話設定がなされていると判断している期間中、次式に従って、接話時の入力音声信号の平均音量を算出する。接話時の入力音声信号の平均音量は、ハンズフリー時における、マイクロホン4から音源までの距離を推定するための基準値として利用される。
Figure 0005834948
ここで、Pca(n)、Pca(n-1)は、それぞれ、n番目、(n-1)番目のフレームにおける、接話時の入力音声信号の平均音量である。またPx(n)は、n番目のフレームにおける、接話時の入力音声信号の音量である。そしてcは、平滑化係数であり、例えば、0.01〜0.1に設定される。
距離推定部12は、接話時の入力音声信号の平均音量が更新される度に、その平均音量を距離推定部12が有する半導体メモリに記憶する。
距離推定部12は、制御部2から通知された通話距離設定情報により、ハンズフリー設定がなされていると判断している期間中、メモリに記憶しておいた接話時の入力音声信号の平均音量からフレームごとの入力音声信号の音量を引いた差分音量Pdを求める。そして距離推定部12は、差分音量Pdとマイクロホン4から音源までの距離の関係を表す参照テーブルを参照することにより、その差分音量Pdに対応する、マイクロホン4から音源までの推定距離を決定する。なお、参照テーブルは、例えば、距離推定部12が有する、不揮発性の半導体メモリに予め記憶される。
距離推定部12は、その推定距離を残響特性補正部13へ出力する。
図9は、差分音量Pdとマイクロホン4から音源までの距離の関係の一例を表す図である。図9において、横軸は差分音量Pdを表し、縦軸はマイクロホン4から音源までの推定距離を表す。そしてグラフ900は、差分音量Pdと推定距離との関係を表すグラフである。グラフ900に示されるように、差分音量Pdが大きくなるほど、すなわち、接話時の入力音声信号の平均音量に比べてハンズフリー時の入力音声信号の音量が小さいほど、推定距離が長くなる。
図10は、距離推定部12により実行される距離推定処理の動作フローチャートである。この距離推定処理は、図8に示された残響抑制処理の動作フローチャートにおける、ステップS103及びS104の代わりに実行される。
距離推定部12は、現在のフレームについて入力音声信号の音量を求める(ステップS201)。そして距離推定部12は、携帯電話機1の制御部2から受け取った通話距離設定情報に基づいて、現在の通話距離設定が接話設定か否か判定する(ステップS202)。現在の通話距離設定が接話設定である場合(ステップS202−Yes)、距離推定部12は、接話設定に対して予め定められた距離を残響特性補正部13へ出力する(ステップS203)。また距離推定部12は、現在のフレームについての入力音声信号の音量と、直前までのフレームにおける、接話時の入力音声信号の平均音量とに基づいて、その平均音量を更新し、その平均音量を記憶する(ステップS204)。
一方、現在の通話距離設定がハンズフリー設定である場合(ステップS202−No)、距離推定部12は、接話時の入力音声信号の平均音量から現在のフレームについての入力音声信号の音量を減じた差分音量を求める(ステップS205)。距離推定部12は、差分音量と、マイクロホン4から音源までの距離との関係を表す参照テーブルを参照することにより、ステップS205で求められた差分音量に対応するマイクロホン4から音源までの推定距離を決定し、その推定距離を残響特性補正部13へ出力する(ステップS206)。
ステップS204またはS206の後、距離推定部12は、距離推定処理を終了する。
この第2の実施形態によれば、接話時の入力音声信号の平均音量とハンズフリー時の入力音声信号の音量との差に基づいてマイクロホンから音源までの距離を推定するので、ユーザの発声音量の個人差によらず、マイクロホンから音源までの距離を適切に推定できる。
なお、変形例によれば、残響抑制装置は、距離推定部及び残響抑制部とは別個に、入力音声信号をフレーム単位で時間周波数変換することにより入力音スペクトルを算出する時間周波数変換部(図示せず)を有してもよい。この場合、時間周波数変換部により生成されたフレームごとの入力音スペクトルは、距離推定部及び残響抑制部に入力される。これにより、入力音スペクトルを算出するための演算量または回路規模が削減可能となる。
また他の変形例によれば、残響特性算出部は、(3)式に従って再生音声信号の音量を算出し、その音量が音量閾値Thp以上である場合に限り、残響特性を算出してもよい。この場合、フレームごとに、図8に示した動作フローチャートにおける、ステップS101、S102とステップS103、S104とが再生音声信号の音量に応じて選択的に実行される。
さらに、上記の各実施形態による残響抑制装置の各部が有する各機能をコンピュータに実現させるコンピュータプログラムは、磁気記録媒体あるいは光記録媒体といった、コンピュータによって読み取り可能な媒体に記録された形で提供されてもよい。
図11は、上記の実施形態またはその変形例による残響抑制装置の各部の機能を実現するコンピュータプログラムが動作することにより、残響抑制装置として動作するコンピュータの構成図である。
コンピュータ100は、ユーザインターフェース部101と、通信インターフェース部102と、記憶部103と、記憶媒体アクセス装置104と、プロセッサ105とを有する。プロセッサ105は、ユーザインターフェース部101、通信インターフェース部102、記憶部103及び記憶媒体アクセス装置104と、例えば、バスを介して接続される。
ユーザインターフェース部101は、例えば、キーボードとマウスなどの入力装置と、液晶ディスプレイといった表示装置とを有する。または、ユーザインターフェース部101は、タッチパネルディスプレイといった、入力装置と表示装置とが一体化された装置を有してもよい。そしてユーザインターフェース部101は、例えば、ユーザの操作に応じて、残響抑制処理を開始させる操作信号をプロセッサ105へ出力する。
通信インターフェース部102は、コンピュータ100を、マイクロホン及びスピーカと接続するためのオーディオインターフェース及びその制御回路を有してもよい。
さらに、通信インターフェース部102は、イーサネット(登録商標)などの通信規格に従った通信ネットワークに接続するための通信インターフェース及びその制御回路を有してもよい。
この場合には、通信インターフェース部102は、通信ネットワークに接続された他の機器から、再生音声信号を取得し、プロセッサ105へ渡す。また通信インターフェース部102は、プロセッサ105から受け取った、残響抑制された出力音声信号を通信ネットワークを介して他の機器へ出力してもよい。
記憶部103は、例えば、読み書き可能な半導体メモリと読み出し専用の半導体メモリとを有する。そして記憶部103は、プロセッサ105上で実行される、残響抑制処理を実行するためのコンピュータプログラム、及び残響抑制処理で利用される、各参照テーブルといったデータを記憶する。
記憶媒体アクセス装置104は、例えば、磁気ディスク、半導体メモリカード及び光記憶媒体といった記憶媒体106にアクセスする装置である。記憶媒体アクセス装置104は、例えば、記憶媒体106に記憶されたプロセッサ105上で実行される、残響抑制処理用のコンピュータプログラムを読み込み、プロセッサ105に渡す。
プロセッサ105は、上記の各実施形態の何れかまたは変形例による残響抑制処理用コンピュータプログラムを実行することにより、マイクロホンを介して入力された音声信号に含まれる残響成分を抑制する。そしてプロセッサ105は、残響抑制された入力音声信号を通信インターフェース部102を介して他の機器へ出力する。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
以上説明した実施形態及びその変形例に関し、更に以下の付記を開示する。
(付記1)
第1の音声信号と、音声出力部により再生された該第1の音声信号を音声入力部により集音した音を表す第2の音声信号とから、該音声出力部から該音声入力部への音の経路のインパルス応答を求め、該インパルス応答に応じて残響特性を算出する残響特性算出部と、
音源からの音を前記音声入力部により集音した音を表す第3の音声信号の音量及び周波数特性のうちの少なくとも一方に基づいて前記音声入力部から前記音源までの距離を推定する距離推定部と、
前記距離の推定値が長くなるほど、前記残響特性を大きくするよう補正する残響特性補正部と、
前記補正された残響特性に応じて前記第3の音声信号に含まれる残響成分の周波数スペクトルを推定し、前記第3の音声信号の周波数スペクトルと該残響成分の周波数スペクトルの差が小さいほど前記第3の音声信号を減衰させる残響抑制部と、
を有する残響抑制装置。
(付記2)
前記残響特性算出部は、前記インパルス応答に含まれる、前記音声出力部から前記音声入力部へ直接達する直接音に対応する期間の成分のスペクトルに対する前記音声出力部から前記音声入力部へ間接的に達する残響音に対応する期間の成分のスペクトルの比を前記残響特性とする、付記1に記載の残響抑制装置。
(付記3)
前記距離推定部は、前記第3の音声信号の周波数特性として、前記第3の音声信号が持つ周波数帯域全体のパワースペクトルに対する所定の周波数以下の周波数帯域のパワースペクトルの比を算出し、当該比が大きいほど前記距離の推定値を短くする、付記1または2に記載の残響抑制装置。
(付記4)
前記所定の周波数は、前記音声入力部に対する近接効果により、前記第3の音声信号のうちのパワーが増幅する周波数成分に対応する周波数の上限値である、付記3に記載の残響抑制装置。
(付記5)
前記距離推定部は、前記音声入力部を有する機器について接話設定されている第1の期間における前記第3の音声信号の音量の平均値を算出し、前記機器が接話設定されていない第2の期間における前記第3の音声信号の音量を前記平均値から減じた値が大きいほど、当該第2の期間における前記距離の推定値を長くする、付記1または2に記載の残響抑制装置。
(付記6)
前記残響特性補正部は、第1の周波数における前記残響特性を除する係数を、前記第1の周波数よりも高い第2の周波数における前記残響特性を除する係数よりも大きくする、付記1〜5の何れか一項に記載の残響抑制装置。
(付記7)
第1の音声信号と、音声出力部により再生された該第1の音声信号を音声入力部により集音した音を表す第2の音声信号とから、該音声出力部から該音声入力部への音の経路のインパルス応答を求め、該インパルス応答に応じて残響特性を算出し、
音源からの音を前記音声入力部により集音した音を表す第3の音声信号の音量及び周波数特性のうちの少なくとも一方に基づいて前記音声入力部から前記音源までの距離を推定し、
前記距離の推定値が長くなるほど、前記残響特性を大きくするよう補正し、
前記補正された残響特性に応じて前記第3の音声信号に含まれる残響成分の周波数スペクトルを推定し、
前記第3の音声信号の周波数スペクトルと該残響成分の周波数スペクトルの差が小さいほど前記第3の音声信号を減衰させる、
ことを含む残響抑制方法。
(付記8)
第1の音声信号と、音声出力部により再生された該第1の音声信号を音声入力部により集音した音を表す第2の音声信号とから、該音声出力部から該音声入力部への音の経路のインパルス応答を求め、該インパルス応答に応じて残響特性を算出し、
音源からの音を前記音声入力部により集音した音を表す第3の音声信号の音量及び周波数特性のうちの少なくとも一方に基づいて前記音声入力部から前記音源までの距離を推定し、
前記距離の推定値が長くなるほど、前記残響特性を大きくするよう補正し、
前記補正された残響特性に応じて前記第3の音声信号に含まれる残響成分の周波数スペクトルを推定し、
前記第3の音声信号の周波数スペクトルと該残響成分の周波数スペクトルの差が小さいほど前記第3の音声信号を減衰させる、
ことをコンピュータに実行させる残響抑制用コンピュータプログラム。
1 携帯電話機
2 制御部
3 通信部
4 マイクロホン
5 アナログ/デジタル変換器
6 残響抑制装置
7 デジタル/アナログ変換器
8 スピーカ
11 残響特性算出部
12 距離推定部
13 残響特性補正部
14 残響抑制部
100 コンピュータ
101 ユーザインターフェース部
102 通信インターフェース部
103 記憶部
104 記憶媒体アクセス装置
105 プロセッサ
106 記憶媒体

Claims (6)

  1. 第1の音声信号と、音声出力部により再生された該第1の音声信号を音声入力部により集音した音を表す第2の音声信号とから、該音声出力部から該音声入力部への音の経路のインパルス応答を求め、該インパルス応答に応じて残響特性を算出する残響特性算出部と、
    音源からの音を前記音声入力部により集音した音を表す第3の音声信号の音量及び周波数特性のうちの少なくとも一方に基づいて前記音声入力部から前記音源までの距離を推定する距離推定部と、
    前記距離の推定値が長くなるほど、前記残響特性を大きくするよう補正する残響特性補正部と、
    前記補正された残響特性に応じて前記第3の音声信号に含まれる残響成分の周波数スペクトルを推定し、周波数ごとに、前記第3の音声信号の周波数スペクトルと該残響成分の周波数スペクトルの差を算出し、当該差が小さい周波数ほど前記第3の音声信号を減衰させる残響抑制部と、
    を有する残響抑制装置。
  2. 前記距離推定部は、前記第3の音声信号の周波数特性として、前記第3の音声信号が持つ周波数帯域全体のパワースペクトルに対する所定の周波数以下の周波数帯域のパワースペクトルの比を算出し、当該比が大きいほど前記距離の推定値を短くする、請求項1に記載の残響抑制装置。
  3. 前記距離推定部は、前記音声入力部を有する機器について接話設定されている第1の期間における前記第3の音声信号の音量の平均値を算出し、前記機器が接話設定されていない第2の期間における前記第3の音声信号の音量を前記平均値から減じた値が大きいほど、当該第2の期間における前記距離の推定値を長くする、請求項1に記載の残響抑制装置。
  4. 前記残響特性補正部は、第1の周波数における前記残響特性を除する係数を、前記第1の周波数よりも高い第2の周波数における前記残響特性を除する係数よりも大きくする、請求項1〜3の何れか一項に記載の残響抑制装置。
  5. 第1の音声信号と、音声出力部により再生された該第1の音声信号を音声入力部により集音した音を表す第2の音声信号とから、該音声出力部から該音声入力部への音の経路のインパルス応答を求め、該インパルス応答に応じて残響特性を算出し、
    音源からの音を前記音声入力部により集音した音を表す第3の音声信号の音量及び周波数特性のうちの少なくとも一方に基づいて前記音声入力部から前記音源までの距離を推定し、
    前記距離の推定値が長くなるほど、前記残響特性を大きくするよう補正し、
    前記補正された残響特性に応じて前記第3の音声信号に含まれる残響成分の周波数スペクトルを推定し、
    周波数ごとに、前記第3の音声信号の周波数スペクトルと該残響成分の周波数スペクトルの差を算出し、当該差が小さい周波数ほど前記第3の音声信号を減衰させる、
    ことを含む残響抑制方法。
  6. 第1の音声信号と、音声出力部により再生された該第1の音声信号を音声入力部により集音した音を表す第2の音声信号とから、該音声出力部から該音声入力部への音の経路のインパルス応答を求め、該インパルス応答に応じて残響特性を算出し、
    音源からの音を前記音声入力部により集音した音を表す第3の音声信号の音量及び周波数特性のうちの少なくとも一方に基づいて前記音声入力部から前記音源までの距離を推定し、
    前記距離の推定値が長くなるほど、前記残響特性を大きくするよう補正し、
    前記補正された残響特性に応じて前記第3の音声信号に含まれる残響成分の周波数スペクトルを推定し、
    周波数ごとに、前記第3の音声信号の周波数スペクトルと該残響成分の周波数スペクトルの差を算出し、当該差が小さい周波数ほど前記第3の音声信号を減衰させる、
    ことをコンピュータに実行させる残響抑制用コンピュータプログラム。
JP2012011856A 2012-01-24 2012-01-24 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム Expired - Fee Related JP5834948B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012011856A JP5834948B2 (ja) 2012-01-24 2012-01-24 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム
EP12192177.9A EP2626857B1 (en) 2012-01-24 2012-11-12 Reverberation reduction device and reverberation reduction method
US13/674,479 US9160404B2 (en) 2012-01-24 2012-11-12 Reverberation reduction device and reverberation reduction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012011856A JP5834948B2 (ja) 2012-01-24 2012-01-24 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2013153254A JP2013153254A (ja) 2013-08-08
JP5834948B2 true JP5834948B2 (ja) 2015-12-24

Family

ID=47562963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012011856A Expired - Fee Related JP5834948B2 (ja) 2012-01-24 2012-01-24 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム

Country Status (3)

Country Link
US (1) US9160404B2 (ja)
EP (1) EP2626857B1 (ja)
JP (1) JP5834948B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2916241A1 (en) * 2014-03-03 2015-09-09 Nokia Technologies OY Causation of rendering of song audio information
US9870500B2 (en) * 2014-06-11 2018-01-16 At&T Intellectual Property I, L.P. Sensor enhanced speech recognition
JP6371167B2 (ja) * 2014-09-03 2018-08-08 リオン株式会社 残響抑制装置
DE112014007255B4 (de) * 2014-12-15 2018-08-23 Mitsubishi Electric Corporation Echolöscheinrichtung und Echolöschverfahren
KR20170071121A (ko) * 2015-12-15 2017-06-23 현대오트론 주식회사 초음파 신호 최적화 장치 및 방법
JP6677662B2 (ja) * 2017-02-14 2020-04-08 株式会社東芝 音響処理装置、音響処理方法およびプログラム
WO2019012587A1 (ja) * 2017-07-10 2019-01-17 ヤマハ株式会社 ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム
CN107967921B (zh) * 2017-12-04 2021-09-07 苏州科达科技股份有限公司 会议***的音量调节方法及装置
CN112201267A (zh) * 2020-09-07 2021-01-08 北京达佳互联信息技术有限公司 一种音频处理方法、装置、电子设备及存储介质
CN113067944B (zh) * 2021-03-24 2023-05-02 深圳市锐尔觅移动通信有限公司 通话音量的调节方法、装置、终端及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000069141A (ja) 1998-08-26 2000-03-03 Uniden Corp 音声認識機能付き電話機
US6243322B1 (en) * 1999-11-05 2001-06-05 Wavemakers Research, Inc. Method for estimating the distance of an acoustic signal
JP4247002B2 (ja) 2003-01-22 2009-04-02 富士通株式会社 マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置
JP4396449B2 (ja) 2004-08-25 2010-01-13 パナソニック電工株式会社 残響除去方法及びその装置
JP4249729B2 (ja) 2004-10-01 2009-04-08 日本電信電話株式会社 自動利得制御方法、自動利得制御装置、自動利得制御プログラム及びこれを記録した記録媒体
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
JP4449987B2 (ja) * 2007-02-15 2010-04-14 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
US8767975B2 (en) * 2007-06-21 2014-07-01 Bose Corporation Sound discrimination method and apparatus
EP2058804B1 (en) * 2007-10-31 2016-12-14 Nuance Communications, Inc. Method for dereverberation of an acoustic signal and system thereof
JP2009164747A (ja) 2007-12-28 2009-07-23 Yamaha Corp マイクロフォン装置、電話機、音声信号処理装置および音声信号処理方法
JP5079761B2 (ja) 2009-09-01 2012-11-21 日本電信電話株式会社 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
JP5347902B2 (ja) * 2009-10-22 2013-11-20 ヤマハ株式会社 音響処理装置

Also Published As

Publication number Publication date
US9160404B2 (en) 2015-10-13
EP2626857A1 (en) 2013-08-14
EP2626857B1 (en) 2015-09-09
JP2013153254A (ja) 2013-08-08
US20130188798A1 (en) 2013-07-25

Similar Documents

Publication Publication Date Title
JP5834948B2 (ja) 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム
JP5923994B2 (ja) 音声処理装置及び音声処理方法
JP6446893B2 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧用コンピュータプログラム
CN107636758B (zh) 声学回声消除***和方法
KR101655003B1 (ko) 능동 노이즈 소거 적응형 필터를 위한 사전-성형 직렬 필터
KR102025527B1 (ko) 이어스피커 채널들 중에서 적응형 잡음 제거(anc)의 조정된 제어
JP5293817B2 (ja) 音声信号処理装置及び音声信号処理方法
US9449593B2 (en) Detecting nonlinear amplitude processing
KR20160055871A (ko) 부 경로를 트레이닝하기 위해 내부 백색 잡음을 적응적으로 형성함으로써 적응형 잡음 소거를 위한 시스템들 및 방법들
WO2009117084A2 (en) System and method for envelope-based acoustic echo cancellation
TWI506620B (zh) 通訊裝置及其語音處理方法
CN103841491A (zh) 用于管理多个麦克风和扬声器的自适应***
KR102055701B1 (ko) 트랜듀서 임피던스에 기반한 비선형 음향 에코 소거
JP2006174456A (ja) 受信オーディオを制限するためのシステム
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
KR102190833B1 (ko) 에코 억제
JP2008309955A (ja) ノイズサプレス装置
JPWO2013054448A1 (ja) 音処理装置、音処理方法及びプログラム
US11303758B2 (en) System and method for generating an improved reference signal for acoustic echo cancellation
US20110116644A1 (en) Simulated background noise enabled echo canceller
JP2017216525A (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
CN112702460B (zh) 一种语音通信的回声消除方法及装置
JP5346350B2 (ja) 反響消去装置とその方法とプログラム
JP2015220482A (ja) 送受話端末、エコー消去システム、エコー消去方法、プログラム
JP2013005106A (ja) 場内拡声装置、場内拡声方法、及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151019

R150 Certificate of patent or registration of utility model

Ref document number: 5834948

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees