JP4478045B2 - Echo erasing device, echo erasing method, echo erasing program and recording medium therefor - Google Patents
Echo erasing device, echo erasing method, echo erasing program and recording medium therefor Download PDFInfo
- Publication number
- JP4478045B2 JP4478045B2 JP2005062995A JP2005062995A JP4478045B2 JP 4478045 B2 JP4478045 B2 JP 4478045B2 JP 2005062995 A JP2005062995 A JP 2005062995A JP 2005062995 A JP2005062995 A JP 2005062995A JP 4478045 B2 JP4478045 B2 JP 4478045B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency component
- signal
- amplitude spectrum
- echo
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Description
この発明は、例えば多チャネル音響再生系を有する通信会議システムに適用され、ハウリングの原因及び聴覚上の障害となる音響エコーを消去するエコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体に関するものである。 The present invention is applied to a communication conference system having, for example, a multi-channel sound reproduction system, and relates to an echo erasing apparatus, an echo erasing method, an echo erasing program, and a recording medium for erasing acoustic echoes that cause acoustic feedback and cause hearing problems Is.
図1に示すように、N(≧2の整数)チャンネルの再生信号x1(k)〜xN(k)がスピーカ11〜1Nからマイクロホン2へ回り込むエコーを消去した出力信号e(k)を生成する従来の多チャンネルエコー消去装置は、非特許文献1に記載する手法を用いて、スピーカ11〜1Nとマイクロホン2間のエコー経路のインパルス応答を要素として持つ長さ(即ちタップ数)Lのベクトルh1〜hNの疑似特性h^1(k)〜h^N(k)を保持する疑似エコー経路を適応フィルタ31〜3Nで実現している。ここで、kは、所定間隔の離散的な時刻を指す数(サンプル点の番号)である。サンプリングとは、アナログの音声信号をディジタル信号に変換するために変数のある区間の値を1つの代表する値に置き換えることで、たとえばサンプリング周波数16kHz(1秒間に16000回)で行われる。なお、スピーカ11〜1Nに与える信号、マイクロホン2で収音された信号はアナログ信号であり、以下の説明では、ディジタル信号を扱うので、それぞれDA変換器、AD変換器によって変換を行う必要があるが、それは当黙のことであり、図示していない。
As shown in FIG. 1, an output signal e (k) in which echoes N 1 (≧ 2) channel reproduction signals x 1 (k) to x N (k) cancel echoes that circulate from the
適応フイルタ31〜3Nは再生信号x1(k)〜xN(k)と疑似特性h^1(k)〜h^N(k)との畳み込み演算により疑似エコー信号d’1(k)〜d’N(k)を生成し、実際のエコー信号を含むマイクロホン2の収音信号(「エコー消去前信号」とも呼ぶ。)y(k)から減算することで、エコー消去装置の出力信号(「エコー消去信号」とも呼ぶ。)e(k)を出力する。再生信号x1(k)〜xN(k)と出力信号e(k)とを用いて、疑似特性h^1(k)〜h^N(k)の特性を随時更新し、適応フィルタ31〜3Nに設定する。
適応フィルタ31〜3Nにおいて、たとえば学習同定アルゴリズムを用いた場合の疑似特性h^1(k)〜h^N(k)の推定は、
The
In the
式(1)において、再生信号x1(k)〜xN(k)のチャンネル数と同数の疑似特性h^1(k)〜h^N(k)を随時更新しているため、演算量が飛躍的に増大するという問題点があった。また、適応フィルタ31〜3Nの収束には一定時間を要するため、学習途中において推定誤差が起こり、エコー推定精度が劣化するという問題点もあった。本発明の課題は、演算量を低減することによりハードウェアの規模を縮小し、瞬時にエコー抑圧を行うことで上記問題に起因するエコー消去装置の性能劣化を改善することである。
In the formula (1), since the updated reproduced signal x 1 (k) ~x N pseudo characteristic number of channels as many of (k) h ^ 1 (k ) ~h ^ N (k) from time to time, the amount of computation However, there was a problem that the number increased dramatically. In addition, since the convergence of the
本発明では、再生信号の総和の周波数成分と、収音信号の周波数成分を分析し、各周波数成分をグループ化し、当該グループごとに振幅比からエコーの振幅スペクトルを推定し、収音信号の周波数成分と推定されたエコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号の周波数成分を計算し、エコー消去信号の周波数成分を時間領域に変換して出力する。 In the present invention, the frequency component of the sum of the reproduction signal and the frequency component of the collected sound signal are analyzed, each frequency component is grouped, the amplitude spectrum of the echo is estimated from the amplitude ratio for each group, and the frequency of the collected sound signal The frequency component of the echo cancellation signal is calculated from the amplitude ratio of each frequency component of the echo amplitude spectrum estimated as the component, and the frequency component of the echo cancellation signal is converted into the time domain and output.
この発明によれば、収音信号周波数成分と推定エコー振幅スペクトルの振幅比のみを用いてエコー消去信号周波数成分を算出できるので、従来のような膨大な計算量となる多チャンネルの適応フィルタ演算を避けることができる。また、推定エコー振幅スペクトルをほぼ瞬時に算出することができるため、エコー消去精度が適応フィルタの収束精度に大きく依存するという従来の問題を解決できる。 According to the present invention, since the echo cancellation signal frequency component can be calculated using only the amplitude ratio of the collected sound signal frequency component and the estimated echo amplitude spectrum, the multi-channel adaptive filter calculation that requires a huge amount of calculation as in the prior art can be performed. Can be avoided. Moreover, since the estimated echo amplitude spectrum can be calculated almost instantaneously, the conventional problem that the echo cancellation accuracy greatly depends on the convergence accuracy of the adaptive filter can be solved.
以下にこの発明の実施形態を、図面を参照しながら説明するが、各図中の対応する部分は同一参照番号を付けて重複説明を省略する。
[第1実施形態]
図2は本発明のエコー消去装置100の機能構成例を示す図、図3は処理フローを示す図である。エコー消去装置100は、総和部4A、再生信号用の周波数分析部101、収音信号用の周波数分析部102、エコー振幅スペクトル計算部103、目的成分選択計算部104、および周波数合成部105から構成される。以下に、図2と図3とを参照しながら説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below with reference to the drawings. Corresponding portions in each drawing are given the same reference numerals, and redundant description is omitted.
[First Embodiment]
FIG. 2 is a diagram showing a functional configuration example of the
ステップS4A
総和部4Aでは、複数(N個、Nは2以上の整数)のチャンネルの再生信号x1(k)〜xN(k)を入力とし、各チャンネルの再生信号x1(k)〜xN(k)をサンプルごとに加算した加算再生信号x(k)=ΣN n=1xn(k)を出力する。ここで、kは、所定間隔の離散的な時刻を指す数(サンプル点の番号)である。サンプリングは、たとえばサンプリング周波数16kHz(1秒間に16000回)で行われる。
ステップS101
周波数分析部101は、加算再生信号x(k)を入力とし、各周波数成分の振幅スペクトルを加算再生信号振幅スペクトル|Xω|として出力する。ここで、ωは所定の周波数間隔で求めた振幅スペクトルの周波数成分の番号を示す数である。たとえば、16kHzでサンプリングした512個の加算再生信号x(k−511),…,x(k)を1フレームとし、加算再生信号x(k)をフレーム単位で、8kHzまでの周波数帯域をサンプル点数256で表した加算再生信号振幅スペクトル|Xω|(ω=1,…,256)へ変換する。
Step S4A
In the summing unit 4A, the reproduction signals x 1 (k) to x N (k) of a plurality of channels (N, N is an integer of 2 or more) are input, and the reproduction signals x 1 (k) to x N of each channel are input. (k) adding a reproduced signal obtained by adding each sample x (k) = Σ n n = outputs a 1 x n (k). Here, k is a number indicating the discrete time at a predetermined interval (number of sample points). Sampling is performed, for example, at a sampling frequency of 16 kHz (16000 times per second).
Step S101
The
ステップS102
周波数分析部102は、収音信号y(k)を入力とし、各周波数成分の収音信号振幅スペクトル|Yω|と位相スペクトルarg(Yω)を出力する。kおよびωはステップS101での説明と同じである。またarg(Yω)は0以上2π未満の実数である。
ステップS103
エコー振幅スペクトル計算部103は、入力の加算再生信号振幅スペクトル|Xω|と収音信号振幅スペクトル|Yω|から、推定エコー振幅スペクトル|D^ω|を出力とする。ステップS1031からS1034は、M個(Mは2以上の整数)の周波数成分のグループごとに行い、すべてのm(1≦m≦M)の処理が終了するとステップS1035へ進む(ステップS1037、S1038、S1039により、周波数グループ単位の繰り返し処理を行っている。)。たとえば、ω=1,…,256、M=32の場合は、8個のω(ω=8m−7,…,8m)の各周波数成分が1つのグループとなる。内部の具体的な処理手順は以下の通りである。
Step S102
The
Step S103
The echo amplitude
ステップS1031
周波数グループ中の複数個の|Yω(j)|(たとえば、1つのグループが8個のωで構成されている場合には、|Y8m−7(j)|,…,|Y8m(j)|)のうちの最大値とその最大値をとるωYmを求める。
次に、周波数グループ中の複数個の|Xω(j)|(たとえば、1つのグループが8個のωで構成されている場合には、|X8m−7(j)|,…,|X8m(j)|)から、フレームjでの残響付加再生信号振幅スペクトル
Step S1031
A plurality of | Y ω (j) | in the frequency group (for example, when one group is composed of 8 ω, | Y 8m-7 (j) |,..., | Y 8m ( j) Find the maximum value of |) and ω Ym that takes the maximum value.
Next, a plurality of | X ω (j) | in the frequency group (for example, | X 8m−7 (j) |,. X 8m (j) |), the reverberation-added reproduction signal amplitude spectrum in frame j
このように周波数グループm内の全てのωに対して求めた残響付加再生信号振幅スペクトル(たとえば、1つのグループが8個のωで構成されている場合には、
Thus, the reverberation-added reproduction signal amplitude spectrum obtained for all ω in the frequency group m (for example, when one group is composed of 8 ω,
次に、暫定補正量zm(j)を
ステップS1032
次に、ステップS1035で用いる変形補正量cm(j)を、たとえば以下の2つの条件(条件1、条件2)の組合せによる判断で求める。
Next, the provisional correction amount z m (j) is set to
Step S1032
Next, the deformation correction amount c m (j) used in step S1035 is obtained by determination based on, for example, a combination of the following two conditions (
条件1:グループm(1≦m≦M)での残響付加再生信号振幅スペクトルが最大となるωXmと収音信号周波数成分振幅スペクトルが最大となるωYmが一致し、かつ当該ωでの2つの振幅スペクトルがあらかじめ定めた所定の閾値以上の値を持つ。
あらかじめ定める閾値とは、エコー消去装置100を使用する環境の雑音などによって異なり、音として認識できる程度の値(たとえば、60dBm、1000など)である。
条件2:暫定補正量zm(j)が、cm(j−1)と比較してあらかじめ定めた範囲以内(たとえば、0.5・cm(j−1)<zm(j)<2・cm(j−1))である。
Condition 1: ω Xm that maximizes the reverberation-added reproduction signal amplitude spectrum in group m (1 ≦ m ≦ M) matches ω Ym that maximizes the collected signal frequency component amplitude spectrum, and 2 at the ω. One amplitude spectrum has a value equal to or greater than a predetermined threshold value.
The predetermined threshold value is a value that can be recognized as a sound (for example, 60 dBm, 1000, etc.) depending on the noise of the environment in which the
Condition 2: The provisional correction amount z m (j) is within a predetermined range as compared with c m (j−1) (for example, 0.5 · c m (j−1) <z m (j) < 2 · c m (j−1)).
ここで、範囲を定めるのは、本発明ではチャンネル間の位相差を検出(計算)していないため、2つ以上の音が強めあう場合や弱めあう場合があるが、このような特定の周波数での誤動作、および近端話者(マイクロホン2に対する話者)が話した場合に、話者の成分でcm(j)が大きくなりすぎたり小さくなりすぎたりすることを避けるためである。
上記の2つの条件(条件1、条件2)とも満たす場合にはステップS1033へ進み、どちらか一方でも条件を満たさない場合にはステップS1034へ進む。
ステップS1033
ステップS1032の条件を満足する場合は、ステップS1031で求めた暫定補正量zm(j)を変形補正量cm(j)とする。ここで求めた変形補正量cm(j)は次フレームのS1032およびS1034で前フレームの変形補正量として用いるために記憶しておく。
Here, the range is determined because the phase difference between channels is not detected (calculated) in the present invention, and two or more sounds may be strengthened or weakened. This is for avoiding the malfunction of, and when the near-end speaker (speaker to the microphone 2) speaks, c m (j) becomes too large or too small due to the speaker component.
If both of the above two conditions (
Step S1033
When the condition of step S1032 is satisfied, the provisional correction amount z m (j) obtained in step S1031 is set as the deformation correction amount c m (j). The deformation correction amount c m (j) obtained here is stored for use as the deformation correction amount of the previous frame in S1032 and S1034 of the next frame.
ステップS1034
ステップS1032の条件を満足しない場合は、前フレームで用いた変形補正量cm(j−1)を変形補正量cm(j)とする。ここで求めた変形補正量cm(j)は次フレームのS1032およびS1034で前フレームの変形補正量として用いるために記憶しておく。
ステップS1031からステップS1034は、周波数成分のグループmごとに行ない、すべてのm(1≦m≦M)の処理が終了するとステップS1035へ進む。
Step S1034
If the condition of step S1032 is not satisfied, the deformation correction amount cm (j-1) used in the previous frame is set as the deformation correction amount cm (j). The deformation correction amount c m (j) obtained here is stored for use as the deformation correction amount of the previous frame in S1032 and S1034 of the next frame.
Steps S1031 to S1034 are performed for each frequency component group m. When all m (1 ≦ m ≦ M) processing is completed, the process proceeds to step S1035.
ステップS1035
各周波数成分ωごとの推定エコー振幅スペクトル|D^ω|(すなわち、|D^1|,…,|D^256|)を
Step S1035
Estimated echo amplitude spectrum | D ^ ω | (that is, | D ^ 1 |, ..., | D ^ 256 |) for each frequency component ω
ステップS104
目的成分選択計算部104では、エコー消去信号振幅スペクトル|Eω|を周波数成分ωごとに、
Step S104
The target component
なお、既存の再生信号のシングルトーク検出装置200を利用して、再生信号のシングルトーク状態(近端話者が話していない状態)を検出したとき(ステップS200)、式(4)のエコー消去信号振幅スペクトル|Eω|を振幅比ΔAωに関わらず0にする方法もある。
When a single talk state of the reproduction signal (a state where the near-end speaker is not speaking) is detected using the existing reproduction signal single talk detection device 200 (step S200), the echo cancellation of equation (4) is performed. There is also a method of setting the signal amplitude spectrum | E ω | to 0 regardless of the amplitude ratio ΔA ω .
ステップS105
周波数合成部105では、ステップS104で求めた各周波数成分ωに対応するエコー消去信号振幅スペクトル|Eω|とステップS102で求めた位相スペクトルarg(Yω)から、時間領域の信号e(k)を再合成して出力する。
[第2実施形態]
第1実施形態では複数の再生信号x1(k)〜xN(k)を加算した後に周波数分析したが、本発明では、それぞれの再生信号を周波数分析した後に、周波数成分ωごとに加算する点が異なる。このように先に再生信号ごとの周波数分析を行うことで、周波数分析部の数は多くなるが、再生信号間の位相差による強めあいや弱めあいの影響を避けることができる。図4にエコー消去装置100’の機能構成例、図5に処理フローを示す。
Step S105
In the
[Second Embodiment]
In the first embodiment, the frequency analysis is performed after adding a plurality of reproduction signals x 1 (k) to x N (k). However, in the present invention, each reproduction signal is subjected to frequency analysis and then added for each frequency component ω. The point is different. Thus, by performing frequency analysis for each reproduction signal first, the number of frequency analysis units increases, but the influence of strengthening and weakening due to the phase difference between the reproduction signals can be avoided. FIG. 4 shows a functional configuration example of the
第1実施形態と異なる点のみについて、以下に説明する。
エコー消去装置100’は、第1実施形態のエコー消去装置100の総和部4Aと周波数分析部101の代わりに、複数の周波数分析部1011〜101Nと総和部4Bを備えている。
ステップS101およびS1017〜S1019
ハードウェアとして周波数分析部を構成する場合には、N個の周波数分析部1011〜101Nが存在し、再生信号x1(k)〜xN(k)をそれぞれ周波数分析し、再生信号振幅スペクトル|X1ω|〜|XNω|を得る。一方、周波数分析部がソフトウェアによって構成される場合には、N回の繰り返し処理によってN個の再生信号x1(k)〜xN(k)からN個の再生信号振幅スペクトル|X1ω|〜|XNω|を得る。図5の処理フローでは、ソフトウェアによって構成した場合を示しており、ステップS1017〜S1019の繰り返し処理によって、N回の周波数分析が行われている。
Only differences from the first embodiment will be described below.
The
Steps S101 and S1017 to S1019
When configuring the frequency analyzer as a hardware, there are N
ステップS4B
総和部4Bでは、再生信号振幅スペクトル|X1ω|〜|XNω|を入力とし、周波数ごとに振幅スペクトルを加算し、加算再生信号振幅スペクトル|Xω|を
Step S4B
In the summation unit 4B, the reproduction signal amplitude spectrum | X 1ω | to | X Nω | is input, the amplitude spectrum is added for each frequency, and the addition reproduction signal amplitude spectrum | X ω |
残りの処理は、第1実施形態と同じである。
[第3実施形態]
再生信号のシングルトーク時には、収音信号y(k)は再生信号x1(k)〜xN(k)のエコーと雑音のみから構成されているため、式(5)の振幅比ΔAωは1に近い値となるはずである。もし、振幅比ΔAωが1/β未満になる周波数成分が存在すれば、それは推定エコー振幅スペクトル|D^ω|の誤推定により、変形補正量cmの設定が小さすぎるためである。このような特定の周波数成分の変形補正量cmが小さすぎると、ミュージカルノイズが発生する原因となるため、本実施形態では、変形補正量cmを増加させる処理を加える。具体的には、エコー消去装置100または100’の目的成分選択計算部104での処理を以下のように変更する。本実施形態での処理フローを図6に示す。なお、図6は第1実施形態からの変更例を示しているが、第2実施形態の場合にも同じように適用できる。
The remaining processing is the same as in the first embodiment.
[Third Embodiment]
At the time of single talk of the reproduction signal, the collected sound signal y (k) is composed only of echoes and noises of the reproduction signals x 1 (k) to x N (k), and therefore the amplitude ratio ΔA ω in Expression (5) is The value should be close to 1. If there is a frequency component at which the amplitude ratio ΔA ω is less than 1 / β, this is because the setting of the deformation correction amount cm is too small due to erroneous estimation of the estimated echo amplitude spectrum | D ^ ω |. If the deformation correction amount cm of such a specific frequency component is too small, musical noise is generated. In the present embodiment, processing for increasing the deformation correction amount cm is added. Specifically, the processing in the target component
ステップS1042の追加
目的成分選択計算部104では、振幅比ΔAωが1/β未満になる周波数成分が存在するか否かを確認する。そのような周波数成分がない場合にはステップS104に進み、条件を満足する周波数成分がある場合には、ステップS1043に進む。
ステップS1043の追加
目的成分選択計算部104では、変形補正量cm(j)を増加させる処理として、たとえば、
The additional target component
In the additional target component
このように増加された変形補正量cm(j)を記録し、次フレームでの暫定補正量zm(j+1)の計算やステップS1034の処理に使用される。
残りの処理は第1実施形態および第2実施形態と同じである。
[第4実施形態]
わずかな推定誤差が含まれることによってもミュージカルノイズや近端話者の音がこもるなどの問題が発生する。本実施形態では、このような問題を解決するための手法として、一般的に使用されている原音付加の方法を適用した場合を示す。図7にエコー消去装置100または100’の変更する部分を示す。この原音付加の方法は、第1実施形態から第3実施形態までの実施形態と組み合わせることができるが、図8には第2実施形態と組み合わせた処理フローを示す。
Thus recording the increased deformation correction amount c m (j), it is used to process the calculation and step S1034 of the provisional correction amount in the next frame z m (j + 1).
The remaining processes are the same as those in the first and second embodiments.
[Fourth Embodiment]
Even if a slight estimation error is included, problems such as musical noise and near-end speaker's sound occur. In this embodiment, as a technique for solving such a problem, a case where a generally used method for adding original sound is applied is shown. FIG. 7 shows a part to be changed of the
ステップS5Aの追加
積算部5Aでは、収音信号振幅スペクトル|Yω|に(1−α)を積算する。ここで、αはエコー消去信号振幅スペクトル|Eω|と収音信号振幅スペクトル|Yω|との比をあらかじめ定める値であり、たとえば、α=0.99などの値である。
ステップS5Bの追加
積算部5Bでは、エコー消去信号振幅スペクトル|Eω|にαを積算する。
ステップS6の追加
加算部6では、積算部5Aからの出力と積算部5Bからの出力とを加算する。
In the
Adding
The additional adding
残りの処理は第1実施形態、第2実施形態、および第3実施形態と同じである。
[第5実施形態]
本実施形態では、再生信号のシングルトーク状態か否かの判断手段1041を目的成分選択計算部104’に追加している。この機能構成例を図9、10に示す。この方法の場合、図2および図4に示したシングルトーク検出装置200は不要である。図9は第1実施形態から変更した場合であり、図10は第2実施形態から変更した場合である。図11は図9の機能構成例(第1実施形態からの変更)の場合の処理フローを示す図である。図10の機能構成例の場合も、変更箇所は同じであり、再生信号のシングルトーク検出(ステップS1041)を追加するだけである。
The remaining processes are the same as those in the first embodiment, the second embodiment, and the third embodiment.
[Fifth Embodiment]
In this embodiment, a determination means 1041 for determining whether or not the reproduction signal is in a single talk state is added to the target component
ステップS1041
目的成分選択計算部104’のシングルトーク判断手段1041では、すべての周波数成分の振幅比ΔAωが1/β’以上の時、再生信号のシングルトーク状態と判断し、シングルトーク状態であることを示す情報を出力する。ここで、β’はあらかじめ定める値であり、たとえばβ’=10のようなβよりも大きな値を設定する。
目的成分選択計算部104’で行う、ステップS1042やステップS104では、このシングルトーク状態か否かを示す情報を用いて、これらの処理を行う。
Step S1041
The single talk determination means 1041 of the target component
In step S1042 and step S104 performed by the target component
残りの処理は第1実施形態、第2実施形態、第3実施形態、および第4実施形態と同じである。
なお、本発明のすべての実施形態は、上記の処理手順の全部または一部を、コンピュータと当該コンピュータを動作させるプログラムによっても実行することができる。また、当該プログラムはコンピュータ読み取り可能な記録媒体に記録しておき、必要に応じてコンピュータに読み取らせて実行することも可能である。
[実験例]
実験では、第2実施形態に第3実施形態から第5実施形態での変更を適用したエコー消去装置を用いて従来方法との違いを確認した。図12は本実験で使用したエコー処理装置の処理フローを示す図である。
The remaining processes are the same as those in the first embodiment, the second embodiment, the third embodiment, and the fourth embodiment.
In all the embodiments of the present invention, all or a part of the above-described processing procedure can be executed by a computer and a program for operating the computer. Further, the program can be recorded on a computer-readable recording medium, and can be read and executed by a computer as necessary.
[Experimental example]
In the experiment, the difference from the conventional method was confirmed using an echo canceller that applied the changes in the third to fifth embodiments to the second embodiment. FIG. 12 is a diagram showing a processing flow of the echo processing apparatus used in this experiment.
なお、サンプリング周波数は16kHzとし、残響時間200msの部屋で実測したインパルス応答を2048点で打ち切り、与えた。本発明のエコー消去装置では、周波数分析点数を512点、周波数帯域のグループ数を32、ξ=0.7、ν=0.4、β=2.5、β’=10と設定した。なお、適応フィルタはステップサイズ0.5、タップ数L=2048の学習同定アルゴリズムとし、送話音声存在区間で適応を停止させた。
図13に各信号の時間波形を、図14に各信号をパワーエンベローブに変換したエコー抑圧量を示す。図13で、Aはエコー信号を、Bは送話信号を、Cは適応フィルタによるエコー消去信号を、Dは本発明のエコー消去方法によるエコー消去信号を示している。図14では、点線は収音信号、細線は適応フィルタによるエコー消去の比率、太線は本発明のエコー消去方法によるエコー消去の比率を示している。また、区間(1)は受話シングルトーク状態、区間(2)は送話シングルトーク状態、区間(3)はダブルトーク状態、区間(4)はステレオ信号の相関による適応フィルタの誤収束の影響を確認するために左右の再生信号を入れ替えた受話シングルトーク状態である。
The sampling frequency was 16 kHz, and impulse responses measured in a room with a reverberation time of 200 ms were cut off at 2048 points. In the echo canceller of the present invention, the number of frequency analysis points is set to 512, the number of frequency band groups is set to 32, ξ = 0.7, ν = 0.4, β = 2.5, and β ′ = 10. Note that the adaptive filter is a learning identification algorithm with a step size of 0.5 and the number of taps L = 2048, and the adaptation is stopped in the transmission voice existence section.
FIG. 13 shows a time waveform of each signal, and FIG. 14 shows an echo suppression amount obtained by converting each signal into a power envelope. In FIG. 13, A is an echo signal, B is a transmission signal, C is an echo cancellation signal by an adaptive filter, and D is an echo cancellation signal by the echo cancellation method of the present invention. In FIG. 14, the dotted line indicates the collected sound signal, the thin line indicates the ratio of echo cancellation by the adaptive filter, and the thick line indicates the ratio of echo cancellation by the echo cancellation method of the present invention. In addition, the section (1) is the received single talk state, the section (2) is the transmitted single talk state, the section (3) is the double talk state, and the section (4) is the influence of the misconvergence of the adaptive filter due to the correlation of the stereo signal. In order to confirm, it is an incoming single talk state in which left and right reproduction signals are switched.
図14より、区間(1)において、本発明によるエコー抑圧量は約40dBに達し、適応フィルタと比べて少なくとも約30dBエコーを低減している。区間(2)では、出力信号の波形が送話信号の波形とほぼ同じであり、送話音声に悪影響が無いことが確認できる。区間(4)では、本発明のエコー消去方法が瞬時にエコーを40dB程度抑圧し、エコー経路の変動に頑健であることが分かる。これに対し、適応フィルタでは残留エコーが区間の初期には多いことが分かる。図13の区間(3)では、本発明のエコー消去方法は、送話信号の波形をほぼ復元していることが分かる。また、内観聴取からミュージカルノイズがほとんど無いことも確認した。このように、本発明のエコー消去方法を用いることで、使用する部屋の環境の変化などにも即応でき、送話音声パワーを保持したままでエコーを抑圧できることが分かった。 From FIG. 14, in the section (1), the echo suppression amount according to the present invention reaches about 40 dB, and at least about 30 dB echo is reduced as compared with the adaptive filter. In section (2), the waveform of the output signal is almost the same as the waveform of the transmission signal, and it can be confirmed that there is no adverse effect on the transmission voice. In section (4), it can be seen that the echo cancellation method of the present invention instantaneously suppresses the echo by about 40 dB, and is robust to fluctuations in the echo path. On the other hand, it can be seen that the adaptive filter has many residual echoes at the beginning of the interval. In section (3) of FIG. 13, it can be seen that the echo cancellation method of the present invention almost restores the waveform of the transmitted signal. In addition, it was also confirmed from the introspection that there was almost no musical noise. Thus, it has been found that by using the echo canceling method of the present invention, it is possible to immediately respond to changes in the environment of the room used, and to suppress echoes while maintaining the transmission voice power.
Claims (16)
上記加算再生信号を周波数領域に変換し、周波数成分の分析を行い、加算再生信号振幅スペクトルを出力する第1の周波数分析部と、
入力された収音信号を周波数領域に変換し、周波数成分の分析を行い、収音信号周波数成分を出力する第2の周波数分析部と、
上記加算再生信号振幅スペクトルと上記収音信号周波数成分をそれぞれ複数成分から構成されるグループに分け、当該グループごとに、グループ内で最大となる上記加算再生信号振幅スペクトルと該グループ内で最大となる上記収音信号周波数成分の値との振幅比から該グループのエコーの振幅スペクトルである推定エコー振幅スペクトルを推定し出力するエコー振幅スペクトル計算部と、
上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号周波数成分を出力する目的成分選択計算部と、
上記エコー消去信号周波数成分を時間領域に変換し、出力信号を出力する周波数合成部と、
を備えるエコー消去装置。 A summing unit for adding the input reproduction signals of a plurality of channels and outputting the addition reproduction signal;
A first frequency analysis unit that converts the addition reproduction signal into a frequency domain, analyzes a frequency component, and outputs an addition reproduction signal amplitude spectrum;
A second frequency analysis unit that converts the input sound pickup signal into a frequency domain, analyzes the frequency component, and outputs the sound pickup signal frequency component;
The additive reproduction signal amplitude spectrum and the collected sound signal frequency component are divided into groups each composed of a plurality of components, and for each group, the additive reproduction signal amplitude spectrum that is maximum in the group and maximum in the group. An echo amplitude spectrum calculation unit that estimates and outputs an estimated echo amplitude spectrum that is an amplitude spectrum of the echo of the group from an amplitude ratio with the value of the collected sound signal frequency component ;
A target component selection calculator that outputs an echo cancellation signal frequency component from an amplitude ratio for each frequency component of the collected sound signal frequency component and the estimated echo amplitude spectrum;
A frequency synthesizer that converts the echo cancellation signal frequency component into a time domain and outputs an output signal;
An echo canceller comprising:
複数チャンネルの上記再生信号振幅スペクトルを加算し、加算再生信号振幅スペクトルを出力する総和部と、
入力された収音信号を周波数領域に変換し、周波数成分の分析を行い、収音信号周波数成分を出力する第2の周波数分析部と、
上記加算再生信号振幅スペクトルと上記収音信号周波数成分をそれぞれ複数成分から構成されるグループに分け、当該グループごとに、グループ内で最大となる上記加算再生信号振幅スペクトルと該グループ内で最大となる上記収音信号周波数成分の値との振幅比から該グループのエコーの振幅スペクトルである推定エコー振幅スペクトルを推定し出力するエコー振幅スペクトル計算部と、
上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号周波数成分を出力する目的成分選択計算部と、
上記エコー消去信号周波数成分を時間領域に変換し、出力信号を出力する周波数合成部と、
を備えるエコー消去装置。 A first frequency analyzer that converts the input reproduction signals of a plurality of channels into a frequency domain for each channel, analyzes a frequency component, and outputs a reproduction signal amplitude spectrum;
A summing unit for adding the reproduced signal amplitude spectra of a plurality of channels and outputting an added reproduced signal amplitude spectrum;
A second frequency analysis unit that converts the input sound pickup signal into a frequency domain, analyzes the frequency component, and outputs the sound pickup signal frequency component;
The additive reproduction signal amplitude spectrum and the collected sound signal frequency component are divided into groups each composed of a plurality of components, and for each group, the additive reproduction signal amplitude spectrum that is maximum in the group and maximum in the group. An echo amplitude spectrum calculation unit that estimates and outputs an estimated echo amplitude spectrum that is an amplitude spectrum of the echo of the group from an amplitude ratio with the value of the collected sound signal frequency component ;
A target component selection calculator that outputs an echo cancellation signal frequency component from an amplitude ratio for each frequency component of the collected sound signal frequency component and the estimated echo amplitude spectrum;
A frequency synthesizer that converts the echo cancellation signal frequency component into a time domain and outputs an output signal;
An echo canceller comprising:
再生信号のシングルトークか否かの状態を示す信号も入力でき、再生信号のシングルトーク状態の場合に、エコー消去信号周波数成分を0として出力する上記目的成分選択計算部
を備えるエコー消去装置。 The echo canceller according to claim 1 or 2, wherein
An echo canceling device comprising the above-described target component selection calculating unit that can also input a signal indicating whether or not a single talk of a reproduction signal is input and outputs the echo canceling signal frequency component as 0 in the case of a single talk state of the reproduction signal.
上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比から再生信号のシングルトークか否かの状態を判断する手段を有し、再生信号のシングルトーク状態の場合に、エコー消去信号周波数成分を0として出力する上記目的成分選択計算部
を備えるエコー消去装置。 The echo canceller according to claim 1 or 2, wherein
A means for determining whether or not the reproduced signal is in single talk from the amplitude ratio of each frequency component of the collected sound signal and the estimated echo amplitude spectrum, and echo cancellation in the case of a single talk state of the reproduced signal. An echo canceller comprising the target component selection calculation unit that outputs a signal frequency component as zero.
上記加算再生信号を所定の時間長のフレーム単位で周波数領域に変換し、周波数成分の分析を行い、加算再生信号振幅スペクトルを出力する第1の周波数分析部と、
入力された収音信号をフレーム単位で周波数領域に変換し、周波数成分の分析を行い、収音信号周波数成分を出力する第2の周波数分析部と、
上記加算再生信号振幅スペクトルと上記収音信号周波数成分をそれぞれ複数成分から構成されるグループに分け、当該グループごとに、グループ内で最大となる上記加算再生信号振幅スペクトルに対する該グループ内で最大となる上記収音信号周波数成分の値の振幅比と過去のフレームの補正量とから現フレームに対する補正量を算出し、現フレームに対する補正量を上記加算再生信号振幅スペクトルに乗算することにより推定エコー振幅スペクトルを推定し出力するエコー振幅スペクトル計算部と、
上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号周波数成分を出力すると共に、上記再生信号のシングルトーク状態の場合であって、上記収音信号周波数成分と上記推定エコー振幅スペクトルとの振幅比があらかじめ定めた値未満の時に、現フレームに対する補正量を増加させたものを次フレーム以降の補正量算出のための補正量とする目的成分選択計算部と、
上記エコー消去信号周波数成分を時間領域に変換し、出力信号を出力する周波数合成部と、
を備えるエコー消去装置。 A summing unit for adding the input reproduction signals of a plurality of channels and outputting the addition reproduction signal;
A first frequency analysis unit that converts the addition reproduction signal into a frequency domain in a frame unit of a predetermined time length, analyzes a frequency component, and outputs an addition reproduction signal amplitude spectrum;
A second frequency analysis unit that converts the input sound pickup signal into a frequency domain in units of frames, analyzes the frequency component, and outputs the sound pickup signal frequency component;
The additive reproduction signal amplitude spectrum and the collected sound signal frequency component are divided into groups each composed of a plurality of components, and each group has the maximum in the group with respect to the additive reproduction signal amplitude spectrum that is maximum in the group. An estimated echo amplitude spectrum is calculated by calculating a correction amount for the current frame from the amplitude ratio of the value of the collected sound signal frequency component and the correction amount of the past frame, and multiplying the additional reproduction signal amplitude spectrum by the correction amount for the current frame. An echo amplitude spectrum calculation unit for estimating and outputting
An echo cancellation signal frequency component is output from an amplitude ratio for each frequency component of the collected sound signal frequency component and the estimated echo amplitude spectrum, and the reproduced signal is in a single talk state, and the collected sound signal frequency component and when less than a value amplitude ratio is predetermined between the estimated echo magnitude spectrum, purpose component selection calculating section shall be the correction amount for the correction amount for the next frame after those increasing the correction amount calculation for the current frame When,
A frequency synthesizer that converts the echo cancellation signal frequency component into a time domain and outputs an output signal ;
An echo canceller comprising:
複数チャンネルの上記再生信号振幅スペクトルを加算し、加算再生信号振幅スペクトルを出力する総和部と、 A summing unit for adding the reproduced signal amplitude spectra of a plurality of channels and outputting an added reproduced signal amplitude spectrum;
入力された収音信号をフレーム単位で周波数領域に変換し、周波数成分の分析を行い、収音信号周波数成分を出力する第2の周波数分析部と、 A second frequency analysis unit that converts the input sound pickup signal into a frequency domain in units of frames, analyzes the frequency component, and outputs the sound pickup signal frequency component;
上記加算再生信号振幅スペクトルと上記収音信号周波数成分をそれぞれ複数成分から構成されるグループに分け、当該グループごとに、グループ内で最大となる上記加算再生信号振幅スペクトルに対する該グループ内で最大となる上記収音信号周波数成分の値の振幅比と過去のフレームの補正量とから現フレームに対する補正量を算出し、現フレームに対する補正量を上記加算再生信号振幅スペクトルに乗算することにより推定エコー振幅スペクトルを推定し出力するエコー振幅スペクトル計算部と、 The additive reproduction signal amplitude spectrum and the collected sound signal frequency component are divided into groups each composed of a plurality of components, and each group has the maximum in the group with respect to the additive reproduction signal amplitude spectrum that is maximum in the group. An estimated echo amplitude spectrum is calculated by calculating a correction amount for the current frame from the amplitude ratio of the value of the collected sound signal frequency component and the correction amount of the past frame, and multiplying the additional reproduction signal amplitude spectrum by the correction amount for the current frame. An echo amplitude spectrum calculation unit for estimating and outputting
上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号周波数成分を出力すると共に、上記再生信号のシングルトーク状態の場合であって、上記収音信号周波数成分と上記推定エコー振幅スペクトルとの振幅比があらかじめ定めた値未満の時に、現フレームに対する補正量を増加させたものを次フレーム以降の補正量算出のための補正量とする目的成分選択計算部と、 An echo cancellation signal frequency component is output from an amplitude ratio for each frequency component of the collected sound signal frequency component and the estimated echo amplitude spectrum, and the reproduced signal is in a single talk state, and the collected sound signal frequency component and When the amplitude ratio with the estimated echo amplitude spectrum is less than a predetermined value, a target component selection calculation unit that sets the correction amount for the current frame as a correction amount for calculating the correction amount for the next frame and thereafter,
上記エコー消去信号周波数成分を時間領域に変換し、出力信号を出力する周波数合成部と、 A frequency synthesizer that converts the echo cancellation signal frequency component into a time domain and outputs an output signal;
を備えるエコー消去装置。 An echo canceller comprising:
エコー消去信号周波数成分にあらかじめ定めた第1の係数を乗ずる第1の積算部と、
収音信号周波数成分にあらかじめ定めた第2の係数を乗ずる第2の積算部と、
上記第1の積算部の出力と、上記第2の積算部の出力とを加算する加算部も備え、
上記加算部からの出力を時間領域に変換し、出力信号を出力する周波数合成部
を備えるエコー消去装置。 The echo canceller according to any one of claims 1 to 6 ,
A first integration unit that multiplies the echo cancellation signal frequency component by a predetermined first coefficient;
A second integration unit that multiplies the sound collection signal frequency component by a predetermined second coefficient;
An addition unit for adding the output of the first integration unit and the output of the second integration unit;
An echo canceller comprising: a frequency synthesizer that converts an output from the adder into a time domain and outputs an output signal.
第1の周波数分析部で、上記加算再生信号を周波数領域に変換し、周波数成分の分析を行い、加算再生信号振幅スペクトルを出力し、
第2の周波数分析部で、入力された収音信号を周波数領域に変換し、周波数成分の分析を行い、収音信号周波数成分を出力し、
エコー振幅スペクトル計算部で、上記加算再生信号振幅スペクトルと上記収音信号周波数成分をそれぞれ複数成分から構成されるグループに分け、当該グループごとに、グループ内で最大となる上記加算再生信号振幅スペクトルと該グループ内で最大となる上記収音信号周波数成分の値との振幅比から該グループのエコーの振幅スペクトルである推定エコー振幅スペクトルを推定し出力し、
目的成分選択計算部で、上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号周波数成分を出力し、
周波数合成部で、上記エコー消去信号周波数成分を時間領域に変換し、出力信号を出力する、
ことを備えるエコー消去方法。 The summation unit adds the input playback signals of multiple channels and outputs the added playback signal.
In the first frequency analysis unit, the addition reproduction signal is converted into the frequency domain, the frequency component is analyzed, and the addition reproduction signal amplitude spectrum is output,
In the second frequency analysis unit, the input sound pickup signal is converted into the frequency domain, the frequency component is analyzed, and the sound pickup signal frequency component is output,
The echo amplitude spectrum calculation unit divides the additional reproduction signal amplitude spectrum and the collected sound signal frequency component into groups each composed of a plurality of components, and for each group, the additional reproduction signal amplitude spectrum that is maximum in the group, Estimating and outputting an estimated echo amplitude spectrum, which is an amplitude spectrum of the echo of the group, from an amplitude ratio with the value of the collected sound signal frequency component that is maximum within the group ;
The target component selection calculation unit outputs an echo cancellation signal frequency component from the amplitude ratio of each frequency component of the collected sound signal frequency component and the estimated echo amplitude spectrum,
In the frequency synthesizer, the echo cancellation signal frequency component is converted into the time domain and an output signal is output.
An echo cancellation method comprising:
総和部で、複数チャンネルの上記再生信号振幅スペクトルを加算し、加算再生信号振幅スペクトルを出力し、
第2の周波数分析部で、入力された収音信号を周波数領域に変換し、周波数成分の分析を行い、収音信号周波数成分を出力し、
エコー振幅スペクトル計算部で、上記加算再生信号振幅スペクトルと上記収音信号周波数成分をそれぞれ複数成分から構成されるグループに分け、当該グループごとに、グループ内で最大となる上記加算再生信号振幅スペクトルと該グループ内で最大となる上記収音信号周波数成分の値との振幅比から該グループのエコーの振幅スペクトルである推定エコー振幅スペクトルを推定し出力し、
目的成分選択計算部で、上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号周波数成分を出力し、
周波数合成部で、上記エコー消去信号周波数成分を時間領域に変換し、出力信号を出力する、
ことを備えるエコー消去方法。 In the first frequency analysis unit, the input reproduction signal of a plurality of channels is converted into a frequency domain for each channel, the frequency component is analyzed, and the reproduction signal amplitude spectrum is output,
In the summation unit, add the reproduction signal amplitude spectrum of multiple channels, and output the addition reproduction signal amplitude spectrum,
In the second frequency analysis unit, the input sound pickup signal is converted into the frequency domain, the frequency component is analyzed, and the sound pickup signal frequency component is output,
The echo amplitude spectrum calculation unit divides the additional reproduction signal amplitude spectrum and the collected sound signal frequency component into groups each composed of a plurality of components, and for each group, the additional reproduction signal amplitude spectrum that is maximum in the group, Estimating and outputting an estimated echo amplitude spectrum, which is an amplitude spectrum of the echo of the group, from an amplitude ratio with the value of the collected sound signal frequency component that is maximum within the group ;
The target component selection calculation unit outputs an echo cancellation signal frequency component from the amplitude ratio of each frequency component of the collected sound signal frequency component and the estimated echo amplitude spectrum,
In the frequency synthesizer, the echo cancellation signal frequency component is converted into the time domain and an output signal is output.
An echo cancellation method comprising:
上記目的成分選択計算部で、再生信号のシングルトークか否かの状態を示す信号を受信し、再生信号のシングルトーク状態の場合に、エコー消去信号周波数成分を0として出力する
ことを特徴とするエコー消去方法。 The echo cancellation method according to claim 8 or 9 , wherein
The target component selection calculation unit receives a signal indicating whether or not the reproduction signal is in single talk, and outputs the echo cancellation signal frequency component as 0 when the reproduction signal is in single talk state. Echo cancellation method.
上記目的成分選択計算部で、上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比から再生信号のシングルトークか否かの状態を判断し、再生信号のシングルトーク状態の場合に、エコー消去信号周波数成分を0として出力する
ことを特徴とするエコー消去方法。 The echo cancellation method according to claim 8 or 9 , wherein
In the case of the single talk state of the reproduction signal, the target component selection calculation unit determines whether or not the reproduction signal is a single talk from the amplitude ratio of each frequency component of the collected sound signal frequency and the estimated echo amplitude spectrum. And outputting an echo cancellation signal frequency component as zero.
第1の周波数分析部で、上記加算再生信号を所定の時間長のフレーム単位で周波数領域に変換し、周波数成分の分析を行い、加算再生信号振幅スペクトルを出力し、
第2の周波数分析部で、入力された収音信号をフレーム単位で周波数領域に変換し、周波数成分の分析を行い、収音信号周波数成分を出力し、
エコー振幅スペクトル計算部で、上記加算再生信号振幅スペクトルと上記収音信号周波数成分をそれぞれ複数成分から構成されるグループに分け、当該グループごとに、グループ内で最大となる上記加算再生信号振幅スペクトルに対する該グループ内で最大となる上記収音信号周波数成分の値の振幅比と過去のフレームの補正量とから現フレームに対する補正量を算出し、現フレームに対する補正量を上記加算再生信号振幅スペクトルに乗算することにより推定エコー振幅スペクトルを推定し出力し、
目的成分選択計算部で、上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号周波数成分を出力すると共に、上記再生信号のシングルトーク状態の場合であって、上記収音信号周波数成分と上記推定エコー振幅スペクトルとの振幅比があらかじめ定めた値未満の時に、現フレームに対する補正量を増加させたものを次フレーム以降の補正量算出のための補正量とし、
周波数合成部で、上記エコー消去信号周波数成分を時間領域に変換し、出力信号を出力することを特徴とするエコー消去方法。 The summation unit adds the input playback signals of multiple channels and outputs the added playback signal.
In the first frequency analysis unit, the addition reproduction signal is converted into a frequency domain in a frame unit of a predetermined time length, the frequency component is analyzed, and an addition reproduction signal amplitude spectrum is output,
In the second frequency analysis unit, the input sound pickup signal is converted into the frequency domain in units of frames, the frequency component is analyzed, and the sound pickup signal frequency component is output.
The echo amplitude spectrum calculation unit divides the additive reproduction signal amplitude spectrum and the collected sound signal frequency component into groups each composed of a plurality of components, and for each group, the maximum reproduction signal amplitude spectrum within the group is obtained. The correction amount for the current frame is calculated from the amplitude ratio of the collected sound signal frequency component value that is maximum in the group and the correction amount of the past frame, and the correction amount for the current frame is multiplied by the correction signal amplitude spectrum. To estimate and output the estimated echo amplitude spectrum,
In the target component selection calculation unit, the echo cancellation signal frequency component is output from the amplitude ratio for each frequency component of the collected sound signal frequency component and the estimated echo amplitude spectrum, and the reproduction signal is in a single talk state, When the amplitude ratio between the collected sound signal frequency component and the estimated echo amplitude spectrum is less than a predetermined value, the amount of correction for the current frame is set as a correction amount for calculating the correction amount for the next frame,
An echo canceling method comprising: converting a frequency component of the echo canceling signal into a time domain and outputting an output signal in a frequency synthesizing unit .
総和部で、複数チャンネルの上記再生信号振幅スペクトルを加算し、加算再生信号振幅スペクトルを出力し、 In the summation unit, add the reproduction signal amplitude spectrum of multiple channels, and output the addition reproduction signal amplitude spectrum,
第2の周波数分析部で、入力された収音信号をフレーム単位で周波数領域に変換し、周波数成分の分析を行い、収音信号周波数成分を出力し、 In the second frequency analysis unit, the input sound pickup signal is converted into the frequency domain in units of frames, the frequency component is analyzed, and the sound pickup signal frequency component is output.
エコー振幅スペクトル計算部で、上記加算再生信号振幅スペクトルと上記収音信号周波数成分をそれぞれ複数成分から構成されるグループに分け、当該グループごとに、グループ内で最大となる上記加算再生信号振幅スペクトルに対する該グループ内で最大となる上記収音信号周波数成分の値の振幅比と過去のフレームの補正量とから現フレームに対する補正量を算出し、現フレームに対する補正量を上記加算再生信号振幅スペクトルに乗算することにより推定エコー振幅スペクトルを推定し出力し、 The echo amplitude spectrum calculation unit divides the additive reproduction signal amplitude spectrum and the collected sound signal frequency component into groups each composed of a plurality of components, and for each group, the maximum reproduction signal amplitude spectrum within the group is obtained. The correction amount for the current frame is calculated from the amplitude ratio of the collected sound signal frequency component value that is maximum in the group and the correction amount of the past frame, and the correction amount for the current frame is multiplied by the correction signal amplitude spectrum. To estimate and output the estimated echo amplitude spectrum,
目的成分選択計算部で、上記収音信号周波数成分と上記推定エコー振幅スペクトルの周波数成分ごとの振幅比からエコー消去信号周波数成分を出力すると共に、上記再生信号のシングルトーク状態の場合であって、上記収音信号周波数成分と上記推定エコー振幅スペクトルとの振幅比があらかじめ定めた値未満の時に、現フレームに対する補正量を増加させたものを次フレーム以降の補正量算出のための補正量とし、 In the target component selection calculation unit, the echo cancellation signal frequency component is output from the amplitude ratio for each frequency component of the collected sound signal frequency component and the estimated echo amplitude spectrum, and the reproduction signal is in a single talk state, When the amplitude ratio between the collected sound signal frequency component and the estimated echo amplitude spectrum is less than a predetermined value, the amount of correction for the current frame is set as a correction amount for calculating the correction amount for the next frame,
周波数合成部で、上記エコー消去信号周波数成分を時間領域に変換し、出力信号を出力する The frequency synthesizer converts the echo cancellation signal frequency component into the time domain and outputs the output signal.
ことを特徴とするエコー消去方法。An echo canceling method characterized by the above.
第1の積算部で、エコー消去信号周波数成分にあらかじめ定めた第1の係数を乗じ、
第2の積算部で、収音信号周波数成分にあらかじめ定めた第2の係数を乗じ、
加算部で、上記第1の積算部の出力と、上記第2の積算部の出力とを加算し、
周波数合成部では、上記加算部からの出力を時間領域に変換し、出力信号を出力する
ことを特徴とするエコー消去方法。 The echo cancellation method according to any one of claims 8 to 13 ,
In the first integration unit, the echo cancellation signal frequency component is multiplied by a predetermined first coefficient,
The second integration unit multiplies the collected sound signal frequency component by a predetermined second coefficient,
The adding unit adds the output of the first integrating unit and the output of the second integrating unit,
An echo cancellation method, wherein the frequency synthesizer converts the output from the adder to the time domain and outputs an output signal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005062995A JP4478045B2 (en) | 2005-03-07 | 2005-03-07 | Echo erasing device, echo erasing method, echo erasing program and recording medium therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005062995A JP4478045B2 (en) | 2005-03-07 | 2005-03-07 | Echo erasing device, echo erasing method, echo erasing program and recording medium therefor |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006246397A JP2006246397A (en) | 2006-09-14 |
JP4478045B2 true JP4478045B2 (en) | 2010-06-09 |
Family
ID=37052284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005062995A Expired - Fee Related JP4478045B2 (en) | 2005-03-07 | 2005-03-07 | Echo erasing device, echo erasing method, echo erasing program and recording medium therefor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4478045B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4821635B2 (en) * | 2007-01-31 | 2011-11-24 | 沖電気工業株式会社 | Signal state detection device, echo canceller, and signal state detection program |
-
2005
- 2005-03-07 JP JP2005062995A patent/JP4478045B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006246397A (en) | 2006-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8644496B2 (en) | Echo suppressor, echo suppressing method, and computer readable storage medium | |
JP4954334B2 (en) | Apparatus and method for calculating filter coefficients for echo suppression | |
JP5671147B2 (en) | Echo suppression including modeling of late reverberation components | |
EP1312162B1 (en) | Voice enhancement system | |
EP3080975B1 (en) | Echo cancellation | |
US9113241B2 (en) | Noise removing apparatus and noise removing method | |
US8355511B2 (en) | System and method for envelope-based acoustic echo cancellation | |
JP4957810B2 (en) | Sound processing apparatus, sound processing method, and sound processing program | |
JP5435204B2 (en) | Noise suppression method, apparatus, and program | |
US20120010881A1 (en) | Monaural Noise Suppression Based on Computational Auditory Scene Analysis | |
US20110044461A1 (en) | Apparatus and method for computing control information for an echo suppression filter and apparatus and method for computing a delay value | |
WO2014181330A1 (en) | A method and apparatus for suppression of unwanted audio signals | |
JP2004187283A (en) | Microphone unit and reproducing apparatus | |
JPWO2006046293A1 (en) | Noise suppressor | |
EP2628317A1 (en) | Automatic equalization using adaptive frequency-domain filtering and dynamic fast convolution | |
EP2597639A2 (en) | Sound processing device | |
WO2009042385A1 (en) | Method and apparatus for generating an audio signal from multiple microphones | |
JP2011166484A (en) | Multi-channel echo cancellation method, multi-channel echo canceler, multi-channel echo cancellation program and recording medium therefor | |
JP2004349806A (en) | Multichannel acoustic echo canceling method, apparatus thereof, program thereof, and recording medium thereof | |
JP3607625B2 (en) | Multi-channel echo suppression method, apparatus thereof, program thereof and recording medium thereof | |
CN112272848A (en) | Background noise estimation using gap confidence | |
JP5662232B2 (en) | Echo canceling apparatus, method and program | |
Freudenberger et al. | Microphone diversity combining for in-car applications | |
JP3756839B2 (en) | Reverberation reduction method, Reverberation reduction device, Reverberation reduction program | |
JP3756828B2 (en) | Reverberation elimination method, apparatus for implementing this method, program, and recording medium therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20070116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100302 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100312 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4478045 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |