JP5130895B2 - 音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法 - Google Patents
音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法 Download PDFInfo
- Publication number
- JP5130895B2 JP5130895B2 JP2007322517A JP2007322517A JP5130895B2 JP 5130895 B2 JP5130895 B2 JP 5130895B2 JP 2007322517 A JP2007322517 A JP 2007322517A JP 2007322517 A JP2007322517 A JP 2007322517A JP 5130895 B2 JP5130895 B2 JP 5130895B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound source
- signal
- emitted
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Description
それぞれの会議室に設置された映像/音声処理装置は、通信回線を介して接続される。そして、記録した映像/音声データを互いに送受信することによって、それぞれの会議室の様子を表示し、発話内容を放音する。
互いに離れた場所に位置する第1及び第2の会議室には、映像データと音声データを処理することが可能な映像/音声処理装置1,21が設置される。映像/音声処理装置1,21は、イーサネット(登録商標)等からなるディジタルデータを通信可能なディジタル通信回線9によって互いに接続される。そして、映像/音声処理装置1,21は、通信回線9を介して、データの伝送タイミング等を制御する制御装置31によって集中制御される。以下、映像/音声処理装置1,21が2つの拠点(第1及び第2の会議室)に設置された場合について説明するが、映像/音声処理装置は3つ以上の拠点に設置されていてもよい。
そして、第1の音源S1が発する音声を収音する第2のマイクロホン2bの第1の伝達特性H21(ω)と、第1の音源S1が発する音声を収音する第1のマイクロホン2aの第2の伝達特性H11(ω)とを定める。また、第2の音源S2が発する音声を収音する第1のマイクロホン2aの第3の伝達特性H12(ω)と、第2の音源S2が発する音声を収音する第2のマイクロホン2bの第4の伝達特性H22とを定める。これら第1〜第4の伝達特性は、後述する信号処理部4で音声分離に用いられるパラメータである。
H11(ω,i)は、第1の音源S1から第1のマイクロホン2aへの第1の伝達特性を示す。
H21(ω,i)は、第1の音源S1から第2のマイクロホン2bへの第2の伝達特性を示す。
H12(ω,i)は、第2の音源S2から第1のマイクロホン2aへの第3の伝達特性を示す。
H22(ω,i)は、第2の音源S2から第2のマイクロホン2bへの第4の伝達特性を示す。
式(4)で求まる行列パラメータH(ω)は、時間変動する値である。式(4)では、時間平均された第1のパワーX1(n)と第2のパワーX2(n)の比を、さらに時間平均することによって値を得る。このため、本例の音源分離部42−1〜42−1024で得られる、時間平均された第1のパワーX1(n)と第2のパワーX2(n)の比は、従来の音源分離方式における第1のパワーX1(n)と第2のパワーX2(n)の比を時間平均した値とは異なる。
式(7)で求まる行列パラメータH(ω)は、時間変動する値である。式(7)においては、第1のパワーX1(n)から第1のマイクロホン2aに入力される第1のノイズ成分N1(ω)を減じる。同様に、第2のパワーX2(n)から第2のマイクロホン2bに入力される第2のノイズ成分N2(ω)を減ずることを特徴としている。
Claims (6)
- 第1の音源が発する音声を複数のマイクロホンによって収音し、前記収音された第1の音源が発する音声がエコー成分として含まれる第2の音源が発する音声を、前記複数のマイクロホンが収音する場合に、前記複数のマイクロホンによって生成された音声信号を処理する音声処理装置であって、
前記複数のマイクロホンのうち、少なくとも第1のマイクロホンによって生成された第1の音声信号と、第2のマイクロホンによって生成された第2の音声信号を、所定の周波数帯域に分割する帯域分割部と、
前記第1及び第2のマイクロホンが収音した音声のパワーに基づいて、前記帯域分割部によって所定の周波数帯域に分割された前記第1及び第2の音声信号を、ノイズ成分を含む定常信号と、ノイズ成分を含まない非定常信号に分離し、前記定常信号に含まれる前記ノイズ成分を抑え、前記非定常信号から前記第2の音源が発する音声に含まれる前記第1の音源が発する音声のエコー成分を分離する音源分離部と、
前記音源分離部によって前記第1の音源のエコー成分が分離された前記第1及び第2の音声信号を、前記第1の音源が発する音声を含む音声信号に合成し、前記分離された第1の音源のエコー成分を含む音声信号に合成する帯域合成部と、を備える
音声処理装置。 - 請求項1に記載の音声処理装置において、
前記音源分離部は、
前記所定の周波数帯域における周波数ωと、
前記第1及び第2のマイクロホンが、前記第1及び第2の音源が発する音声を収音する時間iと、
前記第1の音源が発する音声を収音する前記第1のマイクロホンの第1の伝達特性H11(ω)と、前記第1の音源が発する音声を収音する前記第2のマイクロホンの第2の伝達特性H21(ω)と、前記第2の音源が発する音声を収音する前記第1のマイクロホンの第3の伝達特性H12(ω)と、前記第2の音源が発する音声を収音する前記第2のマイクロホンの第4の伝達特性H22(ω)と、
前記第1のマイクロホンのパワーを時間平均して得られる第1のパワーX1(ω)と、前記第2のマイクロホンのパワーを時間平均して得られる第2のパワーX2(ω)と、
前記第1のマイクロホンに入力される第1の定常信号N1(ω)と、前記第2のマイクロホンに入力される第2の定常信号N2(ω)とを定め、
前記第2のパワーX2(ω)から前記第2の定常信号N2(ω)を減じた値から、前記第1のパワーX1(ω)から前記第1の定常信号N1(ω)を減じた値を除した値が、第1の閾値TH1より大きくなる値の平均を求める関数Eと、
前記第1のパワーX1(ω)から前記第1の定常信号N1(ω)を減じた値から、前記第2のパワーX2(ω)から前記第2の定常信号N2(ω)を減じた値を除した値が、第2の閾値TH2より大きくなる値の平均を求める関数Eを用いて、
音声処理装置。 - 複数の拠点に設置され、第1の音源が発する音声を複数のマイクロホンによって収音し、前記収音された第1の音源が発する音声がエコー成分として含まれる第2の音源が発する音声を、前記複数のマイクロホンが収音する場合に、前記複数のマイクロホンによって生成された音声信号を処理する音声処理システムであって、
前記複数のマイクロホンのうち、少なくとも第1のマイクロホンによって生成された第1の音声信号と、第2のマイクロホンによって生成された第2の音声信号を、所定の周波数帯域に分割する帯域分割部と、
前記第1及び第2のマイクロホンが収音した音声のパワーに基づいて、前記帯域分割部によって所定の周波数帯域に分割された前記第1及び第2の音声信号を、ノイズ成分を含む定常信号と、ノイズ成分を含まない非定常信号に分離し、前記定常信号に含まれる前記ノイズ成分を抑え、前記非定常信号から前記第2の音源が発する音声に含まれる前記第1の音源が発する音声のエコー成分を分離する音源分離部と、
前記音源分離部によって前記第1の音源のエコー成分が分離された前記第1及び第2の音声信号を、前記第1の音源が発する音声を含む音声信号に合成し、前記分離された第1の音源のエコー成分を含む音声信号に合成する帯域合成部と、を備える
音声処理システム。 - 請求項3に記載の音声処理システムにおいて、
前記第2の音源は、スピーカであり、
前記複数の拠点のうち、第1の拠点に設置される前記第2の音源が発する音声は、前記第1の拠点で収音された音声が放音される第2の拠点で収音された音声を含む
音声処理システム。 - 第1の音源が発する音声を複数のマイクロホンによって収音し、前記収音された第1の音源が発する音声がエコー成分として含まれる第2の音源が発する音声を、前記複数のマイクロホンが収音する場合に、前記複数のマイクロホンによって生成された音声信号を処理する音声処理プログラムであって、
前記複数のマイクロホンのうち、少なくとも第1のマイクロホンによって生成された第1の音声信号と、第2のマイクロホンによって生成された第2の音声信号を、所定の周波数帯域に分割する手順、
前記第1及び第2のマイクロホンが収音した音声のパワーに基づいて、前記所定の周波数帯域に分割された前記第1及び第2の音声信号を、ノイズ成分を含む定常信号と、ノイズ成分を含まない非定常信号に分離し、前記定常信号に含まれる前記ノイズ成分を抑え、前記非定常信号から前記第2の音源が発する音声に含まれる前記第1の音源が発する音声のエコー成分を分離する手順、
前記第1の音源のエコー成分が分離された前記第1及び第2の音声信号を、前記第1の音源が発する音声を含む音声信号に合成し、前記分離された第1の音源のエコー成分を含む音声信号に合成する手順、を
コンピュータに実行させるための音声処理プログラム。 - 第1の音源が発する音声を複数のマイクロホンによって収音し、前記収音された第1の音源が発する音声がエコー成分として含まれる第2の音源が発する音声を、前記複数のマイクロホンが収音する場合に、前記複数のマイクロホンによって生成された音声信号を処理する音声処理方法であって、
前記複数のマイクロホンのうち、少なくとも第1のマイクロホンによって生成された第1の音声信号と、第2のマイクロホンによって生成された第2の音声信号を、所定の周波数帯域に分割する帯域分割ステップと、
前記第1及び第2のマイクロホンが収音した音声のパワーに基づいて、前記帯域分割ステップによって所定の周波数帯域に分割された前記第1及び第2の音声信号を、ノイズ成分を含む定常信号と、ノイズ成分を含まない非定常信号に分離し、前記定常信号に含まれる前記ノイズ成分を抑え、前記非定常信号から前記第2の音源が発する音声に含まれる前記第1の音源が発する音声のエコー成分を分離する音源分離ステップと、
前記音源分離ステップによって前記第1の音源のエコー成分が分離された前記第1及び第2の音声信号を、前記第1の音源が発する音声を含む音声信号に合成し、前記分離された第1の音源のエコー成分を含む音声信号に合成する帯域合成ステップと、を行う
音声処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007322517A JP5130895B2 (ja) | 2007-12-13 | 2007-12-13 | 音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法 |
US12/316,112 US8194851B2 (en) | 2007-12-13 | 2008-12-09 | Voice processing apparatus, voice processing system, and voice processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007322517A JP5130895B2 (ja) | 2007-12-13 | 2007-12-13 | 音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009147654A JP2009147654A (ja) | 2009-07-02 |
JP5130895B2 true JP5130895B2 (ja) | 2013-01-30 |
Family
ID=40753300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007322517A Expired - Fee Related JP5130895B2 (ja) | 2007-12-13 | 2007-12-13 | 音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8194851B2 (ja) |
JP (1) | JP5130895B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5493655B2 (ja) * | 2009-09-29 | 2014-05-14 | 沖電気工業株式会社 | 音声帯域拡張装置および音声帯域拡張プログラム |
JP2013062640A (ja) | 2011-09-13 | 2013-04-04 | Sony Corp | 信号処理装置、信号処理方法、およびプログラム |
JP5985172B2 (ja) * | 2011-10-31 | 2016-09-06 | アイホン株式会社 | 音響帰還量抑制装置 |
US9648421B2 (en) * | 2011-12-14 | 2017-05-09 | Harris Corporation | Systems and methods for matching gain levels of transducers |
US9148586B2 (en) | 2012-02-10 | 2015-09-29 | Sony Corporation | Terminal apparatus for combining images from two different cameras based on detected sound |
CN105530390B (zh) * | 2014-09-30 | 2018-07-31 | 华为技术有限公司 | 会议服务器及其检测会议中的回声来源的方法 |
JP6635396B1 (ja) * | 2019-04-08 | 2020-01-22 | パナソニックIpマネジメント株式会社 | 音響ノイズ抑圧装置及び音響ノイズ抑圧方法 |
CN111445916B (zh) * | 2020-03-10 | 2022-10-28 | 浙江大华技术股份有限公司 | 一种会议***中音频去混响方法、装置及存储介质 |
CN113556652B (zh) * | 2020-04-24 | 2022-08-09 | 阿里巴巴集团控股有限公司 | 语音处理方法、装置、设备及*** |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5410595A (en) * | 1992-11-12 | 1995-04-25 | Motorola, Inc. | Apparatus and method for noise reduction for a full-duplex speakerphone or the like |
US5761318A (en) * | 1995-09-26 | 1998-06-02 | Nippon Telegraph And Telephone Corporation | Method and apparatus for multi-channel acoustic echo cancellation |
JP3384540B2 (ja) * | 1997-03-13 | 2003-03-10 | 日本電信電話株式会社 | 受話方法、装置及び記録媒体 |
FR2763774B1 (fr) * | 1997-05-21 | 1999-08-06 | France Telecom | Procede et dispositif de reduction d'echo acoustique multivoies et de spatialisation sonore |
US6654468B1 (en) * | 1998-08-25 | 2003-11-25 | Knowles Electronics, Llc | Apparatus and method for matching the response of microphones in magnitude and phase |
JP3435357B2 (ja) * | 1998-09-07 | 2003-08-11 | 日本電信電話株式会社 | 収音方法、その装置及びプログラム記録媒体 |
JP3489043B2 (ja) * | 1999-04-14 | 2004-01-19 | リオン株式会社 | 環境騒音分析装置 |
AUPR647501A0 (en) * | 2001-07-19 | 2001-08-09 | Vast Audio Pty Ltd | Recording a three dimensional auditory scene and reproducing it for the individual listener |
JP3716918B2 (ja) * | 2001-09-06 | 2005-11-16 | 日本電信電話株式会社 | 収音装置、方法及びプログラム、記録媒体 |
JP3787103B2 (ja) * | 2002-03-15 | 2006-06-21 | 日本電信電話株式会社 | 音声処理装置、音声処理方法、音声処理プログラム |
JP4192483B2 (ja) * | 2002-03-25 | 2008-12-10 | ソニー株式会社 | エコーキャンセラ及びエコーキャンセリング方法 |
US7433463B2 (en) * | 2004-08-10 | 2008-10-07 | Clarity Technologies, Inc. | Echo cancellation and noise reduction method |
US7760887B2 (en) * | 2004-10-15 | 2010-07-20 | Lifesize Communications, Inc. | Updating modeling information based on online data gathering |
US7667728B2 (en) * | 2004-10-15 | 2010-02-23 | Lifesize Communications, Inc. | Video and audio conferencing system with spatial audio |
ATE445966T1 (de) * | 2006-05-08 | 2009-10-15 | Harman Becker Automotive Sys | Echoverringerung für zeitvariante systeme |
-
2007
- 2007-12-13 JP JP2007322517A patent/JP5130895B2/ja not_active Expired - Fee Related
-
2008
- 2008-12-09 US US12/316,112 patent/US8194851B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009147654A (ja) | 2009-07-02 |
US8194851B2 (en) | 2012-06-05 |
US20090154692A1 (en) | 2009-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5130895B2 (ja) | 音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法 | |
RU2648604C2 (ru) | Способ и аппаратура для генерации сигнала речи | |
JP6703525B2 (ja) | 音源を強調するための方法及び機器 | |
JP5277508B2 (ja) | マルチ・チャンネル音響信号をエンコードするための装置および方法 | |
JP2013518477A (ja) | レベルキューによる適応ノイズ抑制 | |
JP2011514706A (ja) | エコー抑制のためのフィルタ係数を演算する装置および方法 | |
CN111696567B (zh) | 用于远场通话的噪声估计方法及*** | |
GB2470059A (en) | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter | |
WO2018167960A1 (ja) | 音声処理装置、音声処理システム、音声処理方法、および音声処理プログラム | |
JP2006129434A (ja) | 自動利得制御方法、自動利得制御装置、自動利得制御プログラム及びこれを記録した記録媒体 | |
EP3275208A1 (en) | Sub-band mixing of multiple microphones | |
JP3607625B2 (ja) | 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体 | |
US11380312B1 (en) | Residual echo suppression for keyword detection | |
JP2003284183A (ja) | 反響抑圧装置、反響抑圧方法及びプログラム | |
JP2006033789A (ja) | 反響路結合量推定方法、反響路結合量推定装置、反響路結合量推定プログラム、エコー抑圧方法、エコー抑圧装置、エコー抑圧プログラム、エコーサプレス方法、エコーサプレッサ、エコーサプレッサプログラム、通信路上の損失量制御方法、通信路上の損失量制御装置、通信路上の損失制御プログラム、多チャネルエコー抑圧方法、多チャネルエコー抑圧装置、多チャネルエコー抑圧プログラム、記録媒体 | |
US20130253923A1 (en) | Multichannel enhancement system for preserving spatial cues | |
US11386911B1 (en) | Dereverberation and noise reduction | |
GB2490092A (en) | Reducing howling by applying a noise attenuation factor to a frequency which has above average gain | |
JPWO2012160778A1 (ja) | 通話機 | |
JP2023054779A (ja) | 空間オーディオキャプチャ内の空間オーディオフィルタリング | |
JP3619461B2 (ja) | 多チャネル雑音抑圧装置、その方法、そのプログラム及びその記録媒体 | |
JP5251473B2 (ja) | 音声処理装置、及び、音声処理方法 | |
JP2007151047A (ja) | 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 | |
CN117118956B (zh) | 音频处理方法、装置、电子设备及计算机可读存储介质 | |
JP4209348B2 (ja) | エコー抑圧方法、この方法を実施する装置、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120730 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121009 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121022 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |