JP4298466B2 - 収音方法、装置、プログラム、および記録媒体 - Google Patents
収音方法、装置、プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP4298466B2 JP4298466B2 JP2003370697A JP2003370697A JP4298466B2 JP 4298466 B2 JP4298466 B2 JP 4298466B2 JP 2003370697 A JP2003370697 A JP 2003370697A JP 2003370697 A JP2003370697 A JP 2003370697A JP 4298466 B2 JP4298466 B2 JP 4298466B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- received
- sound
- speaker
- covariance matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Stereophonic Arrangements (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
中島平太郎ら著、応用電気音響、コロナ社出版、日本音響学会編、pp.262−268、昭和54年
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階を有する。
複数の収音手段の各々で受音された受音信号から話者位置と雑音区間を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階を有する。
複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出段階と、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階を有する。
複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出段階と、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階を有する。
前記記憶された各話者の共分散行列から各話者の音声レベルを推定する話者音声レベル推定段階と、
前記各話者の音声レベルから、各話者音声が適正レベルで出力されるための各話者に対するゲインを各々算出するゲイン算出部とをさらに有し、
前記Lチャネルフィルタ係数計算段階は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出し、
前記Rチャネルフィルタ係数計算段階は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出する。
前記記憶された共分散行列のうち対角成分で最もパワーの大きい成分、または前記記憶された共分散行列の対角成分の加算値の周波数特性を平滑化するゲインを、前記記憶された共分散行列に乗算し、白色化された共分散行列を、前記Lチャネルフィルタ係数計算段階と前記Rチャネルフィルタ係数計算段階に入力する白色化段階をさらに有する。
前記複数の収音手段の各々で受音された信号および前記受話信号の時間領域信号から周波数領域信号に変換するFFT段階と、
前記Lチャネル加算段階と前記Rチャネル加算段階の出力信号を周波数領域信号から時間領域信号に変換するIFFT段階をさらに有し、
前記各段階は周波数領域で演算する。
前記LおよびRチャネルフィルタ係数計算段階と前記LおよびRチャネルフィルタ段階と前記LおよびRチャネル加算段階を、3チャネル以上の1〜Jチャネルフィルタ係数計算段階と1〜Jチャネルフィルタ段階と1〜Jチャネル加算段階に置き換えている。
図1は本発明の第1の実施形態の収音装置のブロック図である。
本発明の第2の実施形態の収音装置について説明する。本実施形態のブロック図は、第1の実施形態と同じ図1である。本実施形態は、第1の実施形態の収音装置に雑音抑圧機能を加えたものである。
図2は本発明の第3の実施形態の収音装置のブロック図である。
図3は本発明の第4の実施形態の収音装置のブロック図である。
図4は本発明の第5の実施形態の収音装置の要部のブロック図である。
図5は本発明の第6の実施形態の収音装置の要部のブロック図である。
図6〜図8はそれぞれ本発明の第7、第8、第9の実施形態の収音装置のブロック図である。
本発明の第10の実施形態について説明する。
102L1〜102LM、301LL、301LR Lチャネルフィルタ
102R1〜102RM、301RL、301RR Rチャネルフィルタ
103L Lチャネル加算器
103R Rチャネル加算器
104 共分散行列計算部
105 話者位置検出部
106 共分散行列記憶部
107L Lチャネルフィルタ係数計算部
107R Rチャネルフィルタ係数計算部
108 話者音声レベル推定部
109 ゲイン計算部
110 白色化部
201 送受話検出部
202L Lチャネルスピーカ
202R Rチャネルスピーカ
203L Lチャネルミキシング係数設定部
203R Rチャネルミキシング係数設定部
4011〜401M、501L、501R FFT
402L、402R IFFT
901L、901R 従来技術の指向性マイクロホン
902L、902R 本発明により形成される指向特性
903 本発明の処理
Claims (18)
- 収音方法であって、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階と
を有する収音方法。 - 収音方法であって、
複数の収音手段の各々で受音された受音信号から話者位置と雑音区間を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階と
を有する収音方法。 - 収音方法であって、
複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出段階と、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階と
を有する収音方法。 - 収音方法であって、
複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出段階と、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
あらかじめ各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階と
を有する収音方法。 - 前記記憶された各話者の共分散行列から各話者の音声レベルを推定する話者音声レベル推定段階と、
前記各話者の音声レベルから、各話者音声が適正レベルで出力されるための各話者に対するゲインを各々算出するゲイン算出部とをさらに有し、
前記Lチャネルフィルタ係数計算段階は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出し、
前記Rチャネルフィルタ係数計算段階は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出する、
請求項1から4のいずれかに記載の収音方法。 - 前記記憶された共分散行列のうち対角成分で最もパワーの大きい成分、または前記記憶された共分散行列の対角成分の加算値の周波数特性を平滑化するゲインを、前記記憶された共分散行列に乗算し、白色化された共分散行列を、前記Lチャネルフィルタ係数計算段階と前記Rチャネルフィルタ係数計算段階に入力する白色化段階をさらに有する、請求項1から5のいずれかに記載の収音方法。
- 前記複数の収音手段の各々で受音された信号および前記受話信号を時間領域信号から周波数領域信号に変換するFFT段階と、
前記Lチャネル加算段階と前記Rチャネル加算段階の出力信号を周波数領域信号から時間領域信号に変換するIFFT段階をさらに有し、
前記各段階は周波数領域で演算する、
請求項1から6のいずれかに記載の収音方法。 - 前記LおよびRチャネルフィルタ係数計算段階と前記LおよびRチャネルフィルタ段階と前記LおよびRチャネル加算段階を、3チャネル以上の1〜Jチャネルフィルタ係数計算段階と1〜Jチャネルフィルタ段階と1〜Jチャネル加算段階に置き換えた、
請求項1から7のいずれかに記載の収音方法。 - 収音装置であって、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出手段と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算手段と、
前記共分散行列を話者位置ごとに記憶する共分散行列記憶手段と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定手段と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算手段と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定手段と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算手段と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ手段と、
前記Lチャネル複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ手段と、
前記Lチャネルフィルタ手段の出力信号を加算するLチャネル加算手段と、
前記Rチャネルフィルタ手段の出力信号を加算するRチャネル加算手段と
を有する収音装置。 - 収音装置であって、
複数の収音手段の各々で受音された受音信号から話者位置と雑音区間を検出する話者位置検出手段と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算手段と、
前記共分散行列を雑音区間と話者位置ごとに記憶する共分散行列記憶手段と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定手段と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算手段と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定手段と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算手段と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ手段と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ手段と、
前記Lチャネルフィルタ手段の出力信号を加算するLチャネル加算手段と、
前記Rチャネルフィルタ手段の出力信号を加算するRチャネル加算手段と
を有する収音装置。 - 収音装置であって、
複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から送話区間、受話区間、雑音区間を検出する送受話検出手段と、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出手段と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算手段と、
前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶手段と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定手段と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算手段と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定手段と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算手段と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ手段と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ手段と、
前記Lチャネルフィルタ手段の出力信号を加算するLチャネル加算手段と、
前記Rチャネルフィルタ手段の出力信号を加算するRチャネル加算手段とを有する収音装置。 - 収音装置であって、
複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出手段と、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出手段と、
複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号から共分散行列を計算する共分散行列計算手段と、
前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶手段と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定手段と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算手段と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定手段と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算手段と、
前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ手段と、
前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ手段と、
前記Lチャネルフィルタ手段の出力信号を加算するLチャネル加算手段と、
前記Rチャネルフィルタ手段の出力信号を加算するRチャネル加算手段とを有する収音装置。 - 前記記憶された各話者の共分散行列から各話者の音声レベルを推定する話者音声レベル推定手段と、
前記各話者の音声レベルから、各話者音声が適正レベルで出力されるための各話者に対するゲインを各々算出するゲイン算出部とをさらに有し、
前記Lチャネルフィルタ係数計算手段は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出し、
前記Rチャネルフィルタ係数計算手段は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出する、
請求項9から12のいずれかに記載の収音装置。 - 前記記憶された共分散行列のうち対角成分で最もパワーの大きい成分、または前記記憶された共分散行列の対角成分の加算値の周波数特性を平滑化するゲインを、前記記憶された共分散行列に乗算し、白色化された共分散行列を前記Lチャネルフィルタ係数計算手段と前記Rチャネルフィルタ係数計算手段に入力する白色化手段をさらに有する、
請求項9から13のいずれかに記載の収音装置。 - 前記複数の収音手段の各々で受音された信号および前記受話信号を時間領域信号から周波数領域信号に変換するFFT手段と、
前記Lチャネル加算手段と前記Rチャネル加算手段の出力信号を周波数領域信号から時間領域信号に変換するIFFT手段とをさらに有し、
前記各手段は周波数領域で演算する、
請求項9から14のいずれかに記載の収音装置。 - 前記LおよびRチャネルフィルタ係数計算手段と前記LおよびRチャネルフィルタ手段と前記LおよびRチャネル加算手段を、3チャネル以上の1〜Jチャネルフィルタ係数計算手段と1〜Jチャネルフィルタ手段と1〜Jチャネル加算手段に置き換えた、
請求項9から15のいずれかに記載の収音装置。 - 請求項1から8のいずれかに記載の収音方法をコンピュータに実行させるための収音プログラム。
- 請求項17に記載の収音プログラムを記載した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003370697A JP4298466B2 (ja) | 2003-10-30 | 2003-10-30 | 収音方法、装置、プログラム、および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003370697A JP4298466B2 (ja) | 2003-10-30 | 2003-10-30 | 収音方法、装置、プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005136709A JP2005136709A (ja) | 2005-05-26 |
JP4298466B2 true JP4298466B2 (ja) | 2009-07-22 |
Family
ID=34647631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003370697A Expired - Fee Related JP4298466B2 (ja) | 2003-10-30 | 2003-10-30 | 収音方法、装置、プログラム、および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4298466B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2426168B (en) * | 2005-05-09 | 2008-08-27 | Sony Comp Entertainment Europe | Audio processing |
JP2009116245A (ja) * | 2007-11-09 | 2009-05-28 | Yamaha Corp | 音声強調装置 |
JP5022459B2 (ja) * | 2010-03-03 | 2012-09-12 | 日本電信電話株式会社 | 収音装置、収音方法及び収音プログラム |
EP2560161A1 (en) | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
KR102112018B1 (ko) * | 2013-11-08 | 2020-05-18 | 한국전자통신연구원 | 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07250397A (ja) * | 1994-03-09 | 1995-09-26 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去方法およびこの方法を実施する装置 |
JPH1042396A (ja) * | 1996-07-23 | 1998-02-13 | Sanyo Electric Co Ltd | 音像制御装置 |
JPH10257598A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 仮想音像定位用音響信号合成装置 |
JP3541339B2 (ja) * | 1997-06-26 | 2004-07-07 | 富士通株式会社 | マイクロホンアレイ装置 |
JPH11304906A (ja) * | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | 音源位置推定方法およびそのプログラムを記録した記録媒体 |
JP3878892B2 (ja) * | 2002-08-21 | 2007-02-07 | 日本電信電話株式会社 | 収音方法、収音装置、および収音プログラム |
US7716044B2 (en) * | 2003-02-07 | 2010-05-11 | Nippon Telegraph And Telephone Corporation | Sound collecting method and sound collecting device |
JP4119328B2 (ja) * | 2003-08-15 | 2008-07-16 | 日本電信電話株式会社 | 収音方法、その装置、そのプログラム、およびその記録媒体。 |
-
2003
- 2003-10-30 JP JP2003370697A patent/JP4298466B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005136709A (ja) | 2005-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9922663B2 (en) | Voice signal processing method and apparatus | |
JP5654513B2 (ja) | 音識別方法および装置 | |
US9210504B2 (en) | Processing audio signals | |
EP2749016B1 (en) | Processing audio signals | |
JP4286637B2 (ja) | マイクロホン装置および再生装置 | |
US9232309B2 (en) | Microphone array processing system | |
JP7352291B2 (ja) | 音響装置 | |
KR101934999B1 (ko) | 잡음을 제거하는 장치 및 이를 수행하는 방법 | |
JP4249729B2 (ja) | 自動利得制御方法、自動利得制御装置、自動利得制御プログラム及びこれを記録した記録媒体 | |
WO2004071130A1 (ja) | 収音方法及び収音装置 | |
JP5611970B2 (ja) | オーディオ信号を変換するためのコンバータ及び方法 | |
CN1902901A (zh) | 用于增强主观立体声音频的***和方法 | |
JP2001309483A (ja) | 収音方法および収音装置 | |
CN105284133A (zh) | 基于信号下混比进行中心信号缩放和立体声增强的设备和方法 | |
JP5034607B2 (ja) | 音響エコーキャンセラシステム | |
JP5762479B2 (ja) | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム | |
JP4298466B2 (ja) | 収音方法、装置、プログラム、および記録媒体 | |
JP4116600B2 (ja) | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 | |
US20130253923A1 (en) | Multichannel enhancement system for preserving spatial cues | |
JP2005064968A (ja) | 収音方法、その装置、そのプログラム、およびその記録媒体。 | |
JP5267808B2 (ja) | 音響出力システム及び音響出力方法 | |
JP5937451B2 (ja) | エコー消去装置、エコー消去方法及びプログラム | |
JP4080987B2 (ja) | エコー・雑音抑制方法および多チャネル拡声通話システム | |
JP2002062900A (ja) | 収音装置及び受信装置 | |
JP2005062096A (ja) | 話者位置検出方法、装置、プログラム、および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050621 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090408 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090415 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120424 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130424 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |