JP2008177802A - 音声会議システムおよび音声会議装置 - Google Patents

音声会議システムおよび音声会議装置 Download PDF

Info

Publication number
JP2008177802A
JP2008177802A JP2007008682A JP2007008682A JP2008177802A JP 2008177802 A JP2008177802 A JP 2008177802A JP 2007008682 A JP2007008682 A JP 2007008682A JP 2007008682 A JP2007008682 A JP 2007008682A JP 2008177802 A JP2008177802 A JP 2008177802A
Authority
JP
Japan
Prior art keywords
sound
conference
audio
voice
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007008682A
Other languages
English (en)
Other versions
JP4882757B2 (ja
Inventor
Toshiaki Ishibashi
利晃 石橋
Makoto Tanaka
田中  良
Norifumi Ukai
訓史 鵜飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007008682A priority Critical patent/JP4882757B2/ja
Publication of JP2008177802A publication Critical patent/JP2008177802A/ja
Application granted granted Critical
Publication of JP4882757B2 publication Critical patent/JP4882757B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】互いの音声会議装置に在席する会議者の位置に応じて、臨場感の溢れる会議を実現できる音声会議システムを提供する。
【解決手段】会議室100Aの音声会議装置1Aは、会議者201Aが発言すると、この発言に応じた出力用収音ビーム信号MBSと話者方位情報Pmとからなる音声通信データを生成し、会議室100Bの音声会議装置1Bに送信する。音声会議装置1Bは、受信した音声通信データから放音用音声信号と話者方位情報Pyを取得し、話者方位情報Pyから仮想音源900を設定する。音声会議装置1Bは、仮想音源900に基づいて、各スピーカSP1〜SP4に与えるSP用音声信号SPD1〜SPD4毎に遅延調整量D、ゲイン調整量Gを設定する。音声会議装置1Bは、これらの調整量でそれぞれ調整されたSP用音声信号SPD1〜SPD4をディジタル−アナログ変換後、増幅し、スピーカSPから放音する。
【選択図】 図7

Description

この発明は、互いに離れた位置に配置された二つの音声会議装置を接続して音声会議を行う音声会議システム、および当該音声会議システムに用いる音声会議装置に関するものである。
従来、互いに離れた二地点間で音声会議を行う場合、それぞれの地点に特許文献1や特許文献2のような音声会議装置を配置し、当該音声会議装置を取り囲むように会議者が在席して会議を行う。
特許文献1および特許文献2の音声会議装置では、天面から外部に放音するように、筐体の中心に一つのスピーカが配置され、側面の各コーナ部にそれぞれ異なる方位を収音方向とする複数のマイクが配置されている。
このような従来の音声会議装置では、各マイクでそれぞれに異なる方位からの発生音を収音して音声信号を相手側の音声会議装置に送信する。一方、音声会議装置は、相手側の音声会議装置で収音された音声信号を受信すると、そのままスピーカから放音する。
特開平8−298696号公報 特開平8−204803号公報
前述の従来の音声会議システムでは、収音側(送信側)の音声会議装置は、全てのマイクで筐体周囲の全方位の音声を収音し、一つの放音用音声信号として送信する。そして、放音側(受信側)の音声会議装置は、受信した放音用音声信号をスピーカにあたえ全方位に均一に放音する。
このような構成では、相手先の音声会議装置に複数の会議者が存在していても、相手先から受信した放音用音声信号が全方位に対して均一に放音されるので、相手先の音声会議装置に在席する会議者の位置関係が分からない。このため、会議にあまり臨場感を与えることができない。
したがって、本発明の目的は、互いの音声会議装置に在席する会議者の位置に応じて、臨場感の溢れる会議を実現できる音声会議システムおよび当該音声システムに利用する音声会議装置を提供することにある。
この発明の音声会議システムは、円板状の筐体と、該筐体に円周状に配置された複数の単一指向性マイクと、筐体に円周状に配置された複数のスピーカと、をそれぞれに備えた複数の音声会議装置と、複数の音声会議装置のうちの少なくとも二台を接続する接続手段と、を備えたものである。そして、送信側の音声会議装置は、複数の単一指向性マイクの収音信号からそれぞれに異なる収音方位の収音ビーム信号を形成し、会議者の発生音に基づく収音ビーム信号を信号強度により選択するとともに、選択した収音ビーム信号に対応して、円板状の筐体の外方の全方位中の収音方位を検出して話者方位情報を生成し、選択した収音ビーム信号に基づく放音用音声信号と対応する話者方位情報とを関連付けして送信することを特徴としている。受信側の音声会議装置は、送信側の音声会議装置からの放音用音声信号と対応する話者方位情報とを受信し、当該話者方位情報の方位と同方位に対して仮想音源を設定し、当該仮想音源から放音されたように、複数のスピーカから放音される音声を制御することを特徴としている。
この構成では、送信側の音声会議装置は、会議者の発言を収音するとともに、筐体に対する会議者の方位(収音方位)を取得する。そして、収音音声に基づく放音用音声信号と話者方位情報とを関連付けして送信する。受信側の音声会議装置は、受信した話者方位情報から筐体に対する仮想音源の方位を設定し、当該方位から放音用音声信号に基づく音が放音されているように複数のスピーカから放音される音声を制御する。これにより、受信側の音声会議装置に在席する会議者は、送信側の音声会議装置での話者方位と同じ方位から発声音が放音されているように聞き取ることができる。
また、この発明の受信側の音声会議装置は、設定した仮想音源位置と各スピーカとの位置関係とに基づいて、各スピーカから放音する音声の振幅および遅延制御を行うことを特徴としている。
この構成では、各スピーカと仮想音源位置との位置関係に応じて、各スピーカからの放音音声が振幅制御・遅延制御される。より、具体的には、仮想音源位置からの距離に応じて放音音声の振幅を減衰させ、且つ仮想音源位置からの距離に応じて放音タイミングを遅延させる。これにより、放音側(受信側)の音声会議装置に在席する会議者は、音声会議装置に対してどの方位にいても、仮想音源位置から放音されたように聞き取ることができる。
また、この発明の送信側の音声会議装置は、話者方位とともに発声音の発声位置と筐体の発声位置に最も近い側面との距離を算出し、話者方位と距離とから話者方位情報を生成する。受信側の音声会議装置は、受信した話者方位情報から得られる方位と距離とに基づいて仮想音源を設定することを特徴としている。
この構成では、話者方位のみでなく、筐体から話者までの距離をも算出して仮想音源位置を設定する。これにより、収音側の音声会議装置の会議者の発言位置を、さらに正確に、放音側の音声会議装置で再現することができる。
また、この発明の音声会議装置は、前述の音声会議システムに用いる音声会議装置である。この音声会議装置の複数のスピーカは、筐体の下面側に、筐体から外方を放音方向として設置され、複数の単一指向性マイクは、筐体の上面側に、筐体を平面視した中心方向を収音方向として設置されたことを特徴としている。
この構成では、互いに最も近接するマイクの収音指向性方向とスピーカの放音指向性方向とが逆方向になり、スピーカからの回り込み音声をマイクで収音し難くなるので、筐体から外方の全方位中の目的とする話者方位を検出することがより高精度に可能になる。
この発明によれば、相手先装置の会議者の位置から放音されるので、目には見えない相手先の会議室での各会議者の位置が分かるとともに、当該位置から放音される音声を聞くことで、臨場感に溢れる音声会議システムを実現することができる。
本発明の実施形態に係る音声会議システムについて、図を参照して説明する。
図1は本実施形態の音声会議システムの構成図である。
図2は本実施形態の音声会議システムに用いる音声会議装置の外形図であり、(A)が平面図、(B)が側面図である。図2において、θは、音声会議装置1を平面視した中心を回転中心として、マイクMC1、スピーカSP1方向が0°となり、反時計回りに増加する角度を示す。
図3は図2に示した音声会議装置の機能ブロック図である。
図1に示すように、音声会議システムは、離間された会議室100A,100Bにそれぞれ配置された音声会議装置1A,1Bと、これら音声会議装置1A,1Bを接続するネットワーク500と、を備える。会議室100A,100Bの略中心には、会議テーブル101A,101Bがそれぞれ設置されており、それぞれの会議テーブル101A,101B上に、音声会議装置1A,1Bが配置されている。これら音声会議装置1A,1Bには、入出力I/Fが備えられており、これら入出力I/Fを介してネットワークに接続している。例えば、このような会議室100Aで、会議者201A,203Aは音声会議装置1Aを挟むように対向して着席しており、会議者201Aが音声会議装置1AのスピーカSP1側、会議者203Aが音声会議装置1AのスピーカSP3側に着席している。また、会議室100Bで、会議者202B,204Bは、音声会議装置1Bを挟むように対向して着席しており、会議者202Bが音声会議装置1BのスピーカSP2側、会議者204Bが音声会議装置1BのスピーカSP4側に着席している。
各音声会議装置1A,1Bは同仕様のものであり、円板状の筐体11を備える。具体的に、筐体11は、平面視した形状が円形であり、天面と底面との面積が垂直方向の途中部分の面積よりも狭く、側面視した形状が、高さ方向の一点から天面に向けて狭くなるとともに、前記一点から底面に向けて狭くなる形状からなる。すなわち、前記一点より上部側および下部側にそれぞれ傾斜面を有する形状からなる。筐体11の天面には、該天面の面積よりも狭く、所定深さからなる凹部12が形成されており、凹部12の平面視した中心と天面の中心とが、一致するように設定されている。
16個のマイクMC1〜MC16は、凹部12の側面に沿った筐体11の天面側内部に設置されており、各マイクMC1〜MC16は音声会議装置1を平面視した中心を回転中心として等角度ピッチ(この場合は約22.5°間隔)で配置されている。この際、マイクMC1がθ=0°方向となり、順にθが22.5°ずつ増加する方向に沿って各マイクMC1〜MC16が配置される。例えば、マイクMC5はθ=90°方向に配置され、マイクMC9はθ=180°方向に配置され、マイクMC13は、θ=270°方向に配置される。また、各マイクMC1〜MC16は、単一指向性を有し、それぞれが前記平面視した中心方向に強い指向性を有するように配置されている。例えば、マイクMC1はθ=180°方向を指向性の中心とし、マイクMC5はθ=270°方向を指向性の中心とし、マイクMC9はθ=0(360)°方向を指向性の中心とし、マイクMC13はθ=90°方向を指向性の中心とする。なお、マイクの個数はこれに限らず、仕様に応じて適宜設定すればよい。
4個のスピーカSP1〜SP4は、筐体11の下部側の傾斜面と放音面が一致するようにそれぞれ設置されており、各スピーカSP1〜SP4は音声会議装置1を平面視した中心を回転中心として等角度ピッチ(この場合は約90°間隔)で配置されている。この際、スピーカSP1がマイクMC1と同じθ=0°方向に配置され、スピーカSP2がマイクMC5と同じθ=90°方向に配置され、スピーカSP3がマイクMC9と同じθ=180°方向に配置され、スピーカSP4がマイクMC13と同じθ=270°方向に配置される。また、各スピーカSP1〜SP4は、放音面の正面方向に強い指向性を有するものであり、スピーカSP1はθ=0°方向を中心に放音し、スピーカSP2はθ=90°方向を中心に放音し、スピーカSP3はθ=180°方向を中心に放音し、スピーカSP4はθ=270°方向を中心に放音する。
このように、スピーカSP1〜SP4を筐体11の下部側に配置し、マイクMC1〜MC16を筐体11の上部側に配置し、マイクMC1〜MC16の収音方向を筐体11の中心方向とすることで、各マイクMC1〜MC16は、スピーカSP1〜SP4からの回り込み音声を収音しく難くなる。このため、後述する話者位置検出で、回り込み音声の影響を受け難くなり、より高精度に話者位置検出が行える。
操作部29は、筐体11の上部側の傾斜面に設置されており、図示しないが、各種の操作釦および液晶表示パネルを備える。
入出力I/Fは、筐体11の下部側の傾斜面で、スピーカSP1〜SP4が設置されていない位置に設置されており、図示しないが、ネットワーク接続端子、ディジタルオーディオ端子、アナログオーディオ端子等を備える。そして、このネットワーク接続端子にネットワークケーブルを接続して、前述のネットワーク500に接続する。
音声会議装置1は、このような構造上の構成とともに、図3に示すような機能的な構成を備える。
制御部20は、音声会議装置1の設定、収音、放音等の全般制御を行うとともに、操作部29により入力された操作指示内容に基づく制御を音声会議装置1の各部に与える。
(1)放音
通信制御部21は、入出力I/Fを介して受信した相手先音声会議装置からの音声通信データから、音声データを取得して放音用音声信号S1〜S3としてチャンネルCH1〜CH3に出力する。この際、通信制御部21は、音声通信データから相手先装置IDを取得し、相手先装置ID毎にチャンネルCHを割り当てる。例えば、接続中の相手先装置が一台である場合、当該相手先装置からの音声データを放音用音声信号S1として、チャンネルCH1に割り当てる。また、接続中の相手先装置が二台である場合、二台の相手先装置からの音声データをそれぞれ放音用音声信号S1,S2として、チャンネルCH1,CH2に個別に割り当てる。同様に、接続中の相手先装置が三台である場合、三台の相手先装置からの音声データをそれぞれ放音用音声信号S1,S2,S3として、チャンネルCH1,CH2,CH3に個別に割り当てる。チャンネルCH1〜CH3は、エコーキャンセル部28を介して放音制御部22に接続される。
通信制御部21は、音声通信データの各音声データに関連付けされた相手先音声会議装置での話者方位データPy(Pm)を抽出し、チャンネル情報とともに放音制御部22に与える。
放音制御部22は、放音用音声信号S1〜S3と、話者方位情報Pyとに基づいて、各スピーカSP1〜SP4に与えるスピーカ出力信号SPD1〜SPD4を生成する。
図4は、本実施形態の放音制御部22の主要構成を示すブロック図である。
図5(A)は、放音仕様制御部220で設定する仮想音源の分布を示す図である。また、図5(B)は、放音仕様テーブル2281の内容を示す図である。
図4に示すように、放音制御部22は、各放音用音声信号S1〜S3に対応する個別放音信号生成部221〜223、放音仕様制御部220、各スピーカ出力信号SPD1〜SPD4に対応する信号合成部224〜227、放音仕様テーブル2281を記憶するメモリ228と、を備える。
放音仕様制御部220は、通信制御部21からの話者方位情報Pyに基づいて、仮想音源を設定する。仮想音源は、図5(A)に示すように、筐体11から外方の水平方向に対して所定距離の位置で、且つ、筐体11の中心を回転中心とし、45°間隔で設定されている。より具体的には、筐体11の中心からスピーカSP1とマイクMC1とが配置された方向である、θ=0°方向に仮想音源901が設定され、当該仮想音源901から反時計回り方向に45°の間隔で、順に仮想音源902〜908が設定される。なお、仮想音源数はこれに限るものではなく、装置仕様に応じて適宜設定すればよい。
放音仕様制御部220は、設定した仮想音源に基づいて、メモリ228に記憶されている放音仕様テーブル2281から該当する仮想音源を設定する遅延調整量Dおよびゲイン調整量Gを読み出す。例えば、話者方位情報Pyがθ=0°方向を示すものであれば、放音仕様制御部220は、仮想音源901が設定され、SP1用の遅延調整量D11、ゲイン調整量G11と、SP2用の遅延調整量D21、ゲイン調整量G21と、SP3用の遅延調整量D31、ゲイン調整量G31と、SP4用の遅延調整量D41、ゲイン調整量G41と、を読み出す。なお、ここで、遅延調整量Dおよびゲイン調整量Gは、設定する仮想音源と各スピーカSP1〜SP4との距離により予め設定される。また、これらの調整量は、音声会議装置を設置した後に、その場で放収音環境測定の実験を行って設定しても良い。
放音仕様制御部220は、各スピーカSP1〜SP4に対する遅延調整量D、ゲイン調整量Gを読み出すと、話者方位情報Pyとともに与えられたチャンネル情報に基づいて、該当するチャンネル用の個別放音信号生成部221〜223のいずれかに、遅延調整量D、ゲイン調整量Gを出力する。例えば、仮想音源901が設定され、チャンネル情報がCH1を示すものであれば、放音仕様制御部220は、SP1用の遅延調整量D11、ゲイン調整量G11と、SP2用の遅延調整量D21、ゲイン調整量G21と、SP3用の遅延調整量D31、ゲイン調整量G31と、SP4用の遅延調整量D41、ゲイン調整量G41と、を個別放音信号生成部221に与える。
個別放音信号生成部221〜223は、放音仕様制御部220から与えられたスピーカSP1〜SP4毎の遅延調整量Dおよびゲイン調整量Gに基づいて、対応するチャンネルCH1〜CH3から入力された放音用音声信号S1〜S3を遅延処理およびゲインコントロールして、信号合成部224〜227に出力する。より具体的には、個別放音信号生成部221は、遅延調整量D1*(*:仮想音源901〜908に対応する1〜8)、ゲイン調整量G1*(*:仮想音源901〜908に対応する1〜8)で、放音用音声信号S1の遅延処理およびゲインコントロールを行い、信号合成部224に出力する。同時に、個別放音信号生成部221は、遅延調整量D2*(*:仮想音源901〜908に対応する1〜8)、ゲイン調整量G2*(*:仮想音源901〜908に対応する1〜8)で、放音用音声信号S1の遅延処理およびゲインコントロールを行い、信号合成部225に出力する。また同時に、個別放音信号生成部221は、遅延調整量D3*(*:仮想音源901〜908に対応する1〜8)、ゲイン調整量G3*(*:仮想音源901〜908に対応する1〜8)で、放音用音声信号S1の遅延処理およびゲインコントロールを行い、信号合成部226に出力する。さらに同時に、個別放音信号生成部221は、遅延調整量D4*(*:仮想音源901〜908に対応する1〜8)、ゲイン調整量G4*(*:仮想音源901〜908に対応する1〜8)で、放音用音声信号S1の遅延処理およびゲインコントロールを行い、信号合成部227に出力する。個別放音信号生成部222〜223も個別放音信号生成部221と同様な処理で、放音用音声信号S2,S3の遅延処理およびゲインコントロールを行い、信号合成部224〜227に出力する。
信号合成部224は、各個別放音信号生成部221〜223から出力されたSP1用の信号を合成(加算)処理して、SP1用音声信号SPD1として出力する。同様に、信号合成部225は、各個別放音信号生成部221〜223から出力されたSP2用の信号を合成(加算)処理して、SP2用音声信号SPD2として出力する。また同様に、信号合成部226は、各個別放音信号生成部221〜223から出力されたSP3用の信号を合成(加算)処理して、SP3用音声信号SPD3として出力する。さらに同様に、信号合成部227は、各個別放音信号生成部221〜223から出力されたSP4用の信号を合成(加算)処理して、SP4用音声信号SPD4として出力する。
D/Aコンバータ23は各SP用音声信号SPD1〜SPD4をディジタル−アナログ変換し、放音AMP(アンプ)24は、各SP用音声信号SPD1〜SPD4を一定の増幅率で増幅して、それぞれスピーカSP1〜SP4に与える。
スピーカSP1〜SP4は、与えられたSP用音声信号SPD1〜SPD4を音声変換して放音する。
このような放音処理を行うことで、各スピーカSP1〜SP4から放音される音声が所定の遅延関係および振幅関係になるため、あたかも設定した仮想音源から放音されたような感覚を会議者に与えることができる。
(2)収音
前述のマイクMC1〜MC16は、会議者の発生音等の外部からの音声を収音して収音信号MS1〜MS16を生成する。各収音AMP(アンプ)25は、対応する収音信号MS1〜MS16を所定増幅率で増幅し、A/Dコンバータ26は、増幅された収音信号MS1〜MS16をアナログ−ディジタル変換して収音制御部27に出力する。
図6は収音制御部27の主要構成を示すブロック図である。図6に示すように、収音制御部27は、方位別収音ビーム生成部271、出力データ決定部272を備える。
方位別収音ビーム生成部271は、収音信号MS1〜MS16(ディジタルデータ)に対して適当な組み合わせを設定し、組み合わされた収音信号同士の遅延・加算処理等を行うことで、前述の仮想音源901〜908に対応するそれぞれに異なる八方位を収音方向とする収音ビーム信号MB1〜MB8を生成する。
方位別収音ビーム生成部271は加算器2711〜2718を備える。
加算器2711は、収音信号MS1,MS2,MS16を加算して、θ=180°方向(仮想音源905に対応)に強い指向性を有する収音ビーム信号MB1を生成する。加算器2712は、収音信号MS2,MS3,MS4を加算して、θ=225°方向(仮想音源906に対応)に強い指向性を有する収音ビーム信号MB2を生成する。加算器2713は、収音信号MS4,MS5,MS6を加算して、θ=270°方向(仮想音源907に対応)に強い指向性を有する収音ビーム信号MB3を生成する。加算器2714は、収音信号MS6,MS7,MS8を加算して、θ=315°方向(仮想音源908に対応)に強い指向性を有する収音ビーム信号MB4を生成する。加算器2715は、収音信号MS8,MS9,MS10を加算して、θ=0°方向(仮想音源901に対応)に強い指向性を有する収音ビーム信号MB5を生成する。加算器2716は、収音信号MS10,MS11,MS12を加算して、θ=45°方向(仮想音源902に対応)に強い指向性を有する収音ビーム信号MB6を生成する。加算器2717は、収音信号MS12,MS13,MS14を加算して、θ=90°方向(仮想音源903に対応)に強い指向性を有する収音ビーム信号MB7を生成する。加算器2718は、収音信号MS14,MS15,MS16を加算して、θ=135°方向(仮想音源904に対応)に強い指向性を有する収音ビーム信号MB8を生成する。
このように、実施形態の例では、収音ビーム信号MB1を仮想音源905に対応させ、収音ビーム信号MB2を仮想音源906に対応させ、収音ビーム信号MB3を仮想音源907に対応させ、収音ビーム信号MB4を仮想音源908に対応させる。さらに、収音ビーム信号MB5を仮想音源901に対応させ、収音ビーム信号MB6を仮想音源902に対応させ、収音ビーム信号MB7を仮想音源903に対応させ、収音ビーム信号MB8を仮想音源904に対応させる。なお、生成する収音ビーム信号の個数は、これに限らず、仕様に応じて適宜設定することができる。
方位別収音ビーム生成部271は、生成した収音ビーム信号MB1〜MB8を出力データ決定部272に出力する。
出力データ決定部272は、最大信号検出部2721とSelect/Mix回路2722とを備える。
最大信号検出部2721は、収音ビーム信号MB1〜MB8の信号レベルを比較して、最大の信号レベルを有する収音ビーム信号を選択する。最大信号検出部2721は、選択した収音ビーム信号を示す選択ビーム情報MBMをSelect/Mix回路2722に出力する。また、最大信号検出部2721は、選択した収音ビーム信号に対応する方位情報を話者方位情報Pmとして通信制御部21に出力する。
Select/Mix回路2722は、最大信号検出部2721からの選択ビーム情報MBMに基づいて、当該情報で指定された収音ビーム信号MBを選択して出力用収音ビーム信号MBSとして出力する。なお、Select/Mix回路2722は、選択ビーム情報MBMで指定された収音ビーム信号MBのみを選択して出力するのではなく、選択ビーム情報MBMで指定された収音ビーム信号MBと隣り合う収音ビーム信号MBとをミキシングして、出力用収音ビーム信号MBSとして出力するようにしてもよい。
エコーキャンセル部28は、入力される出力用収音ビーム信号MBSに対して、各放音用音声信号S1〜S3に基づく擬似回帰音信号を生成する適応型フィルタと、出力用収音ビーム信号MBSから擬似回帰音信号を減算するポストプロセッサとからなる。エコーキャンセル回路は、適応型フィルタのフィルタ係数を逐次最適化しながら出力用収音ビーム信号MBSから擬似回帰音信号を減算することで、出力用収音ビーム信号MBSに含まれるスピーカSP1〜SP4からマイクMC1〜MC16への回り込み成分を除去する。この回り込み成分が除去された出力用収音ビーム信号MBS’は、通信制御部21に出力される。
通信制御部21は、エコーキャンセル部28で回帰音除去された出力用収音ビーム信号MBS’と、収音制御部27からの話者方位情報Pmとを関連付けして、音声通信データを生成し、入出力I/Fに出力する。このように生成された音声通信データは、入出力I/F、ネットワーク500を介して相手先音声会議装置に送信される。
このような構成とすることで、収音側の音声会議装置に対する発言者の位置に対応する放音側の音声会議装置の位置で放音が行われるので、収音側の音声会議装置に在席する発言者が、あたかも放音側の音声会議装置に在席して発言しているかのような感覚を、放音側の音声会議装置に在席する各会議者に与えることができる。これにより、臨場感に溢れる遠隔会議を行うことができる。この際、仮想音源の位置に関係なく、全てのスピーカSP1〜SP4からそれぞれに遅延・振幅関係が制御された音声を放音することで、単に仮想音源位置に近いスピーカから放音するよりも、よりリアルな音源定位を実現することができる。例えば、仮想音源位置に近いスピーカのみで放音した場合、放音方向が仮想音源方向であるため、音声会議装置1に対して仮想音源と対称の位置にいる会議者は、こもった音でしか聞き取ることができない。しかし、本実施形態の構成のように全てのスピーカで放音することで、正面ではなくとも会議者方向に放音するスピーカが少なくとも1つは存在するので、鮮明な音を聞き取ることができる。
次に、具体的な使用例について図を参照して説明する。
図7は、図1に示した状況で、会議者201Aが発言した場合の放収音状態を説明する図である。
図1、図7の場合、会議室100Aには、会議者201Aが音声会議装置1Aのθ=0°方向に在席し、会議者203Aが音声会議装置1Aのθ=180°方向に在席している。会議室100Bには、会議者202Bが音声会議装置1Bのθ=90°方向に在席し、会議者204Bが音声会議装置1Bのθ=270°方向に在席している。
会議室100Aの会議者201Aが発言すると音声301Aは音声会議装置1Aで収音される。この際、音声301Aは、主としてマイクMC8,MC9,MC10で収音されるので、これらのマイクMC8,MC9,MC10の収音信号で構成された収音ビーム信号MB5は、前記所定閾値以上となる。この収音ビーム信号MB5からなる出力用収音ビーム信号MBSはエコーキャンセルされて、θ=0°の話者方位情報Pmとともに音声通信データとして音声会議装置1Bに送信される。
会議室100Bの音声会議装置1Bは、音声会議装置1Aからの音声通信データを受信すると、音声データを抽出して、例えば、チャンネルCH1に割り当て、放音用音声信号S1に変換する。また、音声会議装置1Bは、音声通信データから話者方位情報Pm(=Py)を抽出する。音声会議装置1Bは、話者方位情報Pyがθ=0°であることから、θ=0°方向の仮想音源901を設定し、この仮想音源901を実現する遅延調整量Dおよびゲイン調整量Gを読み出す。この際、各スピーカSP1〜SP4に対応するSP用音声信号SPD1〜SPD4は、振幅強度がSP1用音声信号SP1>SP2用音声信号SP2=SP4用音声信号SP4>SP3用音声信号SP3となるようにゲイン調整量Dが設定され、遅延時間がSP1用音声信号SP1<SP2用音声信号SP2=SP4用音声信号SP4<SP3用音声信号SP3となるように設定される。音声会議装置1Bは、このように調整されたSP用音声信号SPD1〜SPD4を対応するスピーカSP1〜SP4から放音する。このように放音することで、SP1用音声信号SPD1に対応する放音音声401Aは、SP2用音声信号SPD2に対応する放音音声402A、SP3用音声信号SPD3に対応する放音音声403A、SP4用音声信号SPD4に対応する放音音声404Aよりも大きな音となる。また、放音音声401A、放音音声402A、放音音声403A、放音音声404Aの順で放音される。これにより、会議者202B、204Bは、あたかも仮想音源901から放音されたように、聞き取ることができる。この結果、音声会議装置101B側に在席する会議者202B,204Bは、θ=0°の方向に音声会議装置101A側に在席する会議者201Aが存在し、この会議者201Aがその場で発言しているように感じることができる。
なお、前述の説明では、一人が発言している時を例に示したが、二人以上が同時に発言している場合でも適用することができる。この場合、収音側の音声会議装置は、それぞれの発言者の音声信号を収音して個別に話者方位情報を与え、放音側の音声会議装置は、取得した話者方位情報に基づいて複数の仮想音源を設定するようにすればよい。
また、前述の説明では、二台の音声会議装置で通信を行う場合を説明したが、三台や四台等の複数台の音声会議装置で通信を行う場合にも前述の仮想音源の設定を適用することができる。この場合、通信相手となる音声会議装置毎に個別にチャンネルを割り当て、それぞれのチャンネルの放音用音声信号に対して、仮想音源を設定し、遅延処理およびゲインコントロールを行えばよい。より具体的には、チャンネルCH1に割り当てた放音音声信号S1は、これに対応する第1の音声会議装置により与えられた話者方位情報に基づいて遅延処理およびゲインコントロールされて、各スピーカSP1〜SP4への音声信号が生成される。同様に、チャンネルCH2に割り当てた放音音声信号S2は、これに対応する第2の音声会議装置により与えられた話者方位情報に基づいて遅延処理およびゲインコントロールされて、各スピーカSP1〜SP4への音声信号が生成される。さらに、チャンネルCH3に割り当てた放音音声信号S3は、これに対応する第3の音声会議装置により与えられた話者方位情報に基づいて遅延処理およびゲインコントロールされて、各スピーカSP1〜SP4への音声信号が生成される。このように、各スピーカSP1〜SP4に対して生成された音声信号を合成することで、SP用音声信号SPD1〜SPD4を生成し、各スピーカSP1〜SP4から放音する。これにより、放音を行う音声会議装置に在席する会議者は、別の第1〜第3の音声会議装置に在席する会議者があたかも居るかのように発言を聞き取ることができる。
また、前述の説明では、筐体からの距離は同じで、方位のみから仮想音源を設定する場合を示したが、方位と距離とを用いて仮想音源を設定するようにしてもよい。この場合、収音側の音声会議装置は、各マイクで収音される音声信号の遅延関係から各マイクと発言位置の距離を算出し、少なくとも三つの距離を用いることで、発言位置を特定することができる。そして、収音側の音声会議装置は、方位情報とともに距離情報からなる話者方位情報を生成し、放音側の音声会議装置に送信する。放音側の音声会議装置は、受信した話者方位情報に基づいて、方位と距離とから得られる仮想音源を設定し、当該仮想音源を実現する遅延処理およびゲインコントロールを行う。これにより、さらにリアルに発言位置(発言した会議者の位置)を再現することができる。
本発明の実施形態の音声会議システムの構成図である。 本発明の実施形態の音声会議システムに用いる音声会議装置の外形図である。 図2に示した音声会議装置の機能ブロック図である。 本発明の実施形態の放音制御部22の主要構成を示すブロック図である。 放音仕様制御部220で設定する仮想音源の分布を示す図、および、放音仕様テーブル2281の内容を示す図である。 収音制御部27の主要構成を示すブロック図である。 図1に示した状況で、それぞれの会議者201Aが発言した場合の放収音状態を説明する図である。
符号の説明
1,1A,1B−音声会議装置、11−筐体、12−凹部、21−通信制御部、22−放音制御部、221〜223−個別放音信号生成部、224〜227−信号合成部、23−D/Aコンバータ、24−放音アンプ、25−収音アンプ、26−A/Dコンバータ、27−収音制御部、271−方位別収音ビーム生成部、272−出力データ決定部、28−エコーキャンセル部、29−操作部、100A,100B−会議室、101A、101B−会議テーブル、201A、203A、202B、204B−会議者、301A−音声(収音音声)、401A、402A、403A、404A−音声(放音音声)、500−ネットワーク、901〜908−仮想音源、SP1〜SP4−スピーカ、MC1〜MC16−マイク

Claims (4)

  1. 円板状の筐体と、該筐体に円周状に配置された複数の単一指向性マイクと、前記筐体に円周状に配置された複数のスピーカと、をそれぞれに備えた複数の音声会議装置と、当該複数の音声会議装置のうちの少なくとも二台を接続する接続手段と、を備えた音声会議システムであって、
    送信側の音声会議装置は、
    前記複数の単一指向性マイクの収音信号からそれぞれに異なる収音方位の収音ビーム信号を形成し、会議者の発生音に基づく収音ビーム信号を信号強度により選択するとともに、
    選択した収音ビーム信号に対応して、前記円板状の筐体の外方の全方位中の収音方位を検出して話者方位情報を生成し、
    前記選択した収音ビーム信号に基づく放音用音声信号と対応する話者方位情報とを関連付けして送信し、
    受信側の音声会議装置は、
    前記送信側の音声会議装置からの放音用音声信号と対応する話者方位情報とを受信し、
    当該話者方位情報の方位と同方位に対して仮想音源を設定し、当該仮想音源から放音されたように、前記複数のスピーカから放音される音声を制御する音声会議システム。
  2. 前記受信側の音声会議装置は、設定した仮想音源位置と各スピーカとの位置関係とに基づいて、各スピーカから放音する音声の振幅および遅延制御を行う請求項1に記載の音声会議システム。
  3. 前記送信側の音声会議装置は、
    前記収音方位とともに前記発声音の発声位置と前記筐体の前記発声位置に最も近い側面との距離を算出し、前記収音方位と前記距離とから前記話者方位情報を生成し、
    前記受信側の音声会議装置は、
    受信した話者方位情報から得られる前記方位と前記距離とに基づいて前記仮想音源を設定する請求項1または請求項2に記載の音声会議システム。
  4. 請求項1〜3のいずれかに記載の音声会議システムに用いる音声会議装置であって、
    前記複数のスピーカは、前記筐体の下面側に、前記筐体から外方を放音方向として設置され、
    前記複数の単一指向性マイクは、前記筐体の上面側に、前記筐体を平面視した中心方向を収音方向として設置された音声会議装置。
JP2007008682A 2007-01-18 2007-01-18 音声会議システム Active JP4882757B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007008682A JP4882757B2 (ja) 2007-01-18 2007-01-18 音声会議システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007008682A JP4882757B2 (ja) 2007-01-18 2007-01-18 音声会議システム

Publications (2)

Publication Number Publication Date
JP2008177802A true JP2008177802A (ja) 2008-07-31
JP4882757B2 JP4882757B2 (ja) 2012-02-22

Family

ID=39704497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007008682A Active JP4882757B2 (ja) 2007-01-18 2007-01-18 音声会議システム

Country Status (1)

Country Link
JP (1) JP4882757B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010071157A1 (ja) * 2008-12-17 2010-06-24 ヤマハ株式会社 収音装置
JP2010220173A (ja) * 2009-03-19 2010-09-30 Yamaha Corp 録音再生装置
CN102308592A (zh) * 2009-02-10 2012-01-04 雅马哈株式会社 拾音装置
CN103259943A (zh) * 2012-02-21 2013-08-21 深圳市东进软件开发有限公司 一种pstn电话会议混音方法
CN108735226A (zh) * 2018-07-09 2018-11-02 科沃斯商用机器人有限公司 语音采集方法、装置及设备
WO2021106622A1 (ja) * 2019-11-29 2021-06-03 ソニーグループ株式会社 テレプレゼンスシステム
US12052528B2 (en) 2019-11-29 2024-07-30 Sony Group Corporation Telepresence system

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10425726B2 (en) 2015-10-26 2019-09-24 Sony Corporation Signal processing device, signal processing method, and program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261351A (ja) * 1996-03-22 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> 音声電話会議装置
JPH1042396A (ja) * 1996-07-23 1998-02-13 Sanyo Electric Co Ltd 音像制御装置
JP2000188795A (ja) * 1998-12-22 2000-07-04 Matsushita Electric Ind Co Ltd マイクロホン装置とそれを用いた音声認識装置、カーナビゲーションシステム、自動車の自動運転システム
JP2004172703A (ja) * 2002-11-18 2004-06-17 Sony Corp 信号処理方法および信号処理装置
JP2005080110A (ja) * 2003-09-02 2005-03-24 Yamaha Corp 音声会議システム、音声会議端末装置およびプログラム
JP2005229422A (ja) * 2004-02-13 2005-08-25 Sony Corp 音声処理装置
JP2006166007A (ja) * 2004-12-07 2006-06-22 Sony Ericsson Mobilecommunications Japan Inc 音源方向検出方法、音源方向検出装置及び撮影装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261351A (ja) * 1996-03-22 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> 音声電話会議装置
JPH1042396A (ja) * 1996-07-23 1998-02-13 Sanyo Electric Co Ltd 音像制御装置
JP2000188795A (ja) * 1998-12-22 2000-07-04 Matsushita Electric Ind Co Ltd マイクロホン装置とそれを用いた音声認識装置、カーナビゲーションシステム、自動車の自動運転システム
JP2004172703A (ja) * 2002-11-18 2004-06-17 Sony Corp 信号処理方法および信号処理装置
JP2005080110A (ja) * 2003-09-02 2005-03-24 Yamaha Corp 音声会議システム、音声会議端末装置およびプログラム
JP2005229422A (ja) * 2004-02-13 2005-08-25 Sony Corp 音声処理装置
JP2006166007A (ja) * 2004-12-07 2006-06-22 Sony Ericsson Mobilecommunications Japan Inc 音源方向検出方法、音源方向検出装置及び撮影装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9294833B2 (en) 2008-12-17 2016-03-22 Yamaha Corporation Sound collection device
JP2010147692A (ja) * 2008-12-17 2010-07-01 Yamaha Corp 収音装置
WO2010071157A1 (ja) * 2008-12-17 2010-06-24 ヤマハ株式会社 収音装置
CN102227918A (zh) * 2008-12-17 2011-10-26 雅马哈株式会社 声音收集装置
CN102227918B (zh) * 2008-12-17 2016-02-10 雅马哈株式会社 声音收集装置
KR101259322B1 (ko) 2008-12-17 2013-05-06 야마하 가부시키가이샤 수음 장치
CN102308592A (zh) * 2009-02-10 2012-01-04 雅马哈株式会社 拾音装置
CN102308592B (zh) * 2009-02-10 2015-01-07 雅马哈株式会社 拾音装置
US9532134B2 (en) 2009-02-10 2016-12-27 Yamaha Corporation Sound pickup apparatus
JP2010220173A (ja) * 2009-03-19 2010-09-30 Yamaha Corp 録音再生装置
CN103259943A (zh) * 2012-02-21 2013-08-21 深圳市东进软件开发有限公司 一种pstn电话会议混音方法
CN108735226A (zh) * 2018-07-09 2018-11-02 科沃斯商用机器人有限公司 语音采集方法、装置及设备
CN108735226B (zh) * 2018-07-09 2024-04-02 科沃斯商用机器人有限公司 语音采集方法、装置及设备
WO2021106622A1 (ja) * 2019-11-29 2021-06-03 ソニーグループ株式会社 テレプレゼンスシステム
US12052528B2 (en) 2019-11-29 2024-07-30 Sony Group Corporation Telepresence system

Also Published As

Publication number Publication date
JP4882757B2 (ja) 2012-02-22

Similar Documents

Publication Publication Date Title
JP4867516B2 (ja) 音声会議システム
JP4882757B2 (ja) 音声会議システム
EP3627860A1 (en) Audio conferencing using a distributed array of smartphones
US7660428B2 (en) Ceiling microphone assembly
JP3972921B2 (ja) 音声集音装置とエコーキャンセル処理方法
JP4984683B2 (ja) 放収音装置
JP3891153B2 (ja) 通話装置
US8428236B2 (en) Conference audio system, process for distributing audio signals and computer program
JP2008543143A (ja) 音響変換器のアセンブリ、システムおよび方法
Zheng et al. Experimental evaluation of a nested microphone array with adaptive noise cancellers
WO2007138985A1 (ja) 放収音装置および放収音装置の制御方法
JP4411959B2 (ja) 音声集音・映像撮像装置
JP2020068466A (ja) 音信号処理装置、ミキサ、および音信号処理方法
JP4281568B2 (ja) 通話装置
JP4479227B2 (ja) 音声集音・映像撮像装置および撮像条件決定方法
JP2005333270A (ja) マイクロフォン信号生成方法および通話装置
JP2008017126A (ja) 音声会議システム
JP4269854B2 (ja) 通話装置
JP4867542B2 (ja) マスキング装置
JP2011155500A (ja) モニタ制御装置及び音響システム
JP4929673B2 (ja) 音声会議装置
JP4470413B2 (ja) マイクロフォン・スピーカ一体構成型・通話装置
JP7524613B2 (ja) 音信号処理方法、音信号処理装置および音信号処理プログラム
JP4867248B2 (ja) スピーカ装置及び音声会議装置
JP2007258951A (ja) 通信会議装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111020

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111108

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141216

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4882757

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150