JP5082878B2 - Audio conferencing equipment - Google Patents
Audio conferencing equipment Download PDFInfo
- Publication number
- JP5082878B2 JP5082878B2 JP2008010131A JP2008010131A JP5082878B2 JP 5082878 B2 JP5082878 B2 JP 5082878B2 JP 2008010131 A JP2008010131 A JP 2008010131A JP 2008010131 A JP2008010131 A JP 2008010131A JP 5082878 B2 JP5082878 B2 JP 5082878B2
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- microphones
- speaker
- voice
- loudspeaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Set Structure (AREA)
- Telephone Function (AREA)
- Details Of Audible-Bandwidth Transducers (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本発明は、通信手段を用いて遠隔地同士の音声会議を可能とする音声会議装置に関するものである。 The present invention relates to an audio conference apparatus that enables an audio conference between remote locations using communication means.
近年、通信手段を用いて遠隔地同士の音声会議を可能とする音声会議装置が普及しつつある。このような音声会議装置は、それぞれの設置場所において複数の人がいても使用できるよう設計されていることが望ましい。代表的な例としては、可聴音を電気信号に変換する複数のマイクロホン装置と、電気信号を可聴音に変換するラウドスピーカと、それらマイクロホン装置とラウドスピーカとを電話回線に電気的に接続する音声通信網とからなり、マイクロホン装置は少なくとも一方向から放散する音に対し他の方向からのそれよりも高感度であるような指向性ポーラー感度特性を有し、さらにそのポーラー感度特性は、主ローブ、サイドローブ、及びローブのペア間にあるヌルを有し、ラウドスピーカは、主ローブと隣接するサイドローブの間にある上記ポーラー感度特性のヌルの位置に配置されたテレカンファレンス装置がある(例えば特許文献1参照)。 In recent years, a voice conference apparatus that enables a voice conference between remote locations using a communication means is becoming widespread. It is desirable that such an audio conference apparatus is designed so that it can be used even if there are a plurality of people at each installation location. As a typical example, a plurality of microphone devices that convert audible sound into electrical signals, a loudspeaker that converts electrical signals into audible sound, and audio that electrically connects the microphone device and the loudspeaker to a telephone line. The microphone device has a directional polar sensitivity characteristic that is more sensitive to sound radiating from at least one direction than that from the other direction, and the polar sensitivity characteristic is the main lobe. , Side lobes, and nulls between the pair of lobes, and the loudspeaker is a teleconference device located at the null position of the polar sensitivity characteristic between the main lobe and the adjacent side lobe (e.g. Patent Document 1).
このテレカンファレンス装置が備えるラウドスピーカは主ローブと隣接サイドローブのポーラー感度パターンのヌルに設置されおり、その結果ラウドスピーカとマイクロホンの間の音響結合が実質上減少するので、全二重動作、すなわち互いに相手の音声をラウドスピーカより出力させて話を聞きながらマイクロホンを用いて発音することが可能である。さらにこのテレカンファレンス装置は、壁もしくは天井からの直接通話の反響から来る無方向音声をマイクロホンがピックアップすることにより起こる室内の残響や室内雑音を低減するための第1のエコーキャンセラや、送信チャネルと受信チャネルを電話回線に接続するハイブリッド回路からの電気的エコー(ハイブリッドエコー)を低減するための第2のエコーキャンセラを有している。これらの構成により、さらに高品質な全二重動作を可能にする。
しかしながら、テレカンファレンス装置で使用される各マイクロホンの指向性ポーラー感度特性には製造上の特性バラつきが存在し、主ローブ・サイドローブの大きさやヌルの位置がマイクロホンによって異なる。この特性バラつきを低減するためには、各マイクロホンの取り付け角度の微調整や集音感度の微調整、さらに場合によっては取り付けるマイクロホンの選別を行わなければならない。これらはテレカンファレンス装置の製造工数の増加や使用されるマイクロホンの歩留まりの低下を引き起こし、装置全体の製造コストの増加につながる。 However, the directional polar sensitivity characteristics of each microphone used in the teleconference device have manufacturing characteristic variations, and the size of the main lobe and side lobe and the position of the null differ depending on the microphone. In order to reduce this characteristic variation, it is necessary to finely adjust the mounting angle of each microphone, finely adjust the sound collection sensitivity, and in some cases select the microphone to be attached. These cause an increase in the man-hours for manufacturing the teleconference device and a decrease in the yield of the microphones used, leading to an increase in the manufacturing cost of the entire device.
また、このようなマイクロホンの指向性ポーラー感度特性は、経年変化により主ローブ・サイドローブの大きさやヌルの位置が変化する。そうするとテレカンファレンス装置の全二重動作の品質が低下する。 In addition, in the directional polar sensitivity characteristic of such a microphone, the size of the main lobe and side lobe and the position of the null change with time. This will reduce the quality of the full-duplex operation of the teleconference device.
さらに、装置を使用するユーザは通常、マイクロホンに対する正面方向、すなわちこのテレカンファレンス装置においては各マイクロホンの中心と装置の中心(つまりラウドスピーカの中心)とを結ぶ線上にマイクロホンの主ローブがあるものと考えるはずである。しかしながら、このテレカンファレンス装置の主ローブは前記線上と直交する方向にある。つまり、ユーザが自分の音声を集音してくれていると考えていたのとは別のマイクの集音感度のほうが実際には高い、ということが発生し得る。このことはユーザに違和感を与え、装置自体が自ら有している複数のマイクロホンを用いて話者選択制御を行う場合に誤動作を引き起こしてしまう要因となり得る。 Furthermore, the user who uses the device usually has the main lobe of the microphone in the front direction with respect to the microphone, that is, in the teleconference device, on the line connecting the center of each microphone and the center of the device (that is, the center of the loudspeaker). I should think about it. However, the main lobe of this teleconference device is in a direction perpendicular to the line. In other words, it may happen that the sound collection sensitivity of a microphone other than the user's thought of collecting his / her voice is actually higher. This gives a sense of incongruity to the user, and may cause a malfunction when performing speaker selection control using a plurality of microphones that the device itself has.
この主ローブの設定方向に関する問題を回避するためには、主ローブと逆方向にヌルを有するマイクロホンの主ローブを各マイクロホンの中心と装置の中心すなわちラウドスピーカの中心とを結ぶ線上に配置し、かつそのマイクロホンのヌルの方向にラウドスピーカを配置することが望ましい。しかしながら、そのような指向性ポーラー感度特性を有するマイクロホンを使用したとしても、各マイクロホンの指向性ポーラー感度特性にはやはり前述の製造上の特性バラつきが存在し、装置の製造工数の増加や使用されるマイクロホンの歩留まりの低下を引き起こし、装置全体の製造コストの増加につながる。 In order to avoid this problem regarding the setting direction of the main lobe, the main lobe of the microphone having a null in the direction opposite to the main lobe is arranged on a line connecting the center of each microphone and the center of the apparatus, that is, the center of the loudspeaker, And it is desirable to arrange a loudspeaker in the null direction of the microphone. However, even if a microphone having such a directional polar sensitivity characteristic is used, the directional polar sensitivity characteristic of each microphone still has the above-mentioned manufacturing characteristic variation, and the number of manufacturing steps of the apparatus is increased or used. Lowering the yield of microphones, leading to an increase in the manufacturing cost of the entire device.
また、上記従来の構成を有するテレカンファレンス装置は室内の残響や室内雑音を低減するための第1のエコーキャンセラを有しているが、実際にはこの他に装置筐体内での反射や振動による残響も存在する。これらの残響は、例えラウドスピーカから出力された同じ音により発生したものであってもマイクロホンへの到達時間が異なるため、第1のエコーキャンセラによる残響低減処理を困難かつ複雑なものとし、場合によっては処理が発散したり処理不能に陥ったりすることになる。 In addition, the teleconference device having the above-described conventional configuration has a first echo canceller for reducing indoor reverberation and room noise, but actually, in addition to this, it is caused by reflection or vibration in the device casing. There is also reverberation. Even if these reverberations are generated by the same sound output from the loudspeaker, the arrival time to the microphone is different, so that the reverberation reduction processing by the first echo canceller is difficult and complicated. Will diverge or become unprocessable.
また、上記従来の構成を有するテレカンファレンス装置のエコーキャンセラは、基本的にマイクロホンとラウドスピーカとの間に挿入されているものであり、ラウドスピーカでの電気信号から空気振動への変換時における音響的ひずみ(ラウドスピーカの固有振動数や周波数特性に起因する)によるエコー信号や、ラウドスピーカの振動に伴うテレカンファレンス装置の筐体振動などによるエコー信号などのいわゆる非線形エコーに対してはエコーキャンセル効果が得られにくいという課題を有していた。特に安価なラウドスピーカにおいては高周波ひずみが問題となっていた。 Moreover, the echo canceller of the teleconference device having the above-described conventional configuration is basically inserted between the microphone and the loudspeaker, and the sound at the time of conversion from the electric signal to the air vibration at the loudspeaker. Cancel effect for so-called non-linear echo such as echo signal due to mechanical distortion (due to natural frequency and frequency characteristics of loudspeaker) and echo signal due to housing vibration of teleconference device due to loudspeaker vibration Has a problem that it is difficult to obtain. Particularly in an inexpensive loudspeaker, high-frequency distortion has been a problem.
本発明は、ユーザに違和感を与えたり誤動作を引き起こしたりすること無く、各集音部の指向性ポーラー感度特性のバラつきと経年変化が低減でき、残響低減処理の負担を低減でき、高品質な全二重動作が可能となる音声会議装置を提供することを目的とする。 The present invention can reduce variations in directional polar sensitivity characteristics and secular change of each sound collection unit without causing a sense of incongruity or malfunctioning to the user, and can reduce the burden of reverberation reduction processing. An object of the present invention is to provide an audio conference apparatus capable of dual operation.
この課題を解決するため、本発明の音声会議装置は、受話音声を出力するスピーカと、送話音声およびスピーカからの音声を集音して音声信号を出力する第一のマイクロホンと前記第一のマイクロホンより前記スピーカから近い位置に設けられ送話音声およびスピーカからの音声を集音して音声信号を出力する第二のマイクロホンを有するマイクユニットと、前記マイクユニットの感度特性を形成する感度特性形成手段と、を有し、前記感度特性形成手段は、前記第一のマイクロホンからの音声信号を一定時間遅延させて出力する第一の遅延手段と、前記第二のマイクロホンからの音声信号を一定時間遅延させて出力する第二の遅延手段と、前記第一のマイクロホンからの音声信号と前記第二の遅延手段からの出力を元に前記スピーカからの音声を打ち消しあうようにすることで前記送話音声を強調して出力する第一の演算手段と、前記第二のマイクロホンからの音声信号と前記第一の遅延手段からの出力を元に前記送話音声を打ち消しあうようにすることで前記スピーカからの音声を強調して出力する第二の演算手段と、前記第二の演算手段の出力を前記第一の演算手段の出力から減算する第三の演算手段と、前記第一のマイクロホンと前記第二のマイクロホンの距離をd、音速をcとした場合、前記第一の遅延手段の遅延時間τ 1 は、前記第一、第二のマイクロホンを結ぶ線の延長線と、前記スピーカ中心と前記第一、第二のマイクロホンの中間点とを結ぶ延長線とのなす角度をθ 1 として、τ 1 =d・cosθ 1 /cとなり、前記第二の遅延手段の遅延時間τ 2 は、前記第一、第二のマイクロホンを結ぶ線の延長線と、前記第一、第二のマイクロホンの中間点と送話者とを結ぶ線とのなす角度
θ 2 として、τ 2 =d・cosθ 2 /cとなることを特徴とする。
In order to solve this problem, an audio conference apparatus according to the present invention includes a speaker that outputs a received voice, a first microphone that collects a transmitted voice and a voice from the speaker, and outputs a voice signal, and the first microphone. A microphone unit having a second microphone that is provided nearer to the speaker than the microphone and collects the transmitted voice and the voice from the speaker and outputs a voice signal, and sensitivity characteristic formation that forms the sensitivity characteristic of the microphone unit And the sensitivity characteristic forming means delays the audio signal from the first microphone for a predetermined time and outputs the audio signal from the second microphone for a predetermined time. Second delay means for outputting after delay, audio signal from the first microphone and output from the speaker based on the output from the second delay means First transmission means that emphasizes and outputs the transmitted voice by canceling voices, and based on the audio signal from the second microphone and the output from the first delay means. Second computing means for emphasizing and outputting the sound from the speaker by canceling out the spoken voice, and third for subtracting the output of the second computing means from the output of the first computing means When the distance between the computing means and the first microphone and the second microphone is d and the speed of sound is c, the delay time τ 1 of the first delay means is the first and second microphones. Assuming that the angle formed between the extension line of the connecting line and the extension line connecting the center of the speaker and the midpoint of the first and second microphones is θ 1 , τ 1 = d · cos θ 1 / c, and the second The delay time τ 2 of the delay means is the first time The angle between the extension of the line connecting the second microphone and the line connecting the midpoint of the first and second microphones and the sender
θ 2 is characterized in that τ 2 = d · cos θ 2 / c .
この構成により、ラウドスピーカとの音響結合が小さくなり、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化も低減される。 With this configuration, the acoustic coupling with the loudspeaker is reduced, the user does not feel uncomfortable, and variations in sensitivity characteristics of each sound collection unit and secular change are reduced.
本発明によれば、ラウドスピーカとの音響結合が小さくなり、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化も低減されるので、高品質な全二重動作が可能となる。さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを防ぐことが出来る。またさらには、非線形エコーについても低減することができる。 According to the present invention, the acoustic coupling with the loudspeaker is reduced, the user does not feel uncomfortable, the variation in sensitivity characteristics of each sound collecting unit and the secular change are reduced, so that all high quality Double operation is possible. Furthermore, unexpected malfunctions caused by the main lobe of the sensitivity characteristic being formed in a direction completely different from what is potentially felt by the user, for example, erroneous reverberation processing and direction adjustment control problems can be prevented. Furthermore, it is possible to reduce the non-linear echo.
第1の発明は、送話音声信号を集音するための複数の無指向性マイクロホン装置からなるマイクユニットと、受話音声信号を拡声するためのラウドスピーカと、送話音声信号および受話信号を送受信するための通信手段とを有し、さらにマイクユニットの音響的中心における収音方向を角度とし感度の大きさを半径方向としてマイクユニットの感度特性を表現する場合に、マイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ放射線と直交しかつマイクユニットの音響的中心を通過する直交線を境界として、境界よりもラウドスピーカ側に形成される感度特性の面積が他方より小さくなるようマイクユニットの感度特性を形成する感度特性形成手段と、を設けた。 A first invention is a microphone unit composed of a plurality of omnidirectional microphone devices for collecting transmission voice signals, a loudspeaker for amplifying reception voice signals, and transmission / reception of transmission voice signals and reception signals. Communication means, and when the sensitivity characteristic of the microphone unit is expressed with the sound collection direction at the acoustic center of the microphone unit as an angle and the magnitude of sensitivity as a radial direction, The microphone is such that the area of the sensitivity characteristic formed on the loudspeaker side is smaller than the other, with an orthogonal line orthogonal to the radiation connecting the acoustic center of the loudspeaker and passing through the acoustic center of the microphone unit as the boundary. And sensitivity characteristic forming means for forming the sensitivity characteristic of the unit.
これにより、マイクユニットとラウドスピーカとの音響結合が小さくなり、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化も低減されるので、高品質な全二重動作が可能となる。さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを低減することが出来る。またさらには、非線形エコーについても低減することができる。 As a result, the acoustic coupling between the microphone unit and the loudspeaker is reduced, the user does not feel uncomfortable, the variation in sensitivity characteristics of each sound collection unit and the secular change are reduced. Double operation is possible. Furthermore, it is possible to reduce unexpected malfunctions caused by the main lobe of the sensitivity characteristic being formed in a direction completely different from what is potentially felt by the user, for example, erroneous reverberation processing or malfunction of the directivity adjustment control. . Furthermore, it is possible to reduce the non-linear echo.
第2の発明は、第1の発明において、複数のマイクロホンのうち少なくとも一つは他よりラウドスピーカに近い位置に配置した構成とした。 According to a second invention, in the first invention, at least one of the plurality of microphones is arranged closer to the loudspeaker than the other microphones.
これにより、マイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ放射線と直交する線を境界として、その境界よりもラウドスピーカ側に形成される感度特性の面積が他方より小さくなるので、マイクユニットとラウドスピーカとの音響結合を小さくできる。 Thereby, since the area perpendicular to the radiation connecting the acoustic center of the microphone unit and the acoustic center of the loudspeaker is a boundary, the area of the sensitivity characteristic formed on the loudspeaker side is smaller than the other, The acoustic coupling between the microphone unit and the loudspeaker can be reduced.
第3の発明は、第2の発明において、複数のマイクロホンの集音口を有する面と複数のマイクロホンを保護するためのマイクユニット保護部材上面との距離は、マイクロホンのそれ以外の面と保護部材との距離よりも小さくなる構成とした。 According to a third invention, in the second invention, the distance between the surface having the sound collection ports of the plurality of microphones and the upper surface of the microphone unit protection member for protecting the plurality of microphones is the same as the distance between the other surface of the microphone and the protection member. It was set as the structure smaller than the distance.
これにより、マイクユニットはラウドスピーカからの一次粗密波を主に集音することができ、マイクユニット内での反射音が拾いにくくなるので、残響低減処理の負担が低減され、さらに高品質な全二重動作が可能となる。 As a result, the microphone unit can mainly collect the primary dense wave from the loudspeaker, and it becomes difficult to pick up the reflected sound in the microphone unit. Dual operation is possible.
第4の発明は、第2の発明において、マイクユニットは2つの無指向性マイクロホン装置がマイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ放射線上に並べて配置された構成とした。 In a fourth aspect based on the second aspect, the microphone unit is configured such that two omnidirectional microphone devices are arranged side by side on the radiation connecting the acoustic center of the microphone unit and the acoustic center of the loudspeaker.
これにより、最小個数の無指向性マイクロホンにてマイクユニットを構成可能であり、従って安価な装置コストで高品質な全二重動作が可能となる。 As a result, the microphone unit can be configured with the minimum number of omnidirectional microphones, and therefore high-quality full-duplex operation can be performed at a low device cost.
第5の発明は、第4の発明において、2つの無指向性マイクロホン装置の音響的中心間の距離dは、サンプリング周波数をFs、音速をc、最高処理可能周波数をf、その波長をλとした場合に、d=c/2Fs=c/4f=(1/4)λとなるように構成した。 According to a fifth aspect of the present invention, in the fourth aspect, the distance d between the acoustic centers of the two omnidirectional microphone devices includes a sampling frequency Fs, a sound velocity c, a maximum processable frequency f, and a wavelength λ. In this case, d = c / 2Fs = c / 4f = (1/4) λ.
これにより、音声通話として十分な音質感が得られ、かつ残響低減処理の負担や誤動作が軽減されるので、高品質な全二重動作が可能となる。さらには、特に高周波ひずみに対する非線形エコーの低減効果が増す。 As a result, a sound quality sufficient for a voice call can be obtained, and the burden and malfunction of reverberation reduction processing can be reduced, so that high-quality full-duplex operation is possible. Furthermore, the effect of reducing non-linear echo particularly with respect to high-frequency distortion is increased.
第6の発明は、第5の発明において、マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、2つの無指向性マイクロホン装置の延長線と、スピーカの音響的中心とマイクロホン装置とを結ぶ線が交差する角度をθとして、d’=d/cosθへと補正するように構成した。 According to a sixth invention, in the fifth invention, the distance d between the acoustic centers of the two omnidirectional microphone devices of the microphone unit is defined as an extension line of the two omnidirectional microphone devices and an acoustic center of the speaker. The angle at which the line connecting the microphone device intersects is assumed to be θ, and d ′ = d / cos θ is corrected.
これにより、2つの無指向性マイクロホン装置の延長線がスピーカの音響的中心を通らない場合においても、スピーカの音響的中心から見た2つの無指向性マイクロホン装置の間隔が、第5の発明の条件を満たすので、十分な指向特性を得ることが可能となる。 Thus, even when the extension line of the two omnidirectional microphone devices does not pass through the acoustic center of the speaker, the distance between the two omnidirectional microphone devices viewed from the acoustic center of the speaker is the same as that of the fifth invention. Since the condition is satisfied, sufficient directivity can be obtained.
第7の発明は、第5の発明において、マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、電気雑音や量子化雑音に対する音響信号のSN比が確保される距離d'>dへと補正するように構成した。 According to a seventh aspect, in the fifth aspect, the distance d between the acoustic centers of the two omnidirectional microphone devices of the microphone unit is the distance d at which the S / N ratio of the acoustic signal with respect to electrical noise or quantization noise is ensured. It was configured to correct to '> d.
これにより、固定小数点演算による量子化雑音や電気基板の雑音など、雑音の影響が無視できない条件において、可能な範囲で十分な指向特性を得る事が出来る。 As a result, sufficient directivity characteristics can be obtained as far as possible under conditions where the influence of noise cannot be ignored, such as quantization noise due to fixed-point arithmetic and noise on the electric board.
第8の発明は、第7の発明において、マイクユニットの2つの無指向性マイクロホン装置の音響的中心間の距離dを、電気雑音に対する音響信号のSN比が35dB以上になる距離d'>dへと補正するように構成した。 In an eighth aspect based on the seventh aspect, the distance d between the acoustic centers of the two omnidirectional microphone devices of the microphone unit is defined as the distance d ′> d at which the S / N ratio of the acoustic signal to the electrical noise is 35 dB or more. It was configured to correct.
これにより、一般的な16ビット固定小数点演算による量子化雑音の下限値である35dBよりも音響信号のSN比が上回るため、16ビット固定小数点演算における最大限の指向特性を得る事が可能となる。 As a result, the SN ratio of the acoustic signal is higher than 35 dB, which is the lower limit value of quantization noise by a general 16-bit fixed-point operation, so that it is possible to obtain the maximum directivity characteristics in the 16-bit fixed-point operation. .
第9の発明は、第4の発明において、感度特性形成手段は、2つの無指向性マイクロホンのうちラウドスピーカに近い側にある無指向性マイクロホンからの入力を一定時間遅延させて出力する第一の遅延手段と、2つの無指向性マイクロホンのうちラウドスピーカから遠い側にある無指向性マイクロホンからの入力を一定時間遅延させて出力する第二の遅延手段と、ラウドスピーカから遠い側にある無指向性マイクロホンからの入力に対し第一の遅延手段の出力を減算する第一の演算手段と、ラウドスピーカに近い側にある無指向性マイクロホンからの入力に対し第二の遅延手段の出力を減算する第二の演算手段と、第二の演算手段の出力を入力し適応学習を行う適応フィルタ手段と、第一の遅延手段の出力から適応フィルタ手段の出力を減算する第三の演算手段と、を有する構成とした。 In a ninth aspect based on the fourth aspect, the sensitivity characteristic forming means delays the input from the omnidirectional microphone on the side closer to the loudspeaker out of the two omnidirectional microphones and outputs the delayed first time. Of the two omnidirectional microphones, second delay means for delaying the input from the omnidirectional microphone on the side far from the loudspeaker for a fixed time, and output on the side farther from the loudspeaker. The first computing means for subtracting the output of the first delay means from the input from the directional microphone and the output of the second delay means from the input from the omnidirectional microphone on the side close to the loudspeaker The second computing means, the adaptive filter means for performing adaptive learning by inputting the output of the second computing means, and the output of the adaptive filter means from the output of the first delay means. A third calculating means for, and configured to have.
これにより、ラウドスピーカに近い側のマイクロホンの入力はラウドスピーカからの受話者の音声が強調され、他のマイクロホンの入力は送話者の音声が強調されるので、受話者音声信号と送話者の残響音の減算が容易となり、スピーカ部から複数のマイクロホンに入力される音声がさらに打ち消されるとともに、音声会議装置の周辺環境により発生する残響音も低減され、音声会議装置の使用者(送話者)の音声が極めて明瞭に、相手側の音声会議装置へと送出される。 As a result, the microphone input closer to the loudspeaker emphasizes the voice of the receiver from the loudspeaker, and the input of the other microphone emphasizes the voice of the sender. The reverberant sound can be easily subtracted, the sound input from the speaker unit to the plurality of microphones is further canceled, and the reverberant sound generated by the surrounding environment of the audio conference device is also reduced. The other party's voice is transmitted to the other party's voice conference apparatus very clearly.
第10の発明は、第9の発明において、第一および第二の遅延手段の遅延時間τは、サンプリング周波数をFs、最高処理可能周波数をfとした場合に、τ=d/cとなるように構成した。 In a tenth aspect based on the ninth aspect, the delay time τ of the first and second delay means is τ = d / c when the sampling frequency is Fs and the maximum processable frequency is f. Configured.
これにより、送話者の音声および受話者の音声強調処理が最適となり、残響低減処理の負担がより軽減されるので、より高品質な全二重動作が可能となる。 Thereby, the voice of the sender and the voice of the receiver are optimized, and the burden of the reverberation reduction process is further reduced, so that a higher-quality full-duplex operation can be performed.
第11の発明は、第2の発明において、マイクユニットは装置筐体上面から見てラウドスピーカの音響的中心の同心円面上に複数配置され、それらのマイクユニットの感度特性は互いに略同一であり、かつそれらのマイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ放射線が隣接するマイクユニットの音響的中心とラウドスピーカの音響的中心とを結ぶ線となす角度は同一である構成とした。 According to an eleventh aspect, in the second aspect, a plurality of microphone units are arranged on a concentric circle at the acoustic center of the loudspeaker when viewed from the upper surface of the apparatus housing, and the sensitivity characteristics of the microphone units are substantially the same. And the angle between the radiation connecting the acoustic center of the microphone unit and the acoustic center of the loudspeaker and the line connecting the acoustic center of the adjacent microphone unit and the acoustic center of the loudspeaker is the same. did.
これにより、あらゆる方向に存在する送話者の音声の集音不均一が低減され、さらに高品質な全二重動作が可能である。 As a result, non-uniform sound collection of the voices of the speakers present in all directions is reduced, and further high-quality full-duplex operation is possible.
第12の発明は、第11の発明において、マイクユニットを4つ配置する構成とした。 In a twelfth aspect according to the eleventh aspect, four microphone units are arranged.
これにより、上から俯瞰すれば圧倒的に長方形または正方形が多いテーブルや部屋の各辺からの集音の均一化を最小のマイクユニット数で実現でき、安価な装置コストでさらに高品質な全二重動作が可能となる。 This makes it possible to achieve uniform sound collection from each side of a table or room, which is overwhelmingly rectangular or square when viewed from above, with a minimum number of microphone units. Double operation is possible.
第13の発明は、第4の発明において、2つの無指向性マイクロホン装置の音響的中心間の距離xが、サンプリング周波数をFs、音速をc、最高処理可能周波数をf、その波長をλとした場合にx=hc/2Fs=hc/4f=(1/4)hλ(但しh<1)とするように構成した。 According to a thirteenth aspect, in the fourth aspect, the distance x between the acoustic centers of the two omnidirectional microphone devices is Fs as the sampling frequency, c as the sound speed, f as the maximum processable frequency, and λ as the wavelength. In this case, x = hc / 2Fs = hc / 4f = (1/4) hλ (where h <1).
これにより、マイクユニットに配置された2つのマイクロホンの間の距離がさらに縮まるので、それぞれのマイクロホンに異なる反射音が入力するのを低減することができ、さらに高品質な全二重動作が可能となる。さらには、特に高周波ひずみに対する非線形エコーの低減効果が増す。 As a result, the distance between the two microphones arranged in the microphone unit is further reduced, so that it is possible to reduce the input of different reflected sounds to each microphone, and a higher-quality full-duplex operation is possible. Become. Furthermore, the effect of reducing non-linear echo particularly with respect to high-frequency distortion is increased.
第14の発明は、第9の発明において、前記マイクユニット2つの無指向性マイクロホン装置の音響的中心間の距離をd、音速をcとした場合、前記第一の遅延手段の遅延時間τ1はτ1=d/cとなり、前記第二の遅延手段の遅延時間τ2は、2つの無指向性マイクロホン装置の延長線と、マイクロホン装置と通話者とを結ぶ線分との角度をθとして、τ2=d・cosθ/cとなるように構成した。 In a fourteenth aspect based on the ninth aspect, when the distance between the acoustic centers of the two omnidirectional microphone devices of the microphone unit is d and the speed of sound is c, the delay time τ 1 of the first delay means. Τ 1 = d / c, and the delay time τ 2 of the second delay means is θ, where θ is the angle between the extension line of the two omnidirectional microphone devices and the line segment connecting the microphone device and the caller. , Τ 2 = d · cos θ / c.
これにより、通話者の2つの無指向性マイクロホン装置の延長線上に位置しないような装置構成・デザイン構成の場合でも、τ2を通話者の音声が2つの無指向性マイクロホン装置にそれぞれ到達する時間の差に一致させる事が出来るので、通話者の音声をクリアに収音する事が可能になる。 Thus, even in the case of a device configuration / design configuration that does not lie on the extension line of the caller's two omnidirectional microphone devices, τ 2 is the time for the caller's voice to reach the two omnidirectional microphone devices, respectively. Therefore, the voice of the caller can be clearly picked up.
第15の発明は、第9の発明において、前記マイクユニット2つの無指向性マイクロホン装置の音響的中心間の距離をd、音速をcとした場合、前記第一の遅延手段の遅延時間τ1は、2つの無指向性マイクロホン装置の延長線と、スピーカ中心とマイクロホン装置とを結ぶ線が交差する角度をθ1として、τ1=d・cosθ1/cとなり、前記第二の遅延手段の遅延時間τ2は、2つの無指向性マイクロホン装置の延長線と、マイクロホン装置と通話者とを結ぶ線分との角度をθ2として、τ2=d・cosθ2/cとなるように構成した。 According to a fifteenth aspect, in the ninth aspect, when the distance between the acoustic centers of the two omnidirectional microphone devices of the microphone unit is d and the speed of sound is c, the delay time τ 1 of the first delay means. Is the angle at which the extension line of the two omnidirectional microphone devices and the line connecting the speaker center and the microphone device intersect, θ 1 , and τ 1 = d · cos θ 1 / c. The delay time τ 2 is configured to be τ 2 = d · cos θ 2 / c, where θ 2 is the angle between the extension line of the two omnidirectional microphone devices and the line segment connecting the microphone device and the talker. did.
これにより、通話者、およびスピーカの音響的中心が、2つの無指向性マイクロホン装置の延長線上にそれぞれ位置しないような装置構成・デザイン構成の場合でも、τ1はスピーカの信号が2つの無指向性マイクロホン装置に到達する時間の差に一致し、τ2は通話者の音声が2つの無指向性マイクロホン装置に到達する時間の差に一致させる事が出来るので、スピーカより再生された音声と通話者の音声とを正確に分離する事が可能となる。 Thus, even in the case of a device configuration / design configuration in which the acoustic center of the caller and the speaker is not located on the extension lines of the two omnidirectional microphone devices, τ 1 is the two omnidirectional signals of the speaker. Τ 2 can match the difference in the time required for the caller to reach the two omnidirectional microphone devices, so that τ 2 can match the difference in the time required to reach the directional microphone device. It is possible to accurately separate the person's voice.
以下、本発明の実施の形態について図面を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(実施の形態1)
図1は、本発明の実施の形態1における音声会議装置の斜視図、図2は、本発明の実施の形態1における音声会議装置の上面図であり、図1の音声会議装置を上面から見た図である。
(Embodiment 1)
1 is a perspective view of an audio conference apparatus according to
図1、図2において、1は音声会議装置、2a〜2dは使用者の音声を集音するための集音部、3は受話音声を再生するスピーカ部、4は発信/着信や各種設定などの操作を行う操作ボタン、5は通話や設定の状態などを表示する表示装置、6または7は相手側回線と接続する通信ケーブルである。6はEthernet(登録商標)ケーブル、7は電話線であり、6と7は通信手段に応じていずれか一方が使用される。実際には互いに離れた2つ以上の音声会議装置が通信手段を介し接続され使用される。 1 and 2, 1 is an audio conference device, 2a to 2d are sound collecting units for collecting user's audio, 3 is a speaker unit for reproducing received audio, 4 is outgoing / incoming calls, various settings, etc. Operation buttons 5 for performing the above operations are indicated by 5, a display device for displaying the state of calls and settings, and 6 or 7 is a communication cable for connecting to the partner line. 6 is an Ethernet (registered trademark) cable, 7 is a telephone line, and either 6 or 7 is used depending on the communication means. Actually, two or more audio conference apparatuses separated from each other are connected and used via communication means.
図3及び図4は、本発明の実施の形態1における2つの音声会議装置を接続した構成例を示す図であり、2つの音声会議装置1a、1bがEthernet(登録商標)ケーブル6を使用して接続された時の様子を示している。
3 and 4 are diagrams showing a configuration example in which two audio conference apparatuses according to
図3に示す音声会議装置1aおよび1bは、図1における音声会議装置1と同一のものである。音声会議装置1aおよび1bはそれぞれEthernet(登録商標)ケーブル6aおよび6bによりゲートウェイ10aおよび10bを介してインターネット11に接続され、互いに通話出来るようになっている。音声会議装置1aと1bとの間で送受信される音声の信号は、図3の場合、デジタル信号がパケット化されたデータである。
The
なお、ゲートウェイ10aやゲートウェイ10bには他の端末装置やハブやルータなどが接続されていても構わないし、ゲートウェイ10aと音声会議装置1aとの間またはゲートウェイ10bと音声会議装置1bとの間にも他の端末装置やハブやルータなどが接続されていても構わない。
Note that another terminal device, a hub, a router, or the like may be connected to the
また、図4に示すように、音声会議装置1aおよび1bがそれぞれ電話線7aおよび7bにより公衆電話回線12に接続されているものであっても良い。この場合、少なくとも電話線7aおよび7b上ではアナログ音声信号で送受信が行われる。
Further, as shown in FIG. 4, the
なお、本実施の形態における音声会議装置1aおよび1bは、それぞれの集音部(図2における音声会議装置1の2a〜2dに相当)に入力される当該音声会議装置の使用者の音声については、その音声会議装置に内蔵されたスピーカ部(図2における音声会議装置1のスピーカ部3に相当)には出力しないようにしている。これは、内蔵マイクロホンに入力された当該音声会議装置の使用者の音声を当該音声会議装置のスピーカから出力するようにした場合、ハウリングを起こしやすいためである。しかしながらもしハウリングが発生しないよう装置を構成することができるのであれば、内蔵マイクロホンに入力された当該音声会議装置の使用者の音声を当該音声会議装置のスピーカから出力するようにしても良い。
Note that the
以上の図1〜図4に示す構成により、音声会議装置1aを使用する話者と音声会議装置1bを使用する話者は互いに離れていながら会話を行うことができる。なお、それぞれの音声会議装置1aおよび1bを使用する話者は1人に限らず、複数人であってもよい。
1 to 4, the speaker who uses the
図5は、本発明の実施の形態1における音声会議装置のハードウェアブロック図を示している。
FIG. 5 shows a hardware block diagram of the audio conference apparatus according to
図5において、40はDSP内蔵のCPU、41はCPU40での各種処理を実行するためのプログラムソフトウェアを格納するプログラムメモリ、42はプログラムメモリ41に格納された各種プログラムをCPU40で実行するために必要となる作業用のメインメモリである。これらにより、MAC層レベル以上でのパケット処理や、ダイヤルトーンやメロディなどの出力処理が行われる。
In FIG. 5,
43はEthernet(登録商標)の物理層レベルでのプロトコル処理をおこなうためのPHYチップ、46はEthernet(登録商標)ケーブル6を接続するための通常RJ−45と呼ばれるコネクタである。CPU40で処理される音声データのパケットは、PHYチップ43、コネクタ46およびEthernet(登録商標)ケーブル6を介して送受信される。
また、CPU40にはキーボード44、LCD45、コントローラ47が接続されている。キーボード44は操作ボタン4の内部に格納され、LCD45は表示部5の内部に格納される。コントローラ47はキーボード44の入力処理を担当している。
In addition, a
50はエコーキャンセル処理を行うDSP、51はDSP50での各種処理を実行するためのプログラムソフトウェアを格納するプログラムメモリ、52はプログラムメモリ51に格納された各種プログラムをDSP50で実行するために必要となる作業用のワークメモリである。
50 is a DSP that performs echo cancellation processing, 51 is a program memory that stores program software for executing various processes in the
DSP50にはタイミング調整用PLD54およびCODEC部55を介してマイクロホン/スピーカ部56が接続されている。マイクロホン/スピーカ部56のアナログ入出力信号はCODEC部55においてデジタル化された後、DSP50においてマイクロホンとラウドスピーカとの間のエコーキャンセル処理が実行される。これらの部分ブロック58のより詳細なブロック図については後述の図6において説明する。マイクロホン/スピーカ部56は8個のマイクロホンと1個のラウドスピーカからなる。マイクロホンは集音部2a〜2dに各2個ずつ設置され、ラウドスピーカはスピーカ部3に設置されているが、これらのより詳細な構成についても後述の図6以降において行う。
A microphone /
本実施の形態における音声会議装置1が電話線7を介して公衆電話回線12に接続され使用される場合は、CODEC部55に対して電話線7を接続するための公衆回線I/F部57が図4の点線に示すようにさらに接続されるが、公衆回線I/F部57の詳細については省略する。
When the
図6は、本発明の実施の形態1におけるDSP、タイミング調整用PLD、CODEC部およびマイク/ラウドスピーカ部のブロック図であり、図5をより詳細に示したものである。 FIG. 6 is a block diagram of the DSP, timing adjustment PLD, CODEC unit, and microphone / loud speaker unit according to the first embodiment of the present invention, and shows FIG. 5 in more detail.
本実施の形態の場合、CODEC部55は2つのCODEC−IC55aおよび55bからなる。CODEC−IC55aおよび55bに対して8個のマイクロホン21a〜21d、22a〜22dおよびラウドスピーカ30が、図6に示すように、各マイク駆動回路61a〜61d、62a〜62dおよびスピーカ増幅回路63を介して接続される。マイクロホン21aとマイク駆動回路61aおよびマイクロホン22aとマイク駆動回路62aは、実際には2系統の独立した回路であるが、図6においてはマイク駆動回路61aと62aおよびそれらを介したマイクロホン21aおよびマイクロホン22aとCODEC部55との間の接続線は1つに省略されている。マイクロホン21b〜21dおよび22b〜22dとマイク駆動回路61b〜61dおよび62b〜62dとのそれぞれの関係も同様である。
In the case of the present embodiment, the
次に、本実施の形態の音声会議装置1に内蔵されるマイクロホンとラウドスピーカとの配置関係について説明する。
Next, the arrangement relationship between the microphone and the loudspeaker built in the
図7は、本発明の実施の形態1におけるラウドスピーカの説明図であり、ラウドスピーカ30の例を示している。
FIG. 7 is an explanatory diagram of the loudspeaker according to
図8は、本発明の実施の形態1におけるマイクロホンとラウドスピーカとの配置関係を示す図であり、マイクロホン21・22と図7に示すラウドスピーカ30が音声会議装置1に内蔵された場合の配置関係をその筐体上面から見た状態を示している。
FIG. 8 is a diagram showing an arrangement relationship between the microphone and the loudspeaker according to the first exemplary embodiment of the present invention. The arrangement in the case where the
図9は、本発明の実施の形態1におけるDSPのマイクロホンに係る処理ブロックを示す図であり、DSP50内においてマイクロホン21・22に関わる部分の処理ブロックを示している。
FIG. 9 is a diagram showing processing blocks related to the microphone of the DSP according to the first embodiment of the present invention, and shows processing blocks of portions related to the
図10は、本発明の実施の形態1におけるマイクロホンとラウドスピーカの配置関係を示す図であり、図8に示す音声会議装置1の集音部20a〜20dの一つに配置されたマイクロホン21・22とスピーカ部3に配置されたラウドスピーカ30との配置関係を断面方向から示したものである。
FIG. 10 is a diagram showing the positional relationship between the microphone and the loudspeaker according to the first exemplary embodiment of the present invention. The
図8の集音部2a〜2dおよびスピーカ部3において、マイクロホン21a〜21dおよび22a〜22dとラウドスピーカ30はそれらの位置がわかるよう描かれているが、実際にはそれぞれ集音部2およびスピーカ部3の内部に配置されているものであり、外部から直接視認することはできない。
In the
図6において、マイクロホン部21a〜21d、22a〜22dに入射した音波は電圧に変換され、CODEC部55によりデジタル信号化され、DSP50によりエコーキャンセル処理がなされ、図5のCPU40においてパケット処理がなされ、PHYチップ43およびコネクタ46を介してEthernet(登録商標)またはインターネット上にある相手側の音声会議装置(例えば図3において本会議装置を1aとするならば、相手側の音声会議装置は1b)へと送出される。
In FIG. 6, sound waves incident on the
図7(a)は、ラウドスピーカ30の背面図、図7(b)は、ラウドスピーカ30の側面方向から見た断面構成図、図7(c)はラウドスピーカ30の動作を簡潔に示すための概略断面図である。
7A is a rear view of the
ラウドスピーカ30は、詳細には図7(a)、(b)に示すような構造を有しているが、原理的には図7(c)に示すとおり、振動板であるコーン紙31、コイル35、磁石37により動作の説明が可能である。すなわち、コイル35に図5におけるスピーカ増幅回路63からの音声の電気信号を流せば、フレミングの法則によってコイル35につながっているコーン紙31が前後に振動して音になる。コーン紙31の振動方向は図7(a)〜(c)に示すとおりである。
The
ラウドスピーカ30から出力されるのはEthernet(登録商標)またはインターネット上にある相手側の音声会議装置(例えば図2において本会議装置を1aとするならば、相手側の音声会議装置は1b)において集音された音声であり、図6におけるコネクタ46およびPHYチップ43を介して受信された相手側の音声会議装置からのパケットがCPU40においてパケット処理がなされ、DSP50を介してCODEC部55によりアナログ信号に変換された後、スピーカ増幅回路63により増幅された信号が入力される。
The output from the
本実施の形態の音声会議装置1においては、以上のようなマイクロホン21a〜21d・22a〜22dおよびラウドスピーカ30が、図8に示す21a〜21dおよび22a〜22dのように配置される。すなわち、各マイクロホン21a〜21dおよび22a〜22dの振動板の振動方向はラウドスピーカ30により発生する疎密波の伝播方向に対し略直交し、かつラウドスピーカ30に対し第1のマイクロホン21a〜21dよりも第2のマイクロホン22a〜22dのほうが距離dだけ近くに設置されている。本実施の形態の場合、2つのマイクロホン21a・22a〜21d・22dのそれぞれの間の距離dは(数1)に示すように、最高処理周波数fの波長の1/4とする。
In the
2つのマイクロホン21a・22a〜21d・22dのそれぞれの間の距離dを、d=(1/4)λ程度に設定する事が望ましい理由を図11により説明する。
The reason why it is desirable to set the distance d between the two
図11の円グラフ(a)と(b)はマイクロホン組の信号処理によって合成される、最高周波数付近の指向性を示すポーラパターンであり、死角方向の感度が最小になる事が望ましい。図11(b)の円グラフのようにマイクの間隔dがλの1/4倍よりも大きくなると、死角方向に空間的な折り返しが発生してしまう。一方、図11(a)の円グラフのようにマイクの間隔dがλの1/4倍に等しいと、死角方向の感度が比較的低くなり、望ましい指向特性を得ることが出来る。逆に、マイクの間隔dがλの1/4倍より小さくなる場合、図12のグラフに示すように、死角と反対側の主ローブの感度はマイクロホンの間隔dに比例するため、感度が低下して相対的に雑音が大きくなり、音声品質が損なわれる。以上より、これら両方が最適なマイクロホン間隔は、d=λ/4の近傍となる。 The pie charts (a) and (b) in FIG. 11 are polar patterns indicating directivity near the highest frequency, which are synthesized by signal processing of a microphone set, and it is desirable that sensitivity in the blind spot direction is minimized. As shown in the pie chart of FIG. 11B, when the microphone distance d is larger than ¼ of λ, spatial folding occurs in the blind spot direction. On the other hand, when the microphone interval d is equal to ¼ times λ as in the pie chart of FIG. 11A, the sensitivity in the blind spot direction is relatively low, and a desirable directivity can be obtained. Conversely, when the microphone distance d is smaller than ¼ of λ, the sensitivity of the main lobe opposite to the blind spot is proportional to the microphone distance d as shown in the graph of FIG. As a result, noise is relatively increased and voice quality is impaired. Accordingly, the optimum microphone interval for both of these is in the vicinity of d = λ / 4.
空気中での音速度cは通常340m/秒であり、最高処理可能周波数は本実施の形態1の場合7kHzとなるが、その場合のマイク間隔dは約12mmとなる。 The sound speed c in the air is normally 340 m / sec, and the maximum processable frequency is 7 kHz in the case of the first embodiment, but the microphone interval d in that case is about 12 mm.
最高処理可能周波数を7kHzとする第1の理由は、ここまでの周波数の音声が処理できれば音声通話として十分な音質感が得られることにある。最高処理周波数fが高くすればより高音質な音声通話が可能となるように思えるが、実際には本実施の形態に示すような音声会議装置においては使用者が実感できるほどの音質感の違いが得られず、逆に、(数1)を見ればわかるように、そのためにサンプリング周波数Fsも上げなければならないので、DSP50の演算量が増加してしまう。
The first reason for setting the maximum processable frequency to 7 kHz is that a sound quality sufficient for a voice call can be obtained if the sound having the frequency so far can be processed. Although it seems that voice communication with higher sound quality can be performed if the maximum processing frequency f is increased, the difference in sound quality that can be actually felt by the user in the audio conference apparatus as shown in the present embodiment. On the contrary, as can be seen from (Equation 1), the sampling frequency Fs must be increased for this purpose, so that the calculation amount of the
最高処理可能周波数を7kHzとする第2の理由としては、通常のADコンバータのアンチエイリアスフィルタの阻止域はサンプリング周波数の0.5倍よりも低い周波数に設定されるので、一般的な16kHzサンプリングのADコンバータにおける実用的な最高周波数は7kHz程度となる。 The second reason for setting the maximum processable frequency to 7 kHz is that the stop band of the anti-aliasing filter of a normal AD converter is set to a frequency lower than 0.5 times the sampling frequency, and therefore a general 16 kHz sampling AD is used. The practical maximum frequency in the converter is about 7 kHz.
2つのマイクロホンの距離をd=(1/4)λから補正する例について、図13を用いて説明する。2つのマイクロホンの音響的中心を結んだ線の延長上に、スピーカの音響的中心が位置しない場合、スピーカの音響的中心と2つのマイクロホンの中間位置とを結ぶ線が、2つのマイクロホンの延長線と交差する角度をθとして、間隔をd’=d/cosθ へと補正する事が望ましい。これにより、スピーカの音響的中心から2つのマイクロホンに到達する音波の伝播方向における行程差が、d=(1/4)の条件を満たす事になり、感度と指向特性の点で望ましい性能を得ることが出来る。例えば、d=(1/4)λ=12mmで、角度θが30度の場合は、d’=12mm/cos30°=約14mmに補正すればよい。
An example of correcting the distance between two microphones from d = (1/4) λ will be described with reference to FIG. When the acoustic center of the speaker is not located on the extension of the line connecting the acoustic centers of the two microphones, the line connecting the acoustic center of the speaker and the intermediate position of the two microphones is an extension line of the two microphones. It is desirable to correct the interval to d ′ = d / cos θ, where θ is the angle that intersects with. As a result, the stroke difference in the propagation direction of the sound wave reaching the two microphones from the acoustic center of the speaker satisfies the condition of d = (1/4), and a desirable performance is obtained in terms of sensitivity and directivity. I can do it. For example, if d = (1/4) λ = 12 mm and the angle θ is 30 degrees, d ′ = 12 mm /
2つのマイクロホンの距離dを補正するもう一つの例について、図14を用いて説明する。固定小数点演算による量子化雑音や電気基板の雑音など、一定の大きさの雑音の混入が避けられない条件下で、図14(a)の2つのマイクロホンの音響的中心間の距離dを、図14(b)のグラフに示すd=(1/4)λに設定すると、上記雑音に対する音響信号のSN比が不足する場合がある。そのような場合は、マイクロホンの間隔dをSN比が確保できる距離d'=(1/4)λ+α>dへと補正する必要がある。これにより、量子化雑音や電気ノイズなどの雑音の影響が無視できない条件においても、妥当な指向性能を得る事が出来る。例えば、d=(1/4)λ=12mmの場合、d’=約14mmに補正する。 Another example of correcting the distance d between two microphones will be described with reference to FIG. The distance d between the acoustic centers of the two microphones in FIG. 14 (a) is shown under the condition that a certain amount of noise, such as quantization noise due to fixed-point arithmetic and electric board noise, cannot be avoided. When d = (1/4) λ shown in the graph of 14 (b) is set, the SN ratio of the acoustic signal to the noise may be insufficient. In such a case, it is necessary to correct the distance d of the microphones to a distance d ′ = (1/4) λ + α> d at which an S / N ratio can be ensured. This makes it possible to obtain reasonable directivity even under conditions where the influence of noise such as quantization noise and electrical noise cannot be ignored. For example, when d = (1/4) λ = 12 mm, d ′ is corrected to about 14 mm.
上記の雑音による距離dの補正の具体的な例としては、図14の(a)と(b)のグラフに示すように、音響信号のSN比が約35dBを上回るように、距離dを(1/4)λよりも少し大きな値に補正する場合がある。これは、一般的な16ビット固定小数点演算による量子化雑音の下限値が35dB前後であるので、その条件下で得られる最大限の指向特性の実現が可能となる。 As a specific example of the correction of the distance d due to the noise, as shown in the graphs of FIGS. 14A and 14B, the distance d is set so that the SN ratio of the acoustic signal exceeds about 35 dB. In some cases, the value is corrected to a value slightly larger than ¼) λ. This is because the lower limit value of the quantization noise by general 16-bit fixed point arithmetic is around 35 dB, so that it is possible to realize the maximum directivity obtained under that condition.
図8のマイクユニットすなわち集音部2a〜2dにおいては、それぞれ2つの無指向性マイクロホン装置21a・22a〜21d・22dが集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ放射線81a〜81d上にそれぞれ並べて配置されている。各集音部2a〜2dにおける無指向性マイクロホンの数を2とすることにより、最小個数の無指向性マイクロホンにてマイクユニットすなわち各集音部2a〜2dを構成可能であり、従って安価な装置コストで高品質な全二重動作が可能となる。
In the microphone unit of FIG. 8, that is, the
さらに、マイクユニットすなわち集音部2a〜2dは音声会議装置1の筐体上面から見てラウドスピーカ30の音響的中心83を中心とする同心円面86上に複数、本実施の形態の場合は4つ配置されており、それらのマイクユニットすなわち集音部2a〜2dの感度特性85a〜85dは互いに略同一であり、かつそれらのマイクユニットすなわち集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ放射線81a〜81dが隣接する放射線となす角度は同一である。これにより、あらゆる方向に存在する送話者の音声の集音不均一が低減され、高品質な全二重動作が可能である。
Further, a plurality of microphone units, that is, the
それに加えマイクユニットすなわち集音部が4つ配置されているのは、テーブルや部屋を上から俯瞰すれば圧倒的に長方形または正方形が多いということによる。よってこの構成が最小のマイクユニット数でテーブルや部屋の各辺からの集音の均一化を最も期待できると言え、安価な装置コストでさらに高品質な全二重動作が可能となる。 In addition, four microphone units, that is, sound collecting units are arranged because the number of rectangles or squares is overwhelming when the table or room is viewed from above. Therefore, it can be said that this configuration can be expected most to equalize the sound collection from each side of the table or room with the minimum number of microphone units, and a higher-quality full-duplex operation is possible at a low cost.
ここで、集音部2a〜2dの各部の音響的中心における収音方向を角度とし感度の大きさを半径方向として、集音部2a〜2dの感度特性85a〜85dを表現する場合について考える。集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ各放射線81a〜81dのそれぞれに直交しかつ音響的中心82a〜82d上を通過する直交線84a〜84dを境界として、それらの境界よりも各集音部2a〜2dの感度特性85a〜85dのラウドスピーカ30側に形成される面積が他方より小さくなるよう、後述の感度特性形成手段により各集音部2a〜2dの2組のマイクロホン21a〜21dおよび22a〜22dを用いて感度特性85a〜85dが形成されている。すなわち感度特性85a〜85dの主ローブは、音声会議装置1の使用者が潜在的かつ無意識に考えている方向、つまり各放射線81a〜81d上であってラウドスピーカ30とは反対の方向に形成されている。
Here, a case will be considered in which the
ここで集音部2a〜2dの音響的中心は、複数の無指向性マイクロホン装置、すなわち本実施の形態1の場合は各2組のマイクロホン21a〜21dおよび22a〜22dをその振動板の振動方向から見た場合の振動板の中心といずれも等距離にある点を仮想的に設定している。また、ラウドスピーカ30の音響的中心83についても、ラウドスピーカ30の振動板を振動方向から見た場合の中心を仮想的に設定している。
Here, the acoustic centers of the
重要なのは、各マイクロホン21a〜21dおよび22a〜22dの振動板の振動方向がラウドスピーカにより発生する疎密波の伝播方向に対し略直交し、ラウドスピーカ30に対し各集音部2a〜2dにおける各第1のマイクロホン21a〜21dよりも各第2のマイクロホン22a〜22dのほうがより近くに設置されていることである。後述の感度特性形成手段は、このようなマイクロホンの配置により初めて図8に示すような各集音部の感度特性を形成することが出来る。もし各集音部に配置されるマイクロホンが3組以上である場合には、それらの少なくとも一つのマイクロホンが他よりもラウドスピーカに近い位置に配置されていれば、各集音部の音響的中心とラウドスピーカの音響的中心とを結ぶ放射線と直交する線を境界として、その境界よりもラウドスピーカ側に形成される感度特性の面積が他方より小さくなる。
What is important is that the vibration directions of the diaphragms of the
以上のような構成により、マイクユニットとラウドスピーカとの音響結合が小さくなり、使用者が違和感を覚えることが無く、各集音部2a〜2dの感度特性85a〜85dのバラつきと経年変化も低減されるので、高品質な全二重動作が可能となる。さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを防ぐことができる。
With the above configuration, the acoustic coupling between the microphone unit and the loudspeaker is reduced, the user does not feel uncomfortable, and variations in the
各集音部2a〜2dの2組のマイクロホン21a〜21dおよび22a〜22dを用いて感度特性85a〜85dを形成するための感度特性形成手段は、本実施の形態の音声会議装置1においては主に図9に示すDSP50内におけるマイクロホン21a〜21d(図9以降においては以下、代表して21と表す)からの入力信号の処理回路ブロック59である。以下、図9以降においては各集音部2a〜2dを代表して2と、各マイクロホン21a〜21dおよび22a〜22dを代表して21および22と、各集音部2a〜2dの音響的中心82a〜82dを代表して82と、集音部2a〜2dの音響的中心82a〜82dとラウドスピーカ30の音響的中心83とを結ぶ各放射線81a〜81dを代表して81と、そのそれぞれに対応する直交線84a〜84dを代表して84と、各集音部2a〜2dの感度特性85a〜85dを代表して85として説明する。
The sensitivity characteristic forming means for forming the
図9において、マイク駆動回路61および62を介して第1のマイクロホン21および第2のマイクロホン22からのアナログ入力信号を入力しデジタル信号化するA/Dコンバータ60および64はCODEC部55内にある。
In FIG. 9, A /
59は、DSP50のプログラムメモリ51に格納されたプログラムにより構成される本発明に関わる部分の処理ブロックである。それぞれのA/Dコンバータ60および64からの出力データからは、互いに他の出力を遅延フィルタ65または66を通して遅延させた信号が減算される。本実施の形態1の場合、遅延フィルタ65および66の遅延時間は(数2)により求められる。
すなわち1サンプリング周期1/Fsであり、最高処理可能周波数fの波形を入力した場合は1/4波長分遅らせることが出来る。これにより、後述の送話者の音声および受話者の音声強調処理が最適となり、残響低減処理の負担がより軽減されるので、より高品質な全二重動作が可能となる。 That is, the sampling period is 1 / Fs, and when a waveform of the maximum processable frequency f is input, it can be delayed by 1/4 wavelength. Thereby, the voice of the sender and the voice enhancement of the receiver, which will be described later, are optimized, and the burden of the reverberation reduction process is further reduced, so that a higher-quality full-duplex operation can be performed.
演算器67は、ラウドスピーカ30に対してより近くに位置している第2のマイクロホン22からの入力信号を処理するA/Dコンバータ64の出力データが遅延フィルタ66により遅延時間τだけ遅延されたデータを、第1のマイクロホン21からの入力信号を処理するA/Dコンバータ60の出力データより減算し出力する。第1のマイクロホン21と第2のマイクロホン22とは最高処理可能周波数fの1/4波長だけ離れているので、特にラウドスピーカ30から2つのマイクロホン21および22に入力される受話者の音声が打ち消し合うこととなる(これを「メイン・ビーム」と呼ぶ)。
In the
演算器68は、ラウドスピーカ30に対してより近くに位置している第2のマイクロホン22からの入力信号を処理するA/Dコンバータ64の出力データから、第1のマイクロホン21からの入力信号を処理するA/Dコンバータ63の出力データが遅延フィルタ65により遅延時間τだけ遅延されたデータを減算し出力する。第1のマイクロホン21と第2のマイクロホン22とは最高処理可能周波数fの1/4波長だけ離れているので、ラウドスピーカ30とは別の方向、特にラウドスピーカ30とは逆の方向から2つのマイクロホン21および22に入力される使用者(送話者)の音声が打ち消し合うこととなる(これを「ヌル・ビーム」と呼ぶ)。以上のような遅延加算処理により、ラウドスピーカ30に近い側のマイクロホン22の入力はラウドスピーカ30からの受話者の音声が強調され、反対側のマイクロホン21の入力は送話者の音声が強調されるので、後述の適応フィルタ69および減算器70において受話者音声信号と送話者の残響音の減算が容易となり、高品質な全二重動作が可能となる。
The
減算器70は、演算器68の出力データ(ヌル・ビーム)が適応フィルタ69により処理されたデータを演算器67の出力データ(メイン・ビーム)より減算する。これにより、ラウドスピーカ30から2つのマイクロホン21および22に入力される音声がさらに打ち消されるとともに、音声会議装置1の周辺環境により発生する残響音も低減され、音声会議装置1の使用者(送話者)の音声が極めて明瞭に、遠端話者の音声会議装置へと送出される。なお、減算器70の後段には、マイクロホン21および22とラウドスピーカ30との間のエコー(線形エコーという)をキャンセルするための別の適応フィルタが配置されていても良い。
The
本実施の形態の音声会議装置1の適応フィルタ69は、音声会議装置1のラウドスピーカ30より通信相手である遠端話者の音声会議装置からの音が出力されており、音声会議装置1の使用者は音声会議装置1に向かって話をしていない状況で学習作業を行う。ここで、適応フィルタ69の一つの例として、FIRフィルタが用いられる場合について説明する。
The
まず、演算器67の出力データ(メイン・ビーム)と演算器68の出力データ(ヌル・ビーム)に相関が高いエコー信号成分との関係は、理論的に(数3)で表されると仮定できる。
First, it is assumed that the relationship between the output data (main beam) of the
上記(数3)においてヌル・ビームに相関が高いエコー成分は、もしマイクロホン21および22に入力される音が純粋にラウドスピーカ30からの音と全く同一であればヌル・ビームと全く同一となるはずであるが、実際には、ラウドスピーカ30での電気信号から空気振動への変換時における音響的ひずみ(ラウドスピーカ30の固有振動数や周波数特性に起因する、特に安価なラウドスピーカにおいては高周波ひずみが問題となる)やラウドスピーカの振動に伴う音声会議装置1の筐体振動などにより、様々なエコー信号が含まれている。ただし、この(数3)におけるヌル・ビームに相関が高いエコー成分を直接算出するのは困難である。そこで、適応フィルタ69はヌル・ビームを基に、(数4)に従って擬似エコー信号を合成する。
The echo component highly correlated with the null beam in the above (Equation 3) is exactly the same as the null beam if the sound input to the
減算器70はメイン・ビームからこの擬似エコー信号を減算する。これによりエコー信号がメイン・ビームより減衰される仕組みとなっている。従って、減算器70の出力信号は以下の(数5)により求められる。
A
適応フィルタの推定誤差がゼロであれば(数5)右辺の第1項と第2項との関係は以下の(数6)および(数7)となり、(数5)における減算器70の出力信号は0となるはずである。
If the estimation error of the adaptive filter is zero (Equation 5), the relationship between the first term and the second term on the right side is (Equation 6) and (Equation 7) below, and the output of the
だが現実には推定誤差が存在するので、(数6)および(数7)とはならない。特に、遠端話者のみが発声し、近端話者が発声していない時の(数5)は残留エコー(エラー)信号と呼ばれ、以下の(数8)のように表される。 However, since there is an estimation error in reality, (Equation 6) and (Equation 7) are not satisfied. Particularly, (Equation 5) when only the far-end speaker speaks and the near-end speaker does not utter is called a residual echo (error) signal, and is expressed as the following (Equation 8).
このような適応フィルタでは、フィルタ係数を推定誤差が少ない方向に更新(学習)していく事が重要であり、その学習のアルゴリズムは数種類知られている。音声の収束が良い事で一般的なNLMS法では、(数9)に示すようにフィルタ係数を更新する。 In such an adaptive filter, it is important to update (learn) the filter coefficients in a direction with less estimation error, and several types of learning algorithms are known. In general NLMS method due to good speech convergence, the filter coefficient is updated as shown in (Equation 9).
この種のアルゴリズムにより、適応フィルタによるエコーの減算と係数の更新が並行的に行われ、メイン・ビームに混入したヌル・ビームのエコー成分が減衰され続け、より純粋に近いメイン・ビームすなわち近端話者の音声信号のみを出力する事が可能となる。なお、本実施の形態における適応フィルタ69については、FIRフィルタをその一つの例として取り上げて説明したが、本実施の形態の音声会議装置の適応フィルタは特にFIRフィルタに限るものではなく、例えば周波数領域適応フィルタやサブバンド分割型適応フィルタを用いても良い。
With this type of algorithm, echo subtraction and coefficient updating by the adaptive filter are performed in parallel, and the echo component of the null beam mixed into the main beam continues to be attenuated, resulting in a purer main beam or near end. Only the voice signal of the speaker can be output. The
従来、適応フィルタはある方向にいる近端話者の音声をより鮮明に抽出するための適応処理を行うものであったが、本実施の形態の音声会議装置における適応フィルタ69は、音声会議装置の周囲にいる近端話者に対してはラウドスピーカ30からの音声が聞こえるように維持しつつ、ラウドスピーカ30から出力されマイクロホン21および22に入力される遠端話者の音声のエコーをキャンセルすることに貢献している。特に、ラウドスピーカ30での電気信号から空気振動への変換時における音響的ひずみによるエコー信号や、ラウドスピーカ30の振動に伴う音声会議装置1の筐体振動などによるエコー信号などのいわゆる非線形エコーに対して効果がある。すなわち、本発明の感度特性形成手段(図9の処理ブロック59に相当)は、マイクユニット2の感度特性をラウドスピーカ30からの出力音声が拾いにくくなるよう形成することに加えて、非線形エコーを低減できるという特徴を併せ持つ。この適応フィルタ69のエコーキャンセル効果をさらにアップするために、前述のように2つのマイクロホン21・22の音響的中心間の距離dを(数1)のように設定すれば、特に高い周波数のひずみに対して効果的である。
Conventionally, the adaptive filter performs an adaptive process for more clearly extracting the voice of the near-end speaker in a certain direction. However, the
図8に示す音声会議装置1の集音部2a〜2dの一つを代表して集音部2とし、そこに配置されるマイクロホン21および22とスピーカ部3に配置されたラウドスピーカ30との配置関係を断面方向から見たものが図10である。相手側の音声会議装置において集音された音声はラウドスピーカ30より出力される。すなわち、そのコーン紙31の振動が空気の粗密波38a及び38bを発生させて音声会議装置1の筐体外部を伝播し、周囲にいる使用者にその音声が伝わる。
The
集音部2の複数のマイクロホン21および22の振動板の振動方向はラウドスピーカにより発生する疎密波の伝播方向に対し略直交している。また、集音部2の複数のマイクロホン21および22の振動板28の振動方向はその直上にあるマイクユニットすなわち集音部2の保護部材20の上面と略直交し、ラウドスピーカ30の振動板28の振動方向はその直上にある保護部材3aの上面と略直交している。
The vibration directions of the diaphragms of the plurality of
このとき、マイクロホン21および22にはラウドスピーカ30からの音声、すなわち相手側の音声会議装置において集音された音声や、周辺の残響などが入力されてしまうが、先に説明した図9に示す処理ブロックによりこれらは低減されるので、本音声会議装置の周辺にいる使用者の音声が極めて明瞭に、相手側の音声会議装置へと送出される。
At this time, voices from the
もし、マイクロホン21および22を、図15の21eおよび22eのように配置すると、ラウドスピーカ30により発生する相手側の音声会議装置において集音された音声の空気粗密波がマイクロホン21eおよび22eに多少なりとも入射しにくくなるかもしれない。しかしながらそのメリットよりも、ラウドスピーカ30からの距離差がほとんど取れないことによる図9のエコーキャンセル処理効果の喪失のほうが極めて大きい。従って、2つのマイクロホン21および22は、図10に示すように配置するほうが良い。
If the
なお、マイクユニットすなわち集音部2の複数のマイクロホン21および22の集音口を有する面とマイクユニットすなわち集音部2の保護部材20の上面との距離は、マイクロホン21および22のそれ以外の面と保護部材20との距離よりも小さくなるよう配置することが望ましい。これによりマイクユニットすなわち集音部2はラウドスピーカ30からの一次粗密波を主に集音することができ、マイクユニットすなわち集音部2内での反射音が拾いにくくなるので、残響低減処理の負担が低減され、さらに高品質な全二重動作が可能となる。
It should be noted that the distance between the microphone unit, that is, the surface having the sound collection ports of the
なお、本実施の形態における音声会議装置1はラウドスピーカ30を一つだけ備えた構成であるが、ラウドスピーカは一つに限定するものではなく、複数備えていても良い。その場合、例えば音声会議装置の上面から見た場合にスピーカ部が備える複数のラウドスピーカの各音響的中心から等距離にある点を音声会議装置のスピーカ部の音響的中心とすることができる。
In addition, although the
以上のように本実施の形態によれば、ラウドスピーカとの音響結合が小さくなり、かつ使用者が違和感を覚えることが無く、各集音部の感度特性のバラつきと経年変化も低減されるので、高品質な全二重動作が可能となる。さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを防ぐことができる。 As described above, according to the present embodiment, the acoustic coupling with the loudspeaker is reduced, the user does not feel uncomfortable, and variations in the sensitivity characteristics of each sound collection unit and aging are also reduced. High-quality full-duplex operation is possible. Furthermore, unexpected malfunctions caused by the main lobe of the sensitivity characteristic being formed in a direction completely different from what is potentially felt by the user, for example, erroneous reverberation processing and direction adjustment control problems can be prevented.
(実施の形態2)
本発明における実施の形態2における信号遅延時間の補正の例を図16に示す。図10との相違点は、送話者の位置が机面と平行に位置し、2個のマイクの延長線方向より角度θの方向に送話者が存在すると仮定しており、より実際に近い。それぞれのA/Dコンバータ60および64からの出力データには、互いに他の出力を遅延フィルタ65または66を通して遅延させた信号が減算される。本実施の形態の場合、ラウドスピーカ30に対してより近くに位置している第2のマイクロホンに適用される遅延フィルタ65の遅延時間τ1は、(数10)により求められる。
(Embodiment 2)
An example of signal delay time correction in the second embodiment of the present invention is shown in FIG. The difference from FIG. 10 is that it is assumed that the position of the speaker is parallel to the desk surface, and that the speaker exists in the direction of the angle θ from the extension line direction of the two microphones. close. Signals obtained by delaying other outputs through the
一方、図16においてラウドスピーカ30に対してより遠くに位置している第1のマイクロホンに適用される遅延フィルタ66の遅延時間τ2は、(数11)により求められる。
On the other hand, the delay time τ 2 of the
すなわち、τ2はτ1よりも遅延時間が小さい。これにより、実際に送話者が位置する方向からの音声信号が強調されるので、集音効率が一層向上し、高品質な全二重動作が可能となる。
このように遅延時間を設定する効果の例を、図16にて説明する。ここではマイクユニット間隔d=14mm,ユニットの延長方向と机面が形成する角度θ=30°と仮定し、指向性パターンを例示している。
That is, τ 2 has a smaller delay time than τ 1 . As a result, the voice signal from the direction in which the speaker is actually located is emphasized, so that the sound collection efficiency is further improved and high-quality full-duplex operation is possible.
An example of the effect of setting the delay time in this way will be described with reference to FIG. Here, the directivity pattern is illustrated on the assumption that the microphone unit interval d is 14 mm and the angle θ between the unit extension direction and the desk surface is 30 °.
最初に、メインビームの指向性パターンを示す。メインビームとは近端話者の音声方向に感度が強く、その反対側は死角となるように合成された指向性パターンの出力信号であり、図16(a)ではaの矢印で示す机面と平行な方向に指向角を向ける事が目的である。この図の場合、近端話者に近い側と遠い側のマイク信号が互いに一致するように、両マイク間の音波の到達時間の差に合わせた遅延を、近端話者に近い側のマイク信号に与えれば良い。その遅延時間τ2がτ2=d/cの場合、図16(b)の円グラフのように、近端話者の反対方向にも感度が多く残り、死角の形成が不十分である。一方、τ2=d・cosθ/cの場合は図16(c)の円グラフのように、近端話者の反対方向に鋭い死角が形成され、この方が優れている事が判る。 First, the directivity pattern of the main beam is shown. The main beam is an output signal of a directivity pattern synthesized so as to be sensitive to the voice direction of the near-end speaker and the other side to be a blind spot. In FIG. The aim is to direct the directivity angle in a direction parallel to. In the case of this figure, the delay that matches the difference in the arrival time of the sound waves between the two microphones is set so that the microphone signals on the near side and the far side talk to each other. What is necessary is just to give to a signal. When the delay time τ 2 is τ 2 = d / c, as shown in the pie chart of FIG. 16B, the sensitivity remains in the opposite direction of the near-end speaker, and the formation of the blind spot is insufficient. On the other hand, when τ 2 = d · cos θ / c, a sharp blind spot is formed in the opposite direction of the near-end speaker, as shown in the pie chart of FIG.
次に、ヌルビームの指向性パターンを示す。ヌルビームとは通話装置のスピーカの方向、すなわち音響エコーの最大の到達方向に感度が強く、その反対側は死角となるように合成された指向性パターンの出力信号であり、図16(a)ではbの矢印で示す2個のマイクの延長線上でスピーカの方向に指向角を向ける事が目的である。この図の場合、スピーカに近い側と遠い側のマイク信号が互いに一致するように、両マイク間の音波の到達時間の差に合わせた遅延を、スピーカに近い側のマイク信号に与えれば良い。その遅延時間τ1がτ1=d/cの場合、図16(d)の円グラフのように、スピーカと反対方向に鋭い死角が形成され、この遅延時間が妥当である事が判る。一方、メインビーム側と同様にτ1=d・cosθ/ cを適用する場合は図16(e)の円グラフのように、スピーカの反対方向にも感度が多く残り、死角の形成が不十分である。 Next, the directivity pattern of the null beam is shown. The null beam is an output signal of a directivity pattern synthesized so that the sensitivity is strong in the direction of the speaker of the communication device, that is, the maximum arrival direction of the acoustic echo, and the opposite side is a blind spot. The purpose is to direct the directivity angle toward the speaker on the extension line of the two microphones indicated by the arrow b. In the case of this figure, a delay according to the difference in arrival time of sound waves between the two microphones may be given to the microphone signal near the speaker so that the microphone signals near and far from the speaker match each other. When the delay time τ 1 is τ 1 = d / c, a sharp blind spot is formed in the opposite direction to the speaker as shown in the pie chart of FIG. 16D, and it can be seen that this delay time is appropriate. On the other hand, when τ 1 = d · cos θ / c is applied as in the main beam side, as shown in the pie chart of FIG. 16 (e), the sensitivity remains in the opposite direction of the speaker, and the formation of the blind spot is insufficient. It is.
以上から本実施の形態のように、指向性を合成する遅延時間τを、メインビーム側とヌルビーム側の目的とする音源の方向で換算した行程差をそれぞれ適用する事によって、メインビーム・ヌルビームの指向性を正確に実現する事が可能になる。 As described above, the delay time τ for synthesizing the directivity is applied to the main beam side and the null beam side by applying the stroke difference converted in the direction of the target sound source on the main beam side and the null beam side. It becomes possible to realize directivity accurately.
(実施の形態3)
本発明における実施の形態3における信号遅延時間の補正の例を図17に示す。図17(b)に示すように図16と比較して、送話者の位置が机面と平行に位置し、2個のマイクの延長線方向より角度θ2の方向に送話者が存在する事は図16(a)と同様であるが、更にスピーカの音響中心も2個のマイクの延長線方向に位置しておらず、角度θ1の方向に位置している。本実施の形態の場合、図17(a)においてラウドスピーカ30に対してより近くに位置している第2のマイクロホンに適用される遅延フィルタ65の遅延時間τ1は、(数12)により求められる。
(Embodiment 3)
An example of signal delay time correction in the third embodiment of the present invention is shown in FIG. As shown in FIG. 17B, compared to FIG. 16, the position of the speaker is parallel to the desk surface, and there is a speaker in the direction of the angle θ 2 from the extension line direction of the two microphones. This is the same as FIG. 16A, but the acoustic center of the speaker is not located in the direction of the extension line of the two microphones, but is located in the direction of the angle θ 1 . In the case of the present embodiment, the delay time τ 1 of the
一方、図17(b)においてラウドスピーカ30に対してより遠くに位置している第1のマイクロホンに適用される遅延フィルタ66の遅延時間τ2は、(数13)により求められる。
On the other hand, the delay time τ 2 of the
以上によって、メインビームでは実際に送話者が位置する方向からの音声信号が強調され、ヌルビームでは実際にスピーカが位置する方向からの信号が強調されるので、集音効率が一層向上し、高品質な全二重動作が可能となる。 As described above, the sound signal from the direction where the speaker is actually positioned is emphasized in the main beam, and the signal from the direction where the speaker is actually positioned is emphasized in the null beam. Quality full-duplex operation is possible.
(実施の形態4)
実施の形態1においては(数1)に示すように、2つのマイクロホン21(21a〜2
1d)および22(22a〜22d)の間の距離dを最高処理周波数fの波長の4分の1程度としていたが、サンプリング周波数Fsや最高処理可能周波数fは変えずにこれよりももっと近い距離とすることもできる。すなわち、距離dの代わりに、(数14)で得られる距離xを、2つのマイクロホン21(21a〜21d)および22(22a〜22d)の間の距離とする。
(Embodiment 4)
In the first embodiment, as shown in (Equation 1), two microphones 21 (21a to 2) are used.
The distance d between 1d) and 22 (22a to 22d) is set to about one quarter of the wavelength of the maximum processing frequency f, but the sampling frequency Fs and the maximum processing frequency f are not changed, and the distance is closer than this. It can also be. That is, instead of the distance d, the distance x obtained by (Equation 14) is the distance between the two microphones 21 (21a to 21d) and 22 (22a to 22d).
この場合、図9の回路における遅延フィルタ65および66の遅延時間τを以下のようにする。 In this case, the delay time τ of the delay filters 65 and 66 in the circuit of FIG. 9 is set as follows.
すなわち、サンプリング周期1/Fsのh倍(h<1)とすればよい。
That is, the
以上のように本実施の形態によれば、マイクユニットすなわち集音部に配置された2つのマイクロホンの間の距離をさらに縮めるので、それぞれのマイクロホンに異なる反射音が入力するのを低減することができ、さらに高品質な全二重動作が可能となる。 As described above, according to the present embodiment, the distance between two microphones arranged in the microphone unit, that is, the sound collecting unit is further reduced, so that it is possible to reduce the input of different reflected sounds to each microphone. In addition, high-quality full-duplex operation is possible.
(実施の形態5)
図18は、本発明の実施の形態5における電話機の斜視図であり、実施の形態1、2,3,4の音声会議装置を応用した電話機を示している。図19は、本発明の実施の形態5における電話機の上面図であり、図18の電話機を上面から見たものを示している。
(Embodiment 5)
FIG. 18 is a perspective view of a telephone set according to the fifth embodiment of the present invention, showing a telephone to which the voice conference apparatus according to the first, second, third, and fourth embodiments is applied. FIG. 19 is a top view of the telephone set according to Embodiment 5 of the present invention, showing the telephone set shown in FIG. 18 as viewed from above.
図18に示すように、本実施の形態の電話機は、実施の形態1における音声会議装置と同様に集音部102およびスピーカ部103を有する。ただし集音部102は実施の形態1の音声会議装置1とは異なり、1つのみである。
As shown in FIG. 18, the telephone according to the present embodiment includes a
図19に示す集音部102およびスピーカ部103において、マイクロホン121および122とラウドスピーカ130はそれらの位置がわかるよう描かれているが、実際にはそれぞれ集音部102およびスピーカ部103の内部に配置されているものであり、外部から直接視認することはできない。
In the
このような電話機113が、実施の形態1の図3または図4における音声会議装置1aまたは1bのように複数台用いられ、インターネット11または公衆電話回線12等を介して接続され、互いに音声の送受信を行う。
A plurality of
本実施の形態における電話機113のハードウェアは、実施の形態1の音声会議装置1における図5および図6と大きな相違点は無く、これらにハンドセットの送受話インターフェース等が追加される程度で実現できる。マイクユニットすなわち集音部102に設置される2つの無指向性マイクロホン装置121・122やスピーカ部に設置されるラウドスピーカ130も、実施の形態1に示したものと大きな相違点の無いものが使用できる。
The hardware of the telephone set 113 in the present embodiment is not significantly different from that in the
マイクユニットすなわち集音部102においては、2つの無指向性マイクロホン装置121・122が集音部102の音響的中心182とラウドスピーカ130の音響的中心183とを結ぶ放射線181上に並べて配置されている。
In the microphone unit, that is, the
各集音部102a〜102dにおける無指向性マイクロホンの数を2とすることにより、最小個数の無指向性マイクロホンにてマイクユニットすなわち各集音部102a〜102dを構成可能であり、従って安価な装置コストで高品質な全二重動作が可能となる。 By setting the number of omnidirectional microphones in each of the sound collection units 102a to 102d to 2, the microphone unit, that is, each of the sound collection units 102a to 102d can be configured with the minimum number of omnidirectional microphones, and thus an inexpensive device. High-quality full-duplex operation is possible at low cost.
各マイクロホン121および122の振動板の振動方向は、ラウドスピーカ130により発生する疎密波の伝播方向に対し略直交し、かつラウドスピーカ130に対し第1のマイクロホン121よりも第2のマイクロホン122のほうが近くに設置されている。その距離は実施の形態1における(数1)により導かれるdでも良いし、実施の形態4における(数14)により導かれるxでも構わない。
The vibration directions of the diaphragms of the
集音部2の音響的中心182とラウドスピーカ130の音響的中心183とを結ぶ放射線81に対応する直交線184を境界として、その境界よりも集音部2の感度特性185のラウドスピーカ130側に形成される面積が他方より小さくなるよう、実施の形態1および実施の形態2において示したのと同様の感度特性形成手段により集音部2の2組のマイクロホン121および122を用いて感度特性185が形成されている。
On the
以上のような構成により、ラウドスピーカとの音響結合が小さくなり、集音部102の感度特性185の経年変化も低減され、後述の送話者の音声および受話者の音声強調処理が最適となり、残響低減処理の負担がより軽減されるので、より高品質な全二重動作が可能となる。電話機113の使用者(送話者)の音声が極めて明瞭に、相手側の電話機へと送出される。
With the above configuration, the acoustic coupling with the loudspeaker is reduced, the secular change of the
なお、マイクユニットすなわち集音部102の複数のマイクロホン121および122の集音口127を有する面とマイクユニット、すなわち集音部102の保護部材の上面との距離は、マイクロホン121および122のそれ以外の面と保護部材との距離よりも小さくなるよう配置することが望ましい。これによりラウドスピーカ130からの一次粗密波を主に集音することができ、マイクユニット内での反射音が拾いにくくなるので、残響低減処理の負担が低減され、さらに高品質な全二重動作が可能となる。
The distance between the microphone unit, that is, the surface of the plurality of
本発明にかかる音声会議装置は、高品質な全二重動作が可能となり、さらには、感度特性の主ローブが使用者にとって潜在的に感じるのとは全く異なる方向に形成されることによる予期しない誤動作、例えば誤った残響処理や指向調整制御の不具合などを防ぐことが出来るところから、例えば電話機や、音声会議システムおよびテレビ会議システムなどへの利用が可能である。 The audio conferencing apparatus according to the present invention enables high-quality full-duplex operation, and is unexpected due to the fact that the main lobe of the sensitivity characteristic is formed in a completely different direction from what is potentially felt to the user. Since malfunctions such as erroneous reverberation processing and orientation adjustment control can be prevented, it can be used for telephones, audio conference systems, video conference systems, and the like.
1、1a、1b 音声会議装置
2、2a〜2d 集音部
3 スピーカ部
4 操作ボタン
5 表示装置
6、6a、6b 通信ケーブル(Ethernet(登録商標)ケーブル)
7、7a、7b 通信ケーブル(電話線)
10a、10b ゲートウェイ
11 インターネット
12 公衆電話回線
20 保護部材
21、21a〜21d、22、22a〜22d マイクロホン
30 ラウドスピーカ
30a 保護部材
31 コーン紙(振動板)
35 コイル
37 磁石
38a、38b 粗密波
40 CPU
41 プログラムメモリ
42 メインメモリ
43 PHYチップ
44 キーボード
45 LCD
46 コネクタ(RJ−45)
47 コントローラ
50 DSP
51 プログラムメモリ
52 DSPのワークメモリ
54 タイミング調整用PLD
55 CODEC部
55a、55b CODEC−IC
56 マイクロホン/スピーカ部
57 公衆回線I/F部
58 部分ブロック
59 処理ブロック
61、61a〜61d、62、62a〜62d マイク駆動回路
63 スピーカ増幅回路
60、64 A/Dコンバータ
65、66 遅延フィルタ
67、68 演算器
69 適応フィルタ
70 減算器
81、81a〜81d 放射線
82、82a〜82d マイクユニット(集音部)の音響的中心
83 スピーカ部(ラウドスピーカ)の音響的中心
84、84a〜84d 直交線
85、85a〜85d 感度特性
86 スピーカ部(ラウドスピーカ)の音響的中心を中心とする同心円面
DESCRIPTION OF
7, 7a, 7b Communication cable (telephone line)
10a, 10b Gateway 11
35
41
46 Connector (RJ-45)
47
51
55
56 Microphone /
Claims (8)
送話音声およびスピーカからの音声を集音して音声信号を出力する第一のマイクロホンと前記第一のマイクロホンより前記スピーカから近い位置に設けられ送話音声およびスピーカからの音声を集音して音声信号を出力する第二のマイクロホンを有するマイクユニットと、
前記マイクユニットの感度特性を形成する感度特性形成手段と、を有し、
前記感度特性形成手段は、
前記第一のマイクロホンからの音声信号を一定時間遅延させて出力する第一の遅延手段と、
前記第二のマイクロホンからの音声信号を一定時間遅延させて出力する第二の遅延手段と、
前記第一のマイクロホンからの音声信号と前記第二の遅延手段からの出力を元に前記スピーカからの音声を打ち消しあうようにすることで前記送話音声を強調して出力する第一の演算手段と、
前記第二のマイクロホンからの音声信号と前記第一の遅延手段からの出力を元に前記送話音声を打ち消しあうようにすることで前記スピーカからの音声を強調して出力する第二の演算手段と、
前記第二の演算手段の出力を前記第一の演算手段の出力から減算する第三の演算手段と、前記第一のマイクロホンと前記第二のマイクロホンの距離をd、音速をcとした場合、
前記第一の遅延手段の遅延時間τ 1 は、前記第一、第二のマイクロホンを結ぶ線の延長線と、前記スピーカ中心と前記第一、第二のマイクロホンの中間点とを結ぶ延長線とのなす角度をθ 1 として、τ 1 =d・cosθ 1 /cとなり、
前記第二の遅延手段の遅延時間τ 2 は、前記第一、第二のマイクロホンを結ぶ線の延長線と、前記第一、第二のマイクロホンの中間点と送話者とを結ぶ線とのなす角度θ 2 として、τ 2 =d・cosθ 2 /cとなることを特徴とする音声会議装置。 A speaker for outputting the received voice;
A first microphone that collects a transmitted voice and a voice from a speaker and outputs a voice signal, and a voice that is provided near the speaker from the first microphone and collects a transmitted voice and a voice from the speaker A microphone unit having a second microphone for outputting an audio signal;
Sensitivity characteristic forming means for forming sensitivity characteristics of the microphone unit,
The sensitivity characteristic forming means includes:
First delay means for outputting the audio signal from the first microphone with a predetermined time delay;
Second delay means for delaying and outputting the audio signal from the second microphone for a fixed time;
First computing means for emphasizing and outputting the transmitted voice by canceling the voice from the speaker based on the voice signal from the first microphone and the output from the second delay means When,
Second computing means for emphasizing and outputting the sound from the speaker by canceling the transmitted voice based on the audio signal from the second microphone and the output from the first delay means When,
When the third calculation means for subtracting the output of the second calculation means from the output of the first calculation means, the distance between the first microphone and the second microphone is d, and the speed of sound is c,
The delay time τ 1 of the first delay means includes an extension line connecting the first and second microphones, and an extension line connecting the speaker center and the intermediate point of the first and second microphones. Where θ 1 is τ 1 = d · cos θ 1 / c,
The delay time τ 2 of the second delay means is an extension of a line connecting the first and second microphones, and a line connecting the midpoint of the first and second microphones and the transmitter. An audio conference apparatus characterized in that the angle θ 2 formed is τ 2 = d · cos θ 2 / c .
The distance between the surface of the first and second microphones having the sound collection port and the upper surface of the microphone unit protection member for protecting the first and second microphones is that of the first and second microphones. The audio conference apparatus according to claim 1, wherein the audio conference apparatus is smaller than a distance between the other surface and the protective member.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008010131A JP5082878B2 (en) | 2007-02-28 | 2008-01-21 | Audio conferencing equipment |
US12/037,426 US8111838B2 (en) | 2007-02-28 | 2008-02-26 | Conferencing apparatus for echo cancellation using a microphone arrangement |
PCT/JP2008/000388 WO2008120436A2 (en) | 2007-02-28 | 2008-02-28 | Voice conference apparatus providing microphone directivity to reduce acoustic coupling |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007048762 | 2007-02-28 | ||
JP2007048762 | 2007-02-28 | ||
JP2008010131A JP5082878B2 (en) | 2007-02-28 | 2008-01-21 | Audio conferencing equipment |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008245250A JP2008245250A (en) | 2008-10-09 |
JP2008245250A5 JP2008245250A5 (en) | 2011-03-10 |
JP5082878B2 true JP5082878B2 (en) | 2012-11-28 |
Family
ID=39915972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008010131A Expired - Fee Related JP5082878B2 (en) | 2007-02-28 | 2008-01-21 | Audio conferencing equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5082878B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5270312B2 (en) * | 2008-11-20 | 2013-08-21 | 株式会社ユニバーサルエンターテインメント | Game machine |
JPWO2012124422A1 (en) * | 2011-03-11 | 2014-07-17 | 三洋電機株式会社 | Recording device |
JP6036412B2 (en) * | 2013-03-04 | 2016-11-30 | ヤマハ株式会社 | Sound collector |
US9807514B2 (en) | 2013-08-26 | 2017-10-31 | Kyocera Corporation | Audio apparatus, audio system, image display apparatus, and image projection apparatus |
JP2020178244A (en) | 2019-04-18 | 2020-10-29 | レノボ・シンガポール・プライベート・リミテッド | Electronic device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02288455A (en) * | 1989-04-27 | 1990-11-28 | Fujitsu Ltd | Talking device for conference |
JPH1118186A (en) * | 1997-06-25 | 1999-01-22 | Purimo:Kk | Primary pressure gradient microphone |
-
2008
- 2008-01-21 JP JP2008010131A patent/JP5082878B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008245250A (en) | 2008-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11657793B2 (en) | Voice sensing using multiple microphones | |
US9749731B2 (en) | Sidetone generation using multiple microphones | |
JP6573624B2 (en) | Frequency dependent sidetone calibration | |
US8111838B2 (en) | Conferencing apparatus for echo cancellation using a microphone arrangement | |
JP5394373B2 (en) | Apparatus and method for processing audio signals | |
JP2843278B2 (en) | Noise control handset | |
US20060147063A1 (en) | Echo cancellation in telephones with multiple microphones | |
US9542957B2 (en) | Procedure and mechanism for controlling and using voice communication | |
JP3267556B2 (en) | Echo canceller and transmitter | |
JP2009141698A (en) | Headset | |
JP5082878B2 (en) | Audio conferencing equipment | |
EP2257081B1 (en) | Listening device with two or more microphones | |
US10182160B2 (en) | Speakerphone system or speakerphone accessory with on-cable microphone | |
US8923530B2 (en) | Speakerphone feedback attenuation | |
US11335315B2 (en) | Wearable electronic device with low frequency noise reduction | |
US7751575B1 (en) | Microphone system for communication devices | |
JP2018018042A (en) | Sound suppression device | |
US11637932B2 (en) | Method for optimizing speech pickup in a speakerphone system | |
WO2023047911A1 (en) | Call system | |
JP2013141118A (en) | Howling canceller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110121 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120410 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120820 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |