JP2015103824A - Voice generation system and stand for voice generation apparatus - Google Patents
Voice generation system and stand for voice generation apparatus Download PDFInfo
- Publication number
- JP2015103824A JP2015103824A JP2013240485A JP2013240485A JP2015103824A JP 2015103824 A JP2015103824 A JP 2015103824A JP 2013240485 A JP2013240485 A JP 2013240485A JP 2013240485 A JP2013240485 A JP 2013240485A JP 2015103824 A JP2015103824 A JP 2015103824A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- voice
- speaker
- speaker system
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Details Of Audible-Bandwidth Transducers (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
この発明は、音声発生機器や音声発生機器を有する音声発生システムにおいて、音声発生機器とは別個の音源が発する音声を用いて音声発生機器を所望の方向に向ける技術に関する。 The present invention relates to a technology for directing a sound generating device in a desired direction using sound generated by a sound source separate from the sound generating device in a sound generating system having the sound generating device or the sound generating device.
テレビ会議システムでは、話者を撮像するために、複数のマイクロホンを使用して話者の方位を特定し、特定された方位に撮像装置の指向方向を向けることが行われている(例えば、特許文献1参照)。 In a video conference system, in order to capture an image of a speaker, the orientation of the speaker is specified using a plurality of microphones, and the orientation direction of the imaging device is directed to the specified orientation (for example, patents). Reference 1).
しかしながら、音源である話者の発する音声により話者の方位を特定する技術は、話者以外に音源がある場合には、正確に話者の方位を特定することが困難である。そのため、従来より、音源の発する音声により当該音源の方位を特定する技術は、音声を発生する機器を話者の方向に向ける方法には適用されてこなかった。また、同様の問題があるため、特定の音源が発する音声を用いて、音声を発生する機器を所望の方向に向けることについては、従来から考慮されてこなかった。 However, it is difficult for the technology for specifying the direction of the speaker based on the voice uttered by the speaker as the sound source to accurately specify the direction of the speaker when there is a sound source other than the speaker. For this reason, conventionally, the technology for specifying the direction of the sound source based on the sound emitted from the sound source has not been applied to a method of directing a device that generates sound toward the speaker. In addition, since there is a similar problem, it has not been conventionally considered to direct a device that generates sound in a desired direction using sound emitted from a specific sound source.
本発明は、上述した従来の課題を解決するためになされたものであり、音声発生機器や音声発生機器を有する音声発生システムにおいて、音声発生機器とは別個の音源が発する音声を用いて音声発生機器を所望の方向に向ける技術を提供することを目的とする。 The present invention has been made to solve the above-described conventional problems. In a sound generation system having a sound generation device or a sound generation device, sound generation is performed using sound generated by a sound source separate from the sound generation device. It aims at providing the technique which orient | assigns an apparatus to a desired direction.
上記課題の少なくとも一部を達成するために、本発明の音声発生システムは、音声を発生する音声発生システムであって、音声発生機器と、N個(Nは、1以上の整数)のマイクと、前記N個のマイクにより収音された音声から前記音声発生機器が発生する音声を除去して、前記音声発生機器とは別個の音源が発し前記N個のマイクに到来するN種の音声をそれぞれ出力するN個のエコーキャンセラと、前記N個のエコーキャンセラが出力する前記N種の音声に応じて、前記音声発生機器の方向を変更する駆動部と、を備えることを特徴とする。 In order to achieve at least a part of the above problems, a sound generation system of the present invention is a sound generation system that generates sound, and includes a sound generation device, N (N is an integer of 1 or more) microphones, and The sound generated by the sound generating device is removed from the sound collected by the N microphones, and N types of sound arriving at the N microphones are generated by a sound source separate from the sound generating device. N echo cancellers that respectively output, and a drive unit that changes the direction of the sound generating device according to the N types of sounds output by the N echo cancellers.
この構成によれば、N個のエコーキャンセラがN個のマイクにより収音された音声から音声発生機器が発生する音声を除去する。そして、N個のエコーキャンセラは、音声発生機器とは別個の音源が発しN個のマイクに到来するN種の音声をそれぞれ出力する。この場合、音声発生機器が音声を発生している状態においても、音声発生機器とは別個の音源が発した音声をN種の音声として抽出することができるので、駆動部がN種の音声に応じて音声発生機器の方向を変更することにより、音声発生機器とは別個の音源が発する音声を用いて音声発生機器を所望の方向に向けることが可能となる。 According to this configuration, the N echo cancellers remove the sound generated by the sound generating device from the sound collected by the N microphones. The N echo cancellers output N types of sounds that are emitted from a sound source separate from the sound generation device and arrive at the N microphones. In this case, since the sound generated by the sound source different from the sound generating device can be extracted as N types of sound even when the sound generating device is generating sound, the drive unit converts the sound into N types of sound. By changing the direction of the sound generating device accordingly, the sound generating device can be directed in a desired direction using sound generated by a sound source separate from the sound generating device.
前記音声発生システムにおいて、Nは、2以上であり、前記音声発生システムは、さらに、前記N個のエコーキャンセラが出力する前記N種の音声に基づいて、前記音源の方向を推定する音源方向推定部を備え、前記駆動部は、前記音源方向推定部により推定された前記音源の方向に基づいて、前記音声発生機器の方向を変更するものとしても良い。 In the speech generation system, N is 2 or more, and the speech generation system further estimates a direction of the sound source based on the N types of speech output from the N echo cancellers. And the drive unit may change the direction of the sound generating device based on the direction of the sound source estimated by the sound source direction estimation unit.
この構成によれば、N種の音声として抽出された音声発生機器とは別個の音源が発した音声に基づいて、当該音源の方向が推定される。そして、音声発生機器の方向は、推定された音源の方向に基づいて変更されるので、音声発生機器を音声発生機器とは別個の音源の方向により容易に向けることができる。 According to this configuration, the direction of the sound source is estimated based on the sound emitted by a sound source that is separate from the sound generating device extracted as N types of sound. Since the direction of the sound generating device is changed based on the estimated direction of the sound source, the sound generating device can be easily directed by the direction of the sound source separate from the sound generating device.
前記音声発生システムは、さらに、前記N個のエコーキャンセラが出力する前記N種の音声に基づいて、前記音源が発した音声の内容を判別する音声認識部を備え、前記駆動部は、前記音声認識部により判別された音声の内容に従って、前記音声発生機器の方向を変更するものとしても良い。 The voice generation system further includes a voice recognition unit that determines the content of the voice generated by the sound source based on the N types of voices output from the N echo cancellers, and the drive unit includes the voice The direction of the sound generating device may be changed according to the content of the sound determined by the recognition unit.
この構成によれば、音声認識部により判別された音声の内容に従って、音声発生機器の方向が変更されるので、より的確に音声発生機器を所望の方向に向けることが可能となる。 According to this configuration, the direction of the sound generating device is changed according to the content of the sound determined by the sound recognizing unit, so that the sound generating device can be directed more accurately in a desired direction.
前記音声発生システムにおいて、Nは、2以上であり、音声発生システムは、さらに、前記N個のエコーキャンセラが出力する前記N種の音声に基づいて、前記音源の方向を推定する音源方向推定部と、前記N個のエコーキャンセラが出力する前記N種の音声に基づいて、前記音源方向推定部により推定された前記音源の方向からの音声を強調する音声強調部と、を備え、前記音声認識部は、前記音声強調部により強調された音声に基づいて前記音源が発した音声の内容を判別するものとしても良い。 In the speech generation system, N is 2 or more, and the speech generation system further estimates a direction of the sound source based on the N types of speech output from the N echo cancellers. And a speech enhancement unit that enhances speech from the direction of the sound source estimated by the sound source direction estimation unit based on the N types of speech output from the N echo cancellers, and the speech recognition The unit may determine the content of the sound generated by the sound source based on the sound emphasized by the sound enhancement unit.
この構成によれば、音源方向推定部により推定された音源の方向からの音声が強調されるので、音源が発した音声は、周囲の雑音よりも相対的に大きくなる。そのため、音声認識部は、より正確に音源が発した音声の内容を判別することができるので、的確に音声発生機器を所望の方向に向けることがより容易となる。 According to this configuration, since the sound from the direction of the sound source estimated by the sound source direction estimating unit is emphasized, the sound emitted from the sound source is relatively larger than the surrounding noise. For this reason, the voice recognition unit can more accurately determine the content of the voice generated by the sound source, and thus it is easier to accurately point the voice generating device in a desired direction.
なお、本発明は、種々の態様で実現することが可能である。例えば、音声発生システム、音声発生機器を配置するための音声発生機器用スタンド、これらの音声発生システムや音声発生機器用スタンドの制御方法、その制御方法を実現するためのプログラム、等の態様で実現することができる。 Note that the present invention can be realized in various modes. For example, the sound generating system, the sound generating device stand for arranging the sound generating device, the control method of the sound generating system and the sound generating device stand, the program for realizing the control method, etc. can do.
A.第1実施形態:
A1.スピーカシステムの構成:
図1は、本発明の第1実施形態としてのスピーカシステム10の外観形状を示す説明図である。図1(a)は、スピーカシステム10の斜視図であり、図1(b)は、スピーカシステム10の底面図である。図1に示すスピーカシステム10では、2つのスピーカユニット21,22と、2つのマイク31,32と、脚部40とが筐体11に取り付けられている。脚部40は、図示しないモータを介して筐体11に取り付けられている。このモータを駆動することにより、筐体11は、回転軸41を中心として左右方向に回転する。このとき、スピーカシステム10は、回転軸41を中心に全体としてその向きを変えるので、スピーカシステム10自体が回転軸41を中心に回転しているものと捉えることができる。なお、図1の例では、脚部40を円筒状に描いているが、脚部40の形状は種々変更することができる。
A. First embodiment:
A1. Speaker system configuration:
FIG. 1 is an explanatory diagram showing the external shape of a
図2は、スピーカシステム10の機能的な構成を示すブロック図である。スピーカシステム10は、2つのスピーカユニット21,22と、2つのマイク31,32と、2つのマイク31,32にそれぞれ接続された2つのエコーキャンセラ51,52と、方向調整部60と、脚部40(図1)を筐体11に対して回転させるモータ70と、モータ70を制御するモータ制御部71と、を有している。方向調整部60は、外部からスピーカシステム10に到来した音の到来方向の推定(後述する)を行う到来方向推定部61を有している。
FIG. 2 is a block diagram showing a functional configuration of the
スピーカシステム10には、所定の音声信号用のインタフェース(図示しない)が設けられており、このインタフェースを介して接続された音楽プレーヤMPから、LとRの2チャンネルの音声信号(ステレオ音声信号)が入力される。なお、音声信号用のインタフェースとしては、音声信号が伝送できるものであれば、有線・無線を問わず任意の種類のインタフェースを用いることができる。ステレオ音声信号のうちの、Lチャンネルの音声信号はスピーカユニット21に供給され、Rチャンネルの音声信号はスピーカユニット22に供給される。これにより、スピーカシステム10では、ステレオ音声が再生される。なお、以下では、特に断らない限り、音声信号とはステレオ音声信号のことをいう。
The
なお、第1実施形態のスピーカシステム10は、音声を発生する機器であると同時に、全体として音声を発生する機能を有しているので、音声発生システムともいうことができる。この場合において、スピーカユニット21,22は、音声発生システムにおける音声発生機器として捉えることも可能である。
Note that the
A2.スピーカシステムにおける処理の流れとスピーカシステムの動作:
図3は、スピーカシステム10(図2)における処理の流れを示すフローチャートである。スピーカシステム10は、CPUと、ROMと、RAMと、マイク31,32やモータ70等とのインタフェースと(いずれも図示しない)を有するコンピュータとしての機能を備えている。CPUがROMやRAMに格納されたプログラムを実行することにより、図3(a)に示す方向調整処理と、図3(b)に示すモータ制御処理とが実行され、エコーキャンセラ51,52、方向調整部60およびモータ制御部71の各機能部が実現される。この場合、機能部間の種々の信号の授受は、RAMの所定の領域にデータを格納し、格納されたデータを読み出すことにより行われる。
A2. Process flow and operation of the speaker system:
FIG. 3 is a flowchart showing the flow of processing in the speaker system 10 (FIG. 2). The
図4および図5は、スピーカシステム10の使用状態を示す説明図であり、図3の方向調整処理およびモータ制御処理が実行された際のスピーカシステム10の動作を示している。図4および図5の例では、音楽プレーヤMP(図2)から供給される音声信号により、スピーカユニット21,22から音楽が再生されている。図4(a)に示す初期の状態において、ユーザUSRは、一点鎖線で示すスピーカシステム10の正面方向から、スピーカシステム10に向かって右にずれた方向に位置している。
4 and 5 are explanatory diagrams showing the usage state of the
図3(a)に示す方向調整処理は、タイマ割り込み等の機能により定期的に実行される。方向調整処理のステップS11では、スピーカシステム10が備えるマイクの数だけ、エコーキャンセルの処理が行われる。このエコーキャンセルの処理は、並列に実行される。第1実施形態のスピーカシステム10では、エコーキャンセラ51,52(図2)が、それぞれに接続されたマイク31,32により収音されたマイク入力音に対してエコーキャンセルの処理を施す。具体的には、エコーキャンセラ51,52は、音楽プレーヤMP(図2)から入力された音声信号を参照信号とし、その参照信号を適応フィルタに通して得られる疑似エコー信号をマイク入力音から差し引く(例えば、電子情報通信学会『知識の森』(http://www.ieice-hbkb.org/)2群−6編−5章参照)。これにより、スピーカユニット21,22が発した音がマイク31,32に伝達されることにより発生する音響エコーが除去され、スピーカシステム10とは別個の音源が発することにより、スピーカシステム10の外部から到来した音(外部到来音)が抽出される。抽出された外部到来音は、エコーキャンセラ51,52から方向調整部60(図2)の到来方向推定部61に供給される。なお、スピーカシステム10には、2つのマイク31,32と2つのエコーキャンセラ51,52とが設けられているため、2つのエコーキャンセラ51,52が出力する外部到来音は、2種の音声として到来方向推定部61に供給される。
The direction adjustment process shown in FIG. 3A is periodically executed by a function such as a timer interrupt. In step S11 of the direction adjustment processing, echo cancellation processing is performed for the number of microphones included in the
図4(a)の例では、スピーカユニット21,22から音楽が再生されている状態で、ユーザUSRが声を発している。ユーザUSRが発した声は、スピーカシステム10のマイク31,32により収音される。マイク31,32により収音された音(マイク入力音)には、ユーザUSRの声と、スピーカユニット21,22により再生されている音楽(すなわち、音響エコー)との双方が含まれている。マイク入力音に対して、エコーキャンセルの処理を施すことにより(図3(a)のステップS11)、ユーザUSRの声が外部到来音として抽出される。
In the example of FIG. 4A, the user USR utters a voice while music is being played from the
図3(a)のステップS12において、到来方向推定部61(図2)は、エコーキャンセラ51,52から供給された外部到来音に基づいて、音声の到来方向を推定する。音声の到来方向は、遅延時間推定法等の周知の音声到来方向推定技術(例えば、電子情報通信学会『知識の森』(http://www.ieice-hbkb.org/)2群−6編−3章参照)を用いて推定される。なお、到来方向推定部61は、スピーカシステム10とは別個の音源が発した外部到来音の到来方向を推定しているので、当該音源の方向を推定する音源方向推定部ともいうことができる。
In step S <b> 12 of FIG. 3A, the arrival direction estimation unit 61 (FIG. 2) estimates the arrival direction of speech based on the external arrival sound supplied from the
到来方向推定部61により推定された外部到来音の到来方向は、スピーカシステム10を外部到来音の到来方向へ向けるために必要な回転角度(以下、単に「回転角度」とも呼ぶ)として与えられる。なお、以下の説明では、回転角度を、スピーカシステム10を上から見て反時計回りの方向を正とし、時計回りの方向を負とする符号付の角度として表す。但し、回転角度は、この反対に、スピーカシステム10を上から見て時計回りの方向を正とし、反時計回りの方向を負とするものとしても良い。
The arrival direction of the external incoming sound estimated by the arrival
ステップS13において、方向調整部60(図2)は、外部到来音の到来方向が特定されたか否かを判断する。具体的には、エコーキャンセラ51,52により抽出された外部到来音の音量が予め設定された閾値よりも小さい場合、あるいは、複数の方向から音が到来して優位な到来方向が特定できなかった場合等には、外部到来音の到来方向が特定されなかったものと判断される。一方、外部到来音の音量が十分に大きく、かつ、優位な到来方向が特定できた場合には、外部到来音の到来方向が特定されたものと判断される。外部到来音の到来方向が特定されたものと判断された場合には、制御はステップS14に移され、外部到来音の到来方向が特定されなかったものと判断された場合には、方向調整処理は終了する。
In step S13, the direction adjustment unit 60 (FIG. 2) determines whether or not the arrival direction of the external incoming sound has been specified. Specifically, when the volume of the external incoming sound extracted by the
図3(a)のステップS14において、方向調整部60(図2)は、制御信号として、到来方向推定部61により推定された外部到来音の到来方向、すなわち、回転角度をモータ制御部71に送出する。そして、モータ制御部71に制御信号を送出した後、方向調整処理は終了する。なお、回転角度の絶対値が予め設定された値よりも小さい場合、モータ制御部71への制御信号の送出を省略するものとしても良い。
In step S14 of FIG. 3 (a), the direction adjustment unit 60 (FIG. 2) sends the arrival direction of the external incoming sound estimated by the arrival
図4(b)は、ユーザUSRの声(すなわち、外部到来音)の到来方向が推定された状態を示している。ユーザUSRは、一点鎖線で示すスピーカシステム10の正面方向から、スピーカシステム10に向かって右にずれた方向において声を発している。そのため、図3(a)のステップS12において、音声の到来方向は、二点鎖線で示すユーザUSRの方向と推定される。図4(b)の例では、音声の到来方向(ユーザUSRの方向)は、スピーカシステム10の正面方向から、スピーカシステム10を上から見て反時計回りに角度θ回転させた方向と推定されている。そして、図3(a)のステップS13においては、外部到来音の到来方向が特定されたものと判断され、ステップS14において、回転角度θが制御信号としてモータ制御部71に送出される。
FIG. 4B shows a state in which the arrival direction of the voice of the user USR (that is, the external incoming sound) is estimated. The user USR utters a voice in a direction shifted to the right from the front direction of the
図3(b)に示すモータ制御処理は、タイマ割り込み等の機能により定期的に実行される。モータ制御処理のステップS21において、モータ制御部71(図2)は、方向調整部60(図2)から制御信号が送出されたか否かを判断する。制御信号が送出されなかったものと判断された場合、制御はステップS23に移される。一方、方向調整部60からモータ制御部71に制御信号が送出されたものと判断された場合、制御はステップS22に移される。制御信号が送出されたか否かは、RAMの所定の領域に格納されたフラグのオン・オフ状態や、制御信号に対応するデータの数値に基づいて判断することができる。なお、図3(b)に示すモータ制御処理では、ステップS21で制御信号が送出されなかったものと判断された場合、制御をステップS23に移しているが、制御をステップS23に移すことなく、モータ制御処理を終了するものとしても良い。
The motor control process shown in FIG. 3B is periodically executed by a function such as a timer interrupt. In step S21 of the motor control process, the motor control unit 71 (FIG. 2) determines whether or not a control signal is sent from the direction adjustment unit 60 (FIG. 2). If it is determined that the control signal has not been sent, control is transferred to step S23. On the other hand, when it is determined that the control signal is sent from the
ステップS22において、モータ制御部71(図2)は、制御信号として送出された回転角度と、実行時点においてスピーカシステム10が向いている方向(現時点方向)とに基づいて、スピーカシステム10を向ける目標方向を更新する。目標方向および現時点方向は、脚部40(図4)を基準とする特定の方向(例えば、筐体11と脚部40との機械的な原点方向)からの角度として表される。この場合、目標方向は、現時点方向に回転角度を加算した角度に更新される。
In step S22, the motor control unit 71 (FIG. 2) targets the
図5(a)は、図3(b)のステップS22において目標方向が更新された状態を示している。図5(a)の例では、現時点方向は、一点鎖線で示すスピーカシステム10の正面方向となっている。そして、回転角度がθとなっているので、目標方向は、二点鎖線で示すユーザUSRの方向となる。
FIG. 5A shows a state in which the target direction has been updated in step S22 of FIG. In the example of FIG. 5A, the current direction is the front direction of the
図3(b)のステップS23において、モータ制御部71(図2)は、モータ70を駆動してスピーカシステム10を目標方向に向かって回転させる。具体的には、モータ制御部71は、目標方向と現時点方向との角度差(すなわち、回転角度)に応じて、モータ70を駆動する。これにより、スピーカシステム10は、回転角度分だけ回転して、目標方向に向く。このように、モータ70と、モータ制御部71とにより、スピーカシステム10の方向は変化させられる。そのため、モータ70とモータ制御部71とを合わせて一個の機能部(駆動部)として捉えることも可能である。
In step S23 of FIG. 3B, the motor control unit 71 (FIG. 2) drives the
図5(b)は、モータ70が駆動されてスピーカシステム10が回転した状態を示している。図5(b)に示すように、図3(b)のステップS23においてモータ70を回転させることにより、スピーカシステム10の筐体11は、脚部40に対して回転角度θだけ回転する。これにより、一点鎖線で示す方向を向いていたスピーカシステム10は、二点鎖線で示す目標方向(すなわち、ユーザUSRの方向)を向く。
FIG. 5B shows a state where the
このように、第1実施形態のスピーカシステム10では、2つのマイク31,32により収音された音(マイク入力音)にエコーキャンセル処理を施すことにより、マイク入力音から、スピーカユニット21,22からマイク31,32に伝達されてきた音(音響エコー)が除去される。そして、マイク入力音から音響エコーを除去した音(外部到来音)から音声の到来方向を推定し、推定された到来方向に基づいてスピーカシステム10を回転する。これにより、スピーカシステム10において音声が再生されている場合においても、ユーザUSRの発した声の到来方向、すなわち、ユーザUSRの方向にスピーカシステム10を向けることが可能となる。
As described above, in the
なお、第1実施形態のスピーカシステム10では、2つのマイク31,32と2つのエコーキャンセラ51,52を用いているが、マイクおよびエコーキャンセラの数は、2以上であれば、任意の数とすることができる。マイクおよびエコーキャンセラの数を3以上とすることにより、左右および上下の各方向における回転角度として、音声の到来方向を推定することができる。そして、左右方向に加え、上下方向に回転させるモータを用いることにより、ユーザの姿勢に関わらずスピーカシステムをユーザの頭部へ向けることが可能となる。
In the
第1実施形態のスピーカシステム10では、モータ制御処理(図3(b))のステップS23において、目標方向と現時点方向との角度差(回転角度)に応じて、モータ70を駆動しているが、回転角度が予め設定された上限角度以上である場合には、目標方向に向かって上限角度の分だけモータ70を駆動し、回転角度が上限角度未満である場合には、目標方向に向かって回転角度分だけモータ70を駆動するものとしても良い。このようにしても、モータ制御処理を複数回繰り返すことにより、スピーカシステム10を外部到来音の到来方向(ユーザの方向)に向けることができる。このように上限角度を設定した場合、以下のような効果を奏する。ユーザが一時的に移動した先で声を発した場合においても、スピーカシステム10は、直ちにユーザが移動した先の方向に向かない。そのため、ユーザが移動先から戻った際においても、スピーカシステム10は、ユーザの方向に近い方向を向いた状態にすることができる。また、移動先から戻ったユーザが声を発してスピーカシステム10をユーザの方向に向ける際には、スピーカシステム10の回転角度を小さくすることができるので、より速やかにスピーカシステム10をユーザの方向に向けることが可能となる。
In the
B.第2実施形態:
B1.スピーカスタンドの構成:
図6は、本発明の第2実施形態としてのスピーカスタンド80の使用状態を示す説明図である。スピーカスタンド80は、その筐体81の上面にスピーカシステム10aを配置するように構成されている。スピーカシステム10aは、筐体11aに取り付けられた2つのスピーカユニット21a,22aを有している。また、スピーカスタンド80では、2つのマイク31a,32aおよび脚部40aが筐体81に取り付けられている。脚部40aは、第1実施形態のスピーカシステム10と同様に、図示しないモータを介して筐体81に取り付けられており、スピーカスタンド80および筐体81の上面に配置されたスピーカシステム10aを回転させることができる。なお、スピーカシステム10aは、音声を発生する機器であるので、音声発生機器とも言うことができる。
B. Second embodiment:
B1. Speaker stand configuration:
FIG. 6 is an explanatory diagram showing a usage state of the speaker stand 80 as the second embodiment of the present invention. The speaker stand 80 is configured to arrange the
図7は、スピーカスタンド80の機能的な構成を示すブロック図である。スピーカスタンド80は、スピーカユニット21,22が省略されている点と、スピーカユニット21,22に換えて外部に接続されたスピーカシステム10aに音声信号を供給している点で、第1実施形態のスピーカシステム10と異なっている。他の点は、第1実施形態のスピーカシステム10と同様である。
FIG. 7 is a block diagram showing a functional configuration of the
スピーカスタンド80においても、第1実施形態のスピーカシステム10と同様の処理(図3)が行われる。そのため、第1実施形態と同様に、スピーカシステム10aにおいて音声が再生されている場合においても、ユーザが声を発することにより、ユーザの発した声の到来方向、すなわち、ユーザの方向にスピーカスタンド80およびスピーカシステム10aを向けることが可能となる。
In the
B2.接続態様の変形例:
スピーカスタンド80には、所定の音声信号用のインタフェース(図示しない)が設けられている。図7の例では、音楽プレーヤMPとスピーカシステム10aとは、このインタフェースを介してスピーカスタンド80に接続されている。そして、音楽プレーヤMPが出力する音声信号は、一旦スピーカスタンド80に入力された後、スピーカスタンド80からスピーカシステム10aに供給されている。しかしながら、スピーカスタンド、音楽プレーヤおよびスピーカシステムは、図7とは異なる態様で接続されるものとしても良い。なお、音声信号用のインタフェースとしては、音声信号を伝送できるものであれば、有線・無線を問わず任意の種類のインタフェースを用いることができる。
B2. Variation of connection mode:
The speaker stand 80 is provided with an interface (not shown) for a predetermined audio signal. In the example of FIG. 7, the music player MP and the
図8および図9は、スピーカスタンド80aとスピーカシステム10a,10gとの接続態様の変形例を示す説明図である。なお、これらの場合、スピーカスタンド80aからは、音声信号を出力する必要がない。そのため、図8および図9に示すように、スピーカスタンド80aからは、音声信号を出力するための線路が省略され、入力された音声信号は、エコーキャンセラ51,52で使用される参照信号としてのみ用いられる。但し、図8および図9に示すスピーカスタンド80aに換えて、図7に示すスピーカスタンド80をそのまま使用することも可能である。
FIG. 8 and FIG. 9 are explanatory diagrams showing modifications of the connection mode between the speaker stand 80a and the
図8に示す接続態様の第1の変形例では、スピーカスタンド80aおよびスピーカシステム10aは、音楽プレーヤMPに並列に接続されている。そして、音楽プレーヤMPから出力される音声信号は、スピーカスタンド80aおよびスピーカシステム10aのそれぞれに直接供給される。そのため、スピーカシステム10aへの音声信号の伝送経路をより簡略化することができるので、音声信号の伝送過程で音質が低下することを抑制することが可能となる。
In the first modification of the connection mode shown in FIG. 8, the speaker stand 80a and the
図9に示す接続態様の第2の変形例では、音楽プレーヤMPが出力する音声信号は、一旦スピーカシステム10gに入力された後、スピーカシステム10gからスピーカスタンド80aに供給される。この場合、スピーカシステム10gには、音声信号を出力するための線路が付加されるので、スピーカシステム10gの構成が、図7および図8のスピーカシステム10aよりも複雑になる。但し、スピーカシステム10gが出力する音声信号を、スピーカシステム10gの再生特性等に合わせて補正することができる。そのため、スピーカスタンド80aでは、音響エコーの除去をより確実に行うことができ、外部到来音の到来方向をより正確に推定することが可能となる。
In the second modification of the connection mode shown in FIG. 9, the audio signal output from the music player MP is once input to the
C.第3実施形態:
図10は、本発明の第3実施形態としてのスピーカスタンド80bの使用状態を示す説明図である。図10は、スピーカスタンド80bと、その筐体81bの上面に配置されたスピーカシステム10bとからなる組を2組用いたスピーカセット1を示している。スピーカシステム10bは、筐体11bに取り付けられた1つのスピーカユニット23を有している。スピーカスタンド80bでは、1つのマイク33および脚部40bが筐体81bに取り付けられている。脚部40bは、第1実施形態のスピーカシステム10や第2実施形態のスピーカスタンド80と同様に、図示しないモータを介して筐体81bに取り付けられており、スピーカスタンド80bおよび筐体81bの上面に配置されたスピーカシステム10bを回転させることができる。なお、図10に示すように、スピーカセット1は、それぞれ2つのスピーカシステム10bとスピーカスタンド80bとを有している。そこで、以下では、スピーカシステム10bやスピーカスタンド80b等の複数ある構成部を区別する場合には、符号の後に[1]あるいは[2]を付加して表記する。
C. Third embodiment:
FIG. 10 is an explanatory diagram showing a usage state of the
第3実施形態のスピーカセット1は、2つのスピーカシステム10bを有しているので、一方のスピーカシステム10bにおいてLチャンネルの音声信号を再生し、他方のスピーカシステム10bにおいてRチャンネルの音声信号を再生することにより、スピーカセット1でステレオの音声が再生される。このように、スピーカセット1は、全体として音声を発生する機能を有しているので、音声発生システムともいうことができる。
Since the speaker set 1 of the third embodiment has two
図11は、スピーカスタンド80bの機能的な構成を示すブロック図である。なお、2つのスピーカスタンド80b[1],80b[2]の構成は同一であるので、図11では、一方のスピーカスタンド80b[1]についてのみ構成を図示している。スピーカスタンド80b[1]は、2つのマイク31a,32aおよび2つのエコーキャンセラ51,52に換えて、スピーカスタンド80b[1]が有するマイク33[1]およびエコーキャンセラ53[1]と、他のスピーカスタンド80b[2]が有するマイク33[2]およびエコーキャンセラ53[2]とを使用している点で、第2実施形態のスピーカスタンド80(図7)と異なっている。他の点は、第2実施形態のスピーカスタンド80と同様である。
FIG. 11 is a block diagram showing a functional configuration of the
第3実施形態のスピーカセット1では、マイク33[1]が収音したマイク入力音には、スピーカシステム10b[1]のスピーカユニット23[1](図10)から伝達されてきた音と、スピーカシステム10b[2]のスピーカユニット23[2]から空間を伝播してきた音とが含まれる。エコーキャンセラ53[1]は、これらの音を音響エコーとして、マイク33[1]が収音したマイク入力音から除去する。音響エコーが除去された外部到来音は、到来方向推定部61[1]と、他のスピーカスタンド80b[2]が有する到来方向推定部61[2]とに供給される。
In the speaker set 1 of the third embodiment, the microphone input sound picked up by the microphone 33 [1] includes the sound transmitted from the speaker unit 23 [1] (FIG. 10) of the
到来方向推定部61[1]は、スピーカスタンド80b[1]のエコーキャンセラ53[1]から供給される外部到来音と、他のスピーカスタンド80b[2]のエコーキャンセラ53[2]から供給される外部到来音とに基づいて、音声の到来方向を推定する。なお、この場合、到来方向の推定には、2つのスピーカスタンド80b[1],80b[2]間の距離等、2つのスピーカスタンド80b[1],80b[2]の位置関係に関する情報が必要となる。このような位置関係に関する情報は、予めユーザにより入力される。また、ユーザが位置関係に関する情報を入力するのに換えて、個々のスピーカシステム10b[1],10b[2]に位置測定用の音声を再生させるとともに、別個に設けられたマイクで収音した位置測定用の音声を解析することにより、2つのスピーカスタンド80b[1],80b[2]の位置関係に関する情報を設定するものとしても良い。2つのスピーカスタンド80b[1],80b[2]の位置関係は、上述した音声の解析による他、赤外線による位置の測定等、種々の位置測定方法を用いて取得することができる。
The arrival direction estimation unit 61 [1] is supplied from the external incoming sound supplied from the echo canceller 53 [1] of the
このように、第3実施形態のスピーカセット1においても、2つのマイク33[1],33[2]と、個々のマイク33[1],33[2]に接続された2つのエコーキャンセラ53[1],53[2]とにより、スピーカセット1の外部から到来した外部到来音が抽出される。そして、到来方向推定部61により、抽出された外部到来音に基づいて外部到来音の到来方向が推定されるので、2つのスピーカスタンド80bは、それぞれが有するモータ70を駆動して、スピーカスタンド80bとスピーカシステム10bとを外部到来音の到来方向に向けることができる。そのため、第1実施形態及び第2実施形態と同様に、スピーカセット1において音声が再生されている場合においても、ユーザが声を発することにより、ユーザの発した声の到来方向、すなわち、ユーザの方向にスピーカスタンド80bおよびスピーカシステム10bを向けることが可能となる。
Thus, also in the speaker set 1 of the third embodiment, the two microphones 33 [1] and 33 [2] and the two
なお、第3実施形態のスピーカスタンド80bでは、スピーカスタンド80bに入力された音声信号をそのままスピーカシステム10bに出力しているが、スピーカシステム10bに出力する音声信号を、外部到来音の到来方向に基づいて遅延させるものとしても良い。このようにすれば、2つのスピーカシステム10b[1],10b[2]のいずれか一方に近い位置にユーザがいる場合においても、スピーカシステム10b[1],10b[2]からユーザに到達する音声の位相を合わせることができるので、ユーザはより自然な音声を聴取することが可能となる。
In the
また、第3実施形態のスピーカセット1では、ステレオ音声を再生するために、スピーカスタンド80bと、スピーカシステム10bとからなる組を2組用いている。但し、スピーカスタンド80bと、スピーカシステム10bとからなる組は、2以上であれば任意の数とすることができる。例えば、5.1チャンネルのサラウンド音声を再生するために、スピーカスタンド80bおよびスピーカシステム10bからなる組を5組と、サブウーファとを使用することも可能である。この場合においては、5.1チャンネルの音声信号をスピーカスタンド80bに供給し、当該音声信号を参照信号としてエコーキャンセルが行われる。
In the speaker set 1 of the third embodiment, two sets of the
上記説明では、本発明の第3実施形態として、スピーカシステム10bを筐体81bの上面に配置するスピーカスタンド80bの例を示しているが、本発明の第3実施形態としては、スピーカシステム10bおよびスピーカスタンド80bの構成と機能とを有する単体のスピーカシステムとして構成することも可能である。
In the above description, an example of the
D.第4実施形態:
図12は、本発明の第4実施形態としてのスピーカシステム10cの機能的な構成を示すブロック図である。第4実施形態のスピーカシステム10cは、モード切替スイッチ91、音声データ格納部92および音声データ登録部93が付加されている点と、方向調整部60cの構成が異なっている点とで、第1実施形態のスピーカシステム10と異なっている。他の点は、第1実施形態のスピーカシステム10と同様である。
D. Fourth embodiment:
FIG. 12 is a block diagram showing a functional configuration of a
スピーカシステム10cは、動作モードとして、音声データを登録するための音声登録モード(後述する)と、第1実施形態のスピーカシステム10と同様にスピーカシステム10cの方向を調整する方向調整モードとを有している。モード切替スイッチ91は、オルタネイト動作型(位置保持型)のスイッチで、スピーカシステム10cの動作モードは、スイッチの位置に応じて、音声登録モードと方向調整モードとのいずれかに切り替えられる。
The
図13は、スピーカシステム10cにおける処理の流れを示すフローチャートである。スピーカシステム10cは、CPUと、ROMと、RAMと、二次記憶装置と、マイク31,32、モータ70、モード切替スイッチ91等とのインタフェースと(いずれも図示しない)を有するコンピュータとしての機能を備えている。CPUがROMやRAMに格納されたプログラムを実行することにより、図13(a)ないし(c)に示す各処理が実行され、エコーキャンセラ51,52、方向調整部60c、モータ制御部71および音声データ登録部93の各機能部が実現される。なお、図13(c)に示すモータ制御処理は、図3(b)に示す第1実施形態におけるモータ制御処理と同一であるので、ここではその説明を省略する。
FIG. 13 is a flowchart showing the flow of processing in the
図13(a)に示すモード対応処理は、タイマ割り込み等の機能により定期的に実行される。モード対応処理のステップS31において、スピーカシステム10cは、モード切替スイッチ91の位置に応じて、スピーカシステム10cの動作モードが音声登録モードであるか否かを判断する。動作モードが音声登録モードであると判断された場合には、制御はステップS32に移され、音声登録モードにおける処理が実行される。一方、動作モードが音声登録モードでない、すなわち、動作モードが方向調整モードであると判断された場合には、制御はステップS34に移される。
The mode corresponding process shown in FIG. 13A is periodically executed by a function such as a timer interrupt. In step S31 of the mode handling process, the
ステップS32において、音声データ登録部93は、マイク31が収音した音声を一時的に録音し、録音された音声を解析する。録音された音声を解析することにより、録音された音声からユーザの声を抽出する。ユーザの声は、例えば、人の声に含まれる帯域において一定以上の大きさの音が所定の時間(例えば、0.5〜2秒)継続して検出された場合に、継続して検出された音声として抽出することができる。
In step S32, the voice
ステップS33において、音声データ登録部93は、ステップS32において抽出されたユーザの声を表す音声データを、音声データ格納部92に登録する。具体的には、二次記憶装置(図示しない)の所定の領域に確保された音声データ格納部92に、ステップS32において抽出されたユーザの声を表す音声データを格納する。そして、音声データ格納部92への音声データの登録後、図13(a)に示すモード対応処理は終了する。
In step S33, the voice
ステップS31において、動作モードが音声登録モードでないと判断された場合に制御が移されるステップS34では、図13(b)に示す方向調整処理が実行される。そして、方向調整処理の終了後、モード対応処理は終了する。 In step S34, in which the control is shifted when it is determined that the operation mode is not the voice registration mode in step S31, the direction adjustment process shown in FIG. 13B is executed. And after completion | finish of a direction adjustment process, a mode corresponding | compatible process is complete | finished.
図13(b)の方向調整処理は、ステップS13がステップS43に置き換えられている点と、ステップS12とステップS43との間に2つのステップS41,S42が付加されている点で、第1実施形態の方向調整処理(図3(a))と異なっている。他の点は、第1実施形態の方向調整処理と同様である。 The direction adjustment process of FIG. 13B is the first implementation in that step S13 is replaced by step S43 and two steps S41 and S42 are added between step S12 and step S43. This is different from the direction adjustment processing of the form (FIG. 3A). Other points are the same as those in the direction adjustment process of the first embodiment.
ステップS41において、到来方向強調部62は、到来方向推定部61において推定された到来方向からの音声(外部到来音)を強調する。具体的には、到来方向推定部61から供給される外部到来音の到来方向を表す情報(方向情報)に基づいて、エコーキャンセラ51,52から供給される外部到来音に対してビームフォーミング(例えば、電気情報通信学会の知識ベース(http://www.ieice-hbkb.org/portal/)の2群−6編−2章参照)を施す。これにより、到来方向推定部61により推定された到来方向からの音声が強調される。
In step S <b> 41, the arrival
ステップS42において、音声認識部63は、到来方向強調部62において強調され、音声認識部63に供給された音声(強調音声)からユーザの声を認識する。具体的には、パターンマッチング等の周知の音声認識技術を用いることにより、強調音声から音声データ格納部92に登録された音声(登録音声)を検出する。
In step S <b> 42, the
ステップS43において、方向調整部60cは、音声認識部63による登録音声の検出結果に基づいて、強調音声が登録音声と一致するか否かを判断する。具体的には、強調音声から登録音声が検出された場合には、強調音声が登録音声と一致するものと判断され、制御はステップS14に移される。一方、強調音声から登録音声が検出されなかった場合には、強調音声が登録音声と一致しないものと判断され、方向調整処理が終了する。
In step S43, the direction adjustment unit 60c determines whether or not the emphasized voice matches the registered voice based on the detection result of the registered voice by the
これにより、予め登録されたユーザの声が検出された場合、ステップS14では、制御信号として、到来方向推定部61において推定された回転角度をモータ制御部71に送出する。そして、図13(c)に示すモータ制御処理が実行されることにより、スピーカシステム10cは、ユーザの声の到来方向に向く。
Thereby, when a user's voice registered in advance is detected, the rotation angle estimated in the arrival
このように、第4実施形態のスピーカシステム10cにおいても、2つのマイク31,32により収音されたマイク入力音にエコーキャンセル処理を施すことにより、マイク入力音から音響エコーが除去される。そして、マイク入力音から音響エコーを除去した外部到来音から音声の到来方向を推定し、推定された到来方向に基づいてスピーカシステム10cを回転する。そのため、スピーカシステム10cにおいて音声が再生されている場合においても、ユーザの発した声の到来方向、すなわち、ユーザの方向にスピーカシステム10cを向けることが可能となる。
As described above, also in the
さらに、第4実施形態のスピーカシステム10cでは、2つのマイク31,32により収音されたマイク入力音にエコーキャンセル処理を施した外部到来音から音声の到来方向を推定し、推定された到来方向からの外部到来音を強調している。このように強調された音声では、音声の到来方向に位置するユーザの声が周囲の雑音よりも相対的に大きくなる。そのため、強調された音声を用いて音声認識を行うことにより、より正確にユーザの声を検出することが可能となる。但し、外部到来音の強調を省略することも可能である。
Furthermore, in the
また、第4実施形態のスピーカシステム10cでは、予め登録されたユーザの声が検出された場合に、推定された到来方向に基づいてスピーカシステム10cを回転する。そのため、登録されていないユーザの声や周囲の雑音により、ユーザの意図に反してスピーカシステム10cが回転することが抑制される。
Moreover, in the
第4実施形態では、方向調整処理(図13(b)のステップS14において、制御信号として、外部到来音の到来方向として推定された回転角度を送出しているが、外部到来音の到来方向と関係なく予め設定された回転角度を送出することも可能である。例えば、回転方向を表すユーザの複数の声(例えば、「右」および「左」)を登録し、音声認識により複数の登録音声のいずれが検出されたかを判別して、判別結果に基づいた制御信号を送出することも可能である。この場合、制御信号として送出される回転角度には、ユーザの声により表される回転方向に向かって予め設定された角度分だけ回転させるための値が設定される。この場合、外部到来音が回転方向を表すものであるか否かを判別して、スピーカシステム10cを回転しているので、スピーカシステム10cは、外部到来音の内容に従ってその方向が変更されているものということができる。
In the fourth embodiment, the rotation angle estimated as the direction of arrival of the external incoming sound is transmitted as the control signal in step S14 of FIG. 13 (b). It is also possible to send a preset rotation angle regardless of, for example, a plurality of user's voices (for example, “right” and “left”) representing the rotation direction are registered, and a plurality of registered voices are recognized by voice recognition. It is also possible to transmit a control signal based on the determination result, in which case the rotation angle transmitted as the control signal includes the rotation direction represented by the voice of the user. In this case, it is determined whether or not the external incoming sound represents the rotation direction, and the
さらに、回転方向を表す複数の声に加え、回転方向を指定しないことを表す声(例えば、「こちら」)を登録し、音声認識により検出された音声が回転方向を指定しないことを表すものであった場合に、制御信号として、外部到来音の到来方向として推定された回転角度を送出するものとしても良い。 Furthermore, in addition to a plurality of voices indicating the rotation direction, a voice indicating that the rotation direction is not specified (for example, “here”) is registered, and the voice detected by voice recognition indicates that the rotation direction is not specified. If there is, the rotation angle estimated as the direction of arrival of the external incoming sound may be transmitted as the control signal.
なお、音声認識により回転方向を表す複数の登録音声のいずれが検出されたかを判別し、判別結果に基づいて制御信号を送出する場合において、さらに外部到来音の強調を省略する場合、外部到来音の到来方向の推定を省略することもできる。この場合には、スピーカシステムに設けられるマイクの数を1つとすることも可能である。 In the case where it is determined which of a plurality of registered sounds representing the rotation direction is detected by the voice recognition, and the control signal is transmitted based on the determination result, and further emphasis of the external incoming sound is omitted, the external incoming sound It is also possible to omit the estimation of the direction of arrival. In this case, the number of microphones provided in the speaker system can be one.
第4実施形態では、スピーカシステム10cの動作モードの切替をオルタネイト動作型のモード切替スイッチ91を用いて行っているが、他の方法で動作モードの切替を行うこともできる。例えば、動作モードの切り替えに、モーメンタリ動作型(自動復帰型)のスイッチを用いることも可能である。この場合、スイッチの押下を検出した際に、モード対応処理(図13(a))のステップS32,S33を実行することにより、音声データを登録することができる。そして、方向調整処理(図13(b))をタイマ割り込み等の機能により定期的に実行すれば、第4実施形態と同様にスピーカシステム10cをユーザの方向に向けることができる。
In the fourth embodiment, the operation mode of the
また、第4実施形態では、音声登録モードでユーザの声を表す音声データを登録しているが、音声データは、パーソナルコンピュータやスマートフォンやタブレット型端末等の外部のコンピュータを用いて登録することも可能である。この場合には、スピーカシステム10cに、外部のコンピュータとスピーカシステム10cとを接続するためのインタフェースが設けられる。
In the fourth embodiment, the voice data representing the user's voice is registered in the voice registration mode. However, the voice data may be registered using an external computer such as a personal computer, a smartphone, or a tablet terminal. Is possible. In this case, the
上記説明では、本発明の第4実施形態として、単体のスピーカシステム10cの例を示しているが、本発明の第4実施形態としては、第2実施形態と同様に、スピーカシステムとスピーカスタンドとを別個のものとして構成することも可能である。
In the above description, an example of a
E.変形例:
本発明は上記各実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば、次のような変形も可能である。
E. Variation:
The present invention is not limited to the above-described embodiments, and can be implemented in various modes without departing from the gist thereof. For example, the following modifications are possible.
E1.変形例1:
上記各実施形態では、エコーキャンセラ51,52,53と、方向調整部60,60cと、モータ制御部71と、音声データ登録部93との各機能部を、CPU(図示しない)がプログラムを実行することにより実現しているが、これらの各機能部の少なくとも一部をハードウェアにより実現するものとしても良い。
E1. Modification 1:
In each of the above-described embodiments, the CPU (not shown) executes programs for the function units of the
E2.変形例2:
上記各実施形態では、本発明を、スピーカセット、スピーカシステムおよびスピーカシステムを配置するためのスピーカスタンドに適用しているが、本発明は、テレビやテレビのスタンド、スマートフォンやタブレット型端末のスタンド等、音声を発生する種々のシステム(音声発生システム)や音声発生機器を配置するための種々のスタンド(音声発生機器用スタンド)に適用することも可能である。
E2. Modification 2:
In each of the above embodiments, the present invention is applied to a speaker set, a speaker system, and a speaker stand for arranging the speaker system. However, the present invention includes a television, a television stand, a smartphone, a tablet terminal stand, and the like. The present invention can also be applied to various systems (sound generation systems) that generate sound and various stands (sound generation device stands) for arranging sound generation devices.
E3.変形例3:
上記各実施形態では、声を発するユーザ自身がスピーカシステムとは別個の音源となっているが、必ずしもユーザ自身が声を発する必要はない。例えば、ユーザがベルやブザー等を鳴らすことにより、スピーカシステムの方向を変化させるものとしても良い。この場合、ユーザが鳴らすベルやブザー等がスピーカシステムとは別個の音源となる。
E3. Modification 3:
In each of the above embodiments, the user who speaks is a sound source separate from the speaker system, but the user does not necessarily have to speak. For example, the user may change the direction of the speaker system by ringing a bell or buzzer. In this case, a bell, a buzzer, or the like that the user rings is a sound source that is separate from the speaker system.
1…スピーカセット、10,10a,10b,10c,10g…スピーカシステム、11,11a,11b…筐体、21,21a,22,22a,23…スピーカユニット、31,31a,32,32a,33…マイク、40,40a,40b…脚部、41…回転軸、51,52,53…エコーキャンセラ、60,60c…方向調整部、61…到来方向推定部、62…到来方向強調部、63…音声認識部、70…モータ、71…モータ制御部、80,80a,80b…スピーカスタンド、81,81b…筐体、91…モード切替スイッチ、92…音声データ格納部、93…音声データ登録部、MP…音楽プレーヤ、USR…ユーザ
DESCRIPTION OF
Claims (5)
音声発生機器と、
N個(Nは、1以上の整数)のマイクと、
前記N個のマイクにより収音された音声から前記音声発生機器が発生する音声を除去して、前記音声発生機器とは別個の音源が発し前記N個のマイクに到来するN種の音声をそれぞれ出力するN個のエコーキャンセラと、
前記N個のエコーキャンセラが出力する前記N種の音声に応じて、前記音声発生機器の方向を変更する駆動部と、
を備える音声発生システム。 A sound generation system for generating sound,
A sound generator,
N microphones (N is an integer of 1 or more),
The sound generated by the sound generation device is removed from the sound collected by the N microphones, and N types of sound arriving at the N microphones are emitted from a sound source separate from the sound generation device. N echo cancellers to output,
A drive unit that changes the direction of the sound generating device according to the N types of sound output by the N echo cancellers;
A sound generation system comprising:
Nは、2以上であり、
前記音声発生システムは、さらに、
前記N個のエコーキャンセラが出力する前記N種の音声に基づいて、前記音源の方向を推定する音源方向推定部
を備え、
前記駆動部は、前記音源方向推定部により推定された前記音源の方向に基づいて、前記音声発生機器の方向を変更する
音声発生システム。 The sound generation system according to claim 1,
N is 2 or more,
The sound generation system further includes:
A sound source direction estimating unit that estimates the direction of the sound source based on the N types of sounds output from the N echo cancellers;
The said drive part changes the direction of the said sound generation apparatus based on the direction of the said sound source estimated by the said sound source direction estimation part.
前記N個のエコーキャンセラが出力する前記N種の音声に基づいて、前記音源が発した音声の内容を判別する音声認識部
を備え、
前記駆動部は、前記音声認識部により判別された音声の内容に従って、前記音声発生機器の方向を変更する
音声発生システム。 The sound generation system according to claim 1, further comprising:
A speech recognizing unit for discriminating the content of speech emitted by the sound source based on the N types of speech output by the N echo cancellers;
The said drive part changes the direction of the said audio | voice generation apparatus according to the content of the audio | voice discriminated by the said audio | voice recognition part Voice generating system.
Nは、2以上であり、
前記音声発生システムは、さらに、
前記N個のエコーキャンセラが出力する前記N種の音声に基づいて、前記音源の方向を推定する音源方向推定部と、
前記N個のエコーキャンセラが出力する前記N種の音声に基づいて、前記音源方向推定部により推定された前記音源の方向からの音声を強調する音声強調部と、
を備え、
前記音声認識部は、前記音声強調部により強調された音声に基づいて前記音源が発した音声の内容を判別する
音声発生システム。 The sound generation system according to claim 3,
N is 2 or more,
The sound generation system further includes:
A sound source direction estimating unit that estimates the direction of the sound source based on the N types of sounds output by the N echo cancellers;
A speech enhancement unit that enhances speech from the direction of the sound source estimated by the sound source direction estimation unit based on the N types of speech output by the N echo cancellers;
With
The voice recognition system, wherein the voice recognition unit discriminates the content of voice generated by the sound source based on the voice emphasized by the voice enhancement unit.
N個(Nは、1以上の整数)のマイクと、
前記N個のマイクにより収音された音声から前記音声発生機器が発生する音声を除去して、前記音声発生機器とは別個の音源が発し前記N個のマイクに到来するN種の音声をそれぞれ出力するN個のエコーキャンセラと、
前記N個のエコーキャンセラが出力する前記N種の音声に応じて、前記音声発生機器の方向を回転させる駆動部と、
を備える音声発生機器用スタンド。 A sound generating device stand for arranging sound generating devices,
N microphones (N is an integer of 1 or more),
The sound generated by the sound generation device is removed from the sound collected by the N microphones, and N types of sound arriving at the N microphones are emitted from a sound source separate from the sound generation device. N echo cancellers to output,
A drive unit that rotates the direction of the sound generation device according to the N types of sound output by the N echo cancellers;
A stand for sound generating equipment.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013240485A JP2015103824A (en) | 2013-11-20 | 2013-11-20 | Voice generation system and stand for voice generation apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013240485A JP2015103824A (en) | 2013-11-20 | 2013-11-20 | Voice generation system and stand for voice generation apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015103824A true JP2015103824A (en) | 2015-06-04 |
Family
ID=53379243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013240485A Pending JP2015103824A (en) | 2013-11-20 | 2013-11-20 | Voice generation system and stand for voice generation apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015103824A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113572878A (en) * | 2020-04-29 | 2021-10-29 | 维沃移动通信有限公司 | Electronic device, control method and control device thereof, and readable storage medium |
-
2013
- 2013-11-20 JP JP2013240485A patent/JP2015103824A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113572878A (en) * | 2020-04-29 | 2021-10-29 | 维沃移动通信有限公司 | Electronic device, control method and control device thereof, and readable storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10097921B2 (en) | Methods circuits devices systems and associated computer executable code for acquiring acoustic signals | |
US9913022B2 (en) | System and method of improving voice quality in a wireless headset with untethered earbuds of a mobile device | |
US9313572B2 (en) | System and method of detecting a user's voice activity using an accelerometer | |
US9438985B2 (en) | System and method of detecting a user's voice activity using an accelerometer | |
US9197974B1 (en) | Directional audio capture adaptation based on alternative sensory input | |
KR102035477B1 (en) | Audio processing based on camera selection | |
US9124984B2 (en) | Hearing aid, signal processing method, and program | |
JP2015213328A (en) | Three-dimensional sound capturing and reproducing with multi-microphones | |
JP5259622B2 (en) | Sound collection device, sound collection method, sound collection program, and integrated circuit | |
TWI584629B (en) | Sound conditioning | |
JP2005084253A (en) | Sound processing apparatus, method, program and storage medium | |
EP3005362B1 (en) | Apparatus and method for improving a perception of a sound signal | |
WO2018167960A1 (en) | Speech processing device, speech processing system, speech processing method, and speech processing program | |
US10529358B2 (en) | Method and system for reducing background sounds in a noisy environment | |
WO2011033924A1 (en) | Echo removal device, echo removal method, and program for echo removal device | |
US11410671B2 (en) | Speech processing device and speech processing meihod | |
JP6800809B2 (en) | Audio processor, audio processing method and program | |
US10225670B2 (en) | Method for operating a hearing system as well as a hearing system | |
JP2011211266A (en) | Speaker array device | |
JP2016163135A (en) | Sound collection device, program and method | |
JP2015103824A (en) | Voice generation system and stand for voice generation apparatus | |
US20190306618A1 (en) | Methods circuits devices systems and associated computer executable code for acquiring acoustic signals | |
JP6361360B2 (en) | Reverberation judgment device and program | |
JP2005236407A (en) | Acoustic processing apparatus, acoustic processing method, and manufacturing method | |
JP2019537071A (en) | Processing sound from distributed microphones |