JP2007318373A - Voice input unit, and audio source separation unit - Google Patents
Voice input unit, and audio source separation unit Download PDFInfo
- Publication number
- JP2007318373A JP2007318373A JP2006144818A JP2006144818A JP2007318373A JP 2007318373 A JP2007318373 A JP 2007318373A JP 2006144818 A JP2006144818 A JP 2006144818A JP 2006144818 A JP2006144818 A JP 2006144818A JP 2007318373 A JP2007318373 A JP 2007318373A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- microphones
- source separation
- microphone unit
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、所定の音響空間において音声を入力する複数のマイクロホンを備え、それらマイクロホンにより得られる音声信号を所定の音源分離装置に伝送する音声入力装置、及びそれを具備する音源分離装置に関するものである。 The present invention relates to a sound input device that includes a plurality of microphones that input sound in a predetermined acoustic space, and that transmits a sound signal obtained by the microphones to a predetermined sound source separation device, and a sound source separation device including the sound input device. is there.
所定の音響空間に複数の音源と複数のマイクロホン(音声入力手段)とが存在する場合、その複数のマイクロホンごとに、複数の音源各々からの個別音声信号(以下、音源信号という)が重畳された音声信号(以下、混合音声信号という)が入力される。このようにして入力された複数の前記混合音声信号のみに基づいて、前記音源信号各々を同定(分離)する音源分離処理の方式は、ブラインド音源分離方式(Blind Source Separation方式、以下、BSS方式という)と呼ばれる。
さらに、BSS方式の音源分離処理の1つに、独立成分分析法(Independent Component Analysis、以下、ICA法という)に基づくBSS方式の音源分離処理がある。このICA法に基づくBSS方式は、複数のマイクロホンを通じて入力される複数の前記混合音声信号(時系列の音声信号)において、前記音源信号どうしが統計的に独立であることを利用して所定の分離行列(逆混合行列)を最適化し、入力された複数の前記混合音声信号に対して最適化された分離行列によるフィルタ処理を施すことによって前記音源信号の同定(音源分離)を行う処理方式である。その際、分離行列の最適化は、ある時点で設定されている分離行列を用いたフィルタ処理により同定(分離)された信号(分離信号)に基づいて、逐次計算(学習計算)により以降に用いる分離行列を計算することによって行われる。
ここで、ICA法に基づくBSS方式の音源分離処理によれば、分離信号各々は、混合音声信号の入力数(=マイクロホンの数)と同じ数の出力端(出力チャンネルといってもよい)各々を通じて出力される。このようなICA法に基づくBSS方式の音源分離処理は、例えば、非特許文献1や非特許文献2等に詳説されている。
また、ブラインド音源分離処理としては、バイノーラル方式のブラインド音源分離処理も知られている。これは、人間の聴覚モデルに基づいて複数の入力音声信号に時変のゲイン調節を施して音源分離を行うものであり、比較的低い演算負荷で実現できる音源分離処理である。これについては、例えば、非特許文献3や非特許文献4等に詳説されている。このバイノーラル方式のブラインド音源分離処理の1つに、バイナリマスク方式によるブラインド音源分離処理がある。
Furthermore, as one of the BSS sound source separation processes, there is a BSS sound source separation process based on an independent component analysis method (hereinafter referred to as ICA method). The BSS method based on the ICA method uses a fact that the sound source signals are statistically independent from each other in a plurality of the mixed sound signals (time-series sound signals) input through a plurality of microphones. This is a processing method for identifying a sound source signal (sound source separation) by optimizing a matrix (inverse mixing matrix) and applying a filtering process using an optimized separation matrix to a plurality of input mixed speech signals. . At that time, the optimization of the separation matrix is used later by sequential calculation (learning calculation) based on the signal (separated signal) identified (separated) by the filter processing using the separation matrix set at a certain time. This is done by calculating the separation matrix.
Here, according to the sound source separation processing of the BSS method based on the ICA method, each of the separated signals has the same number of output terminals (also called output channels) as the number of mixed audio signals (= the number of microphones). Is output through. Such BSS sound source separation processing based on the ICA method is described in detail in
As a blind sound source separation process, a binaural blind sound source separation process is also known. This is a sound source separation process which performs sound source separation by performing time-varying gain adjustment on a plurality of input audio signals based on a human auditory model, and is a sound source separation process which can be realized with a relatively low calculation load. This is described in detail in, for example, Non-Patent Document 3 and Non-Patent
ところで、ICA法に基づくBSS方式の音源分離処理や、バイノーラル方式のブラインド音源分離処理においては、複数の音源に対するマイクロホンの向きが変化することにより、マイクロホンに対する複数の音源の存在方向(左右方向)が入れ替わると、これに応じて前記出力端(出力チャンネル)各々に出力される分離信号も入れ替わる。このため、音源分離装置が処理対象とする混合音声信号を入力するための複数のマイクロホンを、音響空間においてその向きが変化する作業者やロボット等の動体に設けた場合、音源分離装置によって特定の音源を追跡すること、即ち、特定の音源に対応する分離信号が必ず特定の出力端を通じて出力されるようにすることができないという問題点があった。
従って、本発明は上記事情に鑑みてなされたものであり、その目的とするところは、音響空間において向きが変化する動体に複数のマイクロホンを設け、その複数のマイクロホンにより得られる音声信号(混合音声信号)を音源分離装置に伝送する場合に、その音源分離装置が処理対象とする音声信号の入力に用いた複数のマイクロホンに対する音源の存在方向が入れ替わらないようにできる音声入力装置及びそれを具備する音源分離装置を提供することにある。
By the way, in the BSS sound source separation process based on the ICA method and the binaural blind sound source separation process, the direction of the microphone with respect to the plurality of sound sources changes, so that the existence directions (left and right directions) of the plurality of sound sources with respect to the microphones are changed. When switched, the separated signals output to the respective output terminals (output channels) are also switched accordingly. For this reason, when a plurality of microphones for inputting mixed audio signals to be processed by the sound source separation device are provided in a moving body such as an operator or a robot whose direction changes in the acoustic space, a specific sound source separation device is used. There is a problem that tracking a sound source, that is, it is impossible to always output a separated signal corresponding to a specific sound source through a specific output terminal.
Therefore, the present invention has been made in view of the above circumstances, and an object of the present invention is to provide a plurality of microphones on a moving body whose direction changes in an acoustic space, and to obtain an audio signal (mixed sound) obtained by the plurality of microphones. And a sound input device capable of preventing the direction of the sound source from changing with respect to a plurality of microphones used for inputting sound signals to be processed by the sound source separation device when the signal is transmitted to the sound source separation device. An object of the present invention is to provide a sound source separation device.
上記目的を達成するために本発明は、所定の音響空間において音声を入力する複数のマイクロホンを備え、そのマイクロホンにより得られる音声信号を所定の音源分離装置に伝送する音声入力装置に適用されるものであり、以下の第1発明に係る音声入力装置又は第2発明に係る音声入力装置として構成されるものである。
ここで、第1の発明は、次の(1−1)〜(1−3)に示す構成要素を具備することを特徴とする。
(1−1)3つ以上のマイクロホン及びこれらを所定の基準軸の周囲の所定位置に並べた状態で支持する支持部を有する第1のマイクロホンユニット。
(1−2)前記基準軸を回転中心とした場合における前記第1のマイクロホンユニットの向きを検出する第1の向き検出手段。
(1−3)前記第1の向き検出手段の検出結果に基づいて、前記3つ以上のマイクロホンにより得られる3つ以上の入力音声信号から、そのうちの一部の複数の信号を選択して前記音源分離装置に伝送する信号選択手段。
また、第2の発明は、次の(2−1)〜(2−4)に示す構成要素を具備することを特徴とする。
(2−1)複数のマイクロホン及びこれらを所定の基準軸の周囲の所定位置に支持する支持部を有する第2のマイクロホンユニット。
(2−2)前記第2のマイクロホンユニットを前記基準軸を中心に回転駆動する回転駆動手段。
(2−3)前記基準軸を回転中心とした場合における前記第2のマイクロホンユニットを回転可能に支持する部分の向き若しくは前記第2のマイクロホンユニットの向きを検出する第2の向き検出手段。
(2−4)前記第2の向き検出手段の検出結果に基づいて前記回転駆動手段を制御することにより前記第2のマイクロホンユニットの向きを調節する向き調節手段。
ここで、前記第1の向き検出手段や前記第2の向き検出手段としては、例えば、所定の基準方向に対する回転角度をジャイロセンサにより検出するものが考えられる。
前記第1の発明によれば、前記第1のマイクロホンユニットが前記基準軸を中心に回転してその向きが変化した場合に、音源分離装置へ伝送する音声信号(即ち、音源分離装置が処理対象とする音声信号)の入力に用いる複数のマイクロホンを、これに対する音源の存在方向が入れ替わらないように選択できる。
また、前記第2の発明によれば、前記第2のマイクロホンユニットを回転可能に支持する部分が前記基準軸を中心に回転した場合でも、前記第2のマイクロホンユニットの向きを一定方向に向くよう保持できる。
従って、前記第1の発明又は前記第2の発明によれば、音響空間において向きが変化する動体に複数のマイクロホンを設け、その複数のマイクロホンにより得られる音声信号(混合音声信号)を音源分離装置に伝送する場合に、その音源分離装置が処理対象とする音声信号の入力に用いた複数のマイクロホンに対する音源の存在方向が入れ替わらないようにできる。
また、本発明は、以上に示した第1の発明又は第2の発明に係る音声入力装置を具備し、その音声入力装置から伝送される複数の音声信号から、その音声入力装置が配置される音響空間に存在する1又は複数の音源に対応する分離信号を生成する音源分離装置として捉えることもできる。
なお、このような音源分離装置としては、例えば、独立成分分析法に基づくブラインド音源分離処理を行う音源分離装置や、バイナリマスク方式によるブラインド音源分離処理を行う音源分離装置等が考えられる。
In order to achieve the above object, the present invention is applied to an audio input device that includes a plurality of microphones for inputting sound in a predetermined acoustic space and transmits an audio signal obtained by the microphones to a predetermined sound source separation device. And is configured as a voice input device according to the following first invention or a voice input device according to the second invention.
Here, 1st invention comprises the component shown to following (1-1)-(1-3), It is characterized by the above-mentioned.
(1-1) A first microphone unit having three or more microphones and a support unit that supports these microphones in a state where they are arranged at predetermined positions around a predetermined reference axis.
(1-2) First direction detecting means for detecting the direction of the first microphone unit when the reference axis is the rotation center.
(1-3) Based on the detection result of the first direction detection means, select a plurality of signals, some of which are selected from three or more input audio signals obtained by the three or more microphones. Signal selection means for transmission to the sound source separation device.
Moreover, 2nd invention comprises the component shown to following (2-1)-(2-4), It is characterized by the above-mentioned.
(2-1) A second microphone unit having a plurality of microphones and a support unit that supports these microphones at a predetermined position around a predetermined reference axis.
(2-2) Rotation driving means for driving the second microphone unit to rotate about the reference axis.
(2-3) Second orientation detection means for detecting the orientation of the portion that rotatably supports the second microphone unit or the orientation of the second microphone unit when the reference axis is the center of rotation.
(2-4) Direction adjusting means for adjusting the direction of the second microphone unit by controlling the rotation driving means based on the detection result of the second direction detecting means.
Here, as the first direction detection unit and the second direction detection unit, for example, a unit that detects a rotation angle with respect to a predetermined reference direction by a gyro sensor can be considered.
According to the first aspect of the present invention, when the first microphone unit rotates around the reference axis and changes its direction, the audio signal transmitted to the sound source separation device (that is, the sound source separation device is the object to be processed). A plurality of microphones used for input of the sound signal) can be selected so that the direction of the sound source relative to the microphones is not switched.
In addition, according to the second aspect of the invention, even when the portion that rotatably supports the second microphone unit rotates around the reference axis, the second microphone unit is oriented in a certain direction. Can hold.
Therefore, according to the first invention or the second invention, a plurality of microphones are provided on a moving body whose direction changes in an acoustic space, and a sound signal (mixed sound signal) obtained by the plurality of microphones is provided as a sound source separation device. When transmitting to the sound source, it is possible to prevent the direction of the sound source from changing with respect to the plurality of microphones used for inputting the audio signal to be processed by the sound source separation device.
Further, the present invention includes the voice input device according to the first invention or the second invention described above, and the voice input device is arranged from a plurality of voice signals transmitted from the voice input device. It can also be understood as a sound source separation device that generates a separation signal corresponding to one or a plurality of sound sources present in the acoustic space.
As such a sound source separation device, for example, a sound source separation device that performs blind sound source separation processing based on an independent component analysis method, a sound source separation device that performs blind sound source separation processing by a binary mask method, and the like are conceivable.
本発明によれば、音響空間において向きが変化する動体に複数のマイクロホンを設け、その複数のマイクロホンにより得られる音声信号(混合音声信号)を音源分離装置に伝送する場合に、その音源分離装置が処理対象とする音声信号の入力に用いた複数のマイクロホンに対する音源の存在方向が入れ替わらないようにできる。 According to the present invention, when a plurality of microphones are provided on a moving body whose direction changes in an acoustic space, and a sound signal (mixed sound signal) obtained by the plurality of microphones is transmitted to the sound source separation device, the sound source separation device is It is possible to prevent the direction in which the sound source exists for a plurality of microphones used for inputting the audio signal to be processed from being switched.
以下添付図面を参照しながら、本発明の実施の形態について説明し、本発明の理解に供する。尚、以下の実施の形態は、本発明を具体化した一例であって、本発明の技術的範囲を限定する性格のものではない。
ここに、図1は本発明の第1実施形態に係る音源分離装置X1の概略構成を表すブロック図、図2は音源分離装置X1の概略外観図、図3は音源分離装置X1が備えるマイクユニットの平面図、図4は音源分離装置X1におけるマイクユニットの向きに応じたマイクロホンの選択処理を説明するためのマイクユニットの平面図、図5は本発明の第2実施形態に係る音源分離装置X2の概略構成を表すブロック図、図6は音源分離装置X2におけるマイクユニットの回転制御を説明するためのマイクユニットの平面図である。
Embodiments of the present invention will be described below with reference to the accompanying drawings for understanding of the present invention. In addition, the following embodiment is an example which actualized this invention, Comprising: It is not the thing of the character which limits the technical scope of this invention.
FIG. 1 is a block diagram showing a schematic configuration of the sound source separation device X1 according to the first embodiment of the present invention, FIG. 2 is a schematic external view of the sound source separation device X1, and FIG. 3 is a microphone unit provided in the sound source separation device X1. FIG. 4 is a plan view of a microphone unit for explaining microphone selection processing according to the direction of the microphone unit in the sound source separation device X1, and FIG. 5 is a sound source separation device X2 according to the second embodiment of the present invention. FIG. 6 is a plan view of the microphone unit for explaining the rotation control of the microphone unit in the sound source separation device X2.
[第1実施形態]
まず、図1〜図3を参照しつつ、本発明の第1実施形態に係る音源分離装置X1の構成について説明する。
図1に示すように、音源分離装置X1は、所定の音響空間において音声を入力する8つ(3つ以上の一例)のマイクロホン(以下、マイクと称する)1L〜4L、1R〜4Rが設けられたマイクユニット20aと、制御ユニット30aと、ジャイロセンサ10aとを備えている。また、制御ユニット30aには、音源分離処理部31、MPU32a及びマルチプレクサ33aが設けられている。
そして、音源分離装置X1は、複数のマイク1L〜4L、1R〜4Rにより得られる音声信号のうちの2つ(複数)の信号をマルチプレクサ33aを介して音源分離処理部31の2つの入力チャンネルIn1、In2(信号入力端)に伝送し、その2つの入力チャンネルIn1、In2に入力された音声信号から、複数のマイク1L〜4L、1R〜4Rが配置される音響空間に存在する2つの音源に対応する分離信号を生成(同定)し、それを出力チャンネルOut1、Out2(信号出力端)を通じて出力するものである。図1に示す例では、一方の出力チャンネルOut1を通じて出力される分離信号がスピーカ40に出力されている。
複数の入力チャンネルIn1、In2への入力音声信号は、それぞれ複数の音源の信号(音源信号)が重畳された混合音声信号である。そして、音源分離処理部31は、複数の入力チャンネルIn1、In2各々への入力音声信号に基づいてブラインド音源分離処理を実行することにより、各入力音声信号に重畳されている複数の音源信号(ここでは、2つの音源信号)を同定し、その同定した信号を分離信号として出力するものである。ここで、音源分離処理部31が実行するブラインド音源分離処理としては、前述したように、ICA法に基づくBSS方式の音源分離処理や、バイナリマスク方式によるブラインド音源分離処理等が考えられる。それら各処理の詳細は、前述した非特許文献1〜4に詳述されているので、ここでは説明を省略する。
[First Embodiment]
First, the configuration of the sound source separation device X1 according to the first embodiment of the present invention will be described with reference to FIGS.
As shown in FIG. 1, the sound source separation device X1 is provided with eight (three or more examples) microphones (hereinafter referred to as microphones) 1L to 4L and 1R to 4R for inputting sound in a predetermined acoustic space. The
The sound source separation device X1 then transmits two (a plurality) of the audio signals obtained by the plurality of
Input audio signals to the plurality of input channels In1 and In2 are mixed audio signals on which a plurality of sound source signals (sound source signals) are superimposed. The sound source
図3に示すように、マイクユニット20aは、8つのマイク1L〜4L、1R〜4R及びこれらを所定の基準軸M0の周囲の360°の範囲に並べた状態で支持する支持部21aとを備えて構成されている(第1のマイクロホンユニットの一例)。図3に示す例では、8つのマイク1L〜4L、1R〜4Rは、基準軸M0を中心とする円周に沿って等間隔で(隣接するマイクの配置位置と基準軸M0とにより形成される中心角が45°となる間隔で)で配列されている。
図3に示す例では、マイクユニット20aの正面方向D1に対し、基準軸M0を中心として反時計回りに0°から45°間隔の各位置に、マイク3L、マイク2L、マイク1L、マイク4R、マイク3R、マイク2R、マイク1R、マイク4Lが配置されている。
なお、マイクユニット20a、ジャイロセンサ10a、MPU32a及びマルチプレクサ33aが、第1発明に係る音声入力装置の一例を構成する。
As shown in FIG. 3, the
In the example illustrated in FIG. 3, the
The
図2に示す平面図(a)及び側面図(b)のように、音源分離装置X1は、作業者が着用するヘルメットや帽子等の着用具50に装着され、その全体が、着用具50の回転に従って回転する。ここで、音源分離装置X1は、基準軸M0が、着用具50の回転軸とほぼ一致するように着用具50に装着されている。
また、ジャイロセンサ10aは、ジャイロスコープの原理により例えば1軸の回転角度を検出するセンサであり、基準軸M0を回転中心とした場合におけるマイクユニット20aの向きを検出する(第1の向き検出手段の一例)。具体的には、所定の初期化処理が実行されたときのマイクユニット20aの正面方向D1の向きを基準方向D0(図4参照)とし、その基準方向D0に対するマイクユニット20aの正面方向D1の角度(基準方向D0に対する回転角度)をマイクユニット20aの向き(回転角度)として検出する。
マルチプレクサ33aは、8つのマイク1L〜4L、1R〜4Rにより得られる8つの入力音声信号から、そのうちの一部である2つの信号を選択して音源分離処理部31に伝送するものである。
また、MPU32aは、ジャイロセンサ10aに対して前記基準方向D0設定のための初期化設定を行うとともに、ジャイロセンサ10aの検出結果(マイクユニット20aの向き)を入力し、その検出結果に基づいてマルチプレクサ33aを制御することにより、8つのマイク1L〜4L、1R〜4Rにより得られる8つの入力音声信号のうち、いずれの2つの信号を音源分離処理部31に伝送させるかを切り替える制御を行うものである。その制御は、MPU32aが所定のプログラムを実行することにより実現される。なお、マルチプレクサ33a及びMPU32aが、信号選択手段の一例である。
As shown in the plan view (a) and the side view (b) shown in FIG. 2, the sound source separation device X1 is mounted on a wearing
The
The
Further, the
以下、図4を参照しつつ、MPU32aによるマルチプレクサ33aの制御内容について説明する。ここで、図4は、マイクユニット20aの向きに応じたマイク1L〜4L、1R〜4Rの選択処理を説明するためのマイクユニット20aの平面図を表す。
MPU32aは、ジャイロセンサ10aにより検出されるマイクユニット20aの回転角度ω(基準方向D0に対するマイクユニット20aの正面方向D1の角度)を監視し、その回転角度ωに応じて、8つの音声信号の中からいずれの2つの音声信号を選択して音源分離処理部31に伝送するかを、以下に示す8つのルールに従って制御する。なお、音源分離処理部31の2つの入力チャンネルを、第1入力チャンネルIn1及び第2入力チャンネルIn2と称する。
Hereinafter, the control contents of the
The
[ルール1]
(0°≦ω<22.5)又は(337.5°≦ω<360°)である場合、マイク1Lの音声信号を第1入力チャンネルIn1へ、マイク1Rの音声信号を第2入力チャンネルIn2へ伝送する。このときの状態を図4(a)に示す。
[ルール2]
(22.5°≦ω<67.5)である場合、マイク2Lの音声信号を第1入力チャンネルIn1へ、マイク2Rの音声信号を第2入力チャンネルIn2へ伝送する。このときの状態を図4(b)に示す。
[ルール3]
(67.5°≦ω<112.5°)である場合、マイク3Lの音声信号を第1入力チャンネルIn1へ、マイク3Rの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール4]
(112.5°≦ω<157.5°)である場合は、マイク4Lの音声信号を第1入力チャンネルIn1へ、マイク4Rの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール5]
(157.5°≦ω<202.5°)である場合、マイク1Rの音声信号を第1入力チャンネルIn1へ、マイク1Lの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール6]
(202.5°≦ω<247.5°)である場合、マイク2Rの音声信号を第1入力チャンネルIn1へ、マイク2Lの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール7]
(247.5°≦ω<292.5°)である場合、マイク3Rの音声信号を第1入力チャンネルIn1へ、マイク3Lの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール8]
(202.5°≦ω<337.5°)である場合、マイク4Rの音声信号を第1入力チャンネルIn1へ、マイク4Lの音声信号を第2入力チャンネルIn2へ伝送する。このときの状態を図4(c)に示す。
このように、MPU32aは、基準軸M0に対して相互に反対側に位置する2つのマイク(1Lと1R、2Lと2R、3Lと3R、4Lと4R)で得られる音声信号を選択して音源分離処理部31へ伝送させる。
[Rule 1]
When (0 ° ≦ ω <22.5) or (337.5 ° ≦ ω <360 °), the audio signal of the
[Rule 2]
When (22.5 ° ≦ ω <67.5), the audio signal of the
[Rule 3]
When (67.5 ° ≦ ω <112.5 °), the audio signal of the
[Rule 4]
If (112.5 ° ≦ ω <157.5 °), the audio signal of the
[Rule 5]
When (157.5 ° ≦ ω <202.5 °), the audio signal of the
[Rule 6]
When (202.5 ° ≦ ω <247.5 °), the audio signal of the
[Rule 7]
When (247.5 ° ≦ ω <292.5 °), the audio signal of the
[Rule 8]
When (202.5 ° ≦ ω <337.5 °), the audio signal of the
As described above, the
以上に示したように音声信号の選択を行う音源分離装置X1では、マイクユニット20aが基準軸M0を中心に回転してその向きが変化した場合に、音源分離処理部31へ伝送する音声信号(即ち、音源分離装置が処理対象とする混合音声信号)の入力に用いる2つのマイクが、そのマイクに対する音源(図4における音源1、音源2)の存在方向が入れ替わらないように選択される。
その結果、音源分離装置X1が装着された着用具50を着用した作業者は、回転して向く方向を変更した場合であっても、スピーカ40を通じて、特定の音源から発生する音声のみが分離生成(抽出)された音声を選択的に聴くことができる。
As described above, in the sound source separation device X1 that selects the sound signal, when the
As a result, the worker wearing the wearing
[第2実施形態]
次に、図5に示すブロック図を参照しつつ、本発明の第2実施形態に係る音源分離装置X2の構成について説明する。
図5に示すように、音源分離装置X2は、所定の音響空間において音声を入力する2つのマイクロホン(以下、マイクと称する)1L、1Rが設けられたマイクユニット20bと、制御ユニット30bと、ジャイロセンサ10bと、モータ60とを備えている。また、制御ユニット30bには、音源分離処理部31、MPU32b及びモータ60を動作させるドライバ33bが設けられている。
そして、音源分離装置X2は、2つのマイク1L、1Rにより得られる2つ(複数)の音声信号を音源分離処理部31の2つの入力チャンネルIn1、In2各々に伝送し、その2つの入力チャンネルIn1、In2を通じて入力される音声信号から、複数のマイク1L、2Rが配置される音響空間に存在する2つの音源に対応する分離信号を生成(同定)し、その分離信号を出力チャンネルOut1、Out2を通じて出力するものである。図5に示す例では、一方の出力チャンネルOut1を通じて出力される分離信号がスピーカ40に出力されている。
各入力チャンネルIn1、In2への入力音声信号は、それぞれ複数の音源の信号(音源信号)が重畳された混合音声信号であり、音源分離処理部31は、前述した音源分離装置X1における音源分離処理部31と同じものである。
なお、マイクユニット20b、ジャイロセンサ10b、MPU32b及びドライバ33bが、第2発明に係る音声入力装置の一例を構成する。
[Second Embodiment]
Next, the configuration of the sound source separation device X2 according to the second embodiment of the present invention will be described with reference to the block diagram shown in FIG.
As shown in FIG. 5, the sound source separation apparatus X2 includes a
The sound source separation device X2 transmits two (plural) audio signals obtained by the two
Input audio signals to the input channels In1 and In2 are mixed audio signals on which a plurality of sound source signals (sound source signals) are superimposed, and the sound source
The
マイクユニット20bは、2つのマイク1L、1Rと、これらを所定の基準軸Mの周囲の所定位置に支持する支持部21bとを有して構成されている(第2のマイクロホンユニットの一例)。図5に示す例では、2つのマイク1L、1Rは、基準軸Mに対して相互に反対側の等距離の位置に配置されている。
以下、2つのマイク1L、1Rの配列方向に直交する方向であって、一方のマイク1Lが左方向、他方のマイク1Rが右方向となる方向を、マイクユニット20bの正面方向と称する。図5では、紙面に向かう方向が、マイクユニット20bの正面方向である。
モータ60は、例えばステッピングモータ等により構成され、マイクユニット20bを基準軸M0を中心に回転駆動し、これを所望の向きで停止させる(向きを調節する)駆動手段である(回転駆動手段の一例)。
ジャイロセンサ10bは、前述した音源分離装置X1におけるジャイロセンサ10aと同様の回転角度検出用のセンサであり、基準軸M0を回転中心とした場合におけるマイクユニット20bを回転可能に支持する部分(図5の例では、モータ60の本体)の向きを検出する(第2の向き検出手段の一例)。具体的には、所定の初期化処理が実行されたときのモータ60本体の正面方向D2(図6参照)の向きを基準方向D0(図6参照)とし、その基準方向D0に対するモータ60本体の正面方向D2の角度(基準方向D0に対する回転角度)をモータ60本体の向き(回転角度)として検出する。ここで、図5に示す例では、モータ60本体(マックユニット20bの支持部)、ジャイロセンサ10b及び着用具50は、基準軸M0の位置で連結固定され、モータ60本体の正面方向D2が、着用具50の正面方向となるように設定されている。
The
Hereinafter, the direction orthogonal to the arrangement direction of the two
The
The
ドライバ33bは、MPU32bからの制御指令に従ってモータ60を動作させることにより、モータ60の回転軸の回転角度、即ち、その回転軸に支持されたマイクユニット20bの回転角度を調節するモータ駆動回路である。
MPU32bは、ジャイロセンサ10bに対して所定の基準方向D0(図6参照)設定のための初期化設定を行うとともに、ジャイロセンサ10bの検出結果(マイクユニット20bの支持部(モータ60本体)の向き)を入力し、その検出結果に基づいてドライバ33bに制御指令を出力することにより、マイクユニット20bの向きを調節するものである。即ち、MPU32bは、ドライバ33bを通じてモータ60の回転軸の回転角度、即ち、マイクユニット20bの向きを制御する。なお、MPU32b及びドライバ33bが、向き調節手段の一例である。
図5に示すように、音源分離装置X2も、作業者が着用するヘルメットや帽子等の着用具50に装着され、その全体が、着用具50の回転に従って回転する。ここで、音源分離装置X2は、基準軸M0が、着用具50の回転軸とほぼ一致するように着用具50に装着されている。
The
The
As shown in FIG. 5, the sound source separation device X <b> 2 is also attached to a wearing
以下、図6を参照しつつ、MPU32bによるモータ60の制御内容について説明する。ここで、図6は、マイクユニット20bの向きに応じたマイクユニット20bの回転制御を説明するためのマイクユニット20bの平面図を表す。
MPU32bは、ジャイロセンサ10bにより検出されるモータ60本体の回転角度ω(基準方向D0に対するモータ60本体(或いは着用具50)の正面方向D2の角度)を監視し、その回転角度ωに応じて、マイクユニット20bの向き(モータ60の回転軸の回転角度)を制御する。
図6(a)は、モータ60本体の正面方向D2(着用具50の正面方向)が所定の基準方向D0を向いている初期状態におけるマイクユニット20bの向きを表す。この初期状態では、マイクユニット20bの正面方向が基準方向D0に向くよう初期設定される。また、この初期状態において、ジャイロセンサ10bが初期化され、その検出角度ωが0°となる。
図6(b)は、初期状態からモータ60本体(着用具50)が反時計回りに角度ωだけ回転した状態(ジャイロセンサ10bの検出角度=ω)を表す。この場合、MPU32bは、マイクユニット20bを−ωだけ回転させる。これにより、図6(c)に示すように、マイクユニット20bの正面方向が基準方向D0に向く状態となる。
また、図6(d)は、初期状態からモータ60本体(着用具50)が時計回りに角度ωだけ回転した状態(ジャイロセンサ10bの検出角度=ω)を表す。この場合も、MPU32bは、マイクユニット20bを−ωだけ回転させる。これにより、図6(e)に示すように、マイクユニット20bの正面方向が基準方向D0に向く状態となる。
Hereinafter, the control content of the
The
FIG. 6A shows the orientation of the
FIG. 6B shows a state in which the
FIG. 6D shows a state where the
以上に示したように、音源分離装置X2は、着用具50を着用した作業者が回転することにより、マイクユニット20bを回転可能に支持する部分であるモータ60本体が基準軸M0を中心に回転した場合でも、マイクユニット20bの向きを一定方向に向くよう保持する。
その結果、音源分離装置X2が装着された着用具50を着用した作業者は、回転して向く方向を変更した場合であっても、スピーカ40を通じて、特定の音源から発生する音声のみが分離生成(抽出)された音声を選択的に聴くことができる。
なお、図5に示した音源分離装置X2は、ジャイロセンサ10bにより、マイクユニット20bを回転可能に支持する支持部(モータ60本体)の向きを検出するよう構成されているが、他の構成も考えられる。
例えば、ジャイロセンサ10bを、マイクユニット20bの支持部21b等に設け、そのジャイロセンサ10bにより、マイクユニット20bの向きを検出するよう構成することも考えられる。この場合、ジャイロセンサ10bによる検出角度が常に一定(=0°)となるように、モータ60の回転軸の角度を調節(制御)すればよい。
また、図5に示した音源分離装置X2は、モータ60の回転軸が基準軸M0となる構成を示したが、ギア等のリンク機構を採用することにより、基準軸M0とモータ60の回転軸とが一致しない構成も考えられる。
As described above, in the sound source separation device X2, the
As a result, the worker wearing the wearing
The sound source separation device X2 shown in FIG. 5 is configured to detect the orientation of the support portion (
For example, it is conceivable that the
Further, the sound source separation device X2 shown in FIG. 5 has a configuration in which the rotation axis of the
また、前述した音源分離装置X1及び音源分離装置X2では、2入力2出力の音源分離処理部31を例示したが、3つ以上の入出力チャンネル(チャンネル数n)を備えた音源分離処理部を採用することも考えられる。但しその場合、音源分離装置X1では、マイクロホンの数をn+1個以上とし、マルチプレクサ33aにより選択する信号数をn個とする。また、音源分離装置X2では、マイクロホンの数をn個とする。
また、回転角度を検出するセンサとして、ジャイロセンサ10a、10b以外の他の回転角度検出センサを採用することも考えられる。
また、前述した音源分離装置X1におけるマイクユニット20aは、3つ以上のマイク1L〜4L、1R〜4Rを基準軸M0の周囲の360°の範囲に並べた状態で支持するものであったが、各マイク1L〜4L、1R〜4Rがそれより狭い範囲に並べられた構成も考えられる。例えば、着用具50の回転角度の範囲が90°(±45°)以内であるという制約があるような場合には、マイク1L〜4L、1R〜4Rを基準軸M0の周囲の270°の範囲に並べた状態で支持する構成とすることが考えられる。
Further, in the sound source separation device X1 and the sound source separation device X2 described above, the sound source
It is also conceivable to employ a rotation angle detection sensor other than the
Further, the
本発明は、音声入力装置への利用が可能である。 The present invention can be used for a voice input device.
X1、X2…本発明の実施形態に係る音源分離装置
1、2…音源
1L〜4L、1R〜4R…マイクロホン
10a、10b…ジャイロセンサ
20a、20b…マイクユニット
21a、22b…マイクロホンの支持部
30a、30b…制御ユニット
40…スピーカ
In1、In2…入力チャンネル
Out1、Out2…出力チャンネル
X1, X2 ... sound
Claims (4)
複数のマイクロホン及びこれらを所定の基準軸の周囲の所定位置に並べた状態で支持する支持部を有する第1のマイクロホンユニットと、
前記基準軸を回転中心とした場合における前記第1のマイクロホンユニットの向きを検出する第1の向き検出手段と、
前記第1の向き検出手段の検出結果に基づいて、前記複数のマイクロホンにより得られる複数の入力音声信号から、そのうちの一部の複数の信号を選択して前記音源分離装置に伝送する信号選択手段と、
を具備してなることを特徴とする音声入力装置。 A voice input device comprising a plurality of microphones for inputting voice in a predetermined acoustic space, and transmitting a voice signal obtained by the microphones to a predetermined sound source separation device,
A first microphone unit having a plurality of microphones and a support unit that supports the microphones in a state in which they are arranged at predetermined positions around a predetermined reference axis;
First orientation detection means for detecting the orientation of the first microphone unit when the reference axis is the rotation center;
Based on the detection result of the first orientation detection means, a signal selection means for selecting a part of a plurality of signals from a plurality of input audio signals obtained by the plurality of microphones and transmitting the selected signal to the sound source separation device. When,
A voice input device comprising:
複数のマイクロホン及びこれらを所定の基準軸の周囲の所定位置に支持する支持部を有する第2のマイクロホンユニットと、
前記第2のマイクロホンユニットを前記基準軸を中心に回転駆動する回転駆動手段と、
前記基準軸を回転中心とした場合における前記第2のマイクロホンユニットを回転可能に支持する部分の向き若しくは前記第2のマイクロホンユニットの向きを検出する第2の向き検出手段と、
前記第2の向き検出手段の検出結果に基づいて前記回転駆動手段を制御することにより前記第2のマイクロホンユニットの向きを調節する向き調節手段と、
を具備してなることを特徴とする音声入力装置。 A voice input device comprising a plurality of microphones for inputting voice in a predetermined acoustic space, and transmitting a voice signal obtained by the microphones to a predetermined sound source separation device,
A second microphone unit having a plurality of microphones and a support portion for supporting these at predetermined positions around a predetermined reference axis;
Rotation driving means for rotating the second microphone unit around the reference axis;
Second orientation detection means for detecting the orientation of the portion that rotatably supports the second microphone unit or the orientation of the second microphone unit when the reference axis is the rotation center;
Direction adjusting means for adjusting the direction of the second microphone unit by controlling the rotation driving means based on the detection result of the second direction detecting means;
A voice input device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006144818A JP2007318373A (en) | 2006-05-25 | 2006-05-25 | Voice input unit, and audio source separation unit |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006144818A JP2007318373A (en) | 2006-05-25 | 2006-05-25 | Voice input unit, and audio source separation unit |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007318373A true JP2007318373A (en) | 2007-12-06 |
Family
ID=38851849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006144818A Withdrawn JP2007318373A (en) | 2006-05-25 | 2006-05-25 | Voice input unit, and audio source separation unit |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007318373A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009253525A (en) * | 2008-04-03 | 2009-10-29 | National Institute Of Advanced Industrial & Technology | Microphone signal processing device and method |
JP2014502439A (en) * | 2010-10-25 | 2014-01-30 | クゥアルコム・インコーポレイテッド | System, method, apparatus, and computer readable medium for directional high sensitivity recording control |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
WO2019188394A1 (en) * | 2018-03-30 | 2019-10-03 | ソニー株式会社 | Signal processing device and method, and program |
KR102093822B1 (en) * | 2018-11-12 | 2020-03-26 | 한국과학기술연구원 | Apparatus and method for separating sound sources |
-
2006
- 2006-05-25 JP JP2006144818A patent/JP2007318373A/en not_active Withdrawn
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009253525A (en) * | 2008-04-03 | 2009-10-29 | National Institute Of Advanced Industrial & Technology | Microphone signal processing device and method |
JP2014502439A (en) * | 2010-10-25 | 2014-01-30 | クゥアルコム・インコーポレイテッド | System, method, apparatus, and computer readable medium for directional high sensitivity recording control |
US9031256B2 (en) | 2010-10-25 | 2015-05-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
WO2019188394A1 (en) * | 2018-03-30 | 2019-10-03 | ソニー株式会社 | Signal processing device and method, and program |
US11159905B2 (en) | 2018-03-30 | 2021-10-26 | Sony Corporation | Signal processing apparatus and method |
KR102093822B1 (en) * | 2018-11-12 | 2020-03-26 | 한국과학기술연구원 | Apparatus and method for separating sound sources |
US10803882B2 (en) | 2018-11-12 | 2020-10-13 | Korea Institute Of Science And Technology | Apparatus and method of separating sound sources |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2543197B1 (en) | Multi-element directional acoustic arrays | |
US8265310B2 (en) | Multi-element directional acoustic arrays | |
US8325936B2 (en) | Directionally radiating sound in a vehicle | |
EP1872621B1 (en) | Multi-channel bass management | |
JP5401760B2 (en) | Headphone device, audio reproduction system, and audio reproduction method | |
US20080273722A1 (en) | Directionally radiating sound in a vehicle | |
JP2007318373A (en) | Voice input unit, and audio source separation unit | |
US20130028446A1 (en) | Orientation adjusting stereo audio output system and method for electrical devices | |
WO2013101061A1 (en) | Systems, methods, and apparatus for directing sound in a vehicle | |
JP4120646B2 (en) | Loudspeaker system | |
US8553894B2 (en) | Active and passive directional acoustic radiating | |
US20110002487A1 (en) | Audio Channel Assignment for Audio Output in a Movable Device | |
JP2008017469A (en) | Voice processing system and method | |
EP3054706A3 (en) | A binaural hearing system and a hearing device comprising a beamformer unit | |
US20180098175A1 (en) | Apparatus and method for driving an array of loudspeakers with drive signals | |
EP3364638B1 (en) | Recording method, recording playing method and apparatus, and terminal | |
JP5221235B2 (en) | Audio adjustment console | |
JP5843705B2 (en) | Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium | |
WO2005045456A3 (en) | Controlled acoustic beam generator for crowd control | |
JP2009253526A (en) | Sound field controller and sound field controlling method | |
US10659905B1 (en) | Method, system, and processing device for correcting energy distributions of audio signal | |
CN113261309A (en) | Sound output apparatus and sound output method | |
US20180264946A1 (en) | Dynamic audio steering control system | |
US11632644B2 (en) | Virtual soundstage with compact speaker array and interaural crosstalk cancellation | |
JP2019054491A (en) | Acoustic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080926 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20081226 |