JP2007318373A - Voice input unit, and audio source separation unit - Google Patents

Voice input unit, and audio source separation unit Download PDF

Info

Publication number
JP2007318373A
JP2007318373A JP2006144818A JP2006144818A JP2007318373A JP 2007318373 A JP2007318373 A JP 2007318373A JP 2006144818 A JP2006144818 A JP 2006144818A JP 2006144818 A JP2006144818 A JP 2006144818A JP 2007318373 A JP2007318373 A JP 2007318373A
Authority
JP
Japan
Prior art keywords
sound source
microphones
source separation
microphone unit
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006144818A
Other languages
Japanese (ja)
Inventor
Hiroshi Hashimoto
裕志 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2006144818A priority Critical patent/JP2007318373A/en
Publication of JP2007318373A publication Critical patent/JP2007318373A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To avoid replacement of the directions of existence of audio sources to a plurality of microphones used for inputting voice signals, which are processing objects of an audio source separation unit, when the voice signals obtained from the plurality of microphones provided on a moving object having a varied direction are transmitted to the audio source separation unit. <P>SOLUTION: Based on the detection results (the directions of microphone units 20a) of a gyrosensor 10a, from among eight input voice signals obtained from eight microphones 1L-4L, 1R-4R, or more, arrayed on the periphery of a reference axis M0, two signals of the portions thereof are selected and transmitted to an audio source separation processing section 31, so as to control not to replace the existence directions of the audio sources to the selected microphones. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、所定の音響空間において音声を入力する複数のマイクロホンを備え、それらマイクロホンにより得られる音声信号を所定の音源分離装置に伝送する音声入力装置、及びそれを具備する音源分離装置に関するものである。   The present invention relates to a sound input device that includes a plurality of microphones that input sound in a predetermined acoustic space, and that transmits a sound signal obtained by the microphones to a predetermined sound source separation device, and a sound source separation device including the sound input device. is there.

所定の音響空間に複数の音源と複数のマイクロホン(音声入力手段)とが存在する場合、その複数のマイクロホンごとに、複数の音源各々からの個別音声信号(以下、音源信号という)が重畳された音声信号(以下、混合音声信号という)が入力される。このようにして入力された複数の前記混合音声信号のみに基づいて、前記音源信号各々を同定(分離)する音源分離処理の方式は、ブラインド音源分離方式(Blind Source Separation方式、以下、BSS方式という)と呼ばれる。
さらに、BSS方式の音源分離処理の1つに、独立成分分析法(Independent Component Analysis、以下、ICA法という)に基づくBSS方式の音源分離処理がある。このICA法に基づくBSS方式は、複数のマイクロホンを通じて入力される複数の前記混合音声信号(時系列の音声信号)において、前記音源信号どうしが統計的に独立であることを利用して所定の分離行列(逆混合行列)を最適化し、入力された複数の前記混合音声信号に対して最適化された分離行列によるフィルタ処理を施すことによって前記音源信号の同定(音源分離)を行う処理方式である。その際、分離行列の最適化は、ある時点で設定されている分離行列を用いたフィルタ処理により同定(分離)された信号(分離信号)に基づいて、逐次計算(学習計算)により以降に用いる分離行列を計算することによって行われる。
ここで、ICA法に基づくBSS方式の音源分離処理によれば、分離信号各々は、混合音声信号の入力数(=マイクロホンの数)と同じ数の出力端(出力チャンネルといってもよい)各々を通じて出力される。このようなICA法に基づくBSS方式の音源分離処理は、例えば、非特許文献1や非特許文献2等に詳説されている。
また、ブラインド音源分離処理としては、バイノーラル方式のブラインド音源分離処理も知られている。これは、人間の聴覚モデルに基づいて複数の入力音声信号に時変のゲイン調節を施して音源分離を行うものであり、比較的低い演算負荷で実現できる音源分離処理である。これについては、例えば、非特許文献3や非特許文献4等に詳説されている。このバイノーラル方式のブラインド音源分離処理の1つに、バイナリマスク方式によるブラインド音源分離処理がある。
猿渡洋、「アレー信号処理を用いたブラインド音源分離の基礎」電子情報通信学会技術報告、vol.EA2001-7、pp.49-56、April 2001. 高谷智哉他、「SIMOモデルに基づくICAを用いた高忠実度なブラインド音源分離」電子情報通信学会技術報告、vol.US2002-87、EA2002-108、January 2003. R.F.Lyon, "A computational model of binaural localization and separation," In Proc. ICASSP, 1983. M. Bodden, "Modeling human sound-source localization and the cocktail-party-effect," Acta Acoustica, vol.1, pp.43-55, 1993.
When there are a plurality of sound sources and a plurality of microphones (sound input means) in a predetermined acoustic space, individual sound signals (hereinafter referred to as sound source signals) from each of the plurality of sound sources are superimposed for each of the plurality of microphones. An audio signal (hereinafter referred to as a mixed audio signal) is input. A sound source separation processing method for identifying (separating) each of the sound source signals based only on the plurality of mixed audio signals input in this way is a blind source separation method (hereinafter referred to as a BSS method). ).
Furthermore, as one of the BSS sound source separation processes, there is a BSS sound source separation process based on an independent component analysis method (hereinafter referred to as ICA method). The BSS method based on the ICA method uses a fact that the sound source signals are statistically independent from each other in a plurality of the mixed sound signals (time-series sound signals) input through a plurality of microphones. This is a processing method for identifying a sound source signal (sound source separation) by optimizing a matrix (inverse mixing matrix) and applying a filtering process using an optimized separation matrix to a plurality of input mixed speech signals. . At that time, the optimization of the separation matrix is used later by sequential calculation (learning calculation) based on the signal (separated signal) identified (separated) by the filter processing using the separation matrix set at a certain time. This is done by calculating the separation matrix.
Here, according to the sound source separation processing of the BSS method based on the ICA method, each of the separated signals has the same number of output terminals (also called output channels) as the number of mixed audio signals (= the number of microphones). Is output through. Such BSS sound source separation processing based on the ICA method is described in detail in Non-Patent Document 1, Non-Patent Document 2, and the like, for example.
As a blind sound source separation process, a binaural blind sound source separation process is also known. This is a sound source separation process which performs sound source separation by performing time-varying gain adjustment on a plurality of input audio signals based on a human auditory model, and is a sound source separation process which can be realized with a relatively low calculation load. This is described in detail in, for example, Non-Patent Document 3 and Non-Patent Document 4. As one of the binaural blind sound source separation processing, there is a blind sound source separation processing by a binary mask method.
Hiroshi Saruwatari, “Basics of Blind Sound Source Separation Using Array Signal Processing,” IEICE Technical Report, vol.EA2001-7, pp.49-56, April 2001. Tomoya Takatani et al., "High fidelity blind source separation using ICA based on SIMO model" IEICE Technical Report, vol.US2002-87, EA2002-108, January 2003. RFLyon, "A computational model of binaural localization and separation," In Proc. ICASSP, 1983. M. Bodden, "Modeling human sound-source localization and the cocktail-party-effect," Acta Acoustica, vol.1, pp.43-55, 1993.

ところで、ICA法に基づくBSS方式の音源分離処理や、バイノーラル方式のブラインド音源分離処理においては、複数の音源に対するマイクロホンの向きが変化することにより、マイクロホンに対する複数の音源の存在方向(左右方向)が入れ替わると、これに応じて前記出力端(出力チャンネル)各々に出力される分離信号も入れ替わる。このため、音源分離装置が処理対象とする混合音声信号を入力するための複数のマイクロホンを、音響空間においてその向きが変化する作業者やロボット等の動体に設けた場合、音源分離装置によって特定の音源を追跡すること、即ち、特定の音源に対応する分離信号が必ず特定の出力端を通じて出力されるようにすることができないという問題点があった。
従って、本発明は上記事情に鑑みてなされたものであり、その目的とするところは、音響空間において向きが変化する動体に複数のマイクロホンを設け、その複数のマイクロホンにより得られる音声信号(混合音声信号)を音源分離装置に伝送する場合に、その音源分離装置が処理対象とする音声信号の入力に用いた複数のマイクロホンに対する音源の存在方向が入れ替わらないようにできる音声入力装置及びそれを具備する音源分離装置を提供することにある。
By the way, in the BSS sound source separation process based on the ICA method and the binaural blind sound source separation process, the direction of the microphone with respect to the plurality of sound sources changes, so that the existence directions (left and right directions) of the plurality of sound sources with respect to the microphones are changed. When switched, the separated signals output to the respective output terminals (output channels) are also switched accordingly. For this reason, when a plurality of microphones for inputting mixed audio signals to be processed by the sound source separation device are provided in a moving body such as an operator or a robot whose direction changes in the acoustic space, a specific sound source separation device is used. There is a problem that tracking a sound source, that is, it is impossible to always output a separated signal corresponding to a specific sound source through a specific output terminal.
Therefore, the present invention has been made in view of the above circumstances, and an object of the present invention is to provide a plurality of microphones on a moving body whose direction changes in an acoustic space, and to obtain an audio signal (mixed sound) obtained by the plurality of microphones. And a sound input device capable of preventing the direction of the sound source from changing with respect to a plurality of microphones used for inputting sound signals to be processed by the sound source separation device when the signal is transmitted to the sound source separation device. An object of the present invention is to provide a sound source separation device.

上記目的を達成するために本発明は、所定の音響空間において音声を入力する複数のマイクロホンを備え、そのマイクロホンにより得られる音声信号を所定の音源分離装置に伝送する音声入力装置に適用されるものであり、以下の第1発明に係る音声入力装置又は第2発明に係る音声入力装置として構成されるものである。
ここで、第1の発明は、次の(1−1)〜(1−3)に示す構成要素を具備することを特徴とする。
(1−1)3つ以上のマイクロホン及びこれらを所定の基準軸の周囲の所定位置に並べた状態で支持する支持部を有する第1のマイクロホンユニット。
(1−2)前記基準軸を回転中心とした場合における前記第1のマイクロホンユニットの向きを検出する第1の向き検出手段。
(1−3)前記第1の向き検出手段の検出結果に基づいて、前記3つ以上のマイクロホンにより得られる3つ以上の入力音声信号から、そのうちの一部の複数の信号を選択して前記音源分離装置に伝送する信号選択手段。
また、第2の発明は、次の(2−1)〜(2−4)に示す構成要素を具備することを特徴とする。
(2−1)複数のマイクロホン及びこれらを所定の基準軸の周囲の所定位置に支持する支持部を有する第2のマイクロホンユニット。
(2−2)前記第2のマイクロホンユニットを前記基準軸を中心に回転駆動する回転駆動手段。
(2−3)前記基準軸を回転中心とした場合における前記第2のマイクロホンユニットを回転可能に支持する部分の向き若しくは前記第2のマイクロホンユニットの向きを検出する第2の向き検出手段。
(2−4)前記第2の向き検出手段の検出結果に基づいて前記回転駆動手段を制御することにより前記第2のマイクロホンユニットの向きを調節する向き調節手段。
ここで、前記第1の向き検出手段や前記第2の向き検出手段としては、例えば、所定の基準方向に対する回転角度をジャイロセンサにより検出するものが考えられる。
前記第1の発明によれば、前記第1のマイクロホンユニットが前記基準軸を中心に回転してその向きが変化した場合に、音源分離装置へ伝送する音声信号(即ち、音源分離装置が処理対象とする音声信号)の入力に用いる複数のマイクロホンを、これに対する音源の存在方向が入れ替わらないように選択できる。
また、前記第2の発明によれば、前記第2のマイクロホンユニットを回転可能に支持する部分が前記基準軸を中心に回転した場合でも、前記第2のマイクロホンユニットの向きを一定方向に向くよう保持できる。
従って、前記第1の発明又は前記第2の発明によれば、音響空間において向きが変化する動体に複数のマイクロホンを設け、その複数のマイクロホンにより得られる音声信号(混合音声信号)を音源分離装置に伝送する場合に、その音源分離装置が処理対象とする音声信号の入力に用いた複数のマイクロホンに対する音源の存在方向が入れ替わらないようにできる。
また、本発明は、以上に示した第1の発明又は第2の発明に係る音声入力装置を具備し、その音声入力装置から伝送される複数の音声信号から、その音声入力装置が配置される音響空間に存在する1又は複数の音源に対応する分離信号を生成する音源分離装置として捉えることもできる。
なお、このような音源分離装置としては、例えば、独立成分分析法に基づくブラインド音源分離処理を行う音源分離装置や、バイナリマスク方式によるブラインド音源分離処理を行う音源分離装置等が考えられる。
In order to achieve the above object, the present invention is applied to an audio input device that includes a plurality of microphones for inputting sound in a predetermined acoustic space and transmits an audio signal obtained by the microphones to a predetermined sound source separation device. And is configured as a voice input device according to the following first invention or a voice input device according to the second invention.
Here, 1st invention comprises the component shown to following (1-1)-(1-3), It is characterized by the above-mentioned.
(1-1) A first microphone unit having three or more microphones and a support unit that supports these microphones in a state where they are arranged at predetermined positions around a predetermined reference axis.
(1-2) First direction detecting means for detecting the direction of the first microphone unit when the reference axis is the rotation center.
(1-3) Based on the detection result of the first direction detection means, select a plurality of signals, some of which are selected from three or more input audio signals obtained by the three or more microphones. Signal selection means for transmission to the sound source separation device.
Moreover, 2nd invention comprises the component shown to following (2-1)-(2-4), It is characterized by the above-mentioned.
(2-1) A second microphone unit having a plurality of microphones and a support unit that supports these microphones at a predetermined position around a predetermined reference axis.
(2-2) Rotation driving means for driving the second microphone unit to rotate about the reference axis.
(2-3) Second orientation detection means for detecting the orientation of the portion that rotatably supports the second microphone unit or the orientation of the second microphone unit when the reference axis is the center of rotation.
(2-4) Direction adjusting means for adjusting the direction of the second microphone unit by controlling the rotation driving means based on the detection result of the second direction detecting means.
Here, as the first direction detection unit and the second direction detection unit, for example, a unit that detects a rotation angle with respect to a predetermined reference direction by a gyro sensor can be considered.
According to the first aspect of the present invention, when the first microphone unit rotates around the reference axis and changes its direction, the audio signal transmitted to the sound source separation device (that is, the sound source separation device is the object to be processed). A plurality of microphones used for input of the sound signal) can be selected so that the direction of the sound source relative to the microphones is not switched.
In addition, according to the second aspect of the invention, even when the portion that rotatably supports the second microphone unit rotates around the reference axis, the second microphone unit is oriented in a certain direction. Can hold.
Therefore, according to the first invention or the second invention, a plurality of microphones are provided on a moving body whose direction changes in an acoustic space, and a sound signal (mixed sound signal) obtained by the plurality of microphones is provided as a sound source separation device. When transmitting to the sound source, it is possible to prevent the direction of the sound source from changing with respect to the plurality of microphones used for inputting the audio signal to be processed by the sound source separation device.
Further, the present invention includes the voice input device according to the first invention or the second invention described above, and the voice input device is arranged from a plurality of voice signals transmitted from the voice input device. It can also be understood as a sound source separation device that generates a separation signal corresponding to one or a plurality of sound sources present in the acoustic space.
As such a sound source separation device, for example, a sound source separation device that performs blind sound source separation processing based on an independent component analysis method, a sound source separation device that performs blind sound source separation processing by a binary mask method, and the like are conceivable.

本発明によれば、音響空間において向きが変化する動体に複数のマイクロホンを設け、その複数のマイクロホンにより得られる音声信号(混合音声信号)を音源分離装置に伝送する場合に、その音源分離装置が処理対象とする音声信号の入力に用いた複数のマイクロホンに対する音源の存在方向が入れ替わらないようにできる。   According to the present invention, when a plurality of microphones are provided on a moving body whose direction changes in an acoustic space, and a sound signal (mixed sound signal) obtained by the plurality of microphones is transmitted to the sound source separation device, the sound source separation device is It is possible to prevent the direction in which the sound source exists for a plurality of microphones used for inputting the audio signal to be processed from being switched.

以下添付図面を参照しながら、本発明の実施の形態について説明し、本発明の理解に供する。尚、以下の実施の形態は、本発明を具体化した一例であって、本発明の技術的範囲を限定する性格のものではない。
ここに、図1は本発明の第1実施形態に係る音源分離装置X1の概略構成を表すブロック図、図2は音源分離装置X1の概略外観図、図3は音源分離装置X1が備えるマイクユニットの平面図、図4は音源分離装置X1におけるマイクユニットの向きに応じたマイクロホンの選択処理を説明するためのマイクユニットの平面図、図5は本発明の第2実施形態に係る音源分離装置X2の概略構成を表すブロック図、図6は音源分離装置X2におけるマイクユニットの回転制御を説明するためのマイクユニットの平面図である。
Embodiments of the present invention will be described below with reference to the accompanying drawings for understanding of the present invention. In addition, the following embodiment is an example which actualized this invention, Comprising: It is not the thing of the character which limits the technical scope of this invention.
FIG. 1 is a block diagram showing a schematic configuration of the sound source separation device X1 according to the first embodiment of the present invention, FIG. 2 is a schematic external view of the sound source separation device X1, and FIG. 3 is a microphone unit provided in the sound source separation device X1. FIG. 4 is a plan view of a microphone unit for explaining microphone selection processing according to the direction of the microphone unit in the sound source separation device X1, and FIG. 5 is a sound source separation device X2 according to the second embodiment of the present invention. FIG. 6 is a plan view of the microphone unit for explaining the rotation control of the microphone unit in the sound source separation device X2.

[第1実施形態]
まず、図1〜図3を参照しつつ、本発明の第1実施形態に係る音源分離装置X1の構成について説明する。
図1に示すように、音源分離装置X1は、所定の音響空間において音声を入力する8つ(3つ以上の一例)のマイクロホン(以下、マイクと称する)1L〜4L、1R〜4Rが設けられたマイクユニット20aと、制御ユニット30aと、ジャイロセンサ10aとを備えている。また、制御ユニット30aには、音源分離処理部31、MPU32a及びマルチプレクサ33aが設けられている。
そして、音源分離装置X1は、複数のマイク1L〜4L、1R〜4Rにより得られる音声信号のうちの2つ(複数)の信号をマルチプレクサ33aを介して音源分離処理部31の2つの入力チャンネルIn1、In2(信号入力端)に伝送し、その2つの入力チャンネルIn1、In2に入力された音声信号から、複数のマイク1L〜4L、1R〜4Rが配置される音響空間に存在する2つの音源に対応する分離信号を生成(同定)し、それを出力チャンネルOut1、Out2(信号出力端)を通じて出力するものである。図1に示す例では、一方の出力チャンネルOut1を通じて出力される分離信号がスピーカ40に出力されている。
複数の入力チャンネルIn1、In2への入力音声信号は、それぞれ複数の音源の信号(音源信号)が重畳された混合音声信号である。そして、音源分離処理部31は、複数の入力チャンネルIn1、In2各々への入力音声信号に基づいてブラインド音源分離処理を実行することにより、各入力音声信号に重畳されている複数の音源信号(ここでは、2つの音源信号)を同定し、その同定した信号を分離信号として出力するものである。ここで、音源分離処理部31が実行するブラインド音源分離処理としては、前述したように、ICA法に基づくBSS方式の音源分離処理や、バイナリマスク方式によるブラインド音源分離処理等が考えられる。それら各処理の詳細は、前述した非特許文献1〜4に詳述されているので、ここでは説明を省略する。
[First Embodiment]
First, the configuration of the sound source separation device X1 according to the first embodiment of the present invention will be described with reference to FIGS.
As shown in FIG. 1, the sound source separation device X1 is provided with eight (three or more examples) microphones (hereinafter referred to as microphones) 1L to 4L and 1R to 4R for inputting sound in a predetermined acoustic space. The microphone unit 20a, the control unit 30a, and the gyro sensor 10a are provided. The control unit 30a includes a sound source separation processing unit 31, an MPU 32a, and a multiplexer 33a.
The sound source separation device X1 then transmits two (a plurality) of the audio signals obtained by the plurality of microphones 1L to 4L and 1R to 4R to the two input channels In1 of the sound source separation processing unit 31 via the multiplexer 33a. , In2 (signal input terminal), from the audio signals input to the two input channels In1 and In2, the two sound sources existing in the acoustic space where the plurality of microphones 1L to 4L and 1R to 4R are arranged Corresponding separation signals are generated (identified) and output through output channels Out1 and Out2 (signal output terminals). In the example shown in FIG. 1, the separated signal output through one output channel Out1 is output to the speaker 40.
Input audio signals to the plurality of input channels In1 and In2 are mixed audio signals on which a plurality of sound source signals (sound source signals) are superimposed. The sound source separation processing unit 31 performs a blind sound source separation process based on the input sound signals to each of the plurality of input channels In1 and In2, thereby performing a plurality of sound source signals (here, Then, two sound source signals) are identified, and the identified signals are output as separated signals. Here, as described above, the blind sound source separation process executed by the sound source separation processing unit 31 may be a BSS sound source separation process based on the ICA method, a blind sound source separation process based on the binary mask method, or the like. The details of each of these processes are described in detail in Non-Patent Documents 1 to 4 described above, and a description thereof is omitted here.

図3に示すように、マイクユニット20aは、8つのマイク1L〜4L、1R〜4R及びこれらを所定の基準軸M0の周囲の360°の範囲に並べた状態で支持する支持部21aとを備えて構成されている(第1のマイクロホンユニットの一例)。図3に示す例では、8つのマイク1L〜4L、1R〜4Rは、基準軸M0を中心とする円周に沿って等間隔で(隣接するマイクの配置位置と基準軸M0とにより形成される中心角が45°となる間隔で)で配列されている。
図3に示す例では、マイクユニット20aの正面方向D1に対し、基準軸M0を中心として反時計回りに0°から45°間隔の各位置に、マイク3L、マイク2L、マイク1L、マイク4R、マイク3R、マイク2R、マイク1R、マイク4Lが配置されている。
なお、マイクユニット20a、ジャイロセンサ10a、MPU32a及びマルチプレクサ33aが、第1発明に係る音声入力装置の一例を構成する。
As shown in FIG. 3, the microphone unit 20a includes eight microphones 1L to 4L, 1R to 4R and a support portion 21a that supports these microphones in a state where they are arranged in a range of 360 ° around a predetermined reference axis M0. (An example of a first microphone unit). In the example shown in FIG. 3, the eight microphones 1L to 4L and 1R to 4R are formed at equal intervals along the circumference centered on the reference axis M0 (the positions of adjacent microphones and the reference axis M0 are formed). Are arranged at intervals such that the central angle is 45 °.
In the example illustrated in FIG. 3, the microphone 3L, the microphone 2L, the microphone 1L, the microphone 4R, and the microphone 3L are positioned at respective positions 0 to 45 ° counterclockwise around the reference axis M0 with respect to the front direction D1 of the microphone unit 20a. A microphone 3R, a microphone 2R, a microphone 1R, and a microphone 4L are arranged.
The microphone unit 20a, the gyro sensor 10a, the MPU 32a, and the multiplexer 33a constitute an example of an audio input device according to the first invention.

図2に示す平面図(a)及び側面図(b)のように、音源分離装置X1は、作業者が着用するヘルメットや帽子等の着用具50に装着され、その全体が、着用具50の回転に従って回転する。ここで、音源分離装置X1は、基準軸M0が、着用具50の回転軸とほぼ一致するように着用具50に装着されている。
また、ジャイロセンサ10aは、ジャイロスコープの原理により例えば1軸の回転角度を検出するセンサであり、基準軸M0を回転中心とした場合におけるマイクユニット20aの向きを検出する(第1の向き検出手段の一例)。具体的には、所定の初期化処理が実行されたときのマイクユニット20aの正面方向D1の向きを基準方向D0(図4参照)とし、その基準方向D0に対するマイクユニット20aの正面方向D1の角度(基準方向D0に対する回転角度)をマイクユニット20aの向き(回転角度)として検出する。
マルチプレクサ33aは、8つのマイク1L〜4L、1R〜4Rにより得られる8つの入力音声信号から、そのうちの一部である2つの信号を選択して音源分離処理部31に伝送するものである。
また、MPU32aは、ジャイロセンサ10aに対して前記基準方向D0設定のための初期化設定を行うとともに、ジャイロセンサ10aの検出結果(マイクユニット20aの向き)を入力し、その検出結果に基づいてマルチプレクサ33aを制御することにより、8つのマイク1L〜4L、1R〜4Rにより得られる8つの入力音声信号のうち、いずれの2つの信号を音源分離処理部31に伝送させるかを切り替える制御を行うものである。その制御は、MPU32aが所定のプログラムを実行することにより実現される。なお、マルチプレクサ33a及びMPU32aが、信号選択手段の一例である。
As shown in the plan view (a) and the side view (b) shown in FIG. 2, the sound source separation device X1 is mounted on a wearing tool 50 such as a helmet or a hat worn by an operator, Rotate according to rotation. Here, the sound source separation device X1 is attached to the wearing tool 50 such that the reference axis M0 substantially coincides with the rotation axis of the wearing tool 50.
The gyro sensor 10a is a sensor that detects, for example, the rotation angle of one axis based on the principle of the gyroscope, and detects the direction of the microphone unit 20a when the reference axis M0 is the center of rotation (first direction detecting means). Example). Specifically, the direction of the front direction D1 of the microphone unit 20a when a predetermined initialization process is executed is set as the reference direction D0 (see FIG. 4), and the angle of the front direction D1 of the microphone unit 20a with respect to the reference direction D0. (Rotation angle with respect to the reference direction D0) is detected as the direction (rotation angle) of the microphone unit 20a.
The multiplexer 33a selects two signals, which are part of the eight input audio signals obtained by the eight microphones 1L to 4L and 1R to 4R, and transmits them to the sound source separation processing unit 31.
Further, the MPU 32a performs initialization setting for setting the reference direction D0 to the gyro sensor 10a, inputs a detection result of the gyro sensor 10a (direction of the microphone unit 20a), and a multiplexer based on the detection result. By controlling 33a, control is performed to switch which two signals of the eight input audio signals obtained by the eight microphones 1L to 4L and 1R to 4R are transmitted to the sound source separation processing unit 31. is there. The control is realized by the MPU 32a executing a predetermined program. The multiplexer 33a and the MPU 32a are an example of signal selection means.

以下、図4を参照しつつ、MPU32aによるマルチプレクサ33aの制御内容について説明する。ここで、図4は、マイクユニット20aの向きに応じたマイク1L〜4L、1R〜4Rの選択処理を説明するためのマイクユニット20aの平面図を表す。
MPU32aは、ジャイロセンサ10aにより検出されるマイクユニット20aの回転角度ω(基準方向D0に対するマイクユニット20aの正面方向D1の角度)を監視し、その回転角度ωに応じて、8つの音声信号の中からいずれの2つの音声信号を選択して音源分離処理部31に伝送するかを、以下に示す8つのルールに従って制御する。なお、音源分離処理部31の2つの入力チャンネルを、第1入力チャンネルIn1及び第2入力チャンネルIn2と称する。
Hereinafter, the control contents of the multiplexer 33a by the MPU 32a will be described with reference to FIG. Here, FIG. 4 is a plan view of the microphone unit 20a for explaining the selection processing of the microphones 1L to 4L and 1R to 4R according to the direction of the microphone unit 20a.
The MPU 32a monitors the rotation angle ω of the microphone unit 20a detected by the gyro sensor 10a (the angle of the front direction D1 of the microphone unit 20a with respect to the reference direction D0), and according to the rotation angle ω, among the eight audio signals. Which two audio signals are selected and transmitted to the sound source separation processing unit 31 is controlled according to the following eight rules. The two input channels of the sound source separation processing unit 31 are referred to as a first input channel In1 and a second input channel In2.

[ルール1]
(0°≦ω<22.5)又は(337.5°≦ω<360°)である場合、マイク1Lの音声信号を第1入力チャンネルIn1へ、マイク1Rの音声信号を第2入力チャンネルIn2へ伝送する。このときの状態を図4(a)に示す。
[ルール2]
(22.5°≦ω<67.5)である場合、マイク2Lの音声信号を第1入力チャンネルIn1へ、マイク2Rの音声信号を第2入力チャンネルIn2へ伝送する。このときの状態を図4(b)に示す。
[ルール3]
(67.5°≦ω<112.5°)である場合、マイク3Lの音声信号を第1入力チャンネルIn1へ、マイク3Rの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール4]
(112.5°≦ω<157.5°)である場合は、マイク4Lの音声信号を第1入力チャンネルIn1へ、マイク4Rの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール5]
(157.5°≦ω<202.5°)である場合、マイク1Rの音声信号を第1入力チャンネルIn1へ、マイク1Lの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール6]
(202.5°≦ω<247.5°)である場合、マイク2Rの音声信号を第1入力チャンネルIn1へ、マイク2Lの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール7]
(247.5°≦ω<292.5°)である場合、マイク3Rの音声信号を第1入力チャンネルIn1へ、マイク3Lの音声信号を第2入力チャンネルIn2へ伝送する。
[ルール8]
(202.5°≦ω<337.5°)である場合、マイク4Rの音声信号を第1入力チャンネルIn1へ、マイク4Lの音声信号を第2入力チャンネルIn2へ伝送する。このときの状態を図4(c)に示す。
このように、MPU32aは、基準軸M0に対して相互に反対側に位置する2つのマイク(1Lと1R、2Lと2R、3Lと3R、4Lと4R)で得られる音声信号を選択して音源分離処理部31へ伝送させる。
[Rule 1]
When (0 ° ≦ ω <22.5) or (337.5 ° ≦ ω <360 °), the audio signal of the microphone 1L is sent to the first input channel In1, and the audio signal of the microphone 1R is sent to the second input channel In2. Transmit to. The state at this time is shown in FIG.
[Rule 2]
When (22.5 ° ≦ ω <67.5), the audio signal of the microphone 2L is transmitted to the first input channel In1, and the audio signal of the microphone 2R is transmitted to the second input channel In2. The state at this time is shown in FIG.
[Rule 3]
When (67.5 ° ≦ ω <112.5 °), the audio signal of the microphone 3L is transmitted to the first input channel In1, and the audio signal of the microphone 3R is transmitted to the second input channel In2.
[Rule 4]
If (112.5 ° ≦ ω <157.5 °), the audio signal of the microphone 4L is transmitted to the first input channel In1, and the audio signal of the microphone 4R is transmitted to the second input channel In2.
[Rule 5]
When (157.5 ° ≦ ω <202.5 °), the audio signal of the microphone 1R is transmitted to the first input channel In1, and the audio signal of the microphone 1L is transmitted to the second input channel In2.
[Rule 6]
When (202.5 ° ≦ ω <247.5 °), the audio signal of the microphone 2R is transmitted to the first input channel In1, and the audio signal of the microphone 2L is transmitted to the second input channel In2.
[Rule 7]
When (247.5 ° ≦ ω <292.5 °), the audio signal of the microphone 3R is transmitted to the first input channel In1, and the audio signal of the microphone 3L is transmitted to the second input channel In2.
[Rule 8]
When (202.5 ° ≦ ω <337.5 °), the audio signal of the microphone 4R is transmitted to the first input channel In1, and the audio signal of the microphone 4L is transmitted to the second input channel In2. The state at this time is shown in FIG.
As described above, the MPU 32a selects the sound signal obtained by the two microphones (1L and 1R, 2L and 2R, 3L and 3R, 4L and 4R) located on the opposite sides of the reference axis M0, and generates a sound source. The data is transmitted to the separation processing unit 31.

以上に示したように音声信号の選択を行う音源分離装置X1では、マイクユニット20aが基準軸M0を中心に回転してその向きが変化した場合に、音源分離処理部31へ伝送する音声信号(即ち、音源分離装置が処理対象とする混合音声信号)の入力に用いる2つのマイクが、そのマイクに対する音源(図4における音源1、音源2)の存在方向が入れ替わらないように選択される。
その結果、音源分離装置X1が装着された着用具50を着用した作業者は、回転して向く方向を変更した場合であっても、スピーカ40を通じて、特定の音源から発生する音声のみが分離生成(抽出)された音声を選択的に聴くことができる。
As described above, in the sound source separation device X1 that selects the sound signal, when the microphone unit 20a rotates around the reference axis M0 and changes its direction, the sound signal (to be transmitted to the sound source separation processing unit 31) That is, the two microphones used for input of the mixed sound signal to be processed by the sound source separation device are selected so that the directions of the sound sources (sound source 1 and sound source 2 in FIG. 4) relative to the microphones are not switched.
As a result, the worker wearing the wearing tool 50 equipped with the sound source separation device X1 separates and generates only the sound generated from the specific sound source through the speaker 40, even when the direction of rotation is changed. The (extracted) voice can be selectively heard.

[第2実施形態]
次に、図5に示すブロック図を参照しつつ、本発明の第2実施形態に係る音源分離装置X2の構成について説明する。
図5に示すように、音源分離装置X2は、所定の音響空間において音声を入力する2つのマイクロホン(以下、マイクと称する)1L、1Rが設けられたマイクユニット20bと、制御ユニット30bと、ジャイロセンサ10bと、モータ60とを備えている。また、制御ユニット30bには、音源分離処理部31、MPU32b及びモータ60を動作させるドライバ33bが設けられている。
そして、音源分離装置X2は、2つのマイク1L、1Rにより得られる2つ(複数)の音声信号を音源分離処理部31の2つの入力チャンネルIn1、In2各々に伝送し、その2つの入力チャンネルIn1、In2を通じて入力される音声信号から、複数のマイク1L、2Rが配置される音響空間に存在する2つの音源に対応する分離信号を生成(同定)し、その分離信号を出力チャンネルOut1、Out2を通じて出力するものである。図5に示す例では、一方の出力チャンネルOut1を通じて出力される分離信号がスピーカ40に出力されている。
各入力チャンネルIn1、In2への入力音声信号は、それぞれ複数の音源の信号(音源信号)が重畳された混合音声信号であり、音源分離処理部31は、前述した音源分離装置X1における音源分離処理部31と同じものである。
なお、マイクユニット20b、ジャイロセンサ10b、MPU32b及びドライバ33bが、第2発明に係る音声入力装置の一例を構成する。
[Second Embodiment]
Next, the configuration of the sound source separation device X2 according to the second embodiment of the present invention will be described with reference to the block diagram shown in FIG.
As shown in FIG. 5, the sound source separation apparatus X2 includes a microphone unit 20b provided with two microphones (hereinafter referred to as microphones) 1L and 1R for inputting sound in a predetermined acoustic space, a control unit 30b, a gyro The sensor 10b and the motor 60 are provided. The control unit 30b is provided with a sound source separation processing unit 31, an MPU 32b, and a driver 33b that operates the motor 60.
The sound source separation device X2 transmits two (plural) audio signals obtained by the two microphones 1L and 1R to each of the two input channels In1 and In2 of the sound source separation processing unit 31, and the two input channels In1. , Generating (identifying) separated signals corresponding to two sound sources existing in an acoustic space in which a plurality of microphones 1L and 2R are arranged from the audio signal input through In2, and using the separated signals through output channels Out1 and Out2. Output. In the example shown in FIG. 5, the separated signal output through one output channel Out1 is output to the speaker 40.
Input audio signals to the input channels In1 and In2 are mixed audio signals on which a plurality of sound source signals (sound source signals) are superimposed, and the sound source separation processing unit 31 performs sound source separation processing in the sound source separation device X1 described above. This is the same as the unit 31.
The microphone unit 20b, the gyro sensor 10b, the MPU 32b, and the driver 33b constitute an example of a voice input device according to the second invention.

マイクユニット20bは、2つのマイク1L、1Rと、これらを所定の基準軸Mの周囲の所定位置に支持する支持部21bとを有して構成されている(第2のマイクロホンユニットの一例)。図5に示す例では、2つのマイク1L、1Rは、基準軸Mに対して相互に反対側の等距離の位置に配置されている。
以下、2つのマイク1L、1Rの配列方向に直交する方向であって、一方のマイク1Lが左方向、他方のマイク1Rが右方向となる方向を、マイクユニット20bの正面方向と称する。図5では、紙面に向かう方向が、マイクユニット20bの正面方向である。
モータ60は、例えばステッピングモータ等により構成され、マイクユニット20bを基準軸M0を中心に回転駆動し、これを所望の向きで停止させる(向きを調節する)駆動手段である(回転駆動手段の一例)。
ジャイロセンサ10bは、前述した音源分離装置X1におけるジャイロセンサ10aと同様の回転角度検出用のセンサであり、基準軸M0を回転中心とした場合におけるマイクユニット20bを回転可能に支持する部分(図5の例では、モータ60の本体)の向きを検出する(第2の向き検出手段の一例)。具体的には、所定の初期化処理が実行されたときのモータ60本体の正面方向D2(図6参照)の向きを基準方向D0(図6参照)とし、その基準方向D0に対するモータ60本体の正面方向D2の角度(基準方向D0に対する回転角度)をモータ60本体の向き(回転角度)として検出する。ここで、図5に示す例では、モータ60本体(マックユニット20bの支持部)、ジャイロセンサ10b及び着用具50は、基準軸M0の位置で連結固定され、モータ60本体の正面方向D2が、着用具50の正面方向となるように設定されている。
The microphone unit 20b includes two microphones 1L and 1R and a support portion 21b that supports them at a predetermined position around a predetermined reference axis M (an example of a second microphone unit). In the example illustrated in FIG. 5, the two microphones 1 </ b> L and 1 </ b> R are arranged at equidistant positions on the opposite sides of the reference axis M.
Hereinafter, the direction orthogonal to the arrangement direction of the two microphones 1L and 1R, in which one microphone 1L is the left direction and the other microphone 1R is the right direction is referred to as a front direction of the microphone unit 20b. In FIG. 5, the direction toward the paper surface is the front direction of the microphone unit 20b.
The motor 60 is constituted by, for example, a stepping motor or the like, and is a driving unit that rotates the microphone unit 20b around the reference axis M0 and stops it in a desired direction (adjusts the direction) (an example of a rotation driving unit). ).
The gyro sensor 10b is a sensor for detecting a rotation angle similar to the gyro sensor 10a in the sound source separation device X1 described above, and a part that rotatably supports the microphone unit 20b when the reference axis M0 is the rotation center (FIG. 5). In this example, the direction of the main body of the motor 60 is detected (an example of second direction detection means). Specifically, the direction of the front direction D2 (see FIG. 6) of the main body of the motor 60 when a predetermined initialization process is executed is set as the reference direction D0 (see FIG. 6), and the main body of the motor 60 with respect to the reference direction D0. The angle of the front direction D2 (rotation angle with respect to the reference direction D0) is detected as the direction (rotation angle) of the motor 60 main body. Here, in the example shown in FIG. 5, the motor 60 main body (support unit of the Mac unit 20 b), the gyro sensor 10 b, and the wearing tool 50 are connected and fixed at the position of the reference axis M <b> 0, and the front direction D <b> 2 of the motor 60 main body is It is set to be the front direction of the wearing tool 50.

ドライバ33bは、MPU32bからの制御指令に従ってモータ60を動作させることにより、モータ60の回転軸の回転角度、即ち、その回転軸に支持されたマイクユニット20bの回転角度を調節するモータ駆動回路である。
MPU32bは、ジャイロセンサ10bに対して所定の基準方向D0(図6参照)設定のための初期化設定を行うとともに、ジャイロセンサ10bの検出結果(マイクユニット20bの支持部(モータ60本体)の向き)を入力し、その検出結果に基づいてドライバ33bに制御指令を出力することにより、マイクユニット20bの向きを調節するものである。即ち、MPU32bは、ドライバ33bを通じてモータ60の回転軸の回転角度、即ち、マイクユニット20bの向きを制御する。なお、MPU32b及びドライバ33bが、向き調節手段の一例である。
図5に示すように、音源分離装置X2も、作業者が着用するヘルメットや帽子等の着用具50に装着され、その全体が、着用具50の回転に従って回転する。ここで、音源分離装置X2は、基準軸M0が、着用具50の回転軸とほぼ一致するように着用具50に装着されている。
The driver 33b is a motor drive circuit that adjusts the rotation angle of the rotation shaft of the motor 60, that is, the rotation angle of the microphone unit 20b supported by the rotation shaft by operating the motor 60 in accordance with a control command from the MPU 32b. .
The MPU 32b performs initialization setting for setting a predetermined reference direction D0 (see FIG. 6) with respect to the gyro sensor 10b, and also detects the detection result of the gyro sensor 10b (the direction of the support unit (motor 60 main body) of the microphone unit 20b). ) And a control command is output to the driver 33b based on the detection result, thereby adjusting the direction of the microphone unit 20b. That is, the MPU 32b controls the rotation angle of the rotation shaft of the motor 60, that is, the direction of the microphone unit 20b, through the driver 33b. The MPU 32b and the driver 33b are an example of the orientation adjusting unit.
As shown in FIG. 5, the sound source separation device X <b> 2 is also attached to a wearing tool 50 such as a helmet or a hat worn by an operator, and the whole rotates according to the rotation of the wearing tool 50. Here, the sound source separation device X <b> 2 is attached to the wearing tool 50 so that the reference axis M <b> 0 substantially coincides with the rotation axis of the wearing tool 50.

以下、図6を参照しつつ、MPU32bによるモータ60の制御内容について説明する。ここで、図6は、マイクユニット20bの向きに応じたマイクユニット20bの回転制御を説明するためのマイクユニット20bの平面図を表す。
MPU32bは、ジャイロセンサ10bにより検出されるモータ60本体の回転角度ω(基準方向D0に対するモータ60本体(或いは着用具50)の正面方向D2の角度)を監視し、その回転角度ωに応じて、マイクユニット20bの向き(モータ60の回転軸の回転角度)を制御する。
図6(a)は、モータ60本体の正面方向D2(着用具50の正面方向)が所定の基準方向D0を向いている初期状態におけるマイクユニット20bの向きを表す。この初期状態では、マイクユニット20bの正面方向が基準方向D0に向くよう初期設定される。また、この初期状態において、ジャイロセンサ10bが初期化され、その検出角度ωが0°となる。
図6(b)は、初期状態からモータ60本体(着用具50)が反時計回りに角度ωだけ回転した状態(ジャイロセンサ10bの検出角度=ω)を表す。この場合、MPU32bは、マイクユニット20bを−ωだけ回転させる。これにより、図6(c)に示すように、マイクユニット20bの正面方向が基準方向D0に向く状態となる。
また、図6(d)は、初期状態からモータ60本体(着用具50)が時計回りに角度ωだけ回転した状態(ジャイロセンサ10bの検出角度=ω)を表す。この場合も、MPU32bは、マイクユニット20bを−ωだけ回転させる。これにより、図6(e)に示すように、マイクユニット20bの正面方向が基準方向D0に向く状態となる。
Hereinafter, the control content of the motor 60 by the MPU 32b will be described with reference to FIG. Here, FIG. 6 shows a plan view of the microphone unit 20b for explaining the rotation control of the microphone unit 20b according to the direction of the microphone unit 20b.
The MPU 32b monitors the rotation angle ω of the motor 60 main body detected by the gyro sensor 10b (the angle of the front direction D2 of the motor 60 main body (or the wearing tool 50) with respect to the reference direction D0), and according to the rotation angle ω, The direction of the microphone unit 20b (the rotation angle of the rotation shaft of the motor 60) is controlled.
FIG. 6A shows the orientation of the microphone unit 20b in the initial state where the front direction D2 of the motor 60 main body (the front direction of the wearing tool 50) faces the predetermined reference direction D0. In this initial state, the microphone unit 20b is initially set so that the front direction of the microphone unit 20b faces the reference direction D0. In this initial state, the gyro sensor 10b is initialized and the detection angle ω becomes 0 °.
FIG. 6B shows a state in which the motor 60 main body (wearing tool 50) is rotated counterclockwise by an angle ω from the initial state (detection angle of the gyro sensor 10b = ω). In this case, the MPU 32b rotates the microphone unit 20b by −ω. Thereby, as shown in FIG.6 (c), the front direction of the microphone unit 20b will be in the state which faces the reference direction D0.
FIG. 6D shows a state where the motor 60 main body (wearing tool 50) is rotated clockwise by an angle ω from the initial state (detection angle of the gyro sensor 10b = ω). Also in this case, the MPU 32b rotates the microphone unit 20b by −ω. Thereby, as shown in FIG.6 (e), the front direction of the microphone unit 20b will be in the state which faces the reference direction D0.

以上に示したように、音源分離装置X2は、着用具50を着用した作業者が回転することにより、マイクユニット20bを回転可能に支持する部分であるモータ60本体が基準軸M0を中心に回転した場合でも、マイクユニット20bの向きを一定方向に向くよう保持する。
その結果、音源分離装置X2が装着された着用具50を着用した作業者は、回転して向く方向を変更した場合であっても、スピーカ40を通じて、特定の音源から発生する音声のみが分離生成(抽出)された音声を選択的に聴くことができる。
なお、図5に示した音源分離装置X2は、ジャイロセンサ10bにより、マイクユニット20bを回転可能に支持する支持部(モータ60本体)の向きを検出するよう構成されているが、他の構成も考えられる。
例えば、ジャイロセンサ10bを、マイクユニット20bの支持部21b等に設け、そのジャイロセンサ10bにより、マイクユニット20bの向きを検出するよう構成することも考えられる。この場合、ジャイロセンサ10bによる検出角度が常に一定(=0°)となるように、モータ60の回転軸の角度を調節(制御)すればよい。
また、図5に示した音源分離装置X2は、モータ60の回転軸が基準軸M0となる構成を示したが、ギア等のリンク機構を採用することにより、基準軸M0とモータ60の回転軸とが一致しない構成も考えられる。
As described above, in the sound source separation device X2, the motor 60 main body, which is a portion that rotatably supports the microphone unit 20b, rotates about the reference axis M0 when the worker wearing the wearing tool 50 rotates. Even in this case, the microphone unit 20b is held so as to face in a certain direction.
As a result, the worker wearing the wearing tool 50 with the sound source separation device X2 separated and generated only the sound generated from a specific sound source through the speaker 40, even when the direction of rotation is changed. The (extracted) voice can be selectively heard.
The sound source separation device X2 shown in FIG. 5 is configured to detect the orientation of the support portion (motor 60 main body) that rotatably supports the microphone unit 20b by the gyro sensor 10b, but other configurations are also possible. Conceivable.
For example, it is conceivable that the gyro sensor 10b is provided on the support portion 21b of the microphone unit 20b and the direction of the microphone unit 20b is detected by the gyro sensor 10b. In this case, the angle of the rotating shaft of the motor 60 may be adjusted (controlled) so that the angle detected by the gyro sensor 10b is always constant (= 0 °).
Further, the sound source separation device X2 shown in FIG. 5 has a configuration in which the rotation axis of the motor 60 is the reference axis M0. However, by adopting a link mechanism such as a gear, the reference axis M0 and the rotation axis of the motor 60 are There may be a configuration in which does not match.

また、前述した音源分離装置X1及び音源分離装置X2では、2入力2出力の音源分離処理部31を例示したが、3つ以上の入出力チャンネル(チャンネル数n)を備えた音源分離処理部を採用することも考えられる。但しその場合、音源分離装置X1では、マイクロホンの数をn+1個以上とし、マルチプレクサ33aにより選択する信号数をn個とする。また、音源分離装置X2では、マイクロホンの数をn個とする。
また、回転角度を検出するセンサとして、ジャイロセンサ10a、10b以外の他の回転角度検出センサを採用することも考えられる。
また、前述した音源分離装置X1におけるマイクユニット20aは、3つ以上のマイク1L〜4L、1R〜4Rを基準軸M0の周囲の360°の範囲に並べた状態で支持するものであったが、各マイク1L〜4L、1R〜4Rがそれより狭い範囲に並べられた構成も考えられる。例えば、着用具50の回転角度の範囲が90°(±45°)以内であるという制約があるような場合には、マイク1L〜4L、1R〜4Rを基準軸M0の周囲の270°の範囲に並べた状態で支持する構成とすることが考えられる。
Further, in the sound source separation device X1 and the sound source separation device X2 described above, the sound source separation processing unit 31 having two inputs and two outputs is illustrated, but a sound source separation processing unit having three or more input / output channels (number of channels n) is provided. It is possible to adopt it. However, in that case, in the sound source separation device X1, the number of microphones is n + 1 or more, and the number of signals selected by the multiplexer 33a is n. In the sound source separation device X2, the number of microphones is n.
It is also conceivable to employ a rotation angle detection sensor other than the gyro sensors 10a and 10b as a sensor for detecting the rotation angle.
Further, the microphone unit 20a in the sound source separation device X1 described above supports three or more microphones 1L to 4L and 1R to 4R in a state where they are arranged in a 360 ° range around the reference axis M0. A configuration in which the microphones 1L to 4L and 1R to 4R are arranged in a narrower range is also conceivable. For example, when there is a restriction that the range of the rotation angle of the wearing tool 50 is within 90 ° (± 45 °), the microphones 1L to 4L and 1R to 4R are within a range of 270 ° around the reference axis M0. It is conceivable that the structure is supported in a state where they are arranged side by side.

本発明は、音声入力装置への利用が可能である。   The present invention can be used for a voice input device.

本発明の第1実施形態に係る音源分離装置X1の概略構成を表すブロック図。The block diagram showing the schematic structure of the sound source separation apparatus X1 which concerns on 1st Embodiment of this invention. 音源分離装置X1の概略外観図。1 is a schematic external view of a sound source separation device X1. 音源分離装置X1が備えるマイクユニットの平面図。The top view of the microphone unit with which the sound source separation apparatus X1 is provided. 音源分離装置X1におけるマイクユニットの向きに応じたマイクロホンの選択処理を説明するためのマイクユニットの平面図。The top view of the microphone unit for demonstrating the selection process of the microphone according to the direction of the microphone unit in the sound source separation device X1. 本発明の第2実施形態に係る音源分離装置X2の概略構成を表すブロック図。The block diagram showing schematic structure of the sound source separation apparatus X2 which concerns on 2nd Embodiment of this invention. 音源分離装置X2におけるマイクユニットの回転制御を説明するためのマイクユニットの平面図。The top view of the microphone unit for demonstrating rotation control of the microphone unit in the sound source separation apparatus X2.

符号の説明Explanation of symbols

X1、X2…本発明の実施形態に係る音源分離装置
1、2…音源
1L〜4L、1R〜4R…マイクロホン
10a、10b…ジャイロセンサ
20a、20b…マイクユニット
21a、22b…マイクロホンの支持部
30a、30b…制御ユニット
40…スピーカ
In1、In2…入力チャンネル
Out1、Out2…出力チャンネル
X1, X2 ... sound source separation devices 1, 2 ... sound sources 1L to 4L, 1R to 4R ... microphones 10a, 10b ... gyro sensors 20a, 20b ... microphone units 21a, 22b ... microphone support 30a, 30b ... Control unit 40 ... Speakers In1, In2 ... Input channel Out1, Out2 ... Output channel

Claims (4)

所定の音響空間において音声を入力する複数のマイクロホンを備え、該マイクロホンにより得られる音声信号を所定の音源分離装置に伝送する音声入力装置であって、
複数のマイクロホン及びこれらを所定の基準軸の周囲の所定位置に並べた状態で支持する支持部を有する第1のマイクロホンユニットと、
前記基準軸を回転中心とした場合における前記第1のマイクロホンユニットの向きを検出する第1の向き検出手段と、
前記第1の向き検出手段の検出結果に基づいて、前記複数のマイクロホンにより得られる複数の入力音声信号から、そのうちの一部の複数の信号を選択して前記音源分離装置に伝送する信号選択手段と、
を具備してなることを特徴とする音声入力装置。
A voice input device comprising a plurality of microphones for inputting voice in a predetermined acoustic space, and transmitting a voice signal obtained by the microphones to a predetermined sound source separation device,
A first microphone unit having a plurality of microphones and a support unit that supports the microphones in a state in which they are arranged at predetermined positions around a predetermined reference axis;
First orientation detection means for detecting the orientation of the first microphone unit when the reference axis is the rotation center;
Based on the detection result of the first orientation detection means, a signal selection means for selecting a part of a plurality of signals from a plurality of input audio signals obtained by the plurality of microphones and transmitting the selected signal to the sound source separation device. When,
A voice input device comprising:
所定の音響空間において音声を入力する複数のマイクロホンを備え、該マイクロホンにより得られる音声信号を所定の音源分離装置に伝送する音声入力装置であって、
複数のマイクロホン及びこれらを所定の基準軸の周囲の所定位置に支持する支持部を有する第2のマイクロホンユニットと、
前記第2のマイクロホンユニットを前記基準軸を中心に回転駆動する回転駆動手段と、
前記基準軸を回転中心とした場合における前記第2のマイクロホンユニットを回転可能に支持する部分の向き若しくは前記第2のマイクロホンユニットの向きを検出する第2の向き検出手段と、
前記第2の向き検出手段の検出結果に基づいて前記回転駆動手段を制御することにより前記第2のマイクロホンユニットの向きを調節する向き調節手段と、
を具備してなることを特徴とする音声入力装置。
A voice input device comprising a plurality of microphones for inputting voice in a predetermined acoustic space, and transmitting a voice signal obtained by the microphones to a predetermined sound source separation device,
A second microphone unit having a plurality of microphones and a support portion for supporting these at predetermined positions around a predetermined reference axis;
Rotation driving means for rotating the second microphone unit around the reference axis;
Second orientation detection means for detecting the orientation of the portion that rotatably supports the second microphone unit or the orientation of the second microphone unit when the reference axis is the rotation center;
Direction adjusting means for adjusting the direction of the second microphone unit by controlling the rotation driving means based on the detection result of the second direction detecting means;
A voice input device comprising:
前記第1の向き検出手段又は前記第2の向き検出手段が、所定の基準方向に対する回転角度をジャイロセンサにより検出するものである請求項1又は2のいずれかに記載の音声入力装置。   The voice input device according to claim 1, wherein the first direction detection unit or the second direction detection unit detects a rotation angle with respect to a predetermined reference direction by a gyro sensor. 請求項1〜3のいずれかに記載の音声入力装置を具備し、該音声入力装置から伝送される複数の音声信号から、該音声入力装置が配置される音響空間に存在する1又は複数の音源に対応する分離信号を生成してなることを特徴とする音源分離装置。   One or a plurality of sound sources that are provided in the acoustic space in which the voice input device is arranged from a plurality of voice signals transmitted from the voice input device, comprising the voice input device according to claim 1. A sound source separation device characterized by generating a separation signal corresponding to the above.
JP2006144818A 2006-05-25 2006-05-25 Voice input unit, and audio source separation unit Withdrawn JP2007318373A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006144818A JP2007318373A (en) 2006-05-25 2006-05-25 Voice input unit, and audio source separation unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006144818A JP2007318373A (en) 2006-05-25 2006-05-25 Voice input unit, and audio source separation unit

Publications (1)

Publication Number Publication Date
JP2007318373A true JP2007318373A (en) 2007-12-06

Family

ID=38851849

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006144818A Withdrawn JP2007318373A (en) 2006-05-25 2006-05-25 Voice input unit, and audio source separation unit

Country Status (1)

Country Link
JP (1) JP2007318373A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009253525A (en) * 2008-04-03 2009-10-29 National Institute Of Advanced Industrial & Technology Microphone signal processing device and method
JP2014502439A (en) * 2010-10-25 2014-01-30 クゥアルコム・インコーポレイテッド System, method, apparatus, and computer readable medium for directional high sensitivity recording control
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
WO2019188394A1 (en) * 2018-03-30 2019-10-03 ソニー株式会社 Signal processing device and method, and program
KR102093822B1 (en) * 2018-11-12 2020-03-26 한국과학기술연구원 Apparatus and method for separating sound sources

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009253525A (en) * 2008-04-03 2009-10-29 National Institute Of Advanced Industrial & Technology Microphone signal processing device and method
JP2014502439A (en) * 2010-10-25 2014-01-30 クゥアルコム・インコーポレイテッド System, method, apparatus, and computer readable medium for directional high sensitivity recording control
US9031256B2 (en) 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
WO2019188394A1 (en) * 2018-03-30 2019-10-03 ソニー株式会社 Signal processing device and method, and program
US11159905B2 (en) 2018-03-30 2021-10-26 Sony Corporation Signal processing apparatus and method
KR102093822B1 (en) * 2018-11-12 2020-03-26 한국과학기술연구원 Apparatus and method for separating sound sources
US10803882B2 (en) 2018-11-12 2020-10-13 Korea Institute Of Science And Technology Apparatus and method of separating sound sources

Similar Documents

Publication Publication Date Title
EP2543197B1 (en) Multi-element directional acoustic arrays
US8265310B2 (en) Multi-element directional acoustic arrays
US8325936B2 (en) Directionally radiating sound in a vehicle
EP1872621B1 (en) Multi-channel bass management
JP5401760B2 (en) Headphone device, audio reproduction system, and audio reproduction method
US20080273722A1 (en) Directionally radiating sound in a vehicle
JP2007318373A (en) Voice input unit, and audio source separation unit
US20130028446A1 (en) Orientation adjusting stereo audio output system and method for electrical devices
WO2013101061A1 (en) Systems, methods, and apparatus for directing sound in a vehicle
JP4120646B2 (en) Loudspeaker system
US8553894B2 (en) Active and passive directional acoustic radiating
US20110002487A1 (en) Audio Channel Assignment for Audio Output in a Movable Device
JP2008017469A (en) Voice processing system and method
EP3054706A3 (en) A binaural hearing system and a hearing device comprising a beamformer unit
US20180098175A1 (en) Apparatus and method for driving an array of loudspeakers with drive signals
EP3364638B1 (en) Recording method, recording playing method and apparatus, and terminal
JP5221235B2 (en) Audio adjustment console
JP5843705B2 (en) Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium
WO2005045456A3 (en) Controlled acoustic beam generator for crowd control
JP2009253526A (en) Sound field controller and sound field controlling method
US10659905B1 (en) Method, system, and processing device for correcting energy distributions of audio signal
CN113261309A (en) Sound output apparatus and sound output method
US20180264946A1 (en) Dynamic audio steering control system
US11632644B2 (en) Virtual soundstage with compact speaker array and interaural crosstalk cancellation
JP2019054491A (en) Acoustic device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080926

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20081226