JPH05216495A - Speech signal input device - Google Patents

Speech signal input device

Info

Publication number
JPH05216495A
JPH05216495A JP4022519A JP2251992A JPH05216495A JP H05216495 A JPH05216495 A JP H05216495A JP 4022519 A JP4022519 A JP 4022519A JP 2251992 A JP2251992 A JP 2251992A JP H05216495 A JPH05216495 A JP H05216495A
Authority
JP
Japan
Prior art keywords
microphone
speaker
microphones
sub
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4022519A
Other languages
Japanese (ja)
Inventor
Mizuhiro Hida
瑞広 飛田
Yoshitake Suzuki
義武 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4022519A priority Critical patent/JPH05216495A/en
Publication of JPH05216495A publication Critical patent/JPH05216495A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To obtain a high SN ratio in noisy environment. CONSTITUTION:A main unidirectional microphone 12 is arranged in front of a speaker 11 while having its maximum directivity direction set to the mouth, and a subordinate unidirectional microphone 13 is arranged behind the speaker 11 while having its maximum directivity direction set in the opposite direction from the speaker 11. The outputs of the microphones 12 and 13 are passed to band-pass filters 14 and 15 to extract only components in a frequency band enough for the feature quantity extraction of a speech, and their outputs have their levels adjusted by gain controllers 16 and 17 and are passed through phase shifters 18 and 19, so that a subtracter 21 performs their mutual subtraction. The gain controllers 16 and 17 and phase shifters 18 and 19 are adjusted in a state wherein the speaker 11 voices no word so that the output of the subtracter 21 becomes zero.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、周囲騒音や反射音の
生ずる環境下で発声した音声収音してその音声を認識す
る、音声認識装置や各種の音響信号収録装置に適用され
る音声信号入力装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice signal applied to a voice recognizing device and various acoustic signal recording devices for collecting and recognizing a voice uttered in an environment where ambient noise and reflected sound are generated. The present invention relates to an input device.

【0002】[0002]

【従来の技術】情報の伝達手段としては、一般的には手
で操作するタイプライタや押しボタン等に比べて、音声
を用いた場合の方が伝送速度や操作性の点で優れてい
る。音声を情報伝達の手段に用いる場合には、伝達する
相手が人間もしくは機械の別なく、発声音声の内容を正
しく認識理解出来ることが必要である。
2. Description of the Related Art As a means for transmitting information, the use of voice is generally superior in terms of transmission speed and operability to a typewriter or push button which is generally operated by hand. When voice is used as a means of transmitting information, it is necessary that the person who transmits the voice can recognize and understand the content of the vocal voice correctly regardless of whether it is a human or a machine.

【0003】発声音声の認識・理解を向上するために
は、騒音や反響音の影響を極力排除してクリヤな音声信
号を得ることが必要となり、これを実現するために指向
性の鋭いマイクロホンを用いたり、2個の指向性マイク
ロホンをほぼ同一箇所でその基準軸(感度が最大となる
指向性の主軸) を互いに逆方向に設定して各マイクロホ
ン間の差分信号を用いたり、さらには複数のマイクロホ
ンを用いた構成により騒音源方向に対して感度を低下さ
せ、話者方向に高感度となるような技術を用いて騒音を
除去する等の手法が提案されている。
In order to improve the recognition and understanding of vocalized voice, it is necessary to eliminate the influence of noise and reverberation as much as possible to obtain a clear voice signal. In order to realize this, a microphone with a sharp directivity is used. It is possible to use two directional microphones at almost the same location and set their reference axes (the main axis of directional characteristics with maximum sensitivity) in opposite directions to use the differential signal between the microphones. A technique has been proposed in which the sensitivity is reduced in the direction of the noise source by the configuration using the microphone, and the noise is removed by using a technique that provides high sensitivity in the direction of the speaker.

【0004】[0004]

【発明が解決しようとする課題】しかし、指向性の鋭い
マイクロホンを実現するにはその外形寸法、特に長さ方
向の寸法を大きくする必要が有り、狭い空間での使用に
際しての制約や、スペースが十分にある場所での使用に
おいても外観上目障りになるという欠点がある。さら
に、複数のマイクロホンを用いて感度指向特性を適応的
に設定する技術を用いた収音装置は、現在ではまだ汎用
的に使用するには高価であると言う欠点がある。一方、
従来例の構成法の一つとして、2個の指向性マイクロホ
ンをほぼ同一箇所に設定して各々のマイクロホンの基準
軸が逆方向となるように設定して、各マイクロホンの出
力信号の減算により騒音信号を低減しようとするものが
ある。しかしこの場合は、2個のマイクロホンが近接し
ているために音声に対する2個のマイクロホン間の出力
比が十分大きくとれないと言う欠点があった。従って、
騒音や反響音の大きな場所で収音した音声から、音声以
外の不要な成分を除去した音声信号の抽出に関しては、
上記した従来例においては形状寸法、価格及び性能等の
面からそれぞれ一長一短があり、実用上十分な特性を得
ているとはいい難い状況下にある。
However, in order to realize a microphone having a sharp directivity, it is necessary to increase the outer dimensions thereof, particularly the dimension in the lengthwise direction. There is a drawback in that it is visually unpleasant when used in a sufficient place. Further, the sound pickup device using the technique of adaptively setting the sensitivity directional characteristics using a plurality of microphones has a drawback that it is still expensive for general use at present. on the other hand,
As one of the configuration methods of the conventional example, two directional microphones are set at substantially the same location, the reference axes of the microphones are set in opposite directions, and noise is generated by subtracting the output signal of each microphone. There are things that try to reduce the signal. However, in this case, there is a drawback that the output ratio between the two microphones for the voice cannot be sufficiently high because the two microphones are close to each other. Therefore,
Regarding the extraction of voice signals from which unnecessary components other than voice have been removed from voice picked up in a place where noise or reverberation is loud,
The above-mentioned conventional examples have advantages and disadvantages in terms of shape, size, price, performance, etc., and it is difficult to say that they have practically sufficient characteristics.

【0005】この発明はこの様な点に鑑み、騒音や反射
音の存在する環境下で発声した音声から、これらの不要
成分を除去して認識・理解を向上できるクリーンな音声
を得ることを狙いとし、小型化を図ってかつ安価に提供
できる音声信号入力装置を提供することを目的とする。
In view of the above points, the present invention aims to obtain a clean voice capable of improving recognition and understanding by removing these unnecessary components from a voice uttered in an environment where noise and reflected sound exist. It is an object of the present invention to provide a voice signal input device that can be provided at a low cost while achieving miniaturization.

【0006】[0006]

【課題を解決するための手段】この発明によれば発声者
の前方に単一指向特性の主マイクロホンが配され、その
主マイクロホンの基準軸と発声者の口元を通る前後方向
とがなす角度は90°以下とされる。発声者の後方に単
一指向特性の副マイクロホンが配され、その副マイクロ
ホンの基準軸と前記前後方向とがなす角度は90°以上
とされる。これら主マイクロホン、副マイクロホンの各
出力相互の位相を変化することができる移相器が設けら
れる。その相互に位相変化された両マイクロホンの出力
は互いに減算器で差がとられる。
According to the present invention, the main microphone having a unidirectional characteristic is arranged in front of the speaker, and the angle formed by the reference axis of the main microphone and the front-rear direction passing through the mouth of the speaker. The angle is 90 ° or less. A sub-microphone having a unidirectional characteristic is arranged behind the speaker, and the angle formed by the reference axis of the sub-microphone and the front-rear direction is 90 ° or more. A phase shifter capable of changing the phase of each output of the main microphone and the sub microphone is provided. The outputs of both microphones whose phases have been mutually changed are subtracted from each other by a subtracter.

【0007】発声者の近くにその前後方向に延長した音
響的反射体が存在する場合は、その反射体に主マイクロ
ホン、副マイクロホンがなるべく接近され、かつこれら
両マイクロホンの各基準軸は反射体とほぼ平行とされ
る。
When there is an acoustic reflector extending in the front-back direction near the speaker, the main microphone and the sub-microphone are brought as close as possible to the reflector, and the reference axes of both microphones are the reflector. It is almost parallel.

【0008】[0008]

【作用】主マイクロホンの出力中の騒音成分と、副マイ
クロホンの出力中の騒音成分とが同位相となるように移
相器が調整され、両マイクロホン出力の差分がとられ
て、その騒音成分はほぼ零となる。一方、発声者の音声
に対しては、主マイクロホンと副マイクロホンとがその
基準軸が異なることと、発声者自身の頭部回折効果によ
って前方と後方とで生ずる指向性との相乗効果とによ
り、両マイクロホンの出力中の音声のレベル差が強調さ
れ、両マイクロホン出力の差分をとった状態で主マイク
ロホン出力中の音声がそれ程レベル低下することなく取
り出される。
[Function] The phase shifter is adjusted so that the noise component in the output of the main microphone and the noise component in the output of the sub microphone have the same phase, and the difference between the outputs of both microphones is obtained, and the noise component is It becomes almost zero. On the other hand, with respect to the voice of the speaker, the main microphone and the sub microphone have different reference axes, and due to the synergistic effect of the directivity generated in the front and the rear by the head diffraction effect of the speaker itself, The level difference between the voices being output from both microphones is emphasized, and the voice being output from the main microphone is extracted with the difference between the outputs from both microphones being not lowered so much.

【0009】[0009]

【実施例】図1Aにこの発明の実施例を示す。発声者1
1の前方に単一指向特性の主マイクロホン12が配され
る。主マイクロホン12は主に音声信号を収音するため
のものであり、その基準軸は、発声者11の口元に向か
い、前後方向と平行とされている。発声者11の後方に
単一指向特性の副マイクロホン13が配される。副マイ
クロホン13は主として騒音信号を収音するためのもの
であり、その基準軸は発声者11の口元と反射向きで前
後方向と平行とされている。
1A shows an embodiment of the present invention. Speaker 1
A main microphone 12 having a unidirectional characteristic is arranged in front of 1. The main microphone 12 is mainly for picking up a voice signal, and its reference axis is directed toward the mouth of the speaker 11 and parallel to the front-back direction. A sub microphone 13 having a unidirectional characteristic is arranged behind the speaker 11. The sub microphone 13 is mainly for picking up a noise signal, and its reference axis is in the reflection direction of the mouth of the speaker 11 and parallel to the front-back direction.

【0010】マイクロホン12,13の各基準軸を図に
おいて矢印で示している。マイクロホン12,13は例
えば図1Bに実線で示すような単一指向特性、あるいは
更に指向特性の鋭いものであり、同図に示すようにマイ
クロホンの基準軸(信号源方向に対して最大感度となる
方向) を0度として、その180度方向の感度が低減し
ている、通常的に使用される汎用的なものを用いること
ができる。図1B中の破線は、全方向に対して同等の感
度を有する無指向性マイクロホンの特性を比較のために
示している。
Reference axes of the microphones 12 and 13 are indicated by arrows in the figure. The microphones 12 and 13 have, for example, a unidirectional characteristic as shown by the solid line in FIG. 1B or a sharper directional characteristic, and as shown in the figure, the microphone has a reference axis (maximum sensitivity to the signal source direction). The direction can be set to 0 degree, and a commonly used general-purpose one whose sensitivity in the 180 degree direction is reduced can be used. The broken line in FIG. 1B shows, for comparison, the characteristics of an omnidirectional microphone having equivalent sensitivity in all directions.

【0011】主マイクロホン12、副マイクロホン13
の各出力はそれぞれ帯域通過ろ波器14,15に通され
て、音声信号の特徴量を抽出するために十分な周波数帯
域幅の信号が取り出される。これら帯域通過ろ波器1
4,15の各出力はそれぞれ利得調整器16,17を通
り、更に移相器18,19を通って減算器21へ供給さ
れる。
Main microphone 12 and sub microphone 13
The respective outputs of the above are respectively passed through the band-pass filters 14 and 15, and a signal having a frequency bandwidth sufficient for extracting the characteristic amount of the audio signal is extracted. These band pass filters 1
Outputs 4 and 15 pass through gain adjusters 16 and 17, respectively, and further pass through phase shifters 18 and 19 to be supplied to a subtractor 21.

【0012】まず、主マイクロホン12及び副マイクロ
ホン13によって受音される各音響信号の中で、音声信
号を含まない騒音信号に対する出力が以下の過程で各部
の調整及び制御が行われる。すなわち、主マイクロホン
12及び副マイクロホン13によって受音される騒音信
号は、音声信号の特徴量を抽出するのに十分な帯域幅で
設定された帯域通過ろ波器14,15で周波数制限さ
れ、次に利得調整器16,17で各マイクロホンの出力
レベルが等しくなるように調整される。さらに、騒音信
号に対する両マイクロホン12,13間の位相差がほぼ
零となるように移相器16,17で調整される。このよ
うにして振幅並びに位相差の補正がなされたマイクロホ
ン12,13で収音された各騒音信号の出力レベルは、
減算器21で差分処理がなされその出力が信号出力端子
22へ取り出される。以上の処理によれば基本的に、騒
音信号に対しての出力端子22の出力レベルは零とな
る。
First, among the acoustic signals received by the main microphone 12 and the sub microphone 13, the output for the noise signal not including the voice signal is adjusted and controlled in the following process. That is, the noise signals received by the main microphone 12 and the sub microphone 13 are frequency-limited by the band-pass filters 14 and 15 set with a bandwidth sufficient to extract the characteristic amount of the audio signal, Then, the gain adjusters 16 and 17 adjust the output levels of the microphones to be equal. Further, the phase shifters 16 and 17 adjust the phase difference between the microphones 12 and 13 with respect to the noise signal to be substantially zero. The output level of each noise signal picked up by the microphones 12, 13 whose amplitude and phase difference have been corrected in this way is
The subtracter 21 performs difference processing, and the output is taken out to the signal output terminal 22. According to the above processing, the output level of the output terminal 22 with respect to the noise signal is basically zero.

【0013】このような調整の後、発声者11からの音
声信号を収音する。この音声信号は、主マイクロホン1
2と副マイクロホン13との各々のマイクロホン基準軸
が互いに逆方向に設定されていることによって生ずるマ
イクロホンの指向特性によるレベル差と、後述する発声
者11自身による頭部の回折効果による放射指向特性に
よって生ずるレベル差とが相乗的に加算されて得られ、
比較的大きなレベルで音声信号は得られる。
After such adjustment, the voice signal from the speaker 11 is picked up. This audio signal is sent to the main microphone 1
2 and the sub microphone 13, the level difference due to the directional characteristics of the microphones caused by the microphone reference axes being set in mutually opposite directions, and the radiation directivity characteristic due to the diffraction effect of the head by the speaker 11 itself, which will be described later. And the resulting level difference is synergistically added,
The audio signal can be obtained at a relatively large level.

【0014】図2に、マイクロホンの個数を増加した場
合のその配置構成例を示す。図2Aは水平面内で主マイ
クロホン12a,12b,12cと副マイクロホン13
a,13b,13cとを配した場合で、主マイクロホン
12a,12b,12cは発声者11の前方に位置し、
その各基準軸は発声者11の口元に向かっている。副マ
イクロホン13a,13b,13cは発声者11の後方
に位置し、その各基準軸は発声者11の口元と反対向方
に向いている。主マイクロホン12aと副マイクロホン
13aとの各基準軸は発声者11の口元を前後に通る直
線23上に位置し、主マイクロホン12bと副マイクロ
ホン13bとの各基準軸は発声者11の口元を通り、直
線23に対し角度θ1 (<90°) だけ左に斜めの直線
24上に位置し、主マイクロホン12cと副マイクロホ
ン13cとの各基準軸は発声者11の口元を通り、直線
23に対し角度θ2 (<90°) だけ右に斜めの直線2
5上に位置している。マイクロホン12aと13aとの
各出力中の騒音の差がゼロとなり、マイクロホン12b
と13bとの各出力中の騒音の差がゼロとなり、マイク
ロホン12cと13cとの各出力中の騒音の差がゼロと
なるように、各マイクロホンの出力側に図1Aと同様に
設けられた利得調整器、移相器が調整される。
FIG. 2 shows an example of the arrangement configuration when the number of microphones is increased. FIG. 2A shows the main microphones 12a, 12b, 12c and the sub microphone 13 in the horizontal plane.
a, 13b, 13c, the main microphones 12a, 12b, 12c are located in front of the speaker 11,
Each of the reference axes faces the mouth of the speaker 11. The sub microphones 13a, 13b, 13c are located behind the speaker 11, and their respective reference axes face the mouth of the speaker 11 in the opposite direction. The reference axes of the main microphone 12a and the sub microphone 13a are located on the straight line 23 passing back and forth through the mouth of the speaker 11, and the reference axes of the main microphone 12b and the sub microphone 13b pass through the mouth of the speaker 11. It is located on a straight line 24 that is oblique to the left by an angle θ 1 (<90 °) with respect to the straight line 23, and the reference axes of the main microphone 12c and the sub microphone 13c pass through the mouth of the speaker 11 and form an angle with respect to the straight line 23. θ 2 (<90 °) diagonal line 2 to the right
Located on the 5th. The difference in noise between the outputs of the microphones 12a and 13a becomes zero, and the microphone 12b
The gain provided on the output side of each microphone in the same manner as in FIG. 1A so that the difference in noise between the outputs of the microphones and 13b becomes zero and the difference between the noise in the outputs of the microphones 12c and 13c becomes zero. Adjusters and phase shifters are adjusted.

【0015】図2Bは垂直面内で発声者11の前方に主
マイクロホン12a,12d,12eを、後方に副マイ
クロホン13a,13d,13eを配した例である。主
マイクロホン12d、副マイクロホン13dの各基準軸
は発声者11の口元を通り、直線23に対し角度θ
3 (<90°) だけ上に斜めの直線26上に位置し、主
マイクロホン12e、副マイクロホン13eの各基準軸
は発声者11の口元を通り、直線23に対し角度θ
4 (<90°) だけ下に斜めの直線27上に位置してい
る。これら対応する主マイクロホンの出力と副マイクロ
ホンの出力との各騒音を互いにゼロにするようにされ
る。
FIG. 2B shows an example in which the main microphones 12a, 12d and 12e are arranged in front of the speaker 11 and the sub microphones 13a, 13d and 13e are arranged behind them in the vertical plane. The reference axes of the main microphone 12d and the sub microphone 13d pass through the mouth of the speaker 11 and form an angle θ with respect to the straight line 23.
It is located on a straight line 26 diagonally upward by 3 (<90 °), and the reference axes of the main microphone 12e and the sub microphone 13e pass through the mouth of the speaker 11 and form an angle θ with respect to the straight line 23.
It is located on diagonal line 27, which is 4 (<90 °) down. The respective noises of the output of the corresponding main microphone and the output of the sub microphone are made to be zero.

【0016】なお、主マイクロホン12(12a) と副
マイクロホン13(13a) との各特性が全く同一の場
合は利得調整器16,17は省略できる。つまり、各マ
イクロホンの騒音に対する出力特性を考えると、騒音源
が発声者11よりも遠方にあるとすればマイクロホン1
2,13で収音されて出力されるレベル差は、騒音源に
対するマイクロホン12,13の基準軸が同一方向を向
いた配置であるため、発声者11の音声に比べて少ない
かほぼ同等と見なされるため、単純にマイクロホン1
2,13の出力信号の差分成分を抽出しただけでも、騒
音信号成分はかなり除去されることとなる。同様に主マ
イクロホン12b(又は12c,12d,12e) と副
マイクロホン13b(又は13c,13d,13e) と
の各特性を全く同一とする時は対応する利得調整器を省
略できる。角度θ1 とθ2 は等しくてもよいし、同様に
θ3 とθ4 は等しくてもよい。
When the main microphone 12 (12a) and the sub microphone 13 (13a) have exactly the same characteristics, the gain adjusters 16 and 17 can be omitted. That is, considering the output characteristics of each microphone with respect to noise, assuming that the noise source is farther than the speaker 11, the microphone 1
Since the reference axes of the microphones 12 and 13 with respect to the noise source are oriented in the same direction, the level difference that is picked up by the sound sources 2 and 13 and output is considered to be less than or almost equal to the sound of the speaker 11. Microphone 1
Even if only the difference component of the output signals 2 and 13 is extracted, the noise signal component is considerably removed. Similarly, when the characteristics of the main microphone 12b (or 12c, 12d, 12e) and the sub microphone 13b (or 13c, 13d, 13e) are exactly the same, the corresponding gain adjuster can be omitted. The angles θ 1 and θ 2 may be equal, and similarly, the angles θ 3 and θ 4 may be equal.

【0017】また利得調整器16,17、移相器18,
19を設けることにより、主マイクロホン12(12
a) の基準軸と、副マイクロホン13(13b) の基準
軸とは必ずしも同一直線上になくてもよく、互いに角度
をなす二つの直線上にそれぞれ位置していてもよい。主
マイクロホン12(12a) の基準軸は発声者11の口
元に向き、副マイクロホン13(13a) の基準軸は口
元と反対向きとなればよい。これらのことは他のマイク
ロホン12b,12c,12d,12e,13b,13
c,13d,13eについても同様のことが云える。
Further, the gain adjusters 16 and 17, the phase shifter 18,
By providing the main microphone 12 (12
The reference axis of a) and the reference axis of the sub microphone 13 (13b) do not necessarily have to be on the same straight line, and may be located on two straight lines forming an angle with each other. The reference axis of the main microphone 12 (12a) may face the mouth of the speaker 11, and the reference axis of the sub microphone 13 (13a) may face the mouth. These are the other microphones 12b, 12c, 12d, 12e, 13b, 13
The same can be said for c, 13d, and 13e.

【0018】つまり、例えば主マイクロホン12aと副
マイクロホン13bとを組にして用いてもよいことも意
味している。ここで、発声者11自身による発声時の放
射指向特性について述べる。図3は、文献(例えば、電
子通信学会編,“聴覚と音声”,p236,s44年1
1月30日発行,コロナ社) から引用した発声者の発声
レベルについての指向特性を示したもので、図中Aは水
平面内での値、Bは垂直面内での値であって、これから
発声者の口元前方と口元よりも後方の背面部では、音声
の明瞭性に効果のある1kHz以上の高周波数領域で
は、頭部回折効果により10dB以上のレベル差が得ら
れることが分かる。この発明は、この物理現象を効果的
に利用すべく、収音用マイクロホンの配置とその基準軸
の方向とに制約を設けて構成したものである。椅子など
に腰を掛けた状態での使用に際しては、例えば主マイク
ロホンを胸元に付けてその基準軸を口元方向(上向き)
とし、副マイクロホンを椅子の背もたれ等に配置し、そ
の基準軸を下方向に設定して構成することが有効であ
る。
In other words, it also means that the main microphone 12a and the sub microphone 13b may be used in combination, for example. Here, the radiation directivity characteristic when the speaker 11 himself speaks will be described. FIG. 3 is a document (for example, the Institute of Electronics and Communication Engineers, “Audience and Speech”, p236, s44 1
(January 30, published by Corona Publishing Co., Ltd.) shows the directional characteristics of the vocalization level of a speaker, in which A is a value in the horizontal plane and B is a value in the vertical plane. It can be seen that a level difference of 10 dB or more is obtained by the head diffraction effect in the high frequency region of 1 kHz or more, which is effective for the clarity of the sound, in the front part of the mouth of the speaker and the back part behind the mouth. In order to effectively utilize this physical phenomenon, the present invention is configured by limiting the arrangement of the sound pickup microphone and the direction of its reference axis. When using the chair while sitting on it, for example, attach the main microphone to the chest and set its reference axis in the mouth direction (upward).
It is effective to arrange the sub microphone on the back of the chair or the like and set the reference axis downward.

【0019】図4に、発声者11に近接して音響的な反
射体28が配置されている場合のマイクロホンの配置例
を示す。図4Aは反射体28が天井のように発声者11
上側で水平に配された場合、Bは壁のように発声者11
の側面で垂直に配された場合を示している。また図4A
は6つのマイクロホンが図2Aの相対関係で配され、図
4Bは6つのマイクロホンが図2Bの相対関係で配され
ているものとする。何れの配置においても主マイクロホ
ンは、発声者11の口元から前方に配置すると共に反射
体28に対して各マイクロホンの基準軸を平行にし、副
マイクロホンは発声者11の口元から後方に配置すると
共に反射体28に対して各マイクロホンの基準軸を平行
にして配置する。マイクロホンの基準軸を反射体28に
対して平行にすることの利点は、以下の理由による。
FIG. 4 shows an arrangement example of microphones in the case where the acoustic reflector 28 is arranged close to the speaker 11. In FIG. 4A, the reflector 28 is like a ceiling and the speaker 11
When placed horizontally on the upper side, B is a speaker 11 like a wall.
It shows the case where it is arranged vertically on the side of. See also FIG. 4A
In FIG. 4, six microphones are arranged in the relative relationship of FIG. 2A, and in FIG. 4B, six microphones are arranged in the relative relationship of FIG. 2B. In either arrangement, the main microphone is arranged forward from the mouth of the speaker 11 and the reference axis of each microphone is parallel to the reflector 28, and the sub microphone is arranged rearward from the mouth of the speaker 11 and reflected. The reference axes of the microphones are arranged parallel to the body 28. The advantage of making the reference axis of the microphone parallel to the reflector 28 is as follows.

【0020】図5は、単一指向性マイクロホンを反射体
に近接して配置して、音響信号(ここではピンクノイズ
を用いた) の入力方向を変化したときのマイクロホンの
感度周波数特性の相対レベルを示したものである。同図
Aは、マイクロホンの基準軸を常に反射体に平行に配置
した場合、Bはマイクロホンの端面を反射体に接近させ
かつマイクロホンの基準軸を音源方向及び音源に対して
180度方向としたときの測定結果である。同図Aか
ら、音源方向とマイクロホン基準軸との角度θが、0度
(曲線31) と45度(曲線32) とは、反射体なし
(図中の実線) の場合よりも、全ての周波数領域でレベ
ルが上昇していることが分かる。θが90度の(曲線3
3) の場合では、2〜3kHzにディップ(落込み) を
生じた特性を示しており、音声を収音するためには好ま
しくない特性となる。さらに曲線34,35は、θが1
35度と180度の場合であって、反射体が無い場合の
実線で示したレベルよりも何れの周波数領域でもレベル
が低減している。これらから、発声者11が反射体28
に極めて接近して発声しているような場合には、主マイ
クロホン12aの出力特性は図4A中の曲線31とな
り、副マイクロホン13aの出力特性は曲線35とな
り、音声に対する出力はこれらの差分となって出力され
る。図4に示したように発声者11が反射体28から多
少離れている状態で、主、副マイクロホンを前述したよ
うに反射体28に平行に配置して収音した場合は、図A
の曲線32,34で示したレベルの差分として音声信号
が検出される。
FIG. 5 shows the relative level of the sensitivity frequency characteristic of the microphone when the unidirectional microphone is arranged close to the reflector and the input direction of the acoustic signal (here pink noise is used) is changed. Is shown. In FIG. 9A, when the reference axis of the microphone is always arranged parallel to the reflector, B shows the case where the end surface of the microphone is close to the reflector and the reference axis of the microphone is the sound source direction and the direction of 180 degrees with respect to the sound source. Is the measurement result of. From FIG. 6A, when the angle θ between the sound source direction and the microphone reference axis is 0 degree (curve 31) and 45 degrees (curve 32), all frequencies are higher than in the case without a reflector (solid line in the figure). You can see that the level is rising in the area. θ is 90 degrees (curve 3
In the case of 3), a characteristic that a dip (drop) is generated at 2 to 3 kHz is exhibited, which is an unfavorable characteristic for collecting voice. Further, in the curves 34 and 35, θ is 1
In the cases of 35 degrees and 180 degrees, the level is lower in any frequency region than the level shown by the solid line when there is no reflector. From these, the speaker 11 is the reflector 28.
4A, the output characteristic of the main microphone 12a becomes the curve 31 in FIG. 4A, the output characteristic of the sub microphone 13a becomes the curve 35, and the output for the voice becomes the difference between them. Is output. As shown in FIG. 4, when the speaker 11 is slightly away from the reflector 28 and the main and sub microphones are arranged in parallel with the reflector 28 as described above, sound is collected.
The audio signal is detected as the difference between the levels shown by the curves 32 and 34 in FIG.

【0021】図5Bはマイクロホン端面を反射体から5
mm程度離して、かつ反射体とマイクロホン基準軸との
角度を45度とし、マイクロホン基準軸の延長上に音源
があるとしたとき(曲線36) と、マイクロホン基準軸
を音源と逆方向すなわち反射体の方向に向けたとき(曲
線37) の特性とを示す。この結果を、図5A中の曲線
32,34の値と比較すると、顕著な差は認められな
い。従って、マイクロホン反射体に取り付ける場合の容
易さと反射体面からの突起量の低減化を図ることを考え
れば、マイクロホンの一端を反射体から離して発声者方
向に設定してやる必要性は見あたらない。すなわちマイ
クロホンの反射体への取り付けは、まずマイクロホン基
準軸を反射体と平行にした状態として、次にマイクロホ
ン基準軸が主マイクロホンにおいては発声者の口元方向
を、副マイクロホンにおいては発声者とは逆方向となる
ように設定することが推奨されるものである。
FIG. 5B shows the microphone end face 5 from the reflector.
When the angle between the reflector and the microphone reference axis is 45 degrees and the sound source is on the extension of the microphone reference axis (curve 36), the microphone reference axis is in the direction opposite to the sound source, that is, the reflector. And the characteristic when the curve is oriented in the direction (curve 37). When this result is compared with the values of the curves 32 and 34 in FIG. 5A, no significant difference is recognized. Therefore, considering the ease of attachment to the microphone reflector and the reduction in the amount of protrusion from the reflector surface, it is not necessary to set one end of the microphone toward the speaker away from the reflector. That is, the microphone is attached to the reflector first with the microphone reference axis parallel to the reflector, and then the microphone reference axis is in the mouth direction of the speaker in the main microphone and in the sub microphone opposite to that of the speaker. It is recommended to set the direction.

【0022】以上の結果から、発声者に対するマイクロ
ホン基準軸の推奨設定範囲は主マイクロホンについては
その基準軸と、発声者の口元を通る前後方向とのなす角
度を90°以下とし、副マイクロホンについてはその基
準軸と発声者の口元を通る前後方向とのなす角度を少く
とも90°以上とすることが重要である。なお、反射体
28へ極力マイクロホンを近接して配置することの有効
性は、以下の理由による。そのモデルを示すごとく、音
源からマイクロホンへの直接音と反射体28よりの反射
音との各距離D1とD2との差と、音源が出力する波長
との関係から、音源・マイクロホン間の伝送周波数特性
は図6Bに示すような特性を呈する。すなわち、同図
(B) の実線は、音源・マイクロホン間の水平距離Lが
50cm、音源と反射体28との距離H1が30cm、
反射体28とマイクロホンとの間の距離H2が2.5c
mの時の音源・マイクロホン間の伝送特性を示したもの
である。さらに、同図(B) の破線は、H1,H2が共
に30cm、Lが50cmの場合の音源・マイクロホン
間の伝送特性を示したものである。これから、反射体2
8とマイクロホンとの距離H2が小となってD1がD2
に近い値になると、H2が大の場合よりディップ(落込
み) を生ずる最初の周波数fd1が高い方へ移動すると
共にそのディップ量も大となる。このとき、ディップを
生ずる周波数を音声を収音するに必要な帯域外になるよ
うな寸法のH2としてやれば、所要周波数帯域内では平
坦な伝送特性を得ることが出来ることとなる。
From the above results, the recommended setting range of the microphone reference axis for the speaker is that the angle between the reference axis of the main microphone and the front-back direction passing through the mouth of the speaker is 90 ° or less, and that of the sub microphone is It is important that the angle between the reference axis and the front-back direction passing through the mouth of the speaker is at least 90 ° or more. The effectiveness of disposing the microphone as close to the reflector 28 as possible is as follows. As shown in the model, the transmission frequency between the sound source and the microphone is calculated based on the relationship between the difference between the distance D1 and D2 between the direct sound from the sound source to the microphone and the reflected sound from the reflector 28 and the wavelength output by the sound source. The characteristic exhibits the characteristic shown in FIG. 6B. That is, the solid line in FIG. 7B indicates that the horizontal distance L between the sound source and the microphone is 50 cm, the distance H1 between the sound source and the reflector 28 is 30 cm,
The distance H2 between the reflector 28 and the microphone is 2.5c
It shows the transmission characteristics between the sound source and the microphone at m. Further, the broken line in FIG. 7B shows the transmission characteristics between the sound source and the microphone when H1 and H2 are both 30 cm and L is 50 cm. From now on, the reflector 2
8 and the distance H2 between the microphone becomes small and D1 becomes D2
When the value becomes close to, the first frequency fd1 that causes a dip (drop) moves to a higher direction and the dip amount also becomes larger than when H2 is large. At this time, if the frequency causing the dip is set to H2 having a dimension outside the band necessary for picking up voice, a flat transmission characteristic can be obtained within the required frequency band.

【0023】図7Aは、この発明を自動車内の発声者か
らの音声の収音に適用した場合のマイクロホンの配置例
を示したものである。自動車内では、マイクロホンの設
置場所の候補として、エンジン音やカーステレオなどの
音を拾わずに、かつ発声者11から主マイクロホンまで
の距離が小さく、これら間の伝送特性が平坦な箇所が望
ましく、一方副マイクロホンについては、発声者11の
声が入らずに騒音のみが収音される場所が好ましい。主
マイクロホン12aはサンバイザ部を含む天井部分、主
マイクロホン12bはフロントガラスやフロントピラ部
分、主マイクロホン12cはダッシュボード部分、主マ
イクロホン12dはハンドル部分、主マイクロホン12
eは発声者11の胸元位置、主マイクロホン12fは側
面のフロントガラス部分などであり、副マイクロホン1
3aは車両天井部分、副マイクロホン13bはリヤガラ
スやリヤピラー部分、副マイクロホン13cはリヤトレ
イ部分、副マイクロホン13dは座席ヘッドレスト部
分、副マイクロホン13eは座席背もたれ部分、副マイ
クロホン13fはサイドウィンド部分にそれぞれ配置さ
れた場合である。
FIG. 7A shows an example of arrangement of microphones when the present invention is applied to picking up a voice from a speaker in an automobile. In a car, as a candidate for the installation location of the microphone, a location where the sound from the engineer or car stereo is not picked up, the distance from the speaker 11 to the main microphone is small, and the transmission characteristic between them is flat is desirable. On the other hand, for the sub microphone, it is preferable that only the noise is picked up without the voice of the speaker 11 being heard. The main microphone 12a is a ceiling portion including the sun visor portion, the main microphone 12b is a windshield or a front pillar portion, the main microphone 12c is a dashboard portion, the main microphone 12d is a handle portion, the main microphone 12
e is the chest position of the speaker 11, the main microphone 12f is the side windshield, etc.
3a is a vehicle ceiling portion, sub microphone 13b is a rear glass or rear pillar portion, sub microphone 13c is a rear tray portion, sub microphone 13d is a seat headrest portion, sub microphone 13e is a seat back portion, and sub microphone 13f is a side window portion. This is the case.

【0024】この中で、マイクロホン12a,13aの
配置位置が図4Aで説明した反射体28がある場合の例
に相当し、反射体28が天井部分である。実際に走行す
る車内で発声した音声について、音声の認識実験を行っ
てみた。このとき認識実験は、比較のために2個のマイ
クロホンをマイクロホン12aとほぼ同じ位置に各々の
基準軸を逆方向に配置した従来技術で収音した時につい
ても、同一の騒音低減法と認識手法を用いて行った。こ
の結果、従来技術によるマイクロホンの配置での認識率
が90.5%であったのに対し、この発明の実施例によ
るマイクロホン配置での認識率は96.5%と言う結果
が得られ、この発明によるマイクロホン配置を用いたと
きの認識装置への有効性が確認された。
Among these, the arrangement positions of the microphones 12a and 13a correspond to an example in which the reflector 28 described in FIG. 4A is provided, and the reflector 28 is the ceiling portion. We conducted a speech recognition experiment on the speech produced in the actual vehicle. At this time, for the recognition experiment, the same noise reduction method and recognition method are used even when sound is picked up by the prior art in which two microphones are arranged at substantially the same positions as the microphone 12a and their reference axes are arranged in opposite directions for comparison. Was carried out. As a result, the recognition rate in the microphone arrangement according to the related art was 90.5%, whereas the recognition rate in the microphone arrangement according to the embodiment of the present invention was 96.5%. The effectiveness of the invention on a recognizer was confirmed when using the microphone arrangement.

【0025】次に、使用するマイクロホンの数と配置位
置との関係については、例えば発声者が運転席と助手席
とで異なる場合などでは、主マイクロホンの配置は前に
も述べたように発声者の口元に近いことがより高いSN
比を得ることが出来るため有利であることから、それぞ
れの発声者に専用の主マイクロホンを配置して使用者に
応じて切り替えて使用するか、SN比が最も向上するマ
イクロホンの組合せを適応的に抽出、選択して実用に供
することが大切な要素となる。
Next, regarding the relationship between the number of microphones used and the arrangement position, for example, when the speaker is different between the driver's seat and the passenger's seat, the arrangement of the main microphones is as described above. SN closer to the mouth of
Since it is advantageous because it is possible to obtain a ratio, a dedicated main microphone is placed for each speaker and switched depending on the user, or a combination of microphones that maximizes the SN ratio is adaptively used. It is important to extract, select, and put to practical use.

【0026】図7Bは、発声者が11a,11bの2人
で、各発声者に対応して主マイクロホン12a,12b
及び副マイクロホン13a,13bが配置されている状
態を例示したものである。この時、発声者11aが発声
している場合は、主マイクロホンとしては12aが、副
マイクロホンとしては13aまたは13bが選択され、
発声者11bが発声している場合は、主マイクロホンと
して12bが、副マイクロホンとして13bもしくは1
3aが選択されることとなる。なお、車室内に限らず一
般の室内での使用を考えた場合でも、発声者が増加すれ
ばその人数に応じてマイクロホンの数を増やしても良い
し、マイクロホンの数を増やさずに既に設定されている
マイクロホンの中からSN比の向上するマイクロホンの
組合せを選択して使用しても良いことは言うまでもな
い。各マイクロホンで収音した後の騒音成分の除去につ
いては、前に述べた通りである。
In FIG. 7B, there are two speakers 11a and 11b, and the main microphones 12a and 12b corresponding to each speaker.
It also illustrates a state in which the sub microphones 13a and 13b are arranged. At this time, when the speaker 11a is speaking, 12a is selected as the main microphone and 13a or 13b is selected as the sub microphone,
When the speaker 11b is speaking, 12b as the main microphone and 13b or 1 as the sub microphone.
3a will be selected. In addition, even when considering the use not only in the passenger compartment but also in the general passenger compartment, the number of microphones may be increased according to the number of speakers if the number of speakers increases, or it is already set without increasing the number of microphones. It goes without saying that a combination of microphones having an improved SN ratio may be selected and used from the existing microphones. The removal of the noise component after the sound is picked up by each microphone is as described above.

【0027】[0027]

【発明の効果】以上述べたようにこの発明によれば、発
声者の前方において単一指向特性の主マイクロホンをそ
の基準軸が口元に向くように配し、かつ単一指向特性の
副マイクロホンを、発声者の後方においてその基準軸を
発声者と反対向きとして配しているため、マイクロホン
の指向特性と、発声者の頭部回折効果による指向特性と
の相乗効果により、音声信号のレベルの低下が少なく、
かつ騒音を低減することができる。
As described above, according to the present invention, the main microphone having the unidirectional characteristic is arranged in front of the speaker so that the reference axis faces the mouth, and the sub microphone having the unidirectional characteristic is arranged. , Since the reference axis is placed in the back of the speaker in the direction opposite to that of the speaker, the level of the voice signal is lowered by the synergistic effect of the directional characteristics of the microphone and the directional characteristics of the speaker's head diffraction effect. Is less
In addition, noise can be reduced.

【図面の簡単な説明】[Brief description of drawings]

【図1】Aはこの発明の実施例を示すブロック図、Bは
マイクロホンの指向特性の例を示す図である。
1A is a block diagram showing an embodiment of the present invention, and FIG. 1B is a diagram showing an example of directional characteristics of a microphone.

【図2】この発明の実施例における複数の主、副マイク
ロホンの配置の他の例を示し、Aは平面図、Bは側面図
である。
FIG. 2 shows another example of the arrangement of a plurality of main and sub microphones in the embodiment of the present invention, A is a plan view and B is a side view.

【図3】発声者自身の発声時の放射特性を示し、Aは水
平面内特性図、Bは垂直面内特性図である。
3A and 3B show radiation characteristics when a speaker himself or herself speaks, where A is a horizontal plane characteristic diagram and B is a vertical plane characteristic diagram.

【図4】Aは発声者の上側に接近して反射体が在る場合
にこの発明を適用したマイクロホンの配置例を示す側面
図、Bは発声者の横に接近して反射体が在る場合に、こ
の発明を適用したマイクロホンの配置例を示す平面図で
ある。
FIG. 4A is a side view showing an arrangement example of a microphone to which the present invention is applied when a reflector is present close to the upper side of the speaker, and B is a reflector close to the side of the speaker. In a case, it is a top view showing an example of arrangement of a microphone to which the present invention is applied.

【図5】反射体の影響による単一指向マイクロホンの基
準軸と音源方向との角度をパラメータとする伝送周波数
特性を示す図。
FIG. 5 is a diagram showing a transmission frequency characteristic with an angle between a reference axis and a sound source direction of a unidirectional microphone influenced by a reflector as a parameter.

【図6】Aは音源とマイクロホンと、反射体との配置寸
法を示す図、Bは音源とマイクロホンとの間の伝送周波
数特性を示す図である。
6A is a diagram showing arrangement dimensions of a sound source, a microphone, and a reflector, and B is a diagram showing a transmission frequency characteristic between the sound source and the microphone. FIG.

【図7】Aはこの発明を自動車内の収音に適用した場合
のマイクロホンの配置例を示す側面図、Bは発声者が2
名の場合にこの発明を適用した場合のマイクロホンの配
置例を示す平面図である。
7A is a side view showing an arrangement example of microphones when the present invention is applied to sound collection in an automobile, and B is a speaker 2
It is a top view which shows the example of arrangement | positioning of the microphone at the time of applying this invention in the case of a name.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 発声者の前方に配され、その発声者の口
元を通る前後方向に対し、基準軸が90°以下の主マイ
クロホンと、 上記発声者の後方に配され、その発声者の口元を通る前
後方向に対し、基準軸が90°以上の副マイクロホン
と、 上記主マイクロホン及び上記副マイクロホンの各出力の
相対位相を変化させることができる移相器と、 その移相器により相対位相が変化された上記主及び副マ
イクロホンの両出力の差をとる減算器と、 を具備する音声信号入力装置。
1. A main microphone arranged in front of a speaker and having a reference axis of 90 ° or less with respect to a front-back direction passing through the mouth of the speaker, and a microphone arranged behind the speaker, the mouth of the speaker. With respect to the front-back direction passing through, a sub-microphone with a reference axis of 90 ° or more, a phase shifter that can change the relative phase of each output of the main microphone and the sub-microphone, and the relative phase by the phase shifter. An audio signal input device comprising: a subtractor for taking a difference between the changed outputs of the main and sub microphones.
【請求項2】 上記主マイクロホン及び上記副マイクロ
ホンは上記発声者と近接し、その発声者の前後方向に延
長した反射体に極力接近して設けられ、かつ両マイクロ
ホンの各基準軸が上記反射体とほぼ平行とされているこ
とを特徴とする請求項1記載の音声信号入力装置。
2. The main microphone and the sub microphone are provided close to the speaker and as close as possible to a reflector extending in the front-back direction of the speaker, and each reference axis of both microphones is the reflector. The audio signal input device according to claim 1, wherein the audio signal input device is substantially parallel to the audio signal input device.
JP4022519A 1992-02-07 1992-02-07 Speech signal input device Pending JPH05216495A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4022519A JPH05216495A (en) 1992-02-07 1992-02-07 Speech signal input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4022519A JPH05216495A (en) 1992-02-07 1992-02-07 Speech signal input device

Publications (1)

Publication Number Publication Date
JPH05216495A true JPH05216495A (en) 1993-08-27

Family

ID=12085023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4022519A Pending JPH05216495A (en) 1992-02-07 1992-02-07 Speech signal input device

Country Status (1)

Country Link
JP (1) JPH05216495A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195058A (en) * 2000-01-12 2001-07-19 Yamaha Corp Music playing device
WO2008062850A1 (en) * 2006-11-22 2008-05-29 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, its manufacturing method and information processing system
WO2008062848A1 (en) * 2006-11-22 2008-05-29 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, its manufacturing method and information processing system
WO2008062849A1 (en) * 2006-11-22 2008-05-29 Funai Electric Advanced Applied Technology Research Institute Inc. Integrated circuit device, voice input device and information processing system

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195058A (en) * 2000-01-12 2001-07-19 Yamaha Corp Music playing device
JP4644893B2 (en) * 2000-01-12 2011-03-09 ヤマハ株式会社 Performance equipment
WO2008062850A1 (en) * 2006-11-22 2008-05-29 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, its manufacturing method and information processing system
WO2008062848A1 (en) * 2006-11-22 2008-05-29 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, its manufacturing method and information processing system
WO2008062849A1 (en) * 2006-11-22 2008-05-29 Funai Electric Advanced Applied Technology Research Institute Inc. Integrated circuit device, voice input device and information processing system
EP2364036A3 (en) * 2006-11-22 2011-09-28 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, its manufacturing method and information processing system
US8638955B2 (en) 2006-11-22 2014-01-28 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, method of producing the same, and information processing system
US8731693B2 (en) 2006-11-22 2014-05-20 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, method of producing the same, and information processing system
US9025794B2 (en) 2006-11-22 2015-05-05 Funai Electric Co., Ltd. Integrated circuit device, voice input device and information processing system

Similar Documents

Publication Publication Date Title
CN103517185B (en) To the method for the acoustical signal noise reduction of the multi-microphone audio equipment operated in noisy environment
JP5156260B2 (en) Method for removing target noise and extracting target sound, preprocessing unit, speech recognition system and program
US6449593B1 (en) Method and system for tracking human speakers
JP6635394B1 (en) Audio processing device and audio processing method
US9002027B2 (en) Space-time noise reduction system for use in a vehicle and method of forming same
US6754623B2 (en) Methods and apparatus for ambient noise removal in speech recognition
US5835607A (en) Mobile radiotelephone with handsfree device
WO2016103709A1 (en) Voice processing device
WO2001095314A1 (en) Robot acoustic device and robot acoustic system
WO2016103710A1 (en) Voice processing device
JP2007180896A (en) Voice signal processor and voice signal processing method
WO2016143340A1 (en) Speech processing device and control device
CN113066468A (en) Active noise interference elimination optimization device and method based on in-vehicle environment
JP2000312395A (en) Microphone system
JP2003264883A (en) Voice processing apparatus and voice processing method
JP2006023588A (en) In-vehicle noise suppressing system
JP6943120B2 (en) Sound collectors, programs and methods
JPH05216495A (en) Speech signal input device
JP3774580B2 (en) Voice input device
Ahn et al. Background noise reduction via dual-channel scheme for speech recognition in vehicular environment
JP5405130B2 (en) Sound reproducing apparatus and sound reproducing method
JP2965301B2 (en) Sound collector
JP2020134566A (en) Voice processing system, voice processing device and voice processing method
JP3919337B2 (en) Voice recognition device for vehicle
JP7270140B2 (en) Audio processing system and audio processing device