JP7060905B1 - 収音システム、収音方法及びプログラム - Google Patents
収音システム、収音方法及びプログラム Download PDFInfo
- Publication number
- JP7060905B1 JP7060905B1 JP2022502563A JP2022502563A JP7060905B1 JP 7060905 B1 JP7060905 B1 JP 7060905B1 JP 2022502563 A JP2022502563 A JP 2022502563A JP 2022502563 A JP2022502563 A JP 2022502563A JP 7060905 B1 JP7060905 B1 JP 7060905B1
- Authority
- JP
- Japan
- Prior art keywords
- sound
- signal
- sound source
- beam former
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 33
- 230000005236 sound signal Effects 0.000 claims abstract description 75
- 238000001514 detection method Methods 0.000 claims abstract description 50
- 230000007423 decrease Effects 0.000 claims description 5
- 230000003247 decreasing effect Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 238000013016 damping Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
Description
図1は、本実施形態に係る収音システムSの概要を説明するための図である。図1は、空間Rの側面から空間Rの内部を見た図である。空間Rは、例えば、建物内の部屋であるが、これに限らず、建物内の廊下、ラウンジ、階段スペース等であってもよい。図1に示すように、空間Rの上面には収音システムSが設置されており、空間Rには話者A1、話者A2、及び話者A3が滞在している。図1における音声B1、B2、B3は、それぞれ話者A1、A2、A3が発する音声である。図1においては、収音システムSは空間Rの上面に設置されている。なお、収音システムSは空間Rの側面又は底面に設置されていてもよい。
図3は、収音システムSの構成を説明するための図である。収音システムSは、マイクロホンアレイ1と信号処理装置10とを有する。マイクロホンアレイ1は、複数のマイクロフォン2(マイクロフォン2a,2b,2c,2d)を含む。複数のマイクロフォン2は、到来した音に基づく電気信号を出力する。信号処理装置10は、複数のマイクロフォン2が出力する電気信号を処理して音源方向の指向性を高めることにより、音源が発した音を強調して出力する。
図5は、新しい音源を検出したか否かをビームフォーミング処理部15が判定する処理の流れを示すフローチャートである。音源方向検出部151は、入力部11が増幅した後の複数の音信号を取得する(S11)。音源方向検出部151は、取得した複数の音信号に基づいて音源方向を検出する(S12)。
図6は、新しい音源を検出したことに基づいてビームフォーミング処理部15がビームフォーマを制御する処理の流れを示すフローチャートである。図6は、信号処理装置10が有する複数のビームフォーマのうち1つのビームフォーマを指向性制御部155が制御する際の処理の流れを示している。図6に示すフローチャートは、第1ビームフォーマ152が第1音源の方向に指向性がある状態で第1信号を出力している時点から開始している。
以上のとおり、収音システムSは、複数のマイクロフォン2に到来した音に基づく音信号のうち第1範囲内の方向から到来した音に基づく音信号を強調させた第1信号を出力する第1ビームフォーマ152と、複数の音信号のうち第2範囲内の方向から到来した音に基づく音信号を強調させた第2信号を出力する第2ビームフォーマ153とを有する。そして、指向性制御部155が、音源の方向に基づいて、ビームフォーミング処理を行わせるビームフォーマを切り替える。
2 マイクロフォン
10 信号処理装置
11 入力部
12 第1減衰部
13 第2減衰部
14 出力部
15 ビームフォーミング処理部
151 音源方向検出部
152 第1ビームフォーマ
153 第2ビームフォーマ
154 記憶部
155 指向性制御部
161 可変遅延部
162 ゲイン調整部
163 加算部
Claims (13)
- 複数のマイクロフォンを含むマイクロホンアレイと、
前記複数のマイクロフォンに到来した音に基づく複数の音信号のうち第1範囲内の方向から到来した音に基づく音信号を他の方向から到来した音に基づく音信号よりも強調させた第1信号を出力する第1ビームフォーマと、
前記複数の音信号のうち第2範囲内の方向から到来した音に基づく音信号を他の方向から到来した音に基づく音信号よりも強調させた第2信号を出力する第2ビームフォーマと、
前記複数のマイクロフォンに到来した音を発した音源の方向を検出する音源方向検出部と、
前記第1ビームフォーマが前記第1信号を出力している間に、前記音源方向検出部が検出した前記音源の方向の単位時間あたりの変化角度が閾値以上であると判定した場合に、前記第2ビームフォーマに前記第2信号を出力させる指向性制御部と、
を有する収音システム。 - 前記指向性制御部は、前記第1ビームフォーマが前記第1信号を出力している間に、前記音源の方向の単位時間あたりの変化角度が閾値未満であると判定した場合に、前記第1範囲を変更した状態で前記第1ビームフォーマに前記第1信号を継続して出力させる、
請求項1に記載の収音システム。 - 前記指向性制御部は、前記第1ビームフォーマが前記第1信号を出力している間に前記変化角度が閾値以上であると判定した場合に、前記第1信号の出力レベルを減少させる、
請求項1又は2に記載の収音システム。 - 前記指向性制御部は、前記変化角度が閾値以上であると判定してからの経過時間に基づく減衰率で前記第1信号の出力レベルを減少させる、
請求項3に記載の収音システム。 - 前記指向性制御部は、前記第1信号の出力レベルを減少させる間に前記第2信号の出力レベルを増加させる、
請求項3又は4に記載の収音システム。 - 前記指向性制御部は、前記第1信号の出力レベルを減少させる変化速度よりも大きい変化速度で前記第2信号の出力レベルを増加させる、
請求項3から5のいずれか一項に記載の収音システム。 - 前記指向性制御部は、前記音源の方向が前記第1範囲に含まれていないと判定した場合に、前記第2ビームフォーマに前記第2信号を出力させる、
請求項1から6のいずれか一項に記載の収音システム。 - 前記指向性制御部は、前記第2ビームフォーマに前記第2信号を出力させる前に、前記音源の方向を含むように前記第2範囲を決定する、
請求項1から7のいずれか一項に記載の収音システム。 - 前記指向性制御部は、前記第2ビームフォーマが前記第2信号を出力している間に、前記音源方向検出部が検出した前記音源の方向の単位時間あたりの変化角度が閾値以上であると判定した場合に、前記第1ビームフォーマに前記第1信号を出力させる、
請求項1から8のいずれか一項に記載の収音システム。 - 前記音源方向検出部が検出した前記音源の方向と、ビームフォーマ係数とを関連付けて記憶する記憶部をさらに有し、
前記指向性制御部は、前記音源方向検出部が検出した前記音源の方向に関連付けて前記記憶部に記憶された前記ビームフォーマ係数を用いて前記第1ビームフォーマ又は前記第2ビームフォーマに前記第1信号又は前記第2信号を出力させる、
請求項1から9のいずれか一項に記載の収音システム。 - 前記記憶部は、前記音源方向検出部が過去に検出した音源の方向と、当該方向に基づいて指向性制御部が過去の算出したビームフォーマ係数と、を関連付けて記憶し、
前記指向性制御部は、前記音源方向検出部が新たに検出した音源の方向と前記記憶部が記憶している前記過去に検出した音源の方向とが同じであると判定した場合に、前記過去に検出した音源の方向に関連付けて記憶された前記ビームフォーマ係数を使用する、
請求項10に記載の収音システム。 - 複数のマイクロフォンに到来した音に基づく複数の音信号のうち第1範囲内の方向から到来した音に基づく音信号を他の方向から到来した音に基づく音信号よりも強調させた第1信号を出力するステップと、
前記複数のマイクロフォンに到来した音を発した音源の方向を検出するステップと、
前記第1信号を出力している間に、前記音源の方向の単位時間あたりの変化角度が閾値以上であると判定した場合に、前記複数の音信号のうち第2範囲内の方向から到来した音に基づく音信号を他の方向から到来した音に基づく音信号よりも強調させた第2信号を出力するステップと、
を有する収音方法。 - コンピュータを、
複数のマイクロフォンに到来した音に基づく複数の音信号のうち第1範囲内の方向から到来した音に基づく音信号を他の方向から到来した音に基づく音信号よりも強調させた第1信号を出力する第1ビームフォーマ、
前記複数の音信号のうち第2範囲内の方向から到来した音に基づく音信号を他の方向から到来した音に基づく音信号よりも強調させた第2信号を出力する第2ビームフォーマ、
前記複数のマイクロフォンに到来した音を発した音源の方向を検出する音源方向検出部、及び
前記第1ビームフォーマが前記第1信号を出力している間に、前記音源方向検出部が検出した前記音源の方向の単位時間あたりの変化角度が閾値以上であると判定した場合に、前記第2ビームフォーマに前記第2信号を出力させる指向性制御部、
として機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020187841 | 2020-11-11 | ||
JP2020187841 | 2020-11-11 | ||
PCT/JP2021/037733 WO2022102322A1 (ja) | 2020-11-11 | 2021-10-12 | 収音システム、収音方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7060905B1 true JP7060905B1 (ja) | 2022-04-27 |
JPWO2022102322A1 JPWO2022102322A1 (ja) | 2022-05-19 |
Family
ID=81390815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022502563A Active JP7060905B1 (ja) | 2020-11-11 | 2021-10-12 | 収音システム、収音方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230247361A1 (ja) |
EP (1) | EP4207196A4 (ja) |
JP (1) | JP7060905B1 (ja) |
CN (1) | CN116490924A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11978467B2 (en) * | 2022-07-21 | 2024-05-07 | Dell Products Lp | Method and apparatus for voice perception management in a multi-user environment |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009288215A (ja) * | 2008-06-02 | 2009-12-10 | Toshiba Corp | 音響処理装置及びその方法 |
JP2016167645A (ja) * | 2015-03-09 | 2016-09-15 | アイシン精機株式会社 | 音声処理装置及び制御装置 |
JP2017153065A (ja) * | 2016-02-25 | 2017-08-31 | パナソニック株式会社 | 音声認識方法、音声認識装置及びプログラム |
US20170280235A1 (en) * | 2016-03-24 | 2017-09-28 | Intel Corporation | Creating an audio envelope based on angular information |
JP2018155996A (ja) * | 2017-03-21 | 2018-10-04 | 富士通株式会社 | 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法 |
JP2019176332A (ja) * | 2018-03-28 | 2019-10-10 | 株式会社フュートレック | 音声抽出装置及び音声抽出方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7375035B2 (ja) * | 2019-03-13 | 2023-11-07 | ノキア テクノロジーズ オサケユイチア | ビームフォーミングプロファイルを調整するためのデバイス、方法およびコンピュータ読み取り可能なメディア |
-
2021
- 2021-10-12 CN CN202180068862.6A patent/CN116490924A/zh active Pending
- 2021-10-12 JP JP2022502563A patent/JP7060905B1/ja active Active
- 2021-10-12 EP EP21891569.2A patent/EP4207196A4/en active Pending
-
2023
- 2023-03-22 US US18/187,914 patent/US20230247361A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009288215A (ja) * | 2008-06-02 | 2009-12-10 | Toshiba Corp | 音響処理装置及びその方法 |
JP2016167645A (ja) * | 2015-03-09 | 2016-09-15 | アイシン精機株式会社 | 音声処理装置及び制御装置 |
JP2017153065A (ja) * | 2016-02-25 | 2017-08-31 | パナソニック株式会社 | 音声認識方法、音声認識装置及びプログラム |
US20170280235A1 (en) * | 2016-03-24 | 2017-09-28 | Intel Corporation | Creating an audio envelope based on angular information |
JP2018155996A (ja) * | 2017-03-21 | 2018-10-04 | 富士通株式会社 | 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法 |
JP2019176332A (ja) * | 2018-03-28 | 2019-10-10 | 株式会社フュートレック | 音声抽出装置及び音声抽出方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4207196A4 (en) | 2024-03-06 |
EP4207196A1 (en) | 2023-07-05 |
JPWO2022102322A1 (ja) | 2022-05-19 |
US20230247361A1 (en) | 2023-08-03 |
CN116490924A (zh) | 2023-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8098841B2 (en) | Sound field controlling apparatus | |
JP5654513B2 (ja) | 音識別方法および装置 | |
TWI713844B (zh) | 用於語音處理的方法及積體電路 | |
US9338549B2 (en) | Acoustic localization of a speaker | |
KR101715779B1 (ko) | 음원 신호 처리 장치 및 그 방법 | |
US8204198B2 (en) | Method and apparatus for selecting an audio stream | |
JP5446275B2 (ja) | 拡声システム | |
RU2591026C2 (ru) | Аудиосистема и способ ее работы | |
JP4752403B2 (ja) | 拡声システム | |
JP6643818B2 (ja) | 両耳用補聴システムにおける無指向性感知 | |
KR20120101457A (ko) | 오디오 줌 | |
JP2008259022A (ja) | 放収音装置 | |
JP7060905B1 (ja) | 収音システム、収音方法及びプログラム | |
JP6631010B2 (ja) | マイク選択装置、マイクシステムおよびマイク選択方法 | |
JP2010011269A (ja) | スピーカアレイ装置 | |
JP7271862B2 (ja) | 音声処理装置 | |
JP3154468B2 (ja) | 受音方法及びその装置 | |
WO2022102322A1 (ja) | 収音システム、収音方法及びプログラム | |
JP3932928B2 (ja) | 拡声装置 | |
JPH06261390A (ja) | マイクロホン装置 | |
JP5141442B2 (ja) | 収音装置、及び放収音装置 | |
JP2008245203A (ja) | 拡声装置、拡声装置の遅延時間決定方法および拡声装置のフィルタ係数決定方法 | |
JP2019537071A (ja) | 分散したマイクロホンからの音声の処理 | |
JPH0722878A (ja) | 拡声装置 | |
JP2008294600A (ja) | 放収音装置、および放収音システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220114 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7060905 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |