JP5663201B2 - 音源方向推定装置及び音源方向推定方法 - Google Patents
音源方向推定装置及び音源方向推定方法 Download PDFInfo
- Publication number
- JP5663201B2 JP5663201B2 JP2010124874A JP2010124874A JP5663201B2 JP 5663201 B2 JP5663201 B2 JP 5663201B2 JP 2010124874 A JP2010124874 A JP 2010124874A JP 2010124874 A JP2010124874 A JP 2010124874A JP 5663201 B2 JP5663201 B2 JP 5663201B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- correlation matrix
- matrix
- sound
- eigenvector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
また、回転可能な頭部にマイクロフォンを備える移動型ロボットの場合、頭部を回転させたときの音源に対する相関行列は、頭部を回転させていないときの相関行列と異なるため、頭部の回転角度に応じたそれぞれの相関行列を予め用意する必要があり、非常に多くのデータを保持しなければならないという問題がある。
本発明はかかる事情に鑑みてなされたものであり、定常雑音源を有するシステムにおいて、音源方向を正しく推定する技術を提供することを目的とする。
請求項2記載の音源方向推定装置は、前記固有ベクトル算出手段がその固有ベクトルを算出する相関行列が、前記算出された相関行列に、さらに、前記音源毎の相関行列のうち、注目している音源各々の相関行列である、あるいは前記注目している音源各々の相関行列を固有値展開したときの各固有値を対角成分とする対角行列を0から1の間の値乗とした行列に基づく行列である、前記注目している音源各々の集束演算子(例えば、実施形態における相関行列C1)を、前記音源毎の相関行列が得られた順に少なくとも乗じた行列であることを特徴とする。
請求項3記載の音源方向推定方法は、音響信号を入力する音響信号入力手順と、入力された音響信号の相関行列を算出する相関行列算出手順と、算出された相関行列を用いて相関行列の固有ベクトルを求める固有ベクトル算出手順とを有し、前記固有ベクトルを用いて音源方向を推定する音源方向推定方法において、前記固有ベクトル算出手順において、その固有ベクトルが算出される相関行列は、音を発する音源が増えたときに前記音響信号の相関行列にそれまでに得られた音源毎の相関行列の逆行列を乗じることで得られる音源毎の相関行列のうち、消去したい音源各々の相関行列の逆行列である、あるいは前記消去したい音源各々の相関行列を固有値展開したときの各固有値を対角成分とする対角行列を0から−1の間の値乗とした行列に基づく行列である、前記消去したい音源各々の消去演算子を、前記算出された相関行列に、前記音源毎の相関行列が得られた順に少なくとも乗じた行列であることを特徴とする。
請求項2記載の音源方向推定装置によれば、音源方向を推定するための固有ベクトルを、入力された音響信号の相関行列に、さらに、注目している音源各々の集束演算子を乗じた行例を用いて算出するため、音源分離および音声認識などの後段のプロセスにおいて、所望の音源を適切に分離、認識することができる。例えば、音源への興味の度合いに応じて適切に認識処理を行うことができる。
請求項3記載の音源方向推定方法によれば、請求項1と同様の効果を得ることができる。
(音源方向推定装置の概略)
図1及び図2を用いて、本実施形態による音源方向推定装置1、具体的には、本実施形態による音源方向推定装置1を搭載したロボット4の概略を説明する。図1は、本実施形態による音源方向推定装置1を搭載したロボット4の概略側面図である。図2は、ロボット4のブロック図である。ロボット4は、図1に示すように、基体部41と、基体部41に可動連結された頭部42と、収納部45とを備える。
続いて、図4乃至図9を用いて、本実施形態による音源方向推定装置1に関連する技術事項(本実施形態による音源方向推定装置1の基礎になる技術事項も含む)について詳細に説明する。
G.Strang,Linear Algebra and its Applivations Third Edition,Harcount Brace Jovanovich,1998.
MUSIC法の問題を解決するためにGEVDを使用するが、ターゲット音の大きさに比べて雑音の大きさが大きい場合に、上述の如く、雑音の固有ベクトルe1,・・・,eLを選択してしまう点が問題となる。該問題を解決するため、下記式(8)に示すように、雑音N(ω,φ)の相関行列K(ω,φ)を定義する。
ターゲット音源選択は、GEVDの応用し、特定の音を選択する。上記式(10)において、K(ω,φ)の逆行列は、相関行列R(ω,φ)から雑音N(ω,φ)を消去する“消去演算子”とみなすことができる。逆に、上記式(10)において、R(ω,φ)は、ターゲット音及び雑音の“集束演算子”とみなすことができる。
上記式(16)において、piは、整数しかとらないため、ターゲット音源選択において、音の集束および消去は、離散的に実行されるため、インテリジェント定位を実現することはできない。インテリジェント定位を実現する場合、動的FoAが必要になる。
続いて、ロボットの頭部回転時の音源定位について説明する。相関行列推定は、頭部回転によるマイクロフォンアレイ、ターゲット音及び雑音の方向の変化してしまうという課題を解決する。以下、頭部の配向φを変数とする。
GEVD、ターゲット音源選択、動的FoA、及び、相関行列推定の特長は、夫々の関数が、音独立演算であることである。よって、アルゴリズム的に容易に実装可能である。各演算は、音を動的に1つずつ処理することができるので、選択的注意システムは、種々の環境的変化に対し順応性が高い。
1.Rl(ω,φ)の決定(1≦l≦L)
2.上記式(15)によるCl(ω,φ)の決定
3.上記式(16)のpiによるターゲット音源選択のための決定
4.音の重要度に応じて上記式(19)においてDlを定義することによる動的FoAのための決定
5.頭部回転について、上記式(22)によるCl(ω,φ)の変換
以下、上記各種法の有効性を、シミュレーションと実験の両方で評価する。評価用の共通条件は以下のとおりである。
・K(ω,φ)は、頭部角度の5度で与えられる。
・60度と−60度との間に2つの音がある。
・主環境雑音は、180度の角度からである。
・環境雑音N(ω,φ)の強さは、定位する音よりも大きい。
・−60度の角度からの音が最初に検出され、次いで、60度からの音がその後検出される。
・方向推定ベクトルG(ω,Ψ)は5度で与えられる。つまり、Ψ={−175,−170,…,180}度である。
・頭部回転は、ロボットが音を検出したときに行われ、音に向かい合おうとする。従って、C1(ω,φ)は、−60度からの音に関するものであり、C2(ω,φ)は、60度からの音に対するものである。
続いて、上記を踏まえ、固有ベクトル算出部120について詳細に説明する。図2及び図6において、マイクロフォンアレイ100は機能Aに関係し、相関行列算出部110の機能は機能B、C、Dに関係し、固有ベクトル算出部120は機能E、F、Gに関係し、音源方向推定部130は機能Hに関係し、駆動制御部140は機能I、Jに関係する。
41 基体部
42 頭部
45 収納部
100 マイクロフォンアレイ(音響信号入力手段)
110 相関行列算出部(相関行列算出手段)
120 固有ベクトル算出部(固有ベクトル算出手段、マイク姿勢情報保持部)
130 音源方向推定部
140 駆動制御部
150 頭機能部
Claims (3)
- 音響信号を入力する音響信号入力手段と、
入力された音響信号の相関行列を算出する相関行列算出手段と、
算出された相関行列を用いて相関行列の固有ベクトルを求める固有ベクトル算出手段とを備え、前記固有ベクトルを用いて音源方向を推定する音源方向推定装置において、
前記固有ベクトル算出手段がその固有ベクトルを算出する相関行列は、音を発する音源が増えたときに前記音響信号の相関行列にそれまでに得られた音源毎の相関行列の逆行列を乗じることで得られる音源毎の相関行列のうち、消去したい音源各々の相関行列の逆行列である、あるいは前記消去したい音源各々の相関行列を固有値展開したときの各固有値を対角成分とする対角行列を0から−1の間の値乗とした行列に基づく行列である、前記消去したい音源各々の消去演算子を、前記算出された相関行列に、前記音源毎の相関行列が得られた順に少なくとも乗じた行列であることを特徴とする音源方向推定装置。 - 前記固有ベクトル算出手段がその固有ベクトルを算出する相関行列は、前記算出された相関行列に、さらに、前記音源毎の相関行列のうち、注目している音源各々の相関行列である、あるいは前記注目している音源各々の相関行列を固有値展開したときの各固有値を対角成分とする対角行列を0から1の間の値乗とした行列に基づく行列である、前記注目している音源各々の集束演算子を、前記音源毎の相関行列が得られた順に少なくとも乗じた行列であることを特徴とする請求項1に記載の音源方向推定装置。
- 音響信号を入力する音響信号入力手順と、
入力された音響信号の相関行列を算出する相関行列算出手順と、
算出された相関行列を用いて相関行列の固有ベクトルを求める固有ベクトル算出手順とを有し、前記固有ベクトルを用いて音源方向を推定する音源方向推定方法において、
前記固有ベクトル算出手順において、その固有ベクトルが算出される相関行列は、音を発する音源が増えたときに前記音響信号の相関行列にそれまでに得られた音源毎の相関行列の逆行列を乗じることで得られる音源毎の相関行列のうち、消去したい音源各々の相関行列の逆行列である、あるいは前記消去したい音源各々の相関行列を固有値展開したときの各固有値を対角成分とする対角行列を0から−1の間の値乗とした行列に基づく行列である、前記消去したい音源各々の消去演算子を、前記算出された相関行列に、前記音源毎の相関行列が得られた順に少なくとも乗じた行列であることを特徴とする音源方向推定方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US21780309P | 2009-06-04 | 2009-06-04 | |
US61/217,803 | 2009-06-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010281816A JP2010281816A (ja) | 2010-12-16 |
JP5663201B2 true JP5663201B2 (ja) | 2015-02-04 |
Family
ID=43380765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010124874A Active JP5663201B2 (ja) | 2009-06-04 | 2010-05-31 | 音源方向推定装置及び音源方向推定方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9055356B2 (ja) |
JP (1) | JP5663201B2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010149167A1 (en) * | 2009-06-26 | 2010-12-29 | Lizard Technology Aps | Sound localizing robot |
FR2962048A1 (fr) * | 2010-07-02 | 2012-01-06 | Aldebaran Robotics S A | Robot humanoide joueur, methode et systeme d'utilisation dudit robot |
JP5702685B2 (ja) | 2010-08-17 | 2015-04-15 | 本田技研工業株式会社 | 音源方向推定装置及び音源方向推定方法 |
CN103119461B (zh) * | 2011-09-20 | 2015-08-26 | 丰田自动车株式会社 | 声源检测装置 |
JP5967571B2 (ja) | 2012-07-26 | 2016-08-10 | 本田技研工業株式会社 | 音響信号処理装置、音響信号処理方法、及び音響信号処理プログラム |
JP5949311B2 (ja) * | 2012-08-15 | 2016-07-06 | 富士通株式会社 | 推定プログラム、推定装置、及び推定方法 |
JP5952692B2 (ja) * | 2012-09-13 | 2016-07-13 | 本田技研工業株式会社 | 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム |
US20150314454A1 (en) * | 2013-03-15 | 2015-11-05 | JIBO, Inc. | Apparatus and methods for providing a persistent companion device |
JP6311197B2 (ja) * | 2014-02-13 | 2018-04-18 | 本田技研工業株式会社 | 音響処理装置、及び音響処理方法 |
EP2933067B1 (en) * | 2014-04-17 | 2019-09-18 | Softbank Robotics Europe | Method of performing multi-modal dialogue between a humanoid robot and user, computer program product and humanoid robot for implementing said method |
CN105163209A (zh) * | 2015-08-31 | 2015-12-16 | 深圳前海达闼科技有限公司 | 一种接收声音的处理方法及装置 |
JP6436427B2 (ja) * | 2016-03-25 | 2018-12-12 | パナソニックIpマネジメント株式会社 | 収音装置 |
KR101827276B1 (ko) * | 2016-05-13 | 2018-03-22 | 엘지전자 주식회사 | 전자 장치 및 그 제어 방법 |
US10297267B2 (en) * | 2017-05-15 | 2019-05-21 | Cirrus Logic, Inc. | Dual microphone voice processing for headsets with variable microphone array orientation |
US10796711B2 (en) * | 2017-09-29 | 2020-10-06 | Honda Motor Co., Ltd. | System and method for dynamic optical microphone |
CN109831717B (zh) * | 2017-11-23 | 2020-12-15 | 深圳市优必选科技有限公司 | 一种降噪处理方法、***及终端设备 |
JP7109207B2 (ja) * | 2018-02-23 | 2022-07-29 | パナソニックホールディングス株式会社 | 相互作用装置、相互作用方法、相互作用プログラム及びロボット |
KR102228866B1 (ko) * | 2018-10-18 | 2021-03-17 | 엘지전자 주식회사 | 로봇 및 그의 제어 방법 |
CN111239688B (zh) * | 2020-01-20 | 2021-10-26 | 南京邮电大学 | 一种基于校准源的分布式多麦克风阵列的映射校准方法 |
CN111627178A (zh) * | 2020-06-30 | 2020-09-04 | 深圳市联丰科技有限公司 | 一种声音识别定位警戒***及其方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6157403A (en) * | 1996-08-05 | 2000-12-05 | Kabushiki Kaisha Toshiba | Apparatus for detecting position of object capable of simultaneously detecting plural objects and detection method therefor |
JP2002008189A (ja) * | 2000-06-22 | 2002-01-11 | Matsushita Electric Ind Co Ltd | 車両検出装置および車両検出方法 |
JP4660773B2 (ja) * | 2004-09-14 | 2011-03-30 | 国立大学法人北海道大学 | 信号到来方向推定装置、信号到来方向推定方法、および信号到来方向推定用プログラム |
US8189765B2 (en) * | 2006-07-06 | 2012-05-29 | Panasonic Corporation | Multichannel echo canceller |
JP4234746B2 (ja) * | 2006-09-25 | 2009-03-04 | 株式会社東芝 | 音響信号処理装置、音響信号処理方法及び音響信号処理プログラム |
KR100930834B1 (ko) * | 2008-01-29 | 2009-12-10 | 한국과학기술원 | 음향 재생 장치 |
-
2010
- 2010-05-31 JP JP2010124874A patent/JP5663201B2/ja active Active
- 2010-06-01 US US12/791,423 patent/US9055356B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20100329479A1 (en) | 2010-12-30 |
JP2010281816A (ja) | 2010-12-16 |
US9055356B2 (en) | 2015-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5663201B2 (ja) | 音源方向推定装置及び音源方向推定方法 | |
CN110491403B (zh) | 音频信号的处理方法、装置、介质和音频交互设备 | |
US9191738B2 (en) | Sound enhancement method, device, program and recording medium | |
JP4247037B2 (ja) | 音声信号処理方法と装置及びプログラム | |
KR101688354B1 (ko) | 신호 소스 분리 | |
JP4774100B2 (ja) | 残響除去装置、残響除去方法、残響除去プログラム及び記録媒体 | |
JP4937622B2 (ja) | 位置標定モデルを構築するコンピュータ実施方法 | |
CN104335600B (zh) | 多麦克风移动装置中检测及切换降噪模式的方法 | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
JP2008079256A (ja) | 音響信号処理装置、音響信号処理方法及びプログラム | |
US8693287B2 (en) | Sound direction estimation apparatus and sound direction estimation method | |
CN111489753B (zh) | 抗噪声的声源定位方法、装置和计算机设备 | |
Niwa et al. | Post-filter design for speech enhancement in various noisy environments | |
CN108107403A (zh) | 一种波达方向估计方法和装置 | |
CN106537501A (zh) | 混响估计器 | |
BR112019013555A2 (pt) | Aparelho para captura de áudio, método de captura de áudio e produto de programa de computador | |
BR112019013548A2 (pt) | Aparelho de captura de áudio, método de operação para capturar áudio, e produto de programa de computador | |
CN109859769B (zh) | 一种掩码估计方法及装置 | |
CN107393549A (zh) | 时延估计方法及装置 | |
US10986444B2 (en) | Modeling room acoustics using acoustic waves | |
US20200329308A1 (en) | Voice input device and method, and program | |
Do et al. | Stochastic particle filtering: A fast SRP-PHAT single source localization algorithm | |
Abad et al. | Audio-based approaches to head orientation estimation in a smart-room. | |
US11830471B1 (en) | Surface augmented ray-based acoustic modeling | |
Kumon et al. | Motion planning based on simultaneous perturbation stochastic approximation for mobile auditory robots |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140527 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140718 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5663201 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |