JP6221258B2 - 信号処理装置、方法及びプログラム - Google Patents
信号処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6221258B2 JP6221258B2 JP2013036360A JP2013036360A JP6221258B2 JP 6221258 B2 JP6221258 B2 JP 6221258B2 JP 2013036360 A JP2013036360 A JP 2013036360A JP 2013036360 A JP2013036360 A JP 2013036360A JP 6221258 B2 JP6221258 B2 JP 6221258B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- directivity
- unit
- coherence
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 74
- 238000012545 processing Methods 0.000 title claims description 62
- 238000001228 spectrum Methods 0.000 claims description 94
- 230000008569 process Effects 0.000 claims description 59
- 230000003595 spectral effect Effects 0.000 claims description 40
- 230000005236 sound signal Effects 0.000 claims description 11
- 238000012804 iterative process Methods 0.000 claims description 9
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 230000001629 suppression Effects 0.000 description 18
- 230000006399 behavior Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 9
- 230000008054 signal transmission Effects 0.000 description 9
- 238000011410 subtraction method Methods 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000009408 flooring Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
以下、本発明による信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
第1の実施形態の信号処理装置の構成及び動作を説明する前に、第1の実施形態に至った考え方、すなわち、反復スペクトル引き算処理の反復回数を適応的に制御する理由を説明する。
図1は、第1の実施形態に係る信号処理装置の構成を示すブロック図である。ここで、一対のマイクm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(信号処理プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
反復スペクトル引き算部16は、スペクトル引き算処理を、反復回数制御部15から与えられた反復回数Θ(K)だけ繰り返し実行し、雑音成分が抑圧された信号SS_out(f,K)を得て、IFFT部17に与えるものである。
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(n)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm1及びm2は図2(B)のような指向特性を持つようになる。
次に、第1の実施形態の信号処理装置1の動作を、図面を参照しながら、全体動作、反復スペクトル引き算部16における詳細動作の順に説明する。
第1の実施形態によれば、妨害音声の到来方位に応じて、反復スペクトル引き算処理の反復回数を適応的に定めて、その反復回数だけ反復スペクトル引き算処理を実行するようにしたので、音質と抑圧性能とをバランス良く実現することができる。
次に、本発明による信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
従来では、スペクトル引き算処理の反復回数が固定であった。しかし、最適な反復回数は、雑音の特性によって変動する。そのため、反復回数を固定にした場合、雑音の抑圧量が不足する恐れがある。また、反復を繰り返すたびに音声が歪み自然さが損なわれる場合があり、反復回数を徒に多くしても不都合が生じる。そのため、第2の実施形態でも、歪みやミュージカルノイズが少ない音質の自然さと、抑圧性能とがバランス良く実現されるような最適な反復回数を設定することを意図している。
図10は、第2の実施形態に係る信号処理装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
次に、第2の実施形態の信号処理装置1Aの動作を、図面を参照しながら、全体動作、反復スペクトル引き算部16Aにおける詳細動作の順に説明する。
第2の実施形態によれば、目的音声の到来方位に応じて、反復スペクトル引き算処理の反復繰り返しの終了タイミングを捉え、その終了タイミングになるまで反復スペクトル引き算処理を実行するようにしたので、音質と抑圧性能とをバランス良く実現することができる。
上述したように、スペクトル引き算処理は、上記実施形態で説明されたものに限定されるものではない。上記実施形態以外でも、スペクトル引き算処理として公知になっているものは多い。例えば、雑音信号N(f,K,p)に減算係数を乗算した後に、減算処理を行うようにしても良い。また例えば、反復スペクトル引き算後信号SS_out(f,K)にフロアリング処理を施してからIFFT部17に与えるようにしても良い。
Claims (5)
- 一対の入力音声信号の少なくとも一方に含まれている雑音成分を、反復スペクトル引き算手段がスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理装置において、
当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、
上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御する反復回数制御手段とを備え、
上記特徴量算出手段は、
当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得るコヒーレンス計算部とを備える
ことを特徴とする信号処理装置。 - 上記第1の指向性形成部及び上記第2の指向性形成部への一対の入力信号が上記一対の入力音声信号であり、
上記反復回数制御手段は、上記コヒーレンス計算部が計算したコヒーレンスに応じて反復回数を定めて、上記反復スペクトル引き算手段へ通知する
ことを特徴とする請求項1に記載の信号処理装置。 - 上記第1の指向性形成部及び上記第2の指向性形成部への一対の入力信号が、新たな反復回数のスペクトル引き算処理に供する一対の信号であり、
上記反復回数制御手段は、上記コヒーレンス計算部が計算したコヒーレンスが増大から減少に転じたときに、上記反復スペクトル引き算手段へ反復処理の終了を通知する
ことを特徴とする請求項1に記載の信号処理装置。 - 一対の入力音声信号の少なくとも一方に含まれている雑音成分を、反復スペクトル引き算手段がスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理方法において、
特徴量算出手段が、当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出し、
反復回数制御手段が、上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御し、
上記特徴量算出手段の第1の指向性形成部は、当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、
上記特徴量算出手段の第2の指向性形成部は、上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、
上記特徴量算出手段のコヒーレンス計算部は、上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得る
ことを特徴とする信号処理方法。 - 一対の入力音声信号の少なくとも一方に含まれている雑音成分をスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理装置に搭載されたコンピュータを、
当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、
上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御する反復回数制御手段として機能させ、
上記特徴量算出手段は、
当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得るコヒーレンス計算部とを備える
ことを特徴とする信号処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013036360A JP6221258B2 (ja) | 2013-02-26 | 2013-02-26 | 信号処理装置、方法及びプログラム |
PCT/JP2013/081244 WO2014132500A1 (ja) | 2013-02-26 | 2013-11-20 | 信号処理装置および方法 |
US14/770,784 US9659575B2 (en) | 2013-02-26 | 2013-11-20 | Signal processor and method therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013036360A JP6221258B2 (ja) | 2013-02-26 | 2013-02-26 | 信号処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014164191A JP2014164191A (ja) | 2014-09-08 |
JP6221258B2 true JP6221258B2 (ja) | 2017-11-01 |
Family
ID=51427790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013036360A Active JP6221258B2 (ja) | 2013-02-26 | 2013-02-26 | 信号処理装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9659575B2 (ja) |
JP (1) | JP6221258B2 (ja) |
WO (1) | WO2014132500A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6966039B2 (ja) * | 2017-10-25 | 2021-11-10 | 住友電工デバイス・イノベーション株式会社 | 試験装置 |
CN108257617B (zh) * | 2018-01-11 | 2021-01-19 | 会听声学科技(北京)有限公司 | 一种噪声场景识别***及方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5299148A (en) * | 1988-10-28 | 1994-03-29 | The Regents Of The University Of California | Self-coherence restoring signal extraction and estimation of signal direction of arrival |
JP3278486B2 (ja) | 1993-03-22 | 2002-04-30 | セコム株式会社 | 日本語音声合成システム |
JP3270866B2 (ja) * | 1993-03-23 | 2002-04-02 | ソニー株式会社 | 雑音除去方法および雑音除去装置 |
US5848105A (en) * | 1996-10-10 | 1998-12-08 | Gardner; William A. | GMSK signal processors for improved communications capacity and quality |
US6678211B2 (en) * | 1998-04-03 | 2004-01-13 | The Board Of Trustees Of The Leland Stanford Junior University | Amplified tree structure technology for fiber optic sensor arrays |
US6885746B2 (en) * | 2001-07-31 | 2005-04-26 | Telecordia Technologies, Inc. | Crosstalk identification for spectrum management in broadband telecommunications systems |
JP2004021127A (ja) * | 2002-06-19 | 2004-01-22 | Canon Inc | 磁性トナー、該トナーを用いた画像形成方法及びプロセスカートリッジ |
JP4247037B2 (ja) | 2003-01-29 | 2009-04-02 | 株式会社東芝 | 音声信号処理方法と装置及びプログラム |
US7305056B2 (en) * | 2003-11-18 | 2007-12-04 | Ibiquity Digital Corporation | Coherent tracking for FM in-band on-channel receivers |
US7453961B1 (en) * | 2005-01-11 | 2008-11-18 | Itt Manufacturing Enterprises, Inc. | Methods and apparatus for detection of signal timing |
JP4896449B2 (ja) * | 2005-06-29 | 2012-03-14 | 株式会社東芝 | 音響信号処理方法、装置及びプログラム |
FR2906070B1 (fr) * | 2006-09-15 | 2009-02-06 | Imra Europ Sas Soc Par Actions | Reduction de bruit multi-reference pour des applications vocales en environnement automobile |
WO2009078105A1 (ja) * | 2007-12-19 | 2009-06-25 | Fujitsu Limited | 雑音抑圧装置、雑音抑圧制御装置、雑音抑圧方法及び雑音抑圧プログラム |
EP2196988B1 (en) * | 2008-12-12 | 2012-09-05 | Nuance Communications, Inc. | Determination of the coherence of audio signals |
JP5263020B2 (ja) * | 2009-06-12 | 2013-08-14 | ヤマハ株式会社 | 信号処理装置 |
US8340234B1 (en) * | 2009-07-01 | 2012-12-25 | Qualcomm Incorporated | System and method for ISI based adaptive window synchronization |
JP5633673B2 (ja) * | 2010-05-31 | 2014-12-03 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
US8682006B1 (en) * | 2010-10-20 | 2014-03-25 | Audience, Inc. | Noise suppression based on null coherence |
US9185490B2 (en) * | 2010-11-12 | 2015-11-10 | Bradley M. Starobin | Single enclosure surround sound loudspeaker system and method |
US8525868B2 (en) * | 2011-01-13 | 2013-09-03 | Qualcomm Incorporated | Variable beamforming with a mobile platform |
WO2012117374A1 (en) * | 2011-03-03 | 2012-09-07 | Technion R&D Foundation | Coherent and self - coherent signal processing techniques |
JP5817366B2 (ja) * | 2011-09-12 | 2015-11-18 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
GB2495129B (en) * | 2011-09-30 | 2017-07-19 | Skype | Processing signals |
-
2013
- 2013-02-26 JP JP2013036360A patent/JP6221258B2/ja active Active
- 2013-11-20 WO PCT/JP2013/081244 patent/WO2014132500A1/ja active Application Filing
- 2013-11-20 US US14/770,784 patent/US9659575B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9659575B2 (en) | 2017-05-23 |
US20160005418A1 (en) | 2016-01-07 |
JP2014164191A (ja) | 2014-09-08 |
WO2014132500A1 (ja) | 2014-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6196320B2 (ja) | 複数の瞬間到来方向推定を用いるインフォ−ムド空間フィルタリングのフィルタおよび方法 | |
JP5805365B2 (ja) | ノイズ推定装置及び方法とそれを利用したノイズ減少装置 | |
JP5817366B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP5672770B2 (ja) | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム | |
JP5838861B2 (ja) | 音声信号処理装置、方法及びプログラム | |
WO2014054314A1 (ja) | 音声信号処理装置、方法及びプログラム | |
JP6221257B2 (ja) | 信号処理装置、方法及びプログラム | |
US11380312B1 (en) | Residual echo suppression for keyword detection | |
JP6221258B2 (ja) | 信号処理装置、方法及びプログラム | |
JP6314475B2 (ja) | 音声信号処理装置及びプログラム | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP6295650B2 (ja) | 音声信号処理装置及びプログラム | |
JP6263890B2 (ja) | 音声信号処理装置及びプログラム | |
JP6221463B2 (ja) | 音声信号処理装置及びプログラム | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP6102144B2 (ja) | 音響信号処理装置、方法及びプログラム | |
JP6252274B2 (ja) | 背景雑音区間推定装置及びプログラム | |
JP2014164192A (ja) | 信号処理装置、方法及びプログラム | |
JP2015025914A (ja) | 音声信号処理装置及びプログラム | |
JP6903947B2 (ja) | 非目的音抑圧装置、方法及びプログラム | |
JP6213324B2 (ja) | 音声信号処理装置及びプログラム | |
JP6314608B2 (ja) | エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法 | |
JP2017067990A (ja) | 音声処理装置、プログラム及び方法 | |
JP2017067950A (ja) | 音声処理装置、プログラム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6221258 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |