JP2002513479A - ノイズを含む音声信号内のノイズモデルを探索する方法 - Google Patents
ノイズを含む音声信号内のノイズモデルを探索する方法Info
- Publication number
- JP2002513479A JP2002513479A JP50654799A JP50654799A JP2002513479A JP 2002513479 A JP2002513479 A JP 2002513479A JP 50654799 A JP50654799 A JP 50654799A JP 50654799 A JP50654799 A JP 50654799A JP 2002513479 A JP2002513479 A JP 2002513479A
- Authority
- JP
- Japan
- Prior art keywords
- model
- noise
- frame
- search
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000009467 reduction Effects 0.000 claims abstract description 8
- 238000009472 formulation Methods 0.000 claims description 24
- 239000000203 mixture Substances 0.000 claims description 24
- 238000003672 processing method Methods 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 abstract description 9
- 230000008569 process Effects 0.000 abstract description 5
- 230000007613 environmental effect Effects 0.000 description 29
- 230000015654 memory Effects 0.000 description 15
- 230000003595 spectral effect Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 6
- 101150115013 DSP1 gene Proteins 0.000 description 5
- 101150052726 DSP2 gene Proteins 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 230000003936 working memory Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 102100040489 DNA damage-regulated autophagy modulator protein 2 Human genes 0.000 description 1
- 101000968012 Homo sapiens DNA damage-regulated autophagy modulator protein 2 Proteins 0.000 description 1
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
Abstract
Description
Claims (1)
- 【特許請求の範囲】 1. ノイズを含む音声入力信号内のノイズモデルを自動的に探索する処理方法 であって、入力信号をディジタル化し、これらの信号を、発見されたモデルに基 づいて処理する方法において、入力信号を、それぞれ、P個のサンプルからなる 連続したフレームに切断し、予期した特徴のノイズを有するN個の連続したフレ ームを探索し、入力信号のノイズ除去処理に有用なノイズモデルを構築するよう に、N×P個の対応するサンプルを記憶し、かつ、新たなノイズモデルを発見す るように探索を反復して繰り返し、新旧2つのモデルのそれぞれの特徴に従って 、前のモデルの代わりに新たなモデルを記憶するか、または、前のモデルを維持 するかのいずれかにより、入力信号自体の中のノイズモデルの探索を繰り返すこ とを特徴とする処理方法。 2. ノイズモデルの探索が、相互に近似するエネルギを有し、最小値N1と最 大値N2との間に配されるN個の連続したフレームを探索し、発見したN個の連 続したフレームの平均エネルギを計算し、この平均エネルギと前に記憶されてい るアクティブモデルのフレームの平均エネルギとの比が、所定の置換しきい値よ りも小さい場合に、新たなアクティブモデルの形態で、N×P個のサンプルを記 憶することからなることを特徴とする請求項1記載の処理方法。 3. N個の連続したフレームの探索が、少なくとも、n−1個の連続したフレ ームを既に具備する定式化モデルに追加することができる最新のn番目のフレー ムのエネルギを計算するステップと、このエネルギと、前のn−1番目のフレー ムのエネルギとの比を計算するステップと、これらの比を1より小さい下位しき い値および1より大きい上位しきい値と比較するステップと、比較の結果によっ て該n番目のフレームを定式化モデルに組み込むことができるか否かを判断する ステップとを含むことを特徴とする請求項2記載の処理方法。 4. 前記N個の連続したフレームの探索が、最新のフレームのエネルギと1以 上の他の前のフレームのエネルギとの比を計算し、しきい値と比較し、比較の結 果に依存して定式化モデル内にそのフレームを組み入れることをも含むことを特 徴とする請求項3記載の処理方法。 5. n番目のフレームがモデル内に組み込まれる場合には、nがN2より小さ い場合に、モデルの定式化を続けるように、nが1だけ漸増され、反対の場合に は、モデルの定式化が中止され、n個のフレームの平均エネルギが計算され、前 記比の値に従って、前のモデルが維持され、または、定式化モデルにより置き換 えられ、新たなモデルの繰り返し探索が再開されることを特徴とする請求項3ま たは請求項4記載の処理方法。 6. 前記n番目の最新フレームが、定式化モデルに組み込まれない場合に、 − n−1個のフレームからなるモデルの定式化が中止され、 − nがN1より大きい場合には、定式化モデルのフレームの平均エネルギと 、前に記憶されているモデルのフレームの平均エネルギとの比が計算され、その 比の値に従って、前のモデルが維持され、または、新たなモデルによって置き換 えられ、 − 新たなモデルの繰り返し探索が再開されることを特徴とする請求項3また は請求項4記載の処理方法。 7. 入力信号内の会話の存在が探索され、会話の存在が検出された場合には、 新たなモデルの探索が無効にされることを特徴とする請求項1から請求項6のい ずれかに記載の処理方法。 8. 新たなモデルおよび前のモデルのそれぞれの特徴に関わりなく、新たなモ デルを強制的に採用することにより、前記探索が定期的に再初期化されることを 特徴とする請求項1から請求項7のいずれかに記載の処理方法。 9. 前記ノイズを含む信号を、発見されたモデルに基づいて、該モデルに対応 するノイズを可能な限り消滅させる観点から、スペクトルフィルタリングにより 処理することを特徴とする請求項1から請求項8のいずれかに記載の処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9708509A FR2765715B1 (fr) | 1997-07-04 | 1997-07-04 | Procede de recherche d'un modele de bruit dans des signaux sonores bruites |
FR97/08509 | 1997-07-04 | ||
PCT/FR1998/001428 WO1999001862A1 (fr) | 1997-07-04 | 1998-07-03 | Procede de recherche d'un modele de bruit dans des signaux sonores bruites |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002513479A true JP2002513479A (ja) | 2002-05-08 |
JP4338226B2 JP4338226B2 (ja) | 2009-10-07 |
Family
ID=9508879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50654799A Expired - Fee Related JP4338226B2 (ja) | 1997-07-04 | 1998-07-03 | ノイズを含む音声信号内のノイズモデルを探索する方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6438513B1 (ja) |
EP (1) | EP0993671B1 (ja) |
JP (1) | JP4338226B2 (ja) |
DE (1) | DE69806006T2 (ja) |
FR (1) | FR2765715B1 (ja) |
WO (1) | WO1999001862A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008505356A (ja) * | 2004-06-30 | 2008-02-21 | モトローラ・インコーポレイテッド | 通信システムの吸気ノイズを検出して減衰させる方法及び装置 |
JP2012132950A (ja) * | 2010-12-17 | 2012-07-12 | Fujitsu Ltd | 音声認識装置、音声認識方法および音声認識プログラム |
JP2016535312A (ja) * | 2013-09-03 | 2016-11-10 | アマゾン・テクノロジーズ、インコーポレイテッド | 高性能循環オーディオバッファ |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6633842B1 (en) * | 1999-10-22 | 2003-10-14 | Texas Instruments Incorporated | Speech recognition front-end feature extraction for noisy speech |
EP1104925A1 (en) * | 1999-12-03 | 2001-06-06 | Siemens Aktiengesellschaft | Method for processing speech signals by substracting a noise function |
EP1152399A1 (fr) * | 2000-05-04 | 2001-11-07 | Faculte Polytechniquede Mons | Traitement en sous bandes de signal de parole par réseaux de neurones |
FR2808917B1 (fr) * | 2000-05-09 | 2003-12-12 | Thomson Csf | Procede et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant |
US7072833B2 (en) * | 2000-06-02 | 2006-07-04 | Canon Kabushiki Kaisha | Speech processing system |
US6954745B2 (en) * | 2000-06-02 | 2005-10-11 | Canon Kabushiki Kaisha | Signal processing system |
US7010483B2 (en) * | 2000-06-02 | 2006-03-07 | Canon Kabushiki Kaisha | Speech processing system |
US7035790B2 (en) * | 2000-06-02 | 2006-04-25 | Canon Kabushiki Kaisha | Speech processing system |
US20020026253A1 (en) * | 2000-06-02 | 2002-02-28 | Rajan Jebu Jacob | Speech processing apparatus |
EP1170728A1 (en) * | 2000-07-05 | 2002-01-09 | Alcatel | System for adaptively reducing noise in speech signals |
BR0207553A (pt) * | 2001-02-23 | 2004-09-14 | Popcatcher Inc | Método e dispositivo para busca e gravação de sinais de mìdia |
US7062442B2 (en) * | 2001-02-23 | 2006-06-13 | Popcatcher Ab | Method and arrangement for search and recording of media signals |
GB2380644A (en) * | 2001-06-07 | 2003-04-09 | Canon Kk | Speech detection |
FR2842064B1 (fr) * | 2002-07-02 | 2004-12-03 | Thales Sa | Systeme de spatialisation de sources sonores a performances ameliorees |
SE524162C2 (sv) * | 2002-08-23 | 2004-07-06 | Rickard Berg | Förfarande för att behandla signaler |
WO2004109661A1 (ja) * | 2003-06-05 | 2004-12-16 | Matsushita Electric Industrial Co., Ltd. | 音質調整装置および音質調整方法 |
EP1494040A1 (de) * | 2003-06-30 | 2005-01-05 | Sulzer Markets and Technology AG | Verfahren zur Kompensation von Quantisierungsrauschen, sowie die Verwendung des Verfahrens |
US8718298B2 (en) * | 2003-12-19 | 2014-05-06 | Lear Corporation | NVH dependent parallel compression processing for automotive audio systems |
US7813921B2 (en) * | 2004-03-31 | 2010-10-12 | Pioneer Corporation | Speech recognition device and speech recognition method |
JP5068653B2 (ja) * | 2004-09-16 | 2012-11-07 | フランス・テレコム | 雑音のある音声信号を処理する方法および該方法を実行する装置 |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
DE102013111784B4 (de) * | 2013-10-25 | 2019-11-14 | Intel IP Corporation | Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
EP3248191B1 (en) * | 2015-01-20 | 2021-09-29 | Dolby Laboratories Licensing Corporation | Modeling and reduction of drone propulsion system noise |
CN105991900B (zh) * | 2015-02-05 | 2019-08-09 | 扬智科技股份有限公司 | 噪声检测方法和去噪方法 |
CN106067847B (zh) * | 2016-05-25 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种语音数据传输方法及装置 |
CN109087659A (zh) * | 2018-08-03 | 2018-12-25 | 三星电子(中国)研发中心 | 音频优化方法及设备 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US5029118A (en) * | 1985-12-04 | 1991-07-02 | Nissan Motor Co. Ltd. | Periodic noise canceling system and method |
FR2677828B1 (fr) | 1991-06-14 | 1993-08-20 | Sextant Avionique | Procede de detection d'un signal utile bruite. |
FR2697101B1 (fr) | 1992-10-21 | 1994-11-25 | Sextant Avionique | Procédé de détection de la parole. |
FR2704111B1 (fr) | 1993-04-16 | 1995-05-24 | Sextant Avionique | Procédé de détection énergétique de signaux noyés dans du bruit. |
US5521851A (en) * | 1993-04-26 | 1996-05-28 | Nihon Kohden Corporation | Noise reduction method and apparatus |
WO1995002288A1 (en) * | 1993-07-07 | 1995-01-19 | Picturetel Corporation | Reduction of background noise for speech enhancement |
JPH07193548A (ja) * | 1993-12-25 | 1995-07-28 | Sony Corp | 雑音低減処理方法 |
JP3453898B2 (ja) * | 1995-02-17 | 2003-10-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
JP2685031B2 (ja) * | 1995-06-30 | 1997-12-03 | 日本電気株式会社 | 雑音消去方法及び雑音消去装置 |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
FR2744871B1 (fr) | 1996-02-13 | 1998-03-06 | Sextant Avionique | Systeme de spatialisation sonore, et procede de personnalisation pour sa mise en oeuvre |
US5937381A (en) * | 1996-04-10 | 1999-08-10 | Itt Defense, Inc. | System for voice verification of telephone transactions |
US6144937A (en) * | 1997-07-23 | 2000-11-07 | Texas Instruments Incorporated | Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information |
TW333610B (en) * | 1997-10-16 | 1998-06-11 | Winbond Electronics Corp | The phonetic detecting apparatus and its detecting method |
US6216103B1 (en) * | 1997-10-20 | 2001-04-10 | Sony Corporation | Method for implementing a speech recognition system to determine speech endpoints during conditions with background noise |
US6182018B1 (en) * | 1998-08-25 | 2001-01-30 | Ford Global Technologies, Inc. | Method and apparatus for identifying sound in a composite sound signal |
US6188981B1 (en) * | 1998-09-18 | 2001-02-13 | Conexant Systems, Inc. | Method and apparatus for detecting voice activity in a speech signal |
US6108610A (en) * | 1998-10-13 | 2000-08-22 | Noise Cancellation Technologies, Inc. | Method and system for updating noise estimates during pauses in an information signal |
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
-
1997
- 1997-07-04 FR FR9708509A patent/FR2765715B1/fr not_active Expired - Fee Related
-
1998
- 1998-07-03 WO PCT/FR1998/001428 patent/WO1999001862A1/fr active IP Right Grant
- 1998-07-03 US US09/446,886 patent/US6438513B1/en not_active Expired - Lifetime
- 1998-07-03 EP EP98935094A patent/EP0993671B1/fr not_active Expired - Lifetime
- 1998-07-03 JP JP50654799A patent/JP4338226B2/ja not_active Expired - Fee Related
- 1998-07-03 DE DE69806006T patent/DE69806006T2/de not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008505356A (ja) * | 2004-06-30 | 2008-02-21 | モトローラ・インコーポレイテッド | 通信システムの吸気ノイズを検出して減衰させる方法及び装置 |
JP2012132950A (ja) * | 2010-12-17 | 2012-07-12 | Fujitsu Ltd | 音声認識装置、音声認識方法および音声認識プログラム |
JP2016535312A (ja) * | 2013-09-03 | 2016-11-10 | アマゾン・テクノロジーズ、インコーポレイテッド | 高性能循環オーディオバッファ |
Also Published As
Publication number | Publication date |
---|---|
DE69806006D1 (de) | 2002-07-18 |
EP0993671B1 (fr) | 2002-06-12 |
US6438513B1 (en) | 2002-08-20 |
FR2765715B1 (fr) | 1999-09-17 |
DE69806006T2 (de) | 2002-12-19 |
JP4338226B2 (ja) | 2009-10-07 |
FR2765715A1 (fr) | 1999-01-08 |
EP0993671A1 (fr) | 2000-04-19 |
WO1999001862A1 (fr) | 1999-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002513479A (ja) | ノイズを含む音声信号内のノイズモデルを探索する方法 | |
US6445801B1 (en) | Method of frequency filtering applied to noise suppression in signals implementing a wiener filter | |
US7065487B2 (en) | Speech recognition method, program and apparatus using multiple acoustic models | |
EP0871157B1 (en) | A method and a device for recognising speech | |
JP4440937B2 (ja) | 暗騒音存在時の音声を改善するための方法および装置 | |
US6959276B2 (en) | Including the category of environmental noise when processing speech signals | |
Viikki et al. | Cepstral domain segmental feature vector normalization for noise robust speech recognition | |
US7359838B2 (en) | Method of processing a noisy sound signal and device for implementing said method | |
EP1154405B1 (fr) | Procédé et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant | |
US7574008B2 (en) | Method and apparatus for multi-sensory speech enhancement | |
CA2502980C (en) | Noise spectrum estimation method and apparatus | |
JP3154487B2 (ja) | 音声認識の際の雑音のロバストネスを改善するためにスペクトル的推定を行う方法 | |
US7571095B2 (en) | Method and apparatus for recognizing speech in a noisy environment | |
JP2002541753A (ja) | 固定フィルタを用いた時間領域スペクトラル減算による信号雑音の低減 | |
US20020156624A1 (en) | Speech enhancement device | |
US6868378B1 (en) | Process for voice recognition in a noisy acoustic signal and system implementing this process | |
JP2000122688A (ja) | 音声処理装置及び方法 | |
CN110931040B (zh) | 过滤由语音识别***获取的声音信号 | |
JPH08160994A (ja) | 雑音抑圧装置 | |
JP2002123286A (ja) | 音声認識方法 | |
JP2001512585A (ja) | 促進されたコンボリューションノイズ除去 | |
JP3510458B2 (ja) | 音声認識システムおよび音声認識制御プログラムを記録した記録媒体 | |
JP2003271190A (ja) | 雑音除去方法、雑音除去装置及び、それを用いた音声認識装置 | |
JP2003509730A (ja) | 信号場における妨害雑音の低減方法 | |
CN110648681A (zh) | 语音增强的方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090120 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090609 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090630 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |