JP5634959B2 - 雑音/残響除去装置とその方法とプログラム - Google Patents
雑音/残響除去装置とその方法とプログラム Download PDFInfo
- Publication number
- JP5634959B2 JP5634959B2 JP2011172919A JP2011172919A JP5634959B2 JP 5634959 B2 JP5634959 B2 JP 5634959B2 JP 2011172919 A JP2011172919 A JP 2011172919A JP 2011172919 A JP2011172919 A JP 2011172919A JP 5634959 B2 JP5634959 B2 JP 5634959B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- input signal
- speech enhancement
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
この実施例の音声強調処理部102は、入力信号が特徴量領域であるので、入力信号ytに直接、1次的な音声強調処理を施す。1次音声強調信号〜stを得るための処理としては、あらゆる従来の音声強調方法が適用可能であり、適用する方法は入力信号に含まれる音響歪みの種類により適切に選ばれるべきものである。例えば、残響成分を過去の信号から線形予測してパワースペクトル領域で除去する方法(参考文献2:再表2007/100137)などを用いることが出来る。
強調処理結果信頼性計算部103は、1次音声強調信号〜stと、入力信号の特徴量ytを用いて、強調音声(1次音声強調信号〜st)の不確かさを示す値Σbtを計算して出力する。不確かさを示す値Σbtは、全共分散行列を用いることも可能であるが、この実施例ではΣbtを、対角成分をゼロとする共分散行列である対角共分散行列とし、そのk番目の対角要素σkは式(2)に示すように計算する。
ここで、事例モデル記憶部104に記憶される事例モデルを生成する事例モデル生成装置200について説明する。図3に、事例モデル生成装置200の機能構成例を示す。その動作フローを図4に示す。事例モデル生成装置200は、フーリエ変換部201と、特徴量生成部202と、ガウス混合モデル学習部203と、最尤ガウス分布計算部204と、制御部205と、を具備する。事例モデル生成装置200の各部の機能は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
マッチング部105は、入力信号の特徴量ytと、その入力信号の特徴量ytに最も近い学習データのセグメントを、事例モデルMを用いて探索し、入力信号ytに含まれるクリーン音声stに一番近いクリーン音声系列を与えると思われる学習データセグメントMt u:u+τmaxを出力する。マッチング部105は、1次音声強調信号〜stの不確かさを示す値Σbtを加味して、クリーン音声に一番近いクリーン音声系列を探索するものであるが、Σbtを加味しない従来法との違いを明確にする目的で、先に、不確からしさを示す値Σbtを加味しないマッチング方法について説明する。
音声強調フィルタリング部106は、マッチング部105が出力する学習データセグメントMt u:u+τmaxと、それに対応するクリーン音声の振幅スペクトルの事例を用いてフィルタリングを行う。
この発明の雑音/残響除去装置100の性能を評価する目的で評価実験を行った。実験条件は次の通りとした。
Claims (7)
- 雑音・残響の重畳した音声ディジタル信号を入力信号として、該入力信号に1次的な音声強調処理を施した特徴量領域の1次音声強調信号を出力する音声強調処理部と、
上記入力信号の特徴量と、上記1次音声強調信号とから、上記入力信号と上記1次音声強調信号との差が大きいほど上記1次音声強調信号が不確かであることを示す値を該1次音声強調信号の不確かさを示す値として出力する強調処理結果信頼性計算部と、
学習データの事例モデルと、その振幅スペクトルデータを記憶する事例モデル記憶部と、
上記1次音声強調信号と該1次音声強調信号の不確かさを示す値と上記学習データの事例モデルとを入力として、各時間フレームに対して上記入力信号に含まれるクリーン音声に一番近いクリーン音声系列を与える学習データセグメントを出力するマッチング部と、
上記入力信号のパワースペクトルと上記学習データセグメントを入力として、該学習データセグメントと対を成す振幅スペクトルデータを上記事例モデル記憶部から読み出してウィナーフィルタを生成し、上記入力信号のパワースペクトルに上記ウィナーフィルタを乗じてフィルタリングして音声強調信号を出力する音声強調フィルタリング部と、
を具備する雑音/残響除去装置。 - 請求項1に記載の雑音/残響除去装置において、
上記強調処理結果信頼性計算部は、
上記1次音声強調信号の不確かさを示す値を、上記入力信号の特徴量と上記1次音声強調信号との差を成分とする共分散行列とすることを特徴とする雑音/残響除去装置。 - 請求項1又は2に記載した雑音/残響除去装置において、
上記マッチング部の出力する各時間フレームに対して上記入力信号に含まれるクリーン音声に一番近いクリーン音声系列を与える学習データセグメントは、上記入力信号の特徴量によく一致する学習データセグメントの中で最も長いものとすることを特徴とする雑音/残響除去装置。 - 雑音・残響の重畳した音声ディジタル信号を入力信号として、該入力信号に1次的な音声強調処理を施した特徴量領域の1次音声強調信号を出力する音声強調処理過程と、
上記入力信号の特徴量と、上記1次音声強調信号とから、上記入力信号と上記1次音声強調信号との差が大きいほど上記1次音声強調信号が不確かであることを示す値を該1次音声強調信号の不確かさを示す値として出力する強調処理結果信頼性計算過程と、
学習データの事例モデルと、その振幅スペクトルデータを記憶する事例モデル記憶部と、
上記1次音声強調信号と当該1次音声強調信号の不確かさを示す値と事例モデル記憶部に記憶された学習データの事例モデルとを入力として、各時間フレームに対して上記入力信号に含まれるクリーン音声に一番近いクリーン音声系列を与える学習データセグメントを出力するマッチング過程と、
上記入力信号のパワースペクトルと上記学習データセグメントを入力として、該学習データセグメントと対を成して記憶される振幅スペクトルデータを上記事例モデル記憶部から読み出してウィナーフィルタを生成し、上記入力信号のパワースペクトルに上記ウィナーフィルタを乗じてフィルタリングして音声強調信号を出力する音声強調フィルタリング過程と、
を備える雑音/残響除去方法。 - 請求項4に記載の雑音/残響除去方法において、
上記強調処理結果信頼性計算過程は、
上記1次音声強調信号の不確かさを示す値を、上記入力信号の特徴量と上記1次音声強調信号との差を成分とする共分散行列とすることを特徴とする雑音/残響除去方法。 - 請求項4又は5に記載した雑音/残響除去方法において、
上記マッチング過程の出力する各時間フレームに対して上記入力信号に含まれるクリーン音声に一番近いクリーン音声系列を与える学習データセグメントは、上記入力信号の特徴量によく一致する学習データセグメントの中で最も長いものとすることを特徴とする雑音/残響除去方法。 - 請求項1乃至3の何れかに記載した雑音/残響除去装置としてコンピュータを機能させ
るためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011172919A JP5634959B2 (ja) | 2011-08-08 | 2011-08-08 | 雑音/残響除去装置とその方法とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011172919A JP5634959B2 (ja) | 2011-08-08 | 2011-08-08 | 雑音/残響除去装置とその方法とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013037174A JP2013037174A (ja) | 2013-02-21 |
JP5634959B2 true JP5634959B2 (ja) | 2014-12-03 |
Family
ID=47886829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011172919A Active JP5634959B2 (ja) | 2011-08-08 | 2011-08-08 | 雑音/残響除去装置とその方法とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5634959B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6106611B2 (ja) * | 2014-01-17 | 2017-04-05 | 日本電信電話株式会社 | モデル推定装置、雑音抑圧装置、音声強調装置、これらの方法及びプログラム |
JP6139429B2 (ja) * | 2014-02-13 | 2017-05-31 | 日本電信電話株式会社 | 信号処理装置、方法及びプログラム |
JP6139430B2 (ja) * | 2014-02-13 | 2017-05-31 | 日本電信電話株式会社 | 信号処理装置、方法及びプログラム |
JP6404780B2 (ja) * | 2015-07-14 | 2018-10-17 | 日本電信電話株式会社 | ウィナーフィルタ設計装置、音強調装置、音響特徴量選択装置、これらの方法及びプログラム |
KR101934636B1 (ko) * | 2017-04-14 | 2019-01-02 | 한양대학교 산학협력단 | 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치 |
CN108538305A (zh) * | 2018-04-20 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
KR20200024066A (ko) * | 2018-08-27 | 2020-03-06 | 서강대학교산학협력단 | 스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법 |
CN110718230B (zh) * | 2019-08-29 | 2021-12-17 | 云知声智能科技股份有限公司 | 一种消除混响的方法和*** |
CN111128213B (zh) * | 2019-12-10 | 2022-09-27 | 展讯通信(上海)有限公司 | 一种分频段进行处理的噪声抑制方法及其*** |
CN112750461B (zh) * | 2020-02-26 | 2023-08-01 | 腾讯科技(深圳)有限公司 | 语音通信优化方法、装置、电子设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1993320B1 (en) * | 2006-03-03 | 2015-01-07 | Nippon Telegraph And Telephone Corporation | Reverberation removal device, reverberation removal method, reverberation removal program, and recording medium |
-
2011
- 2011-08-08 JP JP2011172919A patent/JP5634959B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013037174A (ja) | 2013-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5634959B2 (ja) | 雑音/残響除去装置とその方法とプログラム | |
CN111161752B (zh) | 回声消除方法和装置 | |
JP7274184B2 (ja) | 話者適応型モデルを実現して合成音声信号を生成するニューラルボコーダおよびニューラルボコーダの訓練方法 | |
JP6004792B2 (ja) | 音響処理装置、音響処理方法、及び音響処理プログラム | |
WO2022017040A1 (zh) | 语音合成方法及*** | |
JP6348427B2 (ja) | 雑音除去装置及び雑音除去プログラム | |
JP4705414B2 (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体 | |
JP2007065204A (ja) | 残響除去装置、残響除去方法、残響除去プログラム及びその記録媒体 | |
JP6721165B2 (ja) | 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム | |
KR102198598B1 (ko) | 합성 음성 신호 생성 방법, 뉴럴 보코더 및 뉴럴 보코더의 훈련 방법 | |
KR102198597B1 (ko) | 뉴럴 보코더 및 화자 적응형 모델을 구현하기 위한 뉴럴 보코더의 훈련 방법 | |
CN111462770A (zh) | 一种基于lstm的后期混响抑制方法及*** | |
JP6499095B2 (ja) | 信号処理方法、信号処理装置及び信号処理プログラム | |
Zheng et al. | Bandwidth extension WaveNet for bone-conducted speech enhancement | |
Mallidi et al. | Robust speaker recognition using spectro-temporal autoregressive models. | |
JP4464797B2 (ja) | 音声認識方法、この方法を実施する装置、プログラムおよびその記録媒体 | |
CN114302301A (zh) | 频响校正方法及相关产品 | |
JP6827908B2 (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
JP6000094B2 (ja) | 話者適応化装置、話者適応化方法、プログラム | |
JP6139430B2 (ja) | 信号処理装置、方法及びプログラム | |
Kim et al. | Spectral distortion model for training phase-sensitive deep-neural networks for far-field speech recognition | |
Llombart et al. | Speech enhancement with wide residual networks in reverberant environments | |
JP4242320B2 (ja) | 音声認識方法、その装置およびプログラム、その記録媒体 | |
Mudgal et al. | Template Based Real-Time Speech Recognition Using Digital Filters on DSP-TMS320F28335 | |
JP2013037177A (ja) | 音声強調装置とその方法とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140304 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140402 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5634959 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |