JP5552988B2 - 音声帯域拡張装置および音声帯域拡張方法 - Google Patents
音声帯域拡張装置および音声帯域拡張方法 Download PDFInfo
- Publication number
- JP5552988B2 JP5552988B2 JP2010216035A JP2010216035A JP5552988B2 JP 5552988 B2 JP5552988 B2 JP 5552988B2 JP 2010216035 A JP2010216035 A JP 2010216035A JP 2010216035 A JP2010216035 A JP 2010216035A JP 5552988 B2 JP5552988 B2 JP 5552988B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- signal
- unit
- snr
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 64
- 238000011156 evaluation Methods 0.000 claims description 34
- 239000004606 Fillers/Extenders Substances 0.000 claims 2
- 238000011867 re-evaluation Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 60
- 238000010586 diagram Methods 0.000 description 51
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 49
- 238000004364 calculation method Methods 0.000 description 43
- 238000001228 spectrum Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 230000002238 attenuated effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 2
- 101100000339 Arabidopsis thaliana ABCG11 gene Proteins 0.000 description 1
- 101150058882 COF1 gene Proteins 0.000 description 1
- 101100328842 Dictyostelium discoideum cofA gene Proteins 0.000 description 1
- 101100328843 Dictyostelium discoideum cofB gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- IYRWEQXVUNLMAY-UHFFFAOYSA-N carbonyl fluoride Chemical compound FC(F)=O IYRWEQXVUNLMAY-UHFFFAOYSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Circuits Of Receivers In General (AREA)
Description
前記評価部による評価結果に基づいて、前記入力信号から雑音が少ない帯域を選択する帯域選択部と、
前記帯域選択部により選択された帯域の信号を用いて、入力信号の帯域を拡張する拡張信号を生成する生成部と、
前記生成部により生成された前記拡張信号を前記入力信号に加算する加算部と
を備えたことを特徴とする音声帯域拡張装置。
前記帯域選択部により選択された帯域の周波数に応じて変化する適用ゲインを設定し、設定した適用ゲインを前記帯域選択部により選択された帯域の信号に適用することで、前記拡張信号を生成することを特徴とする付記1に記載の音声帯域拡張装置。
評価対象とする帯域幅を狭めたサブ帯域ごとの雑音レベルまたは信号対雑音比を評価し、
前記帯域選択部は、
前記評価部による評価結果に基づいて、前記入力信号から雑音が少ないサブ帯域を選択し、
前記生成部は、
前記帯域選択部により選択されたサブ帯域の信号を用いて、前記拡張信号を生成することを特徴とする付記1または2に記載の音声帯域拡張装置。
前記評価部は、前記入力信号に雑音が少ない帯域が存在しない場合に、前記メモリに記憶された過去の入力信号の帯域ごとに雑音レベルまたは信号対雑音比を評価し、
前記帯域選択部は、前記評価部による評価結果に基づいて、前記過去の入力信号から雑音が少ない帯域を選択することを特徴とする付記1〜3のいずれか1つに記載の音声帯域拡張装置。
外部から入力された入力信号の帯域ごとに雑音レベルまたは信号対雑音比を評価し、
前記雑音レベルを評価する処理による評価結果に基づいて、前記入力信号から雑音が少ない帯域を選択し、
前記帯域を選択する処理により選択された帯域の信号を用いて、入力信号の帯域を拡張するための拡張信号を生成し、
前記拡張信号を生成する処理により生成された前記拡張信号を前記入力信号に加算する
ことを特徴とする音声帯域拡張方法。
評価対象とする帯域幅を狭めたサブ帯域ごとの雑音レベルまたは信号対雑音比を評価し、
前記帯域を選択する処理は、
前記雑音レベルを評価する処理による評価結果に基づいて、前記入力信号から雑音が少ないサブ帯域を選択し、
前記拡張信号を生成する処理は、
前記帯域を選択する処理により選択されたサブ帯域の信号を用いて、前記拡張信号を生成することを特徴とする付記5または6に記載の音声帯域拡張方法。
前記帯域を選択する処理は、前記雑音レベルを評価する処理による評価結果に基づいて、前記過去の入力信号から雑音が少ない帯域を選択することを特徴とする付記5〜7のいずれか1つに記載の音声帯域拡張方法。
110 FFT部
120,320,420 SNR算出処理部
121 音声判定部
122 音声レベル更新部
123 雑音レベル更新部
124 SNR算出部
130,230,330,430 帯域選択部
140,340 拡張信号生成部
150 加算部
160 IFFT部
470 メモリ
Claims (5)
- 外部から入力された入力信号の帯域を第1の帯域幅を有する複数の分割帯域に分割し、各分割帯域について信号対雑音比を評価する評価部と、
前記評価部による評価結果に基づいて、前記入力信号から、前記信号対雑音比が閾値を超え且つ前記信号対雑音比が最大となる分割帯域、又は、前記信号対雑音比が前記閾値を超え且つ拡張ターゲット帯域に最も近い分割帯域を選択する帯域選択部と、
前記帯域選択部により選択された分割帯域の信号を用いて、入力信号の帯域を拡張する拡張信号を生成する生成部と、
前記生成部により生成された前記拡張信号を前記入力信号に加算する加算部と
を備えたことを特徴とする音声帯域拡張装置。 - 前記生成部は、前記帯域選択部により選択された分割帯域の周波数に応じて変化する適用ゲインを設定し、設定した適用ゲインを前記帯域選択部により選択された分割帯域の信号に適用することで、前記拡張信号を生成することを特徴とする請求項1に記載の音声帯域拡張装置。
- 外部から入力された入力信号の帯域を第1の帯域幅を有する複数の第1分割帯域に分割し、各第1分割帯域について信号対雑音比を評価する評価部と、
前記評価部による評価結果に基づいて、前記入力信号から、前記信号対雑音比が閾値を超える第1分割帯域を選択する帯域選択部と、
前記帯域選択部により選択された第1分割帯域の信号を用いて、入力信号の帯域を拡張する拡張信号を生成する生成部と、
前記生成部により生成された前記拡張信号を前記入力信号に加算する加算部と、
を具備し、
前記評価部は、前記評価した信号対雑音比が前記閾値を超える第1分割帯域が無い場合、前記入力信号の帯域を前記第1の帯域幅よりも狭い第2の帯域幅を有する複数の第2分割帯域に分割し、各第2分割帯域について信号対雑音比を再評価し、
前記帯域選択部は、前記評価部による再評価結果に基づいて、前記入力信号から、前記信号対雑音比が前記閾値を超える第2分割帯域を選択し、
前記生成部は、前記帯域選択部により選択された第2分割帯域の信号を用いて、前記拡張信号を生成することを特徴とする音声帯域拡張装置。 - 外部から入力された入力信号の帯域を第1の帯域幅を有する複数の分割帯域に分割し、各分割帯域について信号対雑音比を評価する評価部と、
前記評価部による評価結果に基づいて、前記入力信号から、前記信号対雑音比が閾値を超える分割帯域を選択する帯域選択部と、
前記帯域選択部により選択された分割帯域の信号を用いて、入力信号の帯域を拡張する拡張信号を生成する生成部と、
前記生成部により生成された前記拡張信号を前記入力信号に加算する加算部と
前記入力された入力信号を記憶するメモリを備え、
前記評価部は、第1の前記入力信号に前記信号対雑音比が前記閾値を超える分割帯域が存在しない場合に、前記メモリに記憶された前記第1の入力信号よりも過去の第2の入力信号の分割帯域ごとに信号対雑音比を評価し、
前記帯域選択部は、前記評価部による評価結果に基づいて、前記第2の入力信号から、前記信号対雑音比が前記閾値を超える分割帯域を選択することを特徴とする音声帯域拡張装置。 - コンピュータによって実行される音声帯域拡張方法であって、
外部から入力された入力信号の帯域を第1の帯域幅を有する複数の分割帯域に分割し、各分割帯域について信号対雑音比を評価し、
前記評価する処理による評価結果に基づいて、前記入力信号から、前記信号対雑音比が閾値を超え且つ前記信号対雑音比が最大となる分割帯域、又は、前記信号対雑音比が前記閾値を超え且つ拡張ターゲット帯域に最も近い分割帯域を選択し、
前記帯域を選択する処理により選択された分割帯域の信号を用いて、入力信号の帯域を拡張するための拡張信号を生成し、
前記拡張信号を生成する処理により生成された前記拡張信号を前記入力信号に加算する
ことを特徴とする音声帯域拡張方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010216035A JP5552988B2 (ja) | 2010-09-27 | 2010-09-27 | 音声帯域拡張装置および音声帯域拡張方法 |
US13/158,812 US20120078632A1 (en) | 2010-09-27 | 2011-06-13 | Voice-band extending apparatus and voice-band extending method |
EP11171463.0A EP2434486A3 (en) | 2010-09-27 | 2011-06-27 | Voice-band extending apparatus and voice-band extending method |
CN201110179765.2A CN102419980B (zh) | 2010-09-27 | 2011-06-29 | 语音频带扩展装置和语音频带扩展方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010216035A JP5552988B2 (ja) | 2010-09-27 | 2010-09-27 | 音声帯域拡張装置および音声帯域拡張方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012073295A JP2012073295A (ja) | 2012-04-12 |
JP5552988B2 true JP5552988B2 (ja) | 2014-07-16 |
Family
ID=44508740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010216035A Expired - Fee Related JP5552988B2 (ja) | 2010-09-27 | 2010-09-27 | 音声帯域拡張装置および音声帯域拡張方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20120078632A1 (ja) |
EP (1) | EP2434486A3 (ja) |
JP (1) | JP5552988B2 (ja) |
CN (1) | CN102419980B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6282925B2 (ja) * | 2014-05-13 | 2018-02-21 | 日本電信電話株式会社 | 音声強調装置、音声強調方法及びプログラム |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5469494A (en) * | 1994-03-02 | 1995-11-21 | Telular International, Inc. | Self-diagnostic system for cellular-transceiver systems |
US5715365A (en) * | 1994-04-04 | 1998-02-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
JPH08130494A (ja) | 1994-10-28 | 1996-05-21 | Fujitsu Ltd | 音声信号処理システム |
US5806025A (en) * | 1996-08-07 | 1998-09-08 | U S West, Inc. | Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6035048A (en) * | 1997-06-18 | 2000-03-07 | Lucent Technologies Inc. | Method and apparatus for reducing noise in speech and audio signals |
DE19743662A1 (de) * | 1997-10-02 | 1999-04-08 | Bosch Gmbh Robert | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms |
TW376611B (en) * | 1998-05-26 | 1999-12-11 | Koninkl Philips Electronics Nv | Transmission system with improved speech encoder |
DE10026904A1 (de) * | 2000-04-28 | 2002-01-03 | Deutsche Telekom Ag | Verfahren zur Berechnung des die Lautstärke mitbestimmenden Verstärkungsfaktors für ein codiert übertragenes Sprachsignal |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
JP3849116B2 (ja) | 2001-02-28 | 2006-11-22 | 富士通株式会社 | 音声検出装置及び音声検出プログラム |
EP1527442B1 (en) * | 2002-08-01 | 2006-04-05 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and audio decoding method based on spectral band replication |
US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
CN102280109B (zh) * | 2004-05-19 | 2016-04-27 | 松下电器(美国)知识产权公司 | 编码装置、解码装置及它们的方法 |
WO2006048814A1 (en) * | 2004-11-02 | 2006-05-11 | Koninklijke Philips Electronics N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
US8311840B2 (en) * | 2005-06-28 | 2012-11-13 | Qnx Software Systems Limited | Frequency extension of harmonic signals |
EP1943643B1 (en) * | 2005-11-04 | 2019-10-09 | Nokia Technologies Oy | Audio compression |
JP5055759B2 (ja) * | 2005-12-16 | 2012-10-24 | 沖電気工業株式会社 | 帯域変換信号生成器及び帯域拡張装置 |
US8612216B2 (en) * | 2006-01-31 | 2013-12-17 | Siemens Enterprise Communications Gmbh & Co. Kg | Method and arrangements for audio signal encoding |
GB2437559B (en) * | 2006-04-26 | 2010-12-22 | Zarlink Semiconductor Inc | Low complexity noise reduction method |
EP1947644B1 (en) * | 2007-01-18 | 2019-06-19 | Nuance Communications, Inc. | Method and apparatus for providing an acoustic signal with extended band-width |
KR101291672B1 (ko) * | 2007-03-07 | 2013-08-01 | 삼성전자주식회사 | 노이즈 신호 부호화 및 복호화 장치 및 방법 |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
KR101411901B1 (ko) * | 2007-06-12 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US8036891B2 (en) * | 2008-06-26 | 2011-10-11 | California State University, Fresno | Methods of identification using voice sound analysis |
WO2010028297A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
JP4783412B2 (ja) * | 2008-09-09 | 2011-09-28 | 日本電信電話株式会社 | 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体 |
GB0822537D0 (en) * | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
GB2466668A (en) * | 2009-01-06 | 2010-07-07 | Skype Ltd | Speech filtering |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
US8280725B2 (en) * | 2009-05-28 | 2012-10-02 | Cambridge Silicon Radio Limited | Pitch or periodicity estimation |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
US8321215B2 (en) * | 2009-11-23 | 2012-11-27 | Cambridge Silicon Radio Limited | Method and apparatus for improving intelligibility of audible speech represented by a speech signal |
WO2011080855A1 (ja) * | 2009-12-28 | 2011-07-07 | 三菱電機株式会社 | 音声信号復元装置および音声信号復元方法 |
-
2010
- 2010-09-27 JP JP2010216035A patent/JP5552988B2/ja not_active Expired - Fee Related
-
2011
- 2011-06-13 US US13/158,812 patent/US20120078632A1/en not_active Abandoned
- 2011-06-27 EP EP11171463.0A patent/EP2434486A3/en not_active Withdrawn
- 2011-06-29 CN CN201110179765.2A patent/CN102419980B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102419980B (zh) | 2014-04-16 |
EP2434486A2 (en) | 2012-03-28 |
CN102419980A (zh) | 2012-04-18 |
EP2434486A3 (en) | 2013-12-11 |
JP2012073295A (ja) | 2012-04-12 |
US20120078632A1 (en) | 2012-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6378274B2 (ja) | 音声/オーディオ信号処理方法および装置 | |
JP6306565B2 (ja) | 帯域幅拡張のための高周波数符号化/復号化方法及びその装置 | |
JP4945586B2 (ja) | 信号帯域拡張装置 | |
US8989403B2 (en) | Noise suppression device | |
JP6423420B2 (ja) | 帯域幅拡張方法および装置 | |
JP5127754B2 (ja) | 信号処理装置 | |
CN103325380B (zh) | 用于信号增强的增益后处理 | |
US9520144B2 (en) | Determining a harmonicity measure for voice processing | |
JP2006337415A (ja) | 雑音抑圧の方法及び装置 | |
KR101661868B1 (ko) | 오디오 신호를 위한 비트 할당 방법 및 장치 | |
CN104637491A (zh) | 用于内部mmse计算的基于外部估计的snr的修改器 | |
US9445189B2 (en) | Noise suppressing apparatus and noise suppressing method | |
JP6073456B2 (ja) | 音声強調装置 | |
US10319394B2 (en) | Apparatus and method for improving speech intelligibility in background noise by amplification and compression | |
US10991378B2 (en) | Method for reducing noise in an audio signal and a hearing device | |
CN104637490A (zh) | 基于mmse语音概率存在的准确正向snr估计 | |
JP5552988B2 (ja) | 音声帯域拡張装置および音声帯域拡張方法 | |
US11437054B2 (en) | Sample-accurate delay identification in a frequency domain | |
KR20190049954A (ko) | 신호 처리 방법 및 디바이스 | |
JP2011170190A (ja) | 信号分離装置、信号分離方法、および、信号分離プログラム | |
US9443503B2 (en) | Signal processing device, signal processing method and signal processing program | |
JP6677110B2 (ja) | 音声信号処理装置及び音声信号処理プログラム | |
JP6554853B2 (ja) | 雑音抑圧装置及びプログラム | |
JP2001216000A (ja) | 雑音抑制方法、音声信号処理方法、および信号処理回路 | |
JP2009103974A (ja) | マスキングレベル算出装置、符号化装置、マスキングレベル算出方法およびマスキングレベル算出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140320 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5552988 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |