JPWO2008108082A1 - 音声復号装置および音声復号方法 - Google Patents
音声復号装置および音声復号方法 Download PDFInfo
- Publication number
- JPWO2008108082A1 JPWO2008108082A1 JP2009502460A JP2009502460A JPWO2008108082A1 JP WO2008108082 A1 JPWO2008108082 A1 JP WO2008108082A1 JP 2009502460 A JP2009502460 A JP 2009502460A JP 2009502460 A JP2009502460 A JP 2009502460A JP WO2008108082 A1 JPWO2008108082 A1 JP WO2008108082A1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- decoded
- high frequency
- calculation unit
- lpc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000004364 calculation method Methods 0.000 claims abstract description 219
- 238000012545 processing Methods 0.000 claims abstract description 72
- 238000001914 filtration Methods 0.000 claims abstract description 47
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 36
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 36
- 230000003321 amplification Effects 0.000 claims description 82
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 82
- 230000005236 sound signal Effects 0.000 claims description 38
- 230000005284 excitation Effects 0.000 abstract description 67
- 238000000926 separation method Methods 0.000 abstract description 17
- 230000007774 longterm Effects 0.000 description 32
- 238000001228 spectrum Methods 0.000 description 23
- 238000013139 quantization Methods 0.000 description 18
- 230000014509 gene expression Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000012937 correction Methods 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 13
- 239000000284 extract Substances 0.000 description 10
- 238000000605 extraction Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 238000012805 post-processing Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 230000002238 attenuated effect Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Description
J−H.Chen and A.Gersho,"Adaptive Postfiltering for Quality Enhancement of Coded Speech,"IEEE Trans.on Speech and Audio Process.vol.3,no.1,January 1995
(雑音レベル)=0.5×(雑音レベル)+0.5×(現フレームの復号音声信号パワー) …(1)
(雑音レベル)=0.9375×(雑音レベル)+(1−0.9375)×(現フレームの復号音声信号パワー) …(2)
K=(SNR−AA2)×(BB1−BB2)/(AA1−AA2)+BB2 …(5)
Att=(SNR−AA2)×(CC1−CC2)/(AA1−AA2)+CC2 …(6)
R=(ER−K)×Att+K …(7)
ex[i]=eh[i]+el[i] …(10)
ex’[i]=α×eh[i]+β×el[i] …(11)
Xとして閾値等を設計しなおしてもよいし、対数をとらない線形領域で設計することも可能である。
J-H. Chen and A. Gersho, "Adaptive Postfiltering for Quality Enhancement of Coded Speech," IEEE Trans. on Speech and Audio Process. vol.3, no.1, January 1995
/符号化部102、および多重化部103を備える。
処理を行い、得られる復号音源信号をLPC合成フィルタ205に出力し、復号音源信号の復号過程で得られる復号ピッチラグおよび復号ピッチゲインをモード判定部207に出力する。
(雑音レベル)=0.5×(雑音レベル)+0.5×(現フレームの復号音声信号パワー) …(1)
(雑音レベル)=0.9375×(雑音レベル)+(1−0.9375)×(現フレームの復号音声信号パワー) …(2)
域成分のエネルギー、第3エネルギー算出部298から入力される重み付き線形予測残差信号のエネルギー、および相互相関算出部299から入力される重み付き線形予測残差信号の高域成分と低域成分との相互相関を用いて、下記の式(3)に従い低域増幅係数βを算出して乗算器304に出力する。
に、第2乗算係数算出部307から入力される第2乗算係数γ2 jを乗じて、乗算結果を第2重み付きLPCとしてLPC合成フィルタ309に出力する。
K=(SNR−AA2)×(BB1−BB2)/(AA1−AA2)+BB2
…(5)Att=(SNR−AA2)×(CC1−CC2)/(AA1−AA2)+CC2
…(6)
とAttが小さくなるので、高域強調処理後のレベル比Rも小さくなる。レベル比が低いほどスペクトルはフラットに近づき、高域が持ち上げられる(すなわち強調される)ことになる。したがって、AttもKも、SNRが高くなると高域強調の強さが弱くなり、SNRが低くなると高域強調の強さが強くなるように、高域強調係数を制御するパラメータとして機能する。
R=(ER−K)×Att+K …(7)
ex[i]=eh[i]+el[i] …(10)
ex’[i]=α×eh[i]+β×el[i] …(11)
Xとして閾値等を設計しなおしてもよいし、対数をとらない線形領域で設計することも可能である。
Claims (3)
- 音声信号を符号化して得られた符号化データを復号して復号音声信号を得る音声復号手段と、
前記復号音声信号のモードが定常雑音区間であるか否かを一定時間毎に判定するモード判定手段と、
前記復号音声信号のパワーを算出するパワー算出手段と、
前記モード判定手段におけるモード判定結果と、前記復号音声信号のパワーとを用いて復号音声信号のSNR(Signal to Noise Ratio)を算出するSNR算出手段と、
前記SNRを用いて音源信号の高域強調処理を含むポストフィルタリング処理を行うポストフィルタリング手段と、
を具備する音声復号装置。 - 前記ポストフィルタリング手段は、
前記復号音声信号に対しLPC逆フィルタリング処理を行い線形予測残差信号を得るLPC逆フィルタリング手段と、
前記SNRを用いて高域強調係数を算出する高域強調係数算出手段と、
前記高域強調係数を用いて低域増幅係数と、高域増幅係数とを算出する増幅係数算出手段と、
前記低域増幅係数を用いて線形予測残差信号の低域成分を増幅して得られる低域増幅信号と、前記高域増幅係数を用いて線形予測残差信号の高域成分を増幅して得られる高域増幅信号とを加算し、高域強調後の線形予測残差信号を得る高域強調処理手段と、
前記高域強調後の線形予測残差信号に対しLPC合成フィルタリング処理を行うLPC合成フィルタリング手段と、
を具備する請求項1記載の音声復号装置。 - 音声信号を符号化して得られた符号化データを復号して復号音声信号を得るステップと、
前記復号音声信号のモードが定常雑音区間であるか否かを一定時間毎に判定するステップと、
前記復号音声信号のパワーを算出するステップと、
前記モード判定手段におけるモード判定結果と、前記復号音声信号のパワーとを用いて復号音声信号のSNRを算出するステップと、
前記SNRを用いて音源信号の高域強調処理を含むポストフィルタリング処理を行うステップと、
を具備する音声復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009502460A JP5164970B2 (ja) | 2007-03-02 | 2008-02-29 | 音声復号装置および音声復号方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007053531 | 2007-03-02 | ||
JP2007053531 | 2007-03-02 | ||
JP2009502460A JP5164970B2 (ja) | 2007-03-02 | 2008-02-29 | 音声復号装置および音声復号方法 |
PCT/JP2008/000406 WO2008108082A1 (ja) | 2007-03-02 | 2008-02-29 | 音声復号装置および音声復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008108082A1 true JPWO2008108082A1 (ja) | 2010-06-10 |
JP5164970B2 JP5164970B2 (ja) | 2013-03-21 |
Family
ID=39737980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009502460A Expired - Fee Related JP5164970B2 (ja) | 2007-03-02 | 2008-02-29 | 音声復号装置および音声復号方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8554548B2 (ja) |
EP (1) | EP2116997A4 (ja) |
JP (1) | JP5164970B2 (ja) |
CN (1) | CN101617362B (ja) |
WO (1) | WO2008108082A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10720170B2 (en) | 2016-02-17 | 2020-07-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
US11929084B2 (en) | 2014-07-28 | 2024-03-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor with full-band gap filling and a time domain processor |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4235660B1 (en) * | 2008-07-11 | 2024-06-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder |
US9253568B2 (en) * | 2008-07-25 | 2016-02-02 | Broadcom Corporation | Single-microphone wind noise suppression |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
EP3971893B1 (en) * | 2010-07-02 | 2024-06-19 | Dolby International AB | Audio decoding with selective post filter |
TWI815599B (zh) * | 2011-04-22 | 2023-09-11 | 美商惠氏有限責任公司 | 與難養芽胞梭菌(Clostridium difficile)之突變毒素有關之組成物及彼之方法 |
WO2013019562A2 (en) * | 2011-07-29 | 2013-02-07 | Dts Llc. | Adaptive voice intelligibility processor |
WO2013108343A1 (ja) * | 2012-01-20 | 2013-07-25 | パナソニック株式会社 | 音声復号装置及び音声復号方法 |
US9576590B2 (en) * | 2012-02-24 | 2017-02-21 | Nokia Technologies Oy | Noise adaptive post filtering |
KR101629661B1 (ko) * | 2012-08-29 | 2016-06-13 | 니폰 덴신 덴와 가부시끼가이샤 | 복호 방법, 복호 장치, 프로그램 및 그 기록매체 |
CN105976830B (zh) * | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
US20150025894A1 (en) * | 2013-07-16 | 2015-01-22 | Electronics And Telecommunications Research Institute | Method for encoding and decoding of multi channel audio signal, encoder and decoder |
WO2015079946A1 (ja) * | 2013-11-29 | 2015-06-04 | ソニー株式会社 | 周波数帯域拡大装置および方法、並びにプログラム |
US9838737B2 (en) * | 2016-05-05 | 2017-12-05 | Google Inc. | Filtering wind noises in video content |
CN116312601B (zh) * | 2023-05-22 | 2023-08-29 | 北京探境科技有限公司 | 音频处理方法、装置、存储介质及电子设备 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263099A (ja) * | 1995-03-23 | 1996-10-11 | Toshiba Corp | 符号化装置 |
JPH09281995A (ja) | 1996-04-12 | 1997-10-31 | Nec Corp | 信号符号化装置及び方法 |
US6092041A (en) * | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
DE19643900C1 (de) * | 1996-10-30 | 1998-02-12 | Ericsson Telefon Ab L M | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
JPH10171497A (ja) * | 1996-12-12 | 1998-06-26 | Oki Electric Ind Co Ltd | 背景雑音除去装置 |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
US6240383B1 (en) * | 1997-07-25 | 2001-05-29 | Nec Corporation | Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal |
WO1999062056A1 (fr) * | 1998-05-27 | 1999-12-02 | Ntt Mobile Communications Network Inc. | Decodeur vocal et procede de decodage vocal |
US6385573B1 (en) | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
US6377915B1 (en) * | 1999-03-17 | 2002-04-23 | Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. | Speech decoding using mix ratio table |
US7423983B1 (en) * | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
US7478042B2 (en) * | 2000-11-30 | 2009-01-13 | Panasonic Corporation | Speech decoder that detects stationary noise signal regions |
JP3566220B2 (ja) * | 2001-03-09 | 2004-09-15 | 三菱電機株式会社 | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 |
CN1243424C (zh) * | 2002-05-31 | 2006-02-22 | 上海贝尔有限公司 | 宽带码分多址移动通信***下行链路信噪比估计装置及估计方法 |
JP4365610B2 (ja) * | 2003-03-31 | 2009-11-18 | パナソニック株式会社 | 音声復号化装置および音声復号化方法 |
DE60330715D1 (de) * | 2003-05-01 | 2010-02-04 | Fujitsu Ltd | Sprachdecodierer, sprachdecodierungsverfahren, programm,aufzeichnungsmedium |
AU2003274864A1 (en) * | 2003-10-24 | 2005-05-11 | Nokia Corpration | Noise-dependent postfiltering |
US7848921B2 (en) | 2004-08-31 | 2010-12-07 | Panasonic Corporation | Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof |
JP4781272B2 (ja) | 2004-09-17 | 2011-09-28 | パナソニック株式会社 | 音声符号化装置、音声復号装置、通信装置及び音声符号化方法 |
JP4732730B2 (ja) | 2004-09-30 | 2011-07-27 | パナソニック株式会社 | 音声復号装置 |
JP4613746B2 (ja) | 2005-08-17 | 2011-01-19 | 三菱電機株式会社 | 被写体存在証明サービスシステム |
JPWO2007088853A1 (ja) | 2006-01-31 | 2009-06-25 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
JP5061111B2 (ja) * | 2006-09-15 | 2012-10-31 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
-
2008
- 2008-02-29 CN CN200880005495XA patent/CN101617362B/zh not_active Expired - Fee Related
- 2008-02-29 WO PCT/JP2008/000406 patent/WO2008108082A1/ja active Application Filing
- 2008-02-29 JP JP2009502460A patent/JP5164970B2/ja not_active Expired - Fee Related
- 2008-02-29 US US12/528,878 patent/US8554548B2/en active Active
- 2008-02-29 EP EP08710509A patent/EP2116997A4/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11929084B2 (en) | 2014-07-28 | 2024-03-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor with full-band gap filling and a time domain processor |
US10720170B2 (en) | 2016-02-17 | 2020-07-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
US11094331B2 (en) | 2016-02-17 | 2021-08-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
Also Published As
Publication number | Publication date |
---|---|
US8554548B2 (en) | 2013-10-08 |
JP5164970B2 (ja) | 2013-03-21 |
EP2116997A4 (en) | 2011-11-23 |
EP2116997A1 (en) | 2009-11-11 |
CN101617362B (zh) | 2012-07-18 |
CN101617362A (zh) | 2009-12-30 |
WO2008108082A1 (ja) | 2008-09-12 |
US20100100373A1 (en) | 2010-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5164970B2 (ja) | 音声復号装置および音声復号方法 | |
JP5061111B2 (ja) | 音声符号化装置および音声符号化方法 | |
US9454974B2 (en) | Systems, methods, and apparatus for gain factor limiting | |
JP5688852B2 (ja) | オーディオコーデックポストフィルタ | |
WO2007000988A1 (ja) | スケーラブル復号装置および消失データ補間方法 | |
WO2009142466A2 (ko) | 오디오 신호 처리 방법 및 장치 | |
US9082398B2 (en) | System and method for post excitation enhancement for low bit rate speech coding | |
JPWO2008072701A1 (ja) | ポストフィルタおよびフィルタリング方法 | |
US9589576B2 (en) | Bandwidth extension of audio signals | |
HUE031761T2 (en) | Systems and procedures for performing noise modulation and gain adjustment | |
JP5291004B2 (ja) | 通信ネットワークにおける方法及び装置 | |
EP3281197B1 (en) | Audio encoder and method for encoding an audio signal | |
JPWO2007037359A1 (ja) | 音声符号化装置および音声符号化方法 | |
Grancharov et al. | Noise-dependent postfiltering | |
JPWO2008072733A1 (ja) | 符号化装置および符号化方法 | |
KR101170466B1 (ko) | Mdct 영역에서의 후처리 방법, 및 장치 | |
Hennix | Decoder based noise suppression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121218 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5164970 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |