JP6042900B2 - 音声信号の帯域選択的量子化方法及び装置 - Google Patents
音声信号の帯域選択的量子化方法及び装置 Download PDFInfo
- Publication number
- JP6042900B2 JP6042900B2 JP2014538688A JP2014538688A JP6042900B2 JP 6042900 B2 JP6042900 B2 JP 6042900B2 JP 2014538688 A JP2014538688 A JP 2014538688A JP 2014538688 A JP2014538688 A JP 2014538688A JP 6042900 B2 JP6042900 B2 JP 6042900B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- speech
- quantized
- code table
- inverse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013139 quantization Methods 0.000 title claims description 94
- 238000000034 method Methods 0.000 title claims description 81
- 230000015572 biosynthetic process Effects 0.000 claims description 28
- 238000003786 synthesis reaction Methods 0.000 claims description 28
- 238000004458 analytical method Methods 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 14
- 230000005484 gravity Effects 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 description 44
- 238000010586 diagram Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 21
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000005070 sampling Methods 0.000 description 18
- 230000005284 excitation Effects 0.000 description 17
- 238000001914 filtration Methods 0.000 description 11
- 239000000470 constituent Substances 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000010606 normalization Methods 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 238000007493 shaping process Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Claims (12)
- 量子化された音声帯域から抽出された音声パラメータ情報を逆量子化するステップであって、前記量子化された音声帯域は少なくとも一つの所定の固定低周波音声帯域と複数の選択された高周波音声帯域を含み、前記複数の選択された高周波音声帯域は第1の選択された高周波音声帯域と第2の選択された高周波音声帯域を含み、前記第1の選択された高周波音声帯域と前記第2の選択された高周波音声帯域は不連続である、ステップと、
前記逆量子化された音声パラメータ情報に基づいて前記量子化された音声帯域に逆変換を行うステップと、を含み、
前記量子化された音声帯域に前記逆変換を行うステップは、
第1の符号表と前記少なくとも一つの所定の固定低周波音声帯域の音声パラメータに基づいて前記逆変換を行うステップと、第2の符号表と前記複数の選択された高周波音声帯域の音声パラメータに基づいて前記逆変換を行うステップであって、前記第1の符号表は前記第2の符号表とは異なる、ステップとをさらに含み、
前記少なくとも一つの所定の固定低周波音声帯域のエネルギが平均値より高い場合、前記第1の符号表は高いエネルギを備える帯域に基づく符号表であり、前記少なくとも一つの所定の固定低周波音声帯域のエネルギが前記平均値より低い場合、前記第1の符号表は、低いエネルギを備える帯域に基づく符号表であり、
前記複数の選択された高周波音声帯域のエネルギが前記平均値より高い場合、前記第2の符号表は高いエネルギを備える帯域に基づく符号表であり、前記複数の選択された高周波音声帯域のエネルギが前記平均値より低い場合、前記第2の符号表は低いエネルギを備える帯域に基づく符号表である、音声復号方法。 - 前記選択された少なくとも一つの高周波音声帯域は、
音声帯域のエネルギの分布情報に基づいて選択されたエネルギ比重の高い周波数帯域である、請求項1に記載の音声復号方法。 - 前記逆量子化された音声パラメータ情報に基づいて逆変換を行うステップは、
逆量子化された擬似背景雑音レベルを非量子化対象の音声帯域に適用して音声信号を復元するステップを含むことを特徴とする、請求項1に記載の音声復号方法。 - 前記疑似背景雑音レベルは前記所定のしきい値と等しいかより小さいエネルギのみを用いて決定される、請求項3に記載の音声復号方法。
- 前記量子化された音声帯域から抽出された前記音声パラメータ情報を逆量子化するステップは、
分析合成(AbS)に基づいて前記音声パラメータ情報を逆量子化するステップを含む、請求項1に記載の音声復号方法。 - 前記逆量子化された音声パラメータ情報に基づいて前記逆変換を行うステップは、
前記量子化対象の高周波音声帯域に逆離散フーリエ変換(IDFT)を利用して前記逆変換を行うステップと、
前記量子化対象の低周波音声帯域に逆高速フーリエ変換(IFFT)を利用して逆変換を行うステップを含む、請求項5に記載の音声復号方法。 - 量子化された音声帯域から抽出された音声パラメータ情報を逆量子化する逆量子化部であって、前記量子化された音声帯域は少なくとも1つの所定の固定低周波音声帯域と複数の選択された高周波音声帯域を含み、前記複数の選択された高周波音声帯域は第1の選択された高周波音声帯域と第2の選択された高周波音声帯域を含み、前記第1の選択された高周波音声帯域と前記第2の選択された高周波音声帯域は不連続である、逆量子化部と、
前記逆量子化部で逆量子化された前記音声パラメータ情報に基づいて前記量子化された音声帯域に逆変換を行う逆変換部と、を備え、
前記逆変換部は、第1の符号表と前記低周波音声帯域の音声パラメータに基づいて前記逆変換をさらに行い、
前記逆変換部は、第2の符号表と前記複数の選択された高周波音声帯域の音声パラメータに基づいて前記逆変換をさらに行い、
前記第1の符号表は前記第2の符号表とは異なり、
前記少なくとも一つの所定の固定低周波音声帯域のエネルギが平均値より高い場合、前記第1の符号表は高いエネルギを備える帯域に基づく符号表であり、前記少なくとも一つの所定の固定低周波音声帯域のエネルギが前記平均値より低い場合、前記第1の符号表は、低いエネルギを備える帯域に基づく符号表であり、
前記複数の選択された高周波音声帯域のエネルギが前記平均値より高い場合、前記第2の符号表は高いエネルギを備える帯域に基づく符号表であり、前記複数の選択された高周波音声帯域のエネルギが前記平均値より低い場合、前記第2の符号表は低いエネルギを備える帯域に基づく符号表である、音声復号装置。 - 前記少なくとも1つの選択された高周波音声帯域は、音声帯域のエネルギ分布情報に基づいて選択されたエネルギ比重の高い高周波帯域である、請求項7に記載の装置。
- 前記逆量子化部は、
分析合成(AbS)に基づいて前記音声パラメータ情報を逆量子化する、請求項7に記載の装置。 - 前記逆変換部は、
前記量子化対象の高周波音声帯域に逆離散フーリエ変換(IDFT)を利用して逆変換を行い、前記量子化対象の低周波音声帯域に逆高速フーリエ変換(IFFT)を利用して逆変換を行う、請求項7に記載の装置。 - 前記逆変換部は、逆量子化した疑似背景雑音レベルを非量子化対象の音声帯域に適用して音声信号を復元する、請求項7に記載の装置。
- 前記疑似背景雑音レベルは前記所定のしきい値と等しいかより小さいエネルギのみを利用して決定する、請求項7に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161550456P | 2011-10-24 | 2011-10-24 | |
US61/550,456 | 2011-10-24 | ||
PCT/KR2012/003457 WO2013062201A1 (ko) | 2011-10-24 | 2012-05-04 | 음성 신호의 대역 선택적 양자화 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014531063A JP2014531063A (ja) | 2014-11-20 |
JP6042900B2 true JP6042900B2 (ja) | 2016-12-14 |
Family
ID=48168005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014538688A Expired - Fee Related JP6042900B2 (ja) | 2011-10-24 | 2012-05-04 | 音声信号の帯域選択的量子化方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9390722B2 (ja) |
EP (1) | EP2772911B1 (ja) |
JP (1) | JP6042900B2 (ja) |
KR (1) | KR102052144B1 (ja) |
CN (1) | CN103999153B (ja) |
WO (1) | WO2013062201A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
CN111312277B (zh) | 2014-03-03 | 2023-08-15 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码*** |
CN111862994A (zh) * | 2020-05-30 | 2020-10-30 | 北京声连网信息科技有限公司 | 一种声波信号解码的方法及装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
JP2913731B2 (ja) * | 1990-03-07 | 1999-06-28 | ソニー株式会社 | ディジタルデータの高能率符号化方法 |
EP0551705A3 (en) * | 1992-01-15 | 1993-08-18 | Ericsson Ge Mobile Communications Inc. | Method for subbandcoding using synthetic filler signals for non transmitted subbands |
JPH0946233A (ja) | 1995-07-31 | 1997-02-14 | Kokusai Electric Co Ltd | 音声符号化方法とその装置、音声復号方法とその装置 |
CA2219358A1 (en) * | 1996-02-26 | 1997-08-28 | At&T Corp. | Speech signal quantization using human auditory models in predictive coding systems |
FI116642B (fi) * | 1998-02-09 | 2006-01-13 | Nokia Corp | Puheparametrien käsittelymenetelmä, puhekoodauksen käsittely-yksikkö ja verkkoelementti |
JP2002314429A (ja) * | 2001-04-12 | 2002-10-25 | Sony Corp | 信号処理装置および信号処理方法 |
JP2003015698A (ja) * | 2001-06-29 | 2003-01-17 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号復号装置 |
JP2003065822A (ja) | 2001-08-22 | 2003-03-05 | Osaka Gas Co Ltd | 膜式ガスメータ |
JP3923783B2 (ja) * | 2001-11-02 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置及び復号化装置 |
EP1440433B1 (en) | 2001-11-02 | 2005-05-04 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
JP2003256411A (ja) | 2002-03-05 | 2003-09-12 | Nippon Hoso Kyokai <Nhk> | 引用文変換装置及びそのプログラム |
JP2003314429A (ja) | 2002-04-17 | 2003-11-06 | Energy Products Co Ltd | 風力発電機 |
JP2008519991A (ja) * | 2004-11-09 | 2008-06-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声の符号化及び復号化 |
WO2008072670A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 符号化装置、復号装置、およびこれらの方法 |
US8336557B2 (en) | 2007-11-28 | 2012-12-25 | Philip Morris Usa Inc. | Smokeless compressed tobacco product for oral consumption |
US8443269B2 (en) * | 2010-11-04 | 2013-05-14 | Himax Media Solutions, Inc. | System and method for handling forward error correction code blocks in a receiver |
-
2012
- 2012-05-04 CN CN201280062478.6A patent/CN103999153B/zh not_active Expired - Fee Related
- 2012-05-04 WO PCT/KR2012/003457 patent/WO2013062201A1/ko active Application Filing
- 2012-05-04 JP JP2014538688A patent/JP6042900B2/ja not_active Expired - Fee Related
- 2012-05-04 US US14/353,789 patent/US9390722B2/en active Active
- 2012-05-04 KR KR1020147013262A patent/KR102052144B1/ko active IP Right Grant
- 2012-05-04 EP EP12844438.7A patent/EP2772911B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
EP2772911A4 (en) | 2015-05-06 |
US20140303967A1 (en) | 2014-10-09 |
EP2772911B1 (en) | 2017-12-20 |
WO2013062201A1 (ko) | 2013-05-02 |
EP2772911A1 (en) | 2014-09-03 |
CN103999153A (zh) | 2014-08-20 |
KR20140088879A (ko) | 2014-07-11 |
CN103999153B (zh) | 2017-03-01 |
JP2014531063A (ja) | 2014-11-20 |
US9390722B2 (en) | 2016-07-12 |
KR102052144B1 (ko) | 2019-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101896504B1 (ko) | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 | |
US10811022B2 (en) | Apparatus and method for encoding/decoding for high frequency bandwidth extension | |
RU2667382C2 (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
JP6170520B2 (ja) | オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置 | |
KR102063900B1 (ko) | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 | |
KR101373004B1 (ko) | 고주파수 신호 부호화 및 복호화 장치 및 방법 | |
JP5400059B2 (ja) | オーディオ信号処理方法及び装置 | |
TWI576832B (zh) | 產生帶寬延伸訊號的裝置與方法 | |
JP6980871B2 (ja) | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 | |
JP2013528836A (ja) | 広帯域音声コーディングのためのシステム、方法、装置、およびコンピュータプログラム製品 | |
KR20130107257A (ko) | 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치 | |
MX2013004673A (es) | Codificación de señales de audio genéricas a baja tasa de bits y a retardo bajo. | |
JP6042900B2 (ja) | 音声信号の帯域選択的量子化方法及び装置 | |
KR20150032220A (ko) | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140522 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150721 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151008 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160714 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20160805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6042900 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |