JP5809066B2 - 音声符号化装置および音声符号化方法 - Google Patents
音声符号化装置および音声符号化方法 Download PDFInfo
- Publication number
- JP5809066B2 JP5809066B2 JP2011549936A JP2011549936A JP5809066B2 JP 5809066 B2 JP5809066 B2 JP 5809066B2 JP 2011549936 A JP2011549936 A JP 2011549936A JP 2011549936 A JP2011549936 A JP 2011549936A JP 5809066 B2 JP5809066 B2 JP 5809066B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- encoding
- coefficient
- unit
- weighting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 19
- 230000003595 spectral effect Effects 0.000 claims description 105
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000001228 spectrum Methods 0.000 description 36
- 238000004458 analytical method Methods 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 19
- 230000000873 masking effect Effects 0.000 description 16
- 238000000926 separation method Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000005284 excitation Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図10Aに本実施の形態に係る音声符号化装置1000Aの構成を示す。また、図10Bに本実施の形態に係る音声復号装置1000Bの構成を示す。
図13Aに本実施の形態に係る音声符号化装置1300Aの構成を示す。また、図13Bに本実施の形態に係る音声復号装置1300Bの構成を示す。
図16Aに本実施の形態に係る音声符号化装置1600Aの構成を示す。また、図16Bに本実施の形態に係る音声復号装置1600Bの構成を示す。
1000B 音声復号装置
1001 時間−周波数変換部
1002 心理音響モデル分析部
1003 聴覚重み付け部
1004 符号化部
1005 多重化部
1006 分離部
1007 復号部
1008 周波数−時間変換部
1101 推定部
1102 重み係数算出部
1103 重み付け部
1300A 音声符号化装置
1300B 音声復号装置
1301 LPC分析部
1302 符号化部
1303 復号部
1304 逆フィルタ部
1305 時間−周波数変換部
1306 時間−周波数変換部
1307 聴覚重み付け部
1308 符号化部
1309 多重化部
1310 分離部
1311 復号部
1312 周波数−時間変換部
1313 LPC係数復号部
1314 合成フィルタ
1401 心理音響モデル分析部
1600A 音声符号化装置
1600B 音声復号装置
1601 CELP符号化部
1602 CELP復号部
1603 時間−周波数変換部
1604 時間−周波数変換部
1605 聴覚重み付け部
1606 符号化部
1607 多重化部
1608 分離部
1609 CELP復号部
1610 復号部
1611 周波数−時間変換部
1612 減算器
1613 加算器
1701 心理音響モデル分析部
1801 SNR算出部
1802 推定部
1803 重み係数算出部
1804 重み付け部
1805 加算器
Claims (2)
- 少なくとも低位レイヤおよび高位レイヤの2階層よりなる階層符号化を行う音声符号化装置であって、
入力信号と前記低位レイヤの復号信号との誤差信号を生成する生成手段と、
前記入力信号および前記誤差信号を用いて信号対雑音比を算出し、前記信号対雑音比に基づいて、前記誤差信号における互いに異なる周波数の複数のスペクトル係数それぞれの聴覚上の重要度を推定する推定手段と、
推定された各重要度に基づいて、前記複数のスペクトル係数それぞれの重み付け係数を算出する算出手段と、
算出された各重み付け係数を用いて、前記複数のスペクトル係数それぞれを重み付けする重み付け手段と、
重み付けされた前記複数のスペクトル係数を符号化する符号化手段と、
を具備する音声符号化装置。 - 少なくとも低位レイヤおよび高位レイヤの2階層よりなる階層符号化を行う音声符号化方法であって、
入力信号と前記低位レイヤの復号信号との誤差信号を生成するステップと、
前記入力信号および前記誤差信号を用いて信号対雑音比を算出し、前記信号対雑音比に基づいて、前記誤差信号における互いに異なる周波数の複数のスペクトル係数それぞれの聴覚上の重要度を推定するステップと、
推定された各重要度に基づいて、前記複数のスペクトル係数それぞれの重み付け係数を算出するステップと、
算出された各重み付け係数を用いて、前記複数のスペクトル係数それぞれを重み付けするステップと、
重み付けされた前記複数のスペクトル係数を符号化するステップと、
を具備する音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011549936A JP5809066B2 (ja) | 2010-01-14 | 2011-01-13 | 音声符号化装置および音声符号化方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010006312 | 2010-01-14 | ||
JP2010006312 | 2010-01-14 | ||
PCT/JP2011/000134 WO2011086924A1 (ja) | 2010-01-14 | 2011-01-13 | 音声符号化装置および音声符号化方法 |
JP2011549936A JP5809066B2 (ja) | 2010-01-14 | 2011-01-13 | 音声符号化装置および音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011086924A1 JPWO2011086924A1 (ja) | 2013-05-16 |
JP5809066B2 true JP5809066B2 (ja) | 2015-11-10 |
Family
ID=44304200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011549936A Active JP5809066B2 (ja) | 2010-01-14 | 2011-01-13 | 音声符号化装置および音声符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20130030796A1 (ja) |
EP (1) | EP2525355B1 (ja) |
JP (1) | JP5809066B2 (ja) |
WO (1) | WO2011086924A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081927B (zh) * | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及*** |
PL2933799T3 (pl) | 2012-12-13 | 2017-12-29 | Panasonic Intellectual Property Corporation Of America | Urządzenie kodujące głos, urządzenie dekodujące głos, sposób kodowania głosu i sposób dekodowania głosu |
CN105408957B (zh) * | 2013-06-11 | 2020-02-21 | 弗朗霍弗应用研究促进协会 | 进行语音信号的频带扩展的装置及方法 |
KR102315920B1 (ko) * | 2013-09-16 | 2021-10-21 | 삼성전자주식회사 | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
CN105745703B (zh) | 2013-09-16 | 2019-12-10 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
US9401823B2 (en) * | 2013-11-26 | 2016-07-26 | Plusn Llc | System and method for radio frequency carrier aggregation |
EP3040987B1 (en) * | 2013-12-02 | 2019-05-29 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
TWI569257B (zh) * | 2014-07-04 | 2017-02-01 | 玄舟科技有限公司 | 音訊處理裝置及其音訊處理方法 |
PT3413307T (pt) * | 2014-07-25 | 2020-10-19 | Fraunhofer Ges Forschung | Aparelho de codificação de sinal de áudio, dispositivo de descodificação de sinal de áudio, e seus métodos |
MX356371B (es) * | 2014-07-25 | 2018-05-25 | Fraunhofer Ges Forschung | Dispositivo de codificacion de señal acustica, dispositivo de decodificacion de señal acustica, metodo para codificar una señal acustica y metodo para decodificar una señal acustica. |
CN106448688B (zh) * | 2014-07-28 | 2019-11-05 | 华为技术有限公司 | 音频编码方法及相关装置 |
CN113196387A (zh) * | 2019-01-13 | 2021-07-30 | 华为技术有限公司 | 高分辨率音频编解码 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1020898A (ja) * | 1996-07-01 | 1998-01-23 | Matsushita Electric Ind Co Ltd | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
JP2001331198A (ja) * | 2000-05-22 | 2001-11-30 | Nippon Telegr & Teleph Corp <Ntt> | 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体 |
JP2006011170A (ja) * | 2004-06-28 | 2006-01-12 | Sony Corp | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
WO2006075563A1 (ja) * | 2005-01-11 | 2006-07-20 | Nec Corporation | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
JP2007193043A (ja) * | 2006-01-18 | 2007-08-02 | Casio Comput Co Ltd | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7146313B2 (en) * | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7725313B2 (en) * | 2004-09-13 | 2010-05-25 | Ittiam Systems (P) Ltd. | Method, system and apparatus for allocating bits in perceptual audio coders |
MX2007005261A (es) * | 2004-11-04 | 2007-07-09 | Koninkl Philips Electronics Nv | Codificacion y descodificacion de un conjunto de senales. |
KR100707173B1 (ko) * | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US8046218B2 (en) * | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
US8396707B2 (en) * | 2007-09-28 | 2013-03-12 | Voiceage Corporation | Method and device for efficient quantization of transform information in an embedded speech and audio codec |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
JP5508692B2 (ja) | 2008-06-30 | 2014-06-04 | 日本プラスト株式会社 | フェンダープロテクタを取付けた車両 |
FR2947944A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Codage/decodage perfectionne de signaux audionumeriques |
-
2011
- 2011-01-13 WO PCT/JP2011/000134 patent/WO2011086924A1/ja active Application Filing
- 2011-01-13 EP EP11732797.3A patent/EP2525355B1/en active Active
- 2011-01-13 US US13/521,590 patent/US20130030796A1/en not_active Abandoned
- 2011-01-13 JP JP2011549936A patent/JP5809066B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1020898A (ja) * | 1996-07-01 | 1998-01-23 | Matsushita Electric Ind Co Ltd | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
JP2001331198A (ja) * | 2000-05-22 | 2001-11-30 | Nippon Telegr & Teleph Corp <Ntt> | 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体 |
JP2006011170A (ja) * | 2004-06-28 | 2006-01-12 | Sony Corp | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
WO2006075563A1 (ja) * | 2005-01-11 | 2006-07-20 | Nec Corporation | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
JP2007193043A (ja) * | 2006-01-18 | 2007-08-02 | Casio Comput Co Ltd | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2525355A4 (en) | 2016-11-02 |
US20130030796A1 (en) | 2013-01-31 |
WO2011086924A1 (ja) | 2011-07-21 |
EP2525355A1 (en) | 2012-11-21 |
EP2525355B1 (en) | 2017-11-01 |
JPWO2011086924A1 (ja) | 2013-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5809066B2 (ja) | 音声符号化装置および音声符号化方法 | |
JP6170520B2 (ja) | オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置 | |
RU2667382C2 (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
JP5695074B2 (ja) | 音声符号化装置および音声復号化装置 | |
RU2485606C2 (ru) | Схема кодирования/декодирования аудио сигналов с низким битрейтом с применением каскадных переключений | |
JP5863868B2 (ja) | 適応的正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 | |
KR101411901B1 (ko) | 오디오 신호의 부호화/복호화 방법 및 장치 | |
WO2014115225A1 (ja) | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 | |
KR101792712B1 (ko) | 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조 | |
WO2013168414A1 (ja) | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 | |
JPWO2007088853A1 (ja) | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 | |
US9786292B2 (en) | Audio encoding apparatus, audio decoding apparatus, audio encoding method, and audio decoding method | |
JP5629319B2 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
JP6042900B2 (ja) | 音声信号の帯域選択的量子化方法及び装置 | |
Song et al. | Harmonic enhancement in low bitrate audio coding using an efficient long-term predictor | |
JP4354561B2 (ja) | オーディオ信号符号化装置及び復号化装置 | |
WO2011052221A1 (ja) | 符号化装置、復号装置、およびそれらの方法 | |
Motlicek et al. | Wide-band audio coding based on frequency-domain linear prediction | |
Ko | Transform coding based on source filter model in the MDCT domain | |
Lee et al. | Bandwidth Extension of a Narrowband Speech Coder for Music Streaming Services Over IP Networks | |
KR20120089230A (ko) | 신호 복호화 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140527 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140723 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150518 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20150525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150910 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5809066 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |