JP4887288B2 - 音声符号化装置および音声符号化方法 - Google Patents
音声符号化装置および音声符号化方法 Download PDFInfo
- Publication number
- JP4887288B2 JP4887288B2 JP2007510437A JP2007510437A JP4887288B2 JP 4887288 B2 JP4887288 B2 JP 4887288B2 JP 2007510437 A JP2007510437 A JP 2007510437A JP 2007510437 A JP2007510437 A JP 2007510437A JP 4887288 B2 JP4887288 B2 JP 4887288B2
- Authority
- JP
- Japan
- Prior art keywords
- amplitude ratio
- quantization
- delay difference
- prediction parameter
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 8
- 238000013139 quantization Methods 0.000 claims description 100
- 239000013598 vector Substances 0.000 claims description 33
- 238000004891 communication Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 description 31
- 230000005236 sound signal Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 7
- 230000004807 localization Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000012792 core layer Substances 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 239000010410 layer Substances 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 206010021403 Illusion Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Ramprashad, S.A., "Stereophonic CELP coding using cross channel prediction", Proc. IEEE Workshop on Speech Coding, pp.136-138, Sep. 2000.
本実施の形態に係る音声符号化装置の構成を図1に示す。図1に示す音声符号化装置10は、第1ch符号化部11、第1ch復号部12、第2ch予測部13、減算器14、および、第2ch予測残差符号化部15を備える。なお、以下の説明では、フレーム単位での動作を前提にして説明する。
め、第2ch予測残差符号化部15に出力する。
量子化ビット数で同等の量子化歪みを実現する。
構成例1(図3)では、遅延差Dと振幅比gを2次元ベクトルとして表し、その2次元ベクトルに対してベクトル量子化を行う。図4は、この2次元ベクトルを点(○)で表した符号ベクトルの特性図である。
構成例2(図5)では、遅延差Dから振幅比gを推定する関数を予め定め、遅延差Dを量子化後、その量子化値からその関数を用いて推定した振幅比に対する予測残差を量子化する。
本実施の形態に係る音声符号化装置は、実施の形態1と、予測パラメータ量子化部22(図2、3、5)の構成が異なる。本実施の形態における予測パラメータの量子化では、遅延差および振幅比の量子化において、双方のパラメータの量子化誤差が聴感的に相互に打ち消しあう方向に生じるような量子化を行う。すなわち、遅延差の量子化誤差が正の方向に生じる場合は振幅比の量子化誤差がより大きくなるように量子化し、逆に、遅延差の量子化誤差が負の方向に生じる場合は振幅比の量子化誤差がより小さくなるように量子化する。
構成例3(図7)は、歪みの算出において構成例1(図3)と異なる。なお、図7においては、図3と同一の構成部分には同一符号を付し説明を省略する。
構成例4(図9)は、遅延差の量子化誤差を踏まえて聴感的に等価な値へと補正した振幅比(補正振幅比)に対する推定残差を量子化する点において、構成例2(図5)と異なる。なお、図9においては、図5と同一の構成部分には同一符号を付し説明を省略する。
力される。
遅延差Dと振幅比gとをそれぞれ独立に量子化する場合においても、本実施の形態のように、遅延差と振幅比に関する聴感的特性を利用するようにしてもよい。この場合の予測パラメータ量子化部22の構成は、図11に示すようになる。なお、図11において、構成例4(図9)と同一の構成部分には同一符号を付す。
Claims (8)
- 第1信号と第2信号との間の遅延差および振幅比を予測パラメータとして求める予測パラメータ分析手段と、
前記遅延差と前記振幅比との間の相関性に基づいて前記予測パラメータから量子化予測パラメータを得る量子化手段と、
を具備する音声符号化装置。 - 前記量子化手段は、前記振幅比の、前記遅延差から推定される振幅比に対する残差を量子化して前記量子化予測パラメータを得る、
請求項1記載の音声符号化装置。 - 前記量子化手段は、前記遅延差の、前記振幅比から推定される遅延差に対する残差を量子化して前記量子化予測パラメータを得る、
請求項1記載の音声符号化装置。 - 前記量子化手段は、前記遅延差の量子化誤差と前記振幅比の量子化誤差とが聴感的に相互に打ち消しあう方向に生じる量子化を行って前記量子化予測パラメータを得る、
請求項1記載の音声符号化装置。 - 前記量子化手段は、前記遅延差と前記振幅比とからなる2次元ベクトルを用いて前記量子化予測パラメータを得る、
請求項1記載の音声符号化装置。 - 請求項1記載の音声符号化装置を具備する無線通信移動局装置。
- 請求項1記載の音声符号化装置を具備する無線通信基地局装置。
- 第1信号と第2信号との間の遅延差および振幅比を予測パラメータとして求め、
前記遅延差と前記振幅比との間の相関性に基づいて前記予測パラメータから量子化予測パラメータを得る、
音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007510437A JP4887288B2 (ja) | 2005-03-25 | 2006-03-23 | 音声符号化装置および音声符号化方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005088808 | 2005-03-25 | ||
JP2005088808 | 2005-03-25 | ||
JP2007510437A JP4887288B2 (ja) | 2005-03-25 | 2006-03-23 | 音声符号化装置および音声符号化方法 |
PCT/JP2006/305871 WO2006104017A1 (ja) | 2005-03-25 | 2006-03-23 | 音声符号化装置および音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006104017A1 JPWO2006104017A1 (ja) | 2008-09-04 |
JP4887288B2 true JP4887288B2 (ja) | 2012-02-29 |
Family
ID=37053274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007510437A Expired - Fee Related JP4887288B2 (ja) | 2005-03-25 | 2006-03-23 | 音声符号化装置および音声符号化方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8768691B2 (ja) |
EP (1) | EP1858006B1 (ja) |
JP (1) | JP4887288B2 (ja) |
CN (1) | CN101147191B (ja) |
ES (1) | ES2623551T3 (ja) |
WO (1) | WO2006104017A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007332508B2 (en) * | 2006-12-13 | 2012-08-16 | Iii Holdings 12, Llc | Encoding device, decoding device, and method thereof |
US20100100372A1 (en) * | 2007-01-26 | 2010-04-22 | Panasonic Corporation | Stereo encoding device, stereo decoding device, and their method |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
EP2133872B1 (en) | 2007-03-30 | 2012-02-29 | Panasonic Corporation | Encoding device and encoding method |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
EP3779979B1 (en) * | 2010-04-13 | 2023-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoding method for processing stereo audio signals using a variable prediction direction |
JP5799824B2 (ja) * | 2012-01-18 | 2015-10-28 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
KR102169435B1 (ko) * | 2016-03-21 | 2020-10-23 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 가중된 행렬 계수의 적응형 양자화 |
CN107358959B (zh) * | 2016-05-10 | 2021-10-26 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US11176954B2 (en) * | 2017-04-10 | 2021-11-16 | Nokia Technologies Oy | Encoding and decoding of multichannel or stereo audio signals |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004509365A (ja) * | 2000-09-15 | 2004-03-25 | テレフオンアクチーボラゲツト エル エム エリクソン | 複数チャネル信号の符号化及び復号化 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS52116103A (en) * | 1976-03-26 | 1977-09-29 | Kokusai Denshin Denwa Co Ltd | Multistage selection dpcm system |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JP3180762B2 (ja) * | 1998-05-11 | 2001-06-25 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
JP3898184B2 (ja) * | 2001-12-25 | 2007-03-28 | 株式会社エヌ・ティ・ティ・ドコモ | 信号符号化装置、信号符号化方法、プログラム |
ES2300567T3 (es) | 2002-04-22 | 2008-06-16 | Koninklijke Philips Electronics N.V. | Representacion parametrica de audio espacial. |
BRPI0304542B1 (pt) * | 2002-04-22 | 2018-05-08 | Koninklijke Philips Nv | Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado |
US7542896B2 (en) * | 2002-07-16 | 2009-06-02 | Koninklijke Philips Electronics N.V. | Audio coding/decoding with spatial parameters and non-uniform segmentation for transients |
JP4431568B2 (ja) * | 2003-02-11 | 2010-03-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声符号化 |
CN1898724A (zh) * | 2003-12-26 | 2007-01-17 | 松下电器产业株式会社 | 语音/乐音编码设备及语音/乐音编码方法 |
ATE395686T1 (de) * | 2004-04-05 | 2008-05-15 | Koninkl Philips Electronics Nv | Mehrkanal-codierer |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
CN1981326B (zh) * | 2004-07-02 | 2011-05-04 | 松下电器产业株式会社 | 音频信号解码装置和方法及音频信号编码装置和方法 |
JPWO2006004048A1 (ja) * | 2004-07-06 | 2008-04-24 | 松下電器産業株式会社 | オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
KR100672355B1 (ko) * | 2004-07-16 | 2007-01-24 | 엘지전자 주식회사 | 음성 코딩/디코딩 방법 및 그를 위한 장치 |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
SE0402651D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
KR20070085532A (ko) * | 2004-11-30 | 2007-08-27 | 마츠시타 덴끼 산교 가부시키가이샤 | 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법 |
EP1821287B1 (en) * | 2004-12-28 | 2009-11-11 | Panasonic Corporation | Audio encoding device and audio encoding method |
WO2006075975A1 (en) * | 2005-01-11 | 2006-07-20 | Agency For Science, Technology And Research | Encoder, decoder, method for encoding/deconding, computer readable media and computer program elements |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
BRPI0605857A (pt) * | 2005-04-19 | 2007-12-18 | Coding Tech Ab | quantização dependente de energia para a codificação eficiente de parámetros de áudio espacial |
-
2006
- 2006-03-23 CN CN2006800096953A patent/CN101147191B/zh not_active Expired - Fee Related
- 2006-03-23 US US11/909,556 patent/US8768691B2/en active Active
- 2006-03-23 EP EP06729819.0A patent/EP1858006B1/en active Active
- 2006-03-23 JP JP2007510437A patent/JP4887288B2/ja not_active Expired - Fee Related
- 2006-03-23 WO PCT/JP2006/305871 patent/WO2006104017A1/ja active Application Filing
- 2006-03-23 ES ES06729819.0T patent/ES2623551T3/es active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004509365A (ja) * | 2000-09-15 | 2004-03-25 | テレフオンアクチーボラゲツト エル エム エリクソン | 複数チャネル信号の符号化及び復号化 |
Also Published As
Publication number | Publication date |
---|---|
US8768691B2 (en) | 2014-07-01 |
WO2006104017A1 (ja) | 2006-10-05 |
EP1858006B1 (en) | 2017-01-25 |
CN101147191A (zh) | 2008-03-19 |
JPWO2006104017A1 (ja) | 2008-09-04 |
CN101147191B (zh) | 2011-07-13 |
US20090055172A1 (en) | 2009-02-26 |
EP1858006A4 (en) | 2011-01-26 |
ES2623551T3 (es) | 2017-07-11 |
EP1858006A1 (en) | 2007-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4887288B2 (ja) | 音声符号化装置および音声符号化方法 | |
JP5046653B2 (ja) | 音声符号化装置および音声符号化方法 | |
US7945447B2 (en) | Sound coding device and sound coding method | |
JP4850827B2 (ja) | 音声符号化装置および音声符号化方法 | |
JP4977472B2 (ja) | スケーラブル復号化装置 | |
JP4907522B2 (ja) | 音声符号化装置および音声符号化方法 | |
JP4963965B2 (ja) | スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法 | |
JP5153791B2 (ja) | ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法 | |
JP4555299B2 (ja) | スケーラブル符号化装置およびスケーラブル符号化方法 | |
JPWO2007116809A1 (ja) | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 | |
JPWO2006080358A1 (ja) | 音声符号化装置および音声符号化方法 | |
JPWO2006070760A1 (ja) | スケーラブル符号化装置およびスケーラブル符号化方法 | |
JPWO2008132826A1 (ja) | ステレオ音声符号化装置およびステレオ音声符号化方法 | |
JPWO2008090970A1 (ja) | ステレオ符号化装置、ステレオ復号装置、およびこれらの方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111122 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111212 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141216 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4887288 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |