JP7407110B2 - 符号化装置及び符号化方法 - Google Patents
符号化装置及び符号化方法 Download PDFInfo
- Publication number
- JP7407110B2 JP7407110B2 JP2020528992A JP2020528992A JP7407110B2 JP 7407110 B2 JP7407110 B2 JP 7407110B2 JP 2020528992 A JP2020528992 A JP 2020528992A JP 2020528992 A JP2020528992 A JP 2020528992A JP 7407110 B2 JP7407110 B2 JP 7407110B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- encoding
- section
- prediction
- decoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000004364 calculation method Methods 0.000 claims description 51
- 238000013139 quantization Methods 0.000 description 49
- 238000010586 diagram Methods 0.000 description 25
- 238000004891 communication Methods 0.000 description 22
- 238000000926 separation method Methods 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 6
- 230000009977 dual effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
[通信システムの概要]
本実施の形態に係る通信システムは、符号化装置(encoder)100及び復号装置(decoder)200を備える。
図2は、本実施の形態に係る符号化装置100の構成例を示すブロック図である。図2において、符号化装置100は、エネルギ差算出部101と、量子化部102と、エントロピ符号化部103と、逆量子化部104と、ダウンミックス部105と、M信号符号化部106と、加算器107と、M信号エネルギ算出部108と、M-S予測部109と、加算器110と、残差符号化部111と、多重化部112と、を含む。
図3は、本実施の形態に係る復号装置200の構成例を示すブロック図である。図3において、復号装置200は、分離部201と、エントロピ復号部202と、エネルギ差復号部203と、残差復号部204と、M信号復号部205と、加算器206と、M信号エネルギ算出部207と、M-S予測部208と、加算器209と、アップミックス部210と、を含む。
実施の形態1では、予測S信号の算出に用いる予測パラメータを、ステレオ信号のL信号とR信号とのエネルギ差を用いて算出する場合について説明した。これに対して、本実施の形態では、予測S信号の算出に用いる予測パラメータを、M信号及びS信号を用いて算出する場合について説明する。
図4は、本実施の形態に係る符号化装置300の構成例を示すブロック図である。なお、図4において、実施の形態1(図2)と同様の構成には同一の符号を付し、その説明を省略する。
図5は、本実施の形態に係る復号装置400の構成例を示すブロック図である。なお、図5において、実施の形態1(図3)と同様の構成には同一の符号を付し、その説明を省略する。
実施の形態1,2では、予測符号化において、M信号を用いてS信号の予測を行う場合について説明した。これに対して、本実施の形態では、予測符号化において、M信号を用いてL信号及びR信号の予測を行う場合について説明する。換言すると、本実施の形態では、符号化装置及び復号装置はS信号の予測を行わない。
本実施の形態に係る通信システムは、符号化装置(encoder)500及び復号装置(decoder)600を備える。
図6は、本実施の形態に係る符号化装置500の構成例を示すブロック図である。図6において、符号化装置500は、ダウンミックス部501と、M信号符号化部502と、予測係数算出部503と、量子化符号化部504と、逆量子化部505と、チャネル予測部506と、残差算出部507と、残差符号化部508と、多重化部509と、を含む。
図7は、本実施の形態に係る復号装置600の構成例を示すブロック図である。図7において、復号装置600は、分離部601と、M信号復号部602と、予測係数復号逆量子化部603と、残差復号部604と、チャネル予測部605と、加算部606と、を含む。
本実施の形態では、MS予測符号化を含む複数の符号化モードのうち、ステレオ信号の符号化に用いる符号化モードを切り替える方法について説明する。
本実施の形態に係る通信システムは、符号化装置(encoder)700及び復号装置(decoder)800を備える。
図10は、本実施の形態に係る符号化装置700の構成例を示すブロック図である。図10において、符号化装置700は、ダウンミックス部701と、M信号符号化部702と、S信号符号化部703と、符号化モード符号化部704と、多重化部705と、を含む。
図11は、本実施の形態に係る復号装置800の構成例を示すブロック図である。図11において、復号装置800は、分離部801と、M信号復号部802と、符号化モード復号部803と、S信号復号部804と、アップミックス部805と、を含む。
実施の形態4では、符号化装置において複数の符号化モードを用いてS信号をそれぞれ符号化し、符号化結果がより良好である符号化モードを選択する場合について説明した。これに対して、実施の形態5では、符号化装置において、複数の符号化モードの中から1つの符号化モードを選択し、選択した符号化モードを用いてS信号を符号化する場合について説明する。
101 エネルギ差算出部
102,302 量子化部
103,303 エントロピ符号化部
104,304,505 逆量子化部
105,501,701 ダウンミックス部
106,502,702 M信号符号化部
107,110,206,209 加算器
108,207 M信号エネルギ算出部
109,208,305,404 M-S予測部
111,306,508 残差符号化部
112,509,705 多重化部
200,400,600,800 復号装置
201,601,801 分離部
202,401 エントロピ復号部
203 エネルギ差復号部
204,403,604 残差復号部
205,602,802 M信号復号部
210,805 アップミックス部
301,503 予測係数算出部
402 予測係数復号部
504 量子化符号化部
506,605 チャネル予測部
507 残差算出部
603 予測係数復号逆量子化部
606 加算部
703,903 S信号符号化部
704 符号化モード符号化部
803 符号化モード復号部
804 S信号復号部
901,901a 相互相関算出部
902 サブバンド分類部
904 分類情報符号化部
Claims (5)
- ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1の符号化情報を生成する第1符号化回路と、
前記左チャネル信号と前記右チャネル信号との間のエネルギ差に関するパラメータを用いて、前記左チャネル信号と前記右チャネル信号との差を示す差信号を予測するための予測パラメータを算出する算出回路と、
前記予測パラメータを符号化して、第2の符号化情報を生成する第2符号化回路と、
を具備し、
前記エネルギ差に関するパラメータは、前記第1の符号化情報を復号して得られる復号和信号と前記差信号との相関値を、前記復号和信号のエネルギで正規化して得られる係数である、
符号化装置。 - 前記予測パラメータ及び前記和信号を用いて前記差信号を予測して、予測差信号を生成する予測回路と、
前記差信号と前記予測差信号との残差信号を符号化して、第3の符号化情報を生成する第3符号化回路と、を更に具備する、
請求項1に記載の符号化装置。 - 前記第3の符号化情報には、前記和信号と、前記第1の符号化情報を復号して得られる復号和信号との残差信号の符号化結果が含まれる、
請求項2に記載の符号化装置。 - 前記第2符号化回路は、前記予測パラメータに対してエントロピ符号化を行う、
請求項1に記載の符号化装置。 - ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1の符号化情報を生成し、
前記左チャネル信号と前記右チャネル信号との間のエネルギ差に関するパラメータを用いて、前記左チャネル信号と前記右チャネル信号との差を示す差信号を予測するための予測パラメータを算出し、
前記予測パラメータを符号化して、第2の符号化情報を生成し、
前記エネルギ差に関するパラメータは、前記第1の符号化情報を復号して得られる復号和信号と前記差信号との相関値を、前記復号和信号のエネルギで正規化して得られる係数である、
符号化方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018126842 | 2018-07-03 | ||
JP2018126842 | 2018-07-03 | ||
JP2018209940 | 2018-11-07 | ||
JP2018209940 | 2018-11-07 | ||
PCT/JP2019/026200 WO2020009082A1 (ja) | 2018-07-03 | 2019-07-02 | 符号化装置及び符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020009082A1 JPWO2020009082A1 (ja) | 2021-08-02 |
JP7407110B2 true JP7407110B2 (ja) | 2023-12-28 |
Family
ID=69060388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020528992A Active JP7407110B2 (ja) | 2018-07-03 | 2019-07-02 | 符号化装置及び符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11545165B2 (ja) |
JP (1) | JP7407110B2 (ja) |
CN (1) | CN112352277B (ja) |
WO (1) | WO2020009082A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017125562A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
WO2017161315A1 (en) | 2016-03-18 | 2017-09-21 | Qualcomm Incorporated | Multi channel coding |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
JP2005202248A (ja) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 |
JP4950040B2 (ja) * | 2004-06-21 | 2012-06-13 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置 |
JP4892184B2 (ja) * | 2004-10-14 | 2012-03-07 | パナソニック株式会社 | 音響信号符号化装置及び音響信号復号装置 |
JP2006323314A (ja) * | 2005-05-20 | 2006-11-30 | Matsushita Electric Ind Co Ltd | マルチチャネル音声信号をバイノーラルキュー符号化する装置 |
US7991272B2 (en) * | 2005-07-11 | 2011-08-02 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
JP2007183528A (ja) * | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | 符号化装置、符号化方法、および符号化プログラム |
JP2008203315A (ja) * | 2007-02-16 | 2008-09-04 | Matsushita Electric Ind Co Ltd | オーディオ符号化・復号化装置、方法、及びソフトウェア |
CN101981616A (zh) * | 2008-04-04 | 2011-02-23 | 松下电器产业株式会社 | 立体声信号变换装置、立体声信号逆变换装置及其方法 |
US8811621B2 (en) | 2008-05-23 | 2014-08-19 | Koninklijke Philips N.V. | Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder |
CA2754671C (en) * | 2009-03-17 | 2017-01-10 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
CN101533641B (zh) * | 2009-04-20 | 2011-07-20 | 华为技术有限公司 | 对多声道信号的声道延迟参数进行修正的方法和装置 |
US8660851B2 (en) * | 2009-05-26 | 2014-02-25 | Panasonic Corporation | Stereo signal decoding device and stereo signal decoding method |
US8924207B2 (en) * | 2009-07-23 | 2014-12-30 | Texas Instruments Incorporated | Method and apparatus for transcoding audio data |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
AU2011240239B2 (en) * | 2010-04-13 | 2014-06-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
CN103180899B (zh) * | 2010-11-17 | 2015-07-22 | 松下电器(美国)知识产权公司 | 立体声信号的编码装置、解码装置、编码方法及解码方法 |
US8654984B2 (en) | 2011-04-26 | 2014-02-18 | Skype | Processing stereophonic audio signals |
RU2625444C2 (ru) * | 2013-04-05 | 2017-07-13 | Долби Интернэшнл Аб | Система обработки аудио |
US10152977B2 (en) * | 2015-11-20 | 2018-12-11 | Qualcomm Incorporated | Encoding of multiple audio signals |
-
2019
- 2019-07-02 WO PCT/JP2019/026200 patent/WO2020009082A1/ja active Application Filing
- 2019-07-02 US US17/256,899 patent/US11545165B2/en active Active
- 2019-07-02 CN CN201980042253.6A patent/CN112352277B/zh active Active
- 2019-07-02 JP JP2020528992A patent/JP7407110B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017125562A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
WO2017161315A1 (en) | 2016-03-18 | 2017-09-21 | Qualcomm Incorporated | Multi channel coding |
Also Published As
Publication number | Publication date |
---|---|
CN112352277A (zh) | 2021-02-09 |
WO2020009082A1 (ja) | 2020-01-09 |
JPWO2020009082A1 (ja) | 2021-08-02 |
US11545165B2 (en) | 2023-01-03 |
US20210280201A1 (en) | 2021-09-09 |
CN112352277B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101340233B1 (ko) | 스테레오 부호화 장치, 스테레오 복호 장치 및 스테레오부호화 방법 | |
US8374883B2 (en) | Encoder and decoder using inter channel prediction based on optimally determined signals | |
JP5036317B2 (ja) | スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法 | |
WO2009144953A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
KR102460820B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 | |
EP2856776B1 (en) | Stereo audio signal encoder | |
KR102327149B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 | |
JP5746974B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
US20100017197A1 (en) | Voice coding device, voice decoding device and their methods | |
JPWO2007114290A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 | |
JP5714002B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
US8271275B2 (en) | Scalable encoding device, and scalable encoding method | |
JPWO2010140350A1 (ja) | ダウンミックス装置、符号化装置、及びこれらの方法 | |
US20160111100A1 (en) | Audio signal encoder | |
WO2011045926A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP7407110B2 (ja) | 符号化装置及び符号化方法 | |
US20170243592A1 (en) | Method and apparatus for coding or decoding subband configuration data for subband groups | |
JP2022188262A (ja) | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 | |
KR102363275B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 | |
JP5990954B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム | |
JP5544371B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
RU2821284C1 (ru) | Распределение скоростей передачи битов в иммерсивных голосовых и аудиослужбах | |
WO2011058752A1 (ja) | 符号化装置、復号装置およびこれらの方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220617 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7407110 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |