JP7407110B2 - 符号化装置及び符号化方法 - Google Patents

符号化装置及び符号化方法 Download PDF

Info

Publication number
JP7407110B2
JP7407110B2 JP2020528992A JP2020528992A JP7407110B2 JP 7407110 B2 JP7407110 B2 JP 7407110B2 JP 2020528992 A JP2020528992 A JP 2020528992A JP 2020528992 A JP2020528992 A JP 2020528992A JP 7407110 B2 JP7407110 B2 JP 7407110B2
Authority
JP
Japan
Prior art keywords
signal
encoding
section
prediction
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020528992A
Other languages
English (en)
Other versions
JPWO2020009082A1 (ja
Inventor
スリカンス ナギセティ
宏幸 江原
ロヒス マース
チョンスン リム
利昭 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of JPWO2020009082A1 publication Critical patent/JPWO2020009082A1/ja
Application granted granted Critical
Publication of JP7407110B2 publication Critical patent/JP7407110B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本開示は、符号化装置及び符号化方法に関する。
M/S(Middle/Side)ステレオコーデックでは、ステレオ信号を構成する各チャネル(左チャネル及び右チャネル)の信号をM信号(又は和信号と呼ぶ)、及び、S信号(又は差信号と呼ぶ)に変換し、M信号及びS信号をそれぞれモノラル音声音響コーデックにより符号化する。また、M/Sステレオコーデックにおいて、M信号を用いてS信号を予測する符号化方法(以下、MS予測符号化と呼ぶ)が提案されている(例えば、特許文献1-3を参照)。
特許第5122681号公報 特表2014-516425号公報 特許第5705964号公報
しかしながら、MS予測符号化において、S信号を効率良く符号化する方法について十分に検討されていない。
本開示の非限定的な実施例は、MS予測符号化において、S信号を効率良く符号化することができる符号化装置及び符号化方法の提供に資する。
本開示の一実施例に係る符号化装置は、ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1の符号化情報を生成する第1符号化回路と、前記左チャネル信号と前記右チャネル信号との間のエネルギ差に関するパラメータを用いて、前記左チャネル信号と前記右チャネル信号との差を示す差信号を予測するための予測パラメータを算出する算出回路と、前記予測パラメータを符号化して、第2の符号化情報を生成する第2符号化回路と、を具備する。
本開示の一実施例に係る符号化方法は、ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1の符号化情報を生成し、前記左チャネル信号と前記右チャネル信号との間のエネルギ差に関するパラメータを用いて、前記左チャネル信号と前記右チャネル信号との差を示す差信号を予測するための予測パラメータを算出し、前記予測パラメータを符号化して、第2の符号化情報を生成する。
なお、これらの包括的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
本開示の一実施例によれば、MS予測符号化において、S信号を効率良く符号化できる。
本開示の一実施例における更なる利点および効果は、明細書および図面から明らかにされる。かかる利点および/または効果は、いくつかの実施形態並びに明細書および図面に記載された特徴によってそれぞれ提供されるが、1つまたはそれ以上の同一の特徴を得るために必ずしも全てが提供される必要はない。
実施の形態1に係る符号化装置の一部の構成例を示すブロック図 実施の形態1に係る符号化装置の構成例を示すブロック図 実施の形態1に係る復号装置の構成例を示すブロック図 実施の形態2に係る符号化装置の構成例を示すブロック図 実施の形態2に係る復号装置の構成例を示すブロック図 実施の形態3に係る符号化装置の構成例を示すブロック図 実施の形態3に係る復号装置の構成例を示すブロック図 実施の形態3に係る符号化装置の他の構成例を示すブロック図 実施の形態3に係る復号装置の他の構成例を示すブロック図 実施の形態4に係る符号化装置の構成例を示すブロック図 実施の形態4に係る復号装置の構成例を示すブロック図 実施の形態5に係る符号化装置の構成例を示すブロック図 実施の形態5に係る符号化装置の他の構成例を示すブロック図
以下、本開示の実施の形態について図面を参照して詳細に説明する。
(実施の形態1)
[通信システムの概要]
本実施の形態に係る通信システムは、符号化装置(encoder)100及び復号装置(decoder)200を備える。
図1は、本実施の形態に係る符号化装置100の一部の構成を示すブロック図である。図1に示す符号化装置100において、M信号符号化部106は、ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1符号化情報を生成する。エネルギ差算出部101は、左チャネル信号と右チャネル信号との間のエネルギ差に関するパラメータを用いて、左チャネル信号と右チャネル信号との差を示す差信号を予測するための予測パラメータを算出する。エントロピ符号化部103は、予測パラメータを符号化して、第2符号化情報を生成する。
[符号化装置の構成]
図2は、本実施の形態に係る符号化装置100の構成例を示すブロック図である。図2において、符号化装置100は、エネルギ差算出部101と、量子化部102と、エントロピ符号化部103と、逆量子化部104と、ダウンミックス部105と、M信号符号化部106と、加算器107と、M信号エネルギ算出部108と、M-S予測部109と、加算器110と、残差符号化部111と、多重化部112と、を含む。
図2において、エネルギ差算出部101及びダウンミックス部105には、ステレオ信号を構成するL信号(Left channel signal)、及び、R信号(Right channel signal)が入力される。
エネルギ差算出部101は、L信号のエネルギ及びR信号のエネルギをそれぞれ算出し、L信号とR信号とのエネルギ差dを算出する。エネルギ差算出部101は、算出したエネルギ差dを、L信号とR信号との差を示すS信号(差信号)を予測するための予測パラメータとして量子化部102に出力する。
量子化部102は、エネルギ差算出部101から入力される予測パラメータをスカラ量子化し、得られる量子化インデックスをエントロピ符号化部103及び逆量子化部104に出力する。なお、量子化インデックスは、隣接するサブバンド間で差分を取っても良い。例えば、量子化部102は、隣接するサブバンド間でサブバンド量子化(「差分量子化」と呼ぶ)を行っても良い。隣接するサブバンド間で量子化値が近くなる場合には、差分量子化を行った方がエントロピ符号化の効率が上がる場合がある。
エントロピ符号化部103は、量子化部102から入力される量子化インデックスに対してエントロピ符号化(例えば、ハフマン符号化等。例えば、非特許文献1又は非特許文献2を参照)を行い、符号化結果(予測パラメータ符号化情報)を多重化部112に出力する。
また、エントロピ符号化部103は、符号化結果に要するビット数を算出し、符号化結果に使用可能な最大ビット数と、算出したビット数との差(余剰ビット数)を示す情報(換言すると、最大ビット数と比較して何ビット少ないかを示す情報)を、M信号符号化部106及び残差符号化部111の少なくとも一方に出力する。
逆量子化部104は、量子化部102から入力される量子化インデックスを復号して、得られる復号予測パラメータ(復号エネルギ差)をM-S予測部109に出力する。
ダウンミックス部105は、入力されるL信号及びR信号を、L信号とR信号との和を示すM信号(和信号)、及び、L信号とR信号との差を示すS信号(差信号)に変換(LR-MS変換)する。ダウンミックス部105は、M信号をM信号符号化部106、加算器107、M信号エネルギ算出部108、及び、M-S予測部109に出力する。ダウンミックス部105は、S信号を加算器110に出力する。
例えば、ダウンミックス部105は、式(1)に従ってL信号(L(f))及びR信号(R(f))を、M信号(M(f))及びS信号(S(f))に変換する。
Figure 0007407110000001
なお、式(1)は、周波数領域(周波数f)におけるLR-MS変換を示すが、ダウンミックス部105は、例えば、式(2)に示すように時間領域(時間n)におけるLR-MS変換を行ってもよい。
Figure 0007407110000002
M信号符号化部106は、ダウンミックス部105から入力されるM信号を符号化し、符号化結果(M信号符号化情報)を多重化部112に出力する。また、M信号符号化部106は、符号化結果を復号し、得られる復号M信号M’を加算器107に出力する。
なお、M信号符号化部106は、エントロピ符号化部103から入力される余剰ビット数を示す情報に基づいて、M信号の符号化ビット数を決定(例えば、追加)してもよい。
加算器107は、ダウンミックス部105から入力されるM信号と、M信号符号化部106から入力される復号M信号との差分(又は符号化誤差)である残差信号Eを算出し、残差符号化部111に出力する。
M信号エネルギ算出部108は、ダウンミックス部105から入力されるM信号を用いて、M信号のエネルギMEneを算出し、M-S予測部109に出力する。
M-S予測部109は、ダウンミックス部105から入力されるM信号、M信号エネルギ算出部108から入力されるM信号のエネルギ、及び、逆量子化部104から入力される復号予測パラメータ(復号エネルギ差)を用いて、S信号を予測する。
例えば、M-S予測部109は、次式(3)に従って、予測S信号Sを算出する。
Figure 0007407110000003
式(3)において、bはサブバンド番号を示し、MはサブバンドbにおけるM信号を示し、Hはサブバンドbにおける周波数応答を示す。周波数応答Hは、例えば、次式(4)で表される。
Figure 0007407110000004
式(4)において、LはサブバンドbにおけるL信号を示し、RはサブバンドbにおけるR信号を示し、d(b)はサブバンドbにおける復号エネルギ差を示す。また、関数E(x)は、xの期待値を返す関数である。
すなわち、M-S予測部109は、逆量子化部104から入力される予測パラメータである復号エネルギ差(式(4)のd(b)に対応)と、M信号エネルギ算出部108から入力されるM信号のエネルギ(式(4)のM に対応)との比(式(3)及び式(4)のHに対応)を、M信号(式(3)のMに対応)に乗算することにより、予測S信号S を算出する。
なお、式(3)は、一例として、サブバンドb毎の予測S信号(S )を示すが、これに限定されない。例えば、M-S予測部109は、複数のサブバンドのグループ単位の予測S信号を算出してもよく、周波数領域の全帯域における予測S信号を算出してもよく、時間領域の予測S信号を算出してもよい。
M-S予測部109は、得られた予測S信号を加算器110に出力する。
加算器110は、ダウンミックス部105から入力されるS信号と、M-S予測部109から入力される予測S信号との差分(又は符号化誤差)である残差信号Eを算出し、残差符号化部111に出力する。
残差符号化部111は、加算器107から入力される残差信号E及び加算器110から入力される残差信号Eを符号化し、符号化結果(残差符号化情報)を多重化部112に出力する。例えば、残差符号化部111は、残差信号E及び残差信号Eを組み合わせて符号化してもよい。
また、残差符号化部111は、エントロピ符号化部103から入力される余剰ビット数を示す情報に基づいて、残差信号の符号化ビット数を決定(例えば、追加)してもよい。
多重化部112は、エントロピ符号化部103から入力される予測パラメータ符号化情報、M信号符号化部106から入力されるM信号符号化情報、及び、残差符号化部111から入力される残差符号化情報を多重化する。多重化部112は、例えば、得られるビットストリームを、トランスポート層等を介して復号装置200へ送信する。
[復号装置の構成]
図3は、本実施の形態に係る復号装置200の構成例を示すブロック図である。図3において、復号装置200は、分離部201と、エントロピ復号部202と、エネルギ差復号部203と、残差復号部204と、M信号復号部205と、加算器206と、M信号エネルギ算出部207と、M-S予測部208と、加算器209と、アップミックス部210と、を含む。
図3において、分離部201には、符号化装置100から送信されるビットストリームが入力される。ビットストリームには、例えば、予測パラメータ符号化情報、M信号符号化情報、及び、残差符号化情報が多重化されている。
分離部201は、入力されるビットストリームから、予測パラメータ符号化情報と、M信号符号化情報と、残差符号化情報とを分離する。分離部201は、予測パラメータ符号化情報をエントロピ復号部202に出力し、残差符号化情報を残差復号部204に出力し、M信号符号化情報をM信号復号部205に出力する。
エントロピ復号部202は、分離部201から入力される予測パラメータ符号化情報を復号し、復号量子化インデックスをエネルギ差復号部203に出力する。
エネルギ差復号部203は、エントロピ復号部202から入力される復号量子化インデックスを復号して、得られる復号予測パラメータ(復号エネルギ差d)をM-S予測部208に出力する。
残差復号部204は、分離部201から入力される残差符号化情報を復号し、M信号の復号残差信号E’及びS信号の復号残差信号E’を得る。残差復号部204は、復号残差信号E’を加算器206に出力し、復号残差信号E’を加算器209に出力する。
M信号復号部205は、分離部201から入力されるM信号符号化情報を復号し、復号M信号M’を加算器206に出力する。
加算器206は、残差復号部204から入力される復号残差信号E’と、M信号復号部205から入力される復号M信号M’とを加算し、加算結果である復号M信号M^を、M信号エネルギ算出部207、M-S予測部208、及び、アップミックス部210に出力する。
M信号エネルギ算出部207は、加算器206から入力される復号M信号M^を用いて、M信号のエネルギMEne^を算出し、M-S予測部208に出力する。
M-S予測部208は、加算器206から入力される復号M信号M^、M信号エネルギ算出部207から入力されるM信号のエネルギMEne^、及び、エネルギ差復号部203から入力される復号エネルギ差dを用いて、S信号を予測する。
例えば、M-S予測部208は、M-S予測部109と同様、式(3)及び式(4)に従って、復号エネルギ差d(式(4)のd(b)に対応)と、M信号のエネルギMEne^(式(4)のM に対応)との比(式(3)及び式(4)のHに対応)を、復号M信号M^(式(3)のMに対応)に乗算することにより、予測S信号S’を算出する。
M-S予測部208は、予測S信号S’を加算器209に出力する。
加算器209は、残差復号部204から入力される復号残差信号E’と、M-S予測部208から入力される予測S信号S’とを加算し、加算結果である復号S信号S^を、アップミックス部210に出力する。
アップミックス部210は、加算器206から入力される復号M信号M^、及び、加算器209から入力される復号S信号S^を、復号L信号L^及び復号R信号R^に変換(MS-LR変換)する。例えば、アップミックス部210は、式(5)に従って復号M信号及び復号S信号を、復号L信号及び復号R信号に変換する。
Figure 0007407110000005
なお、式(5)は、周波数領域(周波数f)におけるMS-LR変換を示すが、アップミックス部210は、例えば、式(6)に示すように時間領域(時間n)におけるMS-LR変換を行ってもよい。
Figure 0007407110000006
以上、本実施の形態に係る符号化装置100及び復号装置200について説明した。
本実施の形態では、符号化装置100は、S信号を予測するための予測パラメータとして、L信号とR信号との間のエネルギ差を算出する。これにより、符号化装置100は、S信号の予測のためにM信号とS信号との相互相関を算出することなく、符号化装置100に入力されるステレオ信号(L信号及びR信号のエネルギ)を用いて、予測S信号を算出できる。
よって、符号化装置100は、MS予測符号化において予測S信号を算出するための演算量を削減できる。よって、本実施の形態によれば、MS予測符号化において、S信号を効率良く符号化できる。
また、本実施の形態では、符号化装置100は、L信号とR信号との間のエネルギ差を示す予測パラメータ(量子化インデックス)をエントロピ符号化する。例えば、エントロピ符号化では、符号長は可変となる。これにより、符号化装置100は、予測パラメータの符号化において使用されないビット(余剰ビット)が存在する場合、当該余剰ビットを追加してM信号又は残差信号を符号化できる。すなわち、符号化装置100は、M信号又は残差信号に対して、各々に配分されたビット数に加え、エントロピ符号化によって得られる余剰ビットを用いて符号化できる。よって、本実施の形態によれば、符号化装置100におけるM信号又は残差信号の量子化性能を向上でき、復号装置200では、高品質な復号ステレオ信号を実現できる。
また、本実施の形態では、符号化装置100は、M信号の残差信号Eを符号化して、復号装置200へ送信する。そして、復号装置200は、M信号の残差信号E(復号残差信号)を用いて、予測S信号の算出に用いる復号M信号M’を生成する。例えば、M信号の符号化誤差が大きくなると、S信号の予測誤差は大きくなり、S信号の品質が劣化してしまう可能性がある。これに対して、本実施の形態では、M信号の残差信号を符号化情報に含めることにより、M信号の符号化誤差を抑え、S信号の予測誤差を抑えることができるので、S信号の品質を向上させることができる。
また、本実施の形態では、符号化装置100は、予測S信号の残差信号Eを符号化して、復号装置200へ送信する。そして、復号装置200は、予測S信号の残差信号E(復号残差信号)を用いて、復号S信号S’を生成する。これにより、本実施の形態では、予測S信号の残差信号を符号化情報に含めることにより、S信号の予測誤差を抑えることができるので、S信号の品質を向上させることができる。
なお、本実施の形態では、符号化装置100から復号装置200へM信号の残差信号及びS信号の残差信号を送信する場合について説明した。しかし、M信号の残差信号及びS信号の残差信号の少なくとも一方は、符号化装置100から復号装置200へ送信されなくてもよい。例えば、復号装置200は、符号化装置100から送信されるM信号符号化情報、及び、予測パラメータ符号化情報(例えば、エネルギ差)に基づいて、S信号を復号(予測)すればよい。
また、本実施の形態において、図2に示す符号化装置100では、M信号エネルギ算出部108及びM-S予測部109において、M信号を用いてM信号のエネルギ及び予測S信号を算出する場合について説明したがこれに限定されない。例えば、符号化装置100は、M信号符号化部106から出力される復号M信号を用いて、M信号のエネルギ及び予測S信号を算出してもよい。このように、符号化装置100は、復号装置200においてM信号のエネルギ及び予測S信号の算出に使用される復号M信号を用いることにより、復号装置200と同様の条件で予測S信号を生成できる。つまり、実際のS信号(符号化装置100におけるS)と復号装置におけるM-S予測信号Sとの差分信号を残差信号Eとして符号化することができるので、S信号の符号化誤差を減らすことができる。
または、符号化装置100は、M信号の残差信号E(例えば、残差符号化部111の出力)を復号して得られる復号残差信号E’と、復号M信号M’(例えば、M信号符号化部106の出力)と、を加算して、復号M信号M^を生成し、復号M信号M^を用いてM信号のエネルギ及び予測S信号を算出してもよい。これにより、符号化装置100は、S信号の予測精度を更に向上できる。ただし、この場合、残差信号Eを求めるためには復号残差信号E’が必要となるため、符号化装置100は、残差信号Eと残差信号Eとは組み合わせずに符号化する。
(実施の形態2)
実施の形態1では、予測S信号の算出に用いる予測パラメータを、ステレオ信号のL信号とR信号とのエネルギ差を用いて算出する場合について説明した。これに対して、本実施の形態では、予測S信号の算出に用いる予測パラメータを、M信号及びS信号を用いて算出する場合について説明する。
[符号化装置の構成]
図4は、本実施の形態に係る符号化装置300の構成例を示すブロック図である。なお、図4において、実施の形態1(図2)と同様の構成には同一の符号を付し、その説明を省略する。
予測係数算出部301は、ダウンミックス部105から入力されるS信号、及び、M信号符号化部106から入力される復号M信号を用いて、M-S予測係数を算出する。予測係数算出部301は、算出したM-S予測係数を、S信号を予測するための予測パラメータとして量子化部302に出力する。
例えば、予測係数算出部301は、次式(7)に従って、M-S予測係数を算出する。
Figure 0007407110000007
式(7)において、SはサブバンドbにおけるS信号を示し、M’はサブバンドbにおける復号M信号を示し、M’Ene(b)はサブバンドbにおける復号M信号のエネルギを示す。また、関数E(x)は、xの期待値を返す関数である。
例えば、式(7)の分子成分は、次式(8)に従って算出される。
Figure 0007407110000008
また、例えば、式(7)に示す復号M信号のエネルギM’Ene(b)は、次式(9)に従って算出される。
Figure 0007407110000009
式(8)及び式(9)において、kstartはサブバンドbにおけるスペクトル係数の開始番号を示し、kendはサブバンドbにおけるスペクトル係数の終了番号を示す。また、Nbandsは、サブバンド数を示す。また、「*」は複素共役を示す。
すなわち、式(7)に示すM-S予測係数(予測パラメータ)は、復号M信号M’とS信号Sとの相関値を、復号M信号のエネルギM’Eneで正規化して得られる係数である。ここで、M信号及びS信号は、L信号及びR信号の和及び差であるので、M信号とS信号との相関値は、L信号とR信号との間のエネルギ差と等しい。よって、式(7)に示すM-S予測係数(予測パラメータ)は、M信号と復号M信号との符号化誤差に対応する分の誤差が含まれるものの、L信号とR信号との間のエネルギ差に関するパラメータである。
量子化部302は、予測係数算出部301から入力される予測パラメータをスカラ量子化し、得られる量子化インデックスをエントロピ符号化部303及び逆量子化部304に出力する。
エントロピ符号化部303は、量子化部302から入力される量子化インデックスに対してエントロピ符号化(例えば、ハフマン符号化等)を行い、符号化結果(予測パラメータ符号化情報)を多重化部112に出力する。
また、エントロピ符号化部303は、符号化結果に要するビット数を算出し、符号化結果に使用可能な最大ビット数と、算出したビット数との差(余剰ビット数)を示す情報(換言すると、最大ビット数と比較して何ビット少ないかを示す情報)を、M信号符号化部106及び残差符号化部306の少なくとも一方に出力する。M信号符号化部106及び残差符号化部306の少なくとも一方は、例えば、余剰ビット数を示す情報に基づいて、M信号及び残差信号を符号化してもよい。
逆量子化部304は、量子化部302から入力される量子化インデックスを復号して、得られる復号予測パラメータ(復号M-S予測係数)をM-S予測部305に出力する。
M-S予測部305は、M信号符号化部106から入力される復号M信号、及び、逆量子化部304から入力される復号予測パラメータ(復号M-S予測係数)を用いて、S信号を予測する。
例えば、M-S予測部305は、次式(10)に従って、予測S信号S''を算出する。
Figure 0007407110000010
式(10)において、bはサブバンド番号を示し、M’はサブバンドbにおける復号M信号を示し、HはサブバンドbにおけるM-S予測係数(式(7)を参照)を示す。
すなわち、M-S予測部305は、復号M信号とS信号との相関値(式(7)のSM’に対応)と、復号M信号のエネルギ(式(7)のM’Eneに対応)との比(式(7)のHに対応)を、復号M信号(式(7)のM’に対応)に乗算することにより、予測S信号S’’を算出する。
残差符号化部306は、加算器110から入力されるS信号の残差信号Eを符号化し、符号化結果(残差符号化情報)を多重化部112に出力する。
[復号装置の構成]
図5は、本実施の形態に係る復号装置400の構成例を示すブロック図である。なお、図5において、実施の形態1(図3)と同様の構成には同一の符号を付し、その説明を省略する。
エントロピ復号部401は、分離部201から入力される予測パラメータ符号化情報を復号し、復号量子化インデックスを予測係数復号部402に出力する。
予測係数復号部402は、エントロピ復号部401から入力される復号量子化インデックスを復号して、得られる復号予測パラメータ(復号M-S予測係数)をM-S予測部404に出力する。
残差復号部403は、分離部201から入力される残差符号化情報を復号し、S信号の復号残差信号E’を得る。残差復号部403は、復号残差信号E’を加算器209に出力する。
M-S予測部404は、M信号復号部205から入力される復号M信号M’、及び、予測係数復号部402から入力される復号M-S予測係数を用いて、S信号を予測する。
例えば、M-S予測部404は、M-S予測部305と同様、式(10)に従って、M-S予測係数Hを、復号M信号M’に乗算することにより、予測S信号S’’を算出する。
以上、本実施の形態に係る符号化装置300及び復号装置400について説明した。
ここで、図5に示す復号装置400において、M-S予測部404は、復号M-S予測係数、及び、復号M信号を用いて予測S信号S’’を算出する。これに対して、図4に示す符号化装置300において、M-S予測部305は、復号M-S予測係数、及び、復号M信号を用いて予測S信号S’’を算出する。また、符号化装置300において、予測係数算出部301は、復号M信号を用いてM-S予測係数を算出する。
このように、本実施の形態では、符号化装置300は、M-S予測係数の算出処理及びS信号の予測処理の双方において、復号装置400でも使用される復号M信号を用いる。換言すると、符号化装置300は、復号装置400におけるS信号の予測処理と同様の条件でS信号の予測処理を行い、復号装置400における処理を再現する。
よって、符号化装置300では、M信号の符号化誤差を考慮したMS予測符号化が可能となり、MS予測符号化において、S信号の予測精度を向上できる。よって、本実施の形態によれば、MS予測符号化において、S信号を効率良く符号化できる。例えば、本実施の形態は、M信号の符号化誤差(又は、符号化歪み)が大きくなるような低ビットレートにおいて特に有効である。
なお、本実施の形態において、符号化装置300の予測係数算出部301は、復号M信号の代わりに、M信号(例えば、ダウンミックス部105の出力)を用いて、M-S予測係数を算出してもよい。この場合でも、符号化装置300は、M-S予測部305において、復号装置400と同様にして復号M信号と復号M-S予測係数を用いてS信号を予測する。よって、例えば、復号M信号を用いた場合とM信号を用いた場合とで算出されるM-S予測係数に差が発生する場合でも、予測係数の違いによって生じる予測誤差をS信号の残差信号Eに含めることができるので、復号ステレオ信号の品質劣化を抑えることができる。
(実施の形態3)
実施の形態1,2では、予測符号化において、M信号を用いてS信号の予測を行う場合について説明した。これに対して、本実施の形態では、予測符号化において、M信号を用いてL信号及びR信号の予測を行う場合について説明する。換言すると、本実施の形態では、符号化装置及び復号装置はS信号の予測を行わない。
[通信システムの概要]
本実施の形態に係る通信システムは、符号化装置(encoder)500及び復号装置(decoder)600を備える。
[符号化装置の構成]
図6は、本実施の形態に係る符号化装置500の構成例を示すブロック図である。図6において、符号化装置500は、ダウンミックス部501と、M信号符号化部502と、予測係数算出部503と、量子化符号化部504と、逆量子化部505と、チャネル予測部506と、残差算出部507と、残差符号化部508と、多重化部509と、を含む。
図6において、ダウンミックス部501、予測係数算出部503、及び、残差算出部507には、ステレオ信号を構成するL信号、及び、R信号が入力される。
ダウンミックス部501は、入力されるL信号及びR信号を、M信号に変換(LR-M変換)する。ダウンミックス部501は、M信号をM信号符号化部502及び予測係数算出部503に出力する。例えば、ダウンミックス部501は、式(1)又は式(2)に従ってL信号及びR信号を、M信号に変換する。
M信号符号化部502は、ダウンミックス部501から入力されるM信号を符号化し、符号化結果(M信号符号化情報)を多重化部509に出力する。また、M信号符号化部106は、符号化結果を復号し、得られる復号M信号M’をチャネル予測部506に出力する。
予測係数算出部503は、入力されるL信号、R信号、及び、ダウンミックス部501から入力されるM信号を用いて、M-L予測係数及びM-R予測係数をそれぞれ算出する。予測係数算出部503は、算出したM-L予測係数及びM-R予測係数を、L信号及びR信号を予測するための予測パラメータとして量子化符号化部504に出力する。
例えば、予測係数算出部503は、次式(11)及び式(12)に従って、サブバンドbのM-L予測係数XLM(b)及びM-R予測係数XRM(b)を算出する。
Figure 0007407110000011
Figure 0007407110000012
式(11)及び式(12)において、LはサブバンドbにおけるL信号を示し、RはサブバンドbにおけるR信号を示し、MはサブバンドbにおけるM信号を示す。また、関数E(x)は、xの期待値を返す関数である。すなわち、M-L予測係数XLMは、L信号とM信号との相関値を示し、M-R予測係数XRMは、R信号とM信号との相関値を示す。
量子化符号化部504は、予測係数算出部503から入力される予測パラメータ(M-L予測係数及びM-R予測係数)をスカラ量子化し、得られる量子化インデックスに対して符号化を行い、符号化結果(予測パラメータ符号化情報)を多重化部509に出力する。また、量子化符号化部504は、量子化インデックスを逆量子化部505に出力する。
逆量子化部505は、量子化符号化部504から入力される量子化インデックスを復号して、得られる復号予測パラメータ(復号M-L予測係数及び復号M-R予測係数)をチャネル予測部506に出力する。
チャネル予測部506は、逆量子化部505から入力される復号予測パラメータ(復号M-L予測係数及び復号M-R予測係数)、及び、M信号符号化部502から入力される復号M信号を用いて、L信号及びR信号を予測する。チャネル予測部506は、予測L信号及び予測R信号を残差算出部507に出力する。
例えば、チャネル予測部506は、次式(13)及び式(14)に従って、予測L信号L’を算出する。
Figure 0007407110000013
Figure 0007407110000014
式(13)において、H はサブバンドbにおける周波数応答を示し、M’はサブバンドbにおける復号M信号を示す。また、式(14)において、MEne(b)はサブバンドbにおける復号M信号のエネルギを示す。また、関数E(x)は、xの期待値を返す関数である。
同様に、例えば、チャネル予測部506は、次式(15)及び式(16)に従って、予測R信号R’を算出する。
Figure 0007407110000015
Figure 0007407110000016
式(15)において、H はサブバンドbにおける周波数応答を示し、M’はサブバンドbにおける復号M信号を示す。また、式(16)において、MEne(b)はサブバンドbにおける復号M信号のエネルギを示す。また、関数E(x)は、xの期待値を返す関数である。
残差算出部507は、入力されるL信号と、チャネル予測部506から入力される予測L信号との差分である残差信号Eを算出し、残差符号化部508に出力する。また、残差算出部507は、入力されるR信号と、チャネル予測部506から入力される予測R信号との差分である残差信号Eを算出し、残差符号化部508に出力する。
残差符号化部508は、残差算出部507から入力される残差信号E及び残差信号Eを符号化し、符号化結果(残差符号化情報)を多重化部509に出力する。
多重化部509は、M信号符号化部502から入力されるM信号符号化情報、量子化符号化部504から入力される予測パラメータ符号化情報、及び、残差符号化部508から入力される残差符号化情報を多重化する。多重化部509は、例えば、得られるビットストリームを、トランスポート層等を介して復号装置600へ送信する。
[復号装置の構成]
図7は、本実施の形態に係る復号装置600の構成例を示すブロック図である。図7において、復号装置600は、分離部601と、M信号復号部602と、予測係数復号逆量子化部603と、残差復号部604と、チャネル予測部605と、加算部606と、を含む。
図7において、分離部601には、符号化装置500から送信されるビットストリームが入力される。ビットストリームには、例えば、予測パラメータ符号化情報、M信号符号化情報、及び、残差符号化情報が多重化されている。
分離部601は、入力されるビットストリームから、予測パラメータ符号化情報と、M信号符号化情報と、残差符号化情報とを分離する。分離部601は、M信号符号化情報をM信号復号部602に出力し、予測パラメータ符号化情報を予測係数復号逆量子化部603に出力し、残差符号化情報を残差復号部604に出力する。
M信号復号部602は、分離部601から入力されるM信号符号化情報を復号し、復号M信号M’をチャネル予測部605に出力する。
予測係数復号逆量子化部603は、分離部601から入力される予測パラメータ符号化情報を復号し、復号量子化インデックスに対応する、復号予測パラメータ(復号M-L予測係数XLM及び復号M-R予測係数XRM)をチャネル予測部605に出力する。
残差復号部604は、分離部601から入力される残差符号化情報を復号し、L信号の復号残差信号E’及びR信号の復号残差信号E’を得る。残差復号部604は、復号残差信号E’及び復号残差信号E’を加算部606に出力する。
チャネル予測部605は、M信号復号部602から入力される復号M信号、及び、予測係数復号逆量子化部603から入力される復号予測パラメータ(復号M-L予測係数及びM-R予測係数)を用いて、L信号及びR信号を予測する。チャネル予測部605は、予測L信号及び予測R信号を加算部606に出力する。
例えば、チャネル予測部605は、チャネル予測部506と同様、式(13)及び式(14)に従って予測L信号L’を算出し、式(15)及び式(16)に従って予測R信号R’を算出する。
加算部606は、残差復号部604から入力される復号残差信号E’と、チャネル予測部605から入力される予測L信号とを加算し、加算結果である復号L信号L^を出力する。また、加算部606は、残差復号部604から入力される復号残差信号E’と、チャネル予測部605から入力される予測R信号とを加算し、加算結果である復号R信号R^を出力する。
以上、本実施の形態に係る符号化装置500及び復号装置600について説明した。
このように、本実施の形態では、L信号及びR信号の予測符号化を行う場合、符号化装置500は、M信号と、L信号及びR信号と、を用いて予測パラメータ(M-L予測係数及びM-R予測係数)を算出する。また、符号化装置500は、復号M信号及び復号予測パラメータを用いてL信号及びR信号を予測する。換言すると、符号化装置500は、復号装置600におけるL信号及びR信号の予測処理と同様の条件でL信号及びR信号の予測処理を行い、復号装置600における処理を再現する。よって、符号化装置500では、M信号の符号化誤差、および、M-L予測及びM-R予測の予測誤差と符号化誤差を考慮したチャネル予測符号化が可能となり、チャネル予測符号化において、L信号及びR信号の符号化性能を向上できる。
よって、本実施の形態によれば、チャネル予測符号化において、L信号及びR信号を効率良く符号化できる。例えば、本実施の形態は、M信号の符号化誤差(又は、符号化歪み)が大きくなるような低ビットレートにおいて特に有効である。
なお、図6において、予測係数算出部503は、ダウンミックス部501から入力されるM信号を用いてM-L予測係数及びM-R予測係数を算出する場合について説明した。しかし、予測係数算出部503は、M信号の代わりに、M信号符号化部502から入力される復号M信号を用いてM-L予測係数及びM-R予測係数を算出してもよい。これにより、符号化装置500は、復号装置600において使用される復号M信号を用いて予測パラメータを算出できるので、復号装置600でのL信号及びR信号の予測精度を向上できる。
また、本実施の形態では、ステレオ信号(Lチャネル及びRチャネルの2チャネルの信号)の符号化について説明したが、符号化される信号はステレオ信号に限定されず、マルチチャネル信号(例えば、2チャネル以上の信号)でもよい。
例えば、図8は、マルチチャネル信号(Nチャネル。ただし、Nは2以上の整数)を符号化する符号化装置500aの構成例を示すブロック図を示し、図9は、マルチチャネル信号を復号する復号装置600aの構成例を示すブロック図を示す。図8に示す符号化装置500a及び図9に示す復号装置600aの各構成部は、図6に示す符号化装置500及び図7に示す復号装置600の各構成部と同様の処理を行う。ただし、図6及び図7では、ステレオ信号を構成するL信号及びR信号の2チャネルに対する処理が行われるのに対して、図8及び図9では、Nチャネルに対する処理が行われる点が異なる。すなわち、符号化装置500a及び復号装置600aは、M信号(又は復号M信号)を用いて、各チャネル信号を予測する。
(実施の形態4)
本実施の形態では、MS予測符号化を含む複数の符号化モードのうち、ステレオ信号の符号化に用いる符号化モードを切り替える方法について説明する。
[通信システムの概要]
本実施の形態に係る通信システムは、符号化装置(encoder)700及び復号装置(decoder)800を備える。
[符号化装置の構成]
図10は、本実施の形態に係る符号化装置700の構成例を示すブロック図である。図10において、符号化装置700は、ダウンミックス部701と、M信号符号化部702と、S信号符号化部703と、符号化モード符号化部704と、多重化部705と、を含む。
図10において、ダウンミックス部701及びS信号符号化部703には、ステレオ信号を構成するL信号(Left channel signal)、及び、R信号(Right channel signal)が入力される。
ダウンミックス部701は、入力されるL信号及びR信号を、M信号及びS信号に変換(LR-MS変換)する。ダウンミックス部701は、M信号をM信号符号化部702及びS信号符号化部703に出力し、S信号をS信号符号化部703に出力する。例えば、ダウンミックス部701は、式(1)又は式(2)に従ってL信号及びR信号を、M信号及びS信号に変換する。
M信号符号化部702は、ダウンミックス部701から入力されるM信号を符号化し、符号化結果(M信号符号化情報)Cmを多重化部705に出力する。
S信号符号化部703は、入力されるL信号及びR信号、及び、ダウンミックス部701から入力されるM信号及びS信号の少なくとも1つを用いて、S信号を符号化する。S信号符号化部703は、符号化結果(S信号符号化情報)Csを多重化部705に出力する。
例えば、S信号符号化部703は、M-S予測符号化を行う「予測モード」、及び、通常の符号化を行う「通常モード」の双方の符号化モードを用いて、S信号を符号化する。そして、S信号符号化部703は、予測モードの符号化結果と、通常モードの符号化結果とを比較して、より良い符号化結果の符号化モードを選択し、選択した符号化モードの符号化結果を含むS信号符号化情報Csを多重化部705に出力する。また、S信号符号化部703は、選択した符号化モードを示す情報を符号化モード符号化部704に出力する。
「予測モード」では、S信号符号化部703は、例えば、実施の形態1(例えば、図2を参照)又は実施の形態2(例えば、図4を参照)において説明したように、S信号を符号化する。符号化モードとして予測モードが選択される場合、S信号符号化部703は、S信号符号化情報Csとして、予測パラメータ符号化情報、及び、残差符号化情報を多重化部705に出力する。
また、「通常モード」では、S信号符号化部703は、例えば、M/Sステレオコーデックにおいて、S信号に対してモノラル符号化を行う。符号化モードとして通常モードが選択される場合、S信号符号化部703は、S信号符号化情報Csとして、S信号のモノラル符号化結果を多重化部705に出力する。
例えば、S信号符号化部703は、予測モードの符号化結果及び通常モードの符号化結果のうち、符号化誤差がより小さい符号化モードを選択してもよい。または、S信号符号化部703は、予測モードの符号化結果及び通常モードの符号化結果のうち、符号化結果に要するビット数がより少ない符号化モードを選択してもよい。なお、符号化モードの選択基準は、符号化誤差及び符号化ビット数に限定されず、符号化性能に関する他の基準でもよい。
符号化モード符号化部704は、S信号符号化部703から入力される符号化モードを符号化し、得られるモード符号化情報Cgを多重化部705に出力する。
多重化部705は、M信号符号化部702から入力されるM信号符号化情報、S信号符号化部703から入力されるS信号符号化情報、及び、符号化モード符号化部704から入力されるモード符号化情報を多重化する。多重化部705は、例えば、得られるビットストリームを、トランスポート層等を介して復号装置800へ送信する。
[復号装置の構成]
図11は、本実施の形態に係る復号装置800の構成例を示すブロック図である。図11において、復号装置800は、分離部801と、M信号復号部802と、符号化モード復号部803と、S信号復号部804と、アップミックス部805と、を含む。
図11において、分離部801には、符号化装置700から送信されるビットストリームが入力される。ビットストリームには、例えば、M信号符号化情報Cm、S信号符号化情報Cs、及び、モード符号化情報Cgが多重化されている。
分離部801は、入力されるビットストリームから、M信号符号化情報と、S信号符号化情報と、モード符号化情報とを分離する。分離部801は、M信号符号化情報をM信号復号部802に出力し、モード符号化情報を符号化モード復号部803に出力し、S信号符号化モードをS信号復号部804に出力する。
M信号復号部802は、分離部801から入力されるM信号符号化情報を復号し、復号M信号M’を、S信号復号部804及びアップミックス部805に出力する。
符号化モード復号部803は、分離部801から入力されるモード符号化情報を復号し、得られた符号化モードを示す情報を、S信号復号部804に出力する。
S信号復号部804は、符号化モード復号部803から入力される符号化モードに基づいて、S信号符号化情報を復号し、復号S信号S’を得る。S信号復号部804は、復号S信号をアップミックス部805に出力する。
符号化モードが「予測モード」の場合、S信号復号部804は、例えば、実施の形態1(例えば、図3を参照)又は実施の形態2(例えば、図5を参照)において説明したように、M信号復号部802から入力される復号M信号、及び、分離部801から入力されるS信号符号化情報(予測パラメータ及び残差信号)を用いてS信号を予測・復号する。
また、符号化モードが「通常モード」の場合、S信号復号部804は、例えば、S信号符号化情報に対してモノラル復号を行い、復号S信号を得る。
アップミックス部805は、M信号復号部802から入力される復号M信号M’、及び、S信号復号部804から入力される復号S信号S’を、復号L信号L’及び復号R信号R’に変換(MS-LR変換)する。例えば、アップミックス部805は、式(5)又は式(6)に従って復号M信号及び復号S信号を、復号L信号及び復号R信号に変換する。
以上、本実施の形態に係る符号化装置700及び復号装置800について説明した。
このように、本実施の形態では、符号化装置700は、S信号に対して、予測符号化及びモノラル符号化の双方の符号化を行い、符号化結果がより良い符号化モードを選択する。これにより、符号化装置700は、S信号を効率良く符号化でき、復号装置800では、S信号の復号性能を向上できる。
なお、本実施の形態では、S信号に対する符号化モードとして、予測モード及び通常モードを用いる場合について説明した。しかし、S信号に対する符号化モードは、予測モード及び通常モード以外の符号化モードでもよい。また、本実施の形態では、2種類の符号化モードを用いる場合について説明したが、3種類以上の符号化モードを用いてもよい。例えば、L信号とR信号との相関が低い場合には、MSステレオ符号化を用いず、LRをデュアルモノ符号化するモードを用いても良い。
また、本実施の形態において、S信号に対する符号化処理は、複数のサブバンド毎に行われてもよく、複数のサブバンド全体に対して行われてもよい。S信号に対する符号化処理が複数のサブバンド毎に行われる場合、S信号符号化情報及びモード符号化情報は、サブバンド毎に生成される。また、この場合、モード符号化情報は、例えば、予測モードが選択された帯域を「1」で表し、通常モードが選択された帯域を「0」で表すバイナリ符号化情報でもよい。
(実施の形態5)
実施の形態4では、符号化装置において複数の符号化モードを用いてS信号をそれぞれ符号化し、符号化結果がより良好である符号化モードを選択する場合について説明した。これに対して、実施の形態5では、符号化装置において、複数の符号化モードの中から1つの符号化モードを選択し、選択した符号化モードを用いてS信号を符号化する場合について説明する。
図12は、本実施の形態に係る符号化装置900の構成例を示すブロック図である。なお、図12において、実施の形態4と同様の構成には同一の符号を付し、その説明を省略する。また、本実施の形態に係る復号装置は、実施の形態4に係る復号装置800と基本構成が共通するので、図11を援用して説明する。
図12に示す符号化装置900において、相互相関算出部901は、入力されるL信号とR信号との正規化相互相関を算出する。例えば、相互相関算出部901は、サブバンド毎の正規化相互相関値を算出する。相互相関算出部901は、算出したサブバンド毎の正規化相互相関値をサブバンド分類部902に出力する。
例えば、相互相関算出部901は、次式(17)に従って、サブバンドbの正規化相互相関値XLR(b)を算出する。
Figure 0007407110000017
式(17)において、kstartはサブバンドbにおけるスペクトル係数の開始番号を示し、kendはサブバンドbにおけるスペクトル係数の終了番号を示し、bは0,1,…, Nbands-1である。Nbandsはサブバンド数を示す。また、「*」は複素共役を示し、関数E(x)は、xの期待値を返す関数である。
サブバンド分類部902は、相互相関算出部901から入力されるサブバンド毎の正規化相互相関値に基づいて、サブバンドを複数のグループに分類する。サブバンドのグループ数は、例えば、S信号符号化部903において選択可能な符号化モードの数と同一でもよい。例えば、サブバンド分類部902は、正規化相互相関値が所定の範囲であるサブバンドを予測モード(例えば、MS予測符号化)に対応するグループに分類し、正規化相互相関値が上記所定の範囲以外であるサブバンドを通常モード(例えば、モノラル符号化)に対応するグループに分類する。サブバンド分類部902は、サブバンドの分類結果を示す分類情報をS信号符号化部903及び分類情報符号化部904に出力する。
S信号符号化部903は、サブバンド分類部902から入力される分類情報に基づいて、S信号の符号化モード(例えば、予測モード又は通常モードの何れか)を選択する。そして、S信号符号化部903は、選択した符号化モードに基づいて、ダウンミックス部701から入力されるS信号を符号化し、符号化結果(S信号符号化情報)Csを多重化部705に出力する。
分類情報符号化部904は、サブバンド分類部902から入力される分類情報を符号化し、符号化結果(モード符号化情報)Cgを多重化部705に出力する。例えば、分類情報符号化部904は、予測モードに対応するグループに含まれるサブバンドを「1」で表し、通常モードに対応するグループに含まれるサブバンドを「0」で表すバイナリ符号化情報を生成してもよい。
復号装置800(例えば、図11を参照)は、モード符号化情報(換言すると、分類情報)に基づいて、S信号の符号化モードをサブバンド毎に決定し、決定した符号化モードに従って、S信号を復号する。
次に、サブバンド分類部902におけるサブバンドの分類方法の一例を説明する。
MS符号化では、例えば、L信号とR信号とのスペクトル形状が似ているほど(換言すると、正規化相互相関値が高いほど)、L信号とR信号との差を示すS信号をより少ないビット数を用いて高効率に符号化できる。換言すると、L信号及びR信号の正規化相互相関値が高いほど、MS予測符号化(予測モード)によりS信号を予測しなくても、通常モードの符号化によってS信号を高効率に符号化できる。
一方、L信号とR信号とのスペクトル形状が似ていない場合(換言すると、正規化相互相関値が低い場合)、MS予測符号化(予測モード)の予測誤差はより大きくなるので、MS予測符号化では、通常モードの符号化よりも符号化ビット数をより多く要する可能性がある。
そこで、例えば、サブバンド分類部902は、正規化相互相関値XLR(b)が0.5~0.8の範囲のサブバンドbを、予測モードに対応するサブバンドに分類する。また、サブバンド分類部902は、正規化相互相関値XLR(b)が0.5~0.8の範囲以外のサブバンドbを、通常モードに対応するサブバンドに分類する。
これにより、例えば、正規化相互相関値XLR(b)が0.8より大きいサブバンドbでは、S信号符号化部903は、L信号とR信号との差信号(すなわちS信号)が小さいことが期待されるので、通常モードを用いてS信号を高効率に符号化できる。また、例えば、正規化相互相関値XLR(b)が0.5~0.8の範囲のサブバンドbでは、S信号符号化部903は、予測モードを用いてS信号を符号化することにより、通常モードを用いる場合と比較して、S信号符号化情報のビット数を削減できる。また、例えば、正規化相互相関値XLR(b)が0.5未満のサブバンドbでは、S信号符号化部903は、通常モードでS信号を符号化することにより、S信号符号化情報のビット数が不用意に多くなることを回避することができる。
なお、予測モードに対応するサブバンドに分類する正規化相互相関値XLR(b)の範囲は、0.5~0.8の範囲に限定されず、他の範囲でもよい。
このように、本実施の形態では、符号化装置900は、L信号とR信号との相関に適した符号化モードを選択することにより、S信号を効率良く符号化できる。また、符号化装置900は、L信号とR信号との相関に基づいて選択された1つの符号化モードを用いてS信号を符号化するので、複数の符号化モードのそれぞれを用いて符号化を行う場合と比較して演算量を削減できる。
なお、本実施の形態では、S信号の符号化モードに、予測モード及び通常モードの2種類のモードを用いる場合について説明した。しかし、S信号の符号化モードは、3種類以上でもよい。この場合、サブバンド分類部902は、複数のサブバンドを、S信号の符号化モードと同数のグループに分類すればよい。
例えば、サブバンド分類部902は、正規化相互相関値XLR(b)が0.5~0.8の範囲のサブバンドbを、予測モードに対応するサブバンドに分類し、正規化相互相関値XLR(b)が0.8より大きい範囲のサブバンドbを、通常モード(例えば、モノラル符号化)に対応するサブバンドに分類し、正規化相互相関値XLR(b)が0.5未満の範囲のサブバンドbを、デュアルモノモード(デュアルモノ符号化)に対応するサブバンドに分類してもよい。デュアルモノ符号化では、S信号符号化部903は、L信号及びR信号を別々にモノラル符号化する。
また、符号化装置900が用いる符号化モードは、上述したような2種類又は3種類に限定されず、4種類以上でもよい。
また、本実施の形態では、サブバンド毎の符号化モードを決定する場合について説明したが、符号化モードはサブバンド単位に決定される場合に限定されない。例えば、符号化モードは、複数のサブバンドのグループ単位に決定されてもよく、全ての帯域において決定されてもよい。
また、本実施の形態では、符号化装置900は、L信号とR信号との正規化相互相関値に基づいて、符号化モードを選択する場合について説明したが、符号化モードの選択基準となるパラメータは、正規化相互相関値に限定されず、例えば、L信号とR信号との相関に関する他のパラメータでもよい。
または、符号化モードの選択基準となるパラメータは、M-S予測における予測利得でもよい。例えば、符号化装置900は、算出した予測利得が高い場合(例えば、所定の閾値を超えるあるいは所定の閾値以上の場合)に予測モードを選択しても良い。予測利得は、予測対象となる信号(本実施の形態ではS信号)と予測残差信号(予測されたS信号と実際のS信号との誤差信号)とのS/N比として定義できる。この場合、S信号を対象とした場合のS/N比の逆数は、次式(18)で表される。
Figure 0007407110000018
式(18)において、MEne(b)はサブバンドbにおけるM信号のエネルギを示し、SEne(b)はサブバンドbにおけるS信号のエネルギを示し、XSM(b)はサブバンドbにおけるS信号とM信号との相互相関値を示し、SはサブバンドbにおけるS信号を示し、MはサブバンドbにおけるM信号を示し、SはサブバンドbにおけるS信号とM信号とのクロススペクトルを示し、S(k)はサブバンドb内の各周波数ビンkにおけるS信号を示し、M(k)はサブバンドb内の各周波数ビンkにおけるM信号を示し、HはサブバンドbにおけるM-S予測係数を示す(例えば、式(7)を参照)。関数E(x)はxの期待値を返す関数を表す。
式(18)によれば、(XSM(b))/E(SEne(b))E(MEne(b))が大きいほど、予測利得が高くなる。つまり、符号化装置900は、M信号とS信号との相互相関の二乗をM信号のエネルギとS信号のエネルギとを掛けた値で正規化して得られる、「M信号とS信号との正規化相互相関」を算出する。そして、符号化装置900は、「M信号とS信号との正規化相互相関」が所定の閾値以上(または閾値を超える)場合に予測利得が高いと判断して、予測モードを用いるようにすればよい。また、符号化装置900は、例えば、予測利得が低い場合にデュアルモノ符号化モードを用いるようにすれば、モードの判定にL信号及びR信号の相互相関(例えば、式(17)又はこれに準じた式)を計算する必要はない。この場合の符号化装置900aの構成を図13に示す。図13に示す符号化装置900aでは、符号化装置900(図12)と比較すると、相互相関算出部901aの入力信号がダウンミックス部701の出力信号であるM信号とS信号になっている点が異なる。また、図13において、相互相関算出部901aは、上述した「M信号とS信号との正規化相互相関」を算出する。
以上、本開示の各実施の形態について説明した。
なお、本開示はソフトウェア、ハードウェア、又は、ハードウェアと連携したソフトウェアで実現することが可能である。上記実施の形態の説明に用いた各機能ブロックは、部分的に又は全体的に、集積回路であるLSIとして実現され、上記実施の形態で説明した各プロセスは、部分的に又は全体的に、一つのLSI又はLSIの組み合わせによって制御されてもよい。LSIは個々のチップから構成されてもよいし、機能ブロックの一部または全てを含むように一つのチップから構成されてもよい。LSIはデータの入力と出力を備えてもよい。LSIは、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。集積回路化の手法はLSIに限るものではなく、専用回路、汎用プロセッサ又は専用プロセッサで実現してもよい。また、LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。本開示は、デジタル処理又はアナログ処理として実現されてもよい。さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
本開示は、通信機能を持つあらゆる種類の装置、デバイス、システム(通信装置と総称)において実施可能である。通信装置の、非限定的な例としては、電話機(携帯電話、スマートフォン等)、タブレット、パーソナル・コンピューター(PC)(ラップトップ、デスクトップ、ノートブック等)、カメラ(デジタル・スチル/ビデオ・カメラ等)、デジタル・プレーヤー(デジタル・オーディオ/ビデオ・プレーヤー等)、着用可能なデバイス(ウェアラブル・カメラ、スマートウオッチ、トラッキングデバイス等)、ゲーム・コンソール、デジタル・ブック・リーダー、テレヘルス・テレメディシン(遠隔ヘルスケア・メディシン処方)デバイス、通信機能付きの乗り物又は移動輸送機関(自動車、飛行機、船等)、及び上述の各種装置の組み合わせがあげられる。
通信装置は、持ち運び可能又は移動可能なものに限定されず、持ち運びできない又は固定されている、あらゆる種類の装置、デバイス、システム、例えば、スマート・ホーム・デバイス(家電機器、照明機器、スマートメーター又は計測機器、コントロール・パネル等)、自動販売機、その他IoT(Internet of Things)ネットワーク上に存在し得るあらゆる「モノ(Things)」をも含む。
通信には、セルラーシステム、無線LANシステム、通信衛星システム等によるデータ通信に加え、これらの組み合わせによるデータ通信も含まれる。
また、通信装置には、本開示に記載される通信機能を実行する通信デバイスに接続又は連結される、コントローラやセンサー等のデバイスも含まれる。例えば、通信装置の通信機能を実行する通信デバイスが使用する制御信号やデータ信号を生成するような、コントローラやセンサーが含まれる。
また、通信装置には、上記の非限定的な各種装置と通信を行う、あるいはこれら各種装置を制御する、インフラストラクチャ設備、例えば、基地局、アクセスポイント、その他あらゆる装置、デバイス、システムが含まれる。
本開示の一実施例における符号化装置は、ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1の符号化情報を生成する第1符号化回路と、前記左チャネル信号と前記右チャネル信号との間のエネルギ差に関するパラメータを用いて、前記左チャネル信号と前記右チャネル信号との差を示す差信号を予測するための予測パラメータを算出する算出回路と、前記予測パラメータを符号化して、第2の符号化情報を生成する第2符号化回路と、を具備する。
本開示の一実施例における符号化装置において、前記予測パラメータ及び前記和信号を用いて前記差信号を予測して、予測差信号を生成する予測回路と、前記差信号と前記予測差信号との残差信号を符号化して、第3の符号化情報を生成する第3符号化回路と、を更に具備する。
本開示の一実施例における符号化装置において、前記第3符号化情報には、前記和信号と、前記第1の符号化情報を復号して得られる復号和信号との残差信号の符号化結果が含まれる。
本開示の一実施例における符号化装置において、前記エネルギ差に関するパラメータは、前記第1の符号化情報を復号して得られる復号和信号と前記差信号との相関値を、前記復号和信号のエネルギで正規化して得られる係数である。
本開示の一実施例における符号化装置において、前記第2の符号化回路は、前記予測パラメータに対してエントロピ符号化を行う。
本開示の一実施例における符号化方法は、ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1の符号化情報を生成し、前記左チャネル信号と前記右チャネル信号との間のエネルギ差に関するパラメータを用いて、前記左チャネル信号と前記右チャネル信号との差を示す差信号を予測するための予測パラメータを算出し、前記予測パラメータを符号化して、第2の符号化情報を生成する。
2018年7月3日出願の特願2018-126842及び2018年11月7日出願の特願2018-209940の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本開示の一実施例は、MS予測符号化技術を用いた音声通信システムに有用である。
100,300,500,700,900,900a 符号化装置
101 エネルギ差算出部
102,302 量子化部
103,303 エントロピ符号化部
104,304,505 逆量子化部
105,501,701 ダウンミックス部
106,502,702 M信号符号化部
107,110,206,209 加算器
108,207 M信号エネルギ算出部
109,208,305,404 M-S予測部
111,306,508 残差符号化部
112,509,705 多重化部
200,400,600,800 復号装置
201,601,801 分離部
202,401 エントロピ復号部
203 エネルギ差復号部
204,403,604 残差復号部
205,602,802 M信号復号部
210,805 アップミックス部
301,503 予測係数算出部
402 予測係数復号部
504 量子化符号化部
506,605 チャネル予測部
507 残差算出部
603 予測係数復号逆量子化部
606 加算部
703,903 S信号符号化部
704 符号化モード符号化部
803 符号化モード復号部
804 S信号復号部
901,901a 相互相関算出部
902 サブバンド分類部
904 分類情報符号化部

Claims (5)

  1. ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1の符号化情報を生成する第1符号化回路と、
    前記左チャネル信号と前記右チャネル信号との間のエネルギ差に関するパラメータを用いて、前記左チャネル信号と前記右チャネル信号との差を示す差信号を予測するための予測パラメータを算出する算出回路と、
    前記予測パラメータを符号化して、第2の符号化情報を生成する第2符号化回路と、
    を具備し、
    前記エネルギ差に関するパラメータは、前記第1の符号化情報を復号して得られる復号和信号と前記差信号との相関値を、前記復号和信号のエネルギで正規化して得られる係数である、
    符号化装置。
  2. 前記予測パラメータ及び前記和信号を用いて前記差信号を予測して、予測差信号を生成する予測回路と、
    前記差信号と前記予測差信号との残差信号を符号化して、第3の符号化情報を生成する第3符号化回路と、を更に具備する、
    請求項1に記載の符号化装置。
  3. 前記第3符号化情報には、前記和信号と、前記第1の符号化情報を復号して得られる復号和信号との残差信号の符号化結果が含まれる、
    請求項2に記載の符号化装置。
  4. 前記第2符号化回路は、前記予測パラメータに対してエントロピ符号化を行う、
    請求項1に記載の符号化装置。
  5. ステレオ信号を構成する左チャネル信号と右チャネル信号との和を示す和信号を符号化して、第1の符号化情報を生成し、
    前記左チャネル信号と前記右チャネル信号との間のエネルギ差に関するパラメータを用いて、前記左チャネル信号と前記右チャネル信号との差を示す差信号を予測するための予測パラメータを算出し、
    前記予測パラメータを符号化して、第2の符号化情報を生成し、
    前記エネルギ差に関するパラメータは、前記第1の符号化情報を復号して得られる復号和信号と前記差信号との相関値を、前記復号和信号のエネルギで正規化して得られる係数である、
    符号化方法。
JP2020528992A 2018-07-03 2019-07-02 符号化装置及び符号化方法 Active JP7407110B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2018126842 2018-07-03
JP2018126842 2018-07-03
JP2018209940 2018-11-07
JP2018209940 2018-11-07
PCT/JP2019/026200 WO2020009082A1 (ja) 2018-07-03 2019-07-02 符号化装置及び符号化方法

Publications (2)

Publication Number Publication Date
JPWO2020009082A1 JPWO2020009082A1 (ja) 2021-08-02
JP7407110B2 true JP7407110B2 (ja) 2023-12-28

Family

ID=69060388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020528992A Active JP7407110B2 (ja) 2018-07-03 2019-07-02 符号化装置及び符号化方法

Country Status (4)

Country Link
US (1) US11545165B2 (ja)
JP (1) JP7407110B2 (ja)
CN (1) CN112352277B (ja)
WO (1) WO2020009082A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017125562A1 (en) 2016-01-22 2017-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
WO2017161315A1 (en) 2016-03-18 2017-09-21 Qualcomm Incorporated Multi channel coding

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
JP4950040B2 (ja) * 2004-06-21 2012-06-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
JP2006323314A (ja) * 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd マルチチャネル音声信号をバイノーラルキュー符号化する装置
US7991272B2 (en) * 2005-07-11 2011-08-02 Lg Electronics Inc. Apparatus and method of processing an audio signal
JP2007183528A (ja) * 2005-12-06 2007-07-19 Fujitsu Ltd 符号化装置、符号化方法、および符号化プログラム
JP2008203315A (ja) * 2007-02-16 2008-09-04 Matsushita Electric Ind Co Ltd オーディオ符号化・復号化装置、方法、及びソフトウェア
CN101981616A (zh) * 2008-04-04 2011-02-23 松下电器产业株式会社 立体声信号变换装置、立体声信号逆变换装置及其方法
US8811621B2 (en) 2008-05-23 2014-08-19 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
CA2754671C (en) * 2009-03-17 2017-01-10 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
CN101533641B (zh) * 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
US8660851B2 (en) * 2009-05-26 2014-02-25 Panasonic Corporation Stereo signal decoding device and stereo signal decoding method
US8924207B2 (en) * 2009-07-23 2014-12-30 Texas Instruments Incorporated Method and apparatus for transcoding audio data
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
AU2011240239B2 (en) * 2010-04-13 2014-06-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
CN103180899B (zh) * 2010-11-17 2015-07-22 松下电器(美国)知识产权公司 立体声信号的编码装置、解码装置、编码方法及解码方法
US8654984B2 (en) 2011-04-26 2014-02-18 Skype Processing stereophonic audio signals
RU2625444C2 (ru) * 2013-04-05 2017-07-13 Долби Интернэшнл Аб Система обработки аудио
US10152977B2 (en) * 2015-11-20 2018-12-11 Qualcomm Incorporated Encoding of multiple audio signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017125562A1 (en) 2016-01-22 2017-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
WO2017161315A1 (en) 2016-03-18 2017-09-21 Qualcomm Incorporated Multi channel coding

Also Published As

Publication number Publication date
CN112352277A (zh) 2021-02-09
WO2020009082A1 (ja) 2020-01-09
JPWO2020009082A1 (ja) 2021-08-02
US11545165B2 (en) 2023-01-03
US20210280201A1 (en) 2021-09-09
CN112352277B (zh) 2024-05-31

Similar Documents

Publication Publication Date Title
KR101340233B1 (ko) 스테레오 부호화 장치, 스테레오 복호 장치 및 스테레오부호화 방법
US8374883B2 (en) Encoder and decoder using inter channel prediction based on optimally determined signals
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
WO2009144953A1 (ja) 符号化装置、復号装置およびこれらの方法
KR102460820B1 (ko) Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치
EP2856776B1 (en) Stereo audio signal encoder
KR102327149B1 (ko) Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치
JP5746974B2 (ja) 符号化装置、復号装置およびこれらの方法
US20100017197A1 (en) Voice coding device, voice decoding device and their methods
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JP5714002B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
US8271275B2 (en) Scalable encoding device, and scalable encoding method
JPWO2010140350A1 (ja) ダウンミックス装置、符号化装置、及びこれらの方法
US20160111100A1 (en) Audio signal encoder
WO2011045926A1 (ja) 符号化装置、復号装置およびこれらの方法
JP7407110B2 (ja) 符号化装置及び符号化方法
US20170243592A1 (en) Method and apparatus for coding or decoding subband configuration data for subband groups
JP2022188262A (ja) ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
KR102363275B1 (ko) Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치
JP5990954B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム
JP5544371B2 (ja) 符号化装置、復号装置およびこれらの方法
RU2821284C1 (ru) Распределение скоростей передачи битов в иммерсивных голосовых и аудиослужбах
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231218

R150 Certificate of patent or registration of utility model

Ref document number: 7407110

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150