CN112352277A - 编码装置及编码方法 - Google Patents

编码装置及编码方法 Download PDF

Info

Publication number
CN112352277A
CN112352277A CN201980042253.6A CN201980042253A CN112352277A CN 112352277 A CN112352277 A CN 112352277A CN 201980042253 A CN201980042253 A CN 201980042253A CN 112352277 A CN112352277 A CN 112352277A
Authority
CN
China
Prior art keywords
signal
encoding
unit
prediction
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980042253.6A
Other languages
English (en)
Other versions
CN112352277B (zh
Inventor
S.纳吉塞蒂
江原宏幸
R.马斯
C.S.利姆
樱井利昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN112352277A publication Critical patent/CN112352277A/zh
Application granted granted Critical
Publication of CN112352277B publication Critical patent/CN112352277B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供一种编码装置,该编码装置能够在中/侧预测编码即MS预测编码中高效地对S信号进行编码。M信号编码部(106)对表示左声道信号与右声道信号之和的和信号进行编码,产生第一编码信息,该左声道信号和该右声道信号构成立体声信号。能量差计算部(101)使用与左声道信号和右声道信号之间的能量差相关的参数,计算用于预测表示左声道信号与右声道信号之差的差信号的预测参数。熵编码部(103)对预测参数进行编码,产生第二编码信息。

Description

编码装置及编码方法
技术领域
本发明涉及编码装置及编码方法。
背景技术
M/S(Middle/Side,中/侧)立体声编解码器将构成立体声信号的各声道(左声道及右声道)的信号转换成M信号(或称为“和信号”)及S信号(或称为“差信号”),并通过单声道语音声音编解码器,分别对M信号及S信号进行编码。另外,已提出了在M/S立体声编解码器中,使用M信号来对S信号进行预测的编码方法(以下,称为“MS预测编码”)(例如,参照专利文献1~专利文献3)。
现有技术文献
专利文献
专利文献1:日本专利第5122681号公报
专利文献2:日本专利特表2014-516425号公报
专利文献3:日本专利第5705964号公报
非专利文献
非专利文献1:Recommendation ITU-T G.719(06/2008),"Low-complexity,full-band audio coding for high-quality,conversational applications",ITU-T,2008.
非专利文献2:3GPP TS 26.290V12.0.0,"Audio codec processing functions;Extended Adaptive Multi-Rate-Wideband(AMR-WB+)codec;Transcoding functions(Release 12)",2014-09
发明内容
但是,针对在MS预测编码中高效地对S信号进行编码的方法,尚未充分地研究。
本发明的非限定性的实施例有助于提供能够在MS预测编码中高效地对S信号进行编码的编码装置及编码方法。
本发明的一个实施例的编码装置包括:第一编码电路,对表示左声道信号与右声道信号之和的和信号进行编码,产生第一编码信息,该左声道信号和该右声道信号构成立体声信号;计算电路,使用与所述左声道信号和所述右声道信号之间的能量差相关的参数,计算用于预测表示所述左声道信号与所述右声道信号之差的差信号的预测参数;以及第二编码电路,对所述预测参数进行编码,产生第二编码信息。
本发明的一个实施例的编码方法包括以下步骤:对表示左声道信号与右声道信号之和的和信号进行编码,产生第一编码信息,该左声道信号和该右声道信号构成立体声信号;使用与所述左声道信号和所述右声道信号之间的能量差相关的参数,计算用于预测表示所述左声道信号与所述右声道信号之差的差信号的预测参数;以及对所述预测参数进行编码,产生第二编码信息。
应予说明,这些总括性的或具体的方式可由***、装置、方法、集成电路、电脑程序或记录介质实现,也可由***、装置、方法、集成电路、电脑程序及记录介质的任意的组合实现。
根据本发明的一个实施例,能够在MS预测编码中高效地对S信号进行编码。
本发明的一个实施例的更多优点及效果将通过说明书和附图予以阐明。这些优点和/或效果分别由若干个实施方式、以及说明书及附图所记载的特征提供,但未必需要为了获得一个或一个以上的相同特征而全部提供。
附图说明
图1是表示实施方式1的编码装置的一部分的结构例的方框图。
图2是表示实施方式1的编码装置的结构例的方框图。
图3是表示实施方式1的解码装置的结构例的方框图。
图4是表示实施方式2的编码装置的结构例的方框图。
图5是表示实施方式2的解码装置的结构例的方框图。
图6是表示实施方式3的编码装置的结构例的方框图。
图7是表示实施方式3的解码装置的结构例的方框图。
图8是表示实施方式3的编码装置的其他结构例的方框图。
图9是表示实施方式3的解码装置的其他结构例的方框图。
图10是表示实施方式4的编码装置的结构例的方框图。
图11是表示实施方式4的解码装置的结构例的方框图。
图12是表示实施方式5的编码装置的结构例的方框图。
图13是表示实施方式5的编码装置的其他结构例的方框图。
具体实施方式
以下,参照附图来详细地说明本发明的实施方式。
(实施方式1)
[通信***的概要]
本实施方式的通信***包括编码装置(编码器(encoder))100及解码装置(解码器(decoder))200。
图1是表示本实施方式的编码装置100的一部分的结构的方框图。在图1所示的编码装置100中,M信号编码部106对表示左声道信号与右声道信号之和的和信号进行编码,产生第一编码信息,该左声道信号和该右声道信号构成立体声信号。能量差计算部101使用与左声道信号和右声道信号之间的能量差相关的参数,计算用于预测表示左声道信号与右声道信号之差的差信号的预测参数。熵编码部103对预测参数进行编码,产生第二编码信息。
[编码装置的结构]
图2是表示本实施方式的编码装置100的结构例的方框图。在图2中,编码装置100包括能量差计算部101、量化部102、熵编码部103、反量化部104、降混部105、M信号编码部106、加法器107、M信号能量计算部108、M-S预测部109、加法器110、残差编码部111及复用部112。
在图2中,构成立体声信号的L信号(左声道信号(Left channel signal))及R信号(右声道信号(Right channel signal))输入至能量差计算部101及降混部105。
能量差计算部101分别计算L信号的能量及R信号的能量,从而计算L信号与R信号之间的能量差dE。能量差计算部101将计算出的能量差dE作为用于预测表示L信号与R信号之差的S信号(差信号)的预测参数输出至量化部102。
量化部102对从能量差计算部101输入的预测参数进行标量量化,并将获得的量化指标输出至熵编码部103及反量化部104。此外,量化指标也可以是取相邻的子带之间的差分进行量化而得的量化指标。例如,量化部102也可在相邻的子带之间进行子带量化(称为“差值量化”)。在相邻的子带之间的量化值接近的情况下,有时,若是进行差值量化,熵编码效率会提高。
熵编码部103对从量化部102输入的量化指标进行熵编码(例如,哈夫曼编码(Huffman Coding)等。例如,参照非专利文献1或非专利文献2),并将编码结果(预测参数编码信息)输出至复用部112。
另外,熵编码部103计算编码结果所需的比特数,并将表示可用于编码结果的最大比特数与计算出的比特数之差(剩余比特数)的信息(换句话说,表示比最大比特数少几比特的信息)输出至M信号编码部106及残差编码部111中的至少一个编码部。
反量化部104对从量化部102输入的量化指标进行解码,将获得的解码预测参数(解码能量差)输出至M-S预测部109。
降混部105进行转换(LR-MS转换),将被输入的L信号及R信号转换成表示L信号与R信号之和的M信号(和信号)及表示L信号与R信号之差的S信号(差信号)。降混部105将M信号输出至M信号编码部106、加法器107、M信号能量计算部108及M-S预测部109。降混部105将S信号输出至加法器110。
例如,降混部105根据式(1),将L信号(L(f))及R信号(R(f))转换成M信号(M(f))及S信号(S(f))。
[式1]
Figure BDA0002853392830000051
此外,式(1)表示频域(频率f)中的LR-MS转换,但降混部105例如也可如式(2)所示,进行时域(时间n)中的LR-MS转换。
[式2]
Figure BDA0002853392830000052
M信号编码部106对从降混部105输入的M信号进行编码,并将编码结果(M信号编码信息)输出至复用部112。另外,M信号编码部106对编码结果进行解码,并将获得的解码M信号M'输出至加法器107。
此外,M信号编码部106也可基于从熵编码部103输入的表示剩余比特数的信息,决定(例如,增加)M信号的编码比特数。
加法器107计算从降混部105输入的M信号与从M信号编码部106输入的解码M信号之间的差分(或编码误差)即残差信号Em,并输出至残差编码部111。
M信号能量计算部108使用从降混部105输入的M信号,计算M信号的能量MEne,并输出至M-S预测部109。
M-S预测部109使用从降混部105输入的M信号、从M信号能量计算部108输入的M信号的能量及从反量化部104输入的解码预测参数(解码能量差),对S信号进行预测。
例如,M-S预测部109根据下式(3),计算预测S信号S~。
[式3]
S~b=HbMb (3)
在式(3)中,b表示子带编号,Mb表示子带b中的M信号,Hb表示子带b中的频率响应。频率响应Hb例如由下式(4)表示。
[式4]
Figure BDA0002853392830000053
在式(4)中,Lb表示子带b中的L信号,Rb表示子带b中的R信号,dE(b)表示子带b中的解码能量差。另外,函数E(x)是返回x的期望值的函数。
即,M-S预测部109将从反量化部104输入的预测参数即解码能量差(对应于式(4)的dE(b))与从M信号能量计算部108输入的M信号的能量(对应于式(4)的Mb 2)之比(对应于式(3)及式(4)的Hb)乘以M信号(对应于式(3)的Mb),由此,计算预测S信号S~b
此外,作为一例,式(3)示出了每个子带b的预测S信号(S~b),但并不限定于此。例如,M-S预测部109可以以包含多个子带的群组为单位计算预测S信号,也可以计算频域的整个频带中的预测S信号,还可以计算时域的预测S信号。
M-S预测部109将所获得的预测S信号输出至加法器110。
加法器110计算从降混部105输入的S信号与从M-S预测部109输入的预测S信号之间的差分(或编码误差)即残差信号Es,并输出至残差编码部111。
残差编码部111对从加法器107输入的残差信号Em及从加法器110输入的残差信号Es进行编码,并将编码结果(残差编码信息)输出至复用部112。例如,残差编码部111也可将残差信号Em与残差信号Es组合起来进行编码。
另外,残差编码部111也可基于从熵编码部103输入的表示剩余比特数的信息,决定(例如,增加)残差信号的编码比特数。
复用部112复用从熵编码部103输入的预测参数编码信息、从M信号编码部106输入的M信号编码信息及从残差编码部111输入的残差编码信息。复用部112例如经由传输层等将所获得的比特流向解码装置200发送。
[解码装置的结构]
图3是表示本实施方式的解码装置200的结构例的方框图。在图3中,解码装置200包括分离部201、熵解码部202、能量差解码部203、残差解码部204、M信号解码部205、加法器206、M信号能量计算部207、M-S预测部208、加法器209及上混部210。
在图3中,编码装置100所发送的比特流输入分离部201。在比特流中,例如预测参数编码信息、M信号编码信息及残差编码信息被复用。
分离部201从被输入的比特流分离预测参数编码信息、M信号编码信息及残差编码信息。分离部201将预测参数编码信息输出至熵解码部202,将残差编码信息输出至残差解码部204,并将M信号编码信息输出至M信号解码部205。
熵解码部202对从分离部201输入的预测参数编码信息进行解码,并将解码量化指标输出至能量差解码部203。
能量差解码部203对从熵解码部202输入的解码量化指标进行解码,将获得的解码预测参数(解码能量差dE)输出至M-S预测部208。
残差解码部204对从分离部201输入的残差编码信息进行解码,获得M信号的解码残差信号Em'及S信号的解码残差信号Es'。残差解码部204将解码残差信号Em'输出至加法器206,并将解码残差信号Es'输出至加法器209。
M信号解码部205对从分离部201输入的M信号编码信息进行解码,并将解码M信号M'输出至加法器206。
加法器206将从残差解码部204输入的解码残差信号Em'与从M信号解码部205输入的解码M信号M'相加,并将相加结果即解码M信号M^输出至M信号能量计算部207、M-S预测部208及上混部210。
M信号能量计算部207使用从加法器206输入的解码M信号M^,计算M信号的能量MEne^,并输出至M-S预测部208。
M-S预测部208使用从加法器206输入的解码M信号M^、从M信号能量计算部207输入的M信号的能量MEne^、以及从能量差解码部203输入的解码能量差dE,对S信号进行预测。
例如,M-S预测部208与M-S预测部109同样地,根据式(3)及式(4),将解码能量差dE(对应于式(4)的dE(b))与M信号的能量MEne^(对应于式(4)的Mb 2)之比(对应于式(3)及式(4)的Hb)乘以解码M信号M^(对应于式(3)的Mb),由此,计算预测S信号S'。
M-S预测部208将预测S信号S'输出至加法器209。
加法器209将从残差解码部204输入的解码残差信号Es'与从M-S预测部208输入的预测S信号S'相加,并将相加结果即解码S信号S^输出至上混部210。
上混部210进行转换(MS-LR转换),将从加法器206输入的解码M信号M^及从加法器209输入的解码S信号S^转换成解码L信号L^及解码R信号R^。例如,上混部210根据式(5),将解码M信号及解码S信号转换成解码L信号及解码R信号。
[式5]
Figure BDA0002853392830000081
此外,式(5)表示频域(频率f)中的MS-LR转换,但上混部210例如也可如式(6)所示,进行时域(时间n)中的MS-LR转换。
[式6]
Figure BDA0002853392830000082
以上,说明了本实施方式的编码装置100及解码装置200。
在本实施方式中,编码装置100计算L信号与R信号之间的能量差作为用于对S信号进行预测的预测参数。由此,编码装置100无需为对S信号进行预测而计算M信号与S信号之间的互相关,能够使用输入编码装置100的立体声信号(L信号及R信号的能量)计算预测S信号。
由此,编码装置100能够削减MS预测编码中的用于计算预测S信号的运算量。由此,根据本实施方式,能够在MS预测编码中高效地对S信号进行编码。
另外,在本实施方式中,编码装置100对表示L信号与R信号之间的能量差的预测参数(量化指标)进行熵编码。例如,在熵编码中,码长可变。由此,编码装置100在存在未被用于预测参数的编码的比特(剩余比特)的情况下,能够加上该剩余比特,对M信号或残差信号进行编码。即,编码装置100除了能够使用分别对M信号或残差信号分配的比特数之外,还能够使用通过熵编码获得的剩余比特,对M信号或残差信号进行编码。由此,根据本实施方式,能够提高编码装置100中的M信号或残差信号的量化性能,解码装置200能够实现高质量的解码立体声信号。
另外,在本实施方式中,编码装置100对M信号的残差信号Em进行编码,并向解码装置200发送。而且,解码装置200使用M信号的残差信号Em(解码残差信号),产生用于计算预测S信号的解码M信号M'。例如,若M信号的编码误差变大,则S信号的预测误差会变大,从而有可能会导致S信号的质量变差。相对于此,在本实施方式中,通过将M信号的残差信号包含在编码信息中,能够抑制M信号的编码误差,从而抑制S信号的预测误差,因此,能够提高S信号的质量。
另外,在本实施方式中,编码装置100对预测S信号的残差信号Es进行编码,并向解码装置200发送。而且,解码装置200使用预测S信号的残差信号Es(解码残差信号),产生解码S信号S'。由此,在本实施方式中,通过将预测S信号的残差信号包含在编码信息中,能够抑制S信号的预测误差,因此,能够提高S信号的质量。
此外,在本实施方式中,说明了从编码装置100向解码装置200发送M信号的残差信号及S信号的残差信号的情况。但是,也可以是,对于M信号的残差信号及S信号的残差信号中的至少一个残差信号,不将该残差信号从编码装置100向解码装置200发送。例如,解码装置200只要基于编码装置100所发送的M信号编码信息及预测参数编码信息(例如,能量差),对S信号进行解码(预测)即可。
另外,在本实施方式中,说明了如下情况,但并不限定于此:在图2所示的编码装置100中,在M信号能量计算部108及M-S预测部109中,使用M信号,计算M信号的能量及预测S信号。例如,编码装置100也可使用从M信号编码部106输出的解码M信号,计算M信号的能量及预测S信号。这样,编码装置100通过使用在解码装置200中用于计算M信号的能量及预测S信号的解码M信号,能够在与解码装置200相同的条件下产生预测S信号。即,能够将实际的S信号(编码装置100中的S)与解码装置中的M-S预测信号S~之间的差分信号作为残差信号Es进行编码,因此,能够减少S信号的编码误差。
或者,也可以是,编码装置100将对M信号的残差信号Em(例如,残差编码部111的输出)进行解码所得的解码残差信号E'm,与解码M信号M'(例如,M信号编码部106的输出)相加而产生解码M信号M^,并使用解码M信号M^计算M信号的能量及预测S信号。由此,编码装置100能够进一步提高S信号的预测精度。但是,在该情况下,需要解码残差信号E'm来求出残差信号Es,因此,编码装置100以不将残差信号Es与残差信号Em组合的方式进行编码。
(实施方式2)
在实施方式1中,说明了使用立体声信号的L信号与R信号之间的能量差,计算用于计算预测S信号的预测参数的情况。相对于此,在本实施方式中,说明使用M信号及S信号计算用于计算预测S信号的预测参数的情况。
[编码装置的结构]
图4是表示本实施方式的编码装置300的结构例的方框图。此外,在图4中,对与实施方式1(图2)相同的结构赋予相同的附图标记并省略其说明。
预测系数计算部301使用从降混部105输入的S信号及从M信号编码部106输入的解码M信号,计算M-S预测系数。预测系数计算部301将计算出的M-S预测系数作为用于对S信号进行预测的预测参数输出至量化部302。
例如,预测系数计算部301根据下式(7),计算M-S预测系数。
[式7]
Figure BDA0002853392830000101
在式(7)中,Sb表示子带b中的S信号,M'b表示子带b中的解码M信号,M'Ene(b)表示子带b中的解码M信号的能量。另外,函数E(x)是返回x的期望值的函数。
例如,根据下式(8),计算式(7)中的分子的成分。
[式8]
Figure BDA0002853392830000111
另外,例如,根据下式(9),计算式(7)所示的解码M信号的能量M'Ene(b)。
[式9]
Figure BDA0002853392830000112
在式(8)及式(9)中,kstart(b)表示子带b中的谱系数的开始编号,kend(b)表示子带b中的谱系数的结束编号。另外,Nbands表示子带数。另外,“*”表示复共轭。
即,式(7)所示的M-S预测系数(预测参数)是以解码M信号的能量M'Ene,将解码M信号M'与S信号S之间的相关值归一化所得的系数。此处,M信号及S信号是L信号及R信号的和及差,因此,M信号与S信号之间的相关值等于L信号与R信号之间的能量差。由此,式(7)所示的M-S预测系数(预测参数)是与L信号和R信号之间的能量差相关的参数,但该预测参数包含了对应于M信号与解码M信号之间的编码误差的量的误差。
量化部302对从预测系数计算部301输入的预测参数进行标量量化,并将获得的量化指标输出至熵编码部303及反量化部304。
熵编码部303对从量化部302输入的量化指标进行熵编码(例如,哈夫曼编码等),并将编码结果(预测参数编码信息)输出至复用部112。
另外,熵编码部303计算编码结果所需的比特数,并将表示可用于编码结果的最大比特数与计算出的比特数之差(剩余比特数)的信息(换句话说,表示比最大比特数少几比特的信息)输出至M信号编码部106及残差编码部306中的至少一个编码部。M信号编码部106及残差编码部306中的至少一个编码部例如也可基于表示剩余比特数的信息,对M信号及残差信号进行编码。
反量化部304对从量化部302输入的量化指标进行解码,将获得的解码预测参数(解码M-S预测系数)输出至M-S预测部305。
M-S预测部305使用从M信号编码部106输入的解码M信号及从反量化部304输入的解码预测参数(解码M-S预测系数),对S信号进行预测。
例如,M-S预测部305根据下式(10),计算预测S信号S”。
[式10]
S”b=HbM'b (10)
在式(10)中,b表示子带编号,M'b表示子带b中的解码M信号,Hb表示子带b中的M-S预测系数(参照式(7))。
即,M-S预测部305将解码M信号与S信号之间的相关值(对应于式(7)的SbM'b)与解码M信号的能量(对应于式(7)的M'Ene)之比(对应于式(7)的Hb)乘以解码M信号(对应于式(7)的M'b),由此,计算预测S信号S”b
残差编码部306对从加法器110输入的S信号的残差信号Es进行编码,并将编码结果(残差编码信息)输出至复用部112。
[解码装置的结构]
图5是表示本实施方式的解码装置400的结构例的方框图。此外,在图5中,对与实施方式1(图3)相同的结构赋予相同的附图标记并省略其说明。
熵解码部401对从分离部201输入的预测参数编码信息进行解码,并将解码量化指标输出至预测系数解码部402。
预测系数解码部402对从熵解码部401输入的解码量化指标进行解码,将获得的解码预测参数(解码M-S预测系数)输出至M-S预测部404。
残差解码部403对从分离部201输入的残差编码信息进行解码,获得S信号的解码残差信号Es'。残差解码部403将解码残差信号Es'输出至加法器209。
M-S预测部404使用从M信号解码部205输入的解码M信号M'、以及从预测系数解码部402输入的解码M-S预测系数,对S信号进行预测。
例如,M-S预测部404与M-S预测部305同样地,根据式(10),将M-S预测系数Hb乘以解码M信号M'b,由此,计算预测S信号Sb”。
以上,说明了本实施方式的编码装置300及解码装置400。
此处,在图5所示的解码装置400中,M-S预测部404使用解码M-S预测系数及解码M信号计算预测S信号S”。相对于此,在图4所示的编码装置300中,M-S预测部305使用解码M-S预测系数及解码M信号计算预测S信号S”。另外,在编码装置300中,预测系数计算部301使用解码M信号计算M-S预测系数。
这样,在本实施方式中,编码装置300在M-S预测系数的计算处理及S信号的预测处理这两个处理中,使用也由解码装置400使用的解码M信号。换句话说,编码装置300在与解码装置400中的S信号的预测处理相同的条件下进行S信号的预测处理,重现解码装置400中的处理。
由此,编码装置300可进行考虑了M信号的编码误差的MS预测编码,从而能够在MS预测编码中提高S信号的预测精度。由此,根据本实施方式,能够在MS预测编码中高效地对S信号进行编码。例如,本实施方式在M信号的编码误差(或者,编码失真)会变大的低比特率的情况下特别有效。
此外,在本实施方式中,编码装置300的预测系数计算部301也可使用M信号(例如,降混部105的输出)代替解码M信号,计算M-S预测系数。即使是在该情况下,编码装置300也会在M-S预测部305中,与解码装置400同样地,使用解码M信号和解码M-S预测系数,对S信号进行预测。由此,例如,即使是在使用解码M信号计算出的M-S预测系数与使用M信号计算出的M-S预测系数之间产生差异的情况下,也能够将根据预测系数的差异而产生的预测误差包含在S信号的残差信号Es中,因此,能够抑制解码立体声信号的质量变差。
(实施方式3)
在实施方式1、实施方式2中,说明了在预测编码中,使用M信号来对S信号进行预测的情况。相对于此,在本实施方式中,说明在预测编码中,使用M信号来对L信号及R信号进行预测的情况。换句话说,在本实施方式中,编码装置及解码装置不对S信号进行预测。
[通信***的概要]
本实施方式的通信***包括编码装置(编码器(encoder))500及解码装置(解码器(decoder))600。
[编码装置的结构]
图6是表示本实施方式的编码装置500的结构例的方框图。在图6中,编码装置500包括降混部501、M信号编码部502、预测系数计算部503、量化编码部504、反量化部505、声道预测部506、残差计算部507、残差编码部508及复用部509。
在图6中,构成立体声信号的L信号及R信号输入至降混部501、预测系数计算部503及残差计算部507。
降混部501进行转换(LR-M转换),将被输入的L信号及R信号转换成M信号。降混部501将M信号输出至M信号编码部502及预测系数计算部503。例如,降混部501根据式(1)或式(2),将L信号及R信号转换成M信号。
M信号编码部502对从降混部501输入的M信号进行编码,并将编码结果(M信号编码信息)输出至复用部509。另外,M信号编码部502对编码结果进行解码,并将获得的解码M信号M'输出至声道预测部506。
预测系数计算部503使用被输入的L信号、R信号及从降混部501输入的M信号,分别计算M-L预测系数及M-R预测系数。预测系数计算部503将计算出的M-L预测系数及M-R预测系数作为用于对L信号及R信号进行预测的预测参数输出至量化编码部504。
例如,预测系数计算部503根据下式(11)及式(12),计算子带b的M-L预测系数XLM(b)及M-R预测系数XRM(b)。
[式11]
XLM(b)=E(LbMb) (11)
[式12]
XRM(b)=E(RbMb) (12)
在式(11)及式(12)中,Lb表示子带b中的L信号,Rb表示子带b中的R信号,Mb表示子带b中的M信号。另外,函数E(x)是返回x的期望值的函数。即,M-L预测系数XLM表示L信号与M信号之间的相关值,M-R预测系数XRM表示R信号与M信号之间的相关值。
量化编码部504对从预测系数计算部503输入的预测参数(M-L预测系数及M-R预测系数)进行标量量化,对获得的量化指标进行编码,并将编码结果(预测参数编码信息)输出至复用部509。另外,量化编码部504将量化指标输出至反量化部505。
反量化部505对从量化编码部504输入的量化指标进行解码,将获得的解码预测参数(解码M-L预测系数及解码M-R预测系数)输出至声道预测部506。
声道预测部506使用从反量化部505输入的解码预测参数(解码M-L预测系数及解码M-R预测系数)、以及从M信号编码部502输入的解码M信号,对L信号及R信号进行预测。声道预测部506将预测L信号及预测R信号输出至残差计算部507。
例如,声道预测部506根据下式(13)及式(14),计算预测L信号L'。
[式13]
Figure BDA0002853392830000151
[式14]
Figure BDA0002853392830000152
在式(13)中,HL b表示子带b中的频率响应,M'b表示子带b中的解码M信号。另外,在式(14)中,MEne(b)表示子带b中的解码M信号的能量。另外,函数E(x)是返回x的期望值的函数。
同样地,例如,声道预测部506根据下式(15)及式(16),计算预测R信号R'。
[式15]
Figure BDA0002853392830000153
[式16]
Figure BDA0002853392830000154
在式(15)中,HR b表示子带b中的频率响应,M'b表示子带b中的解码M信号。另外,在式(16)中,MEne(b)表示子带b中的解码M信号的能量。另外,函数E(x)是返回x的期望值的函数。
残差计算部507计算被输入的L信号与从声道预测部506输入的预测L信号之间的差分即残差信号EL,并输出至残差编码部508。另外,残差计算部507计算被输入的R信号与从声道预测部506输入的预测R信号之间的差分即残差信号ER,并输出至残差编码部508。
残差编码部508对从残差计算部507输入的残差信号EL及残差信号ER进行编码,并将编码结果(残差编码信息)输出至复用部509。
复用部509复用从M信号编码部502输入的M信号编码信息、从量化编码部504输入的预测参数编码信息、以及从残差编码部508输入的残差编码信息。复用部509例如经由传输层等将所获得的比特流向解码装置600发送。
[解码装置的结构]
图7是表示本实施方式的解码装置600的结构例的方框图。在图7中,解码装置600包括分离部601、M信号解码部602、预测系数解码反量化部603、残差解码部604、声道预测部605及加法部606。
在图7中,编码装置500所发送的比特流输入至分离部601。在比特流中,例如预测参数编码信息、M信号编码信息及残差编码信息被复用。
分离部601从被输入的比特流分离预测参数编码信息、M信号编码信息及残差编码信息。分离部601将M信号编码信息输出至M信号解码部602,将预测参数编码信息输出至预测系数解码反量化部603,并将残差编码信息输出至残差解码部604。
M信号解码部602对从分离部601输入的M信号编码信息进行解码,并将解码M信号M'输出至声道预测部605。
预测系数解码反量化部603对从分离部601输入的预测参数编码信息进行解码,并将对应于解码量化指标的解码预测参数(解码M-L预测系数XLM及解码M-R预测系数XRM)输出至声道预测部605。
残差解码部604对从分离部601输入的残差编码信息进行解码,获得L信号的解码残差信号EL'及R信号的解码残差信号ER'。残差解码部604将解码残差信号EL'及解码残差信号ER'输出至加法部606。
声道预测部605使用从M信号解码部602输入的解码M信号及从预测系数解码反量化部603输入的解码预测参数(解码M-L预测系数及M-R预测系数),对L信号及R信号进行预测。声道预测部605将预测L信号及预测R信号输出至加法部606。
例如,声道预测部605与声道预测部506同样地,根据式(13)及式(14),计算预测L信号L',并根据式(15)及式(16),计算预测R信号R'。
加法部606将从残差解码部604输入的解码残差信号EL'和从声道预测部605输入的预测L信号相加,并输出相加结果即解码L信号L^。另外,加法部606将从残差解码部604输入的解码残差信号ER'和从声道预测部605输入的预测R信号相加,并输出相加结果即解码R信号R^。
以上,说明了本实施方式的编码装置500及解码装置600。
这样,在本实施方式中,在对L信号及R信号进行预测编码的情况下,编码装置500使用M信号、L信号及R信号计算预测参数(M-L预测系数及M-R预测系数)。另外,编码装置500使用解码M信号及解码预测参数,对L信号及R信号进行预测。换句话说,编码装置500在与解码装置600中的L信号及R信号的预测处理相同的条件下进行L信号及R信号的预测处理,重现解码装置600中的处理。由此,编码装置500可进行考虑了M信号的编码误差、以及M-L预测及M-R预测的预测误差和编码误差的声道预测编码,从而能够在声道预测编码中提高L信号及R信号的编码性能。
由此,根据本实施方式,能够在声道预测编码中高效地对L信号及R信号进行编码。例如,本实施方式在M信号的编码误差(或者,编码失真)会变大的低比特率的情况下特别有效。
此外,在图6中说明了如下情况,即,预测系数计算部503使用从降混部501输入的M信号计算M-L预测系数及M-R预测系数。但是,预测系数计算部503也可使用从M信号编码部502输入的解码M信号代替M信号,计算M-L预测系数及M-R预测系数。由此,编码装置500能够使用解码装置600所使用的解码M信号计算预测参数,因此,能够提高解码装置600中的L信号及R信号的预测精度。
另外,在本实施方式中,说明了立体声信号(L声道及R声道这两个声道的信号)的编码,但被编码的信号并不限定于立体声信号,也可以是多声道信号(例如,两个声道以上的信号)。
例如,图8示出表示对多声道信号(N个声道。其中,N是2以上的整数)进行编码的编码装置500a的结构例的方框图,图9示出表示对多声道信号进行解码的解码装置600a的结构例的方框图。图8所示的编码装置500a及图9所示的解码装置600a的各结构构件进行与图6所示的编码装置500及图7所示的解码装置600的各结构构件相同的处理。应予说明,在图6及图7中,进行对于构成立体声信号的L信号及R信号这两个声道的处理,相对于此,图8及图9的不同点在于,进行对于N个声道的处理。即,编码装置500a及解码装置600a使用M信号(或解码M信号)预测各声道信号。
(实施方式4)
在本实施方式中,说明切换包含MS预测编码的多个编码模式中的、用于对立体声信号进行编码的编码模式的方法。
[通信***的概要]
本实施方式的通信***包括编码装置(编码器(encoder))700及解码装置(解码器(decoder))800。
[编码装置的结构]
图10是表示本实施方式的编码装置700的结构例的方框图。在图10中,编码装置700包括降混部701、M信号编码部702、S信号编码部703、编码模式编码部704及复用部705。
在图10中,构成立体声信号的L信号(左声道信号(Left channel signal))及R信号(右声道信号(Right channel signal))输入至降混部701及S信号编码部703。
降混部701进行转换(LR-MS转换),将被输入的L信号及R信号转换成M信号及S信号。降混部701将M信号输出至M信号编码部702及S信号编码部703,并将S信号输出至S信号编码部703。例如,降混部701根据式(1)或式(2),将L信号及R信号转换成M信号及S信号。
M信号编码部702对从降混部701输入的M信号进行编码,并将编码结果(M信号编码信息)Cm输出至复用部705。
S信号编码部703使用被输入的L信号、被输入的R信号、从降混部701输入的M信号和从降混部701输入的S信号中的至少一种信号对S信号进行编码。S信号编码部703将编码结果(S信号编码信息)Cs输出至复用部705。
例如,S信号编码部703使用进行MS预测编码的“预测模式”及进行通常编码的“通常模式”这两个编码模式对S信号进行编码。而且,S信号编码部703比较预测模式的编码结果和通常模式的编码结果,选择编码结果更好的编码模式,并将包含已选择的编码模式的编码结果的S信号编码信息Cs输出至复用部705。另外,S信号编码部703将表示已选择的编码模式的信息输出至编码模式编码部704。
在“预测模式”下,S信号编码部703例如如实施方式1(例如,参照图2)或实施方式2(例如,参照图4)所说明的那样,对S信号进行编码。在选择预测模式作为编码模式的情况下,S信号编码部703将预测参数编码信息及残差编码信息作为S信号编码信息Cs输出至复用部705。
另外,在“通常模式”下,S信号编码部703例如在M/S立体声编解码器中,对S信号进行单声道编码。在选择通常模式作为编码模式的情况下,S信号编码部703将S信号的单声道编码结果作为S信号编码信息Cs输出至复用部705。
例如,S信号编码部703可选择预测模式的编码结果及通常模式的编码结果中的编码误差更小的编码模式。或者,S信号编码部703也可选择预测模式的编码结果及通常模式的编码结果中的编码结果所需的比特数更少的编码模式。此外,编码模式的选择基准并不限定于编码误差及编码比特数,也可以是与编码性能相关的其他基准。
编码模式编码部704对从S信号编码部703输入的编码模式进行编码,并将获得的模式编码信息Cg输出至复用部705。
复用部705复用从M信号编码部702输入的M信号编码信息、从S信号编码部703输入的S信号编码信息及从编码模式编码部704输入的模式编码信息。复用部705例如经由传输层等将所获得的比特流向解码装置800发送。
[解码装置的结构]
图11是表示本实施方式的解码装置800的结构例的方框图。在图11中,解码装置800包括分离部801、M信号解码部802、编码模式解码部803、S信号解码部804及上混部805。
在图11中,编码装置700所发送的比特流输入至分离部801。在比特流中,例如M信号编码信息Cm、S信号编码信息Cs及模式编码信息Cg被复用。
分离部801从被输入的比特流分离M信号编码信息、S信号编码信息及模式编码信息。分离部801将M信号编码信息输出至M信号解码部802,将模式编码信息输出至编码模式解码部803,并将S信号编码信息输出至S信号解码部804。
M信号解码部802对从分离部801输入的M信号编码信息进行解码,并将解码M信号M'输出至S信号解码部804及上混部805。
编码模式解码部803对从分离部801输入的模式编码信息进行解码,并将所获得的表示编码模式的信息输出至S信号解码部804。
S信号解码部804基于从编码模式解码部803输入的编码模式,对S信号编码信息进行解码,获得解码S信号S'。S信号解码部804将解码S信号输出至上混部805。
在编码模式为“预测模式”的情况下,S信号解码部804例如如实施方式1(例如,参照图3)或实施方式2(例如,参照图5)所说明的那样,使用从M信号解码部802输入的解码M信号及从分离部801输入的S信号编码信息(预测参数及残差信号),对S信号进行预测、解码。
另外,在编码模式为“通常模式”的情况下,S信号解码部804例如对S信号编码信息进行单声道解码,以获得解码S信号。
上混部805进行转换(MS-LR转换),将从M信号解码部802输入的解码M信号M'及从S信号解码部804输入的解码S信号S'转换成解码L信号L'及解码R信号R'。例如,上混部805根据式(5)或式(6),将解码M信号及解码S信号转换成解码L信号及解码R信号。
以上,说明了本实施方式的编码装置700及解码装置800。
这样,在本实施方式中,编码装置700对S信号进行预测编码及单声道编码这两种编码,并选择编码结果更好的编码模式。由此,编码装置700能够高效地对S信号进行编码,解码装置800能够提高S信号的解码性能。
此外,在本实施方式中,说明了使用预测模式及通常模式作为对于S信号的编码模式的情况。但是,对于S信号的编码模式也可以是预测模式及通常模式以外的编码模式。另外,在本实施方式中,说明了使用两种编码模式的情况,但也可使用三种以上的编码模式。例如,在L信号与R信号之间的相关低的情况下,也可不使用MS立体声编码,而使用对LR进行双重单声道编码的模式。
另外,在本实施方式中,对于S信号的编码处理可以针对多个子带中的每一个进行,也可以对多个子带整体进行。在对于S信号的编码处理针对多个子带中的每一个进行的情况下,针对每个子带,产生S信号编码信息及模式编码信息。另外,在该情况下,模式编码信息例如也可以是二进制编码信息,该二进制编码信息用“1”表示选择了预测模式的频带,用“0”表示选择了通常模式的频带。
(实施方式5)
在实施方式4中说明了如下情况,即,编码装置使用多个编码模式分别对S信号进行编码,并选择编码结果更好的编码模式。相对于此,在实施方式5中说明如下情况,即,编码装置从多个编码模式中选择一个编码模式,使用已选择的编码模式对S信号进行编码。
图12是表示本实施方式的编码装置900的结构例的方框图。此外,在图12中,对与实施方式4相同的结构赋予相同的附图标记并省略其说明。另外,本实施方式的解码装置的基本结构与实施方式4的解码装置800通用,因此,引用图11进行说明。
在图12所示的编码装置900中,互相关计算部901计算被输入的L信号与R信号之间的归一化互相关。例如,互相关计算部901计算每个子带的归一化互相关值。互相关计算部901将计算出的每个子带的归一化互相关值输出至子带分类部902。
例如,互相关计算部901根据下式(17),计算子带b的归一化互相关值XLR(b)。
[式17]
Figure BDA0002853392830000221
在式(17)中,kstart表示子带b中的谱系数的开始编号,kend表示子带b中的谱系数的结束编号,b为0、1、…、Nbands-1。Nbands表示子带数。另外,“*”表示复共轭,函数E(x)是返回x的期望值的函数。
子带分类部902基于从互相关计算部901输入的每个子带的归一化互相关值,将子带分类成多个群组。子带的群组数例如可以是与S信号编码部903可选择的编码模式的数量相同。例如,子带分类部902将归一化互相关值处于规定范围的子带分类到对应于预测模式(例如,MS预测编码)的群组,将归一化互相关值处于上述规定范围以外的子带分类到对应于通常模式(例如,单声道编码)的群组。子带分类部902将表示子带的分类结果的分类信息输出至S信号编码部903及分类信息编码部904。
S信号编码部903基于从子带分类部902输入的分类信息,选择S信号的编码模式(例如,预测模式或通常模式中的任一个模式)。而且,S信号编码部903基于已选择的编码模式,对从降混部701输入的S信号进行编码,并将编码结果(S信号编码信息)Cs输出至复用部705。
分类信息编码部904对从子带分类部902输入的分类信息进行编码,并将编码结果(模式编码信息)Cg输出至复用部705。例如,分类信息编码部904也可产生二进制编码信息,该二进制编码信息用“1”表示对应于预测模式的群组所含的子带,用“0”表示对应于通常模式的群组所含的子带。
解码装置800(例如,参照图11)基于模式编码信息(换句话说,分类信息),针对每个子带决定S信号的编码模式,并根据已决定的编码模式,对S信号进行解码。
接下来,说明子带分类部902中的子带的分类方法的一例。
在MS编码中,例如,L信号和R信号的谱形状越相似(换句话说,归一化互相关值越高),则越能够使用较少的比特数,高效地对表示L信号与R信号之差的S信号进行编码。换句话说,L信号及R信号的归一化互相关值越高,则越能做到如下:即使不通过MS预测编码(预测模式)对S信号进行预测,也能够通过通常模式的编码,高效地对S信号进行编码。
另一方面,在L信号和R信号的谱形状不相似的情况下(换句话说,在归一化互相关值低的情况下),MS预测编码(预测模式)的预测误差会更大,因此,MS预测编码有可能会需要比通常模式的编码更多的编码比特数。
因此,例如,子带分类部902将归一化互相关值XLR(b)处于0.5~0.8的范围的子带b分类为对应于预测模式的子带。另外,子带分类部902将归一化互相关值XLR(b)处于0.5~0.8的范围以外的子带b分类为对应于通常模式的子带。
由此,例如,对于归一化互相关值XLR(b)大于0.8的子带b,预期L信号与R信号之间的差信号(即S信号)较小,因此,S信号编码部903能够使用通常模式,高效地对S信号进行编码。另外,例如,对于归一化互相关值XLR(b)处于0.5~0.8的范围的子带b,S信号编码部903使用预测模式对S信号进行编码,由此,与使用通常模式的情况相比,能够削减S信号编码信息的比特数。另外,例如,对于归一化互相关值XLR(b)小于0.5的子带b,S信号编码部903以通常模式对S信号进行编码,由此,能够避免S信号编码信息的比特数意外地增多。
此外,分类为对应于预测模式的子带的归一化互相关值XLR(b)的范围并不限定于0.5~0.8的范围,也可以是其他范围。
这样,在本实施方式中,编码装置900通过选择适合于L信号与R信号之间的相关的编码模式,能够高效地对S信号进行编码。另外,编码装置900使用基于L信号与R信号之间的相关选择的一个编码模式对S信号进行编码,因此,与分别使用多个编码模式进行编码的情况相比,能够削减运算量。
此外,在本实施方式中,说明了使用预测模式及通常模式这两种模式作为S信号的编码模式的情况。但是,S信号的编码模式也可以是三种以上。在该情况下,子带分类部902只要将多个子带分类成群组,且使群组的数量与S信号的编码模式的数量相同即可。
例如,子带分类部902也可将归一化互相关值XLR(b)处于0.5~0.8的范围的子带b分类为对应于预测模式的子带,将归一化互相关值XLR(b)处于大于0.8的范围的子带b分类为对应于通常模式(例如,单声道编码)的子带,并将归一化互相关值XLR(b)处于小于0.5的范围的子带b分类为对应于双重单声道模式(双重单声道编码)的子带。在双重单声道编码中,S信号编码部903分别对L信号及R信号进行单声道编码。
另外,编码装置900所使用的编码模式并不限定于如上所述的两种或三种,也可以是四种以上。
另外,在本实施方式中,说明了决定每个子带的编码模式的情况,但并不限定于以子带为单位决定编码模式的情况。例如,可以以包含多个子带的群组为单位决定编码模式,也可针对整个频带决定编码模式。
另外,在本实施方式中,说明了编码装置900基于L信号与R信号之间的归一化互相关值来选择编码模式的情况,但作为编码模式的选择基准的参数并不限定于归一化互相关值,例如也可以是关于L信号与R信号之间的相关的其他参数。
或者,作为编码模式的选择基准的参数也可以是M-S预测中的预测增益。例如,编码装置900也可在计算出的预测增益高的情况下(例如,在超过规定阈值或为规定阈值以上的情况下),选择预测模式。预测增益可以定义为如下的S/N比(信噪比),即,作为预测对象的信号(在本实施方式中为S信号)与预测残差信号(预测出的S信号与实际的S信号之间的误差信号)之间的S/N比。在该情况下,以S信号为对象的情况下的S/N比的倒数由下式(18)表示。
[式18]
Figure BDA0002853392830000251
在式(18)中,MEne(b)表示子带b中的M信号的能量,SEne(b)表示子带b中的S信号的能量,XSM(b)表示子带b中的S信号与M信号之间的互相关值,Sb表示子带b中的S信号,Mb表示子带b中的M信号,SbMb表示子带b中的S信号与M信号之间的交叉谱,S(k)表示子带b内的各频率点k处的S信号,M(k)表示子带b内的各频率点k处的M信号,Hb表示子带b中的M-S预测系数(例如,参照式(7))。函数E(x)表示返回x的期望值的函数。
根据式(18),(XSM(b))2/E(SEne(b))E(MEne(b))越大,则预测增益越高。也就是说,编码装置900计算如下的归一化互相关,即,以M信号的能量与S信号的能量相乘所得的值,将M信号与S信号之间的互相关的平方归一化所得的“M信号与S信号之间的归一化互相关”。此外,编码装置900只要在“M信号与S信号之间的归一化互相关”为规定阈值以上(或者超过阈值)的情况下判断为预测增益高并使用预测模式即可。另外,例如,编码装置900若在预测增益低的情况下使用双重单声道编码模式,则无需为了对模式进行判断而计算L信号及R信号的互相关(例如,式(17)或类似于式(17)的式子)。图13表示该情况下的编码装置900a的结构。图13所示的编码装置900a与编码装置900(图12)相比,不同点在于:互相关计算部901a的输入信号变为降混部701的输出信号即M信号和S信号。另外,在图13中,互相关计算部901a计算上述“M信号与S信号之间的归一化互相关”。
以上,说明了本发明的各实施方式。
此外,本发明可通过软件、硬件或在与硬件协作下的软件实现。在上述实施方式的说明中使用的各功能块部分地或整体地被实现为作为集成电路的LSI(Large ScaleIntegration,大规模集成电路),在上述实施方式中说明的各过程也可部分地或整体地由一个LSI或LSI的组合控制。LSI可由各个芯片构成,也可以是以包含功能块的一部分或全部的方式由一个芯片构成。LSI也可包括数据的输入和输出。LSI根据集成度的不同,也可以称为“IC(Integration Circuit,集成电路)”、“***LSI(System LSI)”、“超大LSI(SuperLSI)”、“特大LSI(Ultra LSI)”。集成电路化的方法不限于LSI,也可由专用电路、通用处理器或专用处理器实现。另外,也可利用LSI制造后能够编程的FPGA(Field ProgrammableGate Array,现场可编程门阵列)、或可以对LSI内部的电路块的连接或设定进行重新构置的可重构处理器(Reconfigurable Processor)。本发明也可被实现为数字处理或模拟处理。再有,如果随着半导体技术的进步或者其他技术的派生,出现了代替LSI的集成电路化的技术,当然也可以利用该技术来实现功能块的集成化。还存在应用生物技术等的可能性。
本发明可在具有通信功能的所有种类的装置、设备、***(总称为“通信装置”)中实施。通信装置的非限定性的例子可列举电话(手机、智能手机等)、平板电脑、个人电脑(PC)(膝上型电脑、台式机、笔记本电脑等)、相机(数码照相机/数码摄像机等)、数码播放器(数码音频/视频播放器等)、可穿戴设备(可穿戴相机、智能手表、跟踪设备等)、游戏机、电子书阅读器、远程健康/远程医疗(远程保健/医学处方)设备、带有通信功能的交通工具或交通运输工具(汽车、飞机、轮船等)、以及上述各种装置的组合。
通信装置并不限定于可携带或可移动的装置,也包含无法携带或受到固定的所有种类的装置、设备、***。例如包括:智能家居设备(家电设备、照明设备、智能电表或计量器、控制面板等)、自动售货机、以及其他可存在于IoT(Internet of Things,物联网)网络上的所有“物体(Things)”。
通信除了包含通过蜂窝***、无线LAN(Local Area Network,局域网)***、通信卫星***等进行的数据通信之外,还包含通过这些***的组合进行的数据通信。
另外,通信装置也包含与执行本发明中记载的通信功能的通信设备连接或连结的、控制器或传感器等设备。例如,包含产生执行通信装置的通信功能的通信设备所使用的控制信号或数据信号的控制器或传感器。
另外,通信装置包含与上述非限定性的各种装置进行通信或对上述各种装置进行控制的基础设施设备。例如包括:基站、接入点及其他所有的装置、设备、***。
本发明的一个实施例中的编码装置包括:第一编码电路,对表示左声道信号与右声道信号之和的和信号进行编码,产生第一编码信息,该左声道信号和该右声道信号构成立体声信号;计算电路,使用与所述左声道信号和所述右声道信号之间的能量差相关的参数,计算用于预测表示所述左声道信号与所述右声道信号之差的差信号的预测参数;以及第二编码电路,对所述预测参数进行编码,产生第二编码信息。
本发明的一个实施例中的编码装置还包括:预测电路,使用所述预测参数及所述和信号来预测所述差信号,产生预测差信号;以及第三编码电路,对所述差信号与所述预测差信号之间的残差信号进行编码,产生第三编码信息。
在本发明的一个实施例中的编码装置中,所述第三编码信息包含所述和信号与对所述第一编码信息进行解码所得的解码和信号之间的残差信号的编码结果。
在本发明的一个实施例中的编码装置中,与所述能量差相关的参数是以解码和信号的能量,将该解码和信号与所述差信号之间的相关值归一化所得的系数,所述解码和信号是对所述第一编码信息进行解码所得的信号。
在本发明的一个实施例中的编码装置中,所述第二编码电路对所述预测参数进行熵编码。
本发明的一个实施例中的编码方法包括以下步骤:对表示左声道信号与右声道信号之和的和信号进行编码,产生第一编码信息,该左声道信号和该右声道信号构成立体声信号;使用与所述左声道信号和所述右声道信号之间的能量差相关的参数,计算用于预测表示所述左声道信号与所述右声道信号之差的差信号的预测参数;以及对所述预测参数进行编码,产生第二编码信息。
在2018年7月3日申请的特愿2018-126842及在2018年11月7日申请的特愿2018-209940的日本专利申请所含的说明书、附图及说明书摘要的公开内容全部被引用于本申请。
工业实用性
本发明的一个实施例对于使用了MS预测编码技术的语音通信***是有用的。
附图标记说明
100、300、500、700、900、900a 编码装置
101 能量差计算部
102、302 量化部
103、303 熵编码部
104、304、505 反量化部
105、501、701 降混部
106、502、702 M信号编码部
107、110、206、209 加法器
108、207 M信号能量计算部
109、208、305、404 M-S预测部
111、306、508 残差编码部
112、509、705 复用部
200、400、600、800 解码装置
201、601、801 分离部
202、401 熵解码部
203 能量差解码部
204、403、604 残差解码部
205、602、802 M信号解码部
210、805 上混部
301、503 预测系数计算部
402 预测系数解码部
504 量化编码部
506、605 声道预测部
507 残差计算部
603 预测系数解码反量化部
606 加法部
703、903 S信号编码部
704 编码模式编码部
803 编码模式解码部
804 S信号解码部
901、901a 互相关计算部
902 子带分类部
904 分类信息编码部。

Claims (6)

1.一种编码装置,其特征在于,包括:
第一编码电路,对表示左声道信号与右声道信号之和的和信号进行编码,产生第一编码信息,该左声道信号和该右声道信号构成立体声信号;
计算电路,使用与所述左声道信号和所述右声道信号之间的能量差相关的参数,计算用于预测表示所述左声道信号与所述右声道信号之差的差信号的预测参数;以及
第二编码电路,对所述预测参数进行编码,产生第二编码信息。
2.如权利要求1所述的编码装置,其中,还包括:
预测电路,使用所述预测参数及所述和信号来预测所述差信号,产生预测差信号;以及
第三编码电路,对所述差信号与所述预测差信号之间的残差信号进行编码,产生第三编码信息。
3.如权利要求2所述的编码装置,其中,
所述第三编码信息包含所述和信号与对所述第一编码信息进行解码所得的解码和信号之间的残差信号的编码结果。
4.如权利要求1所述的编码装置,其中,
与所述能量差相关的参数是以解码和信号的能量,将该解码和信号与所述差信号之间的相关值归一化所得的系数,所述解码和信号是对所述第一编码信息进行解码所得的信号。
5.如权利要求1所述的编码装置,其中,
所述第二编码电路对所述预测参数进行熵编码。
6.一种编码方法,其特征在于,包括以下步骤:
对表示左声道信号与右声道信号之和的和信号进行编码,产生第一编码信息,该左声道信号和该右声道信号构成立体声信号;
使用与所述左声道信号和所述右声道信号之间的能量差相关的参数,计算用于预测表示所述左声道信号与所述右声道信号之差的差信号的预测参数;以及
对所述预测参数进行编码,产生第二编码信息。
CN201980042253.6A 2018-07-03 2019-07-02 编码装置及编码方法 Active CN112352277B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2018-126842 2018-07-03
JP2018126842 2018-07-03
JP2018-209940 2018-11-07
JP2018209940 2018-11-07
PCT/JP2019/026200 WO2020009082A1 (ja) 2018-07-03 2019-07-02 符号化装置及び符号化方法

Publications (2)

Publication Number Publication Date
CN112352277A true CN112352277A (zh) 2021-02-09
CN112352277B CN112352277B (zh) 2024-05-31

Family

ID=69060388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980042253.6A Active CN112352277B (zh) 2018-07-03 2019-07-02 编码装置及编码方法

Country Status (4)

Country Link
US (1) US11545165B2 (zh)
JP (1) JP7407110B2 (zh)
CN (1) CN112352277B (zh)
WO (1) WO2020009082A1 (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050157884A1 (en) * 2004-01-16 2005-07-21 Nobuhide Eguchi Audio encoding apparatus and frame region allocation circuit for audio encoding apparatus
US20070248157A1 (en) * 2004-06-21 2007-10-25 Koninklijke Philips Electronics, N.V. Method and Apparatus to Encode and Decode Multi-Channel Audio Signals
JP2008203315A (ja) * 2007-02-16 2008-09-04 Matsushita Electric Ind Co Ltd オーディオ符号化・復号化装置、方法、及びソフトウェア
US20110019829A1 (en) * 2008-04-04 2011-01-27 Panasonic Corporation Stereo signal converter, stereo signal reverse converter, and methods for both
US20120065984A1 (en) * 2009-05-26 2012-03-15 Panasonic Corporation Decoding device and decoding method
US20120275604A1 (en) * 2011-04-26 2012-11-01 Koen Vos Processing Stereophonic Audio Signals
CN103180899A (zh) * 2010-11-17 2013-06-26 松下电器产业株式会社 立体声信号编码装置、立体声信号解码装置、立体声信号编码方法及立体声信号解码方法
WO2017125562A1 (en) * 2016-01-22 2017-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
WO2017161315A1 (en) * 2016-03-18 2017-09-21 Qualcomm Incorporated Multi channel coding

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
JP2006323314A (ja) * 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd マルチチャネル音声信号をバイノーラルキュー符号化する装置
US8121836B2 (en) * 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
JP2007183528A (ja) * 2005-12-06 2007-07-19 Fujitsu Ltd 符号化装置、符号化方法、および符号化プログラム
BR122020009727B1 (pt) 2008-05-23 2021-04-06 Koninklijke Philips N.V. Método
CN105225667B (zh) * 2009-03-17 2019-04-05 杜比国际公司 编码器***、解码器***、编码方法和解码方法
CN101533641B (zh) * 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
US8924207B2 (en) * 2009-07-23 2014-12-30 Texas Instruments Incorporated Method and apparatus for transcoding audio data
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
BR112012026324B1 (pt) * 2010-04-13 2021-08-17 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável
WO2014161996A2 (en) * 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
US10152977B2 (en) * 2015-11-20 2018-12-11 Qualcomm Incorporated Encoding of multiple audio signals

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050157884A1 (en) * 2004-01-16 2005-07-21 Nobuhide Eguchi Audio encoding apparatus and frame region allocation circuit for audio encoding apparatus
US20070248157A1 (en) * 2004-06-21 2007-10-25 Koninklijke Philips Electronics, N.V. Method and Apparatus to Encode and Decode Multi-Channel Audio Signals
JP2008203315A (ja) * 2007-02-16 2008-09-04 Matsushita Electric Ind Co Ltd オーディオ符号化・復号化装置、方法、及びソフトウェア
US20110019829A1 (en) * 2008-04-04 2011-01-27 Panasonic Corporation Stereo signal converter, stereo signal reverse converter, and methods for both
US20120065984A1 (en) * 2009-05-26 2012-03-15 Panasonic Corporation Decoding device and decoding method
CN103180899A (zh) * 2010-11-17 2013-06-26 松下电器产业株式会社 立体声信号编码装置、立体声信号解码装置、立体声信号编码方法及立体声信号解码方法
US20120275604A1 (en) * 2011-04-26 2012-11-01 Koen Vos Processing Stereophonic Audio Signals
WO2017125562A1 (en) * 2016-01-22 2017-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
WO2017161315A1 (en) * 2016-03-18 2017-09-21 Qualcomm Incorporated Multi channel coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HELMUT WITTEK: "M/S Techniques for Stereo and Surround", 《AUDIO ENGINEERING SOCIETY CONVENTION PAPER》 *

Also Published As

Publication number Publication date
JPWO2020009082A1 (ja) 2021-08-02
CN112352277B (zh) 2024-05-31
US20210280201A1 (en) 2021-09-09
WO2020009082A1 (ja) 2020-01-09
JP7407110B2 (ja) 2023-12-28
US11545165B2 (en) 2023-01-03

Similar Documents

Publication Publication Date Title
EP1912206B1 (en) Stereo encoding device, stereo decoding device, and stereo encoding method
JP5383676B2 (ja) 符号化装置、復号装置およびこれらの方法
US8099275B2 (en) Sound encoder and sound encoding method for generating a second layer decoded signal based on a degree of variation in a first layer decoded signal
US8374883B2 (en) Encoder and decoder using inter channel prediction based on optimally determined signals
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP5340261B2 (ja) ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
EP2856776B1 (en) Stereo audio signal encoder
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JP5746974B2 (ja) 符号化装置、復号装置およびこれらの方法
US8271275B2 (en) Scalable encoding device, and scalable encoding method
WO2011132368A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
US20110137661A1 (en) Quantizing device, encoding device, quantizing method, and encoding method
CN111710342B (zh) 编码装置、解码装置、编码方法、解码方法及程序
WO2014191793A1 (en) Audio signal encoder
EP3577649B1 (en) Stereo audio signal encoder
CN112352277B (zh) 编码装置及编码方法
JP2021529340A (ja) ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
US8949117B2 (en) Encoding device, decoding device and methods therefor
CN115699169A (zh) 编码装置、解码装置、编码方法及解码方法
WO2023198383A1 (en) Method for quantizing line spectral frequencies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant