CN1950883A

CN1950883A - 可伸缩性解码装置及增强层丢失的隐藏方法

Info

Publication number: CN1950883A
Application number: CNA2005800137573A
Authority: CN
Inventors: 江原宏幸
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2004-04-30
Filing date: 2005-04-25
Publication date: 2007-04-18
Also published as: US20080249766A1; EP1758099A1; WO2005106848A1; JPWO2005106848A1

Abstract

提供一种可伸缩性解码装置，在带宽可伸缩性编码中，即使增强层的信号丢失，解码信号的带宽也不会频繁的切换，主观质量上不会产生不协调感或不悦感。没有帧丢失时，所述信号就是一个信号(S101)，而高频分组丢失的话，实际上接收的信号就只有低频分组。因此所述装置通过对低频分组的信号实施上采样处理，生成采样率为宽带且只存在低频分量的信号S102。另一方面，基于第n－1帧的信号S103，通过隐藏处理生成补偿信号S104。将该信号S104通过HPF只提取出高频分量，成为信号S105。将只存在低频分量的信号S101与只存在高频分量的信号S105叠加，而得到解码信号S106。

Description

可伸缩性解码装置及增强层丢失的隐藏方法

技术领域

本发明涉及一种在增强层丢失时进行隐藏处理的可伸缩性解码装置及该装置使用的增强层丢失的隐藏方法。

背景技术

在以因特网通信为代表的分组通信中，由于在传输路径上会发生分组丢失，因而期待一种称为可伸缩性编码的功能，即在丢失一部分传输信息的情况下，也能够根据剩余的信息进行解码处理。有两种类型的可伸缩性编码，一种是不改变带宽而只让编码对象的比特率具有伸缩性执行编码，另一种是让编码对象的信号的带宽(频率轴方向)具有伸缩性执行编码(例如，参照非专利文献1)。特别是，将后者的让带宽具有伸缩性来进行编码的方式称作带宽可伸缩性编码。

以往的语音通信中使用的是电话带宽(300Hz-3.4khZ)的窄带通信，近年来，对宽带(50Hz-7KHz)信号进行编码的方式等也被标准化(例如，参考非专利文献2)，期待将来能用于高质量的语音通信。

另一方面，随着今后网络的完全IP化，可以预计到在同一个网络内会混杂有使用电话带宽的语音信号的终端、及使用宽带语音信号的终端。另外，类似现在的电话会议服务的多方通信也预计会普及。考虑到上述这些情况，以一种编码方式，能够对电话带宽的语音信号及宽带的语音信号两者进行编码和解码的可伸缩性编码方式将会是非常有效的。

至今，也公开过一些不限于语音信号，还针对宽带音频信号的可伸缩性编码方式(例如，参考专利文献1、2)。这些可伸缩性编码方式，分层的对编码对象的音频信号进行编码，因此，利用诸如DiffServ(DifferentiatedSevevces)网络中的优先控制，优先地传输基本(基础层)的信息。接着，根据传输路径的状况，以层级的降序丢弃增强层的信息。这样，可以降低在通信网络中基本信息被丢弃的概率，从而即使由于分组损失而丢失一部分编码信息也能够防止通话质量的下降。

另一方面，在由于传输路径中编码信息的丢失而解码器无法接收到编码信息的情况下，一般来说进行数据丢失的隐藏(补偿)处理。例如，专利文献3中公开了一种ITU-T G.729的帧丢失的隐藏处理，正如专利文献3中所公开的那样，标准的丢弃帧的隐藏处理方式为使用过去已经解码的信息进行外插。

专利文献1：日本专利公开公报特开平08-263096号

专利文献2：日本专利公开公报特开2002-100994号

专利文献3：日本专利公开公报特开平09-120297号

非专利文献1：T.Nomura et al，“A Bitrate and Bandwidth ScalableCELP Coder，”IEEE Proc.ICASSP98，pp.341-344，1998

非专利文献2：3GPP标准、TS26.190

发明内容

发明需要解决的问题

但是，在被可伸缩性编码的信号传输中，还没有一种关于增强层的信号丢失时的解码处理的标准技术。

另外，在只丢失了增强层信号时，虽然也可以使用核心层的信息来进行解码处理，但是却具有下列问题。即，在如上所述的比特率和频率轴方向均具有可伸缩性的情况下，根据核心层信息生成的解码信号为窄带信号，而根据核心层和增强层两者的信息生成的解扩信号则为宽带信号。因此，只使用核心层信息进行解码处理和使用包括增强层的信息进行解码处理之间就存在着解码信号的频率轴方向产生变化的问题。相关的情况下，若只使用核心层的编码信息进行解码，虽然信号带宽只会局部性的变窄，不会造成显著的质量下降，但是在增强层的丢失率较高，解码信号的带宽不断在窄带和宽带之间转换时，结果会产生主观质量上的不协调感或不悦感。

本发明的目的在于提供一种可伸缩性解码装置、及该装置使用的扩展帧丢失的隐藏方法，在带宽可伸缩性编码过程中，即使增强层的信号丢失，解码信号的带宽也不会不断的转换，因而不会产生主观质量上的不协调感或不悦感。

解决该问题的方案

本发明的可伸缩性解码装置，通过由频率轴方向上具有可伸缩性的核心层和增强层形成的编码信息获得宽带解码信号，所述可伸缩性解码装置包括：核心层解码单元，通过核心层的编码信息获得窄带核心层解码信号；转换单元，将所述窄带核心层解码信号的频带宽转换成宽带，得到第一信号；补偿单元，对于核心层存在而增强层丢失的编码信息，根据过去已经得到的解码信号生成宽带补偿信号；消除单元，从所述宽带补偿信号中除掉相当于核心层的频率分量，得到第二信号；加法单元，将由所述转换单元得到的第一信号和由所述消除单元得到的第二信号相加，得到宽带解码信号。

发明的有益效果

根据本发明，在带宽可伸缩性编码过程中，即使增强层的信号丢失，解码信号的带宽也不会不断的转换，不会产生主观质量上的不协调感或不悦感。

附图说明

图1是示意实施例1涉及的可伸缩性解码装置的主要结构的方框图

图2是示意实施例1涉及的核心解码器内部的主要结构的方框图

图3是示意实施例1涉及的增强解码器内部的主要结构的方框图

图4是示意实施例1涉及的增强解码器内部的正常状态下的信号流向的图

图5是示意实施例1涉及的增强解码器内部的增强层丢失时信号流向的图

图6是说明实施例1涉及的可伸缩性解码装置的解码处理的概要的图

图7是示意实施例1涉及的增强解码器为基于MDCT型的上采样处理单元的结构的方框图

图8是示意实施例2涉及的可伸缩性解码装置的的主要结构的方框图

图9是示意实施例1或2涉及的可伸缩性解码装置运用在移动通信***上时，移动站装置及基站装置的主要结构的方框图

图10是示意将实施例1和2组合时的可伸缩性解码装置的主要结构的方框图

具体实施方式

下面针对本发明的实施例，参照附图进行详细说明。在此，以让带宽具有可伸缩性，分层的对输入信号进行编码和解码的状况为例，即以编码信息为频率轴方向上具有可伸缩性的情况为例进行说明。这种情况下，在核心层中对带宽最窄的信号进行编码和解码。

(实施例1)

图1是示意实施例1涉及的可伸缩性解码装置的主要结构的方框图。本实施例涉及的可伸缩性解码装置包括：用于基本码分组的分组分解单元101，核心解码器(基本解码处理单元)102，上采样(up-sampling)处理单元103，扩展码分组用分组分解单元104，增强解码器(扩展解码处理单元)105，高通滤波器(HPF)106，切换开关(SW)107及加法器108。

本实施例涉及的可伸缩性解码装置的各单元进行以下的操作。

用于基本码分组的分组分解单元101从通过分组网N输入进来的带有核心层编码信息的基本码分组中提取出核心层的编码信息，将其输出到核心解码器102(S1)的同时，还将帧丢失信息C1输出到核心解码器102、增强解码器105及切换开关107。在此，编码信息为从发送端的编码装置(图中未示出)输出的编码比特流，帧丢失信息C1为表示作为解码对象的帧是否为丢失帧的信息。不过，在作为解码对象的分组为丢失分组时，该分组中含有的所有帧为丢失帧。

核心解码器102利用由分组分解单元101输出的帧丢失信息C1和编码信息S1，进行核心层解码处理，并输出核心层的解码信号(窄带信号)S3。核心层解码处理的具体内容，例如可以是基于CELP模型的解码处理，也可以是基于波形编码的解码处理，还可以是使用MDCT等转换编码模型的解码处理。另外，核心解码器102，将在核心层的解码处理中获得的信息的一部分或全部(S4)输出到增强解码器105。输出到增强解码器105的信息用于增强层的解码处理。再者，核心解码器102，将在核心层解码处理中得到的信号S6输出到上采样处理单元103。输出到上采样处理单元103的信号S6，可以是核心层的解码信号本身，根据核心层的编码模型也可以是一部分解码参数(例如，频谱参数或声源参数)。

上采样处理单元103对于从核心解码器102输出的解码信号或在解码处理过程中得到的一部分解码参数或解码信号，进行提高乃奎斯特频率的处理。上采样后的信号S7输出到增强解码器105。不过该上采样处理并不局限于在时间轴上进行，根据可伸缩性编码的算法，也可以采用将上采样处理后的信号输出到增强声源解码器122，在扩展声源解码时使用的构成。

另一方面，用于扩展码分组的分组分解单元104，根据通过分组网输入进来的含有增强层的编码信息的扩展码分组中提取出增强层的编码信息，将其(S2)输出到增强解码器105的同时，将帧丢失信息C2输出到增强解码器105和切换开关107。

增强解码器105利用分组分解单元104输出的帧丢失信息C2和编码信息S2、核心解码器102输出的核心层的解码信号S3及核心层的编码处理过程中得到的信息S4、上采样处理单元103输出的对核心层的解码信号进行上采样后的信号S7，进行增强层的解码处理得到增强层的解码信号(宽带信号)，并将解码信号S8、S9分别输出到HPF106及加法单元108。不过，输出到加法单元108的信号S8与输出到HPF106的信号S9可以不相同。例如，增强解码器105可以将来自上采样处理单元103的信号S7不加处理的直接输出到加法单元108，也可以参考帧丢失信息C2有条件地切换。

HPF106，对由增强解码器105输入的解码信号S9只让其高频分量(不含在核心层的窄带解码信号中的带宽分量)通过，并输出到切换开关107。

切换开关(SW)107对由HPF106输入的信号是否输出到加法单元108进行ON/OFF切换。开关的ON/OFF切换参考帧丢失信息来进行，所述帧丢失信息分别由用于基本码分组的分组分解单元101和用于扩展码分组的分组分解单元104输出。具体来说，核心层和增强层均没有丢失时(正常帧)，将开关打开呈OFF状态。另外，只有核心层为正常帧而增强层为丢失帧时，将开关关闭呈ON状态。再者，核心层和增强层均为丢失帧时，将开关打开呈OFF状态。

加法器108，将由增强解码器105直接输入的全带宽的音频信号与由增强解码器105经过HPF106输入的高频带信号相加，并将相加后的结果作为宽带信号输出。

图2是示意实施例1涉及的核心解码器内部的主要结构的方框图。

该核心解码器102包括参数解码器111，基本线性预测系数(LPC)解码器112，核心声源解码器113及合成滤波器114。

参数解码器111将分组分解单元101输出的核心层的编码信息(比特流)S1，分离成LPC参数编码数据(包括LSP码等)、及声源参数编码数据(包括音调延迟(pitch-lag)码、固定源码本码、增益码)，将各个数据解码成各种码，并分别输出到基本(层)LPC解码器112和核心声源解码器113。

核心LPC解码器112对参数解码器111输出的LPC参数的码进行解码，将解码LPC输出到合成滤波器114及增强解码器105。解码处理的具体内容为，例如将通过矢量量化编码的LSP参数解码后变成LPC参数。不过，用于基本码分组的分组分解单元101输出的帧丢失信息C1如果表示当前帧为丢失帧的话，核心LPC解码器112通过帧丢失补偿处理来进行LPC参数的隐藏处理，将由隐藏处理生成的LPC(补偿信号)作为LPC输出。

核心声源解码器113对由参数解码器111输出的声源参数的各种码(音调延迟、固定码本、增益码本等码)实施解码处理，将解码声源信号(S6)输出到合成滤波器114及上采样处理单元103。另外，核心声源解码器113，将通过此解码处理被解码的一部分或全部的信息S3输出到增强解码器105。具体来说，音调延迟信息与脉冲驱动信号(固定码本声源信息)等从核心声源解码器113输出到增强解码器105。不过，由用于基本码分组的分组分解单元101输入的帧丢失信息C1如果示意当前帧为丢失帧的话，核心声源解码器113就以帧丢失补偿处理来进行声源参数的隐藏处理，并将通过隐藏处理生成的补偿声源信号作为解码声源信号输出。

合成滤波器114用由核心声源解码器113输出的解码声源信号来驱动线性预测滤波器，并输出窄带信号S5，该线形预测滤波器由核心LPC解码器112输出的解码LPC构成。

图3是示意实施例1涉及的增强解码器内部的主要结构的方框图。

该增强解码器105包括参数解码单元121，增强声源解码器122，2个切换开关(123、126)，2个合成滤波器(124、128)，LPC转换单元125，及增强LPC解码器127。

参数解码单元121将由分组分解单元104输出的增强层的编码信息S2分离成：LPC参数编码数据(包括LSP码等)和声源参数编码数据(包括音调延迟码、固定码本索引码、增益码等)，解码成各种参数码，并分别输出到增强LPC解码器127及增强声源解码器122。

增强LPC解码器127使用核心解码器102内的核心LPC解码器112输入的解码基本LPC参数S4和参数解码单元111输入的增强层LPC参数码，对用于再次合成宽带信号的LPC参数进行解码，并输出到2个合成滤波器(向合成滤波器124的输出要经由切换开关126)。具体使用的模型为，根据由核心LPC解码器112输入的解码LSP(窄带LSP)预测增强LSP(宽带LSP)。这种情况下，增强LPC解码器127进行以下一系列的处理：对根据窄带LSP预测出的宽带LSP的预测误差进行解码处理(例如使用MA预测矢量量化等编码的)，并将其加到根据窄带LSP预测出的宽带LSP上，进行最终的宽带LSP解码，最后转换成LPC。

另外，由用于扩展码分组的分组分解单元输入的帧丢失信息如果示意当前帧为丢失帧的话，增强LPC解码器127就以帧丢失补偿处理来进行LPC参数隐藏处理，将通过隐藏处理生成的补偿LPC作为解码LPC输出。不过也可以进行其他方法的解码处理。

LPC转换单元125将窄带LPC参数S4转换成宽带LPC参数。作为该上采样方法的例子，对从窄带LSP得到的LPC合成滤波器的脉冲响应进行上采样，根据上采样后的冲激响应求自相关，将求出的自相关转换成所希望次数的LSP等方法，不过并不局限于此。自相关系数Ri与LPC参数ai之间的转换通过利用两者之间的下式(式1)所示的关系得以实现。

(式1)

转换后的LPC参数通过切换开关126输出到合成滤波器124。另外，图中虽然未示出，在使用譬如用转换后的LPC参数对扩展LPC进行解码的编码模型时，将转换后的LPC也输出到增强LPC解码器127。

增强声源解码器122由参数解码单元121输入扩展声源参数的各种码信息，且由核心声源解码器113输入基本声源参数的解码信息、解码基本声源信号等的基本声源解码处理过程中得到的信息。增强声源解码器122进行增强声源(宽带声源)信号的解码处理，并输出到解码信号合成滤波器124及合成滤波器128(向合成滤波器124的输出经由开关123来进行)。

例如，增强声源解码器122进行CELP方式的解码处理时，该处理包括音调延迟的解码处理，自适应码本分量的解码处理，固定码本分量的解码处理，增益参数的解码处理等。

音调延迟的解码处理例如如下地进行：由于基于从核心声源解码器113输出的音调延迟信息用于增强声源的音调延迟被量化，所以增强声源解码器122若将采样频率扩展为2倍的话，就将用于基本声源的音调延迟变成2倍，以将声源用音调延迟转换成增强声源用音调延迟，另一方面，对被差分量化的音调延迟(δ延迟)进行解码。接着，增强声源解码器122将被转换成用于增强声源的音调延迟与通过解码得到的δ延迟的和，作为增强声源用解码音调延迟。

自适应码本分量的解码处理中，增强声源解码器122例如使用根据增强声源解码器122的自适应码本、即过去由增强声源解码器122生成的声源信号的缓存来生成自适应码本分量，并对其进行解码。

固定码本分量的解码处理中，增强声源解码器122例如将由核心声源解码器113输入的转换后的固定码本的采样率，作为增强声源解码处理中固定码本的一个分量来使用。另外，增强声源解码器122，在扩展音声源码本内还另外具有一个固定码本，通过解码处理对追加的固定码本分量进行解码。通过让解码后的自适应码本分量和固定码本分量，分别乘以解码后的增益参数并相加来得到解码声源信号。

不过，由用于扩展编码分组的分组分解输入的帧丢失信息若示意当前帧为丢失帧的话，增强声源解码器122就以帧丢失补偿处理来进行声源参数的隐藏处理，并将通过隐藏处理生成的补偿声源信号作为解码声源信号输出。

切换开关123是将上采样处理单元103和增强声源解码器122的其中一方与合成滤波器124连接的切换开关，根据由用于基本码分组的分组分解单元101输入的帧丢失信息C1和由用于扩展码分组的分组分解单元104输入的帧丢失信息C2来切换。具体来说，核心层为正常帧而增强层为丢失帧时，合成滤波器124的输入端子与上采样处理单元103的输出端子连接，其他的情况下，合成滤波器124的输入端子与增强声源解码器122的输出端子连接。

切换开关126是将LPC转换单元125和增强LPC解码器127的其中一方与合成滤波器124的第二输入端子连接的切换开关，根据由用于基本码分组的分组分解单元101输入的帧丢失信息C1和由用于扩展码分组的分组分解单元104输入的帧丢失信息C2来切换。具体来说，核心层为正常帧而增强层为丢失帧时，合成滤波器124的第二输入端子与LPC转换单元125的输出端子连接，其他的情况下，合成滤波器124的第二输入端子与增强LPC解码器127的输出端子连接。

合成滤波器124由增强LPC解码器127或LPC转换单元125经由开关126输入滤波器系数，并利用这些输入滤波器系数构成合成滤波器。构成的合成滤波器，由从增强声源解码器122或上采样处理单元103经过开关123输入的声源信号来驱动，输出信号S8输出到加法器。另外，只要核心层的帧不丢失，合成滤波器124就持续生成没有差错的信号。

合成滤波器128是由增强LPC解码器127输入的滤波器系数构成的合成滤波器，并由增强声源解码器122输入的解码声源信号来驱动，将输出信号S9输出到高通滤波器106。合成滤波器128无论是否有帧丢失，一直生成宽带的解码信号。

HPF106切断核心解码器102的解码信号带宽的滤波器，合成滤波器128的输入信号被输入，只有高频分量(由增强层扩展的带宽)通过，并输出到开关107。高通滤波器最好具有线性相位特性，但并不限定于此。

切换开关107为对输出到加法器的信号进行ON/OFF切换的开关，根据由用于基本码分组的分组分解单元输入的帧丢失信息，和由用于扩展码分组的分组分解单元输入的帧丢失信息进行切换。具体来说，核心层为正常帧而增强层为丢失帧时，切换开关关闭，HPF106的信号就输出到加法器，其他的情况下，切换开关107打开，HPF106的信号就不输出到加法器。

加法器108将由合成滤波器124输入的解码信号与由切换开关107输入的只有高频分量的解码信号相加，作为最终的宽带解码信号输出。

合成滤波器128在发生增强层丢失时，即合成滤波器124的输出信号的带宽变窄时，将通过HPF106提取出的高频分量的信号与通过合成滤波器124生成的窄带解码信号相加后输出。其结果是，一直都可以得到宽带的解码信号。也就是说，可以防止因解码信号的带宽变化而产生主观不协调感。另外，由于即使增强层的信息丢失低频分量也不会受到影响，因而可以生成高质量的宽带信号。因为对于人的听觉来说低频分量非常重要，并且在CELP方式的编码或解码中因低频分量的错位(音调周期)造成的质量下降较为明显，因此只要低频分量不出差错，即使高频分量中混有一些差错也可以减少主观质量的下降。

不过，核心层为比特率可伸缩性解码器时，可以将用于基本码的分组分割成与比特率可伸缩性结构的层数相当的数量。这种情况下，也根据层数来准备用于基本码的分组分解单元。比特率可伸缩性编码信息的核心层(比特率可伸缩性核心层)以外的信息在分组网内丢失时，将图1中由解码器102输出的各种信息视为，只是通过核心解码器102的比特率可伸缩性核心层解码处理而得到的。另外，只有比特率可伸缩性核心层以外的比特率可伸缩性增强层的一部分增强层丢失时，可以利用比特率可伸缩性核心层与正常接收的比特率可伸缩性增强层的一部分信息来进行核心解码器的解码处理。

图4与图5是示意以上说明的增强解码器105内部的信号流向的图。图4示意的是没有帧丢失时，即正常状况下的信号流向。图5示意的是增强层丢失时的信号流向。图中NB信号表示窄带信号，WB信号表示宽带信号。

接下来，对具有上述结构的可伸缩性解码装置的解码处理的概要，用图6所示的信号图来说明。该图示意的是在第n帧中发生帧丢失时的状况。

虚线表示的信号S101示意没有帧丢失的情况下的信号。但是，在传输路径上该信号的该频率(增强层)分组丢失的话，实际接收的信号就只有低频分组。于是，本实施例通过对该低频分组的信号实施上采样处理等，来生成采样率为宽带且只存在低频分量的信号S102(实线信号)。另一方面，根据第n-1帧的信号S103，通过隐藏处理生成补偿信号S104。让该信号S104经过HPF，这样只有高频分量被提取出而成为信号S105。加法单元108，通过将只存在低频分量的信号S101与只存在高频信号的S105相加，得到解码信号S106。

这样，根据本实施例，对通过正常接收的为无差错低频分量的核心层编码信息得到的信号进行上采样，在上采样后的信号中相加信号，而得到全带宽解码信号，所述信号为从通过增强层进行差错隐藏处理而生成的全带宽信号中只提取出高频分量的信号。

采用这种结构的话，带宽可伸缩性音频编码信息的核心层以外的编码信息即使丢失，也可以不仅一直生成增强层支持的音频信号带宽还可以生成核心层支持的音频信号带宽。

另外，只根据核心层的编码信息得到的解码信号，虽然其采样率没有变化仍为宽带解码信号的状态，但是合成滤波器的输出信号的带宽根据增强层的差错状况会变宽或变窄。即，增强层的帧丢失时，解码信号的带宽变窄。可是根据本实施例的话，能够防止解码音频信号的带宽在短时间内发生变化，不让音频信号中产生不协调感或不悦感。且低频分量的质量不下降。

在带宽可伸缩性音频解码中，由分组网对分组传送进行优先控制时，若只有增强层的编码数据丢失，解码器端的解码信号的带宽就会发生变化，而可能在听觉上感到不悦。在无差错状态下解码的核心层解码信号上相加通过帧丢失隐藏处理解码的增强层解码信号的高频分量，由此能够防止解码信号带宽的时间性变化，而能够在解码器端得到较为稳定的听觉效果。

另外，由于采用利用核心层的解码信息对增强层的编码或解码及帧丢失隐藏处理进行自适应切换的结构，因而即使增强层的信息丢失，只要核心层的信息正常被接收，就可以得到高质量的解码信号。

再者，有效利用分组网的优先控制，可以实现高质量的音频通信效果。

不过，在本实施例中，以增强层为1层时的情况为例进行了说明，增强层也可以为2层以上(输出频率带宽为2种以上)。

另外，还可以是核心层具有比特率可伸缩性的分层结构(可伸缩性编码器或可伸缩性解码器)。

另外，输出各个频带的编码或解码的算法，也可以是具有比特率可伸缩性的分层结构。

另外，增强解码器105也可以是基于MDCT模型的解码器。图7是示意增强解码器105为MDCT类型时上采样处理单元103a的结构的方框图。

该上采样处理单元103a包括MDCT单元131和次数扩展单元132。

核心解码器102，将基本解码信号作为窄带解码信号输出的同时，也输出到MDCT单元131。这相当于图1所示的解码器102的2个输出信号(S3、S4)相同的情况。另外，将核心层的解码过程中得到的信息的一部分或全部输出到增强解码器105。

MDCT单元131，对由核心解码器102输出的窄带解码信号进行变形离散余弦变换处理(MDCT)，将得到的MDCT系数输出到次数扩展单元132。

次数扩展单元132，对MDCT单元131输出的MDCT系数的次数通过加零进行扩展(进行2倍上采样时使MDCT次数为2倍，增加的部分用零系数补充)。将扩展后的MDCT系数输出到扩展解码单元105。

增强解码器105，对次数扩展单元132输出的MDCT系数进行逆变形离散余弦变换，生成增强层的解码信号。另外，增强解码器105在进行隐藏处理时，将通过隐藏处理生成的扩展信息添加在次数扩展单元132输出的DCT系数上，对由此生成的MDCT系数进行逆变形离散余弦变换，来生成增强层的解码信号。

(实施例2)

图8是示意本发明实施例2涉及的可伸缩性解码装置主要结构的方框图。该可伸缩性解码装置与实施例1所示的可伸缩性解码装置具有相同的基本结构，对于相同的结构要素赋予相同的符号，并省略其说明。

本实施例涉及的可伸缩性解码装置包括模式判断单元201，并且在利用模式判断接口201操作具有输入/输出接口的核心解码器102和增强解码器105方面与实施例1有所不同。

接下来，对具有上述机构的可伸缩性解码装置的操作进行说明。

核心解码器102，利用由分组分解单元101输入的帧丢失信息C1与编码信息S3进行核心层的解码处理，并将核心层的解码信号(窄带信号)作为S6输出。另外，将核心层的解码处理中得到的信息的一部分或全部输出到增强解码器105。输出到增强解码器105的信息用于增强层的解码处理。再者，将核心层的解码处理中得到的信号输出到上采样处理单元103及模式判断单元201。输出到上采样处理单元103的信号，根据不同核心层的编码模型，可以是核心层的解码信号本身，也可以是一部分解码参数。输出到模式判断单元201的信息是一般来说用于对语音信号的状态(无声，有声固定部分，噪声性辅音部分，上升，过度部分等)进行分类的参数，例如线性预测系数，音调预测增益，音调延迟，音调周期，信号能，越零率，反射系数，对数断面积比，LSP参数，归一化线性预测残差功率等。

模式判断单元201，利用核心解码器102输入的各种信息，对解码中的信号进行分类(例如，噪声性辅音部分，有声固定部分，上升部分，有声过度部分，无声部分，音乐信号等)，将这些分类结果输出到增强解码器105。分类并不局限于上述的这些例子。

增强解码器105，利用由分组分解单元104输出的帧丢失信息与编码信息、由核心解码器102输出的在核心层编码过程中得到的信息和由上采样处理单元103输出的对核心层的解码信号进行上采样后的信号，进行增强层的解码处理。不过，利用由模式判断单元输入的模式信息，通过选择性的使用适于该模式的编码方式的扩展编码器(图中未示出)进行增强层的编码处理时，解码时也进行相同的处理。

这样采用由核心层来判断现在的音频信号的状况，且自适应地切换增强层的编码方式的结构的话，便可以实现更高质量的编码或解码。

解码信号作为增强层的解码信号(宽带信号)输出到HPF106及加法器108。输出到加法器108的信号与输出到HPF106的信号可以相同。例如，加法器108可以将由上采样单元103输入的信号不加处理地直接输出。另外，也可以参考帧丢失信息有条件地切换输出到加法器108的信息(例如，在上采样处理单元103输入的信号和通过增强解码器105内进行的解码处理生成的信号之间切换)。

另外，帧丢失信息示意当前帧为丢失帧时，增强解码器105进行帧丢失隐藏处理。这种情况下，由于模式判断单元201输入表示音频信号模式的信息，因而进行适于该模式的隐藏处理。通过隐藏处理生成的宽带信号，经由HPF106及开关输出到加法器。HPF106可以通过时域上的数字滤波器来实现，不过也可以利用通过MDCT等正交变换，从时域变换成频域，只留下高频分量，再通过逆变换复原成时域的处理方法。

核心LPC解码器112，将LPC解码处理过程中得到的音频参数或通过已解码的LPC得到的音频参数(例如反射系数，对数截面积比，LSP，归一化线性预测残差功率等)输出到模式判断单元。

核心声源解码器113，将声源解码过程中得到的音频参数或通过已解码的音频信号得到的音频参数(例如音调延迟，音调周期，音调增益，音调预测增益，声源信号能，声源信号越零率等)输出到模式判断单元201。

另外，图中没有表示出的更为优选的是，设置用于分析合成滤波器输出的窄带解码信号的越零率或能量的分析单元，将这些参数输出到模式判断单元。

模式判断单元201，由核心LPC解码器112及核心声源解码器113等输入各种音频参数(LSP，LPC，反射系数，对数断面面积比，归一化线性预测残差功率，音调延迟，音调周期，音调增益，音调预测增益，声源信号能，声源信号越零率，合成信号能，合成信号越零率等)，进行音频信号的模式分类(无声部分，噪音性辅音部分，有声固定部分，上升部分，有声过滤部分，语尾，音乐信号等)，并将分类结果分别输出到增强LPC解码器127及增强声源解码器122。另外，图中虽然没有表示出来当增强解码器105具有譬如后滤波器的后处理单元时，也可以将上述模式分类信息输出到该后处理单元。

增强LPC解码器127，可以根据由模式判断单元201输入的音频信号的各种模式切换解码处理，这时，以在增强LPC解码器(图中未示出)中也进行同样的编码模型切换处理为前提。另外，增强层发生帧丢失时，进行对应上述模式的帧丢失隐藏处理，生成解码扩展LPC。

增强声源解码器122，可以根据由模式判断单元201输入的音频信号的各种模式切换解码处理。这时，以在扩展音频编码器(图中未示出)中也切换成同样的编码模型为前提。另外，增强层发生帧丢失时，进行对应上述模式的帧丢失隐藏处理，生成解码增强声源信号。

(实施例3)

图9是示意实施例1或2涉及的可伸缩性解码装置运用在移动通信***上时，移动站装置及基站装置的主要结构的方框图。

该移动通信***包括语音信号发送装置300及语音信号接收装置310。并且，语音信号接收装置310搭载实施例1或实施例2所示的可伸缩性解码装置。

语音信号发送装置300包括输入装置301，A/D转换装置302，语音编码装置303，信号处理装置304，RF调制装置206及天线307。

A/D转换装置302的输入端子与输入装置301的输出端子连接。语音编码装置303的输入端子与A/D转换装置302的输出端子连接。信号处理装置304的输出端子与语音编码装置303的输出端子连接。RF调制装置305的输入端子与信号处理装置304的输出端子连接。发送装置306的输入端子与RF调制装置305的输出端子连接。天线307与发送装置306的输出端子连接。

输入装置301，接收语音信号并将其变成电信号的模拟语音信号，提供给A/D转换装置302。A/D转换装置302，将来自输入装置301的模拟语音信号转换成数字语音信号，并提供给语音编码装置303。语音编码装置303，对来自A/D转换装置302的数字语音信号进行编码，生成语音编码比特序列并提供给信号处理装置304。信号处理装置304，对来自语音编码装置303de语音编码比特序列进行信道编码处理、分组处理及发送缓冲处理后，将该语音编码比特序列提供给RF调制装置305。RF调制装置305，对来自信号处理装置304的经过信道编码等处理的语音编码比特序列信号进行调制，并提供发送装置306。发送装置306，将来自RF调制装置305的调制后的语音编码信号通过天线307作为电波(RF信号)发送出去。

语音信号发送装置300对通过A/D转换装置302得到的数字语音信号实施的处理，以数十ms的帧为单位进行。构成***的网络为分组网时，将1帧或若干帧的编码数据放入1个分组，并将该分组发送给分组网。不过，当所述网络为线路交换网时，无需进行分组处理和缓冲处理。

语音信号接收装置310包括天线311，接收装置312，RF解调装置313，信号处理装置314，语音解码装置315，D/A转换装置316及输出装置317。

接收装置312的输入端子与天线311连接。RF解调313的输入端子与接收装置312的输出端子连接。信号处理装置314的输入端子与RF解调装置313的输出端子连接。语音解码装置315的输入端子与信号处理装置314的输出端子连接。D/A转换装置316的输入端子与语音解码装置315的输出端子连接。输出装置317的输入端子与D/A转换装置316的输出端子连接。

接收装置312，通过天线311接收含有语音编码信息的电波(RF信号)，生成模拟电信号的接收语音编码信号，并提供给RF解调装置313。通过天线311接收的电波(RF信号)，在传输路径中，如果没有信号的衰落或噪声的重叠的话，就与语音信号发送装置300发送的电波(RF信号)完全相同。

RF解调装置313，将来自接收装置312的接收语音编码信号解调后提供给信号处理装置314。信号处理装置314，对来自RF解调装置313的接收语音编码信号进行抖动吸收缓冲(Jitter Absorption Buffering)处理、分组组合处理及信道解码处理等，并将接收语音编码比特序列提供给语音解码装置315。语音解码装置315，对来自信号处理装置314的接收语音编码比特序列进行解码处理，生成解码语音信号并提供给D/A转换装置316。D/A转换装置316，将来自语音解码装置315的数字解码语音信号转换成模拟解码语音信号，并提供给输出装置317。输出装置317，将D/A转换装置316的模拟解码语音信号转换成空气振动，作为人耳可以听见的声波输出。

这样，便能够提供一种与实施例1或实施例2具有相同效果的移动站装置(通信终端装置)。

另外，本发明涉及的可伸缩性解码装置，并不局限于上述的各实施例，可以加以各种变化来实施。例如可以将实施例1与实施例2适当的组合起来实施。

图10是示意将实施例1和2组合时的可伸缩性解码装置的主要结构的方框图。

核心解码器102，对在解码过程中得到的音频参数或解码信号进行分析，将得到的音频参数输出到模式判断单元201。作为音频参数，有例如前述所有的各种参数。这种结构在增强解码器105使用根据MDCT的编码算法时非常有效。

以上对本发明的种种实施例进行了说明。

不过以上是以本发明通过硬件来实现的情况为例进行的说明，本发明也可以通过软件来实现。例如，本发明涉及的增强层丢失的隐藏方法的算法用编程语言来记载并将该程序存储在存储器中，通过信息处理单元来实现，这样可以实现与本发明涉及可伸缩性解码装置同样的功能。

另外，为区别于LSP会将LSP的余弦，即将LSP作为L(i)时的cos(L(i))特意地称作LSF(line Spectral Frequency)，不过在本说明书中，LSF为LSP的一种形态，使用的LSP这一用语是指LSP中包括LSF。也就是说，可以将LSP当作LSF。

另外，在上述说明的各种实施例中，核心层为对带宽最窄的信号进行编码或解码的层。不过在存在对某一带宽的信号进行编码或解码的X层和对带宽大于所述某一带宽的信号进行编码或解码的Y层时，将X层定义为核心层，Y层定义为增强层，也可以适用本发明的内容。这种情况下，X层不一定得是对带宽最窄的信号进行编码或解码的层，也可以是由多个X层形成的可伸缩性结构。

另外，在上述各实施例的说明中使用的各功能块，最为典型的是通过集成电路LSI来实现，可以将各功能分别芯片化，也可以将全部或一部分功能芯片化。

另外，此处所称的LSI，根据集成度的不同也可称作IC、***LSI、超级LSI、极大LSI等。

集成电路化的方法并不局限于LSI，也可以通过专用电路或通用处理器来实现。也可以在制造LSI后，使用可编程的FPGA(Field Programmable GateArray)，或LSI内部的电路块的连接或设定可以重新构成的可重构处理器。

再者，根据半导体技术的进步或派生出的其他技术，若有可以替代LSI的集成电路化技术问世的话，当然也可以利用该技术进行功能块的集成化。也有应用生物技术的可能性。

本说明书基于2004年4月30日提出的日本专利特愿2004-136280号申请。其内容全部包含于此。

工业实用性

本发明涉及的可伸缩性解码装置及增强层丢失的隐藏方法，可用于移动通信***中的通信终端装置等。

Claims

1.一种可伸缩性解码装置，根据包括具有频率轴方向上可伸缩性的核心层和增强层的编码信息获得宽带解码信号，其特征在于所述可伸缩性解码装置包括：

核心层解码单元，根据核心层的编码信息获取窄带的核心层解码信号；

转换单元，将所述窄带的核心层解码信号的频带变成宽带而获得第一信号；

补偿单元，对于存在核心层而增强层丢失的编码信息，根据过去已经得到的解码信号生成宽带的补偿信号；

消除单元，所述宽带的补偿信号中除去相当于核心层的频率分量而获得第二信号；以及

加法单元，将第一信号与第二信号相加以获得宽带的解码信号。

2.根据权利要求1的可伸缩性解码装置，其特征在于，

所述核心层解码单元包括：

LPC解码单元，根据核心层的编码信息获取核心层的解码LPC；

核心层声源信号解码单元，根据核心层的编码信息获得核心层的解码声源信号，

所述转换单元包括：

LPC转换单元，对所述核心层的解码LPC进行次数转换，变成宽带的LPC；

上采样处理单元，对所述核心层的解码声源信号进行上采样处理，使其成为宽带声源信号；

合成滤波器，由具有在所述LPC转换单元处被转换成次数带宽的LPC形成，并使用作为驱动声援信号的由上采样处理单元上采样的宽带声源信号合成第一信号，

所述补偿单元包括：

增强层LPC解码单元，基于根据增强层的编码信息过去已经获得的增强层的解码LPC，生成宽带的补偿LPC；

增强层声源信号解码单元，基于根据增强层的编码信息过去已经获得的增强层的解码声源信号，生成宽带的补偿声源信号；

第二合成滤波器，由所述增强层LPC解码单元生成的补偿LPC形成，将所述增强层声源信号解码单元生成出的补偿声源信号作为驱动声源信号，合成所述补偿信号。

3.根据权利要求1的可伸缩性解码装置，其特征在于，

所述转换单元包括：

MDCT单元，对所述窄带的核心层解码信号进行修改的离散余弦变换；

次数扩展单元，对通过所述MDCT单元得到的MDCT系数的次数进行扩展得到所述第一信号。

4.根据权利要求1的可伸缩性解码装置，其特征在于，

所述补偿单元，按照包括所述核心层与增强层的编码信息的模式，切换所述补偿信号的生成方法。

5.一种通信终端装置，其特征在于包括权利要求1所述的可伸缩性解码装置。

6.一种基站装置，其特征在于包括权利要求1所述的可伸缩性解码装置。

7.一种增强层丢失的隐藏方法，针对包括具有频率可伸缩性的核心层和增强层的编码信息，其特征在于包括以下步骤：

根据核心层的编码信息获取窄带的核心层解码信号；

将所述窄带的核心层解码信号的频带变成宽带而获得第一信号；

对于存在核心层而增强层丢失的编码信息，根据过去已经得到的解码信号生成宽带的补偿信号；

所述宽带的补偿信号中除去相当于核心层的频率分量而获得第二信号；

将第一信号与第二信号叠加获得宽带的解码信号。