CN101266798B

CN101266798B - 一种在语音解码器中进行增益平滑的方法及装置

Info

Publication number: CN101266798B
Application number: CN 200710088039
Authority: CN
Inventors: 许剑峰; 许丽净; 张清; 李伟; 桑盛虎; 杜正中; 胡晨
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2007-03-12
Filing date: 2007-03-12
Publication date: 2011-06-15
Anticipated expiration: 2027-03-12
Also published as: WO2008110109A1; CN101266798A

Abstract

本发明公开了一种在语音解码器中进行增益平滑的方法，该方法包括：计算当前语音帧的语音参数变化因子，并对所述当前语音帧的固定码本增益进行初始化修正；按照所述语音参数变化因子确定当前语音帧的状态；利用所述初始化修正后的固定码本增益以及为该状态的语音帧设置的平滑因子，对该当前语音帧的固定码本增益进行平滑。同时，本发明还公开了一种在语音解码中进行增益平滑的装置。本发明实施例不需记录连续多帧的固定码本增益，因此存储复杂度较小，而且，也不需要同时计算稳定性因子和浊音因子，只需要计算语音变化因子，因此算法复杂度也降低。

Description

一种在语音解码器中进行增益平滑的方法及装置

技术领域

本发明涉及语音解码技术领域，更具体地说，涉及一种在语音解码器中进行增益平滑的方法及装置。

背景技术

参见图1所示，在语音通信***中，编码器将输入的语音信号进行编码，然后通过通信信道将编码后的比特流发送；解码器对从通信信道中接收到比特流进行解码后，合成为语音信号。

以下将对语音信号进行编码的编码器称为语音编码器。语音编码器常用的编码原理是代数码本激励线性预测(ACELP，Algebraic Code Excited LinearPrediction)，这类编码器包括G.729、EVRC、AMR、AMR-WB、AMR-WB+等。其中G.729是国际电信联盟(ITU-T)的语音编码标准；EVRC是第三代移动通信合作伙伴计划2(3GPP-2，3rd Generation Partnership Project2)的语音编码标准；AMR、AMR-WB、AMR-WB+是第三代移动通信合作伙伴计划(3GPP，3rd Generation Partnership Project)的语音编码标准。

基于ACELP的语音编码器生成的码流都是以语音帧为单位的，有些将帧分为若干子帧，如AMR，以子帧为单位。对于每一帧的输入数据，通常为几十毫秒PCM格式数据，发送端的语音编码器要将其编码为一组参数。这些参数一般要经过量化并且传输。接收端的解码器则要将这些参数重新合成为语音信号，常见为PCM格式数据。

基于ACELP的语音编码器生成的语音帧的参数一般包括谱参数、自适应码本参数、代数码本参数、自适应码本增益和代数码本增益等。

由于编码过程中会产生量化噪声，降低了语音质量，因此在解码器端重新合成语音信号时，一般会进行一些后处理，如固定码本增益平滑和增强周期性，以改善的合成语音质量。其中固定码本增益平滑的目的是为了避免稳态语音的能量不自然波动。

目前语音解码器有两种方法对固定码进行增益平滑。一种是基于短期LSP(线谱对，Linear Spectral Pair)的稳定性对固定码本进行增益平滑，另一种是基于语音的稳定性和浊音特性对固定码本进行增益平滑。

基于短期LSP的稳定性对固定码本进行增益平滑处理步骤如下：

(1)对于每个帧，计算平均LSP。

\overset{&OverBar;}{q} (n) = 0.84 \cdot \overset{&OverBar;}{q} (n - 1) + 0.16 \cdot {\hat{q}}_{4} (n)

其中是当前帧的第4子帧的LSP，q(n-1)是上一帧的平均LSP，q(n)是当前帧的LSP。

(2)对于子帧m，计算平均LSP向量和子帧m的LSP的差分；

{diff}_{m} = \underset{j}{Σ} \frac{| {\overset{&OverBar;}{q}}^{(j)} (n) - {\hat{q}}_{m}^{(j)} (n) |}{{\overset{&OverBar;}{q}}^{(j)} (n)}

(3)计算平滑因子k_m。

k_m＝min(0.25，max(0，diff_m-0.4))/0.25

(4)利用计算最近5个子帧的固定码本平均增益；

\overset{&OverBar;}{g} (m) = \frac{1}{5} Σ_{i = 0}^{4} {\hat{g}}_{c} (m - i)

(5)对当前子帧的固定码本增益进行平滑；

{\hat{g}}_{c} = {\hat{g}}_{c} \cdot k_{m} + {\overset{&OverBar;}{g}}_{c} \cdot (1 - k_{m})

上述进行增益平滑的的缺点是：需要记录过去多个子帧的固定码本平均增益，因此，存储复杂度较大。

基于语音的稳定性和浊音特性对固定码本进行增益平滑是处理步骤如下：

(1)计算浊音因子λ＝0.5(1-rv)，rv＝(Ev-Ec)/(Ev+Ec)

其中，Ev是自适应码本的能量，Ec是固定码本的能量。

(2)计算稳定性因子θ，并且将范围限制在0≤θ≤1，计算公式为

θ = 1.25 - \frac{\underset{i}{Σ} {(isf_{new}_{i} - isf_{old}_{i})}^{2}}{400000}

其中isf_new是当前帧的ISF(导谱频率，Immitance Spectral Frequency)，isf_old是上一帧的ISF。

(3)计算增益平滑因子Sm，Sm＝λθ；

(4)对固定码本增益

进行初始化修正；

当

{\hat{g}}_{c} > g_{- 1}

时，

g_{0} = \max (g_{- 1}, {\hat{g}}_{c} / 1.19)

当

{\hat{g}}_{c} \leq g_{- 1}

时，

g_{0} = \min (g_{- 1}, {\hat{g}}_{c} \cdot 1.19)

其中，g₀表示当前帧经过初始化修正后的固定码本增益。

(5)最后对固定码本增益进行平滑。

{\hat{g}}_{c} = S_{m} g_{0} + (1 - S_{m}) {\hat{g}}_{c}

第二种进行增益平滑方法的缺点是：需要计算稳定性因子和浊音因子，算法复杂度较大。

综上所述，现有技术中，语音编码器对固定码进行增益平滑时，由于需要记录过去多个子帧的固定码本平均增益，或者需要计算稳定性因子和浊音因子，因此，语音编码过程非常复杂。

发明内容

本发明的主要目的时提供一种在语音解码器中进行增益平滑的方法及装置，用以简化语音编码中增益的平滑处理。

本发明实施例提供的一种在语音解码中进行增益平滑的方法是这样实现的：

A.计算当前语音帧的语音参数变化因子，并对所述当前语音帧的固定码本增益进行初始化修正；

B.按照所述语音参数变化因子确定当前语音帧的状态；

C.利用所述初始化修正后的固定码本增益以及该状态的语音帧对应的平滑因子，对所述当前语音帧的固定码本增益进行平滑。

本发明实施例提供的一种在语音解码中进行增益平滑的装置包括：

语音参数变化因子获取单元，用于获取当前帧的语音参数变化因子；

固定码本增益初始化修正单元，用于对所述当前语音帧的固定码本增益进行初始化修正；

语音帧状态确定单元，用于根据获得的所述当前帧的语音参数变化因子确定当前语音帧的状态；

所述固定码本增益平滑单元，用于根据所述进行初始化修正后的固定码本增益以及该状态的语音帧对应的平滑因子，对所述当前语音帧的固定码本增益进行平滑。

通过上述本发明实施例的技术方案可知，本发明实施例只需要记录上一帧的经过修正的固定码本增益，而不需记录连续多帧的固定码本平均增益，因此存储简单。而且，本发明实施例只需要利用一个当前语音帧的语音参数变化因子即可实现增益的平滑，而不需要同时计算稳定性因子和浊音因子，因此算法复杂度也降低。

附图说明

图1为语音通信***示意图；

图2为本发明实施例的对固定码本增益进行平滑的流程示意图；

图3为本发明实施例的基于谱参数变化因子对固定码本增益进行平滑的流程示意图；

图4为另一本发明实施例的基于谱参数变化因子对固定码本增益进行平滑的流程示意图；

图5为本发明实施例的基于基音延迟参数变化因子对固定码本增益进行平滑的流程示意图；

图6为本发明实施例在语音解码器中进行增益平滑的装置的结构示意图；

图7为本发明装置的一具体实施例结构示意图。

具体实施方式

本发明实施例是在语音通信***中，需要计算所述当前语音帧的语音参数变化因子，对所述当前语音帧的固定码本增益进行初始化修正；按照所述语音参数变化因子确定当前语音帧的状态；利用所述初始化修正后的固定码本增益以及为该状态的语音帧设置的平滑因子，对该当前语音帧的固定码本增益进行平滑。

这里，当前语音帧的语音参数变化因子可以利用所述当前帧的语音参数以及上一帧的语音参数计算出。语音参数可以为谱参数、基音延迟参数或浊音因子。

平滑因子可以利用一定的公式计算得到，也可以根据仿真结果得到。

参见图2所示，本发明实施例对固定码本增益进行平滑的具体流程如下：

步骤201：利用当前帧的语音参数以及上一帧的语音参数计算所述当前语音帧的语音参数变化因子，并对所述当前语音帧的固定码本增益进行初始化修正；

如果语音参数变化因子为谱参数变化因子，则步骤201中可以利用当前帧的谱参数以及上一帧的谱参数计算出当前帧的语音参数变化因子。如果语音参数变化因子为基音延迟参数变化因子，则步骤201中可以利用当前帧的基音延迟参数以及上一帧的基音延迟参数计算得出。

比如：如果当前帧的固定码本增益大于上一语音帧经过初始化修正后的固定码本增益，则在进行初始化修正时，需要将当前帧的固定码本增益设置为：上一语音帧经过初始化修正后的固定码本增益，以及固定码本增益与增益缩放因子的比值中的最大值；

如果当前帧的固定码本增益小于等于上一语音帧经过初始化修正后的固定码本增益，则进行初始化修正时，需要将当前帧的固定码本增益设置为：上一语音帧经过初始化修正后的固定码本增益，以及固定码本增益与增益缩放因子的乘积中的最小值。

步骤202：根据语音参数变化因子确定当前语音帧的状态。

这里，可以预先根据语音参数变化因子将语音帧分为若干种状态，并设置每种语音帧的状态与语音参数变化范围的对应关系，则步骤202中确定当前语音帧的状态可以这样实现：

确定所述语音帧参数变化因子所处于的语音参数变化范围；根据所述语音帧的状态与语音参数变化范围的对应关系，获得所述语音参数变化范围所对应的当前语音帧的状态。

步骤203：利用所述初始化修正后的固定码本增益以及该状态的语音帧对应的平滑因子，对该当前语音帧的固定码本增益进行平滑。

例如：进行平滑处理的公式为

{\hat{g}}_{c} = S_{m} \cdot g_{0} + (1 - S_{m}) \cdot {\hat{g}}_{c}

，其中，S_m为该状态的语音帧设置的平滑因子，为当前语音帧的固定码本增益。

参见图3所示，本发明实施例基于谱参数变化因子对固定码本增益进行平滑的具体流程如下：

步骤301：利用当前帧的谱参数和上一帧的谱参数，计算当前帧的谱参数变化因子s_diff。计算公式如下：

s_diff＝f(s_new_i，s_old_i)

其中，s_new是当前帧的谱参数，s_old是上一帧的谱参数，f为s_new和s_old的函数。

谱参数可以是ISF或ISP或LSP或LSF或LPC，不同的语音编解码器可能采用ISF、ISP、LSP、LSF、LPC的一种或多种来表示语音信号的短时相关性。

步骤302：对当前语音帧的固定码本增益

进行初始化修正。这里，可以利用上一语音帧经过初始化修正后的固定码本增益，对当前语音帧的固定码本增益

进行初始化修正，

当

{\hat{g}}_{c} > g_{- 1}

时，通过公式

g_{0} = f_{a} (g_{- 1}, {\hat{g}}_{c})

进行初始化修正：

当

{\hat{g}}_{c} \leq g_{- 1}

时，通过公式

g_{0} = f_{b} (g_{- 1}, {\hat{g}}_{c})

进行初始化修正，

其中，g₀表示当前语音帧经过初始化修正后的固定码本增益，g_-1表示上一语音帧经过初始化修正后的固定码本增益，

和

为关于g_-1和的函数，

为当前语音帧的固定码本增益。

步骤303：根据语音参数变化因子确定当前语音帧的状态。

比如：预先根据语音参数变化因子将语音帧分为n+1种状态，n为自然数t₁......t_n为语音帧状态阈值，因此，可以将语音参数变化范围设置为小于t₁，大于t₁小于t₂.....以及大于t_n-1n+1个语音参数变化范围，每个语音参数变化范围对应一种语音帧的状态；

因此，这里可以根据语音变化因子，确该定当前语音帧所处的语音参数变化范围内，进而再确定的语音参数变化范围所对应的当前语音帧的状态。

步骤304：利用所述初始化修正后的固定码本增益以及该状态对应的平滑因子，对该当前语音帧的固定码本增益进行平滑。

这里，平滑因子的值可以是根据仿真结果确定。还需要预先设置语音参数变化范围与平滑因子的对应关系。

例如：

为当前语音帧的固定码本增益，s_diff为谱参数变化因子，

当语音参数变化因子小于t₁时，为第一种状态，该状态下的平滑因子为S₁；

当语音参数变化因子大于等于t₁且小于t₂时，为第二种状态，该状态下的平滑因子为S₂；

……

当语音参数变化因子大于等于t_m-1且小于t_m时，为第二种状态，该状态下的平滑因子为S_m；

当语音参数变化因子大于等于t_n-1时，为第二种状态，该状态下的平滑因子为S_n，

如果进行平滑处理的公式为

{\hat{g}}_{c} = S_{m} \cdot g_{0} + (1 - S_{m}) \cdot {\hat{g}}_{c},

其中，S_m为该状态的语音帧设置的平滑因子，为当前语音帧的固定码本增益。

因此，当s_diff>t₁时，可以根据公式

{\hat{g}}_{c} = S_{1} \cdot g_{0} + (1 - S_{1}) \cdot {\hat{g}}_{c}

对该类语音帧的固定码本增益进行平滑：

当t₂<s_diff≤t₁时，根据公式

{\hat{g}}_{c} = S_{2} \cdot g_{0} + (1 - S_{2}) \cdot {\hat{g}}_{c}

对该类语音帧的固定码本增益进行平滑；

当s_diff≤t_n-1时，根据公式

{\hat{g}}_{c} = S_{n} \cdot g_{0} + (1 - S_{n}) \cdot {\hat{g}}_{c}

对该类语音帧的固定码本增益进行平滑；

参见图4所示，另一本发明实施例的基于谱参数变化因子对固定码本增益进行平滑的方法包括以下步骤：

步骤401：利用当前帧的谱参数和上一帧的谱参数，计算谱参数变化因子s_diff，谱参数变化因子可以是LSF、ISF、LPC、ISP、LSP等的变化因子，计算公式可以为：

s_diff = \frac{\underset{i}{Σ} {(s_{new}_{i} - s_{old}_{i})}^{2}}{s_scale}

其中s_new是当前帧的谱参数，s_old是上一帧的谱参数。s_scale是归一化因子，可以是一个常数，例如可以取值为40000。

步骤402：利用上一语音帧经过初始化修正后的固定码本增益，或固定码本增益与增益缩放因子的比值，或固定码本增益

与增益缩放因子的乘积，作为修正后的当前帧的固定码本增益。

如果当前帧的固定码本增益

大于上一语音帧经过初始化修正后的固定码本增益g_-1，则当前语音帧经过初始化修正后的固定码本增益为：上一语音帧经过初始化修正后的固定码本增益g_-1，以及固定码本增益

与增益缩放因子的比值中的最大值；

如果当前帧的固定码本增益

小于等于上一语音帧经过初始化修正后的固定码本增益g_-1，则当前语音帧经过初始化修正后的固定码本增益为：上一语音帧经过初始化修正后的固定码本增益g_-1，以及固定码本增益

与增益缩放因子的乘积中的最小值。

具体公式可以包括：

当

{\hat{g}}_{c} > g_{- 1}

时，

g_{0} = \max (g_{- 1}, {\hat{g}}_{c} / g_scale)

当

{\hat{g}}_{c} \leq g_{- 1}

时，

g_{0} = \min (g_{- 1}, {\hat{g}}_{c} \cdot g_scale)

其中，g₀表示当前语音帧经过初始化修正后的固定码本增益，g_-1表示上一语音帧经过初始化修正后的固定码本增益。g_scale是增益缩放因子，可以是一个常数，如1.06。

步骤403：根据语音参数变化因子确定当前语音帧的状态。

这里，可以根据仿真结果预先设置一个语音帧状态阈值，根据s_diff将语音帧分为两类：稳态和非稳态。当s_diff大于语音帧状态阈值时，表示谱参数处于非稳态，当s_diff小于等于语音帧状态阈值时，表示谱参数处于稳态，因此，可以针对根据仿真结果为稳态和非稳态分别设置固定码本平滑因子，稳态时的平滑因子小于非稳态的平滑因子，

步骤404：利用所述初始化修正后的固定码本增益以及为该状态的语音帧设置的平滑因子，对该当前语音帧的固定码本增益进行平滑。

当s_diff>thr时，则可以当前语音帧处于非稳态，根据公式

{\hat{g}}_{c} = S_{1} \cdot g_{0} + (1 - S_{1}) \cdot {\hat{g}}_{c}

对该类语音帧的固定码本增益进行平滑：

当s_diff≤thr时，可以当前语音帧处于稳态，根据公式

{\hat{g}}_{c} = S_{2} \cdot g_{0} + (1 - S_{2}) \cdot {\hat{g}}_{c}

对该类语音帧的固定码本增益进行平滑；

其中，

为当前语音帧的固定码本增益，thr是语音帧状态阈值，可以是一个常数，如0.58。s_diff大于thr表示谱参数处于非稳态，s_diff小于thr表示谱参数处于稳态。S₁和S₂是对应两种不同类型的固定码本增益平滑因子，都是常数，例如分别取值为0.17和0.83。

参见图5所示，本发明实施例基于基音延迟参数变化因子的对固定码本增益进行平滑的具体流程如下：

步骤501：根据当前帧的基音延迟参数和上一帧的基音延迟参数计算基音延迟参数变化因子delay_diff。公式可以如下：

delay_diff＝f(delay_new_i，delay_old_i)

其中delay_new是当前帧的基音延迟参数，s_old是上一帧的基音延迟参数，f是可以根据需要设定的函数。

步骤502：对固定码本增益

进行初始化修正。具体如下：

当

{\hat{g}}_{c} > g_{- 1}

时，可以通过公式

g_{0} = f_{a} (g_{- 1}, {\hat{g}}_{c})

进行初始化修正所述当前语音帧的固定码本增益，

当

{\hat{g}}_{c} \leq g_{- 1}

时，可以通过公式

g_{0} = f_{b} (g_{- 1}, {\hat{g}}_{c})

进行初始化修正所述当前语音帧的固定码本增益，

和

为关于g_-1和的函数，为当前语音帧的固定码本增益。

步骤503：根据基音延迟参数变化因子delay_diff确定当前语音帧的状态。确定方式可以参见步骤303。

步骤504：根据该状态对应的平滑因子，对该当前语音帧的固定码本增益进行增益平滑。

当delay_diff>t₁时，根据公式

{\hat{g}}_{c} = S_{1} \cdot g_{0} + (1 - S_{1}) \cdot {\hat{g}}_{c}

对该类语音帧的固定码本增益进行平滑；

当t₂<delay_diff≤t₁时，根据公式

{\hat{g}}_{c} = S_{2} \cdot g_{0} + (1 - S_{2}) \cdot {\hat{g}}_{c}

对该类语音帧的固定码本增益进行平滑；

当delay_diff≤t_n-1时，根据公式

{\hat{g}}_{c} = S_{n} \cdot g_{0} + (1 - S_{n}) \cdot {\hat{g}}_{c}

对该类语音帧的固定码本增益进行平滑；

其中，delay_diff为当前语音帧的基音延迟参数变化因子，S₁，...，S_n是对应不同类型的平滑因子，t₁......t_n为n个语音帧状态阈值，n为自然数，

为当前语音帧的固定码本增益。

参见图6所示，本发明实施例在语音解码器中进行增益平滑的装置包括：

语音参数变化因子获取单元61、固定码本增益初始化修正单元62、语音帧状态确定单元63以及固定码本增益平滑单元64。

其中，语音参数变化因子获取单元61，用于获取当前帧的语音参数变化因子；固定码本增益初始化修正单元62，用于对所述当前语音帧的固定码本增益进行初始化修正；语音帧状态确定单元63，用于根据获得的所述当前帧的语音参数变化因子确定当前语音帧的状态；所述固定码本增益平滑单元64，用于根据所述进行初始化修正后的固定码本增益以及该状态的语音帧对应的平滑因子，对该当前语音帧的固定码本增益进行平滑。

参见图7所示，所述语音参数变化因子获取单元61可以包括：第一语音参数获取单元71、第二语音参数获取单元72以及语音参数变化因子计算单元73。

其中，第一语音参数获取单元71，用于获取当前帧的语音参数；第二语音参数获取单元72，用于获取上一帧的语音参数；语音参数变化因子计算单元73，用于根据所述当前帧的语音参数和上一帧的语音参数计算所述当前帧的语音参数变化因子。

所述语音帧状态确定单元63可以包括：存储单元74和语音帧状态解析单元75。

其中，存储单元74，用于保存语音帧的状态与语音参数变化范围的对应关系；语音帧状态解析单元75，用于确定获得的所述语音帧参数变化因子所处于的语音参数变化范围；根据所述对应关系，获得所述语音参数变化范围所对应的当前语音帧的状态。

所述固定码本增益平滑单元64可以包括：平滑因子存储单元76、平滑因子获取单元77以及平滑处理单元78。

其中，平滑因子存储单元76，用于存储语音帧的状态与平滑因子的对应关系；平滑因子获取单元77，用于根据当前语音帧的状态，从所述语音帧的状态与平滑因子的对应关系中，获得该状态的语音帧对应的平滑因子；平滑处理单元78，用于根据

{\hat{g}}_{c} = S_{m} \cdot g_{0} + (1 - S_{m}) \cdot {\hat{g}}_{c}

对该当前语音帧的固定码本增益进行平滑，其中，S_m为该状态的语音帧设置的平滑因子，为当前语音帧的固定码本增益。

所述固定码本增益初始化修正单元62包括：比较单元79以及修正处理单元70。

其中，比较单元79，用于判断当前帧的固定码本增益是否大于上一语音帧经过初始化修正后的固定码本增益；修正处理单元70，用于当前帧的固定码本增益大于上一语音帧经过初始化修正后的固定码本增益，将当前帧的固定码本增益设置为：上一语音帧经过初始化修正后的固定码本增益，以及固定码本增益与增益缩放因子的比值中的最大值；当前帧的固定码本增益小于等于上一语音帧经过初始化修正后的固定码本增益，则将当前帧的固定码本增益设置为：上一语音帧经过初始化修正后的固定码本增益，以及固定码本增益与增益缩放因子的乘积中的最小值。

本发明实施例是：计算所述当前语音帧的语音参数变化因子，对所述当前语音帧的固定码本增益进行初始化修正；按照所述语音参数变化因子确定当前语音帧的状态；利用所述初始化修正后的固定码本增益以及为该状态的语音帧设置的平滑因子，对该当前语音帧的固定码本增益进行平滑。由于在本发明实施例中，平滑因子可以利用一定的公式计算得到，也可以根据仿真结果得到。在进行平滑处理时，只需要记录上一帧的经过修正的固定码本增益，并用静态配置好的平滑因子进行平滑处理，不需记录连续多帧的固定码本增益；而且还需要利用一个当前语音帧的语音参数变化因子即可实现增益的平滑，不需要同时计算稳定性因子和浊音因子，因此，相比现有技术来说，存储复杂度以及算法的复杂度都比较低。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种在语音解码器中进行增益平滑的方法，其特征在于，该方法包括以下步骤：

B.按照所述语音参数变化因子确定当前语音帧的状态；

2.根据权利要求1所述的方法，其特征在于，所述当前语音帧的语音参数变化因子是利用所述当前帧的语音参数以及上一帧的语音参数计算出。

3.根据权利要求2所述的方法，其特征在于，所述语音参数包括谱参数、基音延迟参数或浊音因子。

4.根据权利要求1所述的方法，其特征在于，预先将语音帧分为至少两个状态，并设置语音帧的状态与语音参数变化范围的对应关系，则步骤B包括：

确定所述语音帧参数变化因子所处于的语音参数变化范围；

根据所述语音帧的状态与语音参数变化范围的对应关系，获得所述语音参数变化范围所对应的当前语音帧的状态。

5.根据权利要求4所述的方法，其特征在于，步骤C中根据公式

对该当前语音帧的固定码本增益进行平滑；

其中，S_m为该状态的语音帧对应的平滑因子，

为当前语音帧的固定码本增益，g₀表示当前语音帧经过初始化修正后的固定码本增益。

6.根据权利要求1所述的方法，其特征在于，如果当前帧的固定码本增益大于上一语音帧经过初始化修正后的固定码本增益，则步骤A中对所述当前语音帧的固定码本增益进行初始化修正的步骤包括：

将当前帧经过初始化修正后的固定码本增益设置为：上一语音帧经过初始化修正后的固定码本增益，以及当前帧的固定码本增益与增益缩放因子的比值中的最大值；

如果当前帧的固定码本增益小于等于上一语音帧经过初始化修正后的固定码本增益，则步骤A中对所述当前语音帧的固定码本增益进行初始化修正的步骤包括：

将当前帧经过初始化修正后的固定码本增益设置为：上一语音帧经过初始化修正后的固定码本增益，以及当前帧的固定码本增益与增益缩放因子的乘积中的最小值。

7.一种在语音解码中进行增益平滑的装置，其特征在于，该装置包括：

固定码本增益平滑单元，用于根据所述进行初始化修正后的固定码本增益以及该状态的语音帧对应的平滑因子，对所述当前语音帧的固定码本增益进行平滑。

8.根据权利要求7所述的装置，其特征在于，所述语音参数变化因子获取单元包括：

第一语音参数获取单元，用于获取当前帧的语音参数；

第二语音参数获取单元，用于获取上一帧的语音参数；

语音参数变化因子计算单元，用于根据所述当前帧的语音参数和上一帧的语音参数计算所述当前帧的语音参数变化因子。

9.根据权利要求7所述的装置，其特征在于，所述语音帧状态确定单元包括：

存储单元，用于保存语音帧的状态与语音参数变化范围的对应关系；

语音帧状态解析单元，用于确定获得的所述语音帧参数变化因子所处于的语音参数变化范围；根据所述对应关系，获得所述语音参数变化范围所对应的当前语音帧的状态。

10.根据权利要求7所述的装置，其特征在于，所述固定码本增益平滑单元包括：

平滑因子存储单元，用于存储语音帧的状态与平滑因子的对应关系；

平滑因子获取单元，用于根据当前语音帧的状态，从所述语音帧的状态与平滑因子的对应关系中，获得该状态的语音帧对应的平滑因子；

平滑处理单元，用于根据

对该当前语音帧的固定码本增益进行平滑，其中，S_m为该状态的语音帧对应的平滑因子，为当前语音帧的固定码本增益，g₀表示当前语音帧经过初始化修正后的固定码本增益。

11.根据权利要求7所述的装置，其特征在于，所述固定码本增益初始化修正单元包括：

比较单元，用于判断当前帧的固定码本增益是否大于上一语音帧经过初始化修正后的固定码本增益；

修正处理单元，用于当前帧的固定码本增益大于上一语音帧经过初始化修正后的固定码本增益，将当前帧经过初始化修正后的固定码本增益设置为：上一语音帧经过初始化修正后的固定码本增益，以及当前帧的固定码本增益与增益缩放因子的比值中的最大值；当前帧的固定码本增益小于等于上一语音帧经过初始化修正后的固定码本增益，则将当前帧经过初始化修正后的固定码本增益设置为：上一语音帧经过初始化修正后的固定码本增益，以及当前帧的固定码本增益与增益缩放因子的乘积中的最小值。