CN101335003B

CN101335003B - 噪声生成装置、及方法

Info

Publication number: CN101335003B
Application number: CN2007101514089A
Authority: CN
Inventors: 张德明; 代金良
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2007-09-28
Filing date: 2007-09-28
Publication date: 2010-07-07
Anticipated expiration: 2027-09-28
Also published as: JP2010540992A; EP2202725A4; CA2701902A1; US20100191522A1; EP2202725A1; CN101335003A; JP2012247810A; JP5096582B2; EP2202725B1; US8296132B2; WO2009043287A1; US20120288109A1

Abstract

本发明公开了一种噪声生成方法，所述方法包括：根据预先获取的噪声参数，获取重建参数初始值；根据所述重建参数初始值获取随机取值范围；在所述随机取值范围内随机取值作为重建的噪声参数；根据所述重建的噪声参数生成噪声。本发明还公开了一种噪声生成装置，所述装置包括：初始值单元，用于根据预先获取的噪声参数，获取重建参数初始值；范围单元，用于根据所述重建参数初始值获取随机取值范围；重建单元，用于在所述随机取值范围内随机取值作为重建的噪声参数；合成单元，用于根据所述重建的噪声参数合成噪声。本发明可以适应多种标准协议，使解码端可以恢复出使用户感觉较舒适的噪音。

Description

噪声生成装置、及方法

技术领域

本发明涉及通信技术领域，尤其涉及一种噪声生成装置、及方法。

背景技术

在传输语音的过程中，通常会使用语音编码技术对语音信息进行压缩，以增加通信***的容量。

由于在进行语音通信时，只有大约40％的时间是包含语音的，其它时间都是静音或背景噪声，而通常进行语音通信的人们关心的都是语音的内容，对只有静音或背景噪声的时间并不关心，因此在对语音信息进行压缩时，会针对语音、静音或背景噪声按照不同的方法进行编码和传输，以进一步提高通信***的容量。非连续传输***/舒适噪声生成(DTX/CNG，DiscontinuousTransmission System/Comfortable Noise Generation)就是这样一种用于进一步提高通信***容量的技术。

DTX/CNG技术对背景噪声进行编码获得的帧通常称为静音***描述(SID，Silence Insertion Descriptor)帧，在普通的语音帧中会包含谱参数、信号能量增益参数、固定码本、及自适应码本相关的参数，解码端在收到语音帧后根据这些信息就可以恢复出原来的语音数据，而SID帧中一般只包含谱参数和信号能量增益参数，解码端只根据谱参数和信号能量增益参数进行背景噪音的恢复。这是因为用户通常并不关心背景噪音中包含了什么信息，因此SID帧可以只传递很少量的参考信息，也即谱参数和信号能量增益参数，解码端根据这些参考信息进行背景噪音的恢复，使用户可以大致听出对方处于什么环境，并且不会明显影响用户的听觉质量即可。在进行语音传输时，相隔若干帧才发送一次SID帧，编码参数未发送或者根本未进行编码的帧通常称为无音(NO_DATA)帧。

近年来在各大组织和机构制定的语音编码标准中，都存在DTX/CNG技术的具体应用。

在第三代伙伴组织计划(3GPP，Third Generation Partnership Projects)的语音编码标准--自适应多速率声码器(AMR，Adaptive Multi-Rate)中采用的DTX/CNG技术，即为按照固定间隔每8帧发送一次SID帧，利用接收到的连续两帧SID帧解码出的参数，也即信号能量增益参数和谱参数，进行线性插值，以估算出噪声合成所需要的参数，用公式表达为：

P_{n + k} = \frac{8 - k}{8} P_{sid (n - 1)} + \frac{k}{8} P_{sid (n)}

(k＝1，…，8)

其中P_n+k表示第n个SID帧之后的第k帧的CNG参数的估算值，P_sid(n-1)表示解码端接收到的第n-1个SID帧的参数，P_sid(n)表示解码端接收到的第n个SID帧的参数。当n＝0时，P_sid(-1)为拖尾阶段8帧语音帧谱参数和信号能量增益参数的平均值。

在国际电信联盟(ITU，International Telecommunication Union)的语音编码标准--共轭结构代数码本激励线性预测声码器定义的静音压缩方案中，采用的DTX/CNG技术，即为在编码端根据噪声参数的变化情况，自适应地确定是否发送SID，前后两帧SID的间隔最小为20毫秒，最大则不限。在解码端采用的CNG算法则用公式可表示为：

对信号能量增益参数的重建：

对谱参数的重建：

LSF_{t，sub_2}＝LSF_{sid_new}

其中

表示解码端接收到的最新SID帧解码出的信号能量增益参数，LSF_{sid_last}表示解码端上一次接收到的SID解码出的谱参数，LSF_{sid_new}表示解码端最新接收到的SID解码出的谱参数。

在对现有技术的研究和实践过程中，发明人发现现有技术存在以下问题：

3GPP的语音编码标准——AMR中采用的DTX/CNG技术，只针对编码端按照固定间隔发送SID帧的情况，在编码端使用的是自适应间隔发送SID帧时，将无法正常工作。

ITU的语音编码标准——共轭结构代数码本激励线性预测声码器定义的静音压缩方案中采用的DTX/CNG技术，在当前帧为SID时，使用解码出的谱参数与上一个SID帧平均出当前帧的第一子帧的谱参数，第二子帧的谱参数则直接使用解码出的谱参数；在下一个SID帧到来之间的无音帧，则使用最近的SID帧解码出的谱参数重建噪声，当下一个SID帧到来且解码出的谱参数和前一帧SID帧的谱参数有差别时，就会出现不连续性，且由于谱参数是一个处于不断变化中的量，因此前后两个谱参数通常是有差别的，因此重建的舒适噪声的谱，很容易出现不连续性，进而影响到听觉质量，在前后两个谱参数差别较大时尤其明显。

发明内容

本发明实施例要解决的技术问题是提供一种噪声生成装置、及方法，使解码端恢复出使用户感觉较舒适的噪音。

为解决上述技术问题，本发明实施例一方面，提供了一种噪声生成方法，所述方法包括：

根据预先获取的噪声参数，获取重建参数初始值；根据所述重建参数初始值获取随机取值范围；在所述随机取值范围内随机取值作为重建的噪声参数；根据所述重建的噪声参数生成噪声；所述根据所述重建参数初始值获取随机取值范围包括，根据从静音***描述帧中获取的噪声参数确定噪声参数增量；获取预测间隔长度，根据预测间隔长度及所述噪声参数增量确定游动半径；根据所述重建参数初始值及所述游动半径确定游动中心；以所述游动中心为所述随机取值范围的中心，以所述游动半径为所述随机取值范围的半径，确定所述随机取值范围。

另一方面，提供了一种噪声生成装置，所述装置包括：

初始值单元，用于根据预先获取的噪声参数，获取重建参数初始值；

范围单元，用于根据所述重建参数初始值获取随机取值范围；

重建单元，用于在所述随机取值范围内随机取值作为重建的噪声参数；

合成单元，用于根据所述重建的噪声参数合成噪声；

所述范围单元包括，增量单元，用于根据从静音***描述帧中获取的噪声参数获取噪声参数增量；间隔获取单元，用于获取预测间隔长度；半径获取单元，根据所述预测间隔长度及所述噪声参数增量确定游动半径；中心获取单元，用于根据所述重建参数初始值及所述游动半径确定游动中心；运算单元，用于以所述游动中心为所述随机取值范围的中心，以所述游动半径为所述随机取值范围的半径，确定所述随机取值范围。

以上技术方案可以看出，本发明实施例对编码端使用的协议标准没有限制，无论编码端按照固定间隔发送SID帧，还是自适应间隔发送SID帧，都可以正常工作。

且由于在收到第一个SID帧之后，再次收到新的SID帧时，都会取在最新收到的SID帧的前一帧重建的噪声参数作为所述重建参数初始值，并参考该重建参数初始值及最新收到的SID帧的噪声参数，确定一个随机取值范围，在该范围内随机取值作为噪声参数，生成的噪声过渡比较自然，会给用户带来较好的听觉体验。

附图说明

图1、本发明实施例提供的噪声生成方法实施例一流程图；

图2、本发明实施例提供的噪声生成方法实施例二流程图；

图3、本发明实施例提供的噪声生成方法实施例三流程图；

图4、本发明实施例提供的噪声生成方法实施例四流程图；

图5、本发明实施例提供的噪声生成装置实施例结构图。

具体实施方式

本发明实施例提供了一种噪声生成装置、及方法，可以适应多种标准协议，使解码端恢复出使用户感觉较舒适的噪音。

本发明实施例提供的噪声生成方法实施例，在解码端通过少量的SID帧中的噪声参数，重建随机变化、曲线平滑的噪声参数，以恢复出使用户感觉较舒适的噪音。

本发明实施例提供的噪声生成方法实施例一流程如图1所示，包括：

步骤101、获取SID帧中携带的噪声参数。

开始语音通信后，解码端从接收到的语音数据流中译码出帧信息，然后对该帧的格式进行判断，若该帧为语音帧，则进入语音帧处理流程；若为非语音帧，如SID帧或者无音帧，则进入本实施例提供的噪声生成方法实施例流程。

在处理非语音帧时，由于无音帧中不包含任何语音数据，直接进入步骤102，在收到SID帧时，就要获取该SID帧中携带的噪声参数，即信号能量增益参数和谱参数。

步骤102、根据获得的噪声参数重建根据预测方向随机变化、曲线平滑的连续噪声参数，包括信号能量增益参数和谱参数，当前帧为非语音帧，包括SID帧及无音帧。

为了使重建的噪声参数不会偏离实际值太远，首先要为重建的噪声参数的变化曲线确定一个中心值，使重建的噪声参数取值在该中心值附近游动，该中心值可以被称为游动中心C_k，同时也要确定游动的范围，使重建的噪声参数取值以C_k为中心，在该范围内游动，该游动范围可以称为游动半径Δ。

获得游动半径Δ的方法有很多种，本实施例提供了其中的两种：一种为根据噪声参数增量dP、预测间隔长度length、以及当前帧与最新收到的SID帧的时间间隔k获得；一种为根据噪声参数增量dP、预测间隔长度length获得。

根据第一种方法获得游动半径Δ时，当前帧噪声参数的游动半径Δ用公式可以表述为：

Δ = \frac{dP}{2 (| k - length | + 1)}

其中length为预测的最新收到的SID帧与下一个SID帧之间的间隔长度，即假设经过时间length可以收到下一帧SID帧。

当当前帧为解码端在语音段之后接收到第一帧SID帧时，噪声参数增量dP可以利用最新接收到的SID帧噪声参数P_sid，或缓存区中存储的过去几帧语音帧的能量增益参数和谱参数获得。

解码端在语音帧之后接收到第一帧非语音帧时，本实施例提供了两种获得噪声参数增量的方法：

方法一、利用缓存区中存储的过去几帧语音帧的能量增益参数和谱参数，估算出过去平均能量增益参数和谱参数，作为重建参数初始值P_ref，以最新收到的噪声参数P_sid与重建参数初始值P_ref的差值作为噪声参数增量dP，此时噪声参数增量dP可用公式表述为：

dP＝P_sid-P_ref

估算重建参数初始值P_ref的方式可以是采用前几帧能量增益参数和谱参数的平均值作为重建参数初始值P_ref，也可以是采用前几帧能量增益参数和谱参数的加权平均值作为重建参数初始值P_ref。

方法二、直接采用最新收到的SID帧携带的能量增益参数和谱参数，重建该SID帧到下一个SID帧之间的噪声，在收到该SID帧的下一个SID帧时，再开始重建噪声参数，采用语音帧之后第一帧SID帧携带的能量增益参数和谱参数作为重建参数初始值P_ref，以最新收到的噪声参数P_sid与重建参数初始值P_ref的差值作为噪声参数增量dP，此时噪声参数增量dP可用公式表述为：

dP＝P_sid-P_ref

若是第一帧SID帧之后收到的SID帧或无音帧，本实施例提供了两种获得噪声参数增量的方法：

方法一、以最新接收到的SID帧前一帧重建的噪声参数P_k-1为重建参数初始值P_ref，最新接收到的SID帧噪声参数P_sid与重建参数初始值P_ref的差值作为噪声参数增量dP，此时噪声参数增量dP可用公式表述为：

dP＝P_sid-P_ref

方法二、以最新收到的SID帧携带的噪声参数与前一帧SID帧携带的噪声参数的差值作为噪声参数增量dP，以最新收到的SID帧为第n帧为例，噪声参数增量dP用公式可以表述为：

dP＝P_sid(n)-P_sid(n-1)

在收到下一个SID帧之前，为两个SID帧之间的无音帧重建噪声参数时，可以使用最近收到的SID帧的噪声参数增量dP为无音帧确定游动半径Δ，也可以在每次为新的无音帧重建噪声时，更新噪声参数增量dP，本实施例提供了两种更新噪声参数增量dP的方法：

方法一、最新接收到的SID帧噪声参数P_sid与重建参数初始值P_ref的差值作为噪声参数增量dP，在为无音帧重建噪声参数时，以前一帧重建的噪声参数P_k-1更新重建参数初始值P_ref，则使用重建参数初始值P_ref获得的噪声参数增量dP也会相应被更新。

方法二、以最近接收到的SID帧的噪声参数与前一帧SID帧携带的噪声参数的差值为d₀，以最近接收到的SID帧的前一帧重建的噪声参数为P₀，当前帧为距离最新接收到的SID帧的第k帧，当前帧的噪声参数增量为d_k，以d₀减去重建参数初始值P_ref与P₀的差值获得当前帧的噪声参数增量d_k，使d_k＝dP，此时d_k用公式可以表述为：

d_k＝d₀-(P_ref-P₀)

在为无音帧重建噪声参数时，以前一帧重建的噪声参数P_k-1更新重建参数初始值P_ref，则使用重建参数初始值P_ref获得的噪声参数增量d_k也会相应被更新。

变化曲线的预测方向也就是游动半径Δ的取值方向，而游动半径Δ的取值方向受噪声参数增量dP的影响，当噪声参数增量dP为“+”时，Δ取值为“+”；当噪声参数增量dP为“-”时，Δ取值为“-”。

当当前帧是SID帧时，k为“0”，

2(|k-length|+1)＝2(length+1)

Δ = \frac{dP}{2 (length + 1)}

随着无音帧构成的无音段的持续时间变长，k值慢慢变大，在噪声参数增量dP不变时，2(|k-length|+1)的取值将会慢慢变小，Δ的取值则会慢慢变大。

当k＝length，即当前帧是最新收到的SID帧后的第length帧时，

2(|k-length|+1)＝2

Δ = \frac{dP}{2}

若该帧后还没有收到新的SID帧，k值继续增加，在噪声参数增量dP不变时，2(|k-length|+1)的取值将会慢慢变大，Δ的取值则会慢慢变小。

所以在为两个SID帧之间的无音帧重建噪声参数，噪声参数增量dP不变时，Δ的取值是一个初始值等于

最大值等于

而后缓慢衰减的数值。若噪声参数增量dP也在随之发生变化，则Δ的取值的变化将会受到相应影响。

根据第二种方法获得游动半径Δ时，当前帧噪声参数的游动半径Δ用公式可以表述为：

Δ = \frac{dP}{2 * length}

获得噪声参数增量dP及预测间隔长度length的方法与上文所述第一种获得游动半径Δ的方法基本相同。

此时，游动半径Δ的取值方向仍然受噪声参数增量dP的影响，当噪声参数增量dP为“+”时，Δ取值为“+”；当噪声参数增量dP为“-”时，Δ取值为“-”。

当前帧噪声参数的游动中心C_k可以通过重建参数初始值P_ref与当前帧噪声参数的游动半径Δ获得，游动中心C_k用公式可以表述为：

C_k＝P_ref+2Δ

其中，重建参数初始值P_ref会在每一次重建噪声参数时进行更新，以当前噪声参数为P_k，则以P_k-1更新P_ref，此时游动中心C_k用公式可以表述为：

C_k＝P_k-1+2Δ

以C_k为中心，在[C_k-|Δ|，C_k+|Δ|]区间内采用随机取值的方法，重建出当前帧的噪声参数P_k，噪声参数P_k用公式可以表述为：

P_k＝rand(C_k-|Δ|，C_k+|Δ|)

当当前帧是SID帧，Δ取值为“+”时，C_k也大于前一帧的噪声参数P_k-1，[C_k-|Δ|，C_k+|Δ|]的下限为：

C_k-|Δ|＝P_k-1+Δ

[C_k-|Δ|，C_k+|Δ|]的下限比P_k-1高Δ，在采用第一种方法获得Δ时，Δ的取值初始值等于是噪声参数增量dP的

相对噪声参数增量dP而言是一个很小的取值，因此[C_k-|Δ|，C_k+|Δ|]的下限是一个比P_k-1稍高的数值。在采用第二种方法获得Δ时，

Δ = \frac{P_{sid} - P_{k - 1}}{2 * length},

Δ的取值是噪声参数增量的

相对噪声参数增量dP而言是一个很小的取值，因此[C_k-|Δ|，C_k+|Δ|]的下限也是一个比P_k-1稍高的数值。

[C_k-|Δ|，C_k+|Δ|]的上限为：

C_k+|Δ|＝P_k-1+3Δ

[C_k-|Δ|，C_k+|Δ|]的上限比P_k-1高3Δ，在采用第一种方法获得Δ时，以lengh取值为“2”为例，3Δ的值为噪声参数增量dP的

仍然要小于噪声参数增量dP，即[C_k-|Δ|，C_k+|Δ|]的上限小于P_k-1与噪声参数增量dP的和。

在采用第二种方法获得Δ时，以length取值为“2”为例，3Δ的值为P_sid与P_k-1差值的

仍然要小于噪声参数增量dP，即[C_k-|Δ|，C_k+|Δ|]的上限小于P_k-1与噪声参数增量dP的和，而且第二种方法通常被应用于采用固定间隔发送SID帧的场合，这种时候length一般会比“2”大得多，3Δ的值就更小了。

同理，若当前帧是SID帧，Δ取值为“-”时，[C_k-|Δ|，C_k+|Δ|]的下限会比最新接收到的SID帧噪声参数P_sid高，上限会比前一帧的噪声参数P_k-1稍低。

因此在当前帧是SID帧时，在[C_k-|Δ|，C_k+|Δ|]区间内随机取值的噪声参数P_k，会是一个相比前一帧的噪声参数P_k-1稍有变化的参数，这种变化是被最新接收到的SID帧噪声参数P_sid所影响的，温和的变化，即使最新接收到的SID帧噪声参数P_sid与前一帧的噪声参数P_k-1差值非常大，P_k也会是一个过度较平滑的值，根据P_k生成的噪声也会变化较为缓和，会带给用户较好的感受。

当当前帧为无音帧时，重建参数初始值P_ref为前一帧的重建的噪声参数P_k-1，游动中心C_k受到重建参数初始值P_ref的影响，会向游动半径Δ的取值方向发生平缓的变化，在[C_k-|Δ|，C_k+|Δ|]区间内随机取值的噪声参数P_k，会是一个相比前一帧的噪声参数P_k-1稍有变化的参数，两个SID帧之间重建出的连续噪声参数P_k会是一个过度较平滑的值，根据P_k生成的噪声也会变化较为缓和，会带给用户较好的感受。

进一步，在两个SID帧之间的游动半径Δ可能会受k值或dP取值的影响发生变化，随机取值的范围也会相应发生变化，两个SID帧之间重建出的连续噪声参数P_k会是一个变化更加随机的曲线，根据P_k生成的噪声也会发生较多不同的变化，会带给用户较好的感受。

在有些情况下，当前帧为无音帧时，也可能在下一帧SID帧到来前都不更新重建参数初始值P_ref，此时就要依靠游动半径Δ的变化来改变随机取值的范围。

本实施例中，重建参数初始值P_ref包括：重建信号能量增益参数初始值、重建谱参数初始值。

步骤103、利用重建的噪声参数生成噪声。

解码端利用随机序列发生器合成激励信号，该激励信号在重建噪声时，相当于SID帧相比普通语音帧缺少的内容，如固定码本、及自适应码本相关的参数等，解码端根据噪音的共性，利用随机序列发生器合成激励信号，用以重建噪声。

利用激励信号及重建的噪声参数生成噪声的方法有两种：

第一种、解码端将重建的噪声参数中的谱参数，转换为合成滤波器系数，对激励信号进行合成滤波，获得噪声信号，然后对合成的噪声信号用重建的噪声参数中的能量增益参数进行时域整形，进行后处理，即可输出为最终的重建噪声。

第二种、解码端利用重建的噪声参数中的能量增益参数及随机序列发生器合成激励信号，然后将重建的噪声参数中的谱参数，转换为合成滤波器系数，对激励信号进行合成滤波，获得噪声信号。

在本实施例中，对编码端使用的协议标准没有限制，无论编码端按照固定间隔发送SID帧，还是自适应间隔发送SID帧，都可以正常工作。

且由于每次收到新的SID帧都会参考前一帧重建的噪声参数、及新收到的噪声参数，重建噪声参数，生成的噪声过渡比较自然，用户会有较好的听觉体验，同时也参考了实际噪音参数的影响，使用户可以分辨出大致的语音环境；进一步在处理无音帧时，根据无音帧与最近的SID帧之间的距离、最近的SID帧的噪声参数的变化方向、及最近的SID帧的噪声参数与重建参数初始值的差值，为该无音帧重建与前一帧相比变化微小的噪声参数，使得重建出的噪声参数变化曲线较为平滑，因此生成的噪声每帧之间的过渡也比较自然，会给用户带来较好的听觉体验。

本发明实施例提供的噪声生成方法实施例二，编码端采用自适应间隔发送SID帧，流程如图2所示，包括：

步骤201、接收SID帧，获取其中携带的噪声参数。

在处理非语音帧时，由于无音帧中不包含任何语音数据，通常直接进入步骤202，在收到SID帧时，就要获取其中携带的噪声参数，即信号能量增益参数G_sid和谱参数lsf_sid。

步骤202、获得重建参数初始值。

解码端在检测到帧类型从语音帧切换为非语音帧时，即接收到第一帧SID帧时，通过缓冲区中存储的过去N_p帧的能量增益参数和谱参数，计算出平均的能量增益参数G_ref和谱参数lsf_ref作为重建参数初始值，此处N_p取值为大于0的整数，例如N_p＝5，过去的帧可以是语音帧，也可以是SID帧。重建能量增益参数初始值G_ref和重建谱参数初始值lsf_ref用公式表达如下：

{lsf}_{ref} = \frac{1}{N_{p}} Σ_{i = 1}^{N_{p}} {lsf}_{i}

G_{ref} = \frac{1}{N_{p}} Σ_{i = 1}^{N_{p}} G_{i}

若接收到的SID帧不是第一帧SID帧，则用该SID帧前一帧重建的能量增益参数和谱参数作为重建参数初始值。

本实施例中在为无音帧重建噪声参数时，可以每次都使用前一帧重建的能量增益参数和谱参数更新重建参数初始值，也可以在下一帧SID帧到来前都不更新重建参数初始值。

步骤203、重建噪声参数。

在从语音段转入噪音段时，也即接收到语音帧后第一帧SID帧时，将length初始值置为N_p，之后再次收到SID帧时，取最新SID帧与其前一个SID帧之间的间隔长度。为了保证DTX的效率，一般来说会对SID帧的发送间隔进行限制，即length必须大于等于一个自然数，例如在G.729B版本的协议中规定length必须大于等于2。

从最近的SID帧中解码得到的能量增益参数为G_sid、谱参数为lsf_sid，对于该SID帧后第k帧，其能量增益参数的噪声参数增量d_k，G用公式可以表述为：

d_k，G＝G_sid-G_ref

其能量增益参数的游动半径Δ_G用公式可以表述为：

Δ_{G} = \frac{d_{k, G}}{2 (| k - length | + 1)}

其谱参数的噪声参数增量d_k，lsf用公式可以表述为：

d_k，lsf＝lsf_sid-lsf_ref

其谱参数的游动半径Δ_ilsf用公式可以表述为：

Δ_{lsf}^{i} = \frac{d_{k, lsf}}{2 (| k - length | + 1)}

i＝1，2，…，M

其中M为谱参数线性预测的阶数。

则当前帧的重建噪声参数中重建能量增益参数的游动中心C_G，k用公式可以表述为：

C_G，k＝G_ref+2Δ_G

当前帧的重建噪声参数中重建谱参数的游动中心C_lsf，k ⁱ用公式可以表述为：

C_{lsf, k}^{i} = {lsf}_{ref} + 2 {Δ^{i}}_{lsf}

当前帧的重建噪声参数中重建能量增益参数G_k用公式可以表述为：

G_k＝rand(C_G，k-|Δ_G |，C_G，k+|Δ_G|)

当前帧的重建噪声参数中重建谱参数l_sfk ⁱ用公式可以表述为：

{lsf}_{k}^{i} = rand (C_{lsf, k}^{i} - | Δ_{lsf}^{i} |, C_{lsf, k}^{i} + | Δ_{lsf}^{i} |)

其中函数rand(a，b)是指在区间[a，b]中取均匀分布的随机数。如果接收到新的SID帧时，用下面算法对相关变量进行更新：

length＝k-1；

G_ref＝G_k-1；

{lsf}_{ref} = {lsf}_{k - 1}^{i};

最后使k＝1；

如果收到的是无音帧，在更新重建参数初始值时使：

G_ref＝G_k；

lsf_ref＝lsf_k；

对重建参数初始值进行更新，然后使k＝k+1。

继续重建出该帧的噪声参数，直到收到新的SID帧。

步骤204、利用重建的噪声参数生成噪声。

采用随机序列生成白噪声激励信号e(n)；

用重建的谱参数lsf_k构造合成滤波器a_k(z)；

将生成的激励信号用合成滤波器合成滤波：

y_k(n)＝e(n)*a_k(n)

然后将合成的噪声y_k(n)使用重建的能量增益参数G_k进行时域整形：

y (n) = y_{k} (n) \times \frac{G_{k}}{\sqrt{Σ_{i = 0}^{N - 1} y_{k}^{2} (n)}}

其中N为帧长，即可在解码端恢复出舒适噪声。

本实施例步骤204采用的利用重建的噪声参数生成噪声的方法，即为上文提到的利用激励信号及重建的噪声参数生成噪声的方法一。

且由于在从语音段转向噪音段时，采用最后语音段的平均能量增益参数和谱参数作为初始值，参考新收到的噪声参数，重建噪声参数，这就保证了从语音段到噪音段切换时，生成的噪声与语音段的过渡比较自然，用户会有较好的听觉体验，同时由于参考了实际噪音参数的影响，使用户可以分辨出大致的语音环境；每次收到新的SID帧都会采用前一帧重建的噪声参数作为初始值，参考新收到的噪声参数，重建噪声参数，生成的噪声过渡比较自然，用户会有较好的听觉体验，同时也参考了实际噪音参数的影响，使用户可以分辨出大致的语音环境；进一步在处理无音帧时，根据无音帧与最近的SID帧之间的距离、最近的SID帧的噪声参数的变化方向、及最近的SID帧的噪声参数与重建参数初始值的差值，为该无音帧重建与前一帧相比变化微小的噪声参数，使得重建出的噪声参数变化曲线较为平滑，因此生成的噪声每帧之间的过渡也比较自然，会给用户带来较好的听觉体验。

本发明实施例提供的噪声生成方法实施例三，编码端采用固定间隔发送SID帧，其流程如图3所示，包括：

步骤301、接收SID帧，获取其中携带的噪声参数。

在处理非语音帧时，由于无音帧中不包含任何语音数据，通常直接进入步骤302，在收到SID帧时，就要获取其中携带的噪声参数，即信号能量增益参数G_sid、谱参数lsf_sid。

步骤302、获得重建参数初始值。

编码端采用固定的SID帧间隔发送SID帧，这里假定SID帧间隔为LENGTH，LENGTH取值为大于0的自然数。

解码端在检测到帧类型从语音帧切换为非语音帧时，即接收到第一帧SID帧时，将接收到的SID帧中的噪声参数用作未来LENGTH帧的重建噪声参数，并用作重建噪声能量增益参数G_ref和谱参数lsf_ref的初始值，重建能量增益参数初始值G_ref和重建谱参数初始值lsf_ref用公式表达如下：

lsf_ref＝lsf_sid(1)

G_ref＝G_sid(1)

步骤303、重建噪声参数。

重建噪声参数从收到第二个SID帧之后开始，从最近的SID帧中解码得到的能量增益参数为G_sid、谱参数为lsf_sid，对于该SID帧后第k帧，其能量增益参数的噪声参数增量d_k，G用公式可以表述为：

d_k，G＝G_sid-G_ref

其能量增益参数的游动半径Δ_G用公式可以表述为：

Δ_{G} = \frac{d_{k, G}}{2 * LENGTH}

其谱参数的噪声参数增量d_k，lsf用公式可以表述为：

d_k，lsf＝lsf_sid-lsf_ref

其谱参数的游动半径Δ_lsf ⁱ用公式可以表述为：

Δ_{lsf}^{i} = \frac{d_{k, lsf}}{2 * LENGTH}

i＝1，2，…，M

其中M为线性预测的阶数。

C_G，k＝G_ref+2Δ_G

C_{lsf, k}^{i} = {lsf}_{ref} + 2 {Δ^{i}}_{lsf}

G_k＝rand(C_G，k-|Δ_G|，C_G，k+|Δ_G|)

{lsf}_{k}^{i} = rand (C_{lsf, k}^{i} - | Δ_{lsf}^{i} |, C_{lsf, k}^{i} + | Δ_{lsf}^{i})

其中函数rand(a，b)是指在区间[a，b]中取均匀分布的随机数。

如果接收到新的SID帧时，用下面算法对相关变量进行更新：

length＝k-1；

G_ref＝G_k-1；

lsf_ref＝lsf_k-1；

最后使k＝1；

如果收到的是无音帧，在更新重建参数初始值时使：

G_ref＝G_k；

lsf_ref＝lsf_k；

对重建参数初始值进行更新，然后使k＝k+1。

继续重建出该帧的噪声参数，直到收到新的SID帧。

步骤304、利用重建的噪声参数生成噪声。

使用随机序列发生器以及重建的能量增益参数G_k合成白噪声激励信号e(n)；

用重建的谱参数lsf_k构造合成滤波器a_k(z)；

将生成的激励信号用合成滤波器合成滤波：

y_k(n)＝e(n)*a_k(n)

再经过后滤波处理，即可在解码端恢复出舒适噪声。

本实施例步骤304采用的利用重建的噪声参数生成噪声的方法，即为上文提到的利用激励信号及重建的噪声参数生成噪声的方法二。

在本实施例中，对编码端使用的协议标准没有限制，无论编码端按照固定间隔发送SID帧，还是自适应间隔发送SID帧，都可以重建出变化比较平滑的噪声参数，包括能量增益参数、谱参数等，进而生成比较自然的舒适噪声。

由于在从语音段转入噪音段时，采用最新收到的SID帧的噪声参数生成第一帧SID帧到下一个SID帧之间的噪声，每次收到新的SID帧都会采用前一帧重建的噪声参数作为初始值，参考新收到的噪声参数，重建噪声参数，生成噪声，由于语音段转入噪音段时，发送来的SID帧离语音段非常近，所以直接使用最新收到的SID帧的噪声参数生成第一帧SD帧到下一个SID帧之间的噪声，语音段转入噪音段的过渡会比较自然，且两帧SID帧的间隔很短，在短暂的时间内噪音没有变化，是普通人的听觉无法发现的，用户会有较好的听觉体验；每次收到新的SID帧都会采用前一帧重建的噪声参数作为初始值，参考新收到的噪声参数，重建噪声参数，生成的噪声过渡比较自然，用户会有较好的听觉体验，同时也参考了实际噪音参数的影响，使用户可以分辨出大致的语音环境；进一步在处理无音帧时，根据无音帧与最近的SID帧之间的距离、最近的SID帧的噪声参数的变化方向、及最近的SID帧的噪声参数与重建参数初始值的差值，为该无音帧重建与前一帧相比变化微小的噪声参数，使得重建出的噪声参数变化曲线较为平滑，因此生成的噪声每帧之间的过渡也比较自然，会给用户带来较好的听觉体验。

本发明实施例提供的噪声生成方法实施例四，编码端采用自适应间隔发送SID帧，流程如图4所示，包括：

步骤401、接收SID帧，获取其中携带的噪声参数。

在处理非语音帧时，由于无音帧中不包含任何语音数据，通常直接进入步骤402，在收到SID帧时，就要获取其中携带的噪声参数，即信号能量增益参数G_sid和谱参数lsf_sid。

步骤402、获得重建参数初始值。

解码端在检测到帧类型从语音帧切换为非语音帧时，即接收到第一帧SID帧时，假设此时从该帧中获得的信号能量增益参数为G_sid(I)、谱参数为lsf_sid(I)，则重建能量增益参数初始值G_ref和重建谱参数初始值lsf_ref可用公式表达为：

G_ref＝G_sid(I)

lsf_ref＝lsf_sid(I)

步骤403、重建噪声参数。

解码器从收到最新的SID帧中解码得到的能量增益参数为G_sid(n)、谱参数为lsf_sid(n)，(n＝1，2，…)，使：

d_0，G＝G_sid(n)-G_sid(n-1)

d_0，lsf＝lsf_sid(n)-lsf_sid(n-1)

则对于第n个SID帧后第k帧，其能量增益参数的噪声参数增量d_k，G用公式可以表述为：

d_k，G＝d_0，G-(G_ref-G₀)

其中，G_ref为能量增益参数的重建参数初始值，G₀为最近接收到的SID帧的前一帧重建的能量增益参数。

当该最近接收到的SID帧为第一帧SID帧时，G₀为缓冲区中存储的过去N_p帧的能量增益参数的加权平均值G_sid(0)。G_sid(0)可用公式表达如下：

G_{sid (0)} = Σ_{i = 1}^{N_{p}} w_{i} \times G_{i}

其中Wi为权值，满足关系

Σ_{i = 1}^{N_{p}} w_{i} = 1 .

其能量增益参数的游动半径Δ_G用公式可以表述为：

Δ_{G} = \frac{d_{k, G}}{2 (| k - length | + 1)}

其谱参数的噪声参数增量d_k，lsf ⁱ用公式可以表述为：

d_{k, lsf}^{i} = d_{0, lsf} - ({lsf}_{ref} - {lsf}_{0})

其中，lsf_ref为谱参数的重建参数初始值，lsf₀为最近接收到的SID帧的前一帧重建的谱参数。

当该最近接收到的SID帧为第一帧SID帧时，lsf₀为缓冲区中存储的过去N_p帧的能量增益参数的加权平均值lsf_sid(0)。lsf_sid(0)可用公式表达如下：

{lsf}_{sid (0)} = {lsf}_{0} = Σ_{i = 1}^{N_{p}} w_{i} \times {lsf}_{i}

其中w_i为权值，满足关系

Σ_{i = 1}^{N_{p}} w_{i} = 1 .

其谱参数的游动半径Δ_lsf ⁱ用公式可以表述为：

Δ_{lsf}^{i} = \frac{d_{k, lsf}^{i}}{2 (| k - length | + 1)}

i＝1，2，…，M

其中M为谱参数线性预测的阶数。

C_G，k＝G_ref+2Δ_G

C_{lsf, k}^{i} = {lsf}_{ref} + 2 {Δ^{i}}_{lsf}

G_k＝rand(C_G，k-|Δ_G|，C_G，k+|Δ_G|)

当前帧的重建噪声参数中重建谱参数lsf_k ⁱ用公式可以表述为：

{lsf}_{k}^{i} = rand (C_{lsf, k}^{i} - | Δ_{lsf}^{i} |, C_{lsf, k}^{i} + | Δ_{lsf}^{i} |)

其中函数rand(a，b)是指在区间[a，b]中取均匀分布的随机数。

如果接收到新的SID帧时，用下面算法对相关变量进行更新：

length＝k-1；

G_ref＝G_k-1；

{lsf}_{ref} = {lsf}_{k - 1}^{i};

最后使k＝1；

如果收到的是无音帧，在更新重建参数初始值时使：

G_ref＝G_k；

lsf_ref＝lsf_k；

对重建参数初始值进行更新，然后使k＝k+1。

继续重建出该帧的噪声参数，直到收到新的SID帧。

步骤404、利用重建的噪声参数生成噪声。

采用随机序列生成白噪声激励信号e(n)；

用重建的谱参数lsf_k构造合成滤波器a_k(z)；

将生成的激励信号用合成滤波器合成滤波：

y_k(n)＝e(n)*a_k(n)

y (n) = y_{k} (n) \times \frac{G_{k}}{\sqrt{Σ_{i = 1}^{N - 1} y_{k}^{2} (n)}}

其中N为帧长，即可在解码端恢复出舒适噪声。

本实施例步骤404采用的利用重建的噪声参数生成噪声的方法，即为上文提到的利用激励信号及重建的噪声参数生成噪声的方法一。

由于在从语音段转入噪音段时，采用最新收到的SID帧的噪声参数作为初始值，参考新收到的噪声参数，重建噪声参数，由于语音段转入噪音段时，发送来的SID帧离语音段非常近，所以直接使用最新收到的SID帧的噪声参数作为初始值，语音段转入噪音段的过渡会比较自然；每次收到新的SID帧都会采用前一帧重建的噪声参数作为初始值，参考新收到的噪声参数，重建噪声参数，生成的噪声过渡比较自然，用户会有较好的听觉体验，同时也参考了实际噪音参数的影响，使用户可以分辨出大致的语音环境；进一步影响重建噪声参数随机取值范围的噪声参数增量，是根据最近的SID帧与前一帧SID帧的差值、及重建参数初始值与最近的SID帧前一帧重建的噪声参数的差值获得的，被该噪声参数增量影响的取值范围比起前一帧会发生平滑的变化，在此范围内随机取值的重建噪声参数也会受到相应的影响，使得重建出的噪声参数变化曲线较为平滑，因此生成的噪声每帧之间的过渡也比较自然，会给用户带来较好的听觉体验。

本发明实施例提供的噪声生成装置实施例通常位于解码端，可通过少量的SID帧中的噪声参数，重建随机变化、曲线平滑的噪声参数，以恢复出使用户感觉较舒适的噪音。

本发明实施例提供的噪声生成装置实施例结构如图5所示，包括：

初始值单元5100，用于根据预先获取的噪声参数，获取重建参数初始值；

范围单元5200，用于根据所述重建参数初始值获取随机取值范围；

重建单元5300，用于在所述随机取值范围内随机取值作为重建的噪声参数；

合成单元5400，用于根据所述重建的噪声参数合成噪声。

合成单元5400利用激励信号及重建的噪声参数生成噪声的方法有两种：

第一种、合成单元5400将重建的噪声参数中的谱参数，转换为合成滤波器系数，对激励信号进行合成滤波，获得噪声信号，然后对合成的噪声信号用重建的噪声参数中的能量增益参数进行时域整形，进行后处理，即可输出为最终的重建噪声。

第二种、合成单元5400利用重建的噪声参数中的能量增益参数及随机序列发生器合成激励信号，然后将重建的噪声参数中的谱参数，转换为合成滤波器系数，对激励信号进行合成滤波，获得噪声信号。

其中，初始值单元5100包括：

第一初始值单元5101，用于在收到第一个静音***描述帧时，取所述静音***描述帧之前预定数目个帧的噪声参数的平均值作为重建参数初始值；

第二初始值单元5102，用于在收到第一个静音***描述帧之后，再次收到静音***描述帧时、或为无音帧重建噪声参数时，取在最新收到的静音***描述帧的前一帧重建的噪声参数作为所述重建参数初始值。

范围单元5200包括：

增量单元5210，用于根据从静音***描述帧中获取的噪声参数获取噪声参数增量；

间隔获取单元5220，用于获取预测间隔长度；

半径获取单元5230，根据所述预测间隔长度及所述噪声参数增量获取游动半径；

中心获取单元5240，用于根据所述重建参数初始值及所述游动半径获取游动中心；

运算单元5250，用于以所述游动中心为所述随机取值范围的中心，以所述游动半径为所述随机取值范围的半径，确定所述随机取值范围。

其中增量单元5210包括：

第一增量单元5211，用于以从最近获取的静音***描述帧中获取的噪声参数与所述重建参数初始值的差值作为所述噪声参数增量；

或第二增量单元5212，用于以从最近获取的静音***描述帧中获取的噪声参数与从前一帧静音***描述帧中获取的噪声参数的差值作为所述噪声参数增量；

或第三增量单元5213，用于以从最近获取的静音***描述帧中获取的噪声参数与从前一帧静音***描述帧中获取的噪声参数的差值，与所述重建参数初始值与最近获取的静音***描述帧前一帧的重建噪声参数的差值的差值作为所述噪声参数增量。

半径获取单元5230包括：

第一半径获取单元5232，用于以所述噪声参数增量、与两倍的所述预测间隔长度相除获得所述游动半径；

或第二半径获取单元5231，用于根据所述噪声参数增量、所述预测间隔长度、当前帧与最新收到的静音***描述帧的距离获得所述游动半径。

间隔获取单元5220包括：

第一间隔获取单元5221，用于在收到第一个静音***描述帧时，以预定值作为所述间隔长度；

或、第二间隔获取单元5222，用于在收到第一个静音***描述帧时，以***设定的发送静音***描述帧间隔作为所述间隔长度。

第三间隔获取单元5223，用于在收到第一个静音***描述帧之后，再次收到静音***描述帧时、或为无音帧重建噪声参数时，以所述最新收到的静音***描述帧和前次收到的静音***描述帧之间间隔长度为所述预测间隔长度。

本发明实施例提供的噪声生成装置实施例的操作方法与上文所述本发明实施例提供的噪声生成方法实施例基本类似，在此不再重复描述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上对本发明所提供的一种噪声生成装置、及方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种噪声生成方法，其特征在于，所述方法包括：

根据预先获取的噪声参数，获取重建参数初始值；根据所述重建参数初始值获取随机取值范围；在所述随机取值范围内随机取值作为重建的噪声参数；根据所述重建的噪声参数生成噪声；

所述根据所述重建参数初始值获取随机取值范围包括，根据从静音***描述帧中获取的噪声参数确定噪声参数增量；获取预测间隔长度，根据预测间隔长度及所述噪声参数增量确定游动半径；根据所述重建参数初始值及所述游动半径确定游动中心；以所述游动中心为所述随机取值范围的中心，以所述游动半径为所述随机取值范围的半径，确定所述随机取值范围。

2.如权利要求1所述的噪声生成方法，其特征在于，在收到第一个静音***描述帧时，获取所述重建参数初始值包括：

取所述第一个静音***描述帧之前预定数目个帧的噪声参数的平均值或加权平均值作为所述重建参数初始值。

3.如权利要求1或2所述的噪声生成方法，其特征在于，在收到第一个静音***描述帧之后，再次收到静音***描述帧时、或为无音帧重建噪声参数时，获取所述重建参数初始值包括：

取在最新收到的静音***描述帧的前一帧重建的噪声参数作为所述重建参数初始值。

4.如权利要求1所述的噪声生成方法，其特征在于，根据所述重建参数初始值及所述游动半径确定游动中心包括：

以所述重建参数初始值与两倍所述游动半径的和为所述游动中心。

5.如权利要求1所述的噪声生成方法，其特征在于，所述根据从静音***描述帧中获取的噪声参数确定噪声参数增量包括：

以从最新收到的静音***描述帧中获取的噪声参数与所述重建参数初始值的差值作为所述噪声参数增量；

或以从最新收到的静音***描述帧中获取的噪声参数与从前一帧静音***描述帧中获取的噪声参数的差值作为所述噪声参数增量；或者

或以从最新收到的静音***描述帧中获取的噪声参数与从前一帧静音***描述帧中获取的噪声参数的差值，与所述重建参数初始值与最新收到的静音***描述帧前一帧的重建噪声参数的差值的差值作为所述噪声参数增量。

6.如权利要求1所述的噪声生成方法，其特征在于，所述根据预测间隔长度及所述噪声参数增量确定游动半径包括：

以为所述游动半径；

或以

为所述游动半径；

其中，dP为所述噪声参数增量、length为所述预测间隔长度、k为当前帧与最新收到的静音***描述帧的距离。

7.如权利要求1所述的噪声生成方法，其特征在于，在收到第一个静音***描述帧时，获取所述预测间隔长度包括：

以预定值作为所述预测间隔长度；或

以***设定的发送静音***描述帧间隔作为所述预测间隔长度。

8.如权利要求1或6所述的噪声生成方法，其特征在于，在收到第一个静音***描述帧之后，再次收到静音***描述帧时、或为无音帧重建噪声参数时，获取所述预测间隔长度包括：

以所述最新收到的静音***描述帧和前次收到的静音***描述帧之间间隔长度为所述预测间隔长度。

9.一种噪声生成装置，其特征在于，所述装置包括：

合成单元，用于根据所述重建的噪声参数合成噪声；

10.如权利要求9所述的噪声生成装置，其特征在于，所述初始值单元包括：

第一初始值单元，用于在收到第一个静音***描述帧时，取所述静音***描述帧之前预定数目个帧的噪声参数的平均值作为重建参数初始值。

11.如权利要求10或9所述的噪声生成装置，其特征在于，所述初始值单元包括：

第二初始值单元，用于在收到第一个静音***描述帧之后，再次收到静音***描述帧时、或为无音帧重建噪声参数时，取在最新收到的静音***描述帧的前一帧重建的噪声参数作为所述重建参数初始值。

12.如权利要求9所述的噪声生成装置，其特征在于，所述增量单元包括：

第一增量单元，用于以从最近获取的静音***描述帧中获取的噪声参数与所述重建参数初始值的差值作为所述噪声参数增量；

或第二增量单元，用于以从最近获取的静音***描述帧中获取的噪声参数与从前一帧静音***描述帧中获取的噪声参数的差值作为所述噪声参数增量；

或第三增量单元，用于以从最近获取的静音***描述帧中获取的噪声参数与从前一帧静音***描述帧中获取的噪声参数的差值，与所述重建参数初始值与最近获取的静音***描述帧前一帧的重建噪声参数的差值的差值作为所述噪声参数增量。

13.如权利要求9所述的噪声生成装置，其特征在于，所述半径获取单元包括：

第一半径获取单元，用于以所述噪声参数增量、与两倍的所述预测间隔长度相除获得所述游动半径；

或第二半径获取单元，用于根据所述噪声参数增量、所述预测间隔长度、当前帧与最新收到的静音***描述帧的距离获得所述游动半径。

14.如权利要求9所述的噪声生成装置，其特征在于，所述间隔获取单元包括：

第一间隔获取单元，用于在收到第一个静音***描述帧时，以预定值作为所述间隔长度；

或、第二间隔获取单元，用于在收到第一个静音***描述帧时，以***设定的发送静音***描述帧间隔作为所述间隔长度。

15.如权利要求9或14所述的噪声生成装置，其特征在于，所述间隔获取单元包括：

第三间隔获取单元，用于在收到第一个静音***描述帧之后，再次收到静音***描述帧时、或为无音帧重建噪声参数时，以所述最新收到的静音***描述帧和前次收到的静音***描述帧之间间隔长度为所述预测间隔长度。