CN101373594A - 修正音频信号的方法及装置 - Google Patents

修正音频信号的方法及装置 Download PDF

Info

Publication number
CN101373594A
CN101373594A CNA2007101452788A CN200710145278A CN101373594A CN 101373594 A CN101373594 A CN 101373594A CN A2007101452788 A CNA2007101452788 A CN A2007101452788A CN 200710145278 A CN200710145278 A CN 200710145278A CN 101373594 A CN101373594 A CN 101373594A
Authority
CN
China
Prior art keywords
signal
unit
assessment indicator
mean value
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101452788A
Other languages
English (en)
Inventor
郭利斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNA2007101452788A priority Critical patent/CN101373594A/zh
Publication of CN101373594A publication Critical patent/CN101373594A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明属于通信技术领域,本发明公开了一种修正音频信号的方法及装置。本发明方法包括:在音频信号数据帧边界附近截取一段信号;对截取的所述信号进行线性处理,得到新的信号;计算该新的信号的测评指标,当计算所得的测评指标小于预置的测评指标时,继续进行线性处理,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。本发明具有以下效果:计算量小,通过修正音频信号,使音频信号的时域波形变的平滑且有周期性;并且保证了信号的相位信息,减小了频谱发散,使频谱趋于平滑,进而消除边界效应。

Description

修正音频信号的方法及装置
技术领域
本发明涉及通信技术领域,尤其涉及一种修正音频信号的方法及装置。
背景技术
变换域编码是当今音频编码标准普遍采用的压缩技术之一,属于频域编码,通过降低信号中各分量间的相关性,并对变换后的系数进行量化和编码,以达到信息压缩的目的,充分利用人耳在频域上的听觉特性,如掩蔽效应和临界频带,来实现对音频信号的压缩。在实际应用中,通常把音频信号分成若干独立的数据帧进行FFT(Fast Fourier Transform,快速傅立叶变换)或DCT(Discrete Cosine Transform,离散余弦变换),但是不能保证每一帧信号在边缘是连续的,也不能保证信号能够连续延拓成周期信号序列,信号在数据块边缘的跳变会使信号的能量谱发散而不集中,从而产生大量的高频信号;另外,对FFT或DCT的系数进行量化编码,这样不可避免地产生量化误差,这种量化所带来的误差在合成音频信号时被综合窗作用后放大许多倍,使合成音频信号严重失真,即产生边界效应。
边界效应是由音频信号的数据帧间不连续造成的,使音频信号的自然度和可懂度受到严重的影响,影响了编码器的效果,使音频质量严重下降;并且使音频信号听起来带有明显的周期性的“嘟嘟”噪声,在频谱图上表现为:出现明显的间隔性的“噪声竖线”。
现有技术中,为了消除边界效应,通常采用MDCT(Modified DiscreteCosine,修正离散余弦变换)作为时频变换工具,利用50%的样点重叠和时域混叠消除滤波器组,在不降低变换编码性能的情况下,克服FFT、DCT处理运算中的边界效应。相对于DCT而言,MDCT采取了50%的数据重叠技术,即:当前数据块的前一半数据与其前相邻数据块的后一半数据重叠,而后一半数据与其后相邻数据块的前一半数据重叠。
MDCT变换的正变换定义如下:
X i ( k ) = Σ n = 0 N - 1 w a ( n ) x i ( n ) cos [ ( 2 k + 1 ) π N ( n + n 0 ) ] , k = 0,1 , · · · N 2 - 1 - - - ( 1 )
其中, n 0 = N / 2 + 1 2 是MDCT的相位变量。从MDCT定义可知,进行变换的数据块长度N必须为偶数,MDCT是用N个音频时域样本变换得到N/2个频域样本。
MDCT变换的逆变换定义如下:
y i ( n ) = w s ( n ) 4 N Σ n = 0 N / 2 - 1 X i ( k ) cos [ ( 2 k + 1 ) π N ( n + n 0 ) ] , n = 0,1 , · · · N 2 - 1 - - - ( 2 )
MDCT逆变换是用N/2个频域信号样本计算N个时域音频样本。
当信号样本被分成相对独立的数据帧后进行时频变换处理,在数据块的边缘会发生畸变,解决这一有效的方法是在相邻数据帧间采取数据重叠技术。通过上述可知,MDCT采用50%的数据重叠,并且利用分析、综合窗wa(n)、ws(n)进一步减弱了数据帧间的不连续性。因此,MDCT一定程度上消减了边界效应,改善了编码音频的可懂度,提高了编码质量。
然而,MDCT系数不可避免地产生量化误差,这种误差会影响帧间的连续性,因此MDCT不能完全消除边界效应带来的影响,当信号变化比较剧烈,特别是处理能量较强的音频信号后的边界效应尤为明显;并且在处理多声道编码技术上,在解码端对能量进行重新分配会使各个声道不连续,出现更为严重的边界效应。
发明内容
本发明实施例提供一种修正音频信号的方法及装置,能够有效消除边界效应。
一种修正音频信号的方法,包括:
在音频信号数据帧边界附近截取一段信号;
对截取的所述信号进行线性处理,得到新的信号;
计算所述新的信号的测评指标,当所述测评指标小于预置的测评指标时,继续进行线性处理,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
一种修正音频信号的装置,包括:
截取信号单元,用于在音频信号数据帧边界附近截取一段信号;
线性处理单元,用于对接收的信号进行线性处理,得到新的信号;
计算单元,用于计算所述新的信号的测评指标;
比较单元,用于从计算单元接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到线性处理单元,直到接收的测评指标大于或等于所述预置的测评指标。
通过上述技术方案可知,由于音频信号的不连续发生在相邻数据帧边界附近,因此在音频信号数据帧边界附近截取一段信号,对截取的所述信号进行线性处理,用线性处理后的信号替换原来发生跳变或不连续的信号,并计算经过线性处理后的新的信号的测评指标,当经过线性处理后的新的信号的测评指标小于预置的测评指标时,继续进行线性处理,进一步降低相邻数据帧边界附近信号的不连续性,直到线性处理后的信号的测评指标大于或等于预置的测评指标,使得相邻数据帧边界附近的信号具有连续性,实现了消除边界效应的目的。
附图说明
图1为本发明实施例提供的方法流程图;
图2为本发明实施例提供的装置示意图;
图3为本发明实施例一提供的装置示意图;
图4为本发明实施例二提供的装置示意图;
图5为本发明实施例三提供的装置示意图;
图6为本发明实施例四提供的装置示意图;
图7为本发明实施例五提供的装置示意图;
图8为本发明实施例六提供的装置示意图;
图9为本发明实施例七提供的装置示意图;
图10为本发明实施例八提供的装置示意图。
具体实施方式
本发明实施例提供了一种修正音频信号的方法及装置,用于修正音频信号相邻数据帧间的不连续性,使得修正后音频信号的波形平滑,进而实现消除边界效应的目的,为了使本发明实施例的技术方案更清楚,详细,下面列举实施例进行说明。
首先,对本发明实施例提供的方法进行总体描述。
参见图1,为本发明实施例提供的方法流程图:
11):在音频信号数据帧边界附近截取一段信号,例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;
12):对截取的所述信号进行线性处理,得到新的音频信号;
13):计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,判断所述测评指标小于预置的测评指标时,返回步骤12),继续进行线性处理,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标,否则,结束线性处理。
其中,所述预置的测评指标为消除边界效应所对应的音频信号的信噪比、频谱失真度、平均意见分。
下面针对本发明实施例提供的方法分别列举实施例进行详细说明:
实施例一:
101:在音频信号数据帧边界附近截取一段信号;例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;;
102:对截取的信号进行LP(Linear Prediction,线性预测)分析,得到预测系数,然后利用公式 s ′ ( n ) = Σ i = 0 p a i s ( n - i ) 进行线性预测,所得的预测值代替数据帧边界附近的跳变值,得到新的音频信号;
其中,s’(n)代表预测值,p代表预测阶数,ai代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算法求解线性预测系数。
103:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,当所述测评指标小于预置的测评指标时,返回102步骤,继续进行线性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例中,对数据帧边界附近的音频信号通过LP计算得到相关性较大的数据来代替原来相关性较小的不连续或跳变的数据,使音频信号具有连续性。
实施例二:
201:在音频信号数据帧边界附近截取一段信号;例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;
202:对截取的信号进行LP(Linear Prediction,线性预测)分析,得到预测系数,然后利用公式 s ′ ( n ) = Σ i = 0 p a i s ( n - i ) 进行线性预测,所得的预测值代替数据帧边界附近的跳变值,得到新的音频信号;
其中,s’(n)代表预测值,p代表预测阶数,ai代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算法求解线性预测系数。
203:对新的音频信号的数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;以平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,进行线性内插,用内插的数据取代原来相应位置的数据,进一步获得新的音频信号;
204:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,当所述测评指标小于预置的测评指标时,返回202步骤,继续进行线性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
实施例二与实施例一相比,在对音频信号进行线性预测,消除畸变的基础上,采用线性内插的方法,用线性内插的值取代原来相应位置的点,使得音频信号具有连续性,进一步保证了音频信号的不连续性。
实施三:
301:在音频信号数据帧边界附近截取一段信号;例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;
302:对截取的信号进行LP(Linear Prediction,线性预测)分析,得到预测系数,然后利用公式 s ′ ( n ) = Σ i = 0 p a i s ( n - i ) 进行线性预测,所得的预测值代替数据帧边界附近的跳变值,得到新的音频信号;
其中,s’(n)代表预测值,p代表预测阶数,ai代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算法求解线性预测系数。
303:对所述新的音频信号进行快速傅立叶变换,将时域变成频域;截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的音频信号,用所述新的信号代替快速傅立叶变换之前的信号;
304:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,当所述测评指标小于预置的测评指标时,返回302步骤,继续进行线性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例二相比,将实施例二中线性内插的方法替换为频域平滑的方法修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
实施例四:
401:在音频信号数据帧边界附近截取一段信号;例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;
402:对截取的信号进行LP(Linear Prediction,线性预测)分析,得到预测系数,然后利用公式 s ′ ( n ) = Σ i = 0 p a i s ( n - i ) 进行线性预测,所得的预测值代替数据帧边界附近的跳变值,得到新的音频信号;
其中,s’(n)代表预测值,p代表预测阶数,ai代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算法求解线性预测系数。
403:对新的音频信号的数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;以平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点进行线性内插,用内插的数据取代原来相应位置的数据,进一步获得新的音频信号;
404:对经过线性内插后获得的音频信号进行快速傅立叶变换,将时域变成频域;截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的音频信号,用所述新的信号代替快速傅立叶变换之前的信号;
405:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,当所述测评指标小于预置的测评指标时,返回402步骤,继续进行线性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例将实施例二和实施例三项结合,在对音频信号进行线性内插的基础上,进一步采用频域平滑的方法修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
实施五:
501:在音频信号数据帧边界附近截取一段信号;例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;
502:在截取的信号中从前向后截取一段信号设置为奇数标志,从后向前截取一段信号设置为偶数标志,对奇数标志的信号和偶数标志的信号进行线性预测获取奇数标志的信号的预测值和偶数标志的信号的预测值,并且对偶数标志的信号的预测值再进行前后倒置,对奇数标志的信号的预测值,和经过前后倒置的偶数标志的信号的预测值取平均值,用所述平均值代替数据帧边界附近的跳变值;
503:对截取的信号进行LP(Linear Prediction,线性预测)分析,得到预测系数,然后利用公式 s ′ ( n ) = Σ i = 0 p a i s ( n - i ) 进行线性预测,所得的预测值代替数据帧边界附近的跳变值,得到新的音频信号;
其中,s’(n)代表预测值,p代表预测阶数,ai代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算法求解线性预测系数。
504:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,当所述测评指标小于预置的测评指标时,返回502步骤,继续进行线性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例一相比,在利用对数据帧边界附近的音频信号进行线性预测中增加了奇偶标志的方法,保证线性预测的准确性,进而更好的修正音频信号,使音频信号具有连续性。
其中,该实施例中的步骤502可分别位于实施例二中的202之前构成一个实施例;位于实施例三中的302之前构成一个实施例;位于实施例四中的402之前构成一个实施例,处理过程同实施例五。
实施例六:
601:在音频信号数据帧边界附近截取一段信号;例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;
602:对音频信号的数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;以平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据,获得新的音频信号;
603:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,当所述测评指标小于预置的测评指标时,返回602步骤,继续进行线性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例一相比,将实施例一中的线性预测的方法,替换为线性内插的方法,用线性内插的值取代原来相应位置的点,使得音频信号具有连续性,并且在频域上修正了由于数据不连续造成的锯齿波。
实施例七:
701:在音频信号数据帧边界附近截取一段信号;例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;
702:对音频信号的数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;以平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据,获得经过线性内插的音频信号;
703:对经过线性内插的音频信号进行快速傅立叶变换,将时域变成频域;截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的音频信号,用所述新的信号代替快速傅立叶变换之前的信号;
704:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,当所述测评指标小于预置的测评指标时,返回702步骤,继续进行线性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例六相比,在对音频信号进行线性内插的基础上,进一步采用频域平滑的方法修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
实施例八:
801:在音频信号数据帧边界附近截取一段信号;例如,X点为信号1的边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128点,向后截取128点,截取的256点组成一帧信号;
802:对接收的音频信号进行快速傅立叶变换,将时域变成频域;截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的音频信号,用所述新的信号代替快速傅立叶变换之前的信号;
803:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意见分,当所述测评指标小于预置的测评指标时,返回802步骤,继续进行线性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例一相比,将通过线性预测消除畸变的方法替换为频域平滑的方法修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
其中,上述各实施例中的步骤之间并无严格的时序关序,各标号只是代表实现本发明实施例的过程。
下面参照附图,对本发明实施例提供的装置进行详细说明:
参见图2,为本法实施例的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性处理单元202,用于对接收的信号进行线性处理,得到新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到线性处理单元202,直到接收的测评指标大于或等于所述预置的测评指标。
上述是对本发明实施例提供的装置示意图的总体描述,下面分别列举实施例进行详细描述:
参见图3,为本发明实施例一提供的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到线性预测单元301,直到接收的测评指标大于或等于所述预置的测评指标。
其中,线性预测单元301,替换单元302,置于线性处理单元202中。
参见图4,为本发明实施例二提供的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到新的信号。
绘制单元401,用于对数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;
线性内插单元402,用于以所述平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据,获得新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到线性线性预测单元301,直到接收的测评指标大于或等于所述预置的测评指标。
其中,线性预测单元301、替换单元302、绘制单元401、线性内插单元402置于线性处理单元202中。
实施例二提供的示意图与实施例一提供的示意图相比,增加了绘制单元401和线性内插单元402,用于对音频信号进行线性预测消除畸变的基础上,进一步修正音频信号的不连续性。
参见图5,为本发明实施例三提供的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到新的信号;
傅立叶变换单元501,用于对所述新的信号进行快速傅立叶变换,将时域变成频域;
频域平滑单元502,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元503,用于对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号,用傅立叶变换后的新的信号代替快速傅立叶变换之前的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到线性预测单元301,直到接收的测评指标大于或等于所述预置的测评指标。
其中,线性预测单元301、替换单元302、傅立叶变换单元501、频域平滑单元502、傅立叶逆变换单元503置于线性处理单元202中。
该实施例提供的装置示意图与实施例二提供的装置示意图相比,将实施例二中的绘制单元401和线性内插单元402替换为傅立叶变换单元501、频域平滑单元502、傅立叶逆变换单元503,用于修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
参见图6,为本发明实施例四提供的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到新的信号;
绘制单元401,用于对数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;
线性内插单元402,用于以所述平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据,获得新的信号;
傅立叶变换单元501,用于对所述新的信号进行快速傅立叶变换,将时域变成频域;
频域平滑单元502,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元503,用于对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号,用傅立叶变换后的新的信号代替快速傅立叶变换之前的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到线性预测单元301,直到接收的测评指标大于或等于所述预置的测评指标。
其中,线性预测单元301、替换单元302、绘制单元401、线性内插单元402、傅立叶变换单元501、频域平滑单元502、傅立叶逆变换单元503置于线性处理单元202中。
该实施例提供的装置示意图相比实施例一提供的装置示意图,增加了绘制单元401、线性内插单元402、傅立叶变换单元501、频域平滑单元502和傅立叶逆变换单元503,用于在对音频信号进行线性内插的基础上,进一步采用频域平滑的方法修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
参见图7,为本发明实施例五提供的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
奇偶标志单元701,用于从截取信号单元201接收信号,对所述信号从前向后截取一段信号设置为奇数标志,并发送到所述线性预测单元301,获取奇数标志的信号的预测值;从后向前截取一段信号设置为偶数标志;
前后倒置单元702,用于从所述线性预测单元301接收到偶数标志的信号的预测值时,进行前向倒置;
平均值单元703,用于接收所述奇数标志的信号的预测值,及经过前后倒置的偶数标志的信号的预测值,并对所述奇数标志的信号的预测值和经过前后倒置的偶数标志的信号的预测值取平均值,获得截取信号单元截取信号的预测值。
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到线性预测单元301,直到接收的测评指标大于或等于所述预置的测评指标。
其中,线性预测单元301、替换单元302、绘制单元401、线性内插单元402、奇偶标志单元701、前后倒置单元702、平均值单元703置于线性处理单元202中。
其中,该实施例中提供的装置示意图中的奇偶标志单元701、前后倒置单元702、平均值单元703可分别与实施例二提供的装置、施例三提供的装置、实施例四提供的装置,进一步构成新的装置。
该实施例提供的装置示意图与实施例一提供的装置示意图相比,增加了奇偶标志单元701、前后倒置单元702、平均值单元703,用于保证线性预测的准确性,进而更好的修正音频信号,使音频信号具有连续性。
参见图8,为本发明实施例六提供的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
绘制单元401,用于对数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;
线性内插单元402,用于以所述平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据,获得新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到绘制单元401,直到接收的测评指标大于或等于所述预置的测评指标。
其中,绘制单元401、线性内插单元402置于线性处理单元202中。
该实施例提供的示意图与实施例一提供的示意图相比,将线性预测单元301,替换单元302,替换为绘制单元401和线性内插单元402,用于修正音频信号的不连续性。
参见图9,为本发明实施例七提供的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
绘制单元401,用于对数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;
线性内插单元402,用于以所述平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据,获得新的信号;
傅立叶变换单元501,用于对所述新的信号进行快速傅立叶变换,将时域变成频域;
频域平滑单元502,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元503,用于对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号,用傅立叶变换后的新的信号代替快速傅立叶变换之前的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到绘制单元401,直到接收的测评指标大于或等于所述预置的测评指标。
其中,绘制单元401、线性内插单元402、傅立叶变换单元501、频域平滑单元502和傅立叶逆变换单元503置于线性处理单元202中。
该实施例提供的装置示意图相比实施例一提供的装置示意图,将线性预测单元301,替换单元302,替换为绘制单元401、线性内插单元402、傅立叶变换单元501、频域平滑单元502和傅立叶逆变换单元503,用于在对音频信号进行线性内插的基础上,进一步采用频域平滑的方法修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
参见图10,为本发明实施例八提供的装置示意图,包括:
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
傅立叶变换单元501,用于对所述新的信号进行快速傅立叶变换,将时域变成频域;
频域平滑单元502,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元503,用于对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号,用傅立叶变换后的新的信号代替快速傅立叶变换之前的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到傅立叶变换单元501,直到接收的测评指标大于或等于所述预置的测评指标。
其中,傅立叶变换单元501、频域平滑单元502和傅立叶逆变换单元503置于线性处理单元202中。
该实施例提供的装置示意图相比实施例一提供的装置示意图,将线性预测单元301,替换单元302,替换为傅立叶变换单元501、频域平滑单元502和傅立叶逆变换单元503,用于修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
以上实施例可以看出,由于音频信号的不连续发生在相邻数据帧的边界附近,因此在音频信号数据帧边界附近截取一段信号,对截取的所述信号进行线性处理,用线性处理后的信号替换原来的信号,并计算经过线性处理后的新的信号的测评指标,当经过线性处理后的新的信号的测评指标小于预置的测评指标时,继续进行线性处理,进一步修正边界附近的音频信号,直到线性处理后的信号的测评指标大于或等于预置的测评指标,使得相邻数据帧边界附近的信号具有连续性,实现了消除边界效应的目的。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种修正音频信号的方法及装置进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种修正音频信号的方法,其特征在于,包括:
在音频信号数据帧边界附近截取一段信号;
对截取的所述信号进行线性处理,得到新的信号;
计算所述新的信号的测评指标,当所述测评指标小于预置的测评指标时,继续进行线性处理,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
2.根据权利要求1所述的方法,其特征在于,所述对截取的所述信号进行线性处理,包括:
对截取的信号进行线性预测,所得的预测值代替数据帧边界附近的跳变值。
3.根据权利要求1所述的方法,其特征在于,所述对截取的所述信号进行线性处理,包括:
对数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;
以平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据。
4.根据权利要求1所述的方法,其特征在于,所述对截取的所述信号进行线性处理,包括:
对所述信号进行快速傅立叶变换,将时域变成频域;
截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;
对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号,用所述新的信号代替快速傅立叶变换之前的信号。
5.根据权利要求2所述的方法,其特征在于,所述对截取的所述信号进行线性处理,包括:
在所述信号中从前向后截取一段信号设置为奇数标志,从后向前截取一段信号设置为偶数标志;
对奇数标志的信号和偶数标志的信号进行线性预测,获取奇数标志的信号的预测值和偶数标志的信号的预测值,并对偶数标志的信号的预测值再进行前后倒置;
对所述奇数标志的信号的预测值,和经过前后倒置的偶数标志的信号的预测值取平均值,用所述平均值代替数据帧边界附近的跳变值。
6.根据权利要求1所述的方法,其特征在于,所述测评指标,包括:
音频信号的信噪比、频谱失真度、平均意见分。
7.一种修正音频信号的装置,其特征在于,包括:
截取信号单元,用于在音频信号数据帧边界附近截取一段信号;
线性处理单元,用于对接收的信号进行线性处理,得到新的信号;
计算单元,用于计算所述新的信号的测评指标;
比较单元,用于从计算单元接收测评指标,比较所述测评指标与预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号发送到线性处理单元,直到接收的测评指标大于或等于所述预置的测评指标。
8.根据权利要求7所述的装置,其特征在于,所述线性预测单元包括:
线性预测单元,用于对接收的信号进行线性预测,获取预测值;
替换单元,用于将接收的预测值代替数据帧边界附近的跳变值,得到新的信号。
9.根据权利要求8所述的装置,其特征在于,所述装置进一步包括:
奇偶标志单元,用于从截取信号单元接收信号,对所述信号从前向后截取一段信号设置为奇数标志,并发送到所述线性预测单元,获取奇数标志的信号的预测值;从后向前截取一段信号设置为偶数标志;
前后倒置单元,用于从所述线性预测单元接收到偶数标志的信号的预测值时,进行前后倒置;
平均值单元,用于接收所述奇数标志的信号的预测值,及偶数标志的信号的预测值,并对所述奇数标志的信号的预测值和经过前后倒置的偶数标志的信号的预测值取平均值,获得截取信号单元截取信号的预测值。
10.根据权利要求8所述的装置,其特征在于,所述装置进一步包括:
绘制单元,用于对数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;
线性内插单元,用于以所述平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据。
11.根据权利要求8所述的装置,其特征在于,所述装置进一步包括:
傅立叶变换单元,用于对所述信号进行快速傅立叶变换,将时域变成频域;
频域平滑单元,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元,用于对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号,用所述新的信号代替快速傅立叶变换之前的信号。
12.根据权利要求7所述的装置,其特征在于,所述线性处理单元包括:
绘制单元,用于对数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平均值作线性曲线;
线性内插单元,用于以所述平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据取代原来相应位置的数据。
13.根据权利要求12所述的装置,其特征在于,所述装置进一步包括:
傅立叶变换单元,用于对所述信号进行快速傅立叶变换,将时域变成频域;
频域平滑单元,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元,用于对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号,用所述新的信号代替快速傅立叶变换之前的信号。
14.根据权利要求7所述的装置,其特征在于,所述线性处理单元包括:
傅立叶变换单元,用于对所述信号进行快速傅立叶变换,将时域变成频域;
频域平滑单元,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元,用于对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号,用所述新的信号代替快速傅立叶变换之前的信号。
CNA2007101452788A 2007-08-21 2007-08-21 修正音频信号的方法及装置 Pending CN101373594A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007101452788A CN101373594A (zh) 2007-08-21 2007-08-21 修正音频信号的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007101452788A CN101373594A (zh) 2007-08-21 2007-08-21 修正音频信号的方法及装置

Publications (1)

Publication Number Publication Date
CN101373594A true CN101373594A (zh) 2009-02-25

Family

ID=40447729

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101452788A Pending CN101373594A (zh) 2007-08-21 2007-08-21 修正音频信号的方法及装置

Country Status (1)

Country Link
CN (1) CN101373594A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103700386A (zh) * 2013-12-16 2014-04-02 联想(北京)有限公司 一种信息处理方法及电子设备
CN105915524A (zh) * 2016-05-10 2016-08-31 乐视控股(北京)有限公司 对象管理方法和对象管理***
CN103796145B (zh) * 2014-01-26 2017-01-11 深圳市微纳集成电路与***应用研究院 听觉阈值确定方法、听觉阈值确定装置及助听器
CN106663438A (zh) * 2014-07-01 2017-05-10 弗劳恩霍夫应用研究促进协会 用于使用垂直相位校正处理音频信号的音频处理器及方法
CN110749332A (zh) * 2019-10-18 2020-02-04 广州文远知行科技有限公司 Rs曲线的曲率优化方法、装置、计算机设备及存储介质
CN112614496A (zh) * 2015-03-09 2021-04-06 弗劳恩霍夫应用研究促进协会 用于编码的音频编码器及用于解码的音频解码器

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103700386B (zh) * 2013-12-16 2017-09-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN103700386A (zh) * 2013-12-16 2014-04-02 联想(北京)有限公司 一种信息处理方法及电子设备
CN103796145B (zh) * 2014-01-26 2017-01-11 深圳市微纳集成电路与***应用研究院 听觉阈值确定方法、听觉阈值确定装置及助听器
US10770083B2 (en) 2014-07-01 2020-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using vertical phase correction
CN106663438A (zh) * 2014-07-01 2017-05-10 弗劳恩霍夫应用研究促进协会 用于使用垂直相位校正处理音频信号的音频处理器及方法
US10930292B2 (en) 2014-07-01 2021-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using horizontal phase correction
CN112614496A (zh) * 2015-03-09 2021-04-06 弗劳恩霍夫应用研究促进协会 用于编码的音频编码器及用于解码的音频解码器
CN112614497A (zh) * 2015-03-09 2021-04-06 弗劳恩霍夫应用研究促进协会 用于编码的音频编码器及用于解码的音频解码器
US11741973B2 (en) 2015-03-09 2023-08-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11881225B2 (en) 2015-03-09 2024-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN112614496B (zh) * 2015-03-09 2024-04-09 弗劳恩霍夫应用研究促进协会 用于编码的音频编码器及用于解码的音频解码器
CN105915524A (zh) * 2016-05-10 2016-08-31 乐视控股(北京)有限公司 对象管理方法和对象管理***
CN110749332A (zh) * 2019-10-18 2020-02-04 广州文远知行科技有限公司 Rs曲线的曲率优化方法、装置、计算机设备及存储介质
CN110749332B (zh) * 2019-10-18 2021-04-20 广州文远知行科技有限公司 Rs曲线的曲率优化方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
KR102367538B1 (ko) 다중 채널 신호 인코딩 방법 및 인코더
JP4112027B2 (ja) 再生成位相情報を用いた音声合成
RU2470385C2 (ru) Система и способ улучшения декодированного тонального звукового сигнала
CN105264597B (zh) 感知转换音频编码中的噪声填充
US11854561B2 (en) Low-frequency emphasis for LPC-based coding in frequency domain
JP6271531B2 (ja) デジタル音声信号における効果的なプレエコー減衰
CN101149926B (zh) 音频信号插补方法及装置
KR20150108937A (ko) 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치
CN110832581A (zh) 用于使用瞬态位置检测后处理音频信号的装置
JP2020052414A (ja) ハーモニックフィルタツールのハーモニック依存制御
CN103026408A (zh) 音频信号产生装置
KR20170039164A (ko) 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치
CN101373594A (zh) 修正音频信号的方法及装置
US11600283B2 (en) Concept for coding mode switching compensation
RU2622863C2 (ru) Эффективное ослабление опережающего эха в цифровом звуковом сигнале
JP6408125B2 (ja) オーディオ信号内の雑音を推定するための方法、雑音推定器、オーディオ符号化器、オーディオ復号器、およびオーディオ信号を送信するためのシステム
KR101655913B1 (ko) 디지털 오디오 신호에서의 프리-에코 감쇠
CN101694773B (zh) 一种基于tda域的自适应窗切换方法
CN110709926A (zh) 用于使用基于预测的整形后处理音频信号的装置和方法
US10332527B2 (en) Method and apparatus for encoding and decoding audio signal
JP7504216B2 (ja) 低域ポストフィルタの低コストな適応化
VIJAYASRI et al. IMPLEMENTATION OF A NOVEL TRANSFORMATION TECHNIQUE TO IMPROVE SPEECH COMPRESSION RATIO

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090225