CN109785866A

CN109785866A - 基于相关函数最大值的广播语音与噪声检测的方法

Info

Publication number: CN109785866A
Application number: CN201910171860.4A
Authority: CN
Inventors: 袁三男; 刘虹
Original assignee: Shanghai University of Electric Power
Current assignee: Shanghai University of Electric Power; University of Shanghai for Science and Technology
Priority date: 2019-03-07
Filing date: 2019-03-07
Publication date: 2019-05-21

Abstract

本发明涉及一种基于相关函数最大值的广播语音与噪声检测的方法，通过对语音信号进行分帧；根据自(互)相关函数公式进行每帧语音信号相关函数计算；求取分帧每帧语音信号的自(互)相关函数或互相关函数的最大值；计算一秒内自(互)相关函数的最大值方差，设置一个阈值常数Th，当最大值方差大于Th时，便判断为语音，最大值方差小于Th时，便判定为噪声。此方法将语音中噪声识别区分出，便于提升广播或其他声音处理中的声音的清晰度。

Description

基于相关函数最大值的广播语音与噪声检测的方法

技术领域

本发明涉及一种语音识别技术，特别涉及一种基于相关函数最大值的广播语音与噪声检测的方法。

背景技术

调频广播中经常听到“呲呲”的声音，是一种叫做似高斯噪声中高幅值部分的失真引起的。这种典型的现象就是听众没有将收音机准确的调到某个台。现实生活中，一些人的声音和这些噪声极为相似，因此，使用傅里叶变换就很难将这些噪声和语音区分开来。

发明内容

本发明是针对调频广播中嘈杂声难识别区分的问题，提出了一种基于相关函数最大值的广播语音与噪声检测的方法，正确将噪声识别区分出。

本发明的技术方案为：一种基于相关函数最大值的广播语音与噪声检测的方法，具体包括如下步骤：

1)对输入的语音信号进行分帧：设定帧长大小，帧长范围为10～30ms，根据设定对输入的语音信号进行分帧；

2)根据自相关函数公式进行每帧语音信号自相关函数计算，根据互相关函数公式进行每帧语音信号与上一帧语音信号互相关函数计算；

3)求取分帧每帧语音信号的自相关函数或互相关函数的最大值；

4)计算一秒内自相关函数或互相关函数的最大值方差，任取自相关函数的最大值的方差或互相关函数的最大值方差，设置一个阈值常数Th，当最大值方差大于Th时，便判断为语音，最大值方差小于Th时，便判定为噪声；

5)进行下一秒内自相关函数或互相关函数的最大值方差，同步骤4)进行同样判断方法判定噪声，直到步骤1)分帧后的输入语音信号全部判定完毕。

所述步骤2)中自相关函数公式为：

所述互相关函数公式为：

其中x_i(m)为第i帧的语音信号中的第m个数据；x_i-1(m)为第i-1帧的语音信号中的第m个数据；k为延迟量，k＝0,1,2，…，L-1；L为语音分帧后每帧的长度。

本发明的有益效果在于：本发明基于相关函数最大值的广播语音与噪声检测的方法，将语音中噪声识别区分出，便于提升广播或其他声音处理中的声音的清晰度。解决高斯噪声中高幅值部分的失真引起的噪声难以区别的问题。

附图说明

图1为本发明基于相关函数最大值的广播语音与噪声检测流程图。

具体实施方式

如图1所示基于相关函数的最大值的广播语音和噪声检测流程图，具体包括如下步骤：

1、对输入的语音信号进行分帧：由于语音信号是一个非稳态、时变的信号，但是可以在“短时间”范围内认为语音信号是稳态的，时不变的。这个短时间一般指10～30ms，本发明采用的帧长为20ms；

2、求每帧语音信号的短时自相关函数：下标i表示为第i帧，每帧数据的短时自(互)相关函数，自相关函数定义为公式(1)，互相关函数的公式为公式(2)；

其中x_i(m)为第i帧的语音信号中的第m个数据；x_i-1(m)为第i-1帧的语音信号中的第m个数据；k为延迟量(k＝0,1,2，…，L-1)；L为语音分帧后每帧的长度。

3、求取分帧每帧语音信号的自(互)相关函数的最大值。由于语音信号和噪声信号的自(互)相关函数的最大值大小相差比较多，可以利用这一特点来判断是有话帧还是噪声帧。由于1秒内噪声的自(互)相关函数的最大值波动程度比语音信号小，由此可判定每秒的音频是噪声还是语音，每帧长20ms，因此1s内有50帧；

4、计算一秒内50帧自(互)相关函数的最大值方差，方差可以反映信号的波动程度，因此根据噪声的情况，任取自相关函数的最大值的方差或互相关函数的最大值的方差，设置一个阈值常数Th。当方差大于Th时，便判断为语音，小于Th时，便判定为噪声。

5、进行下一秒内自(互)相关函数的最大值方差，同步骤4进行同样判断方法判定噪声，直到步骤1分帧后的输入的语音信号全部判定完毕，输出无噪声语音。

Claims

1.一种基于相关函数最大值的广播语音与噪声检测的方法，其特征在于，具体包括如下步骤：

4)计算一秒内自相关函数或互相关函数的最大值方差，任取自相关函数的最大值的方差或互相关函数的最大值方差，设置一个阈值常数Th，当最大值方差大于Th时，便判定为语音，最大值方差小于Th时，便判定为噪声；

2.根据权利要求1所述基于相关函数最大值的广播语音与噪声检测的方法，其特征在于，所述步骤2)中自相关函数公式为：

所述互相关函数公式为：