CN109427345B - 一种风噪检测方法、装置及*** - Google Patents

一种风噪检测方法、装置及*** Download PDF

Info

Publication number
CN109427345B
CN109427345B CN201710754716.4A CN201710754716A CN109427345B CN 109427345 B CN109427345 B CN 109427345B CN 201710754716 A CN201710754716 A CN 201710754716A CN 109427345 B CN109427345 B CN 109427345B
Authority
CN
China
Prior art keywords
frequency
wind noise
frequency domain
domain data
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710754716.4A
Other languages
English (en)
Other versions
CN109427345A (zh
Inventor
杨茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201710754716.4A priority Critical patent/CN109427345B/zh
Publication of CN109427345A publication Critical patent/CN109427345A/zh
Application granted granted Critical
Publication of CN109427345B publication Critical patent/CN109427345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明实施例提供了一种风噪检测方法、装置及***,方法包括:将每一帧音频数据转换为频域数据,根据频域数据的频谱质心,确定音频数据中是否存在风噪;可见,第一方面,利用一路音频数据即可进行风噪检测,不需要同时采集两路音频数据进行对比,操作方便;第二方面,相比于设置两台采集设备以采集两路音频数据的方案,本方案仅需要一台采集设备采集一路音频数据即可,降低了设备成本。

Description

一种风噪检测方法、装置及***
技术领域
本发明涉及音频处理技术领域,特别是涉及一种风噪检测方法、装置及***。
背景技术
在音频采集过程中,风噪通常是影响音频质量的一个重要因素。为了提大音频质量,通常需要对采集到的音频数据进行风噪检测。
进行风噪检测通常需要同时采集两路音频数据,将这两路音频数据进行比较,比如,将两路音频数据的波峰关系、信噪比等属性值进行比较,根据比较结果,确定音频数据中是否存在风噪。
上述方案中,需要同时采集两路音频数据,而在一些不具备此条件的场景中,比如,在单麦克风场景中,如果要同时采集两路音频数据,则需要增设其他采集设备,操作不方便。
发明内容
本发明实施例的目的在于提供一种风噪检测方法、装置及***,以实现通过一路音频数据进行风噪检测。
为达到上述目的,本发明实施例提供了一种风噪检测方法,包括:
针对每一帧音频数据,将该帧音频数据转换为频域数据;
计算所述频域数据中频率点的功率谱密度;
通过所述功率谱密度,计算所述频域数据的频谱质心;
判断所述频谱质心是否小于第一预设阈值;
如果是,确定该帧音频数据中存在风噪。
可选的,在所述确定该帧音频数据中存在风噪之后,还可以包括:
判断所述频谱质心是否小于第二预设阈值,所述第二预设阈值小于所述第一预设阈值;
如果是,将该帧音频数据置零。
可选的,在所述确定该帧音频数据中存在风噪之后,还可以包括:
判断所述频谱质心是否大于等于第三预设阈值,所述第三预设阈值小于所述第一预设阈值;
如果是,利用预设滤波器对所述频域数据进行滤波,得到滤波后的频域数据;
将所述滤波后的频域数据转换为时域数据。
可选的,在判断所述频谱质心不小于第一预设阈值的情况下,所述方法还可以包括:
输出该帧音频数据。
可选的,所述计算所述频域数据中频率点的功率谱密度,可以包括:
对所述频域数据进行采样,得到多个频率点,计算所述多个频率点的功率谱谱密度;
所述通过所述功率谱密度,计算所述频域数据的频谱质心,可以包括:
根据采样率以及所述功率谱密度,计算所述频域数据的频谱质心。
可选的,所述通过所述功率谱密度,计算所述频域数据的频谱质心,包括:
利用如下算式,计算所述频域数据的频谱质心:
Figure BDA0001391900940000021
其中,SC表示频谱质心,fs表示采样率,L表示频率点的总数量,
Figure BDA0001391900940000022
表示第k个频率点的功率谱密度,
Figure BDA0001391900940000023
X(k)表示第k个频率点的频率值,k为不大于L的正整数。
可选的,在判断所述频谱质心小于第三预设阈值的情况下,所述方法还可以包括:
记录所述频谱质心对应的功率谱密度,作为风噪功率谱密度;
所述利用预设滤波器对所述频域数据进行滤波,得到滤波后的频域数据,包括:
利用如下算式,确定滤波后的频域数据:
Y(k)=H(k)*X(k),
Figure BDA0001391900940000031
其中,Y(k)表示所述滤波后的频域数据,H(k)表示所述预设滤波器,X(k)表示第k个频率点的频率值,
Figure BDA0001391900940000032
表示第k个频率点的功率谱密度,
Figure BDA0001391900940000033
Figure BDA0001391900940000034
表示最新记录的风噪功率谱密度。
为达到上述目的,本发明实施例还提供了一种风噪检测装置,包括:
第一转换模块,用于针对每一帧音频数据,将该帧音频数据转换为频域数据;
第一计算模块,用于计算所述频域数据中频率点的功率谱密度;
第二计算模块,用于通过所述功率谱密度,计算所述频域数据的频谱质心;
第一判断模块,用于判断所述频谱质心是否小于第一预设阈值;
确定模块,用于在所述第一判断模块判断结果为是时,确定该帧音频数据中存在风噪。
可选的,所述装置还可以包括:
第二判断模块,用于在所述第一判断模块判断结果为是时,判断所述频谱质心是否小于第二预设阈值,所述第二预设阈值小于所述第一预设阈值;
置零模块,用于在所述第二判断模块判断结果为是时,将该帧音频数据置零。
可选的,所述装置还可以包括:
第三判断模块,用于在所述第一判断模块判断结果为是时,判断所述频谱质心是否大于等于第三预设阈值,所述第三预设阈值小于所述第一预设阈值;
滤波模块,用于在所述第三判断模块判断结果为是时,利用预设滤波器对所述频域数据进行滤波,得到滤波后的频域数据;
第二转换模块,用于将所述滤波后的频域数据转换为时域数据。
可选的,所述装置还可以包括:
输出模块,用于在所述第一判断模块判断结果为否时,输出该帧音频数据。
可选的,所述第一计算模块,具体可以用于:
对所述频域数据进行采样,得到多个频率点,计算所述多个频率点的功率谱谱密度;
所述第二计算模块,具体可以用于:
根据采样率以及所述功率谱密度,计算所述频域数据的频谱质心。
可选的,所述第二计算模块,具体可以用于:
利用如下算式,计算所述频域数据的频谱质心:
Figure BDA0001391900940000041
其中,SC表示频谱质心,fs表示采样率,L表示频率点的总数量,
Figure BDA0001391900940000042
表示第k个频率点的功率谱密度,
Figure BDA0001391900940000043
X(k)表示第k个频率点的频率值,k为不大于L的正整数。
可选的,所述装置还可以包括:
记录模块,用于在所述第三判断模块判断结果为否时,记录所述频谱质心对应的功率谱密度,作为风噪功率谱密度;
所述滤波模块,具体可以用于:
利用如下算式,确定滤波后的频域数据:
Y(k)=H(k)*X(k),
Figure BDA0001391900940000044
其中,Y(k)表示所述滤波后的频域数据,H(k)表示所述预设滤波器,X(k)表示第k个频率点的频率值,
Figure BDA0001391900940000051
表示第k个频率点的功率谱密度,
Figure BDA0001391900940000052
Figure BDA0001391900940000053
表示所述记录模块最新记录的风噪功率谱密度。
为达到上述目的,本发明实施例还提供了一种电子设备,包括处理器和存储器,其中,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一种风噪检测方法。
为达到上述目的,本发明实施例还提供了一种风噪检测***,包括:音频采集设备和风噪检测设备,其中,
所述音频采集设备,用于采集音频数据,并将所采集的音频数据发送至所述风噪检测设备;
所述风噪检测设备,用于接收所述音频采集设备发送的音频数据,针对其中的每一帧音频数据,将该帧音频数据转换为频域数据;计算所述频域数据中频率点的功率谱密度;通过所述功率谱密度,计算所述频域数据的频谱质心;判断所述频谱质心是否小于第一预设阈值;如果是,确定该帧音频数据中存在风噪。
应用本发明所示实施例,将每一帧音频数据转换为频域数据,根据频域数据的频谱质心,确定音频数据中是否存在风噪;可见,本方案中,利用一路音频数据即可进行风噪检测,不需要同时采集两路音频数据进行对比,操作方便。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的风噪检测方法的第一种流程示意图;
图2为本发明实施例提供的风噪检测方法的第二种流程示意图;
图3为本发明实施例提供的一种风噪检测装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图;
图5为本发明实施例提供的一种风噪检测***的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决上述技术问题,本发明实施例提供了一种风噪检测方法、装置及设备。该方法及装置可以应用于具有音频处理功能的设备,具体不做限定。
下面首先对本发明实施例提供的一种风噪检测方法进行详细说明。
图1为本发明实施例提供的风噪检测方法的第一种流程示意图,包括:
S101:针对每一帧音频数据,将该帧音频数据转换为频域数据。
S102:计算该频域数据中频率点的功率谱密度。
S103:通过该功率谱密度,计算该频域数据的频谱质心。
S104:判断该频谱质心是否小于第一预设阈值,如果是,执行S105。
S105:确定该帧音频数据中存在风噪。
应用本发明图1所示实施例,将每一帧音频数据转换为频域数据,根据频域数据的频谱质心,确定音频数据中是否存在风噪;可见,第一方面,利用一路音频数据即可进行风噪检测,不需要同时采集两路音频数据进行对比,操作方便;第二方面,相比于设置两台采集设备以采集两路音频数据的方案,本方案仅需要一台采集设备采集一路音频数据即可,降低了设备成本。
下面针对图1所示实施例进行详细说明:
S101:针对每一帧音频数据,将该帧音频数据转换为频域数据。
执行本方案的设备(或者说执行主体,以下简称本设备)可以为音频采集设备,也可以为与音频采集设备通信连接的其他电子设备。如果本设备为音频采集设备,则音频采集设备可以针对采集到的每一帧音频数据,应用本方案进行风噪检测。如果本设备为与音频采集设备通信连接的其他电子设备,则该电子设备可以从音频采集设备中获取其采集到的音频数据,并针对每一帧音频数据,应用本方案进行风噪检测。
在本发明的一个可选实施例中,可以对采集到的音频数据进行分帧处理,比如每20ms的音频数据作为一帧。具体的帧长度可以根据实际情况进行设定。
可以利用时域频域转换算法,将一帧音频数据转换为频域数据。比如,可以利用傅里叶变换算法、快速傅里叶变换算法(FFT,Fast Fourier Transformation)等,具体不做限定。
假设一帧音频数据为x(t),通过FFT算法,将其转换为频域数据X。频域数据X中包含各频率点的频率值,比如,第k个频率点的频率值为X(k)。
S102:计算该频域数据中频率点的功率谱密度。
作为一种实施方式,可以对该频域数据进行采样,得到多个频率点,计算该多个频率点的功率谱密度。假设对频域数据X进行采样,得到L个频率点,计算这L个频率点中每个频率点的功率谱密度,其中,第k个频率点的功率谱密度为
Figure BDA0001391900940000071
Figure BDA0001391900940000072
其中,k为不大于L的正整数。
S103:通过该功率谱密度,计算该频域数据的频谱质心。
可以理解,频谱质心(SC,spectral centroids)表示一帧音频数据的频谱能量分布的平均点,能够反应该音频数据频率分布的中心。
一般来说,计算频谱质心的算式可以为:
Figure BDA0001391900940000073
其中,
Figure BDA0001391900940000074
表示该频域数据的频率范围,F(ω)表示频率值,E表示该频域数据的能量。
算式A可以计算一段连续的频域数据的频谱质心,或者,也可以利用算式B计算所述频域数据的频谱质心:
Figure BDA0001391900940000081
其中,fs表示采样率,L表示频率点的总数量,
Figure BDA0001391900940000082
表示第k个频率点的功率谱密度,
Figure BDA0001391900940000083
X(k)表示第k个频率点的频率值,k为不大于L的正整数。
对一段连续的频域数据进行采样,假设采样率为fs,将ω=fs*k/L代入上述算式A,便得到了算式B。可以理解,频域数据具有共轭对称性,因此,可以仅考虑一半频率点,也就是说k可以取[1,L/2]。
S104:判断该频谱质心是否小于第一预设阈值,如果是,执行S105。
S105:确定该帧音频数据中存在风噪。
由于风噪的频谱质心较小,而语音的频谱质心较大,因此:
第一种情况,如果S103中计算得到的频谱质心非常小,接近于纯风噪的频谱质心,则可以认为该音频数据中存在较大风噪;
第二种情况,如果S103中计算得到的频谱质心非常大,接近于纯语音的频谱质心,则可以认为该音频数据中存在的风噪可以忽略不计,或者认为不存在风噪;
第三种情况,如果S103中计算得到的频谱质心介于前两种情况之间,则可以认为该音频数据混合了语音和风噪。
在此基础上,可以设定一个阈值(第一预设阈值),如果S103中计算得到的频谱质心小于该第一预设阈值,也就是说该频谱质心较小,可以认为是上述第一种情况和第三种情况,则确定该帧音频数据中存在风噪。
作为一种实施方式,如果S103中计算得到的频谱质心大于等于该第一预设阈值,可以直接输出S101中的“该帧音频数据”。可以理解,如果S103中计算得到的频谱质心大于该第一预设阈值,则认为是上述第二种情况,这种情况下,该帧音频数据的质量较佳,可以直接输出该帧音频数据。
通过上述方案,便已完成了风噪检测。作为一种实施方式,在完成风噪检测的基础上,进一步进行风噪抑制。
作为一种实施方式,在S105之后,还可以判断所述频谱质心是否小于第二预设阈值;如果是,将该帧音频数据置零。
根据上面三种情况的描述,如果S103中计算得到的频谱质心较小,则可能是上述第一种情况或者第三种情况,进一步地,可以设定一个比第一预设阈值更小的阈值(第二预设阈值),如果S103中计算得到的频谱质心小于该第二预设阈值,则认为是上述第一种情况,该音频数据中存在较大风噪。这种情况下,可以将该帧音频数据置零。可以理解,将该帧音频数据置零输出,输出的为静音数据。
在这种实施方式中,如果某帧音频数据中风噪过大,则输出静音数据,避免用户听到无意义的风噪,体验较佳。
作为一种实施方式,在S105之后,还可以判断所述频谱质心是否大于等于第三预设阈值,所述第三预设阈值小于所述第一预设阈值;
如果是,利用预设滤波器对所述频域数据进行滤波,得到滤波后的频域数据;
将所述滤波后的频域数据转换为时域数据。
可以理解,在S103中计算得到的频谱质心小于第一预设阈值、且大于等于第三预设阈值的情况下,执行本实施方式,因此,第三预设阈值小于第一预设阈值。
该第三预设阈值可以等于该第二预设阈值,也可以大于该第二预设阈值,比如,在后续图2实施例中,第三预设阈值等于第二预设阈值,将大于等于第二预设阈值的情况都作为大于等于第三预设阈值的情况来处理。
本实施方式可以认为是针对上述第三种情况,音频数据为风噪与语音的混合数据,这种情况下,通过对音频数据进行滤波,实现风噪抑制。
在一种可选的滤波方式中,如果某帧音频数据属于上述第一种情况,也就是说,如果某帧音频数据的频谱质心小于第三预设阈值时,记录该帧音频数据的功率谱密度,作为风噪功率谱密度。这样,便可以利用所记录的风噪功率谱密度,对音频数据进行滤波。
从连续的频域数据中选取若干个频率点,用k表示选取出的频率点的序号,然后,可以利用如下算式,确定滤波后的频域数据:
Y(k)=H(k)*X(k),
Figure BDA0001391900940000101
其中,Y(k)表示所述滤波后的频域数据,H(k)表示所述预设滤波器,X(k)表示第k个频率点的频率值,
Figure BDA0001391900940000102
表示第k个频率点的功率谱密度,
Figure BDA0001391900940000103
Figure BDA0001391900940000104
表示最新记录的风噪功率谱密度,k为正整数。
在本滤波方式中,可以仅记录最新的风噪功率谱密度,也就是说,每当判断某帧音频数据对应的频谱质心小于第三预设阈值时,便记录该音频数据的功率谱密度,作为风噪功率谱密度,并删除之前记录的风噪功率谱密度;这样,利用上述算式对某帧音频数据滤波时,算式中的
Figure BDA0001391900940000105
即为记录的风噪功率谱密度。或者,也可以不删除之前记录的风噪功率谱密度;这样,利用上述算式对某帧音频数据滤波时,需要在所记录的风噪功率谱密度中确定出最新一次记录的风噪功率谱密度,作为算式中的
Figure BDA0001391900940000106
该预设滤波器的设定过程如下:
假设某帧音频数据的频域数据X=s+n,其中,s表示频域数据中的语音部分,n表示频域数据中的风噪部分。
相应的,频域数据X的功率谱密度
Figure BDA0001391900940000107
其中,
Figure BDA0001391900940000108
表示该语音部分的功率谱密度,
Figure BDA0001391900940000109
表示最新记录的风噪功率谱密度。
设定滤波器为
Figure BDA00013919009400001010
H(k)的范围为[0,1],当风噪越大时,H(k)越小,Y(k)越小,表示对音频数据的抑制效果越大,当风噪越小时,H(k)越大,Y(k)越大,表示对音频数据的抑制效果越小。
再将Y(k)进行IFFT(Inverse Fast Fourier Transform,快速傅里叶逆变换),便将滤波后的频域数据转换为时域数据,可以输出该时域数据,也就是输出风噪抑制后的时域数据。
本实施方式中,对部分存在风噪的音频数据(频谱质心大于等于第三预设阈值、小于第一预设阈值的音频数据)进行滤波,相比于将存在风噪的音频数据全部丢弃的方案,本实施方式能够保留更多有效的语音数据。
如果利用两路音频数据进行风噪检测,在一些不具备同时采集两路音频数据条件的场景中,比如,在单麦克风场景中,需要增设其他采集设备,操作不方便,而且增加设备成本。而应用本发明所示实施例,利用一路音频数据即可进行风噪检测,操作方便,而且降低了设备成本。
图2为本发明实施例提供的风噪检测方法的第二种流程示意图,包括:
S201:针对每一帧音频数据,将该帧音频数据转换为频域数据。
S202:计算该频域数据中频率点的功率谱密度。
S203:通过该功率谱密度,计算该频域数据的频谱质心。
S204:判断该频谱质心是否小于第一预设阈值,如果是,执行S205,如果否,执行S206。
S205:确定该帧音频数据中存在风噪。
S206:输出该帧音频数据。
S207:判断该频谱质心是否小于第二预设阈值,如果是,执行S208,如果否,执行S209。该第二预设阈值小于第一预设阈值。
S208:将该帧音频数据置零,并输出置零后的音频数据。
S209:利用预设滤波器对该频域数据进行滤波,得到滤波后的频域数据。
S210:将该滤波后的频域数据转换为时域数据,并输出转换后的时域数据。
本发明图2实施例提供了一种完整的风噪检测及风噪抑制的方法。在图2实施例中,并未设定第三预设阈值,而是将大于等于第二预设阈值的情况都作为大于等于第三预设阈值的情况来处理。
根据图1实施例中内容,由于风噪的频谱质心较小,而语音的频谱质心较大,故而根据频谱质心,将音频数据划分为三种情况:一、存在较大风噪、或纯风噪;二、风噪忽略不计、或不存在风噪(纯语音);三、风噪与语音的混合数据。
在图2实施例中,针对这三种情况分别采用不同的处理方案:第一种情况(频谱质心小于第二预设阈值),音频质量很差,将音频数据置零输出,也就是输出静音数据;第二种情况(频谱质心大于等于第一预设阈值),音频质量很好,直接输出音频数据;第三种情况(频谱质心大于等于第二预设阈值、小于第一预设阈值),音频质量介于第一种情况与第二种情况之间,对该音频数据的频域数据进行滤波处理后,再转换为音频数据输出。
在图2实施例中,对于未检测出风噪的音频数据帧(频谱质心大于等于第一预设阈值的音频数据帧),直接将其输出;而一些方案中,无论音频数据帧中是否存在风噪,都对整体音频数据进行风噪抑制;相比于这些方案,本实施例减少了不必要的抑制操作。在一些风噪较小、或者风噪时断时续的场景中,本实施例的这一效果更为明显。
在图2实施例中,对部分存在风噪的音频数据帧(频谱质心大于等于第二预设阈值、小于第一预设阈值的音频数据帧)进行滤波;而一些方案中,将检测出风噪的音频数据全部丢弃;相比于这些方案,本实施例能够保留更多有效的语音数据。
应用本发明图2所示实施例,在风噪检测的基础上,可以针对不同风噪情况采用不同的风噪抑制方案,输出的音频数据质量较高。
与上述方法实施例相对应,本发明实施例还提供一种风噪检测装置。
图3为本发明实施例提供的一种风噪检测装置的结构示意图,包括:
第一转换模块301,用于针对每一帧音频数据,将该帧音频数据转换为频域数据;
第一计算模块302,用于计算所述频域数据中频率点的功率谱密度;
第二计算模块303,用于通过所述功率谱密度,计算所述频域数据的频谱质心;
第一判断模块304,用于判断所述频谱质心是否小于第一预设阈值;
确定模块305,用于在第一判断模块304判断结果为是时,确定该帧音频数据中存在风噪。
作为一种实施方式,所述装置还可以包括:第二判断模块和置零模块(图中未示出),其中,
第二判断模块,用于在所述第一判断模块判断结果为是时,判断所述频谱质心是否小于第二预设阈值,所述第二预设阈值小于所述第一预设阈值;
置零模块,用于在所述第二判断模块判断结果为是时,将该帧音频数据置零。
作为一种实施方式,所述装置还可以包括:第三判断模块、滤波模块和第二转换模块(图中未示出),其中,
第三判断模块,用于在所述第一判断模块判断结果为是时,判断所述频谱质心是否大于等于第三预设阈值,所述第三预设阈值小于所述第一预设阈值;
滤波模块,用于在所述第三判断模块判断结果为是时,利用预设滤波器对所述频域数据进行滤波,得到滤波后的频域数据;
第二转换模块,用于将所述滤波后的频域数据转换为时域数据。
作为一种实施方式,所述装置还可以包括:
输出模块(图中未示出),用于在第一判断模块304判断结果为否时,输出该帧音频数据。
作为一种实施方式,第一计算模块302,具体可以用于:
对所述频域数据进行采样,得到多个频率点,计算所述多个频率点的功率谱谱密度;
第二计算模块303,具体可以用于:
根据采样率以及所述功率谱密度,计算所述频域数据的频谱质心。
作为一种实施方式,第二计算模块303,具体可以用于:
利用如下算式,计算所述频域数据的频谱质心:
Figure BDA0001391900940000141
其中,SC表示频谱质心,fs表示采样率,L表示频率点的总数量,
Figure BDA0001391900940000142
表示第k个频率点的功率谱密度,
Figure BDA0001391900940000143
X(k)表示第k个频率点的频率值,k为不大于L的正整数。
作为一种实施方式,所述装置还可以包括:
记录模块(图中未示出),用于在所述第三判断模块判断结果为否时,记录所述频谱质心对应的功率谱密度,作为风噪功率谱密度;
所述滤波模块,从这段连续的频域数据中选取若干个频率点,用k表示选取出的频率点的序号,并且可以用于:
利用如下算式,确定滤波后的频域数据:
Y(k)=H(k)*X(k),
Figure BDA0001391900940000144
其中,Y(k)表示所述滤波后的频域数据,H(k)表示所述预设滤波器,X(k)表示第k个频率点的频率值,
Figure BDA0001391900940000145
表示第k个频率点的功率谱密度,
Figure BDA0001391900940000146
Figure BDA0001391900940000147
表示所述记录模块最新记录的风噪功率谱密度,k为正整数。
应用本发明图3所示实施例,将每一帧音频数据转换为频域数据,根据频域数据的频谱质心,确定音频数据中是否存在风噪;可见,第一方面,利用一路音频数据即可进行风噪检测,不需要同时采集两路音频数据进行对比,操作方便;第二方面,相比于设置两台采集设备以采集两路音频数据的方案,本方案仅需要一台采集设备采集一路音频数据即可,降低了设备成本。
与上述方法实施例相对应,本发明实施例还提供一种电子设备,如图4所示,包括处理器401和存储器402,其中,
存储器402,用于存放计算机程序;
处理器401,用于执行存储器402上所存放的程序时,实现上述任一种风噪检测方法。
上述电子设备提到的存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种风噪检测方法。
本发明实施例还提供一种风噪检测***,如图5所示,包括:音频采集设备和风噪检测设备,其中,
所述音频采集设备,用于采集音频数据,并将所采集的音频数据发送至所述风噪检测设备;
所述风噪检测设备,用于接收所述音频采集设备发送的音频数据,针对每一帧音频数据,将该帧音频数据转换为频域数据;计算所述频域数据中频率点的功率谱密度;通过所述功率谱密度,计算所述频域数据的频谱质心;判断所述频谱质心是否小于第一预设阈值;如果是,确定该帧音频数据中存在风噪。
作为一种实施方式,所述音频采集设备的数量可以为一台,也就是说,所述***可以仅包含一台音频采集设备。
这种实施方式中,该一台音频采集设备,用于采集一路音频数据,并将所采集的音频数据发送至所述风噪检测设备;
所述风噪检测设备,用于接收所述一路音频数据,针对其中的每一帧音频数据,将该帧音频数据转换为频域数据;计算所述频域数据中频率点的功率谱密度;通过所述功率谱密度,计算所述频域数据的频谱质心;判断所述频谱质心是否小于第一预设阈值;如果是,确定该帧音频数据中存在风噪。
作为一种实施方式,该音频采集设备与该风噪检测设备可以一体设置,二者可以为同一设备。
应用本发明所示实施例,风噪检测设备将接收到的每一帧音频数据转换为频域数据,根据频域数据的频谱质心,确定音频数据中是否存在风噪;可见,第一方面,利用一路音频数据即可进行风噪检测,不需要同时采集两路音频数据进行对比,操作方便;第二方面,相比于设置两台采集设备以采集两路音频数据的方案,本***中仅需要一台采集设备采集一路音频数据即可,降低了设备成本。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于图3所示的风噪检测装置实施例、图4所示的电子设备实施例、图5所示的风噪检测***实施例而言,由于其基本相似于图1-2所示的风噪检测方法实施例,所以描述的比较简单,相关之处参见图1-2所示的风噪检测方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (16)

1.一种风噪检测方法,其特征在于,包括:
针对每一帧音频数据,将该帧音频数据转换为频域数据;
计算所述频域数据中频率点的功率谱密度;
通过所述功率谱密度,计算所述频域数据的频谱质心;
判断所述频谱质心是否小于第一预设阈值;
如果是,确定该帧音频数据中存在风噪;
在所述确定该帧音频数据中存在风噪之后,还包括:
判断所述频谱质心是否大于等于第三预设阈值,所述第三预设阈值小于所述第一预设阈值;
在判断所述频谱质心小于所述第三预设阈值的情况下,记录所述频谱质心对应的功率谱密度,作为风噪功率谱密度;所述风噪功率谱密度用于对该帧音频数据进行滤波。
2.根据权利要求1所述的方法,其特征在于,在所述确定该帧音频数据中存在风噪之后,还包括:
判断所述频谱质心是否小于第二预设阈值,所述第二预设阈值小于所述第一预设阈值;
如果是,将该帧音频数据置零;
其中,所述第三预设阈值大于等于所述第二预设阈值。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述频谱质心大于等于所述第三预设阈值的情况下,利用预设滤波器对所述频域数据进行滤波,得到滤波后的频域数据;
将所述滤波后的频域数据转换为时域数据。
4.根据权利要求1所述的方法,其特征在于,在判断所述频谱质心不小于第一预设阈值的情况下,所述方法还包括:
输出该帧音频数据。
5.根据权利要求1所述的方法,其特征在于,所述计算所述频域数据中频率点的功率谱密度,包括:
对所述频域数据进行采样,得到多个频率点,计算所述多个频率点的功率谱密度;
所述通过所述功率谱密度,计算所述频域数据的频谱质心,包括:
根据采样率以及所述功率谱密度,计算所述频域数据的频谱质心。
6.根据权利要求1所述的方法,其特征在于,所述通过所述功率谱密度,计算所述频域数据的频谱质心,包括:
利用如下算式,计算所述频域数据的频谱质心:
Figure FDA0003704939060000021
其中,SC表示频谱质心,fs表示采样率,L表示频率点的总数量,
Figure FDA0003704939060000022
表示第k个频率点的功率谱密度,
Figure FDA0003704939060000023
X(k)表示第k个频率点的频率值,k为不大于L的正整数。
7.根据权利要求3所述的方法,其特征在于,所述利用预设滤波器对所述频域数据进行滤波,得到滤波后的频域数据,包括:
利用如下算式,确定滤波后的频域数据:
Y(k)=H(k)*X(k),
Figure FDA0003704939060000024
其中,Y(k)表示所述滤波后的频域数据,H(k)表示所述预设滤波器,X(k)表示第k个频率点的频率值,
Figure FDA0003704939060000025
表示第k个频率点的功率谱密度,
Figure FDA0003704939060000026
Figure FDA0003704939060000027
表示最新记录的风噪功率谱密度,k为正整数。
8.一种风噪检测装置,其特征在于,包括:
第一转换模块,用于针对每一帧音频数据,将该帧音频数据转换为频域数据;
第一计算模块,用于计算所述频域数据中频率点的功率谱密度;
第二计算模块,用于通过所述功率谱密度,计算所述频域数据的频谱质心;
第一判断模块,用于判断所述频谱质心是否小于第一预设阈值;
确定模块,用于在所述第一判断模块判断结果为是时,确定该帧音频数据中存在风噪;
所述装置还包括:
第三判断模块,用于在所述第一判断模块判断结果为是时,判断所述频谱质心是否大于等于第三预设阈值,所述第三预设阈值小于所述第一预设阈值;
记录模块,用于在所述第三判断模块判断结果为否时,记录所述频谱质心对应的功率谱密度,作为风噪功率谱密度;所述风噪功率谱密度用于对该帧音频数据进行滤波。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二判断模块,用于在所述第一判断模块判断结果为是时,判断所述频谱质心是否小于第二预设阈值,所述第二预设阈值小于所述第一预设阈值;
置零模块,用于在所述第二判断模块判断结果为是时,将该帧音频数据置零;
其中,所述第三预设阈值大于等于所述第二预设阈值。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
滤波模块,用于在所述第三判断模块判断结果为是时,利用预设滤波器对所述频域数据进行滤波,得到滤波后的频域数据;
第二转换模块,用于将所述滤波后的频域数据转换为时域数据。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
输出模块,用于在所述第一判断模块判断结果为否时,输出该帧音频数据。
12.根据权利要求8所述的装置,其特征在于,所述第一计算模块,具体用于:
对所述频域数据进行采样,得到多个频率点,计算所述多个频率点的功率谱谱密度;
所述第二计算模块,具体用于:
根据采样率以及所述功率谱密度,计算所述频域数据的频谱质心。
13.根据权利要求8所述的装置,其特征在于,所述第二计算模块,具体用于:
利用如下算式,计算所述频域数据的频谱质心:
Figure FDA0003704939060000041
其中,SC表示频谱质心,fs表示采样率,L表示频率点的总数量,
Figure FDA0003704939060000042
表示第k个频率点的功率谱密度,
Figure FDA0003704939060000043
X(k)表示第k个频率点的频率值,k为不大于L的正整数。
14.根据权利要求10所述的装置,其特征在于,所述滤波模块,具体用于:
利用如下算式,确定滤波后的频域数据:
Y(k)=H(k)*X(k),
Figure FDA0003704939060000044
其中,Y(k)表示所述滤波后的频域数据,H(k)表示所述预设滤波器,X(k)表示第k个频率点的频率值,
Figure FDA0003704939060000045
表示第k个频率点的功率谱密度,
Figure FDA0003704939060000046
Figure FDA0003704939060000047
表示所述记录模块最新记录的风噪功率谱密度,k为正整数。
15.一种电子设备,其特征在于,包括处理器和存储器,其中,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
16.一种风噪检测***,其特征在于,包括:音频采集设备和风噪检测设备,其中,
所述音频采集设备,用于采集音频数据,并将所采集的音频数据发送至所述风噪检测设备;
所述风噪检测设备,用于接收所述音频采集设备发送的音频数据,针对其中的每一帧音频数据,将该帧音频数据转换为频域数据;计算所述频域数据中频率点的功率谱密度;通过所述功率谱密度,计算所述频域数据的频谱质心;判断所述频谱质心是否小于第一预设阈值;如果是,确定该帧音频数据中存在风噪;
所述风噪检测设备,还用于在所述确定该帧音频数据中存在风噪之后,判断所述频谱质心是否大于等于第三预设阈值,所述第三预设阈值小于所述第一预设阈值;在判断所述频谱质心小于所述第三预设阈值的情况下,记录所述频谱质心对应的功率谱密度,作为风噪功率谱密度;所述风噪功率谱密度用于对该帧音频数据进行滤波。
CN201710754716.4A 2017-08-29 2017-08-29 一种风噪检测方法、装置及*** Active CN109427345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710754716.4A CN109427345B (zh) 2017-08-29 2017-08-29 一种风噪检测方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710754716.4A CN109427345B (zh) 2017-08-29 2017-08-29 一种风噪检测方法、装置及***

Publications (2)

Publication Number Publication Date
CN109427345A CN109427345A (zh) 2019-03-05
CN109427345B true CN109427345B (zh) 2022-12-02

Family

ID=65501950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710754716.4A Active CN109427345B (zh) 2017-08-29 2017-08-29 一种风噪检测方法、装置及***

Country Status (1)

Country Link
CN (1) CN109427345B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112309420B (zh) * 2020-10-30 2023-06-27 出门问问(苏州)信息科技有限公司 一种检测风噪声的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101031963A (zh) * 2004-09-16 2007-09-05 法国电信 处理有噪声的声音信号的方法以及实现该方法的装置
US20110188685A1 (en) * 2009-12-29 2011-08-04 Sheikh Naim Method for the detection of whistling in an audio system
US20120008799A1 (en) * 2009-04-03 2012-01-12 Sascha Disch Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal
CN103345921A (zh) * 2013-07-15 2013-10-09 南京理工大学 基于多特征的夜间睡眠声信号分析方法
US20160203833A1 (en) * 2013-08-30 2016-07-14 Zte Corporation Voice Activity Detection Method and Device
US20160225388A1 (en) * 2013-10-25 2016-08-04 Intel IP Corporation Audio processing devices and audio processing methods
CN106463106A (zh) * 2014-07-14 2017-02-22 英特尔Ip公司 用于音频接收的风噪声降低

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101031963A (zh) * 2004-09-16 2007-09-05 法国电信 处理有噪声的声音信号的方法以及实现该方法的装置
US20120008799A1 (en) * 2009-04-03 2012-01-12 Sascha Disch Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal
US20110188685A1 (en) * 2009-12-29 2011-08-04 Sheikh Naim Method for the detection of whistling in an audio system
CN103345921A (zh) * 2013-07-15 2013-10-09 南京理工大学 基于多特征的夜间睡眠声信号分析方法
US20160203833A1 (en) * 2013-08-30 2016-07-14 Zte Corporation Voice Activity Detection Method and Device
US20160225388A1 (en) * 2013-10-25 2016-08-04 Intel IP Corporation Audio processing devices and audio processing methods
CN106463106A (zh) * 2014-07-14 2017-02-22 英特尔Ip公司 用于音频接收的风噪声降低

Also Published As

Publication number Publication date
CN109427345A (zh) 2019-03-05

Similar Documents

Publication Publication Date Title
CN108831499B (zh) 利用语音存在概率的语音增强方法
CN106664486B (zh) 用于风噪声检测的方法和装置
CN102160296B (zh) 双端通话检测方法及装置
US7508948B2 (en) Reverberation removal
US7968786B2 (en) Volume adjusting apparatus and volume adjusting method
WO2021114733A1 (zh) 一种分频段进行处理的噪声抑制方法及其***
CN103871418B (zh) 一种扩声***啸叫频点的检测方法及装置
JP2010112996A (ja) 音声処理装置、音声処理方法およびプログラム
CN106328151B (zh) 一种环噪消除***及其应用方法
CN109285554B (zh) 一种回声消除方法、服务器、终端及***
CN108305637B (zh) 耳机语音处理方法、终端设备及存储介质
JP4816711B2 (ja) 通話音声処理装置および通話音声処理方法
US9997168B2 (en) Method and apparatus for signal extraction of audio signal
CN107274913A (zh) 一种声音识别方法及装置
Towsey Noise removal from wave-forms and spectrograms derived from natural recordings of the environment
CN106448696A (zh) 一种基于背景噪声估计自适应高通滤波语音降噪方法
WO2015085946A1 (zh) 语音信号处理方法、装置及服务器
CN101808260A (zh) 音频动态反馈抑制方法
CN112309417A (zh) 风噪抑制的音频信号处理方法、装置、***和可读介质
CN109427345B (zh) 一种风噪检测方法、装置及***
US11170760B2 (en) Detecting speech activity in real-time in audio signal
JP2014513320A (ja) オーディオ信号におけるドミナント周波数を減衰する方法及び装置
CN106571138B (zh) 一种信号端点的检测方法、检测装置及检测设备
CN105869652B (zh) 心理声学模型计算方法和装置
CN107548007B (zh) 一种音频信号采集设备的检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant