CN111968662A - 音频信号的处理方法及装置、存储介质 - Google Patents
音频信号的处理方法及装置、存储介质 Download PDFInfo
- Publication number
- CN111968662A CN111968662A CN202010796977.4A CN202010796977A CN111968662A CN 111968662 A CN111968662 A CN 111968662A CN 202010796977 A CN202010796977 A CN 202010796977A CN 111968662 A CN111968662 A CN 111968662A
- Authority
- CN
- China
- Prior art keywords
- noise
- frequency
- signal
- power spectrum
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 80
- 238000003672 processing method Methods 0.000 title description 3
- 238000001228 spectrum Methods 0.000 claims abstract description 160
- 238000012545 processing Methods 0.000 claims abstract description 58
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000009467 reduction Effects 0.000 claims abstract description 35
- 238000006243 chemical reaction Methods 0.000 claims abstract description 20
- 238000009499 grossing Methods 0.000 claims description 51
- 230000006870 function Effects 0.000 claims description 33
- 230000003595 spectral effect Effects 0.000 claims description 29
- 238000001914 filtration Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 8
- 238000004891 communication Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
Abstract
本公开是关于一种音频信号的处理方法及装置、存储介质。该方法包括:获取待处理的带噪音频功率谱和噪声功率谱;根据带噪音频功率谱在各频点的功率特征,确定第一噪声分量;其中,第一噪声分量为带噪音频功率谱与噪声功率谱中均包含的稳态噪声分量;将带噪音频功率谱减去第一噪声分量,得到带噪音频分量;将噪声功率谱减去第一噪声分量,得到第二噪声分量;根据带噪音频分量与第二噪声分量,确定频域估计信号;基于频域估计信号进行时频转换,得到降噪音频信号。通过本公开实施例的技术方案,对带噪音频功率谱于噪声功率谱去除共有的稳态噪声分量,再对音频信号进行降噪处理,能够减少稳态噪声带来的处理偏差,从而提升降噪效果。
Description
技术领域
本公开涉及信号处理技术,尤其涉及一种音频信号的处理方法及装置、存储介质。
背景技术
随着通信技术与互联网技术的不断发展,多媒体信息的处理成为信息通信的重要研究方向。为了实现更加清晰高质量的通信或者数据传输,需要对音频信号进行降噪处理。降噪处理通常可采用滤波的方式,去除信号中的噪声分量,从而提升信号质量。然而,降噪处理的过程中,往往难以将信号中的噪声分量与纯净的音频信号分离,因此降噪效果难以满足越来越高的用户需求。
发明内容
本公开提供一种音频信号的处理方法及装置、存储介质。
根据本公开实施例的第一方面,提供一种音频信号的处理方法,包括:
获取待处理的带噪音频功率谱和噪声功率谱;
根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量;其中,所述第一噪声分量为所述带噪音频功率谱与所述噪声功率谱中均包含的稳态噪声分量;
将所述带噪音频功率谱减去所述第一噪声分量,得到带噪音频分量;
将所述噪声功率谱减去所述第一噪声分量,得到第二噪声分量;
根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号;
基于所述频域估计信号进行时频转换,得到降噪音频信号。
在一些实施例中,所述根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量,包括:
对所述带噪音频功率谱在预定频带内进行带通滤波处理,得到频率平滑功率谱;
根据时间平滑参数,对所述频率平滑功率谱进行平滑处理,得到时间平滑功率谱;
根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量。
在一些实施例中,所述根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量,包括:
对时域上的每一帧,根据各频点上滤波后的所述带噪音频功率谱,确定各帧的最小功率谱密度的频点,得到各帧的最小频点;
从时域上各帧的所述最小频点中,选择最小功率谱密度的频点,作为所述第一噪声分量。
在一些实施例中,所述根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号,包括:
根据所述带噪音频分量与所述第二噪声分量,确定后验信噪比;
根据所述后验信噪比,确定先验信噪比;
根据所述先验信噪比与所述待处理的带噪音频功率谱,确定所述频域估计信号。
在一些实施例中,所述根据所述后验信噪比,确定先验信噪比,包括:
根据当前帧的所述后验信噪比与上一帧的所述后验信噪比,确定当前帧的所述先验信噪比。
在一些实施例中,所述根据当前帧的后验信噪比与上一帧的后验信噪比,确定当前帧的先验信噪比,包括:
根据第一权重的当前帧的后验信噪比与第二权重的上一帧的后验信噪比,确定当前帧的所述先验信噪比;其中,所述第一权重根据所述先验信噪比与预定的平滑系数确定;所述第二权重根据所述平滑系数确定。
在一些实施例中,所述根据所述先验信噪比与所述待处理的带噪音频功率谱,确定所述频域估计信号,包括:
根据所述先验信噪比,确定增益函数;
将所述待处理的带噪音频功率谱乘以所述增益函数,得到所述频域估计信号。
在一些实施例中,所述方法还包括:
获取待处理的音频信号;
对所述音频信号进行时频转换,得到频域带噪信号;
根据所述频域带噪信号,确定所述待处理的带噪音频功率谱。
根据本公开实施例的第二方面,提供一种音频信号的处理装置,包括:
第一获取模块,用于获取待处理的带噪音频功率谱和噪声功率谱;
第一确定模块,用于根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量;其中,所述第一噪声分量为所述带噪音频功率谱与所述噪声功率谱中均包含的稳态噪声分量;
第一计算模块,用于将所述带噪音频功率谱减去所述第一噪声分量,得到带噪音频分量;
第二计算模块,用于将所述噪声功率谱减去所述第一噪声分量,得到第二噪声分量;
第二确定模块,用于根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号;
第一转换模块,用于基于所述频域估计信号进行时频转换,得到降噪音频信号。
在一些实施例中,所述第一确定模块,包括:
滤波子模块,用于对所述带噪音频功率谱在预定频带内进行带通滤波处理,得到频率平滑功率谱;
平滑子模块,用于根据时间平滑参数,对所述频率平滑功率谱进行平滑处理,得到时间平滑功率谱;
第一确定子模块,用于根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量。
在一些实施例中,所述第一确定子模块,具体用于:
对时域上的每一帧,根据各频点上滤波后的所述带噪音频功率谱,确定各帧的最小功率谱密度的频点,得到各帧的最小频点;
从时域上各帧的所述最小频点中,选择最小功率谱密度的频点,作为所述第一噪声分量。
在一些实施例中,所述第二确定模块,包括:
第二确定子模块,用于根据所述带噪音频分量与所述第二噪声分量,确定后验信噪比;
第三确定子模块,用于根据所述后验信噪比,确定先验信噪比;
第四确定子模块,用于根据所述先验信噪比与所述待处理的频域带噪信号,确定所述频域估计信号。
在一些实施例中,所述第三确定子模块,具体用于:
根据当前帧的所述后验信噪比与上一帧的所述后验信噪比,确定当前帧的所述先验信噪比。
在一些实施例中,所述第三确定子模块,具体用于:
根据第一权重的当前帧的后验信噪比与第二权重的上一帧的后验信噪比,确定当前帧的所述先验信噪比;其中,所述第一权重根据所述先验信噪比与预定的平滑系数确定;所述第二权重根据所述平滑系数确定。
在一些实施例中,所述第四确定子模块,具体用于:
根据所述先验信噪比,确定增益函数;
将所述待处理的带噪音频功率谱乘以所述增益函数,得到所述频域估计信号。
在一些实施例中,所述装置还包括:
第二获取模块,用于获取待处理的音频信号;
第二转换模块,用于对所述音频信号进行时频转换,得到频域带噪信号;
第三确定模块,用于根据所述频域带噪信号,确定所述待处理的带噪音频功率谱。
根据本公开实施例的第三方面,提供一种音频信号的处理装置,至少包括:处理器和用于存储能够在所述处理器上运行的可执行指令的存储器,其中:
处理器用于运行所述可执行指令时,所述可执行指令执行上述任一项音频信号的处理方法中的步骤。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述任一项音频信号的处理方法中的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:通过本公开实施例的技术方案,对带噪音频功率谱于噪声功率谱去除共有的稳态噪声分量,再对音频信号进行降噪处理,相较于直接根据后验信噪比估计噪声,并进行降噪的方式,考虑到了音频信号和噪声中均包含的稳态噪声带来的处理偏差,而采用分别去除稳态噪声后的带噪音频功率谱与噪声功率谱来确定纯净的降噪音频功率谱,因而能够减少降噪音频信号与理想的纯净语音信号之间的偏差,从而提升降噪效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种音频信号的处理方法的流程图一;
图2是根据一示例性实施例示出的一种音频信号的处理方法的流程图二;
图3是根据一示例性实施例示出的一种音频信号的处理方法的流程图三;
图4是根据一示例性实施例示出的一种音频信号的处理装置的结构框图;
图5是根据一示例性实施例示出的一种音频信号的处理装置的实体结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种音频信号的处理方法的流程图,如图1所示,该方法包括以下步骤:
步骤S101、获取待处理的带噪音频功率谱和噪声功率谱;
步骤S102、根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量;其中,所述第一噪声分量为所述带噪音频功率谱与所述噪声功率谱中均包含的稳态噪声分量;
步骤S103、将所述带噪音频功率谱减去所述第一噪声分量,得到带噪音频分量;
步骤S104、将所述噪声功率谱减去所述第一噪声分量,得到第二噪声分量;
步骤S105、根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号;
步骤S106、基于所述频域估计信号进行时频转换,得到降噪音频信号。
本公开实施例的上述方法可以应用于终端中,终端可以为具有音频采集组件(如具有麦克风)的电子设备,包括:手机、笔记本电脑、摄影机、可穿戴电子设备以及各种具有人机交互能力的电子设备等。也可以为具有音频文件的处理功能的电子设备,如,不具有音频采集功能但可以对音频文件进行处理的计算机以及音响设备等。
对于音频信号的处理是为了在终端对音频信号进行处理得到信号质量更高,滤除大部分噪声的降噪音频信号。终端对音频信号进行处理得到上述降噪音频信号后,可将降噪音频信号传输至预定设备,如音箱、电视机等多媒体播放设备,也可以利用终端自身的播放功能进行播放。当然,也可以根据上述降噪音频信号进行编码等处理,形成便于传输或者存储的音频文件。
在本公开实施例中,带噪音频功率谱为原始的带噪音频信号在各频点的功率谱密度,用于体现音频信号在各频点的能量大小。噪声功率谱可通过噪声检测来获取,通过无语音时对环境噪声的检测来获取噪声信号,进而确定噪声在各频点的功率谱密度。
由于噪声包括稳态噪声和非稳态噪声,稳态噪声是指波动范围小于预定音量的连续性噪声,或者重复频率大于预定频率的脉冲噪声。例如,波动范围在5dB(分贝)以内的连续性噪声,或者重复频率大于10Hz的脉冲噪声。原始的带噪音频信号与检测的噪声中均含有近似相同的稳态噪声分量,并且,稳态噪声通常集中在一定的频率范围内,因此,在使用频域信号进行后验信噪比的估计时,会受到稳态噪声的频域分量的影响,使得后验信噪比的估计不准确,进而影响降噪处理的准确性。
因此,在本公开实施例中,可根据带噪音频功率谱对稳态噪声进行估计,得到上述第一噪声分量,然后对带噪音频功率谱与噪声功率谱分别取出表示稳态噪声的第一噪声分量。例如,根据带噪音频功率谱中,符合稳态噪声特点的频点,可估计为稳态噪声对应的频点。然后再基于去除第一噪声分量的带噪音频分量与第二噪声分量对原始音频信号中的纯净音频部分进行估计,也就是实现了对原始带噪音频信号的降噪处理,从而得到上述降噪音频信号。
如此,本公开实施例的技术方案,先根据原始带噪音频信号对稳态噪声进行估计,然后利用去除稳态噪声后的信号分量与噪声分量来确定降噪音频信号,能够减少稳态噪声对信号中噪声估计的处理偏差,从而提升降噪效果,使得降噪音频信号具有更高的信号质量。
在一些实施例中,如图2所示,上述步骤S102中,所述根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量,包括:
步骤S201、对所述带噪音频功率谱在预定频带内进行带通滤波处理,得到频率平滑功率谱;
步骤S202、根据时间平滑参数,对所述频率平滑功率谱进行平滑处理,得到时间平滑功率谱;
步骤S203、根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量。
在本公开实施例中,确定上述第一噪声分量的过程,即根据原始的带噪音频信号对稳态噪声进行估计的过程。
由于稳态噪声具有变化幅度小的特点,使得稳态噪声的音频为集中在一定的频率范围内,且能量较低,而语音中的音频信号则并非始终保持连续不变的频率。因此,可将带噪音频功率谱中,满足上述功率谱密度条件的频点,作为估计的稳态噪声的频点。这里,功率谱密度条件可为:功率小于预定阈值的频点,例如,在语音信号满足正常音量对应的功率以下的信号的频点,或在预定频带范围内功率最小的频点,或者在音频信号所在的全频带内,功率最小的频点。在实际应用中,可根据所处环境的稳态噪声的实际特点来确定上述条件。
在本公开实施例中,上述估计稳态噪声的过程中,可先对带噪音频功率谱在预定频带内进行带通滤波。也就是利用预定长度的窗函数进行加窗处理,实现带噪音频功率谱在频率维度上的平滑,得到上述频率平滑功率谱。然后再对频率平滑功率谱在时间维度上进行平滑处理,从而去除带噪音频功率谱中的跳变点。
通过对上述平滑处理后得到的时间平滑功率谱判断其中满足功率谱密度条件的频点,可以减少由于音频信号中信号的跳变等情况造成估计的偏差,从而得到更加接近实际稳态噪声的第一噪声分量。
在一些实施例中,所述根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量,包括:
对时域上的每一帧,根据各频点上滤波后的所述带噪音频功率谱,确定各帧的最小功率谱密度的频点,得到各帧的最小频点;
从时域上各帧的所述最小频点中,选择最小功率谱密度的频点,作为所述第一噪声分量。
在本公开实施例中,可通过最小值搜索的方式从带噪音频功率谱中查找最小功率谱密度的频点,作为上述第一噪声分量。
在进行搜索时,可将时域上的每一帧分别进行搜索,这样可根据时间的顺序进行处理,然后每隔一段时间,可从各帧的最小频点中挑选出最小功率谱密度的频点,从而找到整个音频信号中的最小功率谱密度的频点。这样,随着时间的推移,从音频信号中找到最小功率谱密度的频点,从而更准确地估计稳态噪声,减少第一噪声分量中包含的的非稳态噪声以及音频信号。
在一些实施例中,所述根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号,包括:
根据所述带噪音频分量与所述第二噪声分量,确定后验信噪比;
根据所述后验信噪比,确定先验信噪比;
根据所述先验信噪比与所述待处理的带噪音频功率谱,确定所述频域估计信号。
后验信噪比为根据获取到的原始带噪音频信号的功率谱与噪声的功率谱之比。在本公开实施例中,后验信噪比则为原始带噪音频信号的功率谱去除稳态噪声后的带噪音频分量。可通过对原始带噪音频信号的频域信号计算各频点的功率得到原始带噪信号的功率谱,通过对噪声检测得到的噪声信号的频域信号计算各频点的功率得到噪声功率谱。然后分别减去第一噪声分量,去除稳态噪声。如此得到的带噪音频分量与第二噪声分量的比值,则为上述后验信噪比。
先验信噪比为纯净语音信号与原始音频信号中所包含噪声分量之比,由于终端获取到的音频信号均为带噪信号,无法直接获得理想的纯净语音信号,因此,可以根据上述后验信噪比对先验信噪比进行估计。根据估计的先验信噪比对原始带噪信号进行处理,实现音频信号的降噪。也就是将先验信噪比与待处理的带噪音频功率谱的乘积,作为降噪处理后的频域信号,由于先验信噪比为估计得到的信噪比参数,因此,降噪处理后的频域信号也为估计的信号,即频域估计信号。
如此,就可以根据原始带噪信号与噪声的处理,实现对原始带噪信号的降噪处理,得到尽可能接近纯净语音的音频信号。
在一些实施例中,所述根据所述后验信噪比,确定先验信噪比,包括:
根据当前帧的所述后验信噪比与上一帧的所述后验信噪比,确定当前帧的所述先验信噪比。
在本公开实施例中,上述根据后验信噪比对先验信噪比的估计,可以根据多帧音频信号对应的后验信噪比,实现对先验信噪比的估计。如此,利用音频信号自身的稳定性或者规律性,按照时间顺序对后验信噪比进行处理,就可以实现对先验信噪比的期望值的估算。
在一些实施例中,所述根据当前帧的后验信噪比与上一帧的后验信噪比,确定当前帧的先验信噪比,包括:
根据第一权重的当前帧的后验信噪比与第二权重的上一帧的后验信噪比,确定当前帧的所述先验信噪比;其中,所述第一权重根据所述先验信噪比与预定的平滑系数确定;所述第二权重根据所述平滑系数确定。
在本公开实施例中,上述根据相邻帧的后验信噪比,估计当前帧的先验信噪比的实现方式,是一种加权平均的估计方式。上述第一权重可根据含有先验信噪比的增益函数以及平滑系数来确定,第二权重则根据平滑系数来确定。因此,对先验信噪比的估计同时也为对含有先验信噪比的增益函数的估计。可参考DD(Decision Directed,判决指向)算法的估计方式:
priorSNR(k,l)=w*H(k,l)*postSNR(k,l-1)+(1-w)*MAX(postSNR(k,l)-1,0)
其中,k为频点,l为帧数,priorSNR(k,l)为第l帧第k频点的先验信噪比,postSNR(k,l)为第l帧第k频点的后验信噪比;w为上述平滑系数,取值在0到1之间,例如,可取0.8;H(k,l)为维纳滤波器的增益函数,由先验信噪比确定。因此,利用该算法可根据后验信噪比实现先验信噪比的估计。
在一些实施例中,所述根据所述先验信噪比与所述待处理的带噪音频功率谱,确定所述频域估计信号,包括:
根据所述先验信噪比,确定增益函数;
将所述待处理的带噪音频功率谱乘以所述增益函数,得到所述频域估计信号。
这里,增益函数为纯净语音的功率谱与纯净语音的功率谱加噪声功率谱的比值。由于对带噪音频信号则可以理解为由纯净语音与噪声组成,因此,对带噪音频功率谱乘以增益函数就可以得到估计的纯净语音的功率谱,即上述频域估计信号。
增益函数可根据先验信噪比计算得到,即先验信噪比与先验信噪比加1的比值。
如此,就能够通过上述DD算法得到先验信噪比,也就是得到上述增益函数,从而利用增益函数对带噪音频功率谱进行降噪处理,然后进行傅里叶反变换,将频域信号转换到时域,从而得到增强的语音信号。
在一些实施例中,所述方法还包括:
获取待处理的音频信号;
对所述音频信号进行时频转换,得到频域带噪信号;
根据所述频域带噪信号,确定所述待处理的带噪音频功率谱。
在本公开实施例中,可通过音频采集组件采集音频信号,也可直接获取音频格式的文件中的音频信号。音频信号可直接利用音频播放组件进行播放的时域信号,因此,在进行上述降噪处理时,可以利用傅里叶变换将音频信号由时域转换为频域信号,再根据上述频域带噪信号在各频点的功率,确定上述带噪音频功率谱。这里,只需要进行简单的时频转换等运算处理,即可将采集到的音频信号通过上述降噪的方式实现降噪处理。
本公开实施例还提供如下示例:
在使用手机通话或者音频处理时,可根据后验信噪比来估计维纳滤波器的增益函数,然后对带噪语音信号进行降噪处理。维纳滤波器是使估计误差的均方值最小化的滤波方式,具有较好的平滑效果和降噪效果。提升维纳滤波器的增益函数的准确性,是提升滤波效果的关键。
对于频域上的音频信号,第l帧的第k个频点的增益函数H(k,l)为其中,Px(k,l)为第k个频点,第l帧的纯净语音的功率谱;Pd(k,l)为第k个频点,第l帧的噪声功率谱。上述增益函数的分子分母同时除以Pd(k,l),即可得到基于先验信噪比的增益函数形式:其中,代表第l帧第k个频点的先验信噪比,即H(k,l)=priorSNR(k,l)/(1+priorSNR(k,l))=gain。基于DD算法,可利用后验信噪比的加权平均估计先验信噪比:
priorSNR(k,l)=w*H(k,l)*postSNR(k,l-1)+(1-w)*MAX(postSNR(k,l)-1,0)
其中,w为平滑因子,作为相邻两帧的后验信噪比的权重,priorSNR(k,l)即上述先验信噪比Ek(k,l),postSNR(k,l)为后验信噪比:其中,Y(k,l)为原始的带噪音频信号在第l帧第k个频点的功率谱,D(k,l)为检测得到的噪声的咋生功率谱。
实际环境中噪声分为稳态噪声和非稳态噪声,上述带噪音频信号的带噪音频功率谱与噪声功率谱均包含稳态噪声,因此,会导致后验信噪比的估计不准确,进而影响先验信噪比的估计,使得维纳滤波器的增益函数不准确。
因此,在本公开实施例中,对上述带噪音频功率谱与噪声功率谱均去除稳态噪声,得到改进的后验信噪比其中,Ps(k,l)为稳态噪声,稳态噪声可根据带噪音频功率谱估计,也可根据噪声功率谱进行估计:Ps(k,l)=MIN(Ps_Y(k,l),Ps_D(k,l)),其中,Ps_Y(k,l)为基于带噪音频功率谱的估计的稳态噪声,Ps_D(k,l)为基于噪声功率谱估计的稳态噪声。
在本公开实施例中,可基于MCRA(Minimum Control Recursive Average,最小值控制的递归平均)算法基于带噪音频功率谱进行稳态噪声的估计:
步骤S301、对带噪语音功率谱分别做时间、频率两个维度的平滑处理:
时间平滑:S(k,l)=αs(k,l)S(k,l-1)+Sf(k,l)
其中,αs(0<αs<1)为平滑因子,b(i)为窗,长度为2w-1,窗长可用于控制最小值的搜索速度。
步骤S302、对平滑处理后的带噪语音功率谱进行最小值搜索,得到估计的稳态噪声:
Smin(k,l)=min{Smin(k,l-1),S(k,l)}
Stmp(k,l)=min{Stmp(k,l-1),S(k,l)}
其中,Stmp为每隔一段时间搜索到的最小值,Smin为总体的最小值。开始两者为相等至,经过L帧后可进行一次统计:
Smin(k,l)=min{Stmp(k,l-1),S(k,l)}
Stmp(k,l)=S(k,l)
最终可跟踪到最小值的频点,作为上述估计的稳态噪声Ps(k,l)。
步骤S303、根据估计的稳态噪声,更新后验信噪比:
步骤S304、基于更新后的后验信噪比,通过DD算法估计先验信噪比,并得到维纳滤波器的增益函数:
priorSNR(k,l)=w*gain*postSNR_new(k,l-1)+(1-w)*MAX(postSNR_new(k,l)-1,0)
这里,gain为基于更新后的后验信噪比估计得到的更加准确的增益函数。
步骤S305、基于得到的增益函数,对语音信号进行降噪:
Px(k,l)=gain(k,l)*Y(k,l),对Px(k,l)进行FFT反变换后得到时域的增强的语音信号。
通过本公开实施例的技术方案,可以对噪声进行更多的一致,并且具有较好的平滑效果。同时,该方法属于动态的估计方法,不需要固定门限的限制,可适用于更多的场景。
图4是根据一示例性实施例示出的一种音频信号的处理装置的结构框图,如图4所示,该装置400,包括:
第一获取模块401,用于获取待处理的带噪音频功率谱和噪声功率谱;
第一确定模块402,用于根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量;其中,所述第一噪声分量为所述带噪音频功率谱与所述噪声功率谱中均包含的稳态噪声分量;
第一计算模块403,用于将所述带噪音频功率谱减去所述第一噪声分量,得到带噪音频分量;
第二计算模块404,用于将所述噪声功率谱减去所述第一噪声分量,得到第二噪声分量;
第二确定模块405,用于根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号;
第一转换模块406,用于基于所述频域估计信号进行时频转换,得到降噪音频信号。
在一些实施例中,所述第一确定模块,包括:
滤波子模块,用于对所述带噪音频功率谱在预定频带内进行带通滤波处理,得到频率平滑功率谱;
平滑子模块,用于根据时间平滑参数,对所述频率平滑功率谱进行平滑处理,得到时间平滑功率谱;
第一确定子模块,用于根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量。
在一些实施例中,所述第一确定子模块,具体用于:
对时域上的每一帧,根据各频点上滤波后的所述带噪音频功率谱,确定各帧的最小功率谱密度的频点,得到各帧的最小频点;
从时域上各帧的所述最小频点中,选择最小功率谱密度的频点,作为所述第一噪声分量。
在一些实施例中,所述第二确定模块,包括:
第二确定子模块,用于根据所述带噪音频分量与所述第二噪声分量,确定后验信噪比;
第三确定子模块,用于根据所述后验信噪比,确定先验信噪比;
第四确定子模块,用于根据所述先验信噪比与所述待处理的频域带噪信号,确定所述频域估计信号。
在一些实施例中,所述第三确定子模块,具体用于:
根据当前帧的所述后验信噪比与上一帧的所述后验信噪比,估计当前帧的所述先验信噪比。
在一些实施例中,所述第三确定子模块,具体用于:
根据第一权重的当前帧的后验信噪比与第二权重的上一帧的后验信噪比,确定当前帧的所述先验信噪比;其中,所述第一权重根据所述先验信噪比与预定的平滑系数确定;所述第二权重根据所述平滑系数确定。
在一些实施例中,所述第四确定子模块,具体用于:
根据所述先验信噪比,确定增益函数;
将所述待处理的带噪音频功率谱乘以所述增益函数,得到所述频域估计信号。
在一些实施例中,所述装置还包括:
第二获取模块,用于获取待处理的音频信号;
第二转换模块,用于对所述音频信号进行时频转换,得到频域带噪信号;
第三确定模块,用于根据所述频域带噪信号,确定所述待处理的带噪音频功率谱。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种装置500的框图。例如,装置500可以是移动电话、计算机、数字广播终端、消息收发设备、游戏控制台、平板设备、医疗设备、健身设备、个人数字助理等。
参照图5,装置500可以包括以下一个或多个组件:处理组件501,存储器502,电源组件503,多媒体组件504,音频组件505,输入/输出(I/O)接口506,传感器组件507,以及通信组件508。
处理组件501通常控制装置500的整体操作,诸如与显示、电话呼叫、数据通信、相机操作和记录操作相关联的操作。处理组件501可以包括一个或多个处理器510来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件501还可以包括一个或多个模块,便于处理组件501和其他组件之间的交互。例如,处理组件501可以包括多媒体模块,以方便多媒体组件504和处理组件501之间的交互。
存储器510被配置为存储各种类型的数据以支持在装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器502可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、快闪存储器、磁盘或光盘。
电源组件503为装置500的各种组件提供电力。电源组件503可以包括:电源管理***,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
多媒体组件504包括在所述装置500和用户之间提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件504包括一个前置摄像头和/或后置摄像头。当装置500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和/或后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件505被配置为输出和/或输入音频信号。例如,音频组件505包括一个麦克风(MIC),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器510或经由通信组件508发送。在一些实施例中,音频组件505还包括一个扬声器,用于输出音频信号。
I/O接口506为处理组件501和***接口模块之间提供接口,上述***接口模块可以是键盘、点击轮、按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件507包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件507可以检测到装置500的打开/关闭状态、组件的相对定位,例如所述组件为装置500的显示器和小键盘,传感器组件507还可以检测装置500或装置500的一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件507可以包括接近传感器,被配置为在没有任何的物理接触时检测附近物体的存在。传感器组件507还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件507还可以包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。
通信组件508被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如WiFi、2G或3G,或它们的组合。在一个示例性实施例中,通信组件508经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件508还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术、红外数据协会(IrDA)技术、超宽带(UWB)技术、蓝牙(BT)技术或其他技术来实现。
在示例性实施例中,装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器502,上述指令可由装置500的处理器510执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本公开实施例还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述任一实施例所提供的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (18)
1.一种音频信号的处理方法,其特征在于,包括:
获取待处理的带噪音频功率谱和噪声功率谱;
根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量;其中,所述第一噪声分量为所述带噪音频功率谱与所述噪声功率谱中均包含的稳态噪声分量;
将所述带噪音频功率谱减去所述第一噪声分量,得到带噪音频分量;
将所述噪声功率谱减去所述第一噪声分量,得到第二噪声分量;
根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号;
基于所述频域估计信号进行时频转换,得到降噪音频信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量,包括:
对所述带噪音频功率谱在预定频带内进行带通滤波处理,得到频率平滑功率谱;
根据时间平滑参数,对所述频率平滑功率谱进行平滑处理,得到时间平滑功率谱;
根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量。
3.根据权利要求2所述的方法,其特征在于,所述根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量,包括:
对时域上的每一帧,根据各频点上滤波后的所述带噪音频功率谱,确定各帧的最小功率谱密度的频点,得到各帧的最小频点;
从时域上各帧的所述最小频点中,选择最小功率谱密度的频点,作为所述第一噪声分量。
4.根据权利要求1至3任一所述的方法,其特征在于,所述根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号,包括:
根据所述带噪音频分量与所述第二噪声分量,确定后验信噪比;
根据所述后验信噪比,确定先验信噪比;
根据所述先验信噪比与所述待处理的带噪音频功率谱,确定所述频域估计信号。
5.根据权利要求4所述的方法,其特征在于,所述根据所述后验信噪比,确定先验信噪比,包括:
根据当前帧的所述后验信噪比与上一帧的所述后验信噪比,确定当前帧的所述先验信噪比。
6.根据权利要求5所述的方法,其特征在于,所述根据当前帧的后验信噪比与上一帧的后验信噪比,确定当前帧的先验信噪比,包括:
根据第一权重的当前帧的后验信噪比与第二权重的上一帧的后验信噪比,确定当前帧的所述先验信噪比;其中,所述第一权重根据所述先验信噪比与预定的平滑系数确定;所述第二权重根据所述平滑系数确定。
7.根据权利要求4所述的方法,其特征在于,所述根据所述先验信噪比与所述待处理的带噪音频功率谱,确定所述频域估计信号,包括:
根据所述先验信噪比,确定增益函数;
将所述待处理的带噪音频功率谱乘以所述增益函数,得到所述频域估计信号。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待处理的音频信号;
对所述音频信号进行时频转换,得到频域带噪信号;
根据所述频域带噪信号,确定所述待处理的带噪音频功率谱。
9.一种音频信号的处理装置,其特征在于,包括:
第一获取模块,用于获取待处理的带噪音频功率谱和噪声功率谱;
第一确定模块,用于根据所述带噪音频功率谱在各频点的功率特征,确定第一噪声分量;其中,所述第一噪声分量为所述带噪音频功率谱与所述噪声功率谱中均包含的稳态噪声分量;
第一计算模块,用于将所述带噪音频功率谱减去所述第一噪声分量,得到带噪音频分量;
第二计算模块,用于将所述噪声功率谱减去所述第一噪声分量,得到第二噪声分量;
第二确定模块,用于根据所述带噪音频分量与所述第二噪声分量,确定频域估计信号;
第一转换模块,用于基于所述频域估计信号进行时频转换,得到降噪音频信号。
10.根据权利要求9所述的装置,其特征在于,所述第一确定模块,包括:
滤波子模块,用于对所述带噪音频功率谱在预定频带内进行带通滤波处理,得到频率平滑功率谱;
平滑子模块,用于根据时间平滑参数,对所述频率平滑功率谱进行平滑处理,得到时间平滑功率谱;
第一确定子模块,用于根据各频点上的所述时间平滑功率谱中满足功率谱密度条件的频点,确定所述第一噪声分量。
11.根据权利要求10所述的装置,其特征在于,所述第一确定子模块,具体用于:
对时域上的每一帧,根据各频点上滤波后的所述带噪音频功率谱,确定各帧的最小功率谱密度的频点,得到各帧的最小频点;
从时域上各帧的所述最小频点中,选择最小功率谱密度的频点,作为所述第一噪声分量。
12.根据权利要求9至11任一所述的装置,其特征在于,所述第二确定模块,包括:
第二确定子模块,用于根据所述带噪音频分量与所述第二噪声分量,确定后验信噪比;
第三确定子模块,用于根据所述后验信噪比,确定先验信噪比;
第四确定子模块,用于根据所述先验信噪比与所述待处理的频域带噪信号,确定所述频域估计信号。
13.根据权利要求12所述的装置,其特征在于,所述第三确定子模块,具体用于:
根据当前帧的所述后验信噪比与上一帧的所述后验信噪比,确定当前帧的所述先验信噪比。
14.根据权利要求13所述的装置,其特征在于,所述第三确定子模块,具体用于:
根据第一权重的当前帧的后验信噪比与第二权重的上一帧的后验信噪比,确定当前帧的所述先验信噪比;其中,所述第一权重根据所述先验信噪比与预定的平滑系数确定;所述第二权重根据所述平滑系数确定。
15.根据权利要求12所述的装置,其特征在于,所述第四确定子模块,具体用于:
根据所述先验信噪比,确定增益函数;
将所述待处理的带噪音频功率谱乘以所述增益函数,得到所述频域估计信号。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取待处理的音频信号;
第二转换模块,用于对所述音频信号进行时频转换,得到频域带噪信号;
第三确定模块,用于根据所述频域带噪信号,确定所述待处理的带噪音频功率谱。
17.一种音频信号的处理装置,其特征在于,所述装置至少包括:处理器和用于存储能够在所述处理器上运行的可执行指令的存储器,其中:
处理器用于运行所述可执行指令时,所述可执行指令执行上述权利要求1至8任一项提供的音频信号的处理方法中的步骤。
18.一种非临时性计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述权利要求1至8任一项提供的音频信号的处理方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010796977.4A CN111968662A (zh) | 2020-08-10 | 2020-08-10 | 音频信号的处理方法及装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010796977.4A CN111968662A (zh) | 2020-08-10 | 2020-08-10 | 音频信号的处理方法及装置、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111968662A true CN111968662A (zh) | 2020-11-20 |
Family
ID=73365047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010796977.4A Pending CN111968662A (zh) | 2020-08-10 | 2020-08-10 | 音频信号的处理方法及装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111968662A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112382277A (zh) * | 2021-01-07 | 2021-02-19 | 博智安全科技股份有限公司 | 智能设备唤醒方法、智能设备和计算机可读存储介质 |
CN112735458A (zh) * | 2020-12-28 | 2021-04-30 | 苏州科达科技股份有限公司 | 噪声估计方法、降噪方法及电子设备 |
CN113488067A (zh) * | 2021-06-30 | 2021-10-08 | 北京小米移动软件有限公司 | 回声消除方法、装置、电子设备和存储介质 |
CN113539285A (zh) * | 2021-06-04 | 2021-10-22 | 浙江华创视讯科技有限公司 | 音频信号降噪方法、电子装置和存储介质 |
CN113613112A (zh) * | 2021-09-23 | 2021-11-05 | 三星半导体(中国)研究开发有限公司 | 抑制麦克风的风噪的方法和电子装置 |
CN113808608A (zh) * | 2021-09-17 | 2021-12-17 | 随锐科技集团股份有限公司 | 一种基于时频掩蔽平滑策略的单声道噪声抑制方法和装置 |
CN115426582A (zh) * | 2022-11-06 | 2022-12-02 | 江苏米笛声学科技有限公司 | 一种耳机音频处理方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070260454A1 (en) * | 2004-05-14 | 2007-11-08 | Roberto Gemello | Noise reduction for automatic speech recognition |
KR20120059431A (ko) * | 2010-11-30 | 2012-06-08 | (주)트란소노 | 적응적 잡음추정 장치 및 방법 |
CN104103278A (zh) * | 2013-04-02 | 2014-10-15 | 北京千橡网景科技发展有限公司 | 一种实时语音去噪的方法和设备 |
CN106098077A (zh) * | 2016-07-28 | 2016-11-09 | 浙江诺尔康神经电子科技股份有限公司 | 一种带降噪的人工耳蜗言语处理***及方法 |
CN106161751A (zh) * | 2015-04-14 | 2016-11-23 | 电信科学技术研究院 | 一种噪声抑制方法及装置 |
CN110164467A (zh) * | 2018-12-18 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 语音降噪的方法和装置、计算设备和计算机可读存储介质 |
US20200251090A1 (en) * | 2019-01-31 | 2020-08-06 | Harman Becker Automotive Systems Gmbh | Detection of fricatives in speech signals |
-
2020
- 2020-08-10 CN CN202010796977.4A patent/CN111968662A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070260454A1 (en) * | 2004-05-14 | 2007-11-08 | Roberto Gemello | Noise reduction for automatic speech recognition |
KR20120059431A (ko) * | 2010-11-30 | 2012-06-08 | (주)트란소노 | 적응적 잡음추정 장치 및 방법 |
CN104103278A (zh) * | 2013-04-02 | 2014-10-15 | 北京千橡网景科技发展有限公司 | 一种实时语音去噪的方法和设备 |
CN106161751A (zh) * | 2015-04-14 | 2016-11-23 | 电信科学技术研究院 | 一种噪声抑制方法及装置 |
CN106098077A (zh) * | 2016-07-28 | 2016-11-09 | 浙江诺尔康神经电子科技股份有限公司 | 一种带降噪的人工耳蜗言语处理***及方法 |
CN110164467A (zh) * | 2018-12-18 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 语音降噪的方法和装置、计算设备和计算机可读存储介质 |
US20200251090A1 (en) * | 2019-01-31 | 2020-08-06 | Harman Becker Automotive Systems Gmbh | Detection of fricatives in speech signals |
Non-Patent Citations (1)
Title |
---|
庞亮;刘双东;: "基于语音存在概率的噪声功率谱估计改进算法", 电声技术, no. 02 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112735458A (zh) * | 2020-12-28 | 2021-04-30 | 苏州科达科技股份有限公司 | 噪声估计方法、降噪方法及电子设备 |
CN112382277A (zh) * | 2021-01-07 | 2021-02-19 | 博智安全科技股份有限公司 | 智能设备唤醒方法、智能设备和计算机可读存储介质 |
CN113539285A (zh) * | 2021-06-04 | 2021-10-22 | 浙江华创视讯科技有限公司 | 音频信号降噪方法、电子装置和存储介质 |
CN113539285B (zh) * | 2021-06-04 | 2023-10-31 | 浙江华创视讯科技有限公司 | 音频信号降噪方法、电子装置和存储介质 |
CN113488067A (zh) * | 2021-06-30 | 2021-10-08 | 北京小米移动软件有限公司 | 回声消除方法、装置、电子设备和存储介质 |
CN113808608A (zh) * | 2021-09-17 | 2021-12-17 | 随锐科技集团股份有限公司 | 一种基于时频掩蔽平滑策略的单声道噪声抑制方法和装置 |
CN113808608B (zh) * | 2021-09-17 | 2023-07-25 | 随锐科技集团股份有限公司 | 一种基于时频掩蔽平滑策略的单声道噪声抑制方法和装置 |
CN113613112A (zh) * | 2021-09-23 | 2021-11-05 | 三星半导体(中国)研究开发有限公司 | 抑制麦克风的风噪的方法和电子装置 |
CN113613112B (zh) * | 2021-09-23 | 2024-03-29 | 三星半导体(中国)研究开发有限公司 | 抑制麦克风的风噪的方法和电子装置 |
CN115426582A (zh) * | 2022-11-06 | 2022-12-02 | 江苏米笛声学科技有限公司 | 一种耳机音频处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111968662A (zh) | 音频信号的处理方法及装置、存储介质 | |
CN107833579B (zh) | 噪声消除方法、装置及计算机可读存储介质 | |
CN109361828B (zh) | 一种回声消除方法、装置、电子设备及存储介质 | |
CN111128221B (zh) | 一种音频信号处理方法、装置、终端及存储介质 | |
CN111986693A (zh) | 音频信号的处理方法及装置、终端设备和存储介质 | |
CN111883164B (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN111009257B (zh) | 一种音频信号处理方法、装置、终端及存储介质 | |
CN110853664A (zh) | 评估语音增强算法性能的方法及装置、电子设备 | |
CN110970051A (zh) | 语音数据采集方法、终端及可读存储介质 | |
CN111179960A (zh) | 音频信号处理方法及装置、存储介质 | |
CN109256145B (zh) | 基于终端的音频处理方法、装置、终端和可读存储介质 | |
CN112201267A (zh) | 一种音频处理方法、装置、电子设备及存储介质 | |
CN112037825B (zh) | 音频信号的处理方法及装置、存储介质 | |
CN113241089A (zh) | 语音信号增强方法、装置及电子设备 | |
CN111292761B (zh) | 语音增强方法及装置 | |
CN114040309B (zh) | 风噪检测方法、装置、电子设备及存储介质 | |
CN112951262B (zh) | 音频录制方法及装置、电子设备及存储介质 | |
CN111667842B (zh) | 音频信号处理方法及装置 | |
CN112863537B (zh) | 一种音频信号处理方法、装置及存储介质 | |
CN110580910A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
CN113077808B (zh) | 一种语音处理方法、装置和用于语音处理的装置 | |
CN113345461A (zh) | 一种语音处理方法、装置和用于语音处理的装置 | |
CN113190207A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN111613239A (zh) | 音频去噪方法和装置、服务器、存储介质 | |
CN113362848B (zh) | 音频信号处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |