CN110875054A - 一种远场噪声抑制方法、装置和*** - Google Patents

一种远场噪声抑制方法、装置和*** Download PDF

Info

Publication number
CN110875054A
CN110875054A CN201811012141.XA CN201811012141A CN110875054A CN 110875054 A CN110875054 A CN 110875054A CN 201811012141 A CN201811012141 A CN 201811012141A CN 110875054 A CN110875054 A CN 110875054A
Authority
CN
China
Prior art keywords
noise
energy
voice
obtaining
far
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811012141.XA
Other languages
English (en)
Other versions
CN110875054B (zh
Inventor
余涛
银鞍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811012141.XA priority Critical patent/CN110875054B/zh
Publication of CN110875054A publication Critical patent/CN110875054A/zh
Application granted granted Critical
Publication of CN110875054B publication Critical patent/CN110875054B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开一种远场噪声抑制方法,以及一种远场噪声抑制装置和***。其中,远场噪声抑制方法包括:根据获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束,获得语音波束的能量和噪声波束的能量,对语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,根据该双路噪声能量和语音波束的能量,获得用于消除非平稳噪声的第一参数,根据该第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。通过在语音波束的基础上,进一步的结合噪声波束对语音信号中的非平稳噪声做出准确的估计,实现了非平稳噪声的消除,从而能够在复杂环境下提高远场语音识别的准确率。

Description

一种远场噪声抑制方法、装置和***
技术领域
本申请涉及远场语音信号处理领域,具体涉及一种远场噪声抑制方法。本申请同时涉及一种远场噪声抑制装置和***。
背景技术
随着人工智能技术的不断发展,作为一项人机交互的关键技术,远场语音识别正变的越来越重要,人们希望机器能够听懂人类的语音指令,从而实现对机器的控制。尽管语音识别技术在过去几十年里取得了飞速的发展,但是,目前的远场语音识别对环境的依赖性依然较强,大量的环境噪声也使得远场语音识别的准确性严重下降。随着语音通信设备的应用场景(例如,商场、车站、街道等)越来越多,伴随语音信号的噪声信号类型也越来越多,这其中不仅存在大量的平稳噪声信号也存在大量的非平稳噪声信号。这就要求对语音信号进行噪声估计的方法需具备更好的适应能力,对语音信号中的噪声做出准确的估计,从而抑制远场语音信号中的噪声信号。
为了解决上述问题,本领域中现有技术,通常是利用单路噪声估计方法对语音信号中的噪声进行估计,从而能够在一定程度上消除语音识别过程中的噪声信号,提高语音信号识别的准确率。但是,单路噪声估计方法也暴露出以下缺陷:由于仅仅以一路目标语音波束作为依据,噪声估计存在一定的局限性,进而仍然不能很好的消除噪音,尤其是在复杂的环境噪声中,对噪声估计的可靠性较低,对噪声估计结果的不准确,从而导致远场语音识别准确率较低。
发明内容
本申请提供一种远场噪声抑制方法,以解决现有技术在复杂的环境噪声中,对噪声估计的可靠性较低,对噪声估计结果的不准确的问题。本申请另外提供一种远场噪声抑制装置和***。
本申请提供的一种远场噪声抑制方法,包括:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
可选的,所述的远场噪声抑制方法还包括:
对所述语音波束进行单路噪声估计,获得单路噪声能量,所述单路噪声能量为平稳噪声的能量;
根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量;
根据所述综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数;
根据所述第二参数对所述语音波束进行滤波处理,获得第二增强语音数据。
可选的,所述第一参数为用于抑制非平稳噪声数据的第一维纳滤波系数;
所述第二参数为用于抑制平稳噪声数据和非平稳噪声数据的第二维纳滤波系数。
可选的,所述获得语音波束的能量和噪声波束的能量,具体包括:获得第一时间点的语音波束的能量和第一时间点的噪声波束的能量;
所述对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,具体包括:
根据所述第一时间点的语音波束的能量和所述第一时间点的噪声波束的能量的比对结果,获得第一时间点上语音波束出现的概率;
根据所述第一时间点上语音波束出现的概率,获得双路噪声能量。
可选的,所述获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束,具体包括:
获取所述第一麦克风和第二麦克风的位置信息,以及所述第一麦克风和第二麦克风之间的距离值;
根据所述位置信息和距离值,获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束。
可选的,所述的远场噪声抑制方法还包括:
获得所述第一时间点上语音波束出现的概率;
根据所述第一时间点上语音波束出现的概率,确定所述第一麦克风在第一时间点的平滑因子。
可选的,所述根据所述第一时间点上语音波束出现的概率,获得双路噪声能量,具体包括::
根据所述第一时间点上语音波束出现的概率,确定所述第一麦克风在第一时间点的平滑因子;
根据所述第一时间点的平滑因子和所述第一时间点的语音波束的能量,确定双路噪声能量。
可选的,所述根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量,具体包括:
获得噪声综合分析算法:
Figure BDA0001785352720000031
其中,
Figure BDA0001785352720000032
为所述单路噪声能量,
Figure BDA0001785352720000033
为所述双路噪声能量,α为所述语音波束的能量,J为所述综合噪声能量;
将所述双路噪声能量和单路噪声能量与所述语音波束的能量输入到所述噪声综合分析算法进行噪声综合分析,获得综合噪声能量。
可选的,所述根据所述综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数,具体包括:
获得所述语音波束能量与所述噪声综合能量和所述语音波束能量的比值;
根据所述比值,确定所述用于消除非平稳噪声和平稳噪声的第二参数;
其中,所述比值为:g=语音波束能量/(语音波束能量+噪声综合能量),其中g为所述第二参数。
可选的,所述对所述语音波束进行单路噪声估计,获得单路噪声能量,具体包括:
对所述语音波束进行初步估计,获得所述语音波束的最小值;
根据所述语音波束的最小值,获得所述语音波束出现的概率;
根据所述语音波束出现的概率,利用递归平均来估计单路噪声的能量。
相应的,本申请还提供一种远场噪声抑制装置,包括:
获取单元,用于获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
第一获得单元,用于根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
第一分析单元,用于对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
第二获得单元,用于根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
第一处理单元,用于根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
可选的,所述的远场噪声抑制装置还包括:
第三获得单元,用于对所述语音波束进行单路噪声估计,获得单路噪声能量,所述单路噪声能量为平稳噪声的能量;
第二分析单元,用于根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量;
第四获得单元,用于根据所述综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数;
第二处理单元,用于根据所述第二参数对所述语音波束进行滤波处理,获得第二增强语音数据。
可选的,所述第一参数为用于抑制非平稳噪声数据的第一维纳滤波系数;
所述第二参数为用于抑制平稳噪声数据和非平稳噪声数据的第二维纳滤波系数。
可选的,所述获得语音波束的能量和噪声波束的能量,具体包括:获得第一时间点的语音波束的能量和第一时间点的噪声波束的能量;
所述对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,具体包括:
根据所述第一时间点的语音波束的能量和所述第一时间点的噪声波束的能量的比对结果,获得第一时间点上语音波束出现的概率;
根据所述第一时间点上语音波束出现的概率,获得双路噪声能量。
可选的,所述获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束,具体包括:
获取所述第一麦克风和第二麦克风的位置信息,以及所述第一麦克风和第二麦克风之间的距离值;
根据所述位置信息和距离值,获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束。
可选的,所述的远场噪声抑制装置还包括:
获得所述第一时间点上语音波束出现的概率;
根据所述第一时间点上语音波束出现的概率,确定所述第一麦克风在第一时间点的平滑因子。
可选的,所述根据所述第一时间点上语音波束出现的概率,获得双路噪声能量,具体包括::
根据所述第一时间点上语音波束出现的概率,确定所述第一麦克风在第一时间点的平滑因子;
根据所述第一时间点的平滑因子和所述第一时间点的语音波束的能量,确定双路噪声能量。
可选的,所述根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量,具体包括:
获得噪声综合分析算法:
Figure BDA0001785352720000051
其中,
Figure BDA0001785352720000052
为所述单路噪声能量,
Figure BDA0001785352720000053
为所述双路噪声能量,α为所述语音波束的能量,J为所述综合噪声能量;
将所述双路噪声能量和单路噪声能量与所述语音波束的能量输入到所述噪声综合分析算法进行噪声综合分析,获得综合噪声能量。
可选的,所述根据所述综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数,具体包括:
获得所述语音波束能量与所述噪声综合能量和所述语音波束能量的比值;
根据所述比值,确定所述用于消除非平稳噪声和平稳噪声的第二参数;
其中,所述比值为:g=语音波束能量/(语音波束能量+噪声综合能量),其中g为所述第二参数。
可选的,所述对所述语音波束进行单路噪声估计,获得单路噪声能量,具体包括:
对所述语音波束进行初步估计,获得所述语音波束的最小值;
根据所述语音波束的最小值,获得所述语音波束出现的概率;
根据所述语音波束出现的概率,利用递归平均来估计单路噪声的能量。
相应的,本申请还提供一种远场噪声抑制***,包括:上述技术方案任意一项所述的远场噪声抑制装置。
相应的,本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储远场噪声抑制方法的程序,该设备通电并通过所述处理器运行该远场噪声抑制方法的程序后,执行下述步骤:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
相应的,本申请还提供一种存储设备,存储有远场噪声抑制方法的程序,该程序被处理器运行,执行下述步骤:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
与现有技术相比,本申请具有以下优点:
本申请提供一种远场噪声抑制方法,具体而言是一种复杂环境下的远场噪声抑制方法。通过获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束,根据语音波束和噪声波束,获得语音波束的能量和噪声波束的能量,对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,双路噪声能量为非平稳噪声的能量,根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数,根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。通过在语音波束的基础上,进一步的结合噪声波束对语音信号中的非平稳噪声做出准确的估计,实现了非平稳噪声的消除,从而能够在复杂环境下提高远场语音识别的准确率。
附图说明
图1为本申请的远场噪声抑制方法的实施例流程图;
图2为本申请的远场噪声抑制装置的实施例示意图;
图3为本申请的远场噪声抑制电子设备的实施例示意图;
图4为本申请的远场噪声抑制***的实施例工作流程图;
图5为本申请对平稳噪声和非平稳噪声进行抑制的方法的实施例流程图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此,本申请不受下面公开的具体实施的限制。
下面基于本申请远场噪声抑制方法,对其实施例进行详细描述。此外,在下面的描述中,将分别针对本方法的各个步骤进行详细的说明。请参考图1所示,其为本申请的远场噪声抑制方法的实施例流程图。
步骤S101:获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束。
在人们进行远场语音识别过程中,需要通过多麦克风阵列来采集语音数据,然后对所采集到的语音数据做进一步处理,从而准确识别远场语音数据。然而在实际的语音数据采集过程中,由于背景噪声的干扰,导致采集到的语音信号数据往往夹杂着大量的非平稳噪声数据,进而无法满足使用要求。为此,在本实施例中提供一种使用语音增强的方式来消除语音信号中的噪声数据的具体方法,其中,若要实现对复杂背景噪声环境下的非平稳噪声进行有效的抑制,首先需要通过第一麦克风采集语音波束,在语音波束的基础上,进一步利用第二麦克风采集噪声波束进行双路噪声估计,从而实现对非平稳噪声的跟踪和消除。需要说明的是,本实施例采用经典的波束形成方法MVDR/LCMV生成所述语音波束和噪声波束,其中,语音波束系数产生的约束条件为:
wspeech=arminw(wHRNNw),s.t wHa(θ)=1
所述噪声波束是根据噪声波束的系数获得的,噪音波束系数产生自如下约束条件:
Figure BDA0001785352720000081
其中,RNN为噪声相关矩阵,a(θ)为目标语音方向θ对应的导向矢量。
步骤S102:根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量。
在本实施例中,双路噪声估计方法的主要过程为:通过通道间相同帧、相同频点能量差异性来判当前帧中频点处语音波束的存在概率,根据语音波束的存在概率,确定平滑因子,并结合麦克风采集的包含噪音信号的语音频谱信息,进行噪声估计。当确定频点处不存在语音波束时,噪声估计的结果实时更新,将当前帧的能量值作为对当前帧噪声估计的结果,当确定频点处存在语音时,噪声估计的结果则由当前帧的前一帧噪声估计的结果。其中,在本实施例中所述的根据语音波束和噪声波束,获得的语音波束的能量和噪声波束的能量具体为,第一时间点的语音波束的能量和第一时间点的噪声波束的能量。在获得第一时间点的语音波束的能量和第一时间点的噪声波束的能量之后,进一步的对第一时间点的语音波束的能量和第一时间点的噪声波束的能量进行对比分析,获得第一时间点上语音波束出现的概率,根据第一时间点上语音波束出现的概率,进而获得双路噪声能量。
步骤S103:对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量。
在本实施例中,对语音波束的能量和噪声波束的能量进行对比分析的具体过程为:假设第一时间点的时刻为t,按照下述公式获得所述第一时间点上语音波束出现的概率:
Figure BDA0001785352720000082
其中,atan为反正切函数,
Figure BDA0001785352720000083
为所述第一时间点的语音波束的能量,
Figure BDA0001785352720000084
所述第一时间点的噪声波束的能量,P(t)为所述第一时间点上语音波束出现的概率。
进一步的,按照下述公式获得所述双路噪声能量:
Figure BDA0001785352720000091
其中,γ为平滑因子;
Figure BDA0001785352720000092
为所述单路噪声能量,
Figure BDA0001785352720000093
为所述双路噪声能量,t为所述的第一时间点。
需要说明的是,本实施例中所述的双路噪声的能量为非平稳噪声的能量。
步骤S104:根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数。
在本实施例中,所述的第一参数为用于抑制非平稳噪声数据的第一维纳滤波系数,根据双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数,具体包括:获得维纳滤波系数的求解公式:g=语音波束能量/(语音波束能量+噪声能量),其中g为所述获得的第一维纳增强系数吗,将双路噪声能量和语音波束的能量输入到维纳滤波系数的求导公式,从而获得用于抑制非平稳噪声数据的第一维纳滤波系数。
步骤S105:根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
在本实施例中,根据第一维纳增强系数对语音波束进行滤波处理,具体过程为获得维纳滤波处理过程算法公式:s=g*y,其中g为所述第一维纳滤波系数,y为消除非平稳噪声前的语音数据,s为消除非平稳噪声之后的语音数据。将第一维纳增强系数对所述语音波束输入到所述维纳滤波处理过程算法公式,获得抑制非平稳噪声数据后的第一增强语音数据。
另外,本申请实施例还提供一种优选的实施方式,请参考图5所示,其为本申请对平稳噪声和非平稳噪声进行抑制的方法的实施例流程图。
在上述实施例抑制非平稳噪声的基础上,该优选的实施例进一步的对单路语音波束进行单路噪声估计,获得单路噪声能量。其中,该单路噪声能量为平稳噪声的能量。根据上述获得的双路噪声能量、单路噪声能量和所述的语音波束的能量进行噪声综合分析,获得综合噪声能量,从而根据综合噪声能量,获得用于消除非平稳噪声和平稳噪声的第二参数,通过该第二参数对待识别的语音波束进行滤波处理,获得第二增强语音数据。其中,上述第二参数为用于抑制平稳噪声数据和非平稳噪声数据的第二维纳滤波系数。
需要说明的是,所述对语音波束进行单路噪声估计,获得单路噪声能量,具体包括:利用最小值跟踪法对语音波束进行初步估计,获得语音波束的最小值,通过语音波束的最小值,获得语音波束出现的概率,根据所述语音波束出现的概率,利用递归平均来估计获得单路噪声的能量。
所述根据双路噪声能量、单路噪声能量和语音波束的能量进行噪声综合分析过程,具体包括:获得噪声综合分析算法:
Figure BDA0001785352720000101
其中,
Figure BDA0001785352720000102
为所述单路噪声能量,
Figure BDA0001785352720000103
为所述双路噪声能量,α为所述语音波束的能量,J为所述综合噪声能量,将双路噪声能量和单路噪声能量与语音波束的能量输入到噪声综合分析算法进行噪声综合分析,获得综合噪声能量,从而实现对非平稳噪声和平稳噪声的同时消除,从而进一步提升语音识别额准确率。
本申请提供一种远场噪声抑制方法,具体而言是一种复杂环境下的远场噪声抑制方法。通过获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束,根据语音波束和噪声波束,获得语音波束的能量和噪声波束的能量,对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,双路噪声能量为非平稳噪声的能量,根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数,根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。在语音波束的基础上,进一步的结合噪声波束对语音信号中的非平稳噪声做出准确的估计,实现非平稳噪声的消除,从而能够在复杂环境下提高远场语音识别的准确率。
与上述的远场噪声抑制方法相对应,本申请还提供一种远场噪声抑制装置,上述远场噪声抑制方法可以应用于该装置,请参见图2所示,其为本申请的远场噪声抑制装置的实施例示意图。由于本装置实施例相似于方法实施例,所以描述的比较简单,相关之处请参见***实施例部分说明即可,下面描述装置实施例仅是示意性的。
获取单元201,用于获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束。
在本实施例中提供一种使用语音增强的方式来消除语音信号中的噪声数据的具体方法,其中,若要实现对复杂背景噪声环境下的非平稳噪声进行有效的抑制,首先需要通过第一麦克风采集语音波束,在语音波束的基础上,进一步利用第二麦克风采集噪声波束进行双路噪声估计,从而实现对非平稳噪声的跟踪和消除。需要说明的是,本实施例是采用经典的波束形成方法MVDR/LCMV生成所述的语音波束和噪声波束,其中,语音波束系数产生自如下约束条件:
wspeech=arminw(wHRNNw),s.t wHa(θ)=1
所述噪声波束是根据噪声波束的系数获得的,噪音波束系数产生自如下约束条件:
Figure BDA0001785352720000111
其中RNN为噪声相关矩阵,a(θ)为目标语音方向θ对应的导向矢量。
第一获得单元202,用于根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量。
在本实施例中,所述的根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量具体为,获得第一时间点的语音波束的能量和第一时间点的噪声波束的能量,然后对第一时间点的语音波束的能量和第一时间点的噪声波束的能量进行对比分析,获得第一时间点上语音波束出现的概率,根据第一时间点上语音波束出现的概率,进而获得双路噪声能量。
第一分析单元203,用于对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量。
在本实施例中,对所述语音波束的能量和噪声波束的能量进行对比分析的具体过程为,假设第一时间点的时刻为t,按照下述公式获得所述第一时间点上语音波束出现的概率:
Figure BDA0001785352720000112
其中,atan为反正切函数,
Figure BDA0001785352720000113
为所述第一时间点的语音波束的能量,
Figure BDA0001785352720000114
所述第一时间点的噪声波束的能量,P(t)为所述第一时间点上语音波束出现的概率。
进一步的,按照下述公式获得所述双路噪声能量:
Figure BDA0001785352720000115
其中,γ为平滑因子;
Figure BDA0001785352720000116
为所述单路噪声能量,
Figure BDA0001785352720000117
为所述双路噪声能量,t为所述第一时间点。
需要说明的是,本实施例中所述的双路噪声的能量为非平稳噪声的能量。
第二获得单元204,用于根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数。
在本实施例中,所述的第一参数为用于抑制非平稳噪声数据的第一维纳滤波系数,根据所述双路噪声能量和所述语音波束的能量的具体过程为,获得维纳滤波系数的求解公式:g=语音波束能量/(语音波束能量+噪声能量),其中g为所述获得的第一维纳增强系数吗,将双路噪声能量和语音波束的能量输入到维纳滤波系数的求导公式,从而获得用于抑制非平稳噪声数据的第一维纳滤波系数。
第一处理单元205,用于根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
在本实施例中,根据第一维纳增强系数对语音波束进行滤波处理,具体过程为获得维纳滤波处理过程算法公式:s=g*y,其中g为所述第一维纳滤波系数,y为消除非平稳噪声前的语音数据,s为消除非平稳噪声之后的语音数据。将第一维纳增强系数对所述语音波束输入到所述维纳滤波处理过程算法公式,获得抑制非平稳噪声数据后的第一增强语音数据。
另外,本申请实施例还提供一种优选的实施方式,请参考图5所示,其为本申请对平稳噪声和非平稳噪声进行抑制的方法的实施例流程图。
在上述实施例抑制非平稳噪声的基础上,该优选的实施例进一步的对单路语音波束进行单路噪声估计,获得单路噪声能量。其中,该单路噪声能量为平稳噪声的能量。根据上述获得的双路噪声能量、单路噪声能量和所述的语音波束的能量进行噪声综合分析,获得综合噪声能量,从而根据综合噪声能量,获得用于消除非平稳噪声和平稳噪声的第二参数,通过该第二参数对待识别的语音波束进行滤波处理,获得第二增强语音数据。其中,上述第二参数为用于抑制平稳噪声数据和非平稳噪声数据的第二维纳滤波系数。
需要说明的是,所述对语音波束进行单路噪声估计,获得单路噪声能量,具体包括:利用最小值跟踪法对语音波束进行初步估计,获得语音波束的最小值,通过语音波束的最小值,获得语音波束出现的概率,根据所述语音波束出现的概率,利用递归平均来估计获得单路噪声的能量。
与上述的远场噪声抑制装置相对应,本申请还提供一种远场噪声抑制***,上述远场噪声抑制装置可以应用于该***,请参见图4所示,其为本申请的远场噪声抑制***的实施例工作流程图。由于本***实施例相似于装置实施例,所以描述的比较简单,相关之处请参见***实施例部分说明即可,下面描述装置实施例仅是示意性的。
在本实施例中,远场噪声抑制***若要对远场噪声数据抑制,首先需要对多通道远场语音数据进行解混响处理,选取其中个通道的数据送入端点检测模块,得到对噪声数据和语音数据起止时间的估计,进一步的将去混响之后的多通道数据送入声源定位模块,得到发音人位置信息,同时,将去混响之后的多通道数据,连同端点检测信息和角度信息一起进行波束形成处理,得到语音波束和噪声波束两个音频流,其中所述的第一麦克风采集语音波束,第二麦克风采集噪声波束,将采集到的语音波束和噪声波束两个音频流进行噪声估计,从而对噪声数据进行抑制,进而得到处理后“干净”的语音。
与上述提供的一种记录数据库信息的方法相对应的,本申请实施例还提供一种远场噪声抑制的电子设备,包括:处理器以及存储器,所述的存储器具体用于存储远场噪声抑制方法的程序,该设备通电并通过所述处理器运行该远场噪声抑制方法的程序后,执行下述步骤:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
需要说明的是,对于本申请实施例提供的一种电子设备的详细描述,可以参考对本申请实施例提供的一种远场噪声抑制方法的相关描述,这里不再赘述。
与上述提供的一种记录数据库信息的方法相对应的,本申请实施例还提供一种远场噪声抑制的存储设备,包括:上述实施例所述的远场噪声抑制方法。
在该存储设备中存储有远场噪声抑制方法的程序,该程序被处理器运行,执行下述步骤:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
需要说明的是,对于本申请实施例提供的一种存储设备的详细描述,可以参考对本申请实施例提供的一种远场噪声抑制方法的相关描述,这里不再赘述。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

Claims (23)

1.一种远场噪声抑制方法,其特征在于,包括:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
2.根据权利要求1所述的远场噪声抑制方法,其特征在于,还包括:
对所述语音波束进行单路噪声估计,获得单路噪声能量,所述单路噪声能量为平稳噪声的能量;
根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量;
根据所述综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数;
根据所述第二参数对所述语音波束进行滤波处理,获得第二增强语音数据。
3.根据权利要求2所述的远场噪声抑制方法,其特征在于,所述第一参数为用于抑制非平稳噪声数据的第一维纳滤波系数;
所述第二参数为用于抑制平稳噪声数据和非平稳噪声数据的第二维纳滤波系数。
4.根据权利要求1所述的远场噪声抑制方法,其特征在于,所述获得语音波束的能量和噪声波束的能量,具体包括:获得第一时间点的语音波束的能量和第一时间点的噪声波束的能量;
所述对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,具体包括:
根据所述第一时间点的语音波束的能量和所述第一时间点的噪声波束的能量的比对结果,获得第一时间点上语音波束出现的概率;
根据所述第一时间点上语音波束出现的概率,获得双路噪声能量。
5.根据权利要求1所述的远场噪声抑制方法,其特征在于,所述获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束,具体包括:
获取所述第一麦克风和第二麦克风的位置信息,以及所述第一麦克风和第二麦克风之间的距离值;
根据所述位置信息和距离值,获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束。
6.根据权利要求4所述的远场噪声抑制方法,其特征在于,还包括:
获得所述第一时间点上语音波束出现的概率;
根据所述第一时间点上语音波束出现的概率,确定所述第一麦克风在第一时间点的平滑因子。
7.根据权利要求6所述的远场噪声抑制方法,其特征在于,所述根据第一时间点上语音波束出现的概率,获得双路噪声能量,具体包括::
根据所述第一时间点上语音波束出现的概率,确定所述第一麦克风在第一时间点的平滑因子;
根据所述第一时间点的平滑因子和所述第一时间点的语音波束的能量,确定双路噪声能量。
8.根据权利要求2所述的远场噪声抑制方法,其特征在于,所述根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量,具体包括:
获得噪声综合分析算法:
Figure FDA0001785352710000021
其中,
Figure FDA0001785352710000022
为所述单路噪声能量,
Figure FDA0001785352710000023
为所述双路噪声能量,α为所述语音波束的能量,J为所述综合噪声能量;
将所述双路噪声能量和单路噪声能量与所述语音波束的能量输入到所述噪声综合分析算法进行噪声综合分析,获得综合噪声能量。
9.根据权利要求2所述的远场噪声抑制方法,其特征在于,所述根据综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数,具体包括:
获得所述语音波束能量与所述噪声综合能量和所述语音波束能量的比值;
根据所述比值,确定所述用于消除非平稳噪声和平稳噪声的第二参数;
其中,所述比值为:g=语音波束能量/(语音波束能量+噪声综合能量),其中g为所述第二参数。
10.根据权利要求2所述的远场噪声抑制方法,其特征在于,所述对所述语音波束进行单路噪声估计,获得单路噪声能量,具体包括:
对所述语音波束进行初步估计,获得所述语音波束的最小值;
根据所述语音波束的最小值,获得所述语音波束出现的概率;
根据所述语音波束出现的概率,利用递归平均来估计单路噪声的能量。
11.一种远场噪声抑制装置,其特征在于,包括:
获取单元,用于获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
第一获得单元,用于根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
第一分析单元,用于对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
第二获得单元,用于根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
第一处理单元,用于根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
12.根据权利要求11所述的远场噪声抑制装置,其特征在于,还包括:
第三获得单元,用于对所述语音波束进行单路噪声估计,获得单路噪声能量,所述单路噪声能量为平稳噪声的能量;
第二分析单元,用于根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量;
第四获得单元,用于根据所述综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数;
第二处理单元,用于根据所述第二参数对所述语音波束进行滤波处理,获得第二增强语音数据。
13.根据权利要求12所述的远场噪声抑制装置,其特征在于,所述第一参数为用于抑制非平稳噪声数据的第一维纳滤波系数;
所述第二参数为用于抑制平稳噪声数据和非平稳噪声数据的第二维纳滤波系数。
14.根据权利要求11所述的远场噪声抑制装置,其特征在于,所述获得语音波束的能量和噪声波束的能量,具体包括:获得第一时间点的语音波束的能量和第一时间点的噪声波束的能量;
所述对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,具体包括:
根据所述第一时间点的语音波束的能量和所述第一时间点的噪声波束的能量的比对结果,获得第一时间点上语音波束出现的概率;
根据所述第一时间点上语音波束出现的概率,获得双路噪声能量。
15.根据权利要求11所述的远场噪声抑制装置,其特征在于,所述获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束,具体包括:
获取所述第一麦克风和第二麦克风的位置信息,以及所述第一麦克风和第二麦克风之间的距离值;
根据所述位置信息和距离值,获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束。
16.根据权利要求14所述的远场噪声抑制装置,其特征在于,还包括:
获得所述第一时间点上语音波束出现的概率;
根据所述第一时间点上语音波束出现的概率,确定所述第一麦克风在第一时间点的平滑因子。
17.根据权利要求16所述的远场噪声抑制装置,其特征在于,所述根据第一时间点上语音波束出现的概率,获得双路噪声能量,具体包括::
根据所述第一时间点上语音波束出现的概率,确定所述第一麦克风在第一时间点的平滑因子;
根据所述第一时间点的平滑因子和所述第一时间点的语音波束的能量,确定双路噪声能量。
18.根据权利要求12所述的远场噪声抑制装置,其特征在于,所述根据双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量,具体包括:
获得噪声综合分析算法:
Figure FDA0001785352710000041
其中,
Figure FDA0001785352710000051
为所述单路噪声能量,
Figure FDA0001785352710000052
为所述双路噪声能量,α为所述语音波束的能量,J为所述综合噪声能量;
将所述双路噪声能量和单路噪声能量与所述语音波束的能量输入到所述噪声综合分析算法进行噪声综合分析,获得综合噪声能量。
19.根据权利要求12所述的远场噪声抑制装置,其特征在于,所述根据所述综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数,具体包括:
获得所述语音波束能量与所述噪声综合能量和所述语音波束能量的比值;
根据所述比值,确定所述用于消除非平稳噪声和平稳噪声的第二参数;
其中,所述比值为:g=语音波束能量/(语音波束能量+噪声综合能量),其中g为所述第二参数。
20.根据权利要求12所述的远场噪声抑制装置,其特征在于,所述对所述语音波束进行单路噪声估计,获得单路噪声能量,具体包括:
对所述语音波束进行初步估计,获得所述语音波束的最小值;
根据所述语音波束的最小值,获得所述语音波束出现的概率;
根据所述语音波束出现的概率,利用递归平均来估计单路噪声的能量。
21.一种远场噪声抑制***,其特征在于,包括:上述权利要求11-20任意一项所述的远场噪声抑制装置。
22.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储远场噪声抑制方法的程序,该设备通电并通过所述处理器运行该远场噪声抑制方法的程序后,执行下述步骤:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
23.一种存储设备,其特征在于,存储有远场噪声抑制方法的程序,该程序被处理器运行,执行下述步骤:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
CN201811012141.XA 2018-08-31 2018-08-31 一种远场噪声抑制方法、装置和*** Active CN110875054B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811012141.XA CN110875054B (zh) 2018-08-31 2018-08-31 一种远场噪声抑制方法、装置和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811012141.XA CN110875054B (zh) 2018-08-31 2018-08-31 一种远场噪声抑制方法、装置和***

Publications (2)

Publication Number Publication Date
CN110875054A true CN110875054A (zh) 2020-03-10
CN110875054B CN110875054B (zh) 2023-07-25

Family

ID=69715316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811012141.XA Active CN110875054B (zh) 2018-08-31 2018-08-31 一种远场噪声抑制方法、装置和***

Country Status (1)

Country Link
CN (1) CN110875054B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696567A (zh) * 2020-06-12 2020-09-22 苏州思必驰信息科技有限公司 用于远场通话的噪声估计方法及***
CN111968615A (zh) * 2020-08-31 2020-11-20 Oppo广东移动通信有限公司 降噪处理方法及装置、终端设备和可读存储介质
CN112037825A (zh) * 2020-08-10 2020-12-04 北京小米松果电子有限公司 音频信号的处理方法及装置、存储介质
WO2022143522A1 (zh) * 2020-12-31 2022-07-07 维沃移动通信有限公司 音频信号处理方法、装置和电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009051959A1 (en) * 2007-10-18 2009-04-23 Motorola, Inc. Robust two microphone noise suppression system
CN101964934A (zh) * 2010-06-08 2011-02-02 浙江大学 二元麦克风微阵列语音波束形成方法
CN102456351A (zh) * 2010-10-14 2012-05-16 清华大学 一种语音增强的***
WO2012091643A1 (en) * 2010-12-29 2012-07-05 Telefonaktiebolaget L M Ericsson (Publ) A noise suppressing method and a noise suppressor for applying the noise suppressing method
CN102938254A (zh) * 2012-10-24 2013-02-20 中国科学技术大学 一种语音信号增强***和方法
CN102969002A (zh) * 2012-11-28 2013-03-13 厦门大学 一种可抑制移动噪声的麦克风阵列语音增强装置
CN107017003A (zh) * 2017-06-02 2017-08-04 厦门大学 一种麦克风阵列远场语音增强装置
CN107316649A (zh) * 2017-05-15 2017-11-03 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法及装置
US20180033447A1 (en) * 2016-08-01 2018-02-01 Apple Inc. Coordination of beamformers for noise estimation and noise suppression

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009051959A1 (en) * 2007-10-18 2009-04-23 Motorola, Inc. Robust two microphone noise suppression system
CN101964934A (zh) * 2010-06-08 2011-02-02 浙江大学 二元麦克风微阵列语音波束形成方法
CN102456351A (zh) * 2010-10-14 2012-05-16 清华大学 一种语音增强的***
WO2012091643A1 (en) * 2010-12-29 2012-07-05 Telefonaktiebolaget L M Ericsson (Publ) A noise suppressing method and a noise suppressor for applying the noise suppressing method
CN103380456A (zh) * 2010-12-29 2013-10-30 瑞典爱立信有限公司 噪声抑制方法和应用噪声抑制方法的噪声抑制器
CN102938254A (zh) * 2012-10-24 2013-02-20 中国科学技术大学 一种语音信号增强***和方法
CN102969002A (zh) * 2012-11-28 2013-03-13 厦门大学 一种可抑制移动噪声的麦克风阵列语音增强装置
US20180033447A1 (en) * 2016-08-01 2018-02-01 Apple Inc. Coordination of beamformers for noise estimation and noise suppression
CN107316649A (zh) * 2017-05-15 2017-11-03 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法及装置
CN107017003A (zh) * 2017-06-02 2017-08-04 厦门大学 一种麦克风阵列远场语音增强装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696567A (zh) * 2020-06-12 2020-09-22 苏州思必驰信息科技有限公司 用于远场通话的噪声估计方法及***
CN111696567B (zh) * 2020-06-12 2022-04-01 思必驰科技股份有限公司 用于远场通话的噪声估计方法及***
CN112037825A (zh) * 2020-08-10 2020-12-04 北京小米松果电子有限公司 音频信号的处理方法及装置、存储介质
CN111968615A (zh) * 2020-08-31 2020-11-20 Oppo广东移动通信有限公司 降噪处理方法及装置、终端设备和可读存储介质
WO2022143522A1 (zh) * 2020-12-31 2022-07-07 维沃移动通信有限公司 音频信号处理方法、装置和电子设备

Also Published As

Publication number Publication date
CN110875054B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN110875054A (zh) 一种远场噪声抑制方法、装置和***
EP3189521B1 (en) Method and apparatus for enhancing sound sources
US20030177007A1 (en) Noise suppression apparatus and method for speech recognition, and speech recognition apparatus and method
US8712074B2 (en) Noise spectrum tracking in noisy acoustical signals
US20040230428A1 (en) Method and apparatus for blind source separation using two sensors
JP2005157354A (ja) 複数感知の音声強調のための方法および機器
JP2006087082A (ja) 多感覚音声強調のための方法および装置
US8296135B2 (en) Noise cancellation system and method
JP2011191423A (ja) 発話認識装置、発話認識方法
CN112216295B (zh) 一种声源定位方法、装置及设备
CN105103230B (zh) 信号处理装置、信号处理方法、信号处理程序
US9875748B2 (en) Audio signal noise attenuation
EP2745293B1 (en) Signal noise attenuation
JP4051325B2 (ja) 話者位置検出方法、装置、プログラム、および記録媒体
Nakatani et al. Simultaneous denoising, dereverberation, and source separation using a unified convolutional beamformer
US20230088989A1 (en) Method and system to improve voice separation by eliminating overlap
CN113707149A (zh) 音频处理方法和装置
CN113744752A (zh) 语音处理方法及装置
KR101424327B1 (ko) 잡음 제거 장치 및 방법
KR101096091B1 (ko) 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법
KR100413797B1 (ko) 음성 신호 보상 방법 및 그 장치
US20240212701A1 (en) Estimating an optimized mask for processing acquired sound data
CN117351925B (zh) 啸叫抑制方法、装置、电子设备和存储介质
Bharathi et al. Speaker verification in a noisy environment by enhancing the speech signal using various approaches of spectral subtraction
KR101051035B1 (ko) 음성 향상을 위한 2차 조건 사후최대확률 기반 광역연판정 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024971

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant