CN110797041B - 语音降噪处理方法、装置、计算机设备及存储介质 - Google Patents

语音降噪处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110797041B
CN110797041B CN201911000052.8A CN201911000052A CN110797041B CN 110797041 B CN110797041 B CN 110797041B CN 201911000052 A CN201911000052 A CN 201911000052A CN 110797041 B CN110797041 B CN 110797041B
Authority
CN
China
Prior art keywords
noise
frequency band
band signal
spectrum
modulation domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911000052.8A
Other languages
English (en)
Other versions
CN110797041A (zh
Inventor
肖强
肖全之
黄荣均
方桂萍
闫玉凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Jieli Technology Co Ltd
Original Assignee
Zhuhai Jieli Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Jieli Technology Co Ltd filed Critical Zhuhai Jieli Technology Co Ltd
Priority to CN201911000052.8A priority Critical patent/CN110797041B/zh
Publication of CN110797041A publication Critical patent/CN110797041A/zh
Priority to US17/770,717 priority patent/US20230230608A1/en
Priority to PCT/CN2020/119600 priority patent/WO2021078010A1/zh
Application granted granted Critical
Publication of CN110797041B publication Critical patent/CN110797041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)

Abstract

本申请涉及一种语音降噪处理方法、装置、计算机设备及存储介质。其中,语音降噪处理方法包括当检测到语音采集设备与目标物的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;获取低频带信号的幅度谱和相位谱;获取幅度谱对应的调制域信号;采用谱减法对调制域幅度谱或功率谱进行处理,得到降噪后的调制域幅度谱或功率谱;对调制域相位谱进行补偿,得到补偿后的调制域相位谱;基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。谱减法所采用的平滑过减因子避免了平滑过减因子过大导致语音消息消除过多的问题。

Description

语音降噪处理方法、装置、计算机设备及存储介质
技术领域
本申请涉及语音降噪技术领域,特别是涉及一种语音降噪处理方法、装置、计算机设备及存储介质。
背景技术
噪声对语音声学分析与特征中造成很大的影响,各种各样的噪声在语谱图中产生各种杂纹导致声学特征不能正确识别和分析。在语音传输***中,噪声会掩蔽语音而影响是否听清语音内容,过大的噪声会导致语音识别率下降。针对于噪声的干扰,需要进行语音降噪处理,降低噪声对语音的影响,突出语音的特点。
在实现过程中,发明人发现传统技术中至少存在如下问题:传统方法中,存在语音消息消除过多的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够避免语音消息消除过多的语音降噪处理方法、装置、计算机设备及存储介质。
为了实现上述目的,本发明实施例提供了一种语音降噪处理方法,包括步骤:
当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;
获取低频带信号的幅度谱和相位谱;
获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;
采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;
对调制域相位谱进行补偿,得到补偿后的调制域相位谱;
基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。
在其中一个实施例中,还包括步骤:
对含噪语音信号进行分频处理,得到高频带信号;
获取高频带信号的幅度谱和相位谱;
采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;
合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。
在其中一个实施例中,采用谱减法对调制域幅度谱或功率谱进行处理,得到降噪后的调制域幅度谱的步骤中,基于以下公式得到降噪后的调制域幅度谱:
Figure GDA0002325026800000021
Figure GDA0002325026800000022
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;|S(u,w,k)|为降噪后的调制域幅度谱;p是谱减法的类型,当p=1时使用的是调制域幅度谱谱减,当p=2时使用的是调制域功率谱谱减;当p=1时,|V(u,w,k)|p为估计的噪声调制域幅度谱,当p=2时,|V(u,w,k)|p为估计的噪声调制域功率谱;α(k)为调制域平滑过减因子;|YLF(u,w,k)|p为调制域幅度谱或功率谱;SNRpost(u,w,k)为调制域的后验信噪比;θ为平滑因子;α0为常数。
在其中一个实施例中,对调制域相位谱进行补偿,得到补偿后的调制域相位谱的步骤包括:
采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角调整,得到相位补偿;
或,采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角调整,得到相位补偿;
根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱。
在其中一个实施例中,采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:
Figure GDA0002325026800000031
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为相位补偿;
Figure GDA0002325026800000032
为反对称函数;ξ为常数;|V(u,w,k)|1为估计的噪声调制域幅度谱;
采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:
Figure GDA0002325026800000033
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为相位补偿;
Figure GDA0002325026800000034
为反对称函数;ξ为常数;|V(u,w,k)|2为估计的噪声调制域功率谱;
根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱的步骤中,基于以下公式,得到补偿后的相位谱:
angle[S(u,w,k)]=angle[YLF(u,w,k)]+Λ(u,w,k);
其中,angle[S(u,w,k)]为补偿后的相位谱;angle[YLF(u,w,k)]为调制域相位谱。
根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱的步骤中,基于以下公式,得到补偿后的相位谱:
angle[S(u,w,k)]=angle[YLF(u,w,k)]+Λ(u,w,k);
其中,angle[S(u,w,k)]为补偿后的相位谱;angle[YLF(u,w,k)]为调制域相位谱。
在其中一个实施例中,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号的步骤包括:
将降噪后的调制域幅度谱和补偿后的调制域相位谱依次进行傅里叶反变换和重叠相加处理,得到降噪后的低频带信号的幅度谱;
对降噪后的低频带信号的幅度谱和低频带信号相位谱依次进行傅里叶反变换处理和重叠相加处理,得到降噪后的低频带信号。
在其中一个实施例中,基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号的步骤包括:
对高频带信号的相位谱和降噪后的高频带信号的幅度谱依次进行傅里叶反变换处理和重叠相加,得到降噪后的低频带信号。
在其中一个实施例中,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱的步骤中,基于以下公式得到降噪后的高频带信号的幅度谱:
|S(u,w)|=|YHF(u,w)|H(u,w);
Figure GDA0002325026800000051
Figure GDA0002325026800000052
Figure GDA0002325026800000053
Figure GDA0002325026800000054
其中,|S(u,w)|为降噪后的高频带信号的幅度谱;H(u,w)为传递增益函数;|YHF(u,w)|为含噪语音高频带幅度谱;
Figure GDA0002325026800000055
为含噪语音高频带互功率谱;
Figure GDA0002325026800000056
为估计的高频带噪声互功率谱;i、j分别为两个语音采集设备采集的的高频带信号;
Figure GDA0002325026800000057
为修改后的后验信噪比;
Figure GDA0002325026800000058
为增益函数;g、b、h为常量;|Yi(u,w)Yj(u,w)|为高频带信号互幅度谱。
在其中一个实施例中,获取低频带信号的幅度谱和相位谱的步骤包括:
预处理低频带信号,得到平稳低频带信号;
采用傅里叶变换对平稳低频带信号进行处理,得到低频带信号的幅度谱和相位谱。
在其中一个实施例中,预处理低频带信号,得到平稳低频带信号的步骤包括:
对低频带信号依次进行分帧处理和加窗处理,得到平稳低频带信号。
在其中一个实施例中,获取高频带信号的幅度谱和相位谱的步骤包括:
预处理高频带信号,得到平稳高频带信号;
对平稳高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱和相位谱。
在其中一个实施例中,预处理高频带信号,得到平稳高频带信号的步骤包括:
对高频带信号依次进行分帧处理和加窗处理,得到平稳高频带信号。
在其中一个实施例中,获取幅度谱对应的调制域信号的步骤包括:
采用傅里叶变换对幅度谱进行处理,得到调制域信号。
在其中一个实施例中,对含噪语音信号进行分频处理,得到低频带信号的步骤包括:
对含噪语音信号进行无凸起低通滤波处理,得到低频带信号;
对含噪语音信号进行分频处理,得到高频带信号的步骤包括:
对含噪语音信号进行无凸起高通滤波处理,得到高频带信号。
本发明实施例还提供了一种语音降噪处理装置,包括:
语音信号获取模块,用于当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号;
低频滤波模块,用于对含噪语音信号进行分频处理,得到低频带信号;
低频带信号频谱获取模块,用于获取低频带信号的幅度谱和相位谱;
调制域信号获取模块,用于获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;
调制域幅度谱处理模块,用于采用谱减法对调制域幅度谱或者功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;
补偿模块,用于对调制域相位谱进行补偿,得到补偿后的调制域相位谱;
低频带信号降噪模块,用于基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。
在其中一个实施例中,语音降噪处理装置还包括:
高频滤波模块,用于对含噪语音信号进行分频处理,得到高频带信号;
高频带信号频谱获取模块,用于获取高频带信号的幅度谱和相位谱;
高频带信号降噪模块,用于采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;
合成模块,用于合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。
本发明实施例还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
上述技术方案中的一个技术方案具有如下优点和有益效果:
上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的语音信号在低频带存在强相关噪声,因此当语音采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号。通过获取低频带信号的幅度谱所对应的调制域信号,并对调制域信号进行处理,得到降噪后的语音信号。具体地,采用谱减法对调制域幅度谱或者所述调制域功率谱进行处理,得到降噪后的调制域幅度谱,在此过程中,谱减法所采用的平滑过减因子为根据调制域的后验信噪比和平滑因子得到。通过此种方式,即避免了平滑过减因子过大导致语音消息消除过多,又避免了过减因子过小使得抑制噪声能力不足,同时也不会产生相邻帧之间的突然变化,有效地提高了语音信号的质量。进一步地,对调制域相位谱进行补偿处理,得到补偿后的调制域相位谱,可以进一步地抑制语音信号的背景噪声,提高语音信号的质量。因此,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到的降噪后的低频带信号的噪声小,进而得到更高质量的语音信号。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为一个实施例中语音降噪处理方法的第一示意性流程示意图;
图2为一个实施例中语音降噪处理方法的第二示意性流程示意图;
图3为一个实施例中对调制域相位谱进行补偿,得到补偿后的调制域相位谱的步骤的流程示意图;
图4为一个实施例中基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号的步骤的流程示意图;
图5为一个实施例中获取低频带信号的幅度谱和相位谱的步骤的流程示意图;
图6为一个实施例中获取高频带信号的幅度谱和相位谱的步骤的流程示意图;
图7为一个实施例中语音降噪处理装置的第一示意性结构框图;
图8为一个实施例中语音降噪处理装置的第二示意性结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种语音降噪处理方法,包括步骤:
S110,当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;
其中,语音采集设备可以为本领域任意一种采集语音的设备。在一个具体示例中,语音采集设备为麦克风。预设值可以为16cm。
具体地,可以通过本领域任意一种方式去获取语音采集设备采集的含噪语音信号。在一个具体示例中,含噪语音信号的获取方式包括从语音采集设备中调取含噪语音信号。可以通过本领域任意一种方式去对含噪语音信号进行分频处理,得到低频带信号。可选地,采用低通滤波对含噪语音信号进行处理,得到低频带信号。在一个具体示例中,对所述含噪语音信号在分频点进行无凸起低通滤波,得到低频带信号,从而实现在后续语音合成的过程中,分频点处没有凸起。
S120,获取低频带信号的幅度谱和相位谱;
具体地,对低频带信号进行傅里叶变换处理,得到低频带信号的幅度谱和相位谱。需要说明的是,也可以通过本领域任意一种手段获取低频带信号的幅度谱和相位谱。
S130,获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;
具体地,可以通过本领域任意一种技术手段获取幅度谱对应的调制域信号。在一个具体示例中,获取幅度谱对应的调制域信号的步骤可以包括采用傅里叶变换对幅度谱进行处理,得到调制域信号。进一步地,可以对幅度谱在每一个频率点分别逐帧进行短时傅里叶变化得到调制域信号。调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱。
S140,采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;
其中,采用谱减法对调制域幅度谱或者调制域功率谱进行处理,可以得到降噪后的调制域幅度谱。
具体地,采用谱减法对调制域幅度谱进行处理,得到降噪后的调制域幅度谱。或者,采用谱减法对调制域功率谱进行处理,可以得到降噪后的调制域功率谱,降噪后的调制域功率谱可以转换成降噪后的调制域幅度谱,转换方式在此不做赘述。
在其中一个实施例中,采用谱减法对调制域幅度谱或功率谱进行处理,得到降噪后的调制域幅度谱的步骤中,基于以下公式得到降噪后的调制域幅度谱:
Figure GDA0002325026800000101
Figure GDA0002325026800000102
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;|S(u,w,k)|为降噪后的调制域幅度谱;p是谱减法的类型,当p=1时使用的是调制域幅度谱谱减,当p=2时使用的是调制域功率谱谱减;当p=1时,|V(u,w,k)|p为估计的噪声调制域幅度谱,当p=2时,|V(u,w,k)|p为估计的噪声调制域功率谱;α(k)为调制域平滑过减因子;|YLF(u,w,k)|p为调制域幅度谱或功率谱;SNRpost(u,w,k)为调制域的后验信噪比;θ为平滑因子;α0为常数。
S150,对调制域相位谱进行补偿,得到补偿后的调制域相位谱;
其中,在语音降噪处理中,对调制域相位谱进行处理可以进一步抑制背景噪声,从而提高语音质量。幅度谱是实信号,因此得到的调制域信号是共轭对称的。基于此,可以通过反对称函数去改变共轭项之间的角度关系,继而可以对调制域相位谱进行补偿,得到补偿后的调制域相位谱。
S160,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。
具体地,根据补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,可以得到降噪后的低频带信号。降噪后的低频带信号可以合成降噪语音信号。可选地,可以获取语音信号的高频带信号,对该高频带信号和降噪后的低频带信号进行合成,得到降噪语音信号;也可以获取语音信号的高频带信号,然后对高频带信号进行降噪处理,将降噪后的高频带信号和降噪后的低频带信号进行合成,得到降噪语音信号。需要说明的是,对高频带信号进行的降噪处理方式,可以为本领域任意一种方式,在此不做具体限定。信号合成也可以采用本领域所用的方式。
上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的语音信号在低频带存在强相关噪声,因此当语音采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号。通过获取低频带信号的幅度谱所对应的调制域信号,并对调制域信号进行处理,得到降噪后的语音信号。具体地,采用谱减法对调制域幅度谱或者所述调制域功率谱进行处理,得到降噪后的调制域幅度谱,在此过程中,谱减法所采用的平滑过减因子为根据调制域的后验信噪比和平滑因子得到。通过此种方式,即避免了平滑过减因子过大导致语音消息消除过多,又避免了过减因子过小使得抑制噪声能力不足,同时也不会产生相邻帧之间的突然变化,有效地提高了语音信号的质量。进一步地,对调制域相位谱进行补偿处理,得到补偿后的调制域相位谱,可以进一步地抑制语音信号的背景噪声,提高语音信号的质量。因此,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到的降噪后的低频带信号的噪声小,进而得到更高质量的语音信号。
在一个实施例中,如图2所示,还包括步骤:
S210,对含噪语音信号进行分频处理,得到高频带信号;
具体地,可以通过本领域任意一种方式去获取语音采集设备采集的含噪语音信号。在一个具体示例中,含噪语音信号的获取方式包括从语音采集设备中调取含噪语音信号。可以通过本领域任意一种方式去对含噪语音信号进行分频处理,得到高频带信号。在一个具体示例中,对所述含噪语音信号在分频点进行无凸点高通滤波,得到高频带信号,从而实现在后续语音合成的过程中,分频点没有凸起。需要说明的是,对含噪语音信号进行分频处理,得到高频带信号的步骤可以与上述S110步骤一起执行,即只进行一次分频处理,便可以得到高频带信号和低频带信号。
S220,获取高频带信号的幅度谱和相位谱;
具体地,对高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱和相位谱。需要说明的是,也可以通过本领域任意一种手段获取高频带信号的幅度谱和相位谱。
S230,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱估计得到;
具体地,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后续的高频带信号的幅度谱。需要说明的是,当双麦的距离达到预设值时,采集的语音信号在高频带存在弱相关噪声。采用传递增益函数处理高频带信号的幅度谱,可以有效地对弱相关噪声进行抑制。
在其中一个实施例中,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱的步骤中,基于以下公式得到降噪后的高频带信号的幅度谱:
|S(u,w)|=|YHF(u,w)|H(u,w);
Figure GDA0002325026800000131
Figure GDA0002325026800000132
Figure GDA0002325026800000133
Figure GDA0002325026800000134
其中,|S(u,w)|为降噪后的高频带信号的幅度谱;H(u,w)为传递增益函数;|YHF(u,w)|为含噪语音高频带幅度谱;
Figure GDA0002325026800000135
为含噪语音高频带互功率谱;
Figure GDA0002325026800000136
为估计的高频带噪声互功率谱;i、j分别为两个语音采集设备采集的的高频带信号;
Figure GDA0002325026800000137
为修改后的后验信噪比;
Figure GDA0002325026800000138
为增益函数;g、b、h为常量;|Yi(u,w)Yj(u,w)|为高频带信号互幅度谱。
在一个具体示例中,基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号的步骤包括:对高频带信号的相位谱和降噪后的高频带信号的幅度谱依次进行傅里叶反变换处理和重叠相加,得到降噪后的低频带信号。需要说明的是,也可以采用本领域任意手段得到降噪后的低频带信号。
S240,合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。
其中,对降噪后的高频带信号和降噪后的低频带信号进行合成处理,可以得到降噪语音信号。需要说明的是,合成处理手段可以为本领域任意一种,在此不做具体限定。
上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的语音信号在高频带存在弱相关噪声,因此当语音采集设备之间的距离达到预设值时,获取采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到高频带信号。通过对高频带信号的幅度谱采用传递增益函数处理,得到降噪后的高频带信号的幅度谱。基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到的降噪后的高频带信号具有更少的噪声。针对于高频带信号和低频带信号的噪声特性,进行不同的降噪处理方法,从而获取更少噪声的语音信号。
在其中一个实施例中,如图3所示,对调制域相位谱进行补偿,得到补偿后的调制域相位谱的步骤包括:
S310,采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角调整,得到相位补偿;
或,采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角调整,得到相位补偿;
其中,在语音降噪处理中,对调制域相位谱进行处理可以进一步抑制背景噪声,从而提高语音质量。幅度谱是实信号,因此得到的调制域信号时共轭对称的。基于此,可以通过反对称函数与估计的噪声调制域幅度谱,对调制域相位谱改变共轭项之间的角度关系,继而可以对调制域相位谱进行补偿,得到补偿后的调制域相位谱。
需要说明的是,估计的噪声调制域幅度谱或估计的噪声调制域相位谱可以根据含噪语音信号的调制域幅度谱得到。
在其中一个实施例中,采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:
Figure GDA0002325026800000151
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为相位补偿;
Figure GDA0002325026800000152
为反对称函数;ξ为常数;|V(u,w,k)|1为估计的噪声调制域幅度谱;
采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:
Figure GDA0002325026800000153
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为相位补偿;
Figure GDA0002325026800000154
为反对称函数;ξ为常数;|V(u,w,k)|2为估计的噪声调制域功率谱;
S320,根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱。
具体而言,得到相位补偿之后,可以基于该相位补偿对调制域相位谱进行处理,得到补偿后的调制域相位谱。
在一个具体示例中,根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱的步骤中,基于以下公式,得到补偿后的相位谱:
angle[S(u,w,k)]=angle[YLF(u,w,k)]+Λ(u,w,k);
上述语音降噪处理方法,通过获得相位补偿,并基于相位补偿对调制域相位谱进行处理,得到补偿后的调制域相位谱,抑制了低频带信号的强相关噪声。
在其中一个实施例中,如图4所示,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号的步骤包括:
S410,将降噪后的调制域幅度谱和补偿后的调制域相位谱依次进行傅里叶反变换和重叠相加处理,得到降噪后的幅度谱;
其中,傅里叶反变换为信号处理的常用手段之一,在此不做具体说明。
具体而言,对降噪后的调制域幅度谱和补偿后的调制域相位谱进行傅里叶反变换处理,然后将得到的结果进行重叠相加处理,得到降噪后的幅度谱;
S420,对降噪后的幅度谱和低频带信号相位谱进行傅里叶反变换处理和重叠相加处理,得到降噪后的低频带信号。
具体而言,对降噪后的幅度谱和低频带信号相位谱进行傅里叶反变换处理,然后将得到的结果进行重叠相加处理,得到降噪后的低频带信号。
在一个实施例中,如图5所示,获取低频带信号的幅度谱和相位谱的步骤包括:
S510,预处理低频带信号,得到平稳低频带信号;
具体地,对低频带信号进行预处理,得到平稳低频带信号。预处理可以为本领域任意一种方式,在此不做具体要求。
S520,采用傅里叶变换对平稳低频带信号进行处理,得到低频带信号的幅度谱和相位谱。
通过对平稳低频带信号进行傅里叶变换处理,得到低频带信号的频率表达式,进而得到低频带信号的幅度谱和相位谱。
在其中一个实施例中,预处理低频带信号,得到平稳低频带信号的步骤包括:对低频带信号依次进行分帧处理和加窗处理,得到平稳低频带信号。
上述语音降噪方法,通过对低频带信号进行预处理,从而得到平稳低频带信号。具体地,语音信号在宏观上是不平稳的,在微观上是平稳的,从而可以将语音信号按照以一帧为单位进行划分。将语音信号进行分帧之后,可以对其进行加窗处理,即将分帧得到的语音信号与一个窗函数相乘,减少频谱泄露。
在一个实施例中,如图6所示,获取高频带信号的幅度谱和相位谱的步骤包括:
S610,预处理高频带信号,得到平稳高频带信号;
具体地,对高频带信号进行预处理,得到平稳高频带信号。预处理可以为本领域任意一种方式,在此不做具体要求。
S620,对平稳高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱和相位谱。
通过对平稳高频带信号进行傅里叶变换处理,得到高频带信号的频率表达式,进而得到高频带信号的幅度谱和相位谱。
在其中一个实施例中,预处理高频带信号,得到平稳高频带信号的步骤包括:对高频带信号依次进行分帧处理和加窗处理,得到平稳高频带信号。
上述语音降噪方法,通过对高频带信号进行预处理,从而得到平稳高频带信号。具体地,语音信号在宏观上是不平稳的,在微观上是平稳的,从而可以将语音信号按照以一帧为单位进行划分。将语音信号进行分帧之后,可以对其进行加窗处理,即将分帧得到的语音信号与一个窗函数相乘,减少频谱泄露。
在一个具体实施例中,对含噪语音信号进行分频处理,得到低频带信号的步骤包括:
对含噪语音信号进行无凸起低通滤波处理,得到低频带信号;
对含噪语音信号进行分频处理,得到高频带信号的步骤包括:
对含噪语音信号进行无凸起高通滤波处理,得到高频带信号。
上述语音降噪处理方法,通过在分频点对含噪语音信号进行无凸起低通滤波处理,得到低频带信号和高频带信号,从而使得分频点处没有凸起。
应该理解的是,虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种语音降噪处理装置,包括:
语音信号获取模块10,用于当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号;
低频滤波模块20,用于对含噪语音信号进行分频处理,得到低频带信号;
低频带信号频谱获取模块30,用于获取低频带信号的幅度谱和相位谱;
调制域信号获取模块40,用于获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;
调制域幅度谱处理模块50,用于采用谱减法对调制域幅度谱或者功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;
补偿模块60,用于对调制域相位谱进行补偿,得到补偿后的调制域相位谱;
低频带信号降噪模块70,用于基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。
在其中一个实施例中,如图8所示,语音降噪处理装置还包括:
高频滤波模块80,用于对含噪语音信号进行分频处理,得到高频带信号;
高频带信号频谱获取模块90,用于获取高频带信号的幅度谱和相位谱;
高频带信号降噪模块100,用于采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率和估计的噪声互功率谱估计得到;
合成模块110,用于合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。
关于语音降噪处理装置的具体限定可以参见上文中对于语音降噪处理方法的限定,在此不再赘述。上述语音降噪处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音降噪处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;
获取低频带信号的幅度谱和相位谱;
获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;
采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;
对调制域相位谱进行补偿,得到补偿后的调制域相位谱;
基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对含噪语音信号进行分频处理,得到高频带信号;
获取高频带信号的幅度谱和相位谱;
采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;
合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;
获取低频带信号的幅度谱和相位谱;
获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;
采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;
对调制域相位谱进行补偿,得到补偿后的调制域相位谱;
基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对含噪语音信号进行分频处理,得到高频带信号;
获取高频带信号的幅度谱和相位谱;
采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;
合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (18)

1.一种语音降噪处理方法,其特征在于,包括步骤:
当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对所述含噪语音信号进行分频处理,得到低频带信号;
获取所述低频带信号的幅度谱和相位谱;
获取所述幅度谱对应的调制域信号;所述调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;
采用谱减法对所述调制域幅度谱或者所述调制域功率谱进行处理,得到降噪后的调制域幅度谱;所述谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;
对所述调制域相位谱进行补偿,得到补偿后的调制域相位谱;
基于所述补偿后的调制域相位谱、所述降噪后的调制域幅度谱和所述低频带信号的相位谱,得到降噪后的低频带信号;所述降噪后的低频带信号用于合成降噪语音信号。
2.根据权利要求1所述的语音降噪处理方法,其特征在于,还包括步骤:
对所述含噪语音信号进行分频处理,得到高频带信号;
获取所述高频带信号的幅度谱和相位谱;
采用传递增益函数对所述高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和所述高频带信号的相位谱,得到降噪后的高频带信号;所述传递增益函数为根据所述高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;
合成所述降噪后的高频带信号和所述降噪后的低频带信号,得到所述降噪语音信号。
3.根据权利要求1所述的语音降噪处理方法,其特征在于,采用谱减法对所述调制域幅度谱或所述调制域功率谱进行处理,得到降噪后的调制域幅度谱的步骤中,基于以下公式得到降噪后的调制域幅度谱:
Figure FDA0004092457170000021
Figure FDA0004092457170000022
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;|S(u,w,k)|为所述降噪后的调制域幅度谱;p是谱减法的类型,当p=1时使用的是调制域幅度谱谱减,当p=2时使用的是调制域功率谱谱减;当p=1时,|V(u,w,k)|p为估计的噪声调制域幅度谱,当p=2时,|V(u,w,k)|p为估计的噪声调制域功率谱;α(k)为调制域平滑过减因子;|YLF(u,w,k)|p为所述调制域幅度谱或功率谱;SNRpost(u,w,k)为所述调制域的后验信噪比;θ为所述平滑因子;α0为常数。
4.根据权利要求1所述的语音降噪处理方法,其特征在于,对所述调制域相位谱进行补偿,得到补偿后的调制域相位谱的步骤包括:
采用反对称函数与估计的噪声调制域幅度谱,对所述调制域相位谱进行共轭角调整,得到相位补偿;
或,采用反对称函数与估计的噪声调制域功率谱,对所述调制域相位谱进行共轭角调整,得到相位补偿;
根据所述相位补偿和所述调制域相位谱,得到所述补偿后的调制域相位谱。
5.根据权利要求4所述的语音降噪处理方法,其特征在于,采用反对称函数与估计的噪声调制域幅度谱,对所述调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到所述相位补偿:
Figure FDA0004092457170000023
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为所述相位补偿;
Figure FDA0004092457170000031
为所述反对称函数;ξ为常数;|V(u,w,k)|1为估计的噪声调制域幅度谱;
采用反对称函数与估计的噪声调制域功率谱,对所述调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到所述相位补偿:
Figure FDA0004092457170000032
其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为所述相位补偿;
Figure FDA0004092457170000033
为所述反对称函数;ξ为常数;|V(u,w,k)|2为估计的噪声调制域功率谱;
根据所述相位补偿和所述调制域相位谱,得到所述补偿后的调制域相位谱的步骤中,基于以下公式,得到所述补偿后的相位谱:
angle[S(u,w,k)]=angle[YLF(u,w,k)]+Λ(u,w,k);
其中,angle[S(u,w,k)]为所述补偿后的相位谱;angle[YLF(u,w,k)]为所述调制域相位谱。
6.根据权利要求1所述的语音降噪处理方法,其特征在于,基于所述补偿后的调制域相位谱、所述降噪后的调制域幅度谱和所述低频带信号的相位谱,得到降噪后的低频带信号的步骤包括:
将所述降噪后的调制域幅度谱和所述补偿后的调制域相位谱依次进行傅里叶反变换和重叠相加处理,得到降噪后的所述低频带信号的幅度谱;
对降噪后的所述低频带信号的幅度谱和所述低频带信号相位谱依次进行傅里叶反变换处理和重叠相加处理,得到降噪后的低频带信号。
7.根据权利要求2所述的语音降噪处理方法,其特征在于,基于降噪后的高频带信号的幅度谱和所述高频带信号的相位谱,得到降噪后的高频带信号的步骤包括:
对所述高频带信号的相位谱和所述降噪后的高频带信号的幅度谱依次进行傅里叶反变换处理和重叠相加,得到降噪后的低频带信号。
8.根据权利要求2所述的语音降噪处理方法,其特征在于,采用传递增益函数对所述高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱的步骤中,基于以下公式得到所述降噪后的高频带信号的幅度谱:
|S(u,w)|=|YHF(u,w)|H(u,w);
Figure FDA0004092457170000041
Figure FDA0004092457170000042
Figure FDA0004092457170000043
Figure FDA0004092457170000044
其中,|S(u,w)|为所述降噪后的高频带信号的幅度谱;H(u,w)为传递增益函数;|YHF(u,w)|为含噪语音高频带幅度谱;
Figure FDA0004092457170000045
为含噪语音高频带互功率谱;
Figure FDA0004092457170000046
为估计的高频带噪声互功率谱;i、j分别为两个语音采集设备采集的的高频带信号;
Figure FDA0004092457170000047
为修改后的后验信噪比;
Figure FDA0004092457170000048
为增益函数;g、b、h为常量;|Yi(u,w)Yj(u,w)|为高频带信号互幅度谱。
9.根据权利要求1所述的语音降噪处理方法,其特征在于,获取所述低频带信号的幅度谱和相位谱的步骤包括:
预处理所述低频带信号,得到平稳低频带信号;
采用傅里叶变换对所述平稳低频带信号进行处理,得到所述低频带信号的幅度谱和相位谱。
10.根据权利要求9所述的语音降噪处理方法,其特征在于,预处理所述低频带信号,得到平稳低频带信号的步骤包括:
对所述低频带信号依次进行分帧处理和加窗处理,得到所述平稳低频带信号。
11.根据权利要求2所述的语音降噪处理方法,其特征在于,获取所述高频带信号的幅度谱和相位谱的步骤包括:
预处理所述高频带信号,得到平稳高频带信号;
对所述平稳高频带信号进行傅里叶变换处理,得到所述高频带信号的幅度谱和相位谱。
12.根据权利要求11所述的语音降噪处理方法,其特征在于,预处理所述高频带信号,得到平稳高频带信号的步骤包括:
对所述高频带信号依次进行分帧处理和加窗处理,得到所述平稳高频带信号。
13.根据权利要求1所述的语音降噪处理方法,其特征在于,获取所述幅度谱对应的调制域信号的步骤包括:
采用傅里叶变换对所述幅度谱进行处理,得到所述调制域信号。
14.根据权利要求2至13任一项所述的语音降噪处理方法,其特征在于,对所述含噪语音信号进行分频处理,得到低频带信号的步骤包括:
对所述含噪语音信号进行无凸起低通滤波处理,得到所述低频带信号;
对所述含噪语音信号进行分频处理,得到高频带信号的步骤包括:
对所述含噪语音信号进行无凸起高通滤波处理,得到所述高频带信号。
15.一种语音降噪处理装置,其特征在于,包括:
语音信号获取模块,用于当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号;
低频滤波模块,用于对所述含噪语音信号进行分频处理,得到低频带信号;
低频带信号频谱获取模块,用于获取所述低频带信号的幅度谱和相位谱;
调制域信号获取模块,用于获取所述幅度谱对应的调制域信号;所述调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;
调制域幅度谱处理模块,用于采用谱减法对所述调制域幅度谱或者功率谱进行处理,得到降噪后的调制域幅度谱;所述谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;
补偿模块,用于对所述调制域相位谱进行补偿,得到补偿后的调制域相位谱;
低频带信号降噪模块,用于基于所述补偿后的调制域相位谱、所述降噪后的调制域幅度谱和所述低频带信号的相位谱,得到降噪后的低频带信号;所述降噪后的低频带信号用于合成降噪语音信号。
16.根据权利要求15所述的语音降噪处理装置,其特征在于,还包括:
高频滤波模块,用于对所述含噪语音信号进行分频处理,得到高频带信号;
高频带信号频谱获取模块,用于获取所述高频带信号的幅度谱和相位谱;
高频带信号降噪模块,用于采用传递增益函数对所述高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和所述高频带信号的相位谱,得到降噪后的高频带信号;所述传递增益函数为根据所述高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;
合成模块,用于合成所述降噪后的高频带信号和所述降噪后的低频带信号,得到所述降噪语音信号。
17.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至14中任一项所述方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至14中任一项所述的方法的步骤。
CN201911000052.8A 2019-10-21 2019-10-21 语音降噪处理方法、装置、计算机设备及存储介质 Active CN110797041B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201911000052.8A CN110797041B (zh) 2019-10-21 2019-10-21 语音降噪处理方法、装置、计算机设备及存储介质
US17/770,717 US20230230608A1 (en) 2019-10-21 2020-09-30 Speech noise reduction processing method and apparatus, and computer device and storage medium
PCT/CN2020/119600 WO2021078010A1 (zh) 2019-10-21 2020-09-30 语音降噪处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911000052.8A CN110797041B (zh) 2019-10-21 2019-10-21 语音降噪处理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110797041A CN110797041A (zh) 2020-02-14
CN110797041B true CN110797041B (zh) 2023-05-12

Family

ID=69439443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911000052.8A Active CN110797041B (zh) 2019-10-21 2019-10-21 语音降噪处理方法、装置、计算机设备及存储介质

Country Status (3)

Country Link
US (1) US20230230608A1 (zh)
CN (1) CN110797041B (zh)
WO (1) WO2021078010A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110797041B (zh) * 2019-10-21 2023-05-12 珠海市杰理科技股份有限公司 语音降噪处理方法、装置、计算机设备及存储介质
CN111754983A (zh) * 2020-05-18 2020-10-09 北京三快在线科技有限公司 一种语音去噪方法、装置、电子设备及存储介质
CN112086085B (zh) * 2020-08-18 2024-02-20 珠海市杰理科技股份有限公司 音频信号的和声处理方法、装置、电子设备和存储介质
CN111933171B (zh) * 2020-09-21 2021-01-22 北京达佳互联信息技术有限公司 降噪方法及装置、电子设备、存储介质
CN113611319B (zh) * 2021-04-07 2023-09-12 珠海市杰理科技股份有限公司 基于语音成分实现的风噪抑制方法、装置、设备及***
CN113539293B (zh) * 2021-08-10 2023-12-26 南京邮电大学 基于卷积神经网络和联合优化的单通道语音分离方法
CN115295024A (zh) * 2022-04-11 2022-11-04 维沃移动通信有限公司 信号处理方法、装置、电子设备及介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4505597B2 (ja) * 2004-08-04 2010-07-21 株式会社国際電気通信基礎技術研究所 雑音除去装置
US7742914B2 (en) * 2005-03-07 2010-06-22 Daniel A. Kosek Audio spectral noise reduction method and apparatus
US20130201316A1 (en) * 2012-01-09 2013-08-08 May Patents Ltd. System and method for server based control
CN103021420B (zh) * 2012-12-04 2015-02-25 中国科学院自动化研究所 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法
JP6174856B2 (ja) * 2012-12-27 2017-08-02 キヤノン株式会社 雑音抑制装置、その制御方法、及びプログラム
CN104252863A (zh) * 2013-06-28 2014-12-31 上海通用汽车有限公司 车载收音机的音频降噪处理***及方法
CN104810024A (zh) * 2014-01-28 2015-07-29 上海力声特医学科技有限公司 一种双路麦克风语音降噪处理方法及***
CN104867497A (zh) * 2014-02-26 2015-08-26 北京信威通信技术股份有限公司 一种语音降噪方法
CN105448304B (zh) * 2015-12-01 2019-01-15 珠海市杰理科技股份有限公司 语音信号噪声频谱估计方法、装置及降噪处理方法
US20210157312A1 (en) * 2016-05-09 2021-05-27 Strong Force Iot Portfolio 2016, Llc Intelligent vibration digital twin systems and methods for industrial environments
JP6892598B2 (ja) * 2017-06-16 2021-06-23 アイコム株式会社 ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム
CN108735213B (zh) * 2018-05-29 2020-06-16 太原理工大学 一种基于相位补偿的语音增强方法及***
CN108831500B (zh) * 2018-05-29 2023-04-28 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN109119093A (zh) * 2018-10-30 2019-01-01 Oppo广东移动通信有限公司 语音降噪方法、装置、存储介质及移动终端
EP3739356A1 (en) * 2019-05-12 2020-11-18 Origin Wireless, Inc. Method, apparatus, and system for wireless tracking, scanning and monitoring
CN110267163B (zh) * 2019-06-18 2021-07-20 重庆清文科技有限公司 一种定向声音虚拟低频增强方法、***、介质和设备
KR20220044204A (ko) * 2019-07-30 2022-04-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 분산형 오디오 디바이스들을 위한 음향 반향 소거 제어
CN110797041B (zh) * 2019-10-21 2023-05-12 珠海市杰理科技股份有限公司 语音降噪处理方法、装置、计算机设备及存储介质
WO2022072921A1 (en) * 2020-10-04 2022-04-07 Strong Force Iot Portfolio 2016, Llc Industrial digital twin systems and methods with echelons of executive, advisory and operations messaging and visualization

Also Published As

Publication number Publication date
WO2021078010A1 (zh) 2021-04-29
CN110797041A (zh) 2020-02-14
US20230230608A1 (en) 2023-07-20

Similar Documents

Publication Publication Date Title
CN110797041B (zh) 语音降噪处理方法、装置、计算机设备及存储介质
CN109767783B (zh) 语音增强方法、装置、设备及存储介质
CN108831500B (zh) 语音增强方法、装置、计算机设备及存储介质
CN107749305B (zh) 语音处理方法及其装置
US9905235B2 (en) Device and method for improved magnitude response and temporal alignment in a phase vocoder based bandwidth extension method for audio signals
EP2436005B1 (en) Efficient combined harmonic transposition
US20080140396A1 (en) Model-based signal enhancement system
CN101916567B (zh) 应用于双麦克风***的语音增强方法
US20100177908A1 (en) Adaptive beamformer using a log domain optimization criterion
US9837097B2 (en) Single processing method, information processing apparatus and signal processing program
JPWO2010086973A1 (ja) 画像処理装置および画像処理プログラム
JP2019512740A (ja) 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング
CN108806721B (zh) 信号处理器
CN110808058B (zh) 语音增强方法、装置、设备及可读存储介质
US8736359B2 (en) Signal processing method, information processing apparatus, and storage medium for storing a signal processing program
CN113129922B (zh) 语音信号的处理方法和装置
US9443503B2 (en) Signal processing device, signal processing method and signal processing program
US9190070B2 (en) Signal processing method, information processing apparatus, and storage medium for storing a signal processing program
CN114220451A (zh) 音频消噪方法、电子设备和存储介质
Lukin et al. Suppression of musical noise artifacts in audio noise reduction by adaptive 2-D filtering
CN110931038B (zh) 一种语音增强方法、装置、设备及存储介质
CN115862581A (zh) 一种重复模式噪声的二次消除方法及***
CN112151053B (zh) 语音增强方法、***、电子设备和存储介质
JP5959106B2 (ja) 受信装置
CN117373473A (zh) 基于语音信号先验概率特性的语音信号增强方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 519000 No. 333, Kexing Road, Xiangzhou District, Zhuhai City, Guangdong Province

Applicant after: ZHUHAI JIELI TECHNOLOGY Co.,Ltd.

Address before: Floor 1-107, building 904, ShiJiHua Road, Zhuhai City, Guangdong Province

Applicant before: ZHUHAI JIELI TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant