CN111128213B - 一种分频段进行处理的噪声抑制方法及其*** - Google Patents

一种分频段进行处理的噪声抑制方法及其*** Download PDF

Info

Publication number
CN111128213B
CN111128213B CN201911278646.5A CN201911278646A CN111128213B CN 111128213 B CN111128213 B CN 111128213B CN 201911278646 A CN201911278646 A CN 201911278646A CN 111128213 B CN111128213 B CN 111128213B
Authority
CN
China
Prior art keywords
frequency
power spectrum
value
frequency point
noise power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911278646.5A
Other languages
English (en)
Other versions
CN111128213A (zh
Inventor
于伟维
纪伟
潘思伟
董斐
雍雅琴
林福辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN201911278646.5A priority Critical patent/CN111128213B/zh
Publication of CN111128213A publication Critical patent/CN111128213A/zh
Priority to PCT/CN2020/111672 priority patent/WO2021114733A1/zh
Application granted granted Critical
Publication of CN111128213B publication Critical patent/CN111128213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/19Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开一种分频段进行处理的噪声抑制方法,用于对通话声音中的噪声进行抑制处理,所述方法包括以下步骤:将采集到的声音数据的信号类型从时域信号变换为频域信号;将频域信号分为低频信号与中高频信号,并根据低频信号的幅值计算出低频噪声功率谱估计值,根据中高频信号的幅值计算出中高频噪声功率谱估计值;根据低频噪声功率谱估计值、中高频噪声功率谱估计值以及频域信号进行计算,得到增益后的频域信号;将增益后的频域信号变换为增益后的时域信号。本发明还公开一种分频段进行处理的噪声抑制***;本发明抑制了噪声传播,提高了语音通话的质量,有效的对通话中的噪声进行抑制。

Description

一种分频段进行处理的噪声抑制方法及其***
技术领域
本发明涉及语音通话技术领域,尤其涉及一种分频段进行处理的噪声抑制方法及其***。
背景技术
随着科技的发展,语音通话逐渐取代了手写信件,语音通话相比于文字交流,信息传达的速度更快,传达的信息也更加准确;沟通过程中,沟通者可以通过对方的语气、语调、措辞等感知对方的情绪,从而提高交流的效率。对于现阶段的语音通话一般是采用麦克风采集语音数据,所述语音数据为模拟信号,再将模拟信号的语音数据转换为数字信号,通过有线或者无线的方式传送给对方,当对方接收到数字信号后,再将数字信号转换为模拟信号进行播放。
目前,一般的麦克风在采集语音数据时,无法避免的采集到一些噪声数据,所述噪声数据一般是用户在通话时的环境噪声,噪声数据会伴随用户的语音数据一同被传送到通话的另一端;一般情况下,噪声会影响通话质量;严重时,噪声会导致通话障碍,使通话时传达的语音产生偏差;如何在通话中精准的区分语音和噪声,并有效的抑制噪声的传播,提高通话质量成为一大难题。
发明内容
本发明的目的是克服现有技术中的不足,提供一种分频段进行处理的噪声抑制方法及其***,用于在通话中精准的区分语音和噪声,并有效的抑制噪声的传播,提高通话质量。
为解决上述技术问题,本发明提供一种分频段进行处理的噪声抑制方法,用于对通话声音中的噪声进行抑制处理,所述方法包括以下步骤:步骤S1,将采集到的声音数据的信号类型从时域信号变换为频域信号;步骤S2,将频域信号分为低频信号与中高频信号,并根据低频信号的幅值计算出低频噪声功率谱估计值,根据中高频信号的幅值计算出中高频噪声功率谱估计值;步骤S3,根据低频噪声功率谱估计值、中高频噪声功率谱估计值以及频域信号进行计算,得到增益后的频域信号;步骤S4,将增益后的频域信号变换为增益后的时域信号。
本发明还提供一种分频段进行处理的噪声抑制***,所述分频段进行处理的噪声抑制***包括:信号变换模块,用于将采集到的声音数据的信号类型从时域信号变换为频域信号;噪声功率谱估计模块,用于将频域信号分为低频信号与中高频信号,并根据低频信号的幅值计算出低频噪声功率谱估计值,根据中高频信号的幅值计算出中高频噪声功率谱估计值;增益频域计算模块,用于根据低频噪声功率谱估计值、中高频噪声功率谱估计值以及频域信号进行计算,得到增益后的频域信号;信号逆变换模块,用于将增益后的频域信号变换为增益后的时域信号。
本发明提供的一种分频段进行处理的噪声抑制方法及其***,通过将频域信号划分为低频信号及中高频信号,并对低频信号进行处理得到低频噪声功率谱估计值,对中高频信号进行处理得到中高频噪声功率谱估计值,根据低频噪声功率谱估计值以及中高频噪声功率谱估计值对频域信号进行计算得到增益后的频域信号;根据不同频率的信号特征,采用不同的噪声处理方式,更加精确的划分噪声和语音,有效的抑制了噪声的传播,提高了语音通话的效率,起到增强语音通话的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中的一种分频段进行处理的噪声抑制方法的流程图。
图2是图1中步骤S1的子流程图。
图3是图1中步骤S2的子流程图。
图4是图3中步骤S22的子流程图。
图5是图4中步骤S223的子流程图。
图6是图3中步骤S23的子流程图。
图7是图1中步骤S3的子流程图。
图8是图7中步骤S33的子流程图。
图9是本发明一实施例中的一种分频段进行处理的噪声抑制***的结构关系图。
图10是图9中信号变换模块的结构示意图。
图11是图9中噪声功率谱估计模块的结构示意图。
图12是图11中低频功率谱估计模块的结构示意图。
图13是图12中非基频点功率谱估计模块的结构示意图。
图14是图11中中高频功率谱估计模块的结构示意图。
图15是图9中增益频域计算模块的结构示意图。
图16是图15中增益信号计算模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例的描述中,需要理解的是,术语“第一”、“第二”仅是为了便于描述本发明和简化描述,因此不能理解为对本发明的限制。
请参阅图1,图1是本发明一实施例中的一种分频段进行处理的噪声抑制方法的流程图。
如图1所示,本发明提供一种分频段进行处理的噪声抑制方法,用于对通话声音中的噪声进行抑制处理,所述方法包括以下步骤:步骤S1,将采集到的声音数据的信号类型从时域信号变换为频域信号;步骤S2,将频域信号分为低频信号与中高频信号,并根据低频信号的幅值计算出低频噪声功率谱估计值,根据中高频信号的幅值计算出中高频噪声功率谱估计值;步骤S3,根据低频噪声功率谱估计值、中高频噪声功率谱估计值以及频域信号进行计算,得到增益后的频域信号;步骤S4,将增益后的频域信号变换为增益后的时域信号。
从而,本发明提供的一种分频段进行处理的噪声抑制方法,通过将频域信号划分为低频信号及中高频信号,并对低频信号进行处理得到低频噪声功率谱估计值,对中高频信号进行处理得到中高频噪声功率谱估计值,根据低频噪声功率谱估计值以及中高频噪声功率谱估计值对频域信号进行计算得到增益后的频域信号;根据不同频率的信号特征,采用不同的噪声处理方式,更加精确的划分噪声和语音,有效的抑制了噪声的传播,提高了语音通话的效率,起到增强语音通话的效果。
请参阅图2,图2是本发明一实施例中的全频信号的处理流程示意图。
如图2所示,在一些实施例中,所述步骤S1包括:步骤S11,获取采集到的信号类型为时域信号的声音数据;步骤S12,将时域信号按照预设时间间隔进行组帧得到多帧时域信号;步骤S13,通过对每一帧时域信号进行时频变换得到频域信号。
其中,所述声音数据包括用户在使用通话设备的过程中,所述通话设备采集用户发出的语音数据及环境声音数据;所述声音数据一般通过麦克风进行采集及转换得到,所述麦克风采集到用户发出的语音和环境声音的模拟信号后,经过模数转换,将所述模拟信号转换为数字信号;这里的声音数据是经模数转换后的数字信号。
所述时域信号是将所述声音数据按照采集的时间的顺序进行排列得到的信号;所述时域用来描述物理量与时间的变化关系。所述时域信号的时域波形用于表达信号随时间的变化情况。
所述频域信号是将所述声音数据按照频率大小的顺序进行排序得到的信号。所述频域用来描述物理量与频率的变化关系。所述频域信号的频域波形用于表达信号的幅值随着频率的变化情况,所述频域信号由多个频点构成,每个频点均包含对应的幅值信息和相位信息。
所述组帧是指在时域信号中按照预先设置的时间间隔,将采集到的声音数据进行组合,将在预设时间间隔内的时域信号组合作为一帧,所述时域信号在组合后为多帧时域信号,所述时频信号将以帧为单位进行后续变换。
所述时频变换在本实施例中是指针对时域信号中的每一帧进行傅里叶变换,每一帧在经过傅里叶变换后得到对应的多个频点的幅值、相位信息,所有频点汇总后得到频域信号;在其他实施例中,也可以采用其他变换方式将所述时域信号转换为频域信号。
具体的,将麦克风采集声音数据按照采集的时间顺序进行排列,生成时域信号,在时域信号中按照预设时间间隔进行组合,将在预设时间间隔内的时域信号组合为一帧,再对组合后的每一帧进行傅里叶变换,将每一帧经傅里叶变换得到的频点汇总得到频域信号。
请参阅图3,图3是图1中步骤S2的子流程图。
如图3所示,在一实施例中,所述步骤S2包括:步骤S21,按照预设频率划分标准将所述频域信号化分为低频信号及中高频信号;步骤S22,对频域信号中单路麦克风采集的单路低频信号进行噪声功率谱密度估计,得到单路低频信号中所有低频频点的噪声功率谱估计值;步骤S23,对频域信号中双路麦克风采集的双路中高频信号进行噪声功率谱密度估计,得到双路中高频信号中所有中高频频点的噪声功率谱估计值。
其中,所述预设频率划分标准是指预先设定的用于对频域信号进行划分的标准;本实施例中,按照所述预设频率划分标准可以将所述频域信号划分为低频信号、中高频信号;本实施例中,所述预设频率划分标准可以为某一固定频率;例如,所述预设频率划分标准可为以预设频率,例如1000Hz为界线区分低频、中高频信号的标准。
所述低频信号是指所述频域信号中低于所述预设频率的信号段。例如,频域信号中低于所述预设频率的信号段属于低频信号。所述低频信号中的频点为低频频点。
所述中高频信号是指所述频域信号中不低于所述预设频率的信号段。例如,频域信号中等于或高于所述预设频率的信号段属于中高频信号。所述中高频信号中的频点为中高频频点。
所述麦克风是指所述通话设备中用于采集声音数据的部件,所述麦克风一般为两个,分别设置于通话设备的不同部位;在用户进行通话时,两路麦克风同时采集声音数据,并将采集到的声音数据分别进行时频变换,得到两路频域信号;在对不同频段的信号进行噪声抑制处理时,采用不同路的麦克风的频域信号。在本实施例中,对低频信号进行噪声抑制处理时,选择信噪比较高的一路麦克风的频域信号进行噪声抑制处理。对中高频信号进行噪声抑制处理时,同时选择两路麦克风的双路频域信号进行噪声抑制处理。
所述功率谱密度(power spectral density,PSD)有时亦称为谱功率分布(spectral power distribution,SPD),是信号(噪声)的自相关函数的傅里叶变换,即每单位频率的信号(噪声)所携带的功率。功率谱密度是一种概率统计方法,是对随机变量均方值的度量。
所述噪声功率谱估计值,即对噪声的功率谱密度的估计值,又称功率谱估计。噪声的功率谱密度是用来描述噪声的能量特征随频率的变化关系。
具体的,当所述预设频率划分标准确定后,按照预设频率划分标准将所述频域信号中频率低于预设频率划分标准的信号段作为低频段,等于或高于预设频率划分标准的信号段作为中高频段。
将两路麦克风采集的声音数据进行时频变换,得到两路频域信号,选择其中信噪比较高的一路频域信号,并根据所述预设频率划分标准选取该路频域信号中的低频段作为低频信号,并对所述低频信号进行噪声功率谱密度估计,得到所述低频信号中所有低频频点的噪声功率谱估计值。
将根据所述预设频率划分标准,同时选取两路频域信号的中高频段作为中高频信号,并对所述中高频信号进行噪声功率谱密度估计,得到所述中高频信号中所有中高频频点的噪声功率谱估计值。
在其他实施例中,所述预设频率划分标准可以为固定的频率段;根据频率段对两路频域信号进行更细致的划分;例如0-1000Hz为低频段,1000-3000Hz为中频段,3000Hz以上为高频段。
从而,通过两路麦克风分别采集两路声音数据,再对两路声音数据分别进行时频变换,得到两路频域信号,在两路频域信号中分别选定低频信号及中高频信号,再对低频信号及中高频信号进行噪声功率谱密度估计,利用低频信号中噪声估计的准确性以及中高频信号中噪声估计的相关性,对频域信号分段处理,充分利用了采集到的两路声音数据,提高了噪声功率谱估计值的精准度,尽可能地去除残留的噪声。
请参阅图4,图4是图3中步骤S22的子流程图。
在一些实施例中,所述步骤S22包括:步骤S221,将单路低频信号中每个低频频点的幅值进行平方得到每个低频频点的幅值的平方值;步骤S222,通过基音检测法将低频频点分为基频点和非基频点;步骤S223,根据非基频点的幅值的平方值计算得到非基频点的噪声功率谱估计值;步骤S224,根据基频点的幅值的平方值以及非基频点的噪声功率谱估计值计算得到基频点的噪声功率谱估计值;步骤S225,将非基频点的噪声功率谱估计值与基频点的噪声功率谱估计值组合得到所有低频频点的噪声功率谱估计值。
其中,所述基音是指人发出浊音时声带振动的周期,基音周期的估计称为基音检测,其目的是提取出与人的声带振动频率一致或尽可能相吻合的基音周期变化的轨迹曲线,即基音频率,所述基音频率是语音信号处理中最重要的特征参数之一。
所述基音检测法是用于检测基音信号的方法,由于语音信号可视为一个动态非平稳随机过程,语音波形和声带振动的频率变化范围大且十分复杂,所以所述基音检测法包括很多种算法,例如泛音内积频谱法、倒频谱分析法、最大似然估计法等;本实施例中,采用倒谱法对所述低频频点进行检测,基音检测中的基音频率可以通过以下计算方法进行确定:
当时域信号序列为x(n)时,其幅值谱对数的傅里叶逆变换
Figure BDA0002311688780000071
即x(n)的倒谱序列,即:
X(ω)=FT[x(n)]
Figure BDA0002311688780000072
其中,FT和FT-1分别表示傅里叶变换和傅里叶逆变换。由于时域信号x(n)是由声门脉冲激励u(n)经声道响应v(n)滤波而得,即
x(n)=u(n)*v(n)
设这三个量的倒谱分别为
Figure BDA0002311688780000073
Figure BDA0002311688780000074
则有
Figure BDA0002311688780000075
在倒频谱域中,
Figure BDA0002311688780000076
Figure BDA0002311688780000077
是相对分离的,说明包含有基音信息的声脉冲倒谱可与声道响应倒谱分离,因此从倒频谱域分离
Figure BDA0002311688780000078
后恢复出u(n),从中求出基音周期,再对基音周期的求倒数即为基音频率。
所述基频点是指低频信号中幅值的平方符合基音频率的频点。
所述非基频点是指低频信号中幅值的平方不符合基音频率的频点。
所述基频点的噪声功率谱估计值是指对基频点的噪声的功率谱密度的估计值。所述非基频点的噪声功率谱估计值是指对非基频点的噪声的功率谱密度的估计值。所述噪声功率谱估计值可以通过如下公式进行计算:
Figure BDA0002311688780000079
其中,M={f0,2f0,3f0,…}。f0为基音频率,2f0,3f0,…表示谐波频率。M表示基频点的集合。|X(λ,μ)|2为原输入,即非基频点的噪声功率谱估计值为该非基频点幅值的平方;|Xinter(λ,μ)|2是利用插值法计算基频点的噪声功率谱估计值,即通过相邻两个非基频点的噪声功率谱估计值进行插值得到所述基频点的噪声功率谱估计值。
具体的,将所述单路低频信号中每个低频频点的幅值进行平方,得到每个低频频点的幅值的平方值。
根据基音检测法对所述低频信号中所有的频点进行筛选,筛选出低频信号中频点的幅值的平方符合基音频率的频点作为基频点,不符合基音频率的频点作为非基频点。
根据上述的所述基频点噪声功率谱估计值和非基频点噪声功率谱估计值的计算公式,计算求得所述基频点噪声功率谱估计值和非基频点噪声功率谱估计值。
将计算得到的非基频点的噪声功率谱估计值与基频点的噪声功率谱估计值进行组合汇总,即得到所有低频频点的噪声功率谱估计值。
请参阅图5,图5是图4中步骤S223的子流程图。
在一些实施例中,所述步骤S223包括:步骤S2231,根据每个低频频点的幅值的平方值计算得到每个低频频点的语音存在概率值;步骤S2232,根据每个非基频点的幅值的平方值计算得到每个非基频点的噪声功率谱初步估计值;步骤S2233,在所有低频频点的语音存在概率值中查找出与非基频点对应的非基频点的语音存在概率值;步骤S2234,根据每个非基频点的语音存在概率值以及对应的非基频点的噪声功率谱初步估计值计算得到每个非基频点的噪声功率谱估计值。
其中,所述语音是指所述声音数据中用户言语的声音,所述声音数据包括语音数据及噪声数据,所述语音数据是通话中需要传达的数据。
所述低频频点的语音存在概率值是指低频频点中语音存在的可能性。所述语音存在概率值可以通过以下公式计算得到:
Figure BDA0002311688780000081
该计算公式中,q(k,λ)代表语音不存在概率,该值可以通过对应频点的幅度谱平方与预设阈值进行比较计算得到;ξ(k,λ)为先验信噪比;v(k,λ)可以由后验信噪比和先验信噪比定义计算得到。其中,先验信噪比是纯净语音信号的功率除以噪声信号的功率。后验信噪比是含噪语音信号的功率除以噪声信号的功率。
所述非基频点的噪声功率谱初步估计值是利用上述公式,对所述非基频点的噪声功率谱估计值进行初步计算得到的值。
具体的,将低频信号中的每个低频频点的幅值的平方值带入上述语音存在概率的公式进行计算,得到低频信号中所有低频频点的语音存在概率值。
根据每个非基频点的幅值的平方值带入上述噪声功率谱估计值的公式计算得到每个非基频点的噪声功率谱初步估计值。
根据所有低频频点的语音存在概率值以及上述基音检测结果中的非基频点,在所有低频频点的语音存在概率值对应查找出每个非基频点的语音存在概率值。
将每个非基频点的语音存在概率值与对应的非基频点的噪声功率谱初步估计值相乘,计算得到每个非基频点的噪声功率谱估计值。
从而,将低频信号中的低频频点划分为基频点与非基频点,再分别针对基频点和非基频点采用不同的计算方式,计算出低频信号中基频点的噪声功率谱估计值以及非基频点的噪声功率谱估计值;通过引入基音检测法,保证了通话语音的质量,提高了在平稳及非平稳的噪声环境下的语音通话效果,使得对噪声的区分更加精准,提高了噪声抑制的效率。
请参阅图6,图6是图3中步骤S23的子流程图。
在一些实施例中,步骤S231,通过对双路中高频信号中每个频点的幅值进行平方得到每个中高频频点的幅值的平方值;步骤S232,根据每个中高频频点的幅值的平方值计算得到每个中高频频点的自功率谱值,以及每个中高频频点的互功率谱值;步骤S233,根据每个中高频频点的幅值的平方值、自功率谱值及互功率谱值计算得到每个中高频频点的相关性值;步骤S234,根据每个中高频频点的相关性值、自功率谱值及互功率谱值计算得到每个中高频频点的噪声功率谱的初步估计值;步骤S235,根据每个中高频频点的相关性值计算得到每个中高频频点的语音存在概率;步骤S236,通过将每个中高频频点的噪声功率谱的初步估计值与对应的中高频频点的语音存在概率进行平滑处理得到每个中高频频点的噪声功率谱估计值。
其中,所述自功率谱值以及互功率谱值用于反映相关函数在时域内表达随机信号自身与其他信号在不同时刻的内在联系,了解不同时刻同一随机样本间的波形相似程度。所述自功率谱以及互功率谱值的计算公式如下:
Figure BDA0002311688780000091
其中,λ表示帧数,μ表示频点,αs为平滑系数,
Figure BDA0002311688780000092
为两个麦克风的自功率谱互功率谱值,Xi,Xj为频域信号的幅值,*表示复共轭。
所述相关性值包括两个麦克风中语音信号的相关性值以及两个麦克风信号中噪声信号的相关性值。所述相关性值可以根据以下公式计算得到:
Figure BDA0002311688780000101
Figure BDA0002311688780000102
Figure BDA0002311688780000103
Figure BDA0002311688780000104
其中,Γx,λ为两个麦克风接受到的信号的相关性;
Figure BDA0002311688780000105
为噪声相关性的估计;Γs,cor为语音相关性的初步估计;
Figure BDA0002311688780000106
为平滑后的语音相关性的估计;γ为后验信噪比;αΓ为平滑系数。
所述中高频频点的语音存在概率是指每个中高频频点中语音信号存在的可能性。所述中高频频点的语音存在概率可以通过以下公式计算得到:
Figure BDA0002311688780000107
所述平滑处理是指将每个中高频频点的噪声功率谱估计值以及对应频点的语音存在概率带入公式计算得到平滑后的中高频频点的噪声功率谱估计值;
所述平滑处理的计算公式如下:
Figure BDA0002311688780000108
所述中高频频点的噪声功率谱的初步估计值是指根据公式初步计算得到的中高频频点的噪声功率谱的估计值;所述中高频频点的噪声功率谱的初步估计值的计算公式如下:
Figure BDA0002311688780000109
具体的,首先,同时获取双路频域信号中的中高频信号,对中高频信号中的每个频点的幅值进行平方,得到每个中高频频点的幅值的平方值。
再将每个中高频频点的幅值的平方值带入上述自功率谱值以及互功率谱值的计算公式,计算得到每个中高频频点的自功率谱值以及互功率谱值。
再将每个中高频频点的幅值的平方值、自功率谱值以及互功率谱值带入上述相关性值的计算公式,计算得到每个中高频频点的相关性值。
再根据每个中高频频点的相关性值、自功率谱值及互功率谱值带入上述的中高频频点的噪声功率谱的初步估计值的计算公式,计算得到每个中高频频点的噪声功率谱的初步估计值。
同时,根据每个中高频频点的相关性值带入上述中高频频点的语音存在概率的计算公式,计算得到每个中高频频点的语音存在概率。
最后,通过将每个中高频频点的噪声功率谱的初步估计值与对应的中高频频点的语音存在概率带入上述的平滑处理的公式进行计算,得到每个中高频频点的噪声功率谱估计值。
从而,通过将所述中高频频点的幅值带入一系列的公式进行计算,利用语音在中高频段相关性相差明显的特征,对中高频信号的频点进行噪声的抑制处理,得到所述中高频信号中每个频点的噪声功率谱估计值。
请参阅图7,图7是图1中步骤S3的子流程图。
如图7所示,在一些实施例中,所述步骤S3包括:步骤S31,将低频噪声功率谱估计值与中高频噪声功率谱估计值组合得到全频带噪声功率谱估计值;步骤S32,根据全频带噪声功率谱估计值中每个频点的噪声功率谱估计值进行增益计算,得到每个频点的幅度谱增益值;步骤S33,根据每个频点的幅度谱增益值及频域信号计算增益后的频域信号。
其中,所述全频带噪声功率谱估计值是指频域信号中所有频点的噪声功率谱估计值。
所述幅度谱增益值是指将所述频点的噪声功率谱估计值带入幅度增益函数求出的每个频点的幅值的增益比例。
所述增益后的频域信号是指对原频域信号中每个频点按照对应频点的幅度谱增益值进行增益后得到的每个频点的幅值。所述原频域信号是指上述时频变换后得到的频域信号。
具体的,将低频噪声功率谱与中高频噪声功率谱进行组合汇总得到频域信号中所有频点的噪声功率谱估计值。
将所有频点的噪声功率谱估计值中每个频点的噪声功率谱估计值带入增益函数进行计算,得到每个频点的幅度谱增益值。
根据每个频点的幅度谱增益值与原频域信号中对应频点的幅值进行计算,得到每个频点增益后的幅值,将所有频点增益后的幅值进行组合汇总后,得到增益后的频域信号。
请参阅图8,图8是图7中步骤S33的子流程图。
如图8所示,在一些实施例中,所述步骤S33包括:步骤S331,获取每个频点的幅度谱增益值以及频域信号中对应频点的幅值;步骤S332,将每个频点的幅度谱增益值与对应频点的幅值相乘得到每个频点的增益后的幅值,将频域信号中所有频点的增益后的幅值组合得到增益后的频域信号。
具体的,根据每个频点的幅度谱增益值,在原频域信号中获取到对应的每个频点的幅值。
将每个频点的幅度谱增益值与对应频点的幅值相乘,得到每个频点的增益后的幅值;将所有频点的增益后的幅值组合汇总后,得到增益后的频域信号。
从而,根据频域信号中每个频点的噪声功率谱估计值计算得到每个频点的幅度谱增益值,再根据每个幅度谱增益值与原频域信号中对应的频点的幅值相乘,计算得到增益后的频域信号,提高了语音的可识别性,并针对每个频点进行了噪声抑制处理,提高了噪声抑制的效率,使得通话中的语音数据更为清晰,抑制噪声数据的传播,提高了通话的质量。
在一些实施例中,所述步骤S4包括:将增益后的频域信号中每个频点的增益后的幅值进行逆时频变换,得到增益后的时域信号。
其中,所述逆时频变换是指将频域信号变换为时域信号,通过对每个频点进行傅里叶逆变换,从而实现将整个频域信号变换为时域信号。
具体的,将增益后的频域信号按照帧进行傅里叶逆变换,得到对应帧的时域信号,所有帧的时域信号组合后得到增益后的时域信号;从而,将所述增益后的频域信号变换为增益后的时域信号。
本发明提供的一种分频段进行处理的噪声抑制方法可以在硬件、固件中实施,或者可以作为可以存储在例如CD、ROM、RAM、软盘、硬盘或磁光盘的等计算机可读存储介质中的软件或计算机代码,或者可以作为原始存储在远程记录介质或非瞬时的机器可读介质上、通过网络下载并且存储在本地记录介质中的计算机代码,从而这里描述的一种分频段进行处理的噪声抑制方法可以利用通用计算机或特殊处理器或在诸如ASIC或FPGA之类的可编程或专用硬件中以存储在记录介质上的软件来呈现。如本领能够理解的,计算机、处理器、微处理器、控制器或可编程硬件包括存储器组件,例如,RAM、ROM、闪存等,当计算机、处理器或硬件实施这里描述的一种分频段进行处理的噪声抑制方法而存取和执行软件或计算机代码时,存储器组件可以存储或接收软件或计算机代码。另外,当通用计算机存取用于实施这里示出的处理的代码时,代码的执行将通用计算机转换为用于执行这里示出的处理的专用计算机。
其中,所述计算机可读存储介质可为固态存储器、存储卡、光碟等。所述计算机可读存储介质存储有程序指令而供计算机调用后执行图1至图8所示的一种分频段进行处理的噪声抑制方法。
请参阅图9,图9是本发明一实施例中的一种分频段进行处理的噪声抑制***100的结构关系图。
在一些实施例中,所述分频段进行处理的噪声抑制***100包括:信号变换模块10,用于将采集到的声音数据的信号类型从时域信号变换为频域信号;噪声功率谱估计模块20,用于将频域信号分为低频信号与中高频信号,并根据低频信号的幅值计算出低频噪声功率谱估计值,根据中高频信号的幅值计算出中高频噪声功率谱估计值;增益频域计算模块30,用于根据低频噪声功率谱估计值、中高频噪声功率谱估计值以及频域信号进行计算,得到增益后的频域信号;信号逆变换模块40,用于将增益后的频域信号变换为增益后的时域信号。
请参阅图10,图10是图9中信号变换模块10的结构示意图。
在一些实施例中,所述信号变换模块10包括:信号获取模块11,用于获取采集到的信号类型为时域信号的声音数据;信号组帧模块12,用于将时域信号按照预设时间间隔进行组帧得到多帧时域信号;时频变换模块13,用于通过对每一帧时域信号进行时频变换得到频域信号。
请参阅图11,图11是图9中噪声功率谱估计模块20的结构示意图。
在一些实施例中,所述噪声功率谱估计模块20包括:信号划分模块21,用于按照预设频率划分标准将所述频域信号化分为低频信号及中高频信号;低频功率谱估计模块22,用于对频域信号中单路麦克风采集的单路低频信号进行噪声功率谱密度估计,得到单路低频信号中所有低频频点的噪声功率谱估计值;中高频功率谱估计模块23,用于对频域信号中双路麦克风采集的双路中高频信号进行噪声功率谱密度估计,得到双路中高频信号中所有中高频频点的噪声功率谱估计值。
请参阅图12,图12是图11中低频功率谱估计模块22的结构示意图。
在一些实施例中,所述低频功率谱估计模块22包括:低频幅值平方模块221,用于将单路低频信号中每个低频频点的幅值进行平方得到每个低频频点的幅值的平方值;基音检测模块222,用于通过基音检测法将低频频点分为基频点和非基频点;非基频点功率谱估计模块223,用于根据非基频点的幅值的平方值计算得到非基频点的噪声功率谱估计值;基频点功率谱估计模块224,用于根据基频点的幅值的平方值以及非基频点的噪声功率谱估计值计算得到基频点的噪声功率谱估计值;低频功率谱组合模块225,用于将非基频点的噪声功率谱估计值与基频点的噪声功率谱估计值组合得到所有低频频点的噪声功率谱估计值。
请参阅图13,图13是图12中非基频点功率谱估计模块223的结构示意图。
在一些实施例中,所述非基频点功率谱估计模块223包括:低频语音概率计算模块2231,用于根据每个低频频点的幅值的平方值计算得到每个低频频点的语音存在概率值;非基频点功率谱初步估计模块2232,用于根据每个非基频点的幅值的平方值计算得到每个非基频点的噪声功率谱初步估计值;非基频点语音概率查找模块2233,用于在所有低频频点的语音存在概率值中查找出与非基频点对应的非基频点的语音存在概率值;非基频点功率谱计算模块2234,用于根据每个非基频点的语音存在概率值以及对应的非基频点的噪声功率谱初步估计值计算得到每个非基频点的噪声功率谱估计值。
请参阅图14,图14是图11中中高频功率谱估计模块23的结构示意图。
在一些实施例中,所述中高频功率谱估计模块23包括:中高频幅值平方模块231,用于通过对双路中高频信号中每个频点的幅值进行平方得到每个中高频频点的幅值的平方值;功率谱值计算模块232,用于根据每个中高频频点的幅值的平方值计算得到每个中高频频点的自功率谱值,以及每个中高频频点的互功率谱值;相关性值计算模块233,用于根据每个中高频频点的幅值的平方值、自功率谱值及互功率谱值计算得到每个中高频频点的相关性值;中高频初步估计模块234,用于根据每个中高频频点的相关性值、自功率谱值及互功率谱值计算得到每个中高频频点的噪声功率谱的初步估计值;中高频语音概率计算模块235,用于根据每个中高频频点的相关性值计算得到每个中高频频点的语音存在概率;中高频平滑处理模块236,用于通过将每个中高频频点的噪声功率谱的初步估计值与对应的中高频频点的语音存在概率进行平滑处理得到每个中高频频点的噪声功率谱估计值。
请参阅图15,图15是图9中增益频域计算模块30的结构示意图。
在一些实施例中,所述增益频域计算模块30包括:全频带功率谱组合模块31,用于将低频噪声功率谱估计值与中高频噪声功率谱估计值组合得到全频带噪声功率谱估计值;幅度谱增益计算模块32,用于根据全频带噪声功率谱估计值中每个频点的噪声功率谱估计值进行增益计算,得到每个频点的幅度谱增益值;增益信号计算模块33,用于根据每个频点的幅度谱增益值及频域信号计算增益后的频域信号。
请参阅图16,图16是图15中增益信号计算模块33的结构示意图。
在一些实施例中,所述增益信号计算模块33包括:幅度谱增益值获取模块331,用于获取每个频点的幅度谱增益值以及频域信号中对应频点的幅值;增益幅值计算模块332,用于将每个频点的幅度谱增益值与对应频点的幅值相乘得到每个频点的增益后的幅值,将频域信号中所有频点的增益后的幅值组合得到增益后的频域信号。
在一些实施例中,所述信号逆变换模块40还用于将增益后的频域信号中每个频点的增益后的幅值进行逆时频变换,得到增益后的时域信号。
所述分频段进行处理的噪声抑制***100还包括中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理单元是所述分频段进行处理的噪声抑制***的数据处理中心,利用有线或者无线线路连接整个所述分频段进行处理的噪声抑制***100的各个模块。用于对各个模块传送来的数据进行处理。
如图1所示,在一些实施例中,所述分频段进行处理的噪声抑制***100还包括存储模块50,所述存储模块50用于存储所述时域信号以及所述频域信号
其中,所述存储模块50可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
具体的,所述存储模块50位于所述通话设备内,主要与上述处理单元相连接,用于存储麦克风采集到的声音数据以及处理单元处理后的频域信号、时域信号、噪声功率谱估计值等。
在其他实施例中,所述存储模块50还可以与所述分频段进行处理的噪声抑制***100的各个模块相连接,用于存储各个模块在参数计算过程中产生的数据。
如图1所示,在一些实施例中,所述一种分频段进行处理的噪声抑制***包括通话设备,所述通话设备可以是移动终端,所述信号变换模块10、噪声功率谱估计模块20、增益频域计算模块30、信号逆变换模块40、存储模块50等,均设置于所述主机设备内;所述信号变换模块10与噪声功率谱估计模块20通过有线或者无线的方式连接,能够将时频变换后的频域信号传送给所述噪声功率谱估计模块20;所述噪声功率谱估计模块20与所述增益频域计算模块30通过有线或者无线的方式连接,能够将计算得到的低频噪声功率谱估计值、中高频噪声功率谱估计值传送给所述增益频域计算模块30;所述增益频域计算模块30与所述信号逆变换模块40通过有线或者无线的方式连接,能够将增益后的频域信号传送给信号逆变换模块40,用于信号逆变换模块40将增益后的频域信号逆时频变换为时域信号;所述存储模块50与信号变换模块10、噪声功率谱估计模块20、增益频域计算模块30、信号逆变换模块40均通过有线或者无线的方式连接,能够存储时域信号、频域信号、低频噪声功率谱估计值、中高频噪声功率谱估计值等数据。
本发明提供的一种分频段进行处理的噪声抑制方法及其***,通过将频域信号划分为低频信号及中高频信号,并对低频信号进行处理得到低频噪声功率谱估计值,对中高频信号进行处理得到中高频噪声功率谱估计值,根据低频噪声功率谱估计值以及中高频噪声功率谱估计值对频域信号进行计算得到增益后的频域信号;根据不同频率的信号特征,采用不同的噪声处理方式,更加精确的划分噪声和语音,有效的抑制了噪声的传播,提高了语音通话的效率,起到增强语音通话的效果。
以上是本发明实施例的实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (20)

1.一种分频段进行处理的噪声抑制方法,用于对两路麦克风采集的通话声音中的噪声进行抑制处理,其特征在于,所述方法包括以下步骤:
步骤S1,将采集到的声音数据的信号类型从时域信号变换为频域信号;
步骤S2,将频域信号分为低频信号与中高频信号,针对低频信号,通过基音检测法将低频频点分为基频点和非基频点,计算得到非基频点的噪声功率谱估计值以及基频点的噪声功率谱估计值,将非基频点的噪声功率谱估计值与基频点的噪声功率谱估计值组合得到所有低频频点的噪声功率谱估计值;针对中高频信号,根据中高频信号的幅值计算出中高频噪声功率谱估计值;
步骤S3,根据低频噪声功率谱估计值、中高频噪声功率谱估计值以及频域信号进行计算,得到增益后的频域信号;
步骤S4,将增益后的频域信号变换为增益后的时域信号。
2.如权利要求1所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述步骤S1包括:
步骤S11,获取采集到的信号类型为时域信号的声音数据;
步骤S12,将时域信号按照预设时间间隔进行组帧得到多帧时域信号;
步骤S13,通过对每一帧时域信号进行时频变换得到频域信号。
3.如权利要求1或2任一项所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述步骤S2包括:
步骤S21,按照预设频率划分标准将所述频域信号化分为低频信号及中高频信号;
步骤S22,对频域信号中单路麦克风采集的单路低频信号进行噪声功率谱密度估计,得到单路低频信号中所有低频频点的噪声功率谱估计值;
步骤S23,对频域信号中双路麦克风采集的双路中高频信号进行噪声功率谱密度估计,得到双路中高频信号中所有中高频频点的噪声功率谱估计值。
4.如权利要求3所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述步骤S22包括:
步骤S221,将单路低频信号中每个低频频点的幅值进行平方得到每个低频频点的幅值的平方值;
步骤S222,通过基音检测法将低频频点分为基频点和非基频点;
步骤S223,根据非基频点的幅值的平方值计算得到非基频点的噪声功率谱估计值;
步骤S224,根据基频点的幅值的平方值以及非基频点的噪声功率谱估计值计算得到基频点的噪声功率谱估计值;
步骤S225,将非基频点的噪声功率谱估计值与基频点的噪声功率谱估计值组合得到所有低频频点的噪声功率谱估计值。
5.如权利要求4所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述步骤S223包括:
步骤S2231,根据每个低频频点的幅值的平方值计算得到每个低频频点的语音存在概率值;
步骤S2232,根据每个非基频点的幅值的平方值计算得到每个非基频点的噪声功率谱初步估计值;
步骤S2233,在所有低频频点的语音存在概率值中查找出与非基频点对应的非基频点的语音存在概率值;
步骤S2234,根据每个非基频点的语音存在概率值以及对应的非基频点的噪声功率谱初步估计值计算得到每个非基频点的噪声功率谱估计值。
6.如权利要求3所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述步骤S23包括:
步骤S231,通过对双路中高频信号中每个频点的幅值进行平方得到每个中高频频点的幅值的平方值;
步骤S232,根据每个中高频频点的幅值的平方值计算得到每个中高频频点的自功率谱值,以及每个中高频频点的互功率谱值;
步骤S233,根据每个中高频频点的幅值的平方值、自功率谱值以及互功率谱值计算得到每个中高频频点的相关性值;
步骤S234,根据每个中高频频点的相关性值、自功率谱值以及互功率谱值计算得到每个中高频频点的噪声功率谱的初步估计值;
步骤S235,根据每个中高频频点的相关性值计算得到每个中高频频点的语音存在概率;
步骤S236,通过将每个中高频频点的噪声功率谱的初步估计值与对应的中高频频点的语音存在概率进行平滑处理得到每个中高频频点的噪声功率谱估计值。
7.如权利要求1所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述步骤S3包括:
步骤S31,将低频噪声功率谱估计值与中高频噪声功率谱估计值组合得到全频带噪声功率谱估计值;
步骤S32,根据全频带噪声功率谱估计值中每个频点的噪声功率谱估计值进行增益计算,得到每个频点的幅度谱增益值;
步骤S33,根据每个频点的幅度谱增益值及频域信号计算增益后的频域信号。
8.如权利要求7所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述步骤S33包括:
步骤S331,获取每个频点的幅度谱增益值以及频域信号中对应频点的幅值;
步骤S332,将每个频点的幅度谱增益值与对应频点的幅值相乘得到每个频点的增益后的幅值,将频域信号中所有频点的增益后的幅值组合得到增益后的频域信号。
9.如权利要求8所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述步骤S4包括:将增益后的频域信号中每个频点的增益后的幅值进行逆时频变换,得到增益后的时域信号。
10.如权利要求9所述的一种分频段进行处理的噪声抑制方法,其特征在于,所述时频变换为傅里叶变换,所述逆时频变换为傅里叶逆变换。
11.一种分频段进行处理的噪声抑制***,用于对两路麦克风采集的通话声音中的噪声进行抑制处理,其特征在于,所述分频段进行处理的噪声抑制***包括:
信号变换模块,用于将采集到的声音数据的信号类型从时域信号变换为频域信号;
噪声功率谱估计模块,用于将频域信号分为低频信号与中高频信号,针对低频信号,通过基音检测法将低频频点分为基频点和非基频点,计算得到非基频点的噪声功率谱估计值以及基频点的噪声功率谱估计值,将非基频点的噪声功率谱估计值与基频点的噪声功率谱估计值组合得到所有低频频点的噪声功率谱估计值;根据中高频信号的幅值计算出中高频噪声功率谱估计值;
增益频域计算模块,用于根据低频噪声功率谱估计值、中高频噪声功率谱估计值以及频域信号进行计算,得到增益后的频域信号;
信号逆变换模块,用于将增益后的频域信号变换为增益后的时域信号。
12.如权利要求11所述的一种分频段进行处理的噪声抑制***,其特征在于,所述信号变换模块包括:
信号获取模块,用于获取采集到的信号类型为时域信号的声音数据;
信号组帧模块,用于将时域信号按照预设时间间隔进行组帧得到多帧时域信号;
时频变换模块,用于通过对每一帧时域信号进行时频变换得到频域信号。
13.如权利要求11或12任一项所述的一种分频段进行处理的噪声抑制***,其特征在于,所述噪声功率谱估计模块包括:
信号划分模块,用于按照预设频率划分标准将所述频域信号化分为低频信号及中高频信号;
低频功率谱估计模块,用于对频域信号中单路麦克风采集的单路低频信号进行噪声功率谱密度估计,得到单路低频信号中所有低频频点的噪声功率谱估计值;
中高频功率谱估计模块,用于对频域信号中双路麦克风采集的双路中高频信号进行噪声功率谱密度估计,得到双路中高频信号中所有中高频频点的噪声功率谱估计值。
14.如权利要求13所述的一种分频段进行处理的噪声抑制***,其特征在于,所述低频功率谱估计模块包括:
低频幅值平方模块,用于将单路低频信号中每个低频频点的幅值进行平方得到每个低频频点的幅值的平方值;
基音检测模块,用于通过基音检测法将低频频点分为基频点和非基频点;
非基频点功率谱估计模块,用于根据非基频点的幅值的平方值计算得到非基频点的噪声功率谱估计值;
基频点功率谱估计模块,用于根据基频点的幅值的平方值以及非基频点的噪声功率谱估计值计算得到基频点的噪声功率谱估计值;
低频功率谱组合模块,用于将非基频点的噪声功率谱估计值与基频点的噪声功率谱估计值组合得到所有低频频点的噪声功率谱估计值。
15.如权利要求14所述的一种分频段进行处理的噪声抑制***,其特征在于,所述非基频点功率谱估计模块包括:
低频语音概率计算模块,用于根据每个低频频点的幅值的平方值计算得到每个低频频点的语音存在概率值;
非基频点功率谱初步估计模块,用于根据每个非基频点的幅值的平方值计算得到每个非基频点的噪声功率谱初步估计值;
非基频点语音概率查找模块,用于在所有低频频点的语音存在概率值中查找出与非基频点对应的非基频点的语音存在概率值;
非基频点功率谱计算模块,用于根据每个非基频点的语音存在概率值以及对应的非基频点的噪声功率谱初步估计值计算得到每个非基频点的噪声功率谱估计值。
16.如权利要求13所述的一种分频段进行处理的噪声抑制***,其特征在于,所述中高频功率谱估计模块包括:
中高频幅值平方模块,用于通过对双路中高频信号中每个频点的幅值进行平方得到每个中高频频点的幅值的平方值;
功率谱值计算模块,用于根据每个中高频频点的幅值的平方值计算得到每个中高频频点的自功率谱值,以及每个中高频频点的互功率谱值;
相关性值计算模块,用于根据每个中高频频点的幅值的平方值、自功率谱值及互功率谱值计算得到每个中高频频点的相关性值;
中高频初步估计模块,用于根据每个中高频频点的相关性值、自功率谱值及互功率谱值计算得到每个中高频频点的噪声功率谱的初步估计值;
中高频语音概率计算模块,用于根据每个中高频频点的相关性值计算得到每个中高频频点的语音存在概率;
中高频平滑处理模块,用于通过将每个中高频频点的噪声功率谱的初步估计值与对应的中高频频点的语音存在概率进行平滑处理得到每个中高频频点的噪声功率谱估计值。
17.如权利要求11所述的一种分频段进行处理的噪声抑制***,其特征在于,所述增益频域计算模块包括:
全频带功率谱组合模块,用于将低频噪声功率谱估计值与中高频噪声功率谱估计值组合得到全频带噪声功率谱估计值;
幅度谱增益计算模块,用于根据全频带噪声功率谱估计值中每个频点的噪声功率谱估计值进行增益计算,得到每个频点的幅度谱增益值;
增益信号计算模块,用于根据每个频点的幅度谱增益值及频域信号计算增益后的频域信号。
18.如权利要求17所述的一种分频段进行处理的噪声抑制***,其特征在于,所述增益信号计算模块包括:
幅度谱增益值获取模块,用于获取每个频点的幅度谱增益值以及频域信号中对应频点的幅值;
增益幅值计算模块,用于将每个频点的幅度谱增益值与对应频点的幅值相乘得到每个频点的增益后的幅值,将频域信号中所有频点的增益后的幅值组合得到增益后的频域信号。
19.如权利要求18所述的一种分频段进行处理的噪声抑制***,其特征在于,所述信号逆变换模块还用于将增益后的频域信号中每个频点的增益后的幅值进行逆时频变换,得到增益后的时域信号。
20.如权利要求19所述的一种分频段进行处理的噪声抑制***,其特征在于,所述时频变换为傅里叶变换,所述逆时频变换为傅里叶逆变换。
CN201911278646.5A 2019-12-10 2019-12-10 一种分频段进行处理的噪声抑制方法及其*** Active CN111128213B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911278646.5A CN111128213B (zh) 2019-12-10 2019-12-10 一种分频段进行处理的噪声抑制方法及其***
PCT/CN2020/111672 WO2021114733A1 (zh) 2019-12-10 2020-08-27 一种分频段进行处理的噪声抑制方法及其***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911278646.5A CN111128213B (zh) 2019-12-10 2019-12-10 一种分频段进行处理的噪声抑制方法及其***

Publications (2)

Publication Number Publication Date
CN111128213A CN111128213A (zh) 2020-05-08
CN111128213B true CN111128213B (zh) 2022-09-27

Family

ID=70498955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911278646.5A Active CN111128213B (zh) 2019-12-10 2019-12-10 一种分频段进行处理的噪声抑制方法及其***

Country Status (2)

Country Link
CN (1) CN111128213B (zh)
WO (1) WO2021114733A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111128213B (zh) * 2019-12-10 2022-09-27 展讯通信(上海)有限公司 一种分频段进行处理的噪声抑制方法及其***
CN112309419B (zh) * 2020-10-30 2023-05-02 浙江蓝鸽科技有限公司 多路音频的降噪、输出方法及其***
CN118173113A (zh) * 2020-12-30 2024-06-11 腾讯科技(深圳)有限公司 音频处理方法、装置、智能设备及存储介质、程序产品
CN113571078B (zh) * 2021-01-29 2024-04-26 腾讯科技(深圳)有限公司 噪声抑制方法、装置、介质以及电子设备
CN112951262B (zh) * 2021-02-24 2023-03-10 北京小米松果电子有限公司 音频录制方法及装置、电子设备及存储介质
CN112700787B (zh) * 2021-03-24 2021-06-25 深圳市中科蓝讯科技股份有限公司 一种降噪方法、非易失性可读存储介质及电子设备
CN113393857B (zh) * 2021-06-10 2024-06-14 腾讯音乐娱乐科技(深圳)有限公司 一种音乐信号的人声消除方法、设备及介质
CN113778226A (zh) * 2021-08-26 2021-12-10 江西恒必达实业有限公司 一种基于语音识别技术控制智能家居的红外ai智能眼镜
CN113613112B (zh) * 2021-09-23 2024-03-29 三星半导体(中国)研究开发有限公司 抑制麦克风的风噪的方法和电子装置
CN113851151A (zh) * 2021-10-26 2021-12-28 北京融讯科创技术有限公司 掩蔽阈值估计方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集***
CN104103278A (zh) * 2013-04-02 2014-10-15 北京千橡网景科技发展有限公司 一种实时语音去噪的方法和设备
CN104867499A (zh) * 2014-12-26 2015-08-26 深圳市微纳集成电路与***应用研究院 一种用于助听器的分频段维纳滤波去噪方法和***
CN105280193A (zh) * 2015-07-20 2016-01-27 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于mmse误差准则的先验信噪比估计方法
CN108986832A (zh) * 2018-07-12 2018-12-11 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19957221A1 (de) * 1999-11-27 2001-05-31 Alcatel Sa Exponentielle Echo- und Geräuschabsenkung in Sprachpausen
US8433564B2 (en) * 2009-07-02 2013-04-30 Alon Konchitsky Method for wind noise reduction
JP5634959B2 (ja) * 2011-08-08 2014-12-03 日本電信電話株式会社 雑音/残響除去装置とその方法とプログラム
CN103871421B (zh) * 2014-03-21 2018-02-02 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与***
CN106297817B (zh) * 2015-06-09 2019-07-09 中国科学院声学研究所 一种基于双耳信息的语音增强方法
CN108831500B (zh) * 2018-05-29 2023-04-28 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN108877826A (zh) * 2018-08-29 2018-11-23 昆明理工大学 一种基于多窗谱的语音减噪方法
CN111128213B (zh) * 2019-12-10 2022-09-27 展讯通信(上海)有限公司 一种分频段进行处理的噪声抑制方法及其***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集***
CN104103278A (zh) * 2013-04-02 2014-10-15 北京千橡网景科技发展有限公司 一种实时语音去噪的方法和设备
CN104867499A (zh) * 2014-12-26 2015-08-26 深圳市微纳集成电路与***应用研究院 一种用于助听器的分频段维纳滤波去噪方法和***
CN105280193A (zh) * 2015-07-20 2016-01-27 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于mmse误差准则的先验信噪比估计方法
CN108986832A (zh) * 2018-07-12 2018-12-11 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置

Also Published As

Publication number Publication date
CN111128213A (zh) 2020-05-08
WO2021114733A1 (zh) 2021-06-17

Similar Documents

Publication Publication Date Title
CN111128213B (zh) 一种分频段进行处理的噪声抑制方法及其***
US7756700B2 (en) Perceptual harmonic cepstral coefficients as the front-end for speech recognition
KR101266894B1 (ko) 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법
Shrawankar et al. Techniques for feature extraction in speech recognition system: A comparative study
CN108831499A (zh) 利用语音存在概率的语音增强方法
CN108447495B (zh) 一种基于综合特征集的深度学习语音增强方法
US20210193149A1 (en) Method, apparatus and device for voiceprint recognition, and medium
US20060253285A1 (en) Method and apparatus using spectral addition for speaker recognition
US20090177468A1 (en) Speech recognition with non-linear noise reduction on mel-frequency ceptra
CN108305639B (zh) 语音情感识别方法、计算机可读存储介质、终端
US8566084B2 (en) Speech processing based on time series of maximum values of cross-power spectrum phase between two consecutive speech frames
CN108682432B (zh) 语音情感识别装置
CN105679312A (zh) 一种噪声环境下声纹识别的语音特征处理方法
CN112116909A (zh) 语音识别方法、装置及***
US20150162014A1 (en) Systems and methods for enhancing an audio signal
Sun et al. An adaptive speech endpoint detection method in low SNR environments
CN103971697B (zh) 基于非局部均值滤波的语音增强方法
Flynn et al. Combined speech enhancement and auditory modelling for robust distributed speech recognition
CN112233693B (zh) 一种音质评估方法、装置和设备
TWI749547B (zh) 應用深度學習的語音增強系統
CN113593604A (zh) 检测音频质量方法、装置及存储介质
Shu-Guang et al. Isolated word recognition in reverberant environments
Mallidi et al. Robust speaker recognition using spectro-temporal autoregressive models.
CN112201261A (zh) 基于线性滤波的频带扩展方法、装置及会议终端***
Zhang et al. Fundamental frequency estimation combining air-conducted speech with bone-conducted speech in noisy environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant