CN106782593A - 一种用于声学回声消除的多带结构自适应滤波器切换方法 - Google Patents

一种用于声学回声消除的多带结构自适应滤波器切换方法 Download PDF

Info

Publication number
CN106782593A
CN106782593A CN201710109956.9A CN201710109956A CN106782593A CN 106782593 A CN106782593 A CN 106782593A CN 201710109956 A CN201710109956 A CN 201710109956A CN 106782593 A CN106782593 A CN 106782593A
Authority
CN
China
Prior art keywords
signal
sef
envelope
algorithm
adapting filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710109956.9A
Other languages
English (en)
Other versions
CN106782593B (zh
Inventor
周翊
魏丹丹
师黎明
刘宏清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201710109956.9A priority Critical patent/CN106782593B/zh
Publication of CN106782593A publication Critical patent/CN106782593A/zh
Application granted granted Critical
Publication of CN106782593B publication Critical patent/CN106782593B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

本发明公开了一种用于声学回声消除的多带结构自适应滤波器切换方法,首先获取远端语音信号;然后检测语音端点,输出VAD标志位以及改进的包络判决阈值;语音信号送入扬声器作为期望信号,同时输入到自适应滤波器;自适应滤波器采用可切换的多带结构和相应的自适应算法,根据反馈信息,利用最小均方准则,调整滤波器参数,得到最优解;本发明提供的切换方法是在保证了稳态失调的情况下,充分考虑语音特性,利用了算法在收敛速度上的优势,同时实现了和算法复杂度的优化配置。在对回声消除的实际应用中,单一算法很难满足各种多变的需求,而本发明中可变的切换算法为使用者提供了更多的可能性,这对于自适应回声消除的应用有重要的意义。

Description

一种用于声学回声消除的多带结构自适应滤波器切换方法
技术领域
本发明涉及信号处理技术领域,特别是一种用于回声消除的多带结构自适应滤波器切换方法。
背景技术
声学回波消除(Acoustic Echo Cancellation,AEC)是由于麦克风和扬声器的耦合而广泛存在于车载***、电话会议和助听器等通信领域的重要研究课题。它主要通过自适应滤波算法实现,常用自适应算法有最小均方(Least Mean Square,LMS)算法,最小二乘(Recursive Least Square,RLS)法和仿射投影算法(Affine Projection Algorithm,APA)等。
自适应回声消除是将经过***处理后送往扬声器的信号同时也送往自适应滤波器,输出信号和麦克风输入信号相比较,得到误差信号,然后通过最小均方准则对自适应滤波器系数进行调整,最终使得包含期望信号的目标函数最小化。自适应滤波器是对回声路径的建模,其输出信号接近回声信号,并在***输入端减去这个回声信号,以达到回声消除的目的。然而,当自适应滤波器的输入信号高度相关时,算法收敛速度明显下降。自适应滤波器的稳态失调较高。当前采用的算法普遍存在着收敛速度和稳态失调间的折中问题,需要对信号的不同状态进行区分,且对于不同的状态利用不同的自适应算法处理。
因此,需要一种用于回声消除的多带结构自适应滤波器切换方法。
发明内容
本发明的目的是提出一种用于回声消除的多带结构自适应滤波器切换方法。
本发明的目的是通过以下技术方案来实现的:
本发明提供的一种用于回声消除的多带结构自适应滤波器切换方法,包括以下步骤:
获取远端语音信号;
然后检测语音端点,采用语音活性检测中的包络法来判别有无语音段,并获得VDA标志位和包络判决阈值;
将语音信号送入扬声器并进行播放,同背景噪声和回声信号一起被话筒拾取,共同构成期望信号,所述期望信号用于自适应滤波器的参考信号,同时将语音信号输入到自适应滤波器;
所述自适应滤波器采用可切换的多带结构,所述多带结构设置有若干采用不同自适应滤波器的子带结构;根据当前输入信号的能量值和包络判决阀值确定多带结构中相应子带结构的自适应算法,利用最小均方准则,得到最优解;
通过相应子带结构中的自适应滤波器输出信号;
并将输出信号与期望信号进行比较得到误差信号;
输出误差信号并反馈到自适应滤波器中;
输出残差信号,并传向远端。
进一步,所述VAD标志位采用快慢包络算法来区分有无语音段,并输出VAD的标志位,具体步骤如下:
输入语音信号经过绝对值运算获得信号绝对值,接着经过慢包络模块和快包络模块,两模块均采用一阶IIR滤波器来平滑输入信号,但用不同的变量因子来调节包络信号跟踪输入信号的速度,然后输出快、慢包络值,用以跟踪输入语音信号的变化趋势;
对比慢包络值、快包络值和背景参数,首先比较慢包络和背景参数值,选择高于背景噪声能量的值作为背景参数,平滑滤波用来估计背景噪声,然后选取背景参数值与快包络值比较,当快包络值大时,表明当前在语音区内,输出VAD的标志位1,反之则是无语音区,输出标志位0,根据当前的VAD值即知道当前的语音状态。
进一步,所述改进的包络判决阈值按照以下步骤来进行:
首先利用得到的快包络和慢包络值进行差值运算,得到快慢包络的差值曲线,然后通过最值运算得到最大幅值,作为阀值来切换子带结构中的滤波器的系数;若输入信号的能量大于阀值则表示当前信号短时能量较大,则提高收敛速度;若输入信号的能量小于包络差值能量,则表示当前信号的短时能量较小,则降低计算复杂度。
进一步,所述子带结构中的自适应滤波器采用基于最小干扰准则的归一化子带自适应滤波算法,按照以下步骤进行:
首先以期望信号和滤波器输出信号的最小均方误差为代价函数,然后用负梯度最陡下降算法对代价函数中的权系数矢量求偏导,利用拉格朗日乘子获得最优解模型,最后,做归一化处理,得到相应权系数更新公式,其中,所述权系数包括用于调整误差和收敛速度的步长参数和避免分母为零的正则化参数。
进一步,所述基于多带结构的归一化子带结构中的自适应滤波器,按照以下步骤进行处理数据:
约束权重系数向量来最小化子带结构输出后验误差向量的一阶范数,然后通过拉格朗日乘数法和对角线假设来解决最优化问题,最后用梯度下降法得到权重更新;如果存在干扰噪声,则将后验误差的能量最小化作为最佳步长的求解,采用变步长矩阵归一化子带结构自适应算法。
进一步,所述子带自适应滤波算法采用基于最大相关熵算法,具体按照以下步骤进行:
首先以期望信号和滤波器输出信号的均方误差的负指数函数为代价函数,然后用负梯度最陡下降算法对代价函数中的权系数矢量求偏导,利用拉格朗日乘子获得最优解模型,最后,做归一化处理,得到相应权系数更新公式,其中,所述权系数包括用于调整误差和收敛速度的步长参数和避免分母为零的正则化参数。
进一步,所述可切换的多带结构按照以下步骤进行工作:
输入信号和期望信号经过分析滤波器,所述分析滤波器包括一个低通滤波器、一个高通滤波器以及多个带通滤波器构成,且所述各滤波器间无重叠,覆盖全部区域,所述输入信号被分析滤波器组分割成多个频率子带,并生成相应的子带信号和子带期望信号;
经过滤波器分频后的采样点数为原信号的多倍,利用下采样降低总的采样数,下采样是将信号频率进行多倍扩展,并以2π为周期延拓,生成信号的频谱;
最后,采样信号通过与阀值比较,若输入信号的能量大于阀值则表示当前信号短时能量较大,则提高收敛速度;若输入信号的能量小于包络差值能量,则表示当前信号的短时能量较小,则降低计算复杂度。
由于采用了上述技术方案,本发明具有如下的优点:
本发明提供的切换方法是在保证了稳态失调的情况下,充分考虑语音特性,实现了算法在收敛速度的优势,同时实现了和算法复杂度的优化选择。克服了现有算法收敛速度的增加与稳态之间的矛盾,在对回声消除的实际应用中,单一算法很难满足各种多变的需求,而本发明中可变的切换算法为使用者提供了更多的可能性,这对于自适应回声消除的应用有重要的意义。
本实施例将与语音信号有重要关联的VAD(Voice Activity Detection)技术引入算法,采用新的切换方法,该方法根据信号短时能量特点,利用VAD技术对信号的不同状态进行区分,对于不同的状态利用不同的自适应算法处理。整合两种相似架构的自适应算法各自在收敛速度和运算量上的优点,最终实现了切换算法在收敛速度和计算复杂度的优化配置。切换算法在声学回声消除中能够有效的提高***噪声抵消能力。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
本发明的附图说明如下。
图1为整个方法流程图。
图2为快慢包络算法。
图3为可切换的多带结构。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例1
如图所示,本实施例提供的用于回声消除的多带结构自适应滤波器切换方法,具体步骤如下:获取语音信号,然后检测语音端点,并输出VAD标志位和改进的包络判决阈值;语音信号送入岩石圈作为期望信号,同时输入到自适应滤波器;自适应滤波器采用可切换的多带结构和相应的自适应算法,根据反馈信息,利用最小均方准则,调整滤波参数,得到最优解;通过自适应滤清的子带输出信号;并与期望信号进行比较得到误差信号,输出误差信号并反馈到自适应滤波器中。
本实施例提供的用于回声消除的多带结构自适应滤波器切换方法,包括以下步骤:
获取远端语音信号;
然后检测语音端点,采用语音活性检测中的包络法来判别有无语音段,并根据其中的包络值和能量比较给出改进的包络判决阈值;
语音信号送入扬声器播放出来,同背景噪声和回声信号一起被话筒拾取,共同构成期望信号,用于后面自适应滤波算法的参考信号,同时还将语音信号输入到自适应滤波器;
自适应滤波器采用可切换的多带结构,即根据当前输入信号的能量值和包络判决阀值进行比较,来决定多带结构采取何种自适应算法,根据反馈信息,利用最小均方准则,调整滤波器参数,得到最优解;
通过自适应滤波器的子带输出信号;
并与期望信号进行比较得到误差信号,
输出误差信号并反馈到自适应滤波器中。
所述VAD标志位采用快慢包络算法来区分有无语音段,并输出VAD的标志位;
输入信号经过绝对值运算获得信号绝对值,接着经过慢包络模块和快包络模块,两模块均采用一阶IIR滤波器来平滑输入信号,但用不同的变量因子来调节包络信号跟踪输入信号的速度,然后输出快、慢包络值,用以跟踪输入信号的变化趋势;
对比慢包络值、快包络值和背景参数,首先比较慢包络和背景参数值,选择高于背景噪声能量的值作为背景参数,平滑滤波可用来估计背景噪声,以防止将讲话中的音节停顿误判为无语音区,然后选取其中的较大值同快包络值比较,快包络值大时,表明当前在语音区内,输出VAD的标志位1,反之则是无语音区,输出标志位0,根据当前的VAD值即知道当前的语音状态。
所述改进的包络判决阈值按照以下步骤来进行:
首先利用前文所述快慢包络算法得到的快包络和慢包络值进一步做差值运算,得到快慢包络的差值曲线,然后通过最值运算得到其幅值最大值,将其作为阀值来切换子带滤波器的系数更新算法;若输入信号的能量大于阀值则表示当前信号短时能量较大,需要收敛性能好的自适应算法提高收敛速度;若输入信号的能量小于包络差值能量则表示当前信号的短时能量较小,则使用计算量较低的自适应算法降低计算复杂度。
所述子带自适应滤波算法为基于最小干扰准则的归一化子带自适应滤波算法,按照以下步骤进行:
首先以期望信号和滤波器输出信号的最小均方误差为代价函数,然后用负梯度最陡下降算法对代价函数中的权系数矢量求偏导,利用拉格朗日乘子获得最优解模型,最后,考虑到自适应过程中所受输入滤波的影响,做归一化处理,即得到相应权系数更新公式,其中,包含了用于调整误差和收敛速度的步长参数,和可以避免分母为零的正则化参数。
所述基于多带结构的归一化子带符号自适应滤波,按照以下步骤进行:
可以归结为一个受线性约束的最小化过程,约束权重系数向量来最小化子带输出后验误差向量的一阶范数,然后通过拉格朗日乘数法和对角线假设来解决最优化问题,最后用梯度下降法得到权重更新。如存在干扰噪声,也可进一步将后验误差的能量最小化作为最佳步长的求解,将算法改进为变步长矩阵归一化子带符号自适应算法。
所述子带自适应滤波算法为基于最大相关熵算法,按照以下步骤进行:其步骤与权利5所述类似,只是其代价函数不再是最小均方误差,而是均方误差的负指数函数形式。
所述可切换的多带结构按照以下步骤进行工作:
输入信号和期望信号经过分析滤波器,理想条件下,分析滤波器为一个低通滤波器、一个高通滤波器以及多个带通滤波器构成,且滤波器间无重叠,覆盖全部区域,所以,信号被分析滤波器组分割成多个频率子带,生成相应的子带信号和子带期望信号;
经过滤波器分频后的采样点数为原信号的多倍,为降低计算量,利用下采样降低总的采样数,下采样是将信号频率进行多倍扩展,并以2π为周期延拓,生成信号的频谱;
最后,采样信号通过与阀值比较,采用如权利4所述的方法来选择合适的自适应滤波算法处理。
实施例2
本实施例提供的自适应滤波器采用基于子带和多速率的子带自适应滤波,子带算法利用分析滤波器组将输入信号和期望信号分割成多个频率子带。对子带信号进行抽取获得采样信号,最后对采样信号进行自适应滤波器处理。每个子滤波器的长度通常比全频带滤波器的长度短,计算量低,故收敛速度快。但是这种子带结构会在滤波器的输出端产生混跌分量,从而导致子带自适应滤波器的稳态失调较高。可利用多带结构来解决这一问题;考虑到输入语音信号的高相关性特点,本实施例将与语音信号有重要关联的VAD(VoiceActivity Detection)技术引入算法,采用新的切换方法,该方法根据信号短时能量特点,利用VAD技术对信号的不同状态进行区分,对于不同的状态利用不同的自适应算法处理。整合两种相似架构的自适应算法各自在收敛速度和运算量上的优点,最终实现了切换算法在收敛速度和计算复杂度的优化配置。切换算法在声学回声消除中能够有效的提高***噪声抵消能力。
1.采用快慢包络算法区分有无语音段,输出VAD的标志位:输入信号经过绝对值运算获得信号绝对值,然后经过慢包络模块和快包络模块后输出慢包络值、快包络值。通过对比慢包络值、快包络值和背景噪声获得VAD的值判断当前语音状态。在语音区内,快包络值比慢包络值大;在无语音区内,快包络值比慢包络值慢,而且短时能量大于背景噪声,包络跟踪方法利用快包络和慢包络跟踪输入信号的变化趋势。同时为了防止将讲话中音节停顿误判为无语音区,需要引入背景参数。选择高于背景噪声能量的值作为背景参数,平滑滤波可用来估计背景噪声。
2.提出一种基于包络的判决阀值:包络差值曲线可反映语音信号瞬时值,因此可以作为输入信号幅值的参考。利用VAD的包络曲线差值的最大值作为阀值切换子带滤波器的系数更新算法。算法切换的关键是区分输入信号的状态。若输入信号的能量大于阀值则表示当前信号短时能量较大,需要收敛性能好的自适应算法提高收敛速度。若输入信号的能量小于包络差值能量则表示当前信号的短时能量较小,则使用计算量较低的自适应算法降低计算复杂度。
3.以声学回声消除中的应用为基础,从不同角度出发,可以采用以下几种子带自适应滤波算法,也可根据实际需求做选择。
a.基于最小干扰准则的归一化子带自适应滤波算法,以子带的最小均方误差准则为代价函数,利用拉格朗日乘子获得最优解模型,通过对自适应滤波器系数进行调整,最终使得包含期望信号的目标函数最小化。利用负梯度最陡下降算法求抽头梯度,可得到相应权系数更新公式,其中,包含了用于调整误差和收敛速度的步长参数,和可以避免分母为零的正则化参数。
b.通过约束权重系数向量来最小化子带输出后验误差向量一范数的归一化子带符号算法,通过拉格朗日乘数法和对角线假设,最后得到权重更新。将后验误差的能量最小化作为求解最佳步长的变步长矩阵归一化子带符号自适应算法。
c.还有各种变设计参数、基于最大相关熵等方案可供选择。
4.本实施例提供的用于切换的多带结构不同于传统子带自适应滤波器;每个子带独享一个自适应子滤波器,基于最小干扰准则的多带结构自适应滤波器,由于各个子带使用相同的全带自适应滤波器,因此可以克服存在于滤波器输出端的混叠分量。在该结构中,输入信号和期望信号经过分析滤波器分割,生成相应的子带信号和子带期望信号。子带信号通过滤波器组将信号和期望信号进行下采样抽取,生成抽取后的子带信号,然后进行自适应滤波器处理后,生成自适应滤波器的子带输出信号。本发明中涉及使用不同算法的两个全带自适应滤波器,根据阀值的取值,来决定选取的算法。
本实施例提供的算法避免了现有算法收敛速度的增加几乎都是以稳态失调为代价的问题,在保证了稳态失调的情况下,充分考虑语音特性,实现了算法在收敛速度的优势,同时实现了和算法复杂度的优化选择。在对回声消除的实际应用中,单一算法很难满足各种多变的需求,而可变的切换算法为使用者提供了更多的可能性,这对于自适应回声消除的应用有重要的意义。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的保护范围当中。

Claims (7)

1.一种用于声学回声消除的多带结构自适应滤波器切换方法,其特征在于:包括以下步骤:
获取远端语音信号;
然后检测语音端点,采用语音活性检测中的包络法来判别有无语音段,并获得VAD标志位和包络判决阈值;
将语音信号送入扬声器并进行播放,同背景噪声和回声信号一起被话筒拾取,共同构成期望信号,所述期望信号用于自适应滤波器的参考信号,同时将语音信号输入到自适应滤波器;
所述自适应滤波器采用可切换的多带结构,所述多带结构设置有若干采用不同自适应滤波器的子带结构;根据当前输入信号的能量值和包络判决阀值确定多带结构中相应子带结构的自适应算法,利用最小均方准则,得到最优解;
通过相应子带结构中的自适应滤波器输出信号;
并将输出信号与期望信号进行比较得到误差信号;
输出误差信号并反馈到自适应滤波器中;
输出残差信号,并传向远端。
2.如权利要求1所述的用于声学回声消除的多带结构自适应滤波器切换方法,其特征在于:所述VAD标志位采用快慢包络算法来区分有无语音段,并输出VAD的标志位,具体步骤如下:
输入语音信号经过绝对值运算获得信号绝对值,接着经过慢包络模块和快包络模块,两模块均采用一阶IIR滤波器来平滑输入信号,但用不同的变量因子来调节包络信号跟踪输入信号的速度,然后输出快、慢包络值,用以跟踪输入语音信号的变化趋势;
对比慢包络值、快包络值和背景参数,首先比较慢包络和背景参数值,选择高于背景噪声能量的值作为背景参数,平滑滤波用来估计背景噪声,然后选取背景参数值与快包络值比较,当快包络值大时,表明当前在语音区内,输出VAD的标志位1,反之则是无语音区,输出标志位0,根据当前的VAD值即知道当前的语音状态。
3.如权利要求1所述的用于声学回声消除的多带结构自适应滤波器切换方法,其特征在于:所述改进的包络判决阈值按照以下步骤来进行:
首先利用得到的快包络和慢包络值进行差值运算,得到快慢包络的差值曲线,然后通过能量计算得到最大能量差的幅值,作为阀值来切换子带结构中的滤波器的系数;若输入信号的能量大于阀值则表示当前信号短时能量较大,则提高收敛速度;若输入信号的能量小于包络差值能量,则表示当前信号的短时能量较小,则降低计算复杂度。
4.如权利要求1所述的用于声学回声消除的多带结构自适应滤波器切换方法,其特征在于:所述子带结构中的自适应滤波器采用基于最小干扰准则的归一化子带结构自适应滤波算法,按照以下步骤进行:
首先以期望信号和滤波器输出信号的最小均方误差为代价函数,然后用负梯度最陡下降算法对代价函数中的权系数矢量求偏导,利用拉格朗日乘子获得最优解模型,最后,做归一化处理,得到相应权系数更新公式,其中,所述权系数包括用于调整误差和收敛速度的步长参数和避免分母为零的正则化参数。
5.如权利要求1所述的用于声学回声消除的多带结构自适应滤波器切换方法,其特征在于:所述多带结构的归一化子带结构中自适应滤波器,按照以下步骤进行处理数据:
约束权重系数向量来最小化子带结构输出后验误差向量的一阶范数,然后通过拉格朗日乘数法和对角线假设来解决最优化问题,最后用梯度下降法得到权重更新;如果存在干扰噪声,则将后验误差的能量最小化作为最佳步长的求解,采用变步长矩阵归一化子带结构自适应算法。
6.如权利要求5所述的用于声学回声消除的多带结构自适应滤波器切换方法,其特征在于:所述子带自适应滤波算法采用基于最大相关熵算法,具体按照以下步骤进行:
首先以期望信号和滤波器输出信号的均方误差的负指数函数为代价函数,然后用负梯度最陡下降算法对代价函数中的权系数矢量求偏导,利用拉格朗日乘子获得最优解模型,最后,做归一化处理,得到相应权系数更新公式,其中,所述权系数包括用于调整误差和收敛速度的步长参数和避免分母为零的正则化参数。
7.如权利要求1所述的用于声学回声消除的多带结构自适应滤波器切换方法,其特征在于:所述可切换的多带结构按照以下步骤进行工作:
输入信号和期望信号经过分析滤波器,所述分析滤波器包括一个低通滤波器、一个高通滤波器以及多个带通滤波器构成,且所述各滤波器间无重叠,覆盖全部区域,所述输入信号被分析滤波器组分割成多个频率子带,并生成相应的子带信号和子带期望信号;
经过滤波器分频后的采样点数为原信号的多倍,利用下采样降低总的采样数,下采样是将信号频率进行多倍扩展,并以2π为周期延拓,生成信号的频谱;
最后,采样信号通过与阀值比较,若输入信号的能量大于阀值则表示当前信号短时能量较大,则提高收敛速度;若输入信号的能量小于包络差值能量,则表示当前信号的短时能量较小,则降低计算复杂度。
CN201710109956.9A 2017-02-27 2017-02-27 一种用于声学回声消除的多带结构自适应滤波器切换方法 Active CN106782593B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710109956.9A CN106782593B (zh) 2017-02-27 2017-02-27 一种用于声学回声消除的多带结构自适应滤波器切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710109956.9A CN106782593B (zh) 2017-02-27 2017-02-27 一种用于声学回声消除的多带结构自适应滤波器切换方法

Publications (2)

Publication Number Publication Date
CN106782593A true CN106782593A (zh) 2017-05-31
CN106782593B CN106782593B (zh) 2019-10-25

Family

ID=58959077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710109956.9A Active CN106782593B (zh) 2017-02-27 2017-02-27 一种用于声学回声消除的多带结构自适应滤波器切换方法

Country Status (1)

Country Link
CN (1) CN106782593B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107170461A (zh) * 2017-07-24 2017-09-15 歌尔科技有限公司 语音信号处理方法及装置
CN107346659A (zh) * 2017-06-05 2017-11-14 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法、装置及终端
CN107369458A (zh) * 2017-07-07 2017-11-21 西南交通大学 一种基于熵吸引的最大熵子带回声消除方法
CN107527622A (zh) * 2017-07-07 2017-12-29 西南交通大学 一种基于最大熵的变步长符号子带回声消除方法
CN107578782A (zh) * 2017-07-07 2018-01-12 西南交通大学 一种变核宽度的最大熵子带回声消除方法
CN107731223A (zh) * 2017-11-22 2018-02-23 腾讯科技(深圳)有限公司 语音活性检测方法、相关装置和设备
CN107799123A (zh) * 2017-12-14 2018-03-13 南京地平线机器人技术有限公司 控制回声消除器的方法和具有回声消除功能的装置
CN107871510A (zh) * 2017-07-07 2018-04-03 西南交通大学 一种零吸引变核宽度的最大熵回声消除方法
CN107947759A (zh) * 2017-11-10 2018-04-20 芯海科技(深圳)股份有限公司 一种具有高灵敏度的动态调整的一阶滞后滤波方法
CN108512528A (zh) * 2018-03-05 2018-09-07 电子科技大学 一种cim函数下的比例控制和归一化lmp滤波方法
CN108540680A (zh) * 2018-02-02 2018-09-14 广州视源电子科技股份有限公司 讲话状态的切换方法及装置、通话***
CN108550371A (zh) * 2018-03-30 2018-09-18 北京云知声信息技术有限公司 智能语音交互设备快速稳定的回声消除方法
CN108986837A (zh) * 2018-09-05 2018-12-11 科大讯飞股份有限公司 一种滤波器更新方法及装置
CN109509481A (zh) * 2017-09-14 2019-03-22 国光电器股份有限公司 音频信号回声降低
CN109545239A (zh) * 2018-12-06 2019-03-29 华南理工大学 用于采集体音信号的双麦克风自适应滤波算法及应用
CN109616136A (zh) * 2018-12-21 2019-04-12 出门问问信息科技有限公司 一种自适应波束形成方法、装置及***
CN109946253A (zh) * 2019-04-08 2019-06-28 中南大学 一种光谱去噪方法
CN110459197A (zh) * 2019-07-10 2019-11-15 哈尔滨工业大学(深圳) 用于微弱盲信号去噪与提取的信号增强器及方法
CN110660408A (zh) * 2019-09-11 2020-01-07 厦门亿联网络技术股份有限公司 一种数字自动控制增益的方法和装置
CN111128198A (zh) * 2019-12-25 2020-05-08 厦门快商通科技股份有限公司 一种声纹识别方法、装置、存储介质、服务器及***
CN111246037A (zh) * 2020-03-16 2020-06-05 北京字节跳动网络技术有限公司 一种回声消除方法、装置、终端设备及介质
CN111739548A (zh) * 2020-06-22 2020-10-02 西南交通大学 抗输入噪声的最小误差熵自适应回声消除方法
CN111739562A (zh) * 2020-07-22 2020-10-02 上海大学 一种基于数据选择性和高斯混合模型的语音活动检测方法
CN111916099A (zh) * 2020-10-13 2020-11-10 南京天悦电子科技有限公司 一种变步长助听器自适应回声消除装置及回声消除方法
CN112653799A (zh) * 2020-12-07 2021-04-13 兰州空间技术物理研究所 一种空间站的空间话音设备的回声消除方法
CN113362844A (zh) * 2021-07-26 2021-09-07 西南交通大学 一种低复杂度分离去相关自适应声学回声消除方法及装置
US11151976B2 (en) 2017-10-19 2021-10-19 Zhejiang Dahua Technology Co., Ltd. Methods and systems for operating a signal filter device
TWI767696B (zh) * 2020-09-08 2022-06-11 英屬開曼群島商意騰科技股份有限公司 自我語音抑制裝置及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716381A (zh) * 2004-06-30 2006-01-04 微软公司 用循环正则化作多通道回声的消除
CN1914819A (zh) * 2004-01-29 2007-02-14 皇家飞利浦电子股份有限公司 利用干扰电平控制步长的回声消除器
CN101273618A (zh) * 2005-09-27 2008-09-24 雅马哈株式会社 反馈声音消除设备
US20090238373A1 (en) * 2008-03-18 2009-09-24 Audience, Inc. System and method for envelope-based acoustic echo cancellation
CN103369162A (zh) * 2013-07-09 2013-10-23 西南交通大学 一种低复杂度的电话回声自适应消除方法
CN104009734A (zh) * 2014-05-07 2014-08-27 西安理工大学 梯度变步长lms自适应滤波方法
CN105871356A (zh) * 2016-03-23 2016-08-17 西安交通大学 基于最大混合互相关熵准则的自适应滤波方法
CN106161822A (zh) * 2016-05-12 2016-11-23 西南交通大学 一种基于m估计的归一化子带自适应回声消除方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1914819A (zh) * 2004-01-29 2007-02-14 皇家飞利浦电子股份有限公司 利用干扰电平控制步长的回声消除器
CN1716381A (zh) * 2004-06-30 2006-01-04 微软公司 用循环正则化作多通道回声的消除
CN101273618A (zh) * 2005-09-27 2008-09-24 雅马哈株式会社 反馈声音消除设备
US20090238373A1 (en) * 2008-03-18 2009-09-24 Audience, Inc. System and method for envelope-based acoustic echo cancellation
CN103369162A (zh) * 2013-07-09 2013-10-23 西南交通大学 一种低复杂度的电话回声自适应消除方法
CN104009734A (zh) * 2014-05-07 2014-08-27 西安理工大学 梯度变步长lms自适应滤波方法
CN105871356A (zh) * 2016-03-23 2016-08-17 西安交通大学 基于最大混合互相关熵准则的自适应滤波方法
CN106161822A (zh) * 2016-05-12 2016-11-23 西南交通大学 一种基于m估计的归一化子带自适应回声消除方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
B.WIDROW等: ""Thinking about thinking: the discovery of the LMS algorithm"", 《IEEE SIGNAL PROCESSING MAGAZINE》 *
JINGEN NI AND FENG LI: ""Adaptive combination of subband adaptive filters for acoustic echo cancellation"", 《IEEE TRANSACTIONS ON CONSUMER ELECTRONICS》 *

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107346659B (zh) * 2017-06-05 2020-06-23 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法、装置及终端
CN107346659A (zh) * 2017-06-05 2017-11-14 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法、装置及终端
CN107527622A (zh) * 2017-07-07 2017-12-29 西南交通大学 一种基于最大熵的变步长符号子带回声消除方法
CN107578782A (zh) * 2017-07-07 2018-01-12 西南交通大学 一种变核宽度的最大熵子带回声消除方法
CN107369458A (zh) * 2017-07-07 2017-11-21 西南交通大学 一种基于熵吸引的最大熵子带回声消除方法
CN107871510A (zh) * 2017-07-07 2018-04-03 西南交通大学 一种零吸引变核宽度的最大熵回声消除方法
CN107527622B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种基于最大熵的变步长符号子带回声消除方法
CN107578782B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种变核宽度的最大熵子带回声消除方法
CN107170461A (zh) * 2017-07-24 2017-09-15 歌尔科技有限公司 语音信号处理方法及装置
CN107170461B (zh) * 2017-07-24 2020-10-09 歌尔科技有限公司 语音信号处理方法及装置
CN109509481B (zh) * 2017-09-14 2020-12-15 国光电器股份有限公司 音频信号回声降低
CN109509481A (zh) * 2017-09-14 2019-03-22 国光电器股份有限公司 音频信号回声降低
US11151976B2 (en) 2017-10-19 2021-10-19 Zhejiang Dahua Technology Co., Ltd. Methods and systems for operating a signal filter device
CN107947759A (zh) * 2017-11-10 2018-04-20 芯海科技(深圳)股份有限公司 一种具有高灵敏度的动态调整的一阶滞后滤波方法
CN107731223A (zh) * 2017-11-22 2018-02-23 腾讯科技(深圳)有限公司 语音活性检测方法、相关装置和设备
US11138992B2 (en) 2017-11-22 2021-10-05 Tencent Technology (Shenzhen) Company Limited Voice activity detection based on entropy-energy feature
CN107799123A (zh) * 2017-12-14 2018-03-13 南京地平线机器人技术有限公司 控制回声消除器的方法和具有回声消除功能的装置
CN108540680A (zh) * 2018-02-02 2018-09-14 广州视源电子科技股份有限公司 讲话状态的切换方法及装置、通话***
CN108512528A (zh) * 2018-03-05 2018-09-07 电子科技大学 一种cim函数下的比例控制和归一化lmp滤波方法
CN108550371A (zh) * 2018-03-30 2018-09-18 北京云知声信息技术有限公司 智能语音交互设备快速稳定的回声消除方法
CN108986837A (zh) * 2018-09-05 2018-12-11 科大讯飞股份有限公司 一种滤波器更新方法及装置
CN108986837B (zh) * 2018-09-05 2021-08-17 科大讯飞股份有限公司 一种滤波器更新方法及装置
CN109545239A (zh) * 2018-12-06 2019-03-29 华南理工大学 用于采集体音信号的双麦克风自适应滤波算法及应用
CN109545239B (zh) * 2018-12-06 2021-11-05 华南理工大学 用于采集体音信号的双麦克风自适应滤波算法及应用
US11735200B2 (en) 2018-12-06 2023-08-22 South China University Of Technology Dual-microphone adaptive filtering algorithm for collecting body sound signals and application thereof
CN109616136B (zh) * 2018-12-21 2020-01-17 出门问问信息科技有限公司 一种自适应波束形成方法、装置及***
CN109616136A (zh) * 2018-12-21 2019-04-12 出门问问信息科技有限公司 一种自适应波束形成方法、装置及***
CN109946253A (zh) * 2019-04-08 2019-06-28 中南大学 一种光谱去噪方法
CN110459197B (zh) * 2019-07-10 2021-09-24 哈尔滨工业大学(深圳) 用于微弱盲信号去噪与提取的信号增强器及方法
CN110459197A (zh) * 2019-07-10 2019-11-15 哈尔滨工业大学(深圳) 用于微弱盲信号去噪与提取的信号增强器及方法
CN110660408A (zh) * 2019-09-11 2020-01-07 厦门亿联网络技术股份有限公司 一种数字自动控制增益的方法和装置
CN110660408B (zh) * 2019-09-11 2022-02-22 厦门亿联网络技术股份有限公司 一种数字自动控制增益的方法和装置
CN111128198B (zh) * 2019-12-25 2022-10-28 厦门快商通科技股份有限公司 一种声纹识别方法、装置、存储介质、服务器及***
CN111128198A (zh) * 2019-12-25 2020-05-08 厦门快商通科技股份有限公司 一种声纹识别方法、装置、存储介质、服务器及***
CN111246037B (zh) * 2020-03-16 2021-11-16 北京字节跳动网络技术有限公司 一种回声消除方法、装置、终端设备及介质
CN111246037A (zh) * 2020-03-16 2020-06-05 北京字节跳动网络技术有限公司 一种回声消除方法、装置、终端设备及介质
CN111739548A (zh) * 2020-06-22 2020-10-02 西南交通大学 抗输入噪声的最小误差熵自适应回声消除方法
CN111739548B (zh) * 2020-06-22 2022-03-22 西南交通大学 抗输入噪声的最小误差熵自适应回声消除方法
CN111739562A (zh) * 2020-07-22 2020-10-02 上海大学 一种基于数据选择性和高斯混合模型的语音活动检测方法
CN111739562B (zh) * 2020-07-22 2022-12-23 上海大学 一种基于数据选择性和高斯混合模型的语音活动检测方法
TWI767696B (zh) * 2020-09-08 2022-06-11 英屬開曼群島商意騰科技股份有限公司 自我語音抑制裝置及方法
US11622208B2 (en) 2020-09-08 2023-04-04 British Cayman Islands Intelligo Technology Inc. Apparatus and method for own voice suppression
CN111916099A (zh) * 2020-10-13 2020-11-10 南京天悦电子科技有限公司 一种变步长助听器自适应回声消除装置及回声消除方法
CN112653799A (zh) * 2020-12-07 2021-04-13 兰州空间技术物理研究所 一种空间站的空间话音设备的回声消除方法
CN113362844A (zh) * 2021-07-26 2021-09-07 西南交通大学 一种低复杂度分离去相关自适应声学回声消除方法及装置
CN113362844B (zh) * 2021-07-26 2022-05-10 西南交通大学 一种低复杂度分离去相关自适应声学回声消除方法及装置

Also Published As

Publication number Publication date
CN106782593B (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
CN106782593B (zh) 一种用于声学回声消除的多带结构自适应滤波器切换方法
AU2003258407B2 (en) Method and system for processing subband signals using adaptive filters
CN103632675B (zh) 个人通信中降噪和回波消除时的噪声估计
US7617099B2 (en) Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
JP5450567B2 (ja) クリアな信号の取得のための方法及びシステム
US7773759B2 (en) Dual microphone noise reduction for headset application
US8131541B2 (en) Two microphone noise reduction system
CN108172233B (zh) 基于远端估计信号和误差信号回归因子的回声消除方法
CN1223166C (zh) 在回波消除***中用于改进子频带自适应滤波的方法和装置
CN107484080A (zh) 音频处理装置及用于估计声音信号的信噪比的方法
CN105575397B (zh) 语音降噪方法及语音采集设备
EP1875466A2 (en) Systems and methods for reducing audio noise
WO2000004698A1 (en) Digital adaptive filter and acoustic echo canceller using the same
KR20130108063A (ko) 다중 마이크로폰의 견고한 잡음 억제
CN105794190A (zh) 回声消除
WO2000062280A1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
KR20070037439A (ko) 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제
CN104410761B (zh) 一种仿射投影符号子带凸组合自适应回声消除方法
WO2011153727A1 (zh) 消除窄带干扰的盲自适应滤波方法、装置及宽带传输***
WO2016034915A1 (en) Audio processing circuit and method for reducing noise in an audio signal
WO2020124325A1 (zh) 一种回声消除中的自适应滤波方法、装置、设备及存储介质
CN107068162A (zh) 一种语音增强方法、装置及终端设备
US5905969A (en) Process and system of adaptive filtering by blind equalization of a digital telephone signal and their applications
CN111916099B (zh) 一种变步长助听器自适应回声消除装置及回声消除方法
Herbordt et al. Efficient frequency-domain realization of robust generalized, sidelobe cancellers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant