CN1129486A - 通信***中降低传输噪声的方法 - Google Patents

通信***中降低传输噪声的方法 Download PDF

Info

Publication number
CN1129486A
CN1129486A CN94191041A CN94191041A CN1129486A CN 1129486 A CN1129486 A CN 1129486A CN 94191041 A CN94191041 A CN 94191041A CN 94191041 A CN94191041 A CN 94191041A CN 1129486 A CN1129486 A CN 1129486A
Authority
CN
China
Prior art keywords
frame
noise
voice
iteration
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN94191041A
Other languages
English (en)
Inventor
伍德森·戴尔·怀恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of CN1129486A publication Critical patent/CN1129486A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/18Automatic or semi-automatic exchanges with means for reducing interference or noise; with means for reducing effects due to line faults with means for protecting lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/40Applications of speech amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Noise Elimination (AREA)
  • Telephonic Communication Services (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Abstract

通过使用线性预测编码语音模型的交互评估以滤除噪声的信号处理过程,电信网络的服务可克服传输噪声带来的恼人的后果。语音模型滤波器使用了根据由话音活动检测器判定否为仅噪声帧的输入信号帧的取样值,对当前噪声功率谱密度的精确修改评估。使用线性预测编码语音模型以计算输入信号的独特的方法基于选定数目的最近过去帧和至多两个将来帧对当前帧进行帧内迭代。当无法从噪声源推知噪声信号时这种处理方法是有效的。

Description

通信***中降低传输噪声的方法
本发明涉及在一个嘈杂的的通信信道或网络中改善语音质量,尤其涉及一种装置,它通过使用独有的线性预测编码,来连续地消除噪声成份,从而改善语音质量。
在所有形式的语音通信***中,由于多种原因而产生的噪声可以干扰用户的通信,破坏性的噪声可能在***的输入端、传输通路中和接收端产生,混入在语音中。噪声的存在是恼人的或干扰用户的通话,极大地影响语音质量,并且降低语音编码和语音识别设备的性能。
语音改善技术对于蜂窝无线电话***是很重要的,因为这些***可能是在吵闹的汽车上和嘈杂的信道上使用,或在喧闹环境中的付费话机中使用,或在嘈杂的无线链路或其它低质量的通路和连接上的长途通信***中使用,或在具有很大噪声的话源的电话会议***中使用,或使用在空一地通信***中,这里驾驶舱中极大的噪声会破环驾驶员的通信,这将是具有破坏性和危险的。进一步地说,在自动拔号的语音识别***中,如果识别器的算法是基于纯净语音的统计模型,那么在嘈杂环境中识别的精度将大大降低。
在传输通路中的噪声尤其难于消除,其中一个原因是由于无法由噪声源中推断出噪声信号,因此就不能通过从噪声的直接测量中产生一个“误差”信号,然后由相位反转来消除这个误差信号的方法来抑制噪声。
各种方法已经尝试及使用,用于当噪声分量无法直接测量到时改善具有噪声的语音质量。对这些技术的论述可在“Proceedings ofthe IEEE”Vot 67,No.12,December 1979,SectionV.pp1586—1604中由J.S.Lim和A.V.Oppenhein所著的“具有噪声的语音的质量改善和带宽压缩“文章中找到。这些技术包括从所得到的具有噪声的信号计算出的整个谱中减去估计的噪声幅度谱,和由Lim和Oppenhein提出的一种基于迭代模型的滤波器,此滤波器尝试找到语音分量的最佳全极点模型,此模型给出了全部具有噪声的信号和对噪声能量谱的评估。J.H.L.Hansen和M.A.demets,在IEEE Transaction On signal processing,Vol 39,No.4,April 1991,PP.795—805的文章“语音识别应用中的受限迭代语音质量改善”中,根据这种模型的方法,提出了一种非实时的语音平滑器,其中在Lim—Oppenhein迭代中的语音模型上加上了时间的约束用以限制模型对语音特性的改变。
使用在Lim/Oppenhein参考资料中所提出的早期方法可以在处理后改善信噪比,但由于在滤波后引入非平稳噪声,其对语音质量的改善并不理想,即使很小的非平稳噪声也会影响人的听力。使用Hansen的非实时的平滑器的方法的好处在于其可减少仍存在的非平稳噪声,Hansen的平滑方法比在Lim/Oppenhein参考资料中所给出的方法提供了更好的语音质量,但这种方法无法在实时环境下使用,因为它要在每个时间帧处理所有的过去和将来的数据,这样此技术就无法在一个通信环境下有效地使用,以下所述的是对Hansen平滑器的一个改进方法,使得滤波器可在这种环境下使用。
本发明是一个用于通信网络的信号处理方法,它使用LPC语音模型及在实时操作中对噪声功率谱的连续的评估,由在每次迭代产生的重滤波信号的修改,及在极点数目和它们在时间帧间的移动的时间约束来滤去噪声。具有破坏性噪声的输入语音信号输入到特殊的迭代线性Wiener滤波器中,其目的是实时地输出传送到网络中的语音的评估值。
滤波器要求对当前噪声功率谱密度有一个精确的评估,这可以由在语音技术中典型使用的从噪声间隔的的评估而获得。对这些仅噪声帧的检测是由话音活动检测器(VAD)完成的。当在VAD中检测到仅噪声状态时,滤波器的输出就会衰减以使噪声的能量不会在网络中传播开来。
当具有噪声的语音由滤波器在时间帧中检测到时,就要作出评估,这个语间是活音的还是非话音的,根据所检测的语音的类型相应地改变在迭代滤波器中所假定的LPC模型的阶数。普遍地,如果在该时间帧中为一个话音语音,LPC模型的阶数为M=Fs+(4或);如果在该时间帧中为非话音语音,M=Fs,其中Fs为以KHZ为单位的语音的带宽。这种动态调整模型阶数的方法用于抑制杂散的模型极点,这些极点可以在滤波后的语音中产生依赖时间的调制的类话音噪声。
根据本发明的另一方面,提供了跟踪噪声谱变化的功能,此功能由在某种程度上依赖于新的与老的噪声谱评估的“距离”以修改新的反噪声帧来实现。可根据在评估新的噪声谱修改前必须检测到的连续新的噪声帧的最小数目和给出的新噪声帧的权重来设置参数。
以下详细描述了在电信网络中使用的遵循本发明的特殊专有实施方式的改进方法,此方法用在使用滤波器的迭代评估技术领域中,此滤波器结合使用一个自适应的语音模式和噪音谱评估,及用于抑制属于无法直接测量类型的噪声的方法。
图1是一个包含本发明的通信网络的说明性示意图。
图1A是信号处理资源;
图2是按照本发明实现的平滑操作的示意图;
图3是显示语音改善方法框架的流程图,
图4是产生受限的语音改善的迭代序列的装置的示意图;
图5是一个示意图,描述了对语音模型的LPC根的帧间平滑操作和从这次迭代到下次迭代的帧内LPC自相关矩阵的驰豫;
图6a是显示了修改当前帧的每次迭代的方法的示意图;
图6b是显示了修改当前帧的每次迭代的改进方法的示意图;
图7a和7b是一个平滑权重表,此权重用于LSP的位置根在当前帧邻近的7个语音帧间进行平滑处理;
图8和图9显示了噪声预测器功能的信号轨迹;
图10是对修改在Wiener滤波器中使用的所要求的噪声的步骤的描述。
本发明是一个对信道内无法获得单独的噪声基准的语音加噪声进行滤波的改进过程,可实时操作。虽然本发明的原理同样可应用于其它需要减少在电子语音传输媒介上的噪声的许多场合,但这里就结合电信网络加以说明。一个典型的电信网络在图1中显示,它包括了一个位于远端的交换机10,许多通信终端如话机11,通过本地线路,如可能为双绞线的线路12,连到这个交换机上。出局的信道如通路13从远端局12发散出来,通路13可能跨越国际边界14,通路13继续连接到美国的基地中心局15,此局包括一个交换机16,这个交换机可以是N0.4ESS交换机。它可以连入包含许多条入局通路的输入集17,其中就包括了通路13。
交换机16建立一条内部路径,如路径18,在例子中,用来连接从信道13来的入局呼叫到最终的出局传输信道19,此信道为出局信道组19中的一条,假定在从信道13来的入局呼叫中包含了在任何连接段10,11,12,13所产生的噪声,因此无法直接测量噪声源。
根据本发明,在逻辑单元20做出决定,在从信道13来的交换机的输出中是否存在高于某个预定阀值的噪声。逻辑单元20在排除了传真,调制解调器及其它可能后,决定呼叫是否为话音的。逻辑单元20进一步决定发端号码是否为要提供降低传输噪声服务的客户。如果逻辑单元20作出了上述所有3个决定,呼叫由交换机22连接到处理单元21,否则呼叫直接传到信道19。在图中只显示了一个处理单元21,所有交换机16的出局信道都与另外处理器21(在图中没有显示)相连。
从具有噪声的信道13来的呼入信号最好由一个模拟滤波器(在图中设有显示)处理,这个滤波器具有受限于基带电话信号的频率响应。
在这里讨论的***中,带有噪声的语音在处理器21中以8KHZ频率被数字化,时间序列在帧中处理。使用的帧的大小为160个取样值(20ms),并且,在这些数据块中有50%的数据重叠以保持重构滤波后语音的连续性。
参考图1A,处理器21包括一个Wiener滤波器,其中通过假定全极点LPC模型和迭代处理每帧获得的未知参数来评估滤波器的信号谱。带有噪声的呼叫被连到滤波器23,这个呼叫也通过旁路24连到话音活动检测器(VAD)25,此检测器可以检测到噪声或语音加噪声帧,决定一个语音帧是话音的或是非话音的。在Wiener滤波器中使用的所要求的噪声谱可收VAD检测到的反噪声帧来评估。
当检测到一个处理为反噪声时,VAD25向噪声抑制电路26发送信号,接通抑制器27在这种方式下,当输入到滤波器23的仅噪声进入到连到在终端28的远端收听人的出局通路19之前,这个噪声被显著地衰减掉。另外,当以噪声帧被检测到时,VAD向滤波器23中的修改功能块29发信号,根据当前噪声帧来评估一个新的噪声谱,及用以前的噪声的评估值加权这个新的噪声谱。
当VAD检测到语音时,单元26的输入连接到单元23,以便滤波后的语音传送到出局线路19。此外,如果检测到话音语音,用于在单元23中的迭代Wiener滤波器的LPC语音模型的阶数被设置为10阶;如果检测到非话音语音,其被设置为4或6阶。这样调整语音模型阶数的目的在于对于LPC极点的迭代搜索会导致在信号功率谱与噪声功率谱之比较低的频带部分产生错误的共振峰,从而在滤波后的输出中产生具有随机频率和持续时间的对人耳有害的噪声音调,即使这时相对于平均信号振幅来说噪声是非常小的。因此,从带宽考虑非话音语音的LPC阶数通常为话音语音的一半,并且非话音语音比话音语音弱,调整4C的阶数以使语音模型适当是很重要的。
迭代滤波器23所使用的处理过程根据3Lim/Oppenheim参考资料中所给出的方法和J.H.L.Hansen在Hansen/Clements的参考资料中提出的用于非实时AVTO—LSP平滑器的用以改进迭代收敛性的帧间和帧内的平滑方法。可根据本发明原理实现不同的方法。滤波器23对呼入带有噪声的语音进行处理,获得近似准确的语音内容。滤波器的操作在以下描述。
如果语音还没被转换成数字形式,滤波器21包含一个输入信号的模拟一数字变换器30,它产生取样输入的帧数据块。帧的大小为160个取样值或20msec,帧的持续时间是足够地长,可把语音认为是LPC模型的一个近似统计平稳的过程。迭代Wiener滤波器和作为此滤波器一部分使用的语音过程的LPC模型都基于平稳过程的假设。因此,帧在这些很短的时间块内被处理是很重要的。
参考图2,输入信号加上噪声可表示为y[n]=s[n]+d[n],其中y是可获得的输入取样值,s和d分别是信号与噪声部分。这些取样值放入重叠的帧中,重叠率如50%,每个数据块由一个时间窗口加权,如Hanning窗口,以便在时间上正确分隔的重叠的加窗帧之和加在一起给出了初始的输入时间序列。窗口的使用减少了用于对数据块进行评估的LPC模型的差,重叠帧的使用可以使输出到图2中单元19的重构滤波信号保持连续性。
正如在Hansen/coements参考资料中的迭代AVTO—LSP平滑器中那样,在处理当前输入数据帧的过程中,根据本发明,对Wiener滤波器的每次迭代存在二类约束。它们是应用于当前帧的每次帧内迭代的LPC自相关矩陈驰豫约束和当前帧的LPC语音模型极点位置用在对相邻的过去和将来帧的每次迭代中实现的LPC极点位置进行帧间平滑。LPC极点约束并不直接应用,因为它们以Z平面上的复数形式出现,并且帧间平滑的复极点位置的关系也不清楚。一个间接但较简单的方法可能是使用一个与LPC极点等价的叫做线谱偶对的表示方法。此方法的细节在Hansen/Clements的参考资料和由S.Fururi,Marcel Dekker公司(NewYork,NY)在1989年出版的“数字语音处理、合成和识别“一书中的第五章中讨论。N阶LPC模型的极点位置可等价地由一套位于复数Z平面单位圆上N/2LSP“位置”根和N/2LSP“差分”根表示。这种LPC极点的等价LSP表达方法的用处在于信号LPC模型的谱的轻微阻尼共振峰的位置与LSP位置根紧密相关,并且在这些共振峰处的LPC谱的带宽与LSP的差分根紧密相关。对于一个稳定的LPC模型,这两类LSP根正好位于单位圆上并在圆上相互交替出现。LSP根的位置顺序是很明显的,它们在时间帧间的平滑过程比复数LPC根的平滑过程简单得多。总之,通过平滑等价的LSP位置根,和应用一个下限值于“差分”根到相邻的“位置”根的最小距离,在相邻帧的同次迭代的LPC极点间来平滑被滤波的每次迭代的LPC极点。后一种约束限制了任何LPC模型的共振峰的尖锐度,使之接近于语音波形。
本发明要求在邻近的时间帧间进行LSP位置平滑,但在通信网络的实时应用所实现的滤波器中,仅可得到在正进行滤波的当前帧之后的几个帧。对于20msec,重叠率为50%的帧,由在图2所示的使用两个将来帧所施加的最小延时为30msec,即使这么小的延时在一些通信网络中也是重要的。在此讨论的滤波器假设使用四个过去帧和2个将来帧进行平滑;虽然可得到所有的过去帧,但只使用与当前帧相关的那些帧。
对当前帧K所执行的受限的迭代步骤在图3所示,迭代1,…,J的细节在图4中所示。在Wiener滤波器(WF)中使用信号和噪声功率谱的评估为C.Sy(f)和Sd(f),由在频率域中滤波输入块y[n]起始了由这种滤波器处理的Wiener滤波器的LSP循环,即初始的滤波器的信号谱为总的输入谱乘以C,使之有预期的信号功率:Psignal=Ptotal-Pnoise。初始化后,图3的循环执行以下步骤,对帧个进行迭代滤波;
(1)从在时间域评估WF输出信号的LPC参数来起始迭代的循环,在LPC的自相关计算依赖于该帧的前几次迭代的自相关值的驰豫。这个驰豫步骤尝试地进一步稳定最佳语音LPC模型的迭代搜索。这在以下结合图5讨论。
(2)从由(1)中对语音帧K的第3次迭代所发现的LPC模型中,解出LSP的位置根Pj和差分根Qj,这要求每个次数为LPC阶数一半的两个多项式有实数根的解。
(3)按照图2和图5C所示,在相邻帧间对当前帧K平滑LSP的位置根Pj,并限制LSP差分根Qj偏离平滑的Pj根的距离,每个差分根Qj被限制为它与最近的平滑Pj根的距离要比一个最小距离Dmin大。这可以防止平滑的LPC极点位置被驱动到复平面Z的单位园上。这种“发散性”在Hansen/Clements为参考资料中提出,认为其是在Lim/Oppenheim参考资料的Lim-Oppenheim迭代滤波器的一个问题,这种约束是实际语音传输所必须的。Dmin=0.086弧度已在本发明的通信测试中使用。
(4)把平滑的LSP根转换为平滑的LSP参数,计算LPC信号模型的功率谱Ss(f)j并定标使平均的功率等于估计的当前K帧的信号功率:
Psignel=Ptotal-Pnoise
(5)如在图3和图4所示,使用平滑的LPC模型的信号谱Ss(f)j估计的当前噪声功率谱Sd(f)去构造下一次迭代的Wiener滤波函数项,因为这个滤波函数是具有幂数Pow的通常的非随机的WF。在0.6至1.0之间的Pow值已在本方法的通信测试中使用。较大的Pow值使每次迭代产生的变化也较大,而较小的Pow值使对信号分量的迭代搜索较为稳定。
(6)用当时的Hj(f)过滤以前迭代的WF时间序列输出Sj-1[n]与初始的输入数据y[n]的组合,以获得信号评估Sj[n]的下一次迭代。使用的线性组合为(1-B)Xy[n]+BXSy-1[n],其中0≤B≤1。如果B=0,滤波器变成非受限的Lim/Op-penheim迭式滤波器;如果B=1,下一个WF的输入是前一上WF的输出,正如Hansen/Clements参考资料中给出的AVTO—LSP平滑器所做的那样。在0.8至0.95之间的B值在本滤波器的绝在部分实验中使用。使用这些B值,可同时具有Lim/Oppenheim滤波器和Hansen平滑器的一些所要求的特性。本发明中的这种权概念是新颖的,它提供了最终噪声内容相对在迭代滤波语音中观测的高频滤波程度的额外控制。
结合在Lim/Oppenheim和Hansen/Clements参考资料中给出的以前两种信号模型的迭代算法的特性,特别是Wiener滤波器输入的每次迭代的加权组合,发现可产生具有较少消声的语音评估,同时折衷地会稍微增加输出的残留噪声。组合方法在图2和图3中所示,其中可见第2次迭代的滤波器的输入信号为总输入y[n]和Wiener滤波器在第(j-1)次迭代的输出S[n]j-1。
(7)在本方法的当前实施过程中,迭代的次数intra是通过实验来决定的输入参数。由实验结果,4至7次的帧内迭代成[Intra,pon]的形式表示,如[7,0.65],[5,0.8]和[4,1.0],其中反馈因子B在0.80至0.95之间。它们的最佳值取决于噪声类别和语音类型。对于宽带白噪声,典型地可取intra=6;当噪声功率谱在0至4KHZ的活音频带谱内偏离了1KHz,迭代4或5次就足够了。
本发明的一个重要方面如在图1A部件25中和图3中所示,话音活动检测器(VAD)有多个应用,它既可检测仅噪声帧,也可在语音存在时通过检测这帧为话音或非话音来决定这帧模型的最佳阶数。正如以前所指出的,对话音和非话音语音帧,LPC语音模型的最佳阶数是不同的。同样的,正如以前指出的,仅当在足够多的相继帧中设有检测到语音信号时,才修改噪声谱。在检测到仅噪声的一个时间间隔内,在交换机26中的噪声抑制器27被激活以衰减输出信号,而迭代滤波器23停用。但是如果检测到语音,交换机26连通30到输出19上。语音的类别,即其为话音的或非话音,决定了用于迭代的LPC语音模型的阶数。检测到三种可能状态(噪声帧,话音帧和非话音帧)的变化,在平滑当前第K帧前,会引起以前帧K—4,K—3,K—2和K—1的LSP历程重新初始化,这样做对最佳语音滤波是必须的符合逻辑的,因为对过去时间帧平滑的目的是通过使用平均帧间的短期平稳性来平均各异的噪声。
图6b显示的为取得滤波器23的实时操作的处理帧的方法。第K帧假定为当前时间的参考点,第K—4,K—3,K—2和K—1帧是以前处理过的归档帧,第K+1和K+2帧是可获得的将来帧。正如在Hansen/Clements参考资料给出的平滑方法,通过使用在处理多次迭代中过去帧的LSP历史状况,滤波器23在第K帧每次迭代时使用过去和将来帧的LSP根来平滑第K帧语音模型的LSP根。但是,与Hansen/Clements参考资料中的非实时平滑器不同的是,对每个帧本发明只使用两个将来帧,在为每个帧进行迭代期间也存储所要求的过去帧的LSP历史状况,以便于在帧内迭代时,使用累积的前四个帧的历史状况来平滑当前帧。按照在Hansen/Clements资料给出的方法,帧间的权重逐渐减小,每个LSP根的锥度取决于当前帧的SNR值和到第K帧为止的SNR的历史状况。
本发明的另一个改进是使用表来查寻用在帧间的帧的LSP权重,用在本发明的权重表可为在图7所示的类型,但在Hansen/Clements参考资料要求的权重是由公式很费时计算得出的,与在Hansen/Clements参考资料使用的公式所施加的约束不同,在图7表中使用的可以容易和独立地调整。语音帧的阈值可以独立地选择,据此一个加到特定LSP根的权重矢量可从一个表转换到另一个表。构造平滑矢量的一般方法是对较高阶的LSP位置(即较高的其振峰频率)平滑得多一些,如在这些表中从左到右所示。这是由于在较高阶LSP语音位置观测到的给定SNR对应噪声的较大影响所致影响表中值的另一个因素是当帧的SNR较低时,平滑程度宽广而均匀;而当SNR增大时,平滑程度变小,当SNR达到最高时,就设有平滑作用了。这种趋势是由于当帧的SNR改善时,噪声对滤波后的语音的影响也随着减小。用于从一个权重矢量表转换到另一个表的帧的SNR阈值目前被选为在VAD中评估的噪声功率运行评估Npow的倍数,阈值是逐渐增加的,当从表Win1转到Win2时,Th1=2Npow;当从表Win2转到Win3时,Th2=3Npow;当从表Win3转到Win4时,Th3=7Npow;当从表Win4转到Win5时,Th4=11Npow;如果在足够长时间内,都出现具有较低SNR的帧时,就使用表WinO。
根据本发明,使用一个话音活动检测器(VAD)从仅噪音中评估噪音的功率谱Sd(f)是一个较好的方法。在图3所示的滤波过程是基于这样一种假设,即语音中存在的噪声具有与评估的Sd(f)相同的平均功率谱。如果噪声在统计上是广义平稳的,噪声评估就无需修改。但是,对于在这里所示的语音改善应用及对于其它的降低传输噪声的应用,噪声的能量只是大致平稳。在这些情况下,需要对Sd(f)进行连续的评估,相应地,一个VAD,如在图1A中的检测器25,它对噪声有较强的抗干扰能力,可以在实际环境SNR下识别何时语音不存在。正如在图10所示,使用在语音段间检测到的仅噪声帧修改噪声功率谱的评估。一个在图1A应用中合适使用的VAD可以在IEEE Conf,ICA ssp1989,Section S706,PP.369—372中D.K.Freeman etal所著“用于PAN—EVRO—PEAN的数字蜂窝移动电话服务的话音活动检测器“文章所讨论的GSMO6.32VAD标准中获得。
滤波前和滤波后的语音信号在图8和图9中所示,它表明了当没有检测到语音时,如何使用话音活动检测方法去触发对输出信号的衰减。如在Freeman etal的参考资料中讨论的,在一个噪声帧VAD的激活是被检测的输入电平和“非语音”属性的重复帧判定的卷积平衡。
优选地,一个VAD语音类别的判定可以在图3所示的LPC模型步骤的前端使用。这是由于可以按照在当前处理帧的正被滤波的语音类别(话音的或非话音的)最好地调整如在AVTO—LSP算法中的LPC阶数那样的参数设置。如果在噪声存在情况下能可靠地鉴别处理帧的语音类别,语音质量就可以更好地改善。
按照本发明的另一方面,参考图3和图10,可以使用一种装置来改进噪声信号谱变化的灵敏度,这种装置可根据新的噪声谱评估Sd(f)new与前次评估Sd(f)间的差异程度修改新的仅噪音谱函数Sd(f)。如果用Sd(f)L-1表示前次噪声谱,那么修改谱为:
Sd(f)L=(1-A)Sd(f)L-1+A.Sd(f)LSd(f)new
其中0≤A≤1,为频带内误差Sd(f)L-1-Sd(f)new p的归一化平均数,P的典型值为1→2。当新的噪声谱评估按近于前次评估形状时,A的值接近为0;但当两个谱的形状差别较大时,A的值将接近为1,并且在Sd(f)L中这些新的噪声帧将占很大比重。由在合适SNR范围下评估相对保守的VAD做出噪声帧的制定,因此在高于10dBSNR条件下,正确判定噪声的概率很高。噪声修改的时间间隔并不是本方法中的一个参数,而只用于平均谱的差异。为了减少评估谱Sd(f)new的方差,需要得到VAD做出的前多个相邻噪声帧的判定且修改是有效的。在改进方法测试中,使用5或6个相连的噪声帧去修改谱。
正如以前讨论的,在AVTO—LSP滤波方法中使用两种约束的改进基于Lim/Oppenheim模型的迭代滤波器,它们是应用于LPC模型每次迭代可计算的自相关矩阵上的帧内自相关驰豫和用在对被滤波帧周围的时间帧的迭代中所产生的LSP根进行帧平滑。每次迭代中执行的约束操作在图5显示。平滑操作显示了在从前次迭代信号结果S[n]j-1获得这次迭代的Wiener滤波器(WF)的信号功率评估Ss(f)j的迭代期间约束施加的次序。采用WF滤波整个信号加噪声y[n],在这个WF中每次迭代对信号谱的新的评估***到WF模型中,在Lim/Oppenheim参考资料定义的统计假设下,滤波的迭代序列在理论上将收敛至“最佳”的信号评估。在实际应的语音信号和噪声类型中,需要额外的帧内和帧间约束帮助加快收敛及施加类语音的要求于WF中的信号谱上。帧内自相关驰豫在图5的部分B显示,其中所要求的LPC模型参数以a表示,最后的信号评估S[n]j的自相关矩阵以Rj表示,且bj为Yale-Walker AR方法中的互相关矢量。建义采用驰豫因子C=0.7。驰豫可以扩充使之不仅只对前次帧进行平滑,但这样做并没有观察出有什么重大的好处。平滑过程在图5C显示。每个大圆表示为在复数Z平面上的单位圆,对于第K帧和第3次迭代,符号“0”标识了LSP的差分根Qkj,符号“·”标识了位置根Pkj。对于一个最小相位的LPC模型,极点位于单位圆内,且Pkj和Qkj沿着圆相互交替出现。在过去和将来帧中进行LSP平滑,其中当前集为帧K—4,K—3,K—2,K—1,K,K+1,K+2,只有位置根Pkj直按被平滑,而差分根Qkj跟着平滑后的Pkj而变化。一种逆向步骤给出了经平滑、定标的LPC信号模型的谱Ss(f)j。一个等价LSP表达式的复数根只是两个阶为初始LPC多项式阶的一半的实根多项式的解。这种方法在Hansen/Clements和Furni的参考资料中详尽描述。
用AVTO—LSP方法平滑LSP根直接平滑自回归模型的复数域根具有计算简捷的优点。即使LPC和LSP模型的表达式是相同,帧间平滑LSP根的可能缺点是存在LPC谱的其振峰位置/带宽和相应的LSP位置/距离根间的非线性关系。特别是当LPC的根离开单位圆时,LSP位置根不能很好地识别LPC的共振峰频率或带宽。但是,这种非线性的映射看起来并没有在改进语音质量时限制受限LSP根的有效性。
在从噪声功率谱的评估开始到使用这种噪声评估处理语音加噪声结束的这段时间间隔内如果噪声在统计上是广义平稳的,所述的处理过程是特别有效的。此方法对于大于10dB的信噪比的信号是最有效的。对于如汔车道路的噪声和飞机驾驶舱中噪声,即这类噪声的大部分谱能量处于音频频带的低频部分,此方法在5dBSNR时,也是有用的。对于如网格内哼声这种平稳的类话音噪声,当VAD能准确指明仅噪声帧时,在低于0dB SNR下滤波器可以成功使用。

Claims (11)

1.在一个包括交换节点连按到所述节点传输从远地来的信号和噪声的入局传输信道和出局信号传输信道的通信网络中,一个用于从所述入局传输信号中滤去噪声的处理过程,包括步骤;
将所述的入局传输信号转换成相继重叠和加了时间窗的信息帧,以创建一种改进的语音信号,每个帧包含了以足够频率采样的数字信号,表示由线性预测编码(LPC)的语音模型的入局信号;在信号滤波器中存贮每个所述的帧,所述滤波器包含了用于根据所述LPC语音模型进行的迭代评估的装置;
通过如下方法对当前帧执行多次帧内迭代:
根据总的输入信号谱和对噪声谱的当前评估在所述信号滤波器中对当前帧作出语音信号分量的初次评估,
对所述的当前帧从所述的初次评估中产生一系列等价的LSP位置根,
对于每个所述当前帧的每次帧内迭代,采用一些位置根,这些位置根来自于过去帧的迭代和在多个未来帧的从第一次所述迭代而得到的多个LSP位置根的相应迭代而得到的位置根,去平滑所述当前帧的所述位置根;
重复执行选定次数的帧内迭代步骤;
最后所述迭代的输出包括一个入局语音信号的实时评估的经滤波的帧。
2.按照权利要求1的过程,其中所述的所选择的过去帧包括多至4个最近过去帧和最近的2个所选的将来帧,
3.按照权利要求2的过程,进一步包含以下步骤:
区分帧为仅含噪声的帧还是有语音内容的帧;
使用所述的仅噪声帧产生噪声谱的一个连续的评估;和
为响应所检测到的反噪声帧,修改所述的噪声谱评估,
4.按照权利要求3的处理过程,还包括以下步骤:把所述滤波器的输出与所述出局传输信道断开以响应检测到一个反噪声帧,把通过一个衰减器所术入局传输信号直接转接到所述的出局传输信道,
5.按照权利要求4,进一步包括以下步骤:
检测每个所述语音帧以确定其为话音的还是非话音的,
为响应检测到一个所述的话音帧,设置所述语音模型为10阶LPC;并且
为响应检测到一个所述的非话音语音帧,设置所述的阶数小于所述的10阶,
6.按照权利要求5的处理过程,其中响应检测的所述话音语音帧的所述阶数设置是在4阶与6阶之间,
7.按照权利要求6的处理过程,其中所述的当前噪声帧的当前评估可由包含以下步骤的处理过程导出:
确定在所术滤波器当前存储了多少个连续的反噪声帧;
如果所述的连续帧超过了一个预定的数目,计算所述连续帧的平均噪声功率谱,
测量所述平均功率谱和以前计算的噪声功率谱的差异;并且
通过与所述测量到的差异相关的加权因子调整上述这两个谱,所述的调整使得所述的谱的结果和与一个预定的功率谱电平一致。
8.按照权利要求7的处理过程,进一步包括以下步骤:设置传输入局噪声阈值和决定是否存在超过所述闽值的噪声;
决定入局呼叫是否包括语音信号内容,
决定发端号码是否为提供降低传输噪声能量的电信服务的客户,并且
如果所有上述这些判决都是肯定的话,在所述交换节点激活所述处理过程,
9.按照权利要求8的处理过程,进一步包括这样一个步骤:在每一帧中加权所述的LSP位置根,其中所述加权因子由以下因素的选择性组合决定,即LSP的共振峰数目,全部帧的功率值,帧的功率阈值,连续噪声阈值失配Pcount和Pcount是否超过所述的记数阈值Lmax。
10.按照权利要求9的处理过程,其每个所述当前帧的帧内迭代数目在1和7之间,
11.按照权利要求10的处理过程,进一步包括这样一个步骤:对每个相继帧重复所述的帧内处理过程;并且组合时间重叠帧的结果以产生一个所述的输出。
CN94191041A 1993-11-30 1994-11-15 通信***中降低传输噪声的方法 Pending CN1129486A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16077093A 1993-11-30 1993-11-30
US08/160,770 1993-11-30

Publications (1)

Publication Number Publication Date
CN1129486A true CN1129486A (zh) 1996-08-21

Family

ID=22578366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN94191041A Pending CN1129486A (zh) 1993-11-30 1994-11-15 通信***中降低传输噪声的方法

Country Status (9)

Country Link
US (3) US5706394A (zh)
EP (1) EP0681730A4 (zh)
JP (1) JPH08506434A (zh)
KR (1) KR0175965B1 (zh)
CN (1) CN1129486A (zh)
CA (1) CA2153170C (zh)
PL (1) PL174216B1 (zh)
UA (1) UA41913C2 (zh)
WO (1) WO1995015550A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100336307C (zh) * 2005-04-28 2007-09-05 北京航空航天大学 接收机射频***电路内部噪声的分配方法
CN101322183B (zh) * 2006-02-16 2011-09-28 日本电信电话株式会社 信号失真消除装置、方法
CN101577847B (zh) * 2008-05-08 2013-01-02 索尼株式会社 信号处理设备和信号处理方法
CN110383700A (zh) * 2017-03-10 2019-10-25 英特尔Ip公司 杂散降低电路和装置、无线电收发器、移动终端、用于杂散降低的方法和计算机程序

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5790754A (en) * 1994-10-21 1998-08-04 Sensory Circuits, Inc. Speech recognition apparatus for consumer electronic applications
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
DE19521258A1 (de) * 1995-06-10 1996-12-12 Philips Patentverwaltung Spracherkennungssystem
SE513892C2 (sv) * 1995-06-21 2000-11-20 Ericsson Telefon Ab L M Spektral effekttäthetsestimering av talsignal Metod och anordning med LPC-analys
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
SE506034C2 (sv) 1996-02-01 1997-11-03 Ericsson Telefon Ab L M Förfarande och anordning för förbättring av parametrar representerande brusigt tal
AU3352997A (en) * 1996-07-03 1998-02-02 British Telecommunications Public Limited Company Voice activity detector
US5742694A (en) * 1996-07-12 1998-04-21 Eatwell; Graham P. Noise reduction filter
US5950154A (en) * 1996-07-15 1999-09-07 At&T Corp. Method and apparatus for measuring the noise content of transmitted speech
US6771590B1 (en) 1996-08-22 2004-08-03 Tellabs Operations, Inc. Communication system clock synchronization techniques
US6118758A (en) 1996-08-22 2000-09-12 Tellabs Operations, Inc. Multi-point OFDM/DMT digital communications system including remote service unit with improved transmitter architecture
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
JP3556419B2 (ja) * 1996-12-09 2004-08-18 株式会社東芝 携帯無線電話機
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
US5983183A (en) * 1997-07-07 1999-11-09 General Data Comm, Inc. Audio automatic gain control system
US6044341A (en) * 1997-07-16 2000-03-28 Olympus Optical Co., Ltd. Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice
DE19747885B4 (de) 1997-10-30 2009-04-23 Harman Becker Automotive Systems Gmbh Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
JP3584458B2 (ja) * 1997-10-31 2004-11-04 ソニー株式会社 パターン認識装置およびパターン認識方法
SE515674C2 (sv) * 1997-12-05 2001-09-24 Ericsson Telefon Ab L M Apparat och metod för brusreducering
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US5991718A (en) * 1998-02-27 1999-11-23 At&T Corp. System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
EP0992978A4 (en) * 1998-03-30 2002-01-16 Mitsubishi Electric Corp NOISE REDUCTION DEVICE AND METHOD
US7440498B2 (en) 2002-12-17 2008-10-21 Tellabs Operations, Inc. Time domain equalization for discrete multi-tone systems
DK1068704T3 (da) 1998-04-03 2012-09-17 Tellabs Operations Inc Filter til impulssvarforkortning, med yderligere spektrale begrænsninger, til multibærebølgeoverførsel
US6081776A (en) * 1998-07-13 2000-06-27 Lockheed Martin Corp. Speech coding system and method including adaptive finite impulse response filter
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6826528B1 (en) 1998-09-09 2004-11-30 Sony Corporation Weighted frequency-channel background noise suppressor
US6272460B1 (en) * 1998-09-10 2001-08-07 Sony Corporation Method for implementing a speech verification system for use in a noisy environment
US6122610A (en) * 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
US6108610A (en) * 1998-10-13 2000-08-22 Noise Cancellation Technologies, Inc. Method and system for updating noise estimates during pauses in an information signal
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
US6331835B1 (en) * 1999-02-02 2001-12-18 The Charles Stark Draper Laboratory, Inc. Deeply-integrated adaptive GPS-based navigator with extended-range code tracking
WO2000049602A1 (en) * 1999-02-18 2000-08-24 Andrea Electronics Corporation System, method and apparatus for cancelling noise
US6363345B1 (en) * 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
JP2000259198A (ja) * 1999-03-04 2000-09-22 Sony Corp パターン認識装置および方法、並びに提供媒体
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6233552B1 (en) * 1999-03-12 2001-05-15 Comsat Corporation Adaptive post-filtering technique based on the Modified Yule-Walker filter
US6519260B1 (en) 1999-03-17 2003-02-11 Telefonaktiebolaget Lm Ericsson (Publ) Reduced delay priority for comfort noise
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6480824B2 (en) * 1999-06-04 2002-11-12 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for canceling noise in a microphone communications path using an electrical equivalence reference signal
CN1145928C (zh) * 1999-06-07 2004-04-14 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
US6519559B1 (en) * 1999-07-29 2003-02-11 Intel Corporation Apparatus and method for the enhancement of signals
WO2001029826A1 (en) * 1999-10-21 2001-04-26 Sony Electronics Inc. Method for implementing a noise suppressor in a speech recognition system
US6731237B2 (en) 1999-11-09 2004-05-04 The Charles Stark Draper Laboratory, Inc. Deeply-integrated adaptive GPS-based navigator with extended-range code tracking
FI19992453A (fi) 1999-11-15 2001-05-16 Nokia Mobile Phones Ltd Kohinanvaimennus
EP1104925A1 (en) * 1999-12-03 2001-06-06 Siemens Aktiengesellschaft Method for processing speech signals by substracting a noise function
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
CA2401672A1 (en) * 2000-03-28 2001-10-04 Tellabs Operations, Inc. Perceptual spectral weighting of frequency bands for adaptive noise cancellation
US7103537B2 (en) * 2000-10-13 2006-09-05 Science Applications International Corporation System and method for linear prediction
US6463408B1 (en) * 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
WO2002054744A1 (en) * 2000-12-29 2002-07-11 Nokia Corporation Audio signal quality enhancement in a digital network
US6708147B2 (en) * 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US7319954B2 (en) * 2001-03-14 2008-01-15 International Business Machines Corporation Multi-channel codebook dependent compensation
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
GB2380644A (en) * 2001-06-07 2003-04-09 Canon Kk Speech detection
US20040148166A1 (en) * 2001-06-22 2004-07-29 Huimin Zheng Noise-stripping device
US7277722B2 (en) * 2001-06-27 2007-10-02 Intel Corporation Reducing undesirable audio signals
DE10137348A1 (de) * 2001-07-31 2003-02-20 Alcatel Sa Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen
US7274794B1 (en) 2001-08-10 2007-09-25 Sonic Innovations, Inc. Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in single wave sound environment
JP3453130B2 (ja) * 2001-08-28 2003-10-06 日本電信電話株式会社 雑音源判別装置及び方法
US6959276B2 (en) * 2001-09-27 2005-10-25 Microsoft Corporation Including the category of environmental noise when processing speech signals
JP3826032B2 (ja) * 2001-12-28 2006-09-27 株式会社東芝 音声認識装置、音声認識方法及び音声認識プログラム
AUPS102902A0 (en) * 2002-03-13 2002-04-11 Hearworks Pty Ltd A method and system for reducing potentially harmful noise in a signal arranged to convey speech
EP1351479A1 (en) * 2002-04-04 2003-10-08 Castel GmbH Generating an undisturbed signal out of an audio signal including a disturbing signal
US7139703B2 (en) * 2002-04-05 2006-11-21 Microsoft Corporation Method of iterative noise estimation in a recursive framework
US7065486B1 (en) * 2002-04-11 2006-06-20 Mindspeed Technologies, Inc. Linear prediction based noise suppression
JP4649208B2 (ja) * 2002-07-16 2011-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオコーディング
US7246059B2 (en) * 2002-07-26 2007-07-17 Motorola, Inc. Method for fast dynamic estimation of background noise
US7024353B2 (en) * 2002-08-09 2006-04-04 Motorola, Inc. Distributed speech recognition with back-end voice activity detection apparatus and method
US20040064314A1 (en) * 2002-09-27 2004-04-01 Aubert Nicolas De Saint Methods and apparatus for speech end-point detection
AU2003286602A1 (en) * 2002-10-25 2004-05-25 Science Applications International Corporation Adaptive filtering in the presence of multipath
US7162420B2 (en) * 2002-12-10 2007-01-09 Liberato Technologies, Llc System and method for noise reduction having first and second adaptive filters
EP1443498B1 (en) * 2003-01-24 2008-03-19 Sony Ericsson Mobile Communications AB Noise reduction and audio-visual speech activity detection
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8326621B2 (en) * 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
TWI233590B (en) * 2003-09-26 2005-06-01 Ind Tech Res Inst Energy feature extraction method for noisy speech recognition
GB0326263D0 (en) * 2003-11-11 2003-12-17 Nokia Corp Speech codecs
AU2003288042A1 (en) * 2003-11-12 2005-06-08 Telecom Italia S.P.A. Method and circuit for noise estimation, related filter, terminal and communication network using same, and computer program product therefor
FR2865310A1 (fr) * 2004-01-20 2005-07-22 France Telecom Procede de restauration de partiels d'un signal sonore
JP4434813B2 (ja) * 2004-03-30 2010-03-17 学校法人早稲田大学 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
US20060018460A1 (en) * 2004-06-25 2006-01-26 Mccree Alan V Acoustic echo devices and methods
US7573947B2 (en) * 2004-07-15 2009-08-11 Terayon Communication Systems, Inc. Simplified narrowband excision
US20060020454A1 (en) * 2004-07-21 2006-01-26 Phonak Ag Method and system for noise suppression in inductive receivers
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
JP4283212B2 (ja) * 2004-12-10 2009-06-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、雑音除去プログラム、及び雑音除去方法
US7567903B1 (en) 2005-01-12 2009-07-28 At&T Intellectual Property Ii, L.P. Low latency real-time vocal tract length normalization
WO2006116132A2 (en) * 2005-04-21 2006-11-02 Srs Labs, Inc. Systems and methods for reducing audio noise
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
US8767974B1 (en) * 2005-06-15 2014-07-01 Hewlett-Packard Development Company, L.P. System and method for generating comfort noise
CN101322182B (zh) 2005-12-05 2011-11-23 高通股份有限公司 用于检测音调分量的***、方法和设备
WO2008007616A1 (fr) * 2006-07-13 2008-01-17 Nec Corporation Dispositif, procédé et programme d'alarme relatif à une entrée de murmure non audible
EP1918910B1 (en) * 2006-10-31 2009-03-11 Harman Becker Automotive Systems GmbH Model-based enhancement of speech signals
US20080312916A1 (en) * 2007-06-15 2008-12-18 Mr. Alon Konchitsky Receiver Intelligibility Enhancement System
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
US9253568B2 (en) * 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
JP4660578B2 (ja) * 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
JP4516157B2 (ja) * 2008-09-16 2010-08-04 パナソニック株式会社 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム
EP2226794B1 (en) * 2009-03-06 2017-11-08 Harman Becker Automotive Systems GmbH Background noise estimation
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
US8526754B2 (en) * 2009-05-28 2013-09-03 Aptina Imaging Corporation System for enhancing depth of field with digital image processing
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法
EP2471064A4 (en) * 2009-08-25 2014-01-08 Univ Nanyang Tech METHOD AND SYSTEM FOR RECONSTRUCTING LANGUAGE FROM AN ENTRY SIGNAL WITH FLUIDED PARTS
US8577678B2 (en) * 2010-03-11 2013-11-05 Honda Motor Co., Ltd. Speech recognition system and speech recognizing method
JP5566846B2 (ja) * 2010-10-15 2014-08-06 本田技研工業株式会社 ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法
US20120143604A1 (en) * 2010-12-07 2012-06-07 Rita Singh Method for Restoring Spectral Components in Denoised Speech Signals
US8838445B1 (en) * 2011-10-10 2014-09-16 The Boeing Company Method of removing contamination in acoustic noise measurements
GB2499781A (en) * 2012-02-16 2013-09-04 Ian Vince Mcloughlin Acoustic information used to determine a user's mouth state which leads to operation of a voice activity detector
EP2850611B1 (en) 2012-06-10 2019-08-21 Nuance Communications, Inc. Noise dependent signal processing for in-car communication systems with multiple acoustic zones
US9805738B2 (en) 2012-09-04 2017-10-31 Nuance Communications, Inc. Formant dependent speech signal enhancement
US9613633B2 (en) 2012-10-30 2017-04-04 Nuance Communications, Inc. Speech enhancement
CN109119096B (zh) * 2012-12-25 2021-01-22 中兴通讯股份有限公司 一种vad判决中当前激活音保持帧数的修正方法及装置
CN107293287B (zh) * 2014-03-12 2021-10-26 华为技术有限公司 检测音频信号的方法和装置
CN113114866A (zh) * 2017-03-10 2021-07-13 株式会社Bonx 便携通信终端及其控制方法、通信***和记录介质
GB201814408D0 (en) * 2018-09-05 2018-10-17 Calrec Audio Ltd A method and apparatus for processing an audio signal stream to attenuate an unwanted signal portion
CN111341333B (zh) * 2020-02-10 2023-01-17 腾讯科技(深圳)有限公司 噪声检测方法、噪声检测装置、介质及电子设备
CN116312545B (zh) * 2023-05-26 2023-07-21 北京道大丰长科技有限公司 多噪声环境下的语音识别***和方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3266042D1 (en) * 1981-09-24 1985-10-10 Gretag Ag Method and apparatus for reduced redundancy digital speech processing
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US5012518A (en) * 1989-07-26 1991-04-30 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
DE69121312T2 (de) * 1990-05-28 1997-01-02 Matsushita Electric Ind Co Ltd Geräuschsignalvorhersagevorrichtung
US5195132B1 (en) * 1990-12-03 1996-03-19 At & T Bell Lab Telephone network speech signal enhancement
US5319703A (en) * 1992-05-26 1994-06-07 Vmx, Inc. Apparatus and method for identifying speech and call-progression signals
US5533133A (en) * 1993-03-26 1996-07-02 Hughes Aircraft Company Noise suppression in digital voice communications systems
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100336307C (zh) * 2005-04-28 2007-09-05 北京航空航天大学 接收机射频***电路内部噪声的分配方法
CN101322183B (zh) * 2006-02-16 2011-09-28 日本电信电话株式会社 信号失真消除装置、方法
CN101577847B (zh) * 2008-05-08 2013-01-02 索尼株式会社 信号处理设备和信号处理方法
CN110383700A (zh) * 2017-03-10 2019-10-25 英特尔Ip公司 杂散降低电路和装置、无线电收发器、移动终端、用于杂散降低的方法和计算机程序

Also Published As

Publication number Publication date
CA2153170A1 (en) 1995-06-08
CA2153170C (en) 2000-12-19
KR0175965B1 (ko) 1999-04-01
KR960700498A (ko) 1996-01-20
WO1995015550A1 (en) 1995-06-08
UA41913C2 (uk) 2001-10-15
JPH08506434A (ja) 1996-07-09
EP0681730A4 (en) 1997-12-17
EP0681730A1 (en) 1995-11-15
PL310056A1 (en) 1995-11-13
PL174216B1 (pl) 1998-06-30
US5706394A (en) 1998-01-06
US5781883A (en) 1998-07-14
US5708754A (en) 1998-01-13

Similar Documents

Publication Publication Date Title
CN1129486A (zh) 通信***中降低传输噪声的方法
CN110619885B (zh) 基于深度完全卷积神经网络的生成对抗网络语音增强方法
EP1154408B1 (en) Multimode speech coding and noise reduction
EP1253581B1 (en) Method and system for speech enhancement in a noisy environment
EP2362389B1 (en) Noise suppressor
CN1111973C (zh) 改进了的数字蜂窝应用的回波消除器
EP2346032B1 (en) Noise suppressor and voice decoder
CN114175152A (zh) 用于增强劣化音频信号的***和方法
CN107863099A (zh) 一种新型双麦克风语音检测和增强方法
KR102316712B1 (ko) 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
CN114822578A (zh) 语音降噪方法、装置、设备及存储介质
US9875748B2 (en) Audio signal noise attenuation
KR102316626B1 (ko) 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 방법 및 장치
CN116959467A (zh) 一种融合噪声场景的通信增强方法、***及存储介质
KR102374167B1 (ko) 어텐션 메커니즘을 이용한 음성 신호 추정 방법 및 장치
CN115440240A (zh) 语音降噪的训练方法、语音降噪***及语音降噪方法
CN113593599A (zh) 一种去除语音信号中噪声信号的方法
CN114333912A (zh) 语音激活检测方法、装置、电子设备和存储介质
KR20130094246A (ko) 반도체 장치 및 음성 통신 장치
Stadermann et al. Voice activity detection in noisy environments
Rao et al. Speech enhancement using perceptual Wiener filter combined with unvoiced speech—A new Scheme
Wang et al. Analysis of Morse Signal Noise Reduction Methods
Priyanka et al. Implementation and comparison of echo cancellation algorithms using adaptive filtering techniques in TMS320C6748 DSK
CN115910090A (zh) 数据信号处理方法、装置、设备及存储介质
MXPA95001343A (en) Transmitted noise reduction in communication systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication