CN1132988A - 声音激活性检测激励噪声补偿器 - Google Patents

声音激活性检测激励噪声补偿器 Download PDF

Info

Publication number
CN1132988A
CN1132988A CN95101493A CN95101493A CN1132988A CN 1132988 A CN1132988 A CN 1132988A CN 95101493 A CN95101493 A CN 95101493A CN 95101493 A CN95101493 A CN 95101493A CN 1132988 A CN1132988 A CN 1132988A
Authority
CN
China
Prior art keywords
signal
noise
high pass
produce
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN95101493A
Other languages
English (en)
Inventor
托马斯·约翰·杰尼兹夫斯基
迈克尔·查尔斯·雷克什奥内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of CN1132988A publication Critical patent/CN1132988A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Noise Elimination (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

改进数字蜂窝无线电***接收机的声音质量的方法和设备。声音激活性检测器使用能量估计来检测在噪声环境下接收的话音信号中是否存在话音。若不存在话音,则该***衰减信号和***低通滤波的白噪声。使用一组高通滤波器基于背景噪声电平滤波该信号。对该信号高通滤波,不管是否存在话音。这样,当解码已在噪声环境中被编码的话音时,在非话期间,除了该信号的高通滤波之外,信号衰减与低通滤的波白噪声的***的组合改进了声音质量。

Description

声音激活性检测激励噪声补偿器
本发明涉及数字移动无线***。特别涉及在声频背景噪声存在时改进数字移动无线电接收机的声音质量。
蜂窝电话***包括三种主要单元,亦即一个蜂窝交换***,用以作为通往陆线(有线)电话网络的网间连接器;在交换***的控制下的多个基站,含有在有线电话网使用的信号与无线通信使用的无线电信号之间变换的设备;以及多个移动电话单元,用以在与基站通信所使用的无线电信号和与人类用户通信使用的可闻声频信号(例如,话音、音乐、等)之间变换。
只有在基站和移动电话使用相同的无线调制方案、数据—编码协议、以及控制策略(即两个单元必须符合空中接口规范)时,才有可能在一个基站与一个移动电话之间进行通信。美国现已对空中接口建立了许多标准。直到最近,美国的所有蜂窝电话都按照高级移动电话业务(AMPS)标准操作。这个标准规定在800MHz无线电频谱范围内使用频率调制的模拟信号编码。根据这个方案,在呼叫期间每个蜂窝电话对话分配一个通信信道,该信道包括上述范围内的两个30KHz频段。为了在对话之间避免干扰,两个对话不能同时占用同一地理区域内的同一信道。因为分配给蜂窝电话的全部无线电频谱是有限的,这限制了蜂窝电话***同时用户的数目。
为了增加***的容量,现已采用了许多替代AMPS的标准。这些标准之一是由电子工业协会和通信工业协会颁发的临时标准54(IS-54)。这个标准使用数字信号编码和使用时分多址(TDMA)方案调制。在TDMA方案中,每个30KHz频段由三个同时对话共享,而且每个对话允许使用信道的三分之一时间。时间被划分为20ms的帧,每帧再细分为三个时隙。为每个对话分配每帧一个时隙。
为了允许所述的20ms对话的所有信息在一个时隙内传送,利用称为“矢量和激励线性预测(VSELP)”的数字话音压缩方法处理语音和其它音频信号。每个IS-54应允的基站和移动电话单元包括VSELP编码器和解码器。VSELP编码器利用人类话音产生的模型把数字化声频信号简化为一组代表在该帧中话音产生机制状态的参数(例如,音调、声域结构、等),代替在该信道上传送声频波形的数字表示物。这些参数被编码为一个数字比特流,然后以8kb/s经该信道传送到接收机。这是比编码实际声频波形要求的低得多的比特率。然后该接收机的VSELP解码器利用这些参数再生该数字化声频波形的估计。该传送的数字话音数据组织成为20ms的数字信息帧,每帧包含160个样值。每个话音帧有159比特。在1990年由电气工业协会出版的元件《TR45全速率话音编译码器兼容性标准PN-2972》中详细描述了该VSELP方法,该文件列在这里供参考(下文称为“VSELP标准”)。
VSELP明显地减少了在通信信道上发送声频信息所要求的比特数。然而,它是通过繁重地依靠话音产生模型来实现这种减少的。其结果是,它使非话音的声音变差。例如,运动的汽车内部是一种固有的噪声环境。汽车的本身声音与外部噪声组合,产生声频背境噪声电平比在不运动环境中典型地遇到的高得多。这种情况除了组合的话音和背景噪声此外还迫使VSELP试图以很多的时间编码非话音信息。
存在背景噪声的情况下在使用VSELP编码话音时出现两个问题。第一,不管话音是否存在,背景噪声发声不自然;第二,话音在特征方面失真。这些问题不管是单独地还是集合地统称为“漩涡”(swirl)。
通过以另一种话音压缩算法代替VSELP算法,有可能消除这些由编码/解码过程引入的人为因素(artifact),那种算法不具有相同缺陷,这种策略将需要改变IS-54空中接口技术规范。因在蜂窝电话的业务提供者、制造者和用户这部分上现存设备中可观的投资故对于这种改变是不希望的。例如,在一种现有技术中,话音编码器检测何时无话音存在并编码待发送到该接收机的特定的帧。这个特定的帧包含舒适噪声参数,这些参数指示话音解码器将产生舒适噪声,该噪声与发送侧的背景噪声相似。这些特定的帧由发射机在无话音期间周期地发送。解决该漩涡问题的这个提案需要改变当前的VSELP话音算法,因为它引入特定的编码帧来指示何时产生舒适噪声。它是在通信信道的发送侧和接收侧实现的,并需要改变当前的空中接口技术规范标准,因此它是一种不希望的解决方案。
本发明的目的是在声频背景噪声存在时在无需对空中接口技术规范作任何改变的情况下来减小VSELP(或任何其它话音编码/解码算法)引入的人为因素严重程度。
业已确定,在无话音期间具有舒适噪声***的信号衰减与根据背景噪声能量的估计所进行的有选择性的高通滤波相结合是对上面研究的“漩涡”问题的一个有效的解决方案。
根据本发明,声音激活性(Voice activity)检测器使用一种能量估计来检测在噪声环境中在接收的话音信号中话音的存在。当不存在话音时,***衰减该信号并以适当的电平***经低通滤波的白噪声(即舒适噪声)。这种舒适噪声模仿汽车或其它背景噪声的典型的频谱特性。这使漩涡平滑,使它发声自然。当由声音激活性检测器确定在该信号中存在话音时,无衰减地处理合成的话音信号。
现已确定,当试图对话音和噪声编码时,话音编码器引入的令人烦恼的人为因素大多出现在低频范围内。鉴此,除了话音激活性激励衰减和舒适噪声***之外,根据背景噪声电平应用一组高通滤波器。不管话音是否存在,都将这种滤波应用于话音信号。如发现噪声电平低于-52db,则可不使用高通滤波器。如果噪声电平在-40db和-52db之间,则将具有截止频率为200Hz的高通滤波器应用于合成的话音信号。如果噪声电平大于-40db,则应用一个具有截止频率为350Hz的高通滤波器。使用这些高通滤波器的结果降低了背景噪声对话音质量影响很小。
上述的本发明应用在接收机(在基站处、移动单元处或在这两处)内,而且可在无需改变当前标准的话音编码/解码规程的情况下得到实施。
图1示出结合本发明的数字无线电接收***的方框图。
图2示出本发明的声音激活性检测激励噪声补偿器(remediator)的方框图。
图3示出接收信号的总声频能量的波形。
图4示出高通滤器激励器的方框图。
图5示出执行声音激活性检测器功能的流程图。
图6示出本发明微处理器实施例的方框图。
图1示出结合本发明的数字无线电接收***10。解调器20接收与编码话音信号相应的发送的波形并处理该接收波形以产生数字信号d。将该数字信号d提供给信道解码器30,该解码器处理信号d以减轻信道差错。由该信道解码器30产生的信号是编码的话音比特流b,该比特流b根据在本发明背景部分中讨论的VSELP标准组编成为数字信息帧。将该编码的话音比特流b提供给话音解码器40,该解码器40处理编码的话音比特流b以产生解码的话音比特流S。设置这个话音解码器40将已按VSELP技术编码的话音进行解码。将这个解码的话音比特流S提供给声音激活性检测激励噪声补偿器(VADDNR)50,以除去在无话音期间信号中存在的任何背景“漩涡”。在一个实施例中,该VADDNR50还接收从信道解码器30经信号线35来的编码话音比特流b的一部分。该VADDNR50使用VSELP编码帧能量值r0,该值是编码比特流b的一部分,这将在下文更详细地讨论。VADDNR50产生经处理的解码话音比特流输出S″。然后将VADDNR 50的输出提供给数/模变换器(D/A)60以将数字信号S″变换为模拟波形。最后将这个模拟波形发送到一个目的地***(例如一个电话网络)。另一种可替换的方案是,将VADDNR50的输出提供给另一个装置,该装置将VADDNR输出变换为由目的地***使用的某些其它数字数据格式。
图2示出VADDNR 50的细节。如图1所示,VADDNR接收信号线35上来自编码的话音比特流b的VSELP编码帧能量值r0。这个能量值r0代表输入话音在20ms帧间隔的平均信号功率。对于r0有32个可能的值,即0至31。r0=0代表帧能量为0。r0其余值的范围从最小值-64db(相应于r0=1)到最大值-4db(相应于r0=31)。r0值之间的步长是2db。在《VSELP标准》第16页更详细地描述了该帧能量值r0。将该编码帧能量值r0提供给估计器210,以确定该平均帧能量的能量。
该能量估计器210产生一个平均帧能量信号e[m],它代表在m帧期间计算的平均帧能量,这里m是帧的号码,它代表当前的数字信息帧。e[m]被定义为:
Figure A9510149300191
平均帧能量初始设定为一个初始的能量估计值Einit。Einit设定为大于31的一个值,对于r0它是最大可能值。例如,Einit可以设定为32。在初始化之后,按公式e[m]=α*r0[m]+(1-α)*e[m-1]计算平均帧能量e[m],这里α是平滑常数,且0≤α≤1,应选择α提供可接受的帧平均值。我们已经发现,在7帧数字信息(140ms)给定有效帧平均的情况下,α=0.25最佳。还可选择不同的α值,该值最好在0.25±0.2的范围内。
如上所述,并如图1所示,在b信号由话音解码器40解码的之前,VADDNR 50从编码的话音比特流信号b接收VSELP编码的帧能量值r0。另一种可替代的方案是,这个帧能量值r0由VADDNR 50本身根据从话音解码器40接收的解码话音比特流信号S来计算。在该帧能量值r0由VADDNR 50计算的一个实施例中,不需要向VADDNR 50提供编码话音比特流b的任何部分,而且图1所示的信号线35也不存在。而VADDNR 50仅处理解码话音比特流S,并且如在《VSELP标准》第16-17页所描述的那样,计算帧能量值r0。然而,由于从编码的比特流b经信号线35向VADDNR 50提供r0,因VADDNR 50无需计算r0能更快地处理解码的话音比特流S。
能量估计器210产生的平均帧能量信号e[m]表示在接收的话音信号中存在平均总声频能量。这个总声频能量可能包括话音和噪声二者。图3示出在时间T内典型的接收信号310的总声频能量波形的一个例子。在移动的环境中,典型地存在一定程度的环境背景噪声。这个噪声的能量电平在图3中以e1表示。当该信号310中存在话音时,声频的能量电平将代表话音及噪声二者。这在图3中表示,能量>e2的范围内在时间间隔t1期间,而在这个时间间隔t1期间,信号310中不存在话音,而在这个时间间隔t1期间声频能量仅代表环境背景噪声。在时间间隔t2期间,信号310中存在话音,而且在这个时间间隔t2期间声频能量代表环境背景噪声加话音。
参见图2,由能量估计器210产生的输出信号e[m]提供给噪声估计器220以确定解码话音比特流S中的平均背景噪声电平。该噪声估计器220产生一个代表噪声估计值的信号N[m],这里:
Figure A9510149300201
初始时,N[m]被设定为初始值Ninit,它是一个初始噪声估计值。在下一步处理期间,N[m]值将根据解码话音比特流S中存在的实际背景噪声而加大或减小。Ninit设定为在适中的与严重的背景噪声之间边界上的一个电平。N[m]初始化到这个电平,以允许N[m]迅速地适应于由实际背景噪声确定的任一个方向。我们已发现,在移动的环境中,最好将Ninit设定为13这个r0值上。
信号能量的话音成分不应包括在计算平均背景噪声电平中。例如,参见图3,在时间间隔t1期间信号310中存在的能量电平应当包括在计算的噪声估计N[m]中,但是不应当包括在时间间隔t2期间信号310中存在的能量电平,因为时间间隔t2期间的能量代表背景噪声和话音二者。
据此,从代表话音和噪声的能量估计器210接收的任何平均帧能量e[m]应当从噪声估计N[m]的计算中排除,为以防止噪声估计N[m]不致变得偏离。为了排除代表话音和噪声二者的平均帧能量e[m]值,使用噪声上限阈值(Nthresh)。鉴此,如上所述,如果e[m]>N[m-1]+Nthresh,则N[m]=N[m-1]。换句话说,如果当前帧的平均帧能量e[m]比前面帧的噪声估计N[m-1]大了一个量值,该量值等于或大于Nthresh(即话音存在),则N[m]不从前面帧的计算中改变。据此,如果在一个短的时间期间帧能量大量增加,则可以认为这种增加是因存在话音并且该能量不包括在噪声估计中。我们已经发现,将Nthresh设定为等于帧能量r0值为2.5是最佳的。因r0以2dB为/单位标度,故这就把噪声估计算法的运算范围限于具有好于5db的声音信号/噪声比条件,对于噪声估计器220的可接受的性能,Nthresh可被设定在2至4范围内的任何位置。
如果在短时间段内帧能量没有大量增加,则噪声估计按下式N[m]=β*e[m]+(1-β)*N[m-1]来确定式中β是平滑常数,应被设定得以提供可接受的帧平均。业已发现β值为0.05是为最好的,β值为0.05可在25帧(500ms)内给出帧平均。β值通常应该被设定在0.025≤β≤0.1的范围内。
由噪声估计器220计算的噪声估计值N[m]提供给高通滤波器激励器260,该激励器260根据话音解码器40提供的解码比特流信号S来工作。如上所述,每个数字信息帧含有160个话音数据样值。该高通滤波器激励器260根据这些样值s(i)的每一个样值来工作,这里的i是取样标号。图4示出该高通滤波器激励器260的细节。由该噪声估计器220产生的噪声估计值N[m]提供到逻辑方框410,该方框内含逻辑电路,用以确定那一组高通滤波器将被使用来对解码话音比特流S的每个样值S(i)进行滤波。现有两个高通滤波器430和440。滤波器430的截止频率是200Hz,而滤波器440的截止频率是350Hz。现已确定了这些截止频率以提供最佳的结果,但是根据本发明,可以采用其它的值。两滤波器截止频率的差值最好至少100Hz。为了确定应当使用那个滤波器,高通滤波器激励器260的逻辑方框410将噪声估计值N[m]与两个阈值比较。第一个阈值设定为相应于帧能量值r0=7(相应于-52db)的一个数值,第二个阈值设定为相应于帧能量值r0=13(相应于-40db)的一个数值。如果噪声估计N[m]小于r0=7,则可不用高通滤波。如果噪声估计值N[m]大于或等于r0=7和小于r0=13,则使用截止频率为200Hz的高通滤波器430。如果噪声估计值N[m]大于或等于r0=13,则使用截止频率为350Hz的高通滤波器440。用以确定待使用高通滤波的逻辑可归结为:
Figure A9510149300231
参见图4,这个逻辑由逻辑方框410来执行。逻辑方框410将根据上述原则来确定使用哪个滤波器并C[m]向两个纵横接线器420、450提供一个控制信号。相应于数值为0的控制信号表明不使用高通滤波器上。相应于数值为1的控制信号表明使用200Hz高通滤波器。相应于数值为2的控制信号表明使用350Hz的高通滤波器。
信号S[i]从话音解码器40提供给纵横制接线器420。该纵横制接线器420令信号S[i]到达合适的信号线421、422、423来选择适当的滤波。“0”控制信号令信号S[i]到达信号线421。信号线421将信号S[i]提供到不使用滤波的纵横接线器450。“1”控制信号令信号S[i]到信号线422,该信号线422连到高通滤波器430。该信号S[i]由高通滤波器430滤波之后经信号线424提供到纵横制接线器450。“2”控制信号令信号S[i]到达信号线423,它连到高通滤波器440。该信号由高通滤波器440滤波之后,再经信号线425提供到纵横制接线器450。控制信号C[m]也提供给纵横制接线器450。根据控制信号C[m],纵横制接线器450将来自信号线421、424、425的信号中的一个信号提供给话音衰减器270。由高通滤波器激励器260产生的这个信号被识别为S′[i]。本领域的技术人员承认,在高通滤波器激励器260中可使用任何数目的高通滤波器或使用具有连续可调截止频率的一个高通滤波器,用以对解码的比特流S滤波。使用较大量的高通滤波器或具有连续可调截止频率的一个高通滤波器将使得滤波器选择之间的过渡较不引人注意。
参见图2,由高通滤波器激励器260产生的信号S′[i]提供到一个话音衰减器/舒适噪声***器270。该话音衰减器/舒适噪声***器270处理信号S′[i],产生经处理的解码话音比特流输出信号S″[i]。该话音衰减器/舒适噪声***器270还接收来自整形噪声发生器250的输入信号n[i]和来自衰减器计算器240的输入信号atten[m]。下面将详细讨论话音衰减器/舒适噪声***器270的功能,再讨论如何计算其输入n[i]和atten[m]。
噪声估计器220产生的噪声估计N[m]和能量估计器230产生的平均帧能量e[m]提供给声音激活性检测器230。该声音激活性检测器230确定在话音信号的当前帧中是否存在话音并产生一个声音检测信号V[m],该信号表明话音是否存在。V[m]的数值为0时表明在话音信号的当前帧中没有检测到声音激活性。V[m]的数值为1时表明在话音信号的当前帧中检测到声音的激活性。声音激活性检测器230的功能结合图5的流程图描述。在步骤505,声音激活性检测器230确定是否e[m]<N[m]+Tdetect,这里Tdetect是较低的噪声检测阈值,该值在功能上类似于前面结合图3描述的Nthresh值。假定仅当平均帧能量e[m]大于噪声估计值N[m]某个值,即Tdetect时,可能存在话音。Tdetect最好设定为r0值2.5,这就意味着只在平均帧能量e[m]比噪声估计值N[m]大5db时,可能存在话音。也可使用其它数值。Tdetect的值通常应在2.5+/-0.5范围内。
为了防止话音激活性检测器230不致申报在字内无声音激活性,使用一个来检测的帧计数器Ncnt。将Ncnt初始化为零,而且置计数达到一个阈值Ncntthresh,该阈值代表含有在声音激活性检测器230申报不存在声音激活性之前必定存在无声音激活性的帧的数目。Ncntthresh可设定数值为6。据此,仅在为6帧(120ms)未检测到话音时,声音激活性检测器230申报无声音。返回参照图5,如果在步骤505确定e[m]<N[m]+Tdetect,即平均能量e[m]小于已确定可能存在话音时的能量,则在步骤510使Ncnt加1。如果步骤515确定Ncnt≥Ncntthresh,亦即在6帧内检测无话音,则在步骤530将V[m]设定为0,这表明当前的帧无话音。如果步骤515确定Ncnt<Ncntthresh,亦即不存在6帧检测无话音,则在步骤520将V[m]设定为1,这表明在当前的帧内存在话音。如果步骤505确定e[m]≥N[m]+Tdetect,亦即平均能量e[m]大于或等于确定可能存在话音的平均功率,则在步骤525将Ncnt设定为0,而且将在步骤520将V[m]设定为1,这表明在当前帧内存在话音。
由声音激活性检测器230产生的声音检测信号V[m]提供给衰减器计算器240,以产生一个衰减信号atten[m],该信号代表当前帧的衰减量。该衰减信号atten[m]每帧更新,而且它的值部分地取决于由声音激活性检测器230是否检测到声音激活性。信号atten[m]将代表0和1之间的某个值。越接近于1,信号的衰减越小,而越接近于0,信号衰减越大。将要应用的最大衰减值被规定为最大衰减值(maxatten),而且现已确定maxatten的最佳值是0.65(即-3.7db)。可使用maxatten的其它值,但是,一般使用值的范围为0.3至0.8。增大话音信号衰减的因数规定为衰减率(attenrate),而且现已发现,衰减率的最佳值为0.98。对于衰减率可使用其它数值,通常该值的范围为0.95+/-0.04。
在这段中,我们将描述衰减信号atten[m]的计算。在下面结合话音衰减器/舒适噪声***器270的讨论中,衰减信号S′[i]中使用atten[m]将变得清楚了。该衰减信号atten[m]按如下方式计算。最初,该衰减信号atten[m]被设定为1。在这初始化以后,将根据由声音激活性检测器230确定的是否存在话音和该衰减是否达到由maxatten规定的最大衰减来计算atten[m]。如果V[m]=1亦即检测到话音,则atten[m]设定为1。如果V[m]=0,亦即检测无话音,而且如果施加到前一帧的衰减的衰减因数(attenrate*atten[m-1])大于最大衰减,则通过将衰减因数施加到前一帧的衰减来计算当前帧的衰减。如果V[m]=0,亦即检测无话音,和如果施加到前一帧衰减的衰减因数小于或等于最大衰减,则当前帧衰减被设定为最大衰减。当前帧衰减的这种计算概括为:据此,当声音激活性检测器230检测无话音时,根据常数0.98,该衰减信号atten[m]从1减到0.65(maxatten)。衰减计算器240产生的当前帧的衰减信号atten[m]被提供到话音衰减器/舒适噪声***器270。
该话音衰减器/舒适噪声***器270还接收信号n[i],该信号来自整形噪声发生器250,代表低通滤波的白噪声。这种低通滤波的白噪声还称为“舒适噪声”。整形噪声发生器250从噪声估计器220接收噪声估计N[m]并产生代表如下整形噪声的信号n[i]:
n[i]=ε*wn[i]+(1-ε)*n(i-1),式中wn[i]=δ*dB21in(N[m])*ran[i]这里i是如上所述的取样标号。据此为当前帧的每个样值产生n[i]。函数db21in使噪声估计N[m]从db变为线性值。标度因数δ被设定数值为1.7和滤波系数ε被设定数值为0.1。函数ran[i]产生在-1.0和1.0之间产生一个随机数。据此,使用噪声估计N[m]标度该噪声,然后由低通滤波器滤波。已经发现上述的标度因数δ和该滤波器系数ε的值是最佳值。然而,可以使用其它数值,δ值通常在1.5至2.0的范围内ε值通常在0.05至0.15的范围内。
由整形噪声发生器220产生的低通滤波白噪声n[i]和由衰减器计算器240产生的当前帧的衰减atten[m]被提供到话音衰减器/舒适噪声***器270。该话音衰减器从高通滤波器激励器260接收高通滤波信号S′[i]并根据下式产生经处理的解码话音比特流S″:
S″[i]=atten[m]*S′[i]+(1-atten[m])*n[i]
i=0、1、……159这样,对于高通滤波的话音信号S′的每个样值S′[i],该话音衰减器/舒适噪声***器270根据当前帧的衰减atten[m]来衰减样值S′[i]。同时,该话音衰减器/舒适噪声***器270还将根据atten[m]值***低通滤波白噪声n[i]。从上式可以看到,如果atten[m]=1,则没有衰减和S″[i]=S′[i]。如果atten[m]=maxatten(0.65),则S″[i]=(0.65*经高通滤波的话音信号)+(0.35*经低通滤液的白噪声)。信号S′[i]的衰减加低通滤波白噪声(舒适噪声)的***的结果将提供一个具有较不易觉察的漩涡的较平滑的背景噪声。由话音衰减器/舒适噪声***器270产生的信号S″[i]提供给D/A变换器60或另外的装置,如上所述,该装置变换信号为某个其它数字数据格式。
如上所述,当在接收的信号中不存在话音时,衰减器计算器240、整形噪声发生器250和话音衰减器/舒适噪声***器270一起工作,以降低背景漩涡。这些单元可被认为是“一个噪声补偿器”,它被示于图2标记为280的虚线内。如上所述,这个噪声补偿器280从声音激活性检测器230接收的声音检测信号V[m],从噪声估计器220接收噪声估计N[m],还从高通滤波器激励器260接收高通滤波信号S′[i],产生处理的解码的话音比特流S″[i]。
如上所述,合适的VADDNR 50可以在如图6所示的微处理器中实施。该微处理器(μ)60由数据线621和地址线622连接到一个非易失存储器620(例如ROM)上。该非易失存储器620包含实现上述VADDNR 50功能的程序码。该微处理器610还通过数据线631和地址线632连接到一个易失存储器630(例如RAM)上。该微处理器610从话音解码器40接收信号线612上的解码的话音比特流S,并产生经处理的解码话音比特流S″。如上所述,在本发明的一个实施例中,该VSELP编码的帧能量值r0从编码的话音比特流b提供到VADDNR 50。这由图6中的信号线611所示。在另一个实施例中,该VADDNR从解码的话音比特流S计算帧能量值r0,而且信号线611将不存在。
可以理解,这里表示和描述的实施例和变化仅仅是为了说明本发明的原理,本领域的技术人员可在不脱离本发明的范围和精神下进行各种各样的修改。在整个本说明书中已经公开了各种优选数值和一些数值的范围。但是,可以理解,这些数值涉及到本发明在移动环境中的使用。本领域的技术人员应该知道,这里公开的本发明可用于各种环境,在这种情况下的数值和数值范围可与这里描述的不同。在各种环境下使用本发明以及数值变化都在本发明的预期范围之内。

Claims (35)

1.一种用于处理接收的编码信号的设备,所述接收的编码信号包括话音分量和噪声分量,所述设备其特征在于包括:
一个话音解码器,用于接收所述编码信号和产生解码信号,所述解码信号包括话音分量和噪声分量;
一个能量估计器,与上述话音解码相连接,用于接收所述解码信号和用于产生代表所述解码信号的声频能量的估计的能量信号;
一个噪声估计器,与上述能量估计器相连接,用于产生代表在所述解码信号中平均背景噪声电平的估计噪声信号;
一个高通滤波器激励器,与上述噪声估计器和所述话音解码器相连接,用于接收所述估计噪声信号和所述解码信号,用于根据所述估计噪声信号,高通滤波所述解码信号,和用于产生高通滤波的输出信号;
一个声音激活性检测器,与上述能量估计器和所述噪声估计相连接,用于接收所述估计能量信号和所述估计噪声信号,和用于产生代表所述解码信号是否包含话音分量的声音检测信号;
一个衰减器计算器,与上述声音激活性检测器相连接,用于接收所述声音检测信号和用于产生代表施加到所述高通滤波信号衰减的衰减信号;
一个噪声发生器,与上述噪声估计器相连接,用于接收所述估计噪声信号和用于产生舒适噪声信号;及
一个话音衰减器/舒适噪声***器,与上述高通滤波器激励器、所述整形噪声发生器和所述衰减器计算器相连接,用于接收所述高通滤波输出信号、所述舒适噪声信号和所述衰减信号,用于衰减高通滤波输出信号并且***所述舒适噪声信号到在所述衰减信号上的所述高通滤波输出信号,和用于产生处理的高通滤波信号。
2.根据权利要求1的设备,其特征在于,所述舒适噪声信号包括低通滤波白噪声。
3.一种用于处理接收信号的设备,其特征在于,所述信号包括话音分量和噪声分量,所述设备还包括:
一个能量估计器,用于产生代表所述接收信号的声频能量的能量信号;
一个噪声估计器,用于接收所述能量信号和用于产生代表在所述接收信号中平均背景噪声的噪声估计信号;
一个声音激活性检测器,用于接收所述噪声估计信号和所述能量信号,和用于产生代表在所述接收信号中是否存在话音的声音检测信号;和
一个噪声补偿器,响应所述噪声估计信号和所述声音检测信号,当所述声音检测信号指示在所述接收信号中没有出现话音时用于处理所述接收信号和用于产生处理的信号,
其中所述处理的信号包括:
包括衰减接收信号的第一分量;和
包括舒适噪声信号的第二分量。
4.根据权利要求3的设备,其特征在于,所述声音检测器产生声音检测信号,只当在预定时间期间所述接收信号中检测无话音时,声音检测信号才指示话音不存在。
5.根据权利要求3的设备,其特征在于,所述舒适噪声包括低通滤波白噪声。
6.根据权利要求3的设备,其特征在于,所述噪声补偿器还包括:
一个衰减器计算器,用于接收所述声音检测信号和用于产生代表衰减被施加到所述接收信号的衰减信号;
一个整形噪声发生器,用于接收所述噪声估计信号和用于产生所述舒适信号;和
一个话音衰减器/舒适噪声***器,响应所述舒适噪声信号和所述衰减信号用于接收所述接收信号和用于衰减所述接收信号并***所述舒适噪声信号到所述接收信号。
7.根据权利要求6的设备,其特征在于,所述舒适噪声信号代表根据所述噪声估计信号标度的低通滤波白噪声。
8.一种用于处理具有话音和噪声分量的接收信号的设备,其特征在于,所述设备包括:
一个能量估计器,用于产生代表所述接收信号的声频能量的能量信号;
一个噪声估计器,用于接收所述能量信号和用于产生代表在所述接收信号中平均背景噪声的噪声估计信号;
多个高通滤波器;和
一种装置,用于将所述多个高通滤波器中的一个加到基于所述噪声估计信号的所述接收信号,和用于产生高通滤波信号。
9.根据权利要求8的设备,其特征在于,所述多个高通滤波器的每一个滤波器的截止频率的差至少是100Hz。
10.一种用于处理具有话音和噪声分量的接收信号的设备,其特征在于,所述设备包括:
一个能量估计器,用于产生代表所述接收信号的声频能量的能量信号;
一个噪声估计器,用于接收所述能量信号和用于产生代表在所述接收信号中平均背景噪声的噪声估计信号;
一个高通滤波器激励器,连接到所述噪声估计器,基于所述噪声估计信号用于滤波的所述接收信号和用于产生高通滤波信号;
一个声音激活性检测器,用于接收所述噪声估计信号和所述能量信号,和用于产生代表在所述接收信号中是否存在话音的声音检测信号;和
一个噪声补偿器,响应所述噪声估计信号和所述声音检测信号,当所述声音检测信号指示在所述接收信号中不存在话音时,用于衰减所述高通滤波信号和***舒适噪声信号到所述高通滤波信号。
11.根据权利要求10的设备,所述高通滤波器激励器进一步包括:
第一高通滤波器;
第二高通滤波器;和
用于将所述第一高通滤波器,所述第二高通滤波器或无高通滤波器加到其于所述噪声估计信号的所述接收信号的装置。
12.根据权利要求11的设备,其特征在于,所述第一高通滤波器和所述第二高通滤波器的截止频率的差至少是100Hz。
13.根据权利要求10所述的设备,其特征在于,当所述声音激活性检测器产生声音检测信号,只当在预定时间期间所述接收信号中检测无话音时,声音检测信号才指示不存在话音。
14.根据权利要求10的设备,其特征在于,所述噪声补偿器还包括:
一个衰减器计算器,用于接收所述声音检测信号和用于产生代表衰减被加到所述接收信号的衰减信号;
一个整形噪声发生器,用于接收所述噪声估计信号和用于产生所述舒适噪声信号;和
一个话音衰减器/舒适噪声***器,响应所述舒适噪声信号和所述衰减信号,用于接收所述高通滤波信号和用于衰减所述高通滤波信号以及用于***所述舒适噪声给到所述高通滤波信号。
15.一种用于处理编码信号的方法,所述编码信号代表话音和噪声,其特征在于,所述方法包括以下步骤:
接收所述编码的信号;
解码所述编码的信号为解码的信号;
产生代表所述解码信号的声频能量的能量信号;
产生代表在所述解码信号中平均背景噪声电平的噪声估计信号;
基于所述能量信号和所述噪声估计信号产生声音检测信号,所述声音检测信号指示所述解码信号是否包含话音分量;和
如果所述声音检测信号指示所述解码信号不包含话音分量:
基于所述噪声估计信号产生舒适噪声信号;
衰减所述解码信号;和
***所述舒适噪声信号到所述解码信号。
16.根据权利要求15的方法,其特征在于,所述产生代表所述解码信号的声频能量的能量值的步骤进一步包括从所述编码信号接收编码能量值的步骤。
17.根据权利要求15的方法,其特征在于,所述产生舒适噪声信号的步骤还包括步骤:
产生白噪声信号;
基于所述噪声估计信号标度所述白噪声信号;和
低通滤波所述标度的白噪声信号。
18.根据权利要求15的方法,其中所述产生声音检测信号的步骤进一步包括步骤:
产生声音检测信号,仅在预定时间期间解码的信号中没有检测到话音时,该声音检测信号才指示没有出现话音。
19.用于处理代表话音和噪声的接收编码信号的方法,其特征在于,所述方法包括以下步骤:
接收所述编码信号;
解码所述编码信号为解码信号;
产生代表所述解码信号的声频能量的能量值;
产生代表在所述解码信号中平均背景噪声电平的噪声估计值;
基于所述能量值和所述噪声估计值确定所述解码信号是否包含话音分量;和
如果所述解码信号在预定时间期间内不包含话音分量:
衰减所述解码信号;和
***舒适噪声到所述解码信号。
20.根据权利要求19的方法,其特征在于,所述舒适噪声包括基于所述噪声估计值标度的低通滤波白噪声。
21.一种用于处理代表话音和噪声的接收信号的方法其特征在于,所述方法包括以下步骤:
产生代表所述接收信号的声频能量的能量信号;
产生代表在所述接收信号中平均背景噪声的噪声估计信号;和
基于所述噪声估计信号,通过将所述接收信号加到多个高通滤波器之一,产生高通滤波信号。
22.根据权利要求21的方法,其特征在于,所述的多个高通滤波器的每个高通滤波器的载止频率的差别至少是100Hz。
23.根据权利要求21的方法,其特征在于,还包括以下步骤:
基于所述能源信号和所述噪声估计信号产生声音检测信号,所述声音检测信号指示所述接收信号是否包含话音分量;和
如果所述声音检测信号指示所述接收信号不包含话音分量,产生处理的高能滤波信号。
24.根据权利要求23的方法,其特征在于,所述产生高通滤波信号的步骤还包括以下步骤:
基于所述噪声估计信号,产生舒适噪声信号;
衰减所述高通滤波信号;和
把所述舒适噪声信号***到所述高通滤波信号中。
25.根据权利要求24的方法,其特征在于,所述舒适噪声信号包括基于所述噪声估计信号标度的低通滤波白噪声。
26.一种用于处理代表话音和噪声接收信号的方法,其特征在于,所述方法包括以下步骤:
产生代表所述接收信号的声频能量的能量值;
产生代表在所述接收信号中平均背景噪声的噪声估计值;
基于所述噪声估计值,通过将所述接收信号加到多个高通滤波器之一,产生高通滤波信号;
产生基于所述噪声估计值的舒适噪声;
基于所述能量值和所述噪声估计值确定所述接收信号是否包含话音分量;和
如果所述接收信号不包含话音分量,产生处理的高通滤波信号。
27.根据权利要求26的方法,其特征在于,所述多个高通滤波器的每一个高通滤波器的截止频率的差别至少是100Hz。
28.根据权利要求26的方法,其特征在于,所述产生处理的高通滤波信号的步骤还包括以下步骤:
衰减所述高通滤波信号;和
把所述舒适噪声***到所述高通滤波信号中。
29.一种用于处理代表话音和噪声的接收编码信号的设备,其特征在于,所述设备包括:
用于接收所述编码信号的装置;
用于解码所述编码信号为解码信号的装置;
用于产生代表所述解码信号声频能量的能量值的装置;
用于产生代表在所述解码信号中平均背景噪声的噪声估计值的装置;
用于基于所述能量值和所述噪声估计确定所述解码信号是否包含话音分量的装置;和
用于在该解码的信号在预定的时间期间不包含话音分量时产生处理的解码信号的装置,所述处理的解码信号包括衰减的解码信号分量和舒适噪声分量。
30.根据权利要求29的设备,其特征在于,所述用于产生代表所述解码信号声频能量的能量值的装置进一步包括用于从所述编码信号中接收编码能量值的装置。
31.一种用于处理接收信号的设备,所述接收信号包括话音分量和噪声分量,其特征在于,所述设备包括:
用于产生代表所述接收信号的声频能量的能量值的装置;
用于产生代表在所述接收信号中平均背景噪声的噪声估计值的装置;
根据所述噪声估计值、通过将所述接收信号施加到多个高通滤波器其中之一上、以产生高通滤波信号的装置。
32.根据权利要求31的设备,其特征在于,所述多个高通滤波器的每个滤波器的截止频率的差别至少是100Hz。
33.根据权利要求31的设备,其特征在于,还包括:
用于确定所述接收信号是否包含话音分量的装置;和
用于在所述接收信号不包含话音分量时、产生经处理的高通滤波信号的装置。
34.根据权利要求33的设备,其特征在于,所述用于产生处理的高通滤波信号的装置还包括:
基于所述噪声估计值、用于产生舒适噪声的装置;
用于衰减所述高通滤波信号的装置;
用于把所述舒适噪声***到所述高通滤波信号中的装置。
35.一种用于处理代表话音和噪声的接收编码信号的设备,其特征在于,所述设备包括:
一个话音解码器,用于接收所述编码信号和产生解码信号;
一个能量估计器,用于从所述编码信号中接收编码能量值和用于产生代表所述编码信号的声频能量的能量信号;
一个噪声估计器,连接到所述能量估计器,用于接收所述能量信号和用于产生代表在所述编码信号的平均背景噪声电平的噪声估计信号;
一个高通滤波器激励器,连接到所述的噪声估计器和所述话音解码器,用于接收所述噪声估计信号和所述解码信号,并基于所述噪声估计信号来高通滤波所述解码信号,和产生高通滤波信号;
一个声音激活性检测器,连接到所述能量估计器和所述噪声估计器,用于接收所述能量信号和所述噪声估计信号和用于产生代表所述编码信号是否包含话音分量的话音检测信号;和
一个噪声补偿器,连接到所述声音激活性检测器、所述噪声估计器和所述高通滤滤器激励器,用于接收所述声音检测信号、所述噪声估计信号和所述高通滤波信号,当所述噪声检测信号指示所述编码信号不包含话音分量时,用于产生处理的高通滤波信号,
其中所述处理的高通滤波信号包含:
一个衰减的高通滤波信号;和
低通滤波的白噪声。
CN95101493A 1994-01-28 1995-01-25 声音激活性检测激励噪声补偿器 Pending CN1132988A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US188294 1994-01-28
US08/188,294 US5657422A (en) 1994-01-28 1994-01-28 Voice activity detection driven noise remediator

Publications (1)

Publication Number Publication Date
CN1132988A true CN1132988A (zh) 1996-10-09

Family

ID=22692567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95101493A Pending CN1132988A (zh) 1994-01-28 1995-01-25 声音激活性检测激励噪声补偿器

Country Status (7)

Country Link
US (1) US5657422A (zh)
EP (2) EP0665530B1 (zh)
KR (1) KR100367533B1 (zh)
CN (1) CN1132988A (zh)
CA (1) CA2138818C (zh)
DE (2) DE69533734T2 (zh)
RU (1) RU2151430C1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100463465C (zh) * 2002-12-25 2009-02-18 日本电信电话株式会社 总话音质量估算方法和装置
CN101106736B (zh) * 2007-08-15 2010-04-14 河南蓝信科技有限公司 应答器报文读取装置和读取方法
CN101002418B (zh) * 2004-06-16 2010-05-12 艾利森电话股份有限公司 补偿噪声估计处理中接收机频率误差的方法和设备
CN102136271A (zh) * 2011-02-09 2011-07-27 华为技术有限公司 舒适噪声生成器、方法及回声抵消装置
US8483854B2 (en) 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
CN104584123A (zh) * 2012-08-29 2015-04-29 日本电信电话株式会社 解码方法、解码装置、程序、及其记录介质
CN107949881A (zh) * 2015-09-10 2018-04-20 高通股份有限公司 解码器之后的音频信号分类和后处理

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852052B1 (en) * 1995-09-14 2001-06-13 Ericsson Inc. System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions
US5914827A (en) * 1996-02-28 1999-06-22 Silicon Systems, Inc. Method and apparatus for implementing a noise generator in an integrated circuit disk drive read channel
JP4307557B2 (ja) * 1996-07-03 2009-08-05 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 音声活性度検出器
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
FR2758676A1 (fr) * 1997-01-21 1998-07-24 Philips Electronics Nv Methode de reduction des clics dans un systeme de transmission de donnees
US5940439A (en) * 1997-02-26 1999-08-17 Motorola Inc. Method and apparatus for adaptive rate communication system
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
US6125343A (en) * 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
US6023674A (en) * 1998-01-23 2000-02-08 Telefonaktiebolaget L M Ericsson Non-parametric voice activity detection
US6182035B1 (en) * 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
USD419160S (en) * 1998-05-14 2000-01-18 Northrop Grumman Corporation Personal communications unit docking station
US6223062B1 (en) 1998-05-15 2001-04-24 Northrop Grumann Corporation Communications interface adapter
US6041243A (en) 1998-05-15 2000-03-21 Northrop Grumman Corporation Personal communications unit
US6141426A (en) 1998-05-15 2000-10-31 Northrop Grumman Corporation Voice operated switch for use in high noise environments
US6304559B1 (en) 1998-05-15 2001-10-16 Northrop Grumman Corporation Wireless communications protocol
US6169730B1 (en) 1998-05-15 2001-01-02 Northrop Grumman Corporation Wireless communications protocol
USD421002S (en) * 1998-05-15 2000-02-22 Northrop Grumman Corporation Personal communications unit handset
US6243573B1 (en) 1998-05-15 2001-06-05 Northrop Grumman Corporation Personal communications system
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
US6157906A (en) * 1998-07-31 2000-12-05 Motorola, Inc. Method for detecting speech in a vocoded signal
US20010014857A1 (en) * 1998-08-14 2001-08-16 Zifei Peter Wang A voice activity detector for packet voice network
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
WO2000060579A1 (en) * 1999-04-05 2000-10-12 Hughes Electronics Corporation A frequency domain interpolative speech codec system
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
US6944141B1 (en) * 1999-10-22 2005-09-13 Lucent Technologies Inc. Systems and method for phase multiplexing in assigning frequency channels for a wireless communication network
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
DE60143506D1 (de) * 2000-01-27 2011-01-05 Nuance Comm Austria Gmbh Sprachdetektiongsgerät mit zwei abschaltkriterien
JP3929686B2 (ja) * 2000-08-14 2007-06-13 松下電器産業株式会社 音声スイッチング装置およびその方法
US6873604B1 (en) * 2000-07-31 2005-03-29 Cisco Technology, Inc. Method and apparatus for transitioning comfort noise in an IP-based telephony system
WO2002029780A2 (en) * 2000-10-04 2002-04-11 Clarity, Llc Speech detection with source separation
US6708147B2 (en) 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US7180881B2 (en) * 2001-09-28 2007-02-20 Interdigital Technology Corporation Burst detector
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
KR100463657B1 (ko) * 2002-11-30 2004-12-29 삼성전자주식회사 음성구간 검출 장치 및 방법
TWI233590B (en) * 2003-09-26 2005-06-01 Ind Tech Res Inst Energy feature extraction method for noisy speech recognition
FR2861247B1 (fr) 2003-10-21 2006-01-27 Cit Alcatel Terminal de telephonie a gestion de la qualite de restituton vocale pendant la reception
JP4490090B2 (ja) * 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP4601970B2 (ja) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
EP1557820B1 (en) * 2004-01-22 2006-10-18 Siemens S.p.A. Voice activity detection operating with compressed speech signal parameters
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
US20060104460A1 (en) * 2004-11-18 2006-05-18 Motorola, Inc. Adaptive time-based noise suppression
WO2006104555A2 (en) 2005-03-24 2006-10-05 Mindspeed Technologies, Inc. Adaptive noise state update for a voice activity detector
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
PL2118889T3 (pl) 2007-03-05 2013-03-29 Ericsson Telefon Ab L M Sposób i sterownik do wygładzania stacjonarnego szumu tła
WO2008108719A1 (en) * 2007-03-05 2008-09-12 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for smoothing of stationary background noise
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
WO2009130388A1 (en) * 2008-04-25 2009-10-29 Nokia Corporation Calibrating multiple microphones
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
US8244528B2 (en) * 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
EP3576388A1 (en) 2008-11-10 2019-12-04 Google LLC Speech detection
ES2371619B1 (es) * 2009-10-08 2012-08-08 Telefónica, S.A. Procedimiento de detección de segmentos de voz.
FR2956539B1 (fr) * 2010-02-16 2012-03-16 Dominique Retali Procede de detection du fonctionnement d'un dispositif de transmission sans fil de signaux de voix.
TWI459828B (zh) 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
US8428759B2 (en) 2010-03-26 2013-04-23 Google Inc. Predictive pre-recording of audio for voice input
CN102844810B (zh) * 2010-04-14 2017-05-03 沃伊斯亚吉公司 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
US8253684B1 (en) 2010-11-02 2012-08-28 Google Inc. Position and orientation determination for a mobile computing device
KR20120080409A (ko) * 2011-01-07 2012-07-17 삼성전자주식회사 잡음 구간 판별에 의한 잡음 추정 장치 및 방법
US8862254B2 (en) * 2011-01-13 2014-10-14 Apple Inc. Background audio processing
KR101624019B1 (ko) * 2011-02-14 2016-06-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코덱에서 잡음 생성
CN103620672B (zh) 2011-02-14 2016-04-27 弗劳恩霍夫应用研究促进协会 用于低延迟联合语音及音频编码(usac)中的错误隐藏的装置和方法
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
MY164797A (en) 2011-02-14 2018-01-30 Fraunhofer Ges Zur Foederung Der Angewandten Forschung E V Apparatus and method for processing a decoded audio signal in a spectral domain
EP2676266B1 (en) 2011-02-14 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Linear prediction based coding scheme using spectral domain noise shaping
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
AU2012217216B2 (en) 2011-02-14 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
PT2936486T (pt) 2012-12-21 2018-10-19 Fraunhofer Ges Forschung Adição de ruído de conforto para modelagem do ruído de fundo em baixas taxas de bits
RU2650025C2 (ru) 2012-12-21 2018-04-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов
US9275638B2 (en) * 2013-03-12 2016-03-01 Google Technology Holdings LLC Method and apparatus for training a voice recognition model database
EP3719801B1 (en) * 2013-12-19 2023-02-01 Telefonaktiebolaget LM Ericsson (publ) Estimation of background noise in audio signals
US9589574B1 (en) * 2015-11-13 2017-03-07 Doppler Labs, Inc. Annoyance noise suppression
US9654861B1 (en) 2015-11-13 2017-05-16 Doppler Labs, Inc. Annoyance noise suppression
CN105913854B (zh) * 2016-04-15 2020-10-23 腾讯科技(深圳)有限公司 语音信号级联处理方法和装置
CN109032233A (zh) 2016-08-18 2018-12-18 华为技术有限公司 一种电压产生装置及半导体芯片
RU2651803C1 (ru) * 2016-12-22 2018-04-24 Акционерное общество "Научно-производственное предприятие "Полет" Подавитель шума
US10157627B1 (en) * 2017-06-02 2018-12-18 Bose Corporation Dynamic spectral filtering
KR102629385B1 (ko) * 2018-01-25 2024-01-25 삼성전자주식회사 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
KR20210031265A (ko) * 2019-09-11 2021-03-19 삼성전자주식회사 전자 장치 및 그 동작방법
RU2742720C1 (ru) * 2019-12-20 2021-02-10 Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Московский институт электронной техники" Устройство для защиты конфиденциальных переговоров
US20220417659A1 (en) * 2021-06-23 2022-12-29 Comcast Cable Communications, Llc Systems, methods, and devices for audio correction

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4061875A (en) * 1977-02-22 1977-12-06 Stephen Freifeld Audio processor for use in high noise environments
US4720802A (en) * 1983-07-26 1988-01-19 Lear Siegler Noise compensation arrangement
DE3689035T2 (de) * 1985-07-01 1994-01-20 Motorola Inc Rauschminderungssystem.
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
US4864561A (en) * 1988-06-20 1989-09-05 American Telephone And Telegraph Company Technique for improved subjective performance in a communication system using attenuated noise-fill
GB2256351B (en) * 1991-05-25 1995-07-05 Motorola Inc Enhancement of echo return loss
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
US5410632A (en) * 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
US5285502A (en) * 1992-03-31 1994-02-08 Auditory System Technologies, Inc. Aid to hearing speech in a noisy environment
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100463465C (zh) * 2002-12-25 2009-02-18 日本电信电话株式会社 总话音质量估算方法和装置
CN101002418B (zh) * 2004-06-16 2010-05-12 艾利森电话股份有限公司 补偿噪声估计处理中接收机频率误差的方法和设备
CN101106736B (zh) * 2007-08-15 2010-04-14 河南蓝信科技有限公司 应答器报文读取装置和读取方法
US8600740B2 (en) 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
US8483854B2 (en) 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
US8554551B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US8554550B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multi resolution analysis
US8560307B2 (en) 2008-01-28 2013-10-15 Qualcomm Incorporated Systems, methods, and apparatus for context suppression using receivers
CN102136271A (zh) * 2011-02-09 2011-07-27 华为技术有限公司 舒适噪声生成器、方法及回声抵消装置
CN104584123A (zh) * 2012-08-29 2015-04-29 日本电信电话株式会社 解码方法、解码装置、程序、及其记录介质
US9640190B2 (en) 2012-08-29 2017-05-02 Nippon Telegraph And Telephone Corporation Decoding method, decoding apparatus, program, and recording medium therefor
CN104584123B (zh) * 2012-08-29 2018-02-13 日本电信电话株式会社 解码方法、以及解码装置
CN108053830A (zh) * 2012-08-29 2018-05-18 日本电信电话株式会社 解码方法、解码装置、程序和记录介质
CN108053830B (zh) * 2012-08-29 2021-12-07 日本电信电话株式会社 解码方法、解码装置、和计算机可读取的记录介质
CN107949881A (zh) * 2015-09-10 2018-04-20 高通股份有限公司 解码器之后的音频信号分类和后处理
CN107949881B (zh) * 2015-09-10 2019-05-31 高通股份有限公司 解码器之后的音频信号分类和后处理

Also Published As

Publication number Publication date
KR950035167A (ko) 1995-12-30
KR100367533B1 (ko) 2003-04-07
DE69518174T2 (de) 2001-05-31
RU2151430C1 (ru) 2000-06-20
DE69518174D1 (de) 2000-09-07
CA2138818C (en) 1999-05-11
EP0665530A1 (en) 1995-08-02
EP1017042B1 (en) 2004-11-03
DE69533734T2 (de) 2005-11-03
EP1017042A1 (en) 2000-07-05
RU95101029A (ru) 1996-11-10
EP0665530B1 (en) 2000-08-02
DE69533734D1 (de) 2004-12-09
US5657422A (en) 1997-08-12
CA2138818A1 (en) 1995-07-29

Similar Documents

Publication Publication Date Title
CN1132988A (zh) 声音激活性检测激励噪声补偿器
EP1239465B2 (en) Method and apparatus for selecting an encoding rate in a variable rate vocoder
US5642464A (en) Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding
CN1075692C (zh) 通信***中噪声抑制方法及装置
EP0848374B1 (en) A method and a device for speech encoding
CA1239701A (en) Method and apparatus for encoding speech
EP0718820A3 (en) Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
AU7078496A (en) System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions
CN1288557A (zh) 解码方法和包括自适应后置滤波器的***
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
CN1116348A (zh) 自适应数字音频编码***
US6029125A (en) Reducing sparseness in coded speech signals
DE60027012T2 (de) Verfahren und vorrichtung zur verschachtelung der quantisierungsverfahren der spektralen frequenzlinien in einem sprachkodierer
EP1222658B1 (en) Frequency spectrum partitioning of a prototype waveform
GB2342829A (en) Postfilter
AU6203300A (en) Coded domain echo control
CN1101214A (zh) 背景音的编码/译码方法和设备
AU6533799A (en) Method for transmitting data in wireless speech channels
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
CN1256000A (zh) 增强音调的方法和装置
WO2000046795A9 (en) Speech synthesizer based on variable rate speech coding
WO2002082425A1 (en) Adpcm speech coding system with specific step-size adaptation
EP1688918A1 (en) Speech decoding
GB2341299A (en) Suppressing noise in a speech communications unit

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication