CN1286788A - 关于低比特率语音编码器的噪声抑制 - Google Patents
关于低比特率语音编码器的噪声抑制 Download PDFInfo
- Publication number
- CN1286788A CN1286788A CN99801661A CN99801661A CN1286788A CN 1286788 A CN1286788 A CN 1286788A CN 99801661 A CN99801661 A CN 99801661A CN 99801661 A CN99801661 A CN 99801661A CN 1286788 A CN1286788 A CN 1286788A
- Authority
- CN
- China
- Prior art keywords
- noise
- input signal
- signal
- band spectrum
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 53
- 238000001228 spectrum Methods 0.000 claims abstract description 95
- 230000004044 response Effects 0.000 claims abstract description 48
- 230000007774 longterm Effects 0.000 claims abstract description 6
- 230000003595 spectral effect Effects 0.000 claims description 54
- 238000000034 method Methods 0.000 claims description 41
- 238000007493 shaping process Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 15
- 230000008447 perception Effects 0.000 claims description 10
- 238000005311 autocorrelation function Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 238000011045 prefiltration Methods 0.000 claims 2
- 238000005259 measurement Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 15
- 230000007704 transition Effects 0.000 description 12
- 230000009467 reduction Effects 0.000 description 10
- 238000011524 similarity measure Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- SYHGEUNFJIGTRX-UHFFFAOYSA-N methylenedioxypyrovalerone Chemical compound C=1C=C2OCOC2=CC=1C(=O)C(CCC)N1CCCC1 SYHGEUNFJIGTRX-UHFFFAOYSA-N 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
在携带噪声和语音的组合的输入信号中的噪声得到了抑制。输入信号被划分成若干个信号块,对这些信号块进行处理以提供输入信号的短时间感知带谱的估计值。在不同的时间点上判断输入信号只携带噪声还是噪声和语音的组合。当输入信号只携带噪声时,输入信号的相应估计的短时间感知带谱用来修正噪声的长时间感知带谱的估计值。然后,根据噪声的长时间感知带谱的估计值和输入信号的短时间感知带谱确定噪声抑制频率响应,和噪声抑制频率响应用来成形与噪声抑制频率响应相一致的输入信号的当前块。
Description
发明背景
本发明提供了适用于低比特率语音编码器的前端的噪声抑制技术。这种创造性的技术尤其适合用在蜂窝式电话应用中。
下列的现有技术文件提供了有关本发明的技术背景:“改进的可变速率编解码器,用于宽带扩频数字***的语音服务可选方案3,”(“ENHANCEDVARIABLE RATE CODEC,SPEECH SERVICE OPTION 3 FORWIDEBAND SPREAD SPECTRUM DIGITAL SYSTEMS”,TIA/EIA/IS-127standard),“关于语音改善方法的语音/暂停检测器的研究”(“THE STUDYOF SPEECH/PAUSE DETECTORS FOR SPEECH ENHANCEMENTMETHODS”,P.Sovka and P.Pollak,Eurospeech 95 Madrid,1995,P.1575-1578),“利用最小二乘法误差快速频谱估值器的语音改善”(“SPEECHENHANCEMENT USING A MINIMUM MEAN-SQUARE ERROR SHORT-TIME SPECTRAL AMPLITUPE ESTIMATOR”,Y.Ephraim,D.Malah,IEEETransactions on Acoustics Speech and Signal Processing,Vol.ASSP-32,No.6,Dec.1984,PP.1109-1121),“利用频谱扣除的声音噪声抑制”(“SUPPRESSION OF ACOUSTCC NOISE USING SPECTRALSUBTRACTION”,S.Boll,IEEE Trangactions on Acoustics Speech and SignalProcessing,Vol.ASSP-27,No.2,April 1979,PP113-120),“基于统计模型的语音改善***”(“STATISTICAL-MODEL-BASED SPEECHENHANCEMENT SYSTEMS”,Proceedings of the IEEE,Vol.80,No.10,October 1992,PP1526-1544)。
用于噪声抑制的不太复杂的方法是频谱修正(也称为频谱扣除)。利用频谱修正的噪声抑制算法首先将含噪声的语音信号划分成几个频带。对每个频带进行增益计算,增益通常依赖于该带中估计的信噪比。应用这些增益,并且重构一个信号。这种类型的方案必须从所观察的含噪声语音信号中估计信号和噪声特性。在如下的美国专利中可以找到几个频谱修正技术的应用例子:US专利号:5,687,285;5,680,393;5,668,927;5,659,622;5,651,071;5,630,015;5,625,684;5,621,850;5,617,505;5,617,472;5,602,962;5,577,161;5,555,287;5,550,924;5,544,250;5,539,859;5,533,133;5,530,768;5,479,560;5,432,859;5,406,635;5,402,496;5,388,182;5,388,160;5,353,376;5,319,736;5,278,780;5,251,263;5,168,526;5,133,013;5,081,681;5,040,156;5,012,519;4,408,855;4,897,878;4,811,404;4,747,143;4,737,976;4,630,305;4,630,304;4,628,529和4,468,804。
频谱修正具有几个合乎要求的特性。首先,可以使它变成自适应的,因此,它可以应付可变的噪声环境。第二,许多计算可以在离散付里叶变换(DFT)域内进行。因此,可以使用快速算法(如快速付里叶变换(FFT))。
但是,在这方面技术的当前状态下,存在着几个缺点。这些缺点包括:
(ⅰ)在降低高噪声电平过程中所希望语音信号的不良畸变(这样的畸变有几方面原因,一些畸变将在下面细述);和
(ⅱ)计算的过份复杂性。
提供能克服现有技术中的缺点的噪声抑制技术是有益的。尤其是,提供考虑典型地出现在基于块的噪声抑制技术中的时域不连续的噪声抑制技术是有益的。进一步,提供这种减少由于频谱扣除所固有的频域不连续性引起的畸变的技术是有益的。还进一步,降低在提供噪声抑制过程中频谱成形操作的复杂性和提高在噪声抑制技术中所估计噪声统计的可靠性是有益的。
本发明提供了具有这些和其它优点的噪声抑制技术。
发明简述
本发明提供了其中由于典型地出现在基于块的噪声抑制技术中的时域不连续性引起的畸变得到减少的噪声抑制技术。随着在噪声抑制处理中所使用的频谱形成操作的复杂性得到降低,由于在频谱扣除中所固有的频域不连续性引起的畸变也得到减少。通过使用改进的语音灵敏检测器,本发明还提高了所估计噪声统计的可靠性。
根据本发明的方法抑制了传输噪声和语音的组合的输入信号中的噪声成分。输入信号被划分成信号块,对这些信号块进行处理以得出输入信号的短时间感知带谱(short-time perceptual band spectrum)的估计值。在不同时间点上确定输入信号只携带噪声还是传输噪声和语音的组合。当输入信号只携带噪声时,输入信号的相应估计的短时间感知带谱被用来修改噪声的长时间感知带谱的估计值。然后,根据噪声的长时间感知带谱的估计值和输入信号的短时间感知帝谱确定噪声抑制频率响应,并且噪声抑制频率响应被用来成形与噪声抑制频率响应相一致的输入信号的当前块。
本发明还可以包括预滤波输入信号以加强其中的高频成分的步骤。在图示的实施例中,输入信号的处理包括将离散付里叶变换应用到信号块中以便提供每块的复值频域表示。信号块的频域表示被转换成只有幅度的信号,在穿过几个分离的频带上对这些信号求平均以获得长时间感知带谱的估计值。对感知带谱的随时间变化的成分进行平滑以得到短时间感知带谱的估计值。
噪声抑制频率响应可以使用应用于成形输入信号的当前块的全极点滤波器器进行模拟。
本发明提供了抑制携带噪声和语音的组合的输入信号中的噪声的设备。能够预滤波输入信号以加强其中的高频成分的信号预处理器将输入信号分成若干块。然后,快速付里叶变换处理器处理这些块以提供输入信号的频域复值谱。配置累加器将频域复值谱累加成由不等宽频带组成的长时间感知帝谱。对长时间感知带谱进行滤波生成由所述长时间感知带谱的当前片段加噪声组成的短时间感知带谱的估计值。语音/暂停检测器判断在给定时间点上输入信号只是噪声,还是语音和噪声的组合。当输入信号只是噪声时,噪声谱估值器响应语音/暂停检测电路,根据短时间感知带谱来修正噪声的长时间感知带谱的估计值。谱增益处理器响应噪声谱估值器确定噪声抑制频率响应。然后,谱成形处理器响应谱增益处理器成形输入信号的当前块以抑制其中的噪声。谱成形处理器可以包括,例如,一个全极点滤波器。
此外,本发明还公开了抑制在传输噪声和诸如语音那样的音频信息的组合的输入信号中的噪声的方法。噪声抑制频率响应是针对频域中的输入信号来计算的。然后,所计算的噪声抑制频率响应应用于时域中的输入信号中抑制输入信号中的噪声。这种方法可以进一步包括在计算输入信号中的噪声抑制频率响应之前将输入信号划分成若干块的步骤。在图示的实施例中,噪声抑制频率响应是通过由确定噪声抑制频率响应的自相关函数所生成的全极点滤波器应用到输入信号中的。
附图简述
图1是根据本发明的噪声抑制算法的方块图;
图2是显示根据本发明的输入信号的分块处理的示意图;
图3是显示具有不同宽度的、含有离散付里叶变换(DFT)箱的各个噪声谱带(NS带)的相关性的示意图;
图4是一种可能的语音/暂停检测器实施例的方块图;
图5包括提供含噪声的语音发声的能量测量例子的波形;
图6包括提供含噪声语音发声的频谱转换测量例子的波形;
图7包括提供含噪声语音发声的频谱相似性测量例子的波形;
图8是模拟含噪声语音信号的信号状态器的图示;
图9显示分段恒定的频率响应;和
图10显示了图9所示的分段恒定频率响应的平滑。
发明详述
根据本发明,噪声抑制算法计算随时间变化的滤波响应并将它应用到含噪声语音中。此算法的方块图显示在图1中,其中标有“AR参数计算”和“AR频谱成形”的方块与随时间变化的滤波响应的应用有关,和“AR”表示“自回归”。图1中的所有其它方块与从含噪声语音中计算随时间变化的滤波响应相对应。
含噪声输入信号在使用简单高通滤波器的信号预处理器10中得到预处理来稍微加强其高频成分。然后,预处理器将滤波信号划分成若干个通过快速付里叶变换(FFT)模块12的块。FFT模块12为信号块开一个窗口并对信号进行离散付里叶变换。对产生的频域复值表示进行处理以生成只有幅度的信号。在几个分离的频带中对这些只有幅度的信号值求平均产生一个“感知带谱”。求平均值导致了必须要处理的数据量的减少。
感知带谱中的时间变化在信号和噪声谱估计模块14中被平滑生成输入信号的短时间感知带谱的估计值。这个估计值传送到语音/暂停检测器16、噪声谱估值器18和谱增益计算模块20。
语音/暂停检测器16判断当前输入信号仅仅是噪声,还是语音和噪声的组合。通过测量输入语音信号的几个特性、使用这些测量结果修正输入信号的模型和利用这个模型的状态作出最后的语音/暂停判定来作出这个判断。然后,这个判定结果传送到噪声谱估值器。
当语音/暂停检测器16确定出输入信号只由噪声组成时,噪声谱估值器18利用当前感知带谱修正噪声的感知带谱估计值。另外,噪声谱估值器的某些参数也在这个模块中得到修正并被反送到语音/暂停检测器16中。然后,噪声的感知带谱估计值传送到谱增益计算模块20中。
利用当前信号和噪声的感知带谱的估计值,谱增益计算模块20确定噪声抑制频率响应。正如图9所示的,这个噪声抑制频率响应是分段恒定的。每个分段恒定的片段对应于临界带谱的一个成分。这个频率响应传送到AR参数计算模块22。
AR参数计算模块利用全极点滤波器模拟噪声抑制频率响应。由于噪声抑制频率响应是分段恒定的,它的自相关函数可以以闭合形式容易得到确定。然后,全极点滤波器参数可以有效地从自相关函数中计算出来。分段恒定谱的全极模拟具有在噪声抑制谱中消除不连续的效果。应该认识到,现在为人所知的或以后发现的其它模拟技术都可以代替全极点滤波器的使用,所有这样的同等技术都意味着由本文所主张的发明所覆盖。
AR谱成形模块24利用AR参数将滤波应用到输入信号的当前块中。通过实现时域内的谱成形,由于块处理引起的时间不连续性得到降低。此外,由于噪声抑制频率响应也可以利用低阶全极点滤波器来模拟,因此,时域成形可以导致在某些处理器上更有效实现。
在信号预处理模块10中,信号首先利用形式为H(z)=1-0.8z-1的高通滤波器得到预加强。这种高通滤波器被选用来部分补偿语音中所固有的谱倾斜。由此预处理的信号生成更加精确的噪声抑制频率响应。
如图2所示,输入信号30以八十个样本(对应于8KHz取样速率上的10ms)为块单位得到处理。这在图中由分析块34所表示,分析块34的长度是八十个样本。更具体地说,在所示例子的实施例中,输入信号被划分成一百二十八个样本的块。每块由来自前一块的最后二十四个样本(参考标号32)、分析块34的八十个新样本和其值为零的二十四个样本(参考标号36)组成。每一块都用汉明窗来开窗并进行付里叶变换。
隐含在块结构中的零位填充值得进一步说明一下。尤其是,从信号处理的观点来看,零位填充是没有必要的,因为谱成形(下面将要说明)并没有利用离散付里叶变换来实现。但是,包含了零位填充可以容易地将此算法整合到由本发明的受让人、Solana技术发展公司(Solana Technology DevelopmentCorporation)研制的现有EVRC语音编解器中。这种块结构并不需要对现有EVRC代码的整个缓冲管理策略作什么改变。
每个噪声抑制帧都可以被看作一个128个点的序列。当这个序列由g[n]来表示时,信号块的频域表示可以定义为离散付里叶变换 这里,c是归一化常数。
然后,信号谱被累加成如下形式的不等宽频带:其中,
F1[k]={2、4、6、8、10、12、14、17、20、23、27、31、36、42、49、56}
Fh[k]={3、5、7、9、11、13、16、19、22、26、30、35、41、48、55、63}
这个不等宽频带被称为感知带谱。这个通常表示成50的频带显示在图3中。如图所示,噪声谱带(NS带)具有不同的宽度,并且与离散付里叶变换(DFT)箱(bins)相关。
信号加噪声的感知带谱的估计值是在模块14(图1)中利用例如单极点递归滤波器对感知带谱进行滤波生成的。信号加噪声的功率谱的估计值是:
Su[k]=β.Su[k]+(1-β).S[k]
由于语音特性只在相对较短时间的区间上是稳定的,因此,选择β只在n个(例如,2-3个)噪声抑制块上进行平滑。这种平滑被称为“短时间”平滑,并提供了“短时间感知带谱”的估计值。
为了能起适当作用,噪声抑制***要求对噪声统计的精确估计。这种功能是由语音/暂停检测模块16来提供的。在一个可能的实施例中,配置了同时测量语音和噪声的单个麦克风。由于噪声抑制算法要求对噪声统计的估计,因此需要一种用来区分含噪声语音信号与只有噪声的信号的方法。这种方法必须从本质上检测到含噪声语音中的暂停。由于几方面的因素,这个工作变得更为困难:
1.暂停检测器[pause detector]必须能在低噪比(0-5dB的数量级)的状态下合格地工作。
2.暂停检测器必须对本底噪声统计的缓慢变化不灵敏。
3.暂停检测器必须精确地区分似噪声语音声音(例如,摩擦声)和本底噪声。
图4提供了一种可能的语音/暂停检测器16的实施例的方块图。
当在有限数量的信号模型之间进行转换生成含噪声语音信号时,暂停检测器模拟该含噪声语音信号。有限状态器(FSM)64支配模型之间的转换。语音/暂停判定与对当前信号的测量结果和其它适当的状态变量一起是FSM的当前状态的函数。状态之间的转换是当前FSM状态和对当前信号的测量结果的函数。
如下所述的测量值用来确定驱动信号状态状态器64的二进制值参数。通常,这些二进制值参数是通过将适当的实测量值与自适应的阀值进行比较来确定的。由测量模块60提供的信号测量结果量化成如下的信号特性:
1.能量测量判断该信号是高能的还是低能的。这个用E[i]表示的信号能量定义为
含噪声语音发声的能量测量例子显示在图5中,其中各个语音样本的幅度由曲线70来表示,相应NS块的能量测量由曲线72来表示。
2.频谱转换测量判断该信号谱在短时间窗上是处在稳定状态还是处在暂态。这个测量是通过确定感知带谱的各个频带的经验平均值和方差来计算的。感知带谱的所有频带的方差之和用作频谱转换的测量。更具体地说,用Ti表示的转换测量计算如下:
感知带谱的每个频带的平均值是通过单极点递归滤波器Si[k]=α
Si-1[k]+(1-α)Si[k]来计算的。感知带谱的每个频带的方差是通过递归滤波器
来计算的。选择滤波参数α在相对较长的时间间隔,例如,10-12个噪声抑制块,上进行平滑。
总方差是作为每个频带的方差之和 计算出来的。请注意,当感知带谱偏离其长时间平均值并不太大时,σi 2本身的方差将是最小的。由此得出,频谱转换的合理测量是бi 2的方差,其值计算如下:自适应时间常数ωi由下式给出:
通过采用时间常数,频谱转换测量适当地追踪信号处于稳定状态的那一部分。含噪声语音发声的频谱转换测量的例子显示在图6中,其中各个语音样本的幅度由曲线74来表示,相应NS块的能量测量由曲线75来表示。
3.用SSi表示的频谱相似性测量测量当前信号谱与估计噪声谱之间的相似程度。为了定义频谱相似性测量,我们假定,由Ni[k]表示的、噪声的感知带谱的对数估计值是可用的(下面结合对噪声谱估值器的讨论给出Ni[k]的定义)。然后,频谱相似性测量定义为 含噪声语音发声的频谱相似性测量的例子显示在图7中,其中各个语音样本的幅度由曲线76来表示,相应NS块的能量测量由曲线78来表示。请注意,频谱相似性测量的低值对应于高相似的频谱,而较高的频谱相似性测量值则对应于不相似频谱。
4.能量相似性测量判断当前信号能量 是否与估计的噪声能量相似。这是通过将信号能量与阈值应用模块62所施加的阈值相比较来确定的。实际阈值由阈值计算处理器66计算出来,阈值计算处理器可以由一个微处理器组成。
二进制参数通过由S[k]表示信号谱的当前估计值、由Ei表示信号能量的当前估计值、由Ni[k]表示对数噪声谱的当前估计值、由Ni表示噪声能量的当前估计值和由
表示噪声能量估计值的方差来确定。
参数high_Low_energy表示信号是否含有高能成分。高能是相对于本底噪声的估计能量定义的。它是通过估计当前信号帧中的能量并应用到阈值中计算出来的。其值定义如下:
high_Low_enery=1 Ei>Et
0 Ei≤Et
这里,E是由
定义的,Et是一个自适应阈值。
参数transition表示当信号谱正在经历转换的时候。它是通过从谱的平均值观察当前短时间谱的偏差来测量的。
从数学上,它定义为:
Transition=1 Ti>Tt
0 Ti≤Tt
这里,T是在前一部分定义的频谱转换测量,Tt是下文将要作更详细描述的自适应计算的阈值。
参数Spectral_similarity测量当前信号谱与估计噪声谱之间的相似性。它是通过计算当前信号的对数谱与噪声的估计对数谱之间的距离来测量的。
Spectral_similarity=1 SSi<SSt
0 SSi≥SSt
这里,SSi如上所述,SSt是下面将要讨论的阈值(例如,一个常数)。
参数energy_similarity测量当前信号的能量与估计噪声能量之间的相似性。
energy_similarity=1 E<ESt
0 E≥ESt
这里,E由 定义,ESt是下面将要确定的自适应计算的阈值。
如上所述的变量都是通过将一个数与一个阈值进行比较来计算的。前面三个阈值反应了动态信号的特性,它们将依赖于噪声的特性。这三个阈值是估计平均值与标准偏差的和积的和值。关于频谱相似性测量的阈值并不依赖于噪声的具体特性,可以将它设置成一个常值。
高/低能阈值是由阈值计算处理器66(图4)按照
计算出来的,这里,
定义的经验方差,
E1是由
E1=γ
Ei-1+(1-γ)Ei定义的经验平均值。
频谱转换阈值是按照Tt=2Ni来计算的。频谱相似性阈值是具有SSt=10量值的常数。
模拟含噪声语音信号的信号状态状态器更详细地显示在图8中。其状态转换是受前一部分所描述的信号测量结果支配的。信号状态是单元80所示的低能稳定状态、单元82所示的暂态和单元84所示的高能稳定状态。在低能稳定状态期间,没有频谱转换发生,信号能量在阈值以下。在暂态期间,发生了频谱转换。在高能稳定状态期间,没有频谱转换发生,信号能量在阈值之上。状态之间的转换是受上面所述的信号测量结果支配的。
状态器转换过程列在表1中。表1
转换 | 输入 | |
初态→末态 | 转换值 | 高/低能 |
1→1 | 0 | 0 |
1→2 | 1 | X |
1→2 | 0 | 1 |
2→1 | 0 | 0 |
2→2 | 1 | X |
2→3 | 0 | 1 |
3→2 | 1 | X |
3→2 | 0 | 0 |
3→3 | 0 | 1 |
在此表中,“X”意味着“任意值”。注意,对任何测量结果都确保状态转换。
由检测器16(图1)提供的语音/暂停判定依赖于信号状态状态器的当前状态和结合图4所描述的信号测量结果。语音/暂停判定是受如下的伪码(暂停:dec=0;语音:dec=1)支配的。
Dec=1; if spectral_similarity=1 dec=0; elseif durrent_state=1 if energy_similarity=1 dec=0 end end
噪声谱是由噪声参数估计模块68(图4)在分类为暂停的帧期间利用公式Ni[k]=βNi[k]+[1-β]log(Si[k])估计出来的,这里β是在0与1之间的常数。噪声能量的当前估计值
Ni和噪声能量估计的方差Ni定义如下:
Ni=λ
Ni-1[k]+(1-λ)log(Ei)1
这里,滤波常数λ被选择成在10-20个噪声抑制块上求平均值。
频谱增益可以通过现有技术中各种各样众所周知的方法来计算。与当前处理适合得好的一种方法包括将信噪比定义为SNR[k]=c*(log Su[k]-Ni[k]),这里,c是常数,Su[k]和Ni[k]定义如上。增益的噪声依赖成分定义为 瞬时增益是按照Gch[k]=10γx+C2(SNR[K]-6))/20来计算的。一旦瞬时增益已经计算出来,就利用单极点平滑滤波器Gs[k]=βGs[k-1]+(1-β)Gch[k]对其进行平滑,这里,向量Gs[k]是时刻t的平滑信道增益向量。
一旦目标频率响应已经计算出来,必须将它应用到含噪声语音中。这对应于修改含噪声语音信号的短时间谱的(随时间变化)滤波操作。结果是噪声得到抑制的信号。与当前的实践不同,这种频谱修改并不需要被应用在频域中。的确,频域处理可能存在如下缺点:
1.可能变得毫无必要的复杂
2.可能导致低质量的噪声抑制语音
频谱成形的时域处理具有成形滤波的脉冲响应并不需要线性相位的额外优点。此外,时域处理消除了由于循环卷积引起的赝信号的可能性。
本文所述的频谱成形技术包括用来设计与其应用一起处理噪声抑制频率响应的不太复杂滤波器的方法。这种滤波器是由AR频谱成形模块24(图1)根据AR参数计算处理器22所提供的参数来提供的。
由于所希望的频率响应对于相对少的片段是分段恒定的,如图9所示,因此,其自相关函数可以以闭合形式有效地确定下来。给定自相关系数,近似于分段恒定频率响应的全极点滤波器可以得以确定。这种方法具有几方面优点。首先,与分段恒定频率响应有关的频谱不连续性得以消除。其二,与FFT块处理有关的时间不连续性也得以消除。第三,由于成形是应用在时域中的,因此,并不需要逆DFT。给定全极点滤波器的低阶,这样可以提供定点处理上的优点。
这样的频率响应可以用数学表达式表示为 这里,Gs[k]是平滑的信道增益,它设置第i个分段恒定片段的幅度,I(ω,ωi-1,ωi)是由频率ωi-1和ωi限定的间隔的指示函数,即,当ωi-1<ω<ωi时,I(ω,ωi-1,ωi)等于1,否则,等于0。自相关函数是H2(ω)的逆付里叶变换,即:
这里,γi=(ωi-ωi-1)和βi=(ωi-1+ωi)/2。通过查阅有关sin(γin)cos(βin)/πn的数值表可以容易地对其进行处理。
给定上面所陈述的自相关函数,频谱的全极点模型可以通过求解正规方程来确定。所需的矩阵求逆可以通过,例如,Levinson/Durbin逆归法有效地计算出来。
利用十六阶滤波的全极点模拟的有效性的例子显示在图10中。可以看出,频谱不连续性已经得到平滑。很显然,通过提高全极点滤波器的阶数可以使模型变得更加准确。但是,十六的滤波阶数在合理的计算价格上提供了很好的性能。
为了提供频谱成形的输出信号,由AR参数计算处理器22计算的参数所提供的全极点滤波器应用到AR频谱成形模块24中的含噪声输入信号的当前块中。
现在,应该体会到本发明提供了带有各种独特特征的应用于噪声抑制的方法和设备。具体地说,本发明提供了由用来模拟输入信号的状态器组成的语音灵敏检测器。这个状态器由从输入信号得到的各种测量结果来驱动。这种结构产生了不太复杂但精度较高的语音/暂停判定。另外,噪声抑制频率响应是在频域中计算出来的但应用于时域之中。这样具有消除时域不连续性的效应,这种时域不连续性可能出现在应用于频域中的噪声抑制频率响应的“基于块”的方法之中。此外,利用确定噪声抑制频率响应的自相关函数的新颖方法设计噪声抑制滤波器。然后,这种自相关序列用来生成全极点滤波器。在一些情况下,这种全极点滤波器对实现频域方法是不太复杂的。
尽管通过结合本发明的具体实施例已经对本发明进行了说明,但应该明白,对其所作的各种修改和变动均不偏离权利要求书所述的本发明的范围。
Claims (14)
1.一种用来抑制在携带噪声和语音组合的输入信号中的噪声的方法,包括下列步骤:
将所述输入信号划分成若干信号块;
处理所述信号块以提供所述输入信号的短时间感知带谱的估计值;
在不同的时间点上判断所述输入信号只携带噪声还是语音和噪声的组合,和当输入信号只携带噪声时,利用输入信号的相应估计的短时间感知带谱修正噪声的长时间感知带谱的估计值;
根据所述噪声的长时间感知带谱的估计值和输入信号的估计短时间感知带谱确定噪声抑制频率响应;和
根据所述噪声抑制频率响应成形输入信号的当前块。
2.如权利要求1所述的方法,进一步包括下面步骤:
在所述处理步骤之前预滤波所述输入信号以加强其中的高频成分。
3.如权利要求2所述的方法,其中所述处理步骤包括下列步骤:
将离散付里叶变换应用到信号块中以提供每块的频域复值表示;
将信号块的频域表示转换成只有幅度的信号;
在穿过几个分离的频带上对只有幅度的信号求平均以提供所述长时间感知带谱估计值;和
平滑感知带谱中的时间变化以提供所述短时间感知带谱估计值。
4.如权利要求3所述的方法,其中所述噪声抑制频率响应是在所述成形步骤中利用全极点滤波器进行模拟的。
5.如权利要求1所述的方法,其中所述噪声抑制频率响应是在所述成形步骤中利用全极点滤波器进行模拟的。
6.如权利要求1所述的方法,其中所述处理步骤包括下列步骤:
将离散付里叶变换应用到信号块中以提供每块的频域复值表示;
将信号块的频域表示转换成只有幅度的信号;
在穿过几个分离的频带上对只有幅度的信号求平均以提供所述长时间感知带谱估计值;和
平滑感知带谱中的时间变化以提供所述短时间感知带谱估计值。
7.一种用来抑制在携带噪声和语音的组合的输入信号中的噪声的设备,包栝:
信号预处理器,用来将所述输入信号划分成若干块;
快速付里叶变换处理器,用来处理所述的块以提供所述输入信号的频域复值谱;
累加器,用来将所述频域复值谱累加成由不等宽频带组成的长时间感知带谱;
滤波器,用来滤波长时间感知带谱以生成由所述长时间感知带谱的当前片段加噪声组成的短时间感知带谱的估计值;
语音/暂停检测器,用来判断所述输入信号只是当前噪声,还是语音和噪声的组合;
噪声谱估值器,用来当输入信号只是噪声时,响应所述语音/暂停检测电路,根据输入信号的短时间感性带谱修正噪声的长时间感知带谱的估计值;
频谱增益处理器,用来响应所述噪声谱估值器确定噪声抑制频率响应;和
频谱成形处理器,用来响应所述频谱增益处理器成形输入信号的当前块来抑制其中的噪声。
8.如权利要求7所述的设备,其中所述频谱成形处理器包括全极点滤波器。
9.如权利要求8所述的设备,其中所述信号预处理器预滤波所述输入信号以加强其中的高频成分。
10.如权利要求7所述的设备,其中所述信号预处理器预滤波所述输入信号以加强其中的高频成分。
11.一种用来抑制在携带噪声和音频信息的组合的输入信号中的噪声的方法,包括下列步骤:
在频域中对所述输入信号计算噪声抑制频率响应;和
将所述噪声抑制频率响应应用到时域中的所述输入信号中以抑制输入信号中的噪声。
12.如权利要求1所述的方法,进一步包括在计算所述输入信号的噪声抑制频率响应之前将所述输入信号划分成若干块的步骤。
13.如权利要求12所述的方法,其中所述噪声抑制频率响应是通过由确定噪声抑制频率响应的自相关函数所产生的全极点滤波器应用到所述输入信号中的。
14.如权利要求11所述的方法,其中所述噪声抑制频率响应是通过由确定噪声抑制频率响应的自相关函数所产生的全极点滤波器应用到所述输入信号中的。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/159,358 | 1998-09-23 | ||
US09/159,358 US6122610A (en) | 1998-09-23 | 1998-09-23 | Noise suppression for low bitrate speech coder |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1286788A true CN1286788A (zh) | 2001-03-07 |
Family
ID=22572262
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN99813506A Pending CN1326584A (zh) | 1998-09-23 | 1999-09-15 | 低比特率语音编码器的噪声抑制 |
CN99801661A Pending CN1286788A (zh) | 1998-09-23 | 1999-09-22 | 关于低比特率语音编码器的噪声抑制 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN99813506A Pending CN1326584A (zh) | 1998-09-23 | 1999-09-15 | 低比特率语音编码器的噪声抑制 |
Country Status (10)
Country | Link |
---|---|
US (1) | US6122610A (zh) |
EP (1) | EP1116224A4 (zh) |
JP (1) | JP2003517624A (zh) |
KR (2) | KR20010075343A (zh) |
CN (2) | CN1326584A (zh) |
AU (2) | AU6037899A (zh) |
BR (1) | BR9913011A (zh) |
CA (2) | CA2344695A1 (zh) |
IL (1) | IL136090A0 (zh) |
WO (2) | WO2000017859A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101223574B (zh) * | 2005-12-08 | 2011-06-29 | 韩国电子通信研究院 | 使用话带信号的语音识别装置和方法 |
CN106068535A (zh) * | 2014-03-17 | 2016-11-02 | 皇家飞利浦有限公司 | 噪声抑制 |
CN115173971A (zh) * | 2022-07-08 | 2022-10-11 | 电信科学技术第五研究所有限公司 | 一种基于频谱数据的宽带信号实时检测方法 |
Families Citing this family (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US6351731B1 (en) | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6453285B1 (en) * | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
KR100281181B1 (ko) * | 1998-10-16 | 2001-02-01 | 윤종용 | 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법 |
US7177805B1 (en) * | 1999-02-01 | 2007-02-13 | Texas Instruments Incorporated | Simplified noise suppression circuit |
US6397177B1 (en) * | 1999-03-10 | 2002-05-28 | Samsung Electronics, Co., Ltd. | Speech-encoding rate decision apparatus and method in a variable rate |
US6507623B1 (en) * | 1999-04-12 | 2003-01-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by time-domain spectral subtraction |
US6351729B1 (en) * | 1999-07-12 | 2002-02-26 | Lucent Technologies Inc. | Multiple-window method for obtaining improved spectrograms of signals |
US6980950B1 (en) * | 1999-10-22 | 2005-12-27 | Texas Instruments Incorporated | Automatic utterance detector with high noise immunity |
JP3878482B2 (ja) * | 1999-11-24 | 2007-02-07 | 富士通株式会社 | 音声検出装置および音声検出方法 |
US6473733B1 (en) * | 1999-12-01 | 2002-10-29 | Research In Motion Limited | Signal enhancement for voice coding |
JP2001166782A (ja) * | 1999-12-07 | 2001-06-22 | Nec Corp | 報知信号発生方法及び装置 |
US6317456B1 (en) * | 2000-01-10 | 2001-11-13 | The Lucent Technologies Inc. | Methods of estimating signal-to-noise ratios |
US9609278B2 (en) | 2000-04-07 | 2017-03-28 | Koplar Interactive Systems International, Llc | Method and system for auxiliary data detection and delivery |
DE10017646A1 (de) * | 2000-04-08 | 2001-10-11 | Alcatel Sa | Geräuschunterdrückung im Zeitbereich |
US6463408B1 (en) * | 2000-11-22 | 2002-10-08 | Ericsson, Inc. | Systems and methods for improving power spectral estimation of speech signals |
US7617099B2 (en) * | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
EP1244094A1 (de) * | 2001-03-20 | 2002-09-25 | Swissqual AG | Verfahren und Vorrichtung zur Bestimmung eines Qualitätsmasses eines Audiosignals |
KR20020082643A (ko) * | 2001-04-25 | 2002-10-31 | 주식회사 호서텔넷 | 고속 푸우리에 변환(fft) 및 역고속 푸우리에변환(ifft)을 이용한 송,수신기의 동기검출장치 |
WO2003001173A1 (en) * | 2001-06-22 | 2003-01-03 | Rti Tech Pte Ltd | A noise-stripping device |
US6952482B2 (en) * | 2001-10-02 | 2005-10-04 | Siemens Corporation Research, Inc. | Method and apparatus for noise filtering |
KR100434723B1 (ko) * | 2001-12-24 | 2004-06-07 | 주식회사 케이티 | 음성 신호특성을 이용한 돌발잡음 제거장치 및 그 방법 |
US8718687B2 (en) * | 2002-03-26 | 2014-05-06 | Zoove Corp. | System and method for mediating service invocation from a communication device |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US8326621B2 (en) * | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7593851B2 (en) * | 2003-03-21 | 2009-09-22 | Intel Corporation | Precision piecewise polynomial approximation for Ephraim-Malah filter |
US7330511B2 (en) | 2003-08-18 | 2008-02-12 | Koplar Interactive Systems International, L.L.C. | Method and system for embedding device positional data in video signals |
US7224810B2 (en) * | 2003-09-12 | 2007-05-29 | Spatializer Audio Laboratories, Inc. | Noise reduction system |
US9055239B2 (en) | 2003-10-08 | 2015-06-09 | Verance Corporation | Signal continuity assessment using embedded watermarks |
US7454332B2 (en) * | 2004-06-15 | 2008-11-18 | Microsoft Corporation | Gain constrained noise suppression |
KR100657912B1 (ko) | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
US20070116300A1 (en) * | 2004-12-22 | 2007-05-24 | Broadcom Corporation | Channel decoding for wireless telephones with multiple microphones and multiple description transmission |
US20060147063A1 (en) * | 2004-12-22 | 2006-07-06 | Broadcom Corporation | Echo cancellation in telephones with multiple microphones |
US7983720B2 (en) * | 2004-12-22 | 2011-07-19 | Broadcom Corporation | Wireless telephone with adaptive microphone array |
US8509703B2 (en) * | 2004-12-22 | 2013-08-13 | Broadcom Corporation | Wireless telephone with multiple microphones and multiple description transmission |
US20060133621A1 (en) * | 2004-12-22 | 2006-06-22 | Broadcom Corporation | Wireless telephone having multiple microphones |
KR100784456B1 (ko) * | 2005-12-08 | 2007-12-11 | 한국전자통신연구원 | Gmm을 이용한 음질향상 시스템 |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US8194880B2 (en) | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8744844B2 (en) * | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8934641B2 (en) | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
US8428661B2 (en) * | 2007-10-30 | 2013-04-23 | Broadcom Corporation | Speech intelligibility in telephones with multiple microphones |
US20090111584A1 (en) | 2007-10-31 | 2009-04-30 | Koplar Interactive Systems International, L.L.C. | Method and system for encoded information processing |
US8296136B2 (en) * | 2007-11-15 | 2012-10-23 | Qnx Software Systems Limited | Dynamic controller for improving speech intelligibility |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
CN101770776B (zh) | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理*** |
US8582781B2 (en) | 2009-01-20 | 2013-11-12 | Koplar Interactive Systems International, L.L.C. | Echo modulation methods and systems |
US8715083B2 (en) | 2009-06-18 | 2014-05-06 | Koplar Interactive Systems International, L.L.C. | Methods and systems for processing gaming data |
USRE48462E1 (en) * | 2009-07-29 | 2021-03-09 | Northwestern University | Systems, methods, and apparatus for equalization preference learning |
CN102044241B (zh) | 2009-10-15 | 2012-04-04 | 华为技术有限公司 | 一种实现通信***中背景噪声的跟踪的方法和装置 |
US20110125497A1 (en) * | 2009-11-20 | 2011-05-26 | Takahiro Unno | Method and System for Voice Activity Detection |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US8745403B2 (en) | 2011-11-23 | 2014-06-03 | Verance Corporation | Enhanced content management based on watermark extraction records |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8726304B2 (en) | 2012-09-13 | 2014-05-13 | Verance Corporation | Time varying evaluation of multimedia content |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
JP6059003B2 (ja) * | 2012-12-26 | 2017-01-11 | パナソニック株式会社 | 歪み補償装置及び歪み補償方法 |
WO2014153199A1 (en) | 2013-03-14 | 2014-09-25 | Verance Corporation | Transactional video marking system |
US9485089B2 (en) | 2013-06-20 | 2016-11-01 | Verance Corporation | Stego key management |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
WO2015138798A1 (en) | 2014-03-13 | 2015-09-17 | Verance Corporation | Interactive content acquisition using embedded codes |
US10504200B2 (en) | 2014-03-13 | 2019-12-10 | Verance Corporation | Metadata acquisition using embedded watermarks |
US9639911B2 (en) | 2014-08-20 | 2017-05-02 | Verance Corporation | Watermark detection using a multiplicity of predicted patterns |
US9799330B2 (en) | 2014-08-28 | 2017-10-24 | Knowles Electronics, Llc | Multi-sourced noise suppression |
US9769543B2 (en) | 2014-11-25 | 2017-09-19 | Verance Corporation | Enhanced metadata and content delivery using watermarks |
US9942602B2 (en) | 2014-11-25 | 2018-04-10 | Verance Corporation | Watermark detection and metadata delivery associated with a primary content |
US9602891B2 (en) | 2014-12-18 | 2017-03-21 | Verance Corporation | Service signaling recovery for multimedia content using embedded watermarks |
WO2016176056A1 (en) | 2015-04-30 | 2016-11-03 | Verance Corporation | Watermark based content recognition improvements |
US10477285B2 (en) | 2015-07-20 | 2019-11-12 | Verance Corporation | Watermark-based data recovery for content with multiple alternative components |
US20190132652A1 (en) | 2016-04-18 | 2019-05-02 | Verance Corporation | System and method for signaling security and database population |
US11297398B2 (en) | 2017-06-21 | 2022-04-05 | Verance Corporation | Watermark-based metadata acquisition and processing |
US11468149B2 (en) | 2018-04-17 | 2022-10-11 | Verance Corporation | Device authentication in collaborative content screening |
CN112562701B (zh) * | 2020-11-16 | 2023-03-28 | 华南理工大学 | 心音信号双通道自适应降噪算法、装置、介质及设备 |
US11722741B2 (en) | 2021-02-08 | 2023-08-08 | Verance Corporation | System and method for tracking content timeline in the presence of playback rate changes |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4628529A (en) * | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US4658426A (en) * | 1985-10-10 | 1987-04-14 | Harold Antin | Adaptive noise suppressor |
US4811404A (en) * | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5450522A (en) * | 1991-08-19 | 1995-09-12 | U S West Advanced Technologies, Inc. | Auditory model for parametrization of speech |
FI92535C (fi) * | 1992-02-14 | 1994-11-25 | Nokia Mobile Phones Ltd | Kohinan vaimennusjärjestelmä puhesignaaleille |
US5432859A (en) * | 1993-02-23 | 1995-07-11 | Novatel Communications Ltd. | Noise-reduction system |
DE69428119T2 (de) * | 1993-07-07 | 2002-03-21 | Picturetel Corp., Peabody | Verringerung des hintergrundrauschens zur sprachverbesserung |
IT1272653B (it) * | 1993-09-20 | 1997-06-26 | Alcatel Italia | Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso |
CA2153170C (en) * | 1993-11-30 | 2000-12-19 | At&T Corp. | Transmitted noise reduction in communications systems |
JP3484757B2 (ja) * | 1994-05-13 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び雑音区間検出方法 |
US5544250A (en) * | 1994-07-18 | 1996-08-06 | Motorola | Noise suppression system and method therefor |
FR2726392B1 (fr) * | 1994-10-28 | 1997-01-10 | Alcatel Mobile Comm France | Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant |
SE505156C2 (sv) * | 1995-01-30 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande för bullerundertryckning genom spektral subtraktion |
US5682463A (en) * | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
-
1998
- 1998-09-23 US US09/159,358 patent/US6122610A/en not_active Expired - Fee Related
-
1999
- 1999-09-15 EP EP99969525A patent/EP1116224A4/en not_active Withdrawn
- 1999-09-15 KR KR1020017003777A patent/KR20010075343A/ko not_active Application Discontinuation
- 1999-09-15 JP JP2000571442A patent/JP2003517624A/ja active Pending
- 1999-09-15 WO PCT/US1999/021033 patent/WO2000017859A1/en not_active Application Discontinuation
- 1999-09-15 CA CA002344695A patent/CA2344695A1/en not_active Abandoned
- 1999-09-15 AU AU60378/99A patent/AU6037899A/en not_active Abandoned
- 1999-09-15 CN CN99813506A patent/CN1326584A/zh active Pending
- 1999-09-22 BR BR9913011-4A patent/BR9913011A/pt not_active IP Right Cessation
- 1999-09-22 AU AU60079/99A patent/AU6007999A/en not_active Abandoned
- 1999-09-22 KR KR1020007005629A patent/KR100330230B1/ko not_active IP Right Cessation
- 1999-09-22 WO PCT/KR1999/000577 patent/WO2000017855A1/en active IP Right Grant
- 1999-09-22 CA CA002310491A patent/CA2310491A1/en not_active Abandoned
- 1999-09-22 IL IL13609099A patent/IL136090A0/xx unknown
- 1999-09-22 CN CN99801661A patent/CN1286788A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101223574B (zh) * | 2005-12-08 | 2011-06-29 | 韩国电子通信研究院 | 使用话带信号的语音识别装置和方法 |
CN106068535A (zh) * | 2014-03-17 | 2016-11-02 | 皇家飞利浦有限公司 | 噪声抑制 |
CN106068535B (zh) * | 2014-03-17 | 2019-11-05 | 皇家飞利浦有限公司 | 噪声抑制 |
CN115173971A (zh) * | 2022-07-08 | 2022-10-11 | 电信科学技术第五研究所有限公司 | 一种基于频谱数据的宽带信号实时检测方法 |
CN115173971B (zh) * | 2022-07-08 | 2023-10-03 | 电信科学技术第五研究所有限公司 | 一种基于频谱数据的宽带信号实时检测方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20010075343A (ko) | 2001-08-09 |
CA2310491A1 (en) | 2000-03-30 |
WO2000017855A1 (en) | 2000-03-30 |
KR20010032390A (ko) | 2001-04-16 |
BR9913011A (pt) | 2001-03-27 |
WO2000017859A1 (en) | 2000-03-30 |
IL136090A0 (en) | 2001-05-20 |
KR100330230B1 (ko) | 2002-05-09 |
AU6037899A (en) | 2000-04-10 |
EP1116224A1 (en) | 2001-07-18 |
WO2000017859A8 (en) | 2000-07-20 |
CA2344695A1 (en) | 2000-03-30 |
JP2003517624A (ja) | 2003-05-27 |
EP1116224A4 (en) | 2003-06-25 |
CN1326584A (zh) | 2001-12-12 |
US6122610A (en) | 2000-09-19 |
AU6007999A (en) | 2000-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1286788A (zh) | 关于低比特率语音编码器的噪声抑制 | |
KR100828962B1 (ko) | 음성 활동에 기초한 이득 제한을 이용하는 음성 개선 방법 | |
CN101976566B (zh) | 语音增强方法及应用该方法的装置 | |
JP4440937B2 (ja) | 暗騒音存在時の音声を改善するための方法および装置 | |
Soon et al. | Speech enhancement using 2-D Fourier transform | |
JP4568733B2 (ja) | 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体 | |
Martin et al. | New speech enhancement techniques for low bit rate speech coding | |
EP0683916A1 (en) | Noise reduction | |
EP1386313B1 (en) | Speech enhancement device | |
Nongpiur | Impulse noise removal in speech using wavelets | |
Amehraye et al. | Perceptual improvement of Wiener filtering | |
JP3279254B2 (ja) | スペクトル雑音除去装置 | |
Taddei et al. | Noise reduction on speech codec parameters | |
Upadhyay et al. | Single channel speech enhancement utilizing iterative processing of multi-band spectral subtraction algorithm | |
Hu et al. | Single acoustic-channel speech enhancement based on glottal correlation using non-acoustic sensor. | |
Verteletskaya et al. | Enhanced spectral subtraction method for noise reduction with minimal speech distortion | |
Abd Almisreb et al. | Noise reduction approach for Arabic phonemes articulated by Malay speakers | |
Wei et al. | A new algorithm for voice activity detection | |
Singh et al. | Sigmoid based Adaptive Noise Estimation Method for Speech Intelligibility Improvement | |
Ito et al. | Forward masking on a generalized logarithmic scale for robust speech recognition | |
Zheng et al. | Speech enhancement based on estimating expected values of speech cepstra | |
Lai et al. | Speech recognition enhancement by psychoacoustic modeled noise suppression | |
Shahnaz et al. | Pitch Estimation from Noisy Speech based on Residual-Temporal Information | |
JP2002258893A (ja) | 雑音推定装置、雑音除去装置及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |