CN105144290A - 信号处理装置、信号处理方法和信号处理程序 - Google Patents
信号处理装置、信号处理方法和信号处理程序 Download PDFInfo
- Publication number
- CN105144290A CN105144290A CN201480020786.1A CN201480020786A CN105144290A CN 105144290 A CN105144290 A CN 105144290A CN 201480020786 A CN201480020786 A CN 201480020786A CN 105144290 A CN105144290 A CN 105144290A
- Authority
- CN
- China
- Prior art keywords
- component signal
- amplitude
- signal
- amplitude component
- replacement unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 98
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000001228 spectrum Methods 0.000 claims abstract description 68
- 238000006243 chemical reaction Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 53
- 238000000034 method Methods 0.000 claims description 45
- 230000002708 enhancing effect Effects 0.000 claims description 24
- 229910002059 quaternary alloy Inorganic materials 0.000 claims description 2
- 230000009131 signaling function Effects 0.000 claims 1
- 230000009466 transformation Effects 0.000 abstract description 4
- 238000006467 substitution reaction Methods 0.000 abstract 1
- 230000003595 spectral effect Effects 0.000 description 65
- 238000010586 diagram Methods 0.000 description 47
- 230000000295 complement effect Effects 0.000 description 41
- 230000008859 change Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 9
- 230000008676 import Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000011105 stabilization Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000006641 stabilisation Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 101150068393 argx gene Proteins 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000005728 strengthening Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
用于将输入声音更改成容易听见的声音的该信号处理设备被提供有:变换装置,其将输入信号变换成频域中的振幅分量信号;稳定分量估计装置,其基于频域中的振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;替换装置,其使用由变换装置确定的振幅分量信号和稳定分量信号来生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号;以及逆变换装置,其将新振幅分量信号逆变换成增强的信号。
Description
技术领域
本发明涉及一种抑制具有非稳定分量的噪声的技术。
背景技术
在以上技术领域中,专利文献1公开一种通过将输入声信号分离成低、中和高频带来减少风噪声的技术。在专利文献1中,从中频带分量生成低频带中的恢复信号,通过对恢复信号和原有低频带信号的加权和来生成用于低频带的校正的声信号,并且通过减少中频带分量的信号电平来生成用于中频带的校正的声信号。最后,组合原有高频带信号以及用于低和中频带的校正的声信号中的每个校正的声信号以生成增强的信号。
专利文献2公开一种将输入声音分离成低和高频带并且根据风噪声的概率抑制低频带有噪语音信号中所包括的风噪声的技术。
引用列表
专利文献
专利文献1:日本专利特开号2009-55583
专利文献2:日本专利特开号2012-239017
专利文献3:国际公开号2012/070668
非专利文献
非专利文献1:M.Kato,A.Sugiyama,和M.Serizawa,"NoisesuppressionwithhighspeechqualitybasedonweightednoiseestimationandMMSESTSA,"IEICETrans.Fundamentals(日本版),vol.J87-A,no.7,pp.851-860,2004年7月
非专利文献2:R.Martin,"Spectralsubtractionbasedonminimumstatistics,"EUSPICO-94,pp.1182-1185,1994年9月
非专利文献3::IEEETRANSACTIONSONACOUSTICS,SPEECH,ANDSIGNALPROCESSING,VOL.32,NO.6,PP.1109-1121,1984年12月
非专利文献4:3GPPTechnicalSpecification26.094,vol.5.0.0,2002年6月
非专利文献5:3GPPTechnicalSpecification26.194,vol.5.0.0,2001年3月
非专利文献6:A.Davis,S.Nordholm,R.Togneri,"StatisticalVoiceActivityDetectionUsingLow-VarianceSpectrumEstimationandanAdaptiveThreshold,"IEEETRANSACTIONSONAUDIO,SPEECH,ANDLANGUAGEPROCESSING,vol.14,no.2,pp.412-424,2006年3月
非专利文献7:K.Li,M.N.S.Swamy,M.O.Ahmad,"AnImprovedVoiceActivityDetectionUsingHigherOrderStatistics,"IEEETRANSACTIONSONSPEECHANDAUDIOPROCESSING,vol.13,no.5,pp.965-974,2005年9月。
发明内容
技术问题
然而,在专利文献1和2中描述的技术中的任一种技术简单地通过减少低频带中的语音信号的信号电平来抑制风噪声,而不是作为抑制非稳定噪声、如风噪声的方法的一种有效方法。因而,不可能将输入声音改变成易于听见的声音。
本发明使得能够提供一种解决以上描述的问题的技术。
对问题的解决方案
本发明的一个方面提供一种信号处理装置,该信号处理装置包括:
变换器,将输入信号变换成频域中的振幅分量信号;
稳定分量估计器,其基于频域中的振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
替换单元,其使用由变换器获得的振幅分量信号和稳定分量信号来生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号;以及
逆变换器,其将新振幅分量信号逆变换成增强的信号。
本发明的另一方面提供一种信号处理方法,该信号处理方法包括:
将输入信号变换成频域中的振幅分量信号;
基于频域中的振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
使用在变换中获得的振幅分量信号和稳定分量信号来生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号;以及
将新振幅分量信号逆变换成增强的信号。
本发明的更多其它方面提供一种用于使计算机执行方法的信号处理程序,该方法包括:
将输入信号变换成频域中的振幅分量信号;
基于频域中的振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
使用在变换中获得的振幅分量信号和稳定分量信号来生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号;以及
将新振幅分量信号逆变换成增强的信号。
发明的有益效果
根据本发明,有可能将输入声音改变成易于听见的声音。
附图说明
图1是示出根据本发明的第一实施例的信号处理装置的布置的框图;
图2A是示出根据本发明的第二实施例的信号处理装置的布置的框图;
图2B是示出根据本发明的第二实施例的变换器的布置的框图;
图2C是示出根据本发明的第二实施例的逆变换器的布置的框图;
图3是示出根据本发明的第二实施例的信号处理装置的信号处理结果的视图;
图4是示出根据本发明的第二实施例的信号处理装置的信号处理结果的视图;
图5是示出根据本发明的第二实施例的信号处理装置的信号处理结果的定时图;
图6是示出根据本发明的第三实施例的替换单元的布置的框图;
图7是示出根据本发明的第三实施例的信号处理装置的信号处理结果的视图;
图8是示出根据本发明的第三实施例的信号处理装置的信号处理结果的视图;
图9是示出根据本发明的第四实施例的替换单元的布置的框图;
图10是示出根据本发明的第四实施例的替换单元的信号处理结果的图形;
图11是示出根据本发明的第四实施例的替换单元的信号处理结果的视图;
图12是示出根据本发明的第五实施例的替换单元的布置的框图;
图13是示出根据本发明的第五实施例的替换单元的信号处理结果的视图;
图14是示出根据本发明的第六实施例的替换单元的布置的框图;
图15是示出根据本发明的第六实施例的替换单元的信号处理结果的视图;
图16是示出根据本发明的第七实施例的替换单元的布置的框图;
图17是示出根据本发明的第八实施例的信号处理装置的布置的框图;
图18是示出根据本发明的第九实施例的信号处理装置的布置的框图;
图19是示出根据本发明的第九实施例的语音检测器的布置的示例的框图;
图20是示出根据本发明的第九实施例的语音检测器的布置的另一示例的框图;
图21是示出根据本发明的第九实施例的信号处理装置的信号处理结果的视图;
图22是示出根据本发明的第十实施例的替换单元的布置的框图;
图23是示出根据本发明的第十一实施例的替换单元的布置的框图;
图24是示出根据本发明的第十二实施例的替换单元的布置的框图;
图25是示出根据本发明的第十三实施例的替换单元的布置的框图;
图26是示出根据本发明的第十四实施例的替换单元的布置的框图;
图27是示出根据本发明的第十五实施例的信号处理装置的布置的框图;
图28是示出根据本发明的第十五实施例的噪声抑制器的布置的框图;
图29是示出根据本发明的第十六实施例的替换单元的布置的框图;
图30是示出根据本发明的第十七实施例的信号处理装置的布置的框图;以及
图31是示出在根据本发明的实施例的信号处理装置由软件实施时的布置的框图。
具体实施方式
现在将参照附图具体地描述本发明的优选实施例。应当注意在这些实施例中阐述的部件的相对布置、数值表达式和数值除非具体地另外陈述,否则不限制本发明的范围。注意,在以下说明中的“语音信号”指示根据语音或者另一声音的影响而出现的直接电改变。语音信号传输语音或者另一声音,但不限于语音。
[第一实施例]
将参照图1描述根据本发明的第一实施例的信号处理装置100。如图1中所示,信号处理装置100包括变换器101、稳定分量估计器102、替换单元103和逆变换器104。
变换器101将输入信号110变换成频域中的振幅分量信号130。
稳定分量估计器102基于频域中的振幅分量信号130估计具有具备稳定特性的频率谱的稳定分量信号140。替换单元103使用振幅分量信号130和稳定分量信号140来生成新振幅分量信号150并且用新振幅分量信号150替换振幅分量信号130。逆变换器104将新振幅分量信号150逆变换成增强的信号160。
有了以上布置,有可能通过用稳定、易于听见的噪声替换在输入声音中包括的噪声来抑制令人不愉快的非稳定噪声。
[第二实施例]
<<总体布置>>
将参照附图描述根据本发明的第二实施例的信号处理装置。根据该实施例的信号处理装置例如适当地抑制非稳定噪声、如风噪声。简而言之,在频域中,估计输入声音中的稳定分量,并且用估计的稳定分量替换输入声音的部分或者全部。输入声音不限于语音。例如,环境声音(街道上的噪声、火车/汽车的行驶声音、报警/警告声音、拍手声等)、人的语音或者动物的声音(鸟儿的啁啾、狗的吠叫、猫的喵叫、笑声、泪声、欢呼等)、音乐等可以用作输入声音。注意,以语音作为在该实施例中的输入声音的代表示例。
图2A是示出信号处理装置200的总体布置的框图。向输入端子206提供有噪信号(包括希望的信号和噪声二者的信号)为一系列采样值。向输入端子206提供的有噪信号在变换器201中经历变换、诸如傅里叶变换并且被划分成多个频率分量。在频率基础上独立地处理多个频率分量。这里将通过关注特定频率分量来继续描述。从频率分量之中,向稳定分量估计器202和替换单元203提供振幅谱(振幅分量)|X(k,n)|,并且向逆变换器204提供相位谱(相位分量)220。注意,变换器201这里向稳定分量估计器202和替换单元203提供有噪信号振幅谱|X(k,n)|。然而,本发明不限于此,而可以提供与振幅谱的平方对应的功率谱。
稳定分量估计器202估计在从变换器201提供的有噪信号振幅谱|X(k,n)|中包括的稳定分量并且生成稳定分量信号(稳定分量谱)N(k,n)。
替换单元203使用生成的稳定分量谱N(k,n)来替换从变换器201供应的有噪信号振幅谱|X(k,n)|并且向逆变换器204传输增强的信号振幅谱|Y(k,n)|作为替换结果。
逆变换器204通过合成从变换器201供应的有噪信号相位谱220来将从替换单元203供应的增强的信号相位谱|Y(k,n)|逆变换成结果信号并且向输出端子207供应结果信号作为增强的信号。
<<变换器的布置>>
图2B是示出变换器201的布置的框图。如图2B中所示,变换器201包括帧划分器211、加窗单元212和傅里叶变换器213。有噪信号采样被供应到帧划分器211并且在K/2采样的基础上被划分成帧,其中K是偶数。划分成帧的有噪信号采样被供应到加窗单元212并且乘以窗函数w(t)。通过按照w(t)对第n个帧输入信号x(t,n)(t=0,1,...,K/2-1)进行加窗而获得的信号由下式给定:
两个相继帧可以部分地叠加(重叠)和加窗。假设重叠长度是帧长度的50%。对于t=0,1,...,K-1,加窗单元212输出下式的左边:
对称窗函数用于实信号。窗函数被设计为除了在变换器201的输出被直接地供应到逆变换器204时的计算误差之外使输入信号和输出信号相互匹配。这意味着w2(t)+w2(t+K/2)=1。
以下假设其中对于重叠20%的两个相继帧执行加窗的示例来继续描述。作为w(t),加窗单元例如可以使用由下式给定的汉宁窗:
各种窗函数、诸如汉明窗和三角窗也是已知的。加窗的输出被供应到傅里叶变换器213并且变换成有噪信号谱X(k,n)。有噪信号谱X(k,n)被分离成相位和振幅。有噪信号相位谱argX(k,n)被供应到逆变换器204,而有噪信号振幅谱|X(k,n)|被供应到稳定分量估计器202和替换单元903。如已经描述的那样,可以使用功率谱取代振幅谱。
<<逆变换器的布置>>
图2C是示出逆变换器204的布置的框图。如图2C中所示,逆变换器204包括逆傅里叶变换器241、加窗单元242和帧合成单元243。逆傅里叶变换器241使用从替换单元203供应的增强的信号振幅谱|Y(k,n)|(在图2C中由Y代表)和从变换器201供应的有噪信号相位谱220(argX(k,n))来获得增强的信号谱Y(k,n)如下。
Y(k,n)=|Y(k,n)|·exp(jargX(k,n))(4)
其中j代表虚数单位。
对于获得的增强的信号谱执行逆傅里叶变换。向加窗单元242供应信号为一系列时域采样值y(t,n)(t=0,1,…,K-1),其中一个帧包括K个采样,并且将信号乘以窗函数w(t)。通过按照w(t)对第n个帧增强信号y(t,n)(t=0,1,…,K-1)进行加窗而获得的信号由下式的左边给定:
帧合成单元243基于K/2个采样从加窗单元242提取两个相邻帧的输出、叠加它们并且通过下式对于t=0,1,…,K/2-1获得输出信号(等式(6)的左边):
从帧合成单元243向输出端子207传输获得的输出信号260。
注意已经描述在图2B和2C中的变换器201和逆变换器204中的变换为傅里叶变换。然而,可以使用任何其它变换、诸如哈达马(Hadamard)变换、哈尔(Haar)变换或者小波变换取代傅里叶变换。哈尔变换无需相乘并且可以减少LSI芯片的面积。小波变换可以根据频率改变时间分辨率,并因此有望提高噪声抑制效果。
稳定分量估计器202可以在由变换器201获得的多个频率分量被积分之后估计稳定分量。在积分之后的频率分量的数目小于在积分之前的频率分量的数目。更具体地,获得与通过积分频率分量而获得的积分频率分量公共的稳定分量谱并且共同地用于属于相同积分频率分量的个别频率分量。如以上描述的那样,在积分多个频率分量之后估计稳定分量信号时,待应用的频率分量的数目变小、由此减少总计算量。
(稳定分量谱的定义)
稳定分量谱指示在输入信号振幅谱中包括的稳定分量。稳定分量的功率的时间变化小于输入信号的功率的时间变化。一般地通过差值或者比值计算时间变化。如果通过差值计算时间变化,则在给定的帧n中相互比较输入信号振幅谱和稳定分量谱时,存在满足下式的至少一个频率k:
(|N(k,n-1)|-|N(k,n)|)2<(|X(k,n-1)|-|X(k,n)|)2(7)
备选地,如果通过比值计算时间变化,则存在满足下式的至少一个频率k:
也就是说,如果以上表达式的左边对于所有帧n和频率k总是高于右边,则可以定义N(k,n)不是稳定分量谱。即使函数是X和N的指数、对数和幂,仍然可以给定相同定义。
(推导稳定分量谱的方法)
各种估计方法、诸如在非专利文献1和2中描述的方法可以用来估计稳定分量谱。
例如,非专利文献1公开一种获得其中未包括目标声音的帧的有噪信号振幅谱的平均值作为估计的噪声谱的方法。在该方法中,有必要检测目标声音。可以通过增强的信号的功率确定其中包括目标声音的区间。
作为理想操作状态,增强的信号是除了噪声之外的目标声音。此外,目标声音或者噪声的电平在相邻帧之间不显著改变。出于这些原因,紧接的在前帧的增强的信号电平用作确定噪声区间的指标。如果紧接的在前帧的增强的信号电平等于或者小于预定值,则确定当前帧为噪声区间。可以通过对被确定为噪声区间的帧的有噪信号振幅谱求平均来估计噪声谱。
非专利文献1还公开一种获得有噪信号振幅谱在它们的供应已经开始的早期阶段中的平均值作为估计的噪声谱的方法。在该情况下,有必要满足未紧接地在开始估计之后包括目标声音这样的条件。如果满足该条件,则可以获得在早期估计阶段中的有噪信号振幅谱作为估计的噪声谱。
非专利文献2公开一种从有噪信号振幅谱的最小值(最小统计量)获得估计的噪声谱的方法。在该方法中,保持有噪信号振幅谱在预定时间内的最小值,并且从最小值估计噪声谱。有噪信号振幅谱的最小值与噪声谱的形状相似、因此可以用作噪声谱形状的估计值。然而,最小值小于原有噪声电平。因此,通过适当地放大最小值而获得的谱用作估计的噪声谱。
此外,可以使用中值滤波器来获得估计的噪声谱。通过WiNE(加权噪声估计)获得估计的噪声谱作为通过使用噪声缓慢地改变的特性来跟随改变的噪声的噪声估计方法。
这样获得的估计的噪声谱可以用作稳定分量谱。
(谱形状)
图3是示出在给定时间n在有噪信号振幅谱(下文也被称为输入信号)|X(k,n)|、稳定分量谱(稳定分量信号)N(k,n)和增强的信号振幅谱(下文被称为处理结果)|Y(k,n)|之间的关系的视图。在图3中,这些谱分别由X、N和Y表示。在该实施例中,在所有频率,输入信号|X(k,n)|由通过将稳定分量信号N(k,n)乘以预定系数α(k,n)而获得的α(k,n)N(k,n)替换。图3示出其中设置α(k,n)=0.8的示例。
获得用于替换的振幅谱(替换振幅谱)的函数不限于由α(k,n)N(k,n)表示的N(k,n)的线性映射函数。例如,可以采用线性函数、诸如α(k,n)N(k,n)+C(k,n)。在该情况下,如果C(k,n)>0,则可总体上提高替换振幅谱的电平、由此提高在听见时的稳定性。如果C(k,n)<0,则可以总体上减少替换振幅谱的电平,但是有必要调整C(k,n),因此其中谱的值变为负的频带不出现。此外,可以使用在另一形式中表示的稳定分量谱N(k,n)的函数、诸如高阶多项式函数或者非线性函数。
图4是示出有噪信号振幅谱、增强的信号振幅谱和稳定分量振幅谱根据频率随时间的改变的视图。如图4中所示,通过连续地表示输入信号|X(k,n)|和稳定分量信号N(k,n)在多个时间的频谱,有可能理解振幅谱的时间变化。
图5是示出有噪信号振幅谱、待输出的增强的信号振幅谱和稳定分量谱在给定的频率下的时间变化的定时图。如图5中所示,有可能通过用稳定分量信号N(k,n)的系数α(k,n)倍替换输入信号|X(k,n)|来使振幅谱的时间变化稳定。也就是说,在该实施例中,有可能通过用至少在时间方向上稳定地改变的频率谱替换输入信号振幅谱|X(k,n)|来防止振幅分量在频域中的“尖峰”。这可以通过仅在时域中平滑强的非稳定分量来抑制具有该分量的噪声、诸如风噪声。有可能通过在频域中使噪声分量稳定而不是减少噪声分量来将噪声改变成易于听见的声音。
由于风噪声的非稳定性高,所以如果尝试估计风噪声,则准确性降低,并且常规噪声估计方法不能应对风噪声。然而,在稳定分量信号例如通过在频率方向上执行平均来生成并且用来执行替换时,有可能将风噪声改变成不令人不愉快的声音,同时保证跟踪能力。
(系数α)
确定经验上适当的值为稳定分量信号N(k,n)与之相乘的系数α(k,n)。例如,如果α(k,n)=1,则获得|Y(k,n)|=N(k,n),因此稳定分量信号N(k,n)直接地用作针对逆变换器104的输出信号。这时,如果稳定分量信号N(k,n)为大,则大噪声不利地保留。为了解决该问题,可以确定系数α(k,n),从而将向逆变换器104输出的振幅分量的最大值等于或者小于预定值。例如,如果α(k,n)=0.5,则通过稳定分量信号N(k,n)的功率一半的信号来执行替换。如果α(k,n)=0.1,则声音变小并且具有与稳定分量信号N(k,n)的谱形状相同的谱形状。
例如,如果SNR(信号噪声比)低,则目标声音小,因此可以通过减少α(k,n)来执行强抑制。恰好相反,在SNR高时,噪声小,因此可以通过将α(k,n)设置成1而不执行替换。
此外,通过考虑声音在增强高频带时令人不愉快,可以使用在k等于或者大于阈值时使α(k,n)充分地小的函数或者随着k增加而变得更小的k的单调递减函数。
根据该实施例,由于有可能使输出信号的噪声分量稳定,所以声音质量与常规技术比较有提高。注意,替换单元903可以在子频带基础而不是频率基础上替换振幅分量。
[第三实施例]
将参照图6至图8描述根据本发明的第三实施例的信号处理装置。图6是用于解释根据该实施例的信号处理装置的替换单元603的布置的框图。根据该实施例的替换单元603与第二实施例不同在于包括比较器631和上侧振幅替换单元632。其余部件和操作与在第二实施例中相同。因此,相同标号将表示相同部件和操作,并且将省略其具体描述。
比较器631比较有噪信号振幅谱|X(k,n)|与通过按照作为第一函数的线性映射函数计算稳定分量谱N(k,n)而获得的第一阈值。在该实施例中,将说明其中利用在线性映射函数之中的有代表性的恒定倍数、也就是α1(k,n)倍执行比较的情况。如果振幅(功率)分量|X(k,n)|大于稳定分量信号N(k,n)的α1(k,n)倍,则上侧振幅替换单元632通过替换振幅谱、即稳定分量信号N(k,n)的、用作第二函数的α2(k,n)倍执行替换;否则,谱形状直接地用作替换单元603的输出信号|Y(k,n)|。也就是说,如果|X(k,n)|>α1(k,n)N(k,n),则获得|Y(k,n)|=α2(k,n)N(k,n);否则,获得|Y(k,n)|=|X(k,n)|。
计算将用于与有噪信号振幅谱|X(k,n)|比较的谱的方法不限于使用稳定分量谱N(k,n)的线性映射函数的方法。例如,可以采用线性函数、如α1(k,n)N(k,n)+C(k,n)。在该情况下,如果C(k,n)<0,则通过稳定分量信号执行替换的频带增加,因此有可能大量地抑制令人不愉快的非稳定噪声。此外,可以使用以另一形式表示的稳定分量谱N(k,n)的函数、诸如高阶多项式函数或者非线性函数。
图7是示出在α1(k,n)=α2(k,n)=1.0时在输入信号|X(k,n)|、稳定分量信号N(k,n)和输出信号|Y(k,n)|之间的关系的视图。
这在输入信号的变化在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更大的频率带中为大时有效。在另一方面,由于有可能在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更小的频带中保持自然性,所以声音质量提高。
图8是示出在α1(k,n)>α2(k,n)应当成立时在输入信号|X(k,n)|、稳定分量信号N(k,n)和输出信号|Y(k,n)|之间的关系的视图。至于图8中所示的输入信号|X(k,n)|,如果α1(k,n)=α2(k,n),则如在图形中的上部分中所示未充分地使谱稳定,因此不可能充分地抑制具有强的非稳定分量的噪声、如风噪声。
为了应对这一点,有可能如图8的下部分中所示,通过在时间t3之前和之后设置α1(k,n)>α2(k,n)来用具有更高稳定性的谱替换该谱。
每次可以根据以下过程(1)→(2)获得α2(k,n)。
(1)例如,通过|X_bar(k,n)|=(|X(k,n-2)|+|X(k,n-1)|+|X(k,n)|+|X(k,n+1)|+|X(k,n+2)|)/5预先计算输入信号的短时间移动平均X_bar(k,n)(k和n分别是与频率和时间对应的索引)。(2)计算在短时间移动平均(|X_bar(k,n)|)与在替换之后的值(α2(k,n)·N(k,n))之间的差值,并且如果差值为大,则改变α2(k,n)的值以减少差值。如果改变的值由α2_hat(k,n)代表,则以下方法可以用作改变方法。(a)一致地设置α2_hat(k,n)=0.5·α2_(k,n)(通过预定值执行恒定值相乘)。(b)设置α2_hat(k,n)=|(X_bar(k,n)|/|N(k,n)|(使用|X_bar(k,n)|和|N(k,n)|来执行计算)。(c)设置α2_hat(k,n)=0.8·|X_bar(k,n)|/|N(k,n)|+0.2(同上)。
然而,获得α2(k,n)的方法不限于以上描述的方法。例如,可以预先设置无论时间如何都是恒定值的α2(k,n)。在该情况下,可以通过实际地听处理的信号来确定α2(k,n)的值。也就是说,可以根据麦克风的特性和麦克风被附着到的设备的特性确定α2(k,n)的值。
例如,在满足以下条件时,可以通过使用等式1至3在时间n之前和之后将短时间移动平均|X_bar(k,n)|除以稳定分量信号|N(k,n)|来获得系数α2(k,n),并且输入信号|X(k,n)|可以由短时间移动平均|X_bar(k,n)|替换作为结果。在不满足以下条件时,可以设置α2(k,n)=α1(k,n)。
条件:|X(k,n)|>α1(k,n)·N(k,n)并且α1(k,n)·N(k,n)-|X_bar(k,n)|>δ
等式1:α2(k,n-1)=|X_bar(k,n)|/N(k,n)
等式2:α2(k,n)=|X_bar(k,n)|/N(k,n)
等式3:α2(k,n+1)=|X_bar(k,n)|/N(k,n)
如以上描述的那样,在稳定分量信号N(k,n)中,如果不可能防止振幅分量信号在短时间内的“尖峰”,则有可能使用短时间移动平均来执行替换、由此提高声音质量。
[第四实施例]
将参照图9至图11描述根据本发明的第四实施例的信号处理装置。图9是用于说明根据该实施例的信号处理装置的替换单元903的布置的框图。根据该实施例的替换单元903与第二实施例不同在于包括比较器931和下侧振幅替换单元932。其余部件和操作与在第二实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
比较器931比较有噪信号振幅谱|X(k,n)|与稳定分量信号N(k,n)的用作第三函数的β1(k,n)倍(第二阈值)。如果振幅(功率)分量|X(k,n)|小于稳定分量信号N(k,n)的β1(k,n)倍,则下侧振幅替换单元932通过稳定分量信号N(k,n)的用作第四函数的β2(k,n)倍执行替换;否则,谱形状直接地用作替换单元903的输出信号|Y(k,n)|。也就是说,如果|X(k,n)|>β1(k,n)N(k,n),则获得|Y(k,n)|=β2(k,n)N(k,n);否则,获得|Y(k,n)|=|X(k,n)|。
图10是示出在β1(k,n)=β2(k,n)时在输入信号|X(k,n)|、稳定分量N(k,n)和输出信号|Y(k,n)|之间的关系的图形。
这在输入信号的变化在功率比通过将稳定分量信号乘以预定系数倍而获得的阈值β1(k,n)N(k,n)更小的频率带中为大时有效。在另一方面,由于有可能在功率比通过将稳定分量信号乘以预定系数而获得的阈值β1(k,n)N(k,n)更小的频带中保持自然性,所以声音质量提高。
图11是示出在β1(k,n)<β2(k,n)应当成立时在输入信号|X(k,n)|、稳定分量信号N(k,n)和输出信号|Y(k,n)|之间的关系的视图。至于图11中所示的输入信号|X(k,n)|,如果β1(k,n)=β2(k,n),则如在图形中的上部分中所示未充分地使谱稳定,因此不可能充分地抑制具有强的非稳定分量的噪声、如风噪声。
为了应对这一点,有可能如图11的下部分中所示通过在时间n=t5之前和之后设置β1(k,n)<β2(k,n)来用具有更高稳定性的谱替换谱。
每次可以根据以下过程(1)→(2)获得β(k,n)。
(1)例如通过X_bar(k,n)=(X(k,n-2)+X(k,n-1)+X(k,n)+X(k,n+1)+X(k,n+2))/5预先计算输入信号的短时间移动平均X_bar(k,n)(k和n分别是与频率和时间对应的索引)。(2)计算在短时间移动平均(X_bar(k,n))与在替换之后的值(β2(k,n)·N(k,n))之间的差值,并且如果差值为大,则改变β2(k,n)的值以减少差值。如果改变的值由β2_hat(k,n)代表,则以下方法可以用作改变方法。(a)一致地设置β2_hat(k,n)=0.5·β2(k,n)(通过预定值执行恒定值相乘)。(b)设置β2_hat(k,n)=(X_bar(k,n)/N(k,n)(使用X_bar(k,n)和N(k,n)来执行计算)。(c)β2_hat(k,n)=0.8·X_bar(k,n)/N(k,n)+0.2(同上)。
然而,获得β2(k,n)的方法不限于以上描述的方法。例如,可以预先设置无论时间如何都是恒定值的β2(k,n)。在该情况下,可以通过实际地听处理的信号来确定β2(k,n)的值。也就是说,可以根据麦克风的和麦克风被附着到的设备的特性确定β2(k,n)的值。
例如,在满足以下条件时,可以通过使用等式1至3在时间n之前和之后将短时间移动平均|X_bar(k,n)|除以稳定分量信号|N(k,n)|来获得系数β2(k,n),并且输入信号|X(k,n)|可以由短时间移动平均|X_bar(k,n)|替换作为结果。在不满足以下条件时,可以设置β2(k,n)=β1(k,n)。
条件:|X(k,n)|>β1(k,n)·N(k,n)并且β1(k,n)·N(k,n)-|X_bar(k,n)|>δ
等式1:β2(k,n-1)=X_bar(k,n)/N(k,n)
等式2:β2(k,n)=X_bar(k,n)/N(k,n)
等式3:β2(k,n+1)=X_bar(k,n)/N(k,n)
如以上描述的那样,在稳定分量信号N(k,n)中,如果有可能防止振幅分量在短时间内的“尖峰”,则有可能使用短时间移动平均来执行替换、由此提高声音质量。
[第五实施例]
将参照图12和图13描述根据本发明的第五实施例的信号处理装置。图12是用于说明根据该实施例的信号处理装置的替换单元1203的布置的框图。根据该实施例的替换单元1203与第二实施例不同在于包括第一比较器1231、上侧振幅替换单元1232、第二比较器1233和下侧振幅替换单元1234。其余部件和操作与在第二实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
第一比较器1231比较有噪信号振幅谱|X(k,n)|与稳定分量信号N(k,n)的用作第五函数的α1(k,n)倍(第三阈值)。如果振幅(功率)分量|X(k,n)|大于稳定分量信号N(k,n)的α1(k,n)倍,则上侧振幅替换单元1232通过稳定分量信号N(k,n)的用作第六函数的α2(k,n)倍执行替换;否则,谱形状直接地用作向第二比较器1233的输出信号|Y1(k,n)|。也就是说,如果|X(k,n)|>α1(k,n)N(k,n),则获得|Y1(k,n)|=α2(k,n)N(k,n);否则,获得|Y1(k,n)|=|X(k,n)|。
在另一方面,第二比较器1233比较来自上侧振幅替换单元1232的输出信号|Y1(k,n)|与稳定分量信号N(k,n)的用作第七函数的β1(k,n)倍(第四阈值)。如果来自上侧振幅替换单元1232的输出信号|Y1(k,n)|小于稳定分量信号N(k,n)的β1(k,n)倍,则下侧振幅替换单元1234通过稳定分量信号N(k,n)的用作第八函数的β2(k,n)倍执行替换;否则,谱形状直接地用作输出信号|Y2(k,n)|。也就是说,如果|Y1(k,n)|<β1(k,n)N(k,n),则获得|Y2(k,n)|=β2(k,n)N(k,n);否则,获得|Y1(k,n)|=|Y2(k,n)|。
图13是示出在α1(k,n)=α2(k,n)和β1(k,n)=β2(k,n)时在输入信号|X(k,n)|、稳定分量信号N(k,n)和输出信号|Y(k,n)|之间的关系的视图。
这在输入信号的变化在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更大的频率带和功率比阈值β1(k,n)N(k,n)更小的频率带中为大时有效。
[第六实施例]
将参照图14和图15描述根据本发明的第六实施例的信号处理装置。图14是用于说明根据该实施例的信号处理装置的替换单元1403的布置的框图。根据该实施例的替换单元1403与第三实施例不同在于上侧振幅替换单元1432使用有噪信号振幅谱|X(k,n)|的系数α(k,n)倍来执行替换。其余部件和操作与在第三实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
如果振幅(功率)分量|X(k,n)|大于稳定分量信号N(k,n)的α1(k,n)倍,则上侧振幅替换单元1432通过振幅分量X(k,n)的α2(k,n)倍执行替换;否则,谱形状直接地用作替换单元1403的输出信号|Y(k,n)|。也就是说,如果|X(k,n)|>α1(k,n)N(k,n),则获得|Y(k,n)|=α2(k,n)|X(k,n)|;否则,获得|Y(k,n)|=|X(k,n)|。
图15是示出在α1(k,n)=1和α2(k,n)=0.7时在输入信号|X(k,n)|、稳定分量信号N(k,n)和输出信号|Y(k,n)|之间的关系的视图。
这在输入信号的变化在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更大的频率带中为大时以及在谱形状的特性优选地尽可能保持在输出信号中时有效。例如,在希望执行语音识别而抑制风噪声时在语音区间中执行根据该实施例的处理是有效的。在另一方面,由于有可能在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更小的频带中保持自然性,所以声音质量提高。
[第七实施例]
将参照图16描述根据本发明的第七实施例的信号处理装置。图16是用于说明根据该实施例的信号处理装置的替换单元1603的布置的框图。根据该实施例的替换单元1603与第五实施例不同在于上侧振幅替换单元1632与根据第六实施例的替换单元1403相似地使用有噪信号振幅谱|X(k,n)|的系数α(k,n)倍来执行替换。其余部件和操作与在第五实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
这在输入信号的变化在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更大的频率带和功率比阈值β1(k,n)N(k,n)更小的频率带中为大时以及在谱形状的特性优选地尽可能保持在输出信号中时有效。
[第八实施例]
将参照图17描述根据本发明的第八实施例的信号处理装置。图17是用于说明根据该实施例的信号处理装置1700的布置的框图。根据该实施例的信号处理装置1700与第二实施例不同在于包括语音检测器1701并且替换单元1703根据语音检测结果执行替换处理。其余部件和操作与在第二实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
语音检测器1701在频率基础上确定语音是否被包括在有噪信号振幅谱|X(k,n)|中。替换单元1703通过使用稳定分量谱N(k,n)在未包括语音的频率上替换有噪信号振幅谱|X(k,n)|。也就是说,如果语音检测器1701的输出是1或者确定了包括语音,则获得|Y(k,n)|=α(k,n)N(k,n)。如果语音检测器1701的输出是0或者确定不包括语音,则获得|Y(k,n)|=|X(k,n)|。
根据该实施例,由于在除了包括语音的频率之外的频率使用稳定分量信号N(k,n)来执行替换,所以有可能避免通过抑制而引起的语音失真等。
[第九实施例]
将参照图18至图21描述根据本发明的第九实施例的信号处理装置。图18是用于说明根据该实施例的信号处理装置1800的布置的框图。根据该实施例的信号处理装置1800与第二实施例不同在于包括语音检测器1801并且替换单元1803根据语音检测结果执行替换处理。其余部件和操作与在第二实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
语音检测器1801在频率基础上计算语音被包括在有噪信号振幅谱|X(k,n)|中的概率p(k,n),其中p(k,n)是实数0(含)至1(含)。替换单元1803使用语音存在概率p(k,n)和稳定分量信号N(k,n)来替换有噪信号振幅谱|X(k,n)|。例如,通过使用范围从0至1的、p(k,n)的函数α(p(k,n)),可以获得输出信号|Y(k,n)|=α(p(k,n))N(k,n)+(1-α(p(k,n)))|X(k,n)|。
图19是示出语音检测器1701的内部布置的示例的框图。频率方向差值计算器1901计算在相邻频率的振幅分量之间的差值。绝对值总和计算器1902计算在由频率方向差值计算器1901计算的振幅分量之间的绝对差值之和。确定器1903基于由绝对值总和计算器1902计算的绝对值总和推倒语音存在概率p(k,n)。更具体地,在绝对值总和较大时,确定以较高概率包括了语音。
图20是示出语音检测器1701的内部布置的另一示例的框图。频率方向平滑器2001在频率方向上平滑输入振幅分量。频率方向差值计算器2002计算在相邻频率的振幅分量之间的差值。绝对值总和计算器2003计算在由频率方向差值计算器2002计算的振幅分量之间的绝对差值之和。
在另一方面,时间方向平滑器2004在时间方向上平滑输入振幅分量。频率方向差值计算器2005计算在相邻频率的振幅分量之间的差值。绝对值总和计算器2006计算在由频率方向差值计算器2005计算的振幅分量之间的绝对差值之和。
确定器2007基于由绝对值总和计算器2003和2006计算的绝对值总和推倒语音存在概率p(k,n)。
在图19和图20中的每幅图中,通过获得语音存在概率p(k,n)来终止处理。然而,可以通过比较语音存在概率p(k,n)与预定阈值q来获得语音信号的存在/不存在(0/1)。注意,已经描述图19和图20中所示的方法作为语音检测方法的示例,但是本发明不限于此。例如,可以在该实施例中应用在非专利文献4至7中描述的语音检测方法。
图21是示出输出信号|Y(k,n)|的谱形状根据p(k,n)的值的改变的视图。在图21的上部分中的图形示出其中p(k,n)对于k的所有值都与1(=语音)接近并且处理结果|Y(k,n)|具有与输入信号|X(k,n)|的谱形状更接近的谱形状的情况。在另一方面,在图21的下部分中的图形示出其中p(k,n)对于k的所有值都与0接近(=非语音)并且处理结果|Y(k,n)|具有与稳定分量信号N(k,n)的谱形状更接近的谱形状的情况。
根据该实施例,有可能根据语音存在可能性使噪声稳定并且抑制非稳定噪声、如风噪声而有效地避免语音的失真等。
[第十实施例]
将参照图22描述根据本发明的第十实施例的信号处理装置。图22是用于说明根据该实施例的替换单元2203的布置的框图。根据该实施例的替换单元2203与第八实施例不同在于包括比较器631和上侧振幅替换单元2232。比较器631与参照图6描述的比较器相同,并且其余部件和操作与在第八实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
上侧振幅替换单元2232从语音检测器1701接收语音检测标志(0/1)。如果标志指示非语音并且|X(k,n)|>α1(k,n)N(k,n),则获得|Y(k,n)|=α2(k,n)N(k,n);否则,获得|Y(k,n)|=|X(k,n)|。
这在输入信号的变化在非语音频带中的、其中功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更大的频率带中为大时有效。在另一方面,由于有可能在语音频带中或者其中功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更小的频带中保持自然性,所以声音质量提高。
[第十一实施例]
将参照图23描述根据本发明的第十一实施例的信号处理装置。图23是用于说明根据该实施例的信号处理装置的替换单元2303的布置的框图。根据该实施例的替换单元2203与第八实施例不同在于包括比较器931和下侧振幅替换单元2332。比较器931与参照图9描述的比较器相同,并且其余部件和操作与在第八实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
下侧振幅替换单元2332从语音检测器1701接收语音检测标志(0/1)。如果标志指示非语音并且|X(k,n)|<β1(k,n)N(k,n),则获得|Y(k,n)|=β2(k,n)N(k,n);否则,获得|Y(k,n)|=|X(k,n)|。
这在输入信号的变化在非语音频带中的、其中功率比通过将稳定分量信号乘以预定系数而获得的阈值β1(k,n)N(k,n)更小的频率带中为大时有效。在另一方面,由于有可能在语音频带中或者其中功率比通过将稳定分量信号乘以预定系数而获得的阈值β1(k,n)N(k,n)更大的频带中保持自然性,所以声音质量提高。
[第十二实施例]
将参照图24描述根据本发明的第十二实施例的信号处理装置。图24是用于说明根据该实施例的信号处理装置的替换单元2403的布置的框图。根据该实施例的替换单元2403与第八实施例不同在于包括第一比较器1231、上侧振幅替换单元2432、第二比较器1233和下侧振幅替换单元2434。第一比较器1231和第二比较器1233与参照图12描述的第一比较器和第二比较器相同,并且其余部件和操作与在第八实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
上侧振幅替换单元2432从语音检测器1701接收语音检测标志(0/1)。如果标志指示非语音并且|X(k,n)|>α1(k,n)N(k,n),则获得|Y1(k,n)|=α2(k,n)N(k,n);否则,获得|Y1(k,n)|=|X(k,n)|。也就是说,如果振幅(功率)分量|X(k,n)|在非语音区间中大于稳定分量信号|N(k,n)|的α1(k,n)倍,则上侧振幅替换单元2432通过稳定分量信号|N(k,n)|的α2(k,n)倍执行替换;否则,谱形状直接地用作向第二比较器1233的输出信号|Y1(k,n)|。
在另一方面,下侧振幅替换单元2434仅在来自上侧振幅替换单元2432的输出信号|Y1(k,n)|在非语音区间中比稳定分量信号N(k,n)的β2(k,n)倍更小的频率、通过稳定分量信号N(k,n)的β2(k,n)倍替换输出信号。在输出信号|Y1(k,n)|比β2(k,n)倍更大的频率,谱形状直接地用作输出信号|Y2(k,n)|。也就是说,如果|Y1(k,n)|<β1(k,n)N(k,n),则获得|Y2(k,n)|=β2(k,n)N(k,n);否则,获得|Y1(k,n)|=|Y2(k,n)|。
这在输入信号的变化在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更大的频率带和功率小于阈值β1(k,n)N(k,n)的频率带中为大时以及在谱形状的特性优选地尽可能多地保持在语音区间中时有效。
[第十三实施例]
将参照图25描述根据本发明的第十三实施例的信号处理装置。图25是用于说明根据该实施例的信号处理装置的替换单元2503的布置的框图。根据该实施例的替换单元2503与第十实施例不同在于上侧振幅替换单元2532与第六实施例相似地使用有噪信号振幅谱|X(k,n)|的系数α2(k,n)倍来执行替换。其余部件和操作与在第十实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
如果振幅(功率)分量|X(k,n)|在非语音区间中大于稳定分量信号N(k,n)的α1(k,n)倍,则上侧振幅替换单元2532通过输入振幅分量|X(k,n)|的α2(k,n)倍执行替换;否则,谱形状直接地用作替换单元2503的输出信号|Y1(k,n)|。也就是说,如果|X(k,n)|>α1(k,n)N(k,n),则获得|Y(k,n)|=α2(k,n)|X(k,n)|;否则,获得|Y(k,n)|=|X(k,n)|。
这在输入信号的变化在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更大的频率带中为大时以及在谱形状的特性优选地尽可能多地保持在输出信号中时有效。例如,在希望识别语音区间中的语音而抑制非语音区间中的风噪声时,即使确定了非语音区间,在功率为大的区间中的谱形状仍然保持。因此,即使语音存在/不存在确定错误,仍然有可能提高语音识别准确性。
[第十四实施例]
将参照图26描述根据本发明的第十四实施例的信号处理装置。图26是用于说明根据该实施例的信号处理装置的替换单元2603的布置的框图。根据该实施例的替换单元2603与第十二实施例不同在于上侧振幅替换单元2632与第七实施例相似地使用有噪信号振幅谱|X(k,n)|的系数α2(k,n)倍来执行替换。其余部件和操作与在第十二实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
如果振幅(功率)分量|X(k,n)|在非语音区间中大于稳定分量信号|N(k,n)|的α1(k,n)倍,则上侧振幅替换单元2632通过输入振幅分量|X(k,n)|的α2(k,n)倍执行替换;否则,谱形状直接地用作向第二比较器1233的输出信号|Y1(k,n)|。也就是说,如果|X(k,n)|>α1(k,n)N(k,n),则获得|Y1(k,n)|=α2(k,n)|X(k,n)|;否则,获得|Y1(k,n)|=|X(k,n)|。
这在输入信号的变化在功率比通过将稳定分量信号乘以预定系数而获得的阈值α1(k,n)N(k,n)更大的频率带中为大时以及在谱形状的特性优选地尽可能多地保留在输出信号|Y2(k,n)|中时有效。例如,在希望识别在语音区间中的语音而抑制在非语音区间中的风噪声时,即使确定了非语音区间,在功率为大的区间中的谱形状仍然保持。因此,即使语音存在/不存在确定错误,仍然有可能提高语音识别准确性。
[第十五实施例]
将参照图27和图28描述根据本发明的第十五实施例的信号处理装置。图27是用于说明根据该实施例的信号处理装置2700的布置的框图。根据该实施例的信号处理装置2700与第二实施例不同在于包括噪声抑制器2701并且替换单元203替换噪声抑制结果。其余部件和操作与在第二实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
噪声抑制器2701使用从变换器201供应的有噪信号振幅谱|X(k,n)|和由稳定分量估计器202估计的稳定分量谱N(k,n)来抑制噪声并且向替换单元203传输增强的信号振幅谱G(k,n)|X(k,n)|作为噪声抑制结果。
如果G(k,n)|X(k,n)|>α1(k,n)N(k,n),则替换单元203设置|Y(k,n)|=α2(k,n)N(k,n);否则,替换单元203设置|Y(k,n)|=G(k,n)|X(k,n)|。
图28是用于说明噪声抑制器2701的内部布置的示例的框图。通过使用各种方法,增益计算器2801可以获得用于抑制噪声的增益G(k,n)。用于输出最优估计值的维纳(Wiener)滤波器可以用来获得增益,该最优估计值最小化与希望的信号的均方差。备选地,已知的方法、诸如GSS(普通谱减法)、MMSESTSA(最小均方差短时间谱振幅)或者MMSELSA(最小均方差对数谱振幅)可以用来推到增益。
乘法器2802通过将输入信号|X(k,n)|乘以由增益计算器2801获得的增益G(k,n)来获得增强的信号振幅谱G(k,n)|X(k,n)|。替换单元203根据条件用稳定分量谱N(k,n)的系数α(k,n)倍替换增强的信号振幅谱G(k,n)|X(k,n)|。
根据该实施例,有可能根据条件使在噪声抑制之后的信号稳定并且抑制其它噪声,同时有效地抑制具有强的非稳定分量的噪声、诸如风噪声。
[第十六实施例]
将参照图29描述根据本发明的第十六实施例的信号处理装置。图29是用于说明根据该实施例的替换单元2903的布置的框图。根据该实施例的替换单元2903与第二实施例不同在于包括第一比较器2931、上侧振幅替换单元2932、第二比较器2933、下侧振幅替换单元2934和增益计算器2935。其余部件和操作与在第二实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
在该实施例中,在替换单元2903中,通过替换来抑制非稳定噪声而使用增益来抑制噪声。
增益计算器2935使用从变换器201供应的有噪信号振幅谱|X(k,n)|和由稳定分量估计器202估计的稳定分量谱N(k,n)来计算增益G(k,n)。该计算方法可以与第十五实施例相似地使用已知的噪声抑制技术。
第一比较器2931比较G(k,n)|X(k,n)|与α1(k,n)N(k,n)。如果G(k,n)|X(k,n)|>α1(k,n)N(k,n),则上侧振幅替换单元2932设置G1(k,n)=α2(k,n)N(k,n)/|X(k,n)|;否则,上侧振幅替换单元2932设置G1(k,n)=G(k,n)。
在另一方面,第二比较器2933比较G1(k,n)X(k,n)与β1(k,n)N(k,n)。如果G1(k,n)X(k,n)<β1(k,n)N(k,n),则下侧振幅替换单元2934设置G2(k,n)=β2(k,n)N(k,n)/X(k,n);否则,下侧振幅替换单元2934设置G2(k,n)=G(k,n)。
最后,乘法器2936将输入振幅谱|X(k,n)|乘以增益G2(k,n)并且输出替换的新振幅谱G2(k,n)|X(k,n)|。
如以上描述的那样,在替换单元2903执行增益计算并且使用增益来执行替换处理时,有可能根据条件使在噪声抑制之后的信号稳定并且抑制其它噪声,同时有效地抑制具有强的非稳定分量的噪声、诸如风噪声。
[第十七实施例]
将参照图30描述根据本发明的第十七实施例的信号处理装置。图30是用于说明根据该实施例的信号处理装置3000的布置的框图。根据该实施例的信号处理装置3000与第十五实施例不同在于还包括参照图17描述的语音检测器1701。其余部件和操作与在第十五实施例中相同。因此,相同标号表示相同部件和操作,并且将省略其具体描述。
根据语音检测器1701的语音检测结果(0/1或者语音概率p),替换单元3003用来自稳定分量估计器202的稳定分量信号N(k,n)的系数α(k,n)倍替换噪声抑制器的噪声抑制结果G(k,n)|X(k,n)|。替换单元3003可以具有在第九至第十四实施例中的每个实施例中描述的布置。
此外,例如,噪声抑制器2701可以通过使用在专利文献3中描述的技术来基于从语音检测器1701输出的语音存在概率p(k,n)计算用于每个频率带的MMSESTSA增益函数值G(k,n)、将输入信号|X(k,n)|乘以MMSESTSA增益函数值并且获得增强的信号G(k,n)|X(k,n)|、由此向替换单元3003输出增强的信号。
根据该实施例,有可能根据语音检测结果使在噪声抑制之后的信号稳定并且输出清楚的语音,同时有效地抑制具有强的非稳定分量的噪声、诸如风噪声和其它噪声。
[其它实施例]
根据以上描述的实施例中的每个实施例的信号处理装置适用于抑制在视频拍摄或者语音记录时的风噪声、车辆经过的声音(汽车/高速火车)、直升飞机声音、在街道上的噪声、自助餐厅噪声、办公室噪声、穿衣的沙沙声等。注意本发明不限于此而适用于为了抑制来自输入信号的非稳定噪声而需要的任何信号处理装置。
注意本发明不限于以上描述的实施例。如本领域技术人员将理解的那样,可以不同地修改本发明的布置和细节而不脱离其精神实质和范围。本发明也并入如下***或者装置,该***或者装置在任何形式中组合在实施例中包括的不同特征。
本发明可以应用于包括多个设备或者单个装置的***。本发明即使在直接地或者从远程地点向***或者装置供应用于实施这些实施例的功能的信号处理程序时也适用。因此,本发明也并入在计算机中安装的用于计算机实施本发明的功能的程序、存储程序的介质和使得用户下载程序的WWW(万维网)服务器。具体而言,本发明并入如下非瞬态计算机可读介质,该非瞬态计算机可读介质存储用于使计算机执行在以上描述的实施例中包括的处理步骤的程序。
作为示例,以下将参照图31描述在第一实施例中说明的语音处理由软件实施时由在计算机3100中提供的CPU3102执行的处理过程。
将输入信号变换成频域中的振幅分量信号(S3101)。基于频域中的振幅分量信号,估计具有频率谱的稳定分量信号,该频率谱具有稳定特性(S3103)。使用输入振幅分量信号和稳定分量信号来生成新振幅分量信号(S3105)。用新振幅分量信号替换振幅分量信号(S3107)。此外,新振幅分量信号被逆变换成增强的信号(S3109)。
在存储器3104中存储用于执行这些过程的程序模块。在CPU3102依次地执行在存储器3104中存储的程序模块时,有可能获得与在第一实施例中的效果相同的效果。
相似地,至于第二至第十七实施例,在CPU3102执行与来自存储器3104的参照框图描述的功能部件对应的程序模块时,有可能获得与在实施例中的效果相同的效果。
[实施例的其它表达]
也可以如在以下补充注释中那样描述以上描述的实施例中的一些或者所有实施例而不限于以下补充注释。
(补充注释1)
提供一种信号处理装置,包括:
变换器,将输入信号变换成频域中的振幅分量信号;
稳定分量估计器,基于频域中的振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
替换单元,使用由变换器获得的振幅分量信号和稳定分量信号来生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号;以及
逆变换器,将新振幅分量信号逆变换成增强的信号。
(补充注释2)
提供根据补充注释1的信号处理装置,其中替换单元在至少一些频率基于稳定分量信号的函数生成新振幅分量信号。
(补充注释3)
提供根据补充注释1或者2的信号处理装置,其中替换单元在至少一些频率通过将稳定分量信号乘以系数来生成新振幅分量信号。
(补充注释4)
提供根据补充注释1、2或者3的信号处理装置,其中替换单元在振幅分量信号比基于稳定分量信号的第一函数确定的第一阈值更大的频率、基于稳定分量信号的第二函数生成新振幅分量信号。
(补充注释5)
提供根据补充注释4的信号处理装置,其中替换单元包括:
比较器,比较第一阈值和振幅分量信号,以及
上侧振幅替换单元,在振幅分量信号大于第一阈值的频率、基于稳定分量信号的第二函数生成新振幅分量信号,而在振幅分量信号不大于第一阈值的频率直接地获得由变换器获得的振幅分量信号作为新振幅分量信号。
(补充注释6)
提供根据补充注释4的信号处理装置,其中替换单元包括:
比较器,比较振幅分量信号与用作第一阈值的、稳定分量信号的第一系数倍,以及
上侧振幅替换单元,在振幅分量信号大于稳定分量信号的第一系数倍时获得稳定分量信号的、用作第二函数的第二系数倍作为新振幅分量信号,而在振幅分量信号不大于稳定分量信号的第一系数倍时直接地获得由变换器获得的振幅分量信号作为新振幅分量信号。
(补充注释7)
提供根据补充注释1至6中的任一补充注释的信号处理装置,其中替换单元在振幅分量信号比基于稳定分量信号的第三函数确定的第二阈值更小的频率、基于稳定分量信号的第四函数生成新振幅分量信号。
(补充注释8)
提供根据补充注释1至7中的任一补充注释的信号处理装置,其中替换单元包括:
比较器,比较第二阈值和振幅分量信号,以及
上侧振幅替换单元,在振幅分量信号大于第二阈值时基于稳定分量信号的第二函数生成新振幅分量信号,而在振幅分量信号不大于第二阈值时直接地获得由变换器获得的振幅分量信号作为新振幅分量信号。
(补充注释9)
提供根据补充注释7的信号处理装置,其中所述替换单元包括:
比较器,比较振幅分量信号与用作第二阈值的、稳定分量信号的第三系数倍,以及
下侧振幅替换单元,在振幅分量信号小于稳定分量信号的第三系数倍时获得稳定分量信号的第四系数倍作为新振幅分量信号,而在振幅分量信号不小于稳定分量信号的第三系数倍时直接地获得由变换器获得的振幅分量信号作为新振幅分量信号。
(补充注释10)
提供根据补充注释1至9中的任一补充注释的信号处理装置,其中替换单元:
在振幅分量信号比基于稳定分量信号的第五函数确定的第三阈值更大的频率、基于稳定分量信号的第六函数生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号,以及
在振幅分量信号比基于稳定分量信号的第七函数确定的第四阈值更小的频率、基于稳定分量信号的第八函数生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号,以及
第三阈值不小于第四阈值。
(补充注释11)
提供根据补充注释10的信号处理装置,其中替换单元包括:
第一比较器,比较振幅分量信号与用作第三阈值的、稳定分量信号的第五系数倍,
上侧振幅替换单元,在振幅分量信号大于稳定分量信号的第五系数倍时使用稳定分量信号的第六系数倍作为新振幅分量信号来替换振幅分量信号,而在振幅分量信号不大于稳定分量信号的第五系数倍时直接地获得由变换器获得的振幅分量信号作为新振幅分量信号,
第二比较器,比较用作第四阈值的、稳定分量信号的第六系数倍与从上侧振幅替换单元输出的新振幅分量信号,以及
下侧振幅替换单元,在从上侧振幅替换单元输出的新振幅分量信号小于稳定分量信号的第六系数倍时使用稳定分量信号的第七系数倍来替换由上侧振幅替换单元获得的新振幅分量信号,而在振幅分量信号不小于稳定分量信号的第六系数倍时直接地输出由上侧振幅替换单元获得的新振幅分量信号。
(补充注释12)
提供根据补充注释1的信号处理装置,其中替换单元包括:
比较器,比较振幅分量信号与稳定分量信号的第七系数倍;以及
上侧振幅替换单元,在振幅分量信号大于稳定分量信号的第七系数倍时使用振幅分量信号的第八系数倍作为新振幅分量信号来替换振幅分量信号,而在振幅分量信号不大于稳定分量信号的第七系数倍时直接地获得由变换器获得的振幅分量信号作为新振幅分量信号。
(补充注释13)
提供根据补充注释1的信号处理装置,其中替换单元包括:
第一比较器,比较振幅分量信号与稳定分量信号的第九系数倍,
上侧振幅替换单元,在振幅分量信号大于稳定分量信号的第九系数倍时使用振幅分量信号的第十系数倍作为新振幅分量信号来替换振幅分量信号,而在振幅分量信号不大于稳定分量信号的第九系数倍时直接地获得由变换器获得的振幅分量信号作为新振幅分量信号,
第二比较器,比较从上侧振幅替换单元输出的新振幅分量信号与稳定分量信号的第十一系数倍,以及
下侧振幅替换单元,进一步地在振幅分量信号小于稳定分量信号的第十一系数倍时使用稳定分量信号的第十二系数倍来替换由上侧振幅替换单元获得的新振幅分量信号,而在振幅分量信号不小于稳定分量信号的第十一系数倍时输出由上侧振幅替换单元获得的新振幅分量信号。
(补充注释14)
提供根据补充注释1至13中的任一补充注释的信号处理装置,还包括:
语音检测器,检测来自振幅分量信号的语音,
其中替换单元在非语音区间中替换由变换器获得的振幅分量信号。
(补充注释15)
提供根据补充注释1至13中的任一补充注释的信号处理装置,还包括:
语音检测器,从振幅分量信号生成语音存在概率,
其中替换单元替换由变换器获得的振幅分量信号,从而在频域中随着语音存在概率越低、振幅分量信号变得越接近稳定分量信号。
(补充注释16)
提供根据补充注释1至15中的任一补充注释的信号处理装置,还包括:
噪声抑制器,抑制在振幅分量信号中包括的噪声,
其中替换单元使用稳定分量信号和由噪声抑制器获得的增强的振幅分量信号来生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号。
(补充注释17)
提供一种信号处理方法,包括:
将输入信号变换成频域中的振幅分量信号;
基于频域中的振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
使用在变换中获得的振幅分量信号和稳定分量信号来生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号;以及
将新振幅分量信号逆变换成增强的信号。
(补充注释18)
提供一种用于使计算机执行方法的信号处理程序,该方法包括:
将输入信号变换成频域中的振幅分量信号;
基于频域中的振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
使用在变换中获得的振幅分量信号和稳定分量信号来生成新振幅分量信号并且用新振幅分量信号替换振幅分量信号;以及
将新振幅分量信号逆变换成增强的信号。
本申请要求于2013年4月11日提交的第2013-83411号日本专利申请的权益,其通过引用整体结合于此。
Claims (16)
1.一种信号处理装置,包括:
变换器,所述变换器将输入信号变换成频域中的振幅分量信号;
稳定分量估计器,所述稳定分量估计器基于所述频域中的所述振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
替换单元,所述替换单元使用由所述变换器获得的所述振幅分量信号和所述稳定分量信号来生成新振幅分量信号,并且用所述新振幅分量信号替换由所述变换器获得的所述振幅分量信号;以及
逆变换器,所述逆变换器将所述新振幅分量信号逆变换成增强的信号。
2.根据权利要求1所述的信号处理装置,其中所述替换单元在至少一些频率、基于所述稳定分量信号的函数生成所述新振幅分量信号。
3.根据权利要求1或者2所述的信号处理装置,其中所述替换单元在至少一些频率、通过将所述稳定分量信号乘以系数来生成所述新振幅分量信号。
4.根据权利要求1、2或者3所述的信号处理装置,其中所述替换单元在所述振幅分量信号比基于所述稳定分量信号的第一函数确定的第一阈值更大的频率、基于所述稳定分量信号的第二函数生成所述新振幅分量信号。
5.根据权利要求4所述的信号处理装置,其中所述替换单元包括:
第一比较器,所述第一比较器比较所述振幅分量信号与用作所述第一阈值的、所述稳定分量信号的第一系数倍,以及
第一上侧振幅替换单元,所述第一上侧振幅替换单元在所述振幅分量信号大于所述稳定分量信号的所述第一系数倍时,获得所述稳定分量信号的、用作所述第二函数的第二系数倍作为所述新振幅分量信号,并且在所述振幅分量信号不大于所述稳定分量信号的所述第一系数倍时,直接地获得由所述变换器获得的所述振幅分量信号作为所述新振幅分量信号。
6.根据权利要求1至5中的任一权利要求所述的信号处理装置,其中所述替换单元在所述振幅分量信号比基于所述稳定分量信号的第三函数确定的第二阈值更小的频率、基于所述稳定分量信号的第四函数生成所述新振幅分量信号。
7.根据权利要求6所述的信号处理装置,其中所述替换单元包括:
第二比较器,所述第二比较器比较所述振幅分量信号与用作所述第二阈值的、所述稳定分量信号的第三系数倍,以及
第一下侧振幅替换单元,所述第一下侧振幅替换单元在所述振幅分量信号小于所述稳定分量信号的所述第三系数倍时,获得所述稳定分量信号的第四系数倍作为所述新振幅分量信号,并且在所述振幅分量信号不小于所述稳定分量信号的所述第三系数倍时,直接地获得由所述变换器获得的所述振幅分量信号作为所述新振幅分量信号。
8.根据权利要求1至7中的任一权利要求所述的信号处理装置,其中所述替换单元:
在所述振幅分量信号大于基于所述稳定分量信号的第五函数确定的第三阈值时,基于所述稳定分量信号的第六函数生成所述新振幅分量信号,并且用所述新振幅分量信号替换所述振幅分量信号,并且
在所述振幅分量信号小于基于所述稳定分量信号的第七函数确定的第四阈值时,基于所述稳定分量信号的第八函数生成所述新振幅分量信号,并且用所述新振幅分量信号替换所述振幅分量信号,并且
所述第三阈值不小于所述第四阈值。
9.根据权利要求8所述的信号处理装置,其中所述替换单元包括:
第三比较器,所述第三比较器比较所述振幅分量信号与用作所述第三阈值的、所述稳定分量信号的第五系数倍,
第二上侧振幅替换单元,所述第二上侧振幅替换单元在所述振幅分量信号大于所述稳定分量信号的所述第五系数倍时,使用所述稳定分量信号的第六系数倍作为所述新振幅分量信号来替换所述振幅分量信号,并且在所述振幅分量信号不大于所述稳定分量信号的所述第五系数倍时直接地获得由所述变换器获得的所述振幅分量信号作为所述新振幅分量信号,
第四比较器,所述第四比较器比较用作所述第四阈值的、所述稳定分量信号的所述第六系数倍与从所述第二上侧振幅替换单元输出的所述新振幅分量信号,以及
第二下侧振幅替换单元,所述第二下侧振幅替换单元在从所述第二上侧振幅替换单元输出的所述新振幅分量信号小于所述稳定分量信号的所述第六系数倍时,使用所述稳定分量信号的第七系数倍来进一步替换由所述第二上侧振幅替换单元获得的所述新振幅分量信号,并且在所述振幅分量信号不小于所述稳定分量信号的所述第六系数倍时,直接地输出由所述第二上侧振幅替换单元获得的所述新振幅分量信号。
10.根据权利要求1所述的信号处理装置,其中所述替换单元包括:
第五比较器,所述第五比较器比较所述振幅分量信号与所述稳定分量信号的第七系数倍;以及
第三上侧振幅替换单元,所述第三上侧振幅替换单元在所述振幅分量信号大于所述稳定分量信号的所述第七系数倍时,使用所述振幅分量信号的第八系数倍作为所述新振幅分量信号来替换所述振幅分量信号,并且在所述振幅分量信号不大于所述稳定分量信号的所述第七系数倍时,直接地获得由所述变换器获得的所述振幅分量信号作为所述新振幅分量信号。
11.根据权利要求1所述的信号处理装置,其中所述替换单元包括:
第六比较器,所述第六比较器比较所述振幅分量信号与所述稳定分量信号的第九系数倍,
第四上侧振幅替换单元,所述第四上侧振幅替换单元在所述振幅分量信号大于所述稳定分量信号的所述第九系数倍时,使用所述振幅分量信号的第十系数倍作为所述新振幅分量信号来替换所述振幅分量信号,并且在所述振幅分量信号不大于所述稳定分量信号的所述第九系数倍时,直接地获得由所述变换器获得的所述振幅分量信号作为所述新振幅分量信号,
第七比较器,所述第七比较器比较从所述上侧振幅替换单元输出的所述新振幅分量信号与所述稳定分量信号的第十一系数倍,以及
第三下侧振幅替换单元,所述第三下侧振幅替换单元在所述振幅分量信号小于所述稳定分量信号的所述第十一系数倍时,使用所述稳定分量信号的第十二系数倍来进一步替换由所述第四上侧振幅替换单元获得的所述新振幅分量信号,并且在所述振幅分量信号不小于所述稳定分量信号的所述第十一系数倍时,输出由所述第四上侧振幅替换单元获得的所述新振幅分量信号。
12.根据权利要求1至11中的任一权利要求所述的信号处理装置,还包括:
语音检测器,所述语音检测器检测来自所述振幅分量信号的语音,
其中所述替换单元在非语音区间中替换由所述变换器获得的所述振幅分量信号。
13.根据权利要求1至11中的任一权利要求所述的信号处理装置,还包括:
语音检测器,所述语音检测器从所述振幅分量信号生成语音存在概率,
其中所述替换单元替换由所述变换器获得的所述振幅分量信号,从而在所述频域中随着所述语音存在概率越低、所述振幅分量信号变得越接近所述稳定分量信号。
14.根据权利要求1至13中的任一权利要求所述的信号处理装置,还包括:
噪声抑制器,所述噪声抑制器抑制在所述振幅分量信号中包括的噪声,
其中所述替换单元使用所述稳定分量信号和由所述噪声抑制器获得的增强的振幅分量信号来生成新振幅分量信号,并且用所述新振幅分量信号替换所述振幅分量信号。
15.一种信号处理方法,包括:
将输入信号变换成频域中的振幅分量信号;
基于所述频域中的所述振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
使用在所述变换中获得的所述振幅分量信号和所述稳定分量信号来生成新振幅分量信号,并且用所述新振幅分量信号替换所述振幅分量信号;以及
将所述新振幅分量信号逆变换成增强的信号。
16.一种用于使得计算机执行方法的信号处理程序,所述方法包括:
将输入信号变换成频域中的振幅分量信号;
基于所述频域中的所述振幅分量信号估计具有具备稳定特性的频率谱的稳定分量信号;
使用在所述变换中获得的所述振幅分量信号和所述稳定分量信号来生成新振幅分量信号,并且用所述新振幅分量信号替换所述振幅分量信号;以及
将所述新振幅分量信号逆变换成增强的信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013-083411 | 2013-04-11 | ||
JP2013083411 | 2013-04-11 | ||
PCT/JP2014/058961 WO2014168021A1 (ja) | 2013-04-11 | 2014-03-27 | 信号処理装置、信号処理方法および信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105144290A true CN105144290A (zh) | 2015-12-09 |
CN105144290B CN105144290B (zh) | 2021-06-15 |
Family
ID=51689432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480020786.1A Active CN105144290B (zh) | 2013-04-11 | 2014-03-27 | 信号处理装置、信号处理方法和信号处理程序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10741194B2 (zh) |
EP (1) | EP2985761B1 (zh) |
JP (1) | JP6544234B2 (zh) |
CN (1) | CN105144290B (zh) |
WO (1) | WO2014168021A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106101925A (zh) * | 2016-06-27 | 2016-11-09 | 联想(北京)有限公司 | 一种控制方法及电子设备 |
WO2020103527A1 (zh) * | 2018-11-23 | 2020-05-28 | 北京达佳互联信息技术有限公司 | 响度调整方法、装置、电子设备以及存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10181329B2 (en) * | 2014-09-05 | 2019-01-15 | Intel IP Corporation | Audio processing circuit and method for reducing noise in an audio signal |
US9838737B2 (en) * | 2016-05-05 | 2017-12-05 | Google Inc. | Filtering wind noises in video content |
JP7152112B2 (ja) * | 2018-08-24 | 2022-10-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US11932256B2 (en) * | 2021-11-18 | 2024-03-19 | Ford Global Technologies, Llc | System and method to identify a location of an occupant in a vehicle |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040185804A1 (en) * | 2002-11-18 | 2004-09-23 | Takeo Kanamori | Microphone device and audio player |
JP2006337415A (ja) * | 2005-05-31 | 2006-12-14 | Nec Corp | 雑音抑圧の方法及び装置 |
WO2008111462A1 (ja) * | 2007-03-06 | 2008-09-18 | Nec Corporation | 雑音抑圧の方法、装置、及びプログラム |
CN102549659A (zh) * | 2009-10-01 | 2012-07-04 | 高通股份有限公司 | 抑制音频信号中的噪声 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
JP4282227B2 (ja) | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
JP2003058186A (ja) * | 2001-08-13 | 2003-02-28 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 雑音抑圧方法および雑音抑圧装置 |
JP4286637B2 (ja) | 2002-11-18 | 2009-07-01 | パナソニック株式会社 | マイクロホン装置および再生装置 |
JP5219499B2 (ja) | 2007-08-01 | 2013-06-26 | 三洋電機株式会社 | 風雑音低減装置 |
DE102007030209A1 (de) * | 2007-06-27 | 2009-01-08 | Siemens Audiologische Technik Gmbh | Glättungsverfahren |
JP5207479B2 (ja) * | 2009-05-19 | 2013-06-12 | 国立大学法人 奈良先端科学技術大学院大学 | 雑音抑圧装置およびプログラム |
JP5728870B2 (ja) | 2010-09-29 | 2015-06-03 | 井関農機株式会社 | コンバイン |
JP6064600B2 (ja) | 2010-11-25 | 2017-01-25 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
JP5919647B2 (ja) | 2011-05-11 | 2016-05-18 | 富士通株式会社 | 風雑音抑圧装置、半導体集積回路及び風雑音抑圧方法 |
JP6004792B2 (ja) * | 2011-07-06 | 2016-10-12 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、及び音響処理プログラム |
-
2014
- 2014-03-27 JP JP2015511204A patent/JP6544234B2/ja active Active
- 2014-03-27 CN CN201480020786.1A patent/CN105144290B/zh active Active
- 2014-03-27 EP EP14783172.1A patent/EP2985761B1/en active Active
- 2014-03-27 US US14/782,932 patent/US10741194B2/en active Active
- 2014-03-27 WO PCT/JP2014/058961 patent/WO2014168021A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040185804A1 (en) * | 2002-11-18 | 2004-09-23 | Takeo Kanamori | Microphone device and audio player |
JP2006337415A (ja) * | 2005-05-31 | 2006-12-14 | Nec Corp | 雑音抑圧の方法及び装置 |
WO2008111462A1 (ja) * | 2007-03-06 | 2008-09-18 | Nec Corporation | 雑音抑圧の方法、装置、及びプログラム |
CN101627428A (zh) * | 2007-03-06 | 2010-01-13 | 日本电气株式会社 | 抑制杂音的方法、装置以及程序 |
CN102549659A (zh) * | 2009-10-01 | 2012-07-04 | 高通股份有限公司 | 抑制音频信号中的噪声 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106101925A (zh) * | 2016-06-27 | 2016-11-09 | 联想(北京)有限公司 | 一种控制方法及电子设备 |
WO2020103527A1 (zh) * | 2018-11-23 | 2020-05-28 | 北京达佳互联信息技术有限公司 | 响度调整方法、装置、电子设备以及存储介质 |
US11284151B2 (en) | 2018-11-23 | 2022-03-22 | Beijing Dajia Internet Information Technology Co., Ltd. | Loudness adjustment method and apparatus, and electronic device and storage medium |
Also Published As
Publication number | Publication date |
---|---|
US10741194B2 (en) | 2020-08-11 |
EP2985761A1 (en) | 2016-02-17 |
JP6544234B2 (ja) | 2019-07-17 |
CN105144290B (zh) | 2021-06-15 |
US20160055863A1 (en) | 2016-02-25 |
EP2985761B1 (en) | 2021-01-13 |
JPWO2014168021A1 (ja) | 2017-02-16 |
WO2014168021A1 (ja) | 2014-10-16 |
EP2985761A4 (en) | 2016-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11056130B2 (en) | Speech enhancement method and apparatus, device and storage medium | |
US7313518B2 (en) | Noise reduction method and device using two pass filtering | |
US9113241B2 (en) | Noise removing apparatus and noise removing method | |
CN104053092B (zh) | 用于双麦克风通信装置的降噪 | |
CN105144290A (zh) | 信号处理装置、信号处理方法和信号处理程序 | |
US9536538B2 (en) | Method and device for reconstructing a target signal from a noisy input signal | |
US7957964B2 (en) | Apparatus and methods for noise suppression in sound signals | |
SE505156C2 (sv) | Förfarande för bullerundertryckning genom spektral subtraktion | |
JP6439682B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
US20090265168A1 (en) | Noise cancellation system and method | |
US9484044B1 (en) | Voice enhancement and/or speech features extraction on noisy audio signals using successively refined transforms | |
US9530434B1 (en) | Reducing octave errors during pitch determination for noisy audio signals | |
Islam et al. | Speech enhancement based on a modified spectral subtraction method | |
Martín-Doñas et al. | Dual-channel DNN-based speech enhancement for smartphones | |
US10453469B2 (en) | Signal processor | |
BR112014009647B1 (pt) | Aparelho de atenuação do ruído e método de atenuação do ruído | |
EP3242295B1 (en) | A signal processor | |
Rao et al. | Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration | |
KR101096091B1 (ko) | 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법 | |
CN113870884B (zh) | 单麦克风噪声抑制方法和装置 | |
EP2712208A1 (en) | Audio processing device, audio processing method, and recording medium on which audio processing program is recorded | |
CN111863015B (zh) | 一种音频处理方法、装置、电子设备和可读存储介质 | |
Nikita et al. | Speech enhancement based on spectral subtraction involving magnitude and phase components | |
CN117528305A (zh) | 拾音控制方法、装置及设备 | |
CN111863015A (zh) | 一种音频处理方法、装置、电子设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |