CN101207663A - 网络通信装置及消除网络通信装置的噪音的方法 - Google Patents

网络通信装置及消除网络通信装置的噪音的方法 Download PDF

Info

Publication number
CN101207663A
CN101207663A CNA2007101679147A CN200710167914A CN101207663A CN 101207663 A CN101207663 A CN 101207663A CN A2007101679147 A CNA2007101679147 A CN A2007101679147A CN 200710167914 A CN200710167914 A CN 200710167914A CN 101207663 A CN101207663 A CN 101207663A
Authority
CN
China
Prior art keywords
remote
sound signal
voice
communication device
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101679147A
Other languages
English (en)
Inventor
张铭
陆晓燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fortemedia Inc
Original Assignee
Fortemedia Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fortemedia Inc filed Critical Fortemedia Inc
Publication of CN101207663A publication Critical patent/CN101207663A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种网络通信装置,该网络通信装置播放经由网络接收的一远程声音信号,并经由该网络传送一近端声音信号至远程。在一实施例中,该网络通信装置包括一远程语音检测模块及一远程信道控制模块。该远程语音检测模块检测是否该远程声音信号包含语音,以产生一远程语音检测结果。若该远程语音检测结果显示该远程声音信号不包含语音,则该远程信道控制模块衰减该远程声音信号,以减少该远程声音信号所包含的噪音。

Description

网络通信装置及消除网络通信装置的噪音的方法
技术领域
本发明涉及噪音消除,特别是涉及网络通信装置的噪音消除。
背景技术
由于传统电路交换式的电话花费较大的成本,网络电话技术逐渐被用来进行长距离通话或国际电话。因此,诸如VoIP装置或Instant Messenger的网络通信装置变的广受欢迎。像是Skype、MSN Messenger、Yahoo Messenger、Google Talker、AOL Messenger皆是网络通信的软件应用程序。随着网络通信装置的频繁使用,对网络通信装置的通话声音品质的要求亦跟着提高。提升网络通信装置的通话声音品质最大的关键在噪音的控制。
网络通信装置时常需经由计算机连接上网络。此时计算机风扇的声音、打字的声音、鼠标移动的声音都很容易被网络通信装置的麦克风所接收而传送至远程。网络通信装置所包含的噪音抑制模块通常能消除大部分的静态噪音(stationary noise),以免静态噪音影响到通话声音品质。然而,传统噪音抑制模块无法消除非静态噪音(non-stationary noise),诸如上述风扇的声音、打字的声音、鼠标移动的声音等等。
由于进行网络通信的各方皆为互相独立的,因此当多人参与网络通信时(例如网络会议),则每方接收到总噪音量为各方产生的噪音的总合。而接收端的网络通信装置的自动增益模块可能会再于放大声音信号时连带将各方产生的噪音一并放大,降低通话的品质。因此,需要一种消除网络通信装置的噪音的方法,尤其是消除非静态噪音,以便增进网络通信装置的通话品质。
发明内容
有鉴于此,本发明的目的在于提供一种网络通信装置,以解决习知技术存在的问题。该网络通信装置播放经由网络接收的一远程声音信号,并经由该网络传送一近端声音信号至远程。在一实施例中,该网络通信装置包括一远程语音检测模块及一远程信道控制模块。该远程语音检测模块检测是否该远程声音信号包含语音,以产生一远程语音检测结果。若该远程语音检测结果显示该远程声音信号不包含语音,则该远程信道控制模块衰减该远程声音信号,以减少该远程声音信号所包含的噪音。
本发明更提供一种消除网络通信装置的噪音的方法。该网络通信装置播放经由网络接收的一远程声音信号,并经由该网络传送一近端声音信号至远程。首先,检测是否该远程声音信号包含语音,以产生一远程语音检测结果。若该远程语音检测结果显示该远程声音信号不包含语音,则衰减该远程声音信号,以减少该远程声音信号所包含的噪音。
为了让本发明的上述和其它目的、特征、和优点能更明显易懂,下文特举数较佳实施例,并配合附图,作详细说明如下。
附图说明
图1为依据本发明的网络通信装置的数据块图;
图2为依据本发明的远程语音检测模块的数据块图;
图3为依据本发明的远程信道控制模块的数据块图;
图4为依据本发明的近端语音检测模块的数据块图;以及
图5为依据本发明具有阵列麦克风的网络通信装置500的数据块图。
附图符号说明
100-网络通信装置;
130-麦克风模块;
132-模/数转换器;
134-声学回声消除模块;
136-噪音抑制模块;
138-自动增益控制模块;
106-近端语音检测模块;
110-数据传输接口;
112-远程回声消除模块;
114-远程噪音抑制模块;
104-远程信道控制模块;
102-远程语音检测模块;
116-远程自动增益控制模块;
118-数字至模拟转换器;
120-功率放大器;
108-计算机;
200-远程语音检测模块;
202-短期平均功率测量模块;
204-长期平均功率测量模块;
206-噪音估测模块;
208、210-比较器;
212-检测模块;
214-谐波检测模块;
300-远程信道控制模块;
302-检测频率模块;
304-语音时期控制模块;
306-衰减控制模块;
400-近端语音检测模块;
402-比较器;
404-音高检测模块;
406-转换模块;
408-检测模块;
500-网络通信装置;
532、533-模/数转换器;
535-波束形成模块;
534-声学回声消除模块;
536-噪音抑制模块;
538-自动增益控制模块;
506-近端语音检测模块;
510-数据传输接口;
512-远程回声消除模块;
514-远程噪音抑制模块;
504-远程信道控制模块;
502-远程语音检测模块;
516-远程自动增益控制模块;
518-数字至模拟转换器;
520-功率放大器;
508-计算机。
具体实施方式
图1为依据本发明的网络通信装置100的数据块图。网络通信装置100连接至一个人计算机108,该个人计算机108又连接至一网络。网络通信装置100可为实体的网络话机或个人计算机108的网络通信软件模块。网络通信装置100转换一近端使用者的语音为一声音信号并将声音信号通过网络传送至远程的另一网络通信装置。网络通信装置100亦通过网络接收来自远程的另一网络通信装置所传送的声音信号,并将该远程声音信号播放,使近端使用者能听见该远程声音信号。如此则在网络两端的使用者可通过网络进行会话。在多方会谈的情形下,可有多个远程的网络通信装置同时与网络通信装置100进行联系。
网络通信装置100通过数据传输接口110连接至个人计算机108。数据传输接口110可为USB接口或模拟音频接口,当网络通信装置100为软件时数据传输接口110则是一软件应用程序接口。当网络通信装置100自网络接收到远程传送的远程声音信号时,远程声音信号在被扬声器122播放前会先经由网络通信装置100的远程信号处理通路进行一连串的处理。远程信号处理通路显示于图1的下半部,包括远程回声消除(Line Echo Cancellation)模块112、远程噪音抑制(Line-in Noise Suppression)模块114、远程语音检测(Line-in Speech Detection)模块102、远程信道控制(Line-in ChannelControl)模块104、远程自动增益控制(Line-in Automatic Gain Control)模块116、数字至模拟转换器118、以及功率放大器(Power Amplifier)120。
远程回声消除模块112自远程声音信号移除网络或传输线造成的回声。远程噪音抑制模块114移除远程声音信号所包含的一部分静态噪音。由于衰减静态噪音时亦会对远程声音信号本身造成衰减,因此只有一部分噪音被远程噪音抑制模块114所移除。因此,本发明增加了两个模块至网络通信装置100,即远程语音检测模块102与远程信道控制模块104,以消除远程声音信号所包含的非静态噪音及远程噪音抑制模块114未能移除的静态噪音。
远程语音检测模块102首先检测是否远程声音信号包含语音。若远程声音信号包含语音,则远程语音检测模块102产生值为1的远程语音检测结果。若远程声音信号不包含语音,则远程语音检测模块102产生值为0的远程语音检测结果。接着,远程语音检测结果被送至远程信道控制模块104。若远程语音检测结果显示远程声音信号不包含语音,则远程信道控制模块104对远程声音信号进行衰减。举例来说,远程信道控制模块104可直接抹除(mute)该远程声音信号。这样一来,包含非静态噪音的所有噪音接自远程声音信号中被移除。远程自动增益控制模块116接着将远程声音信号的信号功率调整至预设的水平。在远程声音信号进一步由数字至模拟转换器118转换为模拟信号并由功率放大器120放大后,扬声器122播放远程声音信号,近端使用者便可以听见来自网络另一方的远程声音信号。
另一方面,网络通信装置100的麦克风130亦自近端使用者接收一近端声音信号。在近端声音信号被由数据传输接口110传送至网络前,近端声音信号先由网络通信装置100的近端信号处理通路进行处理。近端信号处理通路显示于图1的上方,包括模/数转换器132、声学回声消除(Acoustic EchoCancellation)模块134、噪音抑制(Noise Suppression)模块136、近端语音检测(Mic Speech Detection)模块106、以及自动增益控制(Automatic GainControl)模块138。本发明将近端语音检测模块106加入网络通信装置100,以消除近端声音信号包含的噪音,包含非静态噪音。与远程语音检测模块102类似,近端语音检测模块106检测是否近端声音信号包含语音,以产生一近端语音检测结果。若近端语音检测结果显示该近端声音信号不包含语音,则自动增益控制模块138不对该近端声音信号进行放大,以防止该近端声音信号所包含的噪音被放大。因此,近端声音信号所包含的剩余噪音及非静态噪音在传输前不会被放大。
图2为依据本发明的远程语音检测模块200的数据块图。远程语音检测模块200包括短期平均功率测量(Short-term Power Calculation)模块202、长期平均功率测量模块(Long-term Power Calculation)204、噪音估测(NoiseEstimate)模块206、比较器208及210、检测模块212、以及谐波检测(Harmonics Detection)模块214。短期平均功率测量模块202测量远程声音信号L(n)的短期平均功率Ps(n)。长期平均功率测量模块204测量远程声音信号L(n)的长期平均功率P1(n)。短期平均功率Ps(n)与长期平均功率P1(n)分别藉由下列各式决定:
Ps(n)=αs·Ps(n-1)+(1-αs)·L(n)·L(n);以及    (1)
Pl(n)=αl·Pl(n-1)+(1-αl)·L(n)·L(n);        (2)
其中L(n)为远程声音信号,αs为预定的短期平滑化参数,α1为预定的长期平滑化参数,n为该远程声音信号的样本序号。(1-α1)至少较(1-αs)小10倍,以便使短期平均功率Ps(n)较长期平均功率P1(n)有较快的更新速度。
噪音估测模块206由远程声音信号的噪音估测值N(m)导出远程声音信号的噪音功率估测值Pn(n)。噪音估测模块206由图1的远程噪音抑制模块114取得频域噪音估测值N(m)。噪音估测模块206接着依据下式由频域噪音估测值N(m)导出噪音功率估测值Pn(n):
Q ( k ) = 1 M Σ m = 1 M N ( m ) · N ( m ) ; 以及                      (3)
Pn(n)=Q([2n/M]);    (4)
其中,函数[x]表示最接近x的整数值,k为帧序号,M为频域处理的帧长度。
当短期平均功率Ps(n)、长期平均功率P1(n)、及噪音功率估测值Pn(n)均决定后,该等数值被送至比较器208与210。比较器208将短期平均功率Ps(n)与长期平均功率P1(n)间的差距与一第一阈值T1(n)进行比较,以产生一第一比较结果C1(n)。比较器210将长期平均功率P1(n)与噪音功率估测值Pn(n)间的差距与一第二阈值T2(n)进行比较,以产生一第二比较结果C2(n)。第一比较结果C1(n)与第二比较结果C2(n)分别依据下列诸式得到:
C 1 ( n ) = 0 , | log P s ( n ) - log P l ( n ) | ≤ T 1 ( n ) 1 , | log P s ( n ) - log P l ( n ) | > T 1 ( n ) ; 以及    (5)
<math><mrow> <msub> <mi>C</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mn>0</mn> <mo>,</mo> </mtd> <mtd> <mo>|</mo> <mi>log</mi> <msub> <mi>P</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>log</mi> <msub> <mi>P</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>&amp;le;</mo> <msub> <mi>T</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> <mo>,</mo> </mtd> <mtd> <mo>|</mo> <mi>log</mi> <msub> <mi>P</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>log</mi> <msub> <mi>P</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>></mo> <msub> <mi>T</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow></math>
其中,|x|表示x的绝对值,而log(x)表示x以10为底的对数值。
若第一比较结果C1(n)表示短期平均功率Ps(n)远大于长期平均功率P1(n),且第二比较结果C2(n)表示长期平均功率P1(n)远大于噪音功率估测值Pn(n),则第一比较结果C1(n)与第二比较结果C2(n)皆为真。如此则检测模块212使能一检测输出值D(n),以便驱动谐波检测模块214。检测模块212依据下式决定检测输出值D(n):
D ( n ) = 1 , C 1 ( n ) = 1 and C 2 ( n ) = 1 0 , C 1 ( n ) = 0 or C 2 ( n ) = 0 . - - - ( 7 )
当检测输出值D(n)为真时,谐波检测模块214对远程声音信号L(n)进行谐波分析(harmonics analysis),以检测是否远程声音信号包含语音成分。若远程声音信号包含语音成分,则谐波检测模块214产生值为1的远程语音检测结果S(n),以表示远程声音信号包含语音成分。因此,图1的远程信道控制模块104可依据远程语音检测结果S(n)而决定是否抹除远程声音信号L(n)。此外,谐波检测模块214对远程声音信号L(n)进行谐波分析的详细方法,可参阅E.Fisher等的文献:“Generalized likelihood ratio test forvoiced-unvoiced decision in noisy speech using the harmonic model”,IEEE Trans.On Audio,Speech and Language Processing,Vol.14,No.2,March 2006,或是J.Tabrikian的文献:“Tracking speech in a noisyenvironment using the harmonic model”,IEEE Trans.Speech and AudioProcessing,Vol.12,No.1,Jan.2004。
图3为依据本发明的远程信道控制模块300的数据块图。远程信道控制模块300包括检测频率(Detection Frequency)模块302、语音时期控制(Speech Period Control)模块304、以及衰减控制(Attenuation Control)模块306。检测频率模块302接收一语音时期信号G(n)。假设语音时期信号G(n)全为真的时段为「语音时期」,则检测频率模块302于语音时期中计数该远程语音检测结果S(n)为真的频率,以决定一检测频率V(n)。检测频率模块302藉由下式决定检测频率V(n):
V ( n ) = 1 , S ( n ) = 1 , or [ G ( n ) = 1 andV ( n - i ) = 0 , anyi &Element; 1 , . . . , B ] 2 , S ( n ) = 1 , or [ G ( n ) = 1 andV ( n - i ) = 1 , i = 1 , . . . , B ] 0 , Others . - - - ( 8 )
语音时期控制模块304接着依据检测频率V(n)及远程语音检测结果S(n)产生语音时期信号G(n),以控制该远程声音信号的衰减。若检测频率V(n)大于一频率阈值B时,语音时期控制模块304延长语音时期信号G(n)的语音时期。反之,若检测频率V(n)小于该频率阈值B时,则语音时期控制模块304缩短语音时期信号G(n)的语音时期。接着,衰减控制模块306依据语音时期信号G(n)抹除远程声音信号。经过语音时期控制模块304调整语音时期信号G(n)为真的时段长短后,两网络通信装置间的通话便不会频繁地被衰减控制模块306抹除,而使扬声器播放的声音信号变的断断续续或出现尖锐的声音。
语音时期信号G(n)经由下列各式所决定:
H ( n ) = K / J , S ( n ) = 1 , V ( n - i ) = 1 , i < B K , S ( n ) = 1 , V ( n - i ) = 1 , i = 1 , . . . , B max [ H ( n ) - 1,0 ] , Others ; - - - ( 9 )
Y ( n ) = 1 , H ( n ) > 0 0 , Others ; 以及    (10)
G ( n ) = 1 , Y ( n ) = 1 0 , Others . - - - ( 11 )
图4为依据本发明的近端语音检测模块400的数据块图。近端语音检测模块400包括比较器402、音高检测(Pitch Detection)模块404、转换模块406、以及检测模块408。转换模块406将表示远程声音信号是否包含语音的远程检测信号Vf(n)自时域转换至频域,以得到频域的远程检测信号Vf(m)。因此,若远程检测信号Vf(m)为真,则表示目前正有通话在进行,因而此时近端声音信号包含语音的机率较大。频域的远程检测信号Vf(m)经由下式得到:
V f ( m ) = 1 , V f [ ( m - 1 ) &CenterDot; M ] = 1 and V f ( m &CenterDot; M - 1 ) = 1 0 , Others ; - - - ( 12 )
其中,m为帧序号,而M为为频域处理的帧长度。
比较器402接着决定是否近端声音信号的功率Pf(m)与近端声音信号的一静态噪音(stationary noise)估测值Pn(m)之间的差距大于一第三阈值Tx(m)以得到一第三比较结果Cf(m)。若第三比较结果Cf(m)为真,表示近端声音信号的功率Pf(m)远大于静态噪音(stationary noise)估测值Pn(m),则近端声音信号很可能包含了语音成分。此时第三比较结果可驱动音高检测模块404,使音高检测模块404对近端声音信号进行音高检测(pitch detection)以产生一音高检测信号Dx(m)。若因高检测信号为真,则可确定近端声音信号包含语音成分。至于音高检测模块404对近端声音信号进行音高检测的详细方法,可参阅D.Huang等的文献:“Speech pitch detection in noisy environmentusing multi-rate adaptive lossless FIR filters”,ISCAS’04,22-26May 2004,或是L.Hui等的文献:“A Pitch Detection Algorithm Based onAMDF and ACF”,ICASSP’06,14-19 May 2006。
若音高检测信号Dx(m)与远程检测信号Vf(m)皆为真时,表示网络两端的网络通信装置正在进行交谈,因此检测模块408使能近端语音检测结果Sx(n)。接着,图1的自动增益模块138可依据近端语音检测结果Sx(n)而放大近端声音信号X(m)。检测模块408依据下式决定近端语音检测结果Sx(n):
S x ( m ) = 1 , V f ( m ) = 1 and D x ( m ) = 1 0 , Others ; 以及    (13)
Sx(n)=Sx(m·M)  for
Figure S2007101679147D00092
(14)
其中,Sx(m)为频域的近端语音检测结果,而Sx(n)为时域的近端语音检测结果,函数[x]表示最接近x的整数值。
图5为依据本发明具有阵列麦克风(array microphone)的网络通信装置500的数据块图。除了增加阵列麦克风模块及波束形成(beam forming)模块535之外,网络通信装置500大致类似于图1的网络通信装置100。阵列麦克风模块包含两个麦克风530及531,分别在不同位置接收近端使用者发出的声波并将其分别转换为近端声音信号。波束形成模块535可依据麦克风530及531产生的近端声音信号间的差异而产生波束内(in-beam)及波束外(out-of-beam)信息I,以抑制波束外的噪音,并让近端语音检测模块506产生更精确的近端语音检测结果Sx。因此,增加了阵列麦克风及波束形成模块535的网络通信装置500对近端噪音消除的效能较图1的网络通信装置100更佳。
本发明提供了一种消除网络通信装置的噪音的方法。本发明新增了远程语音检测模块,以检测远程声音信号是否包含语音成分,若远程声音信号不包含语音成分,再由远程信道控制模块衰减不包含语音的远程声音信号。本发明亦新增了近端语音检测模块,以检测近端声音信号是否包含语音成分,若近端声音信号不包含语音成分,自动增益控制模块便不对不包含语音的近端声音信号进行放大。如此则远程及近端声音信号所包含的噪音,包括非静态噪音,皆被有效率地移除,因而增进网络通信装置的效能。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明,任何熟习此项技术者,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,因此本发明的保护范围当视本发明的申请专利范围所界定者为准。

Claims (24)

1.一种网络通信装置,播放经由网络接收的一远程声音信号,并经由该网络传送一近端声音信号至远程,包括:
一远程语音检测模块,检测是否该远程声音信号包含语音,以产生一远程语音检测结果;以及
一远程信道控制模块,耦接至该远程语音检测模块,若该远程语音检测结果显示该远程声音信号不包含语音,则衰减该远程声音信号,以减少该远程声音信号所包含的噪音。
2.如权利要求1所述的网络通信装置,其中,该网络通信装置还包括:
一近端语音检测模块,检测是否该近端声音信号包含语音,以产生一近端语音检测结果;以及
一自动增益控制模块,耦接至该近端语音检测模块,若该近端语音检测结果显示该近端声音信号包含语音,则放大该近端声音信号,以防止该近端声音信号所包含的噪音被放大。
3.如权利要求1所述的网络通信装置,其中,该远程语音检测模块更包括:
一短期平均功率测量模块,测量该远程声音信号的短期平均功率;
一长期平均功率测量模块,测量该远程声音信号的长期平均功率;
一噪音估测模块,取得该远程声音信号的噪音功率估测值;
一第一比较器,耦接至该短期平均功率测量模块及该长期平均功率测量模块,产生表示是否该短期平均功率与该长期平均功率间的差距大于一第一阈值的一第一比较结果;
一第二比较器,耦接至该长期平均功率测量模块及该噪音估测模块,产生表示是否该长期平均功率与该噪音功率估测值间的差距大于一第二阈值的一第二比较结果;
一检测模块,耦接至该第一比较器及该第二比较器,产生表示是否该第一比较结果及该第二比较结果均为真的一检测输出值;以及
一谐波检测模块,耦接至该检测模块,当该检测输出值为真时,对该远程声音信号进行谐波分析,以产生表示是否该远程声音信号包含语音成分的该远程语音检测结果。
4.如权利要求3所述的网络通信装置,其中,该短期平均功率测量模块依据下式测量该远程声音信号的短期平均功率:
Ps(n)=αs·Ps(n-1)+(1-αs)·L(n)·L(n);
其中,L(n)为该远程声音信号,Ps(n)为该短期平均功率,αs为预定的一短期平滑化参数,n为该远程声音信号的样本序号;和
该长期平均功率测量模块依据下式测量该远程声音信号的长期平均功率:
Pl(n)=αl·Pl(n-1)+(1-αl)·L(n)·L(n);
其中,L(n)为该远程声音信号,P1(n)为该长期平均功率,α1为预定的一长期平滑化参数,和(1-α1)至少较(1-αs)小10倍,n为该远程声音信号的样本序号。
5.如权利要求3所述的网络通信装置,其中,该噪音估测模块依据下式取得该远程声音信号的噪音功率估测值:
Q ( k ) = 1 M &Sigma; m = 1 M N ( m ) &CenterDot; N ( m ) ; 以及
Pn(n)=Q([2n/M]);
其中,Pn(n)为该噪音功率估测值,N(m)为一频域噪声估测值,函数[x]表示最接近x的整数值,k为帧序号,M为频域处理的帧长度。
6.如权利要求3所述的网络通信装置,其中,该第一比较器依据下式产生该第一比较结果:
C 1 ( n ) = 0 , | log P s ( n ) - log P l ( n ) | &le; T 1 ( n ) 1 , | log P s ( n ) - log P l ( n ) | > T 1 ( n ) ;
其中,C1(n)为该第一比较结果,Ps(n)为该短期平均功率,P1(n)为该长期平均功率,T1(n)为该第一阈值;和
该第二比较器依据下式产生该第二比较结果:
C 2 ( n ) = 0 , | log P l ( n ) - log P n ( n ) | &le; T 2 ( n ) 1 , | log P l ( n ) - log P n ( n ) | > T 2 ( n ) ;
其中,C2(n)为该第二比较结果,P1(n)为该长期平均功率,Pn(n)为该噪音功率估测值,T2(n)为该第二阈值;
且该检测模块依据下式产生该检测输出值:
D ( n ) = 1 , C 1 ( n ) = 1 and C 2 ( n ) = 1 0 , C 1 ( n ) = 0 or C 2 ( n ) = 0 ;
其中,D(n)为该检测输出值,C1(n)为该第一比较结果,C2(n)为该第二比较结果。
7.如权利要求1所述的网络通信装置,其中,该远程信道控制模块包括:
一检测频率模块,在一语音时期信号的语音时期中计数该远程语音检测结果为真的频率以决定一检测频率,其中,该语音时期表示在该时期中该语音时期信号为真;
一语音时期控制模块,耦接至该检测频率模块,产生该语音时期信号以控制该远程声音信号的衰减,在该检测频率大于一频率阈值时延长该语音时期信号的语音时期,并在该检测频率小于该频率阈值时缩短该语音时期信号的语音时期;以及
一衰减控制模块,耦接至该检测频率模块及该语音时期控制模块,依据该语音时期信号抹除该远程声音信号。
8.如权利要求7所述的网络通信装置,其中,该检测频率模块依据下式决定该检测频率:
V ( n ) = 1 , S ( n ) = 1 , or [ G ( n ) = 1 andV ( n - i ) = 0 , anyi &Element; 1 , . . . , B ] 2 , S ( n ) = 1 , or [ G ( n ) = 1 andV ( n - i ) = 1 , i = 1 , . . . , B ] 0 , Others ;
其中,V(n)为该检测频率,n为样本序号,S(n)为该远程语音检测结果,G(n)为该语音时期信号;和
该语音时期控制模块依据下式产生该语音时期信号:
H ( n ) = K / J , S ( n ) = 1 , V ( n - i ) = 1 , i < B K , S ( n ) = 1 , V ( n - i ) = 1 , i = 1 , . . . , B max [ H ( n ) - 1,0 ] , Others ;
Y ( n ) = 1 , H ( n ) > 0 0 , Others ; 以及
G ( n ) = 1 , Y ( n ) = 1 0 , Others ;
其中,G(n)为该语音时期信号,n为样本序号,V(n)为该检测频率,S(n)为该远程语音检测结果,而B为该频率阈值。
9.如权利要求2所述的网络通信装置,其中,该近端语音检测模块包括:
一第三比较器,决定是否该近端声音信号的功率与该近端声音信号的一静态噪音估测值之间的差距大于一第三阈值,以得到一第三比较结果;
一音高检测模块,耦接至该第三比较器,当被该第三比较结果驱动时,对该近端声音信号进行音高检测以产生一音高检测信号;
一转换模块,将表示该远程声音信号包含语音的一远程检测信号自时域转换至频域;以及
一检测模块,耦接至该音高检测模块及该转换模块,若该音高检测信号与该远程检测信号皆为真时使能该近端语音检测结果。
10.如权利要求9所述的网络通信装置,其中,该转换模块依据下式转换该远程检测信号:
V f ( m ) = 1 , V f [ ( m - 1 ) &CenterDot; M ] = 1 and V f ( m &CenterDot; M - 1 ) = 1 0 , Others ;
其中,Vf(m)为频域的该远程检测信号,m为帧序号,而M为为频域处理的帧长度。
11.如权利要求9所述的网络通信装置,其中,该检测模块依据下式产生该近端语音检测结果:
S x ( m ) = 1 , V f ( m ) = 1 and D x ( m ) = 1 0 , Others ;
Sx(n)=Sx(m·M)  for
Figure S2007101679147C00043
其中,Sx(m)为频域的该近端语音检测结果,Sx(n)为时域的该近端语音检测结果,Vf(m)为该远程检测信号,Dx(m)为该音高检测信号,函数[x]表示最接近x的整数值,m为帧序号,n为样本序号,M为频域处理的帧长度。
12.如权利要求2所述的网络通信装置,其中,该网络通信装置还包括一阵列麦克风及一波束形成模块以产生该近端声音信号,该波束形成模块提供该近端声音信号的波束内及波束外信息,以供该近端语音检测模块产生更精确的该近端语音检测结果。
13.一种消除网络通信装置的噪音的方法,该网络通信装置播放经由网络接收的一远程声音信号,并经由该网络传送一近端声音信号至远程,该方法包括下列步骤:
检测是否该远程声音信号包含语音,以产生一远程语音检测结果;以及
若该远程语音检测结果显示该远程声音信号不包含语音,则衰减该远程声音信号,以减少该远程声音信号所包含的噪音。
14.如权利要求13所述的消除网络通信装置的噪音的方法,其中,该方法还包括下列步骤:
检测是否该近端声音信号包含语音,以产生一近端语音检测结果;以及
若该近端语音检测结果显示该近端声音信号包含语音,则放大该近端声音信号,以防止该近端声音信号所包含的噪音被放大。
15.如权利要求13所述的消除网络通信装置的噪音的方法,其中,该远程语音检测结果的产生包括下列步骤:
测量该远程声音信号的短期平均功率;
测量该远程声音信号的长期平均功率;
取得该远程声音信号的噪音功率估测值;
产生表示是否该短期平均功率与该长期平均功率间的差距大于一第一阈值的一第一比较结果;
产生表示是否该长期平均功率与该噪音功率估测值间的差距大于一第二阈值的一第二比较结果;
产生表示是否该第一比较结果及该第二比较结果均为真的一检测输出值;以及
当该检测输出值为真时,对该远程声音信号进行谐波分析,以产生表示是否该远程声音信号包含语音成分的该远程语音检测结果。
16.如权利要求15所述的消除网络通信装置的噪音的方法,其中,该短期平均功率依据下式进行测量:
Ps(n)=αs·Ps(n-1)+(1-αs)·L(n)·L(n);
其中,L(n)为该远程声音信号,Ps(n)为该短期平均功率,αs为预定的一短期平滑化参数,n为该远程声音信号的样本序号;和
该长期平均功率依据下式进行测量:
Pl(n)=αl·Pl(n-1)+(1-αl)·L(n)·L(n);
其中,L(n)为该远程声音信号,P1(n)为该长期平均功率,α1为预定的一长期平滑化参数,且(1-α1)至少较(1-αs)小10倍,n为该远程声音信号的样本序号。
17.如权利要求15所述的消除网络通信装置的噪音的方法,其中,该噪音功率估测值依据下式得到:
Q ( k ) = 1 M &Sigma; m = 1 M N ( m ) &CenterDot; N ( m ) ; 以及
Pn(n)=Q([2n/M]);
其中,Pn(n)为该噪音功率估测值,N(m)为一频域噪声估测值,函数[x]表示最接近x的整数值,k为帧序号,M为频域处理的帧长度。
18.如权利要求15所述的消除网络通信装置的噪音的方法,其中,该第一比较结果依据下式产生:
C 1 ( n ) = 0 , | log P s ( n ) - log P l ( n ) | &le; T 1 ( n ) 1 , | log P s ( n ) - log P l ( n ) | > T 1 ( n ) ;
其中,C1(n)为该第一比较结果,Ps(n)为该短期平均功率,P1(n)为该长期平均功率,T1(n)为该第一阈值;和
该第二比较结果依据下式产生:
C 2 ( n ) = 0 , | log P l ( n ) - log P n ( n ) | &le; T 2 ( n ) 1 , | log P l ( n ) - log P n ( n ) | > T 2 ( n ) ;
其中,C2(n)为该第二比较结果,P1(n)为该长期平均功率,Pn(n)为该噪音功率估测值,T2(n)为该第二阈值;和
该检测输出值依据下式产生:
D ( n ) = 1 , C 1 ( n ) = 1 and C 2 ( n ) = 1 0 , C 1 ( n ) = 0 or C 2 ( n ) = 0 ;
其中,D(n)为该检测输出值,C1(n)为该第一比较结果,C2(n)为该第二比较结果。
19.如权利要求13所述的消除网络通信装置的噪音的方法,其中,该远程声音信号的衰减包括下列步骤:
在一语音时期信号的语音时期中计数该远程语音检测结果为真的频率以决定一检测频率,其中,该语音时期表示在该时期中该语音时期信号为真;
当该检测频率大于一频率阈值时延长该语音时期信号的语音时期;
当该检测频率小于该频率阈值时缩短该语音时期信号的语音时期;以及
依据该语音时期信号抹除该远程声音信号。
20.如权利要求19所述的消除网络通信装置的噪音的方法,其中,该检测频率依据下式决定:
V ( n ) = 1 , S ( n ) = 1 , or [ G ( n ) = 1 andV ( n - i ) = 0 , anyi &Element; 1 , . . . , B ] 2 , S ( n ) = 1 , or [ G ( n ) = 1 andV ( n - i ) = 1 , i = 1 , . . . , B ] 0 , Others ;
其中,V(n)为该检测频率,n为样本序号,S(n)为该远程语音检测结果,G(n)为该语音时期信号;和
该语音时期信号依据下式延长或缩短其语音时期:
H ( n ) = K / J , S ( n ) = 1 , V ( n - i ) = 1 , i < B K , S ( n ) = 1 , V ( n - i ) = 1 , i = 1 , . . . , B max [ H ( n ) - 1,0 ] , Others ;
Y ( n ) = 1 , H ( n ) > 0 0 , Others ; 以及
G ( n ) = 1 , Y ( n ) = 1 0 , Others ;
其中,G(n)为该语音时期信号,n为样本序号,V(n)为该检测频率,S(n)为该远程语音检测结果,而B为该频率阈值。
21.如权利要求14所述的消除网络通信装置的噪音的方法,其中,该近端语音检测结果的产生包括下列步骤:
决定是否该近端声音信号的功率与该近端声音信号的一静态噪音估测值之间的差距大于一第三阈值,以得到一第三比较结果;
当该第三比较结果为真时,对该近端声音信号进行音高检测以产生一音高检测信号;
将表示该远程声音信号包含语音的一远程检测信号自时域转换至频域;以及
若该音高检测信号与该远程检测信号皆为真时使能该近端语音检测结果。
22.如权利要求21所述的消除网络通信装置的噪音的方法,其中,该远程检测信号依据下式转换:
V f ( m ) = 1 , V f [ ( m - 1 ) &CenterDot; M ] = 1 and V f ( m &CenterDot; M - 1 ) = 1 0 , Others ;
其中,Vf(m)为频域的该远程检测信号,m为帧序号,而M为频域处理的帧长度。
23.如权利要求21所述的消除网络通信装置的噪音的方法,其中,该近端语音检测结果依据下式产生:
S x ( m ) = 1 , V f ( m ) = 1 and D x ( m ) = 1 0 , Others ;
Sx(n)=Sx(m·M)  for
Figure S2007101679147C00076
其中,Sx(m)为频域的该近端语音检测结果,Sx(n)为时域的该近端语音检测结果,Vf(m)为该远程检测信号,Dx(m)为该音高检测信号,函数[x]表示最接近x的整数值,m为帧序号,n为样本序号,M为频域处理的帧长度。
24.如权利要求14所述的消除网络通信装置的噪音的方法,其中,该网络通信装置更包括一阵列麦克风及一波束形成模块以产生该近端声音信号,该波束形成模块提供该近端声音信号的波束内及波束外信息,以产生更精确的该近端语音检测结果。
CNA2007101679147A 2006-12-15 2007-10-26 网络通信装置及消除网络通信装置的噪音的方法 Pending CN101207663A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/611,185 US7945442B2 (en) 2006-12-15 2006-12-15 Internet communication device and method for controlling noise thereof
US11/611,185 2006-12-15

Publications (1)

Publication Number Publication Date
CN101207663A true CN101207663A (zh) 2008-06-25

Family

ID=39528604

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101679147A Pending CN101207663A (zh) 2006-12-15 2007-10-26 网络通信装置及消除网络通信装置的噪音的方法

Country Status (3)

Country Link
US (1) US7945442B2 (zh)
CN (1) CN101207663A (zh)
TW (1) TWI346935B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957819A (zh) * 2011-09-30 2013-03-06 斯凯普公司 处理音频信号
US8824693B2 (en) 2011-09-30 2014-09-02 Skype Processing audio signals
US8891785B2 (en) 2011-09-30 2014-11-18 Skype Processing signals
US8981994B2 (en) 2011-09-30 2015-03-17 Skype Processing signals
US9031257B2 (en) 2011-09-30 2015-05-12 Skype Processing signals
US9042575B2 (en) 2011-12-08 2015-05-26 Skype Processing audio signals
US9042573B2 (en) 2011-09-30 2015-05-26 Skype Processing signals
US9042574B2 (en) 2011-09-30 2015-05-26 Skype Processing audio signals
US9111543B2 (en) 2011-11-25 2015-08-18 Skype Processing signals
US9210504B2 (en) 2011-11-18 2015-12-08 Skype Processing audio signals
US9269367B2 (en) 2011-07-05 2016-02-23 Skype Limited Processing audio signals during a communication event
CN105427868A (zh) * 2015-10-30 2016-03-23 杭州乐哈思智能科技有限公司 一种对voip***双向双工免提语音进行噪音消除的方法
CN111110977A (zh) * 2014-04-16 2020-05-08 费雪派克医疗保健有限公司 用于给患者递送气体的方法和***

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8369511B2 (en) * 2006-12-26 2013-02-05 Huawei Technologies Co., Ltd. Robust method of echo suppressor
CN101608947B (zh) * 2008-06-19 2012-05-16 鸿富锦精密工业(深圳)有限公司 声音测试方法
TWI450268B (zh) * 2008-07-04 2014-08-21 Hon Hai Prec Ind Co Ltd 聲音測試方法
TWI413112B (zh) * 2010-09-06 2013-10-21 Byd Co Ltd Method and apparatus for eliminating noise background noise (1)
US9008302B2 (en) 2010-10-08 2015-04-14 Optical Fusion, Inc. Audio acoustic echo cancellation for video conferencing
FR2976710B1 (fr) * 2011-06-20 2013-07-05 Parrot Procede de debruitage pour equipement audio multi-microphones, notamment pour un systeme de telephonie "mains libres"
TWI492622B (zh) * 2011-08-31 2015-07-11 Realtek Semiconductor Corp 網路訊號接收系統與網路訊號接收方法
GB2547459B (en) * 2016-02-19 2019-01-09 Imagination Tech Ltd Dynamic gain controller
CN109918298B (zh) * 2019-02-25 2022-04-01 深圳米唐科技有限公司 智能语音前端麦克风调试方法、装置、***及介质
CN116405836B (zh) * 2023-06-08 2023-09-08 安徽声讯信息技术有限公司 一种基于互联网的麦克风调音方法及***

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0678046A (ja) * 1992-08-25 1994-03-18 Fujitsu Ltd ハンズフリー・システムで用いられる音声スイッチ
US7089181B2 (en) * 2001-05-30 2006-08-08 Intel Corporation Enhancing the intelligibility of received speech in a noisy environment
WO2002029780A2 (en) * 2000-10-04 2002-04-11 Clarity, Llc Speech detection with source separation
US7171357B2 (en) * 2001-03-21 2007-01-30 Avaya Technology Corp. Voice-activity detection using energy ratios and periodicity
US7269252B2 (en) * 2003-08-06 2007-09-11 Polycom, Inc. Method and apparatus for improving nuisance signals in audio/video conference
US20070033030A1 (en) * 2005-07-19 2007-02-08 Oded Gottesman Techniques for measurement, adaptation, and setup of an audio communication system
US20070237339A1 (en) * 2006-04-11 2007-10-11 Alon Konchitsky Environmental noise reduction and cancellation for a voice over internet packets (VOIP) communication device
US8019089B2 (en) * 2006-11-20 2011-09-13 Microsoft Corporation Removal of noise, corresponding to user input devices from an audio signal

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9269367B2 (en) 2011-07-05 2016-02-23 Skype Limited Processing audio signals during a communication event
US8824693B2 (en) 2011-09-30 2014-09-02 Skype Processing audio signals
US8891785B2 (en) 2011-09-30 2014-11-18 Skype Processing signals
CN102957819B (zh) * 2011-09-30 2015-01-28 斯凯普公司 处理音频信号的方法及其设备
US8981994B2 (en) 2011-09-30 2015-03-17 Skype Processing signals
US9031257B2 (en) 2011-09-30 2015-05-12 Skype Processing signals
US9042573B2 (en) 2011-09-30 2015-05-26 Skype Processing signals
US9042574B2 (en) 2011-09-30 2015-05-26 Skype Processing audio signals
CN102957819A (zh) * 2011-09-30 2013-03-06 斯凯普公司 处理音频信号
US9210504B2 (en) 2011-11-18 2015-12-08 Skype Processing audio signals
US9111543B2 (en) 2011-11-25 2015-08-18 Skype Processing signals
US9042575B2 (en) 2011-12-08 2015-05-26 Skype Processing audio signals
CN111110977A (zh) * 2014-04-16 2020-05-08 费雪派克医疗保健有限公司 用于给患者递送气体的方法和***
CN105427868A (zh) * 2015-10-30 2016-03-23 杭州乐哈思智能科技有限公司 一种对voip***双向双工免提语音进行噪音消除的方法

Also Published As

Publication number Publication date
US7945442B2 (en) 2011-05-17
TW200826065A (en) 2008-06-16
US20080147393A1 (en) 2008-06-19
TWI346935B (en) 2011-08-11

Similar Documents

Publication Publication Date Title
CN101207663A (zh) 网络通信装置及消除网络通信装置的噪音的方法
US6792107B2 (en) Double-talk detector suitable for a telephone-enabled PC
CN112071328B (zh) 音频降噪
KR101444100B1 (ko) 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
EP2444966B1 (en) Audio signal processing device and audio signal processing method
CN113766073B (zh) 会议***中的啸叫检测
CN105118522B (zh) 噪声检测方法及装置
US5390244A (en) Method and apparatus for periodic signal detection
CN112004177B (zh) 一种啸叫检测方法、麦克风音量调节方法及存储介质
CN104052526A (zh) 用于声学回声抵消器的基于倒谱距离的消波
CN110995951B (zh) 基于双端发声检测的回声消除方法、装置及***
Sakhnov et al. Approach for Energy-Based Voice Detector with Adaptive Scaling Factor.
US20020103636A1 (en) Frequency-domain post-filtering voice-activity detector
EP1913591B1 (en) Enhancement of speech intelligibility in a mobile communication device by controlling the operation of a vibrator in dependance of the background noise
WO2023040523A1 (zh) 音频信号的处理方法、装置、电子设备及存储介质
JP3507020B2 (ja) 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
CN110148421B (zh) 一种残余回声检测方法、终端和装置
Sakhnov et al. Dynamical energy-based speech/silence detector for speech enhancement applications
CN111989934A (zh) 回声消除装置、回声消除方法、信号处理芯片及电子设备
JP6942282B2 (ja) 補助信号を用いたオーディオデバイスの送信制御
CN111294474B (zh) 一种双端通话检测方法
CN116962583B (zh) 一种回声控制的方法、装置、设备、存储介质及程序产品
CN113299310B (zh) 声音信号处理方法、装置、电子设备及可读存储介质
Sukkar Echo detection and delay estimation using a pattern recogntion approach and cepstral correlation
CN116453497A (zh) 智能网络通讯的杂讯消减方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20080625