CN1979639B - 静音处理装置及方法 - Google Patents
静音处理装置及方法 Download PDFInfo
- Publication number
- CN1979639B CN1979639B CN2005101021006A CN200510102100A CN1979639B CN 1979639 B CN1979639 B CN 1979639B CN 2005101021006 A CN2005101021006 A CN 2005101021006A CN 200510102100 A CN200510102100 A CN 200510102100A CN 1979639 B CN1979639 B CN 1979639B
- Authority
- CN
- China
- Prior art keywords
- sampled signal
- time interval
- signal
- energy
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000030279 gene silencing Effects 0.000 title claims description 15
- 238000005070 sampling Methods 0.000 claims abstract description 10
- 238000003672 processing method Methods 0.000 claims description 8
- 230000006855 networking Effects 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种静音处理装置及方法,该方法包括步骤取样来自麦克风的信号;计算一时间间隔内取样信号的能量;获取该时间间隔内取样信号的最大振幅值;如果该时间间隔内取样信号的能量小于一预定能量值且该时间间隔内取样信号的最大振幅值小于一预定振幅值,发送静音帧标识该时间间隔内取样信号,否则,编码该时间间隔内取样信号;输出静音帧或编码信号。利用该装置及方法可在网络交谈过程中对交谈者语音进行正常编码,而对交谈者静音部分只标记为静音帧,从而减少网络数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
Description
【技术领域】
本发明是关于一种静音处理装置及方法,尤指一种用于网络交谈中的静音处理装置及方法。
【背景技术】
随着通信网络及业务的蓬勃发展,多方通话业务已成为公共交换电信网/综合业务数字网、分组语音网和移动网必备的补充业务,同时在上述网络中会议电话和会议电视业务应用也越来越广泛。基本的语音业务仅涉及两个通话方,通话双方可互相听到对方的声音,而在多方通话业务和会议业务中,同时通话方可能不止两方,其中任意一方的语音信号都应可以被传送至所有其他通话方,而每一通话方都应同时可听到多个其他通话方的声音。因此在多方通话中,语音质量是通话者所关注的一个重点。
而在通信服务中,语音对带宽十分敏感,为了保障语音的质量,必须尽量减少数据的传输。通常在通话交谈过程中,语音信号只占整个音频数据流的50%,而在视频会议或者视频聊天等VOIP(Voice OverIP,以IP网络为载体的语音传输技术)业务中,甚至会更低。
【发明内容】
因此把语音信号从音频数据流中提取出来,对于节约***资源是十分必要的。将语音信号从音频数据流中提取出来后,则只需保存、处理所述语音信号,而其他部分的数据(例如,静音)则可以忽略掉,从而降低了存储空间,同时减少了数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
基于上述内容,有必要提供一种静音处理装置,该静音处理装置可以在多人网络交谈过程中对交谈者发言的语音进行正常编码,而对交谈者的静音部分只标记为静音帧,从而减少网络上的数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
还有必要提供一种静音处理方法,该静音处理方法可以在多人网络交谈过程中对交谈者发言的语音进行正常编码,而对交谈者的静音部分只标记为静音帧,从而减少网络上的数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
所述静音处理装置,包括一取样单元,用于取样来自麦克风的信号;一能量计算单元,用于计算一时间间隔内取样信号的能量;一振幅值获取单元,用于获取该时间间隔内取样信号的最大振幅值;一编码单元,用于编码取样的信号;一处理单元,当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值时,发送静音帧标识该时间间隔内取样信号,否则,控制编码单元编码该时间间隔内取样信号;及一输出单元,用于输出静音帧或编码单元产生的编码信号。
该静音处理装置还包括一易失性存储单元用于存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量;一非易失性存储单元用于存储预定振幅值及预定能量值。
所述静音处理方法,其包括以下步骤:(a)取样来自麦克风的信号;(b)计算一时间间隔内取样信号的能量;(c)获取该时间间隔内取样信号的最大振幅值;(d)如果该时间间隔内取样信号的能量小于一预定能量且该时间间隔内取样信号的最大振幅值小于一预定振幅值,发送静音帧标识该时间间隔内取样信号,否则编码该时间间隔内取样信号;及(e)输出静音帧或编码信号。
该静音处理方法还包括步骤:提供一易失性存储单元及一非易失性存储单元,其中易失性存储单元存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量,非易失性存储单元存储预定振幅值及预定能量值。
相较于现有技术,该静音处理装置及方法可以在多人网络交谈过程中对交谈者发言的语音进行正常编码,而对交谈者的静音部分只标记为静音帧,从而减少网络上的数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
【附图说明】
图1是一实施方式中静音处理装置的硬件架构图。
图2是一实施方式中静音处理方法的流程图。
【具体实施方式】
如图1所示,是一实施方式中静音处理装置的硬件架构图。该静音处理装置包括一取样单元10、一能量计算单元11、一振幅值获取单元12、一编码单元13、一输出单元14、一处理单元15、一易失性存储单元16及一非易失性存储单元17。其中取样单元10,用于按一预定的频率,取样来在自麦克风的信号。能量计算单元11,用于计算一时间间隔内取样信号的能量,其中该时间间隔的长度可根据具体的应用情况而采用不同的时长。振幅值获取单元12,用于获取该时间间隔内取样信号的最大振幅值。编码单元13,用于编码时间间隔内取样信号。输出单元14,用于输出静音帧或编码单元13产生的编码信号。处理单元15,用于控制各单元的操作:当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值时,发送静音帧标识该时间间隔内取样信号,否则,控制编码单元13编码该时间间隔内取样信号。易失性存储单元16,用于存储取样的信号、时间间隔内取样的信号的最大振幅值及时间间隔内取样信号的能量。非易失性存储单元17,用于存储上述预定振幅值及预定能量值。
在本实施方式中,当一时间间隔内取样信号的最大振幅值大于等于预定振幅值且该时间间隔内取样信号的能量大于等于预定能量值时,表明该时间间隔内交谈者正处于发言阶段,编码单元13对该时间间隔内取样信号进行语音编码;当一时间间隔内取样信号的最大振幅值小于预定振幅值但该时间间隔内取样信号的能量大于等于预定能量值时或当一时间间隔内取样信号的最大振幅值大于等于预定振幅值但该时间间隔内取样信号的能量小于预定能量值时,表明该时间间隔内交谈者处于停顿但并未停止发言,编码单元13对该取样信号进行语音编码;当一时间间隔内取样信号的最大帧幅值小于预定振幅值且该时间间隔内取样信号的能量小于预定能量值时,表明该时间间隔内交谈者停止发言开始处于静音阶段,对该取样信号不进行语音编码,而只发送该静音帧,从而减少网络上数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
如图2所示,是一实施方式中静音处理方法的流程图。首先,取样单元10实时取样来自麦克风的信号(步骤S20)。能量计算单元11计算一时间间隔内取样信号的能量(步骤S21)。振幅值获取单元12获取该时间间隔内取样信号的最大振幅值(步骤S22)。处理单元15判断该时间间隔内取样信号的最大振幅值是否小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值(步骤S23)。
如果该时间间隔内取样信号的最大振幅值小于预定振幅值且该时间间隔内取样信号的能量小于预定能量值,发送静音帧标识该时间间隔内取样信号(步骤S24)。能量计算单元11计算下一个时间间隔内取样信号的能量,并返回执行步骤S22(步骤S25)。
否则,编码单元13编码该时间间隔内取样信号并通过输出单元14输出该编码信号(步骤S26)。能量计算单元11计算下一个时间间隔内取样信号的能量,并返回执行步骤S22(步骤S27)。
在上述流程中,当交谈者停止网络交谈时,整个流程终止。
Claims (5)
1. 一种静音处理装置,用于处理网络上多人交谈过程中产生的静音,其特征在于该装置包括:
一取样单元,用于取样来自麦克风的信号;
一能量计算单元,用于计算一时间间隔内取样信号的能量;
一振幅值获取单元,用于获取一时间间隔内取样信号的最大振幅值;
一编码单元,用于编码取样的信号;
一处理单元,当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量时,发送静音帧标识该时间间隔内的取样信号,否则,该处理单元控制编码单元编码该时间间隔内取样信号;及
一输出单元,用于输出静音帧或编码单元产生的编码信号。
2. 如权利要求1所述的静音处理装置,其特征在于,还包括一易失性存储单元,用于存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量。
3. 如权利要求2所述的静音处理装置,其特征在于,还包括一非易失性存储单元,用于存储所述预定振幅值及预定能量值。
4. 一种静音处理方法,用于处理网路上多人交谈过程中产生的静音,其特征在于该方法包括以下步骤:
取样来自麦克风的信号;
计算一时间间隔内取样信号的能量;
获取该时间间隔内取样信号的最大振幅值;
如果该时间间隔内取样信号的能量小于一预定能量且该时间间隔内取样信号的最大振幅值小于一预定振幅值,发送静音帧标识该时间间隔内取样信号,否则,编码该时间间隔内取样信号;及
输出静音帧或编码信号。
5. 如权利要求4所述的静音处理方法,其特在于,还包括步骤:
提供一易失性存储单元及一非易失性存储单元,其中易失性存储单元存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量,非易失性存储单元存储预定振幅值及预定能量值。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2005101021006A CN1979639B (zh) | 2005-12-03 | 2005-12-03 | 静音处理装置及方法 |
US11/309,521 US20070133589A1 (en) | 2005-12-03 | 2006-08-17 | Mute processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2005101021006A CN1979639B (zh) | 2005-12-03 | 2005-12-03 | 静音处理装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1979639A CN1979639A (zh) | 2007-06-13 |
CN1979639B true CN1979639B (zh) | 2011-07-27 |
Family
ID=38130775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005101021006A Expired - Fee Related CN1979639B (zh) | 2005-12-03 | 2005-12-03 | 静音处理装置及方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070133589A1 (zh) |
CN (1) | CN1979639B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1964408A (zh) * | 2005-11-12 | 2007-05-16 | 鸿富锦精密工业(深圳)有限公司 | 静音处理装置及方法 |
CN1980293A (zh) * | 2005-12-03 | 2007-06-13 | 鸿富锦精密工业(深圳)有限公司 | 静音处理装置及方法 |
CN106356068A (zh) * | 2016-11-02 | 2017-01-25 | 北京中星微电子有限公司 | 音频播放方法和装置 |
CN111295864B (zh) * | 2018-08-31 | 2022-04-05 | 华为技术有限公司 | 一种提高语音通话质量的方法、终端和*** |
CN113852893A (zh) * | 2020-06-28 | 2021-12-28 | 北京小米移动软件有限公司 | 数据处理方法及装置、终端和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1245376A (zh) * | 1998-08-17 | 2000-02-23 | 英业达股份有限公司 | 网络电话中的静音检测方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5978756A (en) * | 1996-03-28 | 1999-11-02 | Intel Corporation | Encoding audio signals using precomputed silence |
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
FR2758676A1 (fr) * | 1997-01-21 | 1998-07-24 | Philips Electronics Nv | Methode de reduction des clics dans un systeme de transmission de donnees |
US6172973B1 (en) * | 1997-09-17 | 2001-01-09 | Nortel Networks Limited | Apparatus and method for reducing delay for voice over ATM using co-located switches |
US6708023B1 (en) * | 2000-02-25 | 2004-03-16 | Motorola Inc. | Method and apparatus for noise suppression of received audio signal in a cellular telephone |
DE10101034A1 (de) * | 2001-01-11 | 2002-08-01 | Jumptec Ind Computertechnik Ag | Datenkommunikationssystem und Datenumwandlungsvorrichtung |
JP4280901B2 (ja) * | 2002-02-05 | 2009-06-17 | 株式会社セガ | 音声チャットシステム |
CN1964408A (zh) * | 2005-11-12 | 2007-05-16 | 鸿富锦精密工业(深圳)有限公司 | 静音处理装置及方法 |
CN1980293A (zh) * | 2005-12-03 | 2007-06-13 | 鸿富锦精密工业(深圳)有限公司 | 静音处理装置及方法 |
-
2005
- 2005-12-03 CN CN2005101021006A patent/CN1979639B/zh not_active Expired - Fee Related
-
2006
- 2006-08-17 US US11/309,521 patent/US20070133589A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1245376A (zh) * | 1998-08-17 | 2000-02-23 | 英业达股份有限公司 | 网络电话中的静音检测方法 |
Non-Patent Citations (1)
Title |
---|
陆珉,季晓勇.多媒体通讯***中的静音检测.通信技术.2001,(118),29. * |
Also Published As
Publication number | Publication date |
---|---|
US20070133589A1 (en) | 2007-06-14 |
CN1979639A (zh) | 2007-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1964408A (zh) | 静音处理装置及方法 | |
US7599834B2 (en) | Method and apparatus of voice mixing for conferencing amongst diverse networks | |
CN105304079B (zh) | 一种多方通话的多模式语音合成方法与***以及服务器 | |
CN101188525B (zh) | 一种语音流的处理方法及装置 | |
US6697342B1 (en) | Conference circuit for encoded digital audio | |
US7986644B2 (en) | Multi-fidelity conferencing bridge | |
CN1979639B (zh) | 静音处理装置及方法 | |
WO2008069723A2 (en) | Handling announcement media in a communication network environment | |
US8675849B2 (en) | Ubiquitous transfer of a phone number to another phone | |
CN101193381A (zh) | 一种带有声音预处理的移动终端及其方法 | |
CN100454937C (zh) | 移动通信终端的通话录音方法 | |
EP2572499B1 (en) | Encoder adaption in teleconferencing system | |
CN1980293A (zh) | 静音处理装置及方法 | |
US20090290698A1 (en) | Method and device for transmitting voice data in a communication network | |
EP1889257A1 (en) | A method and system for recording an electronic communication and extracting constituent audio data therefrom | |
US7113514B2 (en) | Apparatus and method for implementing a packet based teleconference bridge | |
US20030174657A1 (en) | Method, system and computer program product for voice active packet switching for IP based audio conferencing | |
CN100442810C (zh) | 一种混音处理方法 | |
Chinna Rao et al. | Real-time implementation and testing of VoIP vocoders with asterisk PBX using wireshark packet analyzer | |
CN101111035A (zh) | 在ptt终端中实现语音缓冲的装置和方法 | |
US7313233B2 (en) | Tone clamping and replacement | |
CN114285910A (zh) | 通信终端与互联网音频格式重塑***和方法 | |
CN106550109A (zh) | 一种通过固话接听移动终端电话的装置和方法 | |
KR20070015532A (ko) | 정보 제공 시스템, 방법 및 정보 제공용 프로그램을 기록한 기록 매체 | |
CN1926894A (zh) | 减少按讲业务的等待时间 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110727 Termination date: 20141203 |
|
EXPY | Termination of patent right or utility model |