CN1338834A - 基于网络协议的低速语音编码方法 - Google Patents
基于网络协议的低速语音编码方法 Download PDFInfo
- Publication number
- CN1338834A CN1338834A CN00126112A CN00126112A CN1338834A CN 1338834 A CN1338834 A CN 1338834A CN 00126112 A CN00126112 A CN 00126112A CN 00126112 A CN00126112 A CN 00126112A CN 1338834 A CN1338834 A CN 1338834A
- Authority
- CN
- China
- Prior art keywords
- voice
- frame
- speech
- low
- speech data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012856 packing Methods 0.000 claims description 7
- 238000011002 quantification Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 abstract description 11
- 238000007906 compression Methods 0.000 abstract description 11
- 230000005540 biological transmission Effects 0.000 abstract description 10
- 230000003044 adaptive effect Effects 0.000 abstract 1
- 238000013139 quantization Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 101100517648 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NUM1 gene Proteins 0.000 description 2
- 101100129590 Schizosaccharomyces pombe (strain 972 / ATCC 24843) mcp5 gene Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/70—Media network packetisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1101—Session protocols
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Communication Control (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供了一种基于网络协议的低速语音编码方法,由于本方法采用单帧、变帧长、帧内比特自适应的低速语音压缩编码方法,可使编码压缩的能力进一步提高,进而提高了数据传输效率。同时由于IP的数据报分割以该语音编码帧的分割为单位,对信源语音编译码的质量会有较大的提高。采用非正式听音表明,使用本方法的数据编码压缩能力或在同等误码率上,以及在对语音译码能力方面,MOS分值提高0.1~0.2。
Description
本发明涉及数字通信***中数据编码方法,尤其是基于网络协议的低速语音编码方法。
在数字通信***中,用以传输信息的信道带宽总是有限的,要在有限的带宽内尽可能多地增加***容量或用户数,就必须提高信道带宽的利用率。采用低速语音编码对信源数据进行压缩是提高带宽利用率的重要手段。目前,低速语音编码方法以固定帧长为基础,基于IP(网络协议)传送的语音信号的数据报分割是以一帧或多帧语音的比特数为单位的。
基于固定帧长的单帧或多帧IP语音传送***的工作流程如下:在发送端,当语音PCM(脉冲编码调制)信号输入后,首先确定语音性质,再根据语音性质和帧长确定编码速率并对其进行压缩编码,最后对压缩后的单帧或多帧语音编码TCP(传输控制协议)或UDP(用户数据报协议)打包和IP打包后,通过信道传送给接收端;在接收端,首先进行IP和TCP或UDP解包,然后判断数据包是否出错、丢包或延迟,如没有上述情况,则正常译码后输出语音PCM信号,否则,经单帧或多帧语音预测译码后输出语音PCM信号。在上述过程中,无论采用单帧还是多帧,由于采用了固定帧长,则其编码效率低,不利于编码效率的进一步下降。当采用多帧时,还不利于IP数据包丢失、传送比特出错、延迟太大时对信源译码的处理,对语音译码质量有影响。
针对以上现有技术中的问题,本发明的目的是,提供一种有利于提高编码效率、降低压缩速率、保证语音译码质量的基于网络协议的低速语音编码方法。
为达到上述目的,本发明采用的技术方案是:一种基于网络协议的低速语音编码方法,该方法包括以下步骤:
(1)信源根据语音数据采样频率,顺序输入量化的语音数据;
(2)根据TN时间内输入的语音数据确定语音的性质参数;
(3)根据上述步骤(2)得到的语音性质参数,确定语音后继处理的最佳帧长T;
(4)对最佳帧长T的语音数据进行压缩编码;
(5)对语音数据压缩编码后的数据比特,在利用TCP或UDP协议
打包和IP协议打包后,通过信道输出。
由于本方法采用变帧长语音压缩编码方法,可提高编码效率,有利于编码压缩速率的进一步下降,进而提高了数据传输效率。同时由于本方法采用单帧语音编码,在IP包数据丢失、传送比特出错、延迟太大时,有利于信源译码的处理,对语音译码有好处,进而保证了语音译码质量。采用非正式听音表明,使用本方法的数据编码压缩能力或在同等误码率上,以及在对语音译码能力方面,MOS分值提高0.1~0.2。
下面结合附图和实施例对本发明作进一步的详细说明。
图1是本发明的流程示意图;
图2是基于自适应变帧长变速率的单帧IP语音传送***流程示意图;
图3是本发明的一个实施例***逻辑示意图;
图4是本发明的基于自适应变帧长变速率的单帧IP语音传送***实施例流程示意图。
本发明的原理描述如下,参考图1、2。信源输入为采样量化的语音数据,数据是根据采样率顺序输入的,语音性质确定模块根据每TN毫秒输入的数据,确定输入语音的性质参数。上述时间TN按照下述原则确定:首先编码效率、压缩率要尽可能高,其次延迟时间不能太长;经实验证明,5ms≤TN≤30ms时为最佳。根据语音性质参数,即语音的变化频度确定输入语音后续处理的最佳帧长T,基本原则为:使输入语音满足短时特性不变,而可以分析的语音帧长尽量长,具体说,若语音的变化频度快,则帧长短,反之帧长长。最佳帧长T=T1,T2,...,TN,为一个有限集。对最佳帧长T的语音,再采用内部变速率算法对其进行压缩编码,输出压缩编码后的比特,其比特数NUM也是在一个有限集中,NUM=NUM1,NUM2,......,NUMM。对语音压缩编码后输出的NUM个比特利用TCP或UDP协议加上包头,比特数变为NUM_P,IP打包模块对NUM_P个比特再打包加上路由信息,得到NUM_IP个比特,由此,传送到接收方,接收方进行IP解包,TCP或UDP解包。在正常情况下,语音译码模块正常译码,但由于在传送过程中,可能会引入信道误码,传输延迟等情况,此时,由于只有一帧语音传送,语音译码模块可以很容易地处理传输中出现的问题。
编码的基本操作流程如下:
(1)信源输入为采样量化的语音数据,数据是根据采样率顺序输入的;
(2)语音性质确定模块根据每TN毫秒输入的数据确定输入语音的性质参数,根据语音的性质参数,即语音的变化频度确定输入语音后续处理的最佳帧长T,T=T1,T2,...,TN,为一个有限集;
(3)对最佳帧长T的语音,再采用内部变速率算法对其进行压缩编码,输出压缩编码后的比特,其比特数NUM也是在一个有限集中,NUM=NUM1,NUM2,......,NUMM;
(4)对语音压缩编码后输出的NUM个比特利用TCP或UDP协议加上包头,比特数变为NUM_P;
(5)IP打包模块对NUM_P个比特再打包加上路由信息,得到NUM_IP个比特。
上述IP打包后的NUM_IP个比特通过信道,传送到接收方。
译码的基本操作流程如下:
(1)接收方进行IP解包;
(2)TCP或UDP解包;
(3)在正常情况下,语音译码模块正常译码;在处错条件下,进行单帧预测译码;
(4)输出恢复的语音数据。
本发明可以应用于目前Internet上公用网或专用网IP语音传送,也可用于未来移动通信中基于IP的核心网语音传送。参考图3。其中IP网关采用本发明提出的编译码,在Internet传送IP包出现丢包、传输比特出错等情况下,译码器能够根据本发明内容纠正译码质量,由于是变帧长传输,纠正的语音译码质量能够更好。对于IP网关,本例给出了一个结合变帧长、变速率语音编码方法的实例,参考图4,编码速率为2Kbitps,4Kbitps,8Kbitps,其基本操作流程如下:
编码:
(1)信源输入为采样量化的语音数据,采样率8000Hz,数据是根据采样率顺序输入的;T1=5,T2=10,T3=15,T4=20,T5=25,T6=30ms;
(2)语音性质确定模块根据每30ms输入的数据确定输入语音的性质参数,计算方法如下,计算每5ms的分段基音周期,分别计算10ms,15ms,20ms,25ms,30ms的基音周期方差D10,D15,D20,D25,D30;
(3)根据语音的性质参数,即语音的变化频度确定输入语音后续处理的最佳帧长T:
当{D30<Threshold则T=30;
D25<Threshold则T=25;
D20<Threshold则T=20;
D15<Threshold则T=15;
D10<Threshold则T=10;
否则T=5}
其中:Threshold是基音周期的一个方差的比较,其值的确定应考虑在编码效率和质量之间作一个较好的权衡。
(4)对最佳帧长T的语音,采用内部变速率算法压缩编码,压缩编码后的比特数为NUM,NUM=T*2,T*4,T*8,为三个档次;
(5)对语音压缩编码后输出的NUM个比特利用TCP协议加上包头,比特数变为NUM_P;
(6)IP打包模块对NUM_P个比特再打包加上路由信息,得到NUM_IP个比特。该NUM_IP个比特通过信道,传送到接收方。译码:
(1)接收方进行IP解包;
(2)TCP解包;
(3)在正常情况下,语音译码模块正常译码;在处错条件下,进行单帧预测译码;
(4)·输出恢复的语音数据。
Claims (4)
1、一种基于网络协议的低速语音编码方法,其特征在于,该方法包括以下步骤:
(1)信源根据语音数据采样频率,顺序输入量化的语音数据;
(2)根据TN时间内输入的语音数据确定语音的性质参数;
(3)根据上述步骤(2)得到的语音性质参数,确定语音后继处理的最佳帧长T;
(4)对最佳帧长T的语音数据进行压缩编码;
(5)对语音数据压缩编码后的数据比特,在利用TCP或UDP协议打包和IP协议打包后,通过信道输出。
2、根据权利要求1所述的基于网络协议的低速语音编码方法,其特征在于:所述TN时间为满足TN≥5ms且TN≤30ms的任一时间。
3、根据权利要求1所述的基于网络协议的低速语音编码方法,其特征在于,所述根据语音性质参数确定语音后继处理的最佳帧长T是按照下述方法确定的:若语音的变化频度快,则帧长短,反之帧长长。
4、根据权利要求1所述的基于网络协议的低速语音编码方法,其特征在于:所述对最佳帧长T的语音数据进行压缩编码是采用内部变速率算法进行的。
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN00126112A CN1338834A (zh) | 2000-08-19 | 2000-08-19 | 基于网络协议的低速语音编码方法 |
PCT/CN2001/000964 WO2002017588A1 (fr) | 2000-08-19 | 2001-06-12 | Procede de codage de la parole a basse vitesse sur la base d'un protocole reseau |
AT01969198T ATE393952T1 (de) | 2000-08-19 | 2001-06-12 | Langsames sprachkodierungsverfahren auf der grundlage eines netzwerkprotokolls |
AU2001289543A AU2001289543A1 (en) | 2000-08-19 | 2001-06-12 | Low speed speech encoding method based on the network protocol |
EP01969198A EP1324561B1 (en) | 2000-08-19 | 2001-06-12 | Low speed speech encoding method based on a network protocol |
DE60133830T DE60133830T2 (de) | 2000-08-19 | 2001-06-12 | Langsames sprachkodierungsverfahren auf der grundlage eines netzwerkprotokolls |
CA2418287A CA2418287C (en) | 2000-08-19 | 2001-06-12 | Low speed speech encoding method based on internet protocol |
US10/366,931 US6947887B2 (en) | 2000-08-19 | 2003-02-19 | Low speed speech encoding method based on Internet protocol |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN00126112A CN1338834A (zh) | 2000-08-19 | 2000-08-19 | 基于网络协议的低速语音编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1338834A true CN1338834A (zh) | 2002-03-06 |
Family
ID=4591746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN00126112A Pending CN1338834A (zh) | 2000-08-19 | 2000-08-19 | 基于网络协议的低速语音编码方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6947887B2 (zh) |
EP (1) | EP1324561B1 (zh) |
CN (1) | CN1338834A (zh) |
AT (1) | ATE393952T1 (zh) |
AU (1) | AU2001289543A1 (zh) |
CA (1) | CA2418287C (zh) |
DE (1) | DE60133830T2 (zh) |
WO (1) | WO2002017588A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102970133A (zh) * | 2012-11-12 | 2013-03-13 | 安徽量子通信技术有限公司 | 量子网络的语音传输方法和语音终端 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050268656A1 (en) * | 2001-01-08 | 2005-12-08 | Alexander Raichel | Poly-crystalline compositions |
US20030189904A1 (en) * | 2002-04-04 | 2003-10-09 | Li Jonathan Q. | Sampling fractal internet protocol traffic with bounded error tolerance and response time |
US7423967B2 (en) * | 2002-05-09 | 2008-09-09 | Broadcom Corporation | Fairness scheme method and apparatus for pause capable and pause incapable ports |
US20050143979A1 (en) * | 2003-12-26 | 2005-06-30 | Lee Mi S. | Variable-frame speech coding/decoding apparatus and method |
JP4156568B2 (ja) * | 2004-06-21 | 2008-09-24 | 富士通株式会社 | 通信システムの制御方法、通信制御装置、プログラム |
US20060070406A1 (en) * | 2004-09-28 | 2006-04-06 | Orgyr Technologies Ltd. | Use of coal ash for the safe disposal of mineral waste |
US20100242715A1 (en) * | 2006-06-13 | 2010-09-30 | D&D Salomon Investment Ltd. | Glass-ceramic materials having a predominant spinel-group crystal phase |
US8204038B2 (en) * | 2009-01-13 | 2012-06-19 | Mediatek Inc. | Method for efficient utilization of radio resources in wireless communications system |
US9894421B2 (en) * | 2012-10-22 | 2018-02-13 | Huawei Technologies Co., Ltd. | Systems and methods for data representation and transportation |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE516526C2 (sv) * | 1993-11-03 | 2002-01-22 | Telia Ab | Metod och anordning vid automatisk extrahering av prosodisk information |
JP3131542B2 (ja) * | 1993-11-25 | 2001-02-05 | シャープ株式会社 | 符号化復号化装置 |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
GB2335335A (en) * | 1998-03-13 | 1999-09-15 | Northern Telecom Ltd | Carrying speech-band signals over power lines |
AU3372199A (en) * | 1998-03-30 | 1999-10-18 | Voxware, Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
AU1878299A (en) * | 1998-12-10 | 2000-06-26 | Nokia Networks Oy | Packet transmission method and apparatus |
KR100322015B1 (ko) * | 1998-12-23 | 2002-03-08 | 윤종용 | 근거리 통신망에서 프레임 구조 가변방법 |
CN1085456C (zh) * | 1999-03-02 | 2002-05-22 | 中信通信项目管理有限责任公司 | 宽带多业务数字化智能话机及其使用方法 |
US6366961B1 (en) * | 1999-03-03 | 2002-04-02 | Nokia Telecommunications, Oy | Method and apparatus for providing mini packet switching in IP based cellular access networks |
US6785261B1 (en) * | 1999-05-28 | 2004-08-31 | 3Com Corporation | Method and system for forward error correction with different frame sizes |
FR2798879B1 (fr) | 1999-09-27 | 2001-10-19 | Commissariat Energie Atomique | Procede de traitement, et d'extraction de composes organiques du liege, par un fluide dense sous pression |
-
2000
- 2000-08-19 CN CN00126112A patent/CN1338834A/zh active Pending
-
2001
- 2001-06-12 CA CA2418287A patent/CA2418287C/en not_active Expired - Lifetime
- 2001-06-12 DE DE60133830T patent/DE60133830T2/de not_active Expired - Lifetime
- 2001-06-12 WO PCT/CN2001/000964 patent/WO2002017588A1/zh active IP Right Grant
- 2001-06-12 AU AU2001289543A patent/AU2001289543A1/en not_active Abandoned
- 2001-06-12 EP EP01969198A patent/EP1324561B1/en not_active Expired - Lifetime
- 2001-06-12 AT AT01969198T patent/ATE393952T1/de not_active IP Right Cessation
-
2003
- 2003-02-19 US US10/366,931 patent/US6947887B2/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102970133A (zh) * | 2012-11-12 | 2013-03-13 | 安徽量子通信技术有限公司 | 量子网络的语音传输方法和语音终端 |
CN102970133B (zh) * | 2012-11-12 | 2015-10-14 | 安徽量子通信技术有限公司 | 量子网络的语音传输方法和语音终端 |
Also Published As
Publication number | Publication date |
---|---|
US6947887B2 (en) | 2005-09-20 |
WO2002017588A1 (fr) | 2002-02-28 |
EP1324561A1 (en) | 2003-07-02 |
EP1324561B1 (en) | 2008-04-30 |
ATE393952T1 (de) | 2008-05-15 |
US20030182127A1 (en) | 2003-09-25 |
DE60133830D1 (de) | 2008-06-12 |
AU2001289543A1 (en) | 2002-03-04 |
DE60133830T2 (de) | 2009-05-20 |
CA2418287C (en) | 2010-08-24 |
EP1324561A4 (en) | 2005-08-17 |
WO2002017588A8 (fr) | 2003-03-20 |
CA2418287A1 (en) | 2003-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7907609B2 (en) | Method and apparatus for enhancing RoHC performance when encountering silence suppression | |
US8352252B2 (en) | Systems and methods for preventing the loss of information within a speech frame | |
CN1157034C (zh) | 使用压缩头标和时间戳字段传送数据分组的***和方法 | |
US7701981B2 (en) | System and method for improving robust header compression (ROHC) efficiency | |
US20080117906A1 (en) | Payload header compression in an rtp session | |
US7072291B1 (en) | Devices, softwares and methods for redundantly encoding a data stream for network transmission with adjustable redundant-coding delay | |
CN1338834A (zh) | 基于网络协议的低速语音编码方法 | |
EP2201565B1 (en) | System and method for providing amr-wb dtx synchronization | |
CN101051465A (zh) | 用于解码被编码的有用数据的方法和解码装置 | |
CN1339212A (zh) | 重构媒体的方法和装置 | |
WO2012072278A1 (en) | Source signal adaptive frame aggregation | |
CN1174571C (zh) | 一种在网络上传输ip语音包的丢包恢复方法 | |
CN100505714C (zh) | 基于自适应差分脉冲编码调制的丢帧处理设备及方法 | |
CN1929355A (zh) | 语音包丢失恢复***以及方法 | |
CN1190916C (zh) | 一种基于ip应用的抗误码编解码方法 | |
CN1172497C (zh) | Voip语音编码的异码桥接装置及方法 | |
WO2009029565A2 (en) | Method, system and apparatus for providing signal based packet loss concealment for memoryless codecs | |
CA2584686A1 (en) | Methods and devices for providing protection in packet switched communication networks | |
CN1509468A (zh) | 评估编解码参数的方法 | |
EP1739917A1 (en) | Terminal, system and method for discarding encoded parts of a sampled audio stream | |
CN1672193A (zh) | 用于语音帧误差降低的语音通信单元和方法 | |
Hellerud et al. | Robust Transmission of Lossless Audio with Low Delay over IP Networks | |
DE DECODEURS et al. | Sherbrooke (Quebec), Canada Mai 2003 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent of invention or patent application | ||
CB02 | Change of applicant information |
Applicant after: Huawei Technologies Co., Ltd. Applicant before: Huawei Technology Co., Ltd., Shenzhen City |
|
COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: SHENZHEN HUAWEI TECHNOLOGY CO., LTD TO: HUAWEI TECHNOLOGY CO., LTD. |
|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |