CN1338834A - 基于网络协议的低速语音编码方法 - Google Patents

基于网络协议的低速语音编码方法 Download PDF

Info

Publication number
CN1338834A
CN1338834A CN00126112A CN00126112A CN1338834A CN 1338834 A CN1338834 A CN 1338834A CN 00126112 A CN00126112 A CN 00126112A CN 00126112 A CN00126112 A CN 00126112A CN 1338834 A CN1338834 A CN 1338834A
Authority
CN
China
Prior art keywords
voice
frame
speech
low
speech data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN00126112A
Other languages
English (en)
Inventor
潘胜昔
李英涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN00126112A priority Critical patent/CN1338834A/zh
Priority to PCT/CN2001/000964 priority patent/WO2002017588A1/zh
Priority to AT01969198T priority patent/ATE393952T1/de
Priority to AU2001289543A priority patent/AU2001289543A1/en
Priority to EP01969198A priority patent/EP1324561B1/en
Priority to DE60133830T priority patent/DE60133830T2/de
Priority to CA2418287A priority patent/CA2418287C/en
Publication of CN1338834A publication Critical patent/CN1338834A/zh
Priority to US10/366,931 priority patent/US6947887B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)
  • Communication Control (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种基于网络协议的低速语音编码方法,由于本方法采用单帧、变帧长、帧内比特自适应的低速语音压缩编码方法,可使编码压缩的能力进一步提高,进而提高了数据传输效率。同时由于IP的数据报分割以该语音编码帧的分割为单位,对信源语音编译码的质量会有较大的提高。采用非正式听音表明,使用本方法的数据编码压缩能力或在同等误码率上,以及在对语音译码能力方面,MOS分值提高0.1~0.2。

Description

基于网络协议的低速语音编码方法
本发明涉及数字通信***中数据编码方法,尤其是基于网络协议的低速语音编码方法。
在数字通信***中,用以传输信息的信道带宽总是有限的,要在有限的带宽内尽可能多地增加***容量或用户数,就必须提高信道带宽的利用率。采用低速语音编码对信源数据进行压缩是提高带宽利用率的重要手段。目前,低速语音编码方法以固定帧长为基础,基于IP(网络协议)传送的语音信号的数据报分割是以一帧或多帧语音的比特数为单位的。
基于固定帧长的单帧或多帧IP语音传送***的工作流程如下:在发送端,当语音PCM(脉冲编码调制)信号输入后,首先确定语音性质,再根据语音性质和帧长确定编码速率并对其进行压缩编码,最后对压缩后的单帧或多帧语音编码TCP(传输控制协议)或UDP(用户数据报协议)打包和IP打包后,通过信道传送给接收端;在接收端,首先进行IP和TCP或UDP解包,然后判断数据包是否出错、丢包或延迟,如没有上述情况,则正常译码后输出语音PCM信号,否则,经单帧或多帧语音预测译码后输出语音PCM信号。在上述过程中,无论采用单帧还是多帧,由于采用了固定帧长,则其编码效率低,不利于编码效率的进一步下降。当采用多帧时,还不利于IP数据包丢失、传送比特出错、延迟太大时对信源译码的处理,对语音译码质量有影响。
针对以上现有技术中的问题,本发明的目的是,提供一种有利于提高编码效率、降低压缩速率、保证语音译码质量的基于网络协议的低速语音编码方法。
为达到上述目的,本发明采用的技术方案是:一种基于网络协议的低速语音编码方法,该方法包括以下步骤:
(1)信源根据语音数据采样频率,顺序输入量化的语音数据;
(2)根据TN时间内输入的语音数据确定语音的性质参数;
(3)根据上述步骤(2)得到的语音性质参数,确定语音后继处理的最佳帧长T;
(4)对最佳帧长T的语音数据进行压缩编码;
(5)对语音数据压缩编码后的数据比特,在利用TCP或UDP协议
打包和IP协议打包后,通过信道输出。
由于本方法采用变帧长语音压缩编码方法,可提高编码效率,有利于编码压缩速率的进一步下降,进而提高了数据传输效率。同时由于本方法采用单帧语音编码,在IP包数据丢失、传送比特出错、延迟太大时,有利于信源译码的处理,对语音译码有好处,进而保证了语音译码质量。采用非正式听音表明,使用本方法的数据编码压缩能力或在同等误码率上,以及在对语音译码能力方面,MOS分值提高0.1~0.2。
下面结合附图和实施例对本发明作进一步的详细说明。
图1是本发明的流程示意图;
图2是基于自适应变帧长变速率的单帧IP语音传送***流程示意图;
图3是本发明的一个实施例***逻辑示意图;
图4是本发明的基于自适应变帧长变速率的单帧IP语音传送***实施例流程示意图。
本发明的原理描述如下,参考图1、2。信源输入为采样量化的语音数据,数据是根据采样率顺序输入的,语音性质确定模块根据每TN毫秒输入的数据,确定输入语音的性质参数。上述时间TN按照下述原则确定:首先编码效率、压缩率要尽可能高,其次延迟时间不能太长;经实验证明,5ms≤TN≤30ms时为最佳。根据语音性质参数,即语音的变化频度确定输入语音后续处理的最佳帧长T,基本原则为:使输入语音满足短时特性不变,而可以分析的语音帧长尽量长,具体说,若语音的变化频度快,则帧长短,反之帧长长。最佳帧长T=T1,T2,...,TN,为一个有限集。对最佳帧长T的语音,再采用内部变速率算法对其进行压缩编码,输出压缩编码后的比特,其比特数NUM也是在一个有限集中,NUM=NUM1,NUM2,......,NUMM。对语音压缩编码后输出的NUM个比特利用TCP或UDP协议加上包头,比特数变为NUM_P,IP打包模块对NUM_P个比特再打包加上路由信息,得到NUM_IP个比特,由此,传送到接收方,接收方进行IP解包,TCP或UDP解包。在正常情况下,语音译码模块正常译码,但由于在传送过程中,可能会引入信道误码,传输延迟等情况,此时,由于只有一帧语音传送,语音译码模块可以很容易地处理传输中出现的问题。
编码的基本操作流程如下:
(1)信源输入为采样量化的语音数据,数据是根据采样率顺序输入的;
(2)语音性质确定模块根据每TN毫秒输入的数据确定输入语音的性质参数,根据语音的性质参数,即语音的变化频度确定输入语音后续处理的最佳帧长T,T=T1,T2,...,TN,为一个有限集;
(3)对最佳帧长T的语音,再采用内部变速率算法对其进行压缩编码,输出压缩编码后的比特,其比特数NUM也是在一个有限集中,NUM=NUM1,NUM2,......,NUMM;
(4)对语音压缩编码后输出的NUM个比特利用TCP或UDP协议加上包头,比特数变为NUM_P;
(5)IP打包模块对NUM_P个比特再打包加上路由信息,得到NUM_IP个比特。
上述IP打包后的NUM_IP个比特通过信道,传送到接收方。
译码的基本操作流程如下:
(1)接收方进行IP解包;
(2)TCP或UDP解包;
(3)在正常情况下,语音译码模块正常译码;在处错条件下,进行单帧预测译码;
(4)输出恢复的语音数据。
本发明可以应用于目前Internet上公用网或专用网IP语音传送,也可用于未来移动通信中基于IP的核心网语音传送。参考图3。其中IP网关采用本发明提出的编译码,在Internet传送IP包出现丢包、传输比特出错等情况下,译码器能够根据本发明内容纠正译码质量,由于是变帧长传输,纠正的语音译码质量能够更好。对于IP网关,本例给出了一个结合变帧长、变速率语音编码方法的实例,参考图4,编码速率为2Kbitps,4Kbitps,8Kbitps,其基本操作流程如下:
编码:
(1)信源输入为采样量化的语音数据,采样率8000Hz,数据是根据采样率顺序输入的;T1=5,T2=10,T3=15,T4=20,T5=25,T6=30ms;
(2)语音性质确定模块根据每30ms输入的数据确定输入语音的性质参数,计算方法如下,计算每5ms的分段基音周期,分别计算10ms,15ms,20ms,25ms,30ms的基音周期方差D10,D15,D20,D25,D30;
(3)根据语音的性质参数,即语音的变化频度确定输入语音后续处理的最佳帧长T:
    当{D30<Threshold则T=30;
       D25<Threshold则T=25;
    D20<Threshold则T=20;
    D15<Threshold则T=15;
    D10<Threshold则T=10;
    否则T=5}
其中:Threshold是基音周期的一个方差的比较,其值的确定应考虑在编码效率和质量之间作一个较好的权衡。
(4)对最佳帧长T的语音,采用内部变速率算法压缩编码,压缩编码后的比特数为NUM,NUM=T*2,T*4,T*8,为三个档次;
(5)对语音压缩编码后输出的NUM个比特利用TCP协议加上包头,比特数变为NUM_P;
(6)IP打包模块对NUM_P个比特再打包加上路由信息,得到NUM_IP个比特。该NUM_IP个比特通过信道,传送到接收方。译码:
(1)接收方进行IP解包;
(2)TCP解包;
(3)在正常情况下,语音译码模块正常译码;在处错条件下,进行单帧预测译码;
(4)·输出恢复的语音数据。

Claims (4)

1、一种基于网络协议的低速语音编码方法,其特征在于,该方法包括以下步骤:
(1)信源根据语音数据采样频率,顺序输入量化的语音数据;
(2)根据TN时间内输入的语音数据确定语音的性质参数;
(3)根据上述步骤(2)得到的语音性质参数,确定语音后继处理的最佳帧长T;
(4)对最佳帧长T的语音数据进行压缩编码;
(5)对语音数据压缩编码后的数据比特,在利用TCP或UDP协议打包和IP协议打包后,通过信道输出。
2、根据权利要求1所述的基于网络协议的低速语音编码方法,其特征在于:所述TN时间为满足TN≥5ms且TN≤30ms的任一时间。
3、根据权利要求1所述的基于网络协议的低速语音编码方法,其特征在于,所述根据语音性质参数确定语音后继处理的最佳帧长T是按照下述方法确定的:若语音的变化频度快,则帧长短,反之帧长长。
4、根据权利要求1所述的基于网络协议的低速语音编码方法,其特征在于:所述对最佳帧长T的语音数据进行压缩编码是采用内部变速率算法进行的。
CN00126112A 2000-08-19 2000-08-19 基于网络协议的低速语音编码方法 Pending CN1338834A (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN00126112A CN1338834A (zh) 2000-08-19 2000-08-19 基于网络协议的低速语音编码方法
PCT/CN2001/000964 WO2002017588A1 (fr) 2000-08-19 2001-06-12 Procede de codage de la parole a basse vitesse sur la base d'un protocole reseau
AT01969198T ATE393952T1 (de) 2000-08-19 2001-06-12 Langsames sprachkodierungsverfahren auf der grundlage eines netzwerkprotokolls
AU2001289543A AU2001289543A1 (en) 2000-08-19 2001-06-12 Low speed speech encoding method based on the network protocol
EP01969198A EP1324561B1 (en) 2000-08-19 2001-06-12 Low speed speech encoding method based on a network protocol
DE60133830T DE60133830T2 (de) 2000-08-19 2001-06-12 Langsames sprachkodierungsverfahren auf der grundlage eines netzwerkprotokolls
CA2418287A CA2418287C (en) 2000-08-19 2001-06-12 Low speed speech encoding method based on internet protocol
US10/366,931 US6947887B2 (en) 2000-08-19 2003-02-19 Low speed speech encoding method based on Internet protocol

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN00126112A CN1338834A (zh) 2000-08-19 2000-08-19 基于网络协议的低速语音编码方法

Publications (1)

Publication Number Publication Date
CN1338834A true CN1338834A (zh) 2002-03-06

Family

ID=4591746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN00126112A Pending CN1338834A (zh) 2000-08-19 2000-08-19 基于网络协议的低速语音编码方法

Country Status (8)

Country Link
US (1) US6947887B2 (zh)
EP (1) EP1324561B1 (zh)
CN (1) CN1338834A (zh)
AT (1) ATE393952T1 (zh)
AU (1) AU2001289543A1 (zh)
CA (1) CA2418287C (zh)
DE (1) DE60133830T2 (zh)
WO (1) WO2002017588A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102970133A (zh) * 2012-11-12 2013-03-13 安徽量子通信技术有限公司 量子网络的语音传输方法和语音终端

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050268656A1 (en) * 2001-01-08 2005-12-08 Alexander Raichel Poly-crystalline compositions
US20030189904A1 (en) * 2002-04-04 2003-10-09 Li Jonathan Q. Sampling fractal internet protocol traffic with bounded error tolerance and response time
US7423967B2 (en) * 2002-05-09 2008-09-09 Broadcom Corporation Fairness scheme method and apparatus for pause capable and pause incapable ports
US20050143979A1 (en) * 2003-12-26 2005-06-30 Lee Mi S. Variable-frame speech coding/decoding apparatus and method
JP4156568B2 (ja) * 2004-06-21 2008-09-24 富士通株式会社 通信システムの制御方法、通信制御装置、プログラム
US20060070406A1 (en) * 2004-09-28 2006-04-06 Orgyr Technologies Ltd. Use of coal ash for the safe disposal of mineral waste
US20100242715A1 (en) * 2006-06-13 2010-09-30 D&D Salomon Investment Ltd. Glass-ceramic materials having a predominant spinel-group crystal phase
US8204038B2 (en) * 2009-01-13 2012-06-19 Mediatek Inc. Method for efficient utilization of radio resources in wireless communications system
US9894421B2 (en) * 2012-10-22 2018-02-13 Huawei Technologies Co., Ltd. Systems and methods for data representation and transportation

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE516526C2 (sv) * 1993-11-03 2002-01-22 Telia Ab Metod och anordning vid automatisk extrahering av prosodisk information
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
GB2335335A (en) * 1998-03-13 1999-09-15 Northern Telecom Ltd Carrying speech-band signals over power lines
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
AU1878299A (en) * 1998-12-10 2000-06-26 Nokia Networks Oy Packet transmission method and apparatus
KR100322015B1 (ko) * 1998-12-23 2002-03-08 윤종용 근거리 통신망에서 프레임 구조 가변방법
CN1085456C (zh) * 1999-03-02 2002-05-22 中信通信项目管理有限责任公司 宽带多业务数字化智能话机及其使用方法
US6366961B1 (en) * 1999-03-03 2002-04-02 Nokia Telecommunications, Oy Method and apparatus for providing mini packet switching in IP based cellular access networks
US6785261B1 (en) * 1999-05-28 2004-08-31 3Com Corporation Method and system for forward error correction with different frame sizes
FR2798879B1 (fr) 1999-09-27 2001-10-19 Commissariat Energie Atomique Procede de traitement, et d'extraction de composes organiques du liege, par un fluide dense sous pression

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102970133A (zh) * 2012-11-12 2013-03-13 安徽量子通信技术有限公司 量子网络的语音传输方法和语音终端
CN102970133B (zh) * 2012-11-12 2015-10-14 安徽量子通信技术有限公司 量子网络的语音传输方法和语音终端

Also Published As

Publication number Publication date
US6947887B2 (en) 2005-09-20
WO2002017588A1 (fr) 2002-02-28
EP1324561A1 (en) 2003-07-02
EP1324561B1 (en) 2008-04-30
ATE393952T1 (de) 2008-05-15
US20030182127A1 (en) 2003-09-25
DE60133830D1 (de) 2008-06-12
AU2001289543A1 (en) 2002-03-04
DE60133830T2 (de) 2009-05-20
CA2418287C (en) 2010-08-24
EP1324561A4 (en) 2005-08-17
WO2002017588A8 (fr) 2003-03-20
CA2418287A1 (en) 2003-02-04

Similar Documents

Publication Publication Date Title
US7907609B2 (en) Method and apparatus for enhancing RoHC performance when encountering silence suppression
US8352252B2 (en) Systems and methods for preventing the loss of information within a speech frame
CN1157034C (zh) 使用压缩头标和时间戳字段传送数据分组的***和方法
US7701981B2 (en) System and method for improving robust header compression (ROHC) efficiency
US20080117906A1 (en) Payload header compression in an rtp session
US7072291B1 (en) Devices, softwares and methods for redundantly encoding a data stream for network transmission with adjustable redundant-coding delay
CN1338834A (zh) 基于网络协议的低速语音编码方法
EP2201565B1 (en) System and method for providing amr-wb dtx synchronization
CN101051465A (zh) 用于解码被编码的有用数据的方法和解码装置
CN1339212A (zh) 重构媒体的方法和装置
WO2012072278A1 (en) Source signal adaptive frame aggregation
CN1174571C (zh) 一种在网络上传输ip语音包的丢包恢复方法
CN100505714C (zh) 基于自适应差分脉冲编码调制的丢帧处理设备及方法
CN1929355A (zh) 语音包丢失恢复***以及方法
CN1190916C (zh) 一种基于ip应用的抗误码编解码方法
CN1172497C (zh) Voip语音编码的异码桥接装置及方法
WO2009029565A2 (en) Method, system and apparatus for providing signal based packet loss concealment for memoryless codecs
CA2584686A1 (en) Methods and devices for providing protection in packet switched communication networks
CN1509468A (zh) 评估编解码参数的方法
EP1739917A1 (en) Terminal, system and method for discarding encoded parts of a sampled audio stream
CN1672193A (zh) 用于语音帧误差降低的语音通信单元和方法
Hellerud et al. Robust Transmission of Lossless Audio with Low Delay over IP Networks
DE DECODEURS et al. Sherbrooke (Quebec), Canada Mai 2003

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Applicant after: Huawei Technologies Co., Ltd.

Applicant before: Huawei Technology Co., Ltd., Shenzhen City

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: SHENZHEN HUAWEI TECHNOLOGY CO., LTD TO: HUAWEI TECHNOLOGY CO., LTD.

C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication