CN102543090B - 一种应用于变速率语音和音频编码的码率自动控制*** - Google Patents

一种应用于变速率语音和音频编码的码率自动控制*** Download PDF

Info

Publication number
CN102543090B
CN102543090B CN2011104591878A CN201110459187A CN102543090B CN 102543090 B CN102543090 B CN 102543090B CN 2011104591878 A CN2011104591878 A CN 2011104591878A CN 201110459187 A CN201110459187 A CN 201110459187A CN 102543090 B CN102543090 B CN 102543090B
Authority
CN
China
Prior art keywords
signal
subband
module
voice
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011104591878A
Other languages
English (en)
Other versions
CN102543090A (zh
Inventor
程荣
梁毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN MAOBI INFORMATION TECHNOLOGY CO LTD
Original Assignee
SHENZHEN MAOBI INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN MAOBI INFORMATION TECHNOLOGY CO LTD filed Critical SHENZHEN MAOBI INFORMATION TECHNOLOGY CO LTD
Priority to CN2011104591878A priority Critical patent/CN102543090B/zh
Publication of CN102543090A publication Critical patent/CN102543090A/zh
Application granted granted Critical
Publication of CN102543090B publication Critical patent/CN102543090B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种应用于变速率语音和音频编码的码率自动控制***,通过计算信号子带信噪比来自动调节编码码率,压缩后的码流与现有技术大小相当的固定码率压缩后的码流相比,采用本发明解压后的信噪比有明显的提升。本发明的自动调节码率方式,比传统的能量判断的方法有较好的鲁棒性;既支持对语音编码的速率控制外,同时也支持对音频信号的变速率编码,可以应用在带宽受限条件下分组域移动语音通信中,以提升传输的语音和音频信号的质量。

Description

一种应用于变速率语音和音频编码的码率自动控制***
技术领域
本发明涉及语音和音频码率自动控制技术,更具体的涉及一种应用于移动互联网语音通信、移动流媒体服务器等的语音和音频编码的码率自动控制技术。
背景技术
语音和音频码率控制技术是指语音和音频信号在编码之前,根据信号的内容的重要性,自动调整编码的速率,在重要信息时采样相对高的码率进行编码,在次要信息(比如噪声)时候采样相对低的码率进行编码,使得在带宽下受限的条件下,既能有较好的语音质量,又能节省带宽。该技术一般用于分组域(PS)移动语音通信、移动流媒体服务器等应用中。
现有的分组域(PS)移动语音通信中的语音编码技术大多采用第三代移动通信***中AMR(自适应多码率)语音编码技术,传统的电路域(CS)AMR语音编码的速率控制是由基站来控制的,由于AMR本身并没有提供码率控制功能,所以分组域(PS)的AMR编码实际多采用固定速率进行编码,这个在移动互联网有限的带宽条件下,在带宽和语音质量之间很难达到一个较好的平衡。其他的几种传统的变速率语音编码(如QCELP、EVRC和SMV等)一般只用于传统的电路域(CS)语音通信,且基本是采用语音活性检测(VAD,Voice Activity Detector)检测加信号能量判断的方法来进行速率控制,这类方法过多依赖于信号能量的大小,而实际上信号内容的重要性并不能完全反映在能量大小上。
发明内容
本发明解决的技术问题是提出一种应用于变速率语音和音频编码的码率自动控制***,实现在带宽受限条件下的分组域移动语音通信中,根据要编码的信号内容的重要性来自动调整码率,提升语音和音频的质量。
本发明提出的应用于变速率语音和音频编码的码率自动控制***,包括:变速率编码器、自适应码率控制单元;输入的语音或音频PCM信号分别输入所述变速率编码器和所述自适应码率控制单元的信号输入端,所述自适应码率控制单元通过计算所述PCM信号的子带信噪比得到编码速率调整参数,并将所述调整参数输出到所述变速率编码器的变速率编码控制端完成对所述PCM信号的变速率编码。
进一步的,所述自适应码率控制单元包括:频域变换模块、子带处理模块、子带信噪比计算模块、以及码率输出模块;所述PCM信号经过所述频域变换模块进行频域变换,并由所述子带处理模块进行子带划分、子带信号能量计算以及子带噪声能量计算,然后经过子带信噪比计算模块进行子带信噪比计算,并由所述码率输出模块通过与历史帧的子带时域平均信噪比的比较得到编码速率调整参数。
进一步的,所述子带处理模块包括:子带信号处理模块和子带噪声处理模块;所述子带信号处理模块与所述频域变换模块相连,对所述频域变换后的信号进行子带划分和子带信号能量计算,然后由所述子带噪声处理模块完成子带噪声能量计算。
进一步的,在所述子带信号处理模块和子带噪声处理模块之间还包括判断输入信号是否为噪声信号的语音活性检测模块。
本发明通过计算信号子带信噪比来自动调节编码码率,压缩后的码流与现有技术大小相当的固定码率压缩后的码流相比,采用本发明解压后的信噪比有明显的提升。在一个实验中,将相同的一端语音信号分别采用固定码率(AMR7.95kbps)进行编码和采用本发明的码率自动控制***进行辅助编码的比较分析,对解码后得到的两个信号的信噪比曲线进行对比,两种方式压缩后的码流大小相当,但是采用本发明时,解压后信噪比有明显提升,最大有13dB的信噪比提升。在另一个实验中,将相同的一段音乐信号采用固定码率(AMR 7.95kbps)进行编码和采用本发明的码率自动控制***进行辅助编码的比较分析,对解码后得到的两个信号的信噪比曲线进行对比,两种方式压缩后的码流大小相当,但是采用本发明时,主旋律信号信噪比有明显提升,最大有10dB的信噪比提升。
附图说明
图1为本发明实施例一的码率自动控制***原理图;
图2为本发明实施例二的自适应码率控制单元结构示意图;
图3为本发明实施例二中的子带处理模块的结构示意图。
具体实施方式
下面结合附图,并通过具体实施例对本发明的具体实现进行说明。
本发明的主要发明构思是通过计算信号子带信噪比来自动调节编码码率的。首先通过对输入的语音或音频PCM信号进行预处理和频域变换,得到频域信号后,划分子带并计算子带信噪比,然后进行背景噪声检测来区分输入信号是否为噪声,如果为噪声则进行背景噪声能力更新,最后计算子带信噪比并根据信噪比自适应计算最优码率,最优码率值输出给变速率编码器进行语音或者音频信号编码。
实施例一
如图1所示的码率自动控制***,包括:变速率编码器和自适应码率控制单元。输入的语音或音频PCM信号分别输入变速率编码器和自适应码率控制单元的信号输入端。自适应码率控制单元通过计算PCM信号的子带信噪比得到编码速率调整参数,并将该调整参数输出到变速率编码器的变速率编码控制端。变速率编码器根据编码速率调整参数完成对所述PCM信号的变速率编码处理,输出编码后的码流。
实施例二
本发明的核心单元为自适应码率控制单元。如图2所示,在本实施例中该单元包括:频域变换模块、子带处理模块、子带信噪比计算模块、以及码率输出模块。PCM信号输入自适应码率控制单元时,先经过所述频域变换模块进行频域变换,并由子带处理模块进行子带划分、子带信号能量计算以及子带噪声能量计算,然后经过子带信噪比计算模块进行子带信噪比计算,并由码率输出模块通过与历史帧的子带时域平均信噪比的比较得到编码速率调整参数。
其中的确定编码速率调整参数的处理可以采用以下方式:
在频域坐标上,计算关键频带(窄带语音一般为750Hz~3400Hz,音频信号视采样率而定)平均信噪比a,然后在时间坐标上,计算连续若干历史帧的时域平均信噪比b,再根据两者之间的实时变化差异(波动)来映射相应的码率,从而达到码率自动调整的目的。
在一种实施方式中,如图3所示,子带处理模块包括:子带信号处理模块和子带噪声处理模块。子带信号处理模块与频域变换模块相连,对频域变换后的信号进行子带划分和子带信号能量计算,然后由子带噪声处理模块完成子带噪声能量计算。为了检测当前信号是否为噪声或语音,还可以在子带信号处理模块和子带噪声处理模块之间设置用于判断输入信号是否为噪声信号的语音活性检测模块。该语音活性检测模块可以采用语音尺度计算和谱偏估计来完成语音活性检测。
综上所述,本发明提出的码率自动控制***,能够根据信号内容自动调节编码的码率,在重要语音信号或音乐主旋律时采用高的码率进行编码,在噪声或者次要的背景音乐时采用低的码率,以保证整体的语音质量。和现有的码率控制技术相比,具有以下特点:(1)它通过计算信号子带信噪比来区分信号内容的重要性,从而实现自动调节码率的目的,比传统的能量判断的方法有较好的鲁棒性;(2)既支持对语音编码的速率控制外,同时也支持对音频信号的变速率编码,因为音乐信号的主旋律也是可以通过计算子带信噪比来检测的。该***在编码之前进行实施。本发明的码率自动控制***,可以应用在带宽受限条件下分组域移动语音通信中,以提升传输的语音和音频信号的质量。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种应用于变速率语音和音频编码的码率自动控制***,其特征在于,包括:变速率编码器、自适应码率控制单元;输入的语音或音频PCM信号分别输入所述变速率编码器和所述自适应码率控制单元的信号输入端;所述自适应码率控制单元包括:频域变换模块、子带处理模块、子带信噪比计算模块、以及码率输出模块;所述PCM信号经过所述频域变换模块进行频域变换,并由所述子带处理模块进行子带划分、子带信号能量计算以及子带噪声能量计算,然后经过所述子带信噪比计算模块进行子带信噪比计算,并由所述码率输出模块通过与历史帧的子带时域平均信噪比的比较得到编码速率调整参数,将所述调整参数输出到所述变速率编码器的变速率编码控制端完成对所述PCM信号的变速率编码。
2.根据权利要求1所述的码率自动控制***,其特征在于,所述子带处理模块包括:子带信号处理模块和子带噪声处理模块;所述子带信号处理模块与所述频域变换模块相连,对所述频域变换后的信号进行子带划分和子带信号能量计算,然后由所述子带噪声处理模块完成子带噪声能量计算。
3.根据权利要求2所述的码率自动控制***,其特征在于,在所述子带信号处理模块和子带噪声处理模块之间还包括判断输入信号是否为噪声信号的语音活性检测模块。
CN2011104591878A 2011-12-31 2011-12-31 一种应用于变速率语音和音频编码的码率自动控制*** Expired - Fee Related CN102543090B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104591878A CN102543090B (zh) 2011-12-31 2011-12-31 一种应用于变速率语音和音频编码的码率自动控制***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104591878A CN102543090B (zh) 2011-12-31 2011-12-31 一种应用于变速率语音和音频编码的码率自动控制***

Publications (2)

Publication Number Publication Date
CN102543090A CN102543090A (zh) 2012-07-04
CN102543090B true CN102543090B (zh) 2013-12-04

Family

ID=46349828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104591878A Expired - Fee Related CN102543090B (zh) 2011-12-31 2011-12-31 一种应用于变速率语音和音频编码的码率自动控制***

Country Status (1)

Country Link
CN (1) CN102543090B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
CN106297812A (zh) * 2016-09-13 2017-01-04 深圳市金立通信设备有限公司 一种数据处理方法及终端
CN107948206B (zh) * 2018-01-02 2020-11-20 联想(北京)有限公司 一种多媒体数据下载/或上传的方法及***
CN110992963B (zh) * 2019-12-10 2023-09-29 腾讯科技(深圳)有限公司 网络通话方法、装置、计算机设备及存储介质
CN113314133A (zh) * 2020-02-11 2021-08-27 华为技术有限公司 音频传输方法及电子设备
CN112037803B (zh) * 2020-05-08 2023-09-29 珠海市杰理科技股份有限公司 音频编码方法及装置、电子设备、存储介质
CN112767953B (zh) * 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质
CN112992166B (zh) * 2021-05-08 2021-08-20 北京百瑞互联技术有限公司 一种动态调整lc3音频编码速率的方法、装置及存储介质
CN114566174B (zh) * 2022-04-24 2022-07-19 北京百瑞互联技术有限公司 一种优化语音编码的方法、装置、***、介质及设备
CN118016081B (zh) * 2024-04-10 2024-06-21 山东省计算中心(国家超级计算济南中心) 基于语音质量分级模型的变速率语音编码方法及***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214741A (en) * 1989-12-11 1993-05-25 Kabushiki Kaisha Toshiba Variable bit rate coding system
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
CN1703737A (zh) * 2002-10-11 2005-11-30 诺基亚有限公司 在自适应多速率宽带(amr-wb)和多模式可变比特率宽带(vmr-wb)编解码器之间互操作的方法
CN101213591A (zh) * 2005-06-18 2008-07-02 诺基亚公司 用于非连续语音传输期间的舒适噪声参数自适应传输的***和方法
CN101765003A (zh) * 2008-12-23 2010-06-30 上海茂碧信息科技有限公司 在不同速率网络环境下传输音频和视频的方法
CN202487155U (zh) * 2011-12-31 2012-10-10 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214741A (en) * 1989-12-11 1993-05-25 Kabushiki Kaisha Toshiba Variable bit rate coding system
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
CN1703737A (zh) * 2002-10-11 2005-11-30 诺基亚有限公司 在自适应多速率宽带(amr-wb)和多模式可变比特率宽带(vmr-wb)编解码器之间互操作的方法
CN101213591A (zh) * 2005-06-18 2008-07-02 诺基亚公司 用于非连续语音传输期间的舒适噪声参数自适应传输的***和方法
CN101765003A (zh) * 2008-12-23 2010-06-30 上海茂碧信息科技有限公司 在不同速率网络环境下传输音频和视频的方法
CN202487155U (zh) * 2011-12-31 2012-10-10 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制***

Also Published As

Publication number Publication date
CN102543090A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102543090B (zh) 一种应用于变速率语音和音频编码的码率自动控制***
US10777213B2 (en) Audio bandwidth selection
CN111429925B (zh) 一种降低音频编码速率的方法及***
CN103310793B (zh) 一种水声实时数字语音通信方法
US20120116758A1 (en) Systems and Methods for Enhancing Voice Quality in Mobile Device
JP4842472B2 (ja) フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
US20090099851A1 (en) Adaptive bit pool allocation in sub-band coding
CN101320563A (zh) 一种背景噪声编码/解码装置、方法和通信设备
KR20190057052A (ko) 잡음 환경에 적응적인 신호 처리방법 및 장치와 이를 채용하는 단말장치
MX2014007968A (es) Metodo, aparato, y sistema para procesar datos de audio.
US9972334B2 (en) Decoder audio classification
CN111768793A (zh) 一种lc3音频编码器编码优化方法、***、存储介质
CN103632681A (zh) 一种谱包络静音检测方法
CN103229544A (zh) 源信号自适应帧聚合
CN103915097A (zh) 一种语音信号处理方法、装置和***
CN202487155U (zh) 一种应用于变速率语音和音频编码的码率自动控制***
US20090043590A1 (en) Noise Detection for Audio Encoding by Mean and Variance Energy Ratio
JP2017526006A (ja) オーディオ信号内の雑音を推定するための方法、雑音推定器、オーディオ符号化器、オーディオ復号器、およびオーディオ信号を送信するためのシステム
CN102760441B (zh) 一种背景噪声编码/解码装置、方法和通信设备
US20050102136A1 (en) Speech codecs
CN208445563U (zh) 一种高速水声语音通信***
WO2024021729A1 (zh) 量化方法、反量化方法及其装置
Shahbazi et al. A novel speech-like symbol design for data transmission through gsm voice channel
CN204859171U (zh) 基于ambe编解码的无线数字对讲机
CN111968653B (zh) 一种轻载荷双Bit自适应增量语音编码译码方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131204

Termination date: 20171231

CF01 Termination of patent right due to non-payment of annual fee