CN202487155U - 一种应用于变速率语音和音频编码的码率自动控制*** - Google Patents

一种应用于变速率语音和音频编码的码率自动控制*** Download PDF

Info

Publication number
CN202487155U
CN202487155U CN2011205731838U CN201120573183U CN202487155U CN 202487155 U CN202487155 U CN 202487155U CN 2011205731838 U CN2011205731838 U CN 2011205731838U CN 201120573183 U CN201120573183 U CN 201120573183U CN 202487155 U CN202487155 U CN 202487155U
Authority
CN
China
Prior art keywords
subband
signal
module
control system
code rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn - After Issue
Application number
CN2011205731838U
Other languages
English (en)
Inventor
程荣
梁毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN MAOBI INFORMATION TECHNOLOGY CO LTD
Original Assignee
SHENZHEN MAOBI INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN MAOBI INFORMATION TECHNOLOGY CO LTD filed Critical SHENZHEN MAOBI INFORMATION TECHNOLOGY CO LTD
Priority to CN2011205731838U priority Critical patent/CN202487155U/zh
Application granted granted Critical
Publication of CN202487155U publication Critical patent/CN202487155U/zh
Anticipated expiration legal-status Critical
Withdrawn - After Issue legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本实用新型公开了一种应用于变速率语音和音频编码的码率自动控制***,通过计算信号子带信噪比来自动调节编码码率,压缩后的码流与现有技术大小相当的固定码率压缩后的码流相比,采用本实用新型解压后的信噪比有明显的提升。本实用新型的自动调节码率方式,比传统的能量判断的方法有较好的鲁棒性;既支持对语音编码的速率控制外,同时也支持对音频信号的变速率编码,可以应用在带宽受限条件下分组域移动语音通信中,以提升传输的语音和音频信号的质量。

Description

一种应用于变速率语音和音频编码的码率自动控制***
技术领域
本实用新型涉及语音和音频码率自动控制技术,更具体的涉及一种应用于移动互联网语音通信、移动流媒体服务器等的语音和音频编码的码率自动控制技术。
背景技术
语音和音频码率控制技术是指语音和音频信号在编码之前,根据信号的内容的重要性,自动调整编码的速率,在重要信息时采样相对高的码率进行编码,在次要信息(比如噪声)时候采样相对低的码率进行编码,使得在带宽下受限的条件下,既能有较好的语音质量,又能节省带宽。该技术一般用于分组域(PS)移动语音通信、移动流媒体服务器等应用中。
现有的分组域(PS)移动语音通信中的语音编码技术大多采用第三代移动通信***中AMR(自适应多码率)语音编码技术,传统的电路域(CS)AMR语音编码的速率控制是由基站来控制的,由于AMR本身并没有提供码率控制功能,所以分组域(PS)的AMR编码实际多采用固定速率进行编码,这个在移动互联网有限的带宽条件下,在带宽和语音质量之间很难达到一个较好的平衡。其他的几种传统的变速率语音编码(如QCELP、EVRC和SMV等)一般只用于传统的电路域(CS)语音通信,且基本是采用语音活性检测(VAD,Voice Activity Detector)检测加信号能量判断的方法来进行速率控制,这类方法过多依赖于信号能量的大小,而实际上信号内容的重要性并不能完全反映在能量大小上。
实用新型内容
本实用新型解决的技术问题是提出一种应用于变速率语音和音频编码的码率自动控制***,实现在带宽受限条件下的分组域移动语音通信中,根据要编码的信号内容的重要性来自动调整码率,提升语音和音频的质量。
本实用新型提出的应用于变速率语音和音频编码的码率自动控制***,包括:变速率编码器、自适应码率控制单元;输入的语音或音频PCM信号分别输入所述变速率编码器和所述自适应码率控制单元的信号输入端,所述自适应码率控制单元通过计算所述PCM信号的子带信噪比得到编码速率调整参数,并将所述调整参数输出到所述变速率编码器的变速率编码控制端完成对所述PCM信号的变速率编码。
进一步的,所述自适应码率控制单元包括:频域变换模块、子带处理模块、子带信噪比计算模块、以及码率输出模块;所述PCM信号经过所述频域变换模块进行频域变换,并由所述子带处理模块进行子带划分、子带信号能量计算以及子带噪声能量计算,然后经过子带信噪比计算模块进行子带信噪比计算,并由所述码率输出模块通过与历史帧的子带时域平均信噪比的比较得到编码速率调整参数。
进一步的,所述子带处理模块包括:子带信号处理模块和子带噪声处理模块;所述子带信号处理模块与所述频域变换模块相连,对所述频域变换后的信号进行子带划分和子带信号能量计算,然后由所述子带噪声处理模块完成子带噪声能量计算。
进一步的,在所述子带信号处理模块和子带噪声处理模块之间还包括判断输入信号是否为噪声信号的语音活性检测模块。
本实用新型通过计算信号子带信噪比来自动调节编码码率,压缩后的码流与现有技术大小相当的固定码率压缩后的码流相比,采用本实用新型解压后的信噪比有明显的提升。在一个实验中,将相同的一端语音信号分别采用固定码率(AMR 7.95kbps)进行编码和采用本实用新型的码率自动控制***进行辅助编码的比较分析,对解码后得到的两个信号的信噪比曲线进行对比,两种方式压缩后的码流大小相当,但是采用本实用新型时,解压后信噪比有明显提升,最大有13dB的信噪比提升。在另一个实验中,将相同的一段音乐信号采用固定码率(AMR 7.95kbps)进行编码和采用本实用新型的码率自动控制***进行辅助编码的比较分析,对解码后得到的两个信号的信噪比曲线进行对比,两种方式压缩后的码流大小相当,但是采用本实用新型时,主旋律信号信噪比有明显提升,最大有10dB的信噪比提升。
附图说明
图1为本实用新型实施例一的码率自动控制***原理图;
图2为本实用新型实施例二的自适应码率控制单元结构示意图;
图3为本实用新型实施例二中的子带处理模块的结构示意图。
具体实施方式
下面结合附图,并通过具体实施例对本实用新型的具体实现进行说明。
本实用新型的主要实用新型构思是通过计算信号子带信噪比来自动调节编码码率的。首先通过对输入的语音或音频PCM信号进行预处理和频域变换,得到频域信号后,划分子带并计算子带信噪比,然后进行背景噪声检测来区分输入信号是否为噪声,如果为噪声则进行背景噪声能力更新,最后计算子带信噪比并根据信噪比自适应计算最优码率,最优码率值输出给变速率编码器进行语音或者音频信号编码。
实施例一
如图1所示的码率自动控制***,包括:变速率编码器和自适应码率控制单元。输入的语音或音频PCM信号分别输入变速率编码器和自适应码率控制单元的信号输入端。自适应码率控制单元通过计算PCM信号的子带信噪比得到编码速率调整参数,并将该调整参数输出到变速率编码器的变速率编码控制端。变速率编码器根据编码速率调整参数完成对所述PCM信号的变速率编码处理,输出编码后的码流。
实施例二
本实用新型的核心单元为自适应码率控制单元。如图2所示,在本实施例中该单元包括:频域变换模块、子带处理模块、子带信噪比计算模块、以及码率输出模块。PCM信号输入自适应码率控制单元时,先经过所述频域变换模块进行频域变换,并由子带处理模块进行子带划分、子带信号能量计算以及子带噪声能量计算,然后经过子带信噪比计算模块进行子带信噪比计算,并由码率输出模块通过与历史帧的子带时域平均信噪比的比较得到编码速率调整参数。
其中的确定编码速率调整参数的处理可以采用以下方式:
在频域坐标上,计算关键频带(窄带语音一般为750Hz~3400Hz,音频信号视采样率而定)平均信噪比a,然后在时间坐标上,计算连续若干历史帧的时域平均信噪比b,再根据两者之间的实时变化差异(波动)来映射相应的码率,从而达到码率自动调整的目的。
在一种实施方式中,如图3所示,子带处理模块包括:子带信号处理模块和子带噪声处理模块。子带信号处理模块与频域变换模块相连,对频域变换后的信号进行子带划分和子带信号能量计算,然后由子带噪声处理模块完成子带噪声能量计算。为了检测当前信号是否为噪声或语音,还可以在子带信号处理模块和子带噪声处理模块之间设置用于判断输入信号是否为噪声信号的语音活性检测模块。该语音活性检测模块可以采用语音尺度计算和谱偏估计来完成语音活性检测。
综上所述,本实用新型提出的码率自动控制***,能够根据信号内容自动调节编码的码率,在重要语音信号或音乐主旋律时采用高的码率进行编码,在噪声或者次要的背景音乐时采用低的码率,以保证整体的语音质量。和现有的码率控制技术相比,具有以下特点:(1)它通过计算信号子带信噪比来区分信号内容的重要性,从而实现自动调节码率的目的,比传统的能量判断的方法有较好的鲁棒性;(2)既支持对语音编码的速率控制外,同时也支持对音频信号的变速率编码,因为音乐信号的主旋律也是可以通过计算子带信噪比来检测的。该***在编码之前进行实施。本实用新型的码率自动控制***,可以应用在带宽受限条件下分组域移动语音通信中,以提升传输的语音和音频信号的质量。
以上所述仅为本实用新型的较佳实施例,并不用以限制本实用新型,凡在本实用新型的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。

Claims (4)

1.一种应用于变速率语音和音频编码的码率自动控制***,其特征在于,包括:变速率编码器、自适应码率控制单元;输入的语音或音频PCM信号分别输入所述变速率编码器和所述自适应码率控制单元的信号输入端,所述自适应码率控制单元通过计算所述PCM信号的子带信噪比得到编码速率调整参数,并将所述调整参数输出到所述变速率编码器的变速率编码控制端完成对所述PCM信号的变速率编码。
2.根据权利要求1所述的码率自动控制***,其特征在于,所述自适应码率控制单元包括:频域变换模块、子带处理模块、子带信噪比计算模块、以及码率输出模块;所述PCM信号经过所述频域变换模块进行频域变换,并由所述子带处理模块进行子带划分、子带信号能量计算以及子带噪声能量计算,然后经过子带信噪比计算模块进行子带信噪比计算,并由所述码率输出模块通过与历史帧的子带时域平均信噪比的比较得到编码速率调整参数。
3.根据权利要求2所述的码率自动控制***,其特征在于,所述子带处理模块包括:子带信号处理模块和子带噪声处理模块;所述子带信号处理模块与所述频域变换模块相连,对所述频域变换后的信号进行子带划分和子带信号能量计算,然后由所述子带噪声处理模块完成子带噪声能量计算。
4.根据权利要求3所述的码率自动控制***,其特征在于,在所述子带信号处理模块和子带噪声处理模块之间还包括判断输入信号是否为噪声信号的语音活性检测模块。
CN2011205731838U 2011-12-31 2011-12-31 一种应用于变速率语音和音频编码的码率自动控制*** Withdrawn - After Issue CN202487155U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011205731838U CN202487155U (zh) 2011-12-31 2011-12-31 一种应用于变速率语音和音频编码的码率自动控制***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011205731838U CN202487155U (zh) 2011-12-31 2011-12-31 一种应用于变速率语音和音频编码的码率自动控制***

Publications (1)

Publication Number Publication Date
CN202487155U true CN202487155U (zh) 2012-10-10

Family

ID=46961559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011205731838U Withdrawn - After Issue CN202487155U (zh) 2011-12-31 2011-12-31 一种应用于变速率语音和音频编码的码率自动控制***

Country Status (1)

Country Link
CN (1) CN202487155U (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543090A (zh) * 2011-12-31 2012-07-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制***
CN103915097A (zh) * 2013-01-04 2014-07-09 ***通信集团公司 一种语音信号处理方法、装置和***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543090A (zh) * 2011-12-31 2012-07-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制***
CN102543090B (zh) * 2011-12-31 2013-12-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制***
CN103915097A (zh) * 2013-01-04 2014-07-09 ***通信集团公司 一种语音信号处理方法、装置和***
CN103915097B (zh) * 2013-01-04 2017-03-22 ***通信集团公司 一种语音信号处理方法、装置和***

Similar Documents

Publication Publication Date Title
CN102543090B (zh) 一种应用于变速率语音和音频编码的码率自动控制***
US10373630B2 (en) Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices
CN102044243B (zh) 语音激活检测方法与装置、编码器
US10049684B2 (en) Audio bandwidth selection
CN103310793B (zh) 一种水声实时数字语音通信方法
CN111429925B (zh) 一种降低音频编码速率的方法及***
CN102985969B (zh) 编码装置、解码装置和编码方法、解码方法
CN100385842C (zh) 自适应多速率编解码器的编解码模式自适应方法和设备
CN1161749C (zh) 保持语言编码中目标比特率的方法和装置
WO2008148321A1 (fr) Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil
WO2008049115A3 (en) System and method for monitoring the connection of an end-user to a remote network
CN105812097B (zh) 一种基于网络状态的amr编码速率自适应调整方法
MX2014007968A (es) Metodo, aparato, y sistema para procesar datos de audio.
CN103632681A (zh) 一种谱包络静音检测方法
CN101854308A (zh) VoIP***高音质服务网络自适应实现方法
CN111768793A (zh) 一种lc3音频编码器编码优化方法、***、存储介质
CN106912092B (zh) 调整发射功率的方法及装置
WO2005060340A3 (en) Codec-assisted capacity enhancement of wireless voip
CN104506287A (zh) 一种td-lte应急通信下的实时语音通信方法
CN103915097B (zh) 一种语音信号处理方法、装置和***
CN202487155U (zh) 一种应用于变速率语音和音频编码的码率自动控制***
CN104167210A (zh) 一种轻量级的多方会议混音方法和装置
CN103229544A (zh) 源信号自适应帧聚合
NO20032174L (no) Reduksjon av sendereffekt i et höyhastighets sambandssystem
CN102800318A (zh) 音频数据流的发送、接收装置及方法

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
AV01 Patent right actively abandoned

Granted publication date: 20121010

Effective date of abandoning: 20131204

RGAV Abandon patent right to avoid regrant