CN103187065A - 音频数据的处理方法、装置和*** - Google Patents

音频数据的处理方法、装置和*** Download PDF

Info

Publication number
CN103187065A
CN103187065A CN2011104558367A CN201110455836A CN103187065A CN 103187065 A CN103187065 A CN 103187065A CN 2011104558367 A CN2011104558367 A CN 2011104558367A CN 201110455836 A CN201110455836 A CN 201110455836A CN 103187065 A CN103187065 A CN 103187065A
Authority
CN
China
Prior art keywords
noise
band signal
sid
energy
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104558367A
Other languages
English (en)
Other versions
CN103187065B (zh
Inventor
王喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201110455836.7A priority Critical patent/CN103187065B/zh
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to MYPI2014001949A priority patent/MY173976A/en
Priority to SG11201403686SA priority patent/SG11201403686SA/en
Priority to CA2861916A priority patent/CA2861916C/en
Priority to RU2014131387/08A priority patent/RU2579926C1/ru
Priority to MX2014007968A priority patent/MX338445B/es
Priority to JP2014549344A priority patent/JP6072068B2/ja
Priority to KR1020147020836A priority patent/KR101693280B1/ko
Priority to EP12861377.5A priority patent/EP2793227B1/en
Priority to AU2012361423A priority patent/AU2012361423B2/en
Priority to KR1020167036611A priority patent/KR101770237B1/ko
Priority to CA3059322A priority patent/CA3059322C/en
Priority to CA3181066A priority patent/CA3181066A1/en
Priority to SG10201609338SA priority patent/SG10201609338SA/en
Priority to RU2016100179A priority patent/RU2617926C1/ru
Priority to BR112014016153-4A priority patent/BR112014016153B1/pt
Priority to PCT/CN2012/087812 priority patent/WO2013097764A1/zh
Priority to ES12861377.5T priority patent/ES2610783T3/es
Priority to PT128613775T priority patent/PT2793227T/pt
Publication of CN103187065A publication Critical patent/CN103187065A/zh
Priority to US14/318,899 priority patent/US9406304B2/en
Priority to IN1436KON2014 priority patent/IN2014KN01436A/en
Priority to ZA2014/04996A priority patent/ZA201404996B/en
Priority to HK14113112.0A priority patent/HK1199543A1/zh
Publication of CN103187065B publication Critical patent/CN103187065B/zh
Application granted granted Critical
Priority to ZA2016/00247A priority patent/ZA201600247B/en
Priority to US15/188,518 priority patent/US9892738B2/en
Priority to JP2016252612A priority patent/JP6462653B2/ja
Priority to RU2017113357A priority patent/RU2641464C1/ru
Priority to US15/867,977 priority patent/US10529345B2/en
Priority to US16/697,822 priority patent/US11183197B2/en
Priority to US17/507,200 priority patent/US11727946B2/en
Priority to US18/344,445 priority patent/US20230352035A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)

Abstract

本发明公开了一种音频数据的处理方法、装置和***,属于通信技术领域。所述方法包括:获取音频信号的噪声帧,并将所述当前噪声帧分解为噪声低带信号和噪声高带信号;以第一非连续传输机制编码传输所述噪声低带信号;以第二非连续传输机制编码传输所述噪声高带信号。本发明通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的。

Description

音频数据的处理方法、装置和***
技术领域
本发明涉及通信技术领域,特别涉及一种音频数据的处理方法、装置和***。
背景技术
在数字通信领域,语音、图像、音频、视频的传输有着非常广泛的应用需求,如手机通话、音视频会议、广播电视、多媒体娱乐等。语音被数字化处理,通过语音通信网络从一个终端传递到另一个终端,这里的终端可以是手机、数字电话终端或其他任何类型的语音终端,数字电话终端例如VOIP电话或ISDN电话、计算机、电缆通信电话。为了降低音频信号存储或者传输过程中占用的资源,音频信号在发送端进行压缩处理后传输到接收端,接收端通过解压缩处理恢复音频信号并进行播放。
在语音通信中只有大约40%的时间是包含语音的,其它时间都是静音或背景噪声。为了节省传输带宽,避免在静音或背景噪声段消耗不必要的带宽,DTX/CNG(Discontinuoustransmission system/Comfort Noise Generation,非连续传输/舒适噪声生成)技术应运而生。DTX/CNG简单的说就是不对噪声帧进行连续的编码,而是按照某种策略在噪声/静音期间每间隔若干帧才做一次编码,且编码的码率通常较对语音帧编码的码率低的多。这种低速率的噪声编码帧叫做SID(Silence Insertion Descriptor,静音***描述帧)。解码器根据间断的接收到的SID在解码端恢复出连续的背景噪声帧来。这种连续的恢复出的背景噪声并不是对编码端背景噪声的忠实重现,而是力求能够尽量不引入听觉上的质量下降,使用户听起来感觉比较舒适,这种恢复出的背景噪声就叫做CN(Comfort Noise,舒适噪声),这种解码端恢复CN的方法就叫做舒适噪声生成。
现有技术中,ITU-T G.718是较新的一个标准化的宽带编解码器,其中包含了一个宽带的DTX/CNG***。该***可以依据固定间隔发送SID,也可以根据估计出的噪声电平高低自适应的调节SID的发送间隔。G.718SID帧由16个ISP参数和激励能量参数组成。该组ISP(Immittance Spectral Pair,导抗谱对)参数表征的是噪声在整个宽带带宽上的频谱包络,激励能量则是由该组ISP参数表示的分析滤波器得到的。在解码端,G.718在CNG状态下根据解码SID得到的ISP参数估计出CNG所需的LPC系数,根据解码SID帧得到的激励能量参数估计出CNG所需的激励能量,使用经增益调整后的白噪声激励CNG合成滤波器得到重建的CN。
但是对于超宽带频谱包络来说,由于超宽带的带宽极宽,如果将现有技术扩展到超宽带DTX/CNG***的话,由于SID需要编码完整的超宽带频谱包络,这就需要消耗更多的计算量和比特来计算和编码增加的十几个ISP参数。由于噪声的高带信号(这里指宽带以上的频率范围)通常在听觉上都感知不敏感,为这部分信号消耗的计算量和比特就变得很不划算,从而降低了编解码器的编码效率。
发明内容
为了解决由于超宽带的编码传输问题,本发明实施例提供了一种音频数据的处理方法、设备和***。所述技术方案如下:
一方面,提供了一种音频数据的处理方法,所述方法包括:
获取音频信号的噪声帧,并将所述噪声帧分解为噪声低带信号和噪声高带信号;
以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,其中所述第一非连续传输机制的第一静音***描述帧SID的发送策略和所述第二非连续传输机制的第二SID的发送策略不的,或,所述第一非连续传输机制的第一SID的编码策略和所述第二非连续传输机制的第二SID的编码策略不同。
一方面,提供了一种音频数据的处理方法,其特征在于,所述方法包括:
解码器获取静音***描述帧SID,判断所述SID是否包含低带参数和/或包含高带参数;
如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;
如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;
如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。
另一方面,提供了一种音频数据的编码装置,所述装置包括:
获取模块,用于获取音频信号的噪声帧,并将所述噪声帧分解为噪声低带信号和噪声高带信号;
传输模块,用于以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,其中所述第一非连续传输机制的第一静音***描述帧SID的发送策略和所述第二非连续传输机制的第二SID的发送策略不的,或,所述第一非连续传输机制的第一SID的编码策略和所述第二非连续传输机制的第二SID的编码策略不同。
另一方面,还提供了一种音频数据的解码装置,所述装置包括:
获取模块,用于获取静音***描述帧SID,判断所述SID是否包含低带参数和/或包含高带参数;
第一解码模块,用于如果所述获取模块获取的SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;
第二解码模块,用于如果所述获取模块获取的SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;
第三解码模块,用于如果所述获取模块获取的SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。
另一方面,还提供了一种音频数据的处理***,所述***包括:如上所述的音频数据的编码装置和如上所述的音频数据的解码装置。
本发明实施例提供的技术方案带来的有益效果是:将当前噪声帧分解为噪声低带信号和噪声高带信号,以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,解码器获取静音***描述帧SID,判断所述SID是否包含低带参数和/或包含高带参数;针对不同判断结果采用不同的噪声解码方式。这样通过对高带信号和低带信号不同的噪声编解码处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1中提供的一种音频数据处理的方法的流程图;
图2是本发明实施例2中提供的一种音频数据处理的方法的流程图;
图3是本发明实施例3中提供的一种音频数据处理的方法的流程图;
图4是本发明实施例4中提供的一种音频数据处理的方法的流程图;
图5是本发明实施例6中提供的一种音频数据的编码装置的示意图;
图6是本发明实施例6中提供的另一种音频数据的编码装置的示意图;
图7是本发明实施例7中提供的一种音频数据的解码装置的示意图;
图8是本发明实施例7中提供的另一种音频数据的解码装置的示意图;
图9是本发明实施例8中提供的一种音频数据的处理***的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
参见图1,本实施例提供了一种音频数据的处理方法,所述方法包括:
101、获取音频信号的噪声帧,并将所述噪声帧分解为噪声低带信号和噪声高带信号;
102、以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,其中所述第一非连续传输机制的第一静音***描述帧SID的发送策略和所述第二非连续传输机制的第二SID的发送策略不同,或,所述第一非连续传输机制的第一SID的编码策略和所述第二非连续传输机制的第二SID的编码策略不同。
本实施例中,所述第一SID包含所述噪声帧的低带参数,所述第二SID包含所述噪声帧的低带参数或高带参数。
可选地,本实施例中,以第二非连续传输机制编码传输所述噪声高带信号,包括:
判断所述噪声高带信号是否具有预设的频谱结构,如果是,且满足所述第二SID发送策略的中的发送条件,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。
其中,所述判断所述噪声高带信号是否具有预设的频谱结构包括:
获得所述噪声高带信号的频谱,将所述频谱划分为至少两个子带,如果所述子带中任一第一子带的平均能量均不小于所述子带中第二子带的平均能量,其中所述第二子带所处的频带高于所述第一子带所处频带,则确认所述噪声高带信号不具有预设的频谱结构,否则所述噪声高带信号具有预设的频谱结构。
可选地,本实施例中,所述以第二非连续传输机制编码传输所述噪声高带信号,包括:
根据第一比值和第二比值生成偏离程度值,其中所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值;
判断所述偏离程度值是否达到预设的阈值,如果是,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。
其中,可选地,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:
所述第一比值是所述噪声帧的噪声高带信号的即时能量与所述噪声低带信号的即时能量的比值;
相应地,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的即时能量和噪声低带信号的即时能量的比值;
或,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:
所述第一比值是所述噪声帧及其之前的噪声帧的噪声高带信号的加权平均能量与所述噪声帧及其之前的噪声帧的噪声低带信号的加权平均能量的比值;
相应地,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声帧及其之前的噪声帧的高带信号的加权平均能量和低带信号的加权平均能量的比值。
本实施例中,所述根据第一比值和第二比值生成偏离程度值,包括:
分别计算第一比值的对数值和第二比值的对数值;
计算所述第一比值的对数值和所述第二比值的对数值的差的绝对值,得到所述偏离程度值。
可选地,本实施例中,所述以第二非连续传输机制编码传输所述噪声高带信号,包括:
判断所述噪声帧的噪声高带信号的频谱结构与在所述噪声帧之前的噪声高带信号的平均频谱结构相比是否满足预设条件,如果是,则以所述第二编码策略编码所述噪声帧的噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声帧的噪声高带信号进行编码传输。
其中,所述噪声帧之前的噪声高带信号的平均频谱结构包括:在所述噪声帧之前的噪声高带信号的频谱的加权平均。
本实施例中,所述第二非连续传输机制的第二SID的发送策略中的发送条件还包括:所述第一非连续传输机制满足所述第一SID的发送条件。
本发明提供的方法实施例的有益效果是:获取音频信号的当前噪声帧,并将所述当前噪声帧分解为噪声低带信号和噪声高带信号,以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,这样通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。
实施例2
参见图2,本实施例中提供了一种音频数据的处理方法,所述方法包括:
201、解码器获取静音***描述帧SID,判断所述SID是否包含低带参数或包含高带参数;
202、如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;
203、如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;
204、如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。
可选地,本实施例中如果所述SID包含所述低带参数,则所述解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧之前,还包括:
如果所述解码器处于第一舒适噪声生成CNG状态,则所述解码器进入第二CNG状态。
可选地,本实施例中,如果所述SID包含所述高带参数和所述低带参数,则所述解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧之前,还包括:
如果所述解码器处于所述第二CNG状态,则所述解码器进入第一CNG状态。
可选地,本实施例中,判断所述SID是否包含低带参数和/或包含高带参数包括:
如果所述SID的比特数小于预设的第一阈值,则确认所述SID包含有高带参数;如果所述SID的比特数大于预设的第一阈值且小于预设的第二阈值,则确认所述SID包含有低带参数;如果所述SID的比特数大于预设的第二阈值且小于预设的第三阈值,则确认所述SID包含有高带参数和低带参数;
或,如果所述SID中包含第一标识符,则确认所述SID包含有高带参数,如果所述SID中包含第二标识符,则确认所述SID包含有低带参数,如果所述SID中包含第三标识符,则确认所述SID包含有低带参数和高带参数。
本实施例中,所述在本地生成噪声高带参数包括:
分别获得所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数;
根据所述获得的所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数得到所述噪声高带信号。
可选地本实施例中,所述获得所述SID所对应的时刻的噪声高带信号的加权平均能量,包括:
根据所述解码得到的噪声低带参数得到第一CN帧的低带信号的能量;
计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量和噪声低带信号的能量的比值得到第一比值;
根据所述第一CN帧的低带信号的能量和所述第一比值,获得所述SID的对应的时刻的噪声高带信号的能量;
将所述SID对应的时刻的噪声高带信号的能量与本地缓存的CN帧的高带信号的能量做加权平均,得到所述SID对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
可选地本实施例中,所述计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量和噪声低带信号的能量的比值得到第一比值,包括:
计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的即时能量和噪声低带信号的即时能量的比值得到第一比值;
或,计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量的加权平均和噪声低带信号的能量的加权平均的比值得到第一比值。
其中,当所述SID对应的时刻的噪声高带信号的能量大于所述本地缓存的前一CN帧的高带信号的能量时,则以第一速率更新所述本地缓存的前一CN帧的高带信号的能量,否则以第二速率更新所述本地缓存的前一CN帧的高带信号的能量,所述第一速率大于所述第二速率。
可选地本实施例中,所述获得所述SID所对应的时刻的噪声高带信号的能量的加权平均,包括:
选取所述SID之前预设时间段内的语音帧中高带信号能量最小的语音帧的高带信号;
根据所述语音帧中高带信号能量最小的语音帧的高带信号的能量获得所述SID所对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量;
或,选取所述SID之前预设时间段内的语音帧中高带信号能量小于预设阈值的N个语音帧的高带信号;
根据所述N个语音帧的高带信号的加权平均能量获得所述SID所对应的时刻的噪声高带信号的能量的加权平均,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
可选地本实施例中,所述获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数,包括:
在高带信号所对应的频率范围内分布M个ISF(Immittance Spectral Frequency,导抗谱频率)系数或ISP系数或LSF(Line Spectral Frequency,线谱频率)系数或LSP(LineSpectral pair,线谱对)系数;
对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过N帧发生改变,其中所述M和所述N均为自然数;
根据所述随机化处理后的滤波器系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
可选地,本实施例中,所述获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数,包括:
获取本地缓存的噪声高带信号的所述M个ISF系数或ISP系数或LSF系数或LSP系数;
对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过所述N帧发生改变;
根据所述随机化处理后的滤波系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
可选地,本实施例中,所述根据所述解码得到的噪声低带参数和所述本地生成的噪声高带参数得到第一CN帧之前,还包括:
当与所述SID相邻的历史帧为语音编码帧时,若所述语音编码帧解码出的高带信号或部分高带信号的平均能量小于所述本地生成的噪声高带信号或部分噪声高带信号的平均能量时,对从所述SID开始的后续L帧的噪声高带信号乘以小于1的平滑系数,得到新的本地生成的噪声高带信号的能量的加权平均;
相应地,所述根据所述解码得到的噪声低带参数和所述本地生成的噪声高带参数得到第一CN帧,包括:
根据所述解码得到的噪声低带参数、所述SID所对应的时刻的噪声高带信号的合成滤波器系数和所述新的本地生成的噪声高带信号的能量的加权平均得到第四CN帧。
本发明提供的方法实施例的有益效果是:解码器获取静音***描述帧SID,判断所述SID是否包含低带参数和/或包含高带参数;如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。这样通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。
实施例3
本实施例中提供了一种音频数据的处理方法,对于编码端,不管是低频带的CNG噪声谱还是高频带的CNG噪声谱通常都已失去了谐波结构了,这样,CNG高频带信号对听觉感知起作用的将主要是其能量而非谱结构。因此,在对超宽带信号进行DTX传输时,很多情况下是没必要在SID中传输高带信号谱的,而可以通过适当的方法在解码端本地构造出高带谱,这种本地构造出的高带频谱并不会造成明显的感知失真。这样,在编码端计算和编码高带谱的计算量和比特就节省下来了。同时,对于另一些噪声信号,其在高带信号可能存在一定的谐波结构,仅靠解码端本地构造高带频谱可能会在CNG段与语音段切换时产生感知质量下降的问题,因此这类噪声则需要在SID中传输高带信号的谱参数。可见,一个兼顾效率和质量的DTX/CNG***应该是在编码端能够根据背景噪声的高带特征自适应的选择在SID中编码或不编码高带谱参数,而在解码端根据SID的不同类型采用不同的解码方法来重建CNG帧。本实施例中,提供了一种音频数据的处理方法包括:对噪声高带频谱的分析/分类,解码器对高带信号谱的盲构造,当SID不包含高带能量参数时解码器对高带信号能量的估计,解码器在不同CNG模块间的切换等。参见图3,具体的本实施例中在编码器端提供的音频数据的处理方法包括:
301、编码器获取音频信号的噪声帧,并将噪声帧分解为噪声低带信号和噪声高带信号。
本实施例中,由于编码器编码规则不同,编码器获取音频信号的噪声帧,其中该噪声帧可以是当前噪声帧,也可以是编码器端缓存的噪声帧对此本实施例不做具体限定。本实施例中,以32kHz采样的超宽带输入音频信号为例。编码器首先对输入音频信号进行分帧处理,以20ms(或640采样点)为一帧。对当前帧(本实施例中当前帧指当前待编码帧),编码器首先进行一个高通滤波,通带为50Hz以上的频率。将高通滤波后的当前帧通过QMF(QuadratureMirror Filter,正交镜像滤波器)分析滤波器分解为一个低带信号s0和一个高带信号s1,其中低带信号s0为16kHz采样,表征当前帧的0~8kHz谱,高带信号s1也是16kHz采样,表征当前帧的8~16kHz谱。当VAD(Voice Activity Detector,语音激活检测器)指示当前帧为前景信号帧,即语音信号帧时,则编码器对当前帧进行语音编码,本实施例中,编码器对语音编码帧进行编码属于现有技术范畴,对此本实施例不再赘述。当VAD指示当前帧为噪声帧时编码器进入DTX工作状态,本实施例中噪声帧既指背景噪声帧也指静音帧。
本实施例中,在DTX工作状态下,DTX控制器根据SID发送策略决定当前帧的低带信号是否编码SID并发送。本实施例中低带信号SID发送策略如下:1)在语音编码帧之后的第一个噪声帧发送SID,设置发送SID标志flagSID=1;2)在噪声期间,在每一SID帧之后第N帧发送一次SID帧,在该帧设置flagSID=1,其中N为大于1的整数,由编码器外部输入;3)噪声期间的其余帧不发送SID,设置flagSID=0。其中,本实施例中低带信号的SID发送策略与现有技术类似,本发明对此不做详细描述。
302、判断当前噪声帧的高带信号是否满足预设的编码传输条件,如果是,则执行步骤304,否则执行步骤303。
本实施例中,判断当前噪声帧的高带信号是否满足预设的编码传输条件包括:判断所述噪声高带信号是否具有预设的频谱结构,如果是,且满足所述第二SID发送策略的中的发送条件,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。其中判断所述噪声高带信号是否具有预设的频谱结构包括:获得所述噪声高带信号的频谱,将所述频谱划分为至少两个子带,如果所述子带中任一第一子带的平均能量均不小于所述子带中第二子带的平均能量,其中所述第二子带所处的频带高于所述第一子带所处频带,则确认所述噪声高带信号不具有预设的频谱结构,否则所述噪声高带信号具有预设的频谱结构。
本实施例中,在DTX工作状态下,编码器对当前噪声帧的高带信号s1进行频谱分析以确定s1是否具有较明显的频谱结构,即预设的频谱结构。本实施例中的具体方法为:对s1做下采样到12.8kHz,对下采样后的信号做256点FFT,得到频谱C(i),i=0,...127。将C(i)划分为等宽的4个子带,计算每个子带的能量E(i),每个子带就是上述所说的任一第一子带,
Figure BDA0000127467610000111
i=0,...3,其中l(i),h(i)分别表示第i子带的上下边界。l(i)={0,32,64,96},h(i)={31,63,95,127}。检查是否满足条件:
E ( i ) ≥ ∀ E ( j ) j>i    (1)
其中E(j)就是上述所说的第二子带,若上述公式(1)满足,即所述子带中任一第一子带的能量均不小于所述子带中第二子带的能量,则认为高带信号不具有明显的频谱结构,否则具有。如果高带信号具有明显的频谱结构,则DTX策略为发送高带参数。本实施例中,若发送高带参数标志flaghb不为1,则在下次flagSID=1时设置flaghb=1,否则flaghb=0。
本实施例中,满足SID发送条件时,可以通过当前噪声帧的高带信号的频谱结构来判断当前噪声帧的高带信号是否需要编码传输,将判断所述噪声高带信号是否具有预设的频谱结构且噪声低带信号是否满足SID发送条件,做为第一判断条件,可选地,本实施例中,判断当前噪声帧的高带信号是否满足预设的编码发送条件包括:根据第一比值和第二比值生成偏离程度值,其中所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值;判断所述偏离程度值是否达到预设的阈值,如果是,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。其中,可选地,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:所述第一比值是所述噪声帧的噪声高带信号的即时能量与所述噪声低带信号的即时能量的比值;相应地,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的即时能量和噪声低带信号的即时能量的比值;或,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:所述第一比值是所述噪声帧及其之前的噪声帧的噪声高带信号的加权平均能量与所述噪声帧及其之前的噪声帧的噪声低带信号的加权平均能量的比值;相应地,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声帧及其之前的噪声帧的高带信号的加权平均能量和低带信号的加权平均能量的比值。本实施例中,优选地,根据第一比值和第二比值生成偏离程度值,包括:分别计算第一比值的对数值和第二比值的对数值;取所述第一比值的对数值和所述第二比值的对数值的差的绝对值,得到所述偏离程度值。
具体的,本实施例中,判断所述偏离程度值是否达到预设的阈值可以通过以下方式实现:
在DTX工作状态下,编码器分别计算当前帧高低带信号s1,s0的对数能量e1,e0
ex=10·log10(∑sx(i)2) x=0,1 i=0,1,...,319(2)
更新e1,e0在编码端的长时滑动平均e1a,e0a
Figure BDA0000127467610000121
x=0,1(3)
其中sign[.]表示符号函数,MIN[.]表示取小函数,|.|表示绝对值函数,形式x(-1)表示前一帧x的取值,α=0.1为遗忘系数决定着更新速度的快慢,其中前一帧就是在当前噪声帧前面最近一次发送包含有高带参数的SID。本实施例中对e1a,e0a的更新幅度是受限的,若当前噪声帧的ex较前一帧的exa的能量变化大于3dB,则按3dB更新当前帧的exa。当编码器第一次进入DTX工作状态时,exa初始化为当前帧的ex。检查当前噪声帧高低带信号能量比(即第一比值)是否偏离最近一次发送包含有高带参数的SID时的高低带能量比(第二比值)达一定程度,即检查是否满足如下条件:
| ( e 0 a - e 1 a ) - ( e 0 a - - e 1 a - ) | > 4.5 - - - ( 4 )
其中
Figure BDA0000127467610000123
分别表示最近一次发送包含有高带参数的SID帧时的高低带对数能量,若上述公式(4)满足,则需要对噪声高带信号进行编码发送,其中如果发送高带参数标志flaghb=0,则置flaghb=1。
本实施例中,长时滑动平均属于加权平均计算的一种,对此本实施例不做具体限定。
本实施例中,判断所述偏离程度值是否达到预设的阈值可以做为第二判断条件,在具体的实施过程中,只需要对第一判断条件或是第二判断条件中的任意一个进行判断就可以确认噪声高带信号是否需要进行编码传输,对此本实施例不做具体限定。
本实施例中,第二判断条件是可选地,执行该步骤的目的是为了协助解码端可以根据噪声低带能量和最近一次接收到包含有高带参数的SID时的噪声高低带能量比值在本地估计出高带噪声的能量。具体的,如果在编码端没有计算偏离程度值,在解码端可以通过获取当前噪声帧之前一段时间的语音帧中高带信号能量最小的语音帧,根据当前噪声帧之前一段时间的语音帧中高带信号能量最小的语音帧的高带信号能量在本地估计出当前高带噪声的能量,例如,选取当前噪声帧之前一段时间的语音帧中高带信号能量最小的语音帧的高带信号能量做为当前高带噪声的能量,或,选取所述SID之前预设时间段内的语音帧中高带信号能量小于预设阈值的N个语音帧的高带信号;根据所述N个语音帧的高带信号的加权平均能量获得所述SID所对应的时刻的噪声高带信号的能量的加权平均。具体的本实施例在此不做限定。
303、以第一非连续传输机制编码传输所述噪声低带信号。
本实施例中,优选地,以第一非连续传输机制编码传输所述噪声低带信号包括:在DTX工作状态下,编码器对当前噪声帧的低带信号s0做16阶线性预测分析,获得16个线性预测系数lpc(i),i=0,1,...,15。变换LPC系数到ISP系数得16个ISP系数isp(i),i=0,1,...,15,并将ISP系数缓存。如果当前帧编码SID即flagSID=1,则在缓存的包括当前帧在内的N个历史帧的ISP系数中搜索中值ISP系数,方法为:首先计算每个帧的ISP系数到其余帧ISP系数的距离δ,
δ k = Σ j = 0 - N + 1 Σ i = 0 15 ( lsp ( k ) ( i ) - lsp ( j ) ( i ) ) 2 j≠k,k=0,-1,...,-N+1(5)
然后选择δ最小的帧的ISP系数做为待编码的ISP系数ispSID(i),i=0,...,15。变换ispSID(i)到ISF系数isfSID(i),对isfSID(i)量化,获得一组量化索引idxISF,封装入SID中。本地解码idxISF获得解码后的ISF系数isf’(i),i=0,...,15,变换isf’(i)到ISP系数isp’(i),i=0,...,15,缓存isp’(i)。对每一噪声帧,用缓存的isp’(i)更新编码端的解码后ISP系数长时滑动平均:
isp a ( i ) = α · isp a ( - 1 ) ( i ) + ( 1 - α ) · isp ′ ( i ) i=0,1,...15(6)
优选地,α=0.9,ispa(i)初始化为第一个SID的isp’(i)。变换ispa(i)到LPC系数lpca(i),得到分析滤波器A(Z)。将每一噪声帧的低带信号s0通过A(Z)滤波得到残差信号r(i),i=0,1,...319,计算对数残差能量er
e r = log 2 ( Σ i = 0 319 r ( i ) 2 ) i=0,1,...319(7)
本实施例中缓存er。当当前噪声帧的flagSID=1时,根据缓存的包括当前噪声帧在内的M个历史帧的er计算加权平均对数能量eSID其中w1(k)为一组M维正系数,
其和小于1。对eSID量化得到量化索引idxe
本实施例中,在DTX工作状态下且flagSID=1时,如果flaghb=0,则此时SID帧仅编码发送低带参数,即此时SID帧由idxISF和idxe组成,方便起见称为小SID帧。
本实施例中,对噪声低带信号的编码传输策略与现有技术中对噪声宽带信号的编码传输策略类似,对此本实施例中只是简要的介绍,具体的实现过程本实施例不做详细描述。本实施例中,当前噪声帧的噪声高带信号不需要进行编码,只对噪声低带信号进行编码,节省了编码端的计算量,同时也节省了传输比特。
304、以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号。
本实施例中,若flaghb=1,则除了需要编码低带参数外,SID还需要编码高带参数。其中低带噪声低带参数的编码同步骤303中的编码方式一样,对此本实施例不再赘述。本实施例中优选地,高带参数的编码方法如下:仅当DTX工作状态下且flaghb=1时,编码器对当前帧的高带信号s1做10阶线性预测分析,获得10个线性预测系数lpc(i),i=0,1,...,9。对lpc(i)加权:
lpcw(i)=w2(i)·lpc(i) i=0,1,...9(8)
得到加权后的LPC系数lpcw(i),其中w2(i)为一组9维的小于等于1的加权系数。变换lpcw(i)到LSP系数得10个LSP系数lspw(i),i=0,1,...,9,根据lspw(i)更新编码端lspw(i)的长时滑动平均:
lsp a ( i ) = α · lsp a ( - 1 ) ( i ) + ( 1 - α ) · lsp w ( i ) i=0,1,...9(9)
其中,优选地,α=0.9,lspa(i)在每次flaghb由0变为1时初始化为当前帧的lspw(i)。当SID需要包含高带参数时,对lspa(i)进行量化,获得一组量化索引idxLSP。对高带信号对数能量在编码端的长时滑动平均e1a进行量化,获得量化索引idxE。此时,SID将由idxISF,idxe,idxLSP和idxE组成,本实施例中将由idxISF,idxe,idxLSP和idxE组成的SID称为大SID。
可选地,lspa(i)也可以是在DTX工作状态下连续更新的,即无论flaghb的取值是1或0,均对lspa(i)进行更新,具体的在flaghb=0时,更新lspa(i)的方法与上述flaghb=1时的方法一样,在此本实施例不在赘述。
本实施例中,对噪声高带信号的编码策略与对噪声低带信号的编码策略原理类似,对此本实施例中只是简要的介绍,具体的实现过程本实施例不做详细描述。
本实施例中,在满足噪声高带信号的编码传输条件时,噪声高带信号的编码传输总是和噪声低带信号的编码传输同时进行的,但是可选地,噪声高带信号的编码传输与噪声低带信号的编码传输也可以不同时进行,即在发送SID时存在三种可能的情况:1)对当前噪声帧只进行低带信号的编码传输;2)对当前噪声帧只进行高带信号的编码传输;3)对当前噪声帧同时进行低带和高带信号的编码传输,此时所述第二非连续传输机制的第二SID的发送策略中的发送条件还包括:所述第一非连续传输机制满足所述第一SID的发送条件。对以上三种发送SID的情况本实施例不做具体限定。
本实施例中,步骤302-304为具体执行以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号的步骤,其中所述第一非连续传输机制的第一静音***描述帧SID的发送策略和所述第二非连续传输机制的第二SID的发送策略是不同的,或,所述第一非连续传输机制的第一SID的编码策略和所述第二非连续传输机制的第二SID的编码策略是不同的。
本发明提供的方法实施例的有益效果是:获取音频信号的当前噪声帧,并将所述当前噪声帧分解为噪声低带信号和噪声高带信号,以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,这样通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。
实施例4
本实施例中提供了一种音频数据的处理方法,相对于编码器端对噪声信号的处理,解码端根据接收到的码流可以判断出当前帧是语音编码帧还是SID或NO_DATA帧。NO_DATA帧表示编码端在噪声期间没有编码发送SID的帧。在当前帧为SID时解码器还可以进一步根据SID的比特数判断是该SID是否包含有低带和/或高带参数。可选地,解码器也可以根据打入SID中的特定标识来判断SID是否包含有低带和/或高带参数,这需要在编码SID时加入额外的标识比特,如当在SID中打入第一标识符时,标识该SID只含有高带参数,打入第二标识符时,标识该SID只含有低带参数,打入第三标识符,标识该SID包含有高带参数和低带参数。若当前帧为语音编码帧,则解码器进行语音帧解码,具体处理过程与现有技术类似,本实施例对此不做详细描述。若当前帧为SID或NO_DATA帧,则解码器根据CNG的具体工作状态选择各自对应的方法重建CN帧。本实施例中CNG有两种工作状态,对应于小SID帧的半解码CNG状态,即第一CNG状态,对应于大SID帧的全解码CNG状态,即第二CNG状态。在全解码CNG状态下,解码器根据解码大SID帧得到的噪声高低带参数重建出CN帧。在半解码CNG状态下,解码器根据解码小SID帧得到的噪声低带参数以及本地估计出的噪声高带参数重建CN帧。当解码端的当前帧为大SID帧时,如果CNG工作状态标志flagCNG=0(表示半解码CNG状态),则设置CNG工作状态标志flagCNG=1(表示全解码CNG状态),否则维持原状态。同样,当解码端的当前帧为小SID帧时,如果CNG工作状态标志flagCNG=1,则设置CNG工作状态标志flagCNG=0,否则维持原状态。参见图4,具体的本实施例中提供的在解码器端的音频数据的处理方法包括:
401、解码器获取SID,如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。
本实施例中,解码器端接收到编码器端发送的编码帧后,先判断该语音帧的类型,以便根据语音帧的不同类型相应采用不同的解码方式。具体的,如果所述SID的比特数小于预设的第一阈值,则确认所述SID包含有高带参数;如果所述SID的比特数大于预设的第一阈值且小于预设的第二阈值,则确认所述SID包含有低带参数;如果所述SID的比特数大于预设的第二阈值且小于预设的第三阈值,则确认所述SID包含有高带参数和低带参数;或,如果所述SID中包含第一标识符,则确认所述SID包含有高带参数,如果所述SID中包含第二标识符,则确认所述SID包含有低带参数,如果所述SID中包含第三标识符,则确认所述SID包含有低带参数和高带参数。
本实施例中,如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。具体的,解码器解码SID得到解码的低带激励对数能量eD,低带ISF系数isfd(i),高带对数能量ED和高带LSP系数lspd(i)。变换isfd(i)到ISP系数ispd(i),转换eD,ED到能量ed,Ed,其中, E d = 10 0.1 · E D , e d = 2 e D , 缓存ispd(i),ed,lspd(i)和Ed
本实施例中,当解码器在CNG工作状态下且flagCNG=1时,无论当前帧是SID还是NO_DATA帧,使用缓存的ispd(i),ed,lspd(i)和Ed更新它们各自在解码端的长时滑动平均,
isp CN ( i ) = α · isp CN ( - 1 ) ( i ) + ( 1 - α ) · isp d ( i ) i=0,1,...15
lsp CN ( i ) = β · lsp CN ( - 1 ) ( i ) + ( 1 - β ) · lsp d ( i ) i=0,1,...9
(10)
e CN = β · e CN ( - 1 ) + ( 1 - β ) · e d
E CN = β · E CN ( - 1 ) + ( 1 - β ) · E d
其中α=0.9,β=0.7。将ECN缓存入高带能量缓存E1old。在eCN的基础上加上一个随机小能量得到最终用于重建低带噪声信号的激励能量e’CN,e′CN=(1+0.000011·RND·eCN)·eCN,其中RND是一个在[-32767,32767]范围内的随机数。本实施例中,生成一个320点的白噪声序列exc0(i),i=0,1,…319,利用e’CN对exc0(i)进行增益调整得到exc’0(i),即将exc0(i)乘以一个增益系数G0使得exc0(i)的能量等于e’CN,其中
Figure BDA0000127467610000171
将ispCN(i)变换为LPC系数得到合成滤波器1/A0(Z),使用增益调整后的激励exc’0(i)激励滤波器1/A(Z)得到解码端重建的16kHz采样低带CN信号s’0,计算s’0的能量并缓存入低带能量缓存E0old
本实施例中,对于解码端对噪声高带信号与对噪声低带信号的处理类似,生成另一个320点的白噪声序列exc1(i),i=0,1,…319,将lspCN(i)变换为LPC系数得到合成滤波器1/A1(Z),使用exc1(i)激励滤波器1/A1(Z)得到未经增益调整的高带CN信号s 1(i)。对s 1(i)乘以增益系数G1和G2=0.8,得到解码端重建的16kHz采样高带CN信号s’1。其中
Figure BDA0000127467610000172
本实施例中,G2的目的是对重建的噪声信号做一定程度的能量抑制。
本实施例中,解码器端将s’0,s’1通过QMF合成滤波器,得到解码器重建的最终32kHz采样的第一CN帧。
402、如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一CN帧。
本实施例中,当解码器在CNG工作状态下且flagCNG=0时,无论当前帧是SID还是NO_DATA帧,依照与flagCNG=1时相同的方法,即步骤402中的方法得到解码端重建的16kHz采样低带CN信号s’0,对此本实施例不再赘述。
本实施例中,第一CN帧的高带信号仍然以用白噪声激励合成滤波器的方法得到,只是第一CN帧的高带信号能量和合成滤波器系数依靠本地估计得到。本实施例中,在本地生成噪声高带参数包括:分别获得所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数;根据所述获得的所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数得到所述噪声高带信号。
本实施例中优选地,获得所述SID所对应的时刻的噪声高带信号的加权平均能量,包括:根据所述解码得到的噪声低带参数得到第一CN帧的低带信号的能量;计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量和噪声低带信号的能量的比值得到第一比值;根据所述第一CN帧的低带信号的能量和所述第一比值,获得所述SID的对应的时刻的噪声高带信号的能量;将所述SID对应的时刻的噪声高带信号的能量与本地缓存的CN帧的高带信号的能量做加权平均,得到所述SID对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。可选地,其中所述计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量和噪声低带信号的能量的比值得到第一比值,包括:计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的即时能量和噪声低带信号的即时能量的比值得到第一比值;或,计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量的加权平均和噪声低带信号的能量的加权平均的比值得到第一比值。其中即时能量就是解码得到的能量。其中,当所述SID对应的时刻的噪声高带信号的能量大于所述本地缓存的前一CN帧的高带信号的能量时,则以第一速率更新所述本地缓存的前一CN帧的高带信号的能量,否则以第二速率更新所述本地缓存的前一CN帧的高带信号的能量,所述第一速率大于所述第二速率。
具体的本实施例中上述获得所述SID所对应的时刻的噪声高带信号的加权平均能量可以通过以下方法实现:
根据解码得到的噪声低带参数得到第一CN帧s’0的低带信号的能量E0。根据在前一全解码CNG状态下缓存的CN帧的高低带信号的能量E1old,E0old以及E0估计出SID的对应的时刻的噪声高带信号的能量E 1,其中,
Figure BDA0000127467610000181
利用E 1更新解码端高带CN信号能量的长时滑动平均ECN
Figure BDA0000127467610000182
其中系数λ为变量,当E 1>ECN时λ=0.98,否则λ=0.9,其中λ=0.98即为第一速率,λ=0.9为第二速率。
本实施例中如果在编码端没有计算偏离程度值,可选地,获得所述SID所对应的时刻的噪声高带信号的能量的加权平均,包括:选取所述SID之前预设时间段内的语音帧中高带信号能量最小的语音帧的高带信号;根据所述语音帧中高带信号能量最小的语音帧的高带信号的能量获得所述SID所对应的时刻的噪声高带信号的加权平均能量;或,选取所述SID之前预设时间段内的语音帧中高带信号能量小于预设阈值的N个语音帧的高带信号;根据所述N个语音帧的高带信号的加权平均能量获得所述SID所对应的时刻的噪声高带信号的能量的加权平均,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
本实施例中,优选地,获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数,包括:在高带信号所对应的频率范围内分布M个导抗谱频率ISF系数或导抗谱对ISP系数或线谱频率LSF系数或线谱对LSP系数;对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过N帧发生改变,且N可为变量;根据所述随机化处理后的滤波器系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
具体的本实施例中获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数可以通过以下方式实现:
在低带ISF系数isfd(14)~16kHz的频带内平均分布9个ISF系数isfext(i),i=0,1,...8,
isfext(i)=isfd(14)+0.1·(i+1)·(16000-isfd(14))i=0,1,...8(11)
将isfext(i)转换到0~8kHz频带,得isf’ext(i),
isf′ext(i)=isfext(i)-8000i=0,1,...8(12)
将isf’ext(i)以一组9维的随机化因子R(i),i=0,1,...8,随机化,得随机化后的ISF系数isf1(i):
isf1(i)=R(i)·(isf′ext(1)-isf′ext(0))+isf′ext(i)i=0,1,...8(13)
其中R(i)由下式(14)得到,
R(i)=α·R(-1)(i)+(1-α)·Rt(i)i=0,1,...8(14)
其中α=0.8,Rt(i)称作目标随机因子,由下式得到,
R t ( i ) = 1 + 0.1 · RND ( i ) mod ( cnt , 10 ) = 0 R t ( - 1 ) ( i ) mod ( cnt , 10 ) ≠ 0 i = 0,1 , . . . 8 - - - ( 15 )
上式(15)中RND为一组9维的随机数序列,每维随机数各不相同且都在[-1,1]的范围内。cnt为一个帧记数器,在CNG工作状态下且flagCNG=0时每帧SID或NO_DATA帧加一,mod(cnt,10)表示对cnt取10的模。在另一实施例中,计算Rt(i)时mod(cnt,10)中的10也可为变量,如:
R t ( i ) = 1 + 0.1 · RND ( i ) mod ( cnt , N ) = 0 R t ( - 1 ) ( i ) mod ( cnt , N ) ≠ 0 i = 0,1 , . . . 8 (16)
N = 10 + 5 · RND mod ( cnt , N ( - 1 ) ) = 0 N ( - 1 ) mod ( cnt , N ( - 1 ) ) ≠ 0
其中RND为[-1,1]范围内的随机数,对此本实施例不做具体限定。
本实施例中,将低带ISF系数isfd(15)做为isf1(9)与随机化后的ISF系数isf1(i),i=0,1,...8,组合成一个10阶滤波器的ISF系数,变换为LPC系数lpc1(i),i=0,1,...9。将lpc1(i)乘以一组10维的加权系数W(i)={0.6699,0.5862,0.5129,0.4488,0.3927,0.3436,0.3007,0.2631,0.2302,0.2014},得加权后的LPC系数lpc 1(i),即为估计出的合成滤波器1/A 1(Z)。
本实施例中,生成320点的白噪声序列exc2(i),i=0,1,…319,使用exc2(i)激励滤波器1/A 1(Z)得到未经增益调整的高带CN信号s 1(i)。对s 1(i)乘以增益系数G3和G4=0.6,得到解码端重建的16kHz采样高带CN信号s’1,其中
如果当前帧是SID,则需要变换lpc 1(i)到LSP系数lsp 1(i),并使用lsp 1(i)更新解码端缓存的CN帧的高带信号的LSP系数的长时滑动平均,
lsp CN ( i ) = β · lsp CN ( - 1 ) ( i ) + ( 1 - β ) · lsp 1 ~ ( i ) i=0,1,...9(17)
其中β=0.7。
本实施例中,可选地,所述获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数,包括:获取本地缓存的噪声高带信号的所述M个ISF或ISP或LSF或LSP系数;对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过所述N帧发生改变;根据所述随机化处理后的滤波系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。对此本实施例不做具体限定。
本实例例中,得到低带参数和高带参数后将s’0,s’1通过QMF合成滤波器,得到解码器重建的最终32kHz采样的第一CN帧。
进一步地,本实施例中可选地,根据所述解码得到的噪声低带参数和所述本地生成的噪声高带参数得到第一CN帧之前,还可以对本地生成的噪声高带参数进行优化,以便能得到效果更好的舒适噪声,其中具体的优化步骤包括:当与所述SID相邻的历史帧为语音编码帧时,若所述语音编码帧解码出的高带信号或部分高带信号的平均能量小于所述本地生成的噪声高带信号或部分噪声高带信号的平均能量时,对从所述SID开始的后续L帧的噪声高带信号乘以小于1的平滑系数,得到新的本地生成的噪声高带信号的能量的加权平均;相应地,所述根据所述解码得到的噪声低带参数和所述本地生成的噪声高带参数得到第一CN帧,包括:根据所述解码得到的噪声低带参数、所述SID所对应的时刻的噪声高带信号的合成滤波器系数和所述新的本地生成的噪声高带信号的能量的加权平均得到第四CN帧。
本实施例中,当当前SID的前一帧为语音编码帧,且该语音编码帧高带信号能量Esp比s’1的能量Es’1低时,需要对当前SID及之后的若干SID(本实施例中为50帧)的高带信号能量进行平滑。具体平滑方法为:将当前帧的s’1乘以增益Gs,得到平滑后的s’1s。其中
Figure BDA0000127467610000203
其中cnt为帧记数器,从语音编码帧之后的第一帧CN帧开始每帧加1,
Figure BDA0000127467610000211
为上一帧经平滑后的高带信号能量,在cnt=1时初始化为Esp。此平滑过程最多只进行50帧,若期间出现
Figure BDA0000127467610000212
大于Es’1的情况则终止此次平滑过程。可选地,
Figure BDA0000127467610000213
和Es’1也可以仅表示部分帧的能量,对此本实施例不做具体限定。本实施例中,将s’0,s’1(或s’1s)通过QMF合成滤波器,得到解码器重建的最终32kHz采样的CN帧。
403:如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧。
本实施例中,如果SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧,其中解码高带参数的方法与步骤401中的方法一样,在此本实施例不再赘述,对于在本地生成低带参数的方法与现有技术中在本地生成宽带参数的方法一样,对此本实施例也不再赘述。
本发明提供的方法实施例的有益效果是:解码器获取静音***描述帧SID,判断所述SID是否包含低带参数和/或包含高带参数;如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。这样通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。并且,在根据所述解码得到的噪声低带参数和所述本地生成的噪声高带参数得到第二CN帧之前,还可以对本地生成的噪声高带参数进行优化,以便能得到效果更好的舒适噪声,从而进一步优化了解码端的性能。
实施例5
本实施例中提供了一种音频数据的处理方法,与实施例2中对音频数据的处理方法一样,编码器端获取音频信号的噪声帧,并将噪声帧分解为噪声低带信号和噪声高带信号,但是可选地,判断噪声帧的高带信号是否满足预设的编码传输条件,包括:判断所述噪声帧的噪声高带信号的频谱结构与在所述噪声帧之前的噪声高带信号的平均频谱结构相比是否满足预设条件,如果是则以所述第二编码策略编码所述噪声帧的噪声高带信号的SID并发送;如果否,则不需要对所述噪声帧的噪声高带信号进行编码传输。其中,噪声帧之前的噪声高带信号的平均频谱结构包括:在所述噪声帧之前的噪声高带信号的频谱的加权平均。本实施例中,将判断所述噪声帧的噪声高带信号的频谱结构与在所述噪声帧之前的噪声高带信号的平均频谱结构相比是否满足预设条件做为是否编码传输噪声高带信号的第三判断条件。
本实施例中,可选地,也可以通过第二判断条件来判断是否需要编码传输噪声高带信号,对此本实施例不做具体限定。
本实施例中,DTX决定是否编码发送高带参数,即flaghb的设置,可以由以下几个条件决定。1)是否满足第三判断条件,如果是,则设置flaghb=0,否则flaghb=1;2)是否满足第二判断条件,如果否,则设置flaghb=0,如果是,则flaghb=1。
本实施例中,第三判断条件的具体实施方法可以为:编码器获得当前噪声帧的噪声高带信号s1的10阶LSP系数lsp(i),i=0,...9,可选地也可以是LSF,或ISF,或ISP系数,对此本实施例不做具体限定,其中LSP,LSF,或ISF,或ISP系数只是不同域的不同表示方式,但是均表示合成滤波器系数,对此本实施例不做具体限定。用lsp(i)更新其滑动平均,
lspa(i)=α·lspa(i)+(1-α)·lsp(i)i=0,...9(18)
其中,lspa(i)为lsp(i)的长时滑动平均,计算当前lspa(i)与最近一次发送包含有高带参数的SID帧时的lspa(i)的谱失真,
Figure BDA0000127467610000221
其中Dlsp为谱失真,
Figure BDA0000127467610000222
表示最近一次发送包含有高带参数的SID帧时的lspa(i)。若Dlsp小于某阈值,则设置flaghb=0,否则flaghb=1。
本实施例中编码器在需编码低带参数和或高带参数下的工作方法与实施例3中的工作方法基本相同,对此本实施例不做赘述。
本实施例中,当解码器在CNG工作状态下且flagCNG=0时,需要本地生成噪声高带信号,其中获得SID所对应的时刻的噪声高带信号的加权平均能量的方法与实施例4中的方法一样,在此本实施例不再赘述。但是,本实施例中,优选地,获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数,包括:获取本地缓存的噪声高带信号的所述M个ISF系数或ISP系数或LSF系数或LSP系数;对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过所述N帧发生改变;根据所述随机化处理后的滤波系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。具体的上述获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数的方法可以通过以下方式实现:
令lsp’(i)=lspCN(i),i=0,...9,lspCN(i)为解码端本地缓存的CN帧的高带信号LSP系数的长时滑动平均。对lsp’(i)以与实施例4中相同的方法进行随机化处理,得到lsp1(i),
lsp 1 ( 0 ) = R ( 0 ) · ( 1 - lsp 1 ( 0 ) ) + lsp ′ ( 0 ) lsp 1 ( i ) = R ( i ) · ( lsp ′ ( i ) - lsp ′ ( i - 1 ) ) + lsp ′ ( i ) i = 1 , . . . 9 - - - ( 19 )
将lsp1(i)变换为LPC系数lpc1(i),并以与实施例4中相同的方法经过w(i)加权后得到合成滤波器1/A 1(Z)。本实施例中,生成320点的白噪声序列exc2(i),i=0,1,…319,使用exc2(i)激励滤波器1/A 1(Z)得到未经增益调整的高带CN信号s 1(i)。对s 1(i)乘以增益系数G3,其中
Figure BDA0000127467610000232
得到解码端重建的16kHz采样CN帧的高带信号s’1。本实施例中,以此方法得到的lsp1(i)在当前帧为SID时不用来更新解码端缓存的CN帧的高带信号的LSP系数的长时滑动平均。
本实施例中,当编码器在编码大SID帧时,对高带信号对数能量在编码端的长时滑动平均e1a进行量化时,对e1a进行一定衰减后(即减去一定值后)再进行量化,所以此时,解码时无需再对s 1(i)乘以实施例4中的G2或G4。本实施例中解码端的其它步骤与上述实施例中的步骤类似,在此本实施例不做具体赘述。
本发明提供的方法实施例的有益效果是:获取音频信号的当前噪声帧,并将所述当前噪声帧分解为噪声低带信号和噪声高带信号,以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,解码器获取静音***描述帧SID,判断所述SID是否包含低带参数和/或包含高带参数;如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。这样通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。
实施例6
参见图5,本实施例中提供了一种音频数据的编码装置,所述装置包括:获取模块501、和传输模块502。
获取模块501,用于获取音频信号的噪声帧,并将所述噪声帧分解为噪声低带信号和噪声高带信号;
传输模块502,用于以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,其中所述第一非连续传输机制的第一静音***描述帧SID的发送策略和所述第二非连续传输机制的第二SID的发送策略不同,或,所述第一非连续传输机制的第一SID的编码策略和所述第二非连续传输机制的第二SID的编码策略不同。
本实施例中,所述第一SID包含所述噪声帧的低带参数,所述第二SID包含所述噪声帧的低带参数和/或高带参数。
其中可选地,参见图6,所述传输模块502包括:
第一传输单元502a,用于判断所述噪声高带信号是否具有预设的频谱结构,如果是,且满足所述第二SID发送策略的中的发送条件,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。
本实施例中,所述第一传输单元502a包括:
判断子单元,用于获得所述噪声高带信号的频谱,将所述频谱划分为至少两个子带,如果所述子带中任一第一子带的平均能量均不小于所述子带中第二子带的平均能量,其中所述第二子带所处的频带高于所述第一子带所处频带,则确认所述噪声高带信号不具有预设的频谱结构,否则所述噪声高带信号具有预设的频谱结构。
参见图6,可选地,所述传输模块502包括:
第二传输单元502b,用于根据第一比值和第二比值生成偏离程度值,其中所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值;判断所述偏离程度值是否达到预设的阈值,如果是,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。
可选地,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:
所述第一比值是所述噪声帧的噪声高带信号的即时能量与所述噪声低带信号的即时能量的比值;
相应地,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的即时能量和噪声低带信号的即时能量的比值;
或,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:
所述第一比值是所述噪声帧及其之前的噪声帧的噪声高带信号的加权平均能量与所述噪声帧及其之前的噪声帧的噪声低带信号的加权平均能量的比值;
相应地,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声帧及其之前的噪声帧的高带信号的加权平均能量和低带信号的加权平均能量的比值。
可选地,本实施例中,所述第二传输单元502b包括:
计算子单元,用于分别计算第一比值的对数值和第二比值的对数值;计算所述第一比值的对数值和所述第二比值的对数值的差的绝对值,得到所述偏离程度值。
参见图6,可选地本实施例中,所述传输模块502包括:
第三传输单元502c,用于判断所述噪声帧的噪声高带信号的频谱结构与在所述噪声帧之前的噪声高带信号的平均频谱结构相比是否满足预设条件,如果是,则以所述第二编码策略编码所述噪声帧的噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声帧的噪声高带信号进行编码传输。
本实施例中,可选地,所述噪声帧之前的噪声高带信号的平均频谱结构包括:在所述噪声帧之前的噪声高带信号的频谱的加权平均。
可选地,本实施例中所述第二非连续传输机制的第二SID的发送策略中的发送条件还包括:所述第一非连续传输机制满足所述第一SID的发送条件。
本发明提供的装置实施例的有益效果是:获取音频信号的当前噪声帧,并将所述当前噪声帧分解为噪声低带信号和噪声高带信号,以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,这样通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。
实施例7
参见图7,本实施例中提供了一种音频数据的解码装置,所述装置包括:获取模块601、第一解码模块602、第二解码模块603和第三解码模块604。
获取模块601,用于判断接收到的当前静音***描述帧SID是否包含有高带参数或低带参数;
第一解码模块602,用于如果所述获取模块601获取的SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;
第二解码模块603,用于如果所述获取模块601获取的SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;
第三解码模块604,用于如果所述获取模块601获取的SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。
可选地,本实施例中,第一解码模块602还用于在解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧之前,如果所述解码器处于第一舒适噪声生成CNG状态,则进入第二CNG状态。
可选地,本实施例中,所述第三解码模块604还用于解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧之前,如果所述解码器处于所述第二CNG状态,则进入第一CNG状态。
其中,可选地,所述获取模块601包括:
第一确认单元,用于如果所述SID的比特数小于预设的第一阈值,则确认所述SID包含有高带参数;如果所述SID的比特数大于预设的第一阈值且小于预设的第二阈值,则确认所述SID包含有低带参数;如果所述SID的比特数大于预设的第二阈值且小于预设的第三阈值,则确认所述SID包含有高带参数和低带参数;
或,第二确认单元,用于如果所述SID中包含第一标识符,则确认所述SID包含有高带参数,如果所述SID中包含第二标识符,则确认所述SID包含有低带参数,如果所述SID中包含第三标识符,则确认所述SID包含有低带参数和高带参数。
本实施例中,所述第一解码模块602包括:
第一获取单元,用于分别获得所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数;
第二获取单元,用于根据所述获得的所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数得到所述噪声高带信号。
可选地,所述第一获取单元包括:
第一获取子单元,用于根据所述解码得到的噪声低带参数得到第一CN帧的低带信号的能量;
计算子单元,用于计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量和噪声低带信号的能量的比值得到第一比值;
第二获取子单元,用于根据所述第一CN帧的低带信号的能量和所述第一比值,获得所述SID的对应的时刻的噪声高带信号的能量;
第三获取子单元,用于将所述SID对应的时刻的噪声高带信号的能量与本地缓存的CN帧的高带信号的能量做加权平均,得到所述SID对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
其中,所述计算子单元具体用于:
计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的即时能量和噪声低带信号的即时能量的比值得到第一比值;
或,计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量的加权平均和噪声低带信号的能量的加权平均的比值得到第一比值。
其中,当所述SID对应的时刻的噪声高带信号的能量大于所述本地缓存的前一CN帧的高带信号的能量时,则以第一速率更新所述本地缓存的前一CN帧的高带信号的能量,否则以第二速率更新所述本地缓存的前一CN帧的高带信号的能量,所述第一速率大于所述第二速率。
可选地,所述第一获取单元包括:
第一选取子单元,用于选取所述SID之前预设时间段内的语音帧中高带信号能量最小的语音帧的高带信号;根据所述语音帧中高带信号能量最小的语音帧的高带信号的能量获得所述SID所对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量;
或,第二选取子单元,用于选取所述SID之前预设时间段内的语音帧中高带信号能量小于预设阈值的N个语音帧的高带信号;根据所述N个语音帧的高带信号的加权平均能量获得所述SID所对应的时刻的噪声高带信号的能量的加权平均,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
可选地,所述第一获取单元包括:
分布子单元,用于在高带信号所对应的频率范围内分布M个导抗谱频率ISF系数或导抗谱对ISP系数或线谱频率LSF系数或线谱对LSP系数;
第一随机化处理子单元,用于对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过N帧发生改变,其中所述M和所述N均为自然数;
第四获取子单元,用于根据所述随机化处理后的滤波器系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
可选地,所述第一获取单元包括:
第五获取子单元,用于获取本地缓存的噪声高带信号的所述M个ISF系数或ISP系数或LSF系数或LSP系数;
第二随机化处理子单元,对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过所述N帧发生改变;
第六获取子单元,用于根据所述随机化处理后的滤波系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
参见图8,可选地,所述装置还包括:
优化模块605,用于所述第一解码模块602得到第一CN帧之前,当与所述SID相邻的历史帧为语音编码帧时,若所述语音编码帧解码出的高带信号或部分高带信号的平均能量小于所述本地生成的噪声高带信号或部分噪声高带信号的平均能量时,对从所述SID开始的后续L帧的噪声高带信号乘以小于1的平滑系数,得到新的本地生成的噪声高带信号的能量的加权平均;
相应地,所述第一解码模块602具体用于根据所述解码得到的噪声低带参数、所述SID所对应的时刻的噪声高带信号的合成滤波器系数和所述新的本地生成的噪声高带信号的能量的加权平均得到第四CN帧。
本发明提供的装置实施例的有益效果是:解码器获取静音***描述帧SID,判断所述SID是否包含低带参数和/或包含高带参数;如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。这样通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。
实施例8
参见图9,本实施例中提供了一种音频数据的处理***,所述***包括:如上所述的音频数据的编码装置500和如上所述的音频数据的解码装置600。
本发明实施例提供的技术方案带来的有益效果是:获取音频信号的当前噪声帧,并将所述当前噪声帧分解为噪声低带信号和噪声高带信号,以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,解码器获取静音***描述帧SID,判断所述SID是否包含低带参数和/或包含高带参数;如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。这样通过对高带信号和低带信号不同的处理方式,可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特,节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的,从而解决了由于超宽带的编码传输问题。
本实施例提供的装置和***,具体可以与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述实施例中的音频数据的处理方法、装置可以应用于音频编码器或音频解码器。音频编解码器可以广泛应用于各种电子设备中,例如:移动电话,无线装置,个人数据助理(PDA),手持式或便携式计算机,GPS接收机/导航器,照相机,音频/视频播放器,摄像机,录像机,监控设备等。通常,这类电子设备中包括音频编码器或音频解码器,音频编码器或者解码器可以直接由数字电路或芯片例如DSP(digital signal processor)实现,或者由软件代码驱动处理器执行软件代码中的流程而实现。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (45)

1.一种音频数据的处理方法,其特征在于,所述方法包括:
获取音频信号的噪声帧,并将所述噪声帧分解为噪声低带信号和噪声高带信号;
以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,其中所述第一非连续传输机制的第一静音***描述帧SID的发送策略和所述第二非连续传输机制的第二SID的发送策略不同,或,所述第一非连续传输机制的第一SID的编码策略和所述第二非连续传输机制的第二SID的编码策略不同。
2.根据权利要求1所述的方法,其特征在于,所述第一SID包含所述噪声帧的低带参数,所述第二SID包含所述噪声帧的低带参数或高带参数。
3.根据权利要求1或2所述的方法,其特征在于,所述以第二非连续传输机制编码传输所述噪声高带信号,包括:
判断所述噪声高带信号是否具有预设的频谱结构,如果是,且满足所述第二SID发送策略的发送条件,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。
4.根据权利要求3所述的方法,其特征在于,所述判断所述噪声高带信号是否具有预设的频谱结构包括:
获得所述噪声高带信号的频谱,将所述频谱划分为至少两个子带,如果所述子带中任一第一子带的平均能量均不小于所述子带中第二子带的平均能量,其中所述第二子带所处的频带高于所述第一子带所处频带,则确认所述噪声高带信号不具有预设的频谱结构,否则所述噪声高带信号具有预设的频谱结构。
5.根据权利要求1或2所述的方法,其特征在于,所述以第二非连续传输机制编码传输所述噪声高带信号,包括:
根据第一比值和第二比值生成偏离程度值,其中所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值;
判断所述偏离程度值是否达到预设的阈值,如果是,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。
6.根据权利要求5所述的方法,其特征在于,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:
所述第一比值是所述噪声帧的噪声高带信号的即时能量与所述噪声低带信号的即时能量的比值;
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的即时能量和噪声低带信号的即时能量的比值;
或,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:
所述第一比值是所述噪声帧及其之前的噪声帧的噪声高带信号的加权平均能量与所述噪声帧及其之前的噪声帧的噪声低带信号的加权平均能量的比值;
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声帧及其之前的噪声帧的高带信号的加权平均能量和低带信号的加权平均能量的比值。
7.根据权利要求5或6所述的方法,其特征在于,所述根据第一比值和第二比值生成偏离程度值,包括:
分别计算第一比值的对数值和第二比值的对数值;
计算所述第一比值的对数值和所述第二比值的对数值的差的绝对值,得到所述偏离程度值。
8.根据权利要求1或2所述的方法,其特征在于,所述以第二非连续传输机制编码传输所述噪声高带信号,包括:
判断所述噪声帧的噪声高带信号的频谱结构与在所述噪声帧之前的噪声高带信号的平均频谱结构相比是否满足预设条件,如果是,则以所述第二编码策略编码所述噪声帧的噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声帧的噪声高带信号进行编码传输。
9.根据权利要求8所述的方法,其特征在于,所述噪声帧之前的噪声高带信号的平均频谱结构包括:在所述噪声帧之前的噪声高带信号的频谱的加权平均。
10.根据权利要求3-8任一项所述的方法,其特征在于,所述第二非连续传输机制的第二SID的发送策略中的发送条件还包括:所述第一非连续传输机制满足所述第一SID的发送条件。
11.一种音频数据的处理方法,其特征在于,所述方法包括:
解码器获取静音***描述帧SID,判断所述SID是否包含低带参数或高带参数;
如果所述SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;
如果所述SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;
如果所述SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。
12.根据权利要求11所述的方法,其特征在于,如果所述SID包含所述低带参数,则所述解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧之前,还包括:
如果所述解码器处于第一舒适噪声生成CNG状态,则所述解码器进入第二CNG状态。
13.根据权利要求11所述的方法,其特征在于,如果所述SID包含所述高带参数和所述低带参数,则所述解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧之前,还包括:
如果所述解码器处于所述第二CNG状态,则所述解码器进入第一CNG状态。
14.根据权利要求11-13任一项所述的方法,其特征在于,所述判断所述SID是否包含低带参数和/或包含高带参数包括:
如果所述SID的比特数小于预设的第一阈值,则确认所述SID包含有高带参数;如果所述SID的比特数大于预设的第一阈值且小于预设的第二阈值,则确认所述SID包含有低带参数;如果所述SID的比特数大于预设的第二阈值且小于预设的第三阈值,则确认所述SID包含有高带参数和低带参数;
或,如果所述SID中包含第一标识符,则确认所述SID包含有高带参数,如果所述SID中包含第二标识符,则确认所述SID包含有低带参数,如果所述SID中包含第三标识符,则确认所述SID包含有低带参数和高带参数。
15.根据权利要求11-14任一项所述的方法,其特征在于,所述在本地生成噪声高带参数包括:
分别获得所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数;
根据所述获得的所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数得到所述噪声高带信号。
16.根据权利要求15所述的方法,其特征在于,所述获得所述SID所对应的时刻的噪声高带信号的加权平均能量,包括:
根据所述解码得到的噪声低带参数得到第一CN帧的低带信号的能量;
计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量和噪声低带信号的能量的比值得到第一比值;
根据所述第一CN帧的低带信号的能量和所述第一比值,获得所述SID的对应的时刻的噪声高带信号的能量;
将所述SID对应的时刻的噪声高带信号的能量与本地缓存的CN帧的高带信号的能量做加权平均,得到所述SID对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
17.根据权利要求16所述的方法,其特征在于,所述计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量和噪声低带信号的能量的比值得到第一比值,包括:
计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的即时能量和噪声低带信号的即时能量的比值得到第一比值;
或,计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量的加权平均和噪声低带信号的能量的加权平均的比值得到第一比值。
18.根据权利要求16或17所述的方法,其特征在于,其中,当所述SID对应的时刻的噪声高带信号的能量大于所述本地缓存的前一CN帧的高带信号的能量时,则以第一速率更新所述本地缓存的前一CN帧的高带信号的能量,否则以第二速率更新所述本地缓存的前一CN帧的高带信号的能量,所述第一速率大于所述第二速率。
19.根据权利要求15所述的方法,其特征在于,所述获得所述SID所对应的时刻的噪声高带信号的能量的加权平均,包括:
选取所述SID之前预设时间段内的语音帧中高带信号能量最小的语音帧的高带信号;
根据所述语音帧中高带信号能量最小的语音帧的高带信号的能量获得所述SID所对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量;
或,选取所述SID之前预设时间段内的语音帧中高带信号能量小于预设阈值的N个语音帧的高带信号;
根据所述N个语音帧的高带信号的加权平均能量获得所述SID所对应的时刻的噪声高带信号的能量的加权平均,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
20.根据权利要求15-19任一项所述的方法,其特征在于,所述获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数,包括:
在高带信号所对应的频率范围内分布M个导抗谱频率ISF系数或导抗谱对ISP系数或线谱频率LSF系数或线谱对LSP系数;
对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过N帧发生改变,其中所述M和所述N均为自然数;
根据所述随机化处理后的滤波器系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
21.根据权利要求15-19任一项所述的方法,其特征在于,所述获得所述SID所对应的时刻的噪声高带信号的合成滤波器系数,包括:
获取本地缓存的噪声高带信号的所述M个ISF系数或IS系数P或LSF系数或LSP系数;
对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过所述N帧发生改变;
根据所述随机化处理后的滤波系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
22.根据权利要求15-21任一项所述的方法,其特征在于,所述根据所述解码得到的噪声低带参数和所述本地生成的噪声高带参数得到第一CN帧之前,还包括:
当与所述SID相邻的历史帧为语音编码帧时,若所述语音编码帧解码出的高带信号或部分高带信号的平均能量小于所述本地生成的噪声高带信号或部分噪声高带信号的平均能量时,对从所述SID开始的后续L帧的噪声高带信号乘以小于1的平滑系数,得到新的本地生成的噪声高带信号的能量的加权平均;
所述根据所述解码得到的噪声低带参数和所述本地生成的噪声高带参数得到第一CN帧,包括:
根据所述解码得到的噪声低带参数、所述SID所对应的时刻的噪声高带信号的合成滤波器系数和所述新的本地生成的噪声高带信号的能量的加权平均得到第四CN帧。
23.一种音频数据的编码装置,其特征在于,所述装置包括:
获取模块,用于获取音频信号的噪声帧,并将所述噪声帧分解为噪声低带信号和噪声高带信号;
传输模块,用于以第一非连续传输机制编码传输所述噪声低带信号,以第二非连续传输机制编码传输所述噪声高带信号,其中所述第一非连续传输机制的第一静音***描述帧SID的发送策略和所述第二非连续传输机制的第二SID的发送策略不同,或,所述第一非连续传输机制的第一SID的编码策略和所述第二非连续传输机制的第二SID的编码策略不同。
24.根据权利要求23所述的装置,其特征在于,所述第一SID包含所述噪声帧的低带参数,所述第二SID包含所述噪声帧的低带参数或高带参数。
25.根据权利要求23或24所述的装置,其特征在于,所述传输模块包括:
第一传输单元,用于判断所述噪声高带信号是否具有预设的频谱结构,如果是,且满足所述第二SID发送策略的发送条件,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。
26.根据权利要求25所述的装置,其特征在于,所述第一传输单元包括:
判断子单元,用于获得所述噪声高带信号的频谱,将所述频谱划分为至少两个子带,如果所述子带中任一第一子带的平均能量均不小于所述子带中第二子带的平均能量,其中所述第二子带所处的频带高于所述第一子带所处频带,则确认所述噪声高带信号不具有预设的频谱结构,否则所述噪声高带信号具有预设的频谱结构。
27.根据权利要求23或24所述的装置,其特征在于,所述传输模块包括:
第二传输单元,用于根据第一比值和第二比值生成偏离程度值,其中所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值;判断所述偏离程度值是否达到预设的阈值,如果是,则以所述第二SID编码策略编码所述噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声高带信号进行编码传输。
28.根据权利要求27所述的装置,其特征在于,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:
所述第一比值是所述噪声帧的噪声高带信号的即时能量与所述噪声低带信号的即时能量的比值;
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的即时能量和噪声低带信号的即时能量的比值;
或,所述第一比值是所述噪声帧的噪声高带信号的能量与所述噪声低带信号的能量的比值,包括:
所述第一比值是所述噪声帧及其之前的噪声帧的噪声高带信号的加权平均能量与所述噪声帧及其之前的噪声帧的噪声低带信号的加权平均能量的比值;
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声高带信号的能量和噪声低带信号的能量的比值,包括:
所述第二比值是在所述噪声帧之前最近一次发送包含有噪声高带参数的SID所对应的时刻的噪声帧及其之前的噪声帧的高带信号的加权平均能量和低带信号的加权平均能量的比值。
29.根据权利要求27或28所述的装置,其特征在于,所述第二传输单元包括:
计算子单元,用于分别计算第一比值的对数值和第二比值的对数值;计算所述第一比值的对数值和所述第二比值的对数值的差的绝对值,得到所述偏离程度值。
30.根据权利要求23或24所述的装置,其特征在于,所述第一传输模块包括:
第三传输单元,用于判断所述噪声帧的噪声高带信号的频谱结构与在所述噪声帧之前的噪声高带信号的平均频谱结构相比是否满足预设条件,如果是,则以所述第二编码策略编码所述噪声帧的噪声高带信号的SID并发送;如果否,则确定不需要对所述噪声帧的噪声高带信号进行编码传输。
31.根据权利要求30所述的装置,其特征在于,所述噪声帧之前的噪声高带信号的平均频谱结构包括:在所述噪声帧之前的噪声高带信号的频谱的加权平均。
32.根据权利要求25-31任一项所述的装置,其特征在于,所述第二非连续传输机制的第二SID的发送策略中的发送条件还包括:所述第一非连续传输机制满足所述第一SID的发送条件。
33.一种音频数据的解码装置,其特征在于,所述装置包括:
获取模块,用于获取静音***描述帧SID,判断所述SID是否包含低带参数或包含高带参数;
第一解码模块,用于如果所述获取模块获取的SID包含所述低带参数,则解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧;
第二解码模块,用于如果所述获取模块获取的SID包含所述高带参数,则解码所述SID得到噪声高带参数,并在本地生成噪声低带参数,根据所述解码得到的噪声高带参数和所述本地生成的噪声低带参数得到第二CN帧;
第三解码模块,用于如果所述获取模块获取的SID包含所述高带参数和所述低带参数,则解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧。
34.根据权利要求32所述的装置,其特征在于,所述第一解码模块还用于在解码所述SID,得到噪声低带参数,并在本地生成噪声高带参数,根据所述解码得到的所述噪声低带参数和所述本地生成的噪声高带参数得到第一舒适噪声CN帧之前,如果所述解码器处于第一舒适噪声生成CNG状态,则进入第二CNG状态。
35.根据权利要求32所述的装置,其特征在于,所述第三解码模块还用于解码所述SID得到噪声高带参数和所述噪声低带参数,根据所述解码得到的噪声高带参数和噪声低带参数得到第三CN帧之前,如果所述解码器处于所述第二CNG状态,则进入第一CNG状态。
36.根据权利要求33-35任一项所述的装置,其特征在于,所述获取模块包括:
第一确认单元,用于如果所述SID的比特数小于预设的第一阈值,则确认所述SID包含有高带参数;如果所述SID的比特数大于预设的第一阈值且小于预设的第二阈值,则确认所述SID包含有低带参数;如果所述SID的比特数大于预设的第二阈值且小于预设的第三阈值,则确认所述SID包含有高带参数和低带参数;
或,第二确认单元,用于如果所述SID中包含第一标识符,则确认所述SID包含有高带参数,如果所述SID中包含第二标识符,则确认所述SID包含有低带参数,如果所述SID中包含第三标识符,则确认所述SID包含有低带参数和高带参数。
37.根据权利要求33-36任一项所述的装置,其特征在于,所述第一解码模块包括:
第一获取单元,用于分别获得所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数;
第二获取单元,用于根据所述获得的所述SID所对应的时刻的噪声高带信号的加权平均能量和噪声高带信号的合成滤波器系数得到所述噪声高带信号。
38.根据权利要求37所述的装置,其特征在于,所述第一获取单元包括:
第一获取子单元,用于根据所述解码得到的噪声低带参数得到第一CN帧的低带信号的能量;
计算子单元,用于计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量和噪声低带信号的能量的比值得到第一比值;
第二获取子单元,用于根据所述第一CN帧的低带信号的能量和所述第一比值,获得所述SID的对应的时刻的噪声高带信号的能量;
第三获取子单元,用于将所述SID对应的时刻的噪声高带信号的能量与本地缓存的CN帧的高带信号的能量做加权平均,得到所述SID对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
39.根据权利要求38所述的装置,其特征在于,所述计算子单元具体用于:
计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的即时能量和噪声低带信号的即时能量的比值得到第一比值;
或,计算在所述SID前面接收到包含有高带参数的SID的时刻所对应的噪声高带信号的能量的加权平均和噪声低带信号的能量的加权平均的比值得到第一比值。
40.根据权利要求38或39所述的装置,其特征在于,其中,当所述SID对应的时刻的噪声高带信号的能量大于所述本地缓存的前一CN帧的高带信号的能量时,则以第一速率更新所述本地缓存的前一CN帧的高带信号的能量,否则以第二速率更新所述本地缓存的前一CN帧的高带信号的能量,所述第一速率大于所述第二速率。
41.根据权利要求37所述的装置,其特征在于,所述第一获取单元包括:
第一选取子单元,用于选取所述SID之前预设时间段内的语音帧中高带信号能量最小的语音帧的高带信号;根据所述语音帧中高带信号能量最小的语音帧的高带信号的能量获得所述SID所对应的时刻的噪声高带信号的加权平均能量,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量;
或,第二选取子单元,用于选取所述SID之前预设时间段内的语音帧中高带信号能量小于预设阈值的N个语音帧的高带信号;根据所述N个语音帧的高带信号的加权平均能量获得所述SID所对应的时刻的噪声高带信号的能量的加权平均,其中所述SID对应的时刻的噪声高带信号的加权平均能量就是所述第一CN帧的高带信号能量。
42.根据权利要求37-41任一项所述的装置,其特征在于,所述第一获取单元包括:
分布子单元,用于在高带信号所对应的频率范围内分布M个导抗谱频率ISF系数或导抗谱对ISP系数或线谱频率LSF系数或线谱对LSP系数;
第一随机化处理子单元,用于对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过N帧发生改变,其中所述M和所述N均为自然数;
第四获取子单元,用于根据所述随机化处理后的滤波器系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
43.根据权利要求37-41任一项所述的装置,其特征在于,所述第一获取单元包括:
第五获取子单元,用于获取本地缓存的噪声高带信号的所述M个ISF系数或ISP系数或LSF系数或LSP系数;
第二随机化处理子单元,对所述M个系数进行随机化处理,其中所述随机化的特征为:使所述M个系数中的每个系数向其各自对应的一个目标值逐渐靠拢,所述目标值为与该系数值相邻的预设范围内的值;所述M个系数中的每个系数的目标值每经过所述N帧发生改变;
第六获取子单元,用于根据所述随机化处理后的滤波系数得到所述SID所对应的时刻的噪声高带信号的合成滤波器系数。
44.根据权利要求37-43任一项所述的装置,其特征在于,所述装置还包括:
第七获取子单元,用于所述第一解码模块得到第一CN帧之前,当与所述SID相邻的历史帧为语音编码帧时,若所述语音编码帧解码出的高带信号或部分高带信号的平均能量小于所述本地生成的噪声高带信号或部分噪声高带信号的平均能量时,对从所述SID开始的后续L帧的噪声高带信号乘以小于1的平滑系数,得到新的本地生成的噪声高带信号的能量的加权平均;
所述第一解码模块具体用于根据所述解码得到的噪声低带参数、所述SID所对应的时刻的噪声高带信号的合成滤波器系数和所述新的本地生成的噪声高带信号的能量的加权平均得到第四CN帧。
45.一种音频数据的处理***,其特征在于,所述***包括:如权利要求23-32任一项所述的音频数据的编码装置和如权利要求33-44任一项所述的音频数据的解码装置。
CN201110455836.7A 2011-12-30 2011-12-30 音频数据的处理方法、装置和*** Active CN103187065B (zh)

Priority Applications (31)

Application Number Priority Date Filing Date Title
CN201110455836.7A CN103187065B (zh) 2011-12-30 2011-12-30 音频数据的处理方法、装置和***
PT128613775T PT2793227T (pt) 2011-12-30 2012-12-28 Método, dispositivo e sistema para processamento de dados áudio
CA2861916A CA2861916C (en) 2011-12-30 2012-12-28 Method, apparatus, and system for processing audio data
SG11201403686SA SG11201403686SA (en) 2011-12-30 2012-12-28 Method, apparatus, and system for processing audio data
MX2014007968A MX338445B (es) 2011-12-30 2012-12-28 Metodo, aparato, y sistema para procesar datos de audio.
ES12861377.5T ES2610783T3 (es) 2011-12-30 2012-12-28 Método y aparato para procesar datos de audio
KR1020147020836A KR101693280B1 (ko) 2011-12-30 2012-12-28 오디오 데이터 처리 방법, 장치 및 시스템
EP12861377.5A EP2793227B1 (en) 2011-12-30 2012-12-28 Audio data processing method and apparatus
AU2012361423A AU2012361423B2 (en) 2011-12-30 2012-12-28 Method, apparatus, and system for processing audio data
KR1020167036611A KR101770237B1 (ko) 2011-12-30 2012-12-28 오디오 데이터 처리 방법, 장치 및 시스템
CA3059322A CA3059322C (en) 2011-12-30 2012-12-28 Method, apparatus, and system for processing audio data
CA3181066A CA3181066A1 (en) 2011-12-30 2012-12-28 Method, apparatus, and system for processing audio data
SG10201609338SA SG10201609338SA (en) 2011-12-30 2012-12-28 Method, apparatus, and system for processing audio data
RU2016100179A RU2617926C1 (ru) 2011-12-30 2012-12-28 Способ, устройство и система для обработки аудиоданных
BR112014016153-4A BR112014016153B1 (pt) 2011-12-30 2012-12-28 método para um codificador processar dados de áudio, método para processar um sinal de áudio, codificador e decodificador
PCT/CN2012/087812 WO2013097764A1 (zh) 2011-12-30 2012-12-28 音频数据的处理方法、装置和***
MYPI2014001949A MY173976A (en) 2011-12-30 2012-12-28 Method, apparatus, and system for processing audio data
RU2014131387/08A RU2579926C1 (ru) 2011-12-30 2012-12-28 Способ, устройство и система для обработки аудиоданных
JP2014549344A JP6072068B2 (ja) 2011-12-30 2012-12-28 オーディオ・データを処理するための方法、装置、及びシステム
US14/318,899 US9406304B2 (en) 2011-12-30 2014-06-30 Method, apparatus, and system for processing audio data
IN1436KON2014 IN2014KN01436A (zh) 2011-12-30 2014-07-08
ZA2014/04996A ZA201404996B (en) 2011-12-30 2014-07-08 Method, apparatus , and system for processing audio data
HK14113112.0A HK1199543A1 (zh) 2011-12-30 2014-12-31 音頻數據的處理方法、裝置和系統
ZA2016/00247A ZA201600247B (en) 2011-12-30 2016-01-12 Method, apparatus, and system for processing audio data
US15/188,518 US9892738B2 (en) 2011-12-30 2016-06-21 Method, apparatus, and system for processing audio data
JP2016252612A JP6462653B2 (ja) 2011-12-30 2016-12-27 オーディオ・データを処理するための方法、装置、及びシステム
RU2017113357A RU2641464C1 (ru) 2011-12-30 2017-04-18 Способ, устройство и система для обработки аудиоданных
US15/867,977 US10529345B2 (en) 2011-12-30 2018-01-11 Method, apparatus, and system for processing audio data
US16/697,822 US11183197B2 (en) 2011-12-30 2019-11-27 Method, apparatus, and system for processing audio data
US17/507,200 US11727946B2 (en) 2011-12-30 2021-10-21 Method, apparatus, and system for processing audio data
US18/344,445 US20230352035A1 (en) 2011-12-30 2023-06-29 Method, Apparatus, and System for Processing Audio Data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110455836.7A CN103187065B (zh) 2011-12-30 2011-12-30 音频数据的处理方法、装置和***

Publications (2)

Publication Number Publication Date
CN103187065A true CN103187065A (zh) 2013-07-03
CN103187065B CN103187065B (zh) 2015-12-16

Family

ID=48678198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110455836.7A Active CN103187065B (zh) 2011-12-30 2011-12-30 音频数据的处理方法、装置和***

Country Status (18)

Country Link
US (6) US9406304B2 (zh)
EP (1) EP2793227B1 (zh)
JP (2) JP6072068B2 (zh)
KR (2) KR101693280B1 (zh)
CN (1) CN103187065B (zh)
AU (1) AU2012361423B2 (zh)
BR (1) BR112014016153B1 (zh)
CA (3) CA2861916C (zh)
ES (1) ES2610783T3 (zh)
HK (1) HK1199543A1 (zh)
IN (1) IN2014KN01436A (zh)
MX (1) MX338445B (zh)
MY (1) MY173976A (zh)
PT (1) PT2793227T (zh)
RU (3) RU2617926C1 (zh)
SG (2) SG10201609338SA (zh)
WO (1) WO2013097764A1 (zh)
ZA (2) ZA201404996B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105681512A (zh) * 2016-02-25 2016-06-15 广东欧珀移动通信有限公司 一种降低语音通话功耗的方法及装置
CN105721656A (zh) * 2016-03-17 2016-06-29 北京小米移动软件有限公司 背景噪声生成方法及装置
CN113571072A (zh) * 2021-09-26 2021-10-29 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和***
CN106169297B (zh) * 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
US9136763B2 (en) * 2013-06-18 2015-09-15 Intersil Americas LLC Audio frequency deadband system and method for switch mode regulators operating in discontinuous conduction mode
BR112016019838B1 (pt) * 2014-03-31 2023-02-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação, método de decodificação e mídia de registro legível por computador não transitória
US10163453B2 (en) 2014-10-24 2018-12-25 Staton Techiya, Llc Robust voice activity detector system for use with an earphone
GB2532041B (en) 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
EP3334079B1 (en) * 2016-12-12 2019-06-19 Kyynel Oy Versatile channel selection procedure for wireless network
US10504538B2 (en) * 2017-06-01 2019-12-10 Sorenson Ip Holdings, Llc Noise reduction by application of two thresholds in each frequency band in audio signals
US10540983B2 (en) * 2017-06-01 2020-01-21 Sorenson Ip Holdings, Llc Detecting and reducing feedback
GB2595891A (en) * 2020-06-10 2021-12-15 Nokia Technologies Oy Adapting multi-source inputs for constant rate encoding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101087319A (zh) * 2006-06-05 2007-12-12 华为技术有限公司 一种发送和接收背景噪声的方法和装置及静音压缩***
CN101246688A (zh) * 2007-02-14 2008-08-20 华为技术有限公司 一种对背景噪声信号进行编解码的方法、***和装置
CN101320563A (zh) * 2007-06-05 2008-12-10 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
US20110228946A1 (en) * 2010-03-22 2011-09-22 Dsp Group Ltd. Comfort noise generation method and system

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103065B1 (en) * 1998-10-30 2006-09-05 Broadcom Corporation Data packet fragmentation in a cable modem system
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
TW444460B (en) * 1998-11-24 2001-07-01 Ericsson Telefon Ab L M An efficient DTX scheme
US6549587B1 (en) * 1999-09-20 2003-04-15 Broadcom Corporation Voice and data exchange over a packet based network with timing recovery
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
WO2001033814A1 (en) * 1999-11-03 2001-05-10 Tellabs Operations, Inc. Integrated voice processing system for packet networks
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US7920697B2 (en) 1999-12-09 2011-04-05 Broadcom Corp. Interaction between echo canceller and packet voice processing
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6691805B2 (en) 2001-08-27 2004-02-17 Halliburton Energy Services, Inc. Electrically conductive oil-based mud
US7319703B2 (en) * 2001-09-04 2008-01-15 Nokia Corporation Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
FR2859566B1 (fr) * 2003-09-05 2010-11-05 Eads Telecom Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre
JP4572123B2 (ja) * 2005-02-28 2010-10-27 日本電気株式会社 音源供給装置及び音源供給方法
US7809559B2 (en) * 2006-07-24 2010-10-05 Motorola, Inc. Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution
US8725499B2 (en) 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
JP2008139447A (ja) * 2006-11-30 2008-06-19 Mitsubishi Electric Corp 音声符号化装置及び音声復号装置
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
DE102008009719A1 (de) 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
US9263063B2 (en) * 2010-02-25 2016-02-16 Telefonaktiebolaget L M Ericsson (Publ) Switching off DTX for music
JP2012215198A (ja) * 2011-03-31 2012-11-08 Showa Corp 回転構造体
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和***
RU2650025C2 (ru) * 2012-12-21 2018-04-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101087319A (zh) * 2006-06-05 2007-12-12 华为技术有限公司 一种发送和接收背景噪声的方法和装置及静音压缩***
CN101246688A (zh) * 2007-02-14 2008-08-20 华为技术有限公司 一种对背景噪声信号进行编解码的方法、***和装置
CN101320563A (zh) * 2007-06-05 2008-12-10 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
US20110228946A1 (en) * 2010-03-22 2011-09-22 Dsp Group Ltd. Comfort noise generation method and system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105681512A (zh) * 2016-02-25 2016-06-15 广东欧珀移动通信有限公司 一种降低语音通话功耗的方法及装置
CN105721656A (zh) * 2016-03-17 2016-06-29 北京小米移动软件有限公司 背景噪声生成方法及装置
CN113571072A (zh) * 2021-09-26 2021-10-29 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品

Also Published As

Publication number Publication date
HK1199543A1 (zh) 2015-07-03
MX2014007968A (es) 2015-01-26
US20200098378A1 (en) 2020-03-26
RU2641464C1 (ru) 2018-01-17
CA3059322A1 (en) 2013-07-04
CA3181066A1 (en) 2013-07-04
MY173976A (en) 2020-03-02
KR20140109456A (ko) 2014-09-15
US10529345B2 (en) 2020-01-07
US20160300578A1 (en) 2016-10-13
ZA201404996B (en) 2016-06-29
JP2017062512A (ja) 2017-03-30
AU2012361423A1 (en) 2014-07-31
AU2012361423B2 (en) 2016-01-28
US11183197B2 (en) 2021-11-23
IN2014KN01436A (zh) 2015-10-23
KR20170002704A (ko) 2017-01-06
RU2617926C1 (ru) 2017-04-28
MX338445B (es) 2016-04-15
US9892738B2 (en) 2018-02-13
US20230352035A1 (en) 2023-11-02
KR101693280B1 (ko) 2017-01-05
CN103187065B (zh) 2015-12-16
US20220044692A1 (en) 2022-02-10
US9406304B2 (en) 2016-08-02
CA2861916C (en) 2019-11-19
US11727946B2 (en) 2023-08-15
ZA201600247B (en) 2016-03-30
CA3059322C (en) 2023-01-10
JP6462653B2 (ja) 2019-01-30
ES2610783T3 (es) 2017-05-03
BR112014016153A8 (pt) 2017-07-04
BR112014016153B1 (pt) 2021-01-12
EP2793227B1 (en) 2016-10-26
SG10201609338SA (en) 2016-12-29
BR112014016153A2 (pt) 2017-06-13
SG11201403686SA (en) 2014-10-30
US20140316774A1 (en) 2014-10-23
EP2793227A1 (en) 2014-10-22
WO2013097764A1 (zh) 2013-07-04
US20180137869A1 (en) 2018-05-17
RU2579926C1 (ru) 2016-04-10
KR101770237B1 (ko) 2017-08-22
JP2015507764A (ja) 2015-03-12
PT2793227T (pt) 2016-12-29
EP2793227A4 (en) 2015-03-18
CA2861916A1 (en) 2013-07-04
JP6072068B2 (ja) 2017-02-01

Similar Documents

Publication Publication Date Title
CN103187065B (zh) 音频数据的处理方法、装置和***
RU2383943C2 (ru) Кодирование звуковых сигналов
US6289311B1 (en) Sound synthesizing method and apparatus, and sound band expanding method and apparatus
JP2007532963A5 (zh)
KR20100095585A (ko) 신호 처리 방법 및 장치
CN104978970A (zh) 一种噪声信号的处理和生成方法、编解码器和编解码***
CN108231083A (zh) 一种基于silk的语音编码器编码效率提高方法
WO2023197809A1 (zh) 一种高频音频信号的编解码方法和相关装置
JP2005241761A (ja) 通信装置及び信号符号化/復号化方法
CN101483495B (zh) 一种背景噪声生成方法以及噪声处理装置
CN105957533B (zh) 语音压缩方法、语音解压方法及音频编码器、音频解码器
WO2008049311A1 (fr) Procédé, système et appareil pour transmettre le flux de code encodé du bruit de fond
CN101533639A (zh) 语音信号处理方法及装置
CN1873777B (zh) 具有语音解码功能的移动通信终端及其动作方法
CN103474079A (zh) 一种语音编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant