CN105324814B - 音频信号解码器中的改进的频带扩展 - Google Patents

音频信号解码器中的改进的频带扩展 Download PDF

Info

Publication number
CN105324814B
CN105324814B CN201480036730.5A CN201480036730A CN105324814B CN 105324814 B CN105324814 B CN 105324814B CN 201480036730 A CN201480036730 A CN 201480036730A CN 105324814 B CN105324814 B CN 105324814B
Authority
CN
China
Prior art keywords
signal
band
frequency
extension
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480036730.5A
Other languages
English (en)
Other versions
CN105324814A (zh
Inventor
M.卡尼斯卡
S.拉戈特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN105324814A publication Critical patent/CN105324814A/zh
Application granted granted Critical
Publication of CN105324814B publication Critical patent/CN105324814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种用于在解码或改进处理期间扩展音频信号的频带的方法,包含在第一所谓的低频带中解码或提取线性预测滤波器的系数和激励信号的步骤。该方法包括以下步骤:‑从在高于第一频带的至少一个第二频带(UHB1(k),E401)中扩展的经过过采样的激励信号获得在至少一个第二频带中扩展的信号(UHB2(k),E403);‑基于帧和子帧的能量比,通过由子帧定义的增益来缩放(E406)扩展信号;‑用线性预测滤波器对所述经缩放的扩展信号进行滤波(E404),所述线性预测滤波器的系数从低频带滤波器的系数得出。本发明还涉及实现所述方法的频带扩展设备以及包含这样的设备的解码器。

Description

音频信号解码器中的改进的频带扩展
技术领域
本发明涉及对音频信号(诸如语音、音乐或其他这样信号)进行编码/ 解码和处理以便它们的传输或存储的领域。
更具体地,本发明涉及一种在产生音频率信号增强的解码器或处理器中 的频带扩展方法和设备。
背景技术
存在许多技术用于(有损地)压缩语音或音乐这样的音频信号。
用于对话应用的传统的编码方法一般被分类为波形编码(PCM即“脉 冲编码调制”、ADCPM即“自适应差分脉冲编码调制”等)、参数编码(LPC 即“线性预测编码”、正弦编码等)以及通过“综合分析”使用参数的量化 的参数混合编码,其中CELP(“编码激励线性预测”)编码是最有名的例子。
对于非对话应用,用于(单声道)音频信号编码的现有技术包含通过变 换进行感知编码或者在子带中通过带复制对高频进行参数编码。
关于传统的语音和音频编码方法的回顾可以见于W.B.Kleijn和K.K. Paliwal(主编)的“Speech Coding and Synthesis”(Elsevier,1995年)、M.Bosi 和R.E.Goldgerg的“Introduction to Digital Audio Coding and Standards” (Springer,2002年)以及J.Benesty、M.M.Sondhi、Y.Huang(主编)的 “Handbook of Speech Processing”(Springer,2008年)等工作中。
这里更具体地关注于3GPP标准化AMR-WB(“自适应多速率宽带”) 编解码器(编码器和解码器),其以16kHz的输入/输出频率进行操作,其中 信号被划分成两个子带,即以12.8kHz采样并且通过CELP模式来编码的低 带(0-6.4kHz)以及通过“带扩展”(或BWE,即“带宽扩展”)根据当前 帧的模式使用或不使用附加信息而在参数上(parametrically)重构的高带 (6.4-7kHz)。这里可以注意到,7kHz的AMR-WB编解码器的经编码的带 的限制在本质上与如下事实有关:在标准化(ETSI/3GPP然后ITU-T)时, 根据在标准ITU-T P.341中定义的频率掩模,并且更具体地通过使用在标准 ITU-T G.191中定义的切除7kHz以上的频率(该滤波器遵守在P.341中定义 的掩模)的所谓的“P341”滤波器,来估计宽带终端的传输中的频率响应。 然而,在理论上,众所周知,以16kHz采样的信号可以具有从0至8000Hz 的定义的音频带;因此,AMR-WB编解码器通过与8kHz的理论带宽的比 较来引入对高带的限制。
3GPP AMR-WB语音编解码器在2001年被标准化,主要用于关于GSM (2G)和UMTS(3G)的电路模式(CS)电话应用。这个相同的编解码器 还在2003年由ITU-T以推荐G.722.2“Wideband coding speech at around 16 kbit/s using Adaptive Multi-RateWideband(AMR-WB)”的形式而标准化。
其包括被称为模式的从6.6至23.85kbit/s的9比特率,并且包括具有来 自静默描述帧(SID,即“静默***描述符”)的舒适噪声生成(CNG)和声 音活动检测(VAD)的连续传输机制(DTX,即“不连续传输”)以及丢失 帧校正机制(FEC,即“帧擦除隐藏”,有时称为PLC,即包丢失隐藏)。
这里不重复AMR-WB编码和解码算法的细节;该编解码器的详细描述 可见于3GPP规范(TS 26.190、26.191、26.192、26.193、26.194、26.204)、 ITU-T-G.722.2(以及对应的附件和附录)、B.Bessette等人的标题为“The adaptive multirate wideband speechcodec(AMR-WB)”(IEEE Transcations on Speech and Audio Processing,第10卷,第8号,2002年,620-636页)的文 章以及相关联的3GPP和ITU-T标准的源代码中。
在AMR-WB编解码器中的带扩展的原理是相当基本的。实际上,通过 时间(以每个子帧的增益的形式来应用)和频率(通过应用线性预测合成滤 波器或LPC即“线性预测编码”)包络来构成白噪声,由此生成高带(6.4-7 kHz)。在图1示出该带扩展技术。
针对每5ms子帧,以16kHz,通过线性同余生成器(块100)来生成 白噪声uHB1(n),n=0,…,79。该噪声uHB1(n)在时间上通过应用每个子帧的增 益来格式化;这个操作被分成两个处理步骤(块102、106或109):
·计算(块101)第一因子,以将白噪声uHB1(n)设置(块102)为与在 低带中以12.8kHz解码的激励(u(n),n=0,…,63)相似的级别:
这里可以注意到,通过比较不同大小(针对u(n)为64,而针对uHB1(n)为 80)的块来完成能量的标准化,而不补偿采样频率(12.8或16kHz)的差异。
·然后,获得(块106或109)如下形式的高带中的激励:
其中,根据比特率而获得不同的增益如果当前帧的比特率<23.85 kbit/s,则将增益估计为“无(blind)”(也就是说,没有附加信息);在 这种情况下,块103通过具有截止频率为400Hz的高通滤波器过滤在低带中 解码的信号以获得信号其中该高通滤波器消除可能扭 曲在块104中做出的估计的非常低的频率的影响,然后,由标准化的自校正 (块104)来计算出信号的被标记为etilt的“倾斜”(频谱斜率的指标):
最后,计算出如下形式的
其中,gSP=1-etilt是应用在活动语音(active speech)(SP)帧中的增 益,gBG=1.25gSP是应用在与背景(BG)噪声相关联的不活动语音(inactive speech)帧中的增益,并且wSP是取决于声音活动检测(VAD)的加权函数。 要理解,对倾斜(etilt)的估计使得能够根据信号的频谱性质来调整高带的 级别;当经CELP解码的信号的频谱斜率在频率增加时平均能量降低的情况 (在etilt接近于1并且因此gSP=1-etilt降低的情况下的声音信号的情况) 下,该估计特别重要。还应当注意,在AMR-WB解码中的因子被限制 为在范围[0.1,1.0]内取值。
在23.85kbit/s时,校正信息项通过AMR-WB编码器传输并解码(块107、 108),以便改进针对每个子帧(每5ms 4比特,或者0.8kbit/s)估计的增益。
然后,通过传递函数1/AHB(z)的并且以16kHz采样频率进行操作的LPC 合成滤波器(块111)对伪(artificial)激励uHB(n)进行滤波(块111)。该滤 波器的结构取决于当前帧的比特率:
·在6.6kbit/s时,按照因子γ=0.9对20阶的LPC滤波器进 行加权,其对在低带(以12.8kHz)中解码的16阶LPC滤波器进行 “外插”,由此获得滤波器1/AHB(z),其中ISF(Imittance Spectral Frequency, 导抗谱频率)参数的领域中进行外插的细节在标准G.722.2的6.3.2.1节中描 述;在该情况下:
·在比特率>6.6kbit/s时,滤波器1/AHB(z)是16阶的,并且简单地对应 于:
其中,γ=0.6。应当注意到,在这种情况下,以16kHz使用滤波器 其导致该滤波器的频率响应的从[0,6.4kHz]到[0,8kHz]的散布 (通过比例变换)。
结果sHB(n)最后由FIR(“有限脉冲响应”)型的带通滤波器(块112)处 理,以仅保留6-7kHz的带;在23.85kbit/s时,将同样是FIR型(块113) 的低通滤波器添加到处理,以进一步衰减7kHz以上的频率。最后,将高频 (HF)合成添加(块130)到通过块120至123获得并且以16kHz重采样 (块123)的低频(LF)合成。这样,即使在理论上高带在AMR-WB编解 码器中从6.4扩展到7kHz,在与LF合成相加之前,HF合成更不如说是包 含在6-7kHz带中。
可以识别出在AMR-WB编解码器的带扩展技术中的一些缺点:
·高带中的信号是格式化(通过每个子帧的时间增益,通过按照1/AHB(z) 和带通滤波来滤波)的白噪声,其不是在6.4-7kHz带中的信号的好的一般 模型。例如,存在非常和谐的音乐信号,6.4-7kHz带包含正弦分量(或音调) 并且没有噪声(或者很少噪声);对于这些信号,AMR-WB编解码器的带扩 展极大地降低质量。
·以7kHz(块113)的低通滤波器在低带和高带之间引入大约1ms的 移位,潜在地,其可能由于使23.85kbit/s的两个带稍微地去同步而降低某些 信号的质量,在将比特率从23.85kbit/s切换到其他模式时,该去同步化也可 能造成问题。
·针对每个子帧(块101、103至105)的增益的估计不是最优的。部分 地,其基于不同频率的信号之间的每个子帧(块101)的“绝对”能量的均 衡:16kHz(白噪声)的伪激励和12.8kHz的信号(经解码的ACELP激励)。 具体地,可以注意到,这方法隐含地引起高带激励的衰减(按照12.8/16=0.8 的比率);实际上,还将注意到,对AMR-WB编解码器中的高带没有执行去 加重(de-emphasis),其隐式地引起相对接近于0.6的放大(其对应于6400Hz 的1/(1-0.68z-1)频率响应的值)。实际上,因子1/0.8和0.6被近似地补偿。
·关于语音,在3GPP报告TR 26.967中记载的3GPP AMR-WB编解码 器特性测试已表明,23.85kbit/s时的模式具有比在23.05kbit/s时不太好的质 量,实际上,其质量与在15.85kbit/s时的模式的质量相似。这特别表明,必 须非常谨慎地控制伪HF信号水平,因为质量在23.85kbit/s时下降,而每个 帧4比特被认为使得最能够近似原始的高频的能量。
·应用声学终端(ITU-T G.191中的滤波器P.341)标准的传输响应的严 格模型导致将经编码的带限制到7kHz。现在,为了确保良好的质量水平, 对于16kHz的采样频率,在7-8kHz带中的频率仍然很重要,特别是对于音 乐信号。
随着在2008年被标准化的可缩放ITU-T G.718编解码器的发展, AMR-WB解码算法已经被部分地进行了改进。
ITU-T G.718标准包括所谓的可互操作(interoperable)模式,其中核心 编码与以12.65kbit/s的G.722.2(AMR-WB)编码兼容;而且,G.718解码 器具有能够对以AMR-WB编解码器的所有可能的比特率(从6.6到23.85 kbit/s)的AMR-WB/G.722.2比特流进行解码的具体特征。
图2示出低延迟模式(G.718-LD)下G.718可互操作解码器。以下是由 G.718编解码器中的AMR-WB比特流解码功能提供的改进的列表,必要时 参考图1:
·带扩展(例如在推荐G.718的条款7.13.1中描述的,块206)与 AMR-WB编解码器的完全相同,除了6-7kHz带通滤波器和1/AHB(z)合成滤 波器(块111和112)是以相反的顺序。此外,在23.85kbit/s时,在可互相 操作的G.718解码器中不使用通过AMR-WB编码器针对每个子帧传输的4 个比特;因此,23.85kbit/s时的高频(HF)的合成与23.05kbit/s一致,这 避免23.85kbit/s时的AMR-WB解码质量的已知问题。最重要地,不使用7 kHz低通滤波器(块113),并且省略23.85kbit/s模式的具体解码(块107 至109)。
·在G.718中,通过块208中的“噪声门(noise gate)”(用于通过降低 级别来“增强”静默的质量)、高通滤波(块209)、衰减低频的交叉谐波噪 声的块210中的低频后滤波器(被称为“低音后滤波器(bass posfilter)”) 以及在块211中通过饱和控制(通过增益控制或AGC)转换成16比特整数, 来实现16kHz(见G.718的7.14条)时的合成后处理。
然而,AMR-WB和/或G.718编解码器中的带扩展仍然在许多方面被限 制:
·具体地,通过格式化的白噪声(通过LPC源滤波器型的时间方法) 来合成高频是在高于6.4kHz的频率的带中的信号的非常有限的模式。
·仅6.4-7kHz带被人为地重新合成,然而实际上,在理论上可能有以 16kHz的采样频率的更宽的带(达8kHz),如果它们未通过在ITU-T的软 件工具库(标准G.191)所定义的P.341型(50-7000Hz)滤波器进行预处理, 则其可以潜在地增强信号的质量。
因此,需要改进AMR-WB型的编解码器或该编解码器的可互操作的版 本中的带扩展,或者更一般地,改进音频信号的带扩展。
本发明改善该情况。
发明内容
为此,本发明提出一种在解码或增强处理中扩展音频信号的频带的方 法,包含在被称为低带的第一频带中解码或提取线性预测滤波器的系数和激 励信号的步骤。该方法是这样的,其包括以下步骤:
-从在高于第一频带的至少一个第二频带中过采样和扩展的所述激励 信号获得在所述至少一个第二频带中的扩展信号;
-根据针对第一频带中的音频信号的每个帧和子帧的能量比,按照针对 每个子帧定义的增益来缩放扩展信号;
-通过线性预测滤波器对所述经缩放的扩展信号进行滤波,所述线性预 测滤波器的系数从低带滤波器的系数得出。
这样,考虑激励信号(得自对低带的解码或者对低带中的信号的提取) 使得能够使用更适合某些类型的信号(诸如音乐信号)的信号模式来执行带 扩展。
实际上,在某些情况下,在低带中解码或估计的激励信号包括谐波,当 它们存在时,可以被置换到高频,使得其能够确保在重构的高带中的一定水 平的调和性。
因此,根据该方法的带扩展可以改进这种类型的信号的质量。
此外,根据该方法的带扩展通过首先扩展激励信号、然后应用合成滤波 步骤来执行;这方法利用如下事实:在低带中解码的激励是频谱相对扁平的 信号,其避免可能存在于现有技术中的在频域中的已知的带扩展方法中的解 码信号增白(whitening)处理。
将注意到,即使本发明受增强在可互操作的AMR-WB编码的背景下的 带扩展质量所激发,不同实施例适用于音频信号的带扩展的更一般的情况, 特别是在执行音频信号的分析以提取带扩展所需的参数的增强设备中。
考虑低带(第一频带)中的信号的当前帧的电平和子帧的电平的能量的 事实使得能够调整在高带(第二频带)中的每个子帧的能量和每个帧的能量 之间的比率,从而调整能量比而不是绝对能量。这使得能够在高带中如在低 带中那样地保持在子帧与帧之间的相同的能量比,这在子帧的能量变化很大 时(例如瞬态声音发作的情况)特别有益。
下面提到的不同的具体实施例可以单独地或者结合另一个添加到在上 面定义的扩展方法的步骤中。
在一个实施例中,方法还包括以下步骤:根据当前帧的解码比特率进行 自适应带通滤波。
该自适应滤波使得能够根据比特率来优化扩展的带宽,并且因此而优化 在带扩展之后重构的信号质量。实际上,对于低比特率(对于AMR-WB, 典型地,6.6和8.85kbit/s),在低带中解码(通过AMR-WB编解码器或可互 操作的版本)的信号的一般质量不是非常好,所以优选不过多地扩展经解码 的带,并且因此通过适配相关联的带通滤波器的频率响应以覆盖例如大约 6-7kHz的带来限制带扩展;该限制完全是更有利的,因为激励信号本身被相对较差地编码并且优选不将其过宽的子带用于高频的扩展。相反,对于更 高的比特率(对于AMR-WB,12.65kbit/s及以上),质量可以通过覆盖例如 大约从6到7kHz的更宽的带的HF合成来增强。7.7kHz(而非8kHz)的 高限制是典型的实施例,其能够被调整成接近于7.7kHz的值。这里,该限 制可以通过如下事实来证明:在本发明中不使用附加信息来完成扩展,并且 到8kHz的扩展(即使其在理论上是可能的)可能针对具体信号导致伪像(artifact)。此外,到7.7kHz的该限制考虑如下事实:通常,模拟/数字转换 中的抗锯齿(anti-aliasing)滤波器以及在16kHz和其他频率之间的重采样 滤波器并不完美,并且它们通常在低于8kHz的频率时引入拒绝(rejection)。
在可能的实施例中,该方法包括激励信号的时频变换的步骤、获得然后 在频域中执行的扩展信号的步骤以及在缩放和滤波步骤之前对扩展信号进 行逆时频变换的步骤。
在频域中实现带扩展(激励信号)使得能够获得通过时间方法不可得到 的频率分析的细微的程度,并且还使得能够具有足够的频率分辨率来检测谐 波并且置换成(在低带中)信号的高频谐波以在考虑信号结构的同时增强质 量。
在详细的实施例中,生成经过过采样和扩展的激励信号的步骤根据以下 等式来执行:
其中,k是样本索引,UHB1(k)是扩展的激励信号的频谱,U(k)是变换步骤之 后获得的激励信号的频谱,start_band是预定义的变量。
这样,该函数实际上包含通过将样本添加到该信号的频谱来对激励信号 进行重采样。
在对应于样本的范围为从200至239的频带中,保留原始频谱,以便能 够对其应用在该频带中的高通滤波器的渐进衰减响应,并且不在将低频合成 添加到高频合成的步骤中引入可听见的缺陷。
在具体实施例中,该方法包括至少在第二频带中对扩展信号进行去加重 滤波的步骤。
这样,在第二频带中的信号被调整到与第一频带中信号一致的域中。
在具体实施例中,该方法还包括至少在第二频带生成噪声信号的步骤, 扩展信号通过组合扩展的激励信号和噪声信号来获得。
实际上,对于具有适合于某些类型信号的信号模式,具有得自至少一个 第二频带中的经过过采样和扩展的激励信号的特征就足够了。这可以组合另 外的信号,例如所生成的噪声,以获得具有适合的信号模式的扩展信号。
在一个实施例中,组合步骤通过与在扩展的激励信号和噪声信号之间的 电平均衡增益(level equalization gain)的自适应加法混合(adaptive additive mixing)来执行。
该均衡增益的应用使得能够在组合步骤适应信号特征以优化在混合中 的噪声的相对比例。
本发明的目标还在于一种用于扩展音频信号的频带的设备,包含在被称 为低带的第一频带中解码或提取线性预测滤波器的系数和激励信号的级。该 设备如下,其包含:
-用于从在高于第一频带的至少一个第二频带(UHB1(k))中过采样和扩 展的所述激励信号获得在所述至少一个第二频带中的扩展信号(UHB2(k), 503)的模块;
-用于根据第一频带中的音频信号的每个帧和子帧的能量比,按照针对 每个子帧定义的增益来缩放扩展信号的模块(507);
-用于通过线性预测滤波器对所述经缩放的扩展信号进行滤波的模块 (510),所述线性预测滤波器的系数从低带滤波器的系数得出。
该设备提供与其实现的先前描述的方法相同的优点。
本发明的目标在于包括所述设备的解码器。
目标还在于一种包含代码指令的计算机程序,当这些指令被处理器执行 时实现所述带扩展方法的步骤。
最后,本发明涉及一种可以由处理器读取的存储介质,其可以合并在带 扩展设备中或者不在带扩展设备中,能够移动,并且可以存储实现先前描述 的带扩展方法的计算机程序。
附图说明
本发明的其他特征和优点将通过阅读以下描述而变得更清楚,以下描述 给出纯粹作为非限制性的例子并且参考附图,附图中:
-图1示出实现现有技术的以及所先前所述的频带扩展步骤的 AMR-WB型解码器的一部分;
-图2示出根据现有技术的以及所先前所述的16kHz G.718-LD可互操 作型的解码器;
-图3示出根据本发明的实施例的合并带扩展设备的可与AMR-WB编 码互操作的解码器;
-图4以图表形式示出根据本发明实施例的带扩展方法的主要步骤;
-图5示出根据本发明的带扩展设备的频域中的第一实施例;
-图6示出在本发明的具体实施例中使用的带通滤波器的示例性频率响 应;
-图7示出根据本发明的带扩展设备的时域中的第二实施例;以及
-图8示出根据本发明的带扩展设备的硬件实现方式。
具体实施方式
图3示出与AMR-WB/G.722.2标准兼容的示例性解码器,其中存在与在 G.718中介绍并且参照图2描述的相似的后处理以及由块309示出的带扩展 设备实现的根据本发明的扩展方法的改进的带扩展。
与以16kHz的输出采用频率进行操作的AMR-WB解码和以8或16kHz 进行操作的G.718解码器不同,这里解码器被考虑为可以以频率fs=8、16、 32或48kHz的输出(合成)信号进行操作。应当注意,这里假设已经根据 AMR-WB算法执行了编码,其中12.8kHz的内部频率用于在低带中的CELP 编码,并且以23.85kbit/s,针对以16kHz的频率的每个子帧进行增益编码; 虽然这里在解码级对发明进行了描述,但是这里假设编码也可以以频率 fs=8、16、32或48kHz的输入信号进行操作,并且适合的重采样操作(超 出本发明内容)在编码中根据fs的值来实现。可以注意到,当fs=8kHz时, 在解码与AMR-WB兼容情况下,不必扩展0-6.4kHz低带,因为以频率fs重 构的音频带被限制到0-4000kHz。
在图3中,CELP解码(LF代表低频)如在AMR-WB和G.718中那样, 仍然以12.8kHz的内部频率进行操作,并且作为本发明的主题的带扩展(HF 代表高频)以16kHz的频率进行操作,并且LF和HF合成是在适合的重采 样之后(块306以及块311中的内部处理)以频率fs被组合(块312)。在 本发明的变型中,低带和高带的组合可以在16kHz处、在对从12.8到16kHz的低带进行重采样之后、在以频率fs对扩展信号进行重采样之前完成。
根据图3的解码取决于与所接收的当前帧相关联的AMR-WB模式(或 比特率)。作为指示并且在不影响块309的情况下,在低带中的CELP部分 的解码包括以下步骤:
·在正确地接收到帧的情况下,对经编码的参数进行多路分解(块300) (bfi=0,bfi是“坏帧指示器”,其中0值代表所接收的帧和1代表丢失的帧);
·如在标准G.722.2的条款6.1是所描述的那样,通过内插和转换成LPC 系数对ISF参数进行解码(块301);
·对CELP激励进行解码(块302),其中自适应和固定部分用于在以 12.8kHz的长度为64的每个子帧中重构激励(exc或u′(n)):
其中遵照关于CELP解码的G.718的条款7.1.2.1的标记,其中,v(n)和c(n) 分别是自适应和固定字典的码字,是相关联的经解码的增益。该激 励u′(n)被用在下一个子帧的自适应字典中;然后,对其进行后处理,并且 如在G718中那样,在块303中,将激励u′(n)(也被记为exc)与用作合成 滤波器的输入的其修改的经过后处理的版本u(n)(也被记为exc2) 区分开;在可以实现本发明的变型中,可以修改对激励应用的后处理操作(例 如,可以增强相位分散),或者可以扩展这些后处理操作(例如,可以实现 交叉谐波噪声的减少),而不影响根据本发明的带扩展方法的性质;
·通过进行合成滤波(块303),其中经解码的LPC滤波器是 16阶的;
·如果fs=8kHz,则根据G.718条款7.3来进行窄带后处理(块304);
·通过滤波器1/(1-0.68z-1)进行去加重(块305);
·如在G.718的条款7.14.1.1中所描述的那样,对低频进行后处理(块 306)。该处理引入在高带(>6.4kHz)的解码中考虑的延迟;
·以输出频率fs对12.8kHz的内部频率进行重采样(块307)。可能有 一些实施例。在不失一般性的情况下,作为例子,这里认为,如果fs=8或 16kHz,则在这里重复在G.718的条款7.6中描述的重采样,而如果fs=32或 48kHz,则使用另外的有限脉冲响应(FIR)滤波器;
·计算“噪声门”的参数(块308),其优选如在G.718的条款7.14中 所描述的那样地执行。
可以注意到,块306、308、314的使用是可选的。
还将注意到,上述的低带的解码假设所谓“活动的”当前帧具有在6.6 和23.85kbit/s之间的比特率。实际上,在激活DTX模式时,某些帧被编码 为“不活动的”,在这种情况下,能够传送静默描述符(以35比特)或者什 么也不传送。具体地,将记起SID帧描述许多参数:在8帧上平均的ISF参 数、在8帧上的平均能量、用于重构不稳定噪声的抖动标志。在所有情况下, 在解码器中,存在与用于活动帧的相同的解码模式,具有对当前帧的LPC 滤波器和激励的重构,其使得能够将带扩展甚至应用于不活动的帧。同样的 观察适用于对“丢失帧”(或FEC、PLC)的解码,其中应用LPC模型。
与AMR-WB或G.718解码不同,根据本发明的解码器使得能够将经解 码的低带(考虑在解码器上的50Hz高通滤波的50-6400Hz,一般情况下为 0-6400Hz)扩展为扩展带,其宽度根据在当前帧中实现的模式不同而变化, 范围大约从50-6900Hz到50-7700Hz。这样,其能够参考0-6400Hz的第一 频带以及6400-8000Hz的第二频带。实际上,在优选实施例中,激励的扩展 在5000-8000Hz带的频域中执行,以允许6000到6900或7700Hz宽度的带 通滤波。
在优选实施例中,在23.85kbit/s时,如在参考图2描述的G.718解码器 中那样,以23.85kbit/s传送的HF增益校正信息(0.8kbit/s)在这里被忽视。 于是,在图3中,不使用特定于23.85kbit/s的块。
在表示根据本发明的带扩展设备的并且在第一实施例中的图5中以及在 第二实施例的图7中详细描述的块309中实现高带解码部分。
该设备包含:从在高于第一频带的至少一个第二频带(UHB1(k))至少一 个模块中过采样和扩展的激励信号获得在至少一个第二频带中的扩展信号 的至少一个模块;用于根据第一频带中的音频信号的每个帧和子帧的能量 比,按照针对每个子帧定义的增益来缩放扩展信号的模块;以及用于通过线 性预测滤波器对所述经缩放的扩展信号进行滤波的模块,所述线性预测滤波 器的系数从低带滤波器的系数得出。
为了对齐经解码的低带和高带,在第一实施例中引入延迟(块301)以 对块306和307的输出进行同步,并且从16kHz到频率fs(块311的输出) 对以16kHz合成的高带进行重采样。例如,当fs=16kHz时,延迟T=30 个样本,其对应于15个样品的从12.8到16kHz的重采样的延迟+15个样品 的低频的后处理的延迟。根据所实现的处理操作,延迟T的值将必须适合于 其他情况(fs=32,48kHz)。将记起当fs=8kHz时,不必应用块309到311, 因为在解码器的输出处的信号的带被限制为0-4000Hz。
将注意到,根据第一实施例的在块309中实现的本发明的扩展方法优选 不引入相对于以12.8kHz重构的低带的任何另外的延迟;然而,在本发明的 变型中(例如,通过重叠地使用时间/频率变换),将可能引入延迟。因此, 一般地,在块310中的T值必须根据具体实施进行调整。例如,在不使用低 频的后处理(块306)的情况下,对fs=16kHz引入的延迟将可能被设置为 T=15个样品;相似地,在根据在图7中描述的实施例的变型来实现本发明的情况下,如果使用低频的后处理(块306),则降低T值以补偿由其引入 的延迟。
然后,在块312中组合(相加)低带和高带,所获得的合成通过系数取 决于频率fs的2阶的50Hz高通滤波(IIR型)进行后处理(块313),并且 以与G.718(块314)相似的方式输出后处理,可选地应用“噪声门”。
根据图3的解码器的实施例的由块309示出的根据本发明的带扩展设备 实现现在参考图4描述的带扩展方法。
该扩展设备也可以独立于解码器,并且可以实现在图4中描述的方法, 以对存储到或传送给该设备的现有音频信号执行带扩展,其中分析音频信号 以从中提取激励和LPC滤波器。
作为输入,该设备在实现在时域中的情况下接收在被称为低带的第一频 带中的激励信号u(n),或者在实现在频域中的情况下接收U(k),然后对其应 用时频变换步骤。
在应用在解码器中的情况下,该所接收的激励信号是经解码的信号。
在独立于解码器的增强设备的情况下,通过分析音频信号来提取低带激 励信号。
在一个可能的实施例中,在激励的提取步骤之前对低带音频信号进行重 采样,使得通过根据低带信号(或者根据与低带相关联的LPC参数)估计 出的线性预测从音频信号提取的激励已经被重采样。在这种情况下的示例性 实施例包含:取得以12.8kHz采样的低带信号,对其存在描述当前帧的短期 频谱包络的低带LPC滤波器;以16kHz对其进行过采样;以及通过由对LPC 滤波器进行外插所获得的LPC预测滤波器对其进行滤波。另外的示例性实 施例包含:取得以12.8kHz采样的低带信号,对其没有LPC模型;以16kHz 对其进行过采样;以16kHz对该信号执行LPC分析;以及由通过该分析所 获得的LPC预测滤波器对该信号进行滤波。
执行步骤E401,该步骤生成在高于第一频带的第二频带中的经扩展的 经过过采样的激励信号(uext(n)或UHB1(k))。根据作为输入所获得的激励信号, 该生成步骤可以包含重采样步骤和扩展步骤两者,或者仅包含扩展步骤。
稍后参考图5和图7来详细描述该步骤。
该经扩展的经过过采样的激励信号被用于获得第二频带中的扩展信号 (UHB2(k))。然后,该扩展信号由于扩展的激励信号的特征而具有适合于某 些类型信号的信号模型。
该扩展信号可以在经过过采样和扩展的激励信号与另外的信号(例如噪 声信号)的组合之后获得。
这样,在一个实施例中,执行步骤E402,该步骤生成至少在第二频带 中的噪声信号(uHB(n)或UHB(k))。第二频带例如是范围从6000到8000Hz 的高频带。例如,该噪声可以通过线性同余生成器以伪随机方式来生成。在 本发明的变型中,将可能用其他方法取代该噪声生成,例如,能够定义(诸 如1这样的任意值的)恒定幅度的信号,并且将随机符号施加于所生成的每 个频率射线(frequency ray)。
然后,在步骤E403中将经扩展的激励信号与噪声信号组合,以获得将 可能被称为对应于包括第一和第二频带的所有频带的扩展频带中的组合信 号(uHB1(n)或UHB2(k))。这样,这两种类型的信号的组合使得能够获得具有 更适合于某些类型信号(诸如音乐信号)的特征的组合信号。
实际上,在某些情况下,在低带中解码或估计的激励信号包括更接近于 音乐信号的谐波而不是单独的噪声信号。因此,低频谐波(如果它们存在) 可以置换到高频,使得它们与噪声的混合使得能够确保在重构的高带中的一 定级别的调和性或相关噪声级别或频谱扁平性。
与AMR-WB相比,根据该方法的带扩展增强这种类型的信号的质量。
然后,在E404中,通过线性预测滤波器对组合(或扩展)信号进行滤 波,线性预测滤波器的系数得自通过对低带信号或其经过过采样的版本进行 分析和提取所解码或获得的低带滤波器的系数。因此,根据本方法 的带扩展通过首先扩展激励信号、然后通过线性预测(LPC)应用合成滤波 的步骤来执行;该方法利用如下事实:在低带中解码的LPC激励是频谱相 对扁平的信号,其避免在带扩展中的另外的经解码的信号的白化处理操作。
有利地,该滤波器的系数例如可以根据在低带中的线性预测滤波器 (LPC)的经解码的参数来获得。如果以16kHz采样的高带中所使用的LPC 滤波器的形式是其中是在低带中解码的滤波器,γ是加权 因子,滤波器的频率响应对应于在低带中解码的滤波器的频率响应 的散布。在变型中,将可能将滤波器扩展到更高阶(诸如到块111中 的6.6kbit/s)以避免这样的散布。
优选地,但是可选地,可以执行在E405中的自适应带通滤波和/或在 E406和E407中的缩放的另外的步骤,以便一方面根据解码比特率来增强扩 展信号的质量,另一方面确保在子帧和组合信号帧之间保持与在低频带中的 相同的能量比。
这些步骤将在图5和7的实施例中更详细地解释。
在第一实施例中,现在参考图5来描述带扩展设备。该设备实现先前参 考图4所描述的带扩展方法。
这样,在该设备的输入处,接收通过分析而解码或估计出的低带激励信 号(u(n))。这里,带扩展使用在块302的输出处以12.8kHz(exc2或u(n)) 解码的激励。
将注意到,在该实施例中,在范围从5到8kHz并且因此而包括在第一 频带(0-6.4kHz)之上的第二频带(6.4-8kHz)的频带中执行经过过采样和 扩展的激励的生成。
这样,至少在第二频带之上,而且还在第一频带的一部分之上,执行扩 展的激励信号的生成。
显然,定义这些频带的值可以根据应用本发明的解码器或处理设备而不 同。
对于该示例性实施例,通过时频变换模块500对该信号进行变换以获得 激励信号频谱U(k)。
在具体实施例中,变换对20ms的当前帧(256个样本)使用DCT-IV (即“离散余弦变换”-IV型)(块500),不使用窗口化(windowing),其 相当于根据以下公式直接变换u(n),其中n=0,…,255:
其中,N=256并且k=0,…,255。
这里应当注意的是,不使用窗口化(或者,等效地,使用帧的长度的隐 式矩形窗口)的变换是可能的,因为处理在激励域而非信号域中执行,使得 听不到伪像(块效应),其构成本发明的该实施例的重要优点。
在该实施例中,DCT-IV变换是通过FFT根据在D.M.Zhang、H.T.Li 的文章“A LowComplexity Transform–Evolved DET”(IEEE 14th International Conference onComputational Science and Engineering(CSE), 2011年8月,144-149页)中描述的并且在ITU-T标准G.718附录B和G.729.1 附录E中实现的所谓的“演变的DCT(Evolved DCT,EDCT)”算法来实 现。
在本发明的变型中,并且不失一般性,DCT-IV变换能够替换为相同长 度并且在激励域中的其他短期时频变换,诸如FFT(即“快速傅里叶变换”) 或DCT-II(离散余弦变换-II型)。替代地,将可能通过使用比当前帧的长度 更长的重叠相加和窗口化的变换来替换对该帧的DCT-IV,例如通过使用 MDCT(即“修改的离散余弦变换”)。在这种情况下,将必须近似地根据由 该变换进行的分析/合成引起的另外的延迟来调整(降低)图3的块310中的 延迟T。
然后,将(以12.8kHz)覆盖0-6400Hz带的256个样品的DCT频谱 U(k)扩展(块501)成如下形式的(以16kHz)覆盖0-8000Hz带的320个 样品的频谱:
其中优选取start_band=160。
块501作为用于生成经过过采样和扩展的激励信号的模块进行操作,并 且执行包含通过将1/4的样本(k=240,…,319)加入到频谱中来在频域中从 12.8到16kHz进行重采样的步骤E401,在16和12.8之间的比率是5/4。
此外,因为UHB1(k)的前200个样品被设为0,所以块501执行在0-5000 Hz带中的隐式的高通滤波;如稍后所解释的那样,该高通滤波还通过在 5000-6400Hz带中的索引k=200,…,255的频谱值的渐进衰减的一部分来补 偿;该渐进衰减在块504实现,但是可以在块504的外部单独地执行。等效 地,在本发明的变型中,被分离到变换的域中的衰减系数k=200,…,255、被 设置为0的索引k=0,…,199的系数的块的高通滤波的实现方式将因此而能够 在单一步骤中执行。
在该示例性实施例中,并且根据UHB1(k)的定义,将注意到,UHB1(k)的 5000-6000Hz带(其对应于索引k=200,…,239)是从U(k)的5000-6000Hz带 复制的。该方法使得能够在该带中保留原始频谱,并且避免在将HF合成与 HF合成相加时在5000-6000Hz带中引入失真,具体地,保持该带中的(在 DCT-IV域中隐式地表示的)信号的相位。
这里,因为start_band的值优选被设定为160,所以通过复制U(k)的 4000-6000Hz带来定义UHB1(k)的6000-8000Hz带。
在实施例的变型中,将可能使start_band的值自适应地在160值附近, 而不用改变本发明的性质。这里不描述start_band值的自适应的细节,因为 它们不改变其范围的情况下超出本发明的框架。
对于某些宽带信号(以16kHz采样),高带(>6kHz)可以是噪声影响 的(noise-affected)、谐波或者包括噪声和谐波的混合。此外,6000-8000Hz 带中的谐波级别一般与更低频带的谐波级别有关。这样,在具体的实施例中, 噪声生成块502实现图4的步骤E402,并且在对应于被称为高频的第二频 带的频域UHBN(k)(k=240,…,319)(80个样品)中执行噪声生成,以便然 后在块503中将该噪声与频谱UHB1(k)组合。
在具体的实施例中,使用16比特的线性同余生成器来伪随机地生成噪 声(在6000-8000Hz带中):
遵守常规,在当前帧中的UHBN(239)对应于前面的帧的值UHBN(319)。在本发 明的变型中,将可能用其他方法来代替该噪声生成。
组合块503可以以不同的方式来产生。优选地,考虑以下形式的自适应 加法混合:
UHB2(k)=βUHB1(k)+αGHBNUHBN(k),k=240,…,319
其中,GHBN是归一化因子,用于平衡两个信号之间的能量级别,
其中,ε=0.01,系数α(在0和1之间)根据从经解码的低带估计出的参 数来调整,系数β(在0和1之间)取决于α。
在优选实施例中,在三个带中计算出噪声的能量:2000-4000Hz、 4000-6000Hz和6000-8000Hz,其中
其中
并且N(k1,k2)是索引k的集合,索引k的系数以与噪声相关联的方式来分类。 该集合例如可以通过检测验证|U′(k)|≥|U′(k-1)|et|U′(k)|≥|U′(k+1)|的U′(k)并且通过考虑不与噪声相关联的这些射来获得,亦即(应用前面条件的否定):
N(a,b)={a≤k≤b||U′(k)|<|U′(k-1)|ou|U′(k)|<|U′(k+1)|}
可以注意到,计算噪声能量的其他方法是可能的,例如通过取得在所考 虑的带上的频谱的中间值或者通过在计算每个带的能量之前对每个频率射 线应用平滑处理。
α是4-6kHz和6-8kHz带中的噪声的能量之间的比率与2-4kHz和4-6 kHz带之间的一样的集合:
其中
EN4-6=max(EN4-6,EN2-4),ρ=max(ρ,EN6-8)
其中,max(.,.)是给出两个参量的最大值的函数。
在本发明的变型中,α的计算将可能被替换为其他方法。例如,在变型 中,将可能提取(计算)表征在低带中的信号的不同参数(或“特征”),包 括与AMR-WB编解码器中计算出的相似的“倾斜(tilt)”参数,并且将根 据线性回归、从这些不同的参数、通过将其值限制在0和1之间,来估计因 子α。线性回归将例如能够以被监督的方式通过估计因子α(通过交换在 学习库(learning base)中的原始高带)来估计。将注意到,计算α的方式 不限制本发明的性质。
在优选实施例中,为了在混合之后保留扩展信号的能量,采取:
在变型中,因子β和α将可能被适配以考虑如下事实:被注入到信号的 给定带中的噪声一般被感知为强于在相同带中具有相同能量的谐波信号。因 此,将可能如下那样地修改因子β和α:
β←β.f(α)
α←α.f(α)
其中,f(α)是α的递减函数,例如,b=1.1,a=1.2,f(α) 被限制于从0.3到1。必须要注意到,在乘以f(α)之后,α22<1,使得 信号UHB2(k)=βUHB1(k)+αGHBNUHBN(k)的能量比UHB1(k)的能量更低(能量差异取 决于α,添加的噪声越多,能量衰减的越多)。
在本发明的另一变型中,将可能采取:
β=1-α
其使得能够保留幅度级别(当组合信号的符号相同时);然而,该变型具有 导致作为α的函数是不单调的整体能量(在UHB2(k)的级别)的缺点。
因此,这里应当注意,块503作为图1的块101的等效物,以根据激励 对白噪声进行归一化,相比之下,激励在频域中已经被扩展到16kHz比率; 而且,混合被限制到6000-8000Hz带。
在简单的变型中,能够考虑块503的实现,其中频谱UHB1(k)或GHBNUHBN(k) 被自适应地选择(切换),这相当于对于α只允许值0或1;该方法相当于对 将在6000-8000Hz带中生成的激励的类型进行分类。
可选地,块504执行在频域中应用带通滤波器频率响应和去加重滤波的 双重操作。
在本发明的变型中,去加重滤波将可能在块505之后,甚至在块500之 前,在时域中执行;然而,在该情况下,在块504中执行的带通滤波可以遗 弃可能以稍微可感知的方式修改经解码的低带的由去加重放大的非常低的 级别的某些低频分量。为此,这里优选在频域中执行去加重。在优选实施例 中,索引k=0,…,199的系数被设置为0,因此去加重被限制在更高的系数。 首先根据下面的等式对激励去加重:
其中,Gdeemph(k)是在受限制的离散频率带上的滤波器1/(1-0.68z-1)的频率响应。通过考虑DCT-IV的离散(奇数)频率,这里将Gdeemph(k)定义为:
其中
在使用DCT-IV之外的变换的情况下,将可能调整θk的定义(例如针对偶数 频率)。
应当注意,去加重应用在两个阶段,即对应于5000-6400Hz频带的 k=200,…,255,其中响应1/(1-0.68z-1)被应用为以12.8kHz,以及对应于 6400-8000Hz频带的k=256,…,319,其中响应在这里从16kHz被扩展到6.4-8 kHz带中的恒定值。
可以注意到,在AMR-WB编解码器中,HF合成未被去加重。相反地, 在这里提出的实施例中,高频信号被去加重,以便可以将其带入到与由块305 遗弃的低频信号(0-6.4kHz)一致的域中。这对于HF合成的能量的评估和 随后的调整是很重要的。
在实施例的变型中,为了降低复杂性,将可能将Gdeemph(k)设置为与k无 关的恒定值,例如采取Gdeemph(k)=0.6,其近似对应于在上述实施例条件中的 k=200,…,319的Gdeemph(k)的平均值。
在扩展设备的实施例的另一个变型中,将可能在逆DCT之后在时域中 以等效的方式来执行去加重。在稍后描述的图7中实现这样的实施例。
除了去加重之外,带通滤波还与两个单独的部分一起应用:其一,高通, 固定的;另一个,低通,自适应的(比特率的函数)。
该滤波在频域中执行,并且它的频率响应在图6示出。对于低部分,在 3dB处的截止频率是6000Hz,对于高部分,在6.6、6.8以及高于比8.85kbit/s 的比特率处(分别)大约是6900、7300、7600Hz。
在优选实施例中,在频域中如下那样地计算低通滤波器部分响应:
其中,在6.6kbit/s时,Nlp=60,在8.85kbit/s时为40,并且在比特率>8.85bit/s时为20。
然后,以如下形式应用带通滤波器:
Ghp(k)(k=0,…,55)的定义例如在下面的表1中给出:
K g<sub>hp</sub>(k) K g<sub>hp</sub>(k) K g<sub>hp</sub>(k) k g<sub>hp</sub>(k)
0 0.001622428 14 0.114057967 28 0.403990611 42 0.776551214
1 0.004717458 15 0.128865425 29 0.430149896 43 0.800503267
2 0.008410494 16 0.144662643 30 0.456722014 44 0.823611104
3 0.012747280 17 0.161445005 31 0.483628433 45 0.845788355
4 0.017772424 18 0.179202219 32 0.510787115 46 0.866951597
5 0.023528982 19 0.197918220 33 0.538112915 47 0.887020781
6 0.030058032 20 0.217571104 34 0.565518011 48 0.905919644
7 0.037398264 21 0.238133114 35 0.592912340 49 0.923576092
8 0.045585564 22 0.259570657 36 0.620204057 50 0.939922577
9 0.054652620 23 0.281844373 37 0.647300005 51 0.954896429
10 0.064628539 24 0.304909235 38 0.674106188 52 0.968440179
11 0.075538482 25 0.328714699 39 0.700528260 53 0.980501849
12 0.087403328 26 0.353204886 40 0.726472003 54 0.991035206
13 0.100239356 27 0.378318805 41 0.751843820 55 1.000000000
表1
将注意到,在本发明的变型中,将可能修改Ghp(k)的值,同时保持渐近 衰减。相似地,具有可变带宽的低通滤波Glp(k)可以使用不同的值或频率中 间值来调整,而不改变该滤波步骤的原理。
还将注意到,在图6示出的带通滤波的例子将可能通过定义组合高通和 低通滤波的单一滤波步骤来适配。
在另外的实施例中,将可能在逆DCT步骤之后根据比特率使用不同的 滤波器系数在时域中(如在图1的块112中那样)以等效的方式来执行带通 滤波。稍后在图7中实现这样的实施例。然而,将注意到,在频域中直接执 行该步骤是有利的,因为滤波是在LPC激励的域中执行,并且因此循环卷 积和边缘效应的问题在该域中是非常有限的。
逆变换块505对320个样本执行逆DCT以找到以16kHz采样的高频激 励。因为DCT-IV是正交的,所以其实现方式与块500相同,除了变换的长 度是320而不是256,并且获得:
其中,N16k=320,并且k=0,…,319。
然后,可选地,按照针对80个样本的每个子帧定义的增益对以16kHz 采样的该激励进行缩放(块507)。
在优选的实施例中,首先针对每个子帧通过子帧的能量的比率来计算 (块506)增益gHB1(m),使得在当前帧的索引m=0,1,2或3的每个子帧中:
其中
其中,ε=0.01。针对每个子帧的增益gHB1(m)可以写成以下形式:
其示出,在信号uHB中,确保在每个子帧的能量与每个帧的能量之间的与在 信号u(n)中相同的比率。
块507根据下面的等式来执行组合的(或扩展的)信号的缩放(图4的 步骤E406):
uHB′(n)=gHB1(m)uHB(n),n=80m,…,80(m+1)-1
将注意到,块506的实现方式与图1的块101的实现方式不同,因为除 了子帧的能量之外还考虑在当前帧级别处的能量。这使得能够具有每个子帧 的能量相对于帧的能量的比率。因此,比较能量的比率(或相对能量),而 不是低带和高带之间的绝对能量。
因此,该缩放步骤使得能够在高带中以与在低带中相同的方式来保持子 帧和帧之间的能量的比率。
可选地,块509然后根据以下等式来执行信号的缩放(图4步骤E407):
uHB″(n)=gHB2(m)uHB′(n),n=80m,…,80(m+1)-1
其中,通过执行AMR-WB编解码器的块103、104和105来从块508获得增 益gHB2(m)(块103的输入是在低带中解码的激励u(n))。块508和509对 于调整LPC合成滤波器的级别(块510)(这里根据信号的倾斜)是有用的。 能够有计算增益gHB2(m)的其他方法,而不改变本发明的性质。
最后,通过滤波模块510对激励uHB′(n)或uHB″(n)进行滤波(图4的步骤 E404),这里,其可以通过取作传递函数来执行,其中,在6.6kbit/s 时γ=0.9,在其他比特率时γ=0.6,从而将滤波器的阶数限制为16阶。
在变型中,该滤波将可能以针对AMR-WB编解码器的图1的块111所 描述的相同方式来执行,但是滤波器的阶在6.6比特率时改变为20,其并不 显著地改变合成信号的质量。在另外的变型中,将可能在已经计算出在块510 中实现的滤波器的频率响应之后,在频域中执行LPC合成滤波。
在本发明的变型实施例中,低带(0-6.4kHz)的编码将可能被替换为在 AMR-WB中使用的编码器之外的CELP编码器,诸如例如以8kbit/s的G.718 中的CELP编码器。不失一般性地,可以使用其他宽带编码器或以高于16kHz 的频率进行操作的编码器,其中低带的编码以12.8kHz的内部频率进行操 作。而且,很明显,当低频解码器以低于原始或重构的信号的采样频率的采 样频率进行操作时,本发明可以适合于12.8kHz之外的采样频率。当低带解 码不使用线性预测时,没有要被扩展的信号,在这种情况下,将可能对在当 前帧中重构的信号执行LPC分析,并且将计算LPC激励以便能够应用本发 明。
最后,在本发明的另外的变型中,在长度320的变换(例如DCT-IV) 之前,从12.8到16kHz,例如通过线性内插或立方“仿样”,对激励(u(n)) 进行重采样。该变型具有更复杂的缺点,因为然后在更大的长度上计算出激 励的变换(DCT-IV)并且不在变换域中执行重采样。
而且,在本发明的变型中,估计增益 (GHBN,gHB1(m),gHB2(m),gHBN,…)所需的所有计算将可能在对数域中执 行。
参考图7,现在描述带扩展设备的第二实施例。该实施例在时域中操作。
如在图5的实施例中那样,保留具有16kHz的扩展信号和噪声信号的 混合的实施例的原理,但是该混合此时是在时域中执行的,并且此时,针对 每个子帧而不是每个帧来完成激励的主要生成。
来自在当前帧中的低频解码的激励信号u(n)(n=0,…,255)首先以16 kHz(块700)无延迟地(图4步骤E401)进行重采样,并且在具体的实施 例中,使用线性内插来获得第二频带中的激励信号uext(n)(n=0,…,319)。在 变型实施例中,将可能使用其他重采样方法,例如“仿样”或多速率滤波。
使用块701和702进行检查以确保信号uext(n)的能量具有与激励u(n)相 似的级别,如下:
在变型实施例中,将可能将u′ext(n)乘以5/4乘以补偿由不同的信号采样 频率uext(n)和u(n)造成的按照比率12.8/16的衰减。
在块703中的噪声生成器实现图4的步骤E402,并且可以如在图5中 所描述的块502那样地实现,除了在输出处的信号对应于时间子帧uHBN(n) (n=0,…,319)之外。
组合块704可以以不同的方式产生。优选地,考虑以如下形式的针对每 个子帧的自适应加法混合:
uHB1(n+80m)=βuext(n+80m)+αgHBNuHBN(n+80m),n=0,…,79
其中gHBN是用于均衡两个组合信号的谐波的级别的归一化因子,
m是子帧的索引,并且如在第一实施例中那样地计算因子α和β。因此,将 注意到,块704作为图1的块101的等效物。此外,因子α的计算需要计算 低带中的经解码的激励信号(或者根据相对噪声级别或频谱扁平性的计算域 的经解码的信号本身)的变换,如果该计算依赖于频谱扁平性;在包括前述 的线性回归的使用的变型中,这样的变换不是必须的。
然后,时间信号通过gdeemph/(1-0.68z-1)形式的滤波器进行去加重(块 705),其中计算gdeemph以便将滤波器1/(1-0.68z-1)(在12.8kHz处定义)延 长为16kHz的采样频率gdeemph=(1-0.68ej2π6000/16000)/(1-0.68ej2π6000/12800)|,然后通过阶数 固定(值为30)但其系数根据当前帧的经解码的比特率而改变的可变带宽的 带通滤波(块706)进行处理。在下表中给出这样的FIR型的自适应带通滤 波的示例性实施例,该表定义根据比特率的FIR滤波器的脉冲响应。
n h(n) n h(n) n h(n) n h(n)
0 -0.0002581 8 0.0306285 16 -0.1451668 24 -0.0114595
1 0.0003791 9 -0.0716116 17 0.0626279 25 0.0090482
2 0.0002581 10 0.0995869 18 0.0286124 26 -0.0029758
3 -0.0002177 11 -0.0885791 19 -0.0885791 27 -0.0002177
4 -0.0029758 12 0.0286124 20 0.0995869 28 0.0002581
5 0.0090482 13 0.0626279 21 -0.0716116 29 0.0003791
6 -0.0114595 14 -0.1451668 22 0.0306285 30 -0.0002581
7 0 15 0.1783678 23 0 - -
表2a(6.6kbit/s)
n h(n) n h(n) n h(n) n h(n)
0 0.0019706 8 0.0312161 16 -0.1720177 24 -0.0030672
1 -0.0064291 9 -0.0709664 17 0.0817478 25 -0.0041966
2 0.0124179 10 0.0980678 18 0.0181018 26 0.0132058
3 -0.0160589 11 -0.0842625 19 -0.0842625 27 -0.0160589
4 0.0132058 12 0.0181018 20 0.0980678 28 0.0124179
5 -0.0041966 13 0.0817478 21 -0.0709664 29 -0.0064291
6 -0.0030672 14 -0.1720177 22 0.0312161 30 0.0019706
7 -0.0036671 15 0.2083360 23 -0.0036671 -
表2b(8.85kbit/s)
n h(n) n h(n) n h(n) n h(n)
0 0.0013312 8 0.0606146 16 -0.1916778 24 0.0221682
1 -0.0047346 9 -0.0860005 17 0.1093354 25 -0.0180046
2 0.0098657 10 0.0924138 18 -0.0129187 26 0.0171709
3 -0.0147045 11 -0.0607694 19 -0.0607694 27 -0.0147045
4 0.0171709 12 -0.0129187 20 0.0924138 28 0.0098657
5 -0.0180046 13 0.1093354 21 -0.0860005 29 -0.0047346
6 0.0221682 14 -0.1916778 22 0.0606146 30 0.0013312
7 -0.0360130 15 0.2240719 23 -0.0360130 - -
表2c(比特率>8.85kbit/s)
缩放步骤(图4中的E407)是由与图5相同的块508和509来执行。
滤波步骤(图4中的E404)是由与参考图5所描述的相同的滤波模块 (块510)来执行。
这里,不必实现由块506和507在图5的实施例中所执行的缩放步骤, 因为针对每个子帧生成激励。已经确保在帧级别上的能量比的一致性。
在带扩展的变型中,在低带中的激励u(n)和LPC滤波器将针 对每个帧通过对必须被扩展的低带信号的LPC分析进行估计。然后,通过 分析音频信号来提取低带激励信号。
在该变型的可能实施例中,在提取激励的步骤之前对低带音频信号进行 重采样,使得已经对(通过线性预测)从音频信号提取的激励信号进行了重 采样。
在该情况下对未被解码是是被分析的低带应用在图5中或者替代地在图 7中示出的本发明。
图8表示根据本发明的带扩展设备800的示例性物理实施例。后者可以 形成音频信号解码器或接收经解码的或未经解码的音频信号的装置项目的 必须部分。
该类型的设备包括与包括储存器和/或工作存储器MEM的存储器块BM 协作的处理器PROC。
这样的设备包含:输入模块E,适合于接收在被称为低带的第一频带中 解码或提取的激励音频信号(u(n)或U(k))以及线性预测合成滤波器的参数。其包含:输出模块S,适合于将合成的高频信号(HF_syn)例如传 送给像图3的块310那样的应用延迟的模块或者像模块311那样的重采样模 块。
有利地,存储器块可以包括计算机程序,所述计算机程序包含代码指令, 所述代码指令在这些指令由处理器PROC执行时用于实现在本发明的意义 内的带扩展方法的步骤,特别是以下步骤:从在高于第一频带的至少一个第 二频带中过采样和扩展的激励信号获得在至少一个第二频带中的扩展信号; 根据帧和子帧的能量比,按照针对每个子帧定义的增益来缩放扩展信号;以 及通过线性预测滤波器对经缩放的扩展信号进行滤波,所述线性预测滤波器 的系数从低带滤波器的系数得出。
典型地,图4的描述再现这样的计算机程序的算法的步骤。计算机程序 也可以存储在存储器介质上,可以由设备的读取器读取或者可以被下载到其 存储器空间中。
一般地,存储器MEM存储实现该方法所需的所有数据。
在一个可能的实施例中,除了根据本发明的带扩展功能之外,如此描述 的设备还可以包含例如在图3中描述的低带解码功能和其他处理功能。

Claims (10)

1.一种用于在解码或改进处理中扩展音频信号的频带的方法,包含在被称为低带的第一频带中解码或提取线性预测滤波器的系数和激励信号的步骤,该方法的特征在于其包含以下步骤:
-从在高于第一频带的至少一个第二频带中过采样和扩展(E401)的所述激励信号UHB1(k)获得(E403)在所述至少一个第二频带中的扩展信号UHB2(k);
-根据每个子帧的能量和低带的激励信号的每个帧的能量的比率与每个子帧的能量和扩展信号的每个帧的能量的比率之间的比率,按照针对每个子帧定义的增益来缩放(E406)扩展信号;
-通过线性预测滤波器对经缩放的扩展信号进行滤波(E404),所述线性预测滤波器的系数从低带滤波器的系数得出。
2.如权利要求1所述的方法,其特征在于,其还包含以下步骤:根据当前帧的解码比特率来进行自适应带通滤波(E405)。
3.如权利要求1所述的方法,其特征在于,其包含以下步骤:对激励信号进行时频变换;获得然后在频域中执行的扩展信号;以及在缩放和滤波步骤之前对扩展信号进行逆时频变换。
4.如权利要求3所述的方法,其特征在于,根据下面的等式来执行生成经过过采样和扩展的激励信号的步骤:
其中,K是样本的索引,UHB1(k)是扩展的激励信号的频谱,U(k)是在变换步骤之后获得的激励信号的频谱,start_band是预定义的变量。
5.如权利要求1-4中的任一项所述的方法,其特征在于,其包含以下步骤:对至少在第二频带中的扩展信号进行去加重滤波。
6.如权利要求1所述的方法,其特征在于,其还包含以下步骤:至少在第二频带中生成(E402)噪声信号,扩展信号UHB2(k)通过组合(E403)扩展的激励信号和噪声信号来获得。
7.如权利要求6所述的方法,其特征在于,组合步骤通过与在扩展的激励信号和噪声信号之间的电平均衡增益的自适应加法混合来执行。
8.一种用于扩展音频信号频带的设备,包含在被称为低带的第一频带中解码或提取线性预测滤波器的系数和激励信号的级,该设备的特征在于其包含:
-用于从在高于第一频带的至少一个第二频带中过采样和扩展的所述激励信号UHB1(k)获得在所述至少一个第二频带中的扩展信号UHB2(k)的模块(503);
-用于根据每个子帧的能量和低带的激励信号的每个帧的能量的比率与每个子帧的能量和扩展信号的每个帧的能量的比率之间的比率,按照针对每个子帧定义的增益来缩放扩展信号的模块(507);
-用于通过线性预测滤波器对经缩放的扩展信号进行滤波的模块(510),所述线性预测滤波器的系数从低带滤波器的系数得出。
9.一种音频信号解码器,其特征在于,其包含如权利要求8所述的扩展音频信号频带的设备。
10.一种可由频带扩展设备读取的存储介质,其中存储包含用于执行如权利要求1-7中的任一项所述的扩展音频信号的频带的方法的步骤的代码指令的计算机程序。
CN201480036730.5A 2013-06-25 2014-06-24 音频信号解码器中的改进的频带扩展 Active CN105324814B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1356100 2013-06-25
FR1356100A FR3007563A1 (fr) 2013-06-25 2013-06-25 Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
PCT/FR2014/051563 WO2014207362A1 (fr) 2013-06-25 2014-06-24 Extension améliorée de bande de fréquence dans un décodeur de signaux audiofréquences

Publications (2)

Publication Number Publication Date
CN105324814A CN105324814A (zh) 2016-02-10
CN105324814B true CN105324814B (zh) 2019-06-04

Family

ID=49151174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480036730.5A Active CN105324814B (zh) 2013-06-25 2014-06-24 音频信号解码器中的改进的频带扩展

Country Status (6)

Country Link
US (1) US9911432B2 (zh)
EP (1) EP3014611B1 (zh)
CN (1) CN105324814B (zh)
ES (1) ES2724576T3 (zh)
FR (1) FR3007563A1 (zh)
WO (1) WO2014207362A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3045686C (en) 2010-04-09 2020-07-14 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10249307B2 (en) 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
CN107886966A (zh) * 2017-10-30 2018-04-06 捷开通讯(深圳)有限公司 终端及其优化语音命令的方法、存储装置
EP3553777B1 (en) * 2018-04-09 2022-07-20 Dolby Laboratories Licensing Corporation Low-complexity packet loss concealment for transcoded audio signals
CN110660409A (zh) * 2018-06-29 2020-01-07 华为技术有限公司 一种扩频的方法及装置
CN110556122B (zh) * 2019-09-18 2024-01-19 腾讯科技(深圳)有限公司 频带扩展方法、装置、电子设备及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1606687A (zh) * 2002-09-19 2005-04-13 松下电器产业株式会社 音频解码设备和方法
CN102934163A (zh) * 2010-06-01 2013-02-13 高通股份有限公司 用于宽带语音编码的***、方法、设备和计算机程序产品

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
ATE331280T1 (de) * 2001-11-23 2006-07-15 Koninkl Philips Electronics Nv Bandbreitenvergrösserung für audiosignale
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
CA2603246C (en) * 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
CA2780971A1 (en) * 2009-11-19 2011-05-26 Telefonaktiebolaget L M Ericsson (Publ) Improved excitation signal bandwidth extension
MX2013009295A (es) * 2011-02-15 2013-10-08 Voiceage Corp Dispositivo y método para cuantificar ganancias de contribuciones adaptativas y fijas de una excitación en un codec celp.
US20140019125A1 (en) * 2011-03-31 2014-01-16 Nokia Corporation Low band bandwidth extended
WO2013066238A2 (en) * 2011-11-02 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1606687A (zh) * 2002-09-19 2005-04-13 松下电器产业株式会社 音频解码设备和方法
CN102934163A (zh) * 2010-06-01 2013-02-13 高通股份有限公司 用于宽带语音编码的***、方法、设备和计算机程序产品

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Bandwidth Extension for Hierarchical Speech and Audio Coding in ITU-T Rec.G.729.1;Bernd Geiser et al.;《IEEE Transactions on Audio,Speech,and Language Processing》;20071130;第2496-2509页

Also Published As

Publication number Publication date
EP3014611B1 (fr) 2019-03-13
EP3014611A1 (fr) 2016-05-04
US20160133273A1 (en) 2016-05-12
WO2014207362A1 (fr) 2014-12-31
CN105324814A (zh) 2016-02-10
FR3007563A1 (fr) 2014-12-26
US9911432B2 (en) 2018-03-06
ES2724576T3 (es) 2019-09-12

Similar Documents

Publication Publication Date Title
CN105324814B (zh) 音频信号解码器中的改进的频带扩展
JP6515157B2 (ja) 音声周波数信号復号器における周波数帯域拡張のための最適化スケール因子の判定方法及び判定装置
US11312164B2 (en) Frequency band extension in an audio signal decoder
JP2016528539A5 (zh)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant