CN103503065A - 用于衰减低精确度重构的信号区域的方法和解码器 - Google Patents

用于衰减低精确度重构的信号区域的方法和解码器 Download PDF

Info

Publication number
CN103503065A
CN103503065A CN201180070142.XA CN201180070142A CN103503065A CN 103503065 A CN103503065 A CN 103503065A CN 201180070142 A CN201180070142 A CN 201180070142A CN 103503065 A CN103503065 A CN 103503065A
Authority
CN
China
Prior art keywords
decay
spectral regions
frequency spectrum
bandwidth
zone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201180070142.XA
Other languages
English (en)
Other versions
CN103503065B (zh
Inventor
塞巴斯蒂安·内斯隆德
艾力克·诺维尔
沃洛佳·格兰恰诺夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN103503065A publication Critical patent/CN103503065A/zh
Application granted granted Critical
Publication of CN103503065B publication Critical patent/CN103503065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种用于解码器的方法,以及用于确定要应用到音频信号的衰减的衰减控制器,包括:识别要衰减的频谱区域;随后将识别出的频谱区域归在一起以形成连续频谱区域;以及自适应于带宽来应用所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。

Description

用于衰减低精确度重构的信号区域的方法和解码器
技术领域
本发明的实施例涉及用于音频信号的解码器、编码器及其方法。音频信号可以包括各种条件下的语音、音乐以及混合的语音和音乐内容。具体来说,实施例涉及重构质量差的频谱区域的衰减。这可以例如应用于利用较少数目比特或未分配比特进行编码的区域。
背景技术
传统地,移动网络被设计为处理低比特率的语音信号。这已经通过使用对低比特率的语音信号示出良好性能但对音乐和混合内容具有较差性能的指定语音编解码器来实现。存在以下不断增长的需求:网络还应当处理针对如等待音乐和回铃音等这些信号。移动互联网应用还驱动了用于流应用的低比特率语音编码的需求。音频编解码器通常使用比语音编解码器高的比特率进行操作。当限制针对音频编解码器的比特预算时,信号的某些频谱区域可能利用较少数目的比特进行编码,因此不能保证重构信号的期望目标质量。频谱区域指代频域区域(例如,频率转换信号块的特定子带)。为了简洁起见,在整个说明书中,将使用“频谱区域”,其意思是“短时信号频谱的一部分”。
而且,在低比特率和中比特率情况下,将存在没分配比特的频谱区域。这种频谱区域在解码器处必须通过重用来自可获得的编码频谱区域的信息(例如,噪声填充或带宽扩展)来进行重构。在所有这些情况中,期望对低精度的重构区域的能量的某种衰减,以避免显著的信号失真。
以不足数目的比特或未分配比特进行编码的信号区域将以低精度重构,因此期望衰减这些频谱区域。这里,将不足的比特数定义为低至不能用感觉上合理的质量表示频谱区域的比特数。注意,此数目将取决于针对此区域的音频感知的敏感度,以及所考察的信号区域的复杂度。
然而,低精度的编码频谱区域的衰减不是小问题。一方面,期望强衰减来掩饰不想要的失真。另一方面,听众可以将这种衰减感知为重构信号的响度损失、频率特性的改变或信号动力的改变(例如,随时间进行的编码算法可以选择不同信号区域进行噪声填充)。处于这些原因,传统的音频编码***应用非常保守的(即,有限的)衰减,这实现不同类型的上述列出的失真之间的平均特定平衡。
发明内容
本发明的实施例通过将恒定衰减替换为自适应衰减方案来改善传统的衰减方案,所述自适应衰减方案允许更强衰减而不引入信号频率特性的可听得见的改变。
根据第一方面,提供了一种用于解码器的方法,所述方法确定要应用到音频信号的衰减。在所述方法中,识别要衰减的频谱区域;随后将识别出的频谱区域归在一起,以形成连续频谱区域;确定连续频谱区域的带宽;以及,自适应于带宽应用连续频谱区域的衰减,使得增大的带宽减小连续频谱区域的衰减。
根据第二方面,提供了一种解码器的衰减控制器,所述衰减控制器用于确定要应用到音频信号的衰减。所述衰减控制器包括:识别器单元,被配置为识别要衰减的频谱区域;归并单元,被配置为将后续识别出的频谱区域归在一起,以形成连续频谱区域;以及,确定单元,被配置为确定连续频谱区域的带宽。此外,提供了应用单元,其中,所述应用单元被配置为:自适应于带宽,应用所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。
根据第三方面,提供了一种移动终端。该移动终端包括具有衰减控制器的解码器。所述衰减控制器包括:识别器单元,被配置为识别要衰减的频谱区域;归并单元,被配置为将后续识别出的频谱区域归在一起,以形成连续频谱区域;以及,确定单元,被配置为确定所述连续频谱区域的带宽。此外,提供了应用单元,其中,所述应用单元被配置为:自适应于带宽,应用所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。
根据第四方面,提供了网络节点。网络节点包括具有衰减控制器的解码器。所述衰减控制器包括:识别器单元,被配置为识别要衰减的频谱区域;归并单元,被配置为将随后识别出的频谱区域归在一起,以形成连续频谱区域;以及,确定单元,被配置为确定所述连续频谱区域的带宽。此外,提供了应用单元,其中,所述应用单元被配置为:自适应于带宽,应用所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。
本发明实施例的优点是:与具有有限的恒定衰减的传统***相比,所提出的自适应衰减允许显著降低重构音频信号中的可听得见的噪声。
附图说明
图1示意性地示出了基于MDCT变换的编码器和解码器***的总览。
图2是根据本发明的实施例的方法的流程图。
图3a和3b示出了根据本发明的实施例的包含衰减控制的解码器的总览。
图4示出了实施例可以使用的衰减限制函数和当应用该衰减限制函数时所得的增益修改。
图5a示出了具有脉冲分配的16个子向量的示例,其中,根据本发明的实施例识别低精度区域并确定各个区域的带宽。
图5b示出了当根据本发明的实施例应用自适应衰减时的衰减影响。
图6a示意性地示出了包含子向量分析单元的编码器的总览,其中,根据本发明的实施例,解码器使用子向量分析单元的结果。
图6b示出了根据实施例的包含衰减控制的解码器的总览,该衰减控制基于来自与编码器分析相对应的比特流的参数来完成。
图7a和7b示意性地示出了根据本发明的实施例的衰减控制器。
图8示出了具有本发明实施例的衰减控制器的移动终端。
图9示出了具有本发明实施例的衰减控制器的网络节点。
具体实施方式
根据本发明实施例的解码器可以用在音频编解码器、音频解码器中,该音频编解码器、音频解码器可以用在端用户设备(例如,移动设备(例如,移动电话)或固定PC)中或者用在发生解码的网络节点中。本发明实施例的解决方案涉及自适应衰减,该自适应衰减允许更强衰减而不引入信号频率特性的可听得见的改变。这是在解码器中的衰减控制器中实现的,如图2的流程图所示。
图2的流程图示出了根据一个实施例的解码器中的方法。首先,识别要衰减的频谱区域201。此步骤可以涉及对重构的子向量的检查201a。随后,将识别出的频谱区域归在一起202,以形成连续频谱区域,并确定该连续频谱区域的带宽203。然后,应用该连续频谱区域的衰减,其中,该衰减是与带宽相适应,使得增大的带宽减小该连续频谱区域的衰减。
根据实施例的衰减控制器可实现在移动终端或网络节点中的音频解码器中。该音频解码器可以用在主要以语音为目标的实时通信场景中或用在主要以音乐为目标的流场景中。
在一个实施例中,实现衰减控制器的音频编解码器是例如使用基于脉冲的向量量化方案的转换域音频编解码器。在此示例性实施例中,使用阶乘脉冲编码(Factorial Pusle Coding,简称FPC)类型的量化器,但本领域技术人员理解,可以使用任意向量量化方案。图1示出了这种音频编解码器的示意性总览,并在下文中给出所涉及步骤的简短描述。
改进的离散余弦转换(MDCT)105将短音频段(20-40ms)(标记为输入音频100)转换到频域。
将MDCT105所获得的MDCT向量X(k)107分成多个频带(即,子向量)。注意,可以使用任意其他合适的频率转换(例如,DFT或DCT)来替代MDCT。
在包络计算器110中计算每个频带中的能量,这给出了频谱包络的近似。
包络量化器120对该频谱包络进行量化,并向比特流复用器发送量化索引以便存储或发送给解码器。
通过使用量化包络增益的倒数对MDCT向量进行缩放,来获得残余向量117,例如,每个频带中的残余被缩放为具有单位均方根(RMS)能量。
比特分配器130基于量化后的包络能量为量化器分配比特,该量化器执行对不同残余向量125的量化。由于有限的比特预算,子向量中的一些未接收到比特。
基于可获得的比特的数目,对残余子向量进行量化,并向解码器发送量化索引。利用阶乘脉冲编码(FPC)方案执行残余量化。复用器135将包络和子向量的量化索引复用到比特流140,比特流140可被存储或发送给解码器。
应当注意,不对未分配比特的残余子向量进行编码,而是在解码器处进行噪声填充。这可以通过从已编码子向量创建虚拟码本或任意其他噪声填充算法来实现。噪声填充创建在未编码子向量中的内容。
进一步参考图1,解码器在解复用器145处接收来自编码器的比特流140。包络解码器160重构已量化的包络增益。产生比特分配的比特分配器155使用已量化的包络增益,子向量解码器150使用该比特分配来产生解码出的残余子向量。解码出的残余子向量的序列形成归一化的频谱。由于有限比特预算,子向量中的一些将不被表示,并将在频谱中产生零或孔。这些频谱孔将通过噪声填充算法165来填充。噪声填充算法还可以包括BWE算法,BWE算法可以重构最后编码频带上的频谱。使用该比特分配,确定固定包络衰减175。使用所确定的衰减来修改量化的包络增益,并通过使用这些增益缩放解码出的残余子向量来重构MDCT频谱170。最后,逆MDCT185产生重构的音频帧190。
本发明的实施例涉及上文(上文列出中的先前步骤)所描述的包络衰减,其中,添加包络增益的附加加权,以控制以低精度量化的子向量(即,以较小数目编码的子向量或未编码的以噪声填充的子向量)的能量。以较少数目比特编码的子向量意味着比特数不足以实现期望精度。因此,将不足比特数定义为低至不能用感觉上合理的质量表示频谱区域的比特数。注意,此数目将取决于针对此区域的音频感知的敏感度以及所考察的信号区域的复杂度。
图3a中示出了具有根据实施例的算法的方案中的解码器的总览。图3a的解码器对应于图1的解码器添加根据本发明实施例的衰减控制器300。根据本发明实施例,衰减控制器300控制自适应衰减。
因此,衰减控制器被配置为:识别要衰减的频谱区域;将识别出的频谱区域归在一起,以形成连续频谱区域;确定连续频谱区域的带宽;以及,自适应于带宽来应用连续频谱区域的衰减,使得增大的带宽减小连续频谱区域的衰减。
根据实施例,要衰减的低精度频谱区域是利用较少数目的比特编码的或未分配比特进行编码。识别低精度频谱区域的步骤还可以包括对重键的子向量的分析。
在此参考图2,图2是根据本发明实施例的方法的流程图,第一步骤201是检查201a重构的子向量,以便识别以低精度表示的解码出的频域残余的频谱区域。根据一个实施例,当针对所述重构的子向量分配的比特数低于预定阈值时,该频谱区域可以说是以低精度表示的。
根据另一实施例,使用脉冲编码方案对频谱子向量进行编码,并且如果频谱区域由脉冲数P(b)低于预定阈值的一个或更多个连续子向量构成,则该频谱区域可以说是以低精度表示的。
因此,确定频谱子向量是否包括用于量化子向量的脉冲数P(b)满足等式1的一个或更多个连续子向量。
P(b)<Θ,b=1,2....Nb      (1)
其中Nb是子向量数,并且Θ是阈值,其具有优选值Θ=10。应当注意,脉冲数可以转换为比特数。此外,可以应用更详尽的方法来识别低精度区域,例如,通过使用比特率结合对合成形状向量的分析。图3b中示出了这种设置,其中,向包络衰减器输入合成形状向量。对合成成形的分析可以例如涉及测量合成形状的尖峰,因为较高速率的尖峰合成可以指示尖峰输入信号,并因此指示较好的输入/合成相干性。已解码子向量的估计精度可以用于识别作为低分辨率频带的对应频带,并决定合适的衰减。
在比特分配中接收到零比特并用噪声填充的子向量也可被包括在此范畴中。
返回图2,对于每个识别出的低精度频谱区域,将识别出的频谱区域归在一起202,并通过例如计算该归并成的区域中的子向量的数目来确定该归并成的频谱区域的带宽203。
为了获得最佳的可能音频质量,期望衰减频谱的低精度区域。根据实施例,衰减204取决于低精度频谱区域的带宽。因此,衰减应当随着带宽而减小。这意味着:较窄区域允许比较宽区域更大的衰减。
作为示例,可以按两个步骤获得衰减。首先,确定每个子向量b的初始衰减因子A(b)。对于噪声填充的子向量,基于连续噪声填充子向量的数目决定衰减因子。对于低精度的编码向量,可以使用精度函数来定义初始衰减。当识别出低精度区域之后,使用低精度区域的带宽来估计每个区域的衰减级别。调整衰减因子以形成A′(b),其考虑了低精度区域带宽。
图4中示出了取决于低精度区域的带宽b的示例衰减限制函数A(b)。可以使用等式2描述图4中还示出的所得增益修改A′(b)。
A′(b)=α(w)+(1-α(w))A(b)   (2)
其中,α(w)定义在等式3中
Figure BDA0000395983100000071
其中,w表示低精度区域的以子向量数表达的带宽,而C和T是控制调整函数α(w)的常数。在本示例中,可以发现合适值是C=6和T=5。
图5a示出了前16个子向量的示例以及用于量化每个子向量的脉冲数,连同算法所识别的低精度区域以及以子向量为单位表示的区域带宽。随后,将低精度区域归在一起,以形成连续频谱区域501;502;503,并确定该连续频谱区域的带宽。每个区域的带宽被用于确定要应用的衰减。图5b示出了算法对对应子向量能量的影响。可以看到,算法如何限制在带宽为7个子向量的区域512中的衰减,然而该算法允许在带宽分别为1个子向量和3个子向量的区域511和513中的目标衰减。因此,衰减随着低精度频谱区域的带宽增大而减小。因为对于较高频率,频带数目不是随着带宽的增大而均匀增大的,而且因为以频带数目定义带宽,所以该方案将具有隐性的频率依赖性。因为频带与感知的频率分辨率相对应,所以在整个频谱中,所感知的衰减应该是大致恒定的。然而,也可以考虑让此频率依赖性显性化。一个可能的实现是修改调整函数
Figure BDA0000395983100000081
其中f表示频谱的频率块(frequency bin),而β是调谐参数。β的一个可能值是L/4,其中L是MDCT频谱中系数数目。等式(4)将允许对较高频率进行更多衰减,这与在本实施例中已经获得的结果类似。还可以得到关于频率的相反关系,如下:
Figure BDA0000395983100000082
其中,γ表示另一调谐参数。在此情况下,对于较高频率,衰减将被限制。如果发现对于较高频率存在较小的衰减益处,则这可能是期望的。
在另一实施例中,如果由于量化器的特性,上述概念可以仅局限于噪声填充区域;具有较少数目分配比特的子带可被分开对待。
在备选实施例中,例如,如果编解码器操作在高比特率并且不存在噪声填充频带,则结合第一实施例描述的概念可以在无噪声填充频带的情况下操作。
在另一实施例中,重构的频谱还包括使用带宽扩展(BWE)算法进行重构的区域。可以结合BWE模块使用对低精度的重构信号区域的自适应衰减的概念。当今BWE算法在检测到与目标信号中的对应区域极大不同的重构频谱区域上应用特定衰减。还可以使得这种衰减根据上述概念来自适应调整。BWE算法可以是图3a中所公开的噪声填充单元310的主要部分。根据实施例修改的BWE算法可以是部分是时域编解码器或是变换域编解码器。
在另一实施例中,音频通信/压缩***的解码器可以实现根据实施例的自适应衰减算法,而不需要显式地考虑噪声填充的、频带扩展的或以较少数目比特进行量化的区域。取而代之的是,可以基于编码器侧的子向量分析,使用重构的子向量与输入子向量之间的距离量度,选择用于衰减的区域候选。还可以计算该重构与残余子向量的合成之间的距离度量。图6a示出了使用子向量分析单元执行这种分析的编码器的示意性总览。如果特定频率区域中的误差在特定阈值之上,则该区域是用于衰减的潜在候选。误差度量可以是:例如,合成频谱相对于输入频谱的最小均方误差、能量误差、或误差标准的组合。这种分析可以用于识别针对衰减的区域和/或决定针对所识别的区域的衰减。为了在解码器中再现区域识别和衰减,编码器侧分析需要要向比特流中添加的附加参数。在这种实施例中的解码器将经由通过比特流的编码参数接收编码器侧分析的结果,并将在衰减控制中包括该参数。在图6b中示出了这种解码器。
根据一个实施例,可以在例如图7a中所示用户设备的解码器中实现的衰减控制器包括:识别器单元703,被配置为识别要衰减的频谱区域;归并单元704,被配置为随后将识别出的频谱区域归在一起,以形成连续频谱区域;以及,确定单元705,被配置为确定连续频谱区域的带宽。此外,在衰减控制器300中提供了:应用单元706,被配置为自适应于带宽,应用连续频谱区域的衰减。以此方式,增大的带宽减小了对该连续频谱区域的衰减。
根据一个实施例,要衰减的频谱区域是利用较少数目的比特编码的或未分配比特进行编码的。此外,被配置为识别利用较少数目比特或未分配比特进行编码的频谱区域的识别器单元703还可以被配置为:检查重构的子向量,以识别以低精度表示的解码出的频域残余的频谱区域。
当针对所述重构的子向量分配的比特数低于预定阈值时,该频谱区域可以说是以低精度表示的。
备选地,使用脉冲编码方案对频谱子向量进行编码,并且如果频谱区域由脉冲数P(b)低于预定阈值的一个或更多个连续子向量构成,则该频谱区域可以说是以低精度表示的。
根据其他实施例,识别未分配比特进行编码的频谱区域,和/或识别利用较少数目的比特进行编码的频谱区域。
重构的频谱还可以包括使用带宽扩展算法进行重构的区域。
根据又一实施例,衰减控制器300包括:输入/输出单元710,被配置为接收来自编码器的分析,并且,其中,识别器单元703还被配置为:基于所接收的分析,识别要衰减的频谱区域。在所接收的分析中,在重构的合成信号与输入目标信号之间的距离度量被编码器使用。如果特定频率区域中的距离度量在特定阈值之上,则该频谱区域是针对衰减的潜在候选。
应当注意,可以由处理器700实现解码器的衰减控制器300的单元,处理器700被配置为:处理提供图7b所示的单元的功能的软件部分。该软件部分存储在存储器701中,并且当处理该软件部分时,从存储器检索该软件部分。衰减控制器。输入/输出单元710被配置为:从例如比特分配和包络解码接收输入参数,并向包络成形发送信息。
根据本发明的另一方面,提供了根据实施例的在解码器中包括衰减控制器300的移动设备800,如图8所示。应当注意,还可以在如图9所示的网络节点的解码器中实现实施例的衰减控制器300。

Claims (20)

1.一种用于解码器的方法,所述方法用于确定要应用到音频信号的衰减,所述方法包括:
-识别(201)要衰减的频谱区域,
-将后续识别出的频谱区域归在一起(202),以形成连续频谱区域,
-确定(203)所述连续频谱区域的带宽,以及
-自适应于所述带宽,应用(204)所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。
2.根据权利要求1所述的方法,其中,所述要衰减的频谱区域是利用较少数目比特进行编码的或未分配比特进行编码的。
3.根据权利要求2所述的方法,其中,所述识别(201)要衰减的频谱区域的步骤包括检查(201a)重构的子向量。
4.根据权利要求3所述的方法,其中,当向所述重构的子向量分配的比特数低于预定阈值时,称频谱区域是以低精度表示的。
5.根据权利要求3所述的方法,其中,使用脉冲编码方案对所述频谱子向量进行编码,并且如果频谱区域由脉冲数P(b)低于预定阈值的一个或更多个连续子向量构成,则称频谱区域是以低精度表示的。
6.根据权利要求1至5中任意一项所述的方法,其中,识别未分配比特进行编码的频谱区域。
7.根据权利要求1至5中任意一项所述的方法,其中,识别利用较少数目的比特进行编码的频谱区域。
8.根据权利要求1至7中任意一项所述的方法,其中,所述重构的频谱还包括使用带宽扩展算法进行重构的区域。
9.根据权利要求1或8所述的方法,其中,基于从编码器接收的分析,识别要衰减的频谱区域,所述编码器使用在重构的合成信号与输入目标信号之间的距离度量,如果特定频率区域中的距离度量在特定阈值之上,则所述频谱区域是针对衰减的潜在候选。
10.一种解码器的衰减控制器(300),所述衰减控制器用于确定要应用到音频信号的衰减,所述衰减控制器(300)包括:识别器单元(703),被配置为识别要衰减的频谱区域;归并单元(704),被配置为将后续识别出的频谱区域归在一起,以形成连续频谱区域;确定单元(705),被配置为确定所述连续频谱区域的带宽;以及,应用单元(706),被配置为自适应于所述带宽来应用所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。
11.根据权利要求10所述的衰减控制器(300),其中,所述要衰减的频谱区域是利用较少数目比特进行编码的或未分配比特进行编码的。
12.根据权利要求11所述的衰减控制器(300),其中,被配置为识别要衰减的频谱区域的所述识别器单元(703)还被配置为:检查重构的子向量。
13.根据权利要求12所述的衰减控制器(300),其中,当向所述重构的子向量分配的比特数低于预定阈值时,称频谱区域是以低精度表示的。
14.根据权利要求12所述的衰减控制器(300),其中,使用脉冲编码方案对所述频谱子向量进行编码,并且如果频谱区域由脉冲数P(b)低于预定阈值的一个或更多个连续子向量构成,则称频谱区域是以低精度表示的。
15.根据权利要求10至14中任意一项所述的衰减控制器(300),其中,识别未分配比特进行编码的频谱区域。
16.根据权利要求10至14中任意一项所述的衰减控制器(300),其中,识别利用较少数目的比特进行编码的频谱区域。
17.根据权利要求10至16中任意一项所述的衰减控制器(300),所述重构的频谱还包括使用带宽扩展算法进行重构的区域。
18.根据权利要求10或17所述的衰减控制器(300),其中,所述衰减控制器(300)包括输入单元(710),输入单元(710)被配置为从编码器接收分析,并且,所述识别器单元(703)还被配置为:基于所接收的分析,识别要衰减的频谱区域,所述编码器使用在重构的合成信号与输入目标信号之间的距离量度,如果特定频率区域中的距离量度在特定阈值之上,则所述频谱区域是针对衰减的潜在候选。
19.一种移动终端,所述移动终端包括解码器的衰减控制器(300),所述衰减控制器用于确定要应用到音频信号的衰减,其中,所述衰减控制器(300)包括:识别器单元(703),被配置为识别要衰减的频谱区域;归并单元(704),被配置为将后续识别出的频谱区域归在一起,以形成连续频谱区域;确定单元(705),被配置为确定所述连续频谱区域的带宽;以及,应用单元(706),被配置为自适应于所述带宽来应用所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。
20.一种网络节点,所述网络节点包括解码器的衰减控制器(300),所述衰减控制器用于确定要应用到音频信号的衰减,其中,所述衰减控制器(300)包括:识别器单元(703),被配置为识别要衰减的频谱区域;归并单元(704),被配置为将后续识别出的频谱区域归在一起,以形成连续频谱区域;确定单元(705),被配置为确定所述连续频谱区域的带宽;以及,应用单元(706),被配置为自适应于所述带宽来应用所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。
CN201180070142.XA 2011-04-15 2011-12-15 用于衰减低精确度重构的信号区域的方法和解码器 Active CN103503065B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161475711P 2011-04-15 2011-04-15
US61/475,711 2011-04-15
PCT/EP2011/072963 WO2012139668A1 (en) 2011-04-15 2011-12-15 Method and a decoder for attenuation of signal regions reconstructed with low accuracy

Publications (2)

Publication Number Publication Date
CN103503065A true CN103503065A (zh) 2014-01-08
CN103503065B CN103503065B (zh) 2015-08-05

Family

ID=45406733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180070142.XA Active CN103503065B (zh) 2011-04-15 2011-12-15 用于衰减低精确度重构的信号区域的方法和解码器

Country Status (7)

Country Link
US (4) US8706509B2 (zh)
EP (3) EP2697796B1 (zh)
KR (1) KR101520212B1 (zh)
CN (1) CN103503065B (zh)
DK (1) DK3067888T3 (zh)
ES (2) ES2540051T3 (zh)
WO (1) WO2012139668A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160838A (zh) * 2014-07-28 2021-07-23 弗劳恩霍夫应用研究促进协会 用于使用独立噪声填充生成增强信号的装置和方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY197538A (en) 2012-03-29 2023-06-22 Ericsson Telefon Ab L M Bandwidth extension of harmonic audio signal
BR112015031606B1 (pt) 2013-06-21 2021-12-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1157374A2 (en) * 1999-01-27 2001-11-28 Liljeryd, lars, Gustaf Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting
CN100369109C (zh) * 2002-06-17 2008-02-13 杜比实验室特许公司 使用频谱孔填充的音频编码***
WO2009029036A1 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4617676A (en) * 1984-09-04 1986-10-14 At&T Bell Laboratories Predictive communication system filtering arrangement
KR940001817B1 (ko) * 1991-06-14 1994-03-09 삼성전자 주식회사 노이즈 감소회로에 사용되는 액티브 필터용 고역 가중치 회로
JPH08223049A (ja) * 1995-02-14 1996-08-30 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
JPH08328599A (ja) * 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US7787632B2 (en) * 2003-03-04 2010-08-31 Nokia Corporation Support of a multichannel audio extension
ES2391228T3 (es) * 2007-02-26 2012-11-22 Dolby Laboratories Licensing Corporation Realce de voz en audio de entretenimiento
US8326617B2 (en) * 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1157374A2 (en) * 1999-01-27 2001-11-28 Liljeryd, lars, Gustaf Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting
CN100369109C (zh) * 2002-06-17 2008-02-13 杜比实验室特许公司 使用频谱孔填充的音频编码***
WO2009029036A1 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling
CN101809657A (zh) * 2007-08-27 2010-08-18 爱立信电话股份有限公司 用于噪声填充的方法和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160838A (zh) * 2014-07-28 2021-07-23 弗劳恩霍夫应用研究促进协会 用于使用独立噪声填充生成增强信号的装置和方法
CN113160838B (zh) * 2014-07-28 2024-05-10 弗劳恩霍夫应用研究促进协会 用于使用独立噪声填充生成增强信号的装置和方法

Also Published As

Publication number Publication date
US20120278085A1 (en) 2012-11-01
US9349379B2 (en) 2016-05-24
WO2012139668A1 (en) 2012-10-18
US9691398B2 (en) 2017-06-27
KR20140035900A (ko) 2014-03-24
US9595268B2 (en) 2017-03-14
EP3067888B1 (en) 2017-05-31
US20160240201A1 (en) 2016-08-18
EP2816556B1 (en) 2016-05-04
EP2816556A1 (en) 2014-12-24
KR101520212B1 (ko) 2015-05-13
ES2540051T3 (es) 2015-07-08
US20140081646A1 (en) 2014-03-20
EP2697796B1 (en) 2015-05-06
ES2637031T3 (es) 2017-10-10
US8706509B2 (en) 2014-04-22
DK3067888T3 (en) 2017-07-10
EP2697796A1 (en) 2014-02-19
EP3067888A1 (en) 2016-09-14
CN103503065B (zh) 2015-08-05
US20170061977A1 (en) 2017-03-02

Similar Documents

Publication Publication Date Title
KR101343267B1 (ko) 주파수 세그먼트화를 이용한 오디오 코딩 및 디코딩을 위한 방법 및 장치
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
JP6779966B2 (ja) 先進量子化器
KR20080025404A (ko) 디지털 미디어 스펙트럼 데이터의 효율적인 코딩을 위해사용되는 사전 내의 코드워드의 수정
EP3014609B1 (en) Bitstream syntax for spatial voice coding
RU2505921C2 (ru) Способ и устройство кодирования и декодирования аудиосигналов (варианты)
KR102492119B1 (ko) 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품
KR102452637B1 (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
KR20230066137A (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
KR102386738B1 (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
US10657976B2 (en) Signal encoding method and apparatus, and signal decoding method and apparatus
US9691398B2 (en) Method and a decoder for attenuation of signal regions reconstructed with low accuracy
US8924203B2 (en) Apparatus and method for coding signal in a communication system
CN109427338B (zh) 立体声信号的编码方法和编码装置
CN109427337B (zh) 立体声信号编码时重建信号的方法和装置
KR20130047630A (ko) 통신 시스템에서 신호 부호화 장치 및 방법
Nagisetty et al. Super-wideband fine spectrum quantization for low-rate high-quality MDCT coding mode of the 3GPP EVS codec

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant