CN112133315B - 确定用于编码lpd/fd过渡帧的预算 - Google Patents

确定用于编码lpd/fd过渡帧的预算 Download PDF

Info

Publication number
CN112133315B
CN112133315B CN202010879909.4A CN202010879909A CN112133315B CN 112133315 B CN112133315 B CN 112133315B CN 202010879909 A CN202010879909 A CN 202010879909A CN 112133315 B CN112133315 B CN 112133315B
Authority
CN
China
Prior art keywords
frame
transition
encoding
bits
predictive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010879909.4A
Other languages
English (en)
Other versions
CN112133315A (zh
Inventor
斯泰凡·雷高特
朱利恩·福雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Priority to CN202010879909.4A priority Critical patent/CN112133315B/zh
Publication of CN112133315A publication Critical patent/CN112133315A/zh
Application granted granted Critical
Publication of CN112133315B publication Critical patent/CN112133315B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种为编码过渡帧而确定比特分配的方法,所述方法通过对数字信号进行编/解码的编码器/解码器来执行,过渡帧以预测编码的前一帧为先导,编码过渡帧包括变换编码和预测编码过渡帧的单子帧,所述方法包括下列步骤:分配(402;405)比特率,以便预测编码过渡子帧进行,所述比特率等于在变换编码过渡帧的比特率与第一个预定比特率值之间的最小值;根据所述比特率确定(404;408)预测编码过渡子帧所分配的第一个比特数;以及,通过第一个比特数与编码过渡帧可用的比特数来计算(410)为变换编码过渡帧所分配的第二个比特数。

Description

确定用于编码LPD/FD过渡帧的预算
技术领域
本发明涉及到数字信号编/解码领域。
背景技术
本发明十分有利于适用于包含语音和音乐在内即语音和音乐混合在一起或相互交替的声音的编码和/解码。
为了能有效地以较低码率来编码语音,推荐使用CELP类技术(“代码激励线性预测”)。为了能有效地编码音乐,则反而推荐变换编码技术。
CELP类编码器是预测编码器。其目的是通过各个元素来模仿语音生成:通过短期线性预测来模仿声道,通过长期预测来模仿浊音期间的声带振动,并且通过来自固定字典(白噪声,代数预期值)的激励来表示难以模仿的“创新”。
比如MPEG AAC、AAC-LD、AAC-ELD或ITU-TG.722.1附件C这样的变换编码器采用临界采样变换,从而以变换域来压缩信号。“临界采样变换”是指变换域系数的数量等于各个分析帧中时间样本的数量的变换。
对含有混合语音/音乐内容的信号进行有效编码的一个解决方案是随着时间演变而在至少两个编码模式之间所选择的最佳技术,其中之一是CELP类的,另一是变换类的。
例如,适用于3GPPAMR-WB+和MPEG USAC编解码器(用于“统一语音音频编码”)就是这种情况。通过AMR-WB+和USAC瞄准的应用不是会话式的,而是与存储和传播服务相对应的,对于算法延迟就没有较强的限制。
在2009年5月7-10日的第126届美国电化学协会大会上,M. Neuendorf等人发表的文章《低速率统一语音和音频编码的新方案——MPEG RM0》描述了USAC编解码器的初始版本,称之为RM0(参考模型0)。该RM0编解码器可交替应用于多种编码模式:
• 对于语音类信号:LPD模式(即“线性预测域”)包括来源于AMR-WB+编码的两种不同模式:
ACELP模式,
TCX(变换编码激励)模式,称之为WLPT(即“加权线性预测变换”),可利用MDCT类变换(不同于利用FFT(“快速傅里叶变换”)的AMR-WB+编解码器)。
• 对于音乐类信号:FD模式(即“频域”),适用于1024个样本的MPEG AAC类(即“高级音频编码”)的MDCT变换编码(是指“改进离散余弦变换”)。
在USAC编解码器中,在LPD与FD模式之间的过渡是至关重要的,以便能确保在没有切换缺陷的条件下获得足够高的品质,众所周知,各种模式(ACELP、TCX、FD)都有各自特殊的“标志”(就伪像而言)且FD和LPD模式属性不同——FD模式基于信号域的变换编码而LPD模式则利用感知加权域的预测线性编码并通过滤波存储器进行准确的管理。在2009年5月7-10日的第126届美国电化学协会大会上,在J. Lecomte等人发表的文章《基于LPC的音频编码与基于非LPC的音频编码之间过渡的高效交错淡出淡入窗口》中详细说明了USAC RM0编解码器中的模间切换管理。如该文所述,主要困难是从LPD模式过渡到FD模式,反之亦然。在此只考虑从CELP过渡到FD的情况。
为了充分理解其运作原理,通过典型的开发实例来回忆MDCT变换编码的原理。
在编码器一端,MDCT变换通常分为三个步骤,在MDCT编码之前,将信号分成M个样本的帧:
• 通过长度为2M、在此称之为“MDCT窗口”的窗口对信号进行加权;
• 进行时域混叠,以构成长度为M的数据块;
• 进行长度为M的DCT变换(即“离散余弦变换”)。
把DCT窗口分为四个相邻部分,其长度相等为M/2,在此称之为“四等分”。
信号与分析窗口相乘并随后进行混叠:第一个(窗口化的)四等分混叠(即时间颠倒并混叠)在第二等分上,第四等分混叠在第三等分上。
更准确地说,按照以下方式进行一等分在另一等分上的时域混叠:把第一等分的第一个样本加到第二等分的最后一个样本上(或者从第二等分的最后一个样本减去第一等分的第一个样本),把第一等分的第二个样本加到第二等分的倒数第二个样本上(或者从第二等分的倒数第二个样本减去第一等分的第二个样本),以此类推,直到把第一等分的最后一个样本加到第二等分的第一个样本上(或者从第二等分的第一个样本减去第一等分的最后一个样本)。
因此,通过四等分,我们得到混叠的2等分,其中每个样本都是信号待编码的两个信号样本的线性组合的结果。该线性组合引起时域混叠。
然后,在DCT变换(IV类)之后,共同编码混叠的两等分。关于下一帧,通过半个窗口进行转换(即50%混叠),把前一帧的第三等分和第四等分变为当前帧的第一等分和第二等分。在混叠之后,像前一帧一样,发送相同对的样本的第二个线性组合,但其加权是不同的。
在解码器一端,在DCT变换之后,因此得到这些混叠信号的解码版本。两个连续帧包含相同等分的两次不同混叠的结果,即意味着,对于每对样本而言,可获得两个线性组合的结果且其具有不同的和已知的加权:因此解出方程组就能得到输入信号的解码版本,于是可以通过使用两个连续解码帧来消除时域混叠。
解上述方程组一般可通过打开、乘以合理选择的合成窗口并随后相加并重叠两个连续解码帧之间的共有部分(没有因为量化误差导致的间断)来得到其解,实际上,这些运算类似于重叠相加。当第一等分或第四等分的窗口对于每个样本而言都在零点时,即意味着MDCT变换在该窗口这部分中没有时域混叠。在这种情况下,MDCT变换难以提供平稳过渡,则必须由其它方式来提供,例如外部重叠相加。
应该注意的是,尤其是涉及DCT变换的定义,MDCT变换可有一些变体实施方案,包括混叠待变换块的方式(例如,可以颠倒应用到左侧和右侧的混叠等分的标志,或者把第二等分和第三等分分别混叠到第一等分和第四等分上)等等。这些变体实施方案不会改变通过窗口化、时域混叠、然后通过变换、最后通过窗口化、混叠和重叠相加来减少样本块的MDCT分析合成的原理。
在Lecomte等人发表文章所述的USAC RM0编码器的情况下,通过ACELP编码所编码的帧与通过FD编码所编码的帧之间的过渡是通过以下方式进行的:
通过重叠到128个样本的左侧来利用FD模式的过渡窗口。
该重叠区域的时域混叠可通过把人工时域混叠引向重构ACELP帧的右侧来取消。用于过渡的MDCT窗口的大小为2304个样本,DCT变换运算只对1152个样本起作用,然而,FD模式帧的编码通常采用大小为2048个样本的窗口,而DCT变换则采用1024个样本的窗口。因此,正常FD模式的MDCT变换不能直接用于过渡窗口,编码器也必须集成该变换完整的改进版本,这就使得针对FD模式实施过渡变得复杂。
该源于现有技术的编码技术会有约为100毫秒至200毫秒的算法延迟。如此延迟难以满足会话用途,就会话用途而言,对于移动应用(例如,GSM EFR、3GPPAMR和AMR-WB)的语音编码器而言,编码延迟通常约为20毫秒至25毫秒,对于电话会议(例如,UIT-TG.722.1附件C和G.719)的会话变换编码器而言,约为40毫秒。此外,DCT变换尺寸(2304对2048)的偶尔增加会导致过渡时刻的复杂性尖峰。
为了克服这些缺点,据此通过引用并入本申请书的国际专利申请书WO2012/085451所提出的一种编码过渡帧的新方法。过渡帧定义为通过预测编码所编码的前一帧之后的变换编码当前帧。根据上述新方法,一部分过渡帧,例如,在以12.8kHz进行CELP编码情况下的5毫秒子帧和在以16kHz进行CELP编码情况下的4毫秒的两个附加CELP帧,可通过预测编码来编码,且受限于相对于前一帧的预测编码。
受限的预测编码包括利用通过预测编码所编码的前一帧的稳定参数,例如线性预测滤波的系数,以及仅仅只针对过渡帧中的附加子帧编码的几个最低参数。
因为前一帧未通过变换编码进行编码,所以要删除在帧的第一部分中的时域混叠是不可能的。上文提及的专利申请书WO2012/085451进一步提出矫正第一半MDCT窗口,使得正常混叠的第一等分中没有时域混叠。还提出通过改变分析/合成窗口的系数来整合在解码CELP帧与解码MDCT帧之间重叠相加的部分。参阅上述专利申请书所示的图4e,点划线(点和破折号交替的线)与MDCT编码的混叠线(上图)相对应以及与MDCT解码的混叠线(下图)相对应。在上图中,粗线分隔开在编码器输入端的新样本的帧。当被确定为新输入样本的帧完全有效时,便可以开始新MDCT帧的编码。需要注意的是,在编码器中的这些粗线并非与当前帧相对应,而是与每一帧到达的新样本的两个连续块相对应:当前帧实际上延迟8.75毫秒,它与预期相对应,被称之为“前瞻量”。在下图中,粗线在解码器输出端分割开解码帧。
在编码器一端,过渡窗口为零直到混叠点。因此,混叠窗口左侧部分的系数与非混叠窗口的相同。在混叠点与该过渡(TR)CELP子帧末端之间的部分与正弦半窗口相对应。在解码器一端,在展开之后,将相同的窗口应用于信号。在混叠点与MDCT帧始端之间的段上,窗口的系数与sin2窗口相对应。为了确保编码CELP子帧与来自MDCT的信号之间的重叠相加,只需要把cos2类的窗口应用于CELP子帧的重叠部分,并将后者与MDCT帧相加。该方法提供了完全重构。
但是,专利申请书WO2012/085451提出分配比特预算Btrans,以便对CELP子帧进行编码,这相当于对典型帧进行CELP编码所需的预算,使之降到单子帧。然而,变换编码过渡帧的剩余预算并不充分且有可能导致低码率时的质量下降。
发明内容
本发明旨在改进这种现状。
为此目的,本发明第一方面涉及一种适用于编码过渡帧而确定比特分配的方法。该方法可实施应用于在对数字信号进行编/解码的编码器/解码器。过渡帧以预测编码的前一帧为先导,编码该过渡帧包括对过渡帧的单子帧进行变换编码和预测编码。该方法进一步包括下列步骤:
分配比特率,以便对过渡子帧进行预测编码,比特率等于在对过渡帧进行变换编码的比特率与第一个预定比特率值之间的最小值;
根据比特率确定对过渡子帧进行预测编码而分配的第一个比特数;以及,
通过第一个比特数与编码过渡帧可用的比特数来计算变换编码过渡帧而分配的第二个比特数。
于是,通过最大值来抑制预测编码的比特率。为了预测编码而分配的比特数取决于该比特率。因为比特率越低,为了编码而分配的比特数就越小,从而保证了对过渡帧进行变换编码的最低剩余预算。
此外,相对于变换编码比特率优化为了对子帧进行预测编码而分配的比特数。实际上,如果对过渡帧进行变换编码的比特率低于第一个预定值,则预测编码的比特率与变换编码的比特率就相同。由此产生的信号相干性也因此得到提高,从而进一步简化了编码(信道编码)和处理解码器接收帧的后续步骤。
在另一个实施例中,编码器/解码器包括以第一频率对信号帧进行预测编码/解码的第一项核心工作以及以第二频率对信号帧进行预测编码/解码的第二项核心工作。第一个预定比特率值取决于选自对预测编码前一帧进行编码/解码的第一个核心和第二个核心中的核心。
编码器/解码器核心的工作频率直接影响着准确表示输入数字信号所需的比特数。例如,对于某些工作频率而言,必须对不被核心直接处理的编码频带设置附加位。
在一个实施例中,选择第一个核心对预测编码的前一个核心进行编码/解码时,所分配的比特率也等于在变换编码过渡帧的比特率与第二个预定比特率值之间的最大值,其中第二个值小于第一个值。因此,保证了最低比特率,从而防止在不同编码帧之间出现过大的比特率的差异。
在另一个实施例中,将数字信号至少分解为一个频率低波段与一个频率高波段。在这种情况下,分配第一个计算的比特数,以便对频率低波段的过渡帧进行预测编码。因此,分配第三个预定比特数,以便对频率高波段的过渡子帧进行编码。而且,随后通过第三个预定比特数来进一步确定为了对过渡帧进行转换编码而分配的第二个比特数。因此,就有可能有效地对输入信号的整个频谱进行编码,而不会牺牲解码时所恢复信号的质量。
在一个实施例中,可用于编码过渡帧的比特数是固定的。这就降低了编码步骤的复杂性。
在另一个实施例中,第二个比特数等于编码过渡帧的固定比特数减去第一个比特数减去第三个比特数。于是,最终决定过渡帧中的比特分配仅限于减去全部值,由此简化了编码。
作为选择,第二个比特数等于编码过渡帧的固定比特数减去第一个比特数减去第三个比特数减去第一位减去第二位。第一位表示在确定过渡子帧的预测编码参数的过程中是否进行低通滤波,参数与色调前置时间有关。第二位表示对过渡子帧进行预测编码/解码的编码器/解码器核心所采用的频率。如此表示使编码更灵活。
本发明的第二方面涉及一种通过编码器对数字信号进行编码的方法,所述编码器能够按照预测编码或者按照变换编对信号帧进行编码,并包括下列步骤:
按照预测编码对数字信号样本前一帧进行编码;
以过渡帧对数字信号样本的当前帧进行编码,编码过渡帧包括对过渡帧的单子帧进行变换编码和预测编码,对当前帧进行编码包括下列子步骤:
- 根据本发明第一方面的方法来确定比特分配;
- 基于第二个分配比特数对过渡帧进行变换编码;
- 基于第一个分配比特数对过渡子帧进行预测编码。
因此,在编码之前要确定在过渡帧中所包含的比特分配。如下文所述,可通过解码器再现比特分配的确定,由此避免关于该分配信息的清晰传递。
此外,如此编码确保了该过渡帧在预测编码和变换编码之间的平衡分配。
在一个实施例中,预测编码包括生成关于在过渡帧进行比特分配过程为分配的比特率所确定的预测编码参数。利用这种预测参数就能够优化在为预测编码分配的比特率与为变换编码分配的剩余率之间的比率,并因此优化重构信号的质量。实际上,在恒定的质量要求下,归于该预测参数或另外参数的比特数可按照为预测编码所分配的比特率作非线性的比例变化。
在另一个实施例中,预测编码包括通过重新利用前一帧的至少一个预测编码参数来生成受限于前一帧预测编码的预测编码参数。因此,在解码时,从前一帧提取附加信息,以完成待解码的过渡子帧的解码。这就减少了为了预测编码过渡子帧而必须保留的比特数。
将重新利用来自前一帧的参数与为了变换编码过渡帧而分配比特率相结合就能够确保以低成本进行连贯过渡。
本发明的第三方面涉及一种解码通过预测编码和变换编码所编码的数字信号的方法,所述方法包括下列步骤:
预测编码按照预测编码所编码的数字信号样本前一帧;
解码对数字信号样本当前帧进行编码的过渡帧,编码过渡帧包括对过渡帧单子帧进行变换编码和预测编码,包括下列子步骤:
根据本发明第一方面的方法来确定比特分配;
基于第一个分配比特数预测编码过渡子帧;
基于第二个分配比特数变换编码过渡帧。
如上所述,可通过解码器直接重现确定过渡帧的比特分配的方法。实际上,比特分配只是通过过渡的变换编码部分的比特率来确定的。因此,不需要附加位来执行确定比特分配的步骤,因此节省了带宽。
本发明的第四方面进一步针对一种计算机程序,所述计算机程序包括适用于在通过处理器执行指令时可实施根据本发明上述方面的方法的这些指令。
本发明的第五方面涉及一种适用于确定编码过渡帧的比特分配的装置,该装置由对数字信号进行编码/解码的编码器/解码器来实现,过渡帧以预测编码的前一帧为先导,编码过渡帧包括对过渡帧的单子帧进行变换编码和预测编码,编码过渡帧的比特数是固定的,所述装置包括执行下列操作的处理器:
分配适合预测编码过渡子帧的比特数,所述比特率等于在变换编码过渡帧的比特率与第一个预定比特率值之间的最小值;
根据比特率来确定预测编码过渡子帧所分配的第一个分配比特数;
由对编码参数进行编码所需的第一个比特数与编码过渡帧的固定比特数来计算变换编码过渡帧所分配的第二个比特数。
本发明的第六方面进一步针对一种能够按照预测编码或者按照变换编码来编码数字信号的帧的编码器,包括:
根据本发明第五方面的装置;
预测编码器,包括处理器且设置成便于进行以下操作:
按照预测编码来编码数字信号样本的前一帧;
预测编码单子帧,其包含于编码数字信号样本当前帧的过渡帧,编码过渡帧包括变换编码和预测编码子帧,将处理器设置成便于根据第一个分配比特数来实施预测编码过渡子帧的操作;
变换编码器,包括处理器且设置成便于根据第二个分配比特数变换编码过渡帧。
本发明的第七方面进一步针对一种适用于解码通过预测编码和变换编码所编码数字信号的解码器,包括:
根据本发明第五方面的装置;
预测解码器,包括处理器且设置成便于进行以下操作:
预测解码按照预测编码所编码的数字信号样本的前一帧;
预测解码单子帧,其包含于编码数字信号样本当前帧的过渡帧,编码过渡帧包括变换编码和预测编码子帧,将处理器设置成便于根据第一个分配比特数来实施预测解码过渡子帧的操作;
变换解码器,包括处理器且设置成便于根据第二个分配比特数变换解码过渡帧进行。
附图说明
本发明的其它特征和优点将通过仔细阅读下文的详细说明以及参考附图而更加清晰,在附图中:
图1阐释了一种根据本发明一个实施例的音频编码器;
图2是一阐释了根据本发明一个实施例由图1所示的音频编码器执行编码方法的步骤的图表;
图3显示了根据本发明一个实施例在CELP帧与MDCT帧之间的过渡;
图4是一阐释了根据本发明一个实施例确定编码过渡帧的比特分配的方法的步骤的图表;
图5阐释了一种根据本发明一个实施例的音频解码器;
图6是一阐释了根据本发明一个实施例由图5所示的音频解码器执行解码方法的步骤的图表;
图7阐释了根据本发明一个实施例适用于确定过渡帧中比特分配的装置。
具体实施方式
图1阐释了一种根据本发明一个实施例的音频编码器100。
图2是一阐释了根据本发明一个实施例的由图1的音频编码器100执行编码方法的步骤的图表。
编码器100包括接收单元101,用于在步骤201以指定频率fs(例如,8、16、32或48kHz)接收输入信号样本且分解为例如20毫秒的子帧。
一旦开始接收当前帧,预处理单元102就能够在步骤202从在至少一个LPD模式与一个FD模式之间选择出最适合编码当前帧的编码模式。在以下说明中,出于阐释性目的,可以考虑将MDCT编码用于FD模式和将CELP编码用于LPD模式。对于LPD模式和FD模式分别所采用的编码技术没有任何限制。因此,可以采用除CELP模式和MDCT模式之外的其它模式,例如,CELP编码可由其它类型的预测编码来代替,MDCT变换可由其它类型的变换来代替。
本文假设通过块206可明确传输帧的类型,例如,所述块具有固定的编码长度,则表示其模式可选自预定义列表。在本发明的变体中,这类适合于各个帧所选择的模式所进行如此编码的长度是可变的。还提供一位来清晰地传输CELP编码类型(12.8kHz或16kHz),从而更加方便于解码过渡帧。
步骤203核实在步骤202中已经选择的CELP解码。在选择LPD模式的情况下,将信号帧传递至CELP编码器103,以便在步骤204对CELP帧进行编码。CELP编码器还可以采用两个“核心”且分别以例如固定于12.8kHz和16kHz的两个内部采样频率工作,这就需要以内部频率12.8kHz或16kHz来采样入口信号(以频率fs)。这种重新采样可以通过预处理块102或CELP编码器103中的重新采样单元来实施。然后,由CELP编码器103通常通过根据信号分类所推算出的CELP参数对帧进行预测编码。CELP参数通常包括LPC系数、固定的和自适应的增益向量、自适应的字典向量、固定的字典向量。该列表还可以根据帧中的信号类别来修改,比如在UIT-TG.718编码中。于是,可以将计算得到的参数进行量化、多路复用并在步骤206中通过传输单元108将其传递至解码器。在当前帧的随后的帧是MDCT过渡帧的情况下,CELP编码参数(例如,LPC系数、固定的和自适应的增益向量、自适应的字典向量、固定的字典向量)和CELP解码器状态可在步骤205中进一步存储于存储器107。
如下文所述,在当前帧为CELP类的情况下,还可以通过与高波段相关联的编码进行频带扩展。
在步骤203中通过单元102选择了MDCT编码的情况下,则在步骤207中核实已经对当前帧之前的帧进行了MDCT变换编码。在已经对当前帧之前的帧进行了MDCT变换编码的情况下,则直接将当前帧传递至MDCT编码器105,以便在步骤208对当前帧进行MDCT变换编码。MDCT编码器可以对28.75毫秒(包括帧的20毫秒和前瞻量的8.75毫秒)的未重新采样信号的帧进行编码。MDCT窗口大小没有任何限制。而且,把由于对输入信号重新采样所产生的与CELP编码器延迟相对应的延迟应用于通过MDCT编码器所编码的帧,由此使得MDCT帧和CELP帧是同步化的。根据CELP编码之前的重新采样类型,在编码器一端的这种延迟可为0.9375毫秒。在步骤206,将MDCT变换编码帧传递至解码器。
在通过单元102选择了MDCT编码的情况下以及在已经对当前帧之前的帧进行了预测编码的情况下,当前帧是过渡帧并将其传递至过渡单元104。如下文所述,MDCT过渡帧包括附加的CELP子帧。
过渡单元104能够执行下列步骤:
在步骤209,预期编码过渡CELP子帧所需的比特预算,从而确定对当前帧进行MDCT编码可用的预算。如下文所详细描述的,预算可取决于当前帧速率。此外,可以根据所采用的CELP核心对预算进行评估。为了维持足够的比特预算而避免MDCT编码的质量下降,本发明提出限制CELP子帧的编码速率。为此目的,它包括适用于确定在过渡帧中进行比特分配的装置,比如图7所示的装置700;
在步骤210,修改在编码器中所采用的MDCT窗口,使之与下文所述的图3相一致;
使MDCT变换存储器归零,因为在步骤207的前一帧是CELP帧——可以同样的方式,在MDCT解码中忽略MDCT存储器。
在一个实施例中,这些步骤中至少一个步骤是由过渡帧编码单元106执行的,如下文所述。
如下文所述,在步骤212,由MDCT编码器105根据在步骤209分配的比特预算对过渡MDCT帧进行编码。如下文参考图3所述,在步骤213, 由CELP编码器103根据在步骤209分配的比特预算对附加的CELP子帧也进行编码。CELP编码可在MDCT编码之前或者之后进行。
图3显示了在由编码器进行编码之前的CELP帧与MDCT帧之间的过渡以及在由解码器进行解码之前的CELP帧与MDCT帧之间的过渡。
待编码帧301被编码器100接收到并由CELP编码器103对其进行编码。当前帧302随后由编码器100的输入端接收到并进行MDCT变换编码。因此,它是过渡帧。由编码器输入端所接收到的下一帧303也进行MDCT变换编码。根据本发明,下一帧303可通过CELP编码进行编码,而且关于下一帧303所采用的编码没有任何限制。
不对称MDCT窗口304可用于编码当前帧。该窗口304显示了上升沿307为14.375毫秒、增益为1的水平持续11.25毫秒、与前瞻量相对应的下降沿309为8.75毫秒以及空值部分310为5.265毫秒。附加空值部分310使之能够减少前瞻量,并因此减少相对应的延迟。在一个实施例中,适合MDCT编码的该MDCT分析窗口的形式是可以修改的,例如,进一步减少前瞻量或者利用对称窗口,专利申请书WO2012/085451列出了其实例。
虚线312代表MDCT窗口304的中间。MDCT窗口212的10毫秒四等分在线312两侧混叠,如介绍部分所述。实线311表示在MDCT窗口304的第一等分与第二等分之间的混叠区域。下一帧303的MDCT窗口用306表示并且显示了与MDCT窗口304的重叠相加区域,相对于MDCT窗口304的下降沿309。
MDCT窗口305从理论上表示只要已经被MDCT变换编码就可将该窗口应用于前一个窗口。然而,由CELP编码器103来编码前一帧301,这也是必需的,以便能够通过解码器展开MDCT变换编码帧的第一部分,于是窗口在第一等分中是零位(因为前一个MDCT帧的第二部分是无效的)。
为此目的,MDCT窗口304可以由具有零的第一等分的MDCT窗口313来修改,以便MDCT帧的第一部分能够在解码器进行时域混叠。
在解码器一端,分析窗口304、305、306和313分别对应于合成窗口324、325、326和327。合成窗口因此相对于对应的分析窗口时间相反。在本发明的变体中,分析窗口与合成窗口可以相同,同为正弦型或其它类型。
通过CELP编码所编码的新样本的第一帧320由解码器接收到。它相当于该CELP帧301的编码版。在此回顾下,解码帧相对于帧320可有8.75毫秒的移位。
过渡帧302的编码版随后接收到(标号321和222构成一个完整帧)。在CELP帧320末端与合成窗口327上升沿始端之间(与混叠线相对应)会形成一个间隙。在本文所展示的特殊实例中,MDCT窗口的一个等分为10毫秒,覆盖该CELP帧220的合成窗口MDCT324的空值部分为5.625毫秒(与MDCT分析窗口204的部分310相对应),则间隙为4.275毫秒。此外,为了确保MDCT窗口327的非空值部分的始端具有令人满意的重叠相加长度,可将该CELP帧320与MDCT窗口327始端之间的延迟延长到所需的长度。在下列实例中,出于阐释性目的,认为令人满意的重叠相加长度为1.875毫秒,上述延迟(与丢失信号长度相对应)因此达到6.25毫秒,如图2中的标号321所示。
应该注意的是,图3所示的信号帧可包含不同采样频率的信号,该采样频率在CELP编码/解码的情况下为12.8kHz或16kHz以及在MDCT编码/解码的情况下为fs;然而,在解码器一端,在CELP合成的重新采样与MDCT合成的时移之后,要求帧仍然保持同步且如图3所示仍然是准确的。
如上文所述,专利申请书WO2012/085451提出在12.8kHz的CELP编码的情况下,在MDCT过渡帧始端对5毫秒的附加CELP子帧进行编码,在16kHz的CELP编码的情况下,分别在MDCT过渡帧始端对4毫秒的两个附加CELP帧进行编码。
在12.8kHz的情况下,6.25毫秒的延迟未加填补而且重叠相加受到影响:在解码器一端只有0.625毫秒的重叠相加,这是不充分的。
在16kHz的情况下,在过渡帧的始端对两个附加CELP子帧进行编码,这样为编码过渡MDCT帧只留下很少预算而且在低码率下会导致质量明显下降。
为了克服这些缺点,本发明提出通过CELP编码器103在12.8kHz或16kHz对单个附加CELP子帧进行编码。在解码器生成额外的样本,如下文所需详细描述的,从而在上述6.25毫秒长度生成丢失信号。
为了对过渡CELP子帧进行编码,单元106可重新利用前一个CELP帧的至少一个CELP参数。例如,单元106可重新利用前一个CELP子帧的线性预测系数A(z)以及来自前一帧创新(存储在存储器107中,比如上文所述)的能量,从而仅仅只对过渡CELP子帧的自适应字典向量,自适应增益、固定增益以及固定字典向量进行编码。因此,可以通过与前一个CELP帧相同的核心(12.8kHz或16kHz)对附加CELP子帧进行编码。
过渡帧编码单元106确保根据本发明来编码过渡帧。本发明进一步提出通过单元106***表示编码的帧322是过渡帧的附加位比特流,但是,在通常情况下,该过渡帧的表示还可以按照当前帧编码模式的综合表示而不采用附加位来传输。
本发明进一步提出单元116在需要信号高波段的情况下可通过步骤204和214(被称之为“频带扩展”的方法)以固定预算对信号高波段进行编码,因为在解码器一端的合成信号的采样频率不一定与CELP核心频率是相同的。
为此目的,过渡帧106的编码单元可以执行下列步骤:
由高通滤波器对CELP前一帧以及过渡帧的CELP子帧进行滤波,从而保留频谱中较高部分(高于与所采用的CELP核心相对应的频率,即高于6.4 kHz或8kHz)。这种滤波可由CELP编码器103的有限脉冲响应FIR滤波器实施;
搜索在原始过渡CELP子帧的滤波部分与经滤波的前一个CELP帧之间的相关性,从而估算延迟参数,然后估算增益(在滤波子帧相对应的信号与通过施加延迟预测的信号之间的幅差);
利用例如标量量化对延迟参数以及所述增益进行编码(例如,以6位以上对延迟进行编码和以6位以上对增益进行编码)。
上文提及的步骤209可参考图4作更详细的阐释,所述图4图表阐释了根据本发明一个实施例适用于确定过渡编码的比特分配的方法的步骤。按照与编码器和解码器相同的方式执行上述方法,但是出于阐释性目的仅仅只在编码器一侧显示了所述方法。
在步骤400中,总码率(单位为bit/s)用core_brate表示,可用于对当前帧进行编码的总码率是固定的且等于MDCT编码器的输出率。在这个实例中,所考虑的帧的持续时间为20毫秒,每秒的帧数为50,则总的比特预算等于core_brate/50。在固定码率编码器的情况下,总预算是固定的;或者,在执行适合编码速率的可变码率编码器的情况下,总预算是可变的。在下文中,采用num_bits变量且初始化值为core_brate/50。
在步骤401中,过渡单元104从至少两个CELP核心中确定CELP核心,将其用于对这前一CELP帧进行编码。在下列实例中,认为两个CELP核心分别以12.8kHz和16kHz的频率工作。作为选择,编码和/或解码也可以单个CELP核心来实施。
在用于前一个CELP帧的CELP核心的频率为12.8kHz的情况下,该方法包括分配比特率的步骤402,所述比特率标记为cbrate,用于CELP编码过渡子帧,该比特率等于在MDCT编码过渡帧的比特率与第一个预定比特率值之间的最小值。例如,第一个预定值可固定为24.4kbit/s,由此就能确保用于转换编码的比特预算令人满意。
因此,cbrate=min(core_bitrate,24400)。这一限制相当于通过编码CELP参数控制受限于附加子帧的受限CELP编码的操作,使之最多以24.40kbit/s对其进行了CELP编码。
在可选步骤403中,将分配比特率与11.60kbit/s的CELP比特率作比较。如果分配比特率较高,则可以保留一位,用于编码自适应字典的低通滤波的位表示(例如,以大于或等于12.65kbit/s的码率进行AMR-WB编码)。num_bits变量更新为:
num_bits:=num_bits –1
在步骤404中,第一个比特数标记为budg1,用于对附加CELP子帧进行预测编码。第一个比特数budg1表示用于编码CELP子帧的CELP参数的比特数。如上文详细描述的,可对CELP子帧的编码进行限制,采用有限数量的CELP参数,有利的是,可以重新利用编码前一个CELP帧的某些参数。
例如,仅对编码附加CELP子帧的激励进行模型化,因此,仅仅只保留用于固定字典向量、自适应字典向量以及增益向量的比特。通过在步骤402中编码附加CELP子帧所分配的比特率,推算出属于这些参数中每个参数的比特数。例如,来自于2003年7月版的ITU-T的G.722.2的表1/G722.2——关于20毫秒帧的AMR-WB编码算法的比特分配,列出了通过取决于分配比特率的CELP参数进行比特分配的实例。
在前一个实例中,子帧的编码是受限的,budg1相当于分别属于自适应字典、固定字典和增益向量的比特总和。例如,对于19.85kbit/s的分配比特率而言,参阅上述表1/G722,为固定字典(色调前置时间)分配9位以及为增益向量(字典增益)分配7位。在这种情况下,budg1等于88位。
因此,num_bits变量更新为:
num_bits:=num_bits – budg1
本发明还提出在CELP参数的比特分配中考虑帧类别。例如,ITU-T的G.718规范的2008年6月版的第6.8节和第8.1节列出了根据分类或模式和根据分配的比特率(分别为layer1或layer2,相当于8kbit/s和8+4kbit/s的码率)为每个CELP参数所分配的预算,比如所述模式为非浊音模式(UC)、浊音模式(VC)、过渡模式(TC)和通用模式(GC)。编码器G.718是分级编码器,但是它有可能将利用G718分类的CELP编码原则与AMR-WB的多码率分配相结合。
如果在步骤401中已经确定用于前一个CELP帧的CELP核心的频率为16kHz,则该方法包括步骤405,分配标记为cbrate的比特率,以便CELP编码过渡子帧,该比特率等于在MGCT编码过渡帧的比特率和比特率的第一个预定值之间的最小值。在16kHz核心的情况下,例如,第一个预定值可固定在22.6kbit/s,由此就能确保用于变换编码的比特预算令人满意。因此,第一个预定值取决于用于编码前一个CELP帧的CELP核心。此外,对于编码16kHz核心,在对分配比特率进行CELP编码时,可以采用阈值。因此,分配比特率进一步等于在变换编码过渡帧的比特率与至少一个预定的第二个比特率值之间的最小值且第二个值小于第一个值。交换的第二个预定值可例如为14.8kbit/s。因此,如果变换编码过渡帧的比特率小于14.8kbit/s,则CELP编码过渡子帧所分配的比特率可为14.8kbit/s。
在一个补充实施例中,如果变换编码过渡帧的比特率小于8kbit/s,则分配率可为8kbit/s。
因此,根据这个补充实施例,得到下列算法:
如果core_bitrate≤8000
cbrate=8000
否则,如果core_bitrate≤14800
其它cbrate=14800
否则,
cbrate=min(core_bitrate,22600)
结束条件。
在可选步骤407中,将分配比特率与11.60kbit/s的CELP比特率作比较。如果分配比特率较高,则可以保留一位,用于编码自适应字典的低通滤波的位表示。num_bits变量更新为:
num_bits:=num_bits –1
在步骤408,按照与步骤404相同的方式,分配第一个比特数budg1,以便预测编码附加CELP子帧,budg1取决于CELP编码过渡子帧所分配的比特率。
在步骤410中,该步骤对以不同核心频率进行编码都是通用的, 为变换编码过渡帧分配第二个数量,标记为budg2,是通过第一个比特数budg1(即过渡帧的比特总数)计算得到的。关于上述计算,budg2等于num_bits变量。通常,本文将过渡当前帧的模式假设为转嫁于MDCT编码预算,因此未明确考虑该信息。
在将音频信号分解为至少一个频率低波段和一个频率高波段的情况下,可执行前述步骤,以便对过渡子帧的频率低波段进行编码。在步骤410之前的可选步骤409中,所述步骤对于以不同核心频率进行编码也都是通用的,该方法可包括分配第三个预定比特数,标记为budg3,用于编码过渡子帧的频率高波段。在这种情况下,第二个比特数budg2是通过第一个比特数budg1和第三个比特数budg3计算得到的。
如上文所述,编码过渡子帧的频率高波段(或者扩展波段)可基于在音频信号前一帧与过渡子帧之间的相关性。例如,频率高波段的编码可分为两个步骤。
在第一个步骤中,通过高通滤波器对音频信号的前一帧和当前帧进行滤波,以便仅保留频谱中较高的部分。频谱的较高部分可与高于所采用的CELP核心的频率相对应。例如,如果所采用的CELP核心为12.8kHz的CELP核心,则高波段则与低于12.8kHz的频率已经被滤波的音频信号相对应。可以通过FIR滤波器进行如此滤波。
在第二个步骤中,搜索在前一帧被滤波的部分与当前帧之间的相关性。这种相关性搜索能够估算延迟参数以及随后估算增益。增益与在当前帧的滤波部分和通过应用延迟预测的信号之间的幅度比相对应。
例如,可以为增益分配6位和为延迟分配6位。于是,第三个比特数budg3等于12。
然后, num_bits变量更新为:
num_bits:=num_bits –budg3。
于是,第二个比特数budg2等于更新的num_bits变量。
图5阐释了一种根据本发明一个实施例的音频解码器500,图6是一图表,其阐释了根据本发明一个实施例由图5所示的音频解码器500执行的解码方法的步骤。
解码器500包括接收单元501,用于在步骤601中接收来自图1所示编码器500的编码数字信号(或比特流)。将比特流传递给分类单元502,以便能在步骤602中确定当前帧是否为CELP帧、MDCT帧或过渡帧。为此目的,分类单元502能够通过表明当前帧是否为过渡帧的比特流信息和表明采用哪个CELP核心解码CELP帧或过渡CELP子帧的信息推算出比特流。
在步骤603中,核实当前帧是否为过渡帧。
如果当前帧不是过渡帧,则在步骤604核实当前帧是否为CELP帧。如果情况是这样的话,则将帧传递至CELP解码器504,所述CELP解码器能够根据由分类单元502所指示的核心频率在步骤605中解码CELP帧。在解码CELP帧之后,在下一帧是过渡帧的情况下,CELP解码器504可在步骤606中将例如线性预测滤波系数A(z)这类参数以及例如预测能量这类内部状态存储于存储器506中。
作为CELP解码器504的输出,信号可在步骤607中通过重新采样单元505按照解码器500的输出频率对信号进行重新采样。在本发明的一个实施例中,重新采样单元包括FIR滤波器并且重新采样产生(例如)1.25毫秒的延迟。在一个实施例中,在重新采样之前或之后,可对CELP解码运用后处理。
如上所述,在一个实施例中,还可以在步骤6071和6151中通过波段扩展的管理单元5051进行波段扩展,在当前帧为CELP类帧的情况下,解码与高波段有关。然后,使高波段与CELP编码相结合,就有可能将额外延迟应用于低波段的CELP合成。
在步骤608中,将由CELP解码器解码的且重新采样(有可能在重新采样之前或之后进行后处理)的信号传递至解码器的输出接口510。
解码器500进一步包括MDCT解码器507。在步骤604已经确定了当前帧为MDCT帧的情况下,MDCT解码器507能够在步骤609中按照典型的方式解码MDCT帧。此外,对应源自CELP解码器504的信号重新采样应用所需的延迟通过延迟单元508将其施加于解码器输出端,以便在步骤610使MDCT的合成与CELP的合成实现同步化。在步骤608中,将通过MDCT解码的且延迟的信号传递至解码器的输出接口510。
在步骤603之后确定当前帧是过渡帧的情况下,用于确定比特分配的装置503能够在步骤611中确定CELP编码过渡帧的第一个比特数budg1和变换编码过渡帧的第二个比特数budg2。装置503可以与参考图7详细描述的装置700相对应。
MDCT解码器507采用通过确定单元503计算得到的第三个比特数budg3,以便调整解码过渡帧所需的码率。MDCT解码器507进一步使MDCT变换的存储器归零以及在步骤612中解码过渡帧。然后,在步骤613中,由延迟单元508来延迟源自MDCT解码器的信号。
并行地,CELP解码器504在步骤614中基于第一个比特数budg1来解码过渡CELP子帧。为此目的,CELP解码器504解码CELP参数,所述CELP参数可取决于当前帧的类别,例如,包括来自CELP子帧的自适应字典、固定和增益字典的调值,而且所述CELP解码器504利用线性预测滤波系数。此外,CELP解码器504更新CELP解码状态。所述状态通常可包括源自前一个CELP帧的创新的预测能量,以便根据是否采用12.8kHz或者16kHz的CELP核心(在对过渡CELP子帧进行受限编码的情况下)来生成4毫秒或5毫秒的信号子帧。
如上文所述,专利申请书WO2012/085451提出针对12.8kHz的CELP核心额外编码5毫秒的子帧以及针对16kHz的CELP核心额外编码4毫秒的两个附加子帧。
如参考图3所示,在12.8kHz的情况下,未填补6.25毫秒的延迟并且重叠相加受到影响:解码器仅有0.625毫秒的重叠相加,这是不够的。
在16kHz的情况下,在过渡帧始端编码附加CELP子帧,这样仅为编码过渡MDCT帧留下非常少的预算并且相对于在当前帧以“全码率”进行MDCT编码而言会导致质量下降。
因此,国际专利申请书WO2012/085451提出的解决方案不尽人意。
本发明的单独一方面提出由单个附加过渡CELP子帧通过重新利用编码过渡CELP子帧所用的编码参数来部分地生成第二个子帧。因此,该延迟通过确保充足的重叠相加来填充且不影响过渡帧的MDCT编码速率。
为此目的,本发明还针对一种通过解码器500解码编码数字信号的方法P,所述解码器500能够按照预测解码或者按照变换解码来解码信号帧,所述方法包括下列步骤:
在步骤501,接收对第一个数字信号帧进行编码的第一组预测编码参数;
在步骤605,对基于第一组预测编码参数的第一帧进行预测解码;
在步骤501,针对新帧,接收对变换编码过渡帧的第一个过渡子帧进行预测编码的第二组参数;
在步骤614,解码基于第二组预测编码参数的第一个过渡子帧;
在步骤614,通过第二组中至少一个预测编码参数来生成第二个过渡子帧的样本。
本发明进一步针对执行解码方法P的解码器500以及一种计算机程序,所述计算机程序包括在通过处理器执行指令时执行解码方法P的指令。
重新用于生成第二个子帧的CELP参数可以是增益向量、自适应字典向量和固定字典向量。
根据解码方法P的一个实施例,可针对变换解码预定义最小重叠值并且根据最小重叠值来确定由第二个子帧所生成的样本数量。最后这个子帧可以在没有延长CELP合成的附加信息的情况下生成,通过与第一个子帧相同的基音延迟和相同的自适应字典增益进行基音预测 以及通过相同LPC系数的合成LPC滤波和解强或去加重来进行。
然后,可以缩短第二个CELP子帧,使之在12.8kHz的CELP核心的情况下仅仅只保留1.25毫秒的信号以及在16kHz的CELP核心的情况下仅仅只保留2.25毫秒的信号。因此,第一个CELP子帧是完整的,以便使6.25毫秒的附加信号能够填补间隙并且确保MDCT过渡帧的重叠相加令人满意(例如,最小重叠值为1.875毫秒)。在一个实施例中,附加CELP子帧的长度可在12.8kHz和16kHz的CELP核心的情况下延长到6.25毫秒,这就意味着修改“正常”CELP编码使得延长子帧具有该长度,尤其是对固定字典而言。
除了解码方法P的上述实施例之外,该方法P可进一步包括由有限脉冲响应滤波器所执行的重新采样步骤615。如上文所述,FIR滤波器可以与重新采样单元505相结合。重新采样利用来自前一个CELP帧的FIR滤波存储器,而且在这个实例中,处理包括1.25毫秒的附加延迟。
方法P可进一步涉及添加附加信号的步骤,所述附加信号是从储存在有限脉冲响应滤波存储器中的样本中获得的,用于填充由重新采样步骤导致的延迟。因此,除了之前生成的6.25毫秒的附加信号外,由解码器500生成1.25毫秒的信号,这些样本使之能够有利于填补由于重新采样6.25毫秒的附加信号所导致的延迟。
为此目的,重新采样单元505的FIR滤波存储器可保存在CELP解码之后的每一帧。该存储器中的样本数量在所考虑的CELP核心频率(12.8kHz或16kHz)的情况下相当于1.25毫秒。
根据方法P的一个补充实施例,对所存储的样本进行重新采样可运用***法来进行,所述***法通过有限脉冲响应滤波器产生比第一个延迟短的第二个延迟,可将其视为空值。因此,按照隐含最短延迟的方法,对由FIR滤波存储器生成的1.25毫秒的信号进行重新采样。例如,可以通过三次插值对由FIR滤波存储器所生成的1.25毫秒的信号进行重新采样,这意味着仅仅只有来自两个样本之中的一个延迟,即与来自FIR滤波器延迟相比的最短的延迟。因此,需要两个附加信号样本,以满足对上述1.25毫秒的信号进行重新采样:可以通过重复FIR滤波器的重新采样存储器的最后一个值来得到这两个附加样本。
解码器可进一步解码来自6.25毫秒的CELP信号的高频部分,所述CELP信号是通过第一个过渡帧和第二个过渡帧所得到的。为此目的,CELP解码器504可采用来自前一个CELP帧的最后子帧的自适应增益和固定字典向量。
解码器500进一步包括重叠相加单元509,其能够在步骤616中确保在解码并重新采样的CELP过渡子帧、通过三次插值重新采样的样本和源自MDCT解码器507的过渡帧的解码信号之间的重叠相加。
为此目的,单元509应用图3所示的合成修改窗口327。因此,在两个第一等分的MDCT混叠点之前,使样本归零。在上述混叠点之后,把窗口化的样本除以图3所示的未修改窗口324以及乘以正弦型窗口,从而与应用到编码器的窗口相结合,使得总的窗口为sin²。在重叠相加所涉及的部分,通过cos²窗口对通过CELP和0-延迟重新采样(例如,通过三次插值)所得到的样本进行加权。
在步骤608中,将因此所得到的过渡帧传递至解码器的输出接口510。
图7显示了一例确定过渡帧比特分配的装置700的实例。
装置包括随机存取存储器704和处理器703,用于存储能够执行如上所述的确定过渡帧比特分配的方法的指令。装置还涉及大容量存储器705,用于存储数据,旨在保存实施所述方法的数据。装置700进一步涉及输入接口701和输出接口706,旨在分别用于接收数字信号帧和发送关于分配给这些不同帧的预算的详细信息。
装置700可进一步涉及一种数字信号处理器(DSP)702。该DSP 702可根据众所周知的方式来接收数字信号帧,以便形成、解调和放大这些信号帧。
本发明并不仅仅只限于上文所述的实施例,例如上述的目的;本发明可延伸到其它变体。
因此,已经描述了压缩装置或解压装置总体上是实体的实施例。当然,可将装置嵌入各种类型更显著的装置中,比如,数码相机、照相机、移动电话、计算机、电影放映机等。
此外,还描述了提供压缩装置、解压装置和比较装置的详细设计的实施例。这些设计仅仅只出于阐释性目的。因此,还可以考虑部件的安排以及针对每个部件所分配任务的不同分配。例如,由数字信号处理器(DSP)所执行的任务也可以由典型的处理器来执行。

Claims (14)

1.一种确定适用于编码过渡帧(321;322)的比特分配的方法,所述方法通过对数字信号进行编/解码的编码器/解码器(100;500)来执行,过渡帧以预测编码的前一帧(320)为先导,编码过渡帧包括变换编码和预测编码过渡帧的单子帧,该方法包括下列步骤:
分配(402;405)比特率,以便预测编码过渡子帧,所述比特率等于在变换编码过渡帧的比特率与第一个预定比特率值之间的最小值;
根据所述比特率确定(404;408)为预测编码过渡子帧所分配的第一个比特数;以及,通过第一个分配比特数与编码过渡帧可用的比特数来计算(410)为变换编码过渡帧所分配的第二个比特数,其中,将数字信号至少分解为一个频率低波段与一个频率高波段,其中,将第一个计算的比特数分配用于对频率低波段的过渡子帧(321)进行预测编码,以及将第三个预定比特数分配用于对频率高波段的过渡子帧进行编码,而且,通过第三个预定比特数进一步确定为了变换编码过渡帧(322)所分配的第二个比特数。
2.根据权利要求1所述的方法,其特征在于,所述编码器/解码器(100;500)包括以第一频率对信号帧进行预测编码/解码的第一项核心工作和以第二频率对信号帧进行预测编码/解码的第二项核心工作,
其中,第一个预定比特率值取决于选自在对预测编码前一帧(320)进行编码/解码的第一个核心与第二个核心中的核心。
3.根据权利要求2所述的方法,当选择第一个核心对预测编码的前一帧(320)进行编码/解码时,则分配的比特率进一步等于在变换编码过渡帧(322)的比特率与至少一个第二预定比特率值之间的最大值,第二个值小于第一个值。
4.根据权利要求1所述的方法,其特征在于,所述可用于编码过渡帧(321;322)的比特数是固定的。
5.根据权利要求4所述的方法,其特征在于,所述第二个比特数等于编码过渡帧(321;322)的固定比特数减去第一个比特数减去第三个比特数。
6.根据权利要求4所述的方法,其特征在于,所述第二个比特数等于编码过渡帧(321;322)的固定比特数减去第一个比特数减去第三个比特数减去第一位减去第二位,
第一位表示在确定过渡子帧的预测编码参数的过程中是否进行低通滤波,所述参数与色调前置时间有关,
第二位表示对过渡子帧进行预测编码/解码的编码器/解码器核心所采用的频率。
7.一种通过编码器(100)编码数字信号的方法,所述编码器能够按照预测编码或者按照变换编码来编码信号帧,包括下列步骤:
按照预测编码对数字信号样本前一帧进行编码(301);
将数字信号样本当前帧(302)编码为过渡帧(321;322),编码过渡帧(321;322)包括变换编码和预测编码过渡帧的单子帧(321),编码当前帧(302)包括下列子步骤:
根据上述权利要求中任一项来确定(209)比特分配;
根据第二个分配比特数对过渡帧(322)进行变换编码(212);
根据第一个分配比特数对过渡子帧(321)进行预测编码(213)。
8.根据权利要求7所述的编码方法,其特征在于,所述预测编码包括生成关于所述分配比特率所确定的预测编码参数。
9.根据权利要求8所述的编码方法,其特征在于,所述预测编码包括生成预测编码参数,其重新利用前一帧的至少一个预测编码参数且受限于相对于前一帧(320)的预测编码。
10.一种由解码器(500)实施对编码数字信号进行解码的方法,所述解码器(500)能够按照预测编码或者按照变换解码来解码信号帧,所述方法包括下列步骤:
按照预测编码来预测解码所编码的数字信号样本前一帧(605);
解码过渡帧(321;322),所述过渡帧对数字信号样本当前帧进行编码,编码过渡帧包括变换编码和预测编码过渡帧单子帧(321),包括下列子步骤:
-通过根据权利要求1至6中任一项来确定比特分配(611);
-根据第一个分配比特数对过渡子帧(321)进行预测解码(614);
-根据第二个分配比特数对过渡帧(322)进行变换解码(612)。
11.一种可读介质,其存储有计算机程序,所述计算机程序包括适用于在通过处理器执行指令的情况下执行根据权利要求1所述方法的指令。
12.一种适用于确定编码过渡帧(321;322)的比特分配的装置,所述装置(104;503)由对数字信号进行编码/解码的编码器/解码器来实现,过渡帧以预测编码的前一帧(320)为先导,编码过渡帧包括变换编码和预测编码过渡帧的单子帧(321),编码过渡帧的比特数是固定的,所述装置包括处理器且设置成执行下列操作:
-分配比特率,以便预测编码过渡子帧,所述比特率等于在变换编码过渡帧的比特率与第一个预定比特率值之间的最小值;
-根据所述比特率确定预测编码过渡子帧所分配的第一个比特数;
-通过对编码参数进行编码所需的比特数与编码过渡帧的固定比特数来计算变换编码过渡帧所分配的第二个比特数,
其中,将数字信号至少分解为一个频率低波段与一个频率高波段,其中,将第一个计算的比特数分配用于对频率低波段的过渡子帧(321)进行预测编码,以及将第三个预定比特数分配用于对频率高波段的过渡子帧进行编码,而且,通过第三个预定比特数进一步确定为了变换编码过渡帧(322)所分配的第二个比特数。
13.一种能够按照预测编码或者按照变换编码对数字信号帧进行编码的编码器,包括:
根据权利要求12所述的装置(104);
预测编码器(103),包括处理器且设置成执行下列操作:
按照预测编码对数字信号样本前一帧进行编码;
预测编码单子帧,所述单子帧包含在对数字信号样本当前帧进行编码的过渡帧中,编码过渡帧包括变换编码和预测编码所述子帧,将处理器设置成根据第一个分配比特数来预测编码过渡子帧;
变换编码器(105),包括处理器且设置成根据第二个分配比特数变换编码过渡帧。
14.一种适用于通过预测编码和变换编码解码所编码的数字信号的解码器,包括:
根据权利要求12所述的装置(503);
预测解码器(504),包括处理器且设置成执行下列操作:
对按照预测编码所编码的数字信号样本前一帧(320)进行预测解码;
预测解码单子帧(321),所述单子帧包含在对数字信号样本当前帧进行编码的过渡帧中,编码过渡帧包括变换编码和预测编码所述子帧,将处理器设置成根据第一个分配比特数对过渡子帧进行预测解码的操作;
变换解码器(507),包括处理器且设置成根据第二个分配比特数对过渡帧(222)进行变换解码的操作。
CN202010879909.4A 2014-07-29 2015-07-27 确定用于编码lpd/fd过渡帧的预算 Active CN112133315B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010879909.4A CN112133315B (zh) 2014-07-29 2015-07-27 确定用于编码lpd/fd过渡帧的预算

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
FR1457353A FR3024581A1 (fr) 2014-07-29 2014-07-29 Determination d'un budget de codage d'une trame de transition lpd/fd
FR1457353 2014-07-29
CN201580044697.5A CN106605263B (zh) 2014-07-29 2015-07-27 确定用于编码lpd/fd过渡帧的预算
CN202010879909.4A CN112133315B (zh) 2014-07-29 2015-07-27 确定用于编码lpd/fd过渡帧的预算
PCT/FR2015/052073 WO2016016566A1 (fr) 2014-07-29 2015-07-27 Détermination d'un budget de codage d'une trame de transition lpd/fd

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580044697.5A Division CN106605263B (zh) 2014-07-29 2015-07-27 确定用于编码lpd/fd过渡帧的预算

Publications (2)

Publication Number Publication Date
CN112133315A CN112133315A (zh) 2020-12-25
CN112133315B true CN112133315B (zh) 2024-03-08

Family

ID=51894138

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010879909.4A Active CN112133315B (zh) 2014-07-29 2015-07-27 确定用于编码lpd/fd过渡帧的预算
CN201580044697.5A Active CN106605263B (zh) 2014-07-29 2015-07-27 确定用于编码lpd/fd过渡帧的预算

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201580044697.5A Active CN106605263B (zh) 2014-07-29 2015-07-27 确定用于编码lpd/fd过渡帧的预算

Country Status (8)

Country Link
US (2) US10586549B2 (zh)
EP (1) EP3175443B1 (zh)
JP (1) JP6607921B2 (zh)
KR (2) KR102485835B1 (zh)
CN (2) CN112133315B (zh)
ES (1) ES2676832T3 (zh)
FR (1) FR3024581A1 (zh)
WO (1) WO2016016566A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
EP3230980B1 (en) * 2014-12-09 2018-11-28 Dolby International AB Mdct-domain error concealment
BR112020004883A2 (pt) * 2017-09-20 2020-09-15 Voiceage Corporation método e dispositivo para alocar um bit-budget entre subquadros em um codec celp
CN111402908A (zh) * 2020-03-30 2020-07-10 Oppo广东移动通信有限公司 语音处理方法、装置、电子设备和存储介质
CN111431947A (zh) * 2020-06-15 2020-07-17 广东睿江云计算股份有限公司 一种云桌面客户端优化显示的方法及***

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0932141A2 (en) * 1998-01-22 1999-07-28 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
CN1618093A (zh) * 2001-12-14 2005-05-18 诺基亚有限公司 有效编码语音信号的信号修改方法
CN101578508A (zh) * 2006-10-24 2009-11-11 沃伊斯亚吉公司 用于对语音信号中的过渡帧进行编码的方法和设备
CN101939781A (zh) * 2008-01-04 2011-01-05 杜比国际公司 音频编码器和解码器
CN102089811A (zh) * 2008-07-11 2011-06-08 弗朗霍夫应用科学研究促进协会 用于编码和解码音频样本的音频编码器和解码器
CN102089758A (zh) * 2008-07-11 2011-06-08 弗劳恩霍夫应用研究促进协会 用于对采样音频信号的帧进行编码和解码的音频编码器和解码器
CN102105930A (zh) * 2008-07-11 2011-06-22 弗朗霍夫应用科学研究促进协会 用于编码采样音频信号的帧的音频编码器和解码器
CN102859589A (zh) * 2009-10-20 2013-01-02 弗兰霍菲尔运输应用研究公司 多模式音频编译码器及其适用的码簿激励线性预测编码
CN103384900A (zh) * 2010-12-23 2013-11-06 法国电信公司 在预测编码与变换编码之间交替的低延迟声音编码
CN103503062A (zh) * 2011-02-14 2014-01-08 弗兰霍菲尔运输应用研究公司 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法
CN103843062A (zh) * 2011-06-30 2014-06-04 三星电子株式会社 用于产生带宽扩展信号的设备和方法
CN103930946A (zh) * 2011-06-28 2014-07-16 奥兰吉公司 延迟优化的重叠变换,编码/解码加权窗口

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6804218B2 (en) * 2000-12-04 2004-10-12 Qualcomm Incorporated Method and apparatus for improved detection of rate errors in variable rate receivers
DE60222445T2 (de) * 2001-08-17 2008-06-12 Broadcom Corp., Irvine Verfahren zum verbergen von bitfehlern für die sprachcodierung
US6647366B2 (en) * 2001-12-28 2003-11-11 Microsoft Corporation Rate control strategies for speech and music coding
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
US8090573B2 (en) * 2006-01-20 2012-01-03 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
KR100848324B1 (ko) * 2006-12-08 2008-07-24 한국전자통신연구원 음성 부호화 장치 및 그 방법
CN101206860A (zh) * 2006-12-20 2008-06-25 华为技术有限公司 一种可分层音频编解码方法及装置
CN101025918B (zh) * 2007-01-19 2011-06-29 清华大学 一种语音/音乐双模编解码无缝切换方法
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
CN101261836B (zh) * 2008-04-25 2011-03-30 清华大学 基于过渡帧判决及处理的激励信号自然度提高方法
KR101315617B1 (ko) * 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
WO2011013980A2 (en) * 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
MX2012004116A (es) * 2009-10-08 2012-05-22 Fraunhofer Ges Forschung Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, metodo y programa de computacion que usan un modelado de ruido en base a linealidad-prediccion-codi ficacion.
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法***及瞬态信号可分层编解码方法
CN102985968B (zh) * 2010-07-01 2015-12-02 Lg电子株式会社 处理音频信号的方法和装置
US8990094B2 (en) * 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
CN102737636B (zh) * 2011-04-13 2014-06-04 华为技术有限公司 一种音频编码方法及装置
FR2981781A1 (fr) * 2011-10-19 2013-04-26 France Telecom Codage hierarchique perfectionne
KR20140085453A (ko) * 2011-10-27 2014-07-07 엘지전자 주식회사 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치
TWI591620B (zh) * 2012-03-21 2017-07-11 三星電子股份有限公司 產生高頻雜訊的方法
CN103915100B (zh) * 2013-01-07 2019-02-15 中兴通讯股份有限公司 一种编码模式切换方法和装置、解码模式切换方法和装置
ES2634621T3 (es) * 2013-02-20 2017-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0932141A2 (en) * 1998-01-22 1999-07-28 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
CN1618093A (zh) * 2001-12-14 2005-05-18 诺基亚有限公司 有效编码语音信号的信号修改方法
CN101488345A (zh) * 2001-12-14 2009-07-22 诺基亚有限公司 有效编码语音信号的信号修改方法
CN101578508A (zh) * 2006-10-24 2009-11-11 沃伊斯亚吉公司 用于对语音信号中的过渡帧进行编码的方法和设备
CN101939781A (zh) * 2008-01-04 2011-01-05 杜比国际公司 音频编码器和解码器
CN102089811A (zh) * 2008-07-11 2011-06-08 弗朗霍夫应用科学研究促进协会 用于编码和解码音频样本的音频编码器和解码器
CN102089758A (zh) * 2008-07-11 2011-06-08 弗劳恩霍夫应用研究促进协会 用于对采样音频信号的帧进行编码和解码的音频编码器和解码器
CN102105930A (zh) * 2008-07-11 2011-06-22 弗朗霍夫应用科学研究促进协会 用于编码采样音频信号的帧的音频编码器和解码器
CN102859589A (zh) * 2009-10-20 2013-01-02 弗兰霍菲尔运输应用研究公司 多模式音频编译码器及其适用的码簿激励线性预测编码
CN103384900A (zh) * 2010-12-23 2013-11-06 法国电信公司 在预测编码与变换编码之间交替的低延迟声音编码
CN103503062A (zh) * 2011-02-14 2014-01-08 弗兰霍菲尔运输应用研究公司 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法
CN103930946A (zh) * 2011-06-28 2014-07-16 奥兰吉公司 延迟优化的重叠变换,编码/解码加权窗口
CN103843062A (zh) * 2011-06-30 2014-06-04 三星电子株式会社 用于产生带宽扩展信号的设备和方法

Also Published As

Publication number Publication date
US20180182408A1 (en) 2018-06-28
ES2676832T3 (es) 2018-07-25
CN106605263B (zh) 2020-11-27
KR20220066412A (ko) 2022-05-24
EP3175443A1 (fr) 2017-06-07
WO2016016566A1 (fr) 2016-02-04
US20200168236A1 (en) 2020-05-28
KR20170037660A (ko) 2017-04-04
CN106605263A (zh) 2017-04-26
FR3024581A1 (fr) 2016-02-05
JP6607921B2 (ja) 2019-11-20
CN112133315A (zh) 2020-12-25
US11158332B2 (en) 2021-10-26
JP2017527843A (ja) 2017-09-21
KR102485835B1 (ko) 2023-01-09
US10586549B2 (en) 2020-03-10
EP3175443B1 (fr) 2018-04-11

Similar Documents

Publication Publication Date Title
JP7488926B2 (ja) フォワードエイリアシング消去を用いた符号化器
JP6941643B2 (ja) 全帯域ギャップ充填を備えた周波数ドメインプロセッサと時間ドメインプロセッサとを使用するオーディオ符号器及び復号器
JP5978227B2 (ja) 予測符号化と変換符号化を繰り返す低遅延音響符号化
KR101871644B1 (ko) 적응적 대역폭 확장 및 그것을 위한 장치
TWI587291B (zh) 音訊解碼/編碼裝置及其運作方法及電腦程式
US11158332B2 (en) Determining a budget for LPD/FD transition frame encoding
JP7026711B2 (ja) Fd/lpd遷移コンテキストにおけるフレーム喪失管理
JP6110314B2 (ja) 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法
EP2772914A1 (en) Hybrid sound-signal decoder, hybrid sound-signal encoder, sound-signal decoding method, and sound-signal encoding method
KR20160144978A (ko) 다른 샘플링 레이트들을 가진 프레임들간의 전환시 사운드 신호의 선형 예측 인코딩 및 디코딩을 위한 방법, 인코더 및 디코더
US9984696B2 (en) Transition from a transform coding/decoding to a predictive coding/decoding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant