CN1905373A - 一种音频编解码器的实现方法 - Google Patents

一种音频编解码器的实现方法 Download PDF

Info

Publication number
CN1905373A
CN1905373A CNA2005100283020A CN200510028302A CN1905373A CN 1905373 A CN1905373 A CN 1905373A CN A2005100283020 A CNA2005100283020 A CN A2005100283020A CN 200510028302 A CN200510028302 A CN 200510028302A CN 1905373 A CN1905373 A CN 1905373A
Authority
CN
China
Prior art keywords
frequency
frequency band
code
category
implementation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005100283020A
Other languages
English (en)
Other versions
CN100539437C (zh
Inventor
欧阳合
周毅
吴秉惠
罗霖
万凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jade Technologies Co., Ltd.
Original Assignee
SHANGHAI JIEDE MICROELECTRONIC CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI JIEDE MICROELECTRONIC CO Ltd filed Critical SHANGHAI JIEDE MICROELECTRONIC CO Ltd
Priority to CNB2005100283020A priority Critical patent/CN100539437C/zh
Priority to US11/458,143 priority patent/US20070027677A1/en
Publication of CN1905373A publication Critical patent/CN1905373A/zh
Application granted granted Critical
Publication of CN100539437C publication Critical patent/CN100539437C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种音频编解码器的实现方法,它的计算复杂度低,存储量少同时又可以保证高音频压缩质量,被应用于手持设备、片上***或专用集成电路产品和嵌入式***的音频压缩编码技术。在编码器端:第一步,将音频信号做时-频变换,将信号变换到频域,得到非量化频谱数据,第二步,根据所述的非量化频谱数据及目标允许码量,通过迭代方法获得相应最佳的量化因子信息、频带组信息、编码码表索引信息以及量化后的频谱信息,第三步,计算并格式化码流,第四步,输出格式化码流;在它的解码器端:通过对码流的格式化解析,对每帧频谱进行解码、逆量化,经过频→时变换并重构出时域音频数据,并最终重构出各通道的时域信号。

Description

一种音频编解码器的实现方法
技术领域
本发明涉及一种应用于手持设备、SoC(片上***)或ASIC(专用集成电路)产品和嵌入式***的音频压缩编码技术,尤其涉及一种低复杂度高质量宽带音频编解码器的实现方法。
背景技术
目前在音频压缩编码技术中,大部分宽带音频压缩都采用基于频率子带划分,并利用人类声学听觉心理模型进行压缩的方法。采用人类声学听觉心理模型对频谱进行分析的过程中,根据人类听觉掩蔽效会对所谓的“冗余”信息最大限度地去除,从而在实际音频信号中某些频带的信号将因为认为人耳“感觉不到”而去除。这样做的好处就是能将更多的比特用于表示那些“更重要”频率成分。然而这样做的缺点是明显的,主要表现在,首先,采用基于人类声学听觉的频带分析模型,在编解码过程中将明显增加计算量;其次,采用人耳听觉分析模型,将不可避免地在相应的编解码器中需要额外保存用以表示模型的常数。而通常采用的听觉模型需要保存的模型常数的个数是非常可观的(比如在MPEG层3(MP3)的心理学模型需要用到的常数个数超过4700个),从而明显增加编解码器的固定数据存储量需求;另外,由于认为去除了“冗余”的频带信息,尤其是在较低码率情况下,解码后的音频将出现“发沙”的现象。而一旦出现音频“发沙”现象,解码音频质量将会明显降低。还有,某些音频编码器(如WMA)使用noise shaping(噪音整型)技术把量化噪声扩散到相应的频谱系数中,有可能使音频的保真度降低,从而影响解码音频的品质。
发明内容
本发明解决的技术问题是提供了一种音频编解码器的实现方法,它的计算复杂度低,存储量少同时又可以保证高音频压缩质量。
为了解决以上技术问题,本发明提供了一种音频编解码器的实现方法,在它的编码器端:第一步,将音频信号做时-频变换,将信号变换到频域,得到非量化频谱数据,第二步,对所述的非量化频谱数据进行频谱量化,它包括根据所述的非量化频谱数据及目标允许码量,通过迭代方法获得相应最佳的量化因子信息、频带组信息、编码码表索引信息以及量化后的频谱信息,第三步,计算得出并格式化码流,第四步,输出格式化码流;在它的解码器端:第五步,通过对码流格式化解析,对每帧频谱进行解码、逆量化,经过频→时变换并重构出时域音频数据,并最终重构出各通道的时域信号。
其中第二步还包括:首先,根据当前量化后的频谱数据,计算得出总使用的编码数据量,然后,将其与期望数据量进行比较,如果不符合期望要求,则调整量化因子,改变量化因子信息,进而改变各量化频谱数据、调整频带组信息及相应的编码码表,并重新计算编码数据量。如此重复迭代,直到满足期望数据量,最后计算得出格式化码流。
另外,所述的频谱量化是基于Bark频带(临界频带)进行,同一个Bark频带内所有频率子带采用相同的量化因子,且量化步长为()-Scale_factor
另外,所述的每个频带组由相邻的A类频带和B类频带组成。
另外,在对所述A类频带进行编码中,采用总共4个A类码表中的1个进行编码,并且同一个频带采用同一个码表。
另外,在对所述B类频带进行编码中,采用总共22个B类码表中的1个进行编码,并且同一个频带采用同一个码表。
本发明与MPEG层3(MP3)、AC-3以及WMA等传统的宽带音频压缩理论相比,本发明不依赖于人耳听觉模型,不人为删除在截止频率以下的任何频率成分,不人为加入噪声,时→频/频→时变换在编/解码器端各仅进行一次。因此很容易看出本发明的计算复杂度得到了极大的降低,总计算量在传统宽带编解码器的1/5以下。因为本发明不人为删除在截止频率以下的任何频率成分,也没有人为噪声的引入,同时采用更加高效的基于频带组的编码策略,从而最大限度地保证了频谱成分的完整性,进而最大程度地减少了因压缩带来的音质损失。本发明具有充分的动态范围和听觉定位,让人耳能轻易分辨出音源并进行定位,能分辩出高频率之间的细微差别,从而保证很高的解码音频质量。此外,由于采用了极为有限个数的码表,使得本编解码器本身需要存储的常量数据得到极大的减少(总码表入口个数小于256),而与之对应的MPEG层3(MP3)码表的总入口数为1410,以及超过4700个的心理学模型常数。
附图说明
下面结合附图和具体实施方式,对本发明做进一步阐述。
图1是本发明的编码器流程图;
图2是本发明的解码器流程图;
图3是各Bark频带带宽分布;
图4是频带组划分;
图5是A类频带频谱编码所用码表对应的二叉树示意图;
图6是B类频带频谱编码所用码表对应的二叉树示意图;
图7是频带组划分结果示例图。
具体实施方式
图1是本发明的编码器流程图。它的编码流程如下:
首先是将音频信号加窗取帧并做时-频变换,将信号变换到频域。通道编码方式判断模块100是根据输入音频本身的是否为立体声标识或者左右声道的相关性判断采用立体声编码方式还是采用双声道独立编码方式,如果是单声道信号则不需要这个模块进行处理。然后选择编码方式后,进入编码音频数据生成模块101,该模块首先计算当前帧期望码流量,然后导入一帧音频数据(每个通道512个采样点),并与同一通道相邻前一帧合并共同组成一个处理帧(1024个采样点)并乘正弦窗函数,最后将上述经加窗后的1024点音频数据经时→频变换模块102做时→频变换,得到非量化频谱数据。
第二步,对非量化频谱数据进行频谱量化,它包括根据非量化频谱数据及目标允许码量,通过迭代方法获得相应最佳的量化因子信息201、频带组信息202、编码码表索引信息203以及量化后的频谱信息204,经计算得出总使用的编码数据量。
然后,将上述计算得出的总使用的编码数据量与期望数据量进行比较205,如果不符合期望要求,则调整量化因子206,改变量化因子信息,重复第二步,直到满足期望数据量。
最后,当满足期望数据量时,对码流进行格式化并输出码流207。
上述中的量化因子信息201模块根据设定的各Bark频带对应的量化因子,对频谱进行量化。最初的各量化因子的设定可以是任意的。量化因子的选择,是对频谱数据进行量化的关键,它直接影响到编码质量和码流大小。频谱量化采用基于Bark频带划分策略,不同Bark频带采用不同的量化因子进行量化,一个Bark频带范围内所有频率子带的量化因子完全相同。Bark频带的划分与音频信号采样率有关,图3给出的是采样率分别为32kHz,44.1kHz以及48kHz情况下各Bark频带的带宽分布(以Bark数为单位)。频谱量化采用量化步长为()-Scale_factor的量化方法,其中Scale_factor即为需要编码的量化因子,取值范围为[-31,31]的整数。量化因子的编码采用偏移量和差分编码的方式编入码流。可以看出,本发明不需要存储量化码表,这对减少编解码器需要的存储空间也是非常有利的。
上述的频带组信息202模块根据量化后的频谱对整个截止频率以下的频带进行频带组划分。频带组的划分在量化后的频谱基础上进行,这一策略也是本发明完全不同于其他所有宽带编解码器的重要区别之一,也是能进一步提高编码效率的根本。图4给出了频带组的划分示意图,频带组的划分一般应当遵循以下标准:
1、最多允许划分出4个频带组,也可以少于四个,但至少有一个频带组;
2、每个频带组由相邻的A类和B类两类频带组成;
3、A类频带中,所有频率子带的最大量化绝对值为1,即A类频带中每个频率子带的量化值只能为{+1,0,-1}中的一个;
4、B类频带中,所有频率子带量化绝对值的最大值大于1,但可以含有绝对值小于或等于1的频率子带;
5、某些特殊情况下(如所有量化频率子带的最大绝对值为1),为了获得最小码流,B类频带中频率子带量化绝对值的最大值也可以是1。
6、某些特殊情况下,一个频带组中A类或者B类频带可以空缺,如果某个频带组中某类频带空缺,相应的,对应频谱的编/解码跳过。
频带组划分的不同会影响到最终编码码流的大小,总的原则就是使编码码流越小的划分方式就越好。最终的频带组划分信息(各A、B类频带的边界信息)也将进入编码码流。
本发明采用两种完全不同的编码方式对A类频带和B类频带分别进行编码,编码仅对非符号部分进行,符号位单独以0/1方式编码。
其中A类频带采用总共4个A类码表中的一个进行编码,且同一个频带采用同一个码表。图5给出了所有4个A类码表对应的二叉树示意图。TA_0码表对应的是0/1编码方式。TA_1,TA_2和TA_3分别对应以2,3和4个频率子带为一组进行编码的码表。以TA_2码表为例,码字“110”对应的值为4,将4以低位在前高位在后的顺序用3位表示为二进制有“001”。那么值“001”就代表了相邻3个频率子带对应频谱值的绝对值。统计结果(包含各类音乐,中、高、低音人声等音频材料)显示,为获得更小的码流,平均有50%左右的情况下编码***不会选择采用0/1的编码方式,而采用TA_1,TA_2或者TA_3进行编码。因此采用本发明的A类频带的编码方式可以明显节省码流,进而提高了编码效率。不完全统计结果显示节约码流可在15%以上(A类频带编码)。
其中B类频带采用了总共22个B类码表中的一个进行编码,且同一个频带采用同一个码表。图6给出了TB_8、TB_21相应码表的信息。表1给出了各码表对应的能表示的最大值,其中符号TB_Idx代表码表编号,依次为TB_0、TB_1、TB_2、……、TB_20、TB_21,符号MaxLv1表示对应码表能表示的最大值。频带中最大值的大小用来决定采用哪个码表。比如某个频带的最大频谱绝对量化值为7,那么就在TB_12和TB_13选择一个可以使得编码码流较小的码表用以编码。如果最大频谱绝对量化值为10,那么就在TB_18和TB_19中选择。如果最大频谱绝对量化值为12,就直接采用TB_20编码。如果最大频谱绝对量化值为14,那么就采用TB_21。另外,如果最大频谱绝对量化值大于15,则一律采用TB_21码表。在对最大频谱值大于15的频带编码时,频谱值小于15的频谱点,直接采用该表编码。对于频谱值大于等于15的频谱点则先编15,然后对该频谱点频谱值与15的差采用固定长度编码。固定码的长度为能够完整表示该频段最大谱值与15之差所需要的位数。
表1
 TB_Idx   0   1   2   3   4   5   6   7   8   9   10
 MaxLvl   2   2   2   8   3   3   4   4   5   5   6
 TB_Idx   11   12   13   14   15   16   17   18   19   20   21
 MaxLvl   6   7   7   8   8   9   9   11   11   13   15
图7给出了一个具体的频带组分割结果的示意图。
上述中的编码码表索引信息203模块是根据频带组划分的结果(频带组信息)以及相应的量化后的频谱值,计算得出能够获得最小编码码量所对应的编码码表的索引号,并将该索引号(每个A类和B类频带均有一个对应的编码码表索引号)编进码流。因为各A类和B类频带量化频谱的编码相互独立,所以计算获取对应编码码表索引的过程也独立进行。
上述中的量化后频谱信息204模块是根据各频带组的编码码表(编码码表索引信息模块给出)对量化频谱进行编码并形成编码码流。一般情况下,本模块产生的码量在总码流中占的比重最大。
此外,完整的编码码流还包括一些通用辅助信息:如音频采样率、通道个数信息以及码流比特率等。最后对所***流经过格式化处理并最终形成可唯一解码的码流。
图2是本发明的解码器流程图,它通过码流分析器300对码流进行格式化解析,解码器端通过对每帧频谱进行解码、逆量化,然后进行频域信息重构306,它包括经过频→时变换303,时频信号重构304以及通道信号重构305,重构出音频数据,并最终重构出各通道的信号。
首先,进行解码音频流头数据301,进而获得通用解码信息,如采样频率,音频通道数,码流的比特率等。
其次,对每帧的数据进行解码。每帧数据解码的过程中包括解码:1)各Bark频带的量化因子信息201,2)频带组信息202,3)各频带组(A类和B类)对应的编码码表信息302,以及4)各频率子带的编码信息。根据Bark频带量化因子信息可以得到各频率子带对应的量化因子。根据频带组信息202以及频带组对应的编码码表信息302可以得到各频率子带的编码码表信息。根据各频率子带的编码信息和对应的编码码表可完整解码得到量化的频谱数据。根据量化的频谱数据以及对应的量化因子,通过反量化计算得到最终的反量化频谱数据。
其中A类频带解码,参照附图5所示,举如下两个实施例加以说明。
实施例1:假设编码码表为TA_3,码流为:1 0 1 0 1……。首先,根据码表匹配出相应的码字:1 0 1 0,然后得到相应的码值为:4,将码值4转为低位在前高位在后的4比特二进制:0 0 1 0,接下来从码流中取出符号位1(表示为负值),则得到相应4个频率子带的值依次为:0,0,-1,0。
实施例2:假设编码码表为TA_2,码流为:0……。首先,根据码表匹配出相应的码字:0,然后得到相应的码值为:0,将码值0转为低位在前高位在后的3比特二进制:0 0 0。其次,因为均为零,故码流中无符号比特位。从而得到相应3个频率子带的值依次为:0,0,0
其中B类频带解码,参照附图6所示,举如下两个实施例加以说明。
实施例1:假设编码码表为TB_8,码流为:1 1 0 0 0……。首先,根据码表匹配得出相应的码字:1 1 0 0,然后得到相应的码值为:2,其次从码流总取出符号位0(表示为正值),则得到相应频率子带的值为:+2。
实施例2:假设编码码表为TB_21,固定编码长度为3,码流为:1 1 1 1 1 1 0 1 1 1……。首先,根据码表匹配得出相应的码字:1 1 1 11 1,然后得到相应的码值为:15,码值15表示后面还有剩余码流一起用以表示本频率子带的量化谱值,读取后续3个比特长度的码:0 11,为值3,从而得到具体的谱值绝对值为:15+3=18,最后从码流中取出符号位1(表示为负值),则得到相应频率子带的值为:-18。
最后,根据反量化频谱数据,经过频→时变换,重构出音频数据,并根据采样频率以及通道辅助信息最终重构出各通道的一帧信号。重复上述的解码和重构过程,直到解码完所有的数据并结束解码过程。

Claims (16)

1、一种音频编解码器的实现方法,其特征在于:
编码器端:
第一步,编码器端将音频信号做时-频变换,将信号从时域变换到频域,得到非量化频谱数据,
第二步,对所述的非量化频谱数据进行频谱量化,它包括根据所述的非量化频谱数据及目标允许码量,通过迭代方法获得相应最佳的量化因子信息、频带组信息、编码码表索引信息以及量化后的频谱信息,
第三步,计算获得并格式化码流,
第四步,输出格式化码流,
解码器端:
通过对码流格式化解析,对每帧频谱进行解码、逆量化,经过频→时变换并重构出时域音频数据,并最终重构出各通道的时域信号。
2、如权利要求1所述的一种音频编解码器的实现方法,其特征在于,第二步还包括:
首先,根据量化后的频谱数据,计算得出总使用的编码数据量,
然后,将其与期望数据量进行比较,如果不符合期望要求,则调整量化因子,改变量化因子信息,进而改变各量化频谱数据、调整频带组信息及相应的编码码表,并重新计算总使用的编码数据量、如此重复迭代,直到满足期望数据量,
最后计算得出格式化码流。
3、如权利要求1或2所述的一种音频编解码器的实现方法,其特征在于,所述量化因子的编码采用偏移量和差分编码的方式进行。
4、如权利要求1所述的一种音频编解码器的实现方法,其特征在于,所述的频带组至少包括一个频带组,最多不超过四个频带组。
5、如权利要求1或4所述的一种音频编解码器的实现方法,其特征在于,所述的每个频带组由相邻的A类频带和B类频带组成。
6、如权利要求5所述的一种音频编解码器的实现方法,其特征在于,在所述A类频带中,所有频率子带的最大量化绝对值为1,每个频率子带的量化值只能为{+1,0,-1}中的一个。
7、如权利要求5所述的一种音频编解码器的实现方法,其特征在于,在所述B类频带中,所有量化频率子带绝对值的最大值大于1,但可以含有绝对值小于或等于1的频率子带。
8、如权利要求5所述的一种音频编解码器的实现方法,其特征在于,当所有量化频率子带的最大绝对值为1时,在所述B类频带中频率子带量化绝对值的最大值也可以是1。
9、如权利要求5所述的一种音频编解码器的实现方法,其特征在于,在对所述A类频带进行编码中,采用总共4个A类码表中的1个进行编码,并且同一个频带采用同一个码表。
10、如权利要求6所述的一种音频编解码器的实现方法,其特征在于,在对所述A类频带进行编码中,采用总共4个A类码表中的1个进行编码,并且同一个频带采用同一个码表。
11、如权利要求5所述的一种音频编解码器的实现方法,其特征在于,在对所述B类频带进行编码中,采用总共22个B类码表中的1个进行编码,并且同一个频带采用同一个码表。
12、如权利要求7或8所述的一种音频编解码器的实现方法,其特征在于,在对所述B类频带进行编码中,采用总共22个B类码表中的1个进行编码,并且同一个频带采用同一个码表。
13、如权利要求1所述的一种音频编解码器的实现方法,其特征在于,所述频谱量化是基于临界频带进行,同一个临界频带内所有频率子带采用相同的量化因子,且量化步长为
14、如权利要求9或10所述的一种音频编解码器的实现方法,其特征在于,其中所述的4个A类码表分别为TA_0、TA_1、TA_2、TA_3表,TA_0表:码为0、1,其对应的码值为0、1;TA_1表:码为0、10、110、111,其对应的码值为0、1、2、3;TA_2表:码为0、100、101、11100、110、11101、11110、11111,其对应的码值为0、1、2、3、4、5、6、7;TA_3表:码为0、1000、1001、11000、1010、11001、11010、111011、1011、11011、11100、111100、111010、111101、111110、111111,其对应的码值为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15。
15、如权利要求11或12所述的一种音频编解码器的实现方法,其特征在于,其中所述的22个B类码表依次为TB_0、TB_1、TB_2......、TB_20、TB_21,其对应码表能表示的最大值分别为2、2、2、8、3、3、4、4、5、5、6、6、7、7、8、8、9、9、11、11、13、15;其中TB_8表,码为:0、10、1100、1101、1110、1111,其对应的码值为:0、1、2、3、4、5;TB_21表,码为:00、01、100、101、1100、11010、110110、110111、111000、111001、111010、111011、111100、111101、111110、111111,其对应的码值为:0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15。
16、如权利要求13所述的一种音频编解码器的实现方法,其特征在于,所述的临界频带的带宽分布为:在采样率为32kHz时,临界频带数为20个,各临界频带对应的带宽为6、6、6、6、6、6、9、13、17、21、25、28、32、36、40、43、47、51、55、59,总带宽为512;在采样率为44.1kHz时,临界频带数为21个,各临界频带对应的带宽为4、4、4、4、4、6、8、11、13、16、18、21、24、26、29、31、34、36、39、41、44,总带宽为417;在采样率为48kHz时,临界频带数为21个,各临界频带对应的带宽为4、4、4、4、5、7、9、11、13、15、17、20、22、24、26、28、30、32、34、36、39,总带宽为384。
CNB2005100283020A 2005-07-29 2005-07-29 一种音频编解码器的实现方法 Expired - Fee Related CN100539437C (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CNB2005100283020A CN100539437C (zh) 2005-07-29 2005-07-29 一种音频编解码器的实现方法
US11/458,143 US20070027677A1 (en) 2005-07-29 2006-07-18 Method of implementation of audio codec

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100283020A CN100539437C (zh) 2005-07-29 2005-07-29 一种音频编解码器的实现方法

Publications (2)

Publication Number Publication Date
CN1905373A true CN1905373A (zh) 2007-01-31
CN100539437C CN100539437C (zh) 2009-09-09

Family

ID=37674532

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100283020A Expired - Fee Related CN100539437C (zh) 2005-07-29 2005-07-29 一种音频编解码器的实现方法

Country Status (2)

Country Link
US (1) US20070027677A1 (zh)
CN (1) CN100539437C (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102341846A (zh) * 2009-03-04 2012-02-01 韩国科亚电子股份有限公司 用于音频编码的量化
CN101689369B (zh) * 2007-04-12 2013-03-06 三星电子株式会社 用于编码和解码分音的幅度的方法和装置
CN105518776A (zh) * 2013-07-22 2016-04-20 弗劳恩霍夫应用研究促进协会 用于使用重构频带的能量信息值对音频信号进行解码或编码的设备及方法
CN111081263A (zh) * 2019-12-31 2020-04-28 北京百瑞互联技术有限公司 一种优化音频编解码器存储空间的方法及***
WO2022267754A1 (zh) * 2021-06-22 2022-12-29 腾讯科技(深圳)有限公司 语音编码、语音解码方法、装置、计算机设备和存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US7487193B2 (en) * 2004-05-14 2009-02-03 Microsoft Corporation Fast video codec transform implementations
US7689052B2 (en) * 2005-10-07 2010-03-30 Microsoft Corporation Multimedia signal processing using fixed-point approximations of linear transforms
US8942289B2 (en) * 2007-02-21 2015-01-27 Microsoft Corporation Computational complexity and precision control in transform-based digital media codec
WO2010053287A2 (en) * 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CN102419978B (zh) * 2011-08-23 2013-03-27 展讯通信(上海)有限公司 音频解码器、音频解码的频谱重构方法及装置
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5768629A (en) * 1993-06-24 1998-06-16 Discovision Associates Token-based adaptive video processing arrangement
US5664057A (en) * 1993-07-07 1997-09-02 Picturetel Corporation Fixed bit rate speech encoder/decoder
JP3900000B2 (ja) * 2002-05-07 2007-03-28 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP4212591B2 (ja) * 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689369B (zh) * 2007-04-12 2013-03-06 三星电子株式会社 用于编码和解码分音的幅度的方法和装置
CN102341846A (zh) * 2009-03-04 2012-02-01 韩国科亚电子股份有限公司 用于音频编码的量化
CN102341846B (zh) * 2009-03-04 2013-09-25 韩国科亚电子股份有限公司 用于音频编码器的量化方法和装置
US10593345B2 (en) 2013-07-22 2020-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US10847167B2 (en) 2013-07-22 2020-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10276183B2 (en) 2013-07-22 2019-04-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10311892B2 (en) 2013-07-22 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding audio signal with intelligent gap filling in the spectral domain
CN105518776B (zh) * 2013-07-22 2019-06-14 弗劳恩霍夫应用研究促进协会 用重构频带能量信息值解码或编码音频信号的设备及方法
US10332531B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10332539B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellscheaft zur Foerderung der angewanften Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10347274B2 (en) 2013-07-22 2019-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10515652B2 (en) 2013-07-22 2019-12-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
CN105518777B (zh) * 2013-07-22 2020-01-31 弗劳恩霍夫应用研究促进协会 用频谱域智能间隙填充编码或解码音频信号的设备及方法
US10573334B2 (en) 2013-07-22 2020-02-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
CN105518776A (zh) * 2013-07-22 2016-04-20 弗劳恩霍夫应用研究促进协会 用于使用重构频带的能量信息值对音频信号进行解码或编码的设备及方法
US11996106B2 (en) 2013-07-22 2024-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN105518777A (zh) * 2013-07-22 2016-04-20 弗劳恩霍夫应用研究促进协会 在频谱域中使用智能间隙填充对音频信号进行编码或解码的设备及方法
US10984805B2 (en) 2013-07-22 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11049506B2 (en) 2013-07-22 2021-06-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US11222643B2 (en) 2013-07-22 2022-01-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US11250862B2 (en) 2013-07-22 2022-02-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US11257505B2 (en) 2013-07-22 2022-02-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11289104B2 (en) 2013-07-22 2022-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11922956B2 (en) 2013-07-22 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11769512B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11735192B2 (en) 2013-07-22 2023-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11769513B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
CN111081263B (zh) * 2019-12-31 2022-04-15 北京百瑞互联技术有限公司 一种优化音频编解码器存储空间的方法及***
CN111081263A (zh) * 2019-12-31 2020-04-28 北京百瑞互联技术有限公司 一种优化音频编解码器存储空间的方法及***
WO2022267754A1 (zh) * 2021-06-22 2022-12-29 腾讯科技(深圳)有限公司 语音编码、语音解码方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
US20070027677A1 (en) 2007-02-01
CN100539437C (zh) 2009-09-09

Similar Documents

Publication Publication Date Title
CN100539437C (zh) 一种音频编解码器的实现方法
US6636830B1 (en) System and method for noise reduction using bi-orthogonal modified discrete cosine transform
CN101055720B (zh) 对音频信号编码和解码的方法和设备
CN1135721C (zh) 音频信号编码方法及其有关设备
CN101521014B (zh) 音频带宽扩展编解码装置
Quackenbush et al. Noiseless coding of quantized spectral components in MPEG-2 Advanced Audio Coding
CN101030373A (zh) 使用自适应掩蔽阈值的立体声感知音频编码的***和方法
EP2054883B1 (en) Audio encoding system
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
CN100561576C (zh) 一种基于量化信号域的立体声及多声道编解码方法与***
CN1196611A (zh) 可变规模语音编码/解码的方法和装置
CN1735925A (zh) 使用网格降低mpeg-2高级音频编码的比例因子传输成本
WO2005096274A1 (fr) Dispositif et procede de codage/decodage audio ameliores
WO1998000837A1 (fr) Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio
CN105702258A (zh) 用于对音频信号进行编码和解码的方法及设备
CN1262990C (zh) 利用谐波提取的音频编码方法和设备
CN102365680A (zh) 音频信号的编码和解码方法及其装置
KR20080102027A (ko) 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
CN106373583A (zh) 基于理想软阈值掩模irm的多音频对象编、解码方法
Drweesh et al. Audio compression based on discrete cosine transform, run length and high order shift encoding
CN101105940A (zh) 音频编解码的量化方法、反变换方法及音频编解码装置
CN1487746A (zh) 编码或解码音频信号的方法和设备
CN1154084C (zh) 一种基于伪小波滤波的音频编/解码方法
CN1273955C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
CN1318904A (zh) 一种实用的基于小波变换的声音编解码器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: KUNSHAN JADE TECHNOLOGIES CO., LTD.

Free format text: FORMER OWNER: SHANGHAI JADE TECHNOLOGIES CO., LTD.

Effective date: 20100719

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 201203 BUILDING 16, NO.115, LANE 572, BIBO ROAD, PUDONG NEW AREA, SHANGHAI CITY TO: 215311 TOWER ABCD, 12/F, SOUTH BUILDING, KUNSHANPUDONG SOFTWARE PARK, BACHENG TOWN, KUNSHAN CITY

TR01 Transfer of patent right

Effective date of registration: 20100719

Address after: A ABCD 12 layer 215311 town Kunshan city Kunshan Pudong Software Park South

Patentee after: Shanghai Jade Technologies Co., Ltd.

Address before: 201203 Building No. 115, No. 572, Lane 16, blue wave road, Shanghai, Pudong New Area

Patentee before: Shanghai Jiede Microelectronic Co., Ltd.

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090909

Termination date: 20120729