CN103119649A - 用于基于上下文进行无损编码和解码的方法和设备 - Google Patents
用于基于上下文进行无损编码和解码的方法和设备 Download PDFInfo
- Publication number
- CN103119649A CN103119649A CN2011800455124A CN201180045512A CN103119649A CN 103119649 A CN103119649 A CN 103119649A CN 2011800455124 A CN2011800455124 A CN 2011800455124A CN 201180045512 A CN201180045512 A CN 201180045512A CN 103119649 A CN103119649 A CN 103119649A
- Authority
- CN
- China
- Prior art keywords
- msb
- symbol
- lsb
- tuple
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000003595 spectral effect Effects 0.000 claims description 58
- 230000001174 ascending effect Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 11
- 238000011002 quantification Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供一种基于上下文进行无损编码和解码的方法和设备。根据实施例,通过调整MSB的符号并对MSB的符号进行编码,编码效率可被提高。根据实施例,通过使用位于与所述MSB的符号紧邻的符号来估计初始缩放信息,编码效率可被提高。
Description
技术领域
下面的描述涉及一种基于上下文对量化的频谱系数进行编码和解码的方法和设备。
背景技术
音频信号通常在频域被编码和解码。高级音频编码(AAC)可被用作代表性示例。AAC编解码器可被用作示例。AAC编解码器可执行用于将时域转换为频域的改进离散余弦变换(MDCT),并可从心理声学角度使用信号的掩蔽程度来执行频谱量化。为了进一步压缩执行的量化结果,无损压缩方案可被应用。AAC可使用霍夫曼编码方案作为无损压缩方案。应用算术编码方案代替霍夫曼编码方案来作为无损压缩方案的位片算数编码(BSAC)编解码器可被使用。
当无损编码的对象被进一步检查时,量化的频谱系数的量化值可被视为符号,并且可针对所述符号执行无损编码。可通过将位平面上的量化的谱系数的值映射到压缩位(pack bits)来执行编码。在基于上下文执行无损编码的情况下,可基于先前帧的信息来执行无损编码。因此,期望有效地执行无损编码。
发明内容
在一个总体方面,提供一种编码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码。所述编码设备包括:处理器,用于控制一个或多个处理器可执行单元;重新排列单元,用于重新排列MSB的符号;顺序信息编码器,用于对MSB的符号之间的顺序信息进行编码。
在另一总体方面,提供一种解码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码。所述解码设备包括:处理器,用于控制一个或多个处理器可执行单元;MSB解码器,用于对编码的MSB的符号进行解码;顺序信息解码器,用于基于解码的MSB的符号来对所述符号之间的顺序信息进行解码;调整单元,用于基于所述顺序信息来调整MSB的符号。
在另一总体方面,提供一种编码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码。所述编码设备包括:处理器,用于控制一个或多个处理器可执行单元;缩放信息估计单元,用于估计与MSB的符号相关的初始缩放信息。
在另一总体方面,提供一种解码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码。所述解码设备包括:处理器,用于控制一个或多个处理器可执行单元;缩放信息估计单元,用于估计与MSB的符号相关的初始缩放信息。
在另一总体方面,提供一种将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码的编码方法。所述编码方法包括:按照值的升序来重新排列MSB的符号;当MSB的符号的值彼此不同时,由处理器对所述MSB的符号之间的顺序信息进行编码。
在另一总体方面,提供一种将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码的解码方法。所述解码方法包括:对编码的MSB的符号进行解码;基于解码的MSB的符号,由处理器对所述符号之间的顺序信息进行解码;基于所述顺序信息来调整所述MSB的符号。
在另一总体方面,提供一种将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码的编码方法。所述编码方法包括:由处理器估计与MSB的符号相关的初始缩放信息。
在另一总体方面,提供一种将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码的解码方法。所述解码方法包括:由处理器估计与MSB的符号相关的初始缩放信息。
根据实施例,通过重新排列MSB的符号的顺序并对顺序信息进行编码,将被编码的MSB的符号的数量可被减少,以提高编码效率。
根据实施例,通过估计初始缩放信息,用于对转义码进行编码而消耗的比特的数量可被减少,以提高编码效率。
通过下面的详细描述、附图和权利要求,其他特征和方面将是清楚的。
附图说明
图1是示出编码设备的配置的示例的示图;
图2是示出解码设备的配置的示例的示图;
图3是示出编码设备的配置的另一示例的示图;
图4是示出解码设备的配置的另一示例的示图;
图5是示出包括频谱系数的矢量的示例的示图;
图6是示出与上下文模式相关的紧邻位置处的符号的示例的示图;
图7是示出重新排列最高有效位(MSB)的符号的处理的示例的示图;
图8是示出编码方法的配置的示例的流程图;
图9是示出解码方法的配置的示例的流程图;
图10是示出编码方法的配置的另一示例的流程图;
图11是示出解码方法的配置的另一示例的流程图;
在整个附图和详细描述中,除非有其它描述,否则,相同的附图参考标号将被理解为指示相同的元件、特征和结构。为了清楚性、说明性和便利性,这些元件的相对尺寸和描述可被夸大。
具体实施方式
提供下面的详细描述以帮助读者对这里描述的方法、设备和/或***获得全面的理解。因此,这里描述的方法、设备和/或***的各种改变、修改以及等同物将被建议给本领域的普通技术人员。描述的处理步骤和/或操作的进行是示例;然而,和/或操作的顺序不限于在此阐明的顺序,除了必须按照特定的顺序发生的步骤和/或操作以外,所述步骤和/或操作的顺序可如本领域中公知的被改变。此外,为了提高清楚性和简明性,对公知功能和结构的描述可被省略。
图1包括编码设备100的示例。
参照图1,编码设备100可包括,例如,转义码编码器101、重新排列单元102、最高有效位(MSB)编码器103、顺序信息编码器104和最低有效位(LSB)编码器105。编码设备100可将量化的频谱系数构成为至少一个元组,并可将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码。
转义码编码器101可对转义码进行编码。当量化的频谱系数的值偏离预定范围时,编码设备100可考虑到存储空间的限制而缩放量化的频谱系数,使得量化的频谱系数的值可包括在所述预定范围中。这里,转义码可与指示是否针对量化的频谱系数执行缩放的信息相应。
转义码可包括与MSB的符号具有相似级别(level)的概率模型。转义码可在MSB被编码的同时被编码,或者可被单独编码。转义码编码器101可基于缩放被执行的次数来对转义码进行编码。当缩放不再被执行时,可在量化的频谱系数中构成MSB的符号来对MSB的符号进行编码。
重新排列单元102可重新排列MSB的符号。具体地,重新排列单元102可按照升序来重新排列MSB的符号。由于期望被编码的MSB的符号可减少,所以编码效率可被提高。将参照图8对重新排列单元102的操作进行描述。
MSB编码器103可针对重新排列的MSB的符号执行算术编码。例如,MSB编码器103可基于期望被编码的MSB的当前符号,使用与先前帧或当前帧的先前频域相应的紧邻位置处的符号作为上下文来针对当前符号执行基于上下文的编码。MSB编码器103可选择与上下文相应的多个概率模型中的一个来对MSB的符号进行编码。将参照图5到图7对MSB编码器103进行进一步的描述。
顺序信息编码器104可对MSB的符号之间的顺序信息进行编码。例如,当MSB的符号的值彼此不同时,顺序信息编码器104可对所述符号之间的顺序信息进行编码。当MSB的符号的值按照升序被排列时,顺序信息可被设置为例如“0”。当MSB的符号的值按照降序被排列时,顺序信息可被设置为例如“1”。当MSB的符号的值相同时,所述符号之间的顺序信息不需要被编码。顺序信息可按照与MSB的符号被编码的相同方式被编码。
在通过转义码执行缩放之后,残差比特可被产生。LSB编码器105可对与所述残差比特相应的LSB的符号进行编码。
图2包括解码设备200的配置的示例。
图2示出与图1的编码设备100相应的解码设备200。解码设备200可将量化的频谱系数构成为至少一个元组,并可将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码。参照图2,解码设备200可包括,例如,MSB解码器201、顺序信息解码器202、调整单元203和LSB解码器204。
MSB解码器201可通过算术解码来执行确定符号是对应于转义码还是对应于MSB的符号的解码。
当转义码和MSB的符号包括相同级别的符号时,MSB解码器201可基于期望被解码的MSB的当前符号,使用与先前帧或当前帧的先前频域相应的紧邻位置处的符号作为上下文来针对当前符号执行基于上下文的解码。
相反,当转义码和MSB的符号包括不同级别的符号时,解码设备200可对转义码进行解码,并可按照与转义码的解码被执行的次数相同的次数缩放MSB的符号。MSB解码器201可对缩放的MSB的符号进行解码。
顺序信息解码器202可基于MSB的符号对符号之间的顺序信息进行解码。在这种情况下,当MSB的符号彼此不同时,顺序信息解码器202可对符号之间的顺序信息进行解码。相反,当MSB的符号相同时,对符号之间的顺序信息进行解码的操作可被省略。
例如,顺序信息解码器202可按照与对MSB的符号进行解码的相同方案进行解码。顺序信息解码器202可基于紧邻位置处的量化的频谱系数来构成上下文,并可基于所述上下文来选择多个概率模型中的一个以对顺序信息进行解码。
调整单元203可基于解码的顺序信息来调整MSB的符号。当所述MSB的符号被缩放的次数与转义码的解码已经被执行的次数相同时,LSB解码器204可对LSB的符号进行解码,并且随后将解码的LSB的符号与缩放的MSB的符号相加。最终的频谱系数可被恢复。
图3包括编码设备300的另一示例。
参照图3,编码设备300可包括,例如,缩放信息估计单元301、转义码编码器302、MSB编码器303和LSB编码器304。在这种情况下,编码设备300可将量化的频谱系数构成为至少一个元组,并可将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码。
缩放信息估计单元301可估计与MSB的符号相关的初始缩放信息。
例如,缩放信息估计单元301可基于上下文模式来估计初始缩放信息。所述上下文模式与位于与MSB的符号紧邻处的符号的相对位置信息相应,其中,所述MSB的符号基于期望被当前编码的MSB的符号。在这种情况下,紧邻位置处的符号可基于与期望被当前编码的MSB的符号相应的当前帧,与对应于先前帧或当前帧的先前频域的符号相应。
上下文模式可指示将被用于估计初始缩放信息的紧邻位置处的符号与期望被当前编码的符号之间的相对位置信息。上下文模式可每帧被发送一次。上下文模式可被分配到低频域和高频域中的每一个,并且可通过打包分配的上下文模式一次一个地被发送。
例如,缩放信息估计单元301可基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。具体地,缩放信息估计单元301可基于上下文模式来确定用于估计初始缩放信息的谱系数,并可基于确定的谱系数来估计所述初始缩放信息。例如,当矢量包括单个频谱系数时,两个上下文模式可被使用。当上下文模式与“0”相应时,缩放信息估计单元301可使用与先前帧的相同频域相应的量化的频谱系数。当上下文模式与“1”相应时,缩放信息估计单元301可使用与当前帧的先前频域相应的量化的频谱系数。
例如,缩放信息单元301可基于下面示出的伪码来估计初始缩放信息。
这里,“ctx”可指示基于上下文模式确定的量化的频谱系数的值,“lev_ctx”可与指示用于将“ctx”改变为MSB的符号而执行的缩放的次数的信息相应。在这种情况下,当“lev_ctx”的值大于或等于“2”时,初始缩放信息可被估计为“1”。
根据实施例,通过估计初始缩放信息,用于对转义码进行编码而消耗的比特数可被减少,以提高编码效率。
转义码编码器302可针对MSB的符号确定基于初始缩放信息缩放的量化的频谱系数是否偏离预定范围,以对转义码进行编码。频谱系数可被缩放与转义码的编码被执行的次数相同的次数。
当缩放不再执行时,MSB编码器303可对缩放的MSB的符号进行编码。LSB编码器304的操作可与参照图1描述的LSB编码器105相同。
可通过LSB编码器304对与在缩放处理中产生的残差比特相应的LSB进行。LSB编码器304的操作可与参照图1描述的LSB编码器105相同。
图4包括解码设备400的另一示例。
参照图4,解码设备400可包括,例如,缩放信息估计单元401、MSB解码器402和LSB解码器403。图4的解码设备400可将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码。
缩放信息估计单元401可估计与MSB的符号相关的初始缩放信息。缩放信息估计单元401的操作可与图3的缩放信息估计单元301相同。估计的初始缩放信息可被用于缩放MSB的符号。
例如,当初始缩放信息被估计为“1”时,解码的MSB的符号可按照“1”被缩放。初始缩放信息可与由图3的编码设备300和解码设备400之间的协议确定的值相应。
MSB解码器402可对MSB的符号进行解码。MSB解码器402的操作可与图2的MSB解码器201相同。解码的MSB的符号可被缩放与转义码的解码被执行的次数相同的次数。
LSB解码器403可对LSB的符号进行解码。LSB解码器403的操作可与图2的LSB解码器204相同。可将LSB的符号与缩放的MSB的符号相加来恢复最终解码的频谱系数。
图5包括矢量的示例,其中,所述矢量包括频谱系数。
参照图5,基于频率索引和比特深度示出MSB和LSB。在这种情况下,MSB可指示包括标志(sign)信息的比特。
参照图5,MSB和LSB可通过根据频率索引将量化的频谱系数分组为至少一个单元来构成矢量。每个单元可构成符号,并且MSB和LSB可按照符号单元被编码。在图5中,与LSB的深度相应的“N”可指示级别,并且可基于MSB的缩放被执行的次数来控制。
图6包括与上下文模式相关的紧邻位置处的符号的示例。
根据实施例,位于与MSB的符号604紧邻处的紧邻位置处的符号601、602、603和605可被用于对MSB的符号604进行编码。在这种情况下,所述紧邻位置处的符号601、603和605可与对应于MSB的符号604的先前帧的符号相应,并可指示先前编码的符号。紧邻位置处的符号602可与对应于MSB的符号604的当前帧的先前频域的符号相应,并可指示先前编码的符号。
紧邻位置处的符号601、602、603和605可构成将被用于对MSB的符号604进行编码的上下文。具体地,紧邻位置处的符号601、602、603和605可根据相对位置被设置为上下文模式。可基于与所述上下文模式相应的紧邻位置处的符号来确定将被用于初始缩放信息的符号。
图7包括重新排列MSB的符号的处理的示例。
参照图7,量化的频谱系数可包括两个符号。也就是说,矢量可包括两个量化的频谱系数的符号。符号的数量可不限于两个,两个或更多个符号可被类似地应用。
假定第一符号被设置为x,第二符号被设置为y,并且x和y的绝对值小于或等于4。因此,26(即,5*5+1)种类型的包括转义码的矢量可被表示。根据实施例的图1的重新排列单元102可重新排列MSB的符号。具体地,重新排列单元102可按照值的升序来重新排列MSB的符号。
参照图7,当MSB的符号与(3,1)相应时,也就是说,所述MSB的符号按照降序被排列时,重新排列单元102可将所述MSB的符号重新排列为(1,3)。当MSB的符号按照升序被排列或所述符号的值相同时,重新排列单元102可不重新排列MSB的符号。
在这种情况下,在MSB的符号按照升序被排列的情况下,顺序信息可被设置为“0”,在MSB的符号按照降序被排列的情况下,顺序信息可被设置为“1”。顺序信息可被编码为MSB的符号。在重新排列处理中将被编码的MSB的符号可包括(0,0)、(0,1)、(0,2)、(0,3)、(0,4)、(1,1)、(1,2)、(1,3)、(1,4)、(2,2)、(2,3)、(2,4)、(3,3)、(3,4)、(4,4)。即使不对所有的25个类型的MSB的符号进行编码,通过对顺序信息和15个被列出的类型的MSB的符号进行编码可得到相同的结果。通过改变MSB的符号的构成方案,用于存储编码的结果的存储空间可被减少。
图8包括编码方法的示例。
量化的频谱系数可被分为MSB和LSB来对所述MSB和所述LSB进行编码,例如,由根据实施例的图1的编码设备100对所述MSB和所述LSB进行编码。
在操作801,转义码可被编码,例如,可由编码设备100对转义码进行编码。当量化的频谱系数的值偏离预定范围时,编码设备100可考虑到存储空间的限制缩放量化的频谱系数,使得量化的频谱系数的值可包括在所述预定范围中。在这种情况下,转义码可与指示是否针对量化的频谱系数执行缩放的信息相应。具体地,将被缩放的目标可与量化的频谱系数中的MSB相应。
在操作802,MSB的符号可被重新排列,例如,可由编码设备100重新排列MSB的符号。具体地。编码设备100可按照所述符号的值的升序来重新排列所述MSB的符号。由于将被编码的MSB的符号被减少,因此编码效率可被提高。
在操作803,可针对重新排列的MSB的符号执行算术编码,例如,可由编码设备100针对重新排列的MSB的符号执行算术编码。例如,编码设备100可基于期望被编码的当前符号,使用与先前帧或当前帧的先前频域相应的紧邻位置处的符号作为上下文来针对当前符号执行基于上下文的编码。编码设备100可选择与所述上下文相应的多个概率模型中的一个来对所述MSB的符号进行编码。
在操作804,可在MSB的符号之间对顺序信息进行编码,例如,可由编码设备100在MSB的符号之间对顺序信息进行编码。例如,当MSB的符号的值彼此不同时,编码设备100可对所述符号之间的顺序信息进行编码。当MSB的符号的值相同时,符号之间的顺序信息不需要被编码。所述顺序信息可按照与对MSB的符号进行编码的相同方式被编码。
在通过转义码执行缩放之后,残差比特可被产生。在操作805,与所述残差比特相应的LSB的符号可被编码,例如,可由编码设备100对与所述残差比特相应的LSB的符号进行编码。
图9包括解码方法的示例。
在操作901,可通过算术解码执行确定符号是与转义码相应还是与MSB的符号相应的解码,例如,可由图2的解码设备200执行所述解码。
当转义码和MSB的符号包括相同级别的符号时,解码设备200可基于期望被解码的当前符号,使用与先前帧或当前帧的先前频域相应的紧邻位置处的符号作为上下文来针对当前符号执行基于上下文的解码。
相反,当转义码和MSB的符号包括不同级别的符号时,所述转义码可被解码,例如,可由解码设备200对转义码进行解码,并且可将所述MSB的符号缩放与所述转义码的解码被执行的次数相同的次数。解码设备200可对缩放的MSB的符号进行解码。
在操作902,可基于MSB的符号在符号之间对顺序信息进行解码,例如,可由解码设备200基于MSB的符号在所述符号之间对顺序信息进行解码。在这种情况下,当MSB的符号彼此不同时,解码设备200可对符号之间的顺序信息进行解码。
在操作903,可基于已解码的顺序信息来调整MSB的符号,例如,可由解码设备200基于已解码的顺序信息来调整所述MSB的符号。当MSB的符号被缩放的次数与转义码的解码被执行的次数相同时,在操作904,解码设备200可对LSB的符号进行解码,并随后将解码的LSB的符号与缩放的MSB的符号相加。因此,可恢复最终的频谱系数。
图10包括编码方法的另一示例。
在操作1001,与MSB的符号相关的初始缩放信息可被估计,例如,可由图3的编码设备300估计所述初始缩放信息。
例如,可由例如图3的编码设备300基于上下文模式估计初始缩放信息,其中,所述上下文模式与位于与基于期望被编码的MSB的符号的MSB的符号紧邻处的符号的相对位置信息相应。在这种情况下,紧邻位置处的符号可基于与期望被当前编码的MSB的符号相应的当前帧,对应于与先前帧或当前帧的先前频域相应的符号。
例如,可基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息,例如,可由编码设备300基于通过上下文模式确定的紧邻位置处的符号的大小来估计所述初始缩放信息。具体地,编码设备300可基于上下文模式确定用于估计初始缩放信息的谱系数,并且可基于确定的谱系数来估计初始缩放信息。
在操作1002,可针对MSB的符号确定基于初始缩放信息缩放的量化的频谱系数是否偏离预定的范围来对转义码进行编码,例如,由编码设备300对转义码进行编码。频谱系数可被缩放与所述转义码的编码被执行的次数相同的次数。
在操作1003,缩放的MSB的符号可被编码,例如,可由图3的编码设备300对缩放的MSB的符号进行编码。在操作1004,与在缩放处理中产生的残差比特相应的LSB可被编码,例如,可由编码设备300对与在缩放处理中产生的残差比特相应的LSB进行编码。
图11包括解码方法的另一示例。
在操作1101,与MSB的符号相关的初始缩放信息可被估计,例如,可由图4的解码设备400估计与MSB的符号相关的初始缩放信息。估计的初始缩放信息可被用于缩放MSB的符号。例如,解码设备400可基于与位于与MSB的符号紧邻处的符号的相对位置信息相应的上下文模式来估计初始缩放信息,其中,所述MSB的符号基于期望被当前编码的MSB的符号。
在操作1102,MSB的符号可被解码,例如,可由图4的解码设备400对MSB的符号进行解码。解码的MSB的符号可被缩放与转义码的解码被执行的次数相同的次数。
在操作1103,解码设备400可对LSB的符号进行解码,例如,由解码设备400执行所述解码。可将LSB的符号与缩放的MSB的符号相加来恢复最终解码的频谱系数。
上述包括对量化的频谱系数进行编码和解码的方法的处理、功能、方法和/或软件可被记录、存储或固定在一个或多个非瞬时性计算机可读存储介质或处理器可读存储介质中,其中,所述非瞬时性计算机可读存储介质或处理器可读存储介质包括将由计算机实施的程序指令以促使处理器运行或执行所述程序指令。所述介质还可单独包括数据文件和数据结构等,或者可包括与程序指令结合的数据文件和数据结构等。所述介质和程序指令可以是特别设计和构造的程序指令,或者它们可以是对计算机软件领域的技术人员而言公知的且可用的种类的程序指令。这里描述的包括对量化的频谱系数进行编码和解码的方法的方法可在通用计算机或处理器上被执行,或者可在诸如这里描述的编码设备和解码设备的特定机器上被执行。
计算机可读介质或处理器可读介质的示例包括:磁介质(诸如硬盘、软盘和磁带)、光介质(诸如CD-ROM盘和DVD)、磁光介质(诸如光盘)以及专门配置为存储和执行程序指令的硬件装置(诸如只读存储器(ROM),随机存取存储器(RAM)、闪存等)。程序指令的示例包括机器代码(诸如由编译器产生的代码)和包含可由计算机或处理器使用解释器执行的更高级代码的文件两者。
描述的硬件单元可被配置为充当一个或多个软件模块,以便执行上述实施例的操作。这里描述的软件模块中的任何一个或多个可由对于所述单元唯一的专用处理器执行,或者可由对于一个或多个模块共有的处理器执行。
上面已经描述了多个示例。然而,应该理解,可进行各种修改。例如,如果以不同的顺序执行描述的技术和/或如果描述的***、架构、装置或电路中的部件以不同的方式组合和/或由其它的部件或其等同物代替或补充,可实现合适的结果。因此,其它实施方式在权利要求的范围内。
Claims (20)
1.一种编码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码,所述编码设备包括:
处理器,用于控制一个或多个处理器可执行单元;
重新排列单元,用于重新排列MSB的符号;
顺序信息编码单元,用于对MSB的符号之间的顺序信息进行编码。
2.如权利要求1所述的编码设备,其中,所述重新排列单元按照值的升序来重新排列MSB的符号。
3.如权利要求1所述的编码设备,其中,当MSB的符号的值彼此不同时,所述顺序信息编码单元对所述MSB的符号之间的顺序信息进行编码。
4.一种解码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行解码,所述解码设备包括:
处理器,用于控制一个或多个处理器可执行单元;
MSB解码器,用于对编码的MSB的符号进行解码;
顺序信息解码器,用于基于解码的MSB的符号来对所述符号之间的顺序信息进行解码;
调整单元,用于基于顺序信息来调整MSB的符号。
5.如权利要求4所述的解码设备,其中,当解码的MSB的符号彼此不同时,所述顺序信息解码器对解码的MSB的符号之间的顺序信息进行解码。
6.一种编码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码,所述编码设备包括:
处理器,用于控制一个或多个处理器可执行单元;
缩放信息估计单元,用于估计与MSB的符号相关的初始缩放信息。
7.如权利要求6所述的编码设备,其中,所述缩放信息估计单元基于与位于与MSB的符号紧邻处的符号的相对位置信息相应的上下文模式来估计初始缩放信息,其中,所述MSB的符号基于期望被当前编码的MSB的符号。
8.如权利要求7所述的编码设备,其中,所述缩放信息估计单元基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。
9.一种解码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行解码,所述解码设备包括:
处理器,用于控制一个或多个处理器可执行单元;
缩放信息估计单元,用于估计与MSB的符号相关的初始缩放信息。
10.如权利要求9所述的解码设备,其中,所述缩放信息估计单元基于与位于与MSB的符号紧邻处的符号的相对位置信息相应的上下文模式来估计初始缩放信息,其中,所述MSB的符号基于期望被当前解码的MSB的符号。
11.如权利要求10所述的解码设备,其中,所述缩放信息估计单元基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。
12.一种将量化的频谱系数构成为至少一个元组并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码的编码方法,所述编码方法包括:
按照值的升序重新排列MSB的符号;
当MSB的符号的值彼此不同时,由处理器对MSB的符号之间的顺序信息进行编码。
13.一种将量化的频谱系数构成为至少一个元组并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行解码的解码方法,所述解码方法包括:
对编码的MSB的符号进行解码;
基于解码的MSB的符号,由处理器对所述符号之间的顺序信息进行解码;
基于解码的顺序信息来调整MSB的符号。
14.如权利要求13所述的解码方法,其中,对所述符号之间的顺序信息进行解码的步骤包括:当所述符号彼此不同时,对解码的MSB的符号之间的顺序信息进行解码。
15.一种将量化的频谱系数构成为至少一个元组并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码的编码方法,所述编码方法包括:
由处理器估计与MSB的符号相关的初始缩放信息。
16.如权利要求15所述的编码方法,其中,估计的步骤包括:基于与位于与MSB的符号紧邻处的符号的相对位置信息相应的上下文模式来估计初始缩放信息,其中,所述MSB的符号基于期望被当前编码的MSB的符号。
17.如权利要求16所述的编码方法,其中,估计的步骤包括:基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。
18.一种将量化的频谱系数构成为至少一个元组并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行解码的解码方法,所述解码方法包括:
由处理器估计与MSB的符号相关的初始缩放信息。
19.如权利要求18所述的解码方法,其中,估计的步骤包括:基于与位于与MSB的符号紧邻处的符号的相对位置信息相应的上下文模式来估计初始缩放信息,其中,所述MSB的符号基于期望被当前解码的MSB的符号。
20.如权利要求19所述的编码方法,其中,估计的步骤包括:基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2010-0070611 | 2010-07-21 | ||
KR1020100070611A KR101676477B1 (ko) | 2010-07-21 | 2010-07-21 | 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법 |
PCT/KR2011/005367 WO2012011748A2 (en) | 2010-07-21 | 2011-07-21 | Method and apparatus for lossless encoding and decoding based on context |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103119649A true CN103119649A (zh) | 2013-05-22 |
CN103119649B CN103119649B (zh) | 2015-05-20 |
Family
ID=45493598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180045512.4A Expired - Fee Related CN103119649B (zh) | 2010-07-21 | 2011-07-21 | 用于基于上下文进行无损编码和解码的方法和设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8487789B2 (zh) |
EP (1) | EP2596495A4 (zh) |
KR (1) | KR101676477B1 (zh) |
CN (1) | CN103119649B (zh) |
WO (1) | WO2012011748A2 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101766457B1 (ko) | 2015-02-12 | 2017-08-08 | 두산중공업 주식회사 | 막오염 지수 측정 장치 |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1133512A (zh) * | 1994-09-30 | 1996-10-16 | 株式会社理光 | 编码与解码数据的方法和装置 |
CN1681213A (zh) * | 2004-03-10 | 2005-10-12 | 三星电子株式会社 | 无损音频编码/解码方法和装置 |
CN1684371A (zh) * | 2004-02-27 | 2005-10-19 | 三星电子株式会社 | 无损音频解码/编码方法和装置 |
CN1945695A (zh) * | 2005-10-04 | 2007-04-11 | 三星电子株式会社 | 对音频信号编码/解码的方法和设备 |
US20080094259A1 (en) * | 2004-07-14 | 2008-04-24 | Agency For Science, Technology And Research | Context-Based Encoding and Decoding of Signals |
US20090112897A1 (en) * | 2007-10-30 | 2009-04-30 | Erik Ordentlich | Data sequence compression |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6217234B1 (en) * | 1994-07-29 | 2001-04-17 | Discovision Associates | Apparatus and method for processing data with an arithmetic unit |
GB9509831D0 (en) * | 1995-05-15 | 1995-07-05 | Gerzon Michael A | Lossless coding method for waveform data |
US20040208169A1 (en) * | 2003-04-18 | 2004-10-21 | Reznik Yuriy A. | Digital audio signal compression method and apparatus |
DK1741093T3 (da) | 2004-03-25 | 2011-09-12 | Dts Inc | Skalérbar, tabsfri audio-codec og authoringsværktøj |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
US7788106B2 (en) * | 2005-04-13 | 2010-08-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Entropy coding with compact codebooks |
KR101237413B1 (ko) | 2005-12-07 | 2013-02-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 |
KR101539256B1 (ko) | 2008-07-15 | 2015-07-30 | 삼성전자주식회사 | 오디오 신호의 중요 주파수 성분들에 대한 위치 정보를부호화/복호화하는 인코더 및 디코더 |
KR101456495B1 (ko) | 2008-08-28 | 2014-10-31 | 삼성전자주식회사 | 무손실 부호화/복호화 장치 및 방법 |
KR101485339B1 (ko) | 2008-09-29 | 2015-01-26 | 삼성전자주식회사 | 무손실 부호화/복호화 장치 및 방법 |
JP4573910B1 (ja) * | 2009-03-17 | 2010-11-04 | エンパイア テクノロジー ディベロップメント エルエルシー | 画像表示システム、画像表示装置、画像提供装置およびその方法 |
-
2010
- 2010-07-21 KR KR1020100070611A patent/KR101676477B1/ko active IP Right Grant
-
2011
- 2011-07-15 US US13/137,025 patent/US8487789B2/en not_active Expired - Fee Related
- 2011-07-21 WO PCT/KR2011/005367 patent/WO2012011748A2/en active Application Filing
- 2011-07-21 EP EP11809875.5A patent/EP2596495A4/en not_active Withdrawn
- 2011-07-21 CN CN201180045512.4A patent/CN103119649B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1133512A (zh) * | 1994-09-30 | 1996-10-16 | 株式会社理光 | 编码与解码数据的方法和装置 |
CN1684371A (zh) * | 2004-02-27 | 2005-10-19 | 三星电子株式会社 | 无损音频解码/编码方法和装置 |
CN1681213A (zh) * | 2004-03-10 | 2005-10-12 | 三星电子株式会社 | 无损音频编码/解码方法和装置 |
US20080094259A1 (en) * | 2004-07-14 | 2008-04-24 | Agency For Science, Technology And Research | Context-Based Encoding and Decoding of Signals |
CN1945695A (zh) * | 2005-10-04 | 2007-04-11 | 三星电子株式会社 | 对音频信号编码/解码的方法和设备 |
US20090112897A1 (en) * | 2007-10-30 | 2009-04-30 | Erik Ordentlich | Data sequence compression |
Also Published As
Publication number | Publication date |
---|---|
WO2012011748A2 (en) | 2012-01-26 |
CN103119649B (zh) | 2015-05-20 |
KR101676477B1 (ko) | 2016-11-15 |
WO2012011748A3 (en) | 2012-04-19 |
US8487789B2 (en) | 2013-07-16 |
EP2596495A4 (en) | 2016-02-17 |
KR20120009837A (ko) | 2012-02-02 |
EP2596495A2 (en) | 2013-05-29 |
US20120020406A1 (en) | 2012-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PT2282310E (pt) | Codificação entrópica por adaptação de modos de codificação entre codificação por nível e codificação por comprimento/nível de sequência | |
BR122021008576B1 (pt) | Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo | |
JP6494741B2 (ja) | 符号化及び復号化のための符号化装置、復号化装置、システム及び方法 | |
JP2019124947A (ja) | スペクトルピーク位置の符号化及び復号化 | |
CN111656443B (zh) | 调适最低有效比特的编码与解码的音频编码器、音频解码器、方法 | |
KR20190040063A (ko) | 인덱스 코딩 및 비트 스케줄링을 갖는 양자화기 | |
JP7389651B2 (ja) | デジタルオーディオ信号における可変アルファベットサイズ | |
CN110870005B (zh) | 编码***和解码*** | |
JP2004258603A (ja) | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 | |
WO2011097963A1 (zh) | 编码方法、解码方法、编码器和解码器 | |
US9425820B2 (en) | Vector quantization with non-uniform distributions | |
CN103119649B (zh) | 用于基于上下文进行无损编码和解码的方法和设备 | |
JP6289627B2 (ja) | 信号の符号化および復号化の方法および装置 | |
KR101456495B1 (ko) | 무손실 부호화/복호화 장치 및 방법 | |
WO2008021185A2 (en) | A method for quantizing speech and audio through an efficient perceptually relevant search of multiple quantization patterns | |
US20110135007A1 (en) | Entropy-Coded Lattice Vector Quantization | |
CN116527943A (zh) | 基于矢量量化索引和生成模型的极限图像压缩方法及*** | |
US8924202B2 (en) | Audio signal coding system and method using speech signal rotation prior to lattice vector quantization | |
US11508386B2 (en) | Audio coding method based on spectral recovery scheme | |
Vasilache | New directions in lattice based lossy compression | |
CN105632505B (zh) | 主成分分析pca映射模型的编解码方法及装置 | |
WO2011129774A1 (en) | Probability table generator, encoder and decoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C53 | Correction of patent of invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Zhu Jixian Inventor after: Wu Yinmei Inventor before: Zhu Jixian |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: ZHU JIXIAN TO: ZHU JIXIAN WU YINMEI |
|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150520 Termination date: 20200721 |