CN115376532A - 一种音频编码、解码方法、装置、设备及存储介质 - Google Patents
一种音频编码、解码方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115376532A CN115376532A CN202110550059.8A CN202110550059A CN115376532A CN 115376532 A CN115376532 A CN 115376532A CN 202110550059 A CN202110550059 A CN 202110550059A CN 115376532 A CN115376532 A CN 115376532A
- Authority
- CN
- China
- Prior art keywords
- coding
- coding table
- encoding
- target
- audio frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 230000003595 spectral effect Effects 0.000 claims abstract description 86
- 238000009826 distribution Methods 0.000 claims description 50
- 238000004590 computer program Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 description 28
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例提供了一种音频编码、解码方法、装置、设备及存储介质,方法包括:确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围;从生成的多种类别对应的编码表中,选择目标类别对应的编码表,作为第一目标编码表;利用第一目标编码表对待编码音频帧的量化谱系数进行编码。可见,本方案中,对不同类别的音频帧采用不同的编码表进行编码,且音频帧的类别划分依据包括量化谱系数的数值范围,也就是说,本方案考虑到了不同量化谱系数特性不同,提高了编码效率。
Description
技术领域
本发明涉及音频技术领域,特别是涉及一种音频编码、解码方法、装置、设备及存储介质。
背景技术
音频编码可以减少音频数据的冗余,方便音频数据的传输及存储。一些相关的音频编码方案中,通常需要生成一套编码表,例如,哈夫曼(Huffman)编码方案中使用的是码书,算术编码(arithmetic coding)方案中使用的是累积概率表,编码表中包括各字节出现的概率,根据该编码表对音频的量化谱系数进行编码。
但是这种方案中,音频的全部量化谱系数均使用相同的编码表进行编码,没有考虑到不同量化谱系数特性不同,导致编码效率较低。
发明内容
本发明实施例的目的在于提供一种音频编码、解码方法、装置、设备及存储介质,以提高编码效率。
为达到上述目的,本发明实施例提供了一种音频编码方法,包括:
确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围;
从生成的多种类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表;
利用所述第一目标编码表对所述待编码音频帧的量化谱系数进行编码。
可选的,音频帧的类别划分依据还包括以下任意一种或多种:码率、内容、平稳性、谐波性;
生成所述多种类别对应的编码表的过程包括:
通过对不同类别音频帧的量化谱系数进行概率分布统计,生成所述多种类别对应的编码表。
可选的,所述通过对不同类别音频帧的量化谱系数进行概率分布统计,生成所述多种类别对应的编码表,包括:
通过对N种码率、M类信号、K种平稳性、L种谐波性信号和P个范围的量化谱系数进行概率分布统计,生成M*K*N*P*L份编码表。
可选的,所述从生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表,包括:
从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表。
可选的,所述从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表之后,还包括:
判断当前时刻与上一次更新第一候选编码表的时刻间隔是否到达预设时长条件;
如果未到达,将所选择的第一候选编码表确定为第一目标编码表;
如果到达,则执行所述通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表的步骤。
可选的,所述从生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表,包括:
从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第二候选编码表;
确定利用所述第一候选编码表进行编码的编码效率,作为第一编码效率;以及确定利用所述第二候选编码表进行编码的编码效率,作为第二编码效率;
若所述第一编码效率大于所述第二编码效率,则将所述第一候选编码表确定为第一目标编码表;
若所述第一编码效率小于所述第二编码效率,则将所述第二候选编码表确定为第一目标编码表。
可选的,所述利用所述第一目标编码表对所述待编码音频帧的量化谱系数进行编码之后,还包括:
将所述第一目标编码表添加至所述待编码音频帧的填充比特部分和/或附加数据部分。
为达到上述目的,本发明实施例还提供了一种音频解码方法,包括:
获取待解码音频帧,所述待解码音频帧为利用上述音频编码方法编码而成;
获取所述待解码音频帧对应的编码表,作为第二目标编码表;
利用所述第二目标编码表对所述待解码音频帧进行解码。
可选的,所述获取所述待解码音频帧对应的编码表,作为第二目标编码表,包括:
从所述待编码音频帧的填充比特部分和/或附加数据部分,读取所述待解码音频帧对应的编码表,作为第二目标编码表。
可选的,所述获取所述待解码音频帧对应的编码表,作为第二目标编码表,包括:
接收编码端发送的编码表,作为第三候选编码表;
通过对当前时间段内待解码音频帧的量化谱系数进行概率分布统计,对所述第三候选编码表进行更新,得到第二目标编码表。
为达到上述目的,本发明实施例还提供了一种音频编码装置,包括:
第一确定模块,用于确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围;
选择模块,用于从生成的多种类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表;
编码模块,用于利用所述第一目标编码表对所述待编码音频帧的量化谱系数进行编码。
可选的,音频帧的类别划分依据还包括以下任意一种或多种:码率、内容、平稳性、谐波性;所述装置还包括:
生成模块,用于通过对不同类别音频帧的量化谱系数进行概率分布统计,生成所述多种类别对应的编码表。
可选的,所述生成模块,具体用于:
通过对N种码率、M类信号、K种平稳性、L种谐波性信号和P个范围的量化谱系数进行概率分布统计,生成M*K*N*P*L份编码表。
可选的,所述选择模块,包括:
选择子模块,用于从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
更新子模块,用于通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表。
可选的,所述装置还包括:
判断模块,用于在所述选择子模块从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表之后,判断当前时刻与上一次更新第一候选编码表的时刻间隔是否到达预设时长条件;如果未到达,触发第二确定模块,如果到达,触发所述更新子模块;
第二确定模块,用于将所选择的第一候选编码表确定为第一目标编码表。
可选的,所述选择模块,具体用于:
从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第二候选编码表;
确定利用所述第一候选编码表进行编码的编码效率,作为第一编码效率;以及确定利用所述第二候选编码表进行编码的编码效率,作为第二编码效率;
若所述第一编码效率大于所述第二编码效率,则将所述第一候选编码表确定为第一目标编码表;
若所述第一编码效率小于所述第二编码效率,则将所述第二候选编码表确定为第一目标编码表。
可选的,所述装置还包括:
添加模块,用于将所述第一目标编码表添加至所述待编码音频帧的填充比特部分和/或附加数据部分。
为达到上述目的,本发明实施例还提供了一种音频解码装置,包括:
第一获取模块,用于获取待解码音频帧,所述待解码音频帧为利用上述音频编码装置编码而成;
第二获取模块,用于获取所述待解码音频帧对应的编码表,作为第二目标编码表;
解码模块,用于利用所述第二目标编码表对所述待解码音频帧进行解码。
可选的,所述第二获取模块,具体用于:
从所述待编码音频帧的填充比特部分和/或附加数据部分,读取所述待解码音频帧对应的编码表,作为第二目标编码表。
可选的,所述第二获取模块,具体用于:
接收编码端发送的编码表,作为第三候选编码表;
通过对当前时间段内待解码音频帧的量化谱系数进行概率分布统计,对所述第三候选编码表进行更新,得到第二目标编码表。
为达到上述目的,本发明实施例还提供了一种电子设备,包括处理器和存储器,其中,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任意一种音频编码方法或音频解码方法。
为达到上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种音频编码方法或音频解码方法。
应用本发明所示实施例,确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围;从生成的多种类别对应的编码表中,选择目标类别对应的编码表,作为第一目标编码表;利用第一目标编码表对待编码音频帧的量化谱系数进行编码。可见,本方案中,对不同类别的音频帧采用不同的编码表进行编码,且音频帧的类别划分依据包括量化谱系数的数值范围,也就是说,本方案考虑到了不同量化谱系数特性不同,提高了编码效率。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种示例性实施例提供的音频编码方法的第一种流程示意图;
图2为本发明一种示例性实施例提供的一种生成编码表的流程示意图;
图3为本发明一种示例性实施例提供的DRA音频帧的结构示意图;
图4为本发明一种示例性实施例提供的音频编码方法的第二种流程示意图;
图5为本发明一种示例性实施例提供的音频解码方法的第一种流程示意图;
图6为本发明一种示例性实施例提供的音频解码方法的第二种流程示意图;
图7为本发明一种示例性实施例提供的音频解码方法的第三种流程示意图;
图8为本发明一种示例性实施例提供的一种音频编码装置的结构示意图;
图9为本发明一种示例性实施例提供的一种音频解码装置的结构示意图;
图10为本发明一种示例性实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本发明保护的范围。
为了达到上述目的,本发明实施例提供了一种音频编码、解码方法、装置、设备及存储介质,该方法及装置可以应用于各种电子设备,电子设备的具体类型不做限定。下面首先对该音频编码方法进行详细介绍。以下方法实施例中的各个步骤按照合乎逻辑的顺序执行即可,步骤标号或者对各步骤进行介绍的先后顺序,并不对各步骤的执行顺序构成限定。
图1为本发明一种示例性实施例提供的音频编码方法的第一种流程示意图,包括:
S101:确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围。
本发明的一种示例性实施例中,可以仅根据音频帧的量化谱系数的数值范围划分音频帧的类别。以Huffman编码为例来说,可以根据每个码书区间最大谱系数划分P个范围,P表示正整数,参考DRA(Digital Rise Audio,数字音频编码技术)中对稳态信号进行编码划分的9个码书。
本发明的其他示例性实施例中,音频帧的类别划分依据还包括以下任意一种或多种:码率、内容、平稳性、谐波性,等等,类别划分依据具体不做限定。这里所说的码率可以为码率范围,或者也可以为码率值,内容可以分为语音类、音乐类、混合类等等,平稳性可以分为瞬态、准瞬态、稳态等等,对于稳态类可以进一步划分信号的谐波性,例如强谐波性、一般谐波性、弱谐波性和非谐波性等等。
S102:从生成的多种类别对应的编码表中,选择目标类别对应的编码表,作为第一目标编码表。
S103:利用第一目标编码表对待编码音频帧的量化谱系数进行编码。
举例来说,如果采用Huffman编码,则这里的编码表即为码书,如果采用算术编码,则这里的编码表即为累计概率表。编码表中包括各字节出现的概率,根据该编码表可以对音频帧的量化谱系数进行编码。
本发明的一种示例性实施例中,生成所述多种类别对应的编码表的过程可以包括:通过对不同类别音频帧的量化谱系数进行概率分布统计,生成所述多种类别对应的编码表。
如上所述,音频帧的类别划分依据可以包括:量化谱系数的数值范围、码率、内容、平稳性、谐波性,等等。本发明的一种示例性实施例中,通过对N种码率、M类信号、K种平稳性、L种谐波性信号和P个范围的量化谱系数进行概率分布统计,生成M*K*N*P*L份编码表。M、K、N、P、L均为正整数。
举例来说,如图2所示,可以采用如下步骤生成多种类别对应的编码表:
S201、首先确定编码端(编码器或编码软件)所支持的N个码率,例如24kbps,32kbps,40kbps,48kbps……或者N个码率范围,例如20~27.999kbps,28~35.999kpbs,36~43.999kbps……
S202、采用分类算法将音频帧分为M类信号,例如语音类、音乐类、混合类等等。
S203、通过信号检测方式对输入的音频帧信号进行平稳性检测,划分为K种平稳性信号,例如瞬态、准瞬态、稳态等等。
S204、如果是稳态信号,进一步划分为L种谐波性信号,例如强谐波性、一般谐波性、弱谐波性和非谐波性等等;如果是非稳态信号,设定L=1。
S205、对N种码率(或码率范围)、M类信号、K种平稳性、L种谐波性信号和P个范围的量化谱系数进行概率分布统计,得到N*M*K*L*P个概率分布。如果采用Huffman编码算法,则进行Huffman码书设计,产生M*K*N*P*L本码书。如果采用算术编码,则计算出M*K*N*P*L个累积概率表。
本发明的一种示例性实施例中,可以预先生成多种类别对应的编码表,本实施例中生成的编码表可以是固定的。
或者,本发明的另一种示例性实施例中,也可以每隔一段时间对生成的编码表进行更新,这种实施例中,S102可以包括:从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表。
本实施例中,可以根据当前时间段量化谱系数的概率分布,产生更匹配当前时间段量化谱系数特性的编码表,利用这种编码表进行编码,进一步提高了编码效率。
本发明的一种示例性实施例中,从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表之后,可以判断当前时刻与上一次更新第一候选编码表的时刻间隔是否到达预设时长条件;如果未到达,将所选择的第一候选编码表确定为第一目标编码表;如果到达,则通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表。
举例来说,可以每隔一段时间T、或者每隔一定帧数Nf(Nf=T/N*Fs,N为待编码音频帧的帧长,也就是样点数表示,Fs为音频采样率),生成新的编码表(也可称为动态编码表),或者说对固定编码表(第一候选编码表)进行更新。如果生成了动态编码表,则采用动态编码表进行编码,如果没有生成,本实施例中,采用固定编码表(第一候选编码表)进行编码,或者其他示例性实施例中,也可以采用上次生成的动态编码表进行编码。
本发明的另一种示例性实施例中,也可以比较固定编码表和更新后的编码表的编码效率,选择编码效率更高的编码表进行编码。本实施例中,S102可以包括:
从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第二候选编码表;
确定利用所述第一候选编码表进行编码的编码效率,作为第一编码效率;以及确定利用所述第二候选编码表进行编码的编码效率,作为第二编码效率;
若所述第一编码效率大于所述第二编码效率,则将所述第一候选编码表确定为第一目标编码表;
若所述第一编码效率小于所述第二编码效率,则将所述第二候选编码表确定为第一目标编码表。
本实施例中,从比较固定编码表和更新后的编码表中选择编码效率更高的编码表进行编码,进一步提高了编码效率。
本发明的一种示例性实施例中,可以将第一目标编码表发送至解码端,以便于解码端利用第一目标编码表进行解码,例如,可以将第一目标编码表添加至所述待编码音频帧的填充比特部分和/或附加数据部分。
如上所述,可以每隔一定帧数Nf、或者每隔一段时间T,生成动态编码表,这种情况下,可以将动态编码表发送至解码端,以便于解码端利用动态编码表进行解码。或者,也可以将固定编码表发送至解码端,解码端通过对当前时间段内待解码音频帧的量化谱系数进行概率分布统计,对接收到的固定编码表进行更新,得到动态编码表,再利用动态编码表进行解码,这样,只需要传输固定编码表即可,不需要实时传输动态编码表,节省了传输资源。
下面对传输方式进行介绍,举例来说,当编码模式为CBR((Constant Bitrate)即固定码率)模式时,可以采取如下两种传输方式,以图3所示的DRA(Digital Rise Audio,数字音频编码技术)音频帧的结构为例进行说明,其他编码方式下的音频帧的结构类似,如图3所示,音频帧中包括同步字、帧头信息、多个声道(声道0、声道1、声道2……声道n)、填充比特和附加数据,其中帧头信息包括帧头类型、帧长、每帧块数、采样率索引、声道数、LFE(LowFrequency Effect,低频效果声道)、附加数据、MS(Mid-Side,和差)、JIC(Joint intensitycoding,联合强度编码),等等,不再一一介绍。
(1)、不占用额外数据块传输方式:由于每帧有固定比特数,而音频信号内容是变化的,因此一般在每帧除了传输编码的音频内容外都会填充或多或少的无用比特,此时可以利用音频帧尾部无用的填充比特部分来传输第一目标编码表,这种传输方式不会影响原音频编码质量。
(2)、占用额外数据块传输方式:如图3编码帧的最后附加数据部分,可以定义一个数据块来传输第一目标编码表,通过填充比特部分和附加数据部分共同传输可加快其传输速度,提升第一目标编码表的更新率。
第(1)种传输方式不会影响原音频编码质量,但传输速度通常比较慢,导致第一目标编码表的更新也较慢,属于慢自适应熵编码,如果编码音频信号的量化谱系数概率分布变化低于当前第一目标编码表的更新率,则不影响自适应熵编码效率;而如果变化快于当前第一目标编码表的更新率,则会影响自适应能力,而影响熵编码效率,此时可以根据选择第(2)种传输方式。
第(2)种传输方式中第一目标编码表的更新率较高,但由于使用额外数据块来传输第一目标编码表,在固定码率要求下,一帧中前面可用的比特数会减少,因此会对编码质量有一定影响。
举例来说,如果传输动态编码表,由于使用动态编码表会提升熵编码效率,可以采用第(2)种传输方式,“第(2)种传输方式影响编码质量”与“动态编码表提升熵编码效率”,两者综合结果仍然会改善编码效果。一些情况下,两者综合结果不会改善编码效果,则可以仅传输使用固定编码表。
对于其他编码模式来说,如VBR(Variable Bitrate,可变码率)和ABR(平均码率,Average Bitrate),可以采用第(2)种传输方式来传输动态编码表。
或者,也可以将第一目标编码表添加至待编码音频帧的附加数据部分。
传输完成后,编码端可以使用动态编码表进行熵编码(称为自适应熵编码模式),或者编码端可以使用固定编码表进行熵编码(称为准自适应熵编码模式),或者也可以采用混合模式,也就是结合使用动态编码表和固定编码表进行熵编码,或者也可以比较固定编码表和动态编码表的编码效率,选择编码效率更高的编码表进行熵编码,并用比特标志指明本帧使用固定编码表还是动态编码表。
对于无线传输(例如广播应用)的情况:在音频编码中使用自适应熵编码模式时,如果解码端没有从编码的第一帧开始接收,则可能无法接收到完整的动态编码表,这时需要定时切换到准自适应熵编码模式,便于解码端能使用固定编码表进行准确熵解码。此外,解码端可以重新接收动态编码表,直到接收完毕,启用动态编码表进行熵解码。或者如果有比特标志指明使用固定编码表还是动态编码表,则熵解码时根据比特标志选择固定编码表或者动态编码表进行准确熵解码。
举例来说,如图4所示,可以采用如下步骤进行编码:
S401、初始化编码,并设定使用固定编码表。
S402、对待编码音频帧进行感觉编码,其中,对于量化谱系数来说,基于固定编码表进行熵编码。
举例来说,假设输入一帧待编码音频帧,对该音频帧进行音频类型分析,确定其信号类型为m;对其进行平稳性检测,确定其信号平稳性为k;确定其是否为稳态信号;如果是,则对其进行谐波性分析,确定其信号谐波性为l;如果不为稳态信号,则设l=1;根据信号的平稳性,进行多分辨率MDCT(Modified Discrete Cosine Transform,改进离散余弦变换);根据所设码率(或码率范围)n及基于心理声学的比特分配,对谱系数进行量化;对量化谱***进行区间划分,对每个区间中最大量化谱系数分析为p;然后调用码率为n、类型为m、平稳性为k、谐波性为l、谱系数最大绝对值p对应的编码表,作为第一目标编码表;利用第一目标编码表对待编码音频帧的量化谱系数进行熵编码。
S403、可以持续或间隔地对量化谱系数进行概率分布统计,例如,S403包括:S4031、判断是否到达一定帧数Nf或时间T,如果是,则执行S4032、根据统计得到的概率分布情况,产生新的动态编码表,否则返回S402。
S404、传输该动态编码表,传输方式有多种,例如:
(a)对于CBR模式,采用上述第(1)种传输方式或第(2)种传输方式传输该动态编码表。
(b)对于VBR或ABR模式,则采用上述第(2)种传输方式传输该动态编码表。
S405、该动态编码表传输完毕,则编码端切换到使用该动态编码表进行熵编码(自适应熵编码模式);或者切换到混合模式,也就是选择使用固定编码表或动态编码表进行熵编码;或者比较固定编码表和动态编码表的编码效率,选择编码效率更高的编码表进行熵编码,并用1个比特标志来指明本帧使用固定编码表还是动态编码表。
S406、在一段时间(或一定帧数)之后,用1个比特标志指明当前帧是否是复位状态;如果是复位状态,则需要将编码端熵编码部分复位成初始状态,以保证解码端在任意时间开始启动后,在未获取到动态编码表的情况下,需要等待直到接收到复位帧后开始使用固定编码表准确熵解码,并返回S402。如果不是复位状态,则继续正常进行熵编码。
本实施例中,可以定时对编码端和解码端进行复位,复位后产生动态编码表之前,编码端和解码端都使用已有的固定编码表进行熵编码和熵解码,这样可以使得解码端能够与编码端同步。
对于一些大文件音频编解码的应用情况(如本地、服务器或远程存储),可以采用上述步骤进行熵编码,但是由于其传输的特殊性,一般是解码端发起传输请求,因此可以从文件的开始进行解码,不需要定时复位,也就是可以省略掉上述S406,由S405返回S403。
如上所述,一些情况下,只需要传输固定编码表即可,不需要实时传输动态编码表,这些情况下,在解码端对待解码音频帧的量化谱系数进行概率分布统计(与编码端对待编码音频帧的量化谱系数进行概率分布统计相对应),获得与编码端一样的概率分布,并在解码端生成同样的动态编码表,使用该动态编码表进行解码。
这些情况下,可以省略掉上述S404和S406,S405中也不再等待动态编码表传输完毕,S405后返回执行S402。
应用本发明所示实施例,确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围;从生成的多种类别对应的编码表中,选择目标类别对应的编码表,作为第一目标编码表;利用第一目标编码表对待编码音频帧的量化谱系数进行编码。可见,本方案中,对不同类别的音频帧采用不同的编码表进行编码,且音频帧的类别划分依据包括量化谱系数的数值范围,也就是说,本方案考虑到了不同量化谱系数特性不同,提高了编码效率。
另外,上述实施例中,还考虑到了无线传输的情况和大文件应用情况,分别提出了适用于不同情况的熵编码方案。
与上述编码方法相对应,本发明实施例还提供一种音频解码方法,如图5所示,包括:
S501:获取待解码音频帧。该待解码音频帧可以为利用上述任意一种实施例所述的音频编码方法编码而成。
S502:获取待解码音频帧对应的编码表,作为第二目标编码表。
本发明的一种示例性实施例中,S502可以包括:从所述待编码音频帧的填充比特部分和/或附加数据部分,读取所述待解码音频帧对应的编码表,作为第二目标编码表。
上述实施例中介绍了多种传输方式,相对应的,解码端可以从音频帧中添加了编码表的相应部分读取该编码表。为了区分描述,将编码端实施例中的目标编码表称为第一目标编码表,将解码端实施例中的目标编码表称为第二目标编码表,第一目标编码表和第二目标编码表可以指代相同的编码表。
本发明的另一种示例性实施例中,S502可以包括:接收编码端发送的编码表,作为第三候选编码表;通过对当前时间段内待解码音频帧的量化谱系数进行概率分布统计,对所述第三候选编码表进行更新,得到第二目标编码表。
如上所述,一些情况下,只需要传输固定编码表即可,不需要实时传输动态编码表,这些情况下,解码端对待解码音频帧的量化谱系数进行概率分布统计(与编码端对待编码音频帧的量化谱系数进行概率分布统计相对应),获得与编码端一样的概率分布,并对接收到的固定编码表(第三候选编码表)进行更新,生成同样的动态编码表,也就是第二目标编码表。
S503:利用第二目标编码表对待解码音频帧进行解码。
举例来说,与图4相对应,如图6所示,可以采用如下步骤进行解码:
S601、初始化解码,设定使用固定编码表进行熵解码。
S602、输入一个待解码音频帧,并检查该帧的编码端熵编码部分是否为复位状态,如果不是,则不解码本帧,继续输入下一个待解码音频帧,继续本步骤;如果是复位状态,则执行S603。
S603、开始进行正常解码,其中熵解码使用已设定的编码表。
S604、检测是否在待解码音频帧的尾部添加了动态编码表,如果是,则执行S605,如果否,输入下一个待解码音频帧,并返回S603。
S605:开始接收该动态编码表,并判断是否已经接收了一个完整的动态编码表,如果否,输入下一个待解码音频帧,并返回S603;如果是,则执行S606;
S606、设定使用动态编码表进行熵解码(自适应熵编码模式对应的解码模式);或者根据当前帧熵编码类型标识(1个比特标志),判断设定使用固定编码表或动态编码表进行熵解码。
S607、输入下一个待解码音频帧,并检查该帧的编码端熵编码部分是否为复位状态,如果不是,则返回S603;如果是,则执行S608、设定使用固定编码表进行熵解码(准自适应熵编码模式对应的解码模式),并返回S603。
本实施例中,可以定时对编码端和解码端进行复位,复位后产生动态编码表之前,编码端和解码端都使用已有的固定编码表进行熵编码和熵解码,这样可以使得解码端能够与编码端同步。
如上所述,对于一些大文件音频编解码的情况,由于其传输的特殊性,一般是解码端发起传输请求,因此可以从文件的开始进行解码,不需要定时复位,这种情况下,解码步骤中可以省略S602、S607和S608,S603中,输入一个编码帧,开始对其进行正常解码,其中熵解码使用已设定的编码表,S606之后返回S603。
如上所述,一些情况下,只需要传输固定编码表即可,不需要实时传输动态编码表,这些情况下,解码步骤可以如图7所示:
S701、初始化解码,设定使用固定编码表进行熵解码。
S702、输入一个编码帧,开始对其进行正常解码,其中熵解码使用已设定的编码表。
S703、开始对熵解码得到的量化谱系数进行概率分布统计,判断是否到达一定帧数Nf或时间T,如果是,则执行S704、根据概率分布情况,产生新的编码表(也就是动态编码表),并进入到S705,否则返回S702。
S705、设定使用动态编码表进行熵解码(自适应熵编码模式对应的解码模式);或者根据当前帧熵编码类型标识(1个比特标志),判断设定使用固定编码表或动态编码表进行熵解码。返回S702。
举例来说,熵解码过程可以包括:进行熵解码得到量化谱系数,进行反量化、比例因子或步长运算,多声道解码,逆MDCT,输出解码的PCM(Pulse Code Modulation,脉冲编码调制)。
与上述方法实施例相对应,本发明实施例还提供一种音频编码装置,如图8所示,包括:
第一确定模块801,用于确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围;
选择模块802,用于从生成的多种类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表;
编码模块803,用于利用所述第一目标编码表对所述待编码音频帧的量化谱系数进行编码。
本发明的一种示例性实施例中,音频帧的类别划分依据还包括以下任意一种或多种:码率、内容、平稳性、谐波性;所述装置还包括:
生成模块(图中未示出),用于通过对不同类别音频帧的量化谱系数进行概率分布统计,生成所述多种类别对应的编码表。
本发明的一种示例性实施例中,所述生成模块,具体用于:
通过对N种码率、M类信号、K种平稳性、L种谐波性信号和P个范围的量化谱系数进行概率分布统计,生成M*K*N*P*L份编码表。
本发明的一种示例性实施例中,选择模块802包括:选择子模块和更新子模块(图中未示出),其中,
选择子模块,用于从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
更新子模块,用于通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表。
本发明的一种示例性实施例中,所述装置还包括:判断模块和第二确定模块(图中未示出),其中,
判断模块,用于在所述选择子模块从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表之后,判断当前时刻与上一次更新第一候选编码表的时刻间隔是否到达预设时长条件;如果未到达,触发第二确定模块,如果到达,触发所述更新子模块;
第二确定模块,用于将所选择的第一候选编码表确定为第一目标编码表。
本发明的一种示例性实施例中,选择模块802具体用于:
从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第二候选编码表;
确定利用所述第一候选编码表进行编码的编码效率,作为第一编码效率;以及确定利用所述第二候选编码表进行编码的编码效率,作为第二编码效率;
若所述第一编码效率大于所述第二编码效率,则将所述第一候选编码表确定为第一目标编码表;
若所述第一编码效率小于所述第二编码效率,则将所述第二候选编码表确定为第一目标编码表。
本发明的一种示例性实施例中,所述装置还包括:
添加模块(图中未示出),用于将所述第一目标编码表添加至所述待编码音频帧的填充比特部分和/或附加数据部分。
与上述方法实施例相对应,本发明实施例还提供一种音频解码装置,如图9所示,包括:
第一获取模块901,用于获取待解码音频帧,所述待解码音频帧为利用权利要求1-7任意一项所述的音频编码方法编码而成;
第二获取模块902,用于获取所述待解码音频帧对应的编码表,作为第二目标编码表;
解码模块903,用于利用所述第二目标编码表对所述待解码音频帧进行解码。
本发明的一种示例性实施例中,第二获取模块902具体用于:
从所述待编码音频帧的填充比特部分和/或附加数据部分,读取所述待解码音频帧对应的编码表,作为第二目标编码表。
本发明的一种示例性实施例中,第二获取模块902具体用于:
接收编码端发送的编码表,作为第三候选编码表;
通过对当前时间段内待解码音频帧的量化谱系数进行概率分布统计,对所述第三候选编码表进行更新,得到第二目标编码表。
本发明实施例还提供了一种电子设备,如图10所示,包括处理器1001和存储器1002,
存储器1002,用于存放计算机程序;
处理器1001,用于执行存储器1002上所存放的程序时,实现上述任意一种音频编码方法或音频解码方法。
上述电子设备提到的存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种音频编码方法或音频解码方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任意一种音频编码方法或音频解码方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、设备实施例、计算机可读存储介质实施例、以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (22)
1.一种音频编码方法,包括:
确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围;
从生成的多种类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表;
利用所述第一目标编码表对所述待编码音频帧的量化谱系数进行编码。
2.根据权利要求1所述的方法,其中,音频帧的类别划分依据还包括以下任意一种或多种:码率、内容、平稳性、谐波性;
生成所述多种类别对应的编码表的过程包括:
通过对不同类别音频帧的量化谱系数进行概率分布统计,生成所述多种类别对应的编码表。
3.根据权利要求2所述的方法,其中,所述通过对不同类别音频帧的量化谱系数进行概率分布统计,生成所述多种类别对应的编码表,包括:
通过对N种码率、M类信号、K种平稳性、L种谐波性信号和P个范围的量化谱系数进行概率分布统计,生成M*K*N*P*L份编码表。
4.根据权利要求1所述的方法,其中,所述从生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表,包括:
从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表。
5.根据权利要求4所述的方法,其中,所述从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表之后,还包括:
判断当前时刻与上一次更新第一候选编码表的时刻间隔是否到达预设时长条件;
如果未到达,将所选择的第一候选编码表确定为第一目标编码表;
如果到达,则执行所述通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表的步骤。
6.根据权利要求1所述的方法,其中,所述从生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表,包括:
从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第二候选编码表;
确定利用所述第一候选编码表进行编码的编码效率,作为第一编码效率;以及确定利用所述第二候选编码表进行编码的编码效率,作为第二编码效率;
若所述第一编码效率大于所述第二编码效率,则将所述第一候选编码表确定为第一目标编码表;
若所述第一编码效率小于所述第二编码效率,则将所述第二候选编码表确定为第一目标编码表。
7.根据权利要求1所述的方法,其中,所述利用所述第一目标编码表对所述待编码音频帧的量化谱系数进行编码之后,还包括:
将所述第一目标编码表添加至所述待编码音频帧的填充比特部分和/或附加数据部分。
8.一种音频解码方法,包括:
获取待解码音频帧,所述待解码音频帧为利用权利要求1-7任意一项所述的音频编码方法编码而成;
获取所述待解码音频帧对应的编码表,作为第二目标编码表;
利用所述第二目标编码表对所述待解码音频帧进行解码。
9.根据权利要求8所述的方法,其中,所述获取所述待解码音频帧对应的编码表,作为第二目标编码表,包括:
从所述待编码音频帧的填充比特部分和/或附加数据部分,读取所述待解码音频帧对应的编码表,作为第二目标编码表。
10.根据权利要求8所述的方法,其中,所述获取所述待解码音频帧对应的编码表,作为第二目标编码表,包括:
接收编码端发送的编码表,作为第三候选编码表;
通过对当前时间段内待解码音频帧的量化谱系数进行概率分布统计,对所述第三候选编码表进行更新,得到第二目标编码表。
11.一种音频编码装置,包括:
第一确定模块,用于确定待编码音频帧的类别,作为目标类别;其中,音频帧的类别划分依据包括量化谱系数的数值范围;
选择模块,用于从生成的多种类别对应的编码表中,选择所述目标类别对应的编码表,作为第一目标编码表;
编码模块,用于利用所述第一目标编码表对所述待编码音频帧的量化谱系数进行编码。
12.根据权利要求11所述的装置,其中,音频帧的类别划分依据还包括以下任意一种或多种:码率、内容、平稳性、谐波性;所述装置还包括:
生成模块,用于通过对不同类别音频帧的量化谱系数进行概率分布统计,生成所述多种类别对应的编码表。
13.根据权利要求12所述的装置,其中,所述生成模块,具体用于:
通过对N种码率、M类信号、K种平稳性、L种谐波性信号和P个范围的量化谱系数进行概率分布统计,生成M*K*N*P*L份编码表。
14.根据权利要求11所述的装置,其中,所述选择模块,包括:
选择子模块,用于从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
更新子模块,用于通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第一目标编码表。
15.根据权利要求14所述的装置,其中,所述装置还包括:
判断模块,用于在所述选择子模块从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表之后,判断当前时刻与上一次更新第一候选编码表的时刻间隔是否到达预设时长条件;如果未到达,触发第二确定模块,如果到达,触发所述更新子模块;
第二确定模块,用于将所选择的第一候选编码表确定为第一目标编码表。
16.根据权利要求11所述的装置,其中,所述选择模块,具体用于:
从预先生成的多个类别对应的编码表中,选择所述目标类别对应的编码表,作为第一候选编码表;
通过对当前时间段内待编码音频帧的量化谱系数进行概率分布统计,对所述第一候选编码表进行更新,得到第二候选编码表;
确定利用所述第一候选编码表进行编码的编码效率,作为第一编码效率;以及确定利用所述第二候选编码表进行编码的编码效率,作为第二编码效率;
若所述第一编码效率大于所述第二编码效率,则将所述第一候选编码表确定为第一目标编码表;
若所述第一编码效率小于所述第二编码效率,则将所述第二候选编码表确定为第一目标编码表。
17.根据权利要求11所述的装置,其中,所述装置还包括:
添加模块,用于将所述第一目标编码表添加至所述待编码音频帧的填充比特部分和/或附加数据部分。
18.一种音频解码装置,包括:
第一获取模块,用于获取待解码音频帧,所述待解码音频帧为利用权利要求11-17任意一项所述的音频编码装置编码而成;
第二获取模块,用于获取所述待解码音频帧对应的编码表,作为第二目标编码表;
解码模块,用于利用所述第二目标编码表对所述待解码音频帧进行解码。
19.根据权利要求18所述的装置,其中,所述第二获取模块,具体用于:
从所述待编码音频帧的填充比特部分和/或附加数据部分,读取所述待解码音频帧对应的编码表,作为第二目标编码表。
20.根据权利要求18所述的装置,其中,所述第二获取模块,具体用于:
接收编码端发送的编码表,作为第三候选编码表;
通过对当前时间段内待解码音频帧的量化谱系数进行概率分布统计,对所述第三候选编码表进行更新,得到第二目标编码表。
21.一种电子设备,包括处理器和存储器,其中,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-10任一所述的方法步骤。
22.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-10任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110550059.8A CN115376532A (zh) | 2021-05-20 | 2021-05-20 | 一种音频编码、解码方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110550059.8A CN115376532A (zh) | 2021-05-20 | 2021-05-20 | 一种音频编码、解码方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115376532A true CN115376532A (zh) | 2022-11-22 |
Family
ID=84059504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110550059.8A Pending CN115376532A (zh) | 2021-05-20 | 2021-05-20 | 一种音频编码、解码方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115376532A (zh) |
-
2021
- 2021-05-20 CN CN202110550059.8A patent/CN115376532A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7433824B2 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
US8712783B2 (en) | Entropy encoding and decoding using direct level and run-length/level context-adaptive arithmetic coding/decoding modes | |
JP4963498B2 (ja) | 非典型的な部分系列に関する部分情報を用いた音声及びオーディオ符号化パラメータの量子化 | |
US10404984B2 (en) | Method and apparatus for pyramid vector quantization indexing and de-indexing of audio/video sample vectors | |
KR101152707B1 (ko) | 다단계 양자화 방법 및 장치 | |
US20110029304A1 (en) | Hybrid instantaneous/differential pitch period coding | |
US8665945B2 (en) | Encoding method, decoding method, encoding device, decoding device, program, and recording medium | |
KR101170137B1 (ko) | 복잡성이 축소된 벡터 인덱싱 및 탈-인덱싱 | |
RU2702265C1 (ru) | Способ и устройство обработки сигналов | |
KR102017892B1 (ko) | 향상된 계층적 코딩 | |
KR20180026812A (ko) | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 | |
KR20160114192A (ko) | 오디오 신호를 위한 비트 할당 방법 및 장치 | |
RU2754437C1 (ru) | Способ и устройство для распределения битового бюджета между подкадрами в celp-кодеке | |
US8380526B2 (en) | Method, device and system for enhancement layer signal encoding and decoding | |
US8498875B2 (en) | Apparatus and method for encoding and decoding enhancement layer | |
JP2010500819A (ja) | 複数の量子化パターンの効率的な知覚的関連検索による音声及びオーディオを量子化するための方法 | |
CN115376532A (zh) | 一种音频编码、解码方法、装置、设备及存储介质 | |
JP5539992B2 (ja) | レート制御装置、レート制御方法及びレート制御プログラム | |
CN113192517A (zh) | 一种音频编解码方法和音频编解码设备 | |
US7739119B2 (en) | Technique for implementing Huffman decoding | |
CN114694664A (zh) | 一种音频编码、解码方法、装置、设备及存储介质 | |
CN101626242B (zh) | 改进的霍夫曼解码方法及装置 | |
WO2023100494A1 (ja) | 符号化装置、復号装置、符号化方法、及び、復号方法 | |
CA2991341A1 (en) | Bit error detector for an audio signal decoder | |
KR20240118076A (ko) | 부호화 장치, 복호 장치, 부호화 방법, 및, 복호 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |