CN113948094A - 音频编解码方法和相关装置及计算机可读存储介质 - Google Patents
音频编解码方法和相关装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113948094A CN113948094A CN202010688152.0A CN202010688152A CN113948094A CN 113948094 A CN113948094 A CN 113948094A CN 202010688152 A CN202010688152 A CN 202010688152A CN 113948094 A CN113948094 A CN 113948094A
- Authority
- CN
- China
- Prior art keywords
- parameter
- current frame
- frequency
- frequency region
- code stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 230000005236 sound signal Effects 0.000 claims abstract description 41
- 238000004891 communication Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 5
- 238000004590 computer program Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请实施例提供一种音频解码方法和相关装置,可包括:获取编码码流;对所述编码码流进行码流解复用以获得音频信号的当前帧的第一编码参数;根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得所述当前帧的第二编码参数,所述当前帧的第二编码参数包括所述当前帧的音调成分参数;根据所述第一编码参数获得所述当前帧的第一高频带信号和第一低频带信号;根据所述第二编码参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号;根据所述第一高频带信号、所述第二高频带信号和所述第一低频带信号,获得所述当前帧的解码信号。本申请实施例的方案有利于提高解码音频信号的质量。
Description
技术领域
本申请涉及音频技术领域,尤其涉及音频编解码方法和相关的通信装置及相关的计算机可读存储介质。
背景技术
目前,随着社会的进步和技术的不断发展,用户对音频服务的需求越来越高。如何在有限编码比特率的情况下为用户提供更高质量的服务,或利用更低的编码比特率为用户提供相同质量的服务,一直以来都是音频编解码研究的重点。一些国际标准组织(例如第三代合作伙伴计划(3GPP,3rd Generation Partner Project))也在参与相关标准的制定工作,以推动音频服务向高质量迈进。
三维音频由于能够带给用户更好的浸入式体验,成为音频服务发展的新趋势。实现三维音频服务,需要进行压缩编码的原始音频信号格式可分为:基于声道的音频信号格式、基于对象的音频信号格式、基于场景的音频信号格式、以及任意基于以上三种音频信号格式的混合信号格式。
其中,无论是哪种音频信号格式,三维音频编解码器需要进行压缩编码的音频信号包含多路信号。通常情况下,三维音频编解码器利用通道间的相关性将多路信号下混,得到下混信号和多通道编码参数(通常情况下,下混信号的通道数远小于输入信号的通道数,例如多通道信号下混为立体声信号)。然后,利用核心编码器对下混信号进行编码。还可以选择将立体声信号进一步下混为单声道信号和立体声编码参数。编码下混信号和多通道编码参数所用的比特数远小于独立编码多通道输入信号。此外,核心编码器中,为降低编码比特率,往往进一步利用不同频带信号间的相关性进行编码。
利用不同频带信号间的相关性进行编码,原理是利用低频带信号,通过频谱复制或频带扩展等产生高频带信号,以便用较少的比特数对高频带信号进行编码,从而降低整个编码器的编码比特率。但真实的音频信号中,高频带的频谱中往往存在一些与低频带的频谱不相似的音调成分,传统技术没有能够高效地编码及重建这些音调成分。
发明内容
本申请实施例提供了通信方法和相关装置及计算机可读存储介质。
本申请实施例第一方面提供一种音频解码方法,包括:
音频解码器获取编码码流;对所述编码码流进行码流解复用以获得音频信号的当前帧的第一编码参数;根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得所述当前帧的第二编码参数,所述当前帧的第二编码参数包括所述当前帧的音调成分参数;根据所述第一编码参数获得所述当前帧的第一高频带信号和第一低频带信号;根据所述第二编码参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号;根据所述第一高频带信号、所述第二高频带信号和所述第一低频带信号,获得所述当前帧的解码信号。
本申请音频编解码器可为3GPP提出的增强语音服务(EVS,Enhanced VoiceService)音频编解码器,也可是统一语音和音频编码(USAC,Unified Speech and AudioCoding)音频编解码器,或者还可以是动态图像专家组(MPEG,Moving Picture ExpertsGroup)的高效高级音频编码(HE-AAC,High-Efficiency Advanced Audio Coding)的音频编解码器等,当然本申请的音频编解码器也不限于上述举例类型的音频编解码器。
本申请实施例举例的音频解码方案中,音频解码器可以对编码码流进行解码而得到当前帧的音调成分参数,根据音调成分参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号,由于第二高频带信号携带了高频部分的音调成分信息,因此有利于更准确地恢复第二高频带信号对应的频率范围内的音调成分,从而提高了解码音频信号的质量。
在一些可能实施方式中,音频解码方法方法还可包括:获取配置码流;对所述配置码流进行码流解复用以获得解码器配置参数,所述解码器配置参数包括所述音调成分编码的配置参数,所述音调成分编码的配置参数用于表示音调成分编码的频率区域的数量和各频率区域的子带宽度。例如所述音调成分编码的配置参数可包括音调成分编码的频率区域的数量参数和各频率区域的子带宽度参数等。
其中,配置参数可每帧分别获取,也可多帧共用相同的配置参数。即配置码流可以每帧分别获取,也可多帧共用相同的配置码流。
其中,当配置参数可每帧分别获取,那么,当前帧的音调成分编码的频率区域数量参数可能同于或不同于前一帧的音调成分编码的频率区域数量参数,当前帧的至少一个频率区域的音调成分编码的子带宽度参数,可能同于或不同于前一帧的至少一个频率区域的音调成分编码的子带宽度参数;
其中,当多帧共用相同的配置参数,那么当前帧的音调成分编码的频率区域数量参数可同于前一帧的音调成分编码的频率区域数量参数,当前帧的至少一个频率区域的音调成分编码的子带宽度参数,可同于前一帧(当前帧和前一帧共用相同配置参数)的至少一个频率区域的音调成分编码的子带宽度参数。
可以理解,利用配置码流中解码器配置参数包括的音调成分编码的配置参数,可基于需要来灵活配置进行音调成分编码的频率区域的数量和频率区域内的子带划分方式等。
在一些可能的实施方式之中,所述对所述配置码流进行码流解复用以获得解码器配置参数可以包括:从所述配置码流中获得音调成分编码的频率区域的数量参数和使用相同子带宽度的标志参数,其中,所述使用相同子带宽度的标志参数用于表示不同频率区域是否使用相同的子带宽度;根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数。
在一些可能实施方式中,所述根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数,包括:
在所述使用相同子带宽度的标志参数为设定值S1的情况下,从所述配置码流中获得所述共用子带宽度参数(这个共用子带宽度参数可为当前帧和其他帧共用或不共用),所述至少一个频率区域的音调成分编码的子带宽度参数,等于所述共用子带宽度参数,或所述至少一个频率区域的音调成分编码的子带宽度参数,基于所述共用子带宽度参数变换得到(变换方式例如可以是按一定比例放大或缩小,当然也可是其他满足需要的变换方式)。
或者,
在所述使用相同子带宽度的标志参数为设定值S2的情况下,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数(所述至少一个频率区域的音调成分编码的子带宽度参数可为当前帧和其他帧共用或不共用),其中,所述至少一个频率区域的音调成分编码的子带宽度参数的数量,等于所述音调成分编码的频率区域的数量参数所指示的所述音调成分编码的频率区域数量,或所述至少一个频率区域的音调成分编码的子带宽度参数的数量,基于所述音调成分编码的频率区域的数量参数变换得到(变换方式例如可为按一定比例放大或缩小,当然也可是其他满足需要的变换方式)。
可以理解,利用使用相同子带宽度的标志参数,可基于需要来灵活配置进行音调成分编码的频率区域的子带宽度等。
在一些可能实施方式中,当前帧的音调成分参数包括如下参数中的一种或多种:所述当前帧的帧级别音调成分标志参数、所述当前帧的至少一个频率区域的频率区域级别的音调成分标志参数、所述当前帧的至少一个频率区域的噪声基底参数、音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
在一些可能实施方式中,所述音调成分编码的配置参数包括音调成分编码的频率区域的数量参数;所述根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得音频信号的当前帧的第二编码参数,包括:从编码码流中获取所述当前帧的帧级别音调成分标志参数;
在所述当前帧的帧级别音调成分标志参数为设定值S3的情况下,从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,其中,所述N1等于所述当前帧音调成分编码的频率区域的数量参数所指示的所述当前帧音调成分编码的频率区域数量。
在一些可能实施方式中,所述从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,包括:从编码码流中获取所述当前帧的N1个频率区域中当前频率区域的频率区域级别音调成分标志参数;
在所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4的情况下,从所述编码码流中获得如下音调成分参数中的一种或多种:所述当前帧的当前频率区域的噪声基底参数,音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
在一些可能实施方式中,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量信息复用参数和音调成分的位置数量参数,包括:从编码码流中获得所述当前帧的当前频率区域的位置数量信息复用参数;
在当前帧的当前频率区域的位置数量信息复用参数为设定值S5的情况下,所述当前帧的当前频率区域的音调成分的位置数量参数,等于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数;或所述当前帧的当前频率区域的音调成分的位置数量参数,基于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数变换得到。
在所述当前帧的当前频率区域的位置数量信息复用参数为设定值S6的情况下,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数。
可以理解,利用音调成分的位置数量信息复用参数,可以便捷的实现音调成分的位置数量信息是否复用的控制,并且,在音调成分的位置数量信息复用的情况下,也有利于减少比特传输量,进而节约传输资源。
在一些可能实施方式中,所述从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数,包括:根据当前帧的当前频率区域的宽度信息和音调成分编码的子带宽度参数,获得所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数;根据所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数,从所述编码码流中获得当前帧的当前频率区域的音调成分的位置数量参数。
在一些可能实施方式中,所述当前频率区域的宽度信息由音调成分编码的频率区域的分布确定,其中,所述音调成分编码的频率区域的分布由所述音调成分编码的频率区域的数量参数确定。
在一些可能实施方式中,从所述编码码流中获得所述当前帧的至少一个频率区域的音调成分的幅度或能量参数,包括:若所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4,根据所述当前帧的当前频率区域的音调成分的位置数量参数,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的幅度或能量参数。
本申请第二方面提供一种音频解码器,包括:
获取单元,用于获取编码码流;
解码单元,用于对所述编码码流进行码流解复用,以获得音频信号的当前帧的第一编码参数;根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得音频信号的当前帧的第二编码参数,所述当前帧的第二编码参数包括所述当前帧的音调成分参数;根据所述第一编码参数获得所述当前帧的第一高频带信号和第一低频带信号;根据所述第二编码参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号;根据所述第一高频带信号、所述第二高频带信号和所述第一低频带信号,获得所述当前帧的解码信号。
在一些可能实施方式中,所述获取单元还用于获取配置码流;解码单元还用于对所述配置码流进行码流解复用以获得解码器配置参数,其中,所述解码器配置参数包括所述音调成分编码的配置参数,所述音调成分编码的配置参数用于表示音调成分编码的频率区域的数量和各频率区域的子带宽度。
在一些可能实施方式中,所述解码单元对所述配置码流进行码流解复用以获得解码器配置参数,包括:从所述配置码流中获得音调成分编码的频率区域的数量参数和使用相同子带宽度的标志参数,其中,所述使用相同子带宽度的标志参数用于表示不同频率区域是否使用相同的子带宽度;根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数。
在一些可能实施方式中,所述解码单元根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数,包括:
在所述使用相同子带宽度的标志参数为设定值S1的情况下,从所述配置码流中获得共用子带宽度参数,所述至少一个频率区域的音调成分编码的子带宽度参数,等于所述共用子带宽度参数,或所述至少一个频率区域的音调成分编码的子带宽度参数,基于所述共用子带宽度参数变换得到;
或者,
在所述使用相同子带宽度的标志参数为设定值S2的情况下,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数,其中,所述至少一个频率区域的音调成分编码的子带宽度参数的数量,等于所述音调成分编码的频率区域的数量参数所指示的所述音调成分编码的频率区域数量,或所述至少一个频率区域的音调成分编码的子带宽度参数的数量,基于所述音调成分编码的频率区域的数量参数变换得到。
在一些可能实施方式中,当前帧的音调成分参数包括如下参数中的一种或多种:所述当前帧的帧级别音调成分标志参数、所述当前帧的至少一个频率区域的频率区域级别的音调成分标志参数、所述当前帧的至少一个频率区域的噪声基底参数、音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
在一些可能实施方式中,所述音调成分编码的配置参数包括音调成分编码的频率区域的数量参数;所述解码单元根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得音频信号的当前帧的第二编码参数,包括:从编码码流中获取所述当前帧的帧级别音调成分标志参数;
在所述当前帧的帧级别音调成分标志参数为设定值S3的情况下,从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,其中,所述N1等于所述当前帧音调成分编码的频率区域的数量参数所指示的所述当前帧音调成分编码的频率区域数量。
在一些可能实施方式中,所述解码单元从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,包括:
从编码码流中获取所述当前帧的N1个频率区域中当前频率区域的频率区域级别音调成分标志参数;
在所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4的情况下,从所述编码码流中获得如下音调成分参数中的一种或多种:所述当前帧的当前频率区域的噪声基底参数,音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
在一些可能实施方式中,所述解码单元从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量信息复用参数和音调成分的位置数量参数,包括:从编码码流中获得所述当前帧的当前频率区域的位置数量信息复用参数;
在当前帧的当前频率区域的位置数量信息复用参数为设定值S5的情况下,所述当前帧的当前频率区域的音调成分的位置数量参数,等于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数;或所述当前帧的当前频率区域的音调成分的位置数量参数,基于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数变换得到;
在所述当前帧的当前频率区域的位置数量信息复用参数为设定值S6的情况下,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数。
在一些可能实施方式中,所述解码单元从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数,包括:
根据所述当前帧的当前频率区域的宽度信息和音调成分编码的子带宽度参数,获得所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数;根据所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数,从所述编码码流中获得当前帧的当前频率区域的音调成分的位置数量参数。
在一些可能实施方式之中,所述当前频率区域的宽度信息由音调成分编码的频率区域的分布确定,所述音调成分编码的频率区域的分布由所述音调成分编码的频率区域的数量参数确定。
在一些可能实施方式中,所述解码单元从所述编码码流中获得所述当前帧的至少一个频率区域的音调成分的幅度或能量参数,包括:
若所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4,根据所述当前帧的当前频率区域的音调成分的位置数量参数,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的幅度或能量参数。
本申请实施例第三方面提供一种音频解码器,可包括:包括处理器,所述处理器和存储器耦合,所述存储器存储有程序,当所述存储器存储的程序指令被所述处理器执行时实现第一方面提供的任意一种方法。
本申请实施例第四方面提供一种通信***,包括:音频编码器和音频解码器;所述音频解码器为本申请实施例提供的任意一种音频解码器。
本申请实施例第五方面提供一种计算机可读存储介质,包括程序,当所述程序在计算机上运行时,使得所述计算机执行第一方面提供的任意一种方法。
本申请实施例第六方面提供一种网络设备,包括处理器和存储器,所述处理器与存储器耦合,用于读取并执行所述存储器中存储的指令,实现如第一方面提供的任意一种方法。
其中,所述网络设备例如为芯片或片上***。
本申请实施例第七方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有编码码流,其中,本申请实施例提供的任意一种音频解码器获取所述编码码流后,根据所述编码码流获得所述当前帧的解码信号。
本申请实施例第八方面提供一种计算机程序产品,其中,所述计算机程序产品包括计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行第一方面提供的任意一种方法。
附图说明
下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1-A和图1-B为本申请实施例提供的音频编解码方案应用到音频终端的场景示意图。
图1-C和图1-D为本申请实施例提供的有线或无线网络中的网络设备的音频编解码的示意图。
图1-E为本申请实施例提供的音频通信中的音频编解码的示意图。
图1-F和图1-G为本申请实施例提供的有线或无线网络中的网络设备的多声道编解码的示意图。
图1-H为本申请实施例提供的虚拟现实服务应用音频编解码的示意图。
图2为本申请实施例提供的一种音频编码方法的流程示意图。
图3为本申请实施例提供的一种获取当前帧的第二编码参数的方法的流程示意图。
图4-A为本申请实施例提供的一种音频解码方法的流程示意图。
图4-B为本申请实施例提供的一种高频信号和低频信号组合的示意图。
图5为本申请实施例提供的一种音频解码器的示意图。
图6为本申请实施例提供的另一种音频解码器的示意图。
图7为本申请实施例提供的一种通信***的示意图。
图8为本申请实施例提供的一种网络设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
参见图1-A至图1-G,下面介绍本申请音频编解码方案可能应用到的网络架构。音频编解码方案可能应用到音频终端(例如有线或无线通信终端)中,也可能应用到有线或无线网络中的网络设备中。
其中,图1-A和图1-B示出音频编解码方案应用到音频终端的场景,其中,音频终端的具体产品形态可以是图1-A中终端1、终端2或终端3等,但也不限于此。例如音频通信中发送终端中的音频采集器可采集音频信号,立体声编码器可将音频采集器采集到的音频信号进行立体声编码,信道编码器对立体声编码器编码得到的立体声编码信号进行信道编码得到码流,码流通过无线网络或无线网络进行传输。相应的,接收终端中的信道解码器对接收到的码流进行信道解码,再经立体声解码器解码出立体声信号,之后则可由音频回放器进音频回放。
参见图1-C和图1-D,有线或无线网络中的网络设备如需实现转码,则网络设备可进行相应的立体声编解码处理。
其中,立体声编解码处理可以是多声道编解码器中的一部分。例如对采集到的多声道信号进行多声道编码可以是将采集到的多声道信号经过下混处理后得到立体声信号,对得到的立体声信号进行编码;解码端根据多声道信号编码码流,解码得到立体声信号,经过上混处理后恢复出多声道信号。因此立体声编解码方案也可应用于终端、有线或无线网络中的网络设备的通信模块中的多声道编解码器。
图1-E举例示出,例如音频通信中发送终端中的音频采集器可采集音频信号,多声道编码器可将音频采集器采集到的音频信号进行多声道编码,信道编码器对多声道编码器编码得到的多声道编码信号进行信道编码得到码流,码流通过无线网络或无线网络进行传输。而相应的,接收终端中的信道解码器对接收到的码流进行信道解码,再经多声道解码器解码出多声道信号,之后则可由音频回放器进音频回放。
参见图1-F和图1-G,有线或无线网络中的网络设备如需实现转码,则网络设备可进行相应的多声道编解码处理。
参见图1-H,本申请音频编解码方案还可适用于虚拟现实(VR streaming)服务中的音频编解码模块(Audio Encoding/Audio Decoding)。
例如,端到端对音频信号的处理流程可为:音频信号A经过采集模块(Acquisition)后进行预处理操作(Audio Preprocessing),预处理操作包括滤除掉信号中的低频部分,通常是以20Hz或50Hz为分界点,提取信号中的方位信息,之后进行编码处理(Audio encoding)并且打包(File/Segment encapsulation)之后发送(Delivery)到解码端。相应的,解码端首先进行解包(File/Segment decapsulation),之后解码(Audiodecoding),对解码信号进行双耳渲染(Audio rendering)处理,渲染处理后的信号映射到收听者耳机(headphones)上,可为独立的耳机,也可为HTC VIVE等眼镜设备上的耳机。
具体来说,本申请音频编解码方案可应用到的实际产品可包括无线接入网设备、核心网的媒体网关、转码设备、媒体资源服务器,移动终端、固网终端等。还可以应用于VRstreaming服务中的音频编解码器。
本申请音频编解码器可为3GPP提出的增强语音服务(EVS,Enhanced VoiceService)音频编解码器,也可是统一语音和音频编码(USAC,Unified Speech and AudioCoding)音频编解码器,或者还可以是动态图像专家组(MPEG,Moving Picture ExpertsGroup)的高效高级音频编码(HE-AAC,High-Efficiency Advanced Audio Coding)的音频编解码器等,当然本申请的音频编解码器也不限于上述举例类型的音频编解码器。
下面具体介绍一些音频编解码方案。
参见图2,图2为本申请实施例提供的一种音频编码方法的流程示意图。一种音频编码方法可以包括:
201.获取音频编解码器的配置参数,所述配置参数包括音调成分编码的配置参数。
其中,在进行音调成分编码的过程中,例如可以将音频帧的高频带划分为K个频率区域(tile),其中,每个频率区域内可划分为一个或多个子带,不同频率区域内划分子带的数量可相同,部分相同,完全不同。音调成分信息的获取例如可以以频率区域为单位进行。
当音调成分信息的获取以频率区域为单位进行,音调成分编码的配置参数可包括:音调成分编码的频率区域数量参数,还可以包括音调成分编码的子带宽度参数。
其中,音调成分编码的子带宽度参数例如可表示为如下两个参数,即使用相同子带宽度的标志参数,以及各频率区域的音调成分编码的子带宽度参数。
其中,音调成分编码的频率区域数量参数,表示对音频信号的高频带中多少个频率区域进行音调成分的检测、编码和重建。
其中,使用相同子带宽度的标志参数,表示进行音调成分编码的各个频率区域是否使用相同的子带宽度。具体来说,当使用相同子带宽度的标志参数表示出进行音调成分编码的各个频率区域使用相同的子带宽度,那么,进行音调成分编码的各个频率区域均使用相同的子带宽度。当使用相同子带宽度的标志参数表示出进行音调成分编码的各个频率区域使用不相同的子带宽度,那么,进行音调成分编码的部分频率区域或任意两个频率区域使用不相同的子带宽度。
其中,各频率区域中某一频率区域的音调成分编码的子带宽度参数,表示这个频率区域中包含的若干子带的频率宽度(这个频率宽度例如可以是子带的频点数量,且同一频率区域中各子带的频率宽度相同)。
其中,音调成分编码的配置参数可以通过预先设定或查表方式获得。
其中,配置参数可每帧分别获取,也可多帧共用相同的配置参数。
其中,当配置参数可每帧分别获取,那么,当前帧的音调成分编码的频率区域数量参数可能同于或不同于前一帧的音调成分编码的频率区域数量参数,当前帧的至少一个频率区域的音调成分编码的子带宽度参数,可能同于或不同于前一帧的至少一个频率区域的音调成分编码的子带宽度参数;
其中,当多帧共用相同的配置参数,那么当前帧的音调成分编码的频率区域数量参数可同于前一帧的音调成分编码的频率区域数量参数,当前帧的至少一个频率区域的音调成分编码的子带宽度参数,可同于前一帧(当前帧和前一帧共用相同配置参数)的至少一个频率区域的音调成分编码的子带宽度参数。
202.获取音频信号的当前帧,其中,所述当前帧包括高频带信号和低频带信号。
其中,当前帧可以是音频信号中的任意一个帧,其中,当前帧可以包括高频带信号和低频带信号。其中,高频带信号和低频带信号的划分可以通过频带阈值确定,高于这个频带阈值的信号为高频带信号,低于这个频带阈值的信号为低频带信号,对于频带阈值的确定可以根据传输带宽、编码组件和解码组件的数据处理能力来确定,此处不做限定。
可以理解,高频带信号和低频带信号是相对的,例如低于某个频率阈值的信号为低频带信号,高于该频率阈值的信号为高频带信号(其中,该频率阈值对应的信号既可以划到低频带信号,也可以划到高频带信号)。该频率阈值根据当前帧的带宽不同而有可能不同。例如在当前帧为信号带宽为0-8千赫兹(kHz)的宽带信号时,该频率阈值可以为4kHz;在当前帧为信号带宽为0-16kHz的超宽带信号时,该频率阈值可以为8kHz。
需要说明的是,本申请实施例方案中,所述高频带信号可以是高频区域中的部分或全部信号,具体地,高频区域根据当前帧的信号带宽的不同会有不同,也会根据频率阈值的不同会有不同。举例来说,在当前帧的信号带宽为0-8kHz,频率阈值为4kHz时,所述高频区域为4-8kHz,则所述高频带信号可以是覆盖整个高频区域的4-8kHz的信号,也可是仅覆盖部分高频区域的信号,例如高频带信号可是4-7kHz,5-8kHz,5-7kHz,或4-6kHz以及7-8kHz(即所述高频带信号在频域上可以是不连续的)等等;例如在当前帧的信号带宽为0-16kHz,频率阈值为8kHz时,高频区域为8-16kHz,则所述高频带信号可为覆盖整个高频区域的8-16kHz的信号,也可是仅覆盖部分高频区域的信号,例如高频带信号可以是8-15kHz、9-16kHz、9-15kHz或(8-10kHz+11-16kHz,即所述高频带信号在频域上可以是连续的或不连续的)等等。可以理解的是,所述高频带信号覆盖的频率范围可以根据需要进行设置,或者根据需要进行编码的频率范围自适应地确定,例如可根据需要进行音调成分筛选的频率范围自适应地确定。
203.根据所述当前帧高频带信号和低频带信号得到第一编码参数。
其中,第一编码参数具体可以包括:时域噪声整形参数、频域噪声整形参数、频谱量化参数、频带扩展参数等。
204.根据所述音调成分编码的配置参数和所述当前帧的高频带信号获取当前帧的第二编码参数,所述第二编码参数包括当前帧的高频带信号的音调成分参数,所述音调成分参数用于表示所述当前帧的高频带信号的音调成分信息,所述音调成分信息包括所述音调成分的位置信息、数量信息、以及幅度信息或能量信息。在一些实施例中,所述音调成分信息还可以包括频率区域的噪声基底信息。
其中,通常情况下,根据高频带信号获取当前帧的第二编码参数的过程,可按照高频带的频率区域划分和/或子带划分来进行。其中,高频带信号对应的高频带可包括至少一个频率区域,一个频率区域可包括至少一个子带。
其中,音调成分编码的配置参数中,音调成分编码的频率区域数量参数用于表示在所述高频带信号对应的高频带中,进行音调成分编码的频率区域的数量信息。例如,音调成分编码的频率区域数量参数为3,则表明在所述高频带信号对应的高频带中的3个频率区域进行音调成分编码,所述的3个频率区域可以是所述高频带的所有频率区域中指定的3个频率区域,或者从高频带的所有频率区域中按预设规则选定。
其中,音调成分编码的配置参数中,使用相同子带宽度的标志参数以及各频率区域的音调成分编码的子带宽度参数,用于表示音调成分编码的各个频率区域中子带的宽度信息(即子带包含的频点数量)。本申请实施例提供的音调成分编码方法中,每个频率区域的每个子带中最多编码一个音调成分的信息。因此某一频率区域的音调成分编码的子带宽度参数决定了这一频率区域中可以编码的音调成分的最大数量。
205.对音调成分编码的配置参数进行码流复用以获得配置码流。
其中,由于配置参数可每帧分别获取,也可多帧共用相同的配置参数(即配置码流可每帧分别获取,也可多帧共用相同的配置码流)。因此配置码流可能是针对每帧都分别生成,也可能针对多帧而生成一个多帧共用的配置码流。
可以理解,在多帧共用相同的配置参数(即多帧共用相同的配置码流)的情况下,当前帧和另一帧如果公用相同配置参数,那么前一帧的音调成分编码的某配置参数,也可称当前帧的音调成分编码的某配置参数,当前帧的音调成分编码的某配置参数,也可称前一帧的音调成分编码的某配置参数。
206.对第一编码参数和第二编码参数进行码流复用以获得编码码流。
可以看出,由于第二编码参数包括当前帧的高频带信号的音调成分参数,所述音调成分参数用于表示所述当前帧的高频带信号的音调成分信息,因此音频解码器可以对编码码流进行解码而得到当前帧的音调成分参数,进而可根据音调成分参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号,由于第二高频带信号携带了高频部分的音调成分信息,因此有利于更准确地恢复第二高频带信号对应的频率范围内的音调成分,从而提高了解码音频信号的质量。
参见图3,图3为本申请实施例提供的一种获取当前帧的第二编码参数的方法的流程示意图。
其中,一种获取当前帧的第二编码参数的方法可以包括:
301.根据音调成分编码的配置参数和当前帧的至少一个频率区域中的当前频率区域的高频带信号,获得当前帧的当前频率区域的噪声基底参数、音调成分的位置数量参数和音调成分的幅度或能量参数。
根据音调成分编码的频率区域的数量参数、各频率区域的子带宽度参数,以及当前帧的至少一个频率区域中的当前频率区域的高频带信号,可分别获取各频率区域内的音调成分的数量信息、音调成分的位置信息、音调成分的幅度信息或能量信息,以及噪声基底信息。
根据各频率区域内的音调成分的数量信息、音调成分的位置信息、音调成分的幅度信息或能量信息,以及噪声基底信息,获得所述各频率区域内的音调成分的位置数量参数、音调成分的幅度或能量参数,以及噪声基底参数。
其中,音调成分的位置数量参数还可以包括位置数量信息复用参数,此参数的确定方法例如为:若当前帧的至少一个频率区域中的当前频率区域的音调成分的位置数量参数与当前帧的前一帧的当前频率区域的音调成分的位置数量参数相同,则所述当前帧的当前频率区域的位置数量信息复用参数可设定为S5,否则设定为S6。S5不等于S6,例如S5=1且x6=0,或S5=0且S6=1。
其中,根据当前频率区域的高频带信号,确定所述当前频率区域的噪声基底参数、所属当前频率区域的音调成分的位置数量参数,以及所述当前频率区域的音调成分的幅度参数或能量参数的具体方法本申请不做限定。
302.根据当前帧的当前频率区域的音调成分的数量信息,获得当前帧的当前频率区域的频率区域级别的音调成分标志参数。
例如,若当前帧的当前频率区域的音调成分的数量信息大于零,则所述当前频率区域的频率区域级别的音调成分标志参数为设为S4,否则为S8。其中,S4不等于S8,例如S4=1且S8=0,或S4=0且S8=1。
303.根据当前帧的至少一个频率区域的频率区域级别的音调成分标志参数,获得当前帧的帧级别音调成分标志参数。
例如,若当前帧的至少一个频率区域的频率区域级别的音调成分标志参数不为S8,则当前帧的帧级别音调成分标志参数设为S3,否则为S7。其中,S3不等于S7,例如S3=1且S7=0,或S3=0且S7=1。
下面对音调成分编码的配置参数可能包括的具体参数进行举例。音调成分编码的配置参数例如可以包括:
a.音调成分编码的频率区域的数量参数,可记为num_tiles_recon。
b.使用相同子带宽度的标志参数,可记为flag_same_res。其中,使用相同子带宽度的标志参数用于表示不同频率区域是否使用相同的子带宽度。
c.各频率区域的音调成分编码的子带宽度参数,可记为tone_res[N1],其中N1为音调成分编码的频率区域的数量。
下面对音调成分编码的配置参数的码流产生方式举例描述如下(以各频率区域使用相同的子带宽度为例,即使用相同子带宽度的标志参数flag_same_res为S1):
extentElementConfigLength=1
extentElementConfigPayload[0]=(num_tiles_recon-1)<<5
flag_same_res=1
extentElementConfigPayload[0]+=(flag_same_res)<<4
tone_res_common=tone_res[0]
extentElementConfigPayload[0]+=(tone_res_common/8-1)<<2
其中,extentElementConfigLength表示音调成分编码的配置码流长度(字节数)。
extentElementConfigPayload表示音调成分编码的配置码流数组,tone_res_common表示各频率区域的共用子带宽度参数。
例如,在配置码流产生方式中,音调成分编码的频率区域数量参数num_tiles_recon例如可以占用3bit或其他bit数,使用相同子带宽度的标志参数flag_same_res可占用1bit或其他bit数,共用子带宽度参数tone_res_common可占用2bit或其他bit数。
下面对音调成分编码的编码码流参数可能包括的具体参数进行举例,音调成分编码的编码码流参数例如可以包括:
a.帧级别音调成分标志参数,可记为tone_flag。
b.各频率区域的频率区域级别音调成分标志参数,可记为tone_flag_tile。
c.各频率区域的音调成分的位置数量参数,可记为tone_pos。
d.各频率区域的音调成分的位置数量信息复用参数,可记为is_same_pos。
e.各频率区域的音调成分的幅度或能量参数,可记为tone_val_q。
f.各频率区域的噪声基底参数,可记为noise_floor。
其中,音调成分编码的编码码流的一种可能的产生方式描述如下:
若当前帧的帧级别音调成分标志参数tone_flag为S7,即当前帧不存在音调成分,则将当前帧的帧级别音调成分标志参数tone_flag写入码流,当前帧的音调成分编码的编码码流中不再写入其他参数。即,如果当前帧不存在音调成分(tone_flag等于S7),则当前帧的音调成分编码的编码码流中仅包含当前帧的帧级别音调成分标志参数tone_flag。
若当前帧的帧级别音调成分标志参数tone_flag为S3,即当前帧存在音调成分,则将当前帧的帧级别音调成分标志参数tone_flag写入码流,而后将各频率区域的音调成分参数按顺序写入码流,所述频率区域的数量等于音调成分编码的频率区域的数量参数num_tiles_recon。
对所述当前帧的至少一个频率区域中的当前频率区域,若当前频率区域的频率区域级别的音调成分标志参数tone_flag_tile[p](p为频率区域序号)为S8,即当前频率区域不存在音调成分,则将当前频率区域的频率区域级别的音调成分标志参数tone_flag_tile[p]写入码流,当前频率区域不再写入其他参数。若当前频率区域的频率区域级别的音调成分标志参数tone_flag_tile[p]为S4,即当前频率区域存在音调成分,则将当前频率区域的频率区域级别的音调成分标志参数tone_flag_tile[p]写入码流,而后将当前频率区域的其他参数(包括位置数量信息复用参数、位置数量参数、幅度或能量参数、噪声基底参数等)按顺序写入码流。
位置数量信息复用参数和位置数量参数写入码流的方式为:若当前频率区域的位置数量信息复用参数is_same_pos[p](p为频率区域序号)为S6,即当前帧的当前频率区域不复用当前帧的前一帧的位置数量参数,则将位置数量信息复用参数is_same_pos[p]和位置数量参数tone_pos[p]写入码流;若当前频率区域的位置数量信息复用参数is_same_pos[p]为S5,即当前帧的当前频率区域复用前一帧的当前频率区域的位置数量参数,则只将位置数量信息复用参数is_same_pos[p]写入码流。
幅度或能量参数写入码流的方式为:根据当前频率区域的音调成分的数量信息tone_cnt[p],将当前频率区域的各个音调成分的幅度或能量参数写入码流。
噪声基底参数写入码流的方式为:将当前频率区域的噪声基底参数写入码流。
其中,音调成分编码的编码码流一种可能产生方式可如以下伪代码所示:
其中,BsPutBit(m)表示向编码码流写入m个比特,num_subband表示所述频率区域中的子带数量,例如可由所述当前频率区域的宽度和音调成分编码的子带宽度参数确定。
其中,tone_cnt[p]表示所述频率区域中的音调成分数量信息,例如可由音调成分位置数量参数获得。
从上可知,本申请实施例方案中,音频编码器会确定进行音调成分编码的频率区域信息,并对频率区域信息对应的频率范围内的音调成分信息进行编码,使得音频解码器可根据接收的音调成分信息进行音频信号的解码,有利于更准确地恢复频率区域信息对应的频率范围内的音频信号中的音调成分,从而提高了解码音频信号的质量。
参见图4-A,图4-A为本申请实施例提供的一种音频解码方法的流程示意图。一种音频解码方法可以包括:
404.获取编码码流。
其中,在获取编码码流前,可由音频解码器先获取配置码流。配置码流的获取可以每帧进行,或者对于多帧共用配置码流的情况,可每隔若干帧获取一次配置码流(配置码流的获取间隔可自适应调整),也可以只在音频解码器接收第一帧编码码流的时候获取一次配置码流。
其中,音频解码器对配置码流进行码流解复用以得到解码器配置参数,解码器配置参数包括音调成分编码的配置参数,所述音调成分编码的配置参数可用于表示音调成分编码的频率区域的数量和各频率区域的子带宽度等。音调成分编码的配置参数可用于进行音调成分的重建。
其中,音调成分编码的配置参数例如可包括:
a.音调成分编码的频率区域的数量参数,可记为num_tiles_recon;
b.使用相同子带宽度的标志参数,可记为flag_same_res;其中,使用相同子带宽度的标志参数用于表示不同频率区域是否使用相同的子带宽度。
c.各频率区域的音调成分编码的子带宽度参数,可记为tone_res[N1],其中N1为频率区域数量。
举例来说,对配置码流进行解析的具体方式可描述为如下过程:
获取音调成分编码的频率区域的数量参数,其中,例如音调成分编码的频率区域的数量参数占用3比特:
num_tiles_recon=GetBits(3)+1
其中,GetBits表示从码流中获取若干比特的过程。
获取使用相同子带宽度的标志参数flag_same_res。例如使用相同子带宽度的标志参数占用1比特:
flag_same_res=GetBits(1)
根据使用相同子带宽度的标志参数flag_same_res的取值,从配置码流中解析各频率区域的音调成分编码的子带宽度参数tone_res[N1],其中,例如每个频率区域的子带宽度参数占用2比特:
上述配置码流的解复用过程可以描述为:
如果使用相同子带宽度的标志参数flag_same_res的值为S2,即音调成分编码的各个频率区域的子带宽度参数不完全相同,则根据音调成分编码的频率区域的数量参数num_tiles_recon,从配置码流中获取num_tiles_recon个频率区域的音调成分编码的子带宽度参数tone_res[N1]。
若使用相同子带宽度的标志参数flag_same_res的值为S1,即各个频率区域的音调成分编码的子带宽度参数相同,则从配置码流中获取共用子带宽度参数tone_res_common,并将共用子带宽度参数tone_res_common赋值给各个频率区域的音调成分编码的子带宽度参数tone_res[i],其中频率区域的数量等于音调成分编码的频率区域的数量参数num_tiles_recon。
可以理解,上述举例的过程以音调成分编码的频率区域的数量参数占用3比特,使用相同子带宽度的标志参数占用1比特、每个频率区域的音调成分编码的子带宽度参数占用2比特为例的,对于其他比特数量的情况可以此类推。
402.对编码码流进行码流解复用以获得音频信号的当前帧的第一编码参数;根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得当前帧的第二编码参数,所述当前帧的第二编码参数包括所述当前帧的音调成分参数。
第一编码参数和第二编码参数的具体内容可以参考上述实施例举例的编码方法,此处不再赘述。
其中,对所述编码码流进行码流解复用包括:根据所述音调成分编码的配置参数,对所述编码码流进行码流解复用,得到音频信号的当前帧的第二编码参数,所述第二编码参数包括当前帧的音调成分参数。
其中,音调成分编码的编码参数例如可包括如下参数的一种或多种:
a.帧级别音调成分标志参数,记为tone_flag;
b.各频率区域的频率区域级别音调成分标志参数,记为tone_flag_tile;
c.各频率区域的音调成分的位置数量参数,记为tone_pos;
d.各频率区域的音调成分的位置数量信息复用参数,记为is_same_pos;
e.各频率区域的音调成分的幅度或能量参数,记为tone_val_q;
f.各频率区域的噪声基底参数,记为noise_floor;
其中,对编码码流进行解析的方法可以描述为:从编码码流中获取当前帧的帧级别音调成分标志参数tone_flag,其中,若当前帧的帧级别音调成分标志参数为S7,则表明当前帧不存在音调成分,不需要从编码码流中获取其他编码参数;若当前帧的帧级别音调成分标志参数为S3,则表明当前帧存在音调成分,需要从编码码流中获取各频率区域的音调成分参数和噪声基底参数等,其中频率区域的数量等于音调成分编码的频率区域的数量参数num_tiles_recon。
对所述当前帧的至少一个频率区域中的当前频率区域,从编码码流中获取当前频率区域的频率区域级别的音调成分标志参数tone_flag_tile[p](p为频率区域序号),若当前频率区域的频率区域级别的音调成分标志参数为S8,则表明当前频率区域不存在音调成分,不需要从编码码流中获取其他编码参数。此外,若当前频率区域的频率区域级别的音调成分标志参数为S4,则表明当前频率区域存在音调成分,需要从编码码流中获取当前频率区域的音调成分的位置数量信息复用参数、位置数量参数、幅度或能量参数以及当前频率区域的噪声基底参数。
当前频率区域的位置数量信息复用参数和位置数量参数的获取方法为:从编码码流中获取当前频率区域的位置数量信息复用参数is_same_pos[p],若当前频率区域的位置数量信息复用参数为S6,则根据当前频率区域的音调成分的位置数量参数占用的比特数,从编码码流中获取当前频率区域的音调成分的位置数量参数tone_pos[p]。其中,所述当前频率区域的音调成分的位置数量参数占用的比特数由所述当前频率区域的宽度信息和当前频率区域的音调成分编码的子带宽度参数tone_res[p]确定。其中当前频率区域的宽度信息由音调成分编码的频率区域的分布确定,音调成分编码的频率区域的分布由音调成分编码的频率区域的数量参数确定。若当前频率区域的位置数量信息复用参数为S5,则当前帧的当前频率区域的音调成分的位置数量参数等于当前帧的前一帧的当前频率区域的音调成分的位置数量参数。
当前频率区域的音调成分的幅度或能量参数的获取方法可为:根据当前频率区域的音调成分的数量信息,从编码码流中获取当前频率区域的各个音调成分的幅度或能量参数。当前频率区域的音调成分的数量信息,可由当前频率区域的音调成分的位置数量参数获得。
当前频率区域的噪声基底参数的获取方法例如可为:从编码码流中获取当前频率区域的噪声基底参数。
其中,对编码码流进行解析的一种举例方法可描述为如下伪代码:
其中,tile_width为当前频率区域的宽度(即频点数量),tile[p]和tile[p+1]分别为第p个和第p+1个频率区域的起始频点序号。
403.根据所述第一编码参数得到所述当前帧的第一高频带信号和所述当前帧的第一低频带信号。
其中,所述第一高频带信号可包括:根据所述第一编码参数直接解码得到的解码高频带信号,和/或根据所述第一低频带信号进行频带扩展得到的扩展高频带信号。
404.根据所述第二编码参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号,其中,所述第二高频带信号包括重建音调信号。
其中,第二编码参数可包括;高频带信号的音调成分参数。其中,高频带信号的音调成分参数可包括各个频率区域的音调成分的位置数量参数、音调成分的幅度或能量参数及噪声基底参数。
其中,根据所述第二编码参数得到所述当前帧的第二高频带信号,所述第二高频带信号包括重建音调信号,可包括:根据音调成分编码的频率区域的数量参数,确定音调成分编码的频率区域的分布;在音调成分编码的频率区域内,根据高频带信号的音调成分参数对音调成分进行重建。
其中,根据音调成分编码的频率区域数量,确定音调成分编码的频率区域的边界具体例如包括:若音调成分编码的频率区域的数量小于或等于频带扩展信息对应的频带扩展的频率区域数量,则音调成分编码的频率区域的边界与频带扩展的频率区域边界相同。频率区域边界例如可以是频率区域的上限和/或频率区域的下限。
具体的,若音调成分编码的频率区域数量大于所述频带扩展的频率区域数量,则音调成分编码的频率区域中,频率低于频带扩展频率上限的若干个频率区域,其边界与频带扩展的频率区域的边界相同,频率高于频带扩展频率上限的若干个频率区域,其边界可根据频带划分方式确定。
其中,频率高于频带扩展频率上限的若干个频率区域,其边界根据频带划分方式确定的具体方式可以是:
对于频率高于频带扩展频率上限的若干个频率区域中的某一频率区域,其频率下限等于与其相邻且频率较低的频率区域的频率上限,其频率上限根据子带划分方式确定。所述某一频率区域例如满足以下两个条件,其中,条件T1例如为所述频率区域的频率上限小于或等于采样频率的一半,条件T2例如为所述频率区域的宽度小于或等于某一预设值。其中,频率区域的宽度为所述频率区域的频率上限与频率下限之间的差值。
举例来说,音调成分编码的第一频率范围的下限与进行频带扩展的第二频率范围的下限相同;当音调成分编码的频率区域数量小于或等于频带扩展的频率区域数量时,第一频率范围内的频率区域的分布与频带扩展的配置信息中指示的第二频率范围内的频率区域的分布相同,即第一频率范围内的频率区域的划分方式与第二频率范围内的频率区域的划分方式相同。当音调成分编码的频率区域数量大于频带扩展的频率区域数量时,第一频率范围的频率上限大于第二频率范围的频率上限,即第一频率范围覆盖且大于第二频率范围,第一频率范围与第二频率范围重合部分的频率区域的分布与第二频率范围内的频率区域的分布相同,即第一频率范围与第二频率范围重合部分的频率区域的划分方式与第二频率范围内的频率区域的划分方式相同,第一频率范围与第二频率范围的不重合部分内的频率区域的分布是根据预设方式确定的,即第一频率范围与第二频率范围的不重合部分内的频率区域是根据预设方式划分的。
具体举例来说,解码端从配置码流中获取音调成分编码的频率区域数量参数num_tiles_recon。
若num_tiles_recon大于进行频带扩展的频率区域数量,则获取新增频率区域的频率边界和以及和SFB的对应关系,具体方式同编码端,即在保证新增频率区域的宽度不超过给定值的前提下,尽可能接近全带Fs/2。
新增频率区域的频率边界和频率区域边界的SFB序号的确定方式同编码端。频率区域划分表和频率区域-SFB对应表更新如下:
tile[num_tiles_recon]=sfb_offset[sfbIdx]
tile_sfb_wrap[num_tiles_recon]=sfbIdx
其中,sfbIdx表示新增频率区域的上边界对应的SFB序号,sfb_offset则表示SFB边界表格,其中,第i个SFB的下限是sfb_offset[i],上限是sfb_offset[i+1]。
其中,根据高频带信号的音调成分信息对音调成分进行重建,具体可包括:根据所述当前频率区域的音调成分的位置数量参数,确定所述当前频率区域中音调成分的频率位置;根据所述当前频率区域的音调成分的幅度参数或能量参数,确定所述音调成分的频率位置对应的幅度或能量;根据所述当前频率区域中音调成分的频率位置和所述音调成分的频率位置对应的幅度或能量获得重建高频带信号。
405.根据当前帧的第一低频带信号、第一高频带信号、第二高频带信号,得到所述当前帧的解码信号。
具体的,将所述当前帧的第一低频带信号、第一高频带信号、第二高频带信号进行组合而得到所述当前帧的解码信号。组合方式可以是叠加或加权叠加等,参见图4-B,图4-B举例示出了第一低频带信号、第一高频带信号、第二高频带信号进行叠加组合而得到所述当前帧的解码信号的可能方式。
本申请实施例举例的高频带音调成分编解码方案,确定需要进行音调成分检测编码的频率区域信息,并对频率区域信息对应的频率范围内的音调成分信息进行编码,使得音频解码器可以根据接收的音调成分信息进行音频信号的解码,有利于更准确地恢复频率区域信息对应的频率范围内的音频信号中的音调成分,从而提高了解码音频信号的质量。
当频带扩展处理覆盖的频率范围可能未达到最大带宽,利用上述举例方案有利于编码频带扩展处理未覆盖的频带范围内的高频带的音调成分。当频带扩展处理覆盖的频率范围较大,没有足够的编码比特数再对频带扩展处理覆盖的频率范围所有音调成分信息进行编码时,可以选择性地编码部分频率范围内的音调成分信息。实验发现,在不同的条件下,均可获得最佳的编码质量。
参见图5,本申请实施例还提供一种音频解码器500,包括:
获取单元510,用于获取编码码流;
解码单元520,用于对所述编码码流进行码流解复用,以获得音频信号的当前帧的第一编码参数;根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得音频信号的当前帧的第二编码参数,当前帧的第二编码参数包括所述当前帧的音调成分参数;根据所述第一编码参数获得所述当前帧的第一高频带信号和第一低频带信号;根据所述第二编码参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号;根据所述第一高频带信号、所述第二高频带信号和所述第一低频带信号,获得所述当前帧的解码信号。
在一些可能实施方式中,所述获取单元510还用于:获取配置码流;解码单元520还用于对所述配置码流进行码流解复用以获得解码器配置参数,其中,所述解码器配置参数包括所述音调成分编码的配置参数,所述音调成分编码的配置参数用于表示音调成分编码的频率区域的数量和各频率区域的子带宽度。
在一些可能实施方式中,所述解码单元520对所述配置码流进行码流解复用以获得解码器配置参数,包括:从所述配置码流中获得音调成分编码的频率区域的数量参数和使用相同子带宽度的标志参数,其中,所述使用相同子带宽度的标志参数用于表示不同频率区域是否使用相同的子带宽度;根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数。
在一些可能实施方式中,所述解码单元520根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数,包括:
在所述使用相同子带宽度的标志参数为设定值S1的情况下,从所述配置码流中获得共用子带宽度参数,所述至少一个频率区域的音调成分编码的子带宽度参数,等于所述共用子带宽度参数,或所述至少一个频率区域的音调成分编码的子带宽度参数,基于所述共用子带宽度参数变换得到;
或者,
在所述使用相同子带宽度的标志参数为设定值S2的情况下,从所述配置码流中获得至少一个频率区域的音调成分编码的子带宽度参数,其中,所述至少一个频率区域的音调成分编码的子带宽度参数的数量,等于所述音调成分编码的频率区域的数量参数所指示的所述音调成分编码的频率区域数量,或所述至少一个频率区域的音调成分编码的子带宽度参数的数量,基于所述音调成分编码的频率区域的数量参数变换得到。
在一些可能实施方式中,当前帧的音调成分参数包括如下参数中的一种或多种:所述当前帧的帧级别音调成分标志参数、所述当前帧的至少一个频率区域的频率区域级别的音调成分标志参数、所述当前帧的至少一个频率区域的噪声基底参数、音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
在一些可能实施方式中,音调成分编码的配置参数包括音调成分编码的频率区域的数量参数;解码单元520根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得音频信号的当前帧的第二编码参数,包括:从编码码流中获取所述当前帧的帧级别音调成分标志参数;
在所述当前帧的帧级别音调成分标志参数为设定值S3的情况下,从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,其中,所述N1等于所述当前帧音调成分编码的频率区域的数量参数所指示的所述当前帧音调成分编码的频率区域数量。
在一些可能实施方式中,所述解码单元520从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,包括:
从编码码流中获取所述当前帧的N1个频率区域中当前频率区域的频率区域级别音调成分标志参数;
在所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4的情况下,从所述编码码流中获得如下音调成分参数中的一种或多种:所述当前帧的当前频率区域的噪声基底参数,音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
在一些可能实施方式中,所述解码单元520从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量信息复用参数和音调成分的位置数量参数,包括:从编码码流中获得所述当前帧的当前频率区域的位置数量信息复用参数;
在当前帧的当前频率区域的位置数量信息复用参数为设定值S5的情况下,所述当前帧的当前频率区域的音调成分的位置数量参数,等于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数;或所述当前帧的当前频率区域的音调成分的位置数量参数,基于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数变换得到;
在所述当前帧的当前频率区域的位置数量信息复用参数为设定值S6的情况下,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数。
在一些可能实施方式中,所述解码单元520从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数,包括:
根据所述当前帧的当前频率区域的宽度信息和音调成分编码的子带宽度参数,获得所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数;根据所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数,从所述编码码流中获得当前帧的当前频率区域的音调成分的位置数量参数。
在一些可能实施方式之中,所述当前频率区域的宽度信息由音调成分编码的频率区域的分布确定,所述音调成分编码的频率区域的分布由所述音调成分编码的频率区域的数量参数确定。
在一些可能实施方式中,所述解码单元520从所述编码码流中获得所述当前帧的至少一个频率区域的音调成分的幅度或能量参数,包括:
若所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4,根据所述当前帧的当前频率区域的音调成分的位置数量参数,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的幅度或能量参数。
可以理解,本实施例音频解码器500的各个功能模块的功能,例如可基于图4-A所对应方法实施例中的方法来具体实施。
参见图6,本申请实施例还提供一种音频解码器600,可包括:包括处理器610,所述处理器和存储器620耦合,所述存储器620存储有程序,当所述存储器存储的程序指令被所述处理器执行时实现本申请实施例中的音频解码方法的部分或全部步骤。
其中,处理器610还称中央处理单元(CPU,Central Processing Unit)。具体的应用中音频解码器的各组件例如通过总线***耦合在一起。总线***除了可包括数据总线之外,还可包括电源总线、控制总线和状态信号总线等。上述本申请实施例揭示的方法可应用于处理器610中,或由处理器610实现。其中,处理器610可能是一种集成电路芯片,具有信号的处理能力。在一些实现过程中,上述方法的部分或全部步骤可通过处理器610中的硬件的集成逻辑电路或者软件形式的指令完成。处理器610可以是通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。处理器610可实现或执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器610可为微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可直接体现为硬件译码处理器执行完成,或用译码处理器中的硬件及软件模块组合执行完成。
软件模块可位于随机存储器,闪存、只读存储器,可编程只读存储器、电可擦写可编程存储器或寄存器等等本领域成熟的存储介质之中。该存储介质位于存储器620,例如处理器610可读取存储器620中的信息,结合其硬件完成上述方法的部分或全部步骤。
本申请实施例还提供一种音频编码器,可包括处理器,所述处理器和存储器耦合,所述存储器存储有程序,当所述存储器存储的程序指令被所述处理器执行时实现本申请实施例中的音频编方法的部分或全部步骤。
参见图7,本申请实施例还提供一种通信***,包括:
音频编码器710和音频解码器720;所述音频解码器720为本申请实施例提供的任意一种音频解码器。
参见图8,本申请实施例还提供一种网络设备800,包括处理器810和存储器820,所述处理器810与存储器820耦合,用于读取并执行所述存储器中存储的指令,实现本申请实施例中的音频编/解码方法的部分或全部步骤。
所述网络设备800例如为芯片或片上***。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被硬件(如处理器)执行时能够完成本申请实施例中的音频编/解码方法的部分或全部步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被硬件(例如处理器等)执行,以实现本申请实施例中由任意设备执行的任意一种方法的部分或全部步骤。
本申请实施例还提供了一种包括指令的计算机程序产品,当所述计算机程序产品在计算机设备上运行时,使得所述这个计算机设备执行本申请实施例中的任意一种音频编/解码方法的部分或者全部步骤。
在上述实施例中,可全部或部分地通过软件、硬件、固件、或其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如光盘)、或者半导体介质(例如固态硬盘)等。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,也可以通过其它的方式实现。例如以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可结合或者可以集成到另一个***,或一些特征可以忽略或不执行。另一点,所显示或讨论的相互之间的间接耦合或者直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例的方案的目的。
另外,在本申请各实施例中的各功能单元可集成在一个处理单元中,也可以是各单元单独物理存在,也可两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,或者也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(例如可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质例如可包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或光盘等各种可存储程序代码的介质。
Claims (28)
1.一种音频解码方法,其特征在于,包括:
获取编码码流;
对所述编码码流进行码流解复用以获得音频信号的当前帧的第一编码参数;
根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得所述当前帧的第二编码参数,所述当前帧的第二编码参数包括所述当前帧的音调成分参数;
根据所述第一编码参数获得所述当前帧的第一高频带信号和第一低频带信号;
根据所述第二编码参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号;
根据所述第一高频带信号、所述第二高频带信号和所述第一低频带信号,获得所述当前帧的解码信号。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取配置码流;对所述配置码流进行码流解复用以获得解码器配置参数,所述解码器配置参数包括所述音调成分编码的配置参数,所述音调成分编码的配置参数用于表示音调成分编码的频率区域的数量和各频率区域的子带宽度。
3.根据权利要求2所述的方法,其特征在于,所述对所述配置码流进行码流解复用以获得解码器配置参数,包括:从所述配置码流中获得音调成分编码的频率区域的数量参数和使用相同子带宽度的标志参数,其中,所述使用相同子带宽度的标志参数用于表示不同频率区域是否使用相同的子带宽度;根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数,包括:
在所述使用相同子带宽度的标志参数为设定值S1的情况下,从所述配置码流中获得共用子带宽度参数,所述至少一个频率区域的音调成分编码的子带宽度参数,等于所述共用子带宽度参数,或所述至少一个频率区域的音调成分编码的子带宽度参数,基于所述共用子带宽度参数变换得到;
或者,
在所述使用相同子带宽度的标志参数为设定值S2的情况下,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数,其中,所述至少一个频率区域的音调成分编码的子带宽度参数的数量,等于所述音调成分编码的频率区域的数量参数所指示的所述音调成分编码的频率区域数量,或所述至少一个频率区域的音调成分编码的子带宽度参数的数量,基于所述音调成分编码的频率区域的数量参数变换得到。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述当前帧的音调成分参数包括如下参数中的一种或多种:所述当前帧的帧级别音调成分标志参数、所述当前帧的至少一个频率区域的频率区域级别的音调成分标志参数、所述当前帧的至少一个频率区域的噪声基底参数、音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
6.根据权利要求5所述的方法,其特征在于,所述音调成分编码的配置参数包括音调成分编码的频率区域的数量参数;
所述根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得音频信号的当前帧的第二编码参数,包括:
从编码码流中获取所述当前帧的帧级别音调成分标志参数;
在所述当前帧的帧级别音调成分标志参数为设定值S3的情况下,从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,其中,所述N1等于所述当前帧音调成分编码的频率区域的数量参数所指示的所述当前帧音调成分编码的频率区域数量。
7.根据权利要求6所述的方法,其特征在于,所述从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,包括:
从编码码流中获取所述当前帧的N1个频率区域中当前频率区域的频率区域级别音调成分标志参数;
在所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4的情况下,从所述编码码流中获得如下音调成分参数中的一种或多种:所述当前帧的当前频率区域的噪声基底参数,音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
8.根据权利要求7所述的方法,其特征在于,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量信息复用参数和音调成分的位置数量参数,包括:
从编码码流中获得所述当前帧的当前频率区域的位置数量信息复用参数;
在当前帧的当前频率区域的位置数量信息复用参数为设定值S5的情况下,所述当前帧的当前频率区域的音调成分的位置数量参数,等于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数;或所述当前帧的当前频率区域的音调成分的位置数量参数,基于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数变换得到;
在所述当前帧的当前频率区域的位置数量信息复用参数为设定值S6的情况下,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数。
9.根据权利要求8所述的方法,其特征在于,所述从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数,包括:
根据当前帧的当前频率区域的宽度信息和音调成分编码的子带宽度参数,获得所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数;根据所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数,从所述编码码流中获得当前帧的当前频率区域的音调成分的位置数量参数。
10.根据权利要求9所述的方法,其特征在于,所述当前频率区域的宽度信息由音调成分编码的频率区域的分布确定,所述音调成分编码的频率区域的分布由所述音调成分编码的频率区域的数量参数确定。
11.根据权利要求7至10中任意一项所述的方法,其特征在于,从所述编码码流中获得所述当前帧的至少一个频率区域的音调成分的幅度或能量参数,包括:
若所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4,根据所述当前帧的当前频率区域的音调成分的位置数量参数,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的幅度或能量参数。
12.一种音频解码器,其特征在于,包括:
获取单元,用于获取编码码流;
解码单元,用于对所述编码码流进行码流解复用,以获得音频信号的当前帧的第一编码参数;根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得音频信号的当前帧的第二编码参数,所述当前帧的第二编码参数包括所述当前帧的音调成分参数;根据所述第一编码参数获得所述当前帧的第一高频带信号和第一低频带信号;根据所述第二编码参数和所述音调成分编码的配置参数,获得所述当前帧的第二高频带信号;根据所述第一高频带信号、所述第二高频带信号和所述第一低频带信号,获得所述当前帧的解码信号。
13.根据权利要求12所述的音频解码器,其特征在于,所述获取单元还用于:获取配置码流;
所述解码单元还用于对所述配置码流进行码流解复用以获得解码器配置参数,所述解码器配置参数包括所述音调成分编码的配置参数,所述音调成分编码的配置参数用于表示音调成分编码的频率区域的数量和各频率区域的子带宽度。
14.根据权利要求13所述的音频解码器,其特征在于,所述解码单元对所述配置码流进行码流解复用以获得解码器配置参数,包括:
从所述配置码流中获得音调成分编码的频率区域的数量参数和使用相同子带宽度的标志参数,其中,所述使用相同子带宽度的标志参数用于表示不同频率区域是否使用相同的子带宽度;根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数。
15.根据权利要求14所述的音频解码器,其特征在于,所述解码单元根据所述音调成分编码的频率区域的数量参数和所述使用相同子带宽度的标志参数,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数,包括:
在所述使用相同子带宽度的标志参数为设定值S1的情况下,从所述配置码流中获得所述共用子带宽度参数,所述至少一个频率区域的音调成分编码的子带宽度参数,等于所述共用子带宽度参数,或者,所述至少一个频率区域的音调成分编码的子带宽度参数,基于所述共用子带宽度参数变换得到;
或者,
在所述使用相同子带宽度的标志参数为设定值S2的情况下,从所述配置码流中获得所述至少一个频率区域的音调成分编码的子带宽度参数,其中,所述至少一个频率区域的音调成分编码的子带宽度参数的数量,等于所述音调成分编码的频率区域的数量参数所指示的所述音调成分编码的频率区域数量,或所述至少一个频率区域的音调成分编码的子带宽度参数的数量,基于所述音调成分编码的频率区域的数量参数变换得到。
16.根据权利要求12至15任一项所述的音频解码器,其特征在于,所述当前帧的音调成分参数包括如下参数中的一种或多种:所述当前帧的帧级别音调成分标志参数、所述当前帧的至少一个频率区域的频率区域级别的音调成分标志参数、所述当前帧的至少一个频率区域的噪声基底参数、音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
17.根据权利要求16所述的音频解码器,其特征在于,所述音调成分编码的配置参数包括音调成分编码的频率区域的数量参数;
所述解码单元根据音调成分编码的配置参数对所述编码码流进行码流解复用,以获得音频信号的当前帧的第二编码参数,包括:
从编码码流中获取所述当前帧的帧级别音调成分标志参数;
在所述当前帧的帧级别音调成分标志参数为设定值S3的情况下,从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,其中,所述N1等于所述当前帧音调成分编码的频率区域的数量参数所指示的所述当前帧音调成分编码的频率区域数量。
18.根据权利要求17所述的音频解码器,其特征在于,所述解码单元从所述编码码流中获得所述当前帧的N1个频率区域的音调成分参数,包括:
从编码码流中获取所述当前帧的N1个频率区域中当前频率区域的频率区域级别音调成分标志参数;
在所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4的情况下,从所述编码码流中获得如下音调成分参数中的一种或多种:所述当前帧的当前频率区域的噪声基底参数,音调成分的位置数量信息复用参数、音调成分的位置数量参数、音调成分的幅度或能量参数。
19.根据权利要求18所述的音频解码器,其特征在于,所述解码单元从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量信息复用参数和音调成分的位置数量参数,包括:
从编码码流中获得所述当前帧的当前频率区域的位置数量信息复用参数;
在当前帧的当前频率区域的位置数量信息复用参数为设定值S5的情况下,所述当前帧的当前频率区域的音调成分的位置数量参数,等于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数;或所述当前帧的当前频率区域的音调成分的位置数量参数,基于所述当前帧的前一帧的当前频率区域的音调成分的位置数量参数变换得到;
在所述当前帧的当前频率区域的位置数量信息复用参数为设定值S6的情况下,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数。
20.根据权利要求19所述的音频解码器,其特征在于,所述解码单元从所述编码码流中获得所述当前帧的当前频率区域的音调成分的位置数量参数,包括:
根据所述当前帧的当前频率区域的宽度信息和音调成分编码的子带宽度参数,获得所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数;根据所述当前帧的当前频率区域的音调成分的位置数量参数占用的比特数,从所述编码码流中获得当前帧的当前频率区域的音调成分的位置数量参数。
21.根据权利要求20所述的音频解码器,其特征在于,所述当前频率区域的宽度信息由音调成分编码的频率区域的分布确定,所述音调成分编码的频率区域的分布由所述音调成分编码的频率区域的数量参数确定。
22.根据权利要求18至21中任一项所述的音频解码器,其特征在于,所述解码单元从所述编码码流中获得所述当前帧的至少一个频率区域的音调成分的幅度或能量参数,包括:
若所述当前帧的当前频率区域的频率区域级别音调成分标志参数为设定值S4,根据所述当前帧的当前频率区域的音调成分的位置数量参数,从所述编码码流中获得所述当前帧的当前频率区域的音调成分的幅度或能量参数。
23.一种音频解码器,其特征在于,包括:包括处理器,所述处理器和存储器耦合,所述存储器存储有程序,当所述存储器存储的程序指令被所述处理器执行时实现权利要求1至11中任一项所述的方法。
24.一种通信***,其特征在于,包括:音频编码器和音频解码器;所述音频解码器为如权利要求12-23中任一项所述的音频解码器。
25.一种计算机可读存储介质,包括程序,当所述程序在计算机上运行时,使得所述计算机执行如权利要求1-11中任一项所述的方法。
26.一种网络设备,包括处理器和存储器,其特征在于,
所述处理器与存储器耦合,用于读取并执行所述存储器中存储的指令,实现如权利要求1-12中任一项的方法。
27.如权利要求26所述的网络设备,其特征在于,所述网络设备为芯片或片上***。
28.一种计算机可读存储介质,其特征在于,
所述计算机可读存储介质存储有编码码流,其中,如权利要求12-23任一项所述的音频解码器获取所述编码码流后,根据所述编码码流获得所述当前帧的解码信号。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010688152.0A CN113948094A (zh) | 2020-07-16 | 2020-07-16 | 音频编解码方法和相关装置及计算机可读存储介质 |
KR1020237004357A KR20230035373A (ko) | 2020-07-16 | 2021-07-16 | 오디오 인코딩 방법, 오디오 디코딩 방법, 관련 장치, 및 컴퓨터 판독가능 저장 매체 |
EP21842181.6A EP4174851A4 (en) | 2020-07-16 | 2021-07-16 | AUDIO ENCODING METHOD, AUDIO DECODING METHOD, RELATED APPARATUS AND COMPUTER-READABLE STORAGE MEDIUM |
PCT/CN2021/106855 WO2022012677A1 (zh) | 2020-07-16 | 2021-07-16 | 音频编解码方法和相关装置及计算机可读存储介质 |
BR112023000761A BR112023000761A2 (pt) | 2020-07-16 | 2021-07-16 | Método de decodificação de áudio, decodificador de áudio, sistema de comunicação, meio de armazenamento legível por computador e dispositivo de rede |
US18/154,197 US20230154473A1 (en) | 2020-07-16 | 2023-01-13 | Audio coding method and related apparatus, and computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010688152.0A CN113948094A (zh) | 2020-07-16 | 2020-07-16 | 音频编解码方法和相关装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113948094A true CN113948094A (zh) | 2022-01-18 |
Family
ID=79326536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010688152.0A Pending CN113948094A (zh) | 2020-07-16 | 2020-07-16 | 音频编解码方法和相关装置及计算机可读存储介质 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230154473A1 (zh) |
EP (1) | EP4174851A4 (zh) |
KR (1) | KR20230035373A (zh) |
CN (1) | CN113948094A (zh) |
BR (1) | BR112023000761A2 (zh) |
WO (1) | WO2022012677A1 (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100316769B1 (ko) * | 1997-03-12 | 2002-01-15 | 윤종용 | 오디오 부호화/복호화 장치 및 방법 |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
CN101662288B (zh) * | 2008-08-28 | 2012-07-04 | 华为技术有限公司 | 音频编码、解码方法及装置、*** |
CN102396024A (zh) * | 2009-02-16 | 2012-03-28 | 韩国电子通信研究院 | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN103366751B (zh) * | 2012-03-28 | 2015-10-14 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
JP6262668B2 (ja) * | 2013-01-22 | 2018-01-17 | パナソニック株式会社 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
CN104103276B (zh) * | 2013-04-12 | 2017-04-12 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
-
2020
- 2020-07-16 CN CN202010688152.0A patent/CN113948094A/zh active Pending
-
2021
- 2021-07-16 WO PCT/CN2021/106855 patent/WO2022012677A1/zh unknown
- 2021-07-16 KR KR1020237004357A patent/KR20230035373A/ko unknown
- 2021-07-16 BR BR112023000761A patent/BR112023000761A2/pt unknown
- 2021-07-16 EP EP21842181.6A patent/EP4174851A4/en active Pending
-
2023
- 2023-01-13 US US18/154,197 patent/US20230154473A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20230035373A (ko) | 2023-03-13 |
BR112023000761A2 (pt) | 2023-02-07 |
WO2022012677A1 (zh) | 2022-01-20 |
EP4174851A4 (en) | 2023-11-15 |
US20230154473A1 (en) | 2023-05-18 |
EP4174851A1 (en) | 2023-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022204887B2 (en) | Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element | |
CA2705968C (en) | A method and an apparatus for processing a signal | |
JP2001094433A (ja) | サブバンド符号化・復号方法 | |
KR102649124B1 (ko) | 후처리 지연을 저감시킨 고주파 재구성 기술의 통합 | |
JP2021507316A (ja) | オーディオ信号の高周波再構成技術の後方互換性のある統合 | |
JP2020074052A (ja) | オーディオ信号の高周波再構成のための高調波転換器の後方互換な統合 | |
CN110660401B (zh) | 一种基于高低频域分辨率切换的音频对象编解码方法 | |
WO2021244418A1 (zh) | 一种音频编码方法和音频编码装置 | |
WO2021143691A1 (zh) | 一种音频编解码方法和音频编解码设备 | |
CN101800048A (zh) | 基于dra编码器的多声道数字音频编码方法及其编码*** | |
CN113539281A (zh) | 音频信号编码方法和装置 | |
CN113948094A (zh) | 音频编解码方法和相关装置及计算机可读存储介质 | |
US20220293112A1 (en) | Low-latency, low-frequency effects codec | |
KR101786863B1 (ko) | 고 주파수 복원 알고리즘들을 위한 주파수 대역 테이블 설계 | |
JP7318645B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
CN115410585A (zh) | 音频数据编解码方法和相关装置及计算机可读存储介质 | |
CN117476016A (zh) | 音频编解码方法、装置、存储介质及计算机程序产品 | |
CN115472171A (zh) | 编解码方法、装置、设备、存储介质及计算机程序 | |
KR20100054749A (ko) | 신호의 처리 방법 및 이의 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |