CN104299615B - 一种声道间电平差处理方法及装置 - Google Patents
一种声道间电平差处理方法及装置 Download PDFInfo
- Publication number
- CN104299615B CN104299615B CN201310298100.2A CN201310298100A CN104299615B CN 104299615 B CN104299615 B CN 104299615B CN 201310298100 A CN201310298100 A CN 201310298100A CN 104299615 B CN104299615 B CN 104299615B
- Authority
- CN
- China
- Prior art keywords
- subband
- frame
- subframe
- icld
- weighted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 230000005236 sound signal Effects 0.000 claims abstract description 102
- 238000000034 method Methods 0.000 claims description 43
- 230000014509 gene expression Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 abstract description 11
- 238000011002 quantification Methods 0.000 description 27
- 230000000694 effects Effects 0.000 description 6
- 239000007787 solid Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 101100326803 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) fac-2 gene Proteins 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开一种声道间电平差处理方法及装置,涉及立体音频技术领域,可以在信号变化迅速或者丢包情况下保证解码后的立体声音频质量,并且实现立体声音频信号的低比特率传输。本发明通过接收立体声音频信号,并逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD;计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;否则,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。本发明适于进行声道间电平差处理时采用。
Description
技术领域
本发明涉及立体音频技术领域,尤其涉及一种声道间电平差处理方法及装置。
背景技术
随着生活质量的提高,人们对高质量音频的需求不断增大。相对于单声道音频,立体声音频能够提高信息的清晰度和可懂度,因而备受人们青睐。
现有技术对立体声音频进行处理时,首先对输入的立体声音频信号进行解析,获得携带立体声音频信号的帧中各子带声道间电平差(Inter-Channel Level Difference,ICLD)值,然后将获得的ICLD值与前几帧获得的ICLD值进行比较,当ICLD值与前几帧获得的ICLD值变化较大时,则该帧携带的立体声音频信号为暂态Transient,否则该帧携带的立体声音频信号为常态Normal。对Transient分为2帧进行传输,即分别传输奇数子带与偶数子带的ICLD。对于Normal分为4帧进行传输,即每帧传输1/4子带的ICLD。其中,为了保证比特数目的一致,进一步对Normal进行refinement处理。
然而,采用现有技术对立体声音频进行处理时,由于携带立体声音频的帧长较长,当处理10ms的立体声音频时,如果Normal分4帧进行处理,相当于每40ms(4*10ms)进行ICLD更新,则导致在信号变化迅速或者丢包情况下无法保证解码后的立体声音频质量,另外,如果逐帧传输ICLD,将无法实现立体声音频信号的低比特率传输。
发明内容
本发明的实施例提供一种声道间电平差处理方法及装置,可以在信号变化迅速或者丢包情况下保证解码后的立体声音频质量,并且实现立体声音频信号的低比特率传输。
第一方面,本发明实施例提供一种声道间电平差处理方法,包括:
接收立体声音频信号,并逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD,所述每一帧中包括至少两个子帧;
根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;
当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;
当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。
在第一种可能的实现方式中,结合第一方面,所述采用第一加权方式计算所述任一帧中每个子带的ICLD加权值,包括:
根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
在第二种可能的实现方式中,结合第一方面中第一种可能的实现方式,所述根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,包括:
根据fac1(i,b)=1/L计算第i个子帧中的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子。
在第三种可能的实现方式中,结合第一方面中第二种可能的实现方式,所述根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
在第四种可能的实现方式中,结合第一方面,所述采用第二加权方式计算所述任一帧中每个子带的ICLD加权值,包括:
根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,或者根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
在第五种可能的实现方式中,结合第一方面中第四种可能的实现方式,根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
在第六种可能的实现方式中,结合第一方面中第五种可能的实现方式,所述根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
在第七种可能的实现方式中,结合第一方面中第六种可能的实现方式,所述根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述M表示相邻的子带的数量,所述l表示相邻子带和当前子带的索引号的差值。
在第八种可能的实现方式中,结合第一方面中第四种可能的实现方式,或者第五种可能的实现方式,或者第六中可能的实现方式,或者第七种可能的实现方式,所述根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
第二方面,本发明实施例提供一种声道间电平差处理装置,包括:
接收单元,用于接收立体声音频信号;
解析单元,用于根据所述接收单元接收的所述立体声音频信息,逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD,所述每一帧中包括至少两个子帧;
计算单元,用于根据所述解析单元解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;
第一加权处理单元,用于当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;
第二加权处理单元,用于当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。
在第一种可能的实现方式中,结合第二方面,所述第一加权处理单元,包括:
第一计算模块,用于根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
第二计算模块,用于根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
在第二种可能的实现方式中,结合第二方面中第一种可能的实现方式,所述第一计算模块,用于:
根据fac1(i,b)=1/L计算第i个子帧中的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子。
在第三种可能的实现方式中,结合第二方面中第二种可能的实现方式,所述第二计算模块,用于:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
在第四种可能的实现方式中,结合第二方面,所述第二加权处理单元,包括:
第三计算模块,用于根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;或者,第四计算模块,用于根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子;
第五计算模块,用于根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
在第五种可能的实现方式中,结合第二方面中第四种可能的实现方式,所述第三计算模块,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
在第六种可能的实现方式中,结合第二方面中第五种可能的实现方式,所述第四计算模块,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
在第七种可能的实现方式中,结合第二方面中第六种可能的实现方式,所述第四计算模块,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述M表示相邻的子带的数量,所述l表示相邻子带和当前子带的索引号的差值。
在第八种可能的实现方式中,结合第二方面中第四种可能的实现方式,或者第五种可能的实现方式,或者第六中可能的实现方式,或者第七种可能的实现方式,所述第五计算模块,用于:
根据计算所述任一帧中所述第b个子带的ICLD加
权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
本发明实施例提供一种声道间电平差处理方法,通过计接收立体声音频信号,并逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD,所述每一帧中包括至少两个子帧;根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。与现有技术中由于携带立体声音频的帧长较长,当处理10ms的立体声音频时,如果Normal分4帧进行处理,相当于每40ms(4*10ms)进行ICLD更新,则导致在信号变化迅速或者丢包情况下无法保证解码后的立体声音频质量,另外,如果逐帧传输ICLD,将无法实现立体声音频信号的低比特率传输相比,本发明通过子帧间的相关性,对任一个子帧的ICLD进行加权处理,使得根据采用本发明实施例提供的方法获得的实验数据中可以看出,在信号变化迅速或者丢包情况下保证解码后的立体声音频质量,并且实现立体声音频信号的低比特率传输。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例提供的一种声道间电平差处理方法的流程图;
图2为本发明另一个实施例提供的一种声道间电平差处理方法的流程图;
图3为本发明另一个实施例提供的一种声道间电平差处理方法的流程图;
图4为本发明另一个实施例提供的另一种声道间电平差处理方法的流程图;
图5为本发明一个实施例提供的一种声道间电平差处理装置的框图;
图6为本发明一个实施例提供的另一种声道间电平差处理装置的框图;
图7为本发明另一个实施例提供的另一种声道间电平差处理装置的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种声道间电平差处理方法,该方法应用于处理立体声音频的编码端,如图1所示,该方法包括:
步骤101,接收立体声音频信号,并逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD,所述每一帧中包括至少两个子帧。
立体声音频信号可以由许多帧构成。在本步骤中,每一帧进一步可以分为多个子帧,每一个子帧可以分为多个子带。其中,需要说明的是,在实际应用中,每一帧中包括的子帧数量为偶数个,并且每一帧中可以包括至少两个子帧,例如,一帧中包括2个子帧,或者一帧中包括4个子帧,或者一帧中包括6个子帧等等。每一个子帧中包括至少12个子带。
ICLD用于分辨立体声源的水平方向角度,描述了声道间的强度差别,该参数将影响整个频谱的频率成分。进一步可选的,ICLD为两个输入声道信号的功率比,例如,第b个子带的ICLD值为:
其中,XL(p)、XR(p)分别为左右声道的频域系数,P为频点值,level(b)的计算范围为Ab-1≤p<Ab,Ab-1、Ab分别表示不同频率对应的频点值,b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12。需要说明的是,所述K表示为了近似模拟人耳的听觉特性,可把具有相同频率分辨率的频谱系数根据临界频带理论划分为K个不相重叠的子带。
步骤102,根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和。
可选的,根据计算立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和,其中,所述i表示任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2。
步骤103,当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值。
可选的,预设阈值为根据实际经验获得的阈值。
当|sum(i)-sum(j)|<TH时,则判定所述任两个子帧的ICLD相接近,则采用第一加权方式计算所述任一帧中每个子带的ICLD加权值。其中,sum(i)、sum(j)分别表示所述第i个子帧、第j个子帧的ICLD的绝对值之和,所述j表示所述任一帧中包括的任一个子帧,0<j≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2。
可选的,本步骤包括:根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子;
根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,所述根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,包括:
根据fac1(i,b)=1/L计算第i个子帧中的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子。
进一步可选的,所述根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
步骤104,当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。
在本步骤中,当|sum(i)-sum(j)|≥TH时,则判定所述任两个子帧的ICLD相差较大,则采用第二加权方式计算所述任一个子帧中每个子带的ICLD加权值。需要说明的是,任一帧中包括的任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值可以理解为:所有的差的绝对值都大于等于预设阈值,或者部分差的绝对值小于预设阈值,并且其余差的绝对值大于等于预设阈值。
可选的,本步骤包括:根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,或者根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
进一步可选的,所述根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
进一步可选的,所述根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述M表示相邻的子带的数量,所述l表示相邻子带和当前子带的索引号的差值。需要说明的是,一个子帧可以分为K个子带,例如子带1、子带2……子带K,这里,1、2……K即为子带的索引号。为向下取整,为向上取整。
进一步可选的,所述根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
进一步可选的,在本步骤之后,对获得的ICLD加权值进行量化处理。可选的,这里量化处理为根据预设码本与ICLD加权值进行比较,获取与ICLD加权值最接近的预设码本中的值。例如,ICLD加权值为1.4,预设码本中包括0、2等值,则对ICLD加权值进行量化处理后获得的值为2。
进一步可选的,为了保证立体声音频的解码后的质量的前提下,减少比特的传输,在进行量化处理时,可以计算当前ICLD加权值与前一ICLD加权值的差值,将计算得到的差值进行量化处理。例如,一个子帧分为15个子带,将第1个子带的ICLD加权值直接进行量化处理,对第2个子带的ICLD加权值进行量化处理时,首先计算第2个子带的ICLD加权值与第1个子带的ICLD加权值的差值,然后将计算得到的差值进行量化处理,从而获得第2个子带的ICLD加权值的量化结果,可以根据计算第2个子带的ICLD加权值的量化结果的方法依次计算其他子带的ICLD加权值的量化结果。
本发明实施例提供一种声道间电平差处理方法,通过根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。与现有技术中由于携带立体声音频的帧长较长,当处理10ms的立体声音频时,如果Normal分4帧进行处理,相当于每40ms(4*10ms)进行ICLD更新,则导致在信号变化迅速或者丢包情况下无法保证解码后的立体声音频质量,另外,如果逐帧传输ICLD,将无法实现立体声音频信号的低比特率传输相比,本发明通过子帧间的相关性,对任一帧的子帧的ICLD进行加权处理,使得可以在信号变化迅速或者丢包情况下保证解码后的立体声音频质量,并且实现立体声音频信号的低比特率传输。
本发明实施例提供一种声道间电平差处理方法。本实施例中以一帧包括两个子帧进行详细描述,例如,一帧包括第一子帧与第二子帧,如图2所示,该方法包括:
步骤201,接收立体声音频信号,并逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD。
在本实施例中,每一帧中包括两个子帧。即接收立体声音频信号,并逐帧解析所述立体声音频信号,可以获得立体声音频信号的每一帧中第一子帧和第二子帧的各个子带的声道间电平差ICLD。
可选的,逐帧解析立体声音频信号,获取每一帧中每个子帧中的各个子带的ICLD的具体处理方式可以参考附图1中步骤101中的描述,在此不再一一赘述。
步骤202,根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中第一子帧和第二子帧的声道间电平差ICLD的绝对值之和。
可选的,根据计算立体声音频信号的任一帧中第一个子帧的ICLD的绝对值之和,其中,所述b表示所述第1个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12。
可选的,根据计算sum(1)的方法计算sum(2),在此不再一一赘述。
步骤203,判断所述第一子帧的ICLD的绝对值之和与所述第二子帧的ICLD的绝对值之和的差的绝对值是否都小于预设阈值。
可选的,根据|sum(1)-sum(2)|<TH判断所述第一子帧的ICLD的绝对值之和与第二子帧的ICLD的绝对值之和的差的绝对值是否都小于预设阈值。其中,TH为预设阈值,预设阈值可以根据实际经验进行设定。
步骤204,当所述第一子帧的ICLD的绝对值之和与所述第二子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值。
当|sum(1)-sum(2)|<TH时,表明第一子帧与第二子帧的ICLD相接近,则可以采用第一加权方式计算所述任一帧中每个子带的ICLD加权值。
可选的,本步骤包括:根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,包括:
根据fac1(i,b)=1/L计算第i个子帧的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2。
在本步骤中,L为2,则任一帧中第一个子帧或者第二个子帧的第一加权因子为fac1(i,b)=1/L=0.5。
进一步可选的,根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算任一帧中第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
在本步骤中,L=2,任一帧的ICLD加权值为:level(b)=[level(1,b)+level(2,b)]*0.5。
步骤205,当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。
当|sum(1)-sum(2)|≥TH时,表明第一子帧与第二子帧的ICLD相差较大,则可以采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。
可选的,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值,可以采用以下三种方式进行计算:方式一,整帧加权处理;方式二,基于当前子带的逐子带加权处理;方式三,基于相邻M个子带的逐子带加权处理。
可选的,采用方式一进行加权处理时,本步骤包括:
根据计算的所述立体声音频信号的所述任一帧中第一子帧或者第二子帧的ICLD的绝对值之和,计算第一子帧或者第二子帧中第b个子带的第二加权因子;
根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第b个子带的ICLD,计算任一帧中第b个子带的ICLD加权值。
可选的,根据计算的所述立体声音频信号的所述任一帧中第一子帧或者第二子帧的ICLD的绝对值之和,计算第一子帧或者第二子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
具体的,在本步骤中,i=1或2,fac2=sum(1)/[sum(1)+sum(2)]。
进一步可选的,根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第b个子带的ICLD,计算任一帧中第b个子带的ICLD加权值,包括:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
具体的,在本步骤中,任一帧的第b个子带的ICLD加权值为:
level(b)=fac2*level(1,b)+(1-fac2)*level(2,b)。
可选的,采用方式二进行加权处理时,本步骤包括:
根据所述计算的立体声音频的任一帧中包括的第一子帧或者第二子帧中的第b个子带的ICLD,计算第一子帧或者第二子帧中第b个子带的第二加权因子;
根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第b个子带的ICLD,计算任一帧中第b个子带的ICLD加权值。
进一步可选的,根据所述计算的立体声音频的任一帧中包括的第一子帧或者第二子帧中的第b个子带的ICLD,计算第一子帧或者第二子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
具体的,在本步骤中,i=1或2,fac2(b)=level(1,b)/[level(1,b)+level(2,b)]。
可选的,根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第b个子带的ICLD,计算任一帧中第b个子带的ICLD加权值,包括:
根据计算所述任一帧中第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,0<i≤L,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
具体的,在本步骤中,L=2,则任一帧的第b个子带的ICLD加权值为:
level(b)=fac2(b)*level(1,b)+(1-fac2(b))*level(2,b)。
可选的,采用方式三进行加权处理时,本步骤包括:
根据所述计算的立体声音频的任一帧中包括的第一子帧或者第二子帧中的第b个子带的ICLD,计算第一子帧或者第二子帧中第b个子带的第二加权因子;
根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第b个子带的ICLD,计算任一帧中第b个子带的ICLD加权值。
进一步可选的,根据所述计算的立体声音频的任一帧中包括的第一子帧或者第二子帧中的第b个子带的ICLD,计算第一子帧或者第二子帧中第b个子带的第二加权因子,包括:
根据计算所述第一子帧或者第二子帧中第b个子带的第二加权因子,其中,所述M表示所述任一帧中的任一个子帧中相邻的子带的数量。其中,所述l表示相邻子带与当前子带的索引号的差值。需要说明的是,一个子帧可以分为K个子带,例如子带1、子带2……子带K,这里,1、2……K即为子带的索引号。
具体的,在本步骤中,当基于相邻2子带的ICLD得到加权因子为:
在本步骤中,当基于相邻3子带的ICLD得到加权因子为:
需要说明的是,当需要计算基于相邻4个或者5个等其他个数子带的ICLD的加权因子时,可以参照上述基于M个子带的ICLD的加权因子的通用计算公式进行计算,在此不再一一具体举例说明。
可选的,根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第b个子带的ICLD,计算第一子帧或者第二子帧中第b个子带的ICLD加权值,与采用方式二计算任一帧中第b个子带的ICLD加权值的方法相同,L=2,即任一帧的中第b个子带的ICLD加权值为:
level(b)=fac2(b)*level(1,b)+(1-fac2(b))*level(2,b)。
步骤206,对获得的ICLD加权值进行量化处理。
可选的,这里量化处理为根据预设码本与ICLD加权值进行比较,获取与ICLD加权值最接近的预设码本中的值。例如,ICLD加权值为1.4,预设码本中包括0、2等值,则对ICLD加权值进行量化处理后获得的值为2。
进一步可选的,为了保证立体声音频的解码后的质量的前提下,减少比特的传输,在进行量化处理时,可以计算当前ICLD加权值与前一ICLD加权值的差值,将计算得到的差值进行量化处理。例如,一个子帧分为15个子带,将第1个子带的ICLD加权值直接进行量化处理,对第2个子带的ICLD加权值进行量化处理时,首先计算第2个子带的ICLD加权值与第1个子带的ICLD加权值的差值,然后将计算得到的差值进行量化处理,从而获得第2个子带的ICLD加权值的量化结果,可以根据计算第2个子带的ICLD加权值的量化结果的方法依次计算其他子带的ICLD加权值的量化结果。
下面以一帧包括四个子帧进行详细描述,如图3所示,该方法包括:
步骤301,接收立体声音频信号,并逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD。
可选的,所述每一帧中包括四个子帧。可选的,逐帧解析立体声音频信号,获取每一帧中每个子帧中的各个子带的ICLD的具体处理方式可以参考附图1中步骤101中的描述,在此不再一一赘述。
步骤302,根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和。
可选的,根据计算立体声音频信号的任一帧中第一个子帧的ICLD的绝对值之和,其中,所述b表示所述第1个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12,所述i表示任一帧中包括的任一个子帧,在本实施例中,0<i≤4。
步骤303,判断所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值是否都小于预设阈值。
可选的,根据|sum(i)-sum(j)|<TH判断所述任一帧中第i个子帧与第j个子帧的ICLD的绝对值之和的差的绝对值是否都小于预设阈值。其中,TH为预设阈值,预设阈值可以根据实际经验进行设定。
步骤304,当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值。
当|sum(i)-sum(j)|<TH时,表明第i个子帧与第j个子帧的ICLD相接近,则可以采用第一加权方式计算所述任一帧中每个子带的ICLD加权值。
可选的,本步骤包括:
根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,包括:
根据fac1(i,b)=1/L计算第i个子帧中的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2。
在本步骤中,L=4,则第一加权因子为fac1(i,b)=1/L=0.25。
进一步可选的,根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算任一帧中第b个子带的ICLD加权值,其中,所述level(b)表示所述任两个子帧中第b个子带的ICLD加权值,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
在本步骤中,任一帧的第b个子带的ICLD加权值为:
步骤305,当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。
当|sum(i)-sum(j)|≥TH时,表明第i个子帧与第j个子帧的ICLD相差较大,则可以采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。需要说明的是,任一帧中包括的任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值可以理解为:所有的差的绝对值都大于等于预设阈值,或者部分差的绝对值小于预设阈值,并且其余差的绝对值大于等于预设阈值。例如,
|sum(1)-sum(2)|≥TH,|sum(1)-sum(3)|≥TH,|sum(1)-sum(4)|≥TH,
|sum(2)-sum(3)|≥TH,|sum(2)-sum(3)|≥TH,|sum(3)-sum(4)|≥TH;或者,
|sum(1)-sum(2)|≥TH,|sum(1)-sum(3)|≥TH,|sum(1)-sum(4)|<TH,
|sum(2)-sum(3)|<TH,|sum(2)-sum(3)|<TH,|sum(3)-sum(4)|<TH时,可以采用第二加权方式计算所述任一帧中任一个子带的ICLD加权值。
可选的,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值,可以采用以下三种方式进行计算:方式一,整帧加权处理;方式二,基于当前子带的逐子带加权处理;方式三,基于相邻M个子带的逐子带加权处理。
可选的,采用方式一进行加权处理时,本步骤包括:
根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
可选的,根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
进一步可选的,在本步骤中,L=4,计算第i个子帧中第b个子带的的第二加权因子:
进一步可选的,根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
进一步可选的,在本步骤中,L=4,计算任一帧中第b个子带的ICLD加权值:
可选的,采用方式二进行加权处理时,本步骤包括:
根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子;
根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
进一步可选的,在本步骤中,L=4,计算第i个子帧中第b个子带的第二加权因子:
可选的,根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算所述任一帧中第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,0<i≤L,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
进一步可选的,在本步骤中,计算任一帧中第b个子带的ICLD加权值:
可选的,采用方式三进行加权处理时,本步骤包括:
根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子;
根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中第b个子带的第二加权因子,其中,所述M表示所述任一帧中的任一个子帧中相邻的子带的数量,所述l表示相邻子带和当前子带的索引号的差值。需要说明的是,一个子帧可以分为K个子带,例如子带1、子带2……子带K,这里,1、2……K即为子带的索引号。
进一步可选的,在本步骤中,基于相邻2子带的ICLD计算第i个子帧中第b个子带的第二加权因子:
进一步可选的,在本步骤中,基于相邻3子带的ICLD计算第i个子帧中第b个子带的第二加权因子:
需要说明的是,当需要计算基于相邻4个或者5个等其他个数子带的ICLD的加权因子时,可以参照上述基于M个子带的ICLD的加权因子的通用计算公式进行计算,在此不再一一具体举例说明。根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值
可选的,根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,与采用方式二计算任一帧中第b个子带的ICLD加权值的方法相同,即任一帧的第b个子带的CLD加权值为:
步骤306,对获得的ICLD加权值进行量化处理。
可选的,这里量化处理为根据预设码本与ICLD加权值进行比较,获取与ICLD加权值最接近的预设码本中的值。例如,ICLD加权值为1.4,预设码本中包括0、2等值,则对ICLD加权值进行量化处理后获得的值为2。
进一步可选的,为了保证立体声音频的解码后的质量的前提下,减少比特的传输,在进行量化处理时,可以计算当前ICLD加权值与前一ICLD加权值的差,将计算得到的差进行量化处理。例如,一个子帧分为15个子带,将第1个子带的ICLD加权值直接进行量化处理,对第2个子带的ICLD加权值进行量化处理时,首先计算第2个子带的ICLD加权值与第1个子带的ICLD加权值的差值,然后将计算得到的差值进行量化处理,从而获得第2个子带的ICLD加权值的量化结果,可以根据计算第2个子带的ICLD加权值的量化结果的方法依次计算其他子带的ICLD加权值的量化结果。
需要说明的是,当一帧立体声音频信号分为2个子帧,一个子帧分为12个子带时,在立体声音频信号传输过程中没有丢包时,现有技术获得的分段信噪比(segmentalsignal-to-noise ratio,SSNR)为3.63dB,而采用本发明实施例提供的方法后,获得的SSNR为3.73dB。需要说明的是,SSNR值越大,说明编解码处理音频越接近原始音频,即效果越好。因此,本发明实施例提供的方法较现有技术提升0.1dB以上。而在立体声音频信号传输过程中存在丢包时,现有技术获得的SSNR为3.59dB,而采用本发明实施例提供的方法后,获得的SSNR为3.72dB,测试结果与没有丢包情况下获得的测试结果相近。
本发明实施例提供一种声道间电平差处理方法,通过基于子帧间相关性,对任一个子帧的ICLD进行加权处理,并对ICLD加权值进行量化处理,使得能够有效降低编码比特率,且在信号变化迅速及丢包情况下能够保证解码立体声音频质量,达到了预想效果。
本发明实施例提供一种声道间电平差处理方法,如图4所示,在立体声音频解码端,接收输入的量化处理后的立体声音频比特流,解析此比特流获得K(K≥12)个子带的ICLD,将各个子带的ICLD值依次对应地作为当前各个子帧的各个子带的ICLD,从而获得解码后的立体声音频信号。
例如,解析接收到的比特流后获得的子带1的ICLD为A,子带2的ICLD为B,子带3的ICLD为C等,当前帧分为L个子帧,则每个子帧的子带1的ICLD为A,子带2的ICLD为B,子带3的ICLD为C等。
本发明实施例提供的一种声道间电平差处理方法,将接收到的量化处理后的立体声音频比特流进行解码后,可以获得较高质量的立体声音频,并且实现了立体声音频信号的低比特率传输。
本发明实施例提供一种声道间电平差处理装置,该装置可以为处理立体声音频的编码端,如图5所示,该装置包括:接收单元501,解析单元502,计算单元503,第一加权处理单元504,第二加权处理单元505;
接收单元501,用于接收立体声音频信号;
解析单元502,用于根据所述接收单元501接收的所述立体声音频信息,逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD,所述每一帧中包括至少两个子帧;
立体声音频信号可以由许多帧构成。在本步骤中,每一帧进一步可以分为多个子帧,每一个子帧可以分为多个子带。其中,需要说明的是,在实际应用中,每一帧中包括的子帧数量为偶数个,并且每一帧中可以包括至少两个子帧,例如,一帧中包括2个子帧,或者一帧中包括4个子帧,或者一帧中包括6个子帧等等。每一个子帧中包括至少12个子带。
ICLD用于分辨立体声源的水平方向角度,描述了声道间的强度差别,该参数将影响整个频谱的频率成分。
计算单元503,用于根据所述解析单元502解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;
第一加权处理单元504,用于当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;
第二加权处理单元505,用于当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。需要说明的是,任一帧中包括的任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值可以理解为:所有的差的绝对值都大于等于预设阈值,或者部分差的绝对值小于预设阈值,并且其余差的绝对值大于等于预设阈值。
进一步可选的,在计算单元503根据所述解析单元解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和之后,当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,第一加权处理单元504采用第一加权方式计算所述任一帧中每个子带的ICLD加权值之前,或者,当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,第二加权处理单元505采用第二加权方式计算所述任一帧中每个子带的ICLD加权值之前,可以先判断所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值是否都小于预设阈值。
进一步可选的,如图6所示,所述第一加权处理单元504,包括:第一计算模块5041,第二计算模块5042。
第一计算模块5041,用于根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
所述第一计算模块5041用于:
根据fac1(i,b)=1/L计算第i个子帧中的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子。
第二计算模块5042,用于根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
所述第二计算模块5042,用于:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
进一步可选的,所述第二加权处理单元505,包括:第三计算模块5051,第四计算模块5052,第五计算模块5053。
第三计算模块5051,用于根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;或者,第四计算模块5052,用于根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子;
第五计算模块5053,用于根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,采用整帧加权处理方式计算所述第i个子帧中第b个子带的第二加权因子时,所述第三计算模块5051,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
进一步可选的,采用基于当前子带的ICLD进行逐子带加权处理方式,计算所述第i个子帧中第b个子带的第二加权因子时,所述第四计算模块5052,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
进一步可选的,采用基于相邻M子带的ICLD进行逐子带加权处理方式,计算所述第i个子帧中第b个子带的第二加因子权时,所述第四计算模块5052,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述M表示相邻的子带的数量,所述l表示相邻子带和当前子带的索引号的差值。需要说明的是,一个子帧可以分为K个子带,例如子带1、子带2……子带K,这里,1、2……K即为子带的索引号。
进一步可选的,所述第五计算模块5053,用于:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
需要说明的是,附图5或附图6所示装置中,其各个模块的具体实施过程以及各个模块之间的信息交互等内容,由于与本发明方法实施例基于同一发明构思,可以参见方法实施例,在此不一一赘述。
需要说明的是,当一帧立体声音频信号分为2个子帧,一个子帧分为12个子带时,在立体声音频信号传输过程中没有丢包时,现有技术获得的分段信噪比(segmentalsignal-to-noise ratio,SSNR)为3.63dB,而采用本发明实施例提供的方法后,获得的SSNR为3.73dB。需要说明的是,SSNR值越大,说明编解码处理音频越接近原始音频,即效果越好。因此,本发明实施例提供的方法较现有技术提升0.1dB以上。而在立体声音频信号传输过程中存在丢包时,现有技术获得的SSNR为3.59dB,而采用本发明实施例提供的方法后,获得的SSNR为3.72dB,测试结果与没有丢包情况下获得的测试结果相近。
本发明实施例提供一种声道间电平差处理装置,通过基于子帧间相关性,对任一个子帧的ICLD进行加权处理,并对ICLD加权值进行量化处理,使得能够有效降低编码比特率,且在信号变化迅速及丢包情况下能够保证解码立体声音频质量,达到了预想效果。
本发明实施例提供一种声道间电平差处理装置,该装置可以为处理立体声音频的编码端,如图7所示,该装置包括:接收器701,存储器702,处理器703.
接收器701,用于接收立体声音频信号;
存储器702,用于存储包括程序的信息;
处理器703,与接收器701、存储器702连接,用于控制所述程序的执行,具体包括:根据接收的所述立体声音频信息,逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD,所述每一帧中包括至少两个子帧;以及根据所述解析单元解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;以及当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值。
需要说明的是,任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值可以理解为:所有的差的绝对值都大于等于预设阈值,或者部分差的绝对值小于预设阈值,并且其余差的绝对值大于等于预设阈值。
可选的,立体声音频信号可以由许多帧构成。在本步骤中,每一帧可以分为多个子帧,每一个子帧可以分为多个子带。其中,需要说明的是,在实际应用中,每一帧中包括的子帧数量为偶数个,并且每一帧中可以包括至少两个子帧,例如,一帧中包括2个子帧,或者一帧中包括4个子帧,或者一帧中包括6个子帧等等。每一个子帧中包括至少12个子带。
ICLD用于分辨立体声源的水平方向角度,描述了声道间的强度差别,该参数将影响整个频谱的频率成分。
进一步可选的,所述处理器703还用于计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和之后,并且在当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值之前,或者,在当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值之前,用于判断所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值是否都小于预设阈值。
进一步可选的,所述处理器703采用第一加权方式计算所述任一帧中每个子带的ICLD加权值时,用于根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;以及根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,所述处理器703根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子时,具体用于:根据fac1(i,b)=1/L计算第i个子帧中的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子。
进一步可选的,所述处理器703根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值时,具体用于:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
进一步可选的,所述处理器703采用第二加权方式计算所述任一帧中每个子带的ICLD加权值时,用于根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;或者,根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子;以及根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
进一步可选的,所述处理器703根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子时,用于
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
进一步可选的,所述处理器703根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子时,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
进一步可选的,所述处理器703根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子时,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述M表示相邻的子带的数量,所述l表示相邻子带和当前子带的索引号的差值。需要说明的是,一个子帧可以分为K个子带,例如子带1、子带2……子带K,这里,1、2……K即为子带的索引号。
进一步可选的,所述处理器703根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值时,用于:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
需要说明的是,附图7所示装置中,其各个模块的具体实施过程以及各个模块之间的信息交互等内容,由于与本发明方法实施例基于同一发明构思,可以参见方法实施例,在此不一一赘述。
需要说明的是,当一帧立体声音频信号分为2个子帧,一个子帧分为12个子带时,在立体声音频信号传输过程中没有丢包时,现有技术获得的分段信噪比(segmentalsignal-to-noise ratio,SSNR)为3.63dB,而采用本发明实施例提供的方法后,获得的SSNR为3.73dB。需要说明的是,SSNR值越大,说明编解码处理音频越接近原始音频,即效果越好。因此,本发明实施例提供的方法较现有技术提升0.1dB以上。而在立体声音频信号传输过程中存在丢包时,现有技术获得的SSNR为3.59dB,而采用本发明实施例提供的方法后,获得的SSNR为3.72dB,测试结果与没有丢包情况下获得的测试结果相近。
可见,本发明实施例提供一种声道间电平差处理装置,通过基于子帧间相关性,对任一个子帧的ICLD进行加权处理,并对ICLD加权值进行量化处理,使得能够有效降低编码比特率,且在信号变化迅速及丢包情况下能够保证解码立体声音频质量,达到了预想效果。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (18)
1.一种声道间电平差处理方法,其特征在于,包括:
接收立体声音频信号,并逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD,所述每一帧中包括至少两个子帧;
根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;
当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;
当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值;
将所述ICLD加权值与预设码本中的码字进行比较,确定与所述ICLD加权值对应的量化值。
2.根据权利要求1所述的方法,其特征在于,所述采用第一加权方式计算所述任一帧中每个子带的ICLD加权值,包括:
根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,包括:
根据fac1(i,b)=1/L计算第i个子帧中的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
5.根据权利要求1所述的方法,其特征在于,所述采用第二加权方式计算所述任一帧中每个子带的ICLD加权值,包括:
根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,或者根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
6.根据权利要求5所述的方法,其特征在于,根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
7.根据权利要求6所述的方法,其特征在于,所述根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
8.根据权利要求7所述的方法,其特征在于,所述根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子,包括:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述M表示相邻的子带的数量,所述l表示相邻子带和当前子带的索引号的差值。
9.根据权利要求5-8中任一项所述的方法,其特征在于,所述根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值,包括:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
10.一种声道间电平差处理装置,其特征在于,包括:
接收单元,用于接收立体声音频信号;
解析单元,用于根据所述接收单元接收的立体声音频信息,逐帧解析所述立体声音频信号,获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差ICLD,所述每一帧中包括至少两个子帧;
计算单元,用于根据所述解析单元解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD,计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和;
第一加权处理单元,用于当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时,采用第一加权方式计算所述任一帧中每个子带的ICLD加权值;
第二加权处理单元,用于当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值不小于预设阈值时,采用第二加权方式计算所述任一帧中每个子带的ICLD加权值;
量化处理单元,用于将所述ICLD加权值与预设码本中的码字进行比较,确定与所述ICLD加权值对应的量化值。
11.根据权利要求10所述的装置,其特征在于,所述第一加权处理单元,包括:
第一计算模块,用于根据所述任一帧中包括的子帧数量,计算第i个子帧中第b个子带的第一加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;
第二计算模块,用于根据所述第一加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
12.根据权利要求11所述的装置,其特征在于,所述第一计算模块,用于:
根据fac1(i,b)=1/L计算第i个子帧中的第b个子带的第一加权因子,其中,所述fac1(i,b)表示第i个子帧中的第b个子带的所述第一加权因子。
13.根据权利要求12所述的装置,其特征在于,所述第二计算模块,用于:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
14.根据权利要求10所述的装置,其特征在于,所述第二加权处理单元,包括:
第三计算模块,用于根据计算的所述立体声音频信号的所述任一帧中每个子帧的ICLD的绝对值之和,计算所述第i个子帧中第b个子带的第二加权因子,所述i表示所述任一帧中包括的任一个子帧,0<i≤L,所述L为所述任一帧中包括的子帧数量,并且L≥2,所述b表示所述第i个子帧中任一个子带,0<b≤K,所述K表示任一个子帧中包括的子带数量,K≥12;或者,第四计算模块,用于根据所述任一帧中的第i个子帧中第b个子带的ICLD,计算所述第i个子帧中第b个子带的第二加权因子;
第五计算模块,用于根据所述第二加权因子以及所述任一帧中所述第i个子帧中所述第b个子带的ICLD,计算所述任一帧中所述第b个子带的ICLD加权值。
15.根据权利要求14所述的装置,其特征在于,所述第三计算模块,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述fac2(i,b)为第i个子帧中第b个子带的第二加权因子,所述sum(i)表示所述第i个子帧中每个子带的ICLD的绝对值之和,所述sum(j)表示所述第j个子帧中每个子带的ICLD的绝对值之和,所述j为所述任一帧中包括任一个子帧,0<j≤L。
16.根据权利要求15所述的装置,其特征在于,所述第四计算模块,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述level(i,b)表示第i个子帧的第b个子带的ICLD,所述level(j,b)表示第j个子帧的第b个子带的ICLD。
17.根据权利要求16所述的装置,其特征在于,所述第四计算模块,用于:
根据计算所述第i个子帧中所述第b个子带的第二加权因子,其中,所述M表示相邻的子带的数量,所述l表示相邻子带和当前子带的索引号的差值。
18.根据权利要求14-17中任一项所述的装置,其特征在于,所述第五计算模块,用于:
根据计算所述任一帧中所述第b个子带的ICLD加权值,其中,所述level(b)表示所述任一帧中第b个子带的ICLD加权值,所述fac2(i,b)为所述第i个子帧中所述第b个子带的第二加权因子,所述level(i,b)表示第i个子帧的第b个子带的ICLD。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310298100.2A CN104299615B (zh) | 2013-07-16 | 2013-07-16 | 一种声道间电平差处理方法及装置 |
PCT/CN2014/070131 WO2015007075A1 (zh) | 2013-07-16 | 2014-01-04 | 一种声道间电平差处理方法及装置 |
EP14826895.6A EP2977984B1 (en) | 2013-07-16 | 2014-01-04 | Method and device for processing inter-channel voltage level difference |
JP2016520245A JP6106336B2 (ja) | 2013-07-16 | 2014-01-04 | チャネル間レベル差処理方法及び装置 |
KR1020157032153A KR101730362B1 (ko) | 2013-07-16 | 2014-01-04 | 채널간 레벨 차이 계산 방법 및 장치 |
BR112015030201A BR112015030201A2 (pt) | 2013-07-16 | 2014-01-04 | método e aparelho de processamento de diferença de nível intercanal |
US14/931,975 US10002615B2 (en) | 2013-07-16 | 2015-11-04 | Inter-channel level difference processing method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310298100.2A CN104299615B (zh) | 2013-07-16 | 2013-07-16 | 一种声道间电平差处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104299615A CN104299615A (zh) | 2015-01-21 |
CN104299615B true CN104299615B (zh) | 2017-11-17 |
Family
ID=52319314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310298100.2A Active CN104299615B (zh) | 2013-07-16 | 2013-07-16 | 一种声道间电平差处理方法及装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10002615B2 (zh) |
EP (1) | EP2977984B1 (zh) |
JP (1) | JP6106336B2 (zh) |
KR (1) | KR101730362B1 (zh) |
CN (1) | CN104299615B (zh) |
BR (1) | BR112015030201A2 (zh) |
WO (1) | WO2015007075A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10109284B2 (en) | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
GB201909715D0 (en) | 2019-07-05 | 2019-08-21 | Nokia Technologies Oy | Stereo audio |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009125046A1 (en) * | 2008-04-11 | 2009-10-15 | Nokia Corporation | Processing of signals |
US9025775B2 (en) * | 2008-07-01 | 2015-05-05 | Nokia Corporation | Apparatus and method for adjusting spatial cue information of a multichannel audio signal |
EP2353160A1 (en) * | 2008-10-03 | 2011-08-10 | Nokia Corporation | An apparatus |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
CN102157151B (zh) | 2010-02-11 | 2012-10-03 | 华为技术有限公司 | 一种多声道信号编码方法、解码方法、装置和*** |
EP2375410B1 (en) * | 2010-03-29 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
-
2013
- 2013-07-16 CN CN201310298100.2A patent/CN104299615B/zh active Active
-
2014
- 2014-01-04 EP EP14826895.6A patent/EP2977984B1/en not_active Not-in-force
- 2014-01-04 JP JP2016520245A patent/JP6106336B2/ja not_active Expired - Fee Related
- 2014-01-04 BR BR112015030201A patent/BR112015030201A2/pt not_active IP Right Cessation
- 2014-01-04 WO PCT/CN2014/070131 patent/WO2015007075A1/zh active Application Filing
- 2014-01-04 KR KR1020157032153A patent/KR101730362B1/ko active IP Right Grant
-
2015
- 2015-11-04 US US14/931,975 patent/US10002615B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
BR112015030201A2 (pt) | 2017-07-25 |
JP6106336B2 (ja) | 2017-03-29 |
EP2977984A1 (en) | 2016-01-27 |
KR101730362B1 (ko) | 2017-04-26 |
KR20150140802A (ko) | 2015-12-16 |
EP2977984A4 (en) | 2016-06-29 |
EP2977984B1 (en) | 2018-12-12 |
US20160055856A1 (en) | 2016-02-25 |
CN104299615A (zh) | 2015-01-21 |
WO2015007075A1 (zh) | 2015-01-22 |
US10002615B2 (en) | 2018-06-19 |
JP2016522451A (ja) | 2016-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6302071B2 (ja) | 無損失符号化方法及び無損失復号化方法 | |
CN103415884B (zh) | 用于执行霍夫曼编码的装置和方法 | |
CN105531763B (zh) | 用于先进耦合的不均匀参数量化 | |
CN101485094B (zh) | 最大熵意义下后向兼容多通道音频编码与解码方法和*** | |
KR20090041439A (ko) | 오디오 인코딩 시스템 | |
BR112020016948A2 (pt) | Métodos e dispositivos para gerar ou decodificar um fluxo de bits compreendendo sinais de áudio imersivos | |
US8041041B1 (en) | Method and system for providing stereo-channel based multi-channel audio coding | |
CN106663432A (zh) | 对压缩的hoa表示解码的方法和装置以及对压缩的hoa表示编码的方法和装置 | |
KR102512359B1 (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 | |
KR20210111898A (ko) | 다중 채널 오디오 신호 처리 방법, 장치 및 시스템 | |
CN104299615B (zh) | 一种声道间电平差处理方法及装置 | |
US20190057706A1 (en) | Signal Encoding And Decoding Methods and Devices | |
CN109036441B (zh) | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 | |
CN107452387B (zh) | 一种声道间相位差参数的提取方法及装置 | |
EP3637415B1 (en) | Inter-channel phase difference parameter coding method and device | |
CN104464742B (zh) | 一种3d音频空间参数全方位非均匀量化编码***及方法 | |
CN102855876B (zh) | 音频编码器和音频编码方法 | |
CN101800048A (zh) | 基于dra编码器的多声道数字音频编码方法及其编码*** | |
CN106463131A (zh) | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 | |
CN116798438A (zh) | 一种多声道信号的编解码方法和编解码设备以及终端设备 | |
CN102760442B (zh) | 一种3d音频中水平方位参数量化方法 | |
KR20240005905A (ko) | 3차원 오디오 신호 코딩 방법 및 장치, 및 인코더 | |
CN102479514A (zh) | 一种编码方法、解码方法、装置和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210423 Address after: Unit 3401, unit a, building 6, Shenye Zhongcheng, No. 8089, Hongli West Road, Donghai community, Xiangmihu street, Futian District, Shenzhen, Guangdong 518040 Patentee after: Honor Device Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |