CN102446507A

CN102446507A - 一种下混信号生成、还原的方法和装置

Info

Publication number: CN102446507A
Application number: CN201110289391XA
Authority: CN
Inventors: 吴文海; 苗磊; 郎玥; 大卫·维雷特
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2011-09-27
Filing date: 2011-09-27
Publication date: 2012-05-09
Anticipated expiration: 2031-09-27
Also published as: US20140211947A1; EP2722845B1; US9516447B2; ES2569384T3; EP2722845A4; WO2013044826A1; CN102446507B; EP2722845A1

Abstract

本发明实施例提供了一种下混信号的生成方法，包括：对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；计算每个频带的声道能量比和声道相位差；根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差；根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。该方法有效的提高了立体声编解码的质量。

Description

一种下混信号生成、还原的方法和装置

技术领域

本发明涉及立体声编码解码领域，具体涉及一种下混信号生成、还原的方法和装置。

背景技术

在现有立体声编码方法中，绝大多数方法都是将左右两路声道信号下混得到一个单声道信号，而将左右声道的声场信息作为边带信号传输。左右声道的声场信息通常包括左右声道的能量比、左右声道的相位差、左右声道的互相关参数，及第一声道或第二声道与下混信号的相位差参数。现有方法将这些参数作为边信息进行编码并发送到解码端，以恢复立体声信号。

在这类方法中，下混方法、左右声道的声场信息提取及合成都属于核心技术，目前业界也有许多研究成果。现有的立体声下混方法可以分为被动下混和主动下混两种。

被动下混算法比较简单、延时较低，下混因子一般采用0.5来计算。

m(n)＝0.5·(x₁(n)+x₂(n))。

其中x₁(n)、x₂(n)分别表示左声道信号、右声道信号，m(n)表示下混信号。

当左右声道完全反相且幅度相同时，下混信号为0，解码端根本没有办法恢复左右两路声道。即使不完全反相，也会带来下混信号能量缺失。

为了解决被动算法造成的下混信号能量缺失问题，主动下混算法首先将左右两路信号进行时频变换，在频域调整信号的幅度和或相位，从而最大程度的保持下混信号的能量。以下是一个调整相位的例子：

首先对左信号、右信号进行时频变换得到X₁(k)、X₂(k)，在频域计算每个子带内的相位差；再根据相位差对右路信号进行相位旋转，得到相位旋转后的信号

旋转后右声道信号的相位和左路信号相位保持一致。然后根据如下公式将相位调整后的

与X₁(k)相加并乘以0.5后得到频域的下混信号，

最后通过时频逆变换得到时域的下混信号。这种方法能解决左右声道信号反相的能量缺失问题。

但现有的下混方法存在左右声道反相且经常跳变以及左右声道相位差别变换较快的立体声信号的下混性能问题，降低了立体声编解码的主观质量。

发明内容

本发明实施例提供了一种下混信号生成、还原的方法和装置，以提高立体声编解码的质量。

本发明实施例提供了一种下混信号的生成方法，方法包括：对左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。

本发明实施例提供了下混信号的生成装置，包括：时频变换单元，用于对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；频带计算单元，用于计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；相位差计算单元，用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；频域下混信号计算单元：下混信号计算单元，用于根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。

本发明实施例提供了一种下混信号的还原方法，包括：根据下混信号的频域信号幅度、接收到的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息；根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。

本发明实施例提供了一种下混信号的还原装置，其特征在于，包括：信号幅度计算单元：用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道量比反映了左声道信号和右声道信号在每个频带的能量比信息；信号相位计算单元：用于根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；频域信号计算单元：用于根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。

本发明实施例的方法和装置，减少左右声道反相、跳变及左右声道相位差别变换较快等因素对下混性能的干扰，有效的提高了立体声编解码的质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明下混信号的生成方法的一个实施例的流程图；

图2为本发明下混信号的生成装置的一个实施例的结构图；

图3为本发明下混信号的还原方法的一个实施例的流程图；

图4为本发明下混信号的还原装置的一个实施例的结构图。

本领域技术人员可以理解附图只是一个优选实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种下混信号的生成方法，方法包括：

对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；

计算每个频带的声道能量比(Channel Level Difference，CLD)和声道相位差(Internal Phase Difference，IPD)，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；

根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；

根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。

请参考附图1，图1为由左声道信号和右声道信号生成下混信号方法的一个实施例的流程图，步骤包括：

S101对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；

S103计算每个频带的声道能量比和声道相位差；

S105计算下混信号和第一声道信号在每个频带的相位差；

S107计算频域下混信号。

S101对左声道信号和右声道信号进行时频变换，在具体的实施方法中，可以使用傅立叶变换(Fourier Transform，FT)、快速傅立叶变换(FastFourier Transform，FFT)、正交镜像变换(Quadrature Mirror Filterbanks，QMF)等变换方法。左声道信号和右声道信号变换到频域，分别得到L(k)和R(k)。

将频域信号分成若干频带，在本发明的一个实施例中，频带宽度为1。设k为频率点索引，b为频带索引，kb为第b个频带的起始频率点索引。

S103计算每个频带的CLD和IPD，包括根据如下公式计算：

CLD (b) = 10 \log_{10} \frac{Σ_{k = k_{b}}^{k_{b + 1} - 1} X_{1} (k) X_{1}^{*} (k)}{Σ_{k = k_{b}}^{k_{b + 1} - 1} X_{2} (k) X_{2}^{*} (k)};

IPD(b)＝∠cor(b)，其中

cor (b) = Σ_{k = k_{b}}^{k = k_{b + 1} - 1} X_{1} (k) * X_{2}^{*} (k) .

其中，X1(k)是左声道信号，X2(k)是右声道信号。

S105计算下混信号和第一声道信号在每个频带的相位差。

实施例1：在本发明的一个实施例中，第一声道是左声道。

所述下混信号和左声道信号在每个频带的相位差根据如下公式计算：

θ (b) = \frac{1}{1 + c (b)} \cdot IPD (b);

其中c(b)＝10^CLD(b)10。

CLD(b)是第b个频带的所述声道能量比，c(b)是用于计算的中间值变量，IPD(b)是第b个频带的所述声道相位差，θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。

左声道信号能量越大，所述下混信号与左声道的相位差越小；而当右声道能量越大时，下混信号与左声道的相位差越大，下混信号与右信道的相位差越小。下混信号与左声道的相位差和左声道信号能量成正向关系，下混信号与左声道的相位差和右声道能量成反向关系，下混信号与左声道的相位差和声道相位差成正向关系。

S107计算频域下混信号，所述频域下混信号根据如下公式计算：

M_{r} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{r} (k) \cos (θ (b)) + L_{i} (k) \sin (θ (b)));

M_{i} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{i} (k) \cos (θ (b)) - L_{r} (k) \sin (θ (b))) .

k为频率点索引，L_r(k)是左声道信号时频变换第k个频率点的实部，L_i(k)是左声道信号时频变换第k个频率点的虚部，R_mag(k)是右声道信号时频变换第k个频率点的幅度，L_mag(k)是左声道信号时频变换第k个频率点的幅度，M_i(k)是下混信号时频变换第k个频率点的实部，M_r(k)是下混信号时频变换第k个频率点的虚部，θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。

实施例2：在本发明的另一个实施例中，第一声道是右声道。

所述下混信号和右声道信号在每个频带的相位差根据如下公式计算：

θ (b) = \frac{c (b)}{1 + c (b)} \cdot IPD (b);

其中c(b)＝10^CLD(b)10。

左声道信号能量越大，所述下混信号与右声道的相位差越大，下混信号与左声道的相位差越小；而当右声道能量越大时，下混信号与右声道的相位差越小。所述下混信号与右声道的相位差与右声道的能量成反向关系，所述下混信号与右声道的相位差与左声道的能量成正向关系，与所述声道相位差成正向关系。

M_{i} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{i} (k) \cos (θ (b)) - R_{r} (k) \sin (θ (b)));

M_{r} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{r} (k) \cos (θ (b)) + R_{i} (k) \sin (θ (b))) .

实施例3：在本发明的再一个实施例中，第一声道是左声道和右声道中信号幅度更大的声道。

如果左声道信号的幅度大于右声道信号的幅度，第一声道是左声道，下混信号和所述左声道和右声道中信号幅度更大的声道的相位差根据如下公式计算：

θ (b) = \frac{1}{1 + c (b)} \cdot IPD (b);

其中c(b)＝10^CLD(b)/10。

M_{r} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{r} (k) \cos (θ (b)) + L_{i} (k) \sin (θ (b)));

M_{i} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{i} (k) \cos (θ (b)) - L_{r} (k) \sin (θ (b))) .

如果右声道信号的幅度大于左声道信号的幅度，第一声道是右声道，下混信号和所述左声道和右声道中信号幅度更大的声道的相位差根据如下公式计算：

θ (b) = \frac{c (b)}{1 + c (b)} \cdot IPD (b);

其中c(b)＝10^CLD(b)/10。

{; M}_{i} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{i} (k) \cos (θ (b)) - R_{r} (k) \sin (θ (b)))

M_{r} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{r} (k) \cos (θ (b)) + R_{i} (k) \sin (θ (b))) .

本发明实施例的下混信号生成方法不仅具有实施例1和实施例2的优点，还能有效解决小信号相位变换较快影响立体声下混性能的问题。

实施例4：本发明的又一个实施例中，在所述根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后，还包括：所述下混信号和第一声道的相位差根据群相位更新，所述群相位反映了左声道信号和右声道信号的频域包络相似性。

在本发明的一个实施例中，群相位θ_g是各个频带IPD的均值。

若第一声道是左声道：所述下混信号和左声道信号在每个频带的相位差根据如下公式计算：

θ (b) = \frac{1}{1 + c (b)} \cdot (IPD (b) - θ_{g});

其中c(b)＝10^CLD(b)/10。

左声道信号能量越大，所述下混信号与左声道的相位差越小；而当右声道能量越大时，下混信号与右声道的相位差越小。

M_{r} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{r} (k) \cos (θ (b)) + L_{i} (k) \sin (θ (b)));

M_{i} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{i} (k) \cos (θ (b)) - L_{r} (k) \sin (θ (b))) .

若第一声道是右声道，所述下混信号和右声道信号在每个频带的相位差根据如下公式计算：

θ (b) = \frac{c (b)}{1 + c (b)} \cdot IPD (b);

其中c(b)＝10^CLD(b)/10。

左声道信号能量越大，所述下混信号与左声道信号的相位差越小；而当右声道能量越大时，下混信号与右声道信号的相位差越小。

M_{i} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{i} (k) \cos (θ (b)) - R_{r} (k) \sin (θ (b)));

M_{r} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{r} (k) \cos (θ (b)) + R_{i} (k) \sin (θ (b))) .

在所述S107计算频域下混信号之后，本发明实施例的方法还包括：

通过频时变换得到下混信号的时域下混信号；

通过单声道编码器得到时域下混信号的下混单声道比特流，本发明实施例的单声道编码器包括ITU-T G.711.1或者G.722等。

当所述单声道编码器和下混信号中使用的频域变换相同时，可不需进行频时变换直接对频域下混信号进行编码。

为了保持编码端和解码端CLD，IPD的一致性，本发明实施例采用量化后的CLD，IPD进行下混。量化后的CLD，IPD得到的立体声参数比特流，和下混单声道比特流一并发送到解码端。

本发明实施例提供了一种下混信号的生成装置，包括：201时频变换单元：用于对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；203频带计算单元：用于计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；205相位差计算单元：用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；频域下混信号计算单元：207下混信号计算单元，用于根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。

所述205相位差计算单元用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差包括：用于根据声道能量比和声道相位差计算所述下混信号和左声道和右声道中信号幅度更大的声道信号在每个频带的相位差。

在所述第一声道是所述左声道时，所述相位差计算单元用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差具体包括，根据如下公式计算：

c(b)＝10^CLD(b)/10；

θ (b) = \frac{1}{1 + c (b)} \cdot IPD (b);

其中，CLD(b)是第b个频带的所述声道能量比，c(b)是用于计算的中间值变量，IPD(b)是第b个频带的所述声道相位差，θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。

在第一声道是所述右声道时，所述相位差计算单元用于根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差具体包括，根据如下公式计算：

c(b)＝10^CLD(b)/10；

θ (b) = \frac{c (b)}{1 + c (b)} \cdot IPD (b);

所述相位差计算单元在用于根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后，还用于：将所述下混信号和第一声道的相位差根据群相位更新，所述群相位反映了左声道信号和右声道信号的频域包络相似性。

在所述第一声道是所述左声道时，所述下混信号计算单元，用于根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号具体包括，根据如下公式计算：

M_{r} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{r} (k) \cos (θ (b)) + L_{i} (k) \sin (θ (b)));

M_{i} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{i} (k) \cos (θ (b)) - L_{r} (k) \sin (θ (b))) .

在所述第一声道是所述右声道时，所述述下混信号计算单元，用于根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号具体包括，根据如下公式计算：

M_{i} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{i} (k) \cos (θ (b)) - R_{r} (k) \sin (θ (b)));

M_{r} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{r} (k) \cos (θ (b)) + R_{i} (k) \sin (θ (b)));

其中，k为频率点索引，R_r(k)是右声道信号时频变换第k个频率点的实部，R_i(k)是右声道信号时频变换第k个频率点的虚部，R_mag(k)是右声道信号时频变换第k个频率点的幅度，L_mag(k)是左声道信号时频变换第k个频率点的幅度，M_i(k)是下混信号时频变换第k个频率点的实部，M_r(k)是下混信号时频变换第k个频率点的虚部，θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。

本发明实施例提出了一种下混信号的还原方法，如图3所示，图3提供了本发明方法的一个实施例的流程图，包括：

S301根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度；

S303根据所述下混信号的频域信号相位、接收的声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；

S305根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。

在本发明的一个实施例中，通过单声道解码器解码得到下混单声道时域信号，通过解量化器解码得到立体声参数CLD，IPD。下混时域信号通过时频变换可得到频域信号。

S301所述根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度具体包括，根据如下公式计算：

c(b)＝10^CLD(b)/10，

| L (k) | = \frac{c (b)}{1 + c (b)} \cdot | M (k) |,

| R (k) | = \frac{1}{1 + c (b)} \cdot | M (k) |

其中，k为频率点索引，CLD(b)是所述声道能量比在第b个频带的声道能量比，c(b)是用于计算的中间值变量，|M(k)|是下混信号M(k)在频率点k的频域信号幅度，|L(k)|是左声道道信号L(k)在频率点k的频域信号幅度，|R(k)|是右声道信号R(k)在频率点k的频域信号幅度。

S303所述根据下混信号的频域信号相位、声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位具体包括，根据如下公式计算：

c(b)＝10^CLD(b)/10

&angle; L (k) = &angle; M (k) + \frac{1}{1 + c (b)} \cdot IPD (b);

&angle; R (k) = &angle; M (k) - \frac{c (b)}{1 + c (b)} \cdot IPD (b)

c(b)是用于计算的中间值变量，IPD(b)是所述声道相位差在第b个频带的声道相位差，∠M(k)是下混信号M(k)在频率点k的频域信号相位，∠L(k)是左声道信号L(k)在频率点k的频域信号相位，∠R(k)是右声道信号R(k)在频率点k的频域信号相位。

在本发明的一个实施例中，IPD的取值在(-pi，pi]。

在S305根据根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号之后，频域信号通过频时变换得到左右声道时域解码信号。

本发明实施例提供了一种下混信号的还原装置，包括：401信号幅度计算单元：用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道量比反映了左声道信号和右声道信号在每个频带的能量比信息；403信号相位计算单元：用于根据所述下混信号的频域信号相位、接收的声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；405频域信号合成单元：用于根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。

401所述信号幅度计算单元用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度具体包括，根据如下公式计算：

c(b)＝10^CLD(b)/10，

| L (k) | = \frac{c (b)}{1 + c (b)} \cdot | M (k) |,

| R (k) | = \frac{1}{1 + c (b)} \cdot | M (k) |

403所述信号相位计算单元用于根据下混信号的频域信号相位、声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位具体包括，根据如下公式计算：

c(b)＝10^CLD(b)/10

&angle; L (k) = &angle; M (k) + \frac{1}{1 + c (b)} \cdot IPD (b);

&angle; R (k) = &angle; M (k) - \frac{c (b)}{1 + c (b)} \cdot IPD (b)

本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种下混信号的生成方法，其特征在于，方法包括：

对左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；

计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；

根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；

根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。

2.根据权利要求1所述的方法，其特征在于，所述第一声道信号是左声道信号、右声道信号中信号幅度更大的信号，所述根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差包括：根据声道能量比和声道相位差计算所述下混信号和左声道信号、右声道信号中信号幅度更大的信号在每个频带的相位差。

3.根据权利要求1或2所述的方法，其特征在于，所述第一声道是所述左声道，所述根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差包括，根据如下公式计算：

c(b)＝10^CLD(b)/10；

θ (b) = \frac{1}{1 + c (b)} \cdot IPD (b);

4.根据权利要求3所述的方法，其特征在于，所述第一声道是所述左声道，所述根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括，根据如下公式计算：

M_{r} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{r} (k) \cos (θ (b)) + L_{i} (k) \sin (θ (b)));

M_{i} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{i} (k) \cos (θ (b)) - L_{r} (k) \sin (θ (b))) .

5.根据权利要求1或2所述的方法，其特征在于，所述第一声道是所述右声道，所述根据所述声道能量比和所述声道相位差计算下混信号和第一声道信号在每个频带的相位差包括，根据如下公式计算：

c(b)＝10^CLD(b)/10；

θ (b) = \frac{c (b)}{1 + c (b)} \cdot IPD (b);

6.根据权利要求5所述的方法，其特征在于，所述第一声道是所述右声道，所述根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括，根据如下公式计算：

M_{i} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{i} (k) \cos (θ (b)) - R_{r} (k) \sin (θ (b)));

M_{r} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{r} (k) \cos (θ (b)) + R_{i} (k) \sin (θ (b)));

7.根据权利要求4或6所述的方法，其特征在于，在所述根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后，还包括：所述下混信号和第一声道在每个频带的相位差根据群相位更新，所述群相位反映了左声道信号和右声道信号的频域包络相似性，根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括：根据所述左声道信号、右声道信号、以及更新后的所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。

8.一种下混信号的生成装置，其特征在于，包括：时频变换单元，用于对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；频带计算单元，用于计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；相位差计算单元，用于根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；下混信号计算单元，用于根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。

9.根据权利要求8所述的装置，其特征在于，所述相位差计算单元用于根据所述声道能量比和所述声道相位差计算所述下混信号和左声道信号、右声道信号中幅度更大的声道信号在每个频带的相位差。

10.根据权利要求8或9所述的装置，其特征在于，所述第一声道是所述右声道，所述相位差计算单元用于根据如下公式计算下混信号和第一声道信号在每个频带的相位差：

c(b)＝10^CLD(b)/10；

θ (b) = \frac{c (b)}{1 + c (b)} \cdot IPD (b);

11.根据权利要求10所述的装置，其特征在于，所述第一声道是所述左声道，所述下混信号计算单元用于根据如下公式计算频域下混信号：

M_{r} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{r} (k) \cos (θ (b)) + L_{i} (k) \sin (θ (b)));

M_{i} (k) = 0.5 (1 + \frac{R_{mag} (k)}{L_{mag} (k)}) (L_{i} (k) \cos (θ (b)) - L_{r} (k) \sin (θ (b))) .

12.根据权利要求8或9所述的装置，其特征在于，所述第一声道是所述左声道，所述相位差计算单元用于根据如下公式计算所述下混信号和第一声道信号在每个频带的相位差：

c(b)＝10^CLD(b)/10；

θ (b) = \frac{1}{1 + c (b)} \cdot IPD (b);

13.根据权利要求12所述的装置，其特征在于，所述第一声道是所述右声道，所述述下混信号计算单元，用于根据如下公式计算频域下混信号：

M_{i} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{i} (k) \cos (θ (b)) - R_{r} (k) \sin (θ (b)));

M_{r} (k) = 0.5 (1 + \frac{L_{mag} (k)}{R_{mag} (k)}) (R_{r} (k) \cos (θ (b)) - R_{i} (k) \sin (θ (b)));

其中，k为频率点索引，取自然数，R_r(k)是右声道信号时频变换第k个频率点的实部，R_i(k)是右声道信号时频变换第k个频率点的虚部，R_mag(k)是右声道信号时频变换第k个频率点的幅度，L_mag(k)是左声道信号时频变换第k个频率点的幅度，M_i(k)是下混信号时频变换第k个频率点的实部，M_r(k)是下混信号时频变换第k个频率点的虚部，θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。

14.根据权利要求11或13所述的装置，其特征在于，所述相位差计算单元在用于根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后，还用于：将所述下混信号和第一声道的相位差根据群相位更新，所述群相位反映了左声道信号和右声道信号的频域包络相似性。

15.一种下混信号的还原方法，其特征在于，包括：

根据下混信号的频域信号幅度、接收到的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息；

根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；

根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。

16.根据权利要求15所述的方法，其特征在于，所述根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度具体包括，根据如下公式计算：

c(b)＝10^CLD(b)/10，

| L (k) | = \frac{c (b)}{1 + c (b)} \cdot | M (k) |,

| R (k) | = \frac{1}{1 + c (b)} \cdot | M (k) |

17.根据权利要求15所述的方法，其特征在于，所述根据下混信号的频域信号相位、声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位具体包括，根据如下公式计算：

c(b)＝10^CLD(b)/10

&angle; L (k) = &angle; M (k) + \frac{1}{1 + c (b)} \cdot IPD (b);

&angle; R (k) = &angle; M (k) - \frac{c (b)}{1 + c (b)} \cdot IPD (b)

18.一种下混信号的还原装置，其特征在于，包括：信号幅度计算单元：用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道量比反映了左声道信号和右声道信号在每个频带的能量比信息；信号相位计算单元：用于根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；频域信号计算单元：用于根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。

19.根据权利要求18所述的装置，其特征在于，所述信号幅度计算单元用于根据如下公式计算左声道信号的频域信号幅度、右声道信号的频域信号幅度：

c(b)＝10^CLD(b)/10，

| L (k) | = \frac{c (b)}{1 + c (b)} \cdot | M (k) |,

| R (k) | = \frac{1}{1 + c (b)} \cdot | M (k) |

20.根据权利要求18所述的装置，其特征在于，所述信号相位计算单元用于根据如下公式计算左声道信号的频域信号相位、右声道信号的频域信号相位：

c(b)＝10^CLD(b)/10

&angle; L (k) = &angle; M (k) + \frac{1}{1 + c (b)} \cdot IPD (b);

&angle; R (k) = &angle; M (k) - \frac{c (b)}{1 + c (b)} \cdot IPD (b)