CN101650947B

CN101650947B - 一种面向对象音频编解码方法及***

Info

Publication number: CN101650947B
Application number: CN200910272116.XA
Authority: CN
Inventors: 胡瑞敏; 周成; 高丽; 杭波; 王晓晨
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2009-09-17
Filing date: 2009-09-17
Publication date: 2014-05-28
Anticipated expiration: 2029-09-17
Also published as: CN101650947A

Abstract

本发明涉及音频编解码技术领域，尤其涉及一种面向对象音频编解码方法及***。本发明方法包括以下步骤，即输入音频信号、对所述音频信号进行音源分离，获得各分离音源信号、对所述各分离音源信号进行关注音源判别，获得关注音源信号、对所述关注音源信号进行关注度排序，获得关注音源重要度排序、根据所述关注音源重要度排序对关注音源信号进行可分级编码，获得音频编码码流，本发明***包括音源分离模块、关注音源判别模块、关注音源重要度排序模块、可分级编码模块、可分级解码模块。本发明以分离音频信号中各音源信号，经关注音源判别、关注度排序后作分级编解码。

Description

一种面向对象音频编解码方法及***

技术领域

本发明涉及音频编解码技术领域，尤其涉及一种面向对象音频编解码方法及***。

背景技术

在声学领域中，“鸡尾酒效应”是指人耳有自动过滤噪声的机制，会把关注重点放在感兴趣声音上。针对这种情况，面向对象音频编码方法根据音频信号的内容，将其中的对象(关注音源)分离出来分别进行编码，并允许在不同的对象之间灵活分配码率，对重要的对象(感兴趣声音)分配较多的比特，对次要的对象(非感兴趣声音)分配较少的比特，在保持高压缩比的同时，提供更好的主观音频编码质量。

现有MPEG4音频编码工具集虽然对面向对象音频编码方法给出了抽象描述，然而却缺乏具体的框架与细节定义。

发明内容

本发明的目的是提供一种面向对象音频编解码方法及***，以分离音频信号中各音源信号，经关注音源判别、关注度排序后作分级编解码。

为达到上述目的，本发明采用如下的技术方案：

一种面向对象音频编码方法，包括以下步骤：

①输入音频信号；

②对所述音频信号进行音源分离，获得各分离音源信号；

③对所述各分离音源信号进行关注音源判别，获得关注音源信号；

④对所述关注音源信号进行关注度排序，获得关注音源重要度排序；

⑤根据所述关注音源重要度排序对关注音源信号进行可分级编码，获得音频编码码流。

一种面向对象音频解码方法，包括以下步骤：

①输入编码码流；

②根据关注音源重要度排序对所述编码码流进行可分级解码，获得关注音源信号。

一种面向对象音频编解码***，包括：

音源分离模块接收输入的音频信号，用于对所述输入音频信号进行音源分离，获得各分离音源信号，并将各分离音源信号输出给关注音源判别模块；

关注音源判别模块接收音源分离模块输出的各分离音源信号，用于对所述各分离音源信号进行关注音源判别，获得关注音源信号，并将关注音源信号输出给关注音源重要度排序模块；

关注音源重要度排序模块接收关注音源判别模块输入的关注音源信号，用于对所述关注音源信号进行关注音源重要度排序，并将所获得的关注音源重要度排序信息输出给可分级编码模块；

可分级编码模块接收关注音源重要度排序模块输入的关注音源重要度排序信息，用于对所述音源信号进行可分级编码，获得编码码流；

可分级解码模块接收可分级编码模块输出的编码码流，用于根据关注音源重要度排序信息从编码码流中解码获得各关注音源信号。

本发明具有以下优点和积极效果：

1)提供了基于关注音源判别、关注度排序的音频编解码方法；

2)有效地实现对感兴趣声音的面向对象的编解码方法和***。

附图说明

图1是本发明提供的面向对象音频编码流程图。

图2是本发明提供的面向对象音频解码流程图。

图3是本发明提供的面向对象音频编解码***结构图。

其中，

S1-输入音频信号，S2-音源分离，S3-关注音源判别，S4-关注音源重要度排序，S5-可分级编码，S6-获得编码码流；S21-输入编码码流，S22-可分级解码，S23-获得关注音源；1-音源分离模块，2-关注音源判别模块，3-关注音源重要度排序模块，4-可分级编码模块，5-可分级解码模块。

具体实施方式

下面以具体实施例结合附图对本发明作进一步说明：

本发明提供的面向对象音频编码方法，具体采用如下技术方案，参见图1，包括以下步骤：

S1：输入音频信号；

S2：对所述音频信号进行音源分离，获得各分离音源信号；

S3：对所述各分离音源信号进行关注音源判别，获得关注音源信号；

S4：对所述关注音源信号进行关注度排序，获得关注音源重要度排序；

S5：根据所述关注音源重要度排序对关注音源信号进行可分级编码，获得音频编码码流。

下面以具体实施例，详细描述本发明提供的面向对象音频编码方法。

步骤S1，具体实施时，可以使用各种音频分离方法，例如时域分离方法、频域分离方法、时频域分离方法等，将输入音频时域信号S₁，S₂，…S_m(其中，m为音频信号长度)分离为各音源信号

(其中，n为分离音源数目)；

步骤S2，具体实施时，通过建立关注音源特征库的方式来对步骤S1所得各分离音源信号进行识别，得到各关注音源

(k≤n)；

步骤S3，具体实施时，可采用基于能量的重要度排序原则对步骤S2所得各关注音源

(k≤n)进行重要度排序，得到关注音源重要度排序结果，同时将关注音源重要度排序信息送入编码码流；

步骤S4，具体实施时，依据步骤S3所得的关注音源重要度排序对关注音源进行编码，可采用任何编码算法，在限定码率下对重要度高的关注音源优先编码并送入编码码流。

以上过程所得编码码流就是本发明所提供的面向对象音频编码的处理对象，解码过程与编码过程相逆。

本发明提供的面向对象音频解码方法，具体采用如下技术方案，参见图2，包括以下步骤：

步骤S21：输入编码码流；

步骤S22：根据关注音源重要度排序对所述编码码流进行可分级解码；

步骤S23：获得关注音源信号。

下面以具体实施例，详细描述本发明提供的面向对象音频解码方法。

具体实施时，根据关注音源重要度排序信息从编码码流中解码，可采用任何与编码算法对应的解码算法，得到各关注音源信号

(l≤k)。

本发明提供的面向对象音频编解码***，具体采用如下技术方案，参见附图3，包括：

音源分离模块1、关注音源判别模块2、关注音源重要度排序模块3、可分级编码模块4、可分级解码模块5，其中音源分离模块1接收输入的音频信号，用于对所述输入音频信号进行音源分离，获得各分离音源信号，并将各分离音源信号输出给关注音源判别模块2；关注音源判别模块2接收音源分离模块1输出的各分离音源信号，用于对所述各分离音源信号进行关注音源判别，获得关注音源信号，并将关注音源信号输出给关注音源重要度排序模块3；关注音源重要度排序模块3接收关注音源判别模块2输入的关注音源信号，用于对所述关注音源信号进行关注音源重要度排序，并将所获得的关注音源重要度排序信息输出给可分级编码模块4；可分级编码模块4接收关注音源重要度排序模块3输入的关注音源重要度排序信息，用于对所述音源信号进行可分级编码，获得编码码流；可分级解码模块5接收可分级编码模块4输出的编码码流，用于根据关注音源重要度排序信息从编码码流中解码获得各关注音源信号。

下面以具体实施例，详细描述本发明提供的面向对象音频编解码***：

音源分离模块1具体实施时，可以使用各种音频分离方法，例如时域分离方法、频域

分离方法、时频域分离方法等，将输入音频时域信号S₁，S₂，…S_m(其中，m为音频信号长度)分离为各音源信号

(其中，n为分离音源数目)；

关注音源判别模块2具体实施时，通过建立关注音源特征库的方式来对所得各分离音源信号进行识别，得到各关注音源

(k≤n)；

关注音源重要度排序模块3具体实施时，可采用基于能量的重要度排序原则对所得各关注音源

可分级编码模块4具体实施时，依据关注音源重要度排序模块3所得的关注音源重要度排序对关注音源进行编码，可采用任何编码算法，在限定码率下对重要度高的关注音源优先编码并送入编码码流；

可分级解码模块5具体实施时，根据关注音源重要度排序信息从编码码流中解码，可采用任何与编码算法对应的解码算法，得到各关注音源信号

(l≤k)。

Claims

1.一种面向对象音频编码方法，其特征在于，包括以下步骤：

①输入音频信号；

②对所述音频信号进行音源分离，获得各分离音源信号；

④对步骤③所述关注音源信号进行关注度排序，获得关注音源重要度排序；

⑤根据步骤④所述关注音源重要度排序对步骤③所述关注音源信号进行可分级编码，包括对重要度高的关注音源信号优先编码，获得音频编码码流。

2.一种面向对象音频解码方法，其特征在于，包括以下步骤：

①输入编码码流；

3.一种面向对象音频编解码***，其特征在于，包括：

音源分离模块(1)接收输入的音频信号，用于对所述输入音频信号进行音源分离，获得各分离音源信号，并将各分离音源信号输出给关注音源判别模块(2)；

关注音源判别模块(2)接收音源分离模块(1)输出的各分离音源信号，用于对所述各分离音源信号进行关注音源判别，获得关注音源信号，并将关注音源信号输出给关注音源重要度排序模块(3)；

关注音源重要度排序模块(3)接收关注音源判别模块(2)输入的关注音源信号，用于对所述关注音源信号进行关注音源重要度排序，并将所获得的关注音源重要度排序信息输出给可分级编码模块(4)；

可分级编码模块(4)接收关注音源重要度排序模块(3)输入的关注音源重要度排序信息，用于对所述音源信号进行可分级编码，包括对重要度高的关注音源信号优先编码，获得编码码流；

可分级解码模块(5)接收可分级编码模块(4)输出的编码码流，用于根据关注音源重要度排序信息从编码码流中解码获得各关注音源信号。