CN101650947B - 一种面向对象音频编解码方法及*** - Google Patents

一种面向对象音频编解码方法及*** Download PDF

Info

Publication number
CN101650947B
CN101650947B CN200910272116.XA CN200910272116A CN101650947B CN 101650947 B CN101650947 B CN 101650947B CN 200910272116 A CN200910272116 A CN 200910272116A CN 101650947 B CN101650947 B CN 101650947B
Authority
CN
China
Prior art keywords
sound source
attention
coding
module
attention sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200910272116.XA
Other languages
English (en)
Other versions
CN101650947A (zh
Inventor
胡瑞敏
周成
高丽
杭波
王晓晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN200910272116.XA priority Critical patent/CN101650947B/zh
Publication of CN101650947A publication Critical patent/CN101650947A/zh
Application granted granted Critical
Publication of CN101650947B publication Critical patent/CN101650947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及音频编解码技术领域,尤其涉及一种面向对象音频编解码方法及***。本发明方法包括以下步骤,即输入音频信号、对所述音频信号进行音源分离,获得各分离音源信号、对所述各分离音源信号进行关注音源判别,获得关注音源信号、对所述关注音源信号进行关注度排序,获得关注音源重要度排序、根据所述关注音源重要度排序对关注音源信号进行可分级编码,获得音频编码码流,本发明***包括音源分离模块、关注音源判别模块、关注音源重要度排序模块、可分级编码模块、可分级解码模块。本发明以分离音频信号中各音源信号,经关注音源判别、关注度排序后作分级编解码。

Description

一种面向对象音频编解码方法及***
技术领域
本发明涉及音频编解码技术领域,尤其涉及一种面向对象音频编解码方法及***。
背景技术
在声学领域中,“鸡尾酒效应”是指人耳有自动过滤噪声的机制,会把关注重点放在感兴趣声音上。针对这种情况,面向对象音频编码方法根据音频信号的内容,将其中的对象(关注音源)分离出来分别进行编码,并允许在不同的对象之间灵活分配码率,对重要的对象(感兴趣声音)分配较多的比特,对次要的对象(非感兴趣声音)分配较少的比特,在保持高压缩比的同时,提供更好的主观音频编码质量。
现有MPEG4音频编码工具集虽然对面向对象音频编码方法给出了抽象描述,然而却缺乏具体的框架与细节定义。
发明内容
本发明的目的是提供一种面向对象音频编解码方法及***,以分离音频信号中各音源信号,经关注音源判别、关注度排序后作分级编解码。
为达到上述目的,本发明采用如下的技术方案:
一种面向对象音频编码方法,包括以下步骤:
①输入音频信号;
②对所述音频信号进行音源分离,获得各分离音源信号;
③对所述各分离音源信号进行关注音源判别,获得关注音源信号;
④对所述关注音源信号进行关注度排序,获得关注音源重要度排序;
⑤根据所述关注音源重要度排序对关注音源信号进行可分级编码,获得音频编码码流。
一种面向对象音频解码方法,包括以下步骤:
①输入编码码流;
②根据关注音源重要度排序对所述编码码流进行可分级解码,获得关注音源信号。
一种面向对象音频编解码***,包括:
音源分离模块接收输入的音频信号,用于对所述输入音频信号进行音源分离,获得各分离音源信号,并将各分离音源信号输出给关注音源判别模块;
关注音源判别模块接收音源分离模块输出的各分离音源信号,用于对所述各分离音源信号进行关注音源判别,获得关注音源信号,并将关注音源信号输出给关注音源重要度排序模块;
关注音源重要度排序模块接收关注音源判别模块输入的关注音源信号,用于对所述关注音源信号进行关注音源重要度排序,并将所获得的关注音源重要度排序信息输出给可分级编码模块;
可分级编码模块接收关注音源重要度排序模块输入的关注音源重要度排序信息,用于对所述音源信号进行可分级编码,获得编码码流;
可分级解码模块接收可分级编码模块输出的编码码流,用于根据关注音源重要度排序信息从编码码流中解码获得各关注音源信号。
本发明具有以下优点和积极效果:
1)提供了基于关注音源判别、关注度排序的音频编解码方法;
2)有效地实现对感兴趣声音的面向对象的编解码方法和***。
附图说明
图1是本发明提供的面向对象音频编码流程图。
图2是本发明提供的面向对象音频解码流程图。
图3是本发明提供的面向对象音频编解码***结构图。
其中,
S1-输入音频信号,S2-音源分离,S3-关注音源判别,S4-关注音源重要度排序,S5-可分级编码,S6-获得编码码流;S21-输入编码码流,S22-可分级解码,S23-获得关注音源;1-音源分离模块,2-关注音源判别模块,3-关注音源重要度排序模块,4-可分级编码模块,5-可分级解码模块。
具体实施方式
下面以具体实施例结合附图对本发明作进一步说明:
本发明提供的面向对象音频编码方法,具体采用如下技术方案,参见图1,包括以下步骤:
S1:输入音频信号;
S2:对所述音频信号进行音源分离,获得各分离音源信号;
S3:对所述各分离音源信号进行关注音源判别,获得关注音源信号;
S4:对所述关注音源信号进行关注度排序,获得关注音源重要度排序;
S5:根据所述关注音源重要度排序对关注音源信号进行可分级编码,获得音频编码码流。
下面以具体实施例,详细描述本发明提供的面向对象音频编码方法。
步骤S1,具体实施时,可以使用各种音频分离方法,例如时域分离方法、频域分离方法、时频域分离方法等,将输入音频时域信号S1,S2,…Sm(其中,m为音频信号长度)分离为各音源信号
Figure GFW00000062392800031
(其中,n为分离音源数目);
步骤S2,具体实施时,通过建立关注音源特征库的方式来对步骤S1所得各分离音源信号进行识别,得到各关注音源
Figure GFW00000062392800032
(k≤n);
步骤S3,具体实施时,可采用基于能量的重要度排序原则对步骤S2所得各关注音源
Figure GFW00000062392800033
(k≤n)进行重要度排序,得到关注音源重要度排序结果,同时将关注音源重要度排序信息送入编码码流;
步骤S4,具体实施时,依据步骤S3所得的关注音源重要度排序对关注音源进行编码,可采用任何编码算法,在限定码率下对重要度高的关注音源优先编码并送入编码码流。
以上过程所得编码码流就是本发明所提供的面向对象音频编码的处理对象,解码过程与编码过程相逆。
本发明提供的面向对象音频解码方法,具体采用如下技术方案,参见图2,包括以下步骤:
步骤S21:输入编码码流;
步骤S22:根据关注音源重要度排序对所述编码码流进行可分级解码;
步骤S23:获得关注音源信号。
下面以具体实施例,详细描述本发明提供的面向对象音频解码方法。
具体实施时,根据关注音源重要度排序信息从编码码流中解码,可采用任何与编码算法对应的解码算法,得到各关注音源信号
Figure GFW00000062392800034
(l≤k)。
本发明提供的面向对象音频编解码***,具体采用如下技术方案,参见附图3,包括:
音源分离模块1、关注音源判别模块2、关注音源重要度排序模块3、可分级编码模块4、可分级解码模块5,其中音源分离模块1接收输入的音频信号,用于对所述输入音频信号进行音源分离,获得各分离音源信号,并将各分离音源信号输出给关注音源判别模块2;关注音源判别模块2接收音源分离模块1输出的各分离音源信号,用于对所述各分离音源信号进行关注音源判别,获得关注音源信号,并将关注音源信号输出给关注音源重要度排序模块3;关注音源重要度排序模块3接收关注音源判别模块2输入的关注音源信号,用于对所述关注音源信号进行关注音源重要度排序,并将所获得的关注音源重要度排序信息输出给可分级编码模块4;可分级编码模块4接收关注音源重要度排序模块3输入的关注音源重要度排序信息,用于对所述音源信号进行可分级编码,获得编码码流;可分级解码模块5接收可分级编码模块4输出的编码码流,用于根据关注音源重要度排序信息从编码码流中解码获得各关注音源信号。
下面以具体实施例,详细描述本发明提供的面向对象音频编解码***:
音源分离模块1具体实施时,可以使用各种音频分离方法,例如时域分离方法、频域
分离方法、时频域分离方法等,将输入音频时域信号S1,S2,…Sm(其中,m为音频信号长度)分离为各音源信号
Figure GFW00000062392800041
(其中,n为分离音源数目);
关注音源判别模块2具体实施时,通过建立关注音源特征库的方式来对所得各分离音源信号进行识别,得到各关注音源
Figure GFW00000062392800042
(k≤n);
关注音源重要度排序模块3具体实施时,可采用基于能量的重要度排序原则对所得各关注音源
Figure GFW00000062392800043
(k≤n)进行重要度排序,得到关注音源重要度排序结果,同时将关注音源重要度排序信息送入编码码流;
可分级编码模块4具体实施时,依据关注音源重要度排序模块3所得的关注音源重要度排序对关注音源进行编码,可采用任何编码算法,在限定码率下对重要度高的关注音源优先编码并送入编码码流;
可分级解码模块5具体实施时,根据关注音源重要度排序信息从编码码流中解码,可采用任何与编码算法对应的解码算法,得到各关注音源信号
Figure GFW00000062392800044
(l≤k)。

Claims (3)

1.一种面向对象音频编码方法,其特征在于,包括以下步骤:
①输入音频信号;
②对所述音频信号进行音源分离,获得各分离音源信号;
③对所述各分离音源信号进行关注音源判别,获得关注音源信号;
④对步骤③所述关注音源信号进行关注度排序,获得关注音源重要度排序;
⑤根据步骤④所述关注音源重要度排序对步骤③所述关注音源信号进行可分级编码,包括对重要度高的关注音源信号优先编码,获得音频编码码流。
2.一种面向对象音频解码方法,其特征在于,包括以下步骤:
①输入编码码流;
②根据关注音源重要度排序对所述编码码流进行可分级解码,获得关注音源信号。
3.一种面向对象音频编解码***,其特征在于,包括:
音源分离模块(1)接收输入的音频信号,用于对所述输入音频信号进行音源分离,获得各分离音源信号,并将各分离音源信号输出给关注音源判别模块(2);
关注音源判别模块(2)接收音源分离模块(1)输出的各分离音源信号,用于对所述各分离音源信号进行关注音源判别,获得关注音源信号,并将关注音源信号输出给关注音源重要度排序模块(3);
关注音源重要度排序模块(3)接收关注音源判别模块(2)输入的关注音源信号,用于对所述关注音源信号进行关注音源重要度排序,并将所获得的关注音源重要度排序信息输出给可分级编码模块(4);
可分级编码模块(4)接收关注音源重要度排序模块(3)输入的关注音源重要度排序信息,用于对所述音源信号进行可分级编码,包括对重要度高的关注音源信号优先编码,获得编码码流;
可分级解码模块(5)接收可分级编码模块(4)输出的编码码流,用于根据关注音源重要度排序信息从编码码流中解码获得各关注音源信号。
CN200910272116.XA 2009-09-17 2009-09-17 一种面向对象音频编解码方法及*** Active CN101650947B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910272116.XA CN101650947B (zh) 2009-09-17 2009-09-17 一种面向对象音频编解码方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910272116.XA CN101650947B (zh) 2009-09-17 2009-09-17 一种面向对象音频编解码方法及***

Publications (2)

Publication Number Publication Date
CN101650947A CN101650947A (zh) 2010-02-17
CN101650947B true CN101650947B (zh) 2014-05-28

Family

ID=41673168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910272116.XA Active CN101650947B (zh) 2009-09-17 2009-09-17 一种面向对象音频编解码方法及***

Country Status (1)

Country Link
CN (1) CN101650947B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101950562A (zh) * 2010-11-03 2011-01-19 武汉大学 基于音频关注度的分级编码方法及***
CN102184733B (zh) * 2011-05-17 2012-07-25 武汉大学 基于音频关注度的音频质量评价***及方法
CN106937069A (zh) * 2015-12-30 2017-07-07 惠州市伟乐科技股份有限公司 一种自动识别信号接口的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1659824A (zh) * 2002-06-11 2005-08-24 汤姆森许可贸易公司 具有对动态网络丢失条件的简单自适应的多媒体服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264431A (ja) * 2006-03-29 2007-10-11 Univ Meijo 音源分離システム、エンコーダおよびデコーダ

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1659824A (zh) * 2002-06-11 2005-08-24 汤姆森许可贸易公司 具有对动态网络丢失条件的简单自适应的多媒体服务器

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
A closer look into MPEG-4 High Efficiency AAC;Martin Wolters et al;《Audio Engineering Society Convention Paper》;20031013 *
Karlheinz Brandenburg.MPEG-4 natural audio coding.《Signal Processing: Image Communication》.2000,
Martin Wolters et al.A closer look into MPEG-4 High Efficiency AAC.《Audio Engineering Society Convention Paper》.2003,
MPEG-4 natural audio coding;Karlheinz Brandenburg;《Signal Processing: Image Communication》;20001231 *
基于用户关注空间与注意力分析的视频精彩摘要与排序;黄庆明等;《计算机学报》;20080930 *
黄庆明等.基于用户关注空间与注意力分析的视频精彩摘要与排序.《计算机学报》.2008,

Also Published As

Publication number Publication date
CN101650947A (zh) 2010-02-17

Similar Documents

Publication Publication Date Title
TW200737738A (en) Apparatus and method for encoding and decoding signal
CN101836250B (zh) 用于处理信号的方法及装置
CN101849258B (zh) 用于在可缩放音频编解码器中编码/解码的方法和装置
EP2706529A3 (en) Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
CN106373583B (zh) 基于理想软阈值掩模irm的多音频对象编、解码方法
EP4343759A3 (en) Method and apparatus for encoding and decoding an ambisonics representation of a 2- or 3-dimensional sound field
EP4283616A3 (en) Computer program product for encoding a signal
CN102097098B (zh) 一种以压缩音频为掩蔽载体的数字隐写及提取方法
CN1248824A (zh) 音频信号编码装置和方法以及解码装置和方法
CN1922654A (zh) 音频分发***、音频编码器、音频解码器及其操作方法
CN102292767A (zh) 立体声音响信号编码装置、立体声音响信号解码装置及它们的编解码方法
CN102272829A (zh) 用于在多声道音频编码***内生成增强层的方法和装置
EP1713061A3 (en) Apparatus and method of encoding audio data and apparatus and method of decoding encoded audio data
WO2008084427A2 (en) Audio decoder
CA2589623A1 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
CN110739000B (zh) 一种适应于个性化交互***的音频对象编码方法
EP4300488A3 (en) Stereo audio encoder and decoder
WO2008108082A1 (ja) 音声復号装置および音声復号方法
CN102272832A (zh) 基于峰值检测的选择性缩放掩码计算
CN102272831A (zh) 基于峰值检测的选择性缩放掩码计算
CN107610710B (zh) 一种面向多音频对象的音频编码及解码方法
WO2010139257A1 (zh) 压缩编码和解码的方法、编码器和解码器以及编码装置
CN101650947B (zh) 一种面向对象音频编解码方法及***
CN102522092A (zh) 一种基于g.711.1的语音带宽扩展的装置和方法
Huang et al. Lossless audio compression in the new IEEE standard for advanced audio coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant