CN105206278A - 一种基于流水线的三维音频编码加速方法 - Google Patents

一种基于流水线的三维音频编码加速方法 Download PDF

Info

Publication number
CN105206278A
CN105206278A CN201410282633.6A CN201410282633A CN105206278A CN 105206278 A CN105206278 A CN 105206278A CN 201410282633 A CN201410282633 A CN 201410282633A CN 105206278 A CN105206278 A CN 105206278A
Authority
CN
China
Prior art keywords
sound channel
channel unit
adjacent channels
frequency
assembly line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410282633.6A
Other languages
English (en)
Inventor
张军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai DC Science Co Ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410282633.6A priority Critical patent/CN105206278A/zh
Publication of CN105206278A publication Critical patent/CN105206278A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Stereophonic System (AREA)

Abstract

本发明公开了一种基于流水线的三维音频编码加速方法,其具体步骤如下:将多声道的时域信号变换为频域信号;将各声道的频域信号均划分为多个子带;获取各子带能量,并依次将相邻的三个声道对应的子带能量组合成第一类声道单元,若剩余相邻声道不足三个,则将剩余相邻声道对应的子带能量组合成第二类声道单元;对第一类和第二类声道单元分别进行编码,量化编码结果并生成各声道单元对应的变换矩阵索引;将上述4个步骤,组成四级流水线结构,进行三维音频编码加速。

Description

一种基于流水线的三维音频编码加速方法
技术领域
本发明涉及一种基于流水线的三维音频编码加速方法
背景技术
视听已进入三维时代,要想达到更好的视听体验,需要有与三维视频内容同步的三维声场听觉效果,才能真正达到身临其境的视听感受。近年来日本NHK公司推出了22.2声道***,能够通过24个扬声器再现原来的三维声场。2011年MPEG着手制定三维音频的国际标准,在达到一定编码效率的同时希望能通过比较少的扬声去还原三维声场,以便能将该技术推广到移动终端。
为了获得更好的3D声效,需要最大限度地增加声道数,声道数增长使得3D音频面临诸多挑战:3D音频声道数的激增使得其数据量非常大。NHK实验室将22.2多声道3D音频***精简为10.2声道,其精简的原理是用一个扬声器代替包围该扬声器的三个扬声器,重新调整扬声器的分配信号以保持中心点处的声压和粒子速度不变。
为提高三维音频编码的效率,可考虑采用流水线技术。流水线技术是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。流水线功能繁杂,种类也非常多;如果按照处理级别来分类,流水线可以有操作部件级、指令级和处理机级;如果按照流水线可以完成的动作的数量来分类,又可以分为单功能和多功能流水线;如果按照流水线内部的功能部件的连接方式来分类,则有线性流水线和非线性流水线。
本发明提供了一种基于流水线的三维音频编码加速方法,将多声道的时域信号变换为频域信号;再将各声道的频域信号均划分为多个子带;获取各子带能量,并依次将相邻的三个声道对应的子带能量组合成第一类声道单元,若剩余相邻声道不足三个,则将剩余相邻声道对应的子带能量组合成第二类声道单元;对第一类和第二类声道单元分别进行编码,量化编码结果并生成各声道单元对应的变换矩阵索引;组成四级流水线结构,进行三维音频编码加速。
发明内容
本发明的目的在于提供一种基于流水线的三维音频编码加速方法。本发明包括以下特征:
发明技术方案
一种基于流水线的三维音频编码加速方法,其具体步骤如下:
1)将多声道的时域信号变换为频域信号;
2)将各声道的频域信号均划分为多个子带;
3)获取各子带能量,并依次将相邻的三个声道对应的子带能量组合成第一类声道单元,若剩余相邻声道不足三个,则将剩余相邻声道对应的子带能量组合成第二类声道单元;
4)对第一类和第二类声道单元分别进行编码,量化编码结果并生成各声道单元对应的变换矩阵索引;
5)将上述4个步骤,组成四级流水线结构,进行三维音频编码加速。
附图说明
图1是三维音频编码流程图。
具体实施方式
这种基于流水线的三维音频编码加速方法,包括如下步骤:
1)将多声道的时域信号变换为频域信号;
2)将各声道的频域信号均划分为多个子带;
3)获取各子带能量,并依次将相邻的三个声道对应的子带能量组合成第一类声道单元,若剩余相邻声道不足三个,则将剩余相邻声道对应的子带能量组合成第二类声道单元;
4)对第一类和第二类声道单元分别进行编码,量化编码结果并生成各声道单元对应的变换矩阵索引;
5)将上述4个步骤,组成四级流水线结构,进行三维音频编码加速。

Claims (1)

1.一种基于流水线的三维音频编码加速方法,其具体步骤如下:
1)将多声道的时域信号变换为频域信号;
2)将各声道的频域信号均划分为多个子带;
3)获取各子带能量,并依次将相邻的三个声道对应的子带能量组合成第一类声道单元,若剩余相邻声道不足三个,则将剩余相邻声道对应的子带能量组合成第二类声道单元;
4)对第一类和第二类声道单元分别进行编码,量化编码结果并生成各声道单元对应的变换矩阵索引;
5)将上述4个步骤,组成四级流水线结构,进行三维音频编码加速。
CN201410282633.6A 2014-06-23 2014-06-23 一种基于流水线的三维音频编码加速方法 Pending CN105206278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410282633.6A CN105206278A (zh) 2014-06-23 2014-06-23 一种基于流水线的三维音频编码加速方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410282633.6A CN105206278A (zh) 2014-06-23 2014-06-23 一种基于流水线的三维音频编码加速方法

Publications (1)

Publication Number Publication Date
CN105206278A true CN105206278A (zh) 2015-12-30

Family

ID=54953907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410282633.6A Pending CN105206278A (zh) 2014-06-23 2014-06-23 一种基于流水线的三维音频编码加速方法

Country Status (1)

Country Link
CN (1) CN105206278A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334316A (zh) * 2019-07-08 2019-10-15 张军 一种多路数据分块浮点量化处理器原型

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1059627B1 (en) * 1992-03-18 2003-05-14 Sony Corporation Voice analysis-synthesis method
CN1765072A (zh) * 2003-04-30 2006-04-26 诺基亚公司 多声道音频扩展支持
CN101151658A (zh) * 2005-03-30 2008-03-26 皇家飞利浦电子股份有限公司 音频编码和解码
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
CN103400582A (zh) * 2013-08-13 2013-11-20 武汉大学 面向多声道三维音频的编解码方法与***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1059627B1 (en) * 1992-03-18 2003-05-14 Sony Corporation Voice analysis-synthesis method
CN1765072A (zh) * 2003-04-30 2006-04-26 诺基亚公司 多声道音频扩展支持
CN101151658A (zh) * 2005-03-30 2008-03-26 皇家飞利浦电子股份有限公司 音频编码和解码
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
CN103400582A (zh) * 2013-08-13 2013-11-20 武汉大学 面向多声道三维音频的编解码方法与***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡文安等: "《基于openMP的AVS并行编码算法研究与实现》", 《计算机工程与设计》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334316A (zh) * 2019-07-08 2019-10-15 张军 一种多路数据分块浮点量化处理器原型

Similar Documents

Publication Publication Date Title
EP3729425B1 (en) Priority information for higher order ambisonic audio data
RU2661775C2 (ru) Передача сигнальной информации рендеринга аудио в битовом потоке
CN106165452B (zh) 音频信号处理方法和设备
CN101542597B (zh) 用于编码和解码基于对象的音频信号的方法和装置
TWI404429B (zh) 用於將多頻道音訊信號編碼/解碼之方法與裝置
RU2014102198A (ru) Процессор аудиосигналов для обработки кодированных многоканальных аудиосигналов и способ для этого
JP2016538585A (ja) ダウンミックス行列を復号及び符号化するための方法、音声コンテンツを呈示するための方法、ダウンミックス行列のためのエンコーダ及びデコーダ、音声エンコーダ及び音声デコーダ
CN102754151A (zh) 用于对便携式装置内的音频信号的响度进行非破坏性标准化的***和方法
RU2008132156A (ru) Персонализированное декодирование многоканального объемного звука
RU2015113161A (ru) Устройство и способ для предоставления улучшенных характеристик направленного понижающего микширования для трехмерного аудио
MX2014001871A (es) Dispositivo de codificacion y metodo de codificacion, dispositivo de decodificacion y metodo de decodificacion, y programa.
CN104364842A (zh) 立体声音频信号编码器
WO2016183379A3 (en) Generation and playback of near-field audio content
CN103731797B (zh) 一种具有十六通道的数字影院音频处理器
CN109074813A (zh) 处理高清晰度音频数据
CN105206278A (zh) 一种基于流水线的三维音频编码加速方法
CN101800048A (zh) 基于dra编码器的多声道数字音频编码方法及其编码***
KR20140047509A (ko) 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치
KR20230153402A (ko) 다운믹스 신호들의 적응형 이득 제어를 갖는 오디오 코덱
KR20240001226A (ko) 3차원 오디오 신호 코딩 방법, 장치, 및 인코더
CN105227998A (zh) 平衡多音频音量的方法和装置
US11270711B2 (en) Higher order ambisonic audio data
US12027174B2 (en) Apparatus, methods, and computer programs for encoding spatial metadata
TW202123220A (zh) 使用方向性元資料之多通道音頻編碼及解碼
CN103400582A (zh) 面向多声道三维音频的编解码方法与***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180504

Address after: 200000 4A06 room 6, 277 Ruichang Road, Pudong New Area, Shanghai.

Applicant after: Shanghai Deheng Data Technology Co. Ltd.

Address before: 200061 1103, 40 Lane 100 lane, middle Tan Road, Putuo District, Shanghai.

Applicant before: Zhang Jun

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20151230

RJ01 Rejection of invention patent application after publication