CN112530445A - 高阶Ambisonic音频的编解码方法及芯片 - Google Patents
高阶Ambisonic音频的编解码方法及芯片 Download PDFInfo
- Publication number
- CN112530445A CN112530445A CN202011319445.8A CN202011319445A CN112530445A CN 112530445 A CN112530445 A CN 112530445A CN 202011319445 A CN202011319445 A CN 202011319445A CN 112530445 A CN112530445 A CN 112530445A
- Authority
- CN
- China
- Prior art keywords
- result
- function
- trigonometric function
- algorithm
- along
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 50
- 230000006870 function Effects 0.000 claims description 274
- 238000004422 calculation algorithm Methods 0.000 claims description 137
- 239000011159 matrix material Substances 0.000 claims description 122
- 230000005428 wave function Effects 0.000 claims description 39
- 239000000872 buffer Substances 0.000 claims description 6
- 230000003139 buffering effect Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 39
- 230000005236 sound signal Effects 0.000 abstract description 15
- 230000009466 transformation Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 16
- 238000004590 computer program Methods 0.000 description 15
- 238000003860 storage Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000013001 matrix buffer Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Abstract
本发明提供一种高阶Ambisonic音频的编解码方法及芯片,其中,该芯片包括:高阶Ambisonic音频的编码芯片和高阶Ambisonic音频的解码芯片,高阶Ambisonic音频的编码芯片中包含三角函数运算器、勒让德函数运算器、积分器,对输入的音频信号进行三角函数、勒让德函数、积分操作,再进行复空间变换后得到球谐分解的输出B。高阶Ambisonic音频的解码芯片通过加法与乘法器实现高阶立体音频解码的过程。本发明芯片将球谐分解及其逆变换进行硬件实现,以加速HOA信号的编码与解码过程,并以此扩展HOA音频之使用范围,使其适用于流媒体播放等实时性要求较高的场合。
Description
技术领域
本发明涉及高阶立体音频的编解码技术领域,特别涉及一种高阶Ambisonic音频的编解码方法及芯片。
背景技术
高阶立体音频技术(Higher Order Ambisonic,HOA)是一阶立体音频技术(FirstOrder Ambisonic,FOA)的扩展,该技术通过重建空间中声场分布来拟合声场。高阶立体音频技术主要基于以下两个原理:(1)声场可以被视为多个球谐函数的叠加;(2)可以用多个球谐函数来逼近声波函数。
下面阐述球谐函数分解的原理。单位球上的任意函数p(θ,λ)均可表示为以下形式:
其中,anm和bnm是球谐系数,θ和λ是球坐标的角度,n和m是正则化的阶数和次数,Rnm和Snm是正则化后的球谐函数,Rnm(θ,λ)=Pnm(cosθ)cosmλ,Snm(θ,λ)=Pnm(cosθ)sinmλ,Pnm是完全正则化的关联勒让德函数。目前,HOA音频的编码过程即是将原始音频信号进行球谐分解得到HOA信号的过程,其解码过程为使用逆变换求得球谐波在扬声器上的驱动信号的过程。HOA音频信号的编码与解码大多采用软件在通用CPU或GPU上实现,这样HOA音频信号的编码和解码的速度较慢,且尚没有对高阶立体音频编解码过程进行硬件加速的专用芯片。
发明内容
本发明实施例提供了一种高阶Ambisonic音频的编解码方法及芯片,解决了现有技术中HOA音频信号的编码和解码的速度较慢,以及没有对高阶立体音频编解码过程进行硬件加速的专用芯片的技术问题。
本发明实施例提供了一种高阶Ambisonic音频编码方法,针对HOA音频的编码过程进行流水线设计,并对音频信号进行向量化操作,有利于球谐编码的快速运算。
该高阶Ambisonic音频编码方法包括:
将沿λ方向均匀采样的角度和原始声波函数作为第一运算算法的输入,利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果;
将沿θ方向均匀采样的角度和第一结果作为第二运算算法的输入,利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果;
将球谐函数分解的阶数n、沿θ方向的特定角度、第二结果作为第三运算算法的输入,利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果;
将球谐函数分解的次数m、沿λ方向的特定角度、第三结果作为第四运算算法的输入,利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果;
其中,第一运算算法、第二运算算法、第三运算算法和第四运算算法是对球谐函数进行分解后获得;第四结果映射到复空间下的系数矩阵为原始声波函数的HOA编码信号。
本发明实施例还提供了一种高阶Ambisonic音频解码装置,针对HOA音频的解码过程进行流水线设计,并对音频信号进行向量化操作,有利于球谐解码的快速运算。
该高阶Ambisonic音频解码包括:
根据扬声器的数目和位置确定扬声器的系数矩阵;
对所述扬声器的系数矩阵进行伪逆操作,获得伪逆操作矩阵;
根据违逆操作矩阵和原始声波函数的HOA编码信号确定扬声器的驱动信号。
本发明实施例提供了一种高阶Ambisonic音频编码装置,包括:
第一运算算法模块,用于将沿λ方向均匀采样的角度和原始声波函数作为第一运算算法的输入,利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果;
第二运算算法模块,用于将沿θ方向均匀采样的角度和第一结果作为第二运算算法的输入,利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果;
第三运算算法模块,用于将球谐函数分解的阶数n、沿θ方向的特定角度、第二结果作为第三运算算法的输入,利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果;
第四运算算法模块,用于将球谐函数分解的次数m、沿λ方向的特定角度、第三结果作为第四运算算法的输入,利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果;
其中,第一运算算法、第二运算算法、第三运算算法和第四运算算法是对球谐函数进行分解后获得;第四结果映射到复空间下的系数矩阵为原始声波函数的HOA编码信号。
本发明实施例提供了一种高阶Ambisonic音频解码装置,包括:
系数矩阵确定模块,用于根据扬声器的数目和位置确定扬声器的系数矩阵;
矩阵操作模块,用于对所述扬声器的系数矩阵进行伪逆操作,获得伪逆操作矩阵;
驱动信号确定模块,用于根据违逆操作矩阵和原始声波函数的HOA编码信号确定扬声器的驱动信号。
本发明实施例提供了一种高阶Ambisonic音频编码芯片,该芯片将球谐分解进行硬件实现,以加速HOA信号的编码过程,并以此扩展HOA音频之使用范围,使其适用于流媒体播放等实时性要求较高的场合。
该高阶Ambisonic音频编码芯片包括:
第一运算器,用于将沿λ方向均匀采样的角度和原始声波函数作为第一运算算法的输入,利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果;
第二运算器,用于将沿θ方向均匀采样的角度和第一结果作为第二运算算法的输入,利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果;
第三运算器,用于将球谐函数分解的阶数n、沿θ方向的特定角度、第二结果作为第三运算算法的输入,利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果;
第四运算器,用于将球谐函数分解的次数m、沿λ方向的特定角度、第三结果作为第四运算算法的输入,利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果;
其中,第一运算算法、第二运算算法、第三运算算法和第四运算算法是对球谐函数进行分解后获得;第四结果映射到复空间下的系数矩阵为原始声波函数的HOA编码信号。
本发明实施例提供了一种高阶Ambisonic音频解码芯片,该芯片将球谐分解的逆变换进行硬件实现,以加速HOA信号的解码过程,并以此扩展HOA音频之使用范围,使其适用于流媒体播放等实时性要求较高的场合。
该高阶Ambisonic音频解码芯片包括:
第一运算器,用于对扬声器的系数矩阵进行伪逆操作,获得伪逆操作矩阵;
第二运算器,用于根据违逆操作矩阵和原始声波函数的HOA编码信号确定扬声器的驱动信号;
其中,扬声器的系数矩阵根据扬声器的数目和位置确定。
本发明实施例还提供了一种计算机芯片,包括:上述的高阶Ambisonic音频编码芯片、上述的高阶Ambisonic音频解码芯片。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。
在本发明实施例中,对HOA信号的编解码过程进行了流水线设计,比如将球谐函数分解成四个运算算法,将HOA音频解码的过程拆分为多步矩阵计算,同时进行硬件实现,有利于球谐编解码的快速运算。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种高阶Ambisonic音频编码方法流程图;
图2是本发明实施例提供的一种高阶Ambisonic音频编码装置结构框图;
图3是本发明实施例提供的一种高阶Ambisonic音频编码芯片的内部运算器示意图;
图4是本发明实施例提供的一种高阶Ambisonic音频解码方法流程图一;
图5是本发明实施例提供的一种高阶Ambisonic音频解码方法流程图二;
图6是本发明实施例提供的一种高阶Ambisonic音频解码装置结构框图;
图7是本发明实施例提供的一种高阶Ambisonic音频解码芯片的内部运算器示意图;
图8是本发明实施例提供的一种计算机芯片结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中,现有的HOA音频的编码过程即是将原始音频信号进行球谐分解得到HOA信号的过程,其解码过程为使用逆变换求得球谐波在扬声器上的驱动信号的过程,这种HOA音频信号的编码和解码方式速度较慢,且没有对高阶立体音频编解码过程进行硬件加速的专用芯片。基于此,本发明提供了一种HOA音频编解码流程拆分策略,该策略将高阶立体音频编码的过程拆解为四个子过程,将高阶立体音频解码的过程拆分为多步矩阵计算。该策略可由高阶Ambisonic音频的编解码方法、装置及芯片实现,这种流程拆分方式有利于HOA音频编码与解码过程的硬件实现,有利于球谐编解码的快速运算。
基于背景技术中提到的高阶立体音频技术的两个原理以及公式(1),可以将球谐分解的操作表示为以下四步积分形式:
式(3)、(4)、(5)、(6)的操作是类似的,都包含三角函数与积分操作(积分操作包括乘法和加法操作),同时(4)、(5)也包含勒让德函数计算,故将球谐分解的过程分为四个运算过程,基于这四个运算过程进行HOA音频编码。
图1是本发明实施例提供的一种高阶Ambisonic音频编码方法流程图,如图1所示,该方法包括:
对球谐函数进行分解,获得四个运算算法;
步骤101:将沿λ方向均匀采样的角度和原始声波函数作为第一运算算法的输入,利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果
步骤102:将沿θ方向均匀采样的角度和第一结果作为第二运算算法的输入,利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果
步骤103:将球谐函数分解的阶数n、沿θ方向的特定角度、第二结果作为第三运算算法的输入,利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果
步骤104:将球谐函数分解的次数m、沿λ方向的特定角度、第三结果作为第四运算算法的输入,利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果p(θ,λ);
其中,第一运算算法、第二运算算法、第三运算算法和第四运算算法是对球谐函数进行分解后获得;第四结果映射到复空间下的系数矩阵为原始声波函数的HOA编码信号。复空间就是平面向量空间,即由一对有序实数的全体所构成的集合。
在本发明实施例中,根据公式(2)可知,第一运算算法中包括三角函数运算、乘法运算和加法运算;
则步骤101具体包括:
利用三角函数运算计算沿λ方向均匀采样的角度的正弦函数结果和余弦函数结果,利用乘法运算和加法运算将所述沿λ方向均匀采样的角度的正弦函数结果、余弦函数结果分别和原始声波函数相乘后再相加,获得第一结果。
在本发明实施例中,根据公式(3)可知,第二运算算法中包括三角函数运算、勒让德函数运算、乘法运算和加法运算;
则步骤102具体包括:
利用三角函数运算计算沿θ方向均匀采样的角度的正弦函数结果和余弦函数结果,利用勒让德函数运算计算沿θ方向均匀采样的角度的余弦函数结果的勒让德函数结果,利用乘法运算和加法运算将所述沿θ方向均匀采样的角度的正弦函数结果、沿θ方向均匀采样的角度的余弦函数结果的勒让德函数结果、第一结果相乘后再相加,获得第二结果。
在本发明实施例中,根据公式(4)可知,第三运算算法中包括三角函数运算、勒让德函数运算、乘法运算和加法运算;
则步骤103具体包括:
利用三角函数运算计算沿θ方向的特定角度的余弦函数结果,利用勒让德函数运算计算沿θ方向的特定角度的余弦函数结果的勒让德函数结果,利用乘法运算和加法运算将沿θ方向的特定角度的余弦函数结果的勒让德函数结果、第二结果相乘后再相加,获得第三结果。
在本发明实施例中,根据公式(5)可知,第四运算算法中包括三角函数运算、乘法运算和加法运算;
则步骤104具体包括:
利用三角函数运算计算球谐函数分解的次数m和沿λ方向的特定角度的正弦函数结果和余弦函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的正弦函数结果和余弦函数结果与第三结果相乘的结果后再相加,获得第四结果。
其中,步骤103和步骤104中所说的“特定角度”是预先选定的角度。
在本发明实施例中,公式(5)与公式(6)中三角函数、勒让德函数的运算结果有极大可能在公式(3)与公式(4)中被运算过,所以该方法还可以包括:
将所述沿λ方向均匀采样的角度的三角函数、所述沿θ方向均匀采样的角度的三角函数、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果其中之一或多个进行缓存。
这样,本发明充分利用计算结果的局部一致性,将勒让德函数、三角函数的结果进行缓存,在进行步骤103和步骤104时,可以从缓存(cache)中快速获取缓存的cosmλ、sinmλ、Pnm(cosθ),从而减少勒让德函数与三角函数的重复运算。但是,当cache容量有限制时,可能不能缓存,则不排除步骤103和步骤104需重新运算的可能性。
基于同一发明构思,本发明实施例中还提供了一种高阶Ambisonic音频编码装置,如下面的实施例所述。
图2是本发明实施例的高阶Ambisonic音频编码装置结构框图,如图2所示,包括:
第一运算算法模块201,用于将沿λ方向均匀采样的角度和原始声波函数作为第一运算算法的输入,利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果即λ向积分阵列;
第二运算算法模块202,用于将沿θ方向均匀采样的角度和第一结果作为第二运算算法的输入,利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果即θ向积分阵列;
第三运算算法模块203,用于将球谐函数分解的阶数n、沿θ方向的特定角度、第二结果作为第三运算算法的输入,利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果即n向积分阵列;
第四运算算法模块204,用于将球谐函数分解的次数m、沿λ方向的特定角度、第三结果作为第四运算算法的输入,利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果p(θ,λ),即m向积分阵列;
其中,第一运算算法、第二运算算法、第三运算算法和第四运算算法是对球谐函数进行分解后获得;第四结果映射到复空间下的系数矩阵为原始声波函数的HOA编码信号。
该音频编码方法将多个音频帧拼接作为向量输入,每个模块内按角度顺序或者阶数、次数的顺序,对输入变量(和/或)三角函数(和/或)勒让德函数进行积分操作(即相乘相加),前三个模块的积分结果为下一模块的输入,最后一个模块的积分结果变换到复空间后即得到球谐分解的输出B。
在本发明实施例中,所述第一运算算法中包括三角函数运算、乘法运算和加法运算;
第一运算算法模块201具体用于:
利用三角函数运算计算沿λ方向均匀采样的角度的正弦函数结果和余弦函数结果,利用乘法运算和加法运算将所述沿λ方向均匀采样的角度的正弦函数结果、余弦函数结果分别和原始声波函数相乘后再相加,获得第一结果。
在本发明实施例中,所述第二运算算法中包括三角函数运算、勒让德函数运算、乘法运算和加法运算;
第二运算算法模块202具体用于:
利用三角函数运算计算沿θ方向均匀采样的角度的正弦函数结果和余弦函数结果,利用勒让德函数运算计算沿θ方向均匀采样的角度的余弦函数结果的勒让德函数结果,利用乘法运算和加法运算将所述沿θ方向均匀采样的角度的正弦函数结果、沿θ方向均匀采样的角度的余弦函数结果的勒让德函数结果、第一结果相乘后再相加,获得第二结果。
在本发明实施例中,所述第三运算算法中包括三角函数运算、勒让德函数运算、乘法运算和加法运算;
第三运算算法模块203具体用于:
利用三角函数运算计算沿θ方向的特定角度的余弦函数结果,利用勒让德函数运算计算沿θ方向的特定角度的余弦函数结果的勒让德函数结果,利用乘法运算和加法运算将沿θ方向的特定角度的余弦函数结果的勒让德函数结果、第二结果相乘后再相加,获得第三结果。
在本发明实施例中,所述第四运算算法中包括三角函数运算、乘法运算和加法运算;
第四运算算法模块204具体用于:
利用三角函数运算计算球谐函数分解的次数m和沿λ方向的特定角度的正弦函数结果和余弦函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的正弦函数结果和余弦函数结果与第三结果相乘的结果后再相加,获得第四结果。
在本发明实施例中,该高阶Ambisonic音频编码装置还包括:
缓存模块,用于将所述沿λ方向均匀采样的角度的三角函数、所述沿θ方向均匀采样的角度的三角函数、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果其中之一或多个进行缓存。
上述高阶Ambisonic音频编码装置的运算过程被控制信号控制,且其运算过程与缓存有信息交互。
上述是通过计算机程序来实现高阶Ambisonic音频编码,下面还可以从硬件角度来实现高阶Ambisonic音频编码。
基于同一发明构思,本发明实施例中还提供了一种高阶Ambisonic音频编码芯片,如下面的实施例所述。
图3是本发明实施例提供的一种高阶Ambisonic音频编码芯片结构示意图,如图3所示,该高阶Ambisonic音频编码芯片包括:
第一运算器,用于将沿λ方向均匀采样的角度和原始声波函数作为第一运算算法的输入,利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果;
第二运算器,用于将沿θ方向均匀采样的角度和第一结果作为第二运算算法的输入,利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果;
第三运算器,用于将球谐函数分解的阶数n、沿θ方向的特定角度、第二结果作为第三运算算法的输入,利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果;
第四运算器,用于将球谐函数分解的次数m、沿λ方向的特定角度、第三结果作为第四运算算法的输入,利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果;
其中,第一运算算法、第二运算算法、第三运算算法和第四运算算法是对球谐函数进行分解后获得;第四结果映射到复空间下的系数矩阵为原始声波函数的HOA编码信号。
在本发明实施例中,如图3所示,所述第一运算器中包括三角函数运算器、乘法运算器和加法运算器;
所述第二运算器中包括三角函数运算器、勒让德函数运算器、乘法运算器和加法运算器(两者合成积分器);
所述第三运算器中包括三角函数运算器、勒让德函数运算器、乘法运算器和加法运算器;
所述第四运算器中包括三角函数运算器、乘法运算器和加法运算器。
其中,阶数n、次数m表示系数输入,λ、θ表示角度输入。
其中,上述的三角函数运算器是通过cordic方式进行硬件实现,cordic(Coordinate Rotation Digital Computer)算法即坐标旋转数字计算方法,主要用于三角函数、双曲线、指数、对数的计算。该算法通过基本的加和移位运算代替乘法运算,使得矢量的旋转和定向的计算不再需要三角函数、乘法、开方、反三角、指数等函数。
在本发明实施例中,如图3所示,还包括:
缓存器,用于将所述沿λ方向均匀采样的角度的三角函数、所述沿θ方向均匀采样的角度的三角函数、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果其中之一或多个进行缓存。
上述芯片的运算过程被控制信号控制,且其运算过程与缓存有信息交互。当然,数据缓存也可以是缓存于芯片外置的缓存器中。
基于上述的高阶Ambisonic音频编码,本发明还从高阶Ambisonic音频解码角度提出了一种方法、装置和芯片,如下面的实施例所述。
图4是本发明实施例提供的一种高阶Ambisonic音频解码方法流程图,如图4所示,该高阶Ambisonic音频解码方法包括:
步骤401:根据扬声器的数目和位置确定扬声器的系数矩阵;
步骤402:对所述扬声器的系数矩阵进行伪逆操作,获得伪逆操作矩阵;
步骤403:根据违逆操作矩阵和原始声波函数的HOA编码信号确定扬声器的驱动信号。
在本发明实施例中,如图5所示,步骤402具体包括:
步骤4021:根据系数矩阵C确定系数矩阵的转置矩阵CT;
步骤4022:将所述系数矩阵和系数矩阵的转置矩阵相乘得到方形矩阵CTC;
步骤4023:对方形矩阵的进行逆操作,得到方形矩阵的逆矩阵(CTC)-1;
步骤4024:将方形矩阵的逆矩阵(CTC)-1和系数矩阵的转置矩阵CT相乘得到伪逆操作矩阵(CTC)-1CT;
步骤403具体包括:
将违逆操作矩阵(CTC)-1CT和原始声波函数的HOA编码信号B相乘得到扬声器的驱动信号D。
在本发明实施例中,扬声器的驱动信号按照如下公式确定:
D=(CTC)-1CTB;
其中,D为扬声器的驱动信号;C为扬声器的系数矩阵;上标T表示对矩阵进行转置操作;上标-1表示对矩阵进行逆操作;B为原始声波函数的HOA编码信号。
上述方法中,当采用L个扬声器重建声场时,系数矩阵C可根据扬声器数目与位置确定。对指定的球谐信号B(即原始声波函数的HOA编码信号),计算pinv(C)B即得到用于扬声器的驱动信号D,其中pinv(C)=(CTC)-1CT为矩阵的伪逆操作。
在本发明实施例中,该高阶Ambisonic音频解码方法还包括:
对系数矩阵的转置矩阵、方形矩阵、方形矩阵的逆矩阵、伪逆操作矩阵其中之一或多个进行缓存。
这样在计算过程中对球谐系数矩阵C与球谐信号B的变量进行缓存,以减少运算过程中对数据的重复寻址。
基于同一发明构思,本发明实施例中还提供了一种高阶Ambisonic音频解码装置,如下面的实施例所述。
图6是本发明实施例提供的一种高阶Ambisonic音频解码装置结构框图,如图6所示,该高阶Ambisonic音频解码装置包括:
系数矩阵确定模块601,用于根据扬声器的数目和位置确定扬声器的系数矩阵;
矩阵操作模块602,用于对所述扬声器的系数矩阵进行伪逆操作,获得伪逆操作矩阵;
驱动信号确定模块603,用于根据违逆操作矩阵和原始声波函数的HOA编码信号确定扬声器的驱动信号。
在本发明实施例中,所述矩阵操作模块602具体用于:
根据系数矩阵确定系数矩阵的转置矩阵;
将所述系数矩阵和系数矩阵的转置矩阵相乘得到方形矩阵;
对方形矩阵的进行逆操作,得到方形矩阵的逆矩阵;
将方形矩阵的逆矩阵和系数矩阵的转置矩阵相乘得到伪逆操作矩阵;
驱动信号确定模块603具体用于:
将违逆操作矩阵和原始声波函数的HOA编码信号相乘得到扬声器的驱动信号。
在本发明实施例中,还包括:
缓存模块,用于对系数矩阵的转置矩阵、方形矩阵、方形矩阵的逆矩阵、伪逆操作矩阵其中之一或多个进行缓存。
上述是通过计算机程序来实现高阶Ambisonic音频解码,下面还可以从硬件角度来实现高阶Ambisonic音频解码。
该高阶Ambisonic音频解码芯片包括:
第一运算器,用于对扬声器的系数矩阵进行伪逆操作,获得伪逆操作矩阵;
第二运算器,用于根据违逆操作矩阵和原始声波函数的HOA编码信号确定扬声器的驱动信号;
其中,扬声器的系数矩阵根据扬声器的数目和位置确定。
本芯片中的HOA音频解码方法通过两步矩阵乘法与一步矩阵求逆操作实现。
在本发明实施例中,如图7所示,第一运算器包括乘法运算器和cordic运算器(矩阵求逆);
所述第二运算器包括乘法运算器;
所述第一运算器中的乘法运算器具体用于:
将系数矩阵和系数矩阵的转置矩阵相乘得到方形矩阵;
所述第一运算器中的cordic运算器具体用于:
对方形矩阵的进行逆操作,得到方形矩阵的逆矩阵;
所述第一运算器中的乘法运算器具体用于:
将方形矩阵的逆矩阵和系数矩阵的转置矩阵相乘得到伪逆操作矩阵;
所述第二运算器中的乘法运算器具体用于:
将违逆操作矩阵和原始声波函数的HOA编码信号相乘得到扬声器的驱动信号。
在本发明实施例中,如图7所示,还包括:
缓存器,用于对系数矩阵的转置矩阵、方形矩阵、方形矩阵的逆矩阵、伪逆操作矩阵其中之一或多个进行缓存。
上述本芯片中的HOA音频解码方法还可以是通过两步矩阵乘法与一步矩阵求逆操作实现,也就是说所述第一运算器中最后一步的乘法(将方形矩阵的逆矩阵和系数矩阵的转置矩阵相乘)可以合并至所述第二运算器中的将违逆操作矩阵和原始声波函数的HOA编码信号相乘。
上述芯片的运算过程被控制信号控制,且其运算过程与缓存有信息交互。当然,矩阵缓存也可以是缓存于芯片外置的缓存器中。
基于同一发明构思,本发明实施例中还提供了一种计算机芯片,如图8所示,包括:上述所述的高阶Ambisonic音频编码芯片、上述所述的高阶Ambisonic音频解码芯片。
本发明所设计的芯片使用FPGA进行原理验证,但本芯片的产品并不限于FPGA这一种实现形式。
FPGA(Field Programmable Gate Array)器件属于专用集成电路中的一种半定制电路,是可编程的逻辑阵列,能够有效的解决原有的器件门电路数较少的问题。FPGA的基本结构包括可编程输入输出单元,可配置逻辑块,数字时钟管理模块,嵌入式块RAM,布线资源,内嵌专用硬核,底层内嵌功能单元。由于FPGA具有布线资源丰富,可重复编程和集成度高,投资较低的特点,在数字电路设计领域得到了广泛的应用。
FPGA采用了逻辑单元阵列LCA(Logic Cell Array)这样一个概念,内部包括可配置逻辑模块CLB(Configurable Logic Block)、输入输出模块IOB(Input Output Block)和内部连线(Interconnect)三个部分。现场可编程门阵列(FPGA)是可编程器件,与传统逻辑电路和门阵列(如PAL,GAL及CPLD器件)相比,FPGA具有不同的结构。FPGA利用小型查找表(16×1RAM)实现组合逻辑,每个查找表连接到一个D触发器的输入端,触发器再来驱动其他逻辑电路或驱动I/O,由此构成了既可实现组合逻辑功能又可实现时序逻辑功能的基本逻辑单元模块,这些模块间利用金属连线互相连接或连接到I/O模块。FPGA的逻辑是通过向内部静态存储单元加载编程数据来实现的,存储在存储器单元中的值决定了逻辑单元的逻辑功能以及各模块之间或模块与I/O间的联接方式,并最终决定了FPGA所能实现的功能,FPGA允许无限次的编程。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述方法。
本发明所提出的计算机设备还可以是包括一个或多个上述计算机芯片,及一个或多个可读存储介质。该计算机设备可通过计算机芯片操作可读存储介质中的HOA音频信号,使得计算机芯片中的编码与解码方法生效。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。
综上所述,本发明提出的高阶Ambisonic音频的编解码方法、装置及芯片具有如下有益效果:
(1)本发明针对HOA的编码与解码过程进行硬件实现,以扩展HOA音频的使用范围,使其适用于流媒体播放等实时性要求较高的场合。
(2)本发明针对HOA音频的编解码过程进行流水线设计,并对音频信号进行向量化操作,这种设计有利于球谐编码的快速运算;
(3)本发明充分利用了HOA信号编解码过程中矩阵读写、函数计算的局部一致性,并针对这种一致性进行缓存设计,这种设计减少了HOA信号编解码过程的冗余读写与运算操作;
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种高阶Ambisonic音频编码方法,其特征在于,包括:
将沿λ方向均匀采样的角度和原始声波函数作为第一运算算法的输入,利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果;
将沿θ方向均匀采样的角度和第一结果作为第二运算算法的输入,利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果;
将球谐函数分解的阶数n、沿θ方向的特定角度、第二结果作为第三运算算法的输入,利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果;
将球谐函数分解的次数m、沿λ方向的特定角度、第三结果作为第四运算算法的输入,利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果;
其中,第一运算算法、第二运算算法、第三运算算法和第四运算算法是对球谐函数进行分解后获得;第四结果映射到复空间下的系数矩阵为原始声波函数的HOA编码信号。
2.如权利要求1所述的高阶Ambisonic音频编码方法,其特征在于,所述第一运算算法中包括三角函数运算、乘法运算和加法运算;
利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果,包括:
利用三角函数运算计算沿λ方向均匀采样的角度的正弦函数结果和余弦函数结果,利用乘法运算和加法运算将所述沿λ方向均匀采样的角度的正弦函数结果、余弦函数结果分别和原始声波函数相乘后再相加,获得第一结果。
3.如权利要求2所述的高阶Ambisonic音频编码方法,其特征在于,所述第二运算算法中包括三角函数运算、勒让德函数运算、乘法运算和加法运算;
利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果,包括:
利用三角函数运算计算沿θ方向均匀采样的角度的正弦函数结果和余弦函数结果,利用勒让德函数运算计算沿θ方向均匀采样的角度的余弦函数结果的勒让德函数结果,利用乘法运算和加法运算将所述沿θ方向均匀采样的角度的正弦函数结果、沿θ方向均匀采样的角度的余弦函数结果的勒让德函数结果、第一结果相乘后再相加,获得第二结果。
4.如权利要求3所述的高阶Ambisonic音频编码方法,其特征在于,所述第三运算算法中包括三角函数运算、勒让德函数运算、乘法运算和加法运算;
利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果,包括:
利用三角函数运算计算沿θ方向的特定角度的余弦函数结果,利用勒让德函数运算计算沿θ方向的特定角度的余弦函数结果的勒让德函数结果,利用乘法运算和加法运算将沿θ方向的特定角度的余弦函数结果的勒让德函数结果、第二结果相乘后再相加,获得第三结果。
5.如权利要求4所述的高阶Ambisonic音频编码方法,其特征在于,所述第四运算算法中包括三角函数运算、乘法运算和加法运算;
利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果,包括:
利用三角函数运算计算球谐函数分解的次数m和沿λ方向的特定角度的正弦函数结果和余弦函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的正弦函数结果和余弦函数结果与第三结果相乘的结果后再相加,获得第四结果。
6.如权利要求1所述的高阶Ambisonic音频编码方法,其特征在于,还包括:
将所述沿λ方向均匀采样的角度的三角函数、所述沿θ方向均匀采样的角度的三角函数、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果其中之一或多个进行缓存。
7.一种高阶Ambisonic音频解码方法,其特征在于,包括:
根据扬声器的数目和位置确定扬声器的系数矩阵;
对所述扬声器的系数矩阵进行伪逆操作,获得伪逆操作矩阵;
根据违逆操作矩阵和原始声波函数的HOA编码信号确定扬声器的驱动信号。
8.一种高阶Ambisonic音频编码芯片,其特征在于,包括:
第一运算器,用于将沿λ方向均匀采样的角度和原始声波函数作为第一运算算法的输入,利用第一运算算法计算沿λ方向均匀采样的角度的三角函数结果,将所述沿λ方向均匀采样的角度的三角函数结果和原始声波函数相乘的结果进行积分,获得第一结果;
第二运算器,用于将沿θ方向均匀采样的角度和第一结果作为第二运算算法的输入,利用第一运算算法计算沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果,将所述沿θ方向均匀采样的角度的三角函数结果、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果、第一结果相乘的结果进行积分,获得第二结果;
第三运算器,用于将球谐函数分解的阶数n、沿θ方向的特定角度、第二结果作为第三运算算法的输入,利用第三运算算法计算沿θ方向的特定角度的三角函数结果,利用第三运算算法计算沿θ方向的特定角度的三角函数结果的勒让德函数结果,将沿θ方向的特定角度的三角函数结果的勒让德函数结果和第二结果相乘的结果进行积分,获得第三结果;
第四运算器,用于将球谐函数分解的次数m、沿λ方向的特定角度、第三结果作为第四运算算法的输入,利用第四运算算法计算球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果,将球谐函数分解的次数m和沿λ方向的特定角度的三角函数结果与第三结果相乘的结果进行积分,获得第四结果;
其中,第一运算算法、第二运算算法、第三运算算法和第四运算算法是对球谐函数进行分解后获得;第四结果映射到复空间下的系数矩阵为原始声波函数的HOA编码信号。
9.如权利要求8所述的高阶Ambisonic音频编码芯片,其特征在于,所述第一运算器中包括三角函数运算器、乘法运算器和加法运算器;
所述第二运算器中包括三角函数运算器、勒让德函数运算器、乘法运算器和加法运算器;
所述第三运算器中包括三角函数运算器、勒让德函数运算器、乘法运算器和加法运算器;
所述第四运算器中包括三角函数运算器、乘法运算器和加法运算器。
10.如权利要求8所述的高阶Ambisonic音频编码芯片,其特征在于,还包括:
缓存器,用于将所述沿λ方向均匀采样的角度的三角函数、所述沿θ方向均匀采样的角度的三角函数、沿θ方向均匀采样的角度的三角函数结果的勒让德函数结果其中之一或多个进行缓存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011319445.8A CN112530445A (zh) | 2020-11-23 | 2020-11-23 | 高阶Ambisonic音频的编解码方法及芯片 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011319445.8A CN112530445A (zh) | 2020-11-23 | 2020-11-23 | 高阶Ambisonic音频的编解码方法及芯片 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112530445A true CN112530445A (zh) | 2021-03-19 |
Family
ID=74992578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011319445.8A Pending CN112530445A (zh) | 2020-11-23 | 2020-11-23 | 高阶Ambisonic音频的编解码方法及芯片 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112530445A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5734793A (en) * | 1994-09-07 | 1998-03-31 | Motorola Inc. | System for recognizing spoken sounds from continuous speech and method of using same |
CN102823277A (zh) * | 2010-03-26 | 2012-12-12 | 汤姆森特许公司 | 解码用于音频回放的音频声场表示的方法和装置 |
CN103931211A (zh) * | 2011-11-11 | 2014-07-16 | 汤姆逊许可公司 | 处理用于产生声场的高保真度立体声响复制表示的刚性球上的球面麦克风阵列的信号的方法及装置 |
CN104205879A (zh) * | 2012-03-28 | 2014-12-10 | 汤姆逊许可公司 | 从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置 |
AU2014265108A1 (en) * | 2010-03-26 | 2014-12-11 | Dolby International Ab | Method and device for decoding an audio soundfield representation for audio playback |
US20190069110A1 (en) * | 2017-08-25 | 2019-02-28 | Google Inc. | Fast and memory efficient encoding of sound objects using spherical harmonic symmetries |
CN110544484A (zh) * | 2019-09-23 | 2019-12-06 | 中科超影(北京)传媒科技有限公司 | 高阶Ambisonic音频编解码方法及装置 |
CN110583030A (zh) * | 2017-08-01 | 2019-12-17 | 谷歌有限责任公司 | 不相干幂等高保真度立体声响复制渲染 |
-
2020
- 2020-11-23 CN CN202011319445.8A patent/CN112530445A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5734793A (en) * | 1994-09-07 | 1998-03-31 | Motorola Inc. | System for recognizing spoken sounds from continuous speech and method of using same |
CN102823277A (zh) * | 2010-03-26 | 2012-12-12 | 汤姆森特许公司 | 解码用于音频回放的音频声场表示的方法和装置 |
AU2014265108A1 (en) * | 2010-03-26 | 2014-12-11 | Dolby International Ab | Method and device for decoding an audio soundfield representation for audio playback |
CN103931211A (zh) * | 2011-11-11 | 2014-07-16 | 汤姆逊许可公司 | 处理用于产生声场的高保真度立体声响复制表示的刚性球上的球面麦克风阵列的信号的方法及装置 |
CN104205879A (zh) * | 2012-03-28 | 2014-12-10 | 汤姆逊许可公司 | 从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置 |
CN110583030A (zh) * | 2017-08-01 | 2019-12-17 | 谷歌有限责任公司 | 不相干幂等高保真度立体声响复制渲染 |
US20190069110A1 (en) * | 2017-08-25 | 2019-02-28 | Google Inc. | Fast and memory efficient encoding of sound objects using spherical harmonic symmetries |
CN110544484A (zh) * | 2019-09-23 | 2019-12-06 | 中科超影(北京)传媒科技有限公司 | 高阶Ambisonic音频编解码方法及装置 |
Non-Patent Citations (1)
Title |
---|
王岩;陈克安;胥健;: "基于HOA的圆柱腔低频声场重构", 西北工业大学学报, no. 04 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lian et al. | High-performance FPGA-based CNN accelerator with block-floating-point arithmetic | |
Chandrashekara et al. | Design of 8 bit Vedic multiplier using Urdhva Tiryagbhyam sutra with modified carry save adder | |
CN105981410A (zh) | 使用奇异值分解进行高阶高保真立体声编码和解码的方法和装置 | |
Carranza et al. | Fast and scalable computation of the forward and inverse discrete periodic radon transform | |
Cheng et al. | Efficient FPGA-based Fresnel transform architecture for digital holography | |
Lai et al. | A hybrid number system processor with geometric and complex arithmetic capabilities | |
Véstias et al. | A configurable architecture for running hybrid convolutional neural networks in low-density FPGAs | |
Alawad et al. | Memory-efficient probabilistic 2-D finite impulse response (FIR) filter | |
Chu et al. | Efficient design of majority-logic-based approximate arithmetic circuits | |
CN112530445A (zh) | 高阶Ambisonic音频的编解码方法及芯片 | |
CN111615045B (zh) | 音频处理方法、装置、设备及存储介质 | |
US20200394994A1 (en) | Invertible neural network to synthesize audio signals | |
Daud et al. | Hybrid modified booth encoded algorithm-carry save adder fast multiplier | |
Meng et al. | Point-based acoustic scattering for interactive sound propagation via surface encoding | |
Thiruvengadam et al. | Low power approximate adder based repetitive iteration cord (LP-ARICO) algorithm for high-speed applications | |
Kageyama et al. | Implementation of Floating‐Point Arithmetic Processing on Content Addressable Memory‐Based Massive‐Parallel SIMD matriX Core | |
Kariyado et al. | Auralization of three-dimensional cellular automata | |
Marshall et al. | A three-dimensional, p-version BEM: High-order refinement leveraged through regularization | |
Khatua et al. | VLSI architecture of DCT-based harmonic wavelet transform for time–frequency analysis | |
Dong et al. | Implementation of single-precision floating-point trigonometric functions with small area | |
Joshi et al. | Floating point unit core for Signal Processing applications | |
Upadhyay et al. | Simulink design of pipelined CORDIC for generation of sine and cosine values | |
Alawad et al. | Stochastic-based convolutional networks with reconfigurable logic fabric | |
Saravanan et al. | Sine/cos generator for direct digital frequency synthesizer using pipelined CORDIC processor | |
Perez et al. | Real-time voxel-based visual hull reconstruction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |