CN108550369B - 一种可变长度的全景声信号编解码方法 - Google Patents
一种可变长度的全景声信号编解码方法 Download PDFInfo
- Publication number
- CN108550369B CN108550369B CN201810334634.9A CN201810334634A CN108550369B CN 108550369 B CN108550369 B CN 108550369B CN 201810334634 A CN201810334634 A CN 201810334634A CN 108550369 B CN108550369 B CN 108550369B
- Authority
- CN
- China
- Prior art keywords
- frame
- audio
- data
- code stream
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000005236 sound signal Effects 0.000 title claims abstract description 11
- 238000005070 sampling Methods 0.000 claims abstract description 41
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 230000008521 reorganization Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明公开一种可变长度的全景声信号编解码方法,编码包括:计算所需编码全景声信号的音频样点数;将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;将整帧部分按标准方式编码,将短帧部分按短帧方式编码,将短帧的长度信息写在码流中的frame_length字段;解码包括:每次读取一个音频帧对应采样点数的码流数据;若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段进行解码。本发明能够在电影工程中对任意片段进行添加、删除、替换等操作,并可以完整、正确地进行编解码,而且不会影响已经编好的数据。
Description
技术领域
本发明涉及一种全景声信号编解码处理技术领域,具体涉及一种可变长度的全景声信号的编解码方法。
背景技术
经过多年发展,立体声、5.1、7.1环绕声等***已经获得了广泛的应用,这些***因缺乏声音的高度信息,最多只能呈现二维的声音。在真实的世界中,全景声(也称三维声)是声音最真实的呈现和表达方式,无论自然界、艺术领域或视听娱乐领域,全景声都是未来的发展趋势。
在现有的***中,全景声可以是多声道信号(如9.1、11.1、13.1和22.2等),可以是多个声音对象,也可以是两者的组合。在全景声***中,多声道信号可以是环绕声信号,如5.1、7.1等,也可以是多层多声道信号(即多层声道信号分布在不同高度平面)。例如,有些全景声***采用中间层及顶层的两层平面,有些全景声***采用三层***等。有些全景声***只有多层多声道信号,但没有声音对象,例如SMPTE的22.2三维声***和AURO 9.1***等。有些全景声***则既有多层多声道信号,也有声音对象,例如MPEG-H、Dolby Atmos和DTS:X***。当然,作为一个极端的例子,全景声也可以全部是声音对象信号。
一部全景声电影在制作、混录时普遍采用数字音频工作站(Digital AudioWorkstation,DAW),比如Pro Tools、Nuendo、Cubase、Logic Pro、Adobe Audition等。混录师可以将多声道音频和多个声音对象放入电影制作工程中,以达到全景声的听觉效果。电影在制作完毕后,需要对整部电影的音频数据进行符合全景声格式的音频编码,并将编码后的数据和视频一起封装成DCP包,拷贝至影院服务器,再通过全景声音频解码器播放出来,呈现给观众。
目前,这种全景声音频编解码技术可以将整部电影完整、正确地编解码,在放映端效果甚好。但有时,当整部电影完成编码后,导演组会临时调整一些画面或场景,那么相应的音频数据也会发生变化,所以要对所有被修改的数据重新进行编码,同时不能影响已经编好的其他数据。
按照现有的技术,音频编码的帧长是固定的,所以一旦音频数据重新组织后,必然会影响后面所有音频数据的组织方式。那么从修改的部分开始,直到电影结束,都需要重新编码,很浪费时间;而我们希望,仅重编修改过的部分。
发明内容
发明目的:本发明目的在于针对现有技术的不足,提供一种可变长度的全景声音频编解码方法,该方法在保证全景声电影能够完整、正确编解码的情况下,同时能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,从而在很大程度上对全景声音频编码技术进行了完善。
技术方案:本发明所述可变长度的全景声信号编码方法,包括如下步骤:
(1)计算所需编码全景声信号的音频样点数;
(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段。
上述编码方法输出码流的解码方法,包括如下步骤:
(1)每次读取一个音频帧对应采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段按如下规则进行解码:
一个音频帧对应j个采样点数,当读取第m个音频帧时,在j个样点之内的第n个样点位置,遇到了长度为k的音频帧,k≤1024,判断
(21)若n+k=1024,则输出第m帧音频数据;同时,若n>0,则在此之前先输出第m-1帧音频数据;
(22)若n+k>1024,此时输出第m-1帧,等待下次读取数据时解码第m帧;
(23)若n+k<1024,解码第m帧,并继续读取第m+1帧,令n=n+k,k=下一帧码流长度,然后重复步骤(21)、(22),直到n+k≥1024时,根据步骤(21)、(22)输出音频数据。
采用上述编解码方法能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,具体如下:
***操作的编码方法:(1)计算***点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(3)计算待***视频帧的音频样点数;
(4)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则***起点的前一个音频帧也一同重新组织;
(5)将步骤(4)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(6)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(7)将文件Data0拼接到步骤(6)输出的码流后面。
***操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
删除操作的编码方法:(1)计算删除开始点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算删除终点对应的样点数;
(4)计算删除终点对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则删除起点的前一个音频帧也一同重新组织;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
删除操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
替换操作的编码方法:(1)计算替换开始处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算替换终点处视频帧对应的音频样点数;
(4)计算替换终点处视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则替换起点的前一个音频帧也一同重新组织;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
替换操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
有益效果:本发明提供的编解码方法在保证全景声电影能够完整、正确编解码的情况下,同时能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,从而在很大程度上对全景声音频编码技术进行了完善。
附图说明
图1为待编码的音频数据;
图2为现有技术的编码方式;
图3为本发明的编码方式;
图4为本发明的解码方式;
图5为实施例2的编解码方式;
图6为实施例3的编解码方式;
图7为实施例4的编解码方式。
具体实施方式
下面通过附图对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
实施例1:将图1所示音频数据进行编码时编码时,若某一帧的长度是k个样点(k<1024,称为短帧),现有技术是统一输出1024个样点,编码时会多编(1024-k)个样点,其frame_length字段如图2所示。如图3所示,按本发明提供的方法进行编码,则只输出长度为k个样点的码流,并将这个音频帧的长度信息写在码流中的frame_length字段(还需乘以位深和AES通道数)。
解码时,每次读取1024个样点的码流数据,并相应地解出至少一帧的音频数据。在这1024个样点之内,若在第n个样点位置(比如对应第m个音频帧)遇到了长度为k的音频帧(k≤1024),则根据码流中的长度信息frame_length进行解码。任何一帧码流只有在完整时才能解出音频数据。
1.n+k=1024,则输出第m帧音频数据。另外,若n>0,则在此之前先输出第m-1帧音频数据。
2.n+k>1024,由于k不能超过1024,所以n一定大于0。
此时输出第m-1帧,并能读到第m帧的前k个样点,但这帧数据不完整,所以本次解码不输出第m帧,等下次解码再输出;
3.若n+k<1024,则可以完整解出第m帧,并继续读取下一帧,令n=n+k,k=下一帧码流长度,然后重复上述过程,直到n+k≥1024再根据1)2)来决定输出的音频数据。在重复过程中,只要n>0,就输出前一帧数据。
图4表示遇到短帧时的解码过程,包括每次解码读取的码流数据(中)和输出的音频数据(下)。
实施例2:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图5所示,在电影的第1000个视频帧处***200个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数
StartFrame=StartPos/1024=1953,再将第1953个音频帧之后的数据另存为一个文件Data0.pcm;
步骤3:计算需要***的音频样点数InsertSamples=200*48000/24=400,000;
步骤4:计算所有需要重新组织的音频样点数
DataToReenc=InsertSamples+1024=401,024;
步骤5:重新组织音频数据
401,024=391*1024+640,共包含391个音频整帧和一个长度为640的短帧;
步骤6:将前391个音频帧按标准方式编码,每个音频帧输出1024个样点;将最后640个样点按照短帧方式编码,并输出640个样点;
步骤7:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+391=2344帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据。
步骤2:第2344次解码,读取的数据是长度为640的短帧以及第2345帧的前1024-640=384个数据,此时可以解出前640个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据。
步骤3:第2345次解码,读取的数据是第2345帧的后640个数据和第2346帧的前384个数据,此时第2345帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的640个样点+后一帧的384个样点。
实施例3:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图6所示,在电影的第1000个视频帧处删除300个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数StartFrame=StartPos/1024=1953;
步骤3:计算删除终点对应的样点数EndPos=1300*48000/24=2,600,000;‘’步骤4:计算删除终点对应的音频帧数EndFrame=EndPos/1024=2539,将第2539个音频帧之后的数据另存为一个文件Data0.pcm;
步骤5:计算所有需要重新组织的音频样点数
DataToReenc = (EndFrame-StartFrame+1)*1024 - (EndPos-StartPos) =1088;
步骤6:重新组织音频数据
1088=1*1024+64,共包含1个音频整帧和一个长度为64的短帧;
步骤7:将第1个音频帧按标准方式编码,输出1024个样点;将最后64个样点按照短帧方式编码,并输出64个样点;
步骤8:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+1=1954帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据;
步骤2:第1954次解码,读取的数据是长度为64的短帧以及第1955帧的前1024-64=960个数据,此时可以解出前64个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据;
步骤3:第1955次解码,读取的数据是第1955帧的后64个数据和第1956帧的前960个数据,此时第1955帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的64个样点+后一帧的960个样点。
实施例4:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图7所示,在电影的第1000~1100个视频帧替换成200个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数StartFrame=StartPos/1024=1953;
步骤3:计算替换终点对应的样点数EndPos=1100*48000/24=2,200,000;
步骤4:计算替换终点对应的音频帧数EndFrame=EndPos/1024=2148,将第2148个音频帧之后的数据另存为一个文件Data0.pcm;
步骤5:计算所有需要重新组织的音频样点数
DataToReenc = (EndFrame-StartFrame+1)*1024 - (EndPos-StartPos) + 200*48000/24 = 400,704;
步骤6:重新组织音频数据
400,704=391*1024+320,共包含391个音频整帧和一个长度为320的短帧;
步骤7:将前391个音频帧按标准方式编码,每帧输出1024个样点;将最后320个样点按照短帧方式编码,并输出320个样点;
步骤8:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+391=2344帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据;
步骤2:第2344次解码,读取的数据是长度为320的短帧以及第2345帧的前1024-320=704个数据,此时可以解出前320个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据;
步骤3:第2345次解码,读取的数据是第2345帧的后320个数据和第2346帧的前704个数据,此时第2345帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的320个样点+后一帧的704个样点。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。
Claims (10)
1.一种可变长度的全景声信号编码方法,其特征在于,包括如下步骤:
(1)计算所需编码全景声信号的音频样点数;
(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在短帧对应样点数码流中的frame_length字段。
2.一种用于权利要求1编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段按如下规则进行解码:
一个音频帧对应j个采样点数,当读取第m个音频帧时,在j个样点之内的第n个样点位置,遇到了长度为k的音频帧,k≤1024,判断
(21)若n+k=1024,则输出第m帧音频数据;同时,若n>0,则在此之前先输出第m-1帧音频数据;
(22)若n+k>1024,此时输出第m-1帧,等待下次读取数据时解码第m帧;
(23)若n+k<1024,解码第m帧,并继续读取第m+1帧,令n=n+k,k=下一帧码流长度,然后重复步骤(21)、(22),直到n+k≥1024时,根据步骤(21)、(22)输出音频数据。
3.根据权利要求1所述全景声信号编码方法进行***视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算***点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(3)计算待***视频帧的音频样点数;
(4)计算所有需要重新组织的音频样点数,如果采用了前后帧在时域上有交叠的编码方法,则***起点的前一个音频帧也一同重新组织;
(5)将步骤(4)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(6)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(7)将文件Data0拼接到步骤(6)输出的码流后面。
4.一种用于权利要求3所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
5.根据权利要求1所述全景声信号编码方法进行删除视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算删除开始点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算删除终点对应的样点数;
(4)计算删除终点对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
6.一种用于权利要求5所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
7.根据权利要求1所述全景声信号编码方法进行替换视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算替换开始处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算替换终点处视频帧对应的音频样点数;
(4)计算替换终点处视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
8.一种用于权利要求7所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
9.根据权利要求3、5、7任一所述的编码方法,其特征在于:在计算所有需要重新组织的音频样点数时,如果采用了前后帧在时域上有交叠的编码方法,则在进行视频帧操作起点的前一个音频帧也一同重新组织。
10.根据权利要求9所述的编码方法,其特征在于:所述前后帧在时域上有交叠的编码方法为ac3、aac、avs2中任一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810334634.9A CN108550369B (zh) | 2018-04-14 | 2018-04-14 | 一种可变长度的全景声信号编解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810334634.9A CN108550369B (zh) | 2018-04-14 | 2018-04-14 | 一种可变长度的全景声信号编解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108550369A CN108550369A (zh) | 2018-09-18 |
CN108550369B true CN108550369B (zh) | 2020-08-11 |
Family
ID=63514842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810334634.9A Active CN108550369B (zh) | 2018-04-14 | 2018-04-14 | 一种可变长度的全景声信号编解码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108550369B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109243471B (zh) * | 2018-09-26 | 2022-09-23 | 杭州联汇科技股份有限公司 | 一种快速编码广播用数字音频的方法 |
CN111445914B (zh) * | 2020-03-23 | 2023-10-17 | 全景声科技南京有限公司 | 可拆解和再编辑音频信号的处理方法及装置 |
CN111669577A (zh) * | 2020-06-30 | 2020-09-15 | 广州市百果园信息技术有限公司 | 一种硬件解码检测方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1344106A (zh) * | 2000-09-15 | 2002-04-10 | 北京算通数字技术研究中心有限公司 | 基于mpeg-2码流的非线性编辑***编辑方法 |
CN1918629A (zh) * | 2003-09-29 | 2007-02-21 | 索尼电子有限公司 | 音频编码中的短窗分组方法 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN102332266A (zh) * | 2010-07-13 | 2012-01-25 | 炬力集成电路设计有限公司 | 一种音频数据的编码方法及装置 |
CN103119879A (zh) * | 2010-09-29 | 2013-05-22 | 高通股份有限公司 | 用于确定控制字段和调制编码方案信息的***、方法和装置 |
CN106030704A (zh) * | 2013-12-16 | 2016-10-12 | 三星电子株式会社 | 用于对音频信号进行编码/解码的方法和设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100481734C (zh) * | 2002-08-21 | 2009-04-22 | 广州广晟数码技术有限公司 | 用于从音频数据码流中解码重建多声道音频信号的解码器 |
KR101461685B1 (ko) * | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
CN101604524B (zh) * | 2008-06-11 | 2012-01-11 | 北京天籁传音数字技术有限公司 | 立体声编码方法及其装置、立体声解码方法及其装置 |
CN101582262B (zh) * | 2009-06-16 | 2011-12-28 | 武汉大学 | 一种空间音频参数帧间预测编解码方法 |
JP5267362B2 (ja) * | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
CN101673549B (zh) * | 2009-09-28 | 2011-12-14 | 武汉大学 | 一种移动音源空间音频参数预测编解码方法及*** |
CN103632671B (zh) * | 2013-06-28 | 2017-04-26 | 华为软件技术有限公司 | 数据编解码方法、装置及数据通信*** |
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN104240712B (zh) * | 2014-09-30 | 2018-02-02 | 武汉大学深圳研究院 | 一种三维音频多声道分组聚类编码方法及*** |
-
2018
- 2018-04-14 CN CN201810334634.9A patent/CN108550369B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1344106A (zh) * | 2000-09-15 | 2002-04-10 | 北京算通数字技术研究中心有限公司 | 基于mpeg-2码流的非线性编辑***编辑方法 |
CN1918629A (zh) * | 2003-09-29 | 2007-02-21 | 索尼电子有限公司 | 音频编码中的短窗分组方法 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN102332266A (zh) * | 2010-07-13 | 2012-01-25 | 炬力集成电路设计有限公司 | 一种音频数据的编码方法及装置 |
CN103119879A (zh) * | 2010-09-29 | 2013-05-22 | 高通股份有限公司 | 用于确定控制字段和调制编码方案信息的***、方法和装置 |
CN106030704A (zh) * | 2013-12-16 | 2016-10-12 | 三星电子株式会社 | 用于对音频信号进行编码/解码的方法和设备 |
Non-Patent Citations (1)
Title |
---|
On spatially varying acoustic impedance due to high sound;Chao Chen;《Journal of Sound and Vibration》;20200602;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108550369A (zh) | 2018-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7657428B2 (en) | System and method for seamless switching of compressed audio streams | |
US6108584A (en) | Multichannel digital audio decoding method and apparatus | |
CN108550369B (zh) | 一种可变长度的全景声信号编解码方法 | |
US9870799B1 (en) | System and method for processing ancillary data associated with a video stream | |
EP1472889B1 (en) | Audio coding | |
TW201303851A (zh) | 三維音訊聲軌之編碼與再生技術 | |
CN107112024B (zh) | 音频信号的编码和解码 | |
KR20090053723A (ko) | 미디어 스트림에 데이터를 임베딩하는 방법 및 장치 | |
US20080288263A1 (en) | Method and Apparatus for Encoding/Decoding | |
CN1163080C (zh) | 音频数据译码器 | |
KR102243395B1 (ko) | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 | |
EP1997319A1 (en) | System and method for processing content for later insertion of digital watermark and other data | |
WO2021190039A1 (zh) | 可拆解和再编辑音频信号的处理方法及装置 | |
CN106375778B (zh) | 一种符合数字电影规范的三维音频节目码流传输的方法 | |
KR101595136B1 (ko) | 디지털 영화환경에서의 바이브로 키네틱 신호의 전송방법 | |
CN109801639B (zh) | 一种符合ac-3格式的全景声信号的编解码方法 | |
CN101841716A (zh) | 视频信号处理设备和视频信号处理方法、视频信号编码设备和视频信号编码方法、及程序 | |
CN104796732A (zh) | 一种音视频编辑方法及装置 | |
KR101114431B1 (ko) | 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법 | |
JP7182751B1 (ja) | チャネルベースオーディオからオブジェクトベースオーディオへの変換のためのシステム、方法、及び機器 | |
US8355618B2 (en) | Image recording system, image recording apparatus, and image recording method | |
JP2006067367A (ja) | 符号化オーディオ信号の編集装置 | |
GB2614482A (en) | Seamless scalable decoding of channels, objects, and hoa audio content | |
US9786286B2 (en) | Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals | |
CN117082291A (zh) | 通话语音合成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220413 Address after: 101399 room 1001, building 1, No. 8, jinmayuan Third Street, Gaoliying Town, Shunyi District, Beijing Patentee after: Beijing panoramic sound information technology Co.,Ltd. Address before: No. 69, Shitou City, Gulou District, Nanjing, Jiangsu 210029 Patentee before: WAVARTS TECHNOLOGIES CO.,LTD. |