CN102568486B - 通过使用空间信息来处理多声道音频信号的设备和方法 - Google Patents
通过使用空间信息来处理多声道音频信号的设备和方法 Download PDFInfo
- Publication number
- CN102568486B CN102568486B CN201210008276.5A CN201210008276A CN102568486B CN 102568486 B CN102568486 B CN 102568486B CN 201210008276 A CN201210008276 A CN 201210008276A CN 102568486 B CN102568486 B CN 102568486B
- Authority
- CN
- China
- Prior art keywords
- signal
- channel audio
- audio signal
- side information
- stereophonic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000010365 information processing Effects 0.000 abstract description 6
- 238000011084 recovery Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 208000034657 Convalescence Diseases 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 1
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Abstract
一种使用空间信息处理多声道音频信号的设备和方法。该设备包括:主编码单元,通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码,并将编码的结果作为编码信号发送;和主解码单元,接收编码信号,使用接收的编码信号对立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合,并恢复多声道音频信号。
Description
本申请是向中国知识产权局提交的申请日为2005年11月22日、标题为“通过使用空间信息来处理多声道音频信号的设备和方法”、申请号为200510123902.5的申请的分案申请。
本申请要求于2004年12月1日在韩国知识产权局提交的第2004-099741号韩国专利申请的利益,该申请公开于此以资参考。
技术领域
本发明涉及使用运动图像专家组(MPEG)标准等来进行的信号处理,更具体地讲,涉及一种通过使用空间信息来处理多声道音频信号的设备和方法。
背景技术
在处理音频信号的传统方法和设备中,当恢复多声道音频信号时采用仅使用技术心理声学编码(binauralcuecoding,BCC)来恢复环绕(surround)分量的空间音频编码(SAC)。SAC公开于论文“低比特率的高质量参数空间音频编码(High-qualityParametricSpatialAudioCodingatLowBitrates)”,116thAESconvention,Preprint,p.6072,BCC公开于论文“应用于立体声和多声道音频压缩的技术心理声学编码(BinauralCueCodingAppliedtoStereoandMulti-ChannelAudiocompression)”,112thAESconvention,Preprint,p.5574。
在以上使用SAC的传统方法中,当立体声信号被下混合时,环绕分量消失。换句话说,下混合的立体声信号不包括环绕分量。因此,由于具有大量数据的边信息应该被发送以便当恢复多声道音频信号时恢复环绕分量,所以传统方法具有信道传输效率低的缺点。另外,由于消失的环绕分量被恢复,所以恢复的多声道音频信号的声音质量降低。
发明内容
本发明的一方面提供一种使用空间信息处理多声道音频信号的设备,该设备用于使用空间信息在多声道音频信号中包括的环绕分量的恢复期间对多声道音频信号编码,并对多声道音频信号解码。
本发明的一方面还提供一种使用空间信息处理多声道音频信号的方法,该方法使用空间信息在多声道音频信号中包括的环绕分量的恢复期间对多声道音频信号编码,并对多声道音频信号解码。
根据本发明的一方面,提供了一种使用空间信息处理多声道音频信号的设备和方法,该设备包括:主编码单元,通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的结果,并将编码的结果作为编码信号发送;和主解码单元,接收编码信号,使用接收的编码信号对立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合,并恢复多声道音频信号。
根据本发明的另一方面,提供了一种在用于处理多声道音频信号的设备中执行的使用空间信息来处理多声道音频信号的方法,该设备具有对多声道音频信号编码的主编码单元和对多声道音频信号解码的主解码单元,该方法包括:通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的结果,并将编码的结果作为编码信号发送给主解码单元;和接收从主编码单元发送的编码信号,使用接收的编码信号对立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合,并恢复多声道音频信号。
根据本发明的另一方面,提供了一种增加压缩效率的方法,包括:通过将空间信息应用于环绕分量来将包括环绕分量的多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的结果,并发送编码的结果;和接收编码结果,对接收的编码信号的立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合以便恢复多声道音频信号。
根据本发明的另一方面,提供了一种多声道音频信号处理***,包括:编码单元,通过将空间信息应用于环绕分量来将包括环绕分量的多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的信号;和解码单元,接收编码的信号,对接收的编码的信号解码以获得立体声信号和边信息,使用解码的边信息将解码的立体声信号上混合以产生环绕分量。
在下面的描述中将部分地阐明本发明另外的方面和/或优点,通过描述,其会变得更加清楚,或者通过实施本发明可以了解。
附图说明
通过下面结合附图进行的详细描述,本发明的这些和/或其他方面和优点将会变得清楚和更易于理解,其中:
图1是根据本发明实施例的用于处理多声道音频信号的设备的方框图;
图2是示出根据本发明实施例的用于处理多声道音频信号的方法的流程图;
图3是图1中示出的主编码单元的例子的方框图;
图4是示出图2中示出的操作20的例子的流程图;
图5表示可由本发明实施例处理的多声道音频信号;
图6是图3中示出的下混合器的例子的方框图;
图7是图1中示出的主解码单元的例子的方框图;
图8是图2中示出的操作22的例子的流程图;
图9是图7中示出的上混合器的例子的方框图;
图10是图3中示出的边信息产生器的例子的方框图;
图11是图9中示出的运算单元的例子的方框图;和
图12是图9中示出的运算单元的另一例子的方框图。
具体实施方式
现在对本发明实施例进行详细的描述,其示例表示在附图中,其中,相同的标号始终表示相同部件。下面通过参照附图对实施例进行描述以解释本发明。
图1是根据本发明实施例的用于处理多声道音频信号的设备的方框图。图1的设备包括主编码单元10和主解码单元12。
图2是示出根据本发明实施例的用于处理多声道音频信号的方法的流程图。图2的方法包括对多声道音频信号编码(操作20)和对编码的多声道音频信号解码(操作22)。
参照图1和图2,在操作20中,图1的主编码单元10通过将空间信息应用于通过输入端IN1输入的多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用立体声信号或多声道音频信号来产生边信息,对所述立体声信号和边信息编码,并将编码的结果作为编码信号发送给主解码单元12。所述立体声信号指的是将多声道音频信号下混合的结果。空间信息公开于“头部相关传输函数(HRTF)介绍(IntroductiontoHead-RelatedTransferFunctions(HRTF))”,RepresentationsofHRTFinTime,Frequency,andSpace,107thAESconvention,Preprint,p.50。
在操作20之后,在操作22中,主解码单元12接收从主编码单元10发送的编码信号,使用接收的编码信号对立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合,恢复多声道音频信号,并通过输出端OUT1输出恢复的多声道音频信号。
以下,将参照附图来描述用于处理多声道音频信号的设备的各种示例性构造和用于处理多声道音频信号的方法各种示例性操作。
图3是图1中示出的主编码单元10的例子10A的方框图。主编码单元10A包括下混合器30、子编码器32、边信息产生器34、边信息编码器36和位打包单元38。
图4是示出图2中示出的操作20的例子20A的流程图。操作20A包括使用空间信息将多声道音频信号下混合(操作50),对立体声信号编码,产生边信息,对边信息编码(各自为操作52、54、和56),并将编码的结果进行位打包(操作58)。
参照图3和图4,在操作50中,图3的下混合器30通过将空间信息应用于通过输入端IN2输入的多声道音频信号中包括的环绕分量来将多声道音频信号下混合,如方程1中所示,并将下混合的结果作为立体声信号输出给子编码器32。
其中,Lm和Rm分别是作为下混合的结果而获得的立体声信号的左分量和右分量,W可作为加权值而被预先确定和改变,Fi0和Fi1是通过输入端IN2输入的多声道音频信号中所包括的分量之中的非环绕分量,Sj0和Sj1是多声道音频信号中所包括的分量之中的环绕分量,Nf是非环绕分量中包括的声道的数量,Ns是环绕分量中包括的声道的数量,Fi0和Si0中的‘0’是左(L)[或右(R)]分量,Fi1和Si1中的‘1’是右(R)[或左(L)]分量,Hj是指示空间信息的空间滤波器的传递函数。
图5表示多声道音频信号。非环绕分量60、62和64以及环绕分量66和68包括在该多声道音频信号中。这里,标号69表示听者。
如在图5中所示,假设:多声道音频信号的非环绕分量60、62和64由包括左(L)声道60、右(R)声道64和中央(C)声道62的前分量组成,并且多声道音频信号中所包括的环绕分量由右环绕(RS)声道66和左环绕(LS)声道68组成。在这种情况下,方程1可简化为如方程2所示。
其中,是多声道音频信号中所包括的非环绕分量60、62和64,是多声道音频信号中所包括的环绕分量66和68,是空间信息Hj。
图6是图3中示出的下混合器30的例子30A的方框图。下混合器30A包括第一乘法器70和第二乘法器72以及合成器74。
参照图3、4和6,下混合器30A的第一乘法器70将通过输入端IN3输入的加权值与通过输入端IN4输入的多声道音频信号中所包括的非环绕分量相乘,并将相乘的结果输出给合成器74。在这种情况下,第二乘法器72将通过输入端IN4输入的多声道音频信号中所包括的环绕分量与空间信息相乘,并将相乘的结果输出给合成器74。合成器74合成由第一乘法器70和第二乘法器72乘出的结果,并通过输出端IN3将合成的结果作为立体声信号输出。
在操作50之后,在操作52中,子编码器32对从下混合器30输入的立体声信号编码,并将编码的立体声信号输出给位打包单元38。例如,子编码器32能够以MP3[或MPEG-1层3或MPEG-2层3]、MPEG4-高级音频编码(AAC)或MPEG4-比特分片算术编码(BSAC)格式将立体声信号编码。
在操作52之后,在操作54中,边信息产生器34使用从下混合器30输入的立体声信号或通过输入端IN2输入的多声道音频信号来从自位打包单元38输入的编码信号产生边信息,并将产生的边信息输出给边信息编码器36。稍后将详细描述边信息产生器34的实施例和在边信息产生器34中执行的边信息的产生。
在操作54之后,在操作56中,边信息编码器36对由边信息产生器34产生的边信息编码,并将编码的边信息输出给位打包单元38。为此,边信息编码器36能够量化由边信息产生器34产生的边信息,压缩量化的结果,并将压缩的结果作为编码的边信息输出给位打包单元38。
另一方面,与图4中不同,可当执行操作54和56时同时执行操作52,或者可在执行操作54和56之后执行操作52。
在操作58中,位打包单元38将由边信息编码器36编码的边信息和由子编码器32编码的立体声信号进行位打包,通过输出端OUT2将位打包的结果作为编码信号发送给主解码器12,并将位打包的结果输出给边信息产生器34。例如,位打包单元38顺序地重复执行下述操作:存储编码的边信息和编码的立体声信号,输出存储的编码的边信息;然后输出编码的立体声信号。换句话说,位打包单元38将编码的边信息与编码的立体声信号复用,并将复用的结果作为编码信号输出。
图7是图1中示出的主解码单元12的例子12A的方框图。主解码单元12A包括位解包单元90、子解码器92、边信息解码器94和上混合器96。
图8是示出图2中示出的操作22的例子22A的流程图。操作22A包括:对编码信号进行位解包(操作110)以及对位解包的立体声信号和位解包的边信息解码和使用边信息来将立体声信号上混合(各自为操作112和114)。
参照图3、7和8,在操作110中,图7的位解包单元90通过输入端IN5输入具有从主编码单元10发送的比特流形式的编码信号,接收该编码信号,对接收的编码信号进行位解包,将位解包的边信息输出给边信息解码器94,并将位解包的立体声信号输出给子解码器92。换句话说,位解包单元90对由图3的位打包单元38位打包的结果进行位解包。
在操作110之后,在操作112中,子解码器92对位解包的立体声信号解码并将解码的结果输出给上混合器96,边信息解码器94对位解包的边信息解码并将解码的结果输出给上混合器96。如上所述,当边信息编码器36量化边信息并压缩量化的结果时,边信息解码器94恢复边信息,将恢复的结果逆量化,并将逆量化的结果作为解码的边信息输出给上混合器96。
在操作112之后,在操作114中,上混合器96使用由边信息解码器94解码的边信息来混合由子解码器92解码的立体声信号,并通过输出端OUT4将上混合的结果作为恢复的多声道音频信号输出。
图9是图7中示出的上混合器96的例子96A的方框图。上混合器96A包括第三乘法器130和第四乘法器134、非环绕分量恢复单元132以及运算单元136。
参照图3、7和9,图9的第三乘法器130将通过输入端IN6从子解码器92输入的解码的立体声信号与逆空间信息G相乘,并将相乘的结果输出给运算单元136。这里,所述逆空间信息G是如方程3中所示的空间信息的逆矩阵,并且可根据再现由主解码单元12恢复的多声道音频信号的环绕而改变或者预先确定。
G=H-1(3)
非环绕分量恢复单元132从通过输入端IN6自子解码器92输入的解码的立体声信号产生非环绕分量,并将产生的非环绕分量输出给第四乘法器134。例如,当图3的下混合器30如方程2中所示将多声道音频信号下混合时,非环绕分量恢复单元132能够使用方程4来产生非环绕分量。
L′=L′m
R′=R′m
其中,L′是由非环绕分量恢复单元132产生的非环绕分量之中的左(声道)分量;R′是由非环绕分量恢复单元132产生的非环绕分量之中的右(声道)分量;C′是由非环绕分量恢复单元132产生的非环绕分量之中的中央(声道)分量;Lm′是由图7的子解码器92解码的立体声信号中所包括的左(声道)分量;Rm′是所述立体声信号中所包括的右(声道)分量。
第四乘法器134将从非环绕分量恢复单元132输入的非环绕分量与逆空间信息G和加权值W相乘,并将相乘的结果输出给操作单元136。这里,图9的上混合器96A可不包括非环绕分量恢复单元132。在这种情况下,来自解码的立体声信号的不包括环绕分量的非环绕分量通过输入端IN7从外部直接输入至上混合器96A的第四乘法器134。
操作单元136使用第三乘法器130和第四乘法器134乘出的结果以及通过输入端IN8从边信息解码器94输入的解码的边信息来恢复多声道音频信号,并通过输出端OUT4输出恢复的多声道音频信号。
图10是图3中示出的边信息产生器34的例子34A的方框图。边信息产生器34A包括环绕分量恢复单元150和比率产生器152。
环绕分量恢复单元150从通过输入端IN9自位打包单元38输入的编码信号恢复环绕分量,并将恢复的环绕分量输出给比率产生器152。
为此,例如,如图10中所示,环绕分量恢复单元150被显示为可选地包括位解包单元160、子解码器162、边信息解码器164、和上混合器166。这里,位解包单元160、子解码器162、边信息解码器164和上混合器166执行与图7的位解包单元90、子解码器92、边信息解码器94和上混合器96相同的功能,因此,将省略对其的详细描述。
根据本发明的实施例,比率产生器152产生从环绕分量恢复单元150输出的恢复的环绕分量与通过输入端IN10输入的多声道音频信号的比率,并通过输出端OUT5将产生的比率作为边信息输出给边信息解码器36。例如,当图3中示出的下混合器30如先前描述的方程2中所示将多声道音频信号下混合时,比率产生器152可使用方程5来产生边信息。
其中,SI是由比率产生器152产生的边信息,LS′是由环绕分量恢复单元150恢复的,例如从上混合器166输出的,多声道音频信号中所包括的环绕分量之中的左分量,RS′是从上混合器166输出的恢复的多声道音频信号中所包括的环绕分量之中的右分量。
如方程5中所示由比率产生器152产生的边信息的比率可以是功率比或者是功率比和相位比二者。例如,比率产生器152可使用方程6或7来产生边信息。
其中,|LS′|是LS′的功率,|LS|是LS的功率,|RS′|是RS′的功率,|RS|是RS的功率。
其中,∠LS′是LS′的相位,∠LS是LS的相位,∠RS′是RS′的相位,∠RS是RS的相位。
另一方面,比率产生器152产生从环绕分量恢复单元150输出的恢复的环绕分量与通过输入端IN10从下混合器30输入的立体声信号的比率,并通过输出端OUT5将产生的比率作为边信息输出给边信息解码器36。例如,当图3中示出的下混合器30如方程2中所示将多声道音频信号下混合时,比率产生器152可使用方程8来产生边信息。
如方程8中所示由比率产生器152产生的边信息的比率可以是功率比或者是功率比和相位比二者。例如,比率产生器152可如方程9或10所示来产生边信息。
其中,|Lm|是Lm的功率,|Rm|是Rm的功率。
其中,∠Lm是Lm的相位,∠Rm是Rm的相位。
如上所述,当比率产生器152如方程10中所示通过使用恢复的环绕分量和多声道音频信号的比率来产生边信息时,现在将描述图9的运算单元136的结构和操作。
图11是图9中示出的运算单元136的例子136A的方框图。运算单元136A包括第一减法器170和第五乘法器172。
参照图3和图9-11,第一减法器170将通过输入端IN11输入的由图9的第三乘法器130乘出的结果减去通过输入端IN12输入的由第四乘法器134乘出的结果,并将相减的结果输出给第五乘法器172。在这种情况下,第五乘法器172将从第一减法器170输入的相减的结果乘以通过输入端IN13输入的由边信息解码器94解码的边信息,并通过输出端OUT6将相乘的结果作为恢复的多声道音频信号输出。
例如,当图3的下混合器30如方程2所示将多声道音频信号下混合时,从第五乘法器172输出的恢复的多声道音频信号的环绕分量可表示为方程11。
其中,是从第五乘法器172输出的恢复的多声道音频信号的环绕分量,SI′是解码的边信息,是从第一减法器170输出的相减的结果并且可表示为方程12。
其中,是通过输入端IN6从子解码器92输入至第三乘法器130的解码的立体声信号。
当图10的比率产生器152通过使用恢复的环绕分量和从下混合器30输入的立体声信号的比率来产生边信息时,现在将描述图9的运算单元136的结构和操作。
图12是图9中示出的运算单元136的例子136B的方框图。运算单元136B包括第六乘法器190和第二减法器192。
参照图3、9、10和12,第六乘法器190将通过输入端IN14输入的由第三乘法器130乘出的结果乘以通过输入端IN15输入的由边信息解码器94解码的边信息,并将相乘的结果输出给第二减法器192。第二减法器192将由第六乘法器190乘出的结果减去通过输入端IN16输入的由第四乘法器134乘出的结果,并通过输出端OUT7将相减的结果作为恢复的多声道音频信号输出。
例如,当图3的下混合器30如方程2所示将多声道音频信号下混合时,恢复的多声道音频信号的环绕分量,即从第二减法器192输出的相减结果可表示为方程13。
其中,是从第二减法器192输出的恢复的多声道音频信号的环绕分量,是由第六乘法器190乘出的结果,是由第四乘法器134乘出的结果,与方程12中的相同。
在根据本发明上述实施例的使用空间信息处理多声道音频信号的设备和方法中,在使用恢复的立体声信号恢复非环绕分量之后,使用恢复的非环绕分量恢复环绕分量。因此,当恢复多声道音频信号时,可防止在一起恢复环绕分量和非环绕分量时发生串扰。
在根据本发明上述实施例的使用空间信息处理多声道音频信号的设备和方法中,由于空间信息包括在下混合的立体声信号中并且边信息基于用户的感知特性,例如使用功率比和相位比,而被产生,所以仅使用少量边信息就能够将多声道音频信号上混合,从主编码单元10向主解码单元12发送的边信息的数据量能够减少,信道的压缩效率,即传输效率,能够被最大化,由于与传统的空间音频编码(SAC)不同,环绕分量包括在立体声信号中,所以通过恢复的多声道音频信号仅使用立体声扬声器就能够获得多声道效果,从而提供真实的音质,传统的技术心理声学编码(BCC)可被取代,由于音频信号通过使用在考虑到多声道音频***中扬声器的位置的情况下有效表达的逆空间信息来被解码,所以可提供最优音质并可防止发生串扰。
虽然已表示和描述了本发明的一些实施例,但本发明并不限于所描述的实施例。相反,本领域技术人员应该理解,在不脱离由权利要求及其等同物限定其范围的本发明的原理和精神的情况下,可以对这些实施例进行修改。
Claims (4)
1.一种从下混合的立体声信号产生多声道音频信号的方法,所述方法包括:
接收包括下混合的立体声信号和与空间信息对应的边信息的比特流,其中,空间信息包括声道间的电平差;
通过将逆头部相关传输函数(HRTF)和接收的边信息应用到接收的下混合的立体声信号来获得信号,并基于接收的边信息对获得的信号进行上混合,以产生多声道音频信号。
2.一种使用空间信息产生多声道音频信号的方法,包括:
接收包括下混合的立体声信号和与空间信息对应的边信息的比特流;
通过将逆头部相关传输函数(HRTF)和接收的边信息应用到接收的下混合的立体声信号来获得信号,并基于接收的边信息对获得的信号进行上混合,以产生多声道音频信号。
3.一种使用空间信息产生多声道音频信号的设备,包括:
子解码器,从包括在比特流中的下混合的信号中解码立体声信号;
边信息解码器,从比特流中解码与空间信息对应的边信息;
上混合器,通过将逆头部相关传输函数(HRTF)和接收的边信息应用到接收的下混合的立体声信号来获得信号,并基于接收的边信息对获得的信号进行上混合,以产生多声道音频信号。
4.如权利要求3所述的设备,还包括:
位解包单元,对比特流进行位解包以输出立体声信号和边信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040099741A KR100682904B1 (ko) | 2004-12-01 | 2004-12-01 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
KR10-2004-0099741 | 2004-12-01 | ||
CN2005101239025A CN1783728B (zh) | 2004-12-01 | 2005-11-22 | 通过使用空间信息来处理多声道音频信号的方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005101239025A Division CN1783728B (zh) | 2004-12-01 | 2005-11-22 | 通过使用空间信息来处理多声道音频信号的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102568486A CN102568486A (zh) | 2012-07-11 |
CN102568486B true CN102568486B (zh) | 2016-01-13 |
Family
ID=35788801
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210014602.3A Active CN102568487B (zh) | 2004-12-01 | 2005-11-22 | 通过使用空间信息来处理多声道音频信号的设备和方法 |
CN2005101239025A Active CN1783728B (zh) | 2004-12-01 | 2005-11-22 | 通过使用空间信息来处理多声道音频信号的方法 |
CN201210008276.5A Active CN102568486B (zh) | 2004-12-01 | 2005-11-22 | 通过使用空间信息来处理多声道音频信号的设备和方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210014602.3A Active CN102568487B (zh) | 2004-12-01 | 2005-11-22 | 通过使用空间信息来处理多声道音频信号的设备和方法 |
CN2005101239025A Active CN1783728B (zh) | 2004-12-01 | 2005-11-22 | 通过使用空间信息来处理多声道音频信号的方法 |
Country Status (5)
Country | Link |
---|---|
US (4) | US7961889B2 (zh) |
EP (2) | EP1667111A1 (zh) |
JP (3) | JP4921781B2 (zh) |
KR (1) | KR100682904B1 (zh) |
CN (3) | CN102568487B (zh) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7706905B2 (en) * | 2005-07-29 | 2010-04-27 | Lg Electronics Inc. | Method for processing audio signal |
EP1920437A4 (en) * | 2005-07-29 | 2010-01-06 | Lg Electronics Inc | METHOD FOR SIGNALING CUTTING INFORMATION |
WO2007027056A1 (en) * | 2005-08-30 | 2007-03-08 | Lg Electronics Inc. | A method for decoding an audio signal |
JP5108772B2 (ja) * | 2005-09-14 | 2012-12-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
DE602006016017D1 (de) * | 2006-01-09 | 2010-09-16 | Nokia Corp | Steuerung der dekodierung binauraler audiosignale |
BRPI0707136A2 (pt) * | 2006-01-19 | 2011-04-19 | Lg Electronics Inc | método e aparelho para processamento de um sinal de mìdia |
JP2009526263A (ja) * | 2006-02-07 | 2009-07-16 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
BRPI0707969B1 (pt) | 2006-02-21 | 2020-01-21 | Koninklijke Philips Electonics N V | codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador |
EP1853092B1 (en) | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
US8027479B2 (en) | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
CN101479787B (zh) * | 2006-09-29 | 2012-12-26 | Lg电子株式会社 | 用于编码和解码基于对象的音频信号的方法和装置 |
KR20090013178A (ko) | 2006-09-29 | 2009-02-04 | 엘지전자 주식회사 | 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치 |
CN101529898B (zh) * | 2006-10-12 | 2014-09-17 | Lg电子株式会社 | 用于处理混合信号的装置及其方法 |
JP5023662B2 (ja) * | 2006-11-06 | 2012-09-12 | ソニー株式会社 | 信号処理システム、信号送信装置、信号受信装置およびプログラム |
WO2008060111A1 (en) | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
EP2102857B1 (en) | 2006-12-07 | 2018-07-18 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
CN101632117A (zh) | 2006-12-07 | 2010-01-20 | Lg电子株式会社 | 用于解码音频信号的方法和装置 |
EP2595149A3 (en) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Apparatus for transcoding downmix signals |
TR201906713T4 (tr) * | 2007-01-10 | 2019-05-21 | Koninklijke Philips Nv | Audio kod çözücü. |
EP2111618A4 (en) * | 2007-02-13 | 2010-04-21 | Lg Electronics Inc | METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL |
CN103299363B (zh) * | 2007-06-08 | 2015-07-08 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
CN101578655B (zh) * | 2007-10-16 | 2013-06-05 | 松下电器产业株式会社 | 流合成装置、解码装置、方法 |
KR101290394B1 (ko) * | 2007-10-17 | 2013-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다운믹스를 이용한 오디오 코딩 |
US20100228554A1 (en) * | 2007-10-22 | 2010-09-09 | Electronics And Telecommunications Research Institute | Multi-object audio encoding and decoding method and apparatus thereof |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
KR100971700B1 (ko) | 2007-11-07 | 2010-07-22 | 한국전자통신연구원 | 공간큐 기반의 바이노럴 스테레오 합성 장치 및 그 방법과,그를 이용한 바이노럴 스테레오 복호화 장치 |
US8548615B2 (en) * | 2007-11-27 | 2013-10-01 | Nokia Corporation | Encoder |
KR101227932B1 (ko) * | 2011-01-14 | 2013-01-30 | 전자부품연구원 | 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법 |
CN103733256A (zh) * | 2011-06-07 | 2014-04-16 | 三星电子株式会社 | 音频信号处理方法、音频编码设备、音频解码设备和采用所述方法的终端 |
KR20130093798A (ko) * | 2012-01-02 | 2013-08-23 | 한국전자통신연구원 | 다채널 신호 부호화 및 복호화 장치 및 방법 |
WO2013106322A1 (en) * | 2012-01-11 | 2013-07-18 | Dolby Laboratories Licensing Corporation | Simultaneous broadcaster -mixed and receiver -mixed supplementary audio services |
KR102131810B1 (ko) | 2012-07-19 | 2020-07-08 | 돌비 인터네셔널 에이비 | 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스 |
EP2717261A1 (en) | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding |
CN117037810A (zh) | 2013-09-12 | 2023-11-10 | 杜比国际公司 | 多声道音频内容的编码 |
CN103700372B (zh) * | 2013-12-30 | 2016-10-05 | 北京大学 | 一种基于正交解相关技术的参数立体声编码、解码方法 |
US10163446B2 (en) * | 2014-10-01 | 2018-12-25 | Dolby International Ab | Audio encoder and decoder |
EP3067885A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
CN105405445B (zh) * | 2015-12-10 | 2019-03-22 | 北京大学 | 一种基于声道间传递函数的参数立体声编码、解码方法 |
EP3182406B1 (en) * | 2015-12-16 | 2020-04-01 | Harman Becker Automotive Systems GmbH | Sound reproduction with active noise control in a helmet |
CN106774930A (zh) * | 2016-12-30 | 2017-05-31 | 中兴通讯股份有限公司 | 一种数据处理方法、装置及采集设备 |
WO2022164229A1 (ko) * | 2021-01-27 | 2022-08-04 | 삼성전자 주식회사 | 오디오 처리 장치 및 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6463414B1 (en) * | 1999-04-12 | 2002-10-08 | Conexant Systems, Inc. | Conference bridge processing of speech in a packet network environment |
CN1424713A (zh) * | 2003-01-14 | 2003-06-18 | 北京阜国数字技术有限公司 | 高频耦合的伪小波5声道音频编/解码方法 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5046098A (en) * | 1985-03-07 | 1991-09-03 | Dolby Laboratories Licensing Corporation | Variable matrix decoder with three output channels |
US4799260A (en) * | 1985-03-07 | 1989-01-17 | Dolby Laboratories Licensing Corporation | Variable matrix decoder |
JPH0479599A (ja) * | 1990-07-19 | 1992-03-12 | Victor Co Of Japan Ltd | 定位可変音響信号記録再生装置 |
JPH04137900A (ja) * | 1990-09-27 | 1992-05-12 | Pioneer Electron Corp | 信号処理装置及び音響再生装置 |
US5291557A (en) * | 1992-10-13 | 1994-03-01 | Dolby Laboratories Licensing Corporation | Adaptive rematrixing of matrixed audio signals |
EP0631458B1 (en) | 1993-06-22 | 2001-11-07 | Deutsche Thomson-Brandt Gmbh | Method for obtaining a multi-channel decoder matrix |
US5771295A (en) | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
US5970152A (en) | 1996-04-30 | 1999-10-19 | Srs Labs, Inc. | Audio enhancement system for use in a surround sound environment |
US6697491B1 (en) | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
KR100206333B1 (ko) | 1996-10-08 | 1999-07-01 | 윤종용 | 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법 |
KR20010030608A (ko) * | 1997-09-16 | 2001-04-16 | 레이크 테크놀로지 리미티드 | 청취자 주변의 음원의 공간화를 향상시키기 위한 스테레오헤드폰 디바이스에서의 필터링 효과의 이용 |
KR100915120B1 (ko) * | 1999-04-07 | 2009-09-03 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법 |
FI113147B (fi) * | 2000-09-29 | 2004-02-27 | Nokia Corp | Menetelmä ja signaalinkäsittelylaite stereosignaalien muuntamiseksi kuulokekuuntelua varten |
JP2002291100A (ja) * | 2001-03-27 | 2002-10-04 | Victor Co Of Japan Ltd | オーディオ信号再生方法、及びパッケージメディア |
US6996239B2 (en) * | 2001-05-03 | 2006-02-07 | Harman International Industries, Inc. | System for transitioning from stereo to simulated surround sound |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US6990210B2 (en) * | 2001-11-28 | 2006-01-24 | C-Media Electronics, Inc. | System for headphone-like rear channel speaker and the method of the same |
DE60306512T2 (de) * | 2002-04-22 | 2007-06-21 | Koninklijke Philips Electronics N.V. | Parametrische beschreibung von mehrkanal-audio |
ES2300567T3 (es) | 2002-04-22 | 2008-06-16 | Koninklijke Philips Electronics N.V. | Representacion parametrica de audio espacial. |
CA2473343C (en) * | 2002-05-03 | 2012-03-27 | Harman International Industries, Incorporated | Multichannel downmixing device |
WO2004008806A1 (en) | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
US7181019B2 (en) * | 2003-02-11 | 2007-02-20 | Koninklijke Philips Electronics N. V. | Audio coding |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
KR101283525B1 (ko) * | 2004-07-14 | 2013-07-15 | 돌비 인터네셔널 에이비 | 오디오 채널 변환 |
WO2006060279A1 (en) * | 2004-11-30 | 2006-06-08 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
-
2004
- 2004-12-01 KR KR1020040099741A patent/KR100682904B1/ko active IP Right Grant
-
2005
- 2005-08-25 US US11/210,908 patent/US7961889B2/en active Active
- 2005-11-22 CN CN201210014602.3A patent/CN102568487B/zh active Active
- 2005-11-22 CN CN2005101239025A patent/CN1783728B/zh active Active
- 2005-11-22 CN CN201210008276.5A patent/CN102568486B/zh active Active
- 2005-11-25 EP EP05257268A patent/EP1667111A1/en not_active Ceased
- 2005-11-25 EP EP15163384.9A patent/EP2911151A1/en not_active Ceased
- 2005-12-01 JP JP2005348003A patent/JP4921781B2/ja active Active
-
2011
- 2011-05-23 US US13/113,826 patent/US8824690B2/en active Active
- 2011-11-30 JP JP2011262993A patent/JP5643180B2/ja active Active
-
2013
- 2013-08-12 JP JP2013167924A patent/JP6039516B2/ja active Active
-
2014
- 2014-09-01 US US14/474,222 patent/US9232334B2/en active Active
-
2015
- 2015-12-11 US US14/965,994 patent/US9552820B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6463414B1 (en) * | 1999-04-12 | 2002-10-08 | Conexant Systems, Inc. | Conference bridge processing of speech in a packet network environment |
CN1424713A (zh) * | 2003-01-14 | 2003-06-18 | 北京阜国数字技术有限公司 | 高频耦合的伪小波5声道音频编/解码方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1783728A (zh) | 2006-06-07 |
US20110224993A1 (en) | 2011-09-15 |
CN102568487B (zh) | 2014-09-17 |
CN102568487A (zh) | 2012-07-11 |
JP2012070428A (ja) | 2012-04-05 |
KR100682904B1 (ko) | 2007-02-15 |
JP6039516B2 (ja) | 2016-12-07 |
EP1667111A1 (en) | 2006-06-07 |
KR20060060927A (ko) | 2006-06-07 |
CN102568486A (zh) | 2012-07-11 |
JP2006166447A (ja) | 2006-06-22 |
US9552820B2 (en) | 2017-01-24 |
US20060116886A1 (en) | 2006-06-01 |
JP4921781B2 (ja) | 2012-04-25 |
US20160099002A1 (en) | 2016-04-07 |
CN1783728B (zh) | 2012-03-21 |
US8824690B2 (en) | 2014-09-02 |
US20150131799A1 (en) | 2015-05-14 |
US9232334B2 (en) | 2016-01-05 |
JP5643180B2 (ja) | 2014-12-17 |
US7961889B2 (en) | 2011-06-14 |
JP2013251919A (ja) | 2013-12-12 |
EP2911151A1 (en) | 2015-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102568486B (zh) | 通过使用空间信息来处理多声道音频信号的设备和方法 | |
CN1973320B (zh) | 立体声编码和解码的方法及其设备 | |
US7751572B2 (en) | Adaptive residual audio coding | |
JP5123303B2 (ja) | 不可逆的符号化データ・ストリームと可逆的伸張データ・ストリームを用いて原信号を可逆的に符号化する方法及び装置 | |
US5701346A (en) | Method of coding a plurality of audio signals | |
CN101401151B (zh) | 根据主分量分析的可分级多通道音频编码的设备和方法 | |
CN101578654B (zh) | 用于恢复多通道音频信号的设备和方法 | |
CN102595303A (zh) | 代码转换设备和方法以及用于解码多对象音频信号的方法 | |
RU2007139918A (ru) | Кодирование многоканального аудио | |
CN101432610A (zh) | 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备 | |
CN102842337A (zh) | 基于wifi的高保真音频传输方法 | |
WO2006035810A1 (ja) | スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法 | |
CN101604983A (zh) | 编解码装置、***及其方法 | |
JP2904427B2 (ja) | 欠落音声補間装置 | |
Nishiguchi | MPEG-4 speech coding | |
CN102812511A (zh) | 优化的参数立体声解码 | |
Gbur et al. | Realtime implementation of an ISO/MPEG layer 3 encoder on Pentium PCs | |
JPH0922299A (ja) | 音声符号化通信方式 | |
AU2002215972A1 (en) | Speech codec and method for generating a vector codebook and encoding/decoding speech signals | |
JPH05218980A (ja) | 音声符号化通信方式及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |