CN105531928B - 音频编解码器的***方面 - Google Patents

音频编解码器的***方面 Download PDF

Info

Publication number
CN105531928B
CN105531928B CN201480050229.4A CN201480050229A CN105531928B CN 105531928 B CN105531928 B CN 105531928B CN 201480050229 A CN201480050229 A CN 201480050229A CN 105531928 B CN105531928 B CN 105531928B
Authority
CN
China
Prior art keywords
bit stream
frame
sequence
stream frame
phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480050229.4A
Other languages
English (en)
Other versions
CN105531928A (zh
Inventor
A·格罗舍尔
J·波普
M·沃尔特斯
J·瑞德米勒
M·沃德
K·J·罗德恩
H·霍伊里奇
K·林泽梅儿
T·弗瑞尔德里驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Dolby Laboratories Licensing Corp
Original Assignee
Dolby International AB
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Dolby Laboratories Licensing Corp filed Critical Dolby International AB
Publication of CN105531928A publication Critical patent/CN105531928A/zh
Application granted granted Critical
Publication of CN105531928B publication Critical patent/CN105531928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0273Polyphase filters
    • H03H17/0275Polyphase filters comprising non-recursive filters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0273Polyphase filters
    • H03H17/0277Polyphase filters comprising recursive filters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/04Recursive filters
    • H03H17/0416Recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing
    • H03H17/0427Recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing characterized by the ratio between the input-sampling and output-delivery frequencies
    • H03H17/0455Recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing characterized by the ratio between the input-sampling and output-delivery frequencies the ratio being rational
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Image Processing (AREA)

Abstract

本文件涉及用于使用有理重采样因子的重采样器的抗混淆和/或抗成像滤波器的设计。特别地,本文件涉及用于以降低的计算复杂性实现这种抗混淆和/或抗成像滤波器的方法。另外,本文件涉及音频编码和解码***的其它方面,诸如多通道音频信号的通道之间的相位关系和/或编码音频信号的位流的结构。

Description

音频编解码器的***方面
相关申请的交叉引用
本申请要求在2013年9月12提交的美国临时专利申请No.61/877155和在2014年4月29提交的美国临时专利申请No.61/985879,通过引用将它们的全部内容加入这里。
技术领域
本文件涉及用于使用有理(rational)重采样因子的重采样器的抗混淆和/或抗成像滤波器的设计。特别地,本文件涉及用于以降低的计算复杂性实现这种抗混淆和/或抗成像滤波器的方法。另外,本文件涉及音频编码和解码***的其它方面,诸如多通道音频信号的通道之间的相位关系和/或编码的音频信号的位流的结构。此外,本文件涉及编码的音频信号的位流的帧率的修改。
背景技术
不同的音频格式可能需要不同的采样率(例如,32kHz、44.1kHz或48kHz)。为了将第一采样率(例如,32kHz)的音频信号转换成第二采样率(例如,48kHz)的音频信号,可以使有理重采样器。通过有理因子对音频进行重采样典型地将成像/混淆伪像引入到重采样的音频信号中。可以使用抗成像/抗混淆滤波器以抑制音频信号的不希望的图像和/或混淆。本文件描述了有理重采样器中使用的抗成像/抗混淆滤波器。特别地,本文件描述了用于以计算高效的方式实现这种抗成像/抗混淆滤波器的方法。
此外,例如,编码的音频信号的帧率可结合相关视频信号的帧率的修改被修改。这种帧率可以是有理数。本文件描述了如下的方法和***,其被配置为使得能够在可听伪像减小(例如,没有)的情况下实现编码的音频信号的帧率的修改。
发明内容
根据一个方面,描述了用于将输入音频信号重采样成输出音频信号的***。该***也可被称为重采样器。***可被配置为根据有理重采样率执行重采样。重采样率L/M可由上采样因子L和下采样因子M定义,例如,L为大于或等于1的整数,M为大于或等于1的整。因而,重采样器可被配置为将处于输入采样率的输入音频信号重采样成处于输出采样率的输出音频信号,其中,输出采样率与输入采样率的L/M倍对应。
***可包含处理单元,该处理单元被配置为通过使用来自被配置为减少输出音频信号的成像和/或混淆的滤波器的滤波器系数的当前子集从输入音频信号的一个或更多个输入采样确定输出音频信号的当前输出采样。滤波器可被称为抗成像/抗混淆滤波器。滤波器可实现为包含预定数量N的滤波器系数的数字滤波器(例如,有限脉冲响应,FIR,滤波器)。用于确定当前输出采样的滤波器系数的当前子集可选自抗成像/抗混淆滤波器的预定数量N个滤波器系数。特别地,滤波器系数的当前子集可与抗成像/抗混淆滤波器的多相结构的相位对应。
如上所述,抗成像/抗混淆滤波器可包含N个滤波器系数的全集。滤波器系数的该全集可被再分成多相结构的多个相位,其中,各相位包含来自滤波器系数的全集的滤波器系数的子集。特别地,多相结构可包含L个相位,即,与上采样因子L对应的数个相位。用于不同相位的滤波器系数的子集均可包含N/L个滤波器系数。典型地,用于多相结构的不同相位的滤波器系数的子集相互排斥。换句话说,典型地,对于单个相位,来自滤波器系数的全集的各滤波器系数仅包含于单个子集内。此外,用于不同相位的滤波器系数的子集的并集典型地与滤波器系数的全集对应。
***可包含一个或更多个查找表,该一个或更多个查找表分别在用于确定不同输出采样的滤波器的多相结构的不同相位的相位指数与用于确定紧接在前(directlypreceding)输出采样的紧接在前相位的相位指数之间提供映射,并且在相位指数与来自滤波器的滤波器系数的相应子集之间提供映射。
特别地,***还可包含相位查找表,该相位查找表分别在用于确定不同输出采样的抗成像/抗混淆滤波器的多相结构的不同相位的相位指数与用于确定紧接在前输出采样的紧接在前相位的相位指数之间提供映射。换句话说,相位查找表可指示抗成像/抗混淆滤波器的多相结构的相位序列,其中,该相位序列被用于确定输出音频信号的输出采样的对应序列。因而,相位查找表可对于多相结构的每个相位指示多相结构的紧接在后(directlyfollowing)相位。
另外,***可包含在相位指数与来自抗成像/抗混淆滤波器的滤波器系数的相应子集之间提供映射的滤波器查找表。换句话说,滤波器查找表可指示对于多相结构的不同相位的滤波器系数的子集(形成子滤波器)。
作为替代方案,***可包含提供相位指数与来自滤波器的滤波器系数的相应子集之间的映射的合成相位/滤波器查找表。合成相位/滤波器查找表的相位指数可根据用于确定输出音频信号的输出采样的对应序列的相位指数序列被排序。作为例子,合成相位/滤波器查找表可包含对于不同相位指数指示滤波器系数的不同子集的多个行(或列),并且,这些行(或列)可根据用于确定输出音频信号的输出采样的对应序列的相位指数序列被排序。由此,合成相位/滤波器查找表的行(或列)的排序分别在用于确定不同输出采样的滤波器的多相结构的不同相位的相位指数与用于确定紧接在前输出采样的紧接在前相位的相位指数之间提供映射。
作为使用合成相位/滤波器查找表的结果,可通过使用基于MODULO L指针的查找运算来确定用于当前输出采样的滤波器系数的当前子集。
处理单元可被配置为通过使用该一个或更多个查找表基于用于紧接在当前输出采样之前的前一输出采样的前一相位指数确定滤波器系数的当前子集。
特别地,处理单元可被配置为通过使用相位查找表基于前一相位指数(识别用于确定紧接在当前输出采样之前的前一输出采样的相位)确定当前相位指数(识别用于确定当前输出采样的待用当前相位)。因而,通过使用查找运算,可通过计算高效的方式执行当前相位指数的确定(并因此确定当前相位)。以类似的方式,处理单元可被配置为通过使用滤波器查找表基于当前相位指数确定滤波器系数的当前子集。因而,处理单元可被配置为通过使用计算高效的查找运算确定要被用于确定当前输出采样的滤波器系数。
作为替代方案,处理单元可被配置为通过在合成相位/滤波器查找表中使用MODULO L指针基于用于紧接在当前输出采样之前的前一输出采样的前一相位指数确定滤波器系数的当前子集。
如上所述,***可被配置为根据上采样因子L重采样输入音频信号,这里,L大于1。抗成像/抗混淆滤波器的多相结构可然后包含L个相位。此外,相位查找表可然后对于用于L个相位的L个相位指数中的每一个提供到用于紧接在前相位的相位指数的映射。换句话说,相位查找表可包含具有当前相位指数和在前相位指数的映射对的L个条目。相位查找表可指示要用于确定输出音频信号的输出采样的对应序列的相位的相位指数序列。相位指数序列(即,待用相位的序列)典型地依赖于上采样因子L和/或下采样因子M。处理单元可被配置为基于上采样因子L和/或基于下采样因子L确定相位指数序列和/或相位查找表。此外,处理单元可被配置为确定滤波器系数的子集和/或滤波器查找表。可在重采样器的初始化时执行这些确定。可然后通过使用预定的相位指数序列和/或相位查找表以及滤波器系数的预定子集和/或预定滤波器查找表执行输入音频信号的后续处理。
处理单元可被配置为通过确定包含从1到L的升序整数的序列的基本矢量来确定相位指数序列和/或相位查找表。此外,可通过将基本矢量级联M次而从基本矢量确定级联矢量。可通过从级联矢量选择每第M个条目确定相位指数序列。可然后基于相位指数序列确定相位查找表。用于确定相位指数序列的方法是有益的,原因是它不包含诸如乘法或除法的任何计算繁重的任务。
但是,上述的用于确定相位指数序列的方法包括确定和存储包含L*M个条目的级联矢量。以下,描述用于确定相位指数序列的替代性方法,该方法关于存储器资源提供更高的效率。为了确定相位指数序列,处理单元可被配置为从相位指数序列选择第一相位指数。第一相位指数可增加L或L的倍数,只要增加的第一相位指数小于或等于M即可。因此,得到的增加的第一相位指数超过值M。可基于增加的第一相位指数确定相位指数序列中的紧接在第一相位指数之后的第二相位指数。特别地,可通过从增加的第一相位指数M减去M以产生中间相位指数,来确定第二相位指数。可然后通过从L+1减去中间相位指数来确定第二相位指数。可通过迭代的方式重复上述的处理(通过用前一迭代的第二相位指数替代当前迭代的第一相位指数),以确定相位指数的完整序列。
此外,处理单元可被配置为通过对于相位指数序列中的一对或更多对的相邻的相位指数,将相邻相位指数之间的差值确定为Δ=[M MOD L],来确定相位指数序列。
可对于不同的重采样率设计***。换句话说,***可被配置为根据不同的上采样因子L和/或根据不同的下采样因子M执行重采样。出于该目的,相位查找表可包含分别用于多个不同的重采样率L/M的多个相位指数到相位指数映射。此外,滤波器查找表可包含分别用于多个不同的重采样率L/M的多个相位指数对滤波器系数子集映射。处理单元可然后被配置为对适用的重采样率选择适当的映射。
根据另一方面,描述了用于确定相位指数序列的方法。相位指数序列可识别用于从输入音频信号的输入采样的序列确定经重采样的音频信号的输出采样的序列的重采样滤波器的多相结构的相位的对应序列。该方法可包含从相位指数序列选择第一相位指数。第一相位指数可增加上采样因子L或L的倍数,只要增加的第一相位指数小于或等于下采样因子M即可。可基于增加的第一相位指数确定相位指数序列中的紧接在第一相位指数之后的第二相位指数。该方法还可包含通过从增加的第一相位指数M减去M以产生中间相位指数,来确定第二相位指数。另外,方法可包含通过从L+1减去中间相位指数确定第二相位指数。
根据另一方面,描述了用于确定相位指数序列的方法。相位指数序列可识别重采样过滤器的多相结构的相位的对应序列,其中,相位指数序列要被用于从输入音频信号的输入采样的序列确定经重采样的音频信号的输出采样的序列。方法可包含确定包含从1到上采样因子L的升序整数的序列的基本矢量。此外,该方法可包含通过将基本矢量级联M次而从基本矢量确定级联矢量,其中,M是下采样因子。可通过从级联矢量选择每第M个条目确定相位指数序列。
根据另一方面,描述了用于解码包含多个不同通道的多通道音频信号的音频解码***。该多个不同通道可包含一个或更多个环绕通道。所述音频解码***可被配置为接收指示多通道音频信号的位流。该位流可被解码仪提供多通道音频信号。此外,所述音频解码***可被配置为确定是否满足第一条件和第二条件。第一条件可包含或者可指示多通道音频信号要被下混到减少数量的通道。可在位流的解码的情景中或在位流的解码之后执行该下混。因而,第一条件可针对音频解码***正察觉到多通道音频信号的即将到来的下混。
第二条件可包含或者可指示一个或更多个环绕通道已相对于多个不同通道中的其它通道中的一个或更多个相移。换句话说,音频解码***可被配置为验证多通道音频信号的一个或更多个环绕通道是否已相移。相移可对应于相对于多通道音频信号的其它通道的90°相移。第二条件可基于包含于接收的位流内的信息(例如,标记)被验证。由此,第二条件可基于包含于位流内的指示(例如,标记)被确定。作为替代方案,或者附加地,音频解码***可被配置为分析多通道音频信号,以便确定一个或更多个环绕通道已相对于多个不同通道中的其它通道中的一个或更多个相移的事实的概率(在本文件中概述)。
音频解码***可被配置为,如果满足第一条件(即,如果多通道音频信号将要被下混)以及如果不满足第二条件(即,如果音频解码***无法确认一个或更多个环绕通道已相移),则向所述一个或更多个环绕通道施加相移以产生一个或更多个相移的环绕通道。只有在满足第一条件的情况下以及在不满足第二条件的情况下,才向一个或更多个环绕通道施加相移。否则,使一个或更多个环绕通道的相位保持不变。音频解码***可被配置为向一个或更多个环绕通道施加相对于多个不同通道中的其它通道中的一个或更多个的90度相移。
因而,音频解码***可被配置为确保一个或更多个环绕通道的一致相移。这种一致的相移典型地对于矩阵编码(即,下混)和矩阵解码(即,上混)的情境中的通道分离是有益的。此外,可防止或减少信号消除相移的出现。这种信号消除可能由于向一个或更多个环绕通道多次施加相移而出现。
音频解码***还可被配置为通过使用矩阵编码从多通道音频信号确定下混音频信号。与多通道音频信号相比,下混音频信号典型地包含更少的通道。作为矩阵编码的一部分,音频解码***可被配置为使一个或更多个(相移的)环绕通道衰减以产生一个或更多个衰减的环绕通道,并且将一个或更多个衰减的环绕通道与多个不同通道中的其它通道中的一个或更多个相组合,以产生下混音频信号的一个或更多个通道。
根据另一方面,描述了用于将多通道音频信号编码成位流的音频编码***。多通道音频信号包含多个不同通道。多个不同通道可包含一个或更多个环绕通道。该音频编码***可被配置为确定所述一个或更多个环绕通道已相对于多个不同通道中的其它通道中的一个或更多个相移的事实的概率。确定概率可包含分析多个不同通道的音频内容。特别地,可分析多个不同通道的音频内容的谱。此外,可比较多个不同通道的谱的相位。
作为替代方案,或者附加地,可基于多通道音频信号的历史确定概率。作为例子,音频编码***可获知多通道音频信号的源或先前处理。特别地,音频编码***可获知多通道音频信号的处理的(完整)链(从音频信号的记录开始)。这种知识可被用于确定一个或更多个环绕通道已相对于多个不同通道中的其它通道中的一个或更多个相移的事实的概率。特别地,该知识可被用于排除(概率=0%)或确认(概率=100%)一个或更多个环绕通道已经相移的事实。
此外,音频编码***可被配置为,如果所确定的概率超过预定概率阈值,则将对于一个或更多个环绕通道已相对于多个不同通道中的其它通道中的一个或更多个相移这一事实的指示***到位流中。指示可包含位流的预定的位或标记。
根据另一方面,描述了用于解码包含多个不同通道的多通道音频信号的方法。多个不同通道可包含一个或更多个环绕通道。方法可包括接收指示多通道音频信号的位流。此外,方法包括确定是否满足第一条件和第二条件。第一条件可包含多通道音频信号要被下混到减少数量的通道的验证。第二条件包含确定一个或更多个环绕通道已相对于多个不同通道中的其它通道中的一个或更多个相移的验证。这可基于包含于位流内的指示(例如,标记)被确定。作为替代方案,或者附加地,这可基于多通道音频信号自身和/或基于关于多通道音频信号的处理链的知识被确定。该方法还可包括:如果满足第一条件以及如果不满足第二条件,则向一个或更多个环绕通道施加相移以产生一个或更多个相移的环绕通道。
根据另一方面,描述了用于将多通道音频信号编码成位流的方法。多通道音频信号可包含多个不同通道。多个不同通道可包含一个或更多个环绕通道。该方法可包括确定一个或更多个环绕通道已相对于多个不同通道中的其它通道中的一个或更多个相移的事实的概率。此外,该方法可包括如果所确定的概率超过预定概率阈值,则将对于一个或更多个环绕通道已相对于多个不同通道中的其它通道中的一个或更多个相移这一事实的指示***到位流中。
根据另一方面,描述了用于将包含音频帧序列的音频信号编码成包含位流帧的对应序列的位流的音频编码***。该音频编码***可被配置为提供用于对应的音频帧序列的子流帧的第一序列。子流帧的第一序列可包含音频帧序列的第一表示(representation)。表示可包含代表音频信号的数个通道(例如,2个通道或5.1个通道)。作为替代方案,或者附加地,表示可包含位率的指示,或者表示可与子流帧序列的位率相关。音频编码***可进一步被配置为提供用于对应的音频帧序列的子流帧的第二序列。第一序列和第二序列可包含同一音频帧序列的不同表示。
另外,音频编码***可被配置为确定位流帧的序列以使得位流帧在位流帧内的不同位置包含来自第一序列和第二序列的对应子流帧。特别地,位流帧的序列可被确定为使得各位流帧包含来自第一序列和第二序列的对应的子流帧。因而,位流可包含同一音频信号的多个表示。不同表示可关于通道的数量和/或关于位率而不同。作为替代方案,或者附加地,位流可包含用于来自不同音频信号的音频帧的对应序列的不同子流帧序列。
音频编码***还可被配置为将控制信息***位流帧序列中的位流帧中,其中,控制信息指示包含于该位流帧内的子流帧的位置和/或表示。这种控制信息可被***到位流帧序列中的各位流帧中。控制信息使得音频编码***能够识别来自位流的子流帧序列中的一个或更多个序列,而不需要解码整个位流帧序列。
控制信息可包含分别用于第一序列和第二序列的第一控制信息和第二控制信息。特别地,位流帧中的每一个可包含用于识别包含于位流帧内的第一序列和第二序列中的子流帧的第一控制信息和第二控制信息。音频编码***可被配置为通过使用具有不同长度的代码字编码第一控制信息和第二控制信息。换句话说,音频编码***可被配置为对于控制信息编码使用可变长度编码。
分别用于编码第一控制信息和第二控制信息的代码字的长度分别依赖于第一序列和第二序列的位率。特别地,如果第一序列的位率比第二序列的位率高,则用于编码第一控制信息的一个或更多个代码字的长度比用于编码第二控制信息的一个或更多个代码字的长度长,并且/或者,反之亦然。
因而,音频编码***可被配置为通过使用可变长度代码对第一控制信息和第二控制信息进行编码,使得如果子流帧的第一序列平均地包含比子流帧的第二序列多的位数,那么第一控制信息可平均地包含比第二控制信息多的位数,反之亦然。换句话说,音频编码***可被配置为通过使用可变长度代码对第一控制信息和第二控制信息进行编码,使得分别由于第一控制信息和第二控制信息导致的子流帧的第一序列和第二序列的相对开销之间的差值减小。
根据另一方面,描述了被配置为接收和处理包含对应的位流帧序列的输入位流的音频处理***。来自位流帧序列的位流帧在位流帧帧内的不同位置包含来自子流帧的第一序列和第二序列的对应子流帧。第一序列和第二序列可包含同一音频帧序列的不同表示。此外,位流帧序列中的位流帧可包含指示包含于位流帧内的第一序列和第二序列的子流帧的位置和/或表示的控制信息。音频处理***可被配置为通过使用控制信息从位流帧序列提取子流帧的第一序列和/或第二序列。特别地,音频处理***可被配置为从位流帧序列提取子流帧的第一序列和/或第二序列,而不必解码子流帧的第一序列和/或不必解码子流帧的第二序列。因此,音频处理***可被配置为以计算高效的方式识别多个子流帧序列中的一个或更多个序列。
另外,音频处理***可被配置将第一序列中的子流帧***到输出位流的对应位流帧序列中。此外,音频处理***可被配置将控制信息***输出位流的位流帧中。控制信息可指示来自输出位流的位流帧内的第一序列的子流帧的位置和/或表示。因而,音频处理***可被配置为以计算高效的方式产生包括包含于输入位流内的子流帧序列的选择的输出位流。
根据另一方面,描述了用于将包含音频帧的序列的音频信号编码成包含对应的位流帧序列的位流的方法。方法可包括提供用于对应的音频帧序列的子流帧的第一序列和提供用于对应的音频帧序列的子流帧的第二序列的步骤。第一序列和第二序列典型地包含同一音频帧序列的不同表示。该方法还可包括确定位流帧序列以使得位流帧在位流帧内的不同位置包含来自第一序列和第二序列的对应子流帧。另外,方法可包括将控制信息***位流帧的序列中的位流帧中。控制信息可指示包含于该位流帧内的子流帧的位置和/或表示。
根据另一方面,描述了用于处理指示包含音频帧序列的音频信号的位流的方法。该方法包括接收包含对应的位流帧序列的输入位流。位流帧在位流帧内的不同位置或地点包含来自子流帧的第一序列和第二序列的对应子流帧。第一序列和第二序列可包含同一音频帧序列的不同表示。位流帧序列中的位流帧包含指示包含于该位流帧内的子流帧的位置和/或表示的控制信息。此外,该方法可包括通过使用控制信息从位流帧序列提取子流帧的第一序列和/或第二序列。
根据另一方面,描述了用于处理包含对应的位流帧序列的位流的音频处理***。位流帧序列可指示音频信号的对应的音频帧序列。音频处理***可被配置为分别对于位流帧序列产生计数值序列。计数值序列可包含被顺序排序的计数值(例如,升序或降序的计数值)。此外,计数值可包含最小值和最大值。在计数值序列内最小值可跟在最大值后面,或者,反之亦然。换句话说,计数值可在最小值与最大值之间周期性循环。
音频处理***可被配置为将来自计数值序列中的计数值***来自位流帧序列中的位流帧中。计数值可作为控制信息被***位流帧中。作为***计数值的结果,位流帧的控制信息(即,计数值)可指示位流帧序列内的位流帧的顺序次序。这可能对于检测包含不同位流帧序列的级联的位流内的拼接点是有益的。拼接点可基于计数值被检测。特别地,拼接点可基于计数值的特定值和/或基于紧接在后位流帧的计数值的不连续性(discontinuity)被检测。
位流帧典型地还包含指示音频信号的对应音频帧的有效载荷数据。计数值和/或控制信息可被定位在位流帧的端点(例如,始点或终点)。换句话说,计数值和/或控制信息可被定位在位流帧内的预定位置/地点。特别地,计数值和/或控制信息可位于有效载荷数据的上游或下游。作为示例,位流帧可在预定位置首先包含控制信息(例如,帧同步化字和/或位流版本信息),后跟计数值。将计数值和/或控制信息定位于位流帧的暴露和/或预定位置可简化计数值和/或控制信息的识别,由此简化位流的处理和拼接点的检测。
根据另一方面,描述了用于产生拼接位流的音频处理***。拼接位流可从包含对应的第一位流帧序列的第一位流和包含对应的第二位流帧序列的第二位流产生。第一位流帧序列可指示第一音频信号的对应的第一音频帧序列,并且,第二位流帧序列可指示第二音频信号的对应的第二音频帧序列。第二音频信号可与第一音频信号不同。
第一位流帧序列中的位流帧包含指示第一位流帧序列内的位流帧的顺序次序的第一计数值。类似地,第二位流帧序列中的位流帧包含指示第二位流帧序列内的位流帧的顺序次序的第二计数值。因而,第一位流和第二位流分别包含第一计数值和第二计数值。
音频处理***可被配置为在来自第一位流帧序列的特定位流帧处截短第一位流,以由此提供截短位流。此外,音频处理***可被配置为级联截短位流与第二位流帧序列,以提供拼接位流。作为级联的结果以及作为提供计数值的结果,包含于拼接位流的第一部分内的第一计数值和包含于拼接位流的第二部分内的第二计数值可指示第一位流和第二位流之间的拼接点。特别地,拼接位流内的特定位流帧的第一计数值和/或跟在特定位流帧后面的位流帧的第二计数值可指示第一位流和第二位流之间的拼接点。更特别地,拼接位流内的特定位流帧的第一计数值与跟在特定位流帧后面的位流帧的第二计数值之间的不连续性可指示第一位流和第二位流之间的拼接点。
音频处理***可进一步被配置为将特定位流帧的第一计数值设定为预定计数值,并且/或者将拼接位流内的跟在特定位流帧后面的位流帧的第二计数值设定为预定计数值。因而,特定位流帧的计数值(称为第一计数值)可指示紧接在拼接点之前的位流帧,并且/或者,紧接在特定位流之后的位流帧的计数值(称为第二计数值)可指示紧接在拼接点之后的位流帧。典型地,向预定计数值分配(紧接在拼接点之前或者之后的位流帧的)计数值中的仅一个就足够了。特别地,对于实时处理来说,(仅)将紧接在拼接点之后的位流帧的计数值设定为预定计数值可能是有益的。
预定计数值可位于由计数值的最小值和最大值给出的计数值的计数值范围之外。换句话说,第一计数值和/或第二计数值可取得来自最小值与最大值之间的计数值范围的值。该预定计数值在计数值范围之外。作为示例,计数值的最小值可以为“1”并且预定计数值可以为“0”。被设定为预定值的计数值的检测可指示拼接位流内的特定位流帧与跟在特定位流帧后面的位流帧之间的拼接点的存在。
根据另一方面,描述了用于使得能够检测位流的拼接的方法。位流包含位流帧序列,其中,位流帧序列指示音频信号的对应的音频帧序列。该方法包括分别产生用于位流帧序列的计数值序列。此外,该方法包括将来自计数值序列中的计数值作为控制信息***来自位流帧序列的位流帧中,使得位流帧的控制信息指示位流帧序列内的位流帧的顺序次序。
根据另一方面,描述了用于产生指示拼接点的拼接位流的方法。该方法包括在来自第一位流帧序列的特定位流帧处截短第一位流,以提供截短位流。第一位流帧序列指示第一音频信号的对应的第一音频帧序列。第一位流帧序列中的位流帧包含指示第一位流帧序列内的位流帧的顺序次序的第一计数值。此外,该方法包括级联截短位流与包含第二位流帧序列的第二位流,以提供拼接位流。第二位流帧序列指示第二音频信号的对应的第二音频帧序列。第二位流帧序列中的位流帧包含指示第二位流帧序列内的位流帧的顺序次序的第二计数值。拼接位流内的特定位流帧的第一计数值和/或跟在特定位流帧后面的位流帧的第二计数值可指示第一位流和第二位流之间的拼接点。
根据另一方面,描述了用于解码拼接位流的音频解码***。拼接位流包含位流帧的第一序列和第二序列的级联。第一序列和第二序列分别指示第一音频信号和第二音频信号。位流帧的第一序列中的位流帧包含指示位流帧的第一序列内的位流帧的顺序次序的第一计数值。位流帧的第二序列中的位流帧包含指示位流帧的第二序列内的位流帧的顺序次序的第二计数值。
音频解码***可被配置为基于第一计数值和第二计数值检测第一和第二截短序列之间的拼接点。拼接点可基于相邻位流帧的计数值的不连续性和/或基于具有预定计数值的计数值被检测(在本文件中概述)。
此外,音频解码***可被配置为确定正确地解码在拼接点之后的拼接位流的位流帧所需要的数据是否可用。正确地解码位流帧所需要的数据可包含用于解码位流帧的第二序列的解码方案的设定。此外,可能需要确保位流帧不依赖于前一位流帧(由于拼接,因此其不包含于拼接位流内)。换句话说,可能需要确保位流帧是包含解码所需要的所有编码音频数据的独立(即,I)帧。
另外,音频解码***可被配置为,如果数据不可用,则暂停在拼接点之后的拼接位流的位流帧的解码。特别地,音频解码***可被配置为暂停在拼接点之后的(所有)位流帧的解码,直到对于其正确解码所需要的数据可用的拼接位流的(所有)位流帧。作为替代方案,或者附加地,音频解码***可被配置为提供指示已暂停解码的位流帧的静默的音频帧。因而,音频解码***可被配置为在拼接点之后呈现“静默”,直到正确解码所需要的数据都可用的时刻(即,直到该位流帧)。通过这样做,可减少可听伪像的输出。
根据另一方面,描述了用于解码包含位流帧的第一序列和第二序列的级联的拼接位流的方法。第一序列和第二序列可分别指示第一音频信号和第二音频信号。位流帧的第一序列中的位流帧包含指示位流帧的第一序列内的位流帧的顺序次序的第一计数值。位流帧的第二序列中的位流帧包含指示位流帧的第二序列内的位流帧的顺序次序的第二计数值。该方法可包括基于第一计数值和第二计数值检测第一序列和第二序列之间的拼接点。此外,该方法包括确定正确地解码在拼接点之后的拼接位流的位流帧所需要的(所有)数据是否可用。另外,该方法可包括:如果数据不可用,则暂停在拼接点之后的拼接位流的位流帧的解码。
根据另一方面,描述了用于处理位流的音频处理***。音频处理***可包括或者可以是例如音频解码***或采样率转换***或音频编码***。位流可包含位流帧的第一序列和第二序列的级联,其中,第一序列和第二序列指示一个或更多个音频信号。所述一个或更多个音频信号可被称为一组音频信号。在拼接位流的情况下,第一序列可指示第一音频信号(或第一组音频信号),并且,第二序列可指示第二音频信号(或第二组音频信号)。但是,第一序列和第二序列两者也可指示具有不同时间性能(诸如时间的长度和/或位置)的同一音频信号的摘录。
位流帧的第一序列中的位流帧包含指示位流帧的第一序列内的位流帧的顺序次序的第一计数值。此外,第一序列包含具有预定的一套(suite)帧长度的位流帧的第一子序列。第一子序列的该套帧长度使得第一子序列的位流帧展现第一预定平均帧长度N。
位流帧的第二序列中的位流帧包含指示位流帧的第二序列内的位流帧的顺序次序的第二计数值。此外,第二序列可包含具有另一(可能不同的)预定的一套帧长度的位流帧的第二子序列(其中,帧长度可例如以采样数量被测量)。第二子序列的该套帧长度可以为使得第二子序列的位流帧展现第二预定平均帧长度K。
音频处理***可被配置为检测第一序列和第二序列之间的过渡点。过滤点可以是(位流内的任意位置处的)不同音频信号之间的任意拼接点(也称为拼接点)。作为替代方案,或者附加地,过渡点可与位流内的在该处位流的帧率改变的点对应。
音频处理***进一步被配置为从位流帧的第一序列确定第一位流帧,其中,第一位流帧紧接在过渡点之前。另外,音频处理***被配置为基于第一位流帧的第一计数值q1确定第一位流帧的序列指数值i1。序列指数值i1可指示第一子序列内的第一位流帧的位置和/或帧长度。特别地,序列指数值i1可指示在第一子序列的该套预定帧长度内的第一位流帧的帧长度。
另外,音频处理***被配置为从位流帧的第二序列确定第二位流帧,其中,第二位流帧紧接在过渡点之后。然后,音频处理***被配置为基于第一位流帧的序列指数值i1确定第二位流帧的序列指数值i2。以类似于序列指数值i1的方式,序列指数值i2可指示第二子序列内的第二位流帧的位置和/或帧长度。特别地,序列指数值i2可指示在第二子序列的该套预定帧长度内的第二位流帧的帧长度。
通过基于第一位流帧的序列指数值i1确定第二位流帧的序列指数值i2,可确保位流610的“相位”即使在拼接点和/或即使经受了帧率变化仍保持或锁定。作为其结果,可提高经解码的位流的音频质量。
第一位流帧的序列指数值i1可被确定为i1=q1mod Z,其中,Z是第一子序列内的位流帧的数量。这也适用于第二位流帧。
第一位流帧的序列指数值i1可与第一余数值r1相关,其中,第一余数值r1可指示直到第一位流帧的第一子序列的位流帧的中间平均帧长度与第一预定平均帧长度之间的差值。音频处理***可被配置为基于第一余数值r1以及基于第二预定平均帧长度确定第一伪序列指数值特别地,在位流帧的第一序列会展现第二预定平均帧长度(而不是第一预定平均帧长度)的情况下可以确定第一余数值r1会与序列指数相关。第二位流帧的序列指数值i2可然后基于伪序列指数值被确定。特别地,第二位流帧的序列指数值i2可被确定为其中,Z是第二序列的位流帧的数量(如果帧率保持不变)。
如上所述,过渡点可以是拼接点。在这种情况下,过渡点可基于第一计数值和/或第二计数值被检测。特别地,过渡点可基于第二位流帧的第二计数值、例如基于具有预定计数值的第二位流帧的第二计数值被检测。因而,位流的“相位”锁定也可适用于指示的拼接点,即,适用于由预定计数值指示的拼接点。
第一预定平均帧长度可以是有理数,不是整数。另一方面,第一子序列的位流帧的预定的一套帧长度可以是整数。因而,第一子序列可被用于通过使用一套整数帧长度提供小数平均帧长度。该套帧长度可被重复以形成第一序列。以类似的方式,第二预定平均帧长度可以是有理数,不是整数,并且,位流帧的第二子序列的预定的一套帧长度可以是整数。
第一预定平均帧长度可与第二预定平均帧长度不同。特别地,比值K/N或比值N/K可以是大于1的整数。因而,“相位”锁定也可适用于帧率变化。
根据另一方面,描述了用于处理位流的音频处理***。音频处理***可包含或者可以是例如音频解码***或采样率转换***或音频编码***。位流可包含位流帧的第一序列和第二序列的级联,其中,第一序列和第二序列指示例如一组音频信号中的一个或更多个音频信号。在拼接位流的情况下,第一序列可指示(例如,第一组音频信号的)第一音频信号,并且,第二序列可指示(例如,第二组音频信号的)第二音频信号。但是,第一序列和第二序列两者也可指示同一音频信号的不同摘录,其中,不同摘录具有不同的时间性能,诸如时间的长度和/或位置。
位流帧的第一序列中的位流帧包含指示位流帧的第一序列内的位流帧的顺序次序的第一计数值。此外,第一序列展现第一平均帧长度。位流帧的第二序列中的位流帧包含指示位流帧的第二序列内的位流帧的顺序次序的第二计数值。另外,第二序列展现第二平均帧长度。第一平均帧长度和第二平均帧长度可不同。
音频处理***被配置为检测第一序列和第二序列之间的过渡点。此外,音频处理***被配置为确定紧接在过渡点之前的得自第一序列的位流帧的第一位流帧,并且确定第一位流帧的第一计数值q1。另外,音频处理***被配置为确定紧接在过渡点之后的得自第二序列的位流帧的第二位流帧,并且确定第二位流帧的第二计数值q2
此外,音频处理***可被配置为基于第一计数值q1、第二计数值q2、第一平均帧长度和第二平均帧长度确定过渡点是否是拼接点。因而,可通过可靠的方式确定拼接点的存在(即使在帧率变化的情况下仍如此)。作为其结果,可提高经解码的位流的感知质量。
特别地,音频处理***可被配置为基于第一计数值q1、基于第一平均帧长度以及基于第二平均帧长度确定第二位流帧的目标计数值k。也可基于第一计数值的最大值Qmax和/或最小值Qmin确定第二位流帧的目标计数值k。另外,音频处理***可被配置为比较目标计数值k与第二计数值q2,以确定过渡点是否是拼接点。更特别地,音频处理***可被配置为,(只有)如果目标计数值k与第二计数值q2不同,则(才)确定过渡点是拼接点。
N可以是平均帧长度且K可以是第二平均帧长度。比值K/N可以是大于1的整数,即,帧率可在过渡点处增大。目标计数值k可然后被确定为:
作为替代方案,N/K可以是大于1的整数,即,帧率可在过渡点处减小。目标计数值k可然后被确定为:
其中,
根据另一方面,描述了用于处理包含位流帧的第一序列和第二序列的级联的位流的方法。第一序列和第二序列指示一个或更多个音频信号。位流帧的第一序列中的位流帧包含指示位流帧的第一序列内的位流帧的顺序次序的第一计数值。第一序列包含具有预定的一套帧长度的位流帧的第一子序列,使得第一子序列中的位流帧展现第一预定平均帧长度。位流帧的第二序列中的位流帧包含指示位流帧的第二序列内的位流帧的顺序次序的第二计数值。第二序列包含具有预定的一套帧长度的位流帧的第二子序列,使得第二子序列中的位流帧展现第二预定平均帧长度。
该方法包括检测第一序列和第二序列之间的过渡点,并且确定紧接在过渡点之前的得自第一序列的位流帧的第一位流帧。此外,方法包括基于第一位流帧的第一计数值q1确定第一位流帧的序列指数值i1;其中,序列指数值i1指示第一子序列内的第一位流帧的位置。另外,该方法包括确定紧接在过渡点之后的得自位流帧的第二序列的第二位流帧。该方法还包括基于第一位流帧的序列指数值i1确定第二位流帧的序列指数值i2,其中,序列指数值i2指示第二子序列内的第二位流帧的位置。
根据另一方面,描述了用于处理包含位流帧的第一序列和第二序列的级联的位流的方法。第一序列和第二序列指示一个或更多个音频信号。位流帧的第一序列中的位流帧包含指示位流帧的第一序列内的位流帧的顺序次序的第一计数值。第一序列展现第一平均帧长度。位流帧的第二序列中的位流帧包含指示位流帧的第二序列内的位流帧的顺序次序的第二计数值。第二序列展现第二平均帧长度。
该方法包括检测第一序列和第二序列之间的过渡点,并且确定紧接在过渡点之前的得自第一序列的位流帧的第一位流帧。另外,该方法包括确定第一位流帧的第一计数值q1。此外,该方法包括确定紧接在过渡点之后的得自第二序列的位流帧的第二位流帧,并且确定第二位流帧的第二计数值q2。该方法还包括基于第一计数值q1、第二计数值q2、第一平均帧长度和第二平均帧长度确定过渡点是否是拼接点。
根据另一方面,描述了软件程序。该软件程序可适于在处理器上执行,并且当在处理器实施时执行在本文件中概述的方法步骤。
根据另一方面,描述了存储介质。该存储介质可包括软件程序,该软件程序可适于在处理器上执行,并且当在处理器实施时执行在本文件中概述的方法步骤。
根据另一方面,描述了计算机程序产品。计算机程序产品可包含用于当在计算机上执行时执行在本文件中概述的方法步骤的可执行指令。
应当注意,包括在本专利申请中概述的其优选实施例的方法和***可被单独使用,或者与在本文件中概述的其它方法和***组合使用。此外,在本专利申请中概述的方法和***的所有方面可被任意地组合。特别地,权利要求的特征可按任意的方式相互组合。
附图说明
以下参照附图以示例性方式解释本发明,其中,
图1a示出示例性重采样器的概念图;
图1b示出重采样器的多相实现的示例性结构;
图2示出指示重采样器的输入采样与输出采样之间的示例性关系的表;
图3示出示例性重采样***的框图;
图4示出用于确定相位指数序列的示例性方法的流程图;
图5a示出示例性下混***的框图;
图5b示出示例性上混***的框图;
图5c示出另一示例性下混***的框图;
图6a示出包含多个接入单元的示例性音频位流的结构;并且
图6b示出包含多个接入单元的另一示例性音频位流的结构。
具体实施方式
图1a示出示例性有理重采样器10的概念。有理重采样器100包含将输入音频信号110的采样转换成上采样音频信号111的L个采样的上升L(up by L)上采样器101。这可通过在输入音频信号110的两个采样之间***L-1个零实现。随后,通过具有传递函数H(z)的抗混淆/抗成像滤波器102对经上采样的音频信号进行滤波。这导致经滤波的音频信号112。最后,经滤波的音频信号112被传送到仅保持经滤波的音频信号112的每第M个采样的下降M(down-by-M)抽取器或下采样器103,由此提供经重采样的(或输出)音频信号113。在将采样率为32kHz的输入音频信号110重采样为采样率为48kHz的输出音频信号113的情况下,L为3且M为2。在将采样率为44.1kHz的输入音频信号110重采样为采样率为48kHz的输出音频信号113的情况下,L为160而M为147。
应当注意,滤波器102以中间频率(IF)运行,该中间频率为输入采样率的L倍或输出采样率的M倍(例如,对于上述的情况,IF=M*48kHz)。这意味着抗混淆滤波器102典型地以高的采样率操作,从而计算滤波操作的数量的减少是所希望的。换句话说,希望减少抗混淆滤波器102的所需要的系数的数量,以便降低有理重采样器100的总体计算复杂性。
滤波器可实现为图1b所示的多相FIR(有限脉冲响应)实现。这种实现利用了经滤波器102滤波的上采样音频信号111在输入音频信号110的采样之间包含L-1个零的事实。因此,“零”乘法和加法可被省略。此外,多相实现利用了如下这样的事实,即,由于后续的下降M下采样滤波器103,因此仅需要确定经滤波的音频信号112的每第M个采样。通过在滤波实现期间利用这种信息,乘法和/或加法运算的次数可显著减少,由此降低了有理重采样器100的计算复杂性。尽管这样,还希望进一步降低重采样器100的计算复杂性。
图1b表示包含多相滤波器102的示例性重采样器120。多相滤波器102包含多个相位121,其中,各相位121包含具有总传递函数H(z)的滤波器102的子滤波器123。在N为滤波器系数hn(其中n=0、…N-1)的总数的情况下,总传递函数可对L个相位121的L个子滤波器123被再分成L个子传递函数,使得子传递函数可由下式给出:
其中,
图1b具有延迟单元122(用于实现z-l+1)、具有滤波器123(用于实现Hl(z))和具有加法单元124(用于实现求和示出传递函数的多相实现。
从上式可以看出,通过用延迟z-n代替z-Ln(其中,n=0、…、N/L-1),上升L上采样器101可包含于多相滤波器中。此外,通过仅确定多相滤波器的每第M个输出采样,考虑下降M下采样器103。
图2示出如何通过使用重采样器120的多相实现从输入音频信号110的采样204确定输出音频信号113的采样203。图2示出重采样率为3/2(即L=3且M=2)的情况。滤波器102包含N=9个系数hn(附图标记201),其中n=0、…、N-1。在图2中,系数201分别被指示为系数a、b、c、…、I。多相实现包含L=3个相位121,其在图2中由相位指数202指示。
输入采样204(即,输入音频信号110的采样)在图2的表的第一栏(左手侧栏)中被示出并且由数字1、2、3、…标识。在图2的表的第一栏中,由于通过因子L=3上采样输入音频信号110,因此,在输入采样204之间***两个零值。图2的表的右手侧栏示出由数字1、2、3、…标识的输出采样203(即,输出音频信号113的采样)。由于通过因子M=2下采样信号,因此,在输出采样之间***一个零值(由此指示表的该行的输出被忽略)。输入采样204(图2的表的左手侧)与输出采样203(图2的表的右手侧)之间的值代表滤波器延迟线,这确保各输入采样204在每个时间步(从表的一行到下一行)向右偏移1。因而,图2的表的各行代表在经上采样的采样率(即,乘以上采样因子L的输入音频信号101的上采样率)的时刻的重采样器110的状态的快照。时间流程是从图2的表的上面到下面,或者,换句话说,从图2的表的上面到下面,时间增加。
可以看出,为了确定输出采样203的整个序列(与图2的表的右手侧栏中的非零数字对应),仅考虑每隔一个时间步(即,表的每隔一行),并且,执行以下的计算(其中,与“0”的乘法可被省略):输出采样#1到输出采样#3不被分析,原因是这些输出采样203与重采样器120的初始相位对应。尽管如此,本文件的发现仍适用于这些输出采样203。输出采样#4由3*a+2*d+1*g确定(其中,数字代表输入采样204),输出采样#5由3*c+2*f+1*i确定(其中,数字代表输入采样204),并且,输出采样#6由4*b+3*e+2*h确定(其中,数字代表输入采样204)。后续的输出采样203以循环的方式被确定,即,通过使用与输出采样#4相同的系数确定输出采样#7,通过使用与输出采样#5相同的系数确定输出采样#8,并且,通过使用与输出采样#6相同的系数确定输出采样#9,等等。
从图2的例子可以看出,在某个时刻仅使用滤波器系数的子集以产生输出采样203。即,按照循环的方式,对于输出采样#4,使用滤波器系数a、d、g,即第一子滤波器123(即,H1(z))的滤波器系数;对于输出采样#5,使用滤波器系数c、f、i,即第三子滤波器123(即,H3(z))的滤波器系数;对于输出采样#6,使用滤波器系数b、e、h,即第二子滤波器123(即,H2(z))的滤波器系数,等等。
如上所述,滤波器系数的各子集(即,各子滤波器123)可被称为滤波器相位(filter phase)或相位121。图2表示相位指数l 202,其中,系数的各子集(即,各子滤波器123)与相位指数202相关。具有相位指数l=1的相位121的子滤波器123包含滤波器系数a、d、g,具有相位指数l=2的相位121的子滤波器123包含滤波器系数b、e、h,具有相位指数l=3的相位121的子滤波器123包含滤波器系数c、f、i。这也通过上式示出,其中l=1、…、L。
从以上的分析可以看出,从各输出采样203到下一输出采样203,相位指数改变。对于重采样率3/2的例子,相位指数202的序列为l=1、3、2、1、3、2、…。一般地,可进行以下的观察:
·通过使用单个子滤波器123(Hl(z))确定各输出采样203。换句话说,通过使用滤波器102的多相实现的单个相位121确定输出音频信号113的各输出采样203。
·通过特定的相位指数202(l)识别用于确定输出采样203的子滤波器123。
·用于确定输出音频信号103的输出采样203的相位指数202的数量是有限的(典型地,相位指数202的数量与上采样因子L对应)。
·用于输出采样203的序列的相位指数202的序列是重复的或者周期性的,即,相位指数202的序列包含重复的子序列(在上述的例子中,子序列1、3、2重复)。
·各子序列(周期性重复)包含总滤波器102的所有相位指数l=1、…、L或所有相位121。
·相位指数202不必需以升序次序或者顺序次序相互跟随。特别地,相位指数序列的相位指数202可从较高的相位指数跳到低的指数并重新回到较高的相位指数。可在3/2重采样器的例子中看到这一点,这里,用于确定输出采样203的序列的相位指数序列不是l=1、2、3是l=1、3、2。
·从图2可以规定,相位指数序列的两个相邻相位指数之间的差值对应于M MOD L(对于一对或更多对的相邻相位指数)。特别地,相位指数序列的第一相位指数与紧接在后(directly following)相位指数之间的差值在紧接在后相位指数大于第一相位指数且小于或等于最大相位指数L的情况下可对应于M MOD L。另一方面,如果第一相位指数与M MODL的和大于最大相位指数L,那么相位指数可从最大相位指数L回绕到在最小相位指数1与最大相位指数L的范围中的较小的相位指数。
当考虑不同的转换比、例如考虑11/13(即,L=11且M=13)时,可以看出,用于确定输出采样序列的相位指数子序列由l=1、3、5、7、9、11、2、4、6、8、10给出。该相位指数子序列被重复以形成总的相位指数序列。
在嵌入式***中,希望在开始滤波计算之前获知相位指数序列,即,希望获知或确定初始化时的相位指数的序列。计算初始化时的相位指数序列并将其存储在阵列中提供了节省对于各输出采样的计算的优点。作为计算用于特定输出采样203的相位指数202的替代,可从预先计算的阵列读取用于特定输出采样203的相位指数202,并且可设定到对应的子滤波器123的指针。与运行期间的相位指数202的计算和/或子滤波器123的识别相比,这种查找操作明显更高效。
图3示出了示例性重采样***300的框图。***300被配置为从(输入音频信号110的)输入采样204的序列确定(输出音频信号113)的输出采样203的序列。***300可以是例如嵌入到音频编码器或音频解码器***中的嵌入式***。***300可包括处理单元301,例如,数字信号处理器(DSP)。处理单元301可被配置为执行输入采样204和输出采样203的实时处理。特别地,处理单元301可被配置为从输入音频信号110的一个或更多个输入采样204(实时地)确定输出音频信号113的一个或更多个输出采样203。输出采样203可被指示为y[p],其中,p为采样指数(根据输出音频信号113的采样率)。处理单元301可被配置为选择当前相位指数lp以用于确定当前输出采样y[p]。当前相位指数lp可基于用于紧接在当前输出采样y[p]之前的前一输出采样x[p-1]的前一相位指数lp-1被确定。为了确定当前相位指数lp,处理单元301可参照预先确定的相位查找表302(存储于例如***300的存储器单元中)。预先确定的相位查找表302可基于前一相位指数lp-1(例如,作为其函数)提供当前相位指数lp
预先确定的相位查找表302可反映对于特定重采样率L/M的相位指数序列。作为例子,对于重采样率3/2,相位查找表302可具有表1的形式。从表1可以看出,对于重采样率L/M的预先确定的相位查找表302典型地包含L个条目。因而,预先确定的相位查找表302可指示被重复以形成用于确定输出采样203的序列(即,用于确定输出音频信号113)的相位指数序列的相位指数子序列。
表1
在前相位指数lp-1 当前相位指数lp
1 3
2 1
3 2
***300可包含用于多个不同重采样率L/M的多个相位查找表302。重采样率L/M可作为配置数据311被提供给处理单元301。配置数据311可指示上采样因子L和/或下采样因子M。处理单元301可然后被配置为选择指示相位指数202的(子)序列的相位查找表302,该相位查找表302将用于由配置数据311给出的重采样率L/M。
***300还可包括提供要用于确定当前输出采样y[p]的子滤波器123的滤波器查找表303。换句话说,为了确定当前输出采样y[p],滤波器查找表303可提供一个或更多个滤波器系数201,该一个或更多个滤波器系数201要分别应用于一个或更多个对应的输入采样204。换句话说,滤波器查找表303可对于不同的相位指数l 202提供子滤波器123的滤波器系数201。可对于不同的相位指数l提供滤波器系数201的不同集合。因而,滤波器查找表303可基于当前相位指数lp提供滤波器系数的当前集合(要用于确定当前输出采样y[p])。作为例子,对于重采样率3/2以及对于包含总共N=9个滤波器系数201的抗混淆/抗成像滤波器102,滤波器查找表303可具有表2的形式。
表2
当前相位指数lp 当前的一组滤波器系数
1 h0=a,h3=d,h6=g
2 h1=b,h4=e,h7=h
3 h2=c,h5=f,h8=i
以与相位查找表302类似的方式,***300可包含用于不同上采样因子L、用于不同下采样因子M和/或用于滤波器系数201的不同数量N的多个滤波器查找表303。如上所述,配置数据311可指示上采样因子L和/或下采样因子M。作为替代方案,或者附加地,配置数据311可指示要使用的滤波器系数的数量N。
应当注意,作为使用相位查找表302确定相位指数202的(子)序列并然后使用滤波器查找表303确定要用于当前相位的一个或更多个滤波器系数201的替代,可以限定组合的相位/滤波器查找表。组合的相位/滤波器查找表可提供用于不同相位指数l 202的子滤波器123的滤波器系数201(与滤波器查找表303类似),其中,不同相位指数l 202根据相位指数202的(子)序列(例如,由相位查找表302给出)被排序。表3示出用于重采样率3/2以及用于包含总共N=9个滤波器系数201的抗混淆/抗成像滤波器102的示例性组合相位/滤波器查找表。
表3
当前相位指数lp 当前的一组滤波器系数
1 h0=a,h3=d,h6=g
3 h2=c,h5=f,h8=i
2 h1=b,h4=e,h7=h
作为使用根据相位指数的(子)序列排序的组合相位/滤波器查找表的结果,在计算当前输出采样y[p]之后,MODULO L指针可递增,以查找要用于计算下一输出采样y[p+1]的滤波器系数。由此,用于确定输出采样y[p]的滤波器系数可仅通过使用单个查找操作被确定。
因而,***300可被配置为通过使用计算高效的查找操作、例如通过使用相位查找表302和/或滤波器查找表303和/或组合相位/滤波器查找表,确定要用于确定当前输出采样y[p]的一组滤波器系数。该组滤波器系数可包含R个滤波器系数,其中,R典型地等于比率N/L(或者等于其最接近的整数值)。该组滤波器系数定义了要用于通过使用滤波器式从R个输入采样x[q]确定当前输出采样y[p]的子滤波器,其中,滤波器系数形成当前子滤波器123的一组滤波器系数。滤波器系数对应于总体滤波器102的滤波器系数hn(其中n=0、…、N-1)的子集。典型地,用于具有相位指数l的相位121的一组滤波器系数对应于滤波器系数
输出音频信号113的采样指数p与输入音频信号110的采样指数q之间的关系典型地依赖于重采样率L/M。用于确定输出采样y[p]的一个或更多个输入采样204x[q-r]可典型地基于关系被确定,r=0、…、R-1。
***300,特别是处理单元301,可被配置为基于上采样因子L和基于下采样因子M确定相位查找表302和/或重复的相位指数子序列。出于该目的,***300和/或处理单元301可利用强力方法。用于确定周期性的相位指数子序列的方法可包括产生包含有序数[1;L]的基本矢量,例如,对于L=3,为[1 2 3]。该基本矢量可被级联M次以产生级联矢量[[1;L][1;L]…],例如,对于L=3和M=2,级联矢量[[1 2 3][1 2 3]]。此外,该方法可包括去除级联矢量中的每第M个条目的步骤。在L=3和M=2的情况下,从级联矢量[[1 2 3][1 2 3]]去除条目2、1、3(从左到右),从而产生抽取矢量[1 3 2]。抽取矢量与相位指数子序列对应,该子序列被重复以确定输出采样203的序列。
应当注意,上述的用于确定待重复的相位指数子序列的方法包括确定包含L*M个条目的级联矢量。该数量可能相当大,例如,对于与L=147、M=160的比率对应的48000Hz到44100Hz的采样率转换,级联矢量包含23520个条目。因而,确定相位指数子序列和/或相位查找表302可利用大量的存储器资源。鉴于此,描述用于确定相位指数子序列和/或用于确定相位查找表302的另一方法,该另一方法关于存储器资源更高效。
以下描述的方法不利用需要存储于***300的存储器中的级联矢量。在表4中以伪代码的方式描述该方法。
表4
图4示出了用于确定相位指数矢量“phase_array[i]”的示例性方法400,其中,i=1、…、L。示例性方法400与表4所示的方法对应。方法400包括选择相位指数“1”作为相位指数矢量的第一条目的步骤401。此外,方法400包括初始化辅助变量itmp和矢量变量i的步骤402。在步骤403中,验证矢量变量i是否小于或等于L(即,相位指数矢量是否已全部被确定)。在步骤404中,将辅助变量itmp增加L步,直到辅助变量itmp超过下采样因子M。然后,在步骤405中,使辅助变量itmp减小M。得到的辅助变量itmp可被用于确定相位指数矢量中的第i条目的相位指数,即phase_array[i](步骤406和步骤407)。然后,对下一矢量条目重复步骤403~407,直到第L矢量条目。
关于需要的存储器,用于确定相位指数矢量(指示相位指数子序列)的方法400是特别高效的。此外,方法是计算高效的,原因是它仅利用加法和减法,而不需要例如除法或乘法。这对嵌入式***是特别有益的。
用于确定相位指数子序列的另一方法由下式给出:
P(i)=1+[M*(i-1)MOD L],
其中,i=1、2、…L,P(i)与相位指数子序列的第i个相位指数对应。从上式可以看出,考虑相位指数L重新后跟相位指数l(即,考虑最大相位指数L处的相位指数的回绕),两个相邻相位指数之间的差值可以为Δ=[M MOD L]。特别地,除了相位指数从最大相位指数L回绕到低的相位指数的情况之外,两个相邻相位指数之间的差值可以为Δ=[M MOD L]。
用于确定相位指数的子序列的递归式可由下式给出:
P(i+1)=1+[P(i)-1+(M MOD L)]MOD L,
其中,i=1、2、…L-1,P(i)与相位指数子序列的第i相位指数对应,并且,其中,例如P(1)=1。
应当注意,上述的用于确定相位指数子序列和/或用于确定相位查找表302的方法适用于上采样(L>M)和下采样(L<M)。
因而,本文件描述了被配置为以计算和存储高效的方式重采样输入音频信号110的重采样***300。***300可被配置为以资源高效的方式确定相位指数序列(例如,相位查找表302)。此外,***300可利用一个或更多个相位查找表302和/或一个或更多个滤波器查找表303以确定用于确定输出音频信号113的当前采样y[p]的当前一组滤波器系数这里,r=0、…、R-1。作为这种查找运算的结果,可以降低重采样器300的计算复杂性。
以下描述音频编码和解码***的其它方面。这些方面针对多通道音频信号的不同通道之间的相位关系。此外,这些方面针对音频位流的设计。
对于多通道(例如,5.1)音频信号来说,一种典型的使用情况是不在五个离散音频扬声器上被再现。事实上,多通道音频信号可被下混到更少数量的通道,例如,两个(L/R)或三个(L/C/R)通道,以供再现或传送。下混可在数字域中执行。作为替代方案,多通道音频信号可被馈送到被配置为在耳机上的虚拟空间环境中呈现多通道音频信号的所谓的耳机虚拟化器(也称为双耳化器)。
可通过可位于机顶盒(STB)内的音频解码器(作为解码器处理的一部分)执行下混。下混处理可利用所谓的矩阵编码。音频解码器(例如,STB)然后可向实际的再现装置(例如,音频/视频接收器,AVR)提供下混音频信号,其中,音频解码器与实际的再现装置之间的链路可限于减少数量的通道。应当注意,在进行下混之处(例如,在音频解码器处),可能没有关于实际回放配置的详细信息。
可能发生如下情况:为了呈现完整的多通道音频信号,实际再现装置具有足够的扬声器或者包含具有足够的通道输入的耳机虚拟化器。在这种情况下,实际再现装置可执行从下混音频信号到多通道音频信号的矩阵上混处理(也称为矩阵解码处理)。这种上混方案的例子是Dolby Surround、Dolby Prologic或Dolby Prologic II上混方案。
图5a示出被配置为将四个原始源音频信号(也称为多通道音频信号的通道)下混到双通道音频信号的示例性下混***50。原始音频信号包含左(L)通道501、右(R)通道503、中心(C)通道502和环绕(S)通道504。下混音频信号包含左全(Lt)通道511和右全(Rt)通道513。术语“全”指示下混音频信号的通道也包含来自一个或更多个其它通道的信息(不仅仅分别来自左和/或右通道)。
在图5a的情况下,存在四个“基本”输入信号或输入通道:左501、中心502、右503和环绕504(L、C、R、S)。L和R输入分别被直接提供给Lt和Rt下混输出,没有修改。C输入被均分成Lt和Rt下混,例如,为了在下混信号中保持恒定声学功率,具有3dB水平降低(与原始输入信号相比)。S输入也可减小3dB,但是,在Lt和Rt下混输出之间被均分之前,信号可相对于L、C和R被施加90度相移(使用相移单元505)。这可对于Lt、Rt 511、512内的环绕通道504的识别是有益的。此外,可分别在Lt/Rt通道中以相反的极性承载S信号504。这在馈送Lt输出的求和级中由“-”符号实现。
图5b示出被配置为从下混通道511、512产生环绕(S)通道524以及左(L)通道521和右(R)通道523的示例性上混***520。出于这种目的,上混***520被配置为通过使用减法单元555从Lt信号511减去Rt信号513。在图5b的例子中,左(L)通道521和右(R)通道523分别与Lt通道511和Rt通道513对应。
可以看出,如果在下混***500仅存在S信号504(没有C信号502且没有L、R信号501、503),则Lt和Rt上的信号是相同的,但具有相反的极性。当在上混***502中减去这些信号时,信号511、513按照希望产生环绕输出信号524(与原始环绕信号504相同,具有90°的相移)。此外,如果在下混***500仅存在C输入信号502(没有S信号504且没有L、R信号501、503),则Lt和Rt中的C成分是相同的。当在上混***520中相减时,C成分相互完全抵消,从而在S输出中仅留下静默(silence),这又是希望的结果。这表示,可实现C和S通道之间的高的通道分离。但是,如果Lt和Rt信号是随机的(不单纯包含C或S信号),那么上混***520的减法单元525在S输出524产生差值信号。作为结果,不能再以完美的方式分离原始通道。前信号和环绕信号之间的通道分离可低至3dB。
可通过适当的矩阵编码(或下混)处理(例如,Dolby Surround编码)部分地克服多通道信号的原始通道的不完美分离。如图5a的情况所示,下混(例如,从3/2到2/0或者从3/1到2/0的下混)典型地涉及在矩阵编码(或下混)处理之前(或之中)环绕通道504上的90°相移505。
给定以上的构架约束,并且观看5.1材料的掌控级(即,当编码音频数据以用于存储于例如DVD或BluRay上或者用于广播传送),通常不知道多通道音频信号是否将在足够数量的扬声器上“原生”再现,或者多通道音频信号是否通过使用矩阵编码处理(例如,如图5a)被下混,在该矩阵编码处理之后可进行矩阵解码处理(例如,如图5b所示)。
由于90°相移505对于通道分离的益处,变得通常通过在编码多通道音频信号之前已在掌控级中施加90°相移来期望矩阵编码***500的上述90°相移505。作为结果,已编码的离散多通道音频信号在一个或更多个环绕通道504中承载90°相移。因此,为了避免施加两次90°相移,矩阵编码***应不包含相移单元505。在图5c中示出这种矩阵编码或下混***530。可以看出,矩阵编码***530接收修正的环绕(S′)通道534,该通道534相对于由图5a的***500接收的环绕(S)通道504相移90°。
提供已包含一个或更多个被相移90°的环绕通道的多通道音频信号的方法已被证明仅最小程度地使处于全多通道设置的音频信号的再现劣化,而同时提高了在矩阵编码和解码的情况下的通道分离。但是,提供这种被相移的多通道音频信号的方法具有如下这样的风险,即,在矩阵编码级500不知道已偏移的环绕通道504的情况下,编码级500会向一个或更多个环绕通道504施加另一90°相移。对于与来自前通道501、503的内容同相位的环绕通道504的内容,这意味着会出现不希望的信号抵消(由于总180°相移)。在多通道信号不被矩阵编码、但通过使用也向一个或更多个环绕通道504施加90°相移的编码器以离散的方式被重新编码的情况下,也会出现这种信号抵消。此外,在耳机虚拟化器中使用被相移的环绕通道的效果没有被探究,并且可能导致次最佳的双耳化结果。
为了克服上述的缺点,提出在音频编码器中总是省略90°相移(即,当产生多通道音频信号时),以便提供(无相移的)多通道音频信号。相反,应在对应的音频解码器中执行90°相移。90°相移的施加的执行应受制于应满足(即,成立)的一个或更多个条件。条件可包括:
·第一条件,其指示音频解码器在音频信号的解码之后(或之中)执行矩阵下混处理;和/或
·第二条件,其指示多通道信号不被信令(即,不被识别)为之前(例如,在多通道音频信号的编码期间)已相移。
换句话说,提出以下方面:
·省略音频编码器内的90°相位处理(当产生多通道音频信号时)。
·如果确定多通道音频信号的一个或更多个环绕通道已相移90°,那么使得音频编码器能够在位流内向对应的音频解码器传输关于相移的信息。
·在音频编码器不具有关于多通道音频信号的环绕通道的可能的相移的先验信息的情况下,音频编码器可被配置为执行多通道音频信号的信号分析以得出多通道音频信号是否包含一个或更多个相移90°的环绕通道的概率。
·如果确定满足上述的条件,则音频解码器可被配置为执行90°相移。
如上所述,本文件也针对关于从音频编码器传送到对应的音频解码器的位流的各种方面。位流典型地包括指示待呈现的音频信号的音频数据。此外,位流典型地包括向音频解码器提供关于将如何呈现音频信号的信息的元数据。
位流典型地被构建为帧序列(也称为接入单元序列)。音频编码***的位流结构优选以有利于直接在位流层级上操纵包含于位流内的数据的方式被设计(优选不必解码音频数据)。一般地,位流的帧可包含不同子流的多路复用。不同的子流可例如与音频节目的不同语言(例如,与不同语言的视频的不同音频轨道)相关。作为替代方案,或者附加地,不同子流可与处于不同位率的同一音频数据相关。希望总位流的不同子流可被识别、去除或者合并成相对高层级的总子流(而不必解码子流)。提供用于识别子流、提取子流和/或将子流***到总位流中的手段有利于诸如自适应流传输的应用,这里,音频内容的多个不同位率表示中的特定一个表示动态地选自不同位率表示的多路复用,这些位率表示可潜在地存储于一个多路复用中。
在本文件中,提出向位流提供关于包含于位流内的不同子流的信息。如上所述,位流结构允许以每一位流帧数次包含同一信号(在时间上)的方式在一个多路复用位流内存储音频内容的不同表示,其中,同一信号在不同通道模式中和/或以不同位率被编码。作为例子,同一内容可作为2通道和5.1通道表示被提供,并且/或者,同一内容可被以与不同的音频质量对应的不同位率提供。
图6a示出包含帧(或接入单元)601的序列的示例性位流600。每一帧601包含可包含同一音频内容的不同表示的多个子流帧603。不同表示可例如与不同的通道配置(例如,与2通道配置和/或与5.1通道配置)和/或与不同的位率相关。此外,帧601包含提供包含于多路复用帧601内的多个子流帧603的目录(inventory)的控制信息602。控制信息602可包含描述不同表示的信息和/或识别帧601内的子流帧603的位置的信息。
通过使用图6a的位流结构,可使得自适应流传输服务器以实时(例如,即时地)解复用多个表示中的特定一个表示,例如,适于在特定的时间点在流传输通道上传送的特定表示。这可能是有用的,因为流传输通道的流传输带宽可能随时间大大改变。鉴于控制信息602包含足够的信息以识别音频内容的适当的表示(即,识别适当的子帧帧603)而不需要解码子流帧603这一事实,可以以相对低的计算成本执行子帧的解复用。
因而,提出了向包含用于同一音频内容的不同表示的多个不同子流的位流提供位流目录602,该位流目录602保持关于包含于多路复用帧601内的子流帧603中的一些或全部的通道模式和/或位率的信息。提供这种位流目录602使得能够在流传输客户端请求时实现选择和流出哪个表示的动态判定。通过使用适当的编码格式,控制信息602可被设计以仅要求有限的信令开销。
位流600的层级上的可能的操作包含组装和分解包含多个子流的多路复用位流600。特别地,该操作包含对于预先存在的位流600添加和/或去除子流。提供控制信息603简化了子流的这种添加和/或去除。
例如,在包含同一音频内容的不同质量的多路复用位流被存储于服务器上或者在室内传送到广播设施的广播情况下,这种操作是希望的。在播出点处,可决定对于一个或几个分布链路(例如,数字陆地TV、卫星、互联网流传输)使用包含于多路复用位流600内的音频内容的哪个版本。不同的分布链路可具有不同位率约束,因此可需要使用音频内容的不同表示(即,使用多路复用位流600的不同子流)。
提供控制信息602允许不同子流的资源高效识别以及允许从多路复用位流600提取一个或几个希望的子流。在提取子流之后,所提取的子流可被转换成新的有效位流600,其中,新的有效位流600包含音频内容的不同表示的子集(例如,该不同表示中的一个或更多个)。
可通过使用一组规则创建、读取和/或解释控制信息602。控制信息602可提供包含于多路复用帧601内的子流帧603的内容表(ToC)。用于从多路复用位流600提取子流以及用于将提取的子流重新***到单独的新位流中的示例性方法包括:
·对于多路复用位流600的各帧601,读取控制信息602:
·从控制信息602,识别帧601的哪个部分603与待提取子流对应;
·将帧601的被识别部分603复制或提取到外出位流中;
·对于包含待提取的子流的子流帧603的位流600的所有帧601重复该识别和复制步骤;
·产生用于外出位流的控制信息602,其中,控制信息602仅涉及被提取的位流部分;
·将产生的控制信息602与提取的位流部分603进行级联以形成外出位流的帧601。
控制信息或ToC 602可包含关于音频内容的表示的信息(诸如通道计数和/或位率)。作为替代方案,或者附加地,控制信息602可包含关于音频内容的语言的和/或关于主/相关音频关系的信息。作为例子,多路复用位流600可包含与主音频信号和相关音频信号有关的一对子流。相关音频信号可例如包含导演的评论、或用于盲人/视觉受损观众的TV节目的场景描述。消费者可选择他是否希望仅收听主音轨、或者他是否希望收听主信号和相关信号的混合。作为主信号的信号的识别、和/或作为相关信号的信号的识别、和/或相关信号用于什么目的、和/或相关信号参照哪个主信号可以是ToC 602的一部分。
如上所述,除了编码的音频数据以外,位流600典型地还包含元数据和/或控制信息。该数据可被称为附加信息。为了增加编码和/或位率效率,这种附加信息(例如,控制信息602)典型地通过使用可变位率编码器被编码。用于这种可变位率编码的典型方法是分析数据的冗余和统计,以及通过较短代码字编码频繁出现的数据字和通过较长代码字编码较不频繁出现的数据字,由此在不丢失数据的情况下提供平均值更短的数据的表示。这种编码技术的例子是Huffman码。
与以上形成对比,在本文件中提出了在相关子流的希望的总***率较小的情况下,使用较短代码字用于编码附加信息。换句话说,附加信息的可变位率编码可依赖于与附加信息相关联的音频数据的位率。特别地,多路复用位流600的帧601的控制信息602可通过使用可变长度代码被编码,其中,用于编码不同子流的控制信息602的代码字的长度依赖于不同子流的位率。典型地,代码字的长度随着子流的位率而增加。
作为例子,为了对于多路复用位流600的不同子流的通道配置进行编码,可以使用以下的代码字表(表5):
表5
单声道 0
立体声 10
5.0 110
5.1 11
在表5的例子中,四种不同的通道配置(或通道模式)是可能的,它们可通过使用2个位被识别。在本文件中,提出与5.1多通道情况相比,对于相关子流的总位率相对低的单声道情况使用较短代码字(例如,1位代码字),对于该5.1多通道情况,相关子流的总位率比单声道情况高。对于5.1多通道情况,通过3位代码字对通道配置进行编码。由于5.1多通道子流的增加的位率(与单声道子流相比),因此用于控制信息602的相对开销不会比单声道子流高。总体上,基于相关音频数据的位率的控制信息602的可变长度编码允许实现相对于总位率的所需要的控制信息开销的更充分的使用。换句话说,在本文件中描述的可变长度编码方案允许对于多个不同的子流均衡化相对控制信息开销(关于相关音频数据的位率)。
在音频位流的广播的情境下遇到的另一问题是位流的拼接。例如,作为运行位流内的节目改变的结果、作为广告导致的节目中断(“广告***”)的结果、和/或作为用户切换到不同节目的结果,会出现不同位流的拼接。
不同节目或音频信号之间的拼接点可在位流内高层级(例如,在MPEG-2Transport流的Program Map Tables即PMT中)上被信令。但是,关于位流内的拼接点的信息可能无法用于解码装置(诸如电视TV和/或机顶盒STB)的芯部音频解码器。即使关于拼接点的信息在解码装置中可用,也可能不能以特定拼接帧的精度将关于拼接点的信息传输到解码装置。此外,关于拼接点的信息不总是在广播数据首端上被正确地设定。
因此,音频解码器可能不知道被接收位流的待解码帧不与接收位流的作为先前接收帧的同一音频数据流对应的情况。换句话说,音频解码器可能不知道位流内的先前接收的帧与当前(待解码)帧之间的断点。这种断点会导致音频数据的真实解码所需要的参数的丢失。
许多音频编码算法(诸如高效-先进音频编码、即USAC)通常不在各单个编码帧内传送用于解码编码帧的所有必要信息。为了位率效率,可能仅偶尔传送一些信息(例如,以周期性的方式)。帧头信息一般在逐个帧的基础上不变,并且,编码器可对于给定的位率和/或对于给定的通道配置将头信息设定为恒定的。因此,由于连续性,音频解码器可能不知道正确解码待解码帧所需要的头信息。
另一方面是明确依赖于解码处理内的过往信息的编码技术的使用。这些编码技术针对通过利用相邻帧之间的共同性提供位率节省。这种编码技术的例子是参数的交叉帧Δ编码和帧间预测技术的使用。
作为这种相互依赖性的结果,当音频解码器接收到拼接位流时,参数可能在拼接点处改变的事实可能仍不被觉察。因此,音频解码器可能被驱动到未定义的条件,并且/或者会产生可听音频伪像。当至少一些高层级位流参数(例如,比如通道的数量或音频采样频率)在拼接点前后保持不变、而其它(更特定)参数改变时,尤其是这种情况。
在本文件中,提出引入每个帧的序列计数器作为位流的一部分。在常规操作中,后续音频帧被提供有增大的序列计数器号码。当计数器的分辨率用尽时,可应用回绕(例如,a复位到1)。序列计数器使得音频解码器能够检测序列计数器在两个后续帧中不增加1(或增加预定量)的事实。序列计数器的不连续会被音频解码器解释为位流的不连续(例如,由拼接点导致)。作为结果,音频解码器可被配置为通过使用序列计数器检测位流内的拼接点。
特别地,音频解码器可被配置为基于(在检测的拼接点之前的)一个或更多个解码帧抑制(在检测的拼接点之后的)待解码帧的解码。此外,音频解码器可被配置为抑制待解码帧的解码,其依赖于与检测的拼接点之前的一个或更多个帧相关的头信息。作为例子,音频解码器可被配置为仅在接收到正确的头信息时和/或在接收到(例如,所谓I帧的)独立编码帧时才重新开始解码(在检测的拼接点之后)。通过这样做,可以减少由未察觉拼接点导致的可听伪像的出现。
如上所述,序列计数器一般具有有限的分辨率,因此,会以一定的概率出现“错误肯定”(即,拼接点的错误检测)。但是,“错误肯定”的概率可由序列计数器的长度或分辨率控制。
可对于特定的目的保留序列计数器的特定值,例如值“0”。该特定值可为拼接标记的函数。包含该特定序列计数器的帧的含义可以为:
·指示在当前帧(包含特定序列计数器值)和前一帧之间存在拼接点;
·指示具有特定序列计数器值的序列计数器与紧接在后的序列计数器的可能不连续应被忽略。换句话说,即使下一序列计数器会指示拼接点(由于不连续导致的),拼接点的该指示也应被忽略。
拼接标记的定义允许广播前端处的拼接装置通过序列计数器的比较简单的修改(即,通过将序列计数器设定为特定值)即时地标记拼接点。当序列计数器被存储于帧的容易识别位置(优选地接近开端的位置)时,该标记处理作用尤其好。
图6b表示包含帧611、621的序列的示例性位流610。帧611、621包含编码的音频数据613。此外,音频帧611、621包含各自的序列计数器612、622。直接接续(succeeding)的帧611、621内的直接接续的序列计数器612、622可向音频解码器指示直接接续的帧611、621与连续的音频数据有关。另一方面,接续的序列计数器612、622的不连续可指示音频数据的不连续(由拼接点导致)。作为替代方案,或者附加地,序列计数器622的特定值(例如,值“0”)可指示帧611与621之间的拼接点。
如上所述,序列计数器612、622可被用于识别拼接点的存在。序列计数器612、622可在最小值Qmin与最大值Qmax之间周期性循环(以升序或降序)。最小值的示例性值是Qmin=1且最大值的示例性值是Qmax=1020。如果当前帧611的序列计数器612的值q1=n紧接在位流610内的紧接在后帧621的序列计数器622的值q2之前,使得例如q2=n+1或者q2=n mod Qmax+Qmin,那么序列计数器612、622的值q1和q2指示在位流610内不存在拼接点。另一方面,如果帧621的序列计数器622的值q2不紧接在帧611的序列计数器612的值q1之后,例如,q2≠n+1或者q2≠n mod Qmax+Qmin,那么这可提供在当前帧611与直接随后帧621之间的位流内610内存在拼接点的指示。
另一方面,可能发生位流610内的帧611、621的帧率的改变。作为例子,例如为了提高音频信号的质量和/或为了使位流610适于传送介质的可用带宽,用户可以按不同帧率请求同一音频信号。作为例子,位流610可包含第一帧率N的帧611的第一序列和第二帧率K的第二序列的帧621。第一和第二帧率的比K/N可以为整数或有理数。特别地,第一和第二帧率的比可以为1/2、2或4。换句话说,第一和第二帧率可以为基本帧率的整数倍。
如上所述,连续帧611、621的序列计数器的值q1、q2也应连续。如果值q1、q2不连续,那么这可指示拼接点(也称为拼接点)。特别地,位流解码***可被配置为评估序列计数器的值并且发送拼接检测消息,该拼接检测消息可在计数器值跳变(jump)或者展现为预定值(例如,零)时被定时为帧622的名义起点(nominal beginning)。一般地,从0到任何其它数的序列计数器跳变不指示拼接。从0到0的跳变可指示另一拼接点。
但是,帧率的修改可导致帧的序列计数器的值q的改变。特别地,如果帧率以因子1/4、1/2、2、4改变,那么紧接在后帧611、621的计数器值的不连续可能未必是由于位流610的拼接导致的。序列计数器的值q的这种改变可能是由于计数速度(即,序列计数器的修改速度)可能依赖于帧率这一事实而导致的。作为例子,在基本帧率的情况下,序列计数器可具有用于第四帧的值4。另一方面,在为基本帧率的两倍的帧率的情况下,序列计数器可能已具有用于该帧的值8,其与基本帧率的第四帧对应于音频信号的同一时间摘录。由此,帧率的改变可导致序列计数器的值不连续。
表6a提供了用于基于帧611(处于第一帧率N)的序列计数器612的序列计数器值q1=n确定帧611(假定第二帧率K)的序列计数器612的目标序列计数器值的式子。在表6a中对于情况Qmax=1020示出了这些式子。
表6a
表6b在更一般的意义上提供了对于Qmax的任意值的式子。
表6b
如果帧621的序列计数器622的实际值q2等于序列计数器622的目标序列计数器值特别地那么位流610不包含帧611与621之间的拼接点(而仅包含帧率的变化)。在这种情况下,解码***可被配置为不提供拼接检测消息(尽管序列计数器612、622的值的不连续性已被检测到)。另一方面,如果帧621的序列计数器622的实际值q2与序列计数器622的目标序列计数器值(或者,更准确地说,不同,即那么位流610包含帧611与621之间的拼接点(还包括帧率的变化)。在这种情况下,可以提供拼接检测消息。
应当指出,作为替代方案,或者附加地,如以上和/或在权利要求中概述的那样,可直接从帧611的序列计数器612的值q1计算帧621的序列计数器622的目标序列计数器值k(例如,在这种情况下,帧621的序列计数器622的目标序列计数器值k可直接与帧621的序列计数器622的实际值q2相比较,以便确定第一序列和第二序列之间的过渡点是否是拼接点。
因而,解码***可被配置为考虑如下这样的事实,即,作为帧率变化的结果,帧的序列计数器612、622可相差对应于(或依赖于)第二帧率和第一帧率的比K/N的因子。通过这样做,可以提供帧率的无缝切换(而没有由于拼接点的错误检测而导致音频质量劣化)。
位流610内的帧序列的帧率可以是有理数。作为替代方案,或者附加地,位流610的帧的平均长度可以是小数或者可以是有理数。为了实现这种小数帧率和/或帧长度,帧的长度可在位流610内改变。
作为例子,帧率29.97、59.94和119.98fps(帧/秒)可分别导致小数外部帧长度1601.6、800.8和400.4。采样率转换器可通过在子序列内提供更长和更短的帧提供这种小数帧,使得平均地提供小数外部帧长度。在预定数量Z(例如,Z=5)的帧之后,子序列可以重复。换句话说,采样率转换器或编码***可被配置为在子序列内经历Z个不同的帧长度。为了与位流内的解码的开始无关地从位流610、例如从AC-4流产生同一采样输出,采样率转换器的相位可绑定到位流610。
如以上以及表7所示,编码***和/或采样率转换***可产生具有不同的帧长度的帧,以便提供具有小数平均帧长度的帧的序列。某种模式的帧长度或某套帧长度可以(作为子序列)重复,其中,该套帧长度的帧长度的平均值对应于小数平均帧长度。该套帧长度内的位置可被称为位流610的相位。编码***和/或帧率转换***可被配置为“锁定”位流610的相位,即使在拼接点和/或帧率转换点处仍“锁定”位流610的相位。特别地,这可通过将采样率转换器或编码装置的相位锁定到所谓的序列指数来实现。
可基于序列计数器计算序列指数。特别地,可通过使用下式计算序列指数:
sequence_index=sequence_counter mod Z,
其中,sequence_index是特定帧的序列指数的值(指示帧的相位),并且,sequence_counter是特定帧的序列计数器的值。
应当注意,相位数Z可依赖于内部帧长度与其相应的外部帧长度之间的关系,即,相位数Z可依赖于重采样率。作为替代方案,或者附加地,相位数Z可依赖于不同的帧率,即,依赖于内部帧长度与它们的对应的外部帧长度的尺寸。
典型地,音频信号的采样率固定为预定外部采样率(例如,48kHz)。为了允许小数外部帧长度或者帧率,可能需要采样率转换(如在本文件中概括的那样),以便使音频信号适于满足预定的内部帧长度。内部帧长度一般被固定。此外,内部帧长度可依赖于执行的信号处理。作为例子,信号处理可包括QMF(正交镜像滤波器)分析/合成,例如,64子带QMF分析/合成。内部帧长度可依赖于这种信号处理约束,例如,内部帧长度可以是64的倍数(表7所示的例子是这种情况)。为了将音频信号从外部帧长度(可能可变)变换成内部帧长度(一般被固定),可以执行例如从48kHz到46.33kHz的采样率转换(在外部帧长度为1601.6和内部帧长度为1536的情况下)。
表7示出了示例的外部和内部帧长度以及它们与序列指数的关系。
表7
从表7可见,1601.6个采样的小数帧长度可通过使用Z=5个帧的序列(具有一套单独帧长度1601、1602、1601、1602和1602)被实现。帧长度的序列可在位流610被重复,以便提供展现小数帧长度1601.6的位流610。
解码***可被配置为考虑序列指数的值以用于解码,尤其是在拼接点处。特别地,解码***可被配置为基于帧611的序列计数值612的值q1从紧接在拼接点之前的帧的第一序列确定帧611的序列指数的值。可通过使用上式(即,i1=q1mod Z)确定帧611的序列指数的值i1。帧的第一序列的帧611的序列指数的值i1可指示拼接之前的位流610的相位。
为了对于整个位流610确保预定小数帧长度,解码***可在拼接点处被锁定到位流610的相位。特别地,解码***可被配置为将紧接在拼接点之后的帧的第二序列的帧612的序列指数的值i2设定为i2=(i1+1)mod Z。更一般地说,拼接点之后的帧612的序列指数的值i2可基于紧接在前帧611(其在拼接点之前)的序列指数的值i1被确定。
从表7可以看出,依赖于帧611的序列指数的值,存在特定的余数,其中,帧611的余数对应于在帧611的解码(或编码)之后被解码(或编码)的采样的数量与应鉴于小数平均帧长度被解码(或编码)的采样的数量之间的差值。由此,帧611的序列指数的值i1指示这种余数。帧612的序列指数的值i2可基于与帧611的序列指数的值i1相关的余数被确定。
从表2还可以看出,序列指数的值与不同帧率的不同余数值相关。换句话说,不同帧率的余数值被不同地排序。注意,在帧611与612之间的帧率改变的情况下,帧612的序列指数的值i2可如下被确定:
·确定与帧611的序列指数的值i1相关的余数的值r1(在第一帧率下);
·确定与第二帧率下的余数的值r1对应的序列指数的伪值
·将帧612的序列指数的值i2确定为
通过这样做,可在拼接点处和/或在帧率改变的情况下保持位流310的相位。表8示出了示例性帧率比的情况下的序列指数的值。在“前一”帧611与“下一”帧621之间出现帧率变化。
表8
相位的锁定也适用于预定计数器值(例如,计数器值“0”)被用于指示拼接点的存在的情况。序列计数器值“0”可表示所谓的被指示的拼接,其被用于将拼接出现用信号通知给解码***。相关的拼接可以是受控或未受控的拼接,因此可能是无缝的。具有序列计数器值“0”的帧621的序列指数的值可被从前一帧导出。
在帧率在拼接点处保持不变的情况下,序列指数的值可以是连续的,即,i2=(i1+1)mod Z。在帧率改变的情况下,帧621的序列指数的值可如上面概括的那样被确定,例如,通过使用式子Z和/或通过使用表8。
如果具有序列计数器值0的帧是解码***中的第一帧,那么序列计数器值可被假定为Qmax,或者,换句话说,序列指数的值可被假定为0。
一般地,帧n的序列计数器的值可被确定为:
在本文件中描述的方法和***可实现为软件、固件和/或硬件。某些部件可例如实现为在数字信号处理器或微处理器上运行的软件。其它部件可例如实现为硬件或专用集成电路。在描述的方法和***中遇到的信号可存储于诸如随机存取存储器或光学存储介质的介质上。它们可通过诸如无线电网络、卫星网络、无线网络或有线网络的网络(例如,因特网)被传送。利用在本文件中描述的方法和***的典型装置是用于存储和/或呈现音频信号的便携式电子装置或其它消费者设备。

Claims (109)

1.一种用于将输入音频信号(110)重采样为输出音频信号(113)的***(300),该***(300)包括:
-处理单元(301),被配置为通过使用来自被配置为减少输出音频信号(113)的成像和/或混淆的滤波器(102)的滤波器系数(201)的当前子集从输入音频信号(110)的一个或更多个输入采样(204)确定输出音频信号(113)的当前输出采样(203),其中,滤波器系数(201)的当前子集与滤波器(102)的多相结构的相位(121)对应;和
-一个或更多个查找表(302、303),分别在用于确定不同输出采样(203)的滤波器(102)的多相结构的不同相位(121)的相位指数(202)与用于确定紧接在前输出采样(203)的紧接在前相位(121)的相位指数(202)之间提供映射,并且在相位指数(202)与来自滤波器(102)的滤波器系数(201)的相应子集之间提供映射;
其中,处理单元(301)被配置为通过使用一个或更多个查找表(302、303)基于用于紧接在当前输出采样(203)之前的前一输出采样(203)的前一相位指数(202)确定滤波器系数(201)的当前子集。
2.根据权利要求1所述的***(300),其中,
-***(300)包含分别在用于确定不同输出采样(203)的滤波器(102)的多相结构的不同相位(121)的相位指数(202)与用于确定紧接在前输出采样(203)的紧接在前相位(121)的相位指数(202)之间提供映射的相位查找表(302);
-***(300)包含在相位指数(202)与来自滤波器(102)的滤波器系数(201)的相应子集之间提供映射的滤波器查找表(303);
-处理单元(301)被配置为通过使用相位查找表(302)基于用于紧接在当前输出采样(203)之前的前一输出采样(203)的前一相位指数(202)确定当前相位指数(202);以及
-处理单元(301)被配置为通过使用滤波器查找表(303)基于当前相位指数(202)确定滤波器系数(201)的当前子集。
3.根据权利要求2所述的***(300),其中,
-***(300)被配置为根据上采样因子L重采样输入音频信号(110),这里,L大于1;
-多相结构包含L个相位(121);以及
-相位查找表(302)对于L个相位(121)的L个相位指数(202)中的每一个提供到用于紧接在前相位(121)的相位指数(202)的映射。
4.根据权利要求1-3中任一项所述的***(300),其中,***(300)被配置为根据下采样因子M重采样输入音频信号(110),其中M大于1。
5.根据权利要求3所述的***(300),其中,
-滤波器(102)包含N个滤波器系数(201)的全集;以及
-来自过滤器(102)的滤波器系数(201)的子集中的每一个包含N/L个滤波器系数。
6.根据权利要求2或3所述的***(300),其中,相位查找表(302)指示用于确定输出音频信号(113)的输出采样(203)的对应序列的相位指数(202)的序列。
7.根据权利要求3所述的***(300),其中***(300)被配置为根据下采样因子M重采样输入音频信号(110),其中M大于1,其中相位查找表(302)指示用于确定输出音频信号(113)的输出采样(203)的对应序列的相位指数(202)的序列,并且其中相位指数(202)的该序列依赖于上采样因子L和/或下采样因子M。
8.根据权利要求7所述的***(300),其中,处理单元(301)被配置为基于上采样因子L和/或下采样因子M确定相位指数(202)的该序列和/或相位查找表(302)。
9.根据权利要求8所述的***(300),其中,处理单元(301)被配置为:
-确定包含从1到L的升序整数的序列的基本矢量;
-通过将基本矢量级联M次而从基本矢量确定级联矢量;和
-通过从级联矢量选择每第M个条目确定相位指数(202)的该序列。
10.根据权利要求9所述的***(300),其中,处理单元(301)被配置为:
-从相位指数(202)的该序列选择(402、403)第一相位指数(202);
-将第一相位指数(202)增加(404)L或L的倍数,只要增加的第一相位指数小于或等于M即可;
-基于增加的第一相位指数确定(405)相位指数(202)的该序列中的紧接在第一相位指数(202)之后的第二相位指数(202)。
11.根据权利要求10所述的***(300),其中,处理单元(301)被配置为通过从增加的第一相位指数M减去M以产生中间相位指数,来确定第二相位指数(202)。
12.根据权利要求11所述的***(300),其中,处理单元(301)被配置为通过从L+1减去中间相位指数确定第二相位指数(202)。
13.根据权利要求8所述的***(300),其中,处理单元(301)被配置为,通过对于相位指数(202)的该序列中的一对或更多对的相邻的相位指数(202),将相邻相位指数(202)之间的差值确定为Δ=[M MOD L],来确定相位指数(202)的该序列。
14.根据权利要求2或3中的任一项所述的***(300),其中,
-***(300)被配置为根据不同的上采样因子L和/或根据不同的下采样因子M执行重采样;
-相位查找表(302)包含分别用于多个不同的重采样率L/M的多个相位指数对相位指数映射;以及
-滤波器查找表(303)包含分别用于多个不同的重采样率L/M的多个相位指数对滤波器系数子集映射。
15.根据权利要求1到3中任一项所述的***(300),其中,用于多相结构的不同相位(121)的滤波器系数(201)的子集相互排斥。
16.根据权利要求1所述的***(300),其中,
-***包含提供相位指数(202)与来自滤波器(102)的滤波器系数(201)的相应子集之间的映射的合成相位/滤波器查找表;
-合成相位/滤波器查找表的相位指数(202)根据用于确定输出音频信号(113)的输出采样(203)的对应序列的相位指数(202)的序列被排序。
17.根据权利要求16所述的***(300),其中,
-***(300)被配置为根据上采样因子L重采样输入音频信号(110),其中L大于1;
-处理单元(301)被配置为通过在合成相位/滤波器查找表中使用MODULO L指针基于用于紧接在当前输出采样(203)之前的前一输出采样(203)的前一相位指数(202)确定滤波器系数(201)的当前子集。
18.一种用于确定识别重采样滤波器(102)的多相结构的相位(121)的对应序列的相位指数(202)的序列的方法(400),所述重采样滤波器(102)从输入音频信号(110)的输入采样(204)的序列确定重采样音频信号(113)的输出采样(203)的序列,该方法(400)包括:
-从相位指数(202)的该序列选择(402、403)第一相位指数(202);
-将第一相位指数(202)增加(404)上采样因子L或L的倍数,只要增加的第一相位指数小于或等于下采样因子M即可;
-基于增加的第一相位指数确定(405)相位指数(202)的该序列中的紧接在第一相位指数(202)之后的第二相位指数(202)。
19.根据权利要求18所述的方法(400),还包括通过从增加的第一相位指数M减去M以产生中间相位指数,来确定(405)第二相位指数(202)。
20.根据权利要求19所述的方法(400),还包括通过从L+1减去中间相位指数确定(406、407)第二相位指数(202)。
21.一种用于确定识别重采样滤波器(102)的多相结构的相位(121)的对应序列的相位指数(202)的序列的方法,所述重采样滤波器(102)用于从输入音频信号(110)的输入采样(204)的序列确定重采样音频信号(113)的输出采样(203)的序列,该方法包括:
-确定包含从1到上采样因子L的升序整数的序列的基本矢量;
-通过将基本矢量级联M次而从基本矢量确定级联矢量,其中,M是下采样因子;和
-通过从级联矢量选择每第M个条目确定相位指数(202)的该序列。
22.一种用于解码包含多个不同通道(501、502、503、504)的多通道音频信号的音频解码***,其中,多个不同通道(501、502、503、504)包含一个或更多个环绕通道(504),其中,所述音频解码***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频解码***被配置为:
-接收指示多通道音频信号的位流;
-确定是否满足第一条件和第二条件,其中,第一条件包含多通道音频信号要被下混到减少数量的通道,其中,第二条件包含确定所述一个或更多个环绕通道(504)已相对于所述多个不同通道(501、502、503、5604)中的其它通道中的一个或更多个相移;和
-在满足第一条件的情况下以及在不满足第二条件的情况下,向所述一个或更多个环绕通道(504)施加相移以产生一个或更多个相移的环绕通道。
23.根据权利要求22所述的音频解码***,其中,音频解码***被配置为向一个或更多个环绕通道(504)相对于所述多个不同通道(501、502、503、504)中的所述其它通道中的一个或更多个施加90度相移。
24.根据权利要求22~23中的任一项所述的音频解码***,其中,音频解码***被配置为:
-只有在满足第一条件的情况下以及在不满足第二条件的情况下,才向一个或更多个环绕通道(504)施加相移;和
-否则,使一个或更多个环绕通道(504)的相位保持不变。
25.根据权利要求22~23中的任一项所述的音频解码***,进一步被配置为解码位流中的一些或全部以提供多通道音频信号。
26.根据权利要求22~23中的任一项所述的音频解码***,进一步被配置为通过使用矩阵编码从多通道音频信号确定下混音频信号,其中,下混音频信号包含比多通道音频信号少的通道。
27.根据权利要求26所述的音频解码***,进一步被配置为:
-使一个或更多个相移的环绕通道(504)衰减以产生一个或更多个衰减的环绕通道;
-将一个或更多个衰减的环绕通道与多个不同通道(501、502、503、504)中的所述其它通道中的一个或更多个相组合,以产生下混音频信号的一个或更多个通道。
28.一种用于将包含多个不同通道(501、502、503、504)的多通道音频信号编码成位流的音频编码***,其中,多个不同通道(501、502、503、504)包含一个或更多个环绕通道(504),其中,所述音频编码***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频编码***被配置为:
-确定所述一个或更多个环绕通道(504)已相对于多个不同通道(501、502、503、504)中的其它通道中的一个或更多个相移的事实的概率;
-如果所确定的概率超过预定概率阈值,则将对于所述一个或更多个环绕通道(504)已相对于多个不同通道(501、502、503、504)中的所述其它通道中的一个或更多个相移这一事实的指示***到位流中。
29.根据权利要求28所述的音频编码***,其中,确定概率包含分析多个不同通道(501、502、503、504)的音频内容。
30.根据权利要求29所述的音频编码***,其中,确定概率包含分析多个不同通道(501、502、503、504)的音频内容的谱和比较不同通道之间的谱的相位。
31.根据权利要求28~30中的任一项所述的音频编码***,其中,所述指示包含位流的预定位或标记。
32.一种用于解码包含多个不同通道(501、502、503、504)的多通道音频信号的方法,其中,多个不同通道(501、502、503、504)包含一个或更多个环绕通道(504),其中,所述方法包括:
-接收指示多通道音频信号的位流;
-确定是否满足第一条件和第二条件,其中,第一条件包含多通道音频信号要被下混到减少数量的通道,其中,第二条件包含确定所述一个或更多个环绕通道(504)已相对于所述多个不同通道(501、502、503、5604)中的其它通道中的一个或更多个相移;和
-在满足第一条件的情况下以及在不满足第二条件的情况下,向所述一个或更多个环绕通道(504)施加相移以产生一个或更多个相移的环绕通道。
33.一种用于将包含多个不同通道(501、502、503、504)的多通道音频信号编码成位流的方法,其中,多个不同通道(501、502、503、504)包含一个或更多个环绕通道(504),其中,所述方法包括:
-确定所述一个或更多个环绕通道(504)已相对于多个不同通道(501、502、503、504)中的其它通道中的一个或更多个相移的事实的概率;
-如果所确定的概率超过预定概率阈值,则将对于所述一个或更多个环绕通道(504)已相对于多个不同通道(501、502、503、504)中的所述其它通道中的一个或更多个相移这一事实的指示***到位流中。
34.一种用于将包含音频帧的序列的音频信号编码成包含位流帧(601)的对应序列的位流(600)的音频编码***,其中,所述音频编码***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频编码***被配置为:
-提供用于音频帧的对应序列的子流帧(603)的第一序列;
-提供用于音频帧的对应序列的子流帧(603)的第二序列;
-确定位流帧(601)的序列以使得位流帧(601)在位流帧(601)内的不同位置包含来自第一序列和第二序列的对应子流帧(603);和
-将控制信息(602)***位流帧(601)的序列中的一个位流帧(601)中,其中,控制信息(602)指示包含于该位流帧(601)内的子流帧(603)的位置和/或表示。
35.根据权利要求34所述的音频编码***,其中,第一序列和第二序列包含音频帧的同一序列的不同表示。
36.根据权利要求35所述的音频编码***,其中,表示包含:
-表示音频信号的通道的数量;和/或
-子流帧(603)的序列的位率。
37.根据权利要求34~36中的任一项所述的音频编码***,其中,控制信息(602)包含分别用于第一序列和第二序列的第一控制信息和第二控制信息(602)。
38.根据权利要求37所述的音频编码***,进一步被配置为通过使用不同长度的代码字编码第一控制信息和第二控制信息(602);其中,分别用于编码第一控制信息和第二控制信息(602)的代码字的长度分别依赖于第一序列和第二序列的位率。
39.根据权利要求38所述的音频编码***,其中,如果第一序列的位率比第二序列的位率高,则用于编码第一控制信息(602)的一个或更多个代码字的长度比用于编码第二控制信息(602)的一个或更多个代码字的长度长,并且/或者,反之亦然。
40.根据权利要求38~39中的任一项所述的音频编码***,其中,音频编码***被配置为通过使用可变长度代码对第一控制信息和第二控制信息(602)进行编码,使得如果子流帧(603)的第一序列平均地包含比子流帧(603)的第二序列多的位数,那么第一控制信息(602)平均地包含比第二控制信息(602)多的位数,反之亦然。
41.根据权利要求38~39中的任一项所述的音频编码***,其中,音频编码***被配置为通过使用可变长度代码对第一控制信息和第二控制信息(602)进行编码,使得分别由于第一控制信息和第二控制信息(602)导致的子流帧(603)的第一序列和第二序列的相对开销之间的差值减小。
42.一种音频处理***,包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频处理***被配置为:
-接收包含位流帧(601)的对应序列的输入位流(600);其中,位流帧(601)在位流帧(601)内的不同位置包含来自子流帧(603)的第一序列和第二序列的对应子流帧(603);其中,位流帧(601)的序列中的一个位流帧(601)包含指示包含于该位流帧(601)内的子流帧(603)的位置和/或表示的控制信息(602);和
-通过使用控制信息(602)从位流帧(601)的序列提取子流帧(603)的第一序列和/或第二序列。
43.根据权利要求42所述的音频处理***,进一步被配置为从位流帧(601)的序列提取子流帧(603)的第一序列,而不必解码子流帧(603)的第一序列和/或不必解码子流帧(603)的第二序列。
44.根据权利要求42~43中的任一项所述的音频处理***,进一步被配置为:
-将第一序列中的子流帧(603)***到输出位流(600)的位流帧(601)的对应序列中;和
-将控制信息(602)***输出位流(600)的位流帧(601)中。
45.根据权利要求42~43中的任一项所述的音频处理***,其中,第一序列和第二序列包含音频帧的同一序列的不同表示。
46.一种用于将包含音频帧的序列的音频信号编码成包含位流帧(601)的对应序列的位流(600)的方法,其中,该方法包括:
-提供用于音频帧的对应序列的子流帧(603)的第一序列;
-提供用于音频帧的对应序列的子流帧(603)的第二序列;
-确定位流帧(601)的序列以使得位流帧(601)在位流帧(601)内的不同位置包含来自第一序列和第二序列的对应子流帧(603);和
-将控制信息(602)***位流帧(601)的序列中的一个位流帧(601)中,其中,控制信息(602)指示包含于该位流帧(601)内的子流帧(603)的位置和/或表示。
47.一种用于处理指示包含音频帧的序列的音频信号的位流的方法,该方法包括:
-接收包含位流帧(601)的对应序列的输入位流(600);其中,位流帧(601)在位流帧(601)内的不同位置包含来自子流帧(603)的第一序列和第二序列的对应子流帧(603);其中,位流帧(601)的序列中的一个位流帧(601)包含指示包含于该位流帧(601)内的子流帧(603)的位置和/或表示的控制信息(602);和
-通过使用控制信息(602)从位流帧(601)的序列提取子流帧(603)的第一序列和/或第二序列。
48.一种用于处理包含位流帧(611、621)的对应序列的位流(610)的音频处理***,其中,位流帧(611、621)的序列指示音频信号的音频帧的对应序列,其中,所述音频处理***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频处理***被配置为:
-分别对于位流帧(611、621)的序列产生计数值的序列;以及
-将来自计数值的序列中的计数值***来自位流帧(611、621)的序列中的位流帧(611、621)中,使得位流帧(611、621)的计数值指示位流帧(611、621)的序列内的位流帧(611、621)的顺序次序。
49.根据权利要求48所述的音频处理***,其中,位流帧(611、621)还包含指示音频信号的对应音频帧的有效载荷数据(613)。
50.根据权利要求48~49中的任一项所述的音频处理***,其中,计数值被定位在位流帧(611、621)内的预定位置。
51.根据权利要求48~49中的任一项所述的音频处理***,其中,计数值的序列包含被顺序排序的计数值。
52.根据权利要求48~49中的任一项所述的音频处理***,其中,
-计数值包含最小值和最大值;和
-在计数值的序列内最小值跟在最大值后面,或者,反之亦然。
53.一种用于从包含位流帧(611、621)的对应的第一序列的第一位流(610)和包含位流帧(611、621)的对应的第二序列的第二位流(610)产生拼接位流(610)的音频处理***,其中,位流帧(611、621)的第一序列指示第一音频信号的音频帧的对应的第一序列;其中,位流帧(611、621)的第二序列指示第二音频信号的音频帧的对应的第二序列;其中,第二音频信号与第一音频信号不同;其中,位流帧(611、621)的第一序列中的位流帧(611、621)包含指示位流帧(611、621)的第一序列内的位流帧(611、621)的顺序次序的第一计数值;其中,位流帧(611、621)的第二序列中的位流帧(611、621)包含指示位流帧(611、621)的第二序列内的位流帧(611、621)的顺序次序的第二计数值;其中,所述音频处理***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频处理***被配置为:
-在来自位流帧(611、621)的第一序列的特定位流帧(611)处截短第一位流,以提供截短位流;和
-将截短位流与位流帧(611、621)的第二序列进行级联,以提供拼接位流(610);其中,拼接位流(610)内的特定位流帧(611)的第一计数值和/或跟在特定位流帧(611)后面的位流帧(621)的第二计数值指示第一位流和第二位流(610)之间的拼接点。
54.根据权利要求53所述的音频处理***,其中,拼接位流(610)内的特定位流帧(611)的第一计数值与跟在特定位流帧(611)后面的位流帧(621)的第二计数值之间的不连续性指示第一和第二位流(610)之间的拼接点。
55.根据权利要求53所述的音频处理***,进一步被配置为:
-将拼接位流(610)内的跟在特定位流帧(611)后面的位流帧(621)的第二计数值设定为预定计数值。
56.根据权利要求55所述的音频处理***,其中,
-第一计数值和第二计数值取得来自最小值与最大值之间的计数值范围的值;以及
-预定计数值在所述计数值范围之外。
57.根据权利要求56所述的音频处理***,其中,
-最小值是“1”;以及
-预定计数值是“0”。
58.一种用于解码包含位流帧(611、621)的第一序列和第二序列的级联的拼接位流(610)的音频解码***;其中,第一序列和第二序列分别指示第一音频信号和第二音频信号;其中,位流帧(611、621)的第一序列中的位流帧(611、621)包含指示位流帧(611、621)的第一序列内的位流帧(611、621)的顺序次序的第一计数值;其中,位流帧(611、621)的第二序列中的位流帧(611、621)包含指示位流帧(611、621)的第二序列内的位流帧(611、621)的顺序次序的第二计数值;其中,所述音频解码***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频解码***被配置为:
-基于第一计数值和第二计数值检测第一序列和第二序列之间的拼接点;
-确定正确地解码在拼接点之后的拼接位流(610)的位流帧(621)所需要的数据是否可用;
-如果数据不可用,则暂停在拼接点之后的拼接位流(610)的位流帧(621)的解码。
59.根据权利要求58所述的音频解码***,进一步被配置为基于相邻位流帧(611、621)的计数值的不连续性和/或基于具有预定计数值的计数值来检测拼接点。
60.根据权利要求58~59中的任一项所述的音频解码***,其中,正确地解码位流帧(621)所需要的数据包含用于解码位流帧的第二序列的解码方案的设定。
61.根据权利要求58~59中的任一项所述的音频解码***,其中,音频解码***被配置为暂停在拼接点之后的位流帧(621)的解码,直到对于其正确解码所需要的数据可用的拼接位流(610)的位流帧。
62.根据权利要求58~59中的任一项所述的音频解码***,其中,音频解码***被配置为提供指示已暂停解码的位流帧(621)的静默的音频帧。
63.一种用于使得能够检测包含位流帧(611、621)的序列的位流(610)的拼接的方法;其中,位流帧(611、621)的序列指示音频信号的音频帧的对应序列;其中,所述方法包括:
-分别产生用于位流帧(611、621)的序列的计数值的序列;和
-将来自计数值的序列中的计数值作为控制信息(612、622)***来自位流帧(611、621)的序列中的位流帧(611、621)中,使得位流帧(611、621)的控制信息(612、622)指示位流帧(611、621)的序列内的位流帧(611、621)的顺序次序。
64.一种用于产生指示拼接点的拼接位流(610)的方法;其中,所述方法包含:
-在来自位流帧(611、621)的第一序列的特定位流帧(611)处截短第一位流,以提供截短位流;其中,位流帧(611、621)的第一序列指示第一音频信号的音频帧的对应的第一序列;其中,位流帧(611、621)的第一序列中的位流帧(611、621)包含指示位流帧(611、621)的第一序列内的位流帧(611、621)的顺序次序的第一计数值;和
-级联截短位流与包含位流帧(611、621)的第二序列的第二位流(610),以提供拼接位流(610);其中,位流帧(611、621)的第二序列指示第二音频信号的音频帧的对应的第二序列;其中,第二音频信号与第一音频信号不同;其中,位流帧(611、621)的第二序列中的位流帧(611、621)包含指示位流帧(611、621)的第二序列内的位流帧(611、621)的顺序次序的第二计数值;其中,拼接位流(610)内的特定位流帧(611)的第一计数值和/或跟在特定位流帧(611)后面的位流帧(621)的第二计数值指示第一和第二位流(610)之间的拼接点。
65.一种用于解码包含位流帧(611、621)的第一序列和第二序列的级联的拼接位流(610)的方法;其中,第一序列和第二序列分别指示第一音频信号和第二音频信号;其中,位流帧(611、621)的第一序列中的位流帧(611、621)包含指示位流帧(611、621)的第一序列内的位流帧(611、621)的顺序次序的第一计数值;其中,位流帧(611、621)的第二序列中的位流帧(611、621)包含指示位流帧(611、621)的第二序列内的位流帧(611、621)的顺序次序的第二计数值;其中,所述方法包含:
-基于第一计数值和第二计数值检测第一序列和第二序列之间的拼接点;
-确定正确地解码在拼接点之后的拼接位流(610)的位流帧(621)所需要的数据是否可用;
-如果数据不可用,则暂停在拼接点之后的拼接位流(610)的位流帧(621)的解码。
66.一种用于处理包含位流帧(611、621)的第一序列和第二序列的级联的位流(610)的音频处理***;其中,第一序列和第二序列指示一个或更多个音频信号;其中,位流帧(611)的第一序列中的位流帧(611、621)包含指示位流帧(611)的第一序列内的位流帧(611)的顺序次序的第一计数值;其中,第一序列包含具有预定的一套帧长度的位流帧的第一子序列,使得第一子序列中的位流帧展现第一预定平均帧长度;其中,位流帧(621)的第二序列中的位流帧(621)包含指示位流帧(621)的第二序列内的位流帧(621)的顺序次序的第二计数值;其中,第二序列包含具有预定的一套帧长度的位流帧的第二子序列,使得第二子序列中的位流帧展现第二预定平均帧长度;其中,所述音频处理***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频处理***被配置为:
-检测第一序列和第二序列之间的过渡点;
-确定紧接在过渡点之前的得自位流帧(611)的第一序列的第一位流帧(611);
-基于第一位流帧(611)的第一计数值q1确定第一位流帧(611)的序列指数值i1;其中,序列指数值i1指示第一子序列内的第一位流帧(611)的位置;
-确定紧接在过渡点之后的得自位流帧(621)的第二序列的第二位流帧(621);和
-基于第一位流帧(611)的序列指数值i1确定第二位流帧(621)的序列指数值i2;其中,序列指数值i2指示第二子序列内的第二位流帧(621)的位置。
67.根据权利要求66所述的音频处理***,其中,
-第一位流帧(611)的序列指数值i1被确定为i1=q1mod Z;以及
-Z是第一序列内的位流帧的数量。
68.根据权利要求66~67中的任一项所述的音频处理***,其中,
-过渡点是拼接点;以及
-过渡点基于第一计数值和/或第二计数值被检测。
69.根据权利要求68所述的音频处理***,其中,过渡点基于第二位流帧(621)的第二计数值被检测。
70.根据权利要求69所述的音频处理***,其中,过渡点基于具有预定计数值的第二位流帧(621)的第二计数值被检测。
71.根据权利要求66~67中的任一项所述的音频处理***,其中,
-第一预定平均帧长度是有理数且不是整数;
-第一子序列的位流帧的该预定的一套帧长度是整数;
-第二预定平均帧长度是有理数且不是整数;以及
-第二子序列的位流帧的该预定的一套帧长度是整数。
72.根据权利要求66~67中的任一项所述的音频处理***,其中,第一预定平均帧长度与第二预定平均帧长度不同。
73.根据权利要求66~67中的任一项所述的音频处理***,其中,
-第一位流帧(611)的序列指数值i1与第一余数值r1相关;
-第一余数值r1指示第一子序列中的直到第一位流帧(611)的位流帧的中间平均帧长度与第一预定平均帧长度之间的差值;
-音频处理***被配置为基于第一余数值r1以及基于第二预定平均帧长度确定第一伪序列指数值以及
-第二位流帧(621)的序列指数值i2基于伪序列指数值被确定。
74.根据权利要求73所述的音频处理***,其中,
-第二位流帧(621)的序列指数值i2被确定为以及
-Z是第二序列的位流帧的数量。
75.根据权利要求66~67中的任一项所述的音频处理***,其中,
-N是第一预定平均帧长度;
-K是第二预定平均帧长度;
-比值K/N或比值N/K是大于1的整数。
76.一种用于处理包含位流帧(611、621)的第一序列和第二序列的级联的位流(610)的音频处理***;其中,第一序列和第二序列指示一个或更多个音频信号;其中,位流帧(611)的第一序列中的位流帧(611)包含指示位流帧(611)的第一序列内的位流帧(611)的顺序次序的第一计数值;其中,第一序列展现第一平均帧长度;其中,位流帧(621)的第二序列中的位流帧(621)包含指示位流帧(621)的第二序列内的位流帧(621)的顺序次序的第二计数值;其中,第二序列展现第二平均帧长度;其中,所述音频处理***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由所述处理器执行时使得所述音频处理***被配置为:
-检测第一序列和第二序列之间的过渡点;
-确定紧接在过渡点之前的得自位流帧(611,621)的第一序列的第一位流帧(611);
-确定第一位流帧(611)的第一计数值q1
-确定紧接在过渡点之后的得自位流帧(621)的第二序列的第二位流帧(621);
-确定第二位流帧(621)的第二计数值q2;和
-基于第一计数值q1、第二计数值q2、第一平均帧长度和第二平均帧长度来确定过渡点是否是拼接点。
77.根据权利要求76所述的音频处理***,其中,音频处理***被配置为:
-基于第一计数值q1、第一平均帧长度和第二平均帧长度确定第二位流帧(621)的目标计数值k;和
-比较目标计数值k与第二计数值q2,以确定过渡点是否是拼接点。
78.根据权利要求77所述的音频处理***,其中,音频处理***被配置为还基于第一计数值的最大值Qmax和/或最小值Qmin确定第二位流帧(621)的目标计数值k。
79.根据权利要求78所述的音频处理***,其中,
-N是第一平均帧长度;
-K是第二平均帧长度;
-比值K/N是大于1的整数;以及
-目标计数值k被确定为:
80.根据权利要求77~79中的任一项所述的音频处理***,其中,音频处理***被配置为,如果目标计数值k与第二计数值q2不同,则确定过渡点为拼接点。
81.一种用于处理包含位流帧(611、621)的第一序列和第二序列的级联的位流(610)的方法;其中,第一序列和第二序列指示一个或更多个音频信号;其中,位流帧(611)的第一序列中的位流帧(611)包含指示位流帧(611)的第一序列内的位流帧(611)的顺序次序的第一计数值;其中,第一序列包含具有预定的一套帧长度的位流帧的第一子序列,使得第一子序列中的位流帧展现第一预定平均帧长度;其中,位流帧(621)的第二序列中的位流帧(621)包含指示位流帧(621)的第二序列内的位流帧(621)的顺序次序的第二计数值;其中,第二序列包含具有预定的一套帧长度的位流帧的第二子序列,使得第二子序列中的位流帧展现第二预定平均帧长度;其中,所述方法包括:
-检测第一序列和第二序列之间的过渡点;
-从紧接在过渡点之前的位流帧(611)的第一序列确定第一位流帧(611);
-基于第一位流帧(611)的第一计数值q1确定第一位流帧(611)的序列指数值i1;其中,序列指数值i1指示第一子序列内的第一位流帧(611)的位置;
-从紧接在过渡点之后的位流帧(621)的第二序列确定第二位流帧(621);和
-基于第一位流帧(611)的序列指数值i1确定第二位流帧(621)的序列指数值i2;其中,序列指数值i2指示第二子序列内的第二位流帧(621)的位置。
82.一种用于处理包含位流帧(611、621)的第一序列和第二序列的级联的位流(610)的方法;其中,第一序列和第二序列指示一个或更多个音频信号;其中,位流帧(611)的第一序列中的位流帧(611)包含指示位流帧(611)的第一序列内的位流帧(611)的顺序次序的第一计数值;其中,第一序列展现第一平均帧长度;其中,位流帧(621)的第二序列中的位流帧(621)包含指示位流帧(621)的第二序列内的位流帧(621)的顺序次序的第二计数值;其中,第二序列展现第二平均帧长度;其中,所述方法包括:
-检测第一序列和第二序列之间的过渡点;
-从紧接在过渡点之前的位流帧(611)的第一序列确定第一位流帧(611);
-确定第一位流帧(611)的第一计数值q1
-从紧接在过渡点之后的位流帧(621)的第二序列确定第二位流帧(621);
-确定第二位流帧(621)的第二计数值q2;和
-基于第一计数值q1、第二计数值q2、第一平均帧长度和第二平均帧长度来确定过渡点是否是拼接点。
83.一种用于确定识别重采样滤波器(102)的多相结构的相位(121)的对应序列的相位指数(202)的序列的设备,所述重采样滤波器(102)用于从输入音频信号(110)的输入采样(204)的序列确定重采样音频信号(113)的输出采样(203)的序列,所述设备包括:
用于从相位指数(202)的该序列选择第一相位指数(202)的装置;
用于将第一相位指数(202)增加上采样因子L或L的倍数的装置,只要增加的第一相位指数小于或等于下采样因子M即可;
用于基于增加的第一相位指数确定相位指数(202)的该序列中的紧接在第一相位指数(202)之后的第二相位指数(202)的装置。
84.一种用于确定识别重采样滤波器(102)的多相结构的相位(121)的对应序列的相位指数(202)的序列的设备,所述重采样滤波器(102)用于从输入音频信号(110)的输入采样(204)的序列确定重采样音频信号(113)的输出采样(203)的序列,所述设备包括:
用于确定包含从1到上采样因子L的升序整数的序列的基本矢量的装置;
用于通过将基本矢量级联M次而从基本矢量确定级联矢量的装置,其中,M是下采样因子;和
用于通过从级联矢量选择每第M个条目确定相位指数(202)的该序列的装置。
85.一种用于解码包含多个不同通道(501、502、503、504)的多通道音频信号的设备,其中,多个不同通道(501、502、503、504)包含一个或更多个环绕通道(504),其中,所述设备包括:
用于接收指示多通道音频信号的位流的装置;
用于确定是否满足第一条件和第二条件的装置,其中,第一条件包含多通道音频信号要被下混到减少数量的通道,其中,第二条件包含确定所述一个或更多个环绕通道(504)已相对于所述多个不同通道(501、502、503、5604)中的其它通道中的一个或更多个相移;和
用于在满足第一条件的情况下以及在不满足第二条件的情况下,向所述一个或更多个环绕通道(504)施加相移以产生一个或更多个相移的环绕通道的装置。
86.一种用于将包含多个不同通道(501、502、503、504)的多通道音频信号编码成位流的设备,其中,多个不同通道(501、502、503、504)包含一个或更多个环绕通道(504),其中,所述设备包括:
用于确定所述一个或更多个环绕通道(504)已相对于多个不同通道(501、502、503、504)中的其它通道中的一个或更多个相移的事实的概率的装置;
用于如果所确定的概率超过预定概率阈值,则将对于所述一个或更多个环绕通道(504)已相对于多个不同通道(501、502、503、504)中的所述其它通道中的一个或更多个相移这一事实的指示***到位流中的装置。
87.一种用于将包含音频帧的序列的音频信号编码成包含位流帧(601)的对应序列的位流(600)的设备,其中,所述设备包括:
用于提供用于音频帧的对应序列的子流帧(603)的第一序列的装置;
用于提供用于音频帧的对应序列的子流帧(603)的第二序列的装置;
用于确定位流帧(601)的序列以使得位流帧(601)在位流帧(601)内的不同位置包含来自第一序列和第二序列的对应子流帧(603)的装置;和
用于将控制信息(602)***位流帧(601)的序列中的一个位流帧(601)中的装置,其中,控制信息(602)指示包含于该位流帧(601)内的子流帧(603)的位置和/或表示。
88.一种用于处理指示包含音频帧的序列的音频信号的位流的设备,包括:
用于接收包含位流帧(601)的对应序列的输入位流(600)的装置;其中,位流帧(601)在位流帧(601)内的不同位置包含来自子流帧(603)的第一序列和第二序列的对应子流帧(603);其中,位流帧(601)的序列中的一个位流帧(601)包含指示包含于该位流帧(601)内的子流帧(603)的位置和/或表示的控制信息(602);和
用于通过使用控制信息(602)从位流帧(601)的序列提取子流帧(603)的第一序列和/或第二序列的装置。
89.一种用于使得能够检测包含位流帧(611、621)的序列的位流(610)的拼接的设备;其中,位流帧(611、612621)的序列指示音频信号的音频帧的对应序列;其中,所述设备包括:
用于分别产生用于位流帧(611、621)的序列的计数值的序列的装置;和
用于将来自计数值的序列中的计数值作为控制信息(612、622)***来自位流帧(611、621)的序列中的位流帧(611、621)中,使得位流帧(611、621)的控制信息(612、622)指示位流帧(611、621)的序列内的位流帧(611、621)的顺序次序的装置。
90.一种用于产生指示拼接点的拼接位流(610)的设备;其中,所述设备包含:
用于在来自位流帧(611、621)的第一序列的特定位流帧(611)处截短第一位流,以提供截短位流的装置;其中,位流帧(611、621)的第一序列指示第一音频信号的音频帧的对应的第一序列;其中,位流帧(611、621)的第一序列中的位流帧(611、621)包含指示位流帧(611、621)的第一序列内的位流帧(611、621)的顺序次序的第一计数值;和
用于级联截短位流与包含位流帧(611、621)的第二序列的第二位流(610),以提供拼接位流(610)的装置;其中,位流帧(611、621)的第二序列指示第二音频信号的音频帧的对应的第二序列;其中,第二音频信号与第一音频信号不同;其中,位流帧(611、621)的第二序列中的位流帧(611、621)包含指示位流帧(611、621)的第二序列内的位流帧(611、621)的顺序次序的第二计数值;其中,拼接位流(610)内的特定位流帧(611)的第一计数值和/或跟在特定位流帧(611)后面的位流帧(621)的第二计数值指示第一和第二位流(610)之间的拼接点。
91.一种用于解码包含位流帧(611、621)的第一序列和第二序列的级联的拼接位流(610)的设备;其中,第一序列和第二序列分别指示第一音频信号和第二音频信号;其中,位流帧(611、621)的第一序列中的位流帧(611、621)包含指示位流帧(611、621)的第一序列内的位流帧(611、621)的顺序次序的第一计数值;其中,位流帧(611、621)的第二序列中的位流帧(611、621)包含指示位流帧(611、621)的第二序列内的位流帧(611、621)的顺序次序的第二计数值;其中,所述设备包含:
用于基于第一计数值和第二计数值检测第一序列和第二序列之间的拼接点的装置;
用于确定正确地解码在拼接点之后的拼接位流(610)的位流帧(621)所需要的数据是否可用的装置;
用于如果数据不可用,则暂停在拼接点之后的拼接位流(610)的位流帧(621)的解码的装置。
92.一种用于处理包含位流帧(611、621)的第一序列和第二序列的级联的位流(610)的设备;其中,第一序列和第二序列指示一个或更多个音频信号;其中,位流帧(611)的第一序列中的位流帧(611、621)包含指示位流帧(611)的第一序列内的位流帧(611)的顺序次序的第一计数值;其中,第一序列包含具有预定的一套帧长度的位流帧的第一子序列,使得第一子序列中的位流帧展现第一预定平均帧长度;其中,位流帧(621)的第二序列中的位流帧(621)包含指示位流帧(621)的第二序列内的位流帧(621)的顺序次序的第二计数值;其中,第二序列包含具有预定的一套帧长度的位流帧的第二子序列,使得第二子序列中的位流帧展现第二预定平均帧长度;其中,所述设备包括:
用于检测第一序列和第二序列之间的过渡点的装置;
用于确定紧接在过渡点之前的得自位流帧(611)的第一序列的第一位流帧(611)的装置;
用于基于第一位流帧(611)的第一计数值q1确定第一位流帧(611)的序列指数值i1的装置;其中,序列指数值i1指示第一子序列内的第一位流帧(611)的位置;
用于确定紧接在过渡点之后的得自位流帧(621)的第二序列的第二位流帧(621)的装置;和
用于基于第一位流帧(611)的序列指数值i1确定第二位流帧(621)的序列指数值i2的装置;其中,序列指数值i2指示第二子序列内的第二位流帧(621)的位置。
93.一种用于处理包含位流帧(611、621)的第一序列和第二序列的级联的位流(610)的设备;其中,第一序列和第二序列指示一个或更多个音频信号;其中,位流帧(611)的第一序列中的位流帧(611)包含指示位流帧(611)的第一序列内的位流帧(611)的顺序次序的第一计数值;其中,第一序列展现第一平均帧长度;其中,位流帧(621)的第二序列中的位流帧(621)包含指示位流帧(621)的第二序列内的位流帧(621)的顺序次序的第二计数值;其中,第二序列展现第二平均帧长度;其中,所述设备包括:
用于检测第一序列和第二序列之间的过渡点的装置;
用于确定紧接在过渡点之前的得自位流帧(611,621)的第一序列的第一位流帧(611)的装置;
用于确定第一位流帧(611)的第一计数值q1的装置;
用于确定紧接在过渡点之后的得自位流帧(621)的第二序列的第二位流帧(621)的装置;
用于确定第二位流帧(621)的第二计数值q2的装置;和
用于基于第一计数值q1、第二计数值q2、第一平均帧长度和第二平均帧长度来确定过渡点是否是拼接点的装置。
94.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器通过以下来将输入音频信号(110)重采样为输出音频信号(113):
-通过使用来自被配置为减少输出音频信号(113)的成像和/或混淆的滤波器(102)的滤波器系数(201)的当前子集从输入音频信号(110)的一个或更多个输入采样(204)确定输出音频信号(113)的当前输出采样(203),其中,滤波器系数(201)的当前子集与滤波器(102)的多相结构的相位(121)对应;和
-通过使用一个或更多个查找表(302、303)基于用于紧接在当前输出采样(203)之前的前一输出采样(203)的前一相位指数(202)确定滤波器系数(201)的当前子集,其中,所述一个或更多个查找表(302、303),分别在用于确定不同输出采样(203)的滤波器(102)的多相结构的不同相位(121)的相位指数(202)与用于确定紧接在前输出采样(203)的紧接在前相位(121)的相位指数(202)之间提供映射,并且在相位指数(202)与来自滤波器(102)的滤波器系数(201)的相应子集之间提供映射。
95.一种用于将输入音频信号(110)重采样为输出音频信号(113)的方法,所述方法包括:
-通过使用来自被配置为减少输出音频信号(113)的成像和/或混淆的滤波器(102)的滤波器系数(201)的当前子集从输入音频信号(110)的一个或更多个输入采样(204)确定输出音频信号(113)的当前输出采样(203),其中,滤波器系数(201)的当前子集与滤波器(102)的多相结构的相位(121)对应;和
-通过使用一个或更多个查找表(302、303)基于用于紧接在当前输出采样(203)之前的前一输出采样(203)的前一相位指数(202)确定滤波器系数(201)的当前子集,其中,所述一个或更多个查找表(302、303),分别在用于确定不同输出采样(203)的滤波器(102)的多相结构的不同相位(121)的相位指数(202)与用于确定紧接在前输出采样(203)的紧接在前相位(121)的相位指数(202)之间提供映射,并且在相位指数(202)与来自滤波器(102)的滤波器系数(201)的相应子集之间提供映射。
96.一种用于将输入音频信号(110)重采样为输出音频信号(113)的设备,所述设备包括:
用于通过使用来自被配置为减少输出音频信号(113)的成像和/或混淆的滤波器(102)的滤波器系数(201)的当前子集从输入音频信号(110)的一个或更多个输入采样(204)确定输出音频信号(113)的当前输出采样(203)的装置,其中,滤波器系数(201)的当前子集与滤波器(102)的多相结构的相位(121)对应;和
用于通过使用一个或更多个查找表(302、303)基于用于紧接在当前输出采样(203)之前的前一输出采样(203)的前一相位指数(202)确定滤波器系数(201)的当前子集的装置,其中,所述一个或更多个查找表(302、303),分别在用于确定不同输出采样(203)的滤波器(102)的多相结构的不同相位(121)的相位指数(202)与用于确定紧接在前输出采样(203)的紧接在前相位(121)的相位指数(202)之间提供映射,并且在相位指数(202)与来自滤波器(102)的滤波器系数(201)的相应子集之间提供映射。
97.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器通过以下来解码包含多个不同通道(501、502、503、504)的多通道音频信号,其中,多个不同通道(501、502、503、504)包含一个或更多个环绕通道(504):
-接收指示多通道音频信号的位流;
-确定是否满足第一条件和第二条件,其中,第一条件包含多通道音频信号要被下混到减少数量的通道,其中,第二条件包含确定所述一个或更多个环绕通道(504)已相对于所述多个不同通道(501、502、503、5604)中的其它通道中的一个或更多个相移;和
-在满足第一条件的情况下以及在不满足第二条件的情况下,向所述一个或更多个环绕通道(504)施加相移以产生一个或更多个相移的环绕通道。
98.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器通过以下来将包含多个不同通道(501、502、503、504)的多通道音频信号编码成位流,其中,多个不同通道(501、502、503、504)包含一个或更多个环绕通道(504):
-确定所述一个或更多个环绕通道(504)已相对于多个不同通道(501、502、503、504)中的其它通道中的一个或更多个相移的事实的概率;
-如果所确定的概率超过预定概率阈值,则将对于所述一个或更多个环绕通道(504)已相对于多个不同通道(501、502、503、504)中的所述其它通道中的一个或更多个相移这一事实的指示***到位流中。
99.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器通过以下来将包含音频帧的序列的音频信号编码成包含位流帧(601)的对应序列的位流(600):
-提供用于音频帧的对应序列的子流帧(603)的第一序列;
-提供用于音频帧的对应序列的子流帧(603)的第二序列;
-确定位流帧(601)的序列以使得位流帧(601)在位流帧(601)内的不同位置包含来自第一序列和第二序列的对应子流帧(603);和
-将控制信息(602)***位流帧(601)的序列中的一个位流帧(601)中,其中,控制信息(602)指示包含于该位流帧(601)内的子流帧(603)的位置和/或表示。
100.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器:
-接收包含位流帧(601)的对应序列的输入位流(600);其中,位流帧(601)在位流帧(601)内的不同位置包含来自子流帧(603)的第一序列和第二序列的对应子流帧(603);其中,位流帧(601)的序列中的一个位流帧(601)包含指示包含于该位流帧(601)内的子流帧(603)的位置和/或表示的控制信息(602);和
-通过使用控制信息(602)从位流帧(601)的序列提取子流帧(603)的第一序列和/或第二序列。
101.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器来处理包含位流帧(611、621)的对应序列的位流(610),其中,位流帧(611、621)的序列指示音频信号的音频帧的对应序列:
-分别对于位流帧(611、621)的序列产生计数值的序列;以及
-将来自计数值的序列中的计数值***来自位流帧(611、621)的序列中的位流帧(611、621)中,使得位流帧(611、621)的计数值指示位流帧(611、621)的序列内的位流帧(611、621)的顺序次序。
102.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器来从包含位流帧(611、621)的对应的第一序列的第一位流(610)和包含位流帧(611、621)的对应的第二序列的第二位流(610)产生拼接位流(610),其中,位流帧(611、621)的第一序列指示第一音频信号的音频帧的对应的第一序列;其中,位流帧(611、621)的第二序列指示第二音频信号的音频帧的对应的第二序列;其中,第二音频信号与第一音频信号不同;其中,位流帧(611、621)的第一序列中的位流帧(611、621)包含指示位流帧(611、621)的第一序列内的位流帧(611、621)的顺序次序的第一计数值;其中,位流帧(611、621)的第二序列中的位流帧(611、621)包含指示位流帧(611、621)的第二序列内的位流帧(611、621)的顺序次序的第二计数值:
-在来自位流帧(611、621)的第一序列的特定位流帧(611)处截短第一位流,以提供截短位流;和
-将截短位流与位流帧(611、621)的第二序列进行级联,以提供拼接位流(610);其中,拼接位流(610)内的特定位流帧(611)的第一计数值和/或跟在特定位流帧(611)后面的位流帧(621)的第二计数值指示第一位流和第二位流(610)之间的拼接点。
103.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器来解码包含位流帧(611、621)的第一序列和第二序列的级联的拼接位流(610);其中,第一序列和第二序列分别指示第一音频信号和第二音频信号;其中,位流帧(611、621)的第一序列中的位流帧(611、621)包含指示位流帧(611、621)的第一序列内的位流帧(611、621)的顺序次序的第一计数值;其中,位流帧(611、621)的第二序列中的位流帧(611、621)包含指示位流帧(611、621)的第二序列内的位流帧(611、621)的顺序次序的第二计数值:
-基于第一计数值和第二计数值检测第一序列和第二序列之间的拼接点;
-确定正确地解码在拼接点之后的拼接位流(610)的位流帧(621)所需要的数据是否可用;
-如果数据不可用,则暂停在拼接点之后的拼接位流(610)的位流帧(621)的解码。
104.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器来处理包含位流帧(611、621)的第一序列和第二序列的级联的位流(610);其中,第一序列和第二序列指示一个或更多个音频信号;其中,位流帧(611)的第一序列中的位流帧(611、621)包含指示位流帧(611)的第一序列内的位流帧(611)的顺序次序的第一计数值;其中,第一序列包含具有预定的一套帧长度的位流帧的第一子序列,使得第一子序列中的位流帧展现第一预定平均帧长度;其中,位流帧(621)的第二序列中的位流帧(621)包含指示位流帧(621)的第二序列内的位流帧(621)的顺序次序的第二计数值;其中,第二序列包含具有预定的一套帧长度的位流帧的第二子序列,使得第二子序列中的位流帧展现第二预定平均帧长度:
-检测第一序列和第二序列之间的过渡点;
-确定紧接在过渡点之前的得自位流帧(611)的第一序列的第一位流帧(611);
-基于第一位流帧(611)的第一计数值q1确定第一位流帧(611)的序列指数值i1;其中,序列指数值i1指示第一子序列内的第一位流帧(611)的位置;
-确定紧接在过渡点之后的得自位流帧(621)的第二序列的第二位流帧(621);和
-基于第一位流帧(611)的序列指数值i1确定第二位流帧(621)的序列指数值i2;其中,序列指数值i2指示第二子序列内的第二位流帧(621)的位置。
105.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器来处理包含位流帧(611、621)的第一序列和第二序列的级联的位流(610);其中,第一序列和第二序列指示一个或更多个音频信号;其中,位流帧(611)的第一序列中的位流帧(611)包含指示位流帧(611)的第一序列内的位流帧(611)的顺序次序的第一计数值;其中,第一序列展现第一平均帧长度;其中,位流帧(621)的第二序列中的位流帧(621)包含指示位流帧(621)的第二序列内的位流帧(621)的顺序次序的第二计数值;其中,第二序列展现第二平均帧长度:
-检测第一序列和第二序列之间的过渡点;
-确定紧接在过渡点之前的得自位流帧(611,621)的第一序列的第一位流帧(611);
-确定第一位流帧(611)的第一计数值q1
-确定紧接在过渡点之后的得自位流帧(621)的第二序列的第二位流帧(621);
-确定第二位流帧(621)的第二计数值q2;和
-基于第一计数值q1、第二计数值q2、第一平均帧长度和第二平均帧长度来确定过渡点是否是拼接点。
106.一种用于确定识别重采样滤波器(102)的多相结构的相位(121)的对应序列的相位指数(202)的序列的***,所述重采样滤波器(102)从输入音频信号(110)的输入采样(204)的序列确定重采样音频信号(113)的输出采样(203)的序列,其中该***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由处理器执行时使得所述***:
-从相位指数(202)的该序列选择(402、403)第一相位指数(202);
-将第一相位指数(202)增加(404)上采样因子L或L的倍数,只要增加的第一相位指数小于或等于下采样因子M即可;
-基于增加的第一相位指数确定(405)相位指数(202)的该序列中的紧接在第一相位指数(202)之后的第二相位指数(202)。
107.一种用于确定识别重采样滤波器(102)的多相结构的相位(121)的对应序列的相位指数(202)的序列的***,所述重采样滤波器(102)用于从输入音频信号(110)的输入采样(204)的序列确定重采样音频信号(113)的输出采样(203)的序列,其中该***包括处理器和存储介质,所述存储介质存储有可执行指令,所述可执行指令在由处理器执行时使得所述***:
-确定包含从1到上采样因子L的升序整数的序列的基本矢量;
-通过将基本矢量级联M次而从基本矢量确定级联矢量,其中,M是下采样因子;和
-通过从级联矢量选择每第M个条目确定相位指数(202)的该序列。
108.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器来确定识别重采样滤波器(102)的多相结构的相位(121)的对应序列的相位指数(202)的序列,所述重采样滤波器(102)从输入音频信号(110)的输入采样(204)的序列确定重采样音频信号(113)的输出采样(203)的序列:
-从相位指数(202)的该序列选择(402、403)第一相位指数(202);
-将第一相位指数(202)增加(404)上采样因子L或L的倍数,只要增加的第一相位指数小于或等于下采样因子M即可;
-基于增加的第一相位指数确定(405)相位指数(202)的该序列中的紧接在第一相位指数(202)之后的第二相位指数(202)。
109.一种存储介质,存储有可执行指令,所述可执行指令在由处理器执行时使得所述处理器来确定识别重采样滤波器(102)的多相结构的相位(121)的对应序列的相位指数(202)的序列,所述重采样滤波器(102)用于从输入音频信号(110)的输入采样(204)的序列确定重采样音频信号(113)的输出采样(203)的序列:
-确定包含从1到上采样因子L的升序整数的序列的基本矢量;
-通过将基本矢量级联M次而从基本矢量确定级联矢量,其中,M是下采样因子;和
-通过从级联矢量选择每第M个条目确定相位指数(202)的该序列。
CN201480050229.4A 2013-09-12 2014-09-10 音频编解码器的***方面 Active CN105531928B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361877155P 2013-09-12 2013-09-12
US61/877,155 2013-09-12
US201461985879P 2014-04-29 2014-04-29
US61/985,879 2014-04-29
PCT/US2014/054899 WO2015038578A2 (en) 2013-09-12 2014-09-10 System aspects of an audio codec

Publications (2)

Publication Number Publication Date
CN105531928A CN105531928A (zh) 2016-04-27
CN105531928B true CN105531928B (zh) 2018-10-26

Family

ID=51585240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480050229.4A Active CN105531928B (zh) 2013-09-12 2014-09-10 音频编解码器的***方面

Country Status (5)

Country Link
US (1) US9990935B2 (zh)
EP (1) EP3044877B1 (zh)
JP (1) JP6321181B2 (zh)
CN (1) CN105531928B (zh)
WO (1) WO2015038578A2 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
TWI631835B (zh) * 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
WO2016108655A1 (ko) * 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
JPWO2017169720A1 (ja) * 2016-03-28 2019-02-07 ソニー株式会社 再生装置および再生方法、並びにファイル生成装置およびファイル生成方法
JPWO2017169721A1 (ja) * 2016-03-28 2019-02-07 ソニー株式会社 ファイル生成装置およびファイル生成方法
EP3246923A1 (en) * 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
CN113782039A (zh) * 2017-08-10 2021-12-10 华为技术有限公司 时域立体声编解码方法和相关产品
US10917074B2 (en) * 2019-03-29 2021-02-09 Bose Corporation Subband adaptive filter for systems with partially acausal transfer functions
JP7212868B2 (ja) 2021-03-26 2023-01-26 いすゞ自動車株式会社 車体フレーム構造
CN113078904B (zh) * 2021-03-26 2023-05-02 青岛鼎信通讯股份有限公司 一种信号采样及处理装置及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101479785A (zh) * 2006-09-29 2009-07-08 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
CN101490745A (zh) * 2006-11-24 2009-07-22 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3806709A (en) 1972-08-02 1974-04-23 Gte Automatic Electric Lab Inc Sequence counter control arrangement
US4020332A (en) * 1975-09-24 1977-04-26 Bell Telephone Laboratories, Incorporated Interpolation-decimation circuit for increasing or decreasing digital sampling frequency
US5610595A (en) 1991-12-09 1997-03-11 Intermec Corporation Packet radio communication system protocol
EP0695032B1 (en) 1994-07-25 2001-11-07 Matsushita Electric Industrial Co., Ltd. Digital-to-digital sample rate converter
US5790538A (en) 1996-01-26 1998-08-04 Telogy Networks, Inc. System and method for voice Playout in an asynchronous packet network
US5675382A (en) * 1996-04-08 1997-10-07 Connectix Corporation Spatial compression and decompression for video
US5708688A (en) 1996-05-23 1998-01-13 Etron Technology, Inc. High speed programmable burst address generation circuit
US6806909B1 (en) 1997-03-03 2004-10-19 Koninklijke Philips Electronics N.V. Seamless splicing of MPEG-2 multimedia data streams
US6014682A (en) * 1997-05-30 2000-01-11 International Business Machines Corporation Methods and apparatus for variable-rate down-sampling filters for discrete-time sampled systems using a fixed sampling rate
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JP2000125295A (ja) 1998-10-13 2000-04-28 Canon Inc 動画像符号化装置及び方法、動画像復号化装置及び方法並びに記憶媒体
US6134268A (en) 1998-10-19 2000-10-17 Motorola, Inc. Apparatus for performing a non-integer sampling rate change in a multichannel polyphase filter
US6480535B1 (en) * 1999-07-26 2002-11-12 Sony Corporation Generating multi-channel outputs simultaneously in a receiver using polyphase filter
US6678332B1 (en) 2000-01-04 2004-01-13 Emc Corporation Seamless splicing of encoded MPEG video and audio
US7551837B2 (en) 2001-08-31 2009-06-23 Thomson Licensing Sequence counter for an audio visual stream
US6961395B2 (en) 2001-11-16 2005-11-01 Nortel Networks Limited Time variant filter implementation
JP2003298397A (ja) 2002-03-26 2003-10-17 Internatl Business Mach Corp <Ibm> デジタルサンプル補間器
US7424377B2 (en) 2002-11-04 2008-09-09 Neptune Technology Group, Inc. Power reduction method in an electronic counter
ATE339759T1 (de) 2003-02-11 2006-10-15 Koninkl Philips Electronics Nv Audiocodierung
US20040230658A1 (en) 2003-02-14 2004-11-18 Julio Estrada System and method for message downloading and initializing a collaborative work environment
US6925523B2 (en) 2003-03-03 2005-08-02 Agilent Technologies, Inc. Managing monotonically increasing counter values to minimize impact on non-volatile storage
US7542899B2 (en) 2003-09-30 2009-06-02 Alcatel-Lucent Usa Inc. Method and apparatus for adjusting the level of a speech signal in its encoded format
US7525526B2 (en) 2003-10-28 2009-04-28 Samsung Electronics Co., Ltd. System and method for performing image reconstruction and subpixel rendering to effect scaling for multi-mode display
WO2006053156A1 (en) * 2004-11-12 2006-05-18 Analog Devices, Inc. Sample rate converter for reducing the sampling frequency of a signal by a fractional number
JP4992717B2 (ja) 2005-09-06 2012-08-08 日本電気株式会社 音声合成装置及び方法とプログラム
FR2901433A1 (fr) 2006-05-19 2007-11-23 France Telecom Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps
US7508327B2 (en) 2006-06-14 2009-03-24 Qualcomm Incorporated Integer representation of relative timing between desired output samples and corresponding input samples
DE112008003098B4 (de) 2007-11-16 2023-12-28 Teradyne, Inc. Verfahren und Vorrichtung zur Berechnung von Interpolationsfaktoren in Abtastratenwandlungssystemen
WO2009084920A1 (en) 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing a signal
US8060042B2 (en) 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US20100100389A1 (en) 2008-10-22 2010-04-22 Vns Portfolio Llc System for Signal Sample Rate Conversion
DE102008053295B4 (de) 2008-10-27 2010-10-07 Atmel Automotive Gmbh Verfahren zur Ratenerhöhung und Verfahren zur Ratenreduzierung
WO2010097748A1 (en) 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
PL2405425T3 (pl) 2009-04-08 2014-12-31 Fraunhofer Ges Forschung Urządzenie, sposób i program komputerowy do realizacji upmixu sygnału audio downmixu z użyciem wygładzania wartości faz
US7920078B2 (en) 2009-06-19 2011-04-05 Conexant Systems, Inc. Systems and methods for variable rate conversion
US8768995B2 (en) 2010-08-31 2014-07-01 Telefonaktiebolaget L.M. Ericsson (Publ) Multi-branch rate change filter
US8782109B2 (en) * 2010-09-10 2014-07-15 Texas Instruments Incorporated Asynchronous sample rate conversion using a polynomial interpolator with minimax stopband attenuation
WO2012039920A1 (en) 2010-09-22 2012-03-29 Dolby Laboratories Licensing Corporation Efficient implementation of phase shift filtering for decorrelation and other applications in an audio coding system
TWI476761B (zh) 2011-04-08 2015-03-11 Dolby Lab Licensing Corp 用以產生可由實施不同解碼協定之解碼器所解碼的統一位元流之音頻編碼方法及系統
US8693601B2 (en) 2012-01-03 2014-04-08 Intel Corporation Self-correcting multirate filter

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101479785A (zh) * 2006-09-29 2009-07-08 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
CN101490745A (zh) * 2006-11-24 2009-07-22 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置

Also Published As

Publication number Publication date
WO2015038578A2 (en) 2015-03-19
US9990935B2 (en) 2018-06-05
EP3044877A2 (en) 2016-07-20
CN105531928A (zh) 2016-04-27
JP6321181B2 (ja) 2018-05-09
EP3044877B1 (en) 2021-03-31
JP2016536649A (ja) 2016-11-24
US20160196831A1 (en) 2016-07-07
WO2015038578A3 (en) 2015-05-07

Similar Documents

Publication Publication Date Title
CN105531928B (zh) 音频编解码器的***方面
CN101036183B (zh) 用于立体声兼容的多声道音频编码/解码的方法和设备
AU2011299360B2 (en) Carrying auxiliary data within audio signals
US9570082B2 (en) Method, medium, and apparatus encoding and/or decoding multichannel audio signals
JP6728154B2 (ja) オーディオ信号のエンコードおよびデコード
EP1472889B1 (en) Audio coding
CN105723454A (zh) 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备
CN101292428B (zh) 用于编码/解码的方法和装置
JP3960932B2 (ja) ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
KR100307596B1 (ko) 디지털 오디오 데이터의 무손실 부호화 및 복호화장치
JP2023076610A (ja) 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
WO2008116065A1 (en) Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
KR100300887B1 (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
JP2008250340A (ja) 音声符号化方法及び音声復号方法
JP4148259B2 (ja) 音声符号化方法及び音声復号方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant