CN1662958A - 使用频谱孔填充的音频编码*** - Google Patents

使用频谱孔填充的音频编码*** Download PDF

Info

Publication number
CN1662958A
CN1662958A CN038139677A CN03813967A CN1662958A CN 1662958 A CN1662958 A CN 1662958A CN 038139677 A CN038139677 A CN 038139677A CN 03813967 A CN03813967 A CN 03813967A CN 1662958 A CN1662958 A CN 1662958A
Authority
CN
China
Prior art keywords
signal
spectrum
group
subband signal
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN038139677A
Other languages
English (en)
Other versions
CN100369109C (zh
Inventor
迈克尔·M.·杜鲁门
格兰特·A.·戴维森
马修·C.·费勒斯
马克·S.·文顿
马修·A.·沃森
查尔斯·Q.·鲁宾逊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN1662958A publication Critical patent/CN1662958A/zh
Application granted granted Critical
Publication of CN100369109C publication Critical patent/CN100369109C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Optical Elements Other Than Lenses (AREA)
  • Stereophonic System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Optical Communication System (AREA)
  • Adornments (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Optical Filters (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

音频编码过程如量化能够使得编码信号的频谱分量被设置为零,从而在信号中产生频谱孔。这些频谱孔会降低由音频编码***再生的音频信号的感知质量。一种改进的解码器通过用合成频谱分量填充频谱孔避免或减轻了恶化。一种改进的编码器还可以用于实现解码器的进一步改进。

Description

使用频谱孔填充的音频编码***
技术领域
本发明通常涉及音频编码***,尤其涉及改善得自音频编码***的音频信号的感知质量。
背景技术
音频编码***用于将音频信号编码为适合于传输或存储的编码信号,然后接收或检索编码信号并解码以获得用于回放的原始音频信号的一个版本。感知音频编码试图将原始音频信号编码为比原始音频信号信息容量要求更低的编码信号,然后将编码信号解码并提供在感知上与原始音频信号难以区别的输出。感知音频编码***的一个实例参见高级电视标准化委员会(ATSC)A52文件(1994),称之为杜比AC-3。另一个实例参见Bodi等人的文献,“ISO/IEC MPEG-2Advanced Audio Coding,”J.AES,vol.45,no.10,October 1997,pp.789-814,称之为高级音频编码(AAC)。这两个编码***和其它许多感知编码***都对音频信号使用分析滤波器组以获得按聚类或频带排列的频谱分量。其带宽通常是变化的并且通常与人类听觉***所谓临界带的宽度相当。
感知编码***可以用于减少音频信号的信息容量需求同时保留音频质量的主观或感知度量,所以音频信号的编码表示能够以更少的带宽通过信道传输或以更少的空间存储在记录媒体上。通过量化频谱分量可以减少信息容量需求,量化将噪声引入被量化信号,但是感知音频编码***通常使用心理声学模型控制量化噪声的幅度,以通过信号中的频谱分量掩蔽噪声或使其不可闻。
已知频带中的频谱分量通常以相同的量化分辨率进行量化,并使用心理声学模型确定最大的最小量化分辨率或最小信噪比(SNR),引入听不见的量化噪声是可能的。该技术在窄带下运行得相当好,但该技术在较宽频带下,当信息容量需求促使编码***采用相对粗糙的量化分辨率时就不能很好的运行。在宽带中较大值的频谱分量通常量化为所需精度的非零值,而如果频带中较小值的频谱分量幅度小于最小量化水平则被量化为零。随着带宽的增加,随着频带内最大和最小频谱分量差值的增加以及随着最小量化水平的增加,频带内量化为零的频谱分量的数目随之增加。
不幸的是,即使保持最终的量化噪声充分低于可听阈或通过信号的频谱分量在心理声学上被掩蔽了,编码信号中量化为零(QTZ)频谱分量的大量存在仍然会降低音频信号的感知质量。质量降低的原因至少有三个,第一个原因是因为心理声学掩蔽的水平实际上低于用于确定量化分辨率的心理声学模型的预测,量化噪声并不是听不见的;第二个原因是与原始音频信号的功率或能量相比,大量QTZ频谱分量的产生实际在听觉上降低了解码音频信号的功率或能量;第三个原因与使用失真抵消滤波器组的编码过程有关,如量化镜像滤波器(QMF)或修改的离散余弦变换(DCT)和修改的离散余弦逆变换(IDCT),即所谓的时域假信号抵消(TDAC)变换,其说明参见Princen等人的文献,“Subband/Transform Coding Using Filter BankDesigns Based on Time Domain Aliasing Cancellation,”ICASSP 1987Conf.Proc.,May 1987,pp.2161-64。
使用失真抵消滤波器组如QMF或TDAC变换的编码***在编码过程中使用了分析滤波器组,从而在编码信号中引入了失真或寄生分量,但在解码过程中使用合成滤波器至少在理论上可以消除失真。但在实践中如果一个或更多频谱分量的值在编码的过程中发生重大的变化,那么合成滤波器消除失真的能力就会大大削弱。为此,因为频谱分量的值会削弱合成滤波器组消除由分析滤波器组引入的失真的能力,QTZ频谱分量即使在听不见量化噪声的情况下也会降低解码音频信号的感知质量。
已知编码***采用的技术提供了部分解决这些问题的方法。例如,杜比AC-3和AAC变换编码***在解码器中用噪声代替该特定QTZ频谱分量,从而在某种程度上能够从保留了原始音频信号幅度的编码信号中产生输出信号。这两种***都在编码信号中提供了频带的功率指示并在解码器中利用功率指示用适当水平的噪声代替频带中的该特定QTZ频谱分量。杜比AC-3编码器提供了短时功率谱的粗略估计,可以用于产生噪声的适当水平。当频带所有的频谱分量都设置为零时,解码器用在短时功率谱中粗略估计所指示的近似相同功率的噪声填充该频带。AAC***采用称为感知噪声替代(PNS)的技术明确传递给定频带的功率。解码器用该信息添加与该功率匹配的噪声。两种***都仅仅在那些没有非零频谱分量的频带添加噪声。
不幸的是,这些***不能在那些混合了QTZ与非零频谱分量的频带中保留功率水平。表1示出了频谱分量一个假设频带的原始音频信号,每个频谱分量合成在编码信号中的3比特量化表示以及用解码器从编码信号中获得的相应频谱分量。在编码信号中量化频带包含QTZ与非零频谱分量的组合。
               表1
 原始信号分量  量化分量   去量化分量
  10101010     101   10100000
  00000100     000   00000000
  00000010     000   00000000
  00000001     000   00000000
  00011111     000   00000000
  00010101     000   00000000
  00001111     000   00000000
  01010101     010   01000000
  11110000     111   11100000
表的第一列显示的是一组无符号二进制数,表示原始音频信号中分布在单个频带中的频谱分量。第二列显示的是量化为三比特的频谱分量表示。在该例子中每个频谱分量低于3比特精度的部分被截除。量化频谱分量传递给解码器后通过补零恢复原始信号分量的长度完成去量化。第三列显示的就是去量化分量。因为频谱分量的大部分量化为零,去量化频谱分量所包含的能量小于原始频谱分量频带的能量且能量集中在少数几个非零频谱分量中。如前所述,能量的减少降低了解码信号的感知质量。
发明内容
本发明的一个目的就是通过避免或减轻与零值量化频谱分量相关的恶化以修改得自音频编码***的音频信号的感知质量。
本发明的一个方面,通过以下步骤获得音频信息:接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;从该组子带信号中识别该特定子带信号,其中的一个或多个频谱分量具有非零值并用最小量化水平对应于一个阈值的量化器将其量化,其中的多个频谱分量的值是零;生成分别对应于该特定子波带中零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行量化;在该特定子带信号中用合成频谱分量代替相应的零频谱分量生成一组修改的子带信号;用合成滤波器组针对修改的子带信号生成音频信息。
本发明的另一个方面,通过以下步骤提供输出信号,最好是编码输出信号:将分析滤波器组应用于音频信息获得量化信息并用该量化信息生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;从该组子带信号中识别该特定子带信号,其中的一个或多个频谱分量具有非零值并用最小量化水平对应于一个阈值的量化器将其量化,其中的多个频谱分量的值是零;从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的量化以用于合成和代替接收机中的零频谱分量,该接收机产生对应于输出信号的音频信息;将比例控制信息和代表该组子带信号的信息合成在一起以产生输出信号。
通过参考下面的说明和附图,可以更好的理解本发明的各分量特征及其最佳实施例,附图的几个图中相同的编号是指相同的单元。下面说明的内容仅仅作为实例而不能理解为对本发明范畴的限定。
附图简述
图1a是一个音频编码器的示意框图。
图1b是一个音频解码器的示意框图。
图2a-2c是量化函数的示意图。
图3是一假设音频信号的频谱示意图。
图4是一假设音频信号有几个频谱分量设置为零时的频谱示意图。
图5是一假设音频信号用合成频谱分量代替零值频谱分量时的频谱示意图。
图6是分析滤波器组中的一滤波器的假设频率响应示意图。
图7示出了与图6所示频谱泄漏衰减近似的比例包络。
图8示出了由可适应滤波器的输出导出的比例包络。
图9是一假设音频信号的频谱示意图,其合成频谱分量用近似于图6所示频谱泄漏衰减的比例包络加权。
图10是假设心理声学掩蔽阈值的示意图。
图11是一假设音频信号的频谱示意图,其合成频谱分量用近似于心理声学掩蔽阈值的比例包络加权。
图12是一假设子带信号的示意图。
图13是一假设子带信号有几个频谱分量设置为零时的频谱示意图。
图14是一假设时间心理声学掩蔽阈值的示意图。
图15是一假设子带信号的频谱示意图,其合成频谱分量用近似于时间心理声学掩蔽阈值的比例包络加权。
图16是一假设音频信号当含有通过谱复制产生的合成频谱分量时的频谱图。
图17是一个可以用于在编码器或解码器中实现本发明各个方面的装置的示意框图。
具体实施方式
A.概述
本发明的各个方面可以与各种信号处理技术和包括如同图1a和图1b所示那些装置的装置广泛地结合在一起。有些方面可以仅仅在解码技术或装置中得以实施。其它方面则需要在编码和解码技术或装置中共同处理。下面提供可以用于实施本发明这些方面的过程说明,随后提出可以用于执行这些过程的典型装置的综述。
1.编码器
图1a示出了分频带音频编码器的一个实施例,其中分析滤波器组12接收来自通道11代表音频信号的音频信息,并作为响应提供代表音频信号频率子带的数字化信息。每个频率子带的数字化信息用各自的量化器14,15,16量化并传递给编码器17。编码器17生成量化信息的编码表示并传递给格式器18。图中所示的特殊实施例中,量化器14,15,16的量化函数与从模型13接收的比例控制信息相适应,模型13针对从通道11接收的音频信息生成比例控制信息。格式器18将量化信息的编码表示和比例控制信息合成为适合于传输或存储的输出信号,并将输出信号沿通道19传递。
许多音频应用使用均匀的线性量化函数q(x),如图2a所示的3-比特中趋势(mid-tread)非对称量化函数;但是对于本发明重要的是量化的非精确形式。可以采用的另外两个函数q(x)的例子如图2b和图2c所示。在每个例子中,量化函数q(x)对于任何在点30的值与点31的值之间的输入值x的输出值都等于零。在许多应用中,点30,31的值相等且符号相反;但这不是必需的,如图2b所示。为了便于论述,用该特定量化函数q(x)量化为零(QTZ)的输入值区间内的值x是指小于该量化函数最小量化水平的值。
在本说明中,如“编码器”和“编码”的术语不是特意暗示信息处理的任何类型。例如,编码通常用于减少信息容量需求;但是这些术语不是必须指这种处理类型。编码器17可以执行基本上所需的任何处理类型。在一种实施例中,将量化信息编码为具有相同比例因子的量化值的集合。例如在杜比AC-3***中,将量化频谱分量安排在浮点数的集合或频带中,每个频带的数值都分享一个浮点指数。在AAC编码***中采用了熵编码,如哈夫曼编码。在其它实施例中,编码器17就不存在了,而量化信息直接合成到输出信号中。对于本发明任何特殊类型的编码都是不重要的。
模型13可以执行基本上所需的任何处理类型。一个例子是对音频信息应用心理声学模型估计音频信号中不同频谱分量的心理声学掩蔽效应。可能有许多变化,例如,模型13可以生成对应于频率子带信息的在分析滤波器组12的输出端有效的比例控制信息,以代替或附加于在滤波器组输入端有效的音频信息。对另一个例子,模型13可以不存在而量化器14、15、16使用不经过适应的量化函数。对于本发明任何特殊建模过程都是不重要的。
2.解码器
图1b示出了分频带音频解码器的一个实施例,其中解格式器22接收来自通道21的输入信号,该信号是表征音频信号频率子带的量化数字信息的编码表示。解格式器从输入信号得到编码表示并将其传递给解码器23。解码器将编码表示解码为量化信息的频率子带。用各自的去量化器25,26,27将每个频率子带的量化数字信息去量化并传递给合成滤波器组28,该滤波器组产生代表音频信号的音频信息并沿通道29传递。在如图所示的特殊实施例中,去量化器25,26,27的去量化函数与从模型24接收的比例控制信息相适应,该模型针对解格式器22从输入信号获得的控制信息生成比例控制信息。
在本说明中,如“解码器”和“解码”的术语不是特意暗示信息处理的任何类型。解码器23可以执行基本上所需的任何处理类型。在一种实施例中它与上面描述的编码过程相反,在浮点数集合中具有共享指数的量化信息解码为不再共享指数的单个量化分量。在另一个实施例中,解码器23不存在且量化信息直接由解格式器22得到。对于本发明任何特殊类型的解码都是不重要的。
模型24可以执行基本上所需的任何处理类型。一个例子是对音频信息应用心理声学模型估计音频信号中不同频谱分量的心理声学掩蔽效应。对另一个例子,模型24可以不存在而去量化器25,26,27可以使用不经过适应的量化函数或使用与解格式器22直接从输入信号得到的比例控制信息相适应的量化函数。对于本发明任何特殊的处理都是不重要的。
3.滤波器组
图1a和1b中的装置示出了三个频率子带分量。在应用中通常使用更多的子带,但为了解释清楚仅仅示出三个。对于本发明任何特殊数字都是不重要的。
分析和合成滤波器组基本上可以用所需的任何方法实现,包括数字滤波器技术,块变换和小波变换等很宽的范围。在一个含有如前所述编码器和解码器的音频编码***中,分析滤波器组12是由TDAC修改的DCT实现的而合成滤波器组28是由前面提及的TDAC修改IDCT实现的。但原则上没有特殊实现是重要的。
用块变换实现的分析滤波器组将输入信号的一块或一段分为代表该段信号频谱内容的一组变换系数。一个或多个相邻变换系数的集合表征了该特定频率子带内的频谱内容,该子带的带宽与该集合中系数的数目相当。
用某种类型的数字滤波器如多相位滤波器,而不是块变换实现的分析滤波器组将输入信号分为一组子带信号。每个子带信号是该特定频率子带内的频谱内容基于时间的表示。子带信号最好按十分之一抽取以使每个子带信号的带宽与单位时间内子带信号样本的数目相当。
下面的论述尤其是指使用如同前面提及的TDAC变换的块变换实现。在该论述中,术语“子带信号”是指一个或多个相邻变换系数的集合,术语“频谱分量”是指变换系数。但是本发明的原理可以应用于其它类型的实现,所以术语“子带信号”通常也可以理解为表征信号该特定频率子带频谱内容的基于时间的信号,而术语“频谱分量”通常也可以理解为基于时间的子带信号的样本。
4.实施
本发明的各个方面可以用很多种方法实施,包括通用计算机中或其它一些装置中的软件,这些装置包括更专门化的器件如数字信号处理(DSP)电路,其元件类似于通用计算机中的那些元件。图17是可以用于实施本发明在音频编码器或音频解码器中各个方面的装置70的框图,DSP 72提供计算资源;RAM 73是信号处理时DSP 72使用的***随机存取存储器(RAM);ROM 74表示永久存储的某种结构,如只读存储器(ROM),它存储操作装置70以及实施本发明各个方面所需的程序。I/O控制器75表示的是通过通信信道76,77接收和发送信号的接口电路。当需要接收和/或发送模拟音频信号时,I/O控制器75可以包含模-数转换器或数-模转换器。如实施例所示,所有主要的***组件都与总线71相连,该总线代表的物理总线可能不止一种;但总线结构对于本发明的实施不是必需的。
在通用计算机***中实施例中,可以包含附加的元件,如连接键盘或鼠标以及显示器等装置的接口,以及含有存储媒体的存储控制装置如磁带或磁盘或光学媒体等。存储媒体可以用于记录操作***,应用程序及应用的指令程序,可以包含实施本发明各个方面的程序本身。
实践本发明各个方面所需的功能可以通过由很多种方法实现的元器件来完成,这包括离散逻辑元件,一个或多个ASIC和/或可编程控制器。这些元器件的实现方式对于本发明都是不重要的。
本发明的软件实施可以通过多种机器可读媒介传输,如覆盖从超声到紫外频段频率范围的基带或调制通信线路,或通过使用基本上任何磁性或光学记录技术且包含那些传送信息的存储媒体传送,包括磁带,磁盘和光盘。也可以在计算机***70的各个组件中采用处理电路实施各个方面,如ASIC,通用集成电路,由包含在各种ROM或RAM中的嵌入程序控制的微处理器以及其它技术。
B.解码器
本发明在解码器中实施的各个方面不需要任何来自编码器的特殊处理或信息。本说明书在本节说明这些方面,其它需要来自编码器的特殊处理或信息的方面将在下一节说明。
1.频谱孔
图3是一段用变换编码***编码的假设音频信号的频谱示意图。频谱41表示变换系数或频谱分量幅值的包络。在编码过程中,所有幅值低于阈值40的频谱分量都量化为零。如果使用如图2a所示q(x)函数作为量化函数,阈值40对应于最小量化水平30,31。为便于说明,整个频率范围内阈值40都显示为统一的值,这在许多编码***中并不特殊。例如,在每个子带信号内均匀量化频谱分量的感知音频编码***中,阈值40在每个频率子带中是统一的但在子带与子带之间是变化的。在其它实施例中,阈值40也可以在给定的频率子带内变化。
图4是用量化频谱分量表示的假设音频信号频谱示意图。频谱42表示量化频谱分量幅值的包络。该图与其它图所示的频谱没有显示频谱分量的幅值大于或等于阈值40时的量化效果。量化信号中QTZ频谱分量与原始信号中相应的频谱分量之间的差用阴影显示,这些阴影区域代表了在量化表示中需要用合成频谱分量填充的“频谱孔”。
在本发明的一个实施例中,解码器接收的输入信号表达了如图4所示量化子带信号的编码表示。解码器对该编码表示进行解码并识别出这些子带信号中一个或多个频谱分量是非零值而多个频谱分量的值是零。所有子带信号的频率范围最好对解码器是先验已知的或定义在输入信号的控制信息中。使用如下所述的处理过程,解码器产生对应于零频谱分量的合成频谱分量。合成分量按照低于或等于阈值40的比例包络进行调整,然后用调整的合成频谱分量代替子带信号的零频谱分量。如果用于量化频谱分量的量化函数的最小量化水平30,31是已知的,那么解码器不需要来自编码器明确指示阈值40水平的任何信息。
2.按比例缩放
建立比例包络的方法可以有很多种,下面将说明几种方法。可以使用多种方法,例如复合比例包络的导出可以是从多种途径获得的所有包络的最大值,或者用不同的方法建立比例包络的上界和/或下界。这些方法可以与编码信号向适应或进行选择,也可以作为频率的函数进行适应或选择。
a)均匀包络
建立比例包络的第一种方法适合于音频变换编码***和使用其它滤波器组实现的***中的解码器。该方法通过设定包络等于阈值40建立均匀比例包络。这种比例包络的一个实例如图5所示,它用阴影区域表示用合成频谱分量填充的频谱孔。频谱43表示音频信号的频谱分量包络,它含有用合成频谱分量填充的频谱孔。该图与上图所示的阴影区域上界不代表合成频谱分量本身的实际等级,而仅仅代表合成频谱分量的按比例包络。用于填充频谱孔的合成频谱分量的频谱等级不超过比例包络
b)频谱泄漏
建立比例包络的第二种方法非常适合于块变换音频编码***的解码器,但是其原理可以应用于滤波器组的其它实现类型。该方法提供随着块变换中原型滤波器频率响应的频谱泄漏特征变化的非均匀比例包络。
图6所示响应50示出了一个变换原型滤波器的假设频率响应图形,显示了系数间的频谱损耗。该响应包括一个主瓣,通常是指原型滤波器的通带,和一些与主瓣相邻的旁瓣,其大小随着频率离开通带中心而减小。旁瓣表示频谱能量从通带泄漏至相邻的频带。这些旁瓣的大小减小的比率称为频谱泄漏的衰减比。
滤波器的频谱泄漏特征制约了相邻频率子带的频谱隔离。如果滤波器具有大量的频谱泄漏,那么相邻子带的频谱水平就不能象频谱泄漏较低的滤波器那样区分开。图7所示的包络51是图6所示频谱泄漏衰减的近似。合成频谱分量可以用这样一个包络调整或者可以将该包络用作比例包络的下界以用于其它技术的导出。
图9中的频谱44示出了假设音频信号含有按近似频谱泄漏衰减包络调整的合成频谱分量的频谱图。频谱孔通过能量在每边进行限制,其比例包络是两个单独包络的复合,一边一个。该复合的构成是取两个单独包络较大一方。
c)滤波器
建立比例包络的第三种方法非常适合于块变换音频编码***的解码器,但是其原理可以应用于滤波器组的其它实现类型。该方法提供的非均匀比例包络是由频域滤波器的输出导出的,该滤波器用于频域中变换系数。该滤波器可以是一个预测滤波器,低通滤波器或提供所需比例包络的其它任何滤波器。该方法通常需要比上面描述的两种方法所需更多的的计算资源,但它允许比例包络按照频率的函数变化。
图8示出了从可适应频域滤波器输出导出的两个比例包络。例如,比例包络52可以用于填充信号或更像音调的部分信号中的频谱孔,而比例包络53可以用于填充信号或更像噪声的部分信号中的频谱孔。信号的音调和噪声特性可以用多种方法估计,后面将论述其中的一些方法。另一方面,比例包络52可以用于填充较低频率处的频谱孔,其音频信号通常更象音调;而比例包络53可以用于填充较高频率处的频谱孔,其音频信号通常更象噪声。
d)感知掩蔽
建立比例包络的第四种方法可以应用于用块变换滤波器组和其它类型滤波器组实现的音频编码***的解码器。该方法提供了非均匀比例包络,其变化符合估计的心理声学掩蔽效应。
图10示出了两个假设心理声学掩蔽阈值。阈值61表示较低频率频谱分量60的心理声学掩蔽效应,阈值64表示较高频率频谱分量63的心理声学掩蔽效应。类似的这些掩蔽阈值可以用于导出比例包络的形状。
图11中的频谱45示出了假设音频信号含有按照基于心理声学的包络调整的合成频谱替代分量的频谱图。该实施例显示,低频频谱孔中的比例包络是由掩蔽阈值61的较低部分导出。中间频谱孔中的比例包络是掩蔽阈值61的较高部分与掩蔽阈值64的较低部分复合而成。最高频率的频谱孔中的比例包络是由掩蔽阈值64的较高部分导出。
e)音调
建立比例包络的第五种方法是基于对整个音频信号或信号的一部分入一个或多个子带信号的音调估计。音调可以用多种方法估计,包括频谱平坦度量(SFM)的计算,即信号样本的算术平均值除以信号样本的几何平均值的规格化商。该值接近1表明信号非常象噪声,而该值接近于零表明信号非常象音调。SFM可直接用于调整比例包络。当SFM等于零时,就不用合成分量填充频谱孔。当SFM等于1时,用允许的最大合成频谱分量填充频谱孔。但通用来说,因为编码器在编码之前可以访问整个原始音频信号所以能够计算一个更好的SFM值。因为QTZ频谱分量的出现解码器可能计算不出一个准确的SFM值。
解码器通过分析非零值和零频谱分量的排列或分布也可以估计音调。在一个实施例中,如果在几个大的非零值频谱乡之间分布着一长段零频谱分量,那么可以认为该信号更可能是音调而不是噪声,这是因为这种排列意味着一个谱峰结构。
在另一个实施例中,解码器将预测滤波器应用于一个或多个子带信号并确定预测增益。当预测增益增加时可以认为该信号更可能是音调。
f)时间按比例调整
图12示出了一个待编码的假设子带信号。线条46表示频谱分量幅值的时间包络。该子带信号可以由通用的频谱分量或者由从方块变换分析滤波器组获得的块序列中的变换系数组成,或者它可以是另一种类型的分析滤波器组得到的子带信号,该滤波器组是用数字滤波器而不是类似QMF的块变换实现的。在编码过程中,所有幅值低于阈值40的频谱分量量化为零。为便于说明,整个时间间隔内阈值40都显示为统一的值,这在许多使用方块变换滤波器组的编码***中并不特殊。
图13示出了用量化频谱分量表示的假设子带信号。线条47表示量化频谱分量幅值的时间包络。该图和其它图所示的线条没有显示频谱分量的幅值大于或等于阈值40时的量化效果。量化信号中QTZ频谱分量与原始信号中相应的频谱分量之间的差用阴影显示,这些阴影区域代表了在一段时间中需要用合成频谱分量填充的频谱孔。
在本发明的一个实施例中,解码器接收的输入信号表达了如图13所示量化子带信号的编码表示。解码器对该编码表示进行解码并识别出这些子带信号中多个频谱分量的值是零,其前面和/或后面是具有非零值的频谱分量。使用如下所述的处理过程,解码器产生对应于零频谱分量的合成频谱分量。合成分量按照比例包络进行调整。该比例包络最好考虑到人类听觉***的时间隐蔽特征。
图14示出了一种假设的时间心理声学掩蔽阈值。阈值68表示频谱分量67的时间心理声学掩蔽效应。该阈值在频谱分量67左边的部分表示预-时间掩蔽特征,或领先于频谱分量出现的掩蔽。该阈值在频谱分量67右边的部分表示后-时间掩蔽特征,或跟随频谱分量出现的掩蔽。后-掩蔽效应的持续时间通用大大长于预-掩蔽效应。这样的时间掩蔽阈值可以用于导出比例包络的时间形状。
图15的线条48是含有按照基于时间心理声学掩蔽效应的包络调整的合成频谱替代分量的假设子带信号图形。该实施例显示,比例包络是两个单独包络的组合。频谱孔低频部分的单独包络是由阈值68的后-掩蔽部分导出的,频谱孔高频部分的单独包络是由阈值68的预-掩蔽部分导出的。
3.合成分量的产生
合成频谱分量可以由多种方法产生。下面说明两种方法,可以采用多种方法。例如,不同方法的选择可以对应于编码信号的特征或者作为频率的函数。
第一种方法产生类似噪声的信号。产生伪噪声信号的很多种方法基本上都可以使用。
第二种方法使用一种称为谱平移或谱复制的技术,从一个或多个频率子带中复制频谱分量。因为较高频率分量通常以某种方式与较低频率分量相联系,所以较低频率的频谱分量通常复制并填充较高频率的频谱孔。但原则上,频谱分量可以复制到较低或较高的频率。
图16中的频谱49一假设音频信号当含有通过谱复制产生的合成频谱分量时的频谱图。谱峰的一部分在频率上下复制了多次以分别填充低频和中间频率的频谱孔。接近频谱高端频谱分量的一部分在频率上方复制并填充了频谱高端的频谱孔。在所示的实例中,复制分量用统一的比例包络进行调整;但是基本上可以采用任何形式的比例包络。
C.编码器
前面描述的本发明多个方面可以在不对现存编码器作任何修改的前提下在解码器中实施。如果修改编码器以提供附加的控制信息则可以增强这些方面,否则该信息对解码器是不可靠的。附加的控制信息可以用于修改解码器中合成频谱分量产生和按比例调整的方法。
1.控制信息
编码器可以提供多种解码器用于调整合成频谱分量比例包络的比例控制信息。下面说明的每个实例都可以用于整个信号和/或该信号的频率子带。
如果子带包含的频谱分量都大大低于最小量化水平,那么编码器可以为解码器提供指示该状态的信息。该信息可以是一种索引,解码器可以用它从两个或多个缩放比例中选择,或者该信息可以传达某种频谱幅度的度量,如平均或均方根(RMS)功率。解码器可以针对这个信息调整比例包络。
如前所述,解码器可以针对由编码信号本身估计的心理声学掩蔽效应调整比例包络。但是当编码器可以访问那些在编码过程中丢失的信号特征时,就有可能由编码器提供这些掩蔽效应的更佳估计。为此可以由模型13为格式器18提供心理声学信息,否则来自编码信号的信息是不可靠的。使用这种信息,解码器能够调整比例包络以按照一个或多个心理声学标准约束合成频谱分量的形状。
还可以针对信号或子带信号象噪声或象音调的估计调整比例包络。这种估计可以由编码器或者解码器以多种方式进行,但是编码器通常能获得更好的估计。该估计结果可以与编码信号合成在一起。一种估计就是前面描述的SFM。
解码器还可以使用SFM指示选择用于生成合成频谱分量的过程。如果SFM接近于1,可以采用噪声生成技术。如果SFM接近于零,可以采用谱复制技术。
编码器可以针对非零和QTZ频谱分量提供功率的某种指示,如这两个功率的比值。解码器可以计算非零频谱分量的功率,然后使用该比值或其它指示适当调整比例包络。
2.零频谱系数
因为在编码信号中量化是零值分量的通用来源,前面的论述有时将零值频谱分量称为QTZ(量化为零)分量。实质上不是这样,基本上任何处理都可能将编码信号中频谱分量的值设置为零。例如,编码器可以在高于该特定频率的每个子带信号中识别出一个或两个频谱分量,然后将那些子带信号的中其它频谱分量设置为零。另外,编码器可以将低于该特定阈值的该特定子带中的所有频谱分量设置为零。结合如前所述本发明各个方面的解码器能够填充不管是哪个处理过程造成的频谱孔。

Claims (45)

1.一种产生音频信息的方法,其中该方法包括:
接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号的频谱内容的一个或多个频谱分量;
在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零;
生成对应于该特定子波带中各零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行比例调整;
通过在该特定子带信号中用合成频谱分量代替相应的零值频谱分量来生成一组修改的子带信号;以及
通过将合成滤波器组应用于该修改的子带信号来生成音频信息。
2.权利要求1的方法,其中比例包络是均匀的。
3.权利要求1或2的方法,其中合成滤波器组由在相邻频谱分量之间存在频谱泄漏的块变换实现,比例包络按照一个基本上等于块变换频谱泄漏的衰减率的比率变化。
4.权利要求1至3中任一个的方法,其中合成滤波器组由块变换实现,该方法包括:
对该组子带信号的一个或多个频谱分量使用频域滤波器;以及
由频域滤波器的输出导出比例包络。
5.权利要求4的方法,包括随着频率改变频域滤波器的响应。
6.权利要求1至5中任何一个的方法,包括:
获得由该组子带信号代表的音频信号音调的度量;以及
根据音调的度量适配比例包络。
7.权利要求6的方法,从输入信号中获得音调的度量。
8.权利要求6的方法,包括由零值频谱分量在该特定子带信号中的排列方式导出音调的度量。
9.权利要求1至8中任何一个的方法,其中合成滤波器组由块变换实现,该方法包括:
从输入信号获得一序列子带信号组;
在子带信号组序列中识别出通用子带信号,其中对于序列中的每一组有一个或多个频谱分量是非零值而多个频谱分量的值是零。
在通用子带信号中识别出通用频谱分量,其值在序列的多个相邻组中为零,所述多个相邻组或者其前面或后面是具有非零值的通用频谱分量;
按照比例包络比例调整对应于零频谱分量的合成频谱分量,比例包络按照人类听觉***的时间掩蔽特征随序列中的组变化。
通过在各组子带信号中用合成频谱分量代替相应的零值频谱分量来生成修改的子带信号组序列;以及
通过将合成滤波器组应用于该修改的子带信号组序列来生成音频信息。
10.权利要求1至9中任何一个的方法,其中合成滤波器组由块变换实现,并且该方法通过子带信号中其它频谱分量的谱平移生成合成频谱分量。
11.权利要求1至10中任何一个的方法,其中比例包络按照人类听觉***的时间掩蔽特征变化。
12.一种生成输出信号的方法,其中该方法包括:
通过对将分析滤波器组应用于音频信息获得的信息量化来生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;
在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零;
从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的比例以用于合成和代替接收机中的零频谱分量,该接收机响应于输出信号产生音频信息;以及
将比例控制信息和代表该组子带信号的信息装配在一起以产生输出信号。
13.权利要求12的方法,包括:
获得由该组子带信号代表的音频信号音调的度量;以及
由音调的度量导出比例控制信息。
14.权利要求12或13的方法,包括:
获得由该组子带信号代表的音频信号的心理声学掩蔽估计阈值;以及
由该心理声学掩蔽估计阈值导出比例控制信息。
15.权利要求12至14中任何一个的方法,包括:
获得由非零值和零值频谱分量代表的部分音频信号的频谱水平的两个度量;以及
由频谱水平的这两个度量导出比例控制信息。
16.一种生成音频信息的装置,其中该装置包括;
解格式器,该解格式器接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号的频谱内容的一个或多个频谱分量;
与该解格式器连接的解码器,该解码器在该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零,该解码器生成分别对应于该特定子波带中零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行比例调整,该解码器通过在该特定子带信号中用合成频谱分量代替相应的零值频谱分量来生成一组修改的子带信号;以及
与该解码器连接的合成滤波器组,响应于该修改的子带信号生成音频信息。
17.权利要求16的装置,其中比例包络是均匀的。
18.权利要求16或17的装置,其中合成滤波器组由在相邻频谱分量之间存在频谱泄漏的块变换实现,比例包络按照一个基本上等于块变换频谱泄漏的衰减率的比率变化。
19.权利要求16至18中任何一个的装置,其中合成滤波器组由块变换实现,该解码器:
对该组子带信号中的一个或多个频谱分量使用频域滤波器;以及
由频域滤波器的输出导出比例包络。
20.权利要求19的装置,其中解码器随着频率改变频域滤波器的响应。
21.权利要求16至20中任何一个的装置,其中解码器
获得由该组子带信号代表的音频信号音调的度量;以及
根据音调的度量适配比例包络。
22.权利要求21的装置,从输入信号中获得音调的度量。
23.权利要求21的装置,其中解码器由零频谱分量在该特定子带信号中的排列方式导出音调的度量。
24.权利要求16至23中任何一个的装置,其中合成滤波器组由块变换实现以及
解格式器从输入信号中获得一个子带信号组序列;
解码器在子带信号组序列中识别出通用子带信号,其中对于序列中的每一组有一个或多个频谱分量是非零值而多个频谱分量的值是零,在通用子带信号中识别出通用频谱分量,其值在序列的多个相邻组中为零,所述多个相邻组或者其前面或后面是具有非零值的通用频谱分量,按照比例包络比例调整对应于零频谱分量的合成频谱分量,比例包络按照人类听觉***的时间掩蔽特征随序列中的组变化,通过在各组子带信号中用合成频谱分量代替相应的零频谱分量生成修改的子带信号序列;以及
合成滤波器组根据该修改的子带信号序列生成音频信息。
25.权利要求16至24中任何一个的装置,其中合成滤波器组由块变换实现并且该解码器通过子带信号中其它频谱分量的谱平移生成合成频谱分量。
26.权利要求16至25中任何一个的装置,其中比例包络按照人类听觉***的时间掩蔽特征变化。
27.一种生成输出信号的装置,其中该装置包括:
分析滤波器组,该滤波器组根据音频信息生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;
与分析滤波器组连接的量化器,该量化器量化频谱分量;
与量化器连接的编码器,该编码器从该组子带信号中识别一个特定子带信号,其中的一个或多个频谱分量具有非零值并用具有对应于一个阈值的最小量化水平的量化器将其量化,其中的多个频谱分量的值是零,该编码器从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的比例以用于合成和代替接收机中的零频谱分量,该接收机产生响应于输出信号的音频信息;以及
与该编码器连接的格式器,该格式器通过组合比例控制信息和代表该组子带信号的信息来产生输出信号。
28.权利要求27的装置,
获得由该组子带信号代表的音频信号音调的度量;以及
由音调的度量导出比例控制信息。
29.权利要求27或28的装置,包括一个建模组件用于:
获得由该组子带信号代表的音频信号的心理声学掩蔽估计阈值;以及
由该心理声学掩蔽估计阈值导出比例控制信息。
30.权利要求27至29中任何一个的装置,
获得由非零值和零值频谱分量代表的部分音频信号的频谱水平的两个度量;以及
由频谱水平的这两个度量导出比例控制信息。
31.一种媒体,该媒体传送指令程序且对于运行该指令程序并实施生成音频信息方法的装置是可读的,其中该方法包括:
接收输入信号并从中获得一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;
从该组子带信号中识别该特定子带信号,其中的一个或多个频谱分量具有非零值并用最小量化水平对应于一个阈值的量化器将其量化,其中的多个频谱分量的值是零;
生成分别对应于该特定子波带中零值频谱分量的合成频谱分量,并按照小于或等于阈值的比例包络进行量化;
在该特定子带信号中用合成频谱分量代替相应的零频谱分量生成一组修改的子带信号;以及
用合成滤波器组针对修改的子带信号生成音频信息。
32.权利要求31的媒体,其中比例包络是均匀的。
33.权利要求31或32的媒体,其中合成滤波器组由在相邻频谱分量之间存在频谱泄漏的块变换实现,比例包络按照一个基本上等于块变换频谱泄漏的衰减比例的比率变化。
34.权利要求31至33中任何一个的媒体,其中合成滤波器组由块变换实现,该方法包括:
在子带信号中对一个或多个频谱分量使用频域滤波器;以及
由频域滤波器的输出导出比例包络。
35.权利要求34的媒体,包括频域滤波器响应的变化是频率的函数。
36.权利要求31至35中任何一个的媒体,其中的方法包括:
获得由一组子带信号代表的音频信号音调的度量;以及
针对音调的度量调整比例包络。
37.权利要求36的媒体,其中的方法从输入信号中获得音调的度量。
38.权利要求36的媒体,其中的方法包括由零频谱分量在该特定子带信号中的排列方式导出音调的度量。
39.权利要求31至38中任何一个的媒体,其中合成滤波器组由块变换实现,该方法包括:
从输入信号获得一组子带信号;
由子带信号序列识别出通用子带信号,其中对于序列中的每一组有一个或多个频谱分量是非零值而多个频谱分量的值是零。
由通用子带信号中识别出通用频谱分量,其值在序列的多个相邻组中为零,或者其前面或后面是具有非零值的通用频谱分量;
按照比例包络针对零频谱分量调整合成频谱分量,比例包络按照人类听觉***的时间掩蔽特征随序列中的组变化。
在各组子带信号中用合成频谱分量代替相应的零频谱分量生成修改的子带信号序列;以及
用合成滤波器组针对修改的子带信号序列生成音频信息。
40.权利要求31至39中任何一个的媒体,其中合成滤波器组由块变换实现并且该方法通过子带信号中其它频谱分量的谱平移生成合成频谱分量。
41.权利要求31至40中任何一个的媒体,其中比例包络按照人类听觉***的时间掩蔽特征变化。
42.一种媒体,该媒体传送指令程序且对于运行该指令程序并实施生成输出信号方法的装置是可读的,其中该方法包括:
将分析滤波器组应用于音频信息获得量化信息并用该量化信息生成一组子带信号,每个子带信号包含代表音频信号频谱内容的一个或多个频谱分量;
从该组子带信号中识别该特定子带信号,其中的一个或多个频谱分量具有非零值并用最小量化水平对应于一个阈值的量化器将其量化,其中的多个频谱分量的值是零;
从音频信号的频谱内容中导出比例控制信息,其中比例控制信息控制合成频谱分量的量化以用于合成和代替接收机中的零频谱分量,该接收机产生对应于输出信号的音频信息;以及
将比例控制信息和代表该组子带信号的信息合成在一起以产生输出信号。
43.权利要求42的媒体,其中的方法包括:
获得由一组子带信号代表的音频信号音调的度量;以及
由音调的度量导出比例控制信息。
44.权利要求42或43的媒体,其中的方法包括:
获得由子带信号代表的音频信号的心理声学掩蔽估计值;以及
由该心理声学掩蔽估计值导出比例控制信息。
45.权利要求42至44中任何一个的媒体,其中的方法包括:
获得由非零值和零值频谱分量代表的部分音频信号频谱水平的两个度量;以及
由频谱水平的这两个度量导出比例控制信息。
CNB038139677A 2002-06-17 2003-05-30 使用频谱孔填充的音频编码*** Expired - Lifetime CN100369109C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/174,493 US7447631B2 (en) 2002-06-17 2002-06-17 Audio coding system using spectral hole filling
US10/174,493 2002-06-17

Publications (2)

Publication Number Publication Date
CN1662958A true CN1662958A (zh) 2005-08-31
CN100369109C CN100369109C (zh) 2008-02-13

Family

ID=29733607

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038139677A Expired - Lifetime CN100369109C (zh) 2002-06-17 2003-05-30 使用频谱孔填充的音频编码***

Country Status (20)

Country Link
US (4) US7447631B2 (zh)
EP (6) EP1736966B1 (zh)
JP (6) JP4486496B2 (zh)
KR (5) KR100991448B1 (zh)
CN (1) CN100369109C (zh)
AT (7) ATE473503T1 (zh)
CA (6) CA2489441C (zh)
DE (3) DE60310716T8 (zh)
DK (3) DK1736966T3 (zh)
ES (1) ES2275098T3 (zh)
HK (6) HK1070728A1 (zh)
IL (2) IL165650A (zh)
MX (1) MXPA04012539A (zh)
MY (2) MY136521A (zh)
PL (1) PL208344B1 (zh)
PT (1) PT2216777E (zh)
SG (3) SG10201702049SA (zh)
SI (2) SI2209115T1 (zh)
TW (1) TWI352969B (zh)
WO (1) WO2003107328A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102341846A (zh) * 2009-03-04 2012-02-01 韩国科亚电子股份有限公司 用于音频编码的量化
CN101802910B (zh) * 2007-09-12 2012-11-07 杜比实验室特许公司 利用话音清晰性的语音增强
CN102089806B (zh) * 2008-07-11 2012-12-05 弗劳恩霍夫应用研究促进协会 噪声填充器、噪声填充参数计算器、用于提供噪声填充参数的方法/用于提供音频信号的填充了噪声的频谱表示的方法
CN102822890A (zh) * 2010-03-30 2012-12-12 松下电器产业株式会社 音响装置
CN101802909B (zh) * 2007-09-12 2013-07-10 杜比实验室特许公司 通过噪声水平估计调整进行的语音增强
CN102007531B (zh) * 2008-07-11 2013-08-21 弗劳恩霍弗实用研究促进协会 音讯信号解码器、音讯信号编码器及提供多声道音讯信号表现形态的方法
CN105103226A (zh) * 2013-01-29 2015-11-25 弗劳恩霍夫应用研究促进协会 低复杂度音调自适应音频信号量化
CN110189760A (zh) * 2013-01-29 2019-08-30 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置

Families Citing this family (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
WO2004006625A1 (en) * 2002-07-08 2004-01-15 Koninklijke Philips Electronics N.V. Audio processing
US7889783B2 (en) * 2002-12-06 2011-02-15 Broadcom Corporation Multiple data rate communication system
MXPA05012785A (es) 2003-05-28 2006-02-22 Dolby Lab Licensing Corp Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio.
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CA2555182C (en) * 2004-03-12 2011-01-04 Nokia Corporation Synthesizing a mono audio signal based on an encoded multichannel audio signal
US8417515B2 (en) * 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
JP2008510197A (ja) * 2004-08-17 2008-04-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルなオーディオ符号化
KR20070065401A (ko) * 2004-09-23 2007-06-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 데이터를 처리하는 시스템 및 방법, 프로그램구성요소, 및 컴퓨터-판독가능 매체
BRPI0518278B1 (pt) 2004-10-26 2018-04-24 Dolby Laboratories Licensing Corporation Método e aparelho para controlar uma característica de sonoridade particular de um sinal de áudio
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7813573B2 (en) * 2005-09-08 2010-10-12 Monro Donald M Data coding and decoding with replicated matching pursuits
US20070053603A1 (en) * 2005-09-08 2007-03-08 Monro Donald M Low complexity bases matching pursuits data coding and decoding
US8121848B2 (en) * 2005-09-08 2012-02-21 Pan Pacific Plasma Llc Bases dictionary for low complexity matching pursuits data coding and decoding
US7848584B2 (en) * 2005-09-08 2010-12-07 Monro Donald M Reduced dimension wavelet matching pursuits coding and decoding
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
WO2007120452A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
JP2009534713A (ja) * 2006-04-24 2009-09-24 ネロ アーゲー 低減ビットレートを有するデジタル音声データを符号化するための装置および方法
KR101200615B1 (ko) 2006-04-27 2012-11-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 청각 이벤트 검출에 기반한 비-라우드니스를 이용한 자동 이득 제어
US20070270987A1 (en) * 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
WO2008051347A2 (en) 2006-10-20 2008-05-02 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
AU2012261547B2 (en) * 2007-03-09 2014-04-17 Skype Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5192544B2 (ja) 2007-07-13 2013-05-08 ドルビー ラボラトリーズ ライセンシング コーポレイション 聴覚情景分析とスペクトルの歪みを用いた音響処理
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
DK3591650T3 (da) 2007-08-27 2021-02-15 Ericsson Telefon Ab L M Fremgangsmåde og indretning til udfyldning af spektrale huller
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101162275B1 (ko) * 2007-12-31 2012-07-04 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
ES2654433T3 (es) * 2008-07-11 2018-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de señal de audio, método para codificar una señal de audio y programa informático
DK2320416T3 (da) * 2008-08-08 2014-05-26 Panasonic Corp Indretning til spektral udglatning, kodningsindretning, afkodningsindretning, kommunikationsterminalindretning, basisstationsindretning og fremgangsmåde til spektral udglatning
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010053287A2 (en) * 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
TWI559680B (zh) * 2009-02-18 2016-11-21 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
TWI716833B (zh) * 2009-02-18 2021-01-21 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
JP5459688B2 (ja) * 2009-03-31 2014-04-02 ▲ホア▼▲ウェイ▼技術有限公司 復号信号のスペクトルを調整する方法、装置、および音声復号システム
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
PT2491553T (pt) 2009-10-20 2017-01-20 Fraunhofer Ges Forschung Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
MX2012008075A (es) 2010-01-12 2013-12-16 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo.
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2631905A4 (en) * 2010-10-18 2014-04-30 Panasonic Corp DEVICE FOR TONE CODING AND TONE DECODING
CN105225669B (zh) * 2011-03-04 2018-12-21 瑞典爱立信有限公司 音频编码中的后量化增益校正
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
HUE037111T2 (hu) * 2011-03-10 2018-08-28 Ericsson Telefon Ab L M Nem-kódolt al-vektorok kitöltése transzformációsan kódolt audio jelekben
EP3067888B1 (en) 2011-04-15 2017-05-31 Telefonaktiebolaget LM Ericsson (publ) Decoder for attenuation of signal regions reconstructed with low accuracy
AU2012256550B2 (en) 2011-05-13 2016-08-25 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
WO2012169133A1 (ja) * 2011-06-09 2012-12-13 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
JP2013007944A (ja) * 2011-06-27 2013-01-10 Sony Corp 信号処理装置、信号処理方法、及び、プログラム
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
WO2013188562A2 (en) * 2012-06-12 2013-12-19 Audience, Inc. Bandwidth extension via constrained synthesis
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
EP2981961B1 (en) 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
JP6157926B2 (ja) * 2013-05-24 2017-07-05 株式会社東芝 音声処理装置、方法およびプログラム
EP2830055A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
EP2919232A1 (en) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding
JP6035270B2 (ja) 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
RU2572664C2 (ru) * 2014-06-04 2016-01-20 Российская Федерация, От Имени Которой Выступает Министерство Промышленности И Торговли Российской Федерации Устройство активного гашения вибрации
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
CA2957700C (en) 2014-08-08 2022-12-13 Raffaele Migliaccio Mixture of fatty acids and palmitoylethanolamide for use in the treatment of inflammatory and allergic pathologies.
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的***和方法
CN107077849B (zh) * 2014-11-07 2020-09-08 三星电子株式会社 用于恢复音频信号的方法和设备
US9875756B2 (en) 2014-12-16 2018-01-23 Psyx Research, Inc. System and method for artifact masking
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US20170024495A1 (en) * 2015-07-21 2017-01-26 Positive Grid LLC Method of modeling characteristics of a musical instrument
KR102250472B1 (ko) * 2016-03-07 2021-05-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합
DE102016104665A1 (de) 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
TWI702241B (zh) * 2016-12-09 2020-08-21 南韓商Lg化學股份有限公司 封裝組成物
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3544005B1 (en) 2018-03-22 2021-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding with dithered quantization
WO2019207036A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency audio reconstruction techniques
CN114242090A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
WO2023117145A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods
TW202333143A (zh) * 2021-12-23 2023-08-16 弗勞恩霍夫爾協會 在音訊寫碼中使用濾波用於頻譜時間改善頻譜間隙填充之方法及設備
TW202334940A (zh) * 2021-12-23 2023-09-01 紐倫堡大學 在音訊寫碼中使用不同雜訊填充方法進行頻譜時間上改良之頻譜間隙填充之方法及設備
WO2023117146A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36478A (en) * 1862-09-16 Improved can or tank for coal-oil
US3995115A (en) * 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) * 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4885790A (en) 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
EP0243562B1 (en) * 1986-04-30 1992-01-29 International Business Machines Corporation Improved voice coding process and device for implementing said process
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
JPH02183630A (ja) * 1989-01-10 1990-07-18 Fujitsu Ltd 音声符号化方式
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5583962A (en) * 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP2563719B2 (ja) 1992-03-11 1996-12-18 技術研究組合医療福祉機器研究所 音声加工装置と補聴器
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
US5402124A (en) * 1992-11-25 1995-03-28 Dolby Laboratories Licensing Corporation Encoder and decoder with improved quantizer using reserved quantizer level for small amplitude signals
US5394466A (en) * 1993-02-16 1995-02-28 Keptel, Inc. Combination telephone network interface and cable television apparatus and cable television module
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH07225598A (ja) 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JP3186489B2 (ja) * 1994-02-09 2001-07-11 ソニー株式会社 ディジタル信号処理方法及び装置
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
EP0717392B1 (en) * 1994-05-25 2001-08-16 Sony Corporation Encoding method, decoding method, encoding-decoding method, encoder, decoder, and encoder-decoder
US5748786A (en) * 1994-09-21 1998-05-05 Ricoh Company, Ltd. Apparatus for compression using reversible embedded wavelets
JP3254953B2 (ja) 1995-02-17 2002-02-12 日本ビクター株式会社 音声高能率符号化装置
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
DE69620967T2 (de) * 1995-09-19 2002-11-07 At & T Corp Synthese von Sprachsignalen in Abwesenheit kodierter Parameter
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JP3519859B2 (ja) * 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
JPH1091199A (ja) * 1996-09-18 1998-04-10 Mitsubishi Electric Corp 記録再生装置
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
JP3213582B2 (ja) * 1997-05-29 2001-10-02 シャープ株式会社 画像符号化装置及び画像復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6415251B1 (en) * 1997-07-11 2002-07-02 Sony Corporation Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP2000148191A (ja) * 1998-11-06 2000-05-26 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化装置
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
JP4843142B2 (ja) * 1999-04-16 2011-12-21 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声符号化のための利得−適応性量子化及び不均一符号長の使用
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
JP2001324996A (ja) * 2000-05-15 2001-11-22 Japan Music Agency Co Ltd Mp3音楽データ再生方法及び装置
JP3616307B2 (ja) * 2000-05-22 2005-02-02 日本電信電話株式会社 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001343998A (ja) * 2000-05-31 2001-12-14 Yamaha Corp ディジタルオーディオデコーダ
JP3538122B2 (ja) 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
GB0103245D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101802910B (zh) * 2007-09-12 2012-11-07 杜比实验室特许公司 利用话音清晰性的语音增强
CN101802909B (zh) * 2007-09-12 2013-07-10 杜比实验室特许公司 通过噪声水平估计调整进行的语音增强
CN102089806B (zh) * 2008-07-11 2012-12-05 弗劳恩霍夫应用研究促进协会 噪声填充器、噪声填充参数计算器、用于提供噪声填充参数的方法/用于提供音频信号的填充了噪声的频谱表示的方法
CN102007531B (zh) * 2008-07-11 2013-08-21 弗劳恩霍弗实用研究促进协会 音讯信号解码器、音讯信号编码器及提供多声道音讯信号表现形态的方法
CN102341846B (zh) * 2009-03-04 2013-09-25 韩国科亚电子股份有限公司 用于音频编码器的量化方法和装置
CN102341846A (zh) * 2009-03-04 2012-02-01 韩国科亚电子股份有限公司 用于音频编码的量化
CN102822890A (zh) * 2010-03-30 2012-12-12 松下电器产业株式会社 音响装置
CN105103226A (zh) * 2013-01-29 2015-11-25 弗劳恩霍夫应用研究促进协会 低复杂度音调自适应音频信号量化
CN105103226B (zh) * 2013-01-29 2019-04-16 弗劳恩霍夫应用研究促进协会 低复杂度音调自适应音频信号量化
CN110189760A (zh) * 2013-01-29 2019-08-30 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置
US10468043B2 (en) 2013-01-29 2019-11-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
US11094332B2 (en) 2013-01-29 2021-08-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
US11694701B2 (en) 2013-01-29 2023-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
CN110189760B (zh) * 2013-01-29 2023-09-12 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置

Also Published As

Publication number Publication date
EP1514261B1 (en) 2006-12-27
EP2207170A1 (en) 2010-07-14
KR20100086067A (ko) 2010-07-29
EP2209115A1 (en) 2010-07-21
MY159022A (en) 2016-11-30
SG177013A1 (en) 2012-01-30
PT2216777E (pt) 2012-03-16
KR100986152B1 (ko) 2010-10-07
IL216069A0 (en) 2011-12-29
JP2012212167A (ja) 2012-11-01
CA2735830C (en) 2014-04-08
AU2003237295A1 (en) 2003-12-31
TW200404273A (en) 2004-03-16
ATE526661T1 (de) 2011-10-15
US7447631B2 (en) 2008-11-04
SI2209115T1 (sl) 2012-05-31
PL372104A1 (en) 2005-07-11
EP2207170B1 (en) 2011-10-19
KR20050010945A (ko) 2005-01-28
HK1146145A1 (en) 2011-05-13
HK1141623A1 (en) 2010-11-12
JP5063717B2 (ja) 2012-10-31
JP5253564B2 (ja) 2013-07-31
DK1736966T3 (da) 2010-11-01
CA2736055A1 (en) 2003-12-24
DE60310716D1 (de) 2007-02-08
CA2736060C (en) 2015-02-17
SG2014005300A (en) 2016-10-28
EP1736966A3 (en) 2007-11-07
JP5345722B2 (ja) 2013-11-20
JP2012078866A (ja) 2012-04-19
EP2216777B1 (en) 2011-12-07
KR100986150B1 (ko) 2010-10-07
CA2489441C (en) 2012-04-10
US8032387B2 (en) 2011-10-04
WO2003107328A1 (en) 2003-12-24
KR100991450B1 (ko) 2010-11-04
DE60310716T8 (de) 2008-01-31
CA2489441A1 (en) 2003-12-24
IL165650A (en) 2010-11-30
SG10201702049SA (en) 2017-04-27
ATE536615T1 (de) 2011-12-15
JP2005530205A (ja) 2005-10-06
US20090144055A1 (en) 2009-06-04
CA2736046A1 (en) 2003-12-24
US7337118B2 (en) 2008-02-26
SI2207169T1 (sl) 2012-05-31
ATE529859T1 (de) 2011-11-15
PL208344B1 (pl) 2011-04-29
ES2275098T3 (es) 2007-06-01
JP5253565B2 (ja) 2013-07-31
US8050933B2 (en) 2011-11-01
EP2207169A1 (en) 2010-07-14
DE60310716T2 (de) 2007-10-11
ATE529858T1 (de) 2011-11-15
ATE470220T1 (de) 2010-06-15
KR100986153B1 (ko) 2010-10-07
CA2736065C (en) 2015-02-10
US20030233234A1 (en) 2003-12-18
MY136521A (en) 2008-10-31
JP4486496B2 (ja) 2010-06-23
ATE349754T1 (de) 2007-01-15
DK2207169T3 (da) 2012-02-06
ATE473503T1 (de) 2010-07-15
HK1141624A1 (en) 2010-11-12
KR100991448B1 (ko) 2010-11-04
TWI352969B (en) 2011-11-21
EP2207169B1 (en) 2011-10-19
EP2216777A1 (en) 2010-08-11
CA2736060A1 (en) 2003-12-24
CA2736055C (en) 2015-02-24
KR20050010950A (ko) 2005-01-28
JP2012103718A (ja) 2012-05-31
EP2209115B1 (en) 2011-09-28
US20090138267A1 (en) 2009-05-28
IL165650A0 (en) 2006-01-15
CA2735830A1 (en) 2003-12-24
IL216069A (en) 2015-11-30
KR20100086068A (ko) 2010-07-29
JP2010156990A (ja) 2010-07-15
DE60333316D1 (de) 2010-08-19
DK1514261T3 (da) 2007-03-19
DE60332833D1 (de) 2010-07-15
JP5705273B2 (ja) 2015-04-22
US20030233236A1 (en) 2003-12-18
HK1070728A1 (en) 2005-06-24
HK1070729A1 (en) 2005-06-24
CA2736065A1 (en) 2003-12-24
CN100369109C (zh) 2008-02-13
EP1514261A1 (en) 2005-03-16
HK1146146A1 (en) 2011-05-13
MXPA04012539A (es) 2005-04-28
EP1736966B1 (en) 2010-07-07
EP1736966A2 (en) 2006-12-27
JP2013214103A (ja) 2013-10-17
KR20100063141A (ko) 2010-06-10

Similar Documents

Publication Publication Date Title
CN100369109C (zh) 使用频谱孔填充的音频编码***
Painter et al. Perceptual coding of digital audio
EP1701452B1 (en) System and method for masking quantization noise of audio signals
US6240380B1 (en) System and method for partially whitening and quantizing weighting functions of audio signals
CN100367348C (zh) 低比特速率音频编码
CN1310210C (zh) 使用解码信号的特征适配合成频谱分量的音频编码***
US7428489B2 (en) Encoding method and apparatus, and decoding method and apparatus
CN1571993A (zh) 用于改善高频重建的方法
CN1897467A (zh) 信号编码、信号解码装置和方法、程序以及记录介质
JP2005338637A (ja) オーディオ信号符号化装置及び方法
US20060036435A1 (en) Method for encoding and decoding audio at a variable rate
JP4843142B2 (ja) 音声符号化のための利得−適応性量子化及び不均一符号長の使用
Singh et al. Audio watermarking based on quantization index modulation using combined perceptual masking
CN1375817A (zh) 一种基于小波变换的音频信号压缩编/解码方法
JP2005284301A (ja) 復号方法及び装置、並びにプログラム
Gunjal et al. Traditional Psychoacoustic Model and Daubechies Wavelets for Enhanced Speech Coder Performance
HE et al. Wideband Speech and Audio Coding Based on Wavelet Transform And Psychoacoustic Model
Ali et al. Efficient audio coding with optimized subband configurations
Ali et al. Efficient signal adaptive perceptual audio coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20080213

CX01 Expiry of patent term