CN101048935B - 控制音频信号的单位响度或部分单位响度的方法和设备 - Google Patents

控制音频信号的单位响度或部分单位响度的方法和设备 Download PDF

Info

Publication number
CN101048935B
CN101048935B CN2005800367607A CN200580036760A CN101048935B CN 101048935 B CN101048935 B CN 101048935B CN 2005800367607 A CN2005800367607 A CN 2005800367607A CN 200580036760 A CN200580036760 A CN 200580036760A CN 101048935 B CN101048935 B CN 101048935B
Authority
CN
China
Prior art keywords
specific loudness
audio signal
loudness
mrow
target specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800367607A
Other languages
English (en)
Other versions
CN101048935A (zh
Inventor
阿伦·J.·西非尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN101048935A publication Critical patent/CN101048935A/zh
Application granted granted Critical
Publication of CN101048935B publication Critical patent/CN101048935B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/14Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for gain control and tone control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/20Combinations of two or more types of control, e.g. gain control and tone control in frequency-selective amplifiers
    • H03G9/24Combinations of two or more types of control, e.g. gain control and tone control in frequency-selective amplifiers having semiconductor devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

本发明涉及音频信号的感觉声音响度和/或感觉频谱平衡的测量和控制。响应于至少部分在感觉(心理声学)响度域中执行的计算修改音频信号。本发明可用于例如以下之一或更多:响度补偿音量控制、自动增益控制、动态范围控制(包括例如限幅器、压缩器、扩展器等等)、动态均衡、以及补偿音频重放环境中的背景噪声。本发明不仅包括方法而且还包括相应的计算机程序和设备。

Description

控制音频信号的单位响度或部分单位响度的方法和设备 
优先权要求 
本申请要求2004年10月26日提交的序列号为60/622458以及2004年12月21提交的序列号为60/638607的美国临时专利申请的优先权。 
技术领域
本发明涉及音频信号处理。更具体而言,本发明涉及音频信号的感觉声音响度和/或感觉频谱平衡的测量和控制。本发明可用于例如以下的一个或更多方面:响度补偿音量控制、自动增益控制、动态范围控制(包括例如限幅器、压缩器、扩展器等等)、动态均衡、和补偿音频重放环境中的背景噪声干扰。 
背景技术
已经进行过许多尝试来开发令人满意的测量响度的客观方法。Fletcher和Munson在1933年确定人的听觉在低频和高频时比在中间(或话音)频率较不敏感。他们还发现敏感度的相对变化随声级的增加而降低。早先的响度测量仪由麦克风、放大器、测量器和被设计用于在低、中和高声级大致模仿听觉的频率响应的滤波器的组合而构成。 
尽管这些设备提供了单一的、恒定声级、独立音调的响度测量,但是更加复杂声音的测量不能非常好地匹配响度的主观感觉。这种类型的声级测量仪已经被标准化,但是它仅仅用于诸如监控和控制工业噪声的特定任务。 
在20世纪50年代早期,Zwicker和Stevens在开发更为逼真的响度感觉处理的模型中扩展了Fletcher和Munson的工作。Stevens于1956年在Journal of the Acoustical Society of America中发表了一种用于“Caculation of the Loudness of Complex Noise”的方法,以及Zwicker在1958年在Acoustica中发表了他的论文“Psychological andMethodical Basis of Loudness”。在1959年Zwicker发表了响度计算的图形化处理以及不久之后发表了若干类似的论文。Stevens和Zwicker方法已(分别地)标准化为ISO532部分A和B。两种方法包含类似的步骤。 
首先,通过将音频传递通过具有在临界频带速率标度上均匀间隔的中心频率的一组带通听觉滤波器模拟被称之为激励的沿内耳基膜能量的时间变化分布。每个听觉滤波器被设计成模拟沿内耳基膜在特定位置的频率响应,该滤波器的中心频率对应于这个位置。临界频带带宽定义为这样一个滤波器的带宽。以Hz为单位进行度量,这些听觉滤波器的临界带宽随中心频率的增加而增加。所以,有利的是定义曲折的频率标度以便以这种曲折标度度量的所有听觉滤波器的临界带宽是常量。这种曲折的标度被称之为临界频带速率标度并且对理解和模拟范围广泛的心理声学现象非常有用。例如,参见E.Zwicker和H.Fastl所著的Psychoacoustics-Facts and Models,Springer-Verlag,柏林,1990年。Stevens和Zwicker的方法使用被称之为Bark标度的临界频带速率标度,其中临界频带带宽在500Hz以下是常量并且在500Hz以上增加。近来,Moore和Glasberg定义了一种临界带宽速率标度,他们称其为等效矩形带宽(ERB)标度(B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness”,Journal of the Audio EngineeringSociety,Vol.45,No.4,1997年4月,pp.224-240)。通过使用陷波噪声屏蔽器的心理声学实验,Moore和Glasberg证明临界频带带宽在500Hz以下继续减小,这与临界频带带宽保持恒定的Bark标度相反。 
在激励计算之后是产生称之为“单位响度”的量的非线性压缩功能。单位响度是作为频率和时间的函数的感觉响度的度量并且可以沿诸如以上讨论的Bark或ERB标度的临界频率速率标度以每个单位频率的感觉响度为单元进行度量。最后,通过在频率上积分单位响度计 算时间变化“总响度”。当根据沿临界频带速率标度均匀分布的一组有限听觉滤波器估计单位响度时,可以通过对来自每个滤波器的单位响度简单地进行求和计算总响度。 
响度可以以“方”(phon)为单位度量。以方为单位给定声音的响度是具有等于声音响度的主观响度的1kHz音调的声压级(SPL)。传统上,SPL的基准0dB是2×10-5帕压强的均方根,所以这也是基准0方。使用这种定义在比较在除1kHz以外的频率音调的响度和在1kHz音调的响度中,等响度轮廓能够被确定用于给定的方级。 
图11所示为用于20Hz和12.5kHz之间的频率,以及4.2方(被认为是听觉的门限)和120方之间的方级的等响度轮廓(ISO226:1087(E),“Acoustics-Normal equal loudness level contours”)。这种方度量考虑人耳随频率变化的敏感度,但是结果不允许以变化的级评价声音的相对主观的响度,因为没有尝试以校正响度随SPL增加的非线性,即轮廓的间隔发生变化的事实。 
响度还可以以“宋”(sone)为单位度量。如在图11中所指示,在方单位和宋单位之间存在一一映射。1宋定义为40dB(SPL)1kHz纯正弦波的响度并且等效于40方。宋单位是这样的,即宋单位两倍的增加对应于感觉响度的加倍。例如,4宋被感觉为2宋两倍的响度。因此,以宋为单位表达响度级提供更多的信息。如果单位响度定义为作为频率和时间的函数的感觉响度的度量,单位响度可以以每单位频率宋为单位进行度量。因此,当使用Bark标度时,单位响度具有每Bark宋的单位,同理当使用ERB标度时,所述单位是每ERB宋。 
如上所述,人耳的敏感度随频率和级变化,这是在心理声学文献中充分记载的事实。其中的一个结果是给定声音的感觉频谱或音色随听到声音的声级而变化。例如,对于包含低频、中频和高频的声音,感觉的相对成比例的这些频率分量随声音的总响度变化;当无声时低频和高频分量相对于中频比当嘈杂时它们听起来更无声。这种现象是众所周知的并且已经在声音再现设备中通过所谓的响度控制减轻。响度控制是当音量下降时应用低频以及有时候还应用高频增强的音量控制。因此,人耳在频率极限处的较低敏感度被通过这些频率的人为增强进行补偿。这些控制是完全被动的;应用的补偿程度是音量控制或某些其他用户操作控制的设置的函数,而不是音频信号内容的函数。
实际上,在低频、中频和高频中感觉的相对频谱平衡的变化取决于信号,特别是其实际的频谱以及是否目的是高声或低声。考虑交响乐团的录音。在音乐厅内听众中的一员将会听到的相同级再现,无论交响乐正在大声或无声地演奏都可以校正在频谱上的平衡。如果例如以10dB较无声地再现音乐,在频谱上的感觉平衡对于大声通过以一种方式改变以及以对于无声通过以另一种方式改变。传统的被动响度控制不应用作为音乐的函数的不同的补偿。 
在Seefeldt等人于2004年5月27日申请的第PCT/US2004/016964号、2004年12月23日公开号为WO2004/111994A2的国际专利申请中,公开了一种测量和调节音频信号的感觉响度的***。指定美国的所述PCT申请在此全部包含引作参考。在所述申请中,心理声学模型以感觉单元计算音频信号的响度。另外,该申请引入了计算宽带乘法增益的技术,当该增益被应用于音频时,导致增益修正音频的响度基本上与基准响度相同。但是,这种宽带增益的应用改变了音频的感觉频谱平衡。 
发明内容
在一个方面,本发明提供通过修改音频信号以便减小它的单位响度和目标单位响度之间的差来导出可用来控制音频信号的单位响度的信息。单位响度是作为频率和时间的函数的感觉响度的度量。在实际的实现中,经修改音频信号的单位响度可以近似目标单位响度。如下所述,这种近似不仅受普遍信号处理条件而且受在修改中可以被应用的时间和/或频率平滑的影响。 
由于单位响度是作为频率和时间的函数的音频信号的感觉响度的度量,以便减小音频信号的单位响度和目标单位响度之间的差,所述修改可以修改音频信号作为频率的函数。尽管在某些情况下目标单位响度可以是时间恒定的以及音频信号典型本身可以是稳态时间恒定 的信号,但是所述修改还可以修改音频信号作为时间的函数。 
还可以应用本发明的这些方面补偿在音频重放环境中干扰的背景噪声。当在存在背景噪声的情况下倾听音频时,所述噪声可能部分或全部地以一种取决于音频级和频谱以及噪声级和频谱的方式屏蔽该音频。结果是音频感觉频谱的改变。根据心理声学研究(例如参见Moore、Glasberg、和Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness”,J.Audio Eng.Soc.,Vol.45,No.4,1997年4月),可将音频的“部分单位响度”定义为在存在诸如噪声的次干扰声音信号的情况下音频的感觉响度。 
因此,在另一个方面,本发明提供通过修改音频信号以便减小它的部分单位响度和目标单位响度之间的差来导出控制音频信号的部分单位响度可使用的信息。这样做以感觉精确的方式减轻了噪声的影响。在考虑到干扰噪声信号的本发明这个方面和其他方面,假设存在对音频信号和次干扰信号的单独地存取。 
在另一个方面,本发明提供通过修改音频信号以便减小它的单位响度和目标单位响度之差来控制音频信号的单位响度,其中所述修改从传输接收或从存储媒体再现音频和目标单位响度或目标单位响度的表示。 
在另一个方面,本发明提供通过修改音频信号以便减小它的部分单位响度和目标单位响度之差来控制音频信号的部分单位响度。 
当目标单位响度不是音频信号的函数时,它可能是一个已存储的或接收的目标单位响度。当目标单位响度不是音频信号的函数时,修改或导出可以显式或隐式地计算单位响度或部分单位响度。显式计算的实例包括查询表或“封闭式”数学表达式,其中本质上是确定单位响度和/或部分单位响度(术语封闭式的意思是描述使用有限数量的标准数学运算和函数,诸如指数和余弦来精确地表示的数学表达式)。而且当目标单位响度不是音频信号的函数时,目标单位响度可以是时间和频率恒定的或者它可以仅仅是时间恒定的。 
在再一个方面,本发明提供通过根据一个或更多处理以及一个或更多处理控制参数处理音频信号或音频信号的度量以产生目标单位响度来处理音频信号。尽管目标单位响度可以是时间恒定(“固定”)的,但是目标单位响度可以有利地是音频信号的单位响度的函数。尽管它典型可以是静态的、频率和时间恒定的信号,但是音频信号本身是频率和时间变化的,因此当它是音频信号的函数时导致目标单位响度也是频率和时间变化的。 
可以从发送接收或根据存储媒体再现所述音频和目标单位响度或目标单位响度的表示。 
目标单位响度的表示可以是定标音频信号或音频信号度量的一个或更多定标因子。 
本发明的任何上述方面的目标单位响度可以是音频信号或音频信号度量的函数。音频信号的一种适当的度量是音频信号的单位响度。音频信号或音频信号度量的函数可以是音频信号或音频信号度量的定标。例如,所述定标可以是以下定标之一或其组合: 
(a)时间和频率变化定标因子Ξ[b,t]定标单位响度为如下关系 
N ^ [ b , t ] = Ξ [ b , t ] N [ b , t ] ;
(b)时间变化、频率恒定的定标因子Φ[t]定标单位响度为如下关系 
N ^ [ b , t ] = Φ [ t ] N [ b , t ] ;
(c)时间恒定、频率变化的定标因子Θ[b]定标单位响度为如下关系 
N ^ [ b , t ] = Θ [ b ] N [ b , t ] ; 和 
(d)时间恒定、频率恒定的定标因子α定标音频信号的单位响度为如下关系 
N ^ [ b , t ] = αN [ b , t ] ,
其中 
Figure G05836760720070428D000065
是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。 
在时间和频率变化定标因子的情况(a)中,至少可以部分地通过期望的多频带响度和音频信号的多频带响度之比确定所述定标。这种定标可以用作动态范围控制。应用本发明的这些方面作为动态范围 控制的进一步细节在以下进行阐述。 
而且在时间和频率变化定标因子的情况(a)中,通过期望频谱形状的度量和音频信号频谱形状的度量之比可以定标所述单位响度。这种定标可以被应用于将音频信号的感觉频谱从时间变化的感觉频谱变换成基本上时间恒定的感觉频谱。当通过期望频谱形状的度量和音频信号频谱形状的度量定标单位响度时,这种定标可以用作动态均衡器。应用本发明的这些方面作为动态均衡器的进一步细节在以下进行阐述。 
在时间变化、频率恒定定标因子的情况(b)中,至少可以部分地通过期望的宽带响度和音频信号的宽带响度之比来确定所述定标。这种定标可以用作自动增益控制或动态范围控制。应用本发明的这些方面作为自动增益控制或动态范围控制的进一步细节在以下进行阐述。 
在情况(a)(时间和频率变化定标因子)或情况(b)(时间变化、频率恒定定标因子)中,所述定标因子可以是音频信号或音频信号度量的函数。 
在时间恒定、频率变化定标因子的情况(c)或时间恒定、频率恒定定标因子的情况(d)中,所述修改或导出可以包括存储定标因子或从外部来源接收定标因子。 
在(c)和(d)的任何一种情况中,定标因子可以不是音频信号或音频信号度量的函数。 
在本发明各个方面及其变型中任何一个中,修改、导出、或再现可以以不同的方式、显式或隐式地计算(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。显式计算可以包含例如查询表或封闭式数学表达式。 
修改参数可以被时间平滑。修改参数可以例如是(1)和音频信号频带相关的多个幅度定标因子或(2)控制诸如多抽头FIR滤波器或多极IIR滤波器的一个或更多滤波器的多个滤波器系数。所述定标因子或滤波器系数(以及应用它们的滤波器)可以是时间变化的。 
在计算定义目标单位响度的音频信号的单位响度的函数或该函数的反函数中,执行这种计算的处理以可以被表征为感觉(心理声学)响度域的方式操作-该计算的输入和输出是单位响度。相反,在应用幅度定标因子于音频信号的频带中或应用滤波器系数于音频信号的可控制滤波中,修改参数进行操作以修改在可以被表征为电信号域的感觉(心理声学)响度域之外的音频信号。尽管对音频信号的修改可以用于电信号域中的音频信号,但是在感觉(心理声学)响度域中根据计算导出这种电信号域中的改变以便经修改的音频信号具有近似期望的目标单位响度的单位响度。 
通过根据在响度域中的计算导出修改参数,可以比如果在电信号域中导出这种修改参数实现在感觉响度和感觉频谱平衡上的较强控制。另外,在执行响度域计算中使用模拟心理声学滤波器组的基膜或其等效物可以比在电信号域中导出修改参数的结构提供更详细的感觉频谱控制。 
修改、导出、和再现中的每一个可以取决于干扰音频信号度量、目标单位响度、根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度估计、未经修改音频信号的单位响度、以及根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度近似中一个或更多。 
所述修改或导出可以至少部分地根据干扰音频信号的度量、目标单位响度、根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度的估计、未经修改音频信号的单位响度、以及根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度的近似之一或更多导出修改参数。 
更具体而言,所述修改或导出可以至少部分地根据以下导出修改参数: 
(1)目标单位响度和从经修改音频信号的单位响度所导出的未经修改音频信号的单位响度的估计之一,以及 
(2)未经修改音频信号的单位响度和根据经修改音频信号的单 位响度导出的目标单位响度的近似之一,或者 
当考虑干扰音频信号时,所述修改或导出可以至少部分地根据以下导出修改参数: 
(1)干扰音频信号的度量, 
(2)目标单位响度和根据经修改音频信号的部分单位响度导出的未经修改音频信号的单位响度估计之一,以及 
(3)未经修改音频信号的单位响度和根据经修改音频信号的部分单位响度导出的目标单位响度的近似之一。 
可以应用前馈结构,其中根据音频信号导出单位响度以及从方法外部源接收目标单位响度或者当修改或导出包括存储目标单位响度时从存储接收该目标单位响度。可替换地,可以应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及从方法外部源接收目标单位响度或者当所述修改或导出包括存储目标单位响度时从存储接收该目标单位响度。 
所述修改或导出可以包括用于显式或隐式获得目标单位响度的一个或更多处理,其中的一个处理或更多处理显式或隐式地计算音频信号或音频信号度量的函数。在一种替换中,可以应用根据音频信号导出单位响度和目标单位响度的前馈结构,目标单位响度的导出应用音频信号或音频信号度量的函数。在另一种替换中,可以应用根据经修改音频信号导出目标单位响度的近似以及根据音频信号导出目标单位响度的混合前馈/反馈结构,目标单位响度的导出应用音频信号或音频信号度量的函数。 
所述修改或导出可以包括显式或隐式地响应于经修改的音频信号获得未经修改音频信号的单位响度估计的一个或更多处理,其中一个处理或更多处理显式或隐式地计算音频信号或音频信号度量的函数的反函数。在一种替换中,应用根据经修改音频信号导出未经修改音频信号的单位响度的估计和目标单位响度的近似的反馈结构,单位响度的估计使用音频信号音频信号度量的函数的反函数或进行计算。在另一种替换中,应用根据音频信号导出单位响度以及根据经修改音频 信号导出未经修改音频信号的单位响度估计的混合前馈/反馈结构,估计的导出使用音频信号或音频信号度量的所述函数的反函数进行计算。 
修改参数可以应用于音频信号以产生经修改的音频信号。 
本发明的另一个方面在于可以存在处理或设备的时间和/或空间分离,以便实际上存在编码器或编码以及还有解码器或解码。例如,可以存在编码/解码***,其中所述修改或导出可以发送和接收或存储以及还再现音频信号以及(1)修改参数或(2)目标单位响度或目标单位响度的表示。可替换地,实际上可以仅存在编码器或编码,其中发送或存储音频信号和(1)修改参数或(2)目标单位响度或目标单位响度的表示。可替换地,如上所述,实际上可以仅存在解码器或解码,其中接收和再现音频信号(1)修改参数或(2)目标单位响度或目标单位响度的表示。 
附图说明
图1是示例根据本发明方面的前馈实现实例的功能框图。 
图2是示例根据本发明方面的反馈实现实例的功能框图。 
图3是示例根据本发明方面的混合前馈/反馈实现实例的功能框图。 
图4是示例根据本发明方面的另一种混合前馈/反馈实现实例的功能框图。 
图5是示例可以存储或发送如通过前馈、反馈、和混合前馈反馈结构中任何一个所确定的未经修改音频信号和修改参数用于例如时间或空间分离设备或处理中的方式的功能框图。 
图6是示例可以存储或发送如通过前馈、反馈、和混合前馈反馈结构中任何一个所确定的未经修改音频信号和目标单位响度或其表示用于例如时间或空间分离设备或处理中的方式的功能框图。 
图7是显示本发明方面的概述的示意功能框图或示意流程图。 
图8是在本发明实施例中适合用作传输滤波器的线性滤波器P (z)的理想特性响应,其中垂直轴是单位为分贝(dB)的衰减以及水平轴是对数底为10单位为Hz的频率。 
图9所示为ERB频率标度(垂直轴)和单位为Hz的频率(水平轴)之间的关系。 
图10所示为近似临界频带的设置的理想听觉滤波器特性响应。水平标度是单位为Hz的频率以及垂直标度是单位为分贝的级。 
图11所示为ISO226的等响度轮廓。水平标度是单位为Hz的频率(对数底为10的标度)以及垂直标度是单位为分贝的声压级。 
图12所示为通过传输滤波器P(z)规格化的ISO226的等响度轮廓。水平标度是单位为Hz的频率(对数底为10的标度)以及垂直标度是单位为分贝的声压级。 
图13a是显示用于在柔和语音段上0.25响度定标的宽带和多频带增益的理想化图。水平标度是ERB频带和垂直标度是单位为分贝(dB)的相对增益。 
图13b是分别显示原始信号、宽带增益修改信号、以及多频带增益修改信号的单位响度的理想化图。水平标度是ERB频带以及垂直标度是单位响度(宋/ERB). 
图14a是显示作为用于典型AGC的Li[t]的函数的L0[t]的理想化图。水平标度是log(Li[t])以及垂直标度是log(L0[t])。 
图14b是显示作为用于典型DRC的Li[t]的函数的L0[t]的理想化图。水平标度是log(Li[t])以及垂直标度是log(L0[t])。 
图15是显示用于多频带DRC的典型频带平滑函数的理想化图。水平标度是频带号以及垂直标度是频带b的增益输出。 
图16是显示本发明方面的概述的示意功能框图或示意流程图。 
图17是类似于图1的示意功能框图或示意流程图,它还包括补偿重放环境中的噪声。 
具体实施方式
图1到4所示为示例根据本发明方面的可能的前馈、反馈、以及 两种型式的混合前馈/反馈实现实例的功能框图。 
参考图1中的前馈拓扑的实例,音频信号被施加于两个通道:(1)具有能够响应于修改参数以修改音频的处理或设备2的信号通道(“修改音频信号”),和(2)具有能够产生这些修改参数的处理或设备4的控制通道(“产生修改参数”)。在图1中前馈拓扑实例以及图2-4每个实例中的修改音频信号2可以是根据从产生修改参数4(或分别从图2-4每个实例中的对应处理或设备4’、4”和4”’)接收的修改参数M以频率和/或时间变化的方式修改音频信号例如其幅度的设备或处理。产生修改参数4及其图2-4中的对应部分的每一个至少部分在感觉响度域中操作。在图1-4的每个实例中修改音频信号2在电信号域中操作并产生修改的音频信号。而且在图1-4的每个实例中,修改音频信号2和产生修改参数4(或其对应部分)修改所述音频信号以减小其单位响度和目标单位响度之间的差值。 
在图1的前馈实例中,处理或设备4可以包括若干处理和/或设备:响应于音频信号或音频信号的度量诸如音频信号的单位响度计算目标单位响度“计算目标单位响度”处理或设备6,响应于音频信号或音频信号的度量诸如它的激励计算音频信号的单位响度的“计算单位响度”处理或设备8,以及响应于单位响度和目标单位响度计算修改参数的“计算修改参数”处理或设备10。计算目标单位响度6可以执行一个或更多函数“F”,每个函数可以具有函数参数。例如,它可以计算音频信号的单位响度以及然后应用一个或更多函数F给它以提供目标单位响度。这在图1中被示意性指示为处理或设备6的“选择函数F和函数参数”输入。代替通过设备或处理6进行计算,目标单位响度可以由包括在产生修改参数4中或与它相关的存储处理或设备(示意性示为处理或设备10的“存储”输入)提供,或者通过整个处理或设备的外部源(示意性示为处理或设备10的“外部”输入)提供。因此,所述修改参数至少部分基于在感觉(心理声学)响度域中的计算(即,至少单位响度,以及在某些情况下基于目标单位响度计算)。 
处理或设备6、8和10(以及图2实例中的处理或设备12、14、 10’,图3实例中的6、14、10”,图4实例中的8、12、10”’)执行的计算可以被显式和/或隐式地执行。显式执行的实例包括(1)查询表,它的项目全部或部分地基于单位响度和/或目标单位响度和/或修改参数计算,以及(2)封闭式数学表达式,它本质上全部或部分地基于单位响度和/或目标单位响度和/或修改参数。 
尽管示意性示出并且单独地描述图1实例的计算处理或设备6、8和10(以及图2实例中的处理或设备12、14、10’,图3实例中的6、14、10”,图4实例中的8、12、10”’),但是这仅仅是为了说明的目的。将会明白这些处理或设备的部分或全部可以被组合到单个处理或设备中或以不同的方式组合到多个处理或设备中。例如,在以下图9的结构中,如图1实例中的前馈拓扑,计算修改参数的处理或设备响应于根据音频信号和目标单位响度导出的平滑激励这样做。在图9的实例中,显式计算修改参数的设备或处理计算音频信号的单位响度。 
作为本发明的一个方面,在图1的实例以及在这里本发明实施例的其他实例中,通过利用一个或更多定标因子定标所述单位响度N[b,t]可以计算目标单位响度 
Figure G05836760720070428D000131
这种定标可以是以如下关系定标所述单位响度的时间和频率变化的定标因子Ξ[b,t]: 
N ^ [ b , t ] = Ξ [ b , t ] N [ b , t ] ,
以如下关系定标单位响度的时间变化、频率恒定的定标因子Ф[t]: 
N ^ [ b , t ] = Φ [ t ] N [ b , t ] ,
以如下关系定标单位响度的时间恒定、频率变化的定标因子Θ[b]: 
N ^ [ b , t ] = Θ [ b ] N [ b , t ] , 或 
以如下关系定标音频信号的单位响度的定标因子α: 
N ^ [ b , t ] = αN [ b , t ] ,
其中,b是频率的度量(例如频带号)以及t是时间的度量(例如块号)。还可以使用特定定标的多个实例和/或特定定标的组合应用多个定标。以下给出这些多个定标的实例。在某些情况下,如以下进一步的说明,所述定标可以是音频信号或音频信号度量的函数。在其他情况下,正如以下进一步的说明,当所述定标不是音频信号度量的函数 时,同样可以确定或提供该定标。例如,用户能够选择或应用时间和频率恒定的定标因子α或时间恒定、频率变化的定标因子Θ[b]定标。 
因此,目标单位响度可以被表示为音频信号或音频信号度量的一个或更多函数F(单位响度是音频信号的一个可能的度量): 
N ^ [ b , t ] = F ( N [ b , t ] ) .
如果函数F是可逆的,未经修改音频信号的单位响度(N[b,t])可以计算为目标单位响度 
Figure G05836760720070428D000142
的反函数或函数F-1: 
N [ b , t ] = F - 1 ( N ^ [ b , t ] ) .
正如在以下将会看到,在图2和4的反馈和混合前馈/反馈实例中计算反函数或函数F-1。 
用于计算目标单位响度6的“选择函数和函数参数”输入被示出以指示设备或处理6可以根据一个或更多函数参数通过应用一个或更多函数计算目标单位响度。例如,计算目标单位响度8可以计算音频信号的单位响度的函数“F”以便定义目标单位响度。例如,“选择函数参数”输入可以选择落入上述类型定标之一或更多中的一个或更多特定函数,以及诸如关于函数的常数(例如定标因子)的一个或更多函数参数。 
如上所指示,与定标相关的所述定标因子可以用作目标单位响度的表示因为目标单位响度可以被计算单位响度的定标。因此,在以下描述和上述的图9实例中,可以通过定标因子和激励对查询表进行索引,从而单位响度和目标单位响度的计算固有位于该表中。 
无论是应用查询表、封闭式数学表达式还是其他技术,产生修改参数4的操作(及其在图2-4每个实例中的对应处理或设备4’、4”和4”’)都是这样的,即所述计算基于感觉(心理声学)响度域即使可以不显式地计算单位响度和目标单位响度。存在显式的单位响度或存在抽象的隐式单位响度。类似地,存在显式的目标单位响度或存在抽象的隐式目标单位响度。在任何情况下,修改参数的计算旨在产生修改音频信号以减小单位响度和目标单位响度之差的修改参数。 
在具有诸如噪声的次干扰音频信号的重放环境中,计算修改参数 10(及其分别在图2-4每个实例中的对应处理或设备10’、10”和10”’)还可以接收这种次干扰音频信号的度量作为可选的输入或者次干扰信号本身作为其输入之一。这种可选的输入在图1(以及图2-4)中示为虚引线。次干扰信号的度量可以是它的激励诸如在以下描述的图17实例中。应用干扰信号度量或信号本身(假设干扰信号单独可用于处理)于图1中的计算修改参数处理或设备10(及其分别在图2-4实例中的相应处理或设备10’、10”和10”’)允许适当配置的这种处理或设备在标题“噪声补偿”下如以下进一步的说明计算考虑干扰信号的修改参数。在图2-4的实例中,部分单位响度的计算假设干扰信号的适当度量不仅被应用于相应的计算修改参数10’、10”或10”’,而且还被应用于“计算未经修改音频的单位响度的近似”处理或设备12和/或“计算目标单位响度的近似”处理或设备14以便方便通过该函数或设备计算部分单位响度。在图1的前馈实例中,不显式地计算部分单位响度-图1的计算修改参数10计算适当的修改参数以使经修改音频的部分单位响度近似所述目标单位响度。这在以下的标题“噪声补偿”下进行进一步的说明。 
如上所述,在图1-4的每个实例中,当修改参数M被音频信号修改器2应用于音频信号时,该参数减小所产生的经修改音频信号的单位响度或部分单位响度与目标单位响度之差。在理想情况下,经修改音频信号的单位响度与目标单位响度严密地近似或相同。所述修改参数M例如可以采取被应用于根据滤波器组所导出频带的时间变化增益因子或时间变化滤波器系数的形式。因此,在所有图1-4实例中,修改音频信号2可以例如被实现为多个幅度定标器,每个定标器在一频带中工作,或实现为时间变化滤波器(例如,多抽头FIR滤波器或多极IIR滤波器)。 
在本文的这里或其他地方,使用相同的附图标记指示设备或处理可以基本上与另一个或其他具有相同附图标记的设备或处理相同。具有撇号的附图标记(例如,10’)指示该设备或处理在结构或功能方面相类似但可以是具有相同基本附图标记或其带撇号型式的另一个或其 他设备或处理的修改。 
在一定的约束下,可以实现图1中前馈实例的几乎等效的反馈结构。图2描述了音频信号还在单个通道中被应用于修改音频信号处理或设备2的这样一个实例。处理或设备2还从控制通道接收修改参数M,反馈结构中的产生修改参数处理或设备4’在该通道中从修改音频信号2的输出接收经修改的音频信号作为它的输入。因此,在图2的实例中,经修改的音频而不是未经修改的音频被应用于控制通道。修改音频信号处理或设备2以及产生修改参数处理或设备4’修改所述音频信号以减小它的单位响度和目标单位响度之间的差。处理或设备4’可以包括若干功能或设备:“计算未经修改音频单位响度的近似”处理或设备12、“计算目标单位响度的近似”处理或设备14、以及计算修改参数的“计算修改参数”处理或设备10’。 
利用函数F可逆的约束,处理或设备12通过应用反函数F-1给经修改音频信号的单位响度或部分单位响度估计未经修改音频信号的单位响度。如上所述,设备或处理12可以计算反函数F-1。这在图2中被示意性指示为处理或设备12的“选择反函数F-1和函数参数”输入。“计算目标单位响度的近似”14通过计算经修改音频信号的单位响度或部分单位响度进行操作。这种单位响度或部分单位响度是目标单位响度的近似。未经修改音频信号的单位响度的近似和目标单位响度的近似被计算修改参数10’用来导出修改参数M,如果该参数被修改音频信号2应用于音频信号,它将减小经修改音频信号的单位响度或部分单位响度与所述目标单位响度之差。如上所述,这些修改参数M可以例如采取被应用于滤波器组频带的时间变化增益或时间变化滤波器的系数的形式。在计算修改参数10”的实际实施例中,反馈环路可能在修改参数M的计算和应用之间引入延迟。 
如上所述,在具有诸如噪声的次干扰音频信号的重放环境中,计算修改参数10、计算未经修改音频单位响度的近似12、以及计算目标单位响度的近似14其每一个可以接收这种次干扰音频信号的度量作为可选的输入或次干扰信号本身作为其输入之一并且处理或设备12 以及处理或设备14每个可以计算经修改音频信号的部分单位响度。在图2中使用虚引线示出这种可选的输入。 
如上所述,本发明方面的混合前馈/反馈实现实例也是可能的。图3和4示出了这些实现的两个实例。正如在图1和2的实例中,在图3和4的实例中,所述音频信号还在信号通道中被应用于修改音频信号处理或设备2,但是产生修改参数(图3中的4”和图4中的4”’)在相应的控制通道中每个都接收未经修改的音频信号和经修改的音频信号。在图3和4的实例中,修改音频信号2和产生修改参数(分别是4”和4”’)修改所述音频信号以减小它的可能是隐式的单位响度和也可以是隐式的目标单位响度之间的差。 
在图3的实例中,产生修改参数处理或设备4’可以包括若干功能和或设备:如图1实例中的计算目标单位响度6、如图2反馈实例中的计算目标单位响度的近似14、以及如图1实例中的“计算修改参数”处理或设备10”。如在图1的实例中,在这种混合前馈/反馈实例的前馈部分中,计算目标单位响度6可以执行一个或更多函数“F”,其中每个函数可以具有函数参数。这在图3中被示意性指示为处理或设备6的“选择函数F和函数参数”输入。在这种混合前馈/反馈实例的反馈部分中,经修改的音频信号被应用于计算目标单位响度14的近似,如在图2的反馈实例中。设备或处理14在图3的实例中如在图2的实例一样通过计算经修改音频信号的单位响度或部分单位响度进行操作。这种单位响度或部分单位响度是目标单位响度的近似。目标单位响度(来自处理或设备6)以及目标单位响度的近似(来自处理或设备14)被应用于计算修改参数10”以导出修改参数M,如果该参数被修改音频信号2应用于音频信号,将减小未经修改音频信号的单位响度和目标单位响度之差。如上所述,这些修改参数M可以例如采取应用于滤波器组频带的时间变化增益或时间变化滤波器系数的形式。在实际的实施中,反馈环路可以在修改参数M的计算和应用之间引入延迟。如上所述,在具有诸如噪声的次干扰音频信号的重放环境中,计算修改参数10”和计算目标单位响度14的近似其中每一个还可以接收这种次 干扰音频信号的度量作为可选的输入或次干扰信号本身作为它的输入之一以及处理或设备14可以计算经修改音频信号的部分单位响度。所述可选的输入在图3中使用虚引线示出。 
计算修改参数10”可以应用误差检测设备或函数,从而它的目标单位响度和目标单位响度近似输入之差调节所述修改参数以减小目标单位响度的近似和“实际的”目标单位响度之间的差。这些调节减小未经修改音频信号的单位响度和可以是隐式的所述目标单位响度之间的差。因此,修改参数M可以被基于在前馈通道中根据原始音频的单位响度使用函数F计算的目标单位响度和在反馈通道中根据经修改音频的单位响度或部分单位响度计算的目标单位响度近似之间的误差进行更新。 
在图4的实例中,示出了替换的前馈/反馈实例。这种替换不同于图3的实例之处在于在反馈通道中计算反函数或函数F-1而不是在前馈通道中计算函数F。在图4的实例中,产生修改参数处理或设备4’可以包括若干功能和或设备:如图1前馈实例中的计算单位响度8、如图2反馈实例中的计算未经修改音频信号12的单位响度的近似、以及计算修改参数10”’。如图1前馈实例中的计算单位响度8提供未经修改音频信号的单位响度作为计算修改参数10”’的输入。如在图2的反馈实例中,约束条件是函数F是可逆的,处理或设备12通过应用反函数F-1给经修改音频信号的单位响度或部分单位响度以估计未经修改音频信号的单位响度。如上所述,计算未经修改音频12的单位响度近似的“选择反函数和反函数参数”输入被示出以指示设备或处理12可以计算反函数F-1。这在图4中被示意性指示为处理或设备12的“选择反函数F-1和函数参数”输入。因此,处理或设备12提供未经修改音频信号的单位响度的近似作为计算修改参数10”’的另一个输入。 
如在图1-3的实例中,计算修改参数10”’导出修改参数M,如果该参数被修改音频信号2应用于音频信号,将减小未经修改音频信号的单位响度和在本实例中隐式的目标单位响度之间的差。如上所述,修改参数M可以例如采取应用于滤波器组频带的时间变化增益或时 间变化滤波器系数的形式。在实际的实施中,反馈环路可以在修改参数M的计算和应用之间引入延迟。如上所述,在具有诸如噪声的次干扰音频信号的重放环境中,计算修改参数10”’和计算未经修改音频12的单位响度近似其中每个还接收这种次干扰音频信号的度量作为可选的输入或次干扰信号本身作为它的输入之一以及处理或设备12可以计算经修改音频信号的部分单位响度。所述可选的输入在图4中使用虚引线示出。 
计算修改参数10”’可以应用误差检测设备或函数,从而它的目标单位响度和目标单位响度近似输入之差产生调节所述修改参数的输出以减小单位响度的近似和“实际的”单位响度之间的差。由于单位响度的近似根据经修改音频的单位响度或部分单位响度进行导出,这能够被视为目标单位响度的近似,所以这些调节将减小经修改音频信号的单位响度和目标单位响度之间的差,所述单位响度近似在本质上以F-1函数。因此,修改参数M可以基于在前馈通道中根据原始音频计算的单位响度,和在反馈通道中使用反函数或函数F-1根据经修改音频的单位响度或部分单位响度计算的单位响度近似之间的误差进行更新。由于所述反馈通道,实际的实现可以在修改参数的更新和应用之间引入延迟。 
尽管图1-4实例中的修改参数M当被应用于修改音频信号处理或设备2时减小音频信号的单位响度和目标单位响度之差,在实际的实施中响应于同一音频信号产生的相应修改参数不可以彼此相同。 
尽管对于本发明的方面不关键或不必要,音频信号或经修改音频信号的单位响度的计算可以有利地应用在第PCT/US2004/016964号、公开号为WO2004/111964A2的所述国际专利申请中所阐述的技术,其中所述计算从一组两个或更多单位响度模型函数中选择两个或更多单位响度模型函数之一或组合,这种选择受输入音频信号特征的度量的控制。图1中单位响度104的描述在以下描述了这种结构。 
根据本发明的其他方面,未经修改的音频信号和(1)修改参数或(2)目标单位响度或目标单位响度的表示(例如在显式或隐式地计 算目标单位响度中可使用的定标因子)可以被存储或发送用于例如时间和/或空间分离的设备或处理中。修改参数、目标单位响度、或目标单位响度的表示可以以任何适当的方式确定,例如以如上所述的图1-4的前馈、反馈、和混合前馈反馈结构实例之一。实际上,诸如图1实例中的前馈结构是最小复杂度和最快速的因为它避免了基于经修改音频信号的计算。发送或存储未经修改音频和修改参数的实例在图5中示出,而发送或存储未经修改音频和目标单位响度或目标单位响度表示的实例在图6中示出。 
诸如图5实例中的结构可以被用于时间和/或空间地分离修改参数到音频信号的应用与这些修改参数的产生。诸如在图6实例中的结构可以被用于时间和/或空间地分离修改产生的产生和应用与目标单位响度或目标单位响度表示的产生。两种类型的结构有可能产生简单低成本的重放或接收结构,这种结构避免了产生修改产生或产生目标单位响度的复杂性。尽管图5类型的结构比图6类型的结构更简单,但是图6的结构所具有的优点是存储或发送所需的信息可以更少,特别是当存储或发送目标单位响度的表示,诸如一个或更多定标因子时。这种信息存储或发送的减小在低比特率音频环境中尤其有用。 
相应地,本发明的其他方面提供一种设备或处理(1)从存储或发送设备或处理接收或重放修改参数M并将它们应用于还接收的音频信号或(2)从存储或发送设备或处理接收或重放目标单位响度或目标单位响度的表示,通过应用目标单位响度或目标单位响度表示给还接收的所述音频信号(或音频信号的度量诸如它的单位响度,该度量可以从音频信号导出)产生修改参数M,并将修改参数M应用于接收的音频信号。这些设备或处理可以被表征为解码处理或解码器;而产生存储或发送的信息所需的设备或处理可以被表征为编码处理或编码器。这些编码处理或编码器是图1-4结构实例可用于通过相应的解码处理或解码器产生所需信息的那些部分。这些解码处理器或解码器可以与实际上任何类型的处理和/或再现声音的处理或设备相关或一起操作。 
在本发明的一个方面,如在图5的实例中,未经修改的音频信号和例如通过修改参数产生处理或发生器诸如图1的产生修改参数4、图2的4’、图3的4”或图4的4”’产生的修改参数M可以被应用于任何适当的存储或发送设备或函数(“存储或发送”)16。在使用图1中的前馈实例作为编码处理或编码器的情况下,修改音频信号2将不需要用于产生经修改的音频并且如果不需要在编码器或编码处理的时间或空间位置上提供经修改的音频则它能够被省略。存储或发送16可以包括例如任何适当的磁性、光学或固态存储和重放设备或任何适当的有线或无线发送和接收设备,所述这些设备的选择对于本发明来说并不关键。重放或接收的修改参数然后可以被应用于在图1-4实例中所应用类型的修改音频信号2,以修改重放或接收的音频信号,从而它的单位响度近似目标单位响度或本质上位于导出修改参数的结构中。所述修改参数可以以各种方式中的任何一种进行存储或发送。例如,它们可以作为伴随音频信号的元数据被存储或发送,它们可以在独立通道或信道中被发送,它们可以在音频中被用密码编码,它们可以被多路复用等等。使用修改参数修改音频信号可以是可选的,如果可选,它们的使用也是例如通过用户可选择的。例如,如果修改参数被应用于音频信号,该修改参数可能减小音频信号的动态范围。是否应用这种动态范围减小是能够通过用户可选择的。 
在本发明的另一个方面,如在图6的实例中,未经修改的音频信号和目标单位响度或目标单位响度表示可以被应用于任何适当的存储或发送设备或函数(“存储或发送”)16。在使用诸如图1实例的前馈结构作为编码处理或编码器的情况下,不论计算修改参数10类型的处理或设备还是修改音频信号2类型的处理或设备都不需要并且如果不需要在编码器或编码处理的时间或空间位置上提供经修改音频的修改参数它们能够被省略。如在图5实例的情况下,存储或发送16可以包括例如任何适当的磁性、光学或固态存储和重放设备或任何适当的有线或无线发送和接收设备,这些设备的选择对于本发明来说并不关键。重放或接收的目标单位响度或目标单位响度表示然后可以与未经修改 的音频一起被应用于在图1实例中所应用类型的计算修改参数10,或在图3实例中所应用类型的计算修改参数10”,以提供任何被应用于在图1-4实例中所应用类型的修改音频信号2的修改参数M,以修改重放或接收的音频信号从而它的单位响度近似目标单位响度或本质上位于导出修改参数的结构中。尽管图1实例类型的编码处理或编码器中可以最容易地获得目标单位响度或目标单位响度表示,但是在图2到4实例类型的编码处理或编码器中也可以获得目标单位响度或目标单位响度表示或目标单位响度或目标单位响度表示的近似(在图2和3的处理或设备14中以及在图4的处理或设备12中计算近似)。目标单位响度或目标单位响度表示可以以各种方式中的任何一种方式被存储或发送。例如,它可以作为伴随音频信号的元数据被存储或发送,它可以在单独的通道或信道中发送,它可以在音频中被用密码编码,它可以被多路复用等等。使用根据存储或发送的目标单位响度或表示导出的修改参数修改音频信号可以是可选的,如果可选,它们的使用可以是例如通过用户可选择的。例如,如果修改参数被应用于音频信号,该参数可能减小音频信号的动态范围。是否应用这种动态范围减小是能够通过用户可选择的。 
当实现本公开的发明为数字***时,前馈结构是最实际的,所以以下将详细地描述这些结构的实例,应该明白本发明的范围并不受到这种限制。 
在本申请的全文中,术语诸如“滤波器”或“滤波器组”在这里被用于包括基本上任何形式的递归和非递归滤波诸如IIR滤波器或变换,以及“滤波的”信息是应用这些滤波器的结果。以下描述的实施例应用通过变换实现的滤波器组。 
图7描述了以前馈结构实施的本发明一个方面的示意性实施例进一步的细节。音频首先通过分析滤波器组函数或设备(“分析滤波器组”)100,它将音频信号分离成多个频带(因此,图5所示为来自分析滤波器组100的多个输出,每个输出表示一个频带,输出维持各种函数或设备到将频带求和成组合的宽带信号的合成滤波器组,如以下 进一步的描述)。与分析滤波器组100中的每个频带相关的滤波器的响应被设计成模拟在内耳基膜的特定位置处的响应。分析滤波器组100中每个滤波器的输出接下来传递到模拟通过外耳和中耳的音频传输的滤波器效应的传输滤波器或传输滤波器函数(“传输滤波器”)101中。如果只有音频的响度将要被测量,在分析滤波器组之前能够应用传输滤波器,但是由于分析滤波器组输出用于合成经修改的音频,因此在滤波器组之后应用传输滤波器是有利的。传输滤波器101的输出接下来传递到激励函数或设备(“激励”)102,它的输出模拟沿基膜的能量分布。激励能量值可以通过平滑函数或设备(“平滑”)103在时间上进行平滑。平滑函数的时间常量根据想要应用的要求进行设置。平滑的激励信号接下来在单位响度函数或设备(“单位响度(SL)”)104中被转换成单位响度。单位响度以每单位频率宋为单位来表示。与每个频带相关的单位响度分量被传递到单位响度修改函数或设备(“SL修改”)105中。SL修改105采取原始单位响度作为它的输入以及然后输出想要的或“目标的”单位响度,根据本发明的一个方面,所述目标单位响度优选是原始单位响度的函数(参见以下的下一个标题,标题为“目标单位响度”)。SL修改105可以在每个频带上独立地操作,或者取决于想要的效果,可能存在频带之间的互相依赖性(在图7中通过交叉连接线所建议的频率平滑)。采取来自激励102的平滑的激励频带分量以及来自SL修改105的目标单位响度作为它的输入,增益解算器函数或设备(“增益解算器”)106确定需要被应用于分析滤波器组100输出的每个频带的增益以便将测量的单位响度变换成目标单位响度。所述增益解算器可以以各种方式实现。例如,增益解算器可以包括迭代处理诸如以第PCT/US2004/016964号、公开号为WO2004/111964A2的所述国际专利申请中公开的方式或可替换地以表查询的方式。尽管增益解算器106产生的每个频带增益可以进一步通过可选的平滑函数或设备(“平滑”)107在时间上进行平滑以便最小化感觉结果,优选的是如在别处所述在整个处理或设备中在别处应用时间平滑。最后,通过相应的乘法合并函数或合并器108将所述增 益应用于分析滤波器组100的相应频带,以及在合成滤波器组函数或设备(“合成滤波器组”)110中根据增益修改的频带合成经处理或“经修改的”音频。另外,来自分析滤波器组的输出可以在应用增益之前通过延迟函数或设备(“延迟”)109被延迟以便补偿与增益计算相关的任何等待时间。可替换地,代替计算用于在频带中应用增益修改中使用的增益,增益解算器106可以计算控制诸如多抽头FIR滤波器或多极IIR滤波器的时间变化滤波器的滤波器系数。为了简单说明,本发明的这些方面主要被描述为应用被应用于频带的增益因子,应该明白在实际的实施例中还可以应用滤波器系数和时间变化滤波器。 
在实际的实施例中,音频的处理可以在数字域中执行。相应地,音频输入信号通过离散时间序列x[n]表示,该时间序列已经以某采样频率fs从音频源进行采样。假设序列x[n]已经被适当地定标从而通过以下公式以分贝给出的x[n]的均方根(rms)功率 
RMS dB = 10 log 10 ( 1 L Σ n = 0 L x 2 [ n ] )
等于收听者正在以它进行倾听的单位为dB的声压级。另外,为了简化说明起见假设所述音频信号是单声道的。 
如下将更详细地描述分析滤波器组100、传输滤波器101、激励102、单位响度104、单位响度修改105、增益解算器106、以及合成滤波器组110。 
分析滤波器组100 
所述音频输入信号被应用于分析滤波器组或滤波器组函数(“分析滤波器组”)100。分析滤波器组100中的每个滤波器被设计成模拟在沿内耳基膜的特定位置处的频率响应。滤波器组100可以包括一组线性滤波器,其带宽和间隔在等效矩形带宽(ERB)频率标度上是恒定的,如通过Moore、Glasberg和Baer(上文提到的B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness,”)所定义的。 
尽管ERB频率标度更加紧密地匹配人的感觉并且显示出在产生匹配主观响度结果的客观响度度量中改进的性能,但是可以利用降低 的性能应用Bark频率标度。 
对于单位为Hz的中心频率f,单位为Hz的ERB频带的带宽可以被近似为: 
ERB(f)=24.7(4.37f/1000+1)     (1) 
根据这种关系定义曲折的频率标度即在沿曲折标度的任何点上,以曲折标度为单位的相应ERB等于一。用于从单位Hz的线性频率转换到这种ERB频率标度的函数通过积分方程1的倒数而获得: 
HzToERB ( f ) = ∫ 1 24.7 ( 4.37 f / 1000 + 1 ) df = 21.4 log 10 ( 4.37 f / 1000 + 1 ) - - - ( 2 a )
通过解方程2a求解f表示从ERB标度回变换回线性频率标度也是有用的: 
ERBToHz ( e ) = f = 1000 4.37 10 ( e / 21.4 - 1 ) , - - - ( 2 b )
其中,e是以ERB标度的单位。图9所示为ERB标度和单位为Hz的频率之间的关系。 
分析滤波器组100可以包括位于沿ERB标度均匀间隔的中心频率fc[1]...fc[B]的被称之为频带的B听觉滤波器。更具体而言, 
fc[1]=fmin      (3a) 
fc[b]=fc[b-1]+ERBToHz(HzToERB(fc[b-1])+Δ)b=2...B    (3b) 
fc[B]<fmax,                                        (3c) 
其中,Δ是想要的分析滤波器组100的ERB间隔,以及fmin和fmax分别是想要的最小和最大中心频率。可以选择Δ=1,并且考虑人耳敏感的频率范围,可以设置fmin=50Hz和fmax=20000Hz。利用这些参数,例如,应用方程3a-c产生B=40的听觉滤波器。 
每个听觉滤波器的幅度频率响应其特征在于如Moore和Glasberg所提出的舍入指数函数。具体而言,具有中心频率fc[b]的滤波器的幅度响应可以被计算为: 
Hb(f)=(1+pg)e-pg       (4a) 
这里 
g = | f - f c [ b ] f c [ b ] | , - - - ( 4 b )
p = 4 f c [ b ] ERB ( f c [ b ] ) - - - ( 4 c )
在图10示出了在ERB标度上近似临界频带的这些B听觉滤波器的幅度响应。 
使用有限长度离散余弦变换可以充分地近似分析滤波器组100的滤波操作,所述变换通常被称之为短时间离散傅里叶变换(STDFT),因为被称之为全速率实现即在音频信号的采样速率运行滤波器的实现被认为提供比精确响度度量所必须的分辨率更高的时间分辨率。通过使用STDFT代替全速率实现,可以实现效率的提高和计算复杂度的降低。 
输入音频信号x[n]的STDFT定义如下: 
X [ k , t ] = Σ n = 0 N - 1 w [ n ] x [ n + tT ] e - j 2 πk N , - - - ( 5 a )
其中,k是频率索引,t是时间块索引,N是DFT大小,T是跳跃大小,以及w[n]是规格化的长度为N的窗从而 
Σ n = 0 N - 1 w 2 [ n ] = 1 - - - ( 5 b )
应该注意到方程5a中的变量t是表示与以秒为单位的时间度量相对的STDFT时间块的离散索引。t中的每个递增表示沿信号x[n]的T采样的跳跃。接下来参考索引t假设这种定义。尽管取决于实现的细节,可以使用不同的参数设置和窗形状,对于fs=44100Hz,选择N=2048,T=1024,并且让w[n]是汉宁窗提供时间和频率分辨率的足够平衡。使用快速傅里叶变换(FFT)上述的STDFT可以更加有效。 
取代STDFT,可以使用修正离散余弦变换(MDCT)实现分析滤波器组。MDCT是一种通常在诸如Dolby AC-3的感觉音频编码器中使用的变换。如果本公开的***利用这种感觉编码的音频实现,通过处理现有的编码音频的MDCT系数,并因此消除执行分析滤波器组变换的需要,本公开的响度测量和修改可以被更为有效地实现。输入音频信号x[n]的MDCT通过以下公式给出: 
X [ k , t ] = Σ n = 0 N - 1 w [ n ] x [ n + tT ] cos ( ( 2 π / N ) ( k + 1 / 2 ) ( n + n 0 ) ) ,
其中 n 0 = ( N / 2 ) + 1 2 - - - ( 6 )
通常情况下,选择跳跃大小T精确为一半的变换长度N以便有可能完全重构信号x[n]。 
传输滤波器101 
分析滤波器组100的输出被应用于根据通过外耳和中耳的音频传输滤波滤波器组的每个频带的传输滤波器或传输滤波器函数(“传输滤波器”)101。图8描述了传输滤波器在可听频率范围上的一种适当的幅度频率响应P(f)。该响应统一低于1kHz,以及在1kHz以上,遵循在ISO226标准中规范的听觉门限的倒数,该门限被规格化成等于在1kHz的1。 
激励102 
为了计算输入音频信号的响度,在应用传输滤波器101之后需要在分析滤波器组100的每个滤波器中音频信号短时间能量的度量。这种时间和频率变化的度量被称之为激励。在激励函数102中通过频率域中的滤波器响应和输入信号的功率谱相乘可以近似分析滤波器组100中的每个滤波器的短时间能量输出: 
E [ b , t ] = 1 N Σ k = 0 N - 1 | H b [ k ] | 2 | P [ k ] | 2 | X [ k , t ] | 2 , - - - ( 7 )
其中,b是频带号,t是块号,以及Hb[k]和P[k]分别是听觉滤波器和传输滤波器的频率响应,所述输入信号以对应于STDFT或MDCT二进制索引k的频率进行采样。应该注意到除方程4a-c中规定以外的听觉滤波器幅度响应的形式可以在方程7中使用以实现类似的结果。例如,第PCT/US2004/016964号、公开号为WO2004/111964A2的所述国际申请描述了两种替换:通过第12阶IIR传递函数表征的听觉滤波器,以及低成本的“砖墙(brick-wall)”带通近似。 
总而言之,激励函数102的输出是在每时间周期t的各个ERB频带b中能量E的频率域表示。 
时间平均(“平滑”)103 
如下所述,对于本公开发明的一定应用,可能期望在它的变换到单位响度之前平滑激励E[b,t]。例如,在平滑函数103中根据以下方 程可以递归地执行平滑: 
E[b,t]=λbE[b,t]+(1-λb)E[b,t],         (8) 
其中,根据期望的应用选择在每个频带b的时间常量λb。在绝大多数情况下时间常量可以被有利地选择为与在频带b内人类响度感觉的积分时间成比例。Watson和Gengel进行的实验表明这种积分时间在低频(125-200Hz)位于150-175ms的范围内以及在高频位于40-60ms内(Charles S.Watson and Roy W.Gengel,“Signal Duration andSignal Frequency in Relation to Auditory Sensitivity”,Journal of theAcoustical Society of America,Vol.46,No.4(Part 2),1969年,第989-997页)。 
单位响度104 
在单位响度转换器或转换函数(“单位响度”)104中,将激励的每个频带转换成以每ERB宋为单位度量的单位响度的分量值。 
开始,在计算单位响度中,每个频带中的激励级E[b,t]可以被变换成如ISO226的等响度轮廓所规定的(图11)通过传输滤波器P(z)规格化的在1kHz的等效激励级(图12): 
E1kHz[b,t]=T1kHz(E[b,t],fc[b]),        (9) 
其中,T1kHz(E.f)是产生在1Kz所述级的函数,该级和在频率f的级E一样响。实际上,将T1kHz(E,f)实现为通过传输滤波器规格化的等响度轮廓查询表的内插。转换成在1kHz的等效级简化了以下的单位响度计算。 
接下来,每个频带中的单位响度可以计算为: 
N[b,t]=α[b,t]NNB[b,t]+(1-α[b,t])NWB[b,t],   (10) 
其中,NNB[b,t]和NWB[b,t]分别是基于窄带和宽带信号模型的单位响度值。值α[b,t]是根据音频信号计算的位于0和1之间的内插因子。第PCT/US2004/016964、公开号为WO2004/111964A2的所述国际申请描述了一种根据激励的频谱平坦性计算α[b,t]的技术。它还更详细地描述“窄带”和“宽带”信号模型。 
所述窄带和宽带单位响度值NNB[b,t]和NWB[b,t]可以使用指数函数根据变换的激励进行估计: 
N NB [ b , t ] = G NB ( ( E ‾ 1 kHz [ b , t ] TQ 1 kHz ) β NB - 1 ) , E ‾ 1 kHz [ b , t ] > TQ 11 kHz 0 , otherwise - - - ( 11 a )
N WB [ m , t ] = G WB ( ( E ‾ 1 kHz [ b , t ] TQ 1 kHz ) β WB - 1 ) , E ‾ 1 kHz [ b , t ] > TQ 1 kHz 0 , otherwise , - - - ( 11 b )
其中,TQ1kHz是对于1KHz宋来说在无声门限的激励级。根据等响度轮廓(图11和12)TQ1kHz等于4.2dB。注意到当所述激励等于无声门限时这些单位响度函数都等于零。对于大于无声门限的激励,两个函数根据Stevens的级感觉定律以幂定律单调地增加。选择窄带函数的指数大于宽带函数的指数,使得窄带函数相对于宽带函数更快速地增加。具体选择的用于窄带和宽带情况的指数β和增益G被选择成在音调和噪声的响度增加时匹配实验数据。 
Moore和Glasberg建议当所述激励处于听觉门限时单位响度应该等于取代零的某些小值。然后单位响度应该随激励减小到零而单调地减小到零。理由是听觉门限是盖然性门限(在这点上50%的时间检测音调),以及每个位于门限的大量音调一起存在可以相加成一种比任何各个音调更可听的声音。在本公开的申请中,利用这种特性增加单位响度函数已经具有当所述激励接近门限时使以下讨论的增益解算器行为更加正确的附加益处。如果当所述激励位于门限或低于门限时所述单位响度被定义成零,那么对于位于门限或低于门限的激励来说增益解算器的唯一解不存在。另一方面,如果单位响度被定义成对于大于或等于零的所有激励值来说单调地增加,如Moore和Glasberg所建议的,那么唯一解存在。大于统一值的响度定标将总是导致大于统一值的增益并且反之亦然。方程11a和11b中的单位响度函数可以被修改成具有根据以下公式的期望特性: 
N NB [ b , t ] = G NB ( ( E ‾ 1 kHz [ b , t ] TQ 1 kHz ) β NB - 1 ) , E ‾ 1 kHz [ b , t ] > λ TQ 11 kHz exp K NB ( - log ( E ‾ 1 kHz [ b , t ] TQ 1 kHz ) + C NB ) η NB , otherwise - - - ( 11 c )
N WB [ m , t ] = G WB ( ( E ‾ 1 kHz [ b , t ] TQ 1 kHz ) β WB - 1 ) , E ‾ 1 kHz [ b , t ] > λ TQ 1 kHz exp K WB ( - log ( E ‾ 1 kHz [ b , t ] TQ 1 kHz ) + C WB ) η WB , otherwise , - - - ( 11 d )
其中,常量λ大于1,η指数小于1,以及常量K和C如此选择从而单位响度函数及其一阶导数在点E1kHz[b,t]=λTQ1kHz处是连续的。 
根据单位响度,通过在所有频带b上单位响度的求和给出全部或“总”响度L[t]: 
L [ t ] = Σ b N [ b , t ] - - - ( 12 )
单位响度修改105 
在单位响度修改函数(“单位响度修改”)105中,被称之为 的目标单位响度可以取决于全部设备或处理的期望应用以各种方式根据SL104的单位响度(图7)计算。正如以下更详细的描述,例如,在音量控制的情况下,目标单位响度可以使用定标因子α计算。参见以下的方程16及其相关的描述。在自动增益控制(AGC)和动态范围控制(DRC)的情况下,目标单位响度可以使用期望输出响度和输入响度的比率进行计算。参见以下的方程17和18及其相关的描述。在动态均衡的情况下,目标单位响度可以使用方程23及其相关描述中阐述的关系进行计算。 
增益解算器106 
在本实例中,对于每个频带b和每个时间间隔t,增益解算器106采取平滑的激励E[b,t]和目标单位响度 作为它的输入并且产生接下来修改所述音频使用的增益G[b,t]。让函数Ψ{·}表示从激励导单位响度的非线性变换从而 
N[b,t]=Ψ{E[b,t]},   (13) 
增益解算器得到G[b,t],从而 
N ^ [ b , t ] = Ψ { G 2 [ b , t ] E ‾ [ b , t ] } . - - - ( 14 a )
增益解算器106确定频率和时间变化的增益,当该增益被应用于原始激励时,它产生在理想情况下等于期望目标单位响度的单位响度。实际上,所述增益解算器确定频率和时间变化的增益,当该增益被应 用于音频信号的频率域型式时导致修改所述音频信号以便减小它的单位响度和目标单位响度之间的差。在理想情况下,所述修改是这样的即经修改的音频信号具有紧密近似目标单位响度的单位响度。方程14a的解可以以大量的方式实现。例如,如果通过Ψ-1{·}表示的用于反单位响度的封闭形式的数学表达式存在,那么所述增益可以直接通过重新安排方程14a进行计算: 
G [ b , t ] = Ψ - 1 ( N ^ [ b , t ] ) E ‾ [ b , t ] - - - ( 14 b )
可替换地,如果用于Ψ-1{·}的封闭形式的解不存在,可以应用迭代方法,其中对于每个迭代使用增益的当前估计评估方程14a。比较所产生的单位响度和期望的目标单位响度以及基于误差更新增益。如果增益被正确地更新,它们将会聚到期望的解。另一种方法包含对于每个频带中的激励范围预先计算函数Ψ{·}以创建查询表。根据该查询表,获得反函数Ψ-1{·}的近似以及然后可以根据方程14b计算所述增益。正如以前所述,目标单位响度可以通过单位响度的定标表示: 
N ^ [ b , t ] = Ξ [ b , t ] N [ b , t ] - - - ( 14 c )
将方程13代入14c中然后将14c代入14b中产生增益的替换表达式: 
G [ b , t ] = Ψ - 1 ( Ξ [ b , t ] Ψ ( E ‾ [ b , t ] ) ) E ‾ [ b , t ] - - - ( 14 d )
我们看到增益可以精确地表示为激励E[b,t]和单位响度定标Ξ[b,t]的函数。所以,通过14d方程或等效查询表可以计算所述增益而不用显式地计算单位响度或目标单位响度作为中间值。但是,通过方程14d的使用隐式地计算这些值。可以设计通过显式或隐式计算单位响度或目标单位响度用于计算修改参数的其他等效方法,本发明旨在覆盖所有这些方法。 
合成滤波器组110 
如上所述,分析滤波器组100可以通过使用短时间离散傅里叶变换(STDFT)或修正离散余弦变换有效地实现,以及可以类似地使用STDFT或MDCT实现合成滤波器组110。具体而言,如以前所述,让X[k,t]表示输入音频的STDFT或MDCT,经处理(修改)的音频 STDFT或MDCT在合成滤波器组110可以被计算为: 
X ^ [ k , t ] = Σ b G [ b , t ] S b [ k ] X [ k , t - d ] , - - - ( 15 )
其中,Sb[k]是与频带b相关的合成滤波器的响应,以及d是与图7中延迟块109相关的延迟。可以选择合成滤波器的形状Sb[k]与分析滤波器组中使用的滤波器Hb[k]相同,或者可以修改它们以在缺少任何增益修改(即,当G[b,t]=1时)中提供完全的重构。然后如本领域普通技术人员所熟知的那样,通过 
Figure G05836760720070428D000322
的逆傅里叶或修正余弦变换和叠加附加合成可以产生最后处理的音频。 
目标单位响度 
实施本发明这些方面的结构的行为诸如图1-7的实例主要通过计算目标单位响度 
Figure G05836760720070428D000323
的方式指示。尽管本发明并不局限于任何特定的计算目标单位响度的函数或反函数,但是现在将描述用于它们的若干这些函数和适当的应用。 
适于音量控制的时间恒定和频率恒定函数 
标准音量控制通过应用宽带信号给所述音频调节音频信号的响度。通常,所述增益被耦合到通过用户调节的旋钮或滑动块直到音频的响度位于期望的级。本发明的一个方面考虑用于实现这种控制的更加心理声学一致的方式。根据本发明的这个方面,不是具有耦合到音量控制的宽带增益,其中该音量控制在所有频带上通过相同的量产生增益的变化,这可能导致感觉频谱的变化,而是相反将单位响度定标因子与音量控制调节进行相关以便通过考虑人类听觉模型的量改变多个频带的每个频带中的增益,从而在理想情况下不存在感觉频谱的变化。在本发明这个方面及其示意性应用的上下文中,“常量”或“时间恒定”旨在考虑音量控制定标因子的设置中例如通过用户不时的变化。这种“时间恒定”有时候被称之为“准时间恒定”、“准固定”、“分段时间恒定”、“分段固定”、“逐步时间恒定”和“逐步固定”。给定这种定标因子α,目标单位响度可以被计算为通过α相乘的度量的单位响度: 
N ^ [ b , t ] = αN [ b , t ] . - - - ( 16 )
由于总响度L[t]是在所有频带b上单位响度N[b,t]的求和,上述 修改还通过因子α定标总响度,但是它以这样一种方式进行即保存在特定时间音量对于控制调节变化来说相同的感觉频谱。换言之,在任何特定的时间,音量控制调节的变化导致感觉响度的变化但是经修改音频的感觉频谱和未经修改音频的感觉频谱之比值不变化。图13a描述了当对于由柔和语音组成的音频信号α=0.25时在特定时间“t”在频带“b”上所产生的多频带增益G[b,t]。为了比较,如在标准音量控制中,还对通过0.25定标原始总响度所需的宽带增益(水平线)进行绘图。与中频带相比多频带增益G[b,t]在低频带和高频带增加。这与指示人耳在低频和高频较不敏感的等响度轮廓相一致。 
图13b描述了用于原始音频信号、如根据现有技术音量控制修改的宽带增益修改信号、和如根据本发明本方面修改的多频带增益修改信号的单位响度。多频带增益修改信号的单位响度是通过0.25定标的原始信号的单位响度。宽带增益修改信号的单位响度已经相对于原始未经修改信号改变了它的频谱形状。在这种情况下,在相对意义上,单位响度在低频和高频具有丢失的响度。随着它的音量降低这被感觉为音频的不洪亮,一个多频带修改信号不会发生的问题,该信号的响度受在感觉响度域中所导出增益的控制。 
连同与传统音量控制相关的感觉频谱平衡的失真这里存在第二个问题。在方程11a-11d表示的响度模型中所反映的响度感觉的特性是在任何频率的信号的响度随信号级接近听觉门限而更快速地降低。结果,给予更柔和信号相同响度衰减的电子衰减小于较响亮信号所需的衰减。传统的音量控制给予恒定衰减而不管信号级如何,所以柔和信号相对于较响亮信号随音量降低而变得“太柔和”。在许多情况下这导致音频细节的丢失。考虑在回响室内响板的记录。在这种记录中响板的主“击打”与回响回声相相比较相当地响亮,但是它是传达房间大小的回响回声。当利用传统的音量控制降低音量时,回响回声相对主击打变得较柔和并且最终消失在听觉门限之下,留下“干的”发声音的响板。基于响度的音量控制通过相对于较响亮的主击打增强记录的较柔和回响部分,以便这些部分之间的相对响度保持恒定来防止记录的 较柔和部分消失。为了实现这个效果,多频带增益G[b,t]必须以和人的响度感觉时间分辨率相称的一定速率随时间变化。由于多频带增益G[b,t]被计算为平滑激励E[b,t]的函数,方程8中时间常量λb的选择指示在每个频带b中增益如何可以在时间上快速地变化。如之前所述的,可以选择这些时间常量为在频带b中人响度感觉的成比例的积分时间,并因此随时间产生G[b,t]的适当变型。应该注意到如果不正确地选择这些时间常量(过快或过慢),那么在处理的音频中可能引入可感觉的客观结果。 
适于固定均衡的时间恒定和频率变化函数 
在某些应用中,可能希望应用固定感觉均衡于所述音频,在这种情况下可以通过应用如以下关系中的时间恒定但频率变化的定标因子Θ[b]计算目标单位响度: 
N ^ [ b , t ] = Θ [ b ] N [ b , t ] ,
其中, 
Figure G05836760720070428D000342
是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。在这种情况下,所述定标可以随频带而变化。这种应用对于加重例如语音频率所支配的频谱部分以便增强清晰度是有用的。 
适于自动增益和动态范围控制的的频率恒定和时间变化函数 
自动增益和动态范围控制(AGC和DRC)的技术在音频处理领域中是熟知的。在一种抽象含义下,两种技术以某种方式测量音频信号的级以及然后通过为测量级函数的量来增益修改该音频信号。对于AGC的情况,增益修改所述信号以便它的测量级更接近于用户选择的参考级。对于DRC,增益修改所述信号以便将信号的度量级的范围变换成某种期望的范围。例如,可能希望使得音频的无声部分更响亮以及响亮部分较无声。Robinson和Gundry(Charles Robinson和Kenneth Gundry,“Dynamic Range Control via Metadata”,107th Convention of the AES,Preprint 5028,1999年9月24-27日,纽约)描述了这种***。AGC和DRC的传统实现通常使用音频信号级的简单度量,诸如平滑的峰值或均方根(rms)幅度以驱动增益修改。这 些简单的度量和音频感觉响度的某种度相关,但是本发明的方面通过利用基于心理声学模型的响度的度量驱动增益修改考虑更加感觉相关的AGC和DRC。而且,许多传统的AGC和DRC***应用具有宽带增益的增益修改,从而导致经处理音频中的上述音质(频谱)失真。另一方面,本发明的这些方面使用多频带增益以减小或最小化这些失真的方式对所述单位响度整形。 
应用本发明这些方面的AGC和DRC应用通过一种函数表征,该函数将输入宽带响度Li[t]变换或映射成期望的输出宽带响度Lo[t],这里所述响度以诸如宋的感觉响度单位进行度量。输入宽带响度Li[t]是输入音频信号的单位响度N[b,t]的函数。尽管它可以和输入音频信号的总响度相同,但是它可以是音频信号总响度的时间平滑的型式。 
图14a和14b描述了典型分别用于AGC和DRC的映射函数的实例。给定Lo[t]是Li[t]的函数的这种映射,目标单位响度可以被计算为: 
N ^ [ b , t ] = L o [ t ] L i [ t ] N [ b , t ] . - - - ( 17 )
音频信号的原始单位响度N[b,t]简单地通过期望的输出宽带响度和输入宽带响度之比进行定标以产生输出单位响度 对于AGC***,输入宽带响度Li[t]应该通常是音频的长期总响度的度量。这能够通过在时间上平滑总响度L[t]产生Li[t]予以实现。 
与AGC相比较,DRC***反作用于信号响度的较短期变化,所以能够使Li[t]简单等于L[t]。结果,通过Lo[t]/Li[t]给出的单位响度的定标可以快速地波动,这导致经处理音频中的不想要的非自然信号。一种典型的结果是通过一些其他相对不相关的频谱部分对一部分频谱的声频调制。例如,经典音乐选择可能包含持续的弦音所支配的高频,而低频包含大声激增的定音鼓。无论何时定音鼓击打,总响度Li[t]都将增加,以及DRC***应用衰减给整个单位响度。然后弦被听到利用定音鼓在响度方面上下“急剧起伏”。这种在频谱中的交叉急剧起伏是传统宽带DRC***的问题,以及典型的解决方案包含独立地应用 DRC于不同的频带。由于滤波器组和应用感觉响度模型的单位响度计算所以这里公开的***本质上是多频带的,因此修改DRC***根据本发明的方面以多频带方式工作相对地直接并且接下来进行描述。 
适于动态范围控制的频率变化和时间变化的函数 
DRC***可以被扩展成通过允许输入和输出响度独立于频带b变化从而以多频带或频率变化方式工作。这些多频带响度值指Li[b,t]和Lo[b,t],目标单位响度然后可以通过以下公式给出: 
N ^ [ b , t ] = L o [ b , t ] L i [ b , t ] N [ b , t ] , - - - ( 18 )
其中,如在图14b中所示例,已经根据Li[b,t]计算或从它映射Lo[b,t],但是对于每个频带b来说是独立的。输入多频带响度Li[b,t]是输入音频信号的单位响度N[b,t]的函数。尽管它可以和输入音频信号的单位响度相同,但是它可以是音频信号的单位响度的时间平滑/或频率平滑的型式。 
计算Li[b,t]的最直接的方式是设置它等于单位响度N[b,t]。在这种情况下,在感觉响度模型的听觉滤波器组中的每个频带上独立地执行DRC而不是根据上述在标题“适于自动增益和动态范围控制的频率恒定和时间变化函数”下用于所有频带的相同输入相对于输出响度比率。在应用40频带的实际实施例中,沿频率轴这些频带的间隔相对精细以便提供响度的精确度量。但是,独立地应用DRC定标因子于每个频带可以导致经处理的音频听起来“一团糟”。为了避免这个问题,可以选择通过在频带上平滑单位响度N[b,t]以便从一个频带应用到下一个频带的DRC量不剧烈地变化来计算Li[b,t]。这可以通过定义频带平滑滤波器Q(b)以及然后根据标准的卷积和在所有频带c上平滑单位响度实现: 
L i [ b , t ] = Σ c Q ( b - c ) N [ c , t ] . - - - ( 19 )
其中,N[c,t]是音频信号的单位响度以及Q(b-c)是平滑滤波器的频带位移响应。图15描述了这种频带平滑滤波器的一个实例。 
如果计算作为Lo[b,t]的函数的Li[b,t]的DRC函数对于每个频带b是固定的,那么单位响度N[b,t]的每个频带导致的变化类型将根据 被处理音频的频谱变化,即使信号的总响度保持相同。例如,具有响亮低音和无声高音的音频信号可以让低音削减以及让高音增强。具有无声低音和响亮高音的音频信号可以发生相反的情况。实际效果是音频的音质或感觉频谱的变化,并且这在一定的应用中可能是令人想要的。 
但是,可能希望执行多频带DRC而不修改音频的平均的感觉频谱。可能想要平均在每个频带中的修改成大致的相同同时仍然允许修改的短期变化在频带之间以及频带中独立地操作。想要的效果可以通过强制每个频带中DRC的平均行为和某种参考行为相同实现。可以选择这种参考行为作为用于宽带输入响度Li[t]的想要的DRC。让函数Lo[t]=DRC{Li[t]}表示用于宽带响度的想要的DRC映射。然后让Li[t]表示宽带输入响度的时间平均型式,以及让Li[b,t]表示多频带输入响度Li[b,t]的时间平均型式。然后多频带输出响度可以被计算为: 
L o [ b , t ] = L ‾ i [ b , t ] L ‾ i [ t ] DRC { L ‾ i [ t ] L ‾ i [ b , t ] L i [ b , t ] } . - - - ( 20 )
值得注意的是首先将所述多频带输入响度定标位于同一平均范围内作为宽带输入响度。然后应用被设计用于宽带响度的DRC函数。最后,将该结果向下定标回多频带响度的平均范围。利用多频带DRC的这种表示法,保持减小频谱急剧起伏的有益之处,而与此同时保留音频的平均感觉频谱。 
适于动态均衡的频率变化和时间变化函数 
本发明方面的另一个应用是音频的时间变化感觉频谱有意的变换成目标时间恒定的感觉频谱同时仍然保留音频的原始动态范围。可以称这种处理为动态均衡(DEQ)。利用传统的静态均衡,应用简单的固定滤波于音频以便改变它的频谱。例如,可能应用固定低音或高音增强。这种处理不考虑音频的当前频谱并且所以对于某些信号即已经包含相对大量低音或高音的信号来说是不适当的。利用DEQ,度量所述信号的频谱以及然后动态地修改该信号以便将度量的频谱变换成基本上静态的想要的形状。对于本发明的方面,在滤波器组中的频带上规定这种想要的形状并且被称为EQ[b]。在实际的实施例中,度量 的频谱应该表示通过在时间上平滑单位响度N[b,t]所产生的音频的平均频谱形状。可以称平滑的单位响度为N[b,t]。当利用多频带DRC时,可以不想要EDQ修改来从一个频带到下一个频带剧烈地变化,所以可以应用频带平滑函数产生频带平滑的频谱L[b,t]: 
L ‾ [ , b , t ] = Σ c Q ( b - c ) N ‾ [ c , t ] . - - - ( 21 )
为了保留音频的原始动态范围,应该规格化想要的频谱EQ[b]以具有相同的总响度如通过L[b,t]所给出的度量的频谱形状。可以称这种规格化的频谱形状为LEQ[b,t]: 
L ‾ EQ [ b , t ] = ( Σ c L ‾ [ c , t ] Σ c EQ [ c ] ) EQ [ b ] . - - - ( 22 )
最后,计算所述目标单位响度为: 
N ^ [ b , t ] = ( L ‾ [ b , t ] L ‾ EQ [ b , t ] ) 1 - β L ‾ EQ [ b , t ] L ‾ [ b , t ] N [ b , t ] , - - - ( 23 )
其中,β是范围从零到一的用户特定参数,它指示将应用的DEQ的程度。参见方程23,注意到当β=0时,不修改原始的单位响度,以及当β=1时,通过想要的频谱形状和度量的频谱形状之比定标所述单位响度。 
一种产生想要的频谱形状EQ[b]的简便方式是用户将它设置成等于如对音频的某些片段所度量的L[b,t],用户发现该音频的频谱平衡令人愉悦。在实际的实施例中,例如在图16中所示,可以给用户提供按钮或其他适当的致动器507,当它被激励时,导致捕获所述音频的频谱形状L[b,t]的当前度量,然后存储该度量作为当启动DEQ时(如通过预置选择508)可以以后被加载到EQ[b]中的预置(在目标单位响度预置捕获和存储506中)。图16是图7的简化型式,其中只示出了单条线来表示从分析滤波器组100到合成滤波器组110的多个频带。图17的实例还提供动态EQ单位响度(SL)修改505,该修改提供对根据如上所述的动态均衡通过函数或设备104所度量的单位响度的修改。 
合并处理 
可能希望合并所有之前描述的处理,包括音量控制(VC)、AGC、DRC和DEQ到单个***中。由于这些处理中的每个处理可以表示为单位响度的定标,因此它们全部被容易地进行如下合并: 
N ^ [ b , t ] = ( Ξ VC [ b , t ] Ξ AGC [ b , t ] Ξ DRC [ b , t ] Ξ DEQ [ b , t ] ) N [ b , t ] , - - - ( 24 )
其中,Ξ.[b,t]表示与处理“*”相关的定标因子。然后可以为表示合并处理的目标单位响度计算单个一组增益G[b,t]。 
在某些情况下,响度修改处理之一或组合的定标因子可以随时间快速地波动并且在所产生的处理音频中产生非自然信号。所以可能想要平滑这些定标因子的某子集。通常,来自VC和DEQ的定标因子在时间上平滑地变化,但是可能需要平滑AGC和DRC定标因子的组合。让这些定标因子的组合通过以下表示: 
ΞC[b,t]=ΞAGC[b,t]ΞDRC[b,t]       (25) 
在平滑之后的基本概念是当单位响度增加时组合的定标因子应该快速地进行反作用,以及当单位响度减小时定标因子应该被更加缓慢地平滑。这种概念对应于在音频处理器的设计中熟知的使用快攻和慢释放的实践。用于平滑定标因子的适当时间常量可以通过在时间上平滑单位响度的频带平滑型式进行计算。首先计算单位响度的频带平滑型式: 
L [ b , t ] = Σ c Q ( b - c ) N [ c , t ] - - - ( 26 )
其中,N[c,t]是音频信号的单位响度以及Q(b-c)是如上述方程19中的平滑滤波器的频带位移响应。 
然后这种频带平滑单位响度的时间平滑型式被计算为: 
L[b,t]=λ[b,t]L[b,t](1-λ[b,t])L[b,t-1]        (27) 
其中,频带相关的平滑系数λ[b,t]通过以下给出: 
λ [ b , t ] = λ fast . L [ b , t ] > L ‾ [ b , t ] λ slow L [ b , t ] ≤ L ‾ [ b , t ] - - - ( 28 )
然后计算平滑的组合定标因子为: 
ΞC[b,t]=λM[b,t]ΞC[b,t]+(1-λM[b,t])ΞC[b,t-1]    (29) 
其中,λM[b,t]是λ[b,t]的频带平滑型式: 
λ M [ b , t ] = ( 1 Σ c Q ( c ) ) Σ c Q ( b - c ) λ [ b , t ] . - - - ( 30 )
平滑系数的频带平滑防止时间平滑的定标因子在频带上剧烈地变化。所述定标因子时间和频带平滑产生包含更少客观感觉非自然信号的经处理的音频。 
噪声补偿 
在许多音频重放环境中存在和听众希望听到的音频相干扰的背景噪声。例如,在行使汽车中的听众可以在安装的立体声***上播放音乐以及来自引擎和道路的噪声可以严重地改变音乐的感觉。特别是,对于噪声能量相对于音乐能量显著的所述频谱部分,该音乐的感觉响度被减小。如果噪声级足够大,音乐则被完全地屏蔽。有关本发明的一个方面,愿意选择增益G[b,t]从而在存在干扰噪声的情况下经处理音频的单位响度等于目标单位响度 
Figure G05836760720070428D000402
为了实现这种效果,可以利用如通过Moore和Glasberg在上面定义的部分响度的构思。假设能够单独地获得噪声的度量以及单独地获得音频的度量。让EN[b,t]表示来自噪声的激励以及让EA[b,t]表示来自音频的激励。然后通过以下公式给出音频和噪声的组合单位响度: 
NTOT[b,t]=Ψ{EA[b,t]+EN[b,t]},(31) 
其中,Ψ{·}仍然表示从激励到单位响度的非线性变换。可以假设听众的听觉以一种保留组合单位响度的方式在音频的部分单位响度和噪声的部分单位响度之间区分组合的单位响度: 
NTOT[b,t]=NA[b,t]+NN[b,t].            (32) 
音频的部分单位响度NA[b,t]是希望控制的值,所以必须求解该值。噪声的部分单位响度可以被近似为: 
N N [ b , t ] = ( E TN [ b , t ] E A [ b , t ] ) κ ( Ψ { E N [ b , t ] + E TN [ b , t ] } - Ψ { E TQ [ b ] } ) - - - ( 33 )
其中,ETN[b,t]是存在噪声时的屏蔽门限,ETQ[b]是在频带b处于无声的听觉门限,以及κ是位于0和1之间的指数。组合方程31-33可以得到用于音频的部分单位响度的表达式: 
N A [ b , t ] = Ψ { E A [ b , t ] + E N [ b , t ] } - ( E TN [ b , t ] E A [ b , t ] ) κ ( Ψ { E N [ b , t ] + E TN [ b , t ] } - Ψ { E TQ [ b ] } ) - - - ( 34 )
注意到当所述音频的激励等于噪声的屏蔽门限时(EA[b,t]ETN[b,t]),该音频的部分单位响度在无声门限等于信号的响度,这是想要的结果。当音频的激励非常大于噪声的激励时,方程34中的第二项趋于零,以及如果不存在噪声的话则该音频的单位响度近似等于它实际上的值。换言之,如果音频变得比噪声更响亮,则噪声被该音频所屏蔽。通过经验选择指数κ以在噪声中的音调响度上赋予数据最佳的拟合作为信噪比的函数。Moore和Glasberg已经发现值κ=0.3是合适的。噪声的屏蔽门限可以被近似为噪声激励本身的函数: 
ETN[b,t]=K[b]EN[b,t]+ETQ[b]           (35) 
其中,K[b]是在较低频带上增加的常量。因此,通过方程34给出的音频的部分单位响度可以被抽象地表示为音频激励和噪声激励的函数: 
NA[b,t]=Φ{EA[b,t],EN[b,t]}.             (36) 
然后可以使用修改增益解算器来计算增益G[b,t],从而在存在噪声时经处理音频的部分单位响度等于目标单位响度: 
N ^ [ b , t ] = Φ { G 2 [ b , t ] E A [ b , t ] , E N [ b , t ] } - - - ( 37 )
图17描述图7的***,该***具有被所述噪声补偿增益解算器206替换的原始增益解算器106(注意表示滤波器组的多个频带的块之间的多个垂直线已经被替换成单条线以简化图)。另外,该图描述了和音频激励(来自平滑103)和目标单位响度(来自SL修改105)一起馈送到新增益解算器206中的噪声激励的测量(通过分析滤波器组200、传输滤波器201、激励202和平滑203以一种对应于方框100、101、102和103的操作的方式)。 
在其最基本的操作模式中,图17中的SL修改105可以简单地设置目标单位响度 等于音频的原始单位响度N[b,t]。换言之,SL修改提供对音频信号的单位响度定标的频率恒定的定标因子α,其中α=1。利用诸如图17中的结构,计算增益从而在噪声存在时经处理音频的感觉响度频谱等于在噪声不存在时所述音频的响度频谱。另外,上述计算目标单位响度为原始音频函数的技术中任何一个或组合,包括VC、 AGC、DRC和DEQ都可以被结合噪声补偿响度修改***使用。 
在实际的实施例中,可以从被放置在将会播放音频的环境中的或靠近这种环境的麦克风获得噪声的度量。可替换地,可以使用近似在各种条件下的预期噪声频谱的一组预定的模板噪声激励。例如,可以以各种驱动速度预先分析汽车室内的噪声以及然后将其存储为与速度相对的噪声激励的查询表。接下来可以在汽车速度变化时根据这个查询表近似馈送到图17的增益解算器206中的噪声激励。 
实现 
本发明可以以硬件或软件、或二者的组合(例如可编程逻辑阵列)实现。除非特别声明,被包括作为本发明一部分的算法在本质上与任何特定的计算机或其他设备无关。特别是,可以根据这里的教导利用写入程序使用各种通用机器,或者可以更为方便的是构造更专用的设备(例如集成电路)来执行所需的方法步骤。因此,本发明可以以在一个或更多可编程计算机***上执行的一个或更多计算机程序实现,每个计算机***包括至少一个处理器、至少一个数据存储***(包括易失性和非易失性存储器和/或存储单元)、至少一个输入设备或端口、以及至少一个输出设备或端口。应用程序代码给输入数据以执行这里描述的功能和产生输出信息。该输出信息以已知的方式应用于一个或更多输出设备。 
每个这种程序可以以任何想要的计算机语言(包括机器、汇编、或高级程序、逻辑、或面向对象的编程语言)实现以与计算机***进行通信。在任何情况下,所述语言可以是编译或解释语言。 
每个这种计算机程序优选被存储在或下载到通用或专用可编程计算机可读的存储媒体或设备(例如固态存储器或媒体、磁性或光学媒体),用于当存储媒体或设备被计算机***读取时,配置和操作计算机执行这里描述的程序。本发明的***还可以考虑实现为计算机可读的用计算机程序配置的存储媒体,这里如此配置的所述存储媒体使得计算机***以一种特定和预先定义的方式操作来执行这里描述的功能。 
已经描述了本发明的多个实施例。但是,将会明白在不背离本发明精神和范围的条件下可以作出各种修改。例如,这里描述的某些步骤可以是顺序不相关的,因此能够以不同于这里所描述的顺序执行这些步骤。 

Claims (126)

1.一种用于导出可用于控制音频信号的单位响度的信息的方法,其中单位响度是作为频率和时间的函数的感觉响度的度量,该方法包括:
导出可用于修改音频信号以便减小它的单位响度和目标单位响度之间差值的修改参数。
2.一种用于导出可用于控制音频信号的部分单位响度的信息的方法,其中单位响度是作为频率和时间的函数的感觉响度的度量以及信号的部分单位响度是作为频率和时间的函数的在存在次干扰信号时该信号的感觉响度的度量,该方法包括:
导出可用于修改音频信号以便减小它的部分单位响度和目标单位响度之间差值的修改参数。
3.一种用于控制音频信号的单位响度的方法,其中单位响度是作为频率和时间的函数的感觉响度的度量,该方法包括:
修改所述音频信号以便减小它的单位响度和目标单位响度之间的差值,其中所述修改从传输接收或从存储媒体再现音频和目标单位响度或目标单位响度的表示。
4.一种用于控制音频信号的部分单位响度的方法,其中单位响度是作为频率和时间的函数的感觉响度的度量以及信号的部分单位响度是作为频率和时间的函数的在存在次干扰信号时该信号的感觉响度的度量,该方法包括:
修改所述音频信号以便减小它的部分单位响度和目标单位响度之间的差值。
5.根据权利要求1或2所述的方法,其中所述导出从传输接收或从存储媒体再现音频和目标单位响度或目标单位响度的表示。
6.根据权利要求4所述的方法,其中所述修改从传输接收或从存储媒体再现音频和目标单位响度或目标单位响度的表示。
7.根据权利要求3或4所述的方法,其中所述修改根据修改参数修改所述音频信号以提供经修改的音频信号以及所述修改从传输接收或从存储媒体再现音频和修改参数。
8.根据权利要求3或4所述的方法,其中所述修改包括产生修改参数。
9.根据权利要求1所述的方法,其中所述目标单位响度不是音频信号的函数。
10.根据权利要求9所述的方法,其中所述导出包括存储目标单位响度。
11.根据权利要求9所述的方法,其中所述导出包括从本方法的外部来源接收目标单位响度。
12.根据权利要求9所述的方法,其中所述导出包括显式计算单位响度的处理。
13.根据权利要求9所述的方法,其中所述导出包括隐式计算单位响度的处理。
14.根据权利要求13所述的方法,其中所述处理应用查询表以便该处理固有地确定单位响度。
15.根据权利要求13所述的方法,其中以所述处理应用的封闭式数学表达式固有地确定单位响度。
16.根据权利要求9所述的方法,其中所述目标单位响度是时间和频率恒定的。
17.根据权利要求9所述的方法,其中所述目标单位响度是时间恒定的。
18.根据权利要求1所述的方法,其中所述目标单位响度是音频信号或音频信号度量的函数。
19.根据权利要求18所述的方法,其中所述音频信号的度量是音频信号的单位响度。
20.根据权利要求18所述的方法,其中音频信号或音频信号度量的函数是音频信号或音频信号度量的一个或更多定标。
21.根据权利要求20所述的方法,其中所述一个或更多定标包括如在以下关系中定标单位响度的时间和频率变化的定标因子Ξ[b,t]:
N ^ [ b , t ] = Ξ [ b , t ] N [ b , t ] ,
其中,是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
22.根据权利要求21所述的方法,其中至少部分地通过想要的多频带响度和音频信号的多频带响度之比确定所述定标。
23.根据权利要求22所述的方法,其中所述定标可以如在以下关系中被表示为Lo[b,t]/Li[b,t]:
N ^ [ b , t ] = L o [ b , t ] L i [ b , t ] N [ b , t ] ,
其中,N[b,t]是音频信号的单位响度,Lo[b,t]是想要的多频带响度,Li[b,t]是音频信号的多频带响度,以及
Figure FSB00000189249800034
是目标单位响度。
24.根据权利要求23所述的方法,其中Lo[b,t]是Li[b,t]的函数。
25.根据权利要求24所述的方法,其中作为Li[b,t]的函数的Lo[b,t]可以被表示为
Lo[b,t]=DRC{Li[b,t]},
其中,DRC{}指示将Li[b,t]映射到Lo[b,t]的动态范围函数。
26.根据权利要求23所述的方法,其中Li[b,t]是音频信号的单位响度的时间平滑和/或频率平滑的型式。
27.根据权利要求22所述的方法,其中该方法可用作动态范围控制,在该控制中所述修改或所述修改参数的应用产生或所述目标单位响度对应于一个音频信号,在该音频信号中对于单位响度定标的不同值来说感觉的音频频谱或在存在干扰信号时所述感觉的音频频谱是不同的。
28.根据权利要求27所述的方法,其中所述动态范围函数控制每个频带中的响度从而应用于每个频带的短期变化在频带之间独立地变化,而应用于每个频带的平均变化对于所有频带是相同的。
29.根据权利要求28所述的方法,其中作为Li[b,t]的函数的Lo[b,t]可以被表示为
L o [ b , t ] = L ‾ i [ b , t ] L ‾ i [ t ] DRC { L ‾ i [ t ] L ‾ i [ b , t ] L i [ b , t ] }
其中,Lo[t]=DRC{Li[t]}表示音频信号总响度到想要的总响度的映射,
Figure FSB00000189249800041
表示音频信号宽带响度Li[t]的时间平均型式,以及
Figure FSB00000189249800042
表示音频信号的多频带响度Li[b,t]的时间平均型式。
30.根据权利要求28所述的方法,其中该方法可用作动态范围控制,在该控制中所述修改或所述修改参数的应用产生或所述目标单位响度对应于一个音频信号,在该音频信号中对于单位响度定标的不同值来说,感觉的音频频谱或在干扰信号存在时感觉的音频频谱和所述音频信号的感觉音频频谱保持相同。
31.根据权利要求21所述的方法,其中通过想要的频谱形状和音频信号的频谱形状的度量之比定标所述单位响度。
32.根据权利要求31所述的方法,其中该方法将音频信号的感觉频谱从时间变化的感觉频谱变换成时间恒定的感觉频谱。
33.根据权利要求31所述的方法,其中所述定标可以在以下关系中被表示为
Figure FSB00000189249800043
N ^ [ b , t ] = ( L ‾ [ b , t ] L ‾ EQ [ b , t ] ) 1 - β L ‾ EQ [ b , t ] L ‾ [ b , t ] N [ b , t ] ,
以及其中,
Figure FSB00000189249800045
是音频信号的时间平滑的多频带响度,
Figure FSB00000189249800046
是想要的频谱EQ[b],其被规格化成和多频带响度具有相同的宽带响度,从而可以将
Figure FSB00000189249800048
表示为:
L ‾ EQ [ b , t ] = ( Σ c L ‾ [ c , t ] Σ c EQ [ c ] ) EQ [ b ]
其中,N[b,t]是音频信号的单位响度,
Figure FSB000001892498000410
是目标单位响度,以及β是具有以零和一为界并包括零和一的范围的参数,所述参数控制定标的等级。
34.根据权利要求33所述的方法,其中通过本方法的外部来源选择或控制参数β。
35.根据权利要求34所述的方法,其中所述来源是本方法的用户。
36.根据权利要求31所述的方法,其中该方法可用作动态均衡器,在该均衡器中所述修改或所述修改参数的应用产生或所述目标单位响度对应于一个音频信号,在该音频信号中对于单位响度定标的不同值来说感觉的音频频谱或在干扰信号存在时感觉的音频频谱可以是不同的。
37.根据权利要求21所述的方法,其中通过将音频划分成临界频带以及在临界频带之一上进行频率平滑来近似音频信号的多频带响度。
38.根据权利要求37所述的方法,其中在特定的频带b,多频带响度的频带平滑型式L[b,t]可以表示为在所有频带c上的卷积和
L [ b , t ] = Σ c Q ( b - c ) N [ c , t ] ,
其中,N[c,t]是音频信号的单位响度以及Q(b-c)是平滑滤波器的频带位移响应。
39.根据权利要求20所述的方法,其中一个或更多定标包括如在以下关系中定标单位响度的时间变化、频率恒定的定标因子Φ[t]:
N ^ [ b , t ] = Φ [ t ] N [ b , t ] ,
其中,
Figure FSB00000189249800053
是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
40.根据权利要求39所述的方法,其中至少部分地通过想要的宽带响度和音频信号的宽带响度之比确定所述定标。
41.根据权利要求39或40所述的方法,其中音频信号的单位响度函数中的所述定标可以如在以下关系中被表示为Lo[t]/Li[t]:
N ^ [ b , t ] = L o [ t ] L i [ t ] N [ b , t ] ,
其中,N[b,t]是音频信号的单位响度,Lo[t]是想要的宽带响度,Li[t]是音频信号的宽带响度,以及
Figure FSB00000189249800055
是目标单位响度。
42.根据权利要求41所述的方法,其中Lo[t]是Li[t]的函数。
43.根据权利要求42所述的方法,其中作为Li[t]的函数的Lo[t]可以被表示为
Lo[t]=DRC{Li[t]}
其中,DRC{}指示将Li[t]映射到Lo[t]的动态范围函数。
44.根据权利要求41所述的方法,其中Li[t]是音频信号总响度的时间平滑型式。
45.根据权利要求41所述的方法,其中Li[t]是音频信号的长期响度的度量。
46.根据权利要求41所述的方法,其中Li[t]是音频信号的短期响度的度量。
47.根据权利要求39所述的方法,其中该方法可用作自动增益控制或动态范围控制,在该控制中所述修改或所述修改参数的应用产生或所述目标单位响度对应于一个音频信号,在该音频信号中对于单位响度定标的不同值来说,感觉的音频频谱或在干扰信号存在时感觉的音频频谱和音频信号的感觉音频频谱保持相同。
48.根据权利要求21所述的方法,其中所述定标因子是音频信号或音频信号度量的函数。
49.根据权利要求20所述的方法,其中一个或更多定标包括如在以下关系中定标单位响度的时间恒定、频率变化的定标因子Θ[b]:
N ^ [ b , t ] = Θ [ b ] N [ b , t ] ,
其中,是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
50.根据权利要求49所述的方法,其中所述导出包括存储定标因子Θ[b]。
51.根据权利要求49所述的方法,其中从本方法的外部来源接收定标因子Θ[b]。
52.根据权利要求20所述的方法,其中所述一个或更多定标包括如在以下关系中定标音频信号的单位响度的时间恒定、频率恒定的定标因子α:
N ^ [ b , t ] = αN [ b , t ] ,
其中,
Figure FSB00000189249800064
是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
53.根据权利要求52所述的方法,其中所述导出包括存储定标因子α。
54.根据权利要求52所述的方法,其中从本方法的外部来源接收所述定标因子α。
55.根据权利要求49所述的方法,其中该方法可用作音量控制,在该控制中所述修改或所述修改参数的应用产生或所述目标单位响度对应于一个音频信号,在该音频信号中对于单位响度定标的不同值,感觉的音频频谱或在存在干扰信号时感觉的音频频谱与音频信号的感觉音频频谱保持相同。
56.根据权利要求49所述的方法,其中所述定标因子不是音频信号或音频信号度量的函数。
57.根据权利要求1所述的方法,其中所述导出显式地计算(1)单位响度,和/或(2)目标单位响度。
58.根据权利要求3所述的方法,其中所述修改显式地计算(1)单位响度,和/或(2)目标单位响度。
59.根据权利要求1所述的方法,其中所述导出隐式地计算(1)单位响度,和/或(2)目标单位响度。
60.根据权利要求3所述的方法,其中所述修改隐式地计算(1)单位响度,和/或(2)目标单位响度。
61.根据权利要求59所述的方法,其中所述导出应用查询表,该查询表固有地确定(1)单位响度,和/或(2)目标单位响度。
62.根据权利要求60所述的方法,其中所述修改应用查询表,该查询表固有地确定(1)单位响度,和/或(2)目标单位响度。
63.根据权利要求59所述的方法,其中所述导出应用封闭式数学表达式,该表达式固有地确定(1)单位响度,和/或(2)目标单位响度。
64.根据权利要求60所述的方法,其中所述修改应用封闭式数学表达式,该表达式固有地确定(1)单位响度,和/或(2)目标单位响度。
65.根据权利要求1或2所述的方法,其中所述导出(1)发送和接收或(2)存储和再现音频信号和修改参数。
66.根据权利要求1或2所述的方法,其中时间平滑所述修改参数。
67.根据权利要求66所述的方法,其中所述修改参数包括多个与音频信号的频带相关的幅度定标因子。
68.根据权利要求67所述的方法,其中多个幅度定标因子的至少一部分是时间变化的。
69.根据权利要求66所述的方法,其中所述修改参数包括用于控制一个或更多滤波器的多个滤波器系数。
70.根据权利要求69所述的方法,其中一个或更多滤波器中的至少一部分和所述滤波器系数中的至少一部分是时间变化的。
71.根据权利要求1所述的方法,其中所述导出取决于下列各项中的一项或多项:
干扰音频信号的度量,
目标单位响度,
根据经修改音频信号的单位响度导出的未经修改音频信号的单位响度的估计,
未经修改音频信号的单位响度,和
根据经修改音频信号的单位响度导出的目标单位响度的近似。
72.根据权利要求3所述的方法,其中所述修改取决于下列各项中的一项或多项:
干扰音频信号的度量,
目标单位响度,
根据经修改音频信号的单位响度导出的未经修改音频信号的单位响度的估计,
未经修改音频信号的单位响度,和
根据经修改音频信号的单位响度导出的目标单位响度的近似。
73.根据权利要求1所述的方法,其中所述导出至少部分根据下列各项中的一项或多项导出修改参数:
干扰音频信号的度量,
目标单位响度,
根据经修改音频信号的单位响度导出的未经修改音频信号的单位响度的估计,
未经修改音频信号的单位响度,和
根据经修改音频信号的单位响度导出的目标单位响度的近似。
74.根据权利要求3所述的方法,其中所述修改至少部分根据下列各项中的一项或多项导出修改参数:
干扰音频信号的度量,
目标单位响度,
根据经修改音频信号的单位响度导出的未经修改音频信号的单位响度的估计,
未经修改音频信号的单位响度,和
根据经修改音频信号的单位响度导出的目标单位响度的近似。
75.根据权利要求73所述的方法,其中所述导出至少部分根据以下导出修改参数:
(1)目标单位响度和根据经修改音频信号的单位响度导出的未经修改音频信号的单位响度的估计之一,以及
(2)未经修改音频信号的单位响度和根据经修改音频信号的单位响度导出的目标单位响度的近似之一。
76.根据权利要求74所述的方法,其中所述修改至少部分根据以下导出修改参数:
(1)目标单位响度和根据经修改音频信号的单位响度导出的未经修改音频信号的单位响度的估计之一,以及
(2)未经修改音频信号的单位响度和根据经修改音频信号的单位响度导出的目标单位响度的近似之一。
77.根据权利要求73所述的方法,其中所述导出至少部分根据以下导出修改参数:
(1)干扰音频信号的度量,
(2)目标单位响度,以及
(3)未经修改音频信号的单位响度。
78.根据权利要求74所述的方法,其中所述修改至少部分根据以下导出修改参数:
(1)干扰音频信号的度量,
(2)目标单位响度,以及
(3)未经修改音频信号的单位响度。
79.根据权利要求75或77所述的方法,其中该方法应用前馈结构,其中根据音频信号导出单位响度以及从本方法的外部来源或当所述导出包括存储目标单位响度时从存储接收目标单位响度。
80.根据权利要求76或78所述的方法,其中该方法应用前馈结构,其中根据音频信号导出单位响度以及从本方法的外部来源或当所述修改包括存储目标单位响度时从存储接收目标单位响度。
81.根据权利要求75或77所述的方法,其中该方法应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及从本方法的外部来源或者当所述导出包括存储目标单位响度时从存储接收目标单位响度。
82.根据权利要求76或78所述的方法,其中该方法应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及从本方法的外部来源或者当所述修改包括存储目标单位响度时从存储接收目标单位响度。
83.根据权利要求75所述的方法,其中所述导出包括显式或隐式地获得目标单位响度的一个或更多处理,其中的一个或更多处理显式或隐式地计算音频信号或音频信号度量的所述函数。
84.根据权利要求76所述的方法,其中所述修改包括显式或隐式地获得目标单位响度的一个或更多处理,其中的一个或更多处理显式或隐式地计算音频信号或音频信号度量的所述函数。
85.根据权利要求83所述的方法,其中该方法应用前馈结构,其中根据音频信号导出单位响度和目标单位响度,目标单位响度的导出应用音频信号或音频信号度量的所述函数。
86.根据权利要求84所述的方法,其中该方法应用前馈结构,其中根据音频信号导出单位响度和目标单位响度,目标单位响度的导出应用音频信号或音频信号度量的所述函数。
87.根据权利要求83所述的方法,其中该方法应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及根据音频信号导出目标单位响度,目标单位响度的导出应用音频信号或音频信号度量的所述函数。
88.根据权利要求84所述的方法,其中该方法应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及根据音频信号导出目标单位响度,目标单位响度的导出应用音频信号或音频信号度量的所述函数。
89.根据权利要求75或77所述的方法,其中所述导出包括响应于经修改的音频信号显式或隐式地获得未经修改音频信号的单位响度估计的一个或更多处理,其中的一个或更多处理显式或隐式地计算音频信号或音频信号度量的所述函数的反函数。
90.根据权利要求76或78所述的方法,其中所述修改包括响应于经修改的音频信号显式或隐式地获得未经修改音频信号的单位响度估计的一个或更多处理,其中的一个或更多处理显式或隐式地计算音频信号或音频信号度量的所述函数的反函数。
91.根据权利要求89所述的方法,其中该方法应用反馈结构,其中根据经修改的音频信号导出未经修改音频信号的单位响度的估计以及目标单位响度的近似,使用所述音频信号或音频信号度量的所述函数的反函数计算单位响度的估计。
92.根据权利要求90所述的方法,其中该方法应用反馈结构,其中根据经修改的音频信号导出未经修改音频信号的单位响度的估计以及目标单位响度的近似,使用所述音频信号或音频信号度量的所述函数的反函数计算单位响度的估计。
93.根据权利要求89所述的方法,其中该方法应用混合前馈/反馈结构,其中根据音频信号导出单位响度以及根据经修改的音频信号导出未经修改音频信号的单位响度估计,使用音频信号或音频信号度量的所述函数的反函数计算所述估计的导出。
94.根据权利要求90所述的方法,其中该方法应用混合前馈/反馈结构,其中根据音频信号导出单位响度以及根据经修改的音频信号导出未经修改音频信号的单位响度估计,使用音频信号或音频信号度量的所述函数的反函数计算所述估计的导出。
95.根据权利要求1或2所述的方法,其中所述导出(1)发送和接收或(2)存储和再现音频信号和目标单位响度或目标单位响度的表示。
96.根据权利要求3或4所述的方法,其中所述修改(1)发送和接收或(2)存储和再现音频信号和目标单位响度或目标单位响度的表示。
97.根据权利要求95所述的方法,其中目标单位响度的表示是定标音频信号或音频信号度量的一个或更多定标因子。
98.根据权利要求96所述的方法,其中目标单位响度的表示是定标音频信号或音频信号度量的一个或更多定标因子。
99.根据权利要求1或2所述的方法,还包括应用所述修改参数于音频信号以产生经修改的音频信号。
100.根据权利要求1-4中任何一个所述的方法,还包括发送或存储音频信号和目标单位响度或目标单位响度的表示。
101.根据权利要求100所述的方法,还包括接收或再现发送的或存储的音频信号和目标单位响度或目标单位响度的表示。
102.根据权利要求101所述的方法,还包括响应于音频信号和目标单位响度或它的表示修改所述音频信号,以便减小音频信号的单位响度和所述目标单位响度之间的差值。
103.根据权利要求1或2所述的方法,还包括发送或存储音频信号和修改参数。
104.根据权利要求103所述的方法,还包括接收或再现发送的或存储的音频信号和修改参数。
105.根据权利要求104所述的方法,还包括响应于所述修改参数修改音频信号。
106.根据权利要求2所述的方法,其中所述导出显式地计算(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。
107.根据权利要求4所述的方法,其中所述修改显式地计算(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。
108.根据权利要求2所述的方法,其中所述导出隐式地计算(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。
109.根据权利要求4所述的方法,其中所述修改隐式地计算(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。
110.根据权利要求108所述的方法,其中所述导出应用查询表,该查询表固有地确定(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。
111.根据权利要求109所述的方法,其中所述修改应用查询表,该查询表固有地确定(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。
112.根据权利要求108所述的方法,其中所述导出应用封闭式数学表达式,该表达式固有地确定(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。
113.根据权利要求109所述的方法,其中所述修改应用封闭式数学表达式,该表达式固有地确定(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。
114.根据权利要求2所述的方法,其中所述导出取决于下列各项中的一项或多项:
干扰音频信号的度量,
目标单位响度,
根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度的估计,
未经修改音频信号的单位响度,和
根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度的近似。
115.根据权利要求4所述的方法,其中所述修改取决于下列各项中的一项或多项:
干扰音频信号的度量,
目标单位响度,
根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度的估计,
未经修改音频信号的单位响度,和
根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度的近似。
116.根据权利要求2所述的方法,其中所述导出至少部分根据下列各项中的一项或多项导出修改参数:
干扰音频信号的度量,
目标单位响度,
根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度的估计,
未经修改音频信号的单位响度,和
根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度的近似。
117.根据权利要求4所述的方法,其中所述修改至少部分根据下列各项中的一项或多项导出修改参数:
干扰音频信号的度量,
目标单位响度,
根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度的估计,
未经修改音频信号的单位响度,和
根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度的近似。
118.根据权利要求116所述的方法,其中所述导出至少部分根据以下导出修改参数:
(1)干扰音频信号的度量,
(2)目标单位响度和根据经修改音频信号的部分单位响度导出的未经修改音频信号的单位响度的估计之一,以及
(3)未经修改音频信号的单位响度和根据经修改音频信号的部分单位响度导出的目标单位响度的近似之一。
119.根据权利要求117所述的方法,其中所述修改至少部分根据以下导出修改参数:
(1)干扰音频信号的度量,
(2)目标单位响度和根据经修改音频信号的部分单位响度导出的未经修改音频信号的单位响度的估计之一,以及
(3)未经修改音频信号的单位响度和根据经修改音频信号的部分单位响度导出的目标单位响度的近似之一。
120.根据权利要求118所述的方法,其中该方法应用前馈结构,其中根据音频信号导出单位响度以及从本方法的外部来源或当所述导出包括存储目标单位响度时从存储接收目标单位响度。
121.根据权利要求119所述的方法,其中该方法应用前馈结构,其中根据音频信号导出单位响度以及从本方法的外部来源或当所述修改包括存储目标单位响度时从存储接收目标单位响度。
122.根据权利要求118所述的方法,其中该方法应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及从本方法的外部来源或者当所述导出包括存储目标单位响度时从存储接收目标单位响度。
123.根据权利要求119所述的方法,其中该方法应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及从本方法的外部来源或者当所述修改包括存储目标单位响度时从存储接收目标单位响度。
124.根据权利要求118所述的方法,其中所述导出包括响应于经修改的音频信号显式或隐式地获得未经修改音频信号的单位响度估计的一个或更多处理,其中的一个或更多处理显式或隐式地计算音频信号或音频信号度量的所述函数的反函数。
125.根据权利要求119所述的方法,其中所述修改包括响应于经修改的音频信号显式或隐式地获得未经修改音频信号的单位响度估计的一个或更多处理,其中的一个或更多处理显式或隐式地计算音频信号或音频信号度量的所述函数的反函数。
126.一种适于执行以上权利要求中任何一个所述的方法的设备。
CN2005800367607A 2004-10-26 2005-10-25 控制音频信号的单位响度或部分单位响度的方法和设备 Active CN101048935B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US62245804P 2004-10-26 2004-10-26
US60/622,458 2004-10-26
US63860704P 2004-12-21 2004-12-21
US60/638,607 2004-12-21
PCT/US2005/038579 WO2006047600A1 (en) 2004-10-26 2005-10-25 Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Publications (2)

Publication Number Publication Date
CN101048935A CN101048935A (zh) 2007-10-03
CN101048935B true CN101048935B (zh) 2011-03-23

Family

ID=35788286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800367607A Active CN101048935B (zh) 2004-10-26 2005-10-25 控制音频信号的单位响度或部分单位响度的方法和设备

Country Status (12)

Country Link
US (23) US8090120B2 (zh)
EP (2) EP2262108B1 (zh)
JP (1) JP5101292B2 (zh)
KR (1) KR101261212B1 (zh)
CN (1) CN101048935B (zh)
AU (1) AU2005299410B2 (zh)
BR (1) BRPI0518278B1 (zh)
CA (1) CA2581810C (zh)
HK (1) HK1103936A1 (zh)
IL (1) IL182097A (zh)
MX (1) MX2007005027A (zh)
WO (1) WO2006047600A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103580632A (zh) * 2012-08-01 2014-02-12 哈曼贝克自动***股份有限公司 自动响度控制
US11875805B2 (en) 2013-04-05 2024-01-16 Dolby International Ab Audio encoder and decoder for interleaved waveform coding

Families Citing this family (201)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7928310B2 (en) * 2002-11-12 2011-04-19 MediaLab Solutions Inc. Systems and methods for portable audio synthesis
JP2004320628A (ja) * 2003-04-18 2004-11-11 Mitsubishi Electric Corp 音響装置
BRPI0410740A (pt) 2003-05-28 2006-06-27 Dolby Lab Licensing Corp método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
CA2581810C (en) 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP1816891A1 (en) * 2004-11-10 2007-08-08 Hiroshi Sekiguchi Sound electronic circuit and method for adjusting sound level thereof
US8880205B2 (en) * 2004-12-30 2014-11-04 Mondo Systems, Inc. Integrated multimedia signal processing system using centralized processing of signals
US8015590B2 (en) * 2004-12-30 2011-09-06 Mondo Systems, Inc. Integrated multimedia signal processing system using centralized processing of signals
US7653447B2 (en) * 2004-12-30 2010-01-26 Mondo Systems, Inc. Integrated audio video signal processing system using centralized processing of signals
KR100640477B1 (ko) * 2005-06-29 2006-10-30 삼성전자주식회사 디지털 멀티미디어 방송 채널에 따른 오디오 신호 출력방법 및 장치
CN1928807B (zh) * 2005-09-05 2010-09-29 鸿富锦精密工业(深圳)有限公司 声音输出***及方法
TW200710714A (en) * 2005-09-09 2007-03-16 Hon Hai Prec Ind Co Ltd Sound outputting system and method
CN1936829B (zh) * 2005-09-23 2010-05-26 鸿富锦精密工业(深圳)有限公司 声音输出***及方法
TWI316202B (en) * 2005-09-23 2009-10-21 Hon Hai Prec Ind Co Ltd Sound outputting system and method
WO2007095664A1 (en) * 2006-02-21 2007-08-30 Dynamic Hearing Pty Ltd Method and device for low delay processing
US20110311065A1 (en) 2006-03-14 2011-12-22 Harman International Industries, Incorporated Extraction of channels from multichannel signals utilizing stimulus
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
EP2002426B1 (en) * 2006-04-04 2009-09-02 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
PL2002429T3 (pl) * 2006-04-04 2013-03-29 Dolby Laboratories Licensing Corp Kontrola słyszalnej charakterystyki głośności sygnału audio
DE602007011594D1 (de) 2006-04-27 2011-02-10 Dolby Lab Licensing Corp Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke
US7760893B1 (en) * 2006-07-26 2010-07-20 Starmark, Inc. Automatic volume control to compensate for speech interference noise
MY144271A (en) 2006-10-20 2011-08-29 Dolby Lab Licensing Corp Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US8509457B2 (en) 2006-12-11 2013-08-13 Thx, Ltd. Tone balance volume control
WO2008073487A2 (en) 2006-12-12 2008-06-19 Thx, Ltd. Dynamic surround channel volume control
EP2122828B1 (en) 2007-01-03 2018-08-22 Dolby Laboratories Licensing Corporation Hybrid digital/analog loudness-compensating volume control
KR101356206B1 (ko) 2007-02-01 2014-01-28 삼성전자주식회사 자동 오디오 볼륨 기능을 갖는 오디오 재생 방법 및 장치
US8275153B2 (en) * 2007-04-16 2012-09-25 Evertz Microsystems Ltd. System and method for generating an audio gain control signal
US8103008B2 (en) 2007-04-26 2012-01-24 Microsoft Corporation Loudness-based compensation for background noise
CA2679953C (en) 2007-06-19 2014-01-21 Dolby Laboratories Licensing Corporation Loudness measurement with spectral modifications
JP5192544B2 (ja) * 2007-07-13 2013-05-08 ドルビー ラボラトリーズ ライセンシング コーポレイション 聴覚情景分析とスペクトルの歪みを用いた音響処理
EP2188986B1 (en) * 2007-08-16 2016-04-06 DTS, Inc. Audio processing for compressed digital television
TWI350653B (en) 2007-10-19 2011-10-11 Realtek Semiconductor Corp Automatic gain control device and method
EP2209326B1 (en) * 2007-10-30 2012-12-12 Clarion Co., Ltd. Auditory sense correction device
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
EP2232700B1 (en) 2007-12-21 2014-08-13 Dts Llc System for adjusting perceived loudness of audio signals
KR100888049B1 (ko) * 2008-01-25 2009-03-10 재단법인서울대학교산학협력재단 부분 마스킹 효과를 도입한 음성 강화 방법
KR101459319B1 (ko) 2008-01-29 2014-11-07 삼성전자주식회사 오디오 볼륨 자동 조절 방법 및 장치
TWI429301B (zh) * 2008-05-05 2014-03-01 Mstar Semiconductor Inc 音量控制裝置與方法
US9214916B2 (en) 2008-07-11 2015-12-15 Clarion Co., Ltd. Acoustic processing device
KR101599535B1 (ko) * 2008-07-29 2016-03-03 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
US20100054486A1 (en) * 2008-08-26 2010-03-04 Nelson Sollenberger Method and system for output device protection in an audio codec
ATE552690T1 (de) * 2008-09-19 2012-04-15 Dolby Lab Licensing Corp Upstream-signalverarbeitung für client- einrichtungen in einem drahtlosen kleinzellen- netz
EP2329492A1 (en) * 2008-09-19 2011-06-08 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
JP5236006B2 (ja) * 2008-10-17 2013-07-17 シャープ株式会社 音声信号調整装置及び音声信号調整方法
JP5368576B2 (ja) 2008-11-14 2013-12-18 ザット コーポレーション 動的音量制御及び複数空間処理防止
US9380385B1 (en) 2008-11-14 2016-06-28 That Corporation Compressor based dynamic bass enhancement with EQ
WO2010075377A1 (en) 2008-12-24 2010-07-01 Dolby Laboratories Licensing Corporation Audio signal loudness determination and modification in the frequency domain
JP5267115B2 (ja) * 2008-12-26 2013-08-21 ソニー株式会社 信号処理装置、その処理方法およびプログラム
EP2391321B1 (en) * 2009-01-30 2017-03-15 Sonova AG System and method for providing active hearing protection to a user
US8068185B2 (en) * 2009-02-03 2011-11-29 Ali Corporation Volume adjusting method for channel switching of digital television
WO2010099237A2 (en) * 2009-02-25 2010-09-02 Conexant Systems, Inc. Speaker distortion reduction system and method
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
US8761415B2 (en) 2009-04-30 2014-06-24 Dolby Laboratories Corporation Controlling the loudness of an audio signal in response to spectral localization
EP2425426B1 (en) 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
TWI503816B (zh) * 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
WO2010138311A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
WO2010138309A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
WO2010148227A1 (en) 2009-06-19 2010-12-23 Dolby Laboratories Licensing Corporation Upgradable engine framework for audio and video
US9084070B2 (en) * 2009-07-22 2015-07-14 Dolby Laboratories Licensing Corporation System and method for automatic selection of audio configuration settings
WO2011015237A1 (en) * 2009-08-04 2011-02-10 Nokia Corporation Method and apparatus for audio signal classification
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
CN102576535B (zh) * 2009-08-14 2014-06-11 皇家Kpn公司 用于确定音频***的感知质量的方法和***
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
KR101591704B1 (ko) * 2009-12-04 2016-02-04 삼성전자주식회사 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치
KR20110089020A (ko) * 2010-01-29 2011-08-04 주식회사 팬택 휴대용 단말기의 무선 헤드셋을 통한 음성 출력의 조절 방법 및 그 방법이 구현된 휴대용 단말기
NL2004294C2 (en) * 2010-02-24 2011-08-25 Ru Jacob Alexander De Hearing instrument.
EP2367286B1 (en) * 2010-03-12 2013-02-20 Harman Becker Automotive Systems GmbH Automatic correction of loudness level in audio signals
CN101783656A (zh) * 2010-03-17 2010-07-21 北京爱德发科技有限公司 一种音响响度控制方法、模块和装置
US9998081B2 (en) * 2010-05-12 2018-06-12 Nokia Technologies Oy Method and apparatus for processing an audio signal based on an estimated loudness
US8457321B2 (en) * 2010-06-10 2013-06-04 Nxp B.V. Adaptive audio output
JP5304860B2 (ja) 2010-12-03 2013-10-02 ヤマハ株式会社 コンテンツ再生装置およびコンテンツ処理方法
TWI716169B (zh) 2010-12-03 2021-01-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
JP5585432B2 (ja) * 2010-12-16 2014-09-10 ソニー株式会社 音響信号処理装置および方法、並びに、プログラム
US8855322B2 (en) * 2011-01-12 2014-10-07 Qualcomm Incorporated Loudness maximization with constrained loudspeaker excursion
JP5707963B2 (ja) * 2011-01-20 2015-04-30 ヤマハ株式会社 オーディオアンプ
US9191768B2 (en) * 2011-02-24 2015-11-17 Panasonic Intellectual Property Management Co., Ltd. Diffracted sound reduction device, diffracted sound reduction method, and filter coefficient determination method
US8965756B2 (en) * 2011-03-14 2015-02-24 Adobe Systems Incorporated Automatic equalization of coloration in speech recordings
JP5106651B2 (ja) * 2011-03-31 2012-12-26 株式会社東芝 信号処理装置及び信号処理方法
WO2012146757A1 (en) * 2011-04-28 2012-11-01 Dolby International Ab Efficient content classification and loudness estimation
US20120294459A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function
US20120294457A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function
WO2013068637A1 (en) 2011-11-08 2013-05-16 Nokia Corporation A method and an apparatus for automatic volume leveling of audio signals
US9712127B2 (en) 2012-01-11 2017-07-18 Richard Aylward Intelligent method and apparatus for spectral expansion of an input signal
EP2624449B1 (en) * 2012-02-01 2016-12-07 Harman Becker Automotive Systems GmbH Peak detection when adapting a signal gain based on signal loudness
JP5832925B2 (ja) * 2012-02-15 2015-12-16 株式会社タムラ製作所 番組ラウドネス自動管理システム及びその自動管理方法
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
EP2837094B1 (en) 2012-04-12 2016-03-30 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US8831935B2 (en) * 2012-06-20 2014-09-09 Broadcom Corporation Noise feedback coding for delta modulation and other codecs
US9685921B2 (en) * 2012-07-12 2017-06-20 Dts, Inc. Loudness control with noise detection and loudness drop detection
EP2693637A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
EP2693635A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
US9735746B2 (en) 2012-08-01 2017-08-15 Harman Becker Automotive Systems Gmbh Automatic loudness control
CN103796136B (zh) * 2012-10-30 2017-02-08 广州三星通信技术研究有限公司 保证不同音效模式输出响度及音质的设备和方法
US10043535B2 (en) 2013-01-15 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
RU2631139C2 (ru) 2013-01-21 2017-09-19 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
US9451230B1 (en) * 2013-03-15 2016-09-20 Google Inc. Playback adjustments for digital media items
JP2016520854A (ja) * 2013-03-21 2016-07-14 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
US20160049162A1 (en) * 2013-03-21 2016-02-18 Intellectual Discovery Co., Ltd. Audio signal size control method and device
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN107093991B (zh) * 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
CN114566183A (zh) * 2013-04-05 2022-05-31 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
US9253586B2 (en) 2013-04-26 2016-02-02 Sony Corporation Devices, methods and computer program products for controlling loudness
CN108365827B (zh) 2013-04-29 2021-10-26 杜比实验室特许公司 具有动态阈值的频带压缩
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
JP6216553B2 (ja) * 2013-06-27 2017-10-18 クラリオン株式会社 伝搬遅延補正装置及び伝搬遅延補正方法
JP6201460B2 (ja) * 2013-07-02 2017-09-27 ヤマハ株式会社 ミキシング管理装置
WO2015019190A2 (en) * 2013-08-06 2015-02-12 Marvell World Trade Ltd. Systems and methods for noise reduction
CN109920440B (zh) 2013-09-12 2024-01-09 杜比实验室特许公司 用于各种回放环境的动态范围控制
JP6151619B2 (ja) * 2013-10-07 2017-06-21 クラリオン株式会社 音場測定装置、音場測定方法および音場測定プログラム
US10045135B2 (en) 2013-10-24 2018-08-07 Staton Techiya, Llc Method and device for recognition and arbitration of an input connection
US9391575B1 (en) * 2013-12-13 2016-07-12 Amazon Technologies, Inc. Adaptive loudness control
US10043534B2 (en) 2013-12-23 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
US9608588B2 (en) * 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
CN105612692B (zh) * 2014-01-30 2018-06-26 华为技术有限公司 用于压缩音频信号的数字压缩器
CN105900335B (zh) * 2014-01-30 2019-10-25 华为技术有限公司 用于压缩音频信号的音频压缩***
EP3108669B1 (en) 2014-02-18 2020-04-08 Dolby International AB Device and method for tuning a frequency-dependent attenuation stage
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
US20150281830A1 (en) 2014-03-26 2015-10-01 Bose Corporation Collaboratively Processing Audio between Headset and Source
GB201406574D0 (en) * 2014-04-11 2014-05-28 Microsoft Corp Audio Signal Processing
CN110808723A (zh) * 2014-05-26 2020-02-18 杜比实验室特许公司 音频信号响度控制
CN105336341A (zh) 2014-05-26 2016-02-17 杜比实验室特许公司 增强音频信号中的语音内容的可理解性
US10013992B2 (en) 2014-07-11 2018-07-03 Arizona Board Of Regents On Behalf Of Arizona State University Fast computation of excitation pattern, auditory pattern and loudness
US9661435B2 (en) * 2014-08-29 2017-05-23 MUSIC Group IP Ltd. Loudness meter and loudness metering method
US10842418B2 (en) 2014-09-29 2020-11-24 Starkey Laboratories, Inc. Method and apparatus for tinnitus evaluation with test sound automatically adjusted for loudness
US20170373656A1 (en) * 2015-02-19 2017-12-28 Dolby Laboratories Licensing Corporation Loudspeaker-room equalization with perceptual correction of spectral dips
US20170078793A1 (en) * 2015-03-23 2017-03-16 Eric Jay Alexander Inversion Speaker and Headphone for Music Production
WO2016172111A1 (en) 2015-04-20 2016-10-27 Dolby Laboratories Licensing Corporation Processing audio data to compensate for partial hearing loss or an adverse hearing environment
CN108028631B (zh) * 2015-05-29 2022-04-19 弗劳恩霍夫应用研究促进协会 用于音量控制的装置和方法
CN112291699B (zh) 2015-06-17 2022-07-22 弗劳恩霍夫应用研究促进协会 用于处理音频信号的音频处理器和方法及音频编码器
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
EP3342040B1 (en) 2015-08-24 2019-12-18 Dolby Laboratories Licensing Corporation Volume-levelling processing
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
DE102015217565A1 (de) 2015-09-15 2017-03-16 Ford Global Technologies, Llc Verfahren und Vorrichtung zur Verarbeitung von Audio-Signalen
US10341770B2 (en) * 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC
US10586552B2 (en) * 2016-02-25 2020-03-10 Dolby Laboratories Licensing Corporation Capture and extraction of own voice signal
US10142731B2 (en) 2016-03-30 2018-11-27 Dolby Laboratories Licensing Corporation Dynamic suppression of non-linear distortion
CN105845151B (zh) * 2016-05-30 2019-05-31 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
CN114286248A (zh) 2016-06-14 2022-04-05 杜比实验室特许公司 媒体补偿通过和模式切换
US10374566B2 (en) * 2016-07-29 2019-08-06 Maxim Integrated Products, Inc. Perceptual power reduction system and method
US10630254B2 (en) 2016-10-07 2020-04-21 Sony Corporation Information processing device and information processing method
TWI590236B (zh) * 2016-12-09 2017-07-01 宏碁股份有限公司 語音信號處理裝置及語音信號處理方法
AU2017377656B2 (en) * 2016-12-13 2022-07-07 QSIC Pty Ltd Sound management method and system
KR102583931B1 (ko) * 2017-01-25 2023-10-04 삼성전자주식회사 음향 출력 장치 및 그의 제어 방법
WO2018144367A1 (en) * 2017-02-03 2018-08-09 iZotope, Inc. Audio control system and related methods
US10726855B2 (en) 2017-03-15 2020-07-28 Guardian Glass, Llc. Speech privacy system and/or associated method
US20180268840A1 (en) * 2017-03-15 2018-09-20 Guardian Glass, LLC Speech privacy system and/or associated method
EP3389183A1 (en) * 2017-04-13 2018-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for processing an input audio signal and corresponding method
US10374564B2 (en) * 2017-04-20 2019-08-06 Dts, Inc. Loudness control with noise detection and loudness drop detection
CN110574289B (zh) * 2017-05-04 2024-02-13 哈曼国际工业有限公司 用于调整音频信号的方法和装置以及音频***
WO2018226418A1 (en) 2017-06-07 2018-12-13 iZotope, Inc. Systems and methods for identifying and remediating sound masking
KR102302683B1 (ko) 2017-07-07 2021-09-16 삼성전자주식회사 음향 출력 장치 및 그 신호 처리 방법
AT520106B1 (de) * 2017-07-10 2019-07-15 Isuniye Llc Verfahren zum Modifizieren eines Eingangssignals
AT520176B1 (de) * 2017-07-10 2019-02-15 Isuniye Llc Verfahren zum Modifizieren eines Audiosignals
KR102565447B1 (ko) * 2017-07-26 2023-08-08 삼성전자주식회사 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법
CN110799936B (zh) * 2017-08-18 2024-05-03 Oppo广东移动通信有限公司 音量调节方法、装置、终端设备及存储介质
EP3688754A1 (en) * 2017-09-26 2020-08-05 Sony Europe B.V. Method and electronic device for formant attenuation/amplification
US11069369B2 (en) * 2017-09-28 2021-07-20 Sony Europe B.V. Method and electronic device
KR101992019B1 (ko) * 2017-09-29 2019-06-21 경성대학교 산학협력단 음향 출력 제어 장치 및 방법
US10389323B2 (en) 2017-12-18 2019-08-20 Tls Corp. Context-aware loudness control
CN115002644A (zh) 2018-01-09 2022-09-02 杜比实验室特许公司 降低不需要的声音传输
CN110832830B (zh) * 2018-03-22 2021-07-09 华为技术有限公司 一种调节音量的方法和电子设备
EP3785259B1 (en) 2018-04-27 2022-11-30 Dolby Laboratories Licensing Corporation Background noise estimation using gap confidence
KR101942044B1 (ko) * 2018-05-25 2019-01-24 (주)유비아이사운드 다이나믹 부스트 오디오 신호 처리 장치 및 방법
EP3811514B1 (en) * 2018-06-22 2023-06-07 Dolby Laboratories Licensing Corporation Audio enhancement in response to compression feedback
US11011180B2 (en) * 2018-06-29 2021-05-18 Guoguang Electric Company Limited Audio signal dynamic range compression
US11363380B2 (en) 2018-07-31 2022-06-14 Hewlett-Packard Development Company, L.P. Stereophonic devices
EP3609197B1 (en) 2018-08-06 2021-04-14 SONY Corporation Method of reproducing audio, computer software, non-transitory machine-readable medium, and audio processing apparatus
KR102106707B1 (ko) * 2018-09-18 2020-05-04 전자부품연구원 오디오 음량 컨트롤 방법 및 장치
JP7031543B2 (ja) * 2018-09-21 2022-03-08 株式会社Jvcケンウッド 処理装置、処理方法、再生方法、及びプログラム
EP3629475A1 (en) * 2018-09-25 2020-04-01 InterDigital CE Patent Holdings Audio device with learning and adaptive quiet mode capabilities
US10679602B2 (en) * 2018-10-26 2020-06-09 Facebook Technologies, Llc Adaptive ANC based on environmental triggers
WO2020111676A1 (ko) * 2018-11-28 2020-06-04 삼성전자 주식회사 음성 인식 장치 및 방법
WO2020153736A1 (en) 2019-01-23 2020-07-30 Samsung Electronics Co., Ltd. Method and device for speech recognition
CN109817193B (zh) * 2019-02-21 2022-11-22 深圳市魔耳乐器有限公司 一种基于时变多段式频谱的音色拟合***
CN109889170B (zh) * 2019-02-25 2021-06-04 珠海格力电器股份有限公司 音频信号的控制方法和装置
US10674265B1 (en) * 2019-04-26 2020-06-02 Google Llc Background level dependent dynamic volume levels
WO2020231181A1 (en) * 2019-05-16 2020-11-19 Samsung Electronics Co., Ltd. Method and device for providing voice recognition service
CN110191396B (zh) * 2019-05-24 2022-05-27 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、终端及计算机可读存储介质
CN112243151A (zh) * 2019-07-16 2021-01-19 腾讯科技(深圳)有限公司 一种音频播放控制方法、装置、设备及介质
EP3771202B1 (en) * 2019-07-23 2023-08-30 Top Victory Investments Limited Method and system for automatically controlling audio output of a television device based on ambient noise
SE543749C2 (en) * 2019-11-15 2021-07-13 Hearezanz Ab Volume dependent audio compensation
US11817114B2 (en) 2019-12-09 2023-11-14 Dolby Laboratories Licensing Corporation Content and environmentally aware environmental noise compensation
US11032642B1 (en) 2020-03-10 2021-06-08 Nuvoton Technology Corporation Combined frequency response and dynamic range correction for loudspeakers
US20230113561A1 (en) * 2020-03-13 2023-04-13 Immersion Networks, Inc. Loudness equalization system
US11288036B2 (en) 2020-06-03 2022-03-29 Microsoft Technology Licensing, Llc Adaptive modulation of audio content based on background noise
US11317203B2 (en) 2020-08-04 2022-04-26 Nuvoton Technology Corporation System for preventing distortion of original input signal
US11202149B1 (en) 2020-09-11 2021-12-14 Ford Global Technologies, Llc Vehicle audio control
US11157114B1 (en) 2020-09-17 2021-10-26 Ford Global Technologies, Llc Vehicle surface deformation identification
US11387800B1 (en) * 2021-05-12 2022-07-12 Elite Semiconductor Microelectronics Technology Inc. Method for dynamically adjusting weighting values to equalize input signal to generate equalizer output signal and associated parametric equalizer
SE545513C2 (en) * 2021-05-12 2023-10-03 Audiodo Ab Publ Voice optimization in noisy environments
US11757420B2 (en) * 2021-05-19 2023-09-12 Elite Semiconductor Microelectronics Technology Inc. Method for dynamically adjusting adjustable gain value to equalize input signal to generate equalizer output signal and associated leveling equalizer
TWI781714B (zh) * 2021-08-05 2022-10-21 晶豪科技股份有限公司 用以等化輸入訊號以產生等化器輸出訊號的方法以及參數等化器
CN114486286B (zh) * 2022-01-12 2024-05-17 中国重汽集团济南动力有限公司 一种车辆关门声品质评价方法及设备
WO2023249939A1 (en) * 2022-06-21 2023-12-28 Immersion Networks, Inc. System and method for digital signal processing using adaptive soft clipping with lookahead
US20240107230A1 (en) * 2022-09-26 2024-03-28 Zoom Video Communications, Inc. Automatic audio equalization for online conferences
KR20240098312A (ko) 2022-12-21 2024-06-28 서동민 가변 이득 증폭기를 이용한 음량 압축기
CN117354676B (zh) * 2023-10-30 2024-03-05 广州特美声电器有限公司 基于长距离的声音叠加放大方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615270A (en) * 1993-04-08 1997-03-25 International Jensen Incorporated Method and apparatus for dynamic sound optimization
CN1238652A (zh) * 1998-02-20 1999-12-15 日本电气株式会社 移动无线通信设备
US20020076072A1 (en) * 1999-04-26 2002-06-20 Cornelisse Leonard E. Software implemented loudness normalization for a digital hearing aid
US20040190740A1 (en) * 2003-02-26 2004-09-30 Josef Chalupper Method for automatic amplification adjustment in a hearing aid device, as well as a hearing aid device

Family Cites Families (199)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US34961A (en) 1862-04-15 Improvement in the manufacture of gun-barrels
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US4953112A (en) 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
RU2012994C1 (ru) 1989-03-01 1994-05-15 Белорусский государственный университет Устройство автоматической регулировки уровня сигнала
JPH02118322U (zh) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
WO1992012607A1 (en) 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE69214882T2 (de) 1991-06-06 1997-03-20 Matsushita Electric Ind Co Ltd Gerät zur Unterscheidung von Musik und Sprache
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5263188A (en) 1991-08-16 1993-11-16 Delco Electronics Corporation Fade compensated tone control method and apparatus
JP2541062B2 (ja) * 1991-11-28 1996-10-09 ヤマハ株式会社 音響再生装置
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
GB2272615A (en) 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5548638A (en) 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (zh) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5530760A (en) 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) * 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
DE59510501D1 (de) 1995-03-13 2003-01-23 Phonak Ag Staefa Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
WO1996032710A1 (en) 1995-04-10 1996-10-17 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
DE59713033D1 (de) 1996-07-19 2010-06-02 Bernafon Ag Lautheitsgesteuerte Verarbeitung akustischer Signale
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
EP0985328B1 (en) 1997-04-16 2006-03-08 Emma Mixed Signal C.V. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signals in hearing aids
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
JPH10341123A (ja) * 1997-06-06 1998-12-22 Matsushita Electric Ind Co Ltd 音響再生装置
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
TW358925B (en) 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
JPH11225398A (ja) * 1998-02-05 1999-08-17 Matsushita Electric Ind Co Ltd ラウドネス調整方法および補聴器
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
EP1076928B1 (en) * 1998-04-14 2010-06-23 Hearing Enhancement Company, Llc. User adjustable volume control that accommodates hearing
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
WO1999065276A1 (en) 1998-06-08 1999-12-16 Cochlear Limited Hearing instrument
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
DE69933929T2 (de) 1999-04-09 2007-06-06 Texas Instruments Inc., Dallas Bereitstellen von digitalen Audio- und Videoprodukten
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6481496B1 (en) 1999-06-17 2002-11-19 Schlumberger Technology Corporation Well packer and method
US7027981B2 (en) 1999-11-29 2006-04-11 Bizjak Karl M System output control method and apparatus
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) * 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
ATE333751T1 (de) 2000-11-09 2006-08-15 Koninkl Kpn Nv Messen einer übertragungsqualität einer telefonverbindung in einem fernmeldenetz
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
RU2206174C2 (ru) 2001-03-05 2003-06-10 Журин Дмитрий Вячеславович Способ регулирования громкости звуковоспроизведения и устройства для его реализации
GB2373975B (en) 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
WO2001049068A2 (de) 2001-04-10 2001-07-05 Phonak Ag Verfahren zur anpassung eines hörgerätes an ein individuum
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
EP1251715B2 (en) 2001-04-18 2010-12-01 Sound Design Technologies Ltd. Multi-channel hearing instrument with inter-channel communication
CA2354755A1 (en) 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US7242784B2 (en) * 2001-09-04 2007-07-10 Motorola Inc. Dynamic gain control of audio in a communication device
US7177803B2 (en) 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
SE520466C2 (sv) * 2001-11-12 2003-07-15 Ericsson Telefon Ab L M Metod och anordning vid en digital linjäriseringskoppling
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
WO2003075457A2 (en) * 2002-03-01 2003-09-12 Andrew Corporation Apparatus and method for reducing peak-to-average signal power ratio
JP3784734B2 (ja) * 2002-03-07 2006-06-14 松下電器産業株式会社 音響処理装置、音響処理方法およびプログラム
BRPI0304540B1 (pt) 2002-04-22 2017-12-12 Koninklijke Philips N. V Methods for coding an audio signal, and to decode an coded audio sign, encoder to codify an audio signal, codified audio sign, storage media, and, decoder to decode a coded audio sign
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7072477B1 (en) 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
KR100467020B1 (ko) 2002-07-26 2005-01-24 삼성전자주식회사 자기 정렬된 접합영역 콘택홀을 갖는 반도체 장치 및 그제조 방법
JP4434951B2 (ja) 2002-08-07 2010-03-17 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオチャンネルの空間的変換
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
MXPA05008317A (es) 2003-02-06 2005-11-04 Dolby Lab Licensing Corp Audio con respaldo continuo.
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
BRPI0410740A (pt) 2003-05-28 2006-06-27 Dolby Lab Licensing Corp método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio
GB0313649D0 (en) 2003-06-13 2003-07-16 Signature Ind Ltd Activation mechanism for a personal locator beacon
DE602004005234T2 (de) * 2003-07-07 2007-11-08 Koninklijke Philips Electronics N.V. System und verfahren zur signalverarbeitung
TWI233090B (en) 2003-07-24 2005-05-21 Inventec Multimedia & Telecom System and method of language translation for multimedia data
US20050069153A1 (en) 2003-09-26 2005-03-31 Hall David S. Adjustable speaker systems and methods
DE602005005640T2 (de) 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
RU2260174C1 (ru) 2004-03-16 2005-09-10 Тульский государственный университет (ТулГУ) Оптико-электронное устройство для контроля угловых размеров
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
US8199933B2 (en) * 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
CA2581810C (en) * 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US7729673B2 (en) 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US20070121966A1 (en) * 2005-11-30 2007-05-31 Microsoft Corporation Volume normalization device
WO2007111994A2 (en) 2006-03-22 2007-10-04 Syndexa Pharmaceuticals Corporation Compounds and methods for treatment of disorders associated with er stress
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
PL2002429T3 (pl) 2006-04-04 2013-03-29 Dolby Laboratories Licensing Corp Kontrola słyszalnej charakterystyki głośności sygnału audio
EP2002426B1 (en) 2006-04-04 2009-09-02 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
DE602007011594D1 (de) 2006-04-27 2011-02-10 Dolby Lab Licensing Corp Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke
EP1855457B1 (en) * 2006-05-10 2009-07-08 Harman Becker Automotive Systems GmbH Multi channel echo compensation using a decorrelation stage
US20080025530A1 (en) 2006-07-26 2008-01-31 Sony Ericsson Mobile Communications Ab Method and apparatus for normalizing sound playback loudness
JP4952125B2 (ja) * 2006-08-04 2012-06-13 富士通株式会社 負荷分散装置
MY144271A (en) 2006-10-20 2011-08-29 Dolby Lab Licensing Corp Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
EP2122828B1 (en) 2007-01-03 2018-08-22 Dolby Laboratories Licensing Corporation Hybrid digital/analog loudness-compensating volume control
US8560320B2 (en) 2007-03-19 2013-10-15 Dolby Laboratories Licensing Corporation Speech enhancement employing a perceptual model
CA2679953C (en) 2007-06-19 2014-01-21 Dolby Laboratories Licensing Corporation Loudness measurement with spectral modifications
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
US20090253457A1 (en) 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
EP2146522A1 (en) 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
JP2010135906A (ja) 2008-12-02 2010-06-17 Sony Corp クリップ防止装置及びクリップ防止方法
US8422699B2 (en) * 2009-04-17 2013-04-16 Linear Acoustic, Inc. Loudness consistency at program boundaries
WO2010138309A1 (en) * 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
US9071214B2 (en) * 2009-06-11 2015-06-30 Invensense, Inc. Audio signal controller
ES2526761T3 (es) 2010-04-22 2015-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para modificar una señal de audio de entrada
JP5903758B2 (ja) 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8989884B2 (en) 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
JP2012235310A (ja) 2011-04-28 2012-11-29 Sony Corp 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8965774B2 (en) 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
JP2013102411A (ja) 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
CA2858925C (en) 2011-12-15 2017-02-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus, method and computer program for avoiding clipping artefacts
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
RU2639663C2 (ru) 2013-01-28 2017-12-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
US9253586B2 (en) * 2013-04-26 2016-02-02 Sony Corporation Devices, methods and computer program products for controlling loudness
JP2015050685A (ja) 2013-09-03 2015-03-16 ソニー株式会社 オーディオ信号処理装置および方法、並びにプログラム
CN109920440B (zh) * 2013-09-12 2024-01-09 杜比实验室特许公司 用于各种回放环境的动态范围控制
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
SG11201603116XA (en) 2013-10-22 2016-05-30 Fraunhofer Ges Forschung Concept for combined dynamic range compression and guided clipping prevention for audio devices
US9240763B2 (en) 2013-11-25 2016-01-19 Apple Inc. Loudness normalization based on user feedback
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
AU2015238519B2 (en) 2014-03-25 2017-11-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
PT3522554T (pt) 2014-05-28 2021-01-06 Fraunhofer Ges Forschung Processador de dados e transporte de dados de controlo do utilizador para descodificadores e renderizadores de áudio
EP4177886A1 (en) 2014-05-30 2023-05-10 Sony Corporation Information processing apparatus and information processing method
CN113851138A (zh) 2014-06-30 2021-12-28 索尼公司 信息处理装置和信息处理方法
TWI631835B (zh) 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
US20160315722A1 (en) 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
CN108028631B (zh) 2015-05-29 2022-04-19 弗劳恩霍夫应用研究促进协会 用于音量控制的装置和方法
CN112291699B (zh) 2015-06-17 2022-07-22 弗劳恩霍夫应用研究促进协会 用于处理音频信号的音频处理器和方法及音频编码器
US9934790B2 (en) 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615270A (en) * 1993-04-08 1997-03-25 International Jensen Incorporated Method and apparatus for dynamic sound optimization
CN1238652A (zh) * 1998-02-20 1999-12-15 日本电气株式会社 移动无线通信设备
US20020076072A1 (en) * 1999-04-26 2002-06-20 Cornelisse Leonard E. Software implemented loudness normalization for a digital hearing aid
US20040190740A1 (en) * 2003-02-26 2004-09-30 Josef Chalupper Method for automatic amplification adjustment in a hearing aid device, as well as a hearing aid device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103580632A (zh) * 2012-08-01 2014-02-12 哈曼贝克自动***股份有限公司 自动响度控制
CN103580632B (zh) * 2012-08-01 2019-01-04 哈曼贝克自动***股份有限公司 自动响度控制***及方法
US11875805B2 (en) 2013-04-05 2024-01-16 Dolby International Ab Audio encoder and decoder for interleaved waveform coding

Also Published As

Publication number Publication date
US10396739B2 (en) 2019-08-27
US10389319B2 (en) 2019-08-20
EP1805891A1 (en) 2007-07-11
US20190115887A1 (en) 2019-04-18
US20170201221A1 (en) 2017-07-13
US9979366B2 (en) 2018-05-22
US20170338784A1 (en) 2017-11-23
US20170338786A1 (en) 2017-11-23
EP1805891B1 (en) 2012-05-16
US10389321B2 (en) 2019-08-20
US10454439B2 (en) 2019-10-22
US20190115896A1 (en) 2019-04-18
US10476459B2 (en) 2019-11-12
US20190115890A1 (en) 2019-04-18
US10361671B2 (en) 2019-07-23
AU2005299410A1 (en) 2006-05-04
CN101048935A (zh) 2007-10-03
EP2262108B1 (en) 2017-03-01
US9966916B2 (en) 2018-05-08
US10411668B2 (en) 2019-09-10
US20200067473A1 (en) 2020-02-27
US9350311B2 (en) 2016-05-24
CA2581810C (en) 2013-12-17
EP2262108A1 (en) 2010-12-15
US9608584B2 (en) 2017-03-28
US20190115891A1 (en) 2019-04-18
US20160248393A1 (en) 2016-08-25
MX2007005027A (es) 2007-06-19
US9768748B2 (en) 2017-09-19
US20210021247A1 (en) 2021-01-21
BRPI0518278A2 (pt) 2008-11-11
US10396738B2 (en) 2019-08-27
JP5101292B2 (ja) 2012-12-19
US20170155368A1 (en) 2017-06-01
US9960743B2 (en) 2018-05-01
US20170346460A1 (en) 2017-11-30
CA2581810A1 (en) 2006-05-04
HK1103936A1 (en) 2007-12-28
US10374565B2 (en) 2019-08-06
US20190115895A1 (en) 2019-04-18
KR20070068379A (ko) 2007-06-29
AU2005299410B2 (en) 2011-04-07
US20170338785A1 (en) 2017-11-23
US10340869B2 (en) 2019-07-02
US20190115892A1 (en) 2019-04-18
JP2008518565A (ja) 2008-05-29
US20120163629A1 (en) 2012-06-28
IL182097A (en) 2012-10-31
US20070291959A1 (en) 2007-12-20
WO2006047600A1 (en) 2006-05-04
US20170359045A1 (en) 2017-12-14
KR101261212B1 (ko) 2013-05-07
US9705461B1 (en) 2017-07-11
US20130279708A1 (en) 2013-10-24
US20190115894A1 (en) 2019-04-18
US10720898B2 (en) 2020-07-21
IL182097A0 (en) 2007-07-24
US20190115889A1 (en) 2019-04-18
US8090120B2 (en) 2012-01-03
US11296668B2 (en) 2022-04-05
US10389320B2 (en) 2019-08-20
US20190115893A1 (en) 2019-04-18
US8488809B2 (en) 2013-07-16
BRPI0518278B1 (pt) 2018-04-24
US20190115888A1 (en) 2019-04-18
US9954506B2 (en) 2018-04-24

Similar Documents

Publication Publication Date Title
CN101048935B (zh) 控制音频信号的单位响度或部分单位响度的方法和设备
EP2002429B1 (en) Controlling a perceived loudness characteristic of an audio signal
US8199933B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20071003

Assignee: Lenovo (Beijing) Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2012990000553

Denomination of invention: Method and device for controlling the perceived loudness and/or the perceived spectral balance of an audio signal

Granted publication date: 20110323

License type: Common License

Record date: 20120731

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20071003

Assignee: Lenovo (Beijing) Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2012990000553

Denomination of invention: Method and device for controlling the perceived loudness and/or the perceived spectral balance of an audio signal

Granted publication date: 20110323

License type: Common License

Record date: 20120731

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model