CN101790758B - 用于控制音频信号的信号处理的设备和方法 - Google Patents

用于控制音频信号的信号处理的设备和方法 Download PDF

Info

Publication number
CN101790758B
CN101790758B CN2008800245251A CN200880024525A CN101790758B CN 101790758 B CN101790758 B CN 101790758B CN 2008800245251 A CN2008800245251 A CN 2008800245251A CN 200880024525 A CN200880024525 A CN 200880024525A CN 101790758 B CN101790758 B CN 101790758B
Authority
CN
China
Prior art keywords
skewness
sound signal
signal
auditory events
tolerance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008800245251A
Other languages
English (en)
Other versions
CN101790758A (zh
Inventor
阿兰·杰弗里·西费尔特
迈克尔·约翰·史密瑟斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39776994&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101790758(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN101790758A publication Critical patent/CN101790758A/zh
Application granted granted Critical
Publication of CN101790758B publication Critical patent/CN101790758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Holo Graphy (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

一种用于控制音频信号中的听觉事件的响度的方法。在一个实施例中,该方法包括:使用频谱中的偏斜度来对听觉事件(听觉事件具有所述频谱和响度)进行加权;和使用权重来控制听觉事件的响度。本发明的各种实施例如下:加权与对频谱中的偏斜度的度量成比例;对偏斜度的度量是对平滑偏斜度的度量;加权对音频信号的幅度不敏感;加权对功率不敏感;加权对响度不敏感;在加权时不知道对信号的度量与绝对再现水平之间的任何关系;加权包括使用频谱中的偏斜度对听觉事件边界重要性加权。

Description

用于控制音频信号的信号处理的设备和方法
技术领域
本发明主要地涉及音频处理,具体地涉及听觉场景分析和频谱倾斜度。 
背景技术
以下文献通过引用而整体结合于此: 
Crockett和Seefeldt按照专利合作条约的国际申请,序列号为PCT/US2007/008313,标题为″Controlling Dynamic Gain Parameters of Audio using Auditory Scene Analysis and Specific-Loudness-Based Detection of Auditory Events″,发明人为Brett Graham Crockett和Alan Jeffrey Seefeldt,于2007年3月30日提交,代理案号为DOLl86 PCT并于2007年11月8日公布为WO 2007/127023; 
Seefeldt等人按照专利合作条约的国际申请,序列号为PCT/US2004/016964,标题为″Method,Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal″,发明人为Alan Jeffrey Seefeldt等,于2004年5月27日提交,代理案号为DOLl19 PCT并于2004年12月23日公布为WO 2004/111994 A2; 
Seefeldt按照专利合作条约的国际申请,序列号为PCT/US2005/038579,标题为″Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal″,发明人为Alan Jeffrey Seefeldt,于2005年10月25日提交,代理案号为DOLl5202 PCT并于2006年5月4日公布为WO 2006/047600; 
Crockett的美国专利申请,序列号为10/474,387,标题为″High Quality Time-Scaling and Pitch-Scaling of Audio Signals″,发明人为Brett Graham Crockett,于2003年10月10日提交,代理案号为DOL07503并于2004年6月24日公布为US 2004/0122662Al; 
Crockett等人的美国专利申请,序列号为10/478,398,标题为″Method for Time Aligning Audio Signals Using Characterizations Based onAuditory Events″,发明人为Brett G.Crockett等人,于2003年11月20日提交,代理案号为DOL09201并于2004年7月29日公布为US2004/0148159Al; 
Crockett的美国专利申请,序列号为10/478,538,标题为″SegmentingAudio Signals Into Auditory Events″,发明人为Brett G.Crockett,于2003年11月20日提交,代理案号为DOL098并于2004年8月26日公布为US 2004/0165730 Al; 
Crockett等人的美国专利申请,序列号为10/478,397,标题为″Comparing Audio Using Characterizations Based on Auditory Events″,发明人为Brett G.Crockett等人,于2003年11月20日提交,代理案号为DOL092并于2004年9月2日公布为US 2004/0172240 Al; 
Smithers按照专利合作条约的国际申请,序列号为PCT/US05/24630,标题为″Method for Combining Audio Signals Using AuditoryScene Analysis″,发明人为Michael John Smithers,于2005年7月13日提交,代理案号为DOL148PCT并于2006年3月9日公布为WO2006/026161; 
Crockett,B.和Smithers,M.的文章″A Method for Characterizingand Identifying Audio Based on Auditory Scene Analysis″,见AudioEngineering Society(音频工程协会)大会论文6416,第118次大会,巴塞罗纳、2005年5月28-31日; 
Crockett,B.的文章″High Quality Multichannel Time Scaling andPitch-Shifting using Auditory Scene Analysis″,见Audio EngineeringSociety(音频工程协会)大会论文5948,纽约,2003年10月;以及 
Seefeldt等人的文章″A New Objective Measure of PerceivedLoudness″,见Audio Engineering Society(音频工程协会)大会论文6236,旧金山,2004年10月28日。 
背景技术
听觉事件和听觉事件检测 
有时将把声音划分为可以感知为分离的和不同的单元或者片段的过 程称为“听觉事件分析”或者“听觉场景分析”(“Auditory Scene Analysis,ASA”)。所述片段有时被称为“听觉事件”或者“音频事件”。Albert S.Bregman的技术文献″Auditory Scene Analysis--The PerceptualOrganization of Sound″(麻省理工学院1991年版,2001年第四次印刷,第二MIT出版社平装本)深入讨论了听觉场景分析。此外,Bhadkamkar等人的专利(美国专利号为6,002,776(1999年12月14日))引用了回溯至1976年的出版物作为“与通过听觉场景分析的声音分离有关的现有技术的工作”。然而,Bhadkamkar等人并不看好听觉场景分析的实际应用,从而断定“虽然从科学观点来看,涉及到听觉场景分析的技术作为人类听觉处理的模型令人关注,但是通常计算需求过高和过于专业化,使得在获得实质性发展之前无法视为用于声音分离的实用技术”。 
Crockett和Crocket等人在上述的各种专利申请和论文中明确了听觉事件。这些文件教导:通过检测频谱成分(幅度随频率的变化)随时间的改变来将音频信号划分成听觉事件。例如,可以通过计算音频信号的相继时间块的频谱内容、在相继时间块之间比较频谱内容和将听觉事件边界标识为块之间的边界(其中频谱内容的差异在该边界超过阈值)来完成这一点。另外,除了频谱成分随时间的改变之外还计算幅度随时间的改变,或者计算幅度随时间的改变来代替频谱成分随时间的改变。 
听觉事件边界标记一般被设置在时间控制信号中,其中通常用从零到一的范围来表明事件边界的强度。另外,这一控制信号常常被过滤掉,使得保持事件边界强度,并计算出事件边界之间的时间间隔作为先前事件边界的衰减值。然后,经过滤的听觉事件强度被其它音频处理方法(包括自动增益控制和动态范围控制)使用。 
音频的动态处理 
自动增益控制(Automatic Gain Control,AGC)和动态范围控制(Dynamic Range Control,DRC)在许多音频信号路径技术中是熟知和常用的。在抽象意义上,两种技术都测量音频信号的水平、然后以作为测量处的水平的函数的量来对信号进行增益修改。在线性的1∶1动态处理***中,没有处理输入音频,而输出音频信号与输入音频信号理想地匹配。此外,设想如下的音频动态处理***,该***自动测量输入信号并利用测量结果来控制输出信号。如果输入信号的水平上升6dB而处理后的输出信号的水平仅上升3dB,则已按照相对于输入信号为2∶1的比率了压缩输出 信号。 
在Crockett和Seefeldt的技术中,听觉场景分析通过使听觉事件边界之间的增益改变最小化和将大量增益改变局限于事件边界的附近来提高AGC和DRC方法的性能。其通过修改动态处理的释放行为(releasebehavior)来做到这一点。以这一方式,听觉事件听起来一致和自然。 
在钢琴上弹出的音符是一个例子。利用常规AGC方法或者DRC方法,向音频信号施加的增益在各音符的尾音期间增加,造成每个音符不自然地增强。利用听觉场景分析,AGC或者DRC增益在每个音符期间保持恒定,仅在检测到听觉事件边界的每个音符的开始附近改变。由于每个音符的尾音消失,所得到的增益调节后的音频信号听起来自然。 
听觉场景分析的典型实施(如在上述参考文献中那样)有意地将信号水平视作不变。也就是说,它们与绝对信号水平无关地检测听觉事件边界。尽管信号水平不变在许多应用中有用,但是一些听觉场景分析也可以从一些信号水平的依赖性中获益。 
一种这样的情况是在Crockett和Seefeldt的技术中描述的方法。其中AGC和DRC的ASA控制防止听觉事件边界之间出现大的增益改变。然而,较长时间的增益改变对于一些类型的音频信号而言仍然是不期望的。当音频信号从较响亮的一节变成较安静的一节时,局限于仅在事件边界附近改变的AGC或者DRC增益可以使处理的音频信号的水平在安静的章节期间出现不期望和不自然的上升。这一情形经常出现在其中零星对话与安静的背景声音交替的影片中。由于安静的背景音频信号也包含听觉事件,所以AGC或者DRC增益在这些事件边界附近改变,因此总音频信号水平上升。 
按照音频信号水平、功率或者响度的度量将听觉事件的重要性简单地加权是不符合需求的。在许多情形中,信号度量与绝对再现水平之间的关系未知。理想地,独立于音频信号的绝对水平来区分或者检测感官上较为安静的音频信号的测量手段将是有用的。 
这里,“感官上较为安静”并不是指就客观响度度量而言更安静(如在Seefeldt等人和Seefeldt的技术中那样),而实际上是指基于内容的期望响度而言更安静。例如,人类经验表明低语为安静声音。如果动态处理***测量它为安静因而增加AGC增益以达到某一标称输出响度或者电平,则所得到的增益被调节的低语将比经验认为的低语应有的响度更响亮。 
发明内容
这里教导了用于控制音频信号中的听觉事件的响度的方法和装置。在一个实施例中,该方法包括:使用频谱中的偏斜度来对听觉事件(听觉时间具有所述频谱和响度)进行加权,以及使用权重来控制听觉事件的响度。本发明的各种实施例如下:与频谱中的偏斜度的度量成比例地进行加权;偏斜度的度量是平滑偏斜度的度量;加权对音频信号的幅度不敏感;加权对功率不敏感;加权对响度不敏感;在加权时不知道信号度量与绝对再现水平之间的任何关系;加权包括使用频谱中的偏斜度对听觉事件边界的重要性进行加权;以及与未进行所述加权的方法相比,在音频信号的感知上更安静的片段期间,减少了AGC或者DRC处理水平的增强。 
在其它实施例中,本发明是一种包含用于执行任一上述方法的计算机程序的计算机可读存储器。 
在更多其它实施例中,本发明是一种计算机***,该***包括CPU、上文提到的存储器之一以及将CPU和存储器通信耦合的总线。 
在又一实施例中,本发明是一种音频信号处理器,该处理器包括:频谱偏斜度计算器,用于计算音频信号中的频谱偏斜度;听觉事件标识器,用于利用计算出的频谱偏斜度来对音频信号中的听觉事件进行标识和加权;参数修改器,用于修改用于对音频信号中的听觉事件的响度进行控制的参数;以及控制器,用于控制音频信号中的听觉事件的响度。 
在又一实施例中,本发明是一种用于控制音频信号中的听觉事件的响度的方法,该方法包括:计算音频信号的相继听觉事件的频谱的偏斜度的度量;基于偏斜度的度量来生成用于听觉事件的权重;根据权重得出控制信号;以及使用所述控制信号来控制听觉事件的响度。 
可以通过参照以下讨论和附图(其中相似的附图标记指代相似的元件)来更好地理解本发明的各种特征及其优选实施例。 
附图说明
图1图示了用于执行分析听觉场景和控制动态增益参数的Crockett和Seefeldt两种方法的设备。 
图2图示了根据本发明一个实施例的用于标识听觉事件和计算用于修改听觉事件(它们本身用于修改动态处理参数)的偏斜度的音频处理器。 
图3是图示了根据本发明一个实施例在动态范围控制器的数字实施中使用听觉事件来控制释放时间的一系列曲线图。 
图4是根据本发明一个实施例的适合作为传输滤波器的线性滤波器的理想特征响应。 
图5示出了接近ERB(等效矩形带宽)标度的临界频带的一组理想的听觉滤波器特征响应。 
具体实施方式
图1图示了根据Crockett和Seefeldt的技术的用于分析听觉场景和控制动态增益参数的设备1。该设备包括听觉事件标识器10、可选的听觉事件特征标识器11和动态参数修改器12。听觉事件标识器10接收作为输入的音频和产生对动态参数修改器12的输入(和对听觉事件特征标识器11(如果存在的话)的输入)。动态参数修改器12接收听觉事件标识器10(和听觉事件特征标识器11(如果存在的话))的输出和产生输出。 
听觉事件标识器10分析频谱并根据分析结果来标识用于控制动态增益参数的可感知的音频事件的位置。或者,听觉事件标识器10将音频转换到感知响度域中(该域可以比第一种方法提供在心理声学上更相关的信息),在该感知响度域中标识用于控制动态增益参数的听觉事件的位置。(在这一可替代方式中,听觉处理知道绝对的声学再现电平。) 
动态参数修改器12基于听觉事件标识器10(和听觉事件特征标识器11(如果存在的话))的输出来修改动态参数。 
在两种方式中,将数字音频信号x[n]分割成块,对于各块t,D[t]代表当前块与先前块之间的频谱差值。 
对于第一种方式,D[t]是:在所有频谱系数中,当前块t和先前块t-1的归一化对数频谱系数之差(以dB为单位)的数量之和。在这一方式中,D[t]与频谱的绝对差值(本身以dB为单位)成比例。对于第二种方式,D[t]是:在所有特定响度系数中,当前块t和先前块t-1的归一化特定响度系数之差的数量之和。在这一种方式中,D[t]与特定响度的绝对差值(以宋为单位)成比例。 
在两种方式中,如果D[t]超过阈值Dmin,则认为事件已经出现。事件 可以具有在零与一之间的强度,该强度可以基于D[t]减去Dmin后与Dmax与Dmin之差的比值。强度A[t]可以被计算为: 
A [ t ] = 0 D [ t ] &le; D min D [ t ] - D min D max - D min D min < D [ t ] < D max 1 D [ t ] &GreaterEqual; D max - - - ( 1 )
由于每种方式使用的单位不同,最大值和最小值对于每种方式而言是不同的。但是,基于最大值和最小值的计算结果是范围为从0到1的事件强度。也可以用其它方式计算事件强度,但是方程(1)中表达的方式本身已经在多个领域(包括控制动态处理)中得到证实。与二进制事件判决相比,将强度(与关联于该事件的频谱改变量成比例)分配给听觉事件允许对动态处理的更大控制。在较强的事件期间,较大增益改变是可接受的,方程(1)中的信号允许这种可变控制。 
信号A[t]是在事件边界的位置出现冲激的脉冲信号。出于控制释放时间的目的,可以进一步平滑信号A[t],使得信号A[t]在检测到事件边界之后平滑地衰减至零。可以按照下式根据A[t]计算平滑的事件控制信号A[t]: 
Figure G2008800245251D00072
这里,α事件控制事件控制信号的衰减时间。 
图3是图示了根据一个实施例的本发明的操作和效果的曲线图序列。图3中的“b)”描绘了用于图3中的对应音频信号“a)”的事件控制信号 A[t],其中平滑器的半衰时间设置成250ms。音频信号包含散布于营火噼啪声音安静背景下的三个对话脉冲串。事件控制信号示出了对话和背景声音中的许多听觉事件。 
在图3中,“c)”示出了DRC增益信号,其中事件控制信号A[t]用来改变对于DRC增益平滑是恒定的释放时间。如Crocket和Seefeldt的技术所描述的那样,当控制信号等于一时,释放平滑系数不受影响,经平滑的增益根据时间常数的值而改变。当控制信号等于零时,阻止经平滑的增益改变。当控制信号在零与一之间时,允许经平滑的增益改变,但是以与控制信号成比例的减少速率来改变。 
在图3的“c”中,由于在背景中检测到一些事件DRC增益在安静背景声音期间上升。图3的“d”中得到的经DRC修改的音频信号在对话脉冲串之间具有可听见的和不期望的背景噪声的增强。 
为了减少在安静背景声音期间的增益改变,本发明的一个实施例利用对音频信号频谱的不对称性的度量来对听觉强度A[t]进行修改或者加权。本发明的一个实施例计算音频信号激励的频谱偏斜度。 
偏斜度是概率分布的不对称性的统计度量。关于平均数对称的分布具有零偏斜度。其大部分或者大多数集中在平均数以上并具有趋向低于平均数的长尾部的分布具有负倾斜度。聚集于平均数以下并且具有趋向高于平均数的长尾部的分布具有正倾斜度。典型音频信号的幅值或者功率频谱具有正倾斜度。也就是说,频谱中的大部分能量聚集于频谱下部,而频谱具有朝向频谱上部的长尾部。 
图2图示了根据本发明一个实施例的音频处理器2。音频处理器2包括:图1的动态参数修改器12,听觉事件特征标识器11(可选的)以及听觉事件标识器20和偏斜度计算器21。偏斜度计算器21和听觉事件标识器20均接收音频信号13,偏斜度计算器21产生听觉事件标识器20的输入。听觉事件标识器20、听觉事件特征标识器11和动态参数修改器12在其它方面与它们在图1中的对应部件一样地连接。 
在图2中,偏斜度计算器21根据音频信号13的频谱表达(spectralrepresentation)来计算偏斜度,听觉事件标识器20根据同一频谱表达来计算听觉场景分析。音频信号13可以分组成百分之五十重叠的M个样本块,离散傅里叶变换可以进行如下: 
X [ k , t ] = &Sigma; n = 0 M - 1 x [ n , t ] e - j 2 &pi;kn M - - - ( 3 )
其中M=2N个样本,而x[n,t]表示样本块。 
用于变换的块大小被设为与用于计算听觉事件信号的块大小相同。然而,这并非是必需的。当存在不同块率(block rate)时,可以对一个块率上的信号进行插值,或者可以将其块率转换为与另一块率上的信号相同的时间比例因子(timescale)。 
与在时间块t期间在临界频带b的沿着内耳基膜的能量分布近似的激 励信号E[b,t]被计算如下: 
E [ b , t ] = &Sigma; k | T [ k ] | 2 | C b [ k ] | 2 | X [ k , t ] | 2 - - - ( 4 )
其中T[k]代表模拟音频经过外耳和中耳的传输的滤波器的频率响应,而Cb[k]代表基膜在与临界频带b对应的位置处的频率响应。 
图4描绘了合适的传输滤波器的频率响应T[k]。图5描绘了与Cb[k]对应的一组适当的临界频带滤波器响应,其中对于48kHz的采样率和M=2048的变换大小,沿着Moore和Glasberg等效矩形带宽(EquivalentRectangular Bandwidth,ERB)标度均匀地隔开40个频带。舍入指数函数(rounded exponential function)描述出每个滤波曲线的形状,频带隔开1ERB。 
如果按照Crocket和Seefeldt的技术根据特定的响度频谱计算出听觉事件边界,则激励信号E[b,t]作为该特定的响度计算的一部分而存在。 
最后,频谱偏斜度根据激励信号E[b,t]而被计算为: 
SK [ t ] = 1 B - 1 &Sigma; b = 0 B - 1 ( E [ b , t ] - &mu; ) 3 &sigma; 3 - - - ( 5 )
其中μ是激励的算术平均数: 
&mu; = 1 B &Sigma; b = 0 B - 1 E [ b , t ] - - - ( 6 )
而σ是激励信号的方差: 
&sigma; = 1 B &Sigma; b = 0 B - 1 ( E [ b , t ] - &mu; ) 2 - - - ( 7 )
方程(5)的偏斜度信号SK[t]明显波动,因此需要进行平滑,以避免在修改事件控制信号和后续动态处理参数时的非自然因素。一个实施例使用具有衰减常数αSK(半衰期约为6.5ms)的单极平滑器: 
SK′[t]=αSKSK′[t-1]+(1-αSK)SK[t]            (8) 
将偏斜度分别限制于最大值SKmax和最小值SKmin可以是有用的。受约束的偏斜度SK″[t]可以计算为: 
SK &prime; &prime; [ t ] = 0 SK &prime; [ t ] &le; SK min SK &prime; [ t ] - SK min SK max - SK min SK min < SK &prime; [ t ] < SK max 1 SK [ t ] &GreaterEqual; SK max - - - ( 7 )
偏斜度信号SK″[t]的较低值(接近0.0的值)通常对应于特性上较安静的信号,而较高的值(接近1.0的值)通常对应于特性上较响亮的信号。在图3中,“e)”曲线图示出了与图3的“a)”中的音频信号对应的偏斜度信号。偏斜度对于较响亮的对话脉冲串较高而对于背景声音较低。 
偏斜度信号SK″[t]传递到图2的听觉事件标识器20,该标识器对频谱差值的度量D[t]进行加权: 
DSK[t]=SK″[t]D[t]            (8) 
经偏斜度修改的听觉强度信号ASK[t]以与方程(1)中的A[t]相同的方式来计算: 
A SK [ t ] = 0 D SK [ t ] &le; D min D SK [ t ] - D min D max - D min D min < D SK [ t ] < D max 1 D SK [ t ] &GreaterEqual; D max - - - ( 9 )
经偏斜度修改的听觉强度信号ASK[t]以与方程(2)中的A[t]相同的方式来平滑: 
Figure G2008800245251D00103
在图3中,“f)”描绘了图3的“a”中的对应音频信号的经偏斜度修改的事件控制信号ASK[t]。在背景声音期间出现的听觉事件变少,而与较响 亮的对话对应的事件得以保留。 
在图3中,“g)”示出了经偏斜度修改的由事件控制的DRC信号。由于在背景声音中有较少的听觉事件,所以DRC增益保持相对恒定,仅对于较响亮的对话部分才移动。图3中的“h)”示出了得到的经DRC修改的音频信号。 
经DRC修改的音频信号在背景声音期间没有不期望的水平增强。 
偏斜度信号SK″[t]对于感知上较为响亮的信号而言有时变低。对于这些响亮信号,频谱差值度量D[t]的值足够地大,以至于即使在按照方程8对偏斜度信号SK″[t]进行加权之后,加权的频谱差度量DSK[t]通常仍然大到足以示出听觉事件边界。事件控制信号ASK[t]未受不利影响。 

Claims (14)

1.一种用于控制音频信号的信号处理的方法,包括:
通过检测频谱成分随时间的变化将所述音频信号划分成听觉事件,每个所述听觉事件倾向于被感知为分离的和不同的,所述划分包括检测所述音频信号中的听觉事件边界的位置和强度,
获得动态变化的对所述音频信号的频谱偏斜度的度量,其中所述频谱偏斜度是对音频信号频谱的概率分布的不对称性的统计度量,
响应于所述度量,通过调节用于计算听觉事件边界的强度的频谱差度量以使得频谱在听觉事件边界的位置处偏斜得越少,所述频谱差度量下降得越多,来修改所述听觉事件边界的强度,以及
响应于所述听觉事件边界的位置和经偏斜度修改的强度来控制增益参数,并且利用所述增益参数来控制所述信号处理。
2.根据权利要求1所述的方法,其中将所述音频信号划分成听觉事件包括:分析所述音频信号的频谱。
3.根据权利要求2所述的方法,其中:获得动态变化的对所述音频信号的频谱偏斜度的度量包括:从所述音频信号的频谱表达来计算偏斜度。
4.根据权利要求3所述的方法,其中计算所述偏斜度包括:计算与沿着内耳基膜的能量分布近似的激励信号。
5.根据权利要求1所述的方法,其中将所述音频信号划分成听觉事件包括:将所述音频信号转换到感知响度域中,所述转换包括计算与沿着内耳基膜的能量分布近似的激励信号。
6.根据权利要求5所述的方法,其中获得动态变化的对所述音频信号的频谱偏斜度的度量包括:从所述激励信号来计算所述偏斜度。
7.根据权利要求1-6中任一项所述的方法,其中对所述频谱偏斜度的度量是经平滑的度量。
8.一种用于控制音频信号的信号处理的设备,包括:
用于通过检测频谱成分随时间的变化将所述音频信号划分成听觉事件的装置,每个所述听觉事件倾向于被感知为分离的和不同的,所述划分包括检测所述音频信号中的听觉事件边界的位置和强度,
用于获得动态变化的对所述音频信号的频谱偏斜度的度量的装置,其中所述频谱偏斜度是对音频信号频谱的概率分布的不对称性的统计度量,
用于响应于所述度量、通过调节用于计算听觉事件边界的强度的频谱差度量以使得频谱在听觉事件边界的位置处偏斜得越少,所述频谱差度量下降得越多来修改所述听觉事件边界的强度的装置,以及
用于响应于所述听觉事件边界的位置和经偏斜度修改的强度来控制增益参数并且利用所述增益参数来控制所述信号处理的装置。
9.根据权利要求8所述的设备,其中将所述音频信号划分成听觉事件包括:分析所述音频信号的频谱。
10.根据权利要求9所述的设备,其中:获得动态变化的对所述音频信号的频谱偏斜度的度量包括:从所述音频信号的频谱表达来计算偏斜度。
11.根据权利要求10所述的设备,其中计算所述偏斜度包括:计算与沿着内耳基膜的能量分布近似的激励信号。
12.根据权利要求8所述的设备,其中将所述音频信号划分成听觉事件包括:将所述音频信号转换到感知响度域中,所述转换包括计算与沿着内耳基膜的能量分布近似的激励信号。
13.根据权利要求12所述的设备,其中获得动态变化的对所述音频信号的频谱偏斜度的度量包括:从所述激励信号来计算所述偏斜度。
14.根据权利要求8-13中任一项所述的设备,其中对所述频谱偏斜度的度量是经平滑的度量。
CN2008800245251A 2007-07-13 2008-07-11 用于控制音频信号的信号处理的设备和方法 Active CN101790758B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US95946307P 2007-07-13 2007-07-13
US60/959,463 2007-07-13
PCT/US2008/008592 WO2009011827A1 (en) 2007-07-13 2008-07-11 Audio processing using auditory scene analysis and spectral skewness

Publications (2)

Publication Number Publication Date
CN101790758A CN101790758A (zh) 2010-07-28
CN101790758B true CN101790758B (zh) 2013-01-09

Family

ID=39776994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800245251A Active CN101790758B (zh) 2007-07-13 2008-07-11 用于控制音频信号的信号处理的设备和方法

Country Status (10)

Country Link
US (1) US8396574B2 (zh)
EP (1) EP2168122B1 (zh)
JP (1) JP5192544B2 (zh)
CN (1) CN101790758B (zh)
AT (1) ATE535906T1 (zh)
BR (1) BRPI0813723B1 (zh)
ES (1) ES2377719T3 (zh)
RU (1) RU2438197C2 (zh)
TW (1) TWI464735B (zh)
WO (1) WO2009011827A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5248625B2 (ja) * 2007-12-21 2013-07-31 ディーティーエス・エルエルシー オーディオ信号の知覚ラウドネスを調節するシステム
EP2425426B1 (en) 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US8510361B2 (en) * 2010-05-28 2013-08-13 George Massenburg Variable exponent averaging detector and dynamic range controller
AU2012279357B2 (en) * 2011-07-01 2016-01-14 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
EP2834815A4 (en) 2012-04-05 2015-10-28 Nokia Technologies Oy ADAPTIVE AUDIO SIGNAL FILTERING
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
EP2898510B1 (en) 2012-09-19 2016-07-13 Dolby Laboratories Licensing Corporation Method, system and computer program for adaptive control of gain applied to an audio signal
WO2014151813A1 (en) 2013-03-15 2014-09-25 Dolby Laboratories Licensing Corporation Normalization of soundfield orientations based on auditory scene analysis
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
CN104079247B (zh) 2013-03-26 2018-02-09 杜比实验室特许公司 均衡器控制器和控制方法以及音频再现设备
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN114566182A (zh) 2013-04-05 2022-05-31 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
US9876913B2 (en) 2014-02-28 2018-01-23 Dolby Laboratories Licensing Corporation Perceptual continuity using change blindness in conferencing
WO2017079334A1 (en) 2015-11-03 2017-05-11 Dolby Laboratories Licensing Corporation Content-adaptive surround sound virtualization
US9372881B1 (en) 2015-12-29 2016-06-21 International Business Machines Corporation System for identifying a correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset
EP3420735B1 (en) 2016-02-25 2020-06-10 Dolby Laboratories Licensing Corporation Multitalker optimised beamforming system and method
EP3827429A4 (en) 2018-07-25 2022-04-20 Dolby Laboratories Licensing Corporation COMPRESSOR TARGET CURVE TO AVOID AMPLIFICATION NOISE
CN113015059B (zh) * 2021-02-23 2022-10-18 歌尔科技有限公司 音频优化方法、装置、设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6002776A (en) * 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
EP1304681A2 (en) * 2001-10-15 2003-04-23 Samsung Electronics Co., Ltd. Speech absence probability estimation and noise removal

Family Cites Families (134)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
US4624009A (en) 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4594561A (en) * 1984-10-26 1986-06-10 Rg Dynamics, Inc. Audio amplifier with resistive damping for minimizing time displacement distortion
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (zh) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE69210689T2 (de) 1991-01-08 1996-11-21 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
DE69214882T2 (de) 1991-06-06 1997-03-20 Matsushita Electric Ind Co Ltd Gerät zur Unterscheidung von Musik und Sprache
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
JPH0566795A (ja) * 1991-09-06 1993-03-19 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 雑音抑圧装置とその調整装置
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (zh) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
TW247390B (en) 1994-04-29 1995-05-11 Audio Products Int Corp Apparatus and method for adjusting levels between channels of a sound system
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
EP0661905B1 (de) 1995-03-13 2002-12-11 Phonak Ag Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
BR9609799A (pt) 1995-04-10 1999-03-23 Corporate Computer System Inc Sistema para compressão e descompressão de sinais de áudio para transmissão digital
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
EP0820212B1 (de) 1996-07-19 2010-04-21 Bernafon AG Lautheitsgesteuerte Verarbeitung akustischer Signale
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
JP3367592B2 (ja) * 1996-09-24 2003-01-14 日本電信電話株式会社 自動利得調整装置
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
JP2002518912A (ja) 1998-06-08 2002-06-25 コックレア リミティド 聴覚装置
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
EP1089242B1 (en) 1999-04-09 2006-11-08 Texas Instruments Incorporated Supply of digital audio and video products
AU4278300A (en) 1999-04-26 2000-11-10 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
AU2725201A (en) 1999-11-29 2001-06-04 Syfx Signal processing system and method
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
DK1206104T3 (da) 2000-11-09 2006-10-30 Koninkl Kpn Nv Måling af en samtalekvalitet af en telefonforbindelse i et telekommunikationsnetværk
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
DK1290914T3 (da) 2001-04-10 2004-09-27 Phonak Ag Fremgangsmåde til tilpasning af et höreapparat til et individ
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
EP1251715B2 (en) 2001-04-18 2010-12-01 Sound Design Technologies Ltd. Multi-channel hearing instrument with inter-channel communication
US7177803B2 (en) 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
FR2842576B1 (fr) 2002-07-17 2004-10-08 Skf Ab Dispositif de palier a roue libre et poulie a roue libre
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
JP4321049B2 (ja) 2002-07-29 2009-08-26 パナソニック電工株式会社 自動利得制御装置
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
MXPA05008317A (es) 2003-02-06 2005-11-04 Dolby Lab Licensing Corp Audio con respaldo continuo.
DE10308483A1 (de) 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
IN2010KN02913A (zh) 2003-05-28 2015-05-01 Dolby Lab Licensing Corp
US20050071154A1 (en) * 2003-09-30 2005-03-31 Walter Etter Method and apparatus for estimating noise in speech signals
US6923684B2 (en) 2003-10-10 2005-08-02 O'sullivan Industries, Inc. Power harness having multiple upstream USB ports
CA3026276C (en) 2004-03-01 2019-04-16 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
DK1792304T3 (da) * 2004-09-20 2009-01-05 Tno Frekvenskompensation for perceptuel taleanalyse
EP1805891B1 (en) * 2004-10-26 2012-05-16 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI397901B (zh) * 2004-12-21 2013-06-01 Dolby Lab Licensing Corp 控制音訊信號比響度特性之方法及其相關裝置與電腦程式
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
GB2428168A (en) 2005-07-06 2007-01-17 Motorola Inc A transmitter splits a signal into a plurality of sub-signals, each containing a plurality of sub-carriers, and amplifies each sub-signal separately.
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
ATE441920T1 (de) 2006-04-04 2009-09-15 Dolby Lab Licensing Corp Lautstärkemessung von tonsignalen und änderung im mdct-bereich
EP2002429B1 (en) 2006-04-04 2012-11-21 Dolby Laboratories Licensing Corporation Controlling a perceived loudness characteristic of an audio signal
KR101200615B1 (ko) 2006-04-27 2012-11-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 청각 이벤트 검출에 기반한 비-라우드니스를 이용한 자동 이득 제어
EP2082480B1 (en) 2006-10-20 2019-07-24 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
EP2122828B1 (en) 2007-01-03 2018-08-22 Dolby Laboratories Licensing Corporation Hybrid digital/analog loudness-compensating volume control
EP2130019B1 (en) 2007-03-19 2013-01-02 Dolby Laboratories Licensing Corporation Speech enhancement employing a perceptual model
US8213624B2 (en) 2007-06-19 2012-07-03 Dolby Laboratories Licensing Corporation Loudness measurement with spectral modifications

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6002776A (en) * 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
EP1304681A2 (en) * 2001-10-15 2003-04-23 Samsung Electronics Co., Ltd. Speech absence probability estimation and noise removal

Also Published As

Publication number Publication date
EP2168122A1 (en) 2010-03-31
TWI464735B (zh) 2014-12-11
BRPI0813723B1 (pt) 2020-02-04
JP2010534030A (ja) 2010-10-28
ES2377719T3 (es) 2012-03-30
BRPI0813723A2 (pt) 2017-07-04
CN101790758A (zh) 2010-07-28
JP5192544B2 (ja) 2013-05-08
US20100198378A1 (en) 2010-08-05
US8396574B2 (en) 2013-03-12
RU2438197C2 (ru) 2011-12-27
RU2010105052A (ru) 2011-08-20
WO2009011827A1 (en) 2009-01-22
TW200915301A (en) 2009-04-01
ATE535906T1 (de) 2011-12-15
EP2168122B1 (en) 2011-11-30

Similar Documents

Publication Publication Date Title
CN101790758B (zh) 用于控制音频信号的信号处理的设备和方法
US11533575B2 (en) Loudness adjustment for downmixed audio content
CN102684628B (zh) 修正音频动态处理器的参数的方法以及执行该方法的设备
US8812308B2 (en) Apparatus and method for modifying an input audio signal
US9647624B2 (en) Adaptive loudness levelling method for digital audio signals in frequency domain
CN104471855A (zh) 具有噪声检测和响度下降检测的响度控制
CN103262409A (zh) 用于改进的感觉的频谱不平衡的音频信号的动态补偿
JP2023103223A (ja) ラウドネスレベルを制御するオーディオ信号処理方法及び装置
JP2009296298A (ja) 音声信号処理装置および方法
US10141905B2 (en) Amplifier with adjustment of the automatic sound level
Neoran et al. A Perceptive Loudness-Sensitive Leveler for Audio Broadcasting and Mastering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20100728

Assignee: Lenovo (Beijing) Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2012990000553

Denomination of invention: Audio processing using auditory scene analysis and spectral skewness

License type: Common License

Record date: 20120731

C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20100728

Assignee: Lenovo (Beijing) Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2012990000553

Denomination of invention: Audio processing using auditory scene analysis and spectral skewness

License type: Common License

Record date: 20120731

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model