JP2010534030A - 聴覚情景分析とスペクトルの歪みを用いた音響処理 - Google Patents

聴覚情景分析とスペクトルの歪みを用いた音響処理 Download PDF

Info

Publication number
JP2010534030A
JP2010534030A JP2010517000A JP2010517000A JP2010534030A JP 2010534030 A JP2010534030 A JP 2010534030A JP 2010517000 A JP2010517000 A JP 2010517000A JP 2010517000 A JP2010517000 A JP 2010517000A JP 2010534030 A JP2010534030 A JP 2010534030A
Authority
JP
Japan
Prior art keywords
auditory
weighting
loudness
acoustic signal
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010517000A
Other languages
English (en)
Other versions
JP5192544B2 (ja
Inventor
シーフェルト、アラン・ジェフリー
スミサーズ、マイケル・ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39776994&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2010534030(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2010534030A publication Critical patent/JP2010534030A/ja
Application granted granted Critical
Publication of JP5192544B2 publication Critical patent/JP5192544B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Holo Graphy (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

音響信号の聴覚イベントのラウドネスをコントロールする方法である。実施の形態では、その方法は、聴覚イベント(聴覚イベントはスペクトルとラウドネスを有する)をスペクトルの歪みを用いて重み付けすることと、その重みを用いて聴覚イベントのラウドネスをコントロールすることを含む。本発明の種々の実施の形態は以下の通りである:重み付けは、スペクトルの歪みの大きさに比例すること;重み付けは、音響信号の振幅に鈍感であること;重み付けは、パワーに鈍感であること;重み付けは、ラウドネスに鈍感であること;信号の大きさと絶対的再生レベルとの関係は、重み付けの時点で分かっていないこと;重み付けには、スペクトルの歪みを用いて、聴覚イベント境界の重要性の重み付けをすることを含む。
【選択図】図2

Description

本発明は、一般的に音響処理に関し、特に聴覚情景分析とスペクトルの歪みに関する。
[文献と参照による組込み]
以下の文献は、その全体を本明細書に参照して組み込む。
−Crockett、Seefeldt、PCT国際特許出願第PCT/US2007/008313号、発明の名称「Controlling Dynamic Gain Parameters of Audio using Auditory Scene Analysis and Specific-Loudness-Based Detection of Auditory Events」、発明者:Brett Graham Crockett、Alan Jeffrey Seefeldt、出願日2007年3月30日、代理人整理番号DOLI86PCT、公開公報WO2007/127023、公開日2007年11月8日
−Seefeldt、他、 PCT国際特許出願第PCT/US2004/016964号、発明の名称「Method, Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal」、発明者:Alan Jeffrey Seefeldt、他、出願日2004年5月27日、代理人整理番号DOLI19PCT、公開公報WO2004/111994、公開日2004年12月23日
−Seefeldt、 PCT国際特許出願第PCT/US2005/038579号、発明の名称「Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal」、発明者:Alan Jeffrey Seefeldt、出願日2005年10月25日、代理人整理番号DOLI5202PCT、公開公報WO2006/047600、公開日2006年5月4日
−Crockett、 米国特許出願第10/474,387号、発明の名称「High Quality Time- Scaling and Pitch-Scaling of Audio Signals」、発明者:Brett Graham Crockett、出願日2003年10月10日、代理人整理番号DOL07503、公開公報US2004/0122662、公開日2004年6月24日
−Crockett、他、 米国特許出願第10/478,398号、発明の名称「Method for Time Aligning Audio Signals Using Characterizations Based on Auditory Events」、発明者:Brett G. Crockett、他、出願日2003年11月20日、代理人整理番号DOL09201、公開公報US2004/0148159、公開日2004年7月29日
−Crockett、米国特許出願第10/478,538号、発明の名称「Segmenting Audio Signals Into Auditory Events」、発明者:Brett G. Crockett、出願日2003年11月20日、代理人整理番号DOL098、公開公報US2004/0165730、公開日2004年8月26日
−Crockett、他、米国特許出願第10/478,397号、発明の名称「Comparing Audio Using Characterizations Based on Auditory Events」、発明者:Brett G. Crockett、他、出願日2003年11月20日、代理人整理番号DOL092、公開公報US2004/0172240、公開日2004年9月2日
−Smithers、PCT国際特許出願第PCT/US2005/24630号、発明の名称「Method for Combining Audio Signals Using Auditory Scene Analysis」、発明者:Michael John Smithers、出願日2005年7月13日、代理人整理番号DOL148PCT、公開公報WO2006/026161、公開日2006年3月9日
−Crockett, B.、Smithers, M「A Method for Characterizing and Identifying Audio Based on Auditory Scene Analysis」オーディオ工学会会議講演集6416、第118回会議、バルセロナ、2005年5月28〜31日
−Crockett, B.「High Quality Multichannel Time Scaling and Pitch-Shifting using Auditory Scene Analysis」オーディオ工学会会議講演集5948、ニューヨーク、2003年10月
−Seefeldt他「A New Objective Measure of Perceived Loudness」オーディオ工学会会議講演集6236、サンフランシスコ、2004年10月28日
情景技術
[聴覚イベントと聴覚イベント検出]
音を分離して区別して知覚される単位あるいは部分に分けることを「聴覚イベント分析」あるいは「聴覚情景分析(ASA)」と称することがある。Albert S. Bregman著「聴覚情景分析−音の知覚組織化」(マサチューセッツ工科大学、1991年、第4刷、2001年、MITプレスペーパーバック第2版)は、聴覚情景分析について広範に説明している。さらに、Bhadkamkarらの米国特許第6,002,776号(1999年12月14日)は、「聴覚情景分析による音の分離に関する先行技術作業」として1976年にさかのぼる文献を述べている。しかし、Bhadkamkarらは聴覚情景分析の実用的使用を勧めず、「聴覚情景分析に含まれる技術は、ヒトの聴覚処理のモデルとしては科学的観点からは興味深いが、基本的進歩がなされるまでは、現在のところ音分離の実際的技術として考えるにはあまりにコンピュータ的に要求が多く専門化しなければならない」と結論付けている。
CrockettおよびCrocketらは、上記の種々の特許出願や論文で、聴覚イベントを特定している。これらの文献は、時間に関するスペクトル組成(周波数の関数としての振幅)での変化を検出することにより音響信号を聴覚イベント(それぞれは、分離して区別して知覚されがちである)に分けることを教示する。たとえば、このことは、音響信号の連続的時間ブロックのスペクトル成分を計算し、連続する時間ブロック間のスペクトル成分を比較し、聴覚イベント境界をスペクトル成分の差が閾値を越えたブロック間の境界として特定する。あるいは、時間に関する振幅の変化を、時間に関するスペクトル組成の変化の代わりに、あるいは、追加して計算してもよい。
聴覚イベント境界のマーカは、時間的コントロール信号に整えられることが多く、典型的にはゼロから1である範囲はイベント境界の強さを示す。さらに、このコントロール信号は、イベント境界の強さを保つようにフィルタされることが多く、イベント境界の時間間隔は先行するイベント境界の減少値として算定される。そして、このフィルタされた聴覚イベント強さは、自動ゲイン制御やダイナミックレンジ制御を含む他の音響処理方法で用いられる。
[音響の動的処理]
自動ゲイン制御(AGC)とダイナミックレンジ制御(DRC)の技術は、周知であり、多くの音響信号経路で普及している。概要として、両方の技術は、音響信号のレベルを測定し、測定したレベルの関数であるアマウント(amount)により信号のゲイン変更をする。線形の、すなわち1:1の動的処理システムでは、入力音響は処理されず、出力音響信号が入力音響信号と理想的にマッチする。さらに、入力信号を自動的に測定し、その測定と共に出力信号をコントロールする音響動的処理システムを想定する。入力信号のレベルが6dB上昇し、処理された出力信号が3dBしか上昇しないとすると、出力信号は、入力信号に関して2:1の比率で圧縮されたことになる。
クロケット(Crockett)とシーフェルト(Seefeldt)では、聴覚イベント境界間のゲインの変化を最小化し、ゲインの変化の多くをイベント境界の近傍に限定することにより、聴覚情景分析が、AGC法およびDRC法の性能を向上させる。このことは、動的処理リリースの動きを変更することにより行われる。このように、聴覚イベントは、安定し自然に聞こえる。
ピアノで弾かれる音が一例である。従来のAGC法またはDRC法では、音響信号に適用されるゲインは、各音の尾部の間に大きくなり、各音を不自然に大きくする。聴覚情景分析では、AGCゲインまたはDRCゲインは各音の間一定に維持され、聴覚イベント境界が検出される各音の出だしの近くでのみ変化する。結果として得られるゲインを調整した音響信号は、各音の尾部が徐々に消えて自然に聞こえる。
聴覚情景分析(上記の文献での)の代表的な実施は、意図的にレベル不変である。つまり、絶対的な信号のレベルに関係なく、聴覚イベント境界を検出する。多くの用途においてレベルに不変なことは有用ではあるが、聴覚情景分析ではレベルに依存することからも恩恵を受けることもある。
そのような場合の1つがクロケットとシーフェルトに記載されている方法である。そこでは、AGCとDRCのASAコントロールが聴覚イベント境界間の大きなゲイン変化を防止する。しかし、長期間でのゲイン変化でも、音響信号のタイプによっては好ましくない。音響信号が大きな音の区間から静かな区間へ進むとき、イベント境界の近くでの変化だけに限定されているAGCまたはDRCゲインは、静かな区間の間に処理する音響信号のレベルを不適切に不自然に大きくする。この状況は、散発的な会話が静かな背景音と交互に生ずる映画でよく生ずる。静かな背景音響信号もまた聴覚イベントを含むので、AGCゲインまたはDRCゲインはこれらのイベント境界の近くで変化し、全体的な音響信号レベルが上昇する。
音響信号レベル、パワーまたはラウドネスの大きさにより単純に聴覚イベントの重要性に重み付けをすることは好ましくない。多くの状況において、信号の大きさと絶対的再生レベルとの関係は知られていない。理想的には、音響信号の絶対的レベルに独立して、知覚的に静かな音響信号を識別し、または、検出する大きさが実用的であろう。
ここで、「知覚的に静かな」とは、客観的な音のラウドネスの大きさ(シーフェルトら、および、シーフェルトで記載されるように)で静かなことではなく、むしろ、中身の期待ラウドネスに基づいて静かなことである。たとえば、ヒトの経験は、ささやきは静かな音であることを示す。動的処理システムがこれを静かであると測定し、その結果AGCゲインを公称の出力ラウドネスまたはレベルを達するように上昇させると、結果として得られるゲイン調整されたささやきは、経験でそうあるべきとするより大きくなるであろう。
ここでは、音響信号の聴覚イベントのラウドネスをコントロールする方法と装置を説明する。実施の形態でその方法は、スペクトルの歪みを用いて聴覚イベント(聴覚イベントはスペクトルとラウドネスを有する)を重み付けすることと、重みを用いて聴覚イベントのラウドネスをコントロールすることを含む。本発明の様々な実施の形態は次の通りである:重みはスペクトルの歪みの大きさに比例する;歪みの大きさは滑らかにした歪みの大きさである;重み付けは音響信号の振幅に鈍感である;重み付けはパワーに鈍感である;重み付けはラウドネスに鈍感である;信号の大きさと絶対的再生レベルとの関係は重み付けの時には分かっていない;重み付けは、スペクトルの歪みを用いて聴覚イベント境界の重要性の重み付けをすることを含む;本願特許請求の範囲に記載の重み付けを行わない方法と比較して、音響信号の知覚的に静かな区間の間のAGC処理レベルまたはDRC処理レベルの増大を低減する。
他の実施の形態では、本発明は上記の方法のいずれかを実行するコンピュータプログラムを含むコンピュータ可読メモリである。
さらに別の実施の形態では、本発明は、CPU、上記のメモリの1つおよびCPUとメモリとを通信連結するバスを含むコンピュータシステムである。
さらに別の実施の形態では、本発明は、音響信号のスペクトルの歪みを計算するスペクトルの歪み計算装置、計算されたスペクトルの歪みを用いて音響信号の聴覚イベントを識別し重み付けする聴覚イベント識別装置、音響信号の聴覚イベントのラウドネスをコントロールするパラメータを変更するパラメータ変更装置、および、音響信号の聴覚イベントのラウドネスをコントロールするコントローラを含む音響信号プロセッサである。
さらに別の実施の形態では、本発明は、音響信号の聴覚イベントのラウドネスをコントロールする方法であり、音響信号の連続する聴覚イベントのスペクトルの歪みの大きさを計算すること、その歪みの大きさに基づいて聴覚イベントの重みを生成すること、その重みからコントロール信号を導くこと、およびそのコントロール信号を用いて聴覚イベントのラウドネスをコントロールすることを含む。
本発明の様々な特徴とその好適な実施の形態は、以下の説明と添付の図面を参照することで、よりよく理解できるであろう。添付の図面では類似の要素には類似の参照番号を用いる。
図1は、聴覚情景を分析し動的ゲインパラメータをコントロールするクロケットとシーフェルトの2つの方法を実行する装置を図示する。 図2は、本発明の実施の形態による、聴覚イベントを識別し、聴覚イベントを変更する歪みを計算し、それ自身が動的処理パラメータを変更する音響プロセッサを図示する。 図3は、本発明の一実施の形態による、ダイナミックレンジコントローラ(DRC)のデジタル実施におけるリリース時間をコントロールする聴覚イベントの使用を示す一連のグラフである。 図4は、本発明の実施の形態による透過フィルタとして適した線形フィルタの理想化した音響フィルタ特性応答を示す。 図5は、ERBスケールでクリティカル帯域に近似した、一連の理想化した音響フィルタ特性応答を示す。
図1はクロケットとシーフェルトによる聴覚情景を分析し動的ゲインパラメータをコントロールする装置1を示す。その装置は、聴覚イベント識別装置10と、オプションの聴覚イベント特性識別装置11と、動的パラメータ変更装置12とを含む。聴覚イベント識別装置10は入力として音響を受け取り、動的パラメータ変更装置12用の入力(および、存在するときには聴覚イベント特性識別装置11用の入力)を生成する。動的パラメータ変更装置12は、聴覚イベント識別装置10(および、存在するときには聴覚イベント特性識別装置11)の出力を受け取り、出力を生成する。
聴覚イベント識別装置10は、スペクトルを分析し、その結果から、動的ゲインパラメータをコントロールするべき知覚可能な音響イベントの位置を識別する。代替として、聴覚イベント識別装置10は、音響を知覚ラウドネス領域(それは、最初の方法よりさらに心理音響的に関連した情報を提供する)に変換し、知覚ラウドネス領域で動的ゲインパラメータをコントロールするべき聴覚イベントの位置を識別する。(この代替では、音響処理は絶対的音響再生レベルを知っている。)
動的パラメータ変更装置12は、聴覚イベント識別装置10(および、存在するときには聴覚イベント特性識別装置11)の出力に基いて動的パラメータを変更する。
いずれの代替においても、デジタル音響信号x[n]は、ブロックに分割され、各ブロックtに対して、D[t]は現在のブロックと前のブロックとのスペクトルの差を表す。
1番目の代替について、D[t]は、現在のブロックtと前のブロックt−1の正規化した対数スペクトル係数(dBで)間の差の大きさの、全スペクトル係数にわたる、合計である。この代替では、D[1]は、スペクトルの絶対的な差(dBにおけるそれ自身)に比例する。2番目の代替について、D[t]は、現在のブロックtと前のブロックt−1の正規化特定ラウドネス係数間の差の大きさの、全特定ラウドネス係数にわたる、合計である。この代替では、D[t]は、特定ラウドネス(ソーンにおける)の絶対的な差に比例する。
いずれの代替においても、D[t]が閾値Dminを超えると、イベントが生じたとみなされる。イベントは、DmaxとDminの差に対するD[t]マイナスDminの比に基く、0と1の間の強さを有する。強さA[t]は下式で計算される
Figure 2010534030
最大と最小の限界は、各代替により、その異なった単位のために異なる。しかし、双方からの結果は、0から1の範囲のイベント強さとなる。他の代替でもイベント強さを計算するが、式(1)で表わされる代替は、多くの領域でそれ自身が動的処理をコントロールすることを含むことを示す。聴覚イベントに強さ(そのイベントに伴うスペクトル変化のアマウントに比例する)を与えることは、2値のイベント決定に比べて、動的処理のより大きなコントロールをできる。より強いイベントではより大きなゲインの変化が容認され、式(1)での信号はそのような可変のコントロールを可能にする。
信号A[t]は、インパルスがイベント境界の位置で生じるインパルス信号である。リリース時間をコントロールするために、イベント境界の検出後は0へ滑らかに減衰するように信号A[t]をさらに平滑化する。平滑化イベントコントロール信号
Figure 2010534030
は、A[t]から次式により計算される。
Figure 2010534030
ここで、αeventがイベントコントロール信号の減衰時間をコントロールする。
図3は、一実施の形態による本発明の作用と効果を図示する一連のグラフであり、図3のb)は、250msに設定されたスムーサの半減衰時間を有する、図3のa)の対応する音響信号に対するイベントコントロール信号を表わす。音響信号は、静かな背景のキャンプファイヤ有響音が組み入れられた、3つのせりふのバーストを含む。イベントコントロール信号はせりふと背景音の両方で多くの聴覚イベントを示す。
図3では、c)は、DRCゲイン信号を示し、イベントコントロール信号A[t]を用いてDRCゲイン平滑化のためのリリース時定数を変化させる。クロケットとシーフェルトが述べるように、コントロール信号が1に等しいときには、リリース平滑化係数は影響を受けず、時定数の値により平滑化ゲインが変化する。コントロール信号が0に等しいときには、平滑化ゲインは変化することを阻止される。コントロール信号が0と1の間のときには、平滑化ゲインは変化できるが、コントロール信号に比例して減少した率である。
図3のc)では、DRCゲインは、背景中に検出した多くのイベントのために静かな背景音の間に上昇する。図3のd)の結果としてのDRC変更音響信号は、せりふのバーストの間に背景ノイズの可聴な好ましくない増大を有する。
静かな背景音の間のゲイン変化を減少するために、本発明の実施の形態では、音響信号スペクトルの非対称性の大きさを用いて、聴覚強さA[t]を変更しまたは重み付けする。本発明の実施の形態は、音響信号の励磁のスペクトルの歪みを計算する。
歪みは、確率分布の非対称性の統計的大きさである。平均値に対して対称な分布は、ゼロの歪みを有する。平均値より大きなところに大半あるいは大部分が集まり、平均値よりも低くなる長い尾部を有する分布は、負の歪みを有する。平均値より小さなところに集まり、平均値よりも高くなる長い尾部を有する分布は、正の歪みを有する。代表的な音響信号の強度またはパワースペクトルは正の歪みを有する。すなわち、スペクトルのエネルギの大半はスペクトルの低い部分に集まり、スペクトルはスペクトルの大きな部分に向けた長い尾部を有する。
図2は、本発明の実施の形態による音響処理装置2を示す。音響処理装置2は、図1の動的パラメータ変更装置12とオプションとしての聴覚イベント特性識別装置11の他に、聴覚イベント識別装置20と歪み計算装置21を含む。歪み計算装置21と聴覚イベント識別装置20の双方で音響信号13を受信し、歪み計算装置21は聴覚イベント識別装置20の入力を生成する。それ以外では聴覚イベント識別装置20、聴覚イベント特性識別装置11および動的パラメータ変更装置12は図1の対応する装置のように接続される。
図2では、歪み計算装置21は音響信号13のスペクトル表現から歪みを計算し、聴覚イベント識別装置20は同じスペクトル表現から聴覚情景分析を計算する。音響信号13はMサンプルの50%重複したブロックに分類され、以下のように離散フーリエ変換が計算される。
Figure 2010534030
ここで、M=2×Nサンプルで、x[n,t]はサンプルのブロックを表す。
フーリエ変換のためのブロックサイズは、聴覚イベント信号を計算するのと同じであると仮定される。しかし、このことはそうではなくてもよい。異なったブロック比率が存在する場合、一つのブロック比率の信号が、他のブロック比率の信号と同じ時間スケールに補間されまたは比率変換される。
時間ブロックt間のクリティカル帯域bでの内耳の基底膜に沿ってのエネルギ分布を近似する励磁信号E[b,t]は以下で計算される。
Figure 2010534030
ここで、T[k]は外耳および中耳を通る音響の伝達をシミュレートするフィルタの周波数応答を表し、C[k]は、クリティカル帯域bに対応する位置での基底膜の周波数応答を表す。
図4は、適切な透過フィルタT[k]の周波数応答を示す。図5は、C[k]に対応する、一連の適切なクリティカル帯域フィルタ応答を示し、48kHzとM=2048の変換サイズのサンプル比率に対し、ムーアおよびグラスベルグの等価矩形帯域幅(ERB:Equivalent Rectangular Bandwidth)尺度に従って40の帯域が均一に間隔を置いて配置されている。指数曲線関数が各フィルタ形状を示し、1ERBが帯域を分離する。
聴覚イベント境界が特定ラウドネススペクトルからクロケットとシーフェルトにより計算されると、励磁信号E[b,t]は特定ラウドネス計算の一部として既に存在する。
最後に、スペクトルの歪みが次式のように励磁信号E[b,t]から計算される。
Figure 2010534030
ここで、μは次式の励磁の算術平均で、
Figure 2010534030
σは励磁信号の分散である。
Figure 2010534030
式(5)の歪み信号SK[t]は、かなり変動し、イベントコントロール信号とそれに続く動的処理パラメータを変更するときに不自然な結果を避けるように平滑化が必要である。一実施の形態では、約6.5msの半減時間を有する減衰定数αSKを伴う単極スムーサを用いる。
Figure 2010534030
歪みを最大SKmaxと最小SKminに制限することは有用である。制限された歪みSK”[t]は次式で計算される。
Figure 2010534030
歪み信号SK”[t]の低い値(0.0に近い値)は典型的には、特徴的に静かな信号に対応し、高い歪みの値(1.0に近い値)は典型的には、特徴的に大きな音の信号に対応する。図3では、e)のグラフは、図3のa)の音響信号に対応する歪み信号を示す。歪みは、大きな音のせりふバーストに対して高く、背景音に対して低い。
歪み信号SK”[t]は、スペクトル差の大きさD[t]に次式で重み付けする、図2の聴覚イベント識別装置20に伝達される。
Figure 2010534030
歪み変更聴覚強さ信号ASK[t]は、(1)式のA[t]と同じ方法で計算される。
Figure 2010534030
歪み変更聴覚強さ信号ASK[t]は、(2)式のA[t]と同じ方法で平滑化される。
Figure 2010534030
図3ではf)は、図3のa)の対応する音響信号用の歪み変更イベントコントロール信号
Figure 2010534030
を示す。背景音の間は聴覚イベントが現れるのはさらに少ないが、大きな音のせりふに対応するイベントはそのまま残る。
図3ではg)は、歪み変更イベントコントロールDRC信号を示す。背景音のさらに少ない聴覚イベントで、DRCゲインは比較的一定に留まり、大きな音のせりふ区間でのみ動く。図3のh)は、結果としてのDRC変更音響信号を示す。
DRC変更音響信号は、背景音の間はレベルの好ましくない増大を全く含まない。
歪み信号SK”[t]は、知覚できる大きな音の信号ではときどき低くなる。このような大きな音の信号に対しては、スペクトル差の大きさD[t]は十分に大きく、(8)式の歪み信号SK”[t]で重み付けされた後でさえ、重み付けされたスペクトル差の大きさDSK[t]は典型的には聴覚イベント境界を示すのに十分なほどに大きい。イベントコントロール信号
Figure 2010534030
は、悪影響を受けない。

Claims (13)

  1. 音響信号の聴覚イベントのラウドネスをコントロールする方法であって:
    聴覚イベント(スペクトルとラウドネスを有する聴覚イベント)を、前記スペクトルを用いて重み付けすることと;
    前記重みを用いて、聴覚イベントのラウドネスをコントロールすることとを備える;
    方法。
  2. 前記重み付けすることは、
    聴覚イベントを重み付けし、前記重み付けはスペクトルの歪みの大きさに比例することを備える;
    請求項1の方法。
  3. 前記歪みの大きさは、平滑化された歪みの大きさである;
    請求項2の方法。
  4. 前記重み付けすることは、前記音響信号の振幅には鈍感である;
    請求項1の方法。
  5. 前記重み付けすることは、パワーには鈍感である;
    請求項1の方法。
  6. 前記重み付けすることは、ラウドネスには鈍感である;
    請求項1の方法。
  7. 音響の大きさと絶対的再生レベルとの関係は、重み付けの時点では分かっていない;
    請求項1の方法。
  8. 前記重み付けすることは、
    前記スペクトル中の歪みを用いて、聴覚イベント境界の重要性の重み付けをすることを含むことを含む;
    請求項1の方法。
  9. 本特許請求の範囲に記載の重み付けを行わない方法と比較して、音響信号の知覚的に静かな区間の間のAGC処理レベルまたはDRC処理レベルの増大を低減することをさらに備える:
    請求項1の方法。
  10. 請求項1ないし請求項9の方法のいずれかを実行するコンピュータプログラムを含む、
    コンピュータ可読メモリ。
  11. CPUと;
    請求項10のメモリと;
    前記CPUと前記メモリとを通信可能に接続するバスとを備える;
    コンピュータシステム。
  12. 音響信号のスペクトルの歪みを計算するスペクトル歪み計算装置と;
    前記計算されたスペクトルの歪みを用いて、前記音響信号の聴覚イベントを識別し重み付けする聴覚イベント識別装置と;
    前記音響信号の聴覚イベントのラウドネスをコントロールするパラメータを変更するパラメータ変更装置と;
    前記音響信号の前記聴覚イベントのラウドネスをコントロールするコントローラとを備える;
    音響信号プロセッサ。
  13. 音響信号の連続する聴覚イベントのスペクトルの歪みの大きさを計算することと;
    前記歪みの大きさに基づいて前記聴覚イベントの重みを生成することと;
    前記重みからコントロール信号を導くことと;
    前記コントロール信号を用いて前記聴覚イベントのラウドネスをコントロールすることとを備える:
    音響信号の聴覚イベントのラウドネスをコントロールする方法。
JP2010517000A 2007-07-13 2008-07-11 聴覚情景分析とスペクトルの歪みを用いた音響処理 Active JP5192544B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US95946307P 2007-07-13 2007-07-13
US60/959,463 2007-07-13
PCT/US2008/008592 WO2009011827A1 (en) 2007-07-13 2008-07-11 Audio processing using auditory scene analysis and spectral skewness

Publications (2)

Publication Number Publication Date
JP2010534030A true JP2010534030A (ja) 2010-10-28
JP5192544B2 JP5192544B2 (ja) 2013-05-08

Family

ID=39776994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010517000A Active JP5192544B2 (ja) 2007-07-13 2008-07-11 聴覚情景分析とスペクトルの歪みを用いた音響処理

Country Status (10)

Country Link
US (1) US8396574B2 (ja)
EP (1) EP2168122B1 (ja)
JP (1) JP5192544B2 (ja)
CN (1) CN101790758B (ja)
AT (1) ATE535906T1 (ja)
BR (1) BRPI0813723B1 (ja)
ES (1) ES2377719T3 (ja)
RU (1) RU2438197C2 (ja)
TW (1) TWI464735B (ja)
WO (1) WO2009011827A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9372881B1 (en) 2015-12-29 2016-06-21 International Business Machines Corporation System for identifying a correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
EP2425426B1 (en) 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US8510361B2 (en) * 2010-05-28 2013-08-13 George Massenburg Variable exponent averaging detector and dynamic range controller
CN105792086B (zh) * 2011-07-01 2019-02-15 杜比实验室特许公司 用于自适应音频信号产生、编码和呈现的***和方法
WO2013150340A1 (en) * 2012-04-05 2013-10-10 Nokia Corporation Adaptive audio signal filtering
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
EP2898510B1 (en) * 2012-09-19 2016-07-13 Dolby Laboratories Licensing Corporation Method, system and computer program for adaptive control of gain applied to an audio signal
EP3515055A1 (en) 2013-03-15 2019-07-24 Dolby Laboratories Licensing Corp. Normalization of soundfield orientations based on auditory scene analysis
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
CN104079247B (zh) 2013-03-26 2018-02-09 杜比实验室特许公司 均衡器控制器和控制方法以及音频再现设备
AU2014248232B2 (en) 2013-04-05 2015-09-24 Dolby International Ab Companding apparatus and method to reduce quantization noise using advanced spectral extension
JP6224850B2 (ja) 2014-02-28 2017-11-01 ドルビー ラボラトリーズ ライセンシング コーポレイション 会議における変化盲を使った知覚的連続性
US10306392B2 (en) 2015-11-03 2019-05-28 Dolby Laboratories Licensing Corporation Content-adaptive surround sound virtualization
US10412490B2 (en) 2016-02-25 2019-09-10 Dolby Laboratories Licensing Corporation Multitalker optimised beamforming system and method
CN112470219A (zh) 2018-07-25 2021-03-09 杜比实验室特许公司 压缩机目标曲线以避免增强噪声
CN113015059B (zh) * 2021-02-23 2022-10-18 歌尔科技有限公司 音频优化方法、装置、设备及可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61107802A (ja) * 1984-10-26 1986-05-26 アールジー・ダイナミツクス・インコーポレーテツド 増幅器における抵抗減衰
JPH0566795A (ja) * 1991-09-06 1993-03-19 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 雑音抑圧装置とその調整装置
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JPH1098346A (ja) * 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JP2004129187A (ja) * 2002-07-29 2004-04-22 Matsushita Electric Works Ltd 自動利得制御装置
WO2006033570A1 (en) * 2004-09-20 2006-03-30 Nederlandse Organisatie Voor Toegepast- Natuurwetenschappelijk Onderzoek Tno Frequency compensation for perceptual speech analysis
WO2006047600A1 (en) * 2004-10-26 2006-05-04 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Family Cites Families (129)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) * 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) * 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
US4624009A (en) * 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
DE3314570A1 (de) * 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) * 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) * 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (ja) * 1989-03-08 1990-09-21
US5097510A (en) * 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) * 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5583962A (en) * 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
EP0517233B1 (en) 1991-06-06 1996-10-30 Matsushita Electric Industrial Co., Ltd. Music/voice discriminating apparatus
US5278912A (en) * 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5363147A (en) * 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) * 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) * 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) * 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) * 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5530760A (en) * 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
US5500902A (en) * 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) * 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) * 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) * 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
EP0661905B1 (de) 1995-03-13 2002-12-11 Phonak Ag Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6041295A (en) * 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
US6301555B2 (en) * 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US5601617A (en) * 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) * 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) * 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) * 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) * 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US6108431A (en) * 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6327366B1 (en) * 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6430533B1 (en) * 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) * 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) * 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
EP0820212B1 (de) * 1996-07-19 2010-04-21 Bernafon AG Lautheitsgesteuerte Verarbeitung akustischer Signale
JP2953397B2 (ja) * 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5862228A (en) * 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6125343A (en) * 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) * 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) * 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) * 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) * 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6233554B1 (en) * 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) * 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) * 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) * 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) * 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
WO1999065276A1 (en) * 1998-06-08 1999-12-16 Cochlear Limited Hearing instrument
EP0980064A1 (de) * 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) * 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) * 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) * 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
EP1089242B1 (en) 1999-04-09 2006-11-08 Texas Instruments Incorporated Supply of digital audio and video products
AU4278300A (en) * 1999-04-26 2000-11-10 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) * 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6985594B1 (en) 1999-06-15 2006-01-10 Hearing Enhancement Co., Llc. Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
AU2725201A (en) 1999-11-29 2001-06-04 Syfx Signal processing system and method
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US7058572B1 (en) 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) * 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) * 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) * 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
DE60029453T2 (de) * 2000-11-09 2007-04-12 Koninklijke Kpn N.V. Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz
US7457422B2 (en) * 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) * 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) * 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
WO2001049068A2 (de) * 2001-04-10 2001-07-05 Phonak Ag Verfahren zur anpassung eines hörgerätes an ein individuum
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
ATE318062T1 (de) 2001-04-18 2006-03-15 Gennum Corp Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen
KR100400226B1 (ko) * 2001-10-15 2003-10-01 삼성전자주식회사 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법
WO2003036621A1 (en) * 2001-10-22 2003-05-01 Motorola, Inc., A Corporation Of The State Of Delaware Method and apparatus for enhancing loudness of an audio signal
US20040037421A1 (en) * 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
FR2842576B1 (fr) 2002-07-17 2004-10-08 Skf Ab Dispositif de palier a roue libre et poulie a roue libre
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
WO2004073178A2 (en) 2003-02-06 2004-08-26 Dolby Laboratories Licensing Corporation Continuous backup audio
DE10308483A1 (de) * 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
US8437482B2 (en) 2003-05-28 2013-05-07 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US20050071154A1 (en) * 2003-09-30 2005-03-31 Walter Etter Method and apparatus for estimating noise in speech signals
US6923684B2 (en) 2003-10-10 2005-08-02 O'sullivan Industries, Inc. Power harness having multiple upstream USB ports
DE602005022641D1 (de) 2004-03-01 2010-09-09 Dolby Lab Licensing Corp Mehrkanal-Audiodekodierung
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
TWI397901B (zh) * 2004-12-21 2013-06-01 Dolby Lab Licensing Corp 控制音訊信號比響度特性之方法及其相關裝置與電腦程式
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
GB2428168A (en) 2005-07-06 2007-01-17 Motorola Inc A transmitter splits a signal into a plurality of sub-signals, each containing a plurality of sub-carriers, and amplifies each sub-signal separately.
ATE441920T1 (de) 2006-04-04 2009-09-15 Dolby Lab Licensing Corp Lautstärkemessung von tonsignalen und änderung im mdct-bereich
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
BRPI0709877B1 (pt) 2006-04-04 2019-12-31 Dolby Laboratories Licensing Corp método e aparelho para controlar uma característica de intensidade acústica particular de um sinal de áudio
BRPI0711063B1 (pt) 2006-04-27 2023-09-26 Dolby Laboratories Licensing Corporation Método e aparelho para modificar um parâmetro de processamento de dinâmicas de áudio
KR101137715B1 (ko) 2006-10-20 2012-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 리셋을 사용하는 오디오 다이내믹스 프로세싱
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
KR101106031B1 (ko) 2007-01-03 2012-01-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 하이브리드 디지털/아날로그 음향 세기―보상 볼륨 제어 장치 및 그 제어 방법
US8560320B2 (en) 2007-03-19 2013-10-15 Dolby Laboratories Licensing Corporation Speech enhancement employing a perceptual model
JP2010521706A (ja) 2007-06-19 2010-06-24 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スペクトル修飾によるラウドネス測定

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61107802A (ja) * 1984-10-26 1986-05-26 アールジー・ダイナミツクス・インコーポレーテツド 増幅器における抵抗減衰
JPH0566795A (ja) * 1991-09-06 1993-03-19 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 雑音抑圧装置とその調整装置
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JPH1098346A (ja) * 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JP2004129187A (ja) * 2002-07-29 2004-04-22 Matsushita Electric Works Ltd 自動利得制御装置
WO2006033570A1 (en) * 2004-09-20 2006-03-30 Nederlandse Organisatie Voor Toegepast- Natuurwetenschappelijk Onderzoek Tno Frequency compensation for perceptual speech analysis
WO2006047600A1 (en) * 2004-10-26 2006-05-04 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9372881B1 (en) 2015-12-29 2016-06-21 International Business Machines Corporation System for identifying a correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset
US9529877B1 (en) 2015-12-29 2016-12-27 International Business Machines Corporation Method for identifying correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset

Also Published As

Publication number Publication date
EP2168122B1 (en) 2011-11-30
CN101790758A (zh) 2010-07-28
WO2009011827A1 (en) 2009-01-22
TWI464735B (zh) 2014-12-11
BRPI0813723A2 (pt) 2017-07-04
ES2377719T3 (es) 2012-03-30
RU2438197C2 (ru) 2011-12-27
BRPI0813723B1 (pt) 2020-02-04
EP2168122A1 (en) 2010-03-31
ATE535906T1 (de) 2011-12-15
US8396574B2 (en) 2013-03-12
TW200915301A (en) 2009-04-01
JP5192544B2 (ja) 2013-05-08
US20100198378A1 (en) 2010-08-05
CN101790758B (zh) 2013-01-09
RU2010105052A (ru) 2011-08-20

Similar Documents

Publication Publication Date Title
JP5192544B2 (ja) 聴覚情景分析とスペクトルの歪みを用いた音響処理
US9768749B2 (en) Audio control using auditory event detection
JP2015523606A (ja) 雑音検出及びラウドネス低下検出によるラウドネスコントロール
US11894006B2 (en) Compressor target curve to avoid boosting noise
JP2009296298A (ja) 音声信号処理装置および方法
JP2011141540A (ja) 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体
CN114615581A (zh) 一种提升音频主观感受质量的方法及装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110628

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110926

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111003

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130131

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5192544

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160208

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250