JP6242489B2 - 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 - Google Patents

脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 Download PDF

Info

Publication number
JP6242489B2
JP6242489B2 JP2016531763A JP2016531763A JP6242489B2 JP 6242489 B2 JP6242489 B2 JP 6242489B2 JP 2016531763 A JP2016531763 A JP 2016531763A JP 2016531763 A JP2016531763 A JP 2016531763A JP 6242489 B2 JP6242489 B2 JP 6242489B2
Authority
JP
Japan
Prior art keywords
signal
envelope
transient
continuous
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016531763A
Other languages
English (en)
Other versions
JP2016528546A (ja
Inventor
ジェロエン ブリーバルト,ディルク
ジェロエン ブリーバルト,ディルク
ルー,リエ
ソレ,アントニオ マテオス
ソレ,アントニオ マテオス
エール. トウィンゴ,ニコラ
エール. トウィンゴ,ニコラ
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー・インターナショナル・アーベー filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2016528546A publication Critical patent/JP2016528546A/ja
Application granted granted Critical
Publication of JP6242489B2 publication Critical patent/JP6242489B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

関連出願への相互参照
本願は2013年7月29日に出願されたスペイン特許出願第P201331160号および2013年9月30日に出願された米国仮特許出願第61/884,672号の優先権を主張するものである。各出願はここに参照によってその全体において組み込まれる。
技術分野
一つまたは複数の実施形態は概括的にはオーディオ信号処理に、より詳細には過渡信号についての時間的歪みを低減するとともに、オブジェクト・ベースのオーディオ処理システムおいてオーディオ・オブジェクトの知覚されるサイズを修正するために使用できる仕方でオーディオ信号を脱相関させることに関する。
音源または音オブジェクトは、知覚される位置および知覚されるサイズもしくは幅を含む空間的属性をもつ。一般に、オブジェクトの知覚される幅は鼓膜に到達する二つの信号の両耳間相関またはコヒーレンスという数学的概念に密接に関係している。脱相関は一般に、オーディオ信号をより空間的に拡散して聞こえるようにするために使われる。したがって、オーディオ信号の相関の修正または操作は、オーディオ処理、符号化およびレンダリング用途において普通に見出される。オーディオ信号の相関またはコヒーレンスの操作は典型的には、入力信号を受けて一つまたは複数の出力信号を生成する一つまたは複数の脱相関器回路を使って実行される。脱相関器のトポロジーに依存して、出力がその入力から脱相関される、あるいは複数の出力が互いから相互に脱相関される。二つの信号の相関指標は、二つの信号の相互相関関数を計算することによって決定できる。一般に、相関指標は、相互相関関数のピークの値(しばしばコヒーレンスと称される)またはラグ(相対遅延)0における値(相関係数)である。脱相関は、継続時間Tの時間区間にわたって計算されたときに+1より小さい規格化された相互相関係数またはコヒーレンス
Figure 0006242489
をもつこととして定義される:上記の式において、x(t)、y(t)は互いに低い相関をもつようにされた信号であり、pは規格化された相互相関係数およびコヒーレンスである。コヒーレンス値は、相対遅延τにまたがる規格化された相互相関関数の最大と等価である。
空間的オーディオ処理では、信号脱相関は、音像の知覚に対して有意な影響をもつことがあり、指標の相関はオーディオ再生における知覚的効果の有意な予測子である。図1は、従来技術において知られている単純な脱相関器の二つの構成を示している。上の回路100は出力信号y(t)を入力信号x(t)から脱相関する。一方、下の回路101は二つの相互に脱相関された出力y(t)およびx(t)を生成し、これらは共通の入力からは脱相関されていてもいなくてもよい。幅広い多様な脱相関プロセスが現行システムにおける使用のために提案されており、単純な遅延から周波数依存の遅延、ランダム位相の全域通過フィルタ、ラティス全域通過フィルタおよびそれらの組み合わせまで多様である。これらのプロセスはみな、波形を変えるなどして入力信号を有意に修正する。定常的なまたはなめらかに連続的な信号については、そのような修正は一般に問題ではない。しかしながら、インパルス的なまたは高速に変化する信号(過渡信号)については、そのような修正は望ましくない歪みにつながることがある。たとえば、過渡信号の開始に関し、脱相関によって波形を修正することは、時間的なぼけまたは同様の効果を引き起こすことがある。同様に、過渡信号の停止に際し、脱相関は、フィルタおよび付随する回路に関連する内在的な減衰時間に起因して、ポストエコーまたは残響のような効果につながることがあり、これは入力信号がレベルにおいて時間的に急峻な減少をもつときに可聴となる。このように、脱相関に関わるフィルタリング・プロセスはしばしば、劣化した過渡応答または過渡の「歯切れのよさ」(cripsness)につながる。
そのような望ましくない効果を克服するために、脱相関回路はしばしば、これらのアーチファクトを減衰させるために上記フィルタ構造の後のレベル調整段または他の同様の脱相関後の処理をもつ。このように、現在の脱相関回路は、入力信号自身の特性および成分に基づいて適切な量の脱相関を実行するのではなく、時間的なぼけおよび他の劣化効果を、脱相関フィルタより後で補正しようとするという点で、制限されている。したがって、そのようなシステムは、インパルスまたは過渡信号処理に関連する問題を十分に解決するものではない。現在の脱相関回路に関連する具体的な欠点は、劣化した過渡応答、ダウンミックス・アーチファクトを受けやすいことおよび相互に脱相関された出力の数に対する制限を含む。
劣化した過渡応答の問題に関し、現行の脱相関器のねらいは、完全な入力信号を、その内容や構造に関わりなく脱相関することである。具体的には、過渡信号(たとえば、打楽器の開始部)は実際の録音では通例、脱相関されない。一方、録音に存在するその持続部分または残響部分はしばしば脱相関される。従来技術の脱相関回路は一般に、この区別を再現することができない。よって、その出力は、不自然に聞こえることがあり、あるいは結果として劣化した過渡応答をもつことがある。
ダウンミックス・アーチファクトの問題に関し、脱相関プロセスの一部が入力を遅延させることに関わるという事実のため、脱相関器の出力はしばしば、ダウンミックスのためには好適ではない。ある信号をその遅延されたバージョンと加算することは、加算された周波数スペクトルにおけるピークおよびノッチの反復的な生起のため、望ましくない櫛形フィルタ・アーチファクトにつながる。ダウンミックスはオーディオ符号化器、AV受領器、増幅器などにおいて頻繁に生起するプロセスなので、この属性は脱相関回路に依拠する多くの用途において問題である。
相互に脱相関された出力の制限された数の問題に関し、可聴エコーおよび望ましくない時間的ぼけアーチファクトを防止するために、脱相関器において適用される全遅延はしばしば、10ないし30msのオーダーなど、かなり小さい。つまり、相互に独立した出力の数は、要求されたとしても、制限される。実際上、遅延によって構築できる、相互に有意に脱相関され、上述したダウンミックス・アーチファクトを被らない出力は、二つまたは三つのみである。
背景セクションにおいて論じられる主題は、単に背景セクションにおける言及の結果として従来技術であると想定されるべきではない。同様に、背景セクションにおいて言及されるまたは背景セクションの主題に関連する問題は、従来技術において以前に認識されていたと想定されるべきではない。背景セクションにおける主題は単に、種々のアプローチを表わしており、それらのアプローチ自身、発明であることもありうる。
実施形態は、入力オーディオ信号を、入力信号包絡〔エンベロープ〕における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離し、連続成分を脱相関回路において処理して脱相関された連続信号を生成し、脱相関された連続信号を過渡成分と組み合わせて出力信号を構築することによって、入力オーディオ信号を処理する方法に向けられる。この実施形態では、揺動は時間に関して測られ、過渡成分は、過渡成分を連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別される。時間変動特性は、エネルギー、ラウドネスおよびスペクトル・コヒーレンスのうちの一つであってもよい。この実施形態のもとでの本方法は、入力オーディオ信号の包絡を推定し、前記あらかじめ定義された閾値に対する前記時間変動特性の変化について入力オーディオ信号の包絡を解析して過渡成分を同定することをさらに含んでいてもよい。この方法は、関心対象のある種の周波数帯域を強化または減衰させるために入力オーディオ信号を事前フィルタリングすることおよび/または入力オーディオ信号の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡成分を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成することを含んでいてもよい。
ある実施形態では、本方法はさらに、過渡成分、連続成分、入力信号および脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することを含む。ここで、重み付け値は混合利得を含む。脱相関された連続信号は、入力オーディオ信号の包絡および脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされてもよい。脱相関回路は、複数の全域通過遅延セクションを含んでいてもよく、脱相関された連続信号の包絡は連続成分の包絡から予測されてもよい。本方法はさらに、連続成分および/または脱相関された連続信号をフィルタリングして、出力信号において周波数依存の相関を得ることを含んでいてもよい。
ある実施形態では、入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号であってもよく、重み付け値は該空間的再生データに依存する。空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含んでいてもよい。
上記の入力オーディオ信号を処理する方法についての諸実施形態を実装するシステムまたは装置およびコンピュータ可読媒体についてのいくつかのさらなる実施形態が記述される。
以下の図面において、同様の参照符号は同様の要素を指すために使われる。以下の図面はさまざまな例を描いているが、一つまたは複数の実装は図面に描かれている例に限定されるものではない。
従来技術において知られている脱相関回路の例示的構成を示す図である。 ある実施形態のもとでの、過渡処理に基づく脱相関器回路を示すブロック図である。 ある実施形態のもとでの、過渡処理に基づく脱相関システムにおいて使うための脱相関器回路を示すブロック図である。 ある実施形態のもとでの、出力包絡予測および出力レベル調整を実行する脱相関器の後処理回路を示すブロック図である。 ある実施形態のもとでの、包絡予測器回路を含む脱相関システムを示す図である。 ある実施形態のもとでの、過渡に基づく脱相関システムと一緒に使うためのある種の前処理機能を示す図である。 ある実施形態のもとでの、過渡処理に基づく脱相関器システムにおいてオーディオ信号を処理する方法を示すブロック図である。
脱相関フィルタリングの適用前に入力オーディオ信号を処理する過渡処理器のためのシステムおよび方法が記述される。過渡処理器は、入力信号の特性および内容を解析し、入力信号の定常または連続成分から過渡成分を分離する。過渡処理器は、入力信号の過渡またはインパルス成分を抽出し、連続信号を脱相関回路に送り、該脱相関回路において連続信号はその後、所定の脱相関機能に従って脱相関され、一方、入力信号の過渡成分は脱相関されないままである。出力段は、脱相関された連続信号を抽出された過渡成分と組み合わせて、出力信号を形成する。このようにして、入力信号は、何らかの脱相関フィルタリングがされる前に、適切に解析され、分解される。それにより適正な脱相関が入力信号の適切な成分に適用されることができ、過渡信号の脱相関に起因する歪みが防止できる。
本稿に記載される一つまたは複数の実施形態の諸側面は、ソフトウェア命令を実行する一つまたは複数のコンピュータまたは処理装置を含むミキシング、レンダリングおよび再生システムにおいて源オーディオ情報を処理するオーディオまたはオーディオビジュアル(AV)システムにおいて実装されてもよい。記述される実施形態はいずれも、単独でまたは任意の組み合わせにおいて互いと一緒に、使用されうる。本明細書の一つまたは複数の箇所で議論または暗示されることがありうるさまざまな実施形態は従来技術のさまざまな欠点によって動機付けられていることがありうるが、それらの実施形態は必ずしもこれらの欠点のいずれかに対処するものではない。つまり、種々の実施形態は、本明細書において論じられることがある種々の欠点に対処してもよい。いくつかの実施形態は、本明細書において論じられることがあるいくつかの欠点またはただ一つの欠点に部分的に対処するのみであることがありうる。いくつかの実施形態は、これらの欠点のいずれにも対処しないことがありうる。
図2は、ある実施形態のもとでの、過渡処理器に基づく脱相関器回路を示すブロック図である。回路200において示されるように、入力信号x(t)が過渡処理器202に入力される。入力信号x(t)は過渡処理器によって解析される。過渡処理器は、信号の過渡成分を、信号の連続成分に対して識別する。過渡処理器202は、入力x(t)の過渡またはインパルス成分を抽出して中間信号s1(t)および過渡内容(補助)信号s2(t)を生成する。中間信号s1(t)は連続信号内容を含み、これは次いで脱相関器204によって処理されて出力y(t)を生成する。過渡内容信号s2(t)はいかなる脱相関も適用されることなくそのまま出力段206に渡され、よってインパルス脱相関に起因する時間的なぼけや他の歪みは生じない。出力段206は過渡成分s2(t)および脱相関器出力y(t)を組み合わせて出力y'(t)を生成する。出力y'(t)は、脱相関された連続信号成分および脱相関されていない過渡成分の組み合わせを含む。回路200は、何らかの脱相関フィルタを適用する前に過渡処理器によって入力信号を処理する。これは、脱相関後に信号を補正処理する現行の脱相関器回路と対照的である。
図2に示されるように、信号の過渡成分s2(t)は連続成分s1(t)から分離され、いかなる脱相関も実行されることなくそのまま出力段に送られる。あるいはまた、過渡成分s2(t)も、連続信号脱相関器に比べ、より少ない脱相関を適用するまたは異なる脱相関プロセスを適用する別個の脱相関回路によって脱相関されてもよい。
〈過渡処理器〉
図2に示されるように、入力信号x(t)は過渡処理器202によって処理されて、中間信号s1(t)および補助信号s2(t)を与える。これらのうち、s1(t)のみが脱相関器204によって処理されて脱相関された出力y(t)を与える。信号s1(t)は、入力信号x(t)の連続的な諸セグメントに関連付けられているまたはそれから構成される。一方、抽出される信号s2(t)は、信号レベルにおける高速なまたは大きな揺動に関連付けられているx(t)の信号セグメントまたは成分、すなわち信号の過渡成分を表わす。過渡信号は一般に、非常に短い時間期間において信号レベルを変える信号として定義され、振幅、エネルギー、ラウドネスまたは他の関連する特性における有意な変化によって特徴付けられてもよい。ある時間(たとえばミリ秒単位)および/またはレベル(たとえばdB単位)など、これらの特性の一つまたは複数が、入力信号における過渡成分の存在を検出するために、システムによって定義されていてもよい。
ある実施形態では、図2の過渡処理器202は、入力信号レベルにおける突然の増大または減少があればそれに応答する過渡検出器を有することができる。あるいはまた、過渡処理器202は、一つまたは複数の過渡成分を含む信号セグメントを識別するセグメンテーション・アルゴリズムまたは連続的な信号セグメントから過渡的な信号を分離する過渡抽出器または任意の類似の過渡処理方法において具現されてもよい。
ある実施形態では、過渡処理は、入力信号x(t)の包絡e1(t)を推定する包絡推定関数e1(t)=F(x(t))を含む。ここで、F(.)が包絡推定関数である。そのような関数はヒルベルト変換、ピーク検出または次式に従う短期RMS推定を含むことができる:
Figure 0006242489
上記の式において、w(t)は窓関数である。一般的な窓関数は次のように指数関数的な減衰をもつ。
Figure 0006242489
上記の式において、ε(t)は階段関数〔ステップ関数〕であり、cは、エネルギーまたはRMS値を計算する有効継続時間または減衰を決定する係数である。代替的であり可能性としてはより効率的な消費包絡抽出器は
Figure 0006242489
によって与えられうる。
いくつかの実施形態では、信号x(t)は、たとえば高域通過フィルタを使うことによって、関心対象のある種の諸周波数領域を増強または減衰させるために、包絡を計算する前にフィルタリングされる。
ある実施形態では、減衰係数ciの相違に反映される複数の異なる積分継続期間を使って、二つ以上の包絡が計算される:
Figure 0006242489
さらにもう一つの実施形態では、包絡を計算するために、漏れのあるピーク・ホールド・アルゴリズムが使われる:
e(t)=f(x(t))=max(x(t−τ)ε(τ)exp(−cτ))
さらにもう一つの実施形態では、包絡は信号の絶対値(すなわち振幅)から計算される:
e(t)=abs(x(t))
過渡処理のために、入力信号x(t)におけるエネルギー・レベルの強い変化を示す突然の変化について、包絡e(t)が解析される。たとえば、e(t)があるあらかじめ定義された量だけ(絶対値においてまたはその前の一つまたは複数の値に比して)増大する場合、その増大に関連付けられた信号は過渡成分と指定されてもよい。ある実施形態では、6dB以上の変化が信号の過渡成分としての識別をトリガーしてもよい。しかしながら、システムおよび用途の要求および制約条件に依存して、他の値が使用されてもよい。
あるいはまた、ある実施形態では、信号が過渡成分を含んでいる確率を評価する、過渡処理器202において利用される軟判定関数が適用されてもよい。ある好適な関数は、異なる積分時間、たとえばそれぞれ5および100msを用いて計算された二つの包絡推定e1(t)とe2(t)の比である。そのような場合、信号x(t)は信号s1(t)とs2(t)に分解されることができる。
s1(f,t)=x(f,t)min(1,e2(f,t)/e1(f,t))
s2(f,t)=x(f,t)−s1(f,t)
これは
s2(t)=x(t)(1−min(1,e2(t)/e1(t)))
と等価である。
この実施形態において、信号s1(t)およびs2(t)は入力信号x(t)の、x(t)の包絡に依存する時間変化する利得関数a(t)との積として定式化できる:
s1(t)=x(t)a1(t)
s2(t)=x(t)a2(t)
ここで、
a1(t)=min(1,e2(t)/e1(t)))
a2(t)=1−min(1,e2(t)/e1(t))
である。
信号x(t)の突然の増大の場合、包絡e1(t)は、包絡e2(t)よりx(t)の変化に際してより高速に反応する。よって、過渡成分はe2(t)とe1(t)の商だけ減衰させられることになる。その結果、過渡成分は、s1(t)には含まれないまたは部分的にしか含まれない。
もう一つの実施形態では、信号s2(t)は、「過渡」と分類された諸信号セグメントを含んでいてもよい。一方、信号s1(t)は他のすべてのセグメントを含んでいてもよい。オーディオ信号の過渡および連続信号フレームへのそのようなセグメンテーションは、多くの不可逆オーディオ圧縮アルゴリズムの一部である。
ある代替的な実施形態では、過渡処理器202は、包絡処理とは異なるサブバンド過渡処理を実行してもよい。上記の方法は広帯域包絡e(t)を利用する。この代替的な実施形態では、各サブバンドにおける過渡成分を検出するために、サブバンド包絡e(f,t)も推定されることができる。ここで、fはサブバンド・インデックスを表わす。オーディオ信号は一般に異なる複数の源の混合なので、諸サブバンドにおいて過渡成分を検出することは、各源の過渡成分または開始を検出するという恩恵をもちうる。そのことは、サブバンドに基づく脱相関技術を潜在的に向上させることもありうる。
サブバンド過渡成分は、上記と同様の仕方で、たとえば次の式に示されるように推定できる。
s1(f,t)=x(f,t)min(1,e2(f,t)/e1(f,t))
s2(f,t)=x(f,t)−s1(f,t)
上記の式において、x(f,t)はサブバンド・オーディオ信号であり、s2(f,t)はサブバンド「過渡」信号を含み、s1(f,t)はサブバンド「定常」信号を含む。
すべてのサブバンド信号を一緒に組み合わせると、広帯域「定常」s1(t)および「過渡」信号s2(t)が次のように得られる。
s1(t)=Σf s1(f,t)
s2(t)=Σf s2(f,t)
ある種の場合には、過渡成分はスペクトル・コヒーレンスから検出できる。こうして、ある代替的な実施形態では、過渡処理器202はスペクトル・コヒーレンスに基づく過渡処理を実行してもよい。この実施形態については、過渡処理器202は、オーディオ信号の突然のエネルギー変化を検出するエネルギー包絡e(t)を比較する比較器を含む。この実施形態は、スペクトル・コヒーレンスが、どこで新しいオーディオ・イベントまたはオーディオ源が現われるかを検出するために、スペクトル変化を検出できるという事実を使うものである。
時刻tにおけるオーディオ信号のスペクトル・コヒーレンスc(t)は、ある実施形態では、時刻tの前後での二つの構成要素となるフレーム/窓の間のスペクトル類似性によって、たとえば次式によって測定できる。
Figure 0006242489
上記の式において、Xl(f,t)およびXr(f,t)は時刻tにおける左および右のフレーム/窓のスペクトルである。スペクトル・コヒーレンスc(t)は、長期的なコヒーレンスを得るために長い窓において(たとえば移動平均によって)さらに平滑化されることができる。一般に、小さなコヒーレンスはスペクトル変化を示しうる。たとえば、小さなコヒーレンスはスペクトル変化を示しうる。たとえば、c(t)があるあらかじめ定義された量だけ(絶対値においてまたはその前の一つまたは複数の値に比して)減少する場合、その減少に関連付けられた信号は過渡と指定されうる。
あるいはまた、上記と同様の軟判定関数が適用されてもよい。異なる窓サイズをもって二つのコヒーレンス推定c1(t)およびc2(t)が計算または平滑化されることができる。ここで、コヒーレンスc1(t)は、コヒーレンスc2(t)よりx(t)の変化に際してより高速に反応する。同様に、信号x(t)は信号s1(t)とs2(t)に次のように分解できる:
s1(t)=x(t)min(1,c1(t)/c2(t))
s2(t)=x(t)−s1(t)
上記の公式において、過渡成分を減衰させるために、c2(t)をc1(t)で割るのではなく、c1(t)とc2(t)の商が使われていることを注意しておくべきである。
上記で呈示したコヒーレンスは広帯域スペクトルから計算されるものの、この場合に上記のようなサブバンド方法も適用できることを注意しておくべきである。
過渡処理は、ラウドネス領域で実行されることもできる。この実施形態は、信号のラウドネスの突然の変化が信号における過渡成分の存在を示すことができるという事実を活用する。こうして、過渡処理器は、入力信号x(t)のラウドネスの変化を検出するよう構成されることができる。この実施形態では、上記の実施形態は、ラウドネス領域において信号を処理する関数を含むように拡張されることができる。ここで、エネルギーや振幅ではなくラウドネスが適用される。この実施形態について、一般に、ラウドネスはエネルギーまたは振幅の非線形変換である。
〈脱相関〉
図2に示されるように、回路200は、連続信号s2(t)を脱相関する脱相関器204を含んでいる。ある実施形態では、脱相関器204は、次式に示されるような、信号s1(t)を脱相関フィルタ・インパルス応答d(t)と畳み込みするフィルタ演算として実装される:
Figure 0006242489
ある実施形態では、脱相関器は、いくつかの縦続式の全域通過遅延セクションを有する脱相関フィルタを含む。図3は、ある実施形態のもとでの、過渡処理器に基づく脱相関システムにおける脱相関器において使用できる、ある全域通過セクションのデジタル・フィルタ表現を示している。図3に示されるように、フィルタ回路300はMサンプルの遅延およびフィードフォワードおよびフィードバック経路に適用される係数gからなる。フィルタ300のいくつかのセクションが組み合わされて、この縦続式の回路から帰結する平坦な大きさスペクトルをもつ擬似ランダムなインパルス応答を構築してもよい。セクションの数は、実装ならびに特定の信号処理用途の要求および制約条件に依存して変わることができる。図3に示されるような縦続式の全域通過遅延セクションを使うことの恩恵は、それらの遅延および/または係数をランダム化することによって、櫛形フィルタ・アーチファクトを生成することなく混合できる相互に無相関な出力を生成する複数の脱相関器が、かなり簡単に構築されることができるということである。
図3は脱相関器回路200について使用されうるフィルタ回路の特定の型を示しているが、脱相関器回路の他の型または変形が使用されてもよい。
ある種の実施形態では、ある種の脱相関器の後処理機能を実行するために、一つまたは複数のコンポーネントが設けられてもよい。たとえば、ある種の実際的な場合において、入力信号の包絡が急減する場合に脱相関既出力信号を除去するまたは減衰させるために、脱相関器後減衰機能を適用することが有用であることがある。ある実施形態では、過渡処理器に基づく脱相関システムは、脱相関器の入力信号の時間的包絡を推定し、その後、その入力包絡に密接に合致するよう脱相関器の出力信号を修正する、一つまたは複数の高度な時間的包絡整形ツールを含む。これは、過渡信号の急激な終わりをフィルタリングする脱相関によって引き起こされるポストエコー・アーチファクトまたはリンギングに関わる問題を軽減する助けとなる。
全域通過遅延セクションの縦続の場合、各全域通過遅延セクションの出力の包絡eap,out[n]は、その入力の包絡eap,in[n]から次式によって予測できる:
eap,out[n]=eap,out[n]c+(1−c)eap,in[n]
上記の式において、係数cは遅延Mおよび全域通過遅延セクションの係数gにc=g1/Mのように関係している。この定式化は、上記の出力包絡近似関数を縦続させることによって、全域通過遅延セクションの縦続の包絡の推定を許容する。脱相関器出力信号は、その後、次式に示されるように、全域通過遅延縦続の入力および出力包絡の商を乗算される:
y'[n]=y[n]min(1,eap,in[n]/eap,out[n])
図4は、ある実施形態のもとでの、出力包絡予測および出力レベル調整実行する脱相関器の後処理回路を示すブロック図である。図4に示されるように、回路400は、入力信号s1(t)を受け入れる脱相関器402と、包絡入力ein(t)を受け入れる包絡予測コンポーネント404とを含む。それぞれの出力y(t)およびeout(t)は次いで図のように組み合わされて出力y'(t)を生成する。
包絡予測器404は、入力信号x(t)から過渡処理器202によって生成されるein(t)の入力包絡を与えられて、y(t)の包絡を推定する。包絡入力ein(t)はs1(t)信号の包絡であり、上記で与えた式によって与えられるe1(t)およびe2(t)包絡推定の組み合わせである:
s1(t)=x(t)min(1,e1(t)/e2(t))
〈出力信号構築〉
ある実施形態では、脱相関システムは、脱相関器の出力を、過渡処理器によって生成された入力信号の過渡成分とともに処理して出力信号y'(t)を形成する出力回路206を含む。そのような出力回路は、包絡予測器回路400との関連で使用されることもできる。図5は、ある実施形態のもとでの、図2の脱相関システム200を、包絡予測器回路を含むよう修正したものを示している。図5の回路500に示されるように、包絡予測器コンポーネント404は、脱相関器回路204と組み合わされ、出力コンポーネント206は、包絡ein(t)、eout(t)および脱相関器出力信号y(t)を図4の回路400に従って処理する組み合わせ回路を含む。この出力段は、出力y'(t)を生成するために過渡信号成分s1(t)をも処理する。
ある実施形態では、出力コンポーネント206は、信号x(t)、s1(t)、s2(t)およびy'(t)を処理して、可変な相関または知覚される空間的幅をもつ二つ以上の信号を構築する。たとえば、出力信号のステレオ対l(t)、r(t)が:
l(t)=x(t)+s2(t)+y'(t)
r(t)=x(t)+s2(t)−y'(t)
を使って構築されてもよい。
補助信号s2(t)は、脱相関器入力s1(t)から除外された入力信号x(t)の信号セグメントについての補償を保証する。他の実施形態では、次のように一組の出力信号zr(t)を構築するために、複数の脱相関器信号y'q(t)が使用されてもよい:
zr(t)=Pr,q,1x(t)+Pr,q,2s2(t)+Pr,q,3y'q(t)
上記の式において、Pr,q,x値は出力混合利得または重みを表わす。図5に示されるように、出力コンポーネント206は、適切な利得または重み値を適用する利得段504を含む。ある実施形態では、利得段504は、出力信号における周波数依存の相関を得るために出力混合利得を適用するフィルタバンク回路として実装される。たとえば、単純な相補的なシェルビングフィルターがx(t)、s2(t)および/またはy'q(t)に適用されて、各信号の出力信号zr(t)に対する周波数依存の寄与を生成してもよい。
利得段504は、信号処理システムの特定の実装に関連付けられた具体的な特性について補償するよう構成されていてもよい。たとえば、y'q(t)に比べたx(t)の相対寄与が非常に低い周波数(たとえば約500Hzより下)においてより大きくなりうる場合に、本回路は、現実の環境においては拡散音響場の結果として鼓膜に到達する信号の相関が高周波数より低周波数においてより高い相関を与えるという効果をシミュレートするよう構成されうる。もう一つの例示的な場合では、y'q(t)に比べたx(t)の相対寄与は、約2kHzより上の周波数ではより小さくなりうる。人間は一般に、2kHzより上では相関の変化に、より低い周波数ほど敏感ではないからである。こうして、本回路は、この効果についても補償するようしかるべく構成されることができる。
いくつかの実施形態では、s2(t)はスケール関数a2(t)を使ったx(t)のスケーリングされたバージョンであってもよく、よってその場合、以下の定式化は上記と等価である:
zr(t)=x(t)(Pr,q,1+Pr,q,2a2(t))+Pr,q,3y'q(t)
または
zr(t)=x(t)Qx(t)+y'q(t)Qq(t)
つまり、出力信号zr(t)は、重みQx(t)がx(t)の包絡に依存する、入力信号x(t)と脱相関器出力y'q(t)の線形結合として定式化できる。
〈オブジェクト・ベース・オーディオへの応用〉
ある実施形態では、過渡に基づく脱相関システムは、オブジェクト・ベース・オーディオ処理システムとの関連で使われてもよい。オブジェクト・ベース・オーディオとは、オーディオ信号および関連する空間的再生情報を含むオーディオ・オブジェクトを利用するオーディオのオーサリング、伝送および再生のアプローチをいう。この空間的情報は、空間における所望されるオブジェクト位置およびオブジェクト・サイズまたは知覚される幅を含みうる。オブジェクト・サイズまたは幅は、スカラー・パラメータ(たとえば、最小および最大オブジェクト・サイズを示す0ないし1の範囲)によって、あるいは逆にチャネル間相互相関(最大サイズについての0から最小サイズについての+1の範囲)を指定することによって表現されることができる。さらに、相関およびオブジェクト・サイズのいかなる組み合わせがメタデータに含められてもよい。たとえば、オブジェクト・サイズは、あるオブジェクトを再生するために、諸出力信号を横断しての諸信号のエネルギー分布、たとえば各ラウドスピーカーのレベルを制御することができる。オブジェクト相関は、一つまたは複数の出力対の間の相互相関を制御し、よって知覚される空間的拡散性に影響しうる。この場合、オブジェクトのサイズはメタデータ定義として指定されてもよく、このサイズ情報が、信号のアレイを横断した音の分布を計算するために使われる。この場合、脱相関システムは、このオブジェクトの連続信号成分の空間的拡散性を提供し、過渡成分の脱相関を制限するまたは妨げる。
一般に、ラウドスピーカー・インデックスrについてのラウドスピーカー信号zr(t)は入力信号x(t)、補助信号s2(t)および一つまたは複数の脱相関回路の出力y'q(t)の線形結合によって次のように構築される:
zr(t)=Pr,q,1x(t)+Pr,q,2s2(t)+Pr,q,3y'q(t)
定常的な入力信号の場合、s2(t)は小さいか、さらには0であるであろう。その場合、信号対z1、z2の間の相関pは次式に従って設定されることができる:
z1(t)=cos(α+β)x(t)+sin(α+β)y1(t)
z2(t)=cos(α−β)x(t)+sin(α−β)y1(t)
上記の式において、αは自由に選ぶ角であり、βは所望される相関ρに依存し、β=0.5arccos(ρ)によって与えられる。
あるいはまた、次の定式化が使われてもよい。
Figure 0006242489
信号s2(t)が0でないときは、次式が適用できる。
Figure 0006242489
上記の式において、信号z1、z2は、所望されるオブジェクト・サイズに依存してあるレベル分布に従うために、その後、スケーリングを受けてもよい。この実施形態について、脱相関回路204の出力y(t)は、入力信号x(t)の包絡および脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる。
ある実施形態では、過渡に基づく脱相関システムは、入力を前記脱相関器回路への入力を修正する、前記脱相関フィルタの前に適用される一つまたは複数の機能プロセスを含んでいてもよい。図6に示されるように、回路600は一つまたは複数の前処理器を含む前処理段602を含む。図示した例については、前処理段602は、周囲(ambiance)処理器606およびダイアログ処理器602を、前記過渡処理器604とともに含む。これらの処理器は、個々にまたは合同して、脱相関器の前に適用されることができる。これらは、図6に示されるように同じ処理ブロック内の機能コンポーネントとして設けられてもよいし、あるいは過渡処理器604の前または後に機能を実行する個々のコンポーネントとして設けられてもよい。
ある実施形態では、周囲処理器606は、直接信号s2(t)から周囲信号s1(t)を抽出または推定し、周囲信号のみが脱相関器610によって処理される。周囲は通例、没入的なまたは包み込むような経験を高めることにおいて最も重要な成分だからである。
ダイアログ処理器608は、ダイアログ信号s2(t)を他の信号s1(t)から抽出または推定し、他の(ダイアログでない)信号のみが脱相関器610によって処理される。脱相関器アルゴリズムは、ダイアログの了解性にマイナスの影響を与えることがありうるからである。同様に、周囲処理器604は入力信号x(t)を直接成分および周囲成分に分離してもよい。周囲信号は脱相関にかけられてもよく、一方、ドライなまたは直接的な成分はs2(t)に送られてもよい。信号内の種々の型の信号または種々の成分を受け入れて適切な信号成分に脱相関を選択的に適用するために、他の同様の前処理機能が設けられてもよい。たとえば、適切な量の脱相関を適用してフィルタリング・プロセスに関連する歪みがあったとしても最小化するために、入力信号x(t)を解析してある種の定義された内容種別を抽出する内容解析ブロック(図示せず)も設けられてもよい。
図7は、ある実施形態のもとでの、過渡処理に基づく脱相関システムにおけるオーディオ信号の処理方法を示している。図7のプロセスは、入力信号の過渡的な(速く変化する)成分を、入力信号の連続的な(ゆっくり変化する)または定常的な成分から分離する(704)。連続的な信号成分は次いで脱相関される(706)。分離段階に先立って、ブロック702において示されるように、プロセスは、任意的に、ブロック706において適切な信号成分を脱相関器に送り、それにより純粋に過渡的/連続的な特性に基づくもの以外の信号の成分がしかるべく脱相関されたりされなかったりするようにするために、内容または特性(たとえば周囲、ダイアログなど)に基づいて入力信号を前処理してもよい。ブロック708に示されるように、脱相関された信号は、過渡成分と組み合わされて、出力信号を形成し(708)、この出力信号に適切な利得またはスケーリング因子が適用されて最終的な出力を生成してもよい(712)。プロセスは、ポストエコー歪みを最小化するために脱相関既出力を減衰させる任意的な包絡予測段階710をも、脱相関器の後処理段階として適用してもよい。ある実施形態では、図7の方法によって処理される入力信号は、オーディオ信号に関連付けられたメタデータとしてエンコードされる空間的キューを含むオブジェクト・ベース・オーディオ・システムを含んでいてもよい。
本稿に記載されるシステムの諸側面は、デジタルまたはデジタル化されたオーディオ・ファイルを処理するための適切なコンピュータ・ベースの音処理ネットワーク環境において実装されてもよい。適応オーディオ・システムの諸部分は、コンピュータ間で伝送されるデータをバッファリングおよびルーティングするはたらきをする一つまたは複数のルーター(図示せず)を含め、任意の所望される数の個別の機械を有する一つまたは複数のネットワークを含んでいてもよい。そのようなネットワークは、さまざまな異なるネットワーク・プロトコル上に構築されてもよく、インターネット、広域ネットワーク(WAN)、ローカル・エリア・ネットワーク(LAN)またはそれらの任意の組み合わせであってもよい。ネットワークがインターネットを含むある実施形態では、一つまたは複数の機械はウェブ・ブラウザー・プログラムを通じてインターネットにアクセスするよう構成されていてもよい。
上記のコンポーネント、ブロック、プロセスまたは他の機能要素の一つまたは複数は、本システムのプロセッサ・ベースのコンピューティング装置を制御するコンピュータ・プログラムを通じて実装されてもよい。本稿に開示されるさまざまな機能は、その挙動、レジスタ転送、論理コンポーネントおよび/または他の特性に関して、いくつでもあるハードウェア、ファームウェアおよび/またはさまざまな機械可読もしくはコンピュータ可読媒体において具現されたデータおよび/または命令を使って記述されうる。そのようなフォーマットされたデータおよび/または命令が具現されうるコンピュータ可読媒体は、光学式、磁気式または半導体式の記憶媒体などさまざまな形の物理的(非一時的)、不揮発性記憶媒体を含むがそれに限られない。
文脈が明瞭にそうでないことを要求するのでない限り、本稿および請求項を通じて、単語「有する」「含む」などは、排他的または網羅的な意味ではなく、包含的な意味に解釈される。すなわち、「含むがそれに限られない」の意味である。単数または複数を使った単語はそれぞれ複数または単数をも含む。さらに、単語「本稿では」「ここで」「上記」「下記」ならびに同様の含意の単語は本願全体を指すのであって、本願のいかなる特定の部分を指すのでもない。単語「または」が二つ以上の項目のリストを参照して使われるときは、その単語は、その単語の次の解釈のすべてをカバーする:リスト中の項目の任意のもの、リスト中の項目の全部およびリスト中の項目の任意の組み合わせ。
一つまたは複数の実装が例として、個別的な実施形態に関して記述されてきたが、一つまたは複数の実装は開示される実施形態に限定されるものではないことは理解される。逆に、当業者には明白であるようなさまざまな修正および同様の構成をカバーすることが意図されている。したがって、付属の請求項の範囲は、そのような修正および同様の構成のすべてを包含するものとして最も広い解釈を与えられるべきである。
いくつかの態様を記載しておく。
〔態様1〕
入力オーディオ信号を処理する方法であって:
前記入力信号を、入力信号包絡における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離する段階と;
前記連続成分を脱相関回路において処理して脱相関された連続信号を生成する段階と;
前記脱相関された連続信号を前記過渡成分と組み合わせて出力信号を構築する段階とを含む、
方法。
〔態様2〕
前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別される、態様1記載の方法。
〔態様3〕
前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、態様2記載の方法。
〔態様4〕
前記入力オーディオ信号の包絡を推定する段階と;
前記あらかじめ定義された閾値に対する前記時間変動特性の変化について前記入力オーディオ信号の前記包絡を解析して前記過渡成分を識別する段階とをさらに含む、
態様3記載の方法。
〔態様5〕
関心対象のある種の周波数帯域を強化するまたは減衰させるために前記入力オーディオ信号を事前フィルタリングする段階および前記入力オーディオ信号の前記包絡の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡成分を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成する段階のうちの少なくとも一つを実行することをさらに含む、態様2記載の方法。
〔態様6〕
前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することを含み、前記重み付け値は混合利得を含む、態様1記載の方法。
〔態様7〕
前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、態様1記載の方法。
〔態様8〕
前記脱相関回路は、複数の全域通過遅延セクションを含む、態様1記載の方法。
〔態様9〕
前記脱相関された連続信号の包絡が前記連続成分の包絡から予測される、態様7記載の方法。
〔態様10〕
前記連続成分および前記脱相関された連続信号の少なくとも一方をフィルタリングして、前記出力信号における周波数依存の相関を得る段階をさらに含む、態様1記載の方法。
〔態様11〕
前記入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号を含み、前記重み付け値は前記空間的再生データに依存する、態様6記載の方法。
〔態様12〕
前記空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含む、態様11記載の方法。
〔態様13〕
入力オーディオ信号を処理する装置であって:
前記入力信号を、入力信号包絡における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離する過渡処理器と;
前記連続成分を処理して脱相関された連続信号を生成する、前記過渡処理器に結合された脱相関回路と;
前記脱相関された連続信号 過渡成分を組み合わせて出力信号を構築する、前記脱相関回路および過渡処理器に結合された出力段とを有する、
装置。
〔態様14〕
前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別され、前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、態様13記載の装置。
〔態様15〕
前記入力オーディオ信号の包絡を推定し、前記あらかじめ定義された閾値に対する前記時間変動特性の変化について前記入力オーディオ信号の前記包絡を解析して前記過渡成分を識別するよう構成された、前記過渡処理器に結合された包絡処理器をさらに有する、態様14記載の装置。
〔態様16〕
関心対象のある種の周波数帯域を強化するまたは減衰させるために前記入力オーディオ信号を事前フィルタリングする前置フィルタ段と;
前記入力オーディオ信号の前記包絡の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡信号を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成するサブバンド処理器とをさらに有する、
態様15記載の装置。
〔態様17〕
前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用するよう構成された、前記出力段に付随する利得回路をさらに有しており、前記重み付け値は混合利得を含み、前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、態様13記載の装置。
〔態様18〕
前記脱相関回路は、複数の全域通過遅延セクションを含む、態様13記載の装置。
〔態様19〕
前記脱相関された連続信号の包絡を前記連続成分の包絡から予測するよう構成された、前記過渡処理器に結合された包絡予測器をさらに有する、態様13記載の装置。
〔態様20〕
前記連続成分および前記脱相関された連続信号の少なくとも一方をフィルタリングして、前記出力信号における周波数依存の相関を得るフィルタ段をさらに有する、態様13記載の装置。
〔態様21〕
前記入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号を含み、前記重み付け値は前記空間的再生データに依存し、前記空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含む、態様17記載の装置。
〔態様22〕
入力信号を処理する方法であって:
前記入力信号の信号包絡を解析して、前記入力信号の連続成分を、前記入力信号の過渡成分から識別する段階と;
前記連続成分を脱相関して脱相関された連続信号を生成する段階と;
前記過渡成分を出力段に渡す段階と;
前記過渡成分および前記脱相関された連続信号を前記出力段において組み合わせて出力信号を生成する段階とを含む、
方法。
〔態様23〕
ヒルベルト変換、ピーク検出プロセスまたは短期RMSプロセスのうちの一つを使って、前記入力信号の包絡を推定する段階をさらに含む、態様22記載の方法。
〔態様24〕
前記入力信号の異なる積分時間を用いて計算された二つの包絡推定を計算する段階と;
前記二つの包絡推定の比を使って前記過渡成分を前記連続成分から区別する段階とをさらに含む、
態様23記載の方法。
〔態様25〕
前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別され、さらに、前記過渡成分は入力信号包絡における高速な揺動によって特徴付けられ、連続成分は入力信号包絡における遅い揺動によって特徴付けられる、態様22記載の方法。
〔態様26〕
前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、態様25記載の方法。
〔態様27〕
前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することをさらに含み、前記重み付け値は前記出力信号を生成するための混合利得を含む、態様25記載の方法。
〔態様28〕
前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、態様27記載の方法。

Claims (28)

  1. 入力オーディオ信号を処理する方法であって:
    前記入力信号を、入力信号包絡における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離する段階と;
    前記連続成分を脱相関回路において処理して脱相関された連続信号を生成する段階と;
    前記脱相関された連続信号を前記過渡成分と組み合わせて出力信号を構築する段階とを含む、
    方法。
  2. 前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別される、請求項1記載の方法。
  3. 前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、請求項2記載の方法。
  4. 前記入力オーディオ信号の包絡を推定する段階と;
    前記あらかじめ定義された閾値に対する前記時間変動特性の変化について前記入力オーディオ信号の前記包絡を解析して前記過渡成分を識別する段階とをさらに含む、
    請求項3記載の方法。
  5. 関心対象のある種の周波数帯域を強化するまたは減衰させるために前記入力オーディオ信号を事前フィルタリングする段階および前記入力オーディオ信号の前記包絡の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡成分を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成する段階のうちの少なくとも一つを実行することをさらに含む、請求項2記載の方法。
  6. 前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することを含み、前記重み付け値は混合利得を含む、請求項1記載の方法。
  7. 前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、請求項1記載の方法。
  8. 前記脱相関回路は、複数の全域通過遅延セクションを含む、請求項1記載の方法。
  9. 前記脱相関された連続信号の包絡が前記連続成分の包絡から予測される、請求項7記載の方法。
  10. 前記連続成分および前記脱相関された連続信号の少なくとも一方をフィルタリングして、前記出力信号における周波数依存の相関を得る段階をさらに含む、請求項1記載の方法。
  11. 前記入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号を含み、前記重み付け値は前記空間的再生データに依存する、請求項6記載の方法。
  12. 前記空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含む、請求項11記載の方法。
  13. 入力オーディオ信号を処理する装置であって:
    前記入力信号を、入力信号包絡における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離する過渡処理器と;
    前記連続成分を処理して脱相関された連続信号を生成する、前記過渡処理器に結合された脱相関回路と;
    前記脱相関された連続信号 過渡成分を組み合わせて出力信号を構築する、前記脱相関回路および過渡処理器に結合された出力段とを有する、
    装置。
  14. 前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別され、前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、請求項13記載の装置。
  15. 前記入力オーディオ信号の包絡を推定し、前記あらかじめ定義された閾値に対する前記時間変動特性の変化について前記入力オーディオ信号の前記包絡を解析して前記過渡成分を識別するよう構成された、前記過渡処理器に結合された包絡処理器をさらに有する、請求項14記載の装置。
  16. 関心対象のある種の周波数帯域を強化するまたは減衰させるために前記入力オーディオ信号を事前フィルタリングする前置フィルタ段と;
    前記入力オーディオ信号の前記包絡の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡信号を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成するサブバンド処理器とをさらに有する、
    請求項15記載の装置。
  17. 前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用するよう構成された、前記出力段に付随する利得回路をさらに有しており、前記重み付け値は混合利得を含み、前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、請求項13記載の装置。
  18. 前記脱相関回路は、複数の全域通過遅延セクションを含む、請求項13記載の装置。
  19. 前記脱相関された連続信号の包絡を前記連続成分の包絡から予測するよう構成された、前記過渡処理器に結合された包絡予測器をさらに有する、請求項13記載の装置。
  20. 前記連続成分および前記脱相関された連続信号の少なくとも一方をフィルタリングして、前記出力信号における周波数依存の相関を得るフィルタ段をさらに有する、請求項13記載の装置。
  21. 前記入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号を含み、前記重み付け値は前記空間的再生データに依存し、前記空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含む、請求項17記載の装置。
  22. 入力信号を処理する方法であって:
    前記入力信号の信号包絡を解析して、前記入力信号の連続成分を、前記入力信号の過渡成分から識別する段階と;
    前記連続成分を脱相関して脱相関された連続信号を生成する段階と;
    前記過渡成分を出力段に渡す段階と;
    前記過渡成分および前記脱相関された連続信号を前記出力段において組み合わせて出力信号を生成する段階とを含む、
    方法。
  23. ヒルベルト変換、ピーク検出プロセスまたは短期RMSプロセスのうちの一つを使って、前記入力信号の包絡を推定する段階をさらに含む、請求項22記載の方法。
  24. 前記入力信号の異なる積分時間を用いて計算された二つの包絡推定を計算する段階と;
    前記二つの包絡推定の比を使って前記過渡成分を前記連続成分から区別する段階とをさらに含む、
    請求項23記載の方法。
  25. 記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別され、さらに、前記過渡成分は入力信号包絡における高速な揺動によって特徴付けられ、連続成分は入力信号包絡における遅い揺動によって特徴付けられ、前記揺動は時間に関して測られる、請求項22記載の方法。
  26. 前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、請求項25記載の方法。
  27. 前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することをさらに含み、前記重み付け値は前記出力信号を生成するための混合利得を含む、請求項25記載の方法。
  28. 前記脱相関された連続信号が、前記入力信号の包絡および前記脱相関の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、請求項27記載の方法。
JP2016531763A 2013-07-29 2014-07-23 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 Active JP6242489B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
ESP201331160 2013-07-29
ES201331160 2013-07-29
US201361884672P 2013-09-30 2013-09-30
US61/884,672 2013-09-30
PCT/US2014/047891 WO2015017223A1 (en) 2013-07-29 2014-07-23 System and method for reducing temporal artifacts for transient signals in a decorrelator circuit

Publications (2)

Publication Number Publication Date
JP2016528546A JP2016528546A (ja) 2016-09-15
JP6242489B2 true JP6242489B2 (ja) 2017-12-06

Family

ID=52432341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016531763A Active JP6242489B2 (ja) 2013-07-29 2014-07-23 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法

Country Status (5)

Country Link
US (1) US9747909B2 (ja)
EP (1) EP3028274B1 (ja)
JP (1) JP6242489B2 (ja)
CN (2) CN105408955B (ja)
WO (1) WO2015017223A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6242489B2 (ja) * 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
CN105432098B (zh) 2013-07-30 2017-08-29 杜比国际公司 针对任意扬声器布局的音频对象的平移
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US20160173808A1 (en) * 2014-12-16 2016-06-16 Psyx Research, Inc. System and method for level control at a receiver
US9860666B2 (en) * 2015-06-18 2018-01-02 Nokia Technologies Oy Binaural audio reproduction
CN110603821A (zh) 2017-05-04 2019-12-20 杜比国际公司 渲染具有表观大小的音频对象
DE112018003280B4 (de) * 2017-06-27 2024-06-06 Knowles Electronics, Llc Nachlinearisierungssystem und -verfahren unter verwendung eines trackingsignals
JP6471199B2 (ja) * 2017-07-18 2019-02-13 リオン株式会社 フィードバックキャンセラ及び補聴器
US11972767B2 (en) 2019-08-01 2024-04-30 Dolby Laboratories Licensing Corporation Systems and methods for covariance smoothing
EP4320614A1 (en) * 2021-04-06 2024-02-14 Dolby Laboratories Licensing Corporation Multi-band ducking of audio signals technical field
CN115567831A (zh) * 2021-06-30 2023-01-03 华为技术有限公司 一种提升扬声器的音质的方法及装置
WO2024023108A1 (en) 2022-07-28 2024-02-01 Dolby International Ab Acoustic image enhancement for stereo audio

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
CA3026283C (en) * 2001-06-14 2019-04-09 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US7398204B2 (en) * 2002-08-27 2008-07-08 Her Majesty In Right Of Canada As Represented By The Minister Of Industry Bit rate reduction in audio encoders by exploiting inharmonicity effects and auditory temporal masking
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US20100040243A1 (en) 2008-08-14 2010-02-18 Johnston James D Sound Field Widening and Phase Decorrelation System and Method
KR101230479B1 (ko) * 2008-03-10 2013-02-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법
CN102089817B (zh) * 2008-07-11 2013-01-09 弗劳恩霍夫应用研究促进协会 用于计算频谱包络数目的装置与方法
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
CN101770776B (zh) * 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理***
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
EP3144932B1 (en) * 2010-08-25 2018-11-07 Fraunhofer Gesellschaft zur Förderung der Angewand An apparatus for encoding an audio signal having a plurality of channels
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
RS1332U (en) 2013-04-24 2013-08-30 Tomislav Stanojević FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS
JP6242489B2 (ja) * 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法

Also Published As

Publication number Publication date
EP3028274A1 (en) 2016-06-08
EP3028274B1 (en) 2019-03-20
JP2016528546A (ja) 2016-09-15
WO2015017223A1 (en) 2015-02-05
CN105408955A (zh) 2016-03-16
US20160180858A1 (en) 2016-06-23
US9747909B2 (en) 2017-08-29
CN110619882B (zh) 2023-04-04
CN105408955B (zh) 2019-11-05
CN110619882A (zh) 2019-12-27

Similar Documents

Publication Publication Date Title
JP6242489B2 (ja) 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
US10650796B2 (en) Single-channel, binaural and multi-channel dereverberation
CA2959090C (en) A signal processing apparatus for enhancing a voice component within a multi-channel audio signal
RU2600527C1 (ru) Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
CA2903900C (en) Apparatus and method for multichannel direct-ambient decomposition for audio signal processing
US9042576B2 (en) Signal processing method, information processing apparatus, and storage medium for storing a signal processing program
KR20090042856A (ko) 오디오 신호로부터 주위 신호를 생성하는 장치 및 방법, 오디오 신호로부터 멀티-채널 오디오 신호를 도출하는 장치및 방법, 그리고 컴퓨터 프로그램
WO2009039897A1 (en) Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
KR102201308B1 (ko) 상관해제 필터들의 적응적 제어를 위한 방법 및 장치
KR20180075610A (ko) 사운드 스테이지 향상을 위한 장치 및 방법
JP2012524304A (ja) マルチチャネル信号のチャネル遅延パラメータを調整する方法及び装置
KR20140074918A (ko) 직접-산란 분해
Matsumoto Noise reduction with complex bilateral filter
WO2023172609A1 (en) Method and audio processing system for wind noise suppression
WO2023192039A1 (en) Source separation combining spatial and source cues
WO2023192036A1 (en) Multichannel and multi-stream source separation via multi-pair processing
CN116964665A (zh) 提高去混响的感知质量

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171107

R150 Certificate of patent or registration of utility model

Ref document number: 6242489

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250