JP5753899B2 - オーディオ信号合成器 - Google Patents

オーディオ信号合成器 Download PDF

Info

Publication number
JP5753899B2
JP5753899B2 JP2013519930A JP2013519930A JP5753899B2 JP 5753899 B2 JP5753899 B2 JP 5753899B2 JP 2013519930 A JP2013519930 A JP 2013519930A JP 2013519930 A JP2013519930 A JP 2013519930A JP 5753899 B2 JP5753899 B2 JP 5753899B2
Authority
JP
Japan
Prior art keywords
signal
auxiliary
inverse correlation
audio signal
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013519930A
Other languages
English (en)
Other versions
JP2013536461A (ja
Inventor
クリストフ フォーラー
フォーラー クリストフ
ヴィレッテ デビッド
ヴィレッテ デビッド
ユー ラン
ユー ラン
ジャンフェン シー
ジャンフェン シー
Original Assignee
ファーウェイ テクノロジーズ カンパニー リミテッド
ファーウェイ テクノロジーズ カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファーウェイ テクノロジーズ カンパニー リミテッド, ファーウェイ テクノロジーズ カンパニー リミテッド filed Critical ファーウェイ テクノロジーズ カンパニー リミテッド
Publication of JP2013536461A publication Critical patent/JP2013536461A/ja
Application granted granted Critical
Publication of JP5753899B2 publication Critical patent/JP5753899B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ符号化に関する。
たとえば、C.FallerおよびF.Baumgarte、「Efficient representation of spatial audio using perceptual parametrization」,Proc.IEEE Workshop on Appl.of Sig.Proc.to Audio and Acoust.,Oct.2001、199〜202ページに記載されるようなパラメトリックステレオまたはマルチチャンネルオーディオ符号化は、通常モノラルまたはステレオのダウンミックスオーディオ信号をより多くのチャンネルをもつ信号に合成するために空間キューを使用する。通常、ダウンミックスオーディオ信号は、マルチチャンネルオーディオ信号、たとえば、ステレオオーディオ信号の複数のオーディオチャンネル信号の重畳によって生じる。これらのより少数のチャンネルは、波形符号化され、原信号チャンネル関係に関係するサイド情報、すなわち、空間キューは、符号化されたオーディオチャンネルに追加される。復号器は、復号化された波形符号化されたオーディオチャンネルに基づいて当初の数のオーディオチャンネルを再生するために、このサイド情報を使用する。
基本パラメトリックステレオ符号器は、モノラルダウンミックスオーディオ信号からステレオ信号を生成するために必要とされるキューとしてチャンネル間レベル差(ILD)を使用することがある。より高度な符号器は、チャンネル間コヒーレンス(ICC)も使用することがあり、このチャンネル間コヒーレンスは、オーディオチャンネル信号、すなわち、オーディオチャンネルの間の類似度を表すことがある。さらに、たとえば、3Dオーディオまたはヘッドホン・ベース・サラウンド・レンダリングのためバイノーラルステレオ信号を符号化するとき、同様にチャンネル間位相差(IPD)は、チャンネル間の位相/遅延差を再現する役割を果たすことがある。
J.BlauertによるSpatial Hearing:The Psychophysics of Human Sound Localization,The MIT Press,Cambridge,Massachusetts,USA,1997に記載されるように、ICCキューの合成は、環境と、ステレオ残響と、音源幅と、空間印象に関連している他の知覚とを再現するために大部分のオーディオコンテンツおよび音楽コンテンツに関連していることがある。E.Schuijers,W.Oomen,B.den Brinker,およびJ.Breebaart、「Advances in parametric coding for high−quality audio」,in Preprint 114th Conv.Aud.Eng.Soc.,Mar.2003に記載されるように、コヒーレンス合成は、周波数領域において逆相関器を使用することにより実施されることがある。しかし、マルチチャンネルオーディオ信号を合成する既知の合成アプローチは、複雑性を増大させることがある。
本発明によって達成されるべき目標は、ダウンミックスオーディオ信号からマルチチャンネルオーディオ信号を合成する効率的な概念を提供することである。
本発明は、マルチチャンネルオーディオ信号がダウンミックスオーディオ信号の少なくとも3つの信号コピーに基づいてダウンミックスオーディオ信号から効率的に合成されることがあるという研究結果に基づいている。ダウンミックスオーディオ信号は、たとえば、マルチチャンネルオーディオ信号、たとえば、ステレオオーディオ信号の左オーディオチャンネル信号と右オーディオチャンネル信号との和を含むことがある。このようにして、第1のコピーは、第1のオーディオチャンネルを表すことがあり、第2のコピーは、拡散音を表すことがあり、第3のコピーは、第2のオーディオチャンネルを表すことがある。マルチチャンネルオーディオ信号を合成する(たとえば、生成する)ために、第2のコピーは、マルチチャンネルオーディオ信号を合成するためにそれぞれのオーディオチャンネルとそれぞれに結合されることがある2つの逆相関信号を生成するために使用されることがある。2つの逆相関信号を取得するために、第2のコピーは、特に周波数領域において予め記憶されるか、または、遅延させられることがある。しかしながら、逆相関信号は、時間領域において直接取得されることがある。両方の場合に、複雑性の低い配置が達成されることがある。
第1の実施形態によれば、本発明は、ダウンミックスオーディオ信号からマルチチャンネルオーディオ信号を合成するオーディオ信号合成器であって、ダウンミックスオーディオ信号のスペクトルを表す被変換オーディオ信号を取得するためにダウンミックスオーディオ信号を周波数領域に変換する変換器と、被変換オーディオ信号に基づいて第1の補助信号を生成し、第2の補助信号を生成し、第3の補助信号を生成する信号生成器と、第3の補助信号から少なくとも部分的に逆相関にある第1の逆相関信号と第2の逆相関信号とを生成する逆相関器と、第1のオーディオ信号と第2のオーディオ信号とがマルチチャンネルオーディオ信号を形成する第1のオーディオ信号を取得するために第1の補助信号を第1の逆相関信号と結合し、第2のオーディオ信号を取得するために第2の補助信号を第2の逆相関信号と結合する結合器とを備えるオーディオ信号合成器に関する。変換器は、たとえば、ダウンミックスオーディオ信号の短時間スペクトル表現を供給するフーリエ変換器、または、フィルタバンクでもよい。この点に関して、逆相関信号は、これらの信号間の相互相関の第1の相互相関値がこの相互相関の別の相互相関値未満である場合、逆相関関係にあるとみなされることがある。
第1の態様の実施形態によれば、変換器は、ダウンミックスオーディオ信号を周波数領域に変換するためのフーリエ変換器またはフィルタを備える。フーリエ変換器は、たとえば、高速フーリエ変換器でもよい。
第1の態様の実施形態によれば、被変換オーディオ信号は、周波数帯域を占有し、第1の補助信号、第2の補助信号、および第3の補助信号は、周波数帯域のうちの同じ周波数サブ帯域を共用する。これに対応して、周波数帯域の他のサブ帯域は、同様に処理されることがある。
第1の態様の実施形態によれば、信号生成器は、被変換オーディオ信号の信号コピーを供給する信号コピー器と、第1の重み付き信号を取得するために第1の信号コピーに第1の重み係数を乗じる第1の乗算器と、第2の重み付き信号を取得するために第2の信号コピーに第2の重み係数を乗じる第2の乗算器と、第3の重み付き信号を取得するために第3の信号コピーに第3の重み係数を乗じる第3の乗算器とを備え、この信号生成器は、重み付き信号に基づいて補助信号を生成するように構成されている。重み付け係数は、それぞれの信号コピーの電力をそれぞれの第1のオーディオチャンネルと、第2のオーディオチャンネルと、拡散音とに調整または拡大縮小するために使用されることがある。
第1の態様の実施形態によれば、オーディオ信号合成器は、第1の補助信号を取得するために第1の重み付き信号を時間領域に変換し、第2の補助信号を取得するために第2の重み付き信号を時間領域に変換し、第3の補助信号を取得するために第3の重み付き信号を時間領域に変換する変換器を備える。変換器は、たとえば、フーリエ逆変換器でもよい。
第1の態様の実施形態によれば、第1の重み付け係数は、マルチチャンネルオーディオ信号の右オーディオチャンネルの電力に依存し、第2の重み付き係数は、マルチチャンネルオーディオ信号の左オーディオチャンネルの電力に依存する。このようにして、両方のオーディオチャンネルの電力は、それぞれ調整されることがある。
第1の態様の実施形態によれば、逆相関器は、第1の逆相関信号を取得するために周波数領域において第3の補助信号の第1のコピーを記憶する第1のストレージと、第2の逆相関信号を取得するために周波数領域において第3の補助信号の第2のコピーを記憶する第2のストレージとを備える。第1のストレージおよび第2のストレージは、逆相関信号を取得するために異なった期間のコピー信号を記憶するように構成されることがある。
第1の態様の実施形態によれば、逆相関器は、第1の逆相関信号を取得するために第3の補助信号の第1のコピーを遅延させる第1の遅延要素と、第2の逆相関信号を取得するために第3の補助信号の第2のコピーを遅延させる第2の遅延要素とを備える。遅延要素は、時間領域または周波数領域に配置されることがある。
第1の態様の実施形態によれば、逆相関器は、第1の逆相関信号を取得するために第3の補助信号の第1のコピーを濾波する第1の全域通過フィルタと、第2の逆相関信号を取得するために第3の補助信号の第2のコピーを濾波する第2の全域通過フィルタとを備える。個々の全域通過フィルタは、一例として、全域通過回路網によって形成されることがある。
第1の態様の実施形態によれば、逆相関器は、第1の逆相関信号を取得するために第3の補助信号の第1のコピーを残響させる第1のリバーブレーターと、第2の逆相関信号を取得するために第3の補助信号の第2のコピーを残響させる第2のリバーブレーターとを備える。
第1の態様の実施形態によれば、結合器は、第1のオーディオ信号を取得するために第1の補助信号と第1の逆相関信号とを合計し、第2のオーディオ信号を取得するために第2の補助信号と第2の相関信号とを合計するように構成されている。このようにして、合成器は、それぞれの信号を合計する加算器を備えることがある。
第1の態様の実施形態によれば、オーディオ信号合成器は、第1のオーディオ信号および第2のオーディオ信号を時間領域に変換する変換器をさらに備える。この変換器は、フーリエ逆変換器でもよい。
第1の態様の実施形態によれば、第1のオーディオ信号は、マルチチャンネルオーディオ信号の左チャンネルを表し、第2のオーディオ信号は、マルチチャンネルオーディオ信号の右チャンネルを表し、逆相関信号は、拡散オーディオ信号を表す。この拡散オーディオ信号は、拡散音を表すことがある。
第1の態様の実施形態によれば、オーディオ信号合成器は、第1の逆相関信号のエネルギーおよび第2の逆相関信号のエネルギーを決定するエネルギー決定器と、第1の逆相関信号のエネルギーを正規化する第1のエネルギー正規化器と、第2の逆相関信号のエネルギーを正規化する第2のエネルギー正規化器とをさらに備える。
第2の態様によれば、本発明は、ダウンミックスオーディオ信号からマルチチャンネルオーディオ信号、たとえば、ステレオオーディオ信号を合成、たとえば、生成する方法であって、ダウンミックスオーディオ信号のスペクトルを表す被変換オーディオ信号を取得するためにダウンミックスオーディオ信号を周波数領域に変換することと、被変換オーディオ信号に基づいて第1の補助信号、第2の補助信号、および第3の補助信号を生成することと、第3の補助信号から少なくとも部分的に逆相関にある第1の逆相関信号および第2の逆相関信号を生成することと、第1のオーディオ信号および第2のオーディオ信号がマルチチャンネルオーディオ信号を形成する第1のオーディオ信号を取得するために第1の補助信号を第1の逆相関信号と結合し、第2のオーディオ信号を取得するために第2の補助信号を第2の逆相関信号と結合することとを備える方法に関する。
一部の実施形態によれば、ダウンミックス信号からマルチチャンネルオーディオ信号を生成する方法は、ダウンミックス信号を受信することと、入力ダウンミックスオーディオ信号を複数のサブ帯域に変換することと、ターゲットマルチチャンネル信号の相関信号および無相関信号を表すサブ帯域信号を生成するためにサブ帯域領域において係数を適用するステップと、生成されたサブ帯域信号を時間領域に変換することと、無相関信号を表す生成された時間領域信号を逆相関させることと、相関信号を表す時間領域信号を逆相関信号と合成することとを備えることがある。
第4の態様によれば、本発明は、コンピュータ上で実行されるときにマルチチャンネルオーディオ信号を合成する方法を実行するコンピュータプログラムに関する。
発明のさらなる実施形態は、今度は以下の図面との関連で説明される。
図1は一実施形態によるオーディオ信号合成器のブロック図を示した図である。 図2は一実施形態によるオーディオ信号合成器を示した図である。 図3は一実施形態によるオーディオ信号合成器を示した図である。
図1は、ダウンミックスオーディオ信号のスペクトルを表す被変換オーディオ信号X(k,i)を取得するためにダウンミックスオーディオ信号x(n)を周波数領域に変換する変換器101を備えるオーディオ信号合成器のブロック図を示す。このオーディオ信号合成器は、被変換オーディオ信号に基づいて、第1の補助信号y(n)を生成し、第2の補助信号y(n)を生成し、第3の補助信号d(n)を生成する信号生成器103をさらに備える。オーディオ信号合成器は、第3の補助信号d(n)から第1の逆相関信号および第2の逆相関信号を生成する逆相関器105をさらに備える。オーディオ信号合成器は、ステレオ信号の左オーディオチャンネルを形成する第1のオーディオ信号z(n)を取得するために第1の補助信号を第1の逆相関信号と合成し、右オーディオチャンネル信号を形成する第2のオーディオ信号を取得するために第2の補助信号を第2の逆相関信号と合成する合成器107をさらに備える。
変換器101は、たとえば、ダウンミックス信号の短時間スペクトルを供給するように構成されているフーリエ変換器でもよく、または、どんなフィルタバンク(FB)でもよい。ダウンミックス信号は、一例として、たとえば、記録されたステレオ信号の左チャンネルと右チャンネルとの合成に基づいて生成されることがある。
信号生成器103は、たとえば、被変換オーディオ信号の3個のコピーを供給する信号コピー器109を備えることがある。コピー毎に、オーディオ信号合成器は、乗算器を備えることがある。このようにして、信号生成器103は、第1のコピーに第1の重み付け係数wを乗じる第1の乗算器111と、第2のコピーに第2の重み付け係数wを乗じる第2の乗算器113と、第3のコピーに重み付け係数wを乗じる第3の乗算器115とを備える。
一部の実施形態によれば、乗算後のコピーは、逆変換器117、119および121にそれぞれ供給されることがある重み付き信号Y(k,i)、D(k,i)およびY(k,i)を形成する。逆変換器117から121は、たとえば、逆フィルタバンク(IFB)によって、または、フーリエ逆変換器によって形成されることがある。逆変換器117から121の出力に、第1の補助信号、第2の補助信号および第2の補助信号が供給されることがある。特に、逆変換器119の出力での第3の補助信号は、第1の逆相関要素D1および第2の逆相関要素D2を備える逆相関器105に供給される。逆相関要素D1およびD2は、たとえば、遅延要素によって、または、残響要素によって、または、全域通過フィルタによって形成されることがある。一例として、逆相関要素は、逆相関が達成されるように相互に第3の補助信号のコピーを遅延させることがある。それぞれの逆相関信号は、第1のオーディオ信号を取得するために第1の逆相関信号を第1の補助信号に加算する第1の加算器123と、第2のオーディオ信号を取得するために第2の逆相関信号を第2の補助信号に加算する第2の加算器125とを備える合成器107に供給される。
図1に表されるように、逆相関は、時間領域で実行されることがある。これに対応して、逆相関信号とそれぞれの補助信号とは、時間領域において重畳されることがある。しかしながら、逆相関と重畳とは、図2に表されるように、周波数領域において実行されることがある。
図2は、図1に示されたオーディオ信号合成器の構造と異なった構造を有するオーディオ信号合成器を示す。特に、図2のオーディオ信号合成器は、周波数領域で動作する信号生成器201を備える。特に、信号生成器201は、逆相関要素D1およびD2を使用して第2の乗算器113の出力を逆相関させるために周波数領域に配置された逆相関器105を備える。図2に示された実施形態では、乗算器111、113および115の出力信号は、一部の実施形態による第1、第2および第2の補助信号をそれぞれ形成する。逆相関要素D1およびD2は、遅延要素によって、または、所定の異なる期間に亘って周波数領域において第3の補助信号のコピーをそれぞれ記憶するストレージによって形成されることがある。逆相関要素D1およびD2の出力は、周波数領域に配置された加算器123および125を含む合成器107にそれぞれ供給される。加算器123および12の出力は、時間領域信号z(n)およびz(n)をそれぞれ供給するためにフーリエ逆変換器または逆フィルタバンクによって実施されることがある逆変換器203および205にそれぞれ供給される。
図1および図2に関して、ダウンミックスオーディオ信号は、x(n)で表される時間信号でもよく、nは、離散時間インデックスである。この信号の対応する時間−周波数表現は、X(k,i)であり、kは、たとえば、ダウンサンプリングされた時間インデックスであり、iは、パラメータ周波数帯域インデックスである。一般性を失うことなく、チャンネル間レベル差(ICLD)およびチャンネル間コヒーレンス(ICC)合成を使用する例が考慮されてもよい。たとえば、図1に示されるように、モノラルダウンミックスオーディオ信号x(n)は、たとえば、フィルタバンク(FB)または変換器によって短時間スペクトル表現に変換される。一例として、1つのパラメトリックステレオパラメータ帯域のための処理が図1および図2に詳細に示される。すべての他の帯域が同様に処理されてもよい。重み付け係数を表すスケール係数w1、w2およびw3は、第1の補助信号の実施形態を形成する左相関音Y(k,i)、第2の補助信号の実施形態を形成する右相関音Y(k,i)、および第3の補助信号の実施形態を形成する左右無相関音D(k,i)の時間−周波数表現をそれぞれ生成するために、ダウンミックス信号X(k,i)の時間−周波数表現に適用される。
3個の信号Y(k,i)、Y(k,i)、およびD(k,i)の生成された時間−周波数表現は、逆フィルタバンク(IFB)または逆変換器を使用して元の時間領域に変換される。一例として、2つの独立した逆相関器DおよびDが、2個の少なくとも部分的に独立した信号を生成するために信号d(n)に適用され、これらの信号は、たとえば、最終的なステレオ出力左信号および右信号、すなわち、第1のオーディオ信号z(n)および第2のオーディオ信号z(n)を生成するためにy(n)およびy(n)に加算される。
重み付け係数の生成または計算に関連して、ダウンリンク信号の振幅が
Figure 0005753899


であり、LおよびRが左チャンネルおよび右チャンネルの振幅を表す場合、復号器において、左チャンネルおよび右チャンネルの相対電力は、ICLDに基づく以下の式:
Figure 0005753899


Figure 0005753899


に従って求められる。以下では、表記の簡潔さのために、インデックスkおよびiは、省略されることがよくあることに注意すべきである。
ICC(コヒーレンス)の場合、左チャンネルおよび右チャンネルにおける拡散量P(k,i)は、以下の式
Figure 0005753899


に従って計算できる。
さらに使用する前に、Pは、零によって下限が定められ、PとPの最小値によって上限が定められることがある。
重み係数は、結果として得られる3個の信号Y、YおよびDがP、PおよびPに等しい電力を有するように計算され、すなわち、
Figure 0005753899


Figure 0005753899


Figure 0005753899


であり、ここで、ダウンミックスオーディオ信号の電力は、P、PおよびPは正規化されることがあるのでP=1であり、係数gは、ダウンミックス入力信号に使用される正規化に関係する。従来の場合では、ダウンミックス信号が0.5を乗じられた合計であるとき、gは、0.5になるように選択されることがある。
ダウンミックス信号の振幅が
Figure 0005753899


である場合、ある種の適応処理が行われることがある。CLDは、c1およびc2に対して以下の式:
Figure 0005753899


Figure 0005753899


Figure 0005753899


を使用して復号器側でダウンミックスに適用されることがある。
およびcに対する定義は、左チャンネルおよび右チャンネルに対する正確な振幅の復元を可能にすることがある。
およびPは、前の定義に従って
Figure 0005753899


および
Figure 0005753899


として定義されることがあり、結果として
Figure 0005753899


および
Figure 0005753899


となる。
次いで、Pは、前述のとおり、上記PおよびPに基づいて定義されることがある。
ICC=1である場合が考慮される場合、かつ、ダウンミックス信号の振幅が
Figure 0005753899

であると仮定される場合、P、PおよびPの定義が使用され、ダウンミックス信号に適用され、
Figure 0005753899


Figure 0005753899


を生じる。
ダウンミックス計算とP係数およびP係数の仮定との間の不一致の影響を打ち消すために、上記式の一部の適応が実行されることがある。
Figure 0005753899


および
Figure 0005753899


を仮定すると、
Figure 0005753899


Figure 0005753899


を生じ、この場合、
Figure 0005753899


である。
Figure 0005753899


であるとして定義されたダウンミックス信号に対し、w1、w2およびw3は、
Figure 0005753899


Figure 0005753899


Figure 0005753899


に従って左チャンネルおよび右チャンネルのエネルギーを維持するように適応させられることがある。
ICC=1である場合、w1、w2およびw3の定義は、重み付き係数cおよびcの場合と同じ結果を正確に取得することを可能にする。
別の代替的な適応方法が以下で説明される。
CLD(チャンネル差レベル)に基づくステレオ符号器では、左チャンネルおよび右チャンネルのそれぞれに対する2つの利得が存在する。これらの利得は、再構成された左チャンネルおよび右チャンネルを生成するために復号化されたモノラル信号に乗じられることがある。
利得は、したがって、以下の式
Figure 0005753899


=2c/(1+c)
=2/(1+c)
に従って計算されることがある。これらの利得係数は、
=c
=c
P=P+P
を計算するために使用されることがある。
これらのP、PおよびPは、前述のとおりw1、w2およびw3を計算するためにさらに使用されることがある。
係数w1、w2およびw3は、
Figure 0005753899


によって拡大縮小され、その後、左信号、右信号および拡散信号にそれぞれ適用されることがある。
代替的に、電力P、PおよびPを有するように信号Y、YおよびDをそれぞれ計算するのではなく、ウィーナーフィルタが最小2乗平均の意味で真の信号Y、YおよびDを近似するために適用されることがある。この場合、ウィーナーフィルタ係数は、
w1=(P−P)/g
w2=(P−P)/g
w3=P/g
である。
逆相関器に関して、逆相関前の時間領域内の拡散信号d(n)は、スケール係数w1、w2およびw3が計算された方法に起因して、拡散音のため要求された短時間スペクトルを有する。したがって、目標は、必要以上に信号電力および短時間電力スペクトルを変更することなく、逆相関器を使用してd(n)から2個の信号d(n)およびd(n)を生成することである。
この目的のため、単位Lノルムをもつ2つの直交フィルタDおよびDが使用されることがある。代替的に、一般に直交全域通過フィルタまたはリバーブレーターを使用することがある。たとえば、逆相関に適した2つの直交有限インパルス応答(FIR)フィルタは、
(n)=w(n)n1(n)
(n)=w(n)n2(n)
であり、ここで、n1(n)は、インデックス0≦n≦Mに対して、白色ガウス雑音のようなランダム変数であり、それ以外の場合、零である。n2(n)は、n1(n)と独立にランダム変数として同様に定義される。窓w(n)は、たとえば、フィルタD(n)およびD(n)のLノルムが1であるような振幅をもつハン(Hahn)窓になるように選択され得る。
図3は、図2に示されたオーディオ信号合成器の構造に類似する構造を有するオーディオ信号合成器を示す。フィルタバンク101によって供給された第1の補助信号が、乗算器111に供給され、フィルタバンク101によって供給された第2の補助信号が、乗算器115に供給され、第3の補助信号の第1のコピーが、遅延要素D1およびD2の後の補助信号D(k,i)のエネルギーを決定するエネルギー決定器301に供給される。このエネルギー決定器301の出力が、エネルギー決定器301の出力に係数w3を乗じる乗算器303に供給され、この乗算器は、乗算後の値を乗算器123に供給する。
第3の補助信号の第2のコピーが、第1の遅延要素D1に供給され、この第1の遅延要素の出力は、たとえば、第1の遅延要素D1のエネルギーE(D1)に関して第1の遅延要素D1の出力を正規化する第1のエネルギー正規化器305に供給される。第1のエネルギー正規化器305の出力が、乗算器307によって乗算器303の出力と乗算され、この乗算器307の出力が加算器123に供給される。
第3の補助信号の第3のコピーが、第2の遅延要素D2に供給され、この第2の遅延要素の出力は、たとえば、第2の遅延要素D2のエネルギーE(D2)に関して第2の遅延要素D2の出力を正規化する第2のエネルギー正規化器309に供給される。第2のエネルギー正規化器309の出力が、乗算器311によって乗算器303の出力と乗算され、この乗算器311の出力が加算器125に供給される。
図3には、重み付け関数w1、w2およびw3を適用するアルゴリズムの代替的な解決手法が表される。重み付け関数w1、w2およびw3は、元の左チャンネルおよび右チャンネルのエネルギーを維持するために定義されることがある。一実施形態によれば、w3は、エネルギー正規化後の遅延された信号に適用される。図2に示された前の実施形態では、w3は、ダウンミックス信号に直接適用されることがある。次いで、遅延形は、遅延DおよびDを使用して、ステレオ信号の逆相関部分を作るために使用されることがある。遅延DおよびDに起因して、Y(k,i)およびY(k,i)に加算された逆相関部分は、前のフレームで計算された利得w3が乗じられることがある。
さらに図3を参照すると、第1のステップでは、遅延D(k,i)後の信号のエネルギーE(D(k,i))が計算されることがある。第2のステップでは、遅延の出力は、計算されたエネルギーE(D)およびE(D)を使用して正規化されることがある。第3のステップでは、正規化されたDおよびDは、w3が乗じられる。第4のステップでは、DおよびDのエネルギー調整形が加算器12および125で信号Y(k,i)およびY(k,i)に加算されることがある。
逆相関を行う複雑性の低い方法は、単純にDおよびDに対して異なる遅延を使用することである。このアプローチは、逆相関音d(n)を表す信号がほとんど過渡状態を含んでいないということを利用することがある。一例として、DおよびDに対し、10msおよび20msの遅延が使用されることがある。

Claims (23)

  1. ダウンミックスオーディオ信号からマルチチャンネルオーディオ信号を合成するオーディオ信号合成器であって、
    前記ダウンミックスオーディオ信号のスペクトルを表す被変換オーディオ信号を取得するために前記ダウンミックスオーディオ信号を周波数領域に変換する変換器と、
    前記被変換オーディオ信号に基づいて第1の補助信号を生成し、第2の補助信号を生成し、第3の補助信号を生成する信号生成器と、
    前記第3の補助信号から少なくとも部分的に逆相関関係にある第1の逆相関信号と第2の逆相関信号とを生成する逆相関器と、
    第1のオーディオ信号と第2のオーディオ信号とがマルチチャンネルオーディオ信号を形成する前記第1のオーディオ信号を取得するために前記第1の補助信号を前記第1の逆相関信号と結合し、前記第2のオーディオ信号を取得するために前記第2の補助信号を前記第2の逆相関信号と結合する結合器と
    を備え、
    前記逆相関器は、前記第1の逆相関信号を取得するために前記第3の補助信号の第1のコピーを遅延させる第1の遅延要素と、前記第2の逆相関信号を取得するために前記第3の補助信号の第2のコピーを遅延させる第2の遅延要素とを備え
    前記信号生成器は、前記被変換オーディオ信号の信号コピーを供給する信号コピー器と、第1の重み付き信号を取得するために第1の信号コピーに第1の重み係数を乗じる第1の乗算器と、第2の重み付き信号を取得するために第2の信号コピーに第2の重み係数を乗じる第2の乗算器と、第3の重み付き信号を取得するために第3の信号コピーに第3の重み係数を乗じる第3の乗算器とを備え、前記第1の補助信号は前記第1の重み付き信号に基づいて生成され、前記第2の補助信号は前記第2の重み付き信号に基づいて生成され、前記第3の補助信号は前記第3の重み付き信号に基づいて生成されることを特徴とするオーディオ信号合成器。
  2. 前記変換器は、前記ダウンミックスオーディオ信号を周波数領域に変換するためにフーリエ変換器またはフィルタを備えることを特徴とする請求項1に記載のオーディオ信号合成器。
  3. 前記被変換オーディオ信号は、周波数帯域を占有し、前記第1の補助信号、前記第2の補助信号、および前記第3の補助信号は、前記周波数帯域のうちの同じ周波数サブ帯域を共用することを特徴とする請求項1から2のいずれか一項に記載のオーディオ信号合成器。
  4. 前記オーディオ信号合成器は、前記第1の補助信号を取得するために前記第1の重み付き信号を時間領域に変換し、前記第2の補助信号を取得するために前記第2の重み付き信号を時間領域に変換し、前記第3の補助信号を取得するために前記第3の重み付き信号を時間領域に変換する変換器を備えることを特徴とする請求項に記載のオーディオ信号合成器。
  5. 前記第1の重み付け係数は、前記マルチチャンネルオーディオ信号の第1のオーディオチャンネルの電力に依存し、前記第2の重み付き係数は、前記マルチチャンネルオーディオ信号の第2のオーディオチャンネルの電力に依存することを特徴とする請求項に記載のオーディオ信号合成器。
  6. 前記逆相関器は、前記第1の逆相関信号を取得するために周波数領域において前記第3の補助信号の第1のコピーを記憶する第1のストレージと、前記第2の逆相関信号を取得するために周波数領域において前記第3の補助信号の第2のコピーを記憶する第2のストレージとを備えることを特徴とする請求項1からのいずれか一項に記載のオーディオ信号合成器。
  7. 前記逆相関器は、前記第1の逆相関信号を取得するために前記第3の補助信号の第1のコピーを濾波する第1の全域通過フィルタと、前記第2の逆相関信号を取得するために前記第3の補助信号の第2のコピーを濾波する第2の全域通過フィルタとを備えることを特徴とする請求項1からのいずれか一項に記載のオーディオ信号合成器。
  8. 前記逆相関器は、前記第1の逆相関信号を取得するために前記第3の補助信号の第1のコピーを残響させる第1のリバーブレーターと、前記第2の逆相関信号を取得するために前記第3の補助信号の第2のコピーを残響させる第2のリバーブレーターとを備えることを特徴とする請求項1からのいずれか一項に記載のオーディオ信号合成器。
  9. 前記結合器は、前記第1のオーディオ信号を取得するために前記第1の補助信号と前記第1の逆相関信号とを合計し、前記第2のオーディオ信号を取得するために前記第2の補助信号と前記第2の逆相関信号とを合計するように構成されていることを特徴とする請求項1からのいずれか一項に記載のオーディオ信号合成器。
  10. 前記信号生成器は、前記第1のオーディオ信号および前記第2のオーディオ信号を時間領域に変換する変換器を備えることを特徴とする請求項1からのいずれか一項に記載のオーディオ信号合成器。
  11. 前記第1のオーディオ信号は、前記マルチチャンネルオーディオ信号の左チャンネルを表し、前記第2のオーディオ信号は、前記マルチチャンネルオーディオ信号の右チャンネルを表し、前記第1の逆相関信号および前記第2の逆相関信号は、拡散オーディオ信号を表すことを特徴とする請求項1から1のいずれか一項に記載のオーディオ信号合成器。
  12. 前記第1の逆相関信号のエネルギーおよび前記第2の逆相関信号のエネルギーを決定するエネルギー決定器と、前記第1の逆相関信号の前記エネルギーを正規化する第1のエネルギー正規化器と、前記第2の逆相関信号の前記エネルギーを正規化する第2のエネルギー正規化器とをさらに備えることを特徴とする請求項1から1のいずれか一項に記載のオーディオ信号合成器。
  13. ダウンミックスオーディオ信号からマルチチャンネルオーディオ信号を合成する方法であって、
    前記ダウンミックスオーディオ信号のスペクトルを表す被変換オーディオ信号を取得するために前記ダウンミックスオーディオ信号を周波数領域に変換することと、
    前記被変換オーディオ信号に基づいて第1の補助信号と、第2の補助信号と、第3の補助信号とを生成することであって、前記被変換オーディオ信号の信号コピーを供給し、第1の重み付き信号を取得するために第1の信号コピーに第1の重み係数を乗じ、第2の重み付き信号を取得するために第2の信号コピーに第2の重み係数を乗じ、第3の重み付き信号を取得するために第3の信号コピーに第3の重み係数を乗じ、前記第1の重み付き信号に基づいて前記第1の補助信号を生成し、前記第2の重み付き信号に基づいて前記第2の補助信号を生成し、前記第3の重み付き信号に基づいて前記第3の補助信号を生成することと、
    前記第3の補助信号から少なくとも部分的に逆相関にある第1の逆相関信号と第2の逆相関信号とを生成することと、
    第1のオーディオ信号および第2のオーディオ信号が前記マルチチャンネルオーディオ信号を形成する前記第1のオーディオ信号を取得するために前記第1の補助信号を前記第1の逆相関信号と結合し、前記第2のオーディオ信号を取得するために前記第2の補助信号を前記第2の逆相関信号と結合することと
    を備え、
    前記第3の補助信号から少なくとも部分的に逆相関にある前記第1の逆相関信号と前記第2の逆相関信号とを生成することは、
    前記第1の逆相関信号を取得するために前記第3の補助信号の第1のコピーを遅延させ、
    前記第2の逆相関信号を取得するために前記第3の補助信号の第2のコピーを遅延させること
    を備えることを特徴とする方法。
  14. 前記被変換オーディオ信号は、周波数帯域を占有し、前記第1の補助信号、前記第2の補助信号、および前記第3の補助信号は、前記周波数帯域のうちの同じ周波数サブ帯域を共用することを特徴とする請求項1に記載の方法。
  15. 前記第1の重み付き信号に基づいて前記第1の補助信号を生成することは、前記第1の補助信号を取得するために前記第1の重み付き信号を時間領域に変換することを備え
    前記第2の重み付き信号に基づいて前記第2の補助信号を生成することは、前記第2の補助信号を取得するために前記第2の重み付き信号を時間領域に変換することを備え
    前記第3の重み付き信号に基づいて前記第3の補助信号を生成することは、前記第3の補助信号を取得するために前記第3の重み付き信号を時間領域に変換することを備えることを特徴とする請求項13又は14に記載の方法。
  16. 前記第1の重み付け係数は、前記マルチチャンネルオーディオ信号の第1のオーディオチャンネルの電力に依存し、前記第2の重み付き係数は、前記マルチチャンネルオーディオ信号の第2のオーディオチャンネルの電力に依存することを特徴とする請求項13から15のいずれか一項に記載の方法。
  17. 前記第3の補助信号から少なくとも部分的に逆相関にある前記第1の逆相関信号と前記第2の逆相関信号とを生成することは、
    前記第1の逆相関信号を取得するために周波数領域において前記第3の補助信号の第1のコピーを記憶し、
    前記第2の逆相関信号を取得するために周波数領域において前記第3の補助信号の第2のコピーを記憶すること
    を備えることを特徴とする請求項1から1のいずれか一項に記載の方法。
  18. 前記第3の補助信号から少なくとも部分的に逆相関にある前記第1の逆相関信号と前記第2の逆相関信号とを生成することは、
    前記第1の逆相関信号を取得するために前記第3の補助信号の第1のコピーを濾波し、
    前記第2の逆相関信号を取得するために前記第3の補助信号の第2のコピーを濾波すること
    を備えることを特徴とする請求項1から1のいずれか一項に記載の方法。
  19. 前記第3の補助信号から少なくとも部分的に逆相関にある前記第1の逆相関信号と前記第2の逆相関信号とを生成することは、
    前記第1の逆相関信号を取得するために前記第3の補助信号の第1のコピーを残響させ、
    前記第2の逆相関信号を取得するために前記第3の補助信号の第2のコピーを残響させること
    を備えることを特徴とする請求項1から1のいずれか一項に記載の方法。
  20. 前記第1のオーディオ信号を取得するために前記第1の補助信号を前記第1の逆相関信号と結合し、前記第2のオーディオ信号を取得するために前記第2の補助信号を前記第2の逆相関信号と結合することは、
    前記第1のオーディオ信号を取得するために前記第1の補助信号と前記第1の逆相関信号とを合計し、
    前記第2のオーディオ信号を取得するために前記第2の補助信号と前記第2の逆相関信号とを合計すること
    を備えることを特徴とする請求項1から19のいずれか一項に記載の方法。
  21. 前記第1のオーディオ信号は、前記マルチチャンネルオーディオ信号の左チャンネルを表し、前記第2のオーディオ信号は、前記マルチチャンネルオーディオ信号の右チャンネルを表し、前記第1の逆相関信号および前記第2の逆相関信号は、拡散オーディオ信号を表すことを特徴とする請求項1から2のいずれか一項に記載の方法。
  22. 前記第1の逆相関信号のエネルギーおよび前記第2の逆相関信号のエネルギーを決定し、
    前記第1の逆相関信号の前記エネルギーを正規化し、前記第2の逆相関信号の前記エネルギーを正規化すること
    をさらに備えることを特徴とする請求項1から2のいずれか一項に記載の方法。
  23. コンピュータ上で実行されるときに請求項1〜2のいずれか一項に記載の方法を実行することを特徴とするコンピュータプログラム。
JP2013519930A 2010-07-20 2010-07-20 オーディオ信号合成器 Active JP5753899B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2010/075308 WO2012009851A1 (en) 2010-07-20 2010-07-20 Audio signal synthesizer

Publications (2)

Publication Number Publication Date
JP2013536461A JP2013536461A (ja) 2013-09-19
JP5753899B2 true JP5753899B2 (ja) 2015-07-22

Family

ID=45496443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013519930A Active JP5753899B2 (ja) 2010-07-20 2010-07-20 オーディオ信号合成器

Country Status (5)

Country Link
US (1) US9082396B2 (ja)
EP (1) EP2586025A4 (ja)
JP (1) JP5753899B2 (ja)
CN (1) CN103069481B (ja)
WO (1) WO2012009851A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102047276B1 (ko) * 2018-07-25 2019-11-21 주식회사 이엠텍 음향 제공 장치

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830333A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
AU2014295207B2 (en) * 2013-07-22 2017-02-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
CN104064191B (zh) * 2014-06-10 2017-12-15 北京音之邦文化科技有限公司 混音方法及装置
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
CN107948704B (zh) * 2017-12-29 2020-06-23 北京安云世纪科技有限公司 用于对音频数据进行动态合成的方法、***以及移动终端
CN110719564B (zh) * 2018-07-13 2021-06-08 海信视像科技股份有限公司 音效处理方法和装置
CN115993503B (zh) * 2023-03-22 2023-06-06 广东电网有限责任公司东莞供电局 一种变压器的运行检测方法、装置、设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
CN102163429B (zh) 2005-04-15 2013-04-10 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
KR101277041B1 (ko) 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
US8073703B2 (en) 2005-10-07 2011-12-06 Panasonic Corporation Acoustic signal processing apparatus and acoustic signal processing method
US7885414B2 (en) * 2006-11-16 2011-02-08 Texas Instruments Incorporated Band-selectable stereo synthesizer using strictly complementary filter pair
JP5450085B2 (ja) 2006-12-07 2014-03-26 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
CN101425292B (zh) * 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102047276B1 (ko) * 2018-07-25 2019-11-21 주식회사 이엠텍 음향 제공 장치

Also Published As

Publication number Publication date
EP2586025A4 (en) 2015-03-11
US9082396B2 (en) 2015-07-14
CN103069481A (zh) 2013-04-24
WO2012009851A1 (en) 2012-01-26
JP2013536461A (ja) 2013-09-19
CN103069481B (zh) 2014-11-05
US20130129096A1 (en) 2013-05-23
EP2586025A1 (en) 2013-05-01

Similar Documents

Publication Publication Date Title
US11910182B2 (en) Method for processing an audio signal, signal processing unit, binaural renderer, audio encoder and audio decoder
JP5753899B2 (ja) オーディオ信号合成器
KR101175592B1 (ko) 출력신호 합성 장치 및 방법
KR100803344B1 (ko) 멀티채널 출력 신호를 구성하고 다운믹스 신호를 생성하기위한 장치 및 방법
KR101016982B1 (ko) 디코딩 장치
JP2009531886A (ja) 多チャンネル信号のパラメータ表現からの空間ダウンミックスの生成
KR101710544B1 (ko) 스펙트럼 무게 발생기를 사용하는 주파수-영역 처리를 이용하는 스테레오 레코딩 분해를 위한 방법 및 장치
CN102986254B (zh) 音频信号产生装置
KR101805327B1 (ko) 오디오 신호들의 파라메트릭 재구성을 위한 역상관기 구조

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140501

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150525

R150 Certificate of patent or registration of utility model

Ref document number: 5753899

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250