JP6242489B2 - 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 - Google Patents
脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 Download PDFInfo
- Publication number
- JP6242489B2 JP6242489B2 JP2016531763A JP2016531763A JP6242489B2 JP 6242489 B2 JP6242489 B2 JP 6242489B2 JP 2016531763 A JP2016531763 A JP 2016531763A JP 2016531763 A JP2016531763 A JP 2016531763A JP 6242489 B2 JP6242489 B2 JP 6242489B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- envelope
- transient
- continuous
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001052 transient effect Effects 0.000 title claims description 156
- 238000000034 method Methods 0.000 title claims description 87
- 230000002123 temporal effect Effects 0.000 title description 8
- 230000000116 mitigating effect Effects 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims description 59
- 238000012545 processing Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 28
- 230000003595 spectral effect Effects 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 10
- 230000001419 dependent effect Effects 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 4
- 238000011045 prefiltration Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 25
- 230000000694 effects Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 210000003454 tympanic membrane Anatomy 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
本願は2013年7月29日に出願されたスペイン特許出願第P201331160号および2013年9月30日に出願された米国仮特許出願第61/884,672号の優先権を主張するものである。各出願はここに参照によってその全体において組み込まれる。
一つまたは複数の実施形態は概括的にはオーディオ信号処理に、より詳細には過渡信号についての時間的歪みを低減するとともに、オブジェクト・ベースのオーディオ処理システムおいてオーディオ・オブジェクトの知覚されるサイズを修正するために使用できる仕方でオーディオ信号を脱相関させることに関する。
図2に示されるように、入力信号x(t)は過渡処理器202によって処理されて、中間信号s1(t)および補助信号s2(t)を与える。これらのうち、s1(t)のみが脱相関器204によって処理されて脱相関された出力y(t)を与える。信号s1(t)は、入力信号x(t)の連続的な諸セグメントに関連付けられているまたはそれから構成される。一方、抽出される信号s2(t)は、信号レベルにおける高速なまたは大きな揺動に関連付けられているx(t)の信号セグメントまたは成分、すなわち信号の過渡成分を表わす。過渡信号は一般に、非常に短い時間期間において信号レベルを変える信号として定義され、振幅、エネルギー、ラウドネスまたは他の関連する特性における有意な変化によって特徴付けられてもよい。ある時間(たとえばミリ秒単位)および/またはレベル(たとえばdB単位)など、これらの特性の一つまたは複数が、入力信号における過渡成分の存在を検出するために、システムによって定義されていてもよい。
e(t)=f(x(t))=max(x(t−τ)ε(τ)exp(−cτ))
さらにもう一つの実施形態では、包絡は信号の絶対値(すなわち振幅)から計算される:
e(t)=abs(x(t))
。
s2(f,t)=x(f,t)−s1(f,t)
。
s2(t)=x(t)(1−min(1,e2(t)/e1(t)))
と等価である。
s1(t)=x(t)a1(t)
s2(t)=x(t)a2(t)
ここで、
a1(t)=min(1,e2(t)/e1(t)))
a2(t)=1−min(1,e2(t)/e1(t))
である。
s2(f,t)=x(f,t)−s1(f,t)
。
s2(t)=Σf s2(f,t)
。
s1(t)=x(t)min(1,c1(t)/c2(t))
s2(t)=x(t)−s1(t)
。
図2に示されるように、回路200は、連続信号s2(t)を脱相関する脱相関器204を含んでいる。ある実施形態では、脱相関器204は、次式に示されるような、信号s1(t)を脱相関フィルタ・インパルス応答d(t)と畳み込みするフィルタ演算として実装される:
eap,out[n]=eap,out[n]c+(1−c)eap,in[n]
。
y'[n]=y[n]min(1,eap,in[n]/eap,out[n])
。
s1(t)=x(t)min(1,e1(t)/e2(t))
。
ある実施形態では、脱相関システムは、脱相関器の出力を、過渡処理器によって生成された入力信号の過渡成分とともに処理して出力信号y'(t)を形成する出力回路206を含む。そのような出力回路は、包絡予測器回路400との関連で使用されることもできる。図5は、ある実施形態のもとでの、図2の脱相関システム200を、包絡予測器回路を含むよう修正したものを示している。図5の回路500に示されるように、包絡予測器コンポーネント404は、脱相関器回路204と組み合わされ、出力コンポーネント206は、包絡ein(t)、eout(t)および脱相関器出力信号y(t)を図4の回路400に従って処理する組み合わせ回路を含む。この出力段は、出力y'(t)を生成するために過渡信号成分s1(t)をも処理する。
l(t)=x(t)+s2(t)+y'(t)
r(t)=x(t)+s2(t)−y'(t)
を使って構築されてもよい。
zr(t)=Pr,q,1x(t)+Pr,q,2s2(t)+Pr,q,3y'q(t)
。
zr(t)=x(t)(Pr,q,1+Pr,q,2a2(t))+Pr,q,3y'q(t)
または
zr(t)=x(t)Qx(t)+y'q(t)Qq(t)
。
ある実施形態では、過渡に基づく脱相関システムは、オブジェクト・ベース・オーディオ処理システムとの関連で使われてもよい。オブジェクト・ベース・オーディオとは、オーディオ信号および関連する空間的再生情報を含むオーディオ・オブジェクトを利用するオーディオのオーサリング、伝送および再生のアプローチをいう。この空間的情報は、空間における所望されるオブジェクト位置およびオブジェクト・サイズまたは知覚される幅を含みうる。オブジェクト・サイズまたは幅は、スカラー・パラメータ(たとえば、最小および最大オブジェクト・サイズを示す0ないし1の範囲)によって、あるいは逆にチャネル間相互相関(最大サイズについての0から最小サイズについての+1の範囲)を指定することによって表現されることができる。さらに、相関およびオブジェクト・サイズのいかなる組み合わせがメタデータに含められてもよい。たとえば、オブジェクト・サイズは、あるオブジェクトを再生するために、諸出力信号を横断しての諸信号のエネルギー分布、たとえば各ラウドスピーカーのレベルを制御することができる。オブジェクト相関は、一つまたは複数の出力対の間の相互相関を制御し、よって知覚される空間的拡散性に影響しうる。この場合、オブジェクトのサイズはメタデータ定義として指定されてもよく、このサイズ情報が、信号のアレイを横断した音の分布を計算するために使われる。この場合、脱相関システムは、このオブジェクトの連続信号成分の空間的拡散性を提供し、過渡成分の脱相関を制限するまたは妨げる。
zr(t)=Pr,q,1x(t)+Pr,q,2s2(t)+Pr,q,3y'q(t)
。
z1(t)=cos(α+β)x(t)+sin(α+β)y1(t)
z2(t)=cos(α−β)x(t)+sin(α−β)y1(t)
。
いくつかの態様を記載しておく。
〔態様1〕
入力オーディオ信号を処理する方法であって:
前記入力信号を、入力信号包絡における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離する段階と;
前記連続成分を脱相関回路において処理して脱相関された連続信号を生成する段階と;
前記脱相関された連続信号を前記過渡成分と組み合わせて出力信号を構築する段階とを含む、
方法。
〔態様2〕
前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別される、態様1記載の方法。
〔態様3〕
前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、態様2記載の方法。
〔態様4〕
前記入力オーディオ信号の包絡を推定する段階と;
前記あらかじめ定義された閾値に対する前記時間変動特性の変化について前記入力オーディオ信号の前記包絡を解析して前記過渡成分を識別する段階とをさらに含む、
態様3記載の方法。
〔態様5〕
関心対象のある種の周波数帯域を強化するまたは減衰させるために前記入力オーディオ信号を事前フィルタリングする段階および前記入力オーディオ信号の前記包絡の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡成分を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成する段階のうちの少なくとも一つを実行することをさらに含む、態様2記載の方法。
〔態様6〕
前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することを含み、前記重み付け値は混合利得を含む、態様1記載の方法。
〔態様7〕
前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、態様1記載の方法。
〔態様8〕
前記脱相関回路は、複数の全域通過遅延セクションを含む、態様1記載の方法。
〔態様9〕
前記脱相関された連続信号の包絡が前記連続成分の包絡から予測される、態様7記載の方法。
〔態様10〕
前記連続成分および前記脱相関された連続信号の少なくとも一方をフィルタリングして、前記出力信号における周波数依存の相関を得る段階をさらに含む、態様1記載の方法。
〔態様11〕
前記入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号を含み、前記重み付け値は前記空間的再生データに依存する、態様6記載の方法。
〔態様12〕
前記空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含む、態様11記載の方法。
〔態様13〕
入力オーディオ信号を処理する装置であって:
前記入力信号を、入力信号包絡における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離する過渡処理器と;
前記連続成分を処理して脱相関された連続信号を生成する、前記過渡処理器に結合された脱相関回路と;
前記脱相関された連続信号 過渡成分を組み合わせて出力信号を構築する、前記脱相関回路および過渡処理器に結合された出力段とを有する、
装置。
〔態様14〕
前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別され、前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、態様13記載の装置。
〔態様15〕
前記入力オーディオ信号の包絡を推定し、前記あらかじめ定義された閾値に対する前記時間変動特性の変化について前記入力オーディオ信号の前記包絡を解析して前記過渡成分を識別するよう構成された、前記過渡処理器に結合された包絡処理器をさらに有する、態様14記載の装置。
〔態様16〕
関心対象のある種の周波数帯域を強化するまたは減衰させるために前記入力オーディオ信号を事前フィルタリングする前置フィルタ段と;
前記入力オーディオ信号の前記包絡の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡信号を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成するサブバンド処理器とをさらに有する、
態様15記載の装置。
〔態様17〕
前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用するよう構成された、前記出力段に付随する利得回路をさらに有しており、前記重み付け値は混合利得を含み、前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、態様13記載の装置。
〔態様18〕
前記脱相関回路は、複数の全域通過遅延セクションを含む、態様13記載の装置。
〔態様19〕
前記脱相関された連続信号の包絡を前記連続成分の包絡から予測するよう構成された、前記過渡処理器に結合された包絡予測器をさらに有する、態様13記載の装置。
〔態様20〕
前記連続成分および前記脱相関された連続信号の少なくとも一方をフィルタリングして、前記出力信号における周波数依存の相関を得るフィルタ段をさらに有する、態様13記載の装置。
〔態様21〕
前記入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号を含み、前記重み付け値は前記空間的再生データに依存し、前記空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含む、態様17記載の装置。
〔態様22〕
入力信号を処理する方法であって:
前記入力信号の信号包絡を解析して、前記入力信号の連続成分を、前記入力信号の過渡成分から識別する段階と;
前記連続成分を脱相関して脱相関された連続信号を生成する段階と;
前記過渡成分を出力段に渡す段階と;
前記過渡成分および前記脱相関された連続信号を前記出力段において組み合わせて出力信号を生成する段階とを含む、
方法。
〔態様23〕
ヒルベルト変換、ピーク検出プロセスまたは短期RMSプロセスのうちの一つを使って、前記入力信号の包絡を推定する段階をさらに含む、態様22記載の方法。
〔態様24〕
前記入力信号の異なる積分時間を用いて計算された二つの包絡推定を計算する段階と;
前記二つの包絡推定の比を使って前記過渡成分を前記連続成分から区別する段階とをさらに含む、
態様23記載の方法。
〔態様25〕
前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別され、さらに、前記過渡成分は入力信号包絡における高速な揺動によって特徴付けられ、連続成分は入力信号包絡における遅い揺動によって特徴付けられる、態様22記載の方法。
〔態様26〕
前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、態様25記載の方法。
〔態様27〕
前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することをさらに含み、前記重み付け値は前記出力信号を生成するための混合利得を含む、態様25記載の方法。
〔態様28〕
前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、態様27記載の方法。
Claims (28)
- 入力オーディオ信号を処理する方法であって:
前記入力信号を、入力信号包絡における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離する段階と;
前記連続成分を脱相関回路において処理して脱相関された連続信号を生成する段階と;
前記脱相関された連続信号を前記過渡成分と組み合わせて出力信号を構築する段階とを含む、
方法。 - 前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別される、請求項1記載の方法。
- 前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、請求項2記載の方法。
- 前記入力オーディオ信号の包絡を推定する段階と;
前記あらかじめ定義された閾値に対する前記時間変動特性の変化について前記入力オーディオ信号の前記包絡を解析して前記過渡成分を識別する段階とをさらに含む、
請求項3記載の方法。 - 関心対象のある種の周波数帯域を強化するまたは減衰させるために前記入力オーディオ信号を事前フィルタリングする段階および前記入力オーディオ信号の前記包絡の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡成分を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成する段階のうちの少なくとも一つを実行することをさらに含む、請求項2記載の方法。
- 前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することを含み、前記重み付け値は混合利得を含む、請求項1記載の方法。
- 前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、請求項1記載の方法。
- 前記脱相関回路は、複数の全域通過遅延セクションを含む、請求項1記載の方法。
- 前記脱相関された連続信号の包絡が前記連続成分の包絡から予測される、請求項7記載の方法。
- 前記連続成分および前記脱相関された連続信号の少なくとも一方をフィルタリングして、前記出力信号における周波数依存の相関を得る段階をさらに含む、請求項1記載の方法。
- 前記入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号を含み、前記重み付け値は前記空間的再生データに依存する、請求項6記載の方法。
- 前記空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含む、請求項11記載の方法。
- 入力オーディオ信号を処理する装置であって:
前記入力信号を、入力信号包絡における高速な揺動によって特徴付けられる過渡成分と、入力信号包絡における遅い揺動によって特徴付けられる連続成分とに分離する過渡処理器と;
前記連続成分を処理して脱相関された連続信号を生成する、前記過渡処理器に結合された脱相関回路と;
前記脱相関された連続信号 過渡成分を組み合わせて出力信号を構築する、前記脱相関回路および過渡処理器に結合された出力段とを有する、
装置。 - 前記揺動は時間に関して測られ、前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別され、前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、請求項13記載の装置。
- 前記入力オーディオ信号の包絡を推定し、前記あらかじめ定義された閾値に対する前記時間変動特性の変化について前記入力オーディオ信号の前記包絡を解析して前記過渡成分を識別するよう構成された、前記過渡処理器に結合された包絡処理器をさらに有する、請求項14記載の装置。
- 関心対象のある種の周波数帯域を強化するまたは減衰させるために前記入力オーディオ信号を事前フィルタリングする前置フィルタ段と;
前記入力オーディオ信号の前記包絡の少なくとも一つのサブバンド包絡を推定して前記少なくとも一つのサブバンド包絡における一つまたは複数の過渡信号を検出してそれらのサブバンド包絡信号を組み合わせて広帯域連続信号および広帯域過渡信号を生成するサブバンド処理器とをさらに有する、
請求項15記載の装置。 - 前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用するよう構成された、前記出力段に付随する利得回路をさらに有しており、前記重み付け値は混合利得を含み、前記脱相関された連続信号が、前記入力オーディオ信号の包絡および前記脱相関回路の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、請求項13記載の装置。
- 前記脱相関回路は、複数の全域通過遅延セクションを含む、請求項13記載の装置。
- 前記脱相関された連続信号の包絡を前記連続成分の包絡から予測するよう構成された、前記過渡処理器に結合された包絡予測器をさらに有する、請求項13記載の装置。
- 前記連続成分および前記脱相関された連続信号の少なくとも一方をフィルタリングして、前記出力信号における周波数依存の相関を得るフィルタ段をさらに有する、請求項13記載の装置。
- 前記入力オーディオ信号は、空間的再生データをもつオブジェクト・ベースのオーディオ信号を含み、前記重み付け値は前記空間的再生データに依存し、前記空間的再生データは:オブジェクト幅、オブジェクト・サイズ、オブジェクト相関およびオブジェクト拡散性のうちの少なくとも一つを含む、請求項17記載の装置。
- 入力信号を処理する方法であって:
前記入力信号の信号包絡を解析して、前記入力信号の連続成分を、前記入力信号の過渡成分から識別する段階と;
前記連続成分を脱相関して脱相関された連続信号を生成する段階と;
前記過渡成分を出力段に渡す段階と;
前記過渡成分および前記脱相関された連続信号を前記出力段において組み合わせて出力信号を生成する段階とを含む、
方法。 - ヒルベルト変換、ピーク検出プロセスまたは短期RMSプロセスのうちの一つを使って、前記入力信号の包絡を推定する段階をさらに含む、請求項22記載の方法。
- 前記入力信号の異なる積分時間を用いて計算された二つの包絡推定を計算する段階と;
前記二つの包絡推定の比を使って前記過渡成分を前記連続成分から区別する段階とをさらに含む、
請求項23記載の方法。 - 前記過渡成分は、前記過渡成分を前記連続成分から区別するあらかじめ定義された閾値を超える時間変動特性によって識別され、さらに、前記過渡成分は入力信号包絡における高速な揺動によって特徴付けられ、連続成分は入力信号包絡における遅い揺動によって特徴付けられ、前記揺動は時間に関して測られる、請求項22記載の方法。
- 前記時間変動特性は、振幅、エネルギー、ラウドネスおよびスペクトル・コヒーレンスからなる群から選択される、請求項25記載の方法。
- 前記過渡成分、前記連続成分、前記入力信号および前記脱相関された連続信号のうちの少なくとも一つに重み付け値を適用することをさらに含み、前記重み付け値は前記出力信号を生成するための混合利得を含む、請求項25記載の方法。
- 前記脱相関された連続信号が、前記入力信号の包絡および前記脱相関の出力に依存して、時間変化するスケーリング関数を用いてスケーリングされる、請求項27記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ESP201331160 | 2013-07-29 | ||
ES201331160 | 2013-07-29 | ||
US201361884672P | 2013-09-30 | 2013-09-30 | |
US61/884,672 | 2013-09-30 | ||
PCT/US2014/047891 WO2015017223A1 (en) | 2013-07-29 | 2014-07-23 | System and method for reducing temporal artifacts for transient signals in a decorrelator circuit |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016528546A JP2016528546A (ja) | 2016-09-15 |
JP6242489B2 true JP6242489B2 (ja) | 2017-12-06 |
Family
ID=52432341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016531763A Active JP6242489B2 (ja) | 2013-07-29 | 2014-07-23 | 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9747909B2 (ja) |
EP (1) | EP3028274B1 (ja) |
JP (1) | JP6242489B2 (ja) |
CN (2) | CN105408955B (ja) |
WO (1) | WO2015017223A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6242489B2 (ja) * | 2013-07-29 | 2017-12-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 |
CN105432098B (zh) | 2013-07-30 | 2017-08-29 | 杜比国际公司 | 针对任意扬声器布局的音频对象的平移 |
EP2980789A1 (en) * | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
US20160173808A1 (en) * | 2014-12-16 | 2016-06-16 | Psyx Research, Inc. | System and method for level control at a receiver |
US9860666B2 (en) * | 2015-06-18 | 2018-01-02 | Nokia Technologies Oy | Binaural audio reproduction |
CN110603821A (zh) | 2017-05-04 | 2019-12-20 | 杜比国际公司 | 渲染具有表观大小的音频对象 |
DE112018003280B4 (de) * | 2017-06-27 | 2024-06-06 | Knowles Electronics, Llc | Nachlinearisierungssystem und -verfahren unter verwendung eines trackingsignals |
JP6471199B2 (ja) * | 2017-07-18 | 2019-02-13 | リオン株式会社 | フィードバックキャンセラ及び補聴器 |
US11972767B2 (en) | 2019-08-01 | 2024-04-30 | Dolby Laboratories Licensing Corporation | Systems and methods for covariance smoothing |
EP4320614A1 (en) * | 2021-04-06 | 2024-02-14 | Dolby Laboratories Licensing Corporation | Multi-band ducking of audio signals technical field |
CN115567831A (zh) * | 2021-06-30 | 2023-01-03 | 华为技术有限公司 | 一种提升扬声器的音质的方法及装置 |
WO2024023108A1 (en) | 2022-07-28 | 2024-02-01 | Dolby International Ab | Acoustic image enhancement for stereo audio |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
CA3026283C (en) * | 2001-06-14 | 2019-04-09 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques |
US7460993B2 (en) * | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
US7398204B2 (en) * | 2002-08-27 | 2008-07-08 | Her Majesty In Right Of Canada As Represented By The Minister Of Industry | Bit rate reduction in audio encoders by exploiting inharmonicity effects and auditory temporal masking |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US8204261B2 (en) | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
EP1829424B1 (en) * | 2005-04-15 | 2009-01-21 | Dolby Sweden AB | Temporal envelope shaping of decorrelated signals |
DE102006050068B4 (de) * | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
DE102007018032B4 (de) * | 2007-04-17 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Erzeugung dekorrelierter Signale |
US20100040243A1 (en) | 2008-08-14 | 2010-02-18 | Johnston James D | Sound Field Widening and Phase Decorrelation System and Method |
KR101230479B1 (ko) * | 2008-03-10 | 2013-02-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법 |
CN102089817B (zh) * | 2008-07-11 | 2013-01-09 | 弗劳恩霍夫应用研究促进协会 | 用于计算频谱包络数目的装置与方法 |
EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
CN101770776B (zh) * | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理*** |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
EP3144932B1 (en) * | 2010-08-25 | 2018-11-07 | Fraunhofer Gesellschaft zur Förderung der Angewand | An apparatus for encoding an audio signal having a plurality of channels |
EP2477188A1 (en) * | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
EP2704142B1 (en) * | 2012-08-27 | 2015-09-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal |
RS1332U (en) | 2013-04-24 | 2013-08-30 | Tomislav Stanojević | FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS |
JP6242489B2 (ja) * | 2013-07-29 | 2017-12-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 |
-
2014
- 2014-07-23 JP JP2016531763A patent/JP6242489B2/ja active Active
- 2014-07-23 US US14/907,542 patent/US9747909B2/en active Active
- 2014-07-23 CN CN201480042558.4A patent/CN105408955B/zh active Active
- 2014-07-23 CN CN201911058391.1A patent/CN110619882B/zh active Active
- 2014-07-23 EP EP14747789.7A patent/EP3028274B1/en active Active
- 2014-07-23 WO PCT/US2014/047891 patent/WO2015017223A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP3028274A1 (en) | 2016-06-08 |
EP3028274B1 (en) | 2019-03-20 |
JP2016528546A (ja) | 2016-09-15 |
WO2015017223A1 (en) | 2015-02-05 |
CN105408955A (zh) | 2016-03-16 |
US20160180858A1 (en) | 2016-06-23 |
US9747909B2 (en) | 2017-08-29 |
CN110619882B (zh) | 2023-04-04 |
CN105408955B (zh) | 2019-11-05 |
CN110619882A (zh) | 2019-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6242489B2 (ja) | 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 | |
US10650796B2 (en) | Single-channel, binaural and multi-channel dereverberation | |
CA2959090C (en) | A signal processing apparatus for enhancing a voice component within a multi-channel audio signal | |
RU2600527C1 (ru) | Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения | |
CA2903900C (en) | Apparatus and method for multichannel direct-ambient decomposition for audio signal processing | |
US9042576B2 (en) | Signal processing method, information processing apparatus, and storage medium for storing a signal processing program | |
KR20090042856A (ko) | 오디오 신호로부터 주위 신호를 생성하는 장치 및 방법, 오디오 신호로부터 멀티-채널 오디오 신호를 도출하는 장치및 방법, 그리고 컴퓨터 프로그램 | |
WO2009039897A1 (en) | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program | |
KR102201308B1 (ko) | 상관해제 필터들의 적응적 제어를 위한 방법 및 장치 | |
KR20180075610A (ko) | 사운드 스테이지 향상을 위한 장치 및 방법 | |
JP2012524304A (ja) | マルチチャネル信号のチャネル遅延パラメータを調整する方法及び装置 | |
KR20140074918A (ko) | 직접-산란 분해 | |
Matsumoto | Noise reduction with complex bilateral filter | |
WO2023172609A1 (en) | Method and audio processing system for wind noise suppression | |
WO2023192039A1 (en) | Source separation combining spatial and source cues | |
WO2023192036A1 (en) | Multichannel and multi-stream source separation via multi-pair processing | |
CN116964665A (zh) | 提高去混响的感知质量 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170502 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6242489 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |