JP2009512364A - 仮想オーディオシミュレーション - Google Patents
仮想オーディオシミュレーション Download PDFInfo
- Publication number
- JP2009512364A JP2009512364A JP2008535840A JP2008535840A JP2009512364A JP 2009512364 A JP2009512364 A JP 2009512364A JP 2008535840 A JP2008535840 A JP 2008535840A JP 2008535840 A JP2008535840 A JP 2008535840A JP 2009512364 A JP2009512364 A JP 2009512364A
- Authority
- JP
- Japan
- Prior art keywords
- distance
- function
- hrtf
- target
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004088 simulation Methods 0.000 title description 7
- 238000000034 method Methods 0.000 claims abstract description 102
- 230000008859 change Effects 0.000 claims abstract description 43
- 230000005236 sound signal Effects 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000012546 transfer Methods 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 76
- 210000003128 head Anatomy 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000000613 ear canal Anatomy 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S1/005—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
仮想空間オーディオのためのバイノーラル音信号を生成する装置(1)は、仮想空間オーディオとして再生される信号を受信するための受信器(4)を具備している。信号処理装置(3)は、受信したオーディオ信号を処理するため受信器(4)と通信して、仮想音のターゲット距離を変化させるための距離変化関数を使用する演算、及び、仮想空間オーディオとして受信した信号を再生する演算を実施する。装置(1)は、出力デバイスが接続可能なコネクタ(6)と、ターゲット距離における仮想空間オーディオのバイノーラル音信号を出力するための信号処理装置によって制御されている出力デバイスとをさらに具備している。
Description
本発明は、距離変動型の空間オーディオ(spatial audio)のシミュレーションに関する。特に、本発明は、空間における正確な距離及び方向で仮想音源(virtual sound source)を聴取者が明確に知覚するような距離変動型の仮想空間オーディオの再生(rendering virtual spatial audio)の方法及び装置に関する。
本願は、2005年10月20日に出願されたオーストラリア仮出願第2005905817号の優先権を主張し、その内容は引用により本明細書に組み込まれる。
出願人は、距離に伴って変化する仮想空間オーディオを生成するための多様な方法を知っている。距離制御が仮想聴覚ディスプレイ(virtual auditory display)にとって特に重要な空間の1特定領域は、空間のニアフィールド領域(near-field region of space)である。空間のニアフィールド領域とは、聴取者の至近距離、すなわち、概ね手の届く距離の空間位置(spatial location)であると説明することができる。ニアフィールドの仮想音源を高精度に位置決めするための最も一般的な方法は、ニアフィールドで音響的に記録された頭部伝達関数(HRTF)を利用するものである。HRTFは、仮想聴覚空間(virtual auditory space)のシミュレーションに使用される音響伝達関数である。ニアフィールドHRTFは、ニアフィールドの位置から測定が記録された被験者又は試験用人頭の外耳道の入口までの音圧変化(pressure transformation)を説明する音響伝達関数である。ニアフィールド音響HRTFは、既知のインパルス測定技術を使用して記録することができる。高精度に記録されたニアフィールドHRTFは、次いで、適切なフィルタリング技術を使用して仮想音源の合成に使用される。オーバーヘッドフォンを適切に装着すると、これらの仮想音源がニアフィールドHRTFの測定位置によって決定されるニアフィールドのロケーションから発せられるように、知覚上、感じられる。
空間のニアフィールド領域の仮想空間オーディオを生成するその他の方法は、空間のファーフィールド領域(far-field region of space)の仮想音源に信号変形を適用することに依存する。空間のファーフィールド領域とは、空間のニアフィールド領域よりも聴取者からさらに離れた、すなわち、概ね聴取者から1〜2m以上離れた空間位置であると説明することができる。
ファーフィールド仮想音源からニアフィールド仮想音源を合成しようとする理由は、空間のニアフィールド領域のHRTFの記録が困難であり、かつ、時間がかかる事実に由来する。実際、それは空間のファーフィールド領域のHRTFを記録するよりもさらに困難である。ニアフィールドHRTFの記録に関係する困難には、(i)拡声器ダイヤフラム(loudspeaker diaphragm)の有次元性が理想的な点源近似(point-source approximation)を無効にすること、(ii)頭部に対する拡声器位置の小さな誤差がHRTFを大きく変化させることがある。
ファーフィールド距離変形を目的とした信号処理と真のニアフィールド処理とを区別する必要がある。ファーフィールド仮想音源の距離知覚は、例えば、直接音エネルギーと残響音エネルギーとの相対比率を変化させることによって、そして、また、大気による吸収をシミュレートするローパスフィルタを適用することによって変形することが一般的である。これらの信号処理は、一般に、ファーフィールドに存在する仮想音源の知覚距離を変化させることを目的としており、かつ、ニアフィールドに関係するHRTFの体系的な変化を直接説明しない。
空間のニアフィールド領域の仮想空間オーディオを生成するその他の方法は、HRTFを使用して仮想拡声器再生(virtual loudspeaker playback)がシミュレートされるニアフィールド制御(NFC)アンビソニックアプローチのバイノーラル合成(binaural synthesis)を使用する方法である。仮想空間オーディオに対するNFCアンビソニックアプローチは、仮想音場(virtual sound field)の球状調和展開(spherical harmonic expansion)に依存する。より正確には、ニアフィールド点源によって生成される音場は、点源拡声器としてモデル化される拡声器を使用してシミュレートされる。点源近似は波面に曲率を与え、かつ、アンビソニック音ディスプレイ(ambisonic sound display)に従来から使用されてきた拡声器の平面波モデルとは異なる。アンビソニック仮想空間オーディオの背景となる基本原理は、球状調和近似(spherical harmonic approximation)の特定の次数まで有効である空間音場を再現することである。NCFアンビソニック計算は、点源球状調和近似に依存する。NFCアンビソニック拡声器再生のバイノーラル合成は、次いで、HRTFフィルタを使用して拡声器アレイ(array of loudspeakers)をシミュレートすることに依存する。
空間のニアフィールド領域の仮想空間オーディオを生成する従来方法には、ニアフィールドHRTFフィルタをリアルタイムで導出するために使用する数学モデルに単純性、正確性、かつ、直接性を欠くという欠点がある。現在のコンピュータのサウンドカードには、ニアフィールド領域サウンド制御が十分な精度でない両耳レベル差(interaural level difference)の単純な変調に依存するという欠点がある。NFCアンビソニックに基づくバイノーラル合成には、モデルが非常に複雑で、かつ、精度が不十分であるという欠点がある。
以下に使用されるいくつかの技術用語を次のように定義する。「頭部伝達関数(Head-related transfer function:HRTF)」は、仮想聴覚空間のシミュレーションに使用するフィルタ関数である。一般に、耳ごと及び空間位置ごとに1つのHRTFが存在する。本明細書では、HRTFフィルタ関数は、1つの空間位置から他の空間位置までの音圧変化を示すあらゆるフィルタ関数を含むように一般化している。「距離変化関数(distance variation function:DV)」は、ある他の初期位置で既知のHRTFから新規、ターゲット、位置の条件によるHRTFフィルタを導出するために使用される数学量である。「初期関数(initial function)、SI」及び「ターゲット関数(target function)、ST」は、初期空間位置及びターゲット空間位置に関係する数学量をそれぞれ引用し、上記に定義した距離変化関数の計算に使用することができる。「頭部状表面(head-like surface)」は、音響散乱特性を有する剛体面であり、実施されたHRTF音響測定を有するオブジェクトとある類似性を共有する。頭部状表面の例は、剛球体、楕円体、長球体、音響試験用マネキン、人頭、人頭モデル等を具備している。
本発明の第1構成態様によると、仮想空間オーディオを生成するための方法があり、この方法は、
方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを与えるステップと、
距離に伴うHRTFの変化をモデル化する距離変化関数DVを決定するステップと、
距離変化関数DV及びHRTF:HIを音に適用して、方向y^及び距離DTに対応するバイノーラル音を生成するための信号処理装置を使用するステップと
を具備している。
方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを与えるステップと、
距離に伴うHRTFの変化をモデル化する距離変化関数DVを決定するステップと、
距離変化関数DV及びHRTF:HIを音に適用して、方向y^及び距離DTに対応するバイノーラル音を生成するための信号処理装置を使用するステップと
を具備している。
DV、または、HIの一方又は両方は、音に直接適用される可能性があることを理解されたい。したがって、HIを最初に音に直接適用してもよく、その後、DVをその結果に適用し、又はその逆も同様である。しかし、好ましい構成態様では、方向y^及び距離DTに対応する頭部伝達関数HTを得るため、前記方法は距離変化関数DVをHIに適用するステップを具備してもよい。
前記方法は、距離変化関数を周波数領域がHT=DV・HIであるHIに適用するステップを具備することができる。代わりに、前記方法は距離変化関数を時間領域がHT=DVconvolveHIであるHIに適用するステップを具備してもよい。
前記方法は、HRTF、HTを有する音をフィルタリングして、バイノーラル音信号を生成するための信号処理装置を使用するステップを具備してもよい。
好ましくは、前記方法は、仮想空間オーディオバイノーラル音信号と一致する音を聴取者に送るための音響アクチュエータを使用するステップを具備している。
さらに、距離DIはファーフィールドに存在し、かつ、距離DTはニアフィールドに存在することができる。
前記方法は、
初期距離DIに対応する初期関数SIを決定するステップと、
ターゲット距離DTに対応するターゲット関数STを決定するステップと、
SIからSTまでの距離変化関数DVを決定するステップと
によって、距離に伴うHRTFの変化をモデル化する距離変化関数DVを決定するステップを具備してもよい。
初期距離DIに対応する初期関数SIを決定するステップと、
ターゲット距離DTに対応するターゲット関数STを決定するステップと、
SIからSTまでの距離変化関数DVを決定するステップと
によって、距離に伴うHRTFの変化をモデル化する距離変化関数DVを決定するステップを具備してもよい。
初期関数は、頭部状表面から初期距離に位置する音の点源に対して頭部状周囲の散乱音の音波方程式の解を特徴付ける可能性がある。ターゲット関数は、頭部状表面からターゲット距離に位置する音の点源に対して頭部状表面周囲の散乱音の音波方程式の解を特徴付ける可能性がある。
前記方法は、伝達関数を使用して周波数領域において実施することができ、かつ、
として距離変化関数を計算するステップを具備することができる。代わりに、前記方法はフィルタ関数を使用して時間領域において実施してもよく、かつ、DV=STdeconvolveSIとして距離変化関数を計算するステップを具備してもよい。
前記方法は、頭部状表面から離れた初期距離及びターゲット距離ごとの音源による剛体頭部状表面の表面音圧の解析解に従って、初期関数及びターゲット関数を計算するステップを具備することができる。したがって、HRTFに一致する人の被験者に対応して整合する剛体頭部状表面の半径を、解析解において用いるステップを具備することができる。代わりに、前記方法は、解の高速反復計算法を使用して解析解を計算するステップを具備してもよい。
前記方法は、頭部状表面から離れた初期距離及びターゲット距離ごとの音源による剛体頭部状表面の表面音圧から、初期関数及びターゲット関数を導出するステップを具備することができる。
前記方法は、初期距離又はターゲット距離以外の距離に対応するデータから、初期関数、ターゲット関数、初期関数及びターゲット関数の両方のいずれか1つを内挿するステップを具備することができる。
1構成態様では、前記方法は、方向x^と同一である方向y^を選択するステップを具備することができる。その他の構成態様では、前記方法は、距離に依存するパララックス効果によって方向x^に方向y^を関係付けるステップを具備してもよい。
本発明の第2構成態様によると、距離に伴うHRTFの変化をモデル化する距離変化関数を決定するための方法があり、前記方法は、
初期距離に対応する初期関数SIを決定するステップと、
ターゲット距離に対応するターゲット関数STを決定するステップと、
SIからSTまでの距離変化関数DVを決定するステップと
を具備する。
初期距離に対応する初期関数SIを決定するステップと、
ターゲット距離に対応するターゲット関数STを決定するステップと、
SIからSTまでの距離変化関数DVを決定するステップと
を具備する。
前記方法は、伝達関数を使用して周波数領域において実施することができ、かつ、
として距離変化関数を計算するステップを具備することができる。代わりに、前記方法はフィルタ関数を使用して時間領域において実施してもよく、かつ、DV=STdeconvolveSIとして距離変化関数を計算するステップを具備してもよい。
前記方法は、頭部状表面から離れた初期距離及びターゲット距離ごとの音源による剛体頭部状表面の表面音圧の解析解に従って、初期関数及びターゲット関数を計算するステップを具備することができる。したがって、HRTFに一致する人の被験者に対応して整合する剛体頭部状表面の半径を、解析解において用いるステップを具備することができる。代わりに、前記方法は、解の高速反復計算法を使用して解析解を計算するステップを具備してもよい。
前記方法は、頭部状表面から離れた初期距離及びターゲット距離ごとの音源による剛体頭部状表面の表面音圧から、初期関数及びターゲット関数を導出するステップを具備することができる。
前記方法は、初期距離又はターゲット距離以外の距離に対応するデータから、初期関数、ターゲット関数、初期関数及びターゲット関数の両方のいずれか1つを内挿するステップを具備することができる。
本発明の第3構成態様によると、方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを方向y^及び距離DTに対応する頭部伝達関数HTに変形するための方法があり、前記方法は、
距離に伴うHRTFの変化をモデル化する距離変化関数DVを決定するステップと、
距離変化関数DVをHT取得のためのHIに適用するステップと、
を具備する。
距離に伴うHRTFの変化をモデル化する距離変化関数DVを決定するステップと、
距離変化関数DVをHT取得のためのHIに適用するステップと、
を具備する。
前記方法は、本発明の第2構成態様に関連する上記方法を使用して距離変化関数を決定するステップを具備することができる。
前記方法は、距離変化関数を周波数領域がHT=DV・HIであるHIに適用するステップを具備することができる。代わりに、前記方法は距離変化関数を時間領域がHT=DVconvolveHIであるHIに適用するステップを具備してもよい。
前記方法は、方向x^と同一である方向y^を選択するステップを具備することができる。代わりに、前記方法は、距離に依存するパララックス効果によって方向x^に方向y^を関係付けるステップを具備してもよい。
本発明の第4構成態様によると、仮想空間オーディオのためのバイノーラル音信号を生成する方法があり、前記方法は、
方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを方向y^及び距離DTに対応する頭部伝達関数HTに変形するステップと、
バイノーラル音信号を生成するために、変形されたHRTFを有する音をフィルタリングする信号処理装置を使用するステップと
を具備する。
方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを方向y^及び距離DTに対応する頭部伝達関数HTに変形するステップと、
バイノーラル音信号を生成するために、変形されたHRTFを有する音をフィルタリングする信号処理装置を使用するステップと
を具備する。
前記方法は、本発明の第3構成態様に関連する上記方法を使用してHRTF:HTを導出するステップを具備することができる。
本発明の第5構成態様によると、仮想空間オーディオのためのバイノーラル音信号を生成する方法があり、前記方法は、
方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを有する入力音をフィルタリングするステップと、
距離に伴うHRTFの変化をモデル化する距離変化関数DVを有する音をフィルタリングするための信号処理装置を使用するステップと
を具備する。
方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを有する入力音をフィルタリングするステップと、
距離に伴うHRTFの変化をモデル化する距離変化関数DVを有する音をフィルタリングするための信号処理装置を使用するステップと
を具備する。
前記方法は、本発明の第2構成態様に関連する上記方法を使用して距離変化関数DVを導出するステップを具備することができる。
本発明の第6構成態様によると、仮想空間オーディオを生成するための方法があり、前記方法は、
仮想空間オーディオのためのバイノーラル音信号を生成するステップと、
仮想空間オーディオバイノーラル音信号と一致する音を聴取者に送るための音響アクチュエータを使用するステップと
を具備する。
仮想空間オーディオのためのバイノーラル音信号を生成するステップと、
仮想空間オーディオバイノーラル音信号と一致する音を聴取者に送るための音響アクチュエータを使用するステップと
を具備する。
前記方法は、本発明の第4構成態様又は第5構成態様に関連する上記方法を使用してバイノーラル音信号を生成するステップを具備することができる。
本発明の第7構成態様によると、仮想空間オーディオを生成するための装置があり、前記装置は、
仮想空間オーディオとして再生される信号を受信するための受信器と、
受信器と通信して、受信したオーディオ信号を処理し、仮想音のターゲット距離が変化する距離変化関数を使用して演算を実施し、かつ、受信した信号を仮想空間オーディオとして再生するための信号処理装置と、
出力デバイスに接続可能であり、出力デバイスが信号処理装置によって制御されて、ターゲット距離の仮想空間オーディオのバイノーラル音信号を出力するコネクタと
を具備する。
仮想空間オーディオとして再生される信号を受信するための受信器と、
受信器と通信して、受信したオーディオ信号を処理し、仮想音のターゲット距離が変化する距離変化関数を使用して演算を実施し、かつ、受信した信号を仮想空間オーディオとして再生するための信号処理装置と、
出力デバイスに接続可能であり、出力デバイスが信号処理装置によって制御されて、ターゲット距離の仮想空間オーディオのバイノーラル音信号を出力するコネクタと
を具備する。
前記装置は、ニアフィールドバイノーラル音信号と一致する音を聴取者に送る出力デバイスを具備することができる。
本発明の1実施形態は、添付図面を参照し、一例として、説明される。
図において、一般に、参照符号1は本発明の1実施形態による仮想空間オーディオを生成するための装置を意味する。装置1は、オーディオ信号を受信するための入力データポート4と、関連位置信号(associated position signal)を受信するための入力データポート5とを具備し、関連位置信号は、聴取者の個人的な仮想聴覚空間に対してオーディオ信号が空間的に再生されるターゲットロケーション(距離及び方向)を決定する。明らかに、オーディオ信号と位置信号との両方とも時間によって変化する可能性がある。いくつかの実施形態では、オーディオ信号とその関連位置信号を一体化して、単一の入力信号を生成することができる。
前記装置1は、信号処理装置3とデータストレージユニット2とを備えた演算ユニット7を具備している。信号処理装置3は、オプションのマイクロプロセッサ9によって置換え、または、補足してもよい。
信号処理装置3は、オーディオ信号の所期の方向
(以下、q ̄=(r,θk,φk)と表記する)に基づき、データストレージユニット2からHRTFフィルタを選択する。HRTFフィルタは、多様なフォーマットでデータストレージユニット2に格納することができる。好ましい1実施形態では、HRTFフィルタは、あらゆる方向へのHRTFフィルタの内挿に使用することができる追加の側面情報(additional side information)を有する圧縮フォーマット(HRTFデータに主成分分析を行うときに取得されるフォーマットなど)で格納されている。追加の側面情報は、空間における離散的な方向の一連のHRTFフィルタから抽出することができ、球面スプラインアルゴリズム又は近隣(near-neighbor)内挿法などの内挿法を使用する。代わりに、必要なHRTFフィルタは、オプションのデータ通信ポート8を使用して外部ソースから取得してもよい。
好ましい1実施形態では、信号処理装置3は、データストレージユニット2に格納されたHRTFフィルタに関係するターゲットロケーションの距離DT及び距離DIに基づき、距離変化関数DVを計算する。距離変化関数DVが要求されている(例えば、DTがDIと等しくなく、かつ、DT又はDIの少なくとも一方が空間のニアフィールド領域に存在する)と仮定する。好ましい1実施形態では、信号処理装置3は、剛体面の形態の頭部状表面における音散乱のための分析解を使用して、距離DIに関係する初期関数SIと距離DTに関係するターゲット関数STとを導出する。半径aの剛体球表面で、ロケーション
で、正弦波の点音源によって、周波数fで、波数
で、ロケーションq ̄=(r,θk,φk)では、音圧pS(a,θS,φS;k,r)は次式で与えられる。
ここで、cは音の速度であり、hn(kr)=jn(kr)+jyn(kr)はn次の第1種変形球ベッセル関数(modified spherical Bessel function of the first kind of order n)であり、
は、n次かつm次の球面調和関数(spherical harmonic function of degree n and order m)である。特定の距離rの点音源による球表面における音圧伝達関数を決定するために、剛体球表面における音圧pS(a,θS,φS;k,r)は、所望の波数kごとに計算することができる。したがって、好ましい1実施形態では、信号処理装置3は、SI=pS(a,θS,φS;k,DI)として距離DIに対応するSIを計算する。信号処理装置3は、ST=pS(a,θS,φS;k,DT)として距離DTに対応するSTを計算する。aの数値は聴取者の頭のサイズによって決定され、かつ、データストレージユニット2に格納された一連のHRTFからあらかじめ計算することができる(例えば、クーン(Kuhn)のモデルの使用)。方位角及び仰角(θS,φS)は、聴取者の頭の耳のロケーション(耳ごとに別のHRTFフィルタ及び距離変化フィルタDVがあることに注意)によって決定される。信号処理装置3は、次いで、
として距離変化関数を計算する。
前記信号処理装置3は、ターゲット方向q ̄=(r,θk,φk)、及び、データストレージユニット2に格納されたHRTFデータに基づき、初期HRTF:HIを決定する。好ましい1実施形態では、球面スプライン内挿法は、初期HRTFの決定に使用される。好ましい1実施形態では、信号処理装置3は、パララックス効果を考慮し、かつ、初期HRTFフィルタを決定するときのターゲット方向を適切に変更する。信号処理装置3は、次いで、HT=DV・HIとしてターゲットHRTF:HTを計算する。
前記信号処理装置3はHRTF:HTを受信したオーディオ信号に適用して、ニアフィールドにおける仮想聴覚空間を適切にシミュレートするためのバイノーラル音信号を導出する。これらのバイノーラル音信号は、ヘッドフォンセット、拡声器アレイ、または、出力データポート6を経由するその他の音響アクチュエータなどの出力デバイスを通過することができる。
一般的な方法では、HRTFフィルタは対象から特定の距離で音響的に記録される。HRTFフィルタは、ニアフィールドの仮想聴覚空間のシミュレーションに使用される。ニアフィールドの仮想聴覚空間のシミュレーションには、測定距離とシミュレートされた仮想聴覚ディスプレイの音信号のための所望のターゲット距離とが同一でない可能性があるという困難が伴う。典型的には、HRTFフィルタは、聴取者の空間のファーフィールド領域と呼ばれるものに音響的に記録される。空間のファーフィールド領域は、一般に、聴取者から1m以上離れた一連のロケーションとみなされる。ファーフィールドロケーションを明確にする特徴は、空間のファーフィールド領域における音源が近似誤差の小さい平面波音源として近似できることである。空間のファーフィールド領域のための平面波音源特性の結果、空間の特定の方向のためのHRTFフィルタは、距離の関数としてのスペクトル特性にほぼ変化がない。音の全強度は、空間のファーフィールド領域において距離に伴い自然に変化することとなるが、これは適切なゲイン又は減衰率を有する音信号の単純なスケーリングによって説明することができる。したがって、空間のファーフィールド領域のHRTFフィルタは、方向だけに伴う変化があり、かつ、距離の関数では変化がない。
一方、空間のニアフィールド領域とは、一般に、対象の1m以内のロケーションを指し、かつ、この理由から一連のロケーションを「手の届く範囲」と言う。仮想聴覚空間におけるニアフィールド音のシミュレーションにはいくつかの技術的な困難がある。主な困難は、空間のニアフィールド領域に対応するHRTFフィルタが距離の関数として変化することである。したがって、異なるHRTFフィルタが聴取者のニアフィールドの距離のひとつひとつに必要である。HRTFフィルタの音響的な記録は困難であり、かつ、時間がかかる。現在、空間のニアフィールド領域のための記録されたHRTFフィルタデータベースは非常に少ない。空間のニアフィールド領域におけるHRTFフィルタの音響的な記録には、音源に要求される正確な位置決め、及び、広帯域点音源を生成するなどの多数の困難がある。
空間のニアフィールド領域における高忠実度の仮想聴覚空間のシミュレーションに関係する困難を前提とすれば、本発明の大きな利点は、空間のニアフィールド領域のための高忠実度のHRTFフィルタを生成する手段を提供することである。さらに、本発明は、リアルタイムかつオンザフライでニアフィールドHRTFフィルタを高忠実度に生成して、あらゆる仮想聴覚ディスプレイの要求に整合させることができる。距離変化関数DVの計算は、標準的な反復法による計算を使用して非常に高速に実施することができる。本発明のその他の利点は、ニアフィールドHRTFフィルタは、バイノーラルNFCアンビソニック法などのその他の既知の手法に比べてより精度良く、かつ、計算がより容易であることである。
それにもかかわらず、本発明のさらなる利点は、空間領域、すなわち、人の知覚の没頭(immersion)及び聴覚空間のリアリズムに強く影響を及ぼすニアフィールドにおける仮想空間オーディオのシミュレーションを可能にすることである。ニアフィールドの音の高精度なシミュレーションは、聴覚ディスプレイのリアリズムを大いに強調する。さらに、異なる話者の分離もまた、話の明瞭度を非常に向上させる。したがって、多数の異なる話者を一体化する仮想聴覚ディスプレイにおいて、ニアフィールドに位置する話者を精度良くシミュレートする能力は、より明瞭かつ使用に適した仮想聴覚ディスプレイを実現することになる。
広く開示された本発明の真の趣旨又は範囲から逸脱することなく、当業者によって、多様な変形形態及び/又は修正形態が、特定の実施形態を示した本発明になされうることを理解されたい。したがって、提示する実施形態は、すべての点で、具体例であり、かつ、限定されないと理解されるものである。
1 装置
2 データストレージユニット
3 信号処理装置
4 入力データポート
5 入力データポート
6 出力データポート
7 演算ユニット
8 データ通信ポート
9 マイクロプロセッサ
2 データストレージユニット
3 信号処理装置
4 入力データポート
5 入力データポート
6 出力データポート
7 演算ユニット
8 データ通信ポート
9 マイクロプロセッサ
Claims (39)
- 前記方向y^及び前記距離DTに対応する頭部伝達関数HTを得るため、前記距離変化関数DVをHIに適用するステップを具備することを特徴とする請求項1に記載の方法。
- 前記距離変化関数を周波数領域がHT=DV・HIであるHIに適用するステップを具備することを特徴とする請求項2に記載の方法。
- 前記距離変化関数を時間領域がHT=DVconvolveHIであるHIに適用するステップを具備することを特徴とする請求項2に記載の方法。
- 前記HRTF:HTを有する音をフィルタリングして、バイノーラル音信号を生成するための前記信号処理装置を使用するステップを具備することを特徴とする請求項2乃至4のいずれか1項に記載の方法。
- 前記仮想空間オーディオバイノーラル音信号と一致する音を聴取者に送るための音響アクチュエータを使用するステップを具備することを特徴とする請求項1乃至5のいずれか1項に記載の方法。
- 前記距離DIはファーフィールドに存在し、かつ、前記距離DTはニアフィールドに存在することを特徴とする請求項1乃至6のいずれか1項に記載の方法。
- 初期距離DIに対応する初期関数SIを決定するステップと、
ターゲット距離DTに対応するターゲット関数STを決定するステップと、
SIからSTまでの距離変化関数DVを決定するステップと
によって、距離に伴うHRTFの変化をモデル化する前記距離変化関数DVを決定するステップを具備することを特徴とする請求項1乃至7のいずれか1項に記載の方法。 - フィルタ関数を使用して前記時間領域において実施し、かつ、DV=STdeconvolveSIとして前記距離変化関数を計算するステップを具備することを特徴とする請求項8に記載の方法。
- 頭部状表面から離れた前記初期距離及び前記ターゲット距離ごとの音源による剛体頭部状表面の前記表面音圧の解析解に従って、前記初期関数及び前記ターゲット関数を計算するステップを具備することを特徴とする請求項8乃至10のいずれか1項に記載の方法。
- HRTFに一致する人の被験者に対応して整合する前記剛体頭部状表面の半径を、前記解析解において用いるステップを具備することを特徴とする請求項11に記載の方法。
- 解の高速反復計算法を使用して前記解析解を計算するステップを具備することを特徴とする請求項11に記載の方法。
- 前記頭部状表面から離れた前記初期距離及びターゲット距離ごとの音源による前記剛体頭部状表面の表面音圧の解析解から、前記初期関数及びターゲット関数を導出するステップを具備することを特徴とする請求項8乃至10のいずれか1項に記載の方法。
- 前記初期距離又はターゲット距離以外の距離に対応するデータから、前記初期関数、前記ターゲット関数、前記初期関数及び前記ターゲット関数の両方のいずれか1つを内挿するステップを具備することを特徴とする請求項8乃至14のいずれか1項に記載の方法。
- 前記方向x^と同一である前記方向y^を選択するステップを具備することを特徴とする請求項1乃至15のいずれか1項に記載の方法。
- 距離に依存するパララックス効果によって前記方向x^に前記方向y^を関係付けるステップを具備することを特徴とする請求項1乃至15のいずれか1項に記載の方法。
- 距離に伴うHRTFの変化をモデル化する距離変化関数を決定するための方法であって、
初期距離に対応する前記初期関数SIを決定するステップと、
ターゲット距離に対応する前記ターゲット関数STを決定するステップと、
SIからSTまでの距離変化関数DVを決定するステップと
を具備することを特徴とする方法。 - フィルタ関数を使用して前記時間領域において実施され、かつ、DV=STdeconvolveSIとして前記距離変化関数を計算するステップを具備することを特徴とする請求項18に記載の方法。
- 前記頭部状表面から離れた前記初期距離及びターゲット距離ごとの音源による前記剛体頭部状表面の表面音圧の解析解に従って、前記初期関数及びターゲット関数を計算するステップを具備することを特徴とする請求項18乃至20のいずれか1項に記載の方法。
- HRTFに一致する人の被験者に対応して整合する前記剛体頭部状表面の半径を、前記解析解において用いるステップを具備することを特徴とする請求項21に記載の方法。
- 解の高速反復計算法を使用して前記解析解を計算するステップを具備する請求項21に記載の方法。
- 前記頭部状表面から離れた前記初期距離及びターゲット距離ごとの音源による前記剛体頭部状表面の表面音圧から、前記初期関数及びターゲット関数を導出するステップを具備することを特徴とする請求項18乃至20のいずれか1項に記載の方法。
- 前記初期距離又はターゲット距離以外の距離に対応するデータから、前記初期関数、前記ターゲット関数、前記初期関数及び前記ターゲット関数の両方のいずれか1つを内挿するステップを具備することを特徴とする請求項18乃至24のいずれか1項に記載の方法。
- 方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを方向y^及び距離DTに対応する頭部伝達関数HTに変形するための方法であって、
距離に伴うHRTFの変化をモデル化する距離変化関数DVを決定するステップと、
前記距離変化関数DVをHT取得のためのHIに適用するステップと、
を具備することを特徴とする方法。 - 請求項18乃至25に記載の方法を使用して前記距離変化関数を決定するステップを具備することを特徴とする請求項26に記載の方法。
- 前記距離変化関数を前記周波数領域がHT=DV・HIであるHIに適用するステップを具備することを特徴とする請求項26又は請求項27に記載の方法。
- 前記距離変化関数を前記時間領域がHT=DVconvolveHIであるHIに適用するステップを具備することを特徴とする請求項26又は請求項27に記載の方法。
- 前記方向x^と同一である前記方向y^を選択するステップを具備することを特徴とする請求項26乃至29のいずれか1項に記載の方法。
- 距離に依存するパララックス効果によって前記方向x^に前記方向y^を関係付けるステップを具備することを特徴とする請求項26乃至29のいずれか1項に記載の方法。
- 仮想空間オーディオのためのバイノーラル音信号を生成する方法であって、
方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを方向y^及び距離DTに対応する頭部伝達関数HTに変形するステップと、
バイノーラル音信号を生成するために、変形されたHRTFを有する音をフィルタリングする信号処理装置を使用するステップと
を具備することを特徴とする方法。 - 請求項26乃至31のいずれか1項に記載の方法を使用して前記HRTF:HTを導出するステップを具備することを特徴とする請求項32に記載の方法。
- 仮想空間オーディオのためのバイノーラル音信号を生成する方法であって、
方向x^及び距離DIに対応する頭部伝達関数(HRTF)HIを有する入力音をフィルタリングするステップと、
距離に伴うHRTFの変化をモデル化する距離変化関数DVを有する音をフィルタリングするための信号処理装置を使用するステップと
を具備することを特徴とする方法。 - 請求項18乃至25のいずれか1項に記載の方法を使用して前記距離変化関数DVを導出するステップを具備することを特徴とする請求項34に記載の方法。
- 仮想空間オーディオを生成するための方法であって、
仮想空間オーディオのためのバイノーラル音信号を生成するステップと、
前記仮想空間オーディオバイノーラル音信号と一致する音を聴取者に送るための音響アクチュエータを使用するステップと
を具備することを特徴とする方法。 - 請求項32乃至35のいずれか1項に記載の方法を使用して前記バイノーラル音信号を生成するステップを具備することを特徴とする請求項36に記載の方法。
- 仮想空間オーディオを生成するための装置であって、
仮想空間オーディオとして再生される信号を受信するための受信器と、
受信器と連通して、前記受信したオーディオ信号を処理し、前記仮想音のターゲット距離が変化する距離変化関数を使用して演算を実施し、かつ、前記受信した信号を仮想空間オーディオとして再生するための信号処理装置と、
出力デバイスに接続可能であり、前記出力デバイスが前記信号処理装置によって制御されて、前記ターゲット距離の仮想空間オーディオのバイノーラル音信号を出力するコネクタと
を具備することを特徴とする装置。 - ニアフィールドバイノーラル音信号と一致する音を聴取者に送る前記出力デバイスを具備することを特徴とする請求項38に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2005905817A AU2005905817A0 (en) | 2005-10-20 | Spatial audio simualtion | |
PCT/AU2006/001497 WO2007045016A1 (en) | 2005-10-20 | 2006-10-11 | Spatial audio simulation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009512364A true JP2009512364A (ja) | 2009-03-19 |
Family
ID=37962105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008535840A Pending JP2009512364A (ja) | 2005-10-20 | 2006-10-11 | 仮想オーディオシミュレーション |
Country Status (4)
Country | Link |
---|---|
US (1) | US20090041254A1 (ja) |
EP (1) | EP1938655A4 (ja) |
JP (1) | JP2009512364A (ja) |
WO (1) | WO2007045016A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010531605A (ja) * | 2007-06-26 | 2010-09-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | バイノーラル型オブジェクト指向オーディオデコーダ |
CN102183298A (zh) * | 2011-03-02 | 2011-09-14 | 浙江工业大学 | 不规则单全息声压测量面分离非自由声场的方法 |
WO2018012746A1 (ko) * | 2016-07-13 | 2018-01-18 | 삼성전자 주식회사 | 전자 장치 및 전자 장치의 오디오 출력 방법 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8896839B2 (en) | 2008-07-30 | 2014-11-25 | Pason Systems Corp. | Multiplex tunable filter spectrometer |
GB2478834B (en) | 2009-02-04 | 2012-03-07 | Richard Furse | Sound system |
US20100260360A1 (en) * | 2009-04-14 | 2010-10-14 | Strubwerks Llc | Systems, methods, and apparatus for calibrating speakers for three-dimensional acoustical reproduction |
KR101702330B1 (ko) * | 2010-07-13 | 2017-02-03 | 삼성전자주식회사 | 근거리 및 원거리 음장 동시제어 장치 및 방법 |
US20130222590A1 (en) * | 2012-02-27 | 2013-08-29 | Honeywell International Inc. | Methods and apparatus for dynamically simulating a remote audiovisual environment |
US9426300B2 (en) | 2013-09-27 | 2016-08-23 | Dolby Laboratories Licensing Corporation | Matching reverberation in teleconferencing environments |
US9473871B1 (en) * | 2014-01-09 | 2016-10-18 | Marvell International Ltd. | Systems and methods for audio management |
EP3114859B1 (en) | 2014-03-06 | 2018-05-09 | Dolby Laboratories Licensing Corporation | Structural modeling of the head related impulse response |
WO2016077514A1 (en) * | 2014-11-14 | 2016-05-19 | Dolby Laboratories Licensing Corporation | Ear centered head related transfer function system and method |
CN106993249B (zh) * | 2017-04-26 | 2020-04-14 | 深圳创维-Rgb电子有限公司 | 一种声场的音频数据的处理方法及装置 |
US10219095B2 (en) * | 2017-05-24 | 2019-02-26 | Glen A. Norris | User experience localizing binaural sound during a telephone call |
CN109618274B (zh) * | 2018-11-23 | 2021-02-19 | 华南理工大学 | 一种基于角度映射表的虚拟声重放方法、电子设备及介质 |
WO2023042078A1 (en) * | 2021-09-14 | 2023-03-23 | Sound Particles S.A. | System and method for interpolating a head-related transfer function |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2165656T3 (es) * | 1994-02-25 | 2002-03-16 | Henrik Moller | Sintesis binaural, funcion de transferencia respecto a una cabeza, y su utilizacion. |
GB9726338D0 (en) * | 1997-12-13 | 1998-02-11 | Central Research Lab Ltd | A method of processing an audio signal |
GB2351213B (en) * | 1999-05-29 | 2003-08-27 | Central Research Lab Ltd | A method of modifying one or more original head related transfer functions |
JP2001057699A (ja) * | 1999-06-11 | 2001-02-27 | Pioneer Electronic Corp | オーディオ装置 |
US6839438B1 (en) * | 1999-08-31 | 2005-01-04 | Creative Technology, Ltd | Positional audio rendering |
US20030202665A1 (en) * | 2002-04-24 | 2003-10-30 | Bo-Ting Lin | Implementation method of 3D audio |
US7720229B2 (en) * | 2002-11-08 | 2010-05-18 | University Of Maryland | Method for measurement of head related transfer functions |
JP2005223714A (ja) * | 2004-02-06 | 2005-08-18 | Sony Corp | 音響収音装置、音響収音方法、記録媒体 |
JP2005223713A (ja) * | 2004-02-06 | 2005-08-18 | Sony Corp | 音響再生装置、音響再生方法 |
-
2006
- 2006-10-11 EP EP06790367A patent/EP1938655A4/en not_active Withdrawn
- 2006-10-11 JP JP2008535840A patent/JP2009512364A/ja active Pending
- 2006-10-11 WO PCT/AU2006/001497 patent/WO2007045016A1/en active Application Filing
- 2006-10-11 US US12/090,799 patent/US20090041254A1/en not_active Abandoned
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010531605A (ja) * | 2007-06-26 | 2010-09-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | バイノーラル型オブジェクト指向オーディオデコーダ |
CN102183298A (zh) * | 2011-03-02 | 2011-09-14 | 浙江工业大学 | 不规则单全息声压测量面分离非自由声场的方法 |
WO2018012746A1 (ko) * | 2016-07-13 | 2018-01-18 | 삼성전자 주식회사 | 전자 장치 및 전자 장치의 오디오 출력 방법 |
US10893374B2 (en) | 2016-07-13 | 2021-01-12 | Samsung Electronics Co., Ltd. | Electronic device and audio output method for electronic device |
Also Published As
Publication number | Publication date |
---|---|
US20090041254A1 (en) | 2009-02-12 |
EP1938655A1 (en) | 2008-07-02 |
WO2007045016A1 (en) | 2007-04-26 |
EP1938655A4 (en) | 2009-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009512364A (ja) | 仮想オーディオシミュレーション | |
JP4343845B2 (ja) | オーディオデータ処理方法及びこの方法を実現する集音装置 | |
EP3320692B1 (en) | Spatial audio processing apparatus | |
EP2258120B1 (en) | Methods and devices for reproducing surround audio signals via headphones | |
CN106664497B (zh) | 音频再现***和方法 | |
KR101764175B1 (ko) | 입체 음향 재생 방법 및 장치 | |
CN107996028A (zh) | 校准听音装置 | |
US20080306720A1 (en) | Hrtf Individualization by Finite Element Modeling Coupled with a Corrective Model | |
US11668600B2 (en) | Device and method for adaptation of virtual 3D audio to a real room | |
JP2001016697A (ja) | 原頭部関連伝達関数を修正する方法および装置 | |
JP2023517720A (ja) | 残響のレンダリング | |
Sakamoto et al. | Sound-space recording and binaural presentation system based on a 252-channel microphone array | |
CN112584277B (zh) | 一种室内音频均衡的方法 | |
JP2005519502A (ja) | 音場の再生のためのユニットを制御する方法及び装置 | |
Thiemann et al. | A multiple model high-resolution head-related impulse response database for aided and unaided ears | |
Otani et al. | Binaural Ambisonics: Its optimization and applications for auralization | |
Wakayama et al. | Extended sound field recording using position information of directional sound sources | |
US10390167B2 (en) | Ear shape analysis device and ear shape analysis method | |
Menzies et al. | A complex panning method for near-field imaging | |
US11388540B2 (en) | Method for acoustically rendering the size of a sound source | |
Koyama | Boundary integral approach to sound field transform and reproduction | |
Vorländer | Virtual acoustics: opportunities and limits of spatial sound reproduction | |
Moore et al. | Processing pipelines for efficient, physically-accurate simulation of microphone array signals in dynamic sound scenes | |
Filipanits | Design and implementation of an auralization system with a spectrum-based temporal processing optimization | |
US11304021B2 (en) | Deferred audio rendering |