JP6896626B2 - ヘッドホンを通じて頭部外面化3dオーディオを生成するシステム及び方法 - Google Patents

ヘッドホンを通じて頭部外面化3dオーディオを生成するシステム及び方法 Download PDF

Info

Publication number
JP6896626B2
JP6896626B2 JP2017528571A JP2017528571A JP6896626B2 JP 6896626 B2 JP6896626 B2 JP 6896626B2 JP 2017528571 A JP2017528571 A JP 2017528571A JP 2017528571 A JP2017528571 A JP 2017528571A JP 6896626 B2 JP6896626 B2 JP 6896626B2
Authority
JP
Japan
Prior art keywords
filter
audio
srbir
generating
head
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017528571A
Other languages
English (en)
Other versions
JP2018500816A (ja
Inventor
エドガー ワイ チョウエイリ
エドガー ワイ チョウエイリ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Princeton University
Original Assignee
Princeton University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Princeton University filed Critical Princeton University
Publication of JP2018500816A publication Critical patent/JP2018500816A/ja
Application granted granted Critical
Publication of JP6896626B2 publication Critical patent/JP6896626B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Description

本発明は、ヘッドホン(本出願において、聴取者の耳に近接近したヘッドホン、イヤホン、イヤースピーカー、又は他の何れかのトランスデューサを含むものとする)を通じて頭部外面化(head−externalized)3Dオーディオ用の3Dオーディオフィルタを生成するシステム及び方法に関し、より詳細には、ヘッドホンを通じて高品質の3D頭部外面化された3Dオーディオを提供するためのフィルタ設計に関する。
本発明は、音楽聴取、エンターテイメントシステム、プロ用オーディオ、映画、情報通信、テレビ会議、ゲーム、仮想現実システム、コンピュータオーディオ、軍事及び医療用オーディオ用途を含む、ヘッドホンを通じて聴取者にオーディオが提供される実質的に全ての用途において汎用性がある。
ヘッドホンを通じたオーディオの頭部外面化に使用される従来技術のシステム及び方法は、以下の2つの方法のうちの1又は組み合わせに依存する。これらの従来技術の第1は、バイノーラルオーディオ、すなわち、ダミーヘッドマイクロホンで音響的に記録されたオーディオ、又はダミーヘッド又は人間の頭部の数値的HRIR(head−related impulse response:頭部関連インパルス応答)を用いてコンピュータ上でバイノーラル方式でミックスされるオーディオを用いている。本方法に関する課題は、音響の良好な頭部外面化をもたらすことができるのがごく僅かな比率の聴取者だけである点である。実質的に全ての聴取者に標準的なヘッドホンを通じて頭部外面化されたバイノーラル音響に対する十分に立証された機能的不良は、多くの要因に起因する(例えば、Rozenn Nicol, Binaural Technology, AES Monographs series, Audio Engineering Society, April 2010を参照)。かかる要因の1つは、音響記録に使用されるヘッドのHRIRと実際の聴取者のHRIRとの不一致である。別の重要な要因は、頭部移動に対する堅牢性の欠如であり、すなわち、聴取者が頭部を回転させると、感知されたオーディオ像が頭部とともに移動し、この技巧が感知のリアリズムを劣化させることである。PA法1では、音源の位置は、既に記録されている音響場において一般的には未知であるので、感知されたオーディオ像を決定するのに既存の頭部追跡(ヘッドトラッキング)技術を使用することはできない。
第2の従来技術の方法(PA法2)は、リスニングルームにおいてラウドスピーカーのバイノーラルインパルス応答を表現又はエミュレートするデジタル(又はアナログ)フィルタを通してオーディオをフィルタリングする(このようなフィルタは、SRbIRフィルタと呼ばれ、ここで「SRbIR」は、「スピーカー+ルームバイノーラルインパルス応答(Speakers+Room binaural Impulse Response)」を表す)。PA法1に優るこの方法の利点は、種々の頭部位置(予想される頭部回転の範囲をカバーする3つの位置は、他の頭部回転角度でSRbIRを外挿するのに通常は十分である)にて測定又は算出されたSRbIRを用いた入力オーディオの畳み込みは、頭部追跡を用いて頭部位置の関数として変化することができ、その結果、聴取者は、空間内で固定されたラウドスピーカーからもたらされる音響を感知するようになるので、スピーカーの位置が効果的に既知であるときに、空間内で感知されたオーディオ像を決定するのに既存の頭部追跡技術の使用ができることである(これにより、頭部移動に対する堅牢性が大幅に高くなり、従って、感知された音響場のリアリズムが向上される)。しかしながら、PA法2は、音響の良好な頭部外面化をもたらすことができるが、標準的なラウドスピーカーの音響をエミュレートしており、これによりこの音響は真の3次元ではない(すなわち、ラウドスピーカーが位置していると感知される領域を超えて3D空間において大きく広がらない)。
ラウドスピーカーを通したバイノーラル録音における両耳間到達時間差(Inter−Aural Time Difference,ITD)、両耳間音圧差(Inter−Aural Level Difference,ILD)及びスペクトルキューの伝送は、クロストーク(意図しない耳に到達する各ラウドスピーカーからの音響)によって重度に劣化するので、標準的なラウドスピーカーを通したバイノーラルオーディオの音響が真の3Dではないときには、バイノーラルオーディオの利点は大きく損なわれる。
文献又は何らかの既知の従来技術では報告されていないが、SRbIRフィルタに加えて、クロストーク除去されたラウドスピーカーの再生音響をエミュレートする目的でクロストーク除去(XTC)フィルタを使用することによって、上述の第2の方法を高品質3Dサウンドにする(依然として音響を頭部外面化しながら)ことは可能であるように思われる。しかしながら、標準的なXTCフィルタは、SRbIRフィルタで本来的に表され且つヘッドホンを通じた音響の外面化には必須であるクロストークを除去又は有意に低下させることになるので、このようなプロセスは所望の品質の音響をもたらさない。
従って、本発明の主な目的は、ヘッドホンを通じた3Dオーディオのより効果的な頭部外面化を可能にするシステム及び方法を提供することである。
国際出願PCT/US2011/50181号
Rozenn Nicol,「Binaural Technology」, AES Monographs series, Audio Engineering Society, April 2010年 T. Takeuchi et al. "Influence of Individual HRTF on the performance of virtual acoustic Imaging Systems(仮想音響イメージングシステムの性能に対する個々のHRTFの影響)" Audio Engineering Society Convention 104, 1998年5月 P.V.H.Mannerheim" Visually Adaptive Virtual sound Imaging using Loudspeakers", PhD Thesis, Univ. of South Hampton,2008年2月
本発明のシステム及び方法は、実質的にあらゆる聴取者にとってヘッドホンを通じてオーディオの頭部外面化に関する課題を解決することにより上述の従来のシステム及び方法の欠点を回避させ、非バイノーラル録音からでも真の3Dオーディオサウンドステージを生成する。加えて、バイノーラル録音では、本発明のシステム及び方法は、実質的に全ての聴取者がバイノーラル録音された音響場の正確な3D表現を聴くことが可能となる。
本発明のシステム及び方法は、スピーカー+ルームバイノーラルインパルス応答(SRbIR)を特有のクロストーク除去(XTC)フィルタと組み合わせることに依存し、これは、効果的な頭部外面化に必要とされるSRbIRのスペクトル及び時間的特性を劣化又は有意に変化させない。この固有の組み合わせは、クロストーク除去スピーカーのエミュレーションを可能にし、また、ヘッドホンを通じた外面化され堅牢な3Dオーディオレンダリングの3つの主たる課題全てを解決する。具体的には、この組み合わせは、以下の3つである。
(1)スペクトル的及び時間的に損なわれていないSRbIRの結果として、事実上全ての聴取者、すなわち、差分の聴覚損失の無いあらゆる聴取者にとって効果的に音響を外面化する(PA法1では可能ではない)こと。
(2)空間内で感知されたオーディオ像を決定するのに既存の頭部追跡技術の使用を可能にする(PA法1では可能ではない)こと。
(3)3D像の感知に必要とされるITD及びILDキュー(及びバイノーラル録音の場合にはスペクトルキュー)のはるかに小さな限定範囲を提供することによって、3Dオーディオ像を生成する(非クロストーク除去されたスピーカーによって生成されるオーディ像とは異なる)(PA法2では可能ではない)こと。
本発明の方法の実施可能な応用、普遍性及び達成は、録音時における複数(多くの場合)の音源の位置(この位置は一般には未知)を再現する課題を、方位面の前方部分の空間に位置付けられるクロストーク除去スピーカーの音響を単にエミュレートするところまで低減することによって更に確実にされ、これにより、方位面の前方部分における音源の位置は、個々の頭部関連伝達関数(HRTF)の間の差違に主として敏感ではないという十分に立証された音響心理的事実を利用することが可能になる。
この後者の事実を利用することにより、本発明のシステム及び方法は、全ての聴取者に対してヘッドホンを通じた3D音響を効果的に外面化する非個別化(すなわち、ユニバーサルの)フィルタを生成できるようにする。これら非個別化フィルタが実際に個別化フィルタと同程度に有効であることは、本発明の重要な実験的に検証された特徴である。
仮想音響イメージングシステム(聴取者のHRTF用いて)を通じて投影された音響を方位面の位置に位置特定するよう尋ねた聴取者の主観テスト結果を示すグラフである。 図1で使用された個々のHRTFの代わりにダミーHRTFを用いた主観テスト結果のグラフである。 オーディオ信号を処理して頭部外面化3Dオーディオ像を作製するためのオーディオフィルタを生成する本発明の方法のフローチャートである。 典型的なSRbIRの4つの測定されたインパルス応答のグラフである。 図4に示されるSRbIRの2つのインパルス応答の周波数応答のグラフである。 図4に示される測定値から得られたスペクトル的色付けのないクロストーク除去(SU−XTC)フィルタを構成する4つのインパルス応答のグラフである。 図6に示すSU−XTCフィルタの測定されたクロストーク除去性能のグラフである。 図6に示すSU−XTCフィルタの周波数応答(下方の平坦な曲線)と図4に示す方法で生成されたスペクトル的色付けのないクロストーク除去HPフィルタの周波数応答(上方の2つの曲線)のグラフである。 オーディオ信号を処理して頭部外面化3Dオーディオ像を作製するためのオーディオフィルタを生成する本発明のシステム(3Dオーディオヘッドホンプロセッサ)の一例の概略図である。
本発明の第1の主要事項は、SRbIRフィルタと組み合わせたときに、SRbIRフィルタの頭部外面化能力を妨げない又は可聴的に低下させない(すなわち、そのスペクトル特性を変化させない)特有のXTCフィルタを使用することである。この特有のXTCフィルタは、XTCフィルタの解析的に導出される又は実験的に測定されるシステム伝達行列を反転させるのに用いられる周波数依存正則化パラメータ(FDRP)を利用するよう設計されたものである。算出されたFDRPは、(聴取者の耳ではなく)ラウドスピーカーにおける平坦な振幅対平坦な周波数応答をもたらす。このようなフィルタは、名称が「ラウドスピーカーを通したオーディオのスペクトル的色付けのない最適なクロストーク除去」の国際出願PCT/US2011/50181号に記載されており、その教示内容は引用により本明細書に組み込まれる。この特有のXTCフィルタは、本明細書ではスペクトル的色付けのないクロストーク除去フィルタ又はSU−XTCフィルタと呼ばれる(商業上「BACCHフィルタ」とも呼ばれ、ここでBACCHは、The Trustees of Princeton Universityの登録商標である)。
SRbIRフィルタとの組み合わせをヘッドホンを通じた極めて効果的な頭部外面化3DオーディオをもたらすようにするSU−XTCフィルタの特定の特性は、SU−XTCフィルタの最大の特徴である平坦な周波数応答(振幅スペクトル)である。この平坦な周波数応答(又はスペクトル着色の欠如)は、2つのフィルタを組み合わせることによりSRbIRフィルタの周波数応答(振幅スペクトル)を概ね影響がないようにすることができる。定義上は平坦な応答から有意に逸脱した周波数応答を有するXTCフィルタである他の何れかのタイプのXTCフィルタは、2つのフィルタが組み合わされたときにSRbIRフィルタのトーン歪みにつながり、これによりヘッドホンを通じた音響の頭部外面化に必要とされる、SRbIRでの符号化のスペクトルキューを損なうことになる。本発明では、基本的に平坦な周波数応答を有するXTCフィルタを用いることができる。「基本的に平坦な周波数応答」を有するフィルタとは、フィルタリングされたオーディオ信号のトーン成分に可聴変化を引き起こさないフィルタである。例えば、その周波数応答が、オーディオ範囲にわたって完全な平坦応答から1dB以上の広帯域(1オクターブ以上)の何らかの逸脱がない及び/又は完全な平坦応答から2dB以上の狭帯域(1オクターブ未満)の何らかの逸脱がないフィルタは、可聴的に平坦とみなすことができる。
本発明のシステム及び方法におけるXTCフィルタ(SU−XTCフィルタで適合された)の別の要件は、このフィルタが無響であること、すなわち、無響室で行われた測定から設計されるか、又はより実際的には、以下で説明するように直接音を除いた全てを排除するために単に初期IRを時間ウインドウ処理する(通常は約3msの時間ウインドウを用いる)ことによって得られたものであることである。
本発明のXTCフィルタの設計に際してIRの無響部分よりもはるかに多くを含むことは、最終的なヘッドホンフィルタの音響外面化能力の低下を招くことになる。このことは、SRbIRがスピーカーの聴取のクロストークをエミュレートし、非無響XTCフィルタがSRbIRと組み合わされたときに同じクロストークを除去する(少なくとも部分的にはXTCフィルタの周波数応答を通じて、大部分は拡張非無響時間応答を通じて)ように働くことになり、従って、標準的なヘッドホン聴取の必然的なクロストーク除去された音響をもたらす(本来的に頭部内面化を生じる)という事実によって容易に説明される。
基本的に、本発明の3D音響フィルタ(本明細書では「SU−XTC−HPフィルタ」と呼ばれ、ここでHPは「ヘッドホン処理(headphones processing)」又は「ヘッドホンプロセッサ(headphones processor)」を表す)は、SU−XTCフィルタとSRbIRフィルタの適切な組み合わせ(以下でそのステップが記載される本発明の方法により定められる)であり、(適切な頭部追跡と組み合わされたときに)ヘッドホンを通じたクロストーク除去スピーカー再生の堅牢で優れたエミュレーションを可能にする。聴取者は、トーン着色(歪み)のない平坦な周波数応答クロストーク除去フィルタを通じたラウドスピーカーのペアを聴取することによって聴こえることになるものと基本的に同じサウンドステージを聴くことになる。SU−XTCフィルタを用いたラウドスピーカーの聴取は、3D音響像をもたらすので、SU−XTC−HPフィルタを通じて結果として得られるヘッドホン像は、基本的に同じ3D音響像である。
本発明の方法の実施可能な応用、普遍性及び達成は、録音時における複数(多くの場合)の音源の位置(この位置は一般には未知)を再現する課題を、方位面(典型的には聴取者の位置から±45度の方位スパン内にある)の前方部分の空間に位置付けられるXTC処理されたスピーカーの音響を単にエミュレートするところまで低減することによって更に確実にされ、これにより、方位面(±45度の方位スパン角度内)の前方部分における音源の位置は、個々の頭部関連伝達関数(HRTF)の間の差違に主として敏感ではないという十分に立証された音響心理的事実を利用することが可能になる。この事実は、図1及び2に明確に例証されている(T. Takeuchi et al. “Influence of Individual HRTF on the performance of virtual acoustic Imaging Systems(仮想音響イメージングシステムの性能に対する個々のHRTFの影響)” Audio Engineering Society Convention 104, 1998年5月)。図1において、多数の聴取者を伴った主観テスト結果がグラフで示されている。聴取者は、グラフのx軸で表される角座標を有する方位面の位置に仮想音響イメージングシステムを通じて投影された音響を位置特定するよう尋ねられた。y軸は、感知された方位位置を示し、各点のサイズは、当該位置で音響を感知した人の数に比例している。図1において、音響仮想化は、各聴取者に対して測定された個々のHRTFを用いて行い、予想通り、データは良好な位置特定を示す直線(y=x)を概ね辿っている。図2は、個々のHRTFの代わりにダミーヘッド(KEMARダミー)の単一のHRTFを用いた同様の実験セットの結果を示している。高方位角度では、音響位置の誤差は悪化するが、前方方位角度(±45度)では、音響位置は良好ではあるが、汎用ダミーHRTFによってフィルタリングされた音響を聴取していることは図2から明らかである。
この適切な音響心理的事実は、種々の聴取者に対してSU−XTC−HPフィルタの普遍性をベースとしていることとは別に、SRbIRフィルタが単一のダミーヘッド行った測定から、又はダミー(又は単一の個々の)HRTFを用いて算出/シミュレートされた測定から構成できるという有用な実施態様を有する。これは、SRbIRを測定(又は算出)するのに使用されるラウドスピーカー(又は仮想スピーカー)は、SU−XTCフィルタが当該同じ幾何形状に合わせて設計(又は算出)されている限り、方位面(±45度の方位スパン角度内)の前方部分に任意的に位置付けることができることに起因する。
ヘッドホンを通じて3Dでバイノーラルオーディオを極めて堅牢且つ効果的に外面化するSU−XTC−HPフィルタフィルタのこの能力は、ヘッドホンを通じて従来行うことができたものよりもはるかに優れており、これは、ヘッドホンを通じてフル3Dでバイノーラルオーディオを効果的に外面化できる人の割合が、数%(バイノーラル録音を行うのに用いられるヘッドにHRIRが近接している極めて少数の聴取者)から実質的に100%(重度又は差分の聴覚損失の無い事実上あらゆる聴取者)にまで高まったことを意味している。これは、ラウドスピーカーを通じた標準的なバイノーラルオーディオ再生(PA法1)に関するSU−XTC−HPフィルタの主な利点の1つである。このことは、ヘッドホンを通じて標準的なステレオ(すなわち、非バイノーラル)録音を外面化するSU−XTC−HPフィルタの能力に加えて、SU−XTCフィルタリングされたラウドスピーカー再生から得ることができるものと基本的に同じ感知3D像をもたらす。
本発明のシステム及び方法の有用性は、SU−XTC−HPフィルタによって処理されることになる入力オーディオが無響で録音(すなわち、残響を含まない)されていない限り、SU−XTC−HPフィルタがウインドウ化SRbIRフィルタによって表される部屋の残響特性を感知した音響に可聴的に付加しないという事実によって更に確実にされることが重要である。これは、処理された入力オーディオの感知したリバーブテールが、SRbIRのリバーブテールよりもxdB大きいことになることに起因する。ここで、xは、SRbIRのピークの振幅とそのリバーブテールの平均振幅との差違であり、従って、実際には録音されたリバーブは、xが20dBを超えるために常に優勢となるか、又は設計上それよりも容易に大きく又は高くすることができる。
SU−XTC−HPフィルタを生成する新規の方法は、以下の5つの主要ステップを含む。
ステップ1:図3を参照すると、ラウドスピーカーのペアの測定(聴取者が身装着したインナーイヤー式バイノーラルマイクロホン又はダミーヘッドを用いて)又はシミュレートしたバイノーラルインパルス応答は、直接音と実際の室内でラウドスピーカーをシミュレートするのに十分な室内反射とを含むように十分に長い時間ウインドウでウインドウ化される(通常は150ms以上のウインドウが必要とされる)。ウインドウ化されたバイノーラルインパルス応答は、更に処理されなくとも求めるSRbIRフィルタとして機能を果たすことができ、何らかのステレオ入力信号で2x2(真ステレオ)畳み込みにより畳み込まれてヘッドホンに送り込まれた場合には、ラウドスピーカーからもたらされるオーディオの感知を聴取者に与えることになる。しかしながら、以下のステップ2に関連して検討するように、ラウドスピーカーのこのウインドウ化されたバイノーラルIRは、多くの場合は更に処理されて、本発明のシステム及び方法においてSRbIRフィルタとして使用するのに最適にされる。上記で説明された音響心理的事実の結果として、本発明のシステム及び方法は、ラウドスピーカーの方位スパンを小さく(典型的には聴取者の位置から±45度の方位スパン内にある)されたときに、その感知性能が本来的に個々のHRTFに本来的に敏感ではないSU−XTC−HPフィルタをもたらすことになり、この場合、対象の聴取者に関してこの測定を実施する必要はない。その代わりに、及び多くの場合、より実際的には当該測定にはダミーヘッドを用いることができ、或いは同等に、SRbIRは、ダミー又は対象の聴取者とは全く異なる単一固体の汎用HRTFを用いて数値的に構成することができる。これは、図3に示す方法の入力22で二分法によって例証され、ここで大きなスピーカースパン角度で得られたSRbIRは、本方法の終わりにおいて、SRbIRフィルタの設計にHRTFが使用される聴取者によって使用される必要がある聴取者依存のSU−XTC−HPフィルタを生じ、他方、小さなスピーカースパン角度で得られたSRbIRは、あらゆる聴取者が用いることができる聴取者非依存の(すなわち、ユニバーサルな)SU−XTC−HPフィルタを生じる。
このSRbIRフィルタはまた、原理的には、人間の聴取者又はダミーヘッドの測定された(構成された)HRTFを用いて、室内の単一のスピーカーの汎用(非個別化の)インパルス応答(単一の無指向性マイクロホンで測定されるか又はコンピュータシミュレーションを通じて構成される)(例えば、近隣表面からの反射で点音源をシミュレートする)を畳み込む(すなわち、デジタルフィルタを信号に加えるのに一般的に使用される時間又は周波数ドメインにおいて標準の数学的な畳み込み演算をデジタル手段を通じて適用する)ことによって構成することができる。SRbIRを構成するこの(比較的厳しい要求の)方法は、SU−XTC−HPフィルタによってエミュレートされたスピーカー又は部屋の音響を事後に変更する能力という利点を提供する。
SRbIRフィルタは、実際には4つの実IR(各々が2つの耳の一方で測定された2つのスピーカーのうちの1つからの音響のIRを表している)からなる点は明らかなはずである。典型的なSRbIRの4つのIRが図4に示されている。IRは、4つのパネル(上部左:左耳/左スピーカー;底部左:左耳/右スピーカー;上部右:右耳/左スピーカー;及び底部右:右耳/右スピーカー)で示される。明確にするために、この図ではIRの最初の20msだけが図示されているが、使用される実際のウインドウ化IRははるかに長く延びている(上述のような十分な室内反射を含めるために典型的には150ms以上)(これらのグラフの破線曲線は、ステップ3に関連して以下で説明されるSU−XTCを設計するのに使用される時間ウインドウを表している)。
参照として、このSRbIRの周波数応答(2つのIRについての)が図5に示されている(実線の曲線:左耳/左スピーカー;破線曲線:右耳/右スピーカー)(他の図でも全てのスペクトルのグラフは同様であり、x軸はHz単位の周波数、y軸はdB単位の振幅である)。
ステップ2:次に、SRbIRは、任意選択的に処理されて(但し、ここでの処理は、次の段落で説明される理由で飛ばすことができる)、その頭部外面化能力を最適化し、更に必要に応じて、最終フィルタの記憶装置及びCPU要件を低減することができる。このような処理は、ステップ1で使用されたインナーイヤーマイクロホン及び対象のヘッドホンのスペクトル着色を除去(又は補償)する逆フィルタリングの標準的手法を用いて円滑化(時間又は周波数ドメインで)及び等化することを含むことができる。このような等化フィルタは、聴取者がインナーイヤーマイクロホン及び対象のヘッドホンの両方を装着しながら各耳におけるヘッドホンのインパルス応答を測定し、これを用いて何らかの逆IRフィルタ設計技術を通じて等化フィルタを生成することによって設計することができる。
特定の実施形態において、頭部外面化能力を最適化するようSRbIRを処理するステップは、インナーイヤーマイクロホンが平坦な周波数応答を有し(又はそれを有するように等化され)、対象のヘッドホンが「開放」タイプである(Sennheiser HDシリーズ、すなわち、静電気及び磁気平面型ヘッドホンなど)場合には飛ばすことができる。オープンヘッドホン(すなわち、エンクロージャが音響に概ね透過的である)は、トランスデューサと外耳道への入口との間に比較的低いインピーダンスを有し、これにより最終SU−XTC−HPフィルタの有効性を劣化させる重大な不利点を生じることなく等化ステップを飛ばすことが可能となる。
ステップ3:所要のSU−XTCフィルタを設計する前に、ステップ1で測定(又は構成)されたSRbIRにおける4つのIRは、直接音(スピーカーの主時間反応の時間範囲を表す通常は最大2〜3ms)を保持する時間ウインドウを使用し、全ての反射音響(当該ウィンドウ後の全ての音響)を排除してSRbIRにおける4つのIRの各々からの反射音響の全て又はそのほとんどを除去するようにウインドウ化され、その結果、SU−XTCは、基本的にSRbIRの無音(すなわち、直接音)部分であるもので設計される。このような時間ウインドウの一例は、図中で破線曲線として示されている。
ステップ4:所要のSU−XTCフィルタの設計は、ステップ3で得られたウインドウ化SRbIRを入力として用いて、名称が「ラウドスピーカーを通したオーディオのスペクトル的色付けのない最適なクロストーク除去(Spectrally uncolored optimal crosstalk cancellation for audio through loudspeakers)」の国際出願PCT/US2011/50181号に記載されるように進められる。
ステップ4の結果として得られたこのようなSU−XTCフィルタの一例が図6に示され、2x2IRのセットが、図4に示すSRbIR実施例に対応する。このフィルタの測定されたクロストーク除去性能は、図7に示されている(実線の曲線:左耳で測定した音響レベルのみを有する左チャンネルの信号入力:破線曲線:右耳で測定された音響レベルのみを有する右チャンネルの信号入力)(この実施例の平均XTCレベルは17dBを上回る)。
左チャンネルのみにおける信号入力又は右チャンネルのみにおける信号入力についてのSU−XTCの周波数応答は、SU−XTCフィルタから予想されるように、図9のグラフの下側部分の基本的に平坦な線として図示される。
ステップ5:最終SU−XTC−HPフィルタは、ステップ2で得られたSRbIRとステップ4で得られたSU−XTCフィルタとの組み合わせである。この組み合わせは、2つのフィルタを共に畳み込みし、次いで結果として得られた単一のSU−XTC−HPを用いてヘッドホンの生のオーディをフィルタリングすることによって、又は代替として、SU−XTCフィルタ(例えば、図6に示すもの)とSRbIR(例えば、図4に示すもの)を別個に順番に畳み込みする(この畳み込みの各々は「真のステレオ」又は2x2畳み込みである)ことによって行うことができる。
SU−XTCフィルタの周波数応答は平坦であるので、SU−XTC−HPフィルタの周波数応答(図8の上側の2つの曲線で示される)は、2つの図を比較することで検証できるように、SRbIR(図5に示される)の周波数応答と基本的に同じである。これにより、SRbIRを得るのに使用されるクロストーク除去(仮想又はリアルの)ラウドスピーカーを聴取者が実際に聴いていたのと同じ音響をヘッドホンを通じて聴取者が感知することが確保される。
上述の方法の必然的帰結は、センサで聴取者の頭部回転を追跡し、また即座に測定された頭部回転座標(ヨー角)をリアルタイムで用いて、測定(又はシミュレーション)が事前に行われた位置に対応する2つの(SU−XTC−HP)フィルタ間の内挿から導出される当該方位角に相当する適切な(SU−XTC−HP)フィルタにシフトすることで従来技術と同様にして得られた像を調整することにより、空間内で感知された3D像を決定する既存の頭部追跡技術を使用できること(PA法1とは異なって)である。このような調整なしでは、音響の頭部外面化は、頭部が回転したときにかなり悪化することが分かっている。
頭部追跡のハードウェア及びソフトウェアの要件は、標準的なヘッドホンと比べてコスト及び複雑さが付加されるが、ゲーム産業(例えば、TrackIR, Kinect, Visage SDK)で使用されることが多いような商業的に既存のコスト効果のある頭部追跡ハードウェアであれば、当該目的に極めて効果的に機能する。これらには、光学センサ(例えば、カメラ)、赤外センサ又は内部測定ユニット(例えば、マイクロジャイロスコープ、加速度計、ジャイロスコープ及び磁気探知機)が含まれる。
頭部追跡の解決策はまた、従来技術のIR内挿及びスライド畳み込み法に依存し、これらは、3つのSRbIR測定値(上述の方法のステップ1の一部として)を通じて3つのSU−XTC−HPフィルタを作製し、1つが中央リスニング位置にあるヘッドに対応し、1つが極左に回転したヘッドに対応し、3つめが極右に回転したヘッドに対応することが必要とされる。次いで、一連のSU−XTC−HPフィルタ(通常はほとんどの用途で十分であるには40個のフィルタであることが分かっている)は、これら3つのアンカーフィルタ間の内挿によって迅速に構築されて、頭部回転座標(ヨー)の瞬時的値に応じて適切なフィルタがオンザフライで選択される。これらの技術は、従来技術の文献、例えば、P.V.H.Mannerheim“ Visually Adaptive Virtual sound Imaging using Loudspeakers”, PhD Thesis, Univ. of South Hampton,2008年2月に記載されており、その教示内容は引用により本明細書に組み込まれる。
本方法を利用するシステムの一例が図9に示されている。本システムは、SU−XTC−HPフィルタをベースとした3Dオーディオヘッドホンプロセッサになる。本システムは、IR測定システム50を用いて、無響室内のラウドスピーカーのペアのIRを測定し、又はシミュレーションシステム60を用いて、音響反射62に対するラウドスピーカーのペアのバイノーラル応答をシミュレートする。IR測定システムにおいて、インナーイヤーマイクロホン54のペアは、人間又はダミーヘッド56に装着される。次いで、測定又はシミュレートされたIRは、マイクプリアンプ及びA/Dコンバータ66によって処理されてSRbIRを生成する。
プロセッサ70は、音響及び反射音響を含めるようSRbIRをウインドウ化する。プロセッサ70はまた、上記のステップ2に関連して記載されたように一部の実施形態においてバイノーラルIRを平滑化及び等化することになる。プロセッサ70はまた、SRbIRにおいて4つのIRをウインドウ化して、SU−XTCフィルタを生成する前に直接音を含めて反射音響を含めないようにし、該SU−XTCフィルタは、SRbIRフィルタと組み合わされ、該SRbIRフィルタとSU−XTCフィルタを組み合わせることでSU−XTC−HPフィルタを生成する。A/Dコンバータ76を通じて処理された生オーディオ74は、SU−XTC−HPフィルタを用いてオーディオをフィルタリングする畳み込み器(コンボルバ)72を通じて供給される。フィルタリングされたオーディオは、D/Aコンバータ及びヘッドホンプリアンプ78に供給され、処理された3Dオーディオ出力80を生成する。次に、処理された出力80は、聴取者82が装着したヘッドホンセットに供給される。デジタル事前処理は、上述の本発明の方法のステップに相当する。ヘッドトラッカー83を用いて、聴取者の頭部回転を追跡し、畳み込み器(コンボルバ)72に供給される瞬時的な頭部ヨー座標を生成して、瞬時頭部ヨー角度の関数として畳み込みを調整することができる。
好ましい実施形態を参照して上記の発明を説明してきたが、当業者であれば様々な代替形態及び修正形態を想定することが可能である。このような代替形態及び修正形態の全ては、添付の請求項の範囲内にあるものとする。
50:IR測定システム
54:インナーイヤーマイクロホン
56:ダミーヘッド
60:シミュレーションシステム
62:音響反射
66:A/Dコンバータ
70:プロセッサ
72:畳み込み器(コンボルバ)
74:生オーディオ
76:A/Dコンバータ
78:ヘッドホンプリアンプ
80:3Dオーディオ出力
82:聴取者
83:ヘッドトラッカー

Claims (19)

  1. オーディオ信号を処理してヘッドホンを通じた頭部外面化3Dオーディオ像を作製するためのオーディオフィルタを生成する方法であって、
    頭部の両耳に装着されたバイノーラルマイクロホンを用いたインパルス応答測定システムで部屋のスピーカーのペアのインパルス応答を測定するステップと、
    直接音及び反射音を含む特定の特性を有する前記インパルス応答から、4つの実インパルス応答から成るスピーカー+ルームバイノーラルインパルス応答(SRbIR)フィルタを生成するステップと、
    直接音を含むが反射音を除去した前記SRbIRフィルタの時間ウインドウでウインドウ化されたバージョンからスペクトル的色付けのないクロストーク除去フィルタを生成するステップと、
    プロセッサを用いて、前記SRbIRフィルタ及び前記クロストーク除去フィルタの組み合わせを介して、前記オーディオ信号をフィルタリングし、ステレオオーディオ信号を生成するステップと、
    得られた前記ステレオオーディオ信号をヘッドホンにフィードし、頭部外面化3Dオーディオ像の感知を与えるオーディオ再生のエミュレーションを、クロストーク除去スピーカーを介して聴取者に提供するステップと、を含む、方法。
  2. 前記ヘッドホンがイヤホンである、請求項1に記載のオーディオフィルタを生成する方法。
  3. 前記ヘッドホンがイヤースピーカーである、請求項1に記載のオーディオフィルタを生成する方法。
  4. 前記ヘッドホンが、聴取者の耳に近接近して配置されるように設計されたトランスデューサである、請求項1に記載のオーディオフィルタを生成する方法。
  5. 前記SRbIRが、前記インパルス応答を測定することによって得られる、請求項1に記載のオーディオフィルタを生成する方法。
  6. 前記SRbIRが、前記インパルス応答の解析的又は数値的モデリングによって得られる、請求項1に記載のオーディオフィルタを生成する方法。
  7. 前記SRbIRが、前記インパルス応答を算出することによって得られる、請求項1に記載のオーディオフィルタを生成する方法。
  8. 前記SRbIRフィルタを生成するステップが、ダミーの汎用頭部関連伝達関数(HRTF)を用いて前記SRbIRを構成するステップを含む、請求項1に記載のオーディオフィルタを生成する方法。
  9. 前記クロストーク除去フィルタが、前記スピーカーの無響インパルス応答をベースとしている、請求項1に記載のオーディオフィルタを生成する方法。
  10. 前記SRbIRによって表される2つのラウドスピーカー間の聴取者の位置から測定した方位スパンが、±45度以下のスパン角度である、請求項1に記載のオーディオフィルタを生成する方法。
  11. 前記SRbIRフィルタ及び前記クロストーク除去フィルタ組み合わせ、前記SRbIRフィルタと前記クロストーク除去フィルタとを共に畳み込みすることにより得られるオーディオフィルタを生成し、結果として得られる前記オーディオフィルタを用いて前記オーディオ信号を生成するステップによって行われる、請求項1に記載のオーディオフィルタを生成する方法。
  12. 前記SRbIRフィルタ及び前記クロストーク除去フィルタ組み合わせ、前記オーディオ信号を前記2つのフィルタで順番に畳み込むことにより得られるオーディオフィルタを生成するステップによって行われる、請求項1に記載のオーディオフィルタを生成する方法。
  13. 頭部追跡技術を使用して頭部外面化3Dオーディオ像を調整するステップを更に含む、請求項1に記載のオーディオフィルタを生成する方法。
  14. 前記SRbIRを構成するのに非個別化されたHRTFが使用される、請求項1に記載のオーディオフィルタを生成する方法。
  15. 前記SRbIRを構成するのに個別化されたHRTFが使用される、請求項1に記載のオーディオフィルタを生成する方法。
  16. オーディオ信号を処理してヘッドホンを通じた頭部外面化3Dオーディオ像を作製するためのオーディオフィルタを生成するシステムであって、
    頭部の両耳に装着されたバイノーラルマイクロホンを有するインパルス応答測定システムと、
    前記インパルス応答測定システムから受信する一又は二以上のインパルス応答により、スピーカーのペアのウインドウ化されたバイノーラルインパルス応答を測定するための少なくとも一つのプロセッサであって、前記ウインドウ化されたバイノーラルインパルス応答から、直接音及び反射音を含む特定の特性を有し、4つの実インパルス応答から成るスピーカー+ルームバイノーラルインパルス応答(SRbIR)フィルタを生成する少なくとも一つのプロセッサと、を備え、
    前記少なくとも一つのプロセッサは、直接音を含むが反射音を除去した前記SRbIRフィルタの時間ウインドウでウインドウ化されたバージョンからスペクトル的色付けのないクロストーク除去フィルタを生成し、さらに、前記SRbIRフィルタ及び前記クロストーク除去フィルタの組み合わせを介して、前記オーディオ信号をフィルタリングし、ステレオオーディオ信号を生成し、
    オーディオフィルタを生成するシステムは、さらに、得られた前記ステレオオーディオ信号を受け、頭部外面化3Dオーディオ像の感知を与えるオーディオ再生のエミュレーションを、クロストーク除去スピーカーを介して聴取者に提供するためのヘッドホンを備えた、オーディオフィルタを生成するシステム。
  17. インナーイヤーバイノーラルマイクロホンのペアをさらに含む、請求項16に記載のオーディオフィルタを生成するシステム。
  18. 前記プロセッサは、オーディオ信号を、前記SRbIRフィルタ及びクロストーク除去フィルタの両方を順番に介してフィルタリングする、請求項1に記載のオーディオフィルタを生成する方法。
  19. 前記プロセッサは、オーディオ信号を、前記SRbIRフィルタ及びクロストーク除去フィルタの組み合わせから作成されるフィルタによって、フィルタリングする、請求項1に記載のオーディオフィルタを生成する方法。
JP2017528571A 2014-11-25 2015-11-25 ヘッドホンを通じて頭部外面化3dオーディオを生成するシステム及び方法 Active JP6896626B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/553,605 2014-11-25
US14/553,605 US9560464B2 (en) 2014-11-25 2014-11-25 System and method for producing head-externalized 3D audio through headphones
PCT/US2015/062661 WO2016086125A1 (en) 2014-11-25 2015-11-25 System and method for producing head-externalized 3d audio through headphones

Publications (2)

Publication Number Publication Date
JP2018500816A JP2018500816A (ja) 2018-01-11
JP6896626B2 true JP6896626B2 (ja) 2021-06-30

Family

ID=56011563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017528571A Active JP6896626B2 (ja) 2014-11-25 2015-11-25 ヘッドホンを通じて頭部外面化3dオーディオを生成するシステム及び方法

Country Status (4)

Country Link
US (1) US9560464B2 (ja)
EP (1) EP3225039B8 (ja)
JP (1) JP6896626B2 (ja)
WO (1) WO2016086125A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017153872A1 (en) 2016-03-07 2017-09-14 Cirrus Logic International Semiconductor Limited Method and apparatus for acoustic crosstalk cancellation
US10123120B2 (en) * 2016-03-15 2018-11-06 Bacch Laboratories, Inc. Method and apparatus for providing 3D sound for surround sound configurations
US9913061B1 (en) 2016-08-29 2018-03-06 The Directv Group, Inc. Methods and systems for rendering binaural audio content
US10111001B2 (en) 2016-10-05 2018-10-23 Cirrus Logic, Inc. Method and apparatus for acoustic crosstalk cancellation
EP3535988A4 (en) 2016-11-04 2020-06-10 Dirac Research AB CONSTRUCTION OF A SOUND FILTER DATABASE USING HEAD TRACKING DATA
US10771881B2 (en) * 2017-02-27 2020-09-08 Bragi GmbH Earpiece with audio 3D menu

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9603236D0 (en) 1996-02-16 1996-04-17 Adaptive Audio Ltd Sound recording and reproduction systems
US6449368B1 (en) 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
US6668061B1 (en) 1998-11-18 2003-12-23 Jonathan S. Abel Crosstalk canceler
WO1999051062A1 (en) 1998-03-31 1999-10-07 Lake Technolgy Limited Formulation of complex room impulse responses from 3-d audio information
GB0015419D0 (en) 2000-06-24 2000-08-16 Adaptive Audio Ltd Sound reproduction systems
US6738479B1 (en) * 2000-11-13 2004-05-18 Creative Technology Ltd. Method of audio signal processing for a loudspeaker located close to an ear
FI118370B (fi) 2002-11-22 2007-10-15 Nokia Corp Stereolaajennusverkon ulostulon ekvalisointi
KR20050060789A (ko) 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
US7536017B2 (en) 2004-05-14 2009-05-19 Texas Instruments Incorporated Cross-talk cancellation
US7974418B1 (en) * 2005-02-28 2011-07-05 Texas Instruments Incorporated Virtualizer with cross-talk cancellation and reverb
EP1984913A4 (en) * 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
US8559646B2 (en) * 2006-12-14 2013-10-15 William G. Gardner Spatial audio teleconferencing
US8483413B2 (en) * 2007-05-04 2013-07-09 Bose Corporation System and method for directionally radiating sound
GB0712998D0 (en) 2007-07-05 2007-08-15 Adaptive Audio Ltd Sound reproducing systems
US20090086982A1 (en) 2007-09-28 2009-04-02 Qualcomm Incorporated Crosstalk cancellation for closely spaced speakers
US8238563B2 (en) * 2008-03-20 2012-08-07 University of Surrey-H4 System, devices and methods for predicting the perceived spatial quality of sound processing and reproducing equipment
US9066191B2 (en) * 2008-04-09 2015-06-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating filter characteristics
US8295498B2 (en) 2008-04-16 2012-10-23 Telefonaktiebolaget Lm Ericsson (Publ) Apparatus and method for producing 3D audio in systems with closely spaced speakers
TWI475896B (zh) 2008-09-25 2015-03-01 Dolby Lab Licensing Corp 單音相容性及揚聲器相容性之立體聲濾波器
US9107021B2 (en) * 2010-04-30 2015-08-11 Microsoft Technology Licensing, Llc Audio spatialization using reflective room model
EP2389016B1 (en) * 2010-05-18 2013-07-10 Harman Becker Automotive Systems GmbH Individualization of sound signals
JP5993373B2 (ja) * 2010-09-03 2016-09-14 ザ トラスティーズ オヴ プリンストン ユニヴァーシティー ラウドスピーカを通した音声のスペクトル的色付けのない最適なクロストーク除去
JP2013110682A (ja) * 2011-11-24 2013-06-06 Sony Corp 音響信号処理装置、音響信号処理方法、プログラム、および、記録媒体
US9420393B2 (en) * 2013-05-29 2016-08-16 Qualcomm Incorporated Binaural rendering of spherical harmonic coefficients

Also Published As

Publication number Publication date
JP2018500816A (ja) 2018-01-11
EP3225039B8 (en) 2021-03-31
EP3225039A4 (en) 2018-05-30
EP3225039A1 (en) 2017-10-04
EP3225039B1 (en) 2021-02-17
US20160150339A1 (en) 2016-05-26
US9560464B2 (en) 2017-01-31
WO2016086125A1 (en) 2016-06-02

Similar Documents

Publication Publication Date Title
JP6896626B2 (ja) ヘッドホンを通じて頭部外面化3dオーディオを生成するシステム及び方法
US10142761B2 (en) Structural modeling of the head related impulse response
KR100608024B1 (ko) 다중 채널 오디오 입력 신호를 2채널 출력으로 재생하기위한 장치 및 방법과 이를 수행하기 위한 프로그램이기록된 기록매체
US7391876B2 (en) Method and system for simulating a 3D sound environment
JP6824155B2 (ja) 音声再生システム及び方法
US10341799B2 (en) Impedance matching filters and equalization for headphone surround rendering
CN112005559B (zh) 改进环绕声的定位的方法
EP3132617A1 (en) An audio signal processing apparatus
KR20110127074A (ko) 음향 신호의 개별화
JP2000152397A (ja) 複数の聴取者用3次元音響再生装置及びその方法
JP2009077379A (ja) 立体音響再生装置、立体音響再生方法及びコンピュータプログラム
JP6690008B2 (ja) オーディオ信号処理装置および方法
US20170272889A1 (en) Sound reproduction system
JP2020536464A (ja) オーディオ再生においてクロストークキャンセルゾーンを作成するためのシステム及び方法
US10440495B2 (en) Virtual localization of sound
JP4407467B2 (ja) 音響シミュレーション装置、音響シミュレーション方法、および音響シミュレーションプログラム
US20230403528A1 (en) A method and system for real-time implementation of time-varying head-related transfer functions
Mittag et al. Dataset of Binaural Room Impulse Responses at Multiple Recording Positions, Source Positions, and Orientations in a Real Room
CN116193196A (zh) 虚拟环绕声渲染方法、装置、设备及存储介质
Fernandes Spatial Effects: Binaural Simulation of Sound Source Motion

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200114

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201015

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210609

R150 Certificate of patent or registration of utility model

Ref document number: 6896626

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250