JP6821699B2

JP6821699B2 - アクティブモニタリングヘッドホンとそれの反転を正則化する方法

Info

Publication number: JP6821699B2
Application number: JP2018555466A
Authority: JP
Inventors: ゴメス−ボラニョス、ハビエル; メーキビルタ、アキ; プルッキ、ビレ
Original assignee: Genelec Oy
Current assignee: Genelec Oy
Priority date: 2016-04-20
Filing date: 2017-04-18
Publication date: 2021-01-27
Anticipated expiration: 2037-04-18
Also published as: US10582325B2; EP3446499B1; CN109155895A; EP3446499A4; EP3446499A1; WO2017182707A1; US20190098427A1; CN109155895B; JP2019516313A

Description

[0001] 本発明は、アクティブモニタリングヘッドホン及びこれらのヘッドホンに関する方法に関する。

[0002] ほとんどのヘッドホンは受動的なものであり、したがって、その性能は、使用される外部増幅器に依存する。したがって、性能は、ユニットによって、及び設計によって大きく異なる。イヤホンカップに組み込まれた電子機器を備えたアクティブヘッドホンがいくらか存在する。電子機器は、（多くの場合）スペースを取って音響性能を低下させる。電子機器の機能は、増幅器のみ、または増幅器及びＡＮＣ（アクティブノイズキャンセル）である。コンピュータ／デジタルオーディオ／アナログオーディオに必要なインターフェースを得ることは、費用がかかる。２種類のヘッドホン、オープン型ヘッドホン及びクローズ型ヘッドホンが存在する。オープン型ヘッドホンは、周囲のノイズに対する減衰が少ないという特有の長所を有し、このことがオーディオ素材の細部の聴取を妨げる可能性がある（そして周囲の音響さえもヘッドホンのオーディオに影響を与え得る）が、オープン型ヘッドホン設計は、時としてクローズ型ヘッドホンの設計に関連する「ボックス」音（オーディオ色づけ（audio colorations））及び制限された低周波数拡張を防ぐと言われている。また、クローズ型ヘッドホンでは、ユーザの聴覚はイヤーカップ領域に限定され、したがって、ユーザ間の通信は困難であり得る。

[0003] ラウドスピーカーを用いて行われた作業を補完して継続するためにヘッドホンが使用される場合、ヘッドホンの較正が室内におけるラウドスピーカーベースのモニタシステムの音と同じ音特性を有し、その結果、あるシステムから別のシステムに切り替えるときに音質が一定に保たれるように、ヘッドホン及び関連する信号処理を設計する必要がある。

[0004] 本発明は、アクティブモニタリングヘッドホン（ＡＭＨ）及びその較正方法に関する。

[0005] 本発明は、独立請求項の特徴によって定義される。いくつかの特定の実施形態は、従属請求項において定義される。

[0006] 本発明の第１の態様に従えば、メモリと信号処理特性を有する増幅器を含むアクティブモニタリングヘッドホンを自動較正する方法が提供され、この方法は、ヘッドホン（１）のための所望の音属性を決定するためのステップと、ヘッドホンのユーザから受信された入力情報に基づいてまたは測定によって、所望の音属性を得るために増幅器（２）における信号処理パラメータ及び較正アルゴリズムを設定するためのステップを備える。

[0007] 本発明の第２の態様に従えば、音属性が次の特徴：「周波数応答」、「時間応答」、「位相応答」または「音レベル」のうちの少なくとも１つを含む方法が提供される。

[0008] 本発明の第３の態様に従えば、周波数応答のような所望の音属性が、特定のルームについてのラウドスピーカーシステムの較正パラメータに基づいて、及び室内の音響測定に従って決定される方法が提供される。

[0009] 本発明の第４の態様に従えば、以下の方法が提供される、テスト信号が、ソフトウェアまたはハードウェアインターフェースを介して開始され、増幅器またはインターフェースデバイスによって生成され、及び、第１のサブバンド（Ｂ_１）を通じてラウドスピーカーによって再生され、テスト信号は、第１のサブバンド（Ｂ_１）を通じてヘッドホン（１）によって再生され、第１のサブバンド（Ｂ_１）を通じてラウドスピーカーによって再生されたテスト信号で、第１のサブバンド（Ｂ_１）を通じてヘッドホン（１）によって再生されたテスト信号の音レベルのような音属性を評価し、サブバンドＢ_１でのラウドスピーカーと本質的に同じであるようにヘッドホンの音レベルのような音属性を設定して記憶し、複数のサブバンドＢ_１乃至Ｂ_ｎを通じてテスト信号で上述の工程を繰り返す。

[0010] 本発明の第５の態様に従えば、テスト信号がピンクノイズである方法が提供される。

[0011] 本発明の第６の態様に従えば、テスト信号が広域スペクトルコンテンツを有するオーディオ信号を含む音楽的なオーディオファイルであることが提供される。

[0012] 本発明の第７の態様に従えば、テスト信号の持続時間が１乃至１０秒である方法が提供される。

[0013] 本発明の第８の態様に従えば、テスト信号が連続的に繰り返されることが提供される。

[0014] 本発明の第９の態様に従えば、ヘッドホンと、ケーブルによってヘッドホンに接続された増幅器とを含むアクティブモニタリングヘッドホンシステムが提供され、そのシステムは、サーカムオーラル型のイヤーカップと、増幅器（２）における信号処理のための手段と、増幅器（２）において少なくとも２つの所定の等化設定を記憶するための手段と、２００Ｈｚより下の周波数でノイズキャンセリングするための手段とを備える。

[0015] 本発明の第１０の態様に従えば、ヘッドホンとヘッドホン増幅器とがケーブルによって互いに接続された別個の独立ユニットである、アクティブヘッドホンシステムが提供される。

[0016] 本発明の第１１の態様に従えば、ヘッドホンの各ドライバまたはイヤーカップが、設定された基準イヤーカップまたはドライバに対して工場較正され、増幅器のメモリに記憶されるアクティブヘッドホンシステムが提供され、それによって、工場較正は、ヘッドホンシステムにおけるすべてのイヤーカップを、設定された基準イヤーカップまたはドライバに基づいて、音響的に本質的に同じにする、例えば、同じ応答、同じラウドネスにする。

［0017］本発明の第１２の態様に従えば、ヘッドホン増幅器とヘッドホンとが工場較正に基づいて固有のペアであるアクティブヘッドホンシステムが提供される。

［0018］本発明の第１３の態様に従えば、ヘッドホン等化のためのステレオヘッドホン伝達関数の反転を正規化する方法が提供され、それは、等化のための次の式
を使用することを特徴とし、この式において、
・
は、シグマ反転であり、
・Ｈ^*（ω）は、応答の複素共役であり、
・Ｄ（ω）は、因果的反転（causal inverse）
を生成するために導入される遅延フィルタであり、
・Ｈ^*（ω）は、応答であり、
・α（ω）は、ヘッドホンの再生帯域幅であり、
・σ（ω）は、その帯域幅内で必要とされる正則化の推定値である。

［0019］本発明の第１４の態様に従えば、項β|Ｂ（ω）|^２は応答が正確に反転されるように、周波数依存パラメータ
である、請求項１に記載の方法が提供され、狭いノッチや再生のヘッドホン帯域幅外の周波数では反転の影響が望ましくなく、パラメータ
は、ヘッドホン再生帯域幅の推定値α（ω）とその帯域幅内で必要とされる正則化の推定値σ（ω）、とを組み合わせて決定され、パラメータ
を定義し、それは次に、
（５）
として定義され、ここにおいてパラメータα（ω）は、α（ω）がゼロに近いかゼロに等しい周波数範囲として定義される反転の帯域幅を決定し、新しい正則化係数σ（ω）は、α（ω）によって定義される帯域幅内の反転の影響を制御し、ヘッドホン帯域幅が既知である場合、α（ω）はユニティゲインフィルタＷ（ω）を用いて、
（６）
として定義され、それにより、Ｗ（ω）のフラットな通過帯域は、再生ヘッドホン帯域幅、高品質のヘッドホンに関しては典型的には２０Ｈｚ乃至２０ｋＨｚに相当し、同様に、ノイズパワースペクトル推定値が利用可能である場合、α（ω）は
（７）
として定義され、応答における隣接する周波数ビン間の強い変動を避けるために、雑音包絡線の推定値Ｎ（ω）、例えば平滑化されたスペクトルが使用されるべきであり、新しい正則化係数σ（ω）、はノッチのマグニチュード
を減じる応答からの測定された応答Ｈ（ω）の負の偏差として、定義され、例えば、
は、ヘッドホン応答の平滑化されたバージョンを使用して定義されることができ、これに基づいて、σ（ω）は、
（８）
として決定され、したがって、
に関してσ^２（ω）＞０であり、パラメータ
は、平滑化ウィンドウよりも狭いノッチ周波数で大きな正則値を含む。
請求される発明は、耳のすぐ近くの物理的な音再生における最小限の変動によって、第１の聴取環境（ラウドスピーカー）から第２の聴取環境（ヘッドホン）への変換器（ドライバ）についての音をどのように等化するかの技術的影響に関する。
換言すれば、本発明は、ラウドスピーカーに関して生成された音情報を、聴取者の耳での最小限の変動で、ヘッドホンドライバに対してどのように等化するかの技術的解決策を生成する。

[0020] 図１は、本発明の少なくともいくつかの実施形態に従った１つのアクティブヘッドホンを示す。 [0021] 図２は、本発明に従ってどのようにオーディオ信号がサブバンドに分割され得るかのグラフを示す。 [0022] 図３は、本発明に従って１つの較正方法の一実施形態をブロック図として示す。 [0023] 図４は、本発明に従って電気機器の一実施形態をブロック図として示す。 [0024] 図５は、本発明に従ってソフトウェアの一実施形態のブロック図を示す。 [0025] 図６は、本発明に従ってシステムの第１のレイアウトを示す。 [0026] 図７は、本発明に従ってシステムの第２のレイアウトを示す。 [0027] 図８は、ヘッドホンの等化における再配置の影響を示す。式１を用いたヘッドホン応答のインバースフィルタは、ヘッドホンを再配置した後に測定される２つの応答を補償するために使用される。２ｋＨｚより下の周波数については顕著な違いはない。 [0028] 図９は、直接反転（ＤＩ）、β＝０．０１（ＲＩ）で正則化された反転（regularized inverse）、及びウィーナーデコンボリューション（ＷＩ）を用いたヘッドホン応答の反転を示す。 [0029] 図１０は、式６（実線）及び式７（点線）を用いて定義されたα（ω）に対する正則化パラメータβ（ω）の値を示し、は、ヘッドホン応答の半オクターブ平滑化されたバージョンである。
[0030] 図１１は、直接反転（点線）及び提案されるシグマ反転方法（実線）を用いたヘッドホン応答の反転を示す。 [0031] 図１２ａは、開いた外耳道の内部に配置された小型マイクロホンの概略図を示す。 [0032] 図１２ｂは、ヘッドホンを配置するときのマイクロホンの移動を防ぐために、耳介（pinna）の周りで曲げられ、テープで２つのロケーションに固定されたマイクロホンリード線の画像を示す。 [0033] 図１３は、ウィーナーデコンボリューション（ＷＩ）、従来の正則化された反転（ＲＩ）、複合平滑化（ＳＭ）、及び提案される方法シグマ反転（ＳＩ）方法を用いてヘッドホン応答の反転を得るために、式９についてのパラメータを示す表を示す。 [0034] 図１４は、測定間にヘッドホンを再配置しながら４回測定されたヘッドホンの正規化された（normalized）マグニチュード応答を示す。被験者は、各測定の前にヘッドホンを取り外し且つ再着用した。最初の測定は反転（実線）のために使用される。他の３つの応答は、点線、一点短鎖線及び破線で示されている。２ｋＨｚより下の周波数では顕著な違いはない。 [0035] 図１５は、ウィーナーデコンボリューション（ＷＩ）、従来の正則化された反転法（ＲＩ）、複合平滑化法（ＳＭ）、及び提案されるシグマ反転法（ＳＩ）で得られる、インバースフィルタを使用して単一のヘッドホン応答を補償することの影響を示す。２ｋＨｚより下の周波数については顕著な違いはない。 [0036] 図１６は、ウィーナーデコンボリューション（ＷＩ-一番上のボックス）、正則化された反転法（ＲＩ-上から２番目のボックス）、複合平滑化法（ＳＭ-上から３番目のボックス）、及び提案される方法（ＳＩ-一番下のボックス）で得られる、インバースフィルタを使用してヘッドホンを３回異なる時間で再配置した場合の補償される応答の安定性を示す。第１、第２及び第３の測定値に対応する補償されたる応答は、それぞれ実線、点線及び破線で示される。２ｋＨｚより下の周波数については顕著な違いはない。 [0037] 図１７は、各反転法：ヘッドホン等化無し（ＮＦ：No headphone equalization）、従来の正則化された反転（ＲＩ）、平滑化法（ＳＭ）、及び提案される方法（ＳＩ）、について１０人の被験者にわたって得られた平均スコアμ及び標準偏差（ＳＤ）を示す表を示す。 [0038] 図１８は、Games-Howell手順を用いた多一致テストのｐ値を示す表を示す。これらの方法は、次のように識別される：ヘッドホン等化無し（ＮＦ）、従来の正則化された反転（ＲＩ）、平滑化法（ＳＭ）、及び提案される方法（ＳＩ）。 [0039] 図１９は、１０人の被験者にわたって計算された反転法の平均及びそれらの９５％の信頼区間（confidence interval）を示す。この方法は、ヘッドホン等化無し（ＮＦ）、従来の正則化された反転（ＲＩ）、平滑化法（ＳＭ）、及び提案される方法（ＳＩ）である。 [0040] 図２０は、ラウドスピーカーステレオセットアップのバイノーラルレンダリングの概略図を示す。 [0041] 図２１は、中心に配置されたファントム音源のヘッドホン上でのバイノーラルステレオ再生の概略図を示す。 [0042] 図２２は、中央に配置されたファントム音源のステレオ信号のヘッドホン上での直接再生の概略図を示す。耳が１つのみ示されている。 [0043] 図２３は、左に完全にパンされたファントム音源のヘッドホン上でのバイノーラルステレオ再生の概略図を示す。 [0044] 図２４は、中央に位置決めされるファントム音源の応答の等化でのヘッドホン上でのバイノーラルステレオ再生の概略図を示す。 [0045] 図２５は、フィルタ（実線）及び
（破線）によって導入されたゲインを示す。
[0046] 図２６は、オーディオエンジニアリング学会（Audio Engineering Society Conference）、第２２回国際協議会、「Virtual, Synthetic, Entertainment Audio」、2002年、のKirkeby、O.による「A Balanced Stereo Widening Network for Headphones」に基づいて、フィルタ（実線）及び
（点線）によって導入されるゲインを示す。
[0047] 図２７は、左耳における直接パスとクロストークパスとの総和（summation）後の等化されたフィルタの１オクターブ平滑化されたマグニチュード応答を示す。Ｈ_{ｂｉｎＥＱ}、Ｈ_ｐｈＥＱ、及びＨ_{ｒｏｏｍＥＱ＿}に対する応答は、それぞれ実線、破線及び点線で示されている。 [0048] 図２８は、空間品質テスト（テスト１）についての事後テストの結果を示す表を示す。低いアンカーは分析から除外された。２×１０^−３より小さいｐ値は０に切り下げられ、α＝０．０５より大きいｐ値は太字で示される。 [0049] 図２９は、空間品質テスト結果を示す。テスト１における各ケースについて得られたスコアの四分位数及び中央値。ボックスにおけるノッチは、中央値についての９５％の信頼区間を示す。Ｈ_ｂｉｎ＿が基準として使用された（スコア＝１００）} [0050] 図３０は、音色／音バランス品質テスト（テスト２）についての事後テストの結果を示す表を示す。低いアンカーは、分析から除外された。２×１０^−３より小さいｐ値は０に切り下げられ、α＝０．０５より大きいｐ値は太字で示される。 [0051] 図３１は、音色／音バランス品質テストの結果を示す。テスト２においてケースごとに得られたスコアの四分位数及び中央値表現。ボックスにおけるノッチは中央値についての９５％の信頼区間を示す。ヘッドホン上でのステレオ信号の直接再生が、基準として使用された（スコア＝１００）} [0052] 図３２は、全体の品質テスト（テスト３）についての事後テストの結果を示す表を示す。低いアンカーは、分析から除外された。２×１０^−３より小さいｐ値は０に切り下げられ、α＝０．０５より大きいｐ値は太字で示される。 [0053] 図３３は、全体の品質テストの結果を示す。テスト３においてケースごとに得られたスコアの四分位数及び中央値表現。ボックスにおけるノッチは、中央値についての９５％の信頼区間を示す。

[0054] 定義

[0055] 本文脈において、用語「可聴周波数範囲（audio frequency range）」は、２０Ｈｚから２０ｋＨｚまでの周波数範囲である。

[0056] 本文脈において、用語「サブバンド」Ｂ_ｎは、可聴周波数範囲よりも狭い可聴周波数範囲内の通過帯域を意味する。

[0057] 本文脈において、「音特性を評価する」の定義は、マイクを使用することによる測定か、人による主観的な決定のいずれかを意味する。

[0058] 本文脈において、「音属性」の定義は、「周波数応答」、「時間応答」、「位相応答」、「ボリュームレベル」、及び「サブバンド内の周波数強調」の定義を含む。

[0059] ラウドスピーカーを用いて行われるモニタリング作業を補完し継続するためにヘッドホンが使用される場合、ヘッドホンの較正が室内におけるラウドスピーカーベースのモニタシステムの音と同じ音特性を有するように、ヘッドホン及び関連する信号処理を設計する必要がある。これは、あるシステムから別のモニタリングシステムに切り替えるときにモニタリング品質ができるだけ一定に保たれることを確実にするために必要である。

[0060] 図１は、本発明の少なくともいくつかの実施形態に従って１つのアクティブモニタリングヘッドホンを示しており、両耳用ドライバを備えたアクティブモニタリングステレオヘッドホン１は、接続ケーブル３の支援によってヘッドホン増幅器２に接続されている。ブロック６０は、この実施形態の特徴を説明しており、すなわち、本発明の少なくともいくつかの実施形態に従えば、ヘッドホン１の各ドライバが、各耳用のドライバシステムが個別に基準と同じ応答を有する状態にするために前述の基準に対して電気的に等化されるという工場較正、各耳用のドライバシステム間のいかなる相違も除去すること、並びに、ユーザが高すぎる音レベルから保護されるダイナミクス制御を説明する。

[0061] １つの好ましい実施形態では、ヘッドホンは、２つのイヤーカップを含み、それらの各々は、使用されるカップのタイプが可聴周波数範囲ではクローズ型であるように、すべての側面から耳を取り囲み（サーカムオーラル型）、周囲の音やノイズに対する音響減衰を提供する、というようなものである。本発明に従ったヘッドホンケーブルのコネクタは、４つ（またはそれ以上）のピンコネクタであり、電子信号がヘッドホン内の各ドライバに別個にアクセスすることを可能にする。そして、ヘッドホンの各イヤーカップ内に２つ以上のドライバが使用されている場合、ヘッドホン増幅器は、較正とクロスオーバーフィルタリングを個別に適用できる。

[0062] エンハンストアクティブＬＦ（低周波数）アイソレーション（ＥＡＩ）は、イヤホンカップの外側または内側に取り付けられたマイクロホンを使用し、それは、ヘッドホンケーブルにおいて追加の導体を備えており、ヘッドホン増幅器がマイクロホン信号にアクセスすることを可能にする。ヘッドホン増幅器は、周波数選択性ゲインでマイクロホン信号を反転及び増幅し、この反転された信号を、イヤホンカップ内部に漏れるノイズが減衰されるかまたは完全に除去されるように、ヘッドホンドライバへの信号供給に加える。ゲインの周波数選択性は、この減衰が、主に低周波数、より具体的には５００Ｈｚより下の周波数で機能することを可能にする。このようにすることで、クローズ型ヘッドホン設計の典型的な減少する（reducing）受動的減衰が低周波数へと強化され、ヘッドホン増幅器と組み合わせて、低周波数も大幅に減衰させるヘッドホンを生成する。

[0063] 典型的には、ヘッドホンの機械的低周波音アイソレーションは良好ではない。本発明のいくつかの実施形態は、ＬＦアイソレーションを向上させるために電子エンハンスメントを使用し得る。その目的は、ＬＦでのオーディオ詳細のより詳細な聴取を可能にすることである。典型的に、このエンハンスメントは２００Ｈｚ（波長１．７ｍ）より下の値で動作する。実際の実施では、少なくとも１つのイヤホンカップは、マイクロホンを含む。マイクロホンの帯域幅は、中音域でのノイズ増加をなくすように制限される。マイク信号（mic signal）は、ヘッドホンケーブルを介して、ヘッドホン増幅器に送り返される。イヤホン内部で聞き取られる低周波レベルを低減するために、増幅器のアナログ部分に負のフィードバックが与えられる。低周波ではイヤホンのアイソレーションが増大するようである。その結果、本発明に従ったヘッドホンの明らかな遮音は、従来技術よりも優れているようである。

工場較正

[0064] １つの好ましい実施形態では、工場較正は、ヘッドホンのすべてのドライバに対して使用される。工場較正は、ヘッドホンにおけるすべてのイヤーカップを、設定された基準ドライバまたはイヤーカップに基づいて、まったく同じ、同じ応答、同じラウドネスにする。これはまた、各イヤホンカップの感度をまったく同じに設定する。工場較正は、個々のヘッドホン及びヘッドホンのイヤーカップごとに固有のものであり、したがって、ヘッドホン増幅器及びヘッドホンは増幅器のような固有のペアであり、エンクロージャは、アクティブモニタスピーカー用であり得る。したがって、いかなるヘッドホン増幅器もいかなる他のアクティブヘッドホンと混合することはできない。これらの工場較正されたヘッドホンは、特定のヘッドホン増幅器ユニットを備えたシステムを構成し、それらは、デバイスにおける通常のヘッドホン出力またはサードパーティ増幅器では使用できない。

ルーム較正、バージョン１

[0065] これは、ヘッドホン音特性のルーム較正がない測定であることができる方法である。この較正は、リスニングルームにおいてユーザによって繰り返し設定されることができる。セットアップについては図５を参照し、方法については図２及び図３を参照すると、ルーム較正は、アクティブモニタリングヘッドホン増幅器２におけるフィルタを設定する。アクティブヘッドホン増幅器２に接続されたソフトウェアは、テスト信号を提供し、較正中の測定プロセスの進行を示す。これは、ヘッドホン増幅器２に接続されたＰＣまたはＭＡＣ５１のようなコンピュータに設けられたユーザインターフェースによって行われる。テスト信号は、アクティブヘッドホン増幅器２に供給され、グラフィカルユーザインターフェースがプロセスを案内する。ユーザは、ユーザインターフェースによってソフトウェアにおけるフィルタ設定を調整し、テスト信号の音ボリュームなどの音属性がラウドスピーカーシステムと同じであるように、アクティブモニタリングヘッドホン増幅器２の設定を行う。モニタリングラウドスピーカーシステム較正テスト測定及び等化セットアップは、アクティブモニタリングヘッドホン音属性を調整するための基準として使用される。基準テスト信号は、記憶された又はリアルタイムの測定に基づいて異なるセットアップの設定を含むことができる。ユーザは、ソフトウエアユーザインターフェースが、変化が非常に小さくまたはランダムであることすなわち、体系的な改善が行われていないことを検出し、これが処理を終了するまで、いつでもモニタリングラウドスピーカーシステムとヘッドホン１とを切り替えることができる。図２及び図３に従えば、セットアップ手順は、オーディオ帯域幅の異なるサブバンドＢ_１乃至Ｂ_ｎを通じて進み、完全なオーディオ帯域にわたって等化を行う。このプロセスでは、ラウドスピーカーシステムで、モニタリングルーム音カラーと同様の周波数応答のようなアクティブモニタリングヘッドホン増幅器２の音属性を、設定する。

[0066] 換言すれば、ヘッドホン１のユーザは、異なる周波数範囲にわたってテスト信号でアクティブモニタリングヘッドホンとラウドスピーカーとを交代で聴く。これは、オーディオ周波数範囲が図２に従って複数のサブバンドＢ_１乃至Ｂ_ｎに分割されるようにテスト信号がバンドパスフィルタでフィルタリングされることを意味する。ユーザは、複数のサブバンドＢ_１乃至Ｂ_ｎを通じてテスト信号を聴き、各サブバンドＢ_１乃至Ｂ_ｎのヘッドホンの音レベルのような音属性を、同じ帯域を有するラウドスピーカーシステムと同じに調整する。この評価は、ヘッドホン１が人工頭部に着脱され、人工頭部のマイクロホンからの出力がモニタであるようにマイクロホンを含む人工頭部を用いる測定によっても為されることができる。この手順は、モニタリングラウドスピーカーシステムとアクティブヘッドホンとの間に本質的な相違がなくなるまで続き、そしてソフトウェアは、調整によって生成された設定を所定の設定の１セットとしてヘッドホン増幅器に記憶する。典型的には、サブバンドＢ_１乃至Ｂ_ｎの帯域幅Δｆは１オクターブである。音属性として、サブバンドＢ_１乃至Ｂ_ｎ内で周波数調整が、サブバンドＢ_１乃至Ｂ_ｎ内での低周波数または高周波数のいずれかが強調されるように使用されることもできる。

[0067] テスト信号は、有利には、以下の信号を含むwavファイルである。
a．ピンクノイズ、換言すれば、信号のパワースペクトル密度（エネルギまたはパワー／Ｈｚ）が信号の周波数に反比例する。ピンクノイズでは、各オクターブ（周波数の半分／倍音）が同量のノイズパワーを搬送する。
b．あるいは、テスト信号は、典型的には、基本的にサブバンドの周波数範囲をカバーするスペクトル的に広い周波数領域にわたって周波数成分を含む音楽的な信号の擬似シーケンスであり得る。
c．擬似シーケンスが繰り返され、調整のためのサンプル基準を生成し、繰り返し前の持続時間は典型的に１乃至１０秒である。

[0068] ユーザインターフェースに関連して、この較正プロセスは、以下の方法で説明され得る。
・測定フリー較正により、ユーザは、ラウドスピーカーシステムの音と同様の色（同じ音属性）になるように音を較正することが可能となる、
・プロセスは、例えば、ソフトウェアが生成する音に基づく、
・較正プロセスは次のように進行する
- コンピュータは、各サブバンドの音サンプル（これはwavファイルであることができる）を再生する
- このサンプルは、モニタまたはアクティブヘッドホンのいずれかで、ソフトウェア制御下で再生される
- ソフトウェアは、ユーザがモニタシステム出力でヘッドホンにおいてレベルを同様にするように調整する、グラフィカルユーザインターフェースを提示する
- これは、左右の（または周囲の）システムに対してまとめて行われる
- ソフトウェアは、あるサブバンドから次のサブバンドへと、すべてがカバーされるまで進む
- ユーザは結果を評価し、アクティブヘッドホン増幅器２のメモリに較正を保存する

ルーム較正、バージョン２

[0069] 若しくは、較正は、測定によって行われることができる。これは、ヘッドホンの音特性をルーム較正する測定ベースの方法である。このタイプのルーム較正は、モニタリングラウドスピーカーシステムとマイクロホンの支援によって、ソフトウェア較正がリスニングルームを測定した後に設定されることができる。ここでは、リスニングルームのインパルス応答を決定するためにマイクロホン測定が使用される。インパルス応答は、ルーム周波数応答の計算を可能にする。ルーム較正測定値は、アクティブモニタリングヘッドホン増幅器２においてフィルタを設定するために使用される。この方法は、測定されたルーム応答と一致するように、アクティブモニタリングヘッドホン増幅器の出力信号属性を設定する。この方法は、ルーム応答の主な特徴をモデル化する。ユーザは、モデリング精度の精度を選択できる。ルームモデルは、最初の３０ミリ秒間のＦＩＲ、及び残りのルーム減衰のための５つのサブバンドにおけるＩＩＲ（無限インパルス応答）残響モデルである。ＦＩＲ（有限インパルス応答）は、ルームＩＲに適合する。サブバンドＩＩＲは、検出された減衰特性及びサブバンド内のスピードに適合する。典型的に、外在化フィルタが適用される。ユーザの相互作用は不要である。

[0070] 外在化に関連して、以下の手順が、本発明に関連する１つの選択肢である。外在化フィルタは、オールパスフィルタであるようにバイノーラルフィルタとしてインプリメントされる。換言すれば、一定のマグニチュード応答（マグニチュード／振幅は周波数の関数として変化しない）を有するフィルタ、しかし、バイノーラルフィルタの位相応答のみが、インプリメントされる。この種類またはフィルタは、有利にはＦＩＲフィルタとしてインプリメントされることができるが、理論的には、ＩＩＲフィルタと同じ結果が得られ得る。フィルタの度合いが高いため、ＩＩＲインプリメンテーションは常に実用的であるわけではない。この手法を用いると、いくつかの利点が得られる。すなわち、マグニチュードの反転が通常のバイノーラルフィルタを用いてモデル化される場合、明瞭に聴き取れる着色（clearly audible coloration）が容易に生成される。これは、本発明に従ったオールパスのインプリメンテーションによって回避されることができる。さらに、オールパスソリューションは、大きなゲインをもたらさず、それによりダイナミクスの要件は最小限である。オールパスインプリメンテーションは、測定が行われた空間の経験を有する外在化を生成する。さらに、オールパスインプリメンテーションは、通常のバイノーラルフィルタのようなＨＲＴＦフィルタの形状にはあまり敏感ではなく、それによって第三者の頭部で行われた測定も使用することができる。結果として、ユーザは、使用されている聴取空間に最も近い対応するデフォルト外在化フィルタを提供され得る。

[0071] このルーム較正は、例えば以下のようにしてラウドスピーカーに対して実施され得る。

[0072] 工場較正された音響測定マイクロホンは、ラウドスピーカーごとに音レベルをアラインさせ、距離差を補償するために使用される。適切なソフトウェアは、音響設定の完全な手動の制御で、測定された応答、フィルタ補償、及び各ラウドスピーカーの結果としてのシステム応答の正確且つグラフィカルな表示を提供する。シングルまたはマルチポイントのマイクロホン位置は、１人、２人、または３人の混合する環境に対して使用され得る。

[0073] ソフトウェアの観点から、この較正は以下の方法で提示されることができる。
・較正は、アクティブヘッドホン１の音を、ユーザが以前に測定されたラウドスピーカーモニタリングシステムの音と同様であるように設定する。
- 較正プロセスは次のとおりである。
-ユーザは、適切なソフトウェア（ＧＬＭのような）を作動させているコンピュータ５１に接続されたアクティブヘッドホン増幅器２を有する。
- ユーザが既存のシステム較正を選択する
- ソフトウェアが左右のモニタ応答を選択する
- ソフトウェアがアクティブヘッドホンの音をモニタラウドスピーカーの音と同様にするために、フィルタ設定を計算する
- 早期反射、サブバンド減衰、音色、及び外在化フィルタ設定を含む
- ユーザは、等化結果を聞き取り、これらの設定をアクティブヘッドホン増幅器のメモリに永続的に保存することができる

[0074] 図４は、本発明の少なくともいくつかの実施形態をサポートすることができる例示的な装置を示す。図４に従えば、ヘッドホン増幅器２は、アナログオーディオ信号を受信するためのアナログ入力３５を含む。この信号は、アナログ／デジタルコンバータ３６によってデジタル形式に変換され、デジタル信号処理ブロック３７に供給された後、そのデジタル信号は、増幅された信号をヘッドホン１のドライバに供給するパワー増幅器３９及び４０に供給されるように、アナログ形式に変換して戻される。ヘッドホン増幅器２はまた、ローカルの簡単なユーザインターフェース３４を含み、それは、カラー信号灯または小さなディスプレイを有するスイッチまたは回転ノブであることができる。さらに、ヘッドホン増幅器２は、電源及びバッテリー管理システム３２に電気パワーを入力することができるＵＳＢコネクタ３３を含み、それは、充電サブシステム３１に、そこからバッテリー３０に、パワーをさらに供給し、ヘッドホン増幅器２の電子機器のためのプライマリ電源として使用される。ＵＳＢコネクタ３３は、デジタル信号処理ブロック３７のデジタル入力としても使用される。

[0075] 図５は、本発明の少なくともいくつかの実施形態をサポートすることができる例としてのソフトウェアシステムを示す。図５に従えば、ソフトウェアは、ルーム較正を扱うためのAutoCalルームイコライザ４１のためのソフトウェアモジュールと、ヘッドホン１のカスタマイズされた等化を生成するためのEarCalユーザイコライザ４２のためのソフトウェアモジュールとを含む。工場等化モジュール４３は、ヘッドホン増幅器２のメモリに記憶された工場等化を表し、ヘッドホンの各ドライバは、工場を出る各ヘッドホン１ヘッドホン増幅器２のペアが基本的に同様の音属性を有するオーディオ信号を生成するように、基準に対して工場較正される。加えて、ソフトウェアパッケージは、ＵＳＢインターフェース機能４７、ソフトウェアインターフェース（ＧＬＭ）機能４８、メモリ管理機能４９及びパワー及びバッテリー管理機能５０のためのソフトウェア機能を含む。

一時的な（Casual）ヘッドホンの使用

[0076] 図６及び図７に従えば、アクティブモニタリングヘッドホン１は、ケーブル３によってヘッドホン増幅器２に接続されている。増幅器２は、ケーブル５２によって、プログラムソース５１、５６のライン出力またはモニタ出力に接続されている。プログラムソースは、コンピュータプラットフォーム５１を含む、専門家または消費者、ポータブルデバイス５６、であり得る。ユーザはアクティブモニタリングヘッドホン増幅器２をオンにし、信号属性を調整する。

[0077] 本発明のいくつかの実施形態に従えば、図６のように、ヘッドホン増幅器２をコンピュータＵＳＢコネクタに取り付けること、及び適切な（例えばＧＬＭ）ソフトウェアをインストールすることが必要である。ユーザは、ユーザインターフェースにおいて「ヘッドホン」ページにナビゲートする。使用可能なオプションは、例えば次の通りである。
・すべてがディム（dim）、プリセットなどを関連付けるボリューム制御
・（中央の音像を設定するための）パーソナルバランス制御
・音特性プロファイル調整
・スタートアップボリュームセット機能
・ＩＳＳ制御機能（スリープするまでどのくらいの時間がかかるか）
・最大ＳＰＬリミット機能（聴覚保護）オン／オフ、リミット調整
・ＥＡＩ（エンハンストＬＦアイソレーション）オン／オフ機能、並びに、アイソレーションレベル（フィードバック）の量の低／中／高制御
・これらの設定をアクティブヘッドホン増幅器に永続的に保存する機能

較正の切り替え

[0078] ユーザがアクティブヘッドホン増幅器に較正を記憶している場合、図６及び図７を参照して等化を選択することが可能である。ボリューム制御のようなスイッチで、較正の１つは、例えば、以下のようにして選択され得る：ボリューム制御５４を押し下げ（クリックし）、ボリューム制御を回して等化を選択する（ｅｑ無し（no eq）またはヘドニスティックなｅｑ（hedonistic eq）が設定される、等化法１、等化法２）、ボリューム制御を解除することによって、等化が選択される。

[0079] 基本システム品質における本発明のいくつかの実施形態の利点は以下の通りである：専用の且つ個々に等化されたヘッドホン増幅器２が含まれる。工場等化は、ユニット間の音質の違いを解消する。イヤホンカップ間には（ランダムに変化する）ユニット間の違いがなく、常にバランスが維持される。他のほとんどのヘッドホンとは異なり、オーディオ再生は常に中立である。加えて、遮音性（中高周波数でのクローズカップによる受動アイソレーション、低周波数での向上されたアイソレーションについての能力）が優れている。ルーム等化（方法１及び２）は、例えばスタジオ内でない場合における、ヘッドホン上での正確且つ信頼性の高い作業のために、既存のモニタリングシステムの音特性のエミュレーションを可能にする。バッテリー容量と電子機器の設計により、増幅器を電源に接続しない動作が全作業時間中可能となる。

[0080] 説明される実施形態に従えば、いくつかの利点が得られる。ヘッドホンとは別個の増幅器モジュールにおける電子機器による解決策により、（手動での）ボリューム制御が可能となり、バッテリー（パワーハンドリング）や電子機器に対するスペース制限がない。この解決策では、必要なすべての入力タイプと接続が使用されることができる。同様に、含まれることができる信号処理には制限がない。

[0081] この解決策は、ＵＳＢコネクタからパワー供給されることができる。個々の増幅及びケーブル接続は、例えば、ヘッドホンケーブルにおいて導体が共有される場合に起こり得る、ドライバ間のいかなる干渉も防ぐ。アクティブヘッドホンにおける信号処理は、非常に線形であることができる。ヘッドホンにおける各耳／ドライバは、基準に対して個々に工場等化されることができ、したがって、各ドライバは、完全にフラット且つニュートラルな応答を提供することができる。各耳用のマルチウェイドライバの場合、理想的な性能を有するように、マルチウェイシステムのクロスオーバが為され得る。消費者による較正（customer calibration）が可能である。基準システム（例えば、リスニングルーム）と同じように聴こえるように、ヘッドホンの較正、並びに、ヘドニスティック較正（hedonistic calibration）（例えば、好ましい音、応答プロファイル）が可能である。この較正は、自動化されることができる。

ヘッドホン伝達関数反転についての自動正則化パラメータ

[0082] ヘッドホン等化のためのヘッドホン伝達関数の反転を自動的に正則化する方法が提案される。この方法は、半オクターブ平滑化の前後の測定された応答を比較することによって、正則化の量を推定する。したがって、正則化はヘッドホン応答のみに依存する。この方法は、ａｔノッチ周波数での平滑法を用いて、測定された応答を反転させる従来の正則化された反転方法の精度を、反転の知覚上のロバスト性と、組み合わせる。バイノーラル再生適用のためのヘッドホンを等化するために主観的に許容可能な自動正則化を得るための提案される方法の有効性を確認するために、主観的な評価が実行される。その結果は、提案される方法が、固定された正則化係数または半オクターブ平滑化ウィンドウと共に使用される複合平滑化法で使用される正則化された反転方法よりも知覚的により良好な等化を生じさせることができることを示す。

[0083] バイノーラル合成（synthesis）は、聴取者が元の音場にいると知覚することができるのと同じ聴覚印象をレンダリングするためのオーディオのヘッドホン提示を可能にする。ヘッドホン上に提示された仮想音源を特定の方向に配置するために、音源音の無響レコーディングが、意図された音源位置から聴取者の耳までの音響パスを表すフィルタでコンボリューションされる。これらのフィルタは、バイノーラル応答として知られている。無響表現の場合、これらの応答は、頭部関連インパルス応答（ＨＲＩＲ：head related impulse responses）として知られている。残響表現の場合、これらはバイノーラルルーム応答（ＢＲＩＲ）と呼ばれる。バイノーラル応答は、聴取者の耳道、バイノーラルマイクロホン（人工頭部）の耳道における測定によって、またはコンピュータシミュレーションによる測定によって、得ることができる。バイノーラル応答のスペクトル特性を維持するために、ヘッドホン伝達関数（ＨｐＴＦ）が、オーディオがヘッドホン上で提示される場合に補償されなければならない。これは、同じ位置で測定されるヘッドホン応答の反転（inverse）でバイノーラル応答をコンボリューションすることによって行われる。応答が各聴取者に対して個々に測定される場合、より良い結果が得られる。

[0084] ヘッドホン伝達関数は、典型的には、ヘッドホンと聴取者の耳によって抑制されるボリューム内で生成される共鳴及び散乱によるピーク及びノッチを含む。ヘッドホンの複素周波数応答の直接反転
（１）
は、測定された応答がノッチを有する周波数において大きなピークを含む。ヘッドホン伝達関数測定で見られるピーク及びノッチは個人によって異なり、また、同じ被験者に対してもヘッドホンを外して再び着用するときに変化し得る。被験者が自身にヘッドホンを取り付ける場合に、ヘッドホンの再配置によるヘッドホン伝達関数の変動性は減じられるが、ヘッドホン伝達関数の直接反転を使用してヘッドホンを等化するプロセスは、音の着色をもたらし得る。さらに、深いノッチの正確な反転を適用することによって生成される大きなピークは、ヘッドホンの再配置によるノッチ周波数偏移、及びイコライザブーストが実際の応答におけるノッチの周波数及びゲインと一致しなくなるとき、共振リンギングアーチファクト（resonant ringing artifact）として知覚され得る。この影響は図８に示されており、再配置後に測定されたヘッドホンの２つのマグニチュード応答が、再配置前に測定された応答の直接反転（direct inversion）を使用して補償されている。図８に示される応答で見られる狭帯域共鳴（narrow band resonance）は、反転のために使用される応答におけるノッチ周波数とヘッドホンの再配置後に測定される応答におけるノッチ周波数とのミスマッチの結果である。このようなミスマッチの可聴性は、測定された応答におけるノッチを反転させることによってもたらされるピークのゲインを制限することによって最小限に抑えられることができる。

[0085] ノッチ反転の可聴効果を最小にするために、測定された応答を直接反転するように知覚的に動機付けされた修正が一般に採用されている。人間は同じマグニチュードとＱ係数のノッチよりも良いピークを知覚するため、反転は、ノッチが無視されるか反転の前にそれらのマグニチュードが減じられながら、測定された応答におけるピークが反転されるように行われる必要がある。反転に先立ってノッチのマグニチュードを減じる際に用いられる方法は、測定された応答を平滑化すること、ヘッドホンを再配置することで取られる複数の応答を平均化すること、または統計的手法を用いて全体の応答を近似させること、を含む。しかしながら、これらの方法は、残りの応答のための反転の精度に影響を与え得る。

[0086] 反転の正則化は、ノッチ反転の影響を低減しながら、応答の正確な反転を可能にする方法である。正則化パラメータは、特定の周波数での反転の影響を定義し、応答におけるノイズ及びノッチの反転を制限する。正則化パラメータは、音の主観的な劣化を最小限にするように選択されなければならない。しかしながら、正則化パラメータの適切な値は、反転される応答に依存し、したがって、値は、リスニングテストを使用して各反転に対して選択されなければならない。

[0087] この作業において、バイノーラル合成アプリケーションのためのヘッドホン応答を反転するときに周波数依存の正則化パラメータを自動的に得る方法が、提案される。提案される正則化の性能は、ヘッドホンの再配置に対する等化の安定性、及び大きなノッチを除いた応答反転の精度に関して、従来の正則化された反転、ウィーナーデコンボリューション、及び複合平滑化法と比較される。提案される正則化の主観的性能を確認するために、個別化されたバイノーラルルーム応答を用いて主観的評価が行われる。

ヘッドホン等化に適用される正則化された反転

[0088] 反転プロセスにおいて、ノッチの反転に与えられる影響を制限するために、周波数依存の正則化係数を導入することができる。正則化係数は、フィルタＢ（ω）で構成され、これは倍率βでスケーリングされる。応答Ｈ（ω）の正則化された反転
は、次のように表される。
（２）
ここにおいて、*は複素共役（complex conjugate）を表す。|・|は絶対値演算子であり、Ｄ（ω）は因果的反転（causal inverse）
を生じさせるために導入された遅延フィルタである。

[0089]
である場合、反転は正確であるが、
である場合、反転の影響は制限される。正則化の影響は図９に見ることができ、β＝０．０１とＢ（ω）＝１についての正則化された反転（実線）は、直接反転（点線）で表された大きな共鳴を除いて、ヘッドホン応答の正確な反転を生じさせる。さらに、この方法は、マグニチュードが正則化係数よりも小さい周波数での反転を防ぐので、３０Ｈｚより下の周波数に見られるように、ヘッドホンの有効な帯域幅外の周波数は反転されない。

[0090] パラメータβ及びＢ（ω）は、狭いノッチ以外の応答を正確に反転しながら、最小限の音質劣化を受けるように通常選択される。典型的には、Ｂ（ω）は、許容可能な主観的品質で反転に必要な帯域幅を評価することに基づいて定義され、結果として例えば３オクターブ平滑化されたバージョンの応答を反転させる、またはハイパスフィルタを使用する。そして、音質の劣化を最小限に抑えるためにＢ（ω）をスケーリングするために、リスニングテストを使用してβが調整される。S.G. Norcross、G.A. Soulodre、及びM.C. Lavoieの、 "Subjective investigations of inverse filtering"、J.Audio Eng. Soc、vol. 52、No. １０、pp. 1003−1028, 2004、においては、ラウドスピーカー応答の正則化された反転は、３つの異なるＢ（ω）フィルタ、すなわちフラットな応答、８０Ｈｚ及び１８ｋＨｚでのカット周波数を有するバンドストップフィルタ（band-stop filter）、及び１／３オクターブ（third octave）平滑化された応答の反転、を使用して評価された。次に、Ｂ（ω）ごとにβの異なる値がテストされた。S.G. Norcross、G.A. Soulodre、及びM.C. Lavoieの結果、「Subjective investigations of inverse filtering」J. Audio Eng. Soc、vol. 52、no. 10、pp.1003-1028,2004は、βの正しい値が、反転される応答と、正則化のために選択されるフィルタＢ（ω）に依存することを示している。さらに、バイノーラル再生のためのヘッドホン応答を反転する異なる方法の性能に関する研究は、専門家の聴取者によるβの調整がＢ（ω）に依存して異なる結果をもたらすことを示した。彼らの実験では、Ｂ（ω）は、ヘッドホン応答のオクターブ平滑化応答の反転として、または８ｋＨｚのカットオフ周波数を有するハイパスフィルタとして定義された。それにもかかわらず、専門家の聴取者によって調整された正則化を伴う正則化された反転を使用して得られるヘッドホン等化は、複合平滑化法を用いて得られる反転を使用して得られるヘッドホン等化よりも知覚
的に受け入れやすい。従って、Ｂ（ω）は先験的に選択することができるが、βは、反転されるべき応答、Ｈ（ω）及び正則化フィルタＢ（ω）に依存して調整されるべきである。

ウィーナーデコンボリューションとの関係

[0091] ノイズパワースペクトル
が既知である場合、式（２）の項
は、信号対雑音比（ＳＮＲ）の反転として推定されることができる、
（３）。

[0092] これが、ＳＮＲに関する反転の最適な帯域幅を提供するウィーナーデコンボリューションをもたらす。ウィーナーデコンボリューションフィルタ、
は、
（４）
として得られる。

[0093] ＳＮＲが大きい場合、ウィーナーデコンボリューションは直接反転に等しいが、反転のための最適な帯域幅を有する、なぜなら、大きなＳＮＲを有する帯域幅だけが正確に反転されるからである。これは、図９に示されており、ここにおいて、ウィーナーデコンボリューション（破線）を使用して計算された反転ヘッドホン応答（inverse headphone response）が示されている。この方法は反転の最適な帯域幅を提供するが、ノッチは正確に反転され、直接反転（点線）と同様の方法で大きな共鳴を生じさせ、したがってリンギングアーチファクトを生じさせる。反転された応答における大きな共鳴を防ぐために、スケール係数が適用されることができ、ウィーナーデコンボリューションを正則化された反転法と同等にすることができる（式２参照）。

提案される正則化

[0094] β|Ｂ（ω）|^２の項は、応答が正確に反転されるように周波数依存パラメータ
として定義されることができるが、狭いノッチに対して及び再生のヘッドホン帯域幅外の周波数では、反転の影響は望ましくない。パラメータ
は、ヘッドホン再生帯域幅α（ω）の推定と、その帯域幅内で必要とされる正則化の推定σ（ω）とを組み合わせて決定されることができる。

[0095] 次に、パラメータ
は、
（５）
として定義される。パラメータα（ω）は、反転の帯域幅を決定する、これは、α（ω）がゼロに近いかゼロに等しい周波数範囲として定義される。新しい正則化係数σ（ω）は、α（ω）によって定義される帯域幅内の反転の影響を制御する。

[0096] ヘッドホン帯域幅が既知である場合、α（ω）は、ユニティゲインフィルタＷ（ω）を用いて、
（６）
として定義されることができる。Ｗ（ω）のフラットな通過帯域は、再生のヘッドホン帯域幅、典型的には高品質のヘッドホンの場合には２０Ｈｚ乃至２０ｋＨｚに相当する。

[0097] 同様に、ノイズパワースペクトル推定が利用可能である場合、α（ω）は、
(７)
として定義されることができる。応答において近接周波数ビン間の強い変動を防ぐために、雑音包絡線の推定Ｎ（ω）、例えば平滑化スペクトルが使用されるべきである。

[0098] 新しい正則化係数σ（ω）は、ノッチのマグニチュード
を減少させる応答からの測定応答、Ｈ（ω）、の負の偏差として定義される。例えば、
は、ヘッドホン応答の平滑化されたバージョンを使用して定義されることができる。これに基づいて、σ（ω）は、
（８）
として決定されることができる。

[0099]
に対してσ^２（ω）>０であるため、パラメータ
は平滑化ウィンドウよりも狭いノッチ周波数で大きな正則化値を含む。一例として、図９で使用されるヘッドホン応答に関して得られる
が、図１０に示されている。
を得るためには、パラメータα（ω）が、式６を用いて決定され、ここにおいて、Ｗ（ω）が、それが２０Ｈｚ乃至２０ｋＨｚの帯域幅（実線）を制限するように、選択される。加えて、α（ω）もまた、式７（点線）を使用して決定され、ここにおいて、Ｎ（ω）は、測定されたヘッドホンインパルス応答の終わりから推定される。どちらのケースでも、
は、ヘッドホン応答の半オクターブ平滑化バージョンである。最大の正則化値は、図９に見られる直接反転における共鳴の周波数と一致する。正則化パラメータ
は、残りの応答に対して依然としてゼロに近いか、またはゼロに等しく、正確な反転を可能にする。α（ω）によって生じられる帯域幅制限は、２０Ｈｚより下の及び２０ｋＨｚより上の周波数で見られ、ここにおいて
は、大きい値を含む。式７（点線）を用いてα（ω）が定義される場合、反転帯域幅は、低周波数にわずかにより多く拡張し、それは、高周波では制限されないが、一方で、式６を用いて、反転帯域幅は、先に定義されたように、２０Ｈｚ乃至２０ｋＨｚに制限される。２０Ｈｚ乃至２０ｋＨｚの周波数については、
は、α（ω）を決定するためにいずれのアプローチを用いても同様の結果をもたらすことを確証する両方の方法において同様である。

[00100] 式５を式２に適用することによって、従来の正則化された反転式の提案される変更、シグマ反転
（９）
がもたらされる。

[00101] 提案されるシグマ反転法は、図１１において、図９で使用されるヘッドホン応答の直接反転と比較される。パラメータ
は、
をレンダリングするために使用され、図１０に実線で示されるパラメータである。ヘッドホン応答のノッチの正確な反転によって生成された共鳴は、提案される方法（実線）によって生成される反転には存在しない。さらに、規定された帯域幅外の周波数は補償されず、応答の他の部分は正確に反転される。

装置及び方法

[00102] このセクションは、提案される方法の性能を評価する際に実施される測定セットアップ及び信号処理を説明する。リスニングテストの設計及び評価測定もまた説明される。

測定セットアップ

[00103] 測定セットアップは、被験者の開口耳道内に配置され、オーディオインターフェース（UltraLite Hybrid 3、MOTU）に接続された２つの小型マイクロホン（FG−23329、
、Knowles）から成る。応答は、４８ｋＨｚのサンプリングレートでデジタル化される。マイクロホンは、バイノーラルフィルタでのヘッドホン負荷の影響を防ぐために、開口耳道内に配置される。小型のマイクロホンは、鼓膜に達しないように、ただし耳の周りのリードワイヤを曲げるときにそれらが所定の位置に留まるように十分に深く、耳道内に導入される（図１２ａ参照）。図１２ｂに示されるように、ワイヤをテープで２つの位置に固定することによって、ヘッドホンを耳上に置いたときにマイクロホンが動かないことを確実にするように、注意する。

正規化（Normalization）

[00104] スケール係数ｇを用いて、測定されたヘッドホン応答Ｈ（ω）は、
（１０）
となるように、単位エネルギーの事前の反転に正規化される。これにより、図９及び図１１に見られるように、反転を０ｄＢのレベルの中心に位置することを可能にし、反転される応答のマグニチュードが非常に小さい場合に、反転の帯域幅外の周波数で反転される応答における不連続性を防ぐ。反転後、元の信号ゲインを復元するために、応答がこのスケール係数に対して補償されることができる。さらに、この正規化によって、反転の帯域幅内でＢ（ｗ）＝１である場合、正則化を動的制限として定義することができる（例えば、β＝０．０１＝−２０ｄＢ）。従って、正規化された応答の反転は、図９に見られるように|β|−６ｄＢより大きい増幅を生成せず、ここにおいてβ＝０．０１＝−２０ｄＢの従来の正則化された反転は、１４ｄＢより大きくは増幅されない。

インバースフィルタ

[00105] 異なる方法のためのインバースフィルタは、式（９）を用いて、α（ω）及びσ^２（ω）の値を修正することによって、得られる。ウィーナーデコンボリューション、従来の正則反転、複合平滑化、及び提案されるシグマ反転正則化法を用いて反転応答を得るためのパラメータ値が、図１３に示される。この作業で使用されるすべての方法で同じ帯域幅を保証するために、α（ω）は式６を使用して定義され、ここにおいて、Ｗ（ω）は、２０Ｈｚ乃至２０ｋＨｚの一定のユニットゲインを有する。ウィーナーデコンボリューションは、式７を使用するが、結果として生じる帯域幅は、他の方法のそれと大きく異なることはない。正則化スケール係数βは、リスニングテストを使用した調整によって選択される。半オクターブ平滑化は、複合平滑化法及び提案されるシグマ反転方法と共に使用され、これらの方法を公正に比較する。この平滑化ウィンドウは、非公式のリスニングテストに基づいて選択される。半オクターブ平滑化は、オクターブ、１／３オクターブ、ＥＲＢ平滑化ウィンドウと比較して最小の音質劣化をもたらす。

[00106] 平滑化された応答Ｈ_ＳＭ（ω）は、ω_１で始まりω_２で終わる半オクターブ角窓（square window）、Ｗ_{ＳＭ,_}を用いて周波数領域でインプリメントされ、マグニチュード
（１１）
とアンラッピングされた位相
（１２）
とを、別個に平滑化する。平滑化された応答は、
（１３）
として得られ、反転
は、式９を用いて計算される。

性能評価測定

[00107] 単独の被験者によって装着されるヘッドホン（HD600、Sennheiser、ドイツ）が、各測定後にヘッドホンを再配置しながら、４回測定される。ヘッドホンを再配置するために、被験者は、測定された応答の変動を減じるために、測定の合間にヘッドホンを取り外して再着用する。測定された応答は、０ｄＢレベル付近のマグニチュードで正規化される。結果として得られた応答が、応答間の比較を可能にするために図１４に示される。第１のヘッドホン応答（実線）は反転に使用され、図９及び図１１に示される反転応答を得るためにも利用された。反転されるときに個人の等化フィルタがリンギングアーチファクトを生じさせることが先の非公式測定から分かっている特定の被験者が、選択される。９．５ｋＨｚでのノッチの正確な反転が、アーチファクトの原因と考えられる。β=−２０ｄＢの値が、被験者によって行われる調整テストに基づいて従来の正則化された反転方法のために選択される。各方法についてのパラメータが、図１３に示される。

主観評価のためのリスニングテスト設計

[00108] 提案される方法を主観的に評価するために、一連の測定が実行される。ITU-R BS.1116準拠ルーム内のステレオラウドスピーカーセットアップ（8260A、Genelec、フィンランド）の個々のバイノーラルルーム応答とヘッドホン応答（SR-307、Stax、日本）とが、各テスト参加者に対して測定される。測定されたヘッドホン応答は、反転前に正規化され、ゲイン係数は反転後に補償される。これにより、ヘッドホン上での再生レベルをラウドスピーカー上での再生の音レベルに合わせることが可能となる。

[00109] リスニングテストは、提案される方法の性能を知覚的に評価するように設計される。このテストのパラダイムは、ステレオラウドスピーカーのセットアップのヘッドホン上での、バイノーラル合成された表現の忠実度を評価することである。目的は、ヘッドホンの再配置が課されたときのラウドスピーカーの表現と比較して全体的な音質を評価することである。被験者に対する課題は、ヘッドホンを取り外してからラウドスピーカーを聴き、最後にヘッドホンを再び装着して、バイノーラル再生を聴くことである。これは、テスト中の再配置の影響をもたらす。作業仮説は、提案される方法が、従来の正則化された反転及び平滑化法の最良の場合よりも統計的に良好に、または同様に良好に実施されることである。これにより、提案される方法の適合性が検証される。

[00110] 使用されるテスト信号は、２ｋＨｚのカットオフ周波数を有するハイパスピンクノイズ、ブロードバンドピンクノイズ、及び２つの異なる音楽サンプルである。テスト信号は、広帯域の周波数成分を有する。したがって、高い周波数のアーチファクト及び着色が、検出されることができる。ノイズ信号は、ラウドスピーカーごとに１つの、２つの無相関のピンクノイズトラックから成る。音楽信号は、ループでシームレスに再生できるロックとファンクミュージックの短いステレオトラックである。テストサンプルを得るために、テスト信号は、正則化された反転方法、平滑化法、及び提案されるシグマ反転方法を使用して得られるバイノーラルフィルタでコンボリューションされる。従来の正則化された反転β=−１８ｄＢのスケール係数は、３人の聴取者が異なる正則化β値で得られる音質を等級付けする非公式のテストで選択される。ヘッドホン等化のないバイノーラルフィルタは、低いアンカーとして使用される。これらの補償されていないフィルタは、耳道内のマイクロホンの応答及びヘッドホン応答が等化されないため、音の音色と空間特性を歪めることが予想される。

[00111] １０人の被験者がテストに参加した。彼らは、音色及び空間の歪みを区別することを必要とする同様のテストを受ける。被験者は、オーディオサンプルのヘッドホン表示の忠実度を０乃至１００の尺度を用いて等級付けするように求められる。ラウドスピーカー上での再生が基準として使用される。被験者は、彼らが差異を感知しない、したがって、音がラウドスピーカーから出ているか、ヘッドホンから出ているかを区別することができない場合に限り、最大のスコアを与えるように指示される。ヘッドホンの再生がラウドスピーカーの表現のいかなる特徴も再生していない場合、最小のスコアが与えられる。評価されるこれらの特徴は、音色、空間特性、及びアーチファクトの存在として被験者に説明される。それでも、被験者は、各特徴に異なる重み付けを自由に行うことができ、例えば、空間的再生における小さな差異が、音色のその違い、より重大と等級付けされ得る。テストサンプルは、連続ループで再生され、ラウドスピーカーの再生を聴くかヘッドホンの再生を聴くかを被験者が自由に選択できる。グラフィックインターフェースにより、被験者は４つのバイノーラルフィルタとラウドスピーカー再生との間で選択することができる。バイノーラルフィルタは、各テスト信号に対してランダムに順序付けされ、フィルタ間の比較が可能である。

結果

性能の評価

[00112] 提案される正則化の適合性は、ウィーナーデコンボリューション、従来の正則化された反転及び複合平滑化法との比較によって評価される。比較の基準は、再配置によるアーチファクトを生じさせ得るノッチを除いて、応答の反転における正確さである。ウィーナーデコンボリューションと従来の正則化された反転方法とは、それらが、提案される方法と同様の式を特徴とし、使用される正則化パラメータのみが異なるので、比較のために選択される（上記「ヘッドホン等化に適用される正則化された反転」を参照）。ウィーナーデコンボリューションはまた、最適な帯域幅制限を備えた直接反転を表している。平滑化法は、正則化パラメータσ^２（ω）を推定するために、マグニチュードの平滑化が提案される方法でも用いられるので、比較のために選択される（式８参照）。

[00113] 図１４に実線で示されているヘッドホン応答は、前述の方法を使用してインバースフィルタを得るために利用される。異なるインバースフィルタで元の応答をコンボリュージョンした結果が、図１５に示されている。この曲線は、差が生じる２乃至２０ｋＨｚのデータを示す。ウィーナーデコンボリューション（点線）は、ノッチを正確に反転するフラットな応答を生成する。平滑化法（破線）は、ノッチ周波数間で５ｄＢの共鳴を生成する、ここにおいて、反転は正確であると予想される。従来の正則化された反転方法（一点鎖線）は、ノッチ周波数で同様の減衰を維持しながら、平滑化法よりもフラットな応答を生成する。提案される方法（実線）は、ノッチ周波数で最大の減衰を有する補償された応答を生成するが、依然としてノッチ間のフラットな応答を提供する。ノッチ周波数での強い減衰は、このインバースフィルタがヘッドホンを再配置した後に測定されたヘッドホン応答に適用される場合にノッチ周波数のわずかなシフトが共振をもたらさない場合があることを示唆している。この影響の例は図１６に見ることができ、再配置後に測定された３つの応答で以前に得られたインバースフィルタをコンボリュージョンした結果を示す。ヘッドホンの再配置によるこれらの応答は、図１４に点線、一点鎖線、及び破線で示されている。すべての方法について、１６ｋＨｚより上では、３回目の測定で得られた応答の等化は、元のヘッドホン応答に対して最大１０ｄＢだけ異なる。しかしながら、広帯域の音が再生される場合、このことが判断に大きく影響するとは予期されない。従って、評価は１６ｋＨｚより下の周波数に対して行われる。図１４のヘッドホン応答は大きく異ならないが、ウィーナーデコンボリューション（１番上のボックス）を用いた図１６の等化されたヘッドホン応答は、リンギングアーチファクトとして感知されることができる共鳴を含む。これらの共鳴は、他の方法では経験されないが、従来の正則化された反転（上から２番目のボックス）、平滑化法（上から３番目のボックス）、及び提案される方法（下のボックス）の間には、これらの周波数にいくらかの違いが存在する。提案される方法は、すべての応答に対してノッチ周波数（９．５ｋＨｚ及び１５ｋＨｚ）で安定した大きな減衰を生成する。これは他の方法には当てはまらない。それらの減衰は、再配置によって変化する。さらに、提案される方法は、従来の正則化された反転と同様にフラットな全体の応答を依然として維持する。これらの結果は、提案される方法が、最小限の音劣化を維持しながら、再配置の影響に対してある程度のロバスト性を加え得ることを示唆している。しかしながら、これはリスニングテストによって評価されるべきである。

主観的評価

[00114] テストに参加した１０人の被験者にわたって推定されたサンプル平均（μ）及び標準偏差（ＳＤ）が図１７に示される。各方法に与えられたスコアの平均間の差異の統計的有意性を評価するために、一元配置分散分析（One-way ANOVA）テストが実行される。分散（variance）の均質性は、Leveneテスト（Ｆ（３，１５６）＝１４．０５、ｐ＜０．００１）を用いてテストされ、均質性の仮定の違反をもたらす。したがって、従来の一元配置分散分析の代わりに、アルファ＝０．０５のWelchのテストが使用される。Welchのテストは、異なる方法に与えられた平均スコアの少なくとも１つにおける統計的に有意な差異を報告している（Ｆ（３，７９．４８）＝１４５．４８、ｐ＜０．００１）。与えられたスコアと反転方法（ω^２＝０．７３）との間の関連の強度の尺度は、スコアにおける分散の７３％が反転法に起因し得ることを示す。分散の均質性が違反されるため、どの方法が平均スコアにおいて統計的に異なるかを決定するために、Games-Howellの事後テストが使用される。テストの結果が図１８に示される。帰無仮説（null hypothesis）が拒否されない（ｐ＝０．１３９）平滑化法（μ＝６９．９２、ＳＤ＝２５．７）と従来の正則化された反転（μ＝７９．８、ＳＤ＝１４．３３）で形成されたペアを除いて、すべての方法が、スコア平均間の統計的に有意な差異を示す。

[00115] 平均及びそれらの９５％の信頼区間が図１９に描かれている。従来の正則化された反転のスコア平均及び信頼区間は、平滑化法のスコア平均及び信頼区間よりも優れており、知覚的に優れた性能を示す、ただし、平均値の差は統計的に有意ではない。これは、２００９年５月のオーディオエンジニアリング学会１２６で、Z.Schaerer及びA. Lindauの「Evaluation of equalization methods for binaural signals」の結果と一致し、ここにおいて、βは専門家の聴取者によって選択された。これに基づいて、現在のテストで使用されるβの値は、専門家によって得られた値と一致すると考えられ、したがって、提案される方法の性能を評価するために受け入れられ得る。提案される手法は、最も高い品質スコア平均を示し、それは、提案される手法に、他の手法に比べて少ない音質劣化をもたらすことを示す。さらに、提案される方法の平均の信頼区間は狭く、この方法に与えられるスコアについて被験者が同意することを示唆する。これらの結果は、提案される方法がこのテストで使用された他の方法よりも統計的に良好に行われるという仮説を確証する。

考察と結論

[00116] 最適な正則化係数は、元の測定されたヘッドホン応答のノッチの反転に起因する音質の主観的劣化を依然として最小限に抑えながら、主観的に許容可能であり且つ正確なヘッドホン応答の反転を生成する。

[00117] 最良の主観的受容のために個々に正則化係数を調整することは、いくらかの周波数依存性が予想されるので、面倒で時間がかかる。ヘッドホン応答を反転するための正則化係数を定義するアプローチは、所定のされた正則化フィルタのスケーリングに基づく。正則化フィルタは、まず反転の帯域幅を制限するように設計され、次に固定スケール係数が許容値に調整される。正則化係数は反転される応答に依存するため、固定のスケール係数が、あるノッチを過剰に正則化させ、一方で他を十分に正則化させず、これが音質を低下させる。

[00118] 提案される方法は、ヘッドホン応答それ自体を使用してそれを推定することによって、周波数依存正則化係数を自動的に生成する。測定されたヘッドホン応答とその平滑化されたバージョンとの比較は、各周波数で必要とされる正則化の推定を提供する。この正則化はノッチ周波数で大きく、元の応答と平滑化された応答が似ている場合はゼロに近い。反転の帯域幅は、ＳＮＲの推定または再生帯域幅の事前知識を用いて測定された応答から定義されることができる。したがって、正則化係数は個別に且つ自動的に得られることができる。

[00119] 正則化の量を推定するために用いられる平滑化ウィンドウは、引き起こす音質の劣化が最小限であるべきである。狭い平滑化ウィンドウは、平滑化された応答が元のデータにより似ているため、ヘッドホン応答のより正確な反転を生成する。しかしながら、これは、元の測定のノッチの周りの周波数における反転によって導入される過度の増幅のために、不快な音質を引き起こす可能性がある。ヘッドホン応答の半オクターブ平滑化は、必要な正則化の量を適切に推定することが見出されているが、B.Masiero及びJ.Fels、「Perceptually robust headphone equalization for binaural reproduction」、オーディオエンジニアリング学会１３０、２０１１年５月に示されているような、異なる方法で得られる他の平滑化された応答もまた適し得る。さらに、異なる平滑化ウィンドウが、この作業で分析されるもの以外の特定の目的に最適であり得る。

[00120] 提案される方法の評価は、ノッチの反転を保守的且つ主観的に許容可能なやり方で制限しながら、測定された応答を反転させるための従来の正則化された反転方法の精度を維持することができるインバースフィルタを提供することを示す。正則化は強力であり、元の応答のノッチの周りの、従来の正則化された反転で使用される固定の正則化より広い周波数範囲に及ぶ。これにより、ヘッドホンを再配置することに典型的なノッチ周波数における小さなシフトにもかかわらず、効果的な正則化がもたらされ、引き起こす主観的影響がより小さくなり、ヘッドホンの再配置に対してより良好なロバスト性が示唆される。主観的なテストに基づいて、提案される方法に起因するより大きな正則化は、知覚される音質を低下させないようである。

[00121] 従来の正則化された反転方法のための正則化係数の調整は、３人の被験者のみによって行われる主観的テストに基づく。この単一の正則化を１０人すべての被験者に適用することは、それらのうちの何人かにとっては最適ではない場合がある。しかしながら、正則化された反転法は良好なスコア（μ＝７９．８、ＳＤ＝１４．３３）を得て、一般に複合平滑化法（μ＝６９．９２、ＳＤ＝２５．７）よりも良いと等級付けされ、それは以前の研究と一致する。これは、従来の正則化された反転方法のために選択された正則化係数が、主観的な実験における提案される方法の有効性を検証するための基準として使用されることができることを示唆している。

[00122] 被験者の数は、従来の正則化された反転方法に関して提案される方法の性能を観察するのに十分である。関連尺度（association measure）の強度（ω^２＝０．７３）は、主観的スコアが主に反転法の影響を受けていることを示しており、事後テストは、提案される方法と従来の正則化された反転方法との間に有意差があることを示している（ｐ＝０．００２）。したがって、提案される方法によって得られたスコアは偶然ではない。提案される方法によって得られる平均スコア（μ＝８９．６２、ＳＤ＝８．０４）は、実験における研究仮説を確証するものである。仮説は、ヘッドホン応答反転の提案される正則化が固定値正則化パラメータを使用することよりも知覚的に優れており、その結果がヘッドホンの再配置に対して主観的にロバストであるということである。

[00123] より小さい標準偏差及び評価スコアのより狭い信頼区間は、被験者が提案される方法によって生成された知覚される音質に関して同意することを示唆する。テスト中のヘッドホンの再配置の影響は、基準方法のスコアよりも提案される方法に与えられたスコアに影響を与えないようである。

[00124] 提案される方法は、従来の正則化された反転に対する改善を表す。提案される方法の重要な利点は、正則化が周波数特有であり、それが最小の音質劣化をもたらし、それが測定されたヘッドホン応答データに完全に基づいて自動的に設定されることである。

[00125] 提案される方法は、個々の被験者ごとに正則化係数の調整に必要な時間を回避し、ヘッドホンのより迅速でより正確な等化を可能にする。この方法が主観的テストで示した忠実度は、この方法がヘッドホン上でのバイノーラル合成におけるさらなる研究のための基準方法として使用されるか、またはリスニングテスト設計によって示されるように、元のラウドスピーカールームシステムの音色特性を維持しながらヘッドホン上でラウドスピーカーセットアップをシミュレートするために使用されることができることを、示唆する。

ヘッドホンの音質を保持するために等化されたバイノーラル応答を使用するヘッドホンステレオエンハンスメント

[00126] ヘッドホンの音質を保持するために、バイノーラルステレオレンダリングネットワークの出力を等化するための基準が説明され且つ評価される。目的は、ラウドスピーカーから各耳への直接パスとクロストークパスの合計がフラットなマグニチュード応答を有するように、バイノーラルフィルタを等化することである。この等化基準は、いくつかのバイノーラルフィルタ設計が使用されたリスニングテストを用いて評価される。結果は、バイノーラルフィルタの直接パス及びクロストークパス間の差異を保持することがバイノーラルレンダリングの空間的品質を維持するために必要であること、及び、バイノーラルフィルタのポスト等化がヘッドホンの元の音質を保持できることを示す。さらに、測定されたバイノーラル応答のポスト等化は、テスト参加者がラウドスピーカーからのステレオ再生の仮想提示に対する期待をより良好に満たすことが分かった。

[00127] イントロダクション

[00128] ヘッドホンは、一般的に、携帯性及び周囲からのアイソレーションにより、携帯デバイスでのステレオリスニングのために使用されている。ヘッドホンの音質は主にその周波数応答による影響を受け、いくつかの研究が、高音質ヘッドホンを設計するための種々のターゲット機能を提案している。これが、ステレオ音再生において優れた音質を提供できるヘッドホン設計をもたらす。しかしながら、ヘッドホン上でのステレオ信号の再生は、耳間の聴覚イメージをもたらし（頭内定位（lateralization））、疲労を生じさせることが知られている。これは、ラウドスピーカー上でのステレオ再生によって生成されるものと比較して、ヘッドホンによって生成されるバイノーラルキューの違いによって生じられる。ヘッドホン再生のためのステレオエンハンスメント方法は、フィルタリングによってラウドスピーカーによって生成されたものと同様のバイノーラルキューを人工的に導入することができる。ステレオラウドスピーカーのセットアップのバイノーラルレンダリングが、図２０に示されている。ラウドスピーカーから耳へのバイノーラル応答は、フィルタＨ_ｉｊ（ω）によって表される（大文字の添字「Ｌ」及び「Ｒ」は左及び右のラウドスピーカーを表し、小文字の「ｌ」及び「ｒ」はそれぞれ左及び右の耳を表す）。ステレオオーディオ信号をこれらのフィルタとコンボリューションした後、ラウドスピーカーペアによって生成されるものと同様の聴覚イメージが、ヘッドホン上で聴きながら再生される。

[00129] （ＩＴＤ及びＩＬＤそれぞれの）両耳間時間差及びレベル差が、水平面における定位のための主要なキューであるため、ステレオラウドスピーカーシステムのＩＴＤ及びＩＬＤを模倣するフィルタが、頭内定位効果を低減するために使用されることができる。さらに、聴取者のモノラル応答及び実際のＩＴＤ、ＩＬＤをより正確に近似するバイノーラルルーム応答（ＢＲＩＲ）、または頭部伝達関数（ＨＲＴＦ）を使用することによって、ヘッドホン上でのステレオ再生の空間特性が改善される。

[00130] しかしながら、バイノーラルレンダリングは聴覚定位研究に広く使用されているが、音質評価テストは、聴取者がエンハンスメント法なしにヘッドホン上でのステレオ信号の再生を好むことを示している。これは、個体化されていないバイノーラルフィルタが音において引き起こすスペクトルの着色に起因する可能性がある。バイノーラルフィルタを用いてより「自然な」音を生成するために、ＨＲＴＦの等化が提案されている。バイノーラル音質をラウドスピーカーの音質に一致させるために、専門家の聴取者を利用してバイノーラルフィルタの事後等化を設計することも検討されている。しかしながら、バイノーラルレンダリングを使用するときに元のヘッドホンの音質を保持する研究はほとんどない。

[00131] 聴覚イメージの空間特性を強化しながらヘッドホンの元の音質を保持することが、この作業の動機となる。本作業では、マグニチュード情報が様々な方法で等化されながら、バイノーラルルーム応答の位相情報が保持されるように、バイノーラルフィルタが設計される。これらのバイノーラルフィルタの設計の目的は、ヘッドホン音の質の劣化を最小限に抑えながら、空間的なステレオイメージを強化することである。オーディオエンジニアリング学会、第２２回国際協議会、Virtual、Synthetic、及びEntertainment Audio、２００２年におけるKirkeby, O.による「A Balanced Stereo Widening Network for Headphones」のように、両チャンネルにおいて等しい信号マグニチュードを得るために、バイノーラルステレオネットワーク出力のフラットなマグニチュード応答を維持することが、ヘッドホンの音質を保持するための基準として採用されている。フィルタは、空間品質、音色／音バランス品質、及び全体的なステレオ表現品質が別個にテストされるリスニングテストによって評価される。

[00132] まず、バイノーラルステレオレンダリングにおけるヘッドホン音質を保持するための基準が示される。次に、測定、フィルタリング法、及び評価のためのリスニングテストの設計が、説明される。次に、リスニングテストの結果が提示され、説明される。次に、結論が示される。

ステレオバイノーラルレンダリングにおけるヘッドホンの音質を保持するための基準

[00133] ステレオミキシングでは、両チャネル間で信号を等しく分配することによって、ファントムモノフォニック音源が聴覚イメージの中心に配置される。ヘッドホン上でラウドスピーカーステレオ再生を模倣する（emulate）ためにバイノーラルレンダリングを適用する場合、各ステレオチャンネルは、ラウドスピーカーから頭の同じ側の耳までの直接パス（Ｈ_ｄ）、及び頭の反対側におけるラウドスピーカーからのクロストークパス（Ｈ_ｘ）を表すフィルタのペアによって、常に処理される。フィルタＨ_ｄはＨ_{Ｌｌ_}とＨ_Ｒｒに相当し、ここにおいては図２０のＨ_{Ｌｒ_}とＨ_{Ｒｌ_}に相当する。中心に置かれたファントム音源のヘッドホン上でのバイノーラルステレオ再生が図２１に示されており、ここで、sはオーディオ信号、ｓ'はバイノーラルフィルタ処理後に生じる信号、Ｈ_{ＨＰ_}はヘッドホンの伝達関数、
は、耳に伝達される音響信号である。バイノーラル処理のないヘッドホン上での同じ信号ｓの再生が図２２に示されており、ここで、ｓ_{ＨＰ_}は、耳に送信される結果としての音響信号である。各ラウドスピーカーから耳へのパスの間に対称性があると仮定しており、したがって、図２１に示されるネットワークは、両耳に対して同様である。

[00134] 完全に左にパンされたファントム音源のバイノーラルステレオ再生が、図２３に示されている。このケースでは、オーディオ信号は、ステレオ信号ｓ_Ｌの左チャネルに含まれ、右チャネルは、いかなる信号も含まない。対称性が仮定されているので、反転の配置は音源を完全に右にパンする。

[00135] 図２１のネットワークとは対照的に、信号の総和が脳内で行われる。これは両耳加算（binaural summation）として知られている。「両耳加算」という用語は、信号の単耳再生（一方の耳にのみ示される信号）と信号の両耳再生（両耳に示される信号）との間の知覚されるラウドネスの知覚的増加として理解されるべきである。ラウドネスの増加は、再生レベルに依存することが分かっている。しかしながら、ここでは、両耳再生が中程度のレベルで知覚されたゲインに近似するため、両耳再生は、単耳再生に関して６ｄＢのゲインを生成することを想定する。これは、２つの等しい相関信号の和に相当する。フィルタＨ_{ｘ_}は両方の耳に対して同じであると想定されるため、図２３のネットワークは、図２１と等しい。これは、ヘッドホンの元の音質を保持する等化を得るために、図２１におけるシステムの使用を正当化する。

[00136] ヘッドホンの音質を保持するために、バイノーラルネットワークs'の出力は、中心のファントム音源に対してステレオ信号によって直接駆動されるとき、ヘッドホンの入力に近似するべきである（図２１参照）。しかし、s'＝sを引き起こすフィルタＨ_ＥＱ_は、空間化のために行われるバイノーラル処理をすべて除去する。音質がマグニチュード応答の観点から定義される場合、フィルタＨ_{ＥＱ_}は、マグニチュード応答がsのマグニチュード応答に近似する信号s''を生成するように定義されることができる。これは、Ｈ_{ＥＱ_}がバイノーラルネットワーク出力のマグニチュードをフラットにすべきであることを意味する。このフィルタは、
（１４）
として計算されるマグニチュード応答を有する線形フィルタとして設計されることができる。Ｈ_{ｄ_}とＨ_{ｘ_}はルームの影響を含み得るので、|Ｈ_{ｄ_}＋Ｈ_ｘ|の平滑化されたバージョン、|Ｈ_ＳＭ|が反転に望ましくあり得る。この作業では、１オクターブ幅の平滑化ウィンドウ（one octave wide smoothing window）を使用した。ヘッドホン音質を保持するためのバイノーラルステレオ再生ネットワークが、図２４に示されている。

方法

[00137] ヘッドホンの音質を保持するためのバイノーラルステレオネットワークを評価するために、３つのバイノーラルフィルタが設計され、リスニングテストが実行される。バイノーラルルーム応答が、フィルタによって生成された外在化を改善する反射を追加するために使用された。

測定とフィルタ設計

[00138] ダミーヘッド（Cortex Mk II）のバイノーラル時間応答、ｈ_ｉｊ（t）が、３４０ｍｓの残響時間を有するリスニングルーム内のステレオラウドスピーカーセットアップ（Genelec 8260A）について測定された。測定された応答を使用して、バイノーラルフィルタのセット、Ｈ_ｂｉｎが、応答の最初の４２ｍｓ（２０４８サンプル、４８ｋＨｚサンプリングレート）をウィンドウ化することによって設計され、
（１５）
ここにおいて、
はフーリエ変換を表し、ｗ（ｔ）は４２ｍｓの長時間ウィンドウである。非公式のリスニングテストを実施した後、このフィルタの長さは室内残響によって生じる音色効果と外在化能力との間の最良のトレードオフとして採用された。

[00139] 次に、上記のプロセスが、等化されたバイノーラルフィルタのセット、Ｈ_{ｂｉｎＥＱ}を得るために、適用された。まず、平均フィルタＨ_{ＳＭ_}が、
（１６）
として、両耳のバイノーラルネットワークを用いて得られた。ここで、
は、直接フィルタとクロストークフィルタの加算後の１オクターブの平滑化プロセスを示す。フィルタＨ_{ＥＱ_}のマグニチュードは、周波数５０Ｈｚ乃至２０ｋＨｚの|Ｈ_ＳＭ|の反転として得られた。そして、バイノーラルフィルタＨ_ｂｉｎが、等化されたバイノーラルフィルタＨ_{ｂｉｎＥＱ}を得るために、Ｈ_{ＥＱ_}とコンボリュージョンされた、
（１７）。
モノラルキューを除去するためのバイノーラルフィルタに対する更なる変更もまた、行われた。オールパスバージョンのＨ_ｂｉｎ＿が、バイノーラルフィルタの位相情報のみを保持することによって生成された。これが、フィルタにおいて一時的な情報を保持するが、ＩＬＤとモノラルのキューとを削除する。そして、直接パスとクロストークパスとの間のレベル差、ＨＬＤは、直接パスとクロストークパスとの平滑化された応答間のマグニチュード比から得られた結果としてのマグニチュードを平均することによって推定され、HLDは、直接パスとクロストークパスとの平滑化された応答間のマグニチュード比から得られた結果としてのマグニチュードを平均することによって推定され、
（１８）、
ここにおいて、＾はフィルタマグニチュード応答の１オクターブ平滑化を示す。この後、直接フィルタとクロストークフィルタのマグニチュード
及び
は、それぞれ、
（１９）
として設計された。
（実線）と
（破線）とによって知らしめられる周波数依存ゲインが、図２５に示されている。バイノーラルオールパスフィルタは、バイノーラルフィルタＨ_ｐｈを生成するために、対応する
及び
フィルタでコンボリュージョンされ、
（２０）
ここにおいて、arg{・}はフィルタの引数（位相）を示す。この後、等化フィルタが、式１６及び式１４を用いて設計された。結果としてのフィルタは、等化されたバイノーラルフィルタＨ_{ｐｈＥＱを}得るために、Ｈ_{ｐｈ_}でコンボリュージョンされた。

[00140] さらに、ステレオラウドスピーカーのセットアップはまた、リスニング位置の左右の９ｃｍのところに配置された全方向性マイクロホン（Ｇ．Ｒ．Ａ．Ｓ．タイプ４０ＤＰ）を用いて、リスニングルームにおいて測定された。１つのラウドスピーカーから各マイクロホン位置への直接音の到着時間の差は、ダミーヘッドで得られたＩＴＤに近似する。これらの応答は、４２ｍｓにウィンドウ化され、Ｈ_ｐｈＥＱと同様の方法で処理されたが、ＩＬＤは、オーディオエンジニアリング学会、第２２回国際協議会、Virtual、Synthetic、Entertainment Audio、２００２年におけるKirkeby, O.の「A Balanced Stereo Widening Network for Headphones」で提案される直接フィルタ及びクロストークフィルタによって導入された。これらのフィルタは、
及び
で示され、それらの周波数応答は、図２６に示されている。結果としての等化されたバイノーラルフィルタは、Ｈ_{ｏｏｍＥＱ}として示される。

[00141] 直接フィルタ及びクロストークフィルタの加算（図２４のs''）の後、フィルタＨ_{ｂｉｎＥＱ}、Ｈ_ｐＥＱ、及びＨ_{ｒｏｏｍＥＱ＿}の応答は、左のヘッドホンチャネルについて図２７に示されている。フラットな応答からの偏差は、処理において選択された平滑化ウィンドウ及び対称フィルタを近似するための、耳間の平均化によるものである。

リスニングテスト設計

[00142] 空間ステレオ品質、音色／音質、全体的な音質をそれぞれ評価するために、３つの別個のセクションから成るリスニングテストが、設計された。リスニングテストは、先のセクションで測定された室内のヘッドホン（Stax SR-307）のみを使用して行われた。評価されるケースは、ヘッドホン上でのステレオ信号の直接再生、及びセクションフィルタ設計、すなわちＨ_ｂｉｎ、Ｈ_{ｂｉｎＥＱ}、Ｈ_ｐｈＥＱ、及びＨ_{ｒｏｏｍＥＱ}に記載された処理後に得られたバイノーラルフィルタを用いたバイノーラルステレオ再生である。ローパスフィルタにかけられた（３．５ｋＨｚのカット周波数の）モノフォニック信号が、テストにおいて低アンカーとして導入された。

[00143] ４つのステレオ音楽トラックがテストのために選択された。２つのステレオトラックは、最初の作者によって様々な方向にパンされた異なる楽器ループと混合された。他の２つのステレオトラックは、商業用音楽のミックスの短い曲（カントリーとロック）であった。これらのステレオトラックは、各バイノーラルフィルタでコンボリューションされ、結果の信号は、テスト参加者によって制御されるグラフィカルユーザインターフェースを用いてシームレスな連続ループで再生された。グラフィカルユーザインターフェースによって、参加者は、テストケースと基準とを所望の回数だけ選択することと、０乃至１００の数値スケールを用いるスライダを用いて各テストケースを等級付けすることとが、可能となった。品質ディスクリプタ（非常に悪い、悪い、普通、良い、非常良い）が、スライダの右側に見られる。参加者は、最も悪い場合を０、最も良い場合を１００としたスコアを与えるよう指示された。そして残りのケースは、感知される差異に基づいて等級付けされるべきである。これはすべてのテストにおいて有効であった。

[00144] テスト１として示される第１のテストは、基準によって生成された空間的ステレオ品質に対して異なるケースの空間ステレオ品質を評価する。基準はＨ_ｂｉｎであり、かくしてそれは、テスト１では隠れ基準（hidden reference）として使用された。テストに参加するために、参加者は、基準を聴くときに外在化を感知するべきである。そうでなければ、参加者のデータは分析に含まれなかった。テスト１では、参加者は、音色の変化が聴覚的なイメージにおけるファントム音源の定位、幅、分布に焦点を当てることによって空間的特徴の感知に生じ得る影響を防ぐように指示された。

[00145] テスト２では、各ケースによって生成された音質が、基準と比較された。この基準は、ヘッドホンを介したステレオ信号の直接再生であった。かくして、テストは隠れ基準を含んでいた。参加者は、等級付けの間は空間化の影響を無視し、異なるファントム音源のラウドネス／音色の違い、音のバランス、及び音アーチファクトに集中するよう指示された。

[00146] テスト３は、ステレオ音を再生するときの全体的な音質に基づいて異なるケースを評価する。このテストでは基準はなかったが、参加者は、仮想基準を想定するよう指示された。この仮想基準は、音楽のステレオ再生がラウドスピーカー上で再生された場合にどのように聞こえるかについての参加者の個人的な予想であった。このテストでは、参加者は、自分の個人的な予想に基づいて空間的及び音色の質を考慮するべきである。

[00147] ２３乃至４５歳の計１４名の被験者がテストに参加した。参加者のうちの１人は、テスト＼，１における基準での外在化を感知しなかった。したがって、彼のデータはすべてのテストで分析から除外され、残りの１３人の参加者についての結果が分析された。

結果

[00148] データは、
適合度プロシージャ（goodnes-of-fit procedure）を用いて正規性についてテストされた。正規性の仮定は、
及び
及び
によって得られたスコアによって破られた。

[00149] ３つの聞き取りテストのデータはまた、分散の均質性（homogeneity of variance）の仮定に反することが判明した（テスト１、２及び３それぞれについてｐ＝０．００２０６、ｐ＝２．８７×１０^−５及びｐ＝１．３２７×１０^−１１）。したがって、フリードマンのノンパラメトリックな統計解析及びボンフェローニ補正を用いた両側ウィルコクソン符号付き順位事後テスト（two-tailed Wilcoxon signed-rank post-hoc test）が、各リスニングテストから得られたデータについて実施された。

テスト１：空間品質

[00150] テスト１（
）についてのデータのノンパラメトリック分析は、異なるフィルタによって得られたスコアが同じ分布を共有しないことを示した。事後テストにより、すべてのケースが異なることが確認された（図２８参照）。プールドデータの中央値及び四分位点が図２９に示されている。ヘッドホン上でのステレオ信号の直接再生は、直接（Direct）と表示され、基準はＨ_ｂｉｎであった。基準及び低アンカーは、それぞれ常に１００及び０であるため、図には示されていない。ボックス内のノッチは、中央値の９５％の信頼間隔を表し、異常値は十字として示されている。各フィルタの中央値は、Ｈ_ｂｉｎに含まれるバイノーラル情報の劣化と同時に起こる傾向にしたがって順序付けられる。Ｈ_ｂｉｎと同じ両耳間差を含むフィルタＨ_{ｂｉｎＥＱ}は、Ｈ_ｐｈＥＱよりも基準の空間特性を良好に再生し、Ｈ_ｂｉｎとＨ_{ｒｏｏｍＥＱ}と比較して同じ位相のみを含み、人工的に導入されたバイノーラル情報を有すること、が判明した。ヘッドホン上でのステレオ信号の直接再生は、基準の空間特性を十分に再生しないことが判明した。

テスト２：音色／音バランス品質

[00151] ノンパラメトリック分析
は、異なるケースによって得られたスコアの分布に有意差があることが判った。事後テストの結果が図３０に示される。事後テストにより、Ｈ_{ｂｉｎＥＱ_}とＨ_{ｐｈＥＱ_}（Ｚ＝０．９１５、ｐ＝０．８４５）を除いてデータの分布がケース間で有意に異なることが確認された。これは、図３1にも示されており、ここにおいて、Ｈ_{ｂｉｎＥＱ_}及びＨ_{ｐｈＥＱ_}は、中央値について同様の分布及び同様の信頼区間を示している。このテストでは、ヘッドホン上でのステレオ信号の直接再生が、基準として使用された。異なるケースについてのスコアは、フィルタによってもたらされるマグニチュードの歪みの量によって順序付けられる。Ｈ_{ｒｏｏｍＥＱ＿}で使用されている直接フィルタ及びクロストークフィルタは、平滑で、フラットな応答を生成するように設計されているため、より小さいマグニチュードの歪みをもたらす。Ｈ_{ｂｉｎＥＱ_}はＨ_ｂｉｎの両耳間の差異を含むが、それは、Ｈ_ｐｈＥＱよりも均等に等級付けされ、ここでは、両耳間のレベル差が人為的に導入されている。さらに、このテストでは、Ｈ_ｂｉｎ＿は明らかに他のフィルタの方が性能は優れているが、Ｈ_{ｂｉｎＥＱ_}とＨ_{ｐｈＥＱ_}は、Ｈ_{ｒｏｏｍＥＱ}のスコアに比較的近い。図２７の応答と比較すると、これらの結果は、ヘッドホン上での直接再生と比較する場合、平滑なフィルタ応答が音色の質を改善し得ることを示唆している。しかしながら、Ｈ_ｐｈＥＱのように、より平滑なフィルタを生成するためにモノラル及びＩＬＤキューを除去することは、Ｈ_ｂｉｎに対して同じバイノーラル情報を含むＨ_{ｂｉｎＥＱ}に関しては音色の質を改善しなかった。

テスト３：全体的な品質

[00152] テスト３におけるデータの分布間に有意差が見られた
。事後テストの結果は、ヘッドホン上での直接再生及びＨ_ｂｉｎ＿よって形成されたペア（Ｚ＝０．７７、ｐ＝０．４３）、及びＨ_{ｂｉｎＥＱ_}及びＨ_{ｐｈＥＱ_}によって形成されたペア（Ｚ＝０．８７、ｐ＝０．３８）を除いて、各ケースのスコアが異なることを確証している。事後テストの結果が、図３２に示される。

[00153] 事後テストは、Ｈ_{ｂｉｎＥＱ_}とＨ_ｐｈＥＱとの間に差異がないことを見出したが、図３３のボックスプロットは、Ｈ_{ｂｉｎＥＱ}に対するわずかに高いスコアリングを示す。ポスト等化を有するバイノーラルフィルタ（添字ＥＱで示される）は、ヘッドホン及びＨ_ｂｉｎ上での直接再生によって得られたスコアよりも性能が優れている。直接ステレオ再生とＨ_ｂｉｎ＿についての同様の分布は、参加者が空間的印象の欠如と音色の歪みに同様にペナルティを課したことを示唆する。これらの結果は、オーディオエンジニアリング学会、第２２回国際協議会、Virtual、Synthetic、Entertainment Audio、2002年のLorho、G.、Isherwood、D.、Zacharov、N.、及び Huopaniemi、J.による「Round Robin Subjective Evaluation of Stereo Enhancement System for Headphones」において得られたものとは異なる。それは、音質の抽象的な定義ではなく、仮想基準（ラウドスピーカーのセットアップ）の選択に関連し得る。

結論

[00154] この研究は、元のヘッドホンの音質を保持しながら、ラウドスピーカーステレオペアの空間的印象を再生するためにバイノーラルフィルタの使用に焦点を当てている。ラウドスピーカーステレオ再生のバイノーラルレンダリングにおけるヘッドホンの元の音質を保持するための基準が規定され、評価される。ポスト等化フィルタは、ラウドスピーカーから各耳への直接パスとクロストークパスの加算の出力をフラットにするように設計されている。これは、同側のＨＲＴＦ及び反対側のＨＲＴＦが所望の方向に対して修正される他の等化方法とは異なる。提案される等化方法は、オーディオエンジニアリング学会、第２２回国際協議会、Virtual、Synthetic、Entertainment Audio、2002年のKirkeby、O.による「A Balanced Stereo Widening Network for Headphones」に示された概念を共有する、しかしそれは、バイノーラルルーム応答を用いることに一般化されている。測定されたバイノーラルルーム応答（４２ｍｓ）は、バイノーラルフィルタを設計するために使用され、それは、残響による過剰な音色の影響を防ぎながら、初期反射をほとんど許容しない。修正されたバイノーラルフィルタは、いくつかの元のバイノーラル属性が平滑化されるか、または人工のバイノーラル情報によって置換されるように設計されている。前述の基準は、異なるバイノーラルフィルタの直接フィルタとクロストークフィルタとの加算をフラットにするために適用されるポスト等化フィルタを設計するために使用される。空間品質、音色／音バランス品質、及び全体的な品質の観点から、バイノーラルフィルタの性能を評価するために、リスニングテストが実行される。結果は、バイノーラルレンダリングの空間品質を維持するために、元のバイノーラルフィルタの直接パスとクロストークパスとの間の相違を保持することが必要であり、そのようなバイノーラルフィルタのポスト等化が依然としてヘッドホンの音質を保持することを示している。聴取者には、ステレオ音楽再生がどのように聞こえるかについての個人的な予想を尋ねられる場合、典型的なバイノーラルレンダリングやヘッドホン上での典型的なステレオ再生に対して、設計されたフィルタが好まれる。これは、音の空間的なステレオ特性を強化しながら、ヘッドホンの音質を保持するための提示された基準の適合性を確認する。

[00155] 開示された本発明の実施形態は、本書に開示された特定の構造、プロセスステップ、または材料に限定されず、関連技術分野の当業者によって認識されるように、それらの同等物まで及ぶことが理解されるべきである。また、本書で用いられる用語は、特定の実施形態を説明するためだけに使用され、限定することを意図するものではないことが理解されるべきである。

[00156] 本書を通して、一実施形態またはある実施形態を参照することは、この実施形態に関連して説明された特定の特徴、構造、または特性が、本発明の少なくとも１つの実施形態に含まれることを意味する。かくして、本書の様々な箇所における「一実施形態では（in one embodiment）」または「ある実施形態では（in an embodiment）」という表現は、必ずしもすべて同じ実施形態を指しているとは限らない。例えば、約（about）またはほぼ（substantially）等の用語を用いて数値を参照する場合、正確な数値も開示される。

[00157] 本書で使用されるように、複数の項目、構造要素、構成要素、及び／または材料は、便宜上、共通のリストにおいて示され得る。しかしながら、これらのリストは、リストの各メンバーがあたかも別個の固有のメンバーとして個々に識別されるように、解釈されるべきである。かくして、そのようなリストの個々のメンバーは、これとは反対に、インジケーション無しで共通のグループでのそれらの提示だけに基づいて、同じリストのいかなる他のメンバーと事実上（de facto）同等であると解釈されるべきではない。さらに、本発明の様々な実施形態及び実施例は、本書において、その様々な構成要素の代替案と共に参照され得る。そのような実施形態、実施例、及び代替案は、互いに事実上同等であると解釈されるべきではなく、本発明の別個の自律的な表現とみなされるべきであることが理解される。

[00158] さらに、説明された特徴、構造、または特性は、１つまたは複数の実施形態において任意の適切な方法で組み合わされ得る。以下の説明では、本発明の実施形態の完全な理解を提供するために、長さ、幅、形状などの例のような多くの具体的な詳細が提供される。しかしながら、関連技術分野の当業者は、本発明が、特定の詳細の１つまたは複数を用いないで、または他の方法、構成要素、材料などを用いて実施され得ることを認識するであろう。他の例では、本発明の態様を不明瞭にすることを避けるために、周知の構造、材料、または動作は詳細には示されていないか、または記載されていない。

[00159] 上記の例は、１つまたは複数の特定の用途における本発明の原理の例示であるが、本発明の原理及び概念から逸脱することなく、且つ発明の権限を行使することなく、実施の形態、使用法、及び詳細の多くの変更が為され得ることが、当業者には明らかであろう。したがって、以下に示される特許請求の範囲を除いて、本発明が限定されることは意図されていない。

[00160] 「備える（to comprise）」及び「含む（to include）」という動詞は、この文章では、引用されていない特徴の存在を除外することも必要とすることもないオープンな制限として使用されている。従属クレームに列挙された特徴は、他に明示的に述べられていない限り、相互に自由に組み合わせ可能である。さらに、本書を通して「a」または「an」、すなわち単数形の使用は複数を排除するものではないことを理解されたい。

[00161] 産業上の利用可能性

[00162] 本発明の少なくともいくつかの実施形態は、音響再生デバイス及びシステムにおいて工業的用途を見出す。

[00163] 本発明のいくつかの態様は、以下の段落に説明される。
段落１．
ヘッドホン等化のために、ステレオヘッドホン伝達関数の反転を正則化する方法であって、等化のための式：
を使用することを特徴とし、この式において、
・
は、シグマ反転であり、
・Ｈ^*（ω）は、応答の複素共役であり、
・Ｄ（ω）は、因果的反転
を生成するために導入される遅延フィルタであり
・Ｈ^*（ω）は、応答であり、
・α（ω）は、ヘッドホンの再生帯域幅であり、
・σ（ω）は、その帯域幅内で必要とされる正則化の推定値である、
方法。
段落２．
項β|Ｂ（ω）|^２は、応答が正確に反転されるように、周波数依存パラメータ
であるが、狭いノッチに対して及びヘッドホン再生帯域幅外の周波数では反転の影響は望まれておらず、パラメータ
は、ヘッドホン再生帯域幅の推定値α（ω）と、その帯域幅内で必要とされる正則化の推定値σ（ω）とを組み合わせて決定され、パラメータ
を定義し、それは次に、
（５）
として定義され、ここにおいて、パラメータα（ω）は、反転の帯域幅を決定し、それは、α（ω）がゼロに近いかゼロに等しい周波数範囲として定義され、新しい正則化係数σ（ω）は、α（ω）によって定義される帯域幅内の反転の影響を制御し、ヘッドホン帯域幅が既知である場合、α（ω）は、ユニティゲインフィルタＷ（ω）を用いて、
（６）
として定義され、それにより、Ｗ（ω）のフラットな通過帯域は、ヘッドホンの再生帯域幅、典型的には高品質のヘッドホンの場合には２０Ｈｚ乃至２０ｋＨｚに相当し、同様に、ノイズパワースペクトル推定が利用可能であれば、α（ω）は、
（７）
として定義され、応答における近接周波数ビン間の強い変動を防ぐために、雑音包絡線の推定値Ｎ（ω）、例えば平滑化スペクトル、が使用されるべきであり、新しい正則化係数σ（ω）は、ノッチのマグニチュード
を減じる応答からの測定された応答Ｈ（ｗ)の負の偏差として定義され、例えば、
は、ヘッドホン応答の平滑化されたバージョンを使用して定義されることができ、これに基づいて、σ（ω）は、
（８）
として決定され、したがって、
に対してσ^２（ω）＞０であり、パラメータ
は、平滑化ウィンドウよりも狭いノッチ周波数で大きな正則化値を含む、段落１に記載の方法。
段落３．
メモリ及び信号処理特性を有する増幅器を含み、ヘッドホンの各ドライバ又はイヤーカップを設定された基準イヤーカップ又はドライバに対して較正し、増幅器のメモリに較正設定を記憶するステップを備える、ステレオヘッドホンを較正するための先の段落のいずれかに記載の方法。
段落４．
ヘッドホンの所望の音属性は、測定によって、またはヘッドホンのユーザから受信された入力情報に基づいて所望の音属性を得るために、増幅器において信号処理パラメータを設定することによって決定される、先の段落のいずれかに記載の方法。
段落３．
少なくともマグニチュード応答、典型的には周波数応答（位相応答を含む）を較正するステップ（工場較正）を含む、先の段落のいずれかに記載の方法。
段落４．
音属性は、以下の特徴：「周波数応答」、「時間応答」、「位相応答」、または「感度」のうちの少なくとも１つを含む、先の段落のいずれかに記載の方法。
段落５．
周波数応答のような所望の音属性は、特定のルームのラウドスピーカーシステムの較正パラメータに基づいて決定される、先の段落のいずれか、またはそれらの組み合わせに記載の方法。
段落６．
外在化機能が、ヘッドホンのユーザのためのルーム表現を生成するために、信号処理パラメータについて実施される、先の段落のいずれかに記載の方法。
段落７．
外在化機能は、それがオールパスフィルタであるように、バイノーラルフィルタの支援によって実施される、段落８に記載の方法。
段落８．
バイノーラルフィルタは、一定のマグニチュード応答（マグニチュード／振幅は周波数の関数として変化しない）を有するが、バイノーラルフィルタの位相応答のみがインプリメントされる、段落８に記載の方法。
段落９．
バイノーラルフィルタは、ＦＩＲフィルタである、段落８に記載の方法。
段落１０．
i．テスト信号は、第１のサブバンド（Ｂ_１）を介してラウドスピーカーによって再生され、
a．テスト信号は、第１のサブバンド（Ｂ_１）を通じてヘッドホンによって再生され、
b．第１のサブバンド（Ｂ_１）を通じてラウドスピーカーによって再生されたテスト信号で、第１のサブバンド（Ｂ_１）を通じてヘッドホンによって再生されたテスト信号の音レベルのような音属性を評価し、サブバンドＢ_１のラウドスピーカーと本質的に同じであるようにヘッドホンの音レベルのような音属性を設定して記憶し、
c．複数のサブバンドＢ_１乃至Ｂ_ｎを通じてテスト信号で上記の手順を繰り返す、
先の段落のいずれかに記載の方法。
段落１１．
テスト信号は、ピンクノイズである、段落１２に記載の方法。
段落１２．
テスト信号は、広域スペクトルコンテンツを有するオーディオ信号を含む音楽的なオーディオファイルである、段落１２または１３に記載の方法。
段落１３．
テスト信号の持続時間は、１乃至１０秒である、段落１２乃至１４のいずれかに記載の方法。
段落１４．
テスト信号は、連続的に繰り返される、段落１２乃至１５のいずれかに記載の方法。段落１５．
各イヤーカップのための少なくとも１つのドライバを有するヘッドホンと、ケーブルによってヘッドホンに接続された増幅器とを含むアクティブステレオ／バイノーラルヘッドホンシステムであって、
ｂ.イヤーカップ、
ｃ．増幅器における信号処理手段、
ｄ．ヘッドホンのドライバまたはイヤーカップの各々は、イヤーカップまたはドライバのような設定基準に対して工場較正され、増幅器のメモリに記憶される、
ｅ．増幅器に少なくとも２つの所定の等化設定値を記憶する手段、および、
ｆ．２００Ｈｚより下の周波数でのノイズキャンセリングの手段、
を備える、システム。
段落１６．
イヤーカップは、耳を完全に、例えば、サーカムオーラルの方法で覆っている、段落１７に記載のシステム。
段落１７．
基準は、測定によって、または基準ドライバまたはイヤーカップから得られる所定の周波数応答である、段落１７または１８に記載のシステム。
段落１８．
ヘッドホン及びヘッドホン増幅器は、ケーブルによって互いに接続された別個の独立したユニットである、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落１９．
ヘッドホンの各ドライバまたはイヤーカップは、設定された基準イヤーカップまたはドライバに対して工場較正され、増幅器のメモリにおいて記憶され、それにより、工場較正は、設定された基準イヤーカップまたはドライバに基づいて、ヘッドホンシステムのすべてのイヤーカップを、音響的に本質的に同じ、例えば、同じ応答、同じラウドネスにする、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落２０．
ヘッドホン増幅器及びヘッドホンは、工場較正に基づいて固有のペアを構成する、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落２１．
アクティブヘッドホンシステムは、ヘッドホンのユーザのためのルームの表現を生成するために、信号処理パラメータを使用してオーディオを外在化する手段を含む、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落２２．
外在化機能がバイノーラルフィルタの支援によって実施される、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落２３．
バイノーラルフィルタは、
ｇ．オールパスフィルタまたは
ｈ．位相応答及びマグニチュード応答を有するフィルタ、である、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落２４．
ラウドスピーカーの伝達関数がヘッドホンシステムにインポートされる、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落２５．
ヘッドホンシステムの伝達関数がラウドスピーカーシステムにエクスポートされる、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落２６．
ボリューム制御は、ラウドスピーカー及びホンについて同じである、先の段落のいずれかに記載のアクティブヘッドホンシステム。
段落２７．
先の方法段落の少なくとも１つに記載の方法を実施させるように構成されたコンピュータプログラム。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
〔１〕
ヘッドホン等化のために、ヘッドホン及び聴取者の耳によって抑制されたボリューム内で生成される共振及び散乱によるピーク及びノッチを含むステレオヘッドホン伝達関数の反転を正則化する方法であって、前記等化のためのシグマ反転式：
を使用することを特徴とし、この式において、
・
は、シグマ反転であり、
・Ｈ ^* （ω）は、応答の複素共役であり、
・Ｄ（ω）は、因果的反転
を生成するために導入される遅延フィルタであり
・Ｈ ^* （ω）は、応答であり、
・α（ω）は、ヘッドホンの再生帯域幅であり、
・σ（ω）は、その帯域幅内で必要とされる正則化の推定値である、
方法。
〔２〕
前記項β|Ｂ（ω）| ^２は、前記応答が正確に反転されるように、周波数依存パラメータ
であるが、狭いノッチに対して及び前記ヘッドホン再生帯域幅外の周波数では反転の影響は望まれておらず、前記パラメータ
は、前記ヘッドホン再生帯域幅の推定値α（ω）と、その帯域幅内で必要とされる前記正則化の推定値σ（ω）とを組み合わせて決定され、パラメータ
を定義し、それは、次に、
（５）
として定義され、ここにおいて、前記パラメータα（ω）は、反転の前記帯域幅を決定し、それは、α（ω）がゼロに近いかゼロに等しい前記周波数範囲として定義され、前記新しい正則化係数σ（ω）は、 α（ω）によって定義される前記帯域幅内の前記反転の影響を制御し、前記ヘッドホン帯域幅が既知である場合、α（ω）は、ユニティゲインフィルタＷ（ω）を用いて、
（６）
として定義され、それにより、Ｗ（ω）のフラットな通過帯域は、前記ヘッドホンの再生帯域幅、典型的には高品質のヘッドホンの場合には２０Ｈｚ乃至２０ｋＨｚに相当し、同様に、ノイズパワースペクトル推定が利用可能であれば、α（ω）は、
（７）
として定義され、前記応答における近接周波数ビン間の強い変動を防ぐために、雑音包絡線の推定Ｎ（ω）、例えば平滑化スペクトル、が使用されるべきであり、前記新しい正則化係数σ（ω）は、前記ノッチのマグニチュード
を減じる前記応答から測定された応答Ｈ（ω)の負の偏差として定義され、例えば、
は、前記ヘッドホン応答の平滑化されたバージョンを使用して定義されることができ、これに基づいて、σ（ω）は、
（８）
として決定され、したがって、
に対してσ ^２（ω）＞０であり、前記パラメータ
は、前記平滑化ウィンドウよりも狭いノッチ周波数で大きな正則化値を含む、
〔１〕に記載の方法。
〔３〕
メモリ及び信号処理特性を有する増幅器を含み、前記ヘッドホンの各ドライバ又はイヤーカップを設定された基準イヤーカップ又はドライバに対して較正し、前記増幅器の前記メモリに前記較正設定を記憶するステップを備える、ステレオヘッドホンを較正するための先の〔１〕〜〔２〕のいずれかに記載の方法。
〔４〕
前記ヘッドホンの所望の音属性は、測定によって、または前記ヘッドホンのユーザから受信された入力情報に基づいて前記所望の音属性を得るために、前記増幅器において信号処理パラメータを設定することによって決定される、〔１〕〜〔３〕のいずれかに記載の方法。
〔５〕
少なくともマグニチュード応答、典型的には周波数応答（位相応答を含む）を較正するステップ（工場較正）を含む、〔１〕〜〔４〕のいずれか一項に記載の方法。
〔６〕
前記音属性は、以下の特徴：「周波数応答」、「時間応答」、「位相応答」、または「感度」のうちの少なくとも１つを含む、〔１〕〜〔５〕のいずれか一項に記載の方法。
〔７〕
周波数応答のような前記所望の音属性は、特定のルームのラウドスピーカーシステムの較正パラメータに基づいて決定される、〔１〕〜〔６〕のいずれか一項またはそれらの組み合わせに記載の方法。
〔８〕
外在化機能が、前記ヘッドホンの前記ユーザのためのルーム表現を生成するために、前記信号処理パラメータについて実施される、〔１〕〜〔７〕のいずれか一項に記載の方法。
〔９〕
外在化機能は、それがオールパスフィルタであるように、バイノーラルフィルタの支援によって実施される、〔８〕に記載の方法。
〔１０〕
前記バイノーラルフィルタは、一定のマグニチュード応答（マグニチュード／振幅は周波数の関数として変化しない）を有するが、前記バイノーラルフィルタの前記位相応答のみがインプリメントされる、〔８〕に記載の方法。
〔１１〕
前記バイノーラルフィルタは、ＦＩＲフィルタである、〔８〕に記載の方法。
〔１２〕
i．テスト信号は、第１のサブバンド（Ｂ _１）を通じてラウドスピーカーによって再生され、
a．前記テスト信号は、前記第１のサブバンド（Ｂ _１）を通じてヘッドホンによって再生され、
b．前記第１のサブバンド（Ｂ _１）を通じて前記ラウドスピーカーによって再生された前記テスト信号で、前記第１のサブバンド（Ｂ _１）を通じて前記ヘッドホンによって再生された前記テスト信号の音レベルのような前記音属性を評価し、前記サブバンドＢ _１の前記ラウドスピーカーと本質的に同じであるように前記ヘッドホンの音レベルのような前記音属性を設定して記憶し、
c．複数のサブバンドＢ _１乃至Ｂ _ｎを通じて前記テスト信号で上記の手順を繰り返す、〔１〕〜〔１１〕のいずれか一項に記載の方法。
〔１３〕
前記テスト信号は、ピンクノイズである、〔１２〕に記載の方法。
〔１４〕
前記テスト信号は、広域スペクトルコンテンツを有するオーディオ信号を含む音楽的なオーディオファイルである、〔１２〕または〔１３〕に記載の方法。
〔１５〕
前記テスト信号の持続時間は、１乃至１０秒である、〔１２〕乃至〔１４〕のいずれか一項に記載の方法。
〔１６〕
前記テスト信号は、連続的に繰り返される、〔１２〕乃至〔１５〕のいずれかに記載の方法。
〔１７〕
各イヤーカップのための少なくとも１つのドライバを有するヘッドホンと、ケーブルによって前記ヘッドホンに接続された増幅器とを含むアクティブステレオ／バイノーラルヘッドホンシステムであって、
j.イヤーカップ、
k．前記増幅器における信号処理手段、
l．前記ヘッドホンの前記ドライバまたは前記イヤーカップの各々は、イヤーカップまたはドライバのような設定基準に対して工場較正され、前記増幅器のメモリに記憶される、m．前記増幅器に少なくとも２つの所定の等化設定値を記憶する手段、および、
n．２００Ｈｚより下の周波数でのノイズキャンセリングの手段、
を具備する、システム。
〔１８〕
前記イヤーカップは、耳を完全に、例えば、サーカムオーラルの方法で覆っている、〔１７〕に記載のシステム。
〔１９〕
前記基準は、測定によって、または基準ドライバまたはイヤーカップによって得られる所定の周波数応答である、〔１７〕または〔１８〕に記載のシステム。
〔２０〕
前記ヘッドホン及び前記ヘッドホン増幅器は、ケーブルによって互いに接続された別個の独立したユニットである、〔１７〕〜〔１９〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２１〕
前記ヘッドホンの各ドライバまたはイヤーカップは、設定された基準イヤーカップまたはドライバに対して工場較正され、前記増幅器のメモリにおいて記憶され、それにより、前記工場較正は、設定された基準イヤーカップまたはドライバに基づいて、前記ヘッドホンシステムのすべての前記イヤーカップを、音響的に本質的に同じ、例えば、同じ応答、同じラウドネスにする、〔１７〕〜〔２０〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２２〕
前記ヘッドホン増幅器及び前記ヘッドホンは、前記工場較正に基づいて固有のペアを構成する、〔１７〕〜〔２１〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２３〕
前記アクティブヘッドホンシステムは、前記ヘッドホンの前記ユーザのためのルームの表現を生成するために、信号処理パラメータを使用して前記オーディオを外在化する手段を含む、〔１７〕〜〔２２〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２４〕
外在化機能がバイノーラルフィルタの支援によって実施される、〔１７〕〜〔２３〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２５〕
バイノーラルフィルタは、
ｏ．オールパスフィルタまたは
ｐ．位相応答及びマグニチュード応答を有するフィルタ、
である、〔１７〕〜〔２４〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２６〕
前記ラウドスピーカーの前記伝達関数が前記ヘッドホンシステムにインポートされる、〔１７〕〜〔２５〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２７〕
前記ヘッドホンシステムの前記伝達関数が前記ラウドスピーカーシステムにエクスポートされる、〔１７〕〜〔２６〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２８〕
前記ボリューム制御は、前記ラウドスピーカー及び前記ホンについて同じである、〔１７〕〜〔２７〕のいずれか一項に記載のアクティブヘッドホンシステム。
〔２９〕
〔１〕〜〔１６〕の方法の少なくとも１つに記載の方法を実施させるように構成されたコンピュータプログラム。

頭字語一覧
ＩＩＲ無限インパルス応答
ＦＩＲ有限インパルス応答
ＩＲインパルス応答
ＡＲＭ適応マルチレートオーディオデータ圧縮方式
ＧＬＭジェネレックラウドスピーカー管理
ＳＰＬ音圧レベル
ＩＳＳスリープ制御
ＥＡＩエンハンスト低周波アイソレーション

引用文献一覧
非特許文献
Kirkeby、O.、「A Balanced Stereo Widening Network for Headphones」、オーディオエンジニアリング学会、第２２回国際協議会、Virtual、Synthetic、Entertainment Audio、２００２年。
Lorho、G.、Isherwood、D.、Zacharov、N.、及びHuopaniemi、J.、「Round Robin Subjective Evaluation of Stereo Enhancement System for Headphones」、オーディオエンジニアリング学会、第２２回国際協議会、Virtual、Synthetic、Entertainment Audio、２００２年。
B. Masiero及びJ. Fels、「Perceptually robust headphone equalization for binaural reproduction」、オーディオエンジニアリング協定１３０、２０１１年５月。
SG Norcross、GA Soulodre、及びMC Lavoie、「Subjective investigations of inverse filtering」、J.Audio Eng． Soc、vol．５２、no．１０、１００３―１０２８頁、２００４年。
Z.Schaerer and A. Lindau、「Evaluation of equalization methods for binaural signals」、オーディオエンジニアリング協定１２６、２００９年５月。

参照符号一覧
１両耳用ドライバを含むステレオヘッドホン
２ヘッドホン増幅器
３ヘッドホンケーブル
３０バッテリー
３１充電サブシステム
３２ＳＭＰＳ電源及びバッテリー管理
３３ＵＳＢ入力
３４ローカルユーザインターフェース
３５アナログ入力
３６アナログ・デジタル変換（ＡＤＣ）
３７適応マルチレート（ＡＭＲ）とデジタル信号処理（ＤＳＰ）
３８デジタルアナログ変換（ＤＡＣ）
３９パワー増幅器
４０パワー増幅器
４１自動較正モジュール
４２耳較正モジュール
４３工場イコライザー／較正
４５ボリューム制御
４６ダイナミクスプロセッサ
４７ＵＳＢインターフェース機能
４８ソフトウェアインターフェース
４９メモリ管理
５０電源及びバッテリー管理
５１ソフトウェアを作動させるコンピュータ
５２ユーザインターフェース用コネクタケーブル
５４ヘッドホン増幅器の制御ノブ
５５電源ケーブル
５６携帯端末
６０ヘッドホン改善要素
６１モニタリング改善要素
Ｂ_１-Ｂ_ｎオーディオサブバンド
Δｆサブバンドの帯域幅、通常は１オクターブ

Claims

ヘッドホン等化のために、ヘッドホン及び聴取者の耳によって抑制されたボリューム内で生成される共振及び散乱によるピーク及びノッチを含むステレオヘッドホン伝達関数の反転を正則化する方法であって、前記等化のためのシグマ反転式：
を使用することを特徴とし、この式において、
・
は、シグマ反転であり、
・Ｈ（ω）は、応答であり、
・Ｈ^*（ω）は、応答の複素共役であり、
・Ｄ（ω）は、応答Ｈ（ω）の正則化された反転
を生成するために導入される遅延フィルタであり、
・
は周波数依存パラメータであり、
・α（ω）は、ヘッドホンの再生帯域幅であり、
・σ（ω）は、その帯域幅内で必要とされる正則化の推定値である、
方法。
前記周波数依存パラメータ
は、前記ヘッドホン再生帯域幅の推定値α（ω）と、その帯域幅内で必要とされる前記正則化の推定値σ（ω）とを組み合わせて決定され、パラメータ
を定義し、それは、次に、
（５）
として定義され、ここにおいて、前記パラメータα（ω）は、反転の前記帯域幅を決定し、それは、α（ω）がゼロに近いかゼロに等しい周波数範囲として定義され、前記新しい正則化係数σ（ω）は、 α（ω）によって定義される前記帯域幅内の前記反転の影響を制御し、前記ヘッドホン再生帯域幅が既知である場合、α（ω）は、ユニティゲインフィルタＷ（ω）を用いて、
（６）
として定義され、それにより、Ｗ（ω）のフラットな通過帯域は、前記ヘッドホンの再生帯域幅、典型的には高品質のヘッドホンの場合には２０Ｈｚ乃至２０ｋＨｚに相当し、同様に、ノイズパワースペクトル推定が利用可能であれば、α（ω）は、
（７）
として定義され、前記応答における近接周波数ビン間の強い変動を防ぐために、雑音包絡線の推定Ｎ（ω）、例えば平滑化スペクトル、が使用されるべきであり、前記新しい正則化係数σ（ω）は、前記ノッチのマグニチュード
を減じる前記応答から測定された応答Ｈ（ω)の負の偏差として定義され、例えば、
は、前記ヘッドホン応答の平滑化されたバージョンを使用して定義されることができ、これに基づいて、σ（ω）は、
（８）
として決定され、したがって、
に対してσ^２（ω）＞０であり、前記パラメータ
は、平滑化ウィンドウよりも狭いノッチ周波数で大きな正則化値を含む、
請求項１に記載の方法。
メモリ及び信号処理特性を有する増幅器を含み、前記ヘッドホンの各ドライバ又はイヤーカップを設定された基準イヤーカップ又はドライバに対して較正し、前記増幅器の前記メモリに前記較正設定を記憶するステップを備える、請求項１に記載の方法。
前記ヘッドホンの所望の音属性は、測定によって、または前記ヘッドホンのユーザから受信された入力情報に基づいて前記所望の音属性を得るために、増幅器において信号処理パラメータを設定することによって決定される、請求項１に記載の方法。
少なくともマグニチュード応答、典型的には周波数応答（位相応答を含む）を較正するステップ（工場較正）を含む、請求項１に記載の方法。
前記音属性は、以下の特徴：「周波数応答」、「時間応答」、「位相応答」、または「感度」のうちの少なくとも１つを含む、請求項４に記載の方法。
周波数応答のような前記所望の音属性は、特定のルームのラウドスピーカーシステムの較正パラメータに基づいて決定される、請求項６に記載の方法。
外在化機能が、前記ヘッドホンのユーザのためのルーム表現を生成するために、信号処理パラメータについて実施される、請求項１に記載の方法。
外在化機能は、それがオールパスフィルタであるように、バイノーラルフィルタの支援によって実施される、請求項８に記載の方法。
前記バイノーラルフィルタは、一定のマグニチュード応答（マグニチュード／振幅は周波数の関数として変化しない）を有するが、前記バイノーラルフィルタの位相応答のみがインプリメントされる、請求項９に記載の方法。
前記バイノーラルフィルタは、ＦＩＲフィルタである、請求項９に記載の方法。
i．テスト信号は、第１のサブバンド（Ｂ_１）を通じてラウドスピーカーによって再生され、
a．前記テスト信号は、前記第１のサブバンド（Ｂ_１）を通じてヘッドホンによって再生され、
b．前記第１のサブバンド（Ｂ_１）を通じて前記ラウドスピーカーによって再生された前記テスト信号で、前記第１のサブバンド（Ｂ_１）を通じて前記ヘッドホンによって再生された前記テスト信号の音レベルのような音属性を評価し、前記サブバンドＢ_１の前記ラウドスピーカーと本質的に同じであるように前記ヘッドホンの音レベルのような前記音属性を設定して記憶し、
c．複数のサブバンドＢ_１乃至Ｂ_ｎを通じて前記テスト信号で上記の手順を繰り返す、請求項１に記載の方法。
前記テスト信号は、ピンクノイズである、請求項１２に記載の方法。
前記テスト信号は、広域スペクトルコンテンツを有するオーディオ信号を含む音楽的なオーディオファイルである、請求項１２または１３に記載の方法。
前記テスト信号の持続時間は、１乃至１０秒である、請求項１２乃至１４のいずれか一項に記載の方法。
前記テスト信号は、連続的に繰り返される、請求項１２乃至１５のいずれかに記載の方法。
コンピュータに、請求項１乃至１６のいずれか一項に記載の方法を実施させるように構成されたコンピュータプログラム。