まず、図1を参照しながら実施形態に係る頭部伝達関数生成装置を説明する上で使用する耳軸座標系について説明する。図1は、実施形態に係る受聴者と、受聴者を基準とした水平面、正中面、矢状面、耳軸、側方角及び上昇角を示す図である。
図1に示した耳軸座標系は、次のように定義される。耳軸Aは、受聴者Pの左右の外耳道入口を結ぶ直線である。原点は、受聴者Pの左右の外耳道入口を結んでおり、耳軸A上に位置する線分の中点である。水平面Hは、右眼窩点と左右の耳珠を結ぶ平面である。正中面Mは、水平面と直交し、受聴者Pを左右に二等分する面である。矢状面Sは、正中面Mと平行な任意の平面である。また、耳軸座標系は、音源が位置する方向を側方角α及び上昇角βにより表す。側方角αは、音源が位置する点と原点とを結ぶ直線が耳軸Aとなす角の余角である。上昇角βは、音源が位置する点を通る矢状面S内における仰角である。
次に図2を参照しながら実施形態に係る頭部伝達関数生成装置を構成しているハードウェアについて説明する。
図2は、実施形態に係る頭部伝達関数生成装置を構成しているハードウェアの一例を示す図である。図2に示すように、頭部伝達関数生成装置1は、プロセッサ11と、主記憶装置12と、通信インターフェース13と、補助記憶装置14と、入出力装置15と、バス16とを備える。
プロセッサ11は、例えば、CPU(Central Processing Unit)であり、頭部伝達関数生成プログラムを読み出して実行し、頭部伝達関数生成装置1が有する各機能を実現させる。また、プロセッサ11は、頭部伝達関数生成プログラム以外のプログラムを読み出して実行し、頭部伝達関数生成装置1が有する各機能を実現させる上で必要な機能を実現させてもよい。
主記憶装置12は、例えば、RAM(Random Access Memory)であり、プロセッサ11により読み出されて実行される意思決定支援プログラム、その他プログラムを予め記憶している。
通信インターフェース13は、ネットワークを介して他の機器と通信を実行するためのインターフェース回路である。ネットワークは、例えば、インターネット、イントラネット、WAN(Wide Area Network)、LAN(Local Area Network)である。
補助記憶装置14は、例えば、ハードディスクドライブ(HDD:Hard Disk Drive)、ソリッドステートドライブ(SSD:Solid State Drive)、フラッシュメモリ(Flash Memory)、ROM(Read Only Memory)である。
入出力装置15は、例えば、入出力ポート(Input/Output Port)である。入出力装置15は、例えば、図2に示したマウス151、キーボード152及びディスプレイ153が接続される。マウス151及びキーボード152は、例えば、頭部伝達関数生成装置1を操作するために必要なデータを入力する作業に使用される。ディスプレイ153は、例えば、液晶ディスプレイである。ディスプレイ153は、例えば、頭部伝達関数生成装置1のグラフィカルユーザインターフェース(GUI:Graphical User Interface)、後述する図8に示した内容等を表示する。
バス16は、プロセッサ11、主記憶装置12、通信インターフェース13、補助記憶装置14及び入出力装置15を互いにデータの送受信が可能なように接続している。
次に、図3から図24を参照しながら実施形態に係る頭部伝達関数生成装置の機能的な構成について説明する。
図3は、実施形態に係る頭部伝達関数生成装置の機能的な構成の一例を示す図である。図3に示すように、頭部伝達関数生成装置1は、実測頭部インパルス応答取得部101と、初期頭部伝達関数生成部102と、周波数帯域分割部103と、モデル化頭部伝達関数生成部104と、耳介形状取得部105と、周波数帯域特定部106と、関係導出部107と、周波数帯域推定部108と、個人化頭部伝達関数生成部109と、個人化頭部インパルス応答生成部110とを備える。
実測頭部インパルス応答取得部101は、学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する。図4は、実施形態に係る受聴者と、受聴者を基準とした正中面における上昇角を30度刻みで示した図である。例えば、実測頭部インパルス応答取得部101は、正中面Mにおける上昇角βが0度、30度、60度、90度、120度、150度又は180度の方向に配置された音源から受聴者Pの外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する。なお、図4に示すように、上昇角βが0度の方向は、受聴者Pの正面方向と一致している。また、図4に示すように、上昇角βが0度の方向は、受聴者Pの正面方向と反対の方向と一致している。
図5は、実施形態に係る実測頭部インパルス応答の一例を示す図である。頭部インパルス応答(HRIR:Head-Related Impulse Response)は、音源から受聴者の外耳道入口に到達する音波が受聴者の頭部及びその周辺の影響を受けることによる物理特性の変化を時間領域で表現したものである。実測頭部インパルス応答は、実際に音波を測定することにより生成された頭部インパルス応答である。図5に示すように、実測頭部インパルス応答は、受聴者の外耳道入口に到達した音波の相対強度の時間変化を表す。
また、実測頭部インパルス応答は、フーリエ変換により実測頭部伝達関数に変換される。頭部伝達関数(HRTF:Head-Related Transfer Function)は、音源から受聴者の外耳道入口に到達する音波が受聴者の頭部及びその周辺の影響を受けることによる物理特性の変化を周波数領域で表現したものである。実測頭部伝達関数は、実際に音波を測定することにより生成された頭部伝達関数である。
図6は、実施形態に係る受聴者の右耳の実測頭部伝達関数及び左耳の頭部伝達関数の一例を示す図である。図6は、横軸が音源から出力された音波の周波数を示しており、縦軸が受聴者の右耳又は左耳に到達した音波の相対振幅を示している。また、ここで言う相対振幅は、受聴者の右耳又は左耳の位置にマイクロフォンが存在し、受聴者が存在しない場合に観測される振幅を基準とし、受聴者の頭部、胴体等の存在により当該振幅よりも大きくなった振幅を正の量として示し、受聴者の頭部、胴体等の存在により当該振幅よりも小さくなった振幅を正の量として示している。また、当該基準は、図6において一点鎖線で示されている。
図6に示した実線は、受聴者の右耳に入射した音波の実測頭部インパルス応答をフーリエ変換することにより生成された実測頭部伝達関数を示している。図6に示した破線は、受聴者の左耳に入射した音波の実測頭部インパルス応答をフーリエ変換することにより生成された実測頭部伝達関数を示している。また、図6の上から一段目、二段目、三段目、四段目、五段目、六段目及び七段目は、それぞれ正中面Mにおける上昇角βが0度、30度、60度、90度、120度、150度、180度の方向に配置された音源から受聴者の外耳道入口に到達した音波の実測頭部伝達関数を示している。
図6に示すように、頭部伝達関数は、音源が位置する方向により異なり、受聴者の右耳と左耳とでも異なる。なぜなら、受聴者の頭部の形状、胴体の形状及び耳介の形状が受聴者を基準とした前後方向、左右方向及び上下方向のいずれにおいても非対称であるためである。このため、頭部伝達関数は、音源が位置する方向を受聴者が知覚する場合の手掛かりとなる。
また、音源が特定の方向に位置する場合における受聴者の頭部伝達関数は、当該特定の方向に位置する音像を当該受聴者に知覚させる。音像は、受聴者の鼓膜に音波が到達した場合に受聴者が知覚するものの総体であり、当該知覚により受聴者が感じる心理的なものである。例えば、音像は、残響感、リズム感、持続感等の時間的性質、方向感、距離感、広がり感等の空間的性質、大きさ、高さ、音色等の質的性質を含んでいる。また、受聴者が音像の空間的な位置を知覚することを音像定位と呼ぶ。
頭部伝達関数は、受聴者に音像を知覚させるため、適切に再現された場合、三次元音響システム、音のバーチャルリアリティ等を実現する上で重要な概念である。しかしながら、頭部伝達関数の受聴者ごとの差がこれらの技術の実現のハードルとなっている。
初期頭部伝達関数生成部102は、実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出する。ここで言う窓関数は、例えば、ブラックマン‐ハリス窓、実測頭部インパルス応答に含まれる相対強度が最大のピークから所定の時間が経過するまでの期間のみを取り出す階段関数である。図7は、実施形態に係る初期頭部インパルス応答の一例を示す図である。図7は、横軸が時間を示しており、縦軸が相対強度を示している。例えば、初期頭部伝達関数生成部102は、図5に示した頭部インパルス応答に所定の窓関数を掛けて図7に示した初期頭部インパルス応答を算出する。
そして、初期頭部伝達関数生成部102は、初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する。図8は、実施形態に係る初期頭部伝達関数、周波数帯域及びモデル化頭部伝達関数の一例を示す図である。例えば、初期頭部伝達関数生成部102は、図8に実線で示した初期頭部伝達関数を示すデータを生成する。なお、初期頭部伝達関数は、実測頭部インパルス応答に含まれる相対強度が最大のピークから1ミリ秒程度が経過するまでの時間を取り出す窓関数により算出された場合、比較的ノイズが少ない滑らかな頭部伝達関数となることが多い。
周波数帯域分割部103は、初期頭部伝達関数を複数の周波数帯域に分割する。例えば、周波数帯域分割部103は、図8に実線で示した初期頭部伝達関数を図8に一点鎖線で示した周波数帯域に分割する。各周波数帯域は、図8に示した互いに隣接する一点鎖線で挟まれた帯域である。
モデル化頭部伝達関数生成部104は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理を実行する。ピークは、頭部伝達関数のうち上に凸となっている部分を指す。ノッチは、頭部伝達関数のうち下に凸となっている部分を指す。
次に、モデル化頭部伝達関数生成部104は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいて相対振幅を決定する処理を実行する。例えば、モデル化頭部伝達関数生成部104は、初めに、各周波数帯域に含まれている変曲点を探索する。モデル化頭部伝達関数生成部104は、周波数帯域において変曲点を一つ発見した場合、当該変曲点により示される相対振幅を当該周波数帯域の相対振幅と決定する。また、モデル化頭部伝達関数生成部104は、周波数帯域において変曲点を二つ以上発見した場合、これらの変曲点により示される相対振幅のうち最大の相対振幅を当該周波数帯域の相対振幅と決定する。また、モデル化頭部伝達関数生成部104は、周波数帯域において変曲点を発見し得なかった場合、当該周波数帯域の中心周波数における相対振幅を当該周波数帯域の相対振幅と決定する。
そして、モデル化頭部伝達関数生成部104は、各周波数帯域における相対振幅を示す点の間を補間することにより受聴者の個人化頭部伝達関数を示すデータを生成する。例えば、モデル化頭部伝達関数生成部104は、これらの点を線分で結ぶことにより、図8に破線で示した個人化頭部伝達関数を示すデータを生成する。
また、モデル化頭部伝達関数生成部104は、周波数帯域分割部103により設定される周波数帯域の幅により異なる精度で初期頭部伝達関数を再現する。そこで、次に、図9から図13を参照しながら、周波数帯域の幅と初期頭部伝達関数の再現精度との関係について説明する。
図9は、実施形態に係る初期頭部伝達関数及び1オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図9は、実線が初期頭部伝達関数を示しており、破線が1オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。
図9に示すように、1オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部104は、初期頭部伝達関数に含まれているピークP2、ピークP3、第一ノッチN1及び第二ノッチN2をモデル化頭部伝達関数により再現し得ていない。なお、第一ノッチN1及び第二ノッチN2は、受聴者が正中面内において音像が位置する方向の上昇角を知覚する場合に重要な役割を果たす。
図10は、実施形態に係る初期頭部伝達関数及び1/2オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図10は、実線が初期頭部伝達関数を示しており、破線が1/2オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。
図10に示すように、1/2オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部104は、初期頭部伝達関数に含まれているピークP2、第一ノッチN1及び第二ノッチN2を一定程度再現している。しかし、この場合、モデル化頭部伝達関数においてピークP2が極大となる周波数、第一ノッチN1が極小となる周波数及び第二ノッチN2が極小となる周波数は、初期頭部伝達関数におけるこれらの周波数と大きく異なっている。また、この場合、モデル化頭部伝達関数生成部104は、初期頭部伝達関数に含まれているピークP3を再現し得ていない。
図11は、実施形態に係る初期頭部伝達関数及び1/3オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図11は、実線が初期頭部伝達関数を示しており、破線が1/3オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。
図11に示すように、1/3オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部104は、初期頭部伝達関数に含まれているピークP2、ピークN3、第一ノッチN1及び第二ノッチN2を一定程度再現している。ただし、この場合、モデル化頭部伝達関数においてピークP2が極大となる周波数、ピークP3が極大となる周波数、第一ノッチN1が極小となる周波数及び第二ノッチN2が極小となる周波数は、初期頭部伝達関数におけるこれらの周波数と若干異なっている。
図12は、実施形態に係る初期頭部伝達関数及び1/6オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図12は、実線が初期頭部伝達関数を示しており、破線が1/6オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。
図12に示すように、1/6オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部104は、初期頭部伝達関数に含まれているピークP2、ピークN3、第一ノッチN1及び第二ノッチN2を比較的精度良く再現している。
図13は、実施形態に係る初期頭部伝達関数及び1/12オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図13は、実線が初期頭部伝達関数を示しており、破線が1/12オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。
図13に示すように、1/12オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部104は、初期頭部伝達関数に含まれているピークP2、ピークN3、第一ノッチN1及び第二ノッチN2を比較的精度良く再現している。
また、モデル化頭部伝達関数生成部104による初期頭部伝達関数の再現精度は、受聴者による音像定位に影響を与える。そこで、図14から図19を参照しながら、初期頭部伝達関数の再現精度が受聴者による音像定位に与える影響について説明する。
図14は、実測頭部伝達関数を使用した音像定位実験における音像の方向と学習用受聴者が解答した方向と関係の一例を示す図である。図14は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図14に示すように、実測頭部伝達関数を使用した場合、正中面内において音像が位置する上昇角と、受聴者が解答した上昇角とが略一致していることが分かる。
図15は、1オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験における音像の方向と学習用受聴者が解答した方向と関係の一例を示す図である。図15は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図15に示すように、1オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、0度から150度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが頻発していることが分かる。
図16は、1/2オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。図16は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図16に示すように、1/2オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、0度から150度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが頻発していることが分かる。
図17は、1/3オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。図17は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図17に示すように、1/3オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、90度から150度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが散見されるものの、両者が概ね一致していることが分かる。
図18は、1/6オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。図18は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図18に示すように、1/6オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、90度から150度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが散見されるものの、両者が概ね一致していることが分かる。
図19は、1/12オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。図19は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図19に示すように、1/12オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、90度から150度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが散見されるものの、両者が概ね一致していることが分かる。
したがって、周波数帯域分割部103により設定される周波数帯域の幅は、1/12オクターブから1/3オクターブであることが好ましく、1/12オクターブから1/6オクターブであることが更に好ましい。これにより、図9から図13に示したピークP2、ピークP3、第一ノッチN1及び第二ノッチN2が互いに異なる周波数帯域に含まれることとなるため、モデル化頭部伝達関数生成部104は、初期頭部伝達関数の特徴的な構造を比較的精度良く再現することができる。
次に、頭部伝達関数生成装置1が第一ノッチを含む周波数帯域と学習用受聴者の耳介の形状との関係を導出する処理及び第二ノッチを含む周波数帯域と学習用受聴者の耳介の形状との関係を導出する処理について説明する。
耳介形状取得部105は、受聴者の耳介の形状を示すデータを取得する。図20は、実施形態に係る学習用受聴者の耳介の形状のうち測定の対象となる箇所の一例を示す図である。
例えば、耳介形状取得部105は、図20に示した点p1から点p10の座標を示すデータを取得する。点p0は、外耳道入口上の点であり、極座標の原点と定義されている。図20に示した曲線C1、曲線C2及び曲線C3は、それぞれ耳輪の内側境界線、対輪に沿った線及び耳甲介の外側境界線を表している。図20に示した120度から270度は、いずれも上昇角である。図20に示すように、点p1から点p10は、曲線C1、曲線C2又は曲線C3と、点p0を通るいずれかの直線との交点であり、上述した極座標上に位置している。また、点p1から点p10は、例えば、学習用受聴者の横顔の写真を使用して決定される。
周波数帯域特定部106は、第一ノッチを含んでいる第一周波数帯域及び第二ノッチを含んでいる第二周波数帯域を特定する。第一ノッチは、学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が最も低いノッチである。第二ノッチは、学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が二番目に低いノッチである。
関係導出部107は、複数の周波数帯域ごとに、第一周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。
例えば、関係導出部107は、第一処理において、学習用受聴者の耳介の形状を説明変数とし、複数の周波数帯域を目的変数とする判別分析を実行することにより、第一処理により導出される関係として第一相関行列を算出する。第一相関行列は、周波数帯域ごとに算出される。また、この場合、第一尺度は、マハラノビス距離又は当該マハラノビス距離を使用して算出される値となる。当該マハラノビス距離は、学習用受聴者の耳介の形状に関するパラメータを並べた行ベクトルと、第一相関行列と、学習用受聴者の耳介の形状に関するパラメータを並べた列ベクトルとの積である。
さらに、関係導出部107は、第一相関行列及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の周波数帯域のうち第一確率が最も大きな周波数帯域を第一周波数帯域と特定する。
また、関係導出部107は、複数の周波数帯域ごとに、第二周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。
例えば、関係導出部107は、第二処理において、学習用受聴者の耳介の形状を説明変数とし、複数の周波数帯域を目的変数とする判別分析を実行することにより、第二処理により導出される関係として第二相関行列を算出する。第二相関行列は、周波数帯域ごとに算出される。また、この場合、第二尺度は、マハラノビス距離又は当該マハラノビス距離を使用して算出される値となる。当該マハラノビス距離は、学習用受聴者の耳介の形状に関するパラメータを並べた行ベクトルと、第二相関行列と、学習用受聴者の耳介の形状に関するパラメータを並べた列ベクトルとの積である。
さらに、関係導出部107は、第二相関行列及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の周波数帯域のうち第二確率が最も大きな周波数帯域を第二周波数帯域と特定する。
また、関係導出部107は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、第一修正処理及び第二修正処理の少なくとも一方を実行してもよい。ここで言う所定の下限閾値は、例えば、「3」である。また、ここで言う所定の上限閾値は、例えば、「8」である。また、第一修正処理は、第一確率が二番目に大きな周波数帯域を第一周波数帯域と特定し直す処理である。また、第二修正処理は、第二確率が二番目に大きな周波数帯域を第二周波数帯域と特定し直す処理である。
第一ノッチが含まれ得る周波数帯域及び第二ノッチが含まれる周波数帯域は、いずれも1オクターブ程度の範囲に跨っており、一部が重複している。このため、関係導出部107は、第一修正処理及び第二修正処理の少なくとも一方を実行することにより、更に精度良く第一周波数帯域及び第二周波数帯域を特定することができる。
また、関係導出部107は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、学習用受聴者の耳介の所定の寸法が第一閾値未満である場合、第一修正処理を実行してもよい。これは、受聴者の耳介が小さい場合、初めに第一周波数帯域であると特定された周波数帯域が誤りであることが多いことによる。
また、関係導出部107は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、学習用受聴者の耳介の所定の寸法が第二閾値を超えている場合、第二修正処理を実行してもよい。これは、受聴者の耳介が大きい場合、初めに第二周波数帯域であると特定された周波数帯域が誤りであることが多いことによる。
次に、頭部伝達関数生成装置1が推論用受聴者の耳介の形状、第一処理により導出された関係及び第二処理により導出された関係を使用して推論用受聴者の個人化頭部伝達関数の第一ノッチを含む周波数帯域及び推論用受聴者の個人化頭部伝達関数の第二ノッチを含む周波数帯域を推定する処理について説明する。
耳介形状取得部105は、推論用受聴者の耳介の形状を示すデータを取得する。当該データは、例えば、図20を参照しながら説明したデータと同様のデータである。
周波数帯域推定部108は、第三処理を実行する。具体的には、周波数帯域推定部108は、複数の周波数帯域ごとに、推論用受聴者の耳介の形状及び第一相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出する。そして、周波数帯域推定部108は、第三確率が最も大きな周波数帯域を第三周波数帯域と推定する。
また、周波数帯域推定部108は、第四処理を実行する。具体的には、周波数帯域推定部108は、複数の周波数帯域ごとに、推論用受聴者の耳介の形状及び第二相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出する。そして、周波数帯域推定部108は、第四確率が最も大きな周波数帯域を第四周波数帯域と推定する。
例えば、周波数帯域推定部108は、第三周波数帯域及び第四周波数帯域を推定する場合、次の式(1)を使用する。式(1)は、推論用受聴者の耳介の形状を示すパラメータx1、x2、x3、x4、x5、x6、x7、x8、x9及びx10を要素とする行ベクトルと、これらを要素とする列ベクトルと、xj(j=1,2,3,…,10)とxk(k=1,2,3,…,10)との相関係数rj,kを要素とする相関行列の逆行列との積がマハラノビス距離Dの二乗に等しいことを表している。また、式(1)に含まれる行列の逆行列は、上述した第一相関行列及び第二相関行列の一例である。また、式(1)に含まれるマハラノビス距離Dは、上述した第一尺度及び第二尺度の一例である。例えば、周波数帯域推定部108は、マハラノビス距離が最小となる周波数帯域を第一周波数帯域と推定し、マハラノビス距離が最小となる周波数帯域を第二周波数帯域と推定する。
さらに、周波数帯域推定部108は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、第三修正処理及び第四修正処理の少なくとも一方を実行してもよい。ここで言う所定の下限閾値は、例えば、「3」である。また、ここで言う所定の上限閾値は、例えば、「8」である。また、第三修正処理は、第三確率が二番目に大きな周波数帯域を第三周波数帯域と推定し直す処理である。また、第四修正処理は、第四確率が二番目に大きな周波数帯域を第四周波数帯域と推定し直す処理である。例えば、周波数帯域推定部108は、式(1)を使用して算出されたマハラノビス距離が二番目に大きな周波数帯域を第三周波数帯域や第四周波数帯域と推定し直す。
個人化頭部伝達関数についてもモデル化頭部伝達関数と同様に、第一ノッチが含まれ得る周波数帯域及び第二ノッチが含まれる周波数帯域は、いずれも1オクターブ程度の範囲に跨っており、一部が重複している。このため、周波数帯域推定部108は、第三修正処理及び第四修正処理の少なくとも一方を実行することにより、更に精度良く第三周波数帯域及び第四周波数帯域を特定することができる。
また、周波数帯域推定部108は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、推論用受聴者の耳介の所定の寸法が第三閾値未満である場合、第三修正処理を実行してもよい。これは、推定用受聴者の耳介が小さい場合、初めに第三周波数帯域であると推定された周波数帯域が誤りであることが多いことによる。
また、周波数帯域推定部108は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、推論用受聴者の耳介の所定の寸法が第四閾値を超えている場合、第四修正処理を実行してもよい。これは、受聴者の耳介が大きい場合、初めに第四周波数帯域であると特定された周波数帯域が誤りであることが多いことによる。
次に、図21を参照しながら、頭部伝達関数生成装置1が個人化頭部伝達関数及び個人化頭部インパルス応答を生成する処理の一例について説明する。図21は、実施形態に係る頭部伝達関数生成装置が個人化頭部伝達関数及び個人化頭部インパルス応答を生成する処理の一例を示す概念図である。
個人化頭部伝達関数生成部109は、周波数帯域推定部108が第三周波数帯域及び第四周波数帯域を推定した結果を使用して推論用受聴者の個人化頭部伝達関数を生成する。
具体的には、図21に示すように、個人化頭部伝達関数生成部109は、周波数帯域推定部108が推論用受聴者の耳介の形状、第一相関行列及び第二相関行列に基づいて推定した第三周波数帯域を示すデータ及び第四周波数帯域を示すデータを取得する。
そして、個人化頭部伝達関数生成部109は、例えば、第一ピークの周波数及び相対振幅を表す点、第三周波数帯域の中心周波数及び相対振幅を表す点、第二ピークの周波数及び相対振幅を表す点及び第四周波数帯域の中心周波数及び相対振幅を表す点を直線補間等により補間し、推論用受聴者の個人化頭部伝達関数を生成する。第一ピークは、第一ノッチよりも低い周波数領域に現れるピークである。第二ピークは、第一ノッチよりも高く、第二ノッチよりも低い周波数領域に現れるピークである。個人化頭部伝達関数生成部109は、個人化頭部伝達関数を示すデータを個人化頭部インパルス応答生成部110及び頭部伝達関数生成装置1の外部に出力する。
個人化頭部インパルス応答生成部110は、図21に示すように、個人化頭部伝達関数生成部109により生成された個人化頭部伝達関数を逆フーリエ変換し、個人化頭部インパルス応答を生成する。また、個人化頭部インパルス応答生成部110は、個人化頭部インパルス応答を示すデータを頭部伝達関数生成装置1の外部に出力する。
次に、図22から図24を参照しながら実施形態に係る頭部伝達関数生成装置が上述した周波数帯域の少なくとも二つを統合した統合周波数帯域を生成して使用する場合について説明する。なお、図1から図21を参照しながら説明した内容と重複する内容に関する説明を適宜省略する。
図22は、実施形態に係る頭部伝達関数生成装置の機能的な構成の一例を示す図である。図22に示すように、頭部伝達関数生成装置1aは、実測頭部インパルス応答取得部101と、初期頭部伝達関数生成部102と、周波数帯域分割部103と、モデル化頭部伝達関数生成部104と、耳介形状取得部105と、周波数帯域統合部106aと、統合周波数帯域特定部107aと、関係導出部108aと、統合周波数帯域推定部109aと、個人化頭部伝達関数生成部110aと、個人化頭部インパルス応答生成部111aとを備える。
周波数帯域統合部106aは、複数の周波数帯域を統合した統合周波数帯域を少なくとも二つ生成する。図23及び図24は、実施形態に係る統合周波数帯域の一例を示す図である。
例えば、周波数帯域統合部106aは、図23に番号「42」で示されている周波数帯域を選択し、当該周波数帯域に隣接しており図23に番号「41」で示されている周波数帯域及び当該周波数帯域に隣接しており図23に番号「43」で示されている周波数帯域と統合する。これにより、周波数帯域統合部106aは、図23に番号「1」で示されている統合周波数帯域を生成する。
また、例えば、周波数帯域統合部106aは、図23に番号「45」で示されている周波数帯域を選択し、当該周波数帯域に隣接しており図23に番号「44」で示されている周波数帯域及び当該周波数帯域に隣接しており図23に番号「46」で示されている周波数帯域と統合する。これにより、周波数帯域統合部106aは、図23に番号「2」で示されている統合周波数帯域を生成する。
また、例えば、周波数帯域統合部106aは、図24に番号「48」で示されている周波数帯域を選択し、当該周波数帯域に隣接しており図24に番号「47」で示されている周波数帯域及び当該周波数帯域に隣接しており図24に番号「48」で示されている周波数帯域と統合する。これにより、周波数帯域統合部106aは、図24に番号「1」で示されている統合周波数帯域を生成する。
また、例えば、周波数帯域統合部106aは、図24に番号「51」で示されている周波数帯域を選択し、当該周波数帯域に隣接しており図24に番号「50」で示されている周波数帯域及び当該周波数帯域に隣接しており図24に番号「52」で示されている周波数帯域と統合する。これにより、周波数帯域統合部106aは、図24に番号「2」で示されている統合周波数帯域を生成する。
図23及び図24に示した統合周波数帯域は、いずれも±(1/12+1/24)=±1/8≒±0.125オクターブの周波数幅を有する。この周波数幅は、受聴者が正中面内において音像が位置する方向の上昇角を弁別可能な周波数幅と同程度の周波数幅である。
なお、図23及び図24に示した中心周波数は、各周波数帯域の中心周波数を示している。また、図23に示した耳介の数は、第一ノッチが各周波数帯域に含まれていると推定された耳介の数を示している。また、図24に示した耳介の数は、第二ノッチが各周波数帯域に含まれていると推定された耳介の数を示している。
統合周波数帯域特定部107aは、第一ノッチを含んでいる第一統合周波数帯域及び第二ノッチを含んでいる第二統合周波数帯域を特定する。
関係導出部108aは、複数の統合周波数帯域ごとに、第一統合周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。
例えば、関係導出部108aは、第一処理において、学習用受聴者の耳介の形状を説明変数とし、複数の統合周波数帯域を目的変数とする判別分析を実行することにより、第一処理により導出される関係として第一相関行列を算出する。また、この場合、第一尺度は、マハラノビス距離又は当該マハラノビス距離を使用して算出される値となる。
さらに、関係導出部107は、第一相関行列及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の統合周波数帯域のうち第一確率が最も大きな統合周波数帯域を第一統合周波数帯域と特定する。
また、関係導出部108aは、複数の統合周波数帯域ごとに、第二統合周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。
例えば、関係導出部108aは、第二処理において、学習用受聴者の耳介の形状を説明変数とし、複数の統合周波数帯域を目的変数とする判別分析を実行することにより、第二処理により導出される関係として第二相関行列を算出する。また、この場合、第二尺度は、マハラノビス距離又は当該マハラノビス距離を使用して算出される値となる。
さらに、関係導出部107は、第二相関行列及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の統合周波数帯域のうち第二確率が最も大きな統合周波数帯域を第二統合周波数帯域と特定する。
次に、頭部伝達関数生成装置1aが推論用受聴者の耳介の形状、第一処理により導出された関係及び第二処理により導出された関係を使用して推論用受聴者の個人化頭部伝達関数の第一ノッチを含む統合周波数帯域及び推論用受聴者の個人化頭部伝達関数の第二ノッチを含む統合周波数帯域を推定する処理について説明する。
耳介形状取得部105は、推論用受聴者の耳介の形状を示すデータを取得する。当該データは、例えば、図20を参照しながら説明したデータと同様のデータである。
統合周波数帯域推定部109aは、第三処理を実行する。具体的には、統合周波数帯域推定部109aは、複数の統合周波数帯域ごとに、推論用受聴者の耳介の形状及び第一相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出する。そして、統合周波数帯域推定部109aは、第三確率が最も大きな統合周波数帯域を第三統合周波数帯域と推定する。
また、統合周波数帯域推定部109aは、第四処理を実行する。具体的には、統合周波数帯域推定部109aは、複数の統合周波数帯域ごとに、推論用受聴者の耳介の形状及び第二相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出する。そして、統合周波数帯域推定部109aは、第四確率が最も大きな統合周波数帯域を第四統合周波数帯域と推定する。
個人化頭部伝達関数生成部110aは、統合周波数帯域推定部109aが第三統合周波数帯域及び第四統合周波数帯域を推定した結果を使用して推論用受聴者の個人化頭部伝達関数を生成する。具体的には、個人化頭部伝達関数生成部110aは、上述した個人化頭部伝達関数生成部109が第三周波数帯域及び第四周波数帯域を推定した結果を使用して推論用受聴者の個人化頭部伝達関数を生成する手法を統合周波数帯域に適用する。これにより、個人化頭部伝達関数生成部110aは、統合周波数帯域に基づいて個人化頭部伝達関数を生成する。
個人化頭部インパルス応答生成部111aは、個人化頭部伝達関数生成部110aにより生成された個人化頭部伝達関数を逆フーリエ変換し、個人化頭部インパルス応答を生成する。
次に図25から図31を参照しながら実施形態に係る頭部伝達関数生成装置が実行する処理の一例について説明する。
図25は、実施形態に係る頭部伝達関数生成装置がモデル化頭部伝達関数を生成する場合に実行する処理の一例を示すフローチャートである。
ステップS101において、実測頭部インパルス応答取得部101は、学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する。
ステップS102において、初期頭部伝達関数生成部102は、実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出し、初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する。
ステップS103において、周波数帯域分割部103は、初期頭部伝達関数を複数の周波数帯域に分割する。
ステップS104において、モデル化頭部伝達関数生成部104は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する。
ステップS105において、モデル化頭部伝達関数生成部104は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいて相対振幅を決定する。
ステップS106において、モデル化頭部伝達関数生成部104は、相対振幅を示す点の間を補間することにより学習用受聴者のモデル化頭部伝達関数を示すデータを生成する。
図26及び図27は、実施形態に係る頭部伝達関数生成装置が第一周波数帯域及び第二周波数帯域を特定する処理の一例を示すフローチャートである。
ステップS201において、耳介形状取得部105は、学習用受聴者の耳介の形状を示すデータを取得する。
ステップS202において、周波数帯域特定部106は、第一ノッチを含んでいる第一周波数帯域を特定し、第二ノッチを含んでいる第二周波数帯域を特定する。
ステップS203において、関係導出部107は、複数の周波数帯域ごとに、第一周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。
ステップS204において、関係導出部107は、複数の周波数帯域ごとに、第二周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。
ステップS205において、関係導出部107は、第一確率が最も大きな周波数帯域を第一周波数帯域と特定し、第二確率が最も大きな周波数帯域を第二周波数帯域と特定する。
ステップS206において、関係導出部107は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であるか否かを判定する。関係導出部107は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であると判定した場合(ステップS206:YES)、処理をステップS207に進める。一方、関係導出部107は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下でも所定の上限閾値以上でもないと判定した場合(ステップS206:NO)、処理を終了させる。
ステップS207において、関係導出部107は、学習用受聴者の耳介の所定の寸法が第一閾値未満であるか否かを判定する。関係導出部107は、学習用受聴者の耳介の所定の寸法が第一閾値未満であると判定した場合(ステップS207:YES)、処理をステップS208に進める。一方、関係導出部107は、学習用受聴者の耳介の所定の寸法が第一閾値以上であると判定した場合(ステップS207:NO)、処理をステップS209に進める。
ステップS208において、関係導出部107は、第一確率が二番目に大きな周波数帯域を第一周波数帯域と特定し直す第一修正処理を実行する。
ステップS209において、関係導出部107は、学習用受聴者の耳介の所定の寸法が
第二閾値を超えているか否かを判定する。関係導出部107は、学習用受聴者の耳介の所定の寸法が第二閾値を超えていると判定した場合(ステップS209:YES)、処理をステップS210に進める。一方、関係導出部107は、学習用受聴者の耳介の所定の寸法が第二閾値以下であると判定した場合(ステップS209:NO)、処理を終了させる。
ステップS210において、関係導出部107は、第二確率が二番目に大きな周波数帯域を第二周波数帯域と特定し直す第二修正処理を実行する。
図28及び図29は、実施形態に係る頭部伝達関数生成装置が第三周波数帯域及び第四周波数帯域を特定する処理の一例を示すフローチャートである。
ステップS301において、耳介形状取得部105は、推論用受聴者の耳介の形状を示すデータを取得する。
ステップS302において、周波数帯域推定部108は、第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、第三確率が最も大きな周波数帯域を第三周波数帯域と推定する第三処理を実行する。
ステップS303において、周波数帯域推定部108は、第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、第四確率が最も大きな周波数帯域を第四周波数帯域と推定する第四処理を実行する。
ステップS304において、周波数帯域推定部108は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であるか否かを判定する。周波数帯域推定部108は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であると判定した場合(ステップS304:YES)、処理をステップS305に進める。一方、周波数帯域推定部108は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下でも所定の上限閾値以上でもないと判定した場合(ステップS304:NO)、処理を終了させる。
ステップS305において、周波数帯域推定部108は、推論用受聴者の耳介の所定の寸法が第三閾値未満であるか否かを判定する。周波数帯域推定部108は、推論用受聴者の耳介の所定の寸法が第三閾値未満であると判定した場合(ステップS305:YES)、処理をステップS306に進める。一方、周波数帯域推定部108は、推論用受聴者の耳介の所定の寸法が第三閾値以上であると判定した場合(ステップS305:NO)、処理を終了させる。
ステップS306において、周波数帯域推定部108は、第三確率が二番目に大きな周波数帯域を第三周波数帯域と推定し直す第三修正処理を実行する。
ステップS307において、周波数帯域推定部108は、推論用受聴者の耳介の所定の寸法が第四閾値を超えているか否かを判定する。周波数帯域推定部108は、推論用受聴者の耳介の所定の寸法が第四閾値を超えていると判定した場合(ステップS307:YES)、処理をステップS308に進める。一方、周波数帯域推定部108は、推論用受聴者の耳介の所定の寸法が第四閾値以下であると判定した場合(ステップS:NO)、処理を終了させる。
ステップS308において、周波数帯域推定部108は、第四確率が二番目に大きな周波数帯域を第四周波数帯域と推定し直す第四修正処理を実行する。
図30は、実施形態に係る頭部伝達関数生成装置が第一統合周波数帯域及び第二統合周波数帯域を特定する処理の一例を示すフローチャートである。
ステップS401において、耳介形状取得部105は、学習用受聴者の耳介の形状を示すデータを取得する。
ステップS402において、周波数帯域統合部106aは、複数の周波数帯域を統合した統合周波数帯域を少なくとも二つ生成する。
ステップS403において、統合周波数帯域特定部107aは、第一ノッチを含んでいる第一統合周波数帯域を特定し、第二ノッチを含んでいる第二統合周波数帯域を特定する。
ステップS404において、関係導出部108aは、複数の統合周波数帯域ごとに、第一統合周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。
ステップS405において、関係導出部108aは、複数の統合周波数帯域ごとに、第二統合周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。
ステップS406において、関係導出部108aは、第一確率が最も大きな統合周波数帯域を第一統合周波数帯域と特定し、第二確率が最も大きな統合周波数帯域を第二統合周波数帯域と特定する。
図31は、実施形態に係る頭部伝達関数生成装置実施形態に係る頭部伝達関数生成装置が第三周波数帯域及び第四周波数帯域を推定する処理の一例を示すフローチャートである。
ステップS501において、耳介形状取得部105は、推論用受聴者の耳介の形状を示すデータを取得する。
ステップS502において、統合周波数帯域推定部109aは、第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、第三確率が最も大きな統合周波数帯域を第三統合周波数帯域と推定する第三処理を実行する。
ステップS503において、統合周波数帯域推定部109aは、第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、第四確率が最も大きな統合周波数帯域を第四統合周波数帯域と推定する第四処理を実行する。
以上、実施形態に係る頭部伝達関数生成装置1について説明した。頭部伝達関数生成装置1は、初期頭部伝達関数を複数の周波数帯域に分割し、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理を実行する。次に、頭部伝達関数生成装置1は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいて相対振幅を決定する処理を実行する。そして、頭部伝達関数生成装置1は、相対振幅を示す点の間を補間することにより学習用受聴者のモデル化頭部伝達関数を示すデータを生成する。
これにより、頭部伝達関数生成装置1は、学習用受聴者本人の頭部伝達関数を実際に測定すること無く、学習用受聴者本人の頭部伝達関数の特徴を再現したモデル化頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1は、学習用受聴者の耳介の形状を示すデータを取得する。次に、頭部伝達関数生成装置1は、モデル化頭部伝達関数の第一周波数帯域及び第二周波数帯域を特定する。そして、頭部伝達関数生成装置1は、複数の周波数帯域ごとに、第一周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。また、頭部伝達関数生成装置1は、複数の周波数帯域ごとに、第二周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。
これにより、頭部伝達関数生成装置1は、推論用受聴者のモデル化頭部伝達関数の生成に使用され得る耳介の形状と第一周波数帯域との関係及び耳介の形状と第二周波数帯域との関係を導出することができる。
また、頭部伝達関数生成装置1は、第一処理において、学習用受聴者の耳介の形状を説明変数とし、複数の周波数帯域を目的変数とする判別分析を実行することにより、第一処理により導出される関係として第一相関行列を算出する。また、頭部伝達関数生成装置1は、二処理において、学習用受聴者の耳介の形状を説明変数とし、複数の周波数帯域を目的変数とする判別分析を実行することにより、第二処理により導出される関係として第二相関行列を算出する。
これにより、頭部伝達関数生成装置1は、一定以上の精度で耳介の形状と第一周波数帯域との関係及び耳介の形状と第二周波数帯域との関係を導出することができる。
また、頭部伝達関数生成装置1は、第一相関行列及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の周波数帯域のうち第一確率が最も大きな周波数帯域を第一周波数帯域と特定する。また、頭部伝達関数生成装置1は、第二相関行列及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の周波数帯域のうち第二確率が最も大きな周波数帯域を第二周波数帯域と特定する。
これにより、頭部伝達関数生成装置1は、一定以上の精度で第一周波数帯域及び第二周波数帯域を特定することができる。
また、頭部伝達関数生成装置1は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、上述した第一修正処理及び第二修正処理の少なくとも一方を実行する。
これにより、頭部伝達関数生成装置1は、受聴者が正中面内において音像が位置する方向の上昇角を知覚する場合に重要な役割を果たす第一ノッチ及び第二ノッチを更に精度良く特定することができる。
また、頭部伝達関数生成装置1は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、学習用受聴者の耳介の所定の寸法が第一閾値未満である場合、第一修正処理を実行してもよい。
これにより、頭部伝達関数生成装置1は、学習用受聴者の耳介が小さく、第一周波数帯域であると初めに特定された周波数帯域が誤りである可能性が比較的高い場合に第一修正処理を実行し、第一周波数帯域を更に高い精度で特定することができる。
また、頭部伝達関数生成装置1は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、学習用受聴者の耳介の所定の寸法が第二閾値を超えている場合、第二修正処理を実行してもよい。
これにより、頭部伝達関数生成装置1は、学習用受聴者の耳介が大きく、第二周波数帯域であると初めに特定された周波数帯域が誤りである可能性が比較的高い場合に第二修正処理を実行し、第二周波数帯域を更に高い精度で特定することができる。
また、頭部伝達関数生成装置1は、推論用受聴者の耳介の形状を示すデータをする。そして、頭部伝達関数生成装置1は、第三処理及び第四処理を実行する。第三処理は、推論用受聴者の耳介の形状及び第一相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、第三確率が最も大きな周波数帯域を第三周波数帯域と推定する処理である。第四処理は、複数の周波数帯域ごとに、推論用受聴者の耳介の形状及び第二相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、第四確率が最も大きな周波数帯域を第四周波数帯域と推定する処理である。
これにより、頭部伝達関数生成装置1は、耳介の形状が未知である推論用受聴者の個人化頭部伝達関数について第一ノッチが含まれている第三周波数帯域及び第二ノッチが含まれている第四周波数帯域を一定以上の精度で推定することができる。
また、頭部伝達関数生成装置1は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、上述した第三修正処理及び第四修正処理の少なくとも一方を実行する。
これにより、頭部伝達関数生成装置1は、耳介の形状が未知である推論用受聴者の個人化頭部伝達関数について第三周波数帯域及び第四周波数帯域の少なくとも一方を更に精度良く推定することができる。
また、頭部伝達関数生成装置1は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、推論用受聴者の耳介の所定の寸法が第三閾値未満である場合、第三修正処理を実行してもよい。
これにより、頭部伝達関数生成装置1は、推論用受聴者の耳介が小さく、第三周波数帯域であると初めに推定された周波数帯域が誤りである可能性が比較的高い場合に第三修正処理を実行し、第三周波数帯域を更に高い精度で推定することができる。
また、頭部伝達関数生成装置1は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、推論用受聴者の耳介の所定の寸法が第四閾値を超えている場合、第四修正処理を実行してもよい。
これにより、頭部伝達関数生成装置1は、推論用受聴者の耳介が大きく、第四周波数帯域であると初めに推定された周波数帯域が誤りである可能性が比較的高い場合に第四修正処理を実行し、第四周波数帯域を更に高い精度で推定することができる。
また、頭部伝達関数生成装置1は、周波数帯域推定部108が第三周波数帯域及び第四周波数帯域を推定した結果を使用して推論用受聴者の個人化頭部伝達関数を生成する。
これにより、頭部伝達関数生成装置1は、推論用受聴者が正中面内において音像が位置する方向の上昇角を知覚する場合に重要な役割を果たす第一ノッチ及び第二ノッチを精度良く再現した個人化頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1aは、学習用受聴者の耳介の形状を示すデータを取得する。次に、頭部伝達関数生成装置1aは、複数の周波数帯域を統合した統合周波数帯域を少なくとも二つ生成する。次に、頭部伝達関数生成装置1aは、モデル化頭部伝達関数の第一統合周波数帯域及び第二統合周波数帯域を特定する。そして、頭部伝達関数生成装置1aは、複数の統合周波数帯域ごとに、第一統合周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。また、頭部伝達関数生成装置1aは、複数の統合周波数帯域ごとに、第二統合周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。
これにより、頭部伝達関数生成装置1aは、学習用受聴者のモデル化頭部伝達関数の生成に使用され得る耳介の形状と第一周波数帯域との関係を学習用受聴者が弁別可能な周波数幅に即して導出することができる。また、これにより、頭部伝達関数生成装置1aは、学習用受聴者のモデル化頭部伝達関数の生成に使用され得る耳介の形状と第二周波数帯域との関係を学習用受聴者が弁別可能な周波数幅に即して導出することができる。
また、頭部伝達関数生成装置1aは、第一処理において、学習用受聴者の耳介の形状を説明変数とし、複数の統合周波数帯域を目的変数とする判別分析を実行することにより、第一処理により導出される関係として第一相関行列を算出する。また、頭部伝達関数生成装置1aは、第二処理において、学習用受聴者の耳介の形状を説明変数とし、複数の統合周波数帯域を目的変数とする判別分析を実行することにより、第二処理により導出される関係として第二相関行列を算出する。
これにより、頭部伝達関数生成装置1aは、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即した耳介の形状と第一周波数帯域との関係を導出することができる。また、これにより、頭部伝達関数生成装置1aは、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即した耳介の形状と第二周波数帯域との関係を導出することができる。
また、頭部伝達関数生成装置1aは、第一相関行列及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の統合周波数帯域のうち第一確率が最も大きな統合周波数帯域を第一統合周波数帯域と特定する。また、頭部伝達関数生成装置1aは、第二相関行列及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の統合周波数帯域のうち第二確率が最も大きな統合周波数帯域を第二統合周波数帯域と特定する。
これにより、頭部伝達関数生成装置1aは、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即している第一統合周波数帯域を特定することができる。また、これにより、頭部伝達関数生成装置1aは、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即している第二統合周波数帯域を特定することができる。
また、頭部伝達関数生成装置1aは、推論用受聴者の耳介の形状を示すデータをする。そして、頭部伝達関数生成装置1aは、第三処理及び第四処理を実行する。第三処理は、複数の統合周波数帯域ごとに、推論用受聴者の耳介の形状及び第一相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、第三確率が最も大きな統合周波数帯域を第三統合周波数帯域と推定する処理である。第四処理は、複数の統合周波数帯域ごとに、推論用受聴者の耳介の形状及び第二相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、第四確率が最も大きな統合周波数帯域を第四統合周波数帯域と推定する処理である。
これにより、頭部伝達関数生成装置1aは、耳介の形状が未知である推論用受聴者の個人化頭部伝達関数について、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即している第三統合周波数帯域推定することができる。また、これにより、頭部伝達関数生成装置1aは、耳介の形状が未知である推論用受聴者の個人化頭部伝達関数について、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即している第四統合周波数帯域推定することができる。
なお、上述した実施形態では、頭部伝達関数生成装置1が判別分析を実行して第一相関行列及び第二相関行列を算出する場合を例に挙げて説明したが、これに限定されない。
例えば、関係導出部107は、第一処理において、学習用受聴者の耳介の形状を問題とし、第一周波数帯域を解答とする教師データを使用して学習させた第一学習済モデルを第一処理により導出される関係として導出してもよい。この場合、関係導出部107は、第一学習済モデル及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の周波数帯域のうち第一確率が最も大きな周波数帯域を第一周波数帯域と特定する。
また、例えば、関係導出部107は、第二処理において、学習用受聴者の耳介の形状を問題とし、第二周波数帯域を解答とする教師データを使用して学習させた第二学習済モデルを第二処理により導出される関係として導出してもよい。この場合、関係導出部107は、第二学習済モデル及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の周波数帯域のうち第二確率が最も大きな周波数帯域を第二周波数帯域と特定する。
また、例えば、関係導出部108aは、第一処理において、学習用受聴者の耳介の形状を問題とし、第一統合周波数帯域を解答とする教師データを使用して学習させた第一学習済モデルを第一処理により導出される関係として導出してもよい。この場合、関係導出部108aは、第一学習済モデル及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の統合周波数帯域のうち第一確率が最も大きな統合周波数帯域を第一統合周波数帯域と特定する。
また、例えば、関係導出部108aは、第二処理において、学習用受聴者の耳介の形状を問題とし、第二統合周波数帯域を解答とする教師データを使用して学習させた第二学習済モデルを第二処理により導出される関係として導出してもよい。この場合、関係導出部108aは、第二学習済モデル及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の統合周波数帯域のうち第二確率が最も大きな統合周波数帯域を第二統合周波数帯域と特定する。
また、上述した実施形態では、頭部伝達関数生成装置1が第一相関行列を使用して第三尺度を算出し、第二相関行列を使用して第四尺度を算出する場合を例に挙げて説明したが、これに限定されない。例えば、周波数帯域推定部108は、第一学習済モデルを使用して第三尺度を算出してもよい。また、例えば、周波数帯域推定部108は、第二学習済モデルを使用して第四尺度を算出してもよい。
また、上述した実施形態では、頭部伝達関数生成装置1aが第一相関行列を使用して第三尺度を算出し、第二相関行列を使用して第四尺度を算出する場合を例に挙げて説明したが、これに限定されない。例えば、統合周波数帯域推定部109aは、第一学習済モデルを使用して第三尺度を算出してもよい。また、例えば、統合周波数帯域推定部109aは、第二学習済モデルを使用して第四尺度を算出してもよい。
また、上述した実施形態における頭部伝達関数生成装置1が備える各機能の少なくとも一部は、これらの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここで言うコンピュータシステムは、OSや周辺機器等のハードウェアを含むものとする。
また、コンピュータ読み取り可能な記録媒体は、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶部のことをいう。さらにコンピュータ読み取り可能な記録媒体は、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また、上述したプログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲内において種々の組み合わせ、変形、置換及び設計変更の少なくとも一つを加えることができる。