JP6986778B2

JP6986778B2 - 頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法

Info

Publication number: JP6986778B2
Application number: JP2020200590A
Authority: JP
Inventors: 一博飯田
Original assignee: Chiba Institute of Technology
Current assignee: Chiba Institute of Technology
Priority date: 2020-05-22
Filing date: 2020-12-02
Publication date: 2021-12-22
Anticipated expiration: 2040-12-02
Also published as: JP2021184588A

Description

本発明は、頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法に関する。

従来から三次元音響システム、音のバーチャルリアリティ（ＶＲ：Virtual Reality）等の実用化を目指した研究開発が進められている。これらの技術の実用化を実現する上では、受聴者ごとに頭部伝達関数を再現することが必要である。受聴者ごとに頭部伝達関数を再現する技術の一例として、特許文献１に開示されている頭部伝達関数選択装置が挙げられる。

この頭部伝達関数選択装置は、測定部と、特徴量抽出部と、特性選択部とを備える。測定部は、スピーカから測定信号としての所定の音声を発生させた状態で、ユーザの耳に装着したマイクロホンによって収音した音声信号に基づいて、ユーザの頭部インパルス応答を取得する。特徴量抽出部は、頭部インパルス応答に対応する周波数特性の特徴量を抽出する。特性選択部は、抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する。

特開２０１６−２０１７２３号公報

しかし、上述した頭部伝達関数選択装置は、データベースに記憶されている複数の頭部伝達関数のうちのいずれかが選択されるに過ぎない。このため、当該頭部伝達関数選択装置は、受聴者本人に適合する頭部伝達関数がデータベースに記憶されていない場合、当然のことながら、受聴者本人に適合する頭部伝達関数を選択することができない。

また、受聴者本人の頭部伝達関数を実際に測定しようとする場合、不要な反射音、周囲の騒音等の影響を排除する必要があるため、住宅、オフィス等ではなく、無響室で測定を実施する必要がある。ところが、無響室は、限られた研究機関にしか存在しない。さらに、音響の専門知識を十分に有しない一般のユーザは、受聴者本人の頭部伝達関数を十分な精度で測定することができない。

本発明は、上述した問題点に鑑み、受聴者本人の頭部伝達関数を実際に測定すること無く、受聴者本人の頭部伝達関数の特徴を再現した頭部伝達関数を得ることができる頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法を提供することを目的とする。

本発明の一態様は、学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する実測頭部インパルス応答取得部と、前記実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出し、前記初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する初期頭部伝達関数生成部と、前記初期頭部伝達関数を複数の周波数帯域に分割する周波数帯域分割部と、複数の前記周波数帯域ごとに前記初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理及び相対振幅を決定する処理を実行し、前記相対振幅を示す点の間を補間することにより前記学習用受聴者のモデル化頭部伝達関数を示すデータを生成するモデル化頭部伝達関数生成部と、を備える頭部伝達関数生成装置である。

本発明の一態様に係る頭部伝達関数生成装置は、前記学習用受聴者の耳介の形状を示すデータを取得する耳介形状取得部と、前記学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第一周波数帯域及び前記学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第二周波数帯域を特定する周波数帯域特定部と、複数の前記周波数帯域ごとに、前記第一周波数帯域に該当している第一確率と相関を有する第一尺度と、前記学習用受聴者の耳介の形状との関係を導出する第一処理を実行し、複数の前記周波数帯域ごとに、前記第二周波数帯域に該当している第二確率と相関を有する第二尺度と、前記学習用受聴者の耳介の形状との関係を導出する第二処理を実行する関係導出部と、を更に備える。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一処理において、前記学習用受聴者の耳介の形状を説明変数とし、複数の前記周波数帯域を目的変数とする判別分析を実行することにより、前記第一処理により導出される関係として第一相関行列を算出し、前記第二処理において、前記学習用受聴者の耳介の形状を説明変数とし、複数の前記周波数帯域を目的変数とする判別分析を実行することにより、前記第二処理により導出される関係として第二相関行列を算出してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一相関行列及び前記学習用受聴者の耳介の形状を使用して前記第一尺度を算出し、前記第一尺度に基づいて、複数の前記周波数帯域のうち前記第一確率が最も大きな前記周波数帯域を前記第一周波数帯域と特定し、前記第二相関行列及び前記学習用受聴者の耳介の形状を使用して前記第二尺度を算出し、前記第二尺度に基づいて、複数の前記周波数帯域のうち前記第二確率が最も大きな前記周波数帯域を前記第二周波数帯域と特定してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一処理において、前記学習用受聴者の耳介の形状を問題とし、前記第一周波数帯域を解答とする教師データを使用して学習させた第一学習済モデルを前記第一処理により導出される関係として導出し、前記第二処理において、前記学習用受聴者の耳介の形状を問題とし、前記第二周波数帯域を解答とする教師データを使用して学習させた第二学習済モデルを前記第二処理により導出される関係として導出してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部は、前記第一学習済モデル及び前記学習用受聴者の耳介の形状を使用して前記第一尺度を算出し、前記第一尺度に基づいて、複数の前記周波数帯域のうち前記第一確率が最も大きな前記周波数帯域を前記第一周波数帯域と特定し、前記第二学習済モデル及び前記学習用受聴者の耳介の形状を使用して前記第二尺度を算出し、前記第二尺度に基づいて、複数の前記周波数帯域のうち前記第二確率が最も大きな前記周波数帯域を前記第二周波数帯域と特定してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部は、前記第一周波数帯域と特定された前記周波数帯域と、前記第二周波数帯域と特定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、前記第一確率が二番目に大きな前記周波数帯域を前記第一周波数帯域と特定し直す第一修正処理及び前記第二確率が二番目に大きな前記周波数帯域を前記第二周波数帯域と特定し直す第二修正処理の少なくとも一方を更に実行してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一周波数帯域と特定された前記周波数帯域と、前記第二周波数帯域と特定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、前記学習用受聴者の耳介の所定の寸法が第一閾値未満である場合、前記第一修正処理を実行してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一周波数帯域と特定された前記周波数帯域と、前記第二周波数帯域と特定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、前記学習用受聴者の耳介の所定の寸法が第二閾値を超えている場合、前記第二修正処理を実行してもよい。

本発明の一態様に係る頭部伝達関数生成装置は、前記学習用受聴者の耳介の形状を示すデータを取得する耳介形状取得部と、複数の前記周波数帯域を統合した統合周波数帯域を少なくとも二つ生成する周波数帯域統合部と、前記学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第一統合周波数帯域及び前記学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第二統合周波数帯域を特定する統合周波数帯域特定部と、複数の前記統合周波数帯域ごとに、前記第一統合周波数帯域に該当している第一確率と相関を有する第一尺度と、前記学習用受聴者の耳介の形状との関係を導出する第一処理を実行し、複数の前記統合周波数帯域ごとに、前記第二統合周波数帯域に該当している第二確率と相関を有する第二尺度と、前記学習用受聴者の耳介の形状との関係を導出する第二処理を実行する関係導出部と、を更に備える。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一処理において、前記学習用受聴者の耳介の形状を説明変数とし、複数の前記統合周波数帯域を目的変数とする判別分析を実行することにより、前記第一処理により導出される関係として第一相関行列を算出し、前記第二処理において、前記学習用受聴者の耳介の形状を説明変数とし、複数の前記統合周波数帯域を目的変数とする判別分析を実行することにより、前記第二処理により導出される関係として第二相関行列を算出してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一相関行列及び前記学習用受聴者の耳介の形状を使用して前記第一尺度を算出し、前記第一尺度に基づいて、複数の前記統合周波数帯域のうち前記第一確率が最も大きな前記統合周波数帯域を前記第一統合周波数帯域と特定し、前記第二相関行列及び前記学習用受聴者の耳介の形状を使用して前記第二尺度を算出し、前記第二尺度に基づいて、複数の前記統合周波数帯域のうち前記第二確率が最も大きな前記統合周波数帯域を前記第二統合周波数帯域と特定してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一処理において、前記学習用受聴者の耳介の形状を問題とし、前記第一統合周波数帯域を解答とする教師データを使用して学習させた第一学習済モデルを前記第一処理により導出される関係として導出し、前記第二処理において、前記学習用受聴者の耳介の形状を問題とし、前記第二統合周波数帯域を解答とする教師データを使用して学習させた第二学習済モデルを前記第二処理により導出される関係として導出してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記関係導出部が、前記第一学習済モデル及び前記学習用受聴者の耳介の形状を使用して前記第一尺度を算出し、前記第一尺度に基づいて、複数の前記統合周波数帯域のうち前記第一確率が最も大きな前記統合周波数帯域を前記第一統合周波数帯域と特定し、前記第二学習済モデル及び前記学習用受聴者の耳介の形状を使用して前記第二尺度を算出し、前記第二尺度に基づいて、複数の前記統合周波数帯域のうち前記第二確率が最も大きな前記統合周波数帯域を前記第二統合周波数帯域と特定してもよい。

本発明の一態様に係る頭部伝達関数生成装置は、前記耳介形状取得部が、推論用受聴者の耳介の形状を示すデータを更に取得し、複数の前記周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第一相関行列を使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、前記第三確率が最も大きな前記周波数帯域を前記第三周波数帯域と推定する第三処理を実行し、複数の前記周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第二相関行列を使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、前記第四確率が最も大きな前記周波数帯域を前記第四周波数帯域と推定する第四処理を実行する周波数帯域推定部を更に備えていてもよい。

本発明の一態様に係る頭部伝達関数生成装置は、前記耳介形状取得部が、推論用受聴者の耳介の形状を示すデータを更に取得し、複数の前記周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第一学習済モデルを使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、前記第三確率が最も大きな前記周波数帯域を前記第三周波数帯域と推定する第三処理を実行し、複数の前記周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第二学習済モデルを使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、前記第四確率が最も大きな前記周波数帯域を前記第四周波数帯域と推定する第四処理を実行する周波数帯域推定部を更に備えていてもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記周波数帯域推定部が、前記第三周波数帯域と推定された前記周波数帯域と、前記第四周波数帯域と推定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、前記第三確率が二番目に大きな前記周波数帯域を前記第三周波数帯域と推定し直す第三修正処理及び前記第四確率が二番目に大きな前記周波数帯域を前記第四周波数帯域と推定し直す第四修正処理の少なくとも一方を更に実行してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記周波数帯域推定部が、前記第三周波数帯域と推定された前記周波数帯域と、前記第四周波数帯域と推定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、前記推論用受聴者の耳介の所定の寸法が第三閾値未満である場合、前記第三修正処理を実行してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記周波数帯域推定部が、前記第三周波数帯域と推定された前記周波数帯域と、前記第四周波数帯域と推定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、前記推論用受聴者の耳介の所定の寸法が第四閾値を超えている場合、前記第四修正処理を実行してもよい。

本発明の一態様は、上述した頭部伝達関数生成装置であって、前記周波数帯域推定部が前記第三周波数帯域及び前記第四周波数帯域を推定した結果を使用して前記推論用受聴者の個人化頭部伝達関数を生成する個人化頭部伝達関数生成部を更に備えていてもよい。

本発明の一態様に係る頭部伝達関数生成装置は、前記耳介形状取得部が、推論用受聴者の耳介の形状を示すデータを更に取得し、複数の前記統合周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第一相関行列を使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、前記第三確率が最も大きな前記統合周波数帯域を前記第三統合周波数帯域と推定する第三処理を実行し、複数の前記統合周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第二相関行列を使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、前記第四確率が最も大きな前記統合周波数帯域を前記第四統合周波数帯域と推定する第四処理を実行する統合周波数帯域推定部を更に備えていてもよい。

本発明の一態様に係る頭部伝達関数生成装置は、前記耳介形状取得部が、推論用受聴者の耳介の形状を示すデータを更に取得し、複数の前記統合周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第一学習済モデルを使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、前記第三確率が最も大きな前記統合周波数帯域を前記第三統合周波数帯域と推定する第三処理を実行し、複数の前記統合周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第二学習済モデルを使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、前記第四確率が最も大きな前記統合周波数帯域を前記第四統合周波数帯域と推定する第四処理を実行する統合周波数帯域推定部を更に備えていてもよい。

本発明の一態様は、コンピュータに、学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する実測頭部インパルス応答取得機能と、前記実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出し、前記初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する初期頭部伝達関数生成機能と、前記初期頭部伝達関数を複数の周波数帯域に分割する周波数帯域分割機能と、複数の前記周波数帯域ごとに前記初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理及び相対振幅を決定する処理を実行し、前記相対振幅を示す点の間を補間することにより前記学習用受聴者のモデル化頭部伝達関数を示すデータを生成するモデル化頭部伝達関数生成機能と、を実現させる頭部伝達関数生成プログラムである。

本発明の一態様は、学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する実測頭部インパルス応答取得ステップと、前記実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出し、前記初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する初期頭部伝達関数生成ステップと、前記初期頭部伝達関数を複数の周波数帯域に分割する周波数帯域分割ステップと、複数の前記周波数帯域ごとに前記初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理及び相対振幅を決定する処理を実行し、前記相対振幅を示す点の間を補間することにより前記学習用受聴者のモデル化頭部伝達関数を示すデータを生成するモデル化頭部伝達関数生成ステップと、を含む頭部伝達関数生成方法である。

本発明によれば、受聴者本人の頭部伝達関数を実際に測定すること無く、受聴者本人の頭部伝達関数の特徴を再現した頭部伝達関数を得ることができる頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法を提供することができる。

実施形態に係る受聴者と、受聴者を基準とした水平面、正中面、矢状面、耳軸、側方角及び上昇角を示す図である。実施形態に係る頭部伝達関数生成装置を構成しているハードウェアの一例を示す図である。実施形態に係る頭部伝達関数生成装置の機能的な構成の一例を示す図である。実施形態に係る受聴者と、受聴者を基準とした正中面における上昇角を３０度刻みで示した図である。実施形態に係る実測頭部インパルス応答の一例を示す図である。実施形態に係る受聴者の右耳の実測頭部伝達関数及び左耳の頭部伝達関数の一例を示す図である。実施形態に係る初期頭部インパルス応答の一例を示す図である。実施形態に係る初期頭部伝達関数、周波数帯域及びモデル化頭部伝達関数の一例を示す図である。実施形態に係る初期頭部伝達関数及び１オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。実施形態に係る初期頭部伝達関数及び１／２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。実施形態に係る初期頭部伝達関数及び１／３オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。実施形態に係る初期頭部伝達関数及び１／６オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。実施形態に係る初期頭部伝達関数及び１／１２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。実測頭部伝達関数を使用した音像定位実験における音像の方向と学習用受聴者が解答した方向と関係の一例を示す図である。１オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験における音像の方向と学習用受聴者が解答した方向と関係の一例を示す図である。１／２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。１／３オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。１／６オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。１／１２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。実施形態に係る学習用受聴者の耳介の形状のうち測定の対象となる箇所の一例を示す図である。実施形態に係る頭部伝達関数生成装置が個人化頭部伝達関数及び個人化頭部インパルス応答を生成する処理の一例を示す概念図である。実施形態に係る頭部伝達関数生成装置の機能的な構成の一例を示す図である。実施形態に係る統合周波数帯域の一例を示す図である。実施形態に係る統合周波数帯域の一例を示す図である。実施形態に係る頭部伝達関数生成装置がモデル化頭部伝達関数を生成する場合に実行する処理の一例を示すフローチャートである。実施形態に係る頭部伝達関数生成装置が第一周波数帯域及び第二周波数帯域を特定する処理の一例を示すフローチャートである。実施形態に係る頭部伝達関数生成装置が第一周波数帯域及び第二周波数帯域を特定する処理の一例を示すフローチャートである。実施形態に係る頭部伝達関数生成装置が第三周波数帯域及び第四周波数帯域を特定する処理の一例を示すフローチャートである。実施形態に係る頭部伝達関数生成装置が第三周波数帯域及び第四周波数帯域を特定する処理の一例を示すフローチャートである。実施形態に係る頭部伝達関数生成装置が第一統合周波数帯域及び第二統合周波数帯域を特定する処理の一例を示すフローチャートである。実施形態に係る頭部伝達関数生成装置実施形態に係る頭部伝達関数生成装置が第三周波数帯域及び第四周波数帯域を推定する処理の一例を示すフローチャートである。

まず、図１を参照しながら実施形態に係る頭部伝達関数生成装置を説明する上で使用する耳軸座標系について説明する。図１は、実施形態に係る受聴者と、受聴者を基準とした水平面、正中面、矢状面、耳軸、側方角及び上昇角を示す図である。

図１に示した耳軸座標系は、次のように定義される。耳軸Ａは、受聴者Ｐの左右の外耳道入口を結ぶ直線である。原点は、受聴者Ｐの左右の外耳道入口を結んでおり、耳軸Ａ上に位置する線分の中点である。水平面Ｈは、右眼窩点と左右の耳珠を結ぶ平面である。正中面Ｍは、水平面と直交し、受聴者Ｐを左右に二等分する面である。矢状面Ｓは、正中面Ｍと平行な任意の平面である。また、耳軸座標系は、音源が位置する方向を側方角α及び上昇角βにより表す。側方角αは、音源が位置する点と原点とを結ぶ直線が耳軸Ａとなす角の余角である。上昇角βは、音源が位置する点を通る矢状面Ｓ内における仰角である。

次に図２を参照しながら実施形態に係る頭部伝達関数生成装置を構成しているハードウェアについて説明する。

図２は、実施形態に係る頭部伝達関数生成装置を構成しているハードウェアの一例を示す図である。図２に示すように、頭部伝達関数生成装置１は、プロセッサ１１と、主記憶装置１２と、通信インターフェース１３と、補助記憶装置１４と、入出力装置１５と、バス１６とを備える。

プロセッサ１１は、例えば、ＣＰＵ（Central Processing Unit）であり、頭部伝達関数生成プログラムを読み出して実行し、頭部伝達関数生成装置１が有する各機能を実現させる。また、プロセッサ１１は、頭部伝達関数生成プログラム以外のプログラムを読み出して実行し、頭部伝達関数生成装置１が有する各機能を実現させる上で必要な機能を実現させてもよい。

主記憶装置１２は、例えば、ＲＡＭ（Random Access Memory）であり、プロセッサ１１により読み出されて実行される意思決定支援プログラム、その他プログラムを予め記憶している。

通信インターフェース１３は、ネットワークを介して他の機器と通信を実行するためのインターフェース回路である。ネットワークは、例えば、インターネット、イントラネット、ＷＡＮ（Wide Area Network）、ＬＡＮ（Local Area Network）である。

補助記憶装置１４は、例えば、ハードディスクドライブ（ＨＤＤ：Hard Disk Drive）、ソリッドステートドライブ（ＳＳＤ：Solid State Drive）、フラッシュメモリ（Flash Memory）、ＲＯＭ（Read Only Memory）である。

入出力装置１５は、例えば、入出力ポート（Input/Output Port）である。入出力装置１５は、例えば、図２に示したマウス１５１、キーボード１５２及びディスプレイ１５３が接続される。マウス１５１及びキーボード１５２は、例えば、頭部伝達関数生成装置１を操作するために必要なデータを入力する作業に使用される。ディスプレイ１５３は、例えば、液晶ディスプレイである。ディスプレイ１５３は、例えば、頭部伝達関数生成装置１のグラフィカルユーザインターフェース（ＧＵＩ：Graphical User Interface）、後述する図８に示した内容等を表示する。

バス１６は、プロセッサ１１、主記憶装置１２、通信インターフェース１３、補助記憶装置１４及び入出力装置１５を互いにデータの送受信が可能なように接続している。

次に、図３から図２４を参照しながら実施形態に係る頭部伝達関数生成装置の機能的な構成について説明する。

図３は、実施形態に係る頭部伝達関数生成装置の機能的な構成の一例を示す図である。図３に示すように、頭部伝達関数生成装置１は、実測頭部インパルス応答取得部１０１と、初期頭部伝達関数生成部１０２と、周波数帯域分割部１０３と、モデル化頭部伝達関数生成部１０４と、耳介形状取得部１０５と、周波数帯域特定部１０６と、関係導出部１０７と、周波数帯域推定部１０８と、個人化頭部伝達関数生成部１０９と、個人化頭部インパルス応答生成部１１０とを備える。

実測頭部インパルス応答取得部１０１は、学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する。図４は、実施形態に係る受聴者と、受聴者を基準とした正中面における上昇角を３０度刻みで示した図である。例えば、実測頭部インパルス応答取得部１０１は、正中面Ｍにおける上昇角βが０度、３０度、６０度、９０度、１２０度、１５０度又は１８０度の方向に配置された音源から受聴者Ｐの外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する。なお、図４に示すように、上昇角βが０度の方向は、受聴者Ｐの正面方向と一致している。また、図４に示すように、上昇角βが０度の方向は、受聴者Ｐの正面方向と反対の方向と一致している。

図５は、実施形態に係る実測頭部インパルス応答の一例を示す図である。頭部インパルス応答（ＨＲＩＲ：Head-Related Impulse Response）は、音源から受聴者の外耳道入口に到達する音波が受聴者の頭部及びその周辺の影響を受けることによる物理特性の変化を時間領域で表現したものである。実測頭部インパルス応答は、実際に音波を測定することにより生成された頭部インパルス応答である。図５に示すように、実測頭部インパルス応答は、受聴者の外耳道入口に到達した音波の相対強度の時間変化を表す。

また、実測頭部インパルス応答は、フーリエ変換により実測頭部伝達関数に変換される。頭部伝達関数（ＨＲＴＦ：Head-Related Transfer Function）は、音源から受聴者の外耳道入口に到達する音波が受聴者の頭部及びその周辺の影響を受けることによる物理特性の変化を周波数領域で表現したものである。実測頭部伝達関数は、実際に音波を測定することにより生成された頭部伝達関数である。

図６は、実施形態に係る受聴者の右耳の実測頭部伝達関数及び左耳の頭部伝達関数の一例を示す図である。図６は、横軸が音源から出力された音波の周波数を示しており、縦軸が受聴者の右耳又は左耳に到達した音波の相対振幅を示している。また、ここで言う相対振幅は、受聴者の右耳又は左耳の位置にマイクロフォンが存在し、受聴者が存在しない場合に観測される振幅を基準とし、受聴者の頭部、胴体等の存在により当該振幅よりも大きくなった振幅を正の量として示し、受聴者の頭部、胴体等の存在により当該振幅よりも小さくなった振幅を正の量として示している。また、当該基準は、図６において一点鎖線で示されている。

図６に示した実線は、受聴者の右耳に入射した音波の実測頭部インパルス応答をフーリエ変換することにより生成された実測頭部伝達関数を示している。図６に示した破線は、受聴者の左耳に入射した音波の実測頭部インパルス応答をフーリエ変換することにより生成された実測頭部伝達関数を示している。また、図６の上から一段目、二段目、三段目、四段目、五段目、六段目及び七段目は、それぞれ正中面Ｍにおける上昇角βが０度、３０度、６０度、９０度、１２０度、１５０度、１８０度の方向に配置された音源から受聴者の外耳道入口に到達した音波の実測頭部伝達関数を示している。

図６に示すように、頭部伝達関数は、音源が位置する方向により異なり、受聴者の右耳と左耳とでも異なる。なぜなら、受聴者の頭部の形状、胴体の形状及び耳介の形状が受聴者を基準とした前後方向、左右方向及び上下方向のいずれにおいても非対称であるためである。このため、頭部伝達関数は、音源が位置する方向を受聴者が知覚する場合の手掛かりとなる。

また、音源が特定の方向に位置する場合における受聴者の頭部伝達関数は、当該特定の方向に位置する音像を当該受聴者に知覚させる。音像は、受聴者の鼓膜に音波が到達した場合に受聴者が知覚するものの総体であり、当該知覚により受聴者が感じる心理的なものである。例えば、音像は、残響感、リズム感、持続感等の時間的性質、方向感、距離感、広がり感等の空間的性質、大きさ、高さ、音色等の質的性質を含んでいる。また、受聴者が音像の空間的な位置を知覚することを音像定位と呼ぶ。

頭部伝達関数は、受聴者に音像を知覚させるため、適切に再現された場合、三次元音響システム、音のバーチャルリアリティ等を実現する上で重要な概念である。しかしながら、頭部伝達関数の受聴者ごとの差がこれらの技術の実現のハードルとなっている。

初期頭部伝達関数生成部１０２は、実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出する。ここで言う窓関数は、例えば、ブラックマン‐ハリス窓、実測頭部インパルス応答に含まれる相対強度が最大のピークから所定の時間が経過するまでの期間のみを取り出す階段関数である。図７は、実施形態に係る初期頭部インパルス応答の一例を示す図である。図７は、横軸が時間を示しており、縦軸が相対強度を示している。例えば、初期頭部伝達関数生成部１０２は、図５に示した頭部インパルス応答に所定の窓関数を掛けて図７に示した初期頭部インパルス応答を算出する。

そして、初期頭部伝達関数生成部１０２は、初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する。図８は、実施形態に係る初期頭部伝達関数、周波数帯域及びモデル化頭部伝達関数の一例を示す図である。例えば、初期頭部伝達関数生成部１０２は、図８に実線で示した初期頭部伝達関数を示すデータを生成する。なお、初期頭部伝達関数は、実測頭部インパルス応答に含まれる相対強度が最大のピークから１ミリ秒程度が経過するまでの時間を取り出す窓関数により算出された場合、比較的ノイズが少ない滑らかな頭部伝達関数となることが多い。

周波数帯域分割部１０３は、初期頭部伝達関数を複数の周波数帯域に分割する。例えば、周波数帯域分割部１０３は、図８に実線で示した初期頭部伝達関数を図８に一点鎖線で示した周波数帯域に分割する。各周波数帯域は、図８に示した互いに隣接する一点鎖線で挟まれた帯域である。

モデル化頭部伝達関数生成部１０４は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理を実行する。ピークは、頭部伝達関数のうち上に凸となっている部分を指す。ノッチは、頭部伝達関数のうち下に凸となっている部分を指す。

次に、モデル化頭部伝達関数生成部１０４は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいて相対振幅を決定する処理を実行する。例えば、モデル化頭部伝達関数生成部１０４は、初めに、各周波数帯域に含まれている変曲点を探索する。モデル化頭部伝達関数生成部１０４は、周波数帯域において変曲点を一つ発見した場合、当該変曲点により示される相対振幅を当該周波数帯域の相対振幅と決定する。また、モデル化頭部伝達関数生成部１０４は、周波数帯域において変曲点を二つ以上発見した場合、これらの変曲点により示される相対振幅のうち最大の相対振幅を当該周波数帯域の相対振幅と決定する。また、モデル化頭部伝達関数生成部１０４は、周波数帯域において変曲点を発見し得なかった場合、当該周波数帯域の中心周波数における相対振幅を当該周波数帯域の相対振幅と決定する。

そして、モデル化頭部伝達関数生成部１０４は、各周波数帯域における相対振幅を示す点の間を補間することにより受聴者の個人化頭部伝達関数を示すデータを生成する。例えば、モデル化頭部伝達関数生成部１０４は、これらの点を線分で結ぶことにより、図８に破線で示した個人化頭部伝達関数を示すデータを生成する。

また、モデル化頭部伝達関数生成部１０４は、周波数帯域分割部１０３により設定される周波数帯域の幅により異なる精度で初期頭部伝達関数を再現する。そこで、次に、図９から図１３を参照しながら、周波数帯域の幅と初期頭部伝達関数の再現精度との関係について説明する。

図９は、実施形態に係る初期頭部伝達関数及び１オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図９は、実線が初期頭部伝達関数を示しており、破線が１オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。

図９に示すように、１オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部１０４は、初期頭部伝達関数に含まれているピークＰ２、ピークＰ３、第一ノッチＮ１及び第二ノッチＮ２をモデル化頭部伝達関数により再現し得ていない。なお、第一ノッチＮ１及び第二ノッチＮ２は、受聴者が正中面内において音像が位置する方向の上昇角を知覚する場合に重要な役割を果たす。

図１０は、実施形態に係る初期頭部伝達関数及び１／２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図１０は、実線が初期頭部伝達関数を示しており、破線が１／２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。

図１０に示すように、１／２オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部１０４は、初期頭部伝達関数に含まれているピークＰ２、第一ノッチＮ１及び第二ノッチＮ２を一定程度再現している。しかし、この場合、モデル化頭部伝達関数においてピークＰ２が極大となる周波数、第一ノッチＮ１が極小となる周波数及び第二ノッチＮ２が極小となる周波数は、初期頭部伝達関数におけるこれらの周波数と大きく異なっている。また、この場合、モデル化頭部伝達関数生成部１０４は、初期頭部伝達関数に含まれているピークＰ３を再現し得ていない。

図１１は、実施形態に係る初期頭部伝達関数及び１／３オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図１１は、実線が初期頭部伝達関数を示しており、破線が１／３オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。

図１１に示すように、１／３オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部１０４は、初期頭部伝達関数に含まれているピークＰ２、ピークＮ３、第一ノッチＮ１及び第二ノッチＮ２を一定程度再現している。ただし、この場合、モデル化頭部伝達関数においてピークＰ２が極大となる周波数、ピークＰ３が極大となる周波数、第一ノッチＮ１が極小となる周波数及び第二ノッチＮ２が極小となる周波数は、初期頭部伝達関数におけるこれらの周波数と若干異なっている。

図１２は、実施形態に係る初期頭部伝達関数及び１／６オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図１２は、実線が初期頭部伝達関数を示しており、破線が１／６オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。

図１２に示すように、１／６オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部１０４は、初期頭部伝達関数に含まれているピークＰ２、ピークＮ３、第一ノッチＮ１及び第二ノッチＮ２を比較的精度良く再現している。

図１３は、実施形態に係る初期頭部伝達関数及び１／１２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数の一例を示す図である。図１３は、実線が初期頭部伝達関数を示しており、破線が１／１２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を示している。

図１３に示すように、１／１２オクターブごとの周波数帯域に分割された場合、モデル化頭部伝達関数生成部１０４は、初期頭部伝達関数に含まれているピークＰ２、ピークＮ３、第一ノッチＮ１及び第二ノッチＮ２を比較的精度良く再現している。

また、モデル化頭部伝達関数生成部１０４による初期頭部伝達関数の再現精度は、受聴者による音像定位に影響を与える。そこで、図１４から図１９を参照しながら、初期頭部伝達関数の再現精度が受聴者による音像定位に与える影響について説明する。

図１４は、実測頭部伝達関数を使用した音像定位実験における音像の方向と学習用受聴者が解答した方向と関係の一例を示す図である。図１４は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図１４に示すように、実測頭部伝達関数を使用した場合、正中面内において音像が位置する上昇角と、受聴者が解答した上昇角とが略一致していることが分かる。

図１５は、１オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験における音像の方向と学習用受聴者が解答した方向と関係の一例を示す図である。図１５は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図１５に示すように、１オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、０度から１５０度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが頻発していることが分かる。

図１６は、１／２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。図１６は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図１６に示すように、１／２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、０度から１５０度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが頻発していることが分かる。

図１７は、１／３オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。図１７は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図１７に示すように、１／３オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、９０度から１５０度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが散見されるものの、両者が概ね一致していることが分かる。

図１８は、１／６オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。図１８は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図１８に示すように、１／６オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、９０度から１５０度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが散見されるものの、両者が概ね一致していることが分かる。

図１９は、１／１２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した音像定位実験において音像が位置する上昇角と学習用受聴者が解答した上昇角と関係の一例を示す図である。図１９は、横軸が正中面内において音像が位置する上昇角を示しており、縦軸が学習用受聴者が解答した上昇角を示している。図１９に示すように、１／１２オクターブごとの周波数帯域に分割して生成されたモデル化頭部伝達関数を使用した場合、９０度から１５０度の範囲で学習用受聴者が解答した上昇角が音像が位置する上昇角と一致していないケースが散見されるものの、両者が概ね一致していることが分かる。

したがって、周波数帯域分割部１０３により設定される周波数帯域の幅は、１／１２オクターブから１／３オクターブであることが好ましく、１／１２オクターブから１／６オクターブであることが更に好ましい。これにより、図９から図１３に示したピークＰ２、ピークＰ３、第一ノッチＮ１及び第二ノッチＮ２が互いに異なる周波数帯域に含まれることとなるため、モデル化頭部伝達関数生成部１０４は、初期頭部伝達関数の特徴的な構造を比較的精度良く再現することができる。

次に、頭部伝達関数生成装置１が第一ノッチを含む周波数帯域と学習用受聴者の耳介の形状との関係を導出する処理及び第二ノッチを含む周波数帯域と学習用受聴者の耳介の形状との関係を導出する処理について説明する。

耳介形状取得部１０５は、受聴者の耳介の形状を示すデータを取得する。図２０は、実施形態に係る学習用受聴者の耳介の形状のうち測定の対象となる箇所の一例を示す図である。

例えば、耳介形状取得部１０５は、図２０に示した点ｐ_１から点ｐ_１０の座標を示すデータを取得する。点ｐ_０は、外耳道入口上の点であり、極座標の原点と定義されている。図２０に示した曲線Ｃ_１、曲線Ｃ_２及び曲線Ｃ_３は、それぞれ耳輪の内側境界線、対輪に沿った線及び耳甲介の外側境界線を表している。図２０に示した１２０度から２７０度は、いずれも上昇角である。図２０に示すように、点ｐ_１から点ｐ_１０は、曲線Ｃ_１、曲線Ｃ_２又は曲線Ｃ_３と、点ｐ_０を通るいずれかの直線との交点であり、上述した極座標上に位置している。また、点ｐ_１から点ｐ_１０は、例えば、学習用受聴者の横顔の写真を使用して決定される。

周波数帯域特定部１０６は、第一ノッチを含んでいる第一周波数帯域及び第二ノッチを含んでいる第二周波数帯域を特定する。第一ノッチは、学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が最も低いノッチである。第二ノッチは、学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が二番目に低いノッチである。

関係導出部１０７は、複数の周波数帯域ごとに、第一周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。

例えば、関係導出部１０７は、第一処理において、学習用受聴者の耳介の形状を説明変数とし、複数の周波数帯域を目的変数とする判別分析を実行することにより、第一処理により導出される関係として第一相関行列を算出する。第一相関行列は、周波数帯域ごとに算出される。また、この場合、第一尺度は、マハラノビス距離又は当該マハラノビス距離を使用して算出される値となる。当該マハラノビス距離は、学習用受聴者の耳介の形状に関するパラメータを並べた行ベクトルと、第一相関行列と、学習用受聴者の耳介の形状に関するパラメータを並べた列ベクトルとの積である。

さらに、関係導出部１０７は、第一相関行列及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の周波数帯域のうち第一確率が最も大きな周波数帯域を第一周波数帯域と特定する。

また、関係導出部１０７は、複数の周波数帯域ごとに、第二周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。

例えば、関係導出部１０７は、第二処理において、学習用受聴者の耳介の形状を説明変数とし、複数の周波数帯域を目的変数とする判別分析を実行することにより、第二処理により導出される関係として第二相関行列を算出する。第二相関行列は、周波数帯域ごとに算出される。また、この場合、第二尺度は、マハラノビス距離又は当該マハラノビス距離を使用して算出される値となる。当該マハラノビス距離は、学習用受聴者の耳介の形状に関するパラメータを並べた行ベクトルと、第二相関行列と、学習用受聴者の耳介の形状に関するパラメータを並べた列ベクトルとの積である。

さらに、関係導出部１０７は、第二相関行列及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の周波数帯域のうち第二確率が最も大きな周波数帯域を第二周波数帯域と特定する。

また、関係導出部１０７は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、第一修正処理及び第二修正処理の少なくとも一方を実行してもよい。ここで言う所定の下限閾値は、例えば、「３」である。また、ここで言う所定の上限閾値は、例えば、「８」である。また、第一修正処理は、第一確率が二番目に大きな周波数帯域を第一周波数帯域と特定し直す処理である。また、第二修正処理は、第二確率が二番目に大きな周波数帯域を第二周波数帯域と特定し直す処理である。

第一ノッチが含まれ得る周波数帯域及び第二ノッチが含まれる周波数帯域は、いずれも１オクターブ程度の範囲に跨っており、一部が重複している。このため、関係導出部１０７は、第一修正処理及び第二修正処理の少なくとも一方を実行することにより、更に精度良く第一周波数帯域及び第二周波数帯域を特定することができる。

また、関係導出部１０７は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、学習用受聴者の耳介の所定の寸法が第一閾値未満である場合、第一修正処理を実行してもよい。これは、受聴者の耳介が小さい場合、初めに第一周波数帯域であると特定された周波数帯域が誤りであることが多いことによる。

また、関係導出部１０７は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、学習用受聴者の耳介の所定の寸法が第二閾値を超えている場合、第二修正処理を実行してもよい。これは、受聴者の耳介が大きい場合、初めに第二周波数帯域であると特定された周波数帯域が誤りであることが多いことによる。

次に、頭部伝達関数生成装置１が推論用受聴者の耳介の形状、第一処理により導出された関係及び第二処理により導出された関係を使用して推論用受聴者の個人化頭部伝達関数の第一ノッチを含む周波数帯域及び推論用受聴者の個人化頭部伝達関数の第二ノッチを含む周波数帯域を推定する処理について説明する。

耳介形状取得部１０５は、推論用受聴者の耳介の形状を示すデータを取得する。当該データは、例えば、図２０を参照しながら説明したデータと同様のデータである。

周波数帯域推定部１０８は、第三処理を実行する。具体的には、周波数帯域推定部１０８は、複数の周波数帯域ごとに、推論用受聴者の耳介の形状及び第一相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出する。そして、周波数帯域推定部１０８は、第三確率が最も大きな周波数帯域を第三周波数帯域と推定する。

また、周波数帯域推定部１０８は、第四処理を実行する。具体的には、周波数帯域推定部１０８は、複数の周波数帯域ごとに、推論用受聴者の耳介の形状及び第二相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出する。そして、周波数帯域推定部１０８は、第四確率が最も大きな周波数帯域を第四周波数帯域と推定する。

例えば、周波数帯域推定部１０８は、第三周波数帯域及び第四周波数帯域を推定する場合、次の式（１）を使用する。式（１）は、推論用受聴者の耳介の形状を示すパラメータｘ_１、ｘ_２、ｘ_３、ｘ_４、ｘ_５、ｘ_６、ｘ_７、ｘ_８、ｘ_９及びｘ_１０を要素とする行ベクトルと、これらを要素とする列ベクトルと、ｘ_ｊ（ｊ＝１，２，３，…，１０）とｘ_ｋ（ｋ＝１，２，３，…，１０）との相関係数ｒ_ｊ，ｋを要素とする相関行列の逆行列との積がマハラノビス距離Ｄの二乗に等しいことを表している。また、式（１）に含まれる行列の逆行列は、上述した第一相関行列及び第二相関行列の一例である。また、式（１）に含まれるマハラノビス距離Ｄは、上述した第一尺度及び第二尺度の一例である。例えば、周波数帯域推定部１０８は、マハラノビス距離が最小となる周波数帯域を第一周波数帯域と推定し、マハラノビス距離が最小となる周波数帯域を第二周波数帯域と推定する。

さらに、周波数帯域推定部１０８は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、第三修正処理及び第四修正処理の少なくとも一方を実行してもよい。ここで言う所定の下限閾値は、例えば、「３」である。また、ここで言う所定の上限閾値は、例えば、「８」である。また、第三修正処理は、第三確率が二番目に大きな周波数帯域を第三周波数帯域と推定し直す処理である。また、第四修正処理は、第四確率が二番目に大きな周波数帯域を第四周波数帯域と推定し直す処理である。例えば、周波数帯域推定部１０８は、式（１）を使用して算出されたマハラノビス距離が二番目に大きな周波数帯域を第三周波数帯域や第四周波数帯域と推定し直す。

個人化頭部伝達関数についてもモデル化頭部伝達関数と同様に、第一ノッチが含まれ得る周波数帯域及び第二ノッチが含まれる周波数帯域は、いずれも１オクターブ程度の範囲に跨っており、一部が重複している。このため、周波数帯域推定部１０８は、第三修正処理及び第四修正処理の少なくとも一方を実行することにより、更に精度良く第三周波数帯域及び第四周波数帯域を特定することができる。

また、周波数帯域推定部１０８は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、推論用受聴者の耳介の所定の寸法が第三閾値未満である場合、第三修正処理を実行してもよい。これは、推定用受聴者の耳介が小さい場合、初めに第三周波数帯域であると推定された周波数帯域が誤りであることが多いことによる。

また、周波数帯域推定部１０８は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、推論用受聴者の耳介の所定の寸法が第四閾値を超えている場合、第四修正処理を実行してもよい。これは、受聴者の耳介が大きい場合、初めに第四周波数帯域であると特定された周波数帯域が誤りであることが多いことによる。

次に、図２１を参照しながら、頭部伝達関数生成装置１が個人化頭部伝達関数及び個人化頭部インパルス応答を生成する処理の一例について説明する。図２１は、実施形態に係る頭部伝達関数生成装置が個人化頭部伝達関数及び個人化頭部インパルス応答を生成する処理の一例を示す概念図である。

個人化頭部伝達関数生成部１０９は、周波数帯域推定部１０８が第三周波数帯域及び第四周波数帯域を推定した結果を使用して推論用受聴者の個人化頭部伝達関数を生成する。

具体的には、図２１に示すように、個人化頭部伝達関数生成部１０９は、周波数帯域推定部１０８が推論用受聴者の耳介の形状、第一相関行列及び第二相関行列に基づいて推定した第三周波数帯域を示すデータ及び第四周波数帯域を示すデータを取得する。

そして、個人化頭部伝達関数生成部１０９は、例えば、第一ピークの周波数及び相対振幅を表す点、第三周波数帯域の中心周波数及び相対振幅を表す点、第二ピークの周波数及び相対振幅を表す点及び第四周波数帯域の中心周波数及び相対振幅を表す点を直線補間等により補間し、推論用受聴者の個人化頭部伝達関数を生成する。第一ピークは、第一ノッチよりも低い周波数領域に現れるピークである。第二ピークは、第一ノッチよりも高く、第二ノッチよりも低い周波数領域に現れるピークである。個人化頭部伝達関数生成部１０９は、個人化頭部伝達関数を示すデータを個人化頭部インパルス応答生成部１１０及び頭部伝達関数生成装置１の外部に出力する。

個人化頭部インパルス応答生成部１１０は、図２１に示すように、個人化頭部伝達関数生成部１０９により生成された個人化頭部伝達関数を逆フーリエ変換し、個人化頭部インパルス応答を生成する。また、個人化頭部インパルス応答生成部１１０は、個人化頭部インパルス応答を示すデータを頭部伝達関数生成装置１の外部に出力する。

次に、図２２から図２４を参照しながら実施形態に係る頭部伝達関数生成装置が上述した周波数帯域の少なくとも二つを統合した統合周波数帯域を生成して使用する場合について説明する。なお、図１から図２１を参照しながら説明した内容と重複する内容に関する説明を適宜省略する。

図２２は、実施形態に係る頭部伝達関数生成装置の機能的な構成の一例を示す図である。図２２に示すように、頭部伝達関数生成装置１ａは、実測頭部インパルス応答取得部１０１と、初期頭部伝達関数生成部１０２と、周波数帯域分割部１０３と、モデル化頭部伝達関数生成部１０４と、耳介形状取得部１０５と、周波数帯域統合部１０６ａと、統合周波数帯域特定部１０７ａと、関係導出部１０８ａと、統合周波数帯域推定部１０９ａと、個人化頭部伝達関数生成部１１０ａと、個人化頭部インパルス応答生成部１１１ａとを備える。

周波数帯域統合部１０６ａは、複数の周波数帯域を統合した統合周波数帯域を少なくとも二つ生成する。図２３及び図２４は、実施形態に係る統合周波数帯域の一例を示す図である。

例えば、周波数帯域統合部１０６ａは、図２３に番号「４２」で示されている周波数帯域を選択し、当該周波数帯域に隣接しており図２３に番号「４１」で示されている周波数帯域及び当該周波数帯域に隣接しており図２３に番号「４３」で示されている周波数帯域と統合する。これにより、周波数帯域統合部１０６ａは、図２３に番号「１」で示されている統合周波数帯域を生成する。

また、例えば、周波数帯域統合部１０６ａは、図２３に番号「４５」で示されている周波数帯域を選択し、当該周波数帯域に隣接しており図２３に番号「４４」で示されている周波数帯域及び当該周波数帯域に隣接しており図２３に番号「４６」で示されている周波数帯域と統合する。これにより、周波数帯域統合部１０６ａは、図２３に番号「２」で示されている統合周波数帯域を生成する。

また、例えば、周波数帯域統合部１０６ａは、図２４に番号「４８」で示されている周波数帯域を選択し、当該周波数帯域に隣接しており図２４に番号「４７」で示されている周波数帯域及び当該周波数帯域に隣接しており図２４に番号「４８」で示されている周波数帯域と統合する。これにより、周波数帯域統合部１０６ａは、図２４に番号「１」で示されている統合周波数帯域を生成する。

また、例えば、周波数帯域統合部１０６ａは、図２４に番号「５１」で示されている周波数帯域を選択し、当該周波数帯域に隣接しており図２４に番号「５０」で示されている周波数帯域及び当該周波数帯域に隣接しており図２４に番号「５２」で示されている周波数帯域と統合する。これにより、周波数帯域統合部１０６ａは、図２４に番号「２」で示されている統合周波数帯域を生成する。

図２３及び図２４に示した統合周波数帯域は、いずれも±（１／１２+１／２４）＝±１／８≒±０．１２５オクターブの周波数幅を有する。この周波数幅は、受聴者が正中面内において音像が位置する方向の上昇角を弁別可能な周波数幅と同程度の周波数幅である。

なお、図２３及び図２４に示した中心周波数は、各周波数帯域の中心周波数を示している。また、図２３に示した耳介の数は、第一ノッチが各周波数帯域に含まれていると推定された耳介の数を示している。また、図２４に示した耳介の数は、第二ノッチが各周波数帯域に含まれていると推定された耳介の数を示している。

統合周波数帯域特定部１０７ａは、第一ノッチを含んでいる第一統合周波数帯域及び第二ノッチを含んでいる第二統合周波数帯域を特定する。

関係導出部１０８ａは、複数の統合周波数帯域ごとに、第一統合周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。

例えば、関係導出部１０８ａは、第一処理において、学習用受聴者の耳介の形状を説明変数とし、複数の統合周波数帯域を目的変数とする判別分析を実行することにより、第一処理により導出される関係として第一相関行列を算出する。また、この場合、第一尺度は、マハラノビス距離又は当該マハラノビス距離を使用して算出される値となる。

さらに、関係導出部１０７は、第一相関行列及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の統合周波数帯域のうち第一確率が最も大きな統合周波数帯域を第一統合周波数帯域と特定する。

また、関係導出部１０８ａは、複数の統合周波数帯域ごとに、第二統合周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。

例えば、関係導出部１０８ａは、第二処理において、学習用受聴者の耳介の形状を説明変数とし、複数の統合周波数帯域を目的変数とする判別分析を実行することにより、第二処理により導出される関係として第二相関行列を算出する。また、この場合、第二尺度は、マハラノビス距離又は当該マハラノビス距離を使用して算出される値となる。

さらに、関係導出部１０７は、第二相関行列及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の統合周波数帯域のうち第二確率が最も大きな統合周波数帯域を第二統合周波数帯域と特定する。

次に、頭部伝達関数生成装置１ａが推論用受聴者の耳介の形状、第一処理により導出された関係及び第二処理により導出された関係を使用して推論用受聴者の個人化頭部伝達関数の第一ノッチを含む統合周波数帯域及び推論用受聴者の個人化頭部伝達関数の第二ノッチを含む統合周波数帯域を推定する処理について説明する。

統合周波数帯域推定部１０９ａは、第三処理を実行する。具体的には、統合周波数帯域推定部１０９ａは、複数の統合周波数帯域ごとに、推論用受聴者の耳介の形状及び第一相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出する。そして、統合周波数帯域推定部１０９ａは、第三確率が最も大きな統合周波数帯域を第三統合周波数帯域と推定する。

また、統合周波数帯域推定部１０９ａは、第四処理を実行する。具体的には、統合周波数帯域推定部１０９ａは、複数の統合周波数帯域ごとに、推論用受聴者の耳介の形状及び第二相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出する。そして、統合周波数帯域推定部１０９ａは、第四確率が最も大きな統合周波数帯域を第四統合周波数帯域と推定する。

個人化頭部伝達関数生成部１１０ａは、統合周波数帯域推定部１０９ａが第三統合周波数帯域及び第四統合周波数帯域を推定した結果を使用して推論用受聴者の個人化頭部伝達関数を生成する。具体的には、個人化頭部伝達関数生成部１１０ａは、上述した個人化頭部伝達関数生成部１０９が第三周波数帯域及び第四周波数帯域を推定した結果を使用して推論用受聴者の個人化頭部伝達関数を生成する手法を統合周波数帯域に適用する。これにより、個人化頭部伝達関数生成部１１０ａは、統合周波数帯域に基づいて個人化頭部伝達関数を生成する。

個人化頭部インパルス応答生成部１１１ａは、個人化頭部伝達関数生成部１１０ａにより生成された個人化頭部伝達関数を逆フーリエ変換し、個人化頭部インパルス応答を生成する。

次に図２５から図３１を参照しながら実施形態に係る頭部伝達関数生成装置が実行する処理の一例について説明する。

図２５は、実施形態に係る頭部伝達関数生成装置がモデル化頭部伝達関数を生成する場合に実行する処理の一例を示すフローチャートである。

ステップＳ１０１において、実測頭部インパルス応答取得部１０１は、学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する。

ステップＳ１０２において、初期頭部伝達関数生成部１０２は、実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出し、初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する。

ステップＳ１０３において、周波数帯域分割部１０３は、初期頭部伝達関数を複数の周波数帯域に分割する。

ステップＳ１０４において、モデル化頭部伝達関数生成部１０４は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する。

ステップＳ１０５において、モデル化頭部伝達関数生成部１０４は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいて相対振幅を決定する。

ステップＳ１０６において、モデル化頭部伝達関数生成部１０４は、相対振幅を示す点の間を補間することにより学習用受聴者のモデル化頭部伝達関数を示すデータを生成する。

図２６及び図２７は、実施形態に係る頭部伝達関数生成装置が第一周波数帯域及び第二周波数帯域を特定する処理の一例を示すフローチャートである。

ステップＳ２０１において、耳介形状取得部１０５は、学習用受聴者の耳介の形状を示すデータを取得する。

ステップＳ２０２において、周波数帯域特定部１０６は、第一ノッチを含んでいる第一周波数帯域を特定し、第二ノッチを含んでいる第二周波数帯域を特定する。

ステップＳ２０３において、関係導出部１０７は、複数の周波数帯域ごとに、第一周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。

ステップＳ２０４において、関係導出部１０７は、複数の周波数帯域ごとに、第二周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。

ステップＳ２０５において、関係導出部１０７は、第一確率が最も大きな周波数帯域を第一周波数帯域と特定し、第二確率が最も大きな周波数帯域を第二周波数帯域と特定する。

ステップＳ２０６において、関係導出部１０７は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であるか否かを判定する。関係導出部１０７は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であると判定した場合（ステップＳ２０６：ＹＥＳ）、処理をステップＳ２０７に進める。一方、関係導出部１０７は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下でも所定の上限閾値以上でもないと判定した場合（ステップＳ２０６：ＮＯ）、処理を終了させる。

ステップＳ２０７において、関係導出部１０７は、学習用受聴者の耳介の所定の寸法が第一閾値未満であるか否かを判定する。関係導出部１０７は、学習用受聴者の耳介の所定の寸法が第一閾値未満であると判定した場合（ステップＳ２０７：ＹＥＳ）、処理をステップＳ２０８に進める。一方、関係導出部１０７は、学習用受聴者の耳介の所定の寸法が第一閾値以上であると判定した場合（ステップＳ２０７：ＮＯ）、処理をステップＳ２０９に進める。

ステップＳ２０８において、関係導出部１０７は、第一確率が二番目に大きな周波数帯域を第一周波数帯域と特定し直す第一修正処理を実行する。

ステップＳ２０９において、関係導出部１０７は、学習用受聴者の耳介の所定の寸法が
第二閾値を超えているか否かを判定する。関係導出部１０７は、学習用受聴者の耳介の所定の寸法が第二閾値を超えていると判定した場合（ステップＳ２０９：ＹＥＳ）、処理をステップＳ２１０に進める。一方、関係導出部１０７は、学習用受聴者の耳介の所定の寸法が第二閾値以下であると判定した場合（ステップＳ２０９：ＮＯ）、処理を終了させる。

ステップＳ２１０において、関係導出部１０７は、第二確率が二番目に大きな周波数帯域を第二周波数帯域と特定し直す第二修正処理を実行する。

図２８及び図２９は、実施形態に係る頭部伝達関数生成装置が第三周波数帯域及び第四周波数帯域を特定する処理の一例を示すフローチャートである。

ステップＳ３０１において、耳介形状取得部１０５は、推論用受聴者の耳介の形状を示すデータを取得する。

ステップＳ３０２において、周波数帯域推定部１０８は、第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、第三確率が最も大きな周波数帯域を第三周波数帯域と推定する第三処理を実行する。

ステップＳ３０３において、周波数帯域推定部１０８は、第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、第四確率が最も大きな周波数帯域を第四周波数帯域と推定する第四処理を実行する。

ステップＳ３０４において、周波数帯域推定部１０８は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であるか否かを判定する。周波数帯域推定部１０８は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であると判定した場合（ステップＳ３０４：ＹＥＳ）、処理をステップＳ３０５に進める。一方、周波数帯域推定部１０８は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下でも所定の上限閾値以上でもないと判定した場合（ステップＳ３０４：ＮＯ）、処理を終了させる。

ステップＳ３０５において、周波数帯域推定部１０８は、推論用受聴者の耳介の所定の寸法が第三閾値未満であるか否かを判定する。周波数帯域推定部１０８は、推論用受聴者の耳介の所定の寸法が第三閾値未満であると判定した場合（ステップＳ３０５：ＹＥＳ）、処理をステップＳ３０６に進める。一方、周波数帯域推定部１０８は、推論用受聴者の耳介の所定の寸法が第三閾値以上であると判定した場合（ステップＳ３０５：ＮＯ）、処理を終了させる。

ステップＳ３０６において、周波数帯域推定部１０８は、第三確率が二番目に大きな周波数帯域を第三周波数帯域と推定し直す第三修正処理を実行する。

ステップＳ３０７において、周波数帯域推定部１０８は、推論用受聴者の耳介の所定の寸法が第四閾値を超えているか否かを判定する。周波数帯域推定部１０８は、推論用受聴者の耳介の所定の寸法が第四閾値を超えていると判定した場合（ステップＳ３０７：ＹＥＳ）、処理をステップＳ３０８に進める。一方、周波数帯域推定部１０８は、推論用受聴者の耳介の所定の寸法が第四閾値以下であると判定した場合（ステップＳ：ＮＯ）、処理を終了させる。

ステップＳ３０８において、周波数帯域推定部１０８は、第四確率が二番目に大きな周波数帯域を第四周波数帯域と推定し直す第四修正処理を実行する。

図３０は、実施形態に係る頭部伝達関数生成装置が第一統合周波数帯域及び第二統合周波数帯域を特定する処理の一例を示すフローチャートである。

ステップＳ４０１において、耳介形状取得部１０５は、学習用受聴者の耳介の形状を示すデータを取得する。

ステップＳ４０２において、周波数帯域統合部１０６ａは、複数の周波数帯域を統合した統合周波数帯域を少なくとも二つ生成する。

ステップＳ４０３において、統合周波数帯域特定部１０７ａは、第一ノッチを含んでいる第一統合周波数帯域を特定し、第二ノッチを含んでいる第二統合周波数帯域を特定する。

ステップＳ４０４において、関係導出部１０８ａは、複数の統合周波数帯域ごとに、第一統合周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。

ステップＳ４０５において、関係導出部１０８ａは、複数の統合周波数帯域ごとに、第二統合周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。

ステップＳ４０６において、関係導出部１０８ａは、第一確率が最も大きな統合周波数帯域を第一統合周波数帯域と特定し、第二確率が最も大きな統合周波数帯域を第二統合周波数帯域と特定する。

図３１は、実施形態に係る頭部伝達関数生成装置実施形態に係る頭部伝達関数生成装置が第三周波数帯域及び第四周波数帯域を推定する処理の一例を示すフローチャートである。

ステップＳ５０１において、耳介形状取得部１０５は、推論用受聴者の耳介の形状を示すデータを取得する。

ステップＳ５０２において、統合周波数帯域推定部１０９ａは、第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、第三確率が最も大きな統合周波数帯域を第三統合周波数帯域と推定する第三処理を実行する。

ステップＳ５０３において、統合周波数帯域推定部１０９ａは、第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、第四確率が最も大きな統合周波数帯域を第四統合周波数帯域と推定する第四処理を実行する。

以上、実施形態に係る頭部伝達関数生成装置１について説明した。頭部伝達関数生成装置１は、初期頭部伝達関数を複数の周波数帯域に分割し、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理を実行する。次に、頭部伝達関数生成装置１は、複数の周波数帯域ごとに初期頭部伝達関数の曲率に基づいて相対振幅を決定する処理を実行する。そして、頭部伝達関数生成装置１は、相対振幅を示す点の間を補間することにより学習用受聴者のモデル化頭部伝達関数を示すデータを生成する。

これにより、頭部伝達関数生成装置１は、学習用受聴者本人の頭部伝達関数を実際に測定すること無く、学習用受聴者本人の頭部伝達関数の特徴を再現したモデル化頭部伝達関数を得ることができる。

また、頭部伝達関数生成装置１は、学習用受聴者の耳介の形状を示すデータを取得する。次に、頭部伝達関数生成装置１は、モデル化頭部伝達関数の第一周波数帯域及び第二周波数帯域を特定する。そして、頭部伝達関数生成装置１は、複数の周波数帯域ごとに、第一周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。また、頭部伝達関数生成装置１は、複数の周波数帯域ごとに、第二周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。

これにより、頭部伝達関数生成装置１は、推論用受聴者のモデル化頭部伝達関数の生成に使用され得る耳介の形状と第一周波数帯域との関係及び耳介の形状と第二周波数帯域との関係を導出することができる。

また、頭部伝達関数生成装置１は、第一処理において、学習用受聴者の耳介の形状を説明変数とし、複数の周波数帯域を目的変数とする判別分析を実行することにより、第一処理により導出される関係として第一相関行列を算出する。また、頭部伝達関数生成装置１は、二処理において、学習用受聴者の耳介の形状を説明変数とし、複数の周波数帯域を目的変数とする判別分析を実行することにより、第二処理により導出される関係として第二相関行列を算出する。

これにより、頭部伝達関数生成装置１は、一定以上の精度で耳介の形状と第一周波数帯域との関係及び耳介の形状と第二周波数帯域との関係を導出することができる。

また、頭部伝達関数生成装置１は、第一相関行列及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の周波数帯域のうち第一確率が最も大きな周波数帯域を第一周波数帯域と特定する。また、頭部伝達関数生成装置１は、第二相関行列及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の周波数帯域のうち第二確率が最も大きな周波数帯域を第二周波数帯域と特定する。

これにより、頭部伝達関数生成装置１は、一定以上の精度で第一周波数帯域及び第二周波数帯域を特定することができる。

また、頭部伝達関数生成装置１は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、上述した第一修正処理及び第二修正処理の少なくとも一方を実行する。

これにより、頭部伝達関数生成装置１は、受聴者が正中面内において音像が位置する方向の上昇角を知覚する場合に重要な役割を果たす第一ノッチ及び第二ノッチを更に精度良く特定することができる。

また、頭部伝達関数生成装置１は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、学習用受聴者の耳介の所定の寸法が第一閾値未満である場合、第一修正処理を実行してもよい。

これにより、頭部伝達関数生成装置１は、学習用受聴者の耳介が小さく、第一周波数帯域であると初めに特定された周波数帯域が誤りである可能性が比較的高い場合に第一修正処理を実行し、第一周波数帯域を更に高い精度で特定することができる。

また、頭部伝達関数生成装置１は、第一周波数帯域と特定された周波数帯域と、第二周波数帯域と特定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、学習用受聴者の耳介の所定の寸法が第二閾値を超えている場合、第二修正処理を実行してもよい。

これにより、頭部伝達関数生成装置１は、学習用受聴者の耳介が大きく、第二周波数帯域であると初めに特定された周波数帯域が誤りである可能性が比較的高い場合に第二修正処理を実行し、第二周波数帯域を更に高い精度で特定することができる。

また、頭部伝達関数生成装置１は、推論用受聴者の耳介の形状を示すデータをする。そして、頭部伝達関数生成装置１は、第三処理及び第四処理を実行する。第三処理は、推論用受聴者の耳介の形状及び第一相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、第三確率が最も大きな周波数帯域を第三周波数帯域と推定する処理である。第四処理は、複数の周波数帯域ごとに、推論用受聴者の耳介の形状及び第二相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、第四確率が最も大きな周波数帯域を第四周波数帯域と推定する処理である。

これにより、頭部伝達関数生成装置１は、耳介の形状が未知である推論用受聴者の個人化頭部伝達関数について第一ノッチが含まれている第三周波数帯域及び第二ノッチが含まれている第四周波数帯域を一定以上の精度で推定することができる。

また、頭部伝達関数生成装置１は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、上述した第三修正処理及び第四修正処理の少なくとも一方を実行する。

これにより、頭部伝達関数生成装置１は、耳介の形状が未知である推論用受聴者の個人化頭部伝達関数について第三周波数帯域及び第四周波数帯域の少なくとも一方を更に精度良く推定することができる。

また、頭部伝達関数生成装置１は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、推論用受聴者の耳介の所定の寸法が第三閾値未満である場合、第三修正処理を実行してもよい。

これにより、頭部伝達関数生成装置１は、推論用受聴者の耳介が小さく、第三周波数帯域であると初めに推定された周波数帯域が誤りである可能性が比較的高い場合に第三修正処理を実行し、第三周波数帯域を更に高い精度で推定することができる。

また、頭部伝達関数生成装置１は、第三周波数帯域と推定された周波数帯域と、第四周波数帯域と推定された周波数帯域との間に存在する周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、推論用受聴者の耳介の所定の寸法が第四閾値を超えている場合、第四修正処理を実行してもよい。

これにより、頭部伝達関数生成装置１は、推論用受聴者の耳介が大きく、第四周波数帯域であると初めに推定された周波数帯域が誤りである可能性が比較的高い場合に第四修正処理を実行し、第四周波数帯域を更に高い精度で推定することができる。

また、頭部伝達関数生成装置１は、周波数帯域推定部１０８が第三周波数帯域及び第四周波数帯域を推定した結果を使用して推論用受聴者の個人化頭部伝達関数を生成する。

これにより、頭部伝達関数生成装置１は、推論用受聴者が正中面内において音像が位置する方向の上昇角を知覚する場合に重要な役割を果たす第一ノッチ及び第二ノッチを精度良く再現した個人化頭部伝達関数を得ることができる。

また、頭部伝達関数生成装置１ａは、学習用受聴者の耳介の形状を示すデータを取得する。次に、頭部伝達関数生成装置１ａは、複数の周波数帯域を統合した統合周波数帯域を少なくとも二つ生成する。次に、頭部伝達関数生成装置１ａは、モデル化頭部伝達関数の第一統合周波数帯域及び第二統合周波数帯域を特定する。そして、頭部伝達関数生成装置１ａは、複数の統合周波数帯域ごとに、第一統合周波数帯域に該当している第一確率と相関を有する第一尺度と、学習用受聴者の耳介の形状との関係を導出する第一処理を実行する。また、頭部伝達関数生成装置１ａは、複数の統合周波数帯域ごとに、第二統合周波数帯域に該当している第二確率と相関を有する第二尺度と、学習用受聴者の耳介の形状との関係を導出する第二処理を実行する。

これにより、頭部伝達関数生成装置１ａは、学習用受聴者のモデル化頭部伝達関数の生成に使用され得る耳介の形状と第一周波数帯域との関係を学習用受聴者が弁別可能な周波数幅に即して導出することができる。また、これにより、頭部伝達関数生成装置１ａは、学習用受聴者のモデル化頭部伝達関数の生成に使用され得る耳介の形状と第二周波数帯域との関係を学習用受聴者が弁別可能な周波数幅に即して導出することができる。

また、頭部伝達関数生成装置１ａは、第一処理において、学習用受聴者の耳介の形状を説明変数とし、複数の統合周波数帯域を目的変数とする判別分析を実行することにより、第一処理により導出される関係として第一相関行列を算出する。また、頭部伝達関数生成装置１ａは、第二処理において、学習用受聴者の耳介の形状を説明変数とし、複数の統合周波数帯域を目的変数とする判別分析を実行することにより、第二処理により導出される関係として第二相関行列を算出する。

これにより、頭部伝達関数生成装置１ａは、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即した耳介の形状と第一周波数帯域との関係を導出することができる。また、これにより、頭部伝達関数生成装置１ａは、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即した耳介の形状と第二周波数帯域との関係を導出することができる。

また、頭部伝達関数生成装置１ａは、第一相関行列及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の統合周波数帯域のうち第一確率が最も大きな統合周波数帯域を第一統合周波数帯域と特定する。また、頭部伝達関数生成装置１ａは、第二相関行列及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の統合周波数帯域のうち第二確率が最も大きな統合周波数帯域を第二統合周波数帯域と特定する。

これにより、頭部伝達関数生成装置１ａは、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即している第一統合周波数帯域を特定することができる。また、これにより、頭部伝達関数生成装置１ａは、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即している第二統合周波数帯域を特定することができる。

また、頭部伝達関数生成装置１ａは、推論用受聴者の耳介の形状を示すデータをする。そして、頭部伝達関数生成装置１ａは、第三処理及び第四処理を実行する。第三処理は、複数の統合周波数帯域ごとに、推論用受聴者の耳介の形状及び第一相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、第三確率が最も大きな統合周波数帯域を第三統合周波数帯域と推定する処理である。第四処理は、複数の統合周波数帯域ごとに、推論用受聴者の耳介の形状及び第二相関行列を使用して推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、第四確率が最も大きな統合周波数帯域を第四統合周波数帯域と推定する処理である。

これにより、頭部伝達関数生成装置１ａは、耳介の形状が未知である推論用受聴者の個人化頭部伝達関数について、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即している第三統合周波数帯域推定することができる。また、これにより、頭部伝達関数生成装置１ａは、耳介の形状が未知である推論用受聴者の個人化頭部伝達関数について、一定以上の精度であり、かつ、学習用受聴者が弁別可能な周波数幅に即している第四統合周波数帯域推定することができる。

なお、上述した実施形態では、頭部伝達関数生成装置１が判別分析を実行して第一相関行列及び第二相関行列を算出する場合を例に挙げて説明したが、これに限定されない。

例えば、関係導出部１０７は、第一処理において、学習用受聴者の耳介の形状を問題とし、第一周波数帯域を解答とする教師データを使用して学習させた第一学習済モデルを第一処理により導出される関係として導出してもよい。この場合、関係導出部１０７は、第一学習済モデル及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の周波数帯域のうち第一確率が最も大きな周波数帯域を第一周波数帯域と特定する。

また、例えば、関係導出部１０７は、第二処理において、学習用受聴者の耳介の形状を問題とし、第二周波数帯域を解答とする教師データを使用して学習させた第二学習済モデルを第二処理により導出される関係として導出してもよい。この場合、関係導出部１０７は、第二学習済モデル及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の周波数帯域のうち第二確率が最も大きな周波数帯域を第二周波数帯域と特定する。

また、例えば、関係導出部１０８ａは、第一処理において、学習用受聴者の耳介の形状を問題とし、第一統合周波数帯域を解答とする教師データを使用して学習させた第一学習済モデルを第一処理により導出される関係として導出してもよい。この場合、関係導出部１０８ａは、第一学習済モデル及び学習用受聴者の耳介の形状を使用して第一尺度を算出し、第一尺度に基づいて、複数の統合周波数帯域のうち第一確率が最も大きな統合周波数帯域を第一統合周波数帯域と特定する。

また、例えば、関係導出部１０８ａは、第二処理において、学習用受聴者の耳介の形状を問題とし、第二統合周波数帯域を解答とする教師データを使用して学習させた第二学習済モデルを第二処理により導出される関係として導出してもよい。この場合、関係導出部１０８ａは、第二学習済モデル及び学習用受聴者の耳介の形状を使用して第二尺度を算出し、第二尺度に基づいて、複数の統合周波数帯域のうち第二確率が最も大きな統合周波数帯域を第二統合周波数帯域と特定する。

また、上述した実施形態では、頭部伝達関数生成装置１が第一相関行列を使用して第三尺度を算出し、第二相関行列を使用して第四尺度を算出する場合を例に挙げて説明したが、これに限定されない。例えば、周波数帯域推定部１０８は、第一学習済モデルを使用して第三尺度を算出してもよい。また、例えば、周波数帯域推定部１０８は、第二学習済モデルを使用して第四尺度を算出してもよい。

また、上述した実施形態では、頭部伝達関数生成装置１ａが第一相関行列を使用して第三尺度を算出し、第二相関行列を使用して第四尺度を算出する場合を例に挙げて説明したが、これに限定されない。例えば、統合周波数帯域推定部１０９ａは、第一学習済モデルを使用して第三尺度を算出してもよい。また、例えば、統合周波数帯域推定部１０９ａは、第二学習済モデルを使用して第四尺度を算出してもよい。

また、上述した実施形態における頭部伝達関数生成装置１が備える各機能の少なくとも一部は、これらの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここで言うコンピュータシステムは、ＯＳや周辺機器等のハードウェアを含むものとする。

また、コンピュータ読み取り可能な記録媒体は、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶部のことをいう。さらにコンピュータ読み取り可能な記録媒体は、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また、上述したプログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。

以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲内において種々の組み合わせ、変形、置換及び設計変更の少なくとも一つを加えることができる。

１，１ａ…頭部伝達関数生成装置、１１…プロセッサ、１２…主記憶装置、１３…通信インターフェース、１４…補助記憶装置、１５…入出力装置、１０１…実測頭部インパルス応答取得部、１０２…初期頭部伝達関数生成部、１０３…周波数帯域分割部、１０４…モデル化頭部伝達関数生成部、１０５…耳介形状取得部、１０６…周波数帯域特定部、１０６ａ…周波数帯域統合部、１０７ａ…統合周波数帯域特定部、１０７，１０８ａ…関係導出部、１０８…周波数帯域推定部、１０９，１１０ａ…個人化頭部伝達関数生成部、１０９ａ…統合周波数帯域推定部、１１０，１１１ａ…個人化頭部インパルス応答生成部、１５１…マウス、１５２…キーボード、１５３…ディスプレイ

Claims

学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する実測頭部インパルス応答取得部と、
前記実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出し、前記初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する初期頭部伝達関数生成部と、
前記初期頭部伝達関数を複数の周波数帯域に分割する周波数帯域分割部と、
複数の前記周波数帯域ごとに前記初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理及び相対振幅を決定する処理を実行し、前記相対振幅を示す点の間を補間することにより前記学習用受聴者のモデル化頭部伝達関数を示すデータを生成するモデル化頭部伝達関数生成部と、
を備える頭部伝達関数生成装置。
前記学習用受聴者の耳介の形状を示すデータを取得する耳介形状取得部と、
前記学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第一周波数帯域及び前記学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第二周波数帯域を特定する周波数帯域特定部と、
複数の前記周波数帯域ごとに、前記第一周波数帯域に該当している第一確率と相関を有する第一尺度と、前記学習用受聴者の耳介の形状との関係を導出する第一処理を実行し、複数の前記周波数帯域ごとに、前記第二周波数帯域に該当している第二確率と相関を有する第二尺度と、前記学習用受聴者の耳介の形状との関係を導出する第二処理を実行する関係導出部と、
を更に備える請求項１に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一処理において、前記学習用受聴者の耳介の形状を説明変数とし、複数の前記周波数帯域を目的変数とする判別分析を実行することにより、前記第一処理により導出される関係として第一相関行列を算出し、前記第二処理において、前記学習用受聴者の耳介の形状を説明変数とし、複数の前記周波数帯域を目的変数とする判別分析を実行することにより、前記第二処理により導出される関係として第二相関行列を算出する、
請求項２に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一相関行列及び前記学習用受聴者の耳介の形状を使用して前記第一尺度を算出し、前記第一尺度に基づいて、複数の前記周波数帯域のうち前記第一確率が最も大きな前記周波数帯域を前記第一周波数帯域と特定し、前記第二相関行列及び前記学習用受聴者の耳介の形状を使用して前記第二尺度を算出し、前記第二尺度に基づいて、複数の前記周波数帯域のうち前記第二確率が最も大きな前記周波数帯域を前記第二周波数帯域と特定する、
請求項３に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一処理において、前記学習用受聴者の耳介の形状を問題とし、前記第一周波数帯域を解答とする教師データを使用して学習させた第一学習済モデルを前記第一処理により導出される関係として導出し、前記第二処理において、前記学習用受聴者の耳介の形状を問題とし、前記第二周波数帯域を解答とする教師データを使用して学習させた第二学習済モデルを前記第二処理により導出される関係として導出する、
請求項２に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一学習済モデル及び前記学習用受聴者の耳介の形状を使用して前記第一尺度を算出し、前記第一尺度に基づいて、複数の前記周波数帯域のうち前記第一確率が最も大きな前記周波数帯域を前記第一周波数帯域と特定し、前記第二学習済モデル及び前記学習用受聴者の耳介の形状を使用して前記第二尺度を算出し、前記第二尺度に基づいて、複数の前記周波数帯域のうち前記第二確率が最も大きな前記周波数帯域を前記第二周波数帯域と特定する、
請求項５に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一周波数帯域と特定された前記周波数帯域と、前記第二周波数帯域と特定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、前記第一確率が二番目に大きな前記周波数帯域を前記第一周波数帯域と特定し直す第一修正処理及び前記第二確率が二番目に大きな前記周波数帯域を前記第二周波数帯域と特定し直す第二修正処理の少なくとも一方を更に実行する、
請求項４又は請求項６に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一周波数帯域と特定された前記周波数帯域と、前記第二周波数帯域と特定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、前記学習用受聴者の耳介の所定の寸法が第一閾値未満である場合、前記第一修正処理を実行する、
請求項７に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一周波数帯域と特定された前記周波数帯域と、前記第二周波数帯域と特定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、前記学習用受聴者の耳介の所定の寸法が第二閾値を超えている場合、前記第二修正処理を実行する、
請求項７又は請求項８に記載の頭部伝達関数生成装置。
前記学習用受聴者の耳介の形状を示すデータを取得する耳介形状取得部と、
複数の前記周波数帯域を統合した統合周波数帯域を少なくとも二つ生成する周波数帯域統合部と、
前記学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第一統合周波数帯域及び前記学習用受聴者のモデル化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第二統合周波数帯域を特定する統合周波数帯域特定部と、
複数の前記統合周波数帯域ごとに、前記第一統合周波数帯域に該当している第一確率と相関を有する第一尺度と、前記学習用受聴者の耳介の形状との関係を導出する第一処理を実行し、複数の前記統合周波数帯域ごとに、前記第二統合周波数帯域に該当している第二確率と相関を有する第二尺度と、前記学習用受聴者の耳介の形状との関係を導出する第二処理を実行する関係導出部と、
を更に備える請求項１に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一処理において、前記学習用受聴者の耳介の形状を説明変数とし、複数の前記統合周波数帯域を目的変数とする判別分析を実行することにより、前記第一処理により導出される関係として第一相関行列を算出し、前記第二処理において、前記学習用受聴者の耳介の形状を説明変数とし、複数の前記統合周波数帯域を目的変数とする判別分析を実行することにより、前記第二処理により導出される関係として第二相関行列を算出する、
請求項１０に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一相関行列及び前記学習用受聴者の耳介の形状を使用して前記第一尺度を算出し、前記第一尺度に基づいて、複数の前記統合周波数帯域のうち前記第一確率が最も大きな前記統合周波数帯域を前記第一統合周波数帯域と特定し、前記第二相関行列及び前記学習用受聴者の耳介の形状を使用して前記第二尺度を算出し、前記第二尺度に基づいて、複数の前記統合周波数帯域のうち前記第二確率が最も大きな前記統合周波数帯域を前記第二統合周波数帯域と特定する、
請求項１１に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一処理において、前記学習用受聴者の耳介の形状を問題とし、前記第一統合周波数帯域を解答とする教師データを使用して学習させた第一学習済モデルを前記第一処理により導出される関係として導出し、前記第二処理において、前記学習用受聴者の耳介の形状を問題とし、前記第二統合周波数帯域を解答とする教師データを使用して学習させた第二学習済モデルを前記第二処理により導出される関係として導出する、
請求項１０に記載の頭部伝達関数生成装置。
前記関係導出部は、前記第一学習済モデル及び前記学習用受聴者の耳介の形状を使用して前記第一尺度を算出し、前記第一尺度に基づいて、複数の前記統合周波数帯域のうち前記第一確率が最も大きな前記統合周波数帯域を前記第一統合周波数帯域と特定し、前記第二学習済モデル及び前記学習用受聴者の耳介の形状を使用して前記第二尺度を算出し、前記第二尺度に基づいて、複数の前記統合周波数帯域のうち前記第二確率が最も大きな前記統合周波数帯域を前記第二統合周波数帯域と特定する、
請求項１３に記載の頭部伝達関数生成装置。
前記耳介形状取得部は、推論用受聴者の耳介の形状を示すデータを更に取得し、
複数の前記周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第一相関行列を使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、前記第三確率が最も大きな前記周波数帯域を前記第三周波数帯域と推定する第三処理を実行し、複数の前記周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第二相関行列を使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、前記第四確率が最も大きな前記周波数帯域を前記第四周波数帯域と推定する第四処理を実行する周波数帯域推定部を更に備える、
請求項３又は請求項４に記載の頭部伝達関数生成装置。
前記耳介形状取得部は、推論用受聴者の耳介の形状を示すデータを更に取得し、
複数の前記周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第一学習済モデルを使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、前記第三確率が最も大きな前記周波数帯域を前記第三周波数帯域と推定する第三処理を実行し、複数の前記周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第二学習済モデルを使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、前記第四確率が最も大きな前記周波数帯域を前記第四周波数帯域と推定する第四処理を実行する周波数帯域推定部を更に備える、
請求項５又は請求項６に記載の頭部伝達関数生成装置。
前記周波数帯域推定部は、前記第三周波数帯域と推定された前記周波数帯域と、前記第四周波数帯域と推定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上である場合、前記第三確率が二番目に大きな前記周波数帯域を前記第三周波数帯域と推定し直す第三修正処理及び前記第四確率が二番目に大きな前記周波数帯域を前記第四周波数帯域と推定し直す第四修正処理の少なくとも一方を更に実行する、
請求項１５又は請求項１６に記載の頭部伝達関数生成装置。
前記周波数帯域推定部は、前記第三周波数帯域と推定された前記周波数帯域と、前記第四周波数帯域と推定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、前記推論用受聴者の耳介の所定の寸法が第三閾値未満である場合、前記第三修正処理を実行する、
請求項１７に記載の頭部伝達関数生成装置。
前記周波数帯域推定部は、前記第三周波数帯域と推定された前記周波数帯域と、前記第四周波数帯域と推定された前記周波数帯域との間に存在する前記周波数帯域の数が所定の下限閾値以下又は所定の上限閾値以上であり、かつ、前記推論用受聴者の耳介の所定の寸法が第四閾値を超えている場合、前記第四修正処理を実行する、
請求項１７に記載の頭部伝達関数生成装置。
前記周波数帯域推定部が前記第三周波数帯域及び前記第四周波数帯域を推定した結果を使用して前記推論用受聴者の個人化頭部伝達関数を生成する個人化頭部伝達関数生成部を更に備える、
請求項１５から請求項１９のいずれか一つに記載の頭部伝達関数生成装置。
前記耳介形状取得部は、推論用受聴者の耳介の形状を示すデータを更に取得し、
複数の前記統合周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第一相関行列を使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、前記第三確率が最も大きな前記統合周波数帯域を前記第三統合周波数帯域と推定する第三処理を実行し、複数の前記統合周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第二相関行列を使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、前記第四確率が最も大きな前記統合周波数帯域を前記第四統合周波数帯域と推定する第四処理を実行する統合周波数帯域推定部を更に備える、
請求項１１又は請求項１２に記載の頭部伝達関数生成装置。
前記耳介形状取得部は、推論用受聴者の耳介の形状を示すデータを更に取得し、
複数の前記統合周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第一学習済モデルを使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が最も低い第一ノッチを含んでいる第三統合周波数帯域に該当している第三確率と相関を有する第三尺度を算出し、前記第三確率が最も大きな前記統合周波数帯域を前記第三統合周波数帯域と推定する第三処理を実行し、複数の前記統合周波数帯域ごとに、前記推論用受聴者の耳介の形状及び前記第二学習済モデルを使用して前記推論用受聴者の個人化頭部伝達関数に含まれるノッチのうち周波数が二番目に低い第二ノッチを含んでいる第四統合周波数帯域に該当している第四確率と相関を有する第四尺度を算出し、前記第四確率が最も大きな前記統合周波数帯域を前記第四統合周波数帯域と推定する第四処理を実行する統合周波数帯域推定部を更に備える、
請求項１３又は請求項１４に記載の頭部伝達関数生成装置。
コンピュータに、
学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する実測頭部インパルス応答取得機能と、
前記実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出し、前記初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する初期頭部伝達関数生成機能と、
前記初期頭部伝達関数を複数の周波数帯域に分割する周波数帯域分割機能と、
複数の前記周波数帯域ごとに前記初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理及び相対振幅を決定する処理を実行し、前記相対振幅を示す点の間を補間することにより前記学習用受聴者のモデル化頭部伝達関数を示すデータを生成するモデル化頭部伝達関数生成機能と、
を実現させる頭部伝達関数生成プログラム。
学習用受聴者の外耳道入口に到達した音波の実測頭部インパルス応答を示すデータを取得する実測頭部インパルス応答取得ステップと、
前記実測頭部インパルス応答に窓関数を掛けて初期頭部インパルス応答を算出し、前記初期頭部インパルス応答をフーリエ変換して初期頭部伝達関数を示すデータを生成する初期頭部伝達関数生成ステップと、
前記初期頭部伝達関数を複数の周波数帯域に分割する周波数帯域分割ステップと、
複数の前記周波数帯域ごとに前記初期頭部伝達関数の曲率に基づいてピーク又はノッチを抽出する処理及び相対振幅を決定する処理を実行し、前記相対振幅を示す点の間を補間することにより前記学習用受聴者のモデル化頭部伝達関数を示すデータを生成するモデル化頭部伝達関数生成ステップと、
を含む頭部伝達関数生成方法。