JP7153963B1 - 頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法 - Google Patents

頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法 Download PDF

Info

Publication number
JP7153963B1
JP7153963B1 JP2021130815A JP2021130815A JP7153963B1 JP 7153963 B1 JP7153963 B1 JP 7153963B1 JP 2021130815 A JP2021130815 A JP 2021130815A JP 2021130815 A JP2021130815 A JP 2021130815A JP 7153963 B1 JP7153963 B1 JP 7153963B1
Authority
JP
Japan
Prior art keywords
head
related transfer
transfer function
frequency
notch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021130815A
Other languages
English (en)
Other versions
JP2023025519A (ja
Inventor
一博 飯田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chiba Institute of Technology
Original Assignee
Chiba Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chiba Institute of Technology filed Critical Chiba Institute of Technology
Priority to JP2021130815A priority Critical patent/JP7153963B1/ja
Application granted granted Critical
Publication of JP7153963B1 publication Critical patent/JP7153963B1/ja
Publication of JP2023025519A publication Critical patent/JP2023025519A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】受聴者本人の頭部伝達関数を実際に測定すること無く、受聴者本人に適合する頭部伝達関数を得ること。【解決手段】頭部伝達関数生成装置は、所定の方向における実測頭部伝達関数から受聴者ごとに生成されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力する音声出力部と、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する周波数調整部と、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力するデータ出力部と、を備える。【選択図】図3

Description

本発明は、頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法に関する。
従来から三次元音響システム、音のバーチャルリアリティ(VR:Virtual Reality)等の実用化を目指した研究開発が進められている。これらの技術の実用化を実現する上では、受聴者ごとに頭部伝達関数を再現することが必要である。受聴者ごとに頭部伝達関数を再現する技術の一例として、特許文献1に開示されている頭部伝達関数選択装置が挙げられる。
この頭部伝達関数選択装置は、測定部と、特徴量抽出部と、特性選択部とを備える。測定部は、スピーカから測定信号としての所定の音声を発生させた状態で、ユーザの耳に装着したマイクロホンによって収音した音声信号に基づいて、ユーザの頭部インパルス応答を取得する。特徴量抽出部は、頭部インパルス応答に対応する周波数特性の特徴量を抽出する。特性選択部は、抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する。
特開2016-201723号公報
しかし、上述した頭部伝達関数選択装置は、データベースに記憶されている複数の頭部伝達関数のうちのいずれかが選択されるに過ぎない。このため、当該頭部伝達関数選択装置は、受聴者本人に適合する頭部伝達関数がデータベースに記憶されていない場合、当然のことながら、受聴者本人に適合する頭部伝達関数を選択することができない。
また、受聴者本人の頭部伝達関数を実際に測定しようとする場合、不要な反射音、周囲の騒音等の影響を排除する必要があるため、住宅、オフィス等ではなく、無響室で測定を実施する必要がある。ところが、無響室は、限られた研究機関にしか存在しない。さらに、音響の専門知識を十分に有しない一般のユーザは、受聴者本人の頭部伝達関数を十分な精度で測定することができない。
本発明は、上述した問題点に鑑み、受聴者本人の頭部伝達関数を実際に測定すること無く、受聴者本人に適合する頭部伝達関数を得ることができる頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法を提供することを目的とする。
本発明の一態様は、所定の方向における実測頭部伝達関数から受聴者ごとに生成されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、前記独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力する音声出力部と、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する周波数調整部と、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力するデータ出力部と、を備える頭部伝達関数生成装置である。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記周波数調整部が、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整するために使用される少なくとも一つのユーザインターフェースが操作された結果に基づいて、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、ノッチ及びピークのうちの一つの周波数が所定の範囲を超える範囲内で所定の分散を超える分散で散らばっている複数の前記実測頭部伝達関数に前記相関分析を適用することによりノッチ及びピークの少なくとも一つの周波数が推定された前記調整用頭部伝達関数が畳み込まれた前記音声を出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、ノッチの周波数及びピークの周波数のうちの少なくとも二つの間の相関係数が所定の相関係数を超えている複数の前記実測頭部伝達関数に前記相関分析を適用することによりノッチ及びピークの少なくとも一つの周波数が推定された前記調整用頭部伝達関数が畳み込まれた前記音声を出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、ノッチの周波数及びピークの周波数のうちの一つが高くなる程、残りのノッチの周波数及びピークの周波数が高くなり、ノッチの周波数及びピークの周波数のうちの一つが低くなる程、残りのノッチの周波数及びピークの周波数が低くなる相関関係を有する前記調整用頭部伝達関数が畳み込まれた前記音声を出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、ノッチのレベル、ピークのレベル、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一つが決定された前記調整用頭部伝達関数が畳み込まれた前記音声を出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、複数の前記実測頭部伝達関数の間で周波数が所定の範囲内で一致しているノッチ又はピークのレベルの統計量がノッチ又はピークのレベルとして採用されている前記調整用頭部伝達関数が畳み込まれた前記音声を出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、複数の前記実測頭部伝達関数の間で周波数が所定の範囲内で一致しているノッチ又はピークの尖鋭度の統計量がノッチ又はピークの尖鋭度として採用されている前記調整用頭部伝達関数が畳み込まれた前記音声を出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、前記パラメータ推定用頭部伝達関数のノッチ又はピークのレベルに所定のレベルを加算又は減算したレベルが当該ノッチ又は当該ピークの周波数と所定の範囲で一致している周波数のノッチのレベルとして採用されている前記調整用頭部伝達関数が畳み込まれた前記音声を出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一方が調整されることにより隣接するノッチとピークとの干渉の度合いが調整された前記パラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を前記独立変数とする前記相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された前記調整用頭部伝達関数が畳み込まれた前記音声を出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記所定の方向における前記個人化頭部伝達関数と、受聴者の両耳間時間差及び両耳間レベル差の少なくとも一方を示すデータとに基づいて、当該受聴者の水平面内の方向であり、前記所定の方向と異なる方向における個人化頭部伝達関数を生成する個人化頭部伝達関数生成部を更に備え、前記データ出力部が、前記個人化頭部伝達関数生成部により生成された前記所定の方向と異なる方向における個人化頭部伝達関数を示すデータを出力する。
本発明の一態様は、上述した頭部伝達関数生成装置であって、前記音声出力部が、前記パラメータ推定用頭部伝達関数に含まれるノッチの中で最も低い周波数を有する第一ノッチと、前記パラメータ推定用頭部伝達関数に含まれるノッチの中で二番目に低い周波数を有する第二ノッチと、前記第一ノッチよりも低い周波数を有する第一ピークと、前記第一ノッチよりも高く、第二ノッチよりも低い周波数を有する第二ピークとのうちの一つの周波数を前記独立変数とする前記相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された前記調整用頭部伝達関数が畳み込まれた音声を出力する。
本発明の一態様は、コンピュータに、所定の方向における実測頭部伝達関数から受聴者ごとに生成されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、前記独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力する音声出力機能と、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する周波数調整機能と、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力するデータ出力機能と、を実現させる頭部伝達関数生成プログラムである。
本発明の一態様は、所定の方向における実測頭部伝達関数から受聴者ごとに生成されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、前記独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力し、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整し、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力する、
頭部伝達関数生成方法である。
本発明によれば、受聴者本人の頭部伝達関数を実際に測定すること無く、受聴者本人に適合する頭部伝達関数を得ることができる頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法を提供することができる。
実施形態に係る受聴者と、受聴者を基準とした水平面、正中面、矢状面、耳軸、側方角及び上昇角を示す図である。 実施形態に係る頭部伝達関数生成装置を構成しているハードウェアの一例を示す図である。 実施形態に係る頭部伝達関数生成装置の機能的な構成の一例を示す図である。 実施形態に係る実測頭部伝達関数からパラメータ推定用頭部伝達関数を生成するために使用されるユーザインターフェースの一例を示す図である。 実施形態に係る複数の実測頭部伝達関数の第一ノッチの周波数、第二ノッチの周波数、第一ピークの周波数及び第二ピークの周波数の散らばり具合の一例を示す図である。 実施形態に係る実測頭部伝達関数の第一ノッチの周波数の実測値と、第二ノッチの周波数に基づいて推定された第一ノッチの周波数との相関関係の一例を示す図である。 実施形態に係る実測頭部伝達関数の第一ピークの周波数の実測値と、第二ノッチの周波数に基づいて推定された第一ピークの周波数との相関関係の一例を示す図である。 実施形態に係る実測頭部伝達関数の第二ピークの周波数の実測値と、第二ノッチの周波数に基づいて推定された第二ピークの周波数との相関関係の一例を示す図である。 実施形態に係る第一ノッチ、第一ピーク及び第二ピーク各々の周波数の実測値と、第二ノッチの周波数に基づいて推定された周波数との平均残差の一例を示す図である。 実施形態に係る実測頭部伝達関数と、パラメータ推定用頭部伝達関数と、パラメータ推定用頭部伝達関数のノッチ及びピークの少なくとも一方に所定のレベルを加算又は減算した調整用頭部伝達関数の一例を示す図である。 第一ノッチのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第二ノッチのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第一ピークのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第一ノッチのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の後方が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第二ノッチのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の後方が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第一ピークのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の後方が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第一ノッチのレベルとして受聴者の左耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第二ノッチのレベルとして受聴者の左耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第一ピークのレベルとして受聴者の左耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第一ノッチのレベルとして受聴者の左耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第二ノッチのレベルとして受聴者の左耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 第一ピークのレベルとして受聴者の左耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。 実施形態に係る三名の受聴者が共通して回答した音像の方向の上昇角が共通しているレベルの範囲の一例を示す図である。 実施形態に係る調整用頭部伝達関数の第二ノッチの周波数、第一ピークのレベル及び調整用頭部伝達関数が畳み込まれた音声の側方角を調整するために使用されるユーザインターフェースの一例を示す図である。 実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を確認するために使用される画面の一例を示す図である。 実施形態に係る頭部伝達関数生成装置が調整用頭部伝達関数を生成する処理の一例を示すフローチャートである。 実施形態に係る頭部伝達関数生成装置が個人化頭部伝達関数を生成し、個人化頭部伝達関数を示すデータを出力する処理の一例を示すフローチャートである。 実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を評価するために実施された音像定位実験の結果の一例を示す図である。 実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を評価するために実施された音像定位実験の結果の一例を示す図である。 実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を評価するために実施された音像定位実験の結果の一例を示す図である。 実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を評価するために実施された音像定位実験における前後誤判定率の一例を示す図である。 実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を評価するために実施された音像定位実験における平均仰角誤差の一例を示す図である。
まず、図1を参照しながら実施形態に係る頭部伝達関数生成装置を説明する上で使用する耳軸座標系について説明する。図1は、実施形態に係る受聴者と、受聴者を基準とした水平面、正中面、矢状面、耳軸、側方角及び上昇角を示す図である。
図1に示した耳軸座標系は、次のように定義される。耳軸Aは、受聴者Pの左右の外耳道入口を結ぶ直線である。原点は、受聴者Pの左右の外耳道入口を結んでおり、耳軸A上に位置する線分の中点である。水平面Hは、右眼窩点と左右の耳珠を結ぶ平面である。正中面Mは、水平面と直交し、受聴者Pを左右に二等分する面である。矢状面Sは、正中面Mと平行な任意の平面である。また、耳軸座標系は、音源が位置する方向を側方角α及び上昇角βにより表す。側方角αは、音源が位置する点と原点とを結ぶ直線が耳軸Aとなす角の余角である。また、側方角αは、水平面H内において受聴者Pの正面となる方向で0度となり、水平面H内において受聴者Pの公報となる方向で180度となる。上昇角βは、音源が位置する点を通る矢状面S内における仰角である。
次に図2を参照しながら実施形態に係る頭部伝達関数生成装置を構成しているハードウェアについて説明する。
図2は、実施形態に係る頭部伝達関数生成装置を構成しているハードウェアの一例を示す図である。図2に示すように、頭部伝達関数生成装置1は、プロセッサ11と、主記憶装置12と、通信インターフェース13と、補助記憶装置14と、入出力装置15と、バス16とを備える。
プロセッサ11は、例えば、CPU(Central Processing Unit)であり、頭部伝達関数生成プログラムを読み出して実行し、頭部伝達関数生成装置1が有する各機能を実現させる。また、プロセッサ11は、頭部伝達関数生成プログラム以外のプログラムを読み出して実行し、頭部伝達関数生成装置1が有する各機能を実現させる上で必要な機能を実現させてもよい。
主記憶装置12は、例えば、RAM(Random Access Memory)であり、プロセッサ11により読み出されて実行される意思決定支援プログラム、その他プログラムを予め記憶している。
通信インターフェース13は、ネットワークを介して他の機器と通信を実行するためのインターフェース回路である。ネットワークは、例えば、インターネット、イントラネット、WAN(Wide Area Network)、LAN(Local Area Network)である。
補助記憶装置14は、例えば、ハードディスクドライブ(HDD:Hard Disk Drive)、ソリッドステートドライブ(SSD:Solid State Drive)、フラッシュメモリ(Flash Memory)、ROM(Read Only Memory)である。
入出力装置15は、例えば、入出力ポート(Input/Output Port)である。入出力装置15は、例えば、図2に示したマウス151、キーボード152及びディスプレイ153が接続される。マウス151及びキーボード152は、例えば、頭部伝達関数生成装置1を操作するために必要なデータを入力する作業に使用される。ディスプレイ153は、例えば、液晶ディスプレイである。ディスプレイ153は、例えば、頭部伝達関数生成装置1のユーザにより使用されるグラフィカルユーザインターフェース(GUI:Graphical User Interface)を表示する。グラフィカルユーザインターフェースの詳細は、後述する。
バス16は、プロセッサ11、主記憶装置12、通信インターフェース13、補助記憶装置14及び入出力装置15を互いにデータの送受信が可能なように接続している。
次に、図3から図25を参照しながら実施形態に係る頭部伝達関数生成装置の機能的な構成について説明する。
図3は、実施形態に係る頭部伝達関数生成装置の機能的な構成の一例を示す図である。図3に示すように、頭部伝達関数生成装置1は、頭部伝達関数変換部101と、相関分析実行部102と、調整用頭部伝達関数生成部103と、音声出力部104と、周波数調整部105と、個人化頭部伝達関数生成部106と、データ出力部107とを備える。
頭部伝達関数変換部101は、所定の方向における実測頭部伝達関数を複数の受聴者から取得する。頭部伝達関数(HRTF:Head-Related Transfer Function)は、音源から受聴者の外耳道入口に到達する音波が受聴者の頭部及びその周辺の影響を受けることによる物理特性の変化を周波数領域で表現したものであり、ピーク及びノッチを含む。ピークは、頭部伝達関数のうち上に凸となっている部分を指す。ノッチは、頭部伝達関数のうち下に凸となっている部分を指す。また、実測頭部伝達関数は、実際に音波を測定することにより生成された頭部伝達関数である。また、上述した所定の方向は、例えば、各受聴者の正面である。
頭部伝達関数変換部101は、実測頭部伝達関数に基づいてパラメータ推定用頭部伝達関数を生成する。パラメータ推定用頭部伝達関数は、ノッチ又はピークのレベルと、ノッチ又はピークの尖鋭度とが抽出され、後述する相関分析で使用される独立変数として採用される周波数が抽出される頭部伝達関数である。例えば、頭部伝達関数変換部101は、二次の無限インパルス応答(IIR:Infinite Impulse Response)フィルタをピーキングフィルタとして一つの実測頭部伝達関数に適用することにより、一つのパラメータ推定用頭部伝達関数を生成する。
図4は、実施形態に係る実測頭部伝達関数からパラメータ推定用頭部伝達関数を生成するために使用されるユーザインターフェースの一例を示す図である。図4に示したユーザインターフェースは、例えば、図1に示したディスプレイ153に表示される。図4は、領域R41と、領域R42とを示している。
領域R41は、実測頭部伝達関数及びパラメータ推定用頭部伝達関数が表示される領域である。領域R41に表示されている実線は、実測頭部伝達関数を示している。領域R41に表示されている破線は、パラメータ推定用頭部伝達関数を示している。領域R42は、一つの実測頭部伝達関数を一つのパラメータ推定用頭部伝達関数に変換するピーキングフィルタの各パラメータを調整するために操作されるグラフィカルユーザインターフェースが表示される領域である。領域R42に表示されているグラフィカルユーザインターフェースが操作されると、領域R41に破線で示されているパラメータ推定用頭部伝達関数が逐一変化する。
図5は、実施形態に係る複数の実測頭部伝達関数の第一ノッチの周波数、第二ノッチの周波数、第一ピークの周波数及び第二ピークの周波数の散らばり具合の一例を示す図である。図5は、二十個の耳の実測頭部伝達関数の第一ノッチの周波数、第二ノッチの周波数の周波数、第一ピークの周波数及び第二ピークの周波数の分布を表している。
第一ノッチは、頭部伝達関数に含まれるノッチの中で最も低い周波数を有するノッチである。第二ノッチは、頭部伝達関数に含まれるノッチの中で二番目に低い周波数を有するノッチである。第一ピークは、第一ノッチよりも低い周波数を有するピークである。第二ピークは、第一ノッチよりも高く、第二ノッチよりも低い周波数を有するピークである。
二十個の耳の第一ノッチの周波数は、図5に黒色の丸で示すように、6000Hzから9094Hzの範囲に比較的均等に分布している。この範囲は、0.60オクターブに相当する。二十個の耳の第二ノッチの周波数は、図5に白色の丸で示すように、9094Hzから11906Hzの範囲に比較的均等に分布している。この範囲は、0.39オクターブに相当する。
二十個の耳の第一ピークの周波数は、図5に黒色の三角で示すように、3469Hzから5625Hzの範囲に比較的均等に分布している。この範囲は、0.70オクターブに相当する。二十個の耳の第二ピークの周波数は、図5に白色の三角で示すように、7875Hzから10594Hzの範囲に比較的均等に分布している。この範囲は、0.43オクターブに相当する。
相関分析実行部102は、パラメータ推定用頭部伝達関数からノッチ及びピークの周波数、レベル及び尖鋭度を抽出する。レベルは、相対強度と呼ばれることもある。尖鋭度は、ノッチ又はピークの鋭さを示す値である。
そして、相関分析実行部102は、パラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析を実行する。これにより、相関分析実行部102は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを推定する。
例えば、相関分析実行部102は、パラメータ推定用頭部伝達関数の第二ノッチの周波数を独立変数とし、パラメータ推定用頭部伝達関数の第一ノッチの周波数、第一ピークの周波数又は第二ピークの周波数を従属変数とする相関分析を実行する。
図6は、実施形態に係る実測頭部伝達関数の第一ノッチの周波数の実測値と、第二ノッチの周波数に基づいて推定された第一ノッチの周波数との相関関係の一例を示す図である。図6の横軸は、第一ノッチの周波数の実測値を表している。図6の縦軸は、第二ノッチの周波数に基づいて推定された第一ノッチの周波数を表している。図6の右下に示すように、実測頭部伝達関数の第一ノッチの周波数の実測値と、相関分析により推定された第一ノッチの周波数との相関係数は、「r=0.80」と比較的良好な値となっている。
図7は、実施形態に係る実測頭部伝達関数の第一ピークの周波数の実測値と、第二ノッチの周波数に基づいて推定された第一ピークの周波数との相関関係の一例を示す図である。図7の横軸は、第一ピークの周波数の実測値を表している。図7の縦軸は、第二ノッチの周波数に基づいて推定された第一ピークの周波数を表している。図6の右下に示すように、実測頭部伝達関数の第一ピークの周波数の実測値と、相関分析により推定された第一ピークの周波数との相関係数は、「r=0.53」と比較的良好な値となっている。
図8は、実施形態に係る実測頭部伝達関数の第二ピークの周波数の実測値と、第二ノッチの周波数に基づいて推定された第二ピークの周波数との相関関係の一例を示す図である。図8の横軸は、第二ピークの周波数の実測値を表している。図8の縦軸は、第二ノッチの周波数に基づいて推定された第二ピークの周波数を表している。図8の右下に示すように、実測頭部伝達関数の第二ピークの周波数の実測値と、相関分析により推定された第二ピークの周波数との相関係数は、「r=0.74」と比較的良好な値となっている。
図9は、実施形態に係る第一ノッチ、第一ピーク及び第二ピーク各々の周波数の実測値と、第二ノッチの周波数に基づいて推定された周波数との平均残差の一例を示す図である。図9の左から一列目に示すように、第一ノッチの平均残差は、0.09オクターブである。図9の左から二列目に示すように、第一ノッチの平均残差は、0.13オクターブである。図9の左から三列目に示すように、第一ノッチの平均残差は、0.07オクターブである。
第一ノッチの周波数の丁度可知差異(Just Noticeable Difference)は、低域側及び高域側のいずれにおいても0.1オクターブから0.2オクターブ程度であることが報告されている。また、第一ピークの周波数の丁度可知差異は、低域側が0.35であり、高域側が0.47であることが報告されている。図9に示した平均残差は、いずれもこれらの丁度可知差異の範囲内に収まっている。したがって、相関分析実行部102は、上述した相関分析によりノッチ及びピークの少なくとも一つの周波数を比較的良い精度で推定することができる。
なお、相関分析実行部102は、パラメータ推定用頭部伝達関数の第一ノッチの周波数、第一ピークの周波数又は第二ピークの周波数を独立変数とする相関分析を実行してもよい。
調整用頭部伝達関数生成部103は、調整用頭部伝達関数のノッチのレベル、ピークのレベル、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一つを決定する。
例えば、調整用頭部伝達関数生成部103は、複数の実測頭部伝達関数の間で周波数が所定の範囲内で一致しているノッチ又はピークのレベルの統計量を調整用頭部伝達関数のノッチ又はピークのレベルとして採用する。また、例えば、調整用頭部伝達関数生成部103は、複数の実測頭部伝達関数の間で周波数が所定の範囲内で一致しているノッチ又はピークの尖鋭度の統計量を調整用頭部伝達関数のノッチ又はピークの尖鋭度として採用する。なお、これら二つの統計量は、例えば、平均である。
或いは、調整用頭部伝達関数生成部103は、パラメータ推定用頭部伝達関数のノッチ又はピークのレベルに所定のレベルを加算又は減算したレベルを調整用頭部伝達関数のノッチ又はピークのレベルとして採用する。
図10は、実施形態に係る実測頭部伝達関数と、パラメータ推定用頭部伝達関数と、パラメータ推定用頭部伝達関数のノッチ及びピークの少なくとも一方に所定のレベルを加算又は減算した調整用頭部伝達関数の一例を示す図である。
図10の上から一段目に太い実線で示したグラフは、実測頭部伝達関数の一例を示している。図10の「mHRTF」は、実測頭部伝達関数を意味している。図10の上から一段目に細い実線で示したグラフは、パラメータ推定用頭部伝達関数の一例を示している。図10の「pHRTF(All)」は、パラメータ推定用頭部伝達関数を意味している。当該パラメータ推定用頭部伝達関数は、ノッチ及びピークの周波数、レベル及び尖鋭度として実測値が採用されている。
また、当該パラメータ推定用頭部伝達関数は、ノッチのレベル又はピークのレベルに所定のレベルが加算又は減算される際に、隣接するピーク又はノッチへの影響を抑える目的で尖鋭度も同時に調整されている。さらに、当該パラメータ推定用頭部伝達関数は、ノッチのレベル又はピークのレベルに所定のレベルが加算又は減算される際に、左耳又は右耳のノッチ又はピークが消滅する場合、ノッチ又はピークが消滅するまで所定のレベルを加算又は減算されている。
図10の上から二段目に破線で示したグラフは、パラメータ推定用頭部伝達関数の第一ノッチのレベルに所定のレベルを加算又は減算したパラメータ推定用頭部伝達関数の一例を示している。図10の「N1」は、第一ノッチを意味している。
図10の上から三段目に一点鎖線で示したグラフは、パラメータ推定用頭部伝達関数の第二ノッチのレベルに所定のレベルを加算又は減算したパラメータ推定用頭部伝達関数の一例を示している。図10の「N2」は、第二ノッチを意味している。
図10の上から四段目に二点鎖線で示したグラフは、パラメータ推定用頭部伝達関数の第一ピークのレベルに所定のレベルを加算又は減算したパラメータ推定用頭部伝達関数の一例を示している。図10の「P1」は、第一ピークを意味している。
また、図10の上から二段目、上から三段目又は上から四段目に示した頭部伝達関数で加算又は減算されている所定のレベルは、5、10、15及び20である。さらに、図10に示したパラメータ推定用頭部伝達関数の頭部インパルス応答(HRIR:Head-Related Impulse Response)は、当該パラメータ推定用頭部伝達関数と、最小位相系とに基づいた逆フーリエ変換により生成されている。頭部インパルス応答は、音源から受聴者の外耳道入口に到達する音波が受聴者の頭部及びその周辺の影響を受けることによる物理特性の変化を時間領域で表現したものである。
図11、図12及び図13は、図10に示したパラメータ推定用頭部伝達関数を畳み込んだ音声を使用した音像定位実験の結果の一例を示す図である。この音像定位実験では、受聴者の外耳道入口を解放した状態での鼓膜における音圧を再現するために補正フィルタが使用されている。また、この音像定位実験で使用された音声は、200Hzから17kHzの範囲の広帯域ホワイトノイズであり、立ち上がりの0.1秒及び立ち下がりの0.1秒を含めた受聴者への提示時間が1.2秒である。さらに、当該音声の音圧は、63dB SPLである。
また、この音像定位実験の受聴者は、正常な聴力を有する二十代の男女三名である。三名の受聴者は、マッピング法により音像の方向を回答した。具体的には、三名の受聴者は、ディスプレイに表示され、正中面を示す円周と、前後上下を示す矢印を参照しながら知覚した上昇角を当該円周上にマウスでクリックすることにより知覚した音像の方向を回答した。この音像定位実験では、各受聴者は、音声の提示を十回受けている。
図11は、第一ノッチのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図11に示すように、三名の受聴者は、図10の上から一段目に示した実測頭部伝達関数又はパラメータ推定用頭部伝達関数が畳み込まれている音声が提示された場合、概ね正しい音像の方向を回答している。
ただし、図11に示すように、受聴者Aは、図10の上から二段目に示した調整用頭部伝達関数が畳み込まれている音声が提示された場合、十回のうち一回だけ前後を誤って回答している。また、受聴者Aは、図10の上から二段目に示した調整用頭部伝達関数が畳み込まれている音声が提示された場合、十回のうち二回だけ前後を誤って回答している。
また、図11に示すように、三名の受聴者は、第一ノッチのレベルから所定のレベルを減算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、概ね正しい音像の方向を回答している。一方、図11に示すように、受聴者A及び受聴者Bは、第一ノッチのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、前後を誤って回答したり、正しい音像の方向よりも上昇角が大きな方向を回答したりしている。ただし、受聴者Cは、第一ノッチのレベルから所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向を回答している。
図12は、第二ノッチのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図12に示すように、三名の受聴者は、第二ノッチのレベルから所定のレベルを減算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、概ね正しい音像の方向を回答している。一方、図12に示すように、受聴者Aは、第二ノッチのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、前後を誤って判定している。ただし、受聴者B及び受聴者Cは、第二ノッチのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向を回答している。
図13は、第一ピークのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図13に示すように、受聴者Aは、第一ピークのレベルから所定のレベルを減算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、前後を誤って回答している。また、図13に示すように、受聴者B及び受聴者Cは、第一ピークのレベルから所定のレベルを減算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向を回答している。
一方、図13に示すように、受聴者Aは、第一ピークのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、前後を誤って回答する頻度が増加している。また、受聴者Bは、第一ピークのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向よりも上昇角が大きな方向を回答している。また、受聴者Cは、第一ピークのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向を回答している。
図14は、第一ノッチのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の後方が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図14に示すように、三名の受聴者は、図10の上から一段目に示した実測頭部伝達関数又はパラメータ推定用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向を回答している。
また、図14に示すように、三名の受聴者は、第一ノッチのレベルから所定のレベルを減算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、概ね正しい音像の方向を回答している。一方、図14に示すように、受聴者Bは、第一ノッチのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、前後を誤って回答した。ただし、受聴者A及び受聴者Cは、第一ノッチのレベルから所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、概ね正しい音像の方向を回答している。
図15は、第二ノッチのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の後方が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図15に示すように、三名の受聴者は、第二ノッチのレベルから所定のレベルを減算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、概ね正しい音像の方向を回答している。一方、図15に示すように、受聴者Bは、第二ノッチのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、前後を誤って判定している。ただし、受聴者A及び受聴者Cは、第二ノッチのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向を回答している。
図16は、第一ピークのレベルに所定のレベルを加算又は減算した調整用頭部伝達関数が畳み込まれており、受聴者の後方が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図16に示すように、受聴者Aは、第一ピークのレベルから所定のレベルを減算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向を回答している。一方、図13に示すように、受聴者Aは、第一ピークのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向よりも上昇角が大きな方向を回答している。また、受聴者Bは、第一ピークのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、前後を誤って回答したり、正しい音像の方向よりも上昇角が大きな方向を回答したりしている。また、受聴者Cは、第一ピークのレベルに所定のレベルを加算した調整用頭部伝達関数が畳み込まれている音声が提示された場合、正しい音像の方向を回答している。
図11から図16に示した三名の受聴者の回答を総括すると、第一ノッチ、第二ノッチ及び第一ピークについて次のことがいえる。
受聴者A、受聴者B及び受聴者Cは、目標の方向が正面及び後方のいずれであっても、第一ノッチのレベルから所定のレベルが減算されている場合、正しい音像の方向を回答している。同様に、受聴者A、受聴者B及び受聴者Cは、目標の方向が正面及び後方のいずれであっても、第二ノッチのレベルから所定のレベルが減算されている場合、正しい音像の方向を回答している。
受聴者A、受聴者B及び受聴者Cは、目標の方向が正面であり、第一ピークのレベルに5dBが加算されている場合、正しい音像の方向を回答している。また、受聴者A、受聴者B及び受聴者Cは、目標の方向が正面であり、第一ピークのレベルに5dBから減算されている場合、正しい音像の方向を回答している。一方、受聴者A、受聴者B及び受聴者Cは、目標の方向が後方であり、第一ピークのレベルにから所定のレベルが減算されている場合、正しい音像の方向を回答している。
次に、図17から図23を参照しながら、受聴者のノッチのレベルの絶対値及びピークのレベルの絶対値に着目した音像定位実験の結果の一例について説明する。
図17は、第一ノッチのレベルとして受聴者の左耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図17の横軸は、左耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均を示している。図17の縦軸は、受聴者が回答した音像の方向の上昇角を示している。図17にドットハッチングで示された領域は、受聴者A、受聴者B及び受聴者Cが共通して正しい音像の方向を回答した耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均の範囲を示している。図17に示すように、受聴者A、受聴者B及び受聴者Cは、左耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均が-15dB以下の範囲で共通して正しい音像の方向を回答している。
図18は、第二ノッチのレベルとして受聴者の左耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図18の横軸は、左耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均を示している。図18の縦軸は、受聴者が回答した音像の方向の上昇角を示している。図18にドットハッチングで示された領域は、受聴者A、受聴者B及び受聴者Cが共通して正しい音像の方向を回答した耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均の範囲を示している。図18に示すように、受聴者A、受聴者B及び受聴者Cは、左耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均が-15dB以下の範囲で共通して正しい音像の方向を回答している。
図19は、第一ピークのレベルとして受聴者の左耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図19の横軸は、左耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均を示している。図19の縦軸は、受聴者が回答した音像の方向の上昇角を示している。図19にドットハッチングで示された領域は、受聴者A、受聴者B及び受聴者Cが共通して正しい音像の方向を回答した耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均の範囲を示している。図19に示すように、受聴者A、受聴者B及び受聴者Cは、左耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均が10dBから15dBの範囲で共通して正しい音像の方向を回答している。
図20は、第一ノッチのレベルとして受聴者の左耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図20の横軸は、左耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均を示している。図20の縦軸は、受聴者が回答した音像の方向の上昇角を示している。図20にドットハッチングで示された領域は、受聴者A、受聴者B及び受聴者Cが共通して正しい音像の方向を回答した耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均の範囲を示している。図20に示すように、受聴者A、受聴者B及び受聴者Cは、左耳の第一ノッチのレベルと右耳の第一ノッチのレベルとの平均が-25dB以下の範囲で共通して正しい音像の方向を回答している。
図21は、第二ノッチのレベルとして受聴者の左耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図21の横軸は、左耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均を示している。図21の縦軸は、受聴者が回答した音像の方向の上昇角を示している。図21にドットハッチングで示された領域は、受聴者A、受聴者B及び受聴者Cが共通して正しい音像の方向を回答した耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均の範囲を示している。図21に示すように、受聴者A、受聴者B及び受聴者Cは、左耳の第二ノッチのレベルと右耳の第二ノッチのレベルとの平均が-15dB以下の範囲で共通して正しい音像の方向を回答している。
図22は、第一ピークのレベルとして受聴者の左耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均が採用されている調整用頭部伝達関数が音声に畳み込まれており、受聴者の正面が目標の方向となっている音声が使用された音像定位実験において受聴者が回答した音像の方向の上昇角の一例を示す図である。
図22の横軸は、左耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均を示している。図22の縦軸は、受聴者が回答した音像の方向の上昇角を示している。図22にドットハッチングで示された領域は、受聴者A、受聴者B及び受聴者Cが共通して正しい音像の方向を回答した耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均の範囲を示している。図22に示すように、受聴者A、受聴者B及び受聴者Cは、左耳の第一ピークのレベルと右耳の第一ピークのレベルとの平均が0dBから10dBの範囲で共通して正しい音像の方向を回答している。
図23は、実施形態に係る三名の受聴者が共通して回答した音像の方向の上昇角が共通しているレベルの範囲の一例を示す図である。図17から図22にドットハッチングで示した領域の範囲を総括すると、図23に示した通りとなる。
調整用頭部伝達関数生成部103は、ノッチ及びピークの少なくとも一つの周波数が推定され、ノッチ及びピークの少なくとも一つのレベル及び尖鋭度が決定された調整用頭部伝達関数を生成する。例えば、調整用頭部伝達関数生成部103は、第一ノッチの周波数、第一ピークの周波数及び第二ピークの周波数が第二ノッチの周波数に基づいて推定され、第一ノッチ、第二ノッチ、第一ピーク及び第二ピークのレベル及び尖鋭度が決定された調整用頭部伝達関数を生成する。
音声出力部104は、調整用頭部伝達関数が畳み込まれた音声を生成する。そして、音声出力部104は、調整用頭部伝達関数が畳み込まれた音声を出力する。この音声は、例えば、受聴者に装着されたヘッドホンから出力される。
周波数調整部105は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整するために使用されるユーザインターフェースの操作が完了したか否かを判定する。
図24は、実施形態に係る調整用頭部伝達関数の第二ノッチの周波数、第一ピークのレベル及び調整用頭部伝達関数が畳み込まれた音声の側方角を調整するために使用されるユーザインターフェースの一例を示す図である。図24は、領域R240と、ユーザインターフェースU241と、ユーザインターフェースU242と、ユーザインターフェースU243と、タブTとを備える。
領域R240は、ユーザインターフェースU241、ユーザインターフェースU242及びユーザインターフェースU243の少なくとも一つが操作されることにより生成される個人化頭部伝達関数が表示される領域である。
ユーザインターフェースU241は、第一ピークのレベルを調整するために使用され、第一ピークのレベルの目盛り上に配置されているスライダと、当該スライダの下に配置されている三つのボタンとを有する。
左から一番目のボタンは、当該スライダをメモリ上の所定の位置に戻すために押下されるボタンである。右から一番目のボタンは、第一ピークのレベルを1dB増加させるために押下されるボタンである。右から二番目のボタンは、第一ピークのレベルを1dB減少させるために押下されるボタンである。左から一番目のボタンと右から二番目のボタンとの間には、スライダにより示されている第一ピークのレベルを示す領域が設けられている。この領域は、図24では、「15.0」を示している。また、ユーザインターフェースU241は、調整用頭部伝達関数が畳み込まれている音声を聴いているユーザにより操作されなくてもよい。
ユーザインターフェースU242は、調整用頭部伝達関数が畳み込まれている音声の音像の方向の側方角を調整するために使用され、側方角の目盛り上に配置されているスライダと、当該スライダの下に配置されている四つのボタンとを有する。
左から一番目のボタンは、当該スライダをメモリ上の所定の位置に戻すために押下されるボタンである。左から二番目のボタンは、調整用頭部伝達関数が畳み込まれている音声の音像に後述する両耳間時間差(ITD:Interaural Time Difference)及び両耳間レベル差(ILD:Interaural Level Difference)の少なくとも一方を付加するために押下されるボタンである。当該ボタンが押下されると、音像は、水平面H内で受聴者の正面を経由して左真横から右真横まで移動する。
左から三番目のボタンは、側方角を10度減少させるために押下されるボタンである。左から四番目のボタンは、側方角を10度増加させるために押下されるボタンである。また、ユーザインターフェースU242は、調整用頭部伝達関数が畳み込まれている音声を聴いているユーザにより操作されなくてもよい。
ユーザインターフェースU243は、調整用頭部伝達関数の第二ノッチの周波数を調整するために使用され、第二ノッチの目盛り上に配置されるスライダと、当該スライダの下に配置されている六つのボタンとを有する。また、ユーザインターフェースU243は、調整用頭部伝達関数が畳み込まれている音声を聴いているユーザにより必ず操作される。
左から一番目のボタンは、第二ノッチの周波数を500Hz減少させるために押下されるボタンである。左から二番目のボタンは、第二ノッチの周波数を100Hz減少させるために押下されるボタンである。左から三番目のボタンは、第二ノッチの周波数を10Hz減少させるために押下されるボタンである。
右から一番目のボタンは、第二ノッチの周波数を500Hz増加させるために押下されるボタンである。右から二番目のボタンは、第二ノッチの周波数を100Hz増加させるために押下されるボタンである。右から三番目のボタンは、第二ノッチの周波数を10Hz増加させるために押下されるボタンである。
左から三番目のボタンと右から三番目のボタンとの間には、スライダにより示されている第二ノッチの周波数を示す領域が設けられている。この領域は、図24では、「9000.0」を示している。
タブTは、上述した所定の方向が正面である場合に選択されるタブ、上述した所定の方向が後方である場合に選択されるタブ等を含む。これらのタブは、いずれも当該所定の方向において使用されるユーザインターフェースを含んでいる。
なお、図24に示したユーザインターフェースは、第二ノッチの周波数を調整するために使用されるスライダ、ボタン等だけではなく、第一ノッチの周波数を調整するために使用されるスライダ、ボタン等を有していてもよい。同様に、図24に示したユーザインターフェースは、第二ノッチの周波数を調整するために使用されるスライダ、ボタン等だけではなく、第一ピークの周波数を調整するために使用されるスライダ、ボタン等を有していてもよい。また、図24に示したユーザインターフェースは、第二ノッチの周波数を調整するために使用されるスライダ、ボタン等だけではなく、第二ピークの周波数を調整するために使用されるスライダ、ボタン等を有していてもよい。
また、音声出力部104は、ノッチ及びピークのうちの一つの周波数が所定の範囲を超える範囲内で所定の分散を超える分散で散らばっている複数の実測頭部伝達関数に相関分析を適用することによりノッチ及びピークの少なくとも一つの周波数が推定された調整用頭部伝達関数が畳み込まれた音声を出力することが好ましい。
また、音声出力部104は、ノッチの周波数及びピークの周波数のうちの少なくとも二つの間の相関係数が所定の相関係数を超えている複数の実測頭部伝達関数に相関分析を適用することによりノッチ及びピークの少なくとも一つの周波数が推定された調整用頭部伝達関数が畳み込まれた音声を出力することが好ましい。
また、音声出力部104は、ノッチの周波数及びピークの周波数のうちの一つが高くなる程、残りのノッチの周波数及びピークの周波数が高くなり、ノッチの周波数及びピークの周波数のうちの一つが低くなる程、残りのノッチの周波数及びピークの周波数が低くなる相関関係を有する調整用頭部伝達関数が畳み込まれた音声を出力することが好ましい。
また、音声出力部104は、パラメータ推定用頭部伝達関数のノッチ又はピークのレベルに所定のレベルを加算又は減算したレベルが当該ノッチ又は当該ピークの周波数と所定の範囲で一致している周波数のノッチのレベルとして採用されている調整用頭部伝達関数が畳み込まれた音声を出力してもよい。
また、音声出力部104は、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一方が調整されることにより隣接するノッチとピークとの干渉の度合いが調整されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とする相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力してもよい。
周波数調整部105は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する。具体的には、周波数調整部105は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整するために使用される少なくとも一つのユーザインターフェースが操作された結果に基づいて、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する。
また、周波数調整部105は、出来る限り少ない数のノッチの周波数及びピークの周波数の少なくとも一つを出来る限り少ない数のユーザインターフェースが操作された結果に基づいて、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整することが好ましい。特に、周波数調整部105は、ノッチの周波数及びピークの周波数のうちの一つを調整するための一つのユーザインターフェースが操作された結果に基づいて、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整することが更に好ましい。
個人化頭部伝達関数生成部106は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数を個人化頭部伝達関数とする。
また、個人化頭部伝達関数生成部106は、所定の方向における個人化頭部伝達関数と、受聴者の両耳間時間差及び両耳間レベル差の少なくとも一方を示すデータとに基づいて、当該受聴者の水平面内の方向であり、所定の方向と異なる方向における個人化頭部伝達関数を生成してもよい。なお、個人化頭部伝達関数生成部106は、両耳間時間差に基づいて個人化頭部伝達関数を生成する場合、方位角φ、両耳間距離D及び音速cを含む次の式(1)を使用してもよい。
Figure 0007153963000002
図25は、実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を確認するために使用される画面の一例を示す図である。個人化頭部伝達関数生成部106は、図25に示した画面をディスプレイ153に表示させ、所定の方向における個人化頭部伝達関数及び所定の方向と異なる方向における個人化頭部伝達関数をユーザに確認させてもよい。
データ出力部107は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力する。また、データ出力部107は、個人化頭部伝達関数生成部106により生成された所定の方向と異なる方向における個人化頭部伝達関数を示すデータを出力する。これらのデータは、例えば、図1に示したディスプレイ153に個人化頭部伝達関数を表示するためのデータである。
次に、図26を参照しながら実施形態に係る頭部伝達関数生成装置が調整用頭部伝達関数を生成する処理の一例について説明する。図26は、実施形態に係る頭部伝達関数生成装置が調整用頭部伝達関数を生成する処理の一例を示すフローチャートである。
ステップS101において、頭部伝達関数変換部101は、所定の方向における実測頭部伝達関数を複数の受聴者から取得する。
ステップS102において、頭部伝達関数変換部101は、実測頭部伝達関数に基づいてパラメータ推定用頭部伝達関数を生成する。
ステップS103において、相関分析実行部102は、パラメータ推定用頭部伝達関数からノッチ及びピークの周波数、レベル及び尖鋭度を抽出する。
ステップS104において、相関分析実行部102は、パラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、当該独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析を実行する。
ステップS105において、調整用頭部伝達関数生成部103は、ノッチ及びピークの少なくとも一つについて、ステップS103で抽出されたレベルの統計量及び尖鋭度の統計量を算出する。
ステップS106において、調整用頭部伝達関数生成部103は、ノッチ及びピークの少なくとも一つの周波数が推定され、ノッチ及びピークの少なくとも一つのレベル及び尖鋭度が決定された調整用頭部伝達関数を生成する。
次に、図27を参照しながら実施形態に係る頭部伝達関数生成装置が個人化頭部伝達関数を生成し、個人化頭部伝達関数を示すデータを出力する処理の一例について説明する。図27は、実施形態に係る頭部伝達関数生成装置が個人化頭部伝達関数を生成し、個人化頭部伝達関数を示すデータを出力する処理の一例を示すフローチャートである。
ステップS201において、音声出力部104は、調整用頭部伝達関数が畳み込まれた音声を生成する。
ステップS202において、音声出力部104は、調整用頭部伝達関数が畳み込まれた音声を出力する。
ステップS203において、周波数調整部105は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整するために使用されるユーザインターフェースの操作が完了したか否かを判定する。周波数調整部105は、当該ユーザインターフェースの操作が完了したと判定した場合(ステップS203:YES)、処理をステップS204に進める。一方、周波数調整部105は、当該ユーザインターフェースの操作が完了していないと判定した場合(ステップS203:NO)、当該ユーザインターフェースの操作が完了したと判定するまで待機する。
ステップS204において、個人化頭部伝達関数生成部106は、ノッチの周波数及びピークの周波数の少なくとも一つがユーザインターフェースにより調整された調整用頭部伝達関数を個人化頭部伝達関数とする。
ステップS205において、データ出力部107は、個人化頭部伝達関数を示すデータを出力する。
以上、実施形態に係る頭部伝達関数生成装置1について説明した。頭部伝達関数生成装置1は、音声出力部104と、周波数調整部105と、データ出力部107とを備える。音声出力部104は、上述した相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力する。周波数調整部105は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する。データ出力部107は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力する。
特に、頭部伝達関数生成装置1は、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整するために使用される少なくとも一つのユーザインターフェースが操作された結果に基づいて、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する。
したがって、頭部伝達関数生成装置1は、受聴者本人の頭部伝達関数を実際に測定すること無く、受聴者本人に適合する頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1は、出来る限り少ない数のノッチの周波数及びピークの周波数の少なくとも一つを出来る限り少ない数のユーザインターフェースが操作された結果に基づいて、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整することが好ましい。特に、頭部伝達関数生成装置1は、ノッチの周波数及びピークの周波数のうちの一つを調整するための一つのユーザインターフェースが操作された結果に基づいて、調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整することが更に好ましい。
これにより、頭部伝達関数生成装置1は、調整用頭部伝達関数のノッチの周波数、ピークの周波数等を調整することに不慣れなユーザであっても、これらの少なくとも一つを容易に調整することを可能にし、受聴者本人に適合する頭部伝達関数を更に容易に得ることができる。
また、頭部伝達関数生成装置1は、ノッチ及びピークのうちの一つの周波数が所定の範囲を超える範囲内で所定の分散を超える分散で散らばっている複数の実測頭部伝達関数に相関分析を適用することによりノッチ及びピークの少なくとも一つの周波数が推定された調整用頭部伝達関数が畳み込まれた音声を出力する。
これにより、頭部伝達関数生成装置1は、受聴者本人に適合し、更に精度が高い頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1は、ノッチの周波数及びピークの周波数のうちの少なくとも二つの間の相関係数が所定の相関係数を超えている複数の実測頭部伝達関数に相関分析を適用することによりノッチ及びピークの少なくとも一つの周波数が推定された調整用頭部伝達関数が畳み込まれた音声を出力する。
これにより、頭部伝達関数生成装置1は、受聴者本人に適合し、更に精度が高い頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1は、ノッチの周波数及びピークの周波数のうちの一つが高くなる程、残りのノッチの周波数及びピークの周波数が高くなり、ノッチの周波数及びピークの周波数のうちの一つが低くなる程、残りのノッチの周波数及びピークの周波数が低くなる相関関係を有する調整用頭部伝達関数が畳み込まれた音声を出力する。
これにより、頭部伝達関数生成装置1は、受聴者本人に適合し、更に精度が高い頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1は、ノッチのレベル、ピークのレベル、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一つが決定された調整用頭部伝達関数が畳み込まれた音声を出力する。
具体的には、頭部伝達関数生成装置1は、複数の実測頭部伝達関数の間で周波数が所定の範囲内で一致しているノッチ又はピークのレベルの統計量がノッチ又はピークのレベルとして採用されている調整用頭部伝達関数が畳み込まれた音声を出力する。
具体的には、頭部伝達関数生成装置1は、複数の実測頭部伝達関数の間で周波数が所定の範囲内で一致しているノッチ又はピークの尖鋭度の統計量がノッチ又はピークの尖鋭度として採用されている調整用頭部伝達関数が畳み込まれた音声を出力する。
或いは、頭部伝達関数生成装置1は、パラメータ推定用頭部伝達関数のノッチ又はピークのレベルに所定のレベルを加算又は減算したレベルが当該ノッチ又は当該ピークの周波数と所定の範囲で一致している周波数のノッチのレベルとして採用されている調整用頭部伝達関数が畳み込まれた音声を出力する。
したがって、頭部伝達関数生成装置1は、ノッチのレベル、ピークのレベル、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一つの具体的な値を解析的に決定することが困難な場合であっても、受聴者本人に適合する頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1は、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一方が調整されることにより隣接するノッチとピークとの干渉の度合いが調整されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とする相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力する。
これにより、頭部伝達関数生成装置1は、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一方が調整されることにより隣接するノッチとピークとが干渉する場合であっても、当該干渉の度合いを調整し、受聴者本人に適合する頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1は、所定の方向における個人化頭部伝達関数と、受聴者の両耳間時間差及び両耳間レベル差の少なくとも一方を示すデータとに基づいて、当該受聴者の水平面内の方向であり、所定の方向と異なる方向における個人化頭部伝達関数を生成する。そして、頭部伝達関数生成装置1は、個人化頭部伝達関数生成部106により生成された所定の方向と異なる方向における個人化頭部伝達関数を示すデータを出力する。
これにより、頭部伝達関数生成装置1は、所定の方向と異なる方向についても、受聴者本人に適合する頭部伝達関数を得ることができる。
また、頭部伝達関数生成装置1は、パラメータ推定用頭部伝達関数に含まれるノッチの中で最も低い周波数を有する第一ノッチと、パラメータ推定用頭部伝達関数に含まれるノッチの中で二番目に低い周波数を有する第二ノッチと、第一ノッチよりも低い周波数を有する第一ピークと、第一ノッチよりも高く、第二ノッチよりも低い周波数を有する第二ピークとのうちの一つの周波数を独立変数とする相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力する。
これにより、頭部伝達関数生成装置1は、受聴者が音像を定位する上で特に重要な第一ノッチ、第二ノッチ、第一ピーク及び第二ピークの少なくとも一つが推定された頭部伝達関数を得ることができる。
次に、図28から図32を参照しながら、頭部伝達関数生成装置1により生成された個人化頭部伝達関数を評価するために実施された音像定位実験の結果の一例について説明する。
この音像定位実験は、防音室内で実施され、受聴者本人が図24に示したユーザインターフェースU243を操作することにより生成された個人化頭部伝達関数を評価している。また、この音像定位実験で使用された音声は、200Hzから17kHzの範囲の広帯域ホワイトノイズであり、立ち上がりの0.1秒及び立ち下がりの0.1秒を含めた受聴者への提示時間が1.2秒である。さらに、当該音声は、受聴者により装着されたヘッドホンから出力された。
三名の受聴者は、マッピング法により音像の方向を回答した。具体的には、三名の受聴者は、ディスプレイに表示され、正中面を示す円周と、前後上下を示す矢印を参照しながら知覚した上昇角を当該円周上にマウスでクリックすることにより知覚した音像の方向を回答した。
図28、図29及び図30は、実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を評価するために実施された音像定位実験の結果の一例を示す図である。
図28は、受聴者Aに関する音像定位実験の結果の一例を示している。図28に示すように、受聴者Aは、自身の頭部伝達関数が畳み込まれた音声が提示された場合、上述した所定の方向が正面である場合及び上述した所定の方向が後方である場合のいずれの場合であっても、正しい音像の方向を回答している。また、図28に示すように、受聴者Aは、受聴者Aの個人化頭部伝達関数が畳み込まれた音声が提示された場合、上述した所定の方向が正面である場合及び上述した所定の方向が後方である場合のいずれの場合であっても、概ね正しい音像の方向を回答している。
図29は、受聴者Bに関する音像定位実験の結果の一例を示している。図29に示すように、受聴者Bは、自身の頭部伝達関数が畳み込まれた音声が提示され、上述した所定の方向が正面である場合、概ね正しい音像の方向を回答している。また、図29に示すように、受聴者Bは、自身の頭部伝達関数が畳み込まれた音声が提示され、上述した所定の方向が後方である場合、概ね正しい音像の方向を回答しているものの、一回だけ前後を誤って回答している。
また、図29に示すように、受聴者Bは、受聴者Bの個人化頭部伝達関数が畳み込まれた音声が提示され、上述した所定の方向が正面である場合、正しい音像の方向よりも上昇角が大きな方向を回答している。また、図29に示すように、受聴者Bは、受聴者Bの個人化頭部伝達関数が畳み込まれた音声が提示され、上述した所定の方向が後方である場合、概ね正しい音像の方向を回答している。
図30は、受聴者Cに関する音像定位実験の結果の一例を示している。図30に示すように、受聴者Cは、自身の頭部伝達関数が畳み込まれた音声が提示され、上述した所定の方向が正面である場合、概ね正しい音像の方向を回答しているものの、一回だけ前後を誤って回答している。また、図30に示すように、受聴者Cは、自身の頭部伝達関数が畳み込まれた音声が提示され、上述した所定の方向が後方である場合、概ね正しい音像の方向を回答している。
また、図30に示すように、受聴者Cは、受聴者Cの個人化頭部伝達関数が畳み込まれた音声が提示され、上述した所定の方向が正面である場合、概ね正しい音像の方向を回答しているものの、二回だけ前後を誤って回答している。また、図30に示すように、受聴者Cは、受聴者Cの個人化頭部伝達関数が畳み込まれた音声が提示され、上述した所定の方向が後方である場合、概ね正しい音像の方向を回答しているものの、少しばらつきが大きく、一回だけ70度と回答している。
図31は、実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を評価するために実施された音像定位実験における前後誤判定率の一例を示す図である。図31に示すように、受聴者A、受聴者B及び受聴者Cの前後誤判定率の平均は、上述した所定の方向が正面である場合、受聴者本人の頭部伝達関数では3%となっており、各受聴者の個人化頭部伝達関数では7%となっている。また、図31に示すように、受聴者A、受聴者B及び受聴者Cの前後誤判定率の平均は、上述した所定の方向が後方である場合、受聴者本人の頭部伝達関数では3%となっており、各受聴者の個人化頭部伝達関数では3%となっている。
図32は、実施形態に係る頭部伝達関数生成装置により生成された個人化頭部伝達関数を評価するために実施された音像定位実験における平均仰角誤差の一例を示す図である。図32に示すように、受聴者A、受聴者B及び受聴者Cの平均仰角誤差の平均は、上述した所定の方向が正面である場合、受聴者本人の頭部伝達関数では1.3度となっており、各受聴者の個人化頭部伝達関数では6.3度となっている。また、図32に示すように、受聴者A、受聴者B及び受聴者Cの平均仰角誤差の平均は、上述した所定の方向が後方である場合、受聴者本人の頭部伝達関数では1.1度となっており、各受聴者の個人化頭部伝達関数では7.2度となっている。
図28から図32を参照すると、頭部伝達関数生成装置1により生成された個人化頭部伝達関数は、受聴者本人の頭部伝達関数には少し劣るものの、比較的高い精度で音像の方向を受聴者に定位させることができることが分かる。
なお、上述した実施形態における頭部伝達関数生成装置1が備える各機能の少なくとも一部は、これらの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここで言うコンピュータシステムは、OSや周辺機器等のハードウェアを含むものとする。
また、コンピュータ読み取り可能な記録媒体は、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶部のことをいう。さらにコンピュータ読み取り可能な記録媒体は、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また、上述したプログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲内において種々の組み合わせ、変形、置換及び設計変更の少なくとも一つを加えることができる。
1…頭部伝達関数生成装置、11…プロセッサ、12…主記憶装置、13…通信インターフェース、14…補助記憶装置、15…入出力装置、16…バス、101…頭部伝達関数変換部、102…相関分析実行部、103…調整用頭部伝達関数生成部、104…音声出力部、105…周波数調整部、106…個人化頭部伝達関数生成部、107…データ出力部、151…マウス、152…キーボード、153…ディスプレイ

Claims (14)

  1. 所定の方向における実測頭部伝達関数から受聴者ごとに生成されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、前記独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力する音声出力部と、
    前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する周波数調整部と、
    前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力するデータ出力部と、
    を備える頭部伝達関数生成装置。
  2. 前記周波数調整部は、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整するために使用される少なくとも一つのユーザインターフェースが操作された結果に基づいて、前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する、
    請求項1に記載の頭部伝達関数生成装置。
  3. 前記音声出力部は、ノッチ及びピークのうちの一つの周波数が所定の範囲を超える範囲内で所定の分散を超える分散で散らばっている複数の前記実測頭部伝達関数に前記相関分析を適用することによりノッチ及びピークの少なくとも一つの周波数が推定された前記調整用頭部伝達関数が畳み込まれた前記音声を出力する、
    請求項1又は請求項2に記載の頭部伝達関数生成装置。
  4. 前記音声出力部は、ノッチの周波数及びピークの周波数のうちの少なくとも二つの間の相関係数が所定の相関係数を超えている複数の前記実測頭部伝達関数に前記相関分析を適用することによりノッチ及びピークの少なくとも一つの周波数が推定された前記調整用頭部伝達関数が畳み込まれた前記音声を出力する、
    請求項1から請求項3のいずれか一つに記載の頭部伝達関数生成装置。
  5. 前記音声出力部は、ノッチの周波数及びピークの周波数のうちの一つが高くなる程、残りのノッチの周波数及びピークの周波数が高くなり、ノッチの周波数及びピークの周波数のうちの一つが低くなる程、残りのノッチの周波数及びピークの周波数が低くなる相関関係を有する前記調整用頭部伝達関数が畳み込まれた前記音声を出力する、
    請求項1から請求項4のいずれか一つに記載の頭部伝達関数生成装置。
  6. 前記音声出力部は、ノッチのレベル、ピークのレベル、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一つが決定された前記調整用頭部伝達関数が畳み込まれた前記音声を出力する、
    請求項1から請求項5のいずれか一つに記載の頭部伝達関数生成装置。
  7. 前記音声出力部は、複数の前記実測頭部伝達関数の間で周波数が所定の範囲内で一致しているノッチ又はピークのレベルの統計量がノッチ又はピークのレベルとして採用されている前記調整用頭部伝達関数が畳み込まれた前記音声を出力する、
    請求項6に記載の頭部伝達関数生成装置。
  8. 前記音声出力部は、複数の前記実測頭部伝達関数の間で周波数が所定の範囲内で一致しているノッチ又はピークの尖鋭度の統計量がノッチ又はピークの尖鋭度として採用されている前記調整用頭部伝達関数が畳み込まれた前記音声を出力する、
    請求項6又は請求項7に記載の頭部伝達関数生成装置。
  9. 前記音声出力部は、前記パラメータ推定用頭部伝達関数のノッチ又はピークのレベルに所定のレベルを加算又は減算したレベルが当該ノッチ又は当該ピークの周波数と所定の範囲で一致している周波数のノッチのレベルとして採用されている前記調整用頭部伝達関数が畳み込まれた前記音声を出力する、
    請求項6に記載の頭部伝達関数生成装置。
  10. 前記音声出力部は、ノッチの尖鋭度及びピークの尖鋭度の少なくとも一方が調整されることにより隣接するノッチとピークとの干渉の度合いが調整された前記パラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を前記独立変数とする前記相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された前記調整用頭部伝達関数が畳み込まれた前記音声を出力する、
    請求項6に記載の頭部伝達関数生成装置。
  11. 前記所定の方向における前記個人化頭部伝達関数と、受聴者の両耳間時間差及び両耳間レベル差の少なくとも一方を示すデータとに基づいて、当該受聴者の水平面内の方向であり、前記所定の方向と異なる方向における個人化頭部伝達関数を生成する個人化頭部伝達関数生成部を更に備え、
    前記データ出力部は、前記個人化頭部伝達関数生成部により生成された前記所定の方向と異なる方向における個人化頭部伝達関数を示すデータを出力する、
    請求項1から請求項10のいずれか一つに記載の頭部伝達関数生成装置。
  12. 前記音声出力部は、前記パラメータ推定用頭部伝達関数に含まれるノッチの中で最も低い周波数を有する第一ノッチと、前記パラメータ推定用頭部伝達関数に含まれるノッチの中で二番目に低い周波数を有する第二ノッチと、前記第一ノッチよりも低い周波数を有する第一ピークと、前記第一ノッチよりも高く、第二ノッチよりも低い周波数を有する第二ピークとのうちの一つの周波数を前記独立変数とする前記相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された前記調整用頭部伝達関数が畳み込まれた音声を出力する、
    請求項1から請求項11のいずれか一つに記載の頭部伝達関数生成装置。
  13. コンピュータに、
    所定の方向における実測頭部伝達関数から受聴者ごとに生成されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、前記独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力する音声出力機能と、
    前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整する周波数調整機能と、
    前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力するデータ出力機能と、
    を実現させる頭部伝達関数生成プログラム。
  14. 所定の方向における実測頭部伝達関数から受聴者ごとに生成されたパラメータ推定用頭部伝達関数のノッチ及びピークのうちの一つの周波数を独立変数とし、前記独立変数とされた周波数を有するノッチ又はピークと異なるノッチ及びピークの少なくとも一つの周波数を推定する相関分析によりノッチの周波数及びピークの周波数の少なくとも一つが推定された調整用頭部伝達関数が畳み込まれた音声を出力し、
    前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つを任意の周波数に調整し、
    前記調整用頭部伝達関数のノッチの周波数及びピークの周波数の少なくとも一つが調整された頭部伝達関数である個人化頭部伝達関数を示すデータを出力する、
    頭部伝達関数生成方法。
JP2021130815A 2021-08-10 2021-08-10 頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法 Active JP7153963B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021130815A JP7153963B1 (ja) 2021-08-10 2021-08-10 頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021130815A JP7153963B1 (ja) 2021-08-10 2021-08-10 頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法

Publications (2)

Publication Number Publication Date
JP7153963B1 true JP7153963B1 (ja) 2022-10-17
JP2023025519A JP2023025519A (ja) 2023-02-22

Family

ID=83637926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021130815A Active JP7153963B1 (ja) 2021-08-10 2021-08-10 頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法

Country Status (1)

Country Link
JP (1) JP7153963B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007110206A (ja) * 2005-10-11 2007-04-26 Yamaha Corp 信号処理装置および音像定位装置
JP2020014145A (ja) * 2018-07-19 2020-01-23 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
WO2020214496A1 (en) * 2019-04-18 2020-10-22 Facebook Technologies, Llc Individualization of head related transfer function templates for presentation of audio content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007110206A (ja) * 2005-10-11 2007-04-26 Yamaha Corp 信号処理装置および音像定位装置
JP2020014145A (ja) * 2018-07-19 2020-01-23 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
WO2020214496A1 (en) * 2019-04-18 2020-10-22 Facebook Technologies, Llc Individualization of head related transfer function templates for presentation of audio content

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
飯田 一博,VRの進化を担う3D音響技術,電子情報通信学会誌,日本,一般社団法人電子情報通信学会,2020年04月01日,第103巻 第4号,第413-420頁
飯田 一博: "VRの進化を担う3D音響技術", 電子情報通信学会誌, vol. 第103巻 第4号, JPN6022035355, 1 April 2020 (2020-04-01), JP, pages 413 - 420, ISSN: 0004862678 *

Also Published As

Publication number Publication date
JP2023025519A (ja) 2023-02-22

Similar Documents

Publication Publication Date Title
Schärer et al. Evaluation of equalization methods for binaural signals
KR102125443B1 (ko) 고도 렌더링을 실현하는 필터링된 오디오 신호를 생성하기 위한 장치 및 방법
US8787584B2 (en) Audio metrics for head-related transfer function (HRTF) selection or adaptation
US11528577B2 (en) Method and system for generating an HRTF for a user
Parodi et al. A subjective evaluation of the minimum channel separation for reproducing binaural signals over loudspeakers
WO2011039413A1 (en) An apparatus
US11770669B2 (en) Audio personalisation method and system
EP2822301B1 (en) Determination of individual HRTFs
JP7153963B1 (ja) 頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法
WO2018150766A1 (ja) 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム
US11315277B1 (en) Device to determine user-specific HRTF based on combined geometric data
EP3700233A1 (en) Transfer function generation system and method
JP4226142B2 (ja) 音響再生装置
Inoue et al. Evaluation of HRTFs estimated using physical features
Brinkmann et al. Audibility of head-above-torso orientation in head-related transfer functions
US11337021B2 (en) Head-related transfer function generator, head-related transfer function generation program, and head-related transfer function generation method
Alonso-Martınez Improving Binaural Audio Techniques for Augmented Reality
Nowak et al. 3D virtual audio with headphones: A literature review of the last ten years
JP6986778B2 (ja) 頭部伝達関数生成装置、頭部伝達関数生成プログラム及び頭部伝達関数生成方法
JP2023121015A (ja) 頭部伝達関数生成装置、プログラム及び頭部伝達関数生成方法
Ohlmann et al. Factors affecting sound quality in acoustically transparent hearing devices
CN115460526B (zh) 一种听力模型的确定方法、电子设备及***
CN112954579B (zh) 现场听音效果的重现方法及装置
CN117202001A (zh) 一种基于骨导设备的声像虚拟外化方法
Grimaldi Auditory externalization of a remote microphone signal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220927

R150 Certificate of patent or registration of utility model

Ref document number: 7153963

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150