JP5867799B2 - 収音再生装置、プログラム及び収音再生方法 - Google Patents

収音再生装置、プログラム及び収音再生方法 Download PDF

Info

Publication number
JP5867799B2
JP5867799B2 JP2011139835A JP2011139835A JP5867799B2 JP 5867799 B2 JP5867799 B2 JP 5867799B2 JP 2011139835 A JP2011139835 A JP 2011139835A JP 2011139835 A JP2011139835 A JP 2011139835A JP 5867799 B2 JP5867799 B2 JP 5867799B2
Authority
JP
Japan
Prior art keywords
sound
signal
head
transfer function
related transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011139835A
Other languages
English (en)
Other versions
JP2013009112A (ja
Inventor
郁 蘆原
郁 蘆原
昭吾 桐生
昭吾 桐生
博 木戸
博 木戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Tohoku Institute of Technology
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Tohoku Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST, Tohoku Institute of Technology filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2011139835A priority Critical patent/JP5867799B2/ja
Publication of JP2013009112A publication Critical patent/JP2013009112A/ja
Application granted granted Critical
Publication of JP5867799B2 publication Critical patent/JP5867799B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stereophonic Arrangements (AREA)
  • Stereophonic System (AREA)

Description

本発明は、外部音響を収音し、その音響信号をバイノーラル信号に変換して再生する収音再生装置、該収音再生装置に用いられるプログラム及び収音再生方法に関する。
3次元の音響情報を得るための技術として、例えば、擬似頭(ダミーヘッド)を用いたバイノーラル録音が知られている(特許文献1,2参照)。しかし、これらのバイノーラル録音を有効に実行するためには、擬似頭を人間の頭部と同等の大きさとする必要がある。また、実際の頭と同程度の音響特性を実現するため、擬似頭に充分な剛性と質量を持たせなくてはならない。
このような大きさと質量をもつ擬似頭では、運搬が困難であるのに加えて、狭い空間では使用できないため、音源探査装置やモバイル通信端末として使用できる状況がかなりの程度限定されてしまうという問題がある。例えば、災害現場で瓦礫に埋もれた生存者を探索する場合、狭く曲がりくねった空隙に挿入できるような音源探査装置が求められる。標準的な大きさの擬似頭では、このような用途には適さない。
音源探査技術としては、例えば、多数のマイクロホンを空間的に配置し、信号の遅延和合成によって、任意の方向に鋭い指向性を生むマイクロホンアレイが知られている(特許文献3参照)。
しかしながら、高い感度を得るにはマイクロホン数を多くする必要があり、それにともなってアレイ自体のサイズが大きくなるだけでなく、扱うデータ量も大きくなるという問題がある。
比較的小型の装置としては、半径8.5cmの球体に252チャネルのマイクロホンを配置した球状マイクロホンアレイ(非特許文献1)なども提案されているが、これらの提案手法では、チャネル数が非常に多いため、信号量も多く、高度な信号処理が必要となる問題がある。
本発明は、従来における前記諸問題を解決し、以下の目的を達成することを課題とする。即ち、本発明は、マイクロホン保持部材の小型化及び軽量化が可能であり、かつ、少ないデータ量で臨場感に富んだバイノーラル信号を再生可能な収音再生装置、該収音再生装置に用いられるプログラム及び収音再生方法を提供することを目的とする。
前記課題を解決するための手段としては、以下の通りである。即ち、
<1> 1個の参照マイクロホンと2個又は3個の比較マイクロホンを有する音響収音部と、人の頭部による音の振幅レベル及び位相に対する影響を周波数の関数として表現した頭部伝達関数データを前記音の到来方向ごとに記録した頭部伝達関数データベースと、前記音響収音部で収音され、時間ごとに区切られた音響信号と前記頭部伝達関数データから2チャネルのバイノーラル信号を合成する信号処理部と、前記2チャネルのバイノーラル信号を音響として再生する音響再生部と、を有し、前記信号処理部は、前記音響信号を逐次周波数分析する周波数分析手段と、前記参照マイクロホンを通じて取得される前記音響信号を基準信号とし、前記比較マイクロホンから取得される前記音響信号を比較信号としたとき、逐次周波数分析された前記音響信号に対し、その周波数成分ごとに前記基準信号と前記比較信号の位相差及び振幅レベル差を算出する差分算出手段と、前記位相差及び振幅レベル差から前記周波数成分ごとの音像方向を推定する音像方向推定手段と、前記推定された周波数成分ごとの音像方向にしたがい、前記頭部伝達関数データベースから前記推定された周波数成分ごとの前記頭部伝達関数データを読み出し、前記周波数成分ごとの前記頭部伝達関数データが周波数軸上に並べられた前記時間ごとにおける合成頭部伝達関数を算出する合成頭部伝達関数算出手段と、前記合成頭部伝達関数を前記基準信号に付加することにより、前記2チャネルのバイノーラル信号を合成するバイノーラル信号合成手段と、を有することを特徴とする収音再生装置。
<2> バイノーラル信号を記録する記録部を有する前記<1>に記載の収音再生装置。
<3> 音響再生部の配置角度の変更を検出し、その変更に係る信号を信号処理部に出力する角度センサを有し、音像方向推定手段は、前記角度センサで検出された前記配置角度の変更にしたがい、その推定する音像方向を変更して前記音像方向を推定する前記<1>から<2>のいずれかに記載の収音再生装置。
<4> 音響収音部が、参照マイクロホン及び2個又は3個の比較マイクロホンを保持するマイクロホン保持部材を有し、前記参照マイクロホン及び前記比較マイクロホンのそれぞれが、相互に1cm〜10cmの距離を隔てた状態で保持される前記<1>から<3>のいずれかに記載の収音再生装置。
<5> 音響収音部が、参照マイクロホン及び2個又は3個の比較マイクロホンを保持するマイクロホン保持部材を有し、前記参照マイクロホン及び前記比較マイクロホンが水中音響収音用のハイドロホンとして構成され、前記各ハイドロホンのそれぞれが、相互に4cm〜50cmの距離を隔てた状態で保持される前記<1>から<3>のいずれかに記載の収音再生装置。
<6> マイクロホン保持部材が、少なくとも耳介部と外耳道部を有し、頭部を模擬しているが、前記頭部に比べて小さい大きさの擬似頭であり、比較マイクロホンのうち少なくとも2個が、各々前記外耳道部に配され、参照マイクロホンが前記比較マイクロホンに対して、距離を隔てて前記擬似頭に配される前記<4>から<5>のいずれかに記載の収音再生装置。
<7> 信号処理部がパーソナルコンピュータで構成される前記<1>から<6>のいずれかに記載の収音再生装置。
<8> 信号処理部において合成されたバイノーラル信号を音響再生部に送信する無線インターフェースを有する前記<1>から<7>のいずれかに記載の収音再生装置。
<9> 前記<7>に記載の収音再生装置に用いられ、信号処理部に対し、バイノーラル信号の合成を実行させることを特徴とするプログラム。
<10> 1個の参照マイクロホンと2個又は3個の比較マイクロホンから音響を収音する音響収音ステップと、前記収音された音響の時間ごとに区切られた音響信号と人の頭部による音のレベル及び位相に対する影響を周波数の関数として表現した頭部伝達関数データを前記音の到来方向ごとに記録した頭部伝達関数データベースとから2チャネルのバイノーラル信号を合成する信号処理ステップと、前記2チャネルのバイノーラル信号を音響として再生する音響再生ステップと、を有し、前記信号処理ステップは、前記音響信号を逐次周波数分析する逐次周波数分析処理と、前記参照マイクロホンを通じて取得される前記音響信号を基準信号とし、前記比較マイクロホンから取得される前記音響信号を比較信号としたとき、逐次周波数分析された前記音響信号に対し、その周波数成分ごとに前記基準信号と前記比較信号の位相差及び振幅レベル差を算出する差分算出処理と、前記位相差及び振幅レベル差から前記周波数成分ごとの音像方向を推定する音像方向推定処理と、前記推定された周波数成分ごとの音像方向にしたがい、前記頭部伝達関数データベースから前記推定された周波数成分ごとの前記頭部伝達関数データを読み出し、前記周波数成分ごとの前記頭部伝達関数データが周波数軸上に並べられた前記時間ごとにおける合成頭部伝達関数を算出する合成頭部伝達関数算出処理と、前記合成頭部伝達関数を前記基準信号に付加することにより前記2チャネルのバイノーラル信号を合成するバイノーラル信号合成処理と、を実行することを特徴とする収音再生方法。
<11> 音響再生ステップを実行する音響再生部の配置角度の変更を検出する角度変更検出ステップを有し、音像方向推定処理は、前記角度変更検出ステップで検出された前記配置角度の変更にしたがい、その推定する音像方向を変更して前記音像方向を推定する前記<10>に記載の収音再生方法。
本発明によれば、従来技術における前記諸問題を解決することができ、マイクロホン保持部材の小型化及び軽量化が可能であり、かつ、少ないデータ量で臨場感に富んだバイノーラル信号を再生可能な収音再生装置、該収音再生装置に用いられるプログラム及び収音再生方法を提供することができる。
本発明の収音再生装置の概要を示す説明図である。 信号処理部における信号処理手順の概要を示す説明図である。 音像方向の推定方法を説明する説明図である。 擬似頭を用いた場合の音像方向の推定方法を説明する説明図である。 3次元空間における音の到来する方向を説明する説明図である。 4個のマイクロホンのそれぞれを正四面体の頂点を成すように配置した状態を示す説明図である。 本発明の一実施形態に係る信号処理部の信号処理例を示す説明図である。 音響出力部の装用者が頭を回転したときに仮想音像が回転してしまうことを説明する説明図である。 従来のテレヘッドの手法を説明する説明図である。 本発明の一実施形態に係る収音再生装置において、音響出力部の装用者が頭部の向きを変えたときに3次元音空間情報を保持する手法を説明する説明図である。 本発明の収音再生装置を空中音響の収音に利用する場合と、水中音響の収音に利用する場合の参照マイクロホン及び比較マイクロホンの配置状況を示す図である。 左方向から提示した音声をステレオ録音した信号のパワースペクトルを示す図である。 本発明の収音再生装置にて合成したバイノーラル信号のパワースペクトルを示す図である。
(収音再生装置)
本発明の収音再生装置は、音響収音部と、頭部伝達関数データベースと、信号処理部と、音響再生部とを有し、更に必要に応じて、その他の部材を有する。
本発明の収音再生装置の基本的な構成例を図1に示す。音響収音部1は、1個の参照マイクロホン4と2個の比較マイクロホン5a,5bとを有し、参照マイクロホン4及び比較マイクロホン5a,5bは、それぞれ互いに数cm程度の距離をおいて2次元的あるいは3次元的に配置される。比較マイクロホンの数は、3個でもよいが、この図では、最も簡単な構成例として左右一対の比較マイクロホンからなる場合を示している。
参照マイクロホン4から収音された音響情報及び比較マイクロホン5a,5bから収音された音響情報は、AD変換された後、それぞれ基準信号及び比較信号として、無線又は有線のインターフェースを介して信号処理部2へ送信される。
信号処理部2は、基準信号、比較信号及び頭部伝達関数データベース6の各情報を用いて2チャネルのバイノーラル信号を合成する。
合成されたバイノーラル信号は、無線又は有線のインターフェースを介して音響再生部3に送信され、DA変換された後、音響再生部3に配されるステレオ受話器7にて、3次元の音空間情報を有する音響として再生される。
なお、本発明の収音再生装置では、少ないデータ量でバイノーラル信号を合成することとし、データの取扱性に難がないため、音響収音部1にて収音された信号を無線通信で信号処理部2に送信すること、及び信号処理部2で合成されたバイノーラル信号を無線インターフェースを介して音響再生部3に送信することについても難がない。
したがって、音源探査を行う現場から離れた遠隔地にいる使用者が現場の3次元音響情報を得ることができ、音源探査装置、遠隔監視装置への応用、ロボットの遠隔操作への活用も期待できる。
<音響収音部>
音響収音部1は、前述の通り、少なくとも参照マイクロホン4と比較マイクロホン5a、5bとを有し、更に必要に応じて、これらを保持するマイクロホン保持部材を有する。
ここで、参照マイクロホン4と比較マイクロホン5a、5bの配置に関しては、次の2つの拘束条件が満たされている必要がある。
第1の拘束条件は、少なくとも水平面上のあらゆる方向に対して参照マイクロホン4の特性が変化しないこと、つまり、少なくとも水平面上に関して指向性がないことである。これを満たすには、参照マイクロホン4の近傍に音響特性に影響を及ぼすような障害物が存在しないことが求められる。
第2の拘束条件は、参照マイクロホン4と各比較マイクロホン5a、5b及び比較マイクロホン同士が、少なくとも水平面上で、ある程度の距離を隔てて配置されることである。
この距離の最適値は、本発明の用途によって適宜決めればよいが、通常は数cm程度で充分であり、場合によっては1cm未満でも問題ない。
好ましくは、参照マイクロホン4及び比較マイクロホン5a,5bのそれぞれが、相互に1cm〜10cmの距離を隔てた状態で保持される。
前記2つの拘束条件がともに満たされていれば、参照マイクロホン4及び比較マイクロホン5a、5bの配置は任意である。
また、前記マイクロホン保持部材の形状、構造としては、前記2つの拘束条件が満たされるように、参照マイクロホン4及び比較マイクロホン5a、5bを配置することができる限り特に制限はなく、目的に応じて適宜選択することができる。
例えば、録音用マイクのようなマイクロホンを収容して保持することが可能な筐体や擬似頭の中から、小型で軽量性のものを適宜選択することができる。
したがって、音響収音部1を参照マイクロホン4及び比較マイクロホン5a、5bとを有して構成することとすれば、これらを保持する前記マイクロホン保持部材の小型化及び軽量化が可能となる。
これにより、例えば、前記マイクロホン保持部材を手のひらに乗せて持ち運ぶことができ、人間が入ることのできない配管内や瓦礫の下に挿入し、音源探査させることも可能である。なお、前記擬似頭としても、人の頭部を模擬するものでなくてよく、デザイン性の観点から種々の形状のものを選択することができる。
ところで、使用者自身の外耳に装着してバイノーラル信号を記録するイヤホンタイプのバイノーラルマイクロホンが市販されているが、その種のマイクロホンは、人間が頭に装着して初めてバイノーラル信号を記録できるものなので、人間が入れない空隙の音源探査には使えない。また、装用者が聞いている音を再現することになるため、通信端末としても不向きである。
前記収音再生装置では、単体でバイノーラル信号を再生可能であり、人間の頭部を必要としない。また、前記収音再生装置を話者に対面するように配置すれば、通信端末として使用したとき、遠隔地にいる相手にとっては、自分が話者に対面している状況を擬似体験することになり、効果的である。
<頭部伝達関数データベース>
頭部伝達関数データベース6は、人の頭部による音の振幅レベル及び位相に対する影響を周波数の関数として表現した頭部伝達関数データを前記音の到来方向ごとに記録している。以下、この頭部伝達関数データベース6について説明する。
通常、人間が聞いている音は、その人の頭部や耳介による集音、遮音、反射、回折といった影響を受けている。このため、外耳道内で観測される信号は、頭のかわりに置かれたマイクロホンで観測される信号とは、パワースペクトルも位相スペクトルも明らかに異なるものとなる。
空間内に配置された1本のマイクロホンにてモノラル録音された信号や、水平方向に離して配置された2本のマイクロホンによりステレオ録音された信号をヘッドホンを介して人間に聞かせても、そのような信号には、前記頭部伝達関数の影響が欠如しているので、音に空間的な広がりが感じられず、まるで音源が頭の中で鳴っているように聞こえる。これは頭内定位と呼ばれる現象である。
これに対し、形状が人間の頭部を模擬しており、左右の外耳道内にマイクロホンが取り付けられた擬似頭にて録音された信号をヘッドホンを介して人間に聞かせると、その人には、前記擬似頭のまわりで鳴らされた音が、あたかも自分の頭のまわりで鳴っているかのように、空間的に広がって知覚される。これは頭外定位と呼ばれる現象である。この頭外定位が生じるのは、前記擬似頭の外耳道内で録音される信号には、前記擬似頭の頭部伝達関数が含まれているからである。
一般に、前記擬似頭を用いて録音することは、バイノーラル録音と呼ばれ、その録音された信号は、バイノーラル信号と呼ばれるが、本明細書において、前記収音再生装置で合成されるバイノーラル信号とは、この本来的な意味でのバイノーラル信号を擬似的に合成した信号を示す。
前記頭部伝達関数を逆フーリエ変換し、時間波形にしたものは、頭部インパルス応答と呼ばれる。前記擬似頭の頭部インパルス応答をあらかじめ測定しておけば、いちいち前記擬似頭を使って録音しなくても、モノラル録音された信号に、あらかじめ測定されている前記頭部インパルス応答を畳み込むことで、擬似的にバイノーラル信号を合成することができる。
前記頭部伝達関数及び前記頭部インパルス応答は、音の到来する方向に依存して様々に変化するので、あらかじめあらゆる方向の前記頭部伝達関数あるいは前記頭部インパルス応答を測定しておき、データベース化しておく。
モノラル信号に任意の方向の頭部インパルス応答を畳み込めば、音像の方向を任意に操作することができる。このため、水平面上の方位を5度刻みや10度刻みで測定した前記頭部インパルス応答や、仰角方向も複数に分割して測定した前記頭部インパルス応答のデータベースが多くの研究機関等によって公開されている。
前記モノラル信号に前記頭部インパルス応答を畳み込む手法によって擬似的に前記バイノーラル信号を合成できるが、この手法には原理的な問題点がある。
即ち、前記モノラル信号には、音源からの直接音と、壁、床、天井などから跳ね返ってくる反射音とが含まれており、これらを分離することはできない。現実の環境では、前記反射音は、前記直接音とは異なる方向から耳に到達しているが、前記モノラル信号に前記頭部インパルス応答を畳み込む手法では、前記直接音にも前記反射音にもすべて同じ方向の前記頭部インパルス応答が畳み込まれてしまう。
したがって、この手法で得られる擬似バイノーラル信号は、本来のバイノーラル信号と大きく異なる。
そのため、現実的なバイノーラル信号を得るには、特許文献1及び2に提示されるように前記擬似頭を使って録音することが有効な手法の一つになる。この擬似頭には、人間の頭部の音響特性を忠実に模擬することが求められるため、当然、人間の頭部と同等の大きさが求められることになる。
しかし、人間の頭部と同等の大きさを持つ擬似頭では、その大きさ及び質量ゆえ、研究目的以外での用途は殆ど期待できないのが現状である。
本発明の前記収音再生装置では、音響収音部1を人間の頭部に比べて圧倒的に小さく、軽量化された構成としても、音響収音部1が参照マイクロホン4と比較マイクロホン5a,5bを有する構成とすることで、音響収音部1から収音した信号に基づいて、信号処理部2で擬似的なバイノーラル信号の合成を可能とするものであり、信号処理部2では、あらかじめ実際の人間の頭部あるいは擬似頭を用いて測定された頭部伝達関数データベース6を用いる。
この頭部伝達関数データベース6としては、例えば、f[Hz]からfn−1[Hz]のすべての周波数に関して、水平面上の方向を5度刻み、あるいは10度刻みに分割したすべての方位についての頭部伝達関数、つまり振幅レベル値と位相の値が記録されたデータベースが挙げられる。
<信号処理部>
信号処理部2は、音響収音部1で収音された音響信号と頭部伝達関数データベース6に記録された前記頭部伝達関数データから2チャネルの前記バイノーラル信号を合成し、周波数分析手段と、差分算出手段と、音像方向推定手段と、合成頭部伝達関数算出手段と、バイノーラル信号合成手段とを実行する。
この信号処理部2における情報処理の流れを図2に基づいて説明する。
−周波数分析手段−
前記周波数分析手段は、前記音響信号を逐次周波数分析する機能を有する手段である。
前記周波数分析手段としては、前記機能を有する限り特に制限はなく、目的に応じて適宜選択することができ、例えば、音響信号を時間ごとに区切る時間窓と、前記時間窓で区切られた音響信号を位相スペクトルとパワースペクトルの情報に変換する時間軸−周波数軸変換器(FFT)との組合せ回路等の電気回路要素が挙げられる。
ここでは、参照マイクロホン4にて収音された信号と比較マイクロホン5a、5bにて収音された信号が、それぞれ短い時間窓に区切られる。以下、参照マイクロホン4にて収音された信号を基準信号、比較マイクロホン5a、5bにて収音された信号を比較信号とする。
前記時間窓に区切られた前記基準信号及び前記比較信号のそれぞれから周波数分析によってパワースペクトルと位相スペクトルが得られる。例えば、n点のフーリエ分析にて前記周波数分析処理を実行する場合、周波数f[Hz]からfn−1[Hz]の各周波数成分について、振幅レベルと位相が求められることになる(図2参照)。
なお、前記振幅レベルとは、音響パワーレベル[dB]や音圧レベル[dB]などのスペクトル波形において観測される振幅の値[dB]を示す。
−差分算出手段−
前記差分算出手段は、逐次周波数分析された前記音響信号に対し、その周波数成分ごとに前記基準信号と前記比較信号の位相差及び振幅レベル差を算出する機能を有する手段である。
前記差分算出手段としては、前記機能を有する限り特に制限はなく、例えば、減算器等の電気回路要素が挙げられる。
ここでは、前記周波数分析手段により得られた位相スペクトルとパワースペクトルから、例えば、f[Hz]からfn−1[Hz]の各周波数ごとに、前記基準信号と前記各比較信号の振幅レベル差と位相差が求められる。この振幅レベル差と位相差にもとづいて、各周波数成分ごとの音像方向が推定される(図2参照)。
−音像方向推定手段−
前記音像方向推定手段は、前記位相差及び振幅レベル差から前記周波数ごとの音像方向を推定する機能を有する手段である。
前記音像方向推定手段としては、前記機能を有する限り特に制限はなく、例えば、前記位相差及び振幅レベル差を角度の情報に変換するデータ変換装置等の電気回路要素が挙げられる。
ここでの前記位相差及び振幅レベル差から前記周波数ごとの音像方向を推定する方法について、図3を用いて説明する。図3は、音像方向を推定する方法を説明する説明図であり、参照マイクロホン4と左右一対の比較マイクロホン5a、5bを上から見下ろしたときの様子を示している。この音響収音部1の構成例では、参照マイクロホン4と2個の比較マイクロホン5a、5bとが水平面上で正三角形の各頂点をなすように配置されている。
参照マイクロホン4と比較マイクロホン5a,5bの配置に関する前記第1の拘束条件を満たすように、比較マイクロホン5a、5bは、参照マイクロホン4に対して障害物にならない程度の小型マイクロホンとされる。
いま、図中のAの方向にある音源から、f[Hz]の音が到来しているものとする。参照マイクロホン4にて収音される基準信号をS、図中左側の比較マイクロホン5aにて収音される比較信号をS、図中右側の比較マイクロホン5bにて収音される比較信号をSとする。ある時間窓において、基準信号Sと左側の比較信号Sがそれぞれ周波数分析され、f[Hz]の成分について、SとSの位相差φ[rad]が求められる。
音速をc[mm/s]とすると、周波数f[Hz]と波長λ[mm]には、
λ=c÷f (1)
の関係がある。
前記音源から参照マイクロホン4までの伝搬距離と前記音源から比較マイクロホン5aまでの伝搬距離の差をd[mm]とすると、信号の波長λ[mm]と信号間の位相差φ[rad]との関係は、
2π×d÷λ=φ[rad] (2)
と表せる。
したがって、信号間の位相差φ[rad]から信号の伝搬距離の差d[mm]が求められる。
d[mm]がわかれば、マイクロホンの配置間隔をr[mm]として、
cosθ=d÷r (3)
なので、
θ=acos(d÷r) (4)
から、音像の方向θ[rad]が求められる。ただし、
acos(d÷r)=θ=−θ (5)
なので、前記音源が図中のA方向にあるのかB方向にあるのか区別できない。
そこで、右側の比較信号Sと基準信号Sに基づく音像方向推定も同様に行う。その結果、音像方向として、θと−θが算出される。つまり図中のA方向かC方向である。
両推定結果を同時に満たす音像方向は、BでもCでもなくAだけなので、f[Hz]の音像方向がAの方向であると特定される。2次元的に配置された3個のマイクロホンを用いることで水平面上の音像方向を一義的に求められるわけである。
この方法で、f[Hz]からfn−1[Hz]までのすべての周波数成分について音像方向が推定される。すべての周波数成分の音像方向が推定されれば、後述するように頭部伝達関数データベース6を利用してバイノーラル信号が合成可能とされる。
続いて、参照マイクロホン4及び比較マイクロホン5a、5bを、前記マイクロホン保持部材の一例としての小型擬似頭8上に配置する実施形態について、音像方向の推定方法を図4を用いて説明する。
図4に示す例では、形状が人間の頭部を模擬した擬似頭上に参照マイクロホン4及び左右一対の比較マイクロホン5a、5bが配置されている。この場合も、マイクロホン間の水平距離は数cm程度でよいので、擬似頭の半径も数cmでよい。
この小型擬似頭8を上から見下ろすと、参照マイクロホン4及び比較マイクロホン5a、5bは直線上に並んでいる。このため、図3に示した例のように音像方向を信号間の位相差だけから一義的に特定することができない。つまり音が図中のA方向から到来しているのか、B方向から到来しているのかについて、信号間の位相差だけでは区別できないことになる。
しかし、左右の比較マイクロホン5a、5bの背後に耳介9a、9bが設けられている。この耳介9a、9bは、前方から到来する音に対しては、集音器として働くが、後方から到来する音に対しては障害物となり、遮音効果を及ぼす。
参照マイクロホン4に対して耳介9a、9bの影響が無視できるなら、参照マイクロホン4の特性は、水平面上の方向に依存しないので、前方から到来する音に対しても後方から到来する音に対しても感度は同じである。
したがって、信号間位相差だけでは前方から到来する音と後方から到来する音を区別できなくても、基準信号Sと比較信号S及びSのレベル差が音像方向を推定する手がかりとして利用でき、図中のA方向から来る音とB方向から来る音を区別することが可能となる。
耳介9a、9bによる影響は、音の到来方向にも、信号の周波数にも依存するので、使用する小型擬似頭8の頭部伝達関数をあらかじめ測定しておく必要がある。
ここで、図4に示すように参照マイクロホン4及び比較マイクロホン5a、5bを、マイクロホン保持部材(小型擬似頭8)に配置する利点について述べる。
図3のように擬似頭を用いずにマイクロホンを配置する場合、波長が短くなる高周波数帯域において、前記位相差を前記音像方向を推定する手がかりとして利用できなくなる。図3のマイクロホン配置において、信号の伝搬距離差d[mm]は、マイクロホン間の距離r[mm]より短いはずである。三角関数の周期性から、φ[rad]とφ−2π[rad]は同等であるが、信号の周波数が低く、波長が2r[mm]よりも長ければ、φ[rad]から算出される信号伝搬距離差とφ−2π[rad]から算出される信号伝搬距離差のうち、一方がr[mm]より短ければ、他方は必ずr[mm]よりも長いはずなので、本来の信号間位相差がφ[rad]なのかφ−2π[rad]なのかが一義的に特定され、音像方向も特定できる。
しかし、信号の周波数が高くなり、波長が2r[mm]よりも短くなると、信号間位相差φ[rad]から算出される伝搬距離差とφ−2π[rad]から算出される伝搬距離差の両方がマイクロホン間距離r[mm]よりも短くなることもあり、本来の信号間位相差がφ[rad]なのかφ−2π[rad]なのか特定できない場合も出てくる。この場合、音像方向も特定できない。
信号間位相差以外に前記音像方向を推定する今一つの手がかりとして、信号間振幅レベル差がある。しかし、図3に示すようなマイクロホン配置において、信号間振幅レベル差が利用できるのは、音源が比較的近距離にあるときだけである。音源が近距離にあれば、数cm程度の距離差でも計測可能な信号間振幅レベル差が生じるが、音源が遠くにある場合、例えば10m以上も離れていると、数cm程度の距離差による信号間振幅レベル差は殆ど検出できないため、前記音像方向を推定する手がかりとして利用することが困難である。
これに対し、図4に示すようにマイクロホンが小型擬似頭8上に配置されていれば、擬似頭の横方向から到来する音は、頭のまわりを回折して反対側に達することになる。波には、波長が長いほど回折しやすいという性質がある。周波数の高い音は回折しにくく、低周波音に比べて頭の反対側に伝搬しにくいのである。
つまり、周波数が高くなるほど、左右の比較信号SとSの間に振幅レベル差が生じやすくなるのである。これは音源が遠方にあっても変わらないので、遠くから到来する信号でも、振幅レベル差が音像方向を推定する手がかりとして利用できることを意味する。
本発明において重要なのは、あらゆる周波数成分の音像方向を推定することである。そのための手がかりとして、信号間位相差や振幅レベル差を利用しやすいように各マイクロホンを配置すればよい。この意味で、参照マイクロホン4と比較マイクロホン5a,5bの配置に関する第1及び第2の拘束条件がともに満たされているなら、前記マイクロホン保持部材(小型擬似頭8)の形状に制約はない。
なお、音響収音部1で収音されるべき実際の音源数は1つとは限らない。むしろ通常の環境では、複数の音源が同時に存在するのが普通であり、音源の数も未知である。
したがって、ここでいう音像方向というのは、複数の音源から到来する音が混じり合った合成音像の音像方向である。
ここでは、f[Hz]からfn−1[Hz]の各周波数について推定された音像方向を、それぞれ角度θからθn−1として処理し、合成音像の音像方向を通常の環境に即して推定する。
−合成頭部伝達関数算出手段−
前記合成頭部伝達関数算出手段は、前記推定された音像方向にしたがい、前記頭部伝達関数データベースから前記頭部伝達関数データを読み出し、時変の合成頭部伝達関数を算出する機能を有する手段である。
前記合成頭部伝達関数算出手段としては、前記機能を有する限り特に制限はなく、目的に応じて適宜選択することができ、例えば、音像の方向を表す角度値からなる入力信号に対し、その入力信号に対応する周波数ごとの振幅レベル値と位相の値をデータベースから読み出し、これを出力するデータ変換装置と、その出力信号を周波数順に並べ替えるデータ並べ替え器と、並べ替えられたデータを時間軸情報に変換してインパルス応答を得る周波数軸−時間軸変換器(逆FFT)の組合せ回路等の電気回路要素が挙げられる。
ここでは、頭部伝達関数データベース6から、周波数ごとに音像方向に対応するレベル値と位相の値を取得する。例えば、任意の周波数f[Hz]について推定された音像方向は、θなので、頭部伝達関数データベース6から、f[Hz]の音がθの方向から到来する場合の、振幅レベル値と位相の値を取得する。これをf[Hz]からfn−1[Hz]のすべての成分について行い、得られたレベル値と位相の値を逆フーリエ変換すれば、その観測時間窓における合成頭部インパルス応答になる(図2参照)。
一般に頭部伝達関数や頭部インパルス応答は、音が任意の一方向から到来する場合を想定したものだが、本発明の信号処理部で求められるのは周波数ごとに異なる音像方向に基づく頭部インパルス応答ないし頭部伝達関数なので、ここでは、合成頭部インパルス応答ないし合成頭部伝達関数と呼ぶ。
前記収音再生装置は、頭部伝達関数を、周波数ごとの頭部伝達関数である合成頭部伝達関数として算出し、これをもとにバイノーラル信号を合成するため、複数の音源から到来する音響信号のそれぞれに音空間情報を付加して、臨場感に富んだバイノーラル信号を再生することができる。
−バイノーラル信号合成手段−
前記バイノーラル信号合成手段は、前記合成頭部伝達関数(前記合成頭部インパルス応答)を参照マイクロホン4を通じて取得される前記基準信号に付加することにより、前記2チャネルのバイノーラル信号を合成する機能を有する手段である。
前記バイノーラル信号合成手段としては、前記機能を有する限り特に制限はなく、目的に応じて適宜選択することができ、例えば、畳み込み器等の電気回路要素が挙げられる。
ここでは、前記合成頭部伝達関数算出手段により算出された合成頭部インパルス応答を、参照マイクロホン4にて収音された基準信号に畳み込み、実際の人間の耳で観測される信号を模擬し、臨場感に富んだ2チャネルのバイノーラル信号を合成する(図2参照)。
また、比較マイクロホンの数を3個として、3次元音空間情報を付加したバイノーラル信号を合成する場合は、次のように実施することができる。
3次元空間において、音が到来する方向は、水平面上の方向に仰角方向を加えたx,y,z座標として表される(図5参照)。しかし、図3に示したように参照マイクロホン4と比較マイクロホン5a及び5bを水平面上に配置する方法では、音像の水平面上の方向しか特定されない。
実環境での音の聞こえ方を、より忠実に再現するには、仰角方向も含めた音像方向を推定することが望ましい。それには、1個の参照マイクロホンに3個の比較マイクロホンを合わせた合計4個のマイクロホンを3次元的に配置するとともに、頭部伝達関数データベース6にも仰角方向を含めた3次元の頭部伝達関数データを用意しておくとよい。
1例として、4個のマイクロホンを、それぞれが正四面体の頂点を成すように配置した場合について、図6を用いて説明する。正四面体には、4つの面がある。これらを図6のように、A,B,C,Dとする。4つの面A,B,C,Dは、いずれも正三角形である。このうち正三角形Aが水平面上にあるとすると、Aの頂点となる3つのマイクロホンを用いて、図4に示した方法により、水平面上の音像方向が特定できることは、すでに述べた通りである。しかし、この方法では、仰角方向については音像方向を特定できないため、推定される方向は、垂直方向に面積をもつ面となる。
正三角形B,正三角形C,正三角形Dのそれぞれにおいても同様にして音像方向を推定できるが、推定される方向は、いずれも面である。ただし、4つの正三角形A,B,C,Dは、互いに平行ではないので、それらの正三角形から推定される音像方向も互いに平行関係にはならない。
平行ではない2つの面の交差は、直線となる。更に互いに平行ではない3つの面の交差は、長さをもたない点となる。
したがって、正三角形A,B,C,Dのうち、いずれか3個を用いて音像方向を推定すれば、3つの推定結果を同時に満たす方向は、3次元空間において1方向に特定される。つまり、水平面上の方向に加えて仰角方向も特定できることになる。
このようにして推定された3次元の音像方向を利用するため、頭部伝達関数データベース6には、5度刻みや10度刻みで分割した仰角方向ごとに、水平方向にも5度刻みや10度刻みで分割された精緻な頭部伝達関数データを用意しておく。
周波数ごとに推定された3次元の音像方向にもとづき、頭部伝達関数データベース6から、当該周波数かつ当該方向(仰角方向及び水平方向)の頭部伝達関数データ(振幅レベル値及び位相の値)を読み出す。それ以降の処理について、図3についての説明と同じである。
信号処理部2を電気回路要素により構成した場合の一例を信号処理の流れとともに図7を用いて説明する。
参照マイクロホン4から取得された音響信号は、時間窓50で時間ごとに区切られた後、基準信号として時間軸−周波数軸変換器(FFT)51にて周波数分析され、位相スペクトル及びパワースペクトルの信号として出力される。
また、比較マイクロホン5aから取得された音響信号についても同様に、時間窓50’で時間ごとに区切られた後、比較信号として時間軸−周波数軸変換器(FFT)51’にて周波数分析され、位相スペクトル及びパワースペクトルの信号として出力される。
基準信号及び比較信号のパワースペクトルの信号は、減算器52にて差分算出され、振幅レベル差の信号としてデータ変換装置53に出力される。
同様に、基準信号及び比較信号の位相スペクトルの信号は、減算器52’にて差分算出され、位相差の信号としてデータ変換装置53に出力される。
データ変換装置53は、入力される振幅レベル差及び位相差の信号を、周波数成分f[Hz]〜fn−1[Hz]ごとに音像方向の角度θ[rad]〜θn−1[rad]の情報に変換する。任意の周波数fにおける音像方向の角度θの情報は、頭部伝達関数データベース6にあらかじめ記録された音像方向の角度θにおける頭部伝達関数データ(振幅レベル値及び位相の値)とともに、データ並べ替え器54に出力され、頭部伝達関数データが周波数軸上に並べられた合成頭部伝達関数として出力される。
前記合成頭部伝達関数は、周波数軸−時間軸変換器(逆FFT)55にて、逆フーリエ変換され、観測時間窓における合成頭部インパルス応答として出力される。
比較マイクロホン5bから取得された音響信号についても、比較マイクロホン5aから取得された音響信号と同様の処理により、観測時間窓における合成頭部インパルス応答として出力される。
これらの合成頭部インパルス応答は、畳み込み器56にて参照マイクロホン4にて収音された基準信号に畳み込まれ、前記2チャネルのバイノーラル信号が合成される。
以上、図7を用いて、信号処理部2を電気回路要素により構成した場合の一例を説明したが、市販のパーソナルコンピュータをハードウエア資源として用い、このパーソナルコンピュータに、後述する本発明のプログラムをインストールすることで、前記信号処理部2を電気回路要素により構成した場合と同様の信号処理を実行することができる。
信号処理部2として、このコンピュータを用いた構成とすれば、手持ちのハードウエア資源を有効に活用することができ、安価に前記収音再生装置を構築することができる。
<音響再生部>
音響再生部3は、前記2チャネルのバイノーラル信号をステレオ音響として再生する。
音響再生部3としては、例えば、前記2チャネルのバイノーラル信号をDA変換して、それぞれの信号を独立して出力するステレオ受話器7を有して構成される(図1参照)。
<その他の部材>
前記その他の部材としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、記録部、角度センサ等が挙げられる。
−記録部−
前記記録部は、前記バイノーラル信号を記録する。これにより、前記バイノーラル信号を必要に応じて読み出し、その3次元音空間情報を再生することができる。
前記記録部としては、特に制限はなく、目的に応じて適宜選択することができ、公知の記録媒体を適用することができる。
前記収音再生装置としては、前記マイクロホン保持部材の小型化及び軽量化によりハンドリング性に優れるため、前記記録部を更に備えることで、ボイスレコーダ等の携帯記録メディアとしても好適に利用することができる。
−角度センサ−
前記角度センサは、音響再生部3の配置角度の変更を検出し、その変更に係る信号を信号処理部2に出力する。この時、前記音像方向推定手段は、前記角度センサで検出された前記配置角度の変更にしたがい、その推定する音像方向を変更して前記音像方向を推定する。
ここで、音響再生部3としてのステレオ受話器7の装用者が頭部の向きを変えたときに、3次元音空間情報を保持させるための手法について、図8、図9及び図10により説明する。
実生活場面での様々な音源、例えば犬、救急車、電気掃除機などは、聴取者の頭の動きとは関係なく、独立に動いている。また、テレビ、洗濯機、ドアチャイムといった音源は、聴取者の頭が動いても、それに追従して動いたりはしない。これに対し、ヘッドホンから提示される信号の音像は、聴取者の頭の動きに同調して動いてしまう。
一般に擬似頭を用いてバイノーラル録音された信号は、ヘッドホンを介して提示されるため、図8に示すように、ヘッドホンの装用者が頭部を動かしてしまうと、知覚される音像の方向が狂ってしまう。この図8は、擬似頭10に対し左30度の方向に音源がある場合について示したものである。左上段に示すようにヘッドホン装用者が正面を向いていれば、仮想音源も左30度方向に知覚されるので問題はない。
しかし、左下段のようにヘッドホン装用者が頭部を右に60度回転させると、仮想音源も頭が回転した方向に動いてしまう。頭外にある音源が聴取者の頭の動きに合わせて動くというのは、現実場面では殆ど考えられないことであり、非常に不自然である。
この問題を回避する手段として、ヘッドホンの回転をセンサにて検知することでヘッドホン装用者の頭部の向きの変化を検出し、それに追従させるように擬似頭も回転させる方法が提案されている(非特許文献2)。ヘッドホン装用者の頭部の回転に追従して擬似頭を回転させる方法は、テレヘッド方式と呼ばれている。
この方式では、図9に示すように、ヘッドホンの回転を角度センサ11で検出し、テレヘッド12がヘッドホンの回転に追従して回転する。このため、ヘッドホン装用者が頭部を回転させても、頭外にある仮想音像の方向は変化せず、自然な音像定位が実現される。
しかし、テレヘッド方式を実現するには、ヘッドホンの回転を検出させる機構だけでなく、擬似頭を回転させるためのモータや、モータを駆動させる電力が必要となる。
これに対し、前記角度センサ及び前記音像方向推定手段を用いた手法によれば、基本的な構成に、ステレオ受話器7の回転を検出する機構を加えるだけで、後はすべて信号処理だけでテレヘッド方式と同様の効果を生み出すことが可能である。
信号処理部2では、すでに述べた通り、基準信号と比較信号の位相差及び振幅レベル差を手掛かりとして、周波数ごとの音像方向を推定し、推定された音像方向に基づいて時変の合成頭部伝達関数を算出し、バイノーラル信号を合成している。ここで、音像方向を表す角度の基準となる0度方向は、信号処理部2で、便宜的に決めればよいだけである。
図10に示すように、ステレオ受話器7が回転した場合、参照マイクロホン4や比較マイクロホン5a,5bを回転させるのではなく、当該回転角度分だけ、信号処理部2上の0度方向を回転させればよい。具体的には、ステレオ受話器がθ[rad]だけ回転したなら、信号処理部2で推定された音像方向からθ[rad]を算術的に減算するだけで済む。
図10の例では、もともと−30度方向に音源があった。角度センサ11によってステレオ受話器が60度回転したことが検出されれば、もともとの推定音像方向である−30度から60度を減算し、あらたな音像方向−90度が容易に求められる。このようにマイクロホンを回転させる必要がないので、モータもモータを駆動する電力も不要である。
更に、テレヘッド自体を回転させる方式では、同時に複数のヘッドホン装用者の頭部回転に対応したバイノーラル信号を得るには、ヘッドホン装用者の人数分、個別のテレヘッドを用意し、それを各ヘッドホン装用者の頭部の回転に合わせて回転させなくてはならないのに対し、本発明を用いると、信号処理のプログラムを並列に複数実行させることによって、1個の収音装置で、複数の聴取者に、個別のバイノーラル信号を提示することも可能である。これは、アミューズメント施設などでオーディオビジュアルコンテンツを同時に複数の視聴者に提示する場合などに有効と考えられる。
前記収音再生装置は、音響収音部1の参照マイクロホン4及び比較マイクロホン5a,5bを水中音響収音用のハイドロホンとして構成することにより、水中でのバイノーラル録音に応用することが可能となる。
水中での音速は、およそ1,500m/sであり、空中での音速(約340m/s)の約4.4倍である。これは、同じ周波数の音波の水中における波長が空中に比べて約4.4倍になることを示す。
したがって、水中でバイノーラル録音を行うには、例えば、前記マイクホロン保持部材として擬似頭を用いる場合、標準的な擬似頭の4倍から5倍の大きさの擬似頭を用いる必要がある。この場合、従来法によれば、直径が70cmを超える大きさの擬似頭が必要になる。
しかし、参照マイクロホンと比較マイクロホンを用いる前記収音再生装置によれば、空中での使用において1cm〜10cm程度の間隔をもって、これらのマイクロホンを配置すればよいので、水中での使用においても、前記各マイクロホンを構成する3個又は4個のハイドロホンを最大でも互いに50cmほどの間隔で2次元的又は3次元的に配置するだけでよい。
即ち、図11に示すように、前記収音再生装置を空中で利用する場合の前記各マイクロホンの配置間隔をn[mm]とするなら、水中で利用する場合、ハイドロホンの間隔は、n×4.4[mm]程度となる。
したがって、前記収音再生装置を水中音響の収音再生に用いる場合、音波の波長が水中では、空中の4倍〜5倍であることに合わせて、参照マイクロホン4及び比較マイクロホン5a,5bからなる各ハイドロホンのそれぞれが、相互に4cm〜50cmの距離を隔てた状態で2次元的に保持されるように構成すればよい(図11参照)。なお、実用上は、前記距離を10cmから20cm程度とすれば十分である。
また、収音された信号からバイノーラル信号を合成する信号処理方法は、空中での音波を対象とする場合とまったく同じでよい。
したがって、低価格にて水中の音を立体的に聞かせることが可能となり、海底探査や転覆した船舶内での音源探査への応用が期待できる。
図1、図3、図4、図10及び図11の説明では、わかりやすくするため、比較マイクロホンの数を2個としているが、比較マイクロホンを3個とし、3次元に配置すれば、水平方向だけでなく仰角方向も含めて、より高い精度で音像方向を推定できることは容易に予測できるだろう。本発明における一実施形態を示したが、本発明は、ここで説明した形態に限定されるものではなく、基本的な構成、方法が守られていれば、その他の点については適宜変更することが可能である。
(プログラム)
本発明のプログラムは、前記信号処理部が前記コンピュータで構成される前記収音再生装置に用いられ、前記信号処理部に対し、バイノーラル信号の合成を実行させる。
即ち、前記プログラムは、前記信号処理部としての前記コンピュータに対し、前記音響信号を逐次周波数分析する周波数分析処理と、前記参照マイクロホンを通じて取得される前記音響信号を基準信号とし、前記比較マイクロホンから取得される前記音響信号を比較信号としたとき、逐次周波数分析された前記音響信号に対し、その周波数成分ごとに前記基準信号と前記比較信号の位相差及び振幅レベル差を算出する差分算出処理と、前記位相差及び振幅レベル差から前記周波数成分ごとの音像方向を推定する音像方向推定処理と、前記推定された周波数成分ごとの音像方向にしたがい、前記頭部伝達関数データベースから前記推定された周波数成分ごとの前記頭部伝達関数データを読み出し、時変の合成頭部伝達関数を算出する合成頭部伝達関数算出処理と、前記合成頭部伝達関数を前記基準信号に付加することにより、前記2チャネルのバイノーラル信号を合成するバイノーラル信号合成処理を実行させる。
また、前記収音再生装置が前記角度センサを有する場合、前記音像方向推定処理を、前記角度センサで検出された前記配置角度の変更にしたがい、その推定する方向を変更して前記音像方向を推定することとして、前記信号処理部に実行させる。
(収音再生方法)
本発明の収音再生方法は、音響収音ステップと、信号処理ステップと、音響再生ステップとを有し、更に必要に応じて、角度変更検出ステップを有する。
前記音響収音ステップでは、1個の参照マイクロホンと、2個又は3個の比較マイクロホンから音響を収音する。
この音響収音ステップとしては、本発明の前記収音再生装置における前記音響収音部により、実施することができる。
前記信号処理ステップでは、前記収音された音響の音響信号と、人の頭部による音の振幅レベル及び位相に対する影響を周波数の関数として表現した頭部伝達関数データを前記音の到来方向ごとに記録した頭部伝達関数データベースから2チャネルのバイノーラル信号を合成する。
具体的には、前記信号処理ステップでは、前記音響信号を逐次周波数分析する逐次周波数分析処理と、前記参照マイクロホンを通じて取得される音響信号を基準信号とし、前記比較マイクロホンから取得される音響信号を比較信号としたとき、逐次周波数分析された前記音響信号に対し、その周波数成分ごとに前記基準信号と前記比較信号の位相差及びレベル差を算出する差分算出処理と、前記位相差及びレベル差から前記周波数成分ごとの音像方向を推定する音像方向推定処理と、前記推定された音像方向にしたがい、前記頭部伝達関数データベースから前記頭部伝達関数データを読み出し、時変の合成頭部伝達関数を算出する合成頭部伝達関数算出処理と、前記合成頭部伝達関数を前記基準信号に付加することにより前記2チャネルのバイノーラル信号を合成するバイノーラル信号合成処理と、を実行する。
前記信号処理ステップとしては、本発明の前記収音再生装置における前記信号処理部及び前記頭部伝達関数データベースにより実施することができる。
前記音響再生ステップでは、前記2チャネルのバイノーラル信号を音響として再生する。この音響再生ステップとしては、本発明の前記収音再生装置における前記音響再生部により実施することができる。
前記角度変更検出ステップは、音響再生ステップを実行する音響再生部の配置角度の変更を検出する。この場合、前記音像方向推定処理では、前記角度変更検出ステップで検出された前記配置角度の変更にしたがい、その推定する音像方向を変更して前記音像方向を推定する。この角度変更検出ステップとしては、本発明の前記収音再生装置における前記角度センサにより実施することができる。
以下に、一般的なステレオ録音方法により録音した場合と、本発明の収音再生装置によりバイノーラル録音した場合とで、実際上のどのような相違が確認されるかについて説明する。
左方向から提示した音声をステレオ録音した信号のパワースペクトルを図12に示す。全体的に右チャネルに比べて左チャネルの振幅レベルがわずかに高いこと以外、スペクトルの形状に明確な差は認められない。
同じ音声を本発明の収音再生装置による音響収音部にて収音し、収音された信号をもとに信号処理部にて合成したバイノーラル信号のパワースペクトルを図13に示す。頭部伝達関数の影響が加わっているため、単純なステレオ信号(図12)とは明らかにスペクトル形状が異なる。更に、右チャネルと左チャネルの信号に振幅レベル差だけではなく、5kHzから10kHz付近などに、スペクトル形状の差が認められる。これは、左方向から到来する音に対する頭部伝達関数が左右で明確に異なるためであり、図13は、信号処理によってその違いが再現されていることを示すものである。
1 音響収音部
2 信号処理部
3 音響再生部
4,4’ 参照マイクロホン
5a,5a’ 比較マイクロホン(左)
5b,5b’ 比較マイクロホン(右)
6 頭部伝達関数データベース
7 ステレオ受話器
8 小型擬似頭
9a 耳介(左)
9b 耳介(右)
10 擬似頭
11 角度センサ
12 テレヘッド
50,50’ 時間窓
51,51’ 時間軸−周波数軸変換器(FFT)
52,52’ 減算器
53 データ変換装置
54 データ並べ替え器
55 周波数軸−時間軸変換装置(逆FFT)
56 畳み込み器
特開平7−231500号公報 特開2009−200569号公報 特開2010− 25802号公報
坂本 修一,小玉 純一,本郷 哲,岡本 拓磨,岩谷 幸雄,鈴木 陽一,252ch等密度球状アレイを用いた3次元音場情報取得システム,電子情報通信学会技術研究報告,EA2010−46, 2010 Toshima I.,Uematsu H.,and Hirahara T.,A steerable dummy head that tracks three−dimentional head movement:TeleHead,Acoustical Science and Technology,24,327−329,2003

Claims (11)

  1. 1個の参照マイクロホンと2個又は3個の比較マイクロホンとを有する音響収音部と、
    人の頭部による音の振幅レベル及び位相に対する影響を周波数の関数として表現した頭部伝達関数データを前記音の到来方向ごとに記録した頭部伝達関数データベースと、
    前記音響収音部で収音され、時間ごとに区切られた音響信号と前記頭部伝達関数データから2チャネルのバイノーラル信号を合成する信号処理部と、
    前記2チャネルのバイノーラル信号を音響として再生する音響再生部と、を有し、
    前記信号処理部は、前記音響信号を逐次周波数分析する周波数分析手段と、
    前記参照マイクロホンを通じて取得される前記音響信号を基準信号とし、前記比較マイクロホンから取得される前記音響信号を比較信号としたとき、逐次周波数分析された前記音響信号に対し、その周波数成分ごとに前記基準信号と前記比較信号の位相差及び振幅レベル差を算出する差分算出手段と、
    前記位相差及び振幅レベル差から前記周波数成分ごとの音像方向を推定する音像方向推定手段と、
    前記推定された周波数成分ごとの音像方向にしたがい、前記頭部伝達関数データベースから前記推定された周波数成分ごとの前記頭部伝達関数データを読み出し、前記周波数成分ごとの前記頭部伝達関数データが周波数軸上に並べられた前記時間ごとにおける合成頭部伝達関数を算出する合成頭部伝達関数算出手段と、
    前記合成頭部伝達関数を前記基準信号に付加することにより、前記2チャネルのバイノーラル信号を合成するバイノーラル信号合成手段と、を有することを特徴とする収音再生装置。
  2. バイノーラル信号を記録する記録部を有する請求項1に記載の収音再生装置。
  3. 音響再生部の配置角度の変更を検出し、その変更に係る信号を信号処理部に出力する角度センサを有し、
    音像方向推定手段は、前記角度センサで検出された前記配置角度の変更にしたがい、その推定する音像方向を変更して前記音像方向を推定する請求項1から2のいずれかに記載の収音再生装置。
  4. 音響収音部が、参照マイクロホン及び2個又は3個の比較マイクロホンを保持するマイクロホン保持部材を有し、
    前記参照マイクロホン及び前記比較マイクロホンのそれぞれが、相互に1cm〜10cmの距離を隔てた状態で保持される請求項1から3のいずれかに記載の収音再生装置。
  5. 音響収音部が、参照マイクロホン及び2個又は3個の比較マイクロホンを保持するマイクロホン保持部材を有し、
    前記参照マイクロホン及び前記比較マイクロホンが水中音響収音用のハイドロホンとして構成され、
    前記各ハイドロホンのそれぞれが、相互に4cm〜50cmの距離を隔てた状態で保持される請求項1から3のいずれかに記載の収音再生装置。
  6. マイクロホン保持部材が、少なくとも耳介部と外耳道部を有し、頭部を模擬しているが、前記頭部に比べて小さい大きさの擬似頭であり、
    比較マイクロホンのうち少なくとも2個が、各々前記外耳道部に配され、参照マイクロホンが前記比較マイクロホンに対して、距離を隔てて前記擬似頭に配される請求項4から5のいずれかに記載の収音再生装置。
  7. 信号処理部がパーソナルコンピュータで構成される請求項1から6のいずれかに記載の収音再生装置。
  8. 信号処理部において合成されたバイノーラル信号を音響再生部に送信する無線インターフェースを有する請求項1から7のいずれかに記載の収音再生装置。
  9. 請求項7に記載の収音再生装置に用いられ、
    信号処理部に対し、バイノーラル信号の合成を実行させることを特徴とするプログラム。
  10. 1個の参照マイクロホンと2個又は3個の比較マイクロホンから音響を収音する音響収音ステップと、
    前記収音された音響の時間ごとに区切られた音響信号と人の頭部による音のレベル及び位相に対する影響を周波数の関数として表現した頭部伝達関数データを前記音の到来方向ごとに記録した頭部伝達関数データベースとから2チャネルのバイノーラル信号を合成する信号処理ステップと、
    前記2チャネルのバイノーラル信号を音響として再生する音響再生ステップと、を有し、
    前記信号処理ステップは、前記音響信号を逐次周波数分析する逐次周波数分析処理と、
    前記参照マイクロホンを通じて取得される前記音響信号を基準信号とし、前記比較マイクロホンから取得される前記音響信号を比較信号としたとき、逐次周波数分析された前記音響信号に対し、その周波数成分ごとに前記基準信号と前記比較信号の位相差及び振幅レベル差を算出する差分算出処理と、
    前記位相差及び振幅レベル差から前記周波数成分ごとの音像方向を推定する音像方向推定処理と、
    前記推定された周波数成分ごとの音像方向にしたがい、前記頭部伝達関数データベースから前記推定された周波数成分ごとの前記頭部伝達関数データを読み出し、前記周波数成分ごとの前記頭部伝達関数データが周波数軸上に並べられた前記時間ごとにおける合成頭部伝達関数を算出する合成頭部伝達関数算出処理と、
    前記合成頭部伝達関数を前記基準信号に付加することにより前記2チャネルのバイノーラル信号を合成するバイノーラル信号合成処理と、を実行することを特徴とする収音再生方法。
  11. 音響再生ステップを実行する音響再生部の配置角度の変更を検出する角度変更検出ステップを有し、
    音像方向推定処理は、前記角度変更検出ステップで検出された前記配置角度の変更にしたがい、その推定する音像方向を変更して前記音像方向を推定する請求項10に記載の収音再生方法。
JP2011139835A 2011-06-23 2011-06-23 収音再生装置、プログラム及び収音再生方法 Active JP5867799B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011139835A JP5867799B2 (ja) 2011-06-23 2011-06-23 収音再生装置、プログラム及び収音再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011139835A JP5867799B2 (ja) 2011-06-23 2011-06-23 収音再生装置、プログラム及び収音再生方法

Publications (2)

Publication Number Publication Date
JP2013009112A JP2013009112A (ja) 2013-01-10
JP5867799B2 true JP5867799B2 (ja) 2016-02-24

Family

ID=47676117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011139835A Active JP5867799B2 (ja) 2011-06-23 2011-06-23 収音再生装置、プログラム及び収音再生方法

Country Status (1)

Country Link
JP (1) JP5867799B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6569945B2 (ja) * 2016-02-10 2019-09-04 日本電信電話株式会社 バイノーラル音生成装置、マイクロホンアレイ、バイノーラル音生成方法、プログラム
JP2019528626A (ja) * 2016-08-18 2019-10-10 サウンド6デー エス.アール.エル. スピーカーを組み込んだヘッド支持体および多次元音響効果を再生するためのシステム
WO2021212287A1 (zh) * 2020-04-20 2021-10-28 深圳市大疆创新科技有限公司 音频信号处理方法、音频处理装置及录音设备
CN115240678B (zh) * 2022-09-21 2022-12-09 深圳市英特飞电子有限公司 一种智能语音识别装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03257331A (ja) * 1990-03-08 1991-11-15 Hitachi Zosen Corp 音響信号検出装置
JP3433513B2 (ja) * 1994-06-17 2003-08-04 ソニー株式会社 回転角度検出機能を備えたヘッドホン装置
JPH09191500A (ja) * 1995-09-26 1997-07-22 Nippon Telegr & Teleph Corp <Ntt> 仮想音像定位用伝達関数表作成方法、その伝達関数表を記録した記憶媒体及びそれを用いた音響信号編集方法
JP3435141B2 (ja) * 2001-01-09 2003-08-11 松下電器産業株式会社 音像定位装置、並びに音像定位装置を用いた会議装置、携帯電話機、音声再生装置、音声記録装置、情報端末装置、ゲーム機、通信および放送システム
JP4193041B2 (ja) * 2002-01-31 2008-12-10 学校法人 芝浦工業大学 3次元インテンシティプローブ、同プローブを用いた3次元音源方向検知装置及び3次元音源方向対面制御装置
JP2007221445A (ja) * 2006-02-16 2007-08-30 Sharp Corp サラウンドシステム
JP4670682B2 (ja) * 2006-02-28 2011-04-13 日本ビクター株式会社 オーディオ装置及び指向音生成方法

Also Published As

Publication number Publication date
JP2013009112A (ja) 2013-01-10

Similar Documents

Publication Publication Date Title
EP3320692B1 (en) Spatial audio processing apparatus
JP4051408B2 (ja) 収音・再生方法および装置
US8855341B2 (en) Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
KR101547035B1 (ko) 다중 마이크에 의한 3차원 사운드 포착 및 재생
US9237398B1 (en) Motion tracked binaural sound conversion of legacy recordings
KR100606734B1 (ko) 삼차원 입체음향 구현 방법 및 그 장치
CA2295092C (en) System for producing an artificial sound environment
CN106134223A (zh) 重现双耳信号的音频信号处理设备和方法
CN104756526A (zh) 信号处理装置、信号处理方法、测量方法及测量装置
JP2006519406A5 (ja)
CN102325298A (zh) 音频信号处理装置和音频信号处理方法
JP5867799B2 (ja) 収音再生装置、プログラム及び収音再生方法
CN110890100A (zh) 语音增强、多媒体数据采集、播放方法、装置及监控***
WO2021212287A1 (zh) 音频信号处理方法、音频处理装置及录音设备
KR101111734B1 (ko) 복수 개의 음원을 구분하여 음향을 출력하는 방법 및 장치
JP5163685B2 (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
JP2017028494A (ja) 音場収音再生装置、その方法及びプログラム
Fan et al. Practical implementation and analysis of spatial soundfield capture by higher order microphones
Crutchfield et al. Whales in Space: Experiencing Aquatic Animals in Their Natural Place with the Hydroambiphone
WO2021059983A1 (ja) ヘッドホン、頭外定位フィルタ決定装置、頭外定位フィルタ決定システム、頭外定位フィルタ決定方法、及びプログラム
Geronazzo Sound Spatialization.
JPWO2008126343A1 (ja) 収音方法および装置
JP6027873B2 (ja) インパルス応答生成装置、インパルス応答生成システム及びインパルス応答生成プログラム
Zotkin et al. Signal processing for Audio HCI
JP4956722B2 (ja) 音空間再合成提示システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151224

R150 Certificate of patent or registration of utility model

Ref document number: 5867799

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250