JPWO2017183462A1 - 信号処理装置 - Google Patents

信号処理装置 Download PDF

Info

Publication number
JPWO2017183462A1
JPWO2017183462A1 JP2018513104A JP2018513104A JPWO2017183462A1 JP WO2017183462 A1 JPWO2017183462 A1 JP WO2017183462A1 JP 2018513104 A JP2018513104 A JP 2018513104A JP 2018513104 A JP2018513104 A JP 2018513104A JP WO2017183462 A1 JPWO2017183462 A1 JP WO2017183462A1
Authority
JP
Japan
Prior art keywords
output
speaker
signal
transfer function
side speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018513104A
Other languages
English (en)
Other versions
JP6863370B2 (ja
Inventor
一任 阿部
一任 阿部
宮阪 修二
修二 宮阪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Socionext Inc
Original Assignee
Socionext Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Socionext Inc filed Critical Socionext Inc
Publication of JPWO2017183462A1 publication Critical patent/JPWO2017183462A1/ja
Application granted granted Critical
Publication of JP6863370B2 publication Critical patent/JP6863370B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • H04R3/14Cross-over networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

信号処理装置(1)は、X側およびY側(Xは左および右の一方、Yは左および右の他方)の2つのスピーカ(111、112)が配置された歪な音響空間内で入力の音声信号に対するクロストークキャンセル処理を行う信号処理装置(1)であって、リスナーのY側の耳で該音声信号が概ね打ち消されるように2つのスピーカ(111、112)からの出音を制御する制御部(103)を有し、Y側のスピーカとY側の耳との間の伝達関数をGYY、X側のスピーカとY側の耳との間の伝達関数をGXY、GYYをGXYで除して得られる伝達関数をGCYとしたとき、制御部(103)は、Y側のスピーカから該音声信号を出音するように制御し、X側のスピーカから該音声信号を伝達関数GCYで処理した信号を出音するように制御する。

Description

本開示は、クロストークキャンセラを搭載した信号処理装置に関する。
映画や音楽のみでなく、ゲームにおいても、5.1chや7.1chなどのマルチチャネルのオーディオ信号が普及している。受聴者を取り囲む所定の位置に配置されたマルチチャネルスピーカを用いて再生すると、臨場感あるオーディオ再生が実現される。しかし、一般的な家庭では5.1chや7.1chのマルチチャネルスピーカを設置することが場所的に困難な場合も多い。そこで、従来のステレオスピーカで疑似的にマルチチャネルオーディオ再生と同様な効果を実現する3D音響技術が開発されている。
たとえば、特許文献1は、立体音場処理により任意の位置に音像を定位させる音像定位装置を開示している。また、特許文献2は、音像を広げて再生する音響信号再生装置を開示している。
特開平8−182100号公報 特開2006−303799号公報
ところで、特許文献1に記載されているようなクロストークキャンセル処理は、歪な音響空間では、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象が起こり得るという問題がある。
ここで、クロストークキャンセル処理とは、リスナーの一方の耳で音声信号が概ね打ち消されるように2つのスピーカからの出音を制御することをいう。また、歪な音響空間とは、例えば2つのスピーカの配置がリスナーに対して対称でないような音響空間をいう。具体的には、車室の左右のドアに埋め込まれた2つスピーカと運転席(または助手席)のリスナーとの関係は、歪な音響空間の一例である。
本開示は、歪な音響空間でも適切なクロストークキャンセル処理を実現する信号処理装置を提供することを目的とする。
上記の課題を解決するために、本開示の一形態における信号処理装置は、X側およびY側(Xは左および右の一方、Yは左および右の他方)の2つのスピーカが配置された左右が歪な音響空間内で入力の音声信号Aに対するクロストークキャンセル処理を行う信号処理装置であって、リスナーのY側の耳で該音声信号Aが概ね打ち消されるように前記2つのスピーカからの出音を制御する制御部を有し、Y側のスピーカとY側の耳との間の伝達関数をGYY、X側のスピーカとY側の耳との間の伝達関数をGXY、前記GYYを前記GXYで除して得られる伝達関数をGCYとしたとき、前記制御部は、Y側のスピーカから該音声信号Aを出音するように制御し、X側のスピーカから該音声信号AをGCYで処理した信号を出音するように制御する。
この構成によれば、歪な音響空間内において、クロストークキャンセラのゲインを大きくせずにクロストークをキャンセルすることが可能となる。従って、歪な音響空間においても、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象を低減することができる。つまり、適切なクロストークキャンセル処理を実現することができる。
また、前記制御部は、さらに音声信号を複数の周波数帯域信号F(n)に変換し(nは周波数帯域を示すインデックス)、前記nごとに、Y側のスピーカとY側の耳の間の伝達関数をGYY(n)、X側のスピーカとY側の耳の間の伝達関数をGXY(n)、前記GYY(n)を前記GXY(n)で除して得られる伝達関数をGCY(n)、前記GXY(n)を前記GYY(n)で除して得られる伝達関数をGCX(n)、としたとき、前記制御部は、前記nごとに前記GYY(n)と前記GXY(n)とのゲインを比較し、前記GXY(n)のゲインが前記GYY(n)のゲインより大きい場合には、Y側のスピーカから前記F(n)を出音するように制御し、X側のスピーカから該F(n)を前記GCY(n)で処理した信号を出音するように制御し、前記GYY(n)のゲインが前記GXY(n)のゲインより大きい場合には、X側のスピーカから前記F(n)を出音するように制御し、Y側のスピーカから該F(n)を前記GCX(n)で処理した信号を出音するように制御する。
これにより、音響空間の歪さを周波数帯ごとに判定し、音声信号とそのキャンセル音をどちらのスピーカから再生するか、周波数帯ごとに最適に設定する(つまり、周波数帯ごとに小さいゲインに対応するスピーカを選択する)ことができるため、さまざまな音響空間の特性に最適なクロストークキャンセラを適用することが可能となる。
また、前記信号処理装置は、さらに入力した音声信号を遅延する遅延部を備え、前記遅延部の遅延時間は、X側スピーカからの出音とY側スピーカからの出音との間の因果性を満たすよう遅延時間を設定できることを特徴とする。
これにより、設計された伝達関数が時間進み成分を持つ因果性を満たさないものであったとしても、遅延部の遅延時間により因果性をたすことが可能となる。
本開示によれば、音響的に歪な音響空間においても、クロストークをキャンセルするための制御音のゲインを小さく抑えることができ、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象をより確実に低減し、音響特性の変動に強いクロストークキャンセルを実現することができる。
図1は、実施の形態1における信号処理装置の構成例およびスピーカと、受聴者とを示す図である。 図2Aは、左右非対称のスピーカ配置における音響特性のインパルス応答計測例を示す図である。 図2Bは、図2Aのインパルス応答計測例の周波数特性を示す図である。 図2Cは、設計したクロストークキャンセラの周波数特性例を示す図である。 図3Aは、実施の形態2における信号処理装置の構成例およびスピーカと、受聴者とを示す図である。 図3Bは、実施の形態2におけるクロストークキャンセラの詳細設計例を示す説明図である。 図4Aは、実施の形態2における左右非対称のスピーカ配置におけるインパルス応答計測例を示す図である。 図4Bは、実施の形態2における図4Aのインパルス応答計測例の周波数特性を示す図である。 図4Cは、実施の形態2において設計したクロストークキャンセラの周波数特性例を示す図である。 図5は、実施の形態2における遅延処理部を設けた信号処理装置の構成例およびスピーカと、受聴者とを示す図である。 図6Aは、実施の形態2において設計したクロストークキャンセラのインパルス応答例を示す図である。 図6Bは、実施の形態2において時間進みを考慮して設計したクロストークキャンセラのインパルス応答例を示す図である。 図7は、実施の形態3における信号処理装置の構成例およびスピーカと、受聴者とを示す図である。 図8は、比較例におけるクロストークキャンセラを含む信号処理装置およびスピーカの構成例と、受聴者とを示す図である。 図9Aは、図8のような左右対称のスピーカ配置におけるインパルス応答の計測例を示す図である。 図9Bは、図9Aのインパルス応答の周波数特性を示す図である。 図9Cは、設計したクロストークキャンセラの周波数特性例を示す図である。 図10は、車室内に設置されたクロストークキャンセラを含む信号処理装置およびスピーカ周辺の構成例と、受聴者とを示す図である。 図11Aは、図10のような左右非対称のスピーカ配置におけるインパルス応答の計測例を示す図である。 図11Bは、図11Aのインパルス応答の周波数特性を示す図である。 図11Cは、設計したクロストークキャンセラの周波数特性例を示す図である。 図12Aは、実施の形態4において、nごとに設計した伝達関数XCL(n)、XCR(n)の一例を示す図である。 図12Bは、実施の形態4の変形例において、拡張バンドごとに設計した伝達関数XCL(n)、XCR(n)の一例を示す図である。 図13は、クリティカルバンドの一例を示す図である。
(本開示の基礎となった知見)
本発明者は、「背景技術」の欄において記載した、クロストークキャンセル処理に関し、以下の問題が生じることを見出した。この点について、比較例を示す図8〜図11Cを用いて説明する。
ステレオスピーカを用いた3D音響技術においては、クロストークキャンセラを用いることが一般的である。クロストークキャンセラとは、受聴者の左に設置されたスピーカから受聴者の右耳に到達する音を、受聴者の右に設置されたスピーカから発せられる制御音によってキャンセルする(もしくは、逆に、右に設置されたスピーカから左耳に到達する音をキャンセルする)ように設計された信号処理装置である。
まず、図8を用いてステレオスピーカを用いたクロストークキャンセラの原理を説明する。図8は、比較例におけるクロストークキャンセラ801を含む信号処理装置8およびスピーカの構成例と受聴者100とを示す図である。この信号処理装置8は、クロストークキャンセラ801を備え、スピーカ111およびスピーカ112に接続される。なお、本明細書の説明で特に記載のない場合、変数は全て周波数領域に変換された値とする。また、左のスピーカ111から受聴者100の左耳元101、右耳元102への伝達関数をGLL、GLR、右のスピーカ112から受聴者100の左耳元101、右耳元102への伝達関数をGRL、GRRと呼ぶこととする。また、受聴者100とは、実際に再生された音を聞く人であるが、より平均的な頭部形状をもつ音響計測用マネキン(ダミーヘッド)などでもよい。また、左のスピーカ111、右のスピーカ112は、受聴者100の耳元を含む水平面上に、受聴者100の正面に対して左側、右側に設置されているスピーカのことを呼ぶが、必ずしもそれに限らず、前記水平面上になくてもよい。
図8において、ステレオスピーカであるスピーカ111およびスピーカ112を用いて受聴者100の左耳元101および右耳元102で得られる信号を制御する。なお、耳元とは受聴者の外耳道入口付近を示すが、鼓膜位置など、音響特性を収録する耳付近のどこでもよい。
ここでは信号Aを入力し、左耳元101には音が到達し、右耳元102には0(つまり音が到達しない状態)を実現する。つまり、スピーカ111から右耳元102への音漏れ(クロストーク)をキャンセルする。これを、クロストークキャンセラ801を用いて実現する。クロストークキャンセラ801の伝達関数をXCとする。スピーカ111およびスピーカ112から左耳元101および右耳元102までの音響伝達関数をそれぞれGLL、GLR、GRL、GRRとすると、右耳元102にて0を得るためには、(式1)を満たす必要がある。
(GLR+XC*GRR)*A=0・・・(式1)
つまり、クロストークキャンセラ801の伝達関数XCは(式2)で実現される。
XC=−GLR/GRR・・・(式2)
このように設計されたクロストークキャンセラ801を用いて処理された信号をスピーカ111、112で再生することで、受聴者100の左耳元101にのみ信号Aの音が到達し、右耳元102には音が到達しない状態が実現される。
ここで、図8のように、受聴者に対して、スピーカ111およびスピーカ112が左右対称の配置にある場合、左のスピーカ111と右耳元102の間の距離が、右のスピーカ112と右耳元102との間の距離より長い。また、右耳元102から右のスピーカ112は見通せるが左のスピーカ111は見通せない位置にあり左のスピーカ111から右耳元102への音は回り込んだ音となる。これらのことから、GLRとGRRとのゲインを比較すると|GLR|<|GRR|となる。クロストークキャンセラ801の伝達関数XCのゲインも|XC|<1となる。つまり、本来聞かせたい左のスピーカ111から再生される音より、右のスピーカ112から再生されるキャンセル音(つまり制御音)の方のゲインが小さくなり、特に問題は生じない。言い換えれば、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象が起こらない。
受聴者に対して、スピーカ111およびスピーカ112が左右対称の配置にある場合の、伝達関数に関する具体的な計測例を図9A〜図9Cに示す。図9Aは、図8のような左右対称のスピーカ配置におけるインパルス応答の計測例を示す図である。図9Aの上段は右のスピーカ112と右耳元102との間のインパルス応答で、下段が左のスピーカ111と右耳元102との間のインパルス応答を示す。グラフの横軸は時刻に相当するサンプル数で、縦軸は振幅を示す。図9Aをみるとわかるように、右のスピーカ112−右耳元102間のインパルス応答のほうが左のスピーカ111−右耳元102間のインパルス応答より振幅が大きくなっている。これは、右のスピーカ112−右耳元102間のほうが、左のスピーカ111−右耳元102間より距離も短く、かつ、右耳元102から右のスピーカ112を見通すことができるからであると思われる。図9Bは、図9Aのインパルス応答の周波数特性を示す図である。つまり、図9Aの上段および下段のインパルス応答特性曲線のそれぞれをフーリエ変換で周波数領域に変換したものを図9Bに示す。横軸は周波数、縦軸はゲインをdBで表示したものである。実線がGRR、点線がGLRを示す。周波数ごとにみても、GRRのほうがGLRより大きくなっていることがわかる。このGLR、GRRから、周波数ごとにクロストークキャンセラ801の伝達関数XCを算出したものが図9Cの実線である。つまり、図9Cは、設計したクロストークキャンセラ801の周波数特性例を示す図である。すべての周波数においてクロストークキャンセラ801の伝達関数XCのゲインは点線で示した0dBの値(SPL(Sound Pressure Level)出力)より小さな値をとっている。左のスピーカ111出力より右のスピーカ112出力のほうが小さな制御音を出力することがわかる。つまり、聞かせたい耳側のスピーカから聞かせたい音を再生し、聞かせたくない耳側のスピーカからクロストークをキャンセルする制御音を再生しており、クロストークをキャンセルする信号は聞かせたい信号より小さな音でよいことがわかる。したがって、左右対称なスピーカ配置の場合は、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象が起こらない。
以上が図8のような左右対称なスピーカ配置の場合であったが、例えば車室内などのような、受聴者からみてスピーカ配置が左右対称ではない音環境においては状況が異なる。図10に車室内を模した図を示す。図10は、車室内に設置されたクロストークキャンセラ1030を含む信号処理装置8およびスピーカ周辺の構成例と、受聴者1000とを示す図である。ここでは、受聴者1000は右側の運転席に座っており、左右のスピーカ1011およびスピーカ1012で音を受聴する場合を例として取り上げる。図10に記載したとおり、車室内には、窓ガラスやドアなどで構成される左右の壁1021、1022が存在し、この壁1021、1022のなかにスピーカ1011、1012が設置されることが多い。また、スピーカ1011、1012は壁1021、1022中の受聴者1000の足元付近に設置される場合が多く、右耳元1002から右のスピーカ1012は見通すことができない場合がある。また、左のスピーカ1011から発せられた音は、右耳元1002に回り込んで到達するが、ガラス面などで構成される壁1022にて反射して右耳元1002に到達する経路もあり、図8のような環境とは異なった特性が得られることが予想される。特にガラス面は音の反射率が高いため、音を減衰させることなくよく反射させることから、距離の遠い左のスピーカ1011から右耳元1002への音のほうが、右のスピーカ1012から右耳元1002への音より大きく伝わる、つまり、|GLR|>|GRR|となる場合がある。このような音響系で、図10で構成されるクロストークキャンセラ1030の伝達関数XCを設計すると、そのゲインは|XC|>1となる。また、右のスピーカ1012から右耳元1002が見通せないことから、その間の音響特性を示す伝達関数GRRは、直接音成分が弱く、相対的に反射音成分が多く存在することになる。このような場合、|GRR|が非常に小さくなる周波数特性のディップが生じるが、これもクロストークキャンセラ1030のゲインである|XC|が1より大きくなる要因である。
このように設計されたフィルタで入力信号を処理してクロストークキャンセル処理を実現するには、一般的には、設計したクロストークキャンセラ1030の伝達関数XCを逆フーリエ変換で時間領域に変換し、FIRフィルタなどで入力信号を処理することで実現する。この際、クロストークキャンセラ1030の伝達関数XCのゲイン|XC|がある周波数で大きな値をとるなど、周波数によってXCが急峻な変化をする場合、時間領域では非常に多くのタップ長が必要となり、演算量が大きくなるという課題がある。また、場合によってはタップ長を増やしても収束しない状態(発散する状態)となってしまうこともあり、このような場合、この特性をもつフィルタでの処理を実現することができない。
また、|XC|>1の場合、左のスピーカ1011から再生される本来聞かせたい音と比較して、右のスピーカ1012から、より大きな制御音が再生されることになる。以下ではこのことが制御に及ぼす影響について説明する。左のスピーカ1011、右のスピーカ1012と受聴者の左耳元1001、右耳元1002との間の音響特性は、さまざまな要因で変動する。例えば、左のスピーカ1011、右のスピーカ1012と左耳元1001、右耳元1002との間の音響伝達関数の計測位置と、受聴者1000が受聴する位置とが異なる場合がある。その際、クロストークキャンセラ1030のゲイン|XC|が大きいと、右のスピーカ1012と右耳元1002間の音響特性が微小に変化した場合の耳元で得られる信号への影響が大きく、右耳元1002で得られる音が0から大きく異なってしまうことが予想される。特に反射音が多く存在する車室内などでは、例えば受聴者の頭部の少しの移動などで反射音の影響で容易に変化するため、右のスピーカ1012と右耳元1002間の音響特性のゲインが小さな値を取る周波数が変化しやすく、その結果、うまく制御できなくなるということになる。
図11A〜図11Cに実際の車室内での伝達関数の計測例を示す。図11Aは、図10のような左右非対称のスピーカ配置(ここでは車室内)におけるインパルス応答の計測例を示す図である。図11Aの上段は右のスピーカ1012から右耳元1002へのインパルス応答、図11Aの下段は左のスピーカ1011から右耳元1002へのインパルス応答を示す。右のスピーカ1012−右耳元1002間と左のスピーカ1011−右耳元1002間のインパルス応答の振幅差に着目すると、図9Aにおける上段と下段の振幅差は大きかったのに対して、図11Aの上段と下段ではほぼ同じくらいの振幅となっていることがわかる。図11Bは、図11Aのインパルス応答の周波数特性を示す図である。つまり、図11Bは、図11Aの上段および下段のそれぞれのインパルス応答特性曲線を周波数領域に変換したものを示す。実線が右のスピーカ1012から右耳元1002へのインパルス応答の周波数特性を示す伝達関数GRR、点線が左のスピーカ1011から右耳元1002へのインパルス応答の周波数特性を示す伝達関数GLRを示す。図9Bでは全ての周波数にわたって|GRR|>|GLR|であったが、図11Bでは、周波数によっては|GRR|<|GLR|となっていることがわかる。これらの計測結果からクロストークキャンセラ1030の伝達関数XCを算出した。クロストークキャンセラ1030の伝達関数XCの周波数特性例を図11Cの実線で示す。クロストークキャンセラ1030の伝達関数XCのゲインは0dBを超える周波数が多く、このような例においては、クロストークキャンセルのための出力である右のスピーカ1012のほうが左のスピーカ1011より大きな音として出力されることがわかる。
このように、左右非対称なスピーカ配置の場合は、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象が起こり得る。図10の車室内などのように、受聴者1000からみて2つのスピーカが歪な位置にある場合、スピーカ1012から出力される制御音の振幅が、本来聞かせたい音よりも大きくなり得る。その結果、クロストークをキャンセルする機能は、受聴者1000の受聴位置の変動(例えば頭部の前後左右の動きや向きの変動)による音響特性の変化に対して非常に弱く、適切なクロストークキャンセル処理ができなくなる。
この問題を解決するために、本開示の一態様に係る信号処理装置は、X側およびY側(Xは左および右の一方、Yは左および右の他方)の2つのスピーカが配置された左右が歪な音響空間内で入力の音声信号に対するクロストークキャンセル処理を行う信号処理装置であって、受聴者のY側の耳で該音声信号が概ね打ち消されるように前記2つのスピーカからの出音を制御する制御部を有し、Y側のスピーカとY側の耳との間の伝達関数をGYY、X側のスピーカとY側の耳との間の伝達関数をGXY、前記GYYを前記GXYで除して得られる伝達関数をGCYとしたとき、前記制御部は、Y側のスピーカから該音声信号を出音するように制御し、X側のスピーカから該音声信号をGCYで処理した信号を出音するように制御する。
これにより、Y側のスピーカではなくX側のスピーカから該音声信号をGCYで処理した信号を出音(つまり制御音を出力)するので、歪な音響空間内においてもクロストークキャンセラのゲインを大きくせずにクロストークをキャンセルすることが可能となる。従って、歪な音響空間においても、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象を低減することができる。つまり、適切なクロストークキャンセル処理を実現することができる。
なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
以下、本開示の一態様に係る信号処理装置の実施の形態について、図面を参照しながら具体的に説明する。
なお、以下で説明する実施の形態は、いずれも一包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
(実施の形態1)
図1は本実施の形態における信号処理装置1の構成例およびスピーカと、受聴者100とを示す図である。図中、信号処理装置1は、制御部103、クロストークキャンセラ110、入力部120、出力部121および出力部122を備える。信号処理装置1は、入力部120から入力した音信号を制御部103の制御下でクロストークキャンセラ110を用いるなどして処理し、信号処理装置1の外部にある左のスピーカ111から出音するための出力用音信号を出力部121から出力し、信号処理装置1の外部にある右のスピーカ112から出音するための出力用音信号を出力部122から出力する。
ここでは、制御部103は、再生したい音声信号Aを入力し、受聴者100の左耳元101にのみ音が到達し、右耳元102には音が到達しない状態を実現するようにクロストークキャンセラ110、出力部121および出力部122を制御する。図1に記載のようにクロストークキャンセラ110(この伝達関数をXCとする)は、図8および図10とは逆に、すなわち、右のスピーカ112用の出力部122への経路上ではなく、左のスピーカ111用の出力部121への経路上に設置してある。つまり、聞かせたい音を左のスピーカ111でなく右のスピーカ112から再生し、クロストークキャンセラ110を左のスピーカ111側に設置する。
この場合、受聴者100の右耳元102で0を実現するには、右のスピーカ112−右耳元102間、左のスピーカ111−右耳元102間の伝達関数をそれぞれGRR、GLR、クロストークキャンセラ110の伝達関数をXCとすると、右耳元102にて0を得るためには(つまり音を打ち消すためには)、(式3)を満たす必要がある。
GRR+GLR*XC=0 ・・・(式3)
(式3)よりクロストークキャンセラ110の伝達関数XCは、(式4)で得られる。
XC=−GRR/GLR ・・・(式4)
(式4)から|GRR|<|GLR|の場合でもクロストークキャンセラ110の伝達関数XCのゲイン|XC|を1より小さくすることができ、歪な音響空間における前述のような時間領域で実現する際のタップ長増大の課題や、音響特性の変動による制御性能の大幅な劣化、すなわち本来聞かせたい音よりも大きい音が聞こえるという不適切な現象を低減できる。
図11Aおよび図11Bでの計測結果を用いて図1のクロストークキャンセラ110を設計した結果を図2A〜図2Cに示す。図2Aは左右非対称のスピーカ配置における音響特性のインパルス応答計測例を示す図である。図2A上段は、右のスピーカ112から右耳元102への、図2A下段は左のスピーカ111から右耳元102へのインパルス応答を示す。図2Bは、図2Aのインパルス応答計測例の周波数特性を示す図である。つまり、図2Bは、図2Aの上段および下段のそれぞれのインパルス応答特性曲線を周波数領域に変換したものを示す。実線が右のスピーカ1012から右耳元1002へのインパルス応答の周波数特性を示す伝達関数GRR、点線が左のスピーカ1011から右耳元1002へのインパルス応答の周波数特性を示す伝達関数GLRを示す。図2Aおよび図2Bは、比較のため、図11Aおよび図11Bと同じものとする。
これらを用いて図1の構成でクロストークキャンセラ110伝達関数XCの周波数特性を算出すると、図2Cのようになる。つまり、図2Cは、設計したクロストークキャンセラ110の周波数特性例を示す図である。比較例の図11Cと比較すると、図1の構成でクロストークキャンセラ110を設計した場合、約5kHz以下においては、クロストークキャンセラ110の伝達関数XCのゲイン|XC|が0dBより小さい値をとる周波数が多くなっていることがわかる。
これは、約5kHz以下の帯域に置いて、右のスピーカ112と右耳元102間の周波数特性のゲイン|GRR|より、左のスピーカ111と右耳元102間の周波数特性のゲイン|GLR|が大きい周波数が多かったからである。この帯域では、再生したい音よりクロストークキャンセルのための制御音を小さな音とすることができ、前述のような課題、を解決、すなわち、左右非対称なスピーカ配置の場合に本来聞かせたい音よりも大きい音が聞こえるという不適切な現象が起こりにくくすることができることがわかる。
なお、ここでは左耳元101にのみ音が到達し、右耳元102には音が到達しない状態を実現する場合について説明したが、右耳元102にのみ音が到達し、左耳元101に音が到達しない状態を実現する場合についても同様である。
以上説明してきたように、本実施の形態における信号処理装置1は、X側およびY側(Xは左および右の一方、Yは左および右の他方)の2つのスピーカが配置された左右が歪な音響空間内で入力の音声信号に対するクロストークキャンセル処理を行う信号処理装置であって、受聴者のY側の耳で該音声信号が概ね打ち消されるように前記2つのスピーカからの出音を制御する制御部103を有し、Y側のスピーカとY側の耳との間の伝達関数をGYY、X側のスピーカとY側の耳との間の伝達関数をGXY、前記GYYを前記GXYで除して得られる伝達関数をGCYとしたとき、前記制御部103は、Y側のスピーカから該音声信号を出音するように制御し、X側のスピーカから該音声信号をGCYで処理した信号を出音するように制御する。
たとえば、Xが左、Yが右である場合は、図1に示したように、X側スピーカは左のスピーカ111、Y側スピーカは右のスピーカ112が該当する。また、伝達関数GYY、GXYは、図2Bに示した伝達関数GRR、GLRに該当する。伝達関数GCYは、図2Cに示した伝達関数XCに該当する。
また、例えば、Xが右、Yが左である場合は、図1のクロストークキャンセラ110の代わりに入力部120と右側の出力部122の間にクロストークキャンセラを備える構成例に該当する。そして、X側スピーカは右のスピーカ112に、Y側スピーカは左のスピーカ111に該当する。また、伝達関数GYY、GXYは、伝達関数GLL、GRLに該当する。伝達関数GCYは、(−GLL/GRL)に該当する。
この構成によれば、Y側のスピーカではなくX側のスピーカから該音声信号をGCYで処理した信号を出音(つまり打ち消すための制御音を出力)するので、歪な音響空間内においてもクロストークキャンセラのゲインを大きくせずにクロストークをキャンセルすることが可能となる。従って、歪な音響空間においても、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象を低減することができる。つまり、適切なクロストークキャンセル処理を実現することができる。
ここで、前記制御部103は、X側のスピーカから該音声信号に、−GCYを乗じた信号を出音するように制御してもよい。
また、本実施の形態における信号処理装置1は、入力した音声信号を処理し、出力する信号処理装置1であって、第1の音声信号を入力する入力部120と、上記第1の音声信号を処理し、第2の音声信号と第3の音声信号を出力する制御部103と、前記第2の音声信号を外部に出力する第1の出力部と、前記第3の音声信号を外部に出力する第2の出力部とを備える。前記第2の音声信号を音として出力する第1のスピーカと受聴者の片側の耳との間の伝達関数をGYY、前記第3の音声信号を音として出力する第2のスピーカと受聴者の前記片側の耳との間の伝達関数をGXY、前記GYYを前記GXYで除して得られる伝達関数をGCYとするとき、前記制御部103は、前記第1の音声信号を前記第2の音声信号として出力し、前記第1の音声信号に−GCYを乗じることにより前記第3の音声信号として出力する。
例えば、第1の出力部、第2の出力部は、図1の構成例では左の出力部121、右の出力部122に該当し、上記の片側の耳は右耳元102に該当する。また、伝達関数GYY、GXYは、図2Bに示した伝達関数GRR、GLRに該当する。伝達関数GCYは、図2Cに示した伝達関数XCに該当する。
また、例えば、第1の出力部、第2の出力部は、右の出力部122、左の出力部121に該当し、上記の片側の耳は左耳元101に該当する。この場合、図1のクロストークキャンセラ110の代わりに入力部120と右側の出力部122の間にクロストークキャンセラを備える構成例に該当する。そして、伝達関数GYY、GXYは、伝達関数GLL、GRLに該当する。伝達関数GCYは、(−GLL/GRL)に該当する。
この構成によっても、上記と同様に、歪な音響空間においても、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象を低減することができる。つまり、適切なクロストークキャンセル処理を実現することができる。
(実施の形態2)
実施の形態1における図2Cに示したとおり、実際に計測した音響特性においては、全ての周波数に置いて|GRR|<|GLR|を満たすとは限らず、|GRR|>|GLR|となる周波数も含まれる場合がある。
このような場合、図1の構成とすると、|GRR|>|GLR|を満たす周波数においては、(式5)より、クロストークキャンセラ110のゲイン|XC|が1より大きくなってしまうことがわかる。
XC=−GRR/GLR・・・(式5)
図2Cでは、5kHz以上の帯域において|XC|>1となる周波数が多く含まれているが、これは該当周波数で|GRR|>|GLR|であるからである。
そこで、図3Aのような構成とすることで、より最適な制御を実現する。図3Aは、実施の形態2における信号処理装置3の構成例およびスピーカ111、112と、受聴者100とを示す図である。図3Aでは、スピーカ111、112それぞれの入力信号にクロストークキャンセラ201、202で処理を行う。クロストークキャンセラ201、202の伝達関数をそれぞれXCL、XCRとする。この伝達関数XCL、XCRは下記のように設計する。
XCL(n)=1 ・・(式6A)
XCR(n)=R(n)=−GLR(n)/GRR(n)・・(式6B)
ただし|GRR(n)|>=|GLR(n)|の場合。
XCL(n)=L(n)=−GRR(n)/GLR(n)・・(式7A)
XCR(n)=1 ・・(式7B)
ただし|GRR(n)|<|GLR(n)|の場合。
ただし、nは周波数領域に変換された際の周波数サンプルポイントを示し、例えば、0からN−1のN個のサンプルポイントの何れか示す。あるいは、nは、音声信号をN分割した周波数帯域を示すインデックスであってよい。XCL(n)等は、サンプルポイントnにおけるサンプル値またはインデックスnに対応する周波数帯域のサンプル値(伝達関数)を示す。
上式では、周波数ごとに|GLR(n)|と|GRR(n)|の大きさを比較し、その結果によってクロストークキャンセラ201、202の伝達関数を周波数ごとに設計している。その概略図を図3Bに示す。図3Bは、実施の形態2におけるクロストークキャンセラの詳細設計例を示す説明図である。
右のスピーカ112と右耳元102間の周波数特性を示す伝達関数GRR、左のスピーカ111と右耳元102間の周波数特性を示す伝達関数GLRとも、Nサンプルでフーリエ変換され、周波数サンプルポイントnは、0からN−1の値を持つ。周波数サンプルポイントnにおける伝達関数のゲイン|GRR(n)|と|GLR(n)|を比較し、その大小によってクロストークキャンセラ201、202の伝達関数XCL(n)、XCR(n)が決定される。例えば、|GRR(0)|>|GLR(0)|であるため、XCL(0)、XCR(0)はそれぞれ1、R(0)=−GLR(0)/GRR(0)と決定される。これを周波数サンプル0からN−1までの全てにおいて実施し、XCL、XCRの周波数特性を決定する。
これにより、クロストークキャンセラ201、202とも、ゲインが1よりも大きくなることを避けることができ、より最適な制御を実現することができる。
図11A、図11Bの例で用いた計測結果を示す図4A、図4Bを元に、上記アルゴリズムにてクロストークキャンセラ201、202を設計した結果を図4Cに示す。図4A、図4Bは、それぞれ図2A、2Bと同様に、左右非対称のスピーカ配置におけるインパルス応答計測例、周波数特性を示す図である。図4Cは、実施の形態2において設計したクロストークキャンセラの周波数特性例を示す図である。
図4Cのグラフを見てわかるように、伝達関数XCL、XCRのゲインをすべての周波数において0dB以下とすることができる。
ここで、上記のようにして設計したフィルタを時間領域に変換する際の注意点について説明する。例えば図4Aの2つのインパルス応答を比較すると、GRRのほうがGLRより早くピークが立ち上がり、遅延時間が短い可能性がある。この場合、例えばある周波数サンプルにおいてクロストークキャンセラ201の伝達関数XCL(n)=−GRR(n)/GLR(n)で算出すると、フィルタ自体が時間進み成分を持つ可能性があることになる。時間を進ませることは、一方のスピーカからの出音と他方のスピーカからの出音との間の因果性を満たさないことになり、このままでは実現することができない。しかし、この時間進み成分は左のスピーカ111出力と右のスピーカ112出力との相対的な時間進み成分であればよいため、全体を遅延させることで因果性を満たすものとして実現することができる。具体的には、図5のように遅延部503を設ける。この遅延部503はクロストークキャンセラ201、202それぞれの時間進み成分の最大値より大きな遅延時間を持つものである。例えば、クロストークキャンセラ201、202の時間進み成分がそれぞれzNL、zNRで、L>R(ただし、L、Rは0以上の整数である)のとき、遅延部503は入力信号自体を少なくともLサンプル遅延させる。これにより、入出力での左のスピーカ111出力における時間進み成分は0になる。これにより、左のスピーカ111出力と右のスピーカ112出力の相対的な遅延時間差は保たれたまま、因果性を満たす処理として実現可能となる。この遅延時間の調整については、周波数領域でも実現可能である。図6Aは、図4Cで設計したクロストークキャンセラXCLを逆フーリエ変換で時間領域に変換したインパルス応答例を示す図である。この係数を見ると、時間サンプル0付近でピークをもつものの、時間サンプルの終端(2000サンプル付近)でも振幅が大きな値を取っている。フーリエ変換の性質として、時間進み成分については時間サンプルの終端に回り込んで現れることから、これは設計したクロストークキャンセラXCLが時間進み成分を含んでいることを意味する。そこで、この時間進み成分をなくすため、周波数領域で遅延させる。具体的には、遅延させるサンプル数をdとすると、係数の終端から時間サンプル0に向かってdサンプルを切り出し、時間サンプル0の前に移動させる。これにより、全体をdサンプル遅延させたことになる。d=1024として遅延させたものを図6Bに示す。図6Bは、実施の形態2において時間進みを考慮して設計したクロストークキャンセラのインパルス応答例を示す図である。右のスピーカ側のクロストークキャンセラXCRに対しても同様にこの処理を施すことで、左右のクロストークキャンセラXCLとXCRの相対的な時間遅延を変化させずにフィルタとしての因果性を満たすことができる。このようにして生成した係数にハニング窓などをかけ、時間サンプル0、および終端付近で収束させて用いてもよい。
なお、ここでは遅延時間を整数のサンプル数で説明したが、整数でない場合についても適用可能である。
以上説明してきたように本実施の形態における信号処理装置3において前記制御部203は、音声信号を複数の周波数帯域信号F(n)に変換(nは周波数帯域を示すインデックス)する。ここで、前記nごとに、Y側のスピーカとY側の耳の間の伝達関数をGYY(n)、X側のスピーカとY側の耳の間の伝達関数をGXY(n)、前記GYY(n)を前記GXY(n)で除して得られる伝達関数をGCY(n)、前記GXY(n)を前記GYY(n)で除して得られる伝達関数をGCX(n)とする。
前記制御部103は、前記nごとに前記GYY(n)と前記GXY(n)とのゲインを比較し、前記GXY(n)のゲインが前記GYY(n)のゲインより大きい場合には、Y側のスピーカから前記F(n)を出音するように制御し、X側のスピーカから該F(n)を前記GCY(n)で処理した信号を出音するように制御し、前記GYY(n)のゲインが前記GXY(n)のゲインより大きい場合には、X側のスピーカから前記F(n)を出音するように制御し、Y側のスピーカから該F(n)を前記GCX(n)で処理した信号を出音するように制御する。
これによれば、上記のnごとに、クロストークキャンセルするための制御音のゲインが1よりも大きくなることを避けることができ、より最適な制御を実現することができる。つまり、歪な音響空間においても、本来聞かせたい音よりも大きい音が聞こえるという不適切な現象をより確実に低減することができ、より、適切なクロストークキャンセル処理を実現することができる。ここで、信号処理装置5は、さらに入力した音声信号を遅延する遅延部503を備え、前記遅延部503の遅延時間は、X側スピーカからの出音とY側スピーカからの出音との間の因果性を満たすよう設定される。
(実施の形態3)
これまで説明してきた制御装置は設計したクロストークキャンセラで入力信号を処理し、スピーカから再生して制御するものであったが、クロストークキャンセラで処理された信号をメモリやハードディスクドライブなどの記録装置に記録しておき、再生の必要に応じて処理された信号を再生する、という利用方法も有効である。
図7にそのブロック図を示す。図7は、実施の形態3における信号処理装置7の構成例およびスピーカ111、112と、受聴者100とを示す図である。音声信号Aは前述のような方法で設計されたクロストークキャンセラ201(XCL)、202(XCR)で信号処理され、出力信号として記録装置701に記録される。記録装置701に記録された出力信号は、所定のタイミングで記録装置701から読みだされ、左のスピーカ111、右のスピーカ112から再生される。再生タイミングは、例えばユーザ操作などのイベントやタイムスタンプなどをトリガとして設定することができる。
ここで、クロストークキャンセラ201(XCL)、202(XCR)で信号処理された出力信号を生成するのは、リアルタイム処理でもオフライン処理でもよい。201、202において施される信号処理は固定であるため、同じ信号を何度も処理して再生する場合には、一度生成された出力信号を記録装置701に記録しておき、次回以降再生する際には記録された出力信号を再生すると、クロストークキャンセラ201、202で必要な演算量の負荷を抑えるためには有効である。また、記録装置701に記録する出力信号の生成をPCなど、再生機とは別の機器で実施することも可能であり、その場合には、再生機にはクロストークキャンセラ201(XCL)、202(XCR)でのフィルタ処理を実現するためのDSPなどの信号処理装置は不要となり、再生機の簡略化が可能となる。さらにこの利用形態においては、このフィルタ処理に必要な演算時間の制限がないため、長いタップ長で設計したフィルタを利用することができる。
以上説明してきたように本実施の形態における信号処理装置7は、X側のスピーカから出音すべき音声信号と、Y側のスピーカから出音すべき音声信号とを記録する記録装置を備える。
この構成によれば、信号処理装置7は、リアルタイム処理だけでなくオフライン処理することも可能になる。オフライン処理では、演算時間の制限がないため、長いタップ長で設計したフィルタ処理(クロストークキャンセル処理)を利用することができる。
なお、記録装置701は、インターネットに接続されたサーバ上にあってもよい。再生機はインターネットを経由して前記サーバにアクセスし、フィルタ処理された信号を再生することで、所望の効果を得ることができる。フィルタ処理された信号は、車種などの再生機ごとに最適化されたものであってもよく、あるいは、複数のタイプの再生機をグルーピングしたものに対して最適化されたものでもよい。さらに、ユーザの指示により、所望の音声に対して、再生機に応じたフィルタ処理を施したものを提供してもよい。
(実施の形態4)
クロストークキャンセルは、片方の耳に到達する音声信号を0にする技術であるので、言い換えれば、逆側の耳にのみ音声が到達する状態を作り出すものである。その場合リスナーは、耳元で音が聴こえる、と感じる。
片方の耳元でのみ音が聴こえる状況は、様々な心理状態を引き起こす。例えば、蚊が耳元に纏わりつく煩わしさ、異性が耳元で囁くドキドキ感、ゾンビが耳元に現れる不気味さ、銃弾が耳元を掠め飛ぶ驚き、などである。
本発明者らは、このような聴覚心理現象を、ゲームの楽しさの向上や、爽やかな覚醒、のために応用しようと考えている。
前記の実施の形態2は、片方の耳に到達する音声信号を効果的に0にすることを意図するものであった。
本実施の形態4では、片方の耳に到達する音声信号を0にするための選択肢において、その効果の差が小さい場合は、逆の耳元に到達する音声信号が大きくなる方の選択肢を選択することで耳元感を強くするという意図で構成された技術を述べる。
前記の実施の形態2では、周波数帯域信号F(n)の周波数帯域を示すインデックスnごとに|GLR(n)|と|GRR(n)|の大きさを比較し、その結果によってクロストークキャンセラ201、202の伝達関数XCL、XCRを周波数ごとに設計していた。
すなわち、次のように表される。
|GRR(n)|>=|GLR(n)|の場合、
XCL(n)=1 ・・(式6A)
XCR(n)=R(n)=−GLR(n)/GRR(n)・・(式6B)
|GRR(n)|<|GLR(n)|の場合、
XCL(n)=L(n)=−GRR(n)/GLR(n)・・(式7A)
XCR(n)=1 ・・(式7B)
ここでもし、|GRR(n)|と|GLR(n)|とが概ね同じである場合、意図している方の耳に到達する音声信号を0にする効果がどちらの選択肢でも同じであるので、逆側の耳元に到達する音声信号が大きくなる方の選択肢を選択するように制御部203が制御する。
図3Aを用いてその制御方法を説明する。
インデックスnごとに、右のスピーカ112と右耳元102間の周波数特性を示す伝達関数をGRR(n)、左のスピーカ111と右耳元102間の周波数特性を示す伝達関数をGLR(n)、XCR(n)=−GLR(n)/GRR(n)、XCL(n)=−GRR(n)/GLR(n)、右のスピーカ112と左耳元101間の周波数特性を示す伝達関数をGRL(n)、左のスピーカ111と左耳元101間の周波数特性を示す伝達関数をGLL(n)とする。
まず、制御部203は、|GRR(n)|と|GLR(n)|とが概ね同じである場合、|XCR(n)*GRL(n)+GLL(n)|と、|XCL(n)*GLL(n)+GRL(n)|とを比較する。例えば、|GRR(n)|と|GLR(n)|の比が−2dBから+2dBの範囲に入る場合は、|GRR(n)|と|GLR(n)|とは概ね同じである。なお、この範囲についてはこれに限るものではない。
さらに、制御部203は、前者が大きい場合、クロストークキャンセラ201の伝達関数を「1」とし、クロストークキャンセラ202の伝達関数をXCR(n)とする。
また、制御部203は、後者が大きい場合、クロストークキャンセラ201の伝達関数をXCL(n)とし、クロストークキャンセラ202の伝達関数を「1」とする。
|GRR(n)|と|GLR(n)|とが概ね同じではない場合は、|GRR(n)|>|GLR(n)|の場合には、クロストークキャンセラ201の伝達関数を「1」とし、クロストークキャンセラ202の伝達関数をXCR(n)とし、|GRR(n)|<|GLR(n)|の場合には、クロストークキャンセラ201の伝達関数をXCL(n)とし、クロストークキャンセラ202の伝達関数を「1」とする。
制御部203は、このように制御することによって、周波数帯域信号F(n)ごとに、片方の耳に到達する音声信号を0にする効果が大きい方法を優先的に選択しつつも、その効果が同等である周波数帯域については、逆側の耳に到達する音声信号が大きくなる方法を選択することができるので、耳元で音声が聴こえる効果をより際立たせることができる。
次に、実施の形態4の変形例について説明する。この変形例は実施の形態2にも適用できる。
実施の形態2においても、実施の形態4においても、周波数帯域信号F(n)の帯域を示すインデックスnは、FFT分析における各周波数を暗に示しているので、各周波数帯域信号F(n)の帯域幅は同じである。実施の形態2および実施の形態4では、制御部203は、周波数帯域信号F(n)ごとに、伝達関数XCL(n)、XCR(n)を設計(選択または判定)していた。この変形例では、複数本の周波数帯域信号F(n)を束ねた拡張バンドを複数設定し、拡張バンドごとに伝達関数XCL(n)、XCR(n)の設計(選択または判定)を同じする例について説明する。
具体的には、制御部203は、周波数帯域信号F(n)の複数本を束ねることで帯域幅を拡張した複数の拡張バンドを設定、つまり、隣接する複数本の周波数帯域信号F(n)を括った拡張バンドを設定する。
さらに、制御部203は、同じ拡張バンド内の複数の周波数帯域信号F(n)では、クロストークキャンセラ201の伝達関数XCL(n)の設計(選択または判定)を同じにし、クロストークキャンセラ202の伝達関数XCR(n)の設計(選択または判定)を同じにする。
拡張バンドを適用しない例と適用した例とを図12A、図12Bに示す。
図12Aは、実施の形態4において、上記nごとに設計した伝達関数XCL(n)、XCR(n)の一例を示す図である。図12Bは、実施の形態4の変形例において、拡張バンドごとに設計した伝達関数XCL(n)、XCR(n)の一例を示す図である。図12A、図12BにおけるCBa〜CBgは、それぞれ拡張バンドの例を示している。
図12Aでは、周波数帯域信号F(n)ごとに、伝達関数XCL(n)、XCR(n)を設計しているので、拡張バンドCBa〜CBgは無関係である。破線で囲った各拡張バンドCBa〜CBg内で伝達関数XCL(n)、XCR(n)を設計(選択または判定)が同じになるとは限らない。
これに対して、図12Bでは、実線で囲った各拡張バンドCBa〜CBg内で、伝達関数XCL(n)、XCR(n)を設計(選択または判定)した結果が同じに揃っている。変形例において、例えば、制御部203は、一旦図12Aのような設計をした後、周波数帯域信号ごとの設計結果の多数決によって、拡張バンドごとの設計結果を定めるようにしてもよい。そのようにすることによって、隣接する周波数帯域信号F(n)ごとにフィルタの設計方法が目まぐるしく変わる不自然さを回避できる。
この際の、拡張バンドを設定するための周波数帯域信号F(n)の括り方は、クリティカルバンドと呼ばれる、周波数軸における人間の聴覚の知覚単位に沿って決めてもよい。
因みにクリティカルバンドは、MPEGオーディオ規格ISO/IEC 13818−3においては、人間の耳の周波数選択特性に対応する周波数領域における心理音響的な尺度と定義されている。
図13は、クリティカルバンドの一例を示す図である。同図は、同規格のTable D.2a.の一部の抜粋であり、クリティカルバンドの番号(no)とリティカルバンドの上端の周波数とを示す。同図は、16kHzのサンプリングレートでレイヤIの符号化に対して有効である。なお、この定義は絶対的なものではないので、この定義に限定されるものではない。
以上説明してきたように本実施の形態における信号処理装置において制御部203は、前記GXY(n)のゲインと前記GYY(n)のゲインとが同じである場合、Y側のスピーカとX側の耳の間の伝達関数をGYX(n)、X側のスピーカとX側の耳の間の伝達関数をGXX(n)とし、GCX(n)にGYX(n)を乗じGXXを加算した伝達関数をAXGCY(n)にGXX(n)を乗じGYXを加算した伝達関数をAYとしたとき、AXがAYより大きい場合は、X側のスピーカから前記F(n)を出音するように制御し、Y側のスピーカから該F(n)を前記GCX(n)で処理した信号を出音するように制御し、AYがAXより大きい場合は、Y側のスピーカから前記F(n)を出音するように制御し、X側のスピーカから該F(n)を前記GCY(n)で処理した信号を出音するように制御する。
ここで、前記制御部203は、前記周波数帯域信号F(n)の複数本を束ねた複数の拡張バンドを定め、前記拡張バンド内の複数本の前記周波数帯域信号F(n)では、Y側のスピーカから前記F(n)を出音するように制御し、X側のスピーカから該F(n)を前記GCY(n)で処理した信号を出音するように制御するか、X側のスピーカから前記F(n)を出音するように制御し、Y側のスピーカから該F(n)を前記GCX(n)で処理した信号を出音するように制御するかの判定を同じにしてもよい。
ここで、前記制御部203は、前記複数の拡張バンドを、人間の聴覚のクリティカルバンドに応じて定めてもよい。
なお、実施の形態1から実施の形態4において説明したスピーカ111、112、1011、1012は、特にその構成を限定していなかったが、例えば、通常のスピーカ、すなわち、入力信号の全周波数帯域を再生することを意図したスピーカである。しかし、これはこの構成に限らないのは言うまでもない。例えば、ツイータ、スコーカ、ウーハなど、周波数ごとに異なるユニットから構成されるマルチウェイのスピーカでもよい。その際、例えば、ユニットごとに別筐体でそれぞれが離れた位置に配置されていてもよい。また、通常の可聴帯域を超える周波数の信号を再生することで、鋭い指向性を実現することができるパラメトリックスピーカや、LFE(Low Frequency Effect)信号を再生することができるサブウーハ、アクチュエータなどを含んでもよい。
また、本明細書において、モノラル成分の信号Aを用いて説明しているが、複数の信号処理装置を組み合わせることで、2ch以上の信号に対してクロストークキャンセル処理を行ってもよい。その際、必要に応じて、信号を出力するスピーカは共通にし、出力信号をミックスして再生してもよい。
また、本明細書において、クロストークキャンセラは固定のFIR(Finite Impulse Response)フィルタでの実現する例を記載したが、これに限定されない。IIR(Infinite Impulse Response)フィルタで実現してもよく、固定ではなく適応フィルタで実現してもよい。
また、実施の形態に記載の処理に加え、周波数特性を調整するイコライザやフィルタ、出力振幅を調整するゲインや、AGC(Auto Gain Controller)のほか、ディレイやリバーブ、エコーなどのエフェクト処理をクロストークキャンセラの前段、もしくは後段に設けてもよい。その際、左右のスピーカ出力に対して同等の特性が乗算されることが望ましい。
さらに、本開示に記載の信号処理装置は、クロストークキャンセル処理を含まない、信号再生機と組み合わせて使用してもよいのは言うまでもない。
以上、本開示において、信号処理装置について実施の形態に基づいて説明したが、本開示はこの実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される携帯も、本開示の範囲内に含まれる。
なお、本開示において、信号処理装置における各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPU、またはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読みだして実行することによって実現されてもよい。また、集積回路であるLSI(Large Scale Integration)や、専用回路、汎用プロセッサ、FPGA(Field Programmable Gate Array)、LSI内部の回路セルの接続や設定を再構成可能なリコンフィグラブル・プロセッサで実現してもよい。
なお、本開示において、簡略化のため、ディジタル信号をアナログに変換するD/A変換機、スピーカから出力する際に信号を増幅するアンプ部などの記載は省略したが、これらをソフトウェア、ハードウェアで実現し、スピーカから出力して、本開示の効果は変わらないのはいうまでもない。
本開示にかかる信号処理装置は、スピーカと、クロストークキャンセラと、を備えており、スピーカと受聴者の間の音響空間が歪である場合においても、クロストークキャンセル信号の振幅を小さく抑えることができるので、音響特性の変動に強いクロストークキャンセル処理が実現できるので、幅広く信号処理装置に応用できる。
1、3、5、7、8 信号処理装置
100、1000 受聴者
101、1001 左耳元
102、1002 右耳元
103 制御部
110、201、202、801、1030 クロストークキャンセラ
111、112、1011、1012 スピーカ
120 入力部
121、122 出力部
503 遅延部
701 記録装置

Claims (9)

  1. X側およびY側(Xは左および右の一方、Yは左および右の他方)の2つのスピーカが配置された歪な音響空間内で入力の音声信号に対するクロストークキャンセル処理を行う信号処理装置であって、
    リスナーのY側の耳で該音声信号が概ね打ち消されるように前記2つのスピーカからの出音を制御する制御部を有し、
    Y側のスピーカとY側の耳との間の伝達関数をGYY、X側のスピーカとY側の耳との間の伝達関数をGXY、前記GYYを前記GXYで除して得られる伝達関数をGCYとしたとき、
    前記制御部は、Y側のスピーカから該音声信号を出音するように制御し、X側のスピーカから該音声信号を伝達関数GCYで処理した信号を出音するように制御する
    信号処理装置。
  2. 前記制御部は、X側のスピーカから該音声信号に−GCYを乗じた信号を出音するように制御する
    請求項1記載の信号処理装置。
  3. 入力した音声信号を処理し、出力する信号処理装置であって、
    第1の音声信号を入力する入力部と、
    上記第1の音声信号を処理し、第2の音声信号と第3の音声信号を出力する制御部と、
    前記第2の音声信号を外部に出力する第1の出力部と、
    前記第3の音声信号を外部に出力する第2の出力部と、
    を備え、
    前記第2の音声信号を音として出力する第1のスピーカと受聴者の片側の耳との間の伝達関数をGYY、前記第3の音声信号を音として出力する第2のスピーカと受聴者の前記片側の耳との間の伝達関数をGXY、前記GYYを前記GXYで除して得られる伝達関数をGCYとするとき、
    前記制御部は、前記第1の音声信号を前記第2の音声信号として出力し、前記第1の音声信号に−GCYを乗じることにより前記第3の音声信号として出力する
    信号処理装置。
  4. 前記制御部は、さらに音声信号を複数の周波数帯域信号F(n)に変換し(nは周波数帯域を示すインデックス)、
    前記nごとに、
    Y側のスピーカとY側の耳の間の伝達関数をGYY(n)、
    X側のスピーカとY側の耳の間の伝達関数をGXY(n)、
    前記GYY(n)を前記GXY(n)で除して得られる伝達関数をGCY(n)、
    前記GXY(n)を前記GYY(n)で除して得られる伝達関数をGCX(n)、
    としたとき、
    前記制御部は、
    前記nごとに前記GYY(n)と前記GXY(n)とのゲインを比較し、
    前記GXY(n)のゲインが前記GYY(n)のゲインより大きい場合には、
    Y側のスピーカから前記F(n)を出音するように制御し、X側のスピーカから該F(n)を前記GCY(n)で処理した信号を出音するように制御し、
    前記GYY(n)のゲインが前記GXY(n)のゲインより大きい場合には、
    X側のスピーカから前記F(n)を出音するように制御し、Y側のスピーカから該F(n)を前記GCX(n)で処理した信号を出音するように制御する
    請求項1記載の信号処理装置。
  5. 前記信号処理装置は、さらに入力した音声信号を遅延する遅延部を備え、前記遅延部の遅延時間は、X側スピーカからの出音とY側スピーカからの出音の間の因果性を満たすよう設定される
    請求項1から請求項4のいずれか1項に記載の信号処理装置。
  6. 前記信号処理装置は、さらに、
    X側のスピーカから出音すべき音声信号と、Y側のスピーカから出音すべき音声信号とを記録する記録装置を備える
    請求項1から請求項5のいずれか1項に記載の信号処理装置。
  7. 前記制御部は、さらに音声信号を複数の周波数帯域信号F(n)に変換し(nは周波数帯域を示すインデックス)、
    前記nごとに、
    Y側のスピーカとY側の耳の間の伝達関数をGYY(n)、
    X側のスピーカとY側の耳の間の伝達関数をGXY(n)、
    Y側のスピーカとX側の耳の間の伝達関数をGYX(n)、
    X側のスピーカとX側の耳の間の伝達関数をGXX(n)とし、
    前記GYY(n)を前記GXY(n)で除して得られる伝達関数をGCY(n)、
    前記GXY(n)を前記GYY(n)で除して得られる伝達関数をGCX(n)、
    としたとき、
    前記制御部は、
    前記nごとに前記GYY(n)と前記GXY(n)とのゲインを比較し、
    前記GXY(n)のゲインと前記GYY(n)のゲインとが概ね同じである場合、
    GCX(n)にGYX(n)を乗じGXXを加算した伝達関数をAX、
    GCY(n)にGXX(n)を乗じGYXを加算した伝達関数をAY、
    としたとき、
    AXがAYより大きい場合は、
    X側のスピーカから前記F(n)を出音するように制御し、Y側のスピーカから該F(n)を前記GCX(n)で処理した信号を出音するように制御し、
    AYがAXより大きい場合は、
    Y側のスピーカから前記F(n)を出音するように制御し、X側のスピーカから該F(n)を前記GCY(n)で処理した信号を出音するように制御し、
    前記GXY(n)のゲインと前記GYY(n)のゲインとが概ね同じではなく、かつ、
    前記GXY(n)のゲインが前記GYY(n)のゲインより大きい場合には、
    Y側のスピーカから前記F(n)を出音するように制御し、X側のスピーカから該F(n)を前記GCY(n)で処理した信号を出音するように制御し、
    前記GXY(n)のゲインと前記GYY(n)のゲインとが概ね同じではなく、かつ、
    前記GYY(n)のゲインが前記GXY(n)のゲインより大きい場合には、
    X側のスピーカから前記F(n)を出音するように制御し、Y側のスピーカから該F(n)を前記GCX(n)で処理した信号を出音するように制御する
    請求項1に記載の信号処理装置。
  8. 前記制御部は、
    前記周波数帯域信号F(n)の複数本を束ねた複数の拡張バンドを定め、
    前記拡張バンド内の複数本の前記周波数帯域信号F(n)では、
    Y側のスピーカから前記F(n)を出音するように制御し、X側のスピーカから該F(n)を前記GCY(n)で処理した信号を出音するように制御するか、
    X側のスピーカから前記F(n)を出音するように制御し、Y側のスピーカから該F(n)を前記GCX(n)で処理した信号を出音するように制御するかの判定を同じにする
    請求項4または7に記載の信号処理装置。
  9. 前記制御部は、前記複数の拡張バンドを、人間の聴覚のクリティカルバンドに応じて定める
    請求項8に記載の信号処理装置。
JP2018513104A 2016-04-21 2017-04-05 信号処理装置 Active JP6863370B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016085520 2016-04-21
JP2016085520 2016-04-21
PCT/JP2017/014288 WO2017183462A1 (ja) 2016-04-21 2017-04-05 信号処理装置

Publications (2)

Publication Number Publication Date
JPWO2017183462A1 true JPWO2017183462A1 (ja) 2019-02-28
JP6863370B2 JP6863370B2 (ja) 2021-04-21

Family

ID=60115925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018513104A Active JP6863370B2 (ja) 2016-04-21 2017-04-05 信号処理装置

Country Status (5)

Country Link
US (1) US10560782B2 (ja)
EP (1) EP3448066A4 (ja)
JP (1) JP6863370B2 (ja)
CN (1) CN109076302B (ja)
WO (1) WO2017183462A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3453116B1 (en) * 2016-05-06 2021-11-24 Genesis Technical Systems Corp. Near-end crosstalk cancellation
US10567872B2 (en) * 2016-05-30 2020-02-18 Sony Corporation Locally silenced sound field forming apparatus and method
GB201804129D0 (en) * 2017-12-15 2018-05-02 Cirrus Logic Int Semiconductor Ltd Proximity sensing
TWI795869B (zh) * 2021-08-11 2023-03-11 國立臺北科技大學 一種利用腦波進行聽診的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000024226A1 (fr) * 1998-10-19 2000-04-27 Onkyo Corporation Systeme d'ambiophonie
JP2001346298A (ja) * 2000-06-06 2001-12-14 Fuji Xerox Co Ltd バイノーラル再生装置及び音源評価支援方法
WO2008152720A1 (ja) * 2007-06-14 2008-12-18 Pioneer Corporation 音像定位制御装置、音像定位制御方法、音像定位制御プログラムおよび記録媒体
WO2015154986A1 (en) * 2014-04-07 2015-10-15 Harman Becker Automotive Systems Gmbh Sound wave field generation

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53114201U (ja) * 1977-02-18 1978-09-11
US4555795A (en) * 1982-07-22 1985-11-26 Tvi Systems, Ltd. Monaural to binaural audio processor
CA2158451A1 (en) * 1993-03-18 1994-09-29 Alastair Sibbald Plural-channel sound processing
JPH08182100A (ja) 1994-10-28 1996-07-12 Matsushita Electric Ind Co Ltd 音像定位方法および音像定位装置
US6442277B1 (en) * 1998-12-22 2002-08-27 Texas Instruments Incorporated Method and apparatus for loudspeaker presentation for positional 3D sound
JP2006303799A (ja) 2005-04-19 2006-11-02 Mitsubishi Electric Corp 音響信号再生装置
TW200735687A (en) * 2006-03-09 2007-09-16 Sunplus Technology Co Ltd Crosstalk cancellation system with sound quality preservation
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
US20090086982A1 (en) * 2007-09-28 2009-04-02 Qualcomm Incorporated Crosstalk cancellation for closely spaced speakers
US20100303245A1 (en) * 2009-05-29 2010-12-02 Stmicroelectronics, Inc. Diffusing acoustical crosstalk
WO2012032335A1 (en) * 2010-09-06 2012-03-15 Cambridge Mechatronics Limited Array loudspeaker system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000024226A1 (fr) * 1998-10-19 2000-04-27 Onkyo Corporation Systeme d'ambiophonie
JP2001346298A (ja) * 2000-06-06 2001-12-14 Fuji Xerox Co Ltd バイノーラル再生装置及び音源評価支援方法
WO2008152720A1 (ja) * 2007-06-14 2008-12-18 Pioneer Corporation 音像定位制御装置、音像定位制御方法、音像定位制御プログラムおよび記録媒体
WO2015154986A1 (en) * 2014-04-07 2015-10-15 Harman Becker Automotive Systems Gmbh Sound wave field generation

Also Published As

Publication number Publication date
EP3448066A4 (en) 2019-12-25
US20190052962A1 (en) 2019-02-14
CN109076302A (zh) 2018-12-21
US10560782B2 (en) 2020-02-11
WO2017183462A1 (ja) 2017-10-26
JP6863370B2 (ja) 2021-04-21
EP3448066A1 (en) 2019-02-27
CN109076302B (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
US10104485B2 (en) Headphone response measurement and equalization
JP4780119B2 (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
US8873761B2 (en) Audio signal processing device and audio signal processing method
JP2021132385A (ja) 個々のサウンド領域を提供するための装置および方法
US10560782B2 (en) Signal processor
JP5909665B2 (ja) 音場制御装置および音場制御方法
US20080015845A1 (en) Audio signal component compensation system
JP2018164310A (ja) 車両の音声プラットホームにおける電話および娯楽オーディオの管理
JP6102179B2 (ja) 音声処理装置および方法、並びにプログラム
KR20140116152A (ko) 베이스 강화 시스템
KR20050060789A (ko) 가상 음향 재생 방법 및 그 장치
JP2005530432A (ja) 部屋における拡声器からの音声のデジタル等化方法、および、この方法の使用法
JP5816072B2 (ja) バーチャルサラウンドレンダリングのためのスピーカアレイ
KR20050115801A (ko) 와이드 스테레오 재생 방법 및 그 장치
EP1811809A1 (en) 3-dimensional acoustic reproduction device
JP2010021982A (ja) 音響再生装置
KR20170072132A (ko) 헬멧의 능동적 잡음 제어를 이용한 사운드 재현
WO2009093416A1 (ja) 音声信号処理装置および方法
JP2011259299A (ja) 頭部伝達関数生成装置、頭部伝達関数生成方法及び音声信号処理装置
JP5163685B2 (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
JP2012100117A (ja) 音響処理装置及び方法
JP2010118977A (ja) 音像定位制御装置および音像定位制御方法
JP2008092274A (ja) オーディオ再生装置
JP2012244336A (ja) 音声信号処理装置、音声信号処理方法および音響再生装置
JP2006174078A (ja) オーディオ信号処理方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210302

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210315

R150 Certificate of patent or registration of utility model

Ref document number: 6863370

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150