JP5486568B2 - 音声スポット再生処理方法、装置、プログラム - Google Patents
音声スポット再生処理方法、装置、プログラム Download PDFInfo
- Publication number
- JP5486568B2 JP5486568B2 JP2011190803A JP2011190803A JP5486568B2 JP 5486568 B2 JP5486568 B2 JP 5486568B2 JP 2011190803 A JP2011190803 A JP 2011190803A JP 2011190803 A JP2011190803 A JP 2011190803A JP 5486568 B2 JP5486568 B2 JP 5486568B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- filter
- reproduction processing
- frequency
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
このカテゴリの代表的な例として、ホーンスピーカとパラボラスピーカが挙げられる。ホーンスピーカは、例えば、スピーカの前方に、開口端に向けて断面面積が徐々に広くなるような喇叭状ホーンが取り付けられたスピーカである。ホーン長が長ければ長いほど、ホーンスピーカの指向性は鋭くなる。パラボラスピーカは、パラボラ板(放物面)の焦点にスピーカが配置された構成を持ち、スピーカからパラボラ板に向かって音声を放射することによって、パラボラ板の頂点とパラボラ板の焦点とを結ぶ直線の方向に音声が伝達する。
このカテゴリの代表的な例として、パラメトリックスピーカが挙げられる(例えば特許文献1参照)。パラメトリックスピーカは、直進性の強い超音波を搬送波として、例えば超音波が音源信号で振幅変調された変調波を大音圧で放射する。変調波が空気中を伝播する過程で空気の非線形特性によって歪み成分が生じ、この歪み成分と人間の聴覚特性に起因して可聴帯域の音声が出現する。
このカテゴリの代表的な例として、フェーズドスピーカアレーが挙げられる(例えば非特許文献1参照)。フェーズドスピーカアレーは、複数のスピーカで構成されたスピーカアレーであり、音源信号に時間差やレベル差の情報が含まれているフィルタを掛けて重畳する信号処理を行うことで得られた信号を各スピーカに入力して音声を空間放射し、この結果、目的方向に音声が再生される。
(1)目的方向にスピーカ自体を向けないと、目的方向に音声を再生することができない。つまり、目的方向が変わりえる場合には、人の身体活動に拠らないのであれば、ホーンスピーカやパラボラスピーカそのものの向きを変更するための駆動制御手段が必要になってしまう。
(2)指向性はスポットの広狭に係るから、できるだけ狭いスポットに音声を再生しようとするならば狭指向性の実現が望まれる。しかし、見込み角5°〜10°程度の狭指向性(目的方向に対して±5°〜±10°程度の鋭い指向性)を実現することが困難である。
(3)狭指向性を実現するために、スピーカ数を増やし、アレーサイズ(アレーの全長)を大きくすることが必要となる。これはコストや配線の複雑さなどの観点から不利益である。
(4)スポット再生の音場の形成のために、スピーカを様々な場所に配置する必要がある。これはスピーカアレーを設置する空間の制約やコストなどの観点から不利益である。
(5)目的方向以外の方向の音声に埋もれないように目的方向に向けて音声を高SN比で再生することが難しい。
本発明の原理について説明する。本発明は、信号処理に基づいて任意の方向に向けて音声を再生できるというスピーカアレー技術の本質と、反射音を積極的に利用することによって高SN比で音声を再生することとを基本としつつ、鋭い指向性を可能とする信号処理技術を組み合わせたことを特徴の一つとしている。特に、スピーカアレーから見た方向がほぼ同じで距離だけが異なる受聴位置とスピーカアレーとの間の伝達特性はかなり類似していることに鑑みて、反射物を利用することによって、異なる受聴位置とスピーカアレーとの間の伝達特性の差分を大きくすることが本発明の顕著な特徴の一つと言える。伝達特性の差分を信号処理によって再現することによって、スピーカアレーからの距離に応じて音声をスポット再生可能な音声スポット再生処理技術が実現する。
(参考文献1)Simon Haykin著、鈴木博他訳、「適応フィルタ理論」、初版、株式会社科学技術出版、2001.pp.66-73,248-255
(参考文献2)菊間信良著、「アダプティブアンテナ技術」、第1版、株式会社オーム社、2003年、pp.35-90
(参考文献3)浅野太著、「日本音響学会編 音響テクノシリーズ16 音のアレイ信号処理-音源の定位・追跡と分離-」、初版、株式会社コロナ社、pp.88-89, 259-261
(参考文献4)金田豊著、「適応形雑音抑圧マイクロホンアレー(AMNOR)の指向特性」、日本音響学会誌44巻1号(1988)、pp.23-30
SN比最大化規準によるフィルタ設計法では、位置(θs,Dh)でのSN比(SNR)を最大化する規準でフィルタW→(ω,θs,Dh)を決定する。位置(θs,Dh)への音声の空間相関行列をRss(ω)、位置(θs,Dh)以外の位置への音声の空間相関行列をRnn(ω)とする。このとき、SNRは式(23)で表される。なお、Rss(ω)は式(24)、Rnn(ω)は式(25)で表される。伝達特性a→(ω,θs,Dh)=[a1(ω,θs,Dh),…,aM(ω,θs,Dh)]Tは例えば式(20)で表される(正確には、式(20)のθをθs、DをDhとしたものである)。式(25)で、方向θφのインデックスφが属する集合をΦ(|Φ|=P)、距離Dδのインデックスδが属する集合をΔ(|Δ|=G)とする。
パワーインバージョンに基づくフィルタ設計法では、一つのスピーカに対するフィルタ係数を一定値に固定した状態でビームフォーマの平均出力パワーを最小化する基準でフィルタW→(ω,θs,Dh)を決定する。ここでは、一例として、M個のスピーカのうち1番目のスピーカに対するフィルタ係数を固定するとして説明する。この設計法では、フィルタW→(ω,θs,Dh)は、式(30)の拘束条件の下、空間相関行列Rxx(ω)を用いて全位置(受聴位置として想定される全ての位置)への音声のパワーが最小となるように設計される(式(29)参照)。伝達特性a→(ω,θs,Dh)=[a1(ω,θs,Dh),…,aM(ω,θs,Dh)]Tは例えば式(20)で表される(正確には、式(20)のθをθs、DをDhとしたものである)。
上述の最小分散無歪応答法では、式(3)で表されるように位置(θs,Dh)への音声の全帯域通過を拘束条件とし、式(2)で表されるビームフォーマの平均出力パワーが最小となる(つまり、位置(θs,Dh)以外の位置への音声である漏れ音声のパワーが最小となる)フィルタを求める、という単一拘束条件の下の規準でフィルタW→(ω,θs,Dh)を設計した。この方法によると、全体的に漏れ音声のパワーを抑圧することはできるが、特定の一つまたは複数の位置への音声伝搬を強く抑圧したい場合には必ずしも好適な方法とは言えない。このような場合、既知の一つまたは複数の特定位置(つまり、抑圧点)への音声伝搬を強く抑圧するフィルタが要求される。このため、ここで説明するフィルタ設計法では、(1)位置(θs,Dh)への音声の全帯域通過、および(2)既知のB個(Bは1以上の予め定められた整数)の抑圧点(θN1,DG1),(θN2,DG2),…,(θNB,DGB)への音声の全帯域抑制、を拘束条件として、式(2)で表されるビームフォーマの平均出力パワーが最小となる(つまり、位置(θs,Dh)と各抑圧点とを除く位置への音声のパワーが最小となる)フィルタを求める。既述のように、受聴位置の方向のインデックスφが属する集合を{1,2,…,P}とすると、Nj∈{1,2,…,P}(ただし、j∈{1,2,…,B}),B≦P-1である。また、受聴位置までの距離のインデックスδが属する集合を{1,2,…,G}とすると、Gj∈{1,2,…,G}(ただし、j∈{1,2,…,B}),B≦G-1である。
遅延合成法によると、直接音や反射音が平面波伝搬すると仮定すると、フィルタW→(ω,θs,Dh)は式(35)で与えられる。つまり、フィルタW→(ω,θs,Dh)は伝達特性a→(ω,θs,Dh)を正規化して得られる。伝達特性a→(ω,θs,Dh)=[a1(ω,θs,Dh),…,aM(ω,θs,Dh)]Tは式(20)で表される(正確には、式(20)のθをθs、DをDhとしたものである)。この設計法によると、フィルタ精度は必ずしも良好とは言えない場合があるが、計算量が少なくて済む。
上述の最小分散無歪応答法において、空間相関行列Q(ω,Dh)内に位置(θs,Dh)への音声の空間情報を含めないことによって、漏れ音声を抑圧する自由度が向上し、漏れ音声のパワーをよりいっそう抑圧できる。この場合、ここで説明するフィルタ設計法では、空間相関行列Q(ω,Dh)を、式(5a)の右辺第二項、つまり、式(5d)で表す。フィルタW→(ω,θs,Dh)は式(4)や式(34)で与えられる。このとき、式(4)や式(34)に含まれる空間相関行列は、式(5d)で表される空間相関行列である。
AMNOR法は、目的方向の音声の劣化量Dとフィルタ出力信号に残留する雑音のパワーとのトレードオフ関係を踏まえて、目的方向の音声の劣化量Dを或る程度許容し(例えば劣化量Dを或る閾値D^以下に保つようにする)、[a]目的方向の仮想的な信号(以下、仮想目的信号という)に音源とマイクロホンとの間の伝達特性を作用させた信号と[b](例えば目的方向の音声が無い雑音環境でのM個のマイクロホンによる観測によって得られる)雑音との混合信号を入力としたときのフィルタ出力信号が最小2乗誤差の観点から仮想目的信号を最も良く再現する(つまり、フィルタ出力信号に含まれる雑音のパワーが最小となる)フィルタを求める方式である。
上述の説明では、空間相関行列Q(ω)、Rss(ω)、Rnn(ω)を、伝達特性を用いて表現した。しかし、上述のように、マイクロホンアレーによって観測して得られたアナログ信号を周波数領域に変換して得られる周波数領域信号を用いて空間相関行列Q(ω)、Rss(ω)、Rnn(ω)を表現することもできる。以下、空間相関行列Q(ω)について説明するが、Rss(ω)、Rnn(ω)についても同様である(Q(ω)をRss(ω)あるいはRnn(ω)に読み替えればよい)。なお、空間相関行列Rss(ω)は位置(θs,Dh)への音声のみが存在する環境でのマイクロホンアレー(M個のマイクロホンを含む)による観測によって得られたアナログ信号の周波数領域表現によって得られ、空間相関行列Rnn(ω)は位置(θs,Dh)への音声が無い環境(つまり雑音環境)でのマイクロホンアレー(M個のマイクロホンを含む)による観測によって得られたアナログ信号の周波数領域表現によって得られる。
本発明の実施形態1の機能構成および処理フローを図3と図4に示す。この実施形態1の音声スポット再生処理装置1は、AD変換部210、フレーム生成部220、周波数領域変換部230、フィルタ適用部240、時間領域変換部250、フィルタ設計部260、記憶部290を含む。
予め、フィルタ設計部260が音声スポット再生の対象となりえる離散的な位置(θi,Dg)ごとに、周波数ごとのフィルタW→(ω,θi,Dg)を計算しておく。音声スポット再生の対象となりえる離散的な方向の総数をI(Iは1以上の予め定められた整数であり、I≦Pを満たす)、離散的な距離の総数をG(Gは1以上の予め定められた整数である)とすると、W→(ω,θ1,D1),…,W→(ω,θi,D1),…,W→(ω,θI,D1),W→(ω,θ1,D2),…,W→(ω,θi,D2),…,W→(ω,θI,D2),…,W→(ω,θ1,Dg),…,W→(ω,θi,Dg),…,W→(ω,θI,Dg),…,W→(ω,θ1,DG),…,W→(ω,θi,DG),…,W→(ω,θI,DG)(1≦i≦I, 1≦g≦G, ω∈Ω; iとgは整数、Ωは周波数ωの集合)を事前に計算しておくのである。
音源200が音源信号ss(t)を出力する。この実施形態では、音源200からの音源信号ss(t)はアナログ信号であるとする。ただし、音源信号としてディジタル信号を用いることもできる。
AD変換部210が、音源信号ss(t)をディジタル信号s(t)へAD変換する。ここでtは離散時間のインデックスを表す。なお、ディジタル信号が音源信号である場合には、ステップS3の処理を行う必要がなく、音源信号をAD変換部210の出力信号であるs(t)と見なすことができる。
フレーム生成部220は、AD変換部210が出力したディジタル信号s(t)を入力とし、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(k)を出力する。kはフレーム番号のインデックスである。s(k)=[s((k-1)N+1),…,s(kN)]である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
周波数領域変換部230は、各フレームのディジタル信号s(k)を周波数領域の信号S(ω,k)に変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号S(ω,k)は、各周波数ω、フレームkごとに出力される。
フィルタ適用部240は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,k)に、スポット再生したい位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)を適用して、再生信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tを出力する(式(41)参照)。位置(θs,Dh)のインデックスs, hは、s∈{1,…,I}, h∈{1,…,G}であり、フィルタW→(ω,θs,Dh)は記憶部290に記憶されているので、例えば、ステップS6の処理の都度、フィルタ適用部240は、スポット再生したい位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)を記憶部290から取得すればよい。方向θsのインデックスsが集合{1,…,I}に属さない場合あるいは距離Dhのインデックスhが集合{1,…,G}に属さない場合、つまり、位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)がステップS1の処理で計算されていない場合、臨時に位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)をフィルタ設計部260に計算させてもよいし、あるいは方向θsに近い方向θs'や距離Dhに近い距離Dh'に対応するフィルタW→(ω,θs',Dh)やW→(ω,θs,Dh')やW→(ω,θs',Dh')を用いてよい。
時間領域変換部250は、第kフレームの各周波数ω∈Ωの再生信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]を時間領域に変換して第kフレームのフレーム単位時間領域信号x→(k)=[x1(k),…,xM(k)]を得て、さらに、得られたフレーム単位時間領域信号x→(k)=[x1(k),…,xM(k)]をフレーム番号のインデックスの順番に連結してスポット再生したい位置(θs,Dh)に向けて音声が強調された時間領域信号x→(t)=[x1(t),…,xM(t)]を出力する。周波数領域信号を時間領域信号に変換する方法は、ステップS5の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
Mチャネルの時間領域信号x1(t),…,xM(t)はそれぞれ、スピーカアレーを構成するM個のスピーカ280−1,…,280−Mのうち、チャネルに対応するスピーカで再生される。つまり、m番目(1≦m≦M)のチャネルの時間領域信号xm(t)はm番目のスピーカ280−mで再生される。
本発明の実施形態2の機能構成および処理フローを図13と図14に示す。この実施形態2の音声スポット再生処理装置2は、AD変換部210、フレーム生成部220、周波数領域変換部230、フィルタ適用部240、時間領域変換部250、フィルタ計算部261、記憶部290、AD変換部310、フレーム生成部320、周波数領域変換部330を含む。
音源200が音源信号ss(t)を出力する。この実施形態2では、音源200からの音源信号ss(t)はアナログ信号であるとする。ただし、音源信号としてディジタル信号を用いることもできる。
AD変換部210が、音源信号ss(t)をディジタル信号s(t)へAD変換する。ここでtは離散時間のインデックスを表す。なお、ディジタル信号が音源信号である場合には、ステップS12の処理を行う必要がなく、音源信号をAD変換部210の出力信号であるs(t)と見なすことができる。
フレーム生成部220は、AD変換部210が出力したディジタル信号s(t)を入力とし、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(k)を出力する。kはフレーム番号のインデックスである。s(k)=[s((k-1)N+1),…,s(kN)]である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
周波数領域変換部230は、各フレームのディジタル信号s(k)を周波数領域の信号S(ω,k)に変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号S(ω,k)は、各周波数ω、フレームkごとに出力される。
フィルタ計算部261が、現在の第kフレームで用いられる、位置(θs,Dh)に対応する周波数毎のフィルタW→(ω,θs,Dh,k)(ω∈Ω; Ωは周波数ωの集合)を計算する。
マイクロホンアレーを構成するM個のマイクロホン300−1,…,300−Mを用いて収音する。M個のマイクロホンの並べ方等はスピーカアレーと同じとすることが好ましい。
AD変換部310が、M個のマイクロホン300−1,…,300−Mで収音されたアナログ信号(収音信号)をディジタル信号x→(t)=[x1(t),…,xM(t)]へ変換する。tは離散時間のインデックスを表す。
フレーム生成部320は、AD変換部310が出力したディジタル信号x→(t)=[x1(t),…,xM(t)]を入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x→(k)=[x→ 1(k),…,x→ M(k)]を出力する。kはフレーム番号のインデックスである。x→ m(k)=[xm((k-1)N+1),…,xm(kN)](1≦m≦M)である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
周波数領域変換部330は、各フレームのディジタル信号x→(k)を周波数領域の信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]に変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X→(ω,k)は、各周波数ω、フレームkごとに出力され、記憶部290に蓄積される。
フィルタ適用部240は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,k)に、再生したい位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh,k)を適用して、再生信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]を出力する(式(42)参照)。
時間領域変換部250は、第kフレームの各周波数ω∈Ωの再生信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]を時間領域に変換して第kフレームのフレーム単位時間領域信号x→(k)=[x1(k),…,xM(k)]を得て、さらに、得られたフレーム単位時間領域信号x→(k)=[x1(k),…,xM(k)]をフレーム番号のインデックスの順番に連結して位置(θs,Dh)に向けて音声が強調された時間領域信号x→(t)=[x1(t),…,xM(t)]を出力する。周波数領域信号を時間領域信号に変換する方法は、ステップS14の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
Mチャネルの時間領域信号x1(t),…,xM(t)はそれぞれ、スピーカアレーを構成するM個のスピーカ280−1,…,280−Mのうち、チャネルに対応するスピーカで再生される。つまり、m番目(1≦m≦M)のチャネルの時間領域信号xm(t)はm番目のスピーカ280−mで再生される。
以下、本発明である音声スポット再生処理技術が有用なサービス例について述べる。
上述の実施形態に関わる音声スポット再生処理装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、音声スポット再生処理装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
Claims (15)
- Mを2以上の整数として、方向と距離で定まる所望の位置(スポット再生位置)に対してM個のスピーカで構成されるスピーカアレーで再生されるMチャネルの時間領域信号xを、音源信号が周波数領域に変換された周波数領域信号Sに、当該周波数領域信号SをMチャネルの周波数領域信号Xに変換するフィルタを周波数ごとに適用して得られた当該Mチャネルの周波数領域信号Xを時間領域に変換して得る音声スポット再生処理方法であって、
音声のスポット再生位置として想定される一つまたは複数の位置に含まれる各位置(ただし、各位置を識別するための方向をi、距離をgとする)への各スピーカからの音声の伝達特性ai,gを用いて、音声再生の対象となる位置について、上記周波数ごとの上記フィルタを求めるフィルタ設計ステップと、
上記フィルタ設計ステップで求められた上記フィルタを、上記周波数ごとに上記周波数領域信号Sに適用して上記Mチャネルの周波数領域信号Xを得るフィルタ適用ステップと
を有し、
上記スピーカアレーから放射された音声であって当該音声が反射物で反射した反射音の進行方向に受聴位置が存在する音声を双対音として、各上記伝達特性ai,gは、上記方向iと上記距離gで定まる位置への直接音の伝達特性と一つ以上の双対音の各伝達特性との和で表される
ことを特徴とする音声スポット再生処理方法。 - 請求項1に記載の音声スポット再生処理方法において、
各上記伝達特性ai,gは、上記直接音のステアリングベクトルと、反射による音の減衰および上記反射音の上記直接音に対する時間差が補正された一つ以上の上記双対音の各ステアリングベクトルとの和である
ことを特徴とする音声スポット再生処理方法。 - 請求項1に記載の音声スポット再生処理方法において、
各上記伝達特性ai,gは、実環境下において実測で得られたものである
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、音声再生の対象となる上記位置以外への音声のパワーが最小となるように、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、音声再生の対象となる上記位置でのSN比が最大となるように、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、M個の上記スピーカのうち一つのスピーカに対するフィルタ係数を一定値に固定した状態でスポット再生位置として想定される上記一つまたは複数の位置以外への音声のパワーが最小となるように、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、(1)音声再生の対象となる上記位置への音声の全帯域通過、および(2)一つ以上の抑圧点への音声の全帯域抑制、の条件の下、音声再生の対象となる上記位置と各上記抑圧点以外への音声のパワーが最小となるように、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、音声再生の対象となる上記位置i=s,g=hの伝達特性as,hを正規化することによって、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、音声再生の対象となる上記位置以外の各位置に対応する上記伝達特性ai,gによって表される空間相関行列を用いて、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、音声再生の対象となる上記位置への音声の劣化量を所定量以下とする条件の下、音声再生の対象となる上記位置以外への音声のパワーが最小となるように、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、マイクロホンアレーによって観測して得られた信号を周波数領域に変換して得られる周波数領域信号によって表される空間相関行列を用いて、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - 請求項1から請求項3のいずれかに記載の音声スポット再生処理方法において、
上記フィルタ設計ステップにおいて、スポット再生位置として想定される一つまたは複数の位置に含まれる各位置に対応する上記伝達特性ai,gによって表される空間相関行列を用いて、上記周波数ごとに上記フィルタが求められる
ことを特徴とする音声スポット再生処理方法。 - Mを2以上の整数として、方向と距離で定まる所望の位置(スポット再生位置)に対してM個のスピーカで構成されるスピーカアレーで再生されるMチャネルの時間領域信号xを、音源信号が周波数領域に変換された周波数領域信号Sに、当該周波数領域信号SをMチャネルの周波数領域信号Xに変換するフィルタを周波数ごとに適用して得られた当該Mチャネルの周波数領域信号Xを時間領域に変換して得る音声スポット再生処理装置であって、
音声のスポット再生位置として想定される一つまたは複数の位置に含まれる各位置(ただし、各位置を識別するための方向をi、距離をgとする)への各スピーカからの音声の伝達特性ai,gを用いて、音声再生の対象となる位置について、上記周波数ごとの上記フィルタを求めるフィルタ設計部と、
上記フィルタ設計部によって求められた上記フィルタを、上記周波数ごとに上記周波数領域信号Sに適用して上記Mチャネルの周波数領域信号Xを得るフィルタ適用部と
を含み、
上記スピーカアレーから放射された音声であって当該音声が反射物で反射した反射音の進行方向に受聴位置が存在する音声を双対音として、各上記伝達特性ai,gは、上記方向iと上記距離gで定まる位置への直接音の伝達特性と一つ以上の双対音の各伝達特性との和で表される
ことを特徴とする音声スポット再生処理装置。 - 請求項13に記載の音声スポット再生処理装置において、
上記双対音に対して各上記反射音を与える一つ以上の反射物をさらに含む
ことを特徴とする音声スポット再生処理装置。 - コンピュータに、請求項1から請求項12のいずれかに記載の音声スポット再生処理方法の処理を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011190803A JP5486568B2 (ja) | 2010-12-21 | 2011-09-01 | 音声スポット再生処理方法、装置、プログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010285184 | 2010-12-21 | ||
JP2010285184 | 2010-12-21 | ||
JP2011190803A JP5486568B2 (ja) | 2010-12-21 | 2011-09-01 | 音声スポット再生処理方法、装置、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012147414A JP2012147414A (ja) | 2012-08-02 |
JP5486568B2 true JP5486568B2 (ja) | 2014-05-07 |
Family
ID=46790478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011190803A Expired - Fee Related JP5486568B2 (ja) | 2010-12-21 | 2011-09-01 | 音声スポット再生処理方法、装置、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5486568B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5713988B2 (ja) * | 2012-12-11 | 2015-05-07 | 日本電信電話株式会社 | 音場収音再生装置、方法、およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3821228B2 (ja) * | 2002-11-15 | 2006-09-13 | ソニー株式会社 | オーディオ信号の処理方法および処理装置 |
-
2011
- 2011-09-01 JP JP2011190803A patent/JP5486568B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012147414A (ja) | 2012-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5486694B2 (ja) | 音声強調方法、装置、プログラム、記録媒体 | |
Chang et al. | Sound field control with a circular double-layer array of loudspeakers | |
US10382849B2 (en) | Spatial audio processing apparatus | |
US9820036B1 (en) | Speech processing of reflected sound | |
Teutsch et al. | Acoustic source detection and localization based on wavefield decomposition using circular microphone arrays | |
Poletti et al. | Sound-field reproduction systems using fixed-directivity loudspeakers | |
Poletti et al. | Sound reproduction systems using variable-directivity loudspeakers | |
GB2556093A (en) | Analysis of spatial metadata from multi-microphones having asymmetric geometry in devices | |
Chang et al. | Experimental validation of sound field control with a circular double-layer array of loudspeakers | |
Landschoot et al. | Model-based Bayesian direction of arrival analysis for sound sources using a spherical microphone array | |
Ahrens et al. | Wave field synthesis of a sound field described by spherical harmonics expansion coefficients | |
JP5738218B2 (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム | |
JP5486567B2 (ja) | 狭指向音声再生処理方法、装置、プログラム | |
JP6117142B2 (ja) | 変換装置 | |
JP5486568B2 (ja) | 音声スポット再生処理方法、装置、プログラム | |
Caviedes-Nozal et al. | A Bayesian spherical harmonics source radiation model for sound field control | |
JP5337189B2 (ja) | フィルタ設計における反射物の配置決定方法、装置、プログラム | |
Wang et al. | Spherical harmonic representation of the observed directional wave front in the time domain | |
Peled et al. | Objective performance analysis of spherical microphone arrays for speech enhancement in rooms | |
Bouchard et al. | Beamforming with microphone arrays for directional sources | |
JP5815489B2 (ja) | 音源別音声強調装置、方法、プログラム | |
Bountourakis et al. | Parametric spatial post-filtering utilising high-order circular harmonics with applications to underwater sound-field visualisation | |
Kowalczyk | Raking early reflection signals for late reverberation and noise reduction | |
JP2013135373A (ja) | ズームマイク装置 | |
Wang et al. | On the design of differential loudspeaker arrays with broadside radiation patterns |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5486568 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |