JP2013175869A - 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム - Google Patents
音響信号強調装置、遠近判定装置、それらの方法、及びプログラム Download PDFInfo
- Publication number
- JP2013175869A JP2013175869A JP2012038299A JP2012038299A JP2013175869A JP 2013175869 A JP2013175869 A JP 2013175869A JP 2012038299 A JP2012038299 A JP 2012038299A JP 2012038299 A JP2012038299 A JP 2012038299A JP 2013175869 A JP2013175869 A JP 2013175869A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- direct
- value
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、当該周波数領域信号のパワー推定値を得る。周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る。直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得、周波数領域信号のパワー推定値及び間接音のパワー推定値を用い、間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る。
【選択図】図9
Description
本発明はこのような点に鑑みてなされたものであり、音響信号の直間比推定値を精度よく求める技術を提供することを目的とする。
マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、当該周波数領域信号のパワー推定値を得る。また、上記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、上記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る。直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、上記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得、上記周波数領域信号のパワー推定値及び間接音のパワー推定値を用い、間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る。
実施例の説明の前に各実施例に対応する原理を説明する。
実施例1では、単一のマイクロホンアレーを用い、マイクロホンアレーから特定の距離範囲にある直接音源から発せられた音を強調して収音する。実施例2では、マイクロホンアレーに対する音源位置の遠近を判定する。
<間接音の等方到来モデル>
提案方式では、間接音の等方性を考慮した信号モデルを導入する。ここでは、パワー推定値としてパワースペクトル密度又はその推定値を用いた例を説明するが、これは本発明を限定しない。
M(M≧2)個のマイクロホンからなるマイクロホンアレーのm番目のマイクロホンでの受音信号を短時間フーリエ変換等によって周波数領域に変換すると、以下の周波数領域信号Xm(ω,t)が得られる。
Xm(ω,t)=(HD (m)(ω)+HR (m)(ω))S(ω,t) (1)
ただし、ωは周波数であり、HD (m)(ω)は直接音源からm番目のマイクロホンまでの直接音の伝達関数であり、HR (m)(ω)は直接音源からm番目のマイクロホンまでの間接音の伝達関数であり、S(ω,t)は直接音源での音を周波数領域に変換して得られる信号である。tは所定の時間区間であるフレームのインデックスであり、インデックスtに対応するフレームを「フレームt」と表現する。
ただし、HDref(ω)は直接音源からマイクロホンアレーの基準点(「基準点」という)までの伝達関数の直接音成分であり、HRref,θ(ω)は基準点からみて方向θから到来する間接音成分である。基準点はマイクロホンアレーの内部に存在してもよいし、マイクロホンアレーの外部に存在してもよい。マイクロホンアレーの内部とは、例えば、マイクロホンアレーを構成する複数のマイクロホンを通る直線上、当該複数のマイクロホンを通る線分で囲まれた平面の内部、又は当該複数のマイクロホンを通る面で囲まれた立体の内部を意味する。マイクロホンアレーの外部とは、マイクロホンアレーの内部以外の位置を意味する。例えば、マイクロホンアレーを構成する複数のマイクロホンそれぞれと基準点との距離は、マイクロホンそれぞれと直接音源との距離よりも短い。基準点の例は、マイクロホンアレーの中心点、何れか1個のマイクロホンの位置である。τθ (m)は、次式のように表される。
τθ (m)=-(1/c)uTpm
ここで第m番目のマイクロホンの位置pmは、
pm=[pm,x, pm,y, pm,z]T
であり、図12A及び12Bに示すように直接音源方向を表す単位ベクトルuは、
u=[sinθ, cosθ, 0]T
であり、cは音波の伝搬速度である。方向θから到来する音の上記基準点からm番目のマイクロホンまでの間での伝搬遅延であり、θDは基準点からみた直接音源方向であり、jは虚数単位であり、eは自然対数である。また、θについての積分は0≦θ<2πの範囲で行われる(以下の積分についても同様)。
ただし、αTはαの転置を表し、SD(ω,t)=HDref(ω)S(ω,t),SR,θ(ω,t)=HRref,θ(ω)S(ω,t)である。また、Aθ(ω)は、方向θからマイクロホンアレーに到来する周波数ωの音の基準点からm番目のマイクロホンまでの経路の伝達関数を要素とするM次元ベクトルである。Aθ(ω)の具体例は、マイクロホンアレーの基準点からみた方向θのアレイ・マニフォールド・ベクトル(array manifold vector)である。以下にアレイ・マニフォールド・ベクトルをAθ(ω)とした例を示す。
ただし、PD(ω)=E[|SD(ω,t)|2]t、PR,θ(ω)=E[|SR,θ(ω,t)|2]tである。W(ω)は、周波数領域のビームフォーマのフィルタ係数W1(ω),...,WM(ω)を要素とするベクトルW(ω)=[W1(ω),...,WM(ω)]Tである(参考文献1の第4.1章(P70,71)等参照)。U(ω)は、pq成分(p,q∈{1,...,M})に要素Upq(ω)=E[Xp(ω,t)Xq *(ω,t)]tを持つM×M行列(マイクロホンアレーの入力信号空間相関行列)である。E[α(t)]tはα(t)のtについての期待値演算を表し、αHはαの複素共役転置を表し、α*はαの複素共役を表す。D(ω,θ)はビームフォーマによって形成される指向特性を表す関数(ω,θを定義域とする関数)である。すなわち、D(ω,θ)はビームフォーマによって形成される指向性の形状を表す。例えば、D(ω,θ)は以下のように表される。
式(4)において間接音がマイクロホンアレーに等方的に到来すると仮定できる音場では、PR,θ(ω)はθに依らない値PR −(ω)に置き換えることができる。この場合、式(4)は以下のように変形できる。
PR(ω)=R(ω)PND(ω) (9)
ただし、θ’は|D(ω,θ)|2を最大化するθを意味する。図5に、式(10)の分子と分母を模式的に例示する。
ただし、||Θ||は角度領域Θの大きさを表す0より大きな有理数である。例えば、||Θ||は以下を満たす。
角度領域Θの具体例は、直接音源方向θDを除く何れかの角度領域、直接音源方向θDの逆方向を含む角度領域、|D(ω,θ)|2を最大化する方向θを含む角度領域、予め定められた角度領域の候補のうち|D(ω,θ)|2の平均値を最大化する角度領域などである。
処理対象信号Y(ω,t)の一例は、周波数領域信号X1(ω,t),…,XM(ω,t)の合成信号である。処理対象信号Y(ω,t)の他の例は、何れか1個のマイクロホンm’(m’∈{1,…,M})に対応する周波数領域信号Xm’(ω,t)や、Xm’(ω,t)の重み付け値である。
以下ではパワースペクトル密度又はその推定値をパワー推定値とした例を示す。
図9に例示するように、直間比計算部44は、受音パワー推定部441と、重み係数記憶部442と、指向性形成部443と、直接音抑圧パワー推定部444と、指向性形状分析部445と、間接音パワー推定部446と、直間比推定部447とを備える。
PR,L(ω)=R(ω)PND,L(ω) (20)
図6に例示するように、信号調整部45は、例えば、フィルタ係数算出部451と、乗算部452とを具備する。フィルタ係数算出部451は、直間比推定値DRRL又はDRRL(ω)を入力として、直間比推定値DRRL又はDRRL(ω)に応じた大きさのゲイン(フィルタ係数)G(ω,t)を定めて出力する。
ただし、t=(L−1)+1,...,(L−1)+Kである。直間比推定値DRRL又はDRRL(ω)の最小値と最大値の間の任意の値が閾値Th1とされる。閾値Th1を最小値(0)に近づけると音質は向上する。逆に閾値Th1を最大値に近づけると雑音抑圧効果は高めるが受音信号の歪みが大きくなり音質が劣化する。このように閾値Th1は、音質と雑音抑圧との関係でトレードオフの関係を持つ。よって、閾値Th1は、このトレードオフの関係を考慮した上で、利用目的に応じて経験的に決定される。
ただし、t=(L−1)+1,...,(L−1)+Kである。直間比推定値DRRL又はDRRL(ω)の最小値と最大値の間の任意の値が閾値Th2とされる。
G(ω,t)=DRRL (t=(L-1)+1,...,(L-1)+K) (25)
G(ω,t)=DRRL(ω) (t=(L-1)+1,...,(L-1)+K) (26)
G(ω,t)=F(DRRL) (t=(L-1)+1,...,(L-1)+K) (27)
G(ω,t)=F(DRRL(ω)) (t=(L-1)+1,...,(L-1)+K) (28)
ただし、Fは単調増加関数又は単調減少関数などの関数である。
ただしγ(ω)は重み係数であり、γ(ω)の一例は1/Γである。Γは周波数の総数であり、例えば、周波数領域変換部421〜42Mが短時間フーリエ変換を行う場合、Γはは周波数ビンの総数となる。
例えば、上述の周波数領域で行われた処理の一部が時間領域で実行されてもよい。
例えば、上述の実施形態では、指向性形成部443が、周波数領域のフィルタ係数W1(ω),...,WM(ω)を周波数領域信号X1(ω,t),…,XM(ω,t)に適用し、それによって直接音源方向θDから到来した信号成分を抑圧した直接音抑圧信号ND(ω,t)を生成した。しかしながら、時間領域で受音信号x1(n),…,xM(n)のディジタル信号に対して直接音源方向から到来した信号成分を抑圧する処理を行い、それによって得られた信号を周波数領域に変換して直接音抑圧信号ND(ω,t)が生成されてもよい。すなわち、受音信号x1(n),…,xM(n)のディジタル信号に対し、フィルタ係数W1(ω),...,WM(ω)に対応する時間領域のフィルタ係数を畳み込み、その結果を周波数領域に変換して直接音抑圧信号ND(ω,t)が生成されてもよい。
また、上述の実施形態では、処理対象信号生成部43が処理対象信号Y(ω,t)を出力し、対象信号調整部45が、直間比推定値DRRに応じた大きさのゲインを処理対象信号Y(ω,t)に乗じた。しかしながら、処理対象信号生成部43がY(ω,t)を時間領域に変換した信号y(n’)を出力し、対象信号調整部45が、直間比推定値DRRに応じた大きさのゲインを時間領域の信号y(n’)に乗じてもよい。この場合には逆周波数領域変換部46は不要となる。
120 遠近判定装置
Claims (11)
- マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定部と、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定部と、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定部と、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定部と、
前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整部を有し、
前記直間比推定値が表す前記比率が所定の閾値よりも大きい場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記所定の閾値よりも小さい場合に前記処理対象信号に乗じられる前記ゲインよりも大きい、音響信号強調装置。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定部と、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定部と、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定部と、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定部と、
前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整部を有し、
前記直間比推定値が表す前記比率が所定の閾値よりも大きい場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記所定の閾値よりも小さい場合に前記処理対象信号に乗じられる前記ゲインよりも小さい、音響信号強調装置。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定部と、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定部と、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定部と、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定部と、
前記直間比推定値を用い、前記直接音源の遠近判定を行って遠近判定結果を得る遠近判定部を有し、
前記直間比推定値は、所定の時間区間であるフレームで受音された前記受音信号に基づいて得られ、
前記遠近判定部は、1個以上のフレームからなる判定区間で受音された前記受音信号に基づいて得られた前記直間比推定値に対応する判定値と、前記判定区間よりも多くの個数のフレームからなる基準区間で受音された前記受音信号に基づいて得られた複数の前記直間比推定値に対応する基準値とを用いた比較判定によって、前記判定区間での前記直接音源の遠近判定を行う、遠近判定装置。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定部と、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定部と、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定部と、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定部と、
前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整部を有し、
前記直間比推定値が表す前記比率が第1値である場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記第1値よりも小さな第2値である場合に前記処理対象信号に乗じられる前記ゲインよりも大きい、音響信号強調装置。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定部と、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定部と、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定部と、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定部と、
前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整部を有し、
前記直間比推定値が表す前記比率が第1値である場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記第1値よりも小さな第2値である場合に前記処理対象信号に乗じられる前記ゲインよりも小さい、音響信号強調装置。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定ステップと、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定ステップと、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定ステップと、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定ステップと、
前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整ステップを有し、
前記直間比推定値が表す前記比率が所定の閾値よりも大きい場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記所定の閾値よりも小さい場合に前記処理対象信号に乗じられる前記ゲインよりも大きい、音響信号強調方法。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定ステップと、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定ステップと、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定ステップと、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定ステップと、
前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整ステップを有し、
前記直間比推定値が表す前記比率が所定の閾値よりも大きい場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が上記所定の閾値よりも小さい場合に前記処理対象信号に乗じられる前記ゲインよりも小さい、音響信号強調方法。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定ステップと、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定ステップと、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定ステップと、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定ステップと、
前記直間比推定値を用い、前記直接音源の遠近判定を行って遠近判定結果を得る遠近判定ステップを有し、
前記直間比推定値は、所定の時間区間であるフレームで受音された前記受音信号に基づいて得られ、
前記遠近判定ステップは、1個以上のフレームからなる判定区間で受音された前記受音信号に基づいて得られた前記直間比推定値に対応する判定値と、前記判定区間よりも多くの個数のフレームからなる基準区間で受音された前記受音信号に基づいて得られた複数の前記直間比推定値に対応する基準値とを用いた比較判定によって、前記判定区間での前記直接音源の遠近判定を行う、遠近判定方法。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定ステップと、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定ステップと、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定ステップと、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定ステップと、
前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整ステップを有し、
前記直間比推定値が表す前記比率が第1値である場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記第1値よりも小さな第2値である場合に前記処理対象信号に乗じられる前記ゲインよりも大きい、音響信号強調方法。 - マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定ステップと、
前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定ステップと、
前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定ステップと、
前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定ステップと、
前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整ステップを有し、
前記直間比推定値が表す前記比率が第1値である場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記第1値よりも小さな第2値である場合に前記処理対象信号に乗じられる前記ゲインよりも小さい、音響信号強調方法。 - 請求項1、2、4若しくは5の音響信号強調装置、又は請求項3の遠近判定装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012038299A JP5635024B2 (ja) | 2012-02-24 | 2012-02-24 | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012038299A JP5635024B2 (ja) | 2012-02-24 | 2012-02-24 | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013175869A true JP2013175869A (ja) | 2013-09-05 |
JP5635024B2 JP5635024B2 (ja) | 2014-12-03 |
Family
ID=49268423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012038299A Active JP5635024B2 (ja) | 2012-02-24 | 2012-02-24 | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5635024B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110364161A (zh) * | 2019-08-22 | 2019-10-22 | 北京小米智能科技有限公司 | 响应语音信号的方法、电子设备、介质及*** |
CN110444220A (zh) * | 2019-08-01 | 2019-11-12 | 浙江大学 | 一种多模态远程语音感知方法及装置 |
JP2020510865A (ja) * | 2017-02-27 | 2020-04-09 | ブイタッチ・カンパニー・リミテッド | 音声認識トリガーを提供するための方法、システムおよび非一過性のコンピュータ読み取り可能な記録媒体 |
CN118098260A (zh) * | 2024-03-26 | 2024-05-28 | 荣耀终端有限公司 | 一种语音信号处理方法及相关设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04298797A (ja) * | 1991-03-08 | 1992-10-22 | Mitsubishi Electric Corp | 音声認識装置 |
JPH1152977A (ja) * | 1997-07-31 | 1999-02-26 | Toshiba Corp | 音声処理方法および装置 |
US20020138254A1 (en) * | 1997-07-18 | 2002-09-26 | Takehiko Isaka | Method and apparatus for processing speech signals |
JP2005303574A (ja) * | 2004-04-09 | 2005-10-27 | Toshiba Corp | 音声認識ヘッドセット |
JP2006197552A (ja) * | 2004-12-17 | 2006-07-27 | Univ Waseda | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
JP2011055211A (ja) * | 2009-09-01 | 2011-03-17 | Nippon Telegr & Teleph Corp <Ntt> | 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム |
-
2012
- 2012-02-24 JP JP2012038299A patent/JP5635024B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04298797A (ja) * | 1991-03-08 | 1992-10-22 | Mitsubishi Electric Corp | 音声認識装置 |
US20020138254A1 (en) * | 1997-07-18 | 2002-09-26 | Takehiko Isaka | Method and apparatus for processing speech signals |
JPH1152977A (ja) * | 1997-07-31 | 1999-02-26 | Toshiba Corp | 音声処理方法および装置 |
JP2005303574A (ja) * | 2004-04-09 | 2005-10-27 | Toshiba Corp | 音声認識ヘッドセット |
JP2006197552A (ja) * | 2004-12-17 | 2006-07-27 | Univ Waseda | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
US20090323977A1 (en) * | 2004-12-17 | 2009-12-31 | Waseda University | Sound source separation system, sound source separation method, and acoustic signal acquisition device |
JP2011055211A (ja) * | 2009-09-01 | 2011-03-17 | Nippon Telegr & Teleph Corp <Ntt> | 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020510865A (ja) * | 2017-02-27 | 2020-04-09 | ブイタッチ・カンパニー・リミテッド | 音声認識トリガーを提供するための方法、システムおよび非一過性のコンピュータ読み取り可能な記録媒体 |
CN110444220A (zh) * | 2019-08-01 | 2019-11-12 | 浙江大学 | 一种多模态远程语音感知方法及装置 |
CN110444220B (zh) * | 2019-08-01 | 2023-02-10 | 浙江大学 | 一种多模态远程语音感知方法及装置 |
CN110364161A (zh) * | 2019-08-22 | 2019-10-22 | 北京小米智能科技有限公司 | 响应语音信号的方法、电子设备、介质及*** |
US11295740B2 (en) | 2019-08-22 | 2022-04-05 | Beijing Xiaomi Intelligent Technology Co., Ltd. | Voice signal response method, electronic device, storage medium and system |
CN118098260A (zh) * | 2024-03-26 | 2024-05-28 | 荣耀终端有限公司 | 一种语音信号处理方法及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
JP5635024B2 (ja) | 2014-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101456866B1 (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
CN107018470B (zh) | 一种基于环形麦克风阵列的语音记录方法及*** | |
US8675890B2 (en) | Speaker localization | |
US9042573B2 (en) | Processing signals | |
CN105981404B (zh) | 使用麦克风阵列的混响声的提取 | |
JP4724054B2 (ja) | 特定方向収音装置、特定方向収音プログラム、記録媒体 | |
CN111044973B (zh) | 一种用于麦克风方阵的mvdr目标声源定向拾音方法 | |
JP5079761B2 (ja) | 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム | |
JP2010517047A (ja) | マルチセンサ音源定位 | |
CN110534126B (zh) | 一种基于固定波束形成的声源定位和语音增强方法及*** | |
JP5772151B2 (ja) | 音源分離装置、プログラム及び方法 | |
JP2001309483A (ja) | 収音方法および収音装置 | |
Huleihel et al. | Spherical array processing for acoustic analysis using room impulse responses and time-domain smoothing | |
JP5738218B2 (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム | |
JP5635024B2 (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム | |
JP4928382B2 (ja) | 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体 | |
JP5175262B2 (ja) | 音声取得装置 | |
JP5143802B2 (ja) | 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム | |
JPH09261792A (ja) | 受音方法及びその装置 | |
JP5698166B2 (ja) | 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
JP3588576B2 (ja) | 収音装置および収音方法 | |
JP5683140B2 (ja) | 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム | |
JP5713933B2 (ja) | 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
JP5826465B2 (ja) | 瞬時直間比推定装置、雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム | |
JP2010103617A (ja) | 発話向き推定装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140918 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5635024 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |