JP5690082B2 - 音声信号処理装置、方法、プログラム、及び記録媒体 - Google Patents
音声信号処理装置、方法、プログラム、及び記録媒体 Download PDFInfo
- Publication number
- JP5690082B2 JP5690082B2 JP2010114351A JP2010114351A JP5690082B2 JP 5690082 B2 JP5690082 B2 JP 5690082B2 JP 2010114351 A JP2010114351 A JP 2010114351A JP 2010114351 A JP2010114351 A JP 2010114351A JP 5690082 B2 JP5690082 B2 JP 5690082B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- predetermined spatial
- sound image
- degree
- user operation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
- Electrophonic Musical Instruments (AREA)
Description
第3の技術手段は、第2の技術手段において、前記ユーザインタフェースは、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分の量を周波数帯域毎に可視化して表示することを特徴としたものである。
第4の技術手段は、第2又は第3の技術手段において、前記ユーザインタフェースは、前記相関信号増加部における増加の度合いを周波数帯域毎に変更するユーザ操作を受け付け可能に構成されており、前記パラメータ制御部は、前記ユーザインタフェースで受け付けられたユーザ操作に従って、前記増加の度合い及び変更の対象となった周波数帯域を示すパラメータを変更することを特徴としたものである。
第6の技術手段は、第1又は第5の技術手段において、前記ユーザインタフェースは、前記無相関信号減少部における減少の度合いを周波数帯域毎に変更するユーザ操作を受け付け可能に構成されており、前記パラメータ制御部は、前記ユーザインタフェースで受け付けられたユーザ操作に従って、前記減少の度合い及び変更の対象となった周波数帯域を示すパラメータを変更することを特徴としたものである。
第9の技術手段は、第1〜第8のいずれか1の技術手段において、前記ユーザインタフェースは、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分の量を可視化して表示することを特徴としたものである。
第10の技術手段は、第9の技術手段において、前記ユーザインタフェースは、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分の量を周波数帯域毎に可視化して表示することを特徴としたものである。
第12の技術手段は、複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する音声信号処理方法であって、信号分離部が、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、相関信号増加部が、前記分離ステップで分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、ユーザインタフェースが、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分の量を可視化して表示し、前記増加ステップにおける増加の度合いを変更するユーザ操作を受け付ける受付ステップと、パラメータ制御部が、前記受付ステップで受け付けられたユーザ操作に従って、前記増加の度合いを示すパラメータを変更する変更ステップと、を有することを特徴としたものである。
第13の技術手段は、複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する音声信号処理方法であって、信号分離部が、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、相関信号増加部が、前記分離ステップで分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、ユーザインタフェースが、前記増加ステップにおける増加の度合いを周波数帯域毎に変更するユーザ操作及び前記所定の空間的範囲を変更するユーザ操作を受け付ける受付ステップと、パラメータ制御部が、前記受付ステップで受け付けられたユーザ操作に従って、前記増加の度合い及び変更の対象となった周波数帯域を示すパラメータ、及び/又は、前記所定の空間的範囲を示すパラメータを変更する変更ステップと、を有することを特徴としたものである。
第15の技術手段は、コンピュータに、複数のスピーカに出力するための入力音声信号を、2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、該分離ステップで分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、前記コンピュータのユーザインタフェースで、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分の量を可視化して表示し、前記増加ステップにおける増加の度合いを変更するユーザ操作を受け付ける受付ステップと、該受付ステップで受け付けられたユーザ操作に従って、前記増加の度合いを示すパラメータを変更する変更ステップと、を実行させるためのプログラムである。
第16の技術手段は、コンピュータに、複数のスピーカに出力するための入力音声信号を、2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、該分離ステップで分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、前記コンピュータのユーザインタフェースで、前記増加ステップにおける増加の度合いを周波数帯域毎に変更するユーザ操作及び前記所定の空間的範囲を変更するユーザ操作を受け付ける受付ステップと、該受付ステップで受け付けられたユーザ操作に従って、前記増加の度合い及び変更の対象となった周波数帯域を示すパラメータ、及び/又は、前記所定の空間的範囲を示すパラメータを変更する変更ステップと、を実行させるためのプログラムである。
第17の技術手段は、第14〜16のいずれか1の技術手段におけるプログラムを記録したコンピュータ読み取り可能な記録媒体である。
まず、前処理部21は、1セグメントの半分の長さの音声データを、図1における音声信号抽出部12から読み出す。ここで、音声データとは、例えば48kHzなどの標本化周波数で標本化された2チャネルの離散音声信号波形を指すものとする。そして、セグメントとは、ある一定の長さの標本点群からなる音声データ区間であり、ここでは後ほど離散フーリエ変換の対象となる区間長を指すものとする。その値は例えば1024とする。この例では、1セグメントの半分の長さである512点の音声データが読み出し対象となる。
x′R(m)=w(m)xR(m) (2)
と計算される。このHann窓を用いると、例えば標本点m0(ただし、M/2≦m0<M)の入力信号xL(m0)にはsin2((m0/M)π)が乗算される。そして、その次の回の読み込みではその同じ標本点がm0−M/2として読み込まれるので、
XL(k)=DFT(x′L(n)) 、
XR(k)=DFT(x′R(n)) (3)
I=floor(21.4log10(0.00437fmax+1)) (4)
ただし、floor(a)はフロア関数で、実数aを越えない整数の最大値を表す。
b(i)=24.7(0.00437Fc (i)+1) (6)
よって、その中心周波数から低域側と高域側にそれぞれERB/2の周波数幅だけシフトすることによりi番目の小帯域の両側の境界周波数FL (i)、FU (i)を求めることができる。したがって、i番目の小帯域には、KL (i)番目の線スペクトルからKU (i)番目の線スペクトルが含まれる。ここで、KL (i)、KU (i)はそれぞれ次の数式(7)、(8)で表される。
KL (i)=ceil(21.4log10(0.00437FL (i)+1)) (7)
KU (i)=floor(21.4log10(0.00437FU (i)+1)) (8)
ただし、ceil(a)は天井関数で、実数aより小さくならない整数の最小値を表す。また、離散フーリエ変換した後の線スペクトルは、直流成分すなわち例えばXL(0)を除いて、M/2(ただし、Mは偶数)を境に対称となっている。すなわち、XL(k)とXL(M−k)は0<k<M/2の範囲で複素共役の関係になる。したがって、以下ではKU (i)≦M/2の範囲を分析の対象として考え、k>M/2の範囲については複素共役の関係にある対称の線スペクトルと同じ扱いとする。
xL(m)= s(m)+nL(m)、
xR(m)=αs(m)+nR(m) (13)
と表される。ここで、s(m)は左右の相関信号、nL(m)は左チャネルの音声信号から相関信号s(m)を減算したものであって(左チャネルの)無相関信号として定義できるもの、nR(m)は右チャネルの音声信号から相関信号s(m)を減算したものであって(右チャネルの)無相関信号として定義できるものである。また、αは相関信号の左右音圧バランスの程度を表す正の実数である。
x′L(m)=w(m){ s(m)+nL(m)}= s′(m)+n′L(m)、
x′R(m)=w(m){αs(m)+nR(m)}=αs′(m)+n′R(m)
(14)
XL(k)= S(k)+NL(k)、
XR(k)=αS(k)+NR(k) (15)
XL (i)(k)= S(i)(k)+NL (i)(k)、
XR (i)(k)=α(i)S(i)(k)+NR (i)(k)
ただし、KL (i)≦k≦KU (i) (16)
と表現される。ここで、α(i)はi番目の小帯域におけるαを表す。以後、i番目の小帯域における相関信号S(i)(k)、無相関信号NL (i)(k)、NR (i)(k)をそれぞれ、
S(i)(k)=S(k)、
NL (i)(k)=NL(k)、
NR (i)(k)=NR(k)
ただし、KL (i)≦k≦KU (i) (17)
とおくこととする。
PL (i)=PS (i)+PN (i)、
PR (i)=[α(i)]2PS (i)+PN (i) (18)
と表される。ここで、PS (i)、PN (i)はi番目の小帯域におけるそれぞれ相関信号、無相関信号の電力であり、
est(S(i)(k))=μ1XL (i)(k)+μ2XR (i)(k) (23)
とおくと、推定誤差εは、
ε=est(S(i)(k))−S(i)(k) (24)
と表される。ここで、est(A)はAの推定値を表すものとする。そして二乗誤差ε2が最少になるとき、εとXL (i)(k)、XR (i)(k)はそれぞれ直交するという性質を利用すると、
E[ε・XL (i)(k)]=0 、 E[ε・XR (i)(k)]=0 (25)
という関係が成り立つ。数式(16)、(19)、(21)〜(24)を利用すると、数式(25)から次の連立方程式が導出できる。
(1−μ1−μ2α(i))PS (i)−μ1PN (i)=0
α(i)(1−μ1−μ2α(i))PS (i)−μ2PN (i)=0
(26)
Pest(S) (i)=(μ1+α(i)μ2)2PS (i)+(μ1 2+μ2 2)PN (i) (28)
を満たす必要があるため、この式から推定値を次式のようにスケーリングする。なお、est′(A)はAの推定値をスケーリングしたものを表す。
est(NL (i)(k))=μ3XL (i)(k)+μ4XR (i)(k) (30)
est(NR (i)(k))=μ5XL (i)(k)+μ6XR (i)(k) (31)
とおくことにより、上述の求め方と同様にして、媒介変数μ3〜μ6は、
ここでスライダ54は、左チャネルから右チャネルにかけての空間を表すシンボルであり、その両端を左右スピーカに見立てたとき、シンボル55aの位置を含む抽出対象範囲の方向の音声信号(つまりその方向の相関信号)を増圧するという意味を表している。
シンボル55aは、ユーザによるドラッグ操作などすることによって、その位置を左右に移動させることができるようになっている。その際、シンボル55bとシンボル55cとはその幅を保ってシンボル55aとともに移動する。その稼働範囲は、スライダ54の右端にシンボル55cの右端が達するところから、スライダ54の左端にシンボル55bの左端が達するところまでである。
また、シンボル56a、シンボル56bは、スライダ54のうちシンボル55a〜55cを除く領域のうち、それぞれ左側の領域を示すシンボル、右側の領域を示すシンボルであり、シンボル55a〜55cの移動によってそれらの幅は変わり、無くなることもある。
図1におけるパラメータ制御部17では、ユーザインタフェース制御部18から入力された値を音声信号処理部13で必要となるパラメータに変換する。具体的には以下に示す変換を行う。
この状態で、図5のGUI画面50においてボタン59cをユーザがマウスクリックなどによって押すと、ボタン59cは例えば「一時停止」を表すシンボルに変わるとともに、選択した曲が再生され始める。
g1 2+g2 2=1+[α(i)]2 (42)
となる。
y′L(m)=DFT−1(YL(k))
y′R(m)=DFT−1(YR(k)) (44)
ここで、数式(3)で説明したように、離散フーリエ変換した信号は、窓関数乗算後の信号であったため、逆変換して得られた信号y′L(m)、y′R(m)も窓関数が乗算された状態となっている。窓関数は数式(1)に示すような関数であり、読み込みは半セグメント長ずつずらしながら行ったため、前述した通り、1つ前に処理したセグメントの先頭から半セグメント長ずつずらしながら出力バッファに加算していくことにより変換後のデータを得る。
y″j(m)=y′j(m)+B (45)
となる。Bはバイアスを表す定数であり、1回前の出力音声信号と今回の処理の出力音声信号が出力バッファで加算された後、図10のグラフ100のように波形が連続するように決定される。
したがって、次式のように、加算するバイアス成分(直流成分)の振幅の大きさを時間的に減少させることにより収束させることが好ましい。なお、「時間的に減少させる」とは、加算時点からの経過時間、例えば処理セグメント毎の開始点や不連続点の開始点からの経過時間に比例して減少させることを意味する。
y″j(m)=y′j(m)+B×((M−mσ)/M) (46)
ただし、σはその減少の程度を調整するパラメータであり、例えば0.5などとする。なお、減少のためにはB,σはいずれも正とする。さらに、加算用に求めたバイアスの値の絶対値がある一定以上となった場合には、その値に応じてσを動的に増減させるなどしてもよい。増減させるタイミングは次の処理セグメントでよい。これに限らず、減少させるための比例定数に相当するσを、バイアス値の絶対値(直流成分の振幅の大きさ)に応じて変更する(変化させる)ようにしておけば、フィードバック機能が働き、同様の効果が得られる。ただ、これらの方法では音声波形の振幅がオーバフローしないことを保障するものではない。
例えば、上述した右側の音(ピアノの音)が、例えば図5のシンボル55aの位置から聞こえてくるものであるとして、シンボル57のようにツマミを上げ、シンボル58L、シンボル58Rの無相関信号のツマミは下げている状態を考える。この場合、ピアノの音の左右の音圧バランスは元の信号から変えず、シンボル55cとシンボル55bの幅から決定される区間に含まれる音像が増圧され、その音像以外が全て抑圧されることにより、相対的にピアノの音だけがより抽出されて聞こえる。
図15で例示するGUI画面150は、そのようにして別の一組の抽出対象範囲も表示させた場合の設定画面である。GUI画面150では、スライダ154上に、左から説明すると、シンボル156aで示す非抽出対象範囲、シンボル155a,155c,155dで示す組の抽出対象範囲、シンボル156bで示す非抽出対象範囲、シンボル155b,155e,155fで示す組の抽出対象範囲、シンボル156cで示す非抽出対象範囲が表示されている。この場合でも抽出対象範囲については位置や幅を変えることができるものとする。また、シンボル155a,155bには図5のGUI画面50と同様にそれぞれシンボル157a,157bで示すようにツマミが表示されており、増圧の度合いも抽出対象範囲毎に調整できるものとする。
このことにより、例えば放送番組における台詞の強調や、音楽コンテンツにおけるある楽器音の強調などを柔軟に行うことが可能となる。また、例えば、中央の音(ボーカルの音)がシンボル165bの位置から、左側の音(ギターの音)がシンボル165aの位置から、右側の音(ピアノの音)がシンボル165cの位置から、それぞれ聞こえてくるものであるとして、シンボル167bのようにツマミを上げ、シンボル167a,167cのようにツマミをこれに比べて低く下げると、ボーカルの音である中央付近からの音像が強調されて聞こえる。このように、特定の方向の音像のツマミだけを他と比べ相対的に上げることにより、その方向の音像を強調されて聴くことができる。
上述した各例においては、このようにして本発明により増圧等が施された音声信号を左右のスピーカだけで再生させることを前提に説明したが、マルチチャネル再生方式より広いスイートスポットが得られる波面合成再生方式で再生することが、増圧の効果が狭い聴取エリアに限られず広がることから好ましい。なお、波面合成再生方式とは、直線状または面状に並べたスピーカ群によって音の波面を合成する再生方式であり、例えばWave Field Synthesis(WFS)方式は直線状に並べたスピーカ群(スピーカアレイ)を用いる現実的な実装方法の1つとして近年盛んに研究されている。WFS方式によって提供される音響空間内においてスピーカアレイと対面して音を聴いている受聴者は、実際にはスピーカアレイから放射される音が、スピーカアレイの後方に仮想的に存在する音源(仮想音源)から放射されているかのような感覚を受ける。したがって、このような方式では、広い聴取エリアで本発明に係る増圧の効果を享受でき、例えば横に並んだ複数の聴取者が同時に増圧の効果を享受できる。本発明に係る音声信号処理は、マルチチャネル再生方式での再生であっても波面合成再生方式での再生であっても基本的に同じであり、例えばθ0とy0の決め方も同じである。
さらに、相関信号や無相関信号の増減について、相関信号や無相関信号そのものの増減として説明したが、相関信号から生成された信号、相関信号及び無相関信号から生成された信号、無相関信号から生成された信号を、増加または増減の対象としてもよい。このような処理によっても、間接的には相関信号や無相関信号の音圧を変更することができるため、本発明に含まれる。
さらに、上述した各例では、無相関信号について減圧させるために減少させる手段を設けた例と、増減させるために増加及び減少させる手段の双方を設けた例を挙げている。無相関信号について減少させる手段を少なくとも設けることで、図5や図12等で例を挙げたように、より相関信号の増圧の効果が増すため好ましいが、一方で、無相関信号について増圧のために増加させる手段だけを設けることもできる。
本発明に係る音声信号処理装置は、例えばパーソナルコンピュータ(PC)や光ディスク再生装置、音楽再生機能付きの携帯情報端末、テレビ装置、プロジェクタ、あるいは小型の音声処理専用装置など、音声データ再生装置や音声データ再生装置付きの装置に利用できる。PCでは入力デバイスはマウスなどとなるが、携帯情報端末ではボタン操作やタッチパッドなどとなる。また、光ディスク再生装置や小型の処理専用装置では、本体に設置してあるボタン操作や、あるいはGUI画面をモニタ装置やテレビ装置などの表示デバイスに出力させるとともにリモートコントローラなどによって操作してもよい。また、この音声データ再生装置は、音声のみを取り扱う装置として構成することができるだけでなく、テレビ装置やプロジェクタ等で例示したように、映像の伴う装置に組み込むこともできる。
Claims (17)
- 複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する音声信号処理装置であって、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する信号分離部と、該信号分離部で分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる相関信号増加部と、前記信号分離部で分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分を減少させる無相関信号減少部と、該無相関信号減少部における減少の度合いを変更するユーザ操作を受け付けるためのユーザインタフェースと、該ユーザインタフェースで受け付けられたユーザ操作に従って、前記減少の度合いを示すパラメータを変更するパラメータ制御部とを備えたことを特徴とする音声信号処理装置。
- 複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する音声信号処理装置であって、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する信号分離部と、該信号分離部で分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる相関信号増加部と、該相関信号増加部における増加の度合いを変更するユーザ操作を受け付けるためのユーザインタフェースと、該ユーザインタフェースで受け付けられたユーザ操作に従って、前記増加の度合いを示すパラメータを変更するパラメータ制御部とを備え、
前記ユーザインタフェースは、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分の量を可視化して表示することを特徴とする音声信号処理装置。 - 前記ユーザインタフェースは、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分の量を周波数帯域毎に可視化して表示することを特徴とする請求項2に記載の音声信号処理装置。
- 前記ユーザインタフェースは、前記相関信号増加部における増加の度合いを周波数帯域毎に変更するユーザ操作を受け付け可能に構成されており、前記パラメータ制御部は、前記ユーザインタフェースで受け付けられたユーザ操作に従って、前記増加の度合い及び変更の対象となった周波数帯域を示すパラメータを変更することを特徴とする請求項2又は3に記載の音声信号処理装置。
- 前記信号分離部で分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分を減少させる無相関信号減少部をさらに備え、
前記ユーザインタフェースは、前記無相関信号減少部における減少の度合いを変更するユーザ操作を受け付け可能に構成されており、前記パラメータ制御部は、前記ユーザインタフェースで受け付けられたユーザ操作に従って、前記減少の度合いを示すパラメータを変更することを特徴とする請求項2〜4のいずれか1項に記載の音声信号処理装置。 - 前記ユーザインタフェースは、前記無相関信号減少部における減少の度合いを周波数帯域毎に変更するユーザ操作を受け付け可能に構成されており、前記パラメータ制御部は、前記ユーザインタフェースで受け付けられたユーザ操作に従って、前記減少の度合い及び変更の対象となった周波数帯域を示すパラメータを変更することを特徴とする請求項1又は5に記載の音声信号処理装置。
- 前記ユーザインタフェースは、前記所定の空間的範囲を変更するユーザ操作を受け付け可能に構成されており、前記パラメータ制御部は、前記ユーザインタフェースで受け付けられたユーザ操作に従って前記所定の空間的範囲を示すパラメータを変更することを特徴とする請求項1〜6のいずれか1に記載の音声信号処理装置。
- 複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する音声信号処理装置であって、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する信号分離部と、該信号分離部で分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる相関信号増加部と、該相関信号増加部における増加の度合いを周波数帯域毎に変更するユーザ操作及び前記所定の空間的範囲を変更するユーザ操作を受け付けるためのユーザインタフェースと、該ユーザインタフェースで受け付けられたユーザ操作に従って、前記増加の度合い及び変更の対象となった周波数帯域を示すパラメータ、及び/又は、前記所定の空間的範囲を示すパラメータを変更するパラメータ制御部とを備えたことを特徴とする音声信号処理装置。
- 前記ユーザインタフェースは、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分の量を可視化して表示することを特徴とする請求項1〜8のいずれか1項に記載の音声信号処理装置。
- 前記ユーザインタフェースは、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分の量を周波数帯域毎に可視化して表示することを特徴とする請求項9に記載の音声信号処理装置。
- 複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する音声信号処理方法であって、
信号分離部が、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、
相関信号増加部が、前記分離ステップで分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、
無相関信号減少部が、前記分離ステップで分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分を減少させる減少ステップと、
ユーザインタフェースが、前記減少ステップにおける減少の度合いを変更するユーザ操作を受け付ける受付ステップと、
パラメータ制御部が、前記受付ステップで受け付けられたユーザ操作に従って、前記減少の度合いを示すパラメータを変更する変更ステップと、
を有することを特徴とする音声信号処理方法。 - 複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する音声信号処理方法であって、
信号分離部が、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、
相関信号増加部が、前記分離ステップで分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、
ユーザインタフェースが、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分の量を可視化して表示し、前記増加ステップにおける増加の度合いを変更するユーザ操作を受け付ける受付ステップと、
パラメータ制御部が、前記受付ステップで受け付けられたユーザ操作に従って、前記増加の度合いを示すパラメータを変更する変更ステップと、
を有することを特徴とする音声信号処理方法。 - 複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する音声信号処理方法であって、
信号分離部が、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、
相関信号増加部が、前記分離ステップで分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、
ユーザインタフェースが、前記増加ステップにおける増加の度合いを周波数帯域毎に変更するユーザ操作及び前記所定の空間的範囲を変更するユーザ操作を受け付ける受付ステップと、
パラメータ制御部が、前記受付ステップで受け付けられたユーザ操作に従って、前記増加の度合い及び変更の対象となった周波数帯域を示すパラメータ、及び/又は、前記所定の空間的範囲を示すパラメータを変更する変更ステップと、
を有することを特徴とする音声信号処理方法。 - コンピュータに、複数のスピーカに出力するための入力音声信号を、2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、該分離ステップで分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、前記分離ステップで分離された信号に対し、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分を減少させる減少ステップと、前記コンピュータのユーザインタフェースで、前記減少ステップにおける減少の度合いを変更するユーザ操作を受け付ける受付ステップと、該受付ステップで受け付けられたユーザ操作に従って、前記減少の度合いを示すパラメータを変更する変更ステップと、を実行させるためのプログラム。
- コンピュータに、複数のスピーカに出力するための入力音声信号を、2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、該分離ステップで分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、前記コンピュータのユーザインタフェースで、前記所定の空間的範囲に合成される音像に関わる無相関信号中の成分の量を可視化して表示し、前記増加ステップにおける増加の度合いを変更するユーザ操作を受け付ける受付ステップと、該受付ステップで受け付けられたユーザ操作に従って、前記増加の度合いを示すパラメータを変更する変更ステップと、を実行させるためのプログラム。
- コンピュータに、複数のスピーカに出力するための入力音声信号を、2つのチャネル間の相関信号と無相関信号とに分離する分離ステップと、該分離ステップで分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる増加ステップと、前記コンピュータのユーザインタフェースで、前記増加ステップにおける増加の度合いを周波数帯域毎に変更するユーザ操作及び前記所定の空間的範囲を変更するユーザ操作を受け付ける受付ステップと、該受付ステップで受け付けられたユーザ操作に従って、前記増加の度合い及び変更の対象となった周波数帯域を示すパラメータ、及び/又は、前記所定の空間的範囲を示すパラメータを変更する変更ステップと、を実行させるためのプログラム。
- 請求項14〜16のいずれか1に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010114351A JP5690082B2 (ja) | 2010-05-18 | 2010-05-18 | 音声信号処理装置、方法、プログラム、及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010114351A JP5690082B2 (ja) | 2010-05-18 | 2010-05-18 | 音声信号処理装置、方法、プログラム、及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011244196A JP2011244196A (ja) | 2011-12-01 |
JP5690082B2 true JP5690082B2 (ja) | 2015-03-25 |
Family
ID=45410399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010114351A Active JP5690082B2 (ja) | 2010-05-18 | 2010-05-18 | 音声信号処理装置、方法、プログラム、及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5690082B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5307770B2 (ja) | 2010-07-09 | 2013-10-02 | シャープ株式会社 | 音声信号処理装置、方法、プログラム、及び記録媒体 |
US9713148B2 (en) | 2012-08-02 | 2017-07-18 | Mitsubishi Electric Corporation | Communication system including base station device and communication terminal device |
JP6017352B2 (ja) * | 2013-03-07 | 2016-10-26 | シャープ株式会社 | 音声信号変換装置及び方法 |
JP6161962B2 (ja) * | 2013-06-06 | 2017-07-12 | シャープ株式会社 | 音声信号再生装置及び方法 |
CN113711622A (zh) * | 2019-04-23 | 2021-11-26 | 索尼集团公司 | 信号处理装置、信号处理方法、程序和视频显示装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2971162B2 (ja) * | 1991-03-26 | 1999-11-02 | マツダ株式会社 | 音響装置 |
JPH0690500A (ja) * | 1992-09-09 | 1994-03-29 | Clarion Co Ltd | 音像定位制御装置 |
EP1260119B1 (en) * | 2000-02-18 | 2006-05-17 | Bang & Olufsen A/S | Multi-channel sound reproduction system for stereophonic signals |
JP3912386B2 (ja) * | 2004-02-24 | 2007-05-09 | ヤマハ株式会社 | ステレオ信号の特性表示装置 |
JP4580210B2 (ja) * | 2004-10-19 | 2010-11-10 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
JP4403429B2 (ja) * | 2007-03-08 | 2010-01-27 | ソニー株式会社 | 信号処理装置、信号処理方法、プログラム |
JP5065784B2 (ja) * | 2007-07-18 | 2012-11-07 | 株式会社DiMAGIC Corporation | 同相成分抽出方法及び装置 |
JP5298649B2 (ja) * | 2008-01-07 | 2013-09-25 | 株式会社コルグ | 音楽装置 |
JP5151762B2 (ja) * | 2008-07-22 | 2013-02-27 | 日本電気株式会社 | 音声強調装置、携帯端末、音声強調方法および音声強調プログラム |
JP4840421B2 (ja) * | 2008-09-01 | 2011-12-21 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法、プログラム |
JP5522920B2 (ja) * | 2008-10-23 | 2014-06-18 | アルパイン株式会社 | オーディオ装置及びオーディオ処理方法 |
JP2011234177A (ja) * | 2010-04-28 | 2011-11-17 | Panasonic Corp | 立体音響再生装置及び再生方法 |
-
2010
- 2010-05-18 JP JP2010114351A patent/JP5690082B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011244196A (ja) | 2011-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8670850B2 (en) | System for modifying an acoustic space with audio source content | |
JP5082327B2 (ja) | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム | |
EP1635611B1 (en) | Audio signal processing apparatus and method | |
TWI475896B (zh) | 單音相容性及揚聲器相容性之立體聲濾波器 | |
EP1741313B1 (en) | A method and system for sound source separation | |
JP6377249B2 (ja) | オーディオ信号の強化のための装置と方法及び音響強化システム | |
JP2011501486A (ja) | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 | |
JP5690082B2 (ja) | 音声信号処理装置、方法、プログラム、及び記録媒体 | |
JP6284480B2 (ja) | 音声信号再生装置、方法、プログラム、及び記録媒体 | |
JP5736124B2 (ja) | 音声信号処理装置、方法、プログラム、及び記録媒体 | |
JP5307770B2 (ja) | 音声信号処理装置、方法、プログラム、及び記録媒体 | |
EP2484127B1 (en) | Method, computer program and apparatus for processing audio signals | |
JP4810621B1 (ja) | 音声信号変換装置、方法、プログラム、及び記録媒体 | |
JP4274419B2 (ja) | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム | |
JP5058844B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP4392040B2 (ja) | 音響信号処理装置、音響信号処理方法、音響信号処理プログラムおよびコンピュータに読み取り可能な記録媒体 | |
JP5202021B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
EP3613043A1 (en) | Ambience generation for spatial audio mixing featuring use of original and extended signal | |
JP5915249B2 (ja) | 音響処理装置および音響処理方法 | |
JP4274418B2 (ja) | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム | |
JP2015065551A (ja) | 音声再生システム | |
GB2561594A (en) | Spatially extending in the elevation domain by spectral extension |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130401 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5690082 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |