JP5861275B2 - 音響処理装置 - Google Patents

音響処理装置 Download PDF

Info

Publication number
JP5861275B2
JP5861275B2 JP2011118772A JP2011118772A JP5861275B2 JP 5861275 B2 JP5861275 B2 JP 5861275B2 JP 2011118772 A JP2011118772 A JP 2011118772A JP 2011118772 A JP2011118772 A JP 2011118772A JP 5861275 B2 JP5861275 B2 JP 5861275B2
Authority
JP
Japan
Prior art keywords
target
frequency
area
localization
axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011118772A
Other languages
English (en)
Other versions
JP2012249048A (ja
Inventor
近藤 多伸
多伸 近藤
梅山 康之
康之 梅山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2011118772A priority Critical patent/JP5861275B2/ja
Publication of JP2012249048A publication Critical patent/JP2012249048A/ja
Application granted granted Critical
Publication of JP5861275B2 publication Critical patent/JP5861275B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Description

本発明は、音響信号に関連する情報を表示する技術に関する。
音響信号のうち所定の方向に音像が定位する成分を抑圧または強調する技術が従来から提案されている。例えば特許文献1や特許文献2には、音響信号の左右のチャネル間の類似度に応じて周波数毎に設定された係数値を音響信号の各周波数成分に乗算することで前方(中央)に定位する成分を抑圧する技術が開示されている。
特許第3670562号公報 特開2009−188971号公報
ところで、音響信号の各周波数成分の定位方向の時間的な変化を視覚的に確認できれば、特定の期間内で所望の方向に定位する周波数成分(例えば歌唱曲の収録音のうち中央に定位する歌唱音)を抑圧または強調の対象として利用者が容易に選択できて便利である。しかし、例えば音響信号のスペクトログラムでは、音響信号の各周波数成分の時間的な変化が提示されるに過ぎず、各周波数成分の定位方向の時間的な変化までは確認できない。したがって、所望の方向に定位する成分を抑圧または強調の対象として選択することは困難である。また、時間軸と定位方向を示す定位軸とが設定された領域内に音響信号の定位方向の時間的な変化の画像を表示する構成も想定されるが、音響信号の周波数成分毎の定位方向の変化を確認できないという問題がある。以上の事情を考慮して、本発明は、音響信号の各周波数成分について定位方向の時間的な変化を視覚的に容易に確認できるようにすることを目的とする。
以上の課題を解決するために本発明が採用する手段を説明する。なお、本発明の理解を容易にするために、以下の説明では、本発明の要素と後述の実施形態の要素との対応を括弧書で付記するが、本発明の範囲を実施形態の例示に限定する趣旨ではない。
本発明の音響処理装置は、利用者からの指示を受付ける受付手段(例えば入力装置24)と、第1周波数軸(例えば周波数軸F1)と第1時間軸(例えば時間軸T1)とが設定された第1領域(例えば領域A)内に音響信号のスペクトログラムを配置した周波数特性画像と、第2周波数軸(例えば周波数軸F2)と定位方向を示す定位軸(例えば定位軸L)とが設定された第2領域(例えば領域B)内に音響信号のうち第1時間軸上の着目点に対応する各周波数成分の音像点を配置した定位画像とを表示装置に表示させる手段であって、第1周波数軸上の対象帯域(例えば対象帯域aF)と第1時間軸上の対象期間(例えば対象期間aT)とで画定される周波数/時間指定領域を受付手段に対する指示に応じて第1領域に配置し、第2周波数軸上において第1周波数軸上の対象帯域と共通する対象帯域(例えば対象帯域bF)と定位軸上の対象定位域(例えば対象定位域bL)とで画定される目標指定領域を受付手段に対する指示に応じて第2領域に配置する表示制御手段と、対象期間内の音響信号のうち目標指定領域内の音像点が示す各周波数成分(目標成分)を抑圧または強調する信号処理手段とを具備する。
以上の構成では、音響信号のスペクトログラムを配置した周波数特性画像と音響信号の着目点に対応する各周波数成分の音像点を配置した定位画像とが表示装置に表示されるから、音響信号の各周波数成分について定位方向の時間的な変化を利用者が視覚的に容易に確認することが可能である。また、周波数特性画像の周波数/時間指定領域の対象帯域に対応する目標指定領域が定位画像に配置されるから、音響信号の目標成分について周波数と定位方向と時間との関係を利用者が容易に把握できるという利点もある。なお、定位画像に音像点を配置する音響信号の範囲は任意であるが、例えば音響信号を複数の単位区間に区分する構成では、複数の単位区間のうち着目点に対応する所定個(単数または複数)の単位区間における各周波数成分の音像点を表示制御手段が第2領域内に配置する構成が好適である。また、目標指定領域および周波数/時間指定領域の指定の順序は任意である。すなわち、目標指定領域の指定後に周波数/時間指定領域を配置する構成と、周波数/時間指定領域の指定後に目標指定領域を配置する構成との双方が本発明の範囲に包含される。
本発明の前述の効果は、周波数特性画像と定位画像とを表示装置に並列(同時)に表示した場合に格別に顕著となる。ただし、周波数特性画像と定位画像とを例えば利用者からの指示に応じて選択的に表示することも可能である。
本発明の好適な態様において、表示制御手段は、音響信号を区分した単位区間の所定個毎の各周波数成分の音像点の分布を、第2周波数軸と定位軸とに交差する時間軸の方向に立体的に配列した定位画像を表示装置に表示させる。以上の態様では、音響信号xの各音像点の分布の時間的な変化を利用者が容易に把握できるという利点がある。なお、以上の態様の具体例は、例えば第5実施形態として後述される。
本発明の好適な態様において、表示制御手段は、第2周波数軸上の対象帯域または対象定位域が相違する複数の目標指定領域を受付手段に対する指示に応じて第2領域内に重複可能に配置し、各目標指定領域に対応する複数の周波数/時間指定領域を第1領域内に重複可能に配置する。以上の態様では、対象帯域または対象定位域が相違する複数の目標指定領域が第2領域に重複可能に配置されるとともに各目標指定領域に対応する複数の周波数/時間指定領域が第1領域に重複可能に配置される。したがって、周波数と期間と定位方向とが相違する複数種の成分を目標成分として利用者が容易に指定できるという利点がある。なお、以上の態様の具体例は例えば第2実施形態として後述される。
本発明の好適な態様において、表示制御手段は、目標指定領域に対応する複数の周波数/時間指定領域を、第1領域における第1時間軸上の相異なる時点に設定する。以上の態様では、1個の目標指定領域に対応する複数の周波数/時間指定領域が第1領域に配置されるから、例えば所定の帯域内で間欠的に発生する目標成分を容易かつ適切に指定することが可能である。なお、以上の態様の具体例は、例えば第3実施形態として後述される。
本発明の好適な態様において、表示制御手段は、第1領域内のスペクトログラムのうち目標指定領域内の各音像点に対応する周波数成分と他の周波数成分とを相異なる態様で表示する。以上の態様では、目標指定領域の内側の各音像点に対応する周波数成分と外側の各音像点に対応する周波数成分とが相異なる態様で表示されるから、目標成分として抑圧または強調の対象となる周波数成分を利用者が周波数特性画像から容易に把握できるという利点がある。なお、以上の態様の具体例は、例えば第6実施形態として後述される。
本発明の好適な態様において、表示制御手段は、周波数/時間指定領域および目標指定領域の一方の対象帯域について受付手段に付与された変更指示に応じて周波数/時間指定領域および目標指定領域の双方の対象帯域を変更する。以上の態様では、対象帯域を変更する場合の利用者の負担が軽減されるという利点がある。
本発明の好適な態様において、表示制御手段は、音響信号を構成する第1チャネル信号(例えば音響信号xL)および第2チャネル信号(例えば音響信号xR)の各々のスペクトログラムを第1領域内に配置し、定位軸上における目標指定領域の位置に応じて第1チャネル信号のスペクトログラム(例えばスペクトログラムSL)と第2チャネル信号のスペクトログラム(例えばスペクトログラムSR)とを相異なる表示態様に変化させる。以上の態様では、目標指定領域の位置に応じて各スペクトログラムの表示態様が制御されるから、目標成分の定位位置を利用者が周波数特性画像から直感的に把握できるという利点がある。なお、目標指定領域の位置に応じて表示態様を変化させる領域は、スペクトログラムの全体および一部の何れでもよい。すなわち、スペクトログラムの全体にわたる表示態様を第1チャネル信号と第2チャネル信号とで相違させる構成のほか、例えば、スペクトログラムのうち周波数/時間指定領域の範囲内の表示態様を第1チャネル信号と第2チャネル信号とで相違させる構成も採用され得る。なお、以上の態様の具体例は、例えば第4実施形態として後述される。
本発明の好適な態様において、表示制御手段は、第2時間軸(例えば時間軸T2)が設定された第3領域(例えば領域C)内に信号処理手段による処理前または処理後の音響信号の波形を配置した波形画像を、周波数特性画像および定位画像とともに表示装置に表示させる。以上の態様では、音響信号の波形画像が周波数特性画像や定位画像とともに表示装置に表示されるから、目標成分の対象期間と音響信号の波形との関係で容易に把握できるという利点がある。また、第2時間軸上の対象期間を示す時間指定領域を表示制御手段が第3領域に配置する構成によれば、以上の効果は格別に顕著となる。
本発明の好適な態様において、表示制御手段は、周波数/時間指定領域および時間指定領域の一方の対象期間について受付手段に付与された変更指示に応じて周波数/時間指定領域および時間指定領域の双方の対象期間を変更する。以上の態様では、対象期間を変更する場合の利用者の負担が軽減されるという利点がある。
なお、前述の各形態における表示の態様とは、観察者が視覚的に認識できる画像の状態を意味する。具体的な表示態様としては、形状,寸法,階調,色彩,点滅の有無等が例示される。
以上の各態様に係る音響処理装置は、処理係数列の生成に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、利用者からの指示を受付ける受付手段と、第1周波数軸と第1時間軸とが設定された第1領域内に音響信号のスペクトログラムを配置した周波数特性画像と、第2周波数軸と定位方向を示す定位軸とが設定された第2領域内に音響信号のうち第1時間軸上の着目点に対応する各周波数成分の音像点を配置した定位画像とを表示装置に表示させる手段であって、第1周波数軸上の対象帯域と第1時間軸上の対象期間とで画定される周波数/時間指定領域を受付手段に対する指示に応じて第1領域に配置し、対象期間内の音響信号について、第2周波数軸上の対象帯域と定位軸上の対象定位域とで画定される目標指定領域を受付手段に対する指示に応じて第2領域に配置する表示制御手段と、対象期間内の音響信号のうち目標指定領域内の音像点が示す各周波数成分を抑圧または強調する信号処理手段としてコンピュータを機能させる。以上のプログラムによれば、本発明に係る音響処理装置と同様の作用および効果が奏される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
第1実施形態に係る音響処理装置のブロック図である。 第1実施形態における編集画面の模式図である。 第2実施形態における編集画面の模式図である。 第3実施形態における編集画面の模式図である。 第4実施形態における編集画面の模式図である。 第5実施形態における編集画面の模式図である。 第6実施形態における編集画面の模式図である。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。図1に示すように、音響処理装置100は、演算処理装置12と記憶装置14と信号供給装置22と入力装置24と表示装置26と放音装置28とを具備するコンピュータシステムで実現される。入力装置24は、利用者からの指示を受付ける機器(受付手段)であり、例えば複数の操作子を含んで構成される。表示装置26(例えば液晶表示機器)は、演算処理装置12による制御のもとで各種の画像を表示する。
信号供給装置22は、相異なる位置に存在する音源が発音した複数の音響(歌唱音や伴奏音)の混合音の波形を示す音響信号x(xL,xR)を演算処理装置12に供給する。左チャネルの音響信号xLおよび右チャネルの音響信号xRは、各音源に対応する音像が相異なる位置に定位するように収音または加工(例えば左右チャネル間の振幅比や遅延量を変更する処理)されたステレオ形式の信号である。周囲の音響を収音して音響信号xを生成する収音機器(ステレオマイク)や、可搬型または内蔵型の記録媒体(例えばCD)から音響信号xを読出す再生装置や、通信網から音響信号xを受信する通信装置が信号供給装置22として採用され得る。
記憶装置14は、演算処理装置12が実行するプログラムや演算処理装置12が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置14として任意に採用される。なお、音響信号x(xL,xR)を記憶装置14に格納した構成(したがって信号供給装置22は省略される)も採用され得る。
演算処理装置12は、記憶装置14に格納されたプログラムを実行することで、信号供給装置22が供給する音響信号xから音響信号y(yL,yR)を生成するための複数の機能(周波数分析部32,係数列生成部34,信号処理部36,波形合成部38,表示制御部40)を実現する。左チャネルの音響信号yLおよび右チャネルの音響信号yRは、音響信号xの特定の成分(以下「目標成分」という)を他の成分に対して抑圧または強調したステレオ形式の信号である。音響信号xのうち所定の方向に音像が定位する各周波数成分が目標成分として抑圧または強調される。なお、演算処理装置12の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。図1の放音装置28(例えばステレオスピーカやステレオヘッドホン)は、演算処理装置12が生成した音響信号y(yL,yR)に応じた音波を放射する。
周波数分析部32は、音響信号xLの周波数スペクトルXLと音響信号xRの周波数スペクトルXRとを時間軸上の単位区間(フレーム)毎に順次に生成する。周波数スペクトルXLは、相異なる周波数(周波数帯域)fに対応する複数の周波数成分XL(f,m)の系列である。同様に、周波数スペクトルXRは、複数の周波数成分XR(f,m)で構成される。記号mは時間軸上の各時点(単位区間の番号)を意味する。周波数スペクトルXLおよび周波数スペクトルXRの生成には、例えば短時間フーリエ変換等の公知の周波数分析技術が任意に採用される。
係数列生成部34は、音響信号xの目標成分を抑圧または強調するための処理係数列G(m)を単位区間毎に順次に生成する。処理係数列G(m)は、相異なる周波数fに対応する複数の係数値g(f,m)の系列である。各係数値g(f,m)は、音響信号xの周波数成分XL(f,m)および周波数成分XR(f,m)に対する利得(スペクトルゲイン)に相当し、音響信号xの目標成分が抑圧または強調されるように選定される。各係数値g(f,m)を選定する処理の詳細は後述する。
信号処理部36は、係数列生成部34が生成した処理係数列G(m)を周波数スペクトルXLおよび周波数スペクトルXRの各々に作用させることで音響信号yLの周波数スペクトルYL(周波数成分YL(f,m))と音響信号yRの周波数スペクトルYR(周波数成分YR(f,m))とを単位区間毎に生成する。具体的には、音響信号xLの周波数成分XL(f,m)と処理係数列G(m)の係数値g(f,m)との乗算値が音響信号yLの周波数成分YL(f,m)として算定され、音響信号xRの周波数成分XR(f,m)と係数値g(f,m)との乗算値が音響信号yRの周波数成分YR(f,m)として算定される。
波形合成部38は、信号処理部36が生成した周波数スペクトルYLおよび周波数スペクトルYRから音響信号yLおよび音響信号yRを生成する。具体的には、波形合成部38は、単位区間毎の周波数スペクトルYLを時間領域の信号に変換するとともに前後の単位区間で相互に連結することで音響信号yLを生成する。同様に、波形合成部38は、単位区間毎の周波数スペクトルYRから音響信号yRを生成する。波形合成部38が生成した音響信号y(yL,yR)が放音装置28に供給されて音波として再生される。
図1の表示制御部40は、利用者が目標成分を指定するために参照する図2の編集画面45を表示装置26に表示させる。図2に示すように、編集画面45は、周波数特性画像50と定位画像60と波形画像70とを含んで構成される。
周波数特性画像50は、相互に交差する時間軸T1と周波数軸F1とが設定された領域Aを含む。領域Aには、音響信号xLのスペクトログラムSL(階調や色彩で強度が表現された周波数スペクトルXLの時系列)と音響信号xRのスペクトログラムSRとが並列に配置される。また、時間軸T1上の任意の時点(以下「着目点」という)を示す指示子(カーソル)54が領域Aに配置される。なお、信号処理部36による処理後の音響信号y(yL,yR)のスペクトログラムを領域Aに配置する構成や、音響信号xおよび音響信号yの各々のスペクトログラムを利用者からの指示に応じて切替えて領域Aに配置する構成も採用され得る。
図2の定位画像60は、相互に交差する定位軸Lと周波数軸F2とが設定された領域Bを含む。定位軸Lは、音像の定位方向θを示す座標軸である。定位軸Lの原点(θ=0)は受聴点の正面方向に相当する。また、定位軸Lの原点に対して正側の領域(θ>0)は正面に対して右側の方向に相当し、負側の領域(θ<0)は正面方向の左側の方向に相当する。
定位画像60の領域Bには複数の音像点qが配置される。定位軸L上の定位方向θと周波数軸F2上の周波数fとに対応する座標に位置する音像点qは、その定位方向θに定位する周波数fの周波数成分が音響信号xに存在することを意味する。
表示制御部40は、音響信号xの各周波数fの定位方向θを単位区間毎に算定する。定位方向θの算定には、例えば以下の数式(1)が好適に利用される。数式(1)の記号|XL(f,m)|は音響信号xLの周波数成分XL(f,m)の振幅を意味し、記号|XR(f,m)|は周波数成分XR(f,m)の振幅を意味する。音響信号xのうち周波数特性画像50の指示子54が指定する着目点に対応する1個の単位区間について数式(1)で特定された各音像点qが領域Bに配置される。なお、数式(1)の意義や導出については、例えば、M. Vinyes, J. Bonada, A. Loscos, "Demixing Commercial Music Productions wia Human-Assisted Time-Frequency Masking",Audio Engineering Society 120th Convention, France, 2006から理解される。
θ=2・arctan(|XL(f,m)|/|XR(f,m)|)・2/π−1 ……(1)
利用者は、入力装置24を適宜に操作することで領域B内の任意の領域(以下「目標指定領域」という)62を指定することが可能である。表示制御部40は、図2に示すように、利用者から指示された目標指定領域62を表示装置26に表示させる。目標指定領域62は、定位軸L上の任意の範囲(以下「対象定位域」という)bLと周波数軸F2上の任意の範囲(以下「対象帯域」という)bFとで画定される矩形領域である。利用者は、目標指定領域62の対象定位域bLと対象帯域bFとを入力装置24の操作で任意に変更することが可能である。音響信号xのうち目標指定領域62の内側に位置する音像点qに対応する各周波数fの周波数成分が目標成分として抑圧または強調の対象となる。すなわち、対象帯域bF内の音響信号xの各周波数成分(XL(f,m),XR(f,m))のうち対象定位域bL内の定位方向θに定位する目標成分が抑圧または強調される。
利用者は、入力装置24を適宜に操作することで目標指定領域62について任意の増幅率αを指定することが可能である。表示制御部40は、利用者が指定した増幅率α(図2の例示では40dB)を目標指定領域62に付加する。目標指定領域62の増幅率αが負数に設定された場合には目標成分が抑圧され、増幅率αが正数に設定された場合には目標成分が強調される。
目標指定領域62が領域B内に設定されて入力装置24に所定の操作(例えば適用ボタンの押下)が付与されると、表示制御部40は、図2に示すように、その目標指定領域62に対応する周波数/時間指定領域52を周波数特性画像50の領域A内に配置する。周波数/時間指定領域52は、時間軸T1上の特定の範囲(以下「対象期間」という)aTと周波数軸F1上の対象帯域aFとで画定される矩形領域であり、音響信号xLおよび音響信号xRの各々のスペクトログラムに重なるように配置される。周波数/時間指定領域52の対象帯域aFは、目標指定領域62の対象帯域bFと共通の帯域に設定される。
利用者は、周波数/時間指定領域52の対象帯域aFを入力装置24の操作で任意に変更することが可能である。表示制御部40は、周波数/時間指定領域52の対象帯域aFおよび目標指定領域62の対象帯域bFの一方に対する変更の指示に応じて対象帯域aFおよび対象帯域bFの双方を相互に連動して変更し、対象帯域aFと対象帯域bFとを共通の帯域に維持する。他方、周波数/時間指定領域52の対象期間aTは、定位画像60の目標指定領域62が新規に設定された時点では所定の時間長(例えば音響信号xの全区間)に設定され、入力装置24に対する利用者からの指示に応じて任意に変更される。
図2の波形画像70は、時間軸T2が設定された領域Cを含む。時間軸T2は、周波数特性画像50の時間軸T1と共通の座標軸である。領域Cには、音響信号xLの波形WLおよび音響信号xRの波形WRと、時間軸T2上の着目点を示す指示子(カーソル)74とが配置される。波形画像70の指示子74と周波数特性画像50の指示子54とは音響信号xの共通の着目点を指示する。なお、信号処理部36による処理後の音響信号y(yL,yR)の波形を領域Cに配置する構成や、音響信号xおよび音響信号yの各々の波形を利用者からの指示に応じて切替えて領域Cに配置する構成も採用され得る。
領域Cには時間指定領域72が設定される。時間指定領域72は、時間軸T2上の対象期間cTにわたる矩形領域である。時間指定領域72の対象期間cTと周波数/時間指定領域52の対象期間aTとは共通する。利用者は、入力装置24に対する操作で時間指定領域72の対象期間cTを任意に変更することが可能である。表示制御部40は、周波数/時間指定領域52の対象期間aTおよび時間指定領域72の対象期間cTの一方に対する変更の指示に応じて対象期間aTおよび対象期間cTの双方を相互に連動して変更し、対象期間aTと対象期間cTとを共通の期間に維持する。
利用者が入力装置24に対する操作で音響の再生を指示すると、係数列生成部34による処理係数列G(m)の生成と信号処理部36による音響信号yの生成とが順次に実行されて音響信号yに応じた音波が放音装置28から再生される。周波数特性画像50の指示子54と波形画像70の指示子74とが示す着目点(再生ポイント)は再生の進行とともに時間軸T1および時間軸T2に沿って刻々と移動する。また、利用者は、入力装置24を適宜に操作して指示子54および指示子74を移動させることで所望の時点を着目点として指定することが可能である。定位画像60の領域Bには着目点の1個の単位区間に対応する複数の音像点qが表示され、着目点の移動とともに随時に更新される。
音響の再生中または停止中の任意の時点で、利用者は、定位画像60の領域Bに目標指定領域62を新規に設定し、または既存の目標指定領域62を変更することが可能である。例えば、利用者は、着目点について定位画像60に表示される各音像点qの分布や周波数特性画像60に表示されるスペクトログラム(SL,SR)を参照するとともに放音装置28からの再生音を聴取しながら、自身が抑圧または強調を希望する周波数fおよび定位方向θに対応する音像点qを内包するように目標指定領域62を設定または変更し、音響信号xのうち目標成分を抑圧または強調したい期間を周波数/時間指定領域52の対象期間aTまたは時間指定領域72の対象期間cTとして指定する。
指示子54および指示子74の示す着目点が対象期間aT(cT)の外側に存在する場合には定位画像60の領域Bに目標指定領域62は表示されず(各音像点qは表示される)、着目点が対象期間aTの内側に位置する場合には、図2の例示の通り、定位画像60の領域Bに各音像点qとともに目標指定領域62が表示される。すなわち、着目点の移動(再生の進行)とともに目標指定領域62の表示/非表示が刻々と変化する。
対象期間aT(cT)の外側の各単位区間について、係数列生成部34は、処理係数列G(m)の全部の係数値g(f,m)を所定の数値γ1に設定する。数値γ1は、信号処理部36による処理の前後で強度を変化させない数値(例えば1)に設定される。他方、対象期間aT(cT)の内側の各単位区間について、係数列生成部34は、音響信号xのうちその単位区間に対応する目標指定領域62で指定された目標成分が増幅率αに応じて抑圧または強調されるように処理係数列G(m)の各係数値g(f,m)を設定する。
例えば、増幅率αが負数(目標成分の抑圧)である場合、係数列生成部34は、目標指定領域62の外側の音像点qに対応する各周波数fの係数値g(f,m)を前述の数値γ1に設定し、目標指定領域62の内側の音像点qに対応する各周波数f(すなわち目標成分の各周波数f)の係数値g(f,m)を数値γg1に設定する。増幅率αの絶対値が大きい(目標成分の抑圧の度合が大きい)ほど数値γg1が小さい数値となるように、数値γg1は1未満の正数の範囲内で増幅率αに応じて可変に設定される。したがって、音響信号xの目標成分を他の成分と比較して抑圧した音響信号yが信号処理部36による処理で生成される。
他方、増幅率αが正数(目標成分の強調)である場合、係数列生成部34は、目標指定領域62の外側の音像点qに対応する各周波数fの係数値g(f,m)を数値γ0に設定し、目標指定領域62の内側の音像点qに対応する各周波数fの係数値g(f,m)を数値γg2に設定する。数値γ0は、信号処理部36による処理で強度を低下させる数値(例えば0)に設定される。他方、数値γg2は、増幅率αの絶対値が大きい(目標成分の強調の度合が大きい)ほど大きい数値となるように1未満の正数の範囲内で増幅率αに応じて可変に設定される。したがって、音響信号xの目標成分を他の成分に対して強調した音響信号yが信号処理部36による処理で生成される。
なお、目標指定領域62の外側の音像点qに対応する各係数値g(f,m)を数値γ0と数値γ1との中間値(例えば0.5)に設定し、目標指定領域62の内側の音像点qに対応する各係数値g(f,m)を増幅率α(負数または正数)に応じて設定することで、音響信号xの目標成分を他の成分に対して抑圧または強調することも可能である。
以上に説明した第1実施形態では、音響信号xのうち周波数特性画像50の指示子54や波形画像70の指示子74が示す着目点に対応する単位区間の各周波数成分の各音像点qが定位画像60の領域Bに配置される。したがって、音響信号xの各周波数成分について定位方向θの時間的な変化を視覚的に容易に確認できるという利点がある。また、対象帯域aFおよび対象期間aTで規定される周波数/時間指定領域52を含む周波数特性画像50と、対象帯域bFおよび対象定位域bLで規定される目標指定領域62を含む定位画像60とが、表示装置26に並列に表示される。したがって、音響信号xのうち抑圧または強調の対象となる目標成分について、周波数fの範囲(対象帯域aFおよび対象帯域bF)と定位方向θの範囲(対象定位域bL)と時間範囲(対象期間aT)との関係を利用者が容易に把握できるという利点もある。更に第1実施形態では、波形画像70も周波数特性画像50や定位画像60とともに表示装置26に表示されるから、目標成分の対象期間cTを音響信号xの波形(WL,WR)との関係で容易に把握できるという利点もある。
<B:第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図3は、第2実施形態の編集画面45のうち周波数特性画像50および定位画像60の模式図である。なお、周波数特性画像50のスペクトログラム(SL,SR)の図示を図3では便宜的に省略した。
図3に示すように、第2実施形態の表示制御部40は、対象帯域bFまたは対象定位域bLが相違する複数の目標指定領域62(621,622)を利用者からの指示に応じて定位画像60の領域B内に設定する。利用者は、対象帯域bFと対象定位域bLと増幅率αとを目標指定領域621および目標指定領域622の各々について個別に変更することが可能である。目標指定領域621と目標指定領域622とは、領域B内に相互に離間して配置されるほか、図3の例示のように相互に重複する位置にも配置され得る。
図3に示すように、周波数特性画像50の領域A内には、目標指定領域621に対応する周波数/時間指定領域521と目標指定領域622に対応する周波数/時間指定領域522とが設定される。利用者は、対象帯域aFおよび対象期間aTを周波数/時間指定領域521および周波数/時間指定領域522の各々について個別に設定することが可能である。したがって、周波数/時間指定領域521と周波数/時間指定領域522とは、領域A内に相互に離間して配置されるほか、図3の例示のように相互に重複する位置にも配置され得る。
時間軸T1上で周波数/時間指定領域521のみが存在する時点taを着目点として指示子54および指示子74が示す状態では、定位画像60の領域Bには目標指定領域621のみが配置される。他方、周波数/時間指定領域521および周波数/時間指定領域522の双方が存在する時点tbが着目点として指示された状態では、図3に示すように、目標指定領域621および目標指定領域622の双方が定位画像60の領域Bに配置される。また、着目点として時点tcが指示された状態では目標指定領域622のみが領域Bに配置される。
音響信号xのうち目標指定領域621および目標指定領域622の双方が指定された単位区間について、係数列生成部34は、目標指定領域621の処理係数列GA(m)と目標指定領域622の処理係数列GB(m)との各々を第1実施形態と同様の方法で生成し、処理係数列GA(m)と処理係数列GB(m)との合成(例えば相互に対応する係数値g(f,m)の加算または乗算)で処理係数列G(m)を生成する。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、複数の目標指定領域62(621,622)が定位画像60の領域Bに配置されるとともに各目標指定領域62に対応する複数の周波数/時間指定領域52(521,522)が周波数特性画像50の領域Aに配置される。したがって、周波数f(対象帯域aF)と発生期間(対象期間aT)と定位方向(対象定位域bL)とが相違する複数種の目標成分を容易に抑圧または強調の対象として指定することが可能である。
<C:第3実施形態>
図4は、第3実施形態の編集画面45のうち周波数特性画像50および定位画像60の模式図である。なお、図3と同様に、周波数特性画像50のスペクトログラム(SL,SR)の図示は図4でも省略されている。
第3実施形態の表示制御部40は、定位画像60の1個の目標指定領域62に対応する複数の周波数/時間指定領域52(52A,52B)を利用者からの指示に応じて周波数特性画像50の領域A内に配置する。利用者は、周波数/時間指定領域52Aと周波数/時間指定領域52Bとの各々について対象期間aTを個別に設定することが可能である。したがって、周波数/時間指定領域52Aと周波数/時間指定領域52Bとは時間軸T1上で相異なる時点(相互に間隔をあけた位置)に配置され得る。他方、周波数軸F1上の対象帯域aFは周波数/時間指定領域52Aと周波数/時間指定領域52Bとで共通する。
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、1個の目標指定領域62に対応する複数の周波数/時間指定領域52(52A,52B)が周波数特性画像50の領域Aに配置されるから、例えば所定の帯域内の周波数fで間欠的に発生する目標成分(例えば間奏をあけて発生する歌唱音)を適切に指定することが可能である。
なお、第2実施形態のように領域B内に複数の目標指定領域62(621,622)が指定され得る構成に第3実施形態を適用することも可能である。例えば、目標指定領域621に対応する複数の周波数/時間指定領域52と目標指定領域622に対応する複数の周波数/時間指定領域52とを、相異なる表示態様(例えば色彩)で領域A内に配置する構成が好適である。
<D:第4実施形態>
図5は、第4実施形態の編集画面45のうち周波数特性画像50および定位画像60の模式図である。第4実施形態の表示制御部40は、周波数特性画像50の領域A内に配置される音響信号xLのスペクトログラムSLおよび音響信号xRのスペクトログラムSRの各々の表示態様(以下の例示では階調)を、定位画像60における目標指定領域62の定位軸L上の位置(すなわち目標成分の定位方向θ)に応じて変化させる。
図5の部分(a)に示すように、定位軸L上の原点に対して正側(右方向)に目標指定領域62が設定された場合(すなわち、右方向に定位する成分が目標成分として指定された場合)、表示制御部40は、領域A内のスペクトログラムSRをスペクトログラムSLと比較して低階調で表示する。目標指定領域62の重心(図心)が原点から右方向に離間するほどスペクトログラムSRの階調はスペクトログラムSLと比較して低下する。同様に、図5の部分(b)に示すように、目標指定領域62の重心が原点から負側(左方向)に離間するほど、スペクトログラムSLはスペクトログラムSRと比較して低階調で表示される。目標指定領域62の重心が定位軸L上の原点に位置する場合、スペクトログラムSLとスペクトログラムSRとは相等しい階調で表示される。
第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態では、スペクトログラムSRおよびスペクトログラムSLの各々の表示態様が目標指定領域62の定位軸L上の位置に応じて変化するから、目標成分の定位方向を利用者が周波数特性画像50から直感的に把握できるという利点がある。
なお、以上の説明では、目標指定領域62の指定に並行して随時にスペクトログラムSRおよびスペクトログラムSLの表示態様を変更したが、例えば目標指定領域62の指定後に入力装置24に対して所定の操作(例えば確定ボタンの押下)が付与された場合にスペクトログラムSRおよびスペクトログラムSLの表示態様を変更する構成も採用され得る。
また、以上の説明では、スペクトログラムSRおよびスペクトログラムSLの各々の全体的な表示態様を目標指定領域62の位置に応じて相違させたが、スペクトログラムSRやスペクトログラムSLの部分的な表示態様を相違させる構成も採用される。例えば、目標指定領域62に対応する周波数/時間指定領域52の範囲内の表示態様のみを目標指定領域62の位置に応じてスペクトログラムSRおよびスペクトログラムSLとで相違させ、他の領域の表示態様は共通させることも可能である。
<E:第5実施形態>
図6は、第5実施形態における定位画像60の模式図である。図6に示すように、第6実施形態の表示制御部40が表示装置26に表示させる定位画像60は、音響信号xの相異なる時点(単位区間)に対応する複数の単位画像Uが、周波数軸F2と定位軸Lとに交差する時間軸T0に沿って立体的に配列された画像である。音響信号xの各時点に対応する1個の単位画像Uには、音響信号xのうちその時点の単位区間に対応する複数の音像点qと目標指定領域62とが配置される。複数の単位画像Uのうち指示子54および指示子74が示す着目点に対応する1個の単位画像Uが最前面に表示されるように各単位画像Uの時間軸T0上の位置が順次に変更される。なお、各単位画像Uを透過表示することも可能である。
第5実施形態においても第1実施形態と同様の効果が実現される。また、第5実施形態では、音響信号xの相異なる時点での音像点qを配置した複数の単位画像Uが時間軸T0に沿って立体的に配置されるから、音像点qの分布と目標指定領域62との関係の時間的な遷移を定位画像60から容易に把握できるという利点がある。
<F:第6実施形態>
図7は、第6実施形態における周波数特性画像50および定位画像60の部分的な模式図である。図7に示すように、周波数軸F2上の複数の周波数fは、目標指定領域62の内側の音像点qに対応する周波数faと、目標指定領域62の外側の音像点qに対応する周波数fbとに区分される。目標指定領域62の対象帯域bFの外側の周波数fが周波数faに選別されるほか、対象帯域bFの内側の周波数fでも、対象定位域bLの外側に位置する音像点qに対応する周波数fは周波数fbに選別される。
図7には、周波数特性画像50のスペクトログラムSLのうち音響信号xの1個の単位区間に対応する周波数スペクトルXLの各周波数成分XL(f,m)が模式的に図示されている。図7に示すように、表示制御部40は、周波数スペクトルXLのうち音像点qが目標指定領域62の内側に位置する各周波数faの周波数成分XL(fa,m)と、音像点qが目標指定領域62の外側に位置する各周波数fbの周波数成分XL(fb,m)とを、相異なる表示態様(例えば階調)で表示する。図7では、周波数faの周波数成分XL(fa,m)を黒色(低階調)で表示し、周波数fbの周波数成分XL(fb,m)を白色(高階調)で表示した場合が想定されている。なお、図7ではスペクトログラムSL(周波数スペクトルXL)のみを図示したが、スペクトログラムSRについても同様に表示される。
第6実施形態においても第1実施形態と同様の効果が実現される。また、第6実施形態では、目標指定領域62の内側の音像点qに対応する周波数成分XL(fa,m)と、目標指定領域62の外側の音像点qに対応する周波数成分XL(fb,m)とが相異なる態様で周波数特性画像50に表示されるから、目標成分として抑圧または強調の対象となる周波数成分XL(f,m)を利用者が周波数特性画像50から容易に把握できるという利点がある。
なお、以上の例示では周波数faの周波数成分XL(fa,m)と周波数fbの周波数成分XL(fb,m)とで階調を相違させたが、周波数成分XL(fa,m)と周波数成分XL(fb,m)とを視覚的に区別する方法は任意である。例えば、周波数成分XL(fa,m)と周波数成分XL(fb,m)とで色彩を相違させた構成や、周波数成分XL(fa,m)および周波数成分XL(fb,m)の一方の表示を点滅させることも可能である。
<G:変形例>
以上の形態には様々な変形が加えられる。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は併合され得る。
(1)前述の各形態では、音響信号xLのスペクトログラムSLと音響信号xRのスペクトログラムSRとを領域Aに配置したが、音響信号xLと音響信号xRとの混合信号(モノラル信号)のスペクトログラムや音響信号xLおよび音響信号xRの一方のスペクトログラムを領域Aに配置することも可能である。波形画像70についても同様であり、音響信号xLと音響信号xRの混合信号の波形や音響信号xLおよび音響信号xRの一方の波形を領域Cに配置した構成も採用される。また、波形画像70を省略した構成も採用される。
(2)前述の各形態では、音響信号xの1個の単位区間内の各周波数成分に対応する音像点qを領域Bに配置したが、音響信号xの複数の単位区間にわたる各周波数成分の音像点qを領域Bに配置することも可能である。例えば、複数の単位区間にわたる定位方向θの平均値や加算値が周波数f毎に算定され、各数値に対応する音像点qが領域Bに配置される。
(3)前述の各形態では、領域Aと領域Bと領域Cとを並列に表示したが、各領域を選択的に表示することも可能である。例えば、表示制御部40は、領域Aと領域Bと領域Cとのうち利用者が入力装置24の操作で選択した少なくともひとつの領域を表示装置26に表示させる。
(4)周波数/時間指定領域52や目標指定領域62や時間指定領域72の形状は任意であり、前述の各形態に例示した矩形状には限定されない。
(5)第1実施形態ないし第6実施形態のなかから任意に選択された2以上の形態を併合することも可能である。
100……音響処理装置、12……演算処理装置、14……記憶装置、22……信号供給装置、24……入力装置、26……表示装置、28……放音装置、32……周波数分析部、34……係数列生成部、36……信号処理部、38……波形合成部、40……表示制御部、45……編集画面、50……周波数特性画像、52……周波数/時間指定領域、54……指示子、60……定位画像、62……目標指定領域、70……波形画像、72……時間指定領域、74……指示子。

Claims (5)

  1. 利用者からの指示を受付ける受付手段と、
    第1周波数軸と第1時間軸とが設定された第1領域内に音響信号のスペクトログラムを配置した周波数特性画像と、第2周波数軸と定位方向を示す定位軸とが設定された第2領域内に前記音響信号のうち前記第1時間軸上の着目点に対応する各周波数成分の音像点を配置した定位画像とを、表示装置に並列に表示させる手段であって、前記第1周波数軸上の対象帯域と前記第1時間軸上の対象期間とで画定される周波数/時間指定領域を前記受付手段に対する指示に応じて前記第1領域に配置し、前記第2周波数軸上において前記第1周波数軸上の対象帯域と共通する対象帯域と前記定位軸上の対象定位域とで画定される目標指定領域を前記受付手段に対する指示に応じて前記第2領域に配置する表示制御手段と、
    前記対象期間内の音響信号のうち前記目標指定領域内の音像点が示す各周波数成分を抑圧または強調する信号処理手段と
    を具備する音響処理装置。
  2. 前記表示制御手段は、前記第2周波数軸上の対象帯域または前記対象定位域が相違する複数の前記目標指定領域を前記受付手段に対する指示に応じて前記第2領域内に重複可能に配置し、前記各目標指定領域に対応する複数の周波数/時間指定領域を前記第1領域内に重複可能に配置する
    請求項1の音響処理装置。
  3. 前記表示制御手段は、前記目標指定領域に対応する複数の前記周波数/時間指定領域を、前記第1領域における前記第1時間軸上の相異なる時点に設定する
    請求項1または請求項2の音響処理装置。
  4. 前記表示制御手段は、前記音響信号を構成する第1チャネル信号および第2チャネル信号の各々のスペクトログラムを前記第1領域内に配置し、前記定位軸上における前記目標指定領域の位置に応じて前記第1チャネル信号のスペクトログラムと前記第2チャネル信号のスペクトログラムとを相異なる表示態様に変化させる
    請求項1から請求項3の何れかの音響処理装置。
  5. 前記表示制御手段は、第2時間軸が設定された第3領域内に前記信号処理手段による処理前または処理後の音響信号の波形を配置した波形画像を、前記周波数特性画像および前記定位画像とともに前記表示装置に表示させる
    請求項1から請求項4の何れかの音響処理装置。
JP2011118772A 2011-05-27 2011-05-27 音響処理装置 Expired - Fee Related JP5861275B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011118772A JP5861275B2 (ja) 2011-05-27 2011-05-27 音響処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011118772A JP5861275B2 (ja) 2011-05-27 2011-05-27 音響処理装置

Publications (2)

Publication Number Publication Date
JP2012249048A JP2012249048A (ja) 2012-12-13
JP5861275B2 true JP5861275B2 (ja) 2016-02-16

Family

ID=47469091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011118772A Expired - Fee Related JP5861275B2 (ja) 2011-05-27 2011-05-27 音響処理装置

Country Status (1)

Country Link
JP (1) JP5861275B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6390112B2 (ja) * 2014-02-12 2018-09-19 ヤマハ株式会社 音楽情報処理装置及びプログラム並びに方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216147A (ja) * 2002-01-17 2003-07-30 Dainippon Printing Co Ltd 音響信号の符号化方法
JP2006033389A (ja) * 2004-07-15 2006-02-02 Olympus Corp 編集プログラム、編集方法、編集装置及び記録媒体
JP4602204B2 (ja) * 2005-08-31 2010-12-22 ソニー株式会社 音声信号処理装置および音声信号処理方法
JP4894386B2 (ja) * 2006-07-21 2012-03-14 ソニー株式会社 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
JP4332199B2 (ja) * 2008-06-12 2009-09-16 株式会社光電製作所 水中探査装置
JP5230678B2 (ja) * 2009-05-07 2013-07-10 精一 福永 採譜支援プログラム

Also Published As

Publication number Publication date
JP2012249048A (ja) 2012-12-13

Similar Documents

Publication Publication Date Title
JP5960851B2 (ja) 頭部伝達関数の線形混合による頭部伝達関数の生成のための方法およびシステム
KR101547467B1 (ko) 향상된 3d 오디오 오서링과 렌더링을 위한 시스템 및 툴들
JP5449330B2 (ja) 擬似立体音響オーディオ信号を取得するための角度依存動作装置または方法
CN105933845A (zh) 用于再现三维声音的方法和设备
JP2008042721A (ja) 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
JP7192786B2 (ja) 信号処理装置および方法、並びにプログラム
CN102972047A (zh) 用于再现立体声的方法和设备
US20150271618A1 (en) Device and method for playing sound
WO2014034555A1 (ja) 音声信号再生装置、方法、プログラム、及び記録媒体
TW201735667A (zh) 一種獲得空間音訊定向向量的方法、裝置及設備
US20220386062A1 (en) Stereophonic audio rearrangement based on decomposed tracks
JP5703807B2 (ja) 信号処理装置
JP2013201564A (ja) 音響処理装置
EP2640096B1 (en) Sound processing apparatus
JP5690082B2 (ja) 音声信号処理装置、方法、プログラム、及び記録媒体
JP5861275B2 (ja) 音響処理装置
JP7384162B2 (ja) 信号処理装置、信号処理方法、およびプログラム
JP2013172231A (ja) オーディオミキシング装置
JP2011199707A (ja) 音声データ再生装置及び音声データ再生方法
JP2016134769A (ja) オーディオ信号処理装置
JP4426159B2 (ja) ミキシング装置
JP6503752B2 (ja) オーディオ信号処理装置、オーディオ信号処理方法、プログラム、およびオーディオシステム
JP5895529B2 (ja) 残響解析装置および残響解析方法
JP6161962B2 (ja) 音声信号再生装置及び方法
JP2011004261A (ja) Avアンプ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140320

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150310

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151207

R151 Written notification of patent or utility model registration

Ref document number: 5861275

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees