JP6772890B2 - 信号処理装置、プログラム及び方法 - Google Patents

信号処理装置、プログラム及び方法 Download PDF

Info

Publication number
JP6772890B2
JP6772890B2 JP2017032567A JP2017032567A JP6772890B2 JP 6772890 B2 JP6772890 B2 JP 6772890B2 JP 2017032567 A JP2017032567 A JP 2017032567A JP 2017032567 A JP2017032567 A JP 2017032567A JP 6772890 B2 JP6772890 B2 JP 6772890B2
Authority
JP
Japan
Prior art keywords
feature amount
filter
sound
frequency
frequency analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017032567A
Other languages
English (en)
Other versions
JP2018136509A (ja
Inventor
大 藤枝
大 藤枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2017032567A priority Critical patent/JP6772890B2/ja
Publication of JP2018136509A publication Critical patent/JP2018136509A/ja
Application granted granted Critical
Publication of JP6772890B2 publication Critical patent/JP6772890B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、信号処理装置、プログラム及び方法に関し、例えば、複数の音源が存在する環境下で、特定の方向の範囲に存在する音源を強調し収音することを欲する通信端末、オーディオ機器、音声認識装置などに適用し得る。
複数の音源が存在する環境下において、ある目的の音源を抽出する技術として、複数のマイクを用いた音源分離、マイクを直線上や平面上、球面上等に配置したマイクアレイを用いたビームフォーマやヌルフォーマ等がある。特に、目的の音源以外の音源が非定常である場合や、複数ある場合には、単一のマイクを用いたノイズサプレッサによる目的音源の抽出は難しく、2つ以上のマイクを用いることが必須となる。
上述したマイクアレイを用いたビームフォーマとは、ある特定の方向の音のみ強調し収音する技術である。ビームフォーマとは、各マイクに到達する信号の時間差を利用して指向性を形成する技術である。
ビームフォーマには、加算型と減算型という2つの種類がある。加算型ビームフォーマに比べて、減算型ビームフォーマはより少ないマイク数で鋭い指向性を形成できるという利点がある。
図13は、マイク数が2個の場合の減算型ビームフォーマに係る構成を示すブロック図である。図13の減算型ビームフォーマは、第1のマイクM1、第2のマイクM2、第1の遅延手段3、第2の遅延手段4、減算手段5から構成される。第1のマイクM1で収音した第1の入力信号は第1の遅延手段3に与えられ、第2のマイクM2で収音した第2の入力信号は第2の遅延手段4に与えられる。妨害音が第1のマイクM1側から到来している場合、第1の遅延手段3は第1の入力信号を遅延させることで、第1の入力信号と第2の入力信号に含まれる妨害音の位相を合わせる。一方、妨害音が第2のマイクM2側から到来している場合、第2の遅延手段4は第2の入力信号を遅延させることで、妨害音の位相を合わせる。第1の遅延手段3から得られた第1の遅延信号と第2の遅延手段から得られた第2の遅延信号は減算手段5に与えられる。減算手段5は、第1の遅延信号から第2の遅延信号を減じることで、強調音声を得る。以上のように、減算型ビームフォーマは、第1の入力信号と第2の入力信号とに含まれる妨害音の位相を合わせ、減算し、妨害音を抑圧することで、目的音を強調する。減算型ビームフォーマは、事前に与えられる妨害音の到来方向情報を必要とする。
ところで、減算型ビームフォーマには、妨害音源が少しでも移動してしまうと、妨害音の抑圧性能が大きく低下してしまう問題がある。
図14は、従来の信号処理装置Zを用いて、自動車(車両)Aの中における運転手U1の音声を強調する例について示した説明図である。
例えば、図14に示すように音声認識を用いて音声によって操作できるカーナビゲーションシステムなどでは、自動車内において運転手の音声だけを抽出する必要がある。
したがって、運転席と助手席にそれぞれ人が乗車している場合には、助手席の助手U2の音声(妨害音)を抑圧する必要があるが、助手U2が前後左右に顔(妨害音源)を動かすと、減算型ビームフォーマでは妨害音を抑圧することができない。
適応ビームフォーマの代表の一つである最小分散ビームフォーマ(Minimum Variance Beamformer:MVB)は、目的音の到来方向を事前に与えることで、妨害音を効率的に抑圧できる方法である。MVBは、目的音の到来方向に対してはゲインが1となるような拘束条件の下で、強調音声の分散を最小化することにより、妨害音を抑圧する。
また、スペクトル減算法を用いることで、目的音源の到来方向に強い指向性を形成することができる。非特許文献1では、目的音源は常に正面にあると仮定して、第1に減算型ビームフォーマで正面方向から到来する目的音を抑圧した目的音抑圧信号を得、第2に第1の入力信号の振幅スペクトルから目的音抑圧信号の振幅スペクトルを減算(スペクトル減算)することで目的音を強調した強調音声の振幅スペクトルを得、第3に強調音声の振幅スペクトルと第1の入力信号の位相スペクトルとを用いて強調音声を得る。
矢頭 隆、森戸 誠、山田 圭、小川 哲司、"正方形マイクロホンアレイによる音源分離技術"、情報処理、Vol.51、No.11、2010
しかしながら、従来の技術は以下に述べる問題を有する。
図15は、自動車Aの中における目的音と妨害音のイメージについて示した説明図である。
MVBは、マイクの数より1つ少ない数の妨害音しか抑圧することができない。したがって、図14のように2つのマイクで目的音を強調する場合、妨害音は図15(b)に示すように伝搬するため、MVBは妨害音の直接音を抑圧できるが反射音を抑圧できないので、目的音を十分に強調することができない。
非特許文献1に記載の技術は、正面方向以外から到来した音声は、目的音に由来するものであってもすべて抑圧してしまう。したがって、図14のように2つのマイクで目的音を強調する場合、目的音は図15(a)に示すように伝搬するため、非特許文献1に記載の技術は目的音の反射音をも抑圧してしまうため、目的音の音質が劣化してしまう。
そのため、より少ない演算コストで、且つ、より少ない歪みで目的音を強調する信号処理装置、プログラム及び方法を提供することができる。
第1の本発明の信号処理装置は、(1)第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得る第1の周波数解析手段と、(2)第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得る第2の周波数解析手段と、(3)前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出する特徴量算出手段と、(4)前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得るフィルタ決定手段と、(5)前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る乗算手段とを備えることを特徴とする。
第2の本発明の信号処理プログラムは、コンピュータを、(1)第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得る第1の周波数解析手段と、(2)第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得る第2の周波数解析手段と、(3)前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出する特徴量算出手段と、(4)前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得るフィルタ決定手段と、(5)前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る乗算手段と、(6)前記乗算手段で得られた強調スペクトルを入力して信号波形を復元して強調音声を得る波形復元手段として機能させることを特徴とする。
第3の本発明の信号処理方法は、信号処理方法において、(1)第1の周波数解析手段、第2の周波数解析手段、特徴量算出手段、フィルタ決定手段、及び乗算手段を有し、(2)前記第1の周波数解析手段は、第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得て、(3)前記第2の周波数解析手段は、第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得て、(4)前記特徴量算出手段は、前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出し、(5)前記フィルタ決定手段は、前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得て、(6)前記乗算手段は、前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得ることを特徴とする。
本発明によれば、より少ない演算コストで、且つ、より少ない歪みで目的音を強調する信号処理装置、プログラム及び方法を提供することができる。
第1の実施形態に係る信号処理装置の機能的構成について示したブロック図である。 第1の実施形態に係る信号処理装置の使用環境の例について示した説明図である。 第1の実施形態に係る信号処理装置で処理される特徴量Fcenterの例について示している。 第1の実施形態に係る信号処理装置で処理される特徴量Fsideの例について示している。 第1の実施形態に係る信号処理装置で処理される音の到来方向θとDOA特徴量Fとの関係について示したグラフである。 第1の実施形態に係る信号処理装置で処理される広義単調増加関数の例について示したグラフである。 第1の実施形態に係る信号処理装置で用いられる強調フィルタの例について示したグラフである。 第1の実施形態に係るフィルタ決定手段で得られる強調フィルタGの例について示したグラフである。 第2の実施形態に係るフィルタ決定手段で得られる強調フィルタGの例について示したグラフである。 第2の実施形態に係るフィルタ決定手段で得られる強調フィルタGと、第3の実施形態に係るフィルタ決定手段で得られる強調フィルタGとの比較について示したグラフである。 第4の実施形態に係る信号処理装置で処理される音の到来方向θとDOA特徴量F’との関係について示したグラフである。 第4の実施形態に係るフィルタ決定手段404で得られる強調フィルタGの例について示した説明図である。 従来のマイク数が2個の場合の減算型ビームフォーマに係る構成を示すブロック図である。 従来の信号処理装置を用いて、自動車の中における運転手の音声を強調する例について示した説明図である。 自動車の中における目的音と妨害音のイメージについて示した説明図である。
(A)第1の実施形態
以下、本発明による信号処理装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図2は、第1の実施形態に係る信号処理装置100が利用される環境について示した説明図である。なお、図2において、括弧内の符号は、後述する第2〜第4の実施形態において用いられる符号である。
第1の実施形態に係る信号処理装置100は、自動車Aの中における運転手U1の音声を強調する例について示した説明図である。自動車Aの中では、運転席に運転手U1が座り、助手席に助手U2が座った状態となっている。そして、自動車Aの中では運転手U1の正面(運転席の正面)に、マイクアレイを構成する第1のマイクM1及び第2のマイクM2が配置されている。運転手U1からみて、第1のマイクM1は左側(助手U2と反対の側)に配置されており、第2のマイクM2は右側(助手U2の側)に配置されている。
図1は、第1の実施形態に係る信号処理装置100の機能的構成を示すブロック図である。
第1の実施形態の信号処理装置100は、第1の周波数解析手段101、第2の周波数解析手段102、特徴量算出手段103、フィルタ決定手段104、乗算手段105、及び波形復元手段106を有している。
信号処理装置100は、一部または全部をソフトウェア的に構成するようにしてもよい。信号処理装置100は、例えば、メモリ及びプロセッサを有するコンピュータにプログラム(実施形態に係る信号処理プログラムを含む)をインストールすることにより構成してもよい。
第1の周波数解析手段101は、第1の入力信号x1を周波数解析して第1の入力スペクトルX1を得る。
第2の周波数解析手段102は、第2の入力信号x2を周波数解析して第2の入力スペクトルX2を得る。
特徴量算出手段103は、第1の入力スペクトルX1と第2の入力スペクトルX2とに基づいて所定の特徴量(以下、「DOA特徴量F」と呼ぶ)を得る。DOA特徴量Fは、目的音の到来方向に応じて変化する特徴量であり、詳細については後述する。
特徴量算出手段103は、(1)式または(1)式を式変形した計算式によって前記DOA特徴量Fを得ることができる。
(1)式では、ある時刻のある周波数において、前記第1の入力スペクトルをX、前記第2の入力スペクトルをX、前記第2の入力スペクトルの複素共役をX としている。
Figure 0006772890
フィルタ決定手段104は、DOA特徴量Fを所定の広義単調増加関数で写像して強調フィルタGを得る。
乗算手段105は、第1の入力スペクトルX1に強調フィルタGを乗じて強調スペクトルYを得る。
波形復元手段106は、強調スペクトルYに基づいて信号波形を復元して強調音声yを得る。
次に、特徴量算出手段103が得るDOA特徴量と、フィルタ決定手段104が得る強調フィルタの設計思想について述べる。
強調フィルタには、第2のマイクM2側(妨害音側)から到来する妨害音の直接音と反射音を抑圧し、第1のマイクM1側(目的音側、また、正面方向を含む)から到来する目的音の直接音と反射音を抑圧しない特徴を与える必要がある。そのため、DOA特徴量には、音が、第1のマイクM1側から到来した場合には大きな値を取り、第2のマイクM2側から到来した場合には小さな値を取るようにしたい。しかし、第1のマイクM1側が正面方向を含んでいるために、このような特徴は音の到来方向に対して対称とはならないため、当該特徴を有する公知の特徴量はない。
そこで、正面方向に対して大きな値を取る特徴量と、第2のマイクM2側に対して大きな値を取る特徴量を考える。ある時刻のある周波数において、前記第1の入力スペクトルをX、前記第2の入力スペクトルをX、前記第2の入力スペクトルの複素共役をX とおき、例えば、式(1−1)で表される特徴量Fcenterと、式(1−2)で表される特徴量Fsideを考える。
Figure 0006772890
ここで、正面方向(2つのマイクの位置を結んだ直線と垂直をなす方向)を0度、第2のマイクM2側の(第1のマイクM1から見た第2のマイクM2の)方向を+90度とし、音源のスペクトルをS、角周波数をω、2つのマイク間隔をd、音の到来方向をθ(シータ)、音速をcとおくと、XとXはそれぞれ(2)式と(3)式のように書け、式(2)と式(3)を(1−1)式と(1−2)式に代入すると、それぞれ(3−1)式と(3−2)式が得られる。(3−1)式と(3−2)式で表される特徴量FcenterとFsideの、音の到来方向θに対する関係を、それぞれ図3と図4に示す。
図3は、特徴量Fcenterの例について示している。
図3では、横軸を音源の到来方向θとし縦軸を特徴量Fcenterとしている。図3では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと特徴量Fcenterの関係を示したグラフとなっている。
図4は、特徴量Fsideの例について示している。
図4では、横軸を音源の到来方向θとし縦軸を特徴量Fsideとしている。図4では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと特徴量Fsideの関係を示したグラフとなっている。
図3と図4から、Fcenterは到来方向0度に対して大きな値となっており、またFsideは0度に対して第2のマイクM2側に対して大きな値となり、第1のマイクM1側に対して小さな値となっている。
以上のように、DOA特徴量Fは、目的音の方向(0度の方向;正面方向)に対して大きな値となる特性があるFcenterと、第2のマイクM2側(すなわち妨害音の音源である助手U2の側のマイク)に対して大きな値となる特性があるFsideを用いて得られる特徴量であることがわかる。
次に、音の到来方向とDOA特徴量との関係について述べる。
DOA特徴量は(3−3)式で定義する。
Figure 0006772890
(2)式と(3)式を(3−3)式に代入すると(4)式が得られ、式変形すると(5)式が得られる。(5)式で表される音の到来方向θとDOA特徴量Fとの関係を図5に示す。
図5は、音の到来方向θとDOA特徴量Fとの関係について示したグラフである。
図5では、横軸を音源の到来方向θとし縦軸をDOA特徴量Fとしている。図5では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θとDOA特徴量Fの関係を示したグラフとなっている。
図5から、DOA特徴量Fは、正面方向に対しては必ずF=1となり、第2のマイクM2側(妨害音側)に対しては必ずF<1となる。一方、第1のマイクM1側に対しては、低い周波数と高い周波数の0度に近いθではF>1となり、高い周波数の90度に近い部分ではF<1となる。
以上のように、DOA特徴量Fは、音が、第1のマイクM1側から到来した場合には大きな値を取り、第2のマイクM2側から到来した場合には小さな値を取る特徴を備えていることがわかる。言い換えると、DOA特徴量Fは、正面方向から第1のマイクM1側の方向(助手U2からの妨害音と反対方向)にピークが存在し、当該ピークの存在する方向から第2のマイクM2側に方向が傾くほど値が小さくなる特徴があることがわかる。
Figure 0006772890
強調フィルタは、DOA特徴量を所定の広義単調増加関数で写像することで得られる。
図6は、広義単調増加関数fmap(F)の例について示したグラフである。
図6では、横軸をDOA特徴量Fの値とし縦軸を強調フィルタGの値としている。
図15からわかるように、強調フィルタは、第2のマイクM2側から到来する音を抑圧し、正面方向と第1のマイクM1側から到来する音は抑圧しないようにしたい。そこで、例えば広義単調増加関数fmap(F)を(6)式のように定義する。図6では、マイク間隔を3cm、音速を332m/s、F=0.9としたfmap(F)の例を示している。
強調フィルタをG=fmap(F)として得ると、音の到来方向θと強調フィルタGとの関係は図7のようになる。
図7は、強調フィルタの例について示したグラフである。
図7では、横軸を音の到来方向θの値とし縦軸を強調フィルタGの値としている。図7では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの値の関係を示したグラフとなっている。
つまり、DOA特徴量Fが1より少し小さい値より大きい場合には強調フィルタGを1とし、そうでない場合には強調フィルタGは1より小さくすることで、強調フィルタに所望の特性、すなわち妨害音の直接音と反射音を抑圧するが目的音の直接音と妨害音は抑圧しない特性を与えられる。
Figure 0006772890
なお、本発明と同様の強調フィルタは、例えば第1の入力スペクトルと第2の入力スペクトルとから周波数ごとに到来方向θを算出することで得ることもできるが、逆正接関数(atan、arctan、tan−1などと書かれる)を計算する演算コストがかかる。そのため、演算コストの観点で本発明の方が優位である。
(A−2)第1の実施形態の動作
次に、上述した構成を有する第1の実施形態の信号処理装置100の動作(実施形態の信号処理方法)を、図1を参照しながら説明する。
信号処理装置100は、目的音源を含む第1の入力信号xと第2の入力信号x(時間領域の入力信号)について、目的音強調を行って、強調音声y(時間領域の出力信号)を生成するものである。
第1の周波数解析手段101及び第2の周波数解析手段は、フーリエ変換に代表される任意の周波数解析手法、またはフィルタバンクに代表される任意の帯域分割手段によって、第1の入力信号xと第2の入力信号xをそれぞれK個の帯域に分割し、第1の入力スペクトルXと第2の入力スペクトルXとを得る。以下、第1の入力スペクトルと第2の入力スペクトルは、帯域の番号(例えばk番目)を明示する必要がある場合はX(k)、X(k)と書き、帯域の番号を明示する必要がない場合は単にX、Xと表記する。第1の周波数解析手段101は、得られた第1の入力スペクトルXを特徴量算出手段103と乗算手段105に与え、第2の周波数解析手段102は、得られた第2の入力スペクトルXを特徴量算出手段103に与える。なお、乗算手段105に与えられる入力スペクトルは第1の入力スペクトルXとしたが、これに限定されるものではなく、第2の入力スペクトルXを乗算手段105に与えても良く、いずれも同様の効果を奏する。
特徴量算出手段103は、第1の入力スペクトルXと第2の入力スペクトルXとに基づいて(7)式によってDOA特徴量Fを算出し、フィルタ決定手段104に与える。(7)式をそのまま使って計算しても良いが、冗長な演算を含むため、式変形しても良い。XとXは複素数なので、これを(8)式のように書き直して(7)式に代入して整理すると、(9)式を得る。(7)式の代わりに(9)式を用いることで、乗算回数を減らすことができる。
Figure 0006772890
フィルタ決定手段104は、DOA特徴量Fに基づいて所定の広義単調増加関数によって強調フィルタGを算出し、乗算手段105に与える。第1の実施形態では、すべての周波数に対して同じ広義単調増加関数を用いる。所定の広義単調増加関数fmap(F)として、例えば(10)式で定義される1つの閾値Fを持つ関数や、(11)式で定義される2つの閾値F、Fを持つ関数、(12)式で定義されるスケールF、オフセットFのシグモイド関数を用いることができる。
Figure 0006772890
図8は、第1の実施形態に係るフィルタ決定手段104で得られる強調フィルタGの例について示したグラフである。
図8(a)、図8(b)、図8(c)は、それぞれ(10)式、(11)式、(12)式によって得られる強調フィルタGの例を示している。図8(a)、図8(b)、図8(c)では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの関係を示したグラフとなっている。図8(a)、図8(b)、図8(c)では、横軸を音源の到来方向θとし縦軸を強調フィルタGの値(到来方向θに応じた値)としている。
ここでは、F=0.8、F=0.7、F=0.9、F=12とした。妨害音の抑圧性能に関して、(10)式と(11)式との差はあまりない。一方、強調音声の歪みに関して、(10)式で得られる強調フィルタGは値を0か1しか持たないためにミュージカルノイズを発生しやすいが、(11)式は遷移帯域があることで抑圧/非抑圧の切り替わりが緩やかになるためにミュージカルノイズが発生しにくい。(12)式は(11)式をさらに滑らかにした特性となっており、更なるミュージカルノイズ低減効果や歪みを減らす効果が期待できる。多少の演算コストの増加が許容されるのであれば、(12)式を用いるのが好適である。
乗算手段105は、入力スペクトルXに周波数ごとに強調フィルタG(強調ゲイン)を乗じ、得られた強調スペクトルYを波形復元手段106に与える。
波形復元手段106は、第1の周波数解析手段101と第2の周波数解析手段102で用いた周波数解析手法または帯域分割手法に対応する波形復元手法を用いて、乗算手段105から与えられた強調スペクトルYに基づいて信号波形を再構成し、得られた強調音声y(強調信号)を出力する。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
第1の実施形態の信号処理装置100では、第2のマイクM2側の方向から到来する音を抑圧し、正面方向と第1のマイクM1側の方向から到来する音は抑圧しないので、自動車内において運転手U1の声(目的音)を強調する場合などにおいて、少ない歪みで目的音を強調することができる。
言い換えると、信号処理装置100では、少ない演算コストで、妨害音の直接音と反射音を抑圧するが、目的音の直接音と反射音は抑圧しない強調フィルタGを設計できるので、少ない歪みで目的音を強調できるという効果を奏する。
(B)第2の実施形態
以下、本発明による信号処理装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
第2の実施形態の信号処理装置200も、第1の実施形態と同様に図2に示すような環境で利用されるものとして説明する。
また、第2の実施形態の信号処理装置200の内部構成についても、上述の図1を用いて示すことができる。
以下では、第2の実施形態の信号処理装置200について、第1の実施形態との差異を説明する。
第1の実施形態では、フィルタ決定手段104において、すべての周波数に同じ広義単調増加関数fmap(F)を適用して強調フィルタGを得ていたため、図8に示した通り、強調フィルタGの特性が周波数ごとに異なっていた。特に低い周波数では抑圧されない到来方向の範囲が広くなる現象が起こる。そこで、第2の実施形態では、どの周波数でも同じような特性となるように、周波数ごとに異なる広義単調増加関数を適用する。
第2の実施形態の信号処理装置200の構成は、図1に示すように、フィルタ決定手段104がフィルタ決定手段204に替わること以外は、第1の実施形態の信号処理装置100の構成と同じである。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の信号処理装置200の動作(実施形態の信号処理方法)を説明する。
第2の実施形態の信号処理装置200の動作は、フィルタ決定手段204の動作がフィルタ決定手段104とは異なる点以外は、第1の実施形態の信号処理装置100の動作と同じである。
第1の実施形態では、図7に示すように、正面方向から第2のマイクM2の側に到来方向を傾けた際に、周波数によって強調フィルタGのゲインが所定以下(例えば、0.5以下)となる到来角度(以下、「カットオフ到来角度」と呼ぶ)にばらつきがある。言い換えると、第1の実施形態では、周波数によって抑圧しない到来方向の範囲にばらつきがある。これに対して、第2の実施形態のフィルタ決定手段204は、周波数ごとの広義単調増加関数を設定することで、このばらつきを吸収し、複数の周波数でカットオフ到来角度(抑圧しない到来方向の範囲)が近づくようにしている。フィルタ決定手段204において、周波数ごとのカットオフ到来角度のばらつき(抑圧しない到来方向の範囲のばらつき)を抑制するような、周波数ごとの広義単調増加関数を求める方式については限定されないものであるが、例えば、いかのような処理を適用することができる。
フィルタ決定手段204は、DOA特徴量Fに基づいて所定の広義単調増加関数によって強調フィルタGを算出し、乗算手段105に与える。第2の実施形態では、周波数ごとに異なる広義単調増加関数を用いる。ここでは、k番目の周波数のDOA特徴量をF(k)、k番目の周波数の強調ゲインをG(k)と書く。k番目の周波数をfとして、到来方向と周波数の番号をDOA特徴量に変換する関数を(13)式で定義する。そして、所定のk番目の周波数の広義単調増加関数fmap(F(k))として、例えば(14)式で定義される1つの到来方向閾値θを関数や、(15)式で定義される2つの到来方向閾値θ、θを持つ関数、(16)式で定義されるスケールF、オフセット到来方向θのシグモイド関数を用いることができる。
Figure 0006772890
図9は、第2の実施形態に係るフィルタ決定手段204で得られる強調フィルタGの例について示したグラフである。
図9(a)、図9(b)、図9(c)は、それぞれ(14)式、(15)式、(16)式によって得られる強調フィルタGの例を示している。図9(a)、図9(b)、図9(c)では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの関係を示したグラフとなっている。図9(a)、図9(b)、図9(c)では、横軸を音源の到来方向θとし縦軸を強調フィルタGの値(到来方向θに応じた値)としている。
ここでは、θ=15、θ=20、θ=10、F=12とした。第1の実施形態における強調フィルタG(図8)では、抑圧しない到来方向の範囲が周波数ごとに変化していたが、第2の実施形態における強調フィルタG(図9)では、高い周波数の第1のマイクM1側を除いて、抑圧しない到来方向の範囲は周波数が変わっても変化しない。なお、(16)式については周波数によって特性が変化しているが、強調フィルタGのゲインが0.5となるカットオフ到来角度は周波数に依らず一定である。つまり、(13)〜(16)式を用いて強調ゲインを算出すれば、第2のマイクM2側、すなわち妨害音側(助手席側)を何度まで抑圧するかを、すべての周波数共通かつ直接的に設定できる。
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
第2の実施形態の信号処理装置200では、強調ゲインが抑圧しない到来方向の範囲をすべての周波数で同じように与えることができ、かつその範囲を到来方向の角度そのもので設定できるので、より適切な調整が可能となり、より少ない歪みで目的音を強調できるという効果を奏する。
(C)第3の実施形態
以下、本発明による信号処理装置、プログラム及び方法の第3の実施形態を、図面を参照しながら詳述する。
(C−1)第3の実施形態の構成
第3の実施形態の信号処理装置200も、第1、第2の実施形態と同様に図2に示すような環境で利用されるものとして説明する。
また、第3の実施形態の信号処理装置300の内部構成についても、上述の図1を用いて示すことができる。
以下では、第3の実施形態の信号処理装置200について、第2の実施形態との差異を説明する。
第2の実施形態では、妨害音側の到来方向を何度まで抑圧するかを、すべての周波数共通で設定した。しかし、低い周波数は信号の波長に対してマイク間隔を十分に広く取ることが困難なため(100Hzの波長は約3.3mだが、自動車内でのマイク間隔は数cmとするのが一般的)、低い周波数において数値計算によって得られる到来方向に関する情報(本発明ではDOA特徴量)は一般に曖昧になる(到来方向推定の意味で推定誤差が大きくなる)。そこで、第3の実施形態では、所定よりも低い周波数(例えば、250Hz以下の周波数帯)では強調ゲインが抑圧しない到来方向の範囲を広げる(第2のマイクM2の側に広げる;妨害音を発する助手U2の側に広げる)ように設計する。
第3の実施形態の信号処理装置300の構成は、フィルタ決定手段104がフィルタ決定手段304に替わること以外は、第1の実施形態の信号処理装置100の構成と同じである。
(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の信号処理装置300の動作(実施形態の信号処理方法)を説明する。
第3の実施形態の信号処理装置300の動作は、フィルタ決定手段304の動作がフィルタ決定手段104とは異なる点以外は、第1の実施形態の信号処理装置100の動作と同じである。
フィルタ決定手段304は、DOA特徴量Fに基づいて所定の広義単調増加関数によって強調フィルタGを算出し、乗算手段105に与える。第2の実施形態では、周波数ごとに異なる広義単調増加関数を用いる。ここでは、k番目の周波数のDOA特徴量をF(k)、k番目の周波数の強調ゲインをG(k)と書く。k番目の周波数をfとして、到来方向と周波数の番号をDOA特徴量に変換する関数を(17)式で定義する。そして、所定のk番目の周波数の広義単調増加関数fmap(F(k))として、例えば(18)式で定義される1つの到来方向閾値θを持つ関数を用いることができる。
Figure 0006772890
図10は、第2の実施形態に係るフィルタ決定手段204で得られる強調フィルタGと、第3の実施形態に係るフィルタ決定手段304で得られる強調フィルタGとの比較について示したグラフである。
図10(a)は、第2の実施形態におけるフィルタ決定手段204で上述の(13)式及び(14)式を用いて得られる強調フィルタGについて示している。また、図10(b)は、第3の実施形態に係るフィルタ決定手段304で(17)式及び(18)式により得られる強調フィルタGの例を示している。図10(a)、図10(b)では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの関係を示したグラフとなっている。図10(a)、図10(b)では、横軸を音源の到来方向θとし縦軸を強調フィルタGの値(到来方向θに応じた値)としている。
ここでは、θ=5、F=0.97とした。図10より、到来方向と周波数の番号をDOA特徴量に変換する関数Φ(ファイ)の上限値をFとしたことで、低い周波数の抑圧しない到来方向の範囲が広くなったことが確認できる。
(C−3)第3の実施形態の効果
第3の実施形態によれば、第1、第2の実施形態の効果に加えてができる。
第3の実施形態の信号処理装置300では、数値計算によって得られる到来方向に関する情報が曖昧となる低い周波数において、抑圧しない到来方向の範囲を広めに確保できるので、低い周波数の目的音の歪みが軽減され、より少ない歪みで目的音を強調できるという効果を奏する。
(D)第4の実施形態
以下、本発明による信号処理装置、プログラム及び方法の第4の実施形態を、図面を参照しながら詳述する。
(D−1)第4の実施形態の構成
第4の実施形態の信号処理装置400も、第1〜第3の実施形態と同様に図2に示すような環境で利用されるものとして説明する。
また、第4の実施形態の信号処理装置400の内部構成についても、上述の図1を用いて示すことができる。
以下では、第4の実施形態の信号処理装置400について、第1〜第3の実施形態との差異を説明する。
第1〜第3の実施形態では、自動車A内において運転手U1の正面に2つのマイクM1、M2をセットする場合を想定して、助手席側(助手U2側)だけを抑圧する強調フィルタGを設計した。これに対して、第4の実施形態では、本発明におけるDOA特徴量を用いて正面方向のみを強調する(抑圧しない)強調フィルタを適用するものとする。
図1に示すように、第4の実施形態の信号処理装置400の構成は、特徴量算出手段103とフィルタ決定手段104がそれぞれ特徴量算出手段403とフィルタ決定手段404に替わること以外は、第1の実施形態の信号処理装置100の構成と同じである。
(D−2)第4の実施形態の動作
次に、以上のような構成を有する第4の実施形態の信号処理装置400の動作(実施形態の信号処理方法)を説明する。
次に、上述した構成を有する第4の実施形態の信号処理装置400の動作を説明する。第4の実施形態の信号処理装置400の動作は、特徴量算出手段403とフィルタ決定手段304の動作が特徴量算出手段103とフィルタ決定手段104とは異なる点以外は、第1の実施形態の信号処理装置100の動作と同じである。
特徴量算出手段403は、第1の入力スペクトルXと第2の入力スペクトルXとに基づいて(19)式によって2つのDOA特徴量FとF’を算出し、フィルタ決定手段404に与える。2つのDOA特徴量を音の到来方向θに関して整理すると、(20)式となる。
図11は、音の到来方向θと(20)式のDOA特徴量F’との関係について示したグラフである。
図11では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θとDOA特徴量F’の関係を示したグラフとなっている。図11では、横軸を音源の到来方向θとし縦軸をDOA特徴量F’としている。
図11を見ると、DOA特徴量F(図5)とはちょうど左右が反転していることが確認できる。
Figure 0006772890
フィルタ決定手段404は、2つのDOA特徴量FとF’に基づいて所定の広義単調増加関数によって強調フィルタGを算出し、乗算手段105に与える。所定の広義単調増加関数には、第1の実施形態に係るfmap(F)、第2の実施形態に係るΦ(φ,k)とfmap(F(k))、第3の実施形態に係るΦ(φ,F,k)とfmap(F(k))のいずれを用いても良いが、ここでは一例として、第2の実施形態の所定の広義単調増加関数を用いて説明する。第4の実施形態において、強調フィルタGは(21)式を用いて算出される。
図12は、第4の実施形態に係るフィルタ決定手段404で得られる強調フィルタGの例について示した説明図である。
図12(a)、図12(b)、図12(c)は、それぞれfmap(F(k))として(14)式、(15)式、(16)式を用いた場合に得られる強調フィルタGの例を示している。図12(a)、図12(b)、図12(c)では、音源の周波数を1kHz、2kHz、4kHzと変化させた場合の到来方向θと強調フィルタGの関係を示したグラフとなっている。図12(a)、図12(b)、図12(c)では、横軸を音源の到来方向θとし縦軸を強調フィルタGの値(到来方向θに応じた値)としている。
ここでは、θ=20、θ=15、θ=25、F=12とした。図12より、正面方向のみを強調する(抑圧しない)強調フィルタが得られていることが分かる。
(D−3)第4の実施形態の効果
第4の実施形態によれば、第1〜第3の実施形態と比較して以下のような効果を奏することができる。
第4の実施形態の信号処理装置400では、強調フィルタG(強調ゲイン)が抑圧しない到来方向の範囲を正面方向に限定した目的音を強調できるという特有の効果を奏することができる。
(E)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(E−1)上記の実施形態において、信号処理装置は、強調スペクトルYの波形を復元して強調音声yを出力するものとして記載したが、波形を復元せずに強調スペクトルYを出力しても良い。また、強調スペクトルYと強調音声yの両方を出力するようにしても良い。その場合、波形復元手段106は除外するようにしてもよい。
100…信号処理装置、101…第1の周波数解析手段、102…第2の周波数解析手段、103…特徴量算出手段、104…フィルタ決定手段、105…乗算手段、106…波形復元手段、M1…第1のマイク(第1の収音装置)、M2…第2のマイク(第2の収音装置)。

Claims (10)

  1. 第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得る第1の周波数解析手段と、
    第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得る第2の周波数解析手段と、
    前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出する特徴量算出手段と、
    前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得るフィルタ決定手段と、
    前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る乗算手段と
    を備えることを特徴とする信号処理装置。
  2. 前記第1の特徴量は、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して前記第1の収音装置の側の方向にピークが存在し、前記ピークの方向から前記第2の収音装置側に方向が傾くほど値が小さくなることを特徴とする請求項1に記載の信号処理装置。
  3. 前記特徴量算出手段は、正面方向に対して大きな値となる第2の特徴量と、正面方向よりも前記第2の収音装置の側の方向に対して大きな値となる第3の特徴量を用いて、前記第1の特徴量を算出することを特徴とする請求項1又は2に記載の信号処理装置。
  4. 前記フィルタ決定手段は、周波数ごとに異なる広義単調増加関数を用いて前記第1の特徴量を写像し、周波数ごとに前記強調フィルタを得ることを特徴とする請求項1〜3のいずれかに記載の信号処理装置。
  5. 前記フィルタ決定手段は、周波数ごとの前記強調フィルタにおいて、抑圧しない到来方向の範囲を一致させるように、各周波数の広義単調増加関数を設定することを特徴とする請求項4に記載の信号処理装置。
  6. 前記フィルタ決定手段は、所定の周波数以下の低周波数帯の前記強調フィルタにおいて、前記所定の周波数より高い高周波数帯と比較して抑圧しない到来方向の範囲を広くする広義単調増加関数を設定することを特徴とする請求項4に記載の信号処理装置。
  7. 前記フィルタ決定手段は、前記低周波数帯の前記強調フィルタにおいて、前記高周波数帯よりも、抑圧しない到来方向の範囲を前記第2の収音装置側に広くする広義単調増加関数を設定することを特徴とする請求項6に記載の信号処理装置。
  8. 前記フィルタ決定手段は、前記第1の特徴量を用いて、正面方向のみを強調する強調フィルタを得る広義単調増加関数を設定することを特徴とする請求項1〜3のいずれかに記載の信号処理装置。
  9. コンピュータを、
    第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得る第1の周波数解析手段と、
    第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得る第2の周波数解析手段と、
    前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出する特徴量算出手段と、
    前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得るフィルタ決定手段と、
    前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る乗算手段と、
    前記乗算手段で得られた強調スペクトルを入力して信号波形を復元して強調音声を得る波形復元手段と
    して機能させることを特徴とする信号処理プログラム。
  10. 信号処理方法において、
    第1の周波数解析手段、第2の周波数解析手段、特徴量算出手段、フィルタ決定手段、及び乗算手段を有し、
    前記第1の周波数解析手段は、第1の収音装置から入力された第1の入力信号を周波数解析して第1の入力スペクトルを得て、
    前記第2の周波数解析手段は、第2の収音装置から入力された第2の入力信号を周波数解析して第2の入力スペクトルを得て、
    前記特徴量算出手段は、前記第1の周波数解析手段で得られた第1の入力スペクトルと前記第2の周波数解析手段で得られた第2の入力スペクトルに基づき、前記第1の収音装置の位置と前記第2の収音装置の位置を結んだ直線と垂直をなす正面方向に対して、正面方向及び前記第1の収音装置側の方向の値を大きくとり、前記第2の収音装置側の方向の値を小さくとる第1の特徴量を算出し、
    前記フィルタ決定手段は、前記特徴量算出手段で算出された前記第1の特徴量を、所定の広義単調増加関数で写像して強調フィルタを得て、
    前記乗算手段は、前記第1の周波数解析手段で得られた第1の入力スペクトルに前記フィルタ決定手段で得られた強調フィルタを乗じて強調スペクトルを得る
    ことを特徴とする信号処理方法。
JP2017032567A 2017-02-23 2017-02-23 信号処理装置、プログラム及び方法 Active JP6772890B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017032567A JP6772890B2 (ja) 2017-02-23 2017-02-23 信号処理装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017032567A JP6772890B2 (ja) 2017-02-23 2017-02-23 信号処理装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2018136509A JP2018136509A (ja) 2018-08-30
JP6772890B2 true JP6772890B2 (ja) 2020-10-21

Family

ID=63366854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017032567A Active JP6772890B2 (ja) 2017-02-23 2017-02-23 信号処理装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6772890B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7004875B2 (ja) * 2019-12-20 2022-01-21 三菱電機株式会社 情報処理装置、算出方法、及び算出プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3355598B2 (ja) * 1996-09-18 2002-12-09 日本電信電話株式会社 音源分離方法、装置及び記録媒体
JP3384540B2 (ja) * 1997-03-13 2003-03-10 日本電信電話株式会社 受話方法、装置及び記録媒体

Also Published As

Publication number Publication date
JP2018136509A (ja) 2018-08-30

Similar Documents

Publication Publication Date Title
US9445194B2 (en) Sound source separating apparatus, sound source separating program, sound pickup apparatus, and sound pickup program
KR101555416B1 (ko) 음향 삼각 측량에 의한 공간 선택적 사운드 취득 장치 및 방법
US7991166B2 (en) Microphone apparatus
JP4986248B2 (ja) 音源分離装置、方法及びプログラム
JP6780644B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6131989B2 (ja) 収音装置、プログラム及び方法
JP6065028B2 (ja) 収音装置、プログラム及び方法
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
Mabande et al. Room geometry inference based on spherical microphone array eigenbeam processing
JP6182169B2 (ja) 収音装置、その方法及びプログラム
JP6772890B2 (ja) 信号処理装置、プログラム及び方法
JP2016163135A (ja) 収音装置、プログラム及び方法
US11482239B2 (en) Joint source localization and separation method for acoustic sources
Bountourakis et al. Parametric spatial post-filtering utilising high-order circular harmonics with applications to underwater sound-field visualisation
JP6241520B1 (ja) 収音装置、プログラム及び方法
JP6260666B1 (ja) 収音装置、プログラム及び方法
JP4738284B2 (ja) ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体
Kurc et al. Sound source localization with DAS beamforming method using small number of microphones
JP6065029B2 (ja) 収音装置、プログラム及び方法
JP7182168B2 (ja) 音情報処理装置及びプログラム
JP6863004B2 (ja) 収音装置、プログラム及び方法
Zhao et al. Adapting GCC-PHAT to co-prime circular microphone arrays for speech direction of arrival estimation using neural networks
JP5713933B2 (ja) 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JP6923025B1 (ja) 収音装置、プログラム及び方法
JP7004875B2 (ja) 情報処理装置、算出方法、及び算出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200914

R150 Certificate of patent or registration of utility model

Ref document number: 6772890

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150