JP5772648B2

JP5772648B2 - ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム

Info

Publication number: JP5772648B2
Application number: JP2012031709A
Authority: JP
Inventors: 永井　俊明; 俊明永井; 孝朗山邊
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2012-02-16
Filing date: 2012-02-16
Publication date: 2015-09-02
Anticipated expiration: 2032-02-16
Also published as: JP2013168855A

Description

本発明はノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラムに関する。

ノイズ低減処理技術は、例えば移動体通信の分野で広く利用されている。移動体通信では、低ビットレートで音声を符号化する際にノイズが混入することで音声の明瞭度が劣化する。よってこれを避けるために、音声を符号化する前にノイズを検出してノイズ低減処理を行なっている。

ノイズ低減処理技術では、例えば、音声（例えば、通話者が発する音声などの希望音声）を主に収音するマイクロフォンによって収音された音声信号から、ノイズ（例えば希望音声以外の不要音）を主に収音するマイクロフォンによって収音されたノイズ信号を差し引くことで、音声信号に含まれるノイズ成分を除去することができる。

特許文献１には、音声品質の低下及びノイズを除去する処理性能の低下を防止し、常に音声を最良の状態で聞き取れるようにする技術が開示されている。特許文献２には、適応雑音低減型の音声入力装置において、希望音声の低減を防止して、低減対象の不要音のみを低減するための技術が開示されている。また、特許文献３には、雑音が抑圧されたより高い音声品質を実現するための技術が開示されている。

特開平７−１６８５８６号公報特開平６−６７６９２号公報特開２０１１−９９９６７号公報

音声を主に収音する音声用マイクロフォンとノイズを主に収音する参照音用マイクロフォンを用いてノイズ低減処理を実施する場合、ノイズの到来方向によっては音声の低減量（キャンセル量）が増大するという問題があった。つまり、ノイズ低減装置の使用状況によってはノイズを収音する参照音用マイクロフォンにも音声が混入する場合もある。このように参照音用マイクロフォンに音声が混入すると、音声用マイクロフォンで収音された音声に混入しているノイズ成分だけでなく音声自体もキャンセルされてしまい、音声の明瞭度が低下するという問題があった。

上記課題に鑑み本発明の目的は、ノイズ成分を適切に低減することができるノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラムを提供することである。

本発明にかかるノイズ低減装置は、第１のマイクロフォンで収音された音に応じた第１の収音信号および第２のマイクロフォンで収音された音に応じた第２の収音信号のうちの少なくとも一方に基づき音声区間およびノイズ区間を検出する音声ノイズ区間検出部と、前記音声区間における前記第１の収音信号と前記第２の収音信号との位相差である音声位相差と、前記ノイズ区間における前記第１の収音信号と前記第２の収音信号との位相差であるノイズ位相差とを取得する位相情報取得部と、前記音声位相差と前記ノイズ位相差の状態を判定するノイズ低減処理判定部と、前記ノイズ低減処理判定部の判定結果に応じて前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施するノイズ低減処理部と、を備える。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差との差の状態を判定してもよい。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態がノイズ低減処理を実施する場合である第１の状態であるか否かを判定してもよく、ノイズ低減処理部は、前記ノイズ低減処理判定部が前記第１の状態であると判定した場合、前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施してもよい。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態が、前記第１の状態よりもノイズ低減処理を弱く実施する場合である第２の状態であるか否かを判定してもよく、ノイズ低減処理部は、前記ノイズ低減処理判定部が前記第２の状態であると判定した場合、前記第１の状態よりもノイズ低減処理を弱く実施してもよい。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態が、ノイズ低減処理を実施しない場合である第２の状態であるか否かを判定してもよく、ノイズ低減処理部は、前記ノイズ低減処理判定部が前記第２の状態であると判定した場合、ノイズ低減処理を実施しないようにしてもよい。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差との差の絶対値が所定の閾値以内である場合、前記第２の状態と判定してもよい。
前記位相情報取得部は、前記音声区間において前記音声位相差を更新し、前記ノイズ区間において前記ノイズ位相差を更新してもよい。
前記音声区間における前記第１の収音信号の大きさと前記第２の収音信号の大きさとの差である音声パワー差と、前記ノイズ区間における前記第１の収音信号の大きさと前記第２の収音信号の大きさとの差であるノイズパワー差とを取得するパワー情報取得部を更に備えていてもよく、前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態および前記音声パワー差と前記ノイズパワー差の状態を判定してもよく、前記ノイズ低減処理部は、前記ノイズ低減処理判定部の判定した、前記音声位相差と前記ノイズ位相差の状態、及び、前記音声パワー差と前記ノイズパワー差の状態に応じて、前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施してもよい。
前記ノイズ低減処理部は、前記ノイズ低減処理判定部において前記第１の状態と判定された場合、前記第１の収音信号に含まれるノイズ成分を前記第２の収音信号を用いて低減し、当該ノイズ低減処理後の信号を音声信号として出力し、前記ノイズ低減処理判定部において前記第２の状態と判定された場合、前記第１の収音信号を音声信号として出力してもよい。
前記ノイズ低減処理部は、前記音声区間における前記第２の収音信号の位相が前記第１の収音信号の位相よりも早く、且つ、前記ノイズ低減処理判定部において前記第１の状態と判定された場合、前記第２の収音信号に含まれるノイズ成分を前記第１の収音信号を用いて低減し、当該ノイズ低減処理後の信号を音声信号として出力し、前記音声区間における前記第２の収音信号の位相が前記第１の収音信号の位相よりも早く、且つ、前記ノイズ低減処理判定部において前記第２の状態と判定された場合、前記第２の収音信号を音声信号として出力してもよい。
本発明にかかる音声入力装置は、上記ノイズ低減装置を備える。
前記音声入力装置において、前記第１のマイクロフォンは前記音声入力装置の第１の面に設けられ、前記第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられていてもよい。
本発明にかかる無線通信装置は、上記ノイズ低減装置を備える。
前記無線通信装置において、前記第１のマイクロフォンは前記無線通信装置の第１の面に設けられ、前記第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられていてもよい。
本発明にかかるノイズ低減方法は、第１のマイクロフォンで収音された音に応じた第１の収音信号および第２のマイクロフォンで収音された音に応じた第２の収音信号のうちの少なくとも一方に基づき音声区間およびノイズ区間を検出し、前記音声区間における前記第１の収音信号と前記第２の収音信号との位相差である音声位相差と、前記ノイズ区間における前記第１の収音信号と前記第２の収音信号との位相差であるノイズ位相差とを取得し、前記音声位相差と前記ノイズ位相差の状態を判定し、前記音声位相差と前記ノイズ位相差の状態を判定した結果に応じて前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施する。
本発明にかかるノイズ低減プログラムは、コンピュータに、第１のマイクロフォンで収音された音に応じた第１の収音信号および第２のマイクロフォンで収音された音に応じた第２の収音信号のうちの少なくとも一方に基づき音声区間およびノイズ区間を検出させ、前記音声区間における前記第１の収音信号と前記第２の収音信号との位相差である音声位相差と、前記ノイズ区間における前記第１の収音信号と前記第２の収音信号との位相差であるノイズ位相差とを取得させ、前記音声位相差と前記ノイズ位相差の状態を判定し、前記音声位相差と前記ノイズ位相差の状態を判定した結果に応じて前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施させる、ノイズ低減プログラムである。

本発明によりノイズ成分を適切に低減することができるノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラムを提供することができる。

実施の形態１にかかるノイズ低減装置を示すブロック図である。実施の形態１にかかるノイズ低減装置が備える音声ノイズ区間検出部の一例を示すブロック図である。実施の形態１にかかるノイズ低減装置が備える音声ノイズ区間検出部の他の例を示すブロック図である。実施の形態１にかかるノイズ低減装置が備える位相情報取得部の一例を示すブロック図である。実施の形態１にかかるノイズ低減装置が備える音声用マイクロフォンおよび参照音用マイクロフォンに対する音声およびノイズの音源の位置の一例を示す図である。実施の形態１にかかるノイズ低減装置が備える音声用マイクロフォンおよび参照音用マイクロフォンに対する音声およびノイズの音源の位置の一例を示す図である。実施の形態１にかかるノイズ低減装置が備える音声用マイクロフォンおよび参照音用マイクロフォンに対する音声およびノイズの音源の位置の一例を示す図である。実施の形態１にかかるノイズ低減装置が備えるノイズ低減処理部の一例を示すブロック図である。実施の形態１にかかるノイズ低減装置の動作を説明するためのフローチャートである。実施の形態１にかかるノイズ低減装置を用いた音声入力装置の一例を示す図である。実施の形態１にかかるノイズ低減装置を用いた無線通信装置の一例を示す図である。実施の形態１にかかる発明の効果を説明するための図である。実施の形態１にかかる発明の効果を説明するための図である。実施の形態２にかかるノイズ低減装置を示すブロック図である。実施の形態２にかかるノイズ低減装置が備えるパワー情報取得部の一例を示すブロック図である。実施の形態２にかかるノイズ低減装置の動作を説明するためのフローチャートである。実施の形態２にかかるノイズ低減装置の他の例を示すブロック図である。実施の形態３にかかるノイズ低減装置を示すブロック図である。実施の形態３にかかるノイズ低減装置が備えるノイズ低減処理部の一例を示すブロック図である。実施の形態３にかかるノイズ低減装置の動作を説明するためのフローチャートである。実施の形態３にかかるノイズ低減装置が備える音声用マイクロフォンおよび参照音用マイクロフォンに対する音声およびノイズの音源の位置の一例を示す図である。

＜実施の形態１＞
以下、図面を参照して本発明の実施の形態について説明する。
図１は、実施の形態１にかかるノイズ低減装置を示すブロック図である。図１に示すように、本実施の形態にかかるノイズ低減装置１は、音声用マイクロフォン１１、参照音用マイクロフォン１２、ＡＤコンバータ１３、１４、音声ノイズ区間検出部１５、位相情報取得部１６、ノイズ低減処理判定部１７、およびノイズ低減処理部１８を有する。

音声用マイクロフォン１１および参照音用マイクロフォン１２はそれぞれ、音声成分やノイズ成分を含む音を収音することができる。音声用マイクロフォン１１は、主に音声成分を含む音を収音してアナログ信号に変換し、変換後のアナログ信号をＡＤコンバータ１３に出力する。参照音用マイクロフォン１２は、主にノイズ成分を含む音を収音してアナログ信号に変換し、変換後のアナログ信号をＡＤコンバータ１４に出力する。例えば、参照音用マイクロフォン１２で収音された音に含まれるノイズ成分は、音声用マイクロフォン１１で収音された音に含まれるノイズ成分を低減するために用いられる。

なお、本実施の形態にかかるノイズ低減装置では、マイクロフォンが２つの場合（つまり、音声用マイクロフォン１１と参照音用マイクロフォン１２）の構成について説明するが、例えば参照音用マイクロフォンを更に追加してマイクロフォンを３つ以上設けてもよい。

ＡＤコンバータ１３は、音声用マイクロフォン１１から出力されたアナログ信号を所定のサンプリングレートでサンプリングしてデジタル信号に変換し、収音信号２１を生成する。ＡＤコンバータ１３で生成された収音信号２１は、音声ノイズ区間検出部１５、位相情報取得部１６、およびノイズ低減処理部１８に出力される。

ＡＤコンバータ１４は、参照音用マイクロフォン１２から出力されたアナログ信号を所定のサンプリングレートでサンプリングしてデジタル信号に変換し、収音信号２２を生成する。ＡＤコンバータ１４で生成された収音信号２２は、位相情報取得部１６およびノイズ低減処理部１８に出力される。

本実施の形態において、音声用マイクロフォン１１および参照音用マイクロフォン１２に入力される音声の周波数帯域は、おおよそ１００Ｈｚから４０００Ｈｚ程度である。よって、ＡＤコンバータ１３、１４におけるサンプリング周波数を８ｋＨｚ〜１２ｋＨｚ程度とすることで、音声成分を含むアナログ信号をデジタル信号として取り扱うことができる。
なお、本明細書では、主に音声成分を含む収音信号を音声信号とも記載し、主にノイズ成分を含む収音信号を参照信号とも記載する。

音声ノイズ区間検出部１５は、ＡＤコンバータ１３から出力された収音信号２１に基づき音声区間およびノイズ区間を検出する。そして、音声ノイズ区間検出部１５は、音声区間およびノイズ区間を示す音声ノイズ区間情報２３、２４を、位相情報取得部１６およびノイズ低減処理部１８にそれぞれ出力する。

音声ノイズ区間検出部１５における音声ノイズ区間検出処理には任意の技術を用いることができる。なお、ノイズレベルが高い環境下でノイズ低減装置が使用される場合は、高い精度で音声区間とノイズ区間を判定することが好ましく、例えば、後述する音声ノイズ区間検出技術Ａや音声ノイズ区間検出技術Ｂを用いることで、音声区間およびノイズ区間を高い精度で検出することができる。音声には人の声以外の音も含まれるが、これらの例では、主に人の声を検出する。なお、音声ノイズ区間検出技術Ａは、一例として、特願２０１０−２６０７９８に基づく優先権を主張する出願である特願２０１１−２５４５７８にも記載されている。また、音声ノイズ区間検出技術Ｂは、一例として、特願２０１１−０２０４５９にも記載されている。

最初に、音声ノイズ区間検出技術Ａについて説明する。音声ノイズ区間検出技術Ａでは、音声の主要部分である母音成分の持つ周波数スペクトルに着目し、音声区間を判定している。音声ノイズ区間検出技術Ａでは、適切なノイズレベルを帯域毎に設定し、母音周波数成分のピークとの信号対ノイズレベル比を求め、信号対ノイズレベル比が所定のレベル比かつ所定のピーク数であるか否かを観察することで、音声区間を判定している。

図２は、音声ノイズ区間検出技術Ａを用いた音声ノイズ区間検出部１５'の一例を示すブロック図である。図２に示す音声ノイズ区間検出部１５'は、フレーム化部３１、スペクトル生成部３２、帯域分割部３３、周波数平均部３４、保持部３５、時間平均部３６、ピーク検出部３７、および音声判定部３８を備える。

フレーム化部３１は、収音信号２１を予め定められた時間幅を有するフレーム単位（所定サンプル数長）で順次切り出し、フレーム単位の入力信号（以下、フレーム化入力信号と称す）を生成する。

スペクトル生成部３２は、フレーム化部３１から出力されたフレーム化入力信号の周波数分析を行い、時間領域のフレーム化入力信号を周波数領域のフレーム化入力信号に変換して、スペクトルを集めたスペクトルパターンを生成する。スペクトルパターンは、所定の周波数帯域に渡って、周波数とその周波数におけるエネルギーとが対応付けられた、周波数毎のスペクトルを集めたものである。ここで用いられる周波数変換法は、特定の手段に限定しないが、音声のスペクトルを認識するために必要な周波数分解能が必要であるため、比較的分解能が高いＦＦＴ（Fast Fourier Transform）やＤＣＴ（Discrete Cosine Transform）等の直交変換法を用いるとよい。本実施の形態において、スペクトル生成部３２は、少なくとも２００Ｈｚから７００Ｈｚのスペクトルパターンを生成する。

後述する音声判定部３８が音声区間を判定する際に検出する対象である、音声の特徴を示すスペクトル（以下、フォルマントと称す）には、通常、基音に相当する第１フォルマントから、その倍音部分である第ｎフォルマント（ｎは自然数）まで複数ある。このうち、第１フォルマントや第２フォルマントは２００Ｈｚ未満の周波数帯域に存在することが多い。しかし、この帯域には、低域ノイズ成分が比較的高いエネルギーで含まれているため、フォルマントが埋没し易い。また７００Ｈｚ以上のフォルマントは、フォルマント自体のエネルギーが低いため、やはりノイズ成分に埋没し易い。そのため、ノイズ成分に埋没し難い２００Ｈｚから７００Ｈｚのスペクトルパターンを音声区間の判定に用いることで、判定対象を絞り、効率的に音声区間の判定を行うことができる。

帯域分割部３３は、適切な周波数帯域単位で音声に特徴的なスペクトルを検出するため、スペクトルパターンの各スペクトルを、予め定められた帯域幅で分割された周波数帯域である複数の分割周波数帯域に分割する。本実施の形態において、予め定められた帯域幅は、１００Ｈｚから１５０Ｈｚ程度の帯域幅とする。

周波数平均部３４は、分割周波数帯域毎の平均エネルギーを求める。本実施の形態では、周波数平均部３４は、分割周波数帯域毎に、分割周波数帯域におけるすべてのスペクトルのエネルギーを平均するが、演算負荷軽減のためスペクトルのエネルギーの代わりにスペクトルの最大または平均振幅値（絶対値）を代用してもよい。

保持部３５は、ＲＡＭ（Random Access Memory）、ＥＥＰＲＯＭ（Electrically Erasable and Programmable Read Only Memory）、フラッシュメモリ等の記憶媒体で構成され、帯域毎の平均エネルギーを過去の予め定められた数（本実施の形態においてはＮとする）のフレーム分保持する。

時間平均部３６は、分割周波数帯域毎に、周波数平均部３４で導出された平均エネルギーの時間方向の複数のフレームに渡る平均である帯域別エネルギーを導出する。すなわち、帯域別エネルギーは、分割周波数帯域毎の平均エネルギーの時間方向の複数のフレームに渡る平均値である。また、時間平均部３６は、直前のフレームの分割周波数帯域毎の平均エネルギーに、重み付け係数と時定数を用いて平均化に準じる処理をして、帯域別エネルギーの代用値を求めてもよい。

ピーク検出部３７は、スペクトルパターンの各スペクトルと、そのスペクトルが含まれる分割周波数帯域における帯域別エネルギーとのエネルギー比（ＳＮＲ：Signal to Noise ratio）を導出する。そして、ピーク検出部３７は、スペクトル毎のＳＮＲと、予め定められた閾値Ａとを比較し、閾値Ａを超えるか否かを判定する。ＳＮＲが閾値Ａを超えるスペクトルがあると、このスペクトルをフォルマントとみなし、フォルマントが検出された旨を示す情報を、音声判定部３８に出力する。

音声判定部３８は、フォルマントが検出されたという情報をピーク検出部３７から受け付けると、ピーク検出部３７の判定結果に基づいて、該当フレームのフレーム化入力信号が音声であるか否か判定する。音声判定部３８は、フレーム化入力信号が音声であると判定した場合、位相情報取得部１６およびノイズ低減処理部１８に音声区間を示す音声ノイズ区間情報２３、２４をそれぞれ出力する。一方、音声判定部３８は、フレーム化入力信号が音声ではないと判定した場合、位相情報取得部１６およびノイズ低減処理部１８にノイズ区間を示す音声ノイズ区間情報２３、２４をそれぞれ出力する。

図２に示す音声ノイズ区間検出部１５'は、分割周波数帯域毎に、その分割周波数帯域の帯域別エネルギーを設定している。そのため、音声判定部３８は、他の分割周波数帯域のノイズ成分の影響を受けずに、それぞれの分割周波数帯域毎にフォルマントの有無を精度よく判定することができる。

上述したように、フォルマントには、第１フォルマントから、その倍音部分である第ｎフォルマントまで複数ある。したがって、任意の分割周波数帯域の帯域別エネルギー（ノイズレベル）が上昇し、フォルマントの一部がノイズに埋没しても、他の複数のフォルマントを検出できる場合がある。特に、周囲ノイズは低域に集中するため、基音に相当する第１フォルマントや２倍音に相当する第２フォルマントが低域のノイズに埋没していても、３倍音以上のフォルマントを検出できる可能性がある。よって、音声判定部３８は、ＳＮＲが閾値Ａを超えるスペクトルが所定数以上である場合、フレーム化入力信号が音声であると判定することで、よりノイズに強い音声区間の判定を行うことができる。

以上で説明したように、音声ノイズ区間検出技術Ａを用いた音声ノイズ区間検出部１５'は、入力信号を予め定められた時間幅を有するフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部３１と、フレーム化入力信号を、時間領域から周波数領域に変換して、周波数毎のスペクトルを集めたスペクトルパターンを生成するスペクトル生成部３２と、スペクトルパターンの各スペクトルと、予め定められた帯域幅で分割された周波数帯域である複数の分割周波数帯域のうちスペクトルが含まれる分割周波数帯域における帯域別エネルギーとのエネルギー比が、予め定められた閾値Ａを超えるか否かを判定するピーク検出部３７と、ピーク検出部の判定結果に基づいて、フレーム化入力信号が音声であるか否か判定する音声判定部３８と、スペクトルパターンの各分割周波数帯域におけるスペクトルの周波数方向の平均エネルギーを導出する周波数平均部３４と、分割周波数帯域毎に、平均エネルギーの時間方向の平均である前記帯域別エネルギーを導出する時間平均部３６と、を備える。

例えば、音声判定部３８は、エネルギー比が閾値Ａを超えるスペクトルが予め定められた数以上であると、フレーム化入力信号が音声であると判定することができる。

次に、音声ノイズ区間検出技術Ｂについて説明する。音声ノイズ区間検出技術Ｂでは、子音の特徴であるスペクトルパターンが右上がりになる傾向があるという性質に着目して、音声区間を判定している。音声ノイズ区間検出技術Ｂでは、子音のスペクトルパターンを中高域の周波数帯において測定し、更に部分的にノイズ成分によって埋没してしまった子音の周波数分布の特徴を、ノイズの影響があまり無かった帯域に特化して抽出することで、音声区間を高精度で判定することを可能にしている。

図３は、音声ノイズ区間検出技術Ｂを用いた音声ノイズ区間検出部１５''の一例を示すブロック図である。音声ノイズ区間検出部１５''は、フレーム化部４１、スペクトル生成部４２、帯域分割部４３、平均導出部４４、ノイズレベル導出部４５、判定選択部４６、および子音判定部４７を備える。

フレーム化部４１は、収音信号２１を予め定められた時間幅を有するフレーム単位で順次切り出し、フレーム単位の入力信号であるフレーム化入力信号を生成する。

スペクトル生成部４２は、フレーム化部４１から出力されたフレーム化入力信号の周波数分析を行い、時間領域のフレーム化入力信号を周波数領域のフレーム化入力信号に変換して、スペクトルを集めたスペクトルパターンを生成する。スペクトルパターンは、所定の周波数帯域に渡って、周波数とその周波数におけるエネルギーとが対応付けられた、周波数毎のスペクトルを集めたものである。ここで用いられる周波数変換法は、特定の手段に限定しないが、音声のスペクトルを認識するために必要な周波数分解能が必要であるため、比較的分解能が高いＦＦＴやＤＣＴ等の直交変換法を用いるとよい。

帯域分割部４３は、スペクトル生成部４２が生成したスペクトルパターンの各スペクトルを、予め定められた帯域幅毎に分割し、複数の分割周波数帯域を生成する。本実施の形態において、帯域分割部４３は、例えば、８００Ｈｚ〜３．５ｋＨｚの周波数範囲について、例えば、１００Ｈｚ〜３００Ｈｚ程度の帯域幅毎に分割する。

平均導出部４４は、スペクトルパターンにおける、連接する、帯域分割部４３が分割した分割周波数帯域（バンド）毎の平均エネルギーである帯域別平均エネルギーを導出する。

子音判定部４７は、平均導出部４４が導出した帯域別平均エネルギー同士を比較し、より高周波数帯域の帯域別平均エネルギー程、高いエネルギーとなっていると、そのフレーム化入力信号に子音が含まれると判定する。

一般的に、子音はスペクトルパターンが右上がりになる傾向がある。そこで、音声ノイズ区間検出技術Ｂを用いた音声ノイズ区間検出部１５''は、スペクトルパターンにおける帯域別平均エネルギーを導出し、その帯域別エネルギー同士を比較することで子音に特徴的な、スペクトルパターンにおける右上がりの傾向を検出する。そのため、音声ノイズ区間検出部１５''は、入力信号に子音が含まれる子音区間を精度よく検出することができる。

子音判定部４７は、隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計数し、計数した計数値が、予め定められた閾値Ａ以上であると、子音が含まれると判定する第１判定手段を備える。また、子音判定部４７は、隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計測し、更にこの組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた閾値Ｂ以上であると、子音が含まれると判定する第２判定手段を備える。子音判定部４７は、第１判定手段と第２判定手段をそれぞれノイズレベルに応じて使い分ける。

ここで、第１判定手段と第２判定手段とを適宜選択すべく、ノイズレベル導出部４５は、フレーム化入力信号のノイズレベルを導出する。例えば、ノイズレベルは、フレーム化入力信号のすべての周波数帯域の帯域別平均エネルギーの平均値とすることができる。また、ノイズレベル導出部４５は、フレーム化入力信号毎にノイズレベルを導出してもよいし、所定時間分のフレーム化入力信号のノイズレベルの平均値を用いてもよい。判定選択部４６は、導出されたノイズレベルが所定の閾値未満の場合、第１判定手段を選択し、所定の閾値以上の場合、第２判定手段を選択する。

以上で説明したように、音声ノイズ区間検出技術Ｂを用いた音声ノイズ区間検出部１５''は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部４１と、フレーム化入力信号を、時間領域から周波数領域に変換して、周波数毎のスペクトルを集めたスペクトルパターンを生成するスペクトル生成部４２と、スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出する平均導出部４４と、導出された帯域別平均エネルギー同士を比較し、より高周波数帯域の帯域別平均エネルギー程、高いエネルギーとなっていると、フレーム化入力信号に子音が含まれると判定する子音判定部４７と、を備える。

例えば、子音判定部４７は、スペクトルパターンの隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計数し、計数した計数値が、予め定められた閾値以上であると、子音が含まれると判定することができる。

なお、本実施の形態にかかるノイズ低減装置に上記の音声ノイズ区間検出技術Ａ、Ｂを適用する場合、製品毎にパラメータを設定することができる。すなわち、より確実な音声区間の判定が要求される製品に音声ノイズ区間検出技術Ａ、Ｂを適用する場合、音声区間判定のパラメータとしてより厳しい閾値を設定することができる。

図１に示すノイズ低減装置１の位相情報取得部１６は、音声ノイズ区間情報２３が音声区間を示す場合、音声区間における収音信号２１と収音信号２２との位相差である音声位相差を取得する。また、位相情報取得部１６は、音声ノイズ区間情報２３がノイズ区間を示す場合、ノイズ区間における収音信号２１と収音信号２２との位相差であるノイズ位相差を取得する。取得された音声位相差およびノイズ位相差は、位相情報２５としてノイズ低減処理判定部１７に供給される。

例えば、トランシーバーのような携帯機器（無線通信装置）や、無線通信装置に用いるスピーカーマイクロフォン（音声入力装置）のような小型機器に、本実施の形態にかかるノイズ低減装置を適用する場合（図１０、図１１参照）、音声を拾い易い表側に音声用マイクロフォン１１を設け、音声を拾い難い裏側に参照音用マイクロフォン１２を設ける。これにより、音声用マイクロフォン１１では音声成分を主に収音し、参照音用マイクロフォン１２ではノイズ成分を主に収音することができる。

上記の無線通信装置や音声入力装置は、一般的に人間の握りこぶしよりも少し小さい程度の大きさである。よって、音源と音声用マイクロフォン１１との距離と、音源と参照音用マイクロフォン１２との距離の差は、機器毎やマイクロフォンの配置により異なるものの、５〜１０ｃｍ程度であると考えられる。ここで、音声の空間伝達速度を３４０００ｃｍ／ｓとすると、サンプリング周波数が８ｋＨｚの場合、１サンプル間において音声が伝達する距離は３４０００÷８０００＝４．２５であるので、４．２５ｃｍとなる。仮に、音声用マイクロフォン１１と参照音用マイクロフォン１２との距離が５ｃｍであれば、サンプリング周波数が８ｋＨｚでは音声の方向を推定するには不十分である。

この場合、サンプリング周波数を８ｋＨｚの３倍である２４ｋＨｚとすると、３４０００÷２４０００≒１．４２ｃｍとなり、５ｃｍの間に３〜４点の位相差ポイントを測定することができる。よって、収音信号２１と収音信号２２の位相差に基づいて音声の到来方向を検出する場合は、位相情報取得部１６に入力される収音信号２１と収音信号２２のサンプリング周波数を２４ｋＨｚ以上にするとよい。

図１に示すノイズ低減装置１において、例えばＡＤコンバータ１３、１４から出力された収音信号２１、２２のサンプリング周波数が８〜１２ｋＨｚである場合は、ＡＤコンバータ１３、１４と位相情報取得部１６との間に、サンプリング周波数変換器を設け、位相情報取得部１６に供給される収音信号２１、２２のサンプリング周波数を２４ｋＨｚ以上に変換してもよい。

一方、例えばＡＤコンバータ１３、１４から出力された収音信号２１、２２のサンプリング周波数が２４ｋＨｚ以上である場合は、ＡＤコンバータ１３と音声ノイズ区間検出部１５との間、およびＡＤコンバータ１３、１４とノイズ低減処理部１８との間に、サンプリング周波数変換器を設け、音声ノイズ区間検出部１５およびノイズ低減処理部１８に供給される収音信号２１、２２のサンプリング周波数を８〜１２ｋＨｚに変換してもよい。

収音信号２１と収音信号２２の位相差は、音声用マイクロフォン１１の位置に対する音声またはノイズの到来方向を示すものである。例えば、話者（音声の音源）が音声用マイクロフォン１１と参照音用マイクロフォン１２を直線で結んだ延長線上の音声用マイクロフォン１１側から話す場合、位相差が正の方向に最も大きくなる。換言すると、音声が音声用マイクロフォン１１と参照音用マイクロフォン１２とに到達する際のマイクロフォン間の時間差が正の方向に最も大きくなる（つまり、音声用マイクロフォン１１に最も早く音声が到達する）。

一方、話者（音声の音源）が音声用マイクロフォン１１と参照音用マイクロフォン１２を直線で結んだ延長線上の参照音用マイクロフォン１２側から話す場合、位相差が負の方向に最も大きくなる。換言すると、音声が音声用マイクロフォン１１と参照音用マイクロフォン１２とに到達する際のマイクロフォン間の時間差が負の方向に最も大きくなる（つまり、音声用マイクロフォン１１に最も遅く音声が到達する）。

また、話者（音声の音源）が音声用マイクロフォン１１と参照音用マイクロフォン１２とを結ぶ線分の垂直二等分線上の位置（つまり、音声用マイクロフォン１１と参照音用マイクロフォン１２の中間の位置）から話す場合は、それぞれのマイクロフォンに音声が同時に到達するので、位相差（時間差）はゼロとなる。

このように、音声用マイクロフォン１１からの収音信号２１と参照音用マイクロフォン１２からの収音信号２２とを用いて最も相関が高くなる位置を検出することで、収音信号２１および収音信号２２のうちのいずれか一方を基準として位相差を取得することができる。なお、以下では、音声用マイクロフォン１１からの収音信号２１を基準とする場合を例として説明する。

図４は、本実施の形態にかかるノイズ低減装置１が備える位相情報取得部の一例を示すブロック図である。図４に示す位相情報取得部１６は、基準信号バッファ５１、基準信号抽出部５２、比較信号バッファ５３、比較信号抽出部５４、相互相関値算出部５５、位相差取得部５６、音声位相差格納部５７、ノイズ位相差格納部５８、およびセレクタ５９を備える。

基準信号バッファ５１は、ＡＤコンバータ１３から出力された収音信号２１を一時的に蓄積する。比較信号バッファ５３は、ＡＤコンバータ１４から出力された収音信号２２を一時的に蓄積する。

音源が一つで同時刻に発せられる音声やノイズは、各マイクロフォン１１、１２への伝達経路が異なるため各マイクロフォン１１、１２で検出される位相や振幅値は異なる。しかし、音声やノイズの音源が一つである場合は、各マイクロフォン１１、１２で検出される音声成分の位相や振幅値は類似しており相関性は非常に高いといえる。特に、本実施の形態では、音声区間において音声をノイズ区間においてノイズをそれぞれ収音しているので、各マイクロフォン１１、１２で検出される音声成分の相関性やノイズ成分の相関性は非常に高いといえる。よって、この相関性を測定することで位相差を求めることができ、音源の方向を推定することができる。２つのマイクロフォン１１、１２の間における位相差は、例えば相互相関関数や最小二乗法を用いて算出することができる。

一般的に、２つの信号波形ｘ１（ｔ）とｘ２（ｔ）の相互相関関数は次の式で表すことができる。

基準信号抽出部５２は、収音信号（基準信号）２１に含まれる信号波形ｘ１（ｔ）を抽出して固定する。比較信号抽出部５４は、収音信号（比較信号）２２に含まれる信号波形ｘ２（ｔ）を抽出し、当該信号波形ｘ２（ｔ）を移動する。相互相関値算出部５５は、信号波形ｘ１（ｔ）と信号波形ｘ２（ｔ）とに対して畳み込み演算（積和演算）を実施することで、収音信号２１と収音信号２２の相関が高いポイントを判断する。このとき、収音信号２２のサンプリング周波数とマイクロフォン１１、１２の空間的な距離から算出される最大位相差分に応じて、信号波形ｘ２（ｔ）を前後にシフトしながら畳み込み演算値を計算する。畳み込み演算値が最大となるポイントは符号が一致する場所であり最も相関が高いと判断することができる。

具体的に説明すると、例えば、相関性を比較する時間幅（サンプル数）を２００［ｓａｍｐｌｅ］とした場合、収音信号（基準信号）２１を固定した上で、比較対象とする収音信号（比較信号）２２を同時刻のサンプル先頭から−Ｌ［ｓａｍｐｌｅ］のポイントから＋Ｌ［ｓａｍｐｌｅ］のポイントまで移動することで相互相関値を計算することができる。ここで、Ｌは収音信号２１をデジタル変換する際のサンプリング周波数とマイクロフォン１１、１２間の距離とからその最大値を指定することができる。τ番目の相互相関値（τ）は、上記式１を用いて求めることができる。このとき、τの範囲は−Ｌから＋Ｌまでであり、Ｎ＝２００である。

全ての相互相関値（τ）を求めて最も相互相関値が高いτ［ｓａｍｐｌｅ］を抽出する。分解能は、ＡＤコンバータ１３、１４のサンプリング周波数に応じて変化する。例えば、"１［ｓａｍｐｌｅ］あたりの時間［ｓｅｃ］＝１／サンプリング周波数"であるので、サンプリング周波数が９６［ｋＨｚ］の場合は、１［ｓａｍｐｌｅ］あたりの時間は、約１０．４２［ｍｓｅｃ］となる。この１［ｓａｍｐｌｅ］に相当する時間にτ［ｓａｍｐｌｅ］を乗算したものがマイク間の到達時間差となり、位相のずれ（位相差）を導くことが可能となる。

また、最小二乗法を用いる場合は、次の式を用いることができる。

最小二乗法を用いる場合、基準信号抽出部５２は、収音信号（基準信号）２１に含まれる信号波形を抽出して固定する。比較信号抽出部５４は、収音信号（比較信号）２２に含まれる信号波形を抽出し、当該信号波形を移動する。相互相関値算出部５５は、収音信号２１に含まれる信号波形と収音信号２２に含まれる信号波形との差分値の二乗和を計算する。この二乗和が最小となるポイントは、収音信号２１に含まれる信号波形と収音信号２２に含まれる信号波形とが互いに相似形となる（重なり合う）場所であり、最も相関が高いと判断することができる。最小二乗法を用いる場合は基準信号と比較信号の大きさを揃えることが望ましく、一方を基準として予め正規化しておくのが好ましい。

相互相関値算出部５５は、上記の演算により得られた、基準信号と比較信号の相関関係に関する情報を位相差取得部５６に出力する。すなわち、相互相関値算出部５５で相関が高いと判断された２つの信号波形（つまり、収音信号２１に含まれる信号波形と収音信号２２に含まれる信号波形）は、音源を同一とする音声やノイズの信号波形である可能性が高い。よって、位相差取得部５６は、相関が高いと判断された２つの信号波形の位相差を求めることで、音声用マイクロフォン１１で収音された音と参照音用マイクロフォン１２で収音された音の位相差を求めることができる。

位相情報取得部１６は、音声ノイズ区間検出部１５が音声区間を検出している場合、収音信号２１と収音信号２２との位相差（音声位相差）を更新する。また、位相情報取得部１６は、音声ノイズ区間検出部１５がノイズ区間を検出している場合、収音信号２１と収音信号２２との位相差（ノイズ位相差）を更新する。

例えば、音声ノイズ区間検出部１５から供給される音声ノイズ区間情報２３が音声区間を示している場合、位相差取得部５６で取得される位相差は音声の位相差（音声位相差）である確率が高いといえる。このとき、セレクタ５９には音声ノイズ区間情報２３として音声区間を示す信号が供給されるので、セレクタ５９は位相差取得部５６から出力された位相差（音声位相差）を音声位相差格納部５７に出力する。音声位相差格納部５７は、既に格納されている音声位相差を、セレクタ５９から供給された最新の音声位相差に更新する。更新された音声位相差は、次に音声ノイズ区間情報２３が音声区間を示すタイミング（つまり、音声位相差の次の更新のタイミング）まで保持される。

また、音声ノイズ区間検出部１５から供給される音声ノイズ区間情報２３がノイズ区間を示している場合、位相差取得部５６で取得される位相差はノイズの位相差（ノイズ位相差）である確率が高いといえる。このとき、セレクタ５９には音声ノイズ区間情報２３としてノイズ区間を示す信号が供給されるので、セレクタ５９は位相差取得部５６から出力された位相差（ノイズ位相差）をノイズ位相差格納部５８に出力する。ノイズ位相差格納部５８は、既に格納されているノイズ位相差を、セレクタ５９から供給された最新のノイズ位相差に更新する。更新されたノイズ位相差は、次に音声ノイズ区間情報２３がノイズ区間を示すタイミング（つまり、ノイズ位相差の次の更新のタイミング）まで保持される。

音声位相差格納部５７に格納されている音声位相差およびノイズ位相差格納部５８に格納されているノイズ位相差は、位相情報２５としてノイズ低減処理判定部１７に供給される。このとき、音声位相差およびノイズ位相差は、ノイズ低減処理判定部１７においてそれぞれ分離して認識される。

図５〜図７は、本実施の形態にかかるノイズ低減装置が備える音声用マイクロフォン１１と参照音用マイクロフォン１２とに対する音声およびノイズの音源の位置の一例を示す図である。図５〜図７では、無線通信装置６００の表面側に音声用マイクロフォン１１が設けられており、裏面側に参照音用マイクロフォン１２が設けられている。通常、話者は無線通信装置６００の表面側に設けられている音声用マイクロフォン１１に向かって声を発する。

図５に示すように、音声の音源（話者）が音声用マイクロフォン１１側である場合、音声用マイクロフォン１１で収音される音声の位相は、参照音用マイクロフォン１２で収音される音声の位相よりも早い。よって、この場合は、収音信号２１と収音信号２２の位相差（音声位相差）はプラスとなる。

一方、ノイズの音源が参照音用マイクロフォン１２側である場合、音声用マイクロフォン１１で収音されるノイズの位相は、参照音用マイクロフォン１２で収音されるノイズの位相よりも遅い。よって、この場合は、収音信号２１と収音信号２２の位相差（ノイズ位相差）はマイナスとなる。

また、図６に示すように、音声の音源（話者）とノイズの音源とが共に音声用マイクロフォン１１側である場合、音声用マイクロフォン１１で収音される音声の位相は、参照音用マイクロフォン１２で収音される音声の位相よりも早い。また、音声用マイクロフォン１１で収音されるノイズの位相は、参照音用マイクロフォン１２で収音されるノイズの位相よりも早い。よって、この場合は、音声区間における収音信号２１と収音信号２２の位相差（音声位相差）およびノイズ区間における収音信号２１と収音信号２２の位相差（ノイズ位相差）は共にプラスとなる。

また、図７に示すように、音声の音源（話者）とノイズの音源とが共に参照音用マイクロフォン１２側である場合、音声用マイクロフォン１１で収音される音声の位相は、参照音用マイクロフォン１２で収音される音声の位相よりも遅い。また、音声用マイクロフォン１１で収音されるノイズの位相は、参照音用マイクロフォン１２で収音されるノイズの位相よりも遅い。よって、この場合は、音声区間における収音信号２１と収音信号２２の位相差（音声位相差）およびノイズ区間における収音信号２１と収音信号２２の位相差（ノイズ位相差）は共にマイナスとなる。

図１に示すノイズ低減処理判定部１７は、位相情報取得部１６で取得された音声位相差とノイズ位相差の状態を判定する。例えば、音声位相差とノイズ位相差の状態が、ノイズ低減処理を実施する場合である第１の状態であるか否かや、ノイズ低減処理を実施しない場合またはノイズ低減処理を第１の状態よりも弱く実施する場合である第２の状態であるか否かを判定する。

例えば、ノイズ低減処理判定部１７は、位相情報取得部１６で取得された音声位相差とノイズ位相差との差の絶対値が所定の閾値（第１の閾値）以内である場合、第２の状態と判定することができる。以下では、ノイズ低減処理を実施しない場合またはノイズ低減処理を第１の状態よりも弱く実施する場合である第２の状態を、単に"ノイズ低減処理を実施しない場合"と記載する場合もある。

なお、音声位相差とノイズ位相差とを用いて、ノイズ低減処理を実施しない場合であるか、またはノイズ低減処理を第１の状態よりも弱く実施する場合であるかをさらに判定するようにしてもよい。新たな閾値を設けて音声成分自体を低減してしまう可能性がより高い場合にノイズ低減処理を実施しないようにすればよい。また、音声位相差とノイズ位相差との差分に常に適応させてノイズ低減処理の強さを変更するようにしてもよい。この場合、ノイズ低減処理判定部１７が行う判定動作は、音声位相差と前記ノイズ位相差との差分の絶対値を算出する動作となり、ノイズ低減処理部はその差分の絶対値に応じた強さのノイズ低減処理を行う。例えば差分の絶対値が小さいほど弱いノイズ低減処理とすればよい。以上のことは実施の形態２のようにパワー差を用いた場合も、位相差とパワー差を置き換えて考えれば同様である。

ここで、所定の閾値は任意に設定することができる。例えば、所定の閾値を小さくするほど、ノイズ低減処理を実施する基準が緩くなる（換言すると、ノイズ低減処理を実施しないと判断する範囲が狭くなる）。つまり、音声位相差とノイズ位相差の差は、例えば、音声の音声用マイクロフォン１１への進入角度（音声用マイクロフォン１１の主面に対する音声の進入角度）と、ノイズの音声用マイクロフォン１１への進入角度（音声用マイクロフォン１１の主面に対するノイズの進入角度）との差に対応している。よって、所定の閾値を小さくするほど、ノイズ低減処理を実施しないと判断される音声とノイズの進入角度の差が狭くなる。

逆に、所定の閾値を大きくするほど、ノイズ低減処理を実施する基準が厳しくなる（換言すると、ノイズ低減処理を実施しないと判断する範囲が広くなる）。つまり、所定の閾値を大きくするほど、ノイズ低減処理を実施しないと判断される音声とノイズの進入角度の差が広くなる。

音声とノイズの進入角度の差が０に近づくにつれて、音声用マイクロフォン１１と参照音用マイクロフォン１２とで収音される音（音声およびノイズ）が近似する。このため、ノイズ低減処理部１８においてノイズ低減処理を実施する際に、収音信号２１に含まれるノイズ成分が低減されると同時に音声成分も低減されてしまうという問題がある。このような問題を解決するために、本実施の形態にかかるノイズ低減装置では、位相情報取得部１６で取得された音声位相差とノイズ位相差の差（音声とノイズの進入角度の差に対応する）に基づきノイズ低減処理を実施するか否かを判定している。つまり、音声位相差とノイズ位相差との差の絶対値が所定の閾値以内である場合、ノイズ低減処理を実施しないと判定することができる。

例えば、ノイズ低減処理判定部１７は、ノイズ低減処理を実施する（第１の状態）と判定した場合、判定フラグ２６を無効（ロウレベル）とし、ノイズ低減処理を実施しないまたはノイズ低減処理を第１の状態よりも弱く実施する（第２の状態）と判定した場合、判定フラグ２６を有効（ハイレベル）とする。

ノイズ低減処理部１８は、ノイズ低減処理判定部１７の判定結果に応じて収音信号２１と収音信号２２とを用いてノイズ低減処理を実施する。すなわち、ノイズ低減処理部１８は、ノイズ低減処理を実施する（第１の状態）とノイズ低減処理判定部１７において判定された場合（判定フラグ２６がロウレベルの場合）、収音信号２１に含まれるノイズ成分を収音信号２２を用いて低減し、ノイズ低減処理後の信号を出力信号２７として出力する。また、ノイズ低減処理を実施しないまたはノイズ低減処理を第１の状態よりも弱く実施する（第２の状態）とノイズ低減処理判定部１７において判定された場合（判定フラグ２６がハイレベルの場合）、収音信号２１を音声信号としてそのまま出力してもよいし、また、ノイズ低減処理の効果が通常よりも弱めになるように、ノイズ低減処理を実施してもよい（つまり、図８に示す疑似ノイズ信号８３を小さめに設定してもよい）。

ノイズ低減処理部１８は、収音信号（音声信号）２１に含まれたノイズ成分を低減するために、参照音用マイクロフォン１２を用いてノイズ成分を含む参照音を収音し、この参照音に基づき収音信号２１に含まれている可能性があるノイズ成分を擬似的に生成する。そして、ノイズ低減処理部１８は、収音信号２１から、この擬似的に生成したノイズ成分を差し引くことで、ノイズ低減処理を実施することができる。

例えば、ノイズ低減処理部１８から出力された出力信号２７（デジタル信号）は、ＤＡコンバータ（不図示）においてアナログ信号に変換され、変換後のアナログ信号は出力部（不図示）においてスピーカーや音声出力端子から出力される。

図８は、ノイズ低減処理部１８の一例を示すブロック図である。ノイズ低減処理部１８は、遅延素子７１_１〜７１_ｎ、乗算器７２_１〜７２_ｎ＋１、加算器７３_１〜７３_ｎ、適応係数調整部７４、減算器７５、および出力信号選択部７６を備える。遅延素子７１_１〜７１_ｎ、乗算器７２_１〜７２_ｎ＋１、および加算器７３_１〜７３_ｎは、ＦＩＲフィルタを構成する。遅延素子７１_１〜７１_ｎ、乗算器７２_１〜７２_ｎ＋１、および加算器７３_１〜７３_ｎを用いて収音信号２２を処理することで、擬似ノイズ信号８３が生成される。

適応係数調整部７４は、音声ノイズ区間情報２４に応じて、乗算器７２_１〜７２_ｎ＋１の係数を調整する。すなわち、適応係数調整部７４は、音声ノイズ区間情報２４がノイズ区間を示している場合、適応誤差が少なくなるように係数を調整する。一方、音声ノイズ区間情報２４が音声区間を示している場合、係数を維持するか、または係数を微調整するのみとする。

減算器７５は、収音信号２１から疑似ノイズ信号８３を差し引くことで、ノイズ低減処理後の信号８４を生成し、出力信号選択部７６に出力する。また、減算器７５は、収音信号２１から疑似ノイズ信号８３を差し引くことで、フィードバック用の信号８５を生成し、適応係数調整部７４に出力する。

出力信号選択部７６は、ノイズ低減処理判定部１７から出力された判定フラグ２６に応じて、収音信号２１を出力信号２７としてそのまま出力するか、またはノイズ低減処理後の信号８４を出力信号２７として出力するかを選択する。つまり、出力信号選択部７６は、ノイズ低減処理判定部１７から出力された判定フラグ２６が有効（ハイレベル）である場合は、収音信号２１を出力信号２７としてそのまま出力する。一方、ノイズ低減処理判定部１７から出力された判定フラグ２６が無効（ロウレベル）である場合は、ノイズ低減処理後の信号８４を出力信号２７として出力する。

次に、本実施の形態にかかるノイズ低減装置１の動作について説明する。図９は、本実施の形態にかかるノイズ低減装置１の動作を説明するためのフローチャートである。

まず、音声ノイズ区間検出部１５において、音声用マイクロフォン１１で収音された音（収音信号２１）が音声区間であるかまたはノイズ区間であるかを検出する（ステップＳ１）。このとき、音声区間およびノイズ区間を検出するための条件を厳しくすることで、音声区間およびノイズ区間を確実に検出することができる。

位相情報取得部１６は、音声ノイズ区間検出部１５で検出された音声ノイズ区間情報２３がノイズ区間を示す場合（ステップＳ２：Ｎｏ）、ノイズ区間における収音信号２１と収音信号２２とを用いてノイズ位相差を取得する（ステップＳ３）。そして、位相情報取得部１６は、ステップＳ３で取得したノイズ位相差を用いて、既に保持されているノイズ位相差を更新する（ステップＳ４）。

一方、位相情報取得部１６は、音声ノイズ区間検出部１５で検出された音声ノイズ区間情報２３が音声区間を示す場合（ステップＳ２：Ｙｅｓ）、音声区間における収音信号２１と収音信号２２とを用いて音声位相差を取得する（ステップＳ５）。そして、位相情報取得部１６は、ステップＳ５で取得した音声位相差を用いて、既に保持されている音声位相差を更新する（ステップＳ６）。

次に、ノイズ低減処理判定部１７は、位相情報取得部１６で取得した音声位相差とノイズ位相差とに基づきノイズ低減処理を実施するか否かを判定する。そして、ノイズ低減処理判定部１７は、音声位相差とノイズ位相差との差の絶対値が所定の閾値よりも大きい場合（ステップＳ７：Ｎｏ）、ノイズ低減処理を実施すると判定する。このとき、ノイズ低減処理判定部１７から出力される判定フラグ２６は無効（ロウレベル）であるため、ノイズ低減処理部１８は、収音信号２１に含まれるノイズ成分を収音信号２２を用いて低減し、ノイズ低減処理後の信号を出力信号２７として出力する（ステップＳ８）。

一方、ノイズ低減処理判定部１７は、音声位相差とノイズ位相差との差の絶対値が所定の閾値以内である場合（ステップＳ７：Ｙｅｓ）、ノイズ低減処理を実施しないと判定する。このとき、ノイズ低減処理判定部１７から出力される判定フラグ２６は有効（ハイレベル）であるため、ノイズ低減処理部１８は、収音信号２１（音声信号）をそのまま出力する（ステップＳ９）。

次に、本実施の形態にかかるノイズ低減装置を用いた音声入力装置について説明する。図１０は、本実施の形態にかかるノイズ低減装置を用いた音声入力装置５００の一例を示す図である。図１０（ａ）は、音声入力装置５００の前面図であり、図１０（ｂ）は、音声入力装置５００の背面図である。図１０に示すように、音声入力装置５００はコネクタ５０３を介して無線通信装置５１０に接続可能に構成されている。無線通信装置５１０は一般的な無線機を用いることができ、所定の周波数において他の無線通信装置と通信可能に構成されている。無線通信装置５１０には音声入力装置５００を介して話者の音声が入力される。

音声入力装置５００は、本体５０１、コード５０２、及びコネクタ５０３を有する。本体５０１は、話者の手で把持されるのに適するサイズ及び形状に構成されており、マイクロフォン、スピーカー、電子回路、ノイズ低減装置を内蔵する。図１０（ａ）に示すように、本体５０１の前面にはスピーカー５０６および音声用マイクロフォン５０５が設けられている。図１０（ｂ）に示すように、本体５０１の背面には参照音用マイクロフォン５０８およびベルトクリップ５０７が設けられている。本体５０１の頂面には、ＬＥＤ５０９が設けられている。本体５０１の側面にはＰＴＴ（Push To Talk）５０４が設けられている。ＬＥＤ５０９は、音声入力装置５００による話者の音声の検出状態を話者に対して報知する。ＰＴＴ５０４は、無線通信装置５１０を音声送信状態とするためのスイッチであり、突起状部分が筐体内に押し込まれることを検出する。

本実施の形態にかかるノイズ低減装置１は音声入力装置５００に内蔵されており、ノイズ低減装置１が備える音声用マイクロフォン１１が音声入力装置５００の音声用マイクロフォン５０５に対応し、ノイズ低減装置１が備える参照音用マイクロフォン１２が音声入力装置５００の参照音用マイクロフォン５０８に対応している。また、ノイズ低減装置１から出力される出力信号２７は、音声入力装置５００のコード５０２を経由して無線通信装置５１０に供給される。すなわち、音声入力装置５００は、ノイズ低減装置１でノイズ低減処理された後の出力信号２７を、無線通信装置５１０に供給する。よって、無線通信装置５１０から他の無線通信装置に送信される音声はノイズ低減処理された音声となる。なお、ノイズ低減装置１は、無線通信装置５１０に内蔵するような構成にしてもよい。

次に、本実施の形態にかかるノイズ低減装置を用いた無線通信装置（トランシーバー）６００について説明する。図１１は、本実施の形態にかかるノイズ低減装置を用いた無線通信装置６００の一例を示す図である。図１１（ａ）は、無線通信装置６００の前面図であり、図１１（ｂ）は、無線通信装置６００の背面図である。図１１に示すように、無線通信装置６００は、入力ボタン６０１、表示部６０２、スピーカー６０３、音声用マイクロフォン６０４、ＰＴＴ（Push To Talk）６０５、スイッチ６０６、アンテナ６０７、参照音用マイクロフォン６０８、および蓋６０９を備える。

本実施の形態にかかるノイズ低減装置１は無線通信装置６００に内蔵されており、ノイズ低減装置１が備える音声用マイクロフォン１１が無線通信装置６００の音声用マイクロフォン６０４に対応し、ノイズ低減装置１が備える参照音用マイクロフォン１２が無線通信装置６００の参照音用マイクロフォン６０８に対応している。また、ノイズ低減装置１から出力される出力信号２７は、無線通信装置６００の内部回路において高周波処理されて、アンテナ６０７から他の無線通信装置に無線送信される。ここで、ノイズ低減装置１から出力される出力信号２７はノイズ低減処理が実施された信号であるので、他の無線通信装置に送信される音声はノイズ低減処理された音声となる。ユーザによるＰＴＴ６０５の押下により音の送信が開始されたときに、図９で示したようなノイズ低減装置１の処理を開始し、ユーザがＰＴＴ６０８の押下を中止して、音の送信が終了したときに、図９で示したようなノイズ低減装置１の処理を終了しても良い。

本発明の課題で説明したように、音声を主に収音する音声用マイクロフォン１１とノイズを主に収音する参照音用マイクロフォン１２を用いてノイズ低減処理を実施する場合、ノイズの到来方向によっては音声の低減量（キャンセル量）が増大するという問題があった。つまり、ノイズ低減装置の使用状況によってはノイズを収音する参照音用マイクロフォン１２にも音声が混入する場合もある。このように参照音用マイクロフォン１２に音声が混入すると、音声用マイクロフォンで収音された音声に混入しているノイズ成分だけでなく音声自体もキャンセルされてしまい、音声の明瞭度が低下するという問題があった。

例えば、図７に示すように、音声の音源（話者）とノイズの音源とが共に参照音用マイクロフォン１２側である場合は、参照音用マイクロフォン１２においても音声が収音される。ここで、ノイズ低減装置は、参照音用マイクロフォン１２で収音された参照音を収音し、この参照音に基づき収音信号２１に含まれている可能性があるノイズ成分を擬似的に生成し、この擬似的に生成したノイズ成分を収音信号２１から差し引くことでノイズ低減処理を実施している。このため、参照音用マイクロフォン１２に音声が混入すると、音声用マイクロフォン１１で収音された音に混入しているノイズ成分を低減する際に、ノイズ成分と共に音声自体もキャンセルされてしまうという問題があった。

また、例えば、図６に示すように、音声の音源（話者）とノイズの音源とが共に音声用マイクロフォン１１側である場合は、ノイズの音源の方向から到来する音をキャンセルする作用が働き、同じ到来方向である音声成分は参照音用マイクロフォン１２に混入する音声成分が例え少なくとも、音声用マイクロフォン１１で収音される音声を低減してしまうことになり、音声の明瞭性が損なわれてしまう。また、音声の音源とノイズの音源とが同一方向である場合（図６及び図７参照）以外にも、音声用マイクロフォン１１および参照音用マイクロフォン１２を直線で結んだ軸上に対してミラー対称となるような方向から音声やノイズが到来する場合（つまり、各マイクロフォンへの音声とノイズの入射角度が近似する場合）には、ノイズ成分の低減と共に音声成分も低減されてしまうという問題があった。このような環境では、ノイズ低減処理時にノイズ成分と共に音声自体もキャンセルされてしまい、ノイズ低減処理を適切に実施することができないという問題があった。

また、特許文献１では、音声信号とノイズ信号とを区別するために、音声およびノイズを指向性マイクロフォンを用いて収音している。このとき、それぞれの指向性マイクロフォンが互いに反対向きとなるように配置している。しかしながら、例えば、話者が音声を収音する指向性マイクロフォンに対して９０度横方向（つまり、２つの指向性マイクロフォンの中間の位置）から話した場合、指向性マイクロフォンでは音声を適切に収音することができない。また、２つの指向性マイクロフォンの横方向から話した場合は、音声用マイクロフォンおよびノイズ用マイクロフォンに均等に音声成分が入力される。この場合、ノイズと共に音声もキャンセルされるため出力される音声の品質が劣化する。

また、特許文献２では、音声信号とノイズ信号とを区別するために２種類の指向性マイクロフォンを組み合わせて使用している。しかしながら、指向性マイクロフォンは入力利得が一定の方向に定められている。よって、話者が音声用マイクロフォンの正面から外れた位置で話した場合、指向性の範囲を超えるために音声信号を収音できない場合がある。また、ノイズ用マイクロフォンに音声が入力された場合は、ノイズ成分と共に音声成分も低減処理されてしまう。

このように、音声およびノイズの到来方向によっては、ノイズ低減装置が適切にノイズ低減処理を実施することができないという問題があった。

このような問題を解決するために、本実施の形態にかかるノイズ低減装置では、音声区間における収音信号２１と収音信号２２との位相差である音声位相差と、ノイズ区間における収音信号２１と収音信号２２との位相差であるノイズ位相差とに基づきノイズ低減処理を実施するか否かを判定している。つまり、音声位相差とノイズ位相差との差の絶対値が所定の閾値以内である場合に、ノイズ低減処理を実施しないと判定することができる。

このように、本実施の形態にかかるノイズ低減装置では、ノイズ低減処理を実施するには不適切な場合を音声位相差とノイズ位相差とに基づいて判定することができる。よって、ノイズ低減処理を実施するには不適切な場合にノイズ低減処理を実施しないようにすることができる。ここで、ノイズ低減処理を実施するには不適切な場合とは、例えば、参照音用マイクロフォン１２に音声が混入した場合や、音声用マイクロフォン１１および参照音用マイクロフォン１２を直線で結んだ軸上に対してミラー対称となるような方向から音声やノイズが到来する場合（つまり、各マイクロフォンへの音声とノイズの入射角度が近似する場合）などである。

図１２、図１３は、本実施の形態にかかる発明の効果を説明するための図である。図１２、図１３の横軸はサンプル時間［ｓｅｃ］、縦軸は音圧レベル［ｄＢ］である。図１２は、参照音用マイクロフォン１２にも音声が混入し、音声用マイクロフォン１１で収音された音声に混入しているノイズ成分だけでなく音声自体もキャンセルされている状態を示している。また、図１３は、本実施の形態にかかるノイズ低減装置を用いた場合を示している。つまり、図１３では、ノイズ低減処理を実施するには不適切である場合を判定し、ノイズ低減処理を実施していない状態を示している。なお、図１２に示す区間Ａおよび区間Ｂの位置は、図１３に示す区間Ａおよび区間Ｂの位置に対応している。

図１２に示すように、本実施の形態にかかるノイズ低減装置を用いない場合は、区間Ａおよび区間Ｂにおいて音声成分が低減されている。これに対して、本実施の形態にかかるノイズ低減装置を用いた場合は、図１３に示すように、区間Ａおよび区間Ｂにおいて音声成分が低減されていない。よって、本実施の形態にかかるノイズ低減装置を用いることで、音声の到来方向とノイズの到来方向とに応じてノイズ低減処理を適切に実施することができる。

以上で説明した本実施の形態にかかる発明により、ノイズ成分を適切に低減することができるノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法を提供することができる。

＜実施の形態２＞
次に、本発明の実施の形態２について説明する。図１４は、実施の形態２にかかるノイズ低減装置を示すブロック図である。本実施の形態にかかるノイズ低減装置２は、パワー情報取得部６０を備えている点が実施の形態１で説明したノイズ低減装置１と異なる。これ以外は、実施の形態１で説明したノイズ低減装置１と同様であるので、同一の構成要素には同一の符号を付し重複した説明は省略する。

パワー情報取得部６０は、音声ノイズ区間情報２３が音声区間を示す場合、音声区間における収音信号２１の大きさと収音信号２２の大きさとの差である音声パワー差を取得する。また、パワー情報取得部６０は、音声ノイズ区間情報２３がノイズ区間を示す場合、ノイズ区間における収音信号２１の大きさと収音信号２２の大きさとの差であるノイズパワー差を取得する。取得された音声パワー差およびノイズパワー差は、パワー情報２８としてノイズ低減処理判定部１７に供給される。

図１５は、本実施の形態にかかるノイズ低減装置２が備えるパワー情報取得部６０の一例を示すブロック図である。図１５に示すパワー情報取得部６０は、収音信号バッファ６１、収音信号パワー算出部６２、収音信号バッファ６３、収音信号パワー算出部６４、パワー差算出部６５、音声パワー差格納部６７、ノイズパワー差格納部６８、およびセレクタ６９を備える。図１５に示すパワー情報取得部６０は、ある一定の単位時間における収音信号２１および収音信号２２のパワー情報（図１５に示す場合は、パワー差）を求めることができる。

収音信号バッファ６１は、単位時間分の収音信号２１を蓄積するために、供給された収音信号２１を一時的に蓄積する。収音信号バッファ６３は、単位時間分の収音信号２２を蓄積するために、供給された収音信号２２を一時的に蓄積する。

収音信号パワー算出部６２は、収音信号バッファ６１に蓄積された単位時間分の収音信号を用いて、単位時間当たりのパワー値を算出する。また、収音信号パワー算出部６４は、収音信号バッファ６３に蓄積された単位時間分の収音信号を用いて、単位時間当たりのパワー値を算出する。

ここで、単位時間当たりのパワー値とは、単位時間における収音信号２１、２２の大きさであり、例えば、単位時間における収音信号２１、２２の振幅の最大値や、単位時間における収音信号２１、２２の振幅の積分値等を用いることができる。なお、本実施の形態では、収音信号２１、２２の大きさを示す値であれば、パワー値として上記の最大値や積分値以外の値を用いてもよい。

パワー差算出部６５は、収音信号パワー算出部６２で求めた収音信号２１のパワー値と、収音信号パワー算出部６４で求めた収音信号２２のパワー値とのパワー差を算出する。

パワー情報取得部６０は、音声ノイズ区間検出部１５が音声区間を検出している場合、収音信号２１と収音信号２２のパワー差、つまり、収音信号２１の大きさと収音信号２２の大きさとの差（音声パワー差）を更新する。また、パワー情報取得部６０は、音声ノイズ区間検出部１５がノイズ区間を検出している場合、収音信号２１と収音信号２２とのパワー差、つまり、収音信号２１の大きさと収音信号２２の大きさとの差（ノイズパワー差）を更新する。

例えば、音声ノイズ区間検出部１５から供給される音声ノイズ区間情報２３が音声区間を示している場合、パワー差算出部６５で算出されるパワー差は音声のパワー差（音声パワー差）である確率が高いといえる。このとき、セレクタ６９には音声ノイズ区間情報２３として音声区間を示す信号が供給されるので、セレクタ６９はパワー差算出部６５から出力されたパワー差（音声パワー差）を音声パワー差格納部６７に出力する。音声パワー差格納部６７は、既に格納されている音声パワー差を、セレクタ６９から供給された最新の音声パワー差に更新する。更新された音声パワー差は、次に音声ノイズ区間情報２３が音声区間を示すタイミング（つまり、音声パワー差の次の更新のタイミング）まで保持される。

また、音声ノイズ区間検出部１５から供給される音声ノイズ区間情報２３がノイズ区間を示している場合、パワー差算出部６５で算出されるパワー差はノイズのパワー差（ノイズパワー差）である確率が高いといえる。このとき、セレクタ６９には音声ノイズ区間情報２３としてノイズ区間を示す信号が供給されるので、セレクタ６９はパワー差算出部６５から出力されたパワー差（ノイズパワー差）をノイズパワー差格納部６８に出力する。ノイズパワー差格納部６８は、既に格納されているノイズパワー差を、セレクタ６９から供給された最新のノイズパワー差に更新する。更新されたノイズパワー差は、次に音声ノイズ区間情報２３がノイズ区間を示すタイミング（つまり、ノイズパワー差の次の更新のタイミング）まで保持される。

音声パワー差格納部６７に格納されている音声パワー差およびノイズパワー差格納部６８に格納されているノイズパワー差は、パワー情報２８としてノイズ低減処理判定部１７に供給される。このとき、音声パワー差およびノイズパワー差は、ノイズ低減処理判定部１７においてそれぞれ分離して認識される。

例えば、図５に示すように、音声の音源（話者）が音声用マイクロフォン１１側である場合、音声用マイクロフォン１１で収音される音声の大きさは、参照音用マイクロフォン１２で収音される音声の大きさよりも大きい。よって、この場合は、収音信号２１と収音信号２２のパワー差（音声パワー差）はプラスとなる。

一方、ノイズの音源が参照音用マイクロフォン１２側である場合、音声用マイクロフォン１１で収音されるノイズの大きさは、参照音用マイクロフォン１２で収音されるノイズの大きさよりも小さい。よって、この場合は、収音信号２１と収音信号２２のパワー差（ノイズパワー差）はマイナスとなる。

また、図６に示すように、音声の音源（話者）とノイズの音源とが共に音声用マイクロフォン１１側である場合、音声用マイクロフォン１１で収音される音声の大きさは、参照音用マイクロフォン１２で収音される音声の大きさよりも大きい。また、音声用マイクロフォン１１で収音されるノイズの大きさは、参照音用マイクロフォン１２で収音されるノイズの大きさよりも大きい。よって、この場合は、音声区間における収音信号２１と収音信号２２のパワー差（音声パワー差）およびノイズ区間における収音信号２１と収音信号２２のパワー差（ノイズパワー差）は共にプラスとなる。

また、図７に示すように、音声の音源（話者）とノイズの音源とが共に参照音用マイクロフォン１２側である場合、音声用マイクロフォン１１で収音される音声の大きさは、参照音用マイクロフォン１２で収音される音声の大きさよりも小さい。また、音声用マイクロフォン１１で収音されるノイズの大きさは、参照音用マイクロフォン１２で収音されるノイズの大きさよりも小さい。よって、この場合は、音声区間における収音信号２１と収音信号２２のパワー差（音声パワー差）およびノイズ区間における収音信号２１と収音信号２２のパワー差（ノイズパワー差）は共にマイナスとなる。

ノイズ低減処理判定部１７は、パワー情報取得部６０で取得された音声パワー差とノイズパワー差とに基づき、ノイズ低減処理を実施する場合である第１の状態と、ノイズ低減処理を実施しない場合またはノイズ低減処理を第１の状態よりも弱く実施する場合である第２の状態とを判定する。例えば、ノイズ低減処理判定部１７は、パワー情報取得部６０で取得された音声パワー差とノイズパワー差との差の絶対値が所定の閾値（第２の閾値）以内である場合、前記第２の状態と判定することができる。ここで、音声パワー差およびノイズパワー差は各マイクロフォン間の相対的な比率（例えば、収音信号２１のパワー／収音信号２２のパワー）を求めて両者を比較することで、音声およびノイズのマイクロフォンへの進入角度が近似しているか否かを判定することができる。

ここで、所定の閾値は任意に設定することができる。例えば、所定の閾値を小さくするほど、ノイズ低減処理を実施する基準が緩くなる（換言すると、ノイズ低減処理を実施しないと判断する範囲が狭くなる）。つまり、音声パワー差とノイズパワー差との差は、例えば、音声の音声用マイクロフォン１１への進入角度（音声用マイクロフォン１１の主面に対する音声の進入角度）とノイズの音声用マイクロフォン１１への進入角度（音声用マイクロフォン１１の主面に対するノイズの進入角度）との差に対応している。よって、所定の閾値を小さくするほど、ノイズ低減処理を実施しないと判断される音声とノイズの進入角度の差が狭くなる。

音声とノイズの進入角度の差が０に近づくにつれて、音声用マイクロフォン１１と参照音用マイクロフォン１２とで収音される音（音声およびノイズ）が近似する。このため、ノイズ低減処理部１８においてノイズ低減処理を実施する際に、収音信号２１に含まれるノイズ成分が低減されると同時に音声成分も低減されてしまうという問題がある。このような問題を解決するために、本実施の形態にかかるノイズ低減装置では、パワー情報取得部６０で取得された音声パワー差とノイズパワー差との差（音声とノイズの進入角度の差に対応する）に基づきノイズ低減処理を実施するか否かを判定している。つまり、音声パワー差とノイズパワー差との差の絶対値が所定の閾値以内である場合、ノイズ低減処理を実施しないと判定することができる。

次に、本実施の形態にかかるノイズ低減装置２の動作について説明する。図１６は、本実施の形態にかかるノイズ低減装置２の動作を説明するためのフローチャートである。

まず、音声ノイズ区間検出部１５において、音声用マイクロフォン１１で収音された音（収音信号２１）が音声区間であるかまたはノイズ区間であるかを検出する（ステップＳ１１）。このとき、音声区間およびノイズ区間を検出するための条件を厳しくすることで、音声区間およびノイズ区間を確実に検出することができる。

パワー情報取得部６０は、音声ノイズ区間検出部１５で検出された音声ノイズ区間情報２３がノイズ区間を示す場合（ステップＳ１２：Ｎｏ）、ノイズ区間における収音信号２１と収音信号２２とを用いてノイズパワー差を取得する（ステップＳ１３）。そして、パワー情報取得部６０は、ステップＳ１３で取得したノイズパワー差を用いて、既に保持されているノイズパワー差を更新する（ステップＳ１４）。

一方、パワー情報取得部６０は、音声ノイズ区間検出部１５で検出された音声ノイズ区間情報２３が音声区間を示す場合（ステップＳ１２：Ｙｅｓ）、音声区間における収音信号２１と収音信号２２とを用いて音声パワー差を取得する（ステップＳ１５）。そして、パワー情報取得部６０は、ステップＳ１５で取得した音声パワー差を用いて、既に保持されている音声パワー差を更新する（ステップＳ１６）。

次に、ノイズ低減処理判定部１７は、パワー情報取得部６０で取得した音声パワー差とノイズパワー差とに基づきノイズ低減処理を実施するか否かを判定する。そして、ノイズ低減処理判定部１７は、音声パワー差とノイズパワー差との差の絶対値が所定の閾値よりも大きい場合（ステップＳ１７：Ｎｏ）、ノイズ低減処理を実施すると判定する。このとき、ノイズ低減処理判定部１７から出力される判定フラグ２６は無効（ロウレベル）であるため、ノイズ低減処理部１８は、収音信号２１に含まれるノイズ成分を収音信号２２を用いて低減し、ノイズ低減処理後の信号を出力信号２７として出力する（ステップＳ１８）。

一方、ノイズ低減処理判定部１７は、音声パワー差とノイズパワー差との差の絶対値が所定の閾値以内である場合（ステップＳ１７：Ｙｅｓ）、ノイズ低減処理を実施しないと判定する。このとき、ノイズ低減処理判定部１７から出力される判定フラグ２６は有効（ハイレベル）であるため、ノイズ低減処理部１８は、収音信号２１（音声信号）をそのまま出力する（ステップＳ１９）。

本実施の形態にかかるノイズ低減装置では、音声区間における収音信号２１の大きさと収音信号２２の大きさとの差である音声パワー差と、ノイズ区間における収音信号２１の大きさと収音信号２２の大きさとの差であるノイズパワー差とに基づきノイズ低減処理を実施するか否かを判定している。つまり、音声パワー差とノイズパワー差との差の絶対値が所定の閾値以内である場合に、ノイズ低減処理を実施しないと判定することができる。

このように、本実施の形態にかかるノイズ低減装置では、ノイズ低減処理を実施するには不適切な場合を音声パワー差とノイズパワー差とに基づいて判定することができる。よって、ノイズ低減処理を実施するには不適切な場合にノイズ低減処理を実施しないようにすることができる。

なお、本実施の形態にかかるノイズ低減装置では、パワー情報取得部６０で取得したパワー情報と共に、位相情報取得部１６で取得した位相情報（実施の形態１参照）を用いて、ノイズ低減処理を実施するか否かを判定してもよい。この場合、例えば、図１７に示すノイズ低減装置２'のように、位相情報取得部とパワー情報取得部とを備える位相パワー情報取得部７０を備えるように構成することができる。

例えば、位相パワー情報取得部７０は、位相情報取得部において音声位相差およびノイズ位相差を取得し、パワー情報取得部において音声パワー差およびノイズパワー差を取得し、これらの情報を位相パワー情報２９としてノイズ低減処理判定部１７に出力する。

ノイズ低減処理判定部１７は、位相パワー情報取得部７０で取得された音声位相差とノイズ位相差との差および音声パワー差とノイズパワー差との差に基づき、ノイズ低減処理を実施するか否かを判定することができる。例えば、音声位相差とノイズ位相差との差の絶対値が所定の第１の閾値以内であり、且つ音声パワー差とノイズパワー差との差の絶対値が所定の第２の閾値以内である場合に、ノイズ低減処理を実施しないと判定することができる。このとき、第１の閾値と第２の閾値を調整することで、音声位相差とノイズ位相差との差を用いた判定と、音声パワー差とノイズパワー差との差を用いた判定とに重み付けを付与することができる。

例えば、トランシーバーのような携帯機器（無線通信装置）や、無線通信装置に付属するスピーカーマイクロフォン（音声入力装置）のような小型機器は、持ち方によりマイク開口部が手で塞がれたり、衣服などによってマイク開口部が遮蔽されたりする場合がある。よって、ノイズ低減処理の有無を判定する際に、位相差を用いる方法とパワー差を用いる方法とを組み合わせて使用することで、ノイズ低減処理を実施するには不適切な場合をより高精度に判定することができる。

＜実施の形態３＞
次に、本発明の実施の形態３について説明する。図１８は、本実施の形態にかかるノイズ低減装置３を示すブロック図である。本実施の形態にかかるノイズ低減装置３では、音声ノイズ区間検出部９５、ノイズ低減処理判定部９７、およびノイズ低減処理部９８の構成および動作が、実施の形態１で説明したノイズ低減装置１（図１参照）と異なる。これ以外は実施の形態１で説明したノイズ低減装置１と同様であるので、同一の構成要素には同一の符号を付し重複した説明は省略する。

図１８に示すように、本実施の形態にかかるノイズ低減装置３は、音声用マイクロフォン１１、参照音用マイクロフォン１２、ＡＤコンバータ１３、１４、音声ノイズ区間検出部９５、位相情報取得部１６、ノイズ低減処理判定部９７、およびノイズ低減処理部９８を有する。

音声ノイズ区間検出部９５は、ＡＤコンバータ１３から出力された収音信号２１またはＡＤコンバータ１４から出力された収音信号２２に基づき音声区間およびノイズ区間を検出する。そして、音声ノイズ区間検出部１５は、音声区間およびノイズ区間を示す音声ノイズ区間情報２３、２４を、位相情報取得部１６およびノイズ低減処理部９８にそれぞれ出力する。

例えば、音声ノイズ区間検出部９５は、収音信号２１に音声が含まれているかを判定する回路、および収音信号２２に音声が含まれているかを判定する回路を備えていてもよい。この場合、音声ノイズ区間検出部９５は、音声が多く含まれている方の収音信号を用いて音声区間を検出することができる。なお、音声ノイズ区間検出部１５における音声区間およびノイズ区間の検出には、実施の形態１で説明した技術と同様の技術を用いることができる。

実施の形態１で説明したノイズ低減装置１では、音声は音声用マイクロフォン１１において収音される確率が高いことを前提とし、音声ノイズ区間検出部１５が、音声用マイクロフォン１１の収音信号２１のみに基づき音声区間を判定する場合を示した。しかしながら、ノイズ低減装置の使用状況によっては、音声用マイクロフォン１１よりも参照音用マイクロフォン１２の方が多く音声を収音する場合も考えられる。よって、本実施の形態では、音声ノイズ区間検出部９５が、収音信号２１および収音信号２２のうち音声が多く含まれている方の収音信号を用いて音声区間を検出することができるように構成している。

ノイズ低減処理判定部９７は、位相情報取得部１６で取得された音声位相差とノイズ位相差とに基づき、ノイズ低減処理を実施する場合である第１の状態と、ノイズ低減処理を実施しない場合またはノイズ低減処理を第１の状態よりも弱く実施する場合である第２の状態とを判定する。例えば、ノイズ低減処理判定部１７は、位相情報取得部１６で取得された音声位相差とノイズ位相差との差の絶対値が所定の閾値（第１の閾値）以内である場合、前記第２の状態と判定することができる。

図２１に示すように、ノイズ低減装置を含む無線通信装置６００の使用状況によっては、参照音用マイクロフォン１２が配置されている側に音声の音源が存在する場合も想定される。この場合は、参照音用マイクロフォン１２からの収音信号２２に多くの音声成分が含まれているため、収音信号２２に含まれているノイズ成分を収音信号２１を用いて低減する方が、より確実にノイズ低減処理を実施することができる。

よって、ノイズ低減処理判定部９７は、音声の音源が参照音用マイクロフォン１２側である場合、ノイズ低減処理部９８においてノイズ低減処理に用いる収音信号２１と収音信号２２とを切り替えるための選択信号９９（例えば、ハイレベル信号）を出力する。このように、ノイズ低減処理部９８に選択信号９９を出力することで、収音信号２２に含まれているノイズ成分を収音信号２１を用いて低減することができる。

例えば、音声用マイクロフォン１１で収音される音声の位相が、参照音用マイクロフォン１２で収音される音声の位相よりも遅い場合に、音声の音源が参照音用マイクロフォン１２側であると判断することができる。換言すると、位相情報取得部１６で取得された音声区間における収音信号２２の位相が収音信号２１の位相よりも早い場合（つまり、収音信号２１と収音信号２２の位相差（音声位相差）がマイナスである場合）、ノイズ低減処理判定部９７は、音声の音源が参照音用マイクロフォン１２側であると判断することができる。

また、例えば、図２１に示すように、ノイズの音源が音声用マイクロフォン１１側である場合、音声用マイクロフォン１１で収音されるノイズの位相は、参照音用マイクロフォン１２で収音されるノイズの位相よりも早くなる。よって、この場合は、収音信号２１と収音信号２２の位相差（ノイズ位相差）はプラスとなる。

なお、ノイズ低減処理判定部９７のその他の構成および動作については、実施の形態１で説明したノイズ低減処理判定部１７の構成および動作と同一であるので、重複した説明は省略する。

また、本実施の形態にかかるノイズ低減装置では、実施の形態２で説明したノイズ低減装置のように、パワー情報取得部で取得された音声パワー差とノイズパワー差とを用いてノイズ低減処理を実施するか否かを判定してもよい。例えば、音声用マイクロフォン１１で収音される音声の大きさが、参照音用マイクロフォン１２で収音される音声の大きさよりも小さい場合、音声の音源が参照音用マイクロフォン１２側であると判断することができる。換言すると、パワー情報取得部で取得された音声区間における収音信号２２の大きさが収音信号２１の大きさよりも大きい場合（つまり、収音信号２１と収音信号２２のパワー差（音声パワー差）がマイナスである場合）、ノイズ低減処理判定部９７は、音声の音源が参照音用マイクロフォン１２側であると判断することができる。

また、例えば、ノイズの音源が音声用マイクロフォン１１側である場合、音声用マイクロフォン１１で収音されるノイズの大きさは、参照音用マイクロフォン１２で収音されるノイズの大きさよりも大きい。よって、この場合は、収音信号２１と収音信号２２のパワー差（ノイズパワー差）はプラスとなる。

ノイズ低減処理部９８は、ノイズ低減処理判定部９７の判定結果に応じて収音信号２１と収音信号２２とを用いてノイズ低減処理を実施する。ノイズ低減処理部９８は、例えば、音声区間における収音信号２１の位相が収音信号２２の位相よりも早く（つまり、音声の音源が音声用マイクロフォン１１側）、且つ、ノイズ低減処理を実施するとノイズ低減処理判定部９７において判定された場合（判定フラグ２６がロウレベルの場合）、収音信号２１に含まれるノイズ成分を収音信号２２を用いて低減し、ノイズ低減処理後の信号を出力信号２７として出力する。また、ノイズ低減処理部９８は、音声区間における収音信号２１の位相が収音信号２２の位相よりも早く（つまり、音声の音源が音声用マイクロフォン１１側）、且つ、ノイズ低減処理を実施しないとノイズ低減処理判定部９７において判定された場合（判定フラグ２６がハイレベルの場合）、収音信号２１を出力信号２７としてそのまま出力する。

一方、ノイズ低減処理部９８は、音声区間における収音信号２２の位相が収音信号２１の位相よりも早く（つまり、音声の音源が参照音用マイクロフォン１２側）、且つ、ノイズ低減処理を実施するとノイズ低減処理判定部９７において判定された場合（判定フラグ２６がロウレベルの場合）、収音信号２２に含まれるノイズ成分を収音信号２１を用いて低減し、ノイズ低減処理後の信号を出力信号２７として出力する。また、ノイズ低減処理部９８は、音声区間における収音信号２２の位相が収音信号２１の位相よりも早く（つまり、音声の音源が参照音用マイクロフォン１２側）、且つ、ノイズ低減処理を実施しないとノイズ低減処理判定部９７において判定された場合（判定フラグ２６がハイレベルの場合）、収音信号２２を出力信号２７としてそのまま出力する。

また、パワー情報を用いた場合は、ノイズ低減処理部９８は、例えば、音声区間における収音信号２１の大きさが収音信号２２の大きさよりも大きく（つまり、音声の音源が音声用マイクロフォン１１側）、且つ、ノイズ低減処理を実施するとノイズ低減処理判定部９７において判定された場合（判定フラグ２６がロウレベルの場合）、収音信号２１に含まれるノイズ成分を収音信号２２を用いて低減し、ノイズ低減処理後の信号を出力信号２７として出力する。また、ノイズ低減処理部９８は、音声区間における収音信号２１の大きさが収音信号２２の大きさよりも大きく（つまり、音声の音源が音声用マイクロフォン１１側）、且つ、ノイズ低減処理を実施しないとノイズ低減処理判定部９７において判定された場合（判定フラグ２６がハイレベルの場合）、収音信号２１を出力信号２７としてそのまま出力する。

一方、ノイズ低減処理部９８は、音声区間における収音信号２２の大きさが収音信号２１の大きさよりも大きく（つまり、音声の音源が参照音用マイクロフォン１２側）、且つ、ノイズ低減処理を実施するとノイズ低減処理判定部９７において判定された場合（判定フラグ２６がロウレベルの場合）、収音信号２２に含まれるノイズ成分を収音信号２１を用いて低減し、ノイズ低減処理後の信号を出力信号２７として出力する。また、ノイズ低減処理部９８は、音声区間における収音信号２２の大きさが収音信号２１の大きさよりも大きく（つまり、音声の音源が参照音用マイクロフォン１２側）、且つ、ノイズ低減処理を実施しないとノイズ低減処理判定部９７において判定された場合（判定フラグ２６がハイレベルの場合）、収音信号２２を出力信号２７としてそのまま出力する。

図１９は、ノイズ低減処理部９８の一例を示すブロック図である。ノイズ低減処理部９８は、遅延素子７１_１〜７１_ｎ、乗算器７２_１〜７２_ｎ＋１、加算器７３_１〜７３_ｎ、適応係数調整部７４、減算器７５、出力信号選択部７６、およびセレクタ７７を備える。

セレクタ７７は、ノイズ低減処理判定部９７から出力された選択信号９９に応じて、収音信号２１および収音信号２２をそれぞれ音声信号８１（主に音声成分を含む信号）および参照信号８２（ノイズ成分を擬似的に生成ための信号）として出力する場合と、収音信号２１および収音信号２２をそれぞれ参照信号８２および音声信号８１として出力する場合とを切り替える。例えば、セレクタ７７は、音声の音源が音声用マイクロフォン１１側である場合（つまり、選択信号９９がロウレベルの場合）、収音信号２１および収音信号２２をそれぞれ音声信号８１および参照信号８２として出力する。一方、音声の音源が参照音用マイクロフォン１２側である場合（つまり、選択信号９９がハイレベルの場合）、収音信号２１および収音信号２２をそれぞれ参照信号８２および音声信号８１として出力する。

遅延素子７１_１〜７１_ｎ、乗算器７２_１〜７２_ｎ＋１、および加算器７３_１〜７３_ｎは、ＦＩＲフィルタを構成する。遅延素子７１_１〜７１_ｎ、乗算器７２_１〜７２_ｎ＋１、および加算器７３_１〜７３_ｎを用いて参照信号８２を処理することで、擬似ノイズ信号８３が生成される。

適応係数調整部７４は、音声ノイズ区間情報２４に応じて、乗算器７２_１〜７２_ｎ＋１の係数を調整する。すなわち、適応係数調整部７４は、音声ノイズ区間情報２４がノイズ区間を示している場合、適応誤差が少なくなるように係数を調整する。一方、音声ノイズ区間情報２４が音声区間を示している場合、ノイズ低減処理部１８の係数を維持するか、または係数を微調整するのみとする。

減算器７５は、音声信号８１から疑似ノイズ信号８３を差し引くことで、ノイズ低減処理後の信号８４を生成し、出力信号選択部７６に出力する。また、減算器７５は、音声信号８１から疑似ノイズ信号８３を差し引くことで、フィードバック用の信号８５を生成し、適応係数調整部７４に出力する。

出力信号選択部７６は、ノイズ低減処理判定部９７から出力された判定フラグ２６に応じて、音声信号８１を出力信号２７としてそのまま出力するか、またはノイズ低減処理後の信号８４を出力信号２７として出力するかを選択する。つまり、出力信号選択部７６は、ノイズ低減処理判定部９７から出力された判定フラグ２６が有効（ハイレベル）である場合は、音声信号８１を出力信号２７としてそのまま出力する。一方、ノイズ低減処理判定部９７から出力された判定フラグ２６が無効（ロウレベル）である場合は、ノイズ低減処理後の信号８４を出力信号２７として出力する。

次に、本実施の形態にかかるノイズ低減装置３の動作について説明する。図２０は、本実施の形態にかかるノイズ低減装置３の動作を説明するためのフローチャートである。なお、図２０に示すステップＳ２１〜ステップＳ２６はそれぞれ、図９に示したステップＳ１〜ステップＳ６（実施の形態１参照）と同様であるので、重複した説明は省略する。

ステップＳ２７において、ノイズ低減処理判定部９７は、音声の音源が参照音用マイクロフォン１２側であるか判定する。そして、音声の音源が音声用マイクロフォン１１側である場合（ステップＳ２７：Ｎｏ）、ノイズ低減処理部９８は、音声用マイクロフォン１１の収音信号２１を音声信号８１と、参照音用マイクロフォン１２の収音信号２２を参照信号８２とする（ステップ２８）。例えば、収音信号２１と収音信号２２の位相差（音声位相差）がプラスである場合、ノイズ低減処理判定部９７は、音声の音源が音声用マイクロフォン１１側であると判断することができる。

一方、音声の音源が参照音用マイクロフォン１２側である場合（ステップＳ２７：Ｙｅｓ）、ノイズ低減処理部９８は、参照音用マイクロフォン１２の収音信号２２を音声信号８１と、音声用マイクロフォン１１の収音信号２１を参照信号８２とする（ステップ２９）。例えば、収音信号２１と収音信号２２の位相差（音声位相差）がマイナスである場合、ノイズ低減処理判定部９７は、音声の音源が参照音用マイクロフォン１２側であると判断することができる。

次に、ノイズ低減処理判定部９７は、位相情報取得部１６で取得された音声位相差とノイズ位相差とに基づきノイズ低減処理を実施するか否かを判定する。つまり、ノイズ低減処理判定部９７は、音声位相差とノイズ位相差との差の絶対値が所定の第１の閾値よりも大きい場合（ステップＳ３０：Ｎｏ）、ノイズ低減処理を実施すると判定する。なお、パワー情報を用いる場合は、ノイズ低減処理判定部９７は、パワー情報取得部で取得された音声パワー差とノイズパワー差との差の絶対値が所定の第２の閾値よりも大きい場合、ノイズ低減処理を実施すると判定することができる。

このとき、ノイズ低減処理判定部９７から出力される判定フラグ２６は無効（ロウレベル）であるため、ノイズ低減処理部９８は、音声信号８１（図１９参照）に含まれるノイズ成分を参照信号８２を用いて低減し、ノイズ低減処理後の信号を出力信号２７として出力する（ステップＳ３１）。

一方、ノイズ低減処理判定部９７は、音声位相差とノイズ位相差との差の絶対値が所定の第１の閾値以内である場合（ステップＳ３０：Ｙｅｓ）、ノイズ低減処理を実施しないと判定する。なお、パワー情報を用いる場合は、ノイズ低減処理判定部９７は、パワー情報取得部で取得された音声パワー差とノイズパワー差との差の絶対値が所定の第２の閾値以内である場合、ノイズ低減処理を実施しないと判定することができる。

このとき、ノイズ低減処理判定部９７から出力される判定フラグ２６は有効（ハイレベル）であるため、ノイズ低減処理部９８は、音声信号８１をそのまま出力する（ステップＳ３２）。

よって、本実施の形態にかかるノイズ低減装置３では、音声の音源が参照音用マイクロフォン１２側である場合、ノイズ低減処理部９８においてノイズ低減処理に用いる収音信号２１と収音信号２２とを切り替えている。このように、収音信号２１と収音信号２２を切り替えることで、収音信号２２に含まれているノイズ成分を収音信号２１を用いて低減することができ、より確実にノイズ低減処理を実施することができる。

以上、本発明を上記実施形態に即して説明したが、上記実施形態の構成にのみ限定されるものではなく、本願特許請求の範囲の請求項の発明の範囲内で当業者であればなし得る各種変形、修正、組み合わせを含むことは勿論である。例えば、音声用マイクロフォン１１と参照音用マイクロフォン１２とを機器上部（又は下部）のほぼ同じ位置に設けて、指向性が異なるようにこれらのマイクロフォンを配置してもよい。例えば、音声用マイクロフォン１１と参照音用マイクロフォン１２の指向性が１８０°異なるように配置することが好ましい。

１、２、３ノイズ低減装置
１１音声用マイクロフォン
１２参照音用マイクロフォン
１３、１４ＡＤコンバータ
１５、９５音声ノイズ区間検出部
１６位相情報取得部
１７、９７ノイズ低減処理判定部
１８、９８ノイズ低減処理部
２１、２２収音信号
２３、２４音声ノイズ区間情報
２５音声ノイズ方向情報
２６判定フラグ
２７出力信号
２８パワー情報
２９位相パワー情報
６０パワー情報取得部
７０位相パワー情報取得部

Claims

第１のマイクロフォンで収音された音に応じた第１の収音信号および第２のマイクロフォンで収音された音に応じた第２の収音信号のうちの少なくとも一方に基づき音声区間およびノイズ区間を検出する音声ノイズ区間検出部と、
前記音声区間における前記第１の収音信号と前記第２の収音信号との位相差である音声位相差と、前記ノイズ区間における前記第１の収音信号と前記第２の収音信号との位相差であるノイズ位相差とを取得する位相情報取得部と、
前記音声位相差と前記ノイズ位相差との差に基づく値が、所定の閾値以内であるか否かにより、前記音声位相差と前記ノイズ位相差の状態を判定するノイズ低減処理判定部と、
前記ノイズ低減処理判定部の判定結果に応じて前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施するノイズ低減処理部と、
を備えるノイズ低減装置。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態がノイズ低減処理を実施する場合である第１の状態であるか否かを判定し、
前記ノイズ低減処理部は、前記ノイズ低減処理判定部が前記第１の状態であると判定した場合、前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施する、請求項１に記載のノイズ低減装置。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態が、ノイズ低減処理を実施する場合である第１の状態よりもノイズ低減処理を弱く実施する場合である第２の状態であるか否かを判定し、
前記ノイズ低減処理部は、前記ノイズ低減処理判定部が前記第２の状態であると判定した場合、前記第１の状態よりもノイズ低減処理を弱く実施する、請求項１に記載のノイズ低減装置。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態が、ノイズ低減処理を実施しない場合である第２の状態であるか否かを判定し、
前記ノイズ低減処理部は、前記ノイズ低減処理判定部が前記第２の状態であると判定した場合、ノイズ低減処理を実施しない、請求項１に記載のノイズ低減装置。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差との差の絶対値が所定の閾値以内である場合、前記第２の状態と判定する、請求項３または４に記載のノイズ低減装置。
前記位相情報取得部は、前記音声区間において前記音声位相差を更新し、前記ノイズ区間において前記ノイズ位相差を更新する、請求項１乃至５のいずれか一項に記載のノイズ低減装置。
前記音声区間における前記第１の収音信号の大きさと前記第２の収音信号の大きさとの差である音声パワー差と、前記ノイズ区間における前記第１の収音信号の大きさと前記第２の収音信号の大きさとの差であるノイズパワー差とを取得するパワー情報取得部を更に備え、
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態および前記音声パワー差と前記ノイズパワー差との差に基づく値が、所定の閾値以内であるか否かにより、状態を判定し、
前記ノイズ低減処理部は、前記ノイズ低減処理判定部の判定した、前記音声位相差と前記ノイズ位相差の状態、及び、前記音声パワー差と前記ノイズパワー差の状態に応じて、前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施する、
請求項１乃至６のいずれか一項に記載のノイズ低減装置。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態がノイズ低減処理を実施する場合である第１の状態であるか否かを判定し、
前記ノイズ低減処理部は、前記ノイズ低減処理判定部が前記第１の状態であると判定した場合、前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施し、
前記ノイズ低減処理部は、
前記ノイズ低減処理判定部において前記第１の状態と判定された場合、前記第１の収音信号に含まれるノイズ成分を前記第２の収音信号を用いて低減し、当該ノイズ低減処理後の信号を音声信号として出力し、
前記ノイズ低減処理判定部において前記第２の状態と判定された場合、前記第１の収音信号を音声信号として出力する、
請求項３乃至５のいずれか一項に記載のノイズ低減装置。
前記ノイズ低減処理判定部は、前記音声位相差と前記ノイズ位相差の状態がノイズ低減処理を実施する場合である第１の状態であるか否かを判定し、
前記ノイズ低減処理部は、前記ノイズ低減処理判定部が前記第１の状態であると判定した場合、前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施し、
前記ノイズ低減処理部は、
前記音声区間における前記第２の収音信号の位相が前記第１の収音信号の位相よりも早く、且つ、前記ノイズ低減処理判定部において前記第１の状態と判定された場合、前記第２の収音信号に含まれるノイズ成分を前記第１の収音信号を用いて低減し、当該ノイズ低減処理後の信号を音声信号として出力し、
前記音声区間における前記第２の収音信号の位相が前記第１の収音信号の位相よりも早く、且つ、前記ノイズ低減処理判定部において前記第２の状態と判定された場合、前記第２の収音信号を音声信号として出力する、
請求項３乃至５のいずれか一項に記載のノイズ低減装置。
請求項１乃至９のいずれか一項に記載のノイズ低減装置を備えた音声入力装置。
前記第１のマイクロフォンは前記音声入力装置の第１の面に設けられ、
前記第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられている、請求項１０に記載の音声入力装置。
請求項１乃至９のいずれか一項に記載のノイズ低減装置を備えた無線通信装置。
前記第１のマイクロフォンは前記無線通信装置の第１の面に設けられ、
前記第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられている、請求項１２に記載の無線通信装置。
第１のマイクロフォンで収音された音に応じた第１の収音信号および第２のマイクロフォンで収音された音に応じた第２の収音信号のうちの少なくとも一方に基づき音声区間およびノイズ区間を検出し、
前記音声区間における前記第１の収音信号と前記第２の収音信号との位相差である音声位相差と、前記ノイズ区間における前記第１の収音信号と前記第２の収音信号との位相差であるノイズ位相差とを取得し、
前記音声位相差と前記ノイズ位相差との差に基づく値が、所定の閾値以内であるか否かにより、前記音声位相差と前記ノイズ位相差の状態を判定し、
前記音声位相差と前記ノイズ位相差の状態を判定した結果に応じて前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施する、
ノイズ低減方法。
コンピュータに
第１のマイクロフォンで収音された音に応じた第１の収音信号および第２のマイクロフォンで収音された音に応じた第２の収音信号のうちの少なくとも一方に基づき音声区間およびノイズ区間を検出させ、
前記音声区間における前記第１の収音信号と前記第２の収音信号との位相差である音声位相差と、前記ノイズ区間における前記第１の収音信号と前記第２の収音信号との位相差であるノイズ位相差とを取得させ、
前記音声位相差と前記ノイズ位相差との差に基づく値が、所定の閾値以内であるか否かにより、前記音声位相差と前記ノイズ位相差の状態を判定させ、
前記音声位相差と前記ノイズ位相差の状態を判定した結果に応じて前記第１の収音信号と前記第２の収音信号とを用いてノイズ低減処理を実施させる、
ノイズ低減プログラム。