JPWO2005125273A1 - ハウリング検出装置およびその方法 - Google Patents

ハウリング検出装置およびその方法 Download PDF

Info

Publication number
JPWO2005125273A1
JPWO2005125273A1 JP2006514765A JP2006514765A JPWO2005125273A1 JP WO2005125273 A1 JPWO2005125273 A1 JP WO2005125273A1 JP 2006514765 A JP2006514765 A JP 2006514765A JP 2006514765 A JP2006514765 A JP 2006514765A JP WO2005125273 A1 JPWO2005125273 A1 JP WO2005125273A1
Authority
JP
Japan
Prior art keywords
howling
signal
unit
sound
audio signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006514765A
Other languages
English (en)
Other versions
JP4675888B2 (ja
Inventor
河村 岳
岳 河村
丈郎 金森
丈郎 金森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2005125273A1 publication Critical patent/JPWO2005125273A1/ja
Application granted granted Critical
Publication of JP4675888B2 publication Critical patent/JP4675888B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

ハウリング検出装置は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出する。ハウリング検出装置は、複数の音声信号のレベルをそれぞれ検出するレベル検出部と、スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、レベル検出部が検出した複数の音声信号のレベルからそれぞれ語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を音声信号それぞれの支配率として算出する支配率算出部とを備える。

Description

本発明は、ハウリング検出装置およびその方法に関し、より特定的には、複数の音声信号を混合して拡声する拡声システムにおいて、当該複数の音声信号それぞれについて、ハウリングを発生させる危険度を検出するハウリング検出装置およびその方法に関する。
従来、マイクロフォンで収音した音声信号を拡声する拡声システムにおいて、ハウリングの発生を検出し、当該ハウリングを抑制するハウリング抑制装置が開発されている。従来のハウリング抑制装置としては、適用フィルタやノッチフィルタなどを用いたハウリング抑制装置が知られている(例えば、特許文献1および特許文献2参照)。
以下、図10を参照して、複数の音声信号を入力として当該複数の音声信号を混合して拡声する拡声システムにおいて、従来のハウリング抑制装置を採用した場合について説明する。図10は、複数の音声信号を混合して拡声する拡声システム9において上記特許文献1および特許文献2に開示されたハウリング抑制装置を採用した構成例を示す図である。なお、図10では、スピーカと複数のマイクロフォンとが同一の音場にあるときに発生するハウリングを抑制する場合の構成例を示している。また、ここでは複数の音声信号として、2つのマイクロフォンから2つの音声信号が入力されるとする。
図10において、拡声システム9は、第1のマイクロフォン91a、第2のマイクロフォン91b、音特性調整部92、音混合部93、ハウリング抑制部94、およびスピーカ95を有する。音特性調整部92は、第1のマイクロフォン91aで収音して生成された音声信号を入力とし、当該音声信号の周波数やゲインの特性を調整する。同様に、第2のマイクロフォン91bで収音して生成された音声信号は、音特性調整部92において周波数やゲインの特性が調整される。そして、調整された各音声信号は、音混合部93において混合される。なお、音特性調整部92および音混合部93は、例えば図11に示すような市販のミキサなどに相当する。図11は、音特性調整部92および音混合部93の構成例を示すブロック図である。図11において、音特性調整部92は、例えばイコライザ921a、イコライザ921b、増幅部922a、および増幅部922bを有する。イコライザ921aは、第1のマイクロフォン91aで収音して生成された音声信号の周波数特性を調整する。増幅部922aは、イコライザ921aで調整された音声信号のゲインを調整する。同様に、イコライザ921bおよび増幅部922bは、第2のマイクロフォン91bで収音して生成された音声信号の周波数やゲインの特性を調整する。このように音特性調整部92では、通常のミキサと同様に、第1および第2のマイクロフォン91aおよび92bで収音された各音声信号の周波数やゲインの特性がそれぞれ独立して調整される。音混合部93において混合された音声信号は、ハウリング抑制部94に入力される。
ハウリング抑制部94は、音混合部93において混合された音声信号に対して、ハウリングを抑制する信号処理を行う。そして、信号処理された音声信号は、適宜増幅されてスピーカ95によって拡声される。なお、ハウリング抑制部94は、ハウリングを抑制するハウリング抑制装置に相当する。そして、上述したように、当該拡声システムは、上記特許文献1または特許文献2で開示されたハウリング抑制方式を採用している例であるため、ハウリング抑制部94として適応フィルタまたはノッチフィルタを用いている。
図12は、適応フィルタ941を用いたハウリング抑制部94の構成例を示すブロック図である。この場合、ハウリング抑制部94は、ハウリング抑制部94から出力される音声信号(拡声対象である音声信号)に基づいて、当該音声信号が出力されたときのみ、空間伝達特性などの伝達特性を推定する。そして、適用フィルタ941は、推定した伝達特性を拡声対象である音声信号に乗じて、音混合部93から出力された音声信号から減算する。これにより、ハウリングの発生を抑制することができる。
また、ハウリング抑制部94としてノッチフィルタを用いる場合もある。図13は、音混合部93から出力された音声信号のパワースペクトルX(ω)のハウリング発生時の変化を示す図である。例えば、特定周波数fにおいてハウリングが発生すると仮定する。このとき、図13に示すパワースペクトルX(ω)は、特定周波数fにおいてパワーが急激に増加するように変化する。そこで、隣接する帯域間のパワーの差分を常に観察することで、特定周波数fが含まれる帯域のパワーが急激に増加したことが検出される。つまり、ハウリングが発生する周波数を検出することができる。このとき、ノッチフィルタの減衰する周波数を特定周波数fに設定する。そして、音混合部93から出力された音声信号を特定周波数fで減衰するノッチフィルタに通過させることで、特定周波数fのパワーは減衰する。その結果、ハウリングの発生が抑制される。
特許第2039846号公報 特許第2560923号公報
ここで、図14を参照して、適用フィルタを用いたハウリング抑制部94が推定するべき理想的な伝達特性について考える。図14は、1入力時の拡声システム9において、伝達特性に関係する各構成の特性を模式的に示した図である。ここでは、まずマイクロフォン91が1つの場合について考える。また、図14において、マイクロフォン91の収音対象となる音声をS(ω)、マイクロフォン91で収音して生成された音声信号をX(ω)、音特性調整部92において調整される周波数やゲインの特性をM(ω)、ハウリング抑制部94で推定するべき理想的な伝達特性をHhat(ω)、ハウリング抑制部94から出力される音声信号をY(ω)、スピーカ95からマイクロフォン91までの空間伝達特性をR(ω)とする。このとき、マイクロフォン91で収音して生成された音声信号X(ω)は数式(1)で表現される。
Figure 2005125273
なお、R(ω)には、上記空間の伝達特性だけでなく、マイクロフォン91自体の特性、スピーカ95自体の特性、およびハウリング抑制部94の出力とスピーカ95との間で適宜増幅された場合のその増幅特性などが含まれてもよい。また、ハウリング抑制部94では、音特性調整部92において調整された音声信号M(ω)*X(ω)がハウリング抑制部94の出力音声信号Y(ω)に伝達特性Hhat(ω)を乗じたもので減算する処理が行われ、数式(2)が成立する。
Figure 2005125273
数式(1)および数式(2)を変形すると、数式(3)が得られる。
Figure 2005125273
数式(3)において、第2項がハウリングに起因する項である。したがって、理想的な伝達特性Hhat(ω)は、数式(4)を満たす伝達特性となる。
Figure 2005125273
伝達特性Hhat(ω)が数式(4)の関係を満たすことによって、数式(3)の第2項がほぼゼロとなる。これにより、ハウリング抑制部94は、ハウリングの発生を抑制することができる。
次に、図15を参照して、複数の音声信号を混合する場合について考える。図15は、複数入力時の拡声システム9において、伝達特性と関係する各構成の特性を模式的に示した図である。図15において、第1のマイクロフォン91aの収音対象となる音声をS1(ω)、音特性調整部92において調整される周波数やゲインの特性をM1(ω)、スピーカ95から第1のマイクロフォン91aまでの空間伝達特性をR1(ω)とする。同様に、第nのマイクロフォンの収音対象となる音声をSn(ω)、音特性調整部92において調整される周波数やゲインの特性をMn(ω)、スピーカ95から第nのマイクロフォン92cまでの空間伝達特性をRn(ω)とする。このとき、数式(3)は数式(5)と表現される。なお、nは自然数であり、マイクロフォンの本数を示す。
Figure 2005125273
数式(5)において、第2項がハウリングに起因する項である。したがって、推定されるべき理想的な伝達特性Hhat(ω)は、数式(6)を満たす伝達特性となる。
Figure 2005125273
数式(6)に示すように、複数の音声信号がもつ空間伝達特性R(ω)は、それぞれ固有の値である。また、空間伝達特性R(ω)は、マイクロフォンの位置によって変化する値である。つまり、理想的な伝達特性を適切に推定するためには、複数の音声信号それぞれの空間伝達特性R(ω)を考慮する必要がある。しかしながら、従来においては、伝達特性はハウリング抑制部94の出力信号に基づいて推定される。つまり、ハウリング抑制部94の出力信号は、複数の音声信号が混合された音声信号に基づく信号であり、複数のマイクロフォンそれぞれの空間伝達特性R(ω)が考慮された信号ではない。したがって、従来においては、空間伝達特性R(ω)の変化に対して上記伝達特性の推定速度が追いつかず、ハウリングの発生を適切に抑制することができないという問題があった。
また、数式(6)に示すように、推定されるべき理想的な伝達特性Hhat(t)は、複数のマイクロフォンそれぞれのM(ω)やR(ω)によって決まる値である。つまり、理想的な伝達特性Hhat(ω)は、M(ω)が変化すると、それに伴い変化する値である。ここで、上記適用フィルタ941では、ハウリング抑制部94の出力信号に基づいて、収束しながら伝達特性が推定される。このため、M(ω)が急激に変化して理想的な伝達特性Hhat(ω)も急激に変化した場合には、上記伝達特性の推定速度が追いつかず、ハウリングの発生を適切に抑制することが困難であった。
また、複数のマイクロフォンを有する場合、上述したようにM(ω)およびR(ω)の値は、マイクロフォンが1つのときと比べて変化しやすいので、ハウリングが発生する特定周波数fも変化しやすい。これにより、ハウリング抑制部94として上記ノッチフィルタを用いた場合にも、この特定周波数fの変化にノッチフィルタの減衰する周波数の設定が追いつかず、ハウリングの発生を適切に抑制することが困難であった。
このように、複数の音声信号を混合して拡声する拡声システムにおいては、複数の音声信号それぞれについて、ハウリングの発生する危険度(例えば、上記M(ω)やR(ω)の変化など)を考慮しなければ、ハウリングの発生を適切に抑制することができないという課題があった。
また、従来においてハウリングの発生をユーザに警告する場合、入力された音声信号のパワースペクトルにおいて、隣接する帯域間のパワーの差分を常に観察してハウリングの発生を検出し、ユーザに警告する方法が知られている。しかしながら、複数の音声信号を混合して拡声する拡声システムにおいては、混合された音声信号のパワースペクトルに基づいてハウリングの発生を検出することとなる。したがって、従来においては、複数入力される音声信号のうちどの音声信号がハウリングを発生させたのか、もしくは発生させる危険があるのかを特定して警告することが不可能であった。
それ故、本発明においては、複数の音声信号を混合して拡声する拡声システムにおいて、当該複数の音声信号それぞれについて、ハウリングを発生させる危険度を検出することを目的とする。さらに、本発明においては、当該危険度の情報に基づいて適切な伝達特性を推定し、音特性調整部による伝達特性の急激な変化に対してロバストなハウリングの発生の抑制を行うことを目的とする。また、本発明においては、複数入力される音声信号のうちどの音声信号がハウリングを発生させたのか、もしくは発生させる危険があるのかを特定して警告する方法を提供することを目的とする。
本発明の第1の局面は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出装置であって、複数の前記音声信号のレベルをそれぞれ検出するレベル検出部と、前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出部とを備える。
本発明の第2の局面は、上記第1の局面において、前記ハウリング検出装置は、前記支配率を用いて算出された伝達特性に基づいて、前記語尾の区間に含まれる信号と同じ成分を有する信号を前記混合信号から減算して前記スピーカに出力するハウリング抑制部を、さらに備える。
本発明の第3の局面は、上記第2の局面において、前記ハウリング抑制部は、前記語尾の区間に含まれる信号と同じ成分を有する信号を除いた前記混合信号を推定する関数を設定し、前記支配率に応じて前記総和を更新し、当該更新前後の総和の変化率を前記関数に乗じて前記伝達特性を算出することを特徴とする。
本発明の第4の局面は、上記第3の局面において、前記ハウリング抑制部は、相対的に高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする。
本発明の第5の局面は、上記第3の局面において、前記ハウリング抑制部は、最も高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする。
本発明の第6の局面は、上記第1の局面において、前記ハウリング検出装置は、前記支配率算出部において算出された支配率が相対的に高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
本発明の第7の局面は、上記第1の局面において、ハウリング検出装置であって、前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
本発明の第8の局面は、上記第1の局面において、前記レベル検出部は、複数の前記音声信号レベルをパワースペクトルでそれぞれ検出することを特徴とする。
本発明の第9の局面は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出装置であって、複数の前記音声信号のレベルをそれぞれ検出するレベル検出部と、前記混合信号のパワースペクトルを算出して、当該パワースペクトルの変化に基づいてハウリングの発生を検出するハウリング発生検出部と、前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記ハウリングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出部とを備える。
本発明の第10の局面は、上記第9の局面において、前記ハウリング検出装置は、前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、前記支配率を用いて算出された伝達特性に基づいて、前記語尾の区間に含まれる信号と同じ成分を有する信号を前記混合信号から減算して前記スピーカに出力するハウリング抑制部とを、さらに備える。
本発明の第11の局面は、上記第10の局面において、前記ハウリング抑制部は、前記語尾の区間に含まれる信号と同じ成分を有する信号を除いた前記混合信号を推定する関数を前記語尾の区間が検出されたときに設定し、前記支配率に応じて前記総和を更新し、当該更新前後の総和の変化率を前記関数に乗じて前記伝達特性を前記ハウリングの発生が検出されたときに算出することを特徴とする。
本発明の第12の局面は、上記第11の局面において、前記ハウリング抑制部は、相対的に高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする。
本発明の第13の局面は、上記第11の局面において、前記ハウリング抑制部は、最も高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする。
本発明の第14の局面は、上記第9の局面において、前記ハウリング検出装置は、前記支配率算出部において算出された支配率が相対的に高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
本発明の第15の局面は、上記第9の局面において、前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
本発明の第16の局面は、上記第9の局面において、前記レベル検出部は、複数の前記音声信号レベルをパワースペクトルでそれぞれ検出することを特徴とする。
本発明の第17の局面は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合ステップで混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出方法であって、複数の前記音声信号のレベルをそれぞれ検出するレベル検出ステップと、前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出ステップと、前記レベル検出ステップが検出した複数の前記音声信号のレベルからそれぞれ前記語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出ステップとを含む。
本発明の第18の局面は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合ステップで混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出方法であって、複数の前記音声信号のレベルをそれぞれ検出するレベル検出ステップと、前記混合信号のパワースペクトルを算出して、当該パワースペクトルの変化に基づいてハウリングの発生を検出するハウリング発生検出ステップと、前記レベル検出ステップが検出した複数の前記音声信号のレベルからそれぞれ前記ハウリングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出ステップとを含む。
上記第1の局面によれば、語尾の区間にはハウリングの発生原因となる信号成分のみが含まれおり、支配率が当該語尾の区間に応じたレベルを用いて算出されることで、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度を検出することができる。また、支配率は音混合部で混合される前の音声信号のレベルに基づいて算出される。これにより、本局面によれば、音混合部で混合される前において、例えば複数の音声信号の周波数および/またはゲインの特性がそれぞれ変更されても、その変更に対応した上記危険度を検出することができる。
上記第2の局面によれば、伝達特性が支配率を用いて算出されることで、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度に応じたハウリングの抑制を行うことができる。また、伝達特性が支配率を用いて算出されることで、音混合部で混合される前において、例えば複数の音声信号の周波数および/またはゲインの特性がそれぞれ変更され、伝達特性が急激に変化しても、その変化に対応したロバストなハウリングの抑制を行うことができる。
上記第3の局面によれば、伝達特性が支配率に応じた総和の変化率に基づいて算出されることで、複数の音声信号のハウリングを発生させる危険度を考慮したロバストなハウリング抑制を実現することができる。
上記第4の局面によれば、複数の音声信号のうち、ハウリングを発生させる危険度が相対的に高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑制を実現することができる。
上記第5の局面によれば、複数の音声信号のうち、ハウリングを発生させる危険度が最も高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑制を実現することができる。例えばユーザのミキサ操作として、複数の音声信号のレベルを全て同時に変更したりする操作は稀であるため、支配率の最も高いものだけに追随するものであっても、ロバストなハウリングの抑制を行うことができる。
上記第6の局面によれば、支配率が相対的に高い音声信号を特定することによって、ユーザに対して、複数の音声信号のうち、どの音声信号がハウリングを発生させる危険度が相対的に高いかを通知することができる。また、ユーザが例えばミキサなどの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を未然に防止しながら操作を行うことができる。
上記第7の局面によれば、支配率が最も高い音声信号を特定することによって、ユーザに対して、複数の音声信号のうち、どの音声信号がハウリングを発生させる危険度が最も高いかを通知することができる。また、例えばミキサなどの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を未然に防止しながら操作を行うことができる。
上記第8の局面によれば、複数の音声信号のレベルがパワースペクトルで算出されることで、ハウリングを発生させる危険度を周波数帯域ごとに検出することができる。
上記第9の局面によれば、ハウリングが発生したとき、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度を検出することができる。また、支配率は音混合部で混合される前の音声信号のレベルに基づいて算出される。これにより、本局面によれば、音混合部で混合される前において、例えば複数の音声信号の周波数および/またはゲインの特性がそれぞれ変更されても、その変更に対応した上記危険度を検出することができる。
上記第10の局面によれば、伝達特性が支配率を用いて算出されることで、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度に応じたハウリングの抑制を行うことができる。また、伝達特性が支配率を用いて算出されることで、音混合部で混合される前において、例えば複数の音声信号の周波数および/またはゲインの特性がそれぞれ変更され、伝達特性が急激に変化しても、その変化に対応したロバストなハウリングの抑制を行うことができる。
上記第11の局面によれば、伝達特性が支配率に応じた総和の変化率に基づいて算出されることで、語尾の区間が到来する前に、複数の音声信号のハウリングを発生させる危険度を考慮したロバストなハウリング抑制を実現することができる。
上記第12の局面によれば、複数の音声信号のうち、ハウリングを発生させる危険度が相対的に高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑制を実現することができる。
上記第13の局面によれば、複数の音声信号のうち、ハウリングを発生させる危険度が最も高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑制を実現することができる。例えばユーザのミキサ操作として、複数の音声信号のレベルを全て同時に変更したりする操作は稀であるため、支配率の最も高いものだけに追随するものであっても、ロバストなハウリングの抑制を行うことができる。
上記第14の局面によれば、ハウリングが発生した場合において、ユーザに対して、複数の音声信号のうちどの音声信号がハウリングを発生させる危険度が相対的に高いかを通知することができる。また、ユーザが例えばミキサなどの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を未然に防止しながら操作を行うことができる。
上記第15の局面によれば、ハウリングが発生した場合において、ユーザに対して、複数の音声信号のうちどの音声信号がハウリングを発生させる危険度が最も高いかを通知することができる。また、ユーザが例えばミキサなどの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を未然に防止しながら操作を行うことができる。
上記第16の局面によれば、複数の音声信号のレベルがパワースペクトルで算出されることで、ハウリングを発生させる危険度を周波数帯域ごとに検出することができる。
図1は、拡声システム1の構成例を示すブロック図である。 図2は、音特性調整部12および音混合部13の構成例を示すブロック図である。 図3は、雑音参照信号Y(t)および音声信号Xm(t)の波形を示す図である。 図4は、ループゲインG1(ω)、G2(ω)、およびループゲインの和(G1(ω)+G2(ω))のスペクトラムの一例を示す図である。 図5は、ハウリング抑制部17の構成の一例を示すブロック図である。 図6は、拡声システム2の構成例を示すブロック図である。 図7は、第2の実施形態におけるハウリング抑制部22の構成の一例を示すブロック図である。 図8は、ハウリング警告装置の構成例を示すブロック図である。 図9は、ハウリング発生検出部21を用いたハウリング警告装置の構成例を示すブロック図である。 図10は、複数の音声信号を混合して拡声する拡声システム9において上記特許文献1および特許文献2に開示されたハウリング抑制装置を採用した構成例を示す図である。 図11は、音特性調整部92および音混合部93の構成例を示すブロック図である。 図12は、適応フィルタ941を用いたハウリング抑制部94の構成例を示すブロック図である。 図13は、音混合部93から出力された音声信号のパワースペクトルX(ω)のハウリング発生時の変化を示す図である。 図14は、1入力時の拡声システム9において、伝達特性に関係する各構成の特性を模式的に示した図である。 図15は、複数入力時の拡声システム9において、伝達特性と関係する各構成の特性を模式的に示した図である。
符号の説明
1、2 拡声システム
3 ハウリング警告装置
11a 第1のマイクロフォン
11b 第2のマイクロフォン
12 音特性調整部
13 音混合部
14 レベル検出部
15、176 語尾検出部
16 支配率算出部
17、22 ハウリング抑制部
18 スピーカ
21 ハウリング発生検出部
31 ハウリング警告部
121 イコライザ
122 増幅部
171 第1のパワースペクトル算出部
172 第2のパワースペクトル算出部
173 伝達特性算出部
174 逆フーリエ変換部
175 畳み込み部
(第1の実施形態)
図1を参照して、本発明の第1の実施形態に係るハウリング検出方法および抑制方法を採用した拡声システム1について説明する。図1は、拡声システム1の構成例を示すブロック図である。図1において、拡声システム1は、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、語尾検出部15、支配率算出部16、ハウリング抑制部17、およびスピーカ18を有する。なお、拡声システム1は3つ以上のマイクロフォンを用いて拡声するシステムでもよいが、ここでは2つのマイクロフォンを用いて拡声する場合を想定して説明する。図1において、第1のマイクロフォン11aは、スピーカ18において拡声するための音声を収音して音声信号を生成する。この第1のマイクロフォン11aで生成された音声信号をX1(t)とする。また、第2のマイクロフォン11bでも同様に、拡声するための音声を収音して音声信号X2(t)を生成する。
音特性調整部12は、音声信号X1(t)およびX2(t)を入力とし、当該音声信号の周波数やゲインの特性をそれぞれ調整する。なお、音特性調整部12で調整された音声信号X1(t)をXm1(t)とする。同様に音特性調整部12で調整された音声信号X2(t)をXm2(t)とする。音特性調整部12で調整された音声信号Xm1(t)およびXm2(t)は、レベル検出部14と音混合部13とにそれぞれ出力される。音混合部13に入力された音声信号Xm1(t)およびXm2(t)は、当該音混合部13において混合される。この混合された音声信号をXm(t)とする。そして、音混合部13において混合された音声信号Xm(t)は、語尾検出部15およびハウリング抑制部94に出力される。なお、音特性調整部12および音混合部13は、例えば図2に示すような市販のミキサなどである。
図2は、音特性調整部12および音混合部13の構成例を示すブロック図である。図2において、音特性調整部12は、例えばイコライザ121a、イコライザ121b、増幅部122a、および増幅部122bを有する。イコライザ121aは、第1のマイクロフォン11aで収音して生成された音声信号X1(t)の周波数特性を調整する。増幅部122aは、イコライザ121aで調整された音声信号のゲインを調整する。同様に、イコライザ121bおよび増幅部122bは、第2のマイクロフォン11bで収音して生成された音声信号X2(t)の周波数やゲインの特性を調整する。このように音特性調整部12では、通常のミキサと同様に、第1および第2のマイクロフォン11aおよび12bで収音された各音声信号の周波数やゲインの特性がそれぞれ独立して調整される。
レベル検出部14は、音特性調整部12から出力される音声信号Xm1(t)およびXm2(t)の各レベルを検出する。具体的な検出方法としては、例えば所定時間毎にパワースペクトルを算出して、帯域毎のレベルを検出する。レベル検出部14で検出された各所定時間における帯域毎のレベルの情報は、全て支配率算出部16に出力される。
語尾検出部15は、音混合部13から入力される音声信号Xm(t)と、雑音参照信号Y(t)とに基づいて、雑音参照信号Y(t)に対する音声信号Xm(t)の音声区間の遅延区間を語尾として検出する。なお、雑音参照信号Y(t)は、スピーカで拡声される音響に関する信号であり、例えばスピーカ18において拡声される直前の音声信号である。このとき、ハウリング抑制部17には、スピーカ18の直前の入力から雑音参照信号Y(t)が入力される。また例えば、スピーカ18の近傍で拡声された音声を別のマイクロフォンなどで収音して生成される音声信号であってもよい。このとき、ハウリング抑制部17は、当該別のマイクロフォンと接続され、当該別のマイクロフォンから出力される音声信号を雑音参照信号Y(t)として入力する。
ここで、図3を参照して、語尾部分の信号成分について説明する。図3は、雑音参照信号Y(t)および音声信号Xm(t)の波形を示す図である。図3に示すように、音声信号Xm(t)の音声区間は、雑音参照信号Y(t)に対して遅延している。これは、図13および数式1に示したように、マイクロフォンで収音して生成される音声信号には、話者が発声する音声S(ω)の他に、スピーカで拡声され、空間伝播してマイクロフォンに再び混入する音声Y(ω)*R(ω)が含まれるためである。つまり、混入する音声Y(ω)*R(ω)は、空間伝播する分だけスピーカ18の拡声音より遅延しているためである。これは、第1のマイクロフォン11aおよび第2のマイクロフォン11bから音声信号が入力される場合ついても同様である。このように、音声信号Xm(t)には、空間伝播して第1のマイクロフォン11aおよび/または第2のマイクロフォン11bに再び混入される遅延した音声Y(ω)*R(ω)の信号成分が含まれている。つまり、図3に示す語尾部分には、空間伝播して第1のマイクロフォン11aおよび/または第2のマイクロフォン11bに再び混入する信号成分のみが含まれていることになる。語尾検出部15が上記語尾部分を検出することで、後述する支配率算出部16は、空間伝播して第1のマイクロフォン11aおよび/または第2のマイクロフォン11bに再び混入される信号成分のみに基づいた支配率を算出することができる。語尾検出部15の具体的な検出方法としては、例えば音声信号Xm(t)および雑音参照信号Y(t)の波形のパワーエンベロープを用いる方法がある。各パワーエンベロープ(立ち上がり部分を除く)を用いて、その比率を常に観察することで、語尾部分を検出することができる。また例えば、語尾検出部15が雑音参照信号Y(t)および音声信号Xm(t)を時系列的に比較する。そして、語尾検出部15が各パワーエンベロープの立ち下がりを検出して、それらの差分を語尾部分としてもよい。語尾検出部15において検出された語尾(遅延した部分)の情報は、支配率算出部16およびハウリング抑制部17に送られる。
支配率算出部16は、レベル検出部14から出力された各音声信号のレベルと、語尾検出部15において検出された語尾とに基づいて、入力された複数の音声信号(図1では、Xm1(t)およびXm2(t))の支配率をそれぞれ算出する。なお、支配率算出部16は、語尾検出部15で検出された語尾の区間でのみ支配率の算出処理を行う。以下、支配率の算出方法について具体的に説明する。なお、支配率とは、複数の音声信号それぞれについてハウリングを発生させる危険度を示すものである。
レベル検出部14で算出されたレベルのうち、語尾の区間のパワースペクトルをループゲインGとする。そして、音声信号Xm1(t)のループゲインをG1(ω)、音声信号Xm2(t)のループゲインをG2(ω)とする。同様に、第n(nは自然数)のマイクロフォンから入力され、音特性調整部12で周波数やゲイン特性を調整された音声信号Xmn(t)とする。このとき、当該Xmn(t)のループゲインGn(ω)は、数式7と表現できる。
Figure 2005125273
そして、支配率算出部16は、各音声信号のレベルから語尾の区間のレベルであるループゲインGを抽出し、各音声信号に対する支配率として例えば全音声信号のループゲインの和と各音声信号のループゲインとの比をそれぞれ算出する。例えば、図1では、ループゲインの和はG1(ω)+G2(ω)である。したがって、音声信号Xm1(t)に対する支配率は、和(G1(ω)+G2(ω))とG1(ω)との比として表現される。また、音声信号Xm2(t)に対する支配率は、和(G1(ω)+G2(ω))とG2(ω)との比として表現される。このように支配率算出部16は、図4に示すように、語尾の区間において、帯域毎にどの音声信号のループゲインが支配的であるかを、帯域毎のループゲインの大小をもとに支配率として判定することができる。図4は、ループゲインG1(ω)、G2(ω)、およびループゲインの和(G1(ω)+G2(ω))のスペクトラムの一例を示す図である。図4の一例では、周波数fより大きい周波数帯域でG2(ω)の支配率が高くなり、G2(ω)が支配的であることが判定される。また、周波数f未満の周波数帯域ではG1(ω)の支配率が高くなり、G1(ω)が支配的であることが判定される。
このように、空間伝播される信号成分のみが含まれる語尾の区間に対して、支配率算出部16は、各音声信号の支配率が算出することによってどの音声信号が支配的であるかを検出することができる。ここで、空間伝播される信号成分は、ハウリングの発生原因となる信号成分である。したがって、支配率算出部16は、例えば図13に示すR1(ω)の経路で伝わる音が支配的なのか、あるいはR2(ω)の経路で伝わる音が支配的なのかをハウリング発生前に検出することができる。そして、支配的である音声信号ほどハウリングを発生させる危険度が高い。なお、音特性調整部12、音混合部13、レベル検出部14、語尾検出部15、および支配率算出部16は、本発明におけるハウリング検出装置に相当するものである。そして、本発明におけるハウリング検出装置は、上記支配率を算出することで、複数の音声信号それぞれについてハウリングを発生させる危険度を検出することができる。
なお、算出された支配率が語尾を検出するたびに所定の方式によって学習し更新される仕組みにすれば、マイクロフォンの位置変化などによる支配率の逐次変化にも対応できるようになる。また、支配率を学習するタイミングとしては、語尾が検出されるたびに行うことに限定されず、推定の逐次性および正確性を考慮して適宜調整されてもよい。
ハウリング抑制部17は、音混合部13において混合された音声信号Xm(t)に対して、ハウリングを抑制する信号処理を行う。信号処理された音声信号は、適宜増幅されてスピーカ18によって拡声される。以下、図5を参照して、ハウリング抑制部17の処理方法について具体的に説明する。図5は、ハウリング抑制部17の構成の一例を示すブロック図である。ここでは、図5に示すように、2入力型サブトラクション構成を採用している。2入力型サブトラクション構成は、雑音参照信号として拡声対象の音声信号を用いることで、拡声対象の音声信号に含まれる語尾に応じて伝達特性を学習しながら、ハウリングの発生を抑圧することができる。図5において、ハウリング抑制部17は、第1のパワースペクトル算出部171、第2のパワースペクトル算出部172、伝達特性算出部173、逆フーリエ変換部174、および畳み込み部175を有する。
図5において、第1のパワースペクトル算出部171は、音混合部13から出力された音声信号Xm(t)を入力とし、音声信号Xm(t)のパワースペクトルX(ω)を算出する。第2のパワースペクトル算出部172は、雑音参照信号Y(t)を入力とし、雑音参照信号Y(t)のパワースペクトルY(ω)を算出する。なお、雑音参照信号Y(t)とする拡声対象の音声信号は、例えばスピーカ18において拡声される直前の音声信号である。また例えば、スピーカ18の近傍で拡声された音声をマイクロフォンなどで収音して生成される音声信号であってもよい。
伝達特性算出部173は、まず、音声信号Xm(ω)と雑音参照信号Y(ω)とに基づいて、パワースペクトル比率Hr(ω)を語尾検出部15において検出された語尾の区間でのみ推定する。パワースペクトル比率Hr(ω)は数式(8)で表現される。
Figure 2005125273
なお、εは平均を意味する。そして、伝達特性算出部173は、数式(8)で推定したパワースペクトル比率Hr(ω)に基づいて、数式(9)に示す伝達特性Hsup(ω)を算出する。
Figure 2005125273
このように、本発明において、Hsup(ω)は、語尾の区間に含まれる信号と同じ成分を有する信号を除いた音声信号Xm(t)を推定する関数である。
次に、伝達特性算出部173は、数式9で算出したHsup(ω)に、支配率算出部16で算出された各音声信号のループゲインおよび支配率に基づいて得られるループゲインの和の変化率を乗算して、Hsup(ω)を算出する。以下、Hsup(ω)の算出方法について説明する。
例えば、ユーザが音特性調整部12および音混合部13においてミキサ操作を行って、音声信号X1(t)およびX2(t)の周波数やゲインの特性をそれぞれ変更したとする。この操作に応じて、音声信号Xm1(t)における周波数やゲインの特性M1(ω)と、音声信号Xm2(t)における周波数やゲインの特性M2(ω)とが変化する。このとき、数式7に示すように、ループゲインG1(ω)およびG2(ω)も変化する。ここで、ミキサ操作前に支配率算出部16で算出されたループゲインG1(ω)の支配率がループゲインG2(ω)よりも高いとする。また、ミキサ操作後に支配率算出部16で算出されたループゲインG1(ω)をループゲインG1new(ω)とし、ミキサ操作前に支配率算出部16で算出されたループゲインG1(ω)をループゲインG1old(ω)とする。また、ミキサ操作後に支配率算出部16で算出されたループゲインG2(ω)をループゲインG2new(ω)とし、ミキサ操作前に支配率算出部16で算出されたループゲインG2(ω)をループゲインG2old(ω)とする。
このとき、ミキサ操作前に支配率算出部16で算出されたループゲインの和は、G1old(ω)+G2old(ω)となる。これに対し、ミキサ操作後に支配率算出部16で算出されるループゲインの和は、ミキサ操作前に算出された支配率のうち、最も高い支配率のループゲインのみを考慮した和とする。つまり上述では、ループゲインG1(ω)の支配率がループゲインG2(ω)より高いとしたので、ミキシング操作後に支配率算出部16で算出されたループゲインの和はG1new(ω)+G2old(ω)となる。このとき、ループゲインの和の変化率Lr(ω)は、数式10となる。
Figure 2005125273
このように、支配率算出部16で算出された各音声信号のループゲインおよび支配率に基づいて、ループゲインの和の変化率Lr(ω)が求まる。つまり、ループゲインの和の変化率Lr(ω)としては、支配率が最も高いループゲインG1(ω)の変化に応じて、ループゲインの和(G1(ω)old+G2(ω)old)が和(G1(ω)new+G2(ω)old)に変化したことが予想できる。なお、上述では支配率が最も高いループゲインのみ、ループゲインの和に反映させるとした。これは、ユーザのミキサ操作として、2つ以上の音声信号のゲインを同時に変更したりする操作は稀であるため、ループゲインの和の変化率Lr(ω)が支配率の高いものだけに追随するものであっても、ロバストなハウリングの抑制を行うことができることに基づいている。このように、支配率が最も高いループゲインを、ループゲインの和に反映させることで、複数の音声信号が入力される場合であっても、ハウリングを発生させる危険度が高い音声信号のみを考慮した効率的、かつロバストなハウリング抑制を実現することができる。
伝達特性算出部173は、数式(10)に示すループゲインの和の変化率を数式(9)で算出した伝達特性Hsup(ω)に乗じて、和の変化率に応じた伝達特性Hsup_new(ω)を算出する。なお、伝達特性Hsup(ω)をHsup_old(ω)とし、和の変化率に応じた伝達特性をHsup_new(ω)とする。このとき、和の変化率に応じた伝達特性Hsup_new(ω)は、数式(11)で表現される。
Figure 2005125273
このように、本発明においては、和の変化率に応じた伝達特性Hsup_new(ω)は、推定された関数であるHsup(ω)_oldに和の変化率が乗算された伝達特性である。
数式(11)で更新されたHsup_new(ω)は、逆フーリエ変換部174において、時間軸上に変換される。このHsup_new(ω)の時間軸上に変換されたものをフィルタ係数Hsup_new(t)とする。畳み込み部175は、フィルタ係数Hsup_new(t)を音混合部13から入力される音声信号Xm(t)に畳み込みこむことで、上記語尾検出部15において検出された語尾の区間のみの信号と同じ成分のみを含む信号を音声信号Xm(t)から減算する。なお、Hsup(ω)の算出(数式9)および更新(数式11)は、語尾検出部15において語尾が検出されたときに行われる。また、Hsup(ω)の算出(数式(9)および数式(11))の学習は、例えば語尾を検出するたびに所定の方式によって行うようにしてもよい。
以上のように、本実施形態によれば、支配率算出部16において各音声信号のループゲインおよび支配率を算出して、当該支配率に基づいたループゲインの和の変化率を用いた伝達特性を算出する。また、当該支配率は、音特性調整部12の出力信号に基づいて算出されるので、音特性調整部12において調整される周波数やゲインの特性に連動した値である。これにより、複数の音声信号を混合して拡声する拡声システムにおいて、上記支配率に基づいてハウリング抑制に用いる伝達特性を算出することで、音特性調整部12よる伝達特性の急激な変化に対してロバストなハウリングの抑制を行うことができる。つまり、ユーザのミキサ操作によるM(ω)の急激な変化に対して、ロバストなハウリングの抑制を実現することができる。
なお、上述では、ミキサ操作前に支配率算出部16で算出した支配率のうち、最も高い支配率であるループゲインのみの時間変化分からループゲインの和を推定するとしたが、これに限定されない。例えば、支配率が相対的に高い複数のループゲインをループゲインの和に反映させてもよい。例えば、マイクロフォンが3つあるとし、それぞれのループゲインをG1(ω)、G2(ω)、およびG3(ω)とする。そして、ミキサ操作前の支配率の関係が、ループゲインG1(ω)およびG2(ω)がループゲインG3(ω)より高いとする。そして、ループゲインG1(ω)およびG2(ω)をループゲインの和(G1(ω)+G2(ω)+G3(ω))に反映させてもよい。このとき、ループゲインの和の変化率Lr(ω)は、数式12となる。
Figure 2005125273
また、伝達特性算出部173は、支配率算出部16で算出された支配率を用いて、当該支配率を各音声信号のループゲインそれぞれに反映させて、ループゲインの和の変化率を求めてもよい。また例えば、伝達特性算出部173は、支配率に基づいて、ループゲインの和の変化率以外の他の方法でハウリング抑制に用いる伝達特性を算出してもよい。
なお、上述した拡声システム1においては、2つの音声信号が入力された場合について説明したが、これに限定されない。例えば、3つ以上のマイクロフォンを有して3つ以上の音声信号が入力される場合であってもよい。また、上述したハウリング抑制部17において、サブトラクションの具体的構成を図5に示したが、これに限定されない。畳み込みによるフィルタ方式以外のサブトラクション手法も数多く知られており、これらの手法を用いる構成であってもよい。
また、上述では、レベル検出部14では、各音声信号についてそれぞれ周波数分析を行って、レベルをパワースペクトルとして算出したが、これに限定されない。例えば、レベル検出部14では、所定時間毎の各音声信号のパワーをスカラー値として算出されてもよい。この場合、支配率算出部16では、各音声信号の支配率はスカラー値で算出される。また、ループゲインの和の変化率Lr(ω)もスカラー値で表現される。
(第2の実施形態)
図6を参照して、本発明における第2の実施形態に係るハウリング検出方法および抑制方法を採用した拡声システム2について説明する。図6は、拡声システム2の構成例を示すブロック図である。図6において、拡声システム2は、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、ハウリング発生検出部21、支配率算出部16、ハウリング抑制部22、およびスピーカ18を有する。なお、第1の実施形態においては、各音声信号の支配率を語尾区間でのみ算出するとしたが、本実施形態ではハウリングが検出されたときに算出する点で異なる。以下、異なる点を中心に説明する。また、第1の実施形態と同様に、拡声システム2は3つ以上のマイクロフォンを用いて拡声するシステムでもよいが、ここでは2つのマイクロフォンを用いて拡声する場合を想定して説明する。
図6において、第1のマイクロフォン11aは、スピーカ18において拡声するための音声を収音して音声信号を生成する。この第1のマイクロフォン11aで生成された音声信号をX1(t)とする。また、第2のマイクロフォン11bでも同様に、拡声するための音声を収音して音声信号X2(t)を生成する。音特性調整部12は、音声信号X1(t)およびX2(t)を入力とし、当該音声信号の周波数やゲインの特性をそれぞれ調整する。そして、周波数やゲインの特性を調整された音声信号Xm1(t)およびXm2(t)は、当該音混合部13において混合される。また、レベル検出部14は、音特性調整部12から出力される音声信号Xm1(t)およびXm2(t)の各レベルを検出する。そして、レベル検出部14で検出された各所定時間における帯域毎のレベルの情報は、全て支配率算出部16に出力される。ここまでの処理は、上述した第1の実施形態と同様である。
ハウリング発生検出部21は、音混合部13で混合された音声信号Xm(t)のパワースペクトルXm(ω)を算出して、ハウリングの発生を検出する。例えば特定周波数fにおいてハウリングが発生すると仮定すると、音声信号Xm(t)のパワースペクトルX(ω)は、図13で示したように特定周波数fにおいてパワーが急激に増加するように変化する。そこで、隣接する帯域間のパワーの差分を常に観察することで、特定周波数fが含まれる帯域のパワーが急激に増加したことが検出される。つまり、音声信号Xm(t)のパワースペクトルX(ω)を観察して、ハウリングの初期発生(ハウリングが起こりかかっている状態)を検出する。そして、ハウリング発生検出部21で検出されたハウリングの初期発生時の情報は、支配率算出部16に出力される。
支配率算出部16は、レベル検出部14から出力された各音声信号のレベルと、ハウリング発生検出部21において検出された情報とに基づいて、入力された複数の音声信号(図6では、Xm1(t)およびXm2(t))の支配率をそれぞれ算出する。なお、支配率算出部16は、ハウリング発生検出部21においてハウリングの初期発生が検出されたときの支配率の算出処理を行う。そして、レベル検出部14で算出されたレベルのうち、ハウリングの初期発生が検出されたときのパワースペクトルがループゲインGとなる。以下、支配率の具体的な算出方法は、第1の実施形態と同様であるので説明を省略する。また、本実施形態においては、支配率算出部16において各音声信号の支配率が算出されることで、ハウリングの初期発生時において、どの音声信号が支配的であるかを検出することができる。また、本実施形態における支配率とは、上述した第1の実施形態と同様に、複数の音声信号それぞれについてハウリングを発生させる危険度を示すものである。このように、音特性調整部12、音混合部13、レベル検出部14、ハウリング発生検出部21、および支配率算出部16は、本発明におけるハウリング検出装置に相当するものである。つまり、本発明におけるハウリング検出装置は、上記支配率を算出することで、複数の音声信号それぞれについてハウリングを発生させる危険度を検出することができる。
ハウリング抑制部22は、音混合部13において混合された音声信号Xm(t)に対して、ハウリングを抑制する信号処理を行う。そして、信号処理された音声信号は、適宜増幅されてスピーカ18によって拡声される。以下、図7を参照して、ハウリング抑制部22の処理方法について説明する。図7は、第2の実施形態におけるハウリング抑制部22の構成の一例を示すブロック図である。図7において、ハウリング抑制部22は、第1のパワースペクトル算出部171、第2のパワースペクトル算出部172、伝達特性算出部173、逆フーリエ変換部174、畳み込み部175、および語尾検出部176を有する。なお、上述したハウリング抑制部17においては語尾検出部15から語尾情報を参照していたが、ハウリング抑制部22は、語尾検出部176を新たに備え、当該語尾検出部176から語尾情報を参照する点で異なる。以下、異なる点を中心に説明する。
図7において、第1のパワースペクトル算出部171は、音混合部13から出力された音声信号Xm(t)を入力とし、音声信号Xm(t)のパワースペクトルX(ω)を算出する。第2のパワースペクトル算出部172は、雑音参照信号Y(t)を入力とし、雑音参照信号Y(t)のパワースペクトルY(ω)を算出する。
語尾検出部176は、上述した語尾検出部15と同様の機能を有する。語尾検出部176は、音混合部13から入力される音声信号Xm(t)と、雑音参照信号Y(t)とに基づいて、雑音参照信号Y(t)に対する音声信号Xm(t)の音声区間の遅延区間を語尾として検出する。なお、雑音参照信号Y(t)としては、上述した第1の実施形態と同様に、例えばスピーカ18において拡声される直前の音声信号などである。また、図7において、語尾検出部176は、ハウリング抑制部17の内部に構成するものとしたが、ハウリング抑制部17の外部にあってもよい。また、ハウリング抑制部17と語尾検出部176は別体として、ハウリング抑制部17が語尾検出部176で検出される情報を入力するようにしてもよい。
伝達特性算出部173は、まず、音声信号Xm(ω)と雑音参照信号Y(ω)とに基づいて、数式8で示すパワースペクトル比率Hr(ω)を語尾検出部176において検出された語尾の区間でのみ推定する。そして、伝達特性算出部173は、数式8で推定したパワースペクトル比率Hr(ω)に基づいて、数式(9)に示す伝達特性Hsup(ω)を算出する。次に、伝達特性算出部173は、数式(9)で算出した伝達特性Hsup(ω)に、支配率算出部16で算出された各音声信号のループゲインおよび支配率に基づいて得られるループゲインの和の変化率を乗算して、変化率に応じた伝達特性Hsup(ω)_newを算出する。そして、数式11で算出された変化率に応じた伝達特性Hsup_new(ω)は、逆フーリエ変換部174において、時間軸上に変換される。畳み込み部175は、この時間軸上に変換されたフィルタ係数Hsup_new(t)を音混合部13から入力される音声信号Xm(t)に畳み込み、上記語尾検出部15において検出された語尾の区間のみの信号と同じ成分のみを含む信号を音声信号Xm(t)から減算する。この場合、変化率に応じた伝達特性Hsup(ω)_newは、ハウリングの初期発生時のループゲインを用いて求められるループゲインの和の変化率に基づいている。このため、ハウリングの初期発生が起こっている音声信号およびその周波数成分を考慮したハウリング抑制を行うことができる。
なお、本実施形態においては、Hsup(ω)の算出(数式(9))は、語尾検出部176において語尾が検出されたときに行われる。支配率に基づいたループゲインの和の変化率によるHsup(ω)の更新(数式(11))は、ハウリング発生検出部21でハウリングの初期発生が検出されたときに行われる。また、数式9で算出されたHsup(ω)の学習は、例えば語尾が検出されるたびに所定の方式によって行うようにしてもよい。また、数式11で算出されるHsup(ω)の学習は、例えばハウリングの初期発生を検出するたびに所定の方式によって行うようにしてもよい。
以上のように、本実施形態によれば、支配率算出部16においてハウリングの初期発生時の各音声信号のループゲインおよび支配率を算出する。そして、当該支配率に基づいたループゲインの和の変化率で伝達特性を算出する。また、当該支配率は、音特性調整部12の出力信号に基づいて算出されるので、音特性調整部12において調整される周波数やゲインの特性に連動した値である。これにより、複数の音声信号を混合して拡声する拡声システムにおいて、上記支配率に基づいてハウリング抑制に用いる伝達特性を算出することで、音特性調整部12よる伝達特性の急激な変化で発生するハウリングに対して、ロバストなハウリングの抑制を行うことができる。つまり、ユーザのミキサ操作によるM(ω)の急激な変化によってハウリングが発生しかかっても、ロバストなハウリングの抑制を実現することで、結果的にハウリングの発生を防止することができる。
(第3の実施形態)
図8および図9を参照して、本発明における第3の実施形態に係るハウリング検出方法を採用したハウリング警告装置について説明する。図8は、ハウリング警告装置の構成例を示すブロック図である。図8において、ハウリング警告装置は、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、語尾検出部15、支配率算出部16、スピーカ18、およびハウリング警告部31を有する。
図9は、ハウリング発生検出部21を用いたハウリング警告装置の構成例を示すブロック図である。図9において、ハウリング警告装置は、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、ハウリング発生検出部21、支配率算出部16、スピーカ18、およびハウリング警告部31を有する。図8および図9に示すように、本実施形態では、上述した第1および第2の実施形態におけるハウリング抑制部17および22に代わって、ハウリング警告部31を備える点で異なる。換言すれば、上述した本発明におけるハウリング検出装置にハウリング警告部31を備えたものである。以下、異なる点を中心に説明する。また、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、語尾検出部15、支配率算出部16、ハウリング発生検出部21、およびスピーカ18は、上述した第1および第2の実施形態と同様であるので、同一の符号を付して説明を省略する。
図8において、ハウリング警告部31は、支配率算出部16において算出された語尾区間に基づく支配率に応じて、どの音声信号が原因でハウリングが発生する危険があるかをユーザに警告する。警告するための表示手段としては、例えば音声信号の周波数やゲインの特性を調整するミキサの各チャンネルにランプを設置して、ハウリングが発生する可能性があるチャンネルに対して点滅などさせる手段などがある。そして、例えば支配率が最も高い(ハウリングを発生させる危険度が高い)音声信号のチャンネルのランプを点滅させる。また、例えば支配率が高い複数のチャンネルのランプを点滅させてもよい。また、支配率が周波数帯域毎に算出される場合には、各チャンネルに対して周波数帯域ごとのランプを設け、帯域毎にランプを点滅させてもよい。また、表示手段としては、上記ランプに限らず、ディスプレイ上に表示するものであってもよいし、その他の表示手段であってもよい。また、警告するだけではなく、警告に応じて自動的に音特性調整部12で音特性を変更し(例えば、ゲインが下げ)、ハウリングを未然に防止するようにしてもよい。
また、図9に示すように、ハウリングの初期発生に基づく支配率に応じて、どの音声信号が原因でハウリングが発生する危険があるかをユーザに警告するものであってもよい。図9において、ハウリング警告部31は、支配率算出部16において算出されたハウリングの初期発生に基づく支配率を参照することで、どの音声信号でハウリングの初期発生が起きているかをユーザに警告することができる。
以上のように、本実施形態では、ハウリング警告部31において、支配率算出部16において算出された支配率に応じて、どの音声信号が原因でハウリングが発生する危険があるか、またはどの音声信号でハウリングの初期発生が起きているかをユーザに警告する。これにより、ユーザは、入力される音声信号が複数あっても、ハウリングの発生を未然に防止しながら、ミキサ操作などを各音声信号に対して行うことができる。
また、上述した第1〜第3の実施形態で説明した各構成部のうち少なくとも一部の構成は、集積回路でも実現可能である。以下、各実施形態について具体例を説明する。上述した第1の実施形態で説明したレベル検出部14、語尾検出部15、支配率算出部16、およびハウリング抑制部17は、例えば、音特性調整部12から出力される音声信号(図1では、Xm1(t)およびXm2(t))、音混合部13から出力される音声信号(図1では、Xm(t))、および雑音参照信号(図1では、Y(t))を入力とし、音声信号処理結果を適宜増幅部などで増幅して、スピーカ18へ出力する集積回路でも実現可能である。また、上述した第2の実施形態で説明したレベル検出部14、ハウリング発生検出部21、支配率算出部16、およびハウリング抑制部17は、例えば、音特性調整部12から出力される音声信号(図6では、Xm1(t)およびXm2(t))、音混合部13から出力される音声信号(図6では、Xm(t))、および雑音参照信号(図6では、Y(t))を入力とし、音声信号処理結果を適宜増幅部などで増幅して、スピーカ18へ出力する集積回路でも実現可能である。また、上述した第3の実施形態の図8において説明したレベル検出部14、語尾検出部15、および支配率算出部16は、例えば、音特性調整部12から出力される音声信号(図8では、Xm1(t)およびXm2(t))と、音混合部13から出力される音声信号(図8では、Xm(t))とを入力とし、音声信号処理結果をハウリング警告部31へ出力する集積回路でも実現可能である。また、上述した第3の実施形態の図9において説明したレベル検出部14、ハウリング発生検出部21、および支配率算出部16は、例えば、音特性調整部12から出力される音声信号(図9では、Xm1(t)およびXm2(t))と、音混合部13から出力される音声信号(図9では、Xm(t))とを入力とし、音声信号処理結果をハウリング警告部31へ出力する集積回路でも実現可能である。このように上述した第1〜第3の実施形態では、上述した各機能を果たす電気回路を1つの小型パッケージに集積して、例えば音声信号処理回路DSP(Digital Signal Processor)等を構成することによって、本発明の実現が可能となる。
本発明にかかるハウリング検出装置およびその方法は、支配率を算出することで、複数の音声信号それぞれについて、ハウリングを発生させる危険度を検出することが可能な複数の音声信号を混合して拡声する拡声システムや、音声ミキサ機能つきPA装置等にも有用である。
本発明は、ハウリング検出装置およびその方法に関し、より特定的には、複数の音声信号を混合して拡声する拡声システムにおいて、当該複数の音声信号それぞれについて、ハウリングを発生させる危険度を検出するハウリング検出装置およびその方法に関する。
従来、マイクロフォンで収音した音声信号を拡声する拡声システムにおいて、ハウリングの発生を検出し、当該ハウリングを抑制するハウリング抑制装置が開発されている。従来のハウリング抑制装置としては、適用フィルタやノッチフィルタなどを用いたハウリング抑制装置が知られている(例えば、特許文献1および特許文献2参照)。
以下、図10を参照して、複数の音声信号を入力として当該複数の音声信号を混合して拡声する拡声システムにおいて、従来のハウリング抑制装置を採用した場合について説明する。図10は、複数の音声信号を混合して拡声する拡声システム9において上記特許文献1および特許文献2に開示されたハウリング抑制装置を採用した構成例を示す図である。なお、図10では、スピーカと複数のマイクロフォンとが同一の音場にあるときに発生するハウリングを抑制する場合の構成例を示している。また、ここでは複数の音声信号として、2つのマイクロフォンから2つの音声信号が入力されるとする。
図10において、拡声システム9は、第1のマイクロフォン91a、第2のマイクロフォン91b、音特性調整部92、音混合部93、ハウリング抑制部94、およびスピーカ95を有する。音特性調整部92は、第1のマイクロフォン91aで収音して生成された音声信号を入力とし、当該音声信号の周波数やゲインの特性を調整する。同様に、第2のマイクロフォン91bで収音して生成された音声信号は、音特性調整部92において周波数やゲインの特性が調整される。そして、調整された各音声信号は、音混合部93において混合される。なお、音特性調整部92および音混合部93は、例えば図11に示すような市販のミキサなどに相当する。図11は、音特性調整部92および音混合部93の構成例を示すブロック図である。図11において、音特性調整部92は、例えばイコライザ921a、イコライザ921b、増幅部922a、および増幅部922bを有する。イコライザ921aは、第1のマイクロフォン91aで収音して生成された音声信号の周波数特性を調整する。増幅部922aは、イコライザ921aで調整された音声信号のゲインを調整する。同様に、イコライザ921bおよび増幅部922bは、第2のマイクロフォン91bで収音して生成された音声信号の周波数やゲインの特性を調整する。このように音特性調整部92では、通常のミキサと同様に、第1および第2のマイクロフォン91aおよび92bで収音された各音声信号の周波数やゲインの特性がそれぞれ独立して調整される。音混合部93において混合された音声信号は、ハウリング抑制部94に入力される。
ハウリング抑制部94は、音混合部93において混合された音声信号に対して、ハウリングを抑制する信号処理を行う。そして、信号処理された音声信号は、適宜増幅されてスピーカ95によって拡声される。なお、ハウリング抑制部94は、ハウリングを抑制するハウリング抑制装置に相当する。そして、上述したように、当該拡声システムは、上記特許文献1または特許文献2で開示されたハウリング抑制方式を採用している例であるため、ハウリング抑制部94として適応フィルタまたはノッチフィルタを用いている。
図12は、適応フィルタ941を用いたハウリング抑制部94の構成例を示すブロック図である。この場合、ハウリング抑制部94は、ハウリング抑制部94から出力される音声信号(拡声対象である音声信号)に基づいて、当該音声信号が出力されたときのみ、空間伝達特性などの伝達特性を推定する。そして、適用フィルタ941は、推定した伝達特性を拡声対象である音声信号に乗じて、音混合部93から出力された音声信号から減算する。これにより、ハウリングの発生を抑制することができる。
また、ハウリング抑制部94としてノッチフィルタを用いる場合もある。図13は、音混合部93から出力された音声信号のパワースペクトルX(ω)のハウリング発生時の変化を示す図である。例えば、特定周波数fにおいてハウリングが発生すると仮定する。このとき、図13に示すパワースペクトルX(ω)は、特定周波数fにおいてパワーが急激に増加するように変化する。そこで、隣接する帯域間のパワーの差分を常に観察することで、特定周波数fが含まれる帯域のパワーが急激に増加したことが検出される。つまり、ハウリングが発生する周波数を検出することができる。このとき、ノッチフィルタの減衰する周波数を特定周波数fに設定する。そして、音混合部93から出力された音声信号を特定周波数fで減衰するノッチフィルタに通過させることで、特定周波数fのパワーは減衰する。その結果、ハウリングの発生が抑制される。
特許第2039846号公報 特許第2560923号公報
ここで、図14を参照して、適用フィルタを用いたハウリング抑制部94が推定するべき理想的な伝達特性について考える。図14は、1入力時の拡声システム9において、伝達特性に関係する各構成の特性を模式的に示した図である。ここでは、まずマイクロフォン91が1つの場合について考える。また、図14において、マイクロフォン91の収音対象となる音声をS(ω)、マイクロフォン91で収音して生成された音声信号をX(ω)、音特性調整部92において調整される周波数やゲインの特性をM(ω)、ハウリング抑制部94で推定するべき理想的な伝達特性をHhat(ω)、ハウリング抑制部94から出力される音声信号をY(ω)、スピーカ95からマイクロフォン91までの空間伝達特性をR(ω)とする。このとき、マイクロフォン91で収音して生成された音声信号X(ω)は数式(1)で表現される。
Figure 2005125273
なお、R(ω)には、上記空間の伝達特性だけでなく、マイクロフォン91自体の特性、スピーカ95自体の特性、およびハウリング抑制部94の出力とスピーカ95との間で適宜増幅された場合のその増幅特性などが含まれてもよい。また、ハウリング抑制部94では、音特性調整部92において調整された音声信号M(ω)*X(ω)がハウリング抑制部94の出力音声信号Y(ω)に伝達特性Hhat(ω)を乗じたもので減算する処理が行われ、数式(2)が成立する。
Figure 2005125273
数式(1)および数式(2)を変形すると、数式(3)が得られる。
Figure 2005125273
数式(3)において、第2項がハウリングに起因する項である。したがって、理想的な伝達特性Hhat(ω)は、数式(4)を満たす伝達特性となる。
Figure 2005125273
伝達特性Hhat(ω)が数式(4)の関係を満たすことによって、数式(3)の第2項がほぼゼロとなる。これにより、ハウリング抑制部94は、ハウリングの発生を抑制することができる。
次に、図15を参照して、複数の音声信号を混合する場合について考える。図15は、複数入力時の拡声システム9において、伝達特性と関係する各構成の特性を模式的に示した図である。図15において、第1のマイクロフォン91aの収音対象となる音声をS1(ω)、音特性調整部92において調整される周波数やゲインの特性をM1(ω)、スピーカ95から第1のマイクロフォン91aまでの空間伝達特性をR1(ω)とする。同様に、第nのマイクロフォンの収音対象となる音声をSn(ω)、音特性調整部92において調整される周波数やゲインの特性をMn(ω)、スピーカ95から第nのマイクロフォン92cまでの空間伝達特性をRn(ω)とする。このとき、数式(3)は数式(5)と表現される。なお、nは自然数であり、マイクロフォンの本数を示す。
Figure 2005125273
数式(5)において、第2項がハウリングに起因する項である。したがって、推定されるべき理想的な伝達特性Hhat(ω)は、数式(6)を満たす伝達特性となる。
Figure 2005125273
数式(6)に示すように、複数の音声信号がもつ空間伝達特性R(ω)は、それぞれ固有の値である。また、空間伝達特性R(ω)は、マイクロフォンの位置によって変化する値である。つまり、理想的な伝達特性を適切に推定するためには、複数の音声信号それぞれの空間伝達特性R(ω)を考慮する必要がある。しかしながら、従来においては、伝達特性はハウリング抑制部94の出力信号に基づいて推定される。つまり、ハウリング抑制部94の出力信号は、複数の音声信号が混合された音声信号に基づく信号であり、複数のマイクロフォンそれぞれの空間伝達特性R(ω)が考慮された信号ではない。したがって、従来においては、空間伝達特性R(ω)の変化に対して上記伝達特性の推定速度が追いつかず、ハウリングの発生を適切に抑制することができないという問題があった。
また、数式(6)に示すように、推定されるべき理想的な伝達特性Hhat(t)は、複数のマイクロフォンそれぞれのM(ω)やR(ω)によって決まる値である。つまり、理想的な伝達特性Hhat(ω)は、M(ω)が変化すると、それに伴い変化する値である。ここで、上記適用フィルタ941では、ハウリング抑制部94の出力信号に基づいて、収束しながら伝達特性が推定される。このため、M(ω)が急激に変化して理想的な伝達特性Hhat(ω)も急激に変化した場合には、上記伝達特性の推定速度が追いつかず、ハウリングの発生を適切に抑制することが困難であった。
また、複数のマイクロフォンを有する場合、上述したようにM(ω)およびR(ω)の値は、マイクロフォンが1つのときと比べて変化しやすいので、ハウリングが発生する特定周波数fも変化しやすい。これにより、ハウリング抑制部94として上記ノッチフィルタを用いた場合にも、この特定周波数fの変化にノッチフィルタの減衰する周波数の設定が追いつかず、ハウリングの発生を適切に抑制することが困難であった。
このように、複数の音声信号を混合して拡声する拡声システムにおいては、複数の音声信号それぞれについて、ハウリングの発生する危険度(例えば、上記M(ω)やR(ω)の変化など)を考慮しなければ、ハウリングの発生を適切に抑制することができないという課題があった。
また、従来においてハウリングの発生をユーザに警告する場合、入力された音声信号のパワースペクトルにおいて、隣接する帯域間のパワーの差分を常に観察してハウリングの発生を検出し、ユーザに警告する方法が知られている。しかしながら、複数の音声信号を混合して拡声する拡声システムにおいては、混合された音声信号のパワースペクトルに基づいてハウリングの発生を検出することとなる。したがって、従来においては、複数入力される音声信号のうちどの音声信号がハウリングを発生させたのか、もしくは発生させる危険があるのかを特定して警告することが不可能であった。
それ故、本発明においては、複数の音声信号を混合して拡声する拡声システムにおいて、当該複数の音声信号それぞれについて、ハウリングを発生させる危険度を検出することを目的とする。さらに、本発明においては、当該危険度の情報に基づいて適切な伝達特性を推定し、音特性調整部による伝達特性の急激な変化に対してロバストなハウリングの発生の抑制を行うことを目的とする。また、本発明においては、複数入力される音声信号のうちどの音声信号がハウリングを発生させたのか、もしくは発生させる危険があるのかを特定して警告する方法を提供することを目的とする。
本発明の第1の発明は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出装置であって、複数の前記音声信号のレベルをそれぞれ検出するレベル検出部と、前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出部とを備える。
本発明の第2の発明は、上記第1の発明において、前記ハウリング検出装置は、前記支配率を用いて算出された伝達特性に基づいて、前記語尾の区間に含まれる信号と同じ成分を有する信号を前記混合信号から減算して前記スピーカに出力するハウリング抑制部を、さらに備える。
本発明の第3の発明は、上記第2の発明において、前記ハウリング抑制部は、前記語尾の区間に含まれる信号と同じ成分を有する信号を除いた前記混合信号を推定する関数を設定し、前記支配率に応じて前記総和を更新し、当該更新前後の総和の変化率を前記関数に乗じて前記伝達特性を算出することを特徴とする。
本発明の第4の発明は、上記第3の発明において、前記ハウリング抑制部は、相対的に高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする。
本発明の第5の発明は、上記第3の発明において、前記ハウリング抑制部は、最も高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする。
本発明の第6の発明は、上記第1の発明において、前記ハウリング検出装置は、前記支配率算出部において算出された支配率が相対的に高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
本発明の第7の発明は、上記第1の発明において、ハウリング検出装置であって、前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
本発明の第8の発明は、上記第1の発明において、前記レベル検出部は、複数の前記音声信号レベルをパワースペクトルでそれぞれ検出することを特徴とする。
本発明の第9の発明は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出装置であって、複数の前記音声信号のレベルをそれぞれ検出するレベル検出部と、前記混合信号のパワースペクトルを算出して、当該パワースペクトルの変化に基づいてハウリングの発生を検出するハウリング発生検出部と、前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記ハウリングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出部とを備える。
本発明の第10の発明は、上記第9の発明において、前記ハウリング検出装置は、前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、前記支配率を用いて算出された伝達特性に基づいて、前記語尾の区間に含まれる信号と同じ成分を有する信号を前記混合信号から減算して前記スピーカに出力するハウリング抑制部とを、さらに備える。
本発明の第11の発明は、上記第10の発明において、前記ハウリング抑制部は、前記語尾の区間に含まれる信号と同じ成分を有する信号を除いた前記混合信号を推定する関数を前記語尾の区間が検出されたときに設定し、前記支配率に応じて前記総和を更新し、当該更新前後の総和の変化率を前記関数に乗じて前記伝達特性を前記ハウリングの発生が検出されたときに算出することを特徴とする。
本発明の第12の発明は、上記第11の発明において、前記ハウリング抑制部は、相対的に高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする。
本発明の第13の発明は、上記第11の発明において、前記ハウリング抑制部は、最も高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする。
本発明の第14の発明は、上記第9の発明において、前記ハウリング検出装置は、前記支配率算出部において算出された支配率が相対的に高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
本発明の第15の発明は、上記第9の発明において、前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える。
本発明の第16の発明は、上記第9の発明において、前記レベル検出部は、複数の前記音声信号レベルをパワースペクトルでそれぞれ検出することを特徴とする。
本発明の第17の発明は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合ステップで混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出方法であって、複数の前記音声信号のレベルをそれぞれ検出するレベル検出ステップと、前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出ステップと、前記レベル検出ステップが検出した複数の前記音声信号のレベルからそれぞれ前記語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出ステップとを含む。
本発明の第18の発明は、複数のマイクロフォンから収音されたそれぞれの音声信号を音混合ステップで混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出方法であって、複数の前記音声信号のレベルをそれぞれ検出するレベル検出ステップと、前記混合信号のパワースペクトルを算出して、当該パワースペクトルの変化に基づいてハウリングの発生を検出するハウリング発生検出ステップと、前記レベル検出ステップが検出した複数の前記音声信号のレベルからそれぞれ前記ハウリングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出ステップとを含む。
上記第1の発明によれば、語尾の区間にはハウリングの発生原因となる信号成分のみが含まれおり、支配率が当該語尾の区間に応じたレベルを用いて算出されることで、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度を検出することができる。また、支配率は音混合部で混合される前の音声信号のレベルに基づいて算出される。これにより、本発明によれば、音混合部で混合される前において、例えば複数の音声信号の周波数および/またはゲインの特性がそれぞれ変更されても、その変更に対応した上記危険度を検出することができる。
上記第2の発明によれば、伝達特性が支配率を用いて算出されることで、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度に応じたハウリングの抑制を行うことができる。また、伝達特性が支配率を用いて算出されることで、音混合部で混合される前において、例えば複数の音声信号の周波数および/またはゲインの特性がそれぞれ変更され、伝達特性が急激に変化しても、その変化に対応したロバストなハウリングの抑制を行うことができる。
上記第3の発明によれば、伝達特性が支配率に応じた総和の変化率に基づいて算出されることで、複数の音声信号のハウリングを発生させる危険度を考慮したロバストなハウリング抑制を実現することができる。
上記第4の発明によれば、複数の音声信号のうち、ハウリングを発生させる危険度が相対的に高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑制を実現することができる。
上記第5の発明によれば、複数の音声信号のうち、ハウリングを発生させる危険度が最も高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑制を実現することができる。例えばユーザのミキサ操作として、複数の音声信号のレベルを全て同時に変更したりする操作は稀であるため、支配率の最も高いものだけに追随するものであっても、ロバストなハウリングの抑制を行うことができる。
上記第6の発明によれば、支配率が相対的に高い音声信号を特定することによって、ユーザに対して、複数の音声信号のうち、どの音声信号がハウリングを発生させる危険度が相対的に高いかを通知することができる。また、ユーザが例えばミキサなどの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を未然に防止しながら操作を行うことができる。
上記第7の発明によれば、支配率が最も高い音声信号を特定することによって、ユーザに対して、複数の音声信号のうち、どの音声信号がハウリングを発生させる危険度が最も高いかを通知することができる。また、例えばミキサなどの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を未然に防止しながら操作を行うことができる。
上記第8の発明によれば、複数の音声信号のレベルがパワースペクトルで算出されることで、ハウリングを発生させる危険度を周波数帯域ごとに検出することができる。
上記第9の発明によれば、ハウリングが発生したとき、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度を検出することができる。また、支配率は音混合部で混合される前の音声信号のレベルに基づいて算出される。これにより、本発明によれば、音混合部で混合される前において、例えば複数の音声信号の周波数および/またはゲインの特性がそれぞれ変更されても、その変更に対応した上記危険度を検出することができる。
上記第10の発明によれば、伝達特性が支配率を用いて算出されることで、複数の音声信号のうちどの音声信号がハウリングを発生させるのかという危険度に応じたハウリングの抑制を行うことができる。また、伝達特性が支配率を用いて算出されることで、音混合部で混合される前において、例えば複数の音声信号の周波数および/またはゲインの特性がそれぞれ変更され、伝達特性が急激に変化しても、その変化に対応したロバストなハウリングの抑制を行うことができる。
上記第11の発明によれば、伝達特性が支配率に応じた総和の変化率に基づいて算出されることで、語尾の区間が到来する前に、複数の音声信号のハウリングを発生させる危険度を考慮したロバストなハウリング抑制を実現することができる。
上記第12の発明によれば、複数の音声信号のうち、ハウリングを発生させる危険度が相対的に高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑制を実現することができる。
上記第13の発明によれば、複数の音声信号のうち、ハウリングを発生させる危険度が最も高い音声信号に対応した伝達特性が算出されるので、高効率なハウリング抑制を実現することができる。例えばユーザのミキサ操作として、複数の音声信号のレベルを全て同時に変更したりする操作は稀であるため、支配率の最も高いものだけに追随するものであっても、ロバストなハウリングの抑制を行うことができる。
上記第14の発明によれば、ハウリングが発生した場合において、ユーザに対して、複数の音声信号のうちどの音声信号がハウリングを発生させる危険度が相対的に高いかを通知することができる。また、ユーザが例えばミキサなどの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を未然に防止しながら操作を行うことができる。
上記第15の発明によれば、ハウリングが発生した場合において、ユーザに対して、複数の音声信号のうちどの音声信号がハウリングを発生させる危険度が最も高いかを通知することができる。また、ユーザが例えばミキサなどの操作において収音される音声信号が複数あっても、ユーザは上記危険度を参照することでハウリングの発生を未然に防止しながら操作を行うことができる。
上記第16の発明によれば、複数の音声信号のレベルがパワースペクトルで算出されることで、ハウリングを発生させる危険度を周波数帯域ごとに検出することができる。
(第1の実施形態)
図1を参照して、本発明の第1の実施形態に係るハウリング検出方法および抑制方法を採用した拡声システム1について説明する。図1は、拡声システム1の構成例を示すブロック図である。図1において、拡声システム1は、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、語尾検出部15、支配率算出部16、ハウリング抑制部17、およびスピーカ18を有する。なお、拡声システム1は3つ以上のマイクロフォンを用いて拡声するシステムでもよいが、ここでは2つのマイクロフォンを用いて拡声する場合を想定して説明する。図1において、第1のマイクロフォン11aは、スピーカ18において拡声するための音声を収音して音声信号を生成する。この第1のマイクロフォン11aで生成された音声信号をX1(t)とする。また、第2のマイクロフォン11bでも同様に、拡声するための音声を収音して音声信号X2(t)を生成する。
音特性調整部12は、音声信号X1(t)およびX2(t)を入力とし、当該音声信号の周波数やゲインの特性をそれぞれ調整する。なお、音特性調整部12で調整された音声信号X1(t)をXm1(t)とする。同様に音特性調整部12で調整された音声信号X2(t)をXm2(t)とする。音特性調整部12で調整された音声信号Xm1(t)およびXm2(t)は、レベル検出部14と音混合部13とにそれぞれ出力される。音混合部13に入力された音声信号Xm1(t)およびXm2(t)は、当該音混合部13において混合される。この混合された音声信号をXm(t)とする。そして、音混合部13において混合された音声信号Xm(t)は、語尾検出部15およびハウリング抑制部17に出力される。なお、音特性調整部12および音混合部13は、例えば図2に示すような市販のミキサなどである。
図2は、音特性調整部12および音混合部13の構成例を示すブロック図である。図2において、音特性調整部12は、例えばイコライザ121a、イコライザ121b、増幅部122a、および増幅部122bを有する。イコライザ121aは、第1のマイクロフォン11aで収音して生成された音声信号X1(t)の周波数特性を調整する。増幅部122aは、イコライザ121aで調整された音声信号のゲインを調整する。同様に、イコライザ121bおよび増幅部122bは、第2のマイクロフォン11bで収音して生成された音声信号X2(t)の周波数やゲインの特性を調整する。このように音特性調整部12では、通常のミキサと同様に、第1および第2のマイクロフォン11aおよび1bで収音された各音声信号の周波数やゲインの特性がそれぞれ独立して調整される。
レベル検出部14は、音特性調整部12から出力される音声信号Xm1(t)およびXm2(t)の各レベルを検出する。具体的な検出方法としては、例えば所定時間毎にパワースペクトルを算出して、帯域毎のレベルを検出する。レベル検出部14で検出された各所定時間における帯域毎のレベルの情報は、全て支配率算出部16に出力される。
語尾検出部15は、音混合部13から入力される音声信号Xm(t)と、雑音参照信号Y(t)とに基づいて、雑音参照信号Y(t)に対する音声信号Xm(t)の音声区間の遅延区間を語尾として検出する。なお、雑音参照信号Y(t)は、スピーカで拡声される音響に関する信号であり、例えばスピーカ18において拡声される直前の音声信号である。このとき、ハウリング抑制部17には、スピーカ18の直前の入力から雑音参照信号Y(t)が入力される。また例えば、スピーカ18の近傍で拡声された音声を別のマイクロフォンなどで収音して生成される音声信号であってもよい。このとき、ハウリング抑制部17は、当該別のマイクロフォンと接続され、当該別のマイクロフォンから出力される音声信号を雑音参照信号Y(t)として入力する。
ここで、図3を参照して、語尾部分の信号成分について説明する。図3は、雑音参照信号Y(t)および音声信号Xm(t)の波形を示す図である。図3に示すように、音声信号Xm(t)の音声区間は、雑音参照信号Y(t)に対して遅延している。これは、図13および数式1に示したように、マイクロフォンで収音して生成される音声信号には、話者が発声する音声S(ω)の他に、スピーカで拡声され、空間伝播してマイクロフォンに再び混入する音声Y(ω)*R(ω)が含まれるためである。つまり、混入する音声Y(ω)*R(ω)は、空間伝播する分だけスピーカ18の拡声音より遅延しているためである。これは、第1のマイクロフォン11aおよび第2のマイクロフォン11bから音声信号が入力される場合ついても同様である。このように、音声信号Xm(t)には、空間伝播して第1のマイクロフォン11aおよび/または第2のマイクロフォン11bに再び混入される遅延した音声Y(ω)*R(ω)の信号成分が含まれている。つまり、図3に示す語尾部分には、空間伝播して第1のマイクロフォン11aおよび/または第2のマイクロフォン11bに再び混入する信号成分のみが含まれていることになる。語尾検出部15が上記語尾部分を検出することで、後述する支配率算出部16は、空間伝播して第1のマイクロフォン11aおよび/または第2のマイクロフォン11bに再び混入される信号成分のみに基づいた支配率を算出することができる。語尾検出部15の具体的な検出方法としては、例えば音声信号Xm(t)および雑音参照信号Y(t)の波形のパワーエンベロープを用いる方法がある。各パワーエンベロープ(立ち上がり部分を除く)を用いて、その比率を常に観察することで、語尾部分を検出することができる。また例えば、語尾検出部15が雑音参照信号Y(t)および音声信号Xm(t)を時系列的に比較する。そして、語尾検出部15が各パワーエンベロープの立ち下がりを検出して、それらの差分を語尾部分としてもよい。語尾検出部15において検出された語尾(遅延した部分)の情報は、支配率算出部16およびハウリング抑制部17に送られる。
支配率算出部16は、レベル検出部14から出力された各音声信号のレベルと、語尾検出部15において検出された語尾とに基づいて、入力された複数の音声信号(図1では、Xm1(t)およびXm2(t))の支配率をそれぞれ算出する。なお、支配率算出部16は、語尾検出部15で検出された語尾の区間でのみ支配率の算出処理を行う。以下、支配率の算出方法について具体的に説明する。なお、支配率とは、複数の音声信号それぞれについてハウリングを発生させる危険度を示すものである。
レベル検出部14で算出されたレベルのうち、語尾の区間のパワースペクトルをループゲインGとする。そして、音声信号Xm1(t)のループゲインをG1(ω)、音声信号Xm2(t)のループゲインをG2(ω)とする。同様に、第n(nは自然数)のマイクロフォンから入力され、音特性調整部12で周波数やゲイン特性を調整された音声信号Xmn(t)とする。このとき、当該Xmn(t)のループゲインGn(ω)は、数式7と表現できる。
Figure 2005125273
そして、支配率算出部16は、各音声信号のレベルから語尾の区間のレベルであるループゲインGを抽出し、各音声信号に対する支配率として例えば全音声信号のループゲインの和と各音声信号のループゲインとの比をそれぞれ算出する。例えば、図1では、ループゲインの和はG1(ω)+G2(ω)である。したがって、音声信号Xm1(t)に対する支配率は、和(G1(ω)+G2(ω))とG1(ω)との比として表現される。また、音声信号Xm2(t)に対する支配率は、和(G1(ω)+G2(ω))とG2(ω)との比として表現される。このように支配率算出部16は、図4に示すように、語尾の区間において、帯域毎にどの音声信号のループゲインが支配的であるかを、帯域毎のループゲインの大小をもとに支配率として判定することができる。図4は、ループゲインG1(ω)、G2(ω)、およびループゲインの和(G1(ω)+G2(ω))のスペクトラムの一例を示す図である。図4の一例では、周波数fより大きい周波数帯域でG2(ω)の支配率が高くなり、G2(ω)が支配的であることが判定される。また、周波数f未満の周波数帯域ではG1(ω)の支配率が高くなり、G1(ω)が支配的であることが判定される。
このように、空間伝播される信号成分のみが含まれる語尾の区間に対して、支配率算出部16は、各音声信号の支配率が算出することによってどの音声信号が支配的であるかを検出することができる。ここで、空間伝播される信号成分は、ハウリングの発生原因となる信号成分である。したがって、支配率算出部16は、例えば図1に示すR1(ω)の経路で伝わる音が支配的なのか、あるいはR2(ω)の経路で伝わる音が支配的なのかをハウリング発生前に検出することができる。そして、支配的である音声信号ほどハウリングを発生させる危険度が高い。なお、音特性調整部12、音混合部13、レベル検出部14、語尾検出部15、および支配率算出部16は、本発明におけるハウリング検出装置に相当するものである。そして、本発明におけるハウリング検出装置は、上記支配率を算出することで、複数の音声信号それぞれについてハウリングを発生させる危険度を検出することができる。
なお、算出された支配率が語尾を検出するたびに所定の方式によって学習し更新される仕組みにすれば、マイクロフォンの位置変化などによる支配率の逐次変化にも対応できるようになる。また、支配率を学習するタイミングとしては、語尾が検出されるたびに行うことに限定されず、推定の逐次性および正確性を考慮して適宜調整されてもよい。
ハウリング抑制部17は、音混合部13において混合された音声信号Xm(t)に対して、ハウリングを抑制する信号処理を行う。信号処理された音声信号は、適宜増幅されてスピーカ18によって拡声される。以下、図5を参照して、ハウリング抑制部17の処理方法について具体的に説明する。図5は、ハウリング抑制部17の構成の一例を示すブロック図である。ここでは、図5に示すように、2入力型サブトラクション構成を採用している。2入力型サブトラクション構成は、雑音参照信号として拡声対象の音声信号を用いることで、拡声対象の音声信号に含まれる語尾に応じて伝達特性を学習しながら、ハウリングの発生を抑圧することができる。図5において、ハウリング抑制部17は、第1のパワースペクトル算出部171、第2のパワースペクトル算出部172、伝達特性算出部173、逆フーリエ変換部174、および畳み込み部175を有する。
図5において、第1のパワースペクトル算出部171は、音混合部13から出力された音声信号Xm(t)を入力とし、音声信号Xm(t)のパワースペクトルX(ω)を算出する。第2のパワースペクトル算出部172は、雑音参照信号Y(t)を入力とし、雑音参照信号Y(t)のパワースペクトルY(ω)を算出する。なお、雑音参照信号Y(t)とする拡声対象の音声信号は、例えばスピーカ18において拡声される直前の音声信号である。また例えば、スピーカ18の近傍で拡声された音声をマイクロフォンなどで収音して生成される音声信号であってもよい。
伝達特性算出部173は、まず、音声信号Xm(ω)と雑音参照信号Y(ω)とに基づいて、パワースペクトル比率Hr(ω)を語尾検出部15において検出された語尾の区間でのみ推定する。パワースペクトル比率Hr(ω)は数式(8)で表現される。
Figure 2005125273
なお、εは平均を意味する。そして、伝達特性算出部173は、数式(8)で推定したパワースペクトル比率Hr(ω)に基づいて、数式(9)に示す伝達特性Hsup(ω)を算出する。
Figure 2005125273
このように、本発明において、Hsup(ω)は、語尾の区間に含まれる信号と同じ成分を有する信号を除いた音声信号Xm(t)を推定する関数である。
次に、伝達特性算出部173は、数式9で算出したHsup(ω)に、支配率算出部16で算出された各音声信号のループゲインおよび支配率に基づいて得られるループゲインの和の変化率を乗算して、Hsup(ω)を算出する。以下、Hsup(ω)の算出方法について説明する。
例えば、ユーザが音特性調整部12および音混合部13においてミキサ操作を行って、音声信号X1(t)およびX2(t)の周波数やゲインの特性をそれぞれ変更したとする。この操作に応じて、音声信号Xm1(t)における周波数やゲインの特性M1(ω)と、音声信号Xm2(t)における周波数やゲインの特性M2(ω)とが変化する。このとき、数式7に示すように、ループゲインG1(ω)およびG2(ω)も変化する。ここで、ミキサ操作前に支配率算出部16で算出されたループゲインG1(ω)の支配率がループゲインG2(ω)よりも高いとする。また、ミキサ操作後に支配率算出部16で算出されたループゲインG1(ω)をループゲインG1new(ω)とし、ミキサ操作前に支配率算出部16で算出されたループゲインG1(ω)をループゲインG1old(ω)とする。また、ミキサ操作後に支配率算出部16で算出されたループゲインG2(ω)をループゲインG2new(ω)とし、ミキサ操作前に支配率算出部16で算出されたループゲインG2(ω)をループゲインG2old(ω)とする。
このとき、ミキサ操作前に支配率算出部16で算出されたループゲインの和は、G1old(ω)+G2old(ω)となる。これに対し、ミキサ操作後に支配率算出部16で算出されるループゲインの和は、ミキサ操作前に算出された支配率のうち、最も高い支配率のループゲインのみを考慮した和とする。つまり上述では、ループゲインG1(ω)の支配率がループゲインG2(ω)より高いとしたので、ミキシング操作後に支配率算出部16で算出されたループゲインの和はG1new(ω)+G2old(ω)となる。このとき、ループゲインの和の変化率Lr(ω)は、数式10となる。
Figure 2005125273
このように、支配率算出部16で算出された各音声信号のループゲインおよび支配率に基づいて、ループゲインの和の変化率Lr(ω)が求まる。つまり、ループゲインの和の変化率Lr(ω)としては、支配率が最も高いループゲインG1(ω)の変化に応じて、ループゲインの和(G1(ω)old+G2(ω)old)が和(G1(ω)new+G2(ω)old)に変化したことが予想できる。なお、上述では支配率が最も高いループゲインのみ、ループゲインの和に反映させるとした。これは、ユーザのミキサ操作として、2つ以上の音声信号のゲインを同時に変更したりする操作は稀であるため、ループゲインの和の変化率Lr(ω)が支配率の高いものだけに追随するものであっても、ロバストなハウリングの抑制を行うことができることに基づいている。このように、支配率が最も高いループゲインを、ループゲインの和に反映させることで、複数の音声信号が入力される場合であっても、ハウリングを発生させる危険度が高い音声信号のみを考慮した効率的、かつロバストなハウリング抑制を実現することができる。
伝達特性算出部173は、数式(10)に示すループゲインの和の変化率を数式(9)で算出した伝達特性Hsup(ω)に乗じて、和の変化率に応じた伝達特性Hsup_new(ω)を算出する。なお、伝達特性Hsup(ω)をHsup_old(ω)とし、和の変化率に応じた伝達特性をHsup_new(ω)とする。このとき、和の変化率に応じた伝達特性Hsup_new(ω)は、数式(11)で表現される。
Figure 2005125273
このように、本発明においては、和の変化率に応じた伝達特性Hsup_new(ω)は、推定された関数であるHsup(ω)_oldに和の変化率が乗算された伝達特性である。
数式(11)で更新されたHsup_new(ω)は、逆フーリエ変換部174において、時間軸上に変換される。このHsup_new(ω)の時間軸上に変換されたものをフィルタ係数Hsup_new(t)とする。畳み込み部175は、フィルタ係数Hsup_new(t)を音混合部13から入力される音声信号Xm(t)に畳み込みこむことで、上記語尾検出部15において検出された語尾の区間のみの信号と同じ成分のみを含む信号を音声信号Xm(t)から減算する。なお、Hsup(ω)の算出(数式9)および更新(数式11)は、語尾検出部15において語尾が検出されたときに行われる。また、Hsup(ω)の算出(数式(9)および数式(11))の学習は、例えば語尾を検出するたびに所定の方式によって行うようにしてもよい。
以上のように、本実施形態によれば、支配率算出部16において各音声信号のループゲインおよび支配率を算出して、当該支配率に基づいたループゲインの和の変化率を用いた伝達特性を算出する。また、当該支配率は、音特性調整部12の出力信号に基づいて算出されるので、音特性調整部12において調整される周波数やゲインの特性に連動した値である。これにより、複数の音声信号を混合して拡声する拡声システムにおいて、上記支配率に基づいてハウリング抑制に用いる伝達特性を算出することで、音特性調整部12よる伝達特性の急激な変化に対してロバストなハウリングの抑制を行うことができる。つまり、ユーザのミキサ操作によるM(ω)の急激な変化に対して、ロバストなハウリングの抑制を実現することができる。
なお、上述では、ミキサ操作前に支配率算出部16で算出した支配率のうち、最も高い支配率であるループゲインのみの時間変化分からループゲインの和を推定するとしたが、これに限定されない。例えば、支配率が相対的に高い複数のループゲインをループゲインの和に反映させてもよい。例えば、マイクロフォンが3つあるとし、それぞれのループゲインをG1(ω)、G2(ω)、およびG3(ω)とする。そして、ミキサ操作前の支配率の関係が、ループゲインG1(ω)およびG2(ω)がループゲインG3(ω)より高いとする。そして、ループゲインG1(ω)およびG2(ω)をループゲインの和(G1(ω)+G2(ω)+G3(ω))に反映させてもよい。このとき、ループゲインの和の変化率Lr(ω)は、数式12となる。
Figure 2005125273
また、伝達特性算出部173は、支配率算出部16で算出された支配率を用いて、当該支配率を各音声信号のループゲインそれぞれに反映させて、ループゲインの和の変化率を求めてもよい。また例えば、伝達特性算出部173は、支配率に基づいて、ループゲインの和の変化率以外の他の方法でハウリング抑制に用いる伝達特性を算出してもよい。
なお、上述した拡声システム1においては、2つの音声信号が入力された場合について説明したが、これに限定されない。例えば、3つ以上のマイクロフォンを有して3つ以上の音声信号が入力される場合であってもよい。また、上述したハウリング抑制部17において、サブトラクションの具体的構成を図5に示したが、これに限定されない。畳み込みによるフィルタ方式以外のサブトラクション手法も数多く知られており、これらの手法を用いる構成であってもよい。
また、上述では、レベル検出部14では、各音声信号についてそれぞれ周波数分析を行って、レベルをパワースペクトルとして算出したが、これに限定されない。例えば、レベル検出部14では、所定時間毎の各音声信号のパワーをスカラー値として算出されてもよい。この場合、支配率算出部16では、各音声信号の支配率はスカラー値で算出される。また、ループゲインの和の変化率Lr(ω)もスカラー値で表現される。
(第2の実施形態)
図6を参照して、本発明における第2の実施形態に係るハウリング検出方法および抑制方法を採用した拡声システム2について説明する。図6は、拡声システム2の構成例を示すブロック図である。図6において、拡声システム2は、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、ハウリング発生検出部21、支配率算出部16、ハウリング抑制部22、およびスピーカ18を有する。なお、第1の実施形態においては、各音声信号の支配率を語尾区間でのみ算出するとしたが、本実施形態ではハウリングが検出されたときに算出する点で異なる。以下、異なる点を中心に説明する。また、第1の実施形態と同様に、拡声システム2は3つ以上のマイクロフォンを用いて拡声するシステムでもよいが、ここでは2つのマイクロフォンを用いて拡声する場合を想定して説明する。
図6において、第1のマイクロフォン11aは、スピーカ18において拡声するための音声を収音して音声信号を生成する。この第1のマイクロフォン11aで生成された音声信号をX1(t)とする。また、第2のマイクロフォン11bでも同様に、拡声するための音声を収音して音声信号X2(t)を生成する。音特性調整部12は、音声信号X1(t)およびX2(t)を入力とし、当該音声信号の周波数やゲインの特性をそれぞれ調整する。そして、周波数やゲインの特性を調整された音声信号Xm1(t)およびXm2(t)は、当該音混合部13において混合される。また、レベル検出部14は、音特性調整部12から出力される音声信号Xm1(t)およびXm2(t)の各レベルを検出する。そして、レベル検出部14で検出された各所定時間における帯域毎のレベルの情報は、全て支配率算出部16に出力される。ここまでの処理は、上述した第1の実施形態と同様である。
ハウリング発生検出部21は、音混合部13で混合された音声信号Xm(t)のパワースペクトルXm(ω)を算出して、ハウリングの発生を検出する。例えば特定周波数fにおいてハウリングが発生すると仮定すると、音声信号Xm(t)のパワースペクトルX(ω)は、図13で示したように特定周波数fにおいてパワーが急激に増加するように変化する。そこで、隣接する帯域間のパワーの差分を常に観察することで、特定周波数fが含まれる帯域のパワーが急激に増加したことが検出される。つまり、音声信号Xm(t)のパワースペクトルX(ω)を観察して、ハウリングの初期発生(ハウリングが起こりかかっている状態)を検出する。そして、ハウリング発生検出部21で検出されたハウリングの初期発生時の情報は、支配率算出部16に出力される。
支配率算出部16は、レベル検出部14から出力された各音声信号のレベルと、ハウリング発生検出部21において検出された情報とに基づいて、入力された複数の音声信号(図6では、Xm1(t)およびXm2(t))の支配率をそれぞれ算出する。なお、支配率算出部16は、ハウリング発生検出部21においてハウリングの初期発生が検出されたときの支配率の算出処理を行う。そして、レベル検出部14で算出されたレベルのうち、ハウリングの初期発生が検出されたときのパワースペクトルがループゲインGとなる。以下、支配率の具体的な算出方法は、第1の実施形態と同様であるので説明を省略する。また、本実施形態においては、支配率算出部16において各音声信号の支配率が算出されることで、ハウリングの初期発生時において、どの音声信号が支配的であるかを検出することができる。また、本実施形態における支配率とは、上述した第1の実施形態と同様に、複数の音声信号それぞれについてハウリングを発生させる危険度を示すものである。このように、音特性調整部12、音混合部13、レベル検出部14、ハウリング発生検出部21、および支配率算出部16は、本発明におけるハウリング検出装置に相当するものである。つまり、本発明におけるハウリング検出装置は、上記支配率を算出することで、複数の音声信号それぞれについてハウリングを発生させる危険度を検出することができる。
ハウリング抑制部22は、音混合部13において混合された音声信号Xm(t)に対して、ハウリングを抑制する信号処理を行う。そして、信号処理された音声信号は、適宜増幅されてスピーカ18によって拡声される。以下、図7を参照して、ハウリング抑制部22の処理方法について説明する。図7は、第2の実施形態におけるハウリング抑制部22の構成の一例を示すブロック図である。図7において、ハウリング抑制部22は、第1のパワースペクトル算出部171、第2のパワースペクトル算出部172、伝達特性算出部173、逆フーリエ変換部174、畳み込み部175、および語尾検出部176を有する。なお、上述したハウリング抑制部17においては語尾検出部15から語尾情報を参照していたが、ハウリング抑制部22は、語尾検出部176を新たに備え、当該語尾検出部176から語尾情報を参照する点で異なる。以下、異なる点を中心に説明する。
図7において、第1のパワースペクトル算出部171は、音混合部13から出力された音声信号Xm(t)を入力とし、音声信号Xm(t)のパワースペクトルX(ω)を算出する。第2のパワースペクトル算出部172は、雑音参照信号Y(t)を入力とし、雑音参照信号Y(t)のパワースペクトルY(ω)を算出する。
語尾検出部176は、上述した語尾検出部15と同様の機能を有する。語尾検出部176は、音混合部13から入力される音声信号Xm(t)と、雑音参照信号Y(t)とに基づいて、雑音参照信号Y(t)に対する音声信号Xm(t)の音声区間の遅延区間を語尾として検出する。なお、雑音参照信号Y(t)としては、上述した第1の実施形態と同様に、例えばスピーカ18において拡声される直前の音声信号などである。また、図7において、語尾検出部176は、ハウリング抑制部22の内部に構成するものとしたが、ハウリング抑制部22の外部にあってもよい。また、ハウリング抑制部22と語尾検出部176は別体として、ハウリング抑制部22が語尾検出部176で検出される情報を入力するようにしてもよい。
伝達特性算出部173は、まず、音声信号Xm(ω)と雑音参照信号Y(ω)とに基づいて、数式8で示すパワースペクトル比率Hr(ω)を語尾検出部176において検出された語尾の区間でのみ推定する。そして、伝達特性算出部173は、数式8で推定したパワースペクトル比率Hr(ω)に基づいて、数式(9)に示す伝達特性Hsup(ω)を算出する。次に、伝達特性算出部173は、数式(9)で算出した伝達特性Hsup(ω)に、支配率算出部16で算出された各音声信号のループゲインおよび支配率に基づいて得られるループゲインの和の変化率を乗算して、変化率に応じた伝達特性Hsup(ω)_newを算出する。そして、数式11で算出された変化率に応じた伝達特性Hsup_new(ω)は、逆フーリエ変換部174において、時間軸上に変換される。畳み込み部175は、この時間軸上に変換されたフィルタ係数Hsup_new(t)を音混合部13から入力される音声信号Xm(t)に畳み込み、上記語尾検出部176において検出された語尾の区間のみの信号と同じ成分のみを含む信号を音声信号Xm(t)から減算する。この場合、変化率に応じた伝達特性Hsup(ω)_newは、ハウリングの初期発生時のループゲインを用いて求められるループゲインの和の変化率に基づいている。このため、ハウリングの初期発生が起こっている音声信号およびその周波数成分を考慮したハウリング抑制を行うことができる。
なお、本実施形態においては、Hsup(ω)の算出(数式(9))は、語尾検出部176において語尾が検出されたときに行われる。支配率に基づいたループゲインの和の変化率によるHsup(ω)の更新(数式(11))は、ハウリング発生検出部21でハウリングの初期発生が検出されたときに行われる。また、数式9で算出されたHsup(ω)の学習は、例えば語尾が検出されるたびに所定の方式によって行うようにしてもよい。また、数式11で算出されるHsup(ω)の学習は、例えばハウリングの初期発生を検出するたびに所定の方式によって行うようにしてもよい。
以上のように、本実施形態によれば、支配率算出部16においてハウリングの初期発生時の各音声信号のループゲインおよび支配率を算出する。そして、当該支配率に基づいたループゲインの和の変化率で伝達特性を算出する。また、当該支配率は、音特性調整部12の出力信号に基づいて算出されるので、音特性調整部12において調整される周波数やゲインの特性に連動した値である。これにより、複数の音声信号を混合して拡声する拡声システムにおいて、上記支配率に基づいてハウリング抑制に用いる伝達特性を算出することで、音特性調整部12よる伝達特性の急激な変化で発生するハウリングに対して、ロバストなハウリングの抑制を行うことができる。つまり、ユーザのミキサ操作によるM(ω)の急激な変化によってハウリングが発生しかかっても、ロバストなハウリングの抑制を実現することで、結果的にハウリングの発生を防止することができる。
(第3の実施形態)
図8および図9を参照して、本発明における第3の実施形態に係るハウリング検出方法を採用したハウリング警告装置について説明する。図8は、ハウリング警告装置の構成例を示すブロック図である。図8において、ハウリング警告装置は、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、語尾検出部15、支配率算出部16、スピーカ18、およびハウリング警告部31を有する。
図9は、ハウリング発生検出部21を用いたハウリング警告装置の構成例を示すブロック図である。図9において、ハウリング警告装置は、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、ハウリング発生検出部21、支配率算出部16、スピーカ18、およびハウリング警告部31を有する。図8および図9に示すように、本実施形態では、上述した第1および第2の実施形態におけるハウリング抑制部17および22に代わって、ハウリング警告部31を備える点で異なる。換言すれば、上述した本発明におけるハウリング検出装置にハウリング警告部31を備えたものである。以下、異なる点を中心に説明する。また、第1のマイクロフォン11a、第2のマイクロフォン11b、音特性調整部12、音混合部13、レベル検出部14、語尾検出部15、支配率算出部16、ハウリング発生検出部21、およびスピーカ18は、上述した第1および第2の実施形態と同様であるので、同一の符号を付して説明を省略する。
図8において、ハウリング警告部31は、支配率算出部16において算出された語尾区間に基づく支配率に応じて、どの音声信号が原因でハウリングが発生する危険があるかをユーザに警告する。警告するための表示手段としては、例えば音声信号の周波数やゲインの特性を調整するミキサの各チャンネルにランプを設置して、ハウリングが発生する可能性があるチャンネルに対して点滅などさせる手段などがある。そして、例えば支配率が最も高い(ハウリングを発生させる危険度が高い)音声信号のチャンネルのランプを点滅させる。また、例えば支配率が高い複数のチャンネルのランプを点滅させてもよい。また、支配率が周波数帯域毎に算出される場合には、各チャンネルに対して周波数帯域ごとのランプを設け、帯域毎にランプを点滅させてもよい。また、表示手段としては、上記ランプに限らず、ディスプレイ上に表示するものであってもよいし、その他の表示手段であってもよい。また、警告するだけではなく、警告に応じて自動的に音特性調整部12で音特性を変更し(例えば、ゲインが下げ)、ハウリングを未然に防止するようにしてもよい。
また、図9に示すように、ハウリングの初期発生に基づく支配率に応じて、どの音声信号が原因でハウリングが発生する危険があるかをユーザに警告するものであってもよい。図9において、ハウリング警告部31は、支配率算出部16において算出されたハウリングの初期発生に基づく支配率を参照することで、どの音声信号でハウリングの初期発生が起きているかをユーザに警告することができる。
以上のように、本実施形態では、ハウリング警告部31において、支配率算出部16において算出された支配率に応じて、どの音声信号が原因でハウリングが発生する危険があるか、またはどの音声信号でハウリングの初期発生が起きているかをユーザに警告する。これにより、ユーザは、入力される音声信号が複数あっても、ハウリングの発生を未然に防止しながら、ミキサ操作などを各音声信号に対して行うことができる。
また、上述した第1〜第3の実施形態で説明した各構成部のうち少なくとも一部の構成は、集積回路でも実現可能である。以下、各実施形態について具体例を説明する。上述した第1の実施形態で説明したレベル検出部14、語尾検出部15、支配率算出部16、およびハウリング抑制部17は、例えば、音特性調整部12から出力される音声信号(図1では、Xm1(t)およびXm2(t))、音混合部13から出力される音声信号(図1では、Xm(t))、および雑音参照信号(図1では、Y(t))を入力とし、音声信号処理結果を適宜増幅部などで増幅して、スピーカ18へ出力する集積回路でも実現可能である。また、上述した第2の実施形態で説明したレベル検出部14、ハウリング発生検出部21、支配率算出部16、およびハウリング抑制部17は、例えば、音特性調整部12から出力される音声信号(図6では、Xm1(t)およびXm2(t))、音混合部13から出力される音声信号(図6では、Xm(t))、および雑音参照信号(図6では、Y(t))を入力とし、音声信号処理結果を適宜増幅部などで増幅して、スピーカ18へ出力する集積回路でも実現可能である。また、上述した第3の実施形態の図8において説明したレベル検出部14、語尾検出部15、および支配率算出部16は、例えば、音特性調整部12から出力される音声信号(図8では、Xm1(t)およびXm2(t))と、音混合部13から出力される音声信号(図8では、Xm(t))とを入力とし、音声信号処理結果をハウリング警告部31へ出力する集積回路でも実現可能である。また、上述した第3の実施形態の図9において説明したレベル検出部14、ハウリング発生検出部21、および支配率算出部16は、例えば、音特性調整部12から出力される音声信号(図9では、Xm1(t)およびXm2(t))と、音混合部13から出力される音声信号(図9では、Xm(t))とを入力とし、音声信号処理結果をハウリング警告部31へ出力する集積回路でも実現可能である。このように上述した第1〜第3の実施形態では、上述した各機能を果たす電気回路を1つの小型パッケージに集積して、例えば音声信号処理回路DSP(Digital Signal Processor)等を構成することによって、本発明の実現が可能となる。
本発明にかかるハウリング検出装置およびその方法は、支配率を算出することで、複数の音声信号それぞれについて、ハウリングを発生させる危険度を検出することが可能な複数の音声信号を混合して拡声する拡声システムや、音声ミキサ機能つきPA装置等にも有用である。
拡声システム1の構成例を示すブロック図 音特性調整部12および音混合部13の構成例を示すブロック図 雑音参照信号Y(t)および音声信号Xm(t)の波形を示す図 ループゲインG1(ω)、G2(ω)、およびループゲインの和(G1(ω)+G2(ω))のスペクトラムの一例を示す図 ハウリング抑制部17の構成の一例を示すブロック図 拡声システム2の構成例を示すブロック図 第2の実施形態におけるハウリング抑制部22の構成の一例を示すブロック図 ハウリング警告装置の構成例を示すブロック図 ハウリング発生検出部21を用いたハウリング警告装置の構成例を示すブロック図 複数の音声信号を混合して拡声する拡声システム9において上記特許文献1および特許文献2に開示されたハウリング抑制装置を採用した構成例を示す図 音特性調整部92および音混合部93の構成例を示すブロック図 適応フィルタ941を用いたハウリング抑制部94の構成例を示すブロック図 音混合部93から出力された音声信号のパワースペクトルX(ω)のハウリング発生時の変化を示す図 1入力時の拡声システム9において、伝達特性に関係する各構成の特性を模式的に示した図 複数入力時の拡声システム9において、伝達特性と関係する各構成の特性を模式的に示した図
符号の説明
1、2 拡声システム
3 ハウリング警告装置
11a 第1のマイクロフォン
11b 第2のマイクロフォン
12 音特性調整部
13 音混合部
14 レベル検出部
15、176 語尾検出部
16 支配率算出部
17、22 ハウリング抑制部
18 スピーカ
21 ハウリング発生検出部
31 ハウリング警告部
121 イコライザ
122 増幅部
171 第1のパワースペクトル算出部
172 第2のパワースペクトル算出部
173 伝達特性算出部
174 逆フーリエ変換部
175 畳み込み部

Claims (18)

  1. 複数のマイクロフォンから収音されたそれぞれの音声信号を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出装置であって、
    複数の前記音声信号のレベルをそれぞれ検出するレベル検出部と、
    前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、
    前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出部とを備える、ハウリング検出装置。
  2. 前記ハウリング検出装置は、前記支配率を用いて算出された伝達特性に基づいて、前記語尾の区間に含まれる信号と同じ成分を有する信号を前記混合信号から減算して前記スピーカに出力するハウリング抑制部を、さらに備える、請求項1に記載のハウリング検出装置。
  3. 前記ハウリング抑制部は、前記語尾の区間に含まれる信号と同じ成分を有する信号を除いた前記混合信号を推定する関数を設定し、前記支配率に応じて前記総和を更新し、当該更新前後の総和の変化率を前記関数に乗じて前記伝達特性を算出することを特徴とする、請求項2に記載のハウリング検出装置。
  4. 前記ハウリング抑制部は、相対的に高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする、請求項3に記載のハウリング検出装置。
  5. 前記ハウリング抑制部は、最も高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする、請求項3に記載のハウリング検出装置。
  6. 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が相対的に高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える、請求項1に記載のハウリング検出装置。
  7. 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える、請求項1に記載のハウリング検出装置。
  8. 前記レベル検出部は、複数の前記音声信号レベルをパワースペクトルでそれぞれ検出することを特徴とする、請求項1に記載のハウリング検出装置。
  9. 複数のマイクロフォンから収音されたそれぞれの音声信号を音混合部で混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出装置であって、
    複数の前記音声信号のレベルをそれぞれ検出するレベル検出部と、
    前記混合信号のパワースペクトルを算出して、当該パワースペクトルの変化に基づいてハウリングの発生を検出するハウリング発生検出部と、
    前記レベル検出部が検出した複数の前記音声信号のレベルからそれぞれ前記ハウリングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出部とを備える、ハウリング検出装置。
  10. 前記ハウリング検出装置は、
    前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出部と、
    前記支配率を用いて算出された伝達特性に基づいて、前記語尾の区間に含まれる信号と同じ成分を有する信号を前記混合信号から減算して前記スピーカに出力するハウリング抑制部とを、さらに備える、請求項9に記載のハウリング検出装置。
  11. 前記ハウリング抑制部は、前記語尾の区間に含まれる信号と同じ成分を有する信号を除いた前記混合信号を推定する関数を前記語尾の区間が検出されたときに設定し、前記支配率に応じて前記総和を更新し、当該更新前後の総和の変化率を前記関数に乗じて前記伝達特性を前記ハウリングの発生が検出されたときに算出することを特徴とする、請求項10に記載のハウリング検出装置。
  12. 前記ハウリング抑制部は、相対的に高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする、請求項11に記載のハウリング検出装置。
  13. 前記ハウリング抑制部は、最も高い支配率を示す音声信号のレベルのみを更新して前記総和を更新することを特徴とする、請求項11に記載のハウリング検出装置。
  14. 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が相対的に高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える、請求項9に記載のハウリング検出装置。
  15. 前記ハウリング検出装置は、前記支配率算出部において算出された支配率が最も高い音声信号を特定して、ユーザに通知するハウリング警告部をさらに備える、請求項9に記載のハウリング検出装置。
  16. 前記レベル検出部は、複数の前記音声信号レベルをパワースペクトルでそれぞれ検出することを特徴とする、請求項9に記載のハウリング検出装置。
  17. 複数のマイクロフォンから収音されたそれぞれの音声信号を音混合ステップで混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出方法であって、
    複数の前記音声信号のレベルをそれぞれ検出するレベル検出ステップと、
    前記スピーカで拡声される音響に関する信号を雑音参照信号として当該雑音参照信号と前記混合信号とを時系列的に比較し、当該雑音参照信号がたち下がった後に当該混合信号が入力される時間を語尾の区間として検出する語尾検出ステップと、
    前記レベル検出ステップが検出した複数の前記音声信号のレベルからそれぞれ前記語尾の区間に応じたレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出ステップとを含む、ハウリング検出方法。
  18. 複数のマイクロフォンから収音されたそれぞれの音声信号を音混合ステップで混合した混合信号をスピーカで拡声するときに発生するハウリングに対して、当該音声信号それぞれに対してハウリングを発生させる危険度を示す支配率を検出するハウリング検出方法であって、
    複数の前記音声信号のレベルをそれぞれ検出するレベル検出ステップと、
    前記混合信号のパワースペクトルを算出して、当該パワースペクトルの変化に基づいてハウリングの発生を検出するハウリング発生検出ステップと、
    前記レベル検出ステップが検出した複数の前記音声信号のレベルからそれぞれ前記ハウリングの発生が検出されたときのレベルのみを抽出し、当該複数の音声信号のレベルの総和に対する各音声信号のレベルの比率を前記音声信号それぞれの支配率として算出する支配率算出ステップとを含む、ハウリング検出方法。
JP2006514765A 2004-06-16 2005-06-15 ハウリング検出装置およびその方法 Expired - Fee Related JP4675888B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004177859 2004-06-16
JP2004177859 2004-06-16
PCT/JP2005/010959 WO2005125273A1 (ja) 2004-06-16 2005-06-15 ハウリング検出装置およびその方法

Publications (2)

Publication Number Publication Date
JPWO2005125273A1 true JPWO2005125273A1 (ja) 2008-04-17
JP4675888B2 JP4675888B2 (ja) 2011-04-27

Family

ID=35510156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006514765A Expired - Fee Related JP4675888B2 (ja) 2004-06-16 2005-06-15 ハウリング検出装置およびその方法

Country Status (4)

Country Link
US (1) US7912230B2 (ja)
JP (1) JP4675888B2 (ja)
CN (1) CN1951147B (ja)
WO (1) WO2005125273A1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101199233B (zh) * 2005-05-18 2012-01-18 松下电器产业株式会社 颤噪控制装置和音响装置
JP4225430B2 (ja) * 2005-08-11 2009-02-18 旭化成株式会社 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
JP4798360B2 (ja) * 2006-03-31 2011-10-19 ヤマハ株式会社 音響処理装置
JP4798359B2 (ja) * 2006-03-31 2011-10-19 ヤマハ株式会社 音響処理装置
US8478587B2 (en) * 2007-03-16 2013-07-02 Panasonic Corporation Voice analysis device, voice analysis method, voice analysis program, and system integration circuit
EP2242286B1 (en) * 2007-12-10 2015-08-05 Panasonic Intellectual Property Management Co., Ltd. Sound collecting device, sound collecting method, sound collecting program, and integrated circuit
JP5232485B2 (ja) * 2008-02-01 2013-07-10 国立大学法人岩手大学 ハウリング抑制装置、ハウリング抑制方法及びハウリング抑制プログラム
JP5157778B2 (ja) * 2008-09-18 2013-03-06 富士通株式会社 監視装置、監視方法及びコンピュータプログラム
JP5381091B2 (ja) * 2008-12-26 2014-01-08 ヤマハ株式会社 ハウリング防止装置
JP5515538B2 (ja) * 2009-04-09 2014-06-11 ヤマハ株式会社 ハウリング防止装置
JP5381042B2 (ja) * 2008-11-25 2014-01-08 ヤマハ株式会社 ループゲイン推定装置
JP5381256B2 (ja) * 2009-04-09 2014-01-08 ヤマハ株式会社 ハウリング防止装置
JP5315894B2 (ja) * 2008-09-24 2013-10-16 ヤマハ株式会社 ハウリング防止装置、マイクロフォン、ミキサ、およびアダプタ
WO2010035760A1 (ja) * 2008-09-24 2010-04-01 ヤマハ株式会社 ループゲイン推定装置およびハウリング防止装置
US8996365B2 (en) * 2009-03-19 2015-03-31 Yugengaisya Cepstrum Howling canceller
JP5278219B2 (ja) 2009-07-17 2013-09-04 ヤマハ株式会社 ハウリングキャンセラ
JP5278220B2 (ja) 2009-07-17 2013-09-04 ヤマハ株式会社 ハウリングキャンセラ
JP2011103505A (ja) * 2009-11-10 2011-05-26 Seiko Epson Corp 画像表示装置および制御方法
US8891786B1 (en) * 2010-05-17 2014-11-18 Marvell International Ltd. Selective notch filtering for howling suppression
US8781821B2 (en) * 2012-04-30 2014-07-15 Zanavox Voiced interval command interpretation
CN104871436B (zh) 2012-12-18 2018-03-16 摩托罗拉解决方案公司 用于减轻在数字无线电接收器中的反馈的方法和设备
US20140272883A1 (en) * 2013-03-14 2014-09-18 Northwestern University Systems, methods, and apparatus for equalization preference learning
TWI508576B (zh) * 2013-05-15 2015-11-11 Lite On Opto Technology Changzhou Co Ltd 揚聲器異音檢測方法及裝置
US9269350B2 (en) * 2013-05-24 2016-02-23 Google Technology Holdings LLC Voice controlled audio recording or transmission apparatus with keyword filtering
US9984675B2 (en) 2013-05-24 2018-05-29 Google Technology Holdings LLC Voice controlled audio recording system with adjustable beamforming
CN103391496B (zh) * 2013-07-16 2016-08-10 歌尔声学股份有限公司 应用于主动噪声消除anr耳机的啸叫抑制方法和装置
US9812150B2 (en) 2013-08-28 2017-11-07 Accusonus, Inc. Methods and systems for improved signal decomposition
US10468036B2 (en) * 2014-04-30 2019-11-05 Accusonus, Inc. Methods and systems for processing and mixing signals using signal decomposition
EP3163903B1 (en) * 2015-10-26 2019-06-19 Nxp B.V. Accoustic processor for a mobile device
JP6809936B2 (ja) * 2017-02-28 2021-01-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抽出装置およびマイクロホン装置
EP3641235B1 (en) * 2017-06-12 2022-11-09 Audio-Technica Corporation Data transmission device and data transmission system
US11252506B2 (en) * 2018-02-16 2022-02-15 Nippon Telegraph And Telephone Corporation Howling suppression apparatus, and method and program for the same
CN118016042B (zh) * 2024-04-09 2024-05-31 成都启英泰伦科技有限公司 一种啸叫抑制方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03237899A (ja) * 1990-02-15 1991-10-23 Yamaha Corp ハウリング抑制装置
JPH11146484A (ja) * 1997-11-10 1999-05-28 Yamaha Corp ハウリング抑止装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0771139B2 (ja) 1991-02-28 1995-07-31 松下電器産業株式会社 拡声通話装置
JP2560923B2 (ja) 1991-03-05 1996-12-04 ヤマハ株式会社 ハウリングキャンセル装置
JPH0833091A (ja) * 1994-07-18 1996-02-02 Roland Corp ハウリング予知装置
JPH08223274A (ja) 1995-02-15 1996-08-30 Matsushita Electric Works Ltd ハンズフリー通話装置
JP3673727B2 (ja) * 2000-11-22 2005-07-20 日本電信電話株式会社 反響消去方法、その装置、そのプログラム及びその記録媒体
JP3607625B2 (ja) 2001-02-08 2005-01-05 日本電信電話株式会社 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP4681163B2 (ja) * 2001-07-16 2011-05-11 パナソニック株式会社 ハウリング検出抑圧装置、これを備えた音響装置、及び、ハウリング検出抑圧方法
JP3756828B2 (ja) * 2002-02-25 2006-03-15 日本電信電話株式会社 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP3984842B2 (ja) * 2002-03-12 2007-10-03 松下電器産業株式会社 ハウリング制御装置
JP3753996B2 (ja) 2002-03-20 2006-03-08 日本電信電話株式会社 反響抑圧装置、反響抑圧方法及びプログラム
WO2005125272A1 (ja) * 2004-06-16 2005-12-29 Matsushita Electric Industrial Co., Ltd. ハウリング抑圧装置、プログラム、集積回路、およびハウリング抑圧方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03237899A (ja) * 1990-02-15 1991-10-23 Yamaha Corp ハウリング抑制装置
JPH11146484A (ja) * 1997-11-10 1999-05-28 Yamaha Corp ハウリング抑止装置

Also Published As

Publication number Publication date
US7912230B2 (en) 2011-03-22
US20080021703A1 (en) 2008-01-24
CN1951147B (zh) 2011-08-17
WO2005125273A1 (ja) 2005-12-29
CN1951147A (zh) 2007-04-18
JP4675888B2 (ja) 2011-04-27

Similar Documents

Publication Publication Date Title
JP4675888B2 (ja) ハウリング検出装置およびその方法
US10607592B2 (en) Noise reducing device, noise reducing method, noise reducing program, and noise reducing audio outputting device
JP4697267B2 (ja) ハウリング検出装置およびハウリング検出方法
US9269343B2 (en) Method of controlling an update algorithm of an adaptive feedback estimation system and a decorrelation unit
CN106664473B (zh) 信息处理装置、信息处理方法和程序
WO2010035760A1 (ja) ループゲイン推定装置およびハウリング防止装置
US20040086137A1 (en) Adaptive control system for noise cancellation
WO2005125272A1 (ja) ハウリング抑圧装置、プログラム、集積回路、およびハウリング抑圧方法
JP6312826B2 (ja) 補聴器システムの動作方法および補聴器システム
JP2003032780A (ja) ハウリング検出抑圧装置、これを備えた音響装置、及び、ハウリング検出抑圧方法
EP3669780B1 (en) Methods, devices and system for a compensated hearing test
JP2008268257A (ja) 音響特性補正システムおよびこれを備えたカラオケ装置
EP2663979B1 (en) Processing audio signals
WO2006123495A1 (ja) ハウリング制御装置および音響装置
JP2006262098A (ja) ハウリングキャンセラ
EP3830823A1 (en) Forced gap insertion for pervasive listening
JP6597062B2 (ja) 雑音低減装置、雑音低減方法、雑音低減プログラム
JP4888163B2 (ja) カラオケ装置
JP2006121188A (ja) ハウリング抑圧装置
JP2004032387A (ja) ハウリング制御装置及び補聴器
JP5515538B2 (ja) ハウリング防止装置
EP3955594B1 (en) Feedback control using a correlation measure
JP4974713B2 (ja) カラオケ装置
JP2010178224A (ja) 補聴装置
JP4600105B2 (ja) ハウリングキャンセラ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140204

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees