JP5772591B2 - 音声信号処理装置 - Google Patents

音声信号処理装置 Download PDF

Info

Publication number
JP5772591B2
JP5772591B2 JP2011504722A JP2011504722A JP5772591B2 JP 5772591 B2 JP5772591 B2 JP 5772591B2 JP 2011504722 A JP2011504722 A JP 2011504722A JP 2011504722 A JP2011504722 A JP 2011504722A JP 5772591 B2 JP5772591 B2 JP 5772591B2
Authority
JP
Japan
Prior art keywords
power
audio signal
probability distribution
coincidence
acquired
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011504722A
Other languages
English (en)
Other versions
JPWO2010106734A1 (ja
Inventor
江森 正
正 江森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011504722A priority Critical patent/JP5772591B2/ja
Publication of JPWO2010106734A1 publication Critical patent/JPWO2010106734A1/ja
Application granted granted Critical
Publication of JP5772591B2 publication Critical patent/JP5772591B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

本発明は、入力された音声信号を処理する音声信号処理装置に関する。
複数のマイクロフォンを備え、各マイクロフォンを介して入力された音声信号を受け付け、受け付けた音声信号を処理する音声信号処理装置が知られている。
この種の音声信号処理装置の一つとして、特許文献1に記載の音声信号処理装置は、あるマイクロフォンを介して受け付けられた音声信号が表す音声の大きさを表すパワー(パワーに相当する増幅率)を周波数毎に取得する。そして、音声信号処理装置は、1つの時点にて取得されたパワー(取得パワー)と、所定の基準パワーと、が周波数毎に一致しているか否かを判定する。この音声信号処理装置は、取得パワーと基準パワーとが一致していないと判定した場合、そのマイクロフォンが故障していると判定する。
特開2002−159098号公報
ところで、複数のマイクロフォンは、互いに異なる位置に配置されている。従って、ある位置にて発生した音声が各マイクロフォンに到達する時刻は、マイクロフォン毎に異なる。換言すると、ある時点にて、各マイクロフォンには、互いに異なる時点にて発せられた音声に基づく音声信号が入力される。
このため、例えば、基準パワーとして、あるマイクロフォン(基準マイクロフォン)を介してある時点にて受け付けられた音声信号(基準音声信号)のパワーを用いるように音声信号処理装置が構成されている場合、取得パワーの基となった音声信号と、基準音声信号と、が比較的大きく相違してしまう虞があった。
これに対処するため、複数の時点にて取得されたパワーを平均した値を上記取得パワー及び基準パワーとして用いるように上記音声信号処理装置を構成することが好適であると考えられる。
また、背景雑音のパワーは、時間の経過に伴って変動する。従って、背景雑音に基づいて上記取得パワー及び基準パワーを取得するように音声信号処理装置が構成されている場合にも、複数の時点にて取得されたパワーを平均した値を上記取得パワー及び基準パワーとして用いるように上記音声信号処理装置を構成することが好適であると考えられる。
しかしながら、このように上記音声信号処理装置が構成された場合、音声信号処理装置は、例えば、パワーP0がN回だけ取得されたときと、パワーP0よりも所定量ΔPだけ小さいパワーP1及びパワーP0よりも所定量ΔPだけ大きいパワーP2のそれぞれがN/2回ずつ取得されたときと、で同一の取得パワーP0/Nを取得してしまう。
即ち、この場合、音声信号処理装置は、所定の基準音声信号が入力された場合に取得されるパワーと、所定の基準パワーと、が一致しているか否かを高い精度にて判定することができないという問題があった。
このため、本発明の目的は、上述した課題である「所定の基準音声信号が入力された場合に取得されるパワーと、所定の基準パワーと、が一致しているか否かを高い精度にて判定することができないこと」を解決することが可能な音声信号処理装置を提供することにある。
かかる目的を達成するため本発明の一形態である音声信号処理装置は、
入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得するパワー取得手段と、
上記取得されたパワーの大きさを確率変数とする確率分布を取得する確率分布取得手段と、
所定の基準音声信号が上記パワー取得手段に入力された場合に当該パワー取得手段により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを上記取得された確率分布に基づいて判定する一致度判定手段と、
を備える。
また、本発明の他の形態である音声信号処理方法は、
入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得し、
前記取得されたパワーの大きさを確率変数とする確率分布を取得し、
所定の基準音声信号が入力されることにより取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを前記取得された確率分布に基づいて判定する、方法である。
また、本発明の他の形態である音声信号処理プログラムは、
音声信号処理装置に、
入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得するパワー取得手段と、
上記取得されたパワーの大きさを確率変数とする確率分布を取得する確率分布取得手段と、
所定の基準音声信号が上記パワー取得手段に入力された場合に当該パワー取得手段により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを上記取得された確率分布に基づいて判定する一致度判定手段と、
を実現させるためのプログラムである。
本発明は、以上のように構成されることにより、所定の基準音声信号が入力された場合に取得されるパワーと、所定の基準パワーと、が一致しているか否かを高い精度にて判定することができる。
本発明の第1実施形態に係る音声信号処理装置の機能の概略を表すブロック図である。 図1に示した音声信号処理装置のCPUが実行する音声信号処理プログラムを示したフローチャートである。 各マイクロフォンを介して入力された音声信号のパワーの大きさを確率変数とする確率分布を表すグラフである。 各マイクロフォンに対する確率分布が互いに比較的大きく相違する場合における確率分布を表すグラフである。 各マイクロフォンに対する確率分布が互いに略一致する場合における確率分布を表すグラフである。 本発明の第2実施形態に係る音声信号処理装置の機能の概略を表すブロック図である。
本発明の一形態である音声信号処理装置は、
入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得するパワー取得手段と、
上記取得されたパワーの大きさを確率変数とする確率分布を取得する確率分布取得手段と、
所定の基準音声信号が上記パワー取得手段に入力された場合に当該パワー取得手段により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを上記取得された確率分布に基づいて判定する一致度判定手段と、
を備える。
これによれば、音声信号処理装置は、取得されたパワーの大きさを確率変数とする確率分布に基づいて、基準音声信号が入力された場合に取得されるパワーと、基準パワーと、が一致しているか否かを判定する。これにより、基準音声信号が入力された場合に取得されるパワーと、基準パワーと、が一致しているか否かを高い精度にて判定することができる。
この場合、上記パワー取得手段は、上記受け付けた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して上記パワーを取得するように構成され、
上記確率分布取得手段は、上記分割された複数の部分のそれぞれに対して取得されたパワーに基づいて上記確率分布を取得するように構成されることが好適である。
この場合、上記一致度判定手段は、上記取得された確率分布と、所定の基準確率分布と、が一致している程度が高くなるほど小さくなる分布間距離値を取得し、当該取得した分布間距離値が予め設定された基準距離値よりも小さい場合に上記一致度が上記基準一致度よりも高いと判定するように構成されることが好適である。
この場合、上記パワー取得手段は、上記パワーを周波数毎に取得するように構成され、
上記確率分布取得手段は、所定の周波数の範囲毎に上記確率分布を取得するように構成されることが好適である。
ところで、パワーの大きさを確率変数とする確率分布は、周波数の範囲毎に異なる。従って、上記のように音声信号処理装置を構成することにより、基準音声信号が入力された場合に取得されるパワーと、基準パワーと、が一致しているか否かをより一層高い精度にて判定することができる。
この場合、上記パワー取得手段は、上記取得されたパワーを上記基準パワーに近づけるように補正するように構成され、
上記確率分布取得手段は、上記補正されたパワーに基づいて上記確率分布を取得するように構成され、
上記一致度判定手段は、上記基準音声信号が上記パワー取得手段に入力された場合に当該パワー取得手段により補正されたパワーと、上記基準パワーと、が一致している程度を表す一致度が上記基準一致度よりも高いか否かを上記取得された確率分布に基づいて判定するように構成されることが好適である。
これによれば、基準音声信号がパワー取得手段に入力された場合に当該パワー取得手段により補正されたパワーと、基準パワーと、が一致している否かを高い精度にて判定することができる。即ち、パワー取得手段によってパワーが適切に補正されているか否かを判定することができる。
この場合、上記確率分布取得手段は、上記確率分布を表す関数であって、上記確率変数に対して連続的に変化する関数である確率密度関数を推定することにより当該確率分布を取得するように構成されることが好適である。
この場合、上記確率密度関数は、上記確率変数が0から所定のピーク位置値へ向けて増加するにつれて単調に増加し、且つ、当該確率変数が当該ピーク位置値から増加するにつれて単調に減少する関数であることが好適である。
この場合、上記確率密度関数は、ガンマ分布を表す確率密度関数であることが好適である。
背景雑音のパワーを確率変数とする確率分布は、ガンマ分布によりよく表される。従って、上記のように音声信号処理装置を構成することにより、基準音声信号として背景雑音を表す音声信号が用いられた場合に、音声信号処理装置は、パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布をよく表す確率密度関数を推定することができる。
この場合、上記音声信号処理装置は、
周囲の音声を集音し、当該集音した音声を表す音声信号を出力するマイクロフォンを複数備えるとともに、
上記パワー取得手段は、上記複数のマイクロフォンのそれぞれにより出力された音声信号が入力されるように構成されることが好適である。
この場合、上記確率分布取得手段は、上記複数のマイクロフォンのうちの第1のマイクロフォンにより出力された音声信号に基づいて上記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を取得するように構成され、
上記音声信号処理装置は、更に、
上記複数のマイクロフォンのうちの第2のマイクロフォンにより出力された音声信号に基づいて上記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を上記基準確率分布として取得する基準確率分布取得手段を備えることが好適である。
また、上記音声信号処理装置の他の態様において、
上記確率分布取得手段は、上記複数のマイクロフォンのうちの1つにより出力された音声信号に基づいて上記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を取得するように構成され、
上記音声信号処理装置は、更に、
上記複数のマイクロフォンのそれぞれにより出力された音声信号に基づいて上記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を上記基準確率分布として取得する基準確率分布取得手段を備えることが好適である。
この場合、上記確率分布取得手段は、上記複数のマイクロフォンのうちの1つにより出力された音声信号に基づいて上記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を取得するように構成され、
上記一致度判定手段は、上記基準確率分布として、予め記憶された値を用いるように構成されることが好適である。
また、本発明の他の形態である音声信号処理方法は、
入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得し、
上記取得されたパワーの大きさを確率変数とする確率分布を取得し、
所定の基準音声信号が入力されることにより取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを上記取得された確率分布に基づいて判定する、方法である。
この場合、上記音声信号処理方法は、
上記受け付けた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して上記パワーを取得し、
上記分割された複数の部分のそれぞれに対して取得されたパワーに基づいて上記確率分布を取得することが好適である。
この場合、上記音声信号処理方法は、
上記取得された確率分布と、所定の基準確率分布と、が一致している程度が高くなるほど小さくなる分布間距離値を取得し、当該取得した分布間距離値が予め設定された基準距離値よりも小さい場合に上記一致度が上記基準一致度よりも高いと判定することが好適である。
また、本発明の他の形態である音声信号処理プログラムは、
音声信号処理装置に、
入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得するパワー取得手段と、
上記取得されたパワーの大きさを確率変数とする確率分布を取得する確率分布取得手段と、
所定の基準音声信号が上記パワー取得手段に入力された場合に当該パワー取得手段により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを上記取得された確率分布に基づいて判定する一致度判定手段と、
を実現させるためのプログラムである。
この場合、上記パワー取得手段は、上記受け付けた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して上記パワーを取得するように構成され、
上記確率分布取得手段は、上記分割された複数の部分のそれぞれに対して取得されたパワーに基づいて上記確率分布を取得するように構成されることが好適である。
この場合、上記一致度判定手段は、上記取得された確率分布と、所定の基準確率分布と、が一致している程度が高くなるほど小さくなる分布間距離値を取得し、当該取得した分布間距離値が予め設定された基準距離値よりも小さい場合に上記一致度が上記基準一致度よりも高いと判定するように構成されることが好適である。
上述した構成を有する、音声信号処理方法、又は、音声信号処理プログラム、の発明であっても、上記音声信号処理装置と同様の作用を有するために、上述した本発明の目的を達成することができる。
以下、本発明に係る、音声信号処理装置、音声信号処理方法、及び、音声信号処理プログラム、の実施形態について図1〜図6を参照しながら説明する。
<第1実施形態>
(構成)
図1に示したように、第1実施形態に係る音声信号処理装置1は、情報処理装置である。音声信号処理装置1は、図示しない中央処理装置(CPU;Central Processing Unit)、記憶装置(メモリ及びハードディスク駆動装置(HDD;Hard Disk Drive))、及び、入力装置を備える。
入力装置は、複数(本例では、6つ)のマイクロフォンMC1〜MC6と接続されている。各マイクロフォンMC1〜MC6は、周囲の音声を集音し、集音した音声を表す音声信号を入力装置へ出力する。入力装置は、各マイクロフォンMC1〜MC6から出力された音声信号を入力し、入力された音声信号を受け付ける。なお、入力装置は、パワー取得手段の一部を構成している。
上記のように構成された音声信号処理装置1の機能は、音声信号処理装置1のCPUが後述する図2に示したフローチャートにより表される音声信号処理プログラム等を実行することにより、実現される。なお、この機能は、論理回路等のハードウェアにより実現されていてもよい。
この音声信号処理装置1は、複数のマイクロフォンMC1〜MC6のそれぞれに対して、同様に作動する。従って、以下、複数のマイクロフォンMC1〜MC6のうちの任意の1つであるマイクロフォンMCk(ここで、kは、1〜6の整数)に対する、音声信号処理装置1の機能及び作動について説明する。
この音声信号処理装置1の機能は、パワー取得部(パワー取得手段)10と、確率分布取得部(確率分布取得手段、基準確率分布取得手段)20と、一致度判定部(一致度判定手段)30と、を含む。
パワー取得部10は、マイクロフォンMCkから入力された音声信号を受け付ける。パワー取得部10は、受け付けた音声信号に対してA/D(アナログデジタル)変換処理を行うことにより、音声信号をアナログ信号からデジタル信号に変換する。
更に、パワー取得部10は、変換後の音声信号を所定の(本例では、一定の)フレーム間隔毎に分割する。パワー取得部10は、以下の処理を、分割された音声信号の各部分(フレーム信号)に対して行う。
パワー取得部10は、フレーム信号に対して、所定の前処理(例えば、プリエンファシス処理、及び、窓関数をかける窓掛け処理等)を行う。次いで、パワー取得部10は、フレーム信号に対して高速フーリエ変換(FFT;Fast Fourier Transform)処理を行うことにより、周波数領域におけるフレーム信号(実数部と虚数部とからなる複素数)を取得する。
そして、パワー取得部10は、周波数毎に、取得されたフレーム信号の実数部を二乗した値と、取得されたフレーム信号の虚数部を二乗した値と、の和をパワー(音声信号のパワー)として算出する。
例えば、デジタル信号として、サンプリング周波数が44.1kHzであり且つ16ビットにて量子化された信号が用いられた場合において、フレーム間隔が10msであり、且つ、1024点でFFT処理を行った場合、約43Hz毎のパワーx(t)が算出される。ここで、iは周波数に対応する番号(この例では、iが1だけ増加することと周波数が約43Hzだけ増加することとが対応している)であり、tは、時間軸におけるフレーム信号の位置を表す番号(例えば、フレームを特定するためのフレーム番号)である。
このように、パワー取得部10は、マイクロフォンMCkを介して受け付けられた音声信号を所定のフレーム間隔毎に分割し、当該分割された音声信号の各部分(フレーム信号)に対してパワーを周波数毎に算出する。
パワー取得部10は、算出されたパワーx(t)を、下記式(1)に基づいて、所定の基準パワーに近づけるように補正する。即ち、パワー取得部10は、周波数毎に、記憶装置に予め記憶されている補正係数fを、上記算出されたパワーx(t)に乗じることにより、当該パワーx(t)を補正する。
Figure 0005772591
そして、パワー取得部10は、補正したパワーy(t)を出力する。ここで、補正係数fは、周波数に対応する番号i(即ち、周波数)、及び、マイクロフォンMC1〜MC6を特定するための情報毎に設定された値である。補正係数fは、算出されたパワーx(t)が補正されることにより当該パワーx(t)が上記基準パワーに近づくように設定されている。
確率分布取得部20は、パワー取得部10により出力されたパワーy(t)の大きさを確率変数とする確率分布を取得する。即ち、確率分布取得部20は、パワー取得部10により補正されたパワーに基づいて確率分布を取得する、と言うことができる。
具体的には、確率分布取得部20は、パワー取得部10により受け付けられた音声信号が背景雑音を表す音声信号である場合、確率分布を取得し、一方、パワー取得部10により受け付けられた音声信号が背景雑音以外の音声を表す音声信号である場合、確率分布を取得しないように構成されている。なお、本明細書において、背景雑音を表す音声信号は、基準音声信号とも呼ばれる。
ここで、背景雑音は、マイクロフォンMC1〜MC6の近傍に音源が存在していない状態においてマイクロフォンMC1〜MC6により集音される音声である。本例では、確率分布取得部20は、パワー取得部10により出力されたパワーy(t)の大きさを所定の期間にわたって平均した値が予め設定された閾値よりも小さい場合、パワー取得部10により受け付けられた音声信号が背景雑音を表す音声信号であると判定する。
先ず、確率分布取得部20は、予め設定されたパワーの範囲毎に、パワー取得部10により出力されたパワーy(t)のうちの、その範囲内に存在するパワーy(t)の数(即ち、その範囲内のパワーが出現する頻度)を計数する。
図3は、各マイクロフォンMC1〜MC6を介して入力された音声信号のパワーの大きさを確率変数とする確率分布を表すグラフである。図3における棒グラフは、頻度に比例する長さを有する。
確率分布取得部20は、複数(本例では、100個)のフレーム信号(分割された音声信号の複数の部分)のそれぞれに対して取得されたパワーy(t)に基づいて上記頻度を計数する。従って、本例では、確率分布取得部20は、51200(=512×100)個のパワーy(t)に基づいて上記頻度を計数する。
なお、頻度を計数するために用いるパワーy(t)の基となるフレーム信号の数が多くなるほど、計数された頻度の統計的ばらつきは小さくなる。一方、当該フレーム信号の数が多くなるほど、背景雑音に突発的に発生する雑音が含まれる可能性が高くなる。従って、頻度を計数するために用いるパワーy(t)の基となるフレーム信号の数は、1秒乃至10秒に相当する数であることが好適である。
次に、確率分布取得部20は、計数された頻度に基づいて、上記確率分布を表す関数であって、上記確率変数に対して連続的に変化する関数である確率密度関数を推定する。これによれば、後述する分布間距離値を算出するための処理負荷を軽減することができる。更に、頻度が計数されていない範囲に対する確率分布を容易に取得することができる。
ところで、図3に示したように、この頻度の分布は、確率変数が0から所定のピーク位置値へ向けて増加するにつれて単調に増加し、且つ、当該確率変数が当該ピーク位置値から増加するにつれて単調に減少する。この頻度の分布(即ち、背景雑音のパワーを確率変数とする確率分布)は、ガンマ分布によりよく表される。ガンマ分布は、下記式(2)により表される確率密度関数によって表される。
Figure 0005772591
上記式(2)により表される確率密度関数P(y)は、確率変数yが0から所定のピーク位置値へ向けて増加するにつれて単調に増加し、且つ、確率変数yが当該ピーク位置値から増加するにつれて単調に減少する関数である。
ここで、上記式(2)において、補正後のパワーy(t)を確率変数yと置いている。また、Γ(λ)は、ガンマ関数である。λは、ガンマ分布の形状母数である。σは、ガンマ分布の尺度母数である。
具体的には、確率分布取得部20は、形状母数λ及び尺度母数σを、計数された頻度に基づいて決定することにより確率密度関数を推定する。本例では、確率分布取得部20は、最尤推定を行うことにより形状母数λ及び尺度母数σを決定する。これにより、確率分布取得部20は、図3における実線により示したように、確率密度関数を推定する。
即ち、確率分布取得部20は、上記確率分布を表す関数であって、上記確率変数に対して連続的に変化する関数である確率密度関数を推定することにより当該確率分布を取得するように構成されている。
一致度判定部30は、マイクロフォンMC1〜MC6の任意の2つからなる組み合わせのそれぞれに対して、分布間距離値を算出(取得)する。分布間距離値は、確率分布取得部20により取得された第1の確率分布と、確率分布取得部20により取得された第2の確率分布と、が一致している程度が高くなるほど小さくなる値である。
第1の確率分布は、マイクロフォンMC1〜MC6の任意の2つからなる組み合わせを構成する第1のマイクロフォンにより出力された音声信号に基づいてパワー取得部10により出力されたパワーの大きさを確率変数とする確率分布である。第2の確率分布は、マイクロフォンMC1〜MC6の2つの組み合わせを構成する第2のマイクロフォンにより出力された音声信号に基づいてパワー取得部10により出力されたパワーの大きさを確率変数とする確率分布(基準確率分布)である。
一致度判定部30は、下記式(3)に基づいて分布間距離値DKLを算出する。本例では、分布間距離値DKLは、KL距離(Kullback−Leibler divergence)とも呼ばれる値である。ここで、p(y)は、第1の確率分布を表す確率密度関数であり、q(y)は、第2の確率分布を表す確率密度関数である。
Figure 0005772591
なお、分布間距離値は、複数の確率分布が互いに一致している程度を表す値であればよく、バタチャリヤ距離(Bhattacharyya distance)と呼ばれる値であってもよい。
そして、一致度判定部30は、マイクロフォンMC1〜MC6の任意の2つの組み合わせのそれぞれに対して算出された分布間距離値DKLの最大値を取得する。次いで、一致度判定部30は、取得した分布間距離値DKLの最大値が、予め設定された基準距離値よりも小さいか否かを判定する。
一致度判定部30は、取得した分布間距離値DKLの最大値が基準距離値よりも小さい場合、一致度が基準一致度よりも高いと判定する。ここで、一致度は、基準音声信号(即ち、背景雑音を表す音声信号)が第1のマイクロフォンを介してパワー取得部10に入力された場合にパワー取得部10により出力されるパワーと、基準音声信号が第2のマイクロフォンを介してパワー取得部10に入力された場合にパワー取得部10により出力されるパワー(基準パワー)と、が一致している程度を表す。
このように、一致度判定部30は、一致度が予め設定された基準一致度よりも高いか否かを、確率分布取得部20により取得された確率分布に基づいて判定している、と言うことができる。
一致度判定部30は、一致度が基準一致度よりも高いと判定した場合、パワー取得部10によるパワーの補正が正常に行われている旨を表す正常信号を出力する。一方、一致度判定部30は、一致度が基準一致度よりも低いと判定した場合、パワー取得部10によるパワーの補正が正常に行われていない旨を表すエラー信号を出力する。
(作動)
次に、上記のように構成された音声信号処理装置1の作動について説明する。
音声信号処理装置1のCPUは、図2にフローチャートにより示した音声信号処理プログラムを、マイクロフォンMCkを介して音声信号を受け付ける毎に実行するようになっている。
具体的に述べると、CPUは、音声信号処理プログラムの処理を開始すると、ステップ205にて、受け付けた音声信号をフレーム間隔毎に分割し、分割された音声信号の各部分(フレーム信号)に対するパワーx(t)を算出する。更に、CPUは、算出されたパワーx(t)を、上記式(1)に基づいて補正することにより補正後のパワーy(t)を算出(取得)する(パワー取得工程)。
次いで、CPUは、ステップ210にて、受け付けた音声信号が背景雑音を表す音声信号であるか否かを判定する。
いま、受け付けた音声信号が背景雑音を表す音声信号である場合を想定して説明を続ける。この場合、CPUは、「Yes」と判定してステップ215へ進む。
そして、CPUは、上記ステップ205にて算出されたパワーy(t)の大きさを確率変数とする確率分布を取得する。
具体的には、CPUは、予め設定されたパワーの範囲毎に、上記算出されたパワーy(t)のうちの、その範囲内のパワーy(t)の数(頻度)を計数する。そして、CPUは、計数された頻度に基づいて、ガンマ分布の形状母数λ及び尺度母数σを決定することにより上記式(2)により表される確率密度関数を推定する。このようにして、CPUは、パワーy(t)の大きさを確率変数とする確率分布を取得する(確率分布取得工程)。
次いで、CPUは、取得された確率分布と、上記式(3)と、に基づいて、マイクロフォンMC1〜MC6の任意の2つの組み合わせのそれぞれに対する分布間距離値DKLを算出する(ステップ220、一致度判定工程の一部)。
そして、CPUは、マイクロフォンMC1〜MC6の任意の2つの組み合わせのそれぞれに対して算出した分布間距離値DKLの最大値を取得する。次いで、CPUは、取得した分布間距離値DKLの最大値が上記基準距離値(本例では、0.01)よりも小さいか否かを判定する。これにより、CPUは、一致度が基準一致度よりも高いか否かを判定する(ステップ225、一致度判定工程の一部)。
いま、図4に示したように、各マイクロフォンMC1〜MC6に対して取得された確率分布が互いに比較的大きく相違している例を想定して説明を続ける。この例では、分布間距離値DKLの最大値は、4.5となる。従って、この場合、CPUは、一致度が基準一致度よりも低いと判定し、エラー信号を出力する。その後、CPUは、この音声信号処理プログラムの実行を終了する。
次に、図5に示したように、各マイクロフォンMC1〜MC6に対して取得された確率分布が互いに略一致している例を想定して説明を続ける。この例では、分布間距離値DKLの最大値は、0.0044となる。従って、この場合、CPUは、一致度が基準一致度よりも高いと判定し、正常信号を出力する。その後、CPUは、この音声信号処理プログラムの実行を終了する。
なお、受け付けた音声信号が背景雑音を表す音声信号でない場合、CPUは、ステップ210にて「No」と判定して、ステップ215〜ステップ225の処理を実行することなく、この音声信号処理プログラムの実行を終了する。
以上、説明したように、本発明による音声信号処理装置の第1実施形態によれば、音声信号処理装置1は、取得されたパワーの大きさを確率変数とする確率分布に基づいて、基準音声信号が第1のマイクロフォンを介して入力された場合に取得されるパワーと、基準音声信号が第2のマイクロフォンを介して入力された場合に取得されるパワー(基準パワー)と、が一致しているか否かを判定する。これにより、基準音声信号が入力された場合に取得されるパワーと、基準パワーと、が一致しているか否かを高い精度にて判定することができる。
また、上記第1実施形態において、音声信号処理装置1は、補正されたパワーに基づいて、確率分布を取得するとともに、一致度が基準一致度よりも高いか否かを判定するように構成されている。
これによれば、基準音声信号がパワー取得部10に入力された場合にパワー取得部10により補正されたパワーと、基準パワーと、が一致している否かを高い精度にて判定することができる。即ち、パワー取得部10によってパワーが適切に補正されているか否かを判定することができる。
更に、上記第1実施形態において、音声信号処理装置1は、パワーの大きさを確率変数とする確率分布を表す関数として、ガンマ分布を表す確率密度関数を用いるように構成されている。これにより、音声信号処理装置1は、パワーの大きさを確率変数とする確率分布をよく表す確率密度関数を推定することができる。
<第2実施形態>
次に、本発明の第2実施形態に係る音声信号処理装置について図6を参照しながら説明する。
第2実施形態に係る音声信号処理装置100の機能は、パワー取得部(パワー取得手段)110と、確率分布取得部(確率分布取得手段)120と、一致度判定部(一致度判定手段)130と、を含む。
パワー取得部110は、入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得する。
確率分布取得部120は、パワー取得部110により取得されたパワーの大きさを確率変数とする確率分布を取得する。
一致度判定部130は、所定の基準音声信号がパワー取得部110に入力された場合にパワー取得部110により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを、確率分布取得部120により取得された確率分布に基づいて判定する。
この第2実施形態に係る音声信号処理装置100によれば、音声信号処理装置100は、取得されたパワーの大きさを確率変数とする確率分布に基づいて、基準音声信号が入力された場合に取得されるパワーと、基準パワーと、が一致しているか否かを判定する。これにより、基準音声信号が入力された場合に取得されるパワーと、基準パワーと、が一致しているか否かを高い精度にて判定することができる。
以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成及び詳細に、本願発明の範囲内において当業者が理解し得る様々な変更をすることができる。
例えば、上記実施形態においては、確率分布取得部20は、所定の周波数の範囲毎に確率分布を取得するように構成されていてもよい。ところで、パワーの大きさを確率変数とする確率分布は、周波数の範囲毎に異なる。従って、このように音声信号処理装置を構成することにより、基準音声信号が入力された場合に取得されるパワーと、基準パワーと、が一致しているか否かをより一層高い精度にて判定することができる。
なお、上記実施形態の変形例において、確率分布取得部20は、確率密度関数を推定することなく、計数された頻度を確率分布として用いるように構成されていてもよい。また、確率分布取得部20は、確率分布を表す関数として、ガンマ分布を表す確率密度関数を用いるように構成されていたが、ガンマ分布以外の分布(例えば、正規分布等)を表す確率密度関数を用いるように構成されていてもよい。
更に、上記実施形態の変形例において、音声信号処理装置1は、一致度が基準一致度よりも低いと判定した場合に、補正係数fを設定し直すようにユーザに通知するように構成されていてもよい。また、音声信号処理装置1は、一致度が基準一致度よりも低いと判定した場合に、補正係数fを変更するように構成されていてもよい。
また、上記実施形態において、音声信号処理装置1は、マイクロフォンMC1〜MC6の任意の2つからなる組み合わせのすべてに対して分布間距離値を算出し、算出した分布間距離値の最大値に基づいて一致度が基準一致度よりも高いか否かを判定するように構成されていた。
ところで、上記実施形態の変形例において、音声信号処理装置1は、マイクロフォンMC1〜MC6の1つを基準マイクロフォンとして定め、その基準マイクロフォンと、他のマイクロフォンMC1〜MC6のそれぞれと、の組み合わせに対して分布間距離値を算出し、算出した分布間距離値の最大値に基づいて一致度が基準一致度よりも高いか否かを判定するように構成されていてもよい。
また、上記実施形態において、音声信号処理装置1は、算出された分布間距離値の最大値に基づいて一致度が基準一致度よりも高いか否かを判定するように構成されていたが、算出された分布間距離値を平均した値に基づいて一致度が基準一致度よりも高いか否かを判定するように構成されていてもよい。
また、上記実施形態において、音声信号処理装置1は、補正後のパワーに基づいて、一致度が基準一致度よりも高いか否かを判定するように構成されていたが、補正前のパワーに基づいて、一致度が基準一致度よりも高いか否かを判定するように構成されていてもよい。これによれば、各マイクロフォンMC1〜MC6の周波数特性が一致しているか否かを判定することができる。
また、上記実施形態において、音声信号処理装置1が備えるマイクロフォンの数は、6つであったが、1つ以上の任意の数であってもよい。
また、上記実施形態において、確率分布取得部20は、1つのマイクロフォンにより出力された音声信号に基づいてパワー取得部10により取得されたパワーの大きさを確率変数とする確率分布を基準確率分布として取得するように構成されていた。
ところで、確率分布取得部20は、複数のマイクロフォンにより出力された音声信号に基づいてパワー取得部10により取得されたパワーの大きさを確率変数とする確率分布を基準確率分布として取得するように構成されていてもよい。例えば、確率分布取得部20は、複数のマイクロフォンMC1〜MC6に対して取得されたパワーのすべてに基づいて基準確率分布を取得するように構成されていてもよい。
また、一致度判定部30は、基準確率分布として、記憶装置に予め記憶された値を用いるように構成されていてもよい。
また、上記実施形態においては、確率分布取得部20は、受け付けられた音声信号が表す音声が背景雑音である場合に確率分布を取得するように構成されていたが、受け付けられた音声信号が表す音声が背景雑音以外の予め定められた音声である場合に確率分布を取得するように構成されていてもよい。
また、上記実施形態においてプログラムは、記憶装置に記憶されていたが、コンピュータが読み取り可能な記録媒体に記憶されていてもよい。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。
また、上記実施形態の他の変形例として、上述した実施形態及び変形例の任意の組み合わせが採用されてもよい。
なお、本発明は、日本国にて2009年3月18日に出願された特願2009−065443の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願にて開示された内容のすべてが本明細書に含まれるものとする。
本発明は、複数のマイクロフォンを備え、各マイクロフォンを介して入力された音声信号を受け付け、受け付けた音声信号を処理する音声信号処理装置等に適用可能である。
1 音声信号処理装置
10 パワー取得部
20 確率分布取得部
30 一致度判定部
100 音声信号処理装置
110 パワー取得部
120 確率分布取得部
130 一致度判定部
MC1〜MC6 マイクロフォン

Claims (18)

  1. 入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得するパワー取得手段と、
    前記取得されたパワーの大きさを確率変数とする確率分布を取得する確率分布取得手段と、
    所定の基準音声信号が前記パワー取得手段に入力された場合に当該パワー取得手段により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを前記取得された確率分布に基づいて判定する一致度判定手段と、
    を備える音声信号処理装置。
  2. 請求項1に記載の音声信号処理装置であって、
    前記パワー取得手段は、前記受け付けた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して前記パワーを取得するように構成され、
    前記確率分布取得手段は、前記分割された複数の部分のそれぞれに対して取得されたパワーに基づいて前記確率分布を取得するように構成された音声信号処理装置。
  3. 請求項1又は請求項2に記載の音声信号処理装置であって、
    前記一致度判定手段は、前記取得された確率分布と、所定の基準確率分布と、が一致している程度が高くなるほど小さくなる分布間距離値を取得し、当該取得した分布間距離値が予め設定された基準距離値よりも小さい場合に前記一致度が前記基準一致度よりも高いと判定するように構成された音声信号処理装置。
  4. 請求項1乃至請求項3のいずれか一項に記載の音声信号処理装置であって、
    前記パワー取得手段は、前記パワーを周波数毎に取得するように構成され、
    前記確率分布取得手段は、所定の周波数の範囲毎に前記確率分布を取得するように構成された音声信号処理装置。
  5. 請求項1乃至請求項4のいずれか一項に記載の音声信号処理装置であって、
    前記パワー取得手段は、前記取得されたパワーを前記基準パワーに近づけるように補正するように構成され、
    前記確率分布取得手段は、前記補正されたパワーに基づいて前記確率分布を取得するように構成され、
    前記一致度判定手段は、前記基準音声信号が前記パワー取得手段に入力された場合に当該パワー取得手段により補正されたパワーと、前記基準パワーと、が一致している程度を表す一致度が前記基準一致度よりも高いか否かを前記取得された確率分布に基づいて判定するように構成された音声信号処理装置。
  6. 請求項1乃至請求項5のいずれか一項に記載の音声信号処理装置であって、
    前記確率分布取得手段は、前記確率分布を表す関数であって、前記確率変数に対して連続的に変化する関数である確率密度関数を推定することにより当該確率分布を取得するように構成された音声信号処理装置。
  7. 請求項6に記載の音声信号処理装置であって、
    前記確率密度関数は、前記確率変数が0から所定のピーク位置値へ向けて増加するにつれて単調に増加し、且つ、当該確率変数が当該ピーク位置値から増加するにつれて単調に減少する関数である音声信号処理装置。
  8. 請求項7に記載の音声信号処理装置であって、
    前記確率密度関数は、ガンマ分布を表す確率密度関数である音声信号処理装置。
  9. 請求項1乃至請求項8のいずれか一項に記載の音声信号処理装置であって、
    周囲の音声を集音し、当該集音した音声を表す音声信号を出力するマイクロフォンを複数備えるとともに、
    前記パワー取得手段は、前記複数のマイクロフォンのそれぞれにより出力された音声信号が入力されるように構成された音声信号処理装置。
  10. 入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得するパワー取得手段と、
    前記取得されたパワーの大きさを確率変数とする確率分布を取得する確率分布取得手段と、
    所定の基準音声信号が前記パワー取得手段に入力された場合に当該パワー取得手段により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを前記取得された確率分布に基づいて判定する一致度判定手段と、
    を備え、
    前記一致度判定手段は、前記取得された確率分布と、所定の基準確率分布と、が一致している程度が高くなるほど小さくなる分布間距離値を取得し、当該取得した分布間距離値が予め設定された基準距離値よりも小さい場合に前記一致度が前記基準一致度よりも高いと判定するように構成され、
    周囲の音声を集音し、当該集音した音声を表す音声信号を出力するマイクロフォンを複数備えるとともに、
    前記パワー取得手段は、前記複数のマイクロフォンのそれぞれにより出力された音声信号が入力されるように構成され、
    前記確率分布取得手段は、前記複数のマイクロフォンのうちの第1のマイクロフォンにより出力された音声信号に基づいて前記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を取得するように構成され、
    更に
    前記複数のマイクロフォンのうちの第2のマイクロフォンにより出力された音声信号に基づいて前記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を前記基準確率分布として取得する基準確率分布取得手段を備える音声信号処理装置。
  11. 入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得するパワー取得手段と、
    前記取得されたパワーの大きさを確率変数とする確率分布を取得する確率分布取得手段と、
    所定の基準音声信号が前記パワー取得手段に入力された場合に当該パワー取得手段により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを前記取得された確率分布に基づいて判定する一致度判定手段と、
    を備え、
    前記一致度判定手段は、前記取得された確率分布と、所定の基準確率分布と、が一致している程度が高くなるほど小さくなる分布間距離値を取得し、当該取得した分布間距離値が予め設定された基準距離値よりも小さい場合に前記一致度が前記基準一致度よりも高いと判定するように構成され、
    周囲の音声を集音し、当該集音した音声を表す音声信号を出力するマイクロフォンを複数備えるとともに、
    前記パワー取得手段は、前記複数のマイクロフォンのそれぞれにより出力された音声信号が入力されるように構成され、
    前記確率分布取得手段は、前記複数のマイクロフォンのうちの1つにより出力された音声信号に基づいて前記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を取得するように構成され、
    更に
    前記複数のマイクロフォンのそれぞれにより出力された音声信号に基づいて前記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を前記基準確率分布として取得する基準確率分布取得手段を備える音声信号処理装置。
  12. 請求項10又は請求項11に記載の音声信号処理装置であって、
    前記確率分布取得手段は、前記複数のマイクロフォンのうちの1つにより出力された音声信号に基づいて前記パワー取得手段により取得されたパワーの大きさを確率変数とする確率分布を取得するように構成され、
    前記一致度判定手段は、前記基準確率分布として、予め記憶された値を用いるように構成された音声信号処理装置。
  13. 入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得し、
    前記取得されたパワーの大きさを確率変数とする確率分布を取得し、
    所定の基準音声信号が入力されることにより取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを前記取得された確率分布に基づいて判定する、音声信号処理方法。
  14. 請求項13に記載の音声信号処理方法であって、
    前記受け付けた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して前記パワーを取得し、
    前記分割された複数の部分のそれぞれに対して取得されたパワーに基づいて前記確率分布を取得する、音声信号処理方法。
  15. 請求項13又は請求項14に記載の音声信号処理方法であって、
    前記取得された確率分布と、所定の基準確率分布と、が一致している程度が高くなるほど小さくなる分布間距離値を取得し、当該取得した分布間距離値が予め設定された基準距離値よりも小さい場合に前記一致度が前記基準一致度よりも高いと判定する、音声信号処理方法。
  16. 音声信号処理装置に、
    入力された音声信号を受け付けるとともに、当該受け付けた音声信号に基づいて、その音声信号が表す音声の大きさを表すパワーを取得するパワー取得手段と、
    前記取得されたパワーの大きさを確率変数とする確率分布を取得する確率分布取得手段と、
    所定の基準音声信号が前記パワー取得手段に入力された場合に当該パワー取得手段により取得されるパワーと、所定の基準パワーと、が一致している程度を表す一致度が所定の基準一致度よりも高いか否かを前記取得された確率分布に基づいて判定する一致度判定手段と、
    を実現させるための音声信号処理プログラム。
  17. 請求項16に記載の音声信号処理プログラムであって、
    前記パワー取得手段は、前記受け付けた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して前記パワーを取得するように構成され、
    前記確率分布取得手段は、前記分割された複数の部分のそれぞれに対して取得されたパワーに基づいて前記確率分布を取得するように構成された音声信号処理プログラム。
  18. 請求項16又は請求項17に記載の音声信号処理プログラムであって、
    前記一致度判定手段は、前記取得された確率分布と、所定の基準確率分布と、が一致している程度が高くなるほど小さくなる分布間距離値を取得し、当該取得した分布間距離値が予め設定された基準距離値よりも小さい場合に前記一致度が前記基準一致度よりも高いと判定するように構成された音声信号処理プログラム。
JP2011504722A 2009-03-18 2010-02-18 音声信号処理装置 Active JP5772591B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011504722A JP5772591B2 (ja) 2009-03-18 2010-02-18 音声信号処理装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009065443 2009-03-18
JP2009065443 2009-03-18
PCT/JP2010/001016 WO2010106734A1 (ja) 2009-03-18 2010-02-18 音声信号処理装置
JP2011504722A JP5772591B2 (ja) 2009-03-18 2010-02-18 音声信号処理装置

Publications (2)

Publication Number Publication Date
JPWO2010106734A1 JPWO2010106734A1 (ja) 2012-09-20
JP5772591B2 true JP5772591B2 (ja) 2015-09-02

Family

ID=42739400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011504722A Active JP5772591B2 (ja) 2009-03-18 2010-02-18 音声信号処理装置

Country Status (3)

Country Link
US (1) US8738367B2 (ja)
JP (1) JP5772591B2 (ja)
WO (1) WO2010106734A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104380378A (zh) * 2012-05-31 2015-02-25 丰田自动车株式会社 声源检测装置、噪声模型生成装置、噪声抑制装置、声源方位推定装置、接近车辆检测装置以及噪声抑制方法
KR102512713B1 (ko) * 2015-04-20 2023-03-23 삼성디스플레이 주식회사 유기 발광 표시 장치 및 그의 제조 방법
US9596502B1 (en) 2015-12-21 2017-03-14 Max Abecassis Integration of multiple synchronization methodologies
US9516373B1 (en) 2015-12-21 2016-12-06 Max Abecassis Presets of synchronized second screen functions

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149190A (ja) * 2000-11-01 2002-05-24 Internatl Business Mach Corp <Ibm> 観測データから原信号を復元する信号分離方法、信号処理装置、モバイル端末装置、および記憶媒体
JP2002159086A (ja) * 2000-11-21 2002-05-31 Tokai Rika Co Ltd マイクロフォン装置
WO2007130766A2 (en) * 2006-05-04 2007-11-15 Sony Computer Entertainment Inc. Narrow band noise reduction for speech enhancement

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7012854B1 (en) * 1990-06-21 2006-03-14 Honeywell International Inc. Method for detecting emitted acoustic signals including signal to noise ratio enhancement
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
JP3584458B2 (ja) * 1997-10-31 2004-11-04 ソニー株式会社 パターン認識装置およびパターン認識方法
US6691087B2 (en) * 1997-11-21 2004-02-10 Sarnoff Corporation Method and apparatus for adaptive speech detection by applying a probabilistic description to the classification and tracking of signal components
US6480823B1 (en) * 1998-03-24 2002-11-12 Matsushita Electric Industrial Co., Ltd. Speech detection for noisy conditions
US6768979B1 (en) * 1998-10-22 2004-07-27 Sony Corporation Apparatus and method for noise attenuation in a speech recognition system
WO2001024167A1 (fr) * 1999-09-30 2001-04-05 Fujitsu Limited Dispositif antiparasite
US6892175B1 (en) * 2000-11-02 2005-05-10 International Business Machines Corporation Spread spectrum signaling for speech watermarking
JP2002159098A (ja) 2000-11-21 2002-05-31 Tokai Rika Co Ltd マイクロフォン装置
AU2002241476A1 (en) * 2000-11-22 2002-07-24 Defense Group Inc. Noise filtering utilizing non-gaussian signal statistics
TW595121B (en) * 2001-03-22 2004-06-21 Realtek Semiconductor Corp ADSL encoder and decoder
GB2380644A (en) * 2001-06-07 2003-04-09 Canon Kk Speech detection
CA2483104C (en) * 2002-04-25 2011-06-21 Shazam Entertainment, Ltd. Robust and invariant audio pattern matching
US7697700B2 (en) * 2006-05-04 2010-04-13 Sony Computer Entertainment Inc. Noise removal for electronic device with far field microphone on console
JP4520732B2 (ja) * 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
US7058540B2 (en) * 2003-12-15 2006-06-06 Agilent Technologies, Inc. Method and system for accelerating power complementary cumulative distribution function measurements
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
KR100745977B1 (ko) * 2005-09-26 2007-08-06 삼성전자주식회사 음성 구간 검출 장치 및 방법
US20080082320A1 (en) * 2006-09-29 2008-04-03 Nokia Corporation Apparatus, method and computer program product for advanced voice conversion
US8249271B2 (en) * 2007-01-23 2012-08-21 Karl M. Bizjak Noise analysis and extraction systems and methods
KR101009854B1 (ko) * 2007-03-22 2011-01-19 고려대학교 산학협력단 음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치
KR100905586B1 (ko) * 2007-05-28 2009-07-02 삼성전자주식회사 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가시스템 및 방법
EP2031583B1 (en) * 2007-08-31 2010-01-06 Harman Becker Automotive Systems GmbH Fast estimation of spectral noise power density for speech signal enhancement
JP4872871B2 (ja) * 2007-09-27 2012-02-08 ソニー株式会社 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ
US8473283B2 (en) * 2007-11-02 2013-06-25 Soundhound, Inc. Pitch selection modules in a system for automatic transcription of sung or hummed melodies
JP4950930B2 (ja) * 2008-04-03 2012-06-13 株式会社東芝 音声/非音声を判定する装置、方法およびプログラム
US8611556B2 (en) * 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8131541B2 (en) * 2008-04-25 2012-03-06 Cambridge Silicon Radio Limited Two microphone noise reduction system
EP2151821B1 (en) * 2008-08-07 2011-12-14 Nuance Communications, Inc. Noise-reduction processing of speech signals
EP2196988B1 (en) * 2008-12-12 2012-09-05 Nuance Communications, Inc. Determination of the coherence of audio signals
WO2010091077A1 (en) * 2009-02-03 2010-08-12 University Of Ottawa Method and system for a multi-microphone noise reduction
JP5452158B2 (ja) * 2009-10-07 2014-03-26 株式会社日立製作所 音響監視システム、及び音声集音システム
JP5566846B2 (ja) * 2010-10-15 2014-08-06 本田技研工業株式会社 ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法
US8924204B2 (en) * 2010-11-12 2014-12-30 Broadcom Corporation Method and apparatus for wind noise detection and suppression using multiple microphones

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149190A (ja) * 2000-11-01 2002-05-24 Internatl Business Mach Corp <Ibm> 観測データから原信号を復元する信号分離方法、信号処理装置、モバイル端末装置、および記憶媒体
JP2002159086A (ja) * 2000-11-21 2002-05-31 Tokai Rika Co Ltd マイクロフォン装置
WO2007130766A2 (en) * 2006-05-04 2007-11-15 Sony Computer Entertainment Inc. Narrow band noise reduction for speech enhancement

Also Published As

Publication number Publication date
US20120004916A1 (en) 2012-01-05
JPWO2010106734A1 (ja) 2012-09-20
WO2010106734A1 (ja) 2010-09-23
US8738367B2 (en) 2014-05-27

Similar Documents

Publication Publication Date Title
US20190281162A1 (en) Echo time delay detection method, echo elimination chip, and terminal equipment
EP2773137B1 (en) Microphone sensitivity difference correction device
US8886499B2 (en) Voice processing apparatus and voice processing method
JP5598552B2 (ja) 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置
KR101837331B1 (ko) 보청기 시스템을 동작시키는 방법 및 보청기 시스템
EP2755204A1 (en) Noise suppression device and method
JP6339896B2 (ja) 雑音抑圧装置および雑音抑圧方法
EP3276621B1 (en) Noise suppression device and noise suppressing method
JP2010232717A (ja) 受音信号処理装置、方法およびプログラム
US20150162021A1 (en) Spectral Comb Voice Activity Detection
WO2018014673A1 (zh) 一种啸叫检测方法和装置
US8675901B2 (en) Howling suppression device, hearing aid, howling suppression method, and integrated circuit
JP5772591B2 (ja) 音声信号処理装置
US7953229B2 (en) Sound processor, sound reproducer, and sound processing method
JP5459220B2 (ja) 発話音声検出装置
JP5815435B2 (ja) 音源位置判定装置、音源位置判定方法、プログラム
US20180062597A1 (en) Gain adjustment apparatus and gain adjustment method
JP5126145B2 (ja) 帯域拡張装置、方法及びプログラム、並びに、電話端末
JP5494492B2 (ja) 信号補正装置
JP4746498B2 (ja) 単一指向性マイクロホン
US20130044890A1 (en) Information processing device, information processing method and program
US11227625B2 (en) Storage medium, speaker direction determination method, and speaker direction determination device
KR102167469B1 (ko) 피드백 처리 방법
JP6361360B2 (ja) 残響判定装置及びプログラム
JP2018036431A (ja) 音声処理プログラム、音声処理方法及び音声処理装置

Legal Events

Date Code Title Description
RD07 Notification of extinguishment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7427

Effective date: 20120723

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140729

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150615

R150 Certificate of patent or registration of utility model

Ref document number: 5772591

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150