JP2006084974A - 音声入力装置 - Google Patents
音声入力装置 Download PDFInfo
- Publication number
- JP2006084974A JP2006084974A JP2004271584A JP2004271584A JP2006084974A JP 2006084974 A JP2006084974 A JP 2006084974A JP 2004271584 A JP2004271584 A JP 2004271584A JP 2004271584 A JP2004271584 A JP 2004271584A JP 2006084974 A JP2006084974 A JP 2006084974A
- Authority
- JP
- Japan
- Prior art keywords
- band
- sound
- signal
- target signal
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】目的音と非目的音とが混在する音響をマイクロフォン10-1〜10-nで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、該検知信号から少なくとも一つの該目的信号を分離する音声信号分離フィルタを学習の繰り返しによって取得する音声入力装置において、音響周波数帯域を複数の周波数分割帯域に分割する帯域分割手段103を有し、各周波数分割帯域における前記学習の反復回数を、それぞれの周波数分割帯域において検知信号に含まれる目的信号の強さに正比例するように決定する反復回数決定手段104を有することを特徴とする音声入力装置を構成する。
【選択図】 図1
Description
しかしながら、上記FDICAに基づく目的信号分離の処理における問題点としては、以下が挙げられる。
ここで、S(f)は各音源から送出される音信号ベクトル、X(f)は受音点であるマイクロフォンアレーで観測された観測信号ベクトル、A(f)は各音源と受音点との空間的な音響系に関する混合行列であり、それぞれ以下のように書くことができる。
X(f) = [X1(f),...,XL(f)]T (3)
S(f) = A(f)−X(f) (5)
(ただし、A(f)−は行列A(f)の一般逆行列を表す)のようにA(f)の一般逆行列A(f)−を計算することで音源から送出される音信号S(f)を計算することができる。しかし一般にA(f)は未知であり、X(f)だけを利用することで音信号S(f)を求めなければならない。
X(f,t) = [X1(f,t),...,XK(f,t)]T (6)
と記述できる。次に、逆混合行列W(f)を用いて信号分離を行う。この処理は以下のように示される。
ここで、逆混合行列W(f)は、L個の時系列の出力Y(f,t)が互いに独立になるように最適化される。これらの処理を全ての周波数ビンについて行う。最後に、分離した時系列Y(f,t)に逆直交変換を適用して、音源信号時間波形の再構成を行う。
ここで、Y(f,t)はは音源分離が為された分離信号である。ここで、i+1回目に学習される逆混合行列(音源分離フィルタ)Wi+1(f)は、i回目に学習された逆混合行列Wi(f)から、下記式(8)によって計算することが、Amariらによって提案されている(上記非特許文献4)。
η(diag(<Φ(Y(f,t))YH(f,t)>)-<Φ(Y(f,t))YH(f,t)>)Wi(f)+Wi(f) (8)
ここで、ηは更新係数、diag( )は対角行列、< >は時間に関する平均、Hはエルミート転置を表す。Φ( )は、一般に音声信号のような非ガウス性の振幅分布に従う信号を扱う場合にはsigmoid関数によって近似する手法が提案されている(上記非特許文献1、4参照)。
本実施形態は本発明の基本的な構成を示したものであり、図1に示したように構成される。その動作は図3のフローチャートに示した通りである。この処理構成に従い、目的信号と非目的信号を分離する分離フィルタを学習し、得られた分離フィルタで目的信号の抽出を行う。なお、車室内という環境で本手法の適用を考える場合、目的信号は音声信号、非目的信号とは車両で発生する様々な雑音と捉えることができる。
(方法1)検知信号に含まれる目的信号の平均強さに正比例するように決定する、
(方法2)検知信号に含まれる非目的信号の平均強さに反比例するように決定する、
(方法3)検知信号に含まれる非目的信号の強さに対する目的信号の強さの比(目的信号の強さ/非目的信号の強さ)の周波数分割帯域ごとの平均値に正比例するように決定する、
(方法4)周波数分割帯域の任意の2つを帯域1、帯域2としたときに、帯域1における上記の比の平均値が帯域2における上記の比の平均値以上であれば必ず帯域1における学習の反復回数が帯域2における学習の反復回数よりも小とはならず、周波数分割帯域の2つ以上における学習の反復回数は相異なるように、各周波数分割帯域における前記学習の反復回数を決定する、
(方法5)予め個別に、周波数分割帯域の2つ以上における学習の反復回数は相異なるように決定された反復回数とする、などの方法がある。
S101で、システムの初期化、メモリへの読込作業を行う。
S102で、音入力を検知する。検知したらS103へ進む。
S103で、検知信号(雑音の混合した音声信号)の帯域分割処理を行う。周波数ビンごとの帯域幅は固定でも可変でも良い。ここで周波数ビンの帯域幅をstep(ω)とする。
S104で、帯域ごとの反復回数Iter(ω)を取得する。決定方法は図5及び図6に示す。
S105で、更新フラグRenew(ω)をすべての帯域ωに対してTrueに初期化する。
S106で、更新回数フラグを0に初期化する(Iteration=0)。
S107で、帯域フラグを1に初期化する(ω=1)。
S108で、更新フラグRenew(ω)=TrueであればS109へ進み、FalseであればS110へ進む。
S109で、帯域ωについて、分離フィルタの計算を行う。分離フィルタの計算手法としては、周波数領域ICAなどを適用する。
S110で、帯域フラグを加算する(ω=ω+step(ω)、step(ω):周波数ビンの帯域幅)。
S111で、帯域フラグωの値が帯域の最大値Max(ω)に等しいときはS112へ進み、等しくないときはS108へもどる。帯域の最大値Max(ω)は例えばシステムのナイキスト周波数とする。
S112で、更新回数フラグを加算する(Iteration=Iteration+1)。
S113で、更新回数Iterationが、更新フラグRenew(ω)に等しいときはS114へ進み、等しくないときはS115へ進む。
S114で、帯域ωについて、更新フラグRenew(ω)=Falseとする。次回の更新よりこの帯域は更新処理が行われない。
S115で、全帯域ωについて、更新フラグ Renew(ω)=FalseならばS116へ進み、そうでない場合はS107へ戻る。
S116で、更新処理の結果生成された分離フィルタW(ω)を検知信号に適用して分離信号を得る。
本実施例は第1実施形態と基本的な構成を同じくする。すなわち、ブロック図は図1と同一であり、フローチャート図は図3は同一である。異なるのは、反復回数決定手法において、目的信号と非目的信号から適応的に生成したFIRフィルタ(下記音声帯域通過フィルタ)を反復回数決定用フィルタとして用いる点である。この部分について説明する。
第3実施形態として、第1及び第2実施形態の基本構成を用い、特に車両内での音声入力方法として具体化した一実施形態について説明する。
1:音環境(目的信号、非目的信号の特徴)に変化無し。そのときは、現在保持する分離フィルタ(逆混合フィルタ)をそのまま保持し続ける。この状態で、音声が入力された場合は、保持する分離フィルタを用いて観測信号から音声を抽出する。
2:音環境に変化あり。こにときは、フィルタの更新を行う。現在の観測信号を用いて、帯域分割、分析、反復過程決定を行い、決定された学習回数に基づき分離フィルタを再学習、更新する。
3:高S/N音声が検出されたとき:アイドリング中など、非目的信号(雑音)が目的信号(音声)に対して十分無視できるほど小さい環境において、目的信号(音声)が検出された場合に、該信号を参照信号として収録し、記憶手段へ記憶する。
S201でシステムの初期化、メモリへの読込作業を行う。
S202で音入力を検知する。検知したらS203へ進む。
S203で目的信号(音声)の有無、音環境変化の有無、非目的信号の有無を判断する(詳細は図13のフロー図に示す)。
S204で目的信号フラグ(検知信号に音声が含まれているか否かを示すフラグ)がFalseであればS205へ、TrueであればS207へ進む。
S205で音環境フラグがTrueであればS206の分離フィルタ更新処理へ進み、Falseであれば処理を終了する。
S206で分離フィルタの学習、更新作業を行う(詳細は図14のフロー図に示す)。
S207で非目的信号微小フラグ(検知信号に含まれる不用信号が目的信号に比べて十分小さいか否かを示すフラグ)がTrueであればS208へ、FalseであればS210へ進む。
S208で音声区間を検出する。区間検出には検知信号のエネルギーの変化、スペクトルの変化、及びPTTスイッチの情報や車室内カメラの情報を用いることができる。
S209で検出された音声区間を新規参照信号として記憶手段308へ記憶する。検出される度に、話者や性別ごとに分類して加算平均することが好ましい。初期値としてはHSLNなどを用いることができる。
S210で現在保持する分離フィルタWを検知信号へ適用して目的信号の抽出を行う。
S301で下記のフラグを初期化する(Falseで初期化)する。各フラグは以下のことを表す。目的信号フラグ:Voice-act 検知信号に音声が含まれているか否か、非目的信号微小フラグ:Noise-small 検知信号に含まれる非目的信号が目的信号に比べて十分小さいか否か、音環境変化フラグ:Env-change 音環境が変化したか否か。
S302で時刻T-mにおける音環境情報を取得する。mは処理間隔時間である。音環境情報は、検知信号パワー、検知信号スペクトル、各種スイッチ情報、各種センサ情報などの何れか、あるいは複数を組み合わせたデータから生成され、これらデータに基づき、複数の音環境に分類されるものとする。分類は、該信号スペクトルや、速度、空調機レベルなどの状態と雑音成分特性を対応させたデータベースを参照するなどして行う。
S303で時刻T(現在)における音環境情報を取得する。
S304で時刻TとT-mにおける音環境情報を比較し、検知信号に目的信号(音声)が含まれるかを判定する。音声が含まれると判断した場合はS305へ、含まれないと判断された場合はS306へ進む。音声信号の有無は、検知信号のパワー変化、スペクトル変化、PTTスイッチの押下情報、車室内カメラの検出結果などを用いて判断できる。
S305で目的信号フラグを立てる(Voice-act=True)。
S306で非目的信号(雑音)のエネルギーが閾値より小さいか否かを判定する。閾値より小さい場合はS307へ、閾値以上の場合はS308へ進む。閾値は例えば目的信号(参照信号として用いる音声信号)と非目的信号(雑音信号)とのS/Nが10dB以上となる時の検知信号のエネルギーとする。
S307で非目的信号微小フラグを立てる(Noise-small=True)。
S308で時刻Tの音環境情報と、時刻T-mの音環境情報を比較する。比較結果音環境情報が異なる場合はS309へ進み、同一の場合は処理を終了する。
S309で音環境フラグを立てる(Env-change=True)。
S401で検知信号の帯域分割処理を行う。周波数ビンごとの帯域幅は固定でも可変でも良い。
S402で検知信号と参照信号の分析処理を行う。第1実施形態ではパワーの比較を行う(図4)。第2実施形態では適応フィルタ手法により反復回数決定用フィルタである音声帯域通過フィルタを生成する(図7)。
S403で分析処理の結果に基づき反復回数Iter(ω)を決定する。決定方法は第1実施形態に示した手法(図5、図6)、及び第2実施形態に示した手法(図9)などを用いればよい。
S404で更新フラグRenew(ω)をすべての帯域ωに大してTrueに初期化する。
S405で更新回数フラグを0に初期化する(Iteration=0)。
S406で帯域フラグを1に初期化する(ω=1)。
S407で更新フラグRenew(ω)=TrueであればS408へFalseであればS409へ進む。
S408で帯域ωについて、分離フィルタの計算を行う。分離フィルタの計算手法としては、周波数領域ICAなどを適用する。
S409で帯域フラグを加算する(ω=ω+step(ω)(step(ω):周波数ビンの帯域幅))。
S410で帯域フラグωの値が帯域の最大値Max(ω)に等しいときはS411へ、等しくないときはS411へ進む。帯域の最大値Max(ω)は例えばシステムのナイキスト周波数とする。
S411で更新回数フラグを加算する(Iteration=Iteration+1)。
S412で更新回数Iterationが更新フラグRenew(ω)に等しいときはS413へ、等しくないときはS414へ進む。
S413で帯域ωについて、更新フラグRenew(ω)=Falseとする。次回の更新よりこの帯域は更新処理が行われない。
S414で全帯域ωについて、更新フラグRenew(ω)=Falseならば処理終了。そうでない場合はS406へ戻る。
本実施例は各種スイッチ手段、センサ手段の情報の組み合わせと、該組み合わせが検出されるときの音環境を事前に分析、分類したデータ、及び該音環境における分離フィルタ更新処理時の最適な反復回数Iter(ω)を対応させたデータをそれぞれ記憶する手法である。
S501でシステムの初期化、メモリへの読込作業を行う。
S502で音入力を検知する。検知したらS503へ進む。
S503で音声信号を検知する。検知したらS504へ、検知しない場合はS502へ進む。
S504でスイッチ手段(図15の503)、センサ手段(図15の504)の情報と、記憶手段1(図15の506)のデータテーブルを参照し、現在の音環境を取得する。
S505で、S504で取得した音環境がそれまで保持していた音環境と異なる場合はS506へ、そうでなければS502へ進む。
S506で分離フィルタ更新処理を行う。詳細は図17のフローチャートに示す。
S507で検知信号に対して分離フィルタW(ω)を適用して音源分離(音声抽出)を行う。
S601でシステムの初期化、メモリへの読込作業を行う。
S602で現在の音環境に対応するフィルタ更新処理の反復回数(Iter(ω))を取得する。
S603で検知信号の帯域分割処理を行う。周波数ビンごとの帯域幅は固定でも可変でも良い。
S604で更新フラグRenew(ω)をすべての帯域ωに対してTrueに初期化する。
S605で更新回数フラグを0に初期化する(Iteration=0)。
S606で帯域フラグを1に初期化する(ω=1)。
S607で更新フラグRenew(ω)=TrueであればS109へ、FalseであればS110へ進む。
S608で帯域ωについて、分離フィルタの計算を行う。分離フィルタの計算手法としては、周波数領域ICAなどを適用する。
S609で帯域フラグを加算する(ω=ω+step(ω)(step(ω):各周波数帯の帯域幅))。
S610で帯域フラグωの値が帯域の最大値Max(ω)に等しいときはS611へ進み、等しくないときはS607へ戻る。帯域の最大値Max(ω)は例えばシステムのナイキスト周波数とする。
S611で更新回数フラグを加算する(Iteration=Iteration+1)。
S612で更新回数Iterationが更新フラグRenew(ω)に等しいときはS613へ、等しくないときはS614へ進む。
S613で帯域ωについて、更新フラグRenew(ω)=Falseとする。次回の更新よりこの帯域は更新処理が行われない。
S614で全帯域ωについて、更新フラグRenew(ω)=FalseならばS615へ進み、そうでない場合はS606へ戻る。
S615で更新処理の結果生成された分離フィルタW(ω)をフィルタ手段へとコピーする。
Claims (9)
- 目的音と非目的音とが混在する音響を音響センサで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、各該検知信号から少なくとも一つの該目的信号を分離する分離フィルタを学習の反復によって取得する音声入力装置において、
音響周波数帯域を複数の周波数分割帯域に分割する帯域分割手段と、各該周波数分割帯域における前記学習の反復回数を、それぞれの周波数分割帯域において前記検知信号に含まれる前記目的信号の平均強さに正比例するように決定する反復回数決定手段とを有することを特徴とする音声入力装置。 - 目的音と非目的音とが混在する音響を音響センサで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、各該検知信号から少なくとも一つの該目的信号を分離する分離フィルタを学習の反復によって取得する音声入力装置において、
音響周波数帯域を複数の周波数分割帯域に分割する帯域分割手段と、各該周波数分割帯域における前記学習の反復回数を、それぞれの周波数分割帯域において前記検知信号に含まれる前記非目的信号の平均強さに反比例するように決定する反復回数決定手段とを有することを特徴とする音声入力装置。 - 目的音と非目的音とが混在する音響を音響センサで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、各該検知信号から少なくとも一つの該目的信号を分離する分離フィルタを学習の反復によって取得する音声入力装置において、
音響周波数帯域を複数の周波数分割帯域に分割する帯域分割手段と、各該周波数分割帯域において前記検知信号に含まれる前記非目的信号の強さに対する前記目的信号の強さの比を求め、該周波数分割帯域の任意の2つを帯域1、帯域2としたときに、帯域1における該比の平均値が帯域2における該比の平均値以上であれば必ず帯域1における前記学習の反復回数が帯域2における前記学習の反復回数よりも小とはならず、該周波数分割帯域の2つ以上における前記学習の反復回数は相異なるように、各該周波数分割帯域における前記学習の反復回数を決定する反復回数決定手段とを有することを特徴とする音声入力装置。 - 目的音と非目的音とが混在する音響を音響センサで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、各該検知信号から少なくとも一つの該目的信号を分離する分離フィルタを学習の反復によって取得する音声入力装置において、
音響周波数帯域を複数の周波数分割帯域に分割する帯域分割手段と、各該周波数分割帯域における前記学習の反復回数を、それぞれの周波数分割帯域において前記検知信号に含まれる前記非目的信号の強さに対する前記目的信号の強さの比の平均値に正比例するように決定する反復回数決定手段とを有することを特徴とする音声入力装置。 - 目的音と非目的音とが混在する音響を音響センサで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、各該検知信号から少なくとも一つの該目的信号を分離する分離フィルタを学習の反復によって取得する音声入力装置において、
音響周波数帯域を複数の周波数分割帯域に分割し、各該周波数分割帯域における前記学習を、それぞれの周波数分割帯域において、該周波数分割帯域の2つ以上における前記学習の反復回数は相異なるように予め決定された反復回数だけ反復することを特徴とする音声入力装置。 - 前記検知信号に含まれる前記非目的信号の強さに対する前記目的信号の強さの比を分析する分析手段を有し、前記反復回数決定手段が、各前記周波数分割帯域における前記学習の反復回数を、それぞれの周波数分割帯域において該分析手段によって得られた該比の平均値によって決定することを特徴とする請求項3または4に記載の音声入力装置。
- 目的音と非目的音とが混在する音響を音響センサで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、各該検知信号から少なくとも一つの該目的信号を分離する分離フィルタを学習の反復によって取得する音声入力装置において、
音響周波数帯域を複数の周波数分割帯域に分割する帯域分割手段と、前記検知信号に含まれる前記非目的信号が大きい帯域ほど強く抑圧するような帯域通過フィルタを生成する適応処理手段と、該周波数分割帯域の任意の2つを帯域1、帯域2としたときに、帯域1における該帯域通過フィルタの通過率の平均値が帯域2における該帯域通過フィルタの通過率の平均値以上であれば必ず帯域1における前記学習の反復回数が帯域2における前記学習の反復回数よりも小とはならず、該周波数分割帯域の2つ以上における前記学習の反復回数は相異なるように、各前記周波数分割帯域における前記学習の反復回数を決定する反復回数決定手段とを有することを特徴とする音声入力装置。 - 目的音と非目的音とが混在する音響を音響センサで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、各該検知信号から少なくとも一つの該目的信号を分離する分離フィルタを学習の反復によって取得する音声入力装置において、
音響周波数帯域を複数の周波数分割帯域に分割する帯域分割手段と、前記検知信号に含まれる前記非目的信号が大きい帯域ほど強く抑圧するような音声帯域通過フィルタを生成する適応処理手段と、各該周波数分割帯域における前記学習の反復回数を、それぞれの周波数分割帯域において該音声帯域通過フィルタの通過率の平均値に正比例するように決定する反復回数決定手段とを有することを特徴とする音声入力装置。 - 目的音と非目的音とが混在する音響を音響センサで検知することによって目的信号と非目的信号とが混在する検知信号を取得し、各該検知信号から少なくとも一つの該目的信号を分離する分離フィルタを学習の反復によって取得する音声入力装置において、
音響周波数帯域を複数の周波数分割帯域に分割する帯域分割手段と、前記検知信号に含まれる音環境の内容を判断し決定する判断手段と、該音環境に対応する前記学習の反復回数を記憶する記憶手段とを有し、各該周波数分割帯域において、該判断手段によって判断され決定された音環境に対応する前記学習の反復回数を該記憶手段から読み出し、該読み出した反復回数だけ前記分離フィルタを取得するための学習を反復することを特徴とする音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004271584A JP4529611B2 (ja) | 2004-09-17 | 2004-09-17 | 音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004271584A JP4529611B2 (ja) | 2004-09-17 | 2004-09-17 | 音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006084974A true JP2006084974A (ja) | 2006-03-30 |
JP4529611B2 JP4529611B2 (ja) | 2010-08-25 |
Family
ID=36163517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004271584A Expired - Fee Related JP4529611B2 (ja) | 2004-09-17 | 2004-09-17 | 音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4529611B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183637A (ja) * | 2006-01-09 | 2007-07-19 | Honda Research Inst Europe Gmbh | 反響のある環境での音源定位に適当な測定ウィンドウの決定 |
WO2009038136A1 (ja) * | 2007-09-19 | 2009-03-26 | Nec Corporation | 雑音抑圧装置、その方法及びプログラム |
JP2010054954A (ja) * | 2008-08-29 | 2010-03-11 | Toyota Motor Corp | 音声強調装置及び音声強調方法 |
JP2010117653A (ja) * | 2008-11-14 | 2010-05-27 | Yamaha Corp | 信号処理装置およびプログラム |
JP2010286685A (ja) * | 2009-06-12 | 2010-12-24 | Yamaha Corp | 信号処理装置 |
JP2011248290A (ja) * | 2010-05-31 | 2011-12-08 | Nara Institute Of Schience And Technology | 雑音抑圧装置 |
WO2013032025A1 (ja) * | 2011-08-29 | 2013-03-07 | 日本電気株式会社 | 信号処理装置、信号処理方法、およびコンピュータ・プログラム |
JP2013126026A (ja) * | 2011-12-13 | 2013-06-24 | Oki Electric Ind Co Ltd | 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム |
JP2013544372A (ja) * | 2010-08-30 | 2013-12-12 | クアルコム,インコーポレイテッド | 音響に基づく環境の認識 |
JP2017138416A (ja) * | 2016-02-02 | 2017-08-10 | キヤノン株式会社 | 音声処理装置および音声処理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003084793A (ja) * | 2001-09-14 | 2003-03-19 | Nippon Telegr & Teleph Corp <Ntt> | 独立成分分析方法及び装置並びに独立成分分析プログラム及びそのプログラムを記録した記録媒体 |
JP2003271166A (ja) * | 2002-03-14 | 2003-09-25 | Nissan Motor Co Ltd | 入力信号処理方法および入力信号処理装置 |
-
2004
- 2004-09-17 JP JP2004271584A patent/JP4529611B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003084793A (ja) * | 2001-09-14 | 2003-03-19 | Nippon Telegr & Teleph Corp <Ntt> | 独立成分分析方法及び装置並びに独立成分分析プログラム及びそのプログラムを記録した記録媒体 |
JP2003271166A (ja) * | 2002-03-14 | 2003-09-25 | Nissan Motor Co Ltd | 入力信号処理方法および入力信号処理装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183637A (ja) * | 2006-01-09 | 2007-07-19 | Honda Research Inst Europe Gmbh | 反響のある環境での音源定位に適当な測定ウィンドウの決定 |
JP4662912B2 (ja) * | 2006-01-09 | 2011-03-30 | ホンダ リサーチ インスティテュート ヨーロッパ ゲーエムベーハー | 反響のある環境での音源定位に適当な測定ウィンドウの決定 |
JP5483000B2 (ja) * | 2007-09-19 | 2014-05-07 | 日本電気株式会社 | 雑音抑圧装置、その方法及びプログラム |
WO2009038136A1 (ja) * | 2007-09-19 | 2009-03-26 | Nec Corporation | 雑音抑圧装置、その方法及びプログラム |
JPWO2009038136A1 (ja) * | 2007-09-19 | 2011-01-06 | 日本電気株式会社 | 雑音抑圧装置、その方法及びプログラム |
JP2010054954A (ja) * | 2008-08-29 | 2010-03-11 | Toyota Motor Corp | 音声強調装置及び音声強調方法 |
JP2010117653A (ja) * | 2008-11-14 | 2010-05-27 | Yamaha Corp | 信号処理装置およびプログラム |
US9123348B2 (en) | 2008-11-14 | 2015-09-01 | Yamaha Corporation | Sound processing device |
JP2010286685A (ja) * | 2009-06-12 | 2010-12-24 | Yamaha Corp | 信号処理装置 |
JP2011248290A (ja) * | 2010-05-31 | 2011-12-08 | Nara Institute Of Schience And Technology | 雑音抑圧装置 |
JP2013544372A (ja) * | 2010-08-30 | 2013-12-12 | クアルコム,インコーポレイテッド | 音響に基づく環境の認識 |
WO2013032025A1 (ja) * | 2011-08-29 | 2013-03-07 | 日本電気株式会社 | 信号処理装置、信号処理方法、およびコンピュータ・プログラム |
JP2013126026A (ja) * | 2011-12-13 | 2013-06-24 | Oki Electric Ind Co Ltd | 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム |
JP2017138416A (ja) * | 2016-02-02 | 2017-08-10 | キヤノン株式会社 | 音声処理装置および音声処理方法 |
CN107068163A (zh) * | 2016-02-02 | 2017-08-18 | 佳能株式会社 | 音频处理装置以及音频处理方法 |
CN107068163B (zh) * | 2016-02-02 | 2022-04-08 | 佳能株式会社 | 音频处理装置以及音频处理方法 |
CN107068163B9 (zh) * | 2016-02-02 | 2022-05-24 | 佳能株式会社 | 音频处理装置以及音频处理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4529611B2 (ja) | 2010-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101434200B1 (ko) | 혼합 사운드로부터의 음원 판별 방법 및 장치 | |
EP3655949B1 (en) | Acoustic source separation systems | |
US9668066B1 (en) | Blind source separation systems | |
EP3511937B1 (en) | Device and method for sound source separation, and program | |
US8271200B2 (en) | System and method for acoustic signature extraction, detection, discrimination, and localization | |
US8200484B2 (en) | Elimination of cross-channel interference and multi-channel source separation by using an interference elimination coefficient based on a source signal absence probability | |
US9093079B2 (en) | Method and apparatus for blind signal recovery in noisy, reverberant environments | |
JP5543023B2 (ja) | 目的音強調装置およびカーナビゲーションシステム | |
US20060031067A1 (en) | Sound input device | |
JPH0621838A (ja) | 信号処理システム | |
JP2004502977A (ja) | サブバンド指数平滑雑音消去システム | |
GB2548325A (en) | Acoustic source seperation systems | |
JP4529611B2 (ja) | 音声入力装置 | |
JP2015118361A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP3786038B2 (ja) | 入力信号処理方法および入力信号処理装置 | |
Fang et al. | Integrating statistical uncertainty into neural network-based speech enhancement | |
JP6961545B2 (ja) | 音信号処理装置、音信号処理方法、およびプログラム | |
CN110491408B (zh) | 一种基于稀疏元分析的音乐信号欠定混叠盲分离方法 | |
WO2020039597A1 (ja) | 信号処理装置、音声通話端末、信号処理方法および信号処理プログラム | |
Guzewich et al. | Cross-Corpora Convolutional Deep Neural Network Dereverberation Preprocessing for Speaker Verification and Speech Enhancement. | |
JP4219611B2 (ja) | 雑音除去システムおよび雑音除去方法 | |
JP4249697B2 (ja) | 音源分離学習方法、装置、プログラム、音源分離方法、装置、プログラム、記録媒体 | |
RU2788939C1 (ru) | Способ и устройство для определения глубокого фильтра | |
JP2005091560A (ja) | 信号分離方法および信号分離装置 | |
CN117351925B (zh) | 啸叫抑制方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100531 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130618 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |