JP3297307B2 - 背景雑音消去装置 - Google Patents
背景雑音消去装置Info
- Publication number
- JP3297307B2 JP3297307B2 JP15417996A JP15417996A JP3297307B2 JP 3297307 B2 JP3297307 B2 JP 3297307B2 JP 15417996 A JP15417996 A JP 15417996A JP 15417996 A JP15417996 A JP 15417996A JP 3297307 B2 JP3297307 B2 JP 3297307B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- frequency
- background noise
- window function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001228 spectrum Methods 0.000 claims description 82
- 230000005236 sound signal Effects 0.000 claims description 77
- 238000012545 processing Methods 0.000 claims description 70
- 230000003044 adaptive effect Effects 0.000 claims description 42
- 230000008030 elimination Effects 0.000 claims description 38
- 238000003379 elimination reaction Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 25
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000012937 correction Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 28
- 230000014509 gene expression Effects 0.000 description 15
- MATGKVZWFZHCLI-LSDHHAIUSA-N (-)-matairesinol Chemical compound C1=C(O)C(OC)=CC(C[C@@H]2[C@H](C(=O)OC2)CC=2C=C(OC)C(O)=CC=2)=C1 MATGKVZWFZHCLI-LSDHHAIUSA-N 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 230000002093 peripheral effect Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 238000012886 linear function Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 6
- 101150011704 Def3 gene Proteins 0.000 description 3
- 101100129499 Arabidopsis thaliana MAX2 gene Proteins 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17821—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
- G10K11/17823—Reference signals, e.g. ambient acoustic environment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1783—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1783—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions
- G10K11/17837—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions by retaining part of the ambient acoustic environment, e.g. speech or alarm signals that the user needs to hear
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1787—General system configurations
- G10K11/17873—General system configurations using a reference signal without an error signal, e.g. pure feedforward
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/101—One dimensional
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/108—Communication systems, e.g. where useful sound is kept and noise is cancelled
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/108—Communication systems, e.g. where useful sound is kept and noise is cancelled
- G10K2210/1082—Microphones, e.g. systems using "virtual" microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/117—Nonlinear
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3025—Determination of spectrum characteristics, e.g. FFT
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3027—Feedforward
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3032—Harmonics or sub-harmonics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3035—Models, e.g. of the acoustic system
- G10K2210/30351—Identification of the environment for applying appropriate model characteristics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/50—Miscellaneous
- G10K2210/505—Echo cancellation, e.g. multipath-, ghost- or reverberation-cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/50—Miscellaneous
- G10K2210/511—Narrow band, e.g. implementations for single frequency cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/50—Miscellaneous
- G10K2210/512—Wide band, e.g. non-recurring signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/10—Means associated with receiver for limiting or suppressing noise or interference
- H04B1/12—Neutralising, balancing, or compensation arrangements
- H04B1/123—Neutralising, balancing, or compensation arrangements using adaptive balancing or compensation means
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Noise Elimination (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
Description
いて音声信号に重畳されている背景雑音を除去する背景
雑音消去装置(ノイズキャンセラ)に関するものであ
る。
は、下記文献に開示されるものがあった。
におけるスペクトル変形回復の一方法」、電子情報通信
学会技術研究報告、EA95−57、1995年11月』図2
は、この文献に開示されている従来技術の概略構成を示
すブロック図である。
源から発せられた雑音Nはマイクロホン100に入力さ
れる。マイクロホン100に入力された信号は、アナロ
グ/デジタル変換器(A/D変換器、図示せず)でデジ
タル信号に変換され、簡易周波数サブトラクション処理
部101へと入力される。
において、入力された信号はまず、高速フーリエ変換処
理(以下、FFT処理と呼ぶ)を施され、周波数領域の
信号に変換される。周波数領域の信号に変換された信号
S(k) は、(1) 式及び(2) 式に従って、簡易周波数サブ
トラクション処理(簡易スペクトルサブトラクション処
理)が施された信号S’(k) に変換される。この変換後
信号S’(k) は、対数変換が施された後、スペクトル修
復部103に出力される。簡易周波数サブトラクション
処理は、入力信号の全てのスペクトル包絡に対する低レ
ベル制限処理である。
色雑音環境を疑似する低レベル制限直線関数であり、N
は高速フーリエ変換の点数であり、kはN点中のk番目
のスペクトル線を示し、TH1及びTH2(TH1<T
H2)は予め定められる、低レベル制限直線関数th
(k) を規定する閾値である。
た信号(S’(k) )の処理過程を説明する。
部101で処理された信号S’(k)の例である。
ために、簡易周波数サブトラクション処理部101での
処理後(低レベルの抑圧処理後)は、音声信号だけの場
合におけるスペクトルの小さい部分での谷間が欠如した
ものとなっている。スペクトル修復部103は、以下に
説明するように、スペクトルパワーの小さい谷間の部分
を推定して修復する。すなわち、谷間の左側については
(3) 式の直線関数THL(f) で、谷間の右側については
(4) 式の直線関数THL(f) で、谷間を修復する。
ルを疑似する(5) 式で表される直線関数であり、0〜ナ
イキスト周波数の範囲で0(=TH1)〜−10dB
(=TH2)となっている。また、W(f) は、谷の深さ
を疑似する(6) 式で表される直線関数であり、0〜ナイ
キスト周波数で−30(=TH3)〜−40dB(=T
H4)と固定している。また、修復する谷の数は、周波
数の下方から2個までと限定している。
f3は1.2kHz以降であり、入力信号S’(k) と雑
音レベル疑似関数P(f) との交点であり、周波数f2は
周波数軸上での周波数f1及びf3の2点の中点であ
る。また、第2の谷については、f3以降の周波数であ
り、入力信号S’(k) が疑似雑音レベルP(f) を上から
下に横切る交点を新たに周波数f4として周波数f1と
同様に扱うと共に、次の交点を周波数f6として周波数
f3と同様に扱う。ここでも、周波数f4及びf6の周
波数軸上での中点を周波数f5とし、前述の周波数f2
と同様に扱う。
数が上限であるナイキスト周波数まで検索しても見つか
らないときにはナイキスト周波数を持って周波数f3又
はf6に代えて用いる。前者の場合は、谷の数は1個と
なる。図3は、周波数f6に相当の周波数がナイキスト
周波数まで達した例である。
を復元した信号を、内蔵する部分平滑処理部において、
信号の高周波数領域を平滑化し、内蔵する逆FFT処理
部において、逆FFT処理を施して時間軸信号に戻し、
出力端子104より次段の音声信号処理回路に出力して
いた。
数サブトラクション処理及びスペクトル修正処理を通じ
て、背景雑音を軽減した後、音声スペクトルを修復して
音声スペクトルを強調した信号を得るようにしていた。
の背景雑音消去方法及び装置では、以下に述べるような
課題を有するものであった。
景雑音の状態にも依存するため、通常は未知であり、従
来のように予め固定の関数に設定できないものであり、
固定関数としていると、修復された音声スペクトルが実
際の音声スペクトルとかなり異なることも生じている。
る谷間の数を周波数下方から2個までと限定している
が、実際には、下方からの数が2よりも多く必要になる
場合があり、音声通信等に、この谷間の数の制限を有す
る従来方法を直接応用すると、音声が不自然になって通
話品質が悪くなる。
さ関数W(f) について、第2の谷間より周波数軸で上方
の特性にも近似直線を利用するため、実際の音声信号の
周波数成分は低域の方が周波数パワーが大きく、高域の
方が周波数パワーが小さいという音声の一般的な性質が
反映されず、高域雑音成分を残し、音声通信等に、従来
方法を直接応用すると著しく音感を損ねてしまう。
方法は有声音に有効な方法であり、そのため、予め測定
した無雑音状況での判定結果を流用して有声部及び無声
部の判定を実行しているが、実用では、実際に入手でき
る信号はなにがしかの雑音が混入した上での信号であ
り、雑音の混入を前提とした有声成分信号及び無声成分
信号かの判断を行なう必要があり、従来技術で実際の音
声通信システム等に対する実装が不可能なレベルにあ
る。
き、初段の簡易周波数サブトラクション処理結果で完全
に狭帯域雑音を除去できないため、消し残りの狭帯域雑
音で周波数の谷間を作成するため音質を劣化させてしま
う。
が高い、あるいは、狭帯域雑音が含まれていても雑音消
去を適切に実行できる、周波数サブトラクション(スペ
クトルサブトラクション)処理を利用した背景雑音消去
装置が求められている。
め、第1の本発明の背景雑音消去装置は、(1) 時間軸上
の入力音響信号を周波数軸上の信号に変換する時間軸/
周波数軸変換手段と、(2) 入力音響信号が背景雑音だけ
か、入力音響信号が音声信号を含むかを判別するととも
に、周波数軸上の音響信号の最大ピークパワーと最大ピ
ークパワーを示すパワー最大値周波数を認識する第1の
信号種別判定手段と、(3) 時間軸/周波数軸変換手段で
変換された周波数軸上の音響信号に基づいて、入力音響
信号に追従しながら背景雑音を推定した推定雑音信号を
形成する狭帯域雑音検出用背景雑音推定出力手段と、
(4) 時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号から、推定雑音信号を、少なくとも第1の信
号種別判定手段による判定結果が音声ありのときに減じ
る狭帯域雑音検出用雑音消去演算手段と、(5)第1の信
号種別判定手段により認識されたパワー最大値周波数に
おける狭帯域雑音検出用雑音消去演算手段による雑音処
理後の信号のパワーと第1の信号種別判定手段により認
識された周波数軸上の音響信号の最大ピークパワーとの
差分と所定の閾値とを比較して、入力音響信号に狭帯域
雑音の有無、又は、狭帯域雑音の周波数領域を検出する
狭帯域雑音判定手段とを有し、この狭帯域雑音判定手段
の判定結果が狭帯域雑音ありの場合に、第1の信号種別
判定手段の音声ありの検出結果を音声なしに切り替え
て、当該装置からの出力信号における雑音消去特性を変
化させることを特徴としたものである。
特性を切り替える構成により、狭帯域雑音が含まれてい
ても雑音消去を適切に実行できるようになる。
は、(1)時間軸上の入力音響信号を周波数軸上の信号に
変換する時間軸/周波数軸変換手段と、(2)入力音響信
号が背景雑音だけか、入力音響信号が音声信号を含む
か、音声信号を含む場合に有声音か無声音かを判別する
第2の信号種別判定手段と、(3)時間軸/周波数軸変換
手段で変換された周波数軸上の音響信号に基づいて、入
力音響信号に追従しながら背景雑音を推定した推定雑音
信号を形成すると共に、入力音響信号が音声信号を含む
ときに、音声信号が含まれる直前の推定雑音信号を繰返
し出力する背景雑音推定出力手段と、(4)少なくとも入
力音響信号が音声信号を含むときに、当該背景雑音推定
出力手段からの推定雑音信号に第1の係数を乗算する第
1の乗算手段と、(5)時間軸/周波数軸変換手段で変換
された周波数軸上の音響信号から、第1の係数が乗算さ
れた推定雑音信号を減じる第1の雑音消去演算手段と、
(6)この第1の雑音消去演算手段からの出力信号又は時
間軸/周波数軸変換手段からの出力信号の周波数特性に
応じて、窓関数を作成する適応窓関数発生手段と、(7)
第1の雑音消去演算手段からの出力信号のスペクトル
を、適応窓関数発生手段が作成した窓関数に応じて修正
するスペクトル修正手段と、(8)入力音響信号に有声音
の音声信号があるときに、スペクトル修正手段からの出
力信号を選択し、入力音響信号に無声音の音声信号があ
るときに、第1の雑音消去演算手段からの出力信号を選
択する雑音消去信号選択手段と、(9)この雑音消去信号
選択手段で選択された周波数軸上の信号を時間軸上の信
号に変換する周波数軸/時間軸変換手段とを備えること
を特徴とする。
有声音か無声音かによって、雑音消去特性が異なる出力
信号を選択できると共に、有声音を有する音響信号に対
する減衰特性の谷間の深さを規制する窓関数を入力音響
信号の内容によって適応的に変化でき、出力信号におけ
る音感、音質を従来より高めることができる適切な背景
雑音消去を実行できるようになる。
を図面を参照しながら詳述する。
を示すブロック図である。
声S(t) 及び背景雑音N(t) 、又は、背景雑音N(t) だ
けを電気信号(アナログ信号)に変換してA/D変換器
2に与えるものである。A/D変換器2は、マイクロホ
ン1から与えられた入力信号(アナログ信号)を、所望
のサンプリング周波数(例えば8kHz)でデジタル信
号に変換して窓関数処理部3に与えるものである。
関数処理部3は、入力信号に対して、予め定められたフ
レーム長毎に窓関数演算を施し、その処理後の信号(時
間領域の信号)をFFT演算器4に出力する。ここで、
窓関数としては、ハミング窓等の公知の窓関数を用いれ
ば良い。以下では、窓関数としてハニング窓を適用し、
1フレーム長として256サンプルに選定した場合を意
識して説明するが、これに限定されるものではない。
時間領域の信号x(k) をフレーム毎に区切って、周波数
成分(周波数領域の信号)X(f) に変換する。FFT演
算器4による変換方法としては、公知の方法で良いの
で、その詳細説明は省略する。FFT演算器4によって
変換された周波数成分X(f) は、背景雑音推定部6、加
算器13、14、28、信号レベル計算部15、単純減
衰部16、狭帯域雑音判定部29及び周波数軸信号種別
判定部30に与えられる。
音声検出器31及び有声、無声判定器32から構成され
ており、信号種別の判定結果によって、後述するスイッ
チ5及び17の状態を制御するものである。
器4の出力信号(周波数軸信号)X(f) と、背景雑音保
持部7からの推定背景雑音信号N’(f) が与えられるよ
うになされている。なお、周波数軸音声検出器31に与
えられるFFT演算器4の出力信号(周波数軸信号)X
(f) は、背景雑音保持部7から与えられる推定背景雑音
信号N’(f) の次のフレームのものとなっている。ここ
で、周波数軸での信号は“第kフレーム目の周波数特
性”の意味合いから詳細にはX(f,k) 、N’(f,k) と記
載すべきであるが、簡単のために、適宜、周波数に着目
するときはX(f)、N’(f) と記載し、フレーム順序に
着目するときはX(k) 、N’(k) と記載する。
て、現フレーム(フレーム番号をkとする)について、
FFT演算器4の出力信号X(f) の周波数パワー平均F
_AV(k) を計算すると共に、(8) 式に従って、現フレ
ームについて、推定背景雑音信号N’(f,k-1) の周波数
パワー平均N_AV(k) を計算する。(7) 式及び(8)式
において、sfは開始周波数であり、efは終了周波数
であり、また、総和Σは開始周波数sfから終了周波数
efについてである。ef−sfは、フレーム長(フレ
ームでの周波数サンプル数)となっている。
_AV(k) 及びN_AV(k) のパワー平均比VP(k) を
(9) 式に従って求め、求めたパワー平均比VP(k) を、
予め決められた閾値voi_d(例えば1.5)と比較
する。
(k) が閾値voi_d以上のときには、音声信号が存在
するとして、パワー平均比VP(k) を有声、無声判定器
32に出力し、一方、パワー平均比VP(k) が閾値vo
i_dより小さいときには、音声信号が存在しないとし
て、パワー平均比VP(k) を有声、無声判定器32に出
力しない。
する狭帯域雑音判定部29から狭帯域判定結果が与えら
れるようになされている。周波数軸音声検出器31は、
狭帯域判定結果が狭帯域雑音の存在を指示しているとき
には、パワー平均比VP(k)が閾値voi_d以上であ
っても、音声信号が存在しないとして、パワー平均比V
P(k) を有声、無声判定器32に出力しない。
波数(sf〜ef)に渡って、FFT演算器4からの出
力信号X(f) における最大パワーレベルMAX(k) を検
索すると共に、その最大パワーレベルMAX(k) の周波
数fmax を認識する。そして、周波数軸音声検出器31
は、最大パワーレベルMAX(k) を有声、無声判定器3
2に出力すると共に、最大パワーレベルMAX(k) 及び
その周波数fmax を狭帯域雑音判定部29に出力する。
声信号が有声音の場合における各種信号等を示したもの
であり、これに対して、図5は、入力信号X(f) に含ま
れている音声信号が無声音の場合における各種信号を示
したものである。なお、パワー平均やパワー平均比につ
いては、推定背景雑音信号のパワー平均N AV(k)を
1.0とした正規化値で示している。
を、これら図4及び図5を参照しながら説明する。
出器31からパワー平均比VP(k)が与えられた場合
(音声期間)には、周波数軸音声検出器31が求めたパ
ワー平均比VP(k) を、予め定められている閾値C_V
OI(例えば1.8)と比較すると共に、周波数軸音声
検出器31が求めた入力信号についての最大パワーレベ
ルMAX(k) 及びパワー平均F_AV(k) 間のレベル比
を、予め定められている閾値CV(例えば2.0)と比
較する。すなわち、(10)式に示す条件式を満足している
か否かと、(11)式に示す条件式を満足しているか否かを
判定する。
条件式を共に満足しているときに音声信号は有声音であ
ると判定し、これに対して、(10)式及び(11)式に示す条
件式の少なくとも一方が満足されないときに音声信号は
無声音であると判定する。
条件式は、最大パワーレベルMAX(k) 及びパワー平均
F_AV(k) 間のレベル「比」を閾値と比較するもので
あったが、この条件式に代えて、最大パワーレベルMA
X(k) 及びパワー平均F_AV(k) 間のレベル「差」を
閾値と比較する条件式を用いるようにしても良い。
2出力スイッチ5に対しては、周波数軸音声検出器31
からパワー平均比VP(k) が与えられた場合(音声期
間)には、出力端子fを選択させると共に、周波数軸音
声検出器31からパワー平均比VP(k) が与えられない
場合(雑音区間:狭帯域判定結果に基づく場合を含む)
には、出力端子eを選択させる制御信号を与える。な
お、有声、無声判定器32からスイッチ5に与えられる
制御信号は、背景雑音推定部6にも与えられるようにな
されている。
3入力1出力スイッチ17に対しては、周波数軸音声検
出器31からパワー平均比VP(k) が与えられない場合
(雑音区間:狭帯域判定結果に基づく場合を含む)に
は、入力端子aを選択させ、また、周波数軸音声検出器
31からパワー平均比VP(k) が与えられた場合(音声
期間)において音声信号が無声音と判定した場合には、
入力端子bを選択させ、さらに、周波数軸音声検出器3
1からパワー平均比VP(k) が与えられた場合(音声期
間)において音声信号が有声音と判定した場合には、入
力端子cを選択させる制御信号を与える。
雑音推定部6に入力される。当該背景雑音消去装置への
入力信号は、当初は背景雑音のみであると仮定してお
り、X(f) =N(f) となっており、また、背景雑音推定
部6の推定動作は基本的には雑音区間での動作を意図し
ているので、X(f) =N(f) の状況下を考慮すれば良
い。すなわち、以下の背景雑音推定部6の機能説明で
は、X(f) =N(f) が成立しているとして行なう。
力信号X(f) =N(f) と、直前フレームで作成した推定
背景雑音信号N’(f) 及びN”(f) に基づいて、以下の
ように周波数領域で背景雑音を推定し、推定背景雑音信
号N’(f) 又はN”(f) を作成する。すなわち、スイッ
チ5が出力端子eに接続されている場合(雑音期間の場
合)には、背景雑音推定部6は、(12)式に従って求めた
推定背景雑音信号N’(f) を、スイッチ5を介して後述
する背景雑音保持部7に与えてその保持内容を更新させ
ると共に、スイッチ5が出力端子fに接続されている場
合(音声期間の場合)には、背景雑音推定部6は、(13)
式に従って求めた推定背景雑音信号N”(f) を形成して
スイッチ5を介して加算器28に与える。
音期間で共に実行されるが、背景雑音推定部6からの出
力は音声期間及び雑音期間で異なるようになされてい
る。(12)式及び(13)式に示す演算を、音声期間及び雑音
期間で共に実行するのは、背景雑音推定部6からの出力
を切り替えた前後でもその出力を入力信号N(f) に追従
させておくためである。
り、推定雑音平均係数γ、γ”を小さくすると時間変化
に敏感に、推定雑音平均係数γ、γ”を大きくすると時
間変化に安定にN’(f) 、N”(f) を作成することがで
きる。この実施形態では、背景雑音推定部6内にカウン
タ(図示せず)を設け、装置全体が初期動作を開始した
ときにはγ=0.2、γ”=0.2とし、雑音期間(狭
帯域雑音を含むために音声期間として検出されている期
間を含む)が初期状態から160msを経過したときには
γ=0.5、γ”=0.7になるようにしている。推定
雑音平均係数γ、γ”の値は適用する用途に応じて1.
0以下の範囲で所望の設計値を入れて良く、実施形態の
値に限定されるものではない。
(f) を求める際には、スイッチ5が出力端子fに接続さ
れている場合(音声期間の場合)であるので、このスイ
ッチ5の機能により、後述する背景雑音保持部7の内容
が更新されず、背景雑音保持部7からの推定背景雑音信
号N’(f) は各フレームで同一の値になっている。
信号種別判定器30からの制御信号により、入力信号が
有声音、無声音を問わず「音声あり」の場合(音声期
間)は、背景雑音推定部6からの推定背景雑音信号N”
(f) を加算器28に与え、入力信号が「音声なし」の場
合(雑音期間)は、背景雑音推定部6からの推定背景雑
音信号N’(f) を背景雑音保持部7に与える。
信号X(f) (=N(f) )の場合、パワーが狭帯域に集中
しているため、周波数軸信号種別判定部30において、
「音声あり」と誤って検出される恐れがある(後述する
図7参照)。
部6において、後述する雑音消去に用いる推定雑音平均
係数γを適用した推定背景雑音信号N’(f) を形成させ
るだけでなく、安定時において推定雑音平均係数γより
小さな値の推定雑音平均係数γ”を適用した推定背景雑
音信号N”(f) を形成させると共に、加算器28及び狭
帯域雑音判定部29を設けている。
雑音信号N”(f) が与えられるだけでなく、FFT演算
器4の出力信号X(f) も与えられる。加算器28は、(1
4)式に示すように、FFT演算器4の出力信号X(f) か
ら推定背景雑音信号N”(f)を減算する雑音消去処理を
行ない、その処理後の信号E4(f) を狭帯域雑音判定部
29に与える。
を説明するための図面である。図6は、信号X(f) に音
声信号が含まれている場合を示しており、図7は、信号
X(f) が狭帯域雑音を含む雑音だけでの場合を示してい
る。
に、周波数軸音声検出器31から、信号X(f) における
最大パワーレベルMAX(k) とその周波数fmax とが与
えられている。
レームについて、最大パワーレベル周波数fmax での信
号E4(k) での値E4 (fmax)を求め、次に、(15)式に
従って、最大パワーレベルMAX(k) と、その求めた値
E4 (fmax)との偏差MAX_E4(k) を求める。
4(k) を、予め定められている闘値NALLOW(例え
ば10dB;これに限定されるものではない)と比較す
る。そして、狭帯域雑音判定部29は、偏差MAX_E
4(k) が閾値NALLOWより大きいときは狭帯域雑音
が存在する背景雑音(「狭帯域雑音あり」)と判定し、
偏差MAX_E4(k) が閾値NALLOW以下のときに
は音声と判定する。
(f) に音声が含まれている場合には、雑音消去処理後の
信号E4(k) のスペクトルは信号X(f) に近似してお
り、信号X(f) が狭帯域雑音を含む雑音の場合には、雑
音消去処理後の信号E4(k) のスペクトルは狭帯域雑音
の帯域においてもレベルが低くなり、そのため、上述の
ような方法によって、音声か狭帯域雑音を含む雑音かを
弁別することができる。
うち最大値周波数のみを判定基準の周波数にしたが、局
所的な複数の最大値(極大値)の周波数を用いて、総合
的に狭帯域雑音の有無を判定するようにしても良い。
上述のように、周波数軸信号種別判定部30に与えら
れ、周波数軸信号種別判定部30において、「狭帯域雑
音あり」の場合には、音声信号との検出内容を強制的に
雑音検出に切り替える。
「真の音声信号」のときのみ出力端子fに接続が保持さ
れ、「狭帯域雑音」の有無を問わず「雑音」の場合は出
力端子eに接続が保持される。以上の説明においては、
スイッチ5に対する制御信号を有声、無声判定器32か
ら出力するものを示したが、周波数軸音声検出器31が
スイッチ5に対する制御信号を出力するようにしても良
い。
した推定背景雑音信号N’(f) は、スイッチ5を経由し
て背景雑音保持部7に与えられる。なお、スイッチ5の
機能により、背景雑音保持部7に推定背景雑音信号N’
(f) が与えられるのは、雑音期間である。
雑音信号N’(f) を保持値Nkep(k) として格納する
と共に、入力された推定背景雑音信号N’(f) を乗算器
8及び9に出力するものである。
判定部30から、「音声あり」又は「音声なし」を示す
制御信号も与えられている。この第1の実施形態の背景
雑音推定部6は、音声期間(狭帯域雑音を含むために誤
って検出された期間を含む)においても、推定動作を実
行するため、なんらの措置も講じない場合には、長期間
にわたって音声期間が継続したときに、推定背景雑音信
号N’(f) 及びN”(f) が音声信号によって乱されてし
まう。
は、音声継続フレーム数がm(mは2以上)だけ継続し
た場合には、そのフレームより、mフレーム前の保持し
ている推定背景雑音信号Nkep(k-m) を、背景雑音推
定部6に与えて、背景雑音推定部6において、(16)式及
び(17)式に示すように、現フレームの推定背景雑音信号
N’(k) 及びN”(k) を強制的に変更させるようにす
る。なお、Nkep(k) はNkep(f,k) と同意であ
る。
あり」と検出された内容が狭帯域の検出によって「音声
なし」に切り替えられるに要するフレーム数より長いフ
レーム数にしておくことが好ましい。
雑音信号N’(f) は、乗算器8、9及び交差点検出器2
1に与えられる。
動作により、加算器14、適応窓関数発生部19及びス
ペクトル修正部18と共に、入力信号が「音声あり」の
場合の出力信号の形成に有効に機能するものであり、こ
れに対して、乗算器8は、スイッチ17の選択動作によ
り、加算器13、信号レベル計算部15及び単純減衰部
16と共に、入力信号が「音声なし」の場合(背景雑音
だけを含む区間(以下、雑音区間と呼ぶ))の出力信号
の形成に有効に機能するものである。
対して背景雑音除去係数α1(1.0≧α1≧0)を乗
算し、その出力信号N1’(f) (=α1・N’(f) )を
加算器14に対して減算入力として与えるものである。
(f) に対して背景雑音除去係数α2(1.0≧α2≧
0)を乗算し、その出力信号N2’(f) (=α2・N’
(f) )を加算器13に対して減算入力として与えるもの
である。
以下の範囲で適切に設定されるものであり、この背景雑
音除去係数α1又はα2を大きくすると雑音除去量に優
れる一方、音声混入の際には音感が不自然になり、この
背景雑音除去係数α1又はα2を小さくすると、雑音除
去特性が劣るが音感が自然になる。この実施形態では、
1.0≧α2≧α1≧0になるように選定しており、例
えば、α1=0.7、α2=0.9としている。
らの出力信号X(f) (雑音区間ではN(f) )が入力され
ており、各加算器13、14はそれぞれ、FFT演算器
4からの出力信号X(f) から、対応する乗算器8、9か
らの出力信号N1’(f) 、N2’(f) を減算して、FF
T演算器4からの出力信号X(f) に対する雑音消去を行
なう。
号があろうがなかろうが同じ減算演算を実行するが、音
声信号がない雑音区間では、FFT演算器4からの出力
信号X(f) が雑音成分N(f) だけになっており、しか
も、背景雑音推定部6において精度良く背景雑音が推定
された場合には、推定背景雑音信号N’(f) は入力信号
における雑音成分N(f) に等しいとみなすことができる
ので、加算器14からの出力信号E1(f) は(18)式で表
すことができ、また、加算器13からの出力信号E2
(f) は(19)式で表すことができる。
は1.0≧α2≧α1≧0を満たすように選定されてい
るので、雑音期間において、加算器14からの出力信号
E1(f) は、常に、加算器13からの出力信号E2(f)
以上となっている。
音声期間には、上述したように、スイッチ5が出力端子
fに接続されて、背景雑音保持部7からの推定背景雑音
信号N’(f) の出力は同じ値を継続するので、加算器1
4からの出力信号E1(f) は(20)式で表すことができ、
また、加算器13からの出力信号E2(f) は(21)式で表
すことができ、加算器14からの出力信号E1(f) は、
常に、加算器13からの出力信号E2(f) 以上となる。
なお、(20)式及び(21)式におけるS(f) は、入力音声S
(t) に対するFFT演算器4からの成分である。
部15及びスペクトル修正部18に与えられる。また、
加算器14からの出力信号E1(f) は、スイッチ17の
入力端子b、適応窓関数発生部19及びスペクトル修正
部18に与えられる。
3からの出力信号(雑音消去処理後の信号)E2(f) の
パワーレベル情報として、(22)式に従う絶対値レベル和
L2を計算すると共に、FFT演算器4からの出力信号
(雑音消去処理前の信号であり、雑音期間で有効に機能
するのでN(f) を考えれば良い)のパワーレベル情報と
して、(23)式に従う絶対値レベル和L3を計算する。な
お、(22)式及び(23)式における総和Σは、周波数領域で
の開始周波数sfからその終了周波数ef(=4kHz )
についてである。なお、パワーレベル情報として、自乗
平均の和を求めるようにしても構わない。
を求めると、次には、(24)式に従って、減衰係数γ4を
求めて単純減衰部16に出力する。
FT演算器4の出力信号N(f) のレベル比を減衰係数γ
4として計算しているが、加算器14の出力信号E1
(f) と、FFT演算器4の出力信号N(f) のレベル比を
減衰係数γ4として計算するようにしても良い。
出力信号(雑音期間で有効に機能するのでN(f) )の周
波数成分に減衰係数γ4を乗算し、レベルの小さい周波
数成分信号γ4・N(f) を作成し、雑音期間(「音声な
し」期間)において選択されるスイッチ17の入力端子
aに出力する。この単純減衰部16からの出力信号γ4
・N(f) は、FFT演算器4の出力信号N(f) のレベル
を、加算器13の出力信号E2(f) のレベルに変換した
ものとなり、しかも、雑音消去処理を受けない信号、す
なわち、処理によるゆがみがない信号γ4・N(f) とな
る。
される適応窓関数発生部19は、パワー最大値周波数探
索器20、交差点検出器21、周辺極大値探索器22及
びカウンタ23から構成されており、加算器14からの
出力信号E1(f) はパワー最大値周波数探索器20へ入
力される。
て、入力信号E1(f) の周波数特性に応じて、窓関数処
理を施すものである。図8及び図9は、適応窓関数発生
部19による窓関数作成方法の説明図であり、適応窓関
数発生部19の各部20、21、22、23の機能をこ
れら図8及び図9をも参照しながら説明する。
器20には、加算器14からの出力信号E1(f) が入力
され、パワー最大値周波数探索器20は、処理周波数の
中で最大のパワーを示す周波数fmax を検索する。図8
の例では、最大パワー周波数fmax は、点aの周波数で
ある。最大値パワー周波数fmax (点a)は窓関数を施
す対象の基準であり、最大値パワー周波数fmax (点
a)を中心に予め定めた個数だけの窓関数処理を施す。
ここでは、最大値パワー周波数fmax (点a)を中心に
周波数上方及び下方にそれぞれ2個の窓関数処理を施す
ものとする。
る。以下では、図8における最大値パワー周波数点aか
らその周波数上方側に隣合う極大値パワー周波数点dに
至る周波数範囲を例にとって、窓関数の作成方法を説明
する。
ワー最大値周波数探索器20は、最大値周波数fmax を
交差点検出器21に出力する。この交差点検出器21に
は、背景雑音保持部7から出力された推定背景雑音信号
N’(f) も与えられており、また、加算器14の出力信
号E1(f) も与えられている。交差点検出器21は、最
大値周波数点aから周波数軸上方の各周波数について、
(22-a)式に示すように、両信号E1(f) 及びN1(f) の
差分値CR(f) の符号を判定する。
が反転し、これをもって交点検出とする。さらに、差分
値CR(f) の算出、符号判定を周波数軸上方に向かって
継続していくと再び符号が反転する交点cが現れる。交
差点検出器21は、これら交点b及びcの中点eを求
め、求めた中点eを周辺極大値探索器22へ出力する。
なお、点b及び点cの周波数軸上での中点eは窓関数の
谷間の周波数に相当する。
出力信号E1(f) が与えられており、周辺極大値探索器
22は、(23-a)式に従って、信号E1(f) の傾きdef
(f)を計算し、その符号を監視する。
に進行させ、符号の反転を監視する。そして、周辺極大
値探索器22は、信号E1(f) の傾きdef(f) の符号
が反転するとき、信号E1(f) を極大値と判定する。図
8では、点dが極大値として判定される。
し、その中点eを谷間とした窓関数を作成することがで
きる。この窓関数は、(24-a)式に示す係数W(f) をもつ
ものとする。
たときにそのことを表す情報が与えられ、カウンタ23
は、1つの窓関数が作成されると1だけ加算するもので
ある。
索器20が検出した最大パワー周波数点aを基準とした
窓関数が作成されると、点dを最大パワー周波数点aと
入れ替えて、これを最大値とみなして、点dから周波数
軸上方で再び同様の処理を交差点検出器21及び周辺極
大値探索器22は繰返す。このような交差点検出器21
及び周辺極大値探索器22を中心とした窓関数の作成処
理は、カウンタ23の計数値が所望の窓関数の個数に達
するまで繰り返し行われる。
頂点と窓関数の谷の特性を折り返して利用する。例え
ば、仮に、点dで窓関数の作成を停止するときは、点d
−点c−点eの特性を周波数軸上方に折り返しして(鏡
像)用いる。
から周波数軸下方への処理も、処理の方向が周波数軸上
で上方から下方に進行することを除けば、全く同様な処
理が行なわれる。
a)を中心に周波数上方及び下方にそれぞれ2個の窓関
数を作成するようにしているので、図9に示すように、
ナイキスト周波数より小さい範囲でも、窓関数が作成さ
れない範囲が形成される。すなわち、係数0.0の周波
数範囲が形成される。
て、加算器14からの出力信号E1(f) の内容に応じて
適応的に作成した窓関数(窓関数係数W(f) )をスペク
トル修正部18に与える。
出力信号E1(f) と加算器13の出力信号E2(f) も入
力されており、スペクトル修正部18はまず、雑音消去
所望周波数全体に渡って、(25)式に示すスペクトル信号
E3(f) を計算し、このスペクトル信号E3(f) の値が
信号E2(f) 以上の周波数ではその値E3(f) を出力値
とし、計算されたスペクトル信号E3(f) の値が信号E
2(f) より小さい周波数ではその値E3(f) を値E2
(f) に置き換えて出力値とし、このようにしてスペクト
ル修正が施されたスペクトル信号E3(f) をスイッチ1
7の入力端子cに与える。
E2(f) より小さい周波数ではその値E3(f) を値E2
(f) に置き換えて出力値とするようにしたのは、スペク
トル成分が完全に0になるのを防ぎ、最終的に再現され
る音の自然性を確保するためである。
発生部19に入力された場合におけるスペクトル修正部
18の出力スペクトル信号E3(f) を示している。この
スペクトル信号E3(f) は、雑音なし音声信号のスペク
トルに類似している。また、点fより上方のピークを有
する点i近傍の周波数成分は、窓関数の作成個数の制限
により、窓関数係数が0.0に押さえられている周波数
成分であるため、スペクトル修正部18からの出力信号
E3(f) は小さく押さえられている。
30からの信号を制御信号として受けて、雑音期間
(「音声なし」期間)では単純減衰部16からの出力信
号を選択し、有声音についての「音声あり」期間ではス
ペクトル修正部18からの出力信号を選択し、無声音に
ついての「音声あり」期間では加算器14からの出力信
号を選択して逆FFT演算器25に与えるものである。
与えられた周波数領域の信号を時間軸の信号に変換して
窓関数オーバラップ処理部24に与えるものである。
た窓関数処理部3での影響を打ち消すように、入力信号
をフレーム間でオーバラップさせ、音声信号の自然性を
再現するための処理を行ない、処理後の信号をデジタル
/アナログ変換器(以下、D/A変換器と呼ぶ)26に
出力するものである。例えば、2つのフレーム間で50
%のオーバラップを施すようにすれば良いが、オーバラ
ップ率はこれに限定されるものではない。
信号をアナログ信号に変換して、出力端子27を介し
て、次段の音声信号処理回路(例えば音声通信処理回
路)に出力するものである。
1の実施形態の背景雑音消去装置の動作を説明する。当
該背景雑音消去装置に対して、最初に、背景雑音N(t)
だけが入力され、その後に、音声S(t) 及び背景雑音N
(t) が混在して入力されるとして、説明を行なう。ま
た、スイッチ5は、装置の立上り時に出力端子eの選択
状態にあり、スイッチ17は、装置の立上り時に入力端
子aの選択状態にあるとして説明を行なう。
が捕捉して電気信号に変換した入力信号N(t) は、A/
D変換器2において、デジタル信号に変換された後、窓
関数処理部3に与えられる。
られた信号は、予め定められたフレーム長毎に窓関数演
算が施されてFFT演算器4に与えられ、FFT演算器
4において、入力された時間領域の信号x(k) がフレー
ム毎に周波数領域の信号(周波数成分)X(f) に変換さ
れ、背景雑音推定部6、加算器13、14、28、信号
レベル計算部15、単純減衰部16及び周波数軸信号種
別判定部30に与えられる。
述したようにして、FFT演算器4からの出力信号x
(f) が音声信号であるものであるか、音声信号である場
合に、有声音か無声音かが判定される。
なし」と判定され、スイッチ5は出力端子eの選択状態
を継続すると共に、スイッチ17は入力端子aの選択状
態を継続する。背景雑音推定部6が、FFT演算器4か
らの出力信号X(f) (この場合N(f) )に基づいてフレ
ーム毎に雑音推定して第1及び第2の推定背景雑音信号
N’(f) 及びN”(f) を作成している、この最初の雑音
期間の場合においては基本的には、推定して得た第1の
推定背景雑音信号N’(f) が、スイッチ5の出力端子e
を介して背景雑音保持部7に与えられて、この背景雑音
保持部7から推定背景雑音信号N’(f) が各乗算器8、
9に与えられる。なお、推定背景雑音信号N’(f) は交
差点検出器21にも与えられるが、スイッチ17が入力
端子aを選択しているので、この信号の供給は意味をな
さない。
雑音が狭帯域雑音を含む場合には、周波数軸信号種別判
定部30において、「音声なし」ではなく誤って「音声
あり」と検出されることがある。
0からの制御信号に基づいて、スイッチ5は出力端子f
を選択すると共に、背景雑音推定部6は第2の推背景雑
音信号N”(f) を出力する。このときには、背景雑音保
持部7が保持している推定背景雑音信号N’(f) の更新
は実行されない。また、スイッチ5から出力された第2
の推背景雑音信号N”(f) は加算器28に与えられる。
らの出力信号X(f) (この場合N(f) )から第2の推背
景雑音信号N”(f) が減算されて雑音消去は実行され、
この雑音消去後の信号E4(f) が狭帯域雑音判定部29
に与えられる。また、雑音消去前のFFT演算器4から
の出力信号X(f) も狭帯域雑音判定部29に与えられ
る。これら信号E4(f) 及びX(f) と、周波数軸音声検
出器31からの信号MAX(k) 及び周波数fmax とに基
づいて、上述した狭帯域雑音判定部29の判定処理によ
り、狭帯域雑音の存在が判定され、周波数軸信号種別判
定部30に通知される。
においては、「音声あり」という今までの判定結果を
「音声なし」(雑音期間)に切替える。このとき、スイ
ッチ5は出力端子eの選択状態に切り替わり、スイッチ
17も入力端子aの選択状態に切り替わる。
って「音声あり」と検出されていても速やかに「音声な
し」に切り替えることができ、狭帯域雑音を含む場合に
も雑音期間を正しく検出することができる。
7に保持された推定背景雑音信号N’(f) は上述したよ
うに各乗算器8、9に与えられる。
音信号N’(f) に対して、各乗算器8、9においてそれ
ぞれ、背景雑音の除去度合いを決める背景雑音除去係数
α2、α1が乗算されて、乗算器8、9に対応する加算
器13、14に与えられる。なお、乗算器9は、雑音期
間終了時の信号を形成するものとしてのみ機能する。
算器4からの出力信号X(f) (ここでは雑音成分だけの
信号(N(f) )から、対応する乗算器8、9から与えら
れた、背景雑音除去係数α2、α1が乗算された後の推
定背景雑音信号N2’(f) 、N1’(f) を減算して、F
FT演算器4からの出力信号X(f) に対する雑音消去を
行なう。なお、上述したように、雑音期間においては、
スイッチ17は入力端子aの選択状態にあるので、加算
器14は存在しないに等しい。
加算器13からの雑音消去処理後の信号E2(f) のパワ
ーレベル情報L2が計算されると共に、FFT演算器4
からの雑音消去処理前の信号(雑音期間であるのでN
(f) )のパワーレベル情報L3が計算され、その後、こ
れら値L2及びL3から、減衰係数γ4が求められて単
純減衰部16に出力される。
4からの雑音消去処理前の信号の周波数成分に減衰係数
γ4が乗算され、これにより、レベルの小さい背景雑音
に係るスペクトル信号γ4・N(f) が作成され、このス
ペクトル信号γ4・N(f) が、上述したように、この雑
音期間において選択されているスイッチ17の入力端子
aを介して、逆FFT演算器25に与えられる。
FFT演算器4の出力信号(背景雑音)N(f) のレベル
を、加算器13の出力信号E2(f) のレベルに変換した
ものとなり、しかも、雑音消去処理を受けない信号(処
理によるゆがみがない信号)となっている。
17を通過した単純減衰部16からの、歪みのないかつ
レベルの抑制された雑音成分だけを含むスペクトル信号
が時間軸の信号に変換され、さらに、窓関数オーバラッ
プ処理部24において、窓関数処理部3での影響を打ち
消すようにフレーム間でオーバラップされ、D/A変換
器26において、アナログ信号に変換されて、出力端子
27を介して、次段の音声信号処理回路に出力される。
び音声S(t) が重畳されて入力されるようになったとき
の動作を説明する。
換器2、窓関数処理部3及びFFT演算器4は、雑音期
間と同様に動作する。
えられた周波数軸信号種別判定部30においては、周波
数軸音声検出器31が上述したように音声信号の存在を
検出する。これにより、スイッチ5が出力端子fの選択
状態に変更される。このときには、狭帯域雑音判定部2
9が狭帯域雑音の存在を判定しない限り、その結果、周
波数軸信号種別判定部30が「音声あり」を「音声な
し」に変更することはない。
5は出力端子fの選択状態を継続し、そのとき、背景雑
音推定部6が出力している推定背景雑音信号N”(f) が
背景雑音保持部7に入力されることはなく、背景雑音保
持部7は、音声期間を通して、その直前の雑音期間終了
時の推定背景雑音信号N’(f) を出力する。
ては、音声期間において、有声、無声判定器32によっ
て、音声信号が有声音か無声音かが判定される。そし
て、スイッチ17が、有声音期間において入力端子cを
選択し、無声音期間において入力端子bを選択するよう
に切り替えられる。
期間の継続期間を監視し、音声期間がmフレーム継続す
る毎に、背景雑音推定部6に過去の推定背景雑音信号を
与えて、推定動作に用いる推定背景雑音信号をこの過去
のものに変更させ、この音声期間が終了して雑音期間に
なったときにも、背景雑音推定部6が作成した推定背景
雑音信号N’(f) 及びN”(f) が音声信号に乱されたも
のとなっていないようにさせる。
8、9から、雑音期間終了時の推定背景雑音信号N’
(f) に背景雑音除去係数α2、α1が乗算された信号
N’2(f)、N’1(f) が対応する加算器13、14に
与えられる。
からの音声信号成分S(f) 及び背景雑音成分N(f) が重
畳されている出力信号X(f) が入力されており、各加算
器13、14において、この信号X(f) から、対応する
乗算器8、9の出力信号N’2(f) 、N’1(f) を減算
することにより、信号X(f) の背景雑音成分N(f) が軽
減された2種類の信号E2(f) 及びE1(f) が形成され
る。ここで、乗算器8に対する背景雑音除去係数α2
が、乗算器9に対する背景雑音除去係数α1より大きい
ので、加算器14からの出力信号E1(f) の方が加算器
13からの出力信号E2(f) より常に大きくなってい
る。
イッチ17が入力端子aからの入力信号を選択すること
がないので、加算器13からの出力信号E2(f) を利用
する信号レベル計算部15及び単純減衰部16は、「音
声あり」期間において存在しないに等しい。
イッチ17の入力端子bに入力されている。従って、当
該装置への入力信号に存在する音声信号が無声音の場合
には、加算器14からの出力信号E1(f) が、スイッチ
17で選択されて逆FFT演算器25に与えられること
になる。
、「音声あり」期間で固定化されている背景雑音保持
部7からの推定背景雑音信号N’(f) は、適応窓関数発
生部19に与えられ、また、加算器14からの出力信号
E1(f) 及び加算器13からの出力信号E2(f) は、ス
ペクトル修正部18に与えられる。
避けるが、パワー最大値周波数探索器20、交差点検出
器21、周辺極大値探索器22及びカウンタ23の上述
した機能により、加算器14からの出力信号E1(f) に
適応した窓関数が作成されてスペクトル修正部18に与
えられる。
上述したように、加算器14からの出力信号E1(f) に
対して、適応窓関数発生部19が作成した窓関数を用い
た窓関数演算処理が施され、その演算後の信号E3(f)
において、加算器13からの出力信号E2(f) よりレベ
ルが小さい周波数については、信号E2(f) の値に置き
換え、このようなスペクトル修正後の信号E3(f) がス
イッチ17の入力端子cに与えられる。従って、当該装
置への入力信号に存在する音声信号が有声音の場合に
は、スペクトル修正部18からの出力信号E3(f) が、
スイッチ17で選択されて逆FFT演算器25に与えら
れることになる。
存在する音声信号が有声音の場合には、スペクトル修正
され背景雑音が消去され音声成分が強調された信号が、
スイッチ17で選択され、存在する音声信号が無声音の
場合には、背景雑音が消去された信号が、スイッチ17
で選択されて逆FFT演算器25に入力される。
FT演算器25、窓関数オーバラップ処理部24及びD
/A変換器26による処理が施されて、出力端子27か
ら出力される。
もそれぞれ、上述した雑音期間の動作や音声期間の動作
と同様である。
以下の効果を奏することができる。
いの大きい雑音消去後の信号E2(f) にしたので、この
関数を背景雑音の状態に自動的に対応させることがで
き、疑似関数が未知であっても、予め固定の関数を設定
する必要がなく、実用上、良好な音声品質を達成するこ
とができる。
個数限定でなく、周波数特性の最大パワー周波数からの
個数にしたので、音声が自然になり、音声品質を高める
ことができる。
間では、窓関数の作成個数の制限を通じて、窓関数係数
を0にするようにしたので、低域の方が周波数パワーが
大きく、高域の方が周波数パワーが小さいという音声の
一般的な性質を反映でき、音声通信等に音感に優れた雑
音消去を実現することができる。
力された信号から有声音成分信号、無声音成分信号の判
断を行なうので、実際の装置に実装して十分な背景雑音
消去装置を実現できる。
び狭帯域雑音判定部29を設けて、狭帯域雑音判定を行
ない、音声と狭帯域雑音の区別をつけて背景雑音の推定
を行なうようにしたので、雑音が狭帯域性の雑音である
とき、簡易周波数サブトラクションの処理結果で完全に
狭帯域雑音を除去できずに、周波数の谷間を誤作成する
ための音質劣化をなくすことができる。
を図面を参照しながら詳述する。
装置の全体構成を示すブロック図であり、第1の実施形
態に係る図1との同一、対応部分には同一符号を付して
示している。
に、第2の実施形態の背景雑音消去装置は、適応窓関数
発生部19の内部構成が第1の実施形態とは異なってお
り、適応窓関数発生部19以外の構成は、第1の実施形
態と同様であり、その説明は省略する。
は、パワー最大値周波数探索器20、ピーク基本周期探
索部34、小領域最大値探索器35及びカウンタ23か
ら構成されている。
も、加算器14からの出力信号E1(f) の周波数特性に
応じて、窓関数処理を施すものである。図12及び図1
3は、第2の実施形態の適応窓関数発生部19による窓
関数作成方法の説明図であり、適応窓関数発生部19の
各部の機能をこれら図12及び図13をも参照しながら
説明する。
実施形態と同様に、加算器14からの出力信号E1(f)
について、処理周波数の中で最大のパワーを示す周波数
fmax (点a)を検索する。そして、最大パワー周波数
fmax (点aの周波数fa)の情報をピーク基本周期探
索部34に出力する。
4の出力信号E1(f) が与えられており、ピーク基本周
期探索部34は、パワー最大値周波数探索器20で検索
された最大値周波数fmax から周波数軸上方に対して、
以下のようにして極大値を検索する。まず、(26)式に従
って、信号E1(f) の傾きdef3(f) を計算し、その
後、符号反転を監視して極大値を検出する。
さらに周波数軸上方に向かわせ、傾きdef3(f) が正
になったとき以降に、極大値検出を開始し、再び、傾き
が負に変化した周波数を極大値とする。
検索は行なわれず、極大値は点eから点dに向かいなが
ら計算される。図12の場合、点dが極大値(第2の最
大パワー周波数fmax2=fd)として検出される。
式に示すピーク間周波数幅SBを求める。以後、この周
波数幅SBを基準幅として、極大値の検出を行なう。
関数を作成する。すなわち、最大パワー周波数fmax の
周波数上下にそれぞれΔ1/2の幅をもち、最大パワー
周波数fmax (点a)及び第2の最大パワー周波数fma
x2(点d)の中点周波数を最下点(点e;周波数fe)
とする図13に示すような窓関数を計算する。今、周波
数幅Δ1を2・qで表すと、ピーク基本周期探索部34
は、最大パワー周波数fmax (=fa)側の傾斜部で
は、(28)式で表される窓関数係数W(f) を有し、第2の
最大パワー周波数fmax2(=fd)側の傾斜部では、(2
9)式で表される窓関数係数W(f) を有する窓関数を形成
して、小領域最大値探索器35を経由してスペクトル修
正部18に出力する。
であるので、(30)式が成立し、そのため、(29)式の窓関
数係数W(f) を、(31)式によって計算するようにしても
良い。
波数幅Δ1の余裕を持たせるようにしたのは、音声信号
成分のスペクトルの広がりに対応するためである。
を終了すると、第2のピーク最大周波数fmax2は小領域
最大値探索器35に出力される。小領域最大値探索器3
5は、第2の最大パワー周波数fmax2を新たな最大パワ
ー周波数fmax として置き換えると共に、この置き換え
られた最大パワー周波数fmax を基点とした周波数軸上
方での範囲SB−Δ〜SB+Δ内でのみ新たな第2の最
大パワー周波数(ここではfmax3で表す)を検出する。
ここで、Δはスペクトルのピーク周期のばらつきを吸収
するための定数であり、例えば、Δ=10Hzに選定でき
るが、これに限定するものではない。
て、最大パワー周波数fmax (=fmax2)と第2の最大
パワー周波数fmax3が得られると、小領域最大値探索器
35は、パワー最大値周波数探索器20と同様にして、
これら2個の最大値パワー周波数fmax 及びfmax3に基
づいて、窓関数を作成し、得られた窓関数係数をスペク
トル修正器18に出力する。
が窓関数を作成する毎にカウント値を1だけ増加させ
る。このカウンタ23のカウント値が予め定めた個数
(例えば2個)に達するまで、小領域最大値探索器35
は、上述した処理を繰返す。
最大パワー周波数fmax より、周波数軸で下方への方向
に対しても、処理の方向が周波数軸上で逆であることを
除けば、ピーク基本周期探索器34及び小領域最大値探
索器35は、上述したと同様な窓関数作成処理を行な
う。
消去装置も、全体構成及び動作は、第1の実施形態と同
様であるので、第1の実施形態と同様な効果を奏するこ
とができる。
適応窓関数発生部において、周波数領域で最大値を示す
周波数を検索するパワー最大値周波数探索器を設けて、
最大パワー周波数と第2の最大パワー周波数を求め、ピ
ーク基本周期探索器で基本部分の窓関数を発生すると共
に基本探索周期を決め、また、第2回目以後の窓関数を
求めるための小領域最大値探索器を設けて、第2回目以
後は上記で定めた基本探索周期に対して多少の余裕を持
たせた区間に限定して最大値を求め、その求めた最大値
までを小領域での窓関数幅として窓関数を作成するよう
にしたので、窓関数作成時の演算処理工程を節約でき、
適応窓関数発生部におけるソフトウエア、ハードウエア
規模の縮小が期待できる。
を図面を参照しながら詳述する。
装置の全体構成を示すブロック図であり、第1の実施形
態に係る図1との同一、対応部分には同一符号を付して
示している。
に、第3の実施形態の背景雑音消去装置は、狭帯域雑音
判定部29からは判定情報を周波数軸信号種別判定部3
0に与えず、狭帯域雑音判定部29からの判定情報をス
ペクトル修正部18に与えるようにしている点、並び
に、狭帯域雑音判定部29及びスペクトル修正部18の
内部処理が第1の実施形態と異なっており、その他は第
1の実施形態と同様であるので、その説明は省略する。
果が有声音、無声音を問わずに「音声あり」であれば、
スイッチ5は出力端子fを選択する。なお、無声音であ
ったために、スイッチ5が出力端子fを選択した場合
は、後述するように狭帯域雑音判定部29からの判定情
報を利用したスペクトル修正部18からの出力信号E3
(f) がスイッチ17で選択されないので、この第3の実
施形態の場合、スイッチ5における出力端子fの選択は
意味を有していない。
雑音を含む背景雑音の場合のほとんどが「有声音の音声
信号」と検出されることを前提としており、また、音声
信号に狭帯域雑音が重畳されている場合のほとんども
「有声音の音声信号」と検出されることを前提としてい
る。
は、第1の実施形態と同様に、背景雑音推定部6から出
力された推定背景雑音信号N”(f) は加算器28に与え
られ、加算器28において、この推定背景雑音信号N”
(f) を用いたFFT演算器4からの出力信号X(f) に対
する雑音消去が行なわれ、雑音消去後の信号E4(f)が
狭帯域雑音判定部29に与えられる。
efに渡って、加算器28からの出力信号E4(f) にお
ける全ての極大値周波数MAX2_E4(k) を求める。
なお、周波数軸信号種別判定部30からの最大値周波数
fmax は得られた極大値周波数MAX2_E4(k) から
除く。
ル点が隣合う、信号E4(f) の2種類の傾きdef_2
(f) 及びdef_22(f) を求め、高周波数側の傾きd
ef_2(f) が負で低周波数側の傾きdef_22(f)
が0以上のときにその周波数fを極大値周波数MAX2
_E4(k) と判定する。
x と異なり複数存在するので、より詳細な記述として
は、MAX2_E4(fi ,k)(iは1〜n;nは装
置が許容している極大値の最大個数)であるが、以下で
は、簡単に、MAX2_E4(fi )と記す。
_E4(fi )のうち、狭帯域雑音に関する周波数NA
LLOW_f(fi )を検出する方法の説明図である。
極大値周波数MAX2_E4(fi)に関し、そのピー
ク値MAX2_E4(fi )と、N(f)が定められた閾
値NALLOWより大きい周波数を、狭帯域雑音に係る
周波数NALLOW_f(fi )として検出し、この周
波数NALLOW_f(fi )をスペクトル修正部18
に出力する。
個の極大値周波数のうち、点gに係る極大値周波数が狭
帯域雑音に係る周波数NALLOW_f(fi )として
検出される。
る周波数NALLOW_f(fi )を周波数成分として
含む窓関数の部分のゲイン(窓関数係数)を低下させ
る。すなわち、スペクトル修正部18においては、適応
窓関数発生部19が第1の実施形態で説明したように形
成した窓関数(窓関数係数W(f) )のうち、狭帯域雑音
に係る周波数NALLOW_f(fi )を周波数成分と
して含む窓関数の部分に対しては、(34)式に示すよう
に、減衰係数γ5(例えば0.1;これに限定されるも
のではない)を乗算して、ゲインを小さくさせた窓関数
(窓関数係数N_W(f) )に変換する。
して、スペクトル修正部18が、狭帯域雑音に係る周波
数NALLOW_f(fi )の情報に基づいて、修正処
理した後の全体の窓関数を示したものであり、上述した
図15に対応しているものである。
14の出力信号E1(f) に対して、一部がN_W(f) に
修正された窓関数W(f) を用いて、そのスペクトルを修
正し、そのスペクトル修正後の信号E3(f) を、スイッ
チ17の有声音に係る入力端子cに与える。
(f) の部分に対応した出力信号E1(f) の帯域について
は、(35)式に従って、スペクトル修正信号E3(f) が形
成されることになる。
部18の出力信号例を示す説明図である。
ペクトル修正部18の処理により、スペクトル修正部1
8からの出力信号E3(f) は、当該装置への入力信号に
狭帯域雑音が含まれていてもそれを除去したものとな
る。例えば、当該装置への入力信号が狭帯域雑音、通常
雑音及び音声の重畳信号であっても、スペクトル修正部
18からの出力信号E3(f) は、通常雑音が加算器14
で除去され、狭帯域雑音がスペクトル修正部18で除去
された音声が強調された信号となる。
の出力信号E2(f) を入力させて、第1の実施形態の場
合と同様に、スペクトル修正部18からの出力信号E3
(f)のレベルが低くなり過ぎることを押さえるようにし
ても良い。
消去装置も、全体構成及び動作は、第1の実施形態と同
様であるので、第1の実施形態と同様な効果を奏するこ
とができる。
狭帯域雑音判定部が狭帯域雑音周波数を判定してスペク
トル修正部に判定結果を出力し、スペクトル修正部が、
狭帯域雑音周波数を含む窓関数部分のゲインを小に修正
した窓関数を作成し直し、すなわち、音声と狭帯域雑音
の区別をつけて窓関数を作成し直してスペクトル修正す
るようにしたので、狭帯域性の雑音と音声信号が混在す
るときであっても、狭帯域性雑音を効果的に抑圧し得る
という効果を奏することができる。
を図面を参照しながら詳述する。
装置の全体構成を示すブロック図であり、第1、第2及
び第3の実施形態に係る図1、図11、図14との同
一、対応部分には同一符号を付して示している。
1、図11、図14と比較することで明らかなように、
第4の実施形態の背景雑音消去装置は、第1の実施形態
の適応窓関数発生部19に代えて、第2の実施形態で説
明した適応窓関数発生部19を設けた点、及び、第1の
実施形態の狭帯域雑音の検出、消去構成に代えて、第3
の実施形態の狭帯域雑音の検出、消去構成を適用してい
る点が、第1の実施形態と異なっている。
の機能説明は既に終了しているので、その説明は省略す
る。
消去装置も、全体構成及び動作は、第1の実施形態と同
様であるので、第1の実施形態と同様な効果を奏するこ
とができる。
えて、第2の実施形態で説明した適応窓関数発生部19
を設けたことによる第2の実施形態と同様な効果を奏す
ることができ、第3の実施形態で説明した狭帯域雑音の
検出、消去構成を適用したことによる第3の実施形態と
同様な効果を奏することができる。
実施形態の説明を行なったが、本発明は、上記各実施形
態に限定されるものでなく、上述した変形した実施形態
以外の他の実施形態も許容するものである。そのうちの
いくつかを例示すると以下の通りである。
換をFFT、逆FFT演算以外で行なうものであっても
良い。
力信号の処理系を切り替えるためのスイッチの介在位置
は、上記実施形態のものに限定されるものではない。
における引かれる値及び引く値を逆にしたり、音声の有
無や、有音無音判定等に用いる比の分母分子を逆にして
も良いことは勿論である。この場合、閾値等も変化し、
その大小関係と判定結果等も逆になる。また、信号種別
判定部が時間軸の信号(A/D変換器の出力信号)に基
づいて検出動作するものであっても良い。この場合に
も、狭帯域雑音判定部は周波数軸の信号を処理するよう
にしておけば良い。
生部が発生する窓関数が単調な直線関数であるものを示
したが、窓関数に公知のハミング窓等を用いることもで
きる。また、適応窓関数発生部に、FFT演算器からの
信号を入力して窓関数を発生させるようにしても良い。
また、適応窓関数発生部が発生する窓関数部分(台形形
状部分)の個数を外部から変更し得るようにしても良
い。
置の音声入力手段に適用することを意図してなされたも
のであるが、他の装置の音声入力手段に適用できること
は勿論である。
置によれば、狭帯域雑音を検出して雑音消去特性を切り
替える構成を設けたので、狭帯域雑音が含まれていても
雑音消去を適切に実行できるようになる。
ば、入力された音響信号に存在する音声信号が有声音か
無声音かによって、雑音消去特性が異なる出力信号を選
択すると共に、有声音を有する音響信号に対する減衰特
性の谷間の深さを規制する窓関数を入力音響信号の内容
によって適応的に変化させるようにしたので、出力信号
における音感、音質を従来より高めることができる適切
な背景雑音消去を実行できる。
る。
る。
(その1)である。
(その2)である。
1)である。
2)である。
明図(その1)である。
明図(その2)である。
説明図である。
る。
の説明図(その1)である。
の説明図(その2)である。
る。
図である。
関数例を示す説明図である。
す説明図である。
る。
部、4…FFT演算器、5、17、28…スイッチ、6
…背景雑音推定部、7…背景雑音保持部、8、9…乗算
器、13、14…加算器、15…信号レベル計算部、1
6…単純減衰部、18…スペクトル修正部、19…適応
窓関数発生部、20…パワー最大値周波数探索器、21
…交差点検出器、22…周辺極大値探索器、23…カウ
ンタ、24…窓関数オーバラップ、25…逆FFT演算
器、26…D/A変換器、29…狭帯域雑音判定部、3
0…周波数軸信号種別判定部、31…周波数軸音声検出
器、32…有声、無声判定器、34…ピーク基本周期探
索器、35…小領域最大値探索器。
Claims (11)
- 【請求項1】 時間軸上の入力音響信号を周波数軸上の
信号に変換する時間軸/周波数軸変換手段と、 入力音響信号が背景雑音だけか、入力音響信号が音声信
号を含むかを判別するとともに、上記周波数軸上の音響
信号の最大ピークパワーと最大ピークパワーを示すパワ
ー最大値周波数を認識する第1の信号種別判定手段と、 上記時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号に基づいて、入力音響信号に追従しながら背
景雑音を推定した推定雑音信号を形成する狭帯域雑音検
出用背景雑音推定出力手段と、 上記時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号から、上記推定雑音信号を、上記第1の信号
種別判定手段による判定結果が音声ありのときに減じる
狭帯域雑音検出用雑音消去演算手段と、上記第1の信号種別判定手段により認識されたパワー最
大値周波数における上記狭帯域雑音検出用雑音消去演算
手段による雑音処理後の信号のパワーと上記第1の信号
種別判定手段により認識された周波数軸上の音響信号の
最大ピークパワーとの差分と所定の閾値とを比較して、
上記 入力音響信号に狭帯域雑音の有無、又は、狭帯域雑
音の周波数領域を検出する狭帯域雑音判定手段とを有
し、上 記狭帯域雑音判定手段の判定結果が狭帯域雑音ありの
場合に、上記第1の信号種別判定手段の音声ありの検出
結果を音声なしに切り替えて、当該装置からの出力信号
における雑音消去特性を変化させることを特徴とする背
景雑音消去装置。 - 【請求項2】 上記第1の信号種別判定手段が、入力音
響信号が背景雑音だけか、入力音響信号が音声信号を含
むか、音声信号を含む場合に有声音か無声音かを判別す
るものであり、 上記時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号に基づいて、入力音響信号に追従しながら背
景雑音を推定した推定雑音信号を形成すると共に、入力
音響信号が音声信号を含むときに、音声信号が含まれる
直前の推定雑音信号を繰返し出力する背景雑音推定出力
手段と、 少なくとも入力音響信号が音声信号を含むときに、当該
背景雑音推定出力手段からの推定雑音信号に第1の係数
を乗算する第1の乗算手段と、 上記時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号から、第1の係数が乗算された推定雑音信号
を減じる第1の雑音消去演算手段と、 この第1の雑音消去演算手段からの出力信号又は上記時
間軸/周波数軸変換手段からの出力信号の周波数特性に
応じて、窓関数を作成する適応窓関数発生手段と、 上記第1の雑音消去演算手段からの出力信号のスペクト
ルを、上記適応窓関数発生手段が作成した窓関数に応じ
て修正するスペクトル修正手段と、 入力音響信号に有声音の音声信号があるときに、上記ス
ペクトル修正手段からの出力信号を選択し、入力音響信
号に無声音の音声信号があるときに、上記第1の雑音消
去演算手段からの出力信号を選択する雑音消去信号選択
手段と、 この雑音消去信号選択手段で選択された周波数軸上の信
号を時間軸上の信号に変換する周波数軸/時間軸変換手
段とをさらに有し、 上記スペクトル修正手段は、上記適応窓関数発生手段が
作成した窓関数における上記狭帯域雑音判定手段によっ
て判定された狭帯域雑音の周波数成分のゲインを減少さ
せた後、スペクトル修正を行なうことを特徴とする請求
項1に記載の背景雑音消去装置。 - 【請求項3】 時間軸上の入力音響信号を周波数軸上の
信号に変換する時間軸/周波数軸変換手段と、 入力音響信号が背景雑音だけか、入力音響信号が音声信
号を含むか、音声信号を含む場合に有声音か無声音かを
判別する第2の信号種別判定手段と、 上記時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号に基づいて、入力音響信号に追従しながら背
景雑音を推定した推定雑音信号を形成すると共に、入力
音響信号が音声信号を含むときに、音声信号が含まれる
直前の推定雑音信号を繰返し出力する背景雑音推定出力
手段と、 少なくとも入力音響信号が音声信号を含むときに、当該
背景雑音推定出力手段からの推定雑音信号に第1の係数
を乗算する第1の乗算手段と、 上記時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号から、第1の係数が乗算された推定雑音信号
を減じる第1の雑音消去演算手段と、 この第1の雑音消去演算手段からの出力信号又は上記時
間軸/周波数軸変換手段からの出力信号の周波数特性に
応じて、窓関数を作成する適応窓関数発生手段と、 上記第1の雑音消去演算手段からの出力信号のスペクト
ルを、上記適応窓関数発生手段が作成した窓関数に応じ
て修正するスペクトル修正手段と、 入力音響信号に有声音の音声信号があるときに、上記ス
ペクトル修正手段からの出力信号を選択し、入力音響信
号に無声音の音声信号があるときに、上記第1の雑音消
去演算手段からの出力信号を選択する雑音消去信号選択
手段と、 この雑音消去信号選択手段で選択された周波数軸上の信
号を時間軸上の信号に変換する周波数軸/時間軸変換手
段とを備えることを特徴とする背景雑音消去装置。 - 【請求項4】 少なくとも入力音響信号が背景雑音だけ
を含むときに、上記背景雑音推定出力手段からの推定雑
音信号に、第1の係数より大きな第2の係数を乗算する
第2の乗算手段と、 変換された周波数軸上の音響信号から、第2の係数が乗
算された推定雑音信号を減じる第2の雑音消去演算手段
と、 この第2の雑音消去演算手段による雑音消去処理前後の
信号レベルの関係に応じて、変換された周波数軸上の音
響信号を音質を変化させずに減衰させる無歪減衰手段と
をさらに備えると共に、 上記雑音消去信号選択手段が、入力音響信号が背景雑音
だけを含むときに、上記無歪減衰手段からの出力信号を
選択することを特徴とする請求項2又は3に記載の背景
雑音消去装置。 - 【請求項5】 上記第1又は第2の信号種別判定手段
が、 上記背景雑音推定出力手段からの推定背景雑音信号の周
波数軸でのパワー平均値と、上記時間軸/周波数軸変換
手段で変換された周波数軸上の音響信号のパワー平均値
の差又は比でなる平均値間関係値を第1の閾値と比較し
て音声の有無を検出する周波数軸音声検出器と、 音声ありの場合において、上記平均値間関係値と第2の
閾値との大小関係、及び、周波数軸での最大値と推定背
景雑音信号のパワー比と第3の閾値との大小関係に応じ
て、有声音か無声音かを判定する有声、無声判定器とを
有することを特徴とする請求項2又は3に記載の背景雑
音消去装置。 - 【請求項6】 上記適応窓関数発生手段は、 当該適応窓関数発生手段への入力信号の最大ピークパワ
ーをとるパワー最大値周波数を検索するパワー最大値周
波数探索器と、 当該適応窓関数発生手段への入力信号のレベルと、上記
背景雑音推定出力手段から出力された推定雑音信号のレ
ベルとが交差する交点周波数を求める交差点検出器と、 パワー最大値周波数近傍の極大値を持つ周波数を検出す
る周辺極大値探索器とを有し、 求めた極大値周波数、パワー最大値周波数及び交点周波
数に基づいて、上記スペクトル修正手段に出力する窓関
数を作成することを特徴とする請求項2又は3に記載の
背景雑音消去装置。 - 【請求項7】 上記適応窓関数発生手段は、 当該適応窓関数発生手段への入力信号の最大ピークパワ
ーをとるパワー最大値周波数を検索するパワー最大値周
波数探索器と、 パワー最大値周波数を基準として周波数のピーク間の基
本幅を計算するピーク基本周期探索器と、 求めたピーク間基本幅ずつずれた小領域におけるピーク
周波数を検索する小領域最大値探索器とを有し、 求めたパワー最大値周波数及び小領域内ピーク周波数に
基づいて、上記スペクトル修正手段に出力する窓関数を
作成することを特徴とする請求項2又は3に記載の背景
雑音消去装置。 - 【請求項8】 上記適応窓関数発生手段は、窓関数にお
ける台形形状の窓関数部分の個数を、パワー最大値周波
数を中心とした周波数の上方及び下方にそれぞれ所定個
数に制限して作成させる窓関数部分作成個数制限部をさ
らに有することを特徴とする請求項6又は7に記載の背
景雑音消去装置。 - 【請求項9】 周波数の上方に所定個数を越えた周波数
領域における窓関数のゲインを0に選定していることを
特徴とする請求項8に記載の背景雑音消去装置。 - 【請求項10】 上記スペクトル修正手段は、上記窓関
数発生手段からの窓関数に応じて修正した後の信号にお
ける谷間の深さが過度に小さくなったときに、その過度
に小さくなった部分を所定レベルまで持ち上げて出力す
ることを特徴とする請求項2又は3に記載の背景雑音消
去装置。 - 【請求項11】 上記スペクトル修正手段は、上記窓関
数発生手段からの窓関数に応じて修正した後の信号レベ
ルが、上記第2の雑音消去演算手段による雑音消去処理
後の信号レベルより小さくなった周波数部分を、谷間の
深さが過度に小さくなった周波数部分と捕らえて、上記
第2の雑音消去演算手段による雑音消去処理後の信号に
置き換えることを特徴とする請求項10に記載の背景雑
音消去装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15417996A JP3297307B2 (ja) | 1996-06-14 | 1996-06-14 | 背景雑音消去装置 |
US08/876,509 US5907624A (en) | 1996-06-14 | 1997-06-16 | Noise canceler capable of switching noise canceling characteristics |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15417996A JP3297307B2 (ja) | 1996-06-14 | 1996-06-14 | 背景雑音消去装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH103299A JPH103299A (ja) | 1998-01-06 |
JP3297307B2 true JP3297307B2 (ja) | 2002-07-02 |
Family
ID=15578570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15417996A Expired - Fee Related JP3297307B2 (ja) | 1996-06-14 | 1996-06-14 | 背景雑音消去装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5907624A (ja) |
JP (1) | JP3297307B2 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7046813B1 (en) * | 1997-09-25 | 2006-05-16 | Fumio Denda | Auditory sense training method and sound processing method for auditory sense training |
US6549586B2 (en) * | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6453285B1 (en) | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US6327564B1 (en) * | 1999-03-05 | 2001-12-04 | Matsushita Electric Corporation Of America | Speech detection using stochastic confidence measures on the frequency spectrum |
US6393372B1 (en) | 1999-05-17 | 2002-05-21 | Eugene Rzyski | Automated frequency stepping noise measurement system |
US6172564B1 (en) | 1999-07-30 | 2001-01-09 | Eugene Rzyski | Intermodulation product cancellation circuit |
US6477196B1 (en) * | 1999-08-30 | 2002-11-05 | Rockwell Collins, Inc. | Direct sequence spread spectrum communications receiver and method for efficient narrow-band signal excision |
WO2001024167A1 (fr) | 1999-09-30 | 2001-04-05 | Fujitsu Limited | Dispositif antiparasite |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
US6438225B1 (en) * | 2000-01-13 | 2002-08-20 | Motorola, Inc. | Method and system for detecting and controlling severe echo |
US8019091B2 (en) | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
US20070233479A1 (en) * | 2002-05-30 | 2007-10-04 | Burnett Gregory C | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
US8280072B2 (en) | 2003-03-27 | 2012-10-02 | Aliphcom, Inc. | Microphone array with rear venting |
US6496064B2 (en) | 2000-08-15 | 2002-12-17 | Eugene Rzyski | Intermodulation product cancellation circuit |
US20020147585A1 (en) * | 2001-04-06 | 2002-10-10 | Poulsen Steven P. | Voice activity detection |
US8452023B2 (en) | 2007-05-25 | 2013-05-28 | Aliphcom | Wind suppression/replacement component for use with electronic systems |
US6621349B2 (en) | 2001-11-07 | 2003-09-16 | International Business Machines Corporation | Power supply noise compensation amplifier |
US9066186B2 (en) | 2003-01-30 | 2015-06-23 | Aliphcom | Light-based detection for acoustic applications |
US9099094B2 (en) | 2003-03-27 | 2015-08-04 | Aliphcom | Microphone array with rear venting |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4162604B2 (ja) * | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
KR100640865B1 (ko) | 2004-09-07 | 2006-11-02 | 엘지전자 주식회사 | 음성 품질 향상 방법 및 장치 |
US7706542B2 (en) * | 2005-03-28 | 2010-04-27 | Pioneer Corporation | Noise removal device |
US8837746B2 (en) | 2007-06-13 | 2014-09-16 | Aliphcom | Dual omnidirectional microphone array (DOMA) |
GB0725110D0 (en) * | 2007-12-21 | 2008-01-30 | Wolfson Microelectronics Plc | Gain control based on noise level |
EP2359361B1 (en) * | 2008-10-30 | 2018-07-04 | Telefonaktiebolaget LM Ericsson (publ) | Telephony content signal discrimination |
JP5606234B2 (ja) * | 2010-09-13 | 2014-10-15 | キヤノン株式会社 | 音響装置 |
CN105634543B (zh) * | 2015-12-30 | 2019-09-03 | 航天恒星科技有限公司 | 一种抗窄带干扰方法及*** |
US11335312B2 (en) | 2016-11-08 | 2022-05-17 | Andersen Corporation | Active noise cancellation systems and methods |
CA3098619A1 (en) | 2018-05-04 | 2019-11-07 | Andersen Corporation | Multiband frequency targeting for noise attenuation |
CN112614507B (zh) * | 2020-12-09 | 2024-06-11 | 腾讯音乐娱乐科技(深圳)有限公司 | 检测噪声的方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07273840A (ja) * | 1994-03-25 | 1995-10-20 | Nec Corp | 音声帯域制御機能を有する移動電話機 |
US5727072A (en) * | 1995-02-24 | 1998-03-10 | Nynex Science & Technology | Use of noise segmentation for noise cancellation |
JPH09212196A (ja) * | 1996-01-31 | 1997-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 雑音抑圧装置 |
-
1996
- 1996-06-14 JP JP15417996A patent/JP3297307B2/ja not_active Expired - Fee Related
-
1997
- 1997-06-16 US US08/876,509 patent/US5907624A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US5907624A (en) | 1999-05-25 |
JPH103299A (ja) | 1998-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3297307B2 (ja) | 背景雑音消去装置 | |
US7706550B2 (en) | Noise suppression apparatus and method | |
RU2121719C1 (ru) | Способ и устройство ослабления шума в речевом сигнале | |
KR950011964B1 (ko) | 신호처리장치 | |
JP3454190B2 (ja) | 雑音抑圧装置および方法 | |
KR100739905B1 (ko) | 소스 음성 신호에서 잡음을 억제하는 방법 및 잡음 억제기 | |
JP4187795B2 (ja) | 音声信号障害を低減するための方法 | |
US6023674A (en) | Non-parametric voice activity detection | |
US5708754A (en) | Method for real-time reduction of voice telecommunications noise not measurable at its source | |
RU2127454C1 (ru) | Способ понижения шума и устройство для его осуществления | |
RU2420813C2 (ru) | Повышение качества речи с использованием множества датчиков с помощью модели состояний речи | |
US20050288923A1 (en) | Speech enhancement by noise masking | |
JP2002149200A (ja) | 音声処理装置及び音声処理方法 | |
JP2006215568A (ja) | 音声向上装置、音声向上方法及び音声向上プログラムを記録したコンピュータで読み取り可能な媒体 | |
JP2009031793A (ja) | 調整されたトーンノイズの低減を用いたノイズの低減 | |
JP3264831B2 (ja) | 背景雑音消去装置 | |
JP3269969B2 (ja) | 背景雑音消去装置 | |
JP2000047697A (ja) | ノイズキャンセラ | |
JP2000330597A (ja) | 雑音抑圧装置 | |
JP2002221988A (ja) | 音声信号の雑音抑圧方法と装置及び音声認識装置 | |
JPH10171497A (ja) | 背景雑音除去装置 | |
JPH08160994A (ja) | 雑音抑圧装置 | |
JPH06208395A (ja) | ホルマント検出装置及び音声加工装置 | |
JP4123835B2 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP2006126859A (ja) | 音声処理装置及び音声処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080412 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090412 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100412 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100412 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110412 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110412 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130412 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140412 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |