JPS59115625A - 音声検出器 - Google Patents
音声検出器Info
- Publication number
- JPS59115625A JPS59115625A JP57223893A JP22389382A JPS59115625A JP S59115625 A JPS59115625 A JP S59115625A JP 57223893 A JP57223893 A JP 57223893A JP 22389382 A JP22389382 A JP 22389382A JP S59115625 A JPS59115625 A JP S59115625A
- Authority
- JP
- Japan
- Prior art keywords
- power
- voice
- circuit
- spectral information
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 claims abstract description 24
- 230000005236 sound signal Effects 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 abstract description 12
- 206010019133 Hangover Diseases 0.000 abstract description 3
- 206010002953 Aphonia Diseases 0.000 abstract 2
- 230000005540 biological transmission Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Transmitters (AREA)
- Time-Division Multiplex Systems (AREA)
- Radio Relay Systems (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
声検出器に関し,特に、音声信号の有無を検出する事に
よって音声入力時のみ信号伝送を行い,高能率々音声伝
送を可能とする音声伝送装置に用いられる音声検出器に
関するものである。
よって音声入力時のみ信号伝送を行い,高能率々音声伝
送を可能とする音声伝送装置に用いられる音声検出器に
関するものである。
伝送路において音声を伝送する場合,高能率な伝送手段
として,入力音声の有無を検出し,無人力時には音声伝
送を停止して他のテ゛一夕等の伝送を行う方法が考られ
ている。実回線における通常の会話では,片方向の回線
利用率は40%程度と言われており,音声検出機能を有
する事は,伝送路の利用率を上げるために非常に有効な
手段であるO 従来の音声伝送装置における音声検出器は,主に入力信
号の電力により音声検出を行っているため,話者の周囲
に定常的な雑音源等が存在する場合,常に有音として検
出され回線の利用効率が悪化し,また検出の閾値を上げ
ると話頭切断が生じるという欠点があった。また、雑音
源のレベルに追従して閾値を適応的に変化させる工夫も
ある程度の効果を上げているが、雑音源のレベルが音声
のレベルと同等あるいは、それ以上の場合には。
として,入力音声の有無を検出し,無人力時には音声伝
送を停止して他のテ゛一夕等の伝送を行う方法が考られ
ている。実回線における通常の会話では,片方向の回線
利用率は40%程度と言われており,音声検出機能を有
する事は,伝送路の利用率を上げるために非常に有効な
手段であるO 従来の音声伝送装置における音声検出器は,主に入力信
号の電力により音声検出を行っているため,話者の周囲
に定常的な雑音源等が存在する場合,常に有音として検
出され回線の利用効率が悪化し,また検出の閾値を上げ
ると話頭切断が生じるという欠点があった。また、雑音
源のレベルに追従して閾値を適応的に変化させる工夫も
ある程度の効果を上げているが、雑音源のレベルが音声
のレベルと同等あるいは、それ以上の場合には。
話頭切断あるいは常時検出という欠点を避けることは不
可能である。
可能である。
本発明の目的は2話頭切断が生じない、誤検出の少ない
音声検出器を提供することにある。
音声検出器を提供することにある。
本発明の別の目的は、前述のような信号対雑音比が0デ
シベル以下の場合においても音声検出を行うことが可能
な音声検出器を提供することにある。
シベル以下の場合においても音声検出を行うことが可能
な音声検出器を提供することにある。
本発明によれば、入力信号から音声信号を検出する音声
検出器において、前記入力信号の電力を検出する第1の
電力検出回路と、該第1の電力検出回路によって検出さ
れた電力と予め定められた第1の電力閾値とを比較する
第1の比較器と、前記入力信号のスペクトル情報の時間
的な変化分についての電力を検出する第2の電力検出回
路と。
検出器において、前記入力信号の電力を検出する第1の
電力検出回路と、該第1の電力検出回路によって検出さ
れた電力と予め定められた第1の電力閾値とを比較する
第1の比較器と、前記入力信号のスペクトル情報の時間
的な変化分についての電力を検出する第2の電力検出回
路と。
該第2の電力・演出回路によって検出された電力と予め
定められた第2の電力閾値とを比較する第2の比較器と
、前記第1及び第2の比較器の出力信号を受けるオア回
路とを有し、該オア回路の出力端に〆音声検出信号が得
られることを特徴とする音声検出器が得られる。
定められた第2の電力閾値とを比較する第2の比較器と
、前記第1及び第2の比較器の出力信号を受けるオア回
路とを有し、該オア回路の出力端に〆音声検出信号が得
られることを特徴とする音声検出器が得られる。
本発明の特徴は、入力信号の電力により音声検出を行う
回路に、上記入力信号より抽出されるスペクトル情報の
時間的な変化分についての電力(即ち、差分電力)によ
り、有音/無音判別制御を行う回路を付加した点にある
。従来の音声検出器が一次元の電力を使用しているのに
対し2本発明では多次元の情報を用いる。多次元の情報
の変化を検出する方法として固定の多次元閾値を設ける
ことも考えられるが2元来、雑音のスペクトルをあらか
じめ知ることは不可能であるから、このスペクトルの時
間的な変化分を求め、その大きさを固定値と比較する方
法が単純にして有効である。
回路に、上記入力信号より抽出されるスペクトル情報の
時間的な変化分についての電力(即ち、差分電力)によ
り、有音/無音判別制御を行う回路を付加した点にある
。従来の音声検出器が一次元の電力を使用しているのに
対し2本発明では多次元の情報を用いる。多次元の情報
の変化を検出する方法として固定の多次元閾値を設ける
ことも考えられるが2元来、雑音のスペクトルをあらか
じめ知ることは不可能であるから、このスペクトルの時
間的な変化分を求め、その大きさを固定値と比較する方
法が単純にして有効である。
本発明は、上述の如く、音声伝送装置における音声検出
機能を入力信号の電力およびス被りトル情報の性質によ
シ行うものである。たとえば2話者の周囲に電動機等の
ような定常的雑音源がある場合や、電源ハムが直接入力
側に混入し7ている場合、それらのスにクトル情報は時
間的に定常的な性質を示す事が知られている。一方、音
声の話頭管−:信号の過渡部であ見一般的にスペクトル
情報は、非定常的な性質を持ち、特に摩擦子音等の場合
には顕著である。したがって、このスペクトル情報の時
間的な変化分についての電力(即ち。
機能を入力信号の電力およびス被りトル情報の性質によ
シ行うものである。たとえば2話者の周囲に電動機等の
ような定常的雑音源がある場合や、電源ハムが直接入力
側に混入し7ている場合、それらのスにクトル情報は時
間的に定常的な性質を示す事が知られている。一方、音
声の話頭管−:信号の過渡部であ見一般的にスペクトル
情報は、非定常的な性質を持ち、特に摩擦子音等の場合
には顕著である。したがって、このスペクトル情報の時
間的な変化分についての電力(即ち。
差分電力)を利用すると、定常的な雑音中の話頭の検出
が可能となる。
が可能となる。
次に図面を用いて本発明の詳細な説明する。
第1図を参照して、(A)は定常的雑音が混入した音声
信号の電圧Vを示し、(B)は(A)で示される信号の
電力Po、(C)は(A)で示される信号のスペクトル
情報の差分ΔRの電力(ΔR)2である。また、第1図
において、Sは話頭の始まシ時点を示す。
信号の電圧Vを示し、(B)は(A)で示される信号の
電力Po、(C)は(A)で示される信号のスペクトル
情報の差分ΔRの電力(ΔR)2である。また、第1図
において、Sは話頭の始まシ時点を示す。
(A)のような信号が入力された場合、(B)で示され
るように信号の電力のみでは話頭の検出は非常に困難で
ある。しかしながら、(C)で示されるスペクトル情報
の差分電力を用いると話頭が顕著に識別され、るため、
(B)の信号電力に(C)の差分電力および適当なハン
グオーバ(hangover )時間を併用することに
より2話頭検出特性のよい音声検出器が実現できる。
るように信号の電力のみでは話頭の検出は非常に困難で
ある。しかしながら、(C)で示されるスペクトル情報
の差分電力を用いると話頭が顕著に識別され、るため、
(B)の信号電力に(C)の差分電力および適当なハン
グオーバ(hangover )時間を併用することに
より2話頭検出特性のよい音声検出器が実現できる。
第2図は本発明の一実施例を示すプロ、り図である。音
声入力端子1より入力された信号は、第1の電力検出回
路2およびスペクトル情報抽出回路3に入力される。前
記スペクトル情報抽出回路3の出力は、一方は直接、差
分器4へまた他方は遅延回路5を経由し、前記差分器4
へ入力される。
声入力端子1より入力された信号は、第1の電力検出回
路2およびスペクトル情報抽出回路3に入力される。前
記スペクトル情報抽出回路3の出力は、一方は直接、差
分器4へまた他方は遅延回路5を経由し、前記差分器4
へ入力される。
スペクトル情報の差分である前記差分器4の出力は、二
乗器6によシミ力に変換された後、予め定められた差分
電力閾値TH2と比較する比較器7−・入力される。ま
だ前記電力検出回路2の出力も予め定めらnた電力閾値
TH1と比較する比較器8へ入力され、この比較器8の
出力は前記比較器7の出力と共にオア回路9に入力され
る。前記オア回路9の出力である有音/無音情報は、ハ
ングオー1 パ回路10を経由した後、音声検出出力端子身より出力
される。ハングオーバ回路10は有音状態を一定時間保
持する回路であって、音声信号中のポーズを除くだめの
ものである。
乗器6によシミ力に変換された後、予め定められた差分
電力閾値TH2と比較する比較器7−・入力される。ま
だ前記電力検出回路2の出力も予め定めらnた電力閾値
TH1と比較する比較器8へ入力され、この比較器8の
出力は前記比較器7の出力と共にオア回路9に入力され
る。前記オア回路9の出力である有音/無音情報は、ハ
ングオー1 パ回路10を経由した後、音声検出出力端子身より出力
される。ハングオーバ回路10は有音状態を一定時間保
持する回路であって、音声信号中のポーズを除くだめの
ものである。
なお、第2図のブロック3,4.5及び6を含む部分が
、入力信号のスペクトル情報の時間的な変化分について
の電力を検出する第2の電力検出回路を’IN成してい
る。
、入力信号のスペクトル情報の時間的な変化分について
の電力を検出する第2の電力検出回路を’IN成してい
る。
以上説明したように2本発明によれば、従来の入力信号
の電力により有音/無音を検出する音声検出器に、前記
入力信号のスペクトル情報の時間的な変化分についての
電力(即ち差分電力)による判定機能を付は加えること
によシ2話頭切断が生じない、誤検出の少ない音声検出
器を得ることができる。
の電力により有音/無音を検出する音声検出器に、前記
入力信号のスペクトル情報の時間的な変化分についての
電力(即ち差分電力)による判定機能を付は加えること
によシ2話頭切断が生じない、誤検出の少ない音声検出
器を得ることができる。
第1図(A)は、定常雑音中の音声信号を示し、第1図
(B)は第1図(A)で示される音声信号の電力を示し
、第1図(C)は第1図(A)で示される音声信号のス
ペクトル情報の差分電力を示す図である。第2図は本発
明の一実施例のブロック図である。 ■・・・音声入力端子、2・・・第1の電力検出回路。 3・・スにクトル情報抽出回路、4・差分器、5・・・
遅延回路、6・・二乗器、7・・比較器、8・・・比較
器。 9・・オア回路、10・・ノ・ングオー・ぐ回路、11
・・・音声検出出力端子。
(B)は第1図(A)で示される音声信号の電力を示し
、第1図(C)は第1図(A)で示される音声信号のス
ペクトル情報の差分電力を示す図である。第2図は本発
明の一実施例のブロック図である。 ■・・・音声入力端子、2・・・第1の電力検出回路。 3・・スにクトル情報抽出回路、4・差分器、5・・・
遅延回路、6・・二乗器、7・・比較器、8・・・比較
器。 9・・オア回路、10・・ノ・ングオー・ぐ回路、11
・・・音声検出出力端子。
Claims (1)
- 【特許請求の範囲】 1 人力信号から音声信号を検出する音声検出器におい
て、前記入力信号の電力を検出する第1の電力検出回路
と、該第1の電力検出回路によって検出された電力と予
め定められた第1の電力閾1直とを比較する第1の比較
器と、前記入力信号のス梗りトル情報の時間的な変化分
についての電力を検出する第2の電力検出回路と、該第
2の電力検出回路によって検出された電力と予め定めら
れた第2の電力閾値とを比較する第2の比較器と。 前記第1及び第2の比較器の出力信号を受けるオア回路
とを有し、該オア回路の出力端に回音声検出信号が得ら
れることを特徴とする音声検出器。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57223893A JPS59115625A (ja) | 1982-12-22 | 1982-12-22 | 音声検出器 |
CA000443914A CA1197014A (en) | 1982-12-22 | 1983-12-21 | Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal |
US06/564,651 US4688256A (en) | 1982-12-22 | 1983-12-22 | Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57223893A JPS59115625A (ja) | 1982-12-22 | 1982-12-22 | 音声検出器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59115625A true JPS59115625A (ja) | 1984-07-04 |
JPS6245730B2 JPS6245730B2 (ja) | 1987-09-29 |
Family
ID=16805354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57223893A Granted JPS59115625A (ja) | 1982-12-22 | 1982-12-22 | 音声検出器 |
Country Status (3)
Country | Link |
---|---|
US (1) | US4688256A (ja) |
JP (1) | JPS59115625A (ja) |
CA (1) | CA1197014A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01307800A (ja) * | 1988-06-06 | 1989-12-12 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出方法 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4920568A (en) * | 1985-07-16 | 1990-04-24 | Sharp Kabushiki Kaisha | Method of distinguishing voice from noise |
DE3739681A1 (de) * | 1987-11-24 | 1989-06-08 | Philips Patentverwaltung | Verfahren zum bestimmen von anfangs- und endpunkt isoliert gesprochener woerter in einem sprachsignal und anordnung zur durchfuehrung des verfahrens |
CA1335003C (en) * | 1988-03-11 | 1995-03-28 | Daniel Kenneth Freeman | Voice activity detection |
US4965854A (en) * | 1988-11-30 | 1990-10-23 | General Electric Company | Noise blanker with continuous wave interference compensation |
JP2573352B2 (ja) * | 1989-04-10 | 1997-01-22 | 富士通株式会社 | 音声検出装置 |
US4979214A (en) * | 1989-05-15 | 1990-12-18 | Dialogic Corporation | Method and apparatus for identifying speech in telephone signals |
US5097510A (en) * | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
IN184794B (ja) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
US5819217A (en) * | 1995-12-21 | 1998-10-06 | Nynex Science & Technology, Inc. | Method and system for differentiating between speech and noise |
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
US5864793A (en) * | 1996-08-06 | 1999-01-26 | Cirrus Logic, Inc. | Persistence and dynamic threshold based intermittent signal detector |
DE69904453T2 (de) * | 1998-03-13 | 2003-09-25 | Frank Uldall Leonhard | Signalverarbeitungsverfahren zur analyse von sprachsignal-transienten |
AU1049601A (en) * | 1999-10-25 | 2001-05-08 | Lernout And Hauspie Speech Products N.V. | Small vocabulary speaker dependent speech recognition |
EP2107553B1 (en) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Method for determining barge-in |
EP2148325B1 (en) * | 2008-07-22 | 2014-10-01 | Nuance Communications, Inc. | Method for determining the presence of a wanted signal component |
WO2013187932A1 (en) | 2012-06-10 | 2013-12-19 | Nuance Communications, Inc. | Noise dependent signal processing for in-car communication systems with multiple acoustic zones |
DE112012006876B4 (de) | 2012-09-04 | 2021-06-10 | Cerence Operating Company | Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung |
WO2014070139A2 (en) | 2012-10-30 | 2014-05-08 | Nuance Communications, Inc. | Speech enhancement |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2380612A1 (fr) * | 1977-02-09 | 1978-09-08 | Thomson Csf | Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif |
JPS56104399A (en) * | 1980-01-23 | 1981-08-20 | Hitachi Ltd | Voice interval detection system |
-
1982
- 1982-12-22 JP JP57223893A patent/JPS59115625A/ja active Granted
-
1983
- 1983-12-21 CA CA000443914A patent/CA1197014A/en not_active Expired
- 1983-12-22 US US06/564,651 patent/US4688256A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01307800A (ja) * | 1988-06-06 | 1989-12-12 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出方法 |
Also Published As
Publication number | Publication date |
---|---|
JPS6245730B2 (ja) | 1987-09-29 |
US4688256A (en) | 1987-08-18 |
CA1197014A (en) | 1985-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS59115625A (ja) | 音声検出器 | |
US9734841B2 (en) | Device and method for suppressing noise signal, device and method for detecting special signal, and device and method for detecting notification sound | |
JPH06332492A (ja) | 音声検出方法および検出装置 | |
EP1585947A2 (en) | Sound detection and localization system | |
JPH0431898A (ja) | 音声雑音分離装置 | |
JP5863928B1 (ja) | 音声調整装置 | |
JPH02210497A (ja) | 音声合成装置 | |
US20110125497A1 (en) | Method and System for Voice Activity Detection | |
Kasuya et al. | Characteristics pf pitch period and amplitude perturbations in pathologic voice | |
JP2564821B2 (ja) | 音声判定検出装置 | |
JP2992324B2 (ja) | 音声区間検出方法 | |
JPS5912185B2 (ja) | 有声無声判定装置 | |
JPH03114100A (ja) | 音声区間検出装置 | |
JP3284968B2 (ja) | 話速変換機能を有する補聴器 | |
CN111755028A (zh) | 一种基于基音特征的近场遥控器语音端点检测方法及*** | |
US11758337B2 (en) | Audio processing apparatus | |
JP3033537B2 (ja) | 音声検出器 | |
KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
JP2737109B2 (ja) | 音声区間検出方式 | |
JP2557497B2 (ja) | 男女声の識別方法 | |
JPH10177397A (ja) | 音声検出方法 | |
KR20040082756A (ko) | 비음성 제거에 의한 음성 추출 방법 | |
JPH06175676A (ja) | 音声検出器 | |
JP2891259B2 (ja) | 音声区間検出装置 | |
JP2712692B2 (ja) | 信号制御装置 |