JP2009251134A - 音声/非音声を判定する装置、方法およびプログラム - Google Patents
音声/非音声を判定する装置、方法およびプログラム Download PDFInfo
- Publication number
- JP2009251134A JP2009251134A JP2008096715A JP2008096715A JP2009251134A JP 2009251134 A JP2009251134 A JP 2009251134A JP 2008096715 A JP2008096715 A JP 2008096715A JP 2008096715 A JP2008096715 A JP 2008096715A JP 2009251134 A JP2009251134 A JP 2009251134A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- acoustic signal
- spectrum
- speech
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 30
- 238000001228 spectrum Methods 0.000 claims abstract description 96
- 239000013598 vector Substances 0.000 claims abstract description 75
- 230000003595 spectral effect Effects 0.000 claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims description 40
- 238000009826 distribution Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 14
- 238000012706 support-vector machine Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000009828 non-uniform distribution Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】フレームごとに音響信号を周波数分析してスペクトルを算出するスペクトル算出部103と、雑音スペクトルを推定する雑音推定部104と、雑音信号のエネルギーに対する音響信号のエネルギーの相対的な大きさを表すエネルギー特徴量を算出するSNR算出部105と、正規化スペクトルエントロピーを算出するエントロピー算出部106と、複数フレームに対して算出されたエネルギー特徴量および正規化スペクトルエントロピーに基づいて特徴ベクトルを作成する特徴ベクトル作成部107と、所定の識別モデルに基づいて特徴ベクトルに対応するフレームの音声尤度を算出する尤度算出部109と、音声尤度が閾値より大きい場合にフレームが音声フレームであると判定する判定部110とを備えた。
【選択図】 図1
Description
第1の実施の形態にかかる音声判定装置は、非特許文献1で提案されている正規化スペクトルエントロピーに対して、入力信号と背景雑音の雑音信号(以下、単に背景雑音という)との相対的な大きさを表すエネルギー特徴量を組み合わせた特徴量を、音声/非音声の判別に利用する。さらに、第1の実施の形態にかかる音声判定装置は、スペクトルの時間変化情報を利用するために、複数フレームから抽出した特徴量を利用する。
第2の実施の形態にかかる音声判定装置は、スペクトルの動的特徴量であるデルタ特徴量を算出し、デルタ特徴量を含む特徴ベクトルを作成して音声/非音声判別に利用する。
52 ROM
53 RAM
54 通信I/F
61 バス
100 音声判定装置
101 音響信号取得部
102 フレーム分割部
103 スペクトル算出部
104 雑音推定部
105 SNR算出部
106 エントロピー算出部
107 特徴ベクトル作成部
108 線形変換部
109 尤度算出部
110 判定部
300 音声判定装置
307 特徴ベクトル作成部
309 尤度算出部
310 判定部
Claims (10)
- 雑音信号を含む音響信号を取得する取得部と、
取得された前記音響信号を予め定められた時間間隔を表すフレーム単位に分割する分割部と、
フレームごとに前記音響信号を周波数分析して前記音響信号のスペクトルを算出するスペクトル算出部と、
算出された前記スペクトルに基づいて前記雑音信号のスペクトルを表す雑音スペクトルを推定する推定部と、
前記雑音信号のエネルギーに対する前記音響信号のエネルギーの相対的な大きさを表すエネルギー特徴量をフレームごとに算出するエネルギー算出部と、
前記音響信号のスペクトルについての分布の特徴を表すスペクトルエントロピーを、推定された前記雑音スペクトルによって正規化した正規化スペクトルエントロピーを算出するエントロピー算出部と、
フレームに予め定められた個数の前後のフレームを加えた複数のフレームのそれぞれに対して算出された前記エネルギー特徴量と、前記複数のフレームのそれぞれに対して算出された前記正規化スペクトルエントロピーとに基づいて、前記音響信号の特徴を表す特徴ベクトルをフレームごとに作成する作成部と、
音声を含む音響信号のフレームである音声フレームに対応する前記特徴ベクトルを予め学習した識別モデルと、作成された前記特徴ベクトルとに基づいて、前記音響信号のフレームが前記音声フレームであることの確からしさを表す音声尤度を算出する尤度算出部と、
前記音声尤度と予め定められた第1閾値とを比較し、前記音声尤度が前記第1閾値より大きい場合に、前記音響信号のフレームが前記音声フレームであると判定する判定部と、
を備えたことを特徴とする音声判定装置。 - 前記エネルギー算出部は、推定された前記雑音スペクトルに対する前記スペクトルの相対的な大きさを表す前記エネルギー特徴量をフレームごとに算出すること、
を特徴とする請求項1に記載の音声判定装置。 - 前記作成部は、前記複数のフレームのそれぞれに対して算出された前記エネルギー特徴量と、前記複数のフレームのそれぞれに対して算出された前記正規化スペクトルエントロピーとを要素として含む前記特徴ベクトルをフレームごとに作成すること、
を特徴とする請求項1に記載の音声判定装置。 - 前記作成部は、フレームの前記エネルギー特徴量と、フレームの前記正規化スペクトルエントロピーと、前記複数のフレームでの前記エネルギー特徴量の変化の特徴を表す動的特徴量と、前記複数のフレームでの前記正規化スペクトルエントロピーの変化の特徴を表す動的特徴量と、を要素として含む前記特徴ベクトルをフレームごとに作成すること、
を特徴とする請求項1に記載の音声判定装置。 - 前記推定部は、算出された前記エネルギー特徴量と予め定められた第2閾値とを比較し、算出された前記エネルギー特徴量が前記第2閾値より小さい場合に、算出された前記スペクトルと推定された前記雑音スペクトルとを予め定められた重み付け係数で重み付け加算した値を、前記エネルギー特徴量を算出した前記フレームの次のフレームの雑音スペクトルとして推定すること、
を特徴とする請求項1に記載の音声判定装置。 - 作成された前記特徴ベクトルを予め定められた変換行列によって変換する変換部をさらに備え、
前記尤度算出部は、前記識別モデルと変換された前記特徴ベクトルとに基づいて、前記音響信号のフレームの前記音声尤度を算出すること、
を特徴とする請求項1に記載の音声判定装置。 - 前記変換部は、前記特徴ベクトルより低次元のベクトルに変換する前記変換行列によって、作成された前記特徴ベクトルを変換すること、
を特徴とする請求項6に記載の音声判定装置。 - 前記変換部は、前記特徴ベクトルと同次元のベクトルに変換する前記変換行列によって、作成された前記特徴ベクトルを変換すること、
を特徴とする請求項6に記載の音声判定装置。 - 取得部が、雑音信号を含む音響信号を取得する取得ステップと、
分割部が、取得された前記音響信号を予め定められた時間間隔を表すフレーム単位に分割する分割ステップと、
スペクトル算出部が、フレームごとに前記音響信号を周波数分析して前記音響信号のスペクトルを算出するスペクトル算出ステップと、
推定部が、算出された前記スペクトルに基づいて前記雑音信号のスペクトルを表す雑音スペクトルを推定する推定ステップと、
エネルギー算出部が、前記雑音信号のエネルギーに対する前記音響信号のエネルギーの相対的な大きさを表すエネルギー特徴量をフレームごとに算出するエネルギー算出ステップと、
エントロピー算出部が、前記音響信号のスペクトルについての分布の特徴を表すスペクトルエントロピーを、推定された前記雑音スペクトルによって正規化した正規化スペクトルエントロピーを算出するエントロピー算出ステップと、
作成部が、フレームに予め定められた個数の前後のフレームを加えた複数のフレームのそれぞれに対して算出された前記エネルギー特徴量と、前記複数のフレームのそれぞれに対して算出された前記正規化スペクトルエントロピーとに基づいて、前記音響信号の特徴を表す特徴ベクトルをフレームごとに作成する作成ステップと、
尤度算出部が、音声を含む音響信号のフレームである音声フレームに対応する前記特徴ベクトルを予め学習した識別モデルと、作成された前記特徴ベクトルとに基づいて、前記音響信号のフレームが前記音声フレームであることの確からしさを表す音声尤度を算出する尤度算出ステップと、
判定部が、前記音声尤度と予め定められた第1閾値とを比較し、前記音声尤度が前記第1閾値より大きい場合に、前記音響信号のフレームが前記音声フレームであると判定する判定ステップと、
を備えたことを特徴とする音声判定方法。 - コンピュータを、
雑音信号を含む音響信号を取得する取得部と、
取得された前記音響信号を予め定められた時間間隔を表すフレーム単位に分割する分割部と、
フレームごとに前記音響信号を周波数分析して前記音響信号のスペクトルを算出するスペクトル算出部と、
算出された前記スペクトルに基づいて前記雑音信号のスペクトルを表す雑音スペクトルを推定する推定部と、
前記雑音信号のエネルギーに対する前記音響信号のエネルギーの相対的な大きさを表すエネルギー特徴量をフレームごとに算出するエネルギー算出部と、
前記音響信号のスペクトルについての分布の特徴を表すスペクトルエントロピーを、推定された前記雑音スペクトルによって正規化した正規化スペクトルエントロピーを算出するエントロピー算出部と、
フレームに予め定められた個数の前後のフレームを加えた複数のフレームのそれぞれに対して算出された前記エネルギー特徴量と、前記複数のフレームのそれぞれに対して算出された前記正規化スペクトルエントロピーとに基づいて、前記音響信号の特徴を表す特徴ベクトルをフレームごとに作成する作成部と、
音声を含む音響信号のフレームである音声フレームに対応する前記特徴ベクトルを予め学習した識別モデルと、作成された前記特徴ベクトルとに基づいて、前記音響信号のフレームが前記音声フレームであることの確からしさを表す音声尤度を算出する尤度算出部と、
前記音声尤度と予め定められた第1閾値とを比較し、前記音声尤度が前記第1閾値より大きい場合に、前記音響信号のフレームが前記音声フレームであると判定する判定部と、
として機能させる音声判定プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008096715A JP4950930B2 (ja) | 2008-04-03 | 2008-04-03 | 音声/非音声を判定する装置、方法およびプログラム |
US12/234,976 US8380500B2 (en) | 2008-04-03 | 2008-09-22 | Apparatus, method, and computer program product for judging speech/non-speech |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008096715A JP4950930B2 (ja) | 2008-04-03 | 2008-04-03 | 音声/非音声を判定する装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009251134A true JP2009251134A (ja) | 2009-10-29 |
JP4950930B2 JP4950930B2 (ja) | 2012-06-13 |
Family
ID=41134053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008096715A Expired - Fee Related JP4950930B2 (ja) | 2008-04-03 | 2008-04-03 | 音声/非音声を判定する装置、方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8380500B2 (ja) |
JP (1) | JP4950930B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012215600A (ja) * | 2011-03-31 | 2012-11-08 | Oki Electric Ind Co Ltd | 音声区間判定装置、音声区間判定方法、及びプログラム |
JP2013117639A (ja) * | 2011-12-02 | 2013-06-13 | Fujitsu Ltd | 音声処理装置、音声処理方法及び音声処理プログラム |
JP2013201722A (ja) * | 2012-03-26 | 2013-10-03 | Tokyo Univ Of Science | 多チャネル信号処理装置、方法、及びプログラム |
WO2013179464A1 (ja) * | 2012-05-31 | 2013-12-05 | トヨタ自動車株式会社 | 音源検出装置、ノイズモデル生成装置、ノイズ抑圧装置、音源方位推定装置、接近車両検出装置及びノイズ抑圧方法 |
JP2014507894A (ja) * | 2011-09-10 | 2014-03-27 | 歌尓声学股▲ふん▼有限公司 | ノイズキャンセリングシステム及び方法、知能制御方法及び装置、並びに通信機器 |
JP2014092705A (ja) * | 2012-11-05 | 2014-05-19 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号強調装置、音響信号強調方法、およびプログラム |
JP2014112190A (ja) * | 2012-11-05 | 2014-06-19 | Nippon Telegr & Teleph Corp <Ntt> | 信号区間分類装置、信号区間分類方法、およびプログラム |
US9153243B2 (en) | 2011-01-27 | 2015-10-06 | Nikon Corporation | Imaging device, program, memory medium, and noise reduction method |
WO2020218597A1 (ja) * | 2019-04-26 | 2020-10-29 | 株式会社Preferred Networks | 区間検出装置、信号処理システム、モデル生成方法、区間検出方法およびプログラム |
KR102438701B1 (ko) * | 2021-04-12 | 2022-09-01 | 한국표준과학연구원 | 마이크로폰 어레이를 이용한 음성신호 제거방법 및 제거장치 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8738367B2 (en) * | 2009-03-18 | 2014-05-27 | Nec Corporation | Speech signal processing device |
WO2010146711A1 (ja) * | 2009-06-19 | 2010-12-23 | 富士通株式会社 | 音声信号処理装置及び音声信号処理方法 |
ES2371619B1 (es) * | 2009-10-08 | 2012-08-08 | Telefónica, S.A. | Procedimiento de detección de segmentos de voz. |
JP5156043B2 (ja) * | 2010-03-26 | 2013-03-06 | 株式会社東芝 | 音声判別装置 |
US20120300100A1 (en) * | 2011-05-27 | 2012-11-29 | Nikon Corporation | Noise reduction processing apparatus, imaging apparatus, and noise reduction processing program |
CN103635962B (zh) * | 2011-08-19 | 2015-09-23 | 旭化成株式会社 | 声音识别***、识别字典登记***以及声学模型标识符序列生成装置 |
KR20140031790A (ko) * | 2012-09-05 | 2014-03-13 | 삼성전자주식회사 | 잡음 환경에서 강인한 음성 구간 검출 방법 및 장치 |
CN105225668B (zh) | 2013-05-30 | 2017-05-10 | 华为技术有限公司 | 信号编码方法及设备 |
US9224402B2 (en) * | 2013-09-30 | 2015-12-29 | International Business Machines Corporation | Wideband speech parameterization for high quality synthesis, transformation and quantization |
WO2015059947A1 (ja) * | 2013-10-22 | 2015-04-30 | 日本電気株式会社 | 音声検出装置、音声検出方法及びプログラム |
GB2554943A (en) * | 2016-10-16 | 2018-04-18 | Sentimoto Ltd | Voice activity detection method and apparatus |
CN107731223B (zh) * | 2017-11-22 | 2022-07-26 | 腾讯科技(深圳)有限公司 | 语音活性检测方法、相关装置和设备 |
CN108198547B (zh) * | 2018-01-18 | 2020-10-23 | 深圳市北科瑞声科技股份有限公司 | 语音端点检测方法、装置、计算机设备和存储介质 |
CN108364637B (zh) * | 2018-02-01 | 2021-07-13 | 福州大学 | 一种音频句子边界检测方法 |
CN110600060B (zh) * | 2019-09-27 | 2021-10-22 | 云知声智能科技股份有限公司 | 一种硬件音频主动探测hvad*** |
CN110706693B (zh) * | 2019-10-18 | 2022-04-19 | 浙江大华技术股份有限公司 | 语音端点的确定方法及装置、存储介质、电子装置 |
US11270720B2 (en) | 2019-12-30 | 2022-03-08 | Texas Instruments Incorporated | Background noise estimation and voice activity detection system |
CN112102818B (zh) * | 2020-11-19 | 2021-01-26 | 成都启英泰伦科技有限公司 | 结合语音活性检测和滑动窗噪声估计的信噪比计算方法 |
CN112612008B (zh) * | 2020-12-08 | 2022-05-17 | 中国人民解放军陆军工程大学 | 高速弹丸回波信号的起始参数提取方法及装置 |
CN112634934B (zh) * | 2020-12-21 | 2024-06-25 | 北京声智科技有限公司 | 语音检测方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04223497A (ja) * | 1990-12-25 | 1992-08-13 | Oki Electric Ind Co Ltd | 有音区間の検出方法 |
JPH05173594A (ja) * | 1991-12-25 | 1993-07-13 | Oki Electric Ind Co Ltd | 有声音区間検出方法 |
JP2001331190A (ja) * | 2000-05-22 | 2001-11-30 | Matsushita Electric Ind Co Ltd | 音声認識システムにおけるハイブリッド端点検出方法 |
JP2006113298A (ja) * | 2004-10-14 | 2006-04-27 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1116300A (en) | 1977-12-28 | 1982-01-12 | Hiroaki Sakoe | Speech recognition system |
US4531228A (en) | 1981-10-20 | 1985-07-23 | Nissan Motor Company, Limited | Speech recognition system for an automotive vehicle |
JPS61156100A (ja) | 1984-12-27 | 1986-07-15 | 日本電気株式会社 | 音声認識装置 |
JPS62211699A (ja) | 1986-03-13 | 1987-09-17 | 株式会社東芝 | 音声区間検出回路 |
JPH0740200B2 (ja) | 1986-04-08 | 1995-05-01 | 沖電気工業株式会社 | 音声区間検出方法 |
US4829578A (en) | 1986-10-02 | 1989-05-09 | Dragon Systems, Inc. | Speech detection and recognition apparatus for use with background noise of varying levels |
JP2536633B2 (ja) | 1989-09-19 | 1996-09-18 | 日本電気株式会社 | 複合語抽出装置 |
CA2040025A1 (en) | 1990-04-09 | 1991-10-10 | Hideki Satoh | Speech detection apparatus with influence of input level and noise reduced |
JP3034279B2 (ja) | 1990-06-27 | 2000-04-17 | 株式会社東芝 | 有音検出装置および有音検出方法 |
JPH0416999A (ja) | 1990-05-11 | 1992-01-21 | Seiko Epson Corp | 音声認識装置 |
US5201028A (en) | 1990-09-21 | 1993-04-06 | Theis Peter F | System for distinguishing or counting spoken itemized expressions |
US5459814A (en) | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
JPH06332492A (ja) | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
JP2690027B2 (ja) | 1994-10-05 | 1997-12-10 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | パターン認識方法及び装置 |
JP3716870B2 (ja) | 1995-05-31 | 2005-11-16 | ソニー株式会社 | 音声認識装置および音声認識方法 |
JP3537949B2 (ja) | 1996-03-06 | 2004-06-14 | 株式会社東芝 | パターン認識装置及び同装置における辞書修正方法 |
JP3105465B2 (ja) | 1997-03-14 | 2000-10-30 | 日本電信電話株式会社 | 音声区間検出方法 |
US6600874B1 (en) | 1997-03-19 | 2003-07-29 | Hitachi, Ltd. | Method and device for detecting starting and ending points of sound segment in video |
US20020138254A1 (en) | 1997-07-18 | 2002-09-26 | Takehiko Isaka | Method and apparatus for processing speech signals |
JP3677143B2 (ja) | 1997-07-31 | 2005-07-27 | 株式会社東芝 | 音声処理方法および装置 |
US6757652B1 (en) | 1998-03-03 | 2004-06-29 | Koninklijke Philips Electronics N.V. | Multiple stage speech recognizer |
US6343267B1 (en) | 1998-04-30 | 2002-01-29 | Matsushita Electric Industrial Co., Ltd. | Dimensionality reduction for speaker normalization and speaker and environment adaptation using eigenvoice techniques |
US6263309B1 (en) | 1998-04-30 | 2001-07-17 | Matsushita Electric Industrial Co., Ltd. | Maximum likelihood method for finding an adapted speaker model in eigenvoice space |
US6327565B1 (en) | 1998-04-30 | 2001-12-04 | Matsushita Electric Industrial Co., Ltd. | Speaker and environment adaptation based on eigenvoices |
US6317710B1 (en) | 1998-08-13 | 2001-11-13 | At&T Corp. | Multimedia search apparatus and method for searching multimedia content using speaker detection by audio data |
US6161087A (en) | 1998-10-05 | 2000-12-12 | Lernout & Hauspie Speech Products N.V. | Speech-recognition-assisted selective suppression of silent and filled speech pauses during playback of an audio recording |
US6529872B1 (en) | 2000-04-18 | 2003-03-04 | Matsushita Electric Industrial Co., Ltd. | Method for noise adaptation in automatic speech recognition using transformed matrices |
US7089182B2 (en) | 2000-04-18 | 2006-08-08 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for feature domain joint channel and additive noise compensation |
US7236929B2 (en) | 2001-05-09 | 2007-06-26 | Plantronics, Inc. | Echo suppression and speech detection techniques for telephony applications |
KR100429896B1 (ko) * | 2001-11-22 | 2004-05-03 | 한국전자통신연구원 | 잡음 환경에서의 음성신호 검출방법 및 그 장치 |
JP4292837B2 (ja) | 2002-07-16 | 2009-07-08 | 日本電気株式会社 | パターン特徴抽出方法及びその装置 |
US20040064314A1 (en) | 2002-09-27 | 2004-04-01 | Aubert Nicolas De Saint | Methods and apparatus for speech end-point detection |
US20040102965A1 (en) | 2002-11-21 | 2004-05-27 | Rapoport Ezra J. | Determining a pitch period |
JP4033299B2 (ja) * | 2003-03-12 | 2008-01-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム |
JP4497834B2 (ja) | 2003-04-28 | 2010-07-07 | パイオニア株式会社 | 音声認識装置及び音声認識方法並びに音声認識用プログラム及び情報記録媒体 |
WO2004111996A1 (ja) | 2003-06-11 | 2004-12-23 | Matsushita Electric Industrial Co., Ltd. | 音響区間検出方法および装置 |
JP4521673B2 (ja) | 2003-06-19 | 2010-08-11 | 株式会社国際電気通信基礎技術研究所 | 発話区間検出装置、コンピュータプログラム及びコンピュータ |
US20080004881A1 (en) | 2004-12-22 | 2008-01-03 | David Attwater | Turn-taking model |
JP4667082B2 (ja) | 2005-03-09 | 2011-04-06 | キヤノン株式会社 | 音声認識方法 |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US7680656B2 (en) * | 2005-06-28 | 2010-03-16 | Microsoft Corporation | Multi-sensory speech enhancement using a speech-state model |
JP2007114413A (ja) | 2005-10-19 | 2007-05-10 | Toshiba Corp | 音声非音声判別装置、音声区間検出装置、音声非音声判別方法、音声区間検出方法、音声非音声判別プログラムおよび音声区間検出プログラム |
JP4791857B2 (ja) | 2006-03-02 | 2011-10-12 | 日本放送協会 | 発話区間検出装置及び発話区間検出プログラム |
JP4282704B2 (ja) | 2006-09-27 | 2009-06-24 | 株式会社東芝 | 音声区間検出装置およびプログラム |
-
2008
- 2008-04-03 JP JP2008096715A patent/JP4950930B2/ja not_active Expired - Fee Related
- 2008-09-22 US US12/234,976 patent/US8380500B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04223497A (ja) * | 1990-12-25 | 1992-08-13 | Oki Electric Ind Co Ltd | 有音区間の検出方法 |
JPH05173594A (ja) * | 1991-12-25 | 1993-07-13 | Oki Electric Ind Co Ltd | 有声音区間検出方法 |
JP2001331190A (ja) * | 2000-05-22 | 2001-11-30 | Matsushita Electric Ind Co Ltd | 音声認識システムにおけるハイブリッド端点検出方法 |
JP2006113298A (ja) * | 2004-10-14 | 2006-04-27 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9153243B2 (en) | 2011-01-27 | 2015-10-06 | Nikon Corporation | Imaging device, program, memory medium, and noise reduction method |
JP2012215600A (ja) * | 2011-03-31 | 2012-11-08 | Oki Electric Ind Co Ltd | 音声区間判定装置、音声区間判定方法、及びプログラム |
JP2014507894A (ja) * | 2011-09-10 | 2014-03-27 | 歌尓声学股▲ふん▼有限公司 | ノイズキャンセリングシステム及び方法、知能制御方法及び装置、並びに通信機器 |
US9379751B2 (en) | 2011-09-10 | 2016-06-28 | Goertek Inc. | Noise canceling system and method, smart control method and device and communication equipment |
JP2013117639A (ja) * | 2011-12-02 | 2013-06-13 | Fujitsu Ltd | 音声処理装置、音声処理方法及び音声処理プログラム |
JP2013201722A (ja) * | 2012-03-26 | 2013-10-03 | Tokyo Univ Of Science | 多チャネル信号処理装置、方法、及びプログラム |
WO2013179464A1 (ja) * | 2012-05-31 | 2013-12-05 | トヨタ自動車株式会社 | 音源検出装置、ノイズモデル生成装置、ノイズ抑圧装置、音源方位推定装置、接近車両検出装置及びノイズ抑圧方法 |
JPWO2013179464A1 (ja) * | 2012-05-31 | 2016-01-14 | トヨタ自動車株式会社 | 音源検出装置、ノイズモデル生成装置、ノイズ抑圧装置、音源方位推定装置、接近車両検出装置及びノイズ抑圧方法 |
JP2014092705A (ja) * | 2012-11-05 | 2014-05-19 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号強調装置、音響信号強調方法、およびプログラム |
JP2014112190A (ja) * | 2012-11-05 | 2014-06-19 | Nippon Telegr & Teleph Corp <Ntt> | 信号区間分類装置、信号区間分類方法、およびプログラム |
WO2020218597A1 (ja) * | 2019-04-26 | 2020-10-29 | 株式会社Preferred Networks | 区間検出装置、信号処理システム、モデル生成方法、区間検出方法およびプログラム |
KR102438701B1 (ko) * | 2021-04-12 | 2022-09-01 | 한국표준과학연구원 | 마이크로폰 어레이를 이용한 음성신호 제거방법 및 제거장치 |
Also Published As
Publication number | Publication date |
---|---|
US8380500B2 (en) | 2013-02-19 |
JP4950930B2 (ja) | 2012-06-13 |
US20090254341A1 (en) | 2009-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4950930B2 (ja) | 音声/非音声を判定する装置、方法およびプログラム | |
US11395061B2 (en) | Signal processing apparatus and signal processing method | |
EP3479377B1 (en) | Speech recognition | |
CN106663446B (zh) | 知晓用户环境的声学降噪 | |
US9666183B2 (en) | Deep neural net based filter prediction for audio event classification and extraction | |
US9767806B2 (en) | Anti-spoofing | |
JP5662276B2 (ja) | 音響信号処理装置および音響信号処理方法 | |
US9489965B2 (en) | Method and apparatus for acoustic signal characterization | |
US9384760B2 (en) | Sound processing device and sound processing method | |
KR20120080409A (ko) | 잡음 구간 판별에 의한 잡음 추정 장치 및 방법 | |
US7818169B2 (en) | Formant frequency estimation method, apparatus, and medium in speech recognition | |
WO2018163279A1 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
JP4705414B2 (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体 | |
JP5803125B2 (ja) | 音声による抑圧状態検出装置およびプログラム | |
JP6724290B2 (ja) | 音響処理装置、音響処理方法、及び、プログラム | |
KR100784456B1 (ko) | Gmm을 이용한 음질향상 시스템 | |
JP2002261553A (ja) | 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム | |
JP2008257110A (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
US20160372132A1 (en) | Voice enhancement device and voice enhancement method | |
JPH11212588A (ja) | 音声処理装置、音声処理方法、及び音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP5147012B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
JPWO2015093025A1 (ja) | 音声処理装置、音声処理方法、及び、音声処理プログラム | |
JP4550674B2 (ja) | 音声特徴量抽出装置、音声特徴量抽出方法および音声特徴量抽出プログラム | |
JP5134477B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
JP2015031913A (ja) | 音声処理装置、音声処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120309 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4950930 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |