JPH03290700A - 有音検出装置 - Google Patents

有音検出装置

Info

Publication number
JPH03290700A
JPH03290700A JP2092083A JP9208390A JPH03290700A JP H03290700 A JPH03290700 A JP H03290700A JP 2092083 A JP2092083 A JP 2092083A JP 9208390 A JP9208390 A JP 9208390A JP H03290700 A JPH03290700 A JP H03290700A
Authority
JP
Japan
Prior art keywords
buffer
threshold
feature
feature parameters
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2092083A
Other languages
English (en)
Inventor
Hitoki Satou
佐藤 仁樹
Tsuneo Nitta
恒雄 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2092083A priority Critical patent/JPH03290700A/ja
Priority to CA002040025A priority patent/CA2040025A1/en
Priority to US07/682,079 priority patent/US5293588A/en
Priority to EP91105621A priority patent/EP0451796B1/en
Priority to DE69126730T priority patent/DE69126730T2/de
Publication of JPH03290700A publication Critical patent/JPH03290700A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は、ATV (Asynchronous Tr
ansferMode)通信、D S I (Digi
tal 5peech Interplatlon)、
パケット通信及び音声認識等の分野において、音声信号
中の有音区間を検出するために用いられる有音検出装置
に関する。
(従来の技術) 従来のこの種の有音検出装置について、第12図及び第
13図を参照して述べる。
即ち、第12図は有音検出装置の構成例を示すブロック
図である。図面において、100は音声の入力端子であ
り、この音声入力端子100は、入力信号を音響分析し
て電力、零交差数、自己相関関数又はスペクトル等の特
徴パラメータを抽出する特徴パラメータ計算装置101
に接続されている。上記特徴パラメータ計算装置101
は、予め登録された音声標準パターン102及び雑音標
準パターン103が人力され、これら音声標準パターン
102及び雑音標準パターン103と上記特徴パラメー
タとが、夫々照合され、特徴パラメータと各パターン1
02.103同土間の距離を個別に評価するマツチング
装置104に接続されている。そして、このマツチング
装置104は、特徴パラメータとパターン102.10
3間距離の判定結果が出力される判定出力端子105に
接続されている。
従って、かかる構成により、入力端子100に入力され
た信号中からこの入力信号のフレーム単位(以下、入力
フレームと称す)で電力、零交差数、自己相関関数及び
スペクトル等の特徴パラメータが、特徴パラメータ計算
装置101によって演算され、演算された特徴パラメー
タは、マツチング装置104に出力され、予め設定され
た音声標準パターン102及び雑音標準パターン103
と個別に比較されて、夫々の距離が算出される。
そこで、特徴パラメータと音声標準パターン102との
距離が、雑音標準パターン103との距離より小さけれ
ば、入力フレームは、音声標準パターン102に属し、
音声と判定され、逆に大きければ、雑音標準パターン1
03に属し、雑音と判定される。そして、この判定結果
は出力端子105より出力される。
第13図は電力の特徴パラメータのみを用いた有音検出
装置のブロック図である。この装置は、入力端子100
から入力される入力フレームの特徴パラメータとなる平
均電力P (n)を演算するための電力計算装置106
と、この電力計算装置106に接続され、判定のための
電力のしきい値T (n)を更新するしきい値更新装置
107と、上記電力計算装置106及びしきい値更新装
置107に接続され、電力の特徴パラメータとしきい値
T (n)とを比較し、音声及び雑音を判定するための
しきい値比較装!f108と、このしきい値比較装置1
08による判定結果を出力する出力端子105とから構
成されている。
斯くして、かかる構成の有音検出装置では、先ず、入力
端子100から入力される入力フレームの平均電力P 
(n)が、電力計算装置106により演算される。次い
で、しきい値更新装置107において、上記演算された
P (n)と判定のための現在のしきい値T (n)と
が、次式(1)の関係を満たすとき、 P (n) <T (n) −P (n) X (α−
1)(但し、αは定数)  ・・・(1) T  (n+1)=P  (n)  ×a      
  ・=  (2)上式(2)に示すように、しきい値
T (n)が更新され、新たなしきい値T(n+1.)
が得られる。
逆に、P (n)とT (n)とに次式(3)の関係が
あるときは、 P (n)≧T (n) −P (n) X (a−1
)・・・ (3) (n+1)  士T(n)Xr (但し、rは極めて小さな定数) (4) 上式(4)により新たなしきい値T (n+1)が得ら
れる。
その他の例として、P (n)とT (n)とに次式(
5)の関係があれば、 P (n) <T (n)−α       ・・・(
5)T (n+1)−P (n)+a      −(
6)上式(6)により現在のしきい値T (n)が更新
され、新たにしきい値T(n+1)が求められ、逆に、
次式(7)の関係を満たすならば、P (n)≧T (
n)−α       ・・・(7)T (n+1) 
=T (n) X r      ・= (8)上式(
8)によりT (n)が更新され、新たなしきい値T 
(n+1)が求められる。而して、このようにして演算
されたしきい値T (n)とP (n)とが、上記しき
い値比較装置108で比較される。
ここで、P (n)がT (n)より大きければ、音声
が認識され、逆に小さければ雑音が認識される。
そして、この判定結果は出力端子105より出力された
(発明が解決しようとする課題) 然し乍ら、上述した従来の有音検出装置においては、背
景雑音の影響を受けた特徴パラメータを用いて音声及び
雑音の判定を行なっていたので、入力信号のレベルが低
いとき、音声が雑音と誤認され、背景雑音が大きな場合
には、この背景雑音の電力より低いことの多い子音を雑
音と誤認してしまうという問題点があった。
このため、音声の検出率が低下し、ひいては音質を劣化
させるという問題点があった。
本発明の目的は、上述の問題点に鑑み、入力信号レベル
の高低や背景雑音の大小等に関係なく、確実に音声を検
出できる有音検出装置を提供するものである。
〔発明の構成〕
(課題を解決するための手段) 本発明は上述した目的を達成するため、フレーム単位で
入力信号の特徴パラメータを演算する特徴パラメータ計
算装置と、上記演算された特徴パラメータを順次蓄積す
るバッファと、上記特徴パラメータとしきい値とを比較
して、上記特徴パラメータを上記バッファに蓄積するか
否かを決定すると共に、入力フレームを音声と雑音とに
識別するしきい値比較装置と、上記バッファ内の上記特
徴パラメータを基にして、上記しきい値を演算し、これ
を上記しきい値比較装置に出力するしきい値発生装置と
を具備したものである。
又は、フレーム単位で入力信号の特徴パラメータを演算
する特徴パラメータ計算装置と、上記演算された特徴パ
ラメータを順次蓄積するバッファと、上記バッファ内の
上記特徴パラメータを変換して、上記特徴パラメータの
音声と雑音との違いを強調する特徴パラメータ変換装置
と、上記変換された特徴パラメータより音声及び雑音を
識別する判定装置と、上記判定装置による判定結果を基
にして、上記特徴パラメータを上記バッファに蓄積する
か否かを制御するバッファ制御装置とを具備したもので
ある。
更に、フレーム単位で入力信号の特徴パラメータを演算
する特徴パラメータ計算装置と、上記演算された特徴パ
ラメータを順次蓄積するバッファと、上記特徴パラメー
タとしきい値とを比較して、上記特徴パラメータを上記
バッファに蓄積するか否かを決定するしきい値比較装置
と、上記バッファ内の上記゛特徴パラメータを基にして
、上記しきい値を演算し、これを上記しきい値比較装置
に出力するしきい値発生装置と、上記バッファ内の上記
特徴パラメータを変換して、上記特徴パラメータの音声
と雑音との違いを強調する特徴パラメータ変換装置と、
上記変換された特徴パラメータより音声及び雑音を識別
する判定装置とを具備したものである。
(作用) 第1の発明によれば、特徴パラメータ計算装置で計算さ
れた特徴パラメータを用いて、しきい値比較装置で入力
信号を音声、雑音に識別する。
ここで用いるしきい値は、しきい値比較装置で雑音であ
ると判定され、バッファ内に蓄積された情報を基にしき
い値発生装置で発生されるため、雑音の変化に対して適
応的にしきい値が決定される。
その結果、雑音の変化に依存しない音声、雑音識別が可
能となる。
第2の発明によれば、特徴パラメータ計算装置で計算さ
れた特徴パラメータを、特徴パラメータ変換装置で音声
と雑音との違いを強調するように変換する。この変換は
バッファ内の特徴パラメータを参照して行なわれるため
、バッファ内に蓄積された特徴パラメータに大きく依存
する。すなわち、バッファ内に音声の特徴パラメータが
入っておらず、しかも雑音の特徴パラメータはもれなく
入っているのが望ましい。よって、バッファ内に特徴パ
ラメータを蓄積するか否かを、バッファ制御装置で雑音
に対して適応的に行なうことにより、雑音の影響を受け
ない高精度なパラメータ変換が行なえる。この変換され
たパラメータを用いることにより、音声、雑音の識別が
判定装置で高精度に行なえる。
第3の発明によれば、特徴パラメータ計算装置で計算さ
れた特徴パラメータを、特徴パラメータ変換装置で音声
と雑音との違いを強調するように変換する。この変換は
バッファ内の特徴パラメータを参照して行なわれるため
、バッファ内に蓄積された特徴パラメータに大きく依存
する。すなわち、バッファ内に音声の特徴パラメータが
入っておらず、しかも雑音の特徴パラメータはもれなく
入っているのが望ましい。よって、バッファ内に特徴パ
ラメータを蓄積するか否かを、しきい値比較装置で雑音
に対1−で適応的に行なうことにより、雑音の影響を受
けない高精度なパラメータ変換が行なえる。この変換さ
れたパラメータを用いることにより、音声、雑音の識別
を判定装置で高精度に行なえる。
(実施例) 本発明の有音検出装置における第1乃至第3の実施例を
第1図乃至第11図に基づいて従来例と同一構成部分に
は同一符号を付して説明する。
第1図は第1の実施例に係る有音検出装置の構成例を示
すブロック図である。本実施例における装置は、入力信
号が入力される入力端子100が接続された特徴パラメ
ータ計算装置101と、この特徴パラメータ計算装置1
01との間に、特徴パラメータが蓄積されるバッファ1
09を介在するしきい値発生装置110と、このしきい
値発生装置110と上記特徴パラメータ計算装置101
との間に介在し、バッファ109が接続されたしきい値
比較装置108と、このしきい値比較装置108に接続
され、音声か又は雑音かの判定結果が出力される出力端
子105とから構成されている。
次に、かかる構成の有音検出装置の作用を述べる。
先ず、入力端子100より入力される入力信号をフレー
ム単位に分析する。例えば、入力信号を8KHzでサン
プリングし、160サンプルづつまとめて1フレームと
する。但し、この場合、フレーム長及び分析周期は、常
に一定長である必要はない。
続いて、特徴パラメータ計算装置101によりフレーム
単位にDurbtn法等を用いて線形予測係数を計算す
る。そして、上記得られた線形予測係数を変換して、P
ARCOR係数、LPCケプストラム及びメルケプスト
ラム等を計算して、これを特徴パラメータとする。又、
このとき、電力、自己相関関数及び零交差数等を計算し
、特徴パラメータとしても良い。
現在音声か雑音かを判定しようとしているフレームを以
下では入力フレームという。また、特徴パラメータ計算
装置101で得られた入力フレームの特徴パラメータを
X(n)とする。nはフレームのシーケンシャルな番号
である。特徴パラメータは、p次元のベクトルで、次式
(9)で書き表せる。
X(n)= (xt (n)、x2 (n)、・=、 
Xp (n))・・・ (9) ところで、バッファ109では、第2図に示すように、
特徴パラメータの蓄積される時間の順序関係を保存する
ために、特徴パラメータが入力された順番で、バッファ
109のヘッドからティルに向かって蓄積される。即ち
、時間的に一番新しい特徴パラメータがバッファ109
のヘッドに蓄積されると共に、一番過去の特徴パラメー
タがテイルに蓄積される。
しきい値発生装置110の構成例を第3図に示す。正規
化係数計算装置110aでは、バッファ109に蓄積さ
れた特徴パラメータのうち、入力フレームのSフレーム
より過去(バッファ109のヘッドからSフレームめ)
からバッファ109のテイルに向かってNフレーム分の
特徴パラメータ集合Ω(n)を取り出し、Ω(n)の平
均値と標準偏差を計算する。
先ス、バッファ109で、ヘッドのSフレームめからテ
イルに向かってNフレーム分の特徴パラメータを取り出
し、この特徴パラメータの集合Ω(n)を次式(10)
に示す。
Ω(n): (Xt、、、(S)、Xt、、(S+1)、・、 Xt
、、(S+N−1)1(10) 第2図から分かるように、バッファ109にはしきい値
比較装置108で雑音と判定されたフレームの特徴パラ
メータが蓄・積されるので、バッファ109内の特徴パ
ラメータはかならずしも時間的に連続しているとは限ら
ない。
次に、次式(11)、  (12)を用いて特徴ノ々ラ
メータの各要素ごとに、平均値m+と標準偏差σ、を計
算する。
ここで、 Xい(j)−(xい、 また、平均値m 以下の式(13) %式% ) () () (n)と標準偏差σ、(n)は 、(14)のようにも書き表す ・・・ (13) (j)/N (j)−m (X (n))2 /N・・・ (14) jは次の条件を満たすもので、Σの範囲はjの大きい方
から以下の条件式(15)を満足するNフレームを取る
(x+  (j)  (Ω(n) ’  ) &(j<
 n −S) −(15)ここで、Ω(n)°はしきい
値比較装置108で雑音と判断された特徴パラメータの
集合とする。
しきい値T (n)は、しきい値計算装置110bで、
例えば次式(16)のように計算される。
T (n)−αxm++β×σ!     ・・・(I
B)ここで、α、βは、任意の数である。
ただし、バッファ109の中にN+Sフレーム分の特徴
パラメータが蓄積されるまでは、T (n)はあらかじ
め与えられたしきい値TOを取るものとする。
しきい値比較装置108では、しきい値T (n)と特
徴パラメータX(n)とを比較し音声及び雑音の識別を
行なう。ここで、特徴パラメータは1次元であり非零で
あるとする。その例として、電力、零交差数などが上げ
られる。また、バイアスを加えて、負の値を正にしても
よい。1次元の特徴パラメータを電力としてX (n)
で表わし、X(n)とT (n)との間に、次式(17
)の関係があるとき音声とし、次式(18)の関係のと
き雑音と認識する。
X (n)≧T(n)           ・−(1
7)X(n) <T(n)           −(
1g)ただし、特徴パラメータの性質によっては、不等
号が反転することもある。
もし、p>lの場合には、X (n) = II X(
n)  Ifとしてもよい。また、X(n)の適当な要
素X1(n)を用いてもよい。
第4図は第2の実施例に係る有音検出装置の構成例を示
すブロック図である。本実施例の装置は、入力端子10
0が接続した特徴パラメータ計算装置101と、この特
徴パラメータ計算装置101にバッファ109を介して
接続された判定装置111と、上記特徴パラメータ計算
装置101と判定装置111との間に接続された特徴パ
ラメータ変換装置112と、特徴パラメータ計算装置1
01と判定装置111との間に介在し、特徴パラメータ
変換装置112との間に、バッファ109を介して接続
したバッファ制御装置113と、上記判定装置111に
接続した出力端子105とから構成されている。
次に、かかる構成を有する有音検出装置の作用を述べる
特徴パラメータ変換装置112では、音声と雑音との違
いを強調するために特徴パラメータを変換する。ここで
、変換された特徴パラメータを、以下では変換パラメー
タと呼び、次式(19)で書き表わす。変換パラメータ
はr(≦p)次元のベクトルである。
Y(n)= (y 1(n)、y 2 (n)、−、y
 、 (n))・= (19)特徴パラメータ変換装置
112の構成例を第5図に示す。
この図で正規化係数計算装置110aの構成は、第3図
のものと同じである。正規化装置112aでは、次式(
20)又は(21)により変換パラメータY(n)を計
算する。
y I(n)−(x + (n)−m+ (n))/c
r I (n) −(20)y + (n)−(x I
(n)−m + (n))      −(21)Y(
n)は、Ω(n)の平均ベクトルM(n)とX(n)と
の差をΩ(n)の分散で正規化したものである。また、
第6図にX(n)、Ω(n)、Y(n)の関係を図示し
た。
ここで、i=1.2.・・・、qである。
r>1のとき、r=qであり、1≦q≦pの任意の大き
さを取ることができる。このときの変換パラメータはY
(n)である。
特に、r=1かつp>1のとき、11・11をベクトル
のノルムとすると、変換パラメータを11Y(n)It
とする。qは1≦q≦pの任意の大きさを取ることがで
きる。
バッファ制御装置113では、判定装置111で人力フ
レームが雑音であると判定された場合には、入力フレー
ムの特徴パラメータをバッファ109に蓄積することと
する。
ただし、バッファ109の中にN+Sフレーム分の特徴
パラメータが蓄積されるまでは、入力フレームの電力と
あらかじめ与えられたしきい値Toを比較し、電力がT
。より小さい場合に特徴パラメータをバッファ109に
蓄積するものとする。
判定装置111では、特徴パラメータ変換装置112か
ら得られた変換パラメータをもとに、有音区間を判定す
る。判定装置111の構成例を第7図に示す。
マツチング装置111aでは、標準パターン(1〜M)
lllbと変換パラメータとの距離を測定し、音声に属
する標準パターン111bにマツチングされた場合音声
と判定し、そうでない場合雑音と判定する。
先ず、次式(22)より各標準パターンω。
(°i = 1 、 ++’ M)との距離を測定する
Dr  (Y) ”(Y  tt + ) ’  Σl−1(Y  at
 )÷ln lΣ1・・・ (22) Yは、i =m i n (Dr  (Y) )なる(
IJIに属しているとする。もしω1が音声に属してい
れば、そのフレームは音声、ω、が雑音に属していれば
、そのフレームは雑音であると判定する。
ところで、標準パターン111bは以下のように定義で
きる。
標準パターン111bはマツチング装置111aの構成
から分かるように、変換パラメータの平均値ベクトルμ
および、Y2Oの共分散行列Σとなる。
クラスωに属するL個のr次元変換パラメータを次式(
23)で表わす。
Y−(j)−(y−+(j)、y、2(j)1.、、、
  y、、(j))j−L2.  、、、、L  ・・
・ (23)また、μとΣの各要素をμ8、Σに1とす
ると、第8図に示すように、特徴パラメータ変換装置1
12が接続した平均・共分散行列計算装置114により
次式(24)、(25)を用いて計算される。
ここで、第8図を参照して、標準パターン111bの作
成法を述べる。
標準パターン111bを作成するために、各標準パター
7111bのクラスごとに、音声データベース115を
作成する。
その作成方法は、まず、複数の被験者に各クラスに属す
る音韻を発音してもらい、それを録音する。
このようにして得られた音声信号に対し、フレーム単位
に、子音と雑音との区別をつけるためのラベルを付けて
いく。ラベル付けは、音声信号の波形やスペクトルをC
RTに表示して、それを見ながらフレーム単位にラベル
を付けていく。この音声データベースに対応したラベル
をラベルデータベース116とする。
音声データベース115から特徴パラメータ計算装置1
01で特徴パラメータを計算する。特徴パラメータのバ
ッファ109への蓄積は、ラベルデータベース116を
参照して行なう。この特徴パラメータから先に述べたよ
うに変換パラメータを計算する。その後、ラベルデータ
ベース116を参照して、標準パターン111bを作成
しようとしているクラスに属するフレームの変換パラメ
ータならば、それを用いて平均・共分散行列計算装置1
14で、平均・共分散を計算する。
第9図は第3の実施例に係る有音検出装置の構成例を示
すブロック図である。本実施例における装置は、入力端
子100が接続された特徴パラメータ計算装置101と
、この特徴パラメータ計算袋w101にバッファ109
を介して接続された判定装置111と、上記特徴パラメ
ータ計算装置101と判定装置111との間に接続され
た特徴パラメータ変換装置112と、上記特徴パラメー
タ計算装置101に接続され、特徴パラメータ変換装置
112にバッファ109を介して接続されたしきい値比
較装置108と、このしきい値比較装置108及びバッ
ファ109に接続されたしきい値発生装置110と、判
定装置111に接続された出力端子105とから成って
いる。
そして、かかる構成の有音検出装置では、第10図に示
すように、標準パターン111bの作成において、第2
の実施例がバッファ109に特徴パラメータを蓄積する
か否かをラベルデータベース116を参照して行なって
いるのに対し、しきい値比較装置108としきい値発生
装置110とを用いて行なうものである。
斯くして、本発明では、バッファ109内に蓄積された
特徴パラメータを基にして、音声及び雑音の特徴を強調
するため、第11図に示すように、S/N比が、例えば
14〜20dB程度の背景雑音の大きな環境下でも入力
レベルに左右されない高い音声の平均検出率が得られる
尚、この場合の子音の検出率は次式(26)で%式% (26) 但し、子音フレームが任意の子音、母音のクラスに判定
された場合、子音が正しく検出されたものとする。
同様に、母音フレームが任意の子音、母音のクラスに判
定された場合、母音が正しく検出されたものとする。
同様に、雑音フレームが任意の雑音のクラスに判定され
た場合、雑音が正しく検出されたものとする。
又、雑音及び母音検出率についても同様である。
〔発明の効果〕
以上説明したように本発明によれば、バッファ内の特徴
パラメータを基にして、音声及び雑音の特徴を強調する
ので、入力信号レベルの高低や背景雑音の大小等に影響
されず、高い音声の検出率が得られるので、音声の認識
率が向上でき、音質が向上できる等の効果により上述し
た課題を解決し得る。
【図面の簡単な説明】
第1図乃至第11図は本発明の実施例を示すもので、第
1図は第1実施例に係る装置のブロック図、第2図はバ
ッファ内の特徴パラメータの蓄積状態を示す説明図、第
3図はしきい値発生装置の構成図、第4図は第2実施例
に係る装置のプロッり図、第5図は特徴パラメータ変換
装置の構成図、第6図はX(n)とY(n)との関係図
、第7図は判定装置の構成図、第8図及び第10図は標
準パターンの作成例を示す説明図、第9図は第3実施例
に係る装置のブロック図、第11図は音声の検出率と平
均振幅レベルとの特性図、第12図及び第13図は従来
装置のブロック図である。 100・・・入力端子、 101・・・特徴パラメータ計算装置、105・・・出
力端子、 108・・・しきい値比較装置、 109・・・バッファ、 110・・・しきい値発生装置、 111・・・判定装置、 112・・・特徴パラメータ変換装置、113・・・バ
ッファ制御装置。

Claims (3)

    【特許請求の範囲】
  1. (1)フレーム単位で入力信号の特徴パラメータを演算
    する特徴パラメータ計算装置と、 上記演算された特徴パラメータを順次蓄積するバッファ
    と、 上記特徴パラメータとしきい値とを比較して、上記特徴
    パラメータを上記バッファに蓄積するか否かを決定する
    と共に、入力フレームを音声と雑音とに識別するしきい
    値比較装置と、 上記バッファ内の上記特徴パラメータを基にして、上記
    しきい値を演算し、これを上記しきい値比較装置に出力
    するしきい値発生装置とを具備したことを特徴とする有
    音検出装置。
  2. (2)フレーム単位で入力信号の特徴パラメータを演算
    する特徴パラメータ計算装置と、 上記演算された特徴パラメータを順次蓄積するバッファ
    と、 上記バッファ内の上記特徴パラメータを変換して、上記
    特徴パラメータの音声と雑音との違いを強調する特徴パ
    ラメータ変換装置と、 上記変換された特徴パラメータより、音声と雑音を識別
    する判定装置と、 上記判定装置による判定結果を基にして、上記特徴パラ
    メータを上記バッファに蓄積するか否かを制御するバッ
    ファ制御装置とを具備したことを特徴とする有音検出装
    置。
  3. (3)フレーム単位で入力信号の特徴パラメータを演算
    する特徴パラメータ計算装置と、 上記演算された特徴パラメータを順次蓄積するバッファ
    と、 上記特徴パラメータとしきい値とを比較して、上記特徴
    パラメータを上記バッファに蓄積するか否かを決定する
    しきい値比較装置と、 上記バッファ内の上記特徴パラメータを基にして、上記
    しきい値を演算し、これを上記しきい値比較装置に出力
    するしきい値発生装置と、 上記バッファ内の上記特徴パラメータを変換して、上記
    特徴パラメータの音声と雑音との違いを強調する特徴パ
    ラメータ変換装置と、 上記変換された特徴パラメータより、音声と雑音を識別
    する判定装置とを具備したことを特徴とする有音検出装
    置。
JP2092083A 1990-04-09 1990-04-09 有音検出装置 Pending JPH03290700A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2092083A JPH03290700A (ja) 1990-04-09 1990-04-09 有音検出装置
CA002040025A CA2040025A1 (en) 1990-04-09 1991-04-08 Speech detection apparatus with influence of input level and noise reduced
US07/682,079 US5293588A (en) 1990-04-09 1991-04-09 Speech detection apparatus not affected by input energy or background noise levels
EP91105621A EP0451796B1 (en) 1990-04-09 1991-04-09 Speech detection apparatus with influence of input level and noise reduced
DE69126730T DE69126730T2 (de) 1990-04-09 1991-04-09 Sprachdetektor mit vermindertem Einfluss von Engangssignalpegel und Rauschen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2092083A JPH03290700A (ja) 1990-04-09 1990-04-09 有音検出装置

Publications (1)

Publication Number Publication Date
JPH03290700A true JPH03290700A (ja) 1991-12-20

Family

ID=14044553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2092083A Pending JPH03290700A (ja) 1990-04-09 1990-04-09 有音検出装置

Country Status (1)

Country Link
JP (1) JPH03290700A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016143125A1 (ja) * 2015-03-12 2016-09-15 三菱電機株式会社 音声区間検出装置および音声区間検出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016143125A1 (ja) * 2015-03-12 2016-09-15 三菱電機株式会社 音声区間検出装置および音声区間検出方法
JPWO2016143125A1 (ja) * 2015-03-12 2017-06-01 三菱電機株式会社 音声区間検出装置および音声区間検出方法

Similar Documents

Publication Publication Date Title
US5692104A (en) Method and apparatus for detecting end points of speech activity
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
JP4568371B2 (ja) 少なくとも2つのイベント・クラス間を区別するためのコンピュータ化された方法及びコンピュータ・プログラム
US6993481B2 (en) Detection of speech activity using feature model adaptation
JPH0990974A (ja) 信号処理方法
US5596680A (en) Method and apparatus for detecting speech activity using cepstrum vectors
EP0054365B1 (en) Speech recognition systems
JPH05216490A (ja) 音声コード化装置及び方法並びに音声認識装置及び方法
JPH06332492A (ja) 音声検出方法および検出装置
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
US6470311B1 (en) Method and apparatus for determining pitch synchronous frames
JPH1185190A (ja) 音声認識装置及び音声認識方法
JP2797861B2 (ja) 音声検出方法および音声検出装置
JP2002258881A (ja) 音声検出装置及び音声検出プログラム
JP3034279B2 (ja) 有音検出装置および有音検出方法
JPH03290700A (ja) 有音検出装置
JP3493849B2 (ja) 音声認識装置
JPS63281200A (ja) 音声区間検出方式
US20010029447A1 (en) Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor
CN107039046B (zh) 一种基于特征融合的语音声效模式检测方法
JP2006010739A (ja) 音声認識装置
JPH0222399B2 (ja)
JP3032215B2 (ja) 有音検出装置及びその方法
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법