JP2002258881A - 音声検出装置及び音声検出プログラム - Google Patents

音声検出装置及び音声検出プログラム

Info

Publication number
JP2002258881A
JP2002258881A JP2001055324A JP2001055324A JP2002258881A JP 2002258881 A JP2002258881 A JP 2002258881A JP 2001055324 A JP2001055324 A JP 2001055324A JP 2001055324 A JP2001055324 A JP 2001055324A JP 2002258881 A JP2002258881 A JP 2002258881A
Authority
JP
Japan
Prior art keywords
voice
feature amount
regularity
speech
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001055324A
Other languages
English (en)
Other versions
JP3849116B2 (ja
Inventor
Kaori Endou
香緒里 遠藤
Takashi Ota
恭士 大田
Shinji Nakama
真司 中間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001055324A priority Critical patent/JP3849116B2/ja
Publication of JP2002258881A publication Critical patent/JP2002258881A/ja
Application granted granted Critical
Publication of JP3849116B2 publication Critical patent/JP3849116B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 環境騒音が重畳した音声信号から、音声・非
音声区間を判定する音声検出装置及び音声検出プログラ
ムに関し、環境騒音が大きい場合でも、精度良く音声・
非音声を判定する。 【解決手段】 入力手段1−1から時系列的に順に与え
られるフレーム毎の入力信号に対して、音声特徴量算出
手段1−2により、音声信号の電力、零交差率、パワー
スペクトルのピーク周波数、ピッチ周期等の音声特徴量
を算出する。高次成分強調手段1−3により、音声周波
数の特徴量の高域成分を強調させた特徴量を算出する。
音声判定手段1−4は、それらの特徴量を基に、音声・
非音声判定を行う。更に、音声共振周期の規則性の有無
を算出する手段を備え、該規則性の有無を基に音声・非
音声判定を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声検出装置及び
音声検出プログラムに関する。一般に、音声信号を音声
符号化器により圧縮して伝送する音声通信システム等で
は、通常の会話では約6割が発声の無い非音声区間であ
ることに着目し、音声・非音声区間を判定することによ
り、非音声区間は伝送を停止して電池を長持ちさせた
り、音声の代わりに他のデータを伝送するなどの通信制
御を行うことができる。
【0002】音声通信システム等における音声検出機能
は、このような通信制御を行なうために、音声・非音声
区間の判定を行なう。しかし、騒音環境などの条件によ
っては音声・非音声区間の判定に誤りが起こり、それに
よって音切れが発生するなどして通話品質が著しく損な
われることがあり、音声・非音声区間を精度良く判定す
ることが要求されている。
【0003】
【従来の技術】図5は従来の音声検出装置を示す。従来
の音声検出装置は、環境騒音が重畳した音声信号が入力
信号入力手段5−1に加えられ、入力手段5−1から時
系列的に順に出力されるフレーム毎の入力信号に対し
て、音声特徴量算出手段5−2により、音声信号の電
力、零交差率、パワースペクトルのピーク周波数、又は
ピッチ周期等の音声信号の特徴量を計算し、音声判定手
段5−3において、これらの音声特徴量を閾値と比較す
ることによって、当該フレームに音声が含まれているか
どうかを判定する。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
音声検出装置では環境騒音が大きい場合、雑音区間と音
声区間との音声特徴量の差が小さくなり、音声・非音声
区間を精度良く判定することが困難である。本発明は、
環境騒音の影響を受け難くするように、音声特徴量に処
理を加えることで、環境騒音が大きい場合でも、精度良
く音声・非音声を判定することができる音声検出装置及
び音声検出プログラムを提供することを目的とする。
【0005】
【課題を解決するための手段】本発明の音声検出装置
は、(1)入力信号として環境騒音が重畳した音声信号
が時系列順に与えられるフレーム毎に、当該フレームに
音声が含まれているか否かを判定する音声検出装置であ
って、電力、零交差率、パワースペクトルのピーク周波
数、ピッチ周期のうち少なくとも一つを用いて音声の特
徴量を算出する音声特徴量算出手段と、パワースペクト
ルのピーク周波数の高次成分を強調して音声の特徴量を
算出する高次成分強調特徴量算出手段と、前記音声特徴
量算出手段及び高次成分強調特徴量算出手段により算出
された特徴量を基に、音声か非音声であるかを判定する
音声判定手段と、を備えたものである。
【0006】また、(2)電力、零交差率、パワースペ
クトルのピーク周波数、ピッチ周期のうち少なくとも一
つを用いて音声の特徴量を算出する音声特徴量算出手段
と、音声の共振周期の規則性を算出する共振周期の規則
性算出手段と、前記音声特徴量算出手段により算出した
音声特徴量及び規則性算出手段により算出した音声の共
振周期の規則性を基に、音声か非音声であるかを判定す
る音声判定手段と、を備えたものである。
【0007】また、本発明の音声検出プログラムは、
(3)入力信号として環境騒音が重畳した音声信号が時
系列順に与えられるフレーム毎に、当該フレームに音声
が含まれているか否かを判定する音声検出プログラムで
あって、電力、零交差率、パワースペクトルのピーク周
波数、ピッチ周期のうち少なくとも一つを用いて音声の
特徴量を算出する音声特徴量算出手順と、パワースペク
トルのピーク周波数の高次成分を強調して音声の特徴量
を算出する高次成分強調特徴量算出手順と、前記音声特
徴量算出手順及び高次成分強調特徴量算出手順により算
出された特徴量を基に、音声か非音声であるかを判定す
る音声判定手順と、を実行させるものである。
【0008】また、(4)電力、零交差率、パワースペ
クトルのピーク周波数、ピッチ周期のうち少なくとも一
つを用いて音声の特徴量を算出する音声特徴量算出手順
と、音声の共振周期の規則性を算出する共振周期の規則
性算出手順と、前記音声特徴量算出手順により算出した
音声特徴量及び規則性算出手順により算出した音声の共
振周期の規則性を基に、音声か非音声であるかを判定す
る音声判定判定手順と、を実行させるものである。
【0009】また、(5)電力、零交差率、パワースペ
クトルのピーク周波数、ピッチ周期のうち少なくとも一
つを用いて音声の特徴量を算出する音声特徴量算出手順
と、パワースペクトルのピーク周波数の高次成分を強調
して音声の特徴量を算出する高次成分強調特徴量算出手
順と、音声の共振周期の規則性を算出する共振周期の規
則性算出手順と、前記音声特徴量算出手順により算出し
た音声特徴量、高次成分強調特徴量算出手順により算出
した特徴量、及び規則性算出手順により算出した音声の
共振周期の規則性を基に、音声か非音声であるかを判定
する音声判定手順と、を実行させるものである。
【0010】
【発明の実施の形態】図1は本発明の音声検出装置の第
1の実施形態を示す。本発明の第1の実施形態は、入力
手段1−1から時系列的に順に与えられるフレーム毎の
入力信号に対して、音声特徴量算出手段1−2により、
従来と同様に音声信号の特徴量を算出すると共に、高次
成分強調手段1−3により、音声周波数の特徴量の高域
成分を強調させた特徴量を算出する。音声判定手段1−
4は、従来の特徴量に加えて高域成分を強調させた特徴
量を基に、音声・非音声判定を行う。
【0011】従来の音声検出方式及び装置では、音声周
波数の高次の成分に着目することなく、全般的なパワー
スペクトルのピーク周波数が音声と非音声とで異なるこ
とを利用して判定している。これに対し本発明では、音
声は低域の周波数成分にエネルギーが集中するのに対
し、非音声は一般に特定の周波数領域へのエネルギーの
集中がないので、高次の成分ほど音声と非音声との特徴
量の差が大きくなることを利用して、高次の成分の違い
を強調した特徴量を算出する。この特徴量を用いて判定
することで、騒音の影響が大きい場合でも、正確に音声
・非音声を判定することができる。
【0012】図2は本発明の音声検出装置の第2の実施
形態を示す。本発明の第2の実施形態は、入力手段2−
1から時系列的に順に与えられるフレーム毎の入力信号
に対して、音声特徴量算出手段2−2により、従来と同
様に音声信号の特徴量を算出すると共に、共振周期の規
則性算出手段2−3により、音声の共振周期の規則性を
算出する。そして、音声判定手段2−4は、従来の特徴
量に加えて音声の共振周期の規則性を基に、音声・非音
声判定を行う。
【0013】従来の音声検出方式及び装置では、通常は
最も自己相関が高くなる周期を共振周期として求め、該
共振周期を用いて音声・非音声を判定する。しかし、騒
音の種類によっては、音声と同じような共振周期を有す
る場合があり、このような場合には判別が困難となる。
【0014】母音などの音声は声道の共振によって生成
されるため、声道の基本周期の倍数にエネルギーが集中
し、共振する複数の周期(共振周期)の間に規則性が現
れるのに対し、非音声では特別な規則性がないことに着
目し、本発明は、音声の共振周期の規則性を算出し、こ
れを基に音声・非音声を判定する。
【0015】こうすることにより、最も自己相関が高く
なる周期が音声と騒音で一致する場合でも、音声のみが
複数の共振周期の間に規則性が現れるので、騒音と判別
することができ、騒音の影響が大きい場合でも、正確に
音声・非音声を判定することが可能になる。
【0016】更に、本発明の第1の実施形態として説明
したパワースペクトルのピーク周波数の高次成分の違い
を強調した特徴量と、第2の実施形態として説明した音
声の共振周期の規則性とを組合わせて、音声・非音声の
判定を行うことにより、騒音の影響が大きい場合でも、
より正確に音声・非音声を判定することが可能となる。
【0017】図3は本発明の音声検出の処理フローを示
す。同図はパワースペクトルのピーク周波数をPARC
OR分析で得られる10次の線スペクトル周波数LSF
[i](1≦i≦10)とした場合の処理フローの例を
示している。ここで、従来の音声検出により用いられる
特徴量を、フレーム電力E、零交差数Z,10次の線ス
ペクトル周波数から求めた特徴量L1,共振周波数F1
とする。そして、パワースペクトルのピーク周波数の高
次成分を強調した特徴量をL2、共振周期の規則性をF
2とする。
【0018】先ず、ステップ3−1において、非音声区
間のパラメータを以下の式(1)のとおり初期化する。
ここで、非音声区間のフレーム電力をEN 、非音声区間
の零交差数をZN 、非音声区間の線スペクトル周波数を
LSFN [i]と表すものとする。 EN =0,ZN =0,LSFN [i]=0 (1≦i≦10) …(1)
【0019】次にステップ3−2により、入力音声を読
み込む。次に、ステップ3−3により、現フレームのパ
ラメータを以下の式(2)〜(5)により算出する。こ
こで、現フレームの電力をE、零交差数をZ、共振周波
数をF1と表す。
【数1】
【0020】ここで、x(i)は現フレームのi番目の
入力音声信号振幅値であり、sgn(x(i),x(i
+1))は、x(i)とx(i+1)の符号が異なると
き1、同符号のとき0となる関数である。MAX(co
rr[k])は、k(1≦k≦143)サンプルずらし
て求めた自己相関のうち、最大値のkを表す。sはサン
プリングレート(Hz)を表す。
【0021】次にステップ3−4により、現フレームの
特徴量と非音声区間の特徴量の差分を以下の式(6)に
より算出する。ここで、フレーム電力の差分をΔE、零
交差数の差分をΔZで表す。 ΔE=E−EN ,ΔZ=Z−ZN …(6) また、L1を以下の式(7)により算出する。ここまで
は、従来の音声特徴量算出処理と同様である。
【数2】
【0022】次にステップ3−5により、線スペクトル
周波数の高次成分を強調した特徴量L2を算出する。高
次成分を強調する手法の一つとして、最高次数の線スペ
クトル周波数だけを用い、以下の式(8)により高次成
分を強調した特徴量L2を算出することができる。この
算出処理は、本発明の第1の実施形態における高次成分
強調特徴量算出手段で行われる算出処理に相当する。 L2=LSF[10]−LSFN [10] …(8)
【0023】次にステップ3−6により、共振周期の規
則性F2を算出する。この共振周期の規則性F2の算出
処理は、本発明の第2の実施形態における共振周期の規
則性算出手段で行われる算出処理に相当する。規則性F
2の算出の詳細は、図4を参照して後述する。
【0024】次にステップ3−7により、非音声パラメ
ータの更新を行うかどうかを判定するために、ΔE,Δ
Z,L1,F1,L2,F2を、予め与えられた閾値T
EN,THZN,THL1,THF1,THL2.THF2とそれ
ぞれ比較する。そして、 ΔE<THEN∩ΔZ<THZN∩L1<THL1∩F1>T
F1∩L2<THL2∩F2<THF2 の条件が成り立つ場合には更新を行うために、ステップ
3−8へ処理を進め、上記条件が成り立たない場合に
は、更新を行うことなくステップ3−9へ処理を進め
る。
【0025】ステップ3−8において、非音声パラメー
タを以下の式(9),(10)により更新する。 EN =αE+(1−α)EN,ZN =βZ+(1−β)ZN …(9) LSF[i]N =γLSF[i]+(1−γ)LSF[i]N …(10) α,β,γは予め与えられた値で、0≦α,β,γ≦
1、1≦i≦10である。
【0026】次にステップ3−9において、以下の式に
より音声・非音声の判定を行う。ここで、THE ,TH
Z ,THL1.THF1,THL2,THF2は予め与えられた
閾値とする。 ΔE>THE ∪ΔZ>THZ ∪L1>THL1∪F1<T
F1∪L2>THL2∪F2>THF2 の条件が成り立つ場合には、音声と判定してステップ3
−10へ処理を進める。上記条件が成り立たない場合に
は非音声と判定してステップ3−11へ処理を進める。
【0027】ステップ3−10において音声と判定した
旨の信号を出力する。ステップ3−11においては非音
声と判定した旨の信号を出力する。ステップ3−12に
おいて次の入力信号が無いかどうかを判定し、無い場合
には処理を終了する。次の入力信号が有る場合には、ス
テップ3−2に処理を進め、上記の処理フローを繰り返
し実行する。
【0028】次に、図4を用いて本発明における共振周
波数の規則性の算出処理を説明する。先ずステップ4−
1において、偏自己相関値(corr[k])を以下の
式(11)により計算する。xは入力信号を示す。
【数3】
【0029】ステップ4−2において、偏自己相関値の
ピーク値上位10個とそれに対応するkの値を取る。即
ち、corr[k−1]<corr[k]>corr
[k+1]となる偏自己相関値のうち、値が大きいもの
から上位10個を取り、これをcor_max[i]と
し、対応するkの値をlag[i] 1≦i≦10 と
する。ステップ4−3において、cor_max[i]
及びlag[i]を、lag[i]の昇順にソートす
る。ステップ4−4において、i=0,R=9,lnu
m=10とする。
【0030】次に、ピーク位置の間隔が所定値TH1以
下となるような近過ぎるもの同士を取り出し、その隣合
ったもののうちピーク値の大きい方を採用し、所定の間
隔以上のピーク値について規則性を調べるため、ステッ
プ4−5において、 lag[i+1]−lag[i]<TH1 …(12) の式により、ピーク位置の間隔が所定値TH1以下であ
るかどうか判定し、以下である場合ステップ4−6へ処
理を進める。上記の式(12)が成り立たない、即ち所
定の間隔TH1以上の場合はステップ4−22へ処理を
進める。
【0031】ステップ4−6において、 cor_max[i]<cor_max[i+1] …(13) の式が成り立つか判定し、成り立つ場合ステップ4−8
へ処理を進める。一方、 cor_max[i]≧cor_max[i+1] である場合、ステップ4−7へ処理を進める。
【0032】ステップ4−7において、cor_max
[i+1],lag[i+1]を除去し、cor_ma
x,lagを以下の式(14),(15)により更新
し、ステップ4−11へ処理を進める。 cor_max[j]=cor_max[j+1] …(14) lag[j]=lag[j+1] i+1≦j≦R−1 …(15)
【0033】ステップ4−8において、 cor_max[i+1]/cor_max[i]<TH2 …(16) の式が成り立つか判定し、成り立つ場合ステップ4−1
0へ処理を進める。一方、cor_max[i+1]/
cor_max[i]≧TH2の場合、ステップ4−9
へ処理を進める。
【0034】ステップ4−9において、cor_max
[i],lag[i]を除去し、cor_max,la
gを以下の式(17),(18)により更新し、ステッ
プ4−11へ処理を進める。 cor_max[j]=cor_max[j+1] …(17) lag[j]=lag[j+1] i≦j≦R−1 …(18)
【0035】ステップ4−10において、cor_ma
x[i+1],lag[i+1]を除去し、cor_m
ax,lagを以下の式(19),(20)により更新
し、ステップ4−11へ処理を進める。 cor_max[j]=cor_max[j+1] …(19) lag[j]=lag[j+1] i+1≦j≦R−1 …(20)
【0036】ステップ4−11において、R=R−1,
lnum=lnum−1とし、ステップ4−12へ処理
を進める。また、前述のステップ4−22において、i
=i+1とし、ステップ4−12へ処理を進める。ステ
ップ4−12においてi<Rかどうか判定し、i<Rな
らばステップ4−5へ処理を進める。i≧Rならばステ
ップ4−13へ処理を進める。
【0037】ステップ4−13において、lagの数l
numが2以上かどうか判定し、2以上ならばステップ
4−15へ処理を進める。lnumが1ならばステップ
4−14へ処理を進める。ステップ4−14において、
規則性なしを出力する。
【0038】ステップ4−15において、lagの数が
3以上かどうか判定し、3以上ならステップ4−17へ
処理を進める。lagの数が2ならばステップ4−16
へ処理を進める。ステップ4−16において、 TH3_1<lag[1]/lag[0]<TH3_2 …(21) が成り立つか判定し、成り立つ場合ステップ4−18へ
処理を進める。TH3_1≧lag[1]/lag
[0]、又はlag[1]/lag[0]≧TH3_2
である場合、ステップ4−19へ処理を進める。
【0039】ステップ4−17において、 TH4_1<lag[1]/lag[0]<TH4_2 …(22) かつ、TH5_1<lag[2]/lag[0]<TH5_2 …(23) の条件が成り立つか判定し、成り立つ場合ステップ4−
20へ処理を進める。一方、TH4_1≧lag[1]
/lag[0]、又はlag[1]/lag[0]≧T
H4_2、又はTH5_1≧lag[2]/lag
[0]、又はlag[2]/lag[0]≧TH5_2
である場合はステップ4−21へ処理を進める。
【0040】ステップ4−18では規則性有りを出力す
る。ステップ4−19では規則性無しを出力する。ステ
ップ4−20では規則性有りを出力する。ステップ4−
21では規則性無しを出力する。ここで、規則性有りの
場合、共振周期の規則性F2の値として例えば1を、規
則性無しの場合、共振周期の規則性F2の値として例え
ば0を出力する。
【0041】
【発明の効果】以上説明したように本発明によれば、従
来の音声特徴量算出に加えて、環境騒音の影響を受け難
いように、高次成分の違いを強調した音声特徴量の算出
を行い、この音声特徴量を用いて音声・非音声を判定す
ることにより、従来に比べて騒音の影響が大きい場合で
も、より正確に音声・非音声を判定することができる。
【0042】また、従来の音声特徴量算出に加えて、音
声共振周期の規則性の有無を算出し、この規則性を用い
て音声・非音声を判定することにより、従来に比べて騒
音の影響が大きい場合でも、より正確に音声・非音声を
判定することができる。
【0043】更に、従来の音声特徴量算出に加えて、環
境騒音の影響を受け難いように高次成分の違いを強調し
た特徴量、及び音声共振周期の規則性の有無を算出し、
これらを用いて音声・非音声を判定することにより、従
来に比べて騒音の影響が大きい場合でも、より正確に音
声・非音声を判定することができるようになる。
【図面の簡単な説明】
【図1】本発明の音声検出装置の第1の実施形態を示す
図である。
【図2】本発明の音声検出装置の第2の実施形態を示す
図である。
【図3】本発明の音声検出の処理フローを示す図であ
る。
【図4】本発明における共振周波数の規則性の算出処理
のフロー図である。
【図5】従来の音声検出装置を示す図である。
【符号の説明】
1−1 入力手段 1−2 音声特徴量算出手段 1−3 高次成分強調手段 1−4 音声判定手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中間 真司 福岡県福岡市博多区博多駅前三丁目22番8 号 富士通九州ディジタル・テクノロジ株 式会社内 Fターム(参考) 5D015 DD03 EE05

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 入力信号として環境騒音が重畳した音声
    信号が時系列順に与えられるフレーム毎に、当該フレー
    ムに音声が含まれているか否かを判定する音声検出装置
    であって、 電力、零交差率、パワースペクトルのピーク周波数、ピ
    ッチ周期のうち少なくとも一つを用いて音声の特徴量を
    算出する音声特徴量算出手段と、 パワースペクトルのピーク周波数の高次成分を強調して
    音声の特徴量を算出する高次成分強調特徴量算出手段
    と、 前記音声特徴量算出手段及び高次成分強調特徴量算出手
    段により算出された特徴量を基に、音声か非音声である
    かを判定する音声判定手段と、 を備えたことを特徴とする音声検出装置。
  2. 【請求項2】 入力信号として環境騒音が重畳した音声
    信号が時系列順に与えられるフレーム毎に、当該フレー
    ムに音声が含まれているか否かを判定する音声検出装置
    であって、 電力、零交差率、パワースペクトルのピーク周波数、ピ
    ッチ周期のうち少なくとも一つを用いて音声の特徴量を
    算出する音声特徴量算出手段と、 音声の共振周期の規則性を算出する共振周期の規則性算
    出手段と、 前記音声特徴量算出手段により算出した音声特徴量及び
    規則性算出手段により算出した音声の共振周期の規則性
    を基に、音声か非音声であるかを判定する音声判定手段
    と、 を備えたことを特徴とする音声検出装置。
  3. 【請求項3】 入力信号として環境騒音が重畳した音声
    信号が時系列順に与えられるフレーム毎に、当該フレー
    ムに音声が含まれているか否かを判定する音声検出プロ
    グラムであって、 電力、零交差率、パワースペクトルのピーク周波数、ピ
    ッチ周期のうち少なくとも一つを用いて音声の特徴量を
    算出する音声特徴量算出手順と、 パワースペクトルのピーク周波数の高次成分を強調して
    音声の特徴量を算出する高次成分強調特徴量算出手順
    と、 前記音声特徴量算出手順及び高次成分強調特徴量算出手
    順により算出された特徴量を基に、音声か非音声である
    かを判定する音声判定手順と、 を実行させる音声検出プログラム。
  4. 【請求項4】 入力信号として環境騒音が重畳した音声
    信号が時系列順に与えられるフレーム毎に、当該フレー
    ムに音声が含まれているか否かを判定する音声検出プロ
    グラムであって、 電力、零交差率、パワースペクトルのピーク周波数、ピ
    ッチ周期のうち少なくとも一つを用いて音声の特徴量を
    算出する音声特徴量算出手順と、 音声の共振周期の規則性を算出する共振周期の規則性算
    出手順と、 前記音声特徴量算出手順により算出した音声特徴量及び
    規則性算出手順により算出した音声の共振周期の規則性
    を基に、音声か非音声であるかを判定する音声判定判定
    手順と、 を実行させる音声検出プログラム。
  5. 【請求項5】 入力信号として環境騒音が重畳した音声
    信号が時系列順に与えられるフレーム毎に、当該フレー
    ムに音声が含まれているか否かを判定する音声検出プロ
    グラムであって、 電力、零交差率、パワースペクトルのピーク周波数、ピ
    ッチ周期のうち少なくとも一つを用いて音声の特徴量を
    算出する音声特徴量算出手順と、 パワースペクトルのピーク周波数の高次成分を強調して
    音声の特徴量を算出する高次成分強調特徴量算出手順
    と、 音声の共振周期の規則性を算出する共振周期の規則性算
    出手順と、 前記音声特徴量算出手順により算出した音声特徴量、高
    次成分強調特徴量算出手順により算出した特徴量、及び
    規則性算出手順により算出した音声の共振周期の規則性
    を基に、音声か非音声であるかを判定する音声判定手順
    と、 を実行させる音声検出プログラム。
JP2001055324A 2001-02-28 2001-02-28 音声検出装置及び音声検出プログラム Expired - Fee Related JP3849116B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001055324A JP3849116B2 (ja) 2001-02-28 2001-02-28 音声検出装置及び音声検出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001055324A JP3849116B2 (ja) 2001-02-28 2001-02-28 音声検出装置及び音声検出プログラム

Publications (2)

Publication Number Publication Date
JP2002258881A true JP2002258881A (ja) 2002-09-11
JP3849116B2 JP3849116B2 (ja) 2006-11-22

Family

ID=18915523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001055324A Expired - Fee Related JP3849116B2 (ja) 2001-02-28 2001-02-28 音声検出装置及び音声検出プログラム

Country Status (1)

Country Link
JP (1) JP3849116B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1744304A2 (en) 2003-07-31 2007-01-17 Fujitsu Limited Data embedding device and data extraction device
KR100802984B1 (ko) 2006-11-24 2008-02-14 연세대학교 산학협력단 기준 모델을 이용하여 미확인 신호를 판별하는 방법 및장치
JP2008216618A (ja) * 2007-03-05 2008-09-18 Fujitsu Ten Ltd 音声判別装置
US8457955B2 (en) 2009-09-02 2013-06-04 Fujitsu Limited Voice reproduction with playback time delay and speed based on background noise and speech characteristics
CN107305774A (zh) * 2016-04-22 2017-10-31 腾讯科技(深圳)有限公司 语音检测方法和装置
CN111883183A (zh) * 2020-03-16 2020-11-03 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和***

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5552988B2 (ja) 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
EP2662855A4 (en) 2011-01-04 2015-12-16 Fujitsu Ltd VOICE CONTROL DEVICE, VOICE CONTROL METHOD, AND VOICE CONTROL PROGRAM
EP3823315B1 (en) 2019-11-18 2024-01-10 Panasonic Intellectual Property Corporation of America Sound pickup device, sound pickup method, and sound pickup program

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1744304A2 (en) 2003-07-31 2007-01-17 Fujitsu Limited Data embedding device and data extraction device
US7974846B2 (en) 2003-07-31 2011-07-05 Fujitsu Limited Data embedding device and data extraction device
US8340973B2 (en) 2003-07-31 2012-12-25 Fujitsu Limited Data embedding device and data extraction device
KR100802984B1 (ko) 2006-11-24 2008-02-14 연세대학교 산학협력단 기준 모델을 이용하여 미확인 신호를 판별하는 방법 및장치
JP2008216618A (ja) * 2007-03-05 2008-09-18 Fujitsu Ten Ltd 音声判別装置
US8457955B2 (en) 2009-09-02 2013-06-04 Fujitsu Limited Voice reproduction with playback time delay and speed based on background noise and speech characteristics
CN107305774A (zh) * 2016-04-22 2017-10-31 腾讯科技(深圳)有限公司 语音检测方法和装置
KR20180063282A (ko) * 2016-04-22 2018-06-11 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 음성 검측 방법, 장치 및 기억 매체
JP2018532155A (ja) * 2016-04-22 2018-11-01 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド 音声検出方法、装置及び記憶媒体
KR102037195B1 (ko) 2016-04-22 2019-10-28 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 음성 검측 방법, 장치 및 기억 매체
US10872620B2 (en) 2016-04-22 2020-12-22 Tencent Technology (Shenzhen) Company Limited Voice detection method and apparatus, and storage medium
CN111883183A (zh) * 2020-03-16 2020-11-03 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和***
CN111883183B (zh) * 2020-03-16 2023-09-12 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和***

Also Published As

Publication number Publication date
JP3849116B2 (ja) 2006-11-22

Similar Documents

Publication Publication Date Title
EP0335521B1 (en) Voice activity detection
KR100744352B1 (ko) 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
EP0398180B1 (en) Method of and arrangement for distinguishing between voiced and unvoiced speech elements
KR950000842B1 (ko) 피치 검출기
EP0125423A1 (en) Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
JPH08505715A (ja) 定常的信号と非定常的信号との識別
EP0653091B1 (en) Discriminating between stationary and non-stationary signals
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
JP2002258881A (ja) 音声検出装置及び音声検出プログラム
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
US6954726B2 (en) Method and device for estimating the pitch of a speech signal using a binary signal
US6470311B1 (en) Method and apparatus for determining pitch synchronous frames
Stegmann et al. Robust classification of speech based on the dyadic wavelet transform with application to CELP coding
US20010029447A1 (en) Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor
KR100399057B1 (ko) 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JP3328642B2 (ja) 音声判別装置及び音声判別方法
JP2001022368A (ja) 音声判別装置及び音声判別方法
KR100388488B1 (ko) 유성음 구간에서의 고속 피치 탐색 방법
JPH02266400A (ja) 有音/無音判定回路
AU602957B2 (en) Distance measurement control of a multiple detector system
JPS63237100A (ja) 音声検出器
JPH03290700A (ja) 有音検出装置
EP1143412A1 (en) Estimating the pitch of a speech signal using an intermediate binary signal
Dhanjal OSLP: a new technique in linear prediction of speech

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060818

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130908

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees