JPH09152894A - 有音無音判別器 - Google Patents

有音無音判別器

Info

Publication number
JPH09152894A
JPH09152894A JP7312814A JP31281495A JPH09152894A JP H09152894 A JPH09152894 A JP H09152894A JP 7312814 A JP7312814 A JP 7312814A JP 31281495 A JP31281495 A JP 31281495A JP H09152894 A JPH09152894 A JP H09152894A
Authority
JP
Japan
Prior art keywords
frame
power
voiced
sound
subframe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7312814A
Other languages
English (en)
Inventor
Kazuo Nakamura
一雄 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP7312814A priority Critical patent/JPH09152894A/ja
Priority to US08/758,250 priority patent/US5937375A/en
Publication of JPH09152894A publication Critical patent/JPH09152894A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】 【課題】 音声の語頭部分を含むフレームの有音無音を
正確に判定でき、背景騒音が大きい等、悪環境において
も誤判定の少ない有音無音判別器を提供する。 【解決手段】 サブフレーム電力算出部22では、フレ
ームを4分割したサブフレーム毎にサブフレーム電力P
mを算出し、このサブフレーム電力Pmに基づいて、フ
レーム最大電力生成部24では、サブフレーム毎に一つ
前のサブフレーム電力との移動平均(短期平均値)を算
出すると共に、同一フレームを構成するサブフレーム間
で短期平均値を比較し最大のものを該フレームのフレー
ム最大電力Pfとして選択する。これにより、発声がフ
レームの後半から開始されたとしても、フレーム最大電
力Pfが小さく見積られることがなく、該フレームは有
音判定部28にて、確実に有音と判定される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声分析合成系に
おいて入力音声の有音無音を判別する有音無音判別器に
関し、特に、一定時間毎のフレーム単位で音声信号を分
析して得られる符号化データを送受信するデジタル移動
通信において、移動局の連続使用時間を増大させる目的
で行う低消費電力制御のひとつであるVOX(Voice Op
erated Transmitter)制御に適用することを目的とした
有音無音判別器に関する。
【0002】
【従来の技術】従来より、移動体通信網で使用される移
動局は、電源である電池容量の制約から連続通話時間が
有限であるため、様々な低消費電力制御を施して連続通
話時間の延長を図る努力がなされている。
【0003】その中の一つの技術として、通話中の会話
音声の出現頻度が小さいことを利用し、相手の話を聞い
ている場合等、音声を発していない時には、送信回路を
停止することにより消費電力を抑え、通話時間の延長を
図るVOX(Voice OperatedTransmitter)制御が知ら
れている。
【0004】そして、このようなVOX制御を実現する
ためには、送信する音声の有音無音を正確に判定するこ
とが要求されるが、この種の装置として、例えば、特開
平5−323996号公報には、音声信号を所定時間毎
のフレーム単位で高能率符号化する音声符号化器を備え
た送信器において使用され、符号化を行うフレーム単位
で、音声の有音無音を判定する有音無音判定器が開示さ
れている。
【0005】この有音無音判定器では、音声の送信を行
っている有音区間では、各フレーム毎に求めたフレーム
の平均電力と、音声符号化器において音声信号を高能率
符号化する過程で求められ音声の特徴を表すパラメータ
とを用いてフレームの有音無音を判定し、一方、音声の
送信を停止している無音区間では、電力消費の低減のた
めに音声符号化器も停止させているため、フレームの平
均電力のみに基づいてフレームの有音無音を判定するよ
うに構成されている。
【0006】
【発明が解決しようとする課題】しかし、この装置で
は、無音区間でのフレームの有音無音の判定を、フレー
ムの平均電力のみにより行っているため、発声が開始さ
れた時に、語頭切れが発生しやすく、音声の自然性が損
なわれてしまうという問題があった。
【0007】即ち、この種の装置において用いられるフ
レームのサイズは、通常20ms程度と長いため、フレ
ームの後半から発声が開始された場合、音声の語頭部分
を含むフレームの平均電力は小さなものとなるため、無
音フレームと誤判定されやすく、その結果、語頭切れが
生じてしまうのである。
【0008】また、この語頭切れを防止するために、フ
レームの有音無音を判定するしきい値を小さな値に設定
すると、背景騒音の変動等の影響を受け易くなり、無音
フレームを有音フレームであると判定する誤動作が頻発
するようになるため、VOX制御を有効に実施すること
ができないという問題もあった。
【0009】本発明は、上記問題点を解決するために、
音声の語頭部分を含むフレームの有音無音を正確に判定
でき、しかも背景騒音が大きい等、悪環境においても誤
判定の少ない有音無音判別器を提供することを目的とす
る。
【0010】
【課題を解決するための手段】上記目的を達成するため
になされた請求項1に記載の発明においては、基本フレ
ームを所定分割数に分割してなるサブフレーム分だけ音
声信号が入力されると、サブフレーム電力算出手段が、
このサブフレームの電力値であるサブフレーム電力を算
出し、その後、基本フレーム分だけ音声信号が入力され
ると、フレーム最大電力生成手段が、その基本フレーム
を構成するサブフレームの各サブフレーム電力のうち、
最大のものを該基本フレームのフレーム最大電力として
選択する。
【0011】一方、背景騒音電力推定手段では、サブフ
レーム電力算出手段にて算出された最新のサブフレーム
電力を含む、該サブフレーム電力以前に算出された連続
する複数のサブフレーム電力に基づき、背景騒音電力を
推定する。そして、有音無音判別手段が、基本フレーム
毎に、フレーム最大電力と背景騒音電力との差に基づい
て、その有音無音を判別する。
【0012】このように、本発明においては、サブフレ
ーム毎にサブフレーム電力を算出し、同一基本フレーム
を構成するサブフレーム間でこれを比較し、その最大値
をフレーム最大電力として選択して、基本フレームの有
音無音の判定に使用するようにされている。
【0013】従って、本発明の有音無音判定器によれ
ば、基本フレームの後半から発声が開始されたとして
も、その音声信号の電力が基本フレーム全体で平均化さ
れてしまうことがなく、基本フレーム全体に音声信号が
存在する場合と同様に、ほぼ音声信号の電力レベルに即
したフレーム最大電力が得られるため、確実にこれを有
音フレームと判定することができる。その結果、当該有
音無音判定器を、音声を基本フレーム単位で符号化して
送信する送信器に適用した場合に、音声の語頭切れを確
実に防止でき、音声の品質を向上させることができる。
【0014】また、語頭切れ防止のために、フレーム最
大電力と背景騒音電力との差に基づいて有音無音を判定
するためのしきい値を低く設定する必要がないため、無
音を有音と判定する誤判定も確実に減少させることがで
き、有効なVOX制御を実現することができる。
【0015】また、従来装置のように、基本フレーム単
位で処理を行っている場合、基本フレームが大きい程、
有音無音の判定精度は劣化し、語頭切れや誤動作が発生
し易いが、本発明によれば、サブフレームの大きさによ
り、判定精度が決まるため、基本フレームの大きさに関
係なく、判定精度を任意に設定することができる。
【0016】次に、請求項2に記載の発明においては、
フレーム最大電力生成手段は、短期平均値算出手段を備
え、この短期平均値算出手段は、サブフレーム算出手段
にてサブフレーム電力が算出される毎に、該最新のサブ
フレーム電力を含む、該サブフレーム電力以前に算出さ
れた分割数より少ない所定個の連続するサブフレーム電
力に基づき、その平均値である短期平均値を算出する。
【0017】そして、フレーム最大電力生成手段は、サ
ブフレーム電力に代えて、この短期平均値に基づき、フ
レーム最大電力を選択する。つまり、本発明において
は、突発的に振幅の大きなノイズが音声信号に重畳され
ると、その影響を直接受けてしまうサブフレーム電力の
代わりに、サブフレーム電力の移動平均である短期平均
値を使用してフレーム最大電力を求めることにより、こ
のようなノイズの影響を緩和するようにされている。
【0018】従って、本発明の有音無音判別器によれ
ば、突発的なノイズ等の影響による誤判定を確実に低減
することができる。次に、請求項3に記載の発明におい
ては、背景騒音電力推定手段が、長期平均値算出手段と
選択手段とからなり、長期平均値算出手段が、サブフレ
ーム電力算出手段にてサブフレーム電力が算出される
と、この最新のサブフレーム電力を含み、このサブフレ
ーム電力以前に算出された分割数より多い所定個の連続
するサブフレーム電力に基づき、その平均値である長期
平均値を順次算出し、その後、基本フレーム分だけ音声
信号が入力されると、選択手段が、長期平均値算出手段
にて算出された同一基本フレームを構成するサブフレー
ムの各長期平均値のうち、最小のものを該基本フレーム
の背景騒音電力として選択する。
【0019】つまり、本発明においては、背景雑音電力
を複数基本フレームに渡るサブフレーム電力の移動平均
に基づいて求めている。従って、本発明の有音無音判別
器によれば、基本フレームの有音無音を判定する際の基
準レベルとなる背景騒音電力は、突発的なサブフレーム
電力の変動に追従して急激に変化してしまうことがない
ため、基本フレームの有音無音の判定を安定して行うこ
とができる。
【0020】次に、請求項4に記載の有音無音判別器に
おいては、パラメータ抽出手段が、入力音声信号を上記
基本フレーム毎に線形予測分析して、該入力音声信号の
周波数スペクトル包絡線の特徴を表す特徴パラメータを
抽出し、有音無音判別手段では、第1の判定手段が、フ
レーム最大電力と背景騒音電力との電力差が所定の第1
しきい値以上である基本フレームを有音、また、電力差
が第1しきい値より小さい所定の第2しきい値以下であ
る基本フレームを無音と判定し、電力差が第1しきい値
より大きく、且つ第2しきい値より小さい場合には、第
2の判定手段が、パラメータ抽出手段にて抽出される特
徴パラメータに基づき、基本フレームの有音無音を判定
する。
【0021】ところで、一般に、線形予測分析により抽
出される特徴パラメータは、音声信号の周波数スペクト
ル包絡線の特徴を表すものであり、有音時と無音時とで
は夫々互いに異なった特徴的な傾向を示すため、この特
徴パラメータを用いることにより、背景騒音電力の大き
さによらず、有音と無音とをある程度判別し得ることが
知られている。
【0022】そして、本発明においては、フレーム最大
電力と背景騒音電力との差に基づいて、有音無音を判定
する場合に、それ以上であれば、ほぼ確実に有音である
と判定できるようなレベルに第1しきい値を設定し、そ
れ以下であれば、ほぼ確実に無音であると判定できるよ
うなレベルに第2しきい値を設定し、フレーム最大電力
と背景騒音電力との差では、誤判定を起こす可能性の高
いこれらの間の領域において、特徴パラメータによる判
定を行うようにされている。
【0023】従って、本発明の有音無音判別器によれ
ば、背景騒音電力が大きく、フレーム最大電力と背景騒
音電力との差が小さいときであっても、より確実に有音
無音を判定することができ、単に、フレーム最大電力と
背景騒音電力との差に基づいて判定を行う場合に比べ
て、有音無音の判定精度を向上させることができる。
【0024】即ち、特徴パラメータは、基本フレームの
有音無音を確実に判定できるものではないが、背景騒音
電力の大きさによらず、判定が可能であるため、フレー
ム最大電力により判定を下すのが微妙な範囲において、
この特徴パラメータによる判定を補助的に使用すること
により、有音無音の判定精度を効果的に向上させること
ができるのである。
【0025】次に請求項5に記載の有音無音判別器にお
いては、パラメータ抽出手段にて抽出され、第2の判定
手段にて判定に使用される特徴パラメータは、低次の反
射係数であることを特徴とする。ここで、n次の反射係
数rn とは、(1)式に示すように、入力信号のn次の
自己相関Rn を全エネルギー(0次の自己相関)R0 で
正規化したものに相当する。
【0026】
【数1】
【0027】なお、n次の自己相関Rnとは、(2)式
に示すように、離散的に表された音声波形のデータxi
を、n個前のデータxi-n と掛け合わせて、それを全領
域について加算したものである。
【0028】
【数2】
【0029】そして、低次の反射係数は、その分布が有
声音(母音等)と無声音(無声子音や背景騒音等)とで
比較的よく分離していることが知られている。例えば、
1次の反射係数r1の場合を考えると、有声音は、低周
波領域ではっきりしたホルマント構造を持つので、その
一次相関R1 は、全エネルギーR0 と類似の値を示し、
無声音は、周波数スペクトルの偏りを示さないことが多
いため、その一時相関R1 は、小さい値を示す。その結
果、1次の反射係数r1は、有声音の場合、ほぼ1とな
り、無声音の場合、ほぼ0となる。
【0030】更に、無声音には、無声子音と背景騒音と
が含まれるが、これらの周波数スペクトルの概形の差も
1次の反射係数r1に反映され、即ち、周波数スペクト
ルが3〜10kHzの高周波領域に比較的大きな成分を
有し高域強調の特性となる無声子音では、1次の反射係
数r1は+1側に偏り、一方、周波数特性が−9dB/
oct 程度の傾斜を有し低域強調の特性となる背景騒音で
は、1次の反射係数r1は−1側に偏る。
【0031】このように、1次の反射係数r1は、入力
音声信号が有音の場合、即ち有声音や無声子音を含んで
いる場合には+1に近い値となり、入力音声信号が無音
の場合、即ち背景騒音のみの場合には−1に近い値とな
って、よく分離された特徴を示す。
【0032】なお、母音などの有声音も周囲騒音と同様
に低域強調の周波数特性を示すが、通常、背景騒音に比
べて充分に大きなパワーを有しているため、通常は、フ
レーム最大電力と背景騒音電力との差に基づく有音無音
判定で、充分に分離される。従って、このような特徴を
備えた低次の反射係数rnによる有音無音判定を、フレ
ーム最大電力と背景騒音電力との差に基づく有音無音判
定と併用することにより、基本フレームの有音無音の判
定精度を、より向上させることができる。
【0033】次に、請求項6に記載の有音無音判別器に
おいては、区間判定手段が、有音無音判別手段にて有音
と判定された有音フレーム及び無音と判定された無音フ
レームのうち、有音フレームと該有音フレームの後に連
続する所定個以内の無音フレームとを有音区間と判定
し、有音フレームの後に連続する所定個の無音フレーム
の後に、更に連続する無音フレームを無音区間と判定す
る。
【0034】つまり、有音フレームの直後に無音フレー
ムが表れても、すぐにこれを無音区間と判定することは
せず、無音フレームが所定個以上連続した場合に、それ
以降の無音フレームを無音区間と判定するようにされて
おり、会話中の息継ぎ等、発声時における短時間の無音
が、いちいち無音区間として判定される等して、頻繁に
有音区間と無音区間とが切り替わってしまうことがない
ようにされている。
【0035】従って、本発明の有音無音判別器によれ
ば、ここで判定される無音区間/有音区間に基づいてV
OX制御を行う場合に、VOX制御が頻繁に行われるこ
とによる語頭切れ等による違和感を防止できる。また、
有音フレーム直後の無音フレームが欠落することがない
ので、音声の語尾切れを確実に防止できる。
【0036】
【発明の実施の形態】以下に本発明の実施例を図面と共
に説明する。図2は、本実施例の有音無音判別器が適用
された、デジタル方式の自動車電話システムにて用いら
れる移動局の送信部の構成を表すブロック図である。
【0037】図2に示すように、移動局の送信部は、マ
イクを介して入力され電気信号に変換された音声信号を
125μs周期(8kHz)でサンプリングして、16
ビットのデジタルデータXsに変換する入力部10と、
入力部10からのデジタルデータXsを、20ms(1
60データ)毎に区切ったフレーム単位で分析処理して
高能率符号化する音声符号化器12と、入力部10から
入力されるデジタルデータXsに基づき、音声符号化器
12にて処理されたフレームが、音声信号を含む有音フ
レームであるか音声信号を含まない無音フレームである
かを判定し、その判定に基づき、該フレームが有音区間
/無音区間のいずれに属するかを表す判定結果Vを出力
する有音無音判別器14と、音声符号化器12により生
成された符号化データの送信を、有音無音判別器14か
らの判定結果Vに基づき制御する送信制御部16と、送
信制御部16からの制御に従って所定フォーマットの送
信フレームを生成し、アンテナ20を介して送信する送
信器18と、により構成されている。
【0038】ここで、音声符号化器12は、デジタルシ
グナルプロセッサ(DSP)により構成されており、デ
ジタル方式の自動車電話システムの標準規格として定め
られた音声符号化方式である周知のVSELP(Vector
Sum Excited Linear Prediction)方式により音声デー
タを符号化するものである。
【0039】VSELP方式の音声符号化器12では、
音声の高能率符号化技術の基本モデルである声帯(音
源)及び声道からなる音声生成モデルに基づいて、声帯
から発せられる音を模擬した各種音源情報、声道を模擬
した声道等価フィルタを構成するためのフィルタ係数等
を符号化データとして出力する。
【0040】このうち、フィルタ係数は、所定のフレー
ム単位で音声信号を線形予測分析することにより求めら
れる。なお、このフィルタ係数の算出過程において1次
から10次の反射係数が求められ、そのうち1次と2次
の反射係数r1,r2が、有音無音判別器14に入力さ
れる。
【0041】また、音源情報としては、声帯から発せら
れる音を模擬した音源の駆動信号をベクトル量子化し、
これをコードベクトルと呼んで、複数用意されたコード
ベクトルの中から、合成音声のひずみが最小となるよう
なものが選択され出力されるのであるが、このコードベ
クトルが直接送信されるのではなく、これを間接的に指
定する基底ベクトルのインデックスが用いられる。ま
た、音源情報としては、フレームの電力値等も出力され
る。
【0042】次に、送信制御部16は、有音無音判別器
14による判定結果Vが無音区間(V=0)から有音区
間(V=1)に変化すると、送信器18を起動し、送信
開始を予告するための信号として2フレーム分(40m
s)のプリアンブル生成して、送信器18に入力する。
引続き、判定結果Vが有音区間(V=1)である限り、
音声符号化器12からの符号化データを連続して送信器
18に転送する。その後、判定結果Vが有音区間(V=
1)から無音区間(V=0)に変化すると、未送信の符
号化データ(ここでは2フレーム分)があれば、これを
送信器18に転送し、更に、送信停止を予告するための
信号として3フレーム分(60ms)のポストアンブル
生成して送信器18に入力後、送信器18を停止する。
【0043】また、判定結果Vとして無音区間(V=
0)が長時間継続している場合には、50フレーム(1
000ms)毎に送信器18を起動し、ポストアンブル
を生成して送信器18に入力してこれを送信させた後、
再度送信器18を停止する。なお、送信器18は、送信
制御部16からのプリアンブル,符号化データ,パスト
アンブルを、所定の送信符号に変換する等の処理を施し
た上で送信する。図3は、ことのとき、送信器18から
送信される送信フレームの構成を表す説明図である。
【0044】次に、有音無音判別器14は、図1に示す
ように、入力部10からのデジタルデータXsを順次入
力し、音声符号化器12にて符号化される単位のフレー
ムを、更に4分割して5ms(40データ)毎に区切っ
たサブフレーム単位で、そのサブフレーム内の電力Pm
を算出するサブフレーム電力算出部22と、サブフレー
ム電力算出部22にて順次算出されるサブフレーム電力
Pmに基づき、フレーム最大電力Pfを生成するフレー
ム最大電力生成部24と、同じくサブフレーム電力Pm
に基づき推定背景騒音電力Pbを生成する推定背景騒音
電力生成部26と、フレーム最大電力Pf,推定背景騒
音電力Pb,音声符号化器12からの1次及び2次の反
射係数r1,r2に基づき、フレームの有音無音を判定
する有音判定部28と、有音判定部28の判定結果であ
るフレーム状態FSに基づき、符号化データの送信を行
うべき有音区間と、送信を停止すべき無音区間とを判定
する区間判定部30と、により構成されている。
【0045】なお、有音無音判別器14は、CPU,R
OM,RAMを中心に構成された周知のマイクロプロセ
ッサからなり、本実施例においては、音声符号化器12
(DSP)と有音無音判別器14とは同一のワンチップ
のマイクロプロセッサから構成されている。また、有音
無音判別器14を構成している上記サブフレーム電力算
出部22,フレーム最大電力生成部24,推定背景騒音
電力生成部26,有音判定部28,区間判定部30は、
CPU上で実行される処理として実現されている。
【0046】ここで、有音無音判別器14の各部の処理
をフローチャートに沿って説明する。図4は、サブフレ
ーム電力算出部22に相当するサブフレーム電力算出処
理を表すフローチャートである。本処理は、入力部10
にて入力音声信号がサンプリングされる毎、即ち125
μs周期で起動される。
【0047】なお、本処理にて使用される各変数Ps,
nは、当該有音無音判別器14への電源投入直後に実行
される初期化処理にて0クリアされているものとする。
本処理が起動されると、まず、ステップ110では、入
力部10からのデジタルデータXs2 を変数Psに加算
することにより、デジタルデータXs2 の累積値、即
ち、信号電力の積分値を求め、続くステップ120で
は、デジタルデータXs2 の加算回数を表すカウント値
nをインクリメントしてステップ130に進む。
【0048】ステップ130では、カウント値nが、1
サブフレームに相当する値Nsmpl(本実施例では、4
0)より小さいか否かを判断し、小さければそのまま本
処理を終了する。一方、カウント値nが比較値Nsmplに
達している場合には、1サブフレームの電力の算出が終
了したものとしてステップ140に移行し、デジタルデ
ータXs2 の累積値、即ちサブフレーム電力Psを所定
のバッファに格納する。
【0049】なお、バッファは、リングバッファ形式で
構成されており、常に、最新のサブフレーム電力Ps
が、後述する長期平均値を算出するのに必要な所定個N
buffだけ記憶されるようにされている。続くステップ1
50では、次のサブフレームの処理に備えるために累積
値Ps,カウント値nを0クリアし、続くステップ16
0では、フレーム最大電力生成部24,推定背景騒音電
力生成部26に相当する背景騒音電力,フレーム最大電
力算出処理を起動して本処理を終了する。
【0050】次に、図5は、背景騒音電力,フレーム最
大電力算出処理を表すフローチャートである。本処理
は、先のサブフレーム電力算出処理により、1サブフレ
ームのサブフレーム電力の算出が終了する毎、即ちサブ
フレーム間隔(5ms)で周期的に起動される。
【0051】なお、本処理において使用される変数i,
jは、現在処理中のフレームi、及びサブフレームjを
識別するための変数であり、先のサブフレーム電力算出
処理における変数と同様に、初期化処理にて0クリアさ
れているものとする。図5に示すように、本処理が起動
されると、まず、ステップ210にて、(2)式に基づ
き、サブフレーム電力の長期平均値PAL(i,j)が算出
され、続くステップ220では、(3)式に基づき、サ
ブフレーム電力の短期平均値PAS(i,j)が算出され
る。
【0052】
【数3】
【0053】
【数4】
【0054】なお、Pm(k)は、先のステップ140に
て、バッファに格納されたサブフレーム電力値であり、
今回算出された最新のサブフレーム電力値をPm(0),
k回前に算出されたサブフレーム電力値をPm(k)とす
る。
【0055】即ち、サブフレーム電力の長期平均値PAL
(i,j)とは、図6に示すように、サブフレーム電力算
出処理にて算出された最新のサブフレーム電力値を含
む、この最新のサブフレーム以前の算出された連続する
所定個Nb(本実施例では16個)のサブフレーム電力
値の平均値のことであり、一方、サブフレーム電力の短
期平均値PAS(i,j)とは、最新のサブフレーム電力値
を含む、この最新のサブフレーム電力値以前に算出され
た連続する所定個Nf個(本実施例では2個)のサブフ
レーム電力値の平均値のことであり、いずれも、サブフ
レーム電力値の移動平均を算出するものである。
【0056】続くステップ230では、変数jをインク
リメントしてステップ240に進む。ステップ240で
は、変数jが、1フレーム内のサブフレーム数Nsf(こ
こでは4)より小さいか否かを判断し、小さければ1フ
レーム分の処理はまだ終了していないものとして、本処
理を終了する。一方、変数jがサブフレーム数Nsfに達
していれば、1フレーム分の処理が終了したものとし
て、ステップ250に移行し、(4)式に基づき、当該
フレームを構成する各サブフレーム毎に算出された長期
平均値PAL(i,j)のうち、最小のものを当該フレーム
における背景騒音電力Pb(i)として算出し、続くステ
ップ260では、(5)式に基づき、短期平均値PAS
(i,j)のうち、最大のものを当該フレームにおけるフ
レーム最大電力Pf(i)として算出する。
【0057】
【数5】
【0058】
【数6】
【0059】続くステップ270では、フレームを識別
する変数iをインクリメントすると共に、サブフレーム
を識別する変数jを0クリアする。続くステップ280
では、有音判定部28に相当する有音無音判定処理を起
動して、本処理を終了する。
【0060】次に、図7は、有音無音判定処理を表すフ
ローチャートである。本処理は、背景騒音電力,フレー
ム最大電力算出処理により、1フレームの背景騒音電
力,フレーム最大電力が算出される毎、即ちフレーム間
隔(20ms)で周期的に起動される。
【0061】図7に示すように、本処理が起動される
と、まずステップ310にて、フレーム最大電力Pf
(i)が、背景騒音電力Pb(i)に第1しきい値TH1
(本実施例では50)を加えた比較値以上であるか否か
を判断し、比較値以上であればステップ360に移行
し、比較値より小さければステップ320に移行する。
【0062】ステップ320では、フレーム最大電力P
f(i)が、背景騒音電力Pb(i)に第2しきい値TH2
(本実施例では30)を加えた比較値以上であるか否か
を判断し、比較値以上であればステップ330に移行
し、比較値より小さければステップ350に移行する。
【0063】ステップ330では、音声符号化器12に
て、iフレームを線形予測分析することにより算出され
た1次の反射係数r1(i) が、第3しきい値TH3
(本実施例では0.7)以上であるか否かを判断し、第
3しきい値TH3以上であれば、ステップ360に移行
し、第3しきい値TH3より小さければステップ340
に移行する。
【0064】ステップ340では、2次の反射係数r2
(i) が、第4しきい値TH4以下であるか否かを判断
し、第4しきい値TH4(本実施例では0.3)以下で
あればステップ360に移行し、第4しきい値TH4よ
り大きければステップ350に移行する。
【0065】そして、ステップ350では、フレームの
有音無音の判定結果を表す変数FSを無音を表す値(F
S=0)に設定してステップ370に進み、一方、ステ
ップ360では、変数FSを有音を表す値(FS=1)
に設定してステップ370に進む。
【0066】ステップ370では、区間判定部30に相
当する区間判定処理を実行して、本処理を終了する。即
ち、フレーム最大電力Pf(i)が、背景騒音電力Pb
(i)に、第1しきい値TH1を加算した値以上である場
合には、このフレームを有音であると判定し、フレーム
最大電力Pf(i)が、背景騒音電力Pb(i)に第2しき
い値TH2(<TH1)を加算した値より小さい場合に
は、このフレームを無音であると判定する。そして、フ
レーム最大電力Pf(i)が、これらの中間の大きさであ
る時には、1次の反射係数r1(i)が第3しきい値TH
3以上であるか、2次の反射係数r2(i)が第4しきい
値TH4以下である場合に、このフレームを有音である
と判定し、それ以外の場合を無音であると判断する。
【0067】なお、各値は16ビットで表されるものと
する。次に、区間判定処理の処理を、図8に示す状態遷
移図を用いて説明する。なお、本処理は、先の有音無音
判定処理により設定されたフレーム状態FSに基づき、
有音状態、保留状態、無音状態の3状態の間で状態を遷
移させ、これら状態に応じて、有音区間/無音区間を表
す判定結果Vを設定するものである。
【0068】まず、有音状態とは、前回処理されたフレ
ームが有音(FS=1)であった場合であり、この状態
では、判定結果Vは有音区間を表す値(V=1)に設定
されている。そして、新たに処理されたフレームが、有
音無音判定処理にて有音(FS=1)と判定された場合
は、そのまま有音状態に留まる。一方、新たに処理され
たフレームが、無音(FS=0)と判定された場合は、
保留状態に遷移すると共に、無音フレームカウンタC
に、所定値Nwait(本実施例では、20)を設定する。
なお、この保留状態では、判定結果Vは、有音状態と同
様に有音区間を表す値(V=1)に保持される。
【0069】そして、保留状態では、新たに処理された
フレームが有音と判定された場合は、有音状態に遷移す
る。一方、無音と判定された場合は、無音フレームカウ
ンタCをデクリメントし、その値が0でない時には、そ
のまま保留状態に留まり、0の時には、判定結果Vを無
音区間を表す値(V=0)に設定して無音状態に遷移す
る。
【0070】この無音状態では、新たに処理されたフレ
ームが無音と判定された場合は、そのまま無音状態に留
まり、一方、有音と判定された場合は、判定結果Vを有
音区間を表す値(V=1)に設定して有音状態に遷移す
る。即ち、本処理においては、有音状態及び保留状態が
有音区間(V=1)、無音状態が無音区間(V=0)と
判定され、これに応じて判定結果Vが設定される。
【0071】そして、無音区間にある時には、有音フレ
ームを一つ受信すると、直ちに有音区間と判定され、一
方、有音区間にある時には、無音フレームを20個以上
連続して受信した場合、即ち、無音が400ms以上継
続した場合に無音区間と判定される。
【0072】このようにして、判定された有音区間/無
音区間の判定結果Vが、送信制御部16に入力されるこ
とにより、先に説明したように、送信器18の起動/停
止、及び符号化データの送信が制御される。ここで、図
9,10,11は、静かな室内で、約2秒間隔で発声し
た音声に、走行中の車両の車室内で録音した騒音をS/
N比15dBで重畳したものを入力音声として、シミュ
レーションを行った結果を表す波形図である。
【0073】このうち、図9は、有音無音判別器14に
て算出されるフレーム最大電力Pf、フレーム最大電力
Pfと背景騒音電力Pbとの差Pf−Pbと、音声符号
化器12にて算出される1次及び2次の反射係数r1,
r2と、有音無音判別器14の出力である判定結果Vと
を表す波形図である。横軸は、時間で、縦軸は夫々符号
付き16ビット整数表現した時の値である。
【0074】図に示すように、発声に基づく音声信号の
存在しない区間では、1次の反射係数r1は、−1に近
いほぼ一定値となり、また、2次の反射係数r2は、+
1に近いほぼ一定値となる。一方、音声信号の存在する
区間では、反射係数r1,r2は大きく変動し、音声信
号の有無により顕著に異なる特性がよく表れている。
【0075】また、フレーム最大電力Pfと背景騒音電
力Pbとの差は、発声されていない区間では、比較的小
さな値で変化し、発声の始端では、急激に値が増大す
る。このような特性を有するフレーム最大電力Pfと背
景騒音電力Pbとの差と、反射係数r1,r2に基づい
て、有音無音が判定された結果、発声に基づく音声信号
の存在する区間は、確実に有音区間(V=1)と判定さ
れている。
【0076】図10において、(a)は入力音声信号X
s、(b)(c)は判定結果Vと送信制御部16の制御
状態とを表したものであり、特に(b)は本実施例によ
る有音無音判別器14を用いた場合、(c)は1次及び
2次の反射係数r1,r2を用いることなく、フレーム
最大電力Pfと背景雑音電力Pbとの差が、第2しきい
値TH2以上であれば有音、第2しきい値TH2より小
さければ無音とする有音無音判定器を用いた場合であ
る。
【0077】なお、送信状態の表示は、3が符号データ
を送信している状態、0が送信を停止している状態、
1,2はプリアンブルを送信している状態、−3,−
2,−1はポストアンブルを送信している状態に対応す
る。また、無音中に、周期的に送信されるポストアンブ
ルは、有音無音判定によるものではなく、先に説明した
ように、無音区間にて1000msに1回の割合で送信
されるものである。
【0078】図10に示すように、フレームの電力値の
みで判定を行っている(c)では、背景騒音だけが入力
されている区間の数カ所で、有音区間と誤判定されてい
るが、本実施例の(b)では、背景騒音だけが入力され
ている区間は、確実に無音区間と判定されている。
【0079】図11は、図10の2番目の発声の先頭部
分を拡大したものである。図11に示すように、iフレ
ームの途中から発声が開始されているのであるが、その
フレーム最大電力Pfは、サブフレーム毎に求められた
サブフレーム電力の短期平均値PASの中から、最大のも
のが選択されている。このため、フレーム最大電力Pf
としては、充分に大きな値が得られ、このiフレームは
確実に有音フレームと判定される。
【0080】以上説明したように、本実施例において
は、有音無音判別器14が、音声信号Xsが符号化され
る単位であるフレームを更に分割したサブフレーム毎に
そのサブフレーム電力を算出し、更に、このサブフレー
ム毎に一つ前のサブフレーム電力との移動平均(短期平
均値)PALを算出し、同一フレームを構成するサブフレ
ーム間でこの短期平均値PALを比較して、最大のものを
該フレームのフレーム最大電力Pfとし、このフレーム
最大電力Pfに基づいて、該フレームの有音無音を判定
するようにされている。
【0081】従って、本実施例によれば、発声がフレー
ムの後半から開始されたとしても、そのフレームのフレ
ーム最大電力Pfは、ほぼ音声信号の電力レベルに即し
たものとなるため、このような場合にも、確実に有音フ
レームであると判断することができ、その結果、語頭が
含まれたフレームの欠落による語頭切れを確実に防止で
き、優れた通話品質を確保することができる。
【0082】また、本実施例によれば、フレーム最大電
力Pf及び背景騒音電力Pbをサブフレーム電力の移動
平均により求めているので、突発的なノイズが重畳され
たとしても、その影響を緩和することができ、ノイズに
よる誤判定を防止できる。また更に、各フレームの有音
無音の判定を、そのフレーム最大電力Pfと背景騒音電
力Pbとの差だけによらず、周波数スペクトルの包絡形
状の相違が反映される一次及び2次の反射係数r1,r
2を用いて行っているので、背景騒音が大きく、フレー
ム最大電力Pfと背景騒音電力Pbとの差からでは判定
が困難な場合であっても、確実に有音無音を判定でき
る。
【0083】そして、このように、フレームの有音無音
を正確に判定できることにより、効果的にVOX制御を
行うことができる。即ち、無音区間において、無音フレ
ームを有音フレームとしてしまう誤判定が発生すると、
直ちに有音区間に遷移して、送信制御部16により、送
信器18が起動され、無駄な電力が消費されてしまうこ
とになるが、このようなことを確実に防止できるのであ
る。
【0084】また、本実施例では、有音区間において、
無音フレームが検出されても、直ちに無音区間に変化す
るのではなく、所定フレーム以上連続して無音フレーム
を検出した場合に、無音区間に変化するようにされてい
る。従って、本実施例によれば、会話中の息継ぎ等、短
い無音状態が無音区間と判断されることがなく、有音区
間/無音区間の変化時に実施されるVOX制御のための
処理に基づく音声の欠落を防止することができる。即
ち、本実施例のシステムでは、VOX制御によって送信
器18を停止/起動することを、受信側に通知するため
に、有音区間から無音区間に変化した場合には3フレー
ム分のポストアンブルを、逆に無音区間から有音区間に
変化した場合には2フレーム分のプリアンブルを送信す
るようにされているため、一旦、有音区間から無音区間
に変化すると、その直後にまた有音区間に変化したとし
ても、ポストアンブル、プリアンブルの送信により、最
低5フレーム(100ms)は、音声を送信することが
できず、その間に発生した音声は欠落してしまうのであ
るが、息継ぎのような短時間の無音状態は、これを無音
区間として処理するのではなく、有音区間として処理す
ることにより、このような音声の欠落を防止できるので
ある。
【0085】なお、上記実施例では、1次及び2次の反
射係数を使用しているが、1次の反射係数のみ、或は2
次の反射係数のみを使用したり、3次以上の反射係数を
併用してもよい。また、上記実施例では、フレームが2
0msであるが、より長いフレーム(例えば40ms)
を使用する場合に適用してもよく、この場合、サブフレ
ームの大きさが同じであれば、同じ精度で語頭切れを防
止できる。
【図面の簡単な説明】
【図1】 本実施例の有音無音判別器の構成を表すブロ
ック図である。
【図2】 本実施例の有音無音判別器が適用された自動
車電話システムに用いられる移動局の送信部の構成を表
すブロック図である。
【図3】 送信制御部にて生成される送信フレームの構
成を表す説明図である。
【図4】 サブフレーム電力算出処理を表すフローチャ
ートである。
【図5】 背景騒音電力、フレーム最大電力算出処理を
表すフローチャートである。
【図6】 背景騒音電力、フレーム最大電力の説明図で
ある。
【図7】 有音無音判定処理を表すフローチャートであ
る。
【図8】 区間判定処理を説明するための状態遷移図で
ある。
【図9】 有音無音判別器各部の信号波形を表す波形図
である。
【図10】 有音無音判別器の判定結果,及び送信制御
部の動作状態を表す説明図である。
【図11】 無音から有音への変化時におけるフレーム
最大電力の算出結果を表す説明図である。
【符号の説明】
10…入力部 12…音声符号化器 14…有音無
音判別器 16…送信制御部 18…送信器 20…アンテ
ナ 22…サブフレーム電力算出部 24…フレーム最大
電力生成部 26…推定背景騒音電力生成部 28…有音判定部
30…区間判定部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号を所定時間毎の基本フレー
    ム単位に分割し、該基本フレーム毎に有音無音を判別す
    る有音無音判別器であって、 上記音声信号が、上記基本フレームを更に所定分割数に
    分割したサブフレーム分だけ入力される毎に、該サブフ
    レームの電力値であるサブフレーム電力を順次算出する
    サブフレーム電力算出手段と、 上記音声信号が、上記基本フレーム分だけ入力される毎
    に、上記サブフレーム電力算出手段にて算出された該基
    本フレームを構成するサブフレームの各サブフレーム電
    力のうち、最大のものを該基本フレームのフレーム最大
    電力とするフレーム最大電力生成手段と、 上記サブフレーム電力算出手段にて算出された最新のサ
    ブフレーム電力を含む、該サブフレーム電力以前に算出
    された連続する複数のサブフレーム電力に基づき、背景
    騒音電力を推定する背景騒音電力推定手段と、 上記フレーム最大電力と上記背景騒音電力との差に基づ
    き、上記基本フレームの有音無音を判別する有音無音判
    別手段と、 を備えることを特徴とする有音無音判別器。
  2. 【請求項2】 上記フレーム最大電力生成手段は、 上記サブフレーム算出手段にてサブフレーム電力が算出
    される毎に、該最新のサブフレーム電力を含む、該サブ
    フレーム電力以前に算出された上記分割数より少ない所
    定個の連続するサブフレーム電力に基づき、その平均値
    である短期平均値を算出する短期平均値算出手段を備
    え、 上記サブフレーム電力に代えて上記短期平均値が最大の
    ものをフレーム最大電力とすることを特徴とする請求項
    1に記載の有音無音判別器。
  3. 【請求項3】 上記背景騒音電力推定手段は、 上記サブフレーム電力算出手段にてサブフレーム電力が
    算出される毎に、該最新のサブフレーム電力を含む、該
    サブフレーム電力以前に算出された上記分割数より多い
    所定個の連続するサブフレーム電力に基づき、その平均
    値である長期平均値を算出する長期平均値算出手段と、 上記音声信号が、上記基本フレーム分だけ入力される毎
    に、上記長期平均値算出手段にて算出された該基本フレ
    ームを構成するサブフレームの各長期平均値のうち、最
    小のものを該基本フレームの背景騒音電力とする選択手
    段と、 により構成されていることを特徴とする請求項1または
    請求項2に記載の有音無音判別器。
  4. 【請求項4】 請求項1ないし請求項3のいずれかに記
    載の有音無音判別器において、 更に、上記入力音声信号を上記基本フレーム毎に線形予
    測分析して、該入力音声信号の周波数スペクトル包絡線
    の特徴を表す特徴パラメータを抽出するパラメータ抽出
    手段を備え、 上記有音無音判別手段は、 上記フレーム最大電力と上記背景騒音電力との電力差が
    所定の第1しきい値以上である基本フレームを有音、上
    記電力差が上記第1しきい値より小さい所定の第2しき
    い値以下である基本フレームを無音と判定する第1の判
    定手段と、 上記電力差が第1しきい値より大きく、且つ第2しきい
    値より小さい場合に、上記パラメータ抽出手段にて抽出
    される特徴パラメータに基づき、上記基本フレームの有
    音無音を判定する第2の判定手段と、 により構成されていることを特徴とする有音無音判別
    器。
  5. 【請求項5】 請求項4に記載の有音無音判別器におい
    て、 上記パラメータ抽出手段にて抽出され、上記第2の判定
    手段にて判定に使用される特徴パラメータは、低次の反
    射係数であることを特徴とする有音無音判別器。
  6. 【請求項6】 請求項1ないし請求項5のいずれかに記
    載の有音無音判別器において、 更に、上記有音無音判別手段にて有音と判定された有音
    フレーム及び無音と判定された無音フレームのうち、有
    音フレームと該有音フレームの後に連続する所定個以内
    の無音フレームとを有音区間と判定し、有音フレームの
    後に連続する所定個の無音フレームの後に、更に連続す
    る無音フレームを無音区間と判定する区間判定手段を備
    えたことを特徴とする有音無音判別器。
JP7312814A 1995-11-30 1995-11-30 有音無音判別器 Pending JPH09152894A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7312814A JPH09152894A (ja) 1995-11-30 1995-11-30 有音無音判別器
US08/758,250 US5937375A (en) 1995-11-30 1996-11-27 Voice-presence/absence discriminator having highly reliable lead portion detection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7312814A JPH09152894A (ja) 1995-11-30 1995-11-30 有音無音判別器

Publications (1)

Publication Number Publication Date
JPH09152894A true JPH09152894A (ja) 1997-06-10

Family

ID=18033739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7312814A Pending JPH09152894A (ja) 1995-11-30 1995-11-30 有音無音判別器

Country Status (2)

Country Link
US (1) US5937375A (ja)
JP (1) JPH09152894A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000079516A1 (fr) * 1999-06-23 2000-12-28 Nec Corporation Dispositif et procede de determination de trames voisees/non voisees
JP2002261553A (ja) * 2001-03-02 2002-09-13 Ricoh Co Ltd 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
US6629070B1 (en) 1998-12-01 2003-09-30 Nec Corporation Voice activity detection using the degree of energy variation among multiple adjacent pairs of subframes
WO2005124739A1 (ja) * 2004-06-18 2005-12-29 Matsushita Electric Industrial Co., Ltd. 雑音抑圧装置および雑音抑圧方法
US7308080B1 (en) 1999-07-06 2007-12-11 Nippon Telegraph And Telephone Corporation Voice communications method, voice communications system and recording medium therefor
JP2008058983A (ja) * 2000-08-21 2008-03-13 Conexant Systems Inc 音声コーディングにおける雑音のロバストな分類のための方法
WO2009078093A1 (ja) * 2007-12-18 2009-06-25 Fujitsu Limited 非音声区間検出方法及び非音声区間検出装置
JP2010176145A (ja) * 2000-12-08 2010-08-12 Qualcomm Inc ロバストな音声分類のための方法および装置
JP4773521B2 (ja) * 2006-08-22 2011-09-14 株式会社エヌ・ティ・ティ・ドコモ 無線リソース開放制御方法、無線基地局および移動局

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6122531A (en) * 1998-07-31 2000-09-19 Motorola, Inc. Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode
US6314396B1 (en) * 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
US6980950B1 (en) * 1999-10-22 2005-12-27 Texas Instruments Incorporated Automatic utterance detector with high noise immunity
US6741873B1 (en) * 2000-07-05 2004-05-25 Motorola, Inc. Background noise adaptable speaker phone for use in a mobile communication device
DE10121532A1 (de) * 2001-05-03 2002-11-07 Siemens Ag Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale
WO2002093552A1 (en) * 2001-05-11 2002-11-21 Koninklijke Philips Electronics N.V. Estimating signal power in compressed audio
KR100463657B1 (ko) * 2002-11-30 2004-12-29 삼성전자주식회사 음성구간 검출 장치 및 방법
US8219392B2 (en) * 2005-12-05 2012-07-10 Qualcomm Incorporated Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
EP2107553B1 (en) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
KR101251045B1 (ko) * 2009-07-28 2013-04-04 한국전자통신연구원 오디오 판별 장치 및 그 방법
JP2016038513A (ja) * 2014-08-08 2016-03-22 富士通株式会社 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム
CN109935240A (zh) * 2017-12-18 2019-06-25 上海智臻智能网络科技股份有限公司 通过语音识别情绪的方法
CN109935241A (zh) * 2017-12-18 2019-06-25 上海智臻智能网络科技股份有限公司 语音信息处理方法
CN109961803A (zh) * 2017-12-18 2019-07-02 上海智臻智能网络科技股份有限公司 语音情绪识别***

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4351983A (en) * 1979-03-05 1982-09-28 International Business Machines Corp. Speech detector with variable threshold
US5016205A (en) * 1989-04-27 1991-05-14 Motorola, Inc. Digital signal processor based AGC
JP3277398B2 (ja) * 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
JPH05323996A (ja) * 1992-05-27 1993-12-07 Nippon Telegr & Teleph Corp <Ntt> 有音無音判定法
JP3166797B2 (ja) * 1992-08-28 2001-05-14 株式会社日立国際電気 音声符号化法及び音声復号化法並びに音声符復号化装置
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6629070B1 (en) 1998-12-01 2003-09-30 Nec Corporation Voice activity detection using the degree of energy variation among multiple adjacent pairs of subframes
EP1217607A1 (en) * 1999-06-23 2002-06-26 NEC Corporation Voice/voiceless frame judging device and judging method therefor
EP1217607A4 (en) * 1999-06-23 2005-05-04 Nec Corp DEVICE AND METHOD FOR DETERMINING VOIDED / NON-VOIDED FRAMES
WO2000079516A1 (fr) * 1999-06-23 2000-12-28 Nec Corporation Dispositif et procede de determination de trames voisees/non voisees
US7308080B1 (en) 1999-07-06 2007-12-11 Nippon Telegraph And Telephone Corporation Voice communications method, voice communications system and recording medium therefor
JP2008058983A (ja) * 2000-08-21 2008-03-13 Conexant Systems Inc 音声コーディングにおける雑音のロバストな分類のための方法
JP2010176145A (ja) * 2000-12-08 2010-08-12 Qualcomm Inc ロバストな音声分類のための方法および装置
JP2002261553A (ja) * 2001-03-02 2002-09-13 Ricoh Co Ltd 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
JP4548953B2 (ja) * 2001-03-02 2010-09-22 株式会社リコー 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
WO2005124739A1 (ja) * 2004-06-18 2005-12-29 Matsushita Electric Industrial Co., Ltd. 雑音抑圧装置および雑音抑圧方法
US8537666B2 (en) 2006-08-22 2013-09-17 Ntt Docomo, Inc. Radio resource release controlling method, radio base station, and mobile station
JP4773521B2 (ja) * 2006-08-22 2011-09-14 株式会社エヌ・ティ・ティ・ドコモ 無線リソース開放制御方法、無線基地局および移動局
WO2009078093A1 (ja) * 2007-12-18 2009-06-25 Fujitsu Limited 非音声区間検出方法及び非音声区間検出装置
JP5229234B2 (ja) * 2007-12-18 2013-07-03 富士通株式会社 非音声区間検出方法及び非音声区間検出装置
US8326612B2 (en) 2007-12-18 2012-12-04 Fujitsu Limited Non-speech section detecting method and non-speech section detecting device
US8798991B2 (en) 2007-12-18 2014-08-05 Fujitsu Limited Non-speech section detecting method and non-speech section detecting device

Also Published As

Publication number Publication date
US5937375A (en) 1999-08-10

Similar Documents

Publication Publication Date Title
JPH09152894A (ja) 有音無音判別器
AU763409B2 (en) Complex signal activity detection for improved speech/noise classification of an audio signal
EP1328928B1 (en) Apparatus for bandwidth expansion of a speech signal
KR100675126B1 (ko) 향상된 충실도를 위해 안락 잡음 가변특성을 가지는 음성코딩
JP4444749B2 (ja) 減少レート、可変レートの音声分析合成を実行する方法及び装置
EP0785541B1 (en) Usage of voice activity detection for efficient coding of speech
EP0814458A2 (en) Improvements in or relating to speech coding
CA2235455A1 (en) Method and apparatus for speech enhancement in a speech communication system
US6424942B1 (en) Methods and arrangements in a telecommunications system
US8144862B2 (en) Method and apparatus for the detection and suppression of echo in packet based communication networks using frame energy estimation
JP2000172283A (ja) 有音検出方式及び方法
JP3223966B2 (ja) 音声符号化/復号化装置
EP1112568B1 (en) Speech coding
US6240383B1 (en) Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
EP1619665B1 (en) Voice coding apparatus and method using PLP in mobile communications terminal
JP3055608B2 (ja) 音声符号化方法および装置
JPH07281689A (ja) 音声信号伝送装置
JPH08171400A (ja) 音声符号化装置
JPH07135490A (ja) 音声検出器及び音声検出器を有する音声符号化器
JPS5854399B2 (ja) 音声分析合成系のピツチ周波数伝送方式
JPH02203399A (ja) 音声符号化方式

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041124