JPH08202394A - 音声検出器 - Google Patents

音声検出器

Info

Publication number
JPH08202394A
JPH08202394A JP7011575A JP1157595A JPH08202394A JP H08202394 A JPH08202394 A JP H08202394A JP 7011575 A JP7011575 A JP 7011575A JP 1157595 A JP1157595 A JP 1157595A JP H08202394 A JPH08202394 A JP H08202394A
Authority
JP
Japan
Prior art keywords
voice
frame
power
calculator
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7011575A
Other languages
English (en)
Inventor
Masanori Morohishi
正典 諸菱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP7011575A priority Critical patent/JPH08202394A/ja
Publication of JPH08202394A publication Critical patent/JPH08202394A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】 【目的】音声のパワーを用いて音声信号の有無を検出す
る音声検出器において、無音状態から有音状態に切り替
わる時の語頭切れを無くし、通話の自然性を保ち高品質
の通話を実現する。 【構成】ある固定長のフレーム単位に音声のパワー等を
検出し音声の有無を検出する音声検出器において、離散
化された入力信号から1サンプル毎にある固定長の長さ
の音声パワーを計算する音声パワー算出器10と、音声
パワー算出器10からの出力をフレーム毎に指定された
区間の中で最大の値を検出する最大値検出回路11と、
その最大値検出回路11からの出力を用いて、そのフレ
ームが有音であるか無音であるかを判定する判定回路1
2からなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル音声通信等
に用いる音声の有無を検出する音声検出器に関わる。
【0002】
【従来の技術】近年、携帯電話等の移動体通信では低消
費電力化を図るため、音声の無い区間は送信を中断する
方法(VOX)が用いられている。この方法において
は、音声の有る区間のみ伝送することにより送信電力を
低減しているため、精度の高い音声検出器が望まれてい
る。
【0003】以下、従来の音声検出器について説明す
る。図7は従来の音声検出器を示す図である。図7にお
いて、音声の有無の判定は、ある固定長のフレーム単位
で行われる。1は、そのフレームの音声パワーを算出す
る音声パワー算出器、2はそのフレーム内の零交差率を
測定する零交差率測定器である。零交差率は、パワーが
低く高域のパワーが大きい摩擦性の子音を検出するのに
有効な手段である。3は音声パワー、零交差率からその
フレームが有音であるか無音であるかを判定する判定回
路、4は話尾切れの防止、音声の連続性を維持するため
に有音状態から無音状態で移ったとき、ある一定の時間
有音状態を保持するハングオーバー発生器、5は判定回
路内部で用いる次のフレームのしきい値を決定するしき
い値算出器である。
【0004】以上のような構成により、入力された音声
信号をある固定長、例えば20msec程度のフレーム
毎に音声パワー算出器1により音声パワーが、零交差率
算出器2により零交差率が算出される。判定回路3で
は、音声パワーをある2つのしきい値と比較してそのフ
レームが有音であるか無音であるか、または不定の状態
であるかを判定し、さらに不定の状態であれば、零交差
率により有音であるか無音であるかを判定し有音であれ
ば1、無音であれば0という値をハングオーバー発生器
に対して出力する。ハングオーバー発生器4では、無音
であればそのまま0を、有音であれば1を、また、無音
から有音に切り替わったときは、ある時間長、すなわち
数フレーム1を出力するように動作する。しきい値算出
器5は、判定結果、及び、音声パワーから周囲雑音のパ
ワーレベルを推定し、判定回路11内で音声パワーの判
定に用いる2つのしきい値を設定する。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の音声検出器では、フレーム単位で有音無音を検出
し、その検出に固定長区間のパワーをそのフレームの音
声パワーとしているため、フレームの終わりに話頭がか
かってしまっているような状態は検出しにくく、話頭切
れを生じてしまう問題があった。また、近年のディジタ
ル方式の携帯電話では、そのフレーム単位で音声を符号
化するが、その音声符号化方式VSELP(Vector Sum
Excited Linear Prediction)では、過去の信号から現
在の音声信号を予測により生成しているため、ほんのわ
ずかな話頭切れが音声品質を劣化させてしまうという問
題もある。
【0006】本発明は、上記従来の問題を解決するため
のものであり、音声パワーを用いた音声検出器において
話頭切れを少なくすることのできる優れた音声検出器を
提供することを目的とするものである。
【0007】
【課題を解決するための手段】本発明は上記目的を達成
するために、現在のフレーム区間の音声信号に対してそ
の前後の音声信号を含めた区間に対して、フレームの最
初と最後をずらし音声パワーが最大となる区間の値をそ
のフレームの音声パワーとして判定回路によりしきい値
判定するようにしたものである。
【0008】
【作用】本発明は上記構成により話頭がフレームの後半
にかかっており、そのフレームの音声パワーが大きくな
らないようなフレームに対しても、現在のフレームの前
後のある長さの区間に対して音声パワーを算出し、最大
になる値をそのフレームの音声パワーとすることにより
音声の話頭切れを少なくすることができる。また、この
課程において得られる現在のフレーム区間の音声パワー
をしきい値算出器への入力とすることにより従来と同等
な方法によりしきい値の設定を行うものである。
【0009】
【実施例】以下本発明の実施例について図面を参照しな
がら説明する。図1は本発明を用いた音声検出器であ
り、図3は音声パワーの算出を行う回路の一例であり、
図4は本発明による音声検出器のパワー測定の様子を説
明するための図であり、図5は判定回路の一例、図6は
判定回路の判定規則を説明するための図である。
【0010】以下の説明では、音声検出器に入力される
音声は8kHzでサンプリングされ、2の補数形式でデ
ィジタル化されたものとする。また、20msec、1
60サンプルを1フレームとし、フレーム毎に有音無音
を検出するものとする。
【0011】図1において、10は1サンプル毎に音声
パワーを算出する音声パワー算出器、11はある区間の
中から最大になる値を検出する最大値検出器、13は零
交差率を算出する零交差率算出器、12は零交差率、音
声パワーの最大値から有音無音を判定する判定回路、1
4はハングオーバ発生器である。
【0012】入力される音声は、1サンプル毎に音声パ
ワー算出器10によりある固定長の区間の音声パワーが
求められる。この固定長は、通常フレーム長でもよいが
音声のピッチ周期によりパワーの変動を抑えられればよ
いため最低でもピッチ周期の波形の1周期がはいるよう
な長さを選択すればよく、通常15〜20msec程度
に選べば十分である。今回の場合はフレーム長と同じ1
60サンプル、20msecとして考える。
【0013】図3は音声パワー算出器の具体例を示した
ものであり、1サンプル毎に音声パワーを算出する回路
の一例である。20は入力サンプルの自乗をとる自乗回
路、21はシフトレジスタ、22、23は加算器、24
は1サンプルの遅延器である。入力された音声サンプル
は自乗回路20により1サンプル毎に自乗をとり、シフ
トレジスタ21へ入力されるとともに1サンプル前の音
声パワー値である遅延器24の出力と加算器22により
加算される。そして、パワーを測定する区間分のシフト
レジスタ21より160サンプル前の自乗値を加算器2
3により引くことにより現在のサンプルにおける音声パ
ワー値を音声サンプルの自乗値の移動平均として得る。
また、現在のサンプルの音声パワーは次のサンプルのパ
ワーを求めるために遅延器24へ入力される。
【0014】1サンプル毎に算出された音声パワーは最
大値検出器11に入力される。最大値検出器11では、
図4中31で示される処理対称であるフレーム区間に対
して、32で示される範囲内の音声パワーの最大値を検
出する。この処理対称フレームと音声パワーの測定範囲
のずれ(遅延)はシステムにより許容できる範囲内でと
ればよい。例えばディジタル方式の携帯電話では、音声
符号化方式であるVSELP自体がフレーム処理に先立
ち65サンプル余分に音声サンプルを読み込む必要があ
る。このため、ディジタル方式の携帯電話に本方式を適
用するのであれば31の処理対称フレームと32の音声
パワーの測定範囲のずれを65サンプルとすれば、シス
テム的にここで生じる遅延量はなんら問題を生じない。
【0015】結果的に図4で例示しているような処理対
称フレームの後半に音声部分がかかっているときは、そ
のフレームの後半から次のフレームにかけてのパワーの
大きい音声部分の値がそのフレームの音声パワーとして
選択される。
【0016】これら音声パワーの算出をするとともに、
入力される音声は零交差率算出器13により図4の31
で示されるフレーム区間の零交差率が算出される。零交
差率算出器13は入力された音声サンプルの符号ビット
だけに着目し、隣合うサンプルの符号ビットの違いをカ
ウントするものである。
【0017】最大値検出器11と、零交差率算出器13
の結果は、フレームに一回判定回路12に入力され、処
理対称フレームが有音であるか、無音であるかが判定さ
れ、有音であれば1が、無音であれば0が出力される。
【0018】図5は判定回路の一例であり、40は最大
値検出器11からの出力が、41は零交差率検出器から
の出力が入力され、42、43、44はそれぞれTH
1、TH2、TH3のしきい値と入力を比較し、入力が
しきい値より大きければ1、小さければ0を出力する比
較回路、45は入力を反転するNOTゲート、46は3
つの入力の論理積をとるANDゲート、47は2つの入
力の論理和をとるORゲートである。この判定回路は、
入力された音声パワーが、しきい値TH1より大きけれ
ば出力が1、音声パワーがしきい値TH1より小さく、
しきい値TH2より大きく、また、零交差率がしきい値
TH3より大きい場合は出力が1、それ以外の場合は出
力が0となるように動作する。しきい値TH1、TH2
の値は通常 TH1>TH2 となるように設定される。
【0019】これは、図6に示すように処理対称フレー
ムの音声パワーがしきい値TH1以上では有音、しきい
値TH1以下、しきい値TH2以上であれば不定、しき
い値TH3以下であれば無音と判定し、さらに不定状態
のときは零交差率の値により有音であるか、無音である
かを判定しているものである。ここで、図4で示したよ
うなフレームにおいては、処理対称フレームの実際の音
声パワーがしきい値TH1近辺の値であっても、本発明
によれば判定回路12に入力される音声パワーの値はそ
の処理対象フレームに対して図4で示される音声パワー
測定範囲のうちの有音区間側の値が選択され、その処理
対称フレームの実際の音声パワーより大きな値となるた
め、そのフレームを有音であると判定することができ、
話頭切れを少なくすることができる。
【0020】判定回路の出力は最終的に14のハングオ
ーバ発生器に入力され、処理対称フレームに対して有音
か無音の判定値が出力される。ハングオーバー発生器1
4では、無音であればそのまま0を、有音であれば1
を、また、無音から有音に切り替わったときは、ある時
間長、すなわち数フレーム1を出力するように動作す
る。これは、音声検出器が検出しきれない音声部分の欠
落を防ぐためである。
【0021】図2は本発明の第2の実施例であり、判定
回路12に用いるしきい値を1フレーム毎に可変に設定
することができるようにしたものである。携帯電話等で
は、屋外で使用することが多いため、その周囲雑音を特
定することができない。このため、判定回路内で用いる
しきい値を一定とすると、高雑音下では音声検出器の出
力がすべて有音であるというような結果になってしま
う。このため、しきい値を周囲雑音により適応的に決め
ることが考えられる。
【0022】図2では、本発明の実施例1に対してしき
い値算出回路を設けたものであり、1フレーム毎に最適
なしきい値を設定し、高雑音下でも精度の高い音声検出
を行うようにしたものである。しきい値算出器15以外
は本発明の実施例1と同じ動作をする。ここではしきい
値算出器15の説明をする。また、この場合の周囲雑音
は定常的なものと仮定する。
【0023】しきい値算出器15は、1フレーム毎に音
声パワー算出器10から一定区間の音声パワーの値を入
力し、フレーム毎にそのパワーの変動を監視する。この
変動がある一定時間長、一定値以下であればその区間は
周囲雑音のみの区間であると判定し、その区間の間に入
力された周囲雑音のパワーを推定し判定回路で用いるし
きい値を設定する。
【0024】また、このしきい値算出器15で監視する
時間長は、判定回路12の結果により可変とすることも
考えられる。
【0025】また、音声パワー算出器が1サンプル毎に
音声パワーを算出しているため、その変動をサンプル毎
に監視することができ、さらに精度の高い周囲雑音の推
定を行うことができる。
【0026】
【発明の効果】以上説明してきたように本発明によれ
ば、固定長のフレーム単位で、音声パワーにより有音か
無音であるかを判定する音声検出器において、その音声
パワーの測定範囲をそのフレームの前後に広げ、その範
囲内で測定された最大の値をそのフレームの音声パワー
とすることにより、フレームの後半に音声がかかってお
り、パワーのあまり大きくないようなフレームに対して
も音声の検出ができるため、話頭切れを少なくすること
ができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例における音声検出器のブ
ロック図。
【図2】本発明の第2の実施例における音声検出器のブ
ロック図。
【図3】本実施例における音声パワー算出器の一実施例
を示す図。
【図4】本発明における処理対象フレームと音声パワー
測定範囲を示す図。
【図5】本実施例における判定回路の一実施例を示す
図。
【図6】本実施例における判定回路の判定規則を示す
図。
【図7】従来の音声検出器のブロック図。
【符号の説明】
1 パワー算出器 2 零交差率算出器 3 判定回路 4 ハングオーバ発生器 5 しきい値算出器 10 音声パワー算出器 11 最大値検出器 12 判定回路 13 零交差率算出器 14 ハングオーバ発生器 15 しきい値算出器 20 自乗回路 21 シフトレジスタ 22、23 加算器 24 遅延器 42、43、44 比較回路 45 NOTゲート 46 ANDゲート 47 ORゲート

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】ある固定長のフレーム単位に音声のパワー
    等を検出し音声の有無を検出する音声検出器において、
    離散化された入力信号から1サンプル毎にある固定長の
    音声パワーを測定する音声パワー算出器10と、音声パ
    ワー算出器10の出力をフレーム毎に指定された区間中
    の最大値を検出する最大値検出回路11と、その最大値
    検出回路11の出力を、ある閾値と比較してそのフレー
    ムが有音であるか無音であるかを判定する判定回路12
    とを具備することを特徴とする備える音声検出器。
  2. 【請求項2】前記音声パワー算出器10の出力に基いて
    前記判定回路12の閾値を可変とする閾値算出器15を
    具備することを特徴とする請求項1記載の音声検出器。
JP7011575A 1995-01-27 1995-01-27 音声検出器 Pending JPH08202394A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7011575A JPH08202394A (ja) 1995-01-27 1995-01-27 音声検出器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7011575A JPH08202394A (ja) 1995-01-27 1995-01-27 音声検出器

Publications (1)

Publication Number Publication Date
JPH08202394A true JPH08202394A (ja) 1996-08-09

Family

ID=11781721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7011575A Pending JPH08202394A (ja) 1995-01-27 1995-01-27 音声検出器

Country Status (1)

Country Link
JP (1) JPH08202394A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6088670A (en) * 1997-04-30 2000-07-11 Oki Electric Industry Co., Ltd. Voice detector
JP2008151840A (ja) * 2006-12-14 2008-07-03 Nippon Telegr & Teleph Corp <Ntt> 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置
JP2015207002A (ja) * 2009-10-19 2015-11-19 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声区間検出器及び方法
CN108540680A (zh) * 2018-02-02 2018-09-14 广州视源电子科技股份有限公司 讲话状态的切换方法及装置、通话***

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6088670A (en) * 1997-04-30 2000-07-11 Oki Electric Industry Co., Ltd. Voice detector
JP2008151840A (ja) * 2006-12-14 2008-07-03 Nippon Telegr & Teleph Corp <Ntt> 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置
JP4758879B2 (ja) * 2006-12-14 2011-08-31 日本電信電話株式会社 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置、方法
JP2015207002A (ja) * 2009-10-19 2015-11-19 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声区間検出器及び方法
CN108540680A (zh) * 2018-02-02 2018-09-14 广州视源电子科技股份有限公司 讲话状态的切换方法及装置、通话***

Similar Documents

Publication Publication Date Title
JP4236726B2 (ja) 音声活動検出方法及び音声活動検出装置
FI119085B (fi) Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
JP3297346B2 (ja) 音声検出装置
CN1064771C (zh) 鉴别稳态信号和非稳态信号的装置和方法
JP3273599B2 (ja) 音声符号化レート選択器と音声符号化装置
JP2009545779A (ja) 信号変化検出のためのシステム、方法、および装置
JP2573352B2 (ja) 音声検出装置
US6381568B1 (en) Method of transmitting speech using discontinuous transmission and comfort noise
JPH0713586A (ja) 音声判別装置と音響再生装置
JP2000172283A (ja) 有音検出方式及び方法
KR950702732A (ko) 정상신호와 비정상신호 판별방법 및 장치(Discriminating between stationary and non-stationary signals)
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
JPH08202394A (ja) 音声検出器
JPH11338499A (ja) ノイズキャンセラ
JP3413862B2 (ja) 音声区間検出方法
JPH08305388A (ja) 音声区間検出装置
JP2656069B2 (ja) 音声検出装置
JP4437011B2 (ja) 音声符号化装置
US6157906A (en) Method for detecting speech in a vocoded signal
JPH11133997A (ja) 有音無音判定装置
JP3355473B2 (ja) 音声検出方法
JP2609737B2 (ja) 音声/データ識別器
JPH0832526A (ja) 音声検出器
JPH10301593A (ja) 音声区間検出方法およびその装置
JPH05252121A (ja) 音声符号化処理回路