JPH0563579A - 音声検出器 - Google Patents

音声検出器

Info

Publication number
JPH0563579A
JPH0563579A JP3246445A JP24644591A JPH0563579A JP H0563579 A JPH0563579 A JP H0563579A JP 3246445 A JP3246445 A JP 3246445A JP 24644591 A JP24644591 A JP 24644591A JP H0563579 A JPH0563579 A JP H0563579A
Authority
JP
Japan
Prior art keywords
pitch
voice
absence
pattern
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3246445A
Other languages
English (en)
Other versions
JP3291009B2 (ja
Inventor
Osamu Watanabe
治 渡辺
Masayasu Miyake
正泰 三宅
Masashi Naito
昌志 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Electric Corp
Original Assignee
Kokusai Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Corp filed Critical Kokusai Electric Corp
Priority to JP24644591A priority Critical patent/JP3291009B2/ja
Publication of JPH0563579A publication Critical patent/JPH0563579A/ja
Application granted granted Critical
Publication of JP3291009B2 publication Critical patent/JP3291009B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 波形符号化方式の音声符号化回路に付加てさ
れる音声検出器の回路規模を小さくし、処理量を軽減す
る。 【構成】 ピッチ予測型適応変換符号化回路のピッチ予
測器2から得られる予測パラメータ(3)に含まれるピ
ッチ成分情報からその有無を判定する判定器12と、最
適パターン選択器7から得られるパターン選択情報(1
5)を監視してスペクトラム変動情報(16)を出力す
る監視器(13)と、それらの出力からブロック毎に音
声有無を判定しそのいずれかを示す情報(17)を出力
する音声有無判定器14とを備えたことを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声符号化方式を適用
した無線通信機に用いられ、音声のないとき送信を断に
して消費電力を低減するために、フレーム単位に送信通
話音声の有無を検出する音声検出器に関する。
【0002】
【従来の技術】携帯型の無線機等では、消費電力を低減
するために音声がある時のみ送信し、音声がないときに
は送信を断にするいわゆるVOX(VoiceOperate Switch
Exchange) 制御が使用されており、この制御により送
信時の平均消費電力を約50%削減することができる。
このようなVOX機能を実現するためには、送信側にお
いて音声信号の有無を検出する必要があり、このような
機能をもつ回路をここでは音声検出器という。
【0003】本発明の音声検出器は、ピッチ予測型適応
変換符号化(Pitch Predictive Coder Using Adaptive
Tronsform Coding:PP−ATC)方式の符号化回路に
適用される。このPP−ATC方式は音声信号の波形符
号化方式の一つであり、音声信号を16〜32msのブ
ロックに分割し、ピッチ予測器の出力である予測残差信
号を周波数領域に直交変換し、得られた変換係数を適応
的に符号化して伝送する方式である。直交変換には通常
DCT(Discrete Cosine Transform)と呼ばれる離散的
余弦変換が用いられる。又、適応的な量子化は、通常予
め定められた少なくとも3つ以上の変換係数選択パター
ンの中の最適のパターンにより係数の間引きが行われ、
選択した係数について符号化が行われる。
【0004】この変換係数選択パターンは、周波数の低
い方にパワー(絶対値)の大きい変換係数が集中してい
るときに選択される低域集中型、帯域全体にパワーが分
散しているときに選択される広帯域分散型、又そのどち
らでもない中間型の3グループに大別される。図4はP
P−ATC方式の音声符号化装置に従来の音声検出器が
付加された回路のブロック図である。
【0005】まず、音声符号化処理内容を詳細に説明す
る。入力信号(1)はバッファ1にある期間(通常16
〜32ms程度)蓄積されることによってフレーム化さ
れる。そのフレーム化された信号(2)に対してピッチ
予測器2においてピッチ予測を行ない、ピッチ周期とピ
ッチゲインの2つの予測パラメータ(3)を出力すると
同時に、予測残差信号(4)を出力する。この予測残差
信号(4)はDCT3によって周波数領域に直交変換さ
れ、変換係数(5)となり、予め定められた例えばA,
B,Cの3通りの係数選択回路4,5,6にそれぞれ入
力され選択された係数が出力される。
【0006】最適パターン選択器7では、変換係数
(5)と係数選択回路A,B,Cの3通りの出力との誤
差をそれぞれ計算し、誤差が最小となる回路の出力を選
択して出力するように切替器8を制御する。この最適パ
ターン出力(6)は符号化器9によって最適パターン信
号(15)と共に符号化された信号(7)となり、この
信号(7)は多重化器10によって2つの予測パラメー
タ(3)と多重化され伝送信号(8)となり、VOX
(図示は省略した)を介して伝送路に送出される。
【0007】次に、上述の音声符号化回路に接続された
音声検出器20について説明する。音声符号化方式で
は、フレーム化されたデータに対しフレーム単位に伝送
情報を生成するので、音声検出器20においても音声符
号化方式と同一のフレーム単位に音声が存在するか否か
を判定する必要がある。図5は図4の音声検出器20の
従来の回路ブロック図である。図5の回路の処理内容を
説明する。図4のバッファ1によりフレーム化された信
号(2)は、図5の自己相関関数算出器21に入力さ
れ、自己相関関数(9)が算出されてLPCケプストラ
ム距離算出器22と長期予測分析器23に入力される。
ここで、LPCケプストラム距離とは連続するフレーム
間でスペクトラム包絡がどのぐらい変化したかを表す尺
度であり、長期予測分析とは、ピッチ周期を求めるのと
同様の処理である。LPCケプストラム距離算出器22
によって出力されたLPCケプストラム距離(10)
は、スペクトラム変動検出器24に入力される。ここで
は予め定めた閾値を判断基準としてLPCケプストラム
距離の大小によってスペクトラムの変動が急激であるか
否かを判定し、その結果を示すスペクトラム変動情報
(11)を出力する。一方、長期予測分析器23では、
入力された自己相関関数(9)よりピッチ周期(12)
を算出し、ピッチ成分有無判定器25に入力する。ここ
では連続するある設定した期間のフレーム間においてピ
ッチ周期(12)のゆらぎが予め設定した閾値を超えて
いるか否かによってピッチ成分の有無を判定しその結果
を示すピッチ成分有無情報(13)を出力する。
【0008】スペクトラム変動情報(11)とピッチ成
分有無情報(13)を受けた音声有無判定器(26)
は、次の表1に従って音声の有無(〇または×)を示す
音声検出器出力(14)を送出する。
【表1】
【0009】これは、雑音と母音は長時間にわたりスペ
クトラムの変動がゆるやかであり、子音はその変動が激
しいこと、また前記3種の入力信号のうち母音のみが、
声帯の振動によりピッチ成分が認められるというそれぞ
れの信号の持つ既知の特徴を利用している。
【0010】
【発明が解決しようとする課題】以上説明したように音
声検出器20が動作する。この音声検出器20の長期予
測分析器23の出力であるピッチ周期(12)は、音声
符号化回路のピッチ予測器2の出力である2つのパラメ
ータ(3)のうちの一つピッチ周期と同様であるので、
これを利用すれば長期予測分析器23は省略することが
できる。
【0011】しかしながら、自己相関関数算出器21及
びLPCケプストラム距離算出器22においては、多く
の処理量が必要である。LPC分析合成系の音声符号化
方式であればその内部処理を利用できるが、ここで対象
としている波形符号化系の音声符号化方式は、LPC分
析合成系の音声符号化方式に比べて処理量とプログラム
量が大規模なものとなり、しいては、バードウエアの小
型化も困難になるという欠点がある。
【0012】本発明の目的は、従来技術のように音声符
号化回路と音声検出器の処理が全く違う構成をとること
により生じる処理量の増大と回路の大規模化を解消し、
波形符号化方式の音声符号化回路に適用される音声検出
器を提供することにある。
【0013】
【課題を解決するための手段】本発明の音声検出器は、
フレーム化された音声信号からピッチ周期とピッチゲイ
ン及び予測残差信号をとりだすピッチ予測器と、該予測
残差信号を周波数領域に直交変換して得られる変換係数
と予め定められた少なくとも3つの変換係数選択パター
ンとを比較して最も近似する最適パターンを選択する最
適パターン選択器とを備えたピッチ予測型適応変換符号
化回路における音声の有無を検出するために、前記最適
パターン選択器からのパターン選択情報を監視し複数の
フレームにわたって同一の変換係数選択パターンが連続
したか否かを示すスペクトラム変動情報を出力する選択
パターン監視器と、前記ピッチ予測器から出力されるピ
ッチ周期とピッチゲインからピッチ成分の有無を示すピ
ッチ成分有無情報を出力するピッチ成分有無判定器と、
前記スペクトラム変動情報と前記ピッチ成分有無情報と
により音声の有無を判定してそのいずれかを示す音声有
無情報を出力する音声有無判定器とを備えたことを特徴
とするものである。
【0014】
【実施例】図1は本発明の実施例を示す回路ブロック図
である。図において、符号1〜10及び信号(1)〜
(8),(15)は図4と同じである。11は本発明に
よる音声検出器である。最適パターン選択器7から得ら
れるどのパターンが選択されたかの情報(15)は、選
択パターン監視器13によって連続した幾つかのフレー
ム間にわたり、どのように変化したかを監視することに
よって、スペクトラムの変動が激しいものであるか、ゆ
るやかなものであるかを判定し、その結果(16)を出
力する。次に、選択パターン監視器13の内部処理を明
確にする。前に記述したように音声符号化回路のパター
ン選択情報(15)は周波数軸上でどのようなパワー分
布になっているかによって決定され、低域集中型,中間
型,広帯域分散型の3種のグループに大別できる。よっ
てこの情報はスペクトラムの包絡線情報ともいえること
は明白であり、図2に示される処理フローの例のよう
に、大別した3種のグループのうち同じグループのパタ
ーンが過去3フレームにわたって選択されているかを検
出することによってスペクトラム変動が激しいか否かを
判定することができる。
【0015】一方、図1のピッチ予測器2により出力さ
れた予測パラメータ(3)はピッチ成分有無判定器12
に入力され、ピッチ成分有無情報(13)が出力され
る。この処理は従来の音声検出方式のピッチ成分有無判
定器25と同様である。又、予測パラメータ(3)には
ピッチ周期とピッチゲインがあり、この二つを有効に利
用するために図3に示すような内部の処理フローで行わ
れる。
【0016】スペクトラム変動情報(16)とピッチ成
分有無情報(13)とを受けた音声有無判定器14は、
従来の音声有無判定器26と同様の処理により音声の有
無を示す音声検出器出力(17)を送出する。このよう
に極めて簡単な処理回路を音声符号化回路に追加するだ
けで従来問題となっていた処理量及びハードウエアの大
規模化を解消し、ピッチ予測型適応変換符号化方式の音
声符号化回路用の音声検出器を構成することができる。
【0017】
【発明の効果】以上詳細に説明したように、本発明によ
れば、PP−ATC方式の音声符号化回路で得られたパ
ラメータ(ピッチ,ピッチ利得,適応間引モード)を効
率よく利用して音声検出器を構成しているので、音声符
号器と容易に一体化することができるため小規模な回路
構成になり、処理量も少なくなるという大きな利点があ
る。
【図面の簡単な説明】
【図1】本発明の実施例を示す回路ブロック図
【図2】本発明の部分回路の処理フローチャート
【図3】本発明の部分回路の処理フローチャート
【図4】従来の回路ブロック図
【図5】従来の音声検出器の回路ブロック図
【符号の説明】
1 バッファ 2 ピッチ予測器 3 離散的余弦変換器(DCT) 4,5,6 係数選択回路 7 最適パターン選択器 8 切替器 9 符号化器 10 多重化器 11 音声検出器 12 ピッチ成分有無判定器 13 選択パターン監視器 14 音声有無判定器 20 音声検出器 21 自己相関関数算出器 22 LPCケプストラム距離算出器 23 長期予測分析器 24 スペクトラム変動検出器 25 ピッチ成分有無判定器 26 音声有無判定器

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 フレーム化された音声信号からピッチ周
    期とピッチゲイン及び予測残差信号をとりだすピッチ予
    測器と、該予測残差信号を周波数領域に直交変換して得
    られる変換係数と予め定められた少なくとも3つの変換
    係数選択パターンとを比較して最も近似する最適パター
    ンを選択する最適パターン選択器とを備えたピッチ予測
    型適応変換符号化回路における音声の有無を検出するた
    めに、 前記最適パターン選択器からのパターン選択情報を監視
    し複数のフレームにわたって同一の変換係数選択パター
    ンが連続したか否かを示すスペクトラム変動情報を出力
    する選択パターン監視器と、 前記ピッチ予測器から出力されるピッチ周期とピッチゲ
    インからピッチ成分の有無を示すピッチ成分有無情報を
    出力するピッチ成分有無判定器と、 前記スペクトラム変動情報と前記ピッチ成分有無情報と
    により音声の有無を判定してそのいずれかを示す音声有
    無情報を出力する音声有無判定器とを備えた音声検出
    器。
JP24644591A 1991-09-02 1991-09-02 音声検出器 Expired - Fee Related JP3291009B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24644591A JP3291009B2 (ja) 1991-09-02 1991-09-02 音声検出器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24644591A JP3291009B2 (ja) 1991-09-02 1991-09-02 音声検出器

Publications (2)

Publication Number Publication Date
JPH0563579A true JPH0563579A (ja) 1993-03-12
JP3291009B2 JP3291009B2 (ja) 2002-06-10

Family

ID=17148557

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24644591A Expired - Fee Related JP3291009B2 (ja) 1991-09-02 1991-09-02 音声検出器

Country Status (1)

Country Link
JP (1) JP3291009B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083363A (ja) * 2006-09-27 2008-04-10 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
JP2009210617A (ja) * 2008-02-29 2009-09-17 Internatl Business Mach Corp <Ibm> 発話区間検出システム、方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083363A (ja) * 2006-09-27 2008-04-10 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
JP2009210617A (ja) * 2008-02-29 2009-09-17 Internatl Business Mach Corp <Ibm> 発話区間検出システム、方法及びプログラム

Also Published As

Publication number Publication date
JP3291009B2 (ja) 2002-06-10

Similar Documents

Publication Publication Date Title
US11830506B2 (en) Transient detection with hangover indicator for encoding an audio signal
US5299239A (en) Signal encoding apparatus
US8473284B2 (en) Apparatus and method of encoding/decoding voice for selecting quantization/dequantization using characteristics of synthesized voice
US20190198033A1 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
JP3248215B2 (ja) 音声符号化装置
KR0167769B1 (ko) 디지탈 신호 처리장치
JP2002261622A (ja) 音響信号符号化装置
JPH08204576A (ja) 信号符号化装置及び信号復号化装置
EP0612158B1 (en) A block size determination method of a transform coder
JP3418005B2 (ja) 音声ピッチ検出装置
US4845753A (en) Pitch detecting device
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
US6012025A (en) Audio coding method and apparatus using backward adaptive prediction
JPH0563579A (ja) 音声検出器
EP0723257B1 (en) Voice signal transmission system using spectral parameter and voice parameter encoding apparatus and decoding apparatus used for the voice signal transmission system
EP1688918A1 (en) Speech decoding
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP2870608B2 (ja) 音声ピッチ予測装置
JPH11259099A (ja) 音声符号化・復号装置
RU2400831C1 (ru) Способ выделения сегментов квазистационарности при анализе речевого сигнала в вокодерах с линейным предсказанием
JPH09232964A (ja) ブロック長可変型変換符号化装置および過渡状態検出装置
KR0138878B1 (ko) 보코더용 피치검색 처리시간 단축법
EP0803989A1 (en) Method and apparatus for encoding of a digitalized audio signal
JP2889243B2 (ja) 符号化方式及び復号化方式
JP4240914B2 (ja) 音響信号符号化装置および音響信号符号化方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees