JPS62274941A

JPS62274941A - 音声符号化方式

Info

Publication number: JPS62274941A
Application number: JP61117416A
Authority: JP
Inventors: Ryujiro Muramatsu; 村松　隆二郎; Yoshinori Miyamoto; 宮本　宜則; Kazuhiro Kondo; 和弘近藤; Toshiro Suzuki; 鈴木　俊郎
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1986-05-23
Filing date: 1986-05-23
Publication date: 1987-11-28
Anticipated expiration: 2010-05-24
Also published as: US4918734A; CA1326912C; JPH0748695B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】３、発明の詳細な説明〔産業上の利用分野〕本発明は音声の高能率符号化に係り、特に、電話通信に
おいて音声信号を圧縮したディジタル情報として伝送し
受信側で音声を再生する音声符号化方式に関するもので
、音声休止区間における周囲雑音を処理することを図っ
たものである。

〔従来の技術〕

従来の装置は、特願昭６０−１３７７２１号に記載のよ
うに、入力音声信号をフレーム（音声のパラメータを抽
出する時間間隔）毎に順次分析して伝送パラメータを算
出し再び合成する方式をとっていた。

しかし、周囲雑音のある環境下における音声の休止区間
の合成音については、配慮されていなかった。

〔発明が解決しようとする問題点〕

上記従来技術では、冷暖房装置のファン等が発生する雑
音が周囲雑音として存在している環境下での会話につい
ては配慮されておらず、これらの雑音が会話の休止期間
に入力されると、従来の音声分析合成方式では、これら
の雑音も人間が発する音声と同等に扱われることになり
、その結果、合成出力は入力とはかなり異なった音に聞
こえ、耳ざわすな感じを与えるという問題があった。

本発明の目的は、従来技術での上記した問題点を解決し
、周囲雑音存在下の音声入力に対し、音声入力区間につ
いては従来と同じ処理を実行して音声品質を確保する一
方、音声休止区間については雑音処理を実行させ、雑音
の合成出力が感覚的に奇異な感じを与えないよう自然音
に近づけることのできる音声符号化方式を提供すること
にある。

〔問題点を解決するための手段〕

上記目的は、音声信号のある一定時間間隔毎のパワーを
算出する手段と、該パワーを上記時間間隔単位に積分す
る手段と、該積分値を一定の割合で減衰した値を求める
手段と、前記時間間隔毎に求められた上記減衰値とその
直前の時間間隔での減衰値を一定の割合で減衰した値と
を比較して大きい値の方をしきい値として出力する手段
と、該しきい値と前記積分値との比較結果により音声の
有無を判定する手段とを備えた構成とすることにより、
達成される。

すなわち、本発明の前記した目的を達成するためには、
まず、音声入力区間と音声休止区間とを判別することが
必要である。そのために、音声のパワーあるいはエネル
ギーを求めて、あるしきい値との比較結果により上記区
間を判別する。その際、入力音声レベルの大小に拘らず
、区間の判定がほぼ一定に保たれることが必要であるた
め、上記しきい値は入力信号に応じて変化する可変しき
い値とする必要がある。

さらに、話者、送話器、回線が定まれば、その間の音声
入力区間毎のパワーは、はぼ一定と考えられるため、同
一話者が会話をする平均的な時間内では、上記しきい値
は、はぼ一定とするよう考慮する。次に、雑音のみ入力
した場合、白色雑音に近い雑音でも特定な周波数成分が
多いと分析時には、有声化されやすくなる。これらの音
が合成出力では奇異な感じを与えることになる。そこで
、雑音に対し、常時無声化すれば、感覚的に不快感は少
なくなることを考慮し、音声休止区間では、入力に拘ら
ず無声判定とすることにより、上記目的は達成される。

〔作用〕

最初、前記した可変しきい値は最小値に設定しておく。

次に、音声が入力されると音声のパワーが大きくなるた
め、それに伴って可変しきい値も増大する。しかし、音
声入力中は、音声パワーがしきい値を上まわるために、
音声入力区間と判定＝４− される。音声が途切れると、音声パワーは急速に減少す
る。ここで、しきい値を、音声パワーが減少方向である
時は徐々に減少するようにしておけば、音声パワーがし
きい値を下まわったことを検出することで音声休止区間
に入ったと判定され、この音声休止区間に入力される雑
音がしきい値以下であれば、これらの雑音はすべて無声
化され、奇異な合成音とはならない。

次に再び音声が入力して音声パワーが可変しきい値を上
まわると、音声入力区間に入ったことが判定され１通常
の分析合成処理が行なわれる。そしてこの入力音声によ
り、しきい値が新たな値に設定される。会話が終了する
と、しきい値は徐々に減少し、やがて元の最小値に落ち
着く。

〔実施例〕

以下、本発明の一実施例を第１図に示すブロック構成図
により説明する。第１図は符号器のみを示し、音声を合
成する復号器は前記した特願昭６０−１３７７２１号に
記載の合成部と同一であるため省略している。入力され
た音声信号１は音声分析器２で分析される一方パワー演
算器３にも入力され、ここで音声のパラメータを抽出す
る一定時間間隔（以下、フレームという）毎に音声パワ
ーが演算される。フレーム毎に出力される音声パワーは
漏洩積分器４で積分され、減衰器５で一定レベル減衰さ
れる。実施例では減衰器５は、漏洩積分器４から出力さ
れるディジタル値に一定値、例えば１／２、を乗算する
掛算器であり、入力レベルをその１／２のレベルに減衰
している。６は可変しきい値を出力する比較選択器であ
る。７は選択器６の出力を入力に受けて１フレームだけ
遅延させて出力する、バッファメモリで構成される、］
フレーム遅延器であり、８はこの１フレーム遅延器７の
出力を入力に受けて、入力レベルを一定レベル減衰させ
て出力する減衰器である。減衰器８におけるレベル減衰
率は減衰器５におけるそれとは異なるように設定され、
実施例では入力レベルを９７１０に減衰させて出力する
ように設定される。減衰器５の出力と減衰器８の出力と
が選択器６に入力される。選択器６には、さらに大小比
較器９の出力も入力される。大小比較器９では減衰器５
の出力と１フレーム遅延器７の出力とが比較され、この
比較結果により選択器６を制御し、減衰器５の出力の方
が大きい場合には減衰器５の出力が、また１フレーム遅
延器７の出力の方が減衰器５の出力より大きい場合には
減衰器８の出力が、しきい値として選択器６より出力さ
れる。選択器６より出力されるしきい値と、漏洩積分器
４より出力される積分値との大小比較を判別器１０にお
いて行ない、積分値がしきい値より大なる場合は音声入
力区間と判定し、小なる場合は音声休止区間と判定する
。

この判定結果は有声無声処理器１１に入力され、音声入
力区間の場合は従来技術と同じ処理を行い、音声休止区
間の場合は入力信号に拘らず無声として処理されて符号
器出力１２となる。

次に本実施例における各部信号の時間変化例を第２図、
第３図により説明する。第２図は入力される音声信号を
表わし、第３図は各部信号のレベル値を示している。し
きい値は音声入力前は設定された最小値にあり、音声入
力により漏洩積分値が増大すると減衰器５の出力（破線
曲線）の方がしきい値より大となり、しきい値としては
減衰器５の出力が選択されて比較選択器６の出力となる
。

漏洩積分値がしきい値より大きくなったことで音声入力
区間に入ったと判定される。漏洩積分値がピークより下
がると比較選択器６からは、前回フレームのしきい値を
一定の割合で、実施例では９／１０のレベルに、減少さ
せた値がしきい値として出力される。そして、このしき
い値と漏洩積分値とが判定器１０で比較され、判定され
る。漏洩積分値が低下してしきい値に達する時点までは
音声入力区間と判定され、漏洩積分値がしきい値を下ま
わり次にしきい値を上まわるまでの区間は音声休止区間
となり、この区間内にある小レベルの雑音は第１図の有
声無声処理器１１において無声として処理される。

以上、本実施例によれば、音声入力区間では従来技術と
同等の通常処理が実行され、音声休止区間では、小レベ
ル雑音はすべて無声として処理されるので周囲雑音が奇
異な合成音となって出力されることばなく、従来技術で
の問題点が解決される。

〔発明の効果〕

以上説明したように、本発明によれば、周囲雑音存在下
での会話に際し、音声入力区間においては従来技術にお
ける音声品質を確保し、音声休止区間においては従来技
術において奇異な感じを与えていた合成音を耳ざわりの
ないものとすることができる効果がある。

【図面の簡単な説明】

第１図は本発明の一実施例のブロック構成図、第２図は
実施例における入力音声信号の一例を示す図、第３図は
第１図中の各部信号の時間変化を示す図である。〈符号の説明〉１・・・音声信号人力　　２・・・音声分析器３・・・
パワー演算器　　４・・・漏洩積分器５．８・・・減衰
器　　　６・・・比較選択器７・・・１フレーム遅延器９・・・大小比較器　　　１０・・・判定器１１・・・
有声無声処理器　１２・・符号器出力第１図１−音声信号人力２・−音声分析器３−・−パワー演算器４−濡洩積分器５．８−・減衰器６・・−比較選択器７−１フレ一ム週１４器９−大小辻較器１〇−判定器１１−２−有声無声処理器１２−符号器出力

Claims

【特許請求の範囲】１、音声信号をディジタル符号に符号化し、該ディジタ
ル符号を復号して音声信号を再生する音声符号化方式に
おいて、音声信号の一定時間間隔毎のパワーを算出する
手段と、該パワーを上記一定時間間隔単位に積分する手
段と、該積分値を一定の割合で減衰した値を求める第１
の減衰器と、この減衰値を一方の入力としてしきい値を
選択出力するしきい値選択器と、この出力しきい値を前
記一定時間間隔だけ遅らせて出力する遅延器と、この遅
延器出力を前記とは異なる一定の割合で減衰した値を求
めて上記しきい値選択器に他方の入力として与える第２
の減衰器と、上記第１の減衰器出力と上記遅延器出力と
の大小比較により上記しきい値選択器を制御してその２
入力中の大きい値の方をしきい値として出力させる手段
と、該しきい値と前記積分値との比較結果により音声の
有無を判定する手段とを備えたことを特徴とする音声符
号化方式。２、前記一定時間間隔は、入力音声信号のパラメータを
フレーム毎に抽出して有声、無声の判定を行って音声を
分析合成する音声分析合成器のフレームであり、前記判
定手段は、前記しきい値と前記積分値との比較結果に基
づき音声が無いと判定されたフレームにおいては入力信
号にかかわらず無声と判定することを特徴とする特許請
求の範囲第１項記載の音声符号化方式。