JP2817196B2 - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JP2817196B2
JP2817196B2 JP1118630A JP11863089A JP2817196B2 JP 2817196 B2 JP2817196 B2 JP 2817196B2 JP 1118630 A JP1118630 A JP 1118630A JP 11863089 A JP11863089 A JP 11863089A JP 2817196 B2 JP2817196 B2 JP 2817196B2
Authority
JP
Japan
Prior art keywords
signal
audio signal
filter
pulse
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1118630A
Other languages
English (en)
Other versions
JPH02298999A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1118630A priority Critical patent/JP2817196B2/ja
Publication of JPH02298999A publication Critical patent/JPH02298999A/ja
Application granted granted Critical
Publication of JP2817196B2 publication Critical patent/JP2817196B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号を4.8kb/s程度のビットレートで
良好に符号化する音声符号化方式に関する。
〔従来の技術〕
音声信号を低ビットレート(10kb/s以下)で符号化す
る有力な方式として、マルチパルス符号化方式と雑音駆
動LPC(以下CELPと記す)が知られている。
マルチパルス符号化方式は、音声信号を振幅と位置の
異なる複数個のパルスからなるマルチパルスと音声信号
のスペクトル包絡特性を近似する合成フィルタとでモデ
ル化する方式である。伝送情報は、フィルタの係数とマ
ルチパルスの振幅,位置情報であ。この方式の詳細は、
特願昭57−231606号(文献1)等に記載されている。
またマルチパルス方式をもとにしてビットレートを4.
8kb/s程度に低下させる方式として、ピッチ補間マルチ
パルス方式が知られている。この方式は、有声区間では
フレーム(例えば20ms)の音声信号をピッチ周期毎の小
区間(サブフレーム)に分割し、複数個のサブフレーム
のうち一つのサブフレーム(代表区間)についてのみ少
数のマルチパルスを求めることにより、マルチパルスの
個数を前記文献1の方法に比べ大幅に低減しビットレー
トを低減する方式である。
また、受信側では、フレーム内の代表区間以外のピッ
チ区間のパルスは代表区間のパルスの補間により復元す
る方式や、送信側の他のピッチ区間について代表区間の
パルスのゲイン、位相を調節するゲイン,位相補正係数
を求めて伝送し、これを他の区間のパルスの復元に用い
る方式などが知られている。これらの詳細な説明につい
ては、前者の方式は例えば特願昭59−272435号(文献
2)等を参照することができる。また、後者の方式につ
いては例えば特願昭63−208201号(文献3)等を参照す
ることができる。
また、CELP方式では、音声信号を複数種類の符号語か
ら構成される符号帳(コードブック)から選択した1種
類の符号語と、音声信号のピッチ構造を近似するピッチ
フィルタと、合成フィルタとでモデル化する。コードブ
ックは、予め学習用音声信号に対してトレーニングして
決定しておく方法や、ガウス性の乱数信号を用いる方法
が知られている。コードブックの選択は、フレームよい
も短い小区間(例えば5ms)毎に行う。乱数信号からな
るコードブックを用いるCELP方式の詳細は、例えば、Sc
hroeder,Atal氏らによる“Code−excited linear predi
ction(CELP):High quality speech at very low bit
rates"と題した論文(ICASSP,pp.937−940,1985年)
(文献4)等を参照することができる。
〔発明が解決しようとする課題〕
しかしながら、以上の従来の方式では、ビットレート
が高いところでは良好な音質の合成音声を得ることがで
きるが、ビットレートを4.8kb/s程度以下とすると音質
が低下していた。この理由は、少ない個数のマルチパル
ス(4.8kb/sでは20msフレーム当り4個)や少ない種類
のコードブック(4.8kb/sでは256〜1024種類)では、音
声信号の音源信号を良好に表現することが困難であり歪
が発生するからである。特に有声区間では、ピッチ区間
での位相歪により合成音声に濁りやざらつきなどが生じ
音質を低下させていた。さらに通常の通信で用いられる
カーボンマイクを有する電話機の音声に対しては入力音
声自体の位相歪が顕著であるために、少ない情報量で音
源信号を良好に表すことが一層困難であり大幅に音質が
低下していた。
本発明の目的は、4.8kb/s程度以下のビットレートに
おいて、ダイナミックマイクを有する場合はもちろんの
こと、カーボンマイクを有する電話機の音声に対しても
良好な音質の合成音声を得ることのできる音声符号化方
式を提供することにある。
〔課題を解決するための手段〕
第1の発明である音声符号化方式は、入力した音声信
号を予め定められた時間長のフレームに分割し、前記音
声信号からスペクトル包絡を表すスペクトルパラメータ
を求め、このスペクトルパラメータを用いて前記音声信
号を表すマルチパルスの振幅と位置を予め定められた個
数だけ求め、前記スペクトルパラメータにより構成され
た合成フィルタを前記マルチパルスにより駆動して求め
た合成信号と等化フィルタを通した音声信号との誤差電
力を最小化するように前記等化フィルタのパラメータを
求め、前記音声信号を等化フィルタにより処理した処理
信号を求め、前記処理信号を表すマルチパルスの振幅と
位置を求め出力することを特徴とする。
第2の発明である音声符号化方式は、入力した音声信
号を予め定められた時間長のフレームに分割し、前記音
声信号からスペクトル包絡を表すスペクトルパラメータ
とピッチ周期を表すピッチパラメータとを求め、前記音
声信号を前記ピッチパラメータに応じた小区間に分割
し、少なくとも一つの小区間に対し前記スペクトルパラ
メータを用いて前記小区間の音声信号を表すマルチパル
スの振幅と位置を予め定められた個数だけ求め、前記ス
ペクトルパラメータにより構成される合成フィルタを前
記マルチパルスにより駆動して求めた合成信号と等化フ
ィルムを通して音声信号との誤差電力を最小化するよう
に前記等化フィルタのパラメータを求め、前記音声信号
を等化フィルタにより処理した処理信号を求め、前記処
理信号を表すマルチパルスの振幅と位置を求め出力する
ことを特徴とする。
第3の発明である音声符号化方式は、入力した音声信
号を予め定められた時間長のフレームに分割し、前記音
声信号からスペクトル包絡を表すスペクトルパラメータ
とピッチ周期を表すピッチパラメータとを求め、前記音
声信号を前記フレームと等しいかまたは短い小区間に分
割し、前記小区間に対し前記スペクトルパラメータを用
いて前記小区間の音声信号を表す駆動信号として予め定
められた種類だけ有する符号帳から一種類選択し、前記
スペクトルパラメータとピッチパラメータにより構成さ
れるフィルタを前記駆動信号により駆動して求めた合成
信号と等化フィルタを通した音声信号との誤差電力を最
小化するように前記等化フィルタのパラメータを求め、
前記音声信号を等化フィルタにより処理した処理信号を
求め、前記処理信号の駆動信号として前記符号帳から一
種類を選択して出力することを特徴とする。
〔作用〕 第4図は本発明の作用を示すブロック図である。ここ
で音源信号がマルチパルスの場合について説明するが、
第3の発明のように符号帳(コードブック)を用いる場
合も基本的な作用は同一である。
入力端100から音声信号x(n)を入力する。
バッファメモリ110は、音声信号を蓄積しフレーム毎
(例えば20ms)に分割する。
LPC分析部120は、フレームの音声信号のスペクトル包
絡を表すスペクトルパラメータを周知の線形予測分析
(LPC)により求める。ここでスペクトルパラメータと
しては種々のものが知られているが、線形予測係数a
i(i=1〜P;Pは次数)を用いるものとして以下では話
を進める。LPC分析の方法は例えば、Markel,Gray氏らに
よる“Linear Prediction of Speech"と題した刊行物
(Springer−Verlag社1976年)(文献5)を参照するこ
とができる。
スイッチ1401,1402は、第1フェーズでは1側に接続
されている。
マルチパルス発生部130は、予め定められた個数のマ
ルチパルスの振幅,位置を求めて発生する。
合成フィルタ150は、LPC分析部120から線形予測係数a
iを入力し合成音声(n)を次式に従い計算する。
ここでv(n)は、マルチパルスにより表された音源
信号である。
減算器160は、次式に従い誤差e(n)を求める。
e(n)=x(n)−(n) (2) 重み付けフィルタ170は、誤差e(n)に聴感重み付
けを行う。重み付けフィルタの伝達特性は、周知のよう
に次式で表される。
マルチパルスの振幅,位置は、次式の重み付け誤差電
力Eを最小化するように求める。具体的な方法は、前記
文献1を参照できる。
ここでw(n)は、聴感重み付けフィルタ170のイン
パルス応答を示す。
パルス計算部135では、(4)式を最小化するように
マルチパルスの振幅gi,位置miを求める。求め方の詳細
は前記文献1,2等を参照できる。
次に第2フェーズでは、このようにして求めたマルチ
パルスの振幅gi,位置mi(i=1〜K)を用いて、マル
チパルス発生部130は音源信号v(n)を次式により発
生する。
合成フィルタ150は、音源信号v(n)を入力して前
記(1)式により合成音声(n)を求める。
スイッチ1401,1402は、第2フェーズでは2側に接続
されている。
第2フェーズでは、係数計算部185において等化フィ
ルタ180の係数を計算する。これを以下に示す。等化フ
ィルタは、特に位相歪を補正する働きをする。従ってフ
ィルタの構成としてはFIRフィルタによるMA(Moving Av
erage)タイプが適しているが、IIRフィルタによるAR
(Auto regressive)タイプや、両者のARMAタイプなど
も用いることができる。ここではFIRフィルタを用いる
ものとする。
FIRフィルタのインパルス応答をf(n)とする。等
化フィルタ180は、音声信号x(n)に次式のフィルタ
処理を施し、次式で表される処理信号y(n)を出力す
る。
ここでMは、等化フィルタ180の次数である。
減算器160は、次式により処理信号y(n)と合成信
号(n)との誤差信号e(n)を計算し出力する。
e(n)=y(n)−(n) (7) 重み付けフィルタ170は、誤差信号e(n)に対し聴
感重み付けを行う。
係数計算部185は、等化フィルタ180の係数f(n)を
計算する。ここで次式の聴感重み付け誤差電力Ewを最小
化するように係数f(n)を計算する。
ここでw(n)は、重み付けフィルタ170における聴
感重み付けフィルタのインパルス応答を示す。また誤差
電力を計算するサンプル数Nは、第1の発明のように1
フレーム全体でもよいし、第2の発明のようにフレーム
をピッチ周期毎に分割した小区間でもよい。
(6),(7)式を(8)式に代入して、 (9)式を最小化するには、(9)式をf(m)で偏
微分して0とおくことにより得られる次式を解けばよ
い。
ただし xw(n)=x(n)*w(n) (11) (n)=(n)*w(n) (12) である。(10)式は、左辺第2項が正定値対称であるこ
とから、周知のコレスキ分解法を用いると効率よく解く
ことができる。コレスキ分解による解法については、例
えばRabiner,Schafer氏らによる“Digital Processing
of Speech Signals"と題した刊行物(Prentice−Hall社
1978年)(文献6)等を参照することができる。
以上の方法により等化フィルタ180の係数を求める。
これまでの処理により、処理信号y(n)はマルチパ
ルスにより合成した信号と誤差最小条件のもとで一致し
ている。処理信号y(n)は、入力音声x(n)の位相
をマルチパルスによる合成モデルに適合するように補正
したものと考えることができる。
ところで人間の聴覚は短時間位相には比較的鈍感であ
ることが知られている。従って処理信号y(n)は音声
信号x(n)と位相特性が異なるが、耳には違いはほと
んど判別できない。また音声信号x(n)に位相歪が生
じているときには、処理信号y(n)は位相歪が等化さ
れた信号となる。処理信号y(n)は、マルチパルスに
より誤差最小で表すことができる。従って第3フェーズ
では、音声信号x(n)の代わりに処理信号y(n)を
マルチパルスで表す。
LPC分析部120は、処理信号y(n)をLPC分析して線
形予測係数aiを求める。
スイッチ1401は2側に、スイッチ1402は1側に接続す
る。
パルス計算部135は、処理信号y(n)とマルチパル
スによる合成信号との聴感重み付け誤差電力を最小化す
るように、前述の方法によりマルチパルスの振幅,位置
を計算して出力する。
符号化側から出力する伝送情報は、処理信号y(n)
に対して求めたスペクトルパラメータ(ここでは、線形
予測係数ai)と、処理信号y(n)に対して求めたマル
チパルスの振幅,位置とである。
〔実施例〕
第1図は第1の発明を実施する音声符号化装置の一例
を示すブロック図である。
入力端子200から音声信号x(n)を入力する。
バッファメモリ210は、音声信号をフレーム長だけ格
納する。フレーム長は例えば20msとする。
スイッチ2201,2202,2203は、まず1側に接続してお
く。
LPC分析回路230は、音声信号のスペクトル包絡を表す
スペクトルパラメータとして、PARCOR係数(Kパラメー
タ)を周知のLPC分析により求める。
パラメータ符号器240は、PARCOR係数を予め定められ
た量子化ビット数で符号化する。またこれを復号化して
さらに線形予測係数ai′に変換して出力する。ここでPA
RCORから線形予測係数への変換は、前記文献5を参照で
きる。
インパルス応答計算回路250は、線形予測係数ai′を
用いて合成フィルタの聴感重み付けインパルス応答h
w(n)を予め定められたサンプル数だけ求める。この
詳細は前記文献1のインパルス応答計算回路を参照でき
る。
自己相関関数計算回路260は、インパルス応答h
w(n)の自己相関関数Rを予め定められた遅れ時間だ
け求める。詳細は前記文献1の自己相関関数計算回路を
参照できる。
重み付け回路270は、音声信号x(n)に聴感重み付
け処理を行い、重み付け信号xw(n)を出力する。詳細
は前記文献1の重み付け回路を参照できる。
相互相関関数計算回路280は、重み付け信号xw(n)
と重み付けインパルス応答hw(n)から相互相関関数Φ
を計算する。詳細は前記文献1の相互相関関数計算回路
を参照できる。
マルチパルス計算回路290は、相互相関関数Φと自己
相関関数Rとを用いて前記(4)式を最小化するよう
に、マルチパルスの振幅gi,位置mi(i=1〜K;ただし
Kはマルチパルスの個数)を計算する。詳細は前記文献
1の音源信号計算回路を参照できる。
符号器285は、マルチパルスの振幅,位置を予め定め
られた量子化ビット数で量子化しさらに復号化して出力
する。
合成フィルタ294は、復号化したマルチパルスを用い
て(5)式により音源信号v(n)を発生し、さらに
(1)式により合成信号(n)を計算する。
フィルタ係数計算回路295は、音声信号x(n)の位
相を等化するFIRフィルタの係数f(n)を計算する。
この計算は、作用の項で述べた(10)〜(12)式に従い
行う。
フィルタ298は、係数f(n)を用いて音声信号x
(n)に(6)式に従い位相等化処理を施し処理信号y
(n)を求め出力する。
次にスイッチ2201,2202,2203を、2側に接続する。
処理信号y(n)に対して、LPC分析回路230、パラメ
ータ符号化回路240、インパルス応答計算回路250、自己
相関関数計算回路260、重み付け回路270、相互相関関数
計算回路280、マルチパルス計算回路290、符号器285
は、上述の処理を繰り返す。
マルチプレクサ265は、処理信号y(n)に対して求
めたPARCOR係数の量子化符号とマルチパルスの振幅,位
置の量子化符号を入力し、これらを組み合わせて出力す
る。
以上で第1の発明の実施例の説明を終える。
第2図は、第2の発明を実施する音声符号化装置の一
例を示すブロック図である。第2図において、第1図と
同一の番号を付した構成要素は第1図と同一の動作を行
うので説明は省略する。
図において、LPC,ピッチ分析回路330は、バッファメ
モリ210に格納したフレーム区間の音声信号x(n)か
ら、PARCOR係数とピッチ周期を計算する。ここでピッチ
周期は周知の自己相関分析による方法を用いる。この方
法の詳細は文献2等を参照できる。
パラメータ符号器340は、PARCOR係数とピッチ周期を
予め定められた量子化ビット数で量子化し、これらを復
号化する。復号化したPARCOR係数は、さらに線形予測係
数ai′に変換される。線形予測係数ai′と復号したピッ
チ周期T′が出力される。
スイッチ2201,2202,2203は、まず1側に接続する。
小区間分割回路315は、有声区間ではフレームの音声
信号を復号したピッチ周期T′毎の小区間(サブフレー
ム)に分割する。
マルチパルス計算回路370は、小区間毎に予め定めら
れた個数のマルチパルスを求める。
補正係数計算回路350は、ある小区間をフレームの代
表区間とし、これ以外の小区間に対しては代表区間のパ
ルスのゲイン,位相を補正するゲイン,位相補正係数
cj,djを計算する。ここでjは、フレーム内のj番目の
小区間であることを示す。ゲイン,位相補正係数の具体
的な求め方は文献3等を参照できる。この処理をいくつ
かの小区間について行い、マルチパルスとゲイン,位相
補正係数を用いて求めた合成音声と入力信号とのフレー
ム全体での聴感重み付け誤差電力が最も小さい区間を代
表区間として選択する。この処理の詳細は文献3を参照
できる。
符号器360は、代表区間のマルチパルスの振幅,位置
を予め定められたビット数で量子化し復号化する。また
代表区間以外の小区間で求めたゲイン,位相補正係数を
量子化,復号化する。また代表区間のフレーム内位置を
符号化,復号化する。
フィルタ係数計算回路365では、各小区間毎にフィル
タ366の係数f(n)を計算する。
フィルタ366は、(6)式に従い音声信号x(n)に
位相等化処理を施し位相等化音声信号y(n)を得る。
ただし、(6)式の計算の際、フィルタ係数f(n)は
小区間毎に切り替える。
次に、スイッチ2201,2202,2203を、2側に接続する。
LPC,ピッチ分析回路330、パラメータ符号器340、小区
間分割回路315、重み付け回路270、インパルス応答計算
回路250、自己相関関数計算回路260、相互相関関数計算
回路280、マルチパルス計算回路370、補正係数計算回路
350、符号器360は、位相等化音声信号y(n)に対して
上述の処理を行う。そしてPARCOR係数、ピッチ周期、代
表区間のマルチパルスの振幅,位置、代表区間の位置、
ゲイン・位相補正係数の各々を符号化した符号をマルチ
プレクサ265へ出力する。
以上で第2の発明の実施例の説明を終える。
第3図は第3の発明を実施する音声符号化装置の一例
を示すブロック図である。図において第1図,第2図と
同一の番号を付した構成要素は第1図,第2図と同一の
動作を行うので説明は省略する。
図において、スイッチ2201,2202,2203は、まず1側に
接続する。LPC,ピッチ分析回路400は、バッファメモリ2
10に格納したフレーム区間の音声信号x(n)から、PA
RCOR係数とピッチ周期,ピッチゲインとを計算する。こ
こでピッチ周期,ピッチゲインは周期の自己相関分析に
よる方法を用いる。この方法の詳細は文献2等を参照で
きる。また周知の他の良好な方法を用いることもでき
る。
パラメータ符号器410は、PARCOR係数とピッチ周期と
ピッチゲインを予め定められた量子化ビット数で量子化
し、これらを復号化する。b′は復号したピッチゲイン
を示す。復号化したPARCOR係数は、さらに線形予測係数
ai′に変換される。
小区間分割回路420は、フレームの音声信号を予め定
められた時間長の小区間(例えば5ms)毎に分割する。
コードブック460は、予め定められた種類の符号語
(コードワード)をコードブックとして格納している。
各符号語は予め定められた次元数(例えば40)を有して
いる。コードワードの種類は、コードブック(符号帳)
に割り当てる量子化ビット数により決定される。例えば
Bビットのときは2B個の種類がある。コードブックの作
り方は、予めトレーニング用音声信号に対してトレーニ
ングして作成する方法と、例えばガウス性の乱数信号を
用いる方法が知られている。前者の方法については、例
えばMakhoul氏による“Vector quanti zation in speec
h coding"と題した論文(Proc.IEEE,vol.73,1551−158
8,1985年)(文献7)等を参照できる。後者の方法につ
いては、前記文献4を参照できる。ここでは文献4のよ
うにガウス性の乱数信号からなるコードブックを用いる
こととする。次元数は、小区間の時間帳5msに合わせ40
とする。コードブック420は、2B種類のコードワードを
1つずつ畳み込み回路430へ出力する。
畳み込み回路430は、インパルス応答計算回路250の出
力である聴感重み付けインパルス応答hw(n)と、コー
ドブック420の出力であるコードワードc(n)とを次
式に従い畳み込み、畳み込み信号z(n)を出力する。
自己相関関数計算回路440は、畳み込み信号z(n)
の自己相関関数Rを計算する。
相互相関関数計算回路450は、聴感重み付け音声x
w(n)と畳み込み信号z(n)との相互相関関数Φを
計算する。これらの計算の詳細は前記文献4を参照でき
る。
コードワード選択回路460は、2B種類のコードワード
のうち、入力した音声信号の音源信号を最も良好に表す
ことのできるコードワードc(n)及び最適な音源信号
のゲインgを求めて出力する。詳細な方法は文献4を参
照できる。
ピッチ,合成フィルタ470は、選択されたコードワー
ドc(n),ゲインgを用いて次式に従い音源信号v
(n)を発生する。
v(n)=g・c(n) (14) 次に次式に従い、ピッチ再生フィルタ,合成フィルタ
を通して合成音声(n)を求める。
ここでb′,T′,ai′は、復号したピッチゲイン,ピ
ッチ周期,線形予測係数を示す。ここでp(n)は、ピ
ッチ再生フィルタの出力である。(15)式ではピッチ再
生フィルタの次数は1次としている。
フィルタ係数計算回路365,フィルタ366は、第2図と
同様の動作を行い、小区間毎にフィルタ係数を求め、小
区間毎に入力音声信号x(n)を処理して処理音声信号
y(n)を求める。
次にスイッチ2201,2202,2203を、2側に接続する。
LPC,ピッチ分析回路400、パラメータ符号化回路410、
小区間分割回路420、重み付け回路270、インパルス応答
計算回路250、コードブック420、畳み込み回路430、自
己相関関数計算回路440、相互相関関数計算回路450、コ
ードワード選択回路460は、位相等化音声信号y(n)
に対して上述の処理を行う。そしてPARCOR係数,ピッチ
周期,ピッチゲイン,ゲインの各々を符号化した符号
と、選択されたコードワードのインデックスを示す符号
とをマルチプレクサ265へ出力する。
以上で第3の発明の実施例の説明を終える。
本発明の主旨を損なうことなく以上述べた実施例以外
にも種々の変形が考えられる。
第1の発明において、音源信号をピッチ予測マルチパ
ルスにより表してもよい。このようにするときは、ピッ
チ周期,ピッチゲインを求める必要がある。ピッチ予測
マルチパルスは、特願昭59−27243号(文献8)等を参
照できる。
第2,第3の発明において、位相等化フィルタの係数は
一つの小区間のみにおいて求め、他の小区間ではこの係
数を予め定められた時間間隔毎に例えば線形補間して使
用してもよい。このようにすると係数計算に必要な演算
量を低減できる。
また、一層の演算量の低減化のためには、上記の方法
で求めた係数を補間せずにフレーム全体の音声信号に対
して用いてもよい。ただしこのようにすると、上記の方
法に比べ特性は少し低下する。
また、第2の発明において、有声部ではフレーム内の
一つの小区間のみでマルチパルスを求め、他の区間では
前記マルチパルスを補間してフレームの音源信号を復元
する文献2の方法を用いてもよい。
第3の発明において、ピッチゲイン、周期は、他の良
好な方法により求めることができる。例えば、入力音声
と前フレームあるいは前小区間での合成音声との相互相
関関数から求めることもできる。この方法の詳細は、例
えばKroon氏らによる“A class of an analysis−synth
esis predictive coders for high qualtiy speech cod
ing an rat es between4.8and9.6kb/s"と題した論文(I
EEE J.Sel.Areas Commun.,SAC−6,pp.353−363 1988
年)(文献9)等を参照できる。
また、(15)式においてピッチフィルタの次数は、2
次以上としてもよい。
また、第1〜3の発明において、音声信号を等化フィ
ルタにより処理した処理音声を求めるときに、音声信号
を等化フィルタを通す前の線形予測係数ai′を用いて一
旦予測し、予測残差信号e(n)に対して等化フィルタ
を通した後に合成し、等化音声信号y(n)を求めるよ
うにすることもできる。
また、重み付け回路270はなくてもよい。
〔発明の効果〕
以上述べたように本発明によれば、特に4.8kb/s程度
以下の低ビットレートにおいて従来方式に比べ位相歪な
どの歪を低減し、有声区間での濁りやざらつきの少ない
良好な音質の合成音声を得ることができるという効果が
ある。
さらにダイナミックマイクを有する電話機の音声に対
してはもちろんのこと、通常用いられるカーボンマイク
を有する電話機の音声に対しても入力音声の位相歪を補
正するため、良好な合成音声を得ることができるという
大きな効果がある。
【図面の簡単な説明】
第1図は第1の発明を実施する音声符号化装置の一例を
示す図、 第2図は第2の発明を実施する音声符号化装置の一例を
示す図、 第3図は第3の発明を実施する音声符号化装置の一例を
示す図、 第4図は本発明の作用を示すブロック図である。 110,210……バッファメモリ 120,230,330……LPC分析部 130……パルス発生部 135……パルス計算部 1401,1402,1403,2201,2202,2203……スイッチ 150……合成フィルタ 160……減算器 170……重み付けフィルタ 180……等化フィルタ 185……係数計算部 240,340……パラメータ符号器 250……インパルス応答計算回路 260……自己相関関数計算回路 265……マルチプレクサ 270……重み付け回路 280……相互相関関数計算回路 285,360……符号器 290,370……マルチパルス計算回路 294……合成フィルタ 295,365……フィルタ係数計算回路 298,366……フィルタ

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】入力した音声信号を予め定められた時間長
    のフレームに分割し、前記音声信号からスペクトル包絡
    を表すスペクトルパラメータを求め、このスペクトルパ
    ラメータを用いて前記音声信号を表すマルチパルスの振
    幅と位置を予め定められた個数だけ求め、前記スペクト
    ルパラメータにより構成される合成フィルタを前記マル
    チパルスにより駆動して求めた合成信号と等化フィルタ
    を通した音声信号との誤差電力を最小化するように前記
    等化フィルタのパラメータを求め、前記音声信号を等化
    フィルタにより処理した処理信号を求め、前記処理信号
    を表すマルチパルスの振幅と位置を求め出力することを
    特徴とする音声符号化方式。
  2. 【請求項2】入力した音声信号を予め定められた時間長
    のフレームに分割し、前記音声信号からスペクトル包絡
    を表すスペクトルパラメータとピッチ周期を表すピッチ
    パラメータとを求め、前記音声信号を前記ピッチパラメ
    ータに応じた小区間に分割し、少なくとも一つの小区間
    に対し前記スペクトルパラメータを用いて前記小区間の
    音声信号を表すマルチパルスの振幅と位置を予め定めら
    れた個数だけ求め、前記スペクトルパラメータにより構
    成される合成フィルタを前記マルチパルスにより駆動し
    て求めた合成信号と等化フィルタを通した音声信号との
    誤差電力を最小化するように前記等化フィルタのパラメ
    ータを求め、前記音声信号を等化フィルタにより処理し
    た処理信号を求め、前記処理信号を表すマルチパルスの
    振幅と位置を求め出力することを特徴とする音声符号化
    方式。
  3. 【請求項3】入力した音声信号を予め定められた時間長
    のフレームに分割し、前記音声信号からスペクトル包絡
    を表すスペクトルパラメータとピッチ周期を表すピッチ
    パラメータとを求め、前記音声信号を前記フレームと等
    しいかまたは短い小区間に分割し、前記小区間に対し前
    記スペクトルパラメータを用いて前記小区間の音声信号
    を表す駆動信号として予め定められた種類だけ有する符
    号帳から一種類選択し、前記スペクトルパラメータとピ
    ッチパラメータにより構成されるフィルタを前記駆動信
    号により駆動して求めた合成信号と等化フィルタを通し
    た音声信号との誤差電力を最小化するように前記等化フ
    ィルタのパラメータを求め、前記音声信号を等化フィル
    タにより処理した処理信号を求め、前記処理信号の駆動
    信号として前記符号帳から一種類を選択して出力するこ
    とを特徴とする音声符号化方式。
JP1118630A 1989-05-15 1989-05-15 音声符号化方式 Expired - Lifetime JP2817196B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1118630A JP2817196B2 (ja) 1989-05-15 1989-05-15 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1118630A JP2817196B2 (ja) 1989-05-15 1989-05-15 音声符号化方式

Publications (2)

Publication Number Publication Date
JPH02298999A JPH02298999A (ja) 1990-12-11
JP2817196B2 true JP2817196B2 (ja) 1998-10-27

Family

ID=14741288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1118630A Expired - Lifetime JP2817196B2 (ja) 1989-05-15 1989-05-15 音声符号化方式

Country Status (1)

Country Link
JP (1) JP2817196B2 (ja)

Also Published As

Publication number Publication date
JPH02298999A (ja) 1990-12-11

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP2626223B2 (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH0944195A (ja) 音声符号化装置
JP3179291B2 (ja) 音声符号化装置
JP3303580B2 (ja) 音声符号化装置
JP2817196B2 (ja) 音声符号化方式
JPS6238500A (ja) 高能率音声符号化方式とその装置
JP3003531B2 (ja) 音声符号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP3192051B2 (ja) 音声符号化装置
JP3102017B2 (ja) 音声符号化方法
JP2853170B2 (ja) 音声符号化復号化方式
JPH06130994A (ja) 音声符号化方法
JP2658794B2 (ja) 音声符号化方式
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH05165497A (ja) コード励振線形予測符号化器及び復号化器
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
JP2898641B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070821

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080821

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080821

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090821

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090821

Year of fee payment: 11