JPH05249999A

JPH05249999A - 学習型音声符号化装置

Info

Publication number: JPH05249999A
Application number: JP4278301A
Authority: JP
Inventors: Masami Akamine; 政巳赤嶺
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1991-10-21
Filing date: 1992-10-16
Publication date: 1993-09-28

Abstract

(57)【要約】【目的】８ｋbps 程度以下というような限られたビッ
トレートでより高品質の音声を合成できる学習型音声符
号化装置を提供することを目的とする。【構成】駆動信号ベクトルを格納した適応コードブッ
ク１１０と、入力音声信号を参照して適応コードブック
１１０から最適な駆動信号ベクトルを探索する最小歪探
索回路１１５と、探索された最適な駆動信号ベクトルを
用いて音声信号を合成する合成フィルタ１１２と、探索
された最適な駆動信号ベクトルの情報を蓄積するバッフ
ァ１３１と、蓄積された駆動信号ベクトルの情報を所定
長切り出してトレーニングベクトルを作成するトレーニ
ングベクトル作成部１３２と、このトレーニングベクト
ルを用いてコードブック内の駆動信号ベクトルを学習的
に逐次修正する学習部１３３を有する学習型音声合成装
置。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声符号化装置に係り、
特に音声信号を８ｋbps 程度以下の低ビットレートで符
号化するのに適した学習型音声符号化装置に関する。

【０００２】

【従来の技術】音声信号を低ビットレートで高能率に符
号化する技術は、自動車電話などの移動体通信や、企業
内通信において、電波の有効利用や通信コスト削減のた
めの重要な技術である。８ｋbps 以下のビットレートで
品質の優れた音声符号化方式として、ＣＥＬＰ(Code Ex
cited Linear Prediction)方式が知られている。

【０００３】このＣＥＬＰ方式は、ＡＴ＆Ｔベル研のM.
R.Schroeder 氏とB.S.Atal氏により“Code-Excited Lin
ear Prediction(CELP)“High-Quality Speech at Very
LowBit Rates ”Proc.ICASSP;1985,pp.937-939 （文献
１）で発表されて以来、商品質の音声が合成できる方式
として注目され、品質の改善や、計算量の削減など、種
々の検討がなされて来た。ＣＥＬＰ方式の特徴は、ＬＰ
Ｃ（Liner PredictiveCoding:線形予測符号化）合成フ
ィルタの駆動信号を駆動信号ベクトルとしてコードブッ
クに格納し、合成音声信号と入力音声信号の誤差を評価
しながら、最適な駆動信号ベクトルをコードブックから
探索する点にある。

【０００４】図９は、最新のＣＥＬＰ方式による音声符
号化装置のブロック図である。同図において、入力信号
であるサンプリングされた音声信号系列は入力端子６０
０からフレーム単位で入力される。フレームはＬ個の信
号サンプルからなり、サンプリング周波数が８ｋＨｚの
場合、一般にＬ＝１６０が用いられる。図９には示され
ていないが、駆動信号ベクトルの探索に先立ち、入力さ
れたＬサンプルの音声信号系列に対してＬＰＣ分析が行
われ、ＬＰＣ予測パラメータ｛α₁，ｉ＝１，２，…
ｐ｝が抽出される。このＬＰＣ予測パラメータα₁は、
ＬＰＣ合成フィルタ６３０に供給される。なお、ｐは予
測次数であり、一般にｐ＝１０が用いられる。ＬＰＣ合
成フィルタ６３０の伝達関数Ｈ(z) は、［数１］で与え
られる。

【０００５】

【数１】

【０００６】次に、音声信号を合成しながら最適な駆動
信号ベクトルを探索する過程について説明する。まず、
入力端子６００に入力された１フレームの音声信号か
ら、減算器６１０で前フレームでの合成フィルタ６３０
の内部状態が現フレームに与える影響が減算される。減
算器６１０から得られた信号系列は４個のサブフレーム
に分割され、各サブフレームの目標信号ベクトルとな
る。

【０００７】ＬＰＣ合成フィルタ６３０の入力信号であ
る駆動信号ベクトルは、適応コードブック６４０から選
択された駆動信号ベクトルに乗算器６５０で所定のゲイ
ンを乗算したものと、白色雑音コードブック７１０から
選択された雑音ベクトルに乗算器７２０で所定のゲイン
を乗算したものとを加算器６６０で加算することで得ら
れる。

【０００８】ここで、適応コードブック６４０は文献１
に記載されているピッチ予測分析を閉ループ動作または
合成による分析(Analysis by Synthesis) によって行う
ものであり、詳細はW.B.Kleijin D.J.Krasinski and R.
H.Ketchum,"Improved SpeechQuality and Efficient Ve
ctor Quantization in CELP",Proc.ICASSP,1988,pp.155
-158 （文献２）に述べられている。この文献２による
と、ＬＰＣ合成フィルタ６３０の駆動信号をピッチ探索
範囲ａ〜ｂ（ａ，ｂは駆動信号のサンプル番号であり、
通常ａ＝２０，ｂ＝１４７）にわたって遅延回路６７０
で１サンプルづつ遅延させることにより、ａ〜ｂサンプ
ルのピッチ周期に対する駆動信号ベクトルを作成し、こ
れがコードワードとして適応コードブックに格納され
る。

【０００９】最適な駆動信号ベクトルの探索を行う場
合、適応コードブック６４０から各ピッチ周期に対応す
る駆動信号ベクトルのコードワードが１個ずつ読み出さ
れ、乗算器６５０で所定のゲインと乗算される。そし
て、ＬＰＣ合成フィルタ６３０によりフィルタ演算が行
われ、合成音声信号ベクトルが生成される。生成された
合成音声信号ベクトルは、減算器６２０で目標信号ベク
トルと減算される。この減算器６２０の出力は聴感重み
付けフィルタ６８０を経て誤算計算回路６９０に入力さ
れ、平均２乗誤差が求められる。平均２乗誤差の情報は
更に最小歪探索回路７００に入力され、その最小値が検
出される。

【００１０】以上の過程は、適応コードブック６４０中
の全ての駆動信号ベクトルのコードワードについて行わ
れ、最小歪探索回路７００において平均２乗誤差の最小
値を与えるコードワードの番号が求められる。また、乗
算器６５０で乗じられるゲインも平均２乗誤差が最小に
なるよう決定される。

【００１１】次に、同様の方法で最適な白色雑音ベクト
ルの探索が行われる。すなわち、白色雑音コードブック
７１０から雑音ベクトルのコードワードが１個ずつ読み
出され、乗算器７２０でのゲインとの乗算、ＬＰＣ合成
フィルタ６３０でのフィルタ演算を経て、合成音声信号
ベクトルの生成、目標ベクトルとの平均２乗誤差の計算
が全ての雑音ベクトルについて行われる。そして、平均
２乗誤差の最小値を与える雑音ベクトルの番号及びゲイ
ンが求められる。なお、聴感重み付けフィルタ６８０は
減算器６２０から出力される誤差信号のスペクトルを整
形して、人間に知党される歪を低減するために用いられ
る。

【００１２】このようにＣＥＬＰ方式は、合成音声信号
と入力音声信号との誤差が最小になるような最適の駆動
信号ベクトルを求めているので、８ｋbps 程度の低ビッ
トレートでも高品質の音声を合成することができる。し
かし、８ｋbps 以下のビットレートでは、駆動信号の符
号化に割り当てられるビット数が十分でなくなるため
に、品質の劣化が知覚されてしまうことが確認されてい
る。

【００１３】

【発明が解決しようとする課題】上述したように、従来
のＣＥＬＰ方式は８ｋbps 程度以上のビットレートでは
高品質の音声を合成することができるが、これ以下のビ
ットレートでは駆動信号の符号化に割り当てられるビッ
ト数が不足して品質の劣化が知覚されてしまい、実用上
不十分であるという問題があった。

【００１４】本発明は上記の問題点に鑑みてなされたも
ので、８ｋbps 程度以下というような限られたビットレ
ートでより高品質の音声を合成できる学習型音声符号化
装置を提供することを目的とする。

【００１５】

【課題を解決するための手段】本発明は上記の課題を解
決するために、駆動信号ベクトルをコードワードとして
格納したコードブック（適応コードブック）と、入力音
声信号を参照して適応コードブックから最適な駆動信号
ベクトルを探索する探索手段と、この探索手段により探
索された最適な駆動信号ベクトルを用いて音声信号を合
成する合成フィルタと、前記最適な駆動信号ベクトルを
用いてトレーニングベクトルを作成するトレーニングベ
クトル作成手段と、この手段により作成されたトレーニ
ングベクトルを用いてコードブック内の駆動信号ベクト
ルを逐次修正する学習手段とを具備することを特徴とす
る。

【００１６】

【作用】本発明では適応コードブックから探索された最
適な駆動信号ベクトル、つまり合成フィルタを駆動して
実際に符号化に使用された駆動信号ベクトルを用い、こ
れをトレーニングベクトルとして、適応コードブック内
の駆動信号ベクトル、具体的には駆動信号ベクトルのう
ち所定の基準で選定した代表ベクトルが逐次修正され
る。この処理は符号化と並行して、新たな駆動信号ベク
トルが探索される毎に行われる。

【００１７】このように駆動信号ベクトルが逐次修正さ
れる学習処理によって、適応コードブック内の駆動信号
ベクトルは話者の音声をより正確に合成可能なベクトル
に逐次変化してゆく。この結果、例えば８ｋbps 程度以
下の低いビットレートでも、高品質の音声合成が可能と
なる。

【００１８】

【実施例】以下、図面を参照しながら本発明の実施例を
説明する。図１は、本発明の一実施例に係る学習型音声
符号化装置のブロック図である。

【００１９】図１において、入力端子１００には所定の
サンプリング周波数（例えば８ｋＨｚ）でサンプリング
された音声信号がフレーム単位で入力される。この入力
音声信号は、まずフレームバッファ１０１に入力され
る。フレームバッファ１０１では、入力音声信号系列を
Ｌ個（例えばＬ＝１６０）のサンプル単位で切出し、１
フレームの信号として記憶する。フレームバッファ１０
１からの１フレームの入力音声信号は、ＬＰＣ分析回路
１０２および重み付けフィルタ１０６へ供給される。

【００２０】ＬＰＣ分析回路１０２は、例えば自己相関
法を用いて入力音声信号に対してＬＰＣ（Linear Predi
ctive Coding：線形予測符号化）分析を行い、Ｐ個のＬ
ＰＣ予測係数｛α₁、ｉ＝１，２，…ｐ、｝、または反
射係数｛ｋ₁、ｉ＝１，２，…，ｐ｝を抽出する。抽出
された予測係数または反射係数は、符号化回路１０３に
おいて所定のビット数で符号化された後、重み付けフィ
ルタ１０６および重み付け合成フィルタ１０７，１１
２，１２２で利用される。

【００２１】重み付けフィルタ１０６は、適応コードブ
ック１１０および雑音コードブック１２０から合成フィ
ルタの駆動信号ベクトルを探索する際に、入力音声信号
系列に重み付けを行うものである。重み付け合成フィル
タ１０７，１１２，１２２内の合成フィルタの伝達関数
Ｈ(z) は、［数１］で記述される。この時、重み付けフ
ィルタ１０６の伝達関数Ｗ(z) は［数２］で表される。

【００２２】

【数２】但し、γは重み付けの強さを制御するパラメータである
（０≦γ≦１）。

【００２３】重み付け合成フィルタ１０７，１１２，１
２２は、［数１］に示したＨ(z) なる伝達関数の合成フ
ィルタと、Ｗ(z) なる伝達関数の重み付けフィルタを縦
続接続したフィルタであり、その伝達関数Ｈ_w(z) は
［数３］で記述される。

【００２４】

【数３】

【００２５】本実施例のように重み付けフィルタ１０６
を用いると、聴感上の符号化歪を低減することが可能に
なる。また、本実施例では重み付けフィルタ１０６を駆
動信号ベクトルの探索ループの外に設けた構成になって
おり、この結果、探索に要する計算量が大幅に削除され
る。

【００２６】さらに、重み付け合成フィルタ１１２，１
２２が駆動信号ベクトルの探索に影響を与えないよう
に、初期メモリを持った重み付け合成フィルタ１０７が
設けられている。この重み付け合成フィルタ１０７は、
前フレームの最後に重み付け合成フィルタ１１２，１２
２が保持していた内部状態を初期状態として持つ。

【００２７】そして、重み付け合成フィルタ１０７の零
入力応答ベクトルを作成し、減算器１０８において重み
付けフィルタ１０６の出力から上記零入力応答ベクトル
を減算する。これにより、重み付け合成フィルタ１１
２，１２２の初期状態を零とすることができ、前フレー
ムの影響を考慮せずに駆動信号ベクトルの探索を行うこ
とができる。以上の処理は、全てフレーム単位で行われ
る。次に、フレームをＭ個（通常、Ｍ＝４）のサブフレ
ームに分割し、サブフレーム単位で行う駆動信号ベクト
ル探索の処理について説明する。

【００２８】最適な駆動信号ベクトルの探索は適応コー
ドブック１１０、雑音コードブック１２０の順に行われ
る。適応コードブック１１０には、Ｋ次元（Ｋ＝Ｌ／
Ｍ）の駆動信号ベクトルが２０サンプルから１４７サン
プルのピッチ周期に対応できるように１２８個格納され
ている。駆動信号ベクトルの探索に際しては、まず適応
コードブック１１０から、後述するインデックスｊで指
定される駆動信号ベクトルＸ_jを順次読み出し、乗算器
１１１でＸ_jに所定のゲインβを乗じた後、重み付け合
成フィルタ１１２に供給する。重み付け合成フィルタ１
１２では、ゲインβが乗じられた駆動信号ベクトルにフ
ィルタリング演算を施して合成音声ベクトルを作成す
る。

【００２９】一方、フレームバッファ１０１から読み出
された入力音声信号は、重み付けフィルタ１０６によっ
て重み付けがなされた後、減算器１０８で前フレームの
影響が差し引かれる。この減算器１０８から出力される
音声信号ベクトルＹを目標ベクトルとして、減算器１１
３で重み付け合成フィルタ１１２からの合成音声ベクト
ルとの誤差ベクトルＥ_jが計算される。そして、２乗誤
差計算回路１１４で誤差の２乗和‖Ｅ_j‖が計算され、
この‖Ｅ_j‖の最小値および最小値を与えるインデック
スｊが最小歪探索回路１１５で検出される。このインデ
ックスｊが適応コードブック１１０とマルチプレクサ１
４２に与えられる。

【００３０】具体的には、誤差ベクトルＥ_jは例えば
［数４］で表わされる。この誤差ベクトル‖Ｅ_j‖をβ
で偏微分して零と置くことによって、βを最適化した場
合の‖Ｅ_j‖の最小値が［数５］で表される。但し、β
は乗算器１１１で与えられるゲインである。

【００３１】

【数４】

【００３２】

【数５】

【００３３】ここで、‖Ｘ‖は２乗ノルム、（Ｘ，Ｙ）
は内積をそれぞれ表し、Ｈは［数６］で与えられる重み
付け合成フィルタ（伝達関数：Ｈ_w(z) ）のインパルス
応答行列である。

【００３４】

【数６】

【００３５】［数５］から明らかなように、適応コード
ブック１１０からの駆動信号ベクトルの探索は、全ての
コードワードＸ_jに対し［数５］の右辺第２項を計算
し、それが最大になるインデックスｊを検出することに
よって行う。

【００３６】このようにして適応コードブック１１０か
ら最適な駆動信号ベクトルＸ_optが探索されると、減算
器１１３で目標ベクトルＹからＸ_optに対応する重み付
け合成フィルタ１１２の出力が差し引かれ、この減算器
１１３の出力が雑音コードブック１２０からの雑音ベク
トル探索の目標ベクトルとされる。雑音コードブック１
２０からの雑音ベクトルの探索も、適応コードブック１
１０からの駆動信号ベクトルの探索と全く同様に行うこ
とができる。この雑音ベクトル１２０からの探索で得ら
れたコードベクトルをＮ_optとすると、合成フィルタの
駆動信号ベクトルＸは

【００３７】

【数７】と表される。但し、β，ｇはそれぞれ減算器１１１、１
２１において適応コードブック１１０および雑音コード
ブック１２０から探索された駆動信号ベクトルおよび雑
音ベクトルに与えられるゲインである。

【００３８】このように求められた駆動信号ベクトル
は、過去のサブフレームで求められた駆動信号ベクトル
と結合された後、２０〜１４７サンプルに渡って遅延回
路１５０で１サンプルずつ遅延され、Ｋサンプル単位で
適応コードブック１１０に格納される。次に本発明の要
旨である雑音コードブック１２０内の駆動信号ベクトル
を学習により逐次修正する構成について説明する。図１
においては、この学習のためにトレーニングベクトル作
成部１６２および学習部１６３が設けられている。

【００３９】雑音コードブック１２０からの駆動信号ベ
クトルの探索があるサブフレームで終了すると、最適な
駆動信号ベクトルＮ_optが雑音コードブック１２０から
出力される。トレーニングベクトル作成部１６２はこの
駆動信号ベクトルをトレーニングベクトルＶ_tに設定す
る。学習部１６３では、トレーニング作成部１６２から
のトレーニングベクトルを用いて雑音コードブック１２
０に格納されている駆動信号ベクトルを学習により逐次
修正する。この修正は符号化の処理と並行して行う。

【００４０】図２に、この学習の手順を示す。まず、ト
レーニングベクトル作成部１６２からのトレーニングベ
クトルＶ_tを入力する（Ｓ１）。次に雑音コードブック
１２０内に格納されている複数個の駆動信号ベクトルの
うち、修正（更新）するベクトルを設定する（更新領域
設定Ｓ２）。更新領域の設定法としては、トレーニング
ベクトルＶ_tから一定のユークリッド距離内に存在する
代表ベクトルを、更新領域に設定する方法を用いる。こ
こで雑音コードブック内の駆動信号ベクトルを代表ベク
トルと言い換えている。また更新領域の大きさは時間と
共に小さくなるものとする。時刻ｉにおける更新領域を
ＮＥ(i) とおくと、ＮＥ(i) は次の性質を有するものと
する。

【００４１】

【数８】

【００４２】次に、更新領域内の代表ベクトルをトレー
ニングベクトルＶ_tを用いて、更新（修正）する。時刻
ｉにおける更新領域に含まれる代表ベクトルＶ_j(i)
は、次式に従って更新される。

【００４３】

【数９】ここで、α(i) は修正の大きさを制御する変数であり、
次の性質をもつ。

【００４４】

【数１０】

【００４５】そして、以上の更新は、更新が収束したか
否かが判定され（Ｓ４）、収束するまで続けられる。収
束の判定は、次式を満足するかによって行われ、満たす
場合に収束したと判定する。

【００４６】

【数１１】

【００４７】この学習法は、Ｋｏｈｏｎｅｎのアルゴリ
ズムとして知られるニューラルネットワークの学習法の
一つである。このＫｏｈｏｎｅｎのアルゴリズムについ
ては、例えばT.Kohonen 氏によるSelf-Organization an
d Associative Memory,Springer-Verlag(1984)（文献
３）に記載されているので、詳細な説明は省略する。な
お、学習法はこれに限られるものではなく、他の学習法
を用いてもよい。

【００４８】このような学習によって、雑音コードブッ
ク１２０内の駆動信号ベクトルは、トレーニングベクト
ルとして用いられる駆動信号ベクトルと統計的に類似し
た性質を持つようになる。前述したように、合成フィル
タの駆動信号は符号化対象である入力音声信号と合成信
号との誤差が最小となるように作成される。従って、こ
の駆動信号を用いて学習を行い、雑音コードブック１２
０内の駆動信号ベクトルを修正することによって、入力
音声との差が少ない、つまり歪の少ない合成音声を生成
するのに適した雑音コードブックが作成されることにな
る。

【００４９】しかも、学習は音声符号化の処理と並行し
て行われるので、入力音声信号の性質の変化に対応して
雑音コードブック１２０内の駆動信号ベクトルの性質も
変化する。この結果、符号化レートが８ｋbps 以下とい
うような低ビットレートで、駆動信号に割り当てられる
ビット数が少ない場合でも、高品質の音声を合成するこ
とが可能となる。

【００５０】換言すれば、従来のＣＥＬＰ方式では入力
音声信号の性質が変化するのに関らず、常に同一の雑音
コードブックを用いて音声信号を再生している。これに
対して、本実施例では上述のような学習動作によって、
入力音声信号に対する合成信号の誤差がより小さくなる
ように、雑音コードブック内の駆動信号ベクトルが変化
していく。これにより、駆動信号に割り当てられるビッ
ト数が同じであれば、より高品質の合成音声が得られ
る。

【００５１】以上の処理の過程で求められた符号化パラ
メータは、アルチプレクサ１４２で多重化され、出力端
子１４３から伝送路へ符号化出力として送出される。す
なわち、マルチプレクサ１４２ではＬＰＣ分析回路１０
２で求められたＬＰＣ予測係数の情報を符号化回路１０
３で符号化したコードと、最小歪探索回路１１５で求め
られた適応コードブック１１０のインデックスのコード
と、乗算器１１１で乗じられるゲインの情報をゲイン符
号化回路１４０で符号化したコードと、最小歪探索回路
１２５で求められた雑音コードブック１２０のインデッ
クスのコード、および乗算器１２１で乗じられるゲイン
の情報をゲイン符号化回路１４１で符号化したコードが
多重化される。次に、図１の音声符号化装置に対応した
音声復号化装置の構成を図３により説明する。

【００５２】図３において、入力された符号化パラメー
タは、まずデマルチプレクサ２０１で個々のパラメータ
に分解された後、復号化器２０２，２０３，２０４でそ
れぞれ復号化される。そして、復号化された適応コード
ブックのインデックス及びゲイン、雑音コードブックの
インデックルおよびゲインに基づいて駆動信号が作成さ
れる。この駆動信号が合成フィルタ２１５でフィルタリ
ングされることによって、合成音声信号が作成される。
この合成音声信号は、ポストフィルタ２１６でスペクト
ルの整形が行われ、聴覚的な歪が抑圧された後、出力端
子２１７より出力される。

【００５３】なお、図３においては雑音コードブック２
１２内の駆動信号ベクトルの学習のためにトレーニング
ベクトル作成部２６２および学習部２６３が設けられて
いる。これらは、それぞれ図１に示した音声符号化装置
におけるトレーニングベクトル作成部１６２および学習
部１６３と同一機能を有するものであり、その動作も同
じであるから、詳細な説明は省略する。

【００５４】本実施例から明らかなように本発明では、
トレーニングに用いる信号を符号化，復号化の双方で得
られる信号に設定している。この結果コードブックの学
習のため、何ら補助情報を伝送する必要はなくビットレ
ートの増加はない。次に、図４に本発明の第２の実施例
に係る学習型音声符号化装置のブロック図を示す。

【００５５】第１の実施例では雑音コードブックの内容
を学習によって更新する構成となっていたが、適応コー
ドブックの内容を更新する構成とすることもできる。本
実施例は適応コードブックの学習を行う一構成例であ
る。図４においてはこの学習のためにバッファ１３１，
トレーニングベクトル作成部１３２，学習部１３３，メ
モリ１３４，および遅延回路１３５が設けられている。

【００５６】適応コードブック１１０からの駆動信号ベ
クトルと雑音コードブック１２０からのベクトルの探索
があるサブフレームで終了すると、加算器１３０から新
たな合成フィルタの駆動信号ベクトルが出力される。バ
ッファ１３１は、この新たな駆動信号ベクトルを過去の
サブフレームの駆動信号ベクトルに加えて蓄積する。具
体的には、バッファ１３１は図５に示すように蓄積デー
タ長がＭ_Bサンプル分のシフトレジスタにより構成さ
れ、新たに加算器１３０から出力された駆動信号ベクト
ルを含めて、合計Ｍ_Bサンプル分の駆動信号ベクトルの
情報を蓄積する。バッファ１３１内の駆動信号ベクトル
の情報は、トレーニングベクトル作成部１３２に読み出
される。トレーニングベクトル作成部１３２は、図５に
示すようにバッファ１３１内から駆動信号ベクトルの情
報をベクトルの次元数Ｋの長さを１単位として、順次ｍ
サンプルずつシフトしながら切り出し、これをトレーニ
ングベクトルとして学習部１３３へ送る。図５ではｍ＝
１となっているが、ｍ＝２，３といった値でもよい。ま
た、図５ではＭ_B＝２Ｋとしている。例えばｍ＝１、Ｍ
_B＝２Ｋの場合、トレーニングベクトルとしてはＫ−１
個のベクトルが作成されることになる。

【００５７】学習部１３３では、トレーニングベクトル
作成部１３２からのトレーニングベクトルを用いて、適
応コードブック１１０に格納されている駆動信号ベクト
ルを学習により逐次修正する。この修正は符号化の処理
と並行して行う。

【００５８】図６に、この学習の手順を示す。まず、ト
レーニングベクトル作成部１３２からトレーニングベク
トルを入力する（Ｓ１）。次に、メモリ１３４に格納さ
れている複数個の駆動信号ベクトルの内、入力されたト
レーニングベクトルとの類似度が最大のベクトルをサー
チする（Ｓ２）。なお、類似度としてはユークリッド距
離の逆数を用いることができる。またメモリ１３４内の
駆動信号ベクトルは図７に示すように長さがＮの信号系
列としてシフトレジスタに格納されている。駆動信号ベ
クトルは、ベクトルの次元数Ｋの長さを１単位としてシ
フトレジスタの右端から左へ１サンプルずつシフトしな
がら切り出すことで生成される。適応コードブック内の
駆動信号ベクトルの総数をｎとすると

【００５９】

【数１２】の関係がある。次に、Ｓ２のステップで得られた類似ベ
クトルＣ_jをトレーニングベクトルＶ_tを用いて、以下
のように更新する（Ｓ３）。

【００６０】

【数１３】

【００６１】ここで、αはＣ_jとＶ_tの加重平均の重み
を制御する係数であり、予め定めた定数又は前述の類似
度によって適応的に変化する値を取ることができる。メ
モリ１３４の駆動信号ベクトルの更新は、上式によって
行われるが、実際には駆動信号ベクトルＣ_jが切り出さ
れたシフトレジスタ中の信号系列の一部が更新される。
以上の処理をＳ４でトレーニングベクトルがなくなった
と判定されるまで繰り返し行うことにより、メモリ１３
４内の駆動信号ベクトルの学習が行われる。この学習が
終了するとメモリ１３４のシフトレジスタに格納されて
いる信号系列を、駆動信号ベクトルの次元数Ｋの長さを
１単位として遅延回路１３５で１サンプルずつシフトし
ながら切り出し適応コードブック１１０に格納する。こ
れにより適応コードブックの学習が終了する。なお適応
コードブックは実際に用意する必要はなくメモリ１３４
を仮想的に適応コードブックとすることができる。

【００６２】このような学習によって、適応コードブッ
ク１１０内の駆動信号ベクトルは、トレーニングベクト
ルとして用いられる駆動信号ベクトルと統計的に類似し
た性質を持つようになる。しかも、学習は音声符号化の
処理と並行して行われるので、入力音声信号の性質の変
化に対応して適応コードブック１１０内の駆動信号ベク
トルの性質も変化する。この結果、符号化レートが８ｋ
bps 以下というような低ビットレートで駆動信号の符号
化に割り当てられるビット数が少ない場合でも、高品質
の音声を合成することが可能となる。

【００６３】また、従来のＣＥＬＰ方式では、無声音か
ら有声音へと入力音声信号の性質が急に変化した場合、
適応コードブックの内容が無声音区間の駆動信号ベクト
ルだけになるので有声音を合成するために必要な周期的
な駆動信号を生成することが直ちにはできず、入力音声
信号の変化への追従が遅くなる。この結果、合成音声の
明瞭性が悪くなる問題があった。これに対して、本実施
例では、入力音声信号が無声音から有声音へ急に変化し
た場合でも、上述の学習動作によって過去の有声音区間
の駆動信号ベクトルが適応コードブック内に保存される
ので、この駆動信号ベクトルを用いて有声音を合成する
ことができ、明瞭な合成音声を得ることが可能になる。
さらに、本実施例における駆動信号ベクトルは図７から
明らかなように互いにオーバラップする関係にあり、適
応コードブックから最適な駆動信号ベクトルを探索する
のに要する演算量を削減することができる。従来の適応
コードブックも文献２で記述されているように各ベクト
ルがオーバラップする構造となっており、最適な駆動信
号ベクトルの探索が効率良く行われる。本実施例では学
習動作によって適応コードブックの内容がランダムに更
新されても、オーバラップの構造が崩れないようになっ
ており、効率的な駆動信号ベクトルの探索が可能とな
る。オーバラップ構造を利用した効率的な探索法につい
ては、文献２に記述されているので、ここでは省略す
る。以上の処理の過程で求められた符号化パラメータ
は、マルチプレクサ１４２で多重化され、出力端子１４
３から伝送路へ符号化出力として送出される。

【００６４】図４の音声符号化装置に対応した音声復号
化装置の構成は図８のようになる。図８においては適応
コードブック２１０内の駆動信号ベクトルの学習のため
にメモリ２２４，遅延回路２２５が設けられている。こ
れらは、それぞれ図４に示した音声符号化装置における
メモリ１３４，遅延回路１３５と同一機能を有するもの
であり、その動作も同じであるから、詳細な説明は省略
する。

【００６５】

【発明の効果】以上説明したように、本発明によれば適
応コードブック及び雑音コードブック内の駆動信号ベク
トルはトレーニングベクトルとして用いられる駆動信号
と統計的に同じ性質を持つようになる。一方、合成フィ
ルタの駆動信号は符号化対象である入力音声信号を参照
して、適応コードブック及び雑音コードブックから最適
な駆動信号ベクトル、すなわち入力音声信号と合成フィ
ルタによる合成音声信号との誤差が最小となるような駆
動信号ベクトルが探索されることで作成される。従っ
て、この最適な駆動信号ベクトルを用いて学習的に適応
コードブック及び雑音コードブック内の駆動信号ベクト
ルを逐次修正することによって、入力音声信号に対する
歪がより小さくなるような合成音声を作成するのに適し
た適応コードブック及び雑音コードブックを作成するこ
とができる。また、学習の処理自体は符号化の処理と並
行して進めることができるので、入力音声信号の性質の
変化に対応して適応コードブック及び雑音コードブック
の性質も変化することになる。

【００６６】この結果、上記のような学習を行わない従
来の方式では駆動信号に割り当てるビット数の制限から
品質を確保することが困難であった８ｋbps 程度以下の
低ビットレートにおいても、本発明によれば品質の高い
音声を合成することが可能となる。しかも、学習のトレ
ーニング信号を符号化，復号化の双方の処理で得ること
のできる駆動信号ベクトルに設定しているので、学習の
ため何ら補助情報を伝送する必要はなく、ビットレート
の増加もない。

【図面の簡単な説明】

【図１】本発明の第１の実施例に係る学習型音声符号
化装置のブロック図。

【図２】同実施例における駆動信号ベクトルの学習の
手順を説明するための図。

【図３】同実施例における音声復号化装置のブロック
図。

【図４】本発明の第２の実施例に係る学習型音声符号
化装置のブロック図。

【図５】同実施例におけるトレーニングベクトルの作
成法を説明するための図。

【図６】同実施例における駆動信号ベクトルの学習の
手順を説明するための図。

【図７】同実施例に係るメモリ内において、駆動信号
ベクトルが格納されている様子を示す図。

【図８】同実施例における音声復号化装置のブロック
図。

【図９】従来の音声符号化装置における駆動信号ベク
トル探索に係る構成を示すブロック図。

【符号の説明】

１００…音声信号入力端子１０２…ＬＰＣ
分析回路１０３…符号化回路１０６…重み付
けフィルタ１０７…重み付け合成フィルタ１１０…適応コ
ードブック１１２…重み付け合成フィルタ１１４…２乗誤
差計算回路１１５…最小歪探索回路１２０…雑音コ
ードブック１２２…重み付け合成フィルタ１２４…２乗誤
差計算回路１２５…最小歪探索回路１３１…バッフ
ァ１３２…トレーニングベクトル作成部１３３…学習部１３４…メモリ１３５…遅延回
路１４０…ゲイン符号化回路１４１…ゲイン
符号化回路１４２…マルチプレクサ１４３…出力端
子１５０…遅延回路１６２…トレー
ニングベクトル作成部１６３…学習部

Claims

【特許請求の範囲】

【請求項１】駆動信号ベクトルをコードワードとして格
納したコードブックと、入力音声信号を参照して前記コードブックから最適な駆
動信号ベクトルを探索する探索手段と、この探索手段により探索された最適な駆動信号ベクトル
を用いて音声信号を合成する合成フィルタと、前記最適な駆動信号ベクトルを用いてトレーニングベク
トルを作成するトレーニングベクトル作成手段と、この手段により作成されたトレーニングベクトルを用い
て前記コードブック内の駆動信号ベクトルを逐次修正す
る学習手段とを具備することを特徴とする学習型音声符
号化装置。
【請求項２】駆動信号ベクトルをコードワードとして格
納した複数のコードブックと、入力音声信号を参照して前記複数のコードブックから最
適なコードワードを夫々探索する探索手段と、この探索手段により探索された最適なコードワードを駆
動信号ベクトルとして用いて音声信号を合成する合成フ
ィルタと、前記最適なコードワードを用いてトレーニングベクトル
を作成するトレーニングベクトル作成手段と、この手段により作成されたトレーニングベクトルを用い
て該当する少なくとも１つの前記コードブック内のコー
ドワードを逐次修正する学習手段とを具備することを特
徴とする学習型音声符号化装置。
【請求項３】駆動信号ベクトルをコードワードとして格
納した複数のコードブックと、入力音声信号を参照して前記複数のコードブックから最
適なコードブックを夫々探索する探索手段と、この探索手段により探索された最適なコードワードを駆
動信号ベクトルとして用いて音声信号を合成する合成フ
ィルタと、前記最適なコードワードより得られた駆動信号ベクトル
を用いてトレーニングベクトルを作成するトレーニング
ベクトル作成手段と、この手段により作成されたトレーニングベクトルを用い
て該当する少なくとも１つの前記コードブック内のコー
ドワードを逐次修正する学習手段とを具備することを特
徴とする学習型音声符号化装置。