JP3471889B2

JP3471889B2 - 音声符号化方法及び装置

Info

Publication number: JP3471889B2
Application number: JP06526594A
Authority: JP
Inventors: 皇天田; 政巳赤嶺; 公生三関; 進神庭; 正浩押切
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1994-04-01
Filing date: 1994-04-01
Publication date: 2003-12-02
Anticipated expiration: 2018-12-02
Also published as: JPH07271397A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、線形予測分析型の音声
符号化方法及び装置、特にＣＥＬＰなどの複数の駆動ベ
クトルを合成フィルタに入力し、得られた合成音声ベク
トルと入力音声を聴感重みの下で比較して歪みを最小に
する駆動ベクトルを符号帳から探索する音声符号化方法
及び装置に関する。

【０００２】

【従来の技術】電話帯域の音声を４ｋｂｐｓ程度の伝送
レートで符号化する方式として、ＣＥＬＰ( Code Excit
ed Linear Prediction )方式は有効な方式の一つであ
る。このＣＥＬＰ方式での処理は、フレーム単位に分割
された入力音声から声道をモデル化した音声合成フィル
タを求める処理と、このフィルタの入力信号に当たる駆
動ベクトルを求める処理に大別される。これらのうち、
後者は符号帳に格納された複数の駆動ベクトルを一つず
つ音声合成フィルタに通し、合成音声と入力音声を比較
する符号帳探索と呼ばれる処理が必要であり、この処理
は多くの計算量を必要とする。本発明は符号帳探索にお
ける計算量削減に関するものである。

【０００３】ＣＥＬＰ方式に関しては、例えばM.R.Schr
oeder and B.S.Atal,"Code ExcitedLinear Prediction
(CELP): High Auality Speech at Very Low Bit Rate
s", Proc. ICASSP,pp.937-940, 1985 および W.S.Klei
jin, D.J.Krasinski et al. "ImprovedSpeech Quality
and Efficient Vector Quantization in SELP", Proc.I
CASSP, pp.155-158, 1988 で詳しく述べられている。

【０００４】図９は、ＣＥＬＰ方式による音声符号化装
置の概略を示すブロック図である。まず、符号帳探索に
ついて説明する。駆動ベクトルとしては２系統が用意さ
れており、これらは適応符号帳９０１と雑音符号帳９０
２に格納されている。適応符号帳９０１は過去の駆動ベ
クトル群を格納した可変の符号帳であるのに対し、雑音
符号帳９０２は決まったパターンを複数格納している固
定の符号帳である。端子９０６に入力される入力音声ベ
クトルＲを線形予測分析部９０７で分析し、合成フィル
タ９０８の特性を求めた後、適応符号帳９０１および雑
音符号帳９０２からそれぞれ１つずつ最適な駆動ベクト
ルを選び出す。

【０００５】具体的には、符号帳９０１，９０２から一
つずつ取り出された駆動ベクトルを合成フィルタ９０８
に通し、得られた出力（合成音声ベクトル）を入力音声
ベクトルＲと比較して、入力音声ベクトルＲに最も近い
最適合成音声ベクトルを生成する駆動ベクトルを符号帳
９０１，９０２から探索する。

【０００６】次に、駆動ベクトルの探索方法を数式を用
いて説明する。符号帳９０１，９０２から取り出された
ｉ番目の駆動ベクトルをｙｉ、これを合成フィルタ９０
８に通して得られた合成音声ベクトルをＹｉ、入力音声
ベクトルをＲと表すとき、次式に示すＹｉとＲの差の２
乗和、Ｅ＝｜Ｒ−αＹｉ｜² （１）を最小にする駆動ベクトルｙｉを探索するのが一般的で
ある。但し、αはｙｉが選ばれた場合の最適ゲインであ
り、図９ではゲイン回路９０３，９０４によって付与さ
れる。この式をαで偏微分した式をゼロとおくことによ
り、最適ゲインαが求まる。これを式（１）に代入して
整理すると、Ｅ＝｜Ｒ｜^２−（Ｒ，Ｙｉ）²／｜Ｙｉ｜^２（２）となる。この式の第１項は駆動ベクトルによらない定数
だから、最適ゲインαのもとで最適な駆動ベクトルを探
すことは式（２）の第２項；（Ｒ，Ｙｉ）^２／｜Ｙｉ｜² （３）を評価式とし、これを最大にするｙｉを探すことに等し
い。全ての候補についてこの評価式を計算するため、符
号帳探索はＣＥＬＰ方式全体の中で最も計算量を必要と
する部分である。

【０００７】そこで簡略化した評価式を用いて、Ｍ個の
駆動ベクトル候補からなる符号帳の中からＮ個の候補
（１＜Ｎ＜Ｍ）を選び、これらＮ個の候補の中から上記
の評価式を用いて最適な候補を1 つに絞るという手法が
提案されている。この手法は、詳しくは特開平５−１０
０６９７で述べられている。符号帳から得られるＭ個の
駆動ベクトルから次の評価式；Ｅ＝（Ｒ，Ｙｉ）² （４）を大きくするＮ個を選ぶ前半の作業は予備選択と呼ば
れ、Ｎ個の候補を式（３）を用いて１つに絞る後半の作
業は本選択と呼ばれている。この手法によれば、計算量
のかかる本選択は予備選択で選ばれたＮ個に対して行う
だけで済み、予備選択をせずに符号帳のＭ個の候補全て
に対して本選択を行う場合に比べ大幅に計算量が削減で
きる。

【０００８】この従来の予備選択法は、式（３）の分母
に当たるＹｉのパワがほぼ一定であるという仮定に基づ
いていると考えられる。しかし、実際にはパワ｜Ｙｉ｜
²は駆動ベクトルｙｉのパワが必ずしも一定でないこと
や、たとえ一定だとしても合成フィルタの利得が駆動ベ
クトルに依存し定数にならないことを考えると、パワ｜
Ｙｉ｜²を一定とする仮定には無理があり、これが予備
選択の精度の低下を招いているという問題があった。

【０００９】近年、古典的なＣＥＬＰ方式で提案された
雑音符号帳を使用することは少なくなっており、計算量
およびメモリ量を削減し、より高音質な符号化音声を得
るために、構造化された雑音符号帳を用いることが多
い。例えば、長い１本の雑音信号から１フレーム分の駆
動ベクトルを一つ前の駆動部ベクトルと重ねながら切り
出してくるオーバーラッピング符号帳、適応ベクトル検
索部で得られたピッチ情報を基に駆動ベクトルを周期化
するピッチ同期型符号帳、一つの駆動ベクトルをサンプ
ル間に挟み込む０の数を変えて使用する適応密度符号帳
などがある。

【００１０】これら構造化された符号帳は構造上、駆動
ベクトルのパワを一定にしづらい仕組みになっており、
このような状況で｜Ｙｉ｜²が一定と仮定する従来の予
備選択法を用いることは予備選択の精度を低下させ、結
果的に符号化音声の品質を劣化させる。また、符号化音
声の品質を保つために予備選択で残す候補数を増やす
と、本選択での計算量が増加してしまうという問題が生
じる。

【００１１】

【発明が解決しようとする課題】上述したように、構造
化された符号帳を用いて駆動ベクトルの予備選択を行う
場合、駆動ベクトルのパワが一定でないために、従来の
予備選択法では駆動ベクトルの選択精度が必ずしも良い
とは言えないという問題があった。

【００１２】本発明は、駆動ベクトルの高精度な予備選
択を可能として、本選択に渡す駆動ベクトルの候補数を
符号化音声の品質を保ったまま削減でき、符号化に要す
る計算量の大半を占める本選択での計算量を低下させる
ことを可能とした音声符号化方法及び装置を提供するこ
とを目的とする。

【００１３】

【課題を解決するための手段】本発明は、駆動ベクトル
を生成する駆動ベクトル生成手段と、この駆動ベクトル
生成手段により生成された駆動ベクトルを入力して合成
音声ベクトルを生成する合成手段と、駆動ベクトル生成
手段により生成された駆動ベクトルから少なくとも一つ
の駆動ベクトルを選択する予備選択手段と、この予備選
択手段により選択された駆動ベクトルから最適な駆動ベ
クトルを選択する本選択手段とを有する音声符号化装置
において、予備選択手段を駆動ベクトルのパワに基づく
重み係数で重み付けされた評価式によって駆動ベクトル
の予備選択を行うように構成したことを骨子とする。

【００１４】すなわち、第１の発明では所定の単位期間
に分割された入力音声から得られる目標ベクトル（入力
音声ベクトル）と合成音声ベクトルとの内積値の大きさ
を駆動ベクトル生成手段により生成された駆動ベクトル
をパラメータとする重み関数で重み付けした値をより大
きくする駆動ベクトルを選択するように予備選択手段を
構成する。

【００１５】これを数式で表すと、駆動ベクトル生成手
段から生成されるＭ個の駆動ベクトルｙｉ（ｉ＝１，
…，Ｍ）をそれぞれ合成手段に入力して、目標ベクトル
Ｒに最も近い合成音声ベクトルを出力する駆動ベクトル
を探し出す場合、予備選択手段において、ｙｉをパラメ
ータとする重み係数Ｗ（ｙｉ）を用いた予備選択の評価
式；Ｅ＝Ｗ（ｙｉ）（Ｒ，Ｙｉ）² （５）の値を大きくするＮ個（１＜Ｎ＜Ｍ）のｙｉを予備選択
候補として選び出す。ただし、Ｙｉはｙｉを音声合成手
段に入力して得られた出力である。

【００１６】また、第２の発明では駆動ベクトル生成手
段が符号帳を有し、該符号帳から所定のインデックスで
指定された一つの駆動ベクトルを切り出して生成する場
合、所定の単位期間に分割された入力音声から得られる
目標ベクトルと合成音声ベクトルとの内積値の大きさを
駆動ベクトル生成手段の符号帳に格納された過去の駆動
ベクトル群およびインデックスをパラメータとする重み
関数で重み付けした値をより大きくする少なくとも一つ
の駆動ベクトルを選択するように予備選択手段を構成す
る。

【００１７】これを数式で表すと、符号帳に格納された
駆動ベクトル群をＣとし、インデックスをｉとしたと
き、目標ベクトルＲに最も近い合成音声ベクトルを出力
する駆動ベクトルを探し出す場合、予備選択手段におい
て、Ｃとｉをパラメータとする重み係数Ｗ（Ｃ，ｉ）を
用いた予備選択の評価式；Ｅ＝Ｗ（Ｃ，ｉ）（Ｒ，Ｙｉ）² （６）の値を大きくする駆動ベクトルを予備選択候補として選
び出す。

【００１８】さらに、第３の発明では所定の単位期間に
分割された入力音声から得られる目標ベクトルと最適合
成音声ベクトルを求めた後、合成手段により生成された
合成音声ベクトルを最適合成音声ベクトルに対し直交化
した直交化ベクトルを求め、この直交化ベクトルと目標
ベクトルの内積値の大きさを駆動ベクトル生成手段によ
り生成された駆動ベクトルをパラメータとする重み係数
で重み付けした値をより大きくする駆動ベクトルを選択
するように予備選択手段を構成する。

【００１９】これを数式で説明すると、目標ベクトルＲ
を近似する最適合成音声ベクトルＸが既に求まっている
条件のもとで、Ｒを近似する２つ目の合成音声ベクトル
を出力する駆動ベクトルを駆動ベクトル生成手段から生
成されるＭ個の駆動ベクトルｙｉ（ｉ＝１，…Ｍ）の中
から探索する場合、ｙｉの合成音声ベクトルＹｉをＸに
対し直交化して、直交化ベクトルＹｖｉを求めた後、ｙ
ｉをパラメータとする重み係数Ｗ（ｙｉ）を用いた予備
選択の評価式；Ｅ＝Ｗ（ｙｉ）（Ｒ，Ｙｖｉ）² （７）の値を大きくするＮ個（１＜Ｎ＜Ｍ）のｙｉを予備選択
候補として選び出す。

【００２０】

【作用】本発明における予備選択での評価式；Ｅ＝Ｗ（ｙｉ）（Ｒ，Ｙｉ）² （８）は、次の根拠に基づき重みＷ（ｙｉ）を掛けない従来の
予備選択の評価式である式（４）より精度が高いと言え
る。

【００２１】本選択の評価式である式（３）の分母は合
成音声ベクトルのパワであり、駆動ベクトルｙｉと合成
フィルタの利得Ｇ（ｙｉ）を用いて｜Ｙｉ｜²＝Ｇ（ｙｉ）²｜ｙｉ｜² （９）と表せる。Ｇ（ｙｉ）はｙｉによって異なる値を取る
が、ｙｉのスペクトルの形がほぼ同じであれば、一定値
と仮定することができる。実際に符号帳は雑音系列など
で構成されることが多く、駆動ベクトル間でスペクトル
の分布はそれほど大きく異ならないのが普通である。そ
のためＧ（ｙｉ）を一定値と仮定するのは現実的であ
り、Ｇ＝Ｇ（ｙｉ）と定数と置くことにより式（９）
は、｜Ｙｉ｜²＝Ｇ²｜ｙｉ｜² （１０）と書ける。この式は合成音声ベクトルＹｉのパワは駆動
ベクトルｙｉのパワに合成フィルタの利得にあたる定数
Ｇの２乗を掛ければ推定できることを表している。ここ
で、予め符号帳に含まれる駆動ベクトルのパワが仮に一
定値だと仮定すれば、式（９）はさらに｜Ｙｉ｜²＝Ｇ²ｙ² （１１）となり、｜Ｙｉ｜²は定数となる。その結果、式（３）
の評価式の大小を比較するには分子だけで近似的な評価
が可能になるわけである。従来法は主にこの仮定に基づ
き分母｜Ｙｉ｜²を定数とおいて評価式の大小を比較し
ていると考えられる、しかし、従来の技術の項で述べた
ように、構造化された符号帳が用いられる近年の状況を
考慮すると、この仮定は予備選択の評価式の精度を低下
させる原因になっている。一方、本発明の評価式では重
み係数Ｗ（ｙｉ）を駆動ベクトルｙｉのパワーの逆数１
／｜Ｙｉ｜²とおけば、駆動ベクトルのパワを評価式に
含めることができるのでその分、評価式の精度が向上す
る。また、パワーの逆数を得るのが困難な場合はその推
定値を用いても、定数とする従来法より精度は良い。ま
た、従来法は本発明においてＷ（ｙｉ）＝１とおいた特
殊な場合と考えることもできる。

【００２２】ところで、予備選択で選ぶ候補数Ｎは評価
式の簡略化の精度と関係が深く、精度の良い簡略化を行
えばＮは小さな値で済み、その結果、本選択で必要とさ
れる計算量も小さくなる。簡略化をし過ぎ精度を損なう
と、符号化音声の品質を維持するためにはＮを大きくせ
ざるを得ず、結果として本選択での計算量が増大してし
まう。つまり、評価式を精度を落さずにいかに簡略化す
るかが予備選択のポイントと考えられる。

【００２３】本発明に基づく評価式を用いると、上述し
たように予備選択の精度が向上するので、本選択に渡す
候補数を符号化音声の品質を保ったまま削減でき、本選
択の計算量を低下させることが可能になる。本選択での
計算量は符号化装置全体の計算量の大半を占めているた
め、結果として符号化装置全体の計算量を大きく削減さ
せる効果がある。

【００２４】

【実施例】以下、図面を参照して本発明の実施例を説明
する。

【００２５】（実施例１）図１に、本発明の一実施例に
係る音声符号化装置の構成を示す。この音声符号化装置
は大きく分けて、駆動ベクトル生成部１０１、合成フィ
ルタ１０２、予備選択部１０４および本選択部１０８に
より構成される。入力端子１０３には、入力音声ベクト
ルＲが入力される。予備選択部１０４は、重み係数導出
部１０５と評価式計算部１０６および評価部１０７から
なる。

【００２６】駆動ベクトル生成部１０１により生成され
た駆動ベクトルｙｉは、合成フィルタ１０２に通され、
合成音声ベクトルＹｉが得られる。また、駆動ベクトル
ｙｉは重み係数導出部１０５にも入力され、重み係数Ｗ
（ｙｉ）が得られる。評価式計算部１０６では、合成音
声ベクトルＹｉと、ｙｉをパラメータとする重み係数Ｗ
（ｙｉ）および入力音声ベクトルＲからなる評価式；Ｅ＝Ｗ（ｙｉ）（Ｒ，Ｙｉ）² の値、すなわちＲとＹｉの内積値の大きさをＷ（ｙｉ）
で重み付けした値を計算し、これを出力する。評価部１
０７では、駆動ベクトルｙｉの中で評価式Ｅの値をより
大きくする複数の駆動ベクトルｙｉを求め、そのインデ
ックスｉを予備選択候補として出力する。

【００２７】評価式Ｅは、重み係数Ｗ（ｙｉ）を掛けな
い従来の予備選択の評価式よりも精度が向上するという
効果がある。Ｗ（ｙｉ）の具体的な決め方に関しては、
実施例３以降で述べる。

【００２８】このようにして予備選択部１０４で選ばれ
た予備選択候補は、本選択部１０８で１候補に絞られ、
最適駆動ベクトルＸが出力１０９として得られる。ただ
し、例外としてディレードディシジョン等の利用を目的
に、本選択でも候補を絞るものの、複数の候補を残して
おく場合もある。

【００２９】（実施例２）図２に、本発明の他の実施例
に係る音声符号化装置の構成を示す。本実施例において
は、入力音声ベクトルＲを逆畳み込み演算部２０１に通
した後、評価式計算部１０６に入力している点が図１の
実施例と異なっている。

【００３０】今、合成フィルタ１０２によるフィルタリ
ングを表す行列をＨとおくと、Ｙｉ＝Ｈｙｉと表せる。
よって、評価式Ｅに含まれている内積の計算は、（Ｒ，Ｙｉ）＝Ｒ^tＨｙｉ＝（Ｈ^tＲ，ｙｉ）と表わせる。これはＨ^tＲを駆動ベクトルの探索開始前
に一度計算しておけば、駆動ベクトル探索時はこの値と
ｙｉとの内積演算だけで内積値（Ｒ，Ｙｉ）が得られる
ことを示している。従って、探索中にフィルタリング演
算を行う必要がなくなり、計算量をさらに削減すること
ができる。

【００３１】図２において、入力音声ベクトルＲは逆畳
み込み演算部２０１に入力され、逆畳み込み入力音声ベ
クトルＨ^tＲが生成される。この畳み込み入力音声ベク
トルＨ^tＲが評価式計算部１０６に入力される。一方、
駆動ベクトルｙｉは直接、評価式計算部１０６と重み係
数導出部１０５に入力される。評価式計算部１０６では
（Ｈ^tＲ，ｙｉ）が計算されるが、これは（Ｒ，Ｙｉ）
と等価なので、図１と同じ予備選択候補ｉが予備選択部
１０４から得られる。この場合、計算量は実施例１に比
較して合成フィルタによるフィルタリング演算を行わな
い分だけ削減される。この計算量削減方法は、以降の実
施例についても適用が可能である。

【００３２】（実施例３）図３に、本発明の第３の実施
例に係る音声符号化装置の構成を示す。本実施例におい
ては、駆動ベクトル生成部１０１がインデックス発生部
３０１と適応符号帳３０２および駆動ベクトル切り出し
部３０３により構成されている。適応符号帳３０２に
は、過去の駆動ベクトル群が格納されている。駆動ベク
トル切り出し部３０３では、インデックス発生部３０１
から出力されたインデックスｉに対応するピッチ周期に
基づき、適応符号帳３０２に格納された過去の駆動ベク
トル群から駆動ベクトルｙｉを切り出して出力する。駆
動ベクトルｙｉは合成フィルタ１０２を通り、合成音声
ベクトルとして評価式計算部１０６に入力される。

【００３３】一方、適応符号帳３０２に格納された過去
の駆動ベクトル群Ｃとインデックスｉは重み係数導出部
１０５に入力され、これらの値をパラメータとする重み
係数Ｗ（Ｃ，ｉ）が出力される。評価式計算部１０６で
は、駆動ベクトルＹｉ、重み係数Ｗ（Ｃ，ｉ）および入
力音声ベクトルＲから評価式；Ｅ＝Ｗ（Ｃ，ｉ）（Ｒ，Ｙｉ）² を計算して出力する。以降の処理は実施例１と同じであ
る。

【００３４】図４（ａ）（ｂ）に適応符号帳３０２と重
み係数Ｗ（Ｃ，ｉ）の例を示す。重み係数導出部１０５
は、適応符号帳３０２から入力される過去の駆動ベクト
ル群が図４（ａ）に示す波形の場合、この波形からブロ
ック毎の平均パワの逆数を基にして、図４（ｂ）に示す
重み関数Ｗ（Ｃ，ｉ）を作成する。

【００３５】インデックスｉが入力されると対応するピ
ッチ周期が決まり、ピッチ周期が決まると、駆動ベクト
ル切り出し部３０３が適応符号帳３０２に格納されてい
る駆動ベクトル群のどの時刻から駆動ベクトルを切り出
してくるかが決まる。重み係数Ｗ（Ｃ，ｉ）は、この駆
動ベクトルの切り出し時刻をパラメータとして、図４
（ｂ）の重み係数グラフから求められる。適応符号帳３
０２の内容は駆動ベクトルの探索中は変化しないので、
探索開始前に図４（ｂ）の重み係数グラフを作成してお
けば、探索中はインデックスｉから重み係数Ｗ（Ｃ，
ｉ）がテーブルルックアップで求まる。

【００３６】本実施例は、駆動ベクトル生成部１０１に
入力音声ベクトルＲと共に変化する適応符号帳３０２を
用いながらも、フレーム内の探索中は計算を必要とせず
に重み係数を容易に求められるという効果がある。

【００３７】（実施例４）図５に、本実施例に係る音声
符号化装置の構成を示す。本実施例においては、駆動ベ
クトル生成部１０１は過去の駆動ベクトル群を格納した
適応符号帳５０１と、固定のベクトルを複数格納した雑
音符号帳５０２と、これらの符号帳５０１，５０２から
得られたベクトルにゲインを乗じるゲイン回路５０３，
５０４により構成される。また、音声合成部として入力
音声を線形予測分析して得られた予測係数を用いた再帰
フィルタに聴感重みフィルタを組み合わせた重み付き合
成フィルタ５０６が用いられ、さらに目標ベクトルとし
て聴感重みフィルタで重み付けされた現フレームの入力
音声から、前フレーム処理終了直後の内部状態での重み
付き合成フィルタのゼロ入力応答を差し引いた重み付き
入力音声ベクトルＲが用いられる。

【００３８】まず、適応符号帳５０１に対して駆動ベク
トルの探索を行う。この時は雑音符号帳５０２は使用し
ないので、回路から切り離して考える。予備選択部１０
４には、まず重み付き入力音声ベクトルＲが取り込ま
れ、次に適応符号帳５０１から駆動ベクトルｘｉと、こ
れを重み付き合成フィルタ５０６に通して得られた合成
音声ベクトルＸｉが取り込まれる。このとき、ゲイン回
路５０３のゲインは定数（通常１とする）に固定してお
く。予備選択部１０４では、重み係数Ｗ（ｙｉ）を用い
た評価式；Ｅ＝Ｗ（ｘｉ）（Ｒ，Ｘｉ）² （１２）を計算し、この値の大きなものから順に数個の駆動ベク
トルを予備選択候補として残す。予備選択候補としての
駆動ベクトルを幾つ残すかは、適応符号帳５０１の大き
さや、求められる符号化音声品質などにもよるが、４〜
１６候補程度で十分な品質が得られることが多い。重み
係数Ｗ（ｘｉ）としては、次式を用いる。これは合成音
声ベクトルのパワの逆数である。ここで、ｘｉ（ｎ）は
ｘｉの第ｎ要素、Ｌはフレームの長さをそれぞれ表す。

【００３９】

【数１】このようにして予備選択部１０４で選ばれた予備選択候
補は、本選択部１０８で１候補に絞られ、１つ目の最適
駆動ベクトルＸが出力として得られる。ただし、例外と
してディレードディシジョン等の利用を目的に、本選択
でも候補を絞るものの、複数の候補を残しておく場合も
ある。

【００４０】次に、雑音符号帳５０２について直交化探
索を行う。このときは、適応符号帳５０１は使用しない
ので回路から切り離して考える。予備選択部１０４で
は、先に取り込んだ重み付き入力音声ベクトルＲと、適
応符号帳５０１から探索された最適駆動ベクトルｘを重
み付き音声合成フィルタ５０６に通して得られた最も歪
みの小さくなる合成音声ベクトル（最適合成音声ベクト
ル）Ｘが保持され、雑音符号帳５０２から得られた駆動
ベクトルｙｉと、これを重み付き音声合成フィルタ５０
６に通して得られた合成音声ベクトルＹｉが入力され
る。ゲイン回路５０４のゲインは、定数（通常１）に固
定しておくのが普通である。予備選択部１０４は、重み
係数Ｗ（ｙｉ）を用いた直交化探索における予備選択の
評価式；Ｅ＝Ｗ（ｙｉ）（Ｒ，Ｙｖｉ）² （１４）の値の大きなもの数個を予備選択候補として残す。Ｙｖ
ｉは、合成音声ベクトルＹｉを最適合成音声ベクトルＸ
に対して直交化した直交化ベクトルであり、具体的にはＹｖｉ＝Ｙｉ−｛（Ｙｉ，Ｘ）／｜Ｘ｜²｝・Ｘ（１５）で求められる。重み係数Ｗ（ｙｉ）は、次式に示すよう
に駆動ベクトルのパワの逆数で与えることにする。

【００４１】

【数２】雑音符号帳５０１内の駆動ベクトルは固定であるため、
式（１５）をフレーム毎に計算する必要はなく、(1) テ
ーブルデータとして予め持っておく、(2) 符号化装置の
初期化時に１回だけ計算する、(3) 駆動ベクトル自身の
パワを予め揃えて設計しておく、などの方法により重み
係数Ｗ（ｙｉ）自身の計算を省くことができる。(1)(2)
の方法は固定の符号帳ならば種類によらずに利用可能で
あるが、Ｗ（ｙｉ）を駆動ベクトルの数だけ記憶する分
だけのメモリが必要である。(3)の方法はメモリを必要
としないが、符号帳の構造によってはパワを予め揃える
のが困難なため使用できない場合もある。

【００４２】最後に、予備選択部１０４で選ばれた予備
選択候補が本選択部１０８で１候補に絞られ、２つ目の
最適駆動ベクトルｙｉが得られる。

【００４３】（実施例５）本実施例においては、実施例
４において直交化探索における予備選択の評価式とし
て、Ｅ＝Ｗ（ｙｖｉ）（Ｒ，Ｙｖｉ）² を用いる。この評価式はｙｖｉとその合成フィルタ出力
Ｙｖｉを、ｘｉとその合成フィルタ出力Ｘｉに置き換え
てみると式（１２）と同じ式になることから、本質的に
は上述した一般的な予備選択の評価式である。直交化探
索の予備選択の評価式では、重み係数のパラメータとし
て、本来ｙｖｉを使うべきところをｙｉで近似している
が、本実施例ではｙｖｉを使うことになるので、その分
精度が向上する効果がある。

【００４４】（実施例６）本実施例においては、実施例
４において雑音符号帳の代わりにオーバラッピング符号
帳を用いる。オーバラッピング符号帳は、Ｗ（ｙｉ）の
計算において、実施例４で述べた(3) の方法が使えない
例であるが、符号帳の特徴を利用して少ない計算量でＷ
（ｙｉ）を計算することができる。

【００４５】図６に、オーバラッピング符号長の駆動ベ
クトルの特徴を示した。ｋ番目の駆動ベクトルｙｋは、
ｋ−１番目の駆動ベクトルｙk-1 の先頭からＬ−Ｓ個の
要素に新たにＳ個の要素を先頭に追加した形になってい
る。今、ｙk-1 のパワＱk-1が既に求まっていると仮定
すると、次式の関係からＱｋが容易に求まることが分か
る。

【００４６】

【数３】つまり、Ｑk-1 が与えられれば、Ｑｋのパワは２Ｓ個の
要素のパワーの計算と２回の加減算で求められ、Ｑｋの
逆数を取ることでＷ（ｙｋ）が得られる。実際はＳ＝
２，Ｌ＝８０程度なので、１つの駆動ベクトルに対する
パワの計算は、オーバラッピング構造を利用しない場合
は８０要素のパワを計算する必要があるのに対し、オー
バラッピング構造を利用した場合は４要素分となり、計
算量を削減できる。念のため述べておくと、メモリがあ
れば、実施例４で述べた(1)(2)の方法を用いるのが現実
的な場合が多い。

【００４７】（実施例７）本実施例においては、実施例
４における適応符号帳探索時のＷ（ｙｉ）の計算を実施
例６で述べた方法を応用して効率的に行なう方法につい
て述べる。

【００４８】図７および図８に、適応符号帳と、これか
ら得られる駆動ベクトルが示してある。適応符号帳には
過去の駆動ベクトル群が格納されており、ピッチ周期Ｔ
がフレーム長Ｌより短い場合（Ｔ＜Ｌ）は、この適応符
号帳より切り出してきた長さＴの区間をフレーム長に達
するまで図７のように繰り返す。Ｔ＞Ｌの場合は、Ｔか
らＬだけ手前の区間を図８のようにそのまま取り出す。

【００４９】このような適応符号帳から得られた駆動ベ
クトルのパワを計算する場合、Ｔ＜Ｌのときは１周期分
のパワＰ_Tを計算しておき、これを繰り返す回数だけ
（図では２回）足し合わせれば良い。ただし、端の部分
（図でＴ０の部分) では１周期に満たない区間が生じ、
この部分は別途計算する必要がある。別の方法として、
この区間はパワの計算に含めないという方法も考えられ
る。つまり、１サンプル当たりの平均パワをＰ_T／Ｔと
みなして、（Ｐ_T／Ｔ）×Ｌを駆動ベクトルのパワとみ
なす方法である。このようにしてパワが求まれば、この
逆数が重み係数Ｗ（ｙｉ）となる。さらに、Ｐ_TとＰ
_T+1にはＰ_T+1＝Ｐ_T＋Ｃ_T+1 ² （１８）の関係があるため周期ＴでＷ（ｙｉ）を計算しておけ
ば、上式を利用してＴ＋１のＷ（ｙｉ）を容易に求める
ことができる。Ｌ＜Ｔの場合は図３からも明らかなよう
にシフト量Ｓ＝１のオーバラッピング符号帳と全く同じ
である。ただ、符号長の内容が変わるため、実施例４で
述べた(1)(2)の方法は使えず、実施例６で述べた式（１
７）の関係を利用する方法が有効である。

【００５０】

【発明の効果】以上説明したように、本発明によれば駆
動ベクトルの予備選択時の評価式に駆動ベクトルのパワ
を考慮しているため、従来法に比べて予備選択の精度が
向上する。その結果、本選択に渡す駆動ベクトルの候補
数を符号化音声の品質を保ったまま削減でき、本選択で
の計算量を低下させることが可能になる。本選択での計
算量は符号化装置全体の計算量の大半を占めているた
め、結果として符号化装置全体の計算量を大きく削減さ
せる効果が期待できる。

【図面の簡単な説明】

【図１】実施例１に係る音声符号化装置の構成を示すブ
ロック図

【図２】実施例２に係る逆畳み込みを用いて計算量を削
減した音声符号化装置の構成を示すブロック図

【図３】実施例３に係る適応符号帳を用いた音声符号化
装置の構成を示すブロック図

【図４】実施例３における重み係数の求め方を表す図

【図５】実施例４に係る音声符号化装置の構成を示すブ
ロック図

【図６】オーバラップ符号帳の構造を示す図

【図７】適応符号帳の構造を示す図

【図８】適応符号帳の構造を示す図

【図９】ＣＥＬＰ符号化方式の概略図

【符号の説明】

１０１…駆動ベクトル生成部１０２…合成
フィルタ１０３…入力端子１０４…予備
選択部１０５…重み係数導出部１０６…評価
式計算部１０７…評価部１０８…本選
択部１０９…最適駆動ベクトル２０１…逆畳
み込み演算部３０１…インデックス発生部３０２…適応
符号帳３０３…駆動ベクトル切り出し部５０１…適応
符号帳５０２…雑音符号帳５０３…ゲイ
ン回路５０４…ゲイン回路５０６…重み
付き合成フィルタ

フロントページの続き (72)発明者神庭進神奈川県川崎市幸区小向東芝町１番地株式会社東芝研究開発センター内 (72)発明者押切正浩神奈川県川崎市幸区小向東芝町１番地株式会社東芝研究開発センター内 (56)参考文献特開平５−100697（ＪＰ，Ａ) 特開平７−253795（ＪＰ，Ａ) 三関公生，赤嶺政巳，押切正浩，３. 75ｋｂ／ｓＡＤＰ−ＣＥＬＰ方式，電子情報通信学会技術研究報告［音声］, 日本，1993年７月23日，ＳＰ93−44, ｐ．１−８佐々木茂明，片岡彰俊，守谷健弘，７ｋＨｚ帯域音声符号化法の検討，電子情報通信学会技術研究報告［音声］，日本，1994年２月17日，ＳＰ93−140, ｐ．17−22 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/04 G10L 19/08 G10L 19/12 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】駆動ベクトルを生成する駆動ベクトル生成
方法と、前記駆動ベクトル生成方法により生成された駆動ベクト
ルを入力して合成音声ベクトルを生成する合成方法と、前記駆動ベクトル生成方法により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択方法と、前記予備選択方法により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択方法とを有し、前記予備選択方法は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと前記合成音声ベクトル
との内積値の大きさについて前記駆動ベクトル生成方法
により生成された駆動ベクトルをパラメータとする重み
関数で重み付けした値を求め、当該値をより大きくする
駆動ベクトルを選択することを特徴とする音声符号化方
法。
【請求項２】符号帳を有し、該符号帳から所定のインデ
ックスで指定された一つの駆動ベクトルを切り出して生
成する駆動ベクトル生成方法と、前記駆動ベクトル生成方法により生成された前記駆動ベ
クトルを入力して合成音声ベクトルを生成する合成方法
と、前記駆動ベクトル生成方法により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択方法と、前記予備選択方法により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択方法とを有し、前記予備選択方法は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと前記合成音声ベクトル
との内積値の大きさについて前記符号帳に格納された駆
動ベクトル群および前記インデックスをパラメータとす
る重み関数で重み付けした値を求め、当該値をより大き
くする少なくとも一つの駆動ベクトルを選択することを
特徴とする音声符号化方法。
【請求項３】駆動ベクトルを生成する駆動ベクトル生成
方法と、前記駆動ベクトル生成方法により生成された駆動ベクト
ルを入力して合成音声ベクトルを生成する合成方法と、前記駆動ベクトル生成方法により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択方法と、前記予備選択方法により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択方法とを有し、前記予備選択方法は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと最適合成音声ベクトル
を得た後、前記合成方法により生成された合成音声ベク
トルを前記最適合成音声ベクトルに対し直交化した直交
化ベクトルを求めると共に、前記直交化ベクトルと前記
目標ベクトルの内積値の大きさについて前記駆動ベクト
ル生成方法により生成された駆動ベクトルをパラメータ
とする重み係数で重み付けした値を求め、当該値をより
大きくする駆動ベクトルを選択することを特徴とする音
声符号化方法。
【請求項４】駆動ベクトルを生成する駆動ベクトル生成
手段と、前記駆動ベクトル生成手段により生成された駆動ベクト
ルを入力して合成音声ベクトルを生成する合成手段と、前記駆動ベクトル生成手段により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択手段と、前記予備選択手段により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択手段とを有し、前記予備選択手段は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと前記合成音声ベクトル
との内積値の大きさについて前記駆動ベクトル生成手段
により生成された駆動ベクトルをパラメータとする重み
関数で重み付けした値を求め、当該値をより大きくする
駆動ベクトルを選択することを特徴とする音声符号化装
置。
【請求項５】符号帳を有し、該符号帳から所定のインデ
ックスで指定された一つの駆動ベクトルを切り出して生
成する駆動ベクトル生成手段と、前記駆動ベクトル生成手段により生成された前記駆動ベ
クトルを入力して合成音声ベクトルを生成する合成手段
と、前記駆動ベクトル生成手段により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択手段と、前記予備選択手段により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択手段とを有し、前記予備選択手段は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと前記合成音声ベクトル
との内積値の大きさについて前記符号帳に格納された駆
動ベクトル群および前記インデックスをパラメータとす
る重み関数で重み付けした値を求め、当該値をより大き
くする少なくとも一つの駆動ベクトルを選択することを
特徴とする音声符号化装置。
【請求項６】駆動ベクトルを生成する駆動ベクトル生成
手段と、前記駆動ベクトル生成手段により生成された駆動ベクト
ルを入力して合成音声ベクトルを生成する合成手段と、前記駆動ベクトル生成手段により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択手段と、前記予備選択手段により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択手段とを有し、前記予備選択手段は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと最適合成音声ベクトル
を得た後、前記合成手段により生成された合成音声ベク
トルを前記最適合成音声ベクトルに対し直交化した直交
化ベクトルを求めると共に、前記直交化ベクトルと前記
目標ベクトルの内積値の大きさについて前記駆動ベクト
ル生成手段により生成された駆動ベクトルをパラメータ
とする重み係数で重み付けした値を求め、当該値をより
大きくする駆動ベクトルを選択することを特徴とする音
声符号化装置。