JP3471889B2 - 音声符号化方法及び装置 - Google Patents
音声符号化方法及び装置Info
- Publication number
- JP3471889B2 JP3471889B2 JP06526594A JP6526594A JP3471889B2 JP 3471889 B2 JP3471889 B2 JP 3471889B2 JP 06526594 A JP06526594 A JP 06526594A JP 6526594 A JP6526594 A JP 6526594A JP 3471889 B2 JP3471889 B2 JP 3471889B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- drive
- drive vector
- speech
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
符号化方法及び装置、特にCELPなどの複数の駆動ベ
クトルを合成フィルタに入力し、得られた合成音声ベク
トルと入力音声を聴感重みの下で比較して歪みを最小に
する駆動ベクトルを符号帳から探索する音声符号化方法
及び装置に関する。
レートで符号化する方式として、CELP( Code Excit
ed Linear Prediction )方式は有効な方式の一つであ
る。このCELP方式での処理は、フレーム単位に分割
された入力音声から声道をモデル化した音声合成フィル
タを求める処理と、このフィルタの入力信号に当たる駆
動ベクトルを求める処理に大別される。これらのうち、
後者は符号帳に格納された複数の駆動ベクトルを一つず
つ音声合成フィルタに通し、合成音声と入力音声を比較
する符号帳探索と呼ばれる処理が必要であり、この処理
は多くの計算量を必要とする。本発明は符号帳探索にお
ける計算量削減に関するものである。
oeder and B.S.Atal,"Code ExcitedLinear Prediction
(CELP): High Auality Speech at Very Low Bit Rate
s", Proc. ICASSP,pp.937-940, 1985 および W.S.Klei
jin, D.J.Krasinski et al. "ImprovedSpeech Quality
and Efficient Vector Quantization in SELP", Proc.I
CASSP, pp.155-158, 1988 で詳しく述べられている。
置の概略を示すブロック図である。まず、符号帳探索に
ついて説明する。駆動ベクトルとしては2系統が用意さ
れており、これらは適応符号帳901と雑音符号帳90
2に格納されている。適応符号帳901は過去の駆動ベ
クトル群を格納した可変の符号帳であるのに対し、雑音
符号帳902は決まったパターンを複数格納している固
定の符号帳である。端子906に入力される入力音声ベ
クトルRを線形予測分析部907で分析し、合成フィル
タ908の特性を求めた後、適応符号帳901および雑
音符号帳902からそれぞれ1つずつ最適な駆動ベクト
ルを選び出す。
つずつ取り出された駆動ベクトルを合成フィルタ908
に通し、得られた出力(合成音声ベクトル)を入力音声
ベクトルRと比較して、入力音声ベクトルRに最も近い
最適合成音声ベクトルを生成する駆動ベクトルを符号帳
901,902から探索する。
いて説明する。符号帳901,902から取り出された
i番目の駆動ベクトルをyi、これを合成フィルタ90
8に通して得られた合成音声ベクトルをYi、入力音声
ベクトルをRと表すとき、次式に示すYiとRの差の2
乗和、 E=|R−αYi|2 (1) を最小にする駆動ベクトルyiを探索するのが一般的で
ある。但し、αはyiが選ばれた場合の最適ゲインであ
り、図9ではゲイン回路903,904によって付与さ
れる。この式をαで偏微分した式をゼロとおくことによ
り、最適ゲインαが求まる。これを式(1)に代入して
整理すると、 E=|R|2 −(R,Yi)2 /|Yi|2 (2) となる。この式の第1項は駆動ベクトルによらない定数
だから、最適ゲインαのもとで最適な駆動ベクトルを探
すことは式(2)の第2項; (R,Yi)2 /|Yi|2 (3) を評価式とし、これを最大にするyiを探すことに等し
い。全ての候補についてこの評価式を計算するため、符
号帳探索はCELP方式全体の中で最も計算量を必要と
する部分である。
駆動ベクトル候補からなる符号帳の中からN個の候補
(1<N<M)を選び、これらN個の候補の中から上記
の評価式を用いて最適な候補を1 つに絞るという手法が
提案されている。この手法は、詳しくは特開平5−10
0697で述べられている。符号帳から得られるM個の
駆動ベクトルから次の評価式; E=(R,Yi)2 (4) を大きくするN個を選ぶ前半の作業は予備選択と呼ば
れ、N個の候補を式(3)を用いて1つに絞る後半の作
業は本選択と呼ばれている。この手法によれば、計算量
のかかる本選択は予備選択で選ばれたN個に対して行う
だけで済み、予備選択をせずに符号帳のM個の候補全て
に対して本選択を行う場合に比べ大幅に計算量が削減で
きる。
に当たるYiのパワがほぼ一定であるという仮定に基づ
いていると考えられる。しかし、実際にはパワ|Yi|
2 は駆動ベクトルyiのパワが必ずしも一定でないこと
や、たとえ一定だとしても合成フィルタの利得が駆動ベ
クトルに依存し定数にならないことを考えると、パワ|
Yi|2 を一定とする仮定には無理があり、これが予備
選択の精度の低下を招いているという問題があった。
雑音符号帳を使用することは少なくなっており、計算量
およびメモリ量を削減し、より高音質な符号化音声を得
るために、構造化された雑音符号帳を用いることが多
い。例えば、長い1本の雑音信号から1フレーム分の駆
動ベクトルを一つ前の駆動部ベクトルと重ねながら切り
出してくるオーバーラッピング符号帳、適応ベクトル検
索部で得られたピッチ情報を基に駆動ベクトルを周期化
するピッチ同期型符号帳、一つの駆動ベクトルをサンプ
ル間に挟み込む0の数を変えて使用する適応密度符号帳
などがある。
ベクトルのパワを一定にしづらい仕組みになっており、
このような状況で|Yi|2 が一定と仮定する従来の予
備選択法を用いることは予備選択の精度を低下させ、結
果的に符号化音声の品質を劣化させる。また、符号化音
声の品質を保つために予備選択で残す候補数を増やす
と、本選択での計算量が増加してしまうという問題が生
じる。
化された符号帳を用いて駆動ベクトルの予備選択を行う
場合、駆動ベクトルのパワが一定でないために、従来の
予備選択法では駆動ベクトルの選択精度が必ずしも良い
とは言えないという問題があった。
択を可能として、本選択に渡す駆動ベクトルの候補数を
符号化音声の品質を保ったまま削減でき、符号化に要す
る計算量の大半を占める本選択での計算量を低下させる
ことを可能とした音声符号化方法及び装置を提供するこ
とを目的とする。
を生成する駆動ベクトル生成手段と、この駆動ベクトル
生成手段により生成された駆動ベクトルを入力して合成
音声ベクトルを生成する合成手段と、駆動ベクトル生成
手段により生成された駆動ベクトルから少なくとも一つ
の駆動ベクトルを選択する予備選択手段と、この予備選
択手段により選択された駆動ベクトルから最適な駆動ベ
クトルを選択する本選択手段とを有する音声符号化装置
において、予備選択手段を駆動ベクトルのパワに基づく
重み係数で重み付けされた評価式によって駆動ベクトル
の予備選択を行うように構成したことを骨子とする。
に分割された入力音声から得られる目標ベクトル(入力
音声ベクトル)と合成音声ベクトルとの内積値の大きさ
を駆動ベクトル生成手段により生成された駆動ベクトル
をパラメータとする重み関数で重み付けした値をより大
きくする駆動ベクトルを選択するように予備選択手段を
構成する。
段から生成されるM個の駆動ベクトルyi(i=1,
…,M)をそれぞれ合成手段に入力して、目標ベクトル
Rに最も近い合成音声ベクトルを出力する駆動ベクトル
を探し出す場合、予備選択手段において、yiをパラメ
ータとする重み係数W(yi)を用いた予備選択の評価
式; E=W(yi)(R,Yi)2 (5) の値を大きくするN個(1<N<M)のyiを予備選択
候補として選び出す。ただし、Yiはyiを音声合成手
段に入力して得られた出力である。
段が符号帳を有し、該符号帳から所定のインデックスで
指定された一つの駆動ベクトルを切り出して生成する場
合、所定の単位期間に分割された入力音声から得られる
目標ベクトルと合成音声ベクトルとの内積値の大きさを
駆動ベクトル生成手段の符号帳に格納された過去の駆動
ベクトル群およびインデックスをパラメータとする重み
関数で重み付けした値をより大きくする少なくとも一つ
の駆動ベクトルを選択するように予備選択手段を構成す
る。
駆動ベクトル群をCとし、インデックスをiとしたと
き、目標ベクトルRに最も近い合成音声ベクトルを出力
する駆動ベクトルを探し出す場合、予備選択手段におい
て、Cとiをパラメータとする重み係数W(C,i)を
用いた予備選択の評価式; E=W(C,i)(R,Yi)2 (6) の値を大きくする駆動ベクトルを予備選択候補として選
び出す。
分割された入力音声から得られる目標ベクトルと最適合
成音声ベクトルを求めた後、合成手段により生成された
合成音声ベクトルを最適合成音声ベクトルに対し直交化
した直交化ベクトルを求め、この直交化ベクトルと目標
ベクトルの内積値の大きさを駆動ベクトル生成手段によ
り生成された駆動ベクトルをパラメータとする重み係数
で重み付けした値をより大きくする駆動ベクトルを選択
するように予備選択手段を構成する。
を近似する最適合成音声ベクトルXが既に求まっている
条件のもとで、Rを近似する2つ目の合成音声ベクトル
を出力する駆動ベクトルを駆動ベクトル生成手段から生
成されるM個の駆動ベクトルyi(i=1,…M)の中
から探索する場合、yiの合成音声ベクトルYiをXに
対し直交化して、直交化ベクトルYviを求めた後、y
iをパラメータとする重み係数W(yi)を用いた予備
選択の評価式; E=W(yi)(R,Yvi)2 (7) の値を大きくするN個(1<N<M)のyiを予備選択
候補として選び出す。
予備選択の評価式である式(4)より精度が高いと言え
る。
成音声ベクトルのパワであり、駆動ベクトルyiと合成
フィルタの利得G(yi)を用いて |Yi|2 =G(yi)2 |yi|2 (9) と表せる。G(yi)はyiによって異なる値を取る
が、yiのスペクトルの形がほぼ同じであれば、一定値
と仮定することができる。実際に符号帳は雑音系列など
で構成されることが多く、駆動ベクトル間でスペクトル
の分布はそれほど大きく異ならないのが普通である。そ
のためG(yi)を一定値と仮定するのは現実的であ
り、G=G(yi)と定数と置くことにより式(9)
は、 |Yi|2 =G2 |yi|2 (10) と書ける。この式は合成音声ベクトルYiのパワは駆動
ベクトルyiのパワに合成フィルタの利得にあたる定数
Gの2乗を掛ければ推定できることを表している。ここ
で、予め符号帳に含まれる駆動ベクトルのパワが仮に一
定値だと仮定すれば、式(9)はさらに |Yi|2 =G2 y2 (11) となり、|Yi|2 は定数となる。その結果、式(3)
の評価式の大小を比較するには分子だけで近似的な評価
が可能になるわけである。従来法は主にこの仮定に基づ
き分母|Yi|2 を定数とおいて評価式の大小を比較し
ていると考えられる、しかし、従来の技術の項で述べた
ように、構造化された符号帳が用いられる近年の状況を
考慮すると、この仮定は予備選択の評価式の精度を低下
させる原因になっている。一方、本発明の評価式では重
み係数W(yi)を駆動ベクトルyiのパワーの逆数1
/|Yi|2 とおけば、駆動ベクトルのパワを評価式に
含めることができるのでその分、評価式の精度が向上す
る。また、パワーの逆数を得るのが困難な場合はその推
定値を用いても、定数とする従来法より精度は良い。ま
た、従来法は本発明においてW(yi)=1とおいた特
殊な場合と考えることもできる。
式の簡略化の精度と関係が深く、精度の良い簡略化を行
えばNは小さな値で済み、その結果、本選択で必要とさ
れる計算量も小さくなる。簡略化をし過ぎ精度を損なう
と、符号化音声の品質を維持するためにはNを大きくせ
ざるを得ず、結果として本選択での計算量が増大してし
まう。つまり、評価式を精度を落さずにいかに簡略化す
るかが予備選択のポイントと考えられる。
たように予備選択の精度が向上するので、本選択に渡す
候補数を符号化音声の品質を保ったまま削減でき、本選
択の計算量を低下させることが可能になる。本選択での
計算量は符号化装置全体の計算量の大半を占めているた
め、結果として符号化装置全体の計算量を大きく削減さ
せる効果がある。
する。
係る音声符号化装置の構成を示す。この音声符号化装置
は大きく分けて、駆動ベクトル生成部101、合成フィ
ルタ102、予備選択部104および本選択部108に
より構成される。入力端子103には、入力音声ベクト
ルRが入力される。予備選択部104は、重み係数導出
部105と評価式計算部106および評価部107から
なる。
た駆動ベクトルyiは、合成フィルタ102に通され、
合成音声ベクトルYiが得られる。また、駆動ベクトル
yiは重み係数導出部105にも入力され、重み係数W
(yi)が得られる。評価式計算部106では、合成音
声ベクトルYiと、yiをパラメータとする重み係数W
(yi)および入力音声ベクトルRからなる評価式; E=W(yi)(R,Yi)2 の値、すなわちRとYiの内積値の大きさをW(yi)
で重み付けした値を計算し、これを出力する。評価部1
07では、駆動ベクトルyiの中で評価式Eの値をより
大きくする複数の駆動ベクトルyiを求め、そのインデ
ックスiを予備選択候補として出力する。
い従来の予備選択の評価式よりも精度が向上するという
効果がある。W(yi)の具体的な決め方に関しては、
実施例3以降で述べる。
た予備選択候補は、本選択部108で1候補に絞られ、
最適駆動ベクトルXが出力109として得られる。ただ
し、例外としてディレードディシジョン等の利用を目的
に、本選択でも候補を絞るものの、複数の候補を残して
おく場合もある。
に係る音声符号化装置の構成を示す。本実施例において
は、入力音声ベクトルRを逆畳み込み演算部201に通
した後、評価式計算部106に入力している点が図1の
実施例と異なっている。
ングを表す行列をHとおくと、Yi=Hyiと表せる。
よって、評価式Eに含まれている内積の計算は、 (R,Yi)=Rt Hyi =(Ht R,yi) と表わせる。これはHt Rを駆動ベクトルの探索開始前
に一度計算しておけば、駆動ベクトル探索時はこの値と
yiとの内積演算だけで内積値(R,Yi)が得られる
ことを示している。従って、探索中にフィルタリング演
算を行う必要がなくなり、計算量をさらに削減すること
ができる。
み込み演算部201に入力され、逆畳み込み入力音声ベ
クトルHt Rが生成される。この畳み込み入力音声ベク
トルHt Rが評価式計算部106に入力される。一方、
駆動ベクトルyiは直接、評価式計算部106と重み係
数導出部105に入力される。評価式計算部106では
(Ht R,yi)が計算されるが、これは(R,Yi)
と等価なので、図1と同じ予備選択候補iが予備選択部
104から得られる。この場合、計算量は実施例1に比
較して合成フィルタによるフィルタリング演算を行わな
い分だけ削減される。この計算量削減方法は、以降の実
施例についても適用が可能である。
例に係る音声符号化装置の構成を示す。本実施例におい
ては、駆動ベクトル生成部101がインデックス発生部
301と適応符号帳302および駆動ベクトル切り出し
部303により構成されている。適応符号帳302に
は、過去の駆動ベクトル群が格納されている。駆動ベク
トル切り出し部303では、インデックス発生部301
から出力されたインデックスiに対応するピッチ周期に
基づき、適応符号帳302に格納された過去の駆動ベク
トル群から駆動ベクトルyiを切り出して出力する。駆
動ベクトルyiは合成フィルタ102を通り、合成音声
ベクトルとして評価式計算部106に入力される。
の駆動ベクトル群Cとインデックスiは重み係数導出部
105に入力され、これらの値をパラメータとする重み
係数W(C,i)が出力される。評価式計算部106で
は、駆動ベクトルYi、重み係数W(C,i)および入
力音声ベクトルRから評価式; E=W(C,i)(R,Yi)2 を計算して出力する。以降の処理は実施例1と同じであ
る。
み係数W(C,i)の例を示す。重み係数導出部105
は、適応符号帳302から入力される過去の駆動ベクト
ル群が図4(a)に示す波形の場合、この波形からブロ
ック毎の平均パワの逆数を基にして、図4(b)に示す
重み関数W(C,i)を作成する。
ッチ周期が決まり、ピッチ周期が決まると、駆動ベクト
ル切り出し部303が適応符号帳302に格納されてい
る駆動ベクトル群のどの時刻から駆動ベクトルを切り出
してくるかが決まる。重み係数W(C,i)は、この駆
動ベクトルの切り出し時刻をパラメータとして、図4
(b)の重み係数グラフから求められる。適応符号帳3
02の内容は駆動ベクトルの探索中は変化しないので、
探索開始前に図4(b)の重み係数グラフを作成してお
けば、探索中はインデックスiから重み係数W(C,
i)がテーブルルックアップで求まる。
入力音声ベクトルRと共に変化する適応符号帳302を
用いながらも、フレーム内の探索中は計算を必要とせず
に重み係数を容易に求められるという効果がある。
符号化装置の構成を示す。本実施例においては、駆動ベ
クトル生成部101は過去の駆動ベクトル群を格納した
適応符号帳501と、固定のベクトルを複数格納した雑
音符号帳502と、これらの符号帳501,502から
得られたベクトルにゲインを乗じるゲイン回路503,
504により構成される。また、音声合成部として入力
音声を線形予測分析して得られた予測係数を用いた再帰
フィルタに聴感重みフィルタを組み合わせた重み付き合
成フィルタ506が用いられ、さらに目標ベクトルとし
て聴感重みフィルタで重み付けされた現フレームの入力
音声から、前フレーム処理終了直後の内部状態での重み
付き合成フィルタのゼロ入力応答を差し引いた重み付き
入力音声ベクトルRが用いられる。
トルの探索を行う。この時は雑音符号帳502は使用し
ないので、回路から切り離して考える。予備選択部10
4には、まず重み付き入力音声ベクトルRが取り込ま
れ、次に適応符号帳501から駆動ベクトルxiと、こ
れを重み付き合成フィルタ506に通して得られた合成
音声ベクトルXiが取り込まれる。このとき、ゲイン回
路503のゲインは定数(通常1とする)に固定してお
く。予備選択部104では、重み係数W(yi)を用い
た評価式; E=W(xi)(R,Xi)2 (12) を計算し、この値の大きなものから順に数個の駆動ベク
トルを予備選択候補として残す。予備選択候補としての
駆動ベクトルを幾つ残すかは、適応符号帳501の大き
さや、求められる符号化音声品質などにもよるが、4〜
16候補程度で十分な品質が得られることが多い。重み
係数W(xi)としては、次式を用いる。これは合成音
声ベクトルのパワの逆数である。ここで、xi(n)は
xiの第n要素、Lはフレームの長さをそれぞれ表す。
補は、本選択部108で1候補に絞られ、1つ目の最適
駆動ベクトルXが出力として得られる。ただし、例外と
してディレードディシジョン等の利用を目的に、本選択
でも候補を絞るものの、複数の候補を残しておく場合も
ある。
索を行う。このときは、適応符号帳501は使用しない
ので回路から切り離して考える。予備選択部104で
は、先に取り込んだ重み付き入力音声ベクトルRと、適
応符号帳501から探索された最適駆動ベクトルxを重
み付き音声合成フィルタ506に通して得られた最も歪
みの小さくなる合成音声ベクトル(最適合成音声ベクト
ル)Xが保持され、雑音符号帳502から得られた駆動
ベクトルyiと、これを重み付き音声合成フィルタ50
6に通して得られた合成音声ベクトルYiが入力され
る。ゲイン回路504のゲインは、定数(通常1)に固
定しておくのが普通である。予備選択部104は、重み
係数W(yi)を用いた直交化探索における予備選択の
評価式; E=W(yi)(R,Yvi)2 (14) の値の大きなもの数個を予備選択候補として残す。Yv
iは、合成音声ベクトルYiを最適合成音声ベクトルX
に対して直交化した直交化ベクトルであり、具体的には Yvi=Yi−{(Yi,X)/|X|2 }・X (15) で求められる。重み係数W(yi)は、次式に示すよう
に駆動ベクトルのパワの逆数で与えることにする。
式(15)をフレーム毎に計算する必要はなく、(1) テ
ーブルデータとして予め持っておく、(2) 符号化装置の
初期化時に1回だけ計算する、(3) 駆動ベクトル自身の
パワを予め揃えて設計しておく、などの方法により重み
係数W(yi)自身の計算を省くことができる。(1)(2)
の方法は固定の符号帳ならば種類によらずに利用可能で
あるが、W(yi)を駆動ベクトルの数だけ記憶する分
だけのメモリが必要である。(3)の方法はメモリを必要
としないが、符号帳の構造によってはパワを予め揃える
のが困難なため使用できない場合もある。
選択候補が本選択部108で1候補に絞られ、2つ目の
最適駆動ベクトルyiが得られる。
4において直交化探索における予備選択の評価式とし
て、 E=W(yvi)(R,Yvi)2 を用いる。この評価式はyviとその合成フィルタ出力
Yviを、xiとその合成フィルタ出力Xiに置き換え
てみると式(12)と同じ式になることから、本質的に
は上述した一般的な予備選択の評価式である。直交化探
索の予備選択の評価式では、重み係数のパラメータとし
て、本来yviを使うべきところをyiで近似している
が、本実施例ではyviを使うことになるので、その分
精度が向上する効果がある。
4において雑音符号帳の代わりにオーバラッピング符号
帳を用いる。オーバラッピング符号帳は、W(yi)の
計算において、実施例4で述べた(3) の方法が使えない
例であるが、符号帳の特徴を利用して少ない計算量でW
(yi)を計算することができる。
クトルの特徴を示した。k番目の駆動ベクトルykは、
k−1番目の駆動ベクトルyk-1 の先頭からL−S個の
要素に新たにS個の要素を先頭に追加した形になってい
る。今、yk-1 のパワQk-1が既に求まっていると仮定
すると、次式の関係からQkが容易に求まることが分か
る。
要素のパワーの計算と2回の加減算で求められ、Qkの
逆数を取ることでW(yk)が得られる。実際はS=
2,L=80程度なので、1つの駆動ベクトルに対する
パワの計算は、オーバラッピング構造を利用しない場合
は80要素のパワを計算する必要があるのに対し、オー
バラッピング構造を利用した場合は4要素分となり、計
算量を削減できる。念のため述べておくと、メモリがあ
れば、実施例4で述べた(1)(2)の方法を用いるのが現実
的な場合が多い。
4における適応符号帳探索時のW(yi)の計算を実施
例6で述べた方法を応用して効率的に行なう方法につい
て述べる。
ら得られる駆動ベクトルが示してある。適応符号帳には
過去の駆動ベクトル群が格納されており、ピッチ周期T
がフレーム長Lより短い場合(T<L)は、この適応符
号帳より切り出してきた長さTの区間をフレーム長に達
するまで図7のように繰り返す。T>Lの場合は、Tか
らLだけ手前の区間を図8のようにそのまま取り出す。
クトルのパワを計算する場合、T<Lのときは1周期分
のパワPT を計算しておき、これを繰り返す回数だけ
(図では2回)足し合わせれば良い。ただし、端の部分
(図でT0の部分) では1周期に満たない区間が生じ、
この部分は別途計算する必要がある。別の方法として、
この区間はパワの計算に含めないという方法も考えられ
る。つまり、1サンプル当たりの平均パワをPT /Tと
みなして、(PT /T)×Lを駆動ベクトルのパワとみ
なす方法である。このようにしてパワが求まれば、この
逆数が重み係数W(yi)となる。さらに、PT とP
T+1 には PT+1 =PT +CT+1 2 (18) の関係があるため周期TでW(yi)を計算しておけ
ば、上式を利用してT+1のW(yi)を容易に求める
ことができる。L<Tの場合は図3からも明らかなよう
にシフト量S=1のオーバラッピング符号帳と全く同じ
である。ただ、符号長の内容が変わるため、実施例4で
述べた(1)(2)の方法は使えず、実施例6で述べた式(1
7)の関係を利用する方法が有効である。
動ベクトルの予備選択時の評価式に駆動ベクトルのパワ
を考慮しているため、従来法に比べて予備選択の精度が
向上する。その結果、本選択に渡す駆動ベクトルの候補
数を符号化音声の品質を保ったまま削減でき、本選択で
の計算量を低下させることが可能になる。本選択での計
算量は符号化装置全体の計算量の大半を占めているた
め、結果として符号化装置全体の計算量を大きく削減さ
せる効果が期待できる。
ロック図
減した音声符号化装置の構成を示すブロック図
装置の構成を示すブロック図
ロック図
フィルタ 103…入力端子 104…予備
選択部 105…重み係数導出部 106…評価
式計算部 107…評価部 108…本選
択部 109…最適駆動ベクトル 201…逆畳
み込み演算部 301…インデックス発生部 302…適応
符号帳 303…駆動ベクトル切り出し部 501…適応
符号帳 502…雑音符号帳 503…ゲイ
ン回路 504…ゲイン回路 506…重み
付き合成フィルタ
Claims (6)
- 【請求項1】駆動ベクトルを生成する駆動ベクトル生成
方法と、 前記駆動ベクトル生成方法により生成された駆動ベクト
ルを入力して合成音声ベクトルを生成する合成方法と、 前記駆動ベクトル生成方法により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択方法と、 前記予備選択方法により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択方法とを有し、 前記予備選択方法は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと前記合成音声ベクトル
との内積値の大きさについて前記駆動ベクトル生成方法
により生成された駆動ベクトルをパラメータとする重み
関数で重み付けした値を求め、当該値をより大きくする
駆動ベクトルを選択することを特徴とする音声符号化方
法。 - 【請求項2】符号帳を有し、該符号帳から所定のインデ
ックスで指定された一つの駆動ベクトルを切り出して生
成する駆動ベクトル生成方法と、 前記駆動ベクトル生成方法により生成された前記駆動ベ
クトルを入力して合成音声ベクトルを生成する合成方法
と、 前記駆動ベクトル生成方法により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択方法と、 前記予備選択方法により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択方法とを有し、 前記予備選択方法は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと前記合成音声ベクトル
との内積値の大きさについて前記符号帳に格納された駆
動ベクトル群および前記インデックスをパラメータとす
る重み関数で重み付けした値を求め、当該値をより大き
くする少なくとも一つの駆動ベクトルを選択することを
特徴とする音声符号化方法。 - 【請求項3】駆動ベクトルを生成する駆動ベクトル生成
方法と、 前記駆動ベクトル生成方法により生成された駆動ベクト
ルを入力して合成音声ベクトルを生成する合成方法と、 前記駆動ベクトル生成方法により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択方法と、 前記予備選択方法により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択方法とを有し、 前記予備選択方法は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと最適合成音声ベクトル
を得た後、前記合成方法により生成された合成音声ベク
トルを前記最適合成音声ベクトルに対し直交化した直交
化ベクトルを求めると共に、前記直交化ベクトルと前記
目標ベクトルの内積値の大きさについて前記駆動ベクト
ル生成方法により生成された駆動ベクトルをパラメータ
とする重み係数で重み付けした値を求め、当該値をより
大きくする駆動ベクトルを選択することを特徴とする音
声符号化方法。 - 【請求項4】駆動ベクトルを生成する駆動ベクトル生成
手段と、 前記駆動ベクトル生成手段により生成された駆動ベクト
ルを入力して合成音声ベクトルを生成する合成手段と、 前記駆動ベクトル生成手段により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択手段と、 前記予備選択手段により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択手段とを有し、 前記予備選択手段は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと前記合成音声ベクトル
との内積値の大きさについて前記駆動ベクトル生成手段
により生成された駆動ベクトルをパラメータとする重み
関数で重み付けした値を求め、当該値をより大きくする
駆動ベクトルを選択することを特徴とする音声符号化装
置。 - 【請求項5】符号帳を有し、該符号帳から所定のインデ
ックスで指定された一つの駆動ベクトルを切り出して生
成する駆動ベクトル生成手段と、 前記駆動ベクトル生成手段により生成された前記駆動ベ
クトルを入力して合成音声ベクトルを生成する合成手段
と、 前記駆動ベクトル生成手段により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択手段と、 前記予備選択手段により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択手段とを有し、 前記予備選択手段は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと前記合成音声ベクトル
との内積値の大きさについて前記符号帳に格納された駆
動ベクトル群および前記インデックスをパラメータとす
る重み関数で重み付けした値を求め、当該値をより大き
くする少なくとも一つの駆動ベクトルを選択することを
特徴とする音声符号化装置。 - 【請求項6】駆動ベクトルを生成する駆動ベクトル生成
手段と、 前記駆動ベクトル生成手段により生成された駆動ベクト
ルを入力して合成音声ベクトルを生成する合成手段と、 前記駆動ベクトル生成手段により生成された駆動ベクト
ルから少なくとも一つの駆動ベクトルを選択する予備選
択手段と、 前記予備選択手段により選択された駆動ベクトルから最
適な駆動ベクトルを選択する本選択手段とを有し、 前記予備選択手段は、所定の単位期間に分割された入力
音声から得られる目標ベクトルと最適合成音声ベクトル
を得た後、前記合成手段により生成された合成音声ベク
トルを前記最適合成音声ベクトルに対し直交化した直交
化ベクトルを求めると共に、前記直交化ベクトルと前記
目標ベクトルの内積値の大きさについて前記駆動ベクト
ル生成手段により生成された駆動ベクトルをパラメータ
とする重み係数で重み付けした値を求め、当該値をより
大きくする駆動ベクトルを選択することを特徴とする音
声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06526594A JP3471889B2 (ja) | 1994-04-01 | 1994-04-01 | 音声符号化方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06526594A JP3471889B2 (ja) | 1994-04-01 | 1994-04-01 | 音声符号化方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07271397A JPH07271397A (ja) | 1995-10-20 |
JP3471889B2 true JP3471889B2 (ja) | 2003-12-02 |
Family
ID=13281925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06526594A Expired - Fee Related JP3471889B2 (ja) | 1994-04-01 | 1994-04-01 | 音声符号化方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3471889B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
EP1339040B1 (en) | 2000-11-30 | 2009-01-07 | Panasonic Corporation | Vector quantizing device for lpc parameters |
-
1994
- 1994-04-01 JP JP06526594A patent/JP3471889B2/ja not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
三関公生,赤嶺政巳,押切正浩,3.75kb/s ADP−CELP方式,電子情報通信学会技術研究報告[音声],日本,1993年 7月23日,SP93−44,p.1−8 |
佐々木茂明,片岡彰俊,守谷健弘,7kHz帯域音声符号化法の検討,電子情報通信学会技術研究報告[音声],日本,1994年 2月17日,SP93−140,p.17−22 |
Also Published As
Publication number | Publication date |
---|---|
JPH07271397A (ja) | 1995-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
JP3346765B2 (ja) | 音声復号化方法及び音声復号化装置 | |
US6345248B1 (en) | Low bit-rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization | |
JP3196595B2 (ja) | 音声符号化装置 | |
US6385576B2 (en) | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch | |
KR100194775B1 (ko) | 벡터양자화장치 | |
JPH06222797A (ja) | 音声符号化方式 | |
JP3180786B2 (ja) | 音声符号化方法及び音声符号化装置 | |
JP3137176B2 (ja) | 音声符号化装置 | |
JPH07160294A (ja) | 音声復号装置 | |
JP2624130B2 (ja) | 音声符号化方式 | |
KR20070085788A (ko) | 신호 속성들을 사용한 효율적인 오디오 코딩 | |
JP2970407B2 (ja) | 音声の励振信号符号化装置 | |
KR100465316B1 (ko) | 음성 부호화기 및 이를 이용한 음성 부호화 방법 | |
JP3471889B2 (ja) | 音声符号化方法及び装置 | |
KR100319924B1 (ko) | 음성 부호화시에 대수코드북에서의 대수코드 탐색방법 | |
JP2800599B2 (ja) | 基本周期符号化装置 | |
JP3153075B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3144194B2 (ja) | 音声符号化装置 | |
EP0713208A2 (en) | Pitch lag estimation system | |
JP3276977B2 (ja) | 音声符号化装置 | |
JP3089967B2 (ja) | 音声符号化装置 | |
JPH08185199A (ja) | 音声符号化装置 | |
JP3471542B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070912 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080912 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080912 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090912 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090912 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100912 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130912 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |