JP3471889B2 - 音声符号化方法及び装置 - Google Patents

音声符号化方法及び装置

Info

Publication number
JP3471889B2
JP3471889B2 JP06526594A JP6526594A JP3471889B2 JP 3471889 B2 JP3471889 B2 JP 3471889B2 JP 06526594 A JP06526594 A JP 06526594A JP 6526594 A JP6526594 A JP 6526594A JP 3471889 B2 JP3471889 B2 JP 3471889B2
Authority
JP
Japan
Prior art keywords
vector
drive
drive vector
speech
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06526594A
Other languages
English (en)
Other versions
JPH07271397A (ja
Inventor
皇 天田
政巳 赤嶺
公生 三関
進 神庭
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP06526594A priority Critical patent/JP3471889B2/ja
Publication of JPH07271397A publication Critical patent/JPH07271397A/ja
Application granted granted Critical
Publication of JP3471889B2 publication Critical patent/JP3471889B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、線形予測分析型の音声
符号化方法及び装置、特にCELPなどの複数の駆動ベ
クトルを合成フィルタに入力し、得られた合成音声ベク
トルと入力音声を聴感重みの下で比較して歪みを最小に
する駆動ベクトルを符号帳から探索する音声符号化方法
及び装置に関する。
【0002】
【従来の技術】電話帯域の音声を4kbps程度の伝送
レートで符号化する方式として、CELP( Code Excit
ed Linear Prediction )方式は有効な方式の一つであ
る。このCELP方式での処理は、フレーム単位に分割
された入力音声から声道をモデル化した音声合成フィル
タを求める処理と、このフィルタの入力信号に当たる駆
動ベクトルを求める処理に大別される。これらのうち、
後者は符号帳に格納された複数の駆動ベクトルを一つず
つ音声合成フィルタに通し、合成音声と入力音声を比較
する符号帳探索と呼ばれる処理が必要であり、この処理
は多くの計算量を必要とする。本発明は符号帳探索にお
ける計算量削減に関するものである。
【0003】CELP方式に関しては、例えばM.R.Schr
oeder and B.S.Atal,"Code ExcitedLinear Prediction
(CELP): High Auality Speech at Very Low Bit Rate
s", Proc. ICASSP,pp.937-940, 1985 および W.S.Klei
jin, D.J.Krasinski et al. "ImprovedSpeech Quality
and Efficient Vector Quantization in SELP", Proc.I
CASSP, pp.155-158, 1988 で詳しく述べられている。
【0004】図9は、CELP方式による音声符号化装
置の概略を示すブロック図である。まず、符号帳探索に
ついて説明する。駆動ベクトルとしては2系統が用意さ
れており、これらは適応符号帳901と雑音符号帳90
2に格納されている。適応符号帳901は過去の駆動ベ
クトル群を格納した可変の符号帳であるのに対し、雑音
符号帳902は決まったパターンを複数格納している固
定の符号帳である。端子906に入力される入力音声ベ
クトルRを線形予測分析部907で分析し、合成フィル
タ908の特性を求めた後、適応符号帳901および雑
音符号帳902からそれぞれ1つずつ最適な駆動ベクト
ルを選び出す。
【0005】具体的には、符号帳901,902から一
つずつ取り出された駆動ベクトルを合成フィルタ908
に通し、得られた出力(合成音声ベクトル)を入力音声
ベクトルRと比較して、入力音声ベクトルRに最も近い
最適合成音声ベクトルを生成する駆動ベクトルを符号帳
901,902から探索する。
【0006】次に、駆動ベクトルの探索方法を数式を用
いて説明する。符号帳901,902から取り出された
i番目の駆動ベクトルをyi、これを合成フィルタ90
8に通して得られた合成音声ベクトルをYi、入力音声
ベクトルをRと表すとき、次式に示すYiとRの差の2
乗和、 E=|R−αYi|2 (1) を最小にする駆動ベクトルyiを探索するのが一般的で
ある。但し、αはyiが選ばれた場合の最適ゲインであ
り、図9ではゲイン回路903,904によって付与さ
れる。この式をαで偏微分した式をゼロとおくことによ
り、最適ゲインαが求まる。これを式(1)に代入して
整理すると、 E=|R|−(R,Yi)2 /|Yi| (2) となる。この式の第1項は駆動ベクトルによらない定数
だから、最適ゲインαのもとで最適な駆動ベクトルを探
すことは式(2)の第2項; (R,Yi)/|Yi|2 (3) を評価式とし、これを最大にするyiを探すことに等し
い。全ての候補についてこの評価式を計算するため、符
号帳探索はCELP方式全体の中で最も計算量を必要と
する部分である。
【0007】そこで簡略化した評価式を用いて、M個の
駆動ベクトル候補からなる符号帳の中からN個の候補
(1<N<M)を選び、これらN個の候補の中から上記
の評価式を用いて最適な候補を1 つに絞るという手法が
提案されている。この手法は、詳しくは特開平5−10
0697で述べられている。符号帳から得られるM個の
駆動ベクトルから次の評価式; E=(R,Yi)2 (4) を大きくするN個を選ぶ前半の作業は予備選択と呼ば
れ、N個の候補を式(3)を用いて1つに絞る後半の作
業は本選択と呼ばれている。この手法によれば、計算量
のかかる本選択は予備選択で選ばれたN個に対して行う
だけで済み、予備選択をせずに符号帳のM個の候補全て
に対して本選択を行う場合に比べ大幅に計算量が削減で
きる。
【0008】この従来の予備選択法は、式(3)の分母
に当たるYiのパワがほぼ一定であるという仮定に基づ
いていると考えられる。しかし、実際にはパワ|Yi|
2 は駆動ベクトルyiのパワが必ずしも一定でないこと
や、たとえ一定だとしても合成フィルタの利得が駆動ベ
クトルに依存し定数にならないことを考えると、パワ|
Yi|2 を一定とする仮定には無理があり、これが予備
選択の精度の低下を招いているという問題があった。
【0009】近年、古典的なCELP方式で提案された
雑音符号帳を使用することは少なくなっており、計算量
およびメモリ量を削減し、より高音質な符号化音声を得
るために、構造化された雑音符号帳を用いることが多
い。例えば、長い1本の雑音信号から1フレーム分の駆
動ベクトルを一つ前の駆動部ベクトルと重ねながら切り
出してくるオーバーラッピング符号帳、適応ベクトル検
索部で得られたピッチ情報を基に駆動ベクトルを周期化
するピッチ同期型符号帳、一つの駆動ベクトルをサンプ
ル間に挟み込む0の数を変えて使用する適応密度符号帳
などがある。
【0010】これら構造化された符号帳は構造上、駆動
ベクトルのパワを一定にしづらい仕組みになっており、
このような状況で|Yi|2 が一定と仮定する従来の予
備選択法を用いることは予備選択の精度を低下させ、結
果的に符号化音声の品質を劣化させる。また、符号化音
声の品質を保つために予備選択で残す候補数を増やす
と、本選択での計算量が増加してしまうという問題が生
じる。
【0011】
【発明が解決しようとする課題】上述したように、構造
化された符号帳を用いて駆動ベクトルの予備選択を行う
場合、駆動ベクトルのパワが一定でないために、従来の
予備選択法では駆動ベクトルの選択精度が必ずしも良い
とは言えないという問題があった。
【0012】本発明は、駆動ベクトルの高精度な予備選
択を可能として、本選択に渡す駆動ベクトルの候補数を
符号化音声の品質を保ったまま削減でき、符号化に要す
る計算量の大半を占める本選択での計算量を低下させる
ことを可能とした音声符号化方法及び装置を提供するこ
とを目的とする。
【0013】
【課題を解決するための手段】本発明は、駆動ベクトル
を生成する駆動ベクトル生成手段と、この駆動ベクトル
生成手段により生成された駆動ベクトルを入力して合成
音声ベクトルを生成する合成手段と、駆動ベクトル生成
手段により生成された駆動ベクトルから少なくとも一つ
の駆動ベクトルを選択する予備選択手段と、この予備選
択手段により選択された駆動ベクトルから最適な駆動ベ
クトルを選択する本選択手段とを有する音声符号化装置
において、予備選択手段を駆動ベクトルのパワに基づく
重み係数で重み付けされた評価式によって駆動ベクトル
の予備選択を行うように構成したことを骨子とする。
【0014】すなわち、第1の発明では所定の単位期間
に分割された入力音声から得られる目標ベクトル(入力
音声ベクトル)と合成音声ベクトルとの内積値の大きさ
を駆動ベクトル生成手段により生成された駆動ベクトル
をパラメータとする重み関数で重み付けした値をより大
きくする駆動ベクトルを選択するように予備選択手段を
構成する。
【0015】これを数式で表すと、駆動ベクトル生成手
段から生成されるM個の駆動ベクトルyi(i=1,
…,M)をそれぞれ合成手段に入力して、目標ベクトル
Rに最も近い合成音声ベクトルを出力する駆動ベクトル
を探し出す場合、予備選択手段において、yiをパラメ
ータとする重み係数W(yi)を用いた予備選択の評価
式; E=W(yi)(R,Yi)2 (5) の値を大きくするN個(1<N<M)のyiを予備選択
候補として選び出す。ただし、Yiはyiを音声合成手
段に入力して得られた出力である。
【0016】また、第2の発明では駆動ベクトル生成手
段が符号帳を有し、該符号帳から所定のインデックスで
指定された一つの駆動ベクトルを切り出して生成する場
合、所定の単位期間に分割された入力音声から得られる
目標ベクトルと合成音声ベクトルとの内積値の大きさを
駆動ベクトル生成手段の符号帳に格納された過去の駆動
ベクトル群およびインデックスをパラメータとする重み
関数で重み付けした値をより大きくする少なくとも一つ
の駆動ベクトルを選択するように予備選択手段を構成す
る。
【0017】これを数式で表すと、符号帳に格納された
駆動ベクトル群をCとし、インデックスをiとしたと
き、目標ベクトルRに最も近い合成音声ベクトルを出力
する駆動ベクトルを探し出す場合、予備選択手段におい
て、Cとiをパラメータとする重み係数W(C,i)を
用いた予備選択の評価式; E=W(C,i)(R,Yi)2 (6) の値を大きくする駆動ベクトルを予備選択候補として選
び出す。
【0018】さらに、第3の発明では所定の単位期間に
分割された入力音声から得られる目標ベクトルと最適合
成音声ベクトルを求めた後、合成手段により生成された
合成音声ベクトルを最適合成音声ベクトルに対し直交化
した直交化ベクトルを求め、この直交化ベクトルと目標
ベクトルの内積値の大きさを駆動ベクトル生成手段によ
り生成された駆動ベクトルをパラメータとする重み係数
で重み付けした値をより大きくする駆動ベクトルを選択
するように予備選択手段を構成する。
【0019】これを数式で説明すると、目標ベクトルR
を近似する最適合成音声ベクトルXが既に求まっている
条件のもとで、Rを近似する2つ目の合成音声ベクトル
を出力する駆動ベクトルを駆動ベクトル生成手段から生
成されるM個の駆動ベクトルyi(i=1,…M)の中
から探索する場合、yiの合成音声ベクトルYiをXに
対し直交化して、直交化ベクトルYviを求めた後、y
iをパラメータとする重み係数W(yi)を用いた予備
選択の評価式; E=W(yi)(R,Yvi)2 (7) の値を大きくするN個(1<N<M)のyiを予備選択
候補として選び出す。
【0020】
【作用】本発明における予備選択での評価式; E=W(yi)(R,Yi)2 (8) は、次の根拠に基づき重みW(yi)を掛けない従来の
予備選択の評価式である式(4)より精度が高いと言え
る。
【0021】本選択の評価式である式(3)の分母は合
成音声ベクトルのパワであり、駆動ベクトルyiと合成
フィルタの利得G(yi)を用いて |Yi|2 =G(yi)2 |yi|2 (9) と表せる。G(yi)はyiによって異なる値を取る
が、yiのスペクトルの形がほぼ同じであれば、一定値
と仮定することができる。実際に符号帳は雑音系列など
で構成されることが多く、駆動ベクトル間でスペクトル
の分布はそれほど大きく異ならないのが普通である。そ
のためG(yi)を一定値と仮定するのは現実的であ
り、G=G(yi)と定数と置くことにより式(9)
は、 |Yi|2 =G2 |yi|2 (10) と書ける。この式は合成音声ベクトルYiのパワは駆動
ベクトルyiのパワに合成フィルタの利得にあたる定数
Gの2乗を掛ければ推定できることを表している。ここ
で、予め符号帳に含まれる駆動ベクトルのパワが仮に一
定値だと仮定すれば、式(9)はさらに |Yi|2 =G2 2 (11) となり、|Yi|2 は定数となる。その結果、式(3)
の評価式の大小を比較するには分子だけで近似的な評価
が可能になるわけである。従来法は主にこの仮定に基づ
き分母|Yi|2 を定数とおいて評価式の大小を比較し
ていると考えられる、しかし、従来の技術の項で述べた
ように、構造化された符号帳が用いられる近年の状況を
考慮すると、この仮定は予備選択の評価式の精度を低下
させる原因になっている。一方、本発明の評価式では重
み係数W(yi)を駆動ベクトルyiのパワーの逆数1
/|Yi|2 とおけば、駆動ベクトルのパワを評価式に
含めることができるのでその分、評価式の精度が向上す
る。また、パワーの逆数を得るのが困難な場合はその推
定値を用いても、定数とする従来法より精度は良い。ま
た、従来法は本発明においてW(yi)=1とおいた特
殊な場合と考えることもできる。
【0022】ところで、予備選択で選ぶ候補数Nは評価
式の簡略化の精度と関係が深く、精度の良い簡略化を行
えばNは小さな値で済み、その結果、本選択で必要とさ
れる計算量も小さくなる。簡略化をし過ぎ精度を損なう
と、符号化音声の品質を維持するためにはNを大きくせ
ざるを得ず、結果として本選択での計算量が増大してし
まう。つまり、評価式を精度を落さずにいかに簡略化す
るかが予備選択のポイントと考えられる。
【0023】本発明に基づく評価式を用いると、上述し
たように予備選択の精度が向上するので、本選択に渡す
候補数を符号化音声の品質を保ったまま削減でき、本選
択の計算量を低下させることが可能になる。本選択での
計算量は符号化装置全体の計算量の大半を占めているた
め、結果として符号化装置全体の計算量を大きく削減さ
せる効果がある。
【0024】
【実施例】以下、図面を参照して本発明の実施例を説明
する。
【0025】(実施例1)図1に、本発明の一実施例に
係る音声符号化装置の構成を示す。この音声符号化装置
は大きく分けて、駆動ベクトル生成部101、合成フィ
ルタ102、予備選択部104および本選択部108に
より構成される。入力端子103には、入力音声ベクト
ルRが入力される。予備選択部104は、重み係数導出
部105と評価式計算部106および評価部107から
なる。
【0026】駆動ベクトル生成部101により生成され
た駆動ベクトルyiは、合成フィルタ102に通され、
合成音声ベクトルYiが得られる。また、駆動ベクトル
yiは重み係数導出部105にも入力され、重み係数W
(yi)が得られる。評価式計算部106では、合成音
声ベクトルYiと、yiをパラメータとする重み係数W
(yi)および入力音声ベクトルRからなる評価式; E=W(yi)(R,Yi)2 の値、すなわちRとYiの内積値の大きさをW(yi)
で重み付けした値を計算し、これを出力する。評価部1
07では、駆動ベクトルyiの中で評価式Eの値をより
大きくする複数の駆動ベクトルyiを求め、そのインデ
ックスiを予備選択候補として出力する。
【0027】評価式Eは、重み係数W(yi)を掛けな
い従来の予備選択の評価式よりも精度が向上するという
効果がある。W(yi)の具体的な決め方に関しては、
実施例3以降で述べる。
【0028】このようにして予備選択部104で選ばれ
た予備選択候補は、本選択部108で1候補に絞られ、
最適駆動ベクトルXが出力109として得られる。ただ
し、例外としてディレードディシジョン等の利用を目的
に、本選択でも候補を絞るものの、複数の候補を残して
おく場合もある。
【0029】(実施例2)図2に、本発明の他の実施例
に係る音声符号化装置の構成を示す。本実施例において
は、入力音声ベクトルRを逆畳み込み演算部201に通
した後、評価式計算部106に入力している点が図1の
実施例と異なっている。
【0030】今、合成フィルタ102によるフィルタリ
ングを表す行列をHとおくと、Yi=Hyiと表せる。
よって、評価式Eに含まれている内積の計算は、 (R,Yi)=Rt Hyi =(Ht R,yi) と表わせる。これはHt Rを駆動ベクトルの探索開始前
に一度計算しておけば、駆動ベクトル探索時はこの値と
yiとの内積演算だけで内積値(R,Yi)が得られる
ことを示している。従って、探索中にフィルタリング演
算を行う必要がなくなり、計算量をさらに削減すること
ができる。
【0031】図2において、入力音声ベクトルRは逆畳
み込み演算部201に入力され、逆畳み込み入力音声ベ
クトルHt Rが生成される。この畳み込み入力音声ベク
トルHt Rが評価式計算部106に入力される。一方、
駆動ベクトルyiは直接、評価式計算部106と重み係
数導出部105に入力される。評価式計算部106では
(Ht R,yi)が計算されるが、これは(R,Yi)
と等価なので、図1と同じ予備選択候補iが予備選択部
104から得られる。この場合、計算量は実施例1に比
較して合成フィルタによるフィルタリング演算を行わな
い分だけ削減される。この計算量削減方法は、以降の実
施例についても適用が可能である。
【0032】(実施例3)図3に、本発明の第3の実施
例に係る音声符号化装置の構成を示す。本実施例におい
ては、駆動ベクトル生成部101がインデックス発生部
301と適応符号帳302および駆動ベクトル切り出し
部303により構成されている。適応符号帳302に
は、過去の駆動ベクトル群が格納されている。駆動ベク
トル切り出し部303では、インデックス発生部301
から出力されたインデックスiに対応するピッチ周期に
基づき、適応符号帳302に格納された過去の駆動ベク
トル群から駆動ベクトルyiを切り出して出力する。駆
動ベクトルyiは合成フィルタ102を通り、合成音声
ベクトルとして評価式計算部106に入力される。
【0033】一方、適応符号帳302に格納された過去
の駆動ベクトル群Cとインデックスiは重み係数導出部
105に入力され、これらの値をパラメータとする重み
係数W(C,i)が出力される。評価式計算部106で
は、駆動ベクトルYi、重み係数W(C,i)および入
力音声ベクトルRから評価式; E=W(C,i)(R,Yi)2 を計算して出力する。以降の処理は実施例1と同じであ
る。
【0034】図4(a)(b)に適応符号帳302と重
み係数W(C,i)の例を示す。重み係数導出部105
は、適応符号帳302から入力される過去の駆動ベクト
ル群が図4(a)に示す波形の場合、この波形からブロ
ック毎の平均パワの逆数を基にして、図4(b)に示す
重み関数W(C,i)を作成する。
【0035】インデックスiが入力されると対応するピ
ッチ周期が決まり、ピッチ周期が決まると、駆動ベクト
ル切り出し部303が適応符号帳302に格納されてい
る駆動ベクトル群のどの時刻から駆動ベクトルを切り出
してくるかが決まる。重み係数W(C,i)は、この駆
動ベクトルの切り出し時刻をパラメータとして、図4
(b)の重み係数グラフから求められる。適応符号帳3
02の内容は駆動ベクトルの探索中は変化しないので、
探索開始前に図4(b)の重み係数グラフを作成してお
けば、探索中はインデックスiから重み係数W(C,
i)がテーブルルックアップで求まる。
【0036】本実施例は、駆動ベクトル生成部101に
入力音声ベクトルRと共に変化する適応符号帳302を
用いながらも、フレーム内の探索中は計算を必要とせず
に重み係数を容易に求められるという効果がある。
【0037】(実施例4)図5に、本実施例に係る音声
符号化装置の構成を示す。本実施例においては、駆動ベ
クトル生成部101は過去の駆動ベクトル群を格納した
適応符号帳501と、固定のベクトルを複数格納した雑
音符号帳502と、これらの符号帳501,502から
得られたベクトルにゲインを乗じるゲイン回路503,
504により構成される。また、音声合成部として入力
音声を線形予測分析して得られた予測係数を用いた再帰
フィルタに聴感重みフィルタを組み合わせた重み付き合
成フィルタ506が用いられ、さらに目標ベクトルとし
て聴感重みフィルタで重み付けされた現フレームの入力
音声から、前フレーム処理終了直後の内部状態での重み
付き合成フィルタのゼロ入力応答を差し引いた重み付き
入力音声ベクトルRが用いられる。
【0038】まず、適応符号帳501に対して駆動ベク
トルの探索を行う。この時は雑音符号帳502は使用し
ないので、回路から切り離して考える。予備選択部10
4には、まず重み付き入力音声ベクトルRが取り込ま
れ、次に適応符号帳501から駆動ベクトルxiと、こ
れを重み付き合成フィルタ506に通して得られた合成
音声ベクトルXiが取り込まれる。このとき、ゲイン回
路503のゲインは定数(通常1とする)に固定してお
く。予備選択部104では、重み係数W(yi)を用い
た評価式; E=W(xi)(R,Xi)2 (12) を計算し、この値の大きなものから順に数個の駆動ベク
トルを予備選択候補として残す。予備選択候補としての
駆動ベクトルを幾つ残すかは、適応符号帳501の大き
さや、求められる符号化音声品質などにもよるが、4〜
16候補程度で十分な品質が得られることが多い。重み
係数W(xi)としては、次式を用いる。これは合成音
声ベクトルのパワの逆数である。ここで、xi(n)は
xiの第n要素、Lはフレームの長さをそれぞれ表す。
【0039】
【数1】 このようにして予備選択部104で選ばれた予備選択候
補は、本選択部108で1候補に絞られ、1つ目の最適
駆動ベクトルXが出力として得られる。ただし、例外と
してディレードディシジョン等の利用を目的に、本選択
でも候補を絞るものの、複数の候補を残しておく場合も
ある。
【0040】次に、雑音符号帳502について直交化探
索を行う。このときは、適応符号帳501は使用しない
ので回路から切り離して考える。予備選択部104で
は、先に取り込んだ重み付き入力音声ベクトルRと、適
応符号帳501から探索された最適駆動ベクトルxを重
み付き音声合成フィルタ506に通して得られた最も歪
みの小さくなる合成音声ベクトル(最適合成音声ベクト
ル)Xが保持され、雑音符号帳502から得られた駆動
ベクトルyiと、これを重み付き音声合成フィルタ50
6に通して得られた合成音声ベクトルYiが入力され
る。ゲイン回路504のゲインは、定数(通常1)に固
定しておくのが普通である。予備選択部104は、重み
係数W(yi)を用いた直交化探索における予備選択の
評価式; E=W(yi)(R,Yvi)2 (14) の値の大きなもの数個を予備選択候補として残す。Yv
iは、合成音声ベクトルYiを最適合成音声ベクトルX
に対して直交化した直交化ベクトルであり、具体的には Yvi=Yi−{(Yi,X)/|X|2 }・X (15) で求められる。重み係数W(yi)は、次式に示すよう
に駆動ベクトルのパワの逆数で与えることにする。
【0041】
【数2】 雑音符号帳501内の駆動ベクトルは固定であるため、
式(15)をフレーム毎に計算する必要はなく、(1) テ
ーブルデータとして予め持っておく、(2) 符号化装置の
初期化時に1回だけ計算する、(3) 駆動ベクトル自身の
パワを予め揃えて設計しておく、などの方法により重み
係数W(yi)自身の計算を省くことができる。(1)(2)
の方法は固定の符号帳ならば種類によらずに利用可能で
あるが、W(yi)を駆動ベクトルの数だけ記憶する分
だけのメモリが必要である。(3)の方法はメモリを必要
としないが、符号帳の構造によってはパワを予め揃える
のが困難なため使用できない場合もある。
【0042】最後に、予備選択部104で選ばれた予備
選択候補が本選択部108で1候補に絞られ、2つ目の
最適駆動ベクトルyiが得られる。
【0043】(実施例5)本実施例においては、実施例
4において直交化探索における予備選択の評価式とし
て、 E=W(yvi)(R,Yvi)2 を用いる。この評価式はyviとその合成フィルタ出力
Yviを、xiとその合成フィルタ出力Xiに置き換え
てみると式(12)と同じ式になることから、本質的に
は上述した一般的な予備選択の評価式である。直交化探
索の予備選択の評価式では、重み係数のパラメータとし
て、本来yviを使うべきところをyiで近似している
が、本実施例ではyviを使うことになるので、その分
精度が向上する効果がある。
【0044】(実施例6)本実施例においては、実施例
4において雑音符号帳の代わりにオーバラッピング符号
帳を用いる。オーバラッピング符号帳は、W(yi)の
計算において、実施例4で述べた(3) の方法が使えない
例であるが、符号帳の特徴を利用して少ない計算量でW
(yi)を計算することができる。
【0045】図6に、オーバラッピング符号長の駆動ベ
クトルの特徴を示した。k番目の駆動ベクトルykは、
k−1番目の駆動ベクトルyk-1 の先頭からL−S個の
要素に新たにS個の要素を先頭に追加した形になってい
る。今、yk-1 のパワQk-1が既に求まっていると仮定
すると、次式の関係からQkが容易に求まることが分か
る。
【0046】
【数3】 つまり、Qk-1 が与えられれば、Qkのパワは2S個の
要素のパワーの計算と2回の加減算で求められ、Qkの
逆数を取ることでW(yk)が得られる。実際はS=
2,L=80程度なので、1つの駆動ベクトルに対する
パワの計算は、オーバラッピング構造を利用しない場合
は80要素のパワを計算する必要があるのに対し、オー
バラッピング構造を利用した場合は4要素分となり、計
算量を削減できる。念のため述べておくと、メモリがあ
れば、実施例4で述べた(1)(2)の方法を用いるのが現実
的な場合が多い。
【0047】(実施例7)本実施例においては、実施例
4における適応符号帳探索時のW(yi)の計算を実施
例6で述べた方法を応用して効率的に行なう方法につい
て述べる。
【0048】図7および図8に、適応符号帳と、これか
ら得られる駆動ベクトルが示してある。適応符号帳には
過去の駆動ベクトル群が格納されており、ピッチ周期T
がフレーム長Lより短い場合(T<L)は、この適応符
号帳より切り出してきた長さTの区間をフレーム長に達
するまで図7のように繰り返す。T>Lの場合は、Tか
らLだけ手前の区間を図8のようにそのまま取り出す。
【0049】このような適応符号帳から得られた駆動ベ
クトルのパワを計算する場合、T<Lのときは1周期分
のパワPT を計算しておき、これを繰り返す回数だけ
(図では2回)足し合わせれば良い。ただし、端の部分
(図でT0の部分) では1周期に満たない区間が生じ、
この部分は別途計算する必要がある。別の方法として、
この区間はパワの計算に含めないという方法も考えられ
る。つまり、1サンプル当たりの平均パワをPT /Tと
みなして、(PT /T)×Lを駆動ベクトルのパワとみ
なす方法である。このようにしてパワが求まれば、この
逆数が重み係数W(yi)となる。さらに、PT とP
T+1 には PT+1 =PT +CT+1 2 (18) の関係があるため周期TでW(yi)を計算しておけ
ば、上式を利用してT+1のW(yi)を容易に求める
ことができる。L<Tの場合は図3からも明らかなよう
にシフト量S=1のオーバラッピング符号帳と全く同じ
である。ただ、符号長の内容が変わるため、実施例4で
述べた(1)(2)の方法は使えず、実施例6で述べた式(1
7)の関係を利用する方法が有効である。
【0050】
【発明の効果】以上説明したように、本発明によれば駆
動ベクトルの予備選択時の評価式に駆動ベクトルのパワ
を考慮しているため、従来法に比べて予備選択の精度が
向上する。その結果、本選択に渡す駆動ベクトルの候補
数を符号化音声の品質を保ったまま削減でき、本選択で
の計算量を低下させることが可能になる。本選択での計
算量は符号化装置全体の計算量の大半を占めているた
め、結果として符号化装置全体の計算量を大きく削減さ
せる効果が期待できる。
【図面の簡単な説明】
【図1】実施例1に係る音声符号化装置の構成を示すブ
ロック図
【図2】実施例2に係る逆畳み込みを用いて計算量を削
減した音声符号化装置の構成を示すブロック図
【図3】実施例3に係る適応符号帳を用いた音声符号化
装置の構成を示すブロック図
【図4】実施例3における重み係数の求め方を表す図
【図5】実施例4に係る音声符号化装置の構成を示すブ
ロック図
【図6】オーバラップ符号帳の構造を示す図
【図7】適応符号帳の構造を示す図
【図8】適応符号帳の構造を示す図
【図9】CELP符号化方式の概略図
【符号の説明】
101…駆動ベクトル生成部 102…合成
フィルタ 103…入力端子 104…予備
選択部 105…重み係数導出部 106…評価
式計算部 107…評価部 108…本選
択部 109…最適駆動ベクトル 201…逆畳
み込み演算部 301…インデックス発生部 302…適応
符号帳 303…駆動ベクトル切り出し部 501…適応
符号帳 502…雑音符号帳 503…ゲイ
ン回路 504…ゲイン回路 506…重み
付き合成フィルタ
フロントページの続き (72)発明者 神庭 進 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝研究開発センター内 (72)発明者 押切 正浩 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝研究開発センター内 (56)参考文献 特開 平5−100697(JP,A) 特開 平7−253795(JP,A) 三関公生,赤嶺政巳,押切正浩,3. 75kb/s ADP−CELP方式,電 子情報通信学会技術研究報告[音声], 日本,1993年 7月23日,SP93−44, p.1−8 佐々木茂明,片岡彰俊,守谷健弘,7 kHz帯域音声符号化法の検討,電子情 報通信学会技術研究報告[音声],日 本,1994年 2月17日,SP93−140, p.17−22 (58)調査した分野(Int.Cl.7,DB名) G10L 19/04 G10L 19/08 G10L 19/12 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】駆動ベクトルを生成する駆動ベクトル生成
    方法と、 前記駆動ベクトル生成方法により生成された駆動ベクト
    ルを入力して合成音声ベクトルを生成する合成方法と、 前記駆動ベクトル生成方法により生成された駆動ベクト
    ルから少なくとも一つの駆動ベクトルを選択する予備選
    択方法と、 前記予備選択方法により選択された駆動ベクトルから最
    適な駆動ベクトルを選択する本選択方法とを有し、 前記予備選択方法は、所定の単位期間に分割された入力
    音声から得られる目標ベクトルと前記合成音声ベクトル
    との内積値の大きさについて前記駆動ベクトル生成方法
    により生成された駆動ベクトルをパラメータとする重み
    関数で重み付けした値を求め、当該値をより大きくする
    駆動ベクトルを選択することを特徴とする音声符号化方
    法。
  2. 【請求項2】符号帳を有し、該符号帳から所定のインデ
    ックスで指定された一つの駆動ベクトルを切り出して生
    成する駆動ベクトル生成方法と、 前記駆動ベクトル生成方法により生成された前記駆動ベ
    クトルを入力して合成音声ベクトルを生成する合成方法
    と、 前記駆動ベクトル生成方法により生成された駆動ベクト
    ルから少なくとも一つの駆動ベクトルを選択する予備選
    択方法と、 前記予備選択方法により選択された駆動ベクトルから最
    適な駆動ベクトルを選択する本選択方法とを有し、 前記予備選択方法は、所定の単位期間に分割された入力
    音声から得られる目標ベクトルと前記合成音声ベクトル
    との内積値の大きさについて前記符号帳に格納された駆
    動ベクトル群および前記インデックスをパラメータとす
    る重み関数で重み付けした値を求め、当該値をより大き
    くする少なくとも一つの駆動ベクトルを選択することを
    特徴とする音声符号化方法。
  3. 【請求項3】駆動ベクトルを生成する駆動ベクトル生成
    方法と、 前記駆動ベクトル生成方法により生成された駆動ベクト
    ルを入力して合成音声ベクトルを生成する合成方法と、 前記駆動ベクトル生成方法により生成された駆動ベクト
    ルから少なくとも一つの駆動ベクトルを選択する予備選
    択方法と、 前記予備選択方法により選択された駆動ベクトルから最
    適な駆動ベクトルを選択する本選択方法とを有し、 前記予備選択方法は、所定の単位期間に分割された入力
    音声から得られる目標ベクトルと最適合成音声ベクトル
    を得た後、前記合成方法により生成された合成音声ベク
    トルを前記最適合成音声ベクトルに対し直交化した直交
    化ベクトルを求めると共に、前記直交化ベクトルと前記
    目標ベクトルの内積値の大きさについて前記駆動ベクト
    ル生成方法により生成された駆動ベクトルをパラメータ
    とする重み係数で重み付けした値を求め、当該値をより
    大きくする駆動ベクトルを選択することを特徴とする音
    声符号化方法。
  4. 【請求項4】駆動ベクトルを生成する駆動ベクトル生成
    手段と、 前記駆動ベクトル生成手段により生成された駆動ベクト
    ルを入力して合成音声ベクトルを生成する合成手段と、 前記駆動ベクトル生成手段により生成された駆動ベクト
    ルから少なくとも一つの駆動ベクトルを選択する予備選
    択手段と、 前記予備選択手段により選択された駆動ベクトルから最
    適な駆動ベクトルを選択する本選択手段とを有し、 前記予備選択手段は、所定の単位期間に分割された入力
    音声から得られる目標ベクトルと前記合成音声ベクトル
    との内積値の大きさについて前記駆動ベクトル生成手段
    により生成された駆動ベクトルをパラメータとする重み
    関数で重み付けした値を求め、当該値をより大きくする
    駆動ベクトルを選択することを特徴とする音声符号化装
    置。
  5. 【請求項5】符号帳を有し、該符号帳から所定のインデ
    ックスで指定された一つの駆動ベクトルを切り出して生
    成する駆動ベクトル生成手段と、 前記駆動ベクトル生成手段により生成された前記駆動ベ
    クトルを入力して合成音声ベクトルを生成する合成手段
    と、 前記駆動ベクトル生成手段により生成された駆動ベクト
    ルから少なくとも一つの駆動ベクトルを選択する予備選
    択手段と、 前記予備選択手段により選択された駆動ベクトルから最
    適な駆動ベクトルを選択する本選択手段とを有し、 前記予備選択手段は、所定の単位期間に分割された入力
    音声から得られる目標ベクトルと前記合成音声ベクトル
    との内積値の大きさについて前記符号帳に格納された駆
    動ベクトル群および前記インデックスをパラメータとす
    る重み関数で重み付けした値を求め、当該値をより大き
    くする少なくとも一つの駆動ベクトルを選択することを
    特徴とする音声符号化装置。
  6. 【請求項6】駆動ベクトルを生成する駆動ベクトル生成
    手段と、 前記駆動ベクトル生成手段により生成された駆動ベクト
    ルを入力して合成音声ベクトルを生成する合成手段と、 前記駆動ベクトル生成手段により生成された駆動ベクト
    ルから少なくとも一つの駆動ベクトルを選択する予備選
    択手段と、 前記予備選択手段により選択された駆動ベクトルから最
    適な駆動ベクトルを選択する本選択手段とを有し、 前記予備選択手段は、所定の単位期間に分割された入力
    音声から得られる目標ベクトルと最適合成音声ベクトル
    を得た後、前記合成手段により生成された合成音声ベク
    トルを前記最適合成音声ベクトルに対し直交化した直交
    化ベクトルを求めると共に、前記直交化ベクトルと前記
    目標ベクトルの内積値の大きさについて前記駆動ベクト
    ル生成手段により生成された駆動ベクトルをパラメータ
    とする重み係数で重み付けした値を求め、当該値をより
    大きくする駆動ベクトルを選択することを特徴とする音
    声符号化装置。
JP06526594A 1994-04-01 1994-04-01 音声符号化方法及び装置 Expired - Fee Related JP3471889B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06526594A JP3471889B2 (ja) 1994-04-01 1994-04-01 音声符号化方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06526594A JP3471889B2 (ja) 1994-04-01 1994-04-01 音声符号化方法及び装置

Publications (2)

Publication Number Publication Date
JPH07271397A JPH07271397A (ja) 1995-10-20
JP3471889B2 true JP3471889B2 (ja) 2003-12-02

Family

ID=13281925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06526594A Expired - Fee Related JP3471889B2 (ja) 1994-04-01 1994-04-01 音声符号化方法及び装置

Country Status (1)

Country Link
JP (1) JP3471889B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JP3426207B2 (ja) 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
EP1339040B1 (en) 2000-11-30 2009-01-07 Panasonic Corporation Vector quantizing device for lpc parameters

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
三関公生,赤嶺政巳,押切正浩,3.75kb/s ADP−CELP方式,電子情報通信学会技術研究報告[音声],日本,1993年 7月23日,SP93−44,p.1−8
佐々木茂明,片岡彰俊,守谷健弘,7kHz帯域音声符号化法の検討,電子情報通信学会技術研究報告[音声],日本,1994年 2月17日,SP93−140,p.17−22

Also Published As

Publication number Publication date
JPH07271397A (ja) 1995-10-20

Similar Documents

Publication Publication Date Title
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
US6345248B1 (en) Low bit-rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
JP3196595B2 (ja) 音声符号化装置
US6385576B2 (en) Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
KR100194775B1 (ko) 벡터양자화장치
JPH06222797A (ja) 音声符号化方式
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3137176B2 (ja) 音声符号化装置
JPH07160294A (ja) 音声復号装置
JP2624130B2 (ja) 音声符号化方式
KR20070085788A (ko) 신호 속성들을 사용한 효율적인 오디오 코딩
JP2970407B2 (ja) 音声の励振信号符号化装置
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
JP3471889B2 (ja) 音声符号化方法及び装置
KR100319924B1 (ko) 음성 부호화시에 대수코드북에서의 대수코드 탐색방법
JP2800599B2 (ja) 基本周期符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3144194B2 (ja) 音声符号化装置
EP0713208A2 (en) Pitch lag estimation system
JP3276977B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JPH08185199A (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100912

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees