JP2800599B2 - 基本周期符号化装置 - Google Patents

基本周期符号化装置

Info

Publication number
JP2800599B2
JP2800599B2 JP4319195A JP31919592A JP2800599B2 JP 2800599 B2 JP2800599 B2 JP 2800599B2 JP 4319195 A JP4319195 A JP 4319195A JP 31919592 A JP31919592 A JP 31919592A JP 2800599 B2 JP2800599 B2 JP 2800599B2
Authority
JP
Japan
Prior art keywords
basic
period
subframe
parameter
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4319195A
Other languages
English (en)
Other versions
JPH06131000A (ja
Inventor
茂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4319195A priority Critical patent/JP2800599B2/ja
Publication of JPH06131000A publication Critical patent/JPH06131000A/ja
Application granted granted Critical
Publication of JP2800599B2 publication Critical patent/JP2800599B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号の低ビットレ
ート符号化に関し、特に音声の基本周期パラメータの符
号化装置に関する。
【0002】
【従来の技術】音声信号を効率的に符号化する方式とし
て線形予測符号化方式とベクトル量子化を組み合わせた
CELP(Code−Excited Linear
Prediction)符号化方式がある。本方式は、
信号のスペクトル包絡を表す線形予測部と音声の基本周
期を表すコードブック部と励振信号を表す音源コードブ
ック部と振幅制御を行なうゲインコードブック部とから
なる。CELPにおいては、線形予測部は一定間隔で区
切られたフレーム単位で求められ、他の構成要素はフレ
ームを更に分割したサブフレーム毎に決定されるのが普
通である。
【0003】サブフレーム毎に適応コードブック部で定
まる基本周期を低ピットレートで符号化する方法として
は、M.YongとA.Gershoによる文献
(1):“Efficient encoding o
f the long−termpredictor
in vector excitation code
res,”と、Campbellらによる文献
(2):”An Expandabler Error
−Protected 4800 bps CELP
Coder(U.S.Federal Standar
d 48000 bps Voice Coder)が
ある。前者は、サブフレーム毎の基本周期をフレーム全
体に渡る平均周期とその変動分とで符号化するもので、
音質劣化を抑えて低ビットレート化が可能とされてい
る。一方後者は、奇数サブフレームで求める基本周期は
偶数サブフレームからの差分で符号化する方法であり、
基本周期探索に要する演算量を低減する効果も併せ持
つ。一方、適応コードブック部で定まる基本周期ではな
く、入力音声信号の情報のみから基本周期を抽出する方
式においては、基本周期を差分符号化する構成が、例え
ば文献(3):特開平2−216200”音声符号化装
置および音声符号化装置”などで提案されている。
【0004】
【発明が解決しようとする課題】まず、基本周期を平均
値とそれからの変動分として符号化する前記文献(1)
の従来方式は、過去のサブフレームで定めた基本周期か
らの差分を符号化する逐次差分方法と比較して効率的で
ないという問題がある。例えば、基本周期がサブフレー
ム毎に{8、10、12、14、16}と変動している
とき、前記文献(1)の従来方法では、平均12を表す
のに4ビット、平均からの変動を表すのに7(=2+1
+1+1+2)ビットで計11ビット要する。しかし、
逐次的に符号化する場合は、7(=3+1+1+1+
1)ビットとなり、より低ビットレート化が図れる。
【0005】一方、偶数サブフレームと奇数サブフレー
ムとの差分で量子化する前記文献(2)の従来方式で
は、奇数サブフレームの基本周期を求める際に過去の偶
数サブフレームで定めた基本周期を前提する逐次決定を
採用しているため、基本周期を符号化する手段がフレー
ム全体として最適な基本周期の組を定めるようになって
おらず、差分符号化をしない場合と比較して特性が大き
く劣化するという問題がある。また、奇数サブフレーム
に割り当てられるビット数が一定であるため、音声信号
がフレーム内で変動しているような場合にその変化に追
随できないという欠点を持つ。また更に、後者を更に低
ビットレートに適用するには、奇数サブフレームのビッ
ト数を削減しなければならず、特性が劣化するという問
題がある。
【0006】さらに、文献(3)のような入力音声信号
と再生音声信号との誤差を最小にする基本周期部を持た
ない従来方式における基本周期の差分符号化は、基本周
期パラメータを単なる時系列パラメータとして見たとき
のそれであり、再生音声信号と入力音声信号との距離を
無視しているため、高品質な再生音声信号が得られない
という問題がある。
【0007】本発明の目的は、フレーム全体で最適とな
るように基本周期を低ビットレートで符号化する基本周
期符号化装置を提供することで、音声符号化式の高品質
化を図ることにある。
【0008】
【課題を解決するための手段】第1の発明の基本周期符
号化装置は、離散音声信号をスペクトル包絡を表すパラ
メータと基本周期を表すパラメータと励振音源を表すパ
ラメータと振幅制御を行なうパラメータとで表現する音
声符号化方式で、一定間隔のフレームに分割された離散
音声信号を入力し、前記フレームを複数区間に分散した
サブフレーム毎に基本周期パラメータを符号化する際
に、前記サブフレームの基本周期パラメータの幾つかを
過去に定まるサブフレームの基本周期パラメータとの差
分で符号化する基本周期符号化装置において、前記入力
音声信号をもとに当該フレームの各サブフレームに対応
する候補基本周期の組を出力する基本周期予備選択部
と、前記基本周期予備選択部から出力される候補基本周
期の組の当該サブフレームに対応する基本周期パラメー
タに対する予め定められた範囲にある近傍基本周期パラ
メータから当該サブフレームの入力音声信号と当該サブ
フレームのスペクトル包絡パラメータと過去に定めた励
振音源を表すパラメータとを用いて基本周期を決定する
基本周期本選択部とを有し、前記基本周期予備選択部
が、前記基本周期予備選択部でフレーム全体に渡るサブ
フレームの候補基本周期を求める過程で、前記入力音声
信号を用いて各サブフレーム毎に複数の基本周期パラメ
ータ候補と前記候補に付随する予測ゲインとを定め、前
記定めた基本周期パラメータ候補のそれぞれを基本とし
て隣接するサブフレーム間の基本パラメータの差が予め
定められた範囲内にある基本周期パラメータ組を構成
し、前記構成されたフレーム全体に渡る基本周期パラメ
ータの組からそれらに付随する予測ゲインをもとに候補
基本周期を抽出することを特徴とする。
【0009】第2の発明の基本周期符号化装置は、第1
の発明において、前記基本周期予備選択部が、前記基本
周期予備選択部でフレーム全体に渡るサブフレームの候
補基本周期パラメータを求める過程で、前記入力音声信
号を用いて最大予測ゲインを与えるサブフレームを定
め、前記定まったサブフレーム間において前記入力音声
信号をもとに基本周期パラメータ候補と、前記候補に付
随する予測ゲインとを定め、前記定めた基本周期パラメ
ータ候補のそれぞれを基本として隣接するサブフレーム
の基本パラメータの差が予め定められた範囲内にある基
本周期パラメータ組を構成し、前記構成されたフレーム
全体に渡る基本周期パラメータの組からそれらに付随す
る予測ゲインをもとに候補基本周期を抽出することを特
徴とする。
【0010】第3の発明の基本周期符号化装置は、第1
の発明において、前記基本周期本選択部が、過去のサブ
フレームで定まった基本周期から予め定められた範囲内
にある近傍基本周期パラメータの組みを構成し、前記構
成された近傍基本周期パラメータから当該サブフレーム
の入力信号と当該サブフレームのスペクトル包絡パラメ
ータと過去に定めた励振音源を表すパラメータとを用い
て基本周期を決定することを特徴とする。
【0011】第4の発明の基本周期符号化装置は、第1
の発明において、前記基本周期予備選択部が候補基本周
期を複数出力することを特徴とする。
【0012】第5の発明の基本周期符号化装置は、第1
の発明において、差分符号化される基本周期に割り当て
られるビット数がサブフレーム毎に異なることを特徴と
する。
【0013】第6の発明の基本周期符号化装置は、第1
の発明において、前記入力音声信号から計算される各サ
ブフレーム毎の予測ゲインをもとに当該フレーム或いは
当該サブフレームを予め定められたクラスに分割するモ
ード識別部を備え、前記モード識別部から出力されるク
ラス情報をもとに、差分符号化される基本周期に割り当
てられるビット数をサブフレーム毎に異なるようにする
ことを特徴とする。
【0014】第7の発明の基本周期符号化装置は、第1
の発明において、前記基本周期予備選択部が、隣接する
サブフレーム間の基本パラメータの差が予め定められた
範囲内にあるように構成された複数ラグの組から候補基
本周期を抽出する際に、各ラグに付随する予測ゲインを
用いて前記基本パラメータの組みをより少ない数の組み
に絞り込み、前記絞り込まれた基本パラメータの組みの
中から最も高い基本周期を抽出することを特徴とする。
【0015】第8の発明の基本周期符号化装置は、第1
の発明において、前記基本周期予備選択部が、前記基本
周期予備選択部でサブフレームの候補基本周期を構成す
る過程で、前記フレームと当該フレームと更に次フレー
ムの入力音声信号とで定まる予測ゲインをもとに、前フ
レームのサブフレームの一部と当該フレームのサブフレ
ームと更に次フレームのサブフレームの一部という複数
フレーム渡って、隣接するサブフレーム間の基本パラメ
ータの差が予め定められた範囲内にある基本周期パラメ
ータ組を構成し、前記複数フレームに渡って構成された
基本周期パラメータの組から、それらに付随する予測ゲ
インをもとに候補基本周期を抽出することを特徴とす
る。
【0016】第9の発明の基本周期符号化装置は、第1
の発明において、前記基本周期予備選択部が、隣接する
サブフレームの基本パラメータ候補から予め定められた
範囲内にある基本周期パラメータのフレーム全体に渡る
組を複数構成し、前記構成された基本周期パラメータの
組から候補基本周期を定める際に、前記構成された基本
パラメータの組み各要素のなかで予め決め閾値を越える
予測ゲインを与える基本周期パラメータを用いて基本周
期を抽出することを特徴とする。
【0017】
【作用】いま、第iフレームの入力信号を{s
(n)}、サブフレーム長をLとする。このとき、各
サブフレームnsub=0,・・・,N−1毎に、
【0018】
【0019】が計算されているものとする。ここでtは
時間ラグ(或いは入力信号の周期)を表す項で、各tに
対する予測ゲインは、
【0020】
【0021】として計算される。尚、
【0022】
【0023】である。
【0024】第1の発明における基本周期予備選択部で
は以下のような作用で処理が実行される。入力音声信号
s(n)を用いて前記第(3)式或いは(4)式を用い
て各サブフレームのラグtnsubに対する予測ゲイン
を定める。次に、各サブフレームにおい
【0025】
【0026】なる関係を満足する。以下、このような関
係を満足するラグの組{l}を求めるのをトラッキン
グと呼ぶことにする。また、ここで、{l}を求める
のに
【0027】
【0028】 未来に位置するサブフレームのラグを繰り返して使って
処理することができる。最後に、上式を満足させる{l
}の内、
【0029】
【0030】或いは、
【0031】
【0032】なる累積予測ゲインを最大化させるラグ組
imaxを選択し、それを基本周期本選択部に送る。
第1の発明における基本周期本選択部では、音声のスペ
クトル包絡を表す線形予測係数{α(i)}と過去の励
振音源{v(n),n=0,...,L−1}とを用
いて、基本予備選択部から出力されるlimaxの当該
サブフレ
【0033】
【0034】
【0035】
【0036】ここで、
【0037】
【0038】 トで差分符号化できる。
【0039】なお、上式においては、ラグの値tとして
整数値を仮定しているが、例えばK.Kroon an
d B.S.Atalによる文献(4):“Pitch
Predictiors With High Te
mporal Resolution,”Proc.I
EEE Inc.Conf.on.Acoustic
s,Speech and Signal Proce
ssing,pp.661−664 1990.”で述
べられているような小数値を用いることもできる。この
場合、小数値は整数にインデックスニングされ、差分符
号化はインデックスの差に対して適用される。小数ラグ
を用いる場合一般に演算量が増加するため、基本周期パ
ス候補を計算する際には整数ラグだけを探索し、候補基
本周期抽出をする際に小数ラグを探索する構成を取るこ
とができる。
【0040】第2の発明における基本周期予備選択部で
は、まず第1の発明と同様に各サブフレームにおいて各
ラグに対する予測ゲインを計算する。次に、サブフレー
ムの
【0041】
【0042】なる関係を満足する。そして最後に、上式
を満足させる{l}の内、
【0043】
【0044】なる累積予測ゲインを最大化させるラグの
組limaxを選択し、それを基本周期本選択部に送
る。第2の発明は、第1の発明と比較して少ない演算量
で、同等の特性を与えるという効果を持つ。
【0045】第3の発明における基本周期本選択部で
は、
【0046】
【0047】 いる。
【0048】
【0049】 できる
【0050】第4の発明は、基本周期本選択部に送るラ
グの組{l}(k>1)を複数出力する基本周期予備
選択部と、前記基本周期予備選択部から出力される複数
ラグの予め定められた範囲の近傍にあるラグに対して上
記(9)式に示した選択を行なう本選択部とを持つもの
で、単一候補に絞られた上記の発明と比較してより最適
に近い基本周期パラメータを求めることがでるという効
果を持つ。
【0051】第5の発明は、差分符号化に要するビット
数をサブフレーム毎に異なるようにするもので、前記W
c並びに前記WDはサブフレームの関数となる。例え
ば、基本周期をサブフレーム毎に{8,3,7,3,
3}ビットで符号化する場合、WDはWD(nsub)
={256,8,128,8,8}となり、それに伴い
もW(nsub)={8,8,16,8,8}な
どとなる。また、このWの値を変化させる場合、当該
サブフレームから未来のサブフレームへトラックン とすることができる。
【0052】第6の発明は、サブフレーム毎の差分符号
化に要するビット数を、当該フレーム或いは当該サブフ
レームの特性の応じて異なるようにするもので、当該フ
レーム或いは当該サブフレームの特性としてはサブフレ
ーム毎の予測ゲインの幾何平均、或いはサブフレーム毎
のRMSの幾何平均などの情報を用いることができる。
予め定められたようにクラス分けを行ない、そのクラス
の応じて、差分符号のためのビット数並びに前記W
びに前記WDもサブフレームを割り当てるもの 幾何平均
【0053】
【0054】の値によって当該フレームを次のような予
め定められたクラスに分類する。
【0055】 0 ≦Pgn<0.25 CLASS0 0.25≦Pgn<0.5 CLASS1 0.5 ≦Pgn<0.75 CLASS2 0.75≦Pgn< CLASS3 この分類にしたがって、差分符号化に割り当てるビット
数を次のように切替える。
【0056】 WD(nsub=0,...,3){0,0,0,0,0} for CLASS0 WD(nsub=0,...,3){8,3,7,3,3} for CLASS1 WD(nsub=0,...,3){8,3,5,4,4} for CLASS2 WD(nsub=0,...,3){8,4,4,4,4} for CLASS3 このビットの割り当てに応じて、W(nsub)も変
化させることも可能である。本発明により当該フレーム
の入力音声の特性に応じた基本周期の符号化が可能とな
る。
【0057】第7の発明は、上記第1及び第2の発明で
述べたlimaxを求める際に、予測ゲインの累積誤差
ではなく、累積誤差の最大値PG(imax)から予め
定められた値以内にある累積誤差を与えるラグの組の
内、最小ラグをとるものを基本周期予備選択部として出
力するもの。本発明により倍ピッチを抽出する誤りを防
ぐことができる。
【0058】第8の発明は、上記基本予備選択部の手順
を当該フレームの音声信号に適用するだけでなく、前フ
レームあるいは次フレームのサブフレームの音声信号を
用いてlimaxを求めるものである。例えば、ラグト
ラッキングlを求める式
【0059】
【0060】そして、累積を求める式
【0061】
【0062】において、nsubの値としてnsub=
{−1,0,1,...,N−1,N}を取るようにす
る。このとき、nsub=−1は前フレームのN−1番
目のサブフレームの予測ゲインを用いることを示し、n
sub=Nは次フレームの0番目のサブフレームの予測
ゲインを用いることを示す。本発明はフレーム間の不連
続を軽減させる効果をもつ。
【0063】第9の発明は、上記第1の発明で述べたl
imaxを求める際に、予め定めておいた予測ゲインの
閾値gnthを越える予測ゲインに対してのみ累積予測
ゲイン累積値を計算するようにする。即ち、
【0064】
【0065】本発明により、フレーム内で周期構造が変
化しているような場合、周期性がよりはっきりしている
サブフレームに重みを掛けて候補基本周期が抽出できる
という効果を持つ。
【0066】尚、ここまでは累積予測ゲインとして第3
式或いは第4式なるものを用いたが、他にもサブフレー
ム毎の予測ゲインの算術平均
【0067】
【0068】など、入力音声信号の周期性の程度を表す
ものであれば何でもよい。
【0069】以上で本発明の作用に関する説明を終え
る。
【0070】
【実施例】図1は第1の発明の基本周期符号化装置の一
実施例を示すブロック図である。入力端子10より入力
した音声信号はフレームバッファ20に蓄えられる。線
形予測分析部30はフレームバッファ20より当該フレ
ームの入力音声信号を供給し、文献(4):斉藤、中田
著、音声情報処理の基礎、などでよく知られた線形予測
分析により、例えばLSPのような線形予測パラメータ
1z{lsp(i)}を求め、それをLPC量子化部
50とLPCメモリ31とLPC補間部32とに出力す
る。LPC量子化器50はLPC分析部30から供給さ
れるLSPパラメータ{lsp(i)}に対し、同じ
く前記文献(4)で記述されている量子化法を適用して
定められる量子化LSP{qlsp(i)}を求め、
量子化LPC補間部52と量子化LPCメモリ51とに
出力する。また、量子化の際に求めるインデックス情報
は出力端子14へ送られる。LPC補間部32では、L
PCメモリ31にある前フレームのLSP{lsp
k−1(i)}とLPC分析部30とから供給される当
該フレームのLSP{lsp(i)}とを線形補間
し、当該サブフレームnsubの線形予測係数{α
nsub(i)}を求め、それを基本周期予備選択部4
0と基本周期本選択部60と励振音源探索部70とゲイ
ン探索部90とに供給する。量子化LPC補間部52で
は、量子化LPCメモリ51から供給される前フレーム
の量子化LSP{qlspk−1(i)}とLPC量子
化部50とか供給される当該フレームの量子化されたL
SP{qlsp(i).}とを線形補間し当該サブフ
レームnsubの線形予測係数{βns ub(i)}を
基本周期本選択部60と励振音源探索部70とゲイン探
索部90とへ出力する。
【0071】ここで、基本周期予備選択部40の構成を
図2に基づいて説明する。まず、重みつけ部41では、
フレームバッファ20から供給される入力音声信号をL
PC補間部32から供給される線形予測係数{α
nsub(i)}を用いて次のように変換する。
【0072】
【0073】ここで、v(i)とu(i)は任意の係数
で、例えば、v(i)=0.9、u(i)=0.4
などと選択される。次に、予測ゲイン計算部42で重み
つけされた入力音声信号{s(n)}を{s(n)}
として前記作用で述べた手順により予測ゲインを計算す
る。即ち、
【0074】
【0075】基本周期パス候補構成部43では、まず、
最大値予測ゲインを与える周期tma :”Techniques for improvin
g the performance of CELP
type speech coderes,“Pro
c.IEEE Inc.Conf.on.Acoust
ics,Speech and Signal Pro
cessing,pp.205−2081991.”で
述べられているような、tmaxnsubの約数並びに
倍数から フレームの状態や当該サブフレーム最大予測ゲインの大
きさに応じて変動させることも可能である。例えば、前
フレームの最大予測ゲインが0.3より小さいときT
=0.5,0.3より大きいときはT=0.75とす
ることができ、ま 0.3,T=0.75,otherwizeなどとす
る。このようにして求めた、各サブフレ
【0076】
【0077】なる関係を満足するようなラグの組を求め
る。このようにして求まった{l}は候補基本周期抽
出部44へ出力される。候補基本周期抽出部44では、
基本周期パス候補構成部より供給される{l}の内か
ら、次式の累積予測ゲインを最大化されるラグの組l
imaxを選択し、それを基本周期本選択部60へ出力
する。
【0078】
【0079】以上で基本周期予備選択部40の説明を終
える。図1に戻って、基本周期本選択60では、フレー
ムバッファ20から供給される当該サブフレームの入力
音声信号{s(n−nsub×L)}と、過去の励振音
源メモリ80から供給される励振音源信号{v(n)}
と、LPC補間部32から供給される当該サブフレーム
のLPC係数{αnsub(i)}と、量子化LPC補
間部から供給される当該サブフレームの量子化LPC係
数{βnsub(i)}とを用いて、基本周期予備選択
【0080】
【0081】
【0082】
【0083】ここで
【0084】
【0085】 源{e(n)}は励振音源探索部70へとゲイン探索部
90とへ出力される。励振音源探索部70は、予め蓄え
られた音源コードブックCにある音源コードベクトルc
(n)から、次式を最小化するものcimax(n)
を選択する。
【0086】
【0087】選択された音源コードベクトルはゲイン探
索部90へ、そのインデックスimaxは出力端子12
へ出力される。また、新たに定まった励振音源信号:g
e(n)+gimax(n)は励振音源メモリ8
0へ送られる。ゲイン探索部90は、予め蓄えられてい
るゲインコードブックGからゲインコードベクトル(g
(k),g(k))から次式を最小にするもの(g
(kmax),g(kmax))を選択する。
【0088】
【0089】求められたゲインコードベクトルは励振音
源メモリ80へ、そのインデックスkmaxは出力端子
13へ出力される。励振音源メモリ80では、g(k
max)e(n)+g(kmax)cimax(n)
を過去の励振音源として蓄える。尚、励振音源メモリ8
0は次のように更新される。
【0090】 v(n−L)=v(n),n=L,...,L−1 (43) v(L−L+n)=g(kmax)e(n)+g(kmax)cim ax (n),n=0,...,L−1 (4 4) 図3は第2の発明の基本周期符号化装置における基本周
期予備選択部の実施例の一つである。本実施例における
基本予備選択部は次のように動作する。予測ゲイン計算
部42では前記実施例で説明したのと同様な手順で各サ
ブフレームの予 計算部42から供給される予測ゲインの内最大予測ゲイ
ンを与えるサブフレーム 力する。基本周期パス候補構成部243では、まず、最
大予測ゲイン抽出部24
【0091】
【0092】 る。このように定めた{l}は候補基本周期抽出部4
4へ出力される。候補基本周期抽出部44では、基本周
期パス候補構成部より供給される{l}の内から、次
式の累積予測ゲインを最大化させるラグの組limax
を選択し、それを基本周期本選択部60へ出力する。
【0093】
【0094】図4は第3の発明における基本周期本選択
部の一実施例である。まず、第1サブフレームにおける
動作を説明する。候補ラグ構成部362では、図1の基
本周期予備選択部40から供給されるトラッキングl
imaxから第1サブフレームに対
【0095】
【0096】 られる。距離計算部361では候補ラグ構成部362か
ら供給されるラグ集合
【0097】
【0098】計算されたD(o)は基本周期ラグ選択部
363へ送られる。基本周期ラグ選択部では前記{D
(o)}の中からその最大値を与えるomaxを求め、
候補ラグ 図1の出力端子11とへ出力される。励振音源構成部3
64では基本周期ラグ選 とから、
【0099】
【0100】を構成し、{ge(n)}を図1の励振
音源探索部70へ出力する。次に、第2サブフレーム以
降の動作を説明する。第1サブフレームと本質的に異な
るのは候補ラグ構成部362の処理だけである。候補ラ
グ構成部362では、基本周期 近傍
【0101】
【0102】 }並びにそれに対応する{e(n),n=0,...,
L×N−1}が決定されて行く。
【0103】図5(a)(b)は第4の発明における基
本周期予備選択部と基本周期本選択部の一実施例であ
る。本実施例のおける基本周期抽出部440の候補周期
抽出部444では、基本パス候補構成部43から供給さ
れるラグの組{l}から、累積予測ゲイン
【0104】
【0105】 M−1}を選択し基本周期本選択部460へ出力する。
基本周期本選択部460の候補ラグ構成部462では、
基本周期予備選択部440から供給される複数ラ
【0106】
【0107】 部462から供給
【0108】
【0109】 振音源構成部364とへ出力される。
【0110】図6は、第5の発明における基本周期予備
選択部と基本周期本選択部の実施例を示す。基本周期予
備選択部540の基本周期パス候補構成部543では、
候補範囲テーブル501から、サブフレーム毎のトラッ
キング探索範囲{W(ns
【0111】
【0112】なる関係を満足する。このようにしてトラ
ッキングされたラグの組lは候補基本周期抽出部44
へ出力される。候補基本周期抽出部44では前記
{l}の中から、次式の累積予測ゲインを最大化させ
るラグの組limaxを選択し、それを基本周期本選択
部560の候補ラグ構成部562へ出力する。
【0113】
【0114】 成する際に、候補範囲テーブル501からサブフレーム
毎の範囲{WD(nsub)}を入力して、
【0115】
【0116】が満足されるようにする。距離計算部36
1は候補ラグ構成部562から供給さ
【0117】
【0118】を計算する。他の処理はこれまでの実施例
で述べたものと同じである。
【0119】図7は第6の発明における基本周期予備選
択部と基本周期本選択部の実施例を示す。フレームモー
ド識別部601においては、まず、基本周期予備選択部
640の予測ゲイン計算部42から出力される予測ゲイ
ンから各サブフレームの最大
【0120】
【0121】或いは、算術平均
【0122】
【0123】を計算し、最後にその値によって当該フレ
ームのクラスを判定する。クラスの分類には、例えば次
の表のようなものが採用される。
【0124】 0 ≦Pgn<0.25 CLASS0 0.25≦Pgn<0.5 CLASS1 0.5 ≦Pgn<0.75 CLASS2 0.75≦Pgn< CLASS3 尚、上記分類においては、各サブフレームにおけるrm
s値も併用することができ、 (0 ≦Pgn<0.25)∩(0≦rms<500) CLASS0 (0.25≦Pgn<0.5 )∩(500≦rms<900) CLASS1 (0.5 ≦Pgn<0.75)∩(800≦rms<1200) CLASS2 (0.75≦Pgn) ∩(1000≦rms) CLASS3 のようにすることもできる。クラスインデックスcld
exは出力端子602と基本周期予備選択部640の基
本周期パス候補構成部643と基本周期本選択部660
の候補ラグ構成部662とへ出力される。基本周期パス
候補構成部643では、予測ゲイン計算部42から供給
される各サブフレームの予測ゲインと、前記フレームモ
ード識別部から供給されるクラスインデックスで決まる
当該サブフレームにおけるトラッキンゲ箭囲W(ns
ub)とをもとにトラッキング{l}を出力する。こ
こで、トラッキングの探索範囲Wは、次のように定ま
っているとする。
【0125】 W(nsub=0,,,,3){0,0,0,0,0} for CLASS0 W(nsub=0,,,,3){256,8,128,8,8} for CLASS1 W(nsub=0,,,,3){256,8,32,8,8} for CLASS2 W(nsub=0,,,,3){256,16,16,16,16} for CLASS3
【0126】
【0127】なる関係を満足することになる。このよう
にして定まったトラッキングの組lは候補基本周期抽
出部44へ出力される。候補基本周期抽出部44は、前
記{l}の中から、次式の累積予測ゲイン
【0128】
【0129】を最も大きくするlimaxを求め、基本
周期本選択部660の候補ラグ構成部662へ出力す
る。候補ラグ構成部662では、距離計算部361へ出
力するラグの レームのクラスインデックスを参照して、例えば、 WD(nsub=0,...,3){0,0,0,0,0} for CLASS0 WD(nsub=0,...,3){128,4,64,4,4} for CLASS1 WD(nsub=0,...,3){128,4,16,4,4} for CLASS2 WD(nsub=0,...,3){128,8,8,8,8} for CLASS3 なるテーブルで決まる{WD(nsub)}と、前記基
本周期予備選択部640
【0130】
【0131】
【0132】
【0133】を計算する。その他の処理はこれまでの実
施例で述べたものと同じである。
【0134】図8は第7の発明における基本周期予備選
択部の実施例である。基本周期予備選択部740の候補
基本周期抽出部744では、まず、基本周波パス候補構
成部 それぞれに対して次式の累積予測ゲイン
【0135】
【0136】を計算し、次にその最大値PGmaxから
予め定められた範囲内にあるラグの組
【0137】
【0138】 を基本周期本選択部60へ出力する。尚、上式でTth
は任意の閾値で例えば0.9などと取れる。
【0139】図9は第8における基本周期予備選択部の
実施例を示す。本実施例では、入力端子10から供給さ
れる入力信号{s(n)}は2フレームバッファ820
へ蓄えられる。2フレームバッファ820から当該フレ
ームの入力音声信号はLPC分析部30へ、当該フレー
ムと次フレームの2フレーム分の入力音声信号は基本周
期予備選択部840の重み付け部841へ供給される。
重み付け部841では、2フレームバッファ820から
供給される(1+1/N)フレーム分の入力音声信号を
LPC補間部32から供給される線形予測係数{α
nsub(i)}を用いて次のように変換する。
【0140】
【0141】上式、nsub=N−1とnsub=Nの
線形予測係数は同一として計算する。予測ゲイン計算部
842では、重み付け部841から供給される{s
(n)}から、(N+1)サブフレーム分の予測ゲイ
【0142】
【0143】を前記作用で説明した第3式或は第4式に
基づいて計算する。基本周期パス候補構成部843で
は、まず、nsub={0,...,N}の各サブフレ
ームに対 本周期メモリ845から供給される、候補基本周期抽出
部で定まった前フレーム 出力される。候補基本周期抽出部844は、基本周期パ
ス候補構成部より供給される{l}の内から、次式の
累積予測ゲインを最大化させるラグの組limaxを選
択し、それを基本周期本選択部60へ、第N−1サブフ
レームに対応するラグ
【0144】
【0145】 なので削除してある。
【0146】図10は第9の発明における基本周期予備
選択部の実施例の一つである。基本周期予備選択部94
0の基本周期抽出部944では、基本周期パス候補構成
部43から入力される{l}の内から累積予測ゲイン
を計算して所望のラグの組みを選択する際、閾値メモリ
945から予測ゲインの閾値gnthを入力し、その閾
値を越える予測ゲインに対してのみ累積値を計算するよ
うになっている。即ち、
【0147】
【0148】基本周期本選択部60へ出力されるラグの
組みlimaxは上式を最大化するものである。
【0149】図11は第9発明の基本周期予備選択部の
他の実施例を示すブロック図である。本実施例の整数ラ
グ予測ゲイン計算部1042では、これまで述べた予測
ゲイン
【0150】
【0151】の計算において、ラグtを整数値に限定し
ている。基本周期パス候補構成部1043では、整数予
測ゲイン計算部1042で計算された整数ラグの予測ゲ
インをもとに、例えば、まず最大予測ゲインを与える周
期tmaxnsubとその最大値
【0152】
【0153】なる関係を満足するようなラグの組を求め
る。このようにして求まった{l}は小数ラグ予測ゲ
イン計算部1045と候補基本周期抽出部1044とへ
出力される。小数ラグ予測ゲイン計算部では、基本周期
パス候補構成部1043から供給されるラグの組
{l}の予め定められた近傍の小数ラグの予測ゲイン
を計算する。小数ラグtfracに対応する予測ゲイン
は、例えばtfrax=t+t/D(Dは整数値)
のときは、次のように計算できる。
【0154】
【0155】ここでh()は文献4にあるポリフェイズ
フィルタのインパルス応答である。候補基本周期抽出部
1044では、基本周期パス候補構成部から供給される
{l}と、小数ラグ予測ゲイン計算部1045から供
給される{l}の近傍の小数ラグ予測ゲインとをもと
に、{l}の近傍から次式の累積予測ゲインを最大
【0156】
【0157】ここでWはあらかじめ定められた定数で
ある。
【0158】尚、これまでの実施例においては、全サブ
フレームを差分符号化する構成を説明したが、サブフレ
ームを幾つかの紐に分割し、その組ごとに差分符号化す
る構成を取ることもできる。この構成は、フレーム内の
入力音声信号の基本周期が大きく変動している場合に効
果を出す。
【0159】
【発明の効果】以上説明したように、本発明では、基本
周期を差分符号化する構成において、基本周期予備選択
部でフレーム全体に渡る歪みを評価した最適トラッキン
グを行ない、基本周期本選択部では前記基本周期予備選
択部から供給される候補基本周期の近傍から基本周期を
求め差分符号化を行なうことにより、フレーム全体で最
適な基本周期を低ビットレートで符号化できる基本周期
符号化装置を提供できるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を含む音声符号化装置のブロ
ック図である。
【図2】第1の発明における基本周期予備選択部のブロ
ック図である。
【図3】第2の発明における基本周期予備選択部のブロ
ック図である。
【図4】第3の発明における基本周期本選択部のブロッ
ク図である。
【図5】第4の発明における基本周期予備選択部と基本
周期本選択部のブロック図である。
【図6】第5の発明における基本周期予備選択部と基本
周期本選択部のブロック図である。
【図7】第6の発明における基本周期予備選択部と基本
周期本選択部のブロック図である。
【図8】第7の発明における基本周期予備選択部のブロ
ック図である。
【図9】第8の発明における基本周期予備選択部のブロ
ック図である。
【図10】第9の発明における基本周期予備選択部のブ
ロック図である。
【図11】第9の発明における基本周期予備選択部のブ
ロック図である。
【符号の説明】
10 入力端子 11 基本周期出力端子 12 音源コードブックインデックス出力端子 13 ゲインコードブックインデックス出力端子 14 量子化LPCインデックス出力端子 20 フレームバッファ 30 LPC分析部 31 LPCメモリ 32 LPC補間部 40、440、540、640、740、840、94
0、1040 基本周期予備選択部 41、841 重み付け部 42、842 予測ゲイン計算部 43、243、543、643、843、1043 基
本周期パス候補構成部 44、744、844、944、1044 候補基本周
期抽出部 50 LPC量子化部 51 量子化LPCメモリ 52 量子化LPC補間部 60、460、560、660 基本周期本選択部 70 励振音源探索部 80 励振音源メモリ 90 ゲイン探索部 242 最大予測ゲイン抽出部 361 距離計算部 362、462、562、662 候補ラグ構成部 363 基本周期ラグ選択部 364 励振音源構成部 365 基本周期ラグメモリ 501 候補範囲テーブル 601 フレームモード識別部 601 クラスインデックス出力端子 820 2フレームバッファ 845 候補基本周期メモリ 945 閾値メモリ 1042 整数ラグ予測ゲイン計算部 1045 小数ラグ予測ゲイン計算部

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 離散音声信号をスペクトル包絡を表すパ
    ラメータと基本周期を表すパラメータと励振音源を表す
    パラメータと振幅制御を行なうパラメータとで表現する
    音声符号化方式で、一定間隔のフレームに分割された離
    散音声信号を入力し、前記フレームを複数区間に分割し
    たサブフレーム毎に基本周期パラメータを符号化する際
    に、前記サブフレームの基本周期パラメータの幾つかを
    過去に定まるサブフレームの基本周期パラメータとの差
    分で符号化する基本周期符号化装置において、前記入力
    音声信号をもとに当該フレームの各サブフレームに対応
    する候補基本周期の組を出力する基本周期予備選択部
    と、前記基本周期予備選択部から出力される候補基本周
    期の組の当該サブフレームに対応する基本周期パラメー
    タに対する予め定められた範囲にある近傍基本周期パラ
    メータから当該サブフレームの入力音声信号と当該サブ
    フレームのスペクトル句絡パラメータと過去に定めた励
    振音源を表すパラメータとを用いて基本周期を決定する
    基本周期本選択部とを有し、前記基本周期予備選択部
    が、前記基本周期予備選択部でフレーム全体に渡るサブ
    フレームの候補基本周期を求める過程で、前記入力音声
    信号を用いて各サブフレーム毎に複数の基本周期パラメ
    ータ候補と前記候補に付随する予測ゲインとを定め、前
    記定めた基本周期パラメータ候補のそれぞれを基本とし
    て隣接するサブフレーム間の基本パラメータの差が予め
    定められた範囲内にある基本周期パラメータ組を構成
    し、前記構成されたフレーム全体に渡る基本周期パラメ
    ータの組からそれらに付随する予測ゲインをもとに候補
    基本周期を抽出することを特徴とする基本周期符号化装
    置。
  2. 【請求項2】 前記基本周期予備選択部が、前記基本周
    期予備選択部でフレーム全体に渡るサブフレームの候補
    基本周期パラメータを求める過程で、前記入力音声信号
    を用いて最大予測ゲインを与えるサブフレームを定め、
    前記定まったサブフレームにおいて前記入力音声信号を
    もとに基本周期パラメータ候補と前記候補に付随する予
    測ゲインとを定め、前記定めた基本周期パラメータ候補
    のそれぞれを基本として隣接するサブフレーム間の基本
    パラメータの差が予め定められた範囲内にある基本周期
    パラメータ組を構成し、前記構成されたフレーム全体に
    渡る基本周期パラメータの組からそれらに付随する予測
    ゲインをもとに候補基本周期を抽出することを特徴とす
    る請求項1記載の基本周期符号化装置。
  3. 【請求項3】 前記基本周期本選択部が、過去のサブフ
    レームで定まった基本周期から予め定められた範囲内に
    ある近傍基本周期パラメータの組みを構成し、前記構成
    された近傍基本周期パラメータから当該サブフレームの
    入力信号と当該サブフレームのスペクトル包絡パラメー
    タと過去に定めた励振音源を表すパラメータとを用いて
    基本周期を決定することを特徴とする請求項1記載の基
    本周期符号化装置。
  4. 【請求項4】 前記基本周期予備選択部が候補基本周期
    を複数出力することを特徴とする基本周期符号化装置。
  5. 【請求項5】 差分符号化される基本周期に割り当てら
    れるピット数がサブフレーム毎に異なることを特徴とす
    る請求項1記載の基本周期符号化装置。
  6. 【請求項6】 前記入力音声信号から計算される各サブ
    フレーム毎の予測ゲインをもとに当該フレーム或いは当
    該サブフレームを予め定められたクラスに分割するモー
    ド識別部を備え、前記モード識別部から出力されるクラ
    ス情報をもとに、差分符号化される基本周期に割り当て
    られるピット数をサブフレーム毎に異なるようにするこ
    とを特徴とする請求項1記載の基本周期符号化装置。
  7. 【請求項7】 前記基本周期予備選択部が、隣接するサ
    ブフレーム間の基本パラメータの差が予め定められた範
    囲内にあるように構成された複数ラグの組から候補基本
    周期を抽出する際に、各ラグに付随する予測ゲインを用
    いて前記基本パラメータの組みをより少ない数の組みに
    絞り込み、前記絞り込まれた基本パラメータの組みの中
    から最も高い基本周期を抽出することを特徴とする請求
    項1記載の基本周期符号化装置。
  8. 【請求項8】 前記基本周期予備選択部が、前記基本周
    期予備選択部でサブフレームの候補基本周期を構成する
    過程で、前フレームと当該フレームと更に次フレームの
    入力音声信号とで定まる予測ゲインをもとに、前フレー
    ムのサブフレームの一部と当該フレームのサブフレーム
    と更に次フレームのサブフレームの一部という複数フレ
    ーム渡って、隣接するサブフレーム間の基本パラメータ
    の差が予め定められた範囲内にある基本周期パラメータ
    組を構成し、前記複数フレームに渡って構成された基本
    周期パラメータの組から、それらに付随する予測ゲイン
    をもとに候補基本周期を抽出することを特徴とする請求
    項1記載の基本周期符号化装置。
  9. 【請求項9】 前記基本周期予備選択部が、隣接するサ
    ブフレームの基本パラメータ候補から予め定められた範
    囲内にある基本周期パラメータのフレーム全体に渡る組
    を複数構成し、前記構成された基本周期パラメータの組
    から候補基本周期を定める際に、前記構成された基本パ
    ラメータの組みの各要素のなかで予め決め閾値を越える
    予測ゲインを与える基本周期パラメータを用いて基本周
    期を抽出することを特徴とする請求項1記載の基本周期
    符号化装置。
JP4319195A 1992-10-15 1992-10-15 基本周期符号化装置 Expired - Fee Related JP2800599B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4319195A JP2800599B2 (ja) 1992-10-15 1992-10-15 基本周期符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4319195A JP2800599B2 (ja) 1992-10-15 1992-10-15 基本周期符号化装置

Publications (2)

Publication Number Publication Date
JPH06131000A JPH06131000A (ja) 1994-05-13
JP2800599B2 true JP2800599B2 (ja) 1998-09-21

Family

ID=18107478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4319195A Expired - Fee Related JP2800599B2 (ja) 1992-10-15 1992-10-15 基本周期符号化装置

Country Status (1)

Country Link
JP (1) JP2800599B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3153075B2 (ja) * 1994-08-02 2001-04-03 日本電気株式会社 音声符号化装置
JP3343082B2 (ja) 1998-10-27 2002-11-11 松下電器産業株式会社 Celp型音声符号化装置
EP1164580B1 (en) * 2000-01-11 2015-10-28 Panasonic Intellectual Property Management Co., Ltd. Multi-mode voice encoding device and decoding device
JP4857467B2 (ja) * 2001-01-25 2012-01-18 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP4857468B2 (ja) 2001-01-25 2012-01-18 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
EP2650878B1 (en) * 2011-01-25 2015-11-18 Nippon Telegraph and Telephone Corporation Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04115300A (ja) * 1990-09-05 1992-04-16 Nippon Telegr & Teleph Corp <Ntt> 音声のピッチ予測符号化法
JP2870608B2 (ja) * 1991-02-27 1999-03-17 シャープ株式会社 音声ピッチ予測装置

Also Published As

Publication number Publication date
JPH06131000A (ja) 1994-05-13

Similar Documents

Publication Publication Date Title
JP3196595B2 (ja) 音声符号化装置
US5778334A (en) Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP3143956B2 (ja) 音声パラメータ符号化方式
JPH09281998A (ja) 音声符号化装置
JP2004163959A (ja) 汎用AbS音声符号化方法及びそのような方法を用いた符号化装置
JP2000163096A (ja) 音声符号化方法及び音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP2800599B2 (ja) 基本周期符号化装置
JPH1097294A (ja) 音声符号化装置
US6973424B1 (en) Voice coder
JP3435310B2 (ja) 音声符号化方法および装置
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP3003531B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JPH08234795A (ja) 音声符号化装置
JP3471889B2 (ja) 音声符号化方法及び装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2734995B2 (ja) スペクトルパラメータ抽出装置
JP3192051B2 (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP2808841B2 (ja) 音声符号化方式
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980609

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070710

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080710

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090710

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees