JP3092654B2 - 信号符号化装置 - Google Patents

信号符号化装置

Info

Publication number
JP3092654B2
JP3092654B2 JP08164840A JP16484096A JP3092654B2 JP 3092654 B2 JP3092654 B2 JP 3092654B2 JP 08164840 A JP08164840 A JP 08164840A JP 16484096 A JP16484096 A JP 16484096A JP 3092654 B2 JP3092654 B2 JP 3092654B2
Authority
JP
Japan
Prior art keywords
signal
pitch
delay
pitch prediction
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08164840A
Other languages
English (en)
Other versions
JPH1011093A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP08164840A priority Critical patent/JP3092654B2/ja
Publication of JPH1011093A publication Critical patent/JPH1011093A/ja
Application granted granted Critical
Publication of JP3092654B2 publication Critical patent/JP3092654B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声や音楽信号を
低いビットレートで高品質に符号化するための信号符号
化装置に関するものである。
【0002】
【従来の技術】音声信号を高能率に符号化する方式とし
ては、例えば、M.Schroeder and B.
Atalによる“Code−excited line
arprediction:High quality
speech at very low bit r
ates”(Proc.ICASSP,pp.937−
940,1985年)と題した論文(文献1)や、Kl
eijnらによる“Improved speech
quality and efficeintvect
or quantization in SELP”
(Proc.ICASSP,pp.155−158,1
988年)と題した論文(文献2)などに記載されてい
るCELP(Code Excited Linear
Predictive Coding)が知られてい
る。この従来例では、送信側では、フレーム毎(例えば
20ms)に音声信号から線形予測(LPC)分析を用
いて、音声信号のスペクトル特性を表すスペクトルパラ
メータを抽出する。フレームをさらにサブフレーム(例
えば5ms)に分割し、サブフレーム毎に過去の音源信
号を基に適応コードブックにおけるパラメータ(ピッチ
周期に対応する遅延パラメータとゲインパラメータ)を
抽出し、適応コードブックにより前記サブフレームの音
声信号をピッチ予測する。ピッチ予測して求めた音源信
号に対して、予め定められた種類の雑音信号からなる音
源コードブック(ベクトル量子化コードブック)から最
適な音源コードベクトルを選択し、最適なゲインを計算
することにより、音源信号を量子化する。音源コードベ
クトルの選択の仕方は、選択した雑音信号により合成し
た信号と、前記残差信号との誤差電力を最小化するよう
に行う。そして、選択されたコードベクトルの種類を表
すインデクスとゲインならびに、前記スペクトルパラメ
ータと適応コードブックのパラメータをマルチプレクサ
部により組み合わせて伝送する。受信側の説明は省略す
る。
【0003】
【発明が解決しようとする課題】前記従来法では、音源
コードブックから最適な音源コードベクトルを選択する
のに多大な演算量を要するという問題があった。これ
は、文献1や2の方法では、音源コードベクトルを選択
するのに、各コードベクトルに対して一旦フィルタリン
グもしくは畳み込み演算を行ない、この演算をコードブ
ックに格納されているコードベクトルの個数だけ繰り返
すことに起因する。例えば、コードブックのビット数が
Bビットで、次元数がNのときは、フィルタリングある
いは畳み込み演算のときのフィルタあるいはインパルス
応答長をKとすると、演算量は1秒当たり、N×K×2
B ×8000/Nだけ必要となる。一例として、B=1
0、N=40、K=10とすると、1秒当たり81,9
20,000回の演算が必要となり、極めて膨大である
という問題点があった。また、この問題点は、入力信号
の帯域が電話帯域よりも広く、標本化周波数が高くなる
ほど、深刻であった。
【0004】音源コードブック探索に必要な演算量を低
減する方法として、種々のものが提案されている。例え
ば、ACELP(Argebraic Code Ex
cited Linear Prediction)方
式が提案されている。これは、例えば、C.Lafla
mmeらによる“16 kbps widebands
peech coding technique ba
sed on algebraic CELP”と題し
た論文(Proc.ICASSP,pp.13−16,
1991)(文献3)等を参照することができる。文献
3の方法によれば、音源信号を複数個のパルスで表し、
各パルスの位置をあらかじめ定められたビット数で表し
伝送する。ここで、各パルスの振幅は+1.0もしくは
−1.0に限定されているため、パルス探索の演算量を
大幅に低減化できる。
【0005】しかし、以上述べたいずれの手法も、ピッ
チが一つの音声に対しては比較的良好な音質が得られる
ものの、会議などの用途で、複数話者の声や、複数種の
楽器が混在するためにピッチが複数個含まれる音楽信号
に対しては、低いビットレートでは甚だしく音質が劣化
していた。
【0006】本発明の目的は、上述の問題を解決し、ビ
ットレートが低い場合にも、広帯域の音声のみならず音
楽信号に対しても、比較的少ない演算量で音質の劣化の
少ない信号符号化方式を提供することにある。
【0007】
【課題を解決するための手段】本発明の第1の態様によ
れば、入力信号からスペクトルパラメータを求めて量子
化するスペクトルパラメータ計算部と、前記入力信号か
ら第1のピッチ周期に対応する第1の遅延を求めピッチ
予測残差信号を求め前記ピッチ予測残差信号から第2の
ピッチ周期に対応する第2の遅延を求め、これら第1及
び第2の遅延を少なくとも含むあらかじめ定められた複
数個の遅延を求めて出力する遅延計算部と、前記複数個
の遅延を用いてピッチ予測した残差信号に対して音源信
号を求めて量子化して出力する音源量子化部を有するこ
とを特徴とする信号符号化装置が得られる。
【0008】本発明の第2の態様によれば、前記信号の
音源信号が振幅が非零の複数個のパルスから構成される
ことを特徴とする信号符号化装置が得られる。
【0009】本発明の第3の態様によれば、入力信号か
らスペクトルパラメータを求めて量子化するスペクトル
パラメータ計算部と、前記入力信号から特徴量を抽出し
てモードを判別するモード判別部と、あらかじめ定めら
れたモードにおいて前記入力信号から第1のピッチ周期
に対応する第1の遅延を求めピッチ予測残差信号を求め
前記ピッチ予測残差信号から第2のピッチ周期に対応す
る第2の遅延を求め、これら第1及び第2の遅延を少な
くとも含むあらかじめ定められた複数個の遅延を求めて
出力する遅延計算部と、前記複数個の遅延を用いてピッ
チ予測した残差信号に対して音源信号を求めて量子化し
て出力する音源量子化部を有することを特徴とする信号
符号化装置が得られる。
【0010】本発明の第4の態様によれば、前記信号の
音源信号が振幅が非零の複数個のパルスから構成される
ことを特徴とする信号符号化装置が得られる。
【0011】本発明の第5の態様によれば、入力信号か
らスペクトルパラメータを求めて量子化するスペクトル
パラメータ計算部と、前記入力信号から第1のピッチ周
期に対応する第1の遅延を求めピッチ予測残差信号を求
め第1のピッチ予測利得を計算し、前記ピッチ予測残差
信号から第2のピッチ周期に対応する第2の遅延を求め
これらの処理を繰り返すピッチ予測部と、前記ピッチ予
測利得があらかじめ定められた条件を満たすかどうかを
判別する判別部と、前記ピッチ予測利得があらかじめ定
められた条件を満たさない場合に前記遅延を用いてピッ
チ予測した残差信号に対して音源信号を求めて量子化し
て出力する音源量子化部を有することを特徴とする信号
符号化装置が得られる。
【0012】本発明の第6の態様によれば、前記信号の
音源信号が振幅が非零の複数個のパルスから構成される
ことを特徴とする信号符号化装置が得られる。
【0013】本発明の第7の態様によれば、入力信号か
らスペクトルパラメータを求めて量子化するスペクトル
パラメータ計算部と、前記入力信号から特徴量を抽出し
てモードを判別するモード判別部と、あらかじめ定めら
れたモードにおいて前記入力信号から第1のピッチ周期
に対応する第1の遅延を求めピッチ予測残差信号を求め
第1のピッチ予測利得を計算し、前記ピッチ予測残差信
号から第2のピッチ周期に対応する第2の遅延を求めこ
れらの処理を繰り返すピッチ予測部と、前記ピッチ予測
利得があらかじめ定められた条件を満たすかどうかを判
別する判別部と、前記ピッチ予測利得があらかじめ定め
られた条件を満たさない場合は前記遅延を用いてピッチ
予測した残差信号に対して音源信号を求めて量子化して
出力する音源量子化部を有することを特徴とする信号符
号化装置が得られる。
【0014】本発明の第8の態様によれば、前記信号の
音源信号が振幅が非零の複数個のパルスから構成される
ことを特徴とする信号符号化装置が得られる。
【0015】本発明の第1の態様では、入力信号からピ
ッチ周期に相当する遅延の計算とピッチ予測残差信号の
計算を繰り返し、あらかじめ定められた個数の遅延を求
め、前記複数個の遅延を用いてピッチ予測した残差信号
に対して音源信号を求めて量子化して出力する。
【0016】本発明の第2の態様では、第1の態様にお
いて、音源信号が個数Mの振幅が非零のパルス列から構
成され、パルスの振幅と位置を求めることにより、音源
信号を量子化する。
【0017】本発明の第3の態様では、入力信号から特
徴量を抽出してモードを判別し、あらかじめ定められた
モードにおいてのみ、第1の発明と同一の動作を行な
う。
【0018】本発明の第4の態様では、第3の態様にお
いて、音源信号が個数Mの振幅が非零のパルス列から構
成され、パルスの振幅と位置を求めることにより、音源
信号を量子化する。
【0019】本発明の第5の態様では、入力信号からピ
ッチ周期に相当する遅延の計算とピッチ予測残差信号の
計算とピッチ予測利得の計算を繰り返し、前記ピッチ予
測利得があらかじめ定められた条件を満たすかどうかを
判別し前記ピッチ予測利得があらかじめ定められた条件
を満たさない場合に前記遅延を用いてピッチ予測した残
差信号に対して音源信号を求めて量子化して出力する音
源量子化部を有する。
【0020】本発明の第6の態様では、第5の態様にお
いて、音源信号が個数Mの振幅が非零のパルス列から構
成され、パルスの振幅と位置を求めることにより、音源
信号を量子化する。
【0021】本発明の第7の態様では、入力信号から特
徴量を抽出してモードを判別し、あらかじめ定められた
モードにおいてのみ、第5の態様と同一の動作を行う。
【0022】本発明の第8の態様では、第7の態様にお
いて、音源信号が個数Mの振幅が非零のパルス列から構
成され、パルスの振幅と位置を求めることにより、音源
信号を量子化する。
【0023】
【発明の実施の形態】次に本発明の実施例について図面
を参照して説明する。
【0024】図1は本発明による音声符号化装置の一実
施例を示すブロック図である。
【0025】図において、入力端子100から音声信号
を入力し、フレーム分割回路110では音声信号をフレ
ーム(例えば10ms)毎に分割し、サブフレーム分割
回路120では、フレームの音声信号をフレームよりも
短いサブフレーム(例えば5ms)に分割する。
【0026】スペクトルパラメータ計算回路200で
は、少なくとも一つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓(例えば24ms)を
かけて音声を切り出してスペクトルパラメータをあらか
じめ定められた次数(例えばP=10次)計算する。こ
こでスペクトルパラメータの計算には、周知のLPC分
析や、Burg分析等を用いることができる。ここで
は、Burg分析を用いることとする。Burg分析の
詳細については、中溝著による“信号解析とシステム同
定”と題した単行本(コロナ社1988年刊)の82〜
87頁(文献4)等に記載されているので説明は略す
る。さらにスペクトルパラメータ計算部では、Bung
法により計算された線形予測係数αi (i=1,…,1
0)を量子化や補間に適したLSPパラメータに変換す
る。ここで、線形予測係数からLSPへの変換は、菅村
他による“線スペクトル対(LSP)音声分析合成方式
による音声情報圧縮”と題した論文(電子通信学会論文
誌、J64−A、pp.599−606、1981年)
(文献5)を参照することができる。例えば、第2サブ
フレームでBurg法により求めた線形予測係数を、L
SPパラメータに変換し、第1サブフレームのLSPを
直線補間により求めて、第1サブフレームのLSPを逆
変換して線形予測係数に戻し、第1,2サブフレームの
線形予測係数αil(i=1,…,10、l=1,…,
2)を聴感重み付け回路230に出力する。また、第2
サブフレームのLSPをスペクトルパラメータ量子化回
路210へ出力する。
【0027】スペクトルパラメータ量子化回路210で
は、あらかじめ定められたサブフレームのLSPパラメ
ータを効率的に量子化する。量子化法として、ベクトル
量子化を用いるものとし、第2サブフレームのLSPパ
ラメータを量子化するものとする。LSPパラメータの
ベクトル量子化の手法は周知の手法を用いることができ
る。具体的な方法は例えば、特開平4−171500号
公報(特願平2−297600号)(文献6)や特開平
4−36300号公報(特願平3−261925号)文
献7)や、特開平5−6199号公報(特願平3−15
5049号)(文献8)や、T.Nomura et
al.,による“LSP CodingUsing V
Q−AVQ With Interpolation
in4.075kbps M−LCELP Speec
h Coder”と題した論文(Proc.Mobil
e Multimedia Communicatio
ns,pp.B.2.5,1993)(文献9)等を参
照できる。
【0028】LSPコードブック211を用いて、下記
の数式1で表わされる歪みを最小化するコードベクトル
を選択して出力する。
【0029】
【数1】 ここで、LSP(i),QLSP(i)j ,W(i)は
それぞれ、量子化前のi次目のLSP、量子化後のj番
目の結果、重み係数である。
【0030】また、スペクトルパラメータ量子化回路2
10では、第2サブフレームで量子化したLSPパラメ
ータをもとに、第1サブフレームのLSPパラメータを
復元する。ここでは、現フレームの第2サブフレームの
量子化LSPパラメータと1つ過去のフレームの第2サ
ブフレームの量子化LSPを直線補間して、第1サブフ
レームのLSPを復元する。ここで、量子化前のLSP
と量子化後のLSPとの誤差電力を最小化するコードベ
クトルを1種類選択した後に、直線補間により第1サブ
フレームのLSPを復元できる。
【0031】以上により復元した第1サブフレームのL
SPと第2サブフレームの量子化LSPをサブフレーム
毎に線形予測係数α′i (i=1,…,10)に変換
し、インパルス応答計算回路310へ出力する。また、
第2サブフレームの量子化LSPのコードベクトルを表
すインデクスをマルチプレクサ400に出力する。
【0032】聴感重み付け回路230は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に量子
化前の線形予測係数αi (i=1,…,P)を入力し、
前記文献1にもとづき、サブフレームの音声信号に対し
て聴感重み付けを行い、聴感重み付け信号を出力する。
【0033】応答信号計算回路240は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に線形
予測係数αi を入力し、スペクトルパラメータ量子化回
路210から、量子化、補間して復元した線形予測係数
α′i をサブフレーム毎に入力し、保存されているフィ
ルタメモリの値を用いて、入力信号を零d(n)=0と
した応答信号を1サブフレーム分計算し、減算器235
へ出力する。ここで、応答信号xz (n)は下記の数式
2で表される。
【0034】
【数2】 但し、n−i≦0のときは y(n−i)=p(N+(n−i)) (3) xz (n−i)=sw (N+(n−i)) (4) ここでNはサブフレーム長を示す。γは、聴感重み付け
量を制御する重み係数であり、下記の式(6)と同一の
値である。sw (n)、p(n)は、それぞれ、重み付
け信号計算回路の出力信号、後述の式(6)における右
辺第1項のフィルタの分母の項の出力信号をそれぞれ示
す。
【0035】ピッチ抽出回路390は、聴感重み付け回
路230の出力を用いてピッチ周期に対応する遅延とゲ
インを複数個求める。以下ではこの個数を2とする。ピ
ッチ抽出回路390の構成を図2に示す。
【0036】図2において、端子391から聴感重み付
け信号xw (n)を入力する。第1の遅延、ゲイン計算
回路392は、下記の数式3によって表わされる式
(5)を最小化するように第1の遅延T1 を求め、下記
の数式4によって表わされる式(6)から第1のゲイン
β1 を求める。
【0037】
【数3】
【0038】
【数4】 さらに、次式に従い第1のピッチ予測信号y1 (n)を
求め減算器394に出力する。
【0039】 y1 (n)=β1 w (n−T1 ) (7) 減算器394は、次式により、第1のピッチ予測残差信
号e1 (n)を求める。
【0040】 e1 (n)=xw (n)−y1 (n) (8) 第2の遅延、ゲイン計算回路393は、e1 (n)から
第2の遅延T2 (n)、ゲインβ2 を求める。これら
は、式(5),(6)において、xw (n)のかわりに
1 (n)を用いれば良い。
【0041】T2 ,T1 は、それぞれ、端子397,3
98から出力される。
【0042】インパルス応答計算回路310は、z変換
が下記の数式5で表される聴感重み付けフィルタのイン
パルス応答hw (n)をあらかじめ定められた点数Lだ
け計算し、適応コードブック回路300、音源量子化回
路350へ出力する。
【0043】
【数5】 適応コードブック回路300は、T1 の近傍のサンプル
において、下記の数式6を最小化する遅延Tc1を計算す
る。なお、ここでは、適応コードブックの次数を1とす
る。
【0044】
【数6】 ここで、 yw (n−Tc1)=v1 (n−Tc1)*hw (n) (11) であり、記号*は畳み込み演算を表す。
【0045】ゲインβc1を下記の数式7に従い求める。
【0046】
【数7】 ここで、女性音や子供の声に対して、遅延の抽出精度を
向上させるために、遅延を整数サンプルではなく、小数
サンプル値で求めてもよい。具体的な方法は、例えば、
P.Kroonらによる、“Pitch predic
tors with high temporal r
esolution”と題した論文(Proc.ICA
SSP,pp.661−664,1990年)(文献1
1)等を参照することができる。
【0047】同様の手法により、T2 の近傍のサンプル
において、遅延Tc2とゲインβc2を探索する。
【0048】次に、ピッチ予測信号を計算し、音源量子
化回路350に出力する。
【0049】 qw1(n) =βc1v(n−Tc1)*hw (n) +βc2v(n−Tc2)*hw (n) (13) 遅延Tc1,Tc2はマルチプレクサ400に出力される。
【0050】減算器236は、次式の計算を行ない、減
算結果を音源量子化回路350へ出力する。
【0051】 zw (n)=x′w (n)−qw (n) (14) 音源量子化回路350では、音源信号を、音源コードブ
ック351を用いてベクトル量子化する。減算器236
の出力と、インパルス応答計算回路310の出力を用い
て、下記の数式8を最小化するように、音源コードブッ
ク351から音源コードベクトルcj (n)を探索す
る。
【0052】
【数8】 ここで、記号*は、畳み込み演算を示す。
【0053】選択された音源コードベクトルのインデク
スは、マルチプレクサ400に出力される。
【0054】ゲイン量子化回路365は、ゲインコード
ブック355からゲインコードベクトルを読みだし、選
択された音源コードベクトルに対して、下記の数式9を
最小化するゲインコードベクトルを選択する。
【0055】ここでは、音源コードベクトルのゲインを
ベクトル量子化する例について示す。
【0056】
【数9】 ここで、G′t は、ゲインコードブック355に格納さ
れたゲインコードブックにおけるt番目のコードベクト
ルである。
【0057】選択されたゲインコードベクトルを表すイ
ンデクスをマルチプレクサ400に出力する。
【0058】重み付け信号計算回路360は、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず下式にもとづき駆動音
源信号v(n)を求める。
【0059】 v(n)=g(n)+G′t j (n) (19) v(n)を適応コードブック回路300に出力する。
【0060】次に、スペクトルパラメータ計算回路20
0の出力パラメータ、スペクトルパラメータ量子化回路
210の出力パラメータを用いて下記の数式10によ
り、応答信号sw (n)をサブフレーム毎に計算し、応
答信号計算回路240へ出力する。
【0061】
【数10】 以上により、第1の発明に対応する実施例の説明を終え
る。
【0062】図3は、第2の実施例の構成を示すブロッ
ク図である。図において、図1と異なるのは、音源量子
化回路500、振幅コードブック540、ゲイン量子化
回路550、ゲインコードブック560である。
【0063】音源量子化回路500は、M個の振幅が非
零のパルス列の位置と振幅を計算する。
【0064】音源量子化回路500の構成を示すブロッ
ク図を図4に示す。図4において、相関係数計算回路5
10は、端子501,502からそれぞれ、x
w (n),hw (n)を入力し、下記の数式11及び数
式12に従い、2種の相関係数d(n),φを計算し、
位置計算回路520、振幅量子化回路530に出力す
る。
【0065】
【数11】
【0066】
【数12】 位置計算回路520は、あらかじめ定められた個数Mの
非零の振幅のパルスの位置を計算する。これには、文献
3と同様に、各パルス毎に、あらかじめ定められた位置
の候補について、次式を最大化するパルスの位置を求め
る。
【0067】例えば、位置の候補の例は、サブフレーム
長をN=40、パルスの個数をM=5とすると、下記の
表1のように表せる。
【0068】
【表1】 各パルスについて、位置の候補を調べ、次式を最大化す
る位置を選択する。
【0069】 D=Ck 2 /Ek (23) ここで、Ck 及びEk は下記の数式13及び14により
表わされる。
【0070】
【数13】
【0071】
【数14】 ここで、mk は、k番目のパルスの位置を示すsgn
(k)はk番目のパルスの極性である。
【0072】M個のパルスの位置は振幅量子化回路53
0に出力される。
【0073】振幅量子化回路530は、パルスの振幅を
振幅コードブック540を用いて量子化する。次式を最
大化する振幅コードベクトル選択する。
【0074】 Cj 2 /Ej (26) ここで、Cj 及びEj は下記の数式15及び16により
表わされる。
【0075】
【数15】
【0076】
【数16】 ここで、g′kjは、i番目の振幅コードベクトルにおけ
るk番目のパルスの振幅を示す。
【0077】なお、パルスの振幅を量子化するための振
幅コードブックを、音声信号を用いてあらかじめ学習し
て格納しておくこともできる。コードブックの学習法
は、例えば、Linde氏らによる“An algor
ithm for vector quantizat
ion design,”と題した論文(IEEE T
rans.Commun.,pp.84−95,Jan
uary,1980)(文献12)等を参照できる。
【0078】振幅コードベクトルのインデクスと位置の
情報は、それぞれ、端子503,504から出力され
る。
【0079】ゲイン量子化回路550は、ゲインコード
ブック560を用いてパルスのゲインを量子化する。下
記の数式17を最小化するようなゲインコードベクトル
を選択し、インデクスをマルチプレクサ400へ出力す
る。
【0080】
【数17】 重み付け信号計算回路570は、それぞれのインデクス
を入力し、インデクスからそれに対応するコードベクト
ルを読みだし、まず下式にもとづき駆動音源信号v
(n)を求める。
【0081】 v(n)=g(n)+G′t g′kjw (n−mk ) (30) v(n)を適応コードブック回路300に出力する。
【0082】次に、スペクトルパラメータ計算回路20
0の出力パラメータ、スペクトルパラメータ量子化回路
210の出力パラメータを用いて下記の数式18によ
り、応答信号sw (n)をサブフレーム毎に計算し、応
答信号計算回路240へ出力する。
【0083】
【数18】 図5は第3の実施例の構成を示すブロック図である。
【0084】モード判別回路900は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号を受取
り、モード判別情報をピッチ抽出回路600、マルチプ
レクサ400に出力する。
【0085】ここでは、モード判別に、現在のフレーム
の特徴量を用いる。特徴量としては、例えば、フレーム
で平均したピッチ予測ゲインを用いる。ピッチ予測ゲイ
ンの計算は、例えば下記の数式19を用いる。
【0086】
【数19】 ここで、Lはフレームに含まれるサブフレームの個数で
ある。Pi ,Ei はそれぞれ、i番目のサブフレームで
の音声パワー、ピッチ予測誤差パワーを示し、下記の数
式20及び21により表わされる。
【0087】
【数20】
【0088】
【数21】 ここで、Tは予測ゲインを最大化する最適遅延である。
【0089】フレーム平均ピッチ予測ゲインGをあらか
じめ定められた複数個のしきい値と比較して複数種類の
モードに分類する。モードの個数としては、例えば4を
用いることができる。
【0090】ピッチ抽出回路600は、モード判別情報
を入力し、あらかじめ定められたモードの場合に図2と
同一の処理を行ない、複数個の遅延を出力する。それ以
外のモードでは、遅延の出力は行なわない。
【0091】図6は、第4の実施例の構成を示すブロッ
ク図である。図5におけるモード判別回路900を図3
に付加し、ピッチ抽出回路600を用いたものであるの
で、説明は省略する。
【0092】図7は、第5の実施例の構成を示すブロッ
ク図である。図において、図1の構成と異なるのは、ピ
ッチ抽出回路700、音源量子化回路850、第1の音
源コードブック851、第2の音源コードブック852
であるので、これらを説明する。
【0093】図8はピッチ抽出回路700の構成を示す
ブロック図である。
【0094】第1のピッチ予測利得計算回路710で
は、第1の遅延、ゲイン計算回路392で求めた遅延を
用いて第1のピッチ予測利得を下記の数式22から求め
る。
【0095】
【数22】 判別回路730は、ピッチ予測ゲインG1 があらかじめ
定められたしきい値よりも大きい場合は第2の遅延、ゲ
イン計算回路に対して処理を継続させる。
【0096】G1 がしきい値よりも小さい場合は、第2
の遅延、ゲイン計算回路393の処理は行なわずに、第
1の遅延T1 を出力する。
【0097】処理を継続する場合は、第2の遅延、ゲイ
ン計算回路393は、減算器394に出力に対して、式
(5)及び式(6)のxw (n)をe1 (n)におきか
えて第2の遅延、ゲインを計算する。
【0098】第2のピッチ予測利得計算回路720は、
式(35)においてxw (n)e1(n)におきかえて
第2のピッチ予測利得G2 を計算する。
【0099】判別回路730は、G2 をしきい値と判別
し、あらかじめ定められたしきい値よりも大きいとき
は、第1の遅延と第2の遅延を出力する。あらかじめ定
められたしきい値よりもG2 が小さい時は、第1の遅延
のみを出力する。さらに、遅延の個数を端子399から
出力する。
【0100】図7にもどって、音源量子化回路850
は、まず、ピッチ抽出回路700から出力される遅延の
個数を調べ、遅延の個数が2であれば、通常のビット数
(B1ビット)である第1の音源コードブック851を
使用して音源信号を量子化するが、遅延の個数が1のと
きは、遅延を表すビット数と同一のビッチ数(B2 )の
第2の音源コードブック852を音源コードブック85
1と併用する。
【0101】図9は第6の実施例の構成を示すブロック
図である。図3において、図7のピッチ抽出回路700
を用いたものである。
【0102】音源量子化回路860は、ピッチ抽出回路
700から遅延の個数を入力し、遅延の個数により、パ
ルスの個数をM1 とM2 (M1 <M2 )に切替え、さら
に2種のビット数の異なる振幅コードブックを切替え
る。遅延の個数が2個の時はパルスの個数はM1 とし、
第1の振幅コードブック861を用いる。遅延の個数が
1のときはパルスの個数をM2 とし、第2の振幅コード
ブック862を用いる。
【0103】図10は、第7の実施例の構成を示すブロ
ック図である。
【0104】図7において、図5のモード判別回路90
0を付加し、ピッチ抽出回路800は、あらかじめ定め
られたモードのときに、図7のピッチ抽出回路700と
同一の動作を行なう。
【0105】図11は、第8の実施例の構成を示すブロ
ック図である。図11は、図9において、図10に示し
たモード判別回路900、ピッチ抽出回路800を付加
したものであるので、説明を省略する。
【0106】上述した実施例に限らず、種々の変形が可
能である。
【0107】モード情報を用いて、音源量子化回路や、
ゲインコードブックを切替える構成とすることもでき
る。
【0108】音源コードブックを用いる場合、式(1
5)で示した歪みの小さい順に、複数個のコードベクト
ルを選択し、ゲイン量子化回路でゲインを量子化しなが
ら、式(18)を最小化する音源コードベクトルとゲイ
ンコードベクトルの組合せを選択しても良い。
【0109】また、パルス列で音源を表す場合、パルス
の振幅を量子化するさいに、パルスの位置を複数セット
求め、これらの各々に対して振幅コードブックを探索
し、式(26)を最大化する組合せを選択してもよい。
また、これらの組合せを複数種類ゲイン量子化回路に出
力し、ゲイン量子化しながら、式(29)を最小化する
ような位置、振幅コードベクトル、ゲインコードベクト
ルの組合せを選択してもも良い。
【0110】振幅コードブック540のかわりに、あら
かじめ定められたビット数の極性コードブックを用いて
も良い。
【0111】ピッチ抽出回路で求めた複数個の遅延は、
差分符号化することにより量子化ビット数を削減でき
る。
【0112】
【発明の効果】以上説明したように、本発明によれば、
入力信号から複数個の遅延を求めた後に音源信号を計算
することで、複数話者からなる音声や、複数個の楽器か
ら構成される音楽信号に対して、従来よりも良好な音質
が得られるという効果がある。
【0113】さらに、遅延を求めながらピッチ予測利得
を求め、ピッチ予測利得があらかじめ定められた条件を
満たすかどうかを判別することで遅延の個数を可変にし
ているので、入力信号の特徴に応じて遅延の個数を適切
に選ぶことができ、入力信号を良好に符号化することが
できる。
【図面の簡単な説明】
【図1】本発明の第1の実施例による信号符号化装置の
ブロック図である。
【図2】図1の信号符号化装置のピッチ抽出回路390
のブロック図である。
【図3】本発明の第2の実施例による信号符号化装置の
ブロック図である。
【図4】図3の信号符号化装置の音源量子化回路500
のブロック図である。
【図5】本発明の第3の実施例による信号符号化装置の
ブロック図である。
【図6】本発明の第4の実施例による信号符号化装置の
ブロック図である。
【図7】本発明の第5の実施例による信号符号化装置の
ブロック図である。
【図8】図7の信号符号装置のピッチ抽出回路700の
ブロック図である。
【図9】本発明の第6の実施例による信号符号化装置の
ブロック図である。
【図10】本発明の第7の実施例による信号符号化装置
のブロック図である。
【図11】本発明の第8の実施例による信号符号化装置
のブロック図である。
【符号の説明】
110 フレーム分割回路 120 サブフレーム分割回路 200 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 230 聴感重み付け回路 235,236 減算回路 240 応答信号計算回路 300 適応コードブック回路 310 インパルス応答計算回路 350,500,850,860 音源量子化回路 351 音源コードブック 355,560 ゲインコードブック 365,550 ゲイン量子化回路 390,600,700,800 ピッチ抽出回路 392 第1の遅延計算回路 393 第2の遅延計算回路 400 マルチプレクサ 510 相関係数計算回路 520 位置計算回路 530 振幅量子化回路 540 振幅コードブック 710 第1のピッチ予測利得計算回路 720 第2のピッチ予測利得計算回路 730 判別回路 851 第1の音源コードブック、 852 第2の音源コードブック、 861 第1の振幅コードブック 862 第2の振幅コードブック 900 モード判別回路
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力信号からスペクトルパラメータを求
    めて量子化するスペクトルパラメータ計算部と、前記入
    力信号から第1のピッチ周期に対応する第1の遅延を求
    めピッチ予測残差信号を求め前記ピッチ予測残差信号か
    ら第2のピッチ周期に対応する第2の遅延を求め、これ
    ら第1及び第2の遅延を少なくとも含む、あらかじめ定
    められた複数個の遅延を求めて出力する遅延計算部と、
    前記複数個の遅延を用いてピッチ予測した残差信号に対
    して音源信号を求めて量子化して出力する音源量子化部
    を有することを特徴とする信号符号化装置。
  2. 【請求項2】 前記信号の音源信号が振幅が非零の複数
    個のパルスから構成されることを特徴とする請求項1記
    載の信号符号化装置。
  3. 【請求項3】 入力信号からスペクトルパラメータを求
    めて量子化するスペクトルパラメータ計算部と、前記入
    力信号から特徴量を抽出してモードを判別するモード判
    別部と、あらかじめ定められたモードにおいて前記入力
    信号から第1のピッチ周期に対応する第1の遅延を求め
    ピッチ予測残差信号を求め前記ピッチ予測残差信号から
    第2のピッチ周期に対応する第2の遅延を求め、これら
    第1及び第2の遅延を少なくとも含む、あらかじめ定め
    られた複数個の遅延を求めて出力する遅延計算部と、前
    記複数個の遅延を用いてピッチ予測した残差信号に対し
    て音源信号を求めて量子化して出力する音源量子化部を
    有することを特徴とする信号符号化装置。
  4. 【請求項4】 前記信号の音源信号が振幅が非零の複数
    個のパルスから構成されることを特徴とする請求項3記
    載の信号符号化装置。
  5. 【請求項5】 入力信号からスペクトルパラメータを求
    めて量子化するスペクトルパラメータ計算部と、前記入
    力信号から第1のピッチ周期に対応する第1の遅延を求
    めピッチ予測残差信号を求め第1のピッチ予測利得を計
    算し、前記ピッチ予測残差信号から第2のピッチ周期に
    対応する第2の遅延を求めこれらの処理を繰り返すピッ
    チ予測部と、前記ピッチ予測利得があらかじめ定められ
    た条件を満たすかどうかを判別する判別部と、前記ピッ
    チ予測利得があらかじめ定められた条件を満たさない場
    合に前記遅延を用いてピッチ予測した残差信号に対して
    音源信号を求めて量子化して出力する音源量子化部を有
    することを特徴とする信号符号化装置。
  6. 【請求項6】 前記信号の音源信号が振幅が非零の複数
    個のパルスから構成されることを特徴とする請求項5記
    載の信号符号化装置。
  7. 【請求項7】 入力信号からスペクトルパラメータを求
    めて量子化するスペクトルパラメータ計算部と、前記入
    力信号から特徴量を抽出してモードを判別するモード判
    別部と、あらかじめ定められたモードにおいて前記入力
    信号から第1のピッチ周期に対応する第1の遅延を求め
    ピッチ予測残差信号を求め第1のピッチ予測利得を計算
    し、前記ピッチ予測残差信号から第2のピッチ周期に対
    応する第第2の遅延を求めこれらの処理を繰り返すピッ
    チ予測部と、前記ピッチ予測利得があらかじめ定められ
    た条件を満たすかどうかを判別する判別部と、前記ピッ
    チ予測利得があらかじめ定められた条件を満たさない場
    合は前記遅延を用いてピッチ予測した残差信号に対して
    音源信号を求めて量子化して出力する音源量子化部を有
    することを特徴とする信号符号化装置。
  8. 【請求項8】 前記信号の音源信号が振幅が非零の複数
    個のパルスから構成されることを特徴とする請求項7記
    載の信号符号化装置。
JP08164840A 1996-06-25 1996-06-25 信号符号化装置 Expired - Fee Related JP3092654B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08164840A JP3092654B2 (ja) 1996-06-25 1996-06-25 信号符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08164840A JP3092654B2 (ja) 1996-06-25 1996-06-25 信号符号化装置

Publications (2)

Publication Number Publication Date
JPH1011093A JPH1011093A (ja) 1998-01-16
JP3092654B2 true JP3092654B2 (ja) 2000-09-25

Family

ID=15800927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08164840A Expired - Fee Related JP3092654B2 (ja) 1996-06-25 1996-06-25 信号符号化装置

Country Status (1)

Country Link
JP (1) JP3092654B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3319396B2 (ja) 1998-07-13 2002-08-26 日本電気株式会社 音声符号化装置ならびに音声符号化復号化装置

Also Published As

Publication number Publication date
JPH1011093A (ja) 1998-01-16

Similar Documents

Publication Publication Date Title
JP3094908B2 (ja) 音声符号化装置
JP2746039B2 (ja) 音声符号化方式
JP3196595B2 (ja) 音声符号化装置
US6978235B1 (en) Speech coding apparatus and speech decoding apparatus
JPH09281995A (ja) 信号符号化装置及び方法
JP3266178B2 (ja) 音声符号化装置
JP3335841B2 (ja) 信号符号化装置
US7680669B2 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JP2624130B2 (ja) 音声符号化方式
JP3616432B2 (ja) 音声符号化装置
JP3308764B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3144284B2 (ja) 音声符号化装置
JP4510977B2 (ja) 音声符号化方法および音声復号化方法とその装置
JP3471542B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3192051B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP2907019B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000628

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees