JP2907019B2

JP2907019B2 - 音声符号化装置

Info

Publication number: JP2907019B2
Application number: JP6214838A
Authority: JP
Inventors: 一範小澤; 芹沢　　昌宏
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1994-09-08
Filing date: 1994-09-08
Publication date: 1999-06-21
Anticipated expiration: 2014-06-21
Also published as: JPH0876800A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声符号化装置に関し、
特に音声信号を4.8kb/s 以下の低いビットレートで高品
質に符号化するための音声符号化装置に関する。

【０００２】

【従来の技術】従来の音声符号化装置で、音声信号を4.
8kb/s 以下の低いビットレートで符号化する有効な方法
としては、例えば、エム・シュレーダー（M.Schroeder
）とビー・アタル（B.Atal）等がアイイーイーイー・
プロシーディングス(IEEE Proc.)ICASSP-85,1985年、９
３７〜９４０頁にコード・エキサイテド・リニア・プリ
ディクション：ハイ・クオリティ・スピーチ・アット・
ベリー・ロウ・ビット・レイツ（Code-excited linear
prediction: High quality speech at very low bit ra
tes ）と題して発表した論文（文献１）や、クレイジン
（Kleijn）等によるアイイーイーイー・プロシーディン
グス(IEEE Proc.)ICASSP-88,1988年、１５５〜１５８頁
にインプルーブド・スピーチ・クオリティ・アンド・エ
フィシェント・ベクトル・クオンタイゼイション・イン
・エスイーエルピー(Improved speechquality and effi
cient vector quantization in SELP) と題して発表し
た論文（文献２）等に記載されているＣＥＬＰ(Code Ex
cited Linear Prediction Coding) が知られている。こ
の方法では、送信側では、フレーム毎（例えば20ms）に
音声信号から線形予測（ＬＰＣ）分析を用いて、音声信
号のスペクトル特性を表すスペクトルパラメータを抽出
し、フレームをさらに複数のサブフレーム（例えば5ms)
に分割し、サブフレーム毎に過去の音源信号をもとに適
応コードブックにおけるパラメータ（ピッチ周期に対応
する遅延パラメータとゲインパラメータ）を抽出し、適
応コードブックにより該当のサブフレームの音声信号を
ピッチ予測し、ピッチ予測して求めた残差信号に対し
て、予め定められた種類の雑音信号からなる音源コード
ブック（ベクトル量子化コードブック）から最適音源コ
ードベクトルを選択し、最適なゲインを計算することに
より、音源信号を量子化する。音源コードベクトルの選
択の仕方は、選択した雑音信号により合成した信号と、
前述の残差信号との誤差電力を最小化するように行う。
そして選択されたコードベクトルの種類を表すインデッ
クスとゲインならびに、スペクトルパラメータと適応コ
ードブックのパラメータとをマルチプレクサ部により組
み合わせて伝送する。

【０００３】

【発明が解決しようとする課題】上述した従来の音声符
号化装置で、音声信号を低いビットレートで符号化する
方法としてＣＥＬＰを用いる場合、音源コードブックの
探索に下式を使用しているため、膨大な演算量を必要と
する。

【０００４】

【０００５】ここで、c_j(n) は、音源コードブックにお
けるｊ番目の音源コードベクトル、h(n)、γ_j はそれぞ
れ、スペクトルパラメータから求めたインパルス応答、
j 番目の音源コードベクトルに対する最適ゲインであ
る。但し、簡単のために、ここでは、後述の聴感重み付
け演算は省略している。

【０００６】(1) 式を最小化する音源コードベクトル
は、等価な関係として、下式を最小化することにより得
られる。

【０００７】

【０００８】ここで、

【０００９】

【００１０】である。記号"*" は畳み込み演算を示す。

【００１１】この従来の音声符号化装置で用いる方法で
は、特に、(4) 式の計算が多い。例えば、h(n)の次数を
20点とし、N=64とすると、音源コードベクトル当たりで
は、20x64+64=1344 回の積和演算が必要である。この値
を１秒当たりに換算すると、1344x8000/64=16.8 万回と
なる。このため、符号化を高速度に行うには演算量を低
減化することが必要となる。

【００１２】音源コードブックの探索に必要な演算量を
低減化する方法として、(4) 式を下式で近似する方法が
提案されている。

【００１３】

【００１４】ここで、Ｌ≦Ｎであり、通常、Ｌ＜Ｎにと
る。但し、

【００１５】

【００１６】この方法は自己相関法と呼ばれる。この方
法では、(6) 式の計算は各音源コードベクトルごとに予
め計算し、値をメモリに格納しておくので演算量は零で
あり、又、(7) 式の計算は音源コードブックの探索の前
に１回行えばよいので、(5) 式の計算は音源コードベク
トル当たり、ほぼＬ回の積和演算でよいことになる。例
えばL=20とすれば、前述の従来方式に比べ、積和回数を
1/67と、大幅に低減化することができる。自己相関法の
詳細は、例えば、トランコソ（Trancoso）らによるアイ
イーイーイー・プロシーディングス(IEEE Proc.)ICASSP
-86,1986年、２３７５〜２３７８頁にエフィセント・プ
ロシジャース・フォー・ファインディング・ザ・オプテ
ィマム・イノベイション（Efficient procedures for f
inding theoptimum innovation ）と題して発表した論
文（文献３）等を参照することができるので、説明は省
略する。

【００１７】しかしながら、文献３の方法を用いた場
合、R² _j の値を(5) 式により近似しているので、近似誤
差が発生するという問題点がある。さらに、この近似誤
差は、インパルス応答h(n)の減衰度とコードベクトルc_j
(n) の形状に依存しており、特に、母音部などでインパ
ルス応答長が長い場合に、(5) 式のＬの値を小さく設定
すると、誤差が顕著になるという現象が発生する。この
ため、(5) 式の計算の結果が、常に(2) 式を最小化する
音源コードベクトルを選択しているとは限らず、再生音
声が劣化させることもあるという問題点がある。

【００１８】本発明の目的は、上述した問題点を解決
し、比較的少ない演算量及びメモリ量により、4.8kb/s
以下のビットレートで音質の良好な音声符号化方式を提
供することにある。

【００１９】

【００２０】

【課題を解決するための手段】本発明の音声符号化装置
は、入力した音声信号からスペクトルパラメータを求め
るスペクトルパラメータ分析手段と、複数種類のコード
ベクトルからなるコードブックと、前記コードベクトル
の少なくとも一つに対し前記コードベクトルにより再生
した再生信号の電力との差異を補正する補正量を複数の
スペクトルパラメータのそれぞれに合せて複数種類予め
計算してあり前記スペクトルパラメータに応じて前記補
正量を切り替えながら前記音声信号もしくは前記音声信
号から計算した信号に対してコードベクトルを探索する
音源探索手段とを有する構成である。

【００２１】本発明の音声符号化装置は、入力した音声
信号からスペクトルパラメータを求めるスペクトルパラ
メータ分析手段と、このスペクトルパラメータ分析手段
の求めたスペクトルパラメータをもとに複数種類のイン
パルス応答を計算するインパルス応答計算手段と、複数
種類のコードベクトルからなるコードブックと、前記コ
ードベクトルの少なくとも一つに対し前記コードベクト
ルにより再生した再生信号の電力との差異を表す第１の
量を前記コードベクトルごとに予め格納し、前記音声信
号もしくは前記音声信号から計算した信号に対してコー
ドベクトルを探索する際、該当のコードベクトルに対応
する前記第１の量が予め定められた条件を満たすときは
前記インパルス応答長を変えて前記該当のコードベクト
ルを探索する音源探索手段とを有する構成である。

【００２２】本発明の音声符号化装置は、入力した音声
信号からスペクトルパラメータを求めるスペクトルパラ
メータ分析手段と、このスペクトルパラメータ分析手段
の求めたスペクトルパラメータをもとに複数種類のイン
パルス応答を計算するインパルス応答計算手段と、複数
種類のコードベクトルからなるコードブックと、前記コ
ードベクトルの少なくとも一つに対し予め想定した複数
のスペクトルパラメータのそれぞれに合せて前記コード
ベクトルにより再生した再生信号の電力との差異を表し
前記コードベクトルごとに予め格納しある第１の量を切
り替えながら前記音声信号もしくは前記音声信号から計
算した信号に対して前記コードブックを探索する際、該
当のコードベクトルに対応する前記第１の量が予め定め
られた条件を満たすときは前記インパルス応答長を変え
て前記該当のコードベクトルを探索する音源探索手段と
を有する構成である。

【００２３】

【作用】本発明による音声符号化装置の作用を説明す
る。

【００２４】第１の発明では、音声信号をフレーム（例
えば40ms）に分割し、さらにサブフレーム（ 8ms）に分
割する。サブフレーム毎に音声信号あるいは音源信号を
量子化するためのベクトル量子化コードブックを予め用
意しておき、予め定められた個数（2^B：ここでＢはベク
トル量子化コードブックのビット数) のコードベクトル
が格納されている。すくなくとも一つのコードベクトル
c_j(n) に対して、下式の補正量△_j あるいは△'_jを予め
計算しておく。コードベクトルの探索には、前述の(2)
式に従うが、(2) 式右辺第2 項の分母の計算には(5) 式
のかわりに、下記の(8) 式あるいは(9) 式を使用する。

【００２５】

【００２６】ここで、補正量△_j あるいは△'_jは、(4)
式での真の値とのずれを統計的に表す量として、トレー
ニング用の多量の音声信号に対して予め測定し、メモリ
に格納しておく。

【００２７】第２の発明では、(8) および(9) 式の補正
量がインパルス応答に依存している点を考慮し、音声信
号から求めたスペクトルパラメータに応じて、(8) ある
いは(9) 式の補正量△_j あるいは△'_jを、予め複数種類
求めておき、スペクトルパラメータに応じて切り替えて
いる。

【００２８】第３の発明では、従来の技術で説明した方
法と同様に、コードブック探索時に(5) 式を使用する。
本発明の特徴は、音声信号からスペクトルパラメータを
求めさらに、インパルス応答h(n)に変換する。すくなく
とも一つのコードベクトルに対して、第１の量として
(7) 式あるいは(8) 式の補正量△_j あるいは△'_jを予め
計算しておき、この値が、例えば、予め定められたしき
い値をこえるときは、予め定められた条件を満たすと判
断して、(5) 式におけるインパルス応答の次数Ｌを変え
る点にある。変え方としては、例えば、Ｌを長くするこ
とが考えられる。

【００２９】第４の発明では、次の２点を特徴とする。
音声信号から求めたスペクトルパラメータに応じて(7)
式あるいは(8) 式の補正量△_j あるいは△'_jを予め複数
種類計算しておき、さらに、第１の量として第３の発明
と同一の補正量を用い、この値が予め定められたしきい
値を越えるときは、(5) 式におけるインパルス応答の次
数Ｌの値を変える。

【００３０】

【実施例】次に、本発明の実施例について図面を参照し
て説明する。

【００３１】図１は本発明の第１の実施例のブロック図
である。

【００３２】本発明の第１の実施例の音声符号化装置１
は、入力端子から入力する音声信号を受信し、フレーム
に分割するフレーム分割回路２と、フレームの音声信号
をフレームよりも短いサブフレームに分割するサブフレ
ーム分割回路３と、サブフレームの音声信号に対してサ
ブフレーム長よりも長い窓をかけて音声を切り出してス
ペクトルパラメータを予め定められた次数計算するスペ
クトルパラメータ分析回路４と、スペクトルパラメータ
分析回路４の出力する複数のサブフレームの線スペクト
ル対（以下ＬＳＰと記す）パラメータを受け量子化する
スペクトルパラメータ量子化回路５と、サブフレーム分
割回路３の出力するサブフレームとスペクトルパラメー
タ分析回路４の出力するサブフレームの線形予測係数と
を受け各サブフレームの音声信号に対して聴感重み付け
を行い聴感重み付け信号を出力する聴感重み付け回路６
と、スペクトルパラメータ分析回路４からは各サブフレ
ームごとに線形予測係数α_ilを、スペクトルパラメータ
量子化回路５からは量子化および補間を行い復元したサ
ブフレームごとの線形予測係数α'_il をそれぞれ入力
し、応答信号を１サブフレーム分計算し出力する応答信
号計算回路７と、聴感重み付け回路６が出力する聴感重
み付け信号から応答信号計算回路７が出力する応答信号
を１サブフレーム分減算する減算器８と、スペクトルパ
ラメータ分析回路４からは線形予測係数α_ilを、スペク
トルパラメータ量子化回路５からは線形予測係数α'_il
をそれぞれ入力し、重み付けフィルタのインパルス応答
を予め定められた点数Ｌだけ計算し出力するインパルス
応答計算回路９と、減算器８およびインパルス応答計算
回路９の出力を受けピッチパラメータを求める適応コー
ドブック回路１０と、インパルス応答計算回路９と適応
コードブック回路１０との出力を受け音源コードブック
１１に格納された音源コードベクトルから最良の音源コ
ードベクトルを選択し読みだし補正量コードブック１２
からはこれに対応する補正量を読みだす音源探索回路１
３と、音源探索回路１３の出力する音源コードベクトル
を受けこれと組み合わせが最良なゲインコードベクトル
をゲインコードブック１４から選択し、これらの音源コ
ードベクトルとゲインコードベクトルを表すインデック
スを出力するゲイン量子化回路１５と、スペクトルパラ
メータ分析回路４からは線形予測係数α_ilを、スペクト
ルパラメータ量子化回路５からは線形予測係数α'_il
を、ゲイン量子化回路１５からはそれぞれのインデック
スを入力し、これらに対応するコードベクトルを読みだ
し駆動音源信号v(n)を求める重み付け信号計算回路１６
と、スペクトルパラメータ量子化回路５の出力するコー
ドベクトルを表すインデックスと、適応コードブック回
路１０が求めたサブフレームごとの遅延値に対応するイ
ンデックスと、ゲイン量子化回路１５が選択した音源コ
ードベクトルとゲインコードベクトルを表すインデック
スとを入力し、これらのインデックスを組み合わせて出
力端子から出力するマルチプレクサ１７とで構成してい
る。

【００３３】図２は本発明の第２の実施例のブロック図
である。

【００３４】本発明の第２の実施例の音声符号化装置２
１は、第１の実施例の音声符号化装置１に、インパルス
応答計算回路９の出力のインパルス応答h(n)を予め定め
られた種類のクラスに分類する分類回路２２と、補正量
コードブック１２に替えて、少なくとも一つの音源コー
ドベクトルについての補正量をＫ種のインパルス応答の
パターンの各々に対して予め計算し格納しておき、分類
回路２２の分類結果に応じてＫ種の補正量コードブック
を切り替えて音源探索回路１３に出力する補正量コード
ブック２３とを設けて構成している。図中、図１と同一
の名称および符号を付した構成要素は、図１と同一の働
きをするので、説明は省略する。

【００３５】図３は本発明の第３の実施例のブロック図
である。

【００３６】本発明の第３の実施例の音声符号化装置３
１は、第１の実施例の音声符号化装置１に、インパルス
応答計算回路９に替えて、インパルス応答を、２種類の
次数Ｌ1 ，Ｌ2 （Ｌ1 ＜Ｌ2 ）だけ計算し、両方のイン
パルス応答h(n)を出力し、この内Ｌ1 次のインパルス応
答h(n)は、適応コードブック回路１０に出力するインパ
ルス応答計算回路３２と、インパルス応答計算回路３２
の２種類の次数Ｌ1 ，Ｌ2 のインパルス応答h(n)を受
け、音源探索回路１３が補正量コードブック１２から読
み出す補正量を予め計算してある第１の量と比較し、比
較結果により補正量と共にインパルス応答の一方を音源
探索回路１３に出力する判別回路３３とを設けて構成し
ている。図中、図１と同一の名称および符号を付した構
成要素は、図１と同一の働きをするので、説明は省略す
る。

【００３７】図４は本発明の第４の実施例のブロック図
である。

【００３８】本発明の第４の実施例の音声符号化装置４
１は、第１の実施例の音声符号化装置１に、第２および
第３の実施例で新たに設けた構成要素をすべて設けて構
成している。ここで、若干の説明を付け加えるならば、
特に本実施例で特徴となる構成要素は、インパルス応答
計算回路３２の出力する２種類の次数Ｌ₁ ，Ｌ₂ のイン
パルス応答h(n)の内、次数Ｌ₁ のインパルス応答h(n)を
受け、予め定められたＫ種類のクラスに分類する分類回
路２２と、分類回路２２の出力に応じて、Ｋ種類の補正
量を切替えて出力する補正量コードブック２３と、補正
量コードブック２３から少なくとも一つの補正量を読み
出し、音源探索回路１３が補正量コードブック１２から
読み出す補正量を予め計算してある第１の量と比較し、
比較結果により補正量と共にインパルス応答の一方を音
源探索回路１３に出力する判別回路３３とである。な
お、前述の説明に含まれない、図中、図１と同一の名称
および符号を付した構成要素は、図１と同一の働きをす
るので、説明は省略する。

【００３９】次に動作について説明する。

【００４０】第１の実施例では、入力端子１から音声信
号を入力し、フレーム分割回路２では音声信号をフレー
ム（例えば４０ｍｓ）毎に分割し、サブフレーム分割回
路３では、フレームの音声信号をフレームよりも短いサ
ブフレーム（例えば８ｍｓ）に分割する。スペクトルパ
ラメータ分析回路４では、少なくとも一つのサブフレー
ムの音声信号に対して、サブフレーム長よりも長い窓
（例えば２４ｍｓ）をかけて音声を切り出してスペクト
ルパラメータを予め定められた次数（例えばP=10次）計
算する。スペクトルパラメータは、特に子音、母音間で
の過渡区間では時間的に大きく変化するので、短い時間
毎に分析する方が望ましいが、そのようにすると分析に
必要な演算量が増大するため、ここでは、フレーム中の
いずれかＱ個（Ｑ＞１）のサブフレーム（例えばＱ＝３
とし、第１、３、５サブフレーム）に対してスペクトル
パラメータを計算することにする。そして、分析をしな
かったサブフレーム（ここでは第２、４サブフレーム）
では、それぞれ、第１と第３サブフレーム、第３と第５
サブフレームのスペクトルパラメータを後述のＬＳＰ上
で直線補間したものをスペクトルパラメータとして使用
する。ここでスペクトルパラメータの計算には、周知の
ＬＰＣ分析や、バーグ(Burg)分析等を用いることができ
る。ここでは、バーグ(Burg)分析を用いることとする。
バーグ(Burg)分析の詳細については、中溝著による“信
号解析とシステム同定”と題した単行本（コロナ社１９
８８年刊）の８２〜８７頁（文献４）に記載されている
ので説明は略する。

【００４１】さらにスペクトルパラメータ分析回路４で
は、バーグ(Burg)分析により計算された線形予測係数α
_i(i=1-10) を量子化や補間に適したＬＳＰパラメータに
変換する。ここで、線形予測係数からＬＳＰへの変換
は、菅村他による“線スペクトル対（ＬＳＰ）音声分析
合成方式による音声情報圧縮”と題した論文（電子通信
学会論文誌、Ｊ６４―Ａ，５９９〜６０６頁、１９８１
年）（文献５）を参照することができる。即ち、第１、
３、５サブフレームでバーグ(Burg)分析により求めた線
形予測係数を、ＬＳＰパラメータに変換し、第２、４サ
ブフレームのＬＳＰを直線補間により求めて、第２、４
サブフレームのＬＳＰを逆変換して線形予測係数に戻
し、第１〜５サブフレームの線形予測係数α_il(i=1-10,
l=1-5) を聴感重み付け回路６に出力する。また、第１
〜５サブフレームのＬＳＰをスペクトルパラメータ量子
化回路５へ出力する。

【００４２】スペクルパラメータ量子化回路５では、予
め定められたサブフレームのＬＳＰパラメータを効率的
に量子化する。以下では、量子化法として、ベクトル量
子化を用いるものとし、第５サブフレームのＬＳＰパラ
メータを量子化するものとする。ＬＳＰパラメータのベ
クトル量子化の手法は、周知の手法を用いることができ
る。具体的な方法は、例えば、特願平２−２９７６００
号（文献６）や特願平３−２６１９２５号（文献７）
や、特願平３−１５５０４９号（文献８）や、ティー・
ノムラ(T.Nomura)等によるアイイーイーイー・プロシー
ディングス．モバイル・マルチメディア・コミュニケー
ションズ(IEEE Proc．Mobile MultimediaCommunication
s.)1993年、Ｂ．２．５頁にエルエスピー・コーディン
グ・ユージング・ブイキュー−エスブイキュー・ウイズ
・インターポウレーション・イン・４．０７５・ケービ
ーピーエス・エム−エルシーイーエルピー・スピーチ・
コーダー (LSP Coding Using VQ-SVQ With Interpolat
ion in 4.075 kbps M-LCELPSpeech Coder) と題した論
文（文献９）等を参照できるのでここでは説明は略す
る。

【００４３】また、スペクトルパラメータ量子化回路５
では、第５サブフレームで量子化したＬＳＰパラメータ
をもとに、第１〜第４サブフレームのＬＳＰパラメータ
を復元する。ここでは、現フレームの第５サブフレーム
の量子化ＬＳＰパラメータと１つ過去のフレームの第５
サブフレームの量子化ＬＳＰを直線補間して、第１〜第
４サブフレームのＬＳＰを復元する。ここで、量子化前
のＬＳＰと量子化後のＬＳＰとの誤差電力を最小化する
コードベクトルを１種類選択した後に、直線補間により
第１〜第４サブフレームのＬＳＰを復元できる。さらに
性能を向上させるためには、前述の誤差電力を最小化す
るコードベクトルを複数候補選択した後に、各々の候補
について累積歪を評価し、累積歪を最小化する候補と補
間ＬＳＰの組を選択するようにすることができる。詳細
は、例えば、特開平６−２２２７９７号公報（文献１
０）を参照することができる。

【００４４】以上説明した手順により復元した第１〜４
サブフレームのＬＳＰと第５サブフレームの量子化ＬＳ
Ｐをサブフレーム毎に線形予測係数α'_il (i=1-10, l=1
-5)に変換し、インパルス応答計算回路９に出力する。
また、第５サブフレームの量子化ＬＳＰのコードベクト
ルを表すインデックスをマルチプレクサ１７に出力す
る。

【００４５】上記において、直線補間のかわりに、ＬＳ
Ｐの補間パターンを予め定められたビット数（例えば２
ビット）分用意しておき、これらのパターンの各々に対
して１〜４サブフレームのＬＳＰを復元して累積歪を最
小化するコードベクトルと補間パターンの組を選択する
ようにしてもよい。このようにすると補間パターンのビ
ット数だけ伝送情報が増加するが、ＬＳＰのフレーム内
での時間的な変化をより精密に表すことができる。ここ
で、補間パターンは、トレーニング用のＬＳＰデータを
用いて予め学習して作成してもよいし、予め定められた
パターンを格納しておいてもよい。予め定められたパタ
ーンとしては、例えば、ティー・タニグチ(T.Taniguch)
等がアイイーイーイー・プロシーディングス(IEEE Pro
c.)ICSLP,1992 年、４１〜４４頁にイムプルーブド・シ
ーイーエルピー・スピーチ・コーディング・アット・４
ケービーパーエス・アンド・ビロウ(Improved CELP spe
ech coding at 4kb/s and below)と題した論文（文献１
１）等に記載のパターンを用いることができる。

【００４６】また、さらに性能を改善するためには、補
間パターンを選択した後に、予め定められたサブフレー
ムにおいて、ＬＳＰの真の値とＬＳＰの補間値との誤差
信号を求め、この誤差信号をさらに誤差コードブックで
表すようにしてもよい。詳細は、前述の文献９等を参照
できる。

【００４７】聴感重み付け回路６は、スペクトルパラメ
ータ分析回路４から、各サブフレーム毎に量子化前の線
形予測係数α_il(i=1-10, l=1-5) を入力し、前述の文献
１０にもとづき、サブフレームの音声信号に対して聴感
重み付けを行い、聴感重み付け信号を出力する。

【００４８】応答信号計算回路７は、スペクトルパラメ
ータ分析回路４から、各サブフレーム毎に線形予測係数
α_ilを入力し、スペクトルパラメータ量子化回路５か
ら、量子化、補間して復元した線形予測係数α'_il をサ
ブフレーム毎に入力し、保存されているフィルタメモリ
の値を用いて、入力信号d(n)=0とした応答信号を１サブ
フレーム分計算し、減算器８に出力する。ここで、応答
信号ｘ_Z(n)は、例えば、下式で表される。

【００４９】

【００５０】ここで、γは、聴感重み付け量を制御する
重み係数であり、下記の(11)式と同一の値である。

【００５１】減算器８は、下式により、聴感重み付け信
号から応答信号を１サブフレーム分減算し、ｘ'_w(n) を
適応コードブック回路１０に出力する。

【００５２】

【００５３】インパルス応答計算回路９は、Ｚ変換が下
式で表される重み付けフィルタのインパルス応答 h_w(n)
を予め定められた点数Ｌだけ計算し、適応コードブック
回路１０、音源探索回路１３に出力する。

【００５４】

【００５５】適応コードブック回路１０は、ピッチパラ
メータを求める。詳細は、例えば前記文献１０を参照す
ることができる。そして、求めたサブフレーム毎の遅延
値に対応するインデックスをマルチプレクサ１７に出力
する。また、適応コードブックによりピッチ予測を下式
に従って行い、適応コードブック予測算差信号z(n)を出
力する。

【００５６】

【００５７】ここで、b(n)は、適応コードブックピッチ
予測信号であり、下式で表せる。

【００５８】

【００５９】ここで、β、T は、それぞれ、適応コード
ブックのゲイン、遅延を示す。v(n)は適応コードベクト
ルである。

【００６０】音源探索回路１３は、音源コードブック１
１に格納された音源コードベクトルの全部あるいは一部
に対して、補正量コードブック１２から補正量を読みだ
す。音源コードブック探索時に、補正量を考慮した(8)
式あるいは(9) 式を用いて、前出(2) 式を最小化するよ
うに、最良の音源コードベクトルc_j(n) を選択する。こ
のとき、最良のコードベクトルを１種選択してもよい
し、2 種以上のコードベクトルを選んでおいて、ゲイン
量子化の際に、１種に本選択してもよい。ここでは、2
種以上のコードベクトルを選んでおくものとする。ここ
で、補正量△_j 、あるいは△'_jは、少なくとも一つの音
源コードベクトルc_j(n) に対して予め計算され、補正量
コードブック１２に格納されている。

【００６１】ゲイン量子化回路１５は、ゲインコードブ
ック１４からゲインコードベクトルを読みだし、選択さ
れた音源コードベクトルに対して、(15)式を最小化する
ように、音源コードベクトルとゲインコードベクトルの
組み合わせを選択する。

【００６２】

【００６３】ここで、β'_k、γ'_kは、ゲインコードブッ
ク１４に格納された２次元ゲインコードブックにおける
ｋ番目のコードベクトルである。Ｎは、サブフレーム長
を表わすサンプル数である。

【００６４】選択された音源コードベクトルとゲインコ
ードベクトルを表すインデックスをマルチプレクサ１７
に出力する。

【００６５】重み付け信号計算回路１６は、スペクトル
パラメータ分析回路４の出力パラメータおよびそれぞれ
のインデックスを入力し、インデックスからこれに対応
するコードベクトルを読みだし、まず下式にもとづき駆
動音源信号v(n)を求める。

【００６６】

【００６７】次に、スペクトルパラメータ分析回路４の
出力パラメータとスペクトルパラメータ量子化回路５の
出力パラメータとを用いて下式により、重み付け信号s_w
(n)をサブフレーム毎に計算し、応答信号計算回路７に
出力する。

【００６８】

【００６９】次に、第２の実施例では、分類回路２２が
新たに付加され、インパルス応答計算回路９の出力のイ
ンパルス応答h(n)を受け、予め定められた種類のクラス
に分類する。分類の方法は、例えば、インパルス応答の
パターンをコードブックとして予めＫ種類作成してお
き、各々のパターンとの間で、下式に従い距離を求め、
距離を最小にするパターンを選択することにより分類を
行う。

【００７０】

【００７１】ここで、h'_m(n)は、ｍ番目のインパルス応
答パターンを示す。

【００７２】また、補正量コードブック２３は、補正量
コードブック１２に替えて設けられ、少なくとも一つの
音源コードベクトルc_j(n) について、補正量△_j を格納
したコードブックを、Ｋ種のインパルス応答のパターン
の各々に対して、予め計算し( △_j1,・・・・,△_jK) 格納し
ておく。そして、分類回路２２の分類結果に応じて、Ｋ
種の補正量コードブックを切り替え、切り替えた補正量
コードブック２３の出力を音源探索回路１３に出力す
る。その他の部分の動作は、第１の実施例と同一であ
る。

【００７３】続いて、第３の実施例では、インパルス応
答計算回路３２は、インパルス応答計算回路９に替えて
設けられ、インパルス応答を、２種類の次数L₁、L₂ (L₁
<L₂)だけ計算し、L₁次のインパルス応答を適応コードブ
ック回路１０に出力する。また、両方のインパルス応答
を、新たに付加された判別回路３３に出力する。

【００７４】判別回路３３は、第１の量として補正量を
用いる。補正量コードブック１２から少なくとも一つの
コードベクトルc_j(n) に対する補正量△_j を読みだす。
△_jが例えば、下式の条件を満足するときは、自己相関
法による近似誤差が大きいと判断し、インパルス応答の
長さを長くし、L₂次のインパルス応答を音源探索回路１
３に出力する。

【００７５】△_j ＞Th (19) ここで、Thは、予め定められたしきい値である。

【００７６】一方、(19)式の条件が満足されないとき
は、L₁次のインパルス応答を音源探索回路１３に出力す
る。その他の部分の動作は、第１の実施例と同一であ
る。

【００７７】最後に、第４の実施例では、第２の実施例
と第３の実施例とを組み合わせたもので、分類回路２２
は、インパルス応答計算回路３２の出力する２種類の次
数Ｌ₁ ，Ｌ₂ のインパルス応答h(n)の内、次数Ｌ₁ のイ
ンパルス応答h(n)を受け、予め定められたＫ種類のクラ
スに分類し補正量コードブック２３に出力する。補正量
コードブック２３は、分類回路２２の出力に応じて、Ｋ
種類の補正量を切替えて出力する。判別回路３３は、補
正量コードブック２３から少なくとも一つの補正量を読
み出し、音源探索回路１３が補正量コードブック１２か
ら読み出す補正量を予め計算してある第１の量と比較
し、比較結果により補正量と共にインパルス応答の一方
を音源探索回路１３に出力する。その他の部分の動作
は、第１の実施例と同一である。

【００７８】以上、本発明の実施例について説明した
が、本発明の意向を損なうことなく、上述した実施例以
外にも種々の変形が可能である。

【００７９】スペクトルパラメータはＬＳＰ以外にも他
の周知なパラメータを用いることができる。

【００８０】スペクトルパラメータ分析回路ではフレー
ム中で少なくとも１つのサブフレームでスペクトルパラ
メータを計算するときに、前のサブフレームとの現在の
サブフレームとのＲＭＳの変化あるいはパワーの変化を
測定し、これらの変化が大きな複数個のサブフレームに
対してスペクトルパラメータを計算するようにしてもよ
い。このようにすると、音声の変化点では必ずスペクト
ルパラメータを分析することになり、分析するサブフレ
ーム数を低減しても性能の劣化を防ぐことができる。

【００８１】スペクトルパラメータの量子化には、ベク
トル量子化、スカラ量子化、ベクトルースカラ量子化な
ど周知な方法を用いることができる。

【００８２】スペクトルパラメータ量子化回路における
補間パターンの選択には、他の周知な距離尺度を用いる
ことができる。

【００８３】また、音声信号を量子化する回路におい
て、どの実施例も、コードブックが１段の場合について
説明したが、２段、あるいは多段構成にすることもでき
る。

【００８４】また、音源コードブックの探索ならびに学
習のときの、距離尺度あるいは学習法は、他の周知な尺
度を用いることもできる。

【００８５】補正量コードブックの学習には、周知の方
法を用いることができる。

【００８６】前出(8) 、(9) 式では、音源コードブック
の探索の際、補正量を加算する構成としたが、補正量を
乗算する構成や、他の構成をとることもできる。

【００８７】第２および第４の実施例の分類回路では、
インパルス応答を用いて分類したが、スペクトルパラメ
ータを用いて分類する構成や、他のパラメータを用いる
構成とすることができる。

【００８８】第３および第４の実施例の判別回路では、
第１の量として、補正量を用いたが、他の構成として、
インパルス応答と補正量の両者を用いることもできる。

【００８９】第１ないし第４の実施例のゲインコードブ
ックは、伝送ビット数よりも全体で数倍大きなのサイズ
のコードブックを予め学習し、予め定められたモード毎
にこのコードブックの一部の領域を使用領域としてアサ
インしておき、符号化するときは、モードに応じて使用
領域を切り替えて使用することもできる。

【００９０】

【発明の効果】以上説明したように、本発明は、音源コ
ードブックの探索時に、音源コードベクトルの少なくと
も一つに対して、あらかじめ補正量を計算して補正量コ
ードブックに格納しておき、補正量を加味しながらコー
ドベクトルを探索するので、高速化音源探索法を用いた
ときに生ずる近似誤差を最小限におさえることが可能
で、劣化の少ない再生音声を提供できるという効果があ
る。また、スペクトルパラメータを分類した種類毎に異
なる補正量を求めておき、スペクトルパラメータにより
切り替えて使用することにより、さらに精度の高い再生
音声を提供できるという効果もある。さらに、少なくと
も一つの音源コードベクトルに対して第１の量をあらか
じめ計算しておき、音源コードベクトルを探索する際
に、前述の第１の量が予め定められた条件を満たすとき
は、音源探索のときにインパルス応答の次数を変えるこ
とにより、精度の高い再生音声を提供できるという効果
もある。このように本発明は、比較的少ない演算量及び
メモリ量により、4.8kb/s 以下のビットレートで音質の
良好な再生音声を提供できるという効果が有る。

【図面の簡単な説明】

【図１】本発明の第１の実施例のブロック図である。

【図２】本発明の第２の実施例のブロック図である。

【図３】本発明の第３の実施例のブロック図である。

【図４】本発明の第４の実施例のブロック図である。

【符号の説明】

１，２１，３１，４１音声符号化装置２フレーム分割回路３サブフレーム分割回路４スペクトルパラメータ分析回路５スペクトルパラメータ量子化回路６聴感重み付け回路７応答信号計算回路８減算器９，３２インパルス応答計算回路１０適応コードブック回路１１音源コードブック１２，２３補正量コードブック１３音源探索回路１４ゲインコードブック１５ゲイン量子化回路１６重み付け信号計算回路１７マルチプレクサ２２分類回路３３判別回路

フロントページの続き (58)調査した分野(Int.Cl.⁶，ＤＢ名) G10L 3/00 - 9/18 H03M 7/30 H04B 14/04 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】入力した音声信号からスペクトルパラメ
ータを求めるスペクトルパラメータ分析手段と、複数種
類のコードベクトルからなるコードブックと、前記コー
ドベクトルの少なくとも一つに対し前記コードベクトル
により再生した再生信号の電力との差異を補正する補正
量を複数のスペクトルパラメータのそれぞれに合せて複
数種類予め計算してあり前記スペクトルパラメータに応
じて前記補正量を切り替えながら前記音声信号もしくは
前記音声信号から計算した信号に対してコードベクトル
を探索する音源探索手段とを有することを特徴とする音
声符号化装置。
【請求項２】補正量を計算するための補正量コードブ
ックを有することを特徴とする請求項１記載の音声符号
化装置。
【請求項３】入力した音声信号からスペクトルパラメ
ータを求めるスペクトルパラメータ分析手段と、このス
ペクトルパラメータ分析手段の求めたスペクトルパラメ
ータをもとに複数種類のインパルス応答を計算するイン
パルス応答計算手段と、複数種類のコードベクトルから
なるコードブックと、前記コードベクトルの少なくとも
一つに対し前記コードベクトルにより再生した再生信号
の電力との差異を表す第１の量を前記コードベクトルご
とに予め格納し、前記音声信号もしくは前記音声信号か
ら計算した信号に対してコードベクトルを探索する際、
該当のコードベクトルに対応する前記第１の量が予め定
められた条件を満たすときは前記インパルス応答長を変
えて前記該当のコードベクトルを探索する音源探索手段
とを有することを特徴とする音声符号化装置。
【請求項４】入力した音声信号からスペクトルパラメ
ータを求めるスペクトルパラメータ分析手段と、このス
ペクトルパラメータ分析手段の求めたスペクトルパラメ
ータをもとに複数種類のインパルス応答を計算するイン
パルス応答計算手段と、複数種類のコードベクトルから
なるコードブックと、前記コードベクトルの少なくとも
一つに対し予め想定した複数のスペクトルパラメータの
それぞれに合せて前記コードベクトルにより再生した再
生信号の電力との差異を表し前記コードベクトルごとに
予め格納しある第１の量を切り替えながら前記音声信号
もしくは前記音声信号から計算した信号に対して前記コ
ードブックを探索する際、該当のコードベクトルに対応
する前記第１の量が予め定められた条件を満たすときは
前記インパルス応答長を変えて前記該当のコードベクト
ルを探索する音源探索手段とを有することを特徴とする
音声符号化装置。