JP2702157B2 - 最適音源ベクトル探索装置 - Google Patents

最適音源ベクトル探索装置

Info

Publication number
JP2702157B2
JP2702157B2 JP63153963A JP15396388A JP2702157B2 JP 2702157 B2 JP2702157 B2 JP 2702157B2 JP 63153963 A JP63153963 A JP 63153963A JP 15396388 A JP15396388 A JP 15396388A JP 2702157 B2 JP2702157 B2 JP 2702157B2
Authority
JP
Japan
Prior art keywords
sound source
mapped
source vector
vector
filter coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63153963A
Other languages
English (en)
Other versions
JPH01319799A (ja
Inventor
宏一 白木
邦男 中島
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63153963A priority Critical patent/JP2702157B2/ja
Publication of JPH01319799A publication Critical patent/JPH01319799A/ja
Application granted granted Critical
Publication of JP2702157B2 publication Critical patent/JP2702157B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は音声信号を情報圧縮し、ディジタル伝送,
または蓄積を行なう音声符号化装置の改良に関するもの
である。
〔従来の技術〕
音声信号を合成フィルタを表すパラメータと音源を表
すパラメータとに分離することで情報圧縮を行なう音声
符号化方式の中にコードエキサイテッド線形予測(CEL
P:Code−Excited Linear Prediction)と呼ばれるもの
がある。CELPの一例を示すものとして、M.R.シュレー
ダ,B.S.アタルの「コードエキサイテッドリニアプリデ
ィクション(CELP):ハイクオリティスピーチアットベ
リィロウビットレイツ」(M.R.Schroeder,B.S.Atal,Cod
e−Excited Linear Prediction(CELP):high−quality
speech at very low bit rates,"Proc,IEEE Int.Conf.
Acoust.,Speech,Signal Processing,pp.937−940(198
5))(以下、文献1と称する)を挙げることができ
る。文献1に示される例では合成フィルタを表すパラメ
ータを10msec毎に分析により求め、一方40点(サンプリ
ング周波数が8KHzのときは5msecになる)毎に区切られ
た音声に時間対応した音源を表すパラメータとして、乱
数により生成した40点の雑音の時系列,即ち40次元のベ
クトル(以下、音源ベクトルと称する)を用いている。
文献1の中の最適音源ベクトル探索装置の行っている
処理を周波数領域において行う装置として第2図に示す
ようなものがある。第2図はI.M.トランコソ,B.S.アタ
ルの「エフィシェントプロシージャーズフォーファイン
ディングジオプティマムイノベーションインストカステ
ィックコーダーズ」(I.M.Trancoso,B.S.Atal,“Effici
ent procedures for finding the optimum innovation
in stochastic coders,"Proc.IEEE Int.conf.Acoust.,S
peech,Signal Processing,pp.2375−2378(1986))
(以下、文献2と称する)に記載されている,従来の最
適音源ベクトル探索装置を示す図である。図におて、2
はN点(文献2の例ではサンプリング周波数が8KHzのと
きN=40)のサンプル値系列である音源ベクトルを2・
L点(文献2中ではL=40としている)離散フーリエ変
換(DFT:Discrete Fourier Transform)して得られるDF
T音源ベクトル(写像音源ベクトル)、1はL次元の次
元直交条件を満たすL次元歪評価空間に写像したM個の
DFT音源ベクトルから構成される符号帳(写像音源符号
帳)、4はN点のサンプル値系列である入力音声(入力
される音声信号)11を2・L点DFTして得られるDFT入力
音声(写像音声信号)、5は入力音声11を音声分析して
得られる合成フィルタ係数のインパルス応答を2・L点
DFTして得られる周波数特性としての評価重みフィルタ
係数である。また、12は入力音声11をDFTすることによ
りDFT音源ベクトル2と同様のL次元歪評価空間に写像
するDFT回路(第1のL次元写像手段)、14は入力音声1
1を分析して合成フィルタ係数を算出する音声分析回
路、15は音声分析回路14より出力される合成フィルタ係
数のインパルス応答を算出するインパルス応答生成回
路、16は音声分析回路14およびインパルス応答生成回路
15からなる音声分析手段、13はこの合成フィルタ係数の
インパルス応答をDFTすることによりDFT音源ベクトル2
と同様のL次元歪評価空間に写像するDFT回路(第2の
L次元写像手段)、6はDFT音源ベクトル2を切換えて
音源ベクトル選択回路9に入力する切換スイッチ、9は
切換スイッチ6が選択したM個の写像音源ベクトル中か
ら、評価重みフィルタ係数5とM個の写像音源ベクトル
を用いてDFT入力音声4に対する歪量が最小となる1個
の最適音源ベクトルコードを選択する音源ベクトル選択
回路(音源ベクトル選択手段)、10は音源ベクトル選択
回路9によって選択された最適音源ベクトルコードであ
る。
次に、上記従来装置の基本動作を説明する。まず、切
換スイッチ6は符号帳1の中のM個のDFT音源ベクトル
2を1個ずつ最適音源ベクトル選択回路9に伝える。最
適音源ベクトル選択回路9はM個のDFT音源ベクトル2
それぞれに対して、このDFT音源ベクトル2と評価重み
フィルタ係数5とDFT入力音声4とを用いて周波数領域
において再生音声が入力音声に対して持つ歪量を計算す
る。M個中のk番目の音源ベクトルを用いた場合の前記
歪量D(k)は次式で与えられる。
ここで、X(i)はDFT入力音声のi番目の成分、H
(i)は評価重みフィルタのi番目の成分、C(i,k)
はk番目のDFT音源ベクトルのi番目の成分、g(k)
はD(k)を最小化する利得係数である。さらに、前述
の文献2によれば、第(1)式は次の第(2)式と等価
であり、実際の演算には第(2)式が用いられる。
ここで、Y(i)はY(i)の共役複素数を表し、
Y(i)は次の第(3)式で与えられる。
Y(i)=X(i)・a(i)/H(i) …(3) またa(i)は次の第(4)式で与えられる。
a(i)=|H(i)| …(4) こうして求めたM個のD(k)の内、最小値を与える
DFT音源ベクトルの番号を最適音源ベクトルコードとし
て選択する。
〔発明が解決しようとする課題〕
従来の最適音源ベクトル探索装置は以上のように構成
されているので、最適音源ベクトル選択回路9の中で、
L次元の歪量計算をM回行なう必要があり、良好な再生
音声を得るためにMを大きくとる(例えばM=1024)
と、この歪量計算に要する演算量が莫大となり、装置化
した場合の装置規模が非常に大きくなるという問題点が
あった。
この発明は上記のような問題点を解決するためになさ
れたもので、最適音源ベクトル探索における歪量計算に
要する演算量を小さくできる最適音源ベクトル探索装置
を得ることを目的とする。
〔課題を解決するための手段〕
この発明に係る最適音源ベクトル探索装置は、写像音
源符号帳(1)と、音声分析手段(16)と、第1のL次
元写像手段(12)と、第2のL次元写像手段(13)と、
音源ベクトル予備選択手段(3)と、音源ベクトル選択
手段(9)からなる音声符号化装置の最適音源ベクトル
探索装置において、写像音源符号帳(1)は、L次元の
次元直交条件を満たすL次元歪評価空間に写像したM個
の写像音源ベクトル(2)を有し、第1のL次元写像手
段(12)は、入力される音声信号(11)を写像音源ベク
トル(2)と同様のL次元歪評価空間に写像し、写像音
声信号(4)として音源ベクトル予備選択手段(3)、
および、音源ベクトル選択手段(9)に出力し、音声分
析手段(16)は、入力される音声信号(11)を分析し合
成フィルタ係数を算出すると共に、この合成フィルタ係
数のインパルス応答を算出して第2のL次元写像手段
(13)に出力し、第2のL次元写像手段(13)は、合成
フィルタ係数のインパルス応答を写像音源ベクトル
(2)と同様のL次元歪評価空間に写像し、評価重みフ
ィルタ係数(5)として音源ベクトル予備選択手段
(3)、および、音源ベクトル選択手段(9)に出力
し、音源ベクトル予備選択手段(3)は、評価重みフィ
ルタ係数(5)の各成分の絶対値の大きさに基づいてL1
個(L1<L)の次元成分を選出するとともに、L1個の次
元成分を対象に、評価重みフィルタ係数(5)とM個の
写像音源ベクトル(2)を用いて写像音声信号(4)に
対する歪量が小さいM1個(M1<M)の写像音源ベクトル
を選択し、音源ベクトル選択手段(9)は、L次元全て
を対象に、音源ベクトル予備選択手段(3)の選択した
M1個の写像音源ベクトル中から、評価重みフィルタ係数
(5)とM1個の写像音源ベクトルを用いて写像音声信号
(4)に対する歪量が最小となる1個の最適写像音源ベ
クトルを選択するようにしたものである。
〔作用〕
この発明においては、上述のように構成したことによ
り、音源ベクトルを予備選択し、そのなかから写像音声
信号に対する歪量が小さい写像音源ベクトルを選択し、
選択された写像音源ベクトルのなかから写像音声信号に
対する歪量が最小となる最適写像音源ベクトルを選択す
るようにしたので、最適音源ベクトルを探索する際にお
ける,歪量計算に要する演算量が小さくなる。
〔実施例〕
以下、この発明の一実施例を図について説明する。
第1図は本発明の一実施例による最適音源ベクトル探
索装置を示すブロック図であり、図において、第2図と
同一符号は同一または相当部分である。また、3は音源
ベクトル予備選択回路(音源ベクトル予備選択手段)で
あり、切換スイッチ6により選択されたDFT音源ベクト
ル2のなかから評価重みフィルタ係数5の各成分の絶対
値の大きさに基づいてL1個(L1<L)の次元成分を選出
するとともに、L1個の次元成分を対象に、評価重みフィ
ルタ係数5とM個のDFT音源ベクトル2を用いてDFT入力
音声4に対する歪量が小さいM1個(M1<M)のDFT音源
ベクトルを選択する。6は切換スイッチであり、DFT音
源ベクトル2を切換えて、音源ベクトル選択回路9にで
はなく音源ベクトル予備選択回路3に出力する。8は第
2の切換スイッチであり、音源ベクトル予備選択回路3
が出力する指定信号7に応じてDFT音源ベクトル2を切
換えて音源ベクトル選択回路9に出力する。
次に動作について説明する。
先ず、切換スイッチ6は符号帳1の中のDFT音源ベク
トル2を音源ベクトル予備選択回路3に伝える。音源ベ
クトル予備選択回路3は第(2)式におけるa(i)・
|Y(i)|の大きい次元が歪量への寄与度が大きい次元
であるとし、まずこのa(i)・|Y(i)|の大きなL1
個の次元を選出する。そしてM個のDFT音源ベクトル2
それぞれに対して、このL1個の次元についてのみDFT音
源ベクトル2と評価重みフィルタ係数5とDFT入力音声
4とを用いて周波数領域において再生音声が入力音声に
対して持つ歪量を計算する。M個中のk番目の音源ベク
トルを用いた場合の前記歪量D1(k)は次式で与えられ
る。
ここで、I(i)はベクトル{|a(j)|,j=1,L1}
の中でi番目に大きなベクトル成分に対応する次元であ
る。こうして求めたM個のD1(k)の内、小さなD1
(k)を与えるM1個の音源ベクトルの番号は音源ベクト
ル指定信号7として第2の切換スイッチ8に送られ、第
2の切換スイッチは小さなD1(k)を与えるM1個のDFT
音源ベクトルを音源ベクトル選択回路9に1個ずつ伝え
る。以下の音源ベクトル選択回路9の動作は第2図の音
源ベクトル選択回路9がM個のDFT音源ベクトルを選択
の対象にしていたのが、M1個を対象としていること以外
は同じなので説明は省略する。
次に演算量について述べる。D(k)、又はD1(k)
の1次元のみの演算に要する演算量をFとするとき、従
来の技術、即ち予備選択を行わずに最適音源ベクトルを
選択するための歪量計算を行なう方法ではL・M・Fの
演算量が必要であり、本実施例によれば、まず予備選択
にL1・M・Fそして本選択にL・M1・Fの合計(L1・M
+L・M1)・Fの演算量が必要であるので、L1・M+L
・M1<L・Mを満たすようにL1,M1を定めれば、演算量
を減少させることができる。このとき、M1,L1が小さい
ほど演算量は減少するが、音源ベクトル予備選択回路で
最適音源ベクトルが予備選択されない場合が起こるので
M1,L1は適切に定める必要がある。実験例としてはM=1
024,L=40のときM1=32,L1=5とした場合は最適音源ベ
クトルが予備選択結果からもれることなく演算量の大幅
な減少が確認されている。
なお上記実施例では最適音源探索の処理を回路内で実
現する例について述べたが、これをマイクロプロセッ
サ,信号処理プロセッサ等の汎用演算装置によるソフト
ウェア処理により実現してもよい。
また上記実施例では歪評価空間として、DFTによる周
波数領域を用いた場合について述べたが、これを次元直
交条件を満たす任意の写像空間を用いてもよい。
〔発明の効果〕
以上のように、この発明によれば、写像音源符号帳
(1)と、音声分析手段(16)と、第1のL次元写像手
段(12)と、第2のL次元写像手段(13)と、音源ベク
トル予備選択手段(3)と、音源ベクトル選択手段
(9)からなる音声符号化装置の最適音源ベクトル探索
装置において、写像音源符号帳(1)は、L次元の次元
直交条件を満たすL次元歪評価空間に写像したM個の写
像音源ベクトル(2)を有し、第1のL次元写像手段
(12)は、入力される音声信号(11)を写像音源ベクト
ル(2)と同様のL次元歪評価空間に写像し、写像音声
信号(4)として音源ベクトル予備選択手段(3)、お
よび、音源ベクトル選択手段(9)に出力し、音声分析
手段(16)は、入力される音声信号(11)を分析して合
成フィルタ係数を算出すると共に、この合成フィルタ係
数のインパルス応答を算出して第2のL次元写像手段
(13)に出力し、第2のL次元写像手段(13)は、合成
フィルタ係数のインパルス応答を写像音源ベクトル
(2)と同様のL次元歪評価空間に写像し、評価重みフ
ィルタ係数(5)として音源ベクトル予備選択手段
(3)、および、音源ベクトル選択手段(9)に出力
し、音源ベクトル予備選択手段(3)は、評価重みフィ
ルタ係数(5)の各成分の絶対値の大きさに基づいてL1
個(L1<L)の次元成分を選出するとともに、L1個の次
元成分を対象に、評価重みフィルタ係数(5)とM個の
写像音源ベクトル(2)を用いて写像音声信号(4)に
対する歪量が小さいM1個(M1<M)の写像音源ベクトル
を選択し、音源ベクトル選択手段(9)は、L次元全て
を対象に、音源ベクトル予備選択手段(3)の選択した
M1個の写像音源ベクトル中から、評価重みフィルタ係数
(5)とM1個の写像音源ベクトルを用いて写像音声信号
(4)に対する歪量が最小となる1個の最適写像音源ベ
クトルを選択するようにしたので、音源ベクトルに対す
る歪量計算を行う際にその演算量を低減でき、小規模な
装置でも十分大きなM個の音源ベクトルの中から最適な
音源ベクトルを探索することが可能となり、同じ装置規
模でより高品質な再生音声を得ることができる効果が得
られる。
【図面の簡単な説明】
第1図はこの発明の一実施例による最適音源ベクトル探
索装置を示すブロック図、第2図は従来の最適音源ベク
トル探索装置を示すブロック図である。 図において、1はM個のDFT音源ベクトルから構成され
る符号帳、2はDFT音源ベクトル、3は音源ベクトル予
備選択回路、4はDFT入力音声、5は評価重みフィルタ
係数、6は切換スイッチ、7は指定信号、8は第2の切
換スイッチ、9は音源ベクトル選択回路、10は最適音源
ベクトルコードである。 なお図中同一符号は同一又は相当部分を示す。
フロントページの続き (56)参考文献 特開 昭59−99496(JP,A) 特開 昭62−139089(JP,A) 特開 昭59−77730(JP,A) 特開 昭59−94936(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】写像音源符号帳と、音声分析手段と、第1
    のL次元写像手段と、第2のL次元写像手段と、音源ベ
    クトル予備選択手段と、音源ベクトル選択手段からなる
    音声符号化装置の最適音源ベクトル探索装置において、 写像音源符号帳は、L次元の次元直交条件を満たすL次
    元歪評価空間に写像したM個の写像音源ベクトルを有
    し、 第1のL次元写像手段は、入力される音声信号を写像音
    源ベクトルと同様のL次元歪評価空間に写像し、写像音
    声信号として音源ベクトル予備選択手段、および、音源
    ベクトル選択手段に出力し、 音声分析手段は、入力される音声信号を分析し合成フィ
    ルタ係数を算出すると共に、この合成フィルタ係数のイ
    ンパルス応答を算出して第2のL次元写像手段に出力
    し、 第2のL次元写像手段は、合成フィルタ係数のインパル
    ス応答を写像音源ベクトルと同様のL次元歪評価空間に
    写像し、評価重みフィルタ係数として音源ベクトル予備
    選択手段、および、音源ベクトル選択手段に出力し、 音源ベクトル予備選択手段は、評価重みフィルタ係数の
    各成分の絶対値の大きさに基づいてL1個(L1<L)の次
    元成分を選出するとともに、L1個の次元成分を対象に、
    評価重みフィルタ係数とM個の写像音源ベクトルを用い
    て写像音声信号に対する歪量が小さいM1個(M1<M)の
    写像音源ベクトルを選択し、 音源ベクトル選択手段は、L次元全てを対象に、音源ベ
    クトル予備選択手段の選択したM1個の写像音源ベクトル
    中から、評価重みフィルタ係数とM1個の写像音源ベクト
    ルを用いて写像音声信号に対する歪量が最小となる1個
    の最適写像音源ベクトルを選択することを特徴とする最
    適音源ベクトル探索装置。
JP63153963A 1988-06-21 1988-06-21 最適音源ベクトル探索装置 Expired - Lifetime JP2702157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63153963A JP2702157B2 (ja) 1988-06-21 1988-06-21 最適音源ベクトル探索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63153963A JP2702157B2 (ja) 1988-06-21 1988-06-21 最適音源ベクトル探索装置

Publications (2)

Publication Number Publication Date
JPH01319799A JPH01319799A (ja) 1989-12-26
JP2702157B2 true JP2702157B2 (ja) 1998-01-21

Family

ID=15573896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63153963A Expired - Lifetime JP2702157B2 (ja) 1988-06-21 1988-06-21 最適音源ベクトル探索装置

Country Status (1)

Country Link
JP (1) JP2702157B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5522011A (en) * 1993-09-27 1996-05-28 International Business Machines Corporation Speech coding apparatus and method using classification rules
EP1339040B1 (en) 2000-11-30 2009-01-07 Panasonic Corporation Vector quantizing device for lpc parameters

Also Published As

Publication number Publication date
JPH01319799A (ja) 1989-12-26

Similar Documents

Publication Publication Date Title
US5781880A (en) Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
JP3094908B2 (ja) 音声符号化装置
US6023671A (en) Voiced/unvoiced decision using a plurality of sigmoid-transformed parameters for speech coding
JP3068196B2 (ja) マルチパルス分析音声処理システムおよび方法
JP2970407B2 (ja) 音声の励振信号符号化装置
US5119423A (en) Signal processor for analyzing distortion of speech signals
JP2702157B2 (ja) 最適音源ベクトル探索装置
JPH09214349A (ja) ベクトル量子化方法および音声符号化方法
JP2931059B2 (ja) 音声合成方式およびこれに用いる装置
JP3144284B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3471889B2 (ja) 音声符号化方法及び装置
JP3276977B2 (ja) 音声符号化装置
EP0713208A2 (en) Pitch lag estimation system
JP3226180B2 (ja) 音声のピッチ周期符号化法
JP3471542B2 (ja) 音声符号化装置
JPH04301900A (ja) 音声符号化装置
JP3112462B2 (ja) 音声符号化装置
JP3319551B2 (ja) ベクトル量子化装置
JP3092654B2 (ja) 信号符号化装置
JP2907019B2 (ja) 音声符号化装置
JPH0511799A (ja) 音声符号化方式
JP3354338B2 (ja) 音声符号化装置
JP3209247B2 (ja) 音声の励振信号符号化法