JP3209248B2 - 音声の励振信号符号化法 - Google Patents

音声の励振信号符号化法

Info

Publication number
JP3209248B2
JP3209248B2 JP16558293A JP16558293A JP3209248B2 JP 3209248 B2 JP3209248 B2 JP 3209248B2 JP 16558293 A JP16558293 A JP 16558293A JP 16558293 A JP16558293 A JP 16558293A JP 3209248 B2 JP3209248 B2 JP 3209248B2
Authority
JP
Japan
Prior art keywords
vector
speech
noise excitation
inner product
excitation vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP16558293A
Other languages
English (en)
Other versions
JPH0720896A (ja
Inventor
健弘 守谷
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP16558293A priority Critical patent/JP3209248B2/ja
Publication of JPH0720896A publication Critical patent/JPH0720896A/ja
Application granted granted Critical
Publication of JP3209248B2 publication Critical patent/JP3209248B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は音声信号をできるだけ
少ない情報量でディジタル符号化する高能率音声符号化
法で、特に線形予測合成フィルタに供給する励振信号を
決定する励振信号符号化方法に関するものである。
【0002】
【従来の技術】8kbit/s程度以下の音声符号化法
として、CELP(Code Excited Lin
ear Prediction:符号励振線形予測)符
号化が良く知られている。この符号化法は図5に示すよ
うに、フレーム単位で雑音符号帳11と適応符号帳12
から励振ベクトルを選択して、それぞれ利得調整手段1
3,14で利得を調整して線形予測合成フィルタ15に
入力して音声を合成する。この合成音声と入力音声との
差を差回路16で求め、その差出力を聴感補正フィルタ
17を通し、そのフィルタ出力から歪計算部18で歪を
計算し、その歪が小さくなるように励振信号を選択し利
得調整する。励振ベクトルの選択基準は合成された信号
と入力信号の聴感上の誤差を最小化することである。こ
のように最終的に合成される波形をフィードバックして
励振ベクトルを決定するため、高い品質が得られる。
【0003】この半面、大量の雑音励振ベクトルを記憶
しておく必要があることや、励振ベクトルの探索の演算
量が膨大となるという難点がある。この為記憶容量や演
算量を削減するためにいくつかの手法が考えられている
が、以下で探索の基本原理を示し、この発明と関連のあ
る代表的な演算量削減法について整理して紹介する。
【0004】CELP符号化における雑音励振ベクトル
の探索では、前述したように線形予測合成フィルタ15
の出力合成波形と入力音声との差をとり、その差出力を
聴感補正フィルタ17を通したあとの歪が最小となるベ
クトルを選択する。具体的には、あるフレーム(フレー
ム長はnサンプル)で量子化の目標とするn次元の縦ベ
クトル(入力音声から、前のフレームからの応答成分や
適応符号ベクトルからの合成成分を差し引いた現フレー
ムの入力音声を、聴感補正フィルタに通した信号ベクト
ル)をX、符号帳中のm種類の雑音励振ベクトルのn次
元縦ベクトルをCj (j=0,…,m−1)、聴感補正
フィルタ17も一括した合成フィルタ15のインパルス
応答行列(n×n)をH、雑音励振ベクトルの利得をg
とすると、下記の歪みdを最小とするjを探索する。
【0005】 ここで、最適な利得が与えられ、雑音励振ベクトル決定
後にその利得を量子化することとすると、 g=XT HCj /((HCj T (HCj )) (3) が最適な利得となり(XT はXの転置行列)、このとき
の歪は d=XT X−(XT HCj )2/((HCj T (HCj )) (4) となる。結局第2項の f=(XT HCj )2/((HCj T (HCj )) (5) を最大とするjを捜せばよいことになる。ここでHCj
の合成演算にはn2 /2回程度の積和演算が必要ですべ
てのjについてCj を合成するには莫大な演算量を必要
とする。そこで種々の提案がなされている。
【0006】まず式(5)の分子はXT Hを1回だけ先
に計算し、そのあとでCj と内積をとれば近似誤差を発
生させずに演算量を削減する手法が知られている。内積
はn回の演算ですむためである。ところが、分母の計算
で演算量を削減しようとすると、近似誤差が生ずる。例
えば分母の項を(Cj T T HCj として、HT Hを
テプリッツ型の相関行列で近似し、Hの自己相関関数と
j の自己相関関数の内積で計算する方法が知られてい
る。この方法については実施例のなかで詳しく紹介する
が、これにより、分母の項をn回の積和で計算できる。
しかしながら、近似誤差が大きく、歪の増加と品質の劣
化を招くことや、演算量の削減効果は必ずしも大きくな
い。また雑音励振ベクトルCj 毎に相関値を記憶してお
くために、符号帳のための記憶容量と同程度の記憶容量
の追加が必要となる。
【0007】これとは別にCにローパスフィルタを掛け
てダウンサンプルした励振ベクトルをもち、分母の項を
このベクトルで近似する手法も知られている。ダウンサ
ンプルした比率で演算量を削減できるが、この手法でも
近似誤差やダウンサンプルしたベクトルのための記憶容
量が増加するという問題がある。また探索を2段階にわ
け、第1段では近似計算で複数のCj を候補として予備
選択し、その候補についてのみ第2段で式(5)を最大
とするものを選択する方法も知られている。第1段の近
似法としては分子の項だけを用いる方法や、上記で紹介
した近似法を用いる方法などが考えられる。第1段の近
似誤差を小さくすることや候補数を増やすことで歪を小
さくできるが、演算量削減効果が小さくなってしまう。
【0008】
【発明が解決しようとする課題】この発明の目的は音声
を少ない情報量で符号化するとき、できるだけ演算量を
抑えたまま符号化音声の品質を向上させ、特に上記従来
法の中で紹介した2段階の探索と組合せ、歪の劣化が小
さい割に大幅な演算量の削減ができる音声の励振信号符
号化方法を提供することにある。
【0009】
【課題を解決するための手段】この発明では雑音励振ベ
クトルを選択する(または予備選択する)際に式(5)
の分母の項、すなわちベクトルのエネルギーの項も考慮
するが、そのエネルギーの項は、インパルス応答の係数
の2項積、またはその線形和をパラメータベクトルと
し、このパラメータベクトルと、それに対応して予め蓄
えておいた雑音励振ベクトル毎に作られた回帰係数ベク
トルとの簡単な内積で求めることが特徴である。この回
帰係数ベクトルは雑音励振ベクトル毎に平均推定誤差が
小さくなるように設計し、予め蓄えておく。
【0010】図1に2段階の探索を行なう場合につい
て、この発明方法と従来法との比較を示す。従来におい
ては図1Bに示すようにエネルギー項を全く無視し、式
(5)の分子の計算結果のみで予備選択するか、図1C
に示すようにインパルス応答の自己相関関数と雑音励振
ベクトルの自己相関関数を使った近似演算でエネルギー
項(式(5)の分母の項)を求め、これを用いて式
(5)を近似計算して予備選択を行っているが、この発
明では図1Aに示すようにインパルス応答の2項積のま
たその線形和と回帰係数とでエネルギー項を求めて予備
選択、または本選択を行い演算量が少なく、精度の高い
励振信号の符号化が可能となる。
【0011】
【実施例】図2にこの発明の最も基本的な実施例の要部
の構成を示す。通常のm個のn次元雑音励振ベクトルか
らなる符号帳11のほかに、この実施例では雑音励振ベ
クトル毎に、回帰係数の表21、インパルス応答系列の
係数ごとの2項積の線形結合を演算してエネルギー推定
パラメータを作る手段22が設けられ、この推定パラメ
ータと表21中の回帰係数との内積でエネルギー値を求
める。
【0012】2段階の探索を行なうとしたときの探索手
順は以下のようになる。 1.あるフレームで合成フィルタや聴感補正フィルタの
特性が与えられると、合成フィルタのインパルス応答が
決まる。このインパルス応答の係数ごとの2項積からエ
ネルギー推定パラメータベクトルを作成する。 2.次に式(5)の分子の項を全ての雑音励振ベクトル
に対して求める。
【0013】3.各雑音励振ベクトルに対して、パラメ
ータベクトルと、対応する回帰係数ベクトルとの内積の
計算からエネルギー推定値、さらにそのエネルギー推定
値を用いて(分子の項/エネルギー推定値)を算出し、
その算出値の大きいものから設定された数の候補を残
す。 4.予備選択した候補についてのみ式(5)の計算を行
ない、最適な雑音励振ベクトルの符号を決定する。
【0014】この処理で問題となるのが、どのようなパ
ラメータベクトルを作るかという点とそのベクトルに対
しどのように回帰係数ベクトルを用意するかという点で
ある。まずパラメータベクトルの構成を示すため、式
(5)の分母をfd とし、以下のように書きかえる。
【0015】 ただし である。さらにΦを用いて書きかえる。
【0016】
【数1】 すなわち、分母のエネルギーの項は(n+1)n/2個
のhk i を変数とする関数であるが、このままでは変
数の数が多すぎて演算量削減には意味がない。従来技術
の一つとして Φ(M)1 ≒Φ(M)n-M ,…,Φ(M)n-M-1 ≒Φ(M)n-M , (M=0,…,n−1) (13) と近似し、hに関しても同様に Ψ(M)N =Σhi i+M (14) Σはi=0からN−1まで Ψ(M)1 ≒Ψ(M)n-M ,…,Ψ(M)n-M-1 ≒Ψ(M)n-M , (M=0,…,n−1) (15) として fd =Ψ(0)n Φ(0)n +2ΣΨ(i)n-i Φ(i)n-i (16) Σはi=1からn−1までとすることが知られている。
【0017】この発明ではさらに自由度をあげ、hk
i のうち特定のk、iに対応する値と予め決めた係数a
k,i を使った線形和で少数(ここではp個)のパラメー
タΩ j を作り、分母のエネルギー項を推定する。ak,i
の設定には大きな自由度があるが、ここでは簡単に ak,i =1−(k/(2n)) (17) とし、以下のように間隔の等しい2項積の線形和を作る
こととする。
【0018】 Ω0 =a0,0 0 0 +,…,+an-1,n-1 n-1 n-1 … (18) Ωp-1 =ap-1,0 p-1 0 +,…,+an-1,n-p n-1 n-p d ′=Σξi Ωi (19) Σはi=0からp−1まで、ξは各雑音励振ベクトル毎
に推定値と実際のエネルギー値の差が小さくなるように
予め最小2乗法で決めた回帰係数である。すなわち数多
くのインパルス応答毎に求めたΩj を用いたエネルギー
推定値と、雑音励振ベクトルをそのインパルス応答のフ
ィルタで合成したときの正確なエネルギー値fd j との
2乗誤差の総和Eを最小とするξi を正規方程式を解い
て求めればよい。
【0019】 E=Σ‖fd j −(Σξi Ωi j )‖2 (20) Σはi=0からp−1まで、また場合によってはfd
対数領域や逆数の領域で推定し、その誤差の総和を最小
とする回帰係数を求めてもよい。以上の実施例は図5に
示した基本的なCELP符号化を前提に説明したが、雑
音励振ベクトルの探索の前に、すべての雑音励振ベクト
ルをピッチ成分と直交化させる手法や、複数チャンネル
の雑音励振ベクトルをもつ場合にもこの発明を適用でき
る。
【0020】すなわち第2の実施例として雑音励振ベク
トルをピッチ成分(適応符号帳からの出力)n次元ベク
トルPと直交化させる場合について説明する。この場合
には最終的に最大化する式(5)が次のように変形され
る。 f=(XT HCj −ρHP)2 / ((HCj ) T (HCj )−ρ(HCj T (HP)) (21) ここで ρ=(HCj ) T (HP)/((HP) T (HP)) (22) である。式(21)でも分子の項は式(5)の場合と同
様に比較的少ない演算で正確に計算できる。また分母の
ρ以下の第2項も積和の計算も同様である。従って分母
の第1項を第1の実施例と同じ手順で表から読み出せば
演算量を削減できる。また分母の第2項の計算を全く省
略して、第1項のみで評価しても歪の増加はほとんどな
い。
【0021】第3の実施例として2チャンネルの雑音励
振ベクトルをもつ場合について示す。ここでも2段階の
探索を行なうと図3に示されるような処理を行なうこと
になる。第1チャンネルの励振ベクトルをCj 、第2チ
ャンネルの励振ベクトルをC′k とすると、最終的な評
価尺度は以下のようになる。
【0022】
【数2】 しかしながら各チャンネル毎の予備選択ではそれぞれ、
第1の実施例と同じ処理を行なう。すなわち分母のエネ
ルギー項の概算値を表から読みだし、式(5)を最大と
する候補を複数個選択する。そして、各チャンネルから
の候補の組合せで式(23)が最大となるjとkの組合
せを探索する。
【0023】上述において、パラメータベクトルΩj
1個の2項積で構成してもよい。また雑音励振ベクトル
の実際のエネルギーの逆数値と、その推定値との差が小
さくなるように回帰係数を求め記憶しておき、パラメー
タベクトルと推定値との内積でエネルギーの逆数値を推
定してもよい。更に予備選択のみならず、場合によって
は式(5)の正確な演算を行うことなく、前記予備選択
を最終選択としてもよい。
【0024】
【発明の効果】この発明を用いた場合の入力音声と符号
化歪とのSNRと、音声符号化処理全体の演算量(単位
MOPS Mega Operation Per S
econd:実時間処理に必要な1秒あたり100万回
単位の演算処理回数)との関係を従来法と比較したもの
を図4に示す。この場合、雑音励振ベクトルは2チャン
ネルからなり、各チャンネル毎に7ビット(極性を除
く)を配分した場合である。雑音励振ベクトルの次元数
nは40でピッチ成分との直交化処理を併用している。
またエネルギー推定パラメータの個数は6とした。ここ
での従来法Aは式(5)の分子の項のみで予備選択を行
なう方法(図1Bに示した方法)であり、従来法Bは図
1Cに示したエネルギー項を近似計算して予備選択を行
なう方法である。図中の数字は各チャンネル毎に128
個の中から残す候補数である。この図からこの発明によ
り従来法Aと比較して、残す候補数が同一であれば、演
算量は少し増加するが、それ以上にSNRの改善効果が
あり、つまり同一SNRであればこの発明の方が演算量
が著しく少なくなることがわかる。また従来法Bと比較
して予備選択の候補数が同じ場合に同じようなSNRの
改善効果があるが、従来法Bの演算量の増加が大きいた
め、この発明の方が明らかに有利であることがわかる。
【0025】従来法Aに対し、この発明で増加する演算
量の内分けは、Ωの計算がフレームあたり1回、ξとの
内積が各雑音励振ベクトル毎に1回ずつで、予備選択の
個数を1個増やす程度の比較的少ない量である。またこ
の発明ではξのための記憶容量が増加するが、例えばξ
が6次元で、40次元の雑音励振ベクトルを用いる時に
は、記憶容量の増加する割合は約15%である。
【図面の簡単な説明】
【図1】2段階の探索におけるこの発明の処理を従来法
と対比させて示したブロック図。
【図2】この発明の実施例の要部を示すブロック図。
【図3】この発明を2チャンネルの雑音励振ベクトルの
場合への適用した実施例の要部を示すブロック図。
【図4】この発明によるSNRと演算量の関係を従来法
と比較した図。
【図5】CELP符号化法の基本原理を示すブロック
図。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/12

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 ピッチ周期成分ベクトルと雑音励振ベク
    トルを線形予測合成フィルタの励振源とする音声合成モ
    デルを持ち、合成音声と入力音声の誤差を最小化するよ
    うに雑音励振ベクトルを符号帳のなかから選択する音声
    の励振信号符号化法において、 雑音励振ベクトル毎にその合成後の波形と入力音声波形
    の内積(第1の内積値)を求め、 合成フィルタのインパルス応答の各係数の2項積または
    その線形和をパラメータベクトルとし、 予め、雑音励振ベクトル毎に作られた回帰係数ベクトル
    と前記パラメータベクトルの内積計算(第2の内積値)
    で雑音励振ベクトルの合成後のエネルギー又はその逆数
    を推定し、 前記第1の内積値を前記第2の内積値でわった値を基準
    に雑音励振ベクトルの選択または予備選択を行なうこと
    を特徴とする音声の励振信号符号化法。
JP16558293A 1993-07-05 1993-07-05 音声の励振信号符号化法 Expired - Lifetime JP3209248B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16558293A JP3209248B2 (ja) 1993-07-05 1993-07-05 音声の励振信号符号化法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16558293A JP3209248B2 (ja) 1993-07-05 1993-07-05 音声の励振信号符号化法

Publications (2)

Publication Number Publication Date
JPH0720896A JPH0720896A (ja) 1995-01-24
JP3209248B2 true JP3209248B2 (ja) 2001-09-17

Family

ID=15815098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16558293A Expired - Lifetime JP3209248B2 (ja) 1993-07-05 1993-07-05 音声の励振信号符号化法

Country Status (1)

Country Link
JP (1) JP3209248B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3263347B2 (ja) 1997-09-20 2002-03-04 松下電送システム株式会社 音声符号化装置及び音声符号化におけるピッチ予測方法
EP1386791B1 (en) 2002-07-29 2009-04-29 Toyoda Gosei Co., Ltd. Occupant protecting device and air bag device for rear-end collision mounted on vehicle
JP5821161B2 (ja) * 2010-03-18 2015-11-24 ヤマハ株式会社 波形解析を行うための方法、装置およびプログラム
BR112015007137B1 (pt) * 2012-10-05 2021-07-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho para codificar um sinal de fala que emprega acelp no domínio de autocorrelação

Also Published As

Publication number Publication date
JPH0720896A (ja) 1995-01-24

Similar Documents

Publication Publication Date Title
EP0422232B1 (en) Voice encoder
US5208862A (en) Speech coder
US5396576A (en) Speech coding and decoding methods using adaptive and random code books
JP3114197B2 (ja) 音声パラメータ符号化方法
JP2776050B2 (ja) 音声符号化方式
JP3094908B2 (ja) 音声符号化装置
JPH06222797A (ja) 音声符号化方式
JPH056199A (ja) 音声パラメータ符号化方式
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
KR100561018B1 (ko) 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법
JP2624130B2 (ja) 音声符号化方式
JP3209248B2 (ja) 音声の励振信号符号化法
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
US6751585B2 (en) Speech coder for high quality at low bit rates
JPH0854898A (ja) 音声符号化装置
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP3209247B2 (ja) 音声の励振信号符号化法
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
JP3226180B2 (ja) 音声のピッチ周期符号化法
JP3089967B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070713

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080713

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080713

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090713

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090713

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110713

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120713

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130713

Year of fee payment: 12

EXPY Cancellation because of completion of term