JPH09152896A - 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 - Google Patents

声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置

Info

Publication number
JPH09152896A
JPH09152896A JP7312548A JP31254895A JPH09152896A JP H09152896 A JPH09152896 A JP H09152896A JP 7312548 A JP7312548 A JP 7312548A JP 31254895 A JP31254895 A JP 31254895A JP H09152896 A JPH09152896 A JP H09152896A
Authority
JP
Japan
Prior art keywords
vocal tract
coefficient
prediction coefficient
lsp
tract prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7312548A
Other languages
English (en)
Inventor
Hiromi Aoyanagi
弘美 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7312548A priority Critical patent/JPH09152896A/ja
Priority to US08/738,779 priority patent/US5826221A/en
Publication of JPH09152896A publication Critical patent/JPH09152896A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 声道予測係数が大きく変動しても、平均的な
符号化レートを余り増加させることなく高い品質で忠実
に再生音声を出力すること。 【解決手段】 声道予測係数変換・量子化部202は、
声道予測係数a1〜a4をLSP係数に変換したのち量
子化し、LSP係数量子化値LspQ1〜LspQ4
と、インデックスI1〜I4を同時に出力して符号化モ
ード判定部210に与える。符号化モード判定部210
は、LSP係数量子化値LspQ1〜LspQ4と、前
フレームの第4サブフレームのLSP係数量子化値Ls
pQ4pと、各量子化値のインデックスI1〜I4とか
ら、三つのモードを仮定し、現フレームをどのモードで
符号化するかを判定して、モード符号情報と量子化符号
情報Lとを出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、声道予測係数符号
化・復号化回路、声道予測係数符号化回路、声道予測係
数復号化回路、音声符号化装置及び音声復号化装置に関
し、特に声道予測係数の変動に対処するものである。
【0002】
【従来の技術】近年、4kbit/s以下の低ビットレ
ート音声符号化方式は、次世代のデジタル自動車電話な
どの分野において需要が急増している。
【0003】現在、音声に対する符号・復号方式にはコ
ード励振線形予測(CELP:Code Excite
d Linear Prediction)符号化方
式、マルチパルス励振(MPE:Multi Puls
e Exicitation)線形予測符号化方式等、
音源情報と声道情報を分離して各々符号化する方式が広
く用いられている。
【0004】例えば、CELPにおいて、ビットレート
を低減するためには音源だけでなく、LSP(Line
Spectrum Pair)パラメータの効率的な
量子化法が必要である。CELP方式では一定間隔のフ
レームを更に分割したサブフレーム毎に処理が行われる
ため、LSPの量子化において音質を劣化させずにビッ
トレートを下げるためには、フレーム内で定めたLSP
をサブフレーム毎に補間する方法が重要となる。
【0005】声道情報の符号化は、例えば下記の文献で
開示されている。 文献名:野村、小澤、「LSPパラメータの効率的な量
子化・補間法の検討」1993年電子情報通信学会秋季
大会、A−142、ページ1−144。
【0006】上記文献では、フレーム全体の量子化性能
を向上させることを目的として、量子化法と補間法との
組み合わせを検討している。上記文献では、フレーム毎
に声道予測係数(LSPパラメータ)を量子化し、サブ
フレーム処理では補間値を用いている。即ち、上記文献
においては、現フレームの量子化値の候補を予備選択
し、それぞれの候補と前フレームの量子化値とを用いて
サブフレーム毎に補間している。
【0007】量子化法においては、フレーム全体の量子
化性能を上げるため補間に多くのビットを割り振るに
は、より少ないビット数で歪みの小さい量子化器が必要
となるので、ベクトル−スカラー量子化と、多段−分割
ベクトル量子化をもとに検討されている。
【0008】また、高品質な再生音を得るには、サブフ
レーム毎にLSPパラメータを量子化することが良いと
考えられるが、ビットレートが高くなるので、フレーム
毎に量子化を行い、その量子化値と前フレームの量子化
値を用いてサブフレーム毎に補間値を求める。補間法と
して、直接補間値を用いる方法や直接補間誤差をベクト
ル量子化する方法があるが、補間ベクトルxiを直線補
間値で表すよりも、xi=axp+(1−a)xnのよ
うに補間係数aを用いて表すことが効果的であると考え
られる。ここで、xnは現フレームの量子化値、xpは
前フレームの量子化値である。
【0009】補間係数aをスカラー量子化する方法と、
補間係数をスカラー量子化した上でその誤差ベクトルe
をベクトル量子化する方法とが検討されている。そし
て、補間ベクトルxiは、xi=axp+(1−a)x
n+eと表される。補間係数と誤差ベクトルを組み合わ
せることによって、誤差ベクトルの量子化性能が直線補
間だけのときの誤差ベクトルよりも良くするものであ
る。
【0010】
【発明が解決しようとする課題】しかしながら、入力音
声によってはフレーム内においても声道情報が大きく変
動する場合があり、従来の補間処理では充分に声道情報
の変動に追従できず再生音声品質を劣化させてしまうと
いう問題がある。
【0011】このようなことから、声道予測係数が大き
く変動しても、平均的な符号化レートを余り増加させる
ことなく高い品質で忠実に再生音声を出力することがで
きる声道予測係数符号化・復号化回路、声道予測係数符
号化回路、声道予測係数復号化回路、音声符号化装置及
び音声復号化装置の提供が要請されている。
【0012】
【課題を解決するための手段】そこで、本発明は、入力
フレーム音声信号から声道予測係数を求めて、これを符
号化する声道予測係数符号化回路と、この声道予測係数
符号化回路からの符号化信号から声道予測係数を再生す
る声道予測係数復号化回路とからなる声道予測係数符号
化・復号化回路であって、上記声道予測係数符号化回路
は、入力フレーム音声信号からいくつかのサブフレーム
に対する声道予測係数を求める声道予測係数生成手段
と、上記各サブフレーム単位の声道予測係数から各LS
P係数を求め、これらのLSP係数をそれぞれ量子化し
た各LSP係数量子化値を出力するLSP係数量子化手
段と、上記各LSP係数量子化値から、フレーム内の声
道予測係数の変動状態を分析し、この分析結果から、予
め備えられている声道予測係数の量子化・補間のモード
のいずれを表すか否かを判定する量子化・補間モード判
定処理部の判定処理に従って、量子化・補間モード情報
と、いずれのサブフレームのLSP係数量子化値を伝送
するかを表すLSP係数量子化値情報とを生成出力する
符号化モード判定手段とを備える。
【0013】上記声道予測係数復号化回路は、予め上記
量子化・補間モード判定処理部を備えていて、上記量子
化・補間モード情報とLSP係数量子化値情報とからフ
レーム内の全サブフレームのLSP係数を再生するLS
P係数再生手段と、上記全サブフレームのLSP係数か
ら対応する全サブフレームの声道予測係数を再生する声
道予測係数再生手段とを備えて、上述の課題を解決する
ものである。
【0014】このような構成をとることで、フレーム内
声道予測係数の変動状態に応じて量子化・補間モード判
定処理部の判定処理に従って、いずれかのサブフレーム
のLSP係数量子化値情報と量子化・補間モード情報と
を適応的に選択出力し、声道予測係数復号化回路では、
量子化・補間モード判定処理部を使用してLSP係数量
子化値情報と量子化・補間モード情報とからフレーム内
の全サブフレームのLSP係数を再生し、これらのサブ
フレームのLSP係数から対応する全サブフレームの声
道予測係数を再生するので、声道予測係数の変動が大き
い場合であっても、補間とサブフレームのLSP係数量
子化値とを使用して、忠実に声道予測係数を再生するこ
とができる。
【0015】また、サブフレームに対してLSP係数量
子化値を適用する場合は、LSP係数量子化値情報の伝
送情報が必要になるが、サブフレームに対する補間値を
適用する場合は、量子化・補間モード情報を送るだけで
伝送情報が大幅に軽減される。従って、フレームごとの
伝送レートが可変となる。
【0016】このようなことから、声道予測係数が大き
く変動しても、平均的な符号化レートを余り増加させる
ことなく高い品質で忠実に再生音声を出力することがで
きるのである。
【0017】
【発明の実施の形態】次に本発明の好適な実施の形態を
図面を用いて説明する。そこで、本実施の形態において
は、フレーム内声道情報の変動具合に応じて、サブフレ
ーム処理で用いる声道予測係数値として量子化値にする
か、補間値にするかを適応的に選択するものである。量
子化値を用いる場合には符号化ビットを必要とし、補間
値を用いる場合は、符号化ビットを必要としないためフ
レーム毎の符号化ビット数は可変となる。
【0018】具体的には、本実施の形態の声道予測係数
符号化回路は、入力音声信号よりフレーム単位に声道予
測係数を計算し、前記声道予測係数を量子化して量子化
符号を復号器に伝送する声道予測係数符号回路におい
て、入力音声信号よりフレームを更に分割したサブフレ
ーム単位に声道予測係数を計算し、サブフレーム毎に得
られた前記声道予測係数を各々量子化して量子化値及び
量子化符号を計算し、各サブフレームに対する補間値を
計算し、前記量子化値と前記補間値の差分値を計算し、
前記差分値により各サブフレームで前記量子化値を用い
るか前記補間値を用いるかを選択し、前記量子化を用い
ると判断したサブフレームの前記量子化符号と前記選択
結果情報を伝送するように構成するものである。
【0019】また、声道予測係数符号化回路からの情報
により声道予測係数を復号する声道予測係数復号器にお
いて、声道予測係数符号器からの伝送情報を元に、サブ
フレーム単位に声道予測係数を復号するように構成する
ものである。
【0020】図1は声道予測係数符号化回路の機能構成
図である。この図1において、声道予測係数符号化回路
は、声道分析部201と、声道予測係数変換・量子化部
202と、符号化モード判定部210とから構成されて
いる。
【0021】声道分析部201は、フレーム単位にまと
められて入力される入力音声信号Sに対して、サブフレ
ーム単位で声道予測係数(LPC係数)aを求めて声道
予測係数変換・量子化部202に与える。ここで、本実
施の形態においては、サブフレームを4とするため、声
道予測係数(LPC係数)a1〜a4を声道予測係数変
換・量子化部202に与えるものである。
【0022】声道予測係数変換・量子化部202は、声
道予測係数(LPC係数)a1〜a4をLSP(Lin
e Spectrum Pair)係数に変換したのち
量子化し、LSP係数量子化値LspQ1、LspQ
2、LspQ3、LspQ4を出力して符号化モード判
定部210に与える。また、各量子化値のインデックス
(符号)I1、I2、I3、I4、を同時に出力して符
号化モード判定部210に与える。
【0023】符号化モード判定部210は、LSP係数
量子化値LspQ1〜LspQ4と、前フレームの第4
サブフレームのLSP係数量子化値LspQ4pと、各
量子化値のインデックス(符号)I1〜I4とから、図
2の三つのモードを仮定し、現フレームをどのモードで
符号化するかを判定して、モード符号情報(量子化・補
間モード情報)と量子化符号情報L(LSP係数量子化
値情報)とを出力する。
【0024】この図2において、モード1では、第1サ
ブフレームは補間値を使用し、第2サブフレームは補間
値を使用し、第3サブフレームは補間値を使用し、第4
サブフレームは量子化値を使用するものである。
【0025】更に、モード2では、第1サブフレームは
補間値を使用し、第2サブフレームは量子化値を使用
し、第3サブフレームは補間値を使用し、第4サブフレ
ームは量子化値を使用するものである。
【0026】更にまた、モード3では、第1サブフレー
ムは量子化値を使用し、第2サブフレームは量子化値を
使用し、第3サブフレームは量子化値を使用し、第4サ
ブフレームは量子化値を使用するものである。このモー
ドの場合は、補間を行わず、全て量子化値を出力するも
のである。
【0027】ここでのモード判定法は以下の通りであ
る。先ず、前フレームで得られた第4サブフレームのL
SP係数量子化値(LspQ4p)とLspQ4とを用
いて、現フレームの第1サブフレーム〜第3サブフレー
ムに対するLSP係数補間値LspD1、LspD2、
LspD3を計算する。LspD1〜LspD3は、例
えば、以下の様にして得る。
【0028】即ち、LspD1=LspQ4p*3/4
+LspQ4*1/4 LspD2=LspQ4p*2/4+LspQ4*2/
4 LspD3=LspQ4p*1/4+LspQ4*3/
4 更に、以下のようにしてフレームエラーE1を計算す
る。即ち、 E1=Σ(LspQ1i−LspD1i)+Σ(Ls
pQ2i−LspD2i)+Σ(LspQ3i−Ls
pD3i) i=1〜n、nは例えば、8又は10程度である。
【0029】このフレームエラーE1が予め定められた
閾値Et1より小さい場合は、モード1と判定し、モー
ド符号情報M(モードが1であるという情報)と量子化
符号情報L(I4のみ)を声道予測係数復号回路に伝送
し、符号化モード判定部210は、現フレームの声道予
測係数符号化処理を終了する。フレームエラーE1が閾
値Et1以上のときは引き続き以下の処理を行う。
【0030】先ず、LspQ4p、LspQ2、Lsp
Q4を用いて現フレームの第1サブフレーム、第3サブ
フレームに対するLSP係数補間値LspDD1、Ls
pDD3を計算する。LspDD1、LspDD3は、
例えば、以下のようにして得られる。
【0031】LspDD1=LspQ4p*1/2+L
spQ2*1/2 LspDD3=LspQ2*1/2+LspQ4*1/
2 更に、以下のようにしてフレームエラーE2を計算す
る。
【0032】 E2=Σ(LspQ1i−LspDD1i)+Σ(L
spQ3i−LspDD3i) i=1〜n、nは例えば、8又は10程度である。
【0033】このフレームエラーE2が予め定められた
閾値Et2より小さい場合は、モード2と判定し、モー
ド符号情報M(モードが2であるという情報)と量子化
符号情報L(I2、I4)を声道予測係数復号回路に伝
送し、現フレームの声道予測係数符号化処理を終了す
る。フレームエラーE2がEt2以上の時は、モード3
と判定し、モード符号情報M(モードが3であるという
情報)と、量子化符号情報L(I1、I2、I3、I
4)とを声道予測係数復号回路に伝送し、現フレームの
声道符号化処理を終了するのである。
【0034】(動作): 次に図1の動作を説明す
る。図1の声道予測係数符号化回路の入力端子200よ
りフレーム単位にまとめられて入力される入力音声信号
Sは、声道分析部201に入力され、サブフレームごと
に声道予測係数(LPC係数)が計算される。例えば、
4サブフレームで1フレームとなる場合は、声道予測係
数としてa1〜a4が得られる。
【0035】声道予測係数a1〜a4を与えられた声道
予測係数変換・量子化部102は、声道予測係数a1〜
a4をLSP係数に変換したのち量子化し、LSP係数
量子化値LspQ1〜LspQ4を出力する。また、各
量子化値のインデックス(符号)I1〜I4を同時に出
力する。
【0036】LSP係数量子化値LspQ1〜LspQ
4と、前フレームの第4サブフレームのLSP係数量子
化値(LspQ4p)と、インデックスI1〜I4とを
使用して、符号化モード判定部210では上述の三つの
モードで、現フレームをどのモードで符号化するかが判
定され、モード符号情報Mと量子化符号情報Lとが出力
されるのである。
【0037】(声道予測係数復号化回路): 図3は
声道予測係数復号化回路の機能構成図である。この図3
において、声道予測係数復号化回路は、モード判定逆量
子化部216と、声道予測係数逆変換部217とから構
成されている。
【0038】モード判定逆量子化部216は、声道予測
係数符号化回路からのモード符号情報Mと量子化符号情
報Lとから、以下のようにして各サブフレームで用いる
LSP係数LspU1、LspU2、LspU3、Ls
pU4を求める。
【0039】即ち、先ず、量子化符号情報Lよりインデ
ックスI4を分離し、これより第4サブフレームに対す
る逆量子化値LspQ4を求める。
【0040】モード符号情報からモードが『1』であっ
た場合は、前フレームで得られた第4サブフレームのL
SP係数量子化値(LspQ4p)とLspQ4を用い
て、例えば、 LspU1=LspQ4p*3/4+LspQ4*1/
4 LspU2=LspQ4p*2/4+LspQ4*2/
4 LspU3=LspQ4p*1/4+LspQ4*3/
4 LspU4=LspQ4 の様にLspU1〜LspU4を求めて出力する。
【0041】モード符号情報Mよりモード符号が『2』
であった場合は、量子化符号情報Lより更にI2を分離
し、これより第2サブフレームに対する逆量子化値Ls
pQ2を求める。そして、LspQ4p、LspQ2、
LspQ4を用いて、例えば、 LspU1=LspQ4p*1/2+LspQ2*1/
2 LspU2=LspQ2 LspU3=LspQ2*1/2+LspQ4*1/2 LspU4=LspQ4 の様にLspU1〜LspU4を求めて出力する。
【0042】モード符号情報Mよりモードが『3』であ
った場合は、量子化符号情報Lから更にI1、I3を分
離し、これより第1、第3サブフレームに対する逆量子
化値LspQ1、LspQ2、LspQ3を計算する。
そして、LspQ1、LspQ2、LspQ3、Lsp
Q4を用いて、例えば LspU1=LspQ1 LspU2=LspQ2 LspU3=LspQ3 LspU4=LspQ4 のようにLspU1〜LspU4を計算して、声道予測
係数逆変換部217へ出力するものである。
【0043】声道予測係数逆変換部217は、上記LS
P係数LspU1〜LspU4を声道予測係数aq1〜
aq4に変換して出力するものである。
【0044】(声道予測係数復号化回路の動作):
図3の声道予測係数復号化回路の動作を説明する。この
図3において、声道予測係数符号化回路からのモード符
号情報M、量子化符号情報Lはモード判定逆量子化部2
01に与えられると、各サブフレームのLSP係数Ls
pU1、LspU2、LspU3、LspU4が上述の
方法で計算される。これらのLSP係数LspU1〜L
spU4から、声道予測係数逆変換部217では、声道
予測係数aq1〜aq4に変換され出力されるのであ
る。
【0045】(音声符号化装置): 図4は上述の声
道予測係数符号化回路を音声符号化装置に適用した場合
の機能構成図である。この図4において、音声符号化装
置は、声道分析部201と、声道予測係数変換・量子化
・逆量子化部202Aと、駆動音源符号帳203と、乗
算器204と、ゲインテーブル205と、合成フィルタ
206と、減算器207と、聴覚重み付けフィルタ20
8と、2乗誤差計算回路209と、符号化モード判定部
210と、多重化回路212とから構成されている。図
1と同じ機能部分は、同じ符号を付している。
【0046】声道予測係数変換・量子化・逆量子化部2
02Aは、上述の声道予測係数変換・量子化部202に
逆量子化機能を追加したもので、声道分析部201から
の声道予測係数(LPC係数)a1〜a4をLSP係数
に変換したのち量子化し、LSP係数量子化値LspQ
1、LspQ2、LspQ3、LspQ4を出力して符
号化モード判定部210に与える。また、各量子化値の
インデックス(符号)I1、I2、I3、I4も同時に
出力して符号化モード判定部210に与える。また、量
子化値に対する逆量子化値aqをLSP係数量子化値L
spQ1〜LspQ4と、モード情報Mとから求めて合
成フィルタ206に与えるものである。
【0047】駆動音源符号帳203は、2乗誤差計算回
路209から与えられるインデックス値I、Jによっ
て、対応する駆動音源信号Ci(i=1〜N)を読み出
して乗算器204に与えるものである。
【0048】乗算器204は、ゲインテーブル205か
ら与えられるゲイン情報gj(j=1〜M)と、駆動音
源符号帳203からの駆動音源信号Ci(i=1〜N)
とを乗算して、乗算結果信号Cgijを合成フィルタ2
06に与えるものである。
【0049】ゲインテーブル205は、2乗誤差計算回
路209から与えられるインデックス値jによって、対
応するゲイン情報gj(j=1〜M)を読み出して乗算
器204に与える。
【0050】合成フィルタ206は、例えば、巡回型の
デジタルフィルタで構成され、声道予測係数量子化・逆
量子化部202Aからの逆量子化値(LPC係数を意味
している。)aqと、乗算結果信号Cgijとから合成
音声信号Sijを求めて減算器207に与えるものであ
る。
【0051】減算器207は、入力原音声信号Soと、
合成音声Sijとの差分を求め、この差分信号eijを
聴覚重み付けフィルタ208に与えるものである。
【0052】聴覚重み付けフィルタ208は、減算器2
07からの差分信号eijに対して、周波数的な重みを
かける、言い換えれば、聴覚特性に応じた重み付け処理
を施してその聴覚重み付け信号wijを2乗誤差計算回
路209に与えるものである。音声ホルマントや、ピッ
チハーモニクスのパワーの大きい周波数領域の量子化雑
音は、聴覚マスキング効果によって小さく感じる。逆
に、パワーの小さい周波数領域の量子化雑音は、マスク
されずに聞こえてしまう。そこで、符号化時の量子化雑
音をパワーの大きい周波数領域で大きくし、パワーの小
さい周波数領域で小さくするための周波数重み付けを聴
覚重み付けという。
【0053】人間の聴覚は、ある周波数成分が大きいと
その近くの周波数の音が聞こえにくくなる、マスキング
と呼ばれる特性を持っている。故に、原音声と再生音声
との聴覚上の差、即ち、再生音声の歪み感はそのユーク
リッド距離とは必ずしも対応しない。故に、音声符号化
では、距離尺度として原音声と再生音声との差をマスキ
ング特性に対応した聴覚重み付けフィルタ208に通し
た値を用いる。この聴覚重み付けフィルタ208は、周
波数軸上において大きな部分の歪みを軽くし、小さな部
分の歪みを重くし、重み付けする特性を持つものであ
る。
【0054】2乗誤差計算回路209は、聴覚重み付け
フィルタ208からの聴覚重み付け信号wijに基づ
き、この信号の各成分の2乗和信号Eijを求めて、こ
の2乗和信号Eijの値が、最小となるi、jの組み合
わせを探索して、最小組み合わせi、jを最適インデッ
クスi、jとし、この最適インデックスiを駆動音源符
号帳203に与え、他方の最適インデックスjをゲイン
テーブル205に与え、両方の最適インデックスi、j
を多重化回路212に与えるものである。
【0055】多重化回路212は、符号化モード判定部
210からのモード符号情報Mと、量子化符号情報L
と、最適インデックスi、jとを多重化して、この多重
化によって得られた信号をトータルコード信号Wとして
トータルコード出力端子213に出力するものである。
【0056】(音声符号化装置の動作): 図4の音
声符号化装置の動作を説明する。この図4において、入
力端子200よりフレーム単位にまとめられて入力され
る入力音声信号Sは、声道分析部201に入力され、サ
ブフレームごとに声道予測係数(LPC係数)a1〜a
4が得られる。声道予測係数a1〜a4を与えられた声
道予測係数変換・量子化・逆量子化部202Aでは、声
道予測係数a1〜a4をLSP係数に変換したのち量子
化され、LSP係数量子化値LspQ1〜LspQ4が
出力される。
【0057】また、各量子化値のインデックス(符号)
I1〜I4も同時に出力される。LSP係数量子化値L
spQ1〜LspQ4と、前フレームの第4サブフレー
ムのLSP係数量子化値(LspQ4p)と、インデッ
クスI1〜I4とを使用して、符号化モード判定部21
0では上述の三つのモードで、現フレームをどのモード
で符号化するかが判定され、モード符号情報Mと量子化
符号情報Lとが多重化回路212へ出力され、更に、モ
ード符号情報Mは、声道予測係数変換・量子化・逆量子
化部202Aにも与えられるのである。
【0058】一方、駆動音源符号帳203は、初期的に
は所定のいずれかの駆動音源信号Ci(i=1〜Nのい
ずれか)を読み出し、また、ゲインテーブル205も同
様に初期的には所定のいずれかのゲイン情報gj(j=
1〜Mのいずれか)を読み出して乗算器204に与える
ので、乗算器204によってこれらの乗算が行われて、
乗算結果信号Cgijが合成フィルタ206に与えられ
る。
【0059】乗算結果信号Cgijと、逆量子化値aq
とによって合成フィルタ206によってデジタルフィル
タリング処理されて、合成音声信号Sijが求められ、
減算器207に与えられる。合成音声信号Sijと入力
原音声信号Soとの差分が減算器207で求められ、差
分信号eijは聴覚重み付けフィルタ208に与えられ
る。
【0060】差分信号eijは聴覚重み付けフィルタ2
08で、聴覚特性に応じた重み付け処理が施こされて、
聴覚重み付け信号wijが2乗誤差計算回路209に与
えられる。聴覚重み付け信号wijは、2乗誤差計算回
路209で、信号の各成分に対する2乗和信号Eijが
求められて、この2乗和信号Eijの値が、最小となる
i、jの組み合わせが探索されて、最小組み合わせi、
jが最適インデックスi、jとし、この最適インデック
スiが駆動音源符号帳203に与えられ、他方の最適イ
ンデックスjがゲインテーブル205に与えられ、両方
の最適インデックスi、jが多重化回路212に与えら
れるものである。モード符号情報Mと量子化符号情報L
と、最適インデックスi、jとが多重化されてトータル
コード信号Wが形成されてトータルコード出力端子21
3に出力されるのである。
【0061】このような構成で、図1の声道予測係数符
号回路を音声符号化装置に適用して、音声信号を効率的
に符号化することができるのである。
【0062】(音声復号化装置): 図5は上述の声
道予測係数復号化回路を音声復号化装置に適用した場合
の機能構成図である。この図5において、音声復号化装
置は、多重分離回路214と、駆動音源符号帳203
と、乗算器204と、ゲインテーブル205と、合成フ
ィルタ215と、モード判定逆量子化部216と、声道
予測係数逆変換部217とから構成されている。図3、
図4と同じ機能構成部分には、同じ符号を付している。
【0063】(動作): トータルコード信号Wが多
重分離回路214に与えられると、多重分離してモード
符号情報Mと量子化符号情報Lとがモード判定逆量子化
部216に与えられる。これによってモード判定逆量子
化部216では、各サブフレームフレームのLSP係数
LspU1、LspU2、LspU3、LspU4が上
述の方法で計算され、声道予測係数逆変換部217に与
えられる。LSP係数LspU1〜LspU4は、声道
予測係数逆変換部217で声道予測係数aq1〜aq4
に変換され、合成フィルタ215に与えられる。
【0064】また、多重分離された最適インデックスj
は、ゲインテーブル205に与えられ、これによってゲ
イン情報が出力されて乗算器204に与えられる。更
に、多重分離された最適インデックスiは駆動音源符号
帳203に与えられて、対応する駆動音源信号が出力さ
れ、乗算器204に与えられる。この駆動音源信号とゲ
イン情報とは乗算されて、合成フィルタ215に与えら
れる。
【0065】合成フィルタ215では、声道予測係数a
q1〜aq4と乗算器204からの乗算結果とから音声
合成を行って、再生音声信号を出力するのである。
【0066】このような構成を採ることで、図3の声道
予測係数復号化回路を音声復号化装置に適用して、効率
的に音声信号に復号することができる。
【0067】(本発明の実施の形態の効果): 以上の
本発明の実施の形態の声道予測係数符号化回路、声道予
測係数復号化回路、音声符号化装置及び音声復号化装置
によれば、フレーム内声道情報の変動が大きい場合には
量子化値を用い、変動が小さい場合には補間値を用いる
ことにより、平均符号化レートをそれほど増加させるこ
となく声道情報の変化に追従でき、音声符号化・復号化
装置に適用した場合に高品質で忠実に再生音声信号を得
ることができる。
【0068】(他の実施の形態): (1)尚、以上
の実施の形態においては、符号化モードを図2に示すよ
うに3のモードを設定したが、1フレームを4サブフレ
ームから構成するものとすると、モードは最大4!(=
24)通り作成できるが、伝送符号化量も多くなるの
で、最適なモード種類を設定することが好ましい。
【0069】(2)また、図4においては、フォワード
型の音声符号化装置の構成を示したが、本発明はAbS
法を適用するバックワード型の音声符号化装置の構成に
も容易に適用することができる。即ち、図4において、
バックワード型の構成で適用する場合は、声道分析部2
01に原音声信号を与えず、代わりに合成フィルタ20
6で生成した合成音声ベクトル信号Sijを声道分析部
201に与えることで実現することができる。VSEL
P、LD−CELP、CS−CELP、PSI−CEL
Pなどにも適用することができる。
【0070】(3)更に、駆動音源符号帳203は、具
体的には、例えば、適応符号コードや、統計符号コード
や、雑音性符号コードなどから構成することが好まし
い。
【0071】(4)更にまた、受信側の復号化装置の構
成としては、図5の構成の他、例えば、特開平5−73
099号公報、特開平6−130995号公報、特開平
6−130998号公報、特開平7−134600号公
報、特開平6−130996号公報などに開示されてい
る復号化装置の構成を若干修正することで適用すること
ができる。
【0072】
【発明の効果】以上述べた様に本発明は、声道予測係数
符号化回路が、入力フレーム音声信号からいくつかのサ
ブフレームに対する声道予測係数を求める声道予測係数
生成手段と、上記各サブフレーム単位の声道予測係数か
ら各LSP係数を求め、これらのLSP係数をそれぞ量
子化した各LSP係数量子化値を出力するLSP係数量
子化手段と、上記各LSP係数量子化値から、フレーム
内の声道予測係数の変動状態を分析し、この分析結果か
ら、予め備えられている声道予測係数の量子化・補間の
モードのいずれを表すか否か判定する量子化・補間モー
ド判定処理部の判定処理に従って、量子化・補間モード
情報と、いずれのサブフレームのLSP係数量子化値を
伝送するかを表すLSP係数量子化値情報とを生成出力
する符号化モード判定手段とを備える。そして、上記声
道予測係数復号化回路は、予め上記量子化・補間モード
判定処理部を備えていて、上記量子化・補間モード情報
とLSP係数量子化値情報とからフレーム内の全サブフ
レームのLSP係数を再生するLSP係数再生手段と、
上記全サブフレームのLSP係数から対応する全サブフ
レームの声道予測係数を再生する声道予測係数再生手段
とを備えるものである。
【0073】このような構成を採ることで、声道予測係
数が大きく変動しても、平均的な符号化レートを余り増
加させることなく高い品質で忠実に再生音声を出力する
ことができる声道予測係数符号化・復号化回路、声道予
測係数符号化回路、声道予測係数復号化回路、音声符号
化装置及び音声復号化装置を実現することができるので
ある。
【図面の簡単な説明】
【図1】本発明の実施の形態の声道予測係数符号化回路
の機能構成図である。
【図2】本発明の実施の形態の符号化モードの説明図で
ある。
【図3】本発明の実施の形態の声道予測係数復号化回路
の機能構成図である。
【図4】本発明の実施の形態の音声符号化装置の機能構
成図である。
【図5】本発明の実施の形態の音声復号化装置の機能構
成図である。
【符号の説明】
200…原音声入力端子、201…声道分析部、202
…声道予測係数変換・量子化部、210…符号化モード
判定部、216…モード判定逆量子化部、217…声道
予測係数逆変換部。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力フレーム音声信号から声道予測係数
    を求めて、これを符号化する声道予測係数符号化回路
    と、この声道予測係数符号化回路からの符号化信号から
    声道予測係数を再生する声道予測係数復号化回路とから
    なる声道予測係数符号化・復号化回路であって、 上記声道予測係数符号化回路は、 上記入力フレーム音声信号からいくつかのサブフレーム
    に対する声道予測係数を求める声道予測係数生成手段
    と、 上記サブフレーム単位の声道予測係数から各LSP係数
    を求め、これらのLSP係数をそれぞれ量子化した各L
    SP係数量子化値を出力するLSP係数量子化手段と、 上記各LSP係数量子化値からフレーム内の声道予測係
    数の変動状態を分析し、この分析結果から、予め備えら
    れている声道予測係数の量子化・補間のモードのいずれ
    を表すか否かを判定する量子化・補間モード判定処理部
    の判定処理に従って、量子化・補間モード情報と、いず
    れのサブフレームの上記LSP係数量子化値を伝送する
    かを表すLSP係数量子化値情報とを生成出力する符号
    化モード判定手段とを備え、 上記声道予測係数復号化回路は、 予め上記量子化・補間モード判定処理部を備えていて、
    上記量子化・補間モード情報とLSP係数量子化値情報
    とからフレーム内の全サブフレームのLSP係数を再生
    するLSP係数再生手段と、 上記全サブフレームのLSP係数から対応する全サブフ
    レームの声道予測係数を再生する声道予測係数再生手段
    とを備えることを特徴とする声道予測係数符号化・復号
    化回路。
  2. 【請求項2】 入力フレーム音声信号からいくつかのサ
    ブフレームに対する声道予測係数を求める声道予測係数
    生成手段と、 上記各サブフレーム単位の声道予測係数から各LSP係
    数を求め、これらのLSP係数をそれぞれ量子化した各
    LSP係数量子化値を出力するLSP係数量子化手段
    と、 上記各LSP係数量子化値から、フレーム内の声道予測
    係数の変動状態を分析し、この分析結果から、予め備え
    られている声道予測係数の量子化・補間のモードのいず
    れを表すか否かを判定する量子化・補間モード判定処理
    部の判定処理に従って、量子化・補間モード情報と、い
    ずれのサブフレームの上記LSP係数量子化値を伝送す
    るかを表すLSP係数量子化値情報とを生成出力する符
    号化モード判定手段とを備えることを特徴とする声道予
    測係数符号化回路。
  3. 【請求項3】 上記符号化モード判定手段の上記フレー
    ム内の声道予測係数の変動状態の分析は、前フレームの
    いずれか一つのサブフレームのLSP係数量子化値と、
    現フレームの同じサブフレームのLSP係数量子化値と
    から、これらのサブフレーム間の補間値を求め、この補
    間値と実際に求めた上記各サブフレームのLSP係数量
    子化値との差分値を求め、この差分値が所定閾値以内で
    あれば、変動量が少ないものとして、上記分析結果を出
    力することを特徴とする請求項2記載の声道予測係数符
    号化回路。
  4. 【請求項4】 上記量子化・補間モード判定処理部は、
    声道予測係数の変動量が大きいときは、各サブフレーム
    に対するLSP係数量子化値を優勢的に使用選択するた
    めの上記量子化・補間モード情報を出力し、声道予測係
    数の変動量が小さいときは、各サブフレームに対する補
    間値を優勢的に使用選択するための上記量子化・補間モ
    ード情報を出力することを特徴とする請求項2又は3記
    載の声道予測係数符号化回路。
  5. 【請求項5】 請求項2〜4のいずれかに記載の声道予
    測係数符号化回路からの量子化・補間モード情報と、L
    SP係数量子化値情報とから声道予測係数を再生する声
    道予測係数復号化回路であって、 予め上記量子化・補間モード判定処理部を備えていて、
    上記量子化・補間モード情報とLSP係数量子化値情報
    とからフレーム内の全サブフレームのLSP係数を再生
    するLSP係数再生手段と、 上記全サブフレームの上記LSP係数から対応する全サ
    ブフレームの声道予測係数を再生する声道予測係数再生
    手段とを備えたことを特徴とする声道予測係数復号化回
    路。
  6. 【請求項6】 請求項2〜4のいずれかに記載の声道予
    測係数符号化回路を備える音声符号化装置であって、 上記声道予測係数生成手段は、入力音声信号又は局部再
    生の合成音声信号からサブフレーム単位で声道予測係数
    を求め、 駆動音源符号帳にインデックス対応で格納されている符
    号コードと、上記声道予測係数とを用いて、合成音声信
    号を得る音声合成手段と、 この合成音声信号と上記入力音声信号との比較を行って
    差分信号を出力する比較手段と、 この差分信号に対して聴覚重み付けを行って聴覚重み付
    け信号を得る聴覚重み付け手段と、 上記聴覚重み付け信号から上記駆動音源符号帳用の最適
    インデックス情報を選定して、上記駆動音源符号帳に与
    える符号帳インデックス選定手段とを備えて、 上記量子化・補間モード情報と、いずれのサブフレーム
    のLSP係数量子化値を伝送するかを表す上記LSP係
    数量子化値情報と、上記最適インデックス情報とを出力
    することを特徴とする音声符号化装置。
  7. 【請求項7】 請求項6記載の音声符号化装置からの情
    報を受信し、請求項5記載の声道予測係数復号化回路を
    備えて音声信号を再生出力する音声復号化装置であっ
    て、 上記最適インデックス情報から最適駆動音源信号を出力
    する駆動音源符号帳と、 上記最適駆動音源信号と上記声道予測係数再生手段で再
    生した声道予測係数とから音声合成を行い、音声信号を
    再生出力する合成フィルタとを備えたことを特徴とする
    音声復号化装置。
JP7312548A 1995-11-30 1995-11-30 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 Pending JPH09152896A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7312548A JPH09152896A (ja) 1995-11-30 1995-11-30 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
US08/738,779 US5826221A (en) 1995-11-30 1996-10-29 Vocal tract prediction coefficient coding and decoding circuitry capable of adaptively selecting quantized values and interpolation values

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7312548A JPH09152896A (ja) 1995-11-30 1995-11-30 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置

Publications (1)

Publication Number Publication Date
JPH09152896A true JPH09152896A (ja) 1997-06-10

Family

ID=18030546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7312548A Pending JPH09152896A (ja) 1995-11-30 1995-11-30 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置

Country Status (2)

Country Link
US (1) US5826221A (ja)
JP (1) JPH09152896A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188598A (ja) * 1999-12-24 2001-07-10 Korea Electronics Telecommun 線スペクトルペアー量子化器の高速探索方法
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
WO2010035438A1 (ja) * 2008-09-26 2010-04-01 パナソニック株式会社 音声分析装置および音声分析方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000509847A (ja) * 1997-02-10 2000-08-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号を伝送する伝送システム
US6094629A (en) * 1998-07-13 2000-07-25 Lockheed Martin Corp. Speech coding system and method including spectral quantizer
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US6510407B1 (en) 1999-10-19 2003-01-21 Atmel Corporation Method and apparatus for variable rate coding of speech
US7110947B2 (en) * 1999-12-10 2006-09-19 At&T Corp. Frame erasure concealment technique for a bitstream-based feature extractor
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
JP2008170488A (ja) * 2007-01-06 2008-07-24 Yamaha Corp 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法
US9679575B2 (en) 2011-12-22 2017-06-13 Intel Corporation Reproduce a voice for a speaker based on vocal tract sensing using ultra wide band radar
US9336789B2 (en) 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69233502T2 (de) * 1991-06-11 2006-02-23 Qualcomm, Inc., San Diego Vocoder mit veränderlicher Bitrate
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
JP3073283B2 (ja) * 1991-09-17 2000-08-07 沖電気工業株式会社 励振コードベクトル出力回路
US5448680A (en) * 1992-02-12 1995-09-05 The United States Of America As Represented By The Secretary Of The Navy Voice communication processing system
JPH06130995A (ja) * 1992-10-16 1994-05-13 Oki Electric Ind Co Ltd 統計コードブック及びその作成方法
JPH06130998A (ja) * 1992-10-22 1994-05-13 Oki Electric Ind Co Ltd 圧縮音声復号化装置
JP3400025B2 (ja) * 1993-06-30 2003-04-28 株式会社東芝 高耐圧半導体素子
JP3262652B2 (ja) * 1993-11-10 2002-03-04 沖電気工業株式会社 音声符号化装置及び音声復号化装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188598A (ja) * 1999-12-24 2001-07-10 Korea Electronics Telecommun 線スペクトルペアー量子化器の高速探索方法
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US7167828B2 (en) 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
US7577567B2 (en) 2000-01-11 2009-08-18 Panasonic Corporation Multimode speech coding apparatus and decoding apparatus
WO2010035438A1 (ja) * 2008-09-26 2010-04-01 パナソニック株式会社 音声分析装置および音声分析方法
JP4490507B2 (ja) * 2008-09-26 2010-06-30 パナソニック株式会社 音声分析装置および音声分析方法
JPWO2010035438A1 (ja) * 2008-09-26 2012-02-16 パナソニック株式会社 音声分析装置および音声分析方法
US8370153B2 (en) 2008-09-26 2013-02-05 Panasonic Corporation Speech analyzer and speech analysis method

Also Published As

Publication number Publication date
US5826221A (en) 1998-10-20

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP2940005B2 (ja) 音声符号化装置
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP2903533B2 (ja) 音声符号化方式
JP3266178B2 (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3248215B2 (ja) 音声符号化装置
JPH09319398A (ja) 信号符号化装置
JPH0944195A (ja) 音声符号化装置
JP3050978B2 (ja) 音声符号化方法
JP3003531B2 (ja) 音声符号化装置
JP3481027B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3153075B2 (ja) 音声符号化装置
JPH08234795A (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3192051B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JPH0786952A (ja) 音声の予測符号化方法
JP2946528B2 (ja) 音声符号化復号化方法及びその装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040106