JP3515853B2 - 音声符号/復号化方式及び装置 - Google Patents

音声符号/復号化方式及び装置

Info

Publication number
JP3515853B2
JP3515853B2 JP08061896A JP8061896A JP3515853B2 JP 3515853 B2 JP3515853 B2 JP 3515853B2 JP 08061896 A JP08061896 A JP 08061896A JP 8061896 A JP8061896 A JP 8061896A JP 3515853 B2 JP3515853 B2 JP 3515853B2
Authority
JP
Japan
Prior art keywords
filter
synthesis
decoding
speech
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP08061896A
Other languages
English (en)
Other versions
JPH09244698A (ja
Inventor
聖 今井
隆夫 小林
恵一 徳田
和人 小石田
祐行 古川
Original Assignee
聖 今井
隆夫 小林
恵一 徳田
和人 小石田
東洋通信機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 聖 今井, 隆夫 小林, 恵一 徳田, 和人 小石田, 東洋通信機株式会社 filed Critical 聖 今井
Priority to JP08061896A priority Critical patent/JP3515853B2/ja
Publication of JPH09244698A publication Critical patent/JPH09244698A/ja
Application granted granted Critical
Publication of JP3515853B2 publication Critical patent/JP3515853B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声符号/復号化シ
ステムに関し、特にメル一般化ケプストラムを用いた音
声符号/復号化方式及び装置に関する。尚、この明細書
において「音声符号/復号化」とは、音声符号化、音声
復号化、および音声符号復号化を含む概念である。
【0002】
【従来の技術】従来、音声符号化方式においては、励振
源モデル(音源モデル)、音声モデル(声道モデル)の
2つの主な要素からなる音声生成モデルを採用し、音声
を符号化している。このような音声生成モデルを使用
し、主観的な音声品質を向上させる場合には、符号化、
復号化によって発生する量子化雑音のスペクトル形状と
音声信号のスペクトル形状とをコントロ−ルして主観性
能を向上させる、「ノイズシェ−ピング(又は聴覚重み
付け)」や「ポストフィルタリング」等の処理を行うの
が一般的であり、これらの処理は聴覚のマスキング特性
を考慮して主観性能を向上させるものである。「ノイズ
シェ−ピング」処理は、音声スペクトルのエネルギ−が
小さな部分では量子化雑音のエネルギ−を小さくし、ま
た音声スペクトルのエネルギ−が大きな部分では大きく
なるように量子化雑音のエネルギ−を周波数軸上でコン
トロ−ルする方法である。
【0003】また「ポストフィルタリング」処理は、復
号化された音声信号に対する操作であり、相対的にSN
比が小さくなる音声スペクトルの谷の部分のエネルギ−
を小さく、また相対的にSN比が大きい音声スペクトル
の山の部分を強調するようにフィルタリングを行う方法
であり、上記いずれの処理も聴覚的な雑音感を低減させ
る上で効果を有する。上述した従来の音声符号/復号化
方式では、線形予測法に基づいた全極形の音声スペクト
ルモデルが多く用いられており、前述した「ノイズシェ
−ピング」、「ポストフィルタリング」等の処理も線形
予測法によって得られた全極形のスペクトルに基づいて
行われることが多い。図15に入力音声から線形予測分
析法によってスペクトル包絡に対応する線形予測係数を
抽出し、これを符号帳に蓄えた励振ベクトルで駆動する
ことで音声を合成する符号化方式を用いたCELP符号
化方式の構成を示す。同図において、1は合成フィル
タ、2は聴覚重み付けフィルタ、3は適応符号帳、4は
雑音符号帳、5は誤差最小化であり、前記合成フィルタ
1は線形予測係数a(m)を用いて、
【0004】
【数1】 で定義され、また聴覚重み付けフィルタ2は、
【0005】
【数2】 で定義される。
【0006】前記適応符号帳3は、音声の周期性を表現
するために用いられ、過去の励振源が蓄えられている。
また、雑音符号帳4は、適応符号帳では表現しきれない
音声の変動部分の表現に用いられ、各符号帳3及び4の
ベクトルは、合成による分析(Analysis by Synthesis
(A-b-S)) 法による閉ル−プ探索により決定され、適応
符号帳3、雑音符号帳4の順に探索が行われた後、ゲイ
ンをベクトル量子化で決定する。すなわち、適応符号帳
3及び雑音符号帳4よりのベクトルを合成フィルタ1に
入力すると共に、該合成フィルタ1出力と入力音声との
差を求め、さらに誤差のデ−タを聴覚重み付けフィルタ
2に入力し、該聴覚重み付けフィルタ2の出力が最小と
なるように誤差最小化5により適応符号帳3、雑音符号
帳4の出力を更新するものである。一方、復号器は図1
6に示すように、合成フィルタ1、適応符号帳3、雑音
符号帳4及びポストフィルタ6とからなり、伝送されて
くる情報から、励振源で合成フィルタ1を駆動し、さら
にポストフィルタ6を通すことで聴覚的な雑音の低減を
図る。ここで、ポストフィルタ6は一般に、
【0007】
【数3】 の如き伝達関数をもち、A(z/δ1)/A(z/δ
2)でホルマントの強調を行い、(1−μz-1)でスペ
クトルの傾きを補正している。
【0008】
【発明が解決しようとする課題】このような線形予測に
よるCELP符号化方式は、(1)少ない演算量でスペ
クトルの表現パラメ−タが求まる、(2)LSP(Line
Spectrum Pair)表現等を用いることにより効果的にパ
ラメ−タを量子化することができる、(3)LSP(Li
ne Spectrum Pair) 表現等を用いることにより合成フィ
ルタの安定性を保証することができる、等の利点があ
る。しかし、全極モデルで音声スペクトルを表現した場
合には鼻音等の零点を含んだ音声スペクトルを正確に表
現することは極めて困難であり、高品質な合成音声を得
ることができないという欠点があった。そこで主観性能
を向上させるための操作をより効果的に行うためにはス
ペクトルの極だけでなく、零点を表現することのできる
スペクトルモデルを用いることが必要と考えられ、この
問題を解決するために、本願発明者らは、信学技報SP94
-38(1994-09)に開示したように、スペクトルの極と零と
を同等の精度で表現することができるメルケプストラム
をパラメ−タとするCELP符号化方式を提案してい
る。また、メルケプストラムを用いた場合、低周波数域
で細かい分解能、高周波数域で粗い分解能をもつ人間の
周波数軸の聴覚特性を考慮できるという利点を有する。
【0009】しかしながら、上述したようなスペクトル
の零点を表現することのできるスペクトルモデルを用い
た音声合成では、スペクトルの極と零とを同等の精度で
表現することはできるものの、より精密に人間の聴覚特
性を反映した合成音声を得ることができない。つまり、
鼻音などの音韻性は、スペクトルの零点によって特徴づ
けられるため、零点を表現する必要はあるが、人間の聴
覚特性は、零点(スペクトルの谷)よりも極(スペクト
ルの山)に敏感であるため、極の表現精度を零の表現精
度より高めにすることにより、より人間の聴覚特性にあ
ったスペクトル表現が可能となる。しかしながら、メル
ケプストラムを用いてスペクトルを表現した場合、周波
数軸に人間の聴覚特性を導入できるものの、スペクトル
の極と零との表現精度に重み付を行うことができないた
め音質の向上に限界があるという問題点があった。
【0010】
【数4】 本発明は上記課題解決するためになされたものであっ
て、精密に音声スペクトルを表現しながら人間の聴覚特
性を考慮することのできるメル一般化ケプストラムによ
るスペクトル表現を用いることにより、高い主観音声品
質を得ることができる音声符号/復号化方式及びその装
置を提供することを目的とする。
【0011】
【課題を解決するための手段】上記課題を解決するた
め、本発明に係る音声符号/復号化方式は音声スペクト
ルの表現パラメ−タとして、メル一般化ケプストラムを
用いることを特徴とする。また上記音声符号/復号化方
式を実現する音声符号/復号化装置は、CELP、AD
PCM、MBEを始めとして何らかの音声スペクトル表
現を用いた音声符号/復号化方式を実施する音声符号/
復号化装置において、音声スペクトルの表現に関する部
分(音声のスペクトル解析部、合成フィルタ、ノイズシ
ェ−ピングフィルタ、ポストフィルタ、スペクトルパラ
メ−タ量子化部など)を、メル一般化ケプストラムによ
るものにそれぞれ置き換えた構成をとることを特徴とす
る。
【0012】
【発明の実施の形態】以下、本発明を図面に示した実施
形態例に基づいて詳細に説明する。尚、本発明に係る音
声符号/復号化方式はADPCM(Adaptive Pulse Cod
e Modulation)、APC(Adaptive Predictive Coding)、
CELP(Code Excited Linear Prediction)、MBE
(MultiBand Excitation Vocoder)、ATC(Adaptive T
ransformation Coding) など、音声のスペクトル表現を
用いる各音声符号/復号化方式に適用することができる
が、ここではCELP符号化方式に適用した例を挙げて
説明する。 (メル一般化ケプストラム分析)本願発明に係る音声符
号方式では線形予測法によって推定された全極スペクト
ル1/A(exp(jω))にかえて、メル一般化ケプ
ストラム分析によって推定されたスペクトルを用いるも
のである。メル一般化ケプストラム分析によって推定さ
れたスペクトルはM次までのメル一般化ケプストラム係
数c=[c(0),...c(M)]Tによって、
【0013】
【数5】 と表される。ただし、
【0014】
【数6】
【0015】
【数7】
【0016】
【数8】 である。
【0017】この分析によって得られたH(z)は必ず
安定となることが保証されており、1次のオ−ルパス関
数Z*-1 =exp(−jω)の位相特性ω* は、標本化
周波数8kHzのときαを0.31に選べば、人間の音
の高さに対する聴覚特性を表すメル尺度をよく近似する
ことが知られている。上記[数5]のスペクトルモデル
は、(α、γ)=(0、−1)で全極モデル、(α、
γ)=(0、0)でケプストラムモデル、また|α|<
1、γ=0とすればメルケプストラムモデルと等価とな
る。またa、γの値により、スペクトルモデルを連続的
に変化させることが可能である。尚、αとγの値による
スペクトルモデルの特徴は次のようにまとめられる。ま
ずαについては、α=0の場合、均一的な周波数分解能
となり、α>0の場合、低周波数域で高い分解能とな
る。またγについては、γ=−1の場合、スペクトルの
極を重視したものとなり、−1<γ<0の場合、γ=−
1とγ=0との中間的な性質を有し、γ=0の場合、ス
ペクトルの極と零を同等に表現したものとなる。
【0018】(合成フィルタの構成)次に合成フィルタ
の構成について説明する。前述したように、分析によっ
て得られる伝達関数H(z)は必ず安定となり、そのス
ペクトルはα、γの値によって連続的に変化するので、
任意のα、γに対する合成フィルタが実現できれば、最
も好ましい合成音が得られるγの値を選択することがで
きる。ここで、メル一般化ケプストラムは各係数値がゲ
インの変化により全体的に変化してしまい取り扱いが容
易でないことから、H(z)からゲインをくくり出し、
ゲインに依存しないパラメ−タによりH(z)を表現す
ることを考える。ゲインをKとして、[数5]を、
【0019】
【数9】 と変形する。ただし、
【0020】
【数10】
【0021】
【数11】 また、
【0022】
【数12】
【0023】
【数13】 である。フィルタD(z)のゲインは常に1となること
から、D(z)のメル一般化ケプストラム係数c’は、
【0024】
【数14】 を満足する。これは、
【0025】
【数15】 と等価である。このとき、c’とcとには、
【0026】
【数16】 の関係が成立する。[数11]は、γ=0のときにはM
LSA(Mel Log Spectrum Approximation) フィルタ、
それ以外のγに対してはMGLSA(Mel Generalized
Log Spectrum Approximation) フィルタとして、高い近
似精度で実現可能である。特に、nを自然数として、γ
=−1/nの場合のみを考えると、合成フィルタD
(z)は、
【0027】
【数17】 ただし、
【0028】
【数18】 と表すことができるから、1/C’(z* )のn段接続
となる。しかし、C’(z* )はディレ−フリ−ル−プ
を持つために、直接実現することはできない。そこで
C’(z* )を、
【0029】
【数19】 ただし、
【0030】
【数20】
【0031】
【数21】
【0032】
【数22】
【0033】
【数23】
【0034】
【数24】
【0035】
【数25】
【0036】
【数26】 のように変形する。また、[数19]の右辺第2行目か
ら第3行目への変形は、[数15]で与えられる
【0037】
【数27】 という関係を用いた。[数25]のA-1c’の計算は、
次の関係式
【0038】
【数28】 により、再帰的に計算することができる。ここで、フィ
ルタB(z* )を
【0039】
【数29】 とおけば、図1で示されるように1/B(z* )のn段
接続という簡単な構造で実現される。また、音声分析、
音声合成、音声認識などでは、[数29]におけるγ=
−1/3で良い結果が得られていることから、メル一般
化ケプストラムをCELP符号化方式に導入する場合
も、この値を用いることにする。この場合、合成フィル
タは1/B(z* )の3段縦続構成となる。尚、各段の
基本合成フィルタ1/B(z* )は図2に示すブロック
構成となる。
【0040】(聴覚重み付けフィルタ、ポストフィルタ
の構成) 線形予測法に基づく合成フィルタ[数36]、
【0041】
【数30】 聴覚重み付けフィルタ、[数31]、
【0042】
【数31】 ポストフィルタ、[数32]、
【0043】
【数32】 をメル一般化ケプストラム符号系に適用するために[数
33]のように単純に置換しただけでは、
【0044】
【数33】 合成フィルタ、[数34]、
【0045】
【数34】 聴覚重み付けフィルタ、[数35]、
【0046】
【数35】 ポストフィルタ、[数36]、
【0047】
【数36】 となり、メル一般化ケプストラム符号系はかなり複雑な
ものとなってしまうが、これを合成フィルタ、[数3
7]、
【0048】
【数37】 聴覚重み付けフィルタ、[数38]、
【0049】
【数38】 ポストフィルタ、[数39]、
【0050】
【数39】 とすることにより、非常に簡単に簡単なフィルタ構造の
符号化系を構成することが可能となる。
【0051】(メル一般化ケプストラム分析によるCE
LP方式)次に、上述したようなメル一般化ケプストラ
ム分析方と該分析法によって得られたパラメ−タより求
めたフィルタ係数で駆動に基づいて構成された合成フィ
ルタ、聴覚重み付けフィルタ及びポストフィルタををC
ELPに適用した例を図面に示した形態例に基づいて説
明する。図3はメル一般化ケプストラム分析によるCE
LP符号化を実現した場合のCELP符号器の基本構成
を示した図であり、また、図4はメル一般化ケプストラ
ムによるCELP復号器の基本構成を示した図である。
ここで、聴覚重み付けフィルタ2、ポストフィルタ6
は、それぞれB(z* )、1/B(z* )を用いて実現
する。これにより、スペクトルの極及び零を人間の聴覚
特性を考慮した形で表現できると共に、簡単な構成の合
成フィルタで音声合成を達成することができるのみなら
ず、メル一般化ケプストラム分析を用いて聴覚重み付け
フィルタや、ポストフィルタのフィルタ係数を上記のよ
うに選定したため、より高品質な音声合成が可能とな
る。
【0052】図5(a)は本発明に係る音声符号/復号
化方式における聴覚重み付けとポストフィルタリングの
様子を示す図であり、図5(b)は本発明と従来法との
比較のため、線形予測法(LPC)を用いた音声符号/
復号化方式における聴覚重み付けとポストフィルタリン
グの様子を示す図である。尚、線形予測法の重み付けフ
ィルタとポストフィルタには、それぞれ[数2]、[数
3]を用い、各パラメ−タは(δ1、δ2)=(0.
9、0.4)、(δ3、δ4)=(0.5、0.8)、
μ=0.5とした。図5(a)に示すメル一般化ケプス
トラム分析によって推定される音声スペクトルと、図5
(b)に示す線形予測法によるものとを比較すると明ら
かなように、スペクトルの極だけでなく零も表現され、
特に低周波数域での分解能が高くなっていることが分か
る。また、本発明に係る符号化系の聴覚重み付けとポス
トフィルタリングの処理がメル一般化ケプストラムを介
して行われるため、推定されたスペクトルの情報がよく
保存されており、聴覚的な性能向上が期待できる。
【0053】しかし、図3、4に示した構成では、聴覚
重み付けフィルタやポストフィルタの係数がB(z*
或いは1/B(z* )であり、特に聴覚重み付けフィル
タには変数が存在しないため聴覚重み付けの強さを調整
することができない。また、ポストフィルタには傾き補
正係数μが存在するが、この係数ではポストフィルタリ
ングの強さを調整することができず、したがって、人間
の聴覚特性を考慮した高品質な音声を各フィルタの調整
により得ることができない。そこで、z* 領域の帯域幅
拡張を行うことによって聴覚重み付けやポストフィルタ
リングの強さを調節する方法を以下に示す。
【0054】(z* 領域での帯域幅拡張)z* 領域での
帯域幅拡張は、[数2]、[数3]のA(z/β)のよ
うにz→z/βとするのではなく、z* →z* /βと置
き換えることにより、帯域幅拡張を行うものである。
[数29]のB(z* )、つまりc’(z* )をz*
域で帯域幅拡張したc’(z* /β)は、
【0055】
【数40】 ただし、
【0056】
【数41】 と表すことができる。[数40]を[数19]と同様に
変形していくと、
【0057】
【数42】 ただし、
【0058】
【数43】 となる。一般に、b(0)≠0となり、c* (z*
β)のゲインは1とならないので、[数42]からゲイ
ンをくくり出すと、
【0059】
【数44】 ただし、
【0060】
【数45】
【0061】
【数46】 また、
【0062】
【数47】 となり、bとb’との関係は次式で与えられる。
【0063】
【数48】 以上のように、z領域での帯域幅拡張の操作は、c’か
ら[数43]、つまり次の再帰式
【0064】
【数49】 により[数50]を計算し、[数48]を用いて[数5
1]を求める。この係数、[数51]をB(z* )の係
数とすることにより、B(z* )と全く同じ構成で実現
することができる。
【0065】
【数50】
【0066】
【数51】 さらに、[数43]は
【0067】
【数52】 と変形することも可能であり、bから行列A-1FAを介
してb* ’を求めることも可能である。この際、行列A
-1FAの計算も[数49]と同様に、再帰的に行うこと
ができる。聴覚重み付けとポストフィルタリングは、フ
ィルタB(z* )、1/B(z*)、B(z* /β)、
1/B(z* /β)を組み合わせることにより、その強
さと形状を調節することができ、その一例を図6、図7
に示す。
【0068】図6は聴覚重み付けフィルタの構成の一
例、図7はポストフィルタの構成の一例を示したもので
あり、これらのフィルタによる聴覚重み付けの様子を図
8(a)乃至(d)に示し、またポストフィルタリング
のスペクトルの様子を図9(a)乃至(d)に示す。図
9に示したポストフィルタリングのスペクトルの様子で
は、傾き補正係数を(a)から(d)まで、それぞれμ
=0.5、0.4、0.3、0.2とした。また、図8
(a)及び図9(a)の各スペクトルは、図5(a)に
示した重み付けとポストフィルタリングのスペクトルと
等価となる。したがって、図8(a)乃至(d)及び図
9(a)乃至(d)から明らかなように、低周波数域の
分解能を損なうことなく、βを小さくすることで聴覚重
み付けを強く、ポストフィルタリングはβを大きくする
ことで弱めることができる。
【0069】図10はz* 領域の帯域幅拡張を導入した
ときのランニングスペクトルを示した図であり、(a)
は入力音声波形、(b)はメル一般化ケプストラム分析
によるランニングスペクトル、(c)は従来法(LP
C)分析によるランニングスペクトルである。また、
(b)及び(c)のi)、ii)、iii)はそれぞ
れ、入力音声に対する推定されたスペクトル、聴覚重み
付け、ポストフィルタリングによる状態を示す。ただ
し、図の関係上、聴覚重み付けii)はその逆フィルタ
のスペクトルとして描かれている。このランニングスペ
クトルを得るために、各パラメ−タは聴覚重み付けでは
β=0.8、ポストフィルタリングではβ=μ=0.3
とし、また、(c)に示した従来法分析によるランニン
グスペクトルを得るためのパラメ−タは図5(b)と同
じ値を用いた。さらに、(b)、(c)に示されたもの
のうち、聴覚重み付け、ポストフィルタリングのスペク
トルii)及びiii)は推定されたスペクトルi)の
2倍のスケ−ルで描かれている。この図からも明らかな
ように、本発明に係る符号化系の中で表現されるスペク
トルは低周波数域で高い分解能をもつことが分かる。
【0070】図11は本発明に係る音声符号/復号化方
式をCELPに適用した符号化器系の他の実施の形態例
を示す図である。本発明に係る音声符号/復号化方式、
すなわち、メル一般化ケプストラム分析による方式を用
いた場合には符号化器においては聴覚重み付けフィルタ
の位置を変更することにより、図3に示した実施の形態
例と比較して簡単な構成により符号化系全体を構成する
ことができる。また、聴覚重み付けの強さを調整するた
めには、図12に示すような構成とすることにより、合
成フィルタの構成を簡単にすることも可能である。
【0071】
【実施例】以下に上述した実施の形態の例を示す。図1
3(a)は音声の分析条件、同図(b)は符号化系のビ
ット割り当てを示す表である。適応符号帳は、非整数ラ
グを含む8ビット256状態を表現する。雑音符号帳
は、ガウス雑音により構成される。また、符号長の探索
は、適応符号帳、雑音符号帳の順に行われ、雑音符号帳
の探索は、適応符号帳で決定されたベクトルに雑音符号
長の各ベクトルを直交化させてから行った。さらに合成
フィルタの安定性を保証するため、メル一般化ケプスト
ラムはC’(z* )のz* 領域における線スペクトル表
現を用いて行われた。従来法、本発明ともに、以上のよ
うな構成を用い、音声分析とそれに基づくフィルタ以外
の構成は全く同一の条件で、等価Q値を用いた主観評価
実験を行った。
【0072】(客観評価実験の結果)図14に上記評価
実験の結果を示す。同図に示すように、等価Q値で平均
約2.3dBの主観性能の改善を達成している。
【0073】
【発明の効果】本発明は以上説明したように、精密に音
声スペクトルを表現しながら人間の聴覚特性を考慮する
ことのできるメル一般化ケプストラムによるスペクトル
表現を用いることにより、高い主観音声品質を得ること
ができ、音声符号/復号化システムの音声品質を向上す
る上で著しい効果を発揮するものである。
【図面の簡単な説明】
【図1】本発明の一形態例の構成説明図。
【図2】各段の基本合成フィルタの1/B(z* )を示
すブロック図。
【図3】メル一般化ケプストラム分析によるCELP符
号化を実現した場合のCELP符号器の基本構成を示す
図。
【図4】メル一般化ケプストラム分析によるCELP復
号器の基本構成を示す図。
【図5】(a) は本発明に係る音声符号/復号化方式にお
ける聴覚重み付けとポストフィルタリングの様子を示す
図であり、(b) は本発明と従来例との比較図。
【図6】聴覚重み付けフィルタの構成の一例を示す図。
【図7】ポストフィルタの構成の一例を示す図。
【図8】(a) 乃至(d) はフィルタによる聴覚重み付けの
様子を示す図。
【図9】(a) 乃至(d) はポストフィルタリングのスペク
トルの様子を示す図。
【図10】z* 領域の帯域幅拡張を導入したときのラン
ニングスペクトルを示した図であり、(a) は入力音声波
形、(b) はメル一般化ケプストラム分析によるランニン
グスペクトル、(c) は従来法(LPC)分析によるラン
ニングスペクトルである。
【図11】本発明に係る音声符号/復号化方式をCEL
Pに適用した符号化器系の他の実施の形態例を示す図で
ある。
【図12】聴覚重み付けの強さを調整するための構成例
を示す図である。
【図13】(a) は音声の分析条件、(b) は符号化系のビ
ット割り当てを示す図。
【図14】評価実験の結果を示す図。
【図15】入力音声から線形予測分析法によってスペク
トル包絡に対応する線形予測係数を抽出し、これを符号
帳に蓄えた励振ベクトルで駆動することで音声を合成す
る符号化方式を用いたCELP符号化方式の構成を示す
図。
【図16】従来の復号器の構成説明図。
フロントページの続き (73)特許権者 596045638 小石田 和人 神奈川県川崎市中原区苅宿10鈴影荘2− 2 (73)特許権者 000003104 東洋通信機株式会社 神奈川県川崎市幸区塚越三丁目484番地 (72)発明者 今井 聖 東京都町田市玉川学園5−24−3 (72)発明者 小林 隆夫 神奈川県横浜市都筑区南山田1−4−3 −201 (72)発明者 徳田 恵一 東京都町田市成瀬2739−12 リヴェール 西成瀬204 (72)発明者 小石田 和人 神奈川県川崎市中原区苅宿10鈴影荘2− 2 (72)発明者 古川 祐行 神奈川県高座郡寒川町小谷二丁目1番1 号 東洋通信機株式会社内 (56)参考文献 小石田和人、徳田恵一、小林隆夫、今 井聖,メル一般化ケプストラムによる音 声のスペクトル表現とその諸特性,電子 情報通信学会技術研究報告,電子情報通 信学会,1995年 9月,SP95−49,1 −8 小石田和人、徳田恵一、小林隆夫、今 井聖,メルケプストラムをパラメータと するCELP符号化系,電子情報通信学 会技術研究報告,電子情報通信学会, 1994年 9月,SP94−38,15−22 千葉健司、徳田恵一、小林隆夫、今井 聖,メル一般化ケプストラムをパラメー タとする音声合成,1990年電子情報通信 学会春季全国大会講演論文集,電子情報 通信学会,1990年,1−243 小石田和人、徳田恵一、小林隆夫、今 井聖,メル一般化ケプストラムに基づく CELP符号化系とその評価,日本音響 学会講演論文集,日本音響学会,1996年 3月26日,VOL.1996、春季I, 257−258 (58)調査した分野(Int.Cl.7,DB名) G10L 19/04 G10L 19/06

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 符号側に、少なくとも合成フィルタと聴
    覚重み付けフィルタとを備え、復号側に、少なくとも合
    成フィルタとポストフィルタとを備え、べきパラメータ
    γをγ=0若しくはγ=−1以外に設定したメル一般化
    ケプストラムをパラメータとした音声符号/復号化方式
    において、 前記聴覚重み付けフィルタとして1/B(z* /β)を
    含む組合せにより構成するか、或いは、前記ポストフィ
    ルタとしてB(z* /β)を含む組合せにより構成した
    ことを特徴とする音声符号/復号化方式。
  2. 【請求項2】 符号側においては適応符号帳と、雑音符
    号帳と、誤差最小化と、合成フィルタと、聴覚重み付け
    フィルタとを備え、復号側においては適応符号帳と、雑
    音符号帳と、合成フィルタと、ポストフィルタとを備え
    た音声のスペクトル表現にメル一般化ケプストラム分析
    によるパラメータを用いたCELP音声符号/復号化装
    置において、 前記符号及び復号側の合成フィルタは1/B(z* )の
    n段接続により構成すると共に、符号側における聴覚重み付けフィルタはB(z* )、B
    (z* )、1/B(z* /β)の直列接続を含む構成と
    し、 入力された音声信号と前記合成フィルタの出力との差分
    を前記聴覚重み付けフィルタに供給し、 前記聴覚重み付けフィルタの出力から誤差最少化するよ
    うに構成したことを特徴とするCELP音声符号/復号
    化装置。
  3. 【請求項3】 符号側においては適応符号帳と、雑音符
    号帳と、誤差最小化と、合成フィルタと、聴覚重み付け
    フィルタとを備え、復号側においては適応符号帳と、雑
    音符号帳と、合成フィルタと、ポストフィルタとを備え
    た音声のスペクトル表現にメル一般化ケプストラム分析
    によるパラメータを用いたCELP音声符号/復号化装
    置において、 前記符号及び復号側の合成フィルタは1/B(z* )の
    n段接続により構成すると共に、復号側のポストフィルタはB(z* /β)、1/B(z
    * )の直列接続を含む 構成とした ことを特徴とするCE
    LP音声符号/復号化装置。
  4. 【請求項4】 前記請求項2または3に記載のCELP
    音声符号/復号化装置において、 n=3とすることを特徴とするCELP音声符号/復号
    化装置。
  5. 【請求項5】 符号側においては適応符号帳と、雑音符
    号帳と、誤差最小化と、合成フィルタと、聴覚重み付け
    フィルタとを備え、復号側においては適応符号帳と、雑
    音符号帳と、合成フィルタと、ポストフィルタとを備
    え、備えた音声のスペクトル表現にメル一般化ケプスト
    ラム分析によるパラメータを用いたCELP音声符号/
    復号化装置において、 前記符号の合成フィルタは1/B(z* )の2段接続に
    より構成すると共に、 符号側における聴覚重み付けフィルタはB(z* )によ
    る構成とし、 前記合成フィルタと聴覚重み付けフィルタとの出力差を
    誤差最少化するように構成したことを特徴とするCEL
    P音声符号/復号化装置。
  6. 【請求項6】 符号側においては適応符号帳と、雑音符
    号帳と、誤差最小化と、合成フィルタと、聴覚重み付け
    フィルタとを備え、復号側においては適応符号帳と、雑
    音符号帳と、合成フィルタと、ポストフィルタとを備え
    た音声のスペクトル表現にメル一般化ケプストラム分析
    によるパラメータを用いたCELP音声符号/復号化装
    置において、 前記符号及び復号側の合成フィルタは1/B(z* )と
    1/B(z* /β)との直列接続により構成すると共
    に、 符号側における聴覚重み付けフィルタはB(z* )、B
    (z* )、1/B(z* /β)の直列接続を含む構成と
    し、 前記合成フィルタと聴覚重み付けフィルタとの出力差を
    誤差最少化するように構成したことを特徴とするCEL
    P音声符号/復号化装置。
JP08061896A 1996-03-08 1996-03-08 音声符号/復号化方式及び装置 Expired - Lifetime JP3515853B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08061896A JP3515853B2 (ja) 1996-03-08 1996-03-08 音声符号/復号化方式及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08061896A JP3515853B2 (ja) 1996-03-08 1996-03-08 音声符号/復号化方式及び装置

Publications (2)

Publication Number Publication Date
JPH09244698A JPH09244698A (ja) 1997-09-19
JP3515853B2 true JP3515853B2 (ja) 2004-04-05

Family

ID=13723341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08061896A Expired - Lifetime JP3515853B2 (ja) 1996-03-08 1996-03-08 音声符号/復号化方式及び装置

Country Status (1)

Country Link
JP (1) JP3515853B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3351746B2 (ja) * 1997-10-03 2002-12-03 松下電器産業株式会社 オーディオ信号圧縮方法、オーディオ信号圧縮装置、音声信号圧縮方法、音声信号圧縮装置,音声認識方法および音声認識装置
US8239191B2 (en) 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
千葉健司、徳田恵一、小林隆夫、今井聖,メル一般化ケプストラムをパラメータとする音声合成,1990年電子情報通信学会春季全国大会講演論文集,電子情報通信学会,1990年,1−243
小石田和人、徳田恵一、小林隆夫、今井聖,メルケプストラムをパラメータとするCELP符号化系,電子情報通信学会技術研究報告,電子情報通信学会,1994年 9月,SP94−38,15−22
小石田和人、徳田恵一、小林隆夫、今井聖,メル一般化ケプストラムによる音声のスペクトル表現とその諸特性,電子情報通信学会技術研究報告,電子情報通信学会,1995年 9月,SP95−49,1−8
小石田和人、徳田恵一、小林隆夫、今井聖,メル一般化ケプストラムに基づくCELP符号化系とその評価,日本音響学会講演論文集,日本音響学会,1996年 3月26日,VOL.1996、春季I,257−258

Also Published As

Publication number Publication date
JPH09244698A (ja) 1997-09-19

Similar Documents

Publication Publication Date Title
EP1141946B1 (en) Coded enhancement feature for improved performance in coding communication signals
JP4550289B2 (ja) Celp符号変換
US7171355B1 (en) Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
EP0732686B1 (en) Low-delay code-excited linear-predictive coding of wideband speech at 32kbits/sec
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
JP3707116B2 (ja) 音声復号化方法及び装置
JP3680380B2 (ja) 音声符号化方法及び装置
JP3235703B2 (ja) ディジタルフィルタのフィルタ係数決定方法
JP3653826B2 (ja) 音声復号化方法及び装置
JP4879748B2 (ja) 最適化された複合的符号化方法
JPH1091194A (ja) 音声復号化方法及び装置
JPH10124092A (ja) 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
JP3357795B2 (ja) 音声符号化方法および装置
JP3515853B2 (ja) 音声符号/復号化方式及び装置
Schnitzler A 13.0 kbit/s wideband speech codec based on SB-ACELP
Biundo et al. Design techniques for spectral quantization in wideband speech coding
Copperi et al. Vector quantization and perceptual criteria for low-rate coding of speech
US6983241B2 (en) Method and apparatus for performing harmonic noise weighting in digital speech coders
de Silva et al. A modified CELP model with computationally efficient adaptive codebook search
JP3593839B2 (ja) ベクトルサーチ方法
JP3232701B2 (ja) 音声符号化方法
WO2011074233A1 (ja) ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
US5826223A (en) Method for generating random code book of code-excited linear predictive coding
JP3520955B2 (ja) 音響信号符号化法
JP3675054B2 (ja) ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040119

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090123

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090123

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100123

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110123

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110123

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 8

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140123

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term