JPH0764599A - 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置 - Google Patents

線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置

Info

Publication number
JPH0764599A
JPH0764599A JP5209141A JP20914193A JPH0764599A JP H0764599 A JPH0764599 A JP H0764599A JP 5209141 A JP5209141 A JP 5209141A JP 20914193 A JP20914193 A JP 20914193A JP H0764599 A JPH0764599 A JP H0764599A
Authority
JP
Japan
Prior art keywords
vector
line spectrum
spectrum pair
weighting coefficient
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5209141A
Other languages
English (en)
Inventor
Atsuyoshi Ishikawa
敦義 石川
Yoshiaki Asakawa
吉章 淺川
Hidetoshi Sekine
英敏 関根
卓 ▲高▼島
Taku Takashima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5209141A priority Critical patent/JPH0764599A/ja
Publication of JPH0764599A publication Critical patent/JPH0764599A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 LSPパラメータの量子化時に発生するスペ
クトル歪を低減し、ベクトル量子化の精度や音声符号化
装置の性能を向上させる。 【構成】 入力音声信号をフレーム分割して抽出したL
SPパラメータに基づき算出した重み付け係数を用い
て、LSPパラメータとコードブック内のコードベクト
ルとの歪を計算して音声信号の量子化を行なう時に、反
射係数を用いて、例えば、有声音には低周波数領域で、
無声音には高周波数領域で、重み付け係数を強調してス
ペクトル包絡の傾きに対応した補正を行なうことを特徴
とするベクトル量子化、音声符号化、クラスタリング方
法、および、装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声合成技術に係わ
り、特に、分析合成系における線スペクトル対パラメー
タのベクトル量子化の精度を向上させるのに好適な線ス
ペクトル対パラメータのベクトル量子化方法とクラスタ
リング方法および音声符号化方法並びにそれらの装置に
関するものである。
【0002】
【従来の技術】従来、少ない情報量で音声を合成するた
めの数々の音声符号化技術が提案されている。音声信号
を 8kbps以下の低いビットレートで符号化する技術とし
ては、CELP(Code Excited Linear Predictive Codi
ng)や、このCELPを改良したVSELP(Vector-sum
Excited Linear Predictive Coding)などが知られてい
る。これらの技術では、送信側で、音声信号を一定区間
(フレーム)に分割して、フレーム毎に音声信号のスペ
クトル特性を表すスペクトルパラメータを抽出し、フレ
ームをさらに小区間(サブフレーム)に分割し、サブフ
レーム毎に音源情報のパラメータ(ピッチパラメータ、
ゲイン、音源コード等)を計算し、スペクトルパラメー
タおよび音源情報のパラメータを量子化して伝送する。
【0003】スペクトルパラメータとしては、通常LP
C(Linear Predictive Coefficient)パラメータや、そ
れに等価なパラメータを量子化するが、例えば、日本の
ディジタル自動車電話システムの標準音声符号化技術で
あるVSELPでは、反射係数のスカラー量子化技術が
用いられており、10次のLPCパラメータを量子化す
るのに1.8kbps程度のビット数が必要である。量子化
するLPCパラメータとしては、線形予測係数をはじ
め、反射係数やPARCOR係数、および、線スペクト
ル対パラメータ(以下、LSPパラメータと呼ぶ、LS
P:Line Spectrum Pair)等があ
る。このLSPパラメータは、周波数領域のパラメータ
であり、量子化特性、補間特性が他のパラメータに比べ
て優れている。LSPパラメータの具体的な計算法は、
管村氏らによる”Quantizer dasign inLSP speach a
nalysis-synthesis"と題した論文(IEEE J.Sel.Areas Co
mmun.,pp.425-431,1988年)等を参照できる。
【0004】LSPパラメータをより効率的に量子化す
る技術としては、ベクトル量子化法やベクトル・スカラ
ー量子化法、多段ベクトル量子化法等が提案されてい
る。LSPパラメータのベクトル量子化法では、まず標
本化した音声波形を一定の時間(フレーム)について切
り出し、その区間においてスペクトル分析を行い、P次
のLSPパラメータを導出する。導出されたP個のLS
Pパラメータを1個のデータと考えれば、上記パラメー
タは、P次元空間の1点または原点からその点までのベ
クトルと考えられ、その区間の情報を1つの符号で表現
できる。即ちLSPパラメータを、各次数の値を要素と
するベクトルとみなすことに相当する。このため、ベク
トルとみなしたLSPパラメータの量子化には、あらか
じめクラスタリングの手法を用いて、符号とスペクトル
情報パターン(代表ベクトル)との対応を表す符号帳
(コードブック)を作製しておく必要がある。このコー
ドブックを用いて、各フレームより算出されるLSPパ
ラメータ(入力ベクトル)と最も類似度の高いコードベ
クトルを算出し、このコードベクトルと対になった符号
を選出する。この選出で用いるベクトル間の類似度の尺
度として、一般に、ユークリッド距離を用いる(距離が
小さい程、類似度が高いとする)。
【0005】例えば、入力ベクトルX、および、コード
ブックのj番目のコードベクトルYjをそれぞれ(x1,x2,
…,xp)、(y1j,y2j,…,ypj)とした時の距離(誤差)、す
なわち歪d(X,Yj)は、ユークリッド距離を用いて、次の
数1式のように記述できる。
【数1】 この歪を最小にするコードベクトルを量子化値として、
このコードベクトルと対をなす符号を得る。また、人間
の聴覚特性を考慮して、この歪に重み付けする技術も提
案されている。例えば、重み付け係数をWh(i)(i=1,
…,p)としたときの歪は、次の数2式となる。
【数2】 この重み付け係数として、LSPパラメータ間の距離を
変数とした技術が提案され、Nam Phamdo氏、Nariman Fa
rvardin氏、守谷氏らによる”多段ベクトル量子化を用
いたLSPパラメータの情報源ー通信路結合符号化”
(信学技報、SP-52,1990年)等を参照できる。この技術
による重みづけ係数は、次の数3式で与えられる。
【数3】 ここでxiはi次のLSPパラメータ値であり、前後の
LSPパラメータ値と接近しているLSPパラメータに
対して歪感度を高めるという意味で、この技術は、ホル
マント部を強調した量子化法と言える。尚、x0=0 Hz、
xp+1は最大周波数(標本化周波数の1/2)に対応させ
る。
【0006】このようなベクトル量子化法では、距離尺
度が最も重要なポイントとなる。即ち、ベクトル量子化
時に用いる距離尺度が、音声の物理的な特性であるスペ
クトル歪と十分対応がとれていることが必要である。例
えば、音声の周波数対応の共振特性は、有声音と無声音
とでその傾きが一般的には逆である。しかし、上述した
ユークリッド距離尺度は、p個のLSPパラメータを全
て2乗誤差で表し、この誤差の総和が最小となるパター
ンが選出される。そのために、LSPパラメータ個々の
量子化誤差がほぼ均一になり、スペクトル歪が増加す
る。また、LSPパラメータ間の距離を変数とする距離
尺度を付加した重み付け距離尺度では、ホルマント部以
外の情報が損なわれる恐れがある。
【0007】
【発明が解決しようとする課題】解決しようとする問題
点は、従来の技術では、LSPパラメータのベクトル量
子化時に用いる距離尺度が、音声の物理的な特性と十分
対応がとれておらず、スペクトル歪が増加してしまう点
と、ホルマント部以外の情報が損なわれる恐れがある点
である。本発明の目的は、これら従来技術の課題を解決
し、スペクトルパラメータをより最適なパターンで量子
化でき、量子化歪を低減し、音声符号化システムの性能
の向上を可能とするLSPパラメータのベクトル量子化
方法とクラスタリング方法および音声符号化方法並びに
それらの装置を提供することである。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、本発明のLSPパラメータのベクトル量子化方法
は、(1)入力した音声信号を予め定められた時間長の
フレームに分割して抽出したLSPパラメータを用いて
重み付け係数を計算し、この重み付け係数を用いて、L
SPパラメータと、予め構成されたベクトル量子化コー
ドブック内のコードベクトルとの距離(歪み)を計算
し、この距離を最小化するコードベクトルの値を、LS
Pパラメータの量子化値として出力するLSPパラメー
タのベクトル量子化方法において、音声信号のスペクト
ル包絡の傾きに対応して、LSPパラメータを用いた重
み付け係数計算の補正を行なうことを特徴とする。ま
た、(2)上記(1)に記載のLSPパラメータのベク
トル量子化方法において、有声音(音声信号のスペクト
ル包絡の傾きが負)に対しては低周波数領域で、無声音
(傾きが正)に対しては高周波数領域でそれぞれ強調補
正を行なうことを特徴とする。また、(3)上記
(1)、もしくは、(2)のいずれかに記載のLSPパ
ラメータのベクトル量子化方法において、重み付け係数
計算の補正を、入力音声信号から算出されるPARCO
R係数もしくは反射係数の1次の項を用いて行なうこと
を特徴とする。また、本発明のLSPパラメータのクラ
スタリング方法は、(4)音声信号を予め定められた時
間長のフレームに分割して、LSPパラメータを抽出
し、予め定められた個数のクラスタに分離するクラスタ
リング方法において、上記(1)から(3)のいずれか
に記載の補正を行なった重み付け係数を用いた距離尺度
を使用して、クラスタに対応したセントロイドとLSP
パラメータの距離を計算し、この距離の値に基づきLS
Pパラメータのクラスタ分離を行なうことを特徴とす
る。また、本発明の音声符号化方法は、(5)上記
(1)から(3)のいずれかに記載の補正を行なうLS
Pパラメータのベクトル量子化方法により、入力された
音声信号のLSPパラメータの量子化値を求め、この量
子化値に対応付けられた符号を出力して、音声信号の符
号化を行なうことを特徴とする。また、本発明のLSP
パラメータのベクトル量子化装置は、(6)入力した音
声信号を予め定められた時間長のフレームに分割して、
LSPパラメータを抽出する第1のスペクトル分析器
と、この第1のスペクトル分析器で抽出したLSPパラ
メータを用いて、重み付け係数を計算する第1の重み付
け係数算出器と、この第1の重み付け係数算出器で計算
した重み付け係数を用いて、LSPパラメータと予め構
成されたベクトル量子化コードブック内のコードベクト
ルとの距離を計算して、この距離を最小化するコードベ
クトルの値をLSPパラメータの量子化値として出力す
るベクトル量子化器とからなるLSPパラメータのベク
トル量子化装置において、第1のスペクトル分析器の代
わりに、LSPパラメータと共に、入力音声信号から反
射係数を求める第2のスペクトル分析器を、また、第1
の重み付け係数算出器の代わりに、第2のスペクトル分
析器で求めた反射係数を用いて、上記(1)から(3)
のいずれかに記載の補正を重み付け係数に対して行なう
第2の重み付け係数算出器を設け、ベクトル量子化器
は、第2の重み付け係数算出器で補正した重み付け係数
を用いて、LSPパラメータの量子化を行なうことを特
徴とする。また、本発明のLSPパラメータのクラスタ
リング装置は、(7)音声信号を予め定められた時間長
のフレームに分割して、LSPパラメータを抽出し、こ
の抽出したLSPパラメータを予め定められた個数のク
ラスタに分離するクラスタリング装置において、上記
(6)に記載の第2のスペクトル分析器と同じ機能を有
し、音声信号からLSPパラメータと反射係数を求める
スペクトル分析器と、上記(6)に記載の第2の重み付
け係数算出器と同じ機能を有し、上述のスペクトル分析
器で抽出したLSPパラメータと反射係数とを用いて、
上記(1)から(3)のいずれかに記載の補正を行ない
重み付け係数を計算する重み付け係数算出器と、この重
み付け係数算出器で計算した重み付け係数を用いた距離
尺度を使用して、クラスタに対応したセントロイドとL
SPパラメータとの距離を計算し、この計算した距離の
値に基づき、LSPパラメータのクラスタへの分離を行
なうクラスタ分離器とを設けることを特徴とする。ま
た、本発明の音声符号化装置は、(8)上記(6)に記
載のLSPパラメータのベクトル量子化装置を具備し、
このLSPパラメータのベクトル量子化装置が出力する
量子化値に基づき、音声信号の符号化を行なうことを特
徴とする。
【0009】
【作用】本発明においては、LSPパラメータのベクト
ル量子化を行なう場合に用いる上述の数3式に示した重
み付け係数の計算を、音声信号のスペクトル包絡の傾き
に対応して補正する。例えば、低周波数領域から高周波
数領域に向けて、有声音は立ち下がり、無声音は立ち上
がる傾きとなるのが一般的であり、入力音声信号から算
出されるPARCOR係数や反射係数の1次の項等を用
いて、有声音に対しては低周波数領域で、また、無声音
に対しては高周波数領域でそれぞれ強調補正を行なう。
このことにより、ベクトル量子化に用いる距離尺度が、
音声の物理的な特性と十分に対応がとれ、スペクトル歪
を軽減できる。また、このようなLSPパラメータのベ
クトル量子化を、ベクトル量子化コードブックの作成時
のクラスタ分離処理や音声符号化処理に用いることによ
り、コードブックの高精度化、および、音声符号化装置
の高性能化が図れる。
【0010】
【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明のLSPパラメータのベクト
ル量子化装置の本発明に係わる構成の第1の実施例を示
すブロック図である。本例のベクトル量子化装置は、分
析次数をp、ベクトル量子化器の段数を1としたもので
あり、本図において、1は、音声信号を入力する音声波
形入力部、2は、音声波形入力部1で入力した音声信号
から、LSPパラメータ4と共に、反射係数3を求める
本発明に係わるスペクトル分析器、5は、スペクトル分
析器2で求めたLSPパラメータ4と反射係数3とを用
いて、重み付け係数6を算出する本発明に係わる重み付
け係数算出器、7は、量子化候補のコードベクトルを格
納するコードブック、8は、重み付け係数算出器5で算
出した重み付け係数6を用いて、LSPパラメータとコ
ードブック7内のコードベクトルとの歪を計算して、こ
の歪(距離)を最小化するコードベクトルの値をLSP
パラメータの量子化値として出力部9に出力するベクト
ル量子化器である。
【0011】このような構成のLSPパラメータのベク
トル量子化装置において、スペクトル分析器2は、音声
波形入力部1を介して入力された音声信号から、フレー
ム毎に、線形予測係数(LPC係数)を算出し、算出し
たLPC係数を、反射係数3およびLSPパラメータ4
に変換する。そして、重み付け係数算出器5は、これら
の反射係数3とLSPパラメータ4を、重み付け係数6
の算出に使用する。尚、反射係数3は音声信号より直接
求めることもできる。以下、重み付け係数算出器5の詳
細な動作説明を行なう。
【0012】管村氏らによる”線スペクトル対(LSP)音
声分析合成方式による音声情報圧縮”(信学論、J64-
A、8、pp.599-606、1981)と題した論文では、スペクト
ル感度(LSPパラメータ個々の微小変化に対するスペ
クトル包絡に与える影響)は、低周波数領域のパラメー
タ程大きな値を示すと報告されている。つまり、スペク
トル包絡は、平均的には低周波数領域ほど強い共振特性
を持つことに起因しており、強い共振特性を表すパラメ
ータのわずかな変動でも、スペクトル包絡全体に大きな
変化を及ぼすと考えられる。しかし、この報告結果はあ
くまで平均的なものであり、時間的にはスペクトル感度
分布は変化し、この時間的変化に追従した距離尺度を定
義する必要がある。
【0013】ここで、分析次数をpとしたときのLSP
パラメータX(x1,x2,…,xp)とコードブックのj番目の代
表ベクトルYj(y1j,y2j,…,Ypj)とのベクトル間の距離
尺度を、次の数4式と定義する。
【数4】 尚、r1は反射係数の1次の項であり、LPC分析によ
り、または、音声信号より直接算出できる。また、Wは
入力音声の制限帯域周波数(例えば、8kHz標本化の場
合はW=4kHz)であり、kは定数値で通常1〜3の値を
とる。
【0014】この数4式で示される重み付け係数6は、
LSPパラメータと反射係数の2つの項に分離できる。
まず、LSPパラメータの項は、上述の数3式で示した
ように、ホルマント部を強調しており、非線形性を有し
ている。このホルマントは、音素を特徴づける優勢な周
波数成分であり、声道の共振周波数に対応している。次
に、反射係数の項は、スペクトル感度を高めるためのも
のであり、線形性である。反射係数は絶対値が1以下の
値をとり、反射係数1次の項は、母音(有声音)のよう
に、スペクトルの低域に重要成分がある音韻については
負の値、また、摩擦音(無声音)のように高域に重要成
分がある場合には正の値をとる。即ち、反射係数の1次
の項が負の場合は、低域成分を示すLSP係数の低次成
分がより重要であり、正の場合は、逆に、LSP係数の
高次成分が重要ということになる。よって、重み付け係
数にも、反射係数1次の値によって大局的にスペクトル
の重要成分(スペクトル感度の高い項)に対する歪感度
を高める項を加えている。
【0015】重み付け係数算出器5は、このような重み
付け係数6を算出して、ベクトル量子化器8に渡す。ベ
クトル量子化器8では、入力ベクトル即ちLSPパラメ
ータ4を、上述の数4式で定義された重み付け距離尺度
を用いて、コードブック7のコードベクトルとの誤差が
最小となる代表ベクトルを検索し、この代表ベクトルと
対となった符号を出力部9に出力する。LSPパラメー
タの復号(即ち、量子化値の出力)は、コードブック7
の中の符号10と対になっているコードベクトルを読み
出すことによって実現する。尚、コードブック7はトレ
ーニング用の多量のLSPパラメータ系列を用いて予め
学習して構成する。学習の方法としてはLinde, Buzo, G
rayによる”An algorithm for vector quantization de
sign”と題した論文(IEEE Trans Commun.,Vol.COM-28,p
p84-95,1980年)等を参照できる。このようにして、最適
な重み付け係数を導入したベクトル間の距離尺度を用い
ることにより、スペクトル歪の低減を図ることができ
る。
【0016】次に、図2および図3を用いて、多段ベク
トル量子化装置についての説明を行なう。図2は、多段
ベクトル量子化の原理を示す説明図である。多段ベクト
ル量子化とは、前の段での量子化誤差が次の段へ送ら
れ、各段階で決定された符号の連鎖として最終的な符号
が構成されるものである。本例において、入力ベクトル
51をX(x1,x2,…,xp)、また、各段で選択された代表
ベクトル53、58、62をそれぞれY1(y11,y12,…,
1p)、Y2(y21,y22,…,y2p)、Y3(y31,y32,…,
3p)、また、1段目、2段目の各量子化結果から計算
される量子化誤差ベクトル55、60をそれぞれE1(e
11,e12,…,e1p)、E2(e21,e22,…,e2p)とする。
【0017】多段ベクトル量子化法では、各段毎にそれ
ぞれコードブック70、71、72を持ち、代表ベクト
ルと送信符号が対になっている。まず、1段目ベクトル
量子化器52において、入力ベクトル51と1段目コー
ドブック70により、最適な代表ベクトル53が選出さ
れる。次に、入力ベクトル51と代表ベクトル53との
量子化誤差ベクトル55が、合成器54を介して2段目
ベクトル量子化器57に渡される。この2段目ベクトル
量子化器57では、1段目ベクトル量子化器52より送
られてきた量子化誤差ベクトル55を入力ベクトルと
し、1段目と同様に2段目コードブック71より代表ベ
クトル58が抽出され、量子化誤差ベクトル60が次段
に渡される。以後、3段目ベクトル量子化器61におい
ても同様にして処理され、最終的に、各段で代表ベクト
ルが決定する。ここで、各段において代表ベクトルと対
になった符号63、64、65が送信される。
【0018】このような3段ベクトル量子化器に、本発
明に係わる重み付け距離尺度を使用した場合の構成と動
作を、次の図3を用いて説明する。図3は、本発明のL
SPパラメータのベクトル量子化装置の本発明に係わる
構成の第2の実施例を示すブロック図である。本例は、
重み付け距離尺度を使用した場合の3段ベクトル量子化
器の構成例を示すものであり、1段目ベクトル量子化器
131と2段目ベクトル量子化器132と3段目ベクト
ル量子化器133により、図1におけるベクトル量子化
装置を3段にして構成されるものである。以下、その動
作説明を行なう。
【0019】1段目ベクトル量子化器131において
は、音声波形101を入力し、予め重み付け係数算出器
105で得られた重み付け係数108を基に、入力ベク
トル104と1段目コードブック106のコードベクト
ルとの誤差ベクトルを算出し、誤差ベクトルが最小とな
る代表ベクトル109を算出する。この代表ベクトル1
09と対となった符号117を量子化コードとし、代表
ベクトル109を次段の2段目ベクトル量子化器132
の入力ベクトルとし、重み付け係数108および2段目
コードブック110を基に、次段の代表ベクトル113
を決定する。以後、3段目コードブック114を有する
3段目ベクトル量子化器133においてもこれを繰返
し、3組の符号117、118、119が選出される。
【0020】多段ベクトル量子化法で重み付け距離尺度
を使用する場合、各段で次段に渡す量子化誤差ベクトル
は、入力ベクトルと代表ベクトルとの各次数毎の差であ
り、3段目ベクトル量子化器133で量子化したときの
最終量子化誤差dwは、次の数5式で示される。
【数5】 この数5式で、重み付け距離係数Wh(i)(i=1,2,…,
p)は、各段とも共通の値を使用しているが、2段目以
後は重み付け係数を使用しない(重み付け係数全てを1
とおく、つまりユークリッド距離尺度を使用する)こと
も可能である。
【0021】図4は、図3におけるLSPパラメータの
ベクトル量子化装置の効果例を示すグラフである。本例
は、図3の3段ベクトル量子化器により、本発明に係わ
る重み付け距離尺度を用いて量子化した場合と、ユーク
リッド距離尺度を用いた場合、および、上述の数3式で
示されるホルマント部強調のための重み付け距離尺度を
使用した場合の3通りについて、スペクトル歪を調べた
結果である。ベクトル量子化器は、入力ベクトルに対し
て最終的な距離尺度値(量子化歪)が極力小さくなるよ
うに、各段で誤差ベクトルの候補を複数個出力するディ
レードデシジョンを採用している。つまり、1段目ベク
トル量子化器においては、量子化誤差が小さい順に2候
補を選択し、2段目ベクトル量子化器においても、1段
目ベクトル量子化器と同様に、1つの入力に対して量子
化誤差が最小となる2候補を出力し、結果として、3段
目ベクトル量子化器では、4候補の誤差ベクトルを入力
ベクトルとして量子化する。そして、最終的には、3段
目ベクトル量子化器より量子化された量子化誤差を最小
とするコードベクトルの組を量子化値とする。
【0022】この実験条件としては、サンプリング周波
数8kHz、フレーム長40ms、分析次数10次、量子化
コードブックは各段9bitで合計27bit、評価用音声デ
ータは男女各4名が発声した学習外8音声である。本図
4に示すように、本発明に係わる重み付け距離尺度を用
いて量子化すれば、ユークリッド距離尺度に対して従来
提案されているホルマント部強調のための重み付け距離
尺度に比べて、2倍程度スペクトル歪を低減できる。以
上、述べたように、本発明に係わる距離尺度を用いたL
SPパラメータのベクトル量子化では、スペクトル歪と
対応がとれていることが分かる。次に、図1、図3にお
けるベクトル量子化に用いるコードブックの作製につい
て、本発明に係わる距離尺度を適用した例を示す。すな
わち、ベクトル量子化に用いるコードブックは、多量の
LSPパラメータを基に種々の方法でクラス分けして作
製されるが、次の図5で述べるクラスタ化手法に、本発
明に係わる距離尺度が適用できる。
【0023】図5は、本発明のLSPパラメータのクラ
スタリング装置の本発明に係わる構成の一実施例を示す
ブロック図である。本例のLSPパラメータのクラスタ
リング装置は、図1におけるスペクトル分析器2と重み
付け係数算出器5とにより算出された重み付け係数を用
いた距離尺度を使用して、LSPパラメータのクラスタ
分離を行なうものであり、図1におけるスペクトル分析
器2と重み付け係数算出器5、および、クラスタ分離器
80により構成されている。
【0024】図1、図3におけるベクトル量子化に用い
るコードブックは、多量のLSPパラメータを基に種々
の方法でクラス分けして作製されるが、以下のようにし
て、このようなクラスタ化手法に、本発明に係わる距離
尺度が適用できる。 (a)まず、スペクトル分析器2において、学習用音声
データを一定のフレームに分割し、フレーム毎にスペク
トル分析を行い、N個のLSPパラメータ(学習入力)
を求める。分析次数をpとしたとき、i番目(i≦N)のL
SPパラメータXiを(xi1,xi2,…,xip)とする。また、
フレーム毎に求まったLSPパラメータより反射係数を
導出する。そして、重み付け係数算出器5において、L
SPパラメータと反射係数により重み付け係数を導出す
る。この重み付け係数の内でi番目の重み付け係数をW
i(k)(k=1,…,p)とする。
【0025】次に、クラスタ分離器80において、下記
の(b)〜(e)の処理を行なう。 (b)通常のクラスタリング手法で用いられる方法によ
り、M個(M<N)の初期ベクトルF1〜FMを設定する。
ここで、i番目の初期ベクトルFiを(fi1,fi2,…,f
ip)とする。 (c)LSPパラメータを、初期ベクトルによって、M
個にクラスタ化する。即ち、LSPパラメータの内、j
番目のLSPパラメータについて、次の数6式が最小に
なるようなクラスタを決定する。
【数6】 尚、kはクラスタ番号を示す。 (d)全ての学習入力を分類して、個々のクラスタにつ
いてセントロイドを求め、このセントロイドを新しい代
表ベクトルとして、(a)〜(c)の処理を繰り返す。 (e)上述の代表ベクトルの収束値が、ある値以下にな
れば処理を終了する。 このようにして作製されたコードブックを用いて量子化
することにより、スペクトル歪を低減できる。
【0026】次に、図1におけるLSPパラメータのベ
クトル量子化装置を用いた音声符号化装置の説明を行な
う。図6は、本発明のLSPパラメータの音声符号化装
置の本発明に係わる構成の一実施例を示すブロック図で
ある。本例のLSPパラメータの音声符号化装置は、C
ELP方式のものである。このCELP方式では、図6
(a)に示す符号器側において、入力音声201を決ま
った長さのフレーム(例えば20ms)に分割し、スペク
トル分析器202により、フレーム毎に音声信号のスペ
クトル特性を表すスペクトルパラメータ204を導出す
る。そして、予め構成されたコードブック209によ
り、このスペクトルパラメータ204を量子化し、さら
に、フレームを小区間サブフレーム(例えば5ms)に分
割し、サブフレーム毎に音源信号を表すパラメータを導
出して、この音源信号パラメータを量子化する。このよ
うにして量子化されたスペクトルパラメータ210、お
よび、音源分析器206で抽出された音源信号パラメー
タ211のそれぞれは、多重化器212により直列変換
処理されて伝送される。
【0027】一方、図6(b)に示す復号器側では、符
号器側より伝送された信号301から、多重分離器30
2により、スペクトル特性を表すスペクトルパラメータ
303と音源信号パラメータ304を分離し、これらの
スペクトルパラメータ303および音源パラメータ30
4を、コードブック307を有するスペクトル復号器3
05、および、音源パラメータ復号器306により復号
化する。このようにして復号化されたスペクトル包絡3
08および音源波形309を、合成フィルタ310によ
り合成して、音声信号311を再現する。本例では、ス
ペクトルパラメータとしてLSPパラメータを使用し、
スペクトル分析器202により、反射係数203および
スペクトルパラメータ204が導出され、重み付け係数
算出器205に渡されて重み付け係数算出に使用され
る。重み付け係数算出器205により算出された重み付
け係数208は、ベクトル量子化器207に渡され、ス
ペクトルパラメータ204の量子化に使用される。本例
によれば、スペクトルパラメータの量子化歪を低減でき
るので復号音声の品質の向上が図れる。
【0028】図7は、本発明のLSPパラメータのベク
トル量子化方法および音声符号化方法に係わる処理動作
の一実施例を示すフローチャートである。本例は、図1
におけるLSPパラメータのベクトル量子化装置および
図6におけるLSPパラメータの音声符号化装置の本発
明に係わる処理動作を示すものである。まず、入力した
音声信号を予め定められた時間長のフレームに分割して
スペクトル分析を行ない(ステップ701)、LSPパ
ラメータと反射係数を抽出する(ステップ702)。こ
のようにして抽出したLSPパラメータと反射係数を用
いて重み付け係数を計算する(ステップ703)。尚、
この反射係数として入力音声信号から算出される反射係
数の1次の項を用い、例えば、有声音に対しては低周波
数領域で、また無声音に対しては高周波数領域でそれぞ
れLSPパラメータによる重み付け係数の強調補正を行
なう。このことにより、スペクトル包絡の傾きに対応し
た重み付け係数計算を行なうことができる。
【0029】算出された重み付け係数を用いて、LSP
パラメータと、予め構成されたベクトル量子化コードブ
ック内のコードベクトルとの歪(距離)を計算する(ス
テップ704)。この歪を最小化するコードベクトルの
指標を出力して、このコードベクトルの値を、LSPパ
ラメータの量子化値として特定する(ステップ70
5)。そして、この量子化値に対応付けられる符号を求
めて音声信号の符号化を行なう(ステップ706)。
【0030】図8は、本発明のLSPパラメータのクラ
スタリング方法に係わる処理動作の一実施例を示すフロ
ーチャートである。本例は、図5におけるLSPパラメ
ータのクラスタリング装置の本発明に係わる処理動作を
示すものである。まず、音声信号を予め定められた時間
長のフレームに分割し(ステップ801)、フレーム毎
にスペクトル分析を行ないLSPパラメータを求める
(ステップ802)。このLSPパラメータより、例え
ば、有声音に対しては低周波数領域で、また無声音に対
しては高周波数領域でそれぞれLSPパラメータによる
重み付け係数の強調補正を行なうための反射係数を導出
し(ステップ803)、このLSPパラメータと反射係
数により重み付け係数を導出する(ステップ804)。
【0031】通常のクラスタリング手法により複数
(M)個の初期ベクトルを設定し(ステップ805)、
ステップ804で導出した重み付け係数を用いて、初期
ベクトルとLSPパラメータの距離を計算して(ステッ
プ806)、この距離の値に基づき、LSPパラメータ
をM個にクラスタ化する(ステップ807)。そして、
このようにして求めた各々のクラスタについてセントロ
イドを求め(ステップ808)、このセントロイドを新
たな代表ベクトルとし、この代表ベクトルの収束値が所
定値(K)以下になるまで(ステップ809)、ステッ
プ805〜808の処理を繰り返し、処理を終了する。
【0032】以上、図1〜図8を用いて説明したよう
に、本実施例では、LSPのベクトル量子化におけるス
ペクトル歪みを低減するので、このLSPのベクトル量
子化を用いた音声符号化装置における符号化音質を向上
させることができる。また、LSPのベクトル量子化で
用いるコードブックを構成するセントロイドの算出過程
に、このLSPのベクトル量子化を適用することによ
り、高精度のコードブックを作成することができる。
尚、本発明は、図1〜図8を用いて説明した実施例に限
定されるものではなく、その要旨を逸脱しない範囲にお
いて種々変更可能である。例えば、図5においては、通
常のCELP方式を例にあげて説明しているが、入力音
声をスペクトル情報と音源情報に分離する方式の音声符
号化にも本発明を適用できる。また、反射係数の代わり
にPARCOR係数を用いることも可能である。
【0033】
【発明の効果】本発明によれば、LSPパラメータのベ
クトル量子化時に用いる距離尺度が、音声の物理的な特
性と対応するので、スペクトル歪を低減できると共にホ
ルマント部以外の情報の損失を回避でき、LSPパラメ
ータのベクトル量子化の精度、および、この量子化を用
いる音声符号化装置の性能を向上させることが可能であ
る。
【図面の簡単な説明】
【図1】本発明のLSPパラメータのベクトル量子化装
置の本発明に係わる構成の第1の実施例を示すブロック
図である。
【図2】多段ベクトル量子化の原理を示す説明図であ
る。
【図3】本発明のLSPパラメータのベクトル量子化装
置の本発明に係わる構成の第2の実施例を示すブロック
図である。
【図4】図3におけるLSPパラメータのベクトル量子
化装置の効果例を示すグラフである。
【図5】本発明のLSPパラメータのクラスタリング装
置の本発明に係わる構成の一実施例を示すブロック図で
ある。
【図6】本発明のLSPパラメータの音声符号化装置の
本発明に係わる構成の一実施例を示すブロック図であ
る。
【図7】本発明のLSPパラメータのベクトル量子化方
法および音声符号化方法に係わる処理動作の一実施例を
示すフローチャートである。
【図8】本発明のLSPパラメータのクラスタリング方
法に係わる処理動作の一実施例を示すフローチャートで
ある。
【符号の説明】
1 音声波形入力部 2 スペクトル分析器 3 反射係数 4 LSPパラメータ 5 重み付け係数算出器 6 重み付け係数 7 コードブック 8 ベクトル量子化器 9 出力部 51 入力ベクトル 52 1段目ベクトル量子化器 53 代表ベクトル 54 合成器 55 量子化誤差ベクトル 57 2段目ベクトル量子化器 58 代表ベクトル 59 合成器 60 量子化誤差ベクトル 61 3段目ベクトル量子化器 62 代表ベクトル 63〜65 符号 70 1段目コードブック 71 2段目コードブック 72 3段目コードブック 80 クラスタ分離器 101 音声波形 102 スペクトル分析器 103 反射係数 104 入力ベクトル 105 重み付け係数算出器 106 1段目コードブック 108 重み付け係数 109 代表ベクトル 110 2段目コードブック 113 代表ベクトル 114 3段目コードブック 117〜119 符号 131 1段目ベクトル量子化器 132 2段目ベクトル量子化器 133 3段目ベクトル量子化器 201 入力音声 202 スペクトル分析器 203 反射係数 204 スペクトルパラメータ 205 重み付け係数算出器 206 音源分析器 207 ベクトル量子化器 208 重み付け係数 209 コードブック 210 スペクトルパラメータ 211 音源信号パラメータ 212 多重化器 301 信号 302 多重分離器 303 スペクトルパラメータ 304 音源信号パラメータ 305 スペクトル復号器 306 音源パラメータ復号器 307 コードブック 308 スペクトル包絡 309 音源波形 310 合成フィルタ 311 音声信号
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ▲高▼島 卓 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力した音声信号を予め定められた時間
    長のフレームに分割して抽出した線スペクトル対パラメ
    ータを用いて重み付け係数を計算し、該重み付け係数を
    用いて、上記線スペクトル対パラメータと、予め構成さ
    れたベクトル量子化コードブック内のコードベクトルと
    の距離を計算し、該距離を最小化する上記コードベクト
    ルの値を、上記線スペクトル対パラメータの量子化値と
    して出力する線スペクトル対パラメータのベクトル量子
    化方法において、上記音声信号のスペクトル包絡の傾き
    に対応して、上記線スペクトル対パラメータを用いた上
    記重み付け係数計算の補正を行なうことを特徴とする線
    スペクトル対パラメータのベクトル量子化方法。
  2. 【請求項2】 請求項1に記載の線スペクトル対パラメ
    ータのベクトル量子化方法において、上記音声信号のス
    ペクトル包絡の傾きが負の時は低周波数領域で、傾きが
    正の時は高周波数領域でそれぞれ強調補正を行なうこと
    を特徴とする線スペクトル対パラメータのベクトル量子
    化方法。
  3. 【請求項3】 請求項1、もしくは、請求項2のいずれ
    かに記載の線スペクトル対パラメータのベクトル量子化
    方法において、上記重み付け係数計算の補正を、上記入
    力音声信号から算出されるPARCOR係数もしくは反
    射係数の1次の項を用いて行なうことを特徴とする線ス
    ペクトル対パラメータのベクトル量子化方法。
  4. 【請求項4】 音声信号を予め定められた時間長のフレ
    ームに分割して、線スペクトル対パラメータを抽出し、
    予め定められた個数のクラスタに分離するクラスタリン
    グ方法において、請求項1から請求項3のいずれかに記
    載の補正を行なった重み付け係数を用いた距離尺度を使
    用して、上記クラスタに対応したセントロイドと上記線
    スペクトル対パラメータの距離を計算し、該距離の値に
    基づき上記線スペクトル対パラメータのクラスタ分離を
    行なうことを特徴とする線スペクトル対パラメータのク
    ラスタリング方法。
  5. 【請求項5】 請求項1から請求項3のいずれかに記載
    の補正を行なう線スペクトル対パラメータのベクトル量
    子化方法により、入力された音声信号の線スペクトル対
    パラメータの量子化値を求め、該量子化値に対応付けら
    れた符号を出力して、音声信号の符号化を行なうことを
    特徴とする音声符号化方法。
  6. 【請求項6】 入力した音声信号を予め定められた時間
    長のフレームに分割して、線スペクトル対パラメータを
    抽出する第1のスペクトル分析手段と、該第1のスペク
    トル分析手段で抽出した線スペクトル対パラメータを用
    いて、重み付け係数を計算する第1の重み付け係数算出
    手段と、該第1の重み付け係数算出手段で計算した重み
    付け係数を用いて、上記線スペクトル対パラメータと予
    め構成されたベクトル量子化コードブック内のコードベ
    クトルとの距離を計算して、該距離を最小化する上記コ
    ードベクトルの値を上記線スペクトル対パラメータの量
    子化値として出力するベクトル量子化手段とからなる線
    スペクトル対パラメータのベクトル量子化装置におい
    て、上記第1のスペクトル分析手段の代わりに、上記線
    スペクトル対パラメータと共に、上記入力音声信号から
    反射係数を求める第2のスペクトル分析手段を、上記第
    1の重み付け係数算出手段の代わりに、上記第2のスペ
    クトル分析手段で求めた反射係数を用いて、請求項1か
    ら請求項3のいずれかに記載の補正を上記重み付け係数
    に対して行なう第2の重み付け係数算出手段を設け、上
    記ベクトル量子化手段は、上記第2の重み付け係数算出
    手段で補正した重み付け係数を用いて、上記線スペクト
    ル対パラメータの量子化を行なうことを特徴とする線ス
    ペクトル対パラメータのベクトル量子化装置。
  7. 【請求項7】 音声信号を予め定められた時間長のフレ
    ームに分割して、線スペクトル対パラメータを抽出し、
    該抽出した線スペクトル対パラメータを予め定められた
    個数のクラスタに分離するクラスタリング装置におい
    て、請求項6に記載の第2のスペクトル分析手段と同じ
    機能を有し、上記音声信号から線スペクトル対パラメー
    タと反射係数を求めるスペクトル分析手段と、請求項6
    に記載の第2の重み付け係数算出手段と同じ機能を有
    し、上記スペクトル分析手段で抽出した線スペクトル対
    パラメータと反射係数とを用いて、請求項1から請求項
    3のいずれかに記載の補正を行ない重み付け係数を計算
    する重み付け係数算出手段と、該重み付け係数算出手段
    で計算した重み付け係数を用いた距離尺度を使用して、
    上記クラスタに対応したセントロイドと上記線スペクト
    ル対パラメータとの距離を計算し、該計算した距離の値
    に基づき、上記線スペクトル対パラメータの上記クラス
    タへの分離を行なうクラスタ分離手段とを設けることを
    特徴とする線スペクトル対パラメータのクラスタリング
    装置。
  8. 【請求項8】 請求項6に記載の線スペクトル対パラメ
    ータのベクトル量子化装置を具備し、該線スペクトル対
    パラメータのベクトル量子化装置が出力する量子化値に
    基づき、音声信号の符号化を行なうことを特徴とする音
    声符号化装置。
JP5209141A 1993-08-24 1993-08-24 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置 Pending JPH0764599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5209141A JPH0764599A (ja) 1993-08-24 1993-08-24 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5209141A JPH0764599A (ja) 1993-08-24 1993-08-24 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置

Publications (1)

Publication Number Publication Date
JPH0764599A true JPH0764599A (ja) 1995-03-10

Family

ID=16567986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5209141A Pending JPH0764599A (ja) 1993-08-24 1993-08-24 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置

Country Status (1)

Country Link
JP (1) JPH0764599A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091475A (ja) * 2000-09-18 2002-03-27 Matsushita Electric Ind Co Ltd 音声合成方法
US6826526B1 (en) 1996-07-01 2004-11-30 Matsushita Electric Industrial Co., Ltd. Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
WO2008047795A1 (fr) * 2006-10-17 2008-04-24 Panasonic Corporation Dispositif de quantification vectorielle, dispositif de quantification vectorielle inverse et procédé associé
JP2008145682A (ja) * 2006-12-08 2008-06-26 Nippon Telegr & Teleph Corp <Ntt> 信号符号化装置、信号符号化方法、プログラム及び記録媒体
WO2010073977A1 (ja) * 2008-12-22 2010-07-01 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP2017501430A (ja) * 2013-11-13 2017-01-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826526B1 (en) 1996-07-01 2004-11-30 Matsushita Electric Industrial Co., Ltd. Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
US7243061B2 (en) 1996-07-01 2007-07-10 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having a plurality of frequency bands
JP2002091475A (ja) * 2000-09-18 2002-03-27 Matsushita Electric Ind Co Ltd 音声合成方法
WO2008047795A1 (fr) * 2006-10-17 2008-04-24 Panasonic Corporation Dispositif de quantification vectorielle, dispositif de quantification vectorielle inverse et procédé associé
JP2008145682A (ja) * 2006-12-08 2008-06-26 Nippon Telegr & Teleph Corp <Ntt> 信号符号化装置、信号符号化方法、プログラム及び記録媒体
WO2010073977A1 (ja) * 2008-12-22 2010-07-01 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP2017501430A (ja) * 2013-11-13 2017-01-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法
US9818420B2 (en) 2013-11-13 2017-11-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
US10229693B2 (en) 2013-11-13 2019-03-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
US10354666B2 (en) 2013-11-13 2019-07-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
US10720172B2 (en) 2013-11-13 2020-07-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values

Similar Documents

Publication Publication Date Title
JP4005154B2 (ja) 音声復号化方法及び装置
JP3707116B2 (ja) 音声復号化方法及び装置
EP1339040B1 (en) Vector quantizing device for lpc parameters
JP3680380B2 (ja) 音声符号化方法及び装置
JP3707153B2 (ja) ベクトル量子化方法、音声符号化方法及び装置
JP3707154B2 (ja) 音声符号化方法及び装置
JP3151874B2 (ja) 音声パラメータ符号化方式および装置
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
JPH1091194A (ja) 音声復号化方法及び装置
WO2009090876A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
JPH10124092A (ja) 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
JP5335004B2 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US6917914B2 (en) Voice over bandwidth constrained lines with mixed excitation linear prediction transcoding
EP2087485B1 (en) Multicodebook source -dependent coding and decoding
JPH0764599A (ja) 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置
US20080162150A1 (en) System and Method for a High Performance Audio Codec
JP3793111B2 (ja) 分割型スケーリング因子を用いたスペクトル包絡パラメータのベクトル量子化器
JP2709926B2 (ja) 声質変換方法
JP2002221998A (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音声符号化、復号化方法、装置及びプログラム
JP3675054B2 (ja) ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
JPH09127997A (ja) 音声符号化方法及び装置
JPH09127993A (ja) 音声符号化方法及び音声符号化装置
JPH0473699A (ja) 音声符号化方式