JP3088163B2 - Lsp係数の量子化方法 - Google Patents

Lsp係数の量子化方法

Info

Publication number
JP3088163B2
JP3088163B2 JP03335010A JP33501091A JP3088163B2 JP 3088163 B2 JP3088163 B2 JP 3088163B2 JP 03335010 A JP03335010 A JP 03335010A JP 33501091 A JP33501091 A JP 33501091A JP 3088163 B2 JP3088163 B2 JP 3088163B2
Authority
JP
Japan
Prior art keywords
quantization
vector
stage
lsp
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03335010A
Other languages
English (en)
Other versions
JPH05165499A (ja
Inventor
浩 桂川
賢一郎 細田
弘美 青柳
義博 有山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP03335010A priority Critical patent/JP3088163B2/ja
Publication of JPH05165499A publication Critical patent/JPH05165499A/ja
Application granted granted Critical
Publication of JP3088163B2 publication Critical patent/JP3088163B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声信号の圧縮符号
化方式に関するものであり、特にそこでの線スペクトル
対の量子化方法に関するものである。
【0002】
【従来の技術】音声信号の声道の性質を表すパラメータ
としては、線形予測係数、反射係数などがあるが、中で
も、板倉等によって提案された線スペクトル対(以下L
SP係数)は、量子化に対して比較的歪みが少ないこ
と、補間特性が良いこと、及び安定性の判別が容易なこ
となどの長所をもっている。そのためLSP係数は、音
声の高能率圧縮符号化技術に関する分野では、極めて有
効なパラメータであると言える。LSP係数は、それを
直接的に量子化することもでき(文献1参照)、又AD
PCM的手法で間接的に量子化することができる(文献
2参照)。
【0003】文献1:管村 昇、板倉文忠、「線スペク
トル対(LSP)音声分析合成方式による音声情報圧
縮」、電子通信学会論文誌、Vol.J64−A、No. 8
(1981/8) 文献2:F.K.Soong & B.H.Juang,“Optimal Quantizati
on of LSP ParametersUsing Delayed Decision",Proc.
ICASSP-90 (April 1990) LSP係数は、通常の音声信号の場合、6個から12個
程度の次元(要素)からなるベクトルとして表現され、
また、各ベクトルの要素は、周波数に関する昇順に並ん
でいるという性質を持っており、各要素の値は独立では
ない。従ってその量子化には、例えば文献3で開示され
ているようなベクトル量子化手法が極めて有効である。
【0004】文献3:胡志平、船田哲夫、「2段ベクト
ル量子化による破裂音の認識」、電子通信学会技術研究
報告、SP90−6(1990年5月25日)
【0005】
【発明が解決しようとする課題】LSP係数のベクトル
量子化は、通常、多数のベクトルをテーブルとして蓄積
しておき、入力音声信号のLSP係数類似したベクトル
を探索しそのコードを出力することによって行う。予め
用意しておくベクトルの数は、ビットレートや探索時間
から制限されるため、音声信号の性質によっては量子化
歪みが大きくなることがある。
【0006】本発明は、近接する音声フレームのLSP
係数に相関があることに着目して、テーブルのベクトル
を補うようにするものである。
【0007】すなわち、近接する音声信号から得られた
LSP係数の間には、相関が存在し、近接する音声フレ
ームから求められたLSP係数は似ている。従って、本
発明の目的は、その相関を十分に有効に活用して、量子
化能率を向上させる手法を提供することにある。
【0008】
【課題を解決するための手段】本発明は、LSP係数
(ベクトル)の複数段量子化方法に関する。
【0009】本発明では、初段の量子化テーブルは、予
め定められたベクトルを蓄積している固定部と、置き換
え可能にベクトルを蓄積する可変部とから構成される。
【0010】また、各フレームの量子化終了後、可変部
の最も古いベクトルを、現フレームで決定されたベクト
ルの合成ベクトルで置き換える。すなわち、現フレーム
の出力符号に対応したものであり、現フレームのLSP
係数に対応したベクトルで置き換える。
【0011】
【作用】本発明では、LSP係数の各要素間の相関を有
効に活用するために、スカラー量子化ではなくベクトル
量子化を行う。但し、そのままベクトル量子化したので
は、量子化テーブルの大きさが非常に大きくなってしま
うので、例えば、まず10ビット程度で粗くベクトル量
子化し、その量子化誤差を、別の量子化テーブルを用い
てベクトル量子化し、さらにその時の量子化誤差を、以
前の2つの量子化テーブルとは異なる量子化テーブルを
用いてベクトル量子化するというように、小さい量子化
テーブルを用いたベクトル量子化を複数回繰り返すこと
で、ベクトル量子化の効果を用いる。
【0012】また、近接する音声フレームに関するLS
P係数の相関を有効に利用するために、1段目の量子化
テーブルの一部を可変にしておき、以前のフレームで量
子化されたLSP係数の値を1段目の量子化テーブルの
ベクトルとして用いる。
【0013】
【実施例】図1に、本発明を適用したLPC係数の量子
化器のブロック図を示す。ここでは初段(1段目)と最
終段(2段目)との2個の量子化テーブルを用意するも
のとする。
【0014】1段目の量子化テーブル11は可変の部分
11aと、あらかじめ定められた固定のベクトルからな
る部分11bから構成されている。
【0015】まず最初に、前フレームの1段目で選択さ
れた最適なベクトルV10と、2段目で選択された最適な
ベクトルV20とが加算器15で加算されて、前フレーム
における合成ベクトル(量子化されたLSP係数)を求
め、量子化テーブル1の可変部分11aの中で最も古い
ベクトルを前フレームの量子化されたLSP係数(合成
ベクトル)置き換える。
【0016】次に、誤差評価器13で、量子化テーブル
11の全てのベクトルについて、入力音声のLSP係数
との誤差の評価を行い、最適のベクトルV1 を選択し、
1段目の最適なベクトルV1 とその符号(インデック
ス)C1 を出力する。
【0017】次に、1段目で選ばれたベクトルV1 を入
力音声のLSP係数から減算器16で差し引き1段目で
の量子化誤差ベクトルを求める。
【0018】量子化テーブル12は、全てあらかじめ定
められた固定のベクトルからなっている。
【0019】誤差評価器14では、量子化テーブル12
の全てのベクトルについて、1段目での量子化誤差ベク
トルに対する誤差の評価を行い、最適のベクトルを選択
し、2段目の最適なベクトルV2 とその符号(インデッ
クス)C2 を出力する。
【0020】図2に、第1図に対応する逆量子化器の例
を示す。1段目の量子化テーブル21は可変の部分21
aと、あらかじめ定められた固定のベクトルからなる部
分21bから構成されている。固定部分21bは図1の
11bと一致する。
【0021】まず最初に、量子化テーブル21の可変部
分21aの中で最も古いベクトルを前フレームの合成ベ
クトル(V10+V20)で置き換える。
【0022】次に、量子化テーブル21から符号C1
示される最適な1段目のベクトルV1 が取り出される。
【0023】量子化テーブル22は、図1の12と一致
する。あらかじめ定められた固定のベクトルからなって
いる。
【0024】量子化テーブル22からは、符号C2 で示
される最適な2段目のベクトルV2 が取り出される。
【0025】1段目の最適なベクトルV1 と、2段目の
最適なベクトルV2 が加算器23で加算されて、量子化
されたLSP係数(合成ベクトル)を構成する。
【0026】次表に、従来の方法(LSPのスカラ量子
化)と、図1の符号化器によるLSPの量子化の効果の
比較結果を示す。なお、実験に用いた声道パラメータは
分析フレーム長40ミリ秒で10次の分析を行ったもの
を用いた。従来の方法は各次数のLSP係数を4、4、
3、3、3、3、3、3、2、2ビットで、非線形スカ
ラー量子化したものであり、また、本実施例によるもの
は1段目10ビット、2段目12ビットでベクトル量子
化したものである。また、1段目の可変部分ベクトルの
個数は6ベクトルである。どちらの量子化器も、約3分
の学習データを用いて構成したものであり、また、試験
は学習データに含まれない約15秒分のデータを用いて
行った。
【0027】
【表1】
【0028】ここで、必要となるビット数は少ないほど
圧縮効率が高い。また、スペクトル歪みは小さいほど良
く、音声信号に関しては1dB以上になると、聴覚上、気
になると言われている。SNR(信号対ノイズ比)は大
きいほど良い。
【0029】なお、図1の実施例では、各段のベクトル
及びその符号を各量子化段階毎に決定しているが、文献
2に示されている方法と同様に、各量子化段階では複数
の候補を探索し、最終段完了後に量子化誤差を総合的に
評価することによって、各量子化段階のベクトル及び、
その特号を選択するようにしてもよい。
【0030】
【発明の効果】本発明では、初段の量子化テーブルに可
変部を設け、最近の合成ベクトル(量子化されたLSP
係数)で置き換えるようにしているため、近接フレーム
間のLSP係数の相関を有効に利用でき、量子化能率を
向上させることができる。
【図面の簡単な説明】
【図1】本発明を適用した量子化器のブロック図、
【図2】図1に対応した逆量子化器のブロック図、
【符号の説明】
11 量子化テーブル 11a 可変部 11b 固定部 12 量子化テーブル 13 誤差評価器 14 誤差評価器 15 加算器 16 減算器 23 加算器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 有山 義博 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 平2−296300(JP,A) 特開 平3−288433(JP,A) 特開 平4−171500(JP,A) 特開 平4−363000(JP,A) 特開 昭63−217878(JP,A) 特開 平2−186836(JP,A) 特公 平7−27400(JP,B2) 特公 平7−120961(JP,B2) 1990年電子情報通信学会秋季全国大会 講演論文集,分冊1,「A−130 LS Pパラメータの効率的なベクトル量子化 法の検討」,p.1−132,(1990年9 月15日発行) Proceedings of 1991 IEEE Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.1,K.Ozawa et al,”4kb/s Improve d CELP Coder with Efficient Vector Q uantization”,p.213− 216 (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 13/08 G10L 19/00 - 21/06 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 少なくとも2段の量子化テーブルを備
    え、 初段のベクトル量子化は各フレームの入力音声信号のL
    SP係数を対象として行い、 次段以後の各ベクトル量子化は前段までの量子化誤差を
    対象として行い、 各段毎に量子化誤差を評価しまたは全ての段の量子化誤
    差を総合評価して各段のベクトル量子化に対応してそれ
    ぞれ1個のベクトルを決定し、それらのベクトルに対応
    したそれぞれの符号を出力するLSP係数の量子化方法
    において、 初段の前記量子化テーブルは、予め定められたベクトル
    を蓄積している固定部と、置き換え可能にベクトルを蓄
    積する可変部とから構成され、 各フレームの量子化終了後、前記可変部の最も古いベク
    トルを、当該フレームで決定された前記ベクトルの合成
    ベクトルで置き換える、 ことを特徴としたLSP係数の量子化方法。
JP03335010A 1991-12-18 1991-12-18 Lsp係数の量子化方法 Expired - Lifetime JP3088163B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03335010A JP3088163B2 (ja) 1991-12-18 1991-12-18 Lsp係数の量子化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03335010A JP3088163B2 (ja) 1991-12-18 1991-12-18 Lsp係数の量子化方法

Publications (2)

Publication Number Publication Date
JPH05165499A JPH05165499A (ja) 1993-07-02
JP3088163B2 true JP3088163B2 (ja) 2000-09-18

Family

ID=18283730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03335010A Expired - Lifetime JP3088163B2 (ja) 1991-12-18 1991-12-18 Lsp係数の量子化方法

Country Status (1)

Country Link
JP (1) JP3088163B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2982637B2 (ja) * 1995-01-17 1999-11-29 日本電気株式会社 スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP3344944B2 (ja) * 1997-05-15 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
CN107305774B (zh) * 2016-04-22 2020-11-03 腾讯科技(深圳)有限公司 语音检测方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
1990年電子情報通信学会秋季全国大会講演論文集,分冊1,「A−130 LSPパラメータの効率的なベクトル量子化法の検討」,p.1−132,(1990年9月15日発行)
Proceedings of 1991 IEEE International Conference on Acoustics,Speech and Signal Processing,Vol.1,K.Ozawa et al,"4kb/s Improved CELP Coder with Efficient Vector Quantization",p.213−216

Also Published As

Publication number Publication date
JPH05165499A (ja) 1993-07-02

Similar Documents

Publication Publication Date Title
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3094908B2 (ja) 音声符号化装置
EP1339040A1 (en) Vector quantizing device for lpc parameters
JPH09127991A (ja) 音声符号化方法及び装置、音声復号化方法及び装置
WO2001020595A1 (en) Voice encoder/decoder
JPH08263099A (ja) 符号化装置
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JP3357795B2 (ja) 音声符号化方法および装置
JP3070955B2 (ja) 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JPH1097295A (ja) 音響信号符号化方法及び復号化方法
JP3064947B2 (ja) 音声・楽音符号化及び復号化装置
JPH10177398A (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3444131B2 (ja) 音声符号化及び復号装置
JP3088163B2 (ja) Lsp係数の量子化方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3148778B2 (ja) 音声の符号化方法
JP3268750B2 (ja) 音声合成方法及びシステム
JP2796408B2 (ja) 音声情報圧縮装置
JP3296363B2 (ja) 音声の線形予測パラメータ符号化方法
JP3262652B2 (ja) 音声符号化装置及び音声復号化装置
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법
JPH0786952A (ja) 音声の予測符号化方法
JP3335650B2 (ja) 音声符号化方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000627

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080714

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090714

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100714

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110714

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120714

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120714

Year of fee payment: 12