JP3147807B2 - 信号符号化装置 - Google Patents

信号符号化装置

Info

Publication number
JP3147807B2
JP3147807B2 JP06763797A JP6763797A JP3147807B2 JP 3147807 B2 JP3147807 B2 JP 3147807B2 JP 06763797 A JP06763797 A JP 06763797A JP 6763797 A JP6763797 A JP 6763797A JP 3147807 B2 JP3147807 B2 JP 3147807B2
Authority
JP
Japan
Prior art keywords
signal
pulse
circuit
quantization
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06763797A
Other languages
English (en)
Other versions
JPH10260698A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP06763797A priority Critical patent/JP3147807B2/ja
Priority to DE69826755T priority patent/DE69826755D1/de
Priority to US09/046,159 priority patent/US6236961B1/en
Priority to EP98105186A priority patent/EP0866443B1/en
Priority to CA002232977A priority patent/CA2232977C/en
Publication of JPH10260698A publication Critical patent/JPH10260698A/ja
Application granted granted Critical
Publication of JP3147807B2 publication Critical patent/JP3147807B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声または音楽な
どの音声信号を符号化する信号符号化装置に関し、特
に、低いビットレートによる量子化の際に高品質の符号
化を実現する信号符号化装置に関する。
【0002】
【従来の技術】一般に、音声信号のスペクトルを周波数
軸上で高能率に符号化する方法が知られている。例え
ば、T.Moriya氏などによる“Transform coding of spee
ch usinga weigted vector quantizer,”と題した論文
や、N.Iwakami 氏らによる“High-quality audio-codin
g at less than 64 Kbit/s using transform-domain we
ighted interleave vector quantization (TWINVQ), ”
と題した論文などに記載されている。
【0003】これらの方法では、いずれも音声信号を点
数NのDCT(Discrete Cosine Transform) 変換による
直交変換を行うことによってDCT係数を求めている。
続いて、このDCT係数を所定の点数M(M≦N)ごと
に分割するとともに、M点ごとにコードブックを検索す
ることによって音声信号のベクトル量子化を実現してい
る。
【0004】
【発明が解決しようとする課題】しかし、これら従来例
の信号符号化装置を使用して音声信号を符号化しようと
すると、次に述べるような問題点があった。第1に、点
数NのDCT係数を全て一様に量子化しているので、ビ
ットレートを低減化するためにベクトル量子化器のビッ
ト数を低下させると、聴覚的に重要な役割を果たす良好
なDCT係数が求め難くなる。このため、高いビットレ
ートにより符号化する場合には比較的に良好な音質を提
供しうるが、このビットレートを低下させるとともに音
声信号の音質が極端に劣化してしまう。
【0005】第2に、ベクトル量子化の能率を向上させ
るために、DCT係数を分割する際の点数Mを大きくと
ると、その結果としてベクトル量子化器の次元数が増加
することになるため、このベクトル量子化に必要な演算
量が指数関数的に増加してビットレイートを低減化でき
なくなってしまう。
【0006】本発明は、上記の問題点にかんがみてなさ
れたものであり、高い周波数成分を有する音声信号につ
いて、少ない演算量による量子化を行うことによって、
低いビットレートによる優れた音質の符号化が実現でき
る信号符号化装置の提供を目的とする。
【0007】
【課題を解決するための手段】上記の課題を解決するた
め本発明の信号符号化装置では、音声信号を符号化する
信号符号化装置において、音声信号からスペクトルパラ
メータおよびピッチパラメータを求めて量子化するパラ
メータ計算手段と、これら量子化されたスペクトルパラ
メータまたはピッチパラメータのうち、少なくとも一つ
によって構成されるフィルタにより、そのインパルス応
答を算出するインパルス応答計算手段と、量子化された
スペクトルパラメータおよびピッチパラメータに基づい
て、音声信号または音声信号に由来する信号の直交変換
をして第1変換信号を求める第1直交変換手段と、算出
されたインパルス応答、またはインパルス応答に由来す
る信号の直交変換をして第2変換信号を求める第2直交
変換手段と、第1変換信号の一部分または全部、および
第2変換信号を量子化することによって複数個のパルス
を求めるパルス量子化手段とを備える構成としてある。
【0008】この信号符号化装置によれば、音声信号か
ら求めたスペクトルパラメータおよびピッチパラメータ
に基づく直交変換をすることにより、各変換結果に基づ
いて情報量を削減しつつ音声信号を符号化することがで
きる。
【0009】請求項2記載の信号符号化装置では、前記
パルス量子化手段に、前記複数個のパルスをピッチパラ
メータに基づいて繰り返しながら第1パルス群を探索す
る第1探索部と、第2変換信号に基づいて第2パルス群
を探索する第2探索部とを有しており、第1パルス群お
よび第2パルス群のうちから第1変換信号を最適化する
ものを選択する選択回路を更に備える構成としてある。
【0010】この信号符号化装置によれば、複数個のパ
ルスがピッチパラメータに基づいて繰り返されながら探
索された第1パルス群、または、第2変換信号に基づい
て探索された第2パルス群のうちから、いずれか第1変
換信号を最適化するものが選択されうる。
【0011】請求項3記載の信号符号化装置では、前記
パルス量子化回路が、コードブックから検索されたコー
ドベクトルを併せて使用することによって、前記複数個
のパルスを求める構成としてある。
【0012】この信号符号化装置によれば、コードブッ
クから検索されたコードベクトルに基づいて前記複数個
のパルスを求めうる。
【0013】請求項4記載の信号符号化装置では、前記
パルス量子化回路が、前記複数個のパルスの各極性また
は各振幅を少なくとも一つ以上まとめて量子化する構成
としてある。
【0014】この信号符号化装置によれば、演算処理に
おける転送のための情報量が削減されうる。
【0015】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は、本発明による第1実施形
態を概略的に示す構成図である。この第1実施形態で
は、先ず、準備段階として、フレーム分割回路12が、
入力端子11から音声信号を導入すると、この音声信号
を所定の点数Nごとのフレームに分割してから、スペク
トルパラメータ計算回路13、ピッチ計算回路17およ
び聴感重み付け回路14に送出している。
【0016】スペクトルパラメータ計算回路13は、各
フレームの音声信号に対して、フレーム長よりも長い窓
(例えば、24ms)をかけて音声を切り出し、そのス
ペクトルパラメータを所定の次数(例えば、P=10
次)だけ算出するものである。ここで、スペクトルパラ
メータの算出には、周知のLPC分析やBurg分析などを
使用できるが、以下では、一例としてBurg分析の場合に
ついて説明する。このBurg分析については、中溝氏によ
る著作“信号解析とシステム同定”(コロナ社,1988年
刊)の82頁〜87頁などに記載されているため、詳しい説
明を省略する。
【0017】スペクトルパラメータ計算回路13が、Bu
rg分析によって各フレームにおける線形予測係数αi ,
(i=1,...,10) を求めると、この線形予測係数αi が聴
感重み付け回路16、インパルス応答計算回路21、逆
フィルタ回路22および応答信号計算回路51に送出さ
れる。
【0018】また、スペクトルパラメータ計算回路13
では、この線形予測係数αi を以後の量子化や補完に適
したLSPパラメータに変換してスペクトルパラメータ
量子化回路14に送出している。この線形予測係数αi
からLSPパラメータへの変換については、菅村氏など
による論文“線スペクトル対(LSP)音声分析合成方
式による音声情報圧縮”(電子通信学会論文誌,J64-A,
pp.599-606,1981 年刊行)などに記載されているため、
詳しい説明を省略する。
【0019】スペクトルパラメータ量子化回路14は、
コードブック15を検索して下記の式1における歪みD
S1を最小化するLSPパラメータの量子化値を求めるも
のである。このため各フレームにおいて、LSPパラメ
ータの量子化が効率的に行われうる。ここで、LSP
(i) は量子化前のi次元目のLSPパラメータを、QL
SPj(i) は量子化後のj次元目の結果を、W(i) はi
次元目の重み係数を、それぞれ示す変数である。
【0020】
【数1】
【0021】上記の量子化値が求まると、スペクトルパ
ラメータ量子化回路14が、この量子化値を復号化線形
予測係数αi ′,(i=1,...,P)に復号して、インパルス応
答計算回路21、逆フィルタ回路22、応答信号計算回
路51および重み付け信号計算回路52に送出する。ま
た、この量子化値のコードベクトルを示すインデックス
をマルチプレクサ41に送出する。
【0022】以下、一例として、周知のベクトル量子化
法によりLSPパラメータの量子化をする場合について
説明する。具体的には、例えば、特開平4−17150
0号公報、特開平4−363000号公報、特開平5−
6199号公報に開示される方法がある。あるいは、T.
Nomura氏他による“LSP Coding Using VQ-SVQ With Int
repolation in 4.075 kbps M-LCELP Speech Coder ”と
題した論文(Proc. Mobile Multimedia Communications,
pp.B.2.5, 1993)などを参照できるため、詳しい説明を
省略する。
【0023】ピッチ計算回路17は、入力信号x(n) に
対して、下記の式2における歪みDT1を最小化する遅延
T を求めるとともに、この遅延T に基づいて、下記の式
3によりピッチゲインβを求めて量子化するものであ
る。すなわち、導入した音声信号を入力信号x(n) とし
て、そのピッチに対応する整数サンプル値の最適化を行
って最適な遅延T を求め、この遅延T のインデックスを
マルチプレクサ41に送出している。ここで、x(n-T)
は、入力信号x(n) に対して遅延T のピッチにおける音
声信号を示すものである。
【0024】
【数2】
【0025】続いて、最適な遅延T に基づく量子化を行
ってピッチゲインβを求めることによって、そのインデ
ックスをマルチプレクサ41に送出している。他方、遅
延T および量子化ピッチゲインβをインパルス応答計算
回路21、逆フィルタ回路22、応答信号計算回路51
および重み付け信号計算回路52に送出している。
【0026】
【数3】
【0027】また、ピッチ計算回路17では、上記遅延
T を求める際、整数サンプル値による代わりに、小数サ
ンプル値により求めてもよい。この場合には、女性や子
供の音声信号のように高い周波数成分を多く含むものに
ついて遅延T の抽出精度を向上させることができる。具
体的には、例えば、P.Kroon 氏らによる“Pitch predic
tors with high temporal resolution”と題した論文(P
roc. ICASSP, pp.661-664,1990) などに記載されている
ため、詳しい説明を省略する。
【0028】インパルス応答計算回路21は、下記の式
4に示す伝達関数H1(z)のフィルタを有するものであっ
て、導入した線形予測係数αi 、この線形予測係数αi
を量子化して復号化した後の復号化線形予測係数α
i ′、上記の遅延T および量子化されたピッチゲインβ
に基づいて、上記伝達関数H1(z)のフィルタによるイン
パルス応答を算出して、その結果を第2直交変換回路2
5に送出している。
【0029】
【数4】
【0030】応答信号計算回路51では、導入した線形
予測係数αi 、復号化線形予測係数αi ′、遅延T およ
び量子化ピッチゲインβに基づいて、応答信号xz (n)
を求めるものである。すなわち、保存してあるフィルタ
メモリの数値を使用することによって、下記の式5によ
る入力信号d(n) をd(n) =0としたとき、その応答信
号xz (n) を1フレーム分だけ算出して、その結果を減
算器23に送出している。ここで、γは聴感重み付け量
を制御する重み係数である。
【0031】
【数5】
【0032】この場合に、(n-i) ≦0のときには下記の
式6および式7が成立する。ここで、Nはフレーム長で
あって、sw (n) は重み付け信号計算回路52の重み付
け出力信号であり、p(n) は上記の式5における右辺の
第3項が示す出力信号である。
【0033】
【数6】
【0034】聴感重み付け回路16は、下記の式8に示
す伝達関数W(z) のフィルタを有するものである。すな
わち、導入した各フレームの音声信号に対して、伝達関
数W(z) によるフィルタリングを行って式8による聴感
重み付け信号をxw (n) を算出し、その結果を減算器2
3に送出している。
【0035】
【数7】
【0036】減算器23は、導入した応答信号xz (n)
に基づいて、聴感重み付け信号xw(n) から聴感重み付
け減算信号xw (n) ′を求め逆フィルタ回路22に送出
するものである。すなわち、下記の式9によって聴感重
み付け信号xw (n) から1サブフレーム分について応答
信号xz (n) を減算している。
【0037】
【数8】
【0038】逆フィルタ回路22は、下記の式10に基
づく伝達特性F1(z)を有するフィルタである。すなわ
ち、導入した聴感重み付け減算信号xw (n) ′、線形予
測係数αi 、復号化線形予測係数αi ′遅延T および量
子化ピッチゲインβを、このフィルタに通すことによっ
て第1逆フィルタ出力信号e1(n)を求め、これを第1直
交変換回路24に送出している。
【0039】
【数9】
【0040】第1直交変換回路24は、導入した第1逆
フィルタ出力信号e1(n)に対して直交変換をするもので
あって、例えば、DCT変換による第1変換信号E(K),
(k=0,...,N-1) を求めて第1パルス量子化回路30およ
び第1ゲイン量子化回路42に送出している。このDC
T変換については、J.Triboletなどによる“Frequency
domain coding of speech,”と題した論文(IEEE Trns.
ASSP, vol.ASSP-27, pp.512-530, 1979)などに記載され
ているため、詳しい説明を省略する。
【0041】第2直交変換回路25は、導入したインパ
ルス応答から自己相関関数r(i),(i=0,...,N-1) を算出
し、続いて、この自己相関関数r(i) に点数NのDCT
変換をすることにより、第2変換信号R(k),(k=0,...,N
-1) を算出するものであって、その結果を第1パルス量
子化回路30および第1ゲイン量子化回路42に送出し
ている。
【0042】第1パルス量子化回路30は、第1変換信
号E(K) および第2変換信号R(k)に基づいて、予め定
めた個数の各パルス位置を探索することによって、下記
の式11における歪みDP1を最小化するパルス位置を求
めるものである。併せて、これら求めたパルス位置を第
1ゲイン量子化回路42に送出するとともに、各パルス
位置を所定のビット数によって符号化し、その結果をマ
ルチプレクサ41に送出している。ここで、Gは各パル
ス位置におけるパルスのゲインであって、mi はi番目
のパルス位置を示すもので、δはデルタ関数である。
【0043】
【数10】
【0044】この場合に、探索すべき各パルス位置を所
定数の候補に限定することによって、パルス位置を示す
インデックスの情報量、および上記探索時の演算量をと
もに削減することができる。例えば、各パルス位置が下
記の〔表1〕に示される総数N=160のものであっ
て、パルスの探索個数M=20とする。この場合に、各
パルス位置を3ビットによって示しうるため、20パル
ス全体をたかだか60ビットによって特定することがで
きる。
【0045】
【表1】
【0046】第1ゲイン量子化回路42は、ゲインコー
ドブック43を検索してゲインコードベクトルを求める
ものであって、このゲインコードベクトルを示すインデ
ックスを駆動信号計算回路52に、また、求めた各パル
ス位置を所定のビット数によって符号化し、そのベクト
ル値をマルチプレクサ41に送出している。すなわち、
下記の式12における歪みDG1を最小化する最適なゲイ
ンコードベクトルを算出する。ここで、Gj ′はj番目
のゲインコードベクトルを示すものである。
【0047】
【数11】
【0048】駆動信号計算回路53は、ゲインコードベ
クトルから下記の式13に基づく駆動音源信号V(K),(k
=0,...,N-1) を算出するものである。すなわち、導入し
た各インデックスによって、対応する各ゲインコードベ
クトルを読み出し、続いて、読み出されたゲインコード
ベクトルから算出した駆動音源信号V1(K)を逆直交変換
回路54に送出している。
【0049】
【数12】
【0050】逆直交変換回路54は、駆動音源信号V
1(K)のN点分について逆DCT変換をすることにより、
逆変換出力信号v(n) を求めて重み付け信号計算回路5
2に送出するものである。
【0051】重み付け信号計算回路52は、導入した逆
変換出力信号v(n) 、線形予測係数αi 、復号化線形予
測係数αi ′、遅延T および量子化ピッチゲインβから
応答信号sw (n) を求めるものである。すなわち、下記
の式14に従ってサブフレームごとに応答信号sw (n)
を算出して応答信号計算回路51に送出している。
【0052】
【数13】
【0053】図2は、本発明による第2実施形態を説明
する構成図である。第2実施形態では、第1実施形態に
おける第1パルス量子化回路30に代えて、振幅コード
ブック31を有する第2パルス量子化回路30aを備え
た新たな信号符号化装置が構成され、これらの他は第1
実施形態と同様である。この第2パルス量子化回路30
aは、下記の式15に基づいて歪みDP2を最小化するパ
ルス位置を探索する他は、第1パルス量子化回路30a
と同様である。ここで、signi は、i番目のパルス位置
におけるパルスの極性であって、第1変換信号E(K) を
判定することにより予めこの極性を決定しておく。
【0054】
【数14】
【0055】このような各パルス位置が得られると、第
2パルス量子化回路30aが振幅コードブック31を検
索するとともに、下記の式16における歪みDW2を最小
化する振幅コードベクトルを選択してゲイン量子化回路
42に送出している。併せて、得られた各パルス位置を
所定のビット数により符号化してマルチプレクサ41に
送出する。ここで、Aijはj番目の振幅コードベクトル
である。
【0056】
【数15】
【0057】図3は、本発明による第3実施形態を説明
する構成図である。第3実施形態では、第1実施形態の
前半部における第1インパルス応答計算回路21を第2
インパルス応答計算回路21aに、第1逆フィルタ回路
22を第2逆フィルタ回路22aに、第1応答信号計算
回路51を第2応答信号計算回路51aに、それぞれ置
き換えている。
【0058】併せて、第1実施形態の後半部における第
1パルス量子化回路30を第3パルス量子化回路30b
に、第1ゲイン量子化回路42を第2ゲイン量子化回路
42aにそれぞれ置き換えるとともに、第3パルス量子
化回路30bの出力を選択する選択回路32を更に備え
た別の新たな信号符号化装置が構成され、これらの他は
第1実施形態と同様である。但し、ピッチ計算回路17
が遅延T および量子化ピッチゲインβを第3パルス量子
化回路30bに送出している。
【0059】第2インパルス応答計算回路21aは、下
記の式17に示す伝達関数H2(z)のフィルタを有するも
のである他は、第1インパルス応答計算回路21と同様
である。すなわち、この伝達関数H2(z)による演算を行
ってインパルス応答を求め第2直交変換回路25に送出
している。
【0060】
【数16】
【0061】第2逆フィルタ回路22aは、下記の式1
8に示す伝達関数F2(z)によるフィルタを有するもので
ある他は、第1逆フィルタ回路22と同様である。すな
わち、この伝達関数F2(z)によって、聴感重み付け減算
信号に対する逆フィルタリングを行うことにより、第2
逆フィルタ出力信号e2(n)を求めて第1直交変換回路2
4に送出している。
【0062】
【数17】
【0063】第3パルス量子化回路30bは、導入した
遅延T およびピッチゲインβに基づく第1のパルス群
と、第1パルス量子化回路30によると同様の第2のパ
ルス群との探索を相互独立に行う他は、第1パルス量子
化回路30と同様である。すなわち、先ず、この遅延T
を周波数に変換してピッチ周波数fT を求め、このピッ
チ周波数fT だけ離れた位置のパルスにピッチゲインβ
を乗算しつつ、これら演算を繰り返すことによって各パ
ルスを探索していく。
【0064】続いて、上記の式15によって各パルスの
歪みDP2を算出し、この歪みDP2を最小化する所定数の
パルス位置を求めることによって第1のパルス群を構成
し、それぞれの歪みDP2とともに選択回路32に送出し
ている。その一方で、ピッチ周波数fT およびピッチゲ
インβを使用せずに、各パルスの探索を行い、続いて、
第1パルス群と同様に歪みDP2を最小化する所定数のパ
ルス位置を求めることによって第2のパルス群を構成
し、それぞれの歪みDP2とともに選択回路32に送出し
ている。選択回路32では、第1および第2パルス群の
うちから、いずれか歪みDP2が小さい方のパルス群を選
択して第2ゲイン量子化回路42aに送出する。
【0065】図4は、本発明による第4実施形態を説明
する構成図である。第4実施形態では、第3実施形態に
おける第3パルス量子化回路30bに代えて、振幅コー
ドブック31を有する第4パルス量子化回路30cを備
えた別の新たな信号符号化装置が構成され、これらの他
は第3実施形態と同様である。
【0066】第4パルス量子化回路30cは、パルス位
置の探索によって第1および第2パルス群を抽出する際
に、振幅コードブック31を使用するものである他は、
第3パルス量子化回路30bと同様である。この場合、
この振幅コードブック31によって最適な各振幅コード
ベクトルを検索することができる。選択回路32では、
第1および第2パルス群のうちから、いずれか歪みDP2
が小さい方のパルス群を選択して第2ゲイン量子化回路
42aに送出している。
【0067】図5は、本発明による第5実施形態を説明
する構成図である。第5実施形態では、第1実施形態に
おける第1パルス量子化回路30に代えて、音源コード
ブック33を有する第5パルス量子化回路30dを備え
るとともに、第1ゲイン量子化回路42に代えて、第2
ゲインコードブック44を有する第2ゲイン量子化回路
42aを備えた別の新たな信号符号化装置が構成され、
これらの他は第1実施形態と同様である。
【0068】音源コードブック33には、所定のビット
数Bを有する2B 種類の音源コードベクトルが予め設定
され、また、第2ゲインコードブック44には、2次元
のゲインコードベクトルが設定されている。
【0069】第5パルス量子化回路30dは、パルス位
置の探索によって所定数のパルス群を抽出する際に、音
源コードブック33を使用するものである他は、第1パ
ルス量子化回路30と同様である。この場合、この音源
コードブック33によって最適な音源コードベクトルを
抽出することができる。すなわち、音源コードブック3
3から各音源コードベクトルを読み出し、下記の式19
における歪みDP5を最小化するものを選別している。こ
こで、cj (K)は音源コードベクトルで、G1 は探索す
べき各パルス位置におけるパルスのゲイン、G2 は音源
コードベクトルcj (K) のゲインである。
【0070】
【数18】
【0071】第2ゲイン量子化回路42aは、第2ゲイ
ンコードブック44を検索するものである他は、第1ゲ
イン量子化回路42と同様である。この場合、この第2
ゲインコードブック44によって最適なゲインコードベ
クトルを抽出することができ、そのインデックスを駆動
信号計算回路52に、また、そのベクトル値をマルチプ
レクサ41に送出している。すなわち、第2ゲインコー
ドブック44から各ゲインコードベクトルを読み出し、
下記の式20における歪みDG5が最小化するものを選別
する。ここで、G1j′およびG2j′は第2ゲインコード
ブックのj番目のゲインコードベクトルにおける各要素
を示すものである。
【0072】
【数19】
【0073】第2駆動信号計算回路53aは、導入され
た各インデックスによって対応する各ゲインコードベク
トルを読み出し、駆動音源信号V5(K)を求めて逆直交変
換回路54に送出するものである他は、第1駆動信号計
算回路53と同様である。
【0074】
【数20】
【0075】図6は、本発明による第6実施形態を説明
する構成図である。第6実施形態では、第5実施形態に
おける第5パルス量子化回路30aに代えて、振幅コー
ドブック32および音源コードブック33を併有する第
6パルス量子化回路30eを備えた別の新たな信号符号
化装置が構成され、これらの他は第5実施形態と同様で
ある。
【0076】第6パルス量子化回路30dは、パルス位
置の探索によって所定数のパルス群を抽出する際に、振
幅コードブック31を検索するものである他は、第5パ
ルス量子化回路30aと同様である。この場合、この振
幅コードブック31によって各パルスにおける振幅の量
子化を行うことができる。続いて、音源コードブック3
3を検索することによって、最適な音源コードベクトル
のパルス群を第2ゲイン量子化回路42aに、そのベク
トル値をマルチプレクサ41に送出する。すなわち、音
源コードブック33から各音源コードベクトルを読み出
し、下記の式22における歪みDW6を最小化するものを
選別している。ここで、Ai はi番目の振幅コードベク
トルである。
【0077】
【数21】
【0078】第2ゲイン量子化回路42aは、第2ゲイ
ンコードブック44を検索するものである他は、第1ゲ
イン量子化回路42と同様である。この場合、この第2
ゲインコードブック44によって、下記の式20におけ
る歪みDG6が最小化する最適なゲインコードベクトルを
求めることができ、そのインデックスを第2駆動信号計
算回路52aに、また、そのベクトル値をマルチプレク
サ41に送出している。
【0079】
【数22】
【0080】第2駆動信号計算回路53aは、導入され
た各インデックスによって対応する各ゲインコードベク
トルを読み出し、駆動音源信号V6(K)を求めるものであ
る他は、第1駆動信号計算回路53と同様であって、求
めた駆動音源信号V6(K)を逆直交変換回路54に送出し
ている。
【0081】
【数23】
【0082】図7は、本発明による第7実施形態を説明
する構成図である。第7実施形態では、第3実施形態に
おける第1選択回路32に代えて、音源コードブック3
3を有する第2選択回路32aを備えるとともに、第1
ゲイン量子化回路42に代えて、第2ゲインコードブッ
ク44を有する第2ゲイン量子化回路42aを備え、更
に、第1駆動信号回路53を第2駆動信号回路53aと
置き換えた別の新たな信号符号化装置が構成され、これ
らの他は第3実施形態と同様である。
【0083】第2選択回路32aは、下記の式25にお
ける歪みDP7を最小化するパルスおよび振幅コードベク
トルの組み合わせを探索するものである他は、第1選択
回路32と同様である。すなわち、導入した第1および
第2パルス群のうちから、いずれか歪みDP2が小さい方
のパルス群を選択し、続いて、最適化をされた上記の組
み合わせを選択して第2ゲイン量子化回路42aに送出
している。
【0084】
【数24】
【0085】図8は、本発明による第8実施形態を説明
する構成図である。第8実施形態では、第7実施形態に
おける第7パルス量子化回路30fに代えて、第2選択
回路32aおよび振幅コードブック31を併有する第8
パルス量子化回路30gを備える別の新たな信号符号化
装置が構成され、これらの他は第7実施形態と同様であ
る。
【0086】第8パルス量子化回路30gは、第1およ
び第2パルス群を抽出する際に、振幅コードブック31
を検索するものである他は、第7パルス量子化回路30
fと同様である。この場合、この振幅コードブック31
によって最適な振幅コードベクトルを求めることがで
き、求めた各振幅コードベクトルを各々の歪みDP2とと
もに第2選択回路32aに送出している。
【0087】第2選択回路32aでは、これら第1およ
び第2パルス群のうちから、いずれか歪みDP2が小さい
方のパルス群を選択する。続いて、選択されたパルスお
よび振幅コードベクトルの組み合わせに対して、音源コ
ードブック33を検索することによって下記の式26の
歪みDP8を最小化するコードベクトルを選択する。更
に、これら選択されたパルス、振幅コードベクトルおよ
び音源コードベクトルの組み合わせを第2ゲイン量子化
回路42aに送出している。
【0088】
【数25】
【0089】以上の各実施形態において、直交変換の手
段としては、上記DCT変換の他にも、周知のMDCT
(Modified DCT)変換などを使用することもできる。
この場合、より演算の簡略化が可能となる。
【0090】また、スペクトルパラメータ量子化回路に
おいて、ビット数の配分方法としては、量子化したスペ
クトルパラメータを直交変換してパワースペクトルを求
め、細分化した区間ごとのパワーの相対比から配分する
方法も知られている。この場合、より実効的な音質が得
られる。
【0091】また、各パルス量子化回路において、点数
Nにおける直交変換の各係数を量子化する例について述
べたが、この直交変換の各係数を更に細分化した点数M
ごとに量子化を行うこともできる。この場合、多次元で
の量子化が可能となる。
【0092】更に、第4、第5、第6、第7および第8
実施形態における各パルス量子化回路において、音源コ
ードブックを検索してパルスの音源コードベクトルを選
択するときに、多段のベクトル量子化を行うことができ
る。この場合、更に演算量を削減することができる。
【0093】更に、第2、第4、第6および第8実施形
態における各パルス量子化回路において、振幅コードブ
ックを検索してパルスの振幅を量子化するときに、振幅
コードブックのビット数を音声信号の周波数軸上のパワ
ーに応じて割り当てて配分することもできる。この場
合、より実効的な情報量の削減が可能となる。
【0094】また、パラメータ計算回路またはインパル
ス応答回路から求めたスペクトルの包絡形状からパルス
位置をフレームごとに予め算出し、パルスの極性または
振幅のみを少なくとも1つ以上まとめて量子化すること
もできる。この場合、パルス位置に関する情報量の転送
を省略できる。
【0095】その他、本発明は前述の実施例にのみ限定
されるものではなく、その他、本発明の要旨を逸脱しな
い範囲で種々の変更を加え得ることは勿論である。
【0096】
【発明の効果】以上述べたように、本発明の信号符号化
装置には次の効果がある。第1に、音声信号またはこれ
に由来する信号についての直交変換を行うことによっ
て、それぞれの出力信号の一部分または全部を複数個の
パルスに量子化している。このため、各出力係数の転送
に必要な情報量を削減でき、その結果、転送ビットレー
トを低減することができる。
【0097】第2に、入力信号からピッチ周波数を抽出
することによって、量子化すべきパルスを繰り返しなが
らパルス位置を探索した第1パルス群と、このピッチ周
波数を使用せずに探索を行った第2パルス群とのうちか
ら、いずれか歪みが小さい方のパルス群を選択してい
る。このため、音声信号の特性に基づいて最適なパルス
群の探索が可能となる。
【0098】第3に、探索したパルスおよび音源コード
ブックから読み出したコードベクトルを組み合わせるこ
とによって、この組み合わせを量子化に伴う出力として
使用している。このため、探索したパルスのみによって
は得られなかった音声信号の成分をも量子化することが
でき、その結果、量子化出力における包括的な音質の改
善ができる。
【0099】従って、高い周波数成分を有する音声信号
について少ない演算量による量子化を行うため、低いビ
ットレートによる優れた音質の符号化が実現できる信号
符号化装置を提供できるようになった。
【図面の簡単な説明】
【図1】本発明による第1実施形態を概略的に示す構成
図である。
【図2】本発明による第2実施形態を概略的に説明する
構成図である。
【図3】本発明による第3実施形態を概略的に説明する
構成図である。
【図4】本発明による第4実施形態を概略的に説明する
構成図である。
【図5】本発明による第5実施形態を概略的に説明する
構成図である。
【図6】本発明による第6実施形態を概略的に説明する
構成図である。
【図7】本発明による第7実施形態を概略的に説明する
構成図である。
【図8】本発明による第8実施形態を概略的に説明する
構成図である。
【符号の説明】
11 入力端子 12 フレーム分割回路 13 スペクトルパラメータ計算回路 14 スペクトルパラメータ量子化回路 15 コードブック 16 第1聴感重み付け回路 17 ピッチ計算回路 21 第1インパルス応答計算回路 22 第1逆フィルタ回路 23 減算回路 24 第1直交変換回路 25 第2直交変換回路 30 第1パルス量子化回路 41 マルチプレクサ 42 第1ゲイン量子化回路 43 第1ゲインコードブック 51 第1応答信号計算回路 52 第1重み付け計算回路 53 駆動信号計算回路 54 逆直交変換回路
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/04

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声信号を符号化する信号符号化装置に
    おいて、 音声信号からスペクトルパラメータおよびピッチパラメ
    ータを求めて量子化するパラメータ計算手段と、 これら量子化されたスペクトルパラメータまたはピッチ
    パラメータのうち、少なくとも一つによって構成される
    フィルタにより、そのインパルス応答を算出するインパ
    ルス応答計算手段と、 量子化されたスペクトルパラメータおよびピッチパラメ
    ータに基づいて、音声信号または音声信号に由来する信
    号の直交変換をして第1変換信号を求める第1直交変換
    手段と、 算出されたインパルス応答またはインパルス応答に由来
    する信号の直交変換をして第2変換信号を求める第2直
    交変換手段と、 第1変換信号の一部分または全部、および第2変換信号
    を量子化することによって複数個のパルスを求めるパル
    ス量子化手段とを備えることを特徴とする信号符号化装
    置。
  2. 【請求項2】 前記パルス量子化手段には、前記複数個
    のパルスをピッチパラメータに基づいて繰り返しながら
    第1パルス群を探索する第1探索部と、第2変換信号に
    基づいて第2パルス群を探索する第2探索部とを有して
    おり、 第1パルス群および第2パルス群のうちから第1変換信
    号を最適化するものを選択する選択回路を更に備える請
    求項1記載の信号符号化装置。
  3. 【請求項3】 前記パルス量子化手段は、コードブック
    から検索されたコードベクトルを併せて使用することに
    よって、前記複数個のパルスを求めるものである請求項
    1または請求項2記載の信号符号化装置。
  4. 【請求項4】 前記パルス量子化回路は、前記複数個の
    パルスの各極性または各振幅を少なくとも一つ以上まと
    めて量子化するものである請求項1、請求項2または請
    求項3記載の信号符号化装置。
JP06763797A 1997-03-21 1997-03-21 信号符号化装置 Expired - Fee Related JP3147807B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP06763797A JP3147807B2 (ja) 1997-03-21 1997-03-21 信号符号化装置
DE69826755T DE69826755D1 (de) 1997-03-21 1998-03-23 Sprachsignalkodierer
US09/046,159 US6236961B1 (en) 1997-03-21 1998-03-23 Speech signal coder
EP98105186A EP0866443B1 (en) 1997-03-21 1998-03-23 Speech signal coder
CA002232977A CA2232977C (en) 1997-03-21 1998-03-23 Speech signal coder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06763797A JP3147807B2 (ja) 1997-03-21 1997-03-21 信号符号化装置

Publications (2)

Publication Number Publication Date
JPH10260698A JPH10260698A (ja) 1998-09-29
JP3147807B2 true JP3147807B2 (ja) 2001-03-19

Family

ID=13350720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06763797A Expired - Fee Related JP3147807B2 (ja) 1997-03-21 1997-03-21 信号符号化装置

Country Status (5)

Country Link
US (1) US6236961B1 (ja)
EP (1) EP0866443B1 (ja)
JP (1) JP3147807B2 (ja)
CA (1) CA2232977C (ja)
DE (1) DE69826755D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7142839B2 (ja) 2018-05-09 2022-09-28 株式会社鴻池組 フレキシブルコンテナバッグ

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6449592B1 (en) * 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
BRPI0808198A8 (pt) 2007-03-02 2017-09-12 Panasonic Corp Dispositivo de codificação e método de codificação
JP5241701B2 (ja) 2007-03-02 2013-07-17 パナソニック株式会社 符号化装置および符号化方法
JP5299327B2 (ja) * 2010-03-17 2013-09-25 ソニー株式会社 音声処理装置、音声処理方法、およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5568588A (en) * 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
DE69615227T2 (de) * 1995-01-17 2002-04-25 Nec Corp Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7142839B2 (ja) 2018-05-09 2022-09-28 株式会社鴻池組 フレキシブルコンテナバッグ

Also Published As

Publication number Publication date
CA2232977A1 (en) 1998-09-21
EP0866443A3 (en) 1999-05-12
CA2232977C (en) 2002-05-28
EP0866443A2 (en) 1998-09-23
EP0866443B1 (en) 2004-10-06
JPH10260698A (ja) 1998-09-29
DE69826755D1 (de) 2004-11-11
US6236961B1 (en) 2001-05-22

Similar Documents

Publication Publication Date Title
EP0942411B1 (en) Audio signal coding and decoding apparatus
JP3094908B2 (ja) 音声符号化装置
CA2271410C (en) Speech coding apparatus and speech decoding apparatus
JP2778567B2 (ja) 信号符号化装置及び方法
JPH0990995A (ja) 音声符号化装置
JP3541680B2 (ja) 音声音楽信号の符号化装置および復号装置
EP1513137A1 (en) Speech processing system and method with multi-pulse excitation
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3335841B2 (ja) 信号符号化装置
JP3266178B2 (ja) 音声符号化装置
JPH07261800A (ja) 変換符号化方法、復号化方法
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP3147807B2 (ja) 信号符号化装置
JP2970407B2 (ja) 音声の励振信号符号化装置
US6208962B1 (en) Signal coding system
JP3185748B2 (ja) 信号符号化装置
JP3003531B2 (ja) 音声符号化装置
JPH09230898A (ja) 音響信号変換符号化方法及び復号化方法
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3024467B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3092436B2 (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080112

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees