JP3138574B2 - 線形予測係数補間装置 - Google Patents

線形予測係数補間装置

Info

Publication number
JP3138574B2
JP3138574B2 JP05217373A JP21737393A JP3138574B2 JP 3138574 B2 JP3138574 B2 JP 3138574B2 JP 05217373 A JP05217373 A JP 05217373A JP 21737393 A JP21737393 A JP 21737393A JP 3138574 B2 JP3138574 B2 JP 3138574B2
Authority
JP
Japan
Prior art keywords
coefficient
interpolation
hyperbolic
conversion
linear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05217373A
Other languages
English (en)
Other versions
JPH0774642A (ja
Inventor
修一 河間
吉伸 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP05217373A priority Critical patent/JP3138574B2/ja
Publication of JPH0774642A publication Critical patent/JPH0774642A/ja
Application granted granted Critical
Publication of JP3138574B2 publication Critical patent/JP3138574B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、線形予測係数を使用す
る音声情報処理システムに関し、特に音声情報処理シス
テムに用いることができる線形予測係数補間装置に関す
る。
【0002】
【従来の技術】従来の技術では、入力された音声信号を
線形予測分析し、線形予測係数によりスペクトル情報を
得て、得られたスペクトル情報を伝送することにより実
際の音声信号を伝送するよりも低ビットレートで音声の
通信を行う方式が実現されている。
【0003】上記の線形予測分析を使用して、低ビット
レートの伝送を行う為の音声符号化復号化方法として
は、CELP(Code Excited Linea
r Prediction)方式が知られている。
【0004】CELP方式は、音声の生成をモデル化し
たもので、声門で生じる気流に相当する信号の候補をコ
ードブックに持っており、この中の一つの信号に声帯の
開閉の周期に相当するピッチを付加するピッチ予測(ま
たは長期予測)フィルタ、口腔での調音に相当する(短
期)予測フィルタを通すことによって合成音声を生成す
る。このとき気流に相当する信号の候補からなるコード
ブックの中から最適な信号をAbS(Analysis
by Synthesis)法、即ち合成による分析
法で求め、この信号の番号、利得、ピッチ予測フィルタ
の係数、ラグ(ピッチ長に相当)、線形予測フィルタの
係数を量子化及び符号化している。
【0005】CELP方式では、入力音声信号を約20
〜40msのフレームに分割し、各フレームを4〜5の
サブフレームに分割して処理を行う。また、CELP方
式ではフレーム単位に線形予測係数を求め、それらを補
間することによってサブフレーム単位の線形予測係数を
求める。本来、線形予測係数は、サブフレーム毎に求め
る方が合成音質の良い符号化を行える。しかし、計算量
が多くなり、伝送する符号の量が増加する為、一般的に
上記方式が用いられている。
【0006】従来、CELP方式では、線形予測係数の
補間方法としてLAR(Log Area Rati
o:パーコール(PARCOR)係数の対数変換形(対
数断面積比))による補間を用いている。即ち、線形予
測係数からPARCOR係数に変換し、PARCOR係
数から下記(1)式によりLARを求める。
【0007】
【数1】
【0008】そしてLARの上で線形補間を行い、補間
結果を(1)式の逆変換によりPARCOR係数に変換
してサブフレーム単位の線形予測係数を求める。
【0009】ここでLARについて説明する。
【0010】PARCOR係数は、相関値を表し、その
値は−1〜+1を取るが、PARCOR係数の次数によ
りその分布に偏りが存在する為、偏りの大きい2次まで
のPARCOR係数に関して非線形変換を施して補間を
行う。ここで、(1)式で示すgmの2倍、即ち2gm
をLARと呼ぶ。
【0011】図5は、PARCOR係数からLARの変
換結果を示す。図5に示すように、LARは、±1付近
のPARCOR係数に関しては敏感な変換特性を持つの
で、このLAR変換を予め施すことにより補間誤差は減
少する。また、中高次のPARCOR係数は偏在が少な
く0付近に分散している。LARは0付近のPARCO
R係数に関しては線形に近い変換を施す為、中高次のP
ARCOR係数の特性にも合致する。
【0012】
【発明が解決しようとする課題】しかしながら、上述し
た従来の技術では、現在、線形予測係数の補間において
CELPで一般的に使用されているLARは、補間誤差
は少ないが対数を使用する必要があるため、ディジタル
・シグナル・プロセッサ(DSP)上で実現した場合に
計算量が多くなるという問題点があった。
【0013】本発明の目的は、上記従来の技術における
問題点に鑑み、DSP上で実現しても計算量を大幅に減
少することができる線形予測係数補間装置を提供するこ
とにある。
【0014】
【課題を解決するための手段】本発明の目的は、一定時
間長の入力音声信号から得られた所定次数のPARCO
R係数を双曲線変換する変換手段と、変換手段に接続さ
れており双曲線変換された変換結果を線形補間する補間
手段と、補間手段に接続されており線形補間された線形
補間結果を逆変換する逆変換手段とを備える線形予測係
数補間装置によって達成される。
【0015】本発明の線形予測係数補間装置では、双曲
線変換手段は、所定次数のPARCOR係数が±1の値
に近付く程、急傾斜を持つように双曲線変換を行うよう
に構成してもよい。
【0016】
【作用】本発明の線形予測係数補間装置では、変換手段
は一定時間長の入力音声信号から得られた所定次数のP
ARCOR係数を双曲線変換し、補間手段は双曲線変換
された変換結果を線形補間し、逆変換手段は線形補間さ
れた線形補間結果を逆変換する。
【0017】本発明の線形予測係数補間装置では、双曲
線変換手段は、所定次数のPARCOR係数が±1の値
に近付く程、急傾斜を持つように双曲線変換する。
【0018】
【実施例】以下、図面を参照して本発明の線形予測係数
補間装置の実施例を説明する。
【0019】図1は、本発明の線形予測係数補間装置で
ある予測係数補間部の一実施例を示すブロック図であ
る。
【0020】図2は、図1の主要部を備えたCELP方
式の符号化復号化装置の一実施例の構成を示すブロック
図である。
【0021】ここで、図1の説明を行う前に、図2の符
号化復号化装置を参照して、図1の予測係数補間部の役
割を示す。
【0022】まず、図2の符号化部を説明する。
【0023】図2の符号化部では、線形予測分析(短期
予測)部1において、サンプリング周波数fsでサンプ
リングされたディジタル入力信号s(t)の線形予測分
析があるフレーム周期で行われ、量子化されたフレーム
単位のPARCOR係数が求められる。ここで、tはサ
ンプル時点を示す。
【0024】その後、予測係数補間部6(図1参照)中
の、変換手段である双曲線変換部61において、低次の
PARCOR係数の偏在を緩和する変換を行い、それら
の変換結果を補間手段である線形補間部62にて線形補
間を行う。その後、逆変換手段である双曲線逆変換部6
3にて補間結果の逆変換を行い、サブフレーム単位の補
間PARCOR係数を求める。
【0025】聴覚重み付けフィルタ2は、式(2)で示
す伝達関数W(z)を持つ。
【0026】
【数2】
【0027】ここで、α(m) i (0≦m<M,0<i≦
P)は第mサブフレームのi次の補間後の線形予測係数
を表し、Mは1フレームに含まれるサブフレーム数を表
す。
【0028】つまり、聴覚重み付けフィルタ2は、式
(3)に基づいて入力信号の残差信号を得る逆フィルタ
201と、
【0029】
【数3】
【0030】式(4)に基づいて重み付け線形予測フィ
ルタ202と、
【0031】
【数4】
【0032】からなり、入力信号s(t)のスペクトル
の谷の部分を強調させた信号u(t)を決める。
【0033】ここで、λはスペクトルの谷の部分をどれ
だけ強調するかを決定するパラメータであり、0に近い
ほど谷の部分が強調される。この信号u(t)にできる
だけ似た信号(聴覚重み付けされた合成信号)u′
(t)を合成するように符号化が行われる。この処理は
サブフレーム単位で行われる。1フレームあたりのサン
プル数をFとする。
【0034】この聴覚重み付けフィルタ2により、後に
説明する合成信号s′(t)はパワーの小さいスペクト
ルほど入力信号s(t)との誤差が小さくなり、聴覚の
マスキング特性によりマスクされ難いこれらのスペクト
ル成分の雑音を小さくすることができるので、聴覚的に
合成音質は良くなる。
【0035】コードブック3には、励起信号ベクトルが
N個(ここで、Nは正の整数)入っており、この中の一
つの励起信号ベクトルcj(t)(0≦j<N)は、乗
算器4によりγ倍され、ピッチ予測フィルタ5でピッチ
成分が付け加えられ、重み付け合成フィルタ7(伝達関
数はフィルタ202と同じ)を通ることにより、聴覚重
み付けされた合成信号u′j(t)が得られる。ここ
で、最適な励起信号ベクトルcj(t)を選択する為に
AbS(Analysis by Synthesi
s)法を用いる。
【0036】図2においてAbS法を説明する。コード
ブック3中の励起信号ベクトルcj(t)が乗算器4で
利得γによる乗算が行われ、ピッチ予測フィルタ5でピ
ッチ成分が付加される。その後、重み付け合成フィルタ
7により合成音声信号u′j(t)が生成される。合成
音声信号とターゲットの入力音声信号u(t)の差分が
減算器8で計算され、誤差信号ej(t)が生成され
る。この誤差信号ej(t)のパワーPjがパワー計算
部9によって式(5)に基づいて計算される。
【0037】
【数5】
【0038】そして、このパワーPjが最小となるコー
ドブック3の励起信号ベクトルcj、γ、ピッチ予測フ
ィルタの係数をエラー最小化部10で検索する。
【0039】線形予測係数、励起信号のインデックス
j、利得γ、ピッチ予測フィルタの係数、ピッチ長が符
号化・マルチプレクサ部11で符号化、マルチプレクサ
化されて伝送路12に送られる。この伝送路12とし
て、無線系、有線系、蓄積系がある。
【0040】次に、図2の復号化部を説明する。
【0041】復号化部では、デマルチプレクサ・復号化
部13において、伝送された符号列がデマルチプレク
ス、復号化され、線形予測係数、励起信号のインデック
スj、利得γ、ラグ(ピッチ長)、ピッチ予測フィルタ
の係数が得られる。符号化部のコードブック3と同じ励
起信号ベクトルを持つコードブック14の中のjで示さ
れる励起信号ベクトルcj(t)が乗算器15によりγ
倍され、符号化部のピッチ予測フィルタ5と同じ構造の
ピッチ予測フィルタ16でピッチ成分が付加され、更
に、式(6)で示される伝達関数F(z)
【0042】
【数6】
【0043】を持つ線形予測フィルタ(合成フィルタ)
17を通ることにより、合成信号s′(t)が得られ
る。式(6)で用いられる線形予測係数α(m) i は、伝
送されたフレーム毎の線形予測係数を予測係数補間部1
8において各サブフレーム毎に補間したものである。
【0044】予測係数補間部18は予測係数補間部6と
同様の構造をしており、双曲線変換を施した後、線形補
間を行い、その後、双曲線逆変換を行いサブフレーム毎
のPARCOR係数を求める。
【0045】次に、図1の予測係数補間部6を詳細に説
明する。
【0046】図2の短期予測部1では1フレームの音声
区間毎にP次(Pは正の整数)のPARCOR係数を求
める。その後、PARCOR係数kj(j=1〜P)を
量子化する。以降、この量子化したPARCOR係数を
使用する。
【0047】予測係数補間部6では直前のフレームで求
めたPARCOR係数と現在のフレームで求めたPAR
COR係数との線形補間を行なうことによりM個(Mは
正の整数)のサブフレーム単位のPARCOR係数を求
める。この線形補間PARCOR係数は、低次のPAR
COR係数については双曲線変換部61で変換し、その
結果を線形補間部62で補間し、その後、双曲線逆変換
部63で逆変換することにより得る。また、中・高次の
PARCOR係数については線形補間部62で線形補間
のみ行う。
【0048】上記方法により決定されたPARCOR係
数を線形予測係数αi(i=0〜P)に変換し、各々の
サブフレームで求めた線形予測係数を使用する。但し、
1次のPARCOR係数k1の補間は、各フレームのk
1を下記の式(7)で変換した後に線形補間し、式
(8)により逆変換する。
【0049】
【数7】
【0050】
【数8】
【0051】上記式(7)及び式(8)により、+1に
偏在するk1は図3に示されるように分配される。この
変換式において、定数aの値が大きくなる程±1付近で
の傾斜が大きくなる。2次のPARCOR係数も同様に
変換、補間可能である。また、±1に非常に近い値のP
ARCOR係数をLARで表現すると非常に大きな値と
なり、大きなダイナミックレンジが必要となるが、この
変換式によればそのようなPARCOR係数を変換して
小さなダイナミックレンジで表現可能である。
【0052】次に、図4のフローチャートを参照して、
本実施例によるPARCOR係数補間処理の動作を説明
する。
【0053】まず、n番目のフレームのPARCOR係
数ki(次数i=1〜P)が入力処理で予測係数補間部
6(図1)に入力され(401)、PARCOR係数の
次数を表す変換iを1に初期化する(402)。PAR
COR係数の次数が判定され(403)、低次のPAR
COR係数は式(7)によるyi(n)への変換が行わ
れ(404)、中高次のPARCOR係数はyi(n)
への無変換代入が行われる(405)。そして、次数を
表す変数iをインクリメントする(406)。全ての次
数のPARCOR係数におけるyi(n)を求める。そ
の処理の終了を判定する(407)。その後、yi
(n)は前フレームのyi(n−1)と補間されてy
i′(n)が求まる(408)。その補間式を式(9)
に示す。
【0054】
【数9】
【0055】再び図4に戻って、前フレームのPARC
OR係数yi(n−1)を現在のフレームのPARCO
R係数yi(n)により更新して(409)、上記ステ
ップ402と同様に、次数を表す変数iに初期値1を代
入する(410)。
【0056】その処理後、低次のyi′(n)は双曲線
変換(式(8))されてPARCOR係数へと変換され
る(411、412)。また、中高次のyi′(n)は
そのままPARCOR係数に代入される(413)。こ
れらの変換処理は全ての次数のyi′(n)についてな
され、その後、次数を表す変数iをインクリメントして
(414)、その処理終了を判定する(415)。これ
により求まったPARCOR係数がサブフレーム単位の
処理に適用される(416)。
【0057】図4のフローチャートにおいて、ステップ
402から407までが図1の双曲線変換部61、ステ
ップ408が図1の線形補間部62、ステップ409か
ら415までが図1の双曲線逆変換部63で処理され
る。
【0058】双曲線変換ステップ404及び双曲線逆変
換ステップ412の変換式として、本実施例では式
(7)及び式(8)に示す双曲線関数を用いたが、図3
に示すような±1付近に偏在するPARCOR係数を分
配変換する特性を持つ関数ならば、補間結果は改善され
るので、このような特性を持つ高次の曲線を用いても良
いが実現の際の計算量の観点からは双曲線関数が適当で
ある。なぜなら、双曲線関数であれば、その逆変換も簡
易であり計算量の点からも適していると判断できる。
【0059】上述したように、本発明では、線形予測係
数を補間する前にその分布を考慮した線形変換を施すこ
とによりLARに変換することなく良い補間特性を示
し、またLARに変換しないため計算量を大幅に減ずる
ことができる。即ち、補間誤差の影響削減の効果とし
て、実施例において説明したように、±1付近に偏在す
る提示PARCOR係数の補間による誤差を、その分布
を考慮した変換を行うことにより削減する。また、計算
量削減の効果として、本方式による線形予測係数の補間
ではLARの計算に必要である対数の計算が不必要とな
り、この方式を実際に計算機上で実現する際に計算量を
減少できる。
【0060】
【発明の効果】本発明の線形予測係数補間装置は、一定
時間長の入力音声信号から得られた所定次数のPARC
OR係数を双曲線変換する変換手段と、変換手段に接続
されており双曲線変換された変換結果を線形補間する補
間手段と、補間手段に接続されており線形補間された線
形補間結果を逆変換する逆変換手段とを備えるので、L
ARの計算に必要である対数の計算が不必要となり、こ
の方式を実際に計算機上で実現する際に計算量を減少で
きる。
【0061】また、本発明の線形予測係数補間装置で
は、双曲線変換手段は、所定次数のPARCOR係数が
±1の値に近付く程、急傾斜を持つように双曲線変換を
行うので、±1付近に偏在する提示PARCOR係数の
補間による誤差を、その分布を考慮した変換を行うこと
により削減できる。
【図面の簡単な説明】
【図1】本発明の線形予測係数補間装置の一実施例の構
成を示すブロック図である。
【図2】図1の線形予測係数補間部を備えた音声符号化
復号化装置の一構成例を示すブロック図である。
【図3】図1の線形予測係数補間部によるPARCOR
係数の分布を表す説明図である。
【図4】図1の線形予測係数補間部によるPARCOR
係数補間処理の動作を説明するためのフローチャートで
ある。
【図5】PARCORからLARへの変換結果の説明図
である。
【符号の説明】
1 短期予測部 2 聴覚重み付けフィルタ 3,14 コードブック 4,15 乗算器 5,16 ピッチ予測フィルタ 6,18 予測係数補間部 7,202 重み付け合成フィルタ 8 減算器 9 パワー計算部 10 エラー最小化部 11 符号化、マルチプレクサ部 12 伝送路 13 デマルチプレクサ、復号化部 17 合成フィルタ 61 双曲線変換部 62 線形補間部 63 双曲線逆変換部 201 線形予測フィルタ
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 G10L 19/00 - 19/14 H03M 7/30 H04B 14/04

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 一定時間長の入力音声信号から得られた
    所定次数のパーコール係数を双曲線変換する変換手段
    と、該変換手段に接続されており該双曲線変換された変
    換結果を線形補間する補間手段と、該補間手段に接続さ
    れており該線形補間された線形補間結果を逆変換する逆
    変換手段とを備えることを特徴とする線形予測係数補間
    装置。
  2. 【請求項2】 前記双曲線変換手段は、前記所定次数の
    パーコール係数が±1の値に近付く程、急傾斜を持つよ
    うに双曲線変換を行うことを特徴とする請求項1に記載
    の線形予測係数補間装置。
JP05217373A 1993-09-01 1993-09-01 線形予測係数補間装置 Expired - Fee Related JP3138574B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05217373A JP3138574B2 (ja) 1993-09-01 1993-09-01 線形予測係数補間装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05217373A JP3138574B2 (ja) 1993-09-01 1993-09-01 線形予測係数補間装置

Publications (2)

Publication Number Publication Date
JPH0774642A JPH0774642A (ja) 1995-03-17
JP3138574B2 true JP3138574B2 (ja) 2001-02-26

Family

ID=16703161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05217373A Expired - Fee Related JP3138574B2 (ja) 1993-09-01 1993-09-01 線形予測係数補間装置

Country Status (1)

Country Link
JP (1) JP3138574B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4598877B2 (ja) * 2007-12-04 2010-12-15 日本電信電話株式会社 符号化方法、この方法を用いた装置、プログラム、記録媒体
JP4783412B2 (ja) * 2008-09-09 2011-09-28 日本電信電話株式会社 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体
WO2010073977A1 (ja) * 2008-12-22 2010-07-01 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP5845725B2 (ja) * 2011-08-26 2016-01-20 ヤマハ株式会社 信号処理装置

Also Published As

Publication number Publication date
JPH0774642A (ja) 1995-03-17

Similar Documents

Publication Publication Date Title
EP0673014B1 (en) Acoustic signal transform coding method and decoding method
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
EP1619664B1 (en) Speech coding apparatus, speech decoding apparatus and methods thereof
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
RU2255380C2 (ru) Способ и устройство воспроизведения речевых сигналов и способ их передачи
JP4550289B2 (ja) Celp符号変換
US6681204B2 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
MXPA96004161A (en) Quantification of speech signals using human auiditive models in predict encoding systems
JP3186007B2 (ja) 変換符号化方法、復号化方法
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
EP1672619A2 (en) Speech coding apparatus and method therefor
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JP3684751B2 (ja) 信号符号化方法及び装置
EP1619666B1 (en) Speech decoder, speech decoding method, program, recording medium
JP3138574B2 (ja) 線形予測係数補間装置
EP0954851A1 (en) Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
JPH1083200A (ja) 符号化,復号化方法及び符号化,復号化装置
JP2000509847A (ja) 音声信号を伝送する伝送システム
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3163206B2 (ja) 音響信号符号化装置
JP3099876B2 (ja) 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
JP4618823B2 (ja) 信号符号化装置及び方法
JP3520955B2 (ja) 音響信号符号化法
JPH05232995A (ja) 一般化された合成による分析音声符号化方法と装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees