JPH0738116B2 - マルチパルス符号化装置 - Google Patents

マルチパルス符号化装置

Info

Publication number
JPH0738116B2
JPH0738116B2 JP61180363A JP18036386A JPH0738116B2 JP H0738116 B2 JPH0738116 B2 JP H0738116B2 JP 61180363 A JP61180363 A JP 61180363A JP 18036386 A JP18036386 A JP 18036386A JP H0738116 B2 JPH0738116 B2 JP H0738116B2
Authority
JP
Japan
Prior art keywords
filter
coefficient
pulse
input
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61180363A
Other languages
English (en)
Other versions
JPS63118200A (ja
Inventor
哲 田口
繁治 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61180363A priority Critical patent/JPH0738116B2/ja
Priority to CA000543225A priority patent/CA1308193C/en
Priority to US07/079,327 priority patent/US4908863A/en
Publication of JPS63118200A publication Critical patent/JPS63118200A/ja
Publication of JPH0738116B2 publication Critical patent/JPH0738116B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はマルチパルス符号化装置に関し、特にLow bit
rateで良好な音質の合成音声が得られ、演算量の少ない
マルチパルス符号化装置に関する。
〔従来の技術〕
被分析音声(入力音声)の音源情報を複数のパルス、即
ちマルチパルスで表現し、これを音声合成フィルタの励
振入力として用いるマルチパルス符号化方式は良好な音
質が得られるので近時良く知られつつある。その基本概
念については例えば“A New Model of LPC Excitation
for Producing Natural-Sounding Speech at Low Bit R
ates",Bishnu S.Atal and Joel R.Remde,Poc.ICASSP 19
82,PP.614−617に詳しい。また、このマルチパルスの検
索を相関係数を用いて高効率で行なう手法がAraseki e
t.alにより提案されている、“Multi-Pulse Excited Sp
eech.Coder Based on Maximum Crosscorrelation Searc
h Algorithm",Proc.Global Telecommunication 1983,P
P.794−798. 上記マルチパルス検索においては、合成音声の聴感的な
S/N比を実際の(物理的な)S/N比より向上させる(“no
ise shaping")ため聴感重み付けフィルタが用いられる
ことが多い。即ち、送信側(分析側)のマルチパルス検
索器(coder)の前段に(1)式で表わされる伝達関数
を有する聴感重み付けフィルタを設けるとともに、受信
側(合成側)のマルチパルス復号器の後段に送信側フィ
ルタと逆特性(逆聴感重み付け)を有するフィルタを設
ける構成が知られている。
ここで、αiはLPC係数としてのαパラメータ、Pは求め
るべきLPC係数の次数、γは重み付け係数で0<γ<1
の値をとる。
第4図において、#2は送信側の聴感重み付フィルタ
(1)式の周波数特性を示すスペクトラム、#5は受信
側フィルタの周波数特性(#2と逆特性)を示すスペク
トラムである。スペクトル特性#1で示される入力音声
は送信側の上記フィルタにより聴感重み付け処理が為さ
れ、スペクトル特性#3で示される信号が得られる。こ
の聴感重み付けされた信号を基にして、周知の手法によ
りマルチパルスが求められ、符号化されて伝送路を介し
て受信側に送られる。符号された信号には#4で示され
る白色の量子化雑音が含まれている。受信側において
は、受信信号は復号化された後、受信側フィルタにて逆
聴感重み付け処理が施される。この復号化処理にはマル
チパルスの復元、合成フィルタによる音声信号の復元が
含まれている。復号化された信号は、スペクトル特性#
4で表わされる白色雑音を含み、逆聴感重み付け処理を
受けることにより、スペクトラム特性#1を有する音声
信号が復元される。このように、量子化雑音が入力音声
のスペクトル特性に関連付けられて有色化される。第4
図から明らかなように、その結果、周波数軸の至るとこ
ろで音声電力は雑音電力を上まわり、音声による雑音の
マスクが可能となって、実効的にS/Nが改善される、所
謂Noise Shaping効果が得られる。
聴感重み付けフィルタの特性式(1)の右辺の分子は入
力音声信号のスペクトル包絡に対応する周波数伝達特性 の逆(インバース)特性を示し、入力音声のスペクトル
包絡を平坦化する機能を果す。また(1)式右辺の分母
は入力音声信号を分析して得られるスペクトル包絡が有
する複数周波数極の各々の中心周波数に一致する中心周
波数の周波数極をもつ周波数伝送特性を示す。γはマル
チパルス算出のための演算時間を削減するためにLPC係
数に乗じられる係数で、上記周波数極の帯域幅は、周知
の如く、γに依存する。例えばγ=1.0の場合、帯域幅
は入力音声信号を分析して得られるスペクトル包絡が有
する極の帯域幅と一致する。又、γ<1.0の場合、帯域
幅は入力音声信号を分析して得られるスペクトル包絡が
有する極よりも広い帯域幅を有し、その幅はγが0に近
づく程単調に増加する。従って、フィルタ(特性W
(Z))を通過した音声信号の周波数伝送特性は で表現され、これは入力音声信号を分析して得られるス
ペクトル特性 の極の帯域幅を拡大、平坦化したものと言える。そのイ
ンパルス応答の持続時間は、入力音声信号を分析して求
められたLPC係数で制御されるフィルタのそれと比較し
て短くなることは経験的にも知られている。
例えば、LPC係数αiに基づく合成フィルタの実質的なイ
ンパルス応答の持続時間は100msecを越えることが多
く、一方、γiαiに基づく合成フィルタのインパルス応
答の持続時間は、γ=0.8のとき5msecを越えることは殆
どない。
〔発明が解決しようとする問題点〕
以上のように、減衰係数γを用いた聴感重み付け処理で
は合成フィルタのインパルス応答長(持続時間)が短か
くなる。しかし、インパルス応答長が短かくなると、良
好な合成音を得るためには相対的に多数のマルチパルス
を設定する必要がある。これは、低速符号化(low bit
rate coding)の達成を妨げる大きな要因となる。一
方、聴感重み付けを実施せずにマルチパルスを検索する
と、インパルス応答長(持続時間)は長くなり、少数の
マルチパルスで入力音声波形を近時できるが、逆にその
ために演算量が著しく増大してしまう。このことは上記
のAraseki et.alによる、入力音声波形と合成フィルタ
のインパルスレスポンス波形との相互相関係数に基づい
てマルチパルスを決定する手法においては、両波形のサ
ンプリングデータ間の積和を順次求める必要があり、そ
の積和回数がインパルスレスポンス長が長くなるほど多
くなることからも容易に理解できる。
〔問題点を解決するための手段〕
上記問題点を解決するため本発明によるマルチパルス符
号化装置は、所定のサンプリング間隔でデジタル信号に
変換された音声信号を記憶するメモリ手段と、前記音声
信号を分析してLPC係数を求める分析手段と、前記LPC係
数により指定される係数をもつリカーシブフィルタと、
前記メモリ手段に記憶されている音声信号のうち、時間
的経過の新しい信号から古い信号に(バックワードに)
前記リカーシブフィルタに供給する供給手段と、前記リ
カーシブフィルタの出力に基づいて所定数のマルチパル
スを求めるマルチパルス検索手段とを備えている。
〔実施例〕
第1図は本発明の実施例を示し、前掲Araseki et.alの
提案になる相関係数を用いたマルチパルス検索手法に基
づく音声分析合成装置の構成ブロック図である。本発明
においては、被分析波形(入力音声信号)をバックワー
ドに(時間的経過の新しい方から古い方向に)リカーシ
ブフィルタに供給し、このフィルタによってインパルス
応答波形と入力音声波形との各サンプル値についての積
和を求め、マルチパルスの検索が行なわれる。
第1図に示す実施例は(分析側)と(合成側)によって
構成され、(分析側)は波形メモリ1、フィルタ(LPC
フィルタ)2、LPC分析器3、量子化/復号化器4、補
間器5、K/α変換器6、最大値検索器7、パルス量子化
器8、マルチプレクサ9、ファイル10から成り、また合
成側は、ファイル11、デマルチプレクサ12、パルス復号
化器13、K復号化器14、LPC合成フィルタ15、K/α変換
器16等を備えて構成される。
波形メモリ1は被分析(入力)音声波形を所定の形式で
量子化したうえそのサンプル値を書込み、読出しの際は
書込み時間とは逆順(バックワード)および書き込み順
(フォワード)に読出し、それぞれフィルタ2およびLP
C分析器3に供給する。
この場合、被分析音声波形サンプルのバックワード読出
しは連続的な音声に対しては連続して行なわれる。連続
的な音声の持続時間は通常たかだか数秒程度である。
LPC分析器3は、メモリ1からフォワードに読み出した
波形サンプル系列を分析フレーム単位、たとえば20msec
ごとに線形予測分析を行ない、たとえば12次のKパラメ
ータK1〜K12を抽出しこれを量子化/復号器4に供給す
る。
量子化/復号化器4は、入力するKパラメータを一旦量
子化して、さらにこれを復号化することによって量子化
誤差の条件をフィルタ2の駆動入力と同程度にしたの
ち、復号化出力を補間器5に供給し、所定の補間刻みで
補間を行なってからK/α変換器6に供給する。
K/α変換器6は、補間されたKパラメータをαパラメー
タに変換し、フィルタ係数としてフィルタ2に供給す
る。こうして提供されたαパラメータαi(i=1,…,1
2)をフィルタ係数として形成される巡回型(リカーシ
ブ)フィルタ2は、いわゆるLPC音声合成フィルタとし
て機能する全極型ディジタルフィルタである。
フィルタ2は、波形メモリ1からバックワード的に読出
される被分析音声波形サンプルに対し分析フレーム単位
ごとにインパルス応答との積和を求め両者の相互相関係
数を得る。この積和がフィルタ演算のみで容易に実施し
うることが本発明の重要なポイントであり、詳細は後述
する。
ところで本発明では聴感重み付処理を施さないで、低速
符号化を可能としているがそのために従来の“noise sh
aping"効果は得られなくなる。しかし、“noise shapin
g"は前述の如く、S/Nの良好な条件(充分な数のマルチ
パルスの設定が許される条件)で始めて効果を発揮する
ものであり、本発明のような低速符号化(low bit rat
e)条件下ではS/Nは通常小さく、従って聴感重み付処理
を施さなくとも音質には殆ど影響がなく演算量の削減効
果の方がはるかにメリットが大きい。
こうして演算量を大幅に削減した状態で被分析波形とイ
ンパルス応答との相互相関係数φhsを得る。しかもこの
場合、インパルス応答はLPC係数に減衰係数を乗ずる処
理を含まない状態で求めているので、著しく精度の高い
相互相関係数φhsを算出することができる。
フィルタ2の出力する相互相関係数列はマルチパルス検
索器7に供給される相互相関係数最大値の検索を行な
い、前述公知の手法でマルチパルスを検索、決定する。
このマルチパルスの決定は例えば次のように行なわれ
る。
K個のパルスによって合成された合成信号と音声入力の
差εは次の(2)式で示される。
(2)式においてNは分析フレーム長(1分析フレーム
内のサンプルポイント数で表わす)、gi,miはそれぞれ
分析フレーム内のi番目のパルス振幅ならびに位置を示
す。εを最小とするパルスの振幅および位置は次の
(3)式をgiについて偏微分して零とおくことによって
得られる式の値が最大となる点として決定される。
1≦mi≦N (3)式においてRhh(0)は音声合成フィルタのイン
パルス応答の自己相関係数、φhsは被分析(入力)音声
波形と前記インパルス応答波形との相互相関係数であ
る。(3)式の意味するところは、時間位置miにパルス
をたてる場合には振幅gi(mi)が最適であるということ
である。そうして、このgi(mi)を求めるには、マルチ
パルスたるべきパルスが決定されるごとに相互相関係数
φhs(mi)から(3)式分子の第2項を減算しつつ相互
相関係数の補正を行ない、しかる後、遅れ時間零におけ
る自己相関係数Rhh(0)で正規化したうえその絶対値
の最大値を検索する形式で次々に求められる。相互相関
係数の補正値とすべき前記第2項は、直前に検索された
最大値の振幅glと位置情報ml、その最大値からの遅れ時
間|ml−mi|における自己相関Rhh(|ml−mi|)、検
索すべきマルチパルスの分析フレーム内の位置情報等に
もとづいて求められる。ここで、検索すべきマルチパル
スは、通常のマルチパルスよりも遥かに少なく設定され
ている。これは前述した如く相互相関係数算出精度が極
めて高いこと、ならびに分析、合成系の運用目的等の条
件を勘案して被分析音声波形の特徴を少数のマルチパル
スで表現しうることによる。この運用目的による条件と
は、たとえば、再生音質がさほど忠実性を要求されない
各種のパプリックメッセージ等が該当する。このような
背景のもとで行なう分析フレームごとの最大値検索は、
それ故に、相互相関係数に対する(3)式分子第2項に
よる補正を削除しても運用目的上差支えない場合が多
く、上記の実施例でも補正は実施してしない。ただし、
一般的にはこの補正が必要な場合には容易に併行実施す
ることも可能である。
パルス量子化器8はこうして検索される分析フレーム単
位でのマルチパルスを量子化してマルチプレクサ9に供
給する。
マルチプレクサ9には量子化/復号化器4から量子化K
パラメータも入力し、これら2入力を符号化したうえ適
宜組合せ所定の形式の多重化信号としファイル10に格納
して伝送路を介して合成側に送出する。
さて、合成側では、伝送路を介してファイル10の内容を
受信し、ファイル11に蓄積する。この受信信号はデマル
チプレクサ12によって多重化分離が為された後、符号化
マルチパルスデータはパルス復号化器13に、符号化Kパ
ラメータはK復号化器13に、符号化KパラメータはK復
号化器14に供給する。これら両復号化器はそれぞれ入力
を復号化し、マルチパルスはLPC合成フィルタ15の入力
として、またKパラメータはK/α変換器16でαパラメー
タに変換したのちフィルタ係数としてLPC合成フィルタ1
5に供給される。
全極型ディジタルフィルタとして形成されるLPC合成フ
ィルタ15はこれらフィルタ係数と入力とを供給されてデ
ィジタル形式の音声信号を合成したのち、D/A変換、低
周波フィルタリングを行ないアナログ合成音声として出
力する。
さて、本発明では被分析音声波形とLPCフィルタのイン
パルス応答との相互相関係数φhsを上述の如く、フィル
タへの被分析音声波形のバックワード供給により行なっ
て演算量の大幅な削減を図っている。以下、この点につ
いて第2図を参照しながら説明する。
相互相関係数φhsを得ることは、第2図における、例え
ば入力音声波形上のサンプルAと、フィルタのインパル
ス応答波形の対応点Bとの積について、時刻tOからtO
tlまでの積分値を求めることである。第2図において、
tはサンプル時刻を、tOはインパルス応答の遅れ時間
を、tlはインパルス応答長を、tO+tlはインパルス応答
が実質的に無視できるサンプル時刻をそれぞれ示す。
今、被分析音声波形のサンプル値をS(m)(m=0,1,
…,tO−1,tO,tO+1,…,tO+t−1,tO+t,…,tO
tl)、インパルス応答をh(n)(n=0,1,2,…,t−1,
t,t+1,…,tl)とすると、相互相関係数φhs(tO
は、 となる。
従来は、(4)式の演算を乗算器を用いて行なっていた
ため、φhsを1つ求めるのに必要な演算量はインパルス
応答の持続時間tlに依存している。
本発明では、インパルス応答は音声合成フィルタのもつ
インパルス応答であり、通常の巡回型フィルタで容易に
実現でき、バックワードに供給された波形サンプルAと
Bとの積はフィルタ演算で容易に置換できる点に着目し
た。このことは、サンプルAの代りに振幅として1をフ
ィルタに入力すると時間t後のフィルタ出力としてBが
得られることからも明らかである。従ってサンプルAを
入力すると時間t後のフィルタの出力は(A・B)とな
る。つまりS(tO+t)・h(t)となる。同様にサン
プルAよりも1サンプルだけ過去のサンプルS(tO+t
−1)がフィルタ2に入力されると、時間(t−1)後
のフィルタ出力はS(tO+t−1)h(t−1)とな
る。この関係はtO≦t≦tO+tlの至る点で成立する。
ここで、被分析音声の時間軸を反転し、時間的に未来の
方向から過去の方向に(バックワードに)波形がフィル
タに入力される場合を考える。時刻tO+tlに相当するサ
ンプルS(tO+tl)がフィルタに入力される場合を考え
る。時刻tO+tlに相当するサンプルS(tO+tl)がフィ
ルタに入力されてからtlサンプル後のフィルタの出力波
形レベルは前述の理由によりS(tO+tl)h(tl)とな
る。同様に、時刻tO+tに相当するサンプルS(tO
t)(=A)がフィルタに入力されてからtサンプル後
のフィルタの出力レベルはS(tO+t)h(t)とな
る。勿論、時刻tOに相当するサンプルS(tO)がフィル
タに入力された時点のフィルタの出力レベルはS(tO
h(0)である。
フィルタ2は線形フィルタであり、重ね合せの理が成り
立つ。従ってフィルタに被分析波形をバックワードに連
続的に入力した場合、フィルタのインパルス応答の持続
時間をtl以内と仮定すれば、時刻tOにおけるフィルタの
出力u(tO)は(5)式により表わされる。
更に、時刻tO−1に相当するサンプルS(tO−1)がフ
ィルタに入力されると、フィルタの出力u(tO−1)は
(6)式で表わされる。
尚、ここでh(tl+1)=0とみなしている。
つまり、被分析波形をバックワードに連続的にフィルタ
に入力すると、入力された波形の時刻に対応する相互相
関係数が連続的に求められる。
ところで、上述の如く本発明は入力音声波形をバックワ
ードにフィルタに供給するからこそ、相関係数φhsが得
られるのであり、従来のようにフォワードに音声波形を
フィルタに供給しても以下のように相関係数φhsは得ら
れない。
例えば音声波形S(0)が入力されたときフィルタの出
力u′(0)は u′(0)=S(0)h(0)=S(0) h(0)=1 波形S(1)が入力されたときのフィルタの出力u′
(1)は u′(1)=S(1)h(0)=S(0)h(1) 波形S(t)が入力されたときのフィルタの出力u′
(t)は フィルタのインパルス応答の持続時間tlを越える時刻の
波形S(tm)が入力されたときのフィルタ出力u′
(tm)は 上記から明らかなとおり、フォワード読み出し波形デー
タのフィルタ供給によっては相互相関係数は得られず、
従来は乗算器と加算器によって積和を求めざるを得なか
ったのである。
上述から明らかなとおり、本発明によれば、1つの相互
相関係数を算出するために必要な演算量はインパルス応
答の持続時間には依存せず、単純にフィルタそのものの
演算量となり、本実施例の場合12回の乗算で済むことに
なる。
以上要するに、被分析音声波形とインパルス応答との積
の各サンプル点の和、積和はIIRフィルタに被分析音声
波形をバックワードに印加することによって求められ
る。
このようにして得られる被分析音声とインパルス応答と
の積和は、明らかに両者の相互相関係数に対応するもの
である。マルチパルスの検索はこうして得られる相互相
関係数を利用して行なわれるが、これは前述した内容か
らも明らかな如く、被分析音声波形をバックワードにフ
ィルタに印加しその出力を利用するという形式で演算量
を大幅に削減した状態で得られる。
上記フィルタ2の一構成例は第3図に示されている。メ
モリ1からバックワードに読み出された波形サンプルデ
ータは、先ず加算器204の+端子に供給される。加算器2
04は、この波形データから−端子に供給されたデータを
減算して、その出力は、直列接続された12個の単位遅延
素子201(1)〜201(12)の第1段の遅延素子201
(1)に入力される。各単位遅延素子の出力は、各出力
に対応付けて設けられている乗算器202(1)〜202(1
2)によってK/α変換器6から供給されているαパラメ
ータ:α1〜α12のそれぞれと乗算される。乗算器202
(1)〜202(12)の総ての乗算出力は加算器203にて加
算され、その加算結果は加算器204の−端子に入力され
る。こうして相互相関係数φhsは加算器204の出力とし
て得られる。つまり、このフィルタ2は、メモリ1から
音声波形1サンプルデータが入力される毎に相互相関係
数を1つ算出する。このフィルタによる1個の相互相関
係数を算出するに要する乗算回路は、LPC係数(αパラ
メータ)の次数で定まり、本実施例では12回で済む。
一方、従来のインパルス応答波形と波形との積和を計算
式どおりに算出することを目的にインパルス応答長(持
続時間)分のサンプルデータを用いて、サンプル間の積
和を求めている。例えば、インパルス応答の持続時間を
100msecとし、標本化周波数を8kHzと仮定すると、1つ
の相互相関係数を算出するのに要する乗算回数は、100
×10-3×8×103=800回となり、本発明と比較して大幅
な演算量の増加をきたす。
第5図は本発明によるマルチパルス符号化装置の他の実
施例であり、第1図と同様に分析側と合成側とを備え
る。分析側は窓処理器(1)17、窓処理器(2)18、LP
C分析器20、K量子化/復号化器21、補間器22、K/α変
換器23、IIR(Infinite Impulse Response)フィルタ2
4、相関補正器25、K/α変換器26、自己相関算出器27、
最大値検索器28、パルス量子化器29、マルチプレクサ30
を備えて構成される。また、合成側は、デマルチプレク
サ31、K復号化器32、パルス復号化器33、K補間器34、
K/α変換器35、LPC合成フィルタ36等を備えて構成され
る。
この第5図に示す実施例は、第1図に示す第1の実施例
に比し再生音質に対する条件がかなり厳しくなるC0DEC
(C0der,DECorder)等を対象とするもので、従って被分
析音声波形とIIRフィルタのインパルス応答との相互相
関係数に対し、インパルス応答の自己相関係数による補
正も実施しており、検索すべきマルチパルスの数も通常
要求される程度としている。
被分析音声は窓処理器(1)17に入力され、所定の形式
で量子化されたのち分析フレーム周期、たとえば20mSEC
の矩形関数の乗算により切出される第1の窓処理を受け
る。第6図は第5図の実施例における窓関数特性図であ
る。
窓関数(1)は窓処理器(1)17において利用される窓
関数で、T=20mSECとし、かつ窓処理の円滑化による副
極大の縮少を図って前縁は傾斜部TOを付与している。こ
のTOは3〜5mSECで経験値が設定される。
窓処理器(1)17の出力は引続き窓処理器(2)18と波
形時間軸入替器19とに供給される。
窓処理器(2)18は、LPC分析を実施するための窓処理
を実施するもので、本実施例ではハミング関数を窓処理
器(1)17の出力に乗算する。このハミング関数を窓関
数(2)として第6図に示す。窓処理器(2)18の出力
はLPC分析器20に提供される。こうして、連続的な音声
を所望の時間長に分割しつつ分析を実施することができ
る。即ち、処理に起因する伝送遅延を分割した時間長程
度に限定し得る。仮に、音声を所望の時間長に分割しな
いで連続的にバックワードに処理した場合、伝送遅延は
無限となり、C0DECの意味をなさなくなる。
LPC分析器20は、こうして供給される分析フレーム周期2
0mSECごとの入力のLPC分析を行なって12次のKパラメー
タを抽出、これをK量子化/復号化器21に供給する。
K量子化/復号化器21は、入力の量子化、復号化を介し
て、後述するIIRフィルタ24の入力とほぼ同等な量子化
誤差をKパラメータに付与し、これを補間器22に供給す
る。
補間器22は、入力したKパラメータに所定の刻みの補間
処理を実施したのちこれをK/α変換器23に供給する。
K/α変換器23は、入力のKパラメータをαパラメータに
変換し、これをフィルタ係数としてIIRフィルタ24に供
給する。
IIRフィルタ24の入力は波形時間軸入替器19から供給さ
れる。
波形時間軸入替器19は窓処理器(1)17から出力される
窓関数(1)による切出し出力を入力しつつ、一旦内部
メモリに格納してから波形時間軸を入替えるようにバッ
クワードに読出しIIRフィルタ24に供給する。
IIRフィルタ24は、これら2入力にもとづいて被分析音
声波形とIIRフィルタ24のインパルス応答との積和をと
り、両者の相互相関係数のフィルタ演算を行ないこれを
相関補正器25に出力する。
補間器22はまた、インパルス応答を所望の精度で得るに
必要な刻みで入力を補間しこれをK/α変換器26に供給
し、K/α変換器26はこれをαパラメータに変換する。
自己相関算出器27は、供給されたαパラメータにもとづ
いて形成されるIIRフィルタのインパルス応答を算出
し、さらにその自己相関係数を求めて相関補正器25に供
給する。
相関補正器25はIIRフィルタ24から供給される相互相関
係数列に対し(2)式の分子第2項に示す補正を実施す
る。この相関補正に必要な、検索すべき最大値の振幅と
時間位置に関する情報は最大値検索器28から供給され
る。
最大値検索器28は、相関補正器25を介して先ず相互相関
係数の無補正初期値を受けたあとは、次々に(2)式の
分子に示す相互相関補正データを受けつつその最大値を
(2)式によって検索し、分析フレームごとに所定の個
数のマルチパルスを決定してその振幅と位置に関するデ
ータをパルス量子化器29と相関補正器25に供給する。
パルス量子化器29は、こうして入力するマルチパルスを
所定の形式で量子化しマルチプレクサ30に供給する。
マルチプレクサ30にはまた、K量子化/符号化器21から
Kパラメータが供給され、これら音声パラメータは所定
の形式で符号化、多重化され合成側に伝送される。
合成側では、デマルチプレクサ31が分析側から伝送され
た多重化信号の多重化を分離し、音声パラメータのうち
KパラメータはK復号化器32に、またマルチパルスはパ
ルス復号化器33に供給する。
け復号化器32は、Kパラメータを復号しこれを補間器34
に供給する。補間器34は所定の補間刻みで補間を実施し
たあとK/α変換器35に供給し、これによりKパラメータ
はαパラメータに変換され、そのあとフィルタ係数とし
て全極型ディジタルフィルタとして構成されるLPC合成
フィルタ36に供給される。
LPC合成フィルタ36は、K/α変換器35から提供されたα
パラメータをフィルタ係数とし、パルス復号化器33から
提供されるマルチパルスを入力としてディジタル音声信
号を再生、そのあと所定のD/A変換、低域フィルタリン
グを実施して合成音声として出力する。
〔発明の効果〕
以上説明したように本発明によれば低ビットレートで高
音質音声合成が可能で、且つマルチパルス検索のための
演算時間が著しく少ないマルチパルス符号化装置が得ら
れる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すマルチパルスを用いた
音声分析合成装置のブロック図、第2図は本発明による
マルチパルス検索に用いる相互相関係数算出の原理を説
明する図、第3図は本発明で相互相関係数を求めるため
に用いるフィルタの構成ブロック図、第4図は聴感重み
付けによるS/N向上原理を説明するための図、第5図は
本発明の他の実施例を示すブロック図、第6図は第5図
の実施例における窓関数特性図である。 1…メモリ、2,24…リカーシブフィルタ(IIRフィル
タ)、3,20…LPC分析器、4,21…量子化/復号化器、5,2
2…補間器、6,23,26…K/α変換器、7…マルチパルス検
索器、8,29…パルス量子化器、9,30…マルチプレクサ、
1O,11…ファイル、12,31…デマルチプレクサ、13,33…
マルチパルスデコーダ、14,32…K−デコーダ、15,36…
LPCフィルタ、16,35…K/α変換器、17,18…窓処理器、1
9…波形時間入替器、25…相関補正器、27…自己相関算
出器、28…最大値検索器、34…K補間器。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】所定のサンプリング間隔でデジタル信号に
    変換された音声信号を記憶するメモリ手段と; 前記音声信号を分析してLPC係数を求める分析手段と; 前記LPC係数により指定される係数をもちこの係数に対
    応したインパルス応答と前記音声信号との間の相互相関
    係数を出力するリカーシブフィルタと; 前記メモリ手段に記憶されている音声信号を、時間的経
    過の新しい方向から古い方向に(バックワードに)前記
    リカーシブフィルタに供給する供給手段と; 前記リカーシブフィルタから出力される相互相関係数に
    基づいて所定数のマルチパルスを求めるマルチパルス検
    索手段とを備えることを特徴とするマルチパルス符号化
    装置。
  2. 【請求項2】特許請求の範囲第(1)項において、前記
    リカーシブフィルタは前記供給手段で供給された信号を
    +入力に受けその加算値を前記リカーシブフィルタの出
    力として発生する第1の加算手段と、前記第1の加算手
    段の出力を受け、それぞれ前記サンプリング間隔の遅延
    時間をもち直列接続された、前記LPC係数の次数と等し
    い数の単位遅延手段と、各単位遅延手段の出力に接続さ
    れ、この出力と前記分析手段から送出されるLPC係数と
    を乗算する複数の乗算手段と、これら乗算手段の出力を
    加算し、加算値を前記第1の加算手段の一端子に供給す
    る第2の加算手段とを備えることを特徴とするマルチパ
    ルス符号化装置。
JP61180363A 1986-07-30 1986-07-30 マルチパルス符号化装置 Expired - Lifetime JPH0738116B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61180363A JPH0738116B2 (ja) 1986-07-30 1986-07-30 マルチパルス符号化装置
CA000543225A CA1308193C (en) 1986-07-30 1987-07-29 Multi-pulse coding system
US07/079,327 US4908863A (en) 1986-07-30 1987-07-30 Multi-pulse coding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61180363A JPH0738116B2 (ja) 1986-07-30 1986-07-30 マルチパルス符号化装置

Publications (2)

Publication Number Publication Date
JPS63118200A JPS63118200A (ja) 1988-05-23
JPH0738116B2 true JPH0738116B2 (ja) 1995-04-26

Family

ID=16081934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61180363A Expired - Lifetime JPH0738116B2 (ja) 1986-07-30 1986-07-30 マルチパルス符号化装置

Country Status (3)

Country Link
US (1) US4908863A (ja)
JP (1) JPH0738116B2 (ja)
CA (1) CA1308193C (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5287529A (en) * 1990-08-21 1994-02-15 Massachusetts Institute Of Technology Method for estimating solutions to finite element equations by generating pyramid representations, multiplying to generate weight pyramids, and collapsing the weighted pyramids
JP2947012B2 (ja) * 1993-07-07 1999-09-13 日本電気株式会社 音声符号化装置並びにその分析器及び合成器
JP2906968B2 (ja) * 1993-12-10 1999-06-21 日本電気株式会社 マルチパルス符号化方法とその装置並びに分析器及び合成器
IT1277194B1 (it) * 1995-06-28 1997-11-05 Alcatel Italia Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato
KR101116363B1 (ko) * 2005-08-11 2012-03-09 삼성전자주식회사 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치
KR101414341B1 (ko) * 2007-03-02 2014-07-22 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치 및 부호화 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
JPS597120B2 (ja) * 1978-11-24 1984-02-16 日本電気株式会社 音声分析装置
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit

Also Published As

Publication number Publication date
CA1308193C (en) 1992-09-29
US4908863A (en) 1990-03-13
JPS63118200A (ja) 1988-05-23

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
US4220819A (en) Residual excited predictive speech coding system
US4945565A (en) Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
JP3357795B2 (ja) 音声符号化方法および装置
JP2000155597A (ja) デジタル音声符号器において使用するための音声符号化方法
JPH0738116B2 (ja) マルチパルス符号化装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JPH10143199A (ja) 音声符号化方法および復号化方法
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3303580B2 (ja) 音声符号化装置
JPS61148500A (ja) 音声信号符号化方法とその装置
JP3299099B2 (ja) 音声符号化装置
JP3163206B2 (ja) 音響信号符号化装置
JP3249144B2 (ja) 音声符号化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JP2000298500A (ja) 音声符号化方法
JPS6162100A (ja) マルチパルス型符号化復号化装置
JP3296411B2 (ja) 音声符号化方法および復号化方法
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
JP3071800B2 (ja) 適応ポストフィルタ
JP2853170B2 (ja) 音声符号化復号化方式
JP2778035B2 (ja) 音声符号化方式
JP2508002B2 (ja) 音声符号化方法とその装置
JP2658438B2 (ja) 音声符号化方法とその装置
JP3112462B2 (ja) 音声符号化装置