JP2560860B2 - マルチパルス型音声符号化及び復号化装置 - Google Patents

マルチパルス型音声符号化及び復号化装置

Info

Publication number
JP2560860B2
JP2560860B2 JP1270348A JP27034889A JP2560860B2 JP 2560860 B2 JP2560860 B2 JP 2560860B2 JP 1270348 A JP1270348 A JP 1270348A JP 27034889 A JP27034889 A JP 27034889A JP 2560860 B2 JP2560860 B2 JP 2560860B2
Authority
JP
Japan
Prior art keywords
pulse
information
pulse type
correlation coefficient
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1270348A
Other languages
English (en)
Other versions
JPH03132800A (ja
Inventor
繁治 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP1270348A priority Critical patent/JP2560860B2/ja
Publication of JPH03132800A publication Critical patent/JPH03132800A/ja
Application granted granted Critical
Publication of JP2560860B2 publication Critical patent/JP2560860B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は,マルチパルス型音声符号復号化装置に関す
る。
[従来の技術] 入力音声信号を分析して,この入力音声信号の音声情
報を構成するスペクトル包絡情報と音源情報とを分析側
で抽出し,これら音声情報を伝送路を介して合成側に伝
送し,音声を合成するマルチパルス型音声符号復号化装
置は,最近,よく知られている。
スペクトル包絡情報は,入力音声信号を発生する声道
系のスペクトル分布情報を表うもので,通常,線形予測
符号化(LPC)分析によって得られた分析次数に対応す
る個数のLPC係数,たとえば,αパラメータ,Kパラメー
タ等が使用される。
一方,音源情報は,スペクトル包絡の微細構造を示す
もので,入力音声信号からスペクトル包絡情報を除いた
いわゆる残差信号と言われるものであり,振幅と位置に
自由度のある複数のパルス列(マルチパルス)によって
表現される。
マルチパルス型音声符号復号化装置は,このスペクト
ル包絡情報および音源情報を求め,それぞれ予め定めら
れた量子化ビット割り当て規則に基づいて量子化し,伝
送するものである。
[発明が解決しようとする課題] 上述した従来のマルチパルス型音声符号復号化装置に
は,次のような問題点がある。従来のマルチパルス型音
声符号復号化装置では,通常,音源情報であるマルチパ
ルスの数は予め定められた固定数になっている。この音
源情報は,前述したようにスペクトル包絡の微細構造を
表現するものであり,入力音声が有声音の場合にはピッ
チ構造を示し,また,無声音の場合には明確なピッチ構
造がなくランダムなパルスに近くなるということが知ら
れている。
入力音声が有声音の場合,マルチパルスの数が固定で
あると,以下の様な問題が生じる。すなわち,ピッチ周
期は発話者のちがいによって,およそ50Hz〜500Hz程度
の範囲で変化する。つまり,一定区間長の分析フレーム
の中に入るピッチ周期区間の数は変化する。
それにもかかわらず,分析フレーム内のマルチパルス
数を固定にしてしまうと,分析フレーム内の各ピッチ区
間おのおのに割り当てられたマルチパルスの数が同じに
はならないことが起こる。
ビットレートが高く,分析フレーム内に割り当てられ
るマルチパルスが十分多い場合には,各ピッチ区間おの
おのに割り当てられたマルチパルスの数が異なってもそ
れほど問題にはならない。なぜなら,各ピッチ区間と
も,ほぼその区間の音声波形をほぼ表現してしまうほど
のマルチパルスが割り当てられているからである。
ところが,ビットレートが低く,分析フレーム内に割
り当てられるマルチパルスが少ない場合には,致命的な
問題と言える。なぜならば,分析フレーム内のあるピッ
チ区間では,その区間の音声波形の概形をも表現できな
くなり,結果的に,音質を非常に劣化させてしまうこと
になるからである。
この問題点は,分析フレーム内のマルチパルス数を可
変にして,分析フレーム内の各ピッチ区間のマルチパル
スの数を同じにし,各ピッチ区間の音声波形を同程度に
バランスよく表現させることで回避できる。
従って,本発明の目的は,分析フレーム内のマルチパ
ルスの数を可変し,入力音声が有声音の場合,各ピッチ
区間の音声波形を同程度にバランスよく表現させること
によって,音質を向上しうるマルチパルス型音声符号復
号化装置を提供することにある。
[課題を解決するための手段] マルチパルス型音声符号復号化装置において,音源情
報であるマルチパルスの振幅と位置を求めるマルチパル
ス分析法として,相関処理に基づく手法が知られてい
る。この手法は,入力音声波形に対してノイズシェーピ
ングと呼ばれる聴感重み付け処理を施した重み付け波形
とスペクトル包絡を表現するLPC合成フィルタのインパ
ルス応答波形の相互相関係数を算出し,その相関値の絶
対値の大きいところにパルスを設定していくものであ
る。この場合,パルスが1つ設定されるごとに,相互相
関係数は,インパルス応答波形の自己相関係数を使って
補正される。補正後は,また前と同様に相互相関係数の
絶対値の大きいところを捜し,パルスを設定していく。
このようにしてパルスを順次設定していくと,相互相関
係数の値は,徐々に減少していくことになる。最終的
に,相互相関係数が十分に小さくなった時点で,その分
析フレームの音声波形を十分に表現していることにな
る。つまり,相互相関係数は,それまでに設定されたマ
ルチパルスで,どの程度音声波形を表現しているかの指
標として利用できることがわかる。
ここで,第nパルス設定後の第iタップの相互相関係
数をφ(n,i)として,相互相関係数電力Pφ(n)を
以下の様に定義する。
また,第nパルス設定後の相互相関係数電力Pφ
(n)と第(n−1)パルス設定後の相互相関係数電力
Pφ(n−1)との電力差分D(n)を以下の様に定義
する。
D(n)=Pφ(n)−Pφ(n−1) (n=1,2,3,…) ……(2) 電力差分D(n)は,パルスを(n−1)パルスから
nパルスにした時の音質改善度を間接的に表現している
と言える。したがって,この電力差分D(n)が大きい
うちは,まだパルス数が十分ではないと言える。前述し
た様に,入力音声が有声音の場合,各ピッチ区間の概形
を表現するまでは電力差分D(n)が大きい。したがっ
て,この相互相関係数電力の差分D(n)を算出するこ
とにより,マルチパルス数を設定することが可能であ
る。
本発明によるマルチパルス型音声符号復号化装置は,
(1)式に従って相互相関係数電力を算出する相互相関
係数電力算出手段と,(2)式に従って電力差分を算出
する電力差分算出手段と,電力差分に基いてマルチパル
スの最適パルス数を決定するマルチパルス数決定手段と
を備えている。
[実施例] 次に,図面を参照して本発明について詳細に説明す
る。
第1図は,本発明の一実施例によるマルチパルス型音
声符号復号化装置の構成を示すブロック図である。第1
図の実施例のマルチパルス型音声符号復号化装置は,分
析側,すなわち,マルチパルス型音声符号化装置と合成
側,すなわち,マルチパルス型音声復号化装置によって
構成されている。
分析側は,波形メモリ1,LPC分析器2,K/α変換器3,減
衰α算出器4,インパルス応答算出器5,自己相関係数算出
器6,聴感重み付け波形算出器7,相互相関係数算出器8,相
互相関係数補正器9,マルチパルス検索器10,相互相関係
数電力算出器11,差分電力算出器12,パルス数決定器13,
量子化パタン出力器14,Kパラメータ量子化器15,パルス
量子化器16,及びマルチプレクサ17から成る。
また,合成側は,デマルチプレクサ18,復号化パタン
出力器19,Kパラメータ復号化器20,パルス復号化器21,K/
α変換器22,及びLPC合成フィルタ23から成る。
入力音声波形は,分析フレーム単位,たとえば20msec
の長さで切り出され,波形メモリ1に蓄積される。波形
メモリ1に蓄積された音声波形は,LPC分析器2に供給さ
れ,よく知られているレビンソン法等によってLPC分析
が実施され,Kパラメータが算出される。求められたKパ
ラメータは,k/α変換器3でαパラメータに変換された
のち,減衰α算出器4に送られ,減衰αパラメータが算
出される。減衰αパラメータは,ノイズシェーピングと
呼ばれる聴感重み付け処理のために求められており,い
わゆるマスキング効果をねらったものである。インパル
ス応答算出器5では,減衰αパラメータによって表わさ
れるLPCフィルタのインパルス応答波形が,例えば5msec
分,算出される。
聴感重み付け波形算出器7では,αパラメータ,減衰
αパラメータ,および入力音声波形を用いて,聴感重み
付け波形が算出される。相互相関係数算出器8では,イ
ンパルス応答波形と聴感重み付け波形の相互相関係数が
計算される。マルチパルス検索器10では,相互相関係数
の絶対値の最大の点を捜し、その点にパルスを設定す
る。パルスの振幅については,自己相関係数算出器6で
求められたインパルス応答波形の自己相関係数とパルス
設定位置の相互相関係数から算出される。相互相関係数
補正器9は,設定されたパルス振幅・位置と,自己相関
係数を用いて補正量を算出し,相互相関係数算出器8に
ある相互相関係数を修正する。この一連のマルチパルス
検索処理は,予め定められた最大マルチパルス数に対応
する回数,実施するものとする。
一方,相互相関係数電力算出器11は,パルスが設定さ
れ,相互相関係が補正する度に,相互相関係数の2乗
和,すなわち,相互相関係数電力を算出する。差分電力
算出器12は,相互相関係数電力算出器11で求められた電
力の隣り同志の差分を算出する。パルス数決定器13は,
差分電力をもとに,最も適当なパルス数を決定する。
具体的には,予め定められた最小パルス数と最大パル
ス数の間に対応する差分電力を観測し,差分電力が急激
に小さくなったパルス数から1引いたパルス数を最適パ
ルス数とする。なぜなら,差分電力が急激に小さくなっ
たということは,そのパルスの設定による改善度が減っ
たことを意味するからである。
差分電力の急激減少の判定法はいろいろ考えられる
が,ここでは,差分電力があるしきい値以下になったか
どうかで判定している。もし,しきい値以下にならない
場合は,予め定められた最大パルス数とする。
量子化パタン出力器14は,パルス数決定器13が決定し
たパルス数に対応する予め定められた量子化パタンをK
パラメータ量子化器15,パルス量子化器16にそれぞれ出
力するとともに,その量子化パタンに対応するラベルを
マルチプレクサ17に送出する。
Kパラメータ量子化器15は,LPC分析器2で求まったK
パラメータを,量子化パタン出力器14から入力された量
子化規則に基づいて量子化する。パルス量子化器16は,
設定されたマルチパルスの振幅・位置をKパラメータと
同様に量子化規則に基づいて量子化する。マルチプレク
サ17は,量子化されたKパラメータと,マルチパルス振
幅・位置と量子化パタンのラベルとを多重化し,伝送路
に送出する。
一方,合成側では,デマルチプレクサ18により,多重
化されたデータが量子化パタンラベル,Kパラメータ,及
びマルチパルスに分離される。Kパラメータ,マルチパ
ルスは,復号化パタン出力器19から出力される復号化パ
タン規則に基づいて,それぞれ,Kパラメータ復号化器2
0,パルス復号化器21によって復号化される。パルス復号
化器21で復号化されたマルチパルスは,LPC合成フィルタ
23に送られる。Kパラメータ復号化器20で復号化された
Kパラメータは,K/α変換器22でαパラメータに変換さ
れ,LPC合成フィルタ23に送られる。LPC合成フィルタ23
は,αパラメータをフィルタ係数とし,マルチパルスを
フィルタの入力として,音声を合成し出力する。
[発明の効果] 以上説明したように,本発明によれば,相互相関係数
電力の差分を使って,最適パルス数を決定することによ
り,音質を向上できるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例によるマルチパルス型音声符
号復号化装置の構成を示すブロック図である。 1……波形メモリ,2……LPC分析器,3……K/α変換器,4
……減衰α算出器,5……インパルス応答算出器,6……自
己相関係数算出器,7……聴感重み付け波形算出器,8……
相互相関係数算出器,9……相互相関係数補正器,10……
マルチパルス検索器,11……相互相関係数電力算出器,12
……差分電力算出器,13……パルス数決定器,14……量子
化パタン出力器,15……Kパラメータ量子化器,16……パ
ルス量子化器,17……マルチプレクサ,18……デマルチプ
レクサ,19……復号化パタン出力器,20……Kパラメータ
復号化器,21……パルス復号化器,22……K/α変換器,23
……LPC合成フィルタ。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力音声信号を分析フレームごとにLPC分
    析して抽出したLPC係数をスペクトル包絡情報とし,こ
    のスペクトル包絡情報とともに前記入力音声信号の音声
    情報を構成する音源情報を前記分析フレームごとに該音
    源情報の特徴に対応する発生時間位置と振幅とを有する
    複数個のマルチパルスをもって表現して,前記入力音声
    信号の分析を行なうマルチパルス型音声符号化装置であ
    って, 前記入力音声信号に対して聴感重み付け処理を施した重
    み付け波形と前記LPC係数によって表わされるインパル
    ス応答波形との相互相関係数の電力の差分に基いて,前
    記分析フレームごとに前記マルチパルスの最適パルス数
    を決定する手段を有し,前記スペクトル包絡情報と前記
    音源情報と前記最適パルス数を表わすパルス数情報とを
    符号化信号として送出することを特徴とするマルチパル
    ス型音声符号化装置。
  2. 【請求項2】請求項1記載のマルチパルス型音声符号化
    装置から送出されてくる前記符号化信号から前記入力音
    声信号の合成を行なう合成手段を備えたことを特徴とす
    るマルチパルス型音声復号化装置。
JP1270348A 1989-10-19 1989-10-19 マルチパルス型音声符号化及び復号化装置 Expired - Lifetime JP2560860B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1270348A JP2560860B2 (ja) 1989-10-19 1989-10-19 マルチパルス型音声符号化及び復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1270348A JP2560860B2 (ja) 1989-10-19 1989-10-19 マルチパルス型音声符号化及び復号化装置

Publications (2)

Publication Number Publication Date
JPH03132800A JPH03132800A (ja) 1991-06-06
JP2560860B2 true JP2560860B2 (ja) 1996-12-04

Family

ID=17485011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1270348A Expired - Lifetime JP2560860B2 (ja) 1989-10-19 1989-10-19 マルチパルス型音声符号化及び復号化装置

Country Status (1)

Country Link
JP (1) JP2560860B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8550989B2 (en) 2008-02-29 2013-10-08 The University Of Tokyo Flexibility/rigidity adjustable apparatus

Also Published As

Publication number Publication date
JPH03132800A (ja) 1991-06-06

Similar Documents

Publication Publication Date Title
US5018200A (en) Communication system capable of improving a speech quality by classifying speech signals
EP2384506B1 (en) Speech coding method and apparatus
DE60126149T2 (de) Verfahren, einrichtung und programm zum codieren und decodieren eines akustischen parameters und verfahren, einrichtung und programm zum codieren und decodieren von klängen
EP1420389A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
RU2644123C2 (ru) Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
RU2646357C2 (ru) Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра
US4720865A (en) Multi-pulse type vocoder
CN101099199A (zh) 音频编码和解码
JP2586043B2 (ja) マルチパルス符号化装置
JP2560860B2 (ja) マルチパルス型音声符号化及び復号化装置
JPH087597B2 (ja) 音声符号化器
JPH058839B2 (ja)
JP3552201B2 (ja) 音声符号化方法および装置
JP2639118B2 (ja) マルチパルス型音声符号復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2581050B2 (ja) 音声分析合成装置
JP2853126B2 (ja) マルチパルス符号化装置
JPH02160300A (ja) 音声符号化方式
JP3019342B2 (ja) 音声符号化方式
JP2560486B2 (ja) マルチパルス符号化装置
JPH10105200A (ja) 音声符号化/復号化方法
JP2596143B2 (ja) 音声符号化方法
JPH077275B2 (ja) 音声信号符号化方式とその装置
JPS63118199A (ja) 音声分析合成装置
JPH0284700A (ja) 音声符号化復号化装置