JPS63223800A - 音声符号化・復号化方式とその装置 - Google Patents

音声符号化・復号化方式とその装置

Info

Publication number
JPS63223800A
JPS63223800A JP62058043A JP5804387A JPS63223800A JP S63223800 A JPS63223800 A JP S63223800A JP 62058043 A JP62058043 A JP 62058043A JP 5804387 A JP5804387 A JP 5804387A JP S63223800 A JPS63223800 A JP S63223800A
Authority
JP
Japan
Prior art keywords
sound source
sequence
audio signal
specific section
spectral envelope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62058043A
Other languages
English (en)
Other versions
JPH07101356B2 (ja
Inventor
茂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62058043A priority Critical patent/JPH07101356B2/ja
Publication of JPS63223800A publication Critical patent/JPS63223800A/ja
Publication of JPH07101356B2 publication Critical patent/JPH07101356B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声符号化・復号化方式とその装置に関し、特
に音声信号の帯域圧縮をはかった音声符号化・復号化方
式とその装置に関する。
(従来の技術) 音声信号の妃!@II音源を複数のパルス系列で表すマ
ルチパルス音声符号化を低ビツトレイト化に対応させる
手段として、フレーム内の音源パルスをピッチ周期の長
さをもつ特定区間(以下代表区間と呼ぶ)の音源パルス
系列で代表させ、フレーム内の他の音源パルス系列は1
!J接フレームの代表区間の音源パルス系列との間の補
間で再生させるピッチ補間マルチパルス法がある(文献
1:手沢、見間、“48kbpsマルチパルス音声符号
化法”、日本f書学会a /xra文集、203頁−2
04頁、1985年10月)。ここでに、音源パルス系
列とともに、スペクトル包絡を表す線形予測パラメータ
もピッチ周期毎に補間されている。
この符号化アルグリズリムでは、音環境にかかわらず常
に線形内挿により音声合成のだめの各変数を生成させて
いる。このような処理は、音声信号を準定常性1ぎ号と
仮定しており、スペクトル包Mk&すパラメータや音源
パルス系列はフレーム内やフレーム間で急微に変動しな
いと見なしている0 (発明が解決しようとする問題点) しかし、フレーム長が20〜30m5ec程度になると
、フレーム内、或はフレ゛−ム間で、有声破裂音を含む
場合や鼻f/流音から母音への渡りなどを含むことが多
く、音環境を考慮せずあらゆるフレームに対して線形補
間を施す処理は音声信号のf#Ik十分表すことができ
ず、高品質の音声合成を実現することが離しい。また、
知覚実験によると、音韻知覚の特徴は音声の変化部にあ
るといわれており、音韻の明瞭性が高い合成音声を作る
ためには、各パラメータの補間による再生を原音声信号
の音頭変化に適応して形で行う必要がある。
本発明の目的は、音源パルス系列の補間による音声符号
化法において、代表区間の決定や音源ノくルス系列の補
間、さらにスペクトル包絡を表すパラメータの決定やそ
の補間を原音声信号のスペクトル変化に適応した形で行
うことにより、上述した欠点を除去した高品質の音声符
号化φ復号化方式とその装置を提供することにある。
(問題を解決するための手段) 本発明の音声符号化・復号化方式は、音声信号系列を一
定間隔に分割して入力し前記音声信号系列をスペクトル
包絡′fc表すパラメータと駆動音源系列とで表す場合
に前記駆動音源系列をそのなかのある特定区間の駆動音
源系列で代表させる音声符号化拳復号化方式において、
前記特定区間を前記分割された音声信号の基本周期と前
記スペクトル包1t−fiすパラメータで決定するとと
もに前記特定区1jの駆動音源系列から全区間にわたる
駆動音源系列を再生する際に前記スペクトル包絡パラメ
ータを用いる手段を備えて構成される。
また、本発明の音声符号化装置は、一連の音声信号系利
金一定間隔の区間に分割して入力する手段と、前記入力
音声信号系列のスペクトル包絡を表すパラメータと前記
音声信号系列の基本周期とを求める手段と、前記スペク
トル包絡ヲ表すパラメータと前記基本周期とから特定区
間を定める手段と、前記入力音声信号系列と前記スペク
トル包絡を衣すパラメータとから前記特定区間の駆動音
源系列を定める際に、前記スペクトル包絡パラメータに
適応した全区間にわたる駆動音源系列を再生でさるよう
にする前記特定区間の駆動音源を定める手段と、前記ス
ペクトル包絡を表すパラメータと前記基本周期と前記特
定区間および前記特定区間の駆動音源系列とを符号化す
る手段と、前記スペクトル包M/<ラメータを表す符号
と前記基本周期を表す符号と前記特定区間の音源系列を
表す符号と前記特定区間を表す符号とを出力する手段と
を有して構成される。
更に、本発明の音声復号化装置は、符号系列を入力する
手段と、前記符号系列からスペクトル包絡パラメータを
表す符号と基本周期を表す符号と特定区間の音源系列を
表す符号と前記特定区間を表す符号とt−a号する手段
と、前記スペクトル包絡パラメータと前記基本周期とに
適応させて前記特定区間の駆動音源系列から駆動音源系
列を再生する手段と、前記スペクトル包絡と前記再生さ
れた駆動音源系列とから再生音声信号系利金生成する手
段と、前記生成音声信号系列を出力する手段とを有して
構成される。
(作用) 有声音声信号を言む第nフレームを考える。当該フレー
ムをピッチ周期毎に分割し、分割された第m番目のサブ
フレーム音声信号に対応するPARCOR係at−(k
n−m(i))、i = 1 、 ・−M(M=予測次
数)、とおき、サブフレーム間のスペクトル変化Ds 
subを Ds sub(m)=Σ(larn、m(i)−1ar
n、m−1(i))21arn、m(i)= (1−k
n、m(i))/(1+kn、m(i) )と定義する
。ここで、larは対数断面積関数と呼ばれるものであ
る。Ds sub (m)がフレーム間で変化している
とき、そのフレーム中の音声信号は非定常信号と考えら
れ、単純な煉形内挿を適用すべきではない。即ち、Ds
 sub(m)の最大値が予め設定した閾111より大
きい場合、代表区間t−DSsub (m)の最大値を
与えるサブフレームとし、また当該フレームを代表させ
るPARCOR係数を前記代表区間に該当するサブフレ
ームのものとする。
このようなフレームにおいては、音源パルスを再生させ
るとき、代表区間より過去のサブフレームでは第n−1
フレームの代表パルスを操り返し、代表区間より未来の
サブフレームにおいては当該フレームの代表パルスを繰
り返す方式をとる。概念を第2図に示す。第2図は、サ
ブフレーム間のスペクトル変化の最大値が予め設定した
閾値よりも大きい4合の本発明の原理図である。Ds 
sub(m)の最大値が予め゛設定した閾値よりも大き
い場合、すなわち第2図に示す如くスペクトル変化率が
ある設定閾値を超える場合には代表区間をDssub 
(m)の最大値を与えるサブフレームとし、当該フレー
ムを代表させるPARCOR係数を前記代表区間に該当
するサブフレームのものとして設定するのである。また
、このとき、PARCOR係数の再生も音源パルスと同
様に行う。
さらに、第nフレームにおける代表PARCOR係数を
(kn(i))とおき、隣接するフレーム間での代表P
ARCOR係数によるスペクトル変化率をDs=Σ(l
arn(i) −1arn−1(i) )21arn(
i)= (1−kn(i))/ (1+kn(i) )
とおくと、Dsが予め設定し九閾値よシ大きいときは、
原音声信号はフレーム間で大きく変動していると考えら
れる。このときも、フレーム間で単純な補間はすべきで
なく、代表区間以外のサブフレームでは当該フレームの
代表区間の音源パルスを繰り返すという方法を取る。こ
こでもPARCOR係数のフレーム間に渡る補間は行わ
ず、各サブフレームに対応するPARCOR係数は当該
フレームの代表PA几COR係数を繰り返す。概念を第
3図に示す。
第3図は隣接するフレーム間のスペクトル変化率が予め
設定した閾値よりも大きい場合の本発明の原理図である
第3図に示す如く、本発明は音声信号の隣接する第(f
l)および(n−1)フレームに対する代表区間に設定
した音源パルスである黒丸で示すマルチパルスを各サブ
フレームに対して白丸で示すように繰シ返し利用し補間
音源パルスとしている。なお、このマルチパルスは、前
述した如(PAR,OUR係数で表現される。
一方、Ds sub(m)やDsの最大値が予めきめら
れた値よシ小さいときは、フレーム内或はフレーム間は
定常とみなせるため、代表PAR,COR係数を与える
位置並び音源パルスのための代表区間の位置をフレーム
の中央付近にあるサブフレームにとシ、その他のサブフ
レームに対する音源パルス並びPA几COル係数の再生
は、従来方式と同様にピッチ周期毎の線形内挿に49生
成していく。
以上の説明において、フレーム間或はフレーム内のスペ
クトル変化率を定義においてPA几COR係数を用いて
いるが、これは音声の電カスベクトルの変動を表すもの
であればよく、例えば線形予測係数やケプヌトラム係数
によって決まる量でも構わない。以上によシ、本発明の
原理に関する説明を終える。
(実施例) 次に図面を参照して本発明の詳細な説明する。
第1図は、本発明の一実施例を示す音声符号化復号化装
置のブロック図である。符号化側において、入力端子1
00から一定間隔毎のフレームに分割された音声信号を
入力し、ピッチ分析器110とサブフレームPA几CO
几係数計瀉器120に供給する。ピッチ分析器110は
、供給された音声信号の自己相関関数を計算し、予め定
められた区間の中の最大値検出を介してピッチ周期とピ
ッチゲインを定める。サブフレームPARCOR係数計
算器120は、ピッチ検出器110で定まったピッチ周
期を入力し、前記ピッチ周期毎のサブフレームに対応す
るPAgCOR係数とスペクトル変化尺度Ds sub
(m)を計算し、それらを代表PARCO几係数検出器
130に出力する。代表PA几COR係数検出器130
は前記Ds 5ub(rn)にしたがって当該フレーム
を代表するP A RCO几係数を求める。
即ち、L)ssub(m)の最大1直が予め与えられた
閾値Cよシ小さいときは、中央付近のサブフレームを代
表区間とし、代表区間のPARCO几係数を代表PA凡
CO几係数として出力する。もし、Ds 5ub(rn
)の最大値がIより大きな場合は、L)ssub(m)
の最大値を与えるサブフレームを代表区間として、その
区間のPA凡C0FL係数を代表P A l(、CO几
係数として出力する。有声/無声判定器140は、ピッ
チ分析器110から入力されるピッチゲインの値によシ
当該フレームの有声/無声の判定をする。
音源決定器150は、有声/無声判定器140の判定結
果によシ異なる音源を決定する。当該フレームが有声区
間と判定されたときには、代表PARCOR係数検出器
130から入力されるPA几CO几係数と代表区間の位
置及び入力端子100から入力される入力音声波形をも
とに、代表区間の音源パルス系列を決定する。音源パル
スの求め方は前記文献1にある方法以外に文献2:オザ
ワ アトオル、′ア スタディ オン パルス サーチ
 アルゴリズムズ 7オ マルチパルス エキサイテツ
ド スピーチ コーダ レアライゼイシ薗ン、′アイ 
イー・イー・イー コムポル ニス ニー シー 4.
1986、に詳しい。有声/無声判定器140で無声音
と判定されたフレームは、前記文献1と同じく正規白色
雑音源で表す。このとき、雑音の振幅の決定は、入力音
声信号と再生音声信号との差が最も小さくなるように行
う。マルチプレクサ160は、音源決定器150から入
力される音源信号と代表PA几COR係数検出器130
から入力されるPA几COR係数および代表区間を表す
位置と、有声/無声判定器140から入力される有声/
無声の判定結果と、ピッチ分析器110から入力される
基本周期を表す符号とを適宜組み合わせて多重化し出力
端子170より出力する。
復号化側では、伝送路を介して入力した多重化信号の符
号系列を入力端子200から入力し、デマルチプレクサ
210で音源信号を表す符号とPA凡COR係数を表す
符号と、代表区間の位置を表す符号と、有声/無声の判
定を表す符号と、基本周期を表す符号とに分離し、それ
らを復号して、音源信号を表す符号は音源復号器230
に、有声/無声の判定結果を表す符号は有声/無声判定
器240に、PA几COR係数を表す符号と代表区間を
表す符号は代表P、lCO凡係数復号器220に、基本
周期を表す符号は音源復号器230にそれぞれ出力され
る。代表PARCOR係数復号器220は、前記基本周
期で決まる当該フレームのサブフレームのPARCOR
係数を再生させる。このとき、前フレームに対し送られ
た代表PARCOR係数と現フレームの代表PARCO
R係数との間で前記スペクトル変化尺度Dsを計算する
。Dsが予め定められたCより大きい場合は、現フレー
ムの代表区間より過去にあるサブフレームのPA凡CO
凡係数は過去の代表PARCOR係数を用いる。もしD
sがεよシ小さければ、従来方式と同様に現フレームの
代表PAL(、COR係数と前フレームの代表PA几C
O几係数との線形内挿で生成させる。音源復号器230
は、有声/無声判定器240で有声と判断された符号t
−5ffと6、代表PARCOR4a復号器220から
音源パルスの再生を線形内挿で行うか、代表パルスの繰
り返しで行うかの判定を受は取る。有声でかつ音源パル
スの再生を代表区間の音源パルス系列の線形内挿で行う
と判断されたフレームに対しては、前記文献1と同じ処
理をする。有声でかつ当該フレームが過渡フレームであ
ると判断された場合は、代表区間よシ過去に位置するサ
ブフレームの音飄過去の代表パルスを繰シ返すここで生
成させる。無声音と判断された場合は、正規白色雑音f
啄を用いる。音声生成器250社、代表PARCOR係
数復号器220から入力されるサブフレーム毎のPAR
COR係数と音源復号器230から入力される音銀信号
とをもちい合成音声を再生し出力端子260かもそれを
出力する。
以上で、本発明の実施例KvAする説明を終える。
(発明の効果) 以上説明してきたように本発明は、代表区間の代表音源
パルス系列とスペクトル包絡情報である代表PARCO
R系列を用いて他の区間の音源パルス系列とパラメータ
係数を生成させる際、生成方法を原音声信号のスペクト
ル変動特性に適応させることによシ、音声現象が非定常
信号であり、従来方式のようにあらゆる音iw壊境に対
しても常に直線内挿を適用する構成では音声現象の変動
を十分表すことができないのに対し、音声現象の変動に
十分に追随することができ、従りてより自然性の高い音
声が合成できるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、i@2図
はサブフレーム間のスペクトルの最大値が予め設定した
ー゛値よりも大きい場合の本発明の原理図、第3図は隣
接するフレーム間のスペクトル変化率が予め設定した閾
値よシも大きい場合の本発明の原理図である。 100・・・・・・入力端子、110・・・・・・ピッ
チ分析器、120・・・・・・サブフレームPARCO
R係数計算器、130・・・・・・代表PARCOR係
数検出器、140・・・・・・有声/無声判定器、15
0・・・・・・音源決定器、160・・・・・・マルチ
プレクサ、170・・・・・・出力端子、200・・・
・・・入力端子、210・・・・・・デマルチプレクサ
、22゜・・・・・・代表PARCOR係数復号化器、
230・・・・・・音源復号a、240・・・・・・有
声/無声判定器%250(看7っけ) (又Xクトノシ針化待り 代表区画

Claims (3)

    【特許請求の範囲】
  1. (1)音声信号系列を一定間隔に分割して入力し前記音
    声信号系列をスペクトル包絡を表すパラメータと駆動音
    源系列とで表す場合に前記駆動音源系列をそのなかのあ
    る特定区間の駆動音源系列で代表させる音声符号化・復
    号化方式において、前記特定区間を前記分割された音声
    信号の基本周期と前記スペクトル包絡を表すパラメータ
    で決定するとともに前記特定区間の駆動音源系列から全
    区間にわたる駆動音源系列を再生する際に前記スペクト
    ル包絡パラメータを用いることを特徴とする音声符号化
    ・復号化方式。
  2. (2)一連の音声信号系列を一定間隔の区間に分割して
    入力する手段と、前記入力音声信号系列のスペクトル包
    絡を表すパラメータと前記音声信号系列の基本周期とを
    求める手段と、前記スペクトル包絡を表すパラメータと
    前記基本周期とから特定区間を定める手段と、前記入力
    音声信号系列と前記スペクトル包絡を表すパラメータと
    から前記特定区間の駆動音源系列を定める際に前記スペ
    クトル包絡パラメータに適応した全区間にわたる駆動音
    源系列を再生するできるようにする前記特定区間の駆動
    音源を定める手段と、前記スペクトル包絡を表すパラメ
    ータと前記基本周期と前記特定区間および前記特定区間
    の駆動音源系列とを符号化する手段と、前記スペクトル
    包絡パラメータを表す符号と前記基本周期を表す符号と
    前記特定区間の音源系列を表す符号と前記特定区間を表
    す符号とを出力する手段とを有することを特徴とする音
    声符号化装置。
  3. (3)符号系列を入力する手段と、前記符号系列からス
    ペクトル包絡パラメータを表す符号と基本周期を表す符
    号と特定区間の音源系列を表す符号と前記特定区間を表
    す符号とを復号する手段と、前記スペクトル包絡パラメ
    ータと前記基本周期とに適応させて前記特定区間の駆動
    音源系列から駆動音源系列を再生する手段と、前記スペ
    クトル包絡と前記再生された駆動音源系列とから再生音
    声信号系列を生成する手段と、前記生成音声信号系列を
    出力する手段とを有することを特徴とする音声復号化装
    置。
JP62058043A 1987-03-13 1987-03-13 音声符号化・復号化方式とその装置 Expired - Lifetime JPH07101356B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62058043A JPH07101356B2 (ja) 1987-03-13 1987-03-13 音声符号化・復号化方式とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62058043A JPH07101356B2 (ja) 1987-03-13 1987-03-13 音声符号化・復号化方式とその装置

Publications (2)

Publication Number Publication Date
JPS63223800A true JPS63223800A (ja) 1988-09-19
JPH07101356B2 JPH07101356B2 (ja) 1995-11-01

Family

ID=13072906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62058043A Expired - Lifetime JPH07101356B2 (ja) 1987-03-13 1987-03-13 音声符号化・復号化方式とその装置

Country Status (1)

Country Link
JP (1) JPH07101356B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58207099A (ja) * 1982-05-03 1983-12-02 テキサス インスツルメンツ インコ−ポレイテツド 音声のlpcコード化方法
JPS5917439A (ja) * 1982-07-15 1984-01-28 Ricoh Co Ltd シ−ト状物検出装置
JPS59168494A (ja) * 1983-03-16 1984-09-22 株式会社日立製作所 音声合成方式
JPS617899A (ja) * 1984-06-22 1986-01-14 日本電気株式会社 マルチパルス型符号化復号化装置
JPS6162100A (ja) * 1984-09-04 1986-03-29 日本電気株式会社 マルチパルス型符号化復号化装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58207099A (ja) * 1982-05-03 1983-12-02 テキサス インスツルメンツ インコ−ポレイテツド 音声のlpcコード化方法
JPS5917439A (ja) * 1982-07-15 1984-01-28 Ricoh Co Ltd シ−ト状物検出装置
JPS59168494A (ja) * 1983-03-16 1984-09-22 株式会社日立製作所 音声合成方式
JPS617899A (ja) * 1984-06-22 1986-01-14 日本電気株式会社 マルチパルス型符号化復号化装置
JPS6162100A (ja) * 1984-09-04 1986-03-29 日本電気株式会社 マルチパルス型符号化復号化装置

Also Published As

Publication number Publication date
JPH07101356B2 (ja) 1995-11-01

Similar Documents

Publication Publication Date Title
JPH07160298A (ja) マルチパルス符号化方法とその装置並びに分析器及び合成器
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP3303580B2 (ja) 音声符号化装置
JP2943983B1 (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JP3583945B2 (ja) 音声符号化方法
JPS63223800A (ja) 音声符号化・復号化方式とその装置
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
JPH02282800A (ja) 音声符号化方式
JPH02280200A (ja) 音声符号化復号化方式
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPS62102294A (ja) 音声符号化方式
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置
JP2001154683A (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
JP3071800B2 (ja) 適応ポストフィルタ
JP3103108B2 (ja) 音声符号化装置
JP3199128B2 (ja) 音声の符号化方法
JPS63244100A (ja) 音声分析装置および音声合成装置
JP2844590B2 (ja) 音声符号化方式とその装置
JPH10105200A (ja) 音声符号化/復号化方法
JPH043878B2 (ja)
JPH01257999A (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JPS621000A (ja) 音声処理装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term