JP2956068B2 - 音声符号化復号化方式 - Google Patents

音声符号化復号化方式

Info

Publication number
JP2956068B2
JP2956068B2 JP1100113A JP10011389A JP2956068B2 JP 2956068 B2 JP2956068 B2 JP 2956068B2 JP 1100113 A JP1100113 A JP 1100113A JP 10011389 A JP10011389 A JP 10011389A JP 2956068 B2 JP2956068 B2 JP 2956068B2
Authority
JP
Japan
Prior art keywords
pitch
signal
parameter
pulse
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1100113A
Other languages
English (en)
Other versions
JPH02280200A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP1100113A priority Critical patent/JP2956068B2/ja
Publication of JPH02280200A publication Critical patent/JPH02280200A/ja
Application granted granted Critical
Publication of JP2956068B2 publication Critical patent/JP2956068B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号を低いビットレート、特に4.8kb/
s程度で、比較的少ない演算量により高品質に符号化し
復号化するための音声符号化復号化方式に関する。
〔従来の技術〕
音声信号を4.8kb/s程度の低いビットレートで符号化
する方式としては、例えば特願昭59−272435号明細書
(文献1)や特願昭60−178911号明細書(文献2)等に
記載されているピッチ補間マルチパルス法が知られてい
る。この方法によれば、送信側では、フレーム毎の音声
信号から音声信号のスペクトル特性を表すスペクトルパ
ラメータとピッチを表すピッチパラメータとを抽出し、
音声信号の有声区間では、1フレームの音源信号を、1
フレームをピッチ区間毎に分割した複数個のピッチ区間
のうちの一つのピッチ区間(代表区間)についてマルチ
パルスで表し、代表区間におけるマルチパルスの振幅,
位相と、スペクトル、ピッチパラメータを伝送する。ま
た無声区間では、1フレームの音源を少数のマルチパル
スと雑音信号で表し、マルチパルスの振幅,位相と、雑
音信号のゲイン,インデックスを伝送する。
受信側においては、有声区間では、現フレームの代表
区間のマルチパルスと隣接フレームの代表区間のマルチ
パルスとを用いてマルチパルス同士の振幅と位相を補間
して、代表区間以外のピッチ区間のマルチパルスを復元
しフレームの駆動音源信号を復元する。また、無声区間
では、マルチパルスと雑音信号のインデックス,ゲイン
を用いてフレームの駆動音源信号を復元する。さらに、
復元した駆動音源信号を、スペクトルパラメータを用い
た合成フィルタに入力して合成音声信号を出力する。
〔発明が解決しようとする課題〕
上述した従来方式によれば、有声区間では代表区間に
たてた少数のマルチパルスと隣接フレームの代表区間に
おけるマルチパルスとを補間して音源信号を表してい
た。しかるにマルチパルスの振幅,位相を符号化するの
に、1パルス当り合計で10ビット程度のビット数が必要
である。従って、4.8kb/s程度のビットレートに適用す
るためには代表区間のマルチパルスの個数を通常4個程
度と少なくする必要がある。従ってこのように少ない個
数では音源信号の近似度が十分ではなく、特にピッチ周
期の長い男性話者では温室が劣化するという問題点があ
った。さらに従来方式では、代表区間以外のピッチ区間
は代表区間のパルス同士を線形補間して音源信号を復元
していたが、パルスには振幅と位相の2種のパラメータ
があり相互に関係しているため、これらを独立に補間す
ると特性が低下するという問題点があった。
本発明の目的は、上述した問題点を解決し、比較的少
ない演算量により4.8kb/s程度で音質の良好な音声符号
化復号化方式を提供することにある。
〔課題を解決するための手段〕
第1の発明である音声符号化復号化方式は、送信側で
は、入力した離散的な音声信号から、スペクトル包絡を
表すスペクトルパラメータとピッチを表すピッチパラメ
ータとを予め定められた時間長のフレーム毎に求め、前
記フレームの音声信号を前記ピッチパラメータから求め
たピッチ周期に応じたピッチ区間毎に分割し、前記ピッ
チ区間の内の1つのピッチ区間の音源信号を少数のパル
スと、前記音源信号のスペクトル特性を表すインパルス
応答系列もしくは係数系列から構成されるコードブック
とで表し、前記パルスと前記コードブックにより生成さ
れる合成信号と前記音声信号との誤差を小さくするよう
に前記パルスの振幅と位相を求め、前記コードブックか
ら一つのコードワードを選択し、前記ピッチパラメータ
と前記スペクトルパラメータと前記パルスの振幅,位相
と前記コードワードを表すインデックスとを出力し、受
信側では、前記パルスの振幅,位相と前記インデックス
とを用いて前記ピッチ区間の音源信号を発生し、さらに
他のピッチ区間の音源信号を復元し、前記スクトルパラ
メータを用いて構成した合成フィルタを駆動して合成音
声を求め出力することを特徴とする。
第2の発明である音声符号化復号化方式は、送信側で
は、入力した離散的な音声信号から、スペクトル包絡を
表すスペクトルパラメータとピッチを表すピッチパラメ
ータとを予め定められた時間長のフレーム毎に求め、前
記フレームの音声信号を前記ピッチパラメータから求め
たピッチ周期に応じたピッチ区間毎に分割し、前記ピッ
チ区間の内の1つのピッチ区間の音源信号を少数のパル
スと、前記音源信号のスペクトル特性を表すインパルス
応答系列もしくは係数系列から構成されるコードブック
とで表し、さらに前記ピッチ区間以外の他のピッチ区間
では前記パルスの振幅、位相の少なくとも一方を補正す
る補正係数を求め、前記ピッチパラメータと前記スペク
トルパラメータと前記パルスの振幅,位相と前記コード
ブックから選択されたコードワードを表すインデックス
と前記補正係数を出力し、受信側では、前記パルスの振
幅,位相と前記コードワードのインデックスとを用いて
前記ピッチ区間の音源信号を発生し、さらに他のピッチ
区間では前記ピッチ区間の音源信号と前記補正係数を用
いて音源信号を復元し、前記スペクトルパラメータを用
いて構成した合成フィルタを駆動して合成音声を求めて
出力することを特徴とする。
〔作用〕
本発明による音声符号化復号化方式は、有声区間にお
いて、第3図のブロック図に示すように、フレーム(通
常20ms程度)内のピッチ区間の音源信号を、振幅及び位
相を与えるための少数のパルスを発生するパルス発生部
700と、音源信号のスペクトル包絡を表すフィルタのイ
ンパルス応答、あるいはフィルタの係数のコードブック
720から一つを選択して音源信号を形成する音源信号形
成部710により表すことを特徴とする。さらにこのよう
にして表した音源信号により合成フィルタ730を駆動し
て再生音声を得る。
今、一例として前記パルスの個数を1とする。コード
ブックには、音源信号のスペクトル包絡を表すフィルタ
のインパルス応答の集合からなるコードブックを用い
る。これをhj(n)(j=1−2M)とする。このインパ
ルス応答は種々の方法により求めることができる。例え
ば、音声信号をLPC分析して得た予測残差信号のフレー
ム毎の予め定められたサンプル数をFFT(高速フーリエ
変換)して絶対値スペクトルを求め、さらに逆FFTする
とインパルス応答が求める。別の方法としては、前記予
測残差信号を周知のLPC分析して合成フィルタの係数を
求め、このフィルタのインパルス応答を求める。以上の
他、周知の方法を用いることができる。
前記パルスの振幅g,位相m、コードブックは次のよう
に求める。第4図(a)に或るフレームの音声波形を示
す。フレームをピッチ周期T毎のピッチ区間に区切り、
一つのピッチ区間(代表区間)に着目する(第4図
(b))。この区間での音声信号をxk(n)とする。こ
の区間におけるパルスの振幅g,位相m、コードブックか
らの最適なコードワードの選択は、次式で示す重みづけ
誤差電力を最小化するように行う。重みづけ誤差電力Ek
は、 ただし、 (n−m)=g・hj(n−m)*hs(n) ・・・(2) ここで、w(n)は聴感重みづけフィルタのインパル
ス応答を示す。具体的な構成例は、Atal氏らによる“A
New Model of LPC Excitation for Producing Natural
Sounding Speech at low Bit Rates",Proc.ICASSP,pp,6
14−617,1982,文献3)を参照することができる。ただ
し、このフィルタはなくてもよい。(n)は、パル
スとコードブックから選択したj番目のコードワードと
を用いて音源信号を表し、さらにこれを合成フィルタに
通して再生した再生音声を示す。またhs(n)は音声を
合成するための合成フィルタのインパルス応答を示す。
(2)式を(1)式に代入してgで偏微分して0とおき
次式を得る。
g=Σxwk(n)x′wk(n−m) /Zx′wk(n−m)x′wk(n−m) ・・・(3) ここで、 xwk(n)=xk(n)*w(n) x′wk(n−m)=hj(n−m)*hs(n)*w(n)
・・・(4) である。(1)式を最小化する最適なg,m,hjの組は次の
ように求められる。インパルス応答系列hjとしてまず或
るコードワードを用いて(3)式を計算し、(1)知を
最小化するようにg,mを求める。
これには、 g・Σxwk(n)x′wk(n−m) /Σx′wk(n−m)x′wk(n−m) を最大化するg,mを求めればよい。以上の処理を全ての
jについて行い、 g・Σxwk(n)x′wk(n−m) /Σx′wk(n−m)x′wk(n−m) の値が最も大きいg,m,jの組が求める組である。
以上の説明により、着目するピッチ区間においてパル
スの振幅,位相、コードワードが求まる。第4図
(c),(d)に、求めたパルス、求めたパルスと選択
したコードワードにより発生した代表区間の音源信号に
より合成フィルタを駆動して得た合成波形をそれぞれ示
す。以上の処理はフレーム内の全てのピッチ区間で行っ
てもよいし、一つのピッチ区間(代表区間)についての
み行ってもよい。
一方、無声区間では、1フレーム全体の音源信号を従
来のマルチパルスや乱数コードブック信号などを用いて
表すことができる。後者の方法に関しては、例えば、シ
ュレーダ,アタル氏らによる“Code−excited linear p
rediction(CELP):Highquality speech at very low b
it rates"と題した論文(ICASPP,937−940,1985,文献
4)等を参照できる。
〔実施例〕
第1図(a),(b)は、第1の本発明による音声符
号化復号化方式を実施する音声符号化装置および音声復
号化装置をそれぞれ示す。
まず、送信側での音声符号化方式について説明する。
第1図(a)において、入力端子100から音声信号を入
力し、1フレーム分(例えば20ms)の音声信号x(n)
をバッファメモリ110に格納する。
Kパラメータ計算回数140は、フレームの音声信号の
スペクトル特性を表すスペクトルパラメータとして、K
パラメータを前記フレームの音声信号から周知のLPC分
析を行い、予め定められた次数Mだけ計算する。この具
体的な計算方法については前記文献1,2のKパラメータ
計算回数を参照することができる。なお、Kパラメータ
はPARCOR係数と同一のものである。
Kパラメータ符号化回路160は、Kパラメータを予め
定めた量子化ビット数で量子化して得た符号lkをマルチ
プレクサ260へ出力するとともに、これを復号化してさ
らに線形予測係数ai′(i=1〜M)に変換して重みづ
け回数200,インパルス応答計算回数170へ出力する。K
パラメータの符号化、Kパラメータから線形予測係数へ
の変換の方法については、J.Malhoul氏らによる“Linea
r Prodiction of Speech"と題した刊行物(文献5)等
や前記文献1,2等を参照することができる。
ピッチ計算回数130は、フレームの音声信号から平均
ピッチ周期Tを計算する。この方法としては例えば自己
相関法にもとづく方法が知られており、詳細は前記文献
1,2のピッチ抽出回路を参照することができる。また、
この方法以外にも他の周知な方法(例えば、ケプストラ
ム法、SIFT法、変相関法など)を用いることができる。
ピッチ符号化回路150は、平均ピッチ周期Tを予め定
められたビット数で量子化して得た符号をマルチプレク
サ260へ出力するとともに、これを復号化して得た復号
ピッチ周期T′をピッチ分割回路205,音源信号計算回数
220へ出力する。
コードブック175は、残差信号のスペクトル包絡を表
すフィルタのインパルス応答の系列h(n)(n=1−
L)の集合(コードブック)を2M種類格納している。こ
こでコードブックは予め多量の音声信号の予測残差信号
から分析した、残差信号のスペクトル包絡を表すフィル
タのインパルス応答データから学習により作成してお
く。この学習の方法としては、ベクトル量子化の学習法
が知られており、例えばMakhoul氏らによる“Vector Qu
antization in Speech Coding,"(Proc.IEEE,vol,73,1
1,1551−1588,1985,文献6)等を参照することができ
る。また、残差信号のスペクトル包絡を表すフィルタの
特性の求め方としては、周知の種々の方法を用いること
ができる。例えば、残差信号に対してLPC分析,共分散
分析,改良ケプストラム分析などを用いることができ
る。LPC分析,共分散分析については、Rabiner and Sch
afer氏らによる“Digital Processing of Speech Signa
ls"と題した刊行物(Prentice−Hall著)1978年,文献
7)を参照できる。改良ケプストラム分析については、
今井氏らによる“改良ケプストラム法によるスペクトル
包絡の抽出”(電子通信学学論文誌,J62−A,217−233
頁,1979年、文献8)等を参照できる。コードブック175
は、2M個のインパルス応答系列hj(n)(j=1−2M
について、j=1から順にj=2Mまで一つずつインパル
ス応答計算回数170へ出力する。
インパルス応答計算回数170は、Kパラメータ符号化
回路160からの線形予測係数ai′を用いて、聴感重みづ
けを行った合成フィルタのインパルス応答hw(n)を計
算し、さらにコードブック175からの出力hj(n)と
(4)式に従いたたみこみ計算を行って得たインパルス
応答をx′wk(n−m)を、自己相関関数計算回路180
へ出力する。
自己相関関数計算回路180は、インパルス応答x′wk
(n−m)の自己相関関数Rhh(n)を予め定められた
遅れ時間まで計算して出力する。自己相関関数計算回路
180の動作は前記文献1,2等を参照することができる。
減算器190は、フレームの音声信号x(n)から合成
フィルタ281の出力を1フレーム分減算し、減算結果を
重みづけ回路200へ出力する。
重みづけ回路200は、前記減算結果をインパルス応答
がw(n)で表される聴感重みづけフィルタに通し、重
みづけ信号xw(n)を得てこれを出力する。重みづけの
方法は前記文献1,2等を参照できる。
ピッチ分割回路205は、フレームの音声信号を復号化
されたピッチ周期T′を用いてT′毎に分割する。
相互相関関数計算回路210は、重みづけ信号xw(n)
とインパルス応答x′wk(n−m)を入力して相互相関
関数φxhを予め定められた遅れ時間まで計算し出力す
る。この計算法は前記文献1,2等を参照できる。
音源信号計算回路220では、フレーム内の代表的な1
ピッチ区間(代表区間)について、コードブック出力hj
(n)を用いたときの1個のパルスの振幅gと位相mを
求める。このときg,mの計算には前記(3)式を用い
る。前記作用の項で述べたように、hj(n)として2M
類についてコードブック175から出力して以上の処理を
繰り返し行い、(1)式の誤差電力を最小化するg,m,hj
(n)の組を求める。そして選択されたコードブックの
インデックスを示す符号をマルチプレクサ260に出力
し、g,mを符号器230へ出力する。
符号器230は、代表区間のパルスの振幅g,位相mを予
め定められたビット数で符号化して出力する。また、代
表区間のサブフレーム位置を示す情報PLを予め定められ
たビット数で符号化してマルチプレクサ260へ出力す
る。さらに、これらを復号化して駆動信号復元回路283
へ出力する。
駆動信号復元回路283は、代表区間において求めたパ
ルスの振幅,位相,選択したコードワードを用いて代表
区間において音源信号を発生する。他のピッチ区間にお
いては、前後のフレームの代表区間におけるパルスの振
幅を用いて振幅同士を線形補完して、他のピッチ区間の
パルスを求める。また、選択したコードワードに対して
は、代表区間のコードワード同士を線形補間して、他の
ピッチ区間における残差信号のスペクトル包絡を表すイ
ンパルス応答を求める。以上の処理によりフレームの音
源信号を復元して発生する。
合成フィルタ281は、前記復元された音源信号を入力
し、Kパラメータ符号化回路160からの線形予測係数
ai′を重みづけ回路200を介して入力して1フレーム分
の合成音声信号を求めると共に、次のフレームへの影響
信号を1フレーム分計算し、これを減算器190へ出力す
る。なお、影響信号の計算法は特願昭57−231605号明細
書(文献9)等を参照できる。
マルチプレクサ260は、代表区間におけるパルスの振
幅,位相を表す符号、代表区間の位置を表す符号、Kパ
ラメータを表す符号、ピッチ周期を表す符号、選択され
たコードワードを表す符号を組み合わせて出力する。
次に、受信側での音声復号化方式について説明する。
第1図(b)において、受信側では、デマルチプレクサ
300は受信した信号を分離して出力する。
復号器310は代表区間におけるパルスの振幅,位相を
復号して出力する。
パラメータ復号器320は、Kパラメータを表す符号を
復号し、さらに復号したKパラメータを線形予測係数
ai′に変換して出力する。また、ピッチ周期を表す符号
を復号し、復号したピッチ周期T′を出力する。
駆動信号復元回路340は、送信側における駆動信号復
元回路283と同一の動作を行い、フレームの音源信号を
復元する。またコードブック350は、送信側のコードブ
ック175と同一のコードワードを格納している。
合成フィルタ360は、フレームの音源信号を入力し合
成音声を求めた端子380から出力する。
以上のように本実施例によれば、送信側では、入力し
た離散的な音声信号から、スペクトル包絡を表すスペク
トルパラメータとピッチを表すピッチパラメータとを予
め定められた時間長のフレー4毎に求め、前記フレーム
の音声信号を前記ピッチパラメータから求めたピッチ周
期に応じたピッチ区間毎に分割し、前記ピッチ区間の内
の1つのピッチ区間の音源信号を少数のパルスと前記音
源信号の特性を表すコードブックとで表し、前記音声信
号と前記パルスと前記コードブックにより得られる合成
信号の誤差を小さくするように前記パルスの振幅と位相
を求め、前記コードブックから一つのコードワードを選
択し、前記ピッチパラメータと前記スペクトルパラメー
タと前記パルスの振幅,位相と前記コードワードを表す
インデックスとを出力し、受信側では、前記パルスの振
幅,位相と前記インデックスとを用いて前記ピッチ区間
の音源信号を発生し、さらに補間により他のピッチ区間
の音源信号を復元し、前記スペクトルパラメータを用い
て構成した合成フィルタを駆動して合成音声を求め出力
する。
第2図(a),(b)は、第2の本発明による音声符
号化復号化方式を実施する音声符号化装置および音声復
号化装置をそれそれ示す。図において第1図(a),
(b)と同一の参照番号を付した構成要素は第1図
(a),(b)と同様の動作をするので説明は省略す
る。
第2図(a)において、225は振幅・位相補正計算回
路である。振幅・位相補正計算回路225では、同一フレ
ーム内の代表区間以外のピッチ区間において代表区間の
パルスの振幅,位相を補正するための補正係数を各ピッ
チ区間毎に計算する。具体的には次のように求める。第
i番目のピッチ区間における入力音声,振幅補正係数,
位相補正係数を、それぞれxi(n),ci,diとする。
第i番目のピッチ区間における入力音声と代表区間の
パルスの振幅,位相を補正して合成フィルタに通して再
生した再生信号(n)との聴感重みづけ誤差電力は
次のように書ける。
振幅,位相補正係数ci,diは上式を最小化するように
求めることができる。上式を振幅補正係数ciで偏微分し
て0とおき次式を得る。
ci=Σxwi(n)wi(n−T′−di)/ Σwi(n−T′−diwi(n−T′−di) ・・・(6) 種々の位相補正係数diについて上式を計算し、上式を
最大化するci,diの組を求めればよい。以上の処理をフ
レーム内の代表区間以外の全てのピッチ区間について行
い、各区間の振幅・位相補正係数を符号器230へ出力す
る。
駆動信号復元回路285は、フレームの代表区間ではパ
ルスの振幅,位相及び選ばれたコードワードを用いて音
源信号を発生させる。また同一フレーム内の代表区間以
外のi番目のピッチ区間においては、代表区間の音源信
号v(n)を振幅,位相補正係数ci,diを用いて次式に
従い補正して音源信号di(n)を発生させる。
di(n)=ci・v(n−T′−di) ・・・(7) ただし、 v(n)=g・hj(n−m) ・・・(8) ここでhj(n),g,mはコードブックのコードワード、パ
ルスの振幅、パルスの位相である。
第2図(b)に示す受信側の復号化装置において、駆
動信号復元回路342は送信側の駆動信号復元回路285と同
一の動きを行う。
以上のように本実施例によれば、送信側では、入力し
た離散的な音声信号からのスペクトル包絡を表すスペク
トルパラメータとピッチを表すピッチパラメータとを予
め定められた時間長のフレーム毎に求め、前記フレーム
の音声信号を前記ピッチパラメータから求めたピッチ周
期に応じたピッチ区間毎に分割し、前記ピッチ区間の内
の1つのピッチ区間の音源信号を少数のパルスと前記音
源信号の特性を表すコードブックとで表し、さらに前記
ピッチ区間以外の他のピッチ区間では前記パルスの振
幅,位相を補正する補正係数を求め、前記ピッチパラメ
ータと前記スペクトルパラメータと前記パルスの振幅,
位相と前記コードブックの選択されたコードワードを表
すインデックスと前記補正係数を出力し、受信側では前
記パルスの振幅,位相と前記コードワードのインデック
スとを用いて前記ピッチ区間の音源信号を発生し、さら
に他のピッチ区間では前記ピッチ区間の音源信号と前記
補正係数とを用いて音源信号を復元し、前記復元した音
源信号により前記スペクトルパラメータを用いて構成し
た合成フィルタを駆動して合成音声を求めて出力する。
上述した各実施例はあくまで本発明の一例に過ぎず、
その変形例も種々考えられる。
例えば、パルスの振幅,位相の計算及びコードワード
の選択を代表区間のみではなくフレーム内の全ピッチ区
間において行うようにしてもよい。このような構成とす
ると、音源情報の伝送に必要な情報量は増大するが特性
は向上する。
また、代表区間は例えばフレームの中央部というよう
にフレーム内で固定的に決めてもよいし、最もよい区間
を探索して求めてもよい。後者の具体的な方法について
は前記文献1を参照できる。
また、代表区間のパルスの個数は2以上でもよいが、
伝送情報量が増大する。
また、コードワードに関しては代表区間以外の他のピ
ッチ区間においては線形補間してもよいし、しなくても
よい。
また、コードブックとして、音声信号の予測残差信号
のスペクトル包絡を表すフィルタのインパルス応答とし
たが、フィルタの係数としてもよい。このような構成の
ときはフィルタ係数からインパルス応答に変換する必要
がある。係数としては具体的には、線形入予測係数,Kパ
ラメータ,対数断面積比,ケプストラム,メルケプスト
ラムなど周知の係数を用いることができる。
また、本実施例では、スペクトルパラメータとしてK
パラメータを符号化し、その分析法としてLPC分析を用
いたが、スペクトルパラメータとしては他の周知なパラ
メータ、例えばLSP,LPCケプストラム,ケプストラム,
改良ケプストラム,一般化ケプストラム,メルケプスト
ラムなどを用いることもできる。また各パラメータに最
適な分析法を用いることができる。
また、演算量を低減するために、影響信号の計算を省
略することもできる。これによって、駆動信号復元回路
283,合成フィルタ281,減算器190は不要となり演算量低
減が可能となるが、音質は低下する。
なお、デジタル信号処理の分野でよく知られているよ
うに、自己相関関数は周波数軸上でパワスペクトルに、
相互相関関数はクロスパワスペクトルに対応しているの
で、これらから計算することもできる。これらの計算法
については、Oppenheim氏らによる“Digital Signal Pr
ocessing"(Prentice−Hall,1975)と題した刊行物を参
照できる。
〔発明の効果〕
以上述べたように、本発明によれば、1ピッチ区間の
音源信号(代表区間)を、振幅,位相を与える少数のパ
ルスと音源信号の特性を表すコードブックとを用いて表
しているので、4.8kb/s程度のビットレートでは従来方
式に比べ音源信号の近似度が高く良好な合成音声を得る
ことができるという大きな効果がある。
【図面の簡単な説明】
第1図は第1の発明による音声符号化復号化方式の一実
施例を説明するための音声符号化装置及び音声復号化装
置のブロック図、 第2図は第2の発明による音声符号化復号化方式の一実
施例を説明するための音声符号化装置及び音声復号化装
置のブロック図、 第3図及び第4図は本発明の原理を説明するための図で
ある。 110……バッファメモリ 130……ピッチ計算回路 140……Kパラメータ計算回路 150……ピッチ符号化回路 160……Kパラメータ符号化回路 170……インパルス応答計算回路 175,350,720……コードブック 180……自己相関関数計算回路 205……ピッチ分割回路 210……相互相関関数計算回路 220……音源信号計算回路 225……振幅・位相補正計算回路 230……符号器 260……マルチプレクサ 281,360,730……合成フィルタ 283,285,340,342……駆動信号復元回路 300……デマルチプレクサ

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】送信側では、入力した離散的な音声信号か
    ら、スペクトル包絡を表すスペクトルパラメータとピッ
    チを表すピッチパラメータとを予め定められた時間長の
    フレーム毎に求め、前記フレームの音声信号を前記ピッ
    チパラメータから求めたピッチ周期に応じたピッチ区間
    毎に分割し、前記ピッチ区間の内の1つのピッチ区間の
    音源信号を少数のパルスと、前記音源信号のスペクトル
    特性を表すインパルス応答系列もしくは係数系列から構
    成されるコードブックとで表し、前記パルスと前記コー
    ドブックにより生成される合成信号と前記音声信号との
    誤差を小さくするように前記パルスの振幅と位相を求
    め、前記コードブックから一つのコードワードを選択
    し、前記ピッチパラメータと前記スペクトルパラメータ
    と前記パルスの振幅,位相と前記コードワードを表すイ
    ンデックスとを出力し、受信側では、前記パルスの振
    幅,位相と前記インデックスとを用いて前記ピッチ区間
    の音源信号を発生し、さらに他のピッチ区間の音源信号
    を復元し、前記スペクトルパラメータを用いて構成した
    合成フィルタを駆動して合成音声を求め出力する音声符
    号化復号化方式。
  2. 【請求項2】送信側では、入力した離散的な音声信号か
    ら、スペクトル包絡を表すスペクトルパラメータとピッ
    チを表すピッチパラメータとを予め定められた時間長の
    フレーム毎に求め、前記フレームの音声信号を前記ピッ
    チパラメータから求めたピッチ周期に応じたピッチ区間
    毎に分割し、前記ピッチ区間の内の1つのピッチ区間の
    音源信号を少数のパルスと、前記音源信号のスペクトル
    特性を表すインパルス応答系列もしくは係数系列から構
    成されるコードブックとで表し、さらに前記ピッチ区間
    以外の他のピッチ区間では前記パルスの振幅、位相の少
    なくとも一方を補正する補正係数を求め、前記ピッチパ
    ラメータと前記スペクトルパラメータと前記パルスの振
    幅,位相と前記コードブックから選択されたコードワー
    ドを表すインデックスと前記補正係数を出力し、受信側
    では、前記パルスの振幅,位相と前記コードワードのイ
    ンデックスとを用いて前記ピッチ区間の音源信号を発生
    し、さらに他のピッチ区間では前記ピッチ区間の音源信
    号と前記補正係数を用いて音源信号を復元し、前記スペ
    クトルパラメータを用いて構成した合成フィルタを駆動
    して合成音声を求めて出力する音声符号化復号化方式。
JP1100113A 1989-04-21 1989-04-21 音声符号化復号化方式 Expired - Lifetime JP2956068B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1100113A JP2956068B2 (ja) 1989-04-21 1989-04-21 音声符号化復号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1100113A JP2956068B2 (ja) 1989-04-21 1989-04-21 音声符号化復号化方式

Publications (2)

Publication Number Publication Date
JPH02280200A JPH02280200A (ja) 1990-11-16
JP2956068B2 true JP2956068B2 (ja) 1999-10-04

Family

ID=14265315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1100113A Expired - Lifetime JP2956068B2 (ja) 1989-04-21 1989-04-21 音声符号化復号化方式

Country Status (1)

Country Link
JP (1) JP2956068B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10228491A (ja) * 1997-02-13 1998-08-25 Toshiba Corp 論理検証装置
KR100955126B1 (ko) * 1997-10-22 2010-04-28 파나소닉 주식회사 벡터 양자화 장치
EP1734512B1 (en) 1997-10-22 2015-09-09 Godo Kaisha IP Bridge 1 CELP encoder and a method of CELP encoding
JP2008020840A (ja) * 2006-07-14 2008-01-31 Sharp Corp 音声合成装置、音声合成方法およびコンピュータを音声合成装置として機能させるためのプログラム、ならびに、フィルタ生成装置、フィルタ生成方法およびコンピュータをフィルタ生成装置として機能させるためのプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
昭和63年電子情報通信学会秋季全国大会講演論文集 A−9

Also Published As

Publication number Publication date
JPH02280200A (ja) 1990-11-16

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
US5953697A (en) Gain estimation scheme for LPC vocoders with a shape index based on signal envelopes
JP2970407B2 (ja) 音声の励振信号符号化装置
JPH0944195A (ja) 音声符号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3308764B2 (ja) 音声符号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3303580B2 (ja) 音声符号化装置
JP2946525B2 (ja) 音声符号化方式
JPH0854898A (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3299099B2 (ja) 音声符号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2992998B2 (ja) 音声符号化復号化装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP2853170B2 (ja) 音声符号化復号化方式
JP2658438B2 (ja) 音声符号化方法とその装置
JP3192051B2 (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070723

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080723

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 10