JP3364827B2 - 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置 - Google Patents

音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置

Info

Publication number
JP3364827B2
JP3364827B2 JP06040997A JP6040997A JP3364827B2 JP 3364827 B2 JP3364827 B2 JP 3364827B2 JP 06040997 A JP06040997 A JP 06040997A JP 6040997 A JP6040997 A JP 6040997A JP 3364827 B2 JP3364827 B2 JP 3364827B2
Authority
JP
Japan
Prior art keywords
vector
code
pitch
sound source
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06040997A
Other languages
English (en)
Other versions
JPH10177399A (ja
Inventor
正 山浦
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP06040997A priority Critical patent/JP3364827B2/ja
Publication of JPH10177399A publication Critical patent/JPH10177399A/ja
Application granted granted Critical
Publication of JP3364827B2 publication Critical patent/JP3364827B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声信号をディジ
タル信号に圧縮符号化する音声符号化復号化方法に関
し、特に通信に適用する際に伝送路誤りによる品質劣化
の少ない音声を再生するための音声符号化方法、音声復
号化方法及び音声符号化復号化方法に関する。
【0002】
【従来の技術】従来、通信用の高能率音声符号化方法と
しては、符号励振線形予測符号化(Code-Excited Linea
r Prediction coding : CELP)、多帯域励振符号化
(Multi-Band Excitation coding :MBE)といった手
法が代表的である。それぞれの技術については、「Code
-excited linear prediction (CELP) :High-qualit
y speech at 8kbps」(M.R.Shroeder and B.S.Atal著、
ICASSP'85, pp.937-940,1985)、及び「A real-time im
plementation of the improved MBE speech coder」
(M.S.Brandstein, P.A.Monta, J.C.Hardwick and J.S.
Lim 著、ICASSP'90,pp.5-8, 1990)に述べられている。
【0003】ここでは、CELP系音声符号化について
説明する。図12は、CELP系音声符号化復号化方法
の全体構成の一例を示すもので、図中1は符号化部、2
は復号化部、3は多重化手段、4は分離手段である。符
号化部1は線形予測パラメータ分析手段8、線形予測パ
ラメータ符号化手段9、合成フィルタ10、適応符号帳
11、雑音符号帳12、ゲイン符号化手段13、距離計
算手段14より構成されている。また、復号化部2は線
形予測パラメータ復号化手段15、合成フィルタ16、
適応符号帳17、雑音符号帳18、ゲイン復号化手段1
9より構成されている。
【0004】CELP系音声符号化では、5〜50ms程度
を1フレームとして、そのフレームの音声をスペクトル
情報と音源情報に分けて符号化する。以下、CELP系
音声符号化復号化方法の動作について説明する。まず符
号化部1において、線形予測パラメータ分析手段8は入
力音声S1を分析し、音声のスペクトル情報である線形
予測パラメータを抽出する。線形予測パラメータ符号化
手段9はその線形予測パラメータを符号化し、符号化し
た線形予測パラメータを合成フィルタ10の係数として
設定する。
【0005】次に音源情報の符号化について説明する。
適応符号帳11には、過去の駆動音源ベクトルが記憶さ
れており、適応符号に対応して過去の駆動音源ベクトル
を周期的に繰り返した時系列ベクトルを出力する。雑音
符号帳12には、例えばランダム雑音から生成した複数
の時系列ベクトルが記憶されており、雑音符号に対応し
た時系列ベクトルを出力する。適応符号帳11、雑音符
号帳12からの各時系列ベクトルはゲイン符号化手段1
3から与えられるそれぞれのゲインに応じて重み付けし
て加算され、その加算結果を駆動音源ベクトルとして合
成フィルタ10へ供給し符号化音声を得る。距離計算手
段14は符号化音声と入力音声S1との距離を求め、距
離が最小となる適応符号、雑音符号、ゲインを探索す
る。この符号化が終了した後、線形予測パラメータの符
号、入力音声と符号化音声との歪みを最小にする適応符
号、雑音符号、ゲインの符号を符号化結果として出力す
る。
【0006】一方復号化部2において、線形予測パラメ
ータ復号化手段15は線形予測パラメータの符号から線
形予測パラメータを復号化し、合成フィルタ16の係数
として設定する。次に、適応符号帳17は、適応符号に
対応して、過去の駆動音源ベクトルを周期的に繰り返し
た時系列ベクトルを出力し、また雑音符号帳18は雑音
符号に対応した時系列ベクトルを出力する。これらの時
系列ベクトルは、ゲイン復号化手段19でゲインの符号
から復号化したそれぞれのゲインに応じて重み付けして
加算され、その加算結果が駆動音源ベクトルとして合成
フィルタ16へ供給され出力音声S3が得られる。
【0007】またCELP系音声符号化復号化方法で再
生音声品質の向上を目的として改良された従来の音声符
号化復号化方法として、特開平6−202699号公報
に開示されたものがある。図12との対応部分に同一符
号を付けた図13は、この従来の音声符号化復号化方法
の構成を示し、図中20、22はピッチ位置抽出手段、
21、23はピッチ同期化手段である。このような構成
による符号化復号化方法の動作を説明する。まず符号化
部1において、ピッチ位置抽出手段20は、適応符号帳
11から出力される周期的に繰り返した時系列ベクトル
から、例えば時系列ベクトルの最大振幅をとる周期的な
点をピッチ位置として抽出する。雑音符号帳12には、
例えばランダム雑音から生成した複数の符号ベクトルが
記憶されており、雑音符号に対応した符号ベクトルを出
力する。
【0008】各符号ベクトルにはピッチ同期位置が設定
されており、ピッチ同期化手段21は、前記ピッチ位置
抽出手段20で抽出されたピッチ位置にピッチ同期位置
が合うように、符号ベクトルを切り出しピッチ周期長に
し、これを周期的に繰り返した時系列ベクトルを生成す
る。この時系列ベクトルを生成する方法は、例えば、
「位相適応型PSI−CELP音声符号化の検討」(間
野、守谷著、電子情報通信学会音声研究会 SP94-96, p
p.37-44, 1995)に示すように、フレーム境界とピッチ
位置のずれ(位相)とピッチ周期長の2つのパラメータ
に応じて符号ベクトルを切り出し、これを周期化するも
のである。図14に位相をφ、ピッチ周期をLとしたと
きのピッチ同期化処理の例を示す。そして、適応符号帳
11、ピッチ同期化手段21からの各時系列ベクトルを
用いて符号化音声が生成され、この符号化音声と入力音
声S1との距離が最小となる適応符号、雑音符号、ゲイ
ンが選択され、符号化される。
【0009】次に復号化部2において、ピッチ位置抽出
手段22は適応符号帳17から出力される周期的に繰り
返した時系列ベクトルから、符号化部1のピッチ位置抽
出手段20と同様の方法でピッチ位置を抽出する。また
雑音符号帳18は雑音符号に対応した符号ベクトルを出
力する。符号ベクトルには、符号化部1の雑音符号帳1
2と同じピッチ同期位置が設定されており、ピッチ同期
化手段23は、そのピッチ位置抽出手段22で抽出され
たピッチ位置にピッチ同期位置が合うように、符号ベク
トルを切り出しピッチ周期長にし、これを周期的に繰り
返した時系列ベクトルを生成する。
【0010】そして、適応符号帳17、ピッチ同期化手
段23からの各時系列ベクトルを用いて出力音声S3を
得る。このように構成することにより、雑音符号帳から
の符号ベクトルをピッチに同期させることで再生音声の
ピッチ周期性を向上し、特に音声の有声部における再生
音声の品質を向上することができ、また符号ベクトルを
周期化する際のピッチ位置は適応符号帳からの時系列ベ
クトルから適応的に求めているので、伝送情報量を増加
させること無く、高品質な再生音声を生成できる。
【0011】ここで実際上移動体通信のような、符号誤
りの発生する応用分野に適用される音声符号化復号化方
法では、誤り訂正符号化技術を用いて符号誤りによる符
号化音声の品質劣化を押さえている。また誤りを訂正し
きれない場合には、波形修復処理を行い、符号誤りの影
響を押さえる工夫がなされている。
【0012】これまでの修復方法としては、次の2種類
がある。すなわち一番目の修復方法は、「Channel codi
ng for digital speech transmission in the Japanese
digital cellular system」( M.J.McLaughlin 著、電
子情報通信学会無線通信システム研究会 RCS90-27, pp.
41-45, 1990 )に示すように、現在のフレームが符号誤
りのあるフレームの場合に、過去のフレームのパラメー
タを繰り返し用いて再生音声を生成する、また再生音声
のパワーを徐々に抑圧していく方法である。
【0013】また2番目の修復方法は、特開平6−12
095号公報に開示されているように、過去のフレー
ム、現在のフレーム及び将来のフレームのそれぞれの符
号誤り検出情報を用い、各フレーム誤り検出状態に応じ
て現在のフレームの音声を再生修復するものである。こ
の場合には、将来のフレームの情報も用いて補間を行う
ので、過去のフレームの情報のみを用いる場合に比較し
て、歪みの小さい補間を行うことができる。
【0014】また波形修復が十分に行えない場合にも、
聴感上の音声品質を維持する伝送誤り補償方法として、
特開平7−36496号公報に開示されたものがある。
これは、伝送誤りの状態により再生音声を出力せず、代
わりに雑音信号を出力するものである。これにより、適
当な波形修復が行えない場合にも、異音となることを避
けることができる。
【0015】
【発明が解決しようとする課題】上述したように改良さ
れた従来の音声符号化復号化方法では、雑音符号に対応
した雑音符号帳内の符号ベクトルを、適応符号帳から出
力される時系列ベクトルより求めるピッチ位置に、符号
ベクトルのピッチ同期位置が合うように切り出しピッチ
周期長にし、これを周期的に繰り返した時系列ベクトル
を生成し、これを用いて駆動音源ベクトルを生成してい
る。ここで雑音符号に伝送誤りが発生した場合には、駆
動音源ベクトルは誤りの影響を受け、この駆動音源ベク
トルから生成される適応符号帳からの時系列ベクトルも
誤りの影響を受けたものになるため、ピッチ位置が正し
く求まらなくなる。
【0016】このため一度雑音符号を誤ると、その後は
正しい雑音符号が伝送されて正しい雑音符号ベクトルを
用いても、ピッチ位置が本来の正しいものとは異なるた
め、ピッチ同期化処理により生成される時系列ベクトル
も正しいものが得られず、駆動音源ベクトルが正しく生
成できなくなる。これがまたピッチ位置が正しく求まら
ない原因となるという悪循環が起こるため、雑音符号の
誤りの影響の時間的波及が大きく、雑音符号を誤った場
合の再生音声の劣化が大きいという問題があった。従来
の誤り訂正符号化技術を用いて符号誤りによる符号化音
声の品質劣化を押さえる場合でも、誤り訂正符号にかか
る伝送情報量を少なくするために、この雑音符号は誤り
訂正対象外とされることが多く、雑音符号の誤りによる
品質劣化はできるだけ小さく抑える必要がある。
【0017】またピッチ同期化処理において雑音符号に
対応した雑音符号帳内の符号ベクトルを切り出しピッチ
周期長にする際、位相とピッチ周期長の2つのパラメー
タを用いている。ここでピッチ位置が誤り、位相が本来
の正しいものと異なる場合、ピッチ周期長の符号ベクト
ルが表す波形が本来の正しいものと異なり、これを周期
的に繰り返した時系列ベクトルの波形も本来の正しいも
のとは大きく異なるため、再生音声の劣化が大きいとい
う問題があった。図15(A)、(B)に符号ベクトル
とピッチ周期長は同じで、ピッチ位置のみが異なる場合
のピッチ同期化処理により生成される時系列ベクトルの
例を示す。
【0018】また従来の符号誤りが発生した場合の波形
修復方法では、過去のフレームのパラメータを繰り返し
て用いているが、まだ再生音声の品質が低いという問題
があった。例えば有声の立ち上がりのフレームではピッ
チ周期性が非定常なため、必ずしも後続の有声定常部に
適したピッチ情報のパラメータが伝送されてはいないこ
とが多く、後続フレームで符号誤りが発生した場合、そ
のピッチ情報のパラメータを繰り返して用いても良好な
再生音声は得られなかった。
【0019】また無声部でも局所的には周期性があるフ
レームがあり、これに後続する無声フレームで符号誤り
が発生した場合、パラメータの繰り返しにより一定周期
の信号が連続するため再生音声がブザー音となり、再生
音声の品質劣化が大きかった。また符号誤りが発生した
フレームで、前フレームのパラメータを繰り返して生成
したスペクトルが不適当であった場合には、再生音声品
質が大きく劣化していた。これは特に、高域に鋭いホル
マントピークがある等、高域のパワーが大きい場合に、
その高域での異音感が顕著となり、聴感上の劣化が大き
かった。
【0020】また将来のフレームの情報も用いて補間を
行う従来の波形修復方法では、修復のために現フレーム
の再生に必要な遅延が大きくなるとういう問題があっ
た。この音声再生に必要な遅延が大きくなると、通信に
適用した場合、自然な対話ができず、通話に支障を来た
すので、遅延はできるだけ小さいことが望ましい。また
従来の符号誤りが発生して波形修復が十分に行えない場
合にも、聴感上の音声品質を維持する伝送誤り補償方法
では、再生音声と雑音信号を切り替えて出力している。
しかし、音声から雑音あるいは雑音から音声への移行に
不連続感が伴うため、これがかえって、聴感上の再生音
声品質の劣化につながるという問題があった。さらに伝
送誤りが発生した場合、常に雑音信号を出力しているた
め、本来は無音である部分でも雑音が出力され、これも
聴感上の劣化につながっていた。
【0021】この発明はかかる課題を解決するためにな
されたものであり、伝送路誤りによる品質劣化の少ない
音声を再生する音声符号化方法、音声復号化方法及び音
声符号化復号化方法を提供するものである。またこの発
明は、符号誤りが発生した場合に、遅延を増大すること
なく現在のフレームの音声を良好に再生修復し、伝送路
誤りによる品質劣化の少ない音声を再生する音声復号化
方法及び音声符号化復号化方法を提供するものである。
さらにまたこの発明は、符号誤りが発生した場合に、再
生音声に雑音を重畳し、聴感上の音声品質を維持する音
声復号化方法及び音声符号化復号化方法を提供するもの
である。
【0022】
【課題を解決するための手段】上述の課題を解決するた
めにこの発明の音声符号化方法は、過去の駆動音源ベク
トルを記憶し、適応符号に対応して過去の駆動音源ベク
トルを周期的に繰り返した第1の時系列ベクトルを出力
する適応符号帳と、予め定められたピッチ同期位置を有
する符号ベクトルを複数記憶し、雑音符号に対応した符
号ベクトルを出力する雑音符号帳を備え、上記雑音符号
を除く上記複数のパラメータの符号の何れかを基に、現
フレームにおいてピッチ周期間隔で並ぶ特徴位置からピ
ッチ位置を抽出し、上記抽出されたピッチ位置に上記各
符号ベクトルのピッチ同期位置が合うように、ピッチ周
期長にした符号ベクトルを周期的に繰り返した第2の時
系列ベクトルを生成し、上記第1の時系列ベクトルと上
記第2の時系列ベクトルを加算して駆動音源ベクトルを
生成し、上記駆動音源ベクトルで合成フィルタを駆動し
て音声信号を再生し、上記再生した音声信号の入力音声
に対する歪を評価して符号を決定する。
【0023】また次の発明の音声復号化方法は、過去の
駆動音源ベクトルを記憶し、適応符号に対応して過去の
駆動音源ベクトルを周期的に繰り返した第1の時系列ベ
クトルを出力する適応符号帳と、予め定められたピッチ
同期位置を有する符号ベクトルを複数記憶し、雑音符号
に対応した符号ベクトルを出力する雑音符号帳を備え、
上記雑音符号を除く上記複数のパラメータの符号の何れ
かを基に、現フレームにおいてピッチ周期間隔で並ぶ特
徴位置からピッチ位置を抽出し、上記抽出されたピッチ
位置に上記各符号ベクトルのピッチ同期位置が合うよう
に、ピッチ周期長にした符号ベクトルを周期的に繰り返
した第2の時系列ベクトルを生成し、上記第1の時系列
ベクトルと上記第2の時系列ベクトルを加算して駆動音
源ベクトルを生成し、上記駆動音源ベクトルで合成フィ
ルタを駆動して出力音声を生成する。
【0024】また次の発明の音声符号化復号化方法は、
符号化側では、過去の駆動音源ベクトルを記憶し、適応
符号に対応して過去の駆動音源ベクトルを周期的に繰り
返した第1の時系列ベクトルを出力する適応符号帳と、
予め定められたピッチ同期位置を有する符号ベクトルを
複数記憶し、雑音符号に対応した符号ベクトルを出力す
る雑音符号帳を備え、上記雑音符号を除く上記複数のパ
ラメータの符号の何れかを基に、現フレームにおいてピ
ッチ周期間隔で並ぶ特徴位置からピッチ位置を抽出し、
上記抽出されたピッチ位置に上記各符号ベクトルのピッ
チ同期位置が合うように、ピッチ周期長にした符号ベク
トルを周期的に繰り返した第2の時系列ベクトルを生成
し、上記第1の時系列ベクトルと上記第2の時系列ベク
トルを加算して駆動音源ベクトルを生成し、上記駆動音
源ベクトルで合成フィルタを駆動して音声信号を再生
し、上記再生した音声信号の入力音声に対する歪を評価
して符号を決定し、復号化側では、過去の駆動音源ベク
トルを記憶し、適応符号に対応して過去の駆動音源ベク
トルを周期的に繰り返した第1の時系列ベクトルを出力
する適応符号帳と、予め定められたピッチ同期位置を有
する符号ベクトルを複数記憶し、雑音符号に対応した符
号ベクトルを出力する雑音符号帳を備え、上記雑音符号
を除く上記複数のパラメータの符号の何れかを基に、現
フレームにおいてピッチ周期間隔で並ぶ特徴位置からピ
ッチ位置を抽出し、上記抽出されたピッチ位置に上記各
符号ベクトルのピッチ同期位置が合うように、ピッチ周
期長にした符号ベクトルを周期的に繰り返した第2の時
系列ベクトルを生成し、上記第1の時系列ベクトルと上
記第2の時系列ベクトルをそれぞれ重み付けして加算し
て駆動音源ベクトルを生成し、上記駆動音源ベクトルで
合成フィルタを駆動して出力音声を生成する。
【0025】また次の発明の音声符号化方法は、過去の
駆動音源ベクトルを記憶し、適応符号に対応して過去の
駆動音源ベクトルを周期的に繰り返した第1の時系列ベ
クトルを出力する適応符号帳と、予め定められたピッチ
同期位置と、予めピッチ周期に対応して定められた切り
出し位置を有する符号ベクトルを複数記憶し、雑音符号
に対応した符号ベクトルを出力する雑音符号帳を備え、
現フレームにおいてピッチ周期間隔で並ぶ特徴位置から
ピッチ位置を抽出し、上記各符号ベクトルをピッチ周期
に対応した切り出し位置で切り出し、この切り出した符
号ベクトルのピッチ同期位置が上記抽出されたピッチ位
置に合うように周期的に繰り返した第2の時系列ベクト
ルを生成し、上記第1の時系列ベクトルと上記第2の時
系列ベクトルをそれぞれ重み付けして加算して駆動音源
ベクトルを生成し、上記駆動音源ベクトルで合成フィル
タを駆動して音声信号を再生し、上記再生した音声信号
の入力音声に対する歪を評価して符号を決定する。
【0026】さらに次の発明の音声符号化方法は、フレ
ームはピッチ周期の整数倍長であるようにした。
【0027】さらに次の発明の音声符号化方法は、フレ
ームの規準となる固定長を定め、ピッチ周期の整数倍長
はその固定長に最も近いものとするようにした。
【0028】さらに次の発明の音声符号化方法は、フレ
ームの規準となる固定長を定め、ピッチ周期の整数倍長
の平均は常にその固定長以上とするようにした。
【0029】さらに次の発明の音声符号化方法は、フレ
ームの規準となる固定点を定め、ピッチ周期の整数倍長
はフレーム境界がその固定点に最も近いものとするよう
にした。
【0030】また次の発明の音声復号化方法は、過去の
駆動音源ベクトルを記憶し、適応符号に対応して過去の
駆動音源ベクトルを周期的に繰り返した第1の時系列ベ
クトルを出力する適応符号帳と、予め定められたピッチ
同期位置と、予めピッチ周期に対応して定められた切り
出し位置を有する符号ベクトルを複数記憶し、雑音符号
に対応した符号ベクトルを出力する雑音符号帳を備え、
現フレームにおいてピッチ周期間隔で並ぶ特徴位置から
ピッチ位置を抽出し上記各符号ベクトルをピッチ周期に
対応した切り出し位置で切り出し、この切り出した符号
ベクトルのピッチ同期位置が上記抽出されたピッチ位置
に合うように周期的に繰り返した第2の時系列ベクトル
を生成し、上記第1の時系列ベクトルと上記第2の時系
列ベクトルをそれぞれ重み付けして加算して駆動音源ベ
クトルを生成し、上記駆動音源ベクトルで合成フィルタ
を駆動して出力音声を生成する。
【0031】さらに次の発明の音声復号化方法は、フレ
ームはピッチ周期の整数倍長であるようにした。
【0032】さらに次の発明の音声復号化方法は、フレ
ームの規準となる固定長を定め、ピッチ周期の整数倍長
はその固定長に最も近いものとするようにした。
【0033】さらに次の発明の音声復号化方法は、フレ
ームの規準となる固定長を定め、ピッチ周期の整数倍長
の平均は常にその固定長以上とするようにした。
【0034】さらに次の発明の音声復号化方法は、フレ
ームの規準となる固定点を定め、ピッチ周期の整数倍長
はフレーム境界がその固定点に最も近いものとするよう
にした。
【0035】また次の発明の音声符号化復号化方法は、
符号化側では、過去の駆動音源ベクトルを記憶し、適応
符号に対応して過去の駆動音源ベクトルを周期的に繰り
返した第1の時系列ベクトルを出力する適応符号帳と、
予め定められたピッチ同期位置と、予めピッチ周期に対
応して定められた切り出し位置を有する符号ベクトルを
複数記憶し、雑音符号に対応した符号ベクトルを出力す
る雑音符号帳を備え、現フレームにおいてピッチ周期間
隔で並ぶ特徴位置からピッチ位置を抽出し、上記各符号
ベクトルをピッチ周期に対応した切り出し位置で切り出
し、この切り出した符号ベクトルのピッチ同期位置が上
記抽出されたピッチ位置に合うように周期的に繰り返し
た第2の時系列ベクトルを生成し、上記第1の時系列ベ
クトルと上記第2の時系列ベクトルをそれぞれ重み付け
して加算して駆動音源ベクトルを生成し、上記駆動音源
ベクトルで合成フィルタを駆動して音声信号を再生し、
上記再生した音声信号の入力音声に対する歪を評価して
符号を決定し、復号化側では、過去の駆動音源ベクトル
を記憶し、適応符号に対応して過去の駆動音源ベクトル
を周期的に繰り返した第1の時系列ベクトルを出力する
適応符号帳と、予め定められたピッチ同期位置と、予め
ピッチ周期に対応して定められた切り出し位置を有する
符号ベクトルを複数記憶し、雑音符号に対応した符号ベ
クトルを出力する雑音符号帳を備え、現フレームにおい
てピッチ周期間隔で並ぶ特徴位置からピッチ位置を抽出
し、上記各符号ベクトルをピッチ周期に対応した切り出
し位置で切り出し、この切り出した符号ベクトルのピッ
チ同期位置が上記抽出されたピッチ位置に合うように周
期的に繰り返した第2の時系列ベクトルを生成し、上記
第1の時系列ベクトルと上記第2の時系列ベクトルをそ
れぞれ重み付けして加算して駆動音源ベクトルを生成
し、上記駆動音源ベクトルで合成フィルタを駆動して出
力音声を生成する
【0036】また次の発明の音声符号化装置は、過去の
駆動音源ベクトルを記憶し、適応符号に対応して過去の
駆動音源ベクトルを周期的に繰り返した第1の時系列ベ
クトルを出力する適応符号帳と、予め定められたピッチ
同期位置を有する符号ベクトルを複数記憶し、雑音符号
に対応した符号ベクトルを出力する雑音符号帳と、上記
雑音符号を除く上記複数のパラメータの符号の何れかを
基に、現フレームにおいてピッチ周期間隔で並ぶ特徴位
置からピッチ位置を抽出するピッチ位置抽出手段と、上
記抽出されたピッチ位置に上記各符号ベクトルのピッチ
同期位置が合うように、ピッチ周期長にした符号ベクト
ルを周期的に繰り返した第2の時系列ベクトルを生成す
るピッチ同期化手段と、上記第1の時系列ベクトルと上
記第2の時系列ベクトルを加算して駆動音源ベクトルを
生成する加算手段と、上記駆動音源ベクトルで音声信号
を再生する合成フィルタと、上記再生した音声信号の入
力音声に対する歪を評価して符号を決定する距離算出手
段とを備える。
【0037】また次の発明の音声復号化装置は、過去の
駆動音源ベクトルを記憶し、適応符号に対応して過去の
駆動音源ベクトルを周期的に繰り返した第1の時系列ベ
クトルを出力する適応符号帳と、予め定められたピッチ
同期位置を有する符号ベクトルを複数記憶し、雑音符号
に対応した符号ベクトルを出力する雑音符号帳と、上記
雑音符号を除く上記複数のパラメータの符号の何れかを
基に、現フレームにおいてピッチ周期間隔で並ぶ特徴位
置からピッチ位置を抽出するピッチ位置抽出手段と、上
記抽出されたピッチ位置に上記各符号ベクトルのピッチ
同期位置が合うように、ピッチ周期長にした符号ベクト
ルを周期的に繰り返した第2の時系列ベクトルを生成す
るピッチ同期化手段と、上記第1の時系列ベクトルと上
記第2の時系列ベクトルを加算して駆動音源ベクトルを
生成する加算手段と、上記駆動音源ベクトルで出力音声
を生成する合成フィルタとを備える。
【0038】また次の発明の音声符号化装置は、過去の
駆動音源ベクトルを記憶し、適応符号に対応して過去の
駆動音源ベクトルを周期的に繰り返した第1の時系列ベ
クトルを出力する適応符号帳と、予め定められたピッチ
同期位置と、予めピッチ周期に対応して定められた切り
出し位置を有する符号ベクトルを複数記憶し、雑音符号
に対応した符号ベクトルを出力する雑音符号帳と、現フ
レームにおいてピッチ周期間隔で並ぶ特徴位置からピッ
チ位置を抽出するピッチ位置抽出手段と、上記各符号ベ
クトルをピッチ周期に対応した切り出し位置で切り出
し、この切り出した符号ベクトルのピッチ同期位置が上
記抽出されたピッチ位置に合うように周期的に繰り返し
た第2の時系列ベクトルを生成するピッチ同期化手段
と、上記第1の時系列ベクトルと上記第2の時系列ベク
トルを加算して駆動音源ベクトルを生成する加算手段
と、上記駆動音源ベクトルで音声信号を再生する合成フ
ィルタと、上記再生した音声信号の入力音声に対する歪
を評価して符号を決定する距離算出手段とを備える。
【0039】また次の発明の音声復号化装置は、過去の
駆動音源ベクトルを記憶し、適応符号に対応して過去の
駆動音源ベクトルを周期的に繰り返した第1の時系列ベ
クトルを出力する適応符号帳と、予め定められたピッチ
同期位置と、予めピッチ周期に対応して定められた切り
出し位置を有する符号ベクトルを複数記憶し、雑音符号
に対応した符号ベクトルを出力する雑音符号帳と、現フ
レームにおいてピッチ周期間隔で並ぶ特徴位置からピッ
チ位置を抽出するピッチ位置抽出手段と、上記各符号ベ
クトルをピッチ周期に対応した切り出し位置で切り出
し、この切り出した符号ベクトルのピッチ同期位置が上
記抽出されたピッチ位置に合うように周期的に繰り返し
た第2の時系列ベクトルを生成するピッチ同期化手段
と、上記第1の時系列ベクトルと上記第2の時系列ベク
トルをそれぞれ重み付けして加算して駆動音源ベクトル
を生成する加算手段と、上記駆動音源ベクトルで出力音
声を生成する合成フィルタとを備える。
【0040】
【0041】
【0042】
【0043】
【0044】
【発明の実施の形態】以下図面を参照しながら、この発
明の実施の形態について説明する。
【0045】実施の形態1.図13との対応部分に同一
符号を付けて示す図1は、この発明による音声符号化方
法及び音声復号化方法の実施の形態1の全体構成を示
し、図中符号化部1において24は適応符号帳11と切
り替えて用いる固定符号帳、25は固定符号帳24と合
わせて用いる第2の雑音符号帳、26はピッチ位置抽出
手段である。また図中復号化部2において27は適応符
号帳17と切り替えて用いる固定符号帳、28は固定符
号帳27と合わせて用いる第2の雑音符号帳、29はピ
ッチ位置抽出手段である。
【0046】以下、動作を説明する。まず、符号化部1
において、線形予測パラメータ分析手段8は入力音声S
1を分析し、音声のスペクトル情報である線形予測パラ
メータを抽出する。線形予測パラメータ符号化手段9は
その線形予測パラメータを符号化し、符号化した線形予
測パラメータを合成フィルタ10の係数として設定す
る。ここで、音源情報の符号化について説明する。音源
情報を符号化して駆動音源ベクトルを生成するには、適
応符号帳11と雑音符号帳12とを用いる場合と、固定
符号帳24と第2の雑音符号帳25とを用いる場合の2
通りの方法をとり、例えば符号化音声の入力音声との距
離がより小さくなる駆動音源ベクトルを生成する方法を
選択するとして、これら2通りの方法を切り替えて用い
る。ここでは、まず固定符号帳24と第2の雑音符号帳
25とを用いる場合について説明し、次に適応符号帳1
1と雑音符号帳12とを用いる場合について説明する。
【0047】固定符号帳24には、例えばランダム雑音
から生成した複数の時系列ベクトルが記憶されており、
適応符号に対応した時系列ベクトルを出力する。第2の
雑音符号帳25には、例えばランダム雑音から生成した
複数の時系列ベクトルが記憶されており、雑音符号に対
応した時系列ベクトルを出力する。固定符号帳24、第
2の雑音符号帳25からの各時系列ベクトルはゲイン符
号化部13から与えられるそれぞれのゲインに応じて重
み付けして加算され、その加算結果を駆動音源ベクトル
として合成フィルタ10へ供給され符号化音声を得る。
距離計算手段14は符号化音声と入力音声S1との距離
を求め、距離が最小となる適応符号、雑音符号、ゲイン
を探索する。
【0048】次に、適応符号帳11と雑音符号帳12と
を用いる場合について説明する。適応符号帳11には、
過去の駆動音源ベクトルが記憶されており、適応符号に
対応して過去の駆動音源ベクトルを周期的に繰り返した
時系列ベクトルを出力する。ピッチ位置抽出手段26
は、前フレームにおいて固定符号帳が選択されている場
合は、前フレームにおいて固定符号帳24から出力され
た時系列ベクトルから、例えば時系列ベクトルの終端部
分で、現フレームで探索する適応符号に対応した周期長
の範囲において最大振幅をとる点を基準として、適応符
号に対応した周期で得られる点をピッチ位置として抽出
する。
【0049】また、前フレームにおいて適応符号帳が選
択されている場合は、前フレームで求めたピッチ位置を
基準として、現フレームで探索する適応符号に対応した
周期で繰り返した点をピッチ位置として抽出する。図2
にこの実施の形態1において現フレームで探索する適応
符号に対応した周期をLとしたときのピッチ位置抽出処
理の例を示す。図2(A)は、前フレームにおいて固定
符号帳が選択されている場合、図2(B)は前フレーム
において適応符号帳が選択されている場合の例である。
【0050】雑音符号帳12には、例えばランダム雑音
から生成した複数の符号ベクトルが記憶されており、雑
音符号に対応した符号ベクトルを出力する。各符号ベク
トルにはピッチ同期位置が設定されており、ピッチ同期
化手段21は、前記ピッチ位置抽出手段26で抽出され
たピッチ位置にピッチ同期位置が合うように、符号ベク
トルを切り出しピッチ周期長にし、これを周期的に繰り
返した時系列ベクトルを生成する。適応符号帳11、ピ
ッチ同期化手段21からの各時系列ベクトルは、ゲイン
符号化部13から与えられるそれぞれのゲインに応じて
重み付けして加算され、その加算結果を駆動音源ベクト
ルとして合成フィルタ10へ供給され符号化音声を得
る。距離計算手段14は符号化音声と入力音声S1との
距離を求め、距離が最小となる適応符号、雑音符号、ゲ
インを探索する。
【0051】そして適応符号帳11と雑音符号帳12と
を用いる場合と、固定符号帳24と第2の雑音符号帳2
5とを用いる場合とで、それぞれで選択された適応符
号、雑音符号、ゲインを用いて生成される符号化音声と
入力音声S1との距離を比較し、距離が小さくなる方の
適応符号、雑音符号、ゲインが選択される。以上符号化
が終了した後、線形予測パラメータの符号、入力音声と
符号化音声との歪みを最小にする適応符号、雑音符号、
ゲインの符号を符号化結果S2として出力する。以上が
この実施の形態1の音声符号化方法に特徴的な動作であ
る。
【0052】次に復号化部2について説明する。復号化
部2では、線形予測パラメータ復号化手段15は線形予
測パラメータの符号から線形予測パラメータを復号化
し、合成フィルタ16の係数として設定する。ここで音
源情報の復号化について説明する。音源情報を復号化し
て駆動音源ベクトルを生成するには、適応符号帳17と
雑音符号帳18とを用いる場合と、固定符号帳27と第
2の雑音符号帳28とを用いる場合の2通りの方法をと
り、適応符号、雑音符号に対応して、符号化する際に用
いられた方法を選択するとして、これら2通りの方法を
切り替えて用いる。
【0053】ここでは、まず固定符号帳27と第2の雑
音符号帳28とを用いる場合について説明し、次に適応
符号帳17と雑音符号帳18とを用いる場合について説
明する。固定符号帳27と第2の雑音符号帳28とを用
いる場合、固定符号帳27は適応符号に対応した時系列
ベクトルを出力し、また、第2の雑音符号帳28は雑音
符号に対応した時系列ベクトルを出力する。次に、適応
符号帳17と雑音符号帳18とを用いる場合について説
明する。適応符号帳17は、適応符号に対応して、過去
の駆動音源ベクトルを周期的に繰り返した時系列ベクト
ルを出力する。ピッチ位置抽出手段29は、前フレーム
で固定符号帳が選択されている場合は、前フレームにお
いて固定符号帳27から出力された時系列ベクトルか
ら、また、前フレームにおいて適応符号帳が選択されて
いる場合は、前フレームで求めたピッチ位置から、符号
化部1のピッチ位置抽出手段26と同様の方法でピッチ
位置を抽出する。
【0054】また、雑音符号帳18は雑音符号に対応し
た符号ベクトルを出力する。符号ベクトルにはピッチ同
期位置が設定されており、ピッチ同期化手段23は、前
記ピッチ位置抽出手段29で抽出されたピッチ位置にピ
ッチ同期位置が合うように、符号ベクトルを切り出しピ
ッチ周期長にし、これを周期的に繰り返した時系列ベク
トルを生成する。固定符号帳27と第2の雑音符号帳2
8からの時系列ベクトル、あるいは適応符号帳17とピ
ッチ同期化手段23からの時系列ベクトルは、ゲイン復
号化手段19でゲインの符号から復号化したそれぞれの
ゲインに応じて重み付けして加算され、その加算結果を
駆動音源ベクトルとして合成フィルタ16へ供給され出
力音声S3が得られる。以上がこの実施の形態1の音声
復号化方法に特徴的な動作である。
【0055】この実施の形態1によれば、雑音符号ベク
トルをピッチ同期化する際のピッチ位置を適応符号のみ
にかかわる情報から求め、雑音符号にかかわる情報には
一切無関係に決定することにより、雑音符号に伝送誤り
が発生しても、適応符号が正しく伝送されていればピッ
チ位置は誤りの影響を受けないので、雑音符号の誤りの
影響の時間的波及が小さく、再生音声の劣化を回避し、
伝送誤りによる品質劣化の少ない音声を再生することが
できる。
【0056】実施の形態2.この発明による音声符号化
方法及び音声復号化方法の実施の形態2におけるピッチ
同期化処理を説明する。雑音符号帳内の各符号ベクトル
には、ピッチ周期に対応して符号ベクトルを切り出す位
置が設定されており、この位置より符号ベクトルを切り
出しピッチ周期長にする。そして、これをピッチ位置に
ピッチ同期位置が合うように周期的に繰り返した時系列
ベクトルを生成する。図3にこの実施の形態2における
ピッチ同期化処理により生成される時系列ベクトルの例
を示す。図中ピッチ周期がLの場合、符号ベクトルを切
り出す位置はピッチ同期位置からφ(L)前とし、φ
(L)は例えばL/2とするなどピッチ周期のみから決
定する。図3(A)、(B)は符号ベクトルとピッチ周
期長は同じで、ピッチ位置のみが異なるもので、ピッチ
周期長の符号ベクトルが表す波形は(A)、(B)とも
同一であり、これを周期的に繰り返した時系列ベクトル
も同一の波形を時間的にシフトしたものになる。
【0057】この実施の形態2によれば、ピッチ同期化
処理において雑音符号に対応した雑音符号帳内の符号ベ
クトルを切り出しピッチ周期長にする際、ピッチ周期長
のみをパラメータとして用い、ピッチ位置には一切無関
係に決定するので、ピッチ位置が誤っている場合でもピ
ッチ周期長の符号ベクトルが表す波形は本来の正しいも
のと同一であり、これを周期的に繰り返した時系列ベク
トルの波形は本来の正しいものを時間的にシフトしたも
のになるので、ピッチ位置の誤りによる聴感上の劣化は
小さく、再生音声の劣化を回避し、伝送誤りによる品質
劣化の少ない音声を再生することができる。
【0058】実施の形態3.上述の実施の形態2では、
雑音符号帳内の符号ベクトルを切り出す位置はピッチ同
期位置からφ(L)前とし、φ(L)は例えばL/2と
するなどピッチ周期によらず同一の関数を用いて決定し
ていたが、これに代え、ピッチ周期毎に符号ベクトルを
切り出す位置を決定する関数を変更しても良い。また雑
音符号帳内の符号ベクトル毎に、ピッチ周期毎に符号ベ
クトルを切り出す位置を決定する関数を変更しても良
い。この実施の形態3によれば、符号ベクトルを切り出
す位置を、ピッチ周期毎あるいは符号ベクトル毎に自由
に設定できるので、この設定を再生音声の品質が良くな
るように学習、獲得することにより、伝送誤りがない場
合であっても合成音声の品質を向上することができる。
【0059】実施の形態4.上述の実施の形態2、3で
は、ピッチ周期によらず同一の雑音符号帳内の符号ベク
トルを用いているが、これに代え、雑音符号帳を複数個
備え、ピッチ周期に応じて用いる雑音符号帳を切り替え
るとしても良い。この実施の形態4によれば、ピッチ周
期に応じて異なる雑音符号帳を用いることができるの
で、従来1つの雑音符号帳を用いていた場合と比較して
生成できる時系列ベクトルの自由度が増し、伝送誤りが
ない場合であっても合成音声の品質を向上することがで
きる。
【0060】実施の形態5.上述の実施の形態4でさら
に、全てのピッチ周期長毎に異なる雑音符号帳を備え、
各ピッチ周期長に対応した雑音符号帳はそのピッチ周期
長の符号ベクトルから構成されるとしても良い。この実
施の形態5によれば、各ピッチ周期に対応する雑音符号
帳内の符号ベクトルは既にピッチ周期長であるので、ピ
ッチ同期化処理において符号ベクトルを切り出し、ピッ
チ周期長にする処理を省くことができる。
【0061】実施の形態6.上述の実施の形態2では、
駆動音源ベクトルを生成する単位であるフレームを固定
長としているが、これに代え、フレームをピッチ周期長
に応じて可変長とし、フレームがピッチ周期の整数倍長
となるようにしても良い。図4はこの実施の形態6にお
けるフレームをピッチの整数倍長とした場合の雑音符号
ベクトルのピッチ同期化処理により生成される時系列ベ
クトルの例を示す。図4(A)、(B)は符号ベクトル
とピッチ周期長は同じで、ピッチ位置のみが異なるもの
で、生成される時系列ベクトルは同一の波形であり、ピ
ッチ位置の差異はフレームの境界が時間的にずれること
に現れる。
【0062】この実施の形態6によれば、駆動音源ベク
トルを生成する単位であるフレームをピッチ周期長に応
じて可変長とし、フレームがピッチ周期の整数倍長とな
るようにしたので、従来ピッチ位置が誤っている場合は
そのフレーム境界部分で雑音符号帳から生成される時系
列ベクトルの波形が本来の正しいものと異なっていたと
いう問題を解消でき、生成される雑音符号帳からの時系
列ベクトルは本来の正しいものと全く同一の波形にな
り、ピッチ位置の誤りの影響はフレームが時間的にシフ
トするだけになるので、ピッチ位置の誤りによる聴感上
の劣化は小さく、再生音声の劣化を回避し、伝送誤りに
よる品質劣化の少ない音声を再生することができる。
【0063】実施の形態7.上述の実施の形態6でさら
に、ある固定長をフレームの規準として定め、ピッチ周
期の整数倍長である可変長のフレームは固定長に最も近
いものとなるように整数倍とする値を決定するとしても
良い。図5にフレーム周期の規準となる固定長をN、ピ
ッチ周期をLとしたときのフレームの例を示す。この実
施の形態7によれば、符号化を行う単位であるフレーム
長がある程度一定の値に保たれるので、単位時間におけ
る符号化情報量(ビットレート)を安定にでき、同一の
時間長の音声であれば、ピッチ周期長によらずほぼ同一
の情報量で符号化することができる。
【0064】実施の形態8.上述の実施の形態6でさら
に、ある固定長をフレームの規準として定め、ピッチ周
期の整数倍長である可変長のフレームの平均は常に固定
長以上となるように整数倍とする値を決定するとしても
良い。図6にフレーム周期の規準となる固定長をN、ピ
ッチ周期をLとしたときのフレームの例を示す。この実
施の形態8によれば、あるフレーム数の可変長のフレー
ムで符復号化される音声の時間長が、必ず同フレーム数
の固定長のフレームで符復号化される音声の時間長以上
になるので、通信に適用する際復号化側の遅延を小さく
することができる。また符号化を行う単位であるフレー
ムの周期の平均が常にある一定の値以上に保たれるの
で、単位時間における符号化情報量(ビットレート)の
最大値を規定でき、同一の時間長の音声であれば、ピッ
チ周期長によらず規定されるビットレートの最大値によ
って決まる情報量以下で符号化することができる。
【0065】実施の形態9.上述の実施の形態6でさら
に、ピッチ周期の整数倍長である可変長のフレームは、
ある固定点をフレーム周期の規準として定め、フレーム
の境界が固定点に最も近いものとなるように整数倍とす
る値を決定するとしても良い。図7にフレーム周期の規
準となる固定点を周期N毎の点とし、ピッチ周期をLと
したときのフレームの例を示す。この実施の形態8によ
れば、符号化を行う単位であるフレームの周期がある程
度一定の値に保たれるので、単位時間における符号化情
報量(ビットレート)を安定にでき、同一の時間長の音
声であれば、ピッチ周期長によらずほぼ同一の情報量で
符号化することができる。
【0066】実施の形態10.上述の実施の形態6〜9
では、符号化、復号化するフレームがどの時点の入力音
声を符号化したものであるかという時間情報は一切伝送
されていないため、復号化側においては復号するフレー
ムが入力音声のどの時点に対するものであるかは復号化
を開始した時点から該フレームまでの可変であるフレー
ム長の積算によってのみ求めることができる。このた
め、一度でも伝送誤りによりフレーム長を誤って復号し
た場合にはそれ以降復号化側で生成される再生音声は入
力音声と時間的にずれが生じ、このずれを解消すること
ができないという問題があった。そこで、時間情報を一
切伝送しないことに代え、少なくとも間欠的に、例えば
該フレームを符号化する時点の符号化開始時点からの時
間差を伝送するなど、時間情報を伝送するようにしても
良い。
【0067】この実施の形態10によれば、少なくとも
間欠的に時間情報が伝送されるので、伝送誤りによりフ
レーム長を誤って復号して復号側で生成される再生音声
が入力音声と時間的にずれが生じた場合でも、伝送され
る時間情報を用いることによりその時間的なずれを補償
し、解消することができるので、伝送誤りによる品質劣
化の少ない音声を再生することができる。
【0068】実施の形態11.図1との対応部分に同一
符号を付けた図8は、この発明による音声復号化方法の
実施の形態11の構成を示し、図中30は符号の伝送誤
りが検出された場合に線形予測パラメータを修復する線
形予測パラメータ修復手段、31は再生音声を分析して
前フレームが有声の立ち上がりか否かを判定する立ち上
がり判定手段、32は再生音声を分析しピッチを求める
ピッチ抽出手段、33は符号の伝送誤りが検出された場
合に適応符号を修復する適応符号修復手段である。また
34は再生音声を分析して前フレームが無声か否かを判
定する無声判定手段、35は符号の伝送誤りが検出され
た場合にゲインを修復するゲイン修復手段、36は符号
の伝送誤り検出状況に応じて再生音声のパワーを制御す
る再生音声パワー制御手段である。さらに37は符号の
伝送誤りが検出された場合に現フレームの音声の状態を
推定する音声状態推定手段、38は雑音信号を生成する
雑音生成手段、39は符号の伝送誤り検出状況に応じて
雑音信号のパワーを制御する雑音パワー制御手段であ
る。
【0069】復号化部2において、線形予測パラメータ
復号化手段15は線形予測パラメータの符号から線形予
測パラメータを復号化する。線形予測パラメータ修復手
段30は、符号の伝送誤りが検出されていないフレーム
では復号化された線形予測パラメータを、伝送誤りが検
出されたフレームでは前フレームで復号化された線形予
測パラメータから、低域のホルマント構造を保ち、高域
のホルマントピークを抑制したスペクトルとなるような
線形予測パラメータを、例えば線形予測パラメータを線
スペクトル対パラメータとして表したときに、その低域
のパラメータのみを用いるとして求め、合成フィルタ1
6の係数として設定する。図9に前フレームの線形予測
パラメータが表すスペクトル包絡と、線形予測パラメー
タ修復処理によりその低域の構造を保ち高域を抑制した
スペクトル包絡の例を示す。
【0070】立ち上がり判定手段31は符号の伝送誤り
が検出されたフレームで、前フレームの再生音声を分析
して、前フレームが有声の立ち上がりであるか否かを判
定し、判定結果をピッチ分析手段32、適応符号修復手
段33に出力する。ここで、有声立ち上がりか否かの判
定は、例えば前フレームにおいて、フレーム後半部の音
声のパワーがフレーム前半部のそれと比較してある閾値
以上大きい場合には有声の立ち上がりとする。ピッチ抽
出手段32は、符号の伝送誤りが検出されたフレーム
で、前フレームが有声立ち上がりと判定された場合に、
過去の再生音声を分析して少なくとも1つ以上のピッチ
周期の候補を抽出し、適応符号修復手段33に出力す
る。
【0071】適応符号修復手段33は、符号の伝送誤り
が検出されていないフレームでは、分離手段4から入力
される適応符号を、符号誤りが検出されても前フレーム
が有声立ち上がりではない場合には、前フレームの適応
符号を、符号誤りが検出され、かつ前フレームが有声立
ち上がりの場合には、前記ピッチ抽出手段32から入力
されたピッチ周期の候補の中から、例えば過去に正しく
伝送された適応符号の出現頻度分布と比較し、出現頻度
の高い符号に対応するピッチ周期に最も近いものを選択
し、この選択されたピッチ周期に対応する適応符号を適
応符号帳17に出力する。適応符号帳17は適応符号に
対応して、過去の駆動音源ベクトルを周期的に繰り返し
た時系列ベクトルを出力する。図10(A)にこの実施
の形態11における適応符号修復処理の例を、また図1
0(B)に従来の前フレームの適応符号を繰り返して用
いる修復処理の例を示す。図に示すように、前フレーム
の適応符号に対応するピッチ周期が現フレームに不適な
場合でも、過去のフレームの情報より現フレームに適し
たピッチ周期を求めることにより、良好な波形修復処理
が可能であることが分かる。
【0072】雑音符号帳18は雑音符号に対応した時系
列ベクトルを出力する。ゲイン復号化手段19はゲイン
の符号から、前記適応符号帳17及び雑音符号帳18よ
り出力された時系列ベクトルに対するゲインを復号化す
る。無声判定手段34は、符号の伝送誤りが検出された
フレームで、前フレームの再生音声を分析して、前フレ
ームが無声であるか否かを判定し、判定結果をゲイン修
復手段35に出力する。ゲイン修復手段35は、符号の
伝送誤りが検出されていないフレームでは、ゲイン復号
化手段19から入力されたゲインを、符号誤りが検出さ
れ、かつ、前フレームが無声でない場合は前フレームの
ゲインを、符号誤りが検出され、かつ、前フレームが無
声の場合は、前フレームのゲインに対し、適応符号帳か
らの時系列ベクトルに対するゲインをα倍、雑音符号帳
からの時系列ベクトルに対するゲインをβ倍して出力す
る。ここでα、βは、例えば、0≦α<β≦1とする。
【0073】適応符号帳17、雑音符号帳18からの各
時系列ベクトルは、ゲイン修復手段35から出力された
それぞれのゲインに応じて重み付けして加算され、その
加算結果を駆動音源ベクトルとして合成フィルタ16へ
供給され再生音声が得られる。再生音声パワー制御手段
36は、符号の伝送誤り検出状況に応じて、例えば誤り
が連続するに従い徐々に抑圧量を強めるとして、再生音
声のパワーを抑圧する。音声状態推定手段37は、符号
の伝送誤りが検出された場合に、過去の再生音声及び現
フレームの線形予測パラメータの符号から現フレームの
有音/無音を判定し、その判定結果を雑音生成手段38
に出力する。
【0074】雑音生成手段38は、符号の伝送誤り検出
状況及び音声状態判定手段37から入力された有音/無
音判定結果に応じて、例えば誤りが検出され、かつ、有
音と推定されたフレームで雑音を生成する。雑音パワー
制御手段39は、例えば雑音の重畳始めは徐々にパワー
を増大し、重畳終わりには徐々にパワーを減少させると
して、雑音のパワーを制御する。図11に再生音声及び
雑音信号のパワー制御処理の例を示す。再生音声パワー
制御手段36から出力された再生音声と雑音パワー制御
手段39から出力された雑音は加算され、出力音声S3
が得られる。
【0075】この実施の形態11によれば、符号が正し
く復号できなかったことを検出した場合に、前のフレー
ムの再生音声の状態を判定し、この判定に応じて現在の
フレームの音声を再生修復することにより、遅延を増大
することなく、伝送路誤りによる品質劣化の少ない音声
を再生することができる。また、符号誤りが発生した場
合に、再生する音声の状態に応じて、再生音声に雑音を
重畳することにより、聴感上の音声品質を維持すること
ができる。
【0076】実施の形態12.上述の実施の形態11で
は、線形予測パラメータ修復手段30において、伝送誤
りが発生した際は常に前フレームの線形予測パラメータ
から高域のホルマントピークを抑制したスペクトルとな
るような線形予測パラメータを求め、合成フィルタ16
の係数としているが、これに代え、前フレームの線形予
測パラメータが表すスペクトルの高域に鋭いホルマント
ピークがある場合にのみ抑制処理を行い、その他の場合
は、前フレームの線形予測パラメータをそのまま用いる
とするなど、状態に応じて選択的に処理を行っても良
い。
【0077】この実施の形態12によれば、線形予測パ
ラメータの修復処理を行う際に、高域に鋭いホルマント
ピークがあり、聴感上の品質劣化につながる可能性が高
い場合にのみその抑制処理を行い、その他の場合前フレ
ームの線形予測パラメータを繰り返して用いるので、異
音を発生すること無く合成音声の連続性が向上し、聴感
上の音声品質を向上することができる。
【0078】実施の形態13.上述の実施の形態11で
は、伝送誤り検出時前フレームが無声の場合、ゲイン修
復手段35においてゲインを調整することにより駆動音
源ベクトルのピッチ周期性を抑制を実現しているが、こ
れに代え、例えば適応符号帳からの時系列ベクトルを用
いないとするなど、別の手段を用いてピッチ周期性の抑
制を実現しても良い。この実施の形態13によれば、ピ
ッチ周期性の抑制を適応符号帳からの時系列ベクトルを
使用する/使用しないを切り替えるだけで良く、ゲイン
を調整してピッチ周期性を抑制する場合に比較し簡易に
実現できる。
【0079】実施の形態14.上述の実施の形態11で
は、音声状態推定手段37で、過去の再生音声及び現フ
レームの線形予測パラメータの符号から現フレームの有
音/無音を判定しているが、これに代え、適応符号やゲ
インの符号も判定のためのパラメータとして用いても良
い。この実施の形態14によれば、過去の再生音声及び
線形予測パラメータの符号からだけでなく、その他の情
報も用いて有音/無音判定するので、より精度の高い判
定が可能となる。
【0080】実施の形態15.上述の実施の形態11で
は、CELP系音声符号化に伝送誤り時の修復処理、雑
音重畳処理を適用しているが、これに代え、MBE系音
声符号化をはじめ他の音声符号化方式に適用しても、同
様に伝送誤り時の再生音声の聴感上の音声品質を向上す
ることができる。
【0081】
【発明の効果】以上詳述したように、請求項1〜請求項
及び請求項15〜請求項16に記載の発明によれば、
音声符号化方法及び音声復号化方法で、雑音符号ベクト
ルをピッチ同期化するための特徴位置を求める際に用い
る符号に雑音符号を含まないので、雑音符号の符号誤り
の影響の時間的波及を小さくでき、再生音声の劣化を回
避し伝送誤りによる品質劣化の少ない音声を再生するこ
とができる。
【0082】また請求項4、請求項9、請求項14、請
求項17〜請求項18に記載の発明によれば、音声符号
化方法及び音声復号化方法で、雑音符号ベクトルをピッ
チ同期化する際のピッチ周期長にした符号ベクトルはピ
ッチ周期のみから定まるので、雑音符号より生成される
時系列ベクトルのピッチ位置の誤りによる影響を小さく
でき、再生音声の劣化を回避し伝送誤りによる品質劣化
の少ない音声を再生することができる。
【0083】また請求項5、請求項10に記載の発明に
よれば、音声符号化方法及び音声復号化方法で、フレー
ムはピッチ周期の整数倍長であるので、雑音符号より生
成される時系列ベクトルのピッチ位置の誤りによる影響
を小さくでき、再生音声の劣化を回避し伝送誤りによる
品質劣化の少ない音声を再生することができる。
【0084】また請求項6、請求項11に記載の発明に
よれば、音声符号化方法及び音声復号化方法で、フレー
ムの規準となる固定長を定め、ピッチ周期の整数倍長で
ある可変長のフレームはその固定長に最も近いものとし
たので、単位時間における符号化情報量(ビットレー
ト)を安定にすることができる。
【0085】また請求項7、請求項12に記載の発明に
よれば、音声符号化方法及び音声復号化方法で、フレー
ムの規準となる固定長を定め、ピッチ周期の整数倍長で
ある可変長のフレームの平均は常に固定長以上となるよ
うにしたので、通信に適用する際復号化側の遅延を小さ
くすることができ、また単位時間における符号化情報量
(ビットレート)の最大値を規定することができる。
【0086】また請求項8、請求項13に記載の発明に
よれば、音声符号化方法及び音声復号化方法で、フレー
ムの規準となる固定点を定め、フレームの境界がその固
定点に最も近いものとしたので、単位時間における符号
化情報量(ビットレート)を安定にすることができる。
【0087】
【0088】
【0089】
【0090】
【0091】
【図面の簡単な説明】
【図1】 この発明による音声符号化方法及び音声復号
化方法の実施の形態1の全体構成を示すブロック図であ
る。
【図2】 図1の実施の形態1におけるピッチ位置抽出
処理の動作の説明に供する略線図である。
【図3】 この発明による音声符号化方法及び音声復号
化方法の実施の形態2における雑音符号ベクトルのピッ
チ同期化処理の説明に供する略線図である。
【図4】 この発明による音声符号化方法及び音声復号
化方法の実施の形態6における雑音符号ベクトルのピッ
チ同期化処理の説明に供する略線図である。
【図5】 この発明による音声符号化方法及び音声復号
化方法の実施の形態7におけるフレーム決定の説明に供
する略線図である。
【図6】 この発明による音声符号化方法及び音声復号
化方法の実施の形態8におけるフレーム決定の説明に供
する略線図である。
【図7】 この発明による音声符号化方法及び音声復号
化方法の実施の形態9におけるフレーム決定の説明に供
する略線図である。
【図8】 この発明による音声復号化方法の実施の形態
11の構成を示すブロック図である。
【図9】 図8の実施の形態11におけるスペクトル修
復処理の動作の説明に供する略線図である。
【図10】 図8の実施の形態11における適応符号修
復処理の動作の説明に供する信号波形図である。
【図11】 図8の実施の形態11における再生音声及
び雑音信号のパワー制御処理の一例の説明に供する略線
図である。
【図12】 従来のCELP系音声符号化復号化方法の
全体構成を示すブロック図である。
【図13】 従来の改良されたCELP系音声符号化復
号化方法の全体構成を示すブロック図である。
【図14】 図13のCELP系音声符号化復号化方法
における雑音符号ベクトルのピッチ同期化処理の説明に
供する略線図である。
【図15】 図13のCELP系音声符号化復号化方法
における位相を誤った場合の雑音符号ベクトルのピッチ
同期化処理の説明に供する略線図である。
【符号の説明】
1 符号化部 2 復号化部 3 多重化手段 4 分離手段 8 線形予測パラメータ分析手段 9 線形予測パラメータ符号化手段 10、16 合成フィルタ 11、17 適応符号帳 12、18 雑音符号帳 13 ゲイン符号化手段 14 距離計算手段 15 線形予測パラメータ復号化手段 19 ゲイン復号化手段 20、22 ピッチ位置抽出手段 21、23 ピッチ同期化手段 24、27 固定符号帳 25、28 第2の雑音符号帳 26、29 ピッチ位置抽出手段 30 線形予測パラメータ修復手段 31 立ち上がり判定手段 32 ピッチ抽出手段 33 適応符号修復手段 34 無声判定手段 35 ゲイン修復手段 36 再生音声パワー制御手段 37 音声状態推定手段 38 雑音生成手段 39 雑音パワー制御手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−19794(JP,A) 特開 平5−19796(JP,A) 特開 平5−94200(JP,A) 特開 平5−108098(JP,A) 特開 平6−202699(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04

Claims (18)

    (57)【特許請求の範囲】
  1. 【請求項1】 フレーム単位に入力音声を複数のパラメ
    ータの符号に符号化する音声符号化方法であって、過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳を備え、 上記雑音符号を除く上記複数のパラメータの符号の何れ
    かを基に、現フレームにおいてピッチ周期間隔で並ぶ特
    徴位置からピッチ位置を抽出し、 上記抽出されたピッチ位置に上記各符号ベクトルのピッ
    チ同期位置が合うように、ピッチ周期長にした符号ベク
    トルを周期的に繰り返した第2の時系列ベクトルを生成
    し、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成し、 上記駆動音源ベクトルで合成フィルタを駆動して音声信
    号を再生し、 上記再生した音声信号の入力音声に対する歪を評価して
    符号を決定する ことを特徴とする音声符号化方法。
  2. 【請求項2】 フレーム単位に複数のパラメータの符号
    を復号化して出力音声を生成する音声復号化方法であっ
    て、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳を備え、上記雑音符号を除く上記複数のパラメータの符号の何れ
    かを基に、現フレームにおいてピッチ周期間隔で並ぶ特
    徴位置からピッチ位置を抽出し、 上記抽出されたピッチ位置に上記各符号ベクトルのピッ
    チ同期位置が合うように、ピッチ周期長にした符号ベク
    トルを周期的に繰り返した第2の時系列ベクトルを生成
    し、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベ クトルを生成し、 上記駆動音源ベクトルで合成フィルタを駆動して出力音
    声を生成する ことを特徴とする音声復号化方法。
  3. 【請求項3】 フレーム単位に入力音声を複数のパラメ
    ータの符号に符号化する音声符号化復号化方法であっ
    て、 符号化側では、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳を備え、 上記雑音符号を除く上記複数のパラメータの符号の何れ
    かを基に、現フレームにおいてピッチ周期間隔で並ぶ特
    徴位置からピッチ位置を抽出し、 上記抽出されたピッチ位置に上記各符号ベクトルのピッ
    チ同期位置が合うように、ピッチ周期長にした符号ベク
    トルを周期的に繰り返した第2の時系列ベクトルを生成
    し、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成し、 上記駆動音源ベクトルで合成フィルタを駆動して音声信
    号を再生し、 上記再生した音声信号の入力音声に対する歪を評価して
    符号を決定し、 復号化側では、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳を備え、 上記雑音符号を除く上記複数のパラメータの符号の何れ
    かを基に、現フレームにおいてピッチ周期間隔で並ぶ特
    徴位置からピッチ位置を抽出し、 上記抽出されたピッチ位置に上記各符号ベクトルのピッ
    チ同期位置が合うように、ピッチ周期長にした符号ベク
    トルを周期的に繰り返した第2の時系列ベクトルを生成
    し、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成し、上記駆動音源ベクトルで合成フィルタを駆動して出力音
    声を生成する ことを特徴とする音声符号化復号化方法。
  4. 【請求項4】 フレーム単位に入力音声を複数のパラメ
    ータの符号に符号化する音声符号化方法であって、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置と、予めピッチ周期に対
    応して定められた切り出し位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳を備え、 現フレームにおいてピッチ周期間隔で並ぶ特徴位置から
    ピッチ位置を抽出し、 上記各符号ベクトルをピッチ周期に対応した切り出し位
    置で切り出し、この切り出した符号ベクトルのピッチ同
    期位置が上記抽出されたピッチ位置に合うように周期的
    に繰り返した第2の時系列ベクトルを生成し、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成し、上記駆動音源ベクトルで合成フィルタを駆動して音声信
    号を再生し、上記再生した音声信号の入力音声に対する
    歪を評価して符号を決定する ことを特徴とする音声符号
    化方法。
  5. 【請求項5】 上記フレームはピッチ周期の整数倍長で
    あることを特徴とする請求項4に記載の音声符号化方
    法。
  6. 【請求項6】 フレームの規準となる固定長を定め、上
    記ピッチ周期の整数倍長は上記固定長に最も近いものと
    することを特徴とする請求項5に記載の音声符号化方
    法。
  7. 【請求項7】 フレームの規準となる固定長を定め、上
    記ピッチ周期の整数倍長の平均は常に上記固定長以上と
    することを特徴とする請求項5に記載の音声符号化方
    法。
  8. 【請求項8】 フレームの規準となる固定点を定め、上
    記ピッチ周期の整数倍長はフレーム境界が上記固定点に
    最も近いものとすることを特徴とする請求項5に記載の
    音声符号化方法。
  9. 【請求項9】 フレーム単位に複数のパラメータの符号
    を復号化して出力音声を生成する音声復号化方法であっ
    て、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置と、予めピッチ周期に対
    応して定められた切り出し位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳を備え、 現フレームにおいてピッチ周期間隔で並ぶ特徴位置から
    ピッチ位置を抽出し上記各符号ベクトルをピッチ周期に
    対応した切り出し位置で切り出し、この切り出した符号
    ベクトルのピッチ同期位置が上記抽出されたピッチ位置
    に合うように周期的に繰り返した第2の時系列ベクトル
    を生成し、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成し、 上記駆動音源ベクトルで合成フィルタを駆動して出力音
    声を生成す ることを特徴とする音声復号化方法。
  10. 【請求項10】 上記フレームはピッチ周期の整数倍長
    であることを特徴とする請求項9に記載の音声復号化方
    法。
  11. 【請求項11】 フレームの規準となる固定長を定め、
    上記ピッチ周期の整数倍長は上記固定長に最も近いもの
    とすることを特徴とする請求項10に記載の音声復号化
    方法。
  12. 【請求項12】 フレームの規準となる固定長を定め、
    上記ピッチ周期の整数倍長の平均は常に上記固定長以上
    とすることを特徴とする請求項10に記載の音声復号化
    方法。
  13. 【請求項13】 フレームの規準となる固定点を定め、
    上記ピッチ周期の整数倍長はフレーム境界が上記固定点
    に最も近いものとすることを特徴とする請求項10に記
    載の音声復号化方法。
  14. 【請求項14】 フレーム単位に入力音声を複数のパラ
    メータの符号に符号 化する音声符号化復号化方法であっ
    て、 符号化側では、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置と、予めピッチ周期に対
    応して定められた切り出し位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳を備え、 現フレームにおいてピッチ周期間隔で並ぶ特徴位置から
    ピッチ位置を抽出し、 上記各符号ベクトルをピッチ周期に対応した切り出し位
    置で切り出し、この切り出した符号ベクトルのピッチ同
    期位置が上記抽出されたピッチ位置に合うように周期的
    に繰り返した第2の時系列ベクトルを生成し、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成し、 上記駆動音源ベクトルで合成フィルタを駆動して音声信
    号を再生し、 上記再生した音声信号の入力音声に対する歪を評価して
    符号を決定し、 復号化側では、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置と、予めピッチ周期に対
    応して定められた切り出し位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳を備え、 現フレームにおいてピッチ周期間隔で並ぶ特徴位置から
    ピッチ位置を抽出し、 上記各符号ベクトルをピッチ周期に対応した切り出し位
    置で切り出し、この切り出した符号ベクトルのピッチ同
    期位置が上記抽出されたピッチ位置に合うように周期的
    に繰り返した第2の時系列ベクトルを生成し、上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成し、 上記駆動音源ベクトルで合成フィルタを駆動して出力音
    声を生成する ことを特徴とする音声符号化復号化方法。
  15. 【請求項15】 フレーム単位に入力音声を複数のパラ
    メータの符号に符号化する音声符号化装置であって、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳と、 上記雑音符号を除く上記複数のパラメータの符号の何れ
    かを基に、現フレームにおいてピッチ周期間隔で並ぶ特
    徴位置からピッチ位置を抽出するピッチ位置抽出手段
    と、 上記抽出されたピッチ位置に上記各符号ベクトルのピッ
    チ同期位置が合うように、ピッチ周期長にした符号ベク
    トルを周期的に繰り返した第2の時系列ベクトルを生成
    するピッチ同期化手段と、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成する加算手段と、 上記駆動音源ベクトルで音声信号を再生する合成フィル
    タと、 上記再生した音声信号の入力音声に対する歪を評価して
    符号を決定する距離算出手段とを備えることを特徴とす
    る音声符号化装置。
  16. 【請求項16】 フレーム単位に複数のパラメータの符
    号を復号化して出力音声を生成する音声復号化装置であ
    って、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳と、 上記雑音符号を除く上記複数のパラメータの符号の何れ
    かを基に、現フレームにおいてピッチ周期間隔で並ぶ特
    徴位置からピッチ位置を抽出するピッチ位置抽出手段
    と、 上記抽出されたピッチ位置に上記各符号ベクトルのピッ
    チ同期位置が合うように、ピッチ周期長にした符号ベク
    トルを周期的に繰り返した第2の時系列ベクトルを生成
    するピッチ同期化手段と、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成する加算手段と、 上記駆動音源ベクトルで出力音声を生成する合成フィル
    タとを備えることを特徴とする音声復号化装置。
  17. 【請求項17】 フレーム単位に入力音声を複数のパラ
    メータの符号に符号化する音声符号化装置であって、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置と、予めピッチ周期に対
    応して定められた切り出し位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳と、 現フレームにおいてピッチ周期間隔で並ぶ特徴位置から
    ピッチ位置を抽出するピッチ位置抽出手段と、 上記各符号ベクトルをピッチ周期に対応した切り出し位
    置で切り出し、この切り出した符号ベクトルのピッチ同
    期位置が上記抽出されたピッチ位置に合うように周期的
    に繰り返した第2の時系列ベクトルを生成するピッチ同
    期化手段と、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成する加算手段と、 上記駆動音源ベクトルで音声信号を再生する合成フィル
    タと、 上記再生した音声信号の入力音声に対する歪を評価して
    符号を決定する距離算出手段とを備えることを特徴とす
    る音声符号化装置。
  18. 【請求項18】 フレーム単位に複数のパラメータの符
    号を復号化して出力音声を生成する音声復号化装置であ
    って、 過去の駆動音源ベクトルを記憶し、適応符号に対応して
    過去の駆動音源ベクトルを周期的に繰り返した第1の時
    系列ベクトルを出力する適応符号帳と、 予め定められたピッチ同期位置と、予めピッチ周期に対
    応して定められた切り出し位置を有する符号ベクトルを
    複数記憶し、雑音符号に対応した符号ベクトルを出力す
    る雑音符号帳と、 現フレームにおいてピッチ周期間隔で並ぶ特徴位置から
    ピッチ位置を抽出する ピッチ位置抽出手段と、 上記各符号ベクトルをピッチ周期に対応した切り出し位
    置で切り出し、この切り出した符号ベクトルのピッチ同
    期位置が上記抽出されたピッチ位置に合うように周期的
    に繰り返した第2の時系列ベクトルを生成するピッチ同
    期化手段と、 上記第1の時系列ベクトルと上記第2の時系列ベクトル
    を加算して駆動音源ベクトルを生成する加算手段と、上記駆動音源ベクトルで出力音声を生成する合成フィル
    タとを備える ことを特徴とする音声復号化装置。
JP06040997A 1996-10-18 1997-03-14 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置 Expired - Fee Related JP3364827B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06040997A JP3364827B2 (ja) 1996-10-18 1997-03-14 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-276205 1996-10-18
JP27620596 1996-10-18
JP06040997A JP3364827B2 (ja) 1996-10-18 1997-03-14 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002123468A Division JP3617503B2 (ja) 1996-10-18 2002-04-25 音声復号化方法

Publications (2)

Publication Number Publication Date
JPH10177399A JPH10177399A (ja) 1998-06-30
JP3364827B2 true JP3364827B2 (ja) 2003-01-08

Family

ID=26401479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06040997A Expired - Fee Related JP3364827B2 (ja) 1996-10-18 1997-03-14 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置

Country Status (1)

Country Link
JP (1) JP3364827B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2524243C (en) * 2003-04-30 2013-02-19 Matsushita Electric Industrial Co. Ltd. Speech coding apparatus including enhancement layer performing long term prediction
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement

Also Published As

Publication number Publication date
JPH10177399A (ja) 1998-06-30

Similar Documents

Publication Publication Date Title
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
EP1202251B1 (en) Transcoder for prevention of tandem coding of speech
JP2746033B2 (ja) 音声復号化装置
EP0409239B1 (en) Speech coding/decoding method
KR101023460B1 (ko) 신호 처리 방법, 처리 장치 및 음성 디코더
US6470313B1 (en) Speech coding
KR101812123B1 (ko) 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
EP1096476B1 (en) Speech signal decoding
JPH01155400A (ja) 音声符号化方式
JP3416331B2 (ja) 音声復号化装置
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JPH07129195A (ja) 音声復号化装置
JP3364827B2 (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置
JP3617503B2 (ja) 音声復号化方法
US20040049381A1 (en) Speech coding method and speech coder
JP3515216B2 (ja) 音声符号化装置
JP3515215B2 (ja) 音声符号化装置
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP2004020676A (ja) 音声符号化/復号化方法及び音声符号化/復号化装置
JP3085347B2 (ja) 音声の復号化方法およびその装置
JP3824706B2 (ja) 音声符号化/復号化装置
JPH08202398A (ja) 音声符号化装置
JPH06266399A (ja) 符号化装置及び音声符号化復号化装置
JPH11249697A (ja) ピッチ位置抽出方法及びピッチ位置抽出装置
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071101

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081101

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081101

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091101

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091101

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101101

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees