JP3364825B2 - 音声符号化装置および音声符号化復号化装置 - Google Patents

音声符号化装置および音声符号化復号化装置

Info

Publication number
JP3364825B2
JP3364825B2 JP13524096A JP13524096A JP3364825B2 JP 3364825 B2 JP3364825 B2 JP 3364825B2 JP 13524096 A JP13524096 A JP 13524096A JP 13524096 A JP13524096 A JP 13524096A JP 3364825 B2 JP3364825 B2 JP 3364825B2
Authority
JP
Japan
Prior art keywords
vector
speech
excitation
sound source
driving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP13524096A
Other languages
English (en)
Other versions
JPH09319396A (ja
Inventor
正 山浦
裕久 田崎
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP13524096A priority Critical patent/JP3364825B2/ja
Priority to TW085115514A priority patent/TW317631B/zh
Priority to US08/777,874 priority patent/US6052661A/en
Priority to CA002194513A priority patent/CA2194513C/en
Priority to KR1019970001026A priority patent/KR100218214B1/ko
Priority to EP97101441A priority patent/EP0810585B1/en
Priority to DE69720855T priority patent/DE69720855D1/de
Priority to CNB971029393A priority patent/CN1151491C/zh
Publication of JPH09319396A publication Critical patent/JPH09319396A/ja
Application granted granted Critical
Publication of JP3364825B2 publication Critical patent/JP3364825B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声信号をディ
ジタル信号に圧縮符号化する音声符号化装置および音声
符号化復号化装置に関する。
【0002】
【従来の技術】図9は、従来の入力音声をスペクトル包
絡情報と音源信号情報に分けて、フレーム単位に音源信
号情報を符号化する音声符号化復号化装置の全体構成の
一例を示すものであり、特開昭64−40899号公報
に示されたものと同様のものである。
【0003】図において、1は符号化部、2は復号化
部、3は多重化手段、4は分離手段、5は入力音声、6
は伝送路、7は出力音声である。符号化部1は次の8〜
15により構成されている。8は線形予測パラメータ分
析手段、9は線形予測パラメータ符号化手段、10は適
応音源符号帳、11は適応音源探索手段、12は誤差信
号生成手段、13は駆動音源符号帳、14は駆動音源探
索手段、15は音源信号生成手段である。また、復号化
部2は次の16〜22により構成されている。16は線
形予測パラメータ復号化手段、17は適応音源符号帳、
18は適応音源復号化手段、19は駆動音源符号帳、2
0は駆動音源復号化手段、21は音源信号生成手段、2
2は合成フィルタである。
【0004】以下、上記従来の入力音声をスペクトル包
絡情報と音源信号情報に分けて、フレーム単位に音源信
号情報を符号化する音声符号化復号化装置の動作につい
て説明する。まず符号化部1において、例えば8kHz
でサンプリングされたディジタル音声信号が入力音声5
として入力される。線形予測パラメータ分析手段8は、
入力音声5を分析して、音声のスペクトル包絡情報であ
る線形予測パラメータを抽出する。次いで線形予測パラ
メータ符号化手段9が抽出した前記線形予測パラメータ
を量子化し、それに対応する符号を多重化手段3に出力
するとともに、量子化した線形予測パラメータを適応音
源探索手段11、誤差信号生成手段12、駆動音源探索
手段14に出力する。
【0005】次に、音源信号情報の符号化について説明
する。適応音源符号帳10には音源信号生成手段15か
ら入力される過去に生成した音源信号が記憶されてお
り、適応音源探索手段11より入力される遅延パラメー
タlに対応したフレーム長の適応音源ベクトルを適応音
源探索手段11に出力する。ここで、前記適応音源ベク
トルは遅延パラメータlに対してlサンプル過去からフ
レーム長の音源信号を切り出したものであり、lがフレ
ーム長より短い場合はlサンプルの音源信号をフレーム
長になるまで繰り返して生成したものである。図10
(a)にl≧フレーム長の場合、図10(b)にl<フ
レーム長の場合の適応音源ベクトルの例を示す。
【0006】適応音源探索手段11は、例えば20≦l
≦128の範囲の遅延パラメータlに対して、前記適応
音源符号帳10から入力される適応音源ベクトルを前記
線形予測パラメータ符号化手段9から入力された量子化
した線形予測パラメータを用いて線形予測合成して合成
音声ベクトルを生成する。そして、入力音声5からフレ
ーム毎に切り出した入力音声ベクトルと前記合成音声ベ
クトルとの聴覚重み付き歪みを求める。次に、前記歪み
を比較評価し、前記歪みが最小になる遅延パラメータL
とそれに対応する適応音源利得βを求め、前記遅延パラ
メータLと適応音源利得βの符号を多重化手段3に出力
するとともに、前記遅延パラメータLに対応する適応音
源ベクトルに前記適応音源利得βを乗じた適応音源信号
を生成し、誤差信号生成手段12と音源信号生成手段1
5に出力する。
【0007】誤差信号生成手段12は前記適応音源探索
手段11から入力された適応音源信号を前記線形予測パ
ラメータ符号化手段9から入力された量子化した線形予
測パラメータを用いて線形予測合成して合成音声ベクト
ルを生成する。そして、入力音声5からフレーム毎に切
り出した入力音声ベクトルと前記合成音声ベクトルとの
差分である誤差信号ベクトルを求め、駆動音源探索手段
14に出力する。
【0008】駆動音源符号帳13には、例えばランダム
雑音から生成したN個の駆動音源ベクトルが記憶されて
おり、駆動音源探索手段14より入力される駆動音源符
号iに対応した駆動音源ベクトルを出力する。駆動音源
探索手段14はN個の駆動音源ベクトルに対して、前記
駆動音源符号帳13から入力される駆動音源ベクトルを
前記線形予測パラメータ符号化手段9から入力された量
子化した線形予測パラメータを用いて線形予測合成して
合成音声ベクトルを生成する。そして、前記誤差信号生
成手段12から入力された誤差信号ベクトルと前記合成
音声ベクトルとの聴覚重み付き歪みを求める。次に、前
記歪みを比較評価し、前記歪みが最小になる駆動音源符
号Iとそれに対応する駆動音源利得γを求め、前記駆動
音源符号Iと駆動音源利得γの符号を多重化手段3に出
力するとともに、前記駆動音源符号Iに対応する駆動音
源ベクトルに前記駆動音源利得γを乗じた駆動音源信号
を生成し、音源信号生成手段15に出力する。
【0009】音源信号生成手段15は前記適応音源探索
手段11から入力された適応音源信号と前記駆動音源探
索手段14から入力された駆動音源信号とを加算して音
源信号を生成し、適応音源符号帳10に出力する。以上
符号化が終了した後、多重化手段3は前記量子化した線
形予測パラメータに対応する符号、遅延パラメータL、
駆動音源符号I、及び音源利得β、γに対応する符号を
伝送路6に送出する。
【0010】次に、復号化部2の動作について説明す
る。まず多重化手段3の出力を受けた分離手段4は、 線形予測パラメータの符号→線形予測パラメータ復号化
手段16 遅延パラメータL、音源利得βの符号→適応音源復号化
手段18 駆動音源符号I、音源利得γの符号→駆動音源復号化手
段20 にそれぞれ出力する。
【0011】線形予測パラメータ復号化手段16は、前
記線形予測パラメータの符号に対応する線形予測パラメ
ータを復号化し、合成フィルタ22に出力する。適応音
源復号化手段18は、前記遅延パラメータLに対応した
適応音源ベクトルを適応音源符号帳17から読み出し、
また前記適応音源利得βの符号から適応音源利得βを復
号化し、前記適応音源ベクトルに前記適応音源利得βを
乗じた適応音源信号を生成し、音源信号生成手段21に
出力する。駆動音源復号化手段20は、前記駆動音源符
号Iに対応した駆動音源ベクトルを駆動音源符号帳19
から読み出し、また前記駆動音源利得γの符号から駆動
音源利得γを復号化し、前記駆動音源ベクトルに前記駆
動音源利得γを乗じた駆動音源信号を生成し、音源信号
生成手段21に出力する。
【0012】音源信号生成手段21は前記適応音源復号
化手段18から入力された適応音源信号と前記駆動音源
復号化手段20から入力された駆動音源信号とを加算し
て音源信号を生成し、適応音源符号帳17と合成フィル
タ22に出力する。合成フィルタ22は前記音源信号生
成手段21から入力された音源信号を、前記線形予測パ
ラメータ復号化手段16から入力された線形予測パラメ
ータを用いて線形予測合成し、出力音声7を出力する。
【0013】また、上記従来の音声符号化復号化装置の
改良された先行技術として、より高品質な出力音声を得
られる音声符号化復号化装置として、P.Kroon
and B.S.Atal著“Pitch predi
ctors with high temporal
resolution”(ICASSP’90,pp6
61−664,1990)に示されたものがある。
【0014】この従来の改良された音声符号化復号化装
置は、図9に示す従来の音声符号化復号化装置の構成に
おいて、適応音源探索手段11における探索対象の遅延
パラメータとして整数値の他に非整数有理数もとるよう
にし、適応音源符号帳10、17は前記非整数有理数の
遅延パラメータに対応した適応音源ベクトルを過去に生
成した音源信号のサンプル間を補間して生成し、出力す
るものである。図11に遅延パラメータlが非整数有理
数の場合の適応音源ベクトルの例を示す。図11(a)
はl≧フレーム長の場合、図11(b)はl<フレーム
長の場合の例である。このように構成することにより、
入力音声のサンプリング周期よりも高い精度で遅延パラ
メータを決定し、適応音源ベクトルを生成することがで
き、特開昭64−40899号公報に開示されている装
置に比べてより高品質な出力音声の生成が可能である。
【0015】また、従来の音声符号化復号化装置の他の
先行技術として、特開平4−344699号公報があ
る。図12は、この従来の音声符号化装置の全体構成の
一例を示す構成図である。図12において図9と同一の
部分については同一の符号を付し、その説明は省略す
る。図12において、23、24は駆動音源符号帳で、
図9の駆動音源符号帳とは異なるものである。
【0016】ここで上記の構成による符号化復号化装置
の動作について説明する。まず、符号化部1において、
適応音源探索手段11は、例えば20≦l≦128の範
囲の遅延パラメータlに対して、適応音源符号帳10か
ら入力される適応音源ベクトルを線形予測パラメータ符
号化手段9から入力される量子化した線形予測パラメー
タを用いて線形予測合成して合成音声ベクトルを生成す
る。そして、入力音声5からフレーム毎に切り出した入
力音声ベクトルと前記合成音声ベクトルとの聴覚重み付
き歪みを求める。次に、前記歪みを比較評価し、前記歪
みが最小になる遅延パラメータLとそれに対応する適応
音源利得βを求め、前記遅延パラメータLと適応音源利
得βの符号を多重化手段3と駆動音源符号帳23に出力
するとともに、前記遅延パラメータLに対応する適応音
源ベクトルに前記適応音源利得βを乗じた適応音源信号
を生成し、誤差信号生成手段12と音源信号生成手段1
5に出力する。
【0017】駆動音源符号帳23には、例えばランダム
雑音から生成したN個の駆動音源ベクトルが記憶されて
おり、駆動音源探索手段14より入力される駆動音源符
号iに対応した駆動音源ベクトルを前記遅延パラメータ
Lに対応した周期毎に繰り返して周期化し、出力する。
図13(a)に周期化した駆動音源ベクトルの例を示
す。遅延パラメータLが非整数有理数の場合は、図13
(b)に示すように駆動音源ベクトルのサンプル間を補
間して生成し、周期化する。
【0018】駆動音源探索手段14はN個の駆動音源ベ
クトルに対して、前記駆動音源符号帳23から入力され
る周期化した駆動音源ベクトルを線形予測パラメータ符
号化手段9から入力される量子化した線形予測パラメー
タを用いて線形予測合成して合成音声ベクトルを生成す
る。そして、誤差信号生成手段12から入力される誤差
信号ベクトルと前記合成音声ベクトルとの聴覚重み付き
歪みを求める。次に、前記歪みを比較評価し、前記歪み
が最小になる駆動音源符号Iとそれに対応する駆動音源
利得γを求め、前記駆動音源符号Iと駆動音源利得γの
符号を多重化手段3に出力するとともに、前記駆動音源
符号Iに対応する周期化した駆動音源ベクトルに前記駆
動音源利得γを乗じた駆動音源信号を生成し、音源信号
生成手段15に出力する。
【0019】符号化が終了した後、多重化手段3は前記
量子化した線形予測パラメータに対応する符号、遅延パ
ラメータL、駆動音源符号I、及び音源利得β、γに対
応する符号を伝送路6に送出する。
【0020】次に、復号化部2の動作について説明す
る。まず、多重化手段3の出力を受けた分離手段4は、 線形予測パラメータの符号→線形予測パラメータ復号化
手段16 遅延パラメータL、音源利得βの符号→適応音源復号化
手段18、駆動音源符号帳24 駆動音源符号I、音源利得γの符号→駆動音源復号化手
段20 にそれぞれ出力する。
【0021】駆動音源符号帳24は符号化側の駆動音源
符号帳23と同じN個の駆動音源ベクトルが記憶されて
おり、駆動音源復号化手段20より入力される駆動音源
符号Iに対応した駆動音源ベクトルを前記遅延パラメー
タLに対応した周期毎に繰り返して周期化し、駆動音源
復号化手段20に出力する。
【0022】駆動音源復号化手段20は、前記駆動音源
利得γの符号から駆動音源利得γを復号化し、前記駆動
音源符号帳24から入力された周期化した駆動音源ベク
トルに前記駆動音源利得γを乗じた駆動音源信号を生成
し、音源信号生成手段21に出力する。
【0023】音源信号生成手段21は適応音源復号化手
段18から入力される適応音源信号と前記駆動音源復号
化手段20から入力された駆動音源信号とを加算して音
源信号を生成し、適応音源符号帳17と合成フィルタ2
2に出力する。合成フィルタ22は前記音源信号生成手
段21から入力された音源信号を、線形予測パラメータ
復号化手段16から入力される線形予測パラメータを用
いて線形予測合成し、出力音声7を出力する。
【0024】
【発明が解決しようとする課題】上記した従来の音声符
号化復号化装置では、符号化における音源探索に際し、
遅延パラメータに応じて、適応音源ベクトルまたは駆動
音源ベクトルを周期化、生成してフレーム長の音源ベク
トルとし、これを線形予測合成して合成音声ベクトルを
生成し、フレーム長区間での入力音声ベクトルと合成音
声ベクトルとの歪みを求めている。しかし、線形予測合
成に掛かる演算量が大きいため、音源探索には多大な演
算量を要するという問題があった。
【0025】この発明は、かかる課題を解決するために
なされたもので、その目的は、音声を符号化するに当た
り、合成音声の品質の劣化を回避し、少ない演算量で品
質の良い合成音声を生成することができる音声符号化装
置及び音声符号化復号化装置を得るものである。
【0026】
【課題を解決するための手段】上記の課題を解決するた
めに、この発明の音声符号化装置は、入力音声を遅延パ
ラメータに対応したベクトル長毎に分割し、ベクトル長
毎の入力音声を加重平均して目標音声ベクトルを生成す
る目標音声生成手段と、過去に生成した音源信号から前
記遅延パラメータに対応したベクトル長の適応音源ベク
トルを生成する適応音源符号帳と、前記適応音源ベクト
ルから得られる合成音声ベクトルの前記目標音声ベクト
ルに対する歪みを評価し、歪みが最小となる適応音源ベ
クトルを探索する適応音源探索手段と、前記歪みが最小
となる適応音源ベクトルからフレーム長の音源信号を生
成するフレーム音源生成手段とを備えたものである。
【0027】また、この発明の音声符号化装置はさら
に、目標音声ベクトルと歪みが最小となる適応音源ベク
トルから第2の目標音声ベクトルを生成する第2の目標
音声生成手段と、遅延パラメータに対応したベクトル長
の駆動音源ベクトルを生成する駆動音源符号帳と、前記
駆動音源ベクトルから得られる第2の合成音声ベクトル
の前記第2の目標音声ベクトルに対する歪みを評価し、
歪みが最小となる駆動音源ベクトルを探索する駆動音源
探索手段と、前記歪みが最小となる駆動音源ベクトルか
ら第2のフレーム長の音源信号を生成する第2のフレー
ム音源生成手段とを備えたものである。
【0028】また、この発明の音声符号化装置は、入力
音声を遅延パラメータに対応したベクトル長毎に分割
し、ベクトル長毎の入力音声を加重平均して目標音声ベ
クトルを生成する目標音声生成手段と、遅延パラメータ
に対応したベクトル長の駆動音源ベクトルを生成する駆
動音源符号帳と、前記駆動音源ベクトルから得られる合
成音声ベクトルの前記目標音声ベクトルに対する歪みを
評価し、歪みが最小となる駆動音源ベクトルを探索する
駆動音源探索手段と、前記歪みが最小となる駆動音源ベ
クトルからフレーム長の音源信号を生成するフレーム音
源生成手段とを備えたものである。
【0029】また、この発明の音声符号化装置はさら
に、目標音声ベクトル及び駆動音源ベクトルのベクトル
長は入力音声のピッチ周期に対応して決定するものであ
る。
【0030】また、この発明の音声符号化装置はさら
に、遅延パラメータに対応したベクトル長が有理数をと
るものである。
【0031】
【0032】また、この発明の音声符号化装置はさら
に、目標音声生成手段は、遅延パラメータに対応したベ
クトル長の整数倍長の入力音声をベクトル長毎に分割
し、ベクトル長毎の入力音声を加重平均して目標音声ベ
クトルを生成するものである。
【0033】また、この発明の音声符号化装置はさら
に、遅延パラメータに対応したベクトル長の整数倍長は
フレーム長以上とするものである。
【0034】また、この発明の音声符号化装置はさら
に、目標音声生成手段は遅延パラメータに対応したベク
トル長毎の入力音声に関わる特徴量に応じて、入力音声
をベクトル長毎に加重平均して目標音声ベクトルを生成
する際の重みを決定するものである。
【0035】また、この発明の音声符号化装置はさら
に、遅延パラメータに対応したベクトル長毎の入力音声
に関わる特徴量は少なくとも入力音声のパワー情報を含
むものである。
【0036】また、この発明の音声符号化装置はさら
に、遅延パラメータに対応したベクトル長毎の入力音声
に関わる特徴量は少なくとも入力音声の相関情報を含む
ものである。
【0037】また、この発明の音声符号化装置はさら
に、目標音声生成手段は、遅延パラメータに対応したベ
クトル長毎の入力音声の時間関係に応じて、入力音声を
ベクトル長毎に加重平均して目標音声ベクトルを生成す
る際の重みを決定するものである。
【0038】また、この発明の音声符号化装置はさら
に、目標音声生成手段は、入力音声を遅延パラメータに
対応したベクトル長毎に加重平均する際、ベクトル長毎
の入力音声の時間関係を微調整するものである。
【0039】また、この発明の音声符号化装置はさら
に、フレーム音源生成手段は、遅延パラメータに対応し
たベクトル長の音源ベクトルを前記ベクトル長毎に繰り
返して周期化し、フレーム長の音源信号を生成するもの
である。
【0040】また、この発明の音声符号化装置はさら
に、フレーム音源生成手段は、遅延パラメータに対応し
たベクトル長の音源ベクトルをフレーム間で補間して音
源信号を生成するものである。
【0041】また、この発明の音声符号化装置はさら
に、適応音源探索手段は合成フィルタを備え、この合成
フィルタのインパルス応答を用いて、適応音源ベクトル
から得られる合成音声ベクトルの目標音声ベクトルに対
する歪みを反復的に計算するものである。
【0042】また、この発明の音声符号化装置はさら
に、入力音声をアップサンプリングする入力音声アップ
サンプリング手段を備え、目標音声生成手段はアップサ
ンプリングされた入力音声から目標音声ベクトルを生成
するものである。
【0043】また、この発明の音声符号化装置はさら
に、過去に生成された音源信号をアップサンプリングす
る音源信号アップサンプリング手段を備え、適応音源符
号帳はアップサンプリングされた過去に生成された音源
信号から適応音源ベクトルを生成するものである。
【0044】また、この発明の音声符号化装置はさら
に、アップサンプリング手段は遅延パラメータに対応し
て、アップサンプリング倍率を変更するものである。
【0045】また、この発明の音声符号化装置はさら
に、アップサンプリング手段は遅延パラメータに対応し
たベクトル長に応じた範囲のみ入力音声または音源信号
のアップサンプリング倍率を変更するものである。
【0046】また、この発明に係る音声符号化復号化装
置は、符号化側に、入力音声を遅延パラメータに対応し
たベクトル長毎に分割し、ベクトル長毎の入力音声を加
重平均して目標音声ベクトルを生成する目標音声生成手
段と、過去に生成した音源信号から前記遅延パラメータ
に対応したベクトル長の適応音源ベクトルを生成する適
応音源符号帳と、前記適応音源ベクトルから得られる合
成音声ベクトルの前記目標音声ベクトルに対する歪みを
評価し、歪みが最小となる適応音源ベクトルを探索する
適応音源探索手段と、前記歪みが最小となる適応音源ベ
クトルからフレーム長の音源信号を生成するフレーム音
源生成手段とを備える一方、復号化側に、遅延パラメー
タに対応したベクトル長の適応音源ベクトルを生成する
適応音源符号帳と、適応音源ベクトルからフレーム長の
音源信号を生成するフレーム音源生成手段とを備えるも
のである。
【0047】また、この発明に係る音声符号化復号化装
置はさらに、符号化側に、目標音声ベクトルと適応音源
ベクトルから第2の目標音声ベクトルを生成する第2の
目標音声生成手段と、遅延パラメータに対応したベクト
ル長の駆動音源ベクトルを生成する駆動音源符号帳と、
前記駆動音源ベクトルから得られる第2の合成音声ベク
トルの前記第2の目標音声ベクトルに対する歪みを評価
し、歪みが最小となる駆動音源ベクトルを探索する駆動
音源探索手段と、前記歪みが最小となる駆動音源ベクト
ルから第2のフレーム長の音源信号を生成する第2のフ
レーム音源生成手段とを備える一方、復号化側に遅延パ
ラメータに対応したベクトル長の駆動音源ベクトルを生
成する駆動音源符号帳と、駆動音源ベクトルから第2の
フレーム長の音源信号を生成する第2のフレーム音源生
成手段とを備えるものである。
【0048】また、この発明に係る音声符号化復号化装
置は、符号化側に、入力音声を遅延パラメータに対応し
たベクトル長毎に分割し、ベクトル長毎の入力音声を加
重平均して目標音声ベクトルを生成する目標音声生成手
段と、遅延パラメータに対応したベクトル長の駆動音源
ベクトルを生成する駆動音源符号帳と、前記駆動音源ベ
クトルから得られる合成音声ベクトルの前記目標音声ベ
クトルに対する歪みを評価し、歪みが最小となる駆動音
源ベクトルを探索する駆動音源探索手段と、前記歪みが
最小となる駆動音源ベクトルからフレーム長の音源信号
を生成するフレーム音源生成手段とを備える一方、復号
化側に、遅延パラメータに対応したベクトル長の駆動音
源ベクトルを生成する駆動音源符号帳と、駆動音源ベク
トルからフレーム長の音源信号を生成するフレーム音源
生成手段とを備えるものである。
【0049】
【発明の実施の形態】
実施の形態1.図1は、この発明の実施の形態1である
音声符号化装置及び音声復号化装置の全体構成を示すブ
ロック図である。
【0050】図1において、1は符号化部、2は復号化
部、3は多重化手段、4は分離手段、5は入力音声、6
は伝送路、7は出力音声である。
【0051】符号化部1は次の8、9、15、および2
5〜36により構成されている。8は線形予測パラメー
タ分析手段、9は線形予測パラメータ符号化手段、15
は音源信号生成手段、25は入力音声のピッチ周期を抽
出するピッチ分析手段、26は適応音源ベクトルを探索
する際の遅延パラメータの探索範囲を決定する遅延パラ
メータ探索範囲決定手段、27は入力音声をアップサン
プリングする入力音声アップサンプリング手段、28は
遅延パラメータに対応したベクトル長の目標音声ベクト
ルを生成する目標音声生成手段、29は過去に生成した
音源信号をアップサンプリングする音源信号アップサン
プリング手段、30は過去に生成した音源信号から遅延
パラメータに対応したベクトル長の適応音源ベクトルを
出力する適応音源符号帳、31は適応音源ベクトルから
得られる合成音声ベクトルの目標音声ベクトルに対する
歪みを評価し、歪みが最小となる適応音源ベクトルを探
索する適応音源探索手段、32は遅延パラメータに対応
したベクトル長の適応音源信号からフレーム長の適応音
源信号を生成するフレーム音源生成手段、33は駆動音
源ベクトル探索における遅延パラメータに対応したベク
トル長の目標音声ベクトルを生成する第2の目標音声生
成手段、34は遅延パラメータに対応したベクトル長の
駆動音源ベクトルを出力する駆動音源符号帳、35は駆
動音源ベクトルから得られる合成音声ベクトルの第2の
目標音声ベクトルに対する歪みを評価し、歪みが最小と
なる駆動音源ベクトルを探索する駆動音源探索手段、3
6は遅延パラメータに対応したベクトル長の駆動音源信
号からフレーム長の駆動音源信号を生成する第2のフレ
ーム音源生成手段である。
【0052】また、復号化部2は次の16、21、2
2、および37〜43により構成されている。16は線
形予測パラメータ復号化手段、21は音源信号生成手
段、22は合成フィルタ、37は過去に生成した音源信
号をアップサンプリングする音源信号アップサンプリン
グ手段、38は遅延パラメータに対応したベクトル長の
適応音源ベクトルを出力する適応音源符号帳、39は遅
延パラメータに対応したベクトル長の適応音源信号を復
号化する適応音源復号化手段、40は遅延パラメータに
対応したベクトル長の適応音源信号からフレーム長の適
応音源信号を生成するフレーム音源生成手段、41は遅
延パラメータに対応したベクトル長の駆動音源ベクトル
を出力する駆動音源符号帳、42は遅延パラメータに対
応したベクトル長の駆動音源信号を復号化する駆動音源
復号化手段、43は遅延パラメータに対応したベクトル
長の駆動音源信号からフレーム長の駆動音源信号を生成
する第2のフレーム音源生成手段である。
【0053】以下、動作を説明する。まず符号化部1に
おいて、例えば8kHzでサンプリングされたディジタ
ル音声信号が入力音声5として入力される。線形予測パ
ラメータ分析手段8は、前記入力音声5を分析して、音
声のスペクトル包絡情報である線形予測パラメータを抽
出する。次いで線形予測パラメータ符号化手段9が抽出
した前記線形予測パラメータを量子化し、それに対応す
る符号を多重化手段3に出力するとともに、量子化した
線形予測パラメータを適応音源探索手段31、第2の目
標音声生成手段33、駆動音源探索手段35に出力す
る。
【0054】ピッチ分析手段25は入力音声5を分析し
てピッチ周期Pを抽出する。次いで遅延パラメータ探索
範囲決定手段26は前記ピッチ周期Pより、適応音源ベ
クトルを探索する際の遅延パラメータlの探索範囲l
min ≦l≦lmax を、例えば式(1)に従って決定し、
入力音声アップサンプリング手段27、音源信号アップ
サンプリング手段29、適応音源探索手段31に出力す
る。ここで、ΔPは例えばP/10とする。 lmin =P−ΔP lmax =P+ΔP (1)
【0055】入力音声アップサンプリング手段27は遅
延パラメータ探索範囲決定手段26から入力された遅延
パラメータの探索範囲に応じたサンプリングレートに入
力音声5を、例えば音源信号を符号化する単位であるフ
レーム区間でアップサンプリングし、目標音声生成手段
28に出力する。ここで、アップサンプリングレート
は、例えば以下のように決定する。 lmin <45 の場合、4倍にアップサンプリン
グする。 45≦lmin <65 の場合、2倍にアップサンプリン
グする。 65≦lmin の場合、アップサンプリングしな
い。
【0056】目標音声生成手段28は前記入力音声アッ
プサンプリング手段27から入力されたアップサンプリ
ングしたフレーム長の入力音声を、適応音源探索手段3
1から入力される遅延パラメータlに対応して、例えば
周期1毎に分割し、この分割した遅延パラメータlに対
応したベクトル長毎の入力音声を加算平均することによ
り、遅延パラメータlに対応したベクトル長の目標音声
ベクトルを生成し、適応音源探索手段31と第2の目標
音声生成手段33に出力する。ここで、遅延パラメータ
lは整数値の他、非整数有理数もとり、lの存在範囲に
応じて、例えばlint を整数値遅延とした場合に以下の
値をとり得るとする。 l<45 の場合、lint ,lint +1/4,l
int +1/2,lint +3/4 45≦l<65 の場合、lint ,lint +1/2 65≦l の場合、lint 図2にフレーム長の入力音声から生成する遅延パラメー
タlに対応したベクトル長の目標音声ベクトルの例を示
す。ここで、l≧フレーム長の場合は前記加算平均を行
なわず、フレーム長の入力音声を目標音声ベクトルとす
る。
【0057】音源信号アップサンプリング手段29は、
音源信号生成手段15から入力される過去に生成した音
源信号を、前記遅延パラメータ探索範囲決定手段26か
ら入力された前記遅延パラメータの探索範囲に応じた適
応音源探索に必要な区間のみを、前記遅延パラメータの
探索範囲に応じたサンプリングレートにアップサンプリ
ングし、適応音源符号帳30に出力する。ここで、アッ
プサンプリングレートは、例えば以下のように決定す
る。 l<45 の区間、4倍にアップサンプリングす
る。 45≦l<65 の区間、2倍にアップサンプリングす
る。 65≦l の区間、アップサンプリングしない。
【0058】適応音源符号帳30は前記音源信号アップ
サンプリング手段29から入力されたアップサンプリン
グした音源信号から、適応音源探索手段31より入力さ
れる遅延パラメータlに対応したベクトル長の適応音源
ベクトルを適応音源探索手段31に出力する。ここで、
前記適応音源ベクトルは遅延パラメータlに対して過去
lサンプルの音源信号を切り出したものであり、l≧フ
レーム長の場合はlサンプル過去からフレーム長の音源
信号を切り出したものとする。
【0059】適応音源探索手段31は、合成フィルタを
備え、線形予測パラメータ符号化手段9から入力される
量子化した線形予測パラメータを用いて合成フィルタの
インパルス応答を求める。次いで、lmin ≦l≦lmax
の範囲の遅延パラメータlに対して、前記適応音源符号
帳30から入力される適応音源ベクトルを前記インパル
ス応答を用いて反復的に計算して合成し、合成音声ベク
トルを生成する。そして、前記目標音声生成手段28か
ら入力された目標音声ベクトルと前記合成音声ベクトル
との聴覚重み付き歪みを求める。次に、前記歪みを比較
評価し、前記歪みが最小になる遅延パラメータLとそれ
に対応する適応音源利得βを求め、前記遅延パラメータ
Lと適応音源利得βの符号を多重化手段3と駆動音源符
号帳34に出力するとともに、前記遅延パラメータLに
対応する適応音源ベクトルに前記適応音源利得βを乗じ
た適応音源信号を生成し、フレーム音源生成手段32と
第2の目標音声生成手段33に出力する。ここで、前記
適応音源信号は、L<フレーム長の場合はLサンプル、
L≧フレーム長の場合はフレーム長の信号である。
【0060】フレーム音源生成手段32は前記適応音源
探索手段31から入力された適応音源信号から、例えば
周期L毎に繰り返して周期化して、フレーム長の適応音
源信号を生成し、音源信号生成手段15に出力する。
【0061】第2の目標音声生成手段33は前記適応音
源探索手段31から入力された適応音源信号を線形予測
パラメータ符号化手段9から入力される量子化した線形
予測パラメータを用いて線形予測合成して合成音声ベク
トルを生成する。そして、目標音声生成手段28から入
力された目標音声ベクトルと前記合成音声ベクトルとの
差分を求め、これを第2の目標音声ベクトルとして駆動
音源探索手段35に出力する。
【0062】駆動音源符号帳34には、例えばランダム
雑音から生成したN個の駆動音源ベクトルが記憶されて
おり、駆動音源探索手段35より入力される駆動音源符
号iに対応した駆動音源ベクトルを前記遅延パラメータ
Lに対応したベクトル長で切り出し、出力する。ここ
で、L≧フレーム長の場合は、フレーム長の駆動音源ベ
クトルを出力する。
【0063】駆動音源探索手段35はN個の駆動音源ベ
クトルに対して、前記駆動音源符号帳34から入力され
る切り出した駆動音源ベクトルを前記線形予測パラメー
タ符号化手段9から入力される量子化した線形予測パラ
メータを用いて線形予測合成して合成音声ベクトルを生
成する。そして、前記第2の目標音声生成手段33から
入力された第2の目標音声ベクトルと前記合成音声ベク
トルとの聴覚重み付き歪みを求める。次に、前記歪みを
比較評価し、前記歪みが最小になる駆動音源符号Iとそ
れに対応する駆動音源利得γを求め、前記駆動音源符号
Iと駆動音源利得γの符号を多重化手段3に出力すると
ともに、前記駆動音源符号Iに対応する駆動音源ベクト
ルに前記駆動音源利得γを乗じた駆動音源信号を生成
し、第2のフレーム音源生成手段36に出力する。
【0064】第2のフレーム音源生成手段36は前記駆
動音源探索手段35から入力された駆動音源信号から、
例えば周期L毎に繰り返して周期化して、フレーム長の
駆動音源信号を生成し、音源信号生成手段15に出力す
る。
【0065】音源信号生成手段15は前記フレーム音源
生成手段32から入力されたフレーム長の適応音源信号
と前記第2のフレーム音源生成手段36から入力された
フレーム長の駆動音源信号とを加算して音源信号を生成
し、音源信号アップサンプリング手段29に出力する。
【0066】以上符号化が終了した後、多重化手段3は
前記量子化した線形予測パラメータに対応する符号、遅
延パラメータL、駆動音源信号I、及び音源利得β、γ
に対応する符号を伝送路6に送出する。以上がこの実施
の形態1の音声符号化装置に特徴的な動作である。
【0067】つづいて、復号化部2について説明する。
まず多重化手段3の出力を受けた分離手段4は、 線形予測パラメータの符号→線形予測パラメータ復号化
手段16 遅延パラメータL→適応音源復号化手段39、駆動音源
符号帳41 音源利得βの符号→適応音源復号化手段39 駆動音源符号I、音源利得γの符号→駆動音源復号化手
段42 にそれぞれ出力する。
【0068】適応音源復号化手段39は、まず前記遅延
パラメータLを音源信号アップサンプリング手段37と
適応音源符号帳38に出力する。音源信号アップサンプ
リング手段37は、音源信号生成手段21から入力され
る過去に生成した音源信号を、前記適応音源復号化手段
39から入力された前記遅延パラメータLの値に応じた
適応音源ベクトル生成に必要な区間のみを、前記遅延パ
ラメータLの値に応じたサンプリングレートにアップサ
ンプリングし、適応音源符号帳38に出力する。ここ
で、アップサンプリングレートは符号化部における音源
信号アップサンプリング手段29と同様に決定する。
【0069】適応音源符号帳38は前記音源信号アップ
サンプリング手段37から入力されたアップサンプリン
グした音源信号から、適応音源復号化手段39より入力
される遅延パラメータLに対応したベクトル長の適応音
源ベクトルを適応音源復号化手段39に出力する。ここ
で、前記適応音源ベクトルは遅延パラメータLに対して
過去Lサンプルの音源信号を切り出したものであり、L
≧フレーム長の場合はLサンプル過去からフレーム長の
音源信号を切り出したものとする。
【0070】適応音源復号化手段39は、前記適応音源
利得βの符号から適応音源利得βを復号化し、前記適応
音源符号帳38から入力された適応音源ベクトルに前記
適応音源利得βを乗じた適応音源信号を生成し、フレー
ム音源生成手段40に出力する。フレーム音源生成手段
40は前記適応音源復号化手段39から入力された適応
音源信号から、例えば周期L毎に繰り返して周期化し
て、フレーム長の適応音源信号を生成し、音源信号生成
手段21に出力する。
【0071】駆動音源符号帳41は符号化側の駆動音源
符号帳34と同じN個の駆動音源ベクトルが記憶されて
おり、駆動音源復号化手段42より入力される駆動音源
符号Iに対応した駆動音源ベクトルを前記遅延パラメー
タLに対応したベクトル長で切り出し、駆動音源復号化
手段42に出力する。
【0072】駆動音源復号化手段42は、前記駆動音源
利得γの符号から駆動音源利得γを復号化し、前記駆動
音源符号帳41から入力された切り出した駆動音源ベク
トルに前記駆動音源利得γを乗じた駆動音源信号を生成
し、第2のフレーム音源生成手段43に出力する。第2
のフレーム音源生成手段43は前記駆動音源復号化手段
42から入力された駆動音源信号から、例えば周期L毎
に繰り返して周期化して、フレーム長の駆動音源信号を
生成し、音源信号生成手段21に出力する。
【0073】音源信号生成手段21は前記フレーム音源
生成手段40から入力されたフレーム長の適応音源信号
と前記第2のフレーム音源生成手段43から入力された
フレーム長の駆動音源信号とを加算して音源信号を生成
し、音源信号アップサンプリング手段37と合成フィル
タ22に出力する。合成フィルタ22は前記音源信号生
成手段21から入力された音源信号を、線形予測パラメ
ータ復号化手段16から入力される線形予測パラメータ
を用いて線形予測合成し、出力音声7を出力する。以上
がこの実施の形態1の音声復号化装置に特徴的な動作で
ある。
【0074】この実施の形態1によれば、最適な遅延パ
ラメータを決定する際に、遅延パラメータlがフレーム
長より短い場合は入力音声を周期的に加算平均してベク
トル長lの目標音声ベクトルを生成し、これに対してベ
クトル長lの適応音源ベクトルを線形予測合成して生成
した合成音声ベクトルとの歪みを評価し、また、最適な
駆動音源符号を決定する際にも、ベクトル長lの駆動音
源ベクトルを線形予測合成して生成した合成音声ベクト
ルを歪み評価に用いることにより、合成音声の品質の劣
化を回避し、少ない演算量で品質の良い合成音声を生成
することができる。
【0075】実施の形態2.上記実施の形態1では、フ
レーム音源生成手段32、40及び第2のフレーム音源
生成手段36、43において、遅延パラメータLに対応
したベクトル長の適応音源信号あるいは駆動音源信号を
周期L毎に繰り返して周期化し、フレーム長の適応音源
信号あるいは駆動音源信号を生成しているが、前記遅延
パラメータLに対応したベクトル長の適応音源信号ある
いは駆動音源信号を、例えば周期L毎に波形補間すると
して、フレーム間で補間し、フレーム長の適応音源信号
あるいは駆動音源信号を生成するとしてもよい。
【0076】この実施の形態2によれば、フレーム間の
音源信号の変化が滑らかになり、合成音声の再現性を良
好にし、品質を向上させることができる。
【0077】実施の形態3.上記実施の形態1、2で
は、遅延パラメータLに対応したベクトル長の適応音源
信号と駆動音源信号から、フレーム音源生成手段及び第
2のフレーム音源生成手段を用いてフレーム長の適応音
源信号とフレーム長の駆動音源信号を生成し、これらを
加算してフレーム長の音源信号を生成しているが、遅延
パラメータLに対応したベクトル長の適応音源信号と駆
動音源信号とを加算して遅延パラメータLに対応したベ
クトル長の音源信号を生成し、これを例えば周期L毎に
繰り返して周期化して、フレーム長の音源信号を生成す
るとしてもよい。
【0078】実施の形態4.上記実施の形態1では、符
号化部、復号化部ともに新たな構成をとるとしている
が、符号化部を実施の形態1の符号化部とし、復号化部
を図12に記載の従来の復号化部としてもよい。
【0079】実施の形態5.上記実施の形態1では、目
標音声生成手段28においてフレーム長の入力音声から
遅延パラメータlに対応したベクトル長の目標音声ベク
トルを生成しているが、図3に示すように、遅延パラメ
ータlに対応したベクトル長の整数倍長の入力音声から
目標音声ベクトルを生成するとしてもよい。
【0080】この実施の形態5によれば、目標音声ベク
トルを生成する際の平均化処理において、ベクトル長が
異なるベクトルを扱う必要がなく、簡易に処理すること
ができる。また、フレーム長を越えた入力音声を音声符
号化する際の評価に用いることにより、該フレームの合
成音声が該フレーム以後に与える影響も加味して符号を
決定することになり、合成音声の再現性を良好にし、品
質を向上させることができる。
【0081】実施の形態6.上記実施の形態1では、目
標音声生成手段28において入力音声から遅延パラメー
タlに対応したベクトル長の目標音声ベクトルを生成す
る際に単純平均しているが、図4に示すように、各遅延
パラメータlに対応したベクトル長の入力音声のパワー
に応じた重みで、例えば、パワーが大きいほど重みを大
きくするとして、加重平均するとしてもよい。
【0082】この実施の形態6によれば、目標音声ベク
トルを生成する際の平均化処理において、入力音声のパ
ワーが大きい部分により重みをつけて音声符号化するこ
とにより、主観品質に与える影響が大きい合成音声のパ
ワーの大きな部分の再現性が良好になり、品質を向上さ
せることができる。
【0083】実施の形態7.上記実施の形態1では、目
標音声生成手段28において入力音声から遅延パラメー
タlに対応したベクトル長の目標音声ベクトルを生成す
る際に単純平均しているが、図5に示すように、各遅延
パラメータlに対応したベクトル長の入力音声間の相互
相関値に応じた重みで、例えば、他の各遅延パラメータ
lに対応したベクトル長の入力音声との相関が低い場合
は重みを小さくするとして、加重平均するとしてもよ
い。
【0084】この実施の形態7によれば、目標音声ベク
トルを生成する際の平均化処理において、入力音声が周
期lの周期性をもつとした場合に相関が低い部分の重み
を小さくして音声符号化することにより、ピッチ周期が
変動している入力音声に対しても1ピッチ周期に対応し
た歪みが小さい目標音声ベクトルを生成することがで
き、合成音声の再現性を良好にし、品質を向上させるこ
とができる。
【0085】実施の形態8.上記実施の形態1では、目
標音声生成手段28において入力音声から遅延パラメー
タlに対応したベクトル長の目標音声ベクトルを生成す
る際に単純平均しているが、図6に示すように、各遅延
パラメータlに対応したベクトル長の入力音声間の位置
に応じた重みで、例えば、フレーム境界近傍の入力音声
に対して重みを大きくするとして、加重平均するとして
もよい。
【0086】この実施の形態8によれば、目標音声ベク
トルを生成する際の平均化処理において、フレーム境界
近傍の入力音声に重みを大きくして目標音声ベクトルを
生成し、符号化することにより、フレーム境界近傍の合
成音声の再現性を良好にすることができ、フレーム間の
合成音声の変化を滑らかにすることができる。この効果
は、実施の形態2における音源信号をフレーム間で補間
して生成する場合に、特に顕著となる。
【0087】実施の形態9.上記実施の形態1では、目
標音声生成手段28において入力音声から遅延パラメー
タlに対応したベクトル長の目標音声ベクトルを生成す
る際に入力音声を周期l毎に加算平均しているが、図7
に示すように、入力音声を切り出す位置を、例えば各遅
延パラメータlに対応したベクトル長の入力音声間の相
互相関が最大になるように、微調整し、加算平均すると
してもよい。
【0088】この実施の形態9によれば、目標音声ベク
トルを生成する際の平均化処理において、遅延パラメー
タlに対応したベクトル長の入力音声間の相互相関が大
きくなるように切り出し位置を微調整することにより、
ピッチ周期が変動している入力音声に対しても1ピッチ
周期に対応した歪みが小さい目標音声ベクトルを生成す
ることができ、合成音声の再現性を良好にし、品質を向
上させることができる。
【0089】実施の形態10.図8は、この発明の実施
の形態10である音声符号化装置及び音声復号化装置の
全体構成を示すブロック図である。この図において図1
と同一の部分には同一の符号を付してあるので、説明を
省略する。
【0090】図8において、図1と比べて新たな構成は
次のとおりである。44は入力音声をアップサンプリン
グする入力音声アップサンプリング手段、45はピッチ
周期に対応したベクトル長の目標音声ベクトルを生成す
る目標音声生成手段、46、51はピッチ周期に対応し
たベクトル長の駆動音源ベクトルを出力する駆動音源符
号帳、47は駆動音源ベクトルから得られる合成音声ベ
クトルの目標音声ベクトルに対する歪みを評価し、歪み
が最小となる駆動音源ベクトルを探索する駆動音源探索
手段、48は第2の駆動音源ベクトル探索におけるピッ
チ周期に対応したベクトル長の目標音声ベクトルを生成
する第2の目標音声生成手段、49、54はピッチ周期
に対応したベクトル長の第2の駆動音源ベクトルを出力
する第2の駆動音源符号帳、50は第2の駆動音源ベク
トルから得られる合成音声ベクトルの第2の目標音声ベ
クトルに対する歪みを評価し、歪みが最小となる駆動音
源ベクトルを探索する第2の駆動音源探索手段、52は
ピッチ周期に対応したベクトル長の駆動音源信号を復号
化する駆動音源復号化手段、53はピッチ周期に対応し
たベクトル長の駆動音源信号からフレーム長の駆動音源
信号を生成するフレーム音源生成手段、55はピッチ周
期に対応したベクトル長の第2の駆動音源信号を復号化
する第2の駆動音源復号化手段、56はピッチ周期に対
応したベクトル長の第2の駆動音源信号からフレーム長
の駆動音源信号を生成する第2のフレーム音源生成手段
である。
【0091】以下、上記の新たな構成を中心に動作を説
明する。まず、符号化部1において、ピッチ分析手段2
5は入力音声5を分析してピッチ周期Pを抽出し、多重
化手段3、入力音声アップサンプリング手段44、目標
音声生成手段45、駆動音源符号帳46、第2の駆動音
源符号帳49に出力する。ここで、ピッチ周期Pは整数
値の他、非整数有理数もとり、Pの存在範囲に応じて、
例えばPint を整数値ピッチ周期とした場合に以下の値
をとり得るとする。 P<45 の場合、Pint ,Pint +1/4,P
int +1/2,Pint +3/4 45≦P<65 の場合、Pint ,Pint +1/2 65≦P の場合、Pint
【0092】入力音声アップサンプリング手段44はピ
ッチ分析手段25から入力されたピッチ周期に応じたサ
ンプリングレートに入力音声5を、例えば音源信号を符
号化する単位であるフレーム区間でアップサンプリング
し、目標音声生成手段45に出力する。ここで、アップ
サンプリングレートは、例えば以下のように決定する。 P<45 の場合、4倍にアップサンプリングす
る。 45≦P≦65 の場合、2倍にアップサンプリングす
る。 65≦P の場合、アップサンプリングしない。
【0093】目標音声生成手段45は前記入力音声アッ
プサンプリング手段44から入力されたアップサンプリ
ングしたフレーム長の入力音声を、ピッチ分析手段25
から入力されるピッチ周期Pに対応して、例えば周期P
毎に加算平均することにより、ベクトル長Pの目標音声
ベクトルを生成し、駆動音源探索手段47と第2の目標
音声生成手段48に出力する。ここで、P≧フレーム長
の場合は前記加算平均を行なわず、フレーム長の入力音
声を目標音声ベクトルとする。
【0094】駆動音源符号帳46には、例えばランダム
雑音から生成したN個の駆動音源ベクトルが記憶されて
おり、駆動音源探索手段47より入力される駆動音源符
号iに対応した駆動音源ベクトルを前記ピッチ分析手段
25より入力されたピッチ周期Pに対応したベクトル長
で切り出し、出力する。ここで、P≧フレーム長の場合
は、フレーム長の駆動音源ベクトルを出力する。
【0095】駆動音源探索手段47はN個の駆動音源ベ
クトルに対して、前記駆動音源符号帳46から入力され
る切り出した駆動音源ベクトルを線形予測パラメータ符
号化手段9から入力される量子化した線形予測パラメー
タを用いて線形予測合成して合成音声ベクトルを生成す
る。そして、前記目標音声生成手段45から入力された
目標音声ベクトルと前記合成音声ベクトルとの聴覚重み
付き歪みを求める。次に、前記歪みを比較評価し、前記
歪みが最小になる駆動音源符号Iとそれに対応する駆動
音源利得γを求め、前記駆動音源符号Iと駆動音源利得
γの符号を多重化手段3に出力するとともに、前記駆動
音源符号Iに対応する駆動音源ベクトルに前記駆動音源
利得γを乗じた駆動音源信号を生成し、第2の目標音声
生成手段48に出力する。
【0096】第2の目標音声生成手段48は前記駆動音
源探索手段47から入力された駆動音源信号を線形予測
パラメータ符号化手段9から入力される量子化した線形
予測パラメータを用いて線形予測合成して合成音声ベク
トルを生成する。そして、前記目標音声生成手段45か
ら入力された目標音声ベクトルと前記合成音声ベクトル
との差分を求め、これを第2の目標音声ベクトルとして
第2の駆動音源探索手段50に出力する。
【0097】第2の駆動音源符号帳49には、例えばラ
ンダム雑音から生成したN個の駆動音源ベクトルが記憶
されており、第2の駆動音源探索手段50より入力され
る駆動音源符号jに対応した第2の駆動音源ベクトルを
前記ピッチ分析手段25から入力されたピッチ周期Pに
対応したベクトル長で切り出し、出力する。ここで、P
≧フレーム長の場合は、フレーム長の駆動音源ベクトル
を出力する。
【0098】第2の駆動音源探索手段50はN個の駆動
音源ベクトルに対して、前記第2の駆動音源符号帳49
から入力される切り出した第2の駆動音源ベクトルを前
記線形予測パラメータ符号化手段9から入力される量子
化した線形予測パラメータを用いて線形予測合成して合
成音声ベクトルを生成する。そして、前記第2の目標音
声生成手段48から入力された第2の目標音声ベクトル
と前記合成音声ベクトルとの聴覚重み付き歪みを求め
る。次に、前記歪みを比較評価し、前記歪みが最小にな
る第2の駆動音源符号Jとそれに対応する第2の駆動音
源利得γ2 を求め、前記第2の駆動音源符号Jと第2の
駆動音源利得γ2 の符号を多重化手段3に出力する。
【0099】以上符号化が終了した後、多重化手段3は
前記量子化した線形予測パラメータに対応する符号、ピ
ッチ周期P、駆動音源符号I、J、及び音源利得γ、γ
2 に対応する符号を伝送路6に送出する。以上がこの実
施の形態10の音声符号化装置に特徴的な動作である。
【0100】つづいて、復号化部2について説明する。
まず多重化手段3の出力を受けた分離手段4は、 線形予測パラメータの符号→線形予測パラメータ復号化
手段16 ピッチ周期P→駆動音源符号帳51、第2の駆動音源符
号帳54 駆動音源符号I、音源利得γの符号→駆動音源復号化手
段52 第2の駆動音源符号J、音源利得γ2 の符号→第2の駆
動音源復号化手段55にそれぞれ出力する。
【0101】駆動音源符号帳51は符号化側の駆動音源
符号帳46と同じN個の駆動音源ベクトルが記憶されて
おり、駆動音源復号化手段52より入力される駆動音源
符号Iに対応した駆動音源ベクトルを前記ピッチ周期P
に対応したベクトル長で切り出し、駆動音源復号化手段
52に出力する。
【0102】駆動音源復号化手段52は、前記駆動音源
利得γの符号から駆動音源利得γを復号化し、前記駆動
音源符号帳51から入力された切り出した駆動音源ベク
トルに前記駆動音源利得γを乗じた駆動音源信号を生成
し、フレーム音源生成手段53に出力する。フレーム音
源生成手段53は前記駆動音源復号化手段52から入力
された駆動音源信号から、例えば周期P毎に繰り返して
周期化して、フレーム長の駆動音源信号を生成し、音源
信号生成手段21に出力する。
【0103】第2の駆動音源符号帳54は符号化側の第
2の駆動音源符号帳49と同じN個の駆動音源ベクトル
が記憶されており、第2の駆動音源復号化手段55より
入力される第2の駆動音源符号Jに対応した第2の駆動
音源ベクトルを前記ピッチ周期Pに対応したベクトル長
で切り出し、第2の駆動音源復号化手段55に出力す
る。
【0104】第2の駆動音源復号化手段55は、前記第
2の駆動音源利得γ2 の符号から駆動音源利得γ2 を復
号化し、前記第2の駆動音源符号帳54から入力された
切り出した第2の駆動音源ベクトルに前記駆動音源利得
γ2 を乗じた第2の駆動音源信号を生成し、第2のフレ
ーム音源生成手段56に出力する。第2のフレーム音源
生成手段56は前記第2の駆動音源復号化手段55から
入力された第2の駆動音源信号から、例えば周期P毎に
繰り返して周期化して、第2のフレーム長の駆動音源信
号を生成し、音源信号生成手段21に出力する。
【0105】音源信号生成手段21は前記フレーム音源
生成手段53から入力されたフレーム長の駆動音源信号
と前記第2のフレーム音源生成手段56から入力された
第2のフレーム長の駆動音源信号とを加算して音源信号
を生成し、合成フィルタ22に出力する。合成フィルタ
22は前記音源信号生成手段21から入力された音源信
号を、線形予測パラメータ復号化手段16から入力され
る線形予測パラメータを用いて線形予測合成し、出力音
声7を出力する。以上がこの実施の形態10の音声復号
化装置に特徴的な動作である。
【0106】この実施の形態10によれば、入力音声の
ピッチ周期Pがフレーム長より短い場合は入力音声を周
期的に加算平均してベクトル長Pの目標音声ベクトルを
生成し、これに対してベクトル長Pの駆動音源ベクトル
を線形予測合成して生成した合成音声ベクトルとの歪み
を評価することにより、合成音声の品質の劣化を回避
し、少ない演算量で品質の良い合成音声を生成すること
ができる。
【0107】
【発明の効果】以上詳述したように、請求項1〜請求項
4、請求項6、請求項9、請求項14、請求項16〜請
求項23に記載の発明によれば、音声符号化装置に、入
力音声から遅延パラメータに対応したベクトル長の目標
音声ベクトルを生成する目標音声生成手段と、過去に生
成した音源信号から前記遅延パラメータに対応したベク
トル長の適応音源ベクトルを生成する適応音源符号帳
と、前記適応音源ベクトルから得られる合成音声ベクト
ルの前記目標音声ベクトルに対する歪みを評価し、歪み
が最小となる適応音源ベクトルを探索する適応音源探索
手段と、前記歪みが最小となる適応音源ベクトルからフ
レーム長の音源信号を生成するフレーム音源生成手段と
を備えているので、合成音声の品質の劣化を回避し、少
ない演算量で品質の良い合成音声を生成することができ
る。
【0108】また、請求項5に記載の発明によれば、目
標音声ベクトルのベクトル長が有理数をとるようにした
ので、入力音声から目標音声ベクトルを生成する際に、
入力音声のサンプリング周期に因らず精度良く目標音声
ベクトルを生成することができ、合成音声の品質の劣化
を回避し、少ない演算量で品質の良い合成音声を生成す
ることができる。
【0109】また、請求項7に記載の発明によれば、目
標音声生成手段は遅延パラメータに対応したベクトル長
の整数倍長の入力音声をベクトル長毎に分割し、前記ベ
クトル長毎の入力音声を加重平均して目標音声ベクトル
を生成するものとしたので、目標音声ベクトルを生成す
る際の平均化処理において、ベクトル長が異なるベクト
ルを扱う必要がなく、簡易に処理することができ、合成
音声の品質の劣化を回避し、少ない演算量で品質の良い
合成音声を生成することができる。
【0110】また、請求項8に記載の発明によれば、目
標音声ベクトルを生成するベクトル長の整数倍長の入力
音声をフレーム長以上とするものとしたので、フレーム
長を越えた入力音声を音声符号化する際の評価に用いる
ことにより、該フレームの合成音声が該フレーム以後に
与える影響も加味して符号を決定することになり、合成
音声の再現性を良好にし、品質を向上させることができ
る。
【0111】また、請求項10に記載の発明によれば、
ベクトル長毎の入力音声に関わる特徴量は少なくとも入
力音声のパワー情報を含むようにしたので、入力音声の
パワーが大きい部分により重みをつけて音声符号化する
ことにより、主観品質に与える影響が大きい合成音声の
パワーの大きな部分の再現性が良好になり、品質を向上
させることができる。
【0112】また、請求項11に記載の発明によれば、
ベクトル長毎の入力音声に関わる特徴量は少なくとも入
力音声の相関情報を含むようにしたので、入力音声が周
期lの周期性をもつとした場合に相関が低い部分の重み
を小さくして音声符号化することにより、ピッチ周期が
変動している入力音声に対しても1ピッチ周期に対応し
た歪みが小さい目標音声ベクトルを生成することがで
き、合成音声の再現性を良好にし、品質を向上させるこ
とができる。
【0113】また、請求項12に記載の発明によれば、
目標音声生成手段はベクトル長毎の入力音声の時間関係
に応じて、入力音声を前記ベクトル長毎に加重平均して
目標音声ベクトルを生成する際の重みを決定するように
したので、フレーム境界近傍の入力音声に重みを大きく
して目標音声ベクトルを生成し、符号化することによ
り、フレーム境界近傍の合成音声の再現性を良好にする
ことができ、フレーム間の合成音声の変化を滑らかにす
ることができる。
【0114】また、請求項13に記載の発明によれば、
目標音声生成手段は入力音声をベクトル長毎に加重平均
する際、前記ベクトル長毎の入力音声の時間関係を微調
整するようにしたので、ベクトル長lの入力音声間の相
互関係が大きくなるように切り出し位置を微調整するこ
とにより、ピッチ周期が変動している入力音声に対して
も1ピッチ周期に対応した歪みが小さい目標音声ベクト
ルを生成することができ、合成音声の再現性を良好に
し、品質を向上させることができる。
【0115】また、請求項15に記載の発明によれば、
フレーム音源生成手段はベクトル長の音源ベクトルをフ
レーム間で補間して音源信号を生成するようにしたの
で、フレーム間の音源信号の変化が滑らかになり、合成
音声の再現性を良好にし、品質を向上させることができ
る。
【図面の簡単な説明】
【図1】 この発明の実施の形態1である音声符号化装
置及び音声復号化装置の全体構成を示すブロック図であ
る。
【図2】 この発明の実施の形態1における目標音声生
成手段の動作の一例を示す説明図である。
【図3】 この発明の実施の形態5における目標音声生
成手段の動作の一例を示す説明図である。
【図4】 この発明の実施の形態6における目標音声生
成手段の動作の一例を示す説明図である。
【図5】 この発明の実施の形態7における目標音声生
成手段の動作の一例を示す説明図である。
【図6】 この発明の実施の形態8における目標音声生
成手段の動作の一例を示す説明図である。
【図7】 この発明の実施の形態9における目標音声生
成手段の動作の一例を示す説明図である。
【図8】 この発明の実施の形態10である音声符号化
装置及び音声復号化装置の全体構成を示すブロック図で
ある。
【図9】 従来の音声符号化復号化装置の一例の全体構
成を示すブロック図である。
【図10】 従来の音声符号化復号化装置における適応
音源ベクトルの一例を示す説明図である。
【図11】 従来の改良された音声符号化復号化装置に
おける適応音源ベクトルの一例を示す説明図である。
【図12】 従来の音声符号化復号化装置の他の異なる
一例の全体構成を示すブロック図である。
【図13】 従来の音声符号化復号化装置における周期
化した駆動音源ベクトルの一例を示す説明図である。
【符号の説明】
1 符号化部、2 復号化部、3 多重化手段、4 分
離手段、5 入力音声、6 伝送路、7 出力音声、8
線形予測パラメータ分析手段、9 線形予測パラメー
タ符号化手段、10、17 適応音源符号帳、11 適
応音源探索手段、12 誤差信号生成手段、13、19
駆動音源符号帳、14 駆動音源探索手段、15、2
1 音源信号生成手段、16 線形予測パラメータ復号
化手段、18 適応音源復号化手段、20 駆動音源復
号化手段、22 合成フィルタ、23、24 駆動音源
符号帳、25 ピッチ分析手段、26 遅延パラメータ
探索範囲決定手段、27 入力音声アップサンプリング
手段、28 目標音声生成手段、29 37 音源信号
アップサンプリング手段、30、38 適応音源符号
帳、31 適応音源探索手段、32、40 フレーム音
源生成手段、33 第2の目標音声生成手段、34、4
1 駆動音源符号帳、35 駆動音源探索手段、36、
43 第2のフレーム音源生成手段、39 適応音源復
号化手段、42駆動音源復号化手段、44 入力音声ア
ップサンプリング手段、45 目標音声生成手段、4
6、51 駆動音源符号帳、47 駆動音源探索手段、
48 第2の目標音声生成手段、49、54 第2の駆
動音源符号帳、50 第2の駆動音源探索手段、52
駆動音源復号化手段、53 フレーム音源生成手段、5
5第2の駆動音源復号化手段、56 第2のフレーム音
源生成手段。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−84699(JP,A) 特開 平5−289696(JP,A) 特開 平6−250694(JP,A) 特開 平7−56599(JP,A) 特開 平7−261796(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04

Claims (22)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声をスペクトル包絡情報と音源信
    号情報に分けて、フレーム単位に音源信号情報を符号化
    する音声符号化装置において、入力音声を遅延パラメー
    タに対応したベクトル長毎に分割し、ベクトル長毎の入
    力音声を加重平均して目標音声ベクトルを生成する目標
    音声生成手段と、過去に生成した音源信号から前記遅延
    パラメータに対応したベクトル長の適応音源ベクトルを
    生成する適応音源符号帳と、前記適応音源ベクトルから
    得られる合成音声ベクトルの前記目標音声ベクトルに対
    する歪みを評価し、歪みが最小となる適応音源ベクトル
    を探索する適応音源探索手段と、前記歪みが最小となる
    適応音源ベクトルからフレーム長の音源信号を生成する
    フレーム音源生成手段とを備えたことを特徴とする音声
    符号化装置。
  2. 【請求項2】 目標音声ベクトルと歪みが最小となる適
    応音源ベクトルから第2の目標音声ベクトルを生成する
    第2の目標音声生成手段と、遅延パラメータに対応した
    ベクトル長の駆動音源ベクトルを生成する駆動音源符号
    帳と、前記駆動音源ベクトルから得られる第2の合成音
    声ベクトルの前記第2の目標音声ベクトルに対する歪み
    を評価し、歪みが最小となる駆動音源ベクトルを探索す
    る駆動音源探索手段と、前記歪みが最小となる駆動音源
    ベクトルから第2のフレーム長の音源信号を生成する第
    2のフレーム音源生成手段とを備えたことを特徴とする
    請求項1記載の音声符号化装置。
  3. 【請求項3】 入力音声をスペクトル包絡情報と音源信
    号情報に分けて、フレーム単位に音源信号情報を符号化
    する音声符号化装置において、入力音声を遅延パラメー
    タに対応したベクトル長毎に分割し、ベクトル長毎の入
    力音声を加重平均して目標音声ベクトルを生成する目標
    音声生成手段と、遅延パラメータに対応したベクトル長
    の駆動音源ベクトルを生成する駆動音源符号帳と、前記
    駆動音源ベクトルから得られる合成音声ベクトルの前記
    目標音声ベクトルに対する歪みを評価し、歪みが最小と
    なる駆動音源ベクトルを探索する駆動音源探索手段と、
    前記歪みが最小となる駆動音源ベクトルからフレーム長
    の音源信号を生成するフレーム音源生成手段とを備えた
    ことを特徴とする音声符号化装置。
  4. 【請求項4】 遅延パラメータは入力音声のピッチ周期
    に対応して決定することを特徴とする請求項3記載の音
    声符号化装置。
  5. 【請求項5】 遅延パラメータに対応したベクトル長が
    有理数をとることを特徴とする請求項1〜請求項3のい
    ずれかに記載の音声符号化装置。
  6. 【請求項6】 目標音声生成手段は、遅延パラメータに
    対応したベクトル長の整数倍長の入力音声をベクトル長
    毎に分割し、ベクトル長毎の入力音声を加重平均して目
    標音声ベクトルを生成することを特徴とする請求項1〜
    請求項3のいずれかに記載の音声符号化装置。
  7. 【請求項7】 遅延パラメータに対応したベクトル長の
    整数倍長はフレーム長以上とすることを特徴とする請求
    記載の音声符号化装置。
  8. 【請求項8】 目標音声生成手段は、遅延パラメータに
    対応したベクトル長毎の入力音声に関わる特徴量に応じ
    て、入力音声をベクトル長毎に加重平均して目標音声ベ
    クトルを生成する際の重みを決定することを特徴とする
    請求項6記載の音声符号化装置。
  9. 【請求項9】 遅延パラメータに対応したベクトル長毎
    の入力音声に関わる特徴量は少なくとも入力音声のパワ
    ー情報を含むことを特徴とする請求項記載の音声符号
    化装置。
  10. 【請求項10】 遅延パラメータに対応したベクトル長
    毎の入力音声に関わる特徴量は少なくとも入力音声の相
    関情報を含むことを特徴とする請求項に記載の音声符
    号化装置。
  11. 【請求項11】 目標音声生成手段は、遅延パラメータ
    に対応したベクトル長毎の入力音声の時間関係に応じ
    て、入力音声をベクトル長毎に加重平均して目標音声ベ
    クトルを生成する際の重みを決定することを特徴とする
    請求項6記載の音声符号化装置。
  12. 【請求項12】 目標音声生成手段は、入力音声を遅延
    パラメータに対応したベクトル長毎に加重平均する際、
    ベクトル長毎の入力音声の時間関係を微調整することを
    特徴とする請求項6記載の音声符号化装置。
  13. 【請求項13】 フレーム音源生成手段は、遅延パラメ
    ータに対応したベクトル長の音源ベクトルをベクトル長
    毎に繰り返して周期化し、フレーム長の音源信号を生成
    することを特徴とする請求項1〜請求項3のいずれかに
    記載の音声符号化装置。
  14. 【請求項14】 フレーム音源生成手段は、遅延パラメ
    ータに対応したベクトル長の音源ベクトルをフレーム間
    で補間して音源信号を生成することを特徴とする請求項
    1〜請求項3のいずれかに記載の音声符号化装置。
  15. 【請求項15】 適応音源探索手段は合成フィルタを備
    え、この合成フィルタのインパルス応答を用いて、適応
    音源ベクトルから得られる合成音声ベクトルの目標音声
    ベクトルに対する歪みを反復的に計算することを特徴と
    する請求項1記載の音声符号化装置。
  16. 【請求項16】 入力音声をアップサンプリングする入
    力音声アップサンプリング手段を備え、目標音声生成手
    段はアップサンプリングされた入力音声から目標音声ベ
    クトルを生成することを特徴とする請求項5記載の音声
    符号化装置。
  17. 【請求項17】 過去に生成された音源信号をアップサ
    ンプリングする音源信号アップサンプリング手段を備
    え、適応音源符号帳はアップサンプリングされた過去に
    生成された音源信号から適応音源ベクトルを生成するこ
    とを特徴とする請求項5記載の音声符号化装置。
  18. 【請求項18】 アップサンプリング手段は遅延パラメ
    ータに対応してアップサンプリング倍率を変更すること
    を特徴とする請求項16又は請求項17記載の音声符号
    化装置。
  19. 【請求項19】 アップサンプリング手段は、遅延パラ
    メータに対応したベクトル長に応じた範囲のみ入力音声
    または音源信号のアップサンプリング倍率を変更するこ
    とを特徴とする請求項16又は請求項17記載の音声符
    号化装置。
  20. 【請求項20】 入力音声をスペクトル包絡情報と音源
    信号情報に分けて、フレーム単位に音源信号情報を符号
    化し、符号化された音源信号情報を復号化して出力音声
    を生成する音声符号化復号化装置において、符号化側
    に、入力音声を遅延パラメータに対応したベクトル長毎
    に分割し、ベクトル長毎の入力音声を加重平均して目標
    音声ベクトルを生成する目標音声生成手段と、過去に生
    成した音源信号から前記遅延パラメータに対応したベク
    トル長の適応音源ベクトルを生成する適応音源符号帳
    と、前記適応音源ベクトルから得られる合成音声ベクト
    ルの前記目標音声ベクトルに対する歪みを評価し、歪み
    が最小となる適応音源ベクトルを探索する適応音源探索
    手段と、前記歪みが最小となる適応音源ベクトルからフ
    レーム長の音源信号を生成するフレーム音源生成手段と
    を備える一方、復号化側に、遅延パラメータに対応した
    ベクトル長の適応音源ベクトルを生成する適応音源符号
    帳と、適応音源ベクトルからフレーム長の音源信号を生
    成するフレーム音源生成手段とを備えることを特徴とす
    る音声符号化復号化装置。
  21. 【請求項21】 符号化側に、目標音声ベクトルと適応
    音源ベクトルから第2の目標音声ベクトルを生成する第
    2の目標音声生成手段と、遅延パラメータに対応したベ
    クトル長の駆動音源ベクトルを生成する駆動音源符号帳
    と、前記駆動音源ベクトルから得られる第2の合成音声
    ベクトルの前記第2の目標音声ベクトルに対する歪みを
    評価し、歪みが最小となる駆動音源ベクトルを探索する
    駆動音源探索手段と、前記歪みが最小となる駆動音源ベ
    クトルから第2のフレーム長の音源信号を生成する第2
    のフレーム音源生成手段とを備える一方、復号化側に、
    遅延パラメータに対応したベクトル長の駆動音源ベクト
    ルを生成する駆動音源符号帳と、駆動音源ベクトルから
    第2のフレーム長の音源信号を生成する第2のフレーム
    音源生成手段とを備えることを特徴とする請求項20
    載の音声符号化復号化装置。
  22. 【請求項22】 入力音声をスペクトル包絡情報と音源
    信号情報に分けて、フレーム単位に音源信号情報を符号
    化し、符号化された音源信号情報を復号化して出力音声
    を生成する音声符号化復号化装置において、符号化側
    に、入力音声を遅延パラメータに対応したベクトル長毎
    に分割し、ベクトル長毎の入力音声を加重平均して目標
    音声ベクトルを生成する目標音声生成手段と、遅延パラ
    メータに対応したベクトル長の駆動音源ベクトルを生成
    する駆動音源符号帳と、前記駆動音源ベクトルから得ら
    れる合成音声ベクトルの前記目標音声ベクトルに対する
    歪みを評価し、歪みが最小となる駆動音源ベクトルを探
    索する駆動音源探索手段と、前記歪みが最小となる駆動
    音源ベクトルからフレーム長の音源信号を生成するフレ
    ーム音源生成手段とを備える一方、復号化側に、遅延パ
    ラメータに対応したベクトル長の駆動音源ベクトルを生
    成する駆動音源符号帳と、駆動音源ベクトルからフレー
    ム長の音源信号を生成するフレーム音源生成手段とを備
    えることを特徴とする音声符号化復号化装置。
JP13524096A 1996-05-29 1996-05-29 音声符号化装置および音声符号化復号化装置 Expired - Lifetime JP3364825B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP13524096A JP3364825B2 (ja) 1996-05-29 1996-05-29 音声符号化装置および音声符号化復号化装置
TW085115514A TW317631B (en) 1996-05-29 1996-12-16 Speech encoding device and speech decoding device
US08/777,874 US6052661A (en) 1996-05-29 1996-12-31 Speech encoding apparatus and speech encoding and decoding apparatus
CA002194513A CA2194513C (en) 1996-05-29 1997-01-07 Speech encoding apparatus and speech encoding and decoding apparatus
KR1019970001026A KR100218214B1 (ko) 1996-05-29 1997-01-15 음성 부호화 장치 및 음성 부호화 복호화 장치
EP97101441A EP0810585B1 (en) 1996-05-29 1997-01-30 Speech encoding and decoding apparatus
DE69720855T DE69720855D1 (de) 1996-05-29 1997-01-30 Vorrichtung zur Kodierung und Dekodierung von Sprache
CNB971029393A CN1151491C (zh) 1996-05-29 1997-03-12 音频编码装置和音频编码译码装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13524096A JP3364825B2 (ja) 1996-05-29 1996-05-29 音声符号化装置および音声符号化復号化装置

Publications (2)

Publication Number Publication Date
JPH09319396A JPH09319396A (ja) 1997-12-12
JP3364825B2 true JP3364825B2 (ja) 2003-01-08

Family

ID=15147096

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13524096A Expired - Lifetime JP3364825B2 (ja) 1996-05-29 1996-05-29 音声符号化装置および音声符号化復号化装置

Country Status (8)

Country Link
US (1) US6052661A (ja)
EP (1) EP0810585B1 (ja)
JP (1) JP3364825B2 (ja)
KR (1) KR100218214B1 (ja)
CN (1) CN1151491C (ja)
CA (1) CA2194513C (ja)
DE (1) DE69720855D1 (ja)
TW (1) TW317631B (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19729494C2 (de) * 1997-07-10 1999-11-04 Grundig Ag Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte
KR100938017B1 (ko) * 1997-10-22 2010-01-21 파나소닉 주식회사 벡터 양자화 장치 및 방법
IL136722A0 (en) * 1997-12-24 2001-06-14 Mitsubishi Electric Corp A method for speech coding, method for speech decoding and their apparatuses
JP3268750B2 (ja) * 1998-01-30 2002-03-25 株式会社東芝 音声合成方法及びシステム
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6507814B1 (en) 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
FI111438B (fi) * 1999-07-09 2003-07-15 Nokia Corp Symbolijonon lähetysmenetelmä
JP4792613B2 (ja) * 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
JP3404024B2 (ja) 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
EP1887567B1 (en) * 2005-05-31 2010-07-14 Panasonic Corporation Scalable encoding device, and scalable encoding method
US8108219B2 (en) * 2005-07-11 2012-01-31 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
ES2950794T3 (es) * 2011-12-21 2023-10-13 Huawei Tech Co Ltd Detección y codificación de altura tonal muy débil
US9524727B2 (en) * 2012-06-14 2016-12-20 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for scalable low-complexity coding/decoding
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
CN104143335B (zh) 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4910781A (en) 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching
US5235670A (en) * 1990-10-03 1993-08-10 Interdigital Patents Corporation Multiple impulse excitation speech encoder and decoder
US5195168A (en) * 1991-03-15 1993-03-16 Codex Corporation Speech coder and method having spectral interpolation and fast codebook search
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
JP3275247B2 (ja) * 1991-05-22 2002-04-15 日本電信電話株式会社 音声符号化・復号化方法
US5305421A (en) * 1991-08-28 1994-04-19 Itt Corporation Low bit rate speech coding system and compression
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
JPH07334194A (ja) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd 音声符号化/復号化方法およびそれらの装置

Also Published As

Publication number Publication date
TW317631B (en) 1997-10-11
CN1170189A (zh) 1998-01-14
CN1151491C (zh) 2004-05-26
EP0810585A3 (en) 1998-11-11
KR100218214B1 (ko) 1999-09-01
KR970076487A (ko) 1997-12-12
EP0810585B1 (en) 2003-04-16
CA2194513A1 (en) 1997-11-30
US6052661A (en) 2000-04-18
CA2194513C (en) 2001-05-15
DE69720855D1 (de) 2003-05-22
EP0810585A2 (en) 1997-12-03
JPH09319396A (ja) 1997-12-12

Similar Documents

Publication Publication Date Title
JP3364825B2 (ja) 音声符号化装置および音声符号化復号化装置
EP1157375B1 (en) Celp transcoding
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
EP1202251B1 (en) Transcoder for prevention of tandem coding of speech
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP2940005B2 (ja) 音声符号化装置
JP2002268690A (ja) 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
EP1688920B1 (en) Speech signal decoding
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP2002229599A (ja) 音声符号列の変換装置および変換方法
JPH086597A (ja) 音声の励振信号符号化装置および方法
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3598111B2 (ja) 広帯域音声復元装置
KR20050061579A (ko) 트랜스코더 및 부호변환방법
JPH0990997A (ja) 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ
JPH04301900A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3148920B2 (ja) 音声符号化復号化装置
JP3560964B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3598112B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3773509B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法
JP3748080B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JPH09166999A (ja) 音声符号化装置及び音声符号化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071101

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081101

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081101

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091101

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091101

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101101

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111101

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121101

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131101

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term