JPH06266399A - 符号化装置及び音声符号化復号化装置 - Google Patents

符号化装置及び音声符号化復号化装置

Info

Publication number
JPH06266399A
JPH06266399A JP5049474A JP4947493A JPH06266399A JP H06266399 A JPH06266399 A JP H06266399A JP 5049474 A JP5049474 A JP 5049474A JP 4947493 A JP4947493 A JP 4947493A JP H06266399 A JPH06266399 A JP H06266399A
Authority
JP
Japan
Prior art keywords
excitation
codebook
signal
speech
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5049474A
Other languages
English (en)
Other versions
JP3431655B2 (ja
Inventor
Katsushi Seza
勝志 瀬座
Hirohisa Tazaki
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP04947493A priority Critical patent/JP3431655B2/ja
Publication of JPH06266399A publication Critical patent/JPH06266399A/ja
Application granted granted Critical
Publication of JP3431655B2 publication Critical patent/JP3431655B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 入力音声をスペクトルパラメータと音源信号
に分離して固定時間長のフレーム毎に符号化する装置に
おいて、復号音声の品質を改善する。 【構成】 合成音声と入力音声の歪を最小にする音源モ
デル符号語とスペクトル符号語の組み合わせを探索し、
第一の符号探索結果28を出力する第一の符号探索手段
と、第一または第二の量子化音源信号9,10を適応音
源信号として格納した適応音源符号帳6と、駆動音源符
号帳2内の駆動音源符号語より駆動音源信号を生成する
駆動音源生成手段4と、適応音源信号と駆動音源信号を
用いて生成した第二の量子化音源信号10とのスペクト
ル歪を最小にするスペクトル符号語を用いて生成した合
成音声と入力音声の歪を最小にする駆動音源符号語を探
索し、第二の符号探索結果13として出力する第二の符
号探索手段と、第一と第二の符号探索結果のうち一方を
出力する符号化手段選択手段16を備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声をディジタル伝
送あるいは蓄積する場合に用いられる音声符号化復号化
装置に関するものである。
【0002】
【従来の技術】入力音声を、スペクトルパラメータと音
源信号に分離して固定時間長のフレーム毎に符号化する
従来の音声符号化復号化装置は、文献1”声門音源波モ
デルを用いた音声の分析合成方式の検討”(瀬座勝志、
田崎裕久、中島邦男、日本音響学会秋季研究発表会、1
−6−10、PP209−210、1991)により報
告されている。この従来法においては、音源信号の符号
化に声門音源波の微分波形上で定義される音源モデルを
用い、スペクトルパラメータとして自己回帰係数(以下
ARと略す)及び移動平均係数(以下MAと略す)を用
いている。前述した文献では、2〜3Kbps程度の低
ビットレート音声伝送において高品質な復号音声を得る
方式として声帯音源波モデルを用いた分析合成方式(F
VQ−GARMA)を検討している。そこでは、声帯音
源波モデル、ARパラメータ、及びMAパラメータを全
てベクトル量子化することにより、自然性の高い復号音
声が得られることを明かにしている。しかし、声帯音源
波モデルの予備選択に用いる音源ピーク位置の抽出誤り
や、声帯音源波モデルをマッチングする位置(音源位
置)の伝送を行わないことにより復号音声に劣化を生ず
る場合があった。従来のFVQ−GARMA方式は、声
帯音源波モデルでARMAフィルタを駆動することによ
って有声音を生成するものである。声帯音源波モデルに
は声帯音源波の微分波形上で定義されるモデルを用いて
いる。符号化部では声帯音源波モデル、AR及びMAパ
ラメータをベクトル量子化する際に、予備選択された各
コードの全ての組み合わせの中からSNRsegが最大
になる組み合わせをフレームに一組選択する。復号化部
では各フレームで得られたコードをそれぞれ補間しなが
ら合成する。
【0003】図14及び図15は従来の分析合成方式
(FVQ−GARMA)による音声符号化復号化装置の
構成図である。図14は符号化部を示し、図15は復号
化部を示している。図14及び図15において、1は入
力音声、11はAR符号帳、12はAR符号語、14は
ピッチ周期抽出手段、15はピッチ周期、19は音源開
始位置抽出手段、20は音源開始位置、21は音源モデ
ル符号帳、22は音源モデル符号語、23は音源モデル
生成手段、26はMA符号帳、27はMA符号語、29
は音源モデル符号帳、30は音源モデル符号語、31は
音源モデル生成手段、34はMA符号帳、35はMA符
号語、37は復号音声、44はAR符号帳、45はAR
符号語、56は符号化結果、57は符号探索手段、58
は復号化手段、59は量子化音源信号、60は量子化音
源信号である。
【0004】まず、図14の符号化部について説明す
る。AR符号帳11には典型的なARをAR符号語とし
て複数個格納し、MA符号帳26には典型的なMAをM
A符号語として複数個格納し、音源モデル符号帳21に
は一ピッチ周期の音源信号を表す音源モデルのパラメー
タの典型的なものを音源モデル符号語として複数個格納
してある。ピッチ周期抽出手段14は入力音声1よりピ
ッチ周期15を抽出し出力する。音源開始位置抽出手段
19は先行フレームが無声で当該フレームが有声の場
合、入力音声1より音源開始位置20を抽出し出力す
る。音源モデル生成手段23は音源モデル符号帳21よ
り出力される音源モデル符号語22より生成される一ピ
ッチ周期の音源信号をピッチ周期15で繰り返した信号
を生成し、量子化音源信号59として出力する。符号探
索手段57は、音源開始位置20とAR符号語12と量
子化音源信号59とMA符号語27を用いて合成音声を
生成し、入力音声1と合成音声の歪を最小にするAR符
号語とMA符号語と音源符号語の組み合わせを探索し、
符号化結果56として出力する。
【0005】図16は有声音の先頭フレームでの符号探
索手段57の動作を説明するものである。図において実
線で示される量子化音源信号及び合成音声は当該フレー
ムでの信号を、点線で示される量子化音源信号及び合成
音声は次フレームでの信号を示す。符号探索手段57
は、有声フレームにおいてピッチ周期を単位とした入力
音声を符号化する。当該フレームが有声音の先頭である
場合は、音源開始位置20からピッチ周期単位で量子化
音源信号59を並べた場合に当該フレームを超える範囲
の入力音声1を当該フレームの符号化対象とし、合成音
声を生成する。
【0006】図16においては、音源開始位置20から
ピッチ周期P1,P2までが現在のフレームの符号化対
象として合成音声が生成される。符号化はピッチ周期を
単位として行われるため、フレームの区切りとピッチ周
期の区切りは一致せず、この例では、時刻T3は時刻F
2とは一致せず、時刻T3−時刻F2の時間だけ、現在
のフレームを超えて符号化が行われる。有声音の先頭フ
レーム以外の有声フレームの場合、量子化音源信号59
を先行フレームでの量子化音源信号に引き続いて当該フ
レームを超えるまで並べて合成音声を生成する。図にお
いては、P2というピッチ周期の次から次フレームのた
めの音声合成が生成される。すなわち、P3,P4,P
5というピッチ周期を用いて次フレームの符号化が行わ
れ合成音声が生成される。
【0007】次に図15の復号化部について説明する。
図においてAR符号帳44、音源モデル符号帳31、M
A符号帳34は、それぞれ符号化部におけるAR符号帳
11、音源モデル符号帳21、MA符号帳26と同じも
のである。音源モデル生成手段31は、ピッチ周期15
と符号化結果56に対応する音源モデル符号帳29内の
音源モデル符号語30を用いて量子化音源信号60を生
成する。復号化手段58は、量子化音源信号60と符号
化結果56に対応するAR符号帳44内のAR符号語4
5とMA符号帳34内のMA符号語35を用いて復号音
声37を生成する。
【0008】図17は復号化手段58の動作を説明する
ものである。復号化手段58は量子化音源信号60を当
該フレームの先頭から当該フレームを超えるまで並べて
復号音声37を生成する。図においては、当該フレーム
の先頭からフレーム周期91,92,93を用いて復号
音声を生成する。復号音声の生成もピッチ周期単位で行
われるため、フレームを超えて復号音声が生成される場
合がある。図17においては、ピッチ周期93の終了時
刻S3はフレームの時刻F2を超えており、当該フレー
ムの時刻F2が終了しても当該フレームのための復号音
声が時刻S3まで生成される。
【0009】次フレームでは、これまで復号された復号
音声に引き続いて点線で示される量子化音源信号60を
並べて復号音声37を生成する。図17においては、ピ
ッチ周期94,95,96が次フレームの復号音声生成
のために用いられる。この次フレームの復号音声生成も
ピッチ周期単位で行われるため、前のフレームの復号音
声生成が前のフレームを超えて行われる場合には、図1
7次に示すように次フレームにおいても、ずれたまま復
号音声を生成する。
【0010】
【発明が解決しようとする課題】従来の音声符号化復号
化装置は、声帯音源波コードの予備選択を音源ピーク位
置と過去のフレームで選択された声帯音源波コードを基
準として行っているが、語頭部分や過度部での音源ピー
ク位置の自動抽出には誤りが多く、予備選択がうまく働
かない場合があった。図18(a)に残差波形、図18
(b)(c)に声帯音源波モデルの微分波形を示す。音
源ピーク位置が正しく抽出されている場合(b)に比
べ、誤って抽出された場合(c)は声帯音源波コードの
選択を誤り、SNRsegは急速に劣化する。このよう
に、音源信号の符号化に音源モデルを用いた量子化音源
信号のみを使っているために音源モデルの適合の悪い話
者の場合に復号音声の品質が劣化する場合があった。ま
た、ピッチ周期に応じて様態が異なるMAと音源モデル
に対して各々固定の符号帳を用いて量子化するために復
号音声の品質が劣化する場合があった。また、符号化部
ではピッチ長を補間により微調整しながら音源を誤り返
した場合にSNRsegが最大になるように有声音の先
頭の音源位置とそのピッチ長を決定しているが、この音
源位置を復号化部に伝送しない構成のため、符号化部と
復号化部で各コードを補間した結果に大きな差異を生じ
復号音声品質が劣化する例があった。すなわち、復号化
部に有声音の先頭フレームにおける音源開始位置が伝送
されないために、図16及び図17に示すように、符号
化部と復号化部において同一フレーム内に含まれる音源
モデルの数が異なる場合がある。この様なフレームにお
いてパワーやピッチ周期の変動が大きいと、復号化部の
第一の量子化音源信号は符号化部の第一の量子化音源信
号との間に大きな差異を生じ、復号音声の品質が劣化す
る場合があった。
【0011】本発明は上記課題を解消するためになされ
たもので、復号音声の品質を向上させることを目的とし
ている。
【0012】
【課題を解決するための手段】この発明の請求項1記載
の発明に係る音声符号化復号化装置は、音質劣化を低減
するため、たとえばGARMAとCELPとのマルチモ
ード化を行い、CELP系で用いられている適応コード
と駆動音源コードを用いた音源(図18(d)参照)を
用いてSNRsegを確保し、FVQ−GARMAを用
いた場合と適応コードブックと駆動音源コードブックを
用いた場合でSNRsegの良い方を選択するようにし
たものである。
【0013】この発明の請求項2記載の発明に係る音声
符号化復号化装置は、符号化部に、第一の量子化音源信
号とスペクトル符号帳内のスペクトル符号語から生成し
た合成音声と入力音声の歪を最小にする音源モデル符号
語とスペクトル符号語の組み合わせを探索し、その探索
結果を第一の符号探索結果としてその時の歪と共に符号
化手段選択手段に出力し、第一の量子化音源信号を適応
音源符号帳に出力する第一の符号探索手段と、先行フレ
ームにおいて求めた第一の量子化音源信号または第二の
量子化音源信号を適応音源信号として格納した適応音源
符号帳と、予め用意された音源信号を駆動音源符号語と
して複数個格納した駆動音源符号帳と、前記駆動音源符
号帳内の駆動音源符号語を前記ピッチ周期で繰り返した
駆動音源信号を生成する駆動音源生成手段と、前記適応
音源符号帳内の適応音源信号と前記駆動音源信号より生
成される第二の量子化音源信号と前記スペクトル符号帳
内のスペクトル符号語を用いて生成した合成音声と入力
音声の歪を最小にする駆動音源符号語を探索し、その探
索結果を第二の符号探索結果としてその時の歪と共に符
号化手段選択手段に出力し、第二の量子化音源信号を適
応音源符号帳に出力する第二の符号探索手段と、前記第
一の符号探索結果と前記第二の符号探索結果の内、より
小さい歪を持つ方を符号化結果として選択し、当該フレ
ームの符号化結果として出力するとともに、どちらの符
号探索結果を選択したのかを符号化手段選択信号として
出力する符号化手段選択手段を備え、復号化部に、符号
化部より入力された符号化手段選択信号に従い第一の復
号化手段と第二の復号化手段を選択する復号化手段選択
手段と、符号化部と同じスペクトル符号帳と、符号化部
と同じ音源モデル符号帳と、第一の量子化音源信号と符
号化部より入力された符号化結果に対応する前記スペク
トル符号帳内のスペクトル符号語を用いて復号音声を生
成する第一の復号化手段と、符号化部と同じ適応音源符
号帳と、符号化部と同じ駆動音源符号帳と、前記符号化
結果に対応する前記駆動音源符号帳内の駆動音源符号語
と前記ピッチ周期から駆動音源信号を生成する駆動音源
生成手段と、前記スペクトル符号語と前記適応音源符号
帳内の適応音源信号と前記駆動音源生成手段の出力する
駆動音源信号より復号音声を生成する第二の復号化手段
を備える。
【0014】本発明の請求項3記載の発明に係わる音声
符号化復号化装置は、符号化部と復号化部の適応音源符
号帳に、第一の量子化音源信号を保持する第一の音源記
憶手段と第二の量子化音源信号を保持する第二の音源記
憶手段と、前記第一の音源記憶手段と前記第二の音源記
憶手段を切り換える符号語切換手段を備え、合成音声と
入力音声の歪を最小にする適応音源信号を前記適応音源
符号帳より選択し、どちらを選択したかを第二の符号化
結果に含めて出力する第二の符号探索手段を備える。
【0015】本発明の請求項4及び請求項5記載の発明
に係わる音声符号化復号化装置の符号化部と復号化部の
スペクトル符号帳、音源モデル符号帳及び駆動音源符号
帳は、それぞれピッチ周期に対応する複数の副符号帳
と、入力されるピッチ周期に応じて前記副符号帳を切り
換える副符号帳切換手段を備える。
【0016】本発明の請求項6及び請求項7記載の発明
に係わる音声符号化復号化装置は、有声音の先頭フレー
ムの音源位置だけを、その直前の無声フレームにおいて
伝送する構成とした。後続するフレームでは符号化部と
復号化部においてピッチ長を補間しながら音源を繰り返
すという同一の処理を行うため、フレーム毎に音源位置
を伝送する必要はない。すなわち、符号化部に有声音の
先頭フレームの場合、入力音声より音源開始位置を抽出
し、先行する無声フレームにおいて復号化部に出力する
音源開始位置抽出手段と、復号化部に、符号化部より入
力された音源開始位置に第一の量子化音源信号を同期し
て復号音声を生成する第一の復号化手段を備える。
【0017】
【作用】請求項1記載の発明においては、たとえば、G
ARMAとCELPという異なる方式を用いて符号化し
よりよい結果をもたらす方式を選択するので、符号化品
質がどちらか一方の方式による場合よりも向上する。
【0018】また請求項2記載の発明においては、符号
化手段選択手段は第一の符号探索手段と第二の符号探索
手段のうち入力音声と合成音声の歪を小さくする方を選
択する。
【0019】また、請求項3記載の発明においては、第
二の符号探索手段は適応音源符号帳に保持されている第
一の量子化音源信号と第二の量子化音源信号のうち入力
音声と合成音声の歪を小さくする信号を適応音源信号と
して選択する。
【0020】また、請求項4,5記載の発明において
は、スペクトル符号帳、音源モデル符号帳、駆動音源符
号帳はピッチ周期に応じてそれぞれが持っている副符号
帳を切り換える。
【0021】また、請求項6、7記載の発明において
は、有声音の先頭のフレームでの音源開始位置を復号化
部に伝送する場合に有声フレームに先行する無声フレー
ムで伝送する。
【0022】
【実施例】
実施例1.図1と図2はこの発明に係わる音声符号化復
号化装置の一実施例の構成図であり、以下、本発明の動
作をこの図において説明する。なお図1は符号化部を示
し、図2は復号化部を示しており、図1と図2において
図8と図9と同一の部分については同一符号を付し、説
明を省略する。図において、2は駆動音源符号帳、3は
駆動音源符号語、4は駆動音源生成手段、5は駆動音源
信号、6は適応音源符号帳、7は適応音源信号、8は第
一の符号探索手段、9は第一の量子化音源信号、10は
第二の量子化音源信号、13は第二の符号探索結果、1
6は復号化手段選択手段、17は符号化手段選択信号、
18は符号化結果、25は第二の符号探索手段、28は
第一の符号探索結果、33は第一の復号化手段、38は
符号化手段選択手段、39は符号化結果、40は適応音
源符号帳、41は適応音源信号、42は第二の量子化音
源信号、43は第二の復号化手段、46は駆動音源符号
帳、47は駆動音源符号語、48は駆動音源生成手段、
49は駆動音源信号である。
【0023】まず、符号化部について説明する。第一の
符号探索手段25は、図10に示すように有声音の先頭
フレームの場合は音源開始位置20に第一の量子化音源
信号24を同期させ、この第一の量子化音源信号とAR
符号語12とMA符号語27を用いて合成音声を生成
し、それ以外の有声フレームでは、先行フレームで得ら
れた合成音声に引き続いて第一の量子化音源信号24を
並べて合成音声を生成し、この合成音声と入力音声1の
歪を最小にするAR符号語12とMA符号語27と音源
モデル符号語22の組み合わせを探索し、その探索結果
を符号化結果28とし、その歪と共に符号化手段選択手
段16に出力し、またその組み合わせにおける第一の量
子化音源信号24を第一の量子化音源信号9として適応
音源符号帳6に出力する。
【0024】駆動音源符号帳2は例えばLPC残差信号
の中で典型的な一ピッチ周期の信号やガウス性雑音信号
を駆動音源符号語として複数個格納しておく。駆動音源
生成手段4は駆動音源符号帳2内の駆動音源符号語3を
ピッチ周期15で繰り返した駆動音源信号5を生成す
る。以下この第一の符号探索手段25が行う動作方式を
GARMA方式と呼ぶことにする。
【0025】第二の符号探索手段8は駆動音源信号5と
適応音源符号帳6内の適応音源信号7より生成される量
子化音源信号とスペクトル符号帳11内のスペクトル符
号語12を用いて合成音声を生成し、合成音声と入力音
声1の歪を最小にする駆動音源符号語3とスペクトル符
号語12の組み合わせを探索し、その探索結果を第二の
符号探索結果13とし、その歪と共に符号化手段選択手
段16に出力し、この組み合わせにおける第二の量子化
音源信号10を適応音源符号帳6に出力する。以下この
第二の符号探索手段8が符号化に用いる方式をCELP
方式と呼ぶことにする。
【0026】符号化手段選択手段16は第一の符号探索
結果28と第二の符号探索結果13の内で歪の小さい方
を当該フレームにおける符号化結果18として選択し、
どちらを選択したかを表す符号化手段選択信号17と前
記符号化結果18を出力する。
【0027】図3は適応音源符号帳6の動作を説明した
図である。適応音源符号帳6は当該フレームにおいて第
一の符号探索手段が選択された場合は第一の量子化音源
信号9を音源記憶手段50に格納し、第二の符号探索手
段が選択された場合は第二の量子化音源信号10を音源
記憶手段50に格納し、適応音源信号7として出力す
る。
【0028】従来の適応音源符号帳6は符号探索手段に
より、量子化音源信号を記憶しているのに対して、この
実施例においては、適応音源符号帳6に記憶する量子化
音源信号を第一の符号探索手段25により、出力された
第一の量子化音源信号9と第二の符号探索手段8により
出力された第二の量子化音源信号10のうちから最新の
量子化音源信号を選択し音源記憶手段50に格納する。
どちらが最新の量子化音源信号であるかは符号化手段選
択手段から出力された符号化手段選択信号17により判
定することができる。従って、適応音源符号帳6は符号
化手段選択信号17を入力してスイッチを切り換えるこ
とにより、第一の量子化音源信号9と第二の量子化音源
信号を10を切り換えて音源記憶手段50に入力する。
こうして適応音源符号帳6は最新に用いられた量子化音
源信号を第二の符号探索手段に供給することが可能にな
る。
【0029】次に図2の復号化部1bについて説明す
る。図において駆動音源符号帳46、適応音源符号帳4
0は、それぞれ符号化部1aにおける駆動音源符号帳
2、適応音源符号帳6と同一のものである。復号化手段
選択手段38は符号化手段選択信号17に従い第一の復
号化手段33と第二の復号化手段43のどちらかに、符
号化結果18をそのまま符号化結果39として出力す
る。
【0030】第一の復号化手段33は第一の量子化音源
信号32と符号化結果39に対応するMA符号帳34内
のMA符号語35とスペクトル符号帳44内のAR符号
語45を用いて復号音声37を生成し、第一の量子化音
源信号32をそのまま第一の量子化音源信号36として
適応音源符号帳40に出力する。
【0031】駆動音源生成手段48は、ピッチ周期15
と符号化結果39に対応する駆動音源符号帳46内の駆
動音源符号語47より駆動音源信号49を生成する。第
二の復号化手段43は、適応音源符号帳40内の適応音
源信号41と駆動音源信号49より生成される量子化音
源信号と符号化結果39に対応するスペクトル符号帳4
4内のAR符号語45を用いて復号音声37を生成し、
前記量子化音源信号を適応音源符号帳に第二の量子化音
源信号42として出力する。
【0032】以上のようにこの実施例では、第一の符号
化探索手段は音源モデル符号帳21に格納された音源モ
デルを用いた量子化音源信号のみを用いて符号化を行っ
ている。一方第二の符号探索手段は適応音源符号帳を用
いることにより、直前に符号化した量子化音源信号との
差分を用いることにより符号化を行っている。このよう
にこの符号化の方式が異なるふたつの符号探索手段をそ
れぞれ動作させ、その動作結果を比較することにより、
符号化の歪の小さい方を選択する点がこの実施例の特徴
である。すなわち、この実施例はGARMA方式とCE
LP方式の二つの方式を用い、二つの方式から得られた
符号化結果のよりよい方を選択して出力することを特徴
とするものである。
【0033】実施例2.上記実施例1においては、GA
RMA方式とCELP方式の二つの方式を用いて比較選
択する場合を示したが、二つの符号化方式はこれらの方
式に限るものではなく、その他の方式を利用するもので
もかまない。あるいは同一方式のものであっても、一方
に改良を加えたものや変更を加えたものであってもかま
わない。更に、二つの方式の組み合わせに限らず、三つ
以上の方式の組み合わせであってもかまわない。
【0034】実施例3.図4はこの発明に係わる音声符
号化復号化装置の一実施例における適応音源符号帳6の
構成図であり、以下、適応音源符号帳6の動作をこの図
において説明する。図3と同一の部分は同一番号を付
す。適応音源符号帳6は第一の符号探索手段が選択され
た場合、第一の量子化音源信号9を第一の音源記憶手段
51に格納し、第二の符号探索手段が選択された場合、
第二の量子化音源信号10を第二の音源記憶手段52に
格納しておく。切換手段53は第一の音源記憶手段51
と第二の音源記憶手段52に格納されている信号をそれ
ぞれ適応音源信号7として出力する。第二の符号探索手
段8は合成音声と入力音声の歪を小さくする適応音源信
号7を選択し、選択結果を符号探索結果13に含めて出
力する。
【0035】すなわち第二の符号探索手段8は、選択信
号8aを適用音源符号帳6に出力し、第一の音源記憶手
段51と第二の音源記憶手段に記憶された音源信号を切
り換える。第一の音源記憶手段51は、第一の符号探索
手段から出力された最新の量子化音源信号9を記憶して
いる。第二の音源記憶手段52は第2の符号探索手段か
ら出力された最新の量子化音源信号を記憶している。第
二の符号探索手段8は選択信号8aを出力し、符号語切
換手段53を動作させることにより、第一の音源記憶手
段51と第二の音源記憶手段52に記憶されている量子
化音源信号をそれぞれ入力し、両方の量子化音源信号に
基づいて符号化を試みる。その結果、より歪の小さい方
を用いて、符号化を行い符号探索結果として出力する。
【0036】また復号化部の適応音源符号帳40は図4
における適応音源符号帳6と同一のものである。復号化
部の第二の復号化手段43は、符号化結果39に従い適
応音源信号符号帳40の中から適応音源信号41を選択
する。
【0037】実施例4.上記実施例3においては、二つ
の符号探索手段がある場合を示したが、三つ以上の符号
探索手段が存在する場合には、図4に示した適用音源符
号帳6の内部には音源記憶手段がそれぞれの符号探索手
段に対応して存在し、切換手段53はこれら3つ以上の
音源記憶手段に記憶された量子化音源信号を切り換え
る。
【0038】実施例5.図5はこの発明に係わる音声符
号化復号化装置の一実施例におけるMA符号帳26の構
成図であり、以下、MA符号帳26の動作をこの図にお
いて説明する。図1と同一の部分は同一番号を付す。M
A符号帳26は複数の副符号帳54を持ち、副符号帳切
換手段55は入力されたピッチ周期15に応じて副符号
帳の一つを選択し、選択された副符号帳内のMA符号語
27を出力する。
【0039】例えば図において、副符号帳1は15ms
のピッチ周期に対応するMA符号帳を格納する。また副
符号帳2には16msのピッチ周期に対応する符号帳を
格納する。また、副符号帳3には17msのピッチ周期
に対応する符号帳を格納する。このようにして15ms
から例えば25msまでの符号帳を格納しておき、副符
号帳切り換え手段55は入力されたピッチ周期15に基
づき、副符号帳を選択できる。例えば、ピッチ周期15
が16msである場合には、副符号帳切り換え手段55
は副符号帳2を選択しこれをMA符号語27として出力
する。なお復号化部のMA符号帳34もMA符号帳26
と同一の構成である。また、AR符号帳または音源モデ
ル符号帳または駆動音源符号帳を図5と同様の構成にす
ることも可能である。
【0040】以上のように、この実施例が特徴とする点
は、ピッチ周期に応じて各符号帳内に複数の符号帳を用
意している点である。音声は例えば、男女の差、あるい
は会話のスピード、あるいは音声の高低等の特徴を有し
ているが、入力される音声が男であるか女であるか、あ
るいは速いか遅いか、あるいは高いか低いかというよう
な特徴はピッチ周期に反映されることが多い。すなわ
ち、ピッチ周期に応じてMAや音源モデルの対応が異な
るという事実がある。このピッチ周期に応じて、複数の
MA符号帳や音源モデル符号帳を用意しておき、ピッチ
周期に応じた符号帳を用いて量子化するのがこの実施例
の特徴である。
【0041】実施例6.図6、図7はこの発明に係わる
音声符号化復号化装置の一実施例の構成図であり、以
下、本発明の動作をこの図において説明する。図6は符
号化部を示しており、図7は復号化部を示している。図
1、図2と同一の部分は同一番号を付し説明を省略す
る。符号化部では、当該フレームが有声音の先頭フレー
ムの場合、音源開始位置20を当該フレームに先行する
無声フレームにおいて復号化部に伝送する。すなわち、
有音声の先頭フレームを符号化して伝送する前に音源開
始位置20を符号化して伝送する。このため、有音声の
フレームの伝送が1フレーム分遅れることになるが、1
フレーム分の伝送の遅れがあっても復号化部での復号の
時刻がずれるだけであり、復号の品質に影響は少ない。
なお、音源開始位置20の符号化を有声音の先頭フレー
ムの符号化とともに行ってもよい。ただし、この場合
は、有声音の先頭フレームの符号化情報量が音源開始位
置20の符号化により減少する。
【0042】復号化部では、第一の復号化手段33が優
勢音の先頭フレームを復号することが予め定められてお
り、当該フレームが有声音の先頭フレームの場合、第一
の復号化手段43は入力された音源開始位置20から第
一の量子化音源信号32を並べて復号音声37を生成す
る。
【0043】この例を従来例で示した図17を用いて説
明する。従来例においては、復号動作はフレームの先頭
から行われていたが、この実施例によれば、音源開始位
置20から復号がスタートするため、図17に示した時
刻T1から復号されることになる。従来は時刻F1から
復号されていたため時刻F1からT1の間の復号は本来
必要無いにも拘らず、合成音声が生じていたのに対し、
この実施例によれば、音源開始位置20すなわち時刻T
1から復号が開始されるため、本来必要でない部分の合
成音声がなくなる。また、スタート復号開始位置が一致
するため、ピッチ周期のズレもなくなり、復号音声の品
質が向上する。図17に示したように、入力音声1のピ
ッチ周期P1,P2,P3は復号音声37のピッチ周期
Q1,Q2,Q3とズレているため、このズレが復号音
声の品質を劣化させる原因となっている。これに対し、
この実施例によれば、復号音声も音源開始位置20より
スタートするためピッチ周期は入力音声のものと同一に
なり、復号音声の品質を向上させるのに役立つ。
【0044】実施例7.上記実施例6においては、音源
開始位置20を第一の復号化手段33に入力する場合を
示しているが、音源開始位置20を第二の復号化手段4
3に入力するようにしてもかまわない。実施例6の場合
は前述したように第一の符号化手段が有声音の先頭フレ
ームを複合するということが前提となっているため、音
源開始位置20を第一の復号化手段33にのみ入力すれ
ば良かったが、もし、有声音の先頭フレームを、第一と
第二の符号化手段のいずれかどちらが符号化するか不明
な場合には、音源開始位置20を第一と第二の復号化手
段の両方に入力させてやることにより、第一と第二の復
号化手段のいずれかがその音源開始位置20を用いて復
号を開始することが可能になる。
【0045】実施例8.実施例1ないし実施例7では、
符号化手段選択手段において第一の符号探索手段が選択
された場合、適応音源符号帳に第一の量子化音源信号を
格納するが、第一の量子化音源信号でMAフィルタを駆
動した信号を格納することも可能である。
【0046】実施例9.実施例1ないし実施例8ではス
ペクトルパラメータとしてARとMAを用いているが、
ARのみ、ケプストラム等他のスペクトルパラメータを
用いることも可能である。
【0047】実施例10.上記実施例5においては、図
1または図2に示した音声符号化復号化装置に対して用
いられる各符号帳に複数の符号帳を用意する場合を示し
たが、これら複数の符号帳をピッチ周期で切り換える方
式は、図8及び図9に示した従来の音声符号化復号化装
置に対しても用いることができる。すなわち、ピッチ周
期15に応じて符号帳を選択するという方式は実施例1
に示した方式あるいは従来の方式に拘らず、他の方式に
対しても適用することが可能である。
【0048】実施例11.上記実施例においては、音声
符号化復号化装置として音声が符号され、かつ復号化さ
れる装置の場合について説明したが、単に符号化のみを
行う符号化装置、あるいは復号化のみを行う復号化装置
においても、それぞれの実施例の符号化部分及び復号化
部分を適用することが可能である。
【0049】実施例12.また上記実施例においては、
音声を符号化復号化する場合について説明したが、この
発明における音声とは人間が声道から発声する音声に限
らず動物や獣等の人間以外の生物が発声する声について
も適用することが可能である。同様に生物が発声する声
に限らず音として入力されるものであれば、これらの音
を符号化復号化する場合にも適用されることが可能であ
る。例えば、楽器の音や摩擦音等の音を入力して符号
化、復号化する場合でもかまわない。また、音は人間が
知覚出来る場合に限らず人間の耳には感知できない超音
波あるいは低音波等の音であってもかまわない。
【0050】評価実験例.図8にサブフレーム数が2の
場合の本評価実験の構成図を示す。図においてMODE
0はFVQ−GARMA方式を意味し、MODE1はC
ELP方式を意味するものとする。まずLSP(ARパ
ラメータ)をフレームに数組予備選択する。次にそれぞ
れのLSPに対し、SNRsegの良いModeをサブ
フレーム毎に選択する。最終的にフレーム全体のSNR
segを最大にするLSPと各サブフレームでのMOD
Eの組み合わせが選択される。
【0051】図9にMODE0の内部構成図を示す。M
ODE0はFVQ−GARMAと同様で、予備選択され
た声帯音源波モデルコードとMAコードの全ての組み合
わせの中からSNRsegを最大にするものを選択す
る。
【0052】図10にMODE1の内部構成図を示す。
MODE1のCELPはMODE0と同期をとるために
ピッチ同期の処理とした。まず、適応コードブックの1
ピッチ長を繰り返しベクトルPとする。なお、前サブフ
レームがMODE0であった場合は声帯音源波モデルで
MAフィルタを駆動したものが適応コードブックとな
る。次に駆動音源コードブックの1ピッチ長を繰り返し
ベクトルCとする。そしてSNRsegを最大にするベ
クトルPとCのゲインの比を決定する。なお駆動音源コ
ードブックの学習には、短周期予測残差信号を用いた。
無声フレームではサブフレーム長が長いためサブフレー
ムを複数に分割し、白色雑音で駆動する。なお、適応コ
ードブックは使用しない。コードブックの学習には男女
各5名が発声した日本語短文20文章を用いた。ただし
駆動音源コードブックの学習には、10文章を用いた。
評価用データには学習外の日本語短文10文章(学習に
用いなかった男女各5名が異なる1文章ずつを発声)を
用いた。
【0053】本方式の性能を調べるために図11の条件
で合成音を作成した。ただし、音源ピーク位置は自動抽
出した。図12に本方式2.4Kbps(MGARM
A)のSNRsegとDC(Cepstrum Dis
tortion)を男女別に示す。この結果をみると男
性の方がSNRsegとCDともに劣っている。これ
は、ピッチ変動が大きい男性においてMODE1が多く
選択され、MODE1においてピッチ長の補間を行わず
同一ピッチ長による音源の繰り返しを行っているために
音源ピーク位置のずれが大きくなることが主な原因だと
考えられる。
【0054】本方式の合成音声の主観品質を調べるため
に、図11に示す条件で合成音声を作成し、被験者6名
による簡単な対比較試験を行った。音源ピーク位置を自
動抽出した本方式2.4Kbps(MGARMA)と音
源ピーク位置にマニュアルで修正を加えた従来の2.4
KbpsFVQ−GARMA(MFVQ)、音源ピーク
位置を自動抽出した従来の2.4KbpsFVQ−GA
RMA(AFVQ)及び4.8KbpsCELP基本方
式(CELP)との比較を行った。試験結果を図13に
示す。
【0055】本方式はAFVQより良好であり、音源ピ
ーク位置の抽出誤りに対するロバスト性の向上が確認さ
れた。本方式とMFVQの比較において本方式が選択さ
れない文章では、部分的に残響感が感じられた。音質の
ばらつきにおいては、MFVQより今回方式の方が安定
していることを確認している。音源ピーク位置抽出や補
間の改良によりMFVQと同等レベルに達すれば4.8
KCELPと同等の品質が得られることが期待できる。
【0056】
【発明の効果】以上説明したように請求項1記載の発明
によれば、2種類の符号化方式の中からよりよい方式を
選択するので、1種類の符号化方式の場合よりもよりよ
い符号化が行える。
【0057】また、請求項2記載の発明では符号化手段
選択手段により第二の符号探索手段と第一の符号探索手
段のうち合成音声と入力音声の歪を小さくする方を選択
するため、音源モデルの適合の悪い話者において、復号
音声の品質が改善する。
【0058】請求項3記載の発明の適応音源符号帳は適
応音源信号として第一の量子化音源信号と音源信号を格
納し、第二の符号探索手段が合成音声と入力音声の歪を
小さくする方を選択して用いるため、復号音声の品質が
改善する。
【0059】また、請求項4,5記載の発明の音声符号
化復号化装置では、符号化部と復号化部のスペクトル符
号帳、音源モデル符号帳、駆動音源符号帳がピッチ周期
に対応して作成された複数の副符号帳を持ち、この副符
号帳をピッチ周期により切り換えて用いるため、復号音
声の品質が改善する。
【0060】また、請求項6,7記載の発明の音声符号
化復号化装置では、有声音の先頭のフレームでの音源開
始位置を有声フレームに先行する無声フレームで復号化
部に出力し、復号化部の第一の復号化手段が第一の量子
化音源信号を音源開始位置に同期して復号音声を生成す
るため、有声フレームの伝送量を増加させずに符号化部
の合成音声と同一の復号音声を生成し、復号音声の品質
が改善する。
【図面の簡単な説明】
【図1】この発明の実施例1の音声符号化復号化装置を
示す構成図である。
【図2】この発明の実施例1の音声符号化復号化装置を
示す構成図である。
【図3】この発明の実施例1の適応音源符号帳を示す構
成図である。
【図4】この発明の実施例3の適応音源符号帳を示す構
成図である。
【図5】この発明の実施例5のMA符号帳を示す構成図
である。
【図6】この発明の実施例6の音声符号化復号化装置を
示す構成図である。
【図7】この発明の実施例6の音声符号化復号化装置を
示す構成図である。
【図8】この発明に基づく評価実験の音声符号化復号化
装置を示す構成図である。
【図9】この発明に基づく評価実験の音声符号化復号化
装置を示す構成図である。
【図10】この発明に基づく評価実験の音声符号化復号
化装置を示す構成図である。
【図11】この発明に基づく評価実験の条件を示す図で
ある。
【図12】この発明に基づく評価実験のSNRsegと
CDを示す図である。
【図13】この発明に基づく評価実験の結果を示す図で
ある。
【図14】従来の音声符号化復号化装置を示す構成図で
ある。
【図15】従来の音声符号化復号化装置を示す構成図で
ある。
【図16】従来の音声符号化復号化装置の符号探索手段
の動作を説明する図である。
【図17】従来の音声符号化復号化装置の復号化手段の
動作を説明する図である。
【図18】従来の音声符号化復号化装置の問題点を説明
する図である。
【符号の説明】
1 入力音声 2 駆動音源符号帳 3 駆動音源符号語 4 駆動音源生成手段 5 駆動音源信号 6 適応音源符号帳 7 適応音源信号 8 第二の符号探索手段 9 第一の量子化音源信号 10 第二の量子化音源信号 11 AR符号帳 12 AR符号語 13 第二の符号探索結果 14 ピッチ周期抽出手段 15 ピッチ周期 16 符号化手段選択手段 17 符号化手段選択信号 18 符号化結果 19 音源開始位置抽出手段 20 音源開始位置 21 音源モデル符号帳 22 音源モデル符号語 23 音源モデル生成手段 24 第一の量子化音源信号 25 第一の符号探索手段 26 MA符号帳 27 MA符号語 28 第一の符号探索結果 29 音源モデル符号帳 30 音源モデル符号語 31 音源モデル生成手段 32 第一の量子化音源信号 33 第一の復号化手段 34 MA符号帳 35 MA符号語 36 第一の量子化音源信号 37 復号音声 38 復号化手段選択手段 39 符号化結果 40 適応音源符号帳 41 適応音源信号 42 第二の量子化音源信号 43 第二の復号化手段 44 AR符号帳 45 AR符号語 46 駆動音源符号帳 47 駆動音源符号語 48 駆動音源生成手段 49 駆動音源信号 50 音源記憶手段 51 第一の音源記憶手段 52 第二の音源記憶手段 53 切換手段 54 副符号帳 55 副符号帳切換手段 56 符号化結果 57 符号探索手段 58 復号化手段 59 量子化音源信号 60 量子化音源信号

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力信号と合成信号の歪を最小にするよ
    うなモデルを探索してその探索結果を用いて入力信号を
    符号化する符号化装置において、 入力信号よりピッチ周期を抽出するピッチ周期抽出手段
    と、 前記ピッチ周期抽出手段により抽出されたピッチ周期に
    対して複数のモデルの中から入力信号に適合するひとつ
    のモデルを選択して入力信号を符号化する第1の符号化
    手段と、 前記第1の符号化手段とは異なる方式により入力信号を
    符号化する第2の符号化手段と、 前記第1の符号化手段と第2の符号化手段による符号化
    結果を比較し、その比較結果に基づいて第1の符号化手
    段と第2の符号化手段のいずれの符号化結果を選択して
    出力する選択手段とを有することを特徴とする符号化装
    置。
  2. 【請求項2】 入力音声を、声道のスペクトルパラメー
    タと音源信号に分離して固定時間長のフレーム毎に符号
    化復号化する音声符号化復号化装置において、 符号化部に、入力音声よりピッチ周期を抽出し音源モデ
    ル生成手段と駆動音源生成手段に出力するピッチ周期抽
    出手段と、典型的なスペクトルパラメータをスペクトル
    符号語として複数個格納したスペクトル符号帳と、一ピ
    ッチ周期の音源信号を表す音源モデルのパラメータの典
    型的なものを音源モデル符号語として複数個格納した音
    源モデル符号帳と、前記音源モデル符号帳内の音源モデ
    ル符号語から生成した一ピッチ周期の音源信号を前記ピ
    ッチ周期で繰り返したものを第一の量子化音源信号とし
    て第一の符号探索手段に出力する音源モデル生成手段
    と、前記第一の量子化音源信号と前記スペクトル符号帳
    内のスペクトル符号語から生成した合成音声と入力音声
    の歪を最小にする音源モデル符号語とスペクトル符号語
    の組み合わせを探索し、その探索結果を第一の符号探索
    結果としてその時の歪と共に符号化手段選択手段に出力
    し、この組み合わせにおける第一の量子化音源信号を適
    応音源符号帳に出力する第一の符号探索手段と、 先行フレームにおいて第一の符号探索手段が出力した第
    一の量子化音源信号あるいは第二の符号探索手段が出力
    した第二の量子化音源信号を適応音源信号として格納し
    た前記適応音源符号帳と、予め用意された信号を駆動音
    源符号語として複数個格納した駆動音源符号帳と、前記
    駆動音源符号帳内の駆動音源符号語を前記ピッチ周期で
    繰り返した駆動音源信号を生成する駆動音源生成手段
    と、前記適応音源信号と前記駆動音源信号から第二の量
    子化音源信号を生成し、前記スペクトル符号帳より当該
    フレームにおけるスペクトル歪を最小にするスペクトル
    符号語を選択し、このスペクトル符号語と前記第二の量
    子化音源信号を用いて合成音声を生成し、合成音声と入
    力音声の歪を最小にする駆動音源符号語を探索し、その
    探索結果を第二の符号探索結果としてその時の歪と共に
    符号化手段選択手段に出力し、第二の量子化音源信号を
    前記適応音源符号帳に出力する第二の符号探索手段と、 前記第一の符号探索結果と前記第二の符号探索結果の
    内、より小さい歪を持つ方を当該フレームの符号化結果
    として選択し出力するとともに、どちらの符号探索結果
    を選択したのかを符号化手段選択信号として出力する符
    号化手段選択手段を備え、 復号化部に、符号化部と同じスペクトル符号帳と、符号
    化部と同じ音源モデル符号帳と、 符号化部より入力された符号化結果に対応する前記音源
    モデル符号帳内の音源モデル符号語と符号化部より入力
    されたピッチ周期から第一の量子化音源信号を生成して
    出力する符号化部と同じ音源モデル生成手段と、符号化
    部と同じ適応音源符号帳と、符号化部と同じ駆動音源符
    号帳と、前記第一の量子化音源信号と符号化部より入力
    された符号化結果に対応する前記スペクトル符号帳内の
    スペクトル符号語を用いて復号音声を生成し、前記適応
    音源符号帳に前記第一の量子化音源信号を出力する第一
    の復号化手段と、前記符号化結果に対応する前記駆動音
    源符号帳内の駆動音源符号語と前記ピッチ周期から駆動
    音源信号を生成する駆動音源生成手段と、前記適応音源
    符号帳内の適応音源信号と前記駆動音源生成手段の出力
    する駆動音源信号より生成した第二の量子化音源信号と
    前記スペクトル符号語より復号音声を生成し、第二の量
    子化音源信号を前記適応音源符号帳に出力する第二の復
    号化手段と符号化部より入力された符号化手段選択信号
    に従い第一の復号化手段の復号音声と第二の復号化手段
    の復号音声を選択する復号化手段選択手段とを備えるこ
    とを特徴とする音声符号化復号化装置。
  3. 【請求項3】 上記音声符号化復号化装置において、符
    号化部と復号化部の適応音源符号帳内に、第一の符号探
    索手段が選択された場合の第一の量子化音源信号を格納
    する第一の音源記憶手段と、第二の符号探索手段が選択
    された場合の第二の量子化音源信号を格納する第二の音
    源記憶手段と、適応音源信号として第一の量子化音源信
    号と第二の量子化音源信号を切り換えて出力する切換手
    段を備え、符号化部に、前記適応音源信号と駆動音源信
    号から第二の量子化音源信号を生成し、この第二の量子
    化音源信号とAR符号語を用いて合成音声を生成し、こ
    の合成音声と入力音声の歪を小さくする適応音源信号を
    選択し、その選択結果を第二の符号探索結果に含めて出
    力するようにした第二の符号探索手段を備え、復号化部
    に、符号化部より入力された符号化結果に従い適応音源
    符号帳内の第一の量子化音源信号または第二の量子化音
    源信号を適応音源信号として選択して用いるようにした
    第二の復号化手段を備えることを特徴とする請求項2記
    載の音声符号化復号化装置。
  4. 【請求項4】 入力音声を、声道のスペクトルパラメー
    タと音源信号に分離して固定時間長のフレーム毎に符号
    化復号化する音声符号化復号化装置において、符号化部
    に、少なくとも、典型的なスペクトルパラメータをスペ
    クトル符号語として複数個格納したスペクトル符号帳
    と、一ピッチ周期の音源信号を表す音源モデルのパラメ
    ータの典型的なものを音源モデル符号語として複数個格
    納した音源モデル符号帳と、予め用意された信号を駆動
    音源符号語として複数個格納した駆動音源符号帳とのい
    ずれかを備え、少なくとも符号化部に備えたスペクトル
    符号帳または音源モデル符号帳または駆動音源符号帳の
    いずれかに、ピッチ周期に対応する複数個の副符号帳
    と、ピッチ周期抽出手段より入力されたピッチ周期に応
    じて符号化復号化処理に用いる前記副符号帳を切り換え
    る副符号帳切換手段を備え、復号化部に、復号化部より
    入力されたピッチ周期に応じて副符号帳を切り換える符
    号化部と同一のスペクトル符号帳または音源モデル符号
    帳または駆動音源符号帳を備えることを特徴とする音声
    符号化復号化装置。
  5. 【請求項5】 入力音声を、スペクトルパラメータと音
    源信号に分離して固定時間長のフレーム毎に符号化する
    音声符号化復号化装置において、 符号化部に、入力音声よりピッチ周期を抽出し音源モデ
    ル生成手段と駆動音源生成手段とスペクトル符号帳と音
    源モデル符号帳に出力するピッチ周期抽出手段と、典型
    的なスペクトルパラメータをスペクトル符号語として複
    数個格納したスペクトル符号帳と、一ピッチ周期の音源
    信号を表す音源モデルのパラメータの典型的なものを音
    源モデル符号語として複数個格納した音源モデル符号帳
    と、前記スペクトル符号帳または前記音源モデル符号帳
    に、ピッチ周期に対応する複数個の副符号帳と、ピッチ
    周期抽出手段より入力されたピッチ周期に応じて符号化
    復号化処理に用いる前記副符号帳を切り換える副符号帳
    切換手段を備え、前記音源モデル符号帳内の音源モデル
    符号語から生成した一ピッチ周期の音源信号を前記ピッ
    チ周期で繰り返したものを量子化音源信号として符号探
    索手段に出力する音源モデル生成手段と、前記量子化音
    源信号と前記スペクトル符号帳内のスペクトル符号語か
    ら生成した合成音声と入力音声の歪を最小にする音源モ
    デル符号語とスペクトル符号語の組み合わせを探索し、
    その探索結果を符号探索結果として出力する符号探索手
    段と、 復号化部に、符号化部と同じスペクトル符号帳と、符号
    化部と同じ音源モデル符号帳と、符号化部より入力され
    た符号化結果に対応する前記音源モデル符号帳内の音源
    モデル符号語と符号化部より入力されたピッチ周期から
    量子化音源信号を生成して復号化手段に出力する符号化
    部と同じ音源モデル生成手段と、前記量子化音源信号と
    符号化部より入力された符号化結果に対応する前記スペ
    クトル符号帳内のスペクトル符号語を用いて復号音声を
    生成し、前記適応音源符号帳に前記量子化音源信号を出
    力する復号化手段を備えることを特徴とする音声符号化
    復号化装置。
  6. 【請求項6】 上記音声符号化復号化装置において、符
    号化部に、当該フレームが無声フレームから初めて有声
    フレームに変わったフレームの場合、有声音が開始する
    位置を音源開始位置として入力音声より抽出し、当該フ
    レームに先行する無声フレームにおいて復号化部に出力
    する音源開始位置抽出手段と、復号化部に、第一の量子
    化音源信号を符号化部より入力された音源開始位置に同
    期して復号音声を生成するようにした第一の復号化手段
    を備えることを特徴とする請求項2記載の音声符号化復
    号化装置。
  7. 【請求項7】 入力音声を、スペクトルパラメータと音
    源信号に分離して固定時間長のフレーム毎に符号化する
    音声符号化復号化装置において、 符号化部に、入力音声よりピッチ周期を抽出し音源モデ
    ル生成手段と駆動音源生成手段に出力するピッチ周期抽
    出手段と、典型的なスペクトルパラメータをスペクトル
    符号語として複数個格納したスペクトル符号帳と、一ピ
    ッチ周期の音源信号を表す音源モデルのパラメータの典
    型的なものを音源モデル符号語として複数個格納した音
    源モデル符号帳と、前記音源モデル符号帳内の音源モデ
    ル符号語から生成した一ピッチ周期の音源信号を前記ピ
    ッチ周期で繰り返したものを量子化音源信号として符号
    探索手段に出力する音源モデル生成手段と、前記量子化
    音源信号と前記スペクトル符号帳内のスペクトル符号語
    から生成した合成音声と入力音声の歪を最小にする音源
    モデル符号語とスペクトル符号語の組み合わせを探索
    し、その探索結果を符号探索結果として出力する符号探
    索手段と、当該フレームが無声フレームから初めて有声
    フレームに変わったフレームの場合、有声音が開始する
    位置を音源開始位置として入力音声より抽出し、当該フ
    レームに先行する無声フレームにおいて復号化部に出力
    する音源開始位置抽出手段と、 復号化部に、符号化部と同じスペクトル符号帳と、符号
    化部と同じ音源モデル符号帳と、符号化部より入力され
    た符号化結果に対応する前記音源モデル符号帳内の音源
    モデル符号語と符号化部より入力されたピッチ周期から
    量子化音源信号を生成して復号化手段に出力する符号化
    部と同じ音源モデル生成手段と、当該フレームが無声フ
    レームから初めて有声フレームに変わったフレームの場
    合、符号化部より入力された音源開始位置に同期した前
    記量子化音源信号と符号化部より入力された符号化結果
    に対応する前記スペクトル符号帳内のスペクトル符号語
    を用いて復号音声を生成し、前記適応音源符号帳に前記
    量子化音源信号を出力する復号化手段を備えることを特
    徴とする音声符号化復号化装置。
JP04947493A 1993-03-10 1993-03-10 符号化装置及び復号化装置 Expired - Fee Related JP3431655B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04947493A JP3431655B2 (ja) 1993-03-10 1993-03-10 符号化装置及び復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04947493A JP3431655B2 (ja) 1993-03-10 1993-03-10 符号化装置及び復号化装置

Publications (2)

Publication Number Publication Date
JPH06266399A true JPH06266399A (ja) 1994-09-22
JP3431655B2 JP3431655B2 (ja) 2003-07-28

Family

ID=12832156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04947493A Expired - Fee Related JP3431655B2 (ja) 1993-03-10 1993-03-10 符号化装置及び復号化装置

Country Status (1)

Country Link
JP (1) JP3431655B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002035522A1 (fr) * 2000-10-26 2002-05-02 Mitsubishi Denki Kabushiki Kaisha Procede et appareil de codage vocal
WO2002063610A1 (fr) * 2001-02-02 2002-08-15 Nec Corporation Dispositif et procede de conversion de sequences de codes vocaux
US7092878B1 (en) 1999-08-03 2006-08-15 Canon Kabushiki Kaisha Speech synthesis using multi-mode coding with a speech segment dictionary

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092878B1 (en) 1999-08-03 2006-08-15 Canon Kabushiki Kaisha Speech synthesis using multi-mode coding with a speech segment dictionary
WO2002035522A1 (fr) * 2000-10-26 2002-05-02 Mitsubishi Denki Kabushiki Kaisha Procede et appareil de codage vocal
US7203641B2 (en) 2000-10-26 2007-04-10 Mitsubishi Denki Kabushiki Kaisha Voice encoding method and apparatus
WO2002063610A1 (fr) * 2001-02-02 2002-08-15 Nec Corporation Dispositif et procede de conversion de sequences de codes vocaux
US7505899B2 (en) 2001-02-02 2009-03-17 Nec Corporation Speech code sequence converting device and method in which coding is performed by two types of speech coding systems

Also Published As

Publication number Publication date
JP3431655B2 (ja) 2003-07-28

Similar Documents

Publication Publication Date Title
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
US6161091A (en) Speech recognition-synthesis based encoding/decoding method, and speech encoding/decoding system
EP0409239B1 (en) Speech coding/decoding method
JP3446764B2 (ja) 音声合成システム及び音声合成サーバ
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPH07129195A (ja) 音声復号化装置
US5875423A (en) Method for selecting noise codebook vectors in a variable rate speech coder and decoder
Ribeiro et al. Phonetic vocoding with speaker adaptation.
JP3431655B2 (ja) 符号化装置及び復号化装置
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3232701B2 (ja) 音声符号化方法
JPH05165500A (ja) 音声符号化方法
JP3410931B2 (ja) 音声符号化方法及び装置
JP3552201B2 (ja) 音声符号化方法および装置
JP3232728B2 (ja) 音声符号化方法
JPH11259098A (ja) 音声符号化/復号化方法
JP3515216B2 (ja) 音声符号化装置
JPH05165497A (ja) コード励振線形予測符号化器及び復号化器
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3364827B2 (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置
JP3515215B2 (ja) 音声符号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置
JP2004020676A (ja) 音声符号化/復号化方法及び音声符号化/復号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030506

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040520

LAPS Cancellation because of no payment of annual fees