JP4132154B2

JP4132154B2 - 音声合成方法及び装置、並びに帯域幅拡張方法及び装置

Info

Publication number: JP4132154B2
Application number: JP29140597A
Authority: JP
Inventors: 士郎大森; 正之西口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1997-10-23
Filing date: 1997-10-23
Publication date: 2008-08-13
Anticipated expiration: 2017-10-23
Also published as: EP0911807A2; KR100574031B1; KR19990037291A; JPH11126098A; TW384467B; EP0911807A3; EP0911807B1; US6289311B1

Description

【０００１】
【発明の属する技術分野】
本発明は、送信側から伝送されてきた符号化パラメータを用いて音声を合成する音声合成方法及び装置、並びに電話のような通信、放送によって伝えられる周波数帯域の狭い音声信号を、伝送路ではそのままに、受信側で帯域幅を拡張する帯域幅拡張方法及び装置に関する。
【０００２】
【従来の技術】
電話回線の帯域は例えば３００〜３４００Ｈｚと狭く、電話回線を介して送られてくる音声信号の周波数帯域は制限されている。このため、従来のアナログ電話回線の音質はあまり良好とは言えない。また、ディジタル携帯電話の音質についても不満がある。
【０００３】
しかしながら、伝送路の規格が定まっているため、この帯域幅を広げることは難しく、したがって、受信側で帯域外の信号成分を予測し、広帯域信号を生成するシステムが様々提案されている。この中で、コードブックマッピングを用いた方式の品質が良いとされている。この方式は、入力された狭帯域音声のスペクトル包絡から、広帯域音声のスペクトル包絡を予測するために、分析用と合成用の二つのコードブックを持つことを特徴とする。
【０００４】
具体的には、あらかじめスペクトル包絡を表すパラメータの一種であるＬＰＣケプストラムにより、狭帯域用、広帯域用の二つのコードブックを作成しておく。この二つのコードブックのコードベクタは一対一に対応しており、狭帯域入力音声から狭帯域用ＬＰＣケプストラムを求め、狭帯域コードブック内コードベクタと比較することによりベクトル量子化し、対応する広帯域コードブック内コードベクタを用いて逆量子化することによって広帯域用ＬＰＣケプストラムが求められるという仕組みである。
【０００５】
ここで、二つのコードブックのコードベクタが一対一に対応するための作成方法は以下の通りである。まず広帯域学習用音声と、それを帯域制限した狭帯域学習用音声を用意し、それぞれをフレーミングし、狭帯域音声から求めたＬＰＣケプストラムにより、まず狭帯域コードブックを学習、作成する。そして、結果として得られた各コードベクタに量子化される狭帯域学習用音声のフレームに対応する広帯域学習用音声のフレームを集め、その重心を取ることによって広帯域コードベクタとし、広帯域コードブックを作成する。
【０００６】
また、この応用として、広帯域学習用音声で先に広帯域用コードブックを作成し、対応する狭帯域学習用音声のフレームの重心を取ることで狭帯域コードベクタとし、狭帯域コードブックを作成しても良い。
【０００７】
さらに、コードベクタとするパラメータに自己相関を用いた方式もある。また、ＬＰＣ分析、合成を行う方式の場合、励振源が必要となるが、この励振源には、パルス列とノイズを用いたもの、狭帯域励振源をアップサンプルしたもの、がある。
【０００８】
【発明が解決しようとする課題】
ところで、上述したような方法を用いても、まだ音質は十分とは言えず、特に現在我が国で利用されているディジタル方式の携帯電話に採用されている、いわゆるＣＥＬＰ（Code Excited Linear Prediction：符号励起線形予測）符号化系の符号化方式であるＶＳＥＬＰ（Vector Sum Excited Linear Prediction：ベクトル和励起線形予測）符号化方式や、ＰＳＩ−ＣＥＬＰ（Pitch Synchronus Innovation - CELP：ピッチ同期雑音励振源−ＣＥＬＰ）符号化方式等の低ビットレートの音声符号化方式を用いて符号化した音声に適用すると、音質の不十分さは顕著であった。
【０００９】
また、狭帯域と広帯域のコードブックを用意しておくことによる、使用メモリ領域の大きさも問題であった。
【００１０】
本発明は、上記実情に鑑みてなされたものであり、聴感上品質の良い広帯域音声を得ることのできる音声合成方法及び装置、並びに帯域幅拡張方法及び装置の提供を目的とする。
【００１１】
また、本発明は、上記実情に鑑みてなされたものであり、コードブックを分析合成両用とすることによりメモリ容量を節約できる音声合成方法及び装置、並びに帯域幅拡張方法及び装置の提供を目的とする。
【００１２】
【課題を解決するための手段】
本発明に係る音声合成方法は、所定時間単位毎に広帯域音声から抽出した特徴パラメータにより予め作成した広帯域コードブックを備え、入力された複数種類の符号化パラメータを用いて音声を合成する音声合成方法において、上記複数種類の符号化パラメータを復号化し、この復号化された複数種類の符号化パラメータの内の第１の符号化パラメータを用いて励振源を求めると共に、第２の符号化パラメータを音声合成用の特徴パラメータに変換し、この音声合成用特徴パラメータを上記広帯域コードブック内の各コードベクトルより部分抽出して求めた狭帯域特徴パラメータと比較することによって量子化し、この量子化データを上記広帯域コードブックを用いて逆量子化し、この逆量子化データと上記励振源とに基づいて音声を合成する。
【００１３】
本発明に係る音声合成装置は、所定時間単位毎に広帯域音声から抽出した特徴パラメータにより予め作成した広帯域コードブックを備え、入力された複数種類の符号化パラメータを用いて音声を合成する音声合成装置において、上記複数種類の符号化パラメータを復号化する復号化手段と、上記復号化手段により復号化された複数種類の符号化パラメータの内の第１の符号化パラメータを用いて励振源を求めると励振源形成手段と、上記復号化手段により復号化された複数種類の符号化パラメータの内の第２の符号化パラメータを音声合成用の特徴パラメータに変換するパラメータ変換手段と、上記広帯域コードブック内の各コードベクトルを部分抽出して狭帯域パラメータを求める部分抽出手段と、上記パラメータ変換手段からの上記特徴パラメータを上記部分抽出手段からの狭帯域パラメータを用いて量子化する量子化手段と、上記量子化手段からの量子化データを上記広帯域コードブックを用いて逆量子化する逆量子化手段と、上記逆量子化手段からの逆量子化データと上記励振源形成手段からの励振源とに基づいて音声を合成する合成手段とを備える。
【００１４】
本発明に係る帯域幅拡張方法は、所定時間単位毎に広帯域音声から抽出したパラメータにより予め作成した広帯域コードブックを備え、入力された狭帯域音声を帯域幅拡張する帯域幅拡張方法において、上記入力された狭帯域音声から狭帯域パラメータを出力し、この狭帯域パラメータを、上記広帯域コードブック内の各コードベクトルより部分抽出して求めた狭帯域パラメータと比較することによって量子化し、この量子化データを上記広帯域コードブックを用いて逆量子化し、この逆量子化データに基づいて上記狭帯域音声の帯域幅を拡張する。
【００１５】
本発明に係る帯域幅拡張装置は、所定時間単位毎に広帯域音声から抽出したパラメータにより予め作成した広帯域コードブックを備え、入力された狭帯域音声を帯域幅拡張する帯域幅拡張装置において、上記入力された狭帯域音声から狭帯域パラメータを出力する狭帯域パラメータ出力手段と、上記広帯域コードブック内の各コードベクトルを部分抽出して狭帯域パラメータを求める部分抽出手段と、上記部分抽出手段からの狭帯域パラメータを上記狭帯域パラメータ演算手段からの狭帯域パラメータを用いて量子化する狭帯域音声量子化手段と、上記狭帯域音声量子化手段からの狭帯域量子化データを上記広帯域コードブックを用いて逆量子化する広帯域音声逆量子化手段とを備え、上記広帯域音声逆量子化手段からの逆量子化データに基づいて上記狭帯域音声の帯域幅を拡張する。
【００２４】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照しながら説明する。この実施の形態は、本発明に係る帯域幅拡張方法を用いて、入力された狭帯域音声の帯域幅を拡張する図１に示す音声帯域幅拡張装置である。この音声帯域幅拡張装置の入力端子１には、周波数帯域が例えば３００Ｈｚ〜３４００Ｈｚで、サンプリング周波数が８ｋＨｚの狭帯域音声信号が供給される。
【００２５】
この音声帯域幅拡張装置は、広帯域有声音及び無声音から抽出した有声音用及び無声音用パラメータを用いて予め作成した広帯域有声音用コードブック１２と広帯域無声音用コードブック１４と、上記広帯域音声を周波数帯域制限して得た周波数帯域が例えば３００Ｈｚ〜３４００Ｈｚの狭帯域音声信号から抽出した有声音用及び無声音用パラメータにより予め作成した狭帯域有声音用コードブック７と狭帯域無声音用コードブック１０とを備える。
【００２６】
また、この帯域幅拡張装置は、入力端子１から入力され、フレーム化回路２により、１６０サンプル毎にフレーミング（サンプリング周波数は８ｋＨｚであるので１フレームは２０ｍsec）された上記狭帯域信号に基づいて励振源を求める励振源形成手段となるゼロ詰め部１６と、上記入力狭帯域信号を２０msecの１フレーム毎に有声音（Ｖ）と無声音（ＵＶ）に判定する有声音（Ｖ）／無声音（ＵＶ）判定部５と、この有声音（Ｖ）／無声音（ＵＶ）判定部５からの有声音（Ｖ）／無声音（ＵＶ）判定結果に基づいて狭帯域有声音用及び無声音用の線形予測係数αを出力するＬＰＣ（線形予測符号化）分析回路３と、このＬＰＣ分析回路３からの線形予測係数αをパラメータの一種である自己相関ｒに変換する線形予測係数→自己相関（α→ｒ）変換回路４と、このα→ｒ変換回路４からの狭帯域有声音用自己相関を狭帯域有声音用コードブック８を用いて量子化する狭帯域有声音用量子化器７と、上記α→ｒ変換回路４からの狭帯域無声音用自己相関を狭帯域無声音用コードブック１０を用いて量子化する狭帯域無声音用量子化器９と、狭帯域有声音用量子化器７からの狭帯域有声音用量子化データを広帯域有声音用コードブック１２を用いて逆量子化する広帯域有声音用逆量子化器１１と、狭帯域無声音用量子化器９からの狭帯域無声音用量子化データを広帯域無声音用コードブック１４を用いて逆量子化する広帯域無声音用逆量子化器１３と、広帯域有声音用逆量子化器１１からの逆量子化データとなる広帯域有声音用自己相関を広帯域有声音用の線形予測係数に変換すると共に広帯域無声音用逆量子化器１３からの逆量子化データとなる広帯域無声音用自己相関を広帯域無声音用の線形予測係数に変換する自己相関→線形予測係数（ｒ→α）変換回路１５と、このｒ→α変換回路１５からの広帯域有声音用線形予測係数と広帯域無声音用線形予測係数とゼロ詰め部１６からの励振源とに基づいて広帯域音声を合成するＬＰＣ合成回路１７とを備えてなる。
【００２７】
また、この帯域幅拡張装置は、フレーム化回路２でフレーミングされた狭帯域音声のサンプリング周波数を８ｋＨｚから１６ｋＨｚにオーバーサンプリングするオーバーサンプル回路１９と、ＬＰＣ合成回路１７からの合成出力から入力狭帯域音声信号の周波数帯域３００Ｈｚ〜３４００Ｈｚの信号成分を除去するバンドストップフィルタ（ＢＳＦ）１８と、このＢＳＦ１８からのフィルタ出力にオーバーサンプル回路１９からのサンプリング周波数１６ｋＨｚの周波数帯域３００Ｈｚ〜３４００Ｈｚの基の狭帯域音声信号の成分とを加算する加算器２０とを備えている。そして、出力端子２１からは、周波数帯域が３００〜７０００Ｈｚで、サンプリング周波数が１６ｋＨｚのディジタル音声信号が出力される。
【００２８】
ここで、広帯域有声音用コードブック１２と広帯域無声音用コードブック１４と、狭帯域有声音用コードブック８と狭帯域無声音用コードブック１０の作成について説明する。
【００２９】
先ず、広帯域有声音用コードブック１２と広帯域無声音用コードブック１４は、フレーム化回路２でのフレーミングと同様に例えば２０msec毎にフレーミングした、周波数帯域が例えば３００Ｈｚ〜７０００Ｈｚの広帯域音声信号を、有声音（Ｖ）と無声音（ＵＶ）に分け、この広帯域有声音及び無声音から抽出した有声音用及び無声音用パラメータを用いて作成する。
【００３０】
また、狭帯域有声音用コードブック７と狭帯域無声音用コードブック１０は、上記広帯域音声を周波数帯域制限して得た周波数帯域が例えば３００Ｈｚ〜３４００Ｈｚの狭帯域音声信号から抽出した有声音用及び無声音用パラメータにより作成する。
【００３１】
図２は、上記４つのコードブックを作成するにあたっての学習データの作り方を説明するための図である。図２に示すように、広帯域の学習用音声信号を用意し、ステップＳ１で１フレーム２０msecにフレーミングする。また、上記広帯域の学習用音声信号をステップＳ２で帯域制限して狭帯域とした信号についても上記ステップＳ１でのフレーミングと同じタイミングのフレーム位相によりステップＳ３でフレーミングする。そして、狭帯域音声の各フレームにおいて、例えばフレームエネルギーやゼロクロスの値等を調べることによってステップＳ４で有声音（Ｖ）か無声音（ＵＶ）かの判別を行う。
【００３２】
ここで、コードブックの品質を良いものとするために、有声音（Ｖ）から無声音（ＵＶ）、ＵＶからＶへの遷移状態のものや、ＶともＵＶとも判別しがたいものは除外してしまい、確実にＶであるものと、確実にＵＶであるもののみを利用する。このようにして、学習用狭帯域Ｖフレームの集まりと、同うＶフレームの集まりを作成する。
【００３３】
次に、広帯域フレームもＶとＵＶに分類するが、狭帯域フレームと同じタイミングでフレーミングされているため、その判別結果を用いて、狭帯域でＶと判別された狭帯域フレームと同じ時刻の広帯域フレームはＶとし、ＵＶと判別された狭帯域フレームと同じ時刻の広帯域フレームはＵＶとする。以上により、学習用データが作成される。ここで、狭帯域でＶにもＵＶにも分類されなかった場合は、広帯域でも同様であることは言うまでもない。
【００３４】
また、図示しないが、これと対称な方法で学習データを作ることも可能である。すなわち、広帯域フレームを用いてＶ／ＵＶの判別を行い、その判別結果を用いて狭帯域フレームのＶ／ＵＶを分類するというものである。
【００３５】
続いて、ここで得られた学習データを用い、図３に示すようにコードブックを作成する。図３に示すように、まず広帯域Ｖ(またはＵＶ)フレームの集まりを用いて広帯域Ｖ（ＵＶ）コードブックを学習し作成する。
【００３６】
先ず、ステップＳ６に示すように、各広帯域フレームにおいて、例えばｄｎ次までの自己相関パラメータを抽出する。自己相関パラメータは以下の（１）式に基づいて算出される。
【００３７】
【数１】

【００３８】
ここで、ｘは入力信号、φ（ｘｉ）はi次の自己相関、Ｎはフレーム長である。
【００３９】
この各フレームのｄｎ次元の自己相関パラメータから、ＧＬＡ(Generalized Lloyd Algorithm)により次元ｄｎ、サイズｓｎの広帯域Ｖ（ＵＶ）コードブックをステップＳ７で作成する。
【００４０】
ここで、各広帯域Ｖ（ＵＶ）フレームの自己相関パラメータが、作成されたコードブックの、どのコードベクタに量子化されるかをエンコード結果から調べる。そしてコードベクタごとに、そのベクタに量子化された各広帯域Ｖ（ＵＶ）フレームに対応する、すなわち同じ時刻の各狭帯域Ｖ（ＵＶ）フレームから求められるｄｎ次元の自己相関パラメータ同士の例えば重心を算出し、これをステップＳ８で狭帯域コードベクタとする。これをすべてのコードベクタに対して行うことにより、狭帯域コードブックが生成される。
【００４１】
また、図４に示すように、これと対称な方法も可能である。すなわち、先にステップＳ９からステップＳ１０で狭帯域フレームのパラメータを用いて学習することにより狭帯域コードブックを作成し、ステップＳ１１で対応する広帯域フレームのパラメータの重心を求めるというものである。
【００４２】
以上により狭帯域Ｖ／ＵＶ、広帯域Ｖ／ＵＶの４つのコードブックが作成される。
【００４３】
次に、これらのコードブックを使用して、実際に狭帯域音声が入力されたときに、広帯域音声を出力する、上記帯域幅拡張方法を適用した帯域幅拡張装置の動作について図５を参照しながら説明する。
【００４４】
入力端子１から入力された上記狭帯域音声信号は、先ずステップＳ２１でフレーム化回路２により１６０サンプル（２０msec）毎にフレーミングされる。そして各フレームについて、ＬＰＣ分析回路３で、ステップＳ２３のようにＬＰＣ分析が行われ、線形予測係数αパラメータとＬＰＣ残差に分けられる。αパラメータはステップＳ２４でα→ｒ変換回路４により自己相関ｒに変換される。
【００４５】
また、フレーミングされた信号は、ステップＳ２２でＶ／ＵＶ判定回路５により、Ｖ／ＵＶの判別が行われており、ここで、Ｖと判定されると、α→ｒ変換回路４からの出力を切り替えるスイッチ６は、狭帯域有声音量子化回路７に接続され、ＵＶと判定されると、狭帯域無声音量子化回路９に接続される。
【００４６】
ただし、ここでのＶ／ＵＶの判別は、コードブック作成時とは異なり、ＶにもＵＶにも属さないフレームは発生させず、必ずどちらかに振り分ける。実際には、ＵＶの方が、高域エネルギーが大きいために、高域を予測した場合、大きなエネルギーとなる傾向があるが、Ｖ／ＵＶ判断が難しいもの等をＵＶと誤って判断した場合に異音を発生することにつながる。したがって、コードブック作成時にはＶともＵＶとも判別できなかったものは、Ｖとするよう設定している。
【００４７】
ＵＶ判定回路５がＶと判定したときには、ステップＳ２５では、スイッチ６からの有声音用自己相関ｒを狭帯域Ｖ量子化回路７に供給し、狭帯域Ｖコードブック８を用いて量子化する。一方、ＵＶ判定回路５がＶであるときには、ステップＳ２５では、スイッチ６からの無声音用自己相関ｒを狭帯域ＵＶ量子化回路９に供給し、狭帯域ＵＶコードブック１０を用いて量子化する。
【００４８】
そして、ステップＳ２６でそれぞれ対応する広帯域Ｖ逆量子化回路１１又は広帯域ＵＶ逆量子化回路１３により広帯域Ｖコードブック１２又は広帯域ＵＶコードブック１４を用いて逆量子化され、これにより広帯域自己相関が得られる。
【００４９】
そして、広帯域自己相関はステップＳ２７でｒ→α変換回路１５により広帯域αに変換される。
【００５０】
一方で、ＬＰＣ分析回路３からのＬＰＣ残差は、ステップＳ２８でゼロ詰め部１６によりサンプル間にゼロが詰められることでアップサンプルされ、エイリアシングにより広帯域化される。そして、これが広帯域励振源として、ＬＰＣ合成回路１７に供給される。
【００５１】
そして、ステップＳ２９で、ＬＰＣ合成回路１７が広帯域αと広帯域励振源とを、ＬＰＣ合成し、広帯域の音声信号が得られる。
【００５２】
しかし、このままでは予測によって求められた広帯域信号にすぎず、予測による誤差が含まれる。特に入力狭帯域音声の周波数範囲に関しては、入力音声をそのまま利用したほうが良い。
【００５３】
したがって、入力狭帯域音声の周波数範囲をステップＳ３０でＢＳＦ１８を用いたフィルタリングにより除去してから、ステップ３１でオーバーサンプル回路１９により狭帯域音声をオーバーサンプルしたものと、ステップＳ３２で加算する。これにより、帯域幅拡張された広帯域音声信号が得られる。ここで、前記加算時にゲインの調節、また高域の若干の抑圧等を行い、聴感上の品質を向上させることも可能である。
【００５４】
以上、図１に示した帯域幅拡張装置では、都合４つのコードブックで、自己相関パラメータを使用することを前提としたが、これは自己相関に限るものではない。たとえば、ＬＰＣケプストラムでも良好な効果が得られるし、スペクトル包絡を予測するという観点から、スペクトル包絡そのものをパラメータとしても良い。
【００５５】
また、上記音声帯域幅拡張装置では、狭帯域Ｖ（ＵＶ）用のコードブック８及び１０を用いたが、これらを用いずに、コードブック用のＲＡＭ容量を削減することも可能である。
【００５６】
この場合の音声帯域幅拡張装置の構成を図６に示す。この図６に示す音声帯域幅拡張装置は、狭帯域Ｖ（ＵＶ）用のコードブック８及び１０の代わりに、広帯域コードブック内の各コードベクトルより演算によって狭帯域Ｖ（ＵＶ）パラメータを求める演算回路２５及び２６を用いている。他の構成は上記図１と同様である。
【００５７】
コードブックに使うパラメータを自己相関とした場合、広帯域自己相関と狭帯域自己相関には以下の（２）式のような関係が成り立つ。
【００５８】
【数２】

【００５９】
このために、広帯域自己相関φ(xw)から狭帯域自己相関φ(xn)を演算によって算出することが可能で、理論的に広帯域ベクタと狭帯域ベクタを両方持つ必要がない。ここで、φは自己相関、ｘｎは狭帯域信号、ｘｗは広帯域信号、ｈは帯域制限フィルタのインパルス応答である。
【００６０】
すなわち、狭帯域自己相関は、広帯域自己相関と、帯域制限フィルタのインパルス応答の自己相関との畳み込みで求められる。
【００６１】
したがって、帯域幅拡張処理は、上記図５の代わりに、図７のように行える。すなわち、入力端子１から入力された上記狭帯域音声信号は、先ずステップＳ４１でフレーム化回路２により１６０サンプル（２０msec）毎にフレーミングされる。そして各フレームについて、ＬＰＣ分析回路３で、ステップＳ４３のようにＬＰＣ分析が行われ、線形予測係数αパラメータとＬＰＣ残差に分けられる。αパラメータはステップＳ４４でα→ｒ変換回路４により自己相関ｒに変換される。
【００６２】
また、フレーミングされた信号は、ステップＳ４２でＶ／ＵＶ判定回路５により、Ｖ／ＵＶの判別が行われており、ここで、Ｖと判定されると、α→ｒ変換回路４からの出力を切り替えるスイッチ６は、狭帯域有声音量子化回路７に接続され、ＵＶと判定されると、狭帯域無声音量子化回路９に接続される。
【００６３】
このＶ／ＵＶの判別も、コードブック作成時とは異なり、ＶにもＵＶにも属さないフレームは発生させず、必ずどちらかに振り分ける。
【００６４】
ＵＶ判定回路５がＶと判定したときには、ステップＳ４６では、スイッチ６からの有声音用自己相関ｒを狭帯域Ｖ量子化回路７に供給して、量子化する。しかし、この量子化は狭帯域用のコードブックを用いるのではなく、上述したように演算回路２５によりステップＳ４５で求めた狭帯域Ｖ用パラメータを用いる。
【００６５】
一方、ＵＶ判定回路５がＶであるときには、ステップＳ４６では、スイッチ６からの無声音用自己相関ｒを狭帯域ＵＶ量子化回路９に供給して量子化するが、ここでも、狭帯域ＵＶコードブックを用いずに、演算回路２６で演算により求めた狭帯域ＵＶ用パラメータを用いて量子化する。
【００６６】
そして、ステップＳ４７でそれぞれ対応する広帯域Ｖ逆量子化回路１１又は広帯域ＵＶ逆量子化回路１３により広帯域Ｖコードブック１２又は広帯域ＵＶコードブック１４を用いて逆量子化し、これにより広帯域自己相関が得られる。
【００６７】
そして、広帯域自己相関はステップＳ４８でｒ→α変換回路１５により広帯域αに変換される。
【００６８】
一方で、ＬＰＣ分析回路３からのＬＰＣ残差は、ステップＳ４９でゼロ詰め部１６によりサンプル間にゼロが詰められることでアップサンプルされ、エイリアシングにより広帯域化される。そして、これが広帯域励振源として、ＬＰＣ合成回路１７に供給される。
【００６９】
そして、ステップＳ５０で、ＬＰＣ合成回路１７が広帯域αと広帯域励振源とを、ＬＰＣ合成し、広帯域の音声信号が得られる。
【００７０】
しかし、このままでは予測によって求められた広帯域信号にすぎず、予測による誤差が含まれる。特に入力狭帯域音声の周波数範囲に関しては、入力音声をそのまま利用したほうが良い。
【００７１】
したがって、入力狭帯域音声の周波数範囲をステップＳ５１でＢＳＦ１８を用いたフィルタリングにより除去してから、ステップ５２でオーバーサンプル回路１９により狭帯域音声をオーバーサンプルしたものと、ステップＳ５３で加算する。
【００７２】
このように、図６に示した音声帯域幅拡張装置では、量子化時に狭帯域コードブックのコードベクタと比較することによって量子化するのではなく、広帯域コードブックから演算によって求められるコードベクタとの比較で量子化する。これにより、広帯域コードブックが分析、合成の両用となり、狭帯域コードブックを保持するメモリが不要となる。
【００７３】
しかしながら、この図６に示した音声帯域幅拡張装置では、メモリ容量を節約する効果よりも、演算による処理量が増えることが問題となる場合も考えられる。そこで、コードブックは広帯域のみとしつつ、演算量も増やさない帯域幅拡張方法を適用した図８に示す音声帯域幅拡張装置を説明する。この図８に示す音声帯域幅拡張装置は、演算回路２５及び２６の代わりに、上記広帯域コードブック内の各コードベクトルを部分的に抽出して狭帯域パラメータを求める部分抽出回路２８及び２９を用いている。他の構成は上記図１又は図６と同様である。
【００７４】
先に示した帯域制限フィルタのインパルス応答の自己相関は、周波数領域では、次の（３）式で示すように帯域制限フィルタのパワースペクトル特性となる。
【００７５】
【数３】

【００７６】
ここで、この帯域制限フィルタのパワー特性と等しい周波数特性を持つ、もう一つの帯域制限フィルタを考え、この周波数特性をＨ’とすれば、上記（３）式は次の（４）式になる。
【００７７】
【数４】

【００７８】
この（４）式で示される新たなフィルタの通過域、阻止域は当初の帯域制限フィルタと同等であり、減衰特性が２乗となる。したがって、この新たなフィルタもまた、帯域制限フィルタと言える。
【００７９】
これを考慮すると、狭帯域自己相関は、広帯域自己相関と帯域制限フィルタのインパルス応答との畳み込み、すなわち広帯域自己相関を帯域制限した次の（５）式のように単純化される。
【００８０】
【数５】

【００８１】
ここで、コードブックに使用するパラメータを自己相関とする場合、そもそも現実にＶにおいては、自己相関パラメータは１次よりも２次が小さく、２次よりも３次がさらに小さく、という具合に、なだらかな単調減少の曲線を描く傾向がある。
【００８２】
一方で、狭帯域信号と広帯域信号との関係は、広帯域信号をローパスしたものを狭帯域信号としているため、狭帯域自己相関は、広帯域自己相関をローパスすることによって理論的に求められる。
【００８３】
しかしながら、そもそも広帯域自己相関がなだらかであるため、ローパスしてもほとんど変化がなく、このローパス処理は省略しても影響がない。したがって、広帯域自己相関を狭帯域自己相関そのものとして利用することが可能である。ただし、広帯域信号のサンプリング周波数は、狭帯域信号のサンプリング周波数の２倍としているため、実際には、狭帯域自己相関は広帯域自己相関の１次おきに取ったものとなる。
【００８４】
すなわち、広帯域自己相関コードベクタを１次おきに取ったものは、狭帯域自己相関コードベクタと同等に扱うことができ、入力狭帯域音声の自己相関は、広帯域コードブックによって量子化することができ、狭帯域コードブックが不要ということである。
【００８５】
また、ＵＶにおいては、先に述べたように、高域エネルギーが大きく、予測を誤ると影響が大のため、Ｖ／ＵＶ判断をＶ側に偏らせてあり、ＵＶと判断されるのは、ＵＶである確度が高い場合のみである。そのため、ＵＶ用コードブックサイズはＶ用よりも小さくしており、互いにはっきりと異なるベクタのみが登録されている。したがって、ＵＶの自己相関はＶほどなだらかな曲線ではないにも関わらず、広帯域自己相関コードベクタを１次おきに取ったものと入力狭帯域信号の自己相関とを比較することで、広帯域自己相関コードベクタをローパスしたものと同等の、すなわち狭帯域コードブックが存在する場合と同等の量子化が可能である。すなわち、ＶもＵＶも、狭帯域コードブックが不要となる。
【００８６】
以上のように、コードブックに使用するパラメータを自己相関とした場合は、入力狭帯域音声の自己相関を、広帯域コードベクタを１次おきに取ったものと比較することで量子化できる。この動作は、上記図７のステップＳ４５で部分抽出回路２８及び２９に広帯域コードブックのコードベクトルを１次おきに取らせることにより実現できる。
【００８７】
ここで、コードブックに使用するパラメータを、スペクトル包絡とした場合について考える。この場合、明らかであるが、狭帯域スペクトルは、広帯域スペクトルの一部であるから、狭帯域スペクトルのコードブックは不要である。狭帯域入力音声のスペクトル包絡を、広帯域スペクトル包絡コードベクタの一部と比較をすることによって量子化が可能であることは言うまでもない。
【００８８】
次に、本発明に係る音声合成方法及び装置の実施の形態について図面を参照しながら説明する。この実施の形態は、所定時間単位毎に広帯域音声から抽出した特徴パラメータにより予め作成した広帯域コードブックを備え、入力された複数種類の符号化パラメータを用いて音声を合成する音声合成装置であり、例えば、図９に示すディジタル携帯電話装置の受信機側にあっては、音声復号化器３８と音声合成部３９とから構成される音声合成装置である。
【００８９】
先ず、このディジタル携帯電話装置の構成を説明しておく。ここでは、送信機側と受信機側を別々に記しているが、実際には一つの携帯電話装置内にまとめて内蔵されている。
【００９０】
送信機側では、マイクロホン３１から入力された音声信号を、Ａ／Ｄ変換器３２によりディジタル信号に変換し、音声符号化器３３により符号化してから送信器３４で出力ビットに送信処理を施し、アンテナ３５から送信する。
【００９１】
このとき、音声符号化器３３は、伝送路により制限される狭帯域化を考慮した符号化パラメータを送信器３４に供給する。例えば、符号化パラメータとしては、励振源に関するパラメータや、線形予測係数α、有声音／無声音判定フラグなどがある。
【００９２】
また、受信機側では、アンテナ３６で捉えた電波を、受信器３７で受信し、音声復号化器３８で上記符号化パラメータを復号し、音声合成部３９で上記復号化パラメータを用いて音声を合成し、Ｄ／Ａ変換器４０でアナログ音声信号に戻して、スピーカ４１から出力する。
【００９３】
このディジタル携帯電話装置における、上記音声合成装置の第１の具体例を図１０に示す。この図１０に示す音声合成装置は、上記ディジタル携帯電話装置の送信側の音声符号化器３３から送られてきた符号化パラメータを用いて音声を合成する装置であるため、音声符号化器３３での符号化方法に従った復号化を音声復号化器３８で行う。
【００９４】
音声符号器３３での符号化方法がＰＳＩ−ＣＥＬＰ（Pitch Synchronus Innovation - CELP：ピッチ同期雑音励振源−ＣＥＬＰ）符号化方式によるものであるとすれば、この音声復号化器３８での復号化方法もＰＳＩ−ＣＥＬＰによる。
【００９５】
音声復号化器３８は、上記符号化パラメータの内の第１の符号化パラメータである励振源に関するパラメータから狭帯域励振源に復号した後、ゼロ詰め部１６に供給する。また、上記符号化パラメータの内の第２の符号化パラメータである線形予測係数に関するパラメータをαに変換しα→ｒ（線形予測係数→自己相関）変換回路４に供給する。また、上記符号化パラメータの内の第３の符号化パラメータである有声音／無声音判定フラグをＶ／ＵＶ判定回路５に供給する。
【００９６】
この音声合成装置は、上記音声復号化器３８と、ゼロ詰め部１６と、α→ｒ変換回路４と、Ｖ／ＵＶ判定回路５の他、広帯域有声音及び無声音から抽出した有声音用及び無声音用パラメータを用いて予め作成した広帯域有声音用コードブック１２と広帯域無声音用コードブック１４とを備える。
【００９７】
さらに、この音声合成装置は、広帯域有声音用コードブック１２と広帯域無声音用コードブック１４内の各コードベクトルを部分抽出して狭帯域パラメータを求める部分抽出回路２８及び部分抽出回路２９と、α→ｒ変換回路４からの狭帯域有声音用自己相関を部分抽出回路２８からの狭帯域パラメータを用いて量子化する狭帯域有声音用量子化器７と、上記α→ｒ変換回路４からの狭帯域無声音用自己相関を部分抽出回路２９からの狭帯域パラメータを用いて量子化する狭帯域無声音用量子化器９と、狭帯域有声音用量子化器７からの狭帯域有声音用量子化データを広帯域有声音用コードブック１２を用いて逆量子化する広帯域有声音用逆量子化器１１と、狭帯域無声音用量子化器９からの狭帯域無声音用量子化データを広帯域無声音用コードブック１４を用いて逆量子化する広帯域無声音用逆量子化器１３と、広帯域有声音用逆量子化器１１からの逆量子化データとなる広帯域有声音用自己相関を広帯域有声音用の線形予測係数に変換すると共に広帯域無声音用逆量子化器１３からの逆量子化データとなる広帯域無声音用自己相関を広帯域無声音用の線形予測係数に変換する自己相関→線形予測係数（ｒ→α）変換回路１５と、このｒ→α変換回路１５からの広帯域有声音用線形予測係数と広帯域無声音用線形予測係数とゼロ詰め部１６からの励振源とに基づいて広帯域音声を合成するＬＰＣ合成回路１７とを備えてなる。
【００９８】
また、この音声合成装置は、音声復号化器３８で復号化された狭帯域音声データのサンプリング周波数を８ｋＨｚから１６ｋＨｚにオーバーサンプリングするオーバーサンプル回路１９と、ＬＰＣ合成回路１７からの合成出力から入力狭帯域音声データの周波数帯域３００Ｈｚ〜３４００Ｈｚの信号成分を除去するバンドストップフィルタ（ＢＳＦ）１８と、このＢＳＦ１８からのフィルタ出力にオーバーサンプル回路１９からのサンプリング周波数１６ｋＨｚの周波数帯域３００Ｈｚ〜３４００Ｈｚの基の狭帯域音声データ成分を加算する加算器２０とを備えている。
【００９９】
ここで、上記広帯域有声音及び無声音用コードブック１２及び１４は、上記図２〜図４に示した手順に基づいて作成できる。学習用データとしては、コードブックの品質を良いものとするために、有声音（Ｖ）から無声音（ＵＶ）、ＵＶからＶへの遷移状態のものや、ＶともＵＶとも判別しがたいものは除外してしまい、確実にＶであるものと、確実にＵＶであるもののみを利用する。このようにして、学習用狭帯域Ｖフレームの集まりと、同ＵＶフレームの集まりを作成する。
【０１００】
次に、上記広帯域有声音及び無声音用コードブック１２及び１４を用い、実際に送信側から伝送されてきた符号化パラメータを用いて音声を合成する動作について図１１を参照しながら説明する。
【０１０１】
先ず、音声復号化器３８でデコードされた線形予測係数αは、ステップＳ６１でα→ｒ変換回路４により自己相関ｒに変換される。
【０１０２】
また、音声復号化器３８でデコードされた有声音／無声音判定フラグはステップＳ６２でＶ／ＵＶ判定回路５により解読され、Ｖ／ＵＶの判別が行われる。
【０１０３】
ここで、Ｖと判定されると、α→ｒ変換回路４からの出力を切り替えるスイッチ６は、狭帯域有声音量子化回路７に接続され、ＵＶと判定されると、狭帯域無声音量子化回路９に接続される。
【０１０４】
このＶ／ＵＶの判別も、コードブック作成時とは異なり、ＶにもＵＶにも属さないフレームは発生させず、必ずどちらかに振り分ける。
【０１０５】
ＵＶ判定回路５がＶと判定したときには、ステップＳ６４では、スイッチ６からの有声音用自己相関ｒを狭帯域Ｖ量子化回路７に供給して、量子化する。しかし、この量子化は狭帯域用のコードブックを用いるのではなく、上述したように部分抽出回路２８によりステップＳ６３で求めた狭帯域Ｖ用パラメータを用いる。
【０１０６】
一方、ＵＶ判定回路５がＵＶであるときには、ステップＳ６３では、スイッチ６からの無声音用自己相関ｒを狭帯域ＵＶ量子化回路９に供給して量子化するが、ここでも、狭帯域ＵＶコードブックを用いずに、部分抽出回路２９で演算により求めた狭帯域ＵＶ用パラメータを用いて量子化する。
【０１０７】
そして、ステップＳ６５でそれぞれ対応する広帯域Ｖ逆量子化回路１１又は広帯域ＵＶ逆量子化回路１３により広帯域Ｖコードブック１２又は広帯域ＵＶコードブック１４を用いて逆量子化し、これにより広帯域自己相関が得られる。
【０１０８】
そして、広帯域自己相関はステップＳ６６でｒ→α変換回路１５により広帯域αに変換される。
【０１０９】
一方で、音声復号化器３８からの励振源に関するパラメータは、ステップＳ６７でゼロ詰め部１６によりサンプル間にゼロが詰められることでアップサンプルされ、エイリアシングにより広帯域化される。そして、これが広帯域励振源として、ＬＰＣ合成回路１７に供給される。
【０１１０】
そして、ステップＳ６８で、ＬＰＣ合成回路１７が広帯域αと広帯域励振源とを、ＬＰＣ合成し、広帯域の音声信号が得られる。
【０１１１】
しかし、このままでは予測によって求められた広帯域信号にすぎず、予測による誤差が含まれる。特に入力狭帯域音声の周波数範囲に関しては、入力音声をそのまま利用したほうが良い。
【０１１２】
したがって、入力狭帯域音声の周波数範囲をステップＳ６９でＢＳＦ１８を用いたフィルタリングにより除去してから、ステップ７０でオーバーサンプル回路１９により符号化音声データをオーバーサンプルしたものと、ステップＳ７１で加算する。
【０１１３】
このように、図１０に示した音声合成装置では、量子化時に狭帯域コードブックのコードベクタと比較することによって量子化するのではなく、広帯域コードブックから部分抽出して求められるコードベクタとの比較で量子化する。
【０１１４】
すなわち、デコード中にαパラメータが得られるので、これを利用し、αから狭帯域自己相関に変換、これを広帯域コードブックの各ベクタを1次おきにとったものと比較をし、量子化する。そして同じベクタの今度は全部を用いて逆量子化することで広帯域自己相関を得る。そして広帯域自己相関から広帯域αに変換する。このときに、ゲイン調整および高域の若干の抑圧も先の説明同様に行い、聴感上の品質を向上させている。
【０１１５】
これにより、広帯域コードブックが分析、合成の両用となり、狭帯域コードブックを保持するメモリが不要となる。
【０１１６】
なお、ＰＳＩ−ＣＥＬＰによる音声復号化器３８からの符号化パラメータを用いて音声を合成する音声合成装置としては、図１２に示す音声合成装置も考えられる。この図１２に示す音声合成装置は、部分抽出回路２８及び部分抽出回路２９の代わりに、広帯域コードブック内の各コードベクトルより演算によって狭帯域Ｖ（ＵＶ）パラメータを求める演算回路２５及び２６を用いている。他の構成は上記図１０と同様である。
【０１１７】
次に、上記ディジタル携帯電話装置における、上記音声合成装置の第２の具体例を図１３に示す。この図１３に示す音声合成装置も、上記ディジタル携帯電話装置の送信側の音声符号化器３３から送られてきた符号化パラメータを用いて音声を合成する装置であるため、音声符号化器３３での符号化方法に従った復号化を音声復号化器４６で行う。
【０１１８】
音声符号器３３での符号化方法がＶＳＥＬＰ（Vector Sum Excited Linear Prediction：ベクトル和励起線形予測）符号化方式によるものであるとすれば、この音声復号化器４６での復号化方法もＶＳＥＬＰによる。
【０１１９】
音声復号化器４６は、上記符号化パラメータの内の第１の符号化パラメータである励振源に関するパラメータを励振源切り換え部４７に供給する。また、上記符号化パラメータの内の第２の符号化パラメータである線形予測係数αをα→ｒ（線形予測係数→自己相関）変換回路４に供給する。また、上記符号化パラメータの内の第３の符号化パラメータである有声音／無声音判定フラグをＶ／ＵＶ判定回路５に供給する。
【０１２０】
上記図１０及び図１２に示したＰＳＩ−ＣＥＬＰを用いた音声合成装置と異なるのは、励振源切り換え回路４７をゼロ詰め部１６の前段に設けている点である。
【０１２１】
ＰＳＩ−ＣＥＬＰは、コーデック自体、特にＶを聴感上滑らかに聞こえるような処理を行っているが、ＶＳＥＬＰにはこれがなく、このために帯域幅拡張したときに若干雑音が混入したように聞こえる。そこで、広帯域励振源を作成する際に、励振源切り換え回路４７により図１４のような処理を施す。ここでの処理は、ステップＳ８７〜ステップＳ８９までの処理が上記図１１に示した処理と異なるだけである。
【０１２２】
ＶＳＥＬＰの励振源は、コーデックに利用されるパラメータbeta(長期予測係数), bL[i](長期フィルタ状態),gamma1(利得), c1[i](励起コードベクタ)により、 beta * bL[i] + gamma1 * c1[i] として作成されるが、このうち前者がピッチ成分、後者がノイズ成分を表すので、これをbeta * bL[i]とgamma1 * c1[i]に分け、ステップＳ８７で、一定の時間範囲において、前者のエネルギーが大きい場合にはピッチが強い有声音と考えられるため、ステップＳ８８でＹＥＳに進み、励振源をパルス列とし、ピッチ成分のない部分ではＮＯに進み０に抑圧した。また、ステップＳ８７でエネルギーが大きくない場合には従来どおりとし、こうして作成された狭帯域励振源にステップＳ８９でゼロ詰め部１６によりPSI-CELP同様０を詰めアップサンプルすることにより広帯域励振源とした。これにより、ＶＳＥＬＰにおける有声音の聴感上の品質が向上した。
【０１２３】
なお、ＶＳＥＬＰによる音声復号化器４６からの符号化パラメータを用いて音声を合成する音声合成装置としては、図１５に示す音声合成装置も考えられる。この図１５に示す音声合成装置は、部分抽出回路２８及び部分抽出回路２９の代わりに、広帯域コードブック内の各コードベクトルより演算によって狭帯域Ｖ（ＵＶ）パラメータを求める演算回路２５及び２６を用いている。他の構成は上記図１３と同様である。
【０１２４】
なお、このような音声合成装置においても、図１に示したような広帯域有声音及び無声音から抽出した有声音用及び無声音用パラメータを用いて予め作成した広帯域有声音用コードブック１２と広帯域無声音用コードブック１４と、上記広帯域音声を周波数帯域制限して得た周波数帯域が例えば３００Ｈｚ〜３４００Ｈｚの狭帯域音声信号から抽出した有声音用及び無声音用パラメータにより予め作成した狭帯域有声音用コードブック７と狭帯域無声音用コードブック１０とを用いての音声合成処理も可能である。
【０１２５】
また、低域から高域を予測するものだけに限定するものではない。また、広帯域スペクトルを予測する手段においては、信号を音声に限るものではない。
【０１２６】
【発明の効果】
本発明に係る帯域幅拡張方法及び装置によれば、広帯域スペクトル包絡を予測するためのコードブックを有声音用と無声音用に分けることにより、また、有声音と無声音の判別法を、コードブック作成時と帯域拡張時で異なるものにしたことにより、聴感上品質の良い広帯域音声を得ることができるようになった。
【０１２７】
また、本発明に係る音声合成方法及び装置によれば、コードブックを分析合成両用とすることによりメモリ容量が節約できる。また、演算量を削減することもできる。
【０１２８】
さらに、広帯域励振源を、ピッチが強い場合にパルス列とすることにより、特に有声音における聴感上の品質を向上できる。
【図面の簡単な説明】
【図１】本発明に係る帯域幅拡張方法及び装置の実施の形態となる音声帯域幅拡張装置のブロック図である。
【図２】上記図１に示した音声帯域幅拡張装置に用いているコードブック用のデータを作成する方法を説明するためのフローチャートである。
【図３】上記図１に示した音声帯域幅拡張装置に用いているコードブックを作成する方法を説明するためのフローチャートである。
【図４】上記図１に示した音声帯域幅拡張装置に用いているコードブックを作成する他の方法を説明するためのフローチャートである。
【図５】上記図１に示した音声帯域幅拡張装置の動作を説明するためのフローチャートである。
【図６】上記図１に示した音声帯域幅拡張装置からコードブックの数を減らした変形例の構成を示すブロック図である。
【図７】上記図６に示す変形例の動作を説明するためのフローチャートである。
【図８】上記図１に示した音声帯域幅拡張装置からコードブックの数を減らした他の変形例の構成を示すブロック図である。
【図９】本発明に係る音声合成方法及び装置の実施の形態となる音声合成装置を受信機側に適用したディジタル携帯電話装置の構成を示すブロック図である。
【図１０】本発明に係る音声合成方法及び装置の実施の形態となる、音声復号化器にＰＳＩ−ＣＥＬＰ方式を採用した音声合成装置の構成を示すブロック図である。
【図１１】上記図１０に示した音声合成装置の動作を説明するためのフローチャートである。
【図１２】音声復号化器にＰＳＩ−ＣＥＬＰ方式を採用した音声合成装置の他の構成を示すブロック図である。
【図１３】本発明に係る音声合成方法及び装置の実施の形態となる、音声復号化器にＶＳＥＬＰ方式を採用した音声合成装置の構成を示すブロック図である。
【図１４】上記図１３に示した音声合成装置の動作を説明するためのフローチャートである。
【図１５】音声復号化器にＶＳＥＬＰ方式を採用した音声合成装置の他の構成を示すブロック図である。
【符号の説明】
３ＬＰＣ分析回路、４線形予測係数−自己相関変換回路、７狭帯域有声音用量子化器、８狭帯域有声音用コードブック、９狭帯域無声音用量子化器、１０狭帯域無声音用コードブック、１１広帯域有声音用逆量子化器、１２広帯域有声音用コードブック、１３広帯域無声音用逆量子化器、１４広帯域無声音用コードブック、１５自己相関−線形予測係数変換回路、１６ゼロ詰め回路、１７ＬＰＣ合成回路、１８バンドストップフィルタ、１９オーバーサンプル回路、２０加算器

Claims

所定時間単位毎に広帯域音声から抽出した特徴パラメータにより予め作成した広帯域コードブックを備え、入力された複数種類の符号化パラメータを用いて音声を合成する音声合成方法において、
上記複数種類の符号化パラメータを復号化し、
この復号化された複数種類の符号化パラメータの内の第１の符号化パラメータを用いて励振源を求めると共に、
第２の符号化パラメータを音声合成用の特徴パラメータに変換し、
この音声合成用特徴パラメータを上記広帯域コードブック内の各コードベクトルより部分抽出して求めた狭帯域特徴パラメータと比較することによって量子化し、
この量子化データを上記広帯域コードブックを用いて逆量子化し、
この逆量子化データと上記励振源とに基づいて音声を合成することを特徴とする音声合成方法。
上記広帯域コードブックは所定時間単位毎に有声音と無声音に分けた広帯域音声から抽出した有声音用及び無声音用特徴パラメータにより予め作成された広帯域有声音用及び無声音用コードブックであり、上記入力された複数種類の符号化パラメータの内の第３の符号化パラメータによって判定できる有声音と無声音との判別結果により、上記音声合成用特徴パラメータを、上記広帯域有声音用及び無声音用コードブック内の各コードベクトルより部分抽出して求めた狭帯域特徴パラメータと比較することによって量子化し、この量子化データを上記広帯域有声音用及び無声音用コードブックを用いて逆量子化し、この逆量子化データと上記励振源とに基づいて音声を合成することを特徴とする請求項１記載の音声合成方法。
所定時間単位毎に広帯域音声から抽出した特徴パラメータにより予め作成した広帯域コードブックを備え、入力された複数種類の符号化パラメータを用いて音声を合成する音声合成装置において、
上記複数種類の符号化パラメータを復号化する復号化手段と、
上記復号化手段により復号化された複数種類の符号化パラメータの内の第１の符号化パラメータを用いて励振源を求めると励振源形成手段と、
上記復号化手段により復号化された複数種類の符号化パラメータの内の第２の符号化パラメータを音声合成用の特徴パラメータに変換するパラメータ変換手段と、
上記広帯域コードブック内の各コードベクトルを部分抽出して狭帯域パラメータを求める部分抽出手段と、
上記パラメータ変換手段からの上記特徴パラメータを上記部分抽出手段からの狭帯域パラメータを用いて量子化する量子化手段と、
上記量子化手段からの量子化データを上記広帯域コードブックを用いて逆量子化する逆量子化手段と、
上記逆量子化手段からの逆量子化データと上記励振源形成手段からの励振源とに基づいて音声を合成する合成手段とを備えることを特徴とする音声合成装置。
所定時間単位毎に広帯域音声から抽出したパラメータにより予め作成した広帯域コードブックを備え、入力された狭帯域音声を帯域幅拡張する帯域幅拡張方法において、
上記入力された狭帯域音声から狭帯域パラメータを出力し、
この狭帯域パラメータを、上記広帯域コードブック内の各コードベクトルより部分抽出して求めた狭帯域パラメータと比較することによって量子化し、
この量子化データを上記広帯域コードブックを用いて逆量子化し、
この逆量子化データに基づいて上記狭帯域音声の帯域幅を拡張することを特徴とする帯域幅拡張方法。
所定時間単位毎に広帯域音声から抽出したパラメータにより予め作成した広帯域コードブックを備え、入力された狭帯域音声を帯域幅拡張する帯域幅拡張装置において、
上記入力された狭帯域音声から狭帯域パラメータを出力する狭帯域パラメータ出力手段と、
上記広帯域コードブック内の各コードベクトルを部分抽出して狭帯域パラメータを求める部分抽出手段と、
上記部分抽出手段からの狭帯域パラメータを上記狭帯域パラメータ演算手段からの狭帯域パラメータを用いて量子化する狭帯域音声量子化手段と、
上記狭帯域音声量子化手段からの狭帯域量子化データを上記広帯域コードブックを用いて逆量子化する広帯域音声逆量子化手段とを備え、
上記広帯域音声逆量子化手段からの逆量子化データに基づいて上記狭帯域音声の帯域幅を拡張することを特徴とする帯域幅拡張装置。