JP2014016622A

JP2014016622A - 修正離散コサイン変換音声符号化器用の帯域幅拡大方法及び装置

Info

Publication number: JP2014016622A
Application number: JP2013173691A
Authority: JP
Inventors: Ramabadran Tenkasi; ラマバドラン、テンカシ; Jasiuk Mark; ジャシウク、マーク
Original assignee: Motorola Mobility LLC
Current assignee: Motorola Mobility LLC
Priority date: 2009-02-04
Filing date: 2013-08-23
Publication date: 2014-01-30
Also published as: WO2010091013A1; BRPI1008520A2; JP2012514763A; US8463599B2; MX2011007807A; CN102308333B; EP2394269B1; EP2394269A1; US20100198587A1; KR20110111463A; BRPI1008520B1; KR101341246B1; CN102308333A; JP5597896B2

Abstract

【課題】ＭＤＣＴベースの発話／音声符号化器に適用可能な帯域幅拡大方法及び装置を提供する。
【解決手段】方法は、第１周波数帯域内にスペクトルを備えている信号１０１のための遷移帯域１０３を設定することを含み、前記遷移帯域は、前記第１周波数帯域１０４の一部として設定され、前記第１周波数帯域１０４に隣接する隣接周波数帯域１０５の近くに配置される。遷移帯域１０３を解析し、遷移帯域スペクトル包絡線と遷移帯域励起スペクトルを取得し、隣接周波数帯域スペクトル包絡線を評価し、信号のピッチ周波数によって決定される繰返し周期を備えた遷移帯域励起スペクトルの少なくとも一部の周期的繰返しによって、隣接周波数帯域励起スペクトルを生成し、隣接周波数帯域スペクトル包絡線と隣接周波数帯域励起スペクトルとを組み合わせ、隣接周波数帯域信号スペクトルを得る信号処理論理部を含む。
【選択図】図１

Description

本開示内容は、音声符号化器及び可聴内容の表現に関し、特に音声符号化器用の帯域幅拡大技術に関する。

本開示内容は、米国特許出願第１１／９４６，９７８号、代理人整理番号ＣＭＬ０４９０９ＥＶ、出願日２００７年１１月２９日、発明の名称「信号外帯域幅の内容に対するスペクトル包絡線形状を決定するエネルギ値の提供及び使用を容易にする方法及び装置（ＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＴＯＦＡＣＩＬＩＴＡＴＥＰＲＯＶＩＳＩＯＮＡＮＤＵＳＥＯＦＡＮＥＮＥＲＧＹＶＡＬＵＥＴＯＤＥＴＥＲＭＩＮＥＡＳＰＥＣＩＡＬＥＮＶＥＬＯＰＥＳＨＡＰＥＦＯＲＯＵＴ−ＯＦ−ＳＩＧＮＡＬＢＡＮＤＷＩＤＴＨＣＯＮＴＥＮＴ）」、米国特許出願第１２／０２４，６２０号、代理人整理番号ＣＭＬ０４９１１ＥＶ、出願日２００８年２月１日、発明の名称「帯域幅拡大システム内の高帯域エネルギ評価用の方法及び装置（ＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＥＳＴＩＭＡＴＩＮＧＨＩＧＨ−ＢＡＮＤＥＮＥＲＧＹＩＮＡＢＡＮＤＷＩＤＴＨＥＸＴＥＮＳＩＯＮＳＹＳＴＥＭ）」、米国特許出願第１２／０２７，５７１号、代理人整理番号ＣＭＬ０６６７２ＡＵＤ、出願日２００８年２月７日、発明の名称「帯域幅拡張システム内の高帯域エネルギ評価用の方法及び装置（ＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＥＳＴＩＭＡＴＩＮＧ
ＨＩＧＨ−ＢＡＮＤＥＮＥＲＧＹＩＮＡＢＡＮＤＷＩＤＴＨＥＸＴＥＮＳＩＯＮＳＹＳＴＥＭ）」に関し、これらは全て参照により本明細書に組み込まれる。

携帯電話上の電話発話は通常、可聴音声スペクトルの一部、例えば、３００〜３４００Ｈｚの音声スペクトル内の狭帯域発話のみを利用していた。通常の発話に比べて、このような狭帯域の発話は、こもった音質で明瞭度は低い。従って、符号化器出力の認識される音質を人工的に改善するために、「帯域幅拡大」又は「ＢＷＥ」と呼ばれる、発話符号化器の出力の帯域幅を拡大する様々な方法が適用することができる。

ＢＷＥ方式は、パラメトリックであっても非パラメトリックであってもよいが、大部分の既知のＢＷＥ技術はパラメトリックである。パラメータは、発話生成のソースフィルタモデルから生じ、そこでは、発話信号は声道によって音響的にフィルタ処理された励起ソース信号と考えられる。声道は、例えば、線形予測（linear prediction:LP）技術を用いる全極型フィルタによってモデル化してフィルタ係数を計算できる。ＬＰ係数は、発話スペクトル包絡線情報を効果的にパラメータ化する。他のパラメトリック法では、線スペクトル周波数（line spectral frequencies:LSF）、メル周波数ケプストラム係数（mel-frequency cepstral coefficients:MFCC）、及び対数スペクトル包絡線サンプル（log-spectral envelope samples:LES）を用いて、発話スペクトル包絡線をモデル化する。

多くの現在の発話／音声符号化器は、入力信号の修正離散コサイン変換（Modified Discrete Cosine Transform:MDCT）表現を利用し、従って、ＭＤＣＴベースの発話／音声符号化器に適用可能なＢＷＥ法が必要とされる。

本開示内容は、符号化器の帯域幅拡張用の方法を提供し、第１周波数帯域内にスペクトルを備えている信号用の遷移帯域を定義することを含み、前記遷移帯域は、前記第１周波
数帯域の一部として定義され、前記第１周波数帯域に隣接する隣接周波数帯域の近くに配置されている。前記方法は、遷移帯域を解析し、遷移帯域スペクトル包絡線と遷移帯域励起スペクトルを取得し、隣接周波数帯域スペクトル包絡線を評価し、信号のピッチ周波数によって決定される繰返し周期を備えた遷移帯域励起スペクトルの少なくとも一部の周期的繰返しによって、隣接周波数帯域励起スペクトルを生成し、隣接周波数帯域スペクトル包絡線と隣接周波数帯域励起スペクトルを組み合わせ、隣接周波数帯域信号スペクトルを得る。前記方法を行うための信号処理論理部も開示される。

高周波帯域信号スペクトルを評価するために、本実施例で用いられる前記高周波数帯域近傍に遷移帯域を備えている音声信号を示す図である。本実施形態による符号化器の基本動作の流れ図である。本実施形態による符号化器の動作を更に詳しく示す流れ図である。本実施形態による符号化器を用いる通信装置のブロック図である。本実施形態による符号化器のブロック図である。本実施形態による符号化器のブロック図である。

本実施形態によると、帯域幅拡張は、４〜７ｋＨｚ等の一つの周波数帯域をモデル化する発話又は音声符号化器によって生成された少なくとも量子化ＭＤＣＴ係数を用いて実施して、７〜１４ｋＨｚ等の別の周波数帯域をモデル化するＭＤＣＴ係数を予測してもよい。

ここで、同様の参照番号は同様の要素を表している図面を参照すると、図１は、０〜ＹｋＨｚの範囲の可聴スペクトル１０２上の音声信号１０１を表すグラフ１００（正確な縮尺ではない）である。信号１０１は、低帯域部分１０４と、低帯域発話の一部としては復元されない高帯域部分１０５を備えている。本実施形態によると、高帯域部分１０５を評価するために、遷移帯域１０３が選択され利用される。入力信号は、様々な形態で取得できる。例えば、信号１０１は、移動局に送られた通信システムのデジタル無線チャネル上で受け取った発話であってもよい。信号１０１は、例えば、格納された音声ファイルからの音声再生装置内のメモリから得られてもよい。

図２は、本実施形態による符号化器の基本動作を示している。２０１では、遷移帯域１０３が、信号１０１の第１周波数帯域１０４内で定義される。遷移帯域１０３は、第１周波数帯域の一部として定義され、隣接周波数帯域（高帯域部１０５等）の近傍に配置される。２０３では、遷移帯域１０３を解析し、遷移帯域スペクトルデータを取得し、２０５では、遷移帯域スペクトルデータを用いて、隣接周波数帯域信号スペクトルを生成する。

図３は、一実施形態の動作を更に詳しく示している。３０１では、遷移帯域が２０１と同様に定義される。３０３では、遷移帯域を解析し、遷移帯域スペクトル包絡線と遷移帯域励起スペクトルを含む遷移帯域スペクトルデータを得る。３０５では、隣接周波数帯域スペクトル包絡線を評価する。それから、入力信号のピッチ周波数によって決定された繰返し周波数を備えた遷移帯域励起スペクトルの少なくとも一部の周期的繰返しによって、３０７に示したように、隣接周波数帯域励起スペクトルを生成する。３０９に示したように、隣接周波数帯域スペクトル包絡線と隣接周波数帯域励起スペクトルを組み合わせ、隣接周波数帯域の信号スペクトルを取得できる。

図４は、本実施形態による電子装置４００の要素を示すブロック図である。電子装置は、移動局、ラップトップコンピュータ、携帯情報端末（ＰＤＡ）、ラジオ、音声再生器（ＭＰ３再生器等）であってもよく、もしくは、有線又は無線通信を介して、音声信号を受け取り、本明細書で開示された実施形態の方法及び装置を用いて音声信号を復号化できる任意の他の適切な装置であってもよい。電子装置４００は、本実施形態による信号処理論理部４０５に音声信号を提供する入力部４０３を含む。

図４、並びに図５及び図６は、例示的な目的だけのため、当業者に例示するために、本明細書に記載されている実施形態を作製し使用するために必要な論理部であると理解される。従って、本明細書の図面は、例えば、電子装置を実装するために必要な全ての要素の完全な概略図であることを意図しておらず、むしろ、本明細書に記載されている実施形態の作製及び使用方法を、当業者が容易に理解するために必要なものだけを示していると理解される。従って、論理部の様々な構成と図の任意の内部要素、及びそれらの間の任意の対応する接続性を利用することもでき、このような構成及び対応する接続性も、本明細書に開示されている実施形態によるものに留まっていると理解される。

「論理部」という用語は、本明細書で用いられているように、一つ以上のプログラム可能プロセッサ、ＡＳＩＣ、ＤＳＰ、配線論理部又はそれらの組合せ上で実行するソフトウェア及びファームウェアの少なくとも一方を含んでいる。従って、本実施形態によると、例えば、信号処理論理部４０５を含む任意の記載された論理部が、任意の適切な形態で実装され、本明細書に開示されている実施形態によるものに留まっている。

電子装置４００は、信号を受け取るための受信器、又は送受信器、フロントエンド部４０１、及び任意の必要な一つ以上のアンテナを含むことができる。従って、受信器４０１及び入力論理部４０３の少なくとも一方は、別個に又は組み合わせて、全ての必要な論理部を含んで、信号処理論理部４０５による更なる処理に適した、信号処理論理部４０５に適切な音声信号を提供する。信号処理論理部４０５は、いくつかの実施形態では、一つ以上のコードブック４０７及び参照表４０９を含んでいてもよい。参照表４０９は、スペクトル包絡線参照表であってもよい。

図５は、信号処理論理部４０５の更なる詳細を提供する。信号処理論理部４０５は、評価及び制御論理部５００を含み、ＭＤＣＴ係数の組を決定して音声信号の高帯域部を表す。逆ＭＤＣＴ（ＩＭＤＣＴ）５０１は、信号を時間領域に変換するように用いられ、それから合計演算５０５を用いて、音声信号の低帯域部５０３と組み合わせられ、帯域幅拡大音声信号を得る。それから、帯域幅拡大音声信号が、音声出力論理部（図示せず）に出力される。

いくつかの実施形態の更なる詳細は、図６によって例示されるが、例示されるいくつかの論理部は、全ての実施形態になくてもよく、存在する必要もない。例示のために、以降では、低帯域は５０Ｈｚ〜７ｋＨｚ範囲（名目上、広帯域発話／音声スペクトルと呼ばれる）をカバーすると考えられ、高帯域は７ｋＨｚ〜１４ｋＨｚの範囲をカバーすると考えられる。低帯域と高帯域の組合せ、つまり５０Ｈｚ〜１４ｋＨｚの範囲は、名目上、超広帯域発話／音声スペクトルと呼ばれる。明らかに、低帯域と広帯域の他の選択も可能であり、本実施形態によるものに留まっている。また、例示のために、入力ブロック４０３（基準符号化器の一部）が、ｉ）復号化済み広帯域発話／音声信号Ｓ_ｗｂ、ｉｉ）少なくとも遷移帯域に対応するＭＤＣＴ係数、及びｉｉｉ）ピッチ周波数６０６又は対応するピッチ期間／遅延、という信号を提供するように示されている。入力ブロック４０３は、いくつかの実施形態では、復号化済み広帯域発話／音声信号のみを提供できるが、他の信号は、この場合、復号化器においてそれから抽出される。図６に例示されているように、入力ブロック４０３から、一組の量子化ＭＤＣＴ係数を６０１で選択し、遷移帯域を表す。例えば、４〜７ｋＨｚの周波数帯域が遷移帯域として利用できるが、他のスペクトル部分を用いることもでき、それも本実施形態によるものに留まっている。

次に、復号化済み広帯域発話／音声（例えば、最大７ｋＨｚ）から計算した所定のパラメータと共に、所定の遷移帯域ＭＤＣＴ係数を用いて、ＭＤＣＴの評価済みの組を生成し、例えば、７〜１４ｋＨｚの隣接帯域内の信号内容（signal content）を特定する。従って、所定の遷移帯域ＭＤＣＴ係数は、遷移帯域解析論理部６０３及び遷移帯域エネルギ評価器６１５に提供される。遷移帯域を表す、量子化ＭＤＣＴ係数内のエネルギは、遷移帯域エネルギ評価器６１５の論理部によって計算される。遷移帯域エネルギ評価器６１５の論理部の出力はエネルギ値であり、復号化済み広帯域発話／音声信号の遷移帯域内のエネルギに密接に関連しているが、同一ではない。

６１５で決定されたエネルギ値は、高帯域エネルギ予測器６１１に入力され、高帯域エネルギ予測器６１１は、隣接帯域、例えば、７〜１４ｋＨｚの周波数帯域をモデル化するＭＤＣＴ係数のエネルギを計算する非線形エネルギ予測器である。いくつかの実施形態では、高帯域エネルギ予測器６１１の性能を向上させるために、高帯域エネルギ予測器６１１は、遷移帯域形状評価器６０９によって決定された遷移帯域スペクトル部のスペクトル包絡線形状と共に、ゼロ交差計算器６１９によって計算された復号化済み発話からのゼロ交差を用いることができる。ゼロ交差値と遷移帯域形状に依存して、異なる非線形予測器を用いて、予測器性能の改善をもたらす。予測器の設計では、大きなトレーニングデータベース（training database）が、ゼロ交差値と遷移帯域形状に基づいて複数の区画にまず分割され、そうして生成された区画の各々に対して、別個の予測器係数が計算される。

具体的には、ゼロ交差計算器６１９の出力は、フレームゼロ交差を量子化する８レベルスカラ量子化器を用いて量子化され、同様に、遷移帯域形状評価器６０９は、スペクトル包絡線形状を分類する８形状スペクトル包絡線のベクトル量子化器（vector quantizer:VQ）であってもよい。従って、最大６４個（つまり、８×８）の各フレームにおいて、非線形予測器が提供され、所定の区画に対応する予測器が、そのフレームにおいて用いられる。大部分の実施形態では、６４個の区画の一部は、フレームを含めるようにするために、トレーニングデータベースからの十分な数のフレームを割り当てられていないので、６４個より少ない予測器が用いられ、それらの区画は、その結果として近傍の区画と融合される。低エネルギフレーム上でトレーニングされた別個のエネルギ予測器（図示せず）は、本実施形態によるこのような低エネルギフレームのために用いることもできる。

遷移帯域（４〜７ｋＨｚ）に対応するスペクトル包絡線を計算するために、その帯域内の信号を表すＭＤＣＴ係数が、絶対値演算器によってブロック６０３でまず処理される。次に、ゼロ値である処理済みＭＤＣＴ係数を識別し、ゼロでクリアした振幅は、境界の非ゼロ値のＭＤＣＴ振幅（線形補間演算器の適用前に（例えば、係数５で）縮小されている）線形補間によって得られた値によって置き換えられる。上記のようなゼロ値ＭＤＣＴ係数の除去は、ＭＤＣＴ振幅スペクトルのダイナミックレンジを低減し、修正ＭＤＣＴ係数から計算されるスペクトル包絡線のモデル化効率を改善する。

それから、修正ＭＤＣＴ係数は、２０＊ｌｏｇ１０（ｘ）演算器（図示せず）を用いて、ｄＢ領域に変換される。７〜８ｋＨｚの帯域では、ｄＢスペクトル（dB spectrum）は、７ｋＨｚに対応する周波数インデックスについてスペクトル畳み込みによって得られ、４〜７ｋＨｚ周波数帯域に対して計算されるスペクトル包絡線のダイナミックレンジを更に低減する。４〜８ｋＨｚの周波数帯域に対してこのようにして構成されたｄＢスペクトルに対して、逆離散フーリエ変換（Inverse Discrete Fourier Transform:IDFT）を次に適用し、最初の８個の（疑似）ケプストラム係数を計算する。それから、ｄＢスペクトル包絡線は、ケプストラム係数上で離散フーリエ変換（Discrete Fourier Transform:DFT）演算を行うことによって計算される。

得られる遷移帯域ＭＤＣＴスペクトル包絡線は、二つの方法で用いられる。第１に、それは、遷移帯域スペクトル包絡線のベクトル量子化器、つまり、遷移帯域形状評価器６０９に対する入力を構成し、入力スペクトル包絡線に最も近い、事前に格納したスペクトル包絡線（８個中の１個）のインデックスを返す。そのインデックスは、復号化済み発話から計算したゼロ交差のスカラ量子化器によって返されたインデックス（８個中の１個）と共に用いられ、既に詳しく説明したように、最大６４個の非線形エネルギ予測器の一つを選択する。第二に、計算済みスペクトル包絡線を用いて、遷移帯域ＭＤＣＴ係数のスペクトル包絡線を平坦化する。これを行うことができる一つの方法は、その対応するスペクトル包絡線値によって、各遷移帯域ＭＤＣＴ係数を除算することである。平坦化は、ログ領域でも実施できるが、その場合、除算は減算に置き換えられる。後者の実施では、ログ領域への変換は正の値の入力を必要とするので、ＭＤＣＴ係数の符号（又は極性）は後で復元するために保存される。本実施形態では、平坦化はログ領域で実施されている。

それから、ブロック６０３によって出力された（遷移帯域ＭＤＣＴ励起スペクトルを表す）平坦化済み遷移帯域ＭＤＣＴ係数を用いて、７〜１４ｋＨｚの帯域内の励起信号をモデル化するＭＤＣＴ係数を生成する。一実施形態では、初期のＭＤＣＴインデックスが、３２ｋＨｚのサンプリングで０、２０ｍｓのフレームサイズであると仮定すると、遷移帯域に対応するＭＤＣＴインデックスの範囲は１６０〜２７９になる。平坦化済み遷移帯域ＭＤＣＴ係数を考慮すると、７〜１４ｋＨｚに対応する２８０〜５５９のインデックスの励起を表すＭＤＣＴ係数は、次のマッピングを用いて生成される。

所定のフレームに対する周波数遅延の値Ｄは、コアコーデック送信情報の一部である２０ｍｓフレームの最後のサブフレームに対する長期予測器（long term predictor:LTP）遅延の値から計算される。この復号化済みＬＴＰ遅延から、フレームのための評価済みピッチ周波数値を計算し、このピッチ周波数値の最大整数倍を識別し、（ＭＤＣＴインデックス領域で定義された）１２０以下である対応する整数の周波数遅延値Ｄを生成する。この方式は、平坦化済み遷移帯域ＭＤＣＴ情報の再使用を保証し、４〜７ｋＨｚ帯域内のＭＤＣＴ係数の間の調和関係を保存し、７〜１４ｋＨｚ帯域に対してＭＤＣＴ係数が評価される。もしくは、白色雑音シーケンス入力から計算されるＭＤＣＴ係数を用いて、７〜１４ｋＨｚの帯域内の平坦化済みＭＤＣＴ係数の評価を構成できる。どちらの方法でも、７〜１４ｋＨｚ帯域内の励起情報を表すＭＤＣＴ係数の評価は、高帯域励起生成器６０５によって構成される。

非線形エネルギ予測器によって出力された７〜１４ｋＨｚ帯域内のＭＤＣＴ係数の予測済みエネルギ値は、復号化済み広帯域信号特性に基づいて、エネルギ適応器６１７の論理部によって適応され、アーチファクトを最小化し、帯域幅拡大出力発話の品質を改善する。この目的のために、エネルギ適応器６１７は、予測済み高帯域エネルギ値に加えて、ｉ）高帯域エネルギ予測器６１１からの予測誤差の標準偏差σ、ｉｉ）発声レベル評価器６２１からの発声レベルν、ｉｉｉ）開始／破裂音検出器６２３の出力ｄ、及びｉｖ）定常状態／遷移検出器６２５の出力ｓｓ、の入力を受け取る。

７〜１４ｋＨｚの帯域内のＭＤＣＴ係数の予測済み及び適応済みエネルギ値を考慮すると、そのエネルギ値に一致するスペクトル包絡線が、コードブック４０７から選択される。７〜１４ｋＨｚの帯域内のＭＤＣＴ係数を特徴付け、その帯域内のエネルギ値によって分類されたスペクトル包絡線をモデル化する、このようなスペクトル包絡線のコードブックは、オフラインでトレーニングされる。予測済み及び適応済みエネルギ値に最も近いエネルギクラスに対応する包絡線は、高帯域包絡線選択器６１３によって選択される。

選択されたスペクトル包絡線は、高帯域包絡線選択器６１３によって高帯域ＭＤＣＴ生成器６０７に提供され、それから、７〜１４ｋＨｚの帯域内の平坦化済み励起をモデル化するＭＤＣＴ係数を成形するように適用される。高帯域ＭＤＣＴスペクトルを表す７〜１４ｋＨｚの帯域に対応する成形済みＭＤＣＴ係数は、逆修正コサイン変換（inverse modified cosine transform:IMDCT）５０１に次に適用され、７〜１４ｋＨｚの帯域内の内容を備えている時間領域信号を構成する。それから、この信号は、例えば、合計演算５０５によって、最大７ｋＨｚの内容を備えている復号化済み広帯域信号、つまり、低帯域部５０３と組み合わせられ、最大１４ｋＨｚの情報を含む帯域幅拡大信号を構成する。

一方式によって、上記の予測済み及び適応済みエネルギ値は、複数の対応する候補スペクトル包絡線形状を含む参照表４０９へのアクセスを容易にするために役立つ。このような方式をサポートするために、この装置は、信号処理論理部４０５に動作可能なように結合され、必要であれば、一つ以上の参照表４０９を含むこともできる。そう構成される場合、信号処理論理部４０５は、必要に応じて、参照表４０９に容易にアクセスできる。

上記の信号処理は、基地局と無線通信中の移動局によって行うこともできると理解される。例えば、基地局は、既存の手段を介して、移動局に広帯域又は狭帯域デジタル音声信号を送信できる。いったん受信されると、移動局内の信号処理論理部は、必要な動作を行い、移動局の使用者にとってより明確で、聴覚的に好ましいデジタル音声信号の帯域幅拡張版を生成する。

更に、いくつかの実施形態では、発声レベル評価器６２１は、高帯域励起生成器６０５と共に用いることができる。例えば、未発声の発話を示す発声レベル０は、雑音励起の使用を決定するように用いることができる。同様に、発声の発話を示す発声レベル１は、上記のように、遷移帯域励起から導かれた高帯域励起の使用を決定するように用いることができる。発声レベルが、混合発声の発話を示す０と１の間である場合、発声レベルによって決定され使用されるように、適切な割合で様々な励起を混合することができる。雑音励起は、疑似ランダム雑音関数であってもよく、上記のように、発声レベルに基づいて、スペクトル内の割れ目を充填又は継ぎ合わせるものと考えてもよい。従って、混合高帯域励起は、発声、未発声、及び混合発声の音声に適している。

図６は、遷移帯域ＭＤＣＴ係数選択器の論理部６０１、遷移帯域解析論理部６０３、高帯域励起発生器６０５、高帯域ＭＤＣＴ係数発生器６０７、遷移帯域形状評価器６０９、高帯域エネルギ予測器６１１、高帯域包絡線選択器６１３、遷移帯域エネルギ評価器６１５、エネルギ適応器６１７、ゼロ交差計算器６１９、発声レベル評価器６２１、開始／破裂音検出器６２３、及びＳＳ／遷移検出器６２５を含む評価制御論理部５００を示している。

入力部４０３は、復号化済み広帯域発話／音声信号Ｓ_ｗｂ、少なくとも遷移帯域に対応するＭＤＣＴ係数、及び各フレームのピッチ周波数（又は遅延）を供給する。遷移帯域ＭＤＣＴ選択器の論理部６０１は、基準符号化器の一部であり、遷移帯域用の一組のＭＤＣＴ係数を、遷移帯域解析論理部６０３と遷移帯域エネルギ評価器６１５に供給する。

発声レベル評価：発声レベルを評価するために、ゼロ交差計算器６１９は、次のように、高帯域発話Ｓ_ｗｂの各フレーム内のゼロ交差ｚｃの数を計算できる。

ここで、

ここで、ｎはサンプルインデックスであり、Ｎはサンプル内のフレームサイズである。評価及び制御論理部５００で用いられるフレームサイズと重複割合（percent overlap）は、基準符号化器によって決定され、例えば、３２ｋＨｚのサンプリング周波数においてＮ＝６４０、５０％の重複である。上記のように計算されるｚｃパラメータの値は、０〜１の範囲である。ｚｃパラメータから、発声レベル評価器６２１は、発声レベルνを次のように評価できる。

ここで、ＺＣ_ｌｏｗとＺＣ_ｈｉｇｈは、適切に選択された低閾値と高閾値を各々表し、例えば、ＺＣ_ｌｏｗ＝０．１２５とＺＣ_ｈｉｇｈ＝０．３０である。

高帯域エネルギを評価するために、遷移帯域エネルギ評価器６１５は、遷移帯域ＭＤＣＴ係数から遷移帯域エネルギを評価する。遷移帯域は、広帯域内に含まれ、高帯域に近い周波数帯域としてここでは定義され、つまり、高帯域（この例示では、約７０００〜１４，０００ｋＨｚである）への遷移として役立つ。遷移帯域エネルギＥ_ｔｂを計算する一つの方法は、遷移帯域内のスペクトル成分のエネルギ、つまり、ＭＤＣＴ係数を合計することである。

ｄＢ（デシベル）単位の遷移帯域エネルギＥ_ｔｂから、ｄＢ単位の高帯域エネルギＥ_ｈｂ０は、次のように評価される。

ここで、係数αとβは、トレーニング発話／音声データベースからの多数のフレーム上での高帯域エネルギの真の値と評価値の間の平均二乗誤差を最小化するように選択される。

評価精度は、遷移帯域形状評価器６０９によって提供されるように、ゼロ交差パラメータｚｃと遷移帯域スペクトル形状等の追加の発話パラメータからの状況情報を活用することによって更に改善できる。既に議論したように、ゼロ交差パラメータは、発話発声レベルを示している。遷移帯域形状評価器６０９は、遷移帯域包絡線形状の高解像度表現を提供する。例えば、遷移帯域スペクトル包絡線形状（ｄＢ単位）のベクトル量子化表現を用いてもよい。ベクトル量子化器（ＶＱ）コードブックは、大きなトレーニングデータベースから計算される遷移帯域スペクトル包絡線形状パラメータｔｂｓと呼ばれる８個の形状からなる。性能改善を実現するために、ｚｃ及びｔｂｓパラメータを用いて、対応するｚｃ−ｔｂｓパラメータ面を構成してもよい。既に述べたように、ｚｃ−ｔｂｓ面は、ｚｃの８個のスカラ量子化レベルと８個のｔｂｓ形状に対応する６４個の区画に分割される。区画のいくつかは、トレーニングデータベースからの十分なデータ点がない場合、近傍の区画と融合できる。ｚｃ−ｔｂｓ面内の残りの区画の各々に対しては、別個の予測器係数が計算される。

高帯域エネルギ予測器６１１は、例えば、次式の評価器Ｅ_ｈｂ０の評価で電力Ｅ_ｔｂを用いることによって、評価精度を更に改善できる。

この場合、ｚｃ−ｔｂｓパラメータ面の各区画に対して、５個の異なる係数、つまり、α_４、α_３、α_２、α_１、及びβが選択される。Ｅ_ｈｂ０を評価するための上の式は非線形であるので、入力信号レベル、つまり、エネルギが変化する際、評価済み高帯域エネルギを調整するために、特別な注意が払われなければならない。これを実現する一つの方法は、ｄＢ単位の入力信号レベルを評価し、名目上の信号レベルに応じてＥ_ｔｂを上下に調整し、Ｅ_ｈｂ０を評価し、実際の信号レベルに応じてＥ_ｈｂ０を上下に調整することである。

高帯域エネルギの評価は、誤差を生じやすい。過大評価はアーチファクトをもたらすので、評価済み高帯域エネルギは、Ｅ_ｈｂ０の評価誤差の標準偏差に比例する量だけ下に偏移させる。つまり、高帯域エネルギは、次式のようにエネルギ適応器６１７で適応させる。

ここで、Ｅ_ｈｂ１はｄＢ単位の適応済み高帯域エネルギであり、Ｅ_ｈｂ０はｄＢ単位の評価済み高帯域エネルギであり、λ≧０は比例定数であり、σはｄＢ単位の評価誤差の標準偏差である。従って、評価済み高帯域エネルギレベルの決定後、評価済み高帯域エネルギレベルは、評価済み高帯域エネルギの評価精度に基づいて修正される。図６を参照すると、高帯域エネルギ予測器６１１は更に、高帯域エネルギレベルの評価の一定量の不信頼度を決定し、エネルギ適応器６１７は、一定量の不信頼度に比例する量だけ、評価済み高帯域エネルギレベルを下げるように偏移させる。一実施形態では、一定量の不信頼度は、評価済み高帯域エネルギレベルの誤差の標準偏差σを含んでいる。本実施形態に範囲から逸脱することなく、他の量の不信頼度を用いることもできる。

評価済み高帯域エネルギを「下に偏移させること」によって、エネルギの過大評価の可能性（又は発生回数）を減らし、それによってアーチファクトの数を減らす。また、評価済み高帯域エネルギを低減する量は、評価がどれだけよいかに比例し、より信頼性の高い（つまり、σ値が低い）評価は、信頼性の低い評価より小さな量だけ低減される。高帯域エネルギ予測器６１１を設計する際、ｚｃ−ｔｂｓパラメータ面の各区画に対応するσ値は、トレーニング発話データベースから計算され、後で、評価済み高帯域エネルギを「下に偏移させる」際に使用するために格納される。例えば、ｚｃ−ｔｂｓパラメータ面の区画（≦６４個）のσ値は、約４〜８ｄＢの範囲で、約５．９ｄＢの平均値を備えている。例えば、この高帯域エネルギ予測器に対するλの適切な値は、１．２である。

従来技術の方式では、高帯域エネルギの過大評価は、高帯域エネルギ予測器６１１の設計（design）での過小評価誤差より多くの過大評価誤差のペナルティを科す非対称コスト関数を用いることによって処理される。この従来技術の方式に比べて、本明細書に記載されている「下に偏移させる」方式は、以降の利点を備えている。（Ａ）標準的な対称の「二乗誤差」コスト関数に基づくので、高帯域エネルギ予測器６１１の設計がより簡単になる。（Ｂ）「下に偏移させること」が、演算段階中に明示的に行われ（設計段階中に暗示的に行われない）ので、「下に偏移させる」量を必要に応じて容易に制御できる。（Ｃ）評価の信頼性に対する「下に偏移させる」量の依存性が（設計段階中に用いられる特定のコスト関数に暗示的に依存する代わりに）明示的であり、直接的である。

エネルギの過大評価によるアーチファクトの低減に加えて、上記の「下に偏移させる」方式は、発声フレームに対して別の利点を備え、つまり、高帯域スペクトル包絡線形状評価の任意の誤差をマスキングし、その結果、「雑音性の」アーチファクトを低減できる。しかし、未発声のフレームの場合、評価済み高帯域エネルギの低減が大きすぎると、帯域拡大出力発話は、もはや超広帯域発話のような音ではない。これに対応するために、評価済み高帯域エネルギは、その発声レベルに依存して、次式のようにエネルギ適応器６１７で更に適応させる。

ここで、Ｅ_ｈｂ２はｄＢ単位の発声レベル適応済み高帯域エネルギであり、νは未発声の発話の場合の０から発声発話の場合の１までの範囲の発声レベルであり、δ_１とδ_２（δ_１＞δ_２）はｄＢ単位の定数である。δ_１とδ_２の選択は、「下に偏移させる」ために用いられるλの値に依存し、最良の音声出力発話を生成するために経験的に決定される。例えば、λが１．２と選ばれる場合、δ_１とδ_２は３．０と−３．０に各々選択されてもよい。なお、λの値を他に選択すると、δ_１とδ_２も異なる選択が可能であり、δ_１とδ_２の値は両方とも正であっても、負であっても、逆の符号であってもよい。未発声発話のエネルギレベルの増大は、広帯域入力に比べて帯域幅拡大出力内のこのような発話を強調し、このような未発声セグメントのより適切なスペクトル包絡線形状の選択に役立つ。

図６を参照すると、発声レベル評価器６２１は、エネルギ適応器６１７に発声レベルを出力し、エネルギ適応器６１７は、発声レベルに基づいて、評価済み高帯域エネルギレベルを更に修正することによって、広帯域信号特性に基づいて評価済み高帯域エネルギレベルを更に修正する。更に修正することは、実質的な発声発話に対して高帯域エネルギレベルを低減すること、及び実質的に未発声の発話に対して高帯域エネルギレベルを増大させることの少なくとも一方を含んでいる。

エネルギ適応器６１７を伴った高帯域エネルギ予測器６１１が、大部分のフレームに対してかなりよく機能している一方、高帯域エネルギが著しく過小評価又は過大評価されるフレームが時々存在する。従って、いくつかの実施形態では、このような評価誤差に備え、平滑化フィルタを含むエネルギ経路平滑化論理部（図示せず）を用いて、それらを少なくとも部分的に補正する。従って、広帯域信号特性に基づいて、評価済み高帯域エネルギレベルを修正するステップは、評価済み高帯域エネルギレベル（上記のように、評価の標準偏差σと発声レベルνに基づいて既に修正されている）を平滑化し、連続的なフレームの間のエネルギ差を基本的に低減することを含んでいてもよい。

例えば、発声レベル適応済み高帯域エネルギＥ_ｈｂ２は、次式の３点平均化フィルタを用いて平滑化されてもよい。

ここで、Ｅ_ｈｂ３は平滑化済み評価であり、ｋはフレームインデックスである。特に、評価が「異常値」であるとき、つまり、フレームの高帯域エネルギ評価が、隣接するフレームの評価に比べて高すぎる又は低すぎるとき、平滑化で連続的なフレームの間のエネルギ差を低減する。従って、平滑化は、出力帯域幅拡大発話内のアーチファクトの数を低減するのに役立つ。３点平均化フィルタは、１フレームの遅延をもたらす。エネルギ経路を平滑化するために、遅延を含む又は含まない他の種類のフィルタを設計することもできる。

平滑化済みエネルギ値Ｅ_ｈｂ３は、最終的な適応済み高帯域エネルギ評価Ｅ_ｈｂを得るために、エネルギ適応器６１７によって更に適応される。この適応は、安定状態／遷移検出器６２５によって出力されたｓｓパラメータ、及び開始／破裂音検出器６２３によって出力されたｄパラメータの少なくとも一方に基づいて、平滑化エネルギ値を減少又は増大させることを含むことができる。従って、広帯域信号特性に基づいて、評価済み高帯域エネルギレベルを修正するステップは、フレームが安定状態であるか過渡的であるかに基づいて、評価済み高帯域エネルギレベル（又は既に修正されている評価済み高帯域エネルギレベル）を修正するステップを含んでいてもよい。これは、過渡的フレームの高帯域エネルギレベルを低減すること、及び安定状態フレームの高帯域エネルギレベルを増大させることの少なくとも一方を含んでいてもよく、開始／破裂音の発声に基づいて、評価済み高帯域エネルギレベルを修正することを更に含んでいてもよい。高帯域スペクトルの選択は、評価済みエネルギに関係させることができるので、一方式によって、高帯域エネルギ値を適応させることは、エネルギレベルだけでなく、スペクトル包絡線形状も変化させる。

フレームは、十分なエネルギを備え（つまり、発話フレームであり、無音フレームではない）、スペクトル的な意味でもエネルギに関しても、その隣接フレームの各々に近い場合、安定状態フレームとして定義される。二つのフレームの間の板倉距離が所定の閾値より低い場合、二つのフレームはスペクトル的に近いと考えられる。他の種類のスペクトル距離の尺度を用いることもできる。二つのフレームの広帯域エネルギの差が、所定の閾値より低い場合、二つのフレームはエネルギに関して近いと考えられる。安定状態フレームではない任意のフレームは、過渡的フレームと考えられる。安定状態フレームは、過渡的フレームよりも高帯域エネルギ評価の誤差をずっとよくマスクできる。従って、フレームの評価済み高帯域エネルギは、パラメータｓｓに依存して、つまり、次式の安定状態フレーム（ｓｓ＝１）であるか又は遷移フレーム（ｓｓ＝０）であるかに依存して適応される。

ここで、良好な出力発話品質を実現するために、μ_２＞μ_１≧０は、ｄＢ単位で経験的に選択される定数である。μ_１とμ_２の値は、「下に偏移させる」ために用いられる比例定数λの選択に依存する。例えば、λが１．２と選択される場合、δ_１は３．０、δ_２は−３．０になり、μ_１とμ_２は１．５と６．０に各々選択される。なお、この例では、安定状態フレームの場合、評価済み高帯域エネルギをやや増大させ、遷移フレームの場合は更に著しく減少させる。また、λ、δ_１及びδ_２の値を他に選択すると、μ_１とμ_２も異なる選択となり、μ_１とμ_２の値は両方とも正であっても、負であっても、逆の符号であってもよい。更に、安定状態／遷移フレームを識別する他の基準を用いることもできる。

開始／破裂音検出器６２３の出力ｄに基づいて、評価済み高帯域エネルギレベルは次のように調整できる。ｄ＝１の場合、対応するフレームが、開始、例えば、無音から、未発声又は発声音、又は破裂音への遷移を含むことを示している。開始／破裂音は、前のフレームの広帯域エネルギが、所定の閾値より低く、現在のフレームと前のフレームの間のエネルギ差が、別の閾値を超える場合に、現在フレームにおいて検出される。別の実施では、現在フレームと前のフレームの遷移帯域エネルギを用いて、開始／破裂音を検出することできる。開始／破裂音を検出するための他の方法を用いることもできる。開始／破裂音には、次の理由のために特別な問題がある。Ａ）開始／破裂音の近くの高帯域エネルギの評価は困難である。Ｂ）典型的なブロック処理が用いられるため、出力発話内にプレエコー型のアーチファクトが生じる可能性がある。Ｃ）初期のエネルギの急上昇（energy burst）の後の、破裂音（例えば、［ｐ］、［ｔ］、及び［ｋ］）は、広帯域内に所定の歯擦音（例えば、［ｓ］、［∫］、及び［З］）に近いが、高帯域ではかなり異なる特性を備え、エネルギの過大評価及びその結果のアーチファクトをもたらす。開始／破裂音（ｄ＝１）用の高帯域エネルギ適応は、次式のように行われる。

ここで、ｋはフレームインデックスである。開始／破裂音が検出されるフレーム（ｋ＝１）で始まる最初のＫ_ｍｉｎフレームの場合、高帯域エネルギは、最も可能性が低い値Ｅ_ｍｉｎに設定される。例えば、Ｅ_ｍｉｎは、−∞ｄＢ、又は最も低いエネルギを備えた高帯域スペクトル包絡線形状のエネルギに設定できる。以降のフレームでは（つまり、ｋ＝Ｋ_ｍｉｎ＋１からｋ＝Ｋ_ｍａｘで与えられる範囲の場合）、そのフレームの発声レベルν（ｋ）が閾値Ｖ_１を超えている間だけは、エネルギ適応が行われる。この目的のために、発声レベルパラメータの代わりに、適切な閾値を備えたゼロ交差パラメータｚｃを用いることもできる。この範囲内のフレームの発声レベルがＶ_１以下になると常に、開始エネルギ適応は即座に停止され、つまり、次の開始が検出されるまで、Ｅ_ｈｂ（ｋ）はＥ_ｈｂ４（ｋ）に等しく設定される。発声レベルν（ｋ）がＶ_１より大きい場合、ｋ＝Ｋ_ｍｉｎ＋１からｋ＝Ｋ_Ｔに対して、固定量Δだけ高帯域エネルギを減少させる。ｋ＝Ｋ_Ｔ＋１からｋ＝Ｋ_ｍａｘの場合、事前に指定したシーケンスΔ_Ｔ（ｋ−Ｋ_Ｔ）によって、高帯域エネルギは、Ｅ_ｈｂ４（ｋ）−ΔからＥ_ｈｂ４（ｋ）に向かって次第に増大させ、ｋ＝Ｋ_ｍａｘ＋１では、Ｅ_ｈｂ（ｋ）はＥ_ｈｂ４（ｋ）と等しく設定し、これは次の開始が検出されるまで継続する。開始／破裂音ベースのエネルギ適応に用いられるパラメータの一般的な値は、例えば、Ｋ_ｍｉｎ＝２、Ｋ_Ｔ＝３、Ｋ_ｍａｘ＝５、Ｖ_１＝０．９、Δ＝−１２ｄＢ、Δ_Ｔ（１）＝６ｄＢ、及びΔ_Ｔ（２）＝９．５ｄＢである。ｄ＝０の場合、更なるエネルギの適応は行われず、つまり、Ｅ_ｈｂはＥ_ｈｂ４と等しく設定される。従って、広帯域信号特性に基づいて評価済み高帯域エネルギレベルを修正するステップは、開始／破裂音の発生に基づいて、評価済み高帯域エネルギレベル（又は既に修正済みの評価済み高帯域エネルギレベル）を修正するステップを含んでいてもよい。

既にまとめたように、評価済み高帯域エネルギの適応は、帯域幅拡大出力発話内のアーチファクトの数を最小化するために役立ち、それによってその品質を向上させる。評価済み高帯域エネルギの適応に用いられる動作シーケンスは特定の方法で定義されているが、このようなシーケンスについての具体性は必要条件ではなく、従って、他のシーケンスを用いることもでき、本明細書に開示された実施形態に従っているものに留まることは、当業者には明らかである。また、本実施形態に、高帯域エネルギレベルの修正用に述べられた動作を選択的に適用することもできる。

従って、約７〜１４ｋＨｚの範囲内の高帯域スペクトル部分を評価し、ＭＤＣＴ係数を決定し、高帯域内にスペクトル部分を備えている音声出力を提供できるようにする動作の信号処理論理部及び方法が、本明細書に開示されている。本明細書に開示されている実施形態と同等の他の変形形態も、当業者は発想することができ、以降の請求項によって本明細書に定義されるように、本実施形態の精神及び範囲に従うものに留まっている。

Claims

第１周波数帯域内にスペクトルを備えた信号のための遷移帯域を設定することであって、前記遷移帯域が、前記第１周波数帯域の一部として設定され、前記遷移帯域が、前記第１周波数帯域に隣接する隣接周波数帯域の近傍に配置されている、前記遷移帯域を設定すること、
前記遷移帯域を解析して、遷移帯域スペクトルデータを得ること、
隣接周波数帯域スペクトル包絡線を評価すること、
前記遷移帯域スペクトルデータを用いて、隣接周波数帯域励起スペクトルを生成すること、
前記隣接周波数帯域スペクトル包絡線と、前記隣接周波数帯域励起スペクトルとを組み合わせて、隣接周波数帯域信号スペクトルを生成すること
を含む、方法。
前記遷移帯域を解析して、遷移帯域スペクトルデータを得ることが更に、
前記遷移帯域を解析して、遷移帯域スペクトル包絡線と、遷移帯域励起スペクトルを得ることを含む、請求項１に記載の方法。
前記遷移帯域スペクトルデータを用いて、隣接周波数帯域励起スペクトルを生成することが更に、
前記信号のピッチ周波数によって決定される繰返し周期を備えた、前記遷移帯域スペクトルの少なくとも一部の周期的繰返しによって、前記隣接周波数帯域励起スペクトルを生成することを含む、請求項２に記載の方法。
隣接周波数帯域スペクトル包絡線を評価することが更に、前記隣接周波数帯域内の前記信号のエネルギを評価することを含む、請求項１に記載の方法。
前記第１周波数帯域内のスペクトルと、前記隣接周波数帯域信号スペクトルを組み合わせて、帯域幅拡大信号スペクトルと、対応する帯域幅拡大信号を得ることを更に含む、請求項１に記載の方法。
前記隣接周波数帯域励起スペクトルを生成することが更に、前記遷移帯域励起スペクトルの少なくとも一部の周期的繰返しによって生成された前記隣接周波数帯域励起スペクトルと、前記隣接周波数帯域内の疑似雑音励起スペクトルとを混合することを含む、請求項３に記載の方法。
前記信号から評価した発声レベルを用いて、前記隣接周波数帯域励起スペクトルと、前記疑似雑音励起スペクトルとを混合する混合率を決定することを更に含む、請求項６に記載の方法。
前記疑似雑音励起スペクトルを用いて、前記遷移帯域励起スペクトル内の対応する割れ目に対して前記隣接周波数帯域励起スペクトル内の任意の割れ目を充填することを更に含む、請求項７に記載の方法。
第１周波数帯域内にスペクトルを備えた信号のための遷移帯域を設定することであって、前記遷移帯域が、前記第１周波数帯域の一部として設定され、前記遷移帯域が、前記第１周波数帯域に隣接する隣接周波数帯域の近傍に配置されている、前記遷移帯域を設定することと、
前記遷移帯域を解析して、遷移帯域励起スペクトルを得ること、
隣接周波数帯域スペクトル包絡線を評価すること、
前記信号のピッチ周波数によって決定される繰返し周期を備えた前記遷移帯域励起スペクトルの少なくとも一部の周期的繰返しによって、隣接周波数帯域励起スペクトルを生成すること、
前記隣接周波数帯域スペクトル包絡線と、前記隣接周波数帯域励起スペクトルとを組み合わせて、隣接周波数帯域信号スペクトルを得ること、
を含む、方法。
隣接周波数帯域スペクトル包絡線を評価することが更に、前記隣接周波数帯域内の前記信号のエネルギを評価することを含む、請求項９に記載の方法。
前記第１周波数帯域内の前記スペクトルと、前記隣接周波数帯域信号スペクトルを組み合わせて、帯域幅拡大信号スペクトルと、対応する帯域幅拡大信号とを得ることを更に含む、請求項１０に記載の方法。
前記隣接周波数帯域励起スペクトルを生成することが更に、前記遷移帯域励起スペクトルの少なくとも一部の周期的繰返しによって生成された前記隣接周波数帯域励起スペクトルと、前記隣接周波数帯域内の疑似雑音励起スペクトルとを混合することを含む、請求項１１に記載の方法。
前記信号から評価した発声レベルを用いて、前記隣接周波数帯域励起スペクトルと、前記疑似雑音励起スペクトルとを混合する混合率を決定することを更に含む、請求項１２に記載の方法。
前記疑似雑音励起スペクトルを用いて、前記遷移帯域励起スペクトル内の対応する割れ目に対して前記隣接周波数帯域励起スペクトル内の任意の割れ目を充填することを更に含む、請求項１３に記載の方法。
第１周波数帯域内にスペクトルを備えた信号のための遷移帯域であって、前記遷移帯域が、前記第１周波数帯域の一部として設定され、前記遷移帯域が、前記第１周波数帯域に隣接する隣接周波数帯域の近傍に配置される、前記遷移帯域を設定し、
前記遷移帯域を解析して、遷移帯域励起スペクトルを取得し、
隣接周波数帯域スペクトル包絡線を評価し、
前記信号のピッチ周波数によって決定される繰返し周期を備えた前記遷移帯域励起スペクトルの少なくとも一部の周期的繰返しによって、隣接周波数帯域励起スペクトルを生成し、
前記隣接周波数帯域スペクトル包絡線と、前記隣接周波数帯域励起スペクトルとを組み合わせて、隣接周波数帯域信号スペクトルを得る
ように動作する信号処理論理部を含んでいる装置。
前記信号処理論理部が、前記隣接周波数帯域の前記信号のエネルギを評価するように更に動作する、請求項１５に記載の装置。
前記信号処理論理部が、前記第１周波数帯域内の前記スペクトルと、前記隣接周波数帯域信号スペクトルを組み合わせて、帯域幅拡大信号スペクトルと、対応する帯域幅拡大信号とを得るように更に動作する、請求項１６に記載の装置。
前記信号処理論理部が、前記遷移帯域励起スペクトルの少なくとも一部の周期的繰返しによって生成された前記隣接周波数帯域励起スペクトルと前記隣接周波数帯域内の疑似雑音励起スペクトルとを混合するように更に動作する、請求項１６に記載の装置。
前記信号処理論理部が、前記信号から評価した発声レベルを用いて、前記隣接周波数帯域励起スペクトルと、前記疑似雑音励起スペクトルとを混合する混合率を決定するように更に動作する、請求項１８に記載の装置。
前記信号処理論理部が、前記疑似雑音励起スペクトルを用いて、前記遷移帯域励起スペクトル内の対応する割れ目に対して前記隣接周波数帯域励起スペクトル内の任意の割れ目を充填するように更に動作する、請求項１９に記載の装置。