JP3558031B2

JP3558031B2 - 音声復号化装置

Info

Publication number: JP3558031B2
Application number: JP2000337805A
Authority: JP
Inventors: 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2000-11-06
Filing date: 2000-11-06
Publication date: 2004-08-25
Anticipated expiration: 2020-11-06
Also published as: US20020087308A1; CN1145144C; EP1204092B1; JP2002140099A; US7024354B2; EP1204092A2; CN1352451A; DE60109111T2; EP1204092A3; DE60109111D1

Description

【０００１】
【発明の属する技術分野】
本発明は、音声信号を復号化する音声復号化装置に関し、特に、低いビットレートで符号化された音声信号に含まれる背景雑音信号を良好に復号化することができる音声復号化装置に関する。
【０００２】
【従来の技術】
音声信号を高能率に符号化する方式としては、例えば、Ｍ．ＳｃｈｒｏｅｄｅｒａｎｄＢ．Ａｔａｌ氏による論文“Ｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ：Ｈｉｇｈｑｕａｌｉｔｙｓｐｅｅｃｈａｔｖｅｒｙｌｏｗｂｉｔｒａｔｅｓ”（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．９３７−９４０，１９８５年）（以下、文献１と称する）や、Ｋｌｅｉｊｎ氏らによる論文“ＩｍｐｒｏｖｅｄｓｐｅｅｃｈｑｕａｌｉｔｙａｎｄｅｆｆｉｃｉｅｎｔｖｅｃｔｏｒｑｕａｎｔｉｚａｔｉｏｎｉｎＳＥＬＰ”（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．１５５−１５８，１９８８年）（以下、文献２と称する）等に記載されているＣＥＬＰ（ＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎｇ）が知られている。
【０００３】
ＣＥＬＰにおいては、送信側において、まず、音声信号のフレーム毎（例えば２０ｍｓ）に線形予測（ＬＰＣ：ＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎｇ）分析を用いて、音声信号のスペクトル特性を表すスペクトルパラメータを抽出する。
【０００４】
次に、各フレームをさらにサブフレーム（例えば５ｍｓ）に分割し、サブフレーム毎に過去の音源信号に基づいて、適応コードブックにおけるパラメータ（ピッチ周期に対応する遅延パラメータとゲインパラメータ）を抽出し、適応コードブックによりサブフレームの音声信号をピッチ予測する。
【０００５】
次に、ピッチ予測により求めた音源信号に対して、予め決められた種類の雑音信号からなる音源コードブック（ベクトル量子化コードブック）から最適な音源コードベクトルを選択し、最適なゲインを計算することにより、音源信号を量子化する。なお、音源コードベクトルの選択においては、選択した雑音信号により合成した信号と残差信号との誤差電力を最小化するような音源コードベクトルを選択する。
【０００６】
その後、選択された音源コードベクトルの種類を表すインデクスとゲイン、並びにスペクトルパラメータと適応コードブックのパラメータをマルチプレクサ部にて組み合わせて伝送する。
【０００７】
また、音源コードブックから音源コードベクトルを探索する際に必要となる演算量を低減する方法として、種々のものが提案されており、その１つとして、例えば、Ｃ．Ｌａｆｌａｍｍｅらによる論文“１６ｋｂｐｓｗｉｄｅｂａｎｄｓｐｅｅｃｈｃｏｄｉｎｇｔｅｃｈｎｉｑｕｅｂａｓｅｄｏｎａｌｇｅｂｒａｉｃＣＥＬＰ”（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．１３−１６，１９９１）（以下、文献３と称する）に記載された、ＡＣＥＬＰ（ＡｒｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）方式がある。
【０００８】
このＡＣＥＬＰ方式においては、音源信号が複数個のパルスで表され、各パルスの位置が予め決められたビット数で表されて伝送されるが、各パルスの振幅が＋１．０もしくは−１．０に限定されているため、パルス探索の演算量を大幅に低減することができる。
【０００９】
【発明が解決しようとする課題】
しかしながら、上述したような音声信号を符号化する方式においては、符号化ビットレートを例えば８ｋｂ／ｓ以下に削減すると、特に、音声信号に背景雑音信号が重畳している場合に、背景雑音信号の音質が劣化して全体の音質が劣化するという問題点がある。この問題点は、特に、携帯電話等で音声符号化を使用する場合に顕著に生じてしまう。
【００１０】
文献１及び文献２に記載された符号化方式においては、符号化ビットレートを削減した場合、音源コードブックのビット数が低減し、波形の再現精度が低下してしまう。音声信号のように波形の相関の高い信号においては波形の再現精度の低下はそれほど顕著ではないが、背景雑音信号のように相関が低い信号に対しては、再現精度の低下が顕著になってしまう。
【００１１】
また、文献３に記載された符号化方式においては、音源信号がパルスの組み合わせで表されているため、音声信号に対してはモデルの整合性が高く良好な音質を得ることができるものの、符号化ビットレートが低い場合に、パルスの個数が充分でないために、符号化音声の背景雑音部分の音質が極めて劣化してしまうとい問題点がある。
【００１２】
この問題点は、音声の母音区間では、パルスがピッチの開始点であるピッチパルスの近辺に集中するために少ない個数のパルスで効率的に表すことができるものの、背景雑音のようなランダム信号に対しては、パルスをランダムに立てる必要があるため、少ない個数のパルスでは背景雑音を良好に表すことは困難であり、ビットレートが低減されてパルスの個数が削減された場合に背景雑音に対する音質が急激に劣化してしまうことに起因するものである。
【００１３】
本発明は、符号化ビットレートが低い場合においても、上述したような符号化方式にて符号化された背景雑音信号が重畳された音声信号を、少ない演算量で劣化を抑制して復号化することができる音声復号化装置を提供することを目的とする。
【００１４】
【課題を解決するための手段】
上記目的を達成するための本発明は、
符号化された音声信号を復号化する音声復号化装置において、
復号化された再生音声信号が入力され、該再生音声信号を用いてスペクトルパラメータを計算するスペクトルパラメータ計算回路と、
前記再生音声信号と前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータとを用いて音源信号を計算する音源信号計算手段と、
前記音源信号計算手段にて計算された音源信号のレベルと前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータとのうちの少なくとも１つを時間方向に平滑化して両者を出力する平滑化回路と、
前記平滑化回路から出力されたスペクトルパラメータを用いて合成フィルタを構成し、前記平滑化回路から出力された音源信号を前記合成フィルタにて合成し、音声信号として出力する合成フィルタ回路とを有し、
前記音源信号計算手段、前記平滑化回路及び前記合成フィルタ回路は、予め決められた条件下でのみ動作することを特徴とする。
【００１５】
また、前記再生音声信号の特徴量を求め、該特徴量に基づいて前記再生音声信号のモードを判別するモード判別回路を有し、
前記音源信号計算手段、前記平滑化回路及び前記合成フィルタ回路は、前記モード判別回路にて前記再生音声信号が予め決められたモードであると判別された場合のみ動作することを特徴とする。
【００１６】
また、前記音源信号計算手段、前記平滑化回路及び前記合成フィルタ回路は、前記モード判別回路にて前記再生音声信号が無音状態であると判別された場合のみ動作することを特徴とする。
【００１７】
また、前記音源信号計算手段、前記平滑化回路及び前記合成フィルタ回路は、前記モード判別回路にて前記再生音声信号が無声音状態であると判別された場合のみ動作することを特徴とする。
【００１８】
また、符号化された音声信号を復号化する音声復号化装置において、
復号化された再生音声信号が入力され、該再生音声信号を用いてスペクトルパラメータを計算するスペクトルパラメータ計算回路と、
前記再生音声信号と前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータとを用いて音源信号を計算する音源信号計算手段と、
前記再生音声信号または前記音源信号計算手段にて計算された音源信号からピッチ周期を計算し、該ピッチ周期を用いてピッチ予測を行いピッチ予測信号を計算するとともに、前記音源信号から前記ピッチ予測信号を減算することにより残差信号を求めるピッチ予測回路と、
前記ピッチ予測回路にて計算されたピッチ予測信号と残差信号とのうち少なくとも１つのゲインを求めるゲイン計算回路と、
前記前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータと前記ゲイン計算回路にて計算されたゲインとのうち少なくとも１つを時間方向に平滑化して両者を出力する平滑化回路と、
前記平滑化回路から出力されたスペクトルパラメータを用いて合成フィルタを構成し、前記平滑化回路から出力されたゲイン、並びに、前記ピッチ予測信号及び前記残差信号から音源信号を作成し、該音源信号を前記合成フィルタにて合成して音声信号として出力する合成フィルタ回路とを有することを特徴とする。
【００１９】
また、前記音源信号計算手段は、前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータを用いて前記再生音声信号を逆フィルタリングすることにより音源信号を計算することを特徴とする。
【００２０】
（作用）
上記のように構成された本発明においては、まず、スペクトルパラメータ計算回路において、復号化された再生音声信号を用いてスペクトルパラメータが計算されるとともに、モード判別回路において、再生音声信号の特徴量が求められ、該特徴量に基づいて再生音声信号のモードが判別される。スペクトルパラメータ計算回路にて計算されたスペクトルパラメータは、音源信号計算手段に入力され、音源信号計算手段において、スペクトルパラメータ計算回路にて計算されたスペクトルパラメータを用いて再生音声信号を逆フィルタリングすることにより音源信号が計算され、計算された音源信号は平滑化回路に入力される。平滑化回路においては、音源信号計算手段にて計算された音源信号のレベルとスペクトルパラメータ計算回路にて計算されたスペクトルパラメータとのうちの少なくとも１つが時間方向に平滑化され、両者が出力される。その後、合成フィルタ回路において、平滑化回路から出力されたスペクトルパラメータを用いて合成フィルタが構成され、平滑化回路から出力された音源信号が合成フィルタにて合成され、音声信号として出力される。ここで、音源信号計算手段、平滑化回路及び合成フィルタ回路は、モード判別回路にて再生音声信号が予め決められたモード、例えば、無音状態あるいは無声音状態であると判別された場合のみ動作する。
【００２１】
このように、音源信号のレベルとスペクトルパラメータとのうちの少なくとも１つが時間方向に平滑化され、平滑化されたものを用いて音声信号が再度合成されているので、従来の音声復号化装置の構成を修正することなく、完全な後処理として上述した一連の処理を追加することにより、符号化ビットレートが低い場合においても、背景雑音部におけるパラメータの局所的な時間変動が抑制され、また、音源信号計算手段、平滑化回路及び合成フィルタ回路が、モード判別回路にて再生音声信号が予め決められたモード、例えば、無音状態あるいは無声音状態であると判別された場合のみ動作するので、音声区間に弊害を与えることなく、符号化ビットレートが低い場合においても、背景雑音部におけるパラメータの局所的な時間変動が抑制される。
【００２２】
また、再生音声信号または前記音源信号計算手段にて計算された音源信号からピッチ周期を計算し、該ピッチ周期を用いてピッチ予測を行いピッチ予測信号を計算するとともに、前記音源信号から前記ピッチ予測信号を減算することにより残差信号を求め、ピッチ予測信号と残差信号とのうち少なくとも１つのゲインを求め、平滑化回路において、スペクトルパラメータとゲインとのうち少なくとも１つを時間方向に平滑化し、合成フィルタ回路において、平滑化回路から出力されたスペクトルパラメータを用いて合成フィルタを構成し、平滑化回路から出力されたゲイン、並びに、ピッチ予測信号及び残差信号から音源信号を作成し、該音源信号を合成フィルタにて合成して音声信号として出力する場合は、ゲイン、スペクトルパラメータとパラメータレベルに分離して平滑化することにより、背景雑音部におけるパラメータの局所的な時間変動が一層抑制される。
【００２３】
【発明の実施の形態】
以下に、本発明の実施の形態について図面を参照して説明する。
【００２４】
（第１の実施の形態）
図１は、本発明の音声復号化装置の第１の実施の形態を示す図であり、復号化された音声信号に対して後処理を行うセクションを示す。
【００２５】
本形態は図１に示すように、復号化された再生音声信号ｄ（ｎ）が入力され、再生音声信号ｄ（ｎ）を用いて線形予測分析により予め決められた次数のスペクトルパラメータα_ｉ（ｉ＝１，・・・，Ｐ：例えばＰ＝１０次）を計算するスペクトルパラメータ計算回路１０と、再生音声信号ｄ（ｎ）とスペクトルパラメータ計算回路１０にて計算されたスペクトルパラメータα_ｉとを用いて、再生音声信号ｄ（ｎ）を逆フィルタリングし、それにより音源信号ｘ（ｎ）を計算する音源信号計算手段である逆フィルタ回路２０と、逆フィルタ回路２０にて計算された音源信号ｘ（ｎ）のＲＭＳとスペクトルパラメータ計算回路１０にて計算されたスペクトルパラメータα_ｉとの少なくとも１つを時間方向に平滑化して両者を出力する平滑化回路３０と、平滑化回路３０から出力されたスペクトルパラメータα_ｉを用いて合成フィルタを構成し、平滑化回路３０から出力された音源信号ｘ（ｎ）を合成フィルタにて合成し、音声信号として出力する合成フィルタ回路４０とから構成されている。
【００２６】
以下に、上記のように構成された音声復号化装置における処理について説明する。
【００２７】
まず、復号化された再生音声信号ｄ（ｎ）がスペクトルパラメータ計算回路１０に入力されると、スペクトルパラメータ計算回路１０において、入力された再生音声信号ｄ（ｎ）を用いて線形予測分析により予め決められた次数のスペクトルパラメータα_ｉが計算される。なお、スペクトルパラメータα_ｉの計算は、周知のＬＰＣ分析や、Ｂｕｒｇ分析等を用いることにより行われる。本形態においては、Ｂｕｒｇ分析を用いることとする。Ｂｕｒｇ分析については、中溝著による“信号解析とシステム同定”（コロナ社１９８８年刊）の８２〜８７頁等に記載されている。
【００２８】
スペクトルパラメータ計算回路１０にて計算されたスペクトルパラメータα_ｉは、逆フィルタ回路２０及び平滑化回路３０にそれぞれ入力される。
【００２９】
逆フィルタ回路２０においては、再生音声信号ｄ（ｎ）とスペクトルパラメータ計算回路１０にて計算されたスペクトルパラメータα_ｉとを用いて、式（１）に従って再生音声信号ｄ（ｎ）が逆フィルタリングされ、それにより音源信号ｘ（ｎ）が計算される。
【００３０】
【数１】

【００３１】
また、平滑化回路３０においては、逆フィルタ回路２０にて計算された音源信号ｘ（ｎ）のＲＭＳとスペクトルパラメータ計算回路１０にて計算されたスペクトルパラメータα_ｉとの少なくとも１つが時間方向に平滑化され、両者が出力される。ここで、逆フィルタ回路２０にて計算された音源信号ｘ（ｎ）のＲＭＳ（ＲＭＳ（ｍ））を平滑化する場合は、以下の式（２）に従って行う。
【００３２】
【数２】

【００３３】
また、スペクトルパラメータ計算回路１０にて計算されたスペクトルパラメータα_ｉを平滑化する場合は、以下の式（３）に従って行う。なお、本形態においては、スペクトルパラメータα_ｉの平滑化は、スペクトルパラメータα_ｉを線形スペクトル（ＬＳＰ）上にて平滑化した後、スペクトルパラメータα_ｉ’に逆変換することにより行う。スペクトルパラメータα_ｉとＬＳＰとの変換及び逆変換は、菅村他による論文“線スペクトル対（ＬＳＰ）音声分析合成方式による音声情報圧縮”（電子通信学会論文誌、Ｊ６４−Ａ、ｐｐ．５９９−６０６、１９８１年）に記載されている。
【００３４】
【数３】

【００３５】
その後、合成フィルタ回路４０において、平滑化回路３０から出力されたスペクトルパラメータα_ｉを用いて合成フィルタが構成され、平滑化回路３０から出力された音源信号ｘ（ｎ）が合成フィルタにて合成され、音声信号として出力される。
【００３６】
（第２の実施の形態）
図２は、本発明の音声復号化装置の第２の実施の形態を示す図であり、復号化された音声信号に対して後処理を行うセクションを示す。
【００３７】
本形態は図２に示すように、図１に示したものに対して、再生音声信号ｄ（ｎ）の特徴量を求め、該特徴量に基づいて再生音声信号ｄ（ｎ）のモードを判別し、判別結果を出力するモード判別回路５０が新たに設けられ、逆フィルタ回路２０、平滑化回路３０及び合成フィルタ回路４０が、モード判別回路５０から出力された判別結果に基づいて、再生音声信号ｄ（ｎ）が予め決められたモードである場合のみ動作するように構成されている。
【００３８】
モード判別回路５０においては、まず、再生音声信号ｄ（ｎ）が入力され、以下の式（４）に従って再生音声信号ｄ（ｎ）の特徴量Ｄ_Ｔが求められる。
【００３９】
【数４】

【００４０】
その後、モード判別回路５０において、求められた特徴量Ｄ_Ｔが予め決められたしきい値と比較され、それにより、再生音声信号ｄ（ｎ）のモードが判別される。
【００４１】
モード判別回路５０における判別結果は、逆フィルタ回路２０、平滑化回路３０及び合成フィルタ回路４０に入力され、逆フィルタ回路２０、平滑化回路３００及び合成フィルタ回路４０は、入力された判別結果に基づいて再生音声信号ｄ（ｎ）が予め決められたモード（例えば、無音状態、無声音状態等）の場合のみ、第１の実施の形態にて説明したような動作を行い、また、再生音声信号ｄ（ｎ）が他のモードである場合は動作しない。
【００４２】
（第３の実施の形態）
図３は、本発明の音声復号化装置の第３の実施の形態を示す図であり、復号化された音声信号に対して後処理を行うセクションを示す。
【００４３】
本形態は図３に示すように、図１に示したものに対して、再生音声信号ｄ（ｎ）または逆フィルタ回路２０にて計算された音源信号ｘ（ｎ）のいずれか一方からピッチ周期Ｔを計算し、ピッチ周期Ｔを用いてピッチ予測を行ってピッチ予測信号ｐ（ｎ）を計算するとともに、音源信号ｘ（ｎ）からピッチ予測信号ｐ（ｎ）を減算し、残差信号ｅ（ｎ）を求めるピッチ予測回路６０と、ピッチ予測回路６０にて計算されたピッチ予測信号ｐ（ｎ）と残差信号ｅ（ｎ）との少なくとも１つに対してゲインを求め、該ゲイン、並びにピッチ予測信号ｐ（ｎ）及び残差信号ｅ（ｎ）を平滑化回路３０に対して出力するゲイン計算回路７０とが設けられ、平滑化回路３０が、スペクトルパラメータ計算回路１０にて計算されたスペクトルパラメータα_ｉとゲイン計算回路７０から出力されたゲインとの少なくとも１つを時間方向に平滑化し、当該スペクトルパラメータα_ｉ及びゲイン、並びにピッチ予測信号ｐ（ｎ）及び残差信号ｅ（ｎ）を出力し、合成フィルタ回路４０が、平滑化回路３０から出力されたスペクトルパラメータα_ｉを用いて合成フィルタを構成し、平滑化回路３０から出力されたゲイン、ピッチ予測信号ｐ（ｎ）及び残差信号ｅ（ｎ）から音源信号を作成し、該音源信号を合成フィルタにて合成して音声信号として出力するように構成されている。
【００４４】
ピッチ予測回路６０においては、式（４）によって求められる特徴量Ｄ_Ｔの絶対値を最大化するピッチ周期Ｔが計算され、さらに、ピッチ周期Ｔを用いてピッチ予測が行われ、ピッチ予測信号ｐ（ｎ）が計算される。また、音源信号ｘ（ｎ）からピッチ予測信号ｐ（ｎ）が減算され、それにより、残差信号ｅ（ｎ）が求められる。
【００４５】
その後、ゲイン計算回路７０において、ピッチ予測回路６０にて計算されたピッチ予測信号ｐ（ｎ）と残差信号ｅ（ｎ）との少なくとも１つに対してゲインが求められ、求められたゲインが出力され、平滑化回路３０に入力される。
【００４６】
平滑化回路３０においては、スペクトルパラメータ計算回路１０にて計算されたスペクトルパラメータα_ｉとゲイン計算回路７０から出力されたゲインとの少なくとも１つが時間方向に平滑化され、合成フィルタ回路４０に対して出力される。
【００４７】
合成フィルタ回路４０においては、平滑化回路３０から出力されたスペクトルパラメータα_ｉを用いて合成フィルタが構成され、また、平滑化回路３０から出力されたゲイン、ピッチ予測信号ｐ（ｎ）及び残差信号ｅ（ｎ）から音源信号が作成され、該音源信号が合成フィルタにて合成されて音声信号として出力される。
【００４８】
その他の処理においては、第１の実施の形態にて説明したものと同様である。
【００４９】
【発明の効果】
以上説明したように本発明においては、再生音声信号からスペクトルパラメータを計算し、さらに逆フィルタリングにより音源信号を求め、音源信号のＲＭＳ、スペクトルパラメータのうち少なくとも１つを時間方向に平滑化したものを用いて、音声信号を合成し直す構成としたため、従来の音声復号化装置の構成を修正することなく、完全な後処理として処理を追加することより、符号化ビットレートが低い場合においても、背景雑音部におけるパラメータの局所的な時間変動を抑制することができ、音質的な劣化の少ない合成音声を提供することができる。
【００５０】
また、音源信号計算手段、平滑化回路及び合成フィルタ回路が、モード判別回路にて再生音声信号が予め決められたモード、例えば、無音状態あるいは無声音状態であると判別された場合のみ動作するため、音声区間に弊害を与えることなく、符号化ビットレートが低い場合においても、背景雑音部におけるパラメータの局所的な時間変動を抑制することができる。
【００５１】
また、音源信号からピッチ周期を計算し、ピッチ予測信号を計算し、音源信号からピッチ予測信号を減算し、残差信号を計算し、少なくとも１つのゲインを計算し、ゲインとスペクトルパラメータとのうち少なくとも１つを時間方向に平滑化して音源信号を構成し、音声信号を合成する構成としたものにおいては、ゲイン、スペクトルパラメータとパラメータレベルとに分離して平滑化することにより、背景雑音部におけるパラメータの局所的な時間変動を一層抑制することができ、音質的な劣化の少ない合成音声を提供することができる。
【図面の簡単な説明】
【図１】本発明の音声復号化装置の第１の実施の形態を示す図である。
【図２】本発明の音声復号化装置の第２の実施の形態を示す図である。
【図３】本発明の音声復号化装置の第３の実施の形態を示す図である。
【符号の説明】
１０スペクトルパラメータ計算回路
２０逆フィルタ回路
３０平滑化回路
４０合成フィルタ回路
５０モード判別回路
６０ピッチ予測回路
７０ゲイン計算回路

Claims

符号化された音声信号を復号化する音声復号化装置において、
復号化された再生音声信号が入力され、該再生音声信号を用いてスペクトルパラメータを計算するスペクトルパラメータ計算回路と、
前記再生音声信号と前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータとを用いて音源信号を計算する音源信号計算手段と、
前記音源信号計算手段にて計算された音源信号のレベルと前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータとのうちの少なくとも１つを時間方向に平滑化して両者を出力する平滑化回路と、
前記平滑化回路から出力されたスペクトルパラメータを用いて合成フィルタを構成し、前記平滑化回路から出力された音源信号を前記合成フィルタにて合成し、音声信号として出力する合成フィルタ回路とを有し、
前記音源信号計算手段、前記平滑化回路及び前記合成フィルタ回路は、予め決められた条件下でのみ動作することを特徴とする音声復号化装置。
請求項１に記載の音声復号化装置において、
前記再生音声信号の特徴量を求め、該特徴量に基づいて前記再生音声信号のモードを判別するモード判別回路を有し、
前記音源信号計算手段、前記平滑化回路及び前記合成フィルタ回路は、前記モード判別回路にて前記再生音声信号が予め決められたモードであると判別された場合のみ動作することを特徴とする音声復号化装置。
請求項２に記載の音声復号化装置において、
前記音源信号計算手段、前記平滑化回路及び前記合成フィルタ回路は、前記モード判別回路にて前記再生音声信号が無音状態であると判別された場合のみ動作することを特徴とする音声復号化装置。
請求項２に記載の音声復号化装置において、
前記音源信号計算手段、前記平滑化回路及び前記合成フィルタ回路は、前記モード判別回路にて前記再生音声信号が無声音状態であると判別された場合のみ動作することを特徴とする音声復号化装置。
符号化された音声信号を復号化する音声復号化装置において、
復号化された再生音声信号が入力され、該再生音声信号を用いてスペクトルパラメータを計算するスペクトルパラメータ計算回路と、
前記再生音声信号と前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータとを用いて音源信号を計算する音源信号計算手段と、
前記再生音声信号または前記音源信号計算手段にて計算された音源信号からピッチ周期を計算し、該ピッチ周期を用いてピッチ予測を行いピッチ予測信号を計算するとともに、前記音源信号から前記ピッチ予測信号を減算することにより残差信号を求めるピッチ予測回路と、
前記ピッチ予測回路にて計算されたピッチ予測信号と残差信号とのうち少なくとも１つのゲインを求めるゲイン計算回路と、
前記前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータと前記ゲイン計算回路にて計算されたゲインとのうち少なくとも１つを時間方向に平滑化して両者を出力する平滑化回路と、
前記平滑化回路から出力されたスペクトルパラメータを用いて合成フィルタを構成し、前記平滑化回路から出力されたゲイン、並びに、前記ピッチ予測信号及び前記残差信号から音源信号を作成し、該音源信号を前記合成フィルタにて合成して音声信号として出力する合成フィルタ回路とを有することを特徴とする音声復号化装置。
請求項１乃至５のいずれか１項に記載の音声復号化装置において、
前記音源信号計算手段は、前記スペクトルパラメータ計算回路にて計算されたスペクトルパラメータを用いて前記再生音声信号を逆フィルタリングすることにより音源信号を計算することを特徴とする音声復号化装置。