JP2004020676A - 音声符号化/復号化方法及び音声符号化/復号化装置 - Google Patents

音声符号化/復号化方法及び音声符号化/復号化装置 Download PDF

Info

Publication number
JP2004020676A
JP2004020676A JP2002172265A JP2002172265A JP2004020676A JP 2004020676 A JP2004020676 A JP 2004020676A JP 2002172265 A JP2002172265 A JP 2002172265A JP 2002172265 A JP2002172265 A JP 2002172265A JP 2004020676 A JP2004020676 A JP 2004020676A
Authority
JP
Japan
Prior art keywords
fixed code
code vector
fixed
adaptive
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002172265A
Other languages
English (en)
Inventor
Seiji Sasaki
佐々木 誠司
Nobuaki Kawahara
川原 伸章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2002172265A priority Critical patent/JP2004020676A/ja
Publication of JP2004020676A publication Critical patent/JP2004020676A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】従来の音声符号化方法では、演算量の増加や再生音声品質劣化という問題点があったが、本発明は、演算量を増加することなく、再生音声品質劣化を極力抑え、ビットレートを軽減できる音声符号化/復号化方法及び音声符号化/復号化装置を提供する。
【解決手段】代替処理サブフレームでは、ピーキネス情報を固定符号の代わりに符号化し、固定符号帳探索部5においては、信号切り出し処理部13が、シフト機能付き固定符号ベクトル格納バッファ12に記憶されている過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に同期した位置から切り出して代替固定符号ベクトルとし、非同期パルス発生部14でピーキネス情報に基づく補正を行い、固定符号ベクトルエネルギ調整部17でエネルギー調整して固定符号ベクトルとして出力する音声符号化/復号化方法及び音声符号化/復号化装置である。
【選択図】    図2

Description

【0001】
【発明の属する技術分野】
本発明は、ディジタル移動体通信に用いられるディジタル音声圧縮の為の音声符号化/復号化方法及び音声符号化/復号化装置に係り、特に代数的符号励振予測方式による符号化において、再生音声品質の劣化を極力抑えつつ伝送効率を向上できる音声符号化/復号化方法及び音声符号化/復号化装置に関する。
【0002】
【従来の技術】
現在、世界各国で公衆移動体通信に用いられている音声符号化方式は、代数的符号励振予測方式(Algebraic Code Excitation Linear Prediction:ACELP)を基本方式としたものが主流である。
例として挙げるならば、ヨーロッパの移動電話ディジタル符号化の標準であるGSM(Global System for Mobile)で制定されているディジタル音声符号化方式は、AMR(Adaptive Multi−Rate)はACELPを基本方式としてビットレートを伝送路の状況に合わせて可変させる方式であり、またITU−T(International Telecommunications Union−Telecommunications Standards Sector)で標準化されているG.729も、ACELPを基本方式として利得量子化に共役構造を用いることで伝送路誤りへの耐性および再生音声品質を向上させた方式である。
【0003】
また、米国のディジタル移動電話のEFR(Enhanced Full Rate)もACELPを基本方式としたディジタル音声符号化方式である。
更に、2001年より日本でサービスを開始した第3世代におけるディジタル音声符号化方式もGSMで採用されているAMRを参考に制定された可変ビットレート方式であり基本方式はACELPである。
このように世界的に見て現在公衆移動体通信向けディジタル音声符号化の標準方式として採用されている方式は、そのほとんどがACELPを基本方式としている。
【0004】
ACELPは、フレーム毎に音声信号を分析し、CELPモデルで使用するパラメータである線形予測フィルタ係数(LPC係数)、適応符号帳及び固定符号帳のインデックス、利得を抽出し、これらのパラメータを符号化して送信する。そして、復号器においては、受信した上記パラメータを用いて励振信号や合成フィルタのパラメータを再構築し、励振信号を短期合成フィルタに通すことによって音声を再生し、ポストフィルタを通すことによって音声の品質が改善されるようになっている。短期合成フィルタは線形予測(LP)フィルタを基に構成され、長期すなわちピッチ合成フィルタはいわゆる適応符号帳を用いて実現される。
【0005】
ACELPは、CELPにおけるLPC(Linear Predictive Coding)フィルタを駆動する音源信号として、パルスの組み合わせを用いる方式であり、符号帳と呼ばれるベクトル量子化コードブックを用いる従来のCELP方式と比較して、音源信号の探索に必要な演算量の低減と音声品質の改善が実現されている。
【0006】
ACELPはパルスの組み合わせにより音源信号を表現する方式であるが、以下の点がACELPの特徴である。
(1)パルスの位置は各パルス毎に予め限定して定めてある複数個の候補から最適な一つのパルス位置をパルス毎に探索する。表1に参考としてITU−T標準G.729のパルス位置表を示すが、ITU−T標準G.729では、5msのサブフレームにおけるパルス数が4つで、40サンプルを重複することなくカバーするパルス位置構成を持っている。
【0007】
【表1】
Figure 2004020676
【0008】
(2)パルスの振幅は極性(±)のみを1bitで表現する。これにより送信情報量を低減している。
(3)パルス位置探索は極性を決定した後に、全ての候補に対して総組み合わせ探索を実施し、最小歪みを実現するパルス位置の組み合わせを選択する。
【0009】
即ち、表1に示したように、パルス番号1,2,3に対しては、それぞれパルス位置として8この位置候補が割り当てられているので、それぞれ3bitで位置を表すことができ、パルス番号4に対しては、パルス位置として16この位置候補が割り当てられているので、4bitで位置を表すことができる。従って、各サブフレームの4つのパルスの位置情報は13bitで表され、これに加えて4つのパルスのそれぞれの極性を1bitで表しているので、サブフレーム毎に17bitで固定符号を表すようになっている。
【0010】
G.729の音声品質は、クリーン環境、背景雑音環境および話者依存性等の面で、G.726の適応差分PCM(Adaptive Differential Pulse Code Modulation:ADPCM)と同等以上であることが確認されている。
【0011】
現在、ACELPを低ビットレート化する場合の方法として実施されている手法として、パルス数を削減する方法や、パルス位置候補を間引きするなどの方法が考案されており、これらの方法が4kbps〜8kbpsの方式として採用されている。
【0012】
一例としてG.729AnnexDが挙げられる。このG.729AnnexDは5msのサブフレームにおけるパルス数を2つとして、パルス数の減少による音声品質の劣化に対しては後処理にパルス拡散フィルタを追加することによって補い、6.4kbpsのビットレートを実現している。
また、AMRの低ビットレート方式でも1サブフレームにおけるパルス数を2つとし、かつパルス位置候補を1サンプルおきに配置して最小歪み探索を行うことで5.15kbpsや4.75kbpsを実現している。
【0013】
尚、ACELP方式における音声符号化方法の従来技術としては、平成10年11月24日公開の特開平10−312198号「音声符号化方法」(出願人:日本電信電話株式会社、発明者:林 伸二他)がある。
この従来技術は、雑音成分ベクトルの符号化において、各フレームを構成する2つのサブフレームに対し、雑音符号帳を構成する各雑音ベクトルをサブフレーム毎に3つ以下の単位振幅のパルスで構成し、それらの位置を各サブフレーム内で予め決めた取りうる複数の位置から歪みが最小となるように決める音声符号化方法であり、これにより、音声品質を劣化させずにビットレートを低減できるものである。
【0014】
【発明が解決しようとする課題】
しかしながら、従来の音声符号化方法及び音声符号化装置では、パルス数の減少による音声品質の劣化に対してパルス拡散フィルタを追加すると演算量が増加してしまうという問題点があり、また、パルス位置候補の間引きでは再生音声品質が劣化するという問題点があった。
【0015】
本発明は上記実情に鑑みて為されたもので、演算量を増加することなく、再生音声品質劣化を極力抑え、ビットレートを軽減できるACELP方式における音声符号化方法及び音声符号化装置を提供することを目的とする。
【0016】
【課題を解決するための手段】
上記従来例の問題点を解決するための本発明は、音声符号化方法において、1フレームを複数のサブフレームで構成する入力音声信号について、フレーム単位で音声信号を分析して線形予測フィルタ係数を求め、前記入力音声信号と合成された再生音声信号との誤差信号に対して聴覚重み付けした聴覚重み付け誤差を求め、サブフレーム単位で前記聴覚重み付け誤差を最小化するような適応符号及び固定符号及び適応符号利得及び固定符号利得とを取得して励振信号パラメータとし、前記フレーム単位の線形予測フィルタ係数と前記サブフレーム単位の励振信号パラメータとを音声符号化データとすると共に、前記取得した励振信号パラメータの適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、前記適応符号ベクトル及び前記固定符号ベクトル及び適応符号利得及び固定符号利得とから駆動音源信号を生成し、前記駆動音源信号と前記線形予測フィルタ係数を用いて再生音声信号を合成する代数的符号励振予測方式の音声符号化方法であって、
前記入力音声信号についてサブフレーム単位で、ピークを持つパルス成分の有無を示すピーキネス情報を検出し、
前記聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、
前記フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、前記グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
前記通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、前記探索処理の結果から固定符号及び前記固定符号に対応する固定符号ベクトルを取得し、前記適応符号及び前記取得した固定符号及び前記適応符号利得及び前記固定符号利得を励振信号パラメータに含めて、
前記代替処理サブフレームでは、前記固定符号帳の探索処理は行わず、前記適応符号及び前記ピーキネス情報及び前記適応符号利得及び前記固定符号利得を励振信号パラメータに含め、記憶されている過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを用い、前記代替固定符号ベクトルが予め定めた規定数のパルスを保持せず、且つ前記ピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを前記代替固定符号ベクトルに挿入して補正し、更に前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとするものなので、
演算量を増加することなく、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0017】
上記従来例の問題点を解決するための本発明は、音声復号化方法において、
本発明の音声符号化方法で符号化された音声符号化データについて、前記音声符号化データにおける励振信号パラメータに含まれる適応符号に基づく適応符号ベクトル及び固定符号又はピーキネス情報に基づく固定符号ベクトルを取得し、前記適応符号ベクトル及び前記固定符号ベクトル及び前記励振信号パラメータに含まれる適応符号利得及び固定符号利得とから駆動音源信号を生成し、前記駆動音源信号と前記線形予測フィルタ係数を用いて音声信号を再生する音声復号化方法であって、
前記励振信号パラメータに含まれる固定符号又はピーキネス情報に基づいて固定符号ベクトルを取得する方法が、
音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
前記通常処理サブフレームでは、予め備えている固定符号帳を用いて、前記励振信号パラメータに含まれる固定符号を前記固定符号帳のインデックスとして、前記インデックスに対応する固定符号ベクトルを取得し、
前記代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを用い、前記代替固定符号ベクトルが予め定めた規定数のパルスを保持せず、且つ前記ピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを前記代替固定符号ベクトルに挿入して補正し、更に前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとするものなので、
ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上できる。
【0018】
上記従来例の問題点を解決するための本発明は、音声符号化装置において、
1フレームを複数のサブフレームで構成する音声信号を入力し、フレーム単位で前記音声信号を線形予測分析して線形予測フィルタ係数を求める線形予測分析手段と、
前記音声信号と合成された再生音声信号との誤差信号を求める減算手段と、
前記誤差信号に聴覚重み付けを行い聴覚重み付け誤差信号を出力する聴覚重み付け手段と、
前記聴覚重み付け誤差信号を入力し、サブフレーム単位で、前記聴覚重み付け誤差を最小化するような、適応符号及び固定符号と適応符号利得及び固定符号利得とを取得するための制御を行い、取得された適応符号及び固定符号及び適応符号利得及び固定符号利得を励振信号パラメータとして出力する励振信号パラメータ抽出手段と、
前記励振信号パラメータ抽出手段の制御に従い、過去の駆動音源信号から前記聴覚重み付け誤差信号を最小化するようなピッチ周期を検出し、前記検出されたピッチ周期の情報を適応符号として出力すると共に、前記ピッチ周期の情報と過去の駆動音源信号から求めた適応符号ベクトルを出力する適応符号ベクトル出力手段と、
前記励振信号パラメータ抽出手段の制御に従い、前記聴覚重み付け誤差信号を最小化するような固定符号及び固定符号ベクトルを出力する固定符号ベクトル出力手段と、
前記励振信号パラメータ抽出手段からの制御に従い、前記適応符号ベクトルに関する適応符号利得と、前記固定符号ベクトルに関する固定符号利得とを求めて出力する利得出力手段と、
前記適応符号ベクトル出力手段からの適応符号ベクトルと、前記固定符号ベクトル出力手段からの固定符号ベクトルと、前記利得出力手段からの適応符号利得及び固定符号利得とから駆動音源信号を生成する駆動音源信号生成手段と、
前記駆動音源信号と、前記線形予測分析手段からの線形予測フィルタ係数に基づいて再生音声信号を合成する再生音声合成手段と、
前記入力される音声信号についてサブフレーム単位で、ピークを持つパルス成分の有無を示すピーキネス情報を検出するピーク性検出手段とを備え、
前記励振信号パラメータ抽出手段が、
前記フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、前記グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
前記通常処理サブフレームでは、前記固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、前記適応符号ベクトル出力手段からの適応符号及び前記取得した固定符号及び前記利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含め、
前記代替処理サブフレームでは、前記固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、前記適応符号ベクトル出力手段からの適応符号及び前記ピーク性検出手段で検出されたピーキネス情報及び前記利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含める励振信号パラメータ抽出手段であり、
前記固定符号ベクトル出力手段が、
過去の固定符号ベクトルを記憶し、シフト可能なシフト機能付き固定符号ベクトル格納バッファと、
前記通常処理サブフレームの場合の動作系と前記代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、前記聴覚重み付け誤差を最小化する固定符号ベクトル及び前記固定符号ベクトルに対応する固定符号帳のインデックスを検出し、前記検出された固定符号帳のインデックスを固定符号として出力し、前記検出された固定符号ベクトルを出力すると共に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、サブフレームにおけるサンプル数分シフトしてから、前記取得した固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納する符号帳処理部と、
前記励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力する切り出し処理部と、
前記信号切り出し処理部から出力される代替固定符号ベクトルのパルスを検出し、パルス数が予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正すると共に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、前記補正した代替固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納する非同期パルス発生部と、
前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルを出力する固定符号ベクトルエネルギ調整部と、
前記励振信号パラメータ抽出手段からの指示が通常の探索処理の指示であった場合に、前記符号帳処理部からの固定符号ベクトルを外部に出力し、前記励振信号パラメータ抽出手段からの指示が代替の探索処理の指示であった場合に、前記固定符号ベクトルエネルギ調整部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であるものなので、
演算量を増加することなく、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0019】
上記従来例の問題点を解決するための本発明は、音声復号化装置において、
本発明の音声符号化装置で符号化された音声符号化データから適応符号と、固定符号又はピーキネス情報と、適応符号及び固定符号の利得と、線形予測フィルタ係数とを分離する分離手段と、
前記分離された適応符号を復号してピッチ周期の情報を出力すると共に、前記ピッチ周期の情報に基づき過去の駆動音源信号から適応符号ベクトルを出力する適応符号ベクトル出力手段と、
前記分離された固定符号又はピーキネス情報に基づき、固定符号ベクトルを出力する固定符号ベクトル出力手段と、
前記分離された適応符号及び固定符号の利得に基づき適応符号帳利得及び固定符号帳利得を出力する利得ベクトル出力手段と、
前記適応符号ベクトル及び前記固定符号ベクトル及び前記適応符号帳利得及び前記固定符号帳利得とから駆動音源信号を生成する駆動音源信号生成手段と、
前記駆動音源信号と前記線形予測フィルタ係数とから音声信号を再生する音声再生手段とを備え、
前記固定符号ベクトル出力手段が、
過去の固定符号ベクトルを記憶し、シフト可能なシフト機能付き固定符号ベクトル格納バッファと、
音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
前記通常処理サブフレームの場合の動作系と前記代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
前記切替制御手段の制御で前記通常処理サブフレームの場合に、予め複数の固定符号ベクトルが定められている固定符号帳を用いて、前記分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、サブフレームにおけるサンプル数分シフトしてから、前記取得した固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納する符号帳処理部と、
前記切替制御手段の制御で前記代替処理サブフレームの場合に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトさせて、前記適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力する切り出し処理部と、
前記信号切り出し処理部から出力される代替固定符号ベクトルのパルスを検出し、パルス数が予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正するとと共に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、前記補正された代替固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納する非同期パルス発生部と、
前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルを出力する固定符号ベクトルエネルギ調整部と、
前記切替制御手段の制御で、前記通常処理サブフレームの場合に前記符号帳処理部からの固定符号ベクトルを外部に出力し、前記代替処理サブフレームの場合に前記切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であるものなので、
ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上できる。
【0020】
【発明の実施の形態】
本発明の実施の形態について図面を参照しながら説明する。
尚、以下で説明する機能実現手段は、当該機能を実現できる手段であれば、どのような回路又は装置であっても構わず、また機能の一部又は全部をソフトウェアで実現することも可能である。更に、機能実現手段を複数の回路によって実現してもよく、複数の機能実現手段を単一の回路で実現してもよい。
【0021】
上位概念的に説明すれば、本発明に係る音声符号化方法及び音声符号化装置は、入力音声信号についてサブフレーム単位で、ピークを持つパルス成分の有無を示すピーキネス情報を検出し、聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、探索処理の結果から固定符号及び固定符号に対応する固定符号ベクトルを取得し、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて、代替処理サブフレームでは、固定符号帳の探索処理は行わず、固定符号の代わりにピーキネス情報を励振信号パラメータに含め、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得し、ピーキネス情報に基づく補正を施し、更にエネルギー調整をしてから固定符号ベクトルとする取得制御方法であるので、演算量を増加することなく、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0022】
また、本発明に係る音声復号化方法及び音声復号化装置は、本発明の音声符号化方法で符号化された音声符号化データにおける励振信号パラメータに含まれる固定符号又はピーキネス情報に基づいて固定符号ベクトルを取得する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、予め備えている固定符号帳を用いて、励振信号パラメータに含まれる固定符号を固定符号帳のインデックスとして、インデックスに対応する固定符号ベクトルを取得し、代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得し、ピーキネス情報に基づく補正を施し、更にエネルギー調整をしてから固定符号ベクトルとする取得方法であるので、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上できる。
【0023】
機能実現手段で説明すれば、本発明に係る音声符号化方法及び音声符号化装置は、ピーク性検出手段が入力される音声信号についてサブフレーム単位で、ピークを持つパルス成分の有無を示すピーキネス情報を検出し、励振信号パラメータ抽出手段が、フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、通常処理サブフレームでは、固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、固定符号ベクトル出力手段から出力される適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含め、代替処理サブフレームでは、固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、適応符号及びピーキネス情報及び適応符号利得及び固定符号利得を励振信号パラメータに含めることとし、固定符号ベクトル出力手段が、過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、聴覚重み付け誤差を最小化する固定符号ベクトル及び固定符号ベクトルに対応する固定符号帳のインデックスを検出し、検出された固定符号帳のインデックスを固定符号として出力し、検出された固定符号ベクトルを出力すると共に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファに格納する符号帳処理部と、励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力する切り出し処理部と、信号切り出し処理部から出力される代替固定符号ベクトルのパルスを検出し、パルス数が予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正すると共に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、補正された代替固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファに格納する非同期パルス発生部と、補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルを出力する固定符号ベクトルエネルギ調整部と、励振信号パラメータ抽出手段からの指示が通常の探索処理の指示であった場合に、符号帳処理部からの固定符号ベクトルを外部に出力し、励振信号パラメータ抽出手段からの指示が代替の探索処理の指示であった場合に、固定符号ベクトルエネルギ調整部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有するものなので、演算量を増加することなく、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0024】
また、本発明に係る音声復号化方法及び音声復号化装置は、固定符号ベクトル出力手段が、過去の固定符号ベクトルを記憶し、シフト可能なシフト機能付き固定符号ベクトル格納バッファと、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、切替制御手段の制御で通常処理サブフレームの場合に、予め複数の固定符号ベクトルが定められている固定符号帳を用いて、分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、サブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファに格納する符号帳処理部と、切替制御手段の制御で代替処理サブフレームの場合に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力する切り出し処理部と、信号切り出し処理部から出力される代替固定符号ベクトルのパルスを検出し、パルス数が予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正するとと共に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、補正された代替固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファに格納する非同期パルス発生部と、補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルを出力する固定符号ベクトルエネルギ調整部と、切替制御手段の制御で、通常処理サブフレームの場合に符号帳処理部からの固定符号ベクトルを外部に出力し、代替処理サブフレームの場合に切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であるものなので、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上できる。
【0025】
尚、本発明の実施の形態における音声符号化側の主要な各手段と図1の各部との対応を示すと、ピーク性検出手段はピーク性検出部25に相当し、励振信号パラメータ抽出手段は自乗誤差最小化部8に相当し、適応符号ベクトル出力手段は適応符号帳探索部4に相当し、固定符号ベクトル出力手段は固定符号帳探索部5に相当し、利得出力手段は利得符号帳探索部6に相当し、駆動音源信号生成手段は乗算器21、乗算器22、加算器23に相当し、再生音声合成手段はLPC合成部7に相当している。
【0026】
また、固定符号ベクトル出力手段内の各構成要素と図2の各部との対応を示すと、シフト機能付き固定符号ベクトル格納バッファがシフト機能付き固定符号ベクトル格納バッファ12に、切替制御手段が切替制御部16に相当し、符号帳処理部が符号帳処理部11に、切り出し処理部が信号切り出し処理部13に、固定符号ベクトルエネルギ調整部が固定符号ベクトルエネルギ調整部17に、スイッチがスイッチ15に相当している。
【0027】
また、本発明の実施の形態における音声復号化側の主要な各手段と図4の各部との対応を示すと、分離手段が分離部31に、適応符号ベクトル出力手段が適応符号ベクトル出力部32に、固定符号ベクトル出力手段が固定符号ベクトル出力部33に、利得ベクトル出力手段が利得ベクトル出力部34に、駆動音源信号生成手段が乗算器35、乗算器36,加算器37に、音声再生手段がLPC合成部38、ポストフィルタ39に相当している。
【0028】
そして、固定符号ベクトル出力手段内の各構成要素と、図5の各部との対応を示すと、シフト機能付き固定符号ベクトル格納バッファがシフト機能付き固定符号ベクトル格納バッファ42に、切替制御手段が切替制御部46に相当し、符号帳処理部が符号帳処理部41に、切り出し処理部が信号切り出し処理部43に、固定符号ベクトルエネルギ調整部が固定符号ベクトルエネルギ調整部47に、スイッチがスイッチ45に相当している。
【0029】
まず、本発明に係る代数的符号励振予測方式(ACELP)の音声符号化装置の概略構成例について図1を使って説明する。図1は、本発明に係る音声符号化装置の概略構成ブロック図である。
本実施の形態に係る音声符号化装置は、図1に示すように、前処理部1と、LPC分析量子化補間処理部2と、聴覚重み付け処理部3と、適応符号帳探索部4と、固定符号帳探索部5と、利得符号帳探索部6と、LPC合成部7と、自乗誤差最小化部8と、多重化処理部9と、ピーク性検出部25とから構成されている。
尚、図には示していないが、フレームタイミング、サブフレームタイミングに従って、各部の動作をトータルに制御するようなタイミング制御部が音声符号化装置全体を制御している。
【0030】
本発明の音声符号化装置の各部について簡単に説明する。
前処理部1は、信号のスケーリングと高域通過フィルタリングを行うものである。
LPC分析量子化補間処理部2は、1フレーム毎に線形予測(Linear Prediction:LP)分析を行ってLPフィルタ係数(LPC係数)の算出を行い、算出されたLPC係数を線スペクトル対(Linear Spectrum Pair:LSP)に変換して量子化し、LSP係数の符号(D)を出力すると共に、更に補間して、量子化及び補間結果に基づいて逆変換されたLPC係数を出力するものである。
【0031】
ピーク性検出部25は、前処理部1で前処理された音声信号及びLPC分析量子化補間処理部2から出力されるLPC係数を入力し、LPC予測残差信号を計算した後、ピーキネス値pを計算により求め、それが予め定められた閾値(例えば1.34)と比較して大きければピーキネス情報(E)を1に設定し、そうでなければ0に設定して出力するものである。
【0032】
ここで、ピーキネス値pとは、信号中にピークをもつパルス的な成分(スパイクという)が存在する可能性を表すパラメータであり、文献1(D.Thomson and D.Prezas,SELECTIVE MODELING OF THE LPC RESIDUAL DURING UNVOICED FRAMES:WHITE NOISE OR PULSE EXCITATION,Proc.ICASSP,pp.3087−3090,1986)より[数1]で与えられる。
【0033】
【数1】
Figure 2004020676
【0034】
[数1]において、Nは1サブフレーム中のサンプル数、eは残差信号である。[数1]において分子は分母に比べ大きな値の影響を受けやすいので、pは残差信号中に大きなスパイクが存在する時に大きな値となる。
従って、ピーキネス値pが大きいほど、そのフレームが破裂音フレームである可能性が大きくなる。なぜなら、破裂音のフレームでは、部分的にスパイク(鋭いピーク)を持つが、その他の部分は、白色雑音に近い性質の信号になっているためである。
尚、ピーク性検出部25で求めたピーキネス情報(E)は、後述する多重化処理部9で他のデータ共に多重化され、ビットストリーム化されて送信されると共に、後述する固定符号帳探索部5で使用されることになる。
【0035】
加算器20は、前処理が施された音声入力信号と、前フレームの再生音声信号との差分を取って、誤差信号を出力するものである。
聴覚重み付け処理部3は、入力される誤差信号に対し、サブフレーム単位でLPC係数を用いて聴覚重み付け処理(公知の技術)を行い、聴覚重み付け誤差信号を出力するものである。
【0036】
適応符号帳探索部4は、サブフレーム毎に、ピッチ周期成分を探索するもので、具体的には、後述する自乗誤差最小化部8からの制御信号に従い、過去の駆動音源信号に対してある遅延(ピッチ周期)だけさかのぼり、その点からサブフレーム長のサンプルを切り出して現サブフレームに充当し、これに基づいて作成された再生音声信号と入力音声信号との誤差が最小となるピッチ周期を検出し、検出されたピッチ周期の情報を適応符号(A)として自乗誤差最小化部8に出力する。
また、検出されたピッチ周期を元に過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出し、適応符号ベクトルとして利得算出のために利得符号帳探索部6へ出力すると共に、過去の駆動音源信号生成の為にも出力する。
【0037】
固定符号帳探索部5は、サブフレーム毎に、ピッチ周期成分以外のランダムな成分を探索するもので、入力音声信号から前記適応符号帳探索部4で検出されたピッチ周期及び後述する利得符号帳探索部6で算出された適応符号帳利得に基づく適応符号ベクトル寄与分を減算した目標信号に対して探索を行う。
具体的には、予め候補配置を定められた複数のパルスに関するパルスの組み合わせベクトル(固定符号ベクトル)を固定符号帳として保持し、後述する自乗誤差最小化部8からの制御信号に従い、固定符号帳のインデックス候補に対応する複数のパルスに極性を与え、パルス波形信号を固定符号ベクトルとして出力し、当該固定ベクトルに基づいて作成された再生音声信号と上記目標信号との自乗誤差が最小化されるような固定符号帳のインデックスを検出し、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力する。
【0038】
また、検出された固定符号帳のインデックスに対応する複数のパルスから成るパルス波形信号を固定符号ベクトルとし、利得算出のために重み付けを行った重み付け固定符号ベクトルを利得符号帳探索部6へ出力すると共に、固定符号ベクトルを過去の駆動音源信号生成の為にも出力する。
尚、本発明の固定符号帳探索部5では、自乗誤差最小化部8からの制御信号に従い、固定符号ベクトルを出力する方法が従来とは異なっているが、詳細は後述する。
【0039】
利得符号帳探索部6は、後述する自乗誤差最小化部8からの制御信号に従い、適応符号帳探索部4から入力される適応符号ベクトルと固定符号帳探索部5からの(重み付け)固定符号ベクトルより、入力音声と再生音声との重み付け平均自乗誤差を最小にする適応符号帳利得および固定符号帳利得を求め、利得符号として自乗誤差最小化部8に出力する。
また、検出された適応符号帳利得および固定符号帳利得を過去の駆動音源信号生成の為にも出力する。
【0040】
自乗誤差最小化部8は、聴覚重み付け処理部3で重み付けされた聴覚重み付け誤差信号を入力し、聴覚重み付け誤差を最小にするような各符号を探索するように適応符号帳探索部4、固定符号帳探索部5、利得符号帳探索部6に制御信号を出力し、各々における探索結果である聴覚重み付け誤差を最小とするような適応符号帳のインデックスである適応符号(A)、固定符号帳のインデックスである固定符号(B)、適応符号利得及び固定符号利得からなる利得符号(C)を受け取って、励振パラメータとして多重化処理部9に出力するものである。
尚、本発明の自乗誤差最小化部8では、固定符号帳探索部5への制御方法が従来とは異なっているが、詳細は後述する。
【0041】
乗算器21は、適応符号帳探索部4から出力される適応符号化ベクトルと、利得符号帳探索部6から出力される適応符号利得との乗算を行うものである。
乗算器22は、固定符号帳探索部5から出力される固定符号化ベクトルと、利得符号帳探索部6から出力される固定符号利得との乗算を行うものである。
加算器23は、乗算器21から出力される適応符号化ベクトルと適応符号利得との乗算結果と、乗算器22から出力される固定符号化ベクトルと固定符号利得との乗算結果とを加算して、駆動音源信号を出力するものである。
【0042】
LPC合成部7は、LPC分析量子化補間処理部2から出力されるLPC係数、及び加算器23から出力される駆動音源信号により音声信号を再生し、符号化側における再生音声信号を出力するものである。
【0043】
多重化処理部9は、自乗誤差最小化部8からの適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータと、LPC分析量子化補間処理部2からのLSP係数の符号(D)を多重化して、ビットストリーム化し、音声符号化データとして送信するものである。
尚、本発明における多重化処理部9の特徴として、フレームを構成する複数のサブフレームの中で、一部のサブフレーム(例えば、偶数フレーム、但し奇数フレームでも良い)においては、固定符号(B)の代わりにピーク性検出部25からのピーキネス情報(E)を用いて多重化するようになっている。詳細は後述する。
【0044】
次に、本実施の形態に係る音声符号化装置の一般的なACELP方式の基本動作について図1を使って説明する。
本発明の音声符号化装置では、一般的なACELP方式の基本動作として、送信する音声信号が入力されると、前処理部1でスケーリング及び高域通過フィルタリングの前処理が施され、LPC分析量子化補間処理部2でLPC分析され、LSP係数に変換されて量子化され、補間されて、LPC係数とLSP係数の符号(D)とが出力される。
【0045】
また、本発明の特徴部分動作として、前処理部1から出力された前処理後の音声信号は、ピーク性検出部25に入力され、LPC分析量子化補間処理部2から出力されるLPC係数を用いてLPC予測残差信号が算出され、ピーキネス値pが算出されて、閾値判断により、信号中にピークをもつパルス的な成分(スパイクという)が存在するか否かを示すピーキネス情報(E)が生成されて出力される。
【0046】
一方、前処理部1から出力された前処理後の音声信号は、加算器20で1フレーム前の符号化側における再生音声信号との差分が取られて誤差信号が出力され、聴覚重み付け処理部3において、LPC分析量子化補間処理部2からのLPC係数を用いて誤差信号に聴覚重み付けが為され、聴覚重み付け誤差信号が自乗誤差最小化部8に入力される。
【0047】
自乗誤差最小化部8では、まず適応符号帳探索部4に対して聴覚重み付け誤差を最小にするようなピッチ周期の適応符号を探索する指示の制御信号(図では点線矢印)を出力し、適応符号帳探索部4で誤差信号が最小となるピッチ周期が検出され、検出されたピッチ周期の情報が適応符号(A)として自乗誤差最小化部8に出力される。また、検出されたピッチ周期を元に過去の駆動音源信号からサブフレームにおけるサンプル数分の信号を切り出した適応符号ベクトルが出力される。
【0048】
そして、自乗誤差最小化部8では、利得符号帳探索部6に対して適応符号の利得算出を指示する制御信号(図では点線矢印)が出力され、利得符号帳探索部6で、適応符号帳探索部4から出力される適応符号ベクトルより、適応符号帳利得が求められて出力される。
【0049】
次に、自乗誤差最小化部8では、通常動作としては、固定符号帳探索部5に対して入力音声信号から適応符号ベクトル寄与分を減算した目標信号に対して聴覚重み付け誤差を最小にするような固定符号を探索する指示の制御信号(図では点線矢印)を出力し、固定符号帳探索部5で誤差信号が最小となる固定符号帳インデックスが固定符号(B)として自乗誤差最小化部8に出力される。
【0050】
尚、ここで本発明の特徴部分動作としては、自乗誤差最小化部8では、固定符号帳探索部5における固定符号帳探索を簡単にするために、フレームを構成する一部サブフレームにおいては、上記通常通りの動作を行わず代替の処理を行わせることになるが、詳細は後述する。
【0051】
そして、自乗誤差最小化部8では、利得符号帳探索部6に対して固定符号の利得算出を指示する制御信号(図では点線矢印)が出力され、利得符号帳探索部6では、固定符号帳探索部5から入力される重み付け固定符号ベクトルより、固定符号帳利得が求められ、既に求めた適応符号帳利得と固定符号帳利得とが利得符号として自乗誤差最小化部8に出力される。
【0052】
上記動作の結果、自乗誤差最小化部8では、サブフレーム毎に聴覚重み付け誤差を最小化する適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータが決定されて多重化処理部9に出力され、多重化処理部9ではフレーム毎にLPC分析量子化補間処理部2から出力されるLPC係数と、サブフレーム毎に自乗誤差最小化部8から出力される励振信号パラメータが多重化されて、ビットストリーム化されて送信される。
尚、本発明の特徴部分として、一部サブフレームでは、固定符号(B)の代わりにピーク性検出部25からのピーキネス情報(E)が励振信号パラメータとして多重化されるが、詳細は後述する。
【0053】
そして、サブフレームにおける励振信号パラメータが決定されると、適応符号帳探索部4からの適応符号ベクトルと利得符号帳探索部6からの適応符号帳利得とが乗算器21で乗算され、固定符号帳探索部5からの固定符号ベクトルと利得符号帳探索部6からの固定符号帳利得とが乗算器22で乗算され、乗算器21の乗算結果と乗算器22の乗算結果とが加算器23で加算されて、1サブフレーム前の駆動音源信号として出力される。
【0054】
駆動音源信号は、適応符号帳探索部4に入力されて、次のサブフレームのピッチ周期検出に用いられると共に、LPC合成部7に入力され、LPC合成部7でLPC分析量子化補間処理部2から出力されるLPC係数と駆動音源信号により音声信号を再生され、符号化側における再生音声信号として出力され、加算器20で入力音声信号との差分が取られるようになっている。
【0055】
上記図1を用いて説明した動作が、本発明の前提となる代数的符号励振予測方式(ACELP)の音声符号化装置の一般的な動作であるが、本発明の特徴部分は、励振パラメータ中の固定符号の取り扱い、及びそれに伴う固定符号ベクトルの取得方法が従来のそれとは異なっている。
【0056】
具体的に説明すると、従来ACELP方式の音声符号化方法において、サブフレーム毎に行っていた固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を、本発明ではフレーム内の一部のサブフレームのみで行うものとし、残りのサブフレームでは、固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を行わないようにし、固定符号の代わりに、当該サブフレームについてピーク性検出部25で検出されたピーキネス情報(E)を励振信号パラメータとして音声符号化データとすることとし、固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を行わないようにするものである。
【0057】
ここで、従来通りの固定符号帳の探索処理により固定符号及び固定符号ベクトルの取得を行うサブフレームを通常処理サブフレームと呼び、固定符号(B)の代わりにピーキネス情報(E)を用いるに当たり固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を行わないサブフレームを代替処理サブフレームと呼んで、以降説明する。
尚、フレーム内の複数サブフレームを、どの様に通常処理サブフレームと代替処理サブフレームに割り振るかに付いては、後で詳しく述べることにする。
【0058】
即ち、本発明の音声符号化方法では、フレームを構成する複数のサブフレームの内、通常処理サブフレームでは従来通りの固定符号帳の探索処理により固定符号の取得を行って、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて音声符号化データを作成し、代替処理サブフレームでは、固定符号帳の探索処理による固定符号の取得を行わず、適応符号及びピーキネス情報及び適応符号利得及び固定符号利得を励振信号パラメータとして音声符号化データを作成する。
これにより、代替サブフレームにおいて固定符号(通常、17ビット)の代わりにピーキネス情報(1ビット)を用いるのでデータ量を軽減し、ビットレートを軽減できるものである。
【0059】
そして、本発明の音声符号化方法では、代替処理サブフレームにおいて通常の固定符号帳の探索処理による固定符号の取得を行わないために、固定符号ベクトルが生成されず再生音声の品質劣化を招かないように、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、取得した代替固定符号ベクトルに対してピーキネス情報に基づく補正を行い、更にエネルギー調整を行ってから、固定符号ベクトルとして出力するようにするものである。
【0060】
また、本発明の音声符号化方法に対応した音声復号化方法では、音声符号化データ中で、代替処理サブフレームにおいて固定符号のデータの代わりにピーキネス情報が存在するため、固定符号ベクトルが生成されず再生音声の品質劣化を招かないように、符号化の場合と同様に、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、この代替固定符号ベクトルに対してピーキネス情報に基づく補正を行い、更にエネルギー調整を行ってから、固定符号ベクトルとして出力するようにするものである。
【0061】
上記説明した本発明の音声符号化方法を実現するために、本発明の音声符号化装置では、図1に示したACELP方式の音声符号化装置の一般的な構成において、多重化処理部9の動作と、自乗誤差最小化部8の動作と、固定符号帳探索部5の内容が従来のものとは異なっている。
尚、本発明では、通常処理サブフレームと代替処理サブフレームの設け方を限定するものではないが、1つの例として、通常処理サブフレームと代替処理サブフレームを交互に設ける場合、即ち、通常処理サブフレームを奇数サブフレームとし、代替処理サブフレームを偶数サブフレームとした例で、以降説明する。
【0062】
本発明の自乗誤差最小化部8は、聴覚重み付け誤差信号を最小にするような適応符号(A)、固定符号(B)、利得符号(C)を取得する制御を行うものであるが、特に固定符号を取得する制御において、通常処理サブフレーム(例えば奇数サブフレーム)のタイミングでは、固定符号帳探索部5に対して通常通りの手順で固定符号帳探索を行わせる固定符号帳探索処理の指示を出力して、聴覚重み付け誤差信号が最小となる固定符号帳のインデックスを探索させ、固定符号帳探索部5から出力される固定符号を受け取って、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて音声符号化データとして送信する制御を行う。
【0063】
そして、代替処理サブフレーム(例えば偶数サブフレーム)のタイミングでは、固定符号帳探索部5に対して固定符号帳の探索処理は行わせず、固定符号を励振パラメータに含めず、適応符号及び適応符号利得及び固定符号利得だけを励振信号パラメータに含めて多重化処理部9に出力し、固定符号帳探索部5には代替の固定符号ベクトルを出力させる代替固定符号ベクトル出力処理の指示を行うようになっている。
【0064】
また、本発明の多重化処理部9は、上記説明した通常処理サブフレームでは、自乗誤差最小化部8からの適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータと、LPC分析量子化補間処理部2からのLSP係数の符号(D)を多重化し、代替処理サブフレームでは、自乗誤差最小化部8からの適応符号(A)とピーク性検出部25からのピーキネス情報(E)と利得符号(C)とから成る励振信号パラメータと、LSP係数の符号(D)を多重化し、音声符号化データとするようになっている。
【0065】
尚、ピーク性検出部25からのピーキネス情報(E)を自乗誤差最小化部8に入力するようにして、自乗誤差最小化部8の制御によって、通常処理サブフレームでは、適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータを多重化処理部9に出力し、代替処理サブフレームでは、適応符号(A)とピーク性検出部25からのピーキネス情報(E)と利得符号(C)とから成る励振信号パラメータを多重化処理部9に出力するようにしても構わない。
それにより、本発明の特徴的な制御を自乗誤差最小化部8に特化し、多重化処理部9は従来のままの構成を使用することができる。
【0066】
本発明の固定符号帳探索部5は、自乗誤差最小化部8からの制御指示に従い、通常処理サブフレームのタイミングでは固定符号帳探索処理の指示を受けて、従来通り固定符号帳を探索して、固定符号ベクトル及び固定符号を取得する処理を行う。
また、代替処理サブフレームのタイミングでは、代替固定符号ベクトル出力処理の指示を受けて、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得し、この代替固定符号ベクトルに対してピーキネス情報に基づく補正を行い、更にエネルギー調整を行ってから、固定符号ベクトルとして出力するようにするものである。
【0067】
ここで、本発明の音声符号化装置における固定符号帳探索部5の内部構成例について、図2を使って説明する。図2は、本発明の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
本発明の音声符号化装置における固定符号帳探索部5の内部は、図2に示すように、符号帳処理部11と、シフト機能付き固定符号ベクトル格納バッファ12と、信号切り出し処理部13と、非同期パルス発生部14と、スイッチ15と、切替制御部16と、固定符号ベクトルエネルギ調整部17とから構成されている。
【0068】
各部について説明する。
符号帳処理部11は、予め候補配置を定められた複数のパルスに関するパルスの組み合わせベクトルを保持している固定符号帳を備えており、自乗誤差最小化部8からの制御信号に従って、自乗誤差最小化部8からの指示が通常の探索処理の指示であった場合には、固定符号帳の中で、聴覚重み付け誤差を最小にするようなベクトルのインデックスを検出する最小歪みパルス組み合わせ探索処理を行い、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力すると共に、検出された固定符号帳のインデックスに対応するパルス波形信号を固定符号ベクトルとして出力するものである。
【0069】
尚、従来の音声符号化装置における固定符号帳探索部5では、この符号帳処理部11における最小歪みパルス組み合わせ探索処理をサブフレーム毎に行っていたが、本発明の固定符号帳探索部5では、フレームを構成する複数サブフレームの内の通常処理サブフレーム(例えば、奇数サブフレーム)で最小歪みパルス組み合わせ探索処理を行うようにしている点が特徴である。
【0070】
シフト機能付き固定符号ベクトル格納バッファ12は、符号帳処理部11から出力される固定符号ベクトル、又は後述する信号切り出し処理部13から出力され、非同期パルス発生部14で補正された代替固定符号ベクトルを複数サブフレーム分格納するバッファである。
尚、シフト機能付き固定符号ベクトル格納バッファ12は、シフトレジスタなどで構成され、格納されている過去の複数サブフレーム分の固定ベクトル(又は代替固定符号ベクトル)をサブフレーム毎にサブフレームに対応するサンプル数分だけ過去方向にシフトした後、新しい固定符号ベクトル又は代替固定符号ベクトルを挿入することによりバッファを更新するようになっている。また、信号切り出し処理部13によって切り出される際には、内容をシフトすることによって読み出し(切り出し)位置を調整できるようになっている。
【0071】
信号切り出し処理部13は、自乗誤差最小化部8からの指示が代替の探索処理の指示であった場合に、適応符号帳探索部4からのピッチ周期の情報に従って、シフト機能付き固定符号ベクトル格納バッファ12に記憶されている固定符号ベクトル(又は代替固定符号ベクトル)のデータ系列でピッチ周期の情報分さかのぼった個所からサブフレームにおけるサンプル数分切り出し、代替固定符号ベクトルとして出力するものである。
【0072】
非同期パルス発生部14は、代替固定符号ベクトルに対してピーキネス情報に基づく補正を施すものである。
具体的には、信号切り出し処理部13から出力される代替固定符号ベクトルのパルス数をカウントし、パルスが存在しない場合、又は、パルスの本数が予め定めた数より少ない場合には、ピーク性検出部25から出力されるピーキネス情報(E)を参照し、ピーキネス情報(E)がピーク性ありを示している場合(1の場合)には、予め定められている数本の非周期パルスを強制的に代替固定符号ベクトルに挿入して補正し、補正された代替固定符号ベクトルを出力するものである。
尚、補正に用いられる非周期パルスは、実験の結果例えば、等間隔に4本のパルスを立てたような信号を用いるのが好適であったが、それに限定するものではない。
【0073】
そして、非同期パルス発生部14では、シフト機能付き固定符号ベクトル格納バッファ12に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、補正した代替固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファ12に格納して、過去の固定符号ベクトルを更新するようになっている。
【0074】
固定符号ベクトルエネルギ調整部17は、非同期パルス発生部14からの出力信号である補正された代替固定符号ベクトルに存在するパルス数に応じて各パルスの振幅を可変することにより、代替固定符号ベクトルのエネルギーが全てのサブブレームにおいて均一になるように調整し、エネルギ調整された代替固定符号ベクトルを出力するものである。
【0075】
スイッチ15は、切替制御部16からの制御で符号帳処理部11から出力される固定符号ベクトルと、信号切り出し処理部13側から出力される代替固定符号ベクトルとをサブフレーム毎に切り替えて、固定符号ベクトルとして出力するスイッチである。
【0076】
切替制御部16は、自乗誤差最小化部8からの指示に従い、通常の固定符号帳探索処理の指示であった場合には、符号帳処理部11を動作させて通常の固定符号ベクトルを出力させ、それと共にスイッチ15を符号帳処理部11側に切り替えて、符号帳処理部11からの固定符号ベクトルを固定符号帳探索部5からの固定符号ベクトル出力とし、また代替固定符号ベクトル出力処理の指示であった場合には、信号切り出し処理部13を動作させて代替固定符号ベクトルを出力させ、それと共にスイッチ15を信号切り出し処理部13側に切り替えて、代替固定符号ベクトルを固定符号帳探索部5からの固定符号ベクトル出力とするものである。
【0077】
次に、本発明の音声符号化装置における固定符号帳探索部5の動作について、図2を参照しながら説明する。
本発明の音声符号化装置における第1の固定符号帳探索部5では、自乗誤差最小化部8からサブフレーム毎に入力される制御信号に基づいて、通常処理サブフレーム(例えば、奇数サブフレーム)のタイミングで自乗誤差最小化部8から固定符号帳探索処理の指示があった場合には、符号帳処理部11で、聴覚重み付け誤差を最小にするようなベクトルのインデックスを検出し、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力すると共に、検出された固定符号帳のインデックス候補に対応する固定符号ベクトルが出力され、切替制御部18の制御によって、スイッチ15が符号帳処理部11側に接続されて、符号帳処理部11から出力された固定符号ベクトルが固定符号帳探索部5からの固定符号ベクトル出力として外部に出力される。
【0078】
そして、この時、符号帳処理部11から出力された固定符号ベクトルは、シフト機能付き固定符号ベクトル格納バッファ12に格納されるが、その際、シフト機能付き固定符号ベクトル格納バッファ12に既に記憶されていた過去の代替符号ベクトルは、1サブフレーム分シフトされて新しいて固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0079】
一方、代替処理サブフレーム(例えば、偶数サブフレーム)のタイミングで自乗誤差最小化部8から代替固定符号ベクトル出力処理の指示があった場合には、切替制御部18の制御によって信号切り出し処理部13が動作し、適応符号帳探索部4からのピッチ周期の情報に従い、シフト機能付き固定符号ベクトル格納バッファ12内に格納されているデータ系列を、入力されたピッチ周期の情報分さかのぼった個所から読み出せるようにピッチ周期の情報分シフトさせてから読み出し、代替固定符号ベクトルとして出力する。
【0080】
そして、代替固定符号ベクトルは、非同期パルス発生部14でパルス数がカウントされ、パルス数が0(ゼロ)、又は、予め定めた数より少なく、且つピーク性検出部25から出力されるピーキネス情報(E)がピーク性ありの場合に、非周期パルスが強制的に挿入されて補正され、固定符号ベクトルエネルギ調整部17でエネルギ調整さて、スイッチ15が信号切り出し処理部13側に接続されて、代替固定符号ベクトルが固定符号帳探索部5からの固定符号ベクトル出力として外部に出力される。
【0081】
更に、この時、非同期パルス発生部14で補正された代替固定符号ベクトルは、シフト機能付き固定符号ベクトル格納バッファ12に格納されるが、その際、シフト機能付き固定符号ベクトル格納バッファ12に既に記憶されていた過去の固定符号ベクトルはシフトされて、新しいて代替固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0082】
上記説明では、便宜上奇数サブフレームでは符号帳処理部11からの固定符号ベクトルが出力され、偶数サブフレームでは信号切り出し処理部13からの代替固定符号ベクトルが現サブフレームにおける固定符号ベクトルとして選択されるように記述してきたが、逆の状態でも動作的には変わらない。
【0083】
ここで、非同期パルス発生部14の効果について、図3を使って具体的に説明する。図3は、破裂音“k”の時間波形(サンプル値)の例を示す説明図である。
図3に示すように、破裂音の波形は、部分的にスパイク(鋭いピーク)を持つが、その他の部分は、白色雑音に近い性質の信号になっている。
この破裂音が偶数サブフレーム1に存在し、信号切り出し処理部13により代替固定符号ベクトルが作られる場合を考える。
【0084】
破裂音等の無声音区間または無音区間では、適応符号帳探索の結果、非常に小さなラグ値(30サンプル以下)が検出されるケースが多くなる。ラグ値を例えば30サンプルとすると、シフト機能付き固定符号ベクトル格納バッファ12に格納されている波形のうち、過去30サンプル時点から信号を切り出してくることになるが、ここで問題として、その切り出し区間にパルスが1本も立っていない場合、切り出された信号(代替固定符号ベクトル)にはパルスが存在しないため破裂音の音源を表現できなくなる。
【0085】
そこで、非同期パルス発生部14により、代替固定符号ベクトルのパルス数をカウントし、パルスが存在しない場合、または、パルスの本数が予め定めた数より少ない場合にピーキネス情報(E)がピーク性ありを示している場合に、破裂音のフレームの可能性大として、数本の非周期パルスを強制的に挿入することにより、適切な音源表現が可能となり再生音声品質が改善されることになる。
【0086】
上記説明したように本発明の音声符号化方法及び音声符号化装置では、フレームを構成する複数サブフレームの中で、代替処理サブフレームにおける励振パラメータでは、固定符号の代わりにピーキネス情報を用いて音声符号化データを作成することになる。
それに伴い、この固定符号の代わりにピーキネス情報が用いられた音声符号化データを受けて復号化する音声復号化方法及び音声復号化装置について説明する。
【0087】
本発明の音声復号化方法は、基本的には、符号化された励振信号パラメータの適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、適応符号ベクトル及び固定符号ベクトル及び符号化された励振信号パラメータに基づく適応符号利得及び固定符号利得とから駆動音源信号を生成し、駆動音源信号と線形予測フィルタ係数を用いて音声信号を再生するものであるが、本発明の特徴として、励振信号パラメータの固定符号に基づいて固定符号ベクトルを生成する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、固定符号帳を用いて固定符号に対応する固定符号ベクトルを取得し、代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に基づいて切り出した代替固定符号ベクトルを取得し、音声符号化データに含まれるピーキネス情報を用いて代替固定符号ベクトルを補正し、更にエネルギー調整してから固定符号ベクトルとするものである。
【0088】
次に、上記説明した本発明に係る代数的符号励振予測方式(ACELP)の音声符号化に対応する音声復号化装置の概略構成例について図4を使って説明する。図4は、本発明に係る音声復号化装置の概略構成ブロック図である。
本発明の音声復号化装置は、図4に示すように、分離部31と、適応符号ベクトル出力部32と、固定符号ベクトル出力部33と、利得ベクトル出力部34と、乗算器35と、乗算器36と、加算器37と、LPC合成部38と、ポストフィルタ39とから構成されている。
尚、図には示していないが、フレームタイミング、サブフレームタイミングに従って、各部の動作をトータルに制御するようなタイミング制御部が音声復号化装置全体を制御している。
【0089】
本発明の音声復号化装置の各部について簡単に説明する。
分離部31は、受信した音声符号化データを適応符号(A)、固定符号(B)又はピーキネス値(E)、利得符号(C)、LSP係数の符号(D)に分離して出力するものである。
【0090】
適応符号ベクトル出力部32は、適応符号(A)を復号してピッチ周期を求め出力すると共に、ピッチ周期に基づき過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出し適応符号ベクトルとして出力するものである。
【0091】
固定符号ベクトル出力部33は、予め音声符号化側と同様の複数のパルスに関するパルスの組み合わせベクトル(固定符号ベクトル)を記憶している固定符号帳を保持し、固定符号(B)に示されたパルス位置及び極性(±)の組み合わせに基づき、固定符号帳を用いてパルスを配置したパルス波形信号を固定符号ベクトルとして出力するものである。
但し、本発明の固定符号ベクトル出力部33では、通常処理サブフレーム(例えば、奇数サブフレーム)に付いては通常通り固定符号が送信されてくるが、代替処理サブフレームに付いては、固定符号の代わりにピーキネス情報が送信されてくるため、それに対応した動作で固定符号ベクトルを出力する点が、従来とは異なっている。詳細は、後述する。
【0092】
利得ベクトル出力部34は、利得符号(C)に基づき適応符号帳利得及び固定符号帳利得を出力するものである。
【0093】
乗算器35は、適応符号ベクトル出力部32からの適応符号ベクトルに、利得ベクトル出力部34からの適応符号帳利得を乗算するものである。
乗算器36は、固定符号ベクトル出力部33からの固定符号ベクトルに利得ベクトル出力部34からの固定符号帳利得を乗算するものである。
加算器37は、乗算器35による乗算結果と、乗算器36による乗算結果とを加算して後述するLPC合成部38の駆動音源信号を出力するものである。
【0094】
LPC合成部38は、LSP係数の符号(D)から求めたLPC係数と加算器37から出力される駆動音源信号とにより音声信号を再生し、再生音声信号を出力するものである。
ポストフィルタ39は、LSP係数の符号(D)から求めたLPC係数を用いて、LPC合成部38から出力される再生音声信号に対し、スペクトル整形等の処理を行い、音質が改善された再生音声を出力するものである。
【0095】
次に、本実施の形態に係る音声復号化装置の基本動作について図4を使って説明する。
本発明の音声復号化装置では、受信した音声符号化データが、分離部31で適応符号(A)、固定符号(B)又はピーキネス値(E)、利得符号(C)、LSP係数の符号(D)に分離される。
【0096】
そして、適応符号(A)は、適応符号ベクトル出力部32で復号されてピッチ周期が求められ出力されると共に、ピッチ周期に基づき記憶されている過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出した適応符号ベクトルが出力される。
【0097】
一方、固定符号(B)又はピーキネス値(E)は、固定符号ベクトル出力部33に入力され、固定符号(B)に示されたパルス位置及び極性(±)の組み合わせに基づきパルスを配置したパルス波形信号、又は過去の固定符号ベクトルとピーキネス値(E)とを用いて生成された代替固定符号ベクトルの何れかが、固定符号ベクトルとして出力される。尚、詳細は、後述する。
【0098】
また、利得符号(C)は、利得ベクトル出力部34に入力されて適応符号帳利得及び固定符号帳利得が求められて出力される。
【0099】
そして、適応符号ベクトル出力部32からの適応符号ベクトルには乗算器35で利得ベクトル出力部34からの適応符号帳利得が乗算され、固定符号ベクトル出力部33からの固定符号ベクトルには乗算器36で利得ベクトル出力部34からの固定符号帳利得が乗算され、双方が加算器37により加算されてLPC合成部38の駆動音源信号として出力され、LPC合成部38に入力されると共に、適応符号ベクトル出力部32に入力されて過去の駆動音源信号として記憶される。
【0100】
加算器37から出力された駆動音源信号は、LPC合成部38で分離部31によって分離されたLSP係数の符号(D)から求めたLPC係数を用いて音声信号が再生され、再生音声信号となり、ポストフィルタ39で、LSP係数の符号(D)から求めたLPC係数を用いてスペクトル整形等の処理が行われ、音質が改善された再生音声が出力されるようになっている。
【0101】
上記図4を用いて説明した構成及び動作が、本発明の前提となる代数的符号励振予測方式(ACELP)の音声復号化装置の一般的な構成及び動作であるが、本発明の特徴部分は、励振パラメータ中の固定符号が代替処理サブフレームではピーキネス情報に代わっているので、それに伴い固定符号ベクトルの取得方法が従来のそれとは異なっているので、ここで詳しく説明する。
【0102】
具体的には、フレームを構成する複数サブフレームの内、符号化側で通常の固定符号帳探索処理を行った通常処理サブフレーム(例えば、奇数サブフレーム)に付いては、通常通り固定符号が送信されてくるので、符号化側と同様の固定符号帳を用いて固定符号ベクトルを取得するが、符号化側で代替固定符号ベクトル出力処理を行った代替処理サブフレーム(例えば偶数サブフレーム)に付いては、固定符号が送信されず、代わりにピーキネス情報が送信されてくるので、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、ピーキネス情報に基づく補正を行い、更にエネルギー調整した代替固定符号ベクトルを固定符号ベクトルとして出力するようにするものである。
【0103】
まず、本発明の音声復号化装置における固定符号ベクトル出力部33の内部構成例について、図5を使って説明する。図5は、本発明の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。
本発明の音声復号化装置における固定符号ベクトル出力部33の内部は、図5に示すように、符号帳処理部41と、シフト機能付き固定符号ベクトル格納バッファ42と、信号切り出し処理部43と、非同期パルス発生部44と、スイッチ45と、切替制御部46と、固定符号ベクトルエネルギ調整部47とから構成されている。
【0104】
図5に示した音声復号化装置における固定符号ベクトル出力部33の内部構成は、図2に示した音声符号化装置における固定符号帳探索部5の内部構成と基本的には同様であるが、但し、音声符号化装置における固定符号帳探索部5の符号帳処理部11は、自乗誤差最小化部8からの制御信号に従って誤差を最小化する固定符号帳を探索するが、音声復号化装置における固定符号ベクトル出力部33の符号帳処理部41は、分離部31からの固定符号(B)に対応する固定符号ベクトルを出力する点が異なっている。
【0105】
また、切替制御部46は、予め符号化側で定めた通常処理サブフレームと代替処理サブフレームとの設け方に従って、各動作系を切り替えるものである。
【0106】
その他の構成要素については、図2に示した音声符号化装置における固定符号帳探索部5の対応する構成要素と同様の動作をするものであるので、ここでは説明を省略する。
【0107】
次に、本発明の音声復号化装置における固定符号ベクトル出力部33の動作について、図5を参照しながら説明する。
本発明の音声復号化装置における固定符号ベクトル出力部33では、符号化側で通常の固定符号帳探索処理を行った通常処理サブフレーム(例えば、奇数サブフレーム)のタイミングでは、切替制御部46からの動作指示に従い、符号帳処理部41で分離部31から入力される固定符号(B)に対応する固定符号ベクトルが出力され、切替制御部46の制御によってスイッチ45が符号帳処理部41側に接続されて、符号帳処理部41から出力された固定符号ベクトルが固定符号ベクトル出力部33からの固定符号ベクトル出力として外部に出力される。
【0108】
そして、この時、符号帳処理部41から出力された固定符号ベクトルがシフト機能付き固定符号ベクトル格納バッファ42に格納されるが、その際、シフト機能付き固定符号ベクトル格納バッファ42に既に記憶されていた過去の代替符号ベクトルは、1サブフレーム分シフトされて新しいて固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0109】
一方、符号化側で代替の探索処理を行ったサブフレーム(例えば、偶数サブフレーム)のタイミングでは、切替制御部46からの動作指示に従い、信号切り出し処理部43が動作し、信号切り出し処理部43で適応符号ベクトル出力部32からのピッチ周期情報を入力し、シフト機能付き固定符号ベクトル格納バッファ42内に格納されているデータ系列を、入力されたピッチ周期の情報分さかのぼった個所から読み出せるようにピッチ周期の情報分シフトさせてから読み出し、代替固定符号ベクトルとして出力する。
【0110】
そして、代替固定符号ベクトルは、非同期パルス発生部44でパルス数がカウントされ、パルス数が0(ゼロ)、又は、予め定めた数より少なく、且つ分離部31からのピーキネス情報(E)がピーク性ありの場合に、非周期パルスが強制的に挿入されて補正され、固定符号ベクトルエネルギ調整部47でエネルギ調整さ、切替制御部46の制御によってスイッチ45が信号切り出し処理部43側に接続されて、代替固定符号ベクトルが固定符号ベクトル出力部33からの固定符号ベクトル出力として外部に出力される。
【0111】
更に、この時(偶数サブフレーム時)非同期パルス発生部44で補正された代替固定符号ベクトルは、シフト機能付き固定符号ベクトル格納バッファ42に格納されるが、その際、シフト機能付き固定符号ベクトル格納バッファ42に既に記憶されていた過去の固定符号ベクトル又は代替固定符号ベクトルは、シフトされて記憶されるようになっている。
【0112】
尚、図5では、信号切り出し処理部43から切り出された代替固定符号ベクトルに対して、非同期パルス発生部44で補正を行い、更に固定符号ベクトルエネルギ調整部47でエネルギー調整を行う構成としたが、固定符号ベクトルエネルギ調整部47を省いた構成としても構わない。
【0113】
上記説明では、便宜上奇数サブフレームでは符号帳処理部41からの固定符号ベクトルが出力され、偶数サブフレームでは信号切り出し処理部43からの代替固定符号ベクトルが現サブフレームにおける固定符号ベクトルとして選択されるように記述してきたが、逆の状態でも動作的には変わらない。
【0114】
次に、本発明の音声符号化方法において、通常の最小歪みパルス組み合わせ探索処理を行って探索結果の固定符号を送信する通常処理サブフレームと、固定符号を送信せず、過去の固定符号ベクトルから切り出した代替固定符号ベクトルを固定符号ベクトルとして用いる代替処理サブフレームとの設け方について、図6を使って説明する。図6は、本発明の音声符号化方法における通常処理サブフレームと代替処理サブフレームとの設け方を示す説明図である。
【0115】
ACELP方式の音声符号化を行う際に、LPC分析を行う単位であるフレームを複数(図6ではN個)のサブフレームで構成し、サブフレーム単位で、適応符号帳探索、固定符号帳探索、利得算出を行うものとする。
そして、N個のサブフレームをM(M≦N)個のサブフレームのグループに分け、本発明の音声符号化方法では、グループ内のM個のサブフレームの内、前半(前より)の一部(例えば1〜L)(1≦L<N)のサブフレームを、通常の最小歪みパルス組み合わせ探索を行う固定符号帳探索処理を行って探索結果の固定符号を送信する通常処理サブフレームとし、残りのサブフレーム(L+1〜M)を過去の固定符号ベクトルから切り出した代替固定符号ベクトルを用いる代替処理サブフレームとする。
【0116】
最も簡単な例としては、1フレームが2サブフレームで構成されるような場合に、第1サブフレームを通常処理サブフレームとし、第2サブフレームを代替処理サブフレームとする。
また、1フレームが4サブフレームで構成されるような場合に、2サブフレーム毎にグループ分けし、奇数サブフレームを通常処理サブフレームとし、偶数サブフレームを代替サブフレームとしても良いし、4サブフレームを1グループとして第1,2サブフレームを通常処理サブフレームとし、第3,4サブフレームを代替処理サブフレームとしても良い。
【0117】
また、1フレームが6サブフレームで構成されるような場合に、3サブフレーム毎にグループ分けし、第1、第4サブフレームを通常処理サブフレームとし、第2、第3、第5、第6サブフレームを代替処理サブフレームとしても良いし、第1,第2、第4,第5サブフレームを通常処理サブフレームとし、第3,第6サブフレームを代替処理サブフレームとしても良い。
【0118】
通常処理サブフレームと代替処理サブフレームとの配分を如何にするかは、再生音声精度とビットレート軽減率との兼ね合いであるが、通常処理サブフレームに対して代替処理サブフレームの割合を多くすると、ビットレート軽減率は向上するが、再生音声が劣化する可能性が増えることになり、逆に通常処理サブフレームに対して代替処理サブフレームの割合を少なくすると、再生音声の劣化は少なくなるがビットレート軽減率は余り向上しないことになる。
尚、本発明ではこの通常処理サブフレームと代替処理サブフレームとの具体的な配分方法については限定しないものとする。
【0119】
本発明をDSPプログラムなどによりハードウェア上で実現する場合、演算処理量の増加はほとんど生じず、使用メモリについても500ワード程度の増加のみで済むため、汎用固定小数点演算DSPで十分実現可能である。
【0120】
本発明の音声符号化装置によれば、従来はサブフレーム毎に行っていた固定符号帳探索処理を一部のサブフレーム(通常処理サブフレーム)(例えば奇数サブフレーム)で行って、当該通常処理サブフレームについては探索された固定符号(17bit)を送信するものとし、残りのサブフレーム(代替処理サブフレーム)(例えば偶数サブフレーム)では、固定符号帳探索処理を行わず、固定符号(17bit)の代わりにピーク性検出部25で取得されるLPC予測残差信号から算出したピーキネス値に基づくピーキネス情報(1bit)を用いて音声符号化データを作成することとしているので、ビットレートを軽減できる効果がある。
その結果、本発明をG.729(8.0kbps)に適用した場合、6.4kbpsまで低レート化することが可能となる。
【0121】
そして、本発明の音声符号化方法では、送信側及び受信側における音声再生の際の代替処理サブフレームの固定符号ベクトルは、記憶されている過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを取得して固定符号ベクトルとするので、固定符号帳探索処理の回数を軽減して負荷を軽減できる効果がある。
【0122】
また、本発明の音声符号化方法によれば、代替処理サブフレームのタイミングで、過去の固定符号ベクトルから切り出した代替固定符号ベクトルを用いる際に、代替固定符号ベクトルのパルスをカウントし、パルス数が0(ゼロ)又は特定数以下である場合に、LPC予測残差信号から算出したピーキネス情報がピーク有りを示しているような場合に、非周期パルスを強制的に挿入して代替固定符号ベクトルを補正するので、符号化側の再生音声信号における破裂音の品質を改善し、ACELP符号化誤差を小さくできる効果がある。
【0123】
また、本発明の音声符号化方法によれば、過去の固定符号ベクトルから切り出し、ピーキネス情報に基づいて補正された代替固定符号ベクトルに対して、代替固定符号ベクトルのエネルギーが全てのサブブレームにおいて均一になるように調整するので、再生音声品質を向上できる効果がある。
【0124】
本発明の音声符号化方法の実現する音声符号化装置によれば、自乗誤差最小化部8の制御によって、通常処理サブフレーム(例えば奇数サブフレーム)では、固定符号帳探索部5に対して通常の固定符号ベクトル探索を行わせて、探索された固定符号を送信し、代替処理サブフレーム(例えば偶数サブフレーム)では、固定符号を送信しないこととし、固定符号帳探索部5に対して代替の固定符号ベクトル探索処理を行わせ、固定符号帳探索部5における代替の固定符号ベクトル探索処理は、固定符号ベクトル格納バッファ12及びバッファシフト処理部14に記憶されている過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを固定符号ベクトルとするので、再生音声品質の劣化を極力抑えながら、ビットレートを軽減できる効果がある。
【0125】
また、本発明の固定符号帳探索部を用いた音声符号化装置によれば、代替処理サブフレームのタイミングで、信号切り出し処理部13によって過去の固定符号ベクトルから切り出した代替固定符号ベクトルを用いる際に、非同期パルス発生部14で代替固定符号ベクトルのパルスをカウントし、パルス数が0(ゼロ)又は特定数以下である場合に、LPC予測残差信号から算出したピーキネス情報がピーク有りを示しているような場合に、非周期パルスを強制的に挿入して代替固定符号ベクトルを補正するので、符号化側の再生音声信号における破裂音の品質を改善し、ACELP符号化誤差を小さくできる効果がある。
【0126】
また、本発明の固定符号帳探索部を用いた音声符号化装置によれば、信号切り出し処理部13で求め、非同期パルス発生部14で補正された代替固定符号ベクトルに対して、固定符号ベクトルエネルギ調整部17で代替固定符号ベクトルのエネルギーが全てのサブブレームにおいて均一になるように調整するので、再生音声品質を向上できる効果がある。
【0127】
また、本発明の音声符号化方法に対応する音声復号化方法によれば、符号化側で通常の固定符号帳探索処理を行った通常処理サブフレーム(例えば奇数サブフレーム)では、受信した固定符号に従って固定符号ベクトルを出力し、代替処理サブフレーム(例えば偶数サブフレーム)では、固定符号が受信されないので、過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを固定符号ベクトルとするので、ビットレートを軽減しても、再生音声品質の劣化を極力抑えることができる効果がある。
【0128】
また、本発明の音声復号化方法によれば、代替処理サブフレームのタイミングで、過去の固定符号ベクトルから切り出した代替固定符号ベクトルを用いる際に、代替固定符号ベクトルのパルスをカウントし、パルス数が0(ゼロ)又は特定数以下である場合に、分離されたピーキネス情報がピーク有りを示しているような場合に、非周期パルスを強制的に挿入して代替固定符号ベクトルを補正するので、再生音声信号における破裂音の品質を改善し、ACELP復号化誤差を小さくできる効果がある。
【0129】
また、本発明の音声復号化方法によれば、過去の固定符号ベクトルから切り出し、ピーキネス情報に基づいて補正された代替固定符号ベクトルに対して、代替固定符号ベクトルのエネルギーが全てのサブブレームにおいて均一になるように調整するので、再生音声品質を向上できる効果がある。
【0130】
また、本発明の音声復号化装置によれば、伝送されてくる音声符号化データにおいて、代替処理サブフレームに関しては、固定符号の代わりにピーキネス情報(1bit)が伝送されるので、固定符号ベクトル出力部33において、過去の固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファ42に記憶しておき、代替処理サブフレーム(例えば偶数)のタイミングでは、信号切り出し処理部43が適応符号ベクトル出力部32からのピッチ周期情報に従って、ピッチ周期分さかのぼった過去の固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファ42から切り出した代替固定符号ベクトルを出力するので、固定符号ベクトルを生成する処理を軽減し、負荷を軽減できる効果がある。
【0131】
また、本発明の音声復号化装置によれば、固定符号ベクトル出力部33において、代替処理サブフレームのタイミングで、過去の固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファ42から切り出した代替固定符号ベクトルを用いる際に、非同期パルス発生部44で代替固定符号ベクトルのパルスをカウントし、パルス数が0(ゼロ)又は特定数以下である場合に、伝送されたピーキネス情報がピーク有りを示しているような場合に、非周期パルスを強制的に挿入して代替固定符号ベクトルを補正するので、再生音声信号における破裂音の品質を改善し、再生音声の品質を向上できる効果がある。
【0132】
本発明の音声符号化/復号化方法及び音声符号化/復号化装置を用いることにより、ACELP方式の音声符号化における固定符号として、サブフレームの一部ではピーキネス情報を送信し、音声再生のための固定符号ベクトルは、過去の固定符号ベクトルを利用した代替固定符号ベクトルを用いることとし、破裂音対策として、代替固定符号ベクトルにパルスが無い又は少ないにも関わらず、ピーキネス情報がピーク有りを示している場合に強制的に非周期パルスを挿入して代替固定符号ベクトルを補正することで、演算量をさほど増加すること無く、ビットレートは削減し、再生音声品質については聴感上僅かな劣化が聞き取れる程度に抑えて、符号化効率或いは伝送効率を向上できる効果がある。
【0133】
【発明の効果】
本発明によれば、入力音声信号についてサブフレーム単位で、ピークを持つパルス成分の有無を示すピーキネス情報を検出し、聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、探索処理の結果から固定符号及び固定符号に対応する固定符号ベクトルを取得し、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを過去の固定符号ベクトルとして記憶し、代替処理サブフレームでは、固定符号帳の探索処理は行わず、適応符号及びピーキネス情報及び適応符号利得及び固定符号利得を励振信号パラメータに含め、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを用い、代替固定符号ベクトルが予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正し、更に補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとし、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、代替固定符号ベクトルを過去の固定符号ベクトルとして記憶する音声符号化方法としているので、演算量を増加することなく、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上でき、且つ固定符号帳探索処理の負荷を軽減できる効果がある。
【0134】
本発明によれば、音声符号化データにおける励振信号パラメータに含まれる固定符号又はピーキネス情報に基づいて固定符号ベクトルを取得する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、予め備えている固定符号帳を用いて、励振信号パラメータに含まれる固定符号を固定符号帳のインデックスとして、インデックスに対応する固定符号ベクトルを取得し、代替処理サブフレームでは、代替固定符号ベクトルが予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正し、更に補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとする音声復号化方法としているので、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上できる効果がある。
【0135】
本発明によれば、ピーク性検出手段が、入力される音声信号についてサブフレーム単位で、ピークを持つパルス成分の有無を示すピーキネス情報を検出し、励振信号パラメータ抽出手段が、通常処理サブフレームでは、固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び取得した固定符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含め、代替処理サブフレームでは、固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及びピーク性検出手段で検出されたピーキネス情報及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含めるように制御し、固定符号ベクトル出力手段が、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切替制御手段で切り替え、励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、符号帳処理部が固定符号帳を探索して、聴覚重み付け誤差を最小化する固定符号ベクトル及び固定符号ベクトルに対応する固定符号帳のインデックスを検出し、検出された固定符号帳のインデックスを固定符号として出力し、検出された固定符号ベクトルをスイッチを介して外部に出力すると共に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファに格納し、励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、切り出し処理部がシフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力し、非同期パルス発生部が、代替固定符号ベクトルのパルスを検出し、パルス数が予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正すると共に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、補正した代替固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納し、固定符号ベクトルエネルギ調整部が、補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルをスイッチを介して外部に出力する音声符号化装置としているので、演算量を増加することなく、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上でき、且つ固定符号帳探索処理の負荷を軽減できる効果がある。
【0136】
本発明によれば、固定符号ベクトル出力手段が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切替制御手段で切り替え、切替制御手段の制御で通常処理サブフレームの場合に、固定符号帳を用いて、分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、取得した固定符号ベクトルをスイッチを介して外部に出力すると共に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルをシフト機能付き固定符号ベクトル格納バッファに格納し、切替制御手段の制御で代替処理サブフレームの場合に、切り出し処理部がシフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力し、非同期パルス発生部が、代替固定符号ベクトルのパルスを検出し、パルス数が予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正すると共に、シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、補正した代替固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納し、固定符号ベクトルエネルギ調整部が、補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルをスイッチを介して外部に出力する音声復号化装置としているので、ビットレートを軽減しながら、再生音声品質劣化を極力抑え、特に破裂音の音声品質を向上できる効果がある。
【図面の簡単な説明】
【図1】本発明に係る音声符号化装置の概略構成ブロック図である。
【図2】本発明の音声符号化装置における固定符号帳探索部の内部構成を示すブロック図である。
【図3】破裂音“k”の時間波形(サンプル値)の例を示す説明図である。
【図4】本発明に係る音声復号化装置の概略構成ブロック図である。
【図5】本発明の音声復号化装置における固定符号ベクトル出力部の内部構成を示すブロック図である。
【図6】本発明の音声符号化方法における通常サブフレームと代替サブフレームとの設け方を示す説明図である。
【符号の説明】
1…前処理部、 2…LPC分析量子化補間処理部、 3…聴覚重み付け処理部、 4…適応符号帳探索部、 5…固定符号帳探索部、 6…利得符号帳探索部、 7…LPC合成部、 8…自乗誤差最小化部、 9…多重化処理部、 11…符号帳処理部、 12…シフト機能付き固定符号ベクトル格納バッファ、 13…信号切り出し処理部、 14…非同期パルス発生部、 15…スイッチ、16…切替制御部、 20…加算器、 21…乗算器、 22…乗算器、 23…加算器、 25…ピーク性検出部、 31…分離部、 32…適応符号ベクトル出力部、 33…固定符号ベクトル出力部、 34…利得ベクトル出力部、35…乗算器、 36…乗算器、 37…加算器、 38…LPC合成部、 39…ポストフィルタ、 41…符号帳処理部、 42…シフト機能付き固定符号ベクトル格納バッファ、 43…信号切り出し処理部、 44…非同期パルス発生部、 45…スイッチ、 46…切替制御部

Claims (6)

  1. 1フレームを複数のサブフレームで構成する入力音声信号について、フレーム単位で音声信号を分析して線形予測フィルタ係数を求め、前記入力音声信号と合成された再生音声信号との誤差信号に対して聴覚重み付けした聴覚重み付け誤差を求め、サブフレーム単位で前記聴覚重み付け誤差を最小化するような適応符号及び固定符号及び適応符号利得及び固定符号利得とを取得して励振信号パラメータとし、前記フレーム単位の線形予測フィルタ係数と前記サブフレーム単位の励振信号パラメータとを音声符号化データとすると共に、前記取得した励振信号パラメータの適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、前記適応符号ベクトル及び前記固定符号ベクトル及び適応符号利得及び固定符号利得とから駆動音源信号を生成し、前記駆動音源信号と前記線形予測フィルタ係数を用いて再生音声信号を合成する代数的符号励振予測方式の音声符号化方法であって、
    前記入力音声信号についてサブフレーム単位で、ピークを持つパルス成分の有無を示すピーキネス情報を検出し、
    前記聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、
    前記フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、前記グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
    前記通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、前記探索処理の結果から固定符号及び前記固定符号に対応する固定符号ベクトルを取得し、前記適応符号及び前記取得した固定符号及び前記適応符号利得及び前記固定符号利得を励振信号パラメータに含めて、
    前記代替処理サブフレームでは、前記固定符号帳の探索処理は行わず、前記適応符号及び前記ピーキネス情報及び前記適応符号利得及び前記固定符号利得を励振信号パラメータに含め、記憶されている過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを用い、前記代替固定符号ベクトルが予め定めた規定数のパルスを保持せず、且つ前記ピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを前記代替固定符号ベクトルに挿入して補正し、更に前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとする取得制御方法であることを特徴とする音声符号化方法。
  2. 固定符号及び固定符号ベクトルの取得制御方法が、
    通常処理サブフレームでは、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、前記聴覚重み付け誤差を最小化する固定符号ベクトル及び前記固定符号ベクトルに対応する固定符号帳のインデックスを検出し、前記検出された固定符号帳のインデックスを固定符号として出力し、前記検出された固定符号ベクトルを出力すると共に、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、前記取得した固定符号ベクトルを過去の固定符号ベクトルとして記憶し、
    代替処理サブフレームでは、記憶されている過去の固定符号ベクトルを当該サブフレームにおけるピッチ周期に同期した位置からサブフレームにおけるサンプル数分切り出した代替固定符号ベクトルを用い、前記代替固定符号ベクトルが予め定めた規定数のパルスを保持せず、且つ前記ピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを前記代替固定符号ベクトルに挿入して補正し、更に前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとして出力すると共に、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、前記補正された代替固定符号ベクトルを過去の固定符号ベクトルとして記憶する取得制御方法であることを特徴とする請求項1記載の音声符号化方法。
  3. 代替処理サブフレームにおいて、補正された代替固定符号ベクトルのパルス数をカウントし、前記パルス数に基づいて前記代替固定符号ベクトルのエネルギーを均一にすることを特徴とする請求項2記載の音声符号化方法。
  4. 請求項1記載の音声符号化方法で符号化された音声符号化データについて、前記音声符号化データにおける励振信号パラメータに含まれる適応符号に基づく適応符号ベクトル及び固定符号又はピーキネス情報に基づく固定符号ベクトルを取得し、前記適応符号ベクトル及び前記固定符号ベクトル及び前記励振信号パラメータに含まれる適応符号利得及び固定符号利得とから駆動音源信号を生成し、前記駆動音源信号と前記線形予測フィルタ係数を用いて音声信号を再生する音声復号化方法であって、
    前記励振信号パラメータに含まれる固定符号又はピーキネス情報に基づいて固定符号ベクトルを取得する方法が、
    音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
    前記通常処理サブフレームでは、予め備えている固定符号帳を用いて、前記励振信号パラメータに含まれる固定符号を前記固定符号帳のインデックスとして、前記インデックスに対応する固定符号ベクトルを取得し、
    前記代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを用い、前記代替固定符号ベクトルが予め定めた規定数のパルスを保持せず、且つ前記ピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを前記代替固定符号ベクトルに挿入して補正し、更に前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとする取得方法であることを特徴とする音声復号化方法。
  5. 1フレームを複数のサブフレームで構成する音声信号を入力し、フレーム単位で前記音声信号を線形予測分析して線形予測フィルタ係数を求める線形予測分析手段と、
    前記音声信号と合成された再生音声信号との誤差信号を求める減算手段と、
    前記誤差信号に聴覚重み付けを行い聴覚重み付け誤差信号を出力する聴覚重み付け手段と、
    前記聴覚重み付け誤差信号を入力し、サブフレーム単位で、前記聴覚重み付け誤差を最小化するような、適応符号及び固定符号と適応符号利得及び固定符号利得とを取得するための制御を行い、取得された適応符号及び固定符号及び適応符号利得及び固定符号利得を励振信号パラメータとして出力する励振信号パラメータ抽出手段と、
    前記励振信号パラメータ抽出手段の制御に従い、過去の駆動音源信号から前記聴覚重み付け誤差信号を最小化するようなピッチ周期を検出し、前記検出されたピッチ周期の情報を適応符号として出力すると共に、前記ピッチ周期の情報と過去の駆動音源信号から求めた適応符号ベクトルを出力する適応符号ベクトル出力手段と、
    前記励振信号パラメータ抽出手段の制御に従い、前記聴覚重み付け誤差信号を最小化するような固定符号及び固定符号ベクトルを出力する固定符号ベクトル出力手段と、
    前記励振信号パラメータ抽出手段からの制御に従い、前記適応符号ベクトルに関する適応符号利得と、前記固定符号ベクトルに関する固定符号利得とを求めて出力する利得出力手段と、
    前記適応符号ベクトル出力手段からの適応符号ベクトルと、前記固定符号ベクトル出力手段からの固定符号ベクトルと、前記利得出力手段からの適応符号利得及び固定符号利得とから駆動音源信号を生成する駆動音源信号生成手段と、
    前記駆動音源信号と、前記線形予測分析手段からの線形予測フィルタ係数に基づいて再生音声信号を合成する再生音声合成手段と、
    前記入力される音声信号についてサブフレーム単位で、ピークを持つパルス成分の有無を示すピーキネス情報を検出するピーク性検出手段とを備え、
    前記励振信号パラメータ抽出手段が、
    前記フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、前記グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
    前記通常処理サブフレームでは、前記固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、前記適応符号ベクトル出力手段からの適応符号及び前記取得した固定符号及び前記利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含め、
    前記代替処理サブフレームでは、前記固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、前記適応符号ベクトル出力手段からの適応符号及び前記ピーク性検出手段で検出されたピーキネス情報及び前記利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含める励振信号パラメータ抽出手段であり、
    前記固定符号ベクトル出力手段が、
    過去の固定符号ベクトルを記憶し、シフト可能なシフト機能付き固定符号ベクトル格納バッファと、
    前記通常処理サブフレームの場合の動作系と前記代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
    励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、前記聴覚重み付け誤差を最小化する固定符号ベクトル及び前記固定符号ベクトルに対応する固定符号帳のインデックスを検出し、前記検出された固定符号帳のインデックスを固定符号として出力し、前記検出された固定符号ベクトルを出力すると共に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、サブフレームにおけるサンプル数分シフトしてから、前記取得した固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納する符号帳処理部と、
    前記励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力する切り出し処理部と、
    前記信号切り出し処理部から出力される代替固定符号ベクトルのパルスを検出し、パルス数が予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正すると共に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、前記補正した代替固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納する非同期パルス発生部と、
    前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルを出力する固定符号ベクトルエネルギ調整部と、
    前記励振信号パラメータ抽出手段からの指示が通常の探索処理の指示であった場合に、前記符号帳処理部からの固定符号ベクトルを外部に出力し、前記励振信号パラメータ抽出手段からの指示が代替の探索処理の指示であった場合に、前記固定符号ベクトルエネルギ調整部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であることを特徴とする音声符号化装置。
  6. 請求項5記載の音声符号化装置で符号化された音声符号化データから適応符号と、固定符号又はピーキネス情報と、適応符号及び固定符号の利得と、線形予測フィルタ係数とを分離する分離手段と、
    前記分離された適応符号を復号してピッチ周期の情報を出力すると共に、前記ピッチ周期の情報に基づき過去の駆動音源信号から適応符号ベクトルを出力する適応符号ベクトル出力手段と、
    前記分離された固定符号又はピーキネス情報に基づき、固定符号ベクトルを出力する固定符号ベクトル出力手段と、
    前記分離された適応符号及び固定符号の利得に基づき適応符号帳利得及び固定符号帳利得を出力する利得ベクトル出力手段と、
    前記適応符号ベクトル及び前記固定符号ベクトル及び前記適応符号帳利得及び前記固定符号帳利得とから駆動音源信号を生成する駆動音源信号生成手段と、
    前記駆動音源信号と前記線形予測フィルタ係数とから音声信号を再生する音声再生手段とを備え、
    前記固定符号ベクトル出力手段が、
    過去の固定符号ベクトルを記憶し、シフト可能なシフト機能付き固定符号ベクトル格納バッファと、
    音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
    前記通常処理サブフレームの場合の動作系と前記代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
    前記切替制御手段の制御で前記通常処理サブフレームの場合に、予め複数の固定符号ベクトルが定められている固定符号帳を用いて、前記分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、サブフレームにおけるサンプル数分シフトしてから、前記取得した固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納する符号帳処理部と、
    前記切替制御手段の制御で前記代替処理サブフレームの場合に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトさせて、前記適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力する切り出し処理部と、
    前記信号切り出し処理部から出力される代替固定符号ベクトルのパルスを検出し、パルス数が予め定めた規定数のパルスを保持せず、且つピーキネス情報がピークを持つパルス成分有りを示す場合に、強制的に予め定めた非周期パルスを代替固定符号ベクトルに挿入して補正するとと共に、前記シフト機能付き固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、前記補正された代替固定符号ベクトルを前記シフト機能付き固定符号ベクトル格納バッファに格納する非同期パルス発生部と、
    前記補正された代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルを出力する固定符号ベクトルエネルギ調整部と、
    前記切替制御手段の制御で、前記通常処理サブフレームの場合に前記符号帳処理部からの固定符号ベクトルを外部に出力し、前記代替処理サブフレームの場合に前記切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であることを特徴とする音声復号化装置。
JP2002172265A 2002-06-13 2002-06-13 音声符号化/復号化方法及び音声符号化/復号化装置 Pending JP2004020676A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002172265A JP2004020676A (ja) 2002-06-13 2002-06-13 音声符号化/復号化方法及び音声符号化/復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002172265A JP2004020676A (ja) 2002-06-13 2002-06-13 音声符号化/復号化方法及び音声符号化/復号化装置

Publications (1)

Publication Number Publication Date
JP2004020676A true JP2004020676A (ja) 2004-01-22

Family

ID=31171879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002172265A Pending JP2004020676A (ja) 2002-06-13 2002-06-13 音声符号化/復号化方法及び音声符号化/復号化装置

Country Status (1)

Country Link
JP (1) JP2004020676A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007077841A1 (ja) * 2005-12-27 2007-07-12 Matsushita Electric Industrial Co., Ltd. 音声復号装置および音声復号方法
WO2013129439A1 (ja) * 2012-02-28 2013-09-06 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体
WO2013129528A1 (ja) * 2012-02-28 2013-09-06 日本電信電話株式会社 符号化装置、この方法、プログラムおよび記録媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007077841A1 (ja) * 2005-12-27 2007-07-12 Matsushita Electric Industrial Co., Ltd. 音声復号装置および音声復号方法
US8160874B2 (en) 2005-12-27 2012-04-17 Panasonic Corporation Speech frame loss compensation using non-cyclic-pulse-suppressed version of previous frame excitation as synthesis filter source
JP5142727B2 (ja) * 2005-12-27 2013-02-13 パナソニック株式会社 音声復号装置および音声復号方法
WO2013129439A1 (ja) * 2012-02-28 2013-09-06 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体
WO2013129528A1 (ja) * 2012-02-28 2013-09-06 日本電信電話株式会社 符号化装置、この方法、プログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
EP1202251B1 (en) Transcoder for prevention of tandem coding of speech
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
JP4263412B2 (ja) 音声符号変換方法
KR20070028373A (ko) 음성음악 복호화 장치 및 음성음악 복호화 방법
KR102307492B1 (ko) 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
JPH08305398A (ja) 音声復号化装置
JP4236675B2 (ja) 音声符号変換方法および装置
JP2004020676A (ja) 音声符号化/復号化方法及び音声符号化/復号化装置
EP1204094A2 (en) Frequency dependent long term prediction analysis for speech coding
US20040049381A1 (en) Speech coding method and speech coder
RU2792658C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
JP4238535B2 (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
JP2004020675A (ja) 音声符号化/復号化方法及び音声符号化/復号化装置
RU2776261C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
JP5084360B2 (ja) 音声符号化装置及び音声復号装置
JP3364827B2 (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置
JP3824706B2 (ja) 音声符号化/復号化装置
JP3845316B2 (ja) 音声符号化装置及び音声復号装置
JPH043878B2 (ja)
JP2004157381A (ja) 音声符号化装置及び方法