JP2657927B2 - 音声を符号化するための方法及び装置 - Google Patents

音声を符号化するための方法及び装置

Info

Publication number
JP2657927B2
JP2657927B2 JP63155115A JP15511588A JP2657927B2 JP 2657927 B2 JP2657927 B2 JP 2657927B2 JP 63155115 A JP63155115 A JP 63155115A JP 15511588 A JP15511588 A JP 15511588A JP 2657927 B2 JP2657927 B2 JP 2657927B2
Authority
JP
Japan
Prior art keywords
excitation information
information
excitation
candidate
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63155115A
Other languages
English (en)
Other versions
JPS6454497A (en
Inventor
ハリー ケッチュム リチャード
バスチアアン クレイジン ウィレム
ジョン クラシンスキー ダニエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPS6454497A publication Critical patent/JPS6454497A/ja
Application granted granted Critical
Publication of JP2657927B2 publication Critical patent/JP2657927B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cephalosporin Compounds (AREA)

Description

【発明の詳細な説明】 発明の技術分野 本発明は音声の低ビット速度符号化及び復号、より詳
細には、改良された符号励振線形ボコーダーに関する。
発明の技術的背景 コード励振線形予測符号化(code excited linear pr
edictive coding、CELP)は周知の技術である。この符
号化技術は音声を線形予測(linear predictive、LPC)
フィルタを励振するのに符号化された励振情報を用いて
合成する。この励振は候補励振ベクトルのテーブルを1
フレーム毎に捜すことによって見つけられる。
LPCフィルタを決定するために入力音声に関してLPC分
析が遂行される。この分析はLPCフィルタがテーブルあ
るいはコードブックからのさまざまな候補ベクトルによ
って励振されたときこの出力を比較することによって開
始される。最良の候補がこの対応する合成出力が入力音
声といかに一致するかに基づいて選択される。最良の候
補が見つけられたら、最良のコードブック エントリー
を定義する情報及びフィルタがシンセサイザーに送られ
る。シンセサイザーは類似のコードブックをもち、その
コードブック内の指定されるエントリーにアクセスし、
これを用いて同じLPCフィルタを励振する。
コードブックはその要素が一連の励振サンプルである
ベクトルから成る。個々のベクトルは1フレーム内の音
声サンプルと同数の励振サンプルを含む。ベクトルは2
つのいずれかの方法にて構成される。第1の方法におい
ては、離散したサンプルのセットがベクトルを定義する
のに用いられる。第2の方法、つまり、オーバラッピン
グ コードブックにおいては、ベクトルがウインドウを
励振サンプルの線形アレイに沿ってシフトすることによ
って定義される。
CELPコードブックのベクトルに用いられる励振サンプ
ルとしては複数のソースが考えられる。一例としてホワ
イト ノイズ、あるいは乱数をサンプルとして用いる確
率的励振線形予測(Stochastically Excited Linear Pr
ediction、SELP)法を挙げることができる。別の方法に
おいては、適応コードブックが用いられる。この方法に
おいては、現フレームに対して決定された合成励振が未
来のフレームに対するコードブックを更新するのに用い
られる。この方法では励振コードブックを音声に適応さ
せることが可能である。
音声を符号化するためのCELP技術の1つの問題点はコ
ードブック内の情報の個々の全てのセットにてLPCフィ
ルタを励振し、次に励振結果をエラー基準を用いて比較
しなければならないことである。通常、このエラー基準
としては、元の音声サンプルと個々のセットの情報に対
する励振情報から得られた合成された音声サンプルとの
間の差の平方の総和が用いられる。この計算はコードブ
ック内に格納された励振情報の個々のセットとLPCフィ
ルタとのたたみ込みを伴う。この計算は励振情報とLPC
フィルタのベクトル及びマトリックス演算を用いて遂行
される。問題は遂行されるべき計算の数が莫大であるこ
とである。例えば、4.8kbpsボコーダーの場合、1秒当
たり約500ミリオンの掛け算−加算演算が要求される。
解 決 非常に効率的なCELP計算ユニットを用いるボコーダー
によって上記の問題が解決され、技術上の向上が達成さ
れる。この計算ユニットは有限インパルス応答LPCフィ
ルタ及びオーバラッピング コードブックを用いてCELP
演算のための計算を反復的に遂行する。オーバラッピン
グ コードブックからアクセスされる個々の励振ベクト
ルに対して、アクセスされたベクトルの2つのサンプル
ポイントのみが新たなベクトルを求めるためにこれら
に関する演算動作をすることを要求される。先行技術に
よる方法ではアクセスされた励振ベクトルの全てのサン
プルに関して演算動作が要求される点が異なる。
本発明による方法は、現音声フレームに応答して励振
情報の目標セットを生成するステップ、これと同じ音声
フレームに応答してセットのフィルタ係数を決定するス
テップ、このフィルタ係数に応答して有限インパルス応
答フィルタ モデルを計算するステップ、テーブル内に
格納された励振情報の複数の候補セットの個々を順にこ
の有限インパルス応答フィルタに加えて励振候補セット
の個々に対する有限インパルス応答フィルタの応答と目
標励振セットとの間のエラー値を決定することによって
エラー値を反復的に計算するステップ、及び音声フレー
ムを再生するためにフィルタ係数及びテーブル内の最も
小さなエラー値をもつ選択された候補セットの位置を表
わす情報を送出するステップを含む。
本発明による方法はさらに元の励振セットから選択さ
れた候補励振セットを引くことによって別の目標励振セ
ットを生成するステップ、有限インパルス応答フィルタ
並びに個々の別の候補セット及び別の目標励振セットに
応答して別のテーブル内に格納された別の複数の候補励
振セットの個々に対する別のエラー値を反復的に決算す
るステップ、別の候補セットを最も小さなエラー値をも
つ1つを選択するステップ、及び現フレームに対する音
声を再生するために別のテーブル内のこの選択された別
の候補セットの位置を表わす情報を送出するステップを
含む。
本発明による方法のもう一面においては、候補励振セ
ットはテーブル内にオーバラッピングするような方法で
格納され、個々の候補セットは前の候補セットと励振情
報の第1及び第2のサブセットのみが異なり、反復的に
計算するステップがテンポラリー エラー値を生成する
ために前の候補セットのエラー値から励振情報の第1の
サブセットの影響を除去するステップ及び計算中の現候
補励振セットに対するエラー値を生成するために励振情
報の第2のサブセットの影響をテンポラリー エラー値
に加えるステップを含む。
また、目標励振セットを生成するステップは、前のフ
レームに対する情報のリンギングセットを生成するステ
ップ、中間セットを生成するために現フレームに対する
音声からこのリンギング セットを引くステップ及び現
フレームに対するフィルタ係数に基づいてこの中間セッ
トをホワイトニング フィルタするステップを含む。
これに加え、リンギング セットを計算するステップ
は、合成励振セットを生成するために個々のテーブルか
らの選択された候補励振セットを一緒に加えるステッ
プ、フィルタ係数に基づいて合成励振セットをフィルタ
リングするステップ、フィルタ係数に基づいて前のフレ
ームからのフィルタされた合成励振セットをゼロ イン
パルス応答フィルタリングするステップを含む。この方
法はさらにテーブルを更新するために合成励振セットを
第1のテーブル内に加えるステップを含む。
本発明による装置は現フレームから目標励振セットを
生成するための計算器、現フレームに応答してセットの
フィルタ係数を決定するステップ、フィルタ係数から有
限インパルス応答フィルタ情報を計算するための計算
器、この有限インパルス応答フィルタ情報、格納された
候補励振セットの個々及び目標励振セットに応答してテ
ーブル内に格納された複数の候補励振セットの個々に対
するエラー値を計算するための計算器、及び複号器によ
る再生のためにフィルタ係数及びテーブル内の最も小さ
なエラー値をもつ選択された候補励振セットの位置を送
出する符号器を含む。
実施例 第1図は本発明の主題であるボコーダー(vocoder)
をブロック図形式にて示す。要素101から112はボコーダ
ーのアナライザー部分を示し、一方、要素151から157は
ボコーダーのシンセサイザー部分を表わす。第1図のア
ナライザー部分は経路120上に受信された入り音声に応
答してアナログ音声をデジタル サンプルにデジタル的
にサンプリングし、これらデジタル サンプルを周知の
技術を用いてフレームにグループ化する。個々のフレー
ムに対して、アナライザー部分は声体のフォーマント特
性を表わすLPC係数を計算し、スケーリングファクタに
加えてそのフレームに対する音声を最も良く近似する確
率的コードブロック105及び適応コードブック104の両方
からのエントリーをスケーリング係数とともに捜す。こ
のエントリー及びスケーリング情報なアナライザー部分
によって決定される励振情報を定義する。この励振及び
係数情報が次にエンコーダ109によって経路145を介して
第1図に示されるボコーダーのアナライザー部分に送ら
れる。確率的発生器153及び適応的発生器154はコードブ
ック エントリー及びスケーリング係数に応答して、ボ
コーダーのアナライザー部分内で計算された励振情報を
再生し、この励振情報を用いてアナライザー部分から受
信されるLPC係数によって決定されるLPCフィルタを音声
を再生するために励振する。
次に、第1図のアナライザー部分の機能をより詳細に
述べる。LPCアナライザー101は入り音声に応答して周知
の技術を用いてLPC係数を決定する。これらLPC係数は目
標励振計算器102、スペクトル重み付け計算器103、エン
コーダ109、LPCフィルタ110、及びゼロ入力応答フィル
タ111に送られる。エンコーダ109は、LPC係数に応答し
てこれら係数を経路145を介してデコーダ151に送る。ス
ペクトル重み付け計算器103はこれら係数に応答して重
要な音声内容をもつことが知られている音声の部分を強
調するマトリックスの形式でスペクトル重み付け情報を
計算する。このスペクトル重み付け情報は有限インパル
ス応答LPCフィルタに基づく。この有限インパルス応答
フィルタの使用はサーチャー(searcher)106及び107内
で遂行される計算を遂行するために必要な計算の数を大
きく削減する。このスペクトル重み付け情報はサーチャ
ーによってコードブロック104及び105からの励振情報に
対する最良候補を決定するために用いられる。
ターゲット励振計算器102はサーチャー106及び107が
近似を試みるターゲット励振を計算する。このターゲッ
ト励振はアナライザー101によって入り信号から前のフ
レームに対する励振及びLPSフィルタの影響を引くこと
によって計算されたLPC係数に基づいて重み付けフィル
タを回旋させることによって計算される。前のフレーム
に対する後者の影響はフィルタ110及び111によって計算
される。前のフレームに対する励振及びLPCフィルタを
考慮しなくてはならない理由は、これら係数が、通常、
LPCフィルタのリンギングとして知られる現フレーム内
の信号成分を生成するためである。後に説明されるごと
く、フィルタ110及び111はLPC係数及び前のフレームか
ら計算された励振に応答してこのリンギング信号を決定
し、これを経路144を介して引き算器112に送る。引き算
器112は後者の信号及び現在の音声に対応して現在の音
声からこのリンギング信号を引いた残留信号を計算す
る。計算器102はこの残留信号に応答してターゲット励
振情報を計算し、この情報を経路123を介してサーチャ
ー106及び107に送る。
サーチャーは合成励振とも呼ばれる計算励振を順次計
算する。この計算励振はコードブック インデックス及
びスケーリング係数の形式でエンコーダ109及び経路145
を介して第1図のシンセサイザー部分に送られる。個々
のサーチャーは計算励振の部分を計算する。第1に、適
応的サーチャー106は励振情報を計算し、これを経路127
を介して確率的サーチャー107に送る。サーチャー107は
経路123を介して受信された目標励振及び適応的サーチ
ャー106からの励振情報に応答して計算機102によって計
算された目標励振を最も良く近似する計算励振の残りの
部分を計算する。サーチャー107は計算されるべきこの
残留励振(remaining excitation)を目標励振サーチャ
ー106によって決定される励振を引くことによって決定
する。サーチャー106及び107によって決定される計算あ
るいは合成励振はそれぞれ経路127及び126を介して加算
器108に送られる。加算器108はこの2つの励振成分を一
緒に加えることによって現フレームに対する合成励振を
計算する。この合成励振はシンセサイザーによって合成
音声を生成するために用いられる。
加算器108の出力も経路128を介してLPCフィルタ110及
び適応的コードブック104に送られる。経路128を介して
送られる励振情報は適応的コードブック104を更新する
のに用いられる。コードブック インデックス及びスケ
ーリング係数はサーチャー106及び107からエンコーダ10
9にそれぞれ経路125及び124を介して送られる。
サーチャー106は適応的コードブック104内に格納され
たセットの励振情報にアクセスし、個々のセットの情報
を用いて経路123を介して受信された目標励振とコード
ブック104からのアクセスされたセットの励振との間の
エラー基準を最小にする。適応的コードブック104内に
格納された情報は人の音声の動的レンジ内での変動を許
さないため個々のアクセスされたセットの情報に対して
もスケーリング係数が計算される。
用いられるエラー基準は元の音声と合成音声との間の
差の平方である。合成音声は第1図のシンセサイザー部
分内でLPCフィルタ117の出力の所に再生される音声であ
る。この合成音声はコードブック104から得られる合成
励振及びリンギング信号から計算され、音声信号は目標
励振及びリンギング信号から計算される。合成音声に対
する励振情報は、マトリックスにて表現された重み付け
情報を用いていてシンセサイザー102によってLPCフィル
タのたたみ込みを遂行するのに用いられる。コードブッ
ク104から得られた個々のセットの情報に対してエラー
基準が評価され、最も低いエラー値を与える励振情報の
セットが現フレームに対して用いられる。
サーチャー106がスケーリング係数とともに使用され
るべきセットの励振情報を決定した後、コードブックへ
のインデックス及びスケーリング係数が経路125を介し
てエンコーダ109に送られ、励振情報も経路127を介して
確率的サーチャー107に送られる。確率的サーチャー107
は経路123を介して受信された目標励振から適応的サー
チャー106から励振情報を引く。確率的サーチャー107は
次に適応的サーチャー106によって遂行されるのと類似
の動作を遂行する。
適応的コードブック104内の励振情報は前記のフレー
ムからの励振情報である。個々のフレームに対して、こ
の励振情報はサンプリングされた元の音声と同数のサン
プルから成る。好ましくは、この励振情報は4.8kbps伝
送速度に対して55個のサンプルを含む。このコードブッ
クはプッシュ ダウン リストとして編成され、新たな
セットのサンプルがコードブックの中にプッシュされコ
ードブック内の最も古いサンプルと置換される。コード
ブック104からのセットの励振情報を使用する場合、サ
ーチャー106はこれらセットの情報をばらばらなセット
のサンプルとして扱うのでなく、コードブック内のサン
プルを励振サンプルの線形アレイとして扱う。例えば、
個々のサーチャー106は情報の第1の候補セットをコー
ドブック104からのサンプル1からサンプル55を用いて
生成し、情報の第2のセットの候補をコードブックから
のサンプル2からサンプル56を用いて生成する。このタ
イプのコードブック検索は通常オーバラップ コードブ
ツクと呼ばれる。
この線形サーチング技術がコードブック内のサンプル
の終わりに達すると、使用されるべきフル セットの情
報が存在しなくなる。1つのセットの情報は励振ベクト
ルとも呼ばれる。この時点で、サーチャーは仮想サーチ
(virtualsearch)を遂行する。この仮想サーチにおい
てはテーブルからアクセルされた情報がそれに対してテ
ーブル内にサンプルが存在しないセットの後の部分に反
復して入れられる。この仮想サーチ技術を用いることに
よって、適応的サーチャー106が音声の無声領域(unvoi
ced region)から音声の有声領域(voiced region)へ
の遷移により迅速に応答することが可能となる。これは
無声領域内では励振がホワイト ノイズに類似し、一
方、有声領域内では基本振動数が存在するためである。
いったん基本振動数の部分がコードブックから同定され
ると、これが反復される。
第2図はコードブック104内に格納されるであろう励
振サンプルの一部を示すが、ここでは、説明の目的上、
励振セット当たり10個のみのサンプルが想定される。ラ
イン201はコードブックの内容を図解し、ライン202、20
3及び204は仮想サーチ技術を用いて生成された励振セッ
トを図解する。ライン202に示される励振セットはコー
ドブックのサーチをライン201上のサンプル205から開始
することによって生成される。サンプル205から開始す
ると、テーブル内には9個のみのサンプルが存在し、従
ってサンプル208がライン202に示される励振セットの10
番目のサンプルを形成するためにサンプル209として反
復される。ライン202のサンプル208はライン201のサン
プル205に対応する。ライン203はライン201上のサンプ
ル206から開始して生成されたライン202に示される励振
セットに続くセットを図解する。サンプル206から開始
すると、コードブック内には8個のみのサンプルが存在
し、サンプル210としてグループ化されたライン203の最
初の2つのサンプルがライン203にサンプル211として示
される励振セットの終端に反復される。ライン203に示
される有効ピークがピッチ ピークである場合には、こ
のピッチがサンプル210及び211内で反復されることは当
業者にとって容易に理解できることである。ライン204
はコードブック内のサンプル207から開始して生成され
た第3の励振セットを図解する。図解されるごとく、21
2として示される3つのサンプルがライン204上に示され
る励振セットの終端にサンプル213として反復される。
ライン201内に207として示される初期ピッチ ピーク
は、個々のフレームの終わりにコードブック104の内容
が更新されるため、前のフレームからサーチャー106及
び107によって遂行されるサーチの累積であることに注
意する。統計的サーチャー107は、通常は、無声領域か
ら有声領域に入ると同時に最初にピッチ ピーク、例え
ば、207に到達する。
確率的サーチャー107は適応的サーチャー106と類似の
機能をもつが、これが目標励振として、目標励振計算器
102からの目標励振とサーチャー106によって発見された
最良マッチを代表する励振との間の差を用いる点が異な
る。これに加えて、サーチャー107は仮想サーチは遂行
しない。
次に第1図のアナライザー部分の詳細な説明を行な
う。この説明はマトリックス及びベクトル代数に基づ
く。目標励振計算器102は目標励振ベクトルtを以下の
ように計算する。音声ベクトルsは以下のように表わす
ことができる。
s=Ht+z HマトリックスはLPCアナライザー101を介して経路12
1から受信されるLPC係数によって定義されるオール ポ
ールLPC合成フィルタ(all−pole LPC合成フィルタ)を
表わす。Hによって表わされるこのフィルタの構造は後
に詳細に説明され、本発明の目的の一部を構成する。ベ
クトルzは前のフレームの最中に受信された励振からの
オール ポール フィルタのリンギングを表わす。前述
のごとく、ベクトルzはLPCフィルタ110及びゼロ入力応
答フィルタ111から派生される。計算器102及び引き算器
112は目標励振を表わすベクトルtをベクトルsからベ
クトルzを引き、この結果としての信号ベクトルをオー
ル ゼロLPC合成フィルタ(all−zero LPC合成フィル
タ)を通じて処理する。このオール ゼロ合成フィルタ
はLPCアナライザー101によって生成されたLPC係数から
派生され、経路121を介して送られる。目標励振ベクト
ルtは、重み付けフィルタとも呼ばれるオール ゼロLP
C合成フィルタのたたみ込み演算(convolution operati
n)を遂行することによって得られ、差信号は元の音声
からリンギングを引くことによって発見される。このた
たみ込みは周知の信号処理技術を用いて遂行される。
適応的サーチャー106は目標励振ベクトルtに最もマ
ッチする候補励振ベクトルrを見つけるために適応的コ
ードブック104をサーチする。ベクトルrはまたセット
の励振情報とも呼ばれる。最良のマッチを決定するため
に用いられるエラー基準は元の音声と合成音声の間の差
の平方である。元の音声はベクトルsによって与えら
れ、合成音声は以下の式によって計算されるベクトルy
によって与えられる。
y=HLiri+z ここで、Liはスケーリング係数である。
このエラー基準は以下の形式によって書き表わすこと
ができる。
e=(Ht+z−HLiri−z)(Ht+z−HLiri−z) ……(1) このエラー基準においては、Hマトリックスが感覚的
に重要なスペクトルのセクションを強調するように修正
される。これは周知のポール バンド幅ワイディング技
術(pole−bandwidthwiding technique)を用いて達成
される。式(1)は以下の形式に書き直すことができ
る。
e=(t−LiriTHTH(t−Liri) ……(2) 式(2)はさらに以下のように整理することができ
る。
e=tTHTHt+Liri THTHLiri−2Liri THTHt ……(3) 式(3)の第1の項は任意のフレームに対してコンス
タントであり、コードブック104からのどのriベクトル
を用いるかの決定においてエラーの計算から落される。
コードブック104内のri励振ベクトルの個々に対して、
式(3)を解き、エラー基準eを最も低い値のeをもつ
riベクトルが選択されるように決定すべきである。式
(3)を解く前に、スケーリング係数Liを決定すること
が必要である。これはLiに対して部分導関数(partial
derivative)を取り、これをゼロにセットすることによ
って簡単に遂行でき、これは以下の式を与える。
式(4)の分子は、通常、相互相関項と呼ばれ、分母
はエネルギー項と呼ばれる。このエネルギー項は相互相
関項より多くの計算を必要とする。この理由は相互相関
項では1つのベクトルを得るために1フレーム当たり最
後の3つの要素の積のみの計算が要求され、次に個々の
新たなベクトルriに対して、単に移項(トランスポー
ズ)された候補ベクトルとこの相互相関項の最後の3つ
の要素の計算結果としてのコンスタント ベクトルとの
間のドット積を取ることのみが必要であるためである。
エネルギー項の場合は、最初にHriを計算し、次にこ
のトランスポーズを取り、次にHriとHriのトランスポー
ズの間の内積(inner product)を取ることが要求され
る。これは結果として多数のマトリックス及びベクトル
演算となり、多数の計算を必要とする。本発明は計算の
数を削減し、結果としての合成音声を向上させることを
目的とする。
一部、本発明はこの目的を先行技術において用いられ
る無限インパルス応答LPCフィルタのかわりに有限イン
パルス応答LPCフィルタを用いることによって達成す
る。コスタントの応答長をもつ有限インパルス応答フィ
ルタは先行技術によるのと異なる対称性をもつHマトリ
ックスを与える。Hマトリックスはマトリックス表現で
有限インパルス応答フィルタの演算を表わす。フィルタ
が有限インパルス応答フィルタであるため、このフィル
タと個々のベクトルriによって表わされる励振情報のた
たみ込みはサンプルのR番号によって表わされる有限数
の応答サンプルを生成するベクトルriの個々のサンプル
を与える。たたみ込み演算であるHri計算のマトリック
ス ベクトル演算が遂行されると、候補ベクトルri内の
個々のサンプルからの全てのR応答ポイントが1つに総
和され、合成音声のフレームが生成される。
有限インパルス応答フィルタを表わすHマトリックス
は(N+R)×Nマトリックスであり、ここで、Nはサ
ンプル内のフレーム長を表わし、そしてRは複数のサン
プル内の切捨てインパルス応答の長さである。Hマトリ
ックスのこの形式を用いると、応答ベクトルHrはN+R
の長さをもつ。Hマトリックスのこの形式は以下の式
(5)によって表わされる。
以下の式(6)にて表わされるHマトリックスのトラ
ンスポーズ(transpose)とHマトリックス自体の積を
考慮する。
A=HTH ……(6) 式(6)はマトリックスAを与えるが、これは以下の
式(7)によって表わされるようにN×N平方対称トエ
プリッツ(Toeplitz)である。
式(7)はNが5のときHTH演算から得られるAマト
リックスを表わす。式(5)からRの値によってはマト
リックスA内の幾つかの要素が0となることがわかる。
例えば、R=2の場合、要素A2、A3及びA4は0である。
第3図はこのベクトルが5つのサンブルを含む、つま
り、N=5の場合の第1の候補ベクトルr1に対するエネ
ルギー項を示す。サンプルX0からX4は適応的コードブッ
ク104内に格納された最初の5つのサンプルである。第
2の候補ベクトルr2に対する式(4)のエネルギー項の
計算が第4図に示される。後者の数字は候補ベクトルの
みが変わり、また変化はX0サンプルの削除及びX5サンプ
ルの追加のみを伴うことを示す。
第3図に示されるエネルギー項の計算はスケーラー値
(scalar value)を与える。r1に対するこのスケーラー
値は第4図に示される候補ベクトルr2に対するスケーラ
ー値とX5サンプルが加わり、X0サンプルが削除されてい
る点のみが異なる。有限インパルス応答フィルタの使用
に起因してAマトリックスへ導入される対称性及びトエ
プリッツ(Toeplitz)特性により第4図に対するスケー
ラー値は以下の方法にて簡単に計算できる。第1図に、
X0サンプルからの寄与がこの寄与が第5図に示されるよ
うに簡単に決定できることを認識することにより削除さ
れる。この寄与は、これが単に項501と項502を巻きこむ
掛け算及び加算演算及び項504と項503を巻き込む掛け算
及び加算演算のみに基づくために削除できる。同様に、
第6図は、項X5の追加がこの寄与が項601と602を巻き込
む演算及び項604と項603を巻き込む演算に起因すること
を理解することにより、スケーラー値に加えることがで
きることを図解する。第5図に示される項の寄与を引
き、第6図に示される項の影響を加えることにより、第
4図に対するエネルギー項は第3図のエネルギー項から
反復計算することができる。当業者においては、反復計
算のこの方法がベクトルriあるいはAマトリックスのサ
イズと独立したものであることは明白である。この反復
計算は適応的コードブック104あるいはコードブック105
内に含まれる候補ベクトルを互いに比較することを可能
とし、これにはコードブックから取られる個々の新たな
励振ベクトルに対して第5図及び第6図に示される追加
の演算のみが要求される。
より一般的には、これら反復計算は数学的に以下のよ
うに表現できる。第1に、セットのマスキング マトリ
ックスがIkとして定義される。ここで、最後の1つはk
番目のロウに現れる。
これに加えて、単位マトリックスが以下のようにIと
して定義される。
さらに、シフティング マトリックスが以下のように
定義される。
トエプリッツ(Teoplitz)マトリックスに対しては、
以下の周知の定理があてはまる。
STAS=(I−I1)A(I−I1) ……(11) AあるいはHTHはトエプリッツであるため、エネルギ
ー項に対する反復計算は以下の表記法によって表現でき
る。第1に、rj+iベクトルと関連するエネルギー項を以
下のようにEj+iと定義する。
Ej+1=rj+1 THTHrj+1 ……(12) これに加えて、ベクトルrj+iはrj+1の新たなサンプル
を含むベクトルと結合されたrjのシフトされたバージョ
ンとして以下のように表わすことができる。
rj+1=Srj+(I−IN-1)rj+1 ……(13) 式(11)の定理を用いてシフト マトリックスSを削
除すると、式(12)は以下の形式に書き直すことができ
る。
Ej+1= Ej+2[rj+1 T(I−IN-1)HTHSrj−rj T(I−I1)HTHI
1rj]−rj TI1HTHI1rj+rj+1 T(I−IN-1)HTH(I−I
N-1)rj+1 ……(14) 式(14)から、I及びSマトリックスは幾つかの1を
含がむ0が大勢を占めるため、式(14)の値を求めるの
に必要とされる計算の数は式(3)に要求される計算量
より大きく低減されることが明らかである。詳細な分析
を行なうと、式(14)の計算は2Q+4浮動小数点の演算
のみを必要とすることがわかる。ここで、Qは数Rか数
Nの小さい方のどちらかである。これは式(3)に要求
される計算の数と比較して大きな簡素化である。この計
算の簡素化は無限インパルス応答フィルタでなく有限イ
ンパルス応答フィルタを用いることにより、またHtHマ
トリックスのトエプリッツ(Toeplitz)特性によって達
成される。
式(14)はコードブック104の通常のサーチにおいて
はエネルギー項を正しく計算する。ただし、いったん仮
想サーチングが開始されると、式(14)はもはやエネル
ギーを正確に計算しなくなる。これは第2図のライン20
4上のサンプル213によって図解される仮想サンプルが2
倍の速度で変化するためである。これに加えて、第2図
のサンプル214によって図解される通常のサーチのサン
プルが励振ベクトルの真ん中で変化する。この状況はコ
ードブツク内の実際のサンプル、例えば、サンプル214
をベクトルwiにて表わし、仮想セクション内のサンプ
ル、例えば、第2図のサンプル213をベクトルViによっ
て表わすことによって反復法にて解決できる。これに加
えて、仮想サンプルが総励振ベクトルの半分以下に制限
される。エネルギー項はこれら条件を用い式(14)から
以下のように書き直すことができる。
Ei=wi THTHwi+2vi THTHwi+vi THTHvi ……(15) 式(15)第1及び第3の項は以下の方法で計算的に整
理できる。式(15)の第1の項に対する反復は以下のよ
うに書き変ることができる。
wj+1 THTHwj+1= wj THTHwj−2wj T(I−I1)HTHI1wj−wj TI1HTHI1wj ……(16) そして、vjとvj+1の間の関係は以下のように書くこと
ができる。
vj+1=S2(I−Ip+1)vj+(I−IN-2)vj+1……(17) これは、式(15)の第3の項を以下を用いて整理する
ことを可能とする。
HTHvj+1=S2HTHvj+S2HTH(Ip−Ip+1)vj +(I−IN-2)HTHS2(I−Ip+1)vj +HTH(I−IN-2)vj+1 ……(18) 変数pは現存の励振ベクトル内で現在用いられている
コードブック104内に実際に存在するサンプルの数であ
る。サンプルの数の一例が第2図のサンプル214によっ
て与えられる。式(15)の第2の項は式(18)によって
整理することができる。これは、vi THTが単にマトリッ
クス演算のHTHviのトランスポーズであるためである。
当業者においては、実際のコードブツクサンプルのサー
チとの間ではサーチの速度が異なることは一目瞭然であ
る。上に示される例では、仮想サンプルは実際のサンプ
ルの2倍の速度にてサーチされる。
第7図は第1図の適応的サーチャー106をより詳細に
示す。前述のごとく、適応的サーチャー106は2つのタ
イプのサーチ動作、つまり、仮想サーチと順次サーチの
2つを遂行する。順次サーチ動作においては、サーチャ
ー106は適応的コードブック104からの1つの完全な候補
振励ベクトルにアクセスし、一方、仮想サーチにおいて
は、適応的サーチャー106はコードブック104からの部分
候補励振ベクトルにアクセスし、コードブック104から
アクセスされた候補ベクトルの最初の部分を第2図に示
されるようにこの候補励振ベクトルの後の部分に反復し
て入れる。仮想サーチ動作はブロック708からブロック7
12によって遂行され、順次サーチ動作はブロック702か
ら706によって遂行される。サーチ ディターミネータ7
01は仮想サーチを遂行すべきか順次サーチを遂行すべき
かを決定する。候補セレクタ714はコードブックが完全
にサーチされたか調べ、コードブックか完全にサーチさ
れてない場合は、セレクタ714は制御をサーチ ディタ
ミネータ701に戻す。
サーチ ディタミネータ701は経路122を介して受信さ
れるスペクトル重み付けマトリックス及び経路123を介
して受信される目標励振ベクトルに応答して完全なサー
チコードブック104を管理する。候補ベクトルの第1の
グループは全部コードブック104から満たされ、必要な
計算がブロック702から706によって遂行され、候補励振
ベクトルの第2のグループはブロック708から712によっ
て扱われ、ベクトルの部分が反復される。
候補励振の第1のグループがコードブック104からア
クセスされている場合は、サーチ ディタミネータは目
標励振ベクトル、スペクトル重み付けマトリックス、及
びアクセスされるべき候補励振ベクトルのインデックス
を経路727を介して順次サーチ コントロール702に送
る。コントロール702は候補ベクトル インデックスに
応答してコードブック104にアクセスする。順次サーチ
コントロール702は次に目標励振ベクトル、スペクト
ル重み付けマトリックス、インデックス、及び候補励振
ベクトルを経路728を介してブロック703及び704に送
る。
ブロック704は経路728を介して受信された第1の候補
励振ベクトルに応答して式(3)のHTHt項に等しいテン
ポラリー ベクトル(temporary vector)を計算し、こ
のテンポラリー ベクトル及び経路728を介して受信さ
れた情報を経路729を介して相互相関計算器705に送る。
第1の候補ベクトルの後に、ブロック704は経路728上に
受信された情報を経路729に送る。計算器705は式(3)
の相互相関項を計算する。
エネルギー計算器703は経路728上の情報に応答して式
(14)によって示される演算を遂行することによって式
(3)のエネルギー項を計算する。計算器703はこの値
を経路733を介してエラー計算器706に送る。
エラー計算器706経路730及び733を介して受信された
情報に応答してエネルギー値と相互相関値を加えること
によってエラー値を計算し、このエラー値を候補番号、
スケーリング係数、及び候補値とともに経路730を介し
て候補セレクタ714に送る。
候補セレクタ714は経路732を介して受信された情報に
応答してそのエラー値が最も低い候補の情報を保持し、
経路732を介して起動されると経路731を介して制御をサ
ーチ ディターミネータ701に送る。
サーチ ディタミネータ701が候補ベクトルの第2の
グループがコードブック104からアクセスされるべきこ
とを知ると、これは目標振励ベクトル、スペクトル重み
付けマトリックス、及び候補振励ベクトル インデック
スを経路720を介して仮想サーチ コントロール708に送
る。サーチ コントロール708はコードブツク104にアク
セスし、アクセスされたコード励振ベクトル及び経路72
0を介して受信された情報を経路721を介してブロック70
9及び710に送る。ブロック710、711及び712は、経路722
及び723を介してブロック704、705及び706によって遂行
されるのと同一タイプの演算を遂行する。ブロック709
はブロック703と同様に式(3)のエネルギー項を求め
る演算を遂行する。ただし、ブロック709はエネルギー
計算器703の場合は式(14)を用いるのに反して式(1
5)を用いる。
個々の候補ベクトル インデックス、スケーリング係
数、候補ベクトル、及び経路724を介して受信されるエ
ラー値に対して、候補セレクタ714は候補ベクトル、ス
ケーリング係数、及び最も低いエラー値をもつベクトル
のインデックスを保持する。候補ベクトルの全てが処理
された後、候補セレクタ714は最も低いエラー値をもつ
選択された候補ベクトルのインデックス及びスケーリン
グ係数を経路125を介してエンコーダ109に送り、選択さ
れた励振ベクトル経路127を介して加算器108、そして経
路127を介して確率的サーチャー107に送る。
第8図は仮想サーチ コントロール708をより詳細に
示す。適応的コードブック アクセス801は経路720を介
して受信された候補インデックスに応答して、コードブ
ック104にアクセスし、アクセスされた候補励振ベクト
ル及び経路720を介して受信された情報を経路803を介し
てサンプル リピータ802に送る。サンプル リピータ8
02は候補ベクトルに応答して、1つの完全な候補励振ベ
クトルを得るために候補ベクトルの最初の部分を候補ベ
クトルの最後の部分に反復して入れる。こうして得られ
た完全な候補励振ベクトルが次に経路721を介して第7
図のブロック709及び710に送られる。
第9図はエネルギー計算器709の式(18)によって示
される演算を遂行するための動作をより詳細に示す。実
際のエネルギー成分計算器901は式(18)の第1の項に
よって要求される演算を遂行し、この結果を経路911を
介して加算器905に送る。テンポラリー仮想ベクトル計
算器902は項HTHviを式(18)に従って計算し、この結果
を経路721を介して受信された情報とともに経路910を介
して計算器903及び904に送る。経路910上の情報に応答
して、混合エネルギー成分計算器903は式(15)の第2
の項によって要求される演算を遂行し、この結果を経路
913を介して加算器905に送る。経路910上の情報に応答
して、仮想エネルギー成分計算器904は式(15)の第3
の項によって要求される演算を遂行する。加算器905は
経路911、912、及び913上の情報に応答してエネルギー
値を計算し、この値を経路726上に送る。
統計的サーチャー107は第7図に示されるブロック701
から706及び714と類似するブロックを含む。ただし、サ
ーチ ディターミネータ701は経路123を介して受信され
た目標励振から経路127を介して受信された選択された
候補励振ベクトルを引くことによって第2の目標励振ベ
クトルを形成する。これに加えて、常にディターミネー
タは制御をコントローラ702を送る。
上に説明の実施態様は単に本発明の原理を図解するも
のであり、本発明の精神及び範囲から逸脱することなく
他の構成を設計できることは明白である。
【図面の簡単な説明】
第1図は本発明の主題であるボコーダーのアナライザー
及びシンセサイザー セクションをブロック図の形式で
示し; 第2図は仮想サーチ技法を用いてのコードブロック104
からの励振ベクトルの生成をグラフ形式で示し; 第3図から第6図は本発明の主題であるベクトル及びマ
トリックス演算をグラフ形式で示し; 第7図は第1図の適応的サーチャー106をより詳細に示
し; 第8図は第7図の仮想サーチ コントロール708をより
詳細に示し;そして 第9図は第7図のエネルギー計算器709をより詳細に示
す。 [主要部分の符号の説明] 101……フィルタ係数決定手段 102……目標セット生成手段 103……計算手段 104、105、106、107……反復計算手段 109……送出手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ダニエル ジョン クラシンスキー アメリカ合衆国 60139 イリノイズ, グレンデール ハイツ,フェアウェイ ドライブ 1407 (56)参考文献 特開 昭64−13200(JP,A)

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】テーブル(104)内に格納された励振情報
    の複数の候補セットを用いて音声を符号化するための方
    法であって、該音声は各々が複数のサンプルを有するフ
    レームから成り励振情報の各候補セットがフレームと同
    じ数のサンプルを有するものであり、該方法は該音声の
    フレームの現在のものに応答して励振情報の目標セット
    を生成するステップ(102)、 該音声のフレームの該現在のものに応答してフィルタ係
    数のセットを決定するステップ(101)、 各候補セットが励振情報の第1及び第2のサブセットだ
    け前の候補セットと異なるようにし、励振情報の該第1
    のサブセットが各候補セットの最初からの連続するサン
    プルから成り励振情報の該第2のサブセットが各励振セ
    ットの最後からの連続するサンプルから成るようなオー
    バーラップする方法で第1のテーブルに励振情報の該候
    補セットを格納するステップ(104)と、該フィルタ係
    数のセットから有限インパルス応答フィルタを生成する
    ステップ(103)と、 該有限インパルス応答フィルタならびに励振情報の該候
    補セットの各々および励振情報の該目標セットに応答し
    て該励振情報の該第1のサブセットによって寄与される
    励振情報の該前の候補セットのエネルギ項の部分を励振
    情報の該前の候補セットについてのエネルギ項からとり
    除いて一時的なエネルギ項を形成し、及び励振情報の該
    第2のサブセットにより寄与される励振情報の該候補セ
    ットの各々のエネルギ項の部分を該一時的なエネルギ項
    に加えて励振情報の該候補セットの各々についてのエネ
    ルギ項を形成することによって、励振情報の該複数の候
    補セットの各々についてエラー値を計算するのに用いら
    れるスケーリングファクターのエネルギ項を反復して計
    算するステップ(106)と、 各々についての該エネルギ項を用いて励振情報の該複数
    の候補セットの各々についての該エラー値を計算するス
    テップと、 計算されたエラー値が最も小さい励振情報の該候補の1
    つを選択するステップ(706,712)と、 励振情報の該候補セットの該選択されたものの該テーブ
    ルにおける位置を決定するステップ(714)と、 該フィルタ係数のセット及び励振情報の該候補セットの
    該選択されたものの該位置を表わす情報を送出するステ
    ップ(109)とを含む音声を符号化する方法。
  2. 【請求項2】請求項1に記載の方法において、さらに 該有限インパルス応答フィルタ及び第2のテーブル(10
    5)の候補セットの各々及び励振情報の該目標セット及
    び該第1のテーブルからの励振情報の該選択されたセッ
    トに応答して第2のテーブル(105)に格納される励振
    情報の別の複数の候補セットの各々についての別のエネ
    ルギ項を反復して計算するステップ(107)と、 別のエラー値が最小となる励振情報の該別の複数の候補
    セットの1つを該第2のテーブルから選択するステップ
    (706,732)と、 励振情報の該第2の複数の候補セットの該選択されたも
    のの該第2のテーブルにおける位置を決定するステップ
    (714)と、 該第2のテーブルにおける励振情報の該候補セットの該
    選択されたものの該第2のテーブルにおける位置を表わ
    す情報をさらに送出するステップ(109)とを含むこと
    を特徴とする音声を符号化する方法。
  3. 【請求項3】請求項2に記載の方法において、さらに 励振情報の該複数の候補セットの各々についての該別の
    エネルギ項を反復して計算する該ステップが、励振情報
    の該選択されたセットを励振情報の該目標セットから引
    き算することにより該第2のテーブルの該候補セットの
    各々についての該別のエラー値を計算するのに用いるた
    めの励振情報の別の目標セットを生成することを含むこ
    とを特徴とする音声を符号化する方法。
  4. 【請求項4】請求項3に記載の方法において、さらに 励振情報の該候補セットの各々が複数のサンプルを含
    み、該第1のサブセットが励振情報の該前の候補セット
    の最初のサンプルであり該第2のサブセットが励振情報
    の該候補セットの各々の最後のサンプルであることを特
    徴とする音声を符号化する方法。
  5. 【請求項5】請求項3に記載の方法において、さらに 励振情報の該目標セットを形成する該ステップが、 該第1のテーブルからの励振情報の該選択された候補セ
    ットを該別のテーブルからの励振情報の該選択された候
    補セットに加算(108)することにより励振情報の合成
    セットを生成するステップと、 該前のフレームについてのフィルタ係数に応答して該前
    のフレームからの励振情報の該合成セットをフィルタリ
    ングするステップ(110)と、 該前のフレームについての該フィルタ係数に応答して励
    振情報のフィルタされた合成セットをゼロ入力応答フィ
    ルタリング(111)して情報のリンギングセットを生成
    するステップと、 励振情報の該候補セットの各々についての該音声のフレ
    ームの該現在のものから該情報のリンギングセットを引
    き算して情報の中間セットを発生するステップと、 該現在のフレームについてのフィルタ係数に基づいて該
    情報の中間セットをホワイトニングフィルタリング(10
    2)して励振情報の該目標セットを生成するステップと
    を含むことを特徴とする音声を符号化する方法。
  6. 【請求項6】請求項4に記載の方法において、さらに 該第1のテーブルからの励振情報の該選択された候補セ
    ットと該別のテーブルからの励振情報の該選択された候
    補セットとを加算して該現在のフレームについての励振
    情報の合成セットを生成するステップと、 励振情報の候補セットを置き換えることにより励振情報
    の該合成セットを有する該テーブルを更新するステップ
    とを含むことを特徴とする音声を符号化する方法。
  7. 【請求項7】デコーダに送られここで再生されるように
    音声を符号化するための装置であって、該音声は各々が
    複数のサンプルを有する音声のフレームから成り、該装
    置は、 該音声のフレームの現在のものに応答して励振情報の目
    標セットを生成するための手段(102)と、 該音声のフレームの該現在のものに応答してフィルタ係
    数のセットを決定するための手段(101)と、 各候補セットが前の候補セットと励振情報の第1および
    第2のサブセットだけことなるようにし励振情報の該第
    1のサブセットが各候補セットの最初からの連続するサ
    ンプルから成り励振情報の該第2のサブセットが各候補
    セットの最後からの連続するサンプルから成るようなオ
    ーバーラップする方法にて励振情報の該候補セットを第
    1のテーブルに格納する手段(106)と、 該フィルタ係数のセットから有限応答フィルタを計算す
    る手段(103)と、 該有限インパルス応答フィルター並びに励振情報の該候
    補セットおよび励振情報の該目標セットに応答して、該
    励振情報の該サブセットの効果を励振情報の該前の候補
    セットについてのエネルギ項からとり除いて一時的なエ
    ネルギ項を生成しおよび励振情報の該第2のサブセット
    の効果を該一時的なエネルギ項に加算して励振情報の該
    現在の候補セットについてのエネルギ項を生成すること
    によって、テーブルに格納された励振情報の該複数の候
    補セットの各々についてエラー値を計算するのに用いら
    れるスケーリングファクタのエネルギ項を計算するため
    の手段(106)と、 励振情報の該複数の候補セットの各々についての該エネ
    ルギ項を用いて該エラー値を計算するための手段と、 計算されたエラー値が最も小さい励振情報の該候補の1
    つを選択するための手段(706,712)と、 励振情報の該候補の該選択されたものの該テーブルにお
    ける位置を決定するための手段(714)と、 該フィルタ係数のセットおよび励振情報の該候補セット
    の該選択されたものの決定された位置を表わす情報を送
    出するための手段(109)とを含む音声を符号化するた
    めの装置。
  8. 【請求項8】請求項7に記載の装置において、さらに 該有限応答フィルタ情報及び該別のテーブルの該候補セ
    ットの各々及び励振情報の該目標セット及び該テーブル
    からの励振情報の該選択されたものに応答して別のテー
    ブル(105)に格納された励振情報の別の複数の候補セ
    ットの各々について別のエネルギ項を反復して計算する
    ための手段(107)と、 別のエラー値が最小となる励振情報の該別の複数の候補
    セットの1つを該別のテーブルから選択するための手段
    (706,732)と、 励振情報の該別の複数の候補セットの該選択されたもの
    の該別のテーブルにおける位置を決定するための手段
    (714)と、 該別のテーブルにおける励振情報の該候補セットの該選
    択されたものの該別のテーブルにおける決定された位置
    を表わす情報をさらに送出するための該手段(109)と
    を含むことを特徴とする音声を符号化するための装置。
  9. 【請求項9】請求項8に記載の装置において、さらに 該別のエネルギ項を反復して計算するための該手段が励
    振情報の該目標セットから励振情報の該複数の候補セッ
    トの各々についての励振情報の該選択された候補セット
    を引き算して該別のテーブルの該候補セットの各々につ
    いて該別のエラー値を計算するのに用いるための励振情
    報の別の目標セットを生成することから成ることを特徴
    とする音声を符号化するための装置。
  10. 【請求項10】請求項9に記載の装置において、さらに 励振情報の該候補セットの各々が複数のサンプルから成
    り、及び該第1のサブセットが励振情報の該前の候補セ
    ットの最初のサンプルであり、かつ該第2のサブセット
    が励振情報の該候補セットの各々の最後のサンプルであ
    ることを特徴とする音声を符号化するための装置。
  11. 【請求項11】請求項10に記載の装置において、さらに 励振情報の該目標セットを生成するための該手段が、 該テーブルからの励振情報の該選択された候補セットを
    該別のテーブルからの励振情報の該選択された候補セッ
    トに加算することにより励振情報の合成セットを生成す
    るための手段と、 該前のフレームについてのフィルタ係数に基づいて該前
    のフレームからの励振情報の該合成セットをフィルタリ
    ングする手段(110)と、 該前のフレームについての該フィルタ係数に基づいて励
    振情報の該フィルタされた合成セットをゼロ入力応答フ
    ィルタリング(111)して情報のリンギングセットを生
    成するための手段と、 励振情報の該候補セットの各々について該音声のフレー
    ムの該現在のものから該情報のリンギングセットを引き
    算(112)して情報の中間セットを発生するための手段
    と、 該現在のフレームについてのフィルタ係数に基づいて該
    情報の中間セットをホワイトニングフィルタリング(10
    2)して励振情報の該目標セットを生成する手段として
    含むことを特徴とする音声を符号化するための装置。
  12. 【請求項12】請求項10に記載の装置において、さらに 該テーブルからの励振情報の該選択された候補セットと
    該別のテーブルからの励振情報の該選択されか候補セッ
    トとを加算(108)して該現在のフレームについての励
    振情報の合成セットを生成するための手段と、 励振情報の候補セットを置き換えることによって励振情
    報の該合成セットを有する該テーブルを更新するための
    手段とを含むことを特徴とする音声を符号化するための
    装置。
JP63155115A 1987-06-26 1988-06-24 音声を符号化するための方法及び装置 Expired - Fee Related JP2657927B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/067,649 US4899385A (en) 1987-06-26 1987-06-26 Code excited linear predictive vocoder
US67,649 1987-06-26

Publications (2)

Publication Number Publication Date
JPS6454497A JPS6454497A (en) 1989-03-01
JP2657927B2 true JP2657927B2 (ja) 1997-09-30

Family

ID=22077431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63155115A Expired - Fee Related JP2657927B2 (ja) 1987-06-26 1988-06-24 音声を符号化するための方法及び装置

Country Status (9)

Country Link
US (1) US4899385A (ja)
EP (1) EP0296763B1 (ja)
JP (1) JP2657927B2 (ja)
KR (1) KR0127901B1 (ja)
AT (1) ATE127952T1 (ja)
AU (1) AU596014B2 (ja)
CA (1) CA1335841C (ja)
DE (1) DE3854453T2 (ja)
HK (1) HK183496A (ja)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL94119A (en) * 1989-06-23 1996-06-18 Motorola Inc Digital voice recorder
CA2021514C (en) * 1989-09-01 1998-12-15 Yair Shoham Constrained-stochastic-excitation coding
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
CA2027705C (en) * 1989-10-17 1994-02-15 Masami Akamine Speech coding system utilizing a recursive computation technique for improvement in processing speed
IL95753A (en) * 1989-10-17 1994-11-11 Motorola Inc Digits a digital speech
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JP2834260B2 (ja) * 1990-03-07 1998-12-09 三菱電機株式会社 音声のスペクトル包絡パラメータ符号化装置
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式
JPH0468400A (ja) * 1990-07-09 1992-03-04 Nec Corp 音声符号化方式
FR2665567B1 (fr) * 1990-08-02 1993-07-30 Matra Communication Procede de codage et codeur de parole a analyse par prediction lineaire.
SE466824B (sv) * 1990-08-10 1992-04-06 Ericsson Telefon Ab L M Foerfarande foer kodning av en samplad talsignalvektor
JP2898377B2 (ja) * 1990-08-29 1999-05-31 沖電気工業株式会社 コード励振線形予測符号化器及び復号化器
JPH04114516A (ja) * 1990-09-04 1992-04-15 Matsushita Electric Ind Co Ltd 音声符号化装置
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
AU653969B2 (en) * 1990-09-28 1994-10-20 Philips Electronics N.V. A method of, system for, coding analogue signals
FR2668288B1 (fr) * 1990-10-19 1993-01-15 Di Francesco Renaud Procede de transmission, a bas debit, par codage celp d'un signal de parole et systeme correspondant.
JPH04264597A (ja) * 1991-02-20 1992-09-21 Fujitsu Ltd 音声符号化装置および音声復号装置
US5150410A (en) * 1991-04-11 1992-09-22 Itt Corporation Secure digital conferencing system
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
JPH06138896A (ja) * 1991-05-31 1994-05-20 Motorola Inc 音声フレームを符号化するための装置および方法
CA2483322C (en) * 1991-06-11 2008-09-23 Qualcomm Incorporated Error masking in a variable rate vocoder
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
JPH0546199A (ja) * 1991-08-21 1993-02-26 Matsushita Electric Ind Co Ltd 音声符号化装置
JP3178732B2 (ja) * 1991-10-16 2001-06-25 松下電器産業株式会社 音声符号化装置
US5267317A (en) * 1991-10-18 1993-11-30 At&T Bell Laboratories Method and apparatus for smoothing pitch-cycle waveforms
US5455861A (en) * 1991-12-09 1995-10-03 At&T Corp. Secure telecommunications
JP2968109B2 (ja) * 1991-12-11 1999-10-25 沖電気工業株式会社 コード励振線形予測符号化器及び復号化器
US5339384A (en) * 1992-02-18 1994-08-16 At&T Bell Laboratories Code-excited linear predictive coding with low delay for speech or audio signals
JP2700974B2 (ja) * 1992-04-09 1998-01-21 日本電信電話株式会社 音声符号化法
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
EP0577488B9 (en) * 1992-06-29 2007-10-03 Nippon Telegraph And Telephone Corporation Speech coding method and apparatus for the same
US5357567A (en) * 1992-08-14 1994-10-18 Motorola, Inc. Method and apparatus for volume switched gain control
US5504834A (en) * 1993-05-28 1996-04-02 Motrola, Inc. Pitch epoch synchronous linear predictive coding vocoder and method
US5479559A (en) * 1993-05-28 1995-12-26 Motorola, Inc. Excitation synchronous time encoding vocoder and method
US5623609A (en) * 1993-06-14 1997-04-22 Hal Trust, L.L.C. Computer system and computer-implemented process for phonology-based automatic speech recognition
TW271524B (ja) 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
SE504010C2 (sv) * 1995-02-08 1996-10-14 Ericsson Telefon Ab L M Förfarande och anordning för prediktiv kodning av tal- och datasignaler
US5838683A (en) 1995-03-13 1998-11-17 Selsius Systems Inc. Distributed interactive multimedia system architecture
US7058067B1 (en) 1995-03-13 2006-06-06 Cisco Technology, Inc. Distributed interactive multimedia system architecture
US5717819A (en) * 1995-04-28 1998-02-10 Motorola, Inc. Methods and apparatus for encoding/decoding speech signals at low bit rates
US5668925A (en) * 1995-06-01 1997-09-16 Martin Marietta Corporation Low data rate speech encoder with mixed excitation
US5649051A (en) * 1995-06-01 1997-07-15 Rothweiler; Joseph Harvey Constant data rate speech encoder for limited bandwidth path
WO1997014139A1 (fr) * 1995-10-11 1997-04-17 Philips Electronics N.V. Methode et dispositif de prediction de signal pour un codeur de parole
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
JPH09185397A (ja) 1995-12-28 1997-07-15 Olympus Optical Co Ltd 音声情報記録装置
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
TW317051B (ja) * 1996-02-15 1997-10-01 Philips Electronics Nv
US6765904B1 (en) 1999-08-10 2004-07-20 Texas Instruments Incorporated Packet networks
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6041297A (en) * 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
JP3206497B2 (ja) * 1997-06-16 2001-09-10 日本電気株式会社 インデックスによる信号生成型適応符号帳
US6044339A (en) * 1997-12-02 2000-03-28 Dspc Israel Ltd. Reduced real-time processing in stochastic celp encoding
US6169970B1 (en) 1998-01-08 2001-01-02 Lucent Technologies Inc. Generalized analysis-by-synthesis speech coding method and apparatus
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6681203B1 (en) * 1999-02-26 2004-01-20 Lucent Technologies Inc. Coupled error code protection for multi-mode vocoders
US6801499B1 (en) * 1999-08-10 2004-10-05 Texas Instruments Incorporated Diversity schemes for packet communications
US6757256B1 (en) 1999-08-10 2004-06-29 Texas Instruments Incorporated Process of sending packets of real-time information
US6744757B1 (en) 1999-08-10 2004-06-01 Texas Instruments Incorporated Private branch exchange systems for packet communications
US6804244B1 (en) 1999-08-10 2004-10-12 Texas Instruments Incorporated Integrated circuits for packet communications
US6801532B1 (en) * 1999-08-10 2004-10-05 Texas Instruments Incorporated Packet reconstruction processes for packet communications
US6678267B1 (en) 1999-08-10 2004-01-13 Texas Instruments Incorporated Wireless telephone with excitation reconstruction of lost packet
US7574351B2 (en) * 1999-12-14 2009-08-11 Texas Instruments Incorporated Arranging CELP information of one frame in a second packet
US7478042B2 (en) * 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
US6898568B2 (en) 2001-07-13 2005-05-24 Innomedia Pte Ltd Speaker verification utilizing compressed audio formants
GB0704732D0 (en) * 2007-03-12 2007-04-18 Skype Ltd A communication system
US8539307B1 (en) 2012-01-11 2013-09-17 The United States Of America As Represented By The Director, National Security Agency Device for and method of linear interpolative coding

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4910781A (en) * 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching

Also Published As

Publication number Publication date
HK183496A (en) 1996-10-11
ATE127952T1 (de) 1995-09-15
DE3854453T2 (de) 1996-02-29
EP0296763A1 (en) 1988-12-28
JPS6454497A (en) 1989-03-01
AU596014B2 (en) 1990-04-12
CA1335841C (en) 1995-06-06
KR890001021A (ko) 1989-03-17
AU1838488A (en) 1989-01-05
US4899385A (en) 1990-02-06
EP0296763B1 (en) 1995-09-13
KR0127901B1 (ko) 1998-04-04
DE3854453D1 (de) 1995-10-19

Similar Documents

Publication Publication Date Title
JP2657927B2 (ja) 音声を符号化するための方法及び装置
JP2892011B2 (ja) 仮想サーチを用いたコード励振線形予測ボコーダ
JP3272953B2 (ja) 適応コードブックに基づく音声圧縮システム
US5187745A (en) Efficient codebook search for CELP vocoders
KR100194775B1 (ko) 벡터양자화장치
JPH02502135A (ja) 改良されたベクトル励起源を有するデジタル音声コーダ
US20070118370A1 (en) Methods and apparatuses for variable dimension vector quantization
EP0575511A4 (ja)
US5179594A (en) Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook
KR20060030012A (ko) 스피치 코딩 방법 및 장치
EP0516439A2 (en) Efficient CELP vocoder and method
EP0578436A1 (en) Selective application of speech coding techniques
JP3095133B2 (ja) 音響信号符号化方法
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
JP3238063B2 (ja) ベクトル量子化方法および音声符号化方法
JP3268750B2 (ja) 音声合成方法及びシステム
JP3263347B2 (ja) 音声符号化装置及び音声符号化におけるピッチ予測方法
JP3071012B2 (ja) 音声伝送方式
JPH07271397A (ja) 音声符号化装置
JP3489748B2 (ja) 音声符号化装置及び音声復号化装置
JP3068689B2 (ja) 音声符号化方法
JPH11119799A (ja) 音声符号化方法および音声符号化装置
JPH0511799A (ja) 音声符号化方式
JP3284874B2 (ja) 音声符号化装置
JPH10207495A (ja) 音声情報処理装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees