JP4111538B2 - ディジタル情報コーディング方法ならびに装置 - Google Patents

ディジタル情報コーディング方法ならびに装置 Download PDF

Info

Publication number
JP4111538B2
JP4111538B2 JP52419196A JP52419196A JP4111538B2 JP 4111538 B2 JP4111538 B2 JP 4111538B2 JP 52419196 A JP52419196 A JP 52419196A JP 52419196 A JP52419196 A JP 52419196A JP 4111538 B2 JP4111538 B2 JP 4111538B2
Authority
JP
Japan
Prior art keywords
element storage
predictor
state
synthesis filter
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP52419196A
Other languages
English (en)
Other versions
JPH10513277A (ja
Inventor
ホフマン,ルディ
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JPH10513277A publication Critical patent/JPH10513277A/ja
Application granted granted Critical
Publication of JP4111538B2 publication Critical patent/JP4111538B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0003Backward prediction of gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

産業上の利用分野
本発明は音声コーディング技術ならびに一般的な音声処理に関する。更に詳細には、後方適応技術と組み合わされた合成技法による分析に基づく音声コーディング方法に関する。
従来の技術
合成ならびに後方適応による分析に基づくシステムは例えば低遅延コード励起線形予測(Low-Delay Code Excited Linear Prediction)(LD−CELP)音声コーデックの中で使用され、これは最近国際電気通信連合(ITU)1992年発行の”CODING OF SPEECH AT 16 kbits/s USING LOW-DELAY CODE EXCITED LINEAR PREDICTION”(著作権ITU)の中で標準化された。この音声信号圧縮アルゴリズムは一方で世界中の音声コーディング専門家の中で良く知られている。
ディジタルネットワークはディジタル的にコード化された信号を送信するために使用される。過去に於いては主に音声信号が送信されていた。今日電子メールネットワークが広範に使用されることによりデータトラヒックは世界的に更に増大している。経済的観点から、ネットワークの混雑を無くして接続されるユーザ数を最大とすべきである。その結果特に雑音マスク効果を用いて最適化された音声圧縮アルゴリズムが開発されてきている。不幸にしてこれらのコーディングアルゴリズムは音声帯域データ信号の送信には余り適していない。従って考え方としては信号分類アルゴリズムを追加して、データ信号が検出された際に音声帯域データ信号圧縮(VDSC:voiceband data signal compression)アルゴリズムを使用する。現在16kb/秒ディジタル回路増倍機器(DCME:Digital-Circiut-Multiplication-Equipment)送信システムがこの考え方を用いて標準化されている。LD−CELPコーデック音声の送信に使用されるようになる一方で、音声帯域データ送信用に新たなコーディングアルゴリズムがITU内部で開発途上にある。
実際のアプリケーションでは信号分類アルゴリズムに失敗して、結果的に別の異なるコーディング技法との間で少なからず切換が行われることとなる。もしも次のコーディング技法が常にリセット状態から開始されるのであれば、音声帯域データの送信中はこれは重大な問題とはならないであろう。しかしながら、音声が現に送信されている間はこれはかなり悩ましい効果をもたらす結果となろう。
16kb/秒DCMEシステムに於けるこの問題を解決するために、LD−CELPアーキテクチャを音声帯域信号圧縮にも適用することが提案された。量子化を十分に行うために例えばより大きな形状のコードブックを提供することによりビット速度のみが増大されねばならない。この様な方法を用いることで、1つのコーディングモードから他へ切り替わる際に時間信号の連続的な形状が保証される。
この解決方法の欠点は2つある。1つは高いビット速度で送信中は計算負荷が非常に増大する点である。これは実施する上で余り魅力的とは言えない、何故ならば従来型のLD−CELPが現在市場で提供されているディジタル信号処理装置(DSP)のほぼ完全に近い計算能力を要求しているからである。もう1つは、これは非常に有りそうなことであるが音声帯域データ信号のコーディングは特別に最適化されたアーキテクチャを用いてもっと効率的に実施することが可能であり、結果的に40kb/秒以下のビット速度またはそれ以上の性能が得られる。従来40kb/秒はVDSCアルゴリズムで要求されるビット速度と見なされていた。言及するまでも無いが、もしも既存の信号圧縮アルゴリズムがLD−CELP型コーデックと込み合わされて使用されている場合にはこの切換の問題がまた発生する。既知のシステムは、音声帯域データ信号を送信しなければならない時には、例えばITU rec.G.711(64kb/秒)またはG.726(32kb/秒または40kb/秒)に基づくアルゴリズムを使用している。
これに関連して、ADPCMと名付けられたコーディングアルゴリズムの構造は前方誤り訂正を含む点で、LD−CELPと類似点を有する。サイモン・ヘイキン(Simon Haykin)著”Digital Communications”、ジョン・ウィリー・アンド・サンズ(John Wiley & Sons)発行、1988年参照。
米国特許第5,233,660号にはコード励起線形予測(LD−CELP)に基づく低遅延ディジタル音声エンコーダおよびデコーダが開示されている。コーディングはコードブック利得および短期合成フィルターパラメータ用の後方適応調整を含み、また長期合成フィルターパラメータの前方適応調整をも含む。効率的な低遅延ピッチパラメータ誘導および量子化により、等価な音声品質を実現する従来型コーディング遅延の数分の1の全体遅延が実現できる。
米国特許第5,339,384号にはまた、音声および音響送信用のCELPコーダが開示されている。このコーダは低遅延コーディングに適合されており、これは模擬されて復号された音声の先行フレームの一部のスペクトル分析を行い、復号合成に従来使用されていたものよりも更に高次の合成フィルタを決定し、最も低い内部誤差信号を生成するベクトルの指標のみを送信している。修正知覚重みパラメータおよびポストフィルタリングの新奇な用法とによって、高い品質の再生を保つ一方で、多数のエンコーディングおよびデコーディングの直列処理を改善している。
また米国特許第5,228,076号は先に説明したADPCMコーディングアルゴリズムを使用することを含んでいるため、興味深い。
発明の目的と要約
例えば音声送信中、送信時間のかなりの部分は無声である。この無声期間中、送信データ用の送信リンクを使用することが可能である。データおよび音声は異なるコードでコード化されており、問題は異なるコーダー間での切換と切換後に音声の中に不連続性が生じるのを避けることである。これは特に後方適応コーディング技法の場合である。また、音声以外の別の型式の情報を送信する場合にも、時間間隔が生じることがあって、これは同一チャンネル上で別の情報を送信するために使用できる。
出力信号内の連続性は、起動されているコーディング技法の状態が、このコーディング技法があたかも以前に起動されていたかのように、同一の値に事前設定されることによって除去することが出来る。問題は状態変数の対応する初期値の生成が、コーデックがLD−CELP型コーディング技法に基づいている場合には自明では無い点にある。予測子係数は、LD−CELP型コーディング技法の合成フィルタ係数のように、過去の量子化された出力信号に依存する。更に、状態および予測子係数は、LD−CELP内の合成フィルタの利得予測子例数が励起信号に依存するのと同様、過去の量子化された励起信号に基づいている。更に詳細には、問題はコーデックが切り替えられる際にはこの過去の励起信号を利用できない点にある。たとえ状態変数を呼び出すことが可能としても、コーデックを初期化する時に非常に膨大な瞬時信号処理能力が要求されるであろう。この処理は現在市場で利用可能な全てのDSPを枯渇させるで有ろう。
本発明は状態変数を呼び出す方法と、要求される信号処理または計算能力を削減して実際的に実施することが可能となる方法を示す技術を開示する。問題は切り離される1つのコーダーからの出力サンプルを用いて、切り換えて使用される並列コーダーのコーディング技法の状態を事前設定することで解決される。
更に詳細には、この問題は事前設定値から係数値を生成し、これらの係数値および信号シーケンスから信号シーケンス(ベクトル)を再生(restore)する事で解決される。この信号シーケンス(ベクトル)はデコード出力、例えば音声をデコーダ内またエンコーダ内で直接生成するために使用され、また通常送信中に継続して生成される。信号シーケンス(ベクトル)を再生する事で、コーデックは迅速に開始される。
簡略化された実施例に於いて、係数値はコーデックの中で生成されず、切り離される並列のコーデックから直接転送される。転送された係数は信号シーケンス(ベクトル)を再生するために使用される。
本発明の1つの目的は、LD−CELP型音声コーデックの様な後方適応音声コーディング技法を、再生された出力信号の連続した形状を保ちながら起動することの可能な、適切な装置および方法を提供することである。初期化に関連する信号処理負荷を正当な低い値に保つように修正することも提供されている。
本発明の特長は、コーデックを切り換える際に必要な信号処理能力が適切で有ること、また切換が出力信号の中に大きな不連続性を与えずに実施できることである。音声およびデータを同一通信チャンネル上で送信する場合、音声コーダに切り換える際に音声中に気になる影響は観測されない。
【図面の簡単な説明】
図1は、異なる目的に使用される2つの異なるコーデックを含む送信システムの上位レベルでのブロック図を示す。
図2は、後方適応技術に基づく一般的音声コーディング技法の上位レベルでのブロック図を示す。
図3aは、LD−CELPエンコーダのブロック図を示す。
図3bは、LD−CELPデコーダのブロック図を示す。
図4は、図2に示すローカルデコーダの内容を更に詳細に図示する。
図5は、合成フィルタの後方適応の低レベルブロック図と対応する予測子係数を図示する。
図6は、利得予測子の後方適応の低レベルブロック図と対応する予測子係数を図示する。
図7aおよびbは、LD−CELP音声コーデック内の合成フィルタ動作を実行する処理手順を図示する。
図8は、LD−CELP型音声コーデック内で状態をウォーミングアップ処理手順の流れ図を示す。
図9は、1つの励起ベクトルを生成するブロック図を示す。
実施例の詳細な説明
本発明の提出された実施例を説明するために、例えばLD−CELPアルゴリズム内で用いられる後方適応音声コーディング技法のいくつかの詳細を説明することが有効である。図1は、ブロック図形式で音声信号ならびに音声帯域データ信号用の異なるコーディング技法を備えた送信システムを図示する。送信機側にはLD−CELPコーディング音声用エンコーダ100とVDSCデータエンコーダ101とが存在する。入力ライン99はこれらのエンコーダにスイッチ98で接続され、エンコーダの出力はスイッチ102で通信チャンネル120に接続されている。信号分類装置103が入力ライン99に接続され、スイッチ98および102を制御する。受信機側には音声デコード用デコーダ200とデータデコーダ290とが存在する。これらのデコーダは通信チャンネルにスイッチ203で接続され、またそれらの出力は出力ライン219にスイッチ198で接続されている。信号分類装置103はスイッチ203および198に別々の信号チャンネル191で接続され、これらのスイッチを送信機側のスイッチと並列に制御する。バッファ192がデータエンコーダ101の予備出力に接続され、これはまたスイッチ193経由で音声エンコーダ100の入力144に接続されている。このスイッチは信号分類装置103によって起動される。受信機側には対応するバッファ292およびスイッチ293が存在する。例として示す実施例では、音声エンコーダ100はLD−CELP型式で音声がエンコードされる際に使用され、一方別のコーディング技法がデータエンコーダ101の中で音声帯域データ信号が存在する際に使用される。使用中の圧縮技法上の情報は通常送信機から受信機に別々の信号チャンネル191を通して送られる。本発明はコーディング技法VDSCが動作中に信号分類装置が丁度音声の存在を検知したという情況に関連している。これは結果としてLD−CELP型音声コーデック100および200を起動させる。
図2は、非常に上位のレベルで例えばLD−CELP内で使用される後方適応音声コーディング技法の基本原理を図示する。送信機側にコードブック検索装置130とローカルデコーダ95が存在する。ローカルデコーダ95はコードブックの入力に接続され、これはまた入力信号用の入力を有する。コードブック検索装置からの出力はローカルデコーダの入力に接続されている。送信機はコードベクトルCWを受信機に送信する。受信機側にはポストフィルタ217に接続されたローカルデコーダ96が存在する、またポストフィルタは次に出力219に接続されている。送信機並びに受信機の両側に、量子化された出力信号がそれぞれ’ローカルデコーダ’ブロック95および96の中で再構築される。送信機側で、過去に再構築された信号の既知の状態が、エンコードされるべき現在の音声セグメント用の最適パラメータを見つけるために使用される、これは以下に更に詳細に説明する。
図3aは、LD−CELPエンコーダ100の簡略化されたブロック図およびまたVDSCエンコーダ101を示す。エンコーダ100または101を選択するためのスイッチ102および98ならびにスイッチ98および102を制御するための信号分類装置103もまた、バッファ192およびスイッチ293と同様示されている。入力信号Sは信号分類装置103およびLD−CELPエンコーダ100に接続されている。LD−CELPエンコーダはベクトルバッファ111に接続されたPCM変換器110を含む。エンコーダ100はまた第一励起コードブックメモリ(codebook memory)112を含み、これは第一後方利得適合器114を具備した第一利得スケーリング装置(gain scaling unit)113に接続されている。第一利得スケーリング装置113の出力は入力144を有する第一合成フィルタ115に接続され、これは第一後方予測子適応回路116に接続されている。合成フィルタ115の出力は差分回路117に接続され、またこれにはベクトルバッファ111も接続されている。差分回路117は次に知覚重みフィルタ118に接続され、その出力は2乗平均誤差回路119に接続されている。後者は励起コードブックメモリと、またLD−CELPエンコーダ100と、図3bに示す送信の受信機側のLD−CELPデコーダ200とを接続する通信チャンネル120とに接続されている。
図3bは、スイッチ198および203を具備したVDSCデコーダ290ならびにまた、スイッチ293を具備したバッファ292とを示す。LD−CELPデコーダは、第二励起コードブック格納器212を含み、これは通信チャンネル120と第二後方利得適応器214を具備した第二利得スケーリング回路213とに接続されている。第二利得回路213は入力145を有する第二合成フィルタ215に接続され、これは第二後方予測子適応回路216に接続されている。適応ポストフィルタ217はその入力を合成フィルタ215に接続され、その出力をA−法(A−law)またはμ−法(μ−law)PCM出力219を具備したPCM変換器218に接続されている。
LD−CELPエンコーダ100は以下の方法で動作する。PCM A−法またはμ−法変換された信号Sは変換器110の中で均一PCMに変換される。入力信号は次に5つの連続的入力信号サンプルのブロック、入力信号ベクトルと呼ばれる、に区切られベクトルバッファ111の中に格納される。各々の入力信号ベクトルに対してエンコーダはコードブック112の中に格納されている128候補コードブックベクトルの各々を第一利得スケーリング装置113を通して通過させる。この装置内で各々のベクトルには8つの異なる利得要素が掛け算され、結果として生じる1024候補ベクトルが第一合成フィルタ115を通される。差分回路117内で発生した、各々の入力信号ベクトルと1024候補ベクトルの間の誤差は、重みフィルタ118内で周波数重みづけがなされ、回路119内で2乗平均(mean-square)される。エンコーダは最適コードベクトル、すなわち入力信号ベクトルの1つに対して2乗平均誤差を最少とするベクトルを識別し、最適コードベクトルの10ビットコードブック指標CWがチャンネル120を通してデコーダ200に送信される。最適コードベクトルはまた第一利得スケーリング装置113および第一合成フィルタ115を、次にやって来る入力信号ベクトルのエンコードを行うために、準備状態の訂正フィルタメモリを確立するために通される。最適コードベクトルの識別およびフィルタメモリの更新は全ての入力信号ベクトルに対して繰り返される。合成フィルタ115の係数および第一利得スケーリング装置内の利得は、それぞれ適応回路116および114によって、先に量子化された信号および利得スケール化された励起に基づいて後方適応法で定期的に更新される。
デコーダ200内でのデコーディングもまたブロック毎に実施される。各々の10ビットコードブック指標CWをチャンネル120上で受信すると、デコーダはテーブル対照を実行して励起コードブック212から対応するコードベクトルを抽出する。抽出されたコードベクトルは次に第二利得スケーリング回路213および第二合成フィルタ215を通され、その時点でデコードされた信号ベクトルを生成する。次に第二合成フィルタ215の係数および第二利得スケーリング回路213の利得がエンコーダ100と同一の方法で更新される。次にデコードされた信号ベクトルがポストフィルタ217を通され、知覚品質を強化する。ポストフィルタ係数はデコーダ200で利用できる情報を用いて定期的に更新される。ポストフィルタ信号ベクトルの5つのサンプルは次にPCM変換器218に通され、5つのA−法またはμ−法PCM出力サンプルに変換される。当然エンコーダ100およびデコーダ200は共に、先に述べた2つのPCM法の同一の1つのみを使用する。
図4は、量子化された出力信号または再構築された信号のローカルデコーダ95および96内で生成を、更に詳細に図示する。図3aに於いて、ローカルデコーダは合成フィルタ115と、その利得適応器114を具備した利得スケーリング装置113とを含む。更に詳細には励起コードブック112は形状コードブック130および利得コードブックを含み、回路113と114は掛け算器132および113、そして利得予測子134とを含む。後者は利得要素GAIN’、いわゆる励起ベクトル(excitation vector)を生成し、利得コードブックは利得要素GF2を生成する。掛け算器113の中で全利得要素GF3が生成される。言葉を変えると、利得要素は予測部分GAIN’と更新部分(innovation part)GF2とから成り、これは利得コードブック131内に格納された8つの可能性のある値から選択される。ローカルデコーダ内で、図3aの送信されたコードワードCWは形状コードブック指標SCI(7ビット)と利得コードブック指標GCI(3ビット)とに分割される。形状コードブック130から選択された励起ベクトルは利得要素GF3が掛け算され励起信号ET(1...5)となり、これは合成フィルタ115を通して供給される。この励起信号ET(1...5)のエネルギーは次の励起ベクトルGAIN’の利得を予測するために取り込まれる。従って、利得コードブックから取られた利得要素GF2は、事によると誤差を含む可能性のある予測された利得要素GAIN’を訂正するためにのみ使用される。
図5は例えばLD−CELPコーデック内で使用される後方適応線形予測の基本原理の詳細を図示する。遅延ラインは遅延要素140を有し、各々は1サンプル周期Tの遅延周期を有する。遅延要素の出力は予測子係数A2からA51を具備した各々の係数要素141に接続され、その出力は加算要素142に接続されている。この要素は次に差分要素143に接続され、これは励起信号シーケンスET(1...5)用の1入力を有し、これはまた遅延ラインの第一遅延要素140に接続されている。各々の遅延要素はLPC分析装置に接続され、これは図3に示す後方予測子適応器116である。遅延要素はまた二有力144にも接続されている。適応器116はそれぞれの係数要素141に接続されている。差分要素143と遅延ラインとの間の接続は量子化出力信号用の1つの出力を有し、これはデコードされた音声信号SDである。信号SDの過去に再構築された音声サンプルは遅延ライン要素140内に格納され、’T’は1サンプル周期の遅延を示す。この遅延ラインの最新のサンプルには予測子係数(A1...A51,A1=1)で重みが付けられ、励起信号ET(1...5)と共に量子化出力信号またはデコード音声SDを形成する。新たに生成されたサンプルSDは次に遅延ラインの中にシフトされる。対応する予測子係数A2からA51はデコードされた音声の過去の履歴から、良く知られているLPC技術を後方予測子適応器116に適用して導かれる。図5に示すように、要素141は入力139によって適応器116の出力に接続されている。rec.G.728の中で105個のサンプルから成る全遅延ラインは’音声バッファ’と呼ばれ、疑似コードの中で配列’SB(1..105)’と表される。このバッファの最新部分は’合成フィルタ’と呼ばれ、疑似コードの中で’STATELPC(1...50)’と表される。
図6は後方利得適合器114に対応し、また部分的に図3の利得スケーリング装置113に対応しており、利得予測子部分の詳細情況を図示する。エネルギー生成装置152は遅延要素150により遅延ラインに接続され、その各々は要素内に5Tで記述されている、5つのサンプリング周期の遅延を有する。遅延要素150の一部は予測子係数GP2からGP11を具備した係数要素151に接続されている。係数要素は加算器153に接続され、これは信号GAIN’用の出力を有する。全ての遅延要素150は予測子適応器154に接続され、その出力は係数要素151に接続されている。励起信号ET(1...5)のエネルギーは遅延ラインの中にシフトされる。再びエネルギーの最新に予測子係数(GP1からGP11、GP1=1)で重み付けがなされ、加算器153内で生成された合計は次にエンコードされる入力信号用に予測された利得要素GAIN’となる。またここで、対応する予測子係数が励起信号(1...5)ETのエネルギーの過去の履歴から、良く知られているLPC技術を予測子適応器154内に適用して導かれる。ところでLD−CELPコーデックの中では利得予測子の状態変数は、装置155および156で示されるように対数領域で表現される。これは他の後方適応技法とは異なるはずである。
最後に、最適励起ベクトルET(1...5)を見つける処理手順に関するいくつかの知識が、本発明の詳細を理解する上で有効と思われる。図7aおよび図7bを参照すると、これは図5の合成フィルタの一部を示している。図7aおよび図7bはITU勧告G.728、39ページに記載され、またその図2/G.728で示される合成フィルタ用の異なるブロック22および9に示された異なる状態で動作する合成フィルタを示す。例えばLD−CELPコーデックに於いて、5つの連続したサンプルが集められてエンコードされるベクトルを形成する。もしもベクトルが完全な場合は、合成フィルタの呼び出し信号の5個のサンプルが計算され、この入力音声ベクトルから引き算されて対象ベクトルを生成する。呼び出し信号または零入力応答ZINR(1...5)は、合成フィルタに零値入力サンプル”0”を供給することにより生成される、図7b参照。この信号はまた現行音声ベクトル用の予測サンプルと見ることも出来る。エンコーダに於いて、利得コードブック131と結合された形状コードブック130の全ての1024個の考えられる励起ベクトルは、合成フィルタを通して供給され、零状態から開始し各々の新たなベクトルに対して零状態応答ZSTR(1...5)を生成する、図7a参照。各々の励起ベクトルに対する結果として生じる5つのサンプルは対象ベクトルと比較される。最後に、最少誤差を生じる1つが選択される。一度最適励起ベクトルが見つかると、合成フィルタ状態は更新される。すなわち、選択された励起ベクトルに属する零状態応答が零入力応答に加算され、その結果デコードされた音声の5つの新たなサンプルまたは合成フィルタの新たな5つの状態値が得られる。この更新は送信機側および同様に受信機側のローカルデコーダの中で実行される。
注意して置かねばならないのは、上記の図4、5、6および7の詳細説明は送信機側に付いてなされているが、図1、2、3aおよび3bの説明からも明らかなように、これらは受信機側にも同様に適用可能である。
本発明の概要を先に説明し、またLD−CELP音声コーディング技法の最も重要な詳細を説明したので、本発明の提出された実施例の詳細な説明を行うこととする。LD−SELP音声コーデックの様な後方適応音声コーデックが始動された時、このコーデックとして利用できる状態は無い、すなわち図5の遅延ラインの遅延要素140または図6の要素150の中には利用できる値が存在しない。以前に動作していたコーディング技法で生成された量子化信号のみを集めることが出来る。従って、滑らかな切り換えを実現するためには、LD−CELP状態の呼び出しが過去の出力信号の履歴を基本として取り込むことで実施される。この例として挙げる実施例では、過去の出力信号のこの履歴は、図1のバッファ192および292内に格納されているVDSCコーデックから取られる。例として示すVDSCコーデック101および290の様な、音声帯域データ信号圧縮コーデックは、図5のLD−CELPコーデックの要素140と同様の遅延要素を具備した遅延ラインを有することに注意されたい。バッファ192および292内に格納された物がVDSCコーデックのこの遅延ラインの状態であり、これらはVDSCコーデックが動作し処理が進むに従って更新される。バッファ内の値は要素140にそれらのそれぞれの入力144を経由して並列に供給される。図5から分かるように、合成フィルタの状態は過去に再構築された出力信号の履歴を含む。これは先に説明したLD−CELPに付いて言えるし、またVDSCコーデックに付いても言える。図1の信号分類装置103がライン99上に音声を表示した時、VDSCコーデック101および290からLD−CELPコーデック100および200に切り換えバッファ192および292の更新が停止する。スイッチ193および293は回路103により瞬間的に起動され、バッファの状態値が合成フィルタ遅延ラインの遅延要素140の中に入力144経由でロードされる。従ってバッファ192および292から以前に計算された音声サンプルの履歴が取り込まれ、LD−CELPコーデック100および200の合成フィルタ状態がこれらのバッファ値と共に供給される。残りの仕事は、もしもLD−CELPが過去に既に動作していた場合に、これらの状態を生成する20はずの励起信号ET(1...5)を探し出すことである。この励起信号ET(1...5)が見つけられると、図6に関連して説明した利得予測子状態を事前設定することが容易となろう。
以下に、アルゴリズムの詳細をITU勧告G.728”Coding of Speech at 16kbit/s Using Low-Delay Code Excited Linear Prediction”内で使用されているのと同様、疑似コードを提供して説明する。信号または係数は勧告の表2/G.728に基づいて表記されている。
利得予測子状態生成の説明を、LD−CELPが正常モードで動作中にその中で実行される合成フィルタ更新の処理手順から始める。励起信号ET(1...5)の5つのサンプルが次のように合成フィルタの中に供給される:最初、零入力応答ZINR(1...5)の5つのサンプルが計算される、図7b参照。これは零値入力信号”0”(呼び出し信号)が供給された時の、合成フィルタの出力である。第二番目に、零状態応答ZSTR(1...5)の5つのサンプルが計算される、図7a参照。状態の内の5つのみが零と異なることに注意。従ってこれらの最初の5つの状態のみが図7aに図示されている。ZSTR(1...5)は励起信号ET(1...5)が供給された際の零状態合成フィルタの出力ベクトルである。従って、合成フィルタ状態の5つの新たな値、STATELPC(1:5)またはSB(1:5)は以前に生成された成分を加算することにより計算される。
STATELPC(i)=ZINR(i)+ZSTR(i);i=1,...,5
この処理手順を心に留めて、励起信号ET(1...5)を呼び出すための新たな方法を導くことが出来る。別のコーデック、例えば図1のVDSCコーデックからLD−CELPコーデックに切り換えられた際に、配列STATELPC(1...50)内のサンプルのみが、過去に再構築された信号を配列STATELPC(1...50)または配列SB(1...105)の正しい位置に配置することによって既知であり、ここでSTATELPC(1...50)は図5の配列SB(1...105)の一部と見ることが出来る。励起信号ET(1...5)はZSTR(1...5)内に格納された零状態応答の中に隠されており、これは最初切り離されているべきものである。この目的のために、零入力応答ZINR(1...5)が、合成フィルタに5つの零値サンプルを供給することで生成されなければならない。従って零状態応答は下記を生成することで抽出出来る。
ZSTR(i)=STATELPC(i)-ZINR(i);i=1,...,5
ZSTR(i)は励起信号ET(1...5)が供給された際の零状態合成フィルタの出力である。このベクトルはこの零状態応答に逆フィルタ操作を適用して導くことが出来る。励起信号ET(1...5)は完全に再構築可能である。何故ならば零状態応答のサンプルは50個の予測子係数との連続運転中のコンボリューション処理の全ての成分を含まないからである。零状態応答ZSTR(1...5)から励起信号ET(1...5)を呼び出す、この最後のステップは対応する操作を疑似コードの助けを借りて説明することで更に明瞭に理解される。表1の左列に、勧告G.728に基づいて実施される際の零状態応答を計算するための疑似コードが示されている。右列には励起ベクトルを呼び出すための、対応する逆操作が逆フィルタ操作として示されている。
Figure 0004111538
一度励起信号ET(1...5)を得ると、利得予測子の対応する状態値が、例えばG.728のブロック20”1-vuctor delay, RMS calculator and logarithm calculator”で推奨されているように生成出来る。従って任意のその他のコーデックからLD−CELP型音声コーデックへ滑らかに遷移するために必要な全ての信号が利用できることになる。この利得状態生成を以下に手短に繰り返す。励起信号ET(1...5)が図5のエネルギー生成装置152に供給され、遅延要素150は利得予測子状態で満たされ、係数要素151内の係数GP2−GP11生成され、利得励起ベクトルGAIN’が生成される。音声送信の一番初めにコードベクトルCWが生成され、励起コードブック112に戻って結合される、励起信号ET(1...5)の新たな値が図4に説明されたように生成され、合成フィルタの状態も係数要素141内の合成フィルタ予測子係数A2からA51として更新され、またデコードされた音声の新たな値SDが生成される。利得励起ベクトルGAIN’の新たな値が次のコードベクトルCWに対して生成される。この様にしてLD−CELPの状態が音声送信用に連続的に更新される。
次の本発明の方法の概要を図8の流れ図に関連して説明する。この流れ図は2つの異なる音声コーデック間でデコードされた出力信号の滑らかな切換を提供する切り換え処理手順を図示する。この方法はブロック300から開始し、信号分類回路103が音声が送信されるか否かを検出するところから始まる。NOが選択される場合、VDSCコーデックが、送信用データのコーディングを継続し、これはブロック301に基づき実施される。YESが選択される場合、LD−CELPコーデック内の音声バッファ、要素140にはVDSCコーデックから、バッファ192内に格納されていた状態値VSB(1...105)が提供され、これはブロック302で実施される。合成フィルタ予測子係数A2...A51がブロック303で生成される。励起信号ET(1...5)がブロック304で取り出され、ブロック305で利得予測子バッファ、図6の要素150が提供される。利得予測子係数、GP1からGP11がブロック306で生成され、利得励起ベクトルGAIN’がブロック307で生成される。LD−CELPコーデック100および200が、ブロック308で運転され、音声が送信機と受信機との間で送信される。ブロック309は信号分類装置103が、音声帯域データが送信されるか否かを連続的に検出していることを示している。もしもNOが選択される場合(音声帯域データに対して!)LD−CELPコーデックは運転を継続する。YESが選択される場合、VDSCコーデックが送信ライン120に結合され、示されたデータの送信用のコーディングを開始する。
VDSCコーデックのコーディング技法もまた、後方適応コーディング技法と出来ることが分かるであろう。その様な場合、VDSCコーデックはVDSCコーデック内の状態値にLD−CELPコーデック内の領域SB(1...105)からの状態値を提供することで開始できる。これは図8のブロック310に示されている。この様にして本発明は送信ライン内の音声並びにデータコーデックの両方に用いることが可能である。後方適応コーディング技法を備えたその他のコーデックにもまた、本発明を用いることが出来る。
次に、以下に疑似コードを用いて行う非常に詳細な説明の前に、励起信号ET(1・・・5)の生成を図9に基づいて説明する。VDSCコーデックからの状態値は平行して音声バッファSB(1...105)の要素140の中に格納される。この音声バッファの一部の一時コピーがメモり145内に格納され、信号TEMPが後ほど疑似コードを用いて更に詳細に説明する処理行った後に出力される。音声バッファSB(1...105)の全内容がハイブリッドウィンドウ装置49へ接続48経由で送られる。装置49内のハイブリッドウィンドウ処理、装置50内のレビンソン回帰(Levinson recursion)およびブロック51内の帯域拡張により、予測子係数A2からA51が生成され、メモリ146内に格納される。値A2からA51はそれぞれの係数要素141に入力139を経由して送られる。零入力応答値ZINR(1...5)が装置147の中で、信号TEMPおよびメモリ146からのA係数に基づいて生成される。零状態応答値ZSTR(1...5)が差分装置148の中で生成され、装置149の中で励起信号ET(1...5)が生成される。これらの値はエネルギー生成装置152に送られる。次にデコードされた音声信号SDの値がその処理の最初にメモり146からのA係数の助けを借りて生成され、係数要素141の中に格納され、またVDSCコーデック101からの状態に基づいて要素140の中に格納される。
本発明の簡単化された実施例に於いて、係数値A2からA51は装置49、50、51そして146の中では生成されない。代わってVDSCコーデック内の図3aおよび図3bの対応する係数B2からB51がLD−CELPコーデックに転送され、それらは係数要素141の中に入力139を経由して挿入される。
DCME送信技法に於いて、信号分類アルゴリズムの中で誤った判断を行うと、結果として1つのコーディング技法からもう一方へ2.5ミリ秒ごとに切換が行われることが知られている。もしももう一方のコーディング技法がLD−CELPと同様に高価な場合は、5ミリ秒の間に利用できる計算能力を2つのコーディング技法の間で等値化する機会は無いであろう。何故ならば状態の事前設定操作および正常動作モードの計算を実行しなければならないからである。従ってLD−CELPに切り替わる場合、2.5ミリ秒以内で利用できる計算能力は初期化フェーズと後続の正常動作フェーズとで共有されなければならない。両方を合わせて正常動作モード中に使用される計算能力以上を要求すべきでは無い。以下に於いて始動フェーズ中および最初の適応サイクル中の複雑さを軽減する方法を説明する。
初期化フェーズ中、過去のサンプルを合成フィルタの状態変数の中にコピーするための計算負荷は無視できる。利得予測子状態の更新はわずかばかり高価である。しかしながら、更に多くの計算能力は合成フィルタの予測子係数A1からA51の計算で必要とされる。ハイブリッドウィンドウ処理およびレビンソン回帰処理手順は処理装置能力に対して非常に高いピークを要求するはずである。
この部分での複雑さを軽減する1つの方法は、合成フィルタの予測子の並び順を初期フェーズの間、約10個の値に変更し、A11までの係数のみが生成されるようにすることである。僅かに晶質の落ちた音声の期間は、その信号が数ミリ秒の間しか影響されないので有れば、認識することは困難である。この場合がそれに当たる、何故ならば音声バッファSB(1...105)は過去のサンプルで直ちに満たされるからである。50個の予測子係数の最初の完全なセットは30サンプルまたは3.75ミリ秒の後に利用できる。フィルタ順序を削減することは、初期化フェーズ中の零状態応答の計算に於ける複雑さを少なくするという特長がある。零状態応答の各々の新たなサンプルに対して、図7bから分かるように50回の掛け算−足し算演算が実施されなければならない。この計算コストはフィルタ順序を10に減らせば5分の一に軽減できる。
別の方法はLD−CELPの係数A1からA51に対応する、事前にもう一方のコーディング技法VDSCで生成された係数を使用することである。これはウィンドウ処理、ACF係数およびレビンソン回帰を計算するために必要な計算力の多くを節約する。
更に、LD−CELP開始後最初の適応サイクル中に係数更新で要求される計算能力を取り除き、初期化部分に移すことが可能である。事前に計算された予測子係数は、最初のまたは最初2つの適応サイクルの間凍結される。その結果生じる音声品質の低下は無視できる程度であるが、計算能力に於ける収穫は非常に大きい。
更に別の複雑さの低減がLD−CELPの利得予測子部分で得られる。LD−CELPコーデックの要素150内の利得予測子状態は10個のタップを含む。従って少なくとも10個の連続した励起信号ET(1...5)のベクトルが合成フィルタ状態から導かれなければならない。更に、予測子係数GP2...GP11が、初期化フェーズに続く第一適応サイクルの第一ベクトル用に利得を予測するために導かれなければならない。幸いにして利得予測子状態は少しの歪に対して余り敏感ではない。このため粗く予測された値を事前設定することが可能である。従って、初期フェーズ中の複雑さを軽減するために下記の修正変更が行える:
最新の励起ベクトルET(1...5)のみに対して利得GAIN’を計算し、これが過去の平均値および第一適応サイクルの第一ベクトルに対する予測値と仮定する。この方法により、予測子利得の新たなセットが第一適応サイクルの第一ベクトルの間に既に計算される。従って、GP2...GP11=0と事前設定する事で十分である。
もう少し高価な方法は、最新の対数利得のいくつかを計算してその結果の平均値を現行および過去の利得とする事である。
次にその他の多くの考えられる組み合わせの1つである提出された実施例を、勧告G.728でも適用された疑似コードを用いて詳細に説明する。示されているのは、その他のコーディングアルゴリズムからLD−CELPへの切換が実施された際のステップである。
その他のコーディングアルゴリズムが量子化出力サンプルVSを過去に生成し、この信号の履歴はVSB(1:105)とラベルを付けられ配列の中に格納されており、ここでVSB(105)は最も古い、またVSB(1)は最も新しいサンプルであると仮定する。以下に述べるその他の全てのラベルは勧告G.728の中で使用されたものと同一である。次に、LD−CELPの番になる際に、以下の操作が事前に実施される。
1.配列VSB(1...105)からSB(1...105)へサンプルのコピーを取る。SB(1...50)はSTATELPC(1...50)内に格納されている合成フィルタ状態変数と同一であり、ここで最新のサンプルはSTATELPC(1)内に格納されている。
2.ハイブリッドウィンドウ処理モジュール(ブロック49)、レビンソン回帰モジュール(ブロック50)および帯域幅拡張モジュール(ブロック51)を走らせることで、51個の予測子係数A(1...51)を計算する、ここでA81)=1である。これらの係数は初期化フェーズの間に零入力応答を計算するためと、第一適応サイクルの間に使用される。
3.利得予測子状態は最新の励起ベクトルの対数利得のみを計算し、この値をSBLG()またはGSTATE()の別の場所の中にコピーすることで事前設定される。
a)零入力応答の5つのサンプルを計算する:
Figure 0004111538
b)零状態応答の5つのサンプルを計算する:
Figure 0004111538
c)励起ベクトルの5つのサンプルを逆フィルタ演算で計算する:
Figure 0004111538
d)ブロック76、39、40(対数利得の計算)
Figure 0004111538
e)利得予測子状態を対数利得で満たす:
Figure 0004111538
f)エンコーダ側のみ:形状コードベクトルコンボリューションおよびエネルギーテーブル計算(ブロック12、14、15)実施:
インパルス応答の計算を行うために、この時点では重みフィルタは不要である。従ってブロック12のAWZ()およびAWP()の寄与は取り除かれる。
第一適応サイクル中に実行される操作と組合わされた、この提案された処理手順は事前設定を行わない場合の計算負荷よりも高価であると言うことはない。もしも実際に実行する際に通常行われているようにレビンソン回帰(ブロック50)がいくつかのベクトルに広がっている場合には、これが特に当てはまる。
上記参照されたITU勧告G.728は説明に添付されている。

Claims (24)

  1. 通信チャンネル(120)上に信号を送信するためのLD−CEP符号化システムに於ける方法であって、該システムが,
    第二後方適応エンコーダ(101)に格納された状態値(VSB(1...105))に基づいて設定されるフィルタ状態(SB(1...105))用要素格納部(140)と、要素格納部(140)に格納されたサンプルの重み付けに用いられる予測子係数(A2...A51)用係数要素格納部(141)とを備える合成フィルタ(115)を含む第一後方適応エンコーダ(100)と、
    以前の動作により生成された量子化出力サンプルの履歴を表す状態値(VSB(1...105))用要素格納部を備える第二後方適応エンコーダ(101)と、
    前記第一および第二エンコーダ(100、101)の間の切換を行い、送信で使用されるエンコーダの1つを選択するための制御回路(103)とを含み、
    前記方法は
    信号を第二エンコーダ(101)経由で送信し、その状態値(VSB(1...105))をバッファ(192)の中に格納することと、
    制御回路(103)の動作に基づいて第一エンコーダ(100)経由で送信するための切換を行うことと、
    第一エンコーダ(100)の状態値(SB(1...105))の少なくとも一部を前記格納された値(VSB(1...105))と同一の値に設定することと、
    音声の過去の履歴から導かれた予測子計数(A2...A51)の少なくとも一部を第一エンコーダ(100)の中に持ち込むことと、
    持ち込まれた予測子係数(A2...A51)に基づいて、合成フィルタ(115)から出力信号(SD)を生成することとを含む前記方法。
  2. 請求項1に記載の方法に於いて、第二エンコーダ(101)が第一エンコーダ(100)の係数要素格納部(141)に対応する、予測子係数(B2...B51)用の係数要素を備え、前記方法が更に
    第二エンコーダ(101)の予測子係数(B2...B51)の少なくとも一部を前記バッファ内に格納することと、
    前記格納された予測子係数(B2...B51)を第一エンコーダ(100)内の合成フィルタ(115)の係数要素格納部(141)に送信することとを含む、前記方法。
  3. 請求項1に記載の方法に於いて、第一エンコーダ(100)の予測子係数(A2...A51)を前記設定された状態値(SB(1...105))に基づいて生成することを含む、前記方法。
  4. 請求項3に記載の方法に於いて、予測子係数(A2...A51)の一部(A2...A11)のみを生成することを含む、前記方法。
  5. 請求項1、2、3または4に記載の方法に於いて、更に
    合成フィルタ(115)への5つの零値入力サンプル(”0”)の供給に対する合成フィルタ(115)における応答に含まれる、ベクトル(ZINR(1...5))を状態値(SB(1...105))および合成フィルタ(115)内の予測子係数(A2...A51)に基づいて生成することと、
    零状態応答用のベクトル(ZSTR(1...5))を零値入力サンプル(”0”)への応答の前記ベクトル(ZINR(1...5))を合成フィルタ(115)の対応する状態値(SB(1...105))を最新の5つの状態値(SB(1...5))に分割した物から引き算することで生成することと、
    合成フィルタ(115)用の励起信号(ET(1...5))を零状態応答ベクトル(ZINR(1...5))から得られたベクトル(ZSTR(1...5))と、予測子係数(A 2 ...A 51 )とに基づいて生成することとを含む、前記方法。
  6. 請求項5に記載の方法に於いて、第一エンコーダ(100)が状態値(SBLG)用要素格納部(150)と予測子係数(GP2...GP11)用係数要素格納部(151)とを具備した利得予測子格納部(134)を備え、前記方法は更に
    利得予測子格納部(134)の状態値(SBLG)を前記生成された励起信号(ET(1...5))を前記状態値(SBLG)用要素格納部(150)に供給し、前記状態値(SBLG)用要素格納部(150)において励起信号(ET(1...5))を用いて対数利得を計算することにより生成された値に設定することと、
    利得予測子格納部(134)の前記予測子係数(GP2...GP11)をその状態値(SBLG)に基づいて線形予測コード化により生成することと、
    第一エンコーダ(100)の初期化期間の後、合成フィルタ(115)の第一励起信号(ET(1...5))用に予測利得係数(GAIN’)を生成することを含む、前記方法。
  7. 通信チャンネル(120)上を送信された信号を受信するためのLD−CEP符号化システムに於ける方法であって、該システムが
    第二後方適応デコーダ(290)に格納された状態値(VSB(1...105))に基づいて設定されるフィルタ状態(SB(1...105))用要素格納部(140)と、要素格納部(140)に格納されたサンプルの重み付けに用いられる予測子係数(A2...A51)用係数要素格納部(141)とを有する合成フィルタ(215)を含む第一後方適応デコーダ(200)と、
    以前の動作により生成された量子化出力サンプルの履歴を表す状態値(VSB(1...105))用要素格納部を有する第二後方適応デコーダ(290)と、
    前記第一および第二デコーダ(200、290)の間の切換を行い、信号受信で使用されるデコーダの1つを選択するための制御回路(103)とを含み、
    前記方法は
    信号を第二デコーダ(290)経由で受信し、その状態値(VSB(1...105))をバッファ(292)の中に格納することと、
    制御回路(103)の動作に基づいて第一デコーダ(200)経由で受信するための切換を行うことと、
    第一デコーダ(200)の状態値(SB(1...105))の少なくとも一部を前記格納された値(VSB(1...105))と同一の値に設定することと、
    音声の過去の履歴から導かれた予測子係数(A2...A51)の少なくとも一部を第一デコーダ(200)の中に持ち込むことと、
    持ち込まれた予測子係数(A2...A51)に基づいて、合成フィルタ(215)から出力信号(SD)を生成することとを含む前記方法。
  8. 請求項7に記載の方法に於いて、第二デコーダ(290)が第一デコーダ(200)の係数要素格納部(141)に対応する、予測子係数(B2...B51)用の係数要素を備え、前記方法は更に
    第二デコーダ(290)の予測子係数(B2...B51)の少なくとも一部を前記バッファ内に格納することと、
    前記格納された予測子係数(B2...B51)を第一デコーダ(200)内の合成フィルタ(215)の係数要素格納部(141)に送信することとを含む、前記方法。
  9. 請求項7に記載の方法に於いて、第一デコーダ(200)の予測子係数(A2...A51)を前記設定された状態値(SB(1...105))に基づいて生成することを含む、前記方法。
  10. 請求項9に記載の方法に於いて、予測子係数(A2...A51)の一部(A2...A11)のみの生成を含む、前記方法。
  11. 請求項7、8、9または10に記載の方法に於いて、更に
    合成フィルタ(215)への5つの零値入力サンプル(”0”)の供給に対する合成フィルタ(215)における応答に含まれる、ベクトル(ZINR(1...5))を状態値(SB(1...105))および合成フィルタ(215)内の予測子係数(A2...A51)に基づいて生成し;
    零状態応答用のベクトル(ZSTR(1...5))を零値入力サンプル(”0”)への応答の前記ベクトル(ZINR(1...5))を合成フィルタ(215)の対応する状態値(SB(1...105))を最新の5つの状態値(SB(1...5))に分割した物から引き算することで生成することと、
    合成フィルタ(215)用の励起信号(ET(1...5))を零状態応答ベクトル(ZINR(1...5))から得られたベクトル(ZSTR(1...5))と、予測子係数(A 2 ...A 51 )とに基づいて生成することとを含む、前記方法。
  12. 請求項11に記載の方法に於いて、第一デコーダ(200)が状態値(SBLG)用要素格納部(150)と予測子係数(GP2...GP11)用係数要素格納部(151)とを具備した利得予測子格納部(134)を有し、前記方法は更に
    利得予測子格納部(134)の状態値(SBLG)を前記生成された励起信号(ET(1...5))を前記状態値(SBLG)用要素格納部(150)に供給し、前記状態値(SBLG)用要素格納部(150)において励起信号(ET(1...5))を用いて対数利得を計算することにより生成された値に設定することと、
    利得予測子格納部(134)の前記予測子係数(GP2...GP11)をその状態値(SBLG)に基づいて線形予測コード化により生成することと、
    第一デコーダ(200)の初期化期間の後、合成フィルタ(215)の第一励起信号(ET(1...5))用に予測利得係数(GAIN’)を生成することとを含む、前記方法。
  13. 通信チャンネル(120)上に信号を送信するためのLD−CEP符号化システムに於ける装置であって、該装置が
    第二後方適応エンコーダ(101)に格納された状態値(VSB(1...105))に基づいて設定されるフィルタ状態(SB(1...105))用要素格納部(140)と、要素格納部(140)に格納されたサンプルの重み付けに用いられる予測子係数(A2...A51)用係数要素格納部(141)とを備える合成フィルタ(115)を含む第一後方適応エンコーダ(100)と、
    以前の動作により生成された量子化出力サンプルの履歴を表す状態値(VSB(1...105))用要素格納部を有する第二後方適応エンコーダ(101)と、
    前記第一および第二エンコーダ(100、101)1つを通信チャンネル(120)に結合するためのスイッチ(98、102)を具備した制御回路(103)と、
    信号を前記第二エンコーダ経由で送信する際に、第二エンコーダ(101)の状態値(VSB(1...105))を格納するためのバッファ(192)と、
    第一エンコーダ(100)経由で通信チャンネル(120)上に送信するために切り換えた際に、前記格納された値(VSB(1...105))の少なくとも一部を第一エンコーダ(100)の状態値(SB(1...105))用要素格納部(140)の中に供給するための装置(193、144)と、
    係数要素格納部(141)の入力(139)に接続され、第一エンコーダ(100)の音声の過去の履歴から導かれた予測子係数(A2...A51)の少なくとも一部を持ち込むための装置(116;49,50,51,146;192,193,139)と、
    係数要素格納部(141)に接続され、合成フィルタ(115)から出力信号(SD)を生成するための装置(142、143)とを含む、前記装置。
  14. 請求項13に記載の装置に於いて
    第一エンコーダ(100)の係数要素格納部(141)に対応する、第二エンコーダ(101)内の予測子係数(B2...B51)用係数要素と、
    第二エンコーダ(101)の予測子係数(B2...B51)を格納するための前記バッファ(192)内の装置と、
    前記格納された予測子係数(B2...B51)を合成フィルタ(115)の係数要素格納部(141)に送信するための装置(193、139)とを含む前記装置。
  15. 請求項13に記載の装置に於いて、予測子係数(A2...A51)を持ち込むための装置が、前記予測子係数(A2...A51)を第一エンコーダ(100)の状態値(SB(1...105))用の要素格納部(140)内の前記格納された状態値(VSB(1...105))に基づいて生成するための装置(116;48,49,50,51,146)を含む、前記装置。
  16. 請求項15に記載の装置に於いて、予測子係数(A2...A51)を生成するための前記装置(116;48,49,50,51,146)が予測子係数(A2...A51)の一部のみを生成するように構成されている、前記装置。
  17. 請求項13−16のいずれか1つに記載の装置が
    合成フィルタ(115)への5つの零値入力サンプル(”0”)の供給に対する合成フィルタ(115)における応答に含まれる、ベクトル(ZINR(1...5))を状態値(SB(1...105))および合成フィルタ(115)内の予測子係数(A2...A51)に基づいて生成するための装置(147)と、
    零状態応答用のベクトル(ZSTR(1...5))を生成するための装置(148)で、該装置は零値入力サンプル(”0”)への応答の前記ベクトル(ZINR(1...5))を合成フィルタ(115)の対応する状態値(SB(1...105))を最新の5つの状態値(SB(1...5))に分割した物から引き算することを含む前記装置と、
    合成フィルタ(115)の励起信号(ET(1...5))を零状態応答ベクトル(ZINR(1...5))から得られたベクトル(ZSTR(1...5))と、予測子係数(A 2 ...A 51 )とに基づいて生成するための装置(149)とを含む、前記装置。
  18. 請求項17に記載の方法に於いて、第一エンコーダ(100)が状態値(SBLG)用要素格納部(150)と予測子係数(GP2...GP11)用係数要素格納部(151)とを有する利得予測子格納部(134)を含み、前記方法は更に
    利得予測子格納部(134)の状態値(SBLG)を生成された励起信号(ET(1...5))を前記状態値(SBLG)用要素格納部(150)に供給し、前記状態値(SBLG)用要素格納部(150)において励起信号(ET(1...5))を用いて対数利得を計算することにより生成された値に設定するための装置(152、155)と、
    状態値用要素格納部(150)と係数要素格納部(151)とに接続され、利得予測子格納部(134)の前記予測子係数(GP2...GP11)を利得予測子の状態値(SBLG)に基づいて線形予測コード化により生成するための装置と、
    第一エンコーダ(100)の初期化期間の後、合成フィルタ(115)の第一励起信号(ET(1...5))用に予測利得係数(GAIN’)を生成するための装置(153、156)とを含む、前記装置。
  19. 通信チャンネル(120)上に送信された信号を受信するためのLD−CEP符号化システムに於ける装置であって、該装置が
    第二後方適応デコーダ(200)に格納された状態値(VSB(1...105))に基づいて設定されるフィルタ状態(SB(1...105))用要素格納部(140)と、要素格納部(140)に格納されたサンプルの重み付けに用いられる予測子係数(A2...A51)用係数要素格納部(141)とを備える合成フィルタ(215)を含む第一後方適応デコーダ(200)と、
    以前の動作により生成された量子化出力サンプルの履歴を表す状態値(VSB(1...105))用要素格納部を有する第二後方適応デコーダ(290)と、
    前記第一および第二デコーダ(200、290)1つを通信チャンネル(120)に結合するためのスイッチ(203、198)を具備した制御回路(103)と、
    信号を前記第二デコーダ経由で送信する際に、第二デコーダ(290)の状態値(VSB(1...105))を格納するためのバッファ(292)と、
    第一デコーダ(200)経由で通信チャンネル(120)上に送信するために切り換えた際に、前記格納された値(VSB(1...105))の少なくとも一部を第一デコーダ(200)の状態値(SB(1...105))用要素格納部(140)の中に供給するための装置(293、145)と、
    係数要素格納部(141)の入力(139)に接続され、第一デコーダ(200)の音声の過去の履歴から導かれた予測子係数(A2...A51)の少なくとも一部を持ち込むための装置(116;49,50,51,146;192,193,139)と、
    係数要素格納部(141)に接続され、合成フィルタ(215)から出力信号(SD)を生成するための装置(142、143)とを含む、前記装置。
  20. 請求項19に記載の装置に於いて
    第一デコーダ(200)の係数要素格納部(141)に対応する、第二デコーダ(290)内の予測子係数(B2...B51)用係数要素と、
    第二デコーダ(290)の予測子係数(B2...B51)を格納するための前記バッファ(292)内の装置と、
    前記格納された予測子係数(B2...B51)を合成フィルタ(215)の係数要素格納部(141)に送信するための装置(293、139)とを含む前記装置。
  21. 請求項19に記載の装置に於いて、予測子係数(A2...A51)を持ち込むための装置が、前記予測子係数(A2...A51)を第一デコーダ(200)の状態値(SB(1...105))用の要素格納部(140)内の前記格納された状態値(VSB(1...105))に基づいて生成するための装置(116;48,49,50,51,146)を含む、前記装置。
  22. 請求項21に記載の装置に於いて、予測子係数(A2...A51)を生成するための前記装置(116;48,49,50,51,146)が予測子係数(A2...A11)の一部のみを生成するように構成されている、前記装置。
  23. 請求項19−22のいずれか1つに記載の装置が
    合成フィルタ(215)への5つの零値入力サンプル(”0”)の供給に対する合成フィルタ(215)における応答に含まれる、ベクトル(ZINR(1...5))を状態値(SB(1...105))および合成フィルタ(215)内の予測子係数(A2...A51)に基づいて生成するための装置(147)と、
    零状態応答用のベクトル(ZSTR(1...5))を生成するための装置(148)で、該装置は零値入力サンプル(”0”)への応答の前記ベクトル(ZINR(1...5))を合成フィルタ(215)の対応する状態値(SB(1...105))を最新の5つの状態値(SB(1...5))に分割した物から引き算することを含む前記装置と、
    合成フィルタ(215)の励起信号(ET(1...5))を零状態応答ベクトル(ZINR(1...5))から得られたベクトル(ZSTR(1...5))と、予測子係数(A 2 ...A 51 )とに基づいて生成するための装置(149)とを含む、前記装置。
  24. 請求項23に記載の方法に於いて、第一デコーダ(200)が状態値(SBLG)用要素格納部(150)と予測子係数(GP2...GP11)用係数要素格納部(151)とを有する利得予測子格納部(134)を含み、前記装置は更に
    利得予測子格納部(134)の状態値(SBLG)を生成された励起信号(ET(1...5))を前記状態値(SBLG)用要素格納部(150)に供給し、前記状態値(SBLG)用要素格納部(150)において励起信号(ET(1...5))を用いて対数利得を計算することにより生成された値に設定するための装置(152、155)と、
    状態値用要素格納部(150)と係数要素格納部(151)とに接続され、利得予測子格納部(134)の前記予測子係数(GP2...GP11)を利得予測子の状態値(SBLG)に基づいて線形予測コード化により生成するための装置と、
    第一デコーダ(200)の初期化期間の後、合成フィルタ(215)の第一励起信号(ET(1...5))用に予測利得係数(GAIN’)を生成するための装置(153、156)とを含む、前記装置。
JP52419196A 1995-02-08 1996-02-02 ディジタル情報コーディング方法ならびに装置 Expired - Lifetime JP4111538B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9500452A SE504010C2 (sv) 1995-02-08 1995-02-08 Förfarande och anordning för prediktiv kodning av tal- och datasignaler
SE9500452-9 1995-02-08
PCT/SE1996/000128 WO1996024926A2 (en) 1995-02-08 1996-02-02 Method and apparatus in coding digital information

Publications (2)

Publication Number Publication Date
JPH10513277A JPH10513277A (ja) 1998-12-15
JP4111538B2 true JP4111538B2 (ja) 2008-07-02

Family

ID=20397130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52419196A Expired - Lifetime JP4111538B2 (ja) 1995-02-08 1996-02-02 ディジタル情報コーディング方法ならびに装置

Country Status (13)

Country Link
US (1) US6012024A (ja)
EP (1) EP0976126B1 (ja)
JP (1) JP4111538B2 (ja)
KR (1) KR100383051B1 (ja)
CN (1) CN1110791C (ja)
AU (1) AU720430B2 (ja)
BR (1) BR9607033A (ja)
CA (1) CA2211347C (ja)
DE (1) DE69633944T2 (ja)
FI (1) FI117949B (ja)
MX (1) MX9705890A (ja)
SE (1) SE504010C2 (ja)
WO (1) WO1996024926A2 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL125310A (en) * 1998-07-12 2002-02-10 Eci Telecom Ltd Method and system for managing varying traffic load in telecommunication network
US7457415B2 (en) 1998-08-20 2008-11-25 Akikaze Technologies, Llc Secure information distribution system utilizing information segment scrambling
US6865229B1 (en) * 1999-12-14 2005-03-08 Koninklijke Philips Electronics N.V. Method and apparatus for reducing the “blocky picture” effect in MPEG decoded images
US6961320B1 (en) * 2000-04-03 2005-11-01 Hughes Electronics Corporation In-band transmission of TTY/TTD signals for systems employing low bit-rate voice compression
JP3881157B2 (ja) * 2000-05-23 2007-02-14 株式会社エヌ・ティ・ティ・ドコモ 音声処理方法及び音声処理装置
DE60140020D1 (de) * 2000-08-09 2009-11-05 Sony Corp Sprachdatenverarbeitungsvorrichtung und -verarbeitungsverfahren
AU2002215274A1 (en) * 2000-11-21 2002-06-03 Telefonaktiebolaget Lm Ericsson (Publ) A portable communication device and a method for conference calls
US7855966B2 (en) * 2001-07-16 2010-12-21 International Business Machines Corporation Network congestion detection and automatic fallback: methods, systems and program products
US7068601B2 (en) * 2001-07-16 2006-06-27 International Business Machines Corporation Codec with network congestion detection and automatic fallback: methods, systems & program products
KR100794424B1 (ko) * 2001-11-01 2008-01-16 엘지노텔 주식회사 오디오 패킷 스위칭 시스템 및 방법
US20030101407A1 (en) * 2001-11-09 2003-05-29 Cute Ltd. Selectable complexity turbo coding system
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
WO2004064041A1 (en) * 2003-01-09 2004-07-29 Dilithium Networks Pty Limited Method and apparatus for improved quality voice transcoding
US7996234B2 (en) * 2003-08-26 2011-08-09 Akikaze Technologies, Llc Method and apparatus for adaptive variable bit rate audio encoding
JP2005202262A (ja) * 2004-01-19 2005-07-28 Matsushita Electric Ind Co Ltd 音声信号符号化方法、音声信号復号化方法、送信機、受信機、及びワイヤレスマイクシステム
CN100592389C (zh) 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
WO2007066771A1 (ja) * 2005-12-09 2007-06-14 Matsushita Electric Industrial Co., Ltd. 固定符号帳探索装置および固定符号帳探索方法
EP1991986B1 (en) * 2006-03-07 2019-07-31 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements for audio coding
CN101145345B (zh) * 2006-09-13 2011-02-09 华为技术有限公司 音频分类方法
KR20100006492A (ko) * 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
KR101261677B1 (ko) * 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
JP6132288B2 (ja) * 2014-03-14 2017-05-24 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 生成装置、選択装置、生成方法、選択方法、及び、プログラム
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
RU2643434C2 (ru) * 2014-09-12 2018-02-01 Общество С Ограниченной Ответственностью "Яндекс" Способ предоставления пользователю сообщения посредством вычислительного устройства и машиночитаемый носитель информации

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4100377A (en) * 1977-04-28 1978-07-11 Bell Telephone Laboratories, Incorporated Packet transmission of speech
IL74965A (en) * 1985-04-17 1990-07-12 Israel Electronics Corp Combination tasi and adpcm apparatus
AU7464687A (en) * 1986-07-02 1988-01-07 Eci Telecom Ltd. Telephone line multiplication apparatus
IL80103A0 (en) * 1986-09-21 1987-01-30 Eci Telecom Limited Adaptive differential pulse code modulation(adpcm)system
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4910781A (en) * 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA2005115C (en) * 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
IL89461A (en) * 1989-03-02 1994-06-24 Eci Telecom Limited Telephone communication compression system
US5228076A (en) * 1989-06-12 1993-07-13 Emil Hopner High fidelity speech encoding for telecommunications systems
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
FR2668288B1 (fr) * 1990-10-19 1993-01-15 Di Francesco Renaud Procede de transmission, a bas debit, par codage celp d'un signal de parole et systeme correspondant.
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
DE69228215T2 (de) * 1991-08-30 1999-07-08 Canon K.K., Tokio/Tokyo Gerät zur Bildübertragung
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5339384A (en) * 1992-02-18 1994-08-16 At&T Bell Laboratories Code-excited linear predictive coding with low delay for speech or audio signals
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
US5313554A (en) * 1992-06-16 1994-05-17 At&T Bell Laboratories Backward gain adaptation method in code excited linear prediction coders
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置

Also Published As

Publication number Publication date
WO1996024926A3 (en) 1996-10-03
CA2211347A1 (en) 1996-08-15
EP0976126B1 (en) 2004-11-24
FI973270A (fi) 1997-08-08
KR19980702044A (ko) 1998-07-15
JPH10513277A (ja) 1998-12-15
CN1179848A (zh) 1998-04-22
SE9500452D0 (sv) 1995-02-08
FI117949B (fi) 2007-04-30
CN1110791C (zh) 2003-06-04
AU4682396A (en) 1996-08-27
MX9705890A (es) 1997-10-31
CA2211347C (en) 2007-04-24
KR100383051B1 (ko) 2003-07-16
US6012024A (en) 2000-01-04
EP0976126A2 (en) 2000-02-02
SE9500452L (sv) 1996-08-09
DE69633944D1 (de) 2004-12-30
DE69633944T2 (de) 2005-12-08
SE504010C2 (sv) 1996-10-14
WO1996024926A2 (en) 1996-08-15
BR9607033A (pt) 1997-11-04
AU720430B2 (en) 2000-06-01
FI973270A0 (fi) 1997-08-08

Similar Documents

Publication Publication Date Title
JP4111538B2 (ja) ディジタル情報コーディング方法ならびに装置
JP3964915B2 (ja) エンコードまたはデコードの方法および装置
US4831636A (en) Coding transmission equipment for carrying out coding with adaptive quantization
KR101183857B1 (ko) 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치
EP0364647B1 (en) Improvement to vector quantizing coder
US6202045B1 (en) Speech coding with variable model order linear prediction
WO2008056775A1 (fr) Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre
JPS623535A (ja) 符号化伝送装置
EP0206352B1 (en) Coding transmission equipment for carrying out coding with adaptive quantization
US5799272A (en) Switched multiple sequence excitation model for low bit rate speech compression
JP3095340B2 (ja) 音声復号化装置
Be'ery Variable bit-rate methods for low-delay speech coders
JPS62237813A (ja) 高能率符号化伝送装置
JP3031765B2 (ja) コード励振線形予測符号化方式
JPH02148926A (ja) 予測符号化方式
JPH0535297A (ja) 高能率符号化装置及び高能率符号復号化装置
JPH06118999A (ja) 音声のパラメータ情報符号化法
JPH0531331B2 (ja)
WO1993004466A1 (en) Method and apparatus for codeword searching
JPH08223125A (ja) 音声復号装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060106

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060227

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060320

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060413

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070315

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080408

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term