JP4394578B2 - 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 - Google Patents

可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 Download PDF

Info

Publication number
JP4394578B2
JP4394578B2 JP2004562408A JP2004562408A JP4394578B2 JP 4394578 B2 JP4394578 B2 JP 4394578B2 JP 2004562408 A JP2004562408 A JP 2004562408A JP 2004562408 A JP2004562408 A JP 2004562408A JP 4394578 B2 JP4394578 B2 JP 4394578B2
Authority
JP
Japan
Prior art keywords
prediction
vector
stage
quantization
error vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004562408A
Other languages
English (en)
Other versions
JP2006510947A (ja
JP2006510947A5 (ja
Inventor
ミラン ジェリネク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2006510947A publication Critical patent/JP2006510947A/ja
Publication of JP2006510947A5 publication Critical patent/JP2006510947A5/ja
Application granted granted Critical
Publication of JP4394578B2 publication Critical patent/JP4394578B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声信号の伝送および合成の観点における特に通話信号の、しかし通話信号に制限しない音声信号のディジタル符号化の改良技術に関する。より詳細には、本発明は、可変ビットレート線形予測に基づく符号化における線形予測パラメータのベクトル量子化の方法と装置に関する。
線形予測(LP)パラメータの通話符号化と量子化
無線システムなどのディジタル音声通信システムは、通話符号化器を使用して、音声の高品質を維持しつつ容量の増大を図る。通話符号化器は、通話信号をディジタルビットストリームに変換し、ディジタルビットストリームを通信チャネルに送信する、あるいは記憶媒体に蓄積する。通話信号はディジタル化される、即ちサンプルされ、サンプル当たり通常16ビットにより量子化される。通話符号化器は、主体とする通話の良好な品質を維持しつつ、より少ないビット数によりこれらディジタルサンプルを表現する役割を有する。通話デコーダあるいは合成器は、送信あるいは蓄積されたビットストリームを操作し、音声信号に逆変換する。
線形予測解析に基づくディジタル通話符号化法は、低ビットレート通話符号化において極めて良い成果を収めた。特に、符号励起線形予測(CELP)符号化は、主体とする品質とビットレート間の良好な妥協を得るための既知の最良技術の1つである。この符号化技術は、無線および有線両応用における幾つかの通話符号化標準の基礎をなしている。CELP符号化では、サンプルされた通話信号は、通常フレームと呼ぶNサンプルの連続するブロックで処理され、ここでNは代表的には10−30msに相当する予め定められた数である。フレーム毎に、線形予測(LP)フィルタA(z)を計算し、符号化し、そして送信する。LPフィルタA(z)の計算には、先を見ることが典型的に必要であり、これは後続フレームの5−15msの通話セグメントからなる。Nサンプルのフレームはサブフレームと呼ぶより小さいブロックに分割される。通常、サブフレームの数は3あるいは4で、4−10msのサブフレームとなる。各サブフレームで励起信号は、過去の励起と新規固定符号帳励起の2つの要素から通常得られる。過去の励起から構成される要素は、屡々適応符号帳あるいはピッチ励起と呼ばれる。励起信号を特徴づけるパラメータは符号化され、デコーダに送信され、デコーダでは再構成された励起信号をLP合成フィルタの入力として使用する。
LP合成フィルタは次式で与えられる。
Figure 0004394578
上式で、aは線形予測係数であり、MはLP解析の次数である。LP合成フィルタは、通話信号のスペクトラム包絡線をモデル化する。デコーダでは、通話信号はデコードした励起をLP合成フィルタにより濾過して再構成される。
線形予測係数aの組は、次式に示す予測誤差が最小になるように計算される。
Figure 0004394578
Figure 0004394578
Mサンプルに基づく予測信号である。
Figure 0004394578
従って、予測誤差は、次式で与えられる。
Figure 0004394578
これは、z変換領域では次式に対応する。
Figure 0004394578
上式で、A(z)は、次式で与えられる次数MのLPフィルタである。
Figure 0004394578
代表的には、線形予測係数aはLサンプルのブロックに対する平均2乗予測誤差を最小にすることにより計算され、L(Lは通常20−30msに対応する)は通常Nに等しいか、Nより大きい整数である。線形予測係数の計算は、その他の点ではこの技術の通常の知識を有する人に既知である。このような計算例は、ITU−T勧告G.722.2「適応型マルチレート広帯域(AMR−WB)を使用する大凡16kbit/sにおける通話の広帯域符号化(Wideband coding of speech at around 16 kbit/s using adaptive multi−rate wideband(AMR−WB))」、2002年、ジュネーブに与えられている。
線形予測係数aをデコーダへの送信のために直接量子化することは出来ない。その理由は、線形予測係数に関する小さな量子化誤差がLPフィルタの変換関数の大きなスペクトラム誤差を生じる可能性があり、フィルタの不安定化さえも誘起する可能性がある、ということである。従って量子化に先だって、線形予測係数aに変換を適用する。変換によって、線形予測係数aの所謂表現を生成する。量子化し、変換された線形予測係数aを受信後、デコーダは、次いで逆変換を適用して、量子化線形予測係数を得る。線形予測係数aに広く使用される1つの表現は、線スペクトルの組(LSP)としても既知の線スペクトル周波数(LSF)である。線スペクトル周波数の計算の詳細は、ITU−T勧告G.729「共役構造代数符号励起線形予測(CS−ACELP)を使用する8kbit/sにおける通話符号化(Coding of speech at 8kbit/s using conjugate−structure algebraic−code−excited linear prediction(CS−ACELP))」、1996年3月、ジュネーブに見ることが出来る。
類似の表現は、イミタンススペクトル周波数(ISF)であり、これはAMR−WB符号化標準において使用されている(ITU−T勧告G.722.2「適応型マルチレート広帯域(AMR−WB)を使用する大凡16kbit/sにおける通話の広帯域符号化」(Wideband coding of speech at around 16kbit/s using Adaptive Multi−Rate Wideband(AMR−WB)、2002年、ジュネーブ)。他の表現も可能であり、使用されている。一般性を失うことなく、ISF表現の特種ケースを以下の説明において考慮する。
そのようにして得られるLPパラメータ(LSFs、ISFsなど)はスカラー量子化(SQ)あるいはベクトル量子化(VQ)のいずれかにより量子化される。スカラー量子化では、LPパラメータは、個々に量子化され、通常パラメータ当たり3または4ビットが必要である。ベクトル量子化では、LPパラメータはベクトルにグループ化され、実体として量子化される。量子化ベクトルの組を含むコード帳あるいはテーブルが蓄積される。量子化器は、一定の距離の測定により入力ベクトルに最も近いコード帳入力に対するコード帳を探索する。選択した量子化ベクトルの指標はデコーダに送信される。ベクトル量子化は、スカラー量子化より優れた性能を示すが、複雑さの増大とメモリ要求の犠牲を伴う。
構造化ベクトル量子化は、通常VQの複雑さとメモリ要求の削減に使用される。分離VQでは、LPパラメータベクトルは、少なくとも2つのサブベクトルに分離され、サブベクトルは個々に量子化される。多段VQでは、量子化ベクトルは幾つかのコード帳入力の和である。分離VQおよび多段VQは共に、良好な量子化性能を維持しつつ、結果としてメモリと複雑さを削減する。さらに、興味あるアプローチは、多段および分離VQを組み合わせて、さらに複雑さとメモリ要求を削減することである。参照文献、ITU−T勧告G.729「共役構造代数符号励起線形予測(CS−ACELP)を使用する8kbit/sにおける通話符号化(Coding of speech at 8kbit/s using conjugate−structure algebraic−code−excited linear prediction(CS−ACELP))」、1996年3月、ジュネーブでは、LPパラメータベクトルは2段で量子化され、第2段ベクトルは、2つのサブベクトルに分離される。
LPパラメータは、後続するフレーム間に強い相関を示し、これは通常予測量子化の使用により性能の改善に利用される。予測ベクトル量子化では、予測LPパラメータベクトルは、過去のフレームの情報に基づいて計算される。次いで予測ベクトルは入力ベクトルから除去され、予測誤差はベクトル量子化される。2種の予測が通常使用される:自動回帰(AR)予測と移動平均(MA)予測である。AR予測では、予測ベクトルは過去のフレームの量子化ベクトルの組み合わせとして計算される。MA予測では、予測ベクトルは過去のフレームの予測誤差ベクトルの組み合わせとして計算される。AR予測はよりよい性能を呈する。しかしながら、AR予測は、無線およびパケットベースの通信システムにおいて遭遇するフレーム損失の状態に強くない。フレーム損失の場合、予測は以前の不正フレームに基づくので、誤差は後続するフレームに伝搬する。
可変ビットレート(VBR)符号化
幾つかの通信システム、例えば符号分割多重アクセス(CDMA)技術を使用する無線システムでは、ソース制御可変ビットレート(VBR)通話符号化の使用によりシステム容量を大きく改善する。ソース制御VBR符号化では、符号化器は幾つかのビットレートで動作することが出来、レート選択モジュールを使用して、例えば音声、非音声、非定常、背景雑音などの通話フレームの性格に基づいた各通話フレームの符号化に使用するビットレーを決定する。目標は平均データレート(ADR)とも呼ばれる、所与の平均ビットレートにおいて最良の通話品質を達成することにある。符号化器はまた、レート選択モジュールを調節することにより異なる動作モードに従って動作することが出来、異なるモードに対して異なるADRsを達成する、この場合符号化器の性能は、ADRの増加と共に改善される。これは、符号化器に通話品質とシステム容量との間のトレードオフの機構を付与する。CDMAシステム、例えばCDMA−1およびCDMA2000では、代表的に4ビットレートが使用され、フルレート(FR)、半レート(HR)、4分の1レート(QR)、8分の1レート(ER)と呼ばれる。このCDMAシステムでは、2組のレートがサポートされ、レートセットI、レートセットIIと呼ばれる。レートセットIIでは、レート選択機構を持つ可変レート符号化器は、14.4、7.2、3.6および1.8kbit/s(誤り検出のために追加した幾らかのビットを含む)の実ビットレートに対応して13.3(FR)、6.2(HR)、2.7(QR)および1.0(ER)8kbit/sのソース符号化ビットレートで動作する。
適応型マルチレート広帯域(AMR−WB)通話コーデックとして既知の広帯域コーデックは、幾つかの広帯域電話通話およびサービスのためにITU−T(国際通信連合−通信標準化部門(International Telecommunications Union−Telecommunication Standardization Sector))により、そしてGSMおよびW−CDMA(広帯域符号分割多重アクセス)第3世代無線システムのために3GPP(第3世代合同計画)により、最近採択された。AMR−WBコーデックは6.6から23.858kbit/sの範囲の9ビットレートからなる。CDMA2000システムのためのAMR−WBベースのソース制御VBRコーデックの設計には、CDMA2000とAMR−WBコーデックを使用する他のシステム間の相互運用を可能にする利点がある。12.65kbit/sのAMR−WBビットレートは、CDMA2000のレートセットIIの13.3kbit/sフルレートに適合することの出来る最も近いレートである。12.65kbit/sのレートは、CDMA2000広帯域VBRコーデックとAMR−WBコーデック間の共通レートとして使用して、通話品質を劣化させる符号変換を行わない相互運用性を可能にすることが出来る。レートセットIIの枠組みにおける効率的運用を可能にするためには、6.2kbit/sの半レートを追加する必要がある。得られるコーデックは、少数のCDMA2000に特有のモードで動作することが出来、AMR−WBコーデックを使用するシステムとの相互運用性を可能にするモードを組み込む。
半レート符号化は、入力通話信号が安定なフレームにおいて代表的に選ばれる。符号化パラメータの更新頻度を少なくする、あるいはこれら符号化パラメータの幾つかの符号化に使用するビットを少なくすることにより、フルレートと比較したビットの節減が達成される。より詳細には、安定な音声セグメントにおいては、ピッチ情報はフレーム毎に1度だけ符号化され、より少ないビットを使用して固定符号帳パラメータおよび線形予測計数を表現する。
MA予測による予測VQは、線形予測計数の符号化に代表的に適用されるので、量子化雑音の不要な増加がこれら線形予測計数に観測することが出来る。AR予測に反して、MA予測は、フレーム損失に対する強固さを増すために使用される;しかしながら、安定なフレームでは、線形予測係数はゆっくりと変化するので、この特種なケースにAR予測を使用すれば、フレームが失われる場合の誤差の伝搬への影響はより少なくなる。これは、フレームが失われる場合、大部分のデコーダが、最後のフレームの線形予測係数を本質的に外挿する隠蔽処理を適用することを見れば理解できる。もし失われるフレームが安定な音声であれば、この外挿により実際に送信したが、受信されなかったLPパラメータに極めて似た価値を生じる。再構成LPパラメータベクトルは、従ってフレームが失われなかった場合にデコードされるものに近い。この特種な場合には、それ故線形予測係数の量子化過程にAR予測を使用しても量子化誤差の伝搬に極めて不利な影響があることはあり得ない。
ITU−T勧告G.722.2「適応型マルチレート広帯域(AMR−WB)を使用する大凡16kbit/sにおける通話の広帯域符号化」(Wideb and coding of speech at around 16kbit/s using adaptive multi−rate wideband(AMR−WB)、2002年、ジュネーブ ITU−T勧告G.729「共役構造代数符号励起線形予測(CS−ACELP)を使用する8kbit/sにおける通話符号化(Coding of speech at 8kbit/s using conjugate−structure algebraic−code−excited linear prediction(CS−ACELP))」、1996年3月、ジュネーブ
本発明によれば、可変ビットレートの音声信号の符号化における線形予測パラメータの量子化方法が提供され、本方法は入力線形予測パラメータベクトルする受信する工程、前記入力線形予測パラメータベクトルに対応する音声信号フレームを分類する工程、予測ベクトルを計算する工程、前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する工程、前記予測誤差ベクトルをスケーリングする工程、および前記スケーリングした予測誤差ベクトルを量子化する工程を含む。予測ベクトルを計算する工程は、前記音声信号フレームの分類に関連する複数の予測方式の1つを選択する工程、および前記選択した予測方式に従って前記予測ベクトルを計算する工程を含む。前記予測誤差ベクトルをスケーリングする工程は、前記選択した予測方式に関連する複数のスケーリング方式の少なくとも1つを選択する工程、および前記選択したスケーリング方式に従って前記予測誤差ベクトルをスケーリングする工程を含む。
また本発明によれば、可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置が提供され、本装置は、入力線形予測パラメータベクトルを受信する手段、前記入力線形予測パラメータベクトルに対応する音声信号フレームを分類する手段、予測ベクトルを計算する手段、前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する手段、前記予測誤差ベクトルをスケーリングする手段、および前記スケーリングした予測誤差ベクトルを量子化する手段を含む。予測ベクトルを計算する手段は、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する手段、および前記選択した予測方式に従って前記予測ベクトルを計算する手段を含む。また、前記予測誤差ベクトルをスケーリングする手段は、前記選択した予測方式に関連する複数のスケーリング方式の少なくとも1つを選択する手段、および前記選択したスケーリング方式に従って前記予測誤差ベクトルをスケーリングする手段を含む。
本発明はまた、可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置に関連し、本装置は、入力線形予測パラメータベクトルを受信する入力、前記入力線形予測パラメータベクトルに対応する音声信号フレームの分類器、予測ベクトル計算機、前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する減算器、前記予測誤差ベクトルの供給を受け、前記予測誤差ベクトルのスケーリングを行うスケーリングユニット、および前記スケーリングした予測誤差ベクトルの量子化器を含む。前記予測ベクトル計算機は、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する選択器を含み、前記選択した予測方式に従う前記予測ベクトルの計算を行う。前記スケーリングユニットは、前記選択した予測方式に関連する複数のスケーリング方式の少なくとも1つを選択する選択器を含み、前記選択したスケーリング方式に従う予測誤差ベクトルのスケーリングを行う。
本発明はさらに、可変ビットレートの音声信号の符号化解除における線形予測パラメータの量子化解除方法に関連し、本方法は、少なくとも1つの量子化指標を受信する工程、前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報を受信する工程、少なくとも1つの量子化テーブルに少なくとも1つの指標を適用することによって予測誤差ベクトルを回復する工程、予測ベクトルを再構成する工程、および前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する工程を含む。予測ベクトル再構成は、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する工程を含む。
本発明はなおさらに、可変ビットレートの音声信号の符号化解除における線形予測パラメータの量子化解除装置に関連し、本装置は、少なくとも1つの量子化指標を受信する手段、前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報を受信する手段、少なくとも1つの量子化テーブルに少なくとも1つの指標の適用することによって予測誤差ベクトルを回復する手段、予測ベクトルを再構成する手段、および前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する手段を含む。予測ベクトルを再構成する手段は、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する手段を含む。
本発明の最後の態様によれば、可変ビットレートの音声信号の符号化解除における線形予測パラメータの量子化解除装置が提供され、本装置は、少なくとも1つの量子化指標を受信する手段、前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報を受信する手段、前記少なくとも1つの量子化指標の供給を受け、予測誤差ベクトルを回復する少なくとも1つの量子化テーブル、予測ベクトルを再構成するユニット、および前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルの生成器を含む。前記予測ベクトルを再構成するユニットは、回復予測誤差ベクトルの供給を受けて、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する少なくとも1つの予測器を含む。
本発明の前記および他の目的、利点および特徴は、添付する図面を参照することのみにより、実施例により与えられる本発明を例証する実施形態の以下の非限定的説明を読めば、一層明らかになる。
実施例の詳細な説明
通話信号への適用に関連して以下に本発明を例証する実施形態を説明するが、本発明はまた、他のタイプの音声信号へも適用可能であることを記憶に留めておくべきである。
大部分の最近の通話符号化技術は、CELP符号化などの線形予測解析に基づいている。LPパラメータを計算し、10−30msのフレームに量子化する。本例証的実施形態では、20msのフレームを使用し、16のLP解析次数を想定する。通話符号化システムにおけるLPパラメータの計算例は、非特許文献1に見られる。この説明例では、事前処理された通話信号に窓を設け、窓を開けた通話の自動相関を計算する。次いで、レビンソンーダービン(Levinson−Durbin)循環を使用して、自動相関R(k)、k=0、...、M、Mは予測次数から線形予測係数a、i=1、...、Mを計算する。
線形予測係数aはデコーダへの送信のために直接量子化することは出来ない。その理由は、線形予測係数に関する小さな量子化誤差がLPフィルタの変換関数の大きなスペクトラム誤差を生じる可能性があり、フィルタの不安定化さえも誘起する可能性がある、ということである。従って量子化に先だって、線形予測係数aに変換を適用する。変換によって、線形予測係数の所謂表現を生成する。量子化し、変換された線形予測係数を受信後、デコーダは、次いで逆変換を適用して、量子化線形予測係数を得る。線形予測係数aに広く使用される1つの表現は、線スペクトルの組(LSP)としても既知の線スペクトル周波数(LSF)である。LSFsの計算の詳細は、非特許文献2に見ることが出来る。LSFsは以下の多項式の極からなる:
Figure 0004394578
および
Figure 0004394578
Figure 0004394578
て、多項式を以下のように書くことが出来る:
Figure 0004394578
および
Figure 0004394578
上式で、q=cos(w)であり、wは順序特性0<w<w<...<w<πを満たす線スペクトル周波数(LSF)である。この特別な例では、LSFsはLP(線形予測)パラメータを構成する。
類似の表現は、イミタンススペクトルの組(ISP)あるいはイミタンススペクトル周波数(ISF)であり、これはAMR−WB符号化標準において使用されている。ISFsの計算の詳細は、非特許文献1に見ることが出来る。他の表現も可能であり、使用されている。一般性を失うことなく、以下の説明で、非制限、例証的実施例としてISF表現のケースを考慮する。
Mが偶数である、M次順位LPフィルタに対して、ISPsを以下の多項式の根として定義する:
Figure 0004394578
および
Figure 0004394578
Figure 0004394578
共役根をそれぞれ有する。従って、多項式を以下のように書くことが出来る:
Figure 0004394578
および
Figure 0004394578
上式で、q=cos(w)であり、wはイミタンススペクトル周波数(ISF)であり、a最後の線形予測係数である。ISFsは順序特性0<w<w<...<wM−1<πを満たす。この特別な例では、LSFsはLP(線形予測)パラメータを構成する。従ってISFsは、最後の線形予測係数に加えて、M−1の周波数からなる。本例証的実施形態においては、ISFsは、0からf/2の範囲の周波数にマップされるが、ここでfは以下の関係を利用するサンプル周波数である:
Figure 0004394578
および
Figure 0004394578
LSFsおよびISFs(LPパラメータ)は、量子化目的に適合させる幾つかの特性の故に広く使用されている。これらの特性の中では、動作範囲が良く定義されており、そのスムースな変化によりフレーム間およびフレーム内の強い相関が得られ、順序特性の存在により量子化LPフィルタの安定性が保証される。
本明細書では、用語「LPパラメータ」をLP係数、例えばLSF、ISF、平均除去LSFあるいは平均除去ISFの表現を意味するのに使用する。
次に、ISFs(LP(線形予測)パラメータ)の主要な特性を説明し、使用する量子化手法を理解するようにする。図7に、ISF係数の確率分布関数(PDF)の代表例を示す。各曲線は個々のISF係数のPDFを表す。各分布の平均値を水平軸に示す(μ)。例えば、ISFの曲線は、フレームの第1のISF係数が取りうる全ての値をその生起確率により示す。ISFの曲線は、フレームの第2のISF係数が取りうる全ての値をその生起確率により示す、などである。PDF関数は、幾つかの連続フレームを通じた観測において所与の係数が取る値にヒストグラムを適用することにより代表的に得られる。それぞれのISF係数が全ての可能なISFの値に対して制限された値の幅を占めることが見て取れる。これにより量子化器がカバーすべき空間が効率的に削減され、ビットレートの効率を高める。ISF係数のPDFsが重なりうる一方、所与のフレームのISF係数は常に順序づけられていることに注目することが重要である(ISFk+1−ISF>0、kはISF係数のベクトル内におけるISF係数の位置である)。
通話符号化器において代表的な10−30msのフレーム長により、ISF係数はフレーム間相関を示す。図8に、通話信号のフレームに亘るISF係数の変化を示す。図8は、音声および非音声両フレームを含む通話セグメントの20msの連続30フレームに亘るLP解析を実行することにより得られた。LP係数(フレーム当たり16)をISF係数に変換した。図8は、ISFsが常に順序づけられていることを意味する、線が互いに決して交わらないことを示す。図8はまた、フレームレートに比較して、ISF係数が典型的にゆっくりと変化することを示す。これは実際に、予測量子化を適用して量子化誤差を削減することが出来ることを意味する。
図3は、自動回帰(AR)予測を使用する予測ベクトル量子化器300の実施例を示す。図3に示すように、予測誤差ベクトルeは、量子化すべき入力LPパラメータベクトルxから予測ベクトルpを減算する(プロセッサ301)ことによりまず得られる。ここで、記号nは、フレームの時間指標を意味する。予測ベクトルpは、過去に量子化さ
Figure 0004394578
により計算される。次に、予測誤差ベクトルeが量子化され(プロセッサ303)、例
Figure 0004394578
を加算する(プロセッサ304)ことにより得られる。予測器P(プロセッサ302)の一般形は以下の通りである:
Figure 0004394578
上式で、Aは次元MxMの予測マトリックスで、Kは予測器の次数である。予測器P(プロセッサ302)の単純形は、第1次予測を使用することである:
Figure 0004394578
上式で、Aは次元MxMの予測マトリックスで、MはLPパラメータベクトルxの次元である。予測マトリックスAの単純形は、対角線要素α、α、...、αを持つ対角線マトリックスであり、αは個々のLPパラメータの予測ファクタである。もし全てのLPパラメータに同じファクタαが使用されれば、その場合式(2)は以下になる:
Figure 0004394578
次に、図3において式(3)の単純な予測形式を使用して、量子化LPパラメータベクト
Figure 0004394578
Figure 0004394578
式(4)の循環形式は、図3に示すような形のAR予測量子化器300を使用する場合、チャネル誤りは、幾つかのフレームに亘って伝搬することを意味する。もし式(4)を以下の数学的に等価な形に書けば、これをさらに容易に理解することが出来る:
Figure 0004394578
Figure 0004394578
では同じではない。予測器Pの循環性の故に、この符号化器−デコーダの不一致は先々伝
Figure 0004394578
を与える。それ故、特に予測ファクタが大きい(式(4)および(5)にいてαが1に近い)場合、予測ベクトル量子化はチャネル誤りに対して強くない。
この伝搬問題を軽減するために、AR予測の代わりに移動平均(MA)予測を使用することが出来る。MA予測では、式(5)の無限級数の端を切って、有限数の項とする。この考え方では、式(5)において少数の項を使用することにより式(4)における予測器Pの自動回帰形式に近似させる。総和の加重値を変更して、式(4)の予測器Pにより良く近似できることに注目されたい。
図4に、MA予測ベクトル量子化器400の非制限的実施例を示すが、プロセッサ401、402、403および404はそれぞれプロセッサ301、302、303および304に対応する。予測器P(プロセッサ402)の一般形は以下の通りである:
Figure 0004394578
上式で、Bは次元MxMの予測マトリックスであり、Kは予測器の次数である。MA予測では、伝送誤りは次のKフレームにのみ伝搬することに注目すべきである。
予測器P(プロセッサ402)の単純形は、第1次予測を使用することである:
Figure 0004394578
上式で、Bは次元MxMの予測マトリックスであり、MはLPパラメータベクトルの次元である。予測マトリックスの単純形は、対角線要素β、β、...、βを持つ対角線マトリックスであり、βは個々のLPパラメータの予測ファクタである。もし全てのLPパラメータに同じファクタβが使用されれば、その場合式(6)は以下になる:
Figure 0004394578
次いで、図4において式(7)の単純な予測形式を使用すると、量子化LPパラメータベ
Figure 0004394578
Figure 0004394578
図4に示すようなMA予測を使用する予測ベクトル量子化器400を説明する実施例で
Figure 0004394578
測器P(プロセッサ402)の次数である。式(8)を説明する予測器の実施例においては、第1次予測が使用され、その結果MA予測誤差はただ1フレームにのみ伝搬しうるに過ぎない。
AR予測より伝送誤りにより強い一方、MA予測は所与の予測次数に対して同じ予測利得に達しない。予測誤差は、従ってより広い動作範囲を持ち、同じ符号化利得を得るためにAR予測量子化によるより、より多くのビットを必要とする可能性がある。従って、妥協点は、所与のビットレートにおけるチャネル誤りに対する強さ対符号化利得である。
ソース制御可変ビットレート(VBR)符号化では、符号化器は幾つかのビットレートで動作し、レート選択モジュールを使用して、通話フレーム、例えば音声、非音声、非定常、背景雑音の性質に基づいて各通話フレームの符号化に使用するビットレートを決定すする。通話フレーム、例えば音声、非音声、非定常、背景雑音などの性質は、CDMAVBRの場合と同じように決定することが出来る。目標は平均データレート(ADR)とも呼ばれる、所与の平均ビットレートにおいて最良の通話品質を達成することにある。例証的実施例としてCDMAシステム、例えばCDMA−1およびCDMA2000では、代表的に4つのビットレートが使用され、フルレート(FR)、半レート(HR)、4分の1レート(QR)、8分の1レート(ER)と呼ばれる。このCDMAシステムでは、2組のレートがサポートされ、レートセットI、レートセットIIと呼ばれる。レートセットIIでは、レート選択機構を持つ可変レート符号化器は、13.3(FR)、6.2(HR)、2.7(QR)および1.0(ER)kbit/sのソース符号化ビットレートで動作する。
VBR符号化では、分類およびレート選択機構を使用して、通話フレームをその性質(音声、非音声、非定常、雑音、など)に従って分類し、分類と要求される平均データレート(ADR)に従ってフレームの符号化に必要なビットレートを選択する。半レート符号化は、入力通話信号が安定なフレームにおいて代表的に選ばれる。符号化器パラメータの更新頻度を少なくする、あるいはあるパラメータの符号化に使用するビットを少なくすることにより、フルレートと比較したビットの節減が達成される。さらに、これらのフレームは、ビットレートの削減に利用可能な強い相関を示す。より詳細には安定な音声セグメントにおいては、ピッチ情報はフレームにおいて1度だけ符号化され、固定符号帳およびLP計数により少ないビットを使用する。非音声フレームでは、ピッチ予測は必要ではなく、励起はHRの小さなコード帳あるいはQRのランダム雑音によりモデル化される。
MA予測によるVQ予測は、LPパラメータの符号化に典型的に適用されるので、これにより量子化雑音が不必要に増加することになる。AR予測に反して、MA予測は、フレーム損失に対する強固さを増すために使用される;しかしながら、安定なフレームでは、LPパラメータはゆっくりと変化するので、このケースにAR予測を使用すれば、フレームが失われる場合の誤差伝搬への影響はより少なくなる。これは、フレームが失われる場合、大部分のデコーダが、最後のフレームのLPパラメータを本質的に外挿する隠蔽処理を適用することを見れば検出される。もし失われるフレームが安定な音声であれば、この外挿により実際に送信したが、受信されなかったLPパラメータに極めて似た値を生む。再構成LPパラメータベクトルは、従ってフレームが失われなかった場合にデコードされるものに近い。この特種な場合には、LP係数の量子化過程にAR予測を使用しても量子化誤差の伝搬に極めて不利な影響があることはあり得ない。
従って、本発明の非制限、例証的実施形態によれば、LPパラメータの予測VQ法(predictive VQ method)が開示され、そこでは、処理する通話フレームの性質に従い、予測器がMAおよびAR予測の間で切り替えられる。より詳細には、安定なフレームではAR予測が使用される一方、非定常および非安定なフレームではMA予測が使用される。さらにAR予測はMA予測よりより狭いダイナミックレンジを持つ予測誤差ベクトルe をもたらすので、両方のタイプの予測に同じ量子化テーブルを使用するのは効率的ではない。この問題を克服するために、AR予測の後、予測誤差ベクトルを適切にスケーリングして、MA予測の場合と同じ量子化テーブルを使用して予測誤差ベクトルが量子化されうるようにする。多段VQを使用して予測誤差ベクトルを量子化する場合、正しいAR予測誤差ベクトルを適切にスケーリングした後、両タイプの予測に第1段を使用することが出来る。第2段では、多くのメモリを要求しない分離VQ(split VQ)を使用すれば十分であるので、この第2段の量子化テーブルは学習させることができ、両タイプの予測に対して個別に設計することが出来る。勿論、第1段の量子化テーブルをMA予測により設計し、AR予測誤差ベクトルをスケーリングする代わりに、反対もまた有効である、即ち第1段をAR予測のために設計、量子化に先だってMA予測誤差ベクトルがスケーリングされるようにすることができる
従って、本発明の非制限且つ例証的実施形態によれば、可変ビットレート通話コーデックにおけるLPパラメータの量子化のための予測ベクトル量子化法も開示され、そこでは、処理する通話フレームの性質に関する分類情報に従い、予測器PMAおよびAR予測の間で切り替えられ、かつその際予測誤差ベクトルが適切にスケーリングされ、予測誤差の多段VQにおける同じ第1段量子化テーブルが両方のタイプの予測に使用されうる。
図1に、2段ベクトル量子化器100の非制限的実施例を示す。量子化器Q1(プロセ
Figure 0004394578
プロセッサ102)、第2段VQ(プロセッサ103)により、さらに誤差ベクトルx
Figure 0004394578
図2に、分離ベクトル量子化器200を説明する実施例を示す。次元Mの入力ベクトルxが、次元N、N、...、NのK個のサブベクトルに分離され、ベクトル量子化器Q、Q、...、Qによりそれぞれ量子化される(プロセッサ201.1、201.2...2
Figure 0004394578
ベクトル量子化の効率的手法は、多段および分離VQの両方を結合することであり、これにより品質と複雑さの良好なトレードオフが得られる。第1の例証的実施例では、2段
Figure 0004394578
分離され、第2段量子化器Q21、Q22、...、Q2Kによりそれぞれ量子化される。第2の例証的実施例では、入力ベクトルは2つのサブベクトルに分離され、次いで各サブベクトルは、第1の例証的実施例におけるように第2段における分離をさらに使用する2段VQにより量子化される。
図5に、本発明に従い、切り替え予測ベクトル量子化器500を説明する非制限的実施例の概要ブロック図を示す。まず、平均LPパラメータμのベクトルが入力LPパラメータベクトルzから除去され、平均除去LPパラメータベクトルxを生成する(プロセッサ501)。以前の説明で示したように、LPパラメータベクトルは、LSFパラメータ、ISFパラメータ、あるいは任意の他の関連するLPパラメータ表現のベクトルであり得る。入力LPパラメータベクトルzから平均LPパラメータμを除去することは任意であるとはいえ、それによって予測性能は改善する。もしプロセッサ501を用いることができなければ、平均除去LPパラメータベクトルxは入力LPパラメータベクトルzと同じである。図3および図4で使用するフレーム指標nは、ここでは単純化の目的のために省略する。次いで、予測ベクトルpが計算され、平均除去LPパラメータベクトルxから除去され、予測誤差ベクトルeを生成する(プロセッサ502)。次いで、フレーム分類情報に基づいて、もし入力LPパラメータベクトルzに対応するフレームが安定な音声であれば、AR予測が使用され、誤差ベクトルeはあるファクタによりスケーリングされ(プロセッサ503)、スケーリングされた予測誤差ベクトル(スケーリング予測誤差ベクトル)e'を生成する。もしフレームが安定な音声でなければ、MA予測が使用され、スケーリングファクタ(プロセッサ503)は1に等しい。フレーム、例えば音声、非音声、非定常、背景雑音などの分類、例えばCDMA VBRに対する方法と同じように判定することが出来る。スケーリングファクタは典型的には1より大きく、予測誤差ベクトルのダイナミックレンジを広くスケーリングすることになる。その結果MA予測に対して設計された量子化器により予測誤差ベクトルが量子化されうる。スケーリングファクタの値は、MAおよびAR予測に使用する係数に依存する。非制限的な代表値は:MA予測係数β=0.33及びAR予測係数α=0.65に対してスケーリングファクタ=1.25である。もしAR予測用に量子化器が設計されれば、その場合反対の操作が行われる。すなわち、1より小さいスケーリングファクタによって、MA予測による予測誤差ベクトルがスケーリングされる
次いでスケーリング予測誤差ベクトルe’が、ベクトル量子化され(プロセッサ50
Figure 0004394578
サ508は2段ベクトル量子化器からなり、両段において分離VQが使用され、第1段のベクトル量子化テーブルは、MAおよびAR両予測に対して同じである。2段ベクトル量子化器508は、プロセッサ504、505、506、507、および509からなる。第1段量子化器Q1では、スケーリング予測誤差ベクトルe’が量子化され、第1段量
Figure 0004394578
グ予測誤差ベクトルe’から除去され(プロセッサ505)、第2段予測誤差ベクトルeを生成する。次いでこの第2段予測誤差ベクトルeは、第2段ベクトル量子化器QMAあるいは第2段ベクトル量子化器QARのいずれかにより量子化され(プロセッサ506)、
Figure 0004394578
選択は、フレーム分類情報に依存する(例えば以前に示したように、もしフレームが安定な音声ならAR、もしフレームが安定な音声でないならMA)。量子化スケーリング予測
Figure 0004394578
再構成される(プロセッサ509)。最後に、プロセッサ503のスケーリングの逆のス
Figure 0004394578
り、両段で分離VQが使用される。量子化器Q1および量子化器QMAまたは量子化器QARからの量子化指標iおよびiは乗算され、通信チャネルを介して伝送される(プロセッサ507)。
予測ベクトルpは、フレーム分類情報に依存して(例えば以前に示したように、もしフレームが安定な音声ならAR、もしフレームが安定な音声でないならMA)MA予測器(プロセッサ511)あるいはAR予測器(プロセッサ512)のいずれかにおいて計算される。次いでもしフレームが安定な音声なら、予測ベクトルはAR予測器512の出力に等しい。そうでなければ、予測ベクトルはMA予測器511の出力に等しい。以前に説明したように、AR予測器512が前のフレームからの量子化入力LPパラメータベクトルを操作する一方、MA予測器511は前のフレームからの量子化予測誤差ベクトルを操作
Figure 0004394578
図6は、本発明によるデコーダにおける切り替え予測ベクトル量子化器600の例証的実施形態を示す概略ブロック図である。デコーダ側で、受信量子化指標の組iおよびiが量子化テーブル(プロセッサ601および602)により使用され、第1段および第
Figure 0004394578
説明したように、第2段量子化(プロセッサ602)はMAおよびAR予測に対する2組のテーブルからなることに注目されたい。次いで、2段からの量子化予測誤差ベクトルの
Figure 0004394578
構成される。プロセッサ609において、逆スケーリングが適用され、量子化予測誤差ベ
Figure 0004394578
ロセッサ503により実行されるスケーリングの逆に相当することに注目されたい。次い
Figure 0004394578
平均LPパラメータのベクトルμが符号器側で除去された場合、ベクトルμはプロセッサ
Figure 0004394578
化器側の場合のように、フレーム分類情報に依存して、予測ベクトルpはMA予測器605の出力あるいはAR予測器606の出力のいずれかである;この選択はフレーム分類情報に対応してプロセッサ607の論理に従ってなされる、ことに注意すべきである。より詳細には、もしフレームが安定な音声であれば、その場合予測ベクトルpはAR予測器606の出力に等しい。そうでない場合、予測ベクトルpはMA予測器605の出力に等しい。
勿論、MA予測器あるいはAR予測器のいずれかの出力のみが一定のフレームにおいて使用されるのは事実であるが、MA予測器あるいはAR予測器のいずれかが次のフレームにおいて使用されうることを想定して、両予測器のメモリはフレーム毎に更新される。これは符号化器およびデコーダ側の両側に当てはまる。
符号化利得を最適化するために、MA予測に設計された第1段の幾つかのベクトルは、AR予測に設計された新しいベクトルにより置き換えることが出来る。非制限、例証的実施形態では、第1段コード帳のサイズは256であり、12.65kbit/sのAMR−WB標準におけるのと同じ内容を有し、AR予測を使用する場合、第1段コード帳において28ベクトルが置き換えられる。従って、拡張第1段コード帳は次のように形成される:まず、AR予測を適用する場合余り使用されないが、MA予測に使用しうる28の第1段ベクトルがテーブルの始めに配置され、次いでARおよびMA両予測に使用可能な残りの256−28=228の第1段ベクトルがテーブルに追加され、最後にAR予測に使用可能な28の新しいベクトルがテーブルの末尾に置かれる。テーブル長は、従って256+28=284ベクトルである。MA予測を使用する場合、テーブルの最初の256ベクトルは第1段で使用される;AR予測を使用する場合、テーブルの最後の256ベクトルが使用される。AMR−WB標準との相互運用性を保証するために、この新コード帳における第1段ベクトルの位置とAMR−WB第1段コード帳における元の位置との間のマッピングを含むテーブルが使用される。
要約すると、図5および図6に関して説明した、上述の本発明の非制限、例証的実施形態は以下の特徴を提示する:
・ 現通話フレームの性質に依存する、可変レート符号化器の符号化モードに依存してAR/MA切り替え型の予測方式が使用される。
・ ARあるいはMA予測のいずれが適用されようとも、本質的に同じ第1段量子化器が使用され、これによりメモリの節減が得られる。非制限、例証的実施形態では、16次のLP予測が使用され、LPパラメータはISF領域で表現される。第1段のコード帳は、MA予測を使用して設計されたAMR−WB符号化器の12.65kbit/sモードにおいて使用されるコード帳と同じである(16次元LPパラメータベクトルは、次元7および9の2つのサブベクトルに分離され、量子化の第1段において256エントリを有する2つのコード帳が使用される)。
・ 安定モード、特に半レート音声モードではMA予測の代わりにAR予測が使用されそうでない場合MA予測が使用される。
・ AR予測の場合、量子化器の第1段はMA予測の場合と同じである。しかしながら、第2段は、AR予測に適切となるように設計され学習させることが出来る。
・ 予測器モードにこの切り替えを考慮に入れるために、MAおよびARの両予測が次のフレームに使用されうることを想定して、MAおよびARの両予測のメモリがフレーム毎に更新される。
・ さらに、符号化利得の最適化のために、MA予測に設計された第1段の幾つかのベクトルは、AR予測に設計された新ベクトルによって置き換えることが出来る。この非制限、例証的実施形態によれば、AR予測を使用する場合、28個のベクトルが第1段コード帳において置き換えられる。
この拡張第1段コード帳は以下のように形成することが出来る:まず、AR予測を適用する場合は余り使用されない28の第1段ベクトルがテーブルの始めに配置され、次いで残りの256−28=228の第1段ベクトルがテーブルに配置され、最後に28の新しいベクトルがテーブルの末尾に置かれる。テーブル長は、従って256+28=284ベクトルである。MA予測を使用する場合、テーブルの 最初の256個のベクトル第1段で使用される;AR予測を使用する場合、テーブルの最後の256個のベクトルが使用される。
・ AMR−WB標準との相互運用性を保証するために、この新コード帳における第1段ベクトルの位置とAMR−WB第1段コード帳における元の位置との間のマッピングを含むテーブルが使用される。
・ 安定な信号に関して使用する場合、AR予測はMA予測よりより少ない予測誤差エネルギーを達成するので、スケーリングファクタが予測誤差に適用される。非制限、例証的実施形態では、MA予測が使用される場合スケーリングファクタは1であり、AR予測が使用される場合は1/0.8である。これはAR予測誤差をMA予測誤差と等しいダイナミックレンジに拡大する。従って、第1段において、MAおよびARの両予測方式に対して同じ量子化器が使用されうる。
上記の説明では本発明の非制限、例証的実施形態に関連して、本発明を説明したが、本発明の性質と範囲から逸脱することなく添付の請求範囲内において、これらの実施形態は随意に変更することが出来る。
多段ベクトル量子化器の非制限的実施例を説明する概略ブロック図である。 分離ベクトルベクトル量子化器の非制限的実施例を説明する概略ブロック図である。 自動回帰(AR)予測を使用する予測ベクトル量子化器の非制限的実施例を説明する概略ブロック図である。 移動平均(MR)予測を使用する予測ベクトル量子化器の非制限的実施例を説明する概略ブロック図である。 本発明の非制限、例証的実施形態による符号化器における切り替え予測ベクトル量子化器の実施例の概略ブロック図である。 本発明の非制限、例証的実施形態による符号化解除器における切り替え予測ベクトル量子化器の実施例の概略ブロック図である。 周波数へのISFsの分布の非制限、例証的実施例であり、ここで各分布はISFベクトルの所与の位置にISFを見つける確率関数である。 後続通話フレームによるISFパラメータの変化の代表例を示すグラフである。

Claims (57)

  1. 可変ビットレートの音声信号の符号化における線形予測パラメータの量子化方法であって、
    入力線形予測パラメータベクトルを受信する段階、
    前記入力線形予測パラメータベクトルに対応する音声信号フレームを、安定な音声フレームか安定でない音声フレームかに分類する段階、
    予測ベクトルを計算する段階、
    前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する段階、
    前記予測誤差ベクトルをスケーリングする段階、
    前記スケーリングした予測誤差ベクトルを量子化する段階、
    を含み、
    ・ 前記予測ベクトルを計算する段階は、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する段階、および該選択した予測方式に従って該予測ベクトルを計算する段階を含み、
    ・ 前記予測誤差ベクトルをスケーリングする段階は、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも1つを選択する段階、および該選択したスケーリングファクタに従って該予測誤差ベクトルをスケーリングする段階を含む、量子化方法。
  2. 請求項1に記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
    前記選択した予測方式を使用し、少なくとも1つの量子化器によって前記予測誤差ベクトルを処理する段階、
    を含む、量子化方法。
  3. 請求項1または2に記載の線形予測パラメータの量子化方法であって、
    前記複数の予測方式が、移動平均予測および自己回帰予測を含む、
    量子化方法。
  4. 請求項1から3のいずれかに記載の線形予測パラメータの量子化方法であって、さらに、
    平均線形予測パラメータのベクトルを生成する段階、および
    前記入力線形予測パラメータベクトルから前記平均線形予測パラメータのベクトルを除去し、平均除去線形予測パラメータベクトルを生成する段階、
    を含む、量子化方法。
  5. 請求項1から4のいずれかに記載の線形予測パラメータの量子化方法であって、
    前記音声信号フレームを分類する段階において、該音声信号フレームが安定な音声フレームであると分類した場合、前記複数の予測方式の1つを選択する段階が、自己回帰予測を選択することを含み、
    前記予測ベクトルを計算する段階が、自己回帰予測によって前記予測誤差ベクトルを計算することを含み、
    前記予測誤差ベクトルをスケーリングする段階が、前記スケーリングファクタを使用して、量子化に先立って該予測誤差ベクトルをスケーリングすることを含む、
    量子化方法。
  6. 請求項1から5のいずれかに記載の線形予測パラメータの量子化方法であって、
    前記音声信号フレームを分類する段階において、該音声信号フレームが安定でない音声フレームであると分類した場合、前記予測ベクトルを計算する段階が、移動平均予測によって前記予測誤差ベクトルを計算することを含む、
    量子化方法。
  7. 請求項1から5に記載の線形予測パラメータの量子化方法であって、前記スケーリングファクタが1より大きい、量子化方法。
  8. 請求項1から6のいずれかに記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
    2段ベクトル量子化過程によって前記予測誤差ベクトルを処理する段階、
    を含む、量子化方法。
  9. 請求項8に記載の線形予測パラメータの量子化方法であって、さらに前記ベクトル量子化過程の前記2段において分離ベクトル量子化を使用する段階を含む、量子化方法。
  10. 請求項3に記載の線形予測パラメータの量子化方法であって、
    前記予測誤差ベクトルを量子化する段階が、第1および第2段を含む2段ベクトル量子化過程によって前記予測誤差ベクトルを処理する段階を含み、かつ
    前記2段ベクトル量子化過程によって前記予測誤差ベクトルを処理することが、移動平均および自己回帰の両予測に対して同一である前記第1段のベクトル量子化テーブルに前記予測誤差ベクトルを適用することを含む、
    量子化方法。
  11. 請求項8または9に記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
    前記2段ベクトル量子化過程の第1段において、前記予測誤差ベクトルを量子化し、第1段量子化予測誤差ベクトルを生成する段階、
    前記予測誤差ベクトルから前記第1段量子化予測誤差ベクトルを除去し、第2段予測誤差ベクトルを生成する段階、
    前記2段ベクトル量子化過程の前記第2段において、前記第2段予測誤差ベクトルを量子化し、第2段量子化予測誤差ベクトルを生成する段階、および
    前記第1段および前記第2段量子化予測誤差ベクトルの和によって量子化した予測誤差ベクトルを生成する段階、
    を含む、量子化方法。
  12. 請求項11に記載の線形予測パラメータの量子化方法であって、前記第2段予測誤差ベクトルを量子化する段階が、
    前記音声信号フレームの前記分類に応じ、移動平均予測量子化器または自己回帰予測量子化器によって前記第2段予測誤差ベクトルを処理すること、
    を含む、量子化方法。
  13. 請求項8,9,11のいずれかに記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
    前記2段ベクトル量子化過程の前記2段に対する量子化指標を生成する段階、
    通信チャネルを介し前記量子化指標を伝送する段階、
    を含む、量子化方法。
  14. 請求項8に記載の線形予測パラメータの量子化方法であって、
    前記音声信号フレームを分類する段階において、前記音声信号フレームが安定な音声フレームであると分類した場合、前記予測ベクトルを計算する段階が、
    (a)前記第1段および前記第2段量子化予測誤差ベクトルの和によって生成された前記量子化した予測誤差ベクトルと(b)前記計算した予測ベクトルとを加算し、量子化した入力ベクトルを生成する段階、および
    自己回帰予測によって前記量子化した入力ベクトルを生成する段階、
    を含む、量子化方法。
  15. 請求項2に記載の線形予測パラメータの量子化方法であって、
    ・ 前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
    ・ 前記予測誤差ベクトルを量子化する段階が、
    第1段コード帳を含む2段ベクトル量子化器によって前記予測誤差ベクトルを処理する段階を含み、前記第1段コード帳自体が、連続して、
    移動平均予測を適用するときに使用でき、テーブルの始めに配置された第1グループのベクトル、
    移動平均および自己回帰予測のいずれかを適用するときに使用でき、前記テーブルの前記第1グループのベクトルと第3グループのベクトルとの中間に配置された第2グループのベクトル、
    自己回帰予測を適用するときに使用でき、前記テーブルの末尾に配置された前記第3グループのベクトル、
    を含み、
    ・ 前記選択した予測方式を使用して少なくとも1つの量子化器によって前記予測誤差ベクトルを処理する段階が、
    前記選択した予測方式が移動平均予測であるとき、前記テーブルの前記第1および第2グループのベクトルによって前記予測誤差ベクトルを処理する段階、および
    前記選択した予測方式が自己回帰予測であるとき、前記第2および前記第3グループのベクトルによって前記予測誤差ベクトルを処理する段階、
    を含む、量子化方法。
  16. 請求項15に記載の線形予測パラメータの量子化方法であって、AMR−WB標準との相互運用性を保証するために、前記第1段コード帳の前記テーブルにおける第1段ベクトルの位置と前記AMR−WB第1段コード帳における前記第1段ベクトルの元の位置との間のマッピングがマッピングテーブルにより行われる、量子化方法。
  17. 請求項1−6,8,14のいずれかに記載の線形予測パラメータの量子化方法であって、
    前記音声信号フレームを分類する段階において、該音声信号フレームは安定な音声フレームであると分類した場合、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する段階が、自己回帰予測を選択する段階を含み、前記選択した予測方式に従って前記予測ベクトルを計算する段階が、自己回帰予測によって前記予測誤差ベクトルを計算する段階を含み、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも1つを選択する段階が、1より大きいスケーリングファクタを選択する段階を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする段階が、1より大きい前記スケーリングファクタを使用する量子化に先立って前記予測誤差ベクトルをスケーリングする段階を含み、
    前記音声信号フレームを分類する段階において、該音声信号フレームは安定でない音声フレームであると分類した場合、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する段階が、移動平均予測を選択する段階を含み、前記選択した予測方式に従って前記予測ベクトルを計算する段階が、移動平均予測によって前記予測誤差ベクトルを計算する段階を含み、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも1つを選択する段階が、1に等しいスケーリングファクタを選択する段階を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする段階が、1に等しいスケーリングファクタを使用する量子化に先立って前記予測誤差ベクトルをスケーリングする段階を含む、
    量子化方法。
  18. 可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除方法であって、
    少なくとも1つの量子化指標を受信する段階、
    前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する段階、
    少なくとも1つの量子化テーブルに前記少なくとも1つの指標を適用することによって予測誤差ベクトルを回復する段階、
    予測ベクトルを再構成する段階、
    前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する段階、
    を含み、前記予測ベクトルを再構成する段階が、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する段階を含む、量子化解除方法。
  19. 請求項18に記載の線形予測パラメータの量子化解除方法であって、前記予測誤差ベクトルを回復する段階が、
    前記1つの予測方式を使用し、少なくとも1つの量子化テーブルに前記少なくとも1つの指標および前記分類情報を適用する段階、
    を含む、量子化解除方法。
  20. 請求項18または19に記載の線形予測パラメータの量子化解除方法であって、
    前記少なくとも1つの量子化指標を受信する段階が、第1段量子化指標および第2段量子化指標を受信する段階を含み、
    前記少なくとも1つの量子化テーブルに前記少なくとも1つの指標を適用する段階が、第1段量子化テーブルに前記第1段量子化指標を適用し、第1段予測誤差ベクトルを生成する段階、および第2段量子化テーブルに前記第2段量子化指標を適用し、第2段予測誤差ベクトルを生成する段階を含む、
    量子化解除方法。
  21. 請求項20に記載の線形予測パラメータの量子化解除方法であって、
    前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
    前記第2段量子化テーブルが、移動平均予測テーブルおよび自己回帰予測テーブルを含み、
    前記方法が、さらに前記第2段量子化テーブルに前記音声信号フレームの分類を適用し、前記受信したフレームの分類情報に応じ、前記移動平均予測テーブルまたは前記自己回帰予測テーブルによって前記第2段量子化指標を処理する段階を含む、
    量子化解除方法。
  22. 請求項20又は21に記載の線形予測パラメータの量子化解除方法であって、前記予測誤差ベクトルを回復する段階が、
    前記第1段予測誤差ベクトルと前記第2段予測誤差ベクトルとを加え、前記回復した予測誤差ベクトルを生成する段階、
    を含む、量子化解除方法。
  23. 請求項22に記載の線形予測パラメータの量子化解除方法であって、さらに、
    前記回復したフレーム分類情報の関数として、前記回復した予測ベクトルへ逆スケーリング演算を実行する段階、
    を含む、量子化解除方法。
  24. 請求項18から23のいずれかに記載の線形予測パラメータの量子化解除方法であって、前記線形予測パラメータベクトルを生成する段階が、
    前記回復した予測誤差ベクトルと前記再構成した予測ベクトルとを加算し、前記線形予測パラメータベクトルを生成する段階、
    を含む、量子化解除方法。
  25. 請求項24に記載の線形予測パラメータの量子化解除方法であって、さらに、前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに平均線形予測パラメータのベクトルを加算し、前記線形予測パラメータベクトルを生成する段階を含む、量子化解除方法。
  26. 請求項18から20のいずれかに記載の線形予測パラメータの量子化解除方法であって、
    前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
    前記予測ベクトルを再構成する段階が、フレーム分類情報に応じ、前記回復した予測誤差ベクトルを移動平均予測によって処理するかまたは前記生成したパラメータベクトルを自己回帰予測によって処理する段階を含む、量子化解除方法。
  27. 請求項26に記載の線形予測パラメータの量子化解除方法であって、前記予測ベクトルを再構成する段階が、
    前記音声信号フレームが安定な音声であることを前記フレーム分類情報が示すとき、前記生成したパラメータベクトルを自己回帰予測によって処理する段階、および
    前記音声信号フレームが安定な音声でないことをフレーム分類情報が示すとき、前記回復した予測誤差ベクトルを移動平均予測によって処理する段階、
    を含む、量子化解除方法。
  28. 可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置であって、
    入力線形予測パラメータベクトルを受信する手段、
    前記入力線形予測パラメータベクトルに対応する音声信号フレームが安定な音声フレームであるか否かを判断する手段、
    予測ベクトルを計算する手段、
    前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する手段、
    前記予測誤差ベクトルをスケーリングする手段、
    前記スケーリングした予測誤差ベクトルを量子化する手段、
    を含み、
    ・ 予測ベクトルを計算する前記手段が、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する手段、および該選択した予測方式に従って前記予測ベクトルを計算する手段を含み、
    ・ 前記予測誤差ベクトルをスケーリングする手段が、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも1つを選択する手段、および前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする手段を含む、
    量子化装置。
  29. 可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置であって、
    入力線形予測パラメータベクトルを受信する入力部、
    前記入力線形予測パラメータベクトルに対応する音声信号フレームの分類器であって、該音声信号フレームが安定な音声フレームか安定でない音声フレームかを判断しうる分類器
    予測ベクトルの計算機、
    前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する減算器、
    前記予測誤差ベクトルの供給を受け、前記予測誤差ベクトルをスケーリングするスケーリングユニット、および
    前記スケーリングした予測誤差ベクトルの量子化器、
    を含み、
    ・ 前記予測ベクトル計算機が、前記音声信号フレームの前記分類に関連する複数の予測方式から1つを選択する選択器を含み、前記選択した予測方式に従って前記予測ベクトルの計算を行い、
    ・ 前記スケーリングユニットが、前記選択した予測方式に関連する複数のスケーリングファクタから少なくとも1つを選択する選択器を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルのスケーリングを行う、
    量子化装置。
  30. 請求項29に記載の線形予測パラメータの量子化装置であって、
    前記量子化器が、前記予前記測誤差ベクトルの供給を受け、前記選択した予測方式によって前記予測誤差ベクトルを処理する、
    量子化装置。
  31. 請求項29または30に記載の線形予測パラメータの量子化装置であって、
    前記複数の予測方式が、移動平均予測および自己回帰予測を含む、
    量子化装置。
  32. 請求項29から31のいずれかに記載の線形予測パラメータの量子化装置であって、
    平均線形予測パラメータをベクトル生成する手段、および
    前記入力線形予測パラメータベクトルから平均線形予測パラメータの前記ベクトルを除去し、平均除去入力線形予測パラメータベクトルを生成する減算器、
    を含む、量子化装置。
  33. 請求項29から32のいずれかに記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームであると前記分類器が判定するとき、前記予測ベクトル計算機が、
    前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器、
    を含む、量子化装置。
  34. 請求項29から33のいずれかに記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームでないと前記分類器が判定するとき、
    前記予測ベクトル計算機が、前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含む、
    量子化装置。
  35. 請求項29から33に記載の線形予測パラメータの量子化装置であって、前記スケーリングユニットが、
    前記予測誤差ベクトルに1より大きいスケーリングファクタを適用する乗算器、
    を含む、量子化装置。
  36. 請求項29から35のいずれかに記載の線形予測パラメータの量子化装置であって、前記量子化器が、2段ベクトル量子化器を含む、量子化装置。
  37. 請求項36に記載の線形予測パラメータの量子化装置であって、前記2段ベクトル量子化器が、分離ベクトル量子化を使用する前記2段を含む、量子化装置。
  38. 請求項31から37のいずれかに記載の線形予測パラメータの量子化装置であって、
    前記量子化器が、第1段および第2段を含む2段ベクトル量子化器を含み、
    前記2段ベクトル量子化器が、移動平均および自己回帰の両予測に対して同一である第1段量子化テーブルを含む、
    量子化装置。
  39. 請求項36又は37に記載の線形予測パラメータの量子化装置であって、前記2段ベクトル量子化器が、
    前記予測誤差ベクトルの供給を受け、前記予測誤差ベクトルを量子化し、第1段量子化予測誤差ベクトルを生成する第1段ベクトル量子化器、
    前記予測誤差ベクトルから前記第1段量子化予測誤差ベクトルを除去し、第2段予測誤差ベクトルを生成する減算器、
    前記第2段予測誤差ベクトルの供給を受け、前記第2段予測誤差ベクトルを量子化し、第2段量子化予測誤差ベクトルを生成する第2段ベクトル量子化器、および
    第1段および第2段量子化予測誤差ベクトルの和によって量子化した予測誤差ベクトルを生成する加算器、
    を含む、量子化装置。
  40. 請求項39に記載の線形予測パラメータの量子化装置であって、前記2段ベクトル量子化器が、
    移動平均予測を使用して前記第2段予測誤差ベクトルを量子化する移動平均第2段ベクトル量子化器、および
    自己回帰予測を使用して前記第2段予測誤差ベクトルを量子化する自己回帰第2段ベクトル量子化器、
    を含む、量子化装置。
  41. 請求項36,37,39のいずれかに記載の線形予測パラメータの量子化装置であって、前記2段ベクトル量子化器が、
    第1段量子化指標を生成する第1段ベクトル量子化器、
    第2段量子化指標を生成する第2段ベクトル量子化器、および
    通信チャネルを介し、前記第1段および前記第2段量子化指標を送信する送信機、
    を含む、量子化装置。
  42. 請求項39に記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームであると前記分類器が判定するとき、前記予測ベクトル計算機が、
    (a)前記第1段および前記第2段量子化予測誤差ベクトルの和によって生成された前記量子化した予測誤差ベクトルと(b)前記計算した予測ベクトルとを加え、量子化入力ベクトルを生成する加算器、および
    前記量子化した入力ベクトルを処理する自己回帰予測器、
    を含む、量子化装置。
  43. 請求項30に記載の線形予測パラメータの量子化装置であって、
    ・ 前記複数の予想方式が、移動平均予測および自己回帰予測を含み、
    ・ 前記量子化器が、
    第1段コード帳を含む2段ベクトル量子化器を含み、第1段コード帳自体が、連続して、
    移動平均予測を適用するときに使用でき、テーブルの前記始めに配置された第1グループのベクトル、
    移動平均および自己回帰予測のいずれかを適用するときに使用でき、前記テーブルの前記第1グループのベクトルと第3グループのベクトルとの中間に配置された第2グループのベクトル、
    自己回帰予測を適用するときに使用でき、前記テーブルの前記末尾に配置された前記第3グループのベクトル、
    を含み、
    ・ 前記予測誤差ベクトル処理手段が、
    前記選択した予測方式が移動平均予測であるとき、前記テーブルの前記第1および第2グループのベクトルによって前記予測誤差ベクトルを処理する手段、および
    前記選択した予測方式が自己回帰予測であるとき、前記第2および前記第3グループのベクトルによって前記予測誤差ベクトルを処理する手段、
    を含む、量子化装置。
  44. 請求項43に記載の線形予測パラメータの量子化装置であって、さらに、前記AMR−WB標準との相互運用性を保証するために、前記第1段コード帳の前記テーブルにおける第1段ベクトルの前記位置とAMR−WB第1段コード帳における第1段ベクトルの元の位置との間のマッピングを確立するマッピングテーブルを含む、量子化装置。
  45. 請求項31または38に記載の線形予測パラメータの量子化装置であって、
    前記予測ベクトル計算機が、前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器および前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含み、
    前記自己回帰予測あるいは移動平均予測のいずれかが、次のフレームにおいて使用されうることを想定して、前記自己回帰予測器および移動平均予測器が、音声信号のフレーム毎に更新されるメモリをそれぞれ含む、
    量子化装置。
  46. 可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除装置であって、
    少なくとも1つの量子化指標を受信する手段、
    前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する手段、
    少なくとも1つの量子化テーブルに前記少なくとも1つの指標を適用することによって予測誤差ベクトルを回復する手段、
    予測ベクトルを再構成する手段、
    前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する手段、
    を含み、
    前記予測ベクトルを再構成する手段が、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する手段を含む、
    量子化解除装置。
  47. 可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除装置であって、
    少なくとも1つの量子化指標を受信する手段、
    前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する手段、
    前記少なくとも1つの量子化指標の供給を受け、予測誤差ベクトルを回復する少なくとも1つの量子化テーブル、
    予測ベクトルを再構成するユニット、
    前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルの生成器、
    を含み、
    前記予測ベクトル再構成ユニットは、回復した予測誤差ベクトルの供給を受けて、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する少なくとも1つの予測器を含む、
    量子化解除装置。
  48. 請求項47に記載の線形予測パラメータの量子化解除装置であって、前記少なくとも1つの量子化テーブルが、
    前記1つの予測方式を使用し、前記少なくとも1つの指標および前記分類情報の両者の供給を受ける量子化テーブル、
    を含む、量子化解除装置。
  49. 請求項47または48に記載の線形予測パラメータの量子化解除装置であって、
    前記量子化指標受信手段が、第1段量子化指標および第2段量子化指標を受信する2つの入力を含み、
    前記少なくとも1つの量子化テーブルが、第1段予測誤差ベクトルを生成するために、前記第1段量子化指標の供給を受ける第1段量子化テーブルを含み、第2段予測誤差ベクトルを生成するために、前記第2段量子化指標の供給を受ける第2段量子化テーブルを含む、
    量子化解除装置。
  50. 請求項49に記載の線形予測パラメータの量子化解除装置であって、
    前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
    前記第2段量子化テーブルが、移動平均予測テーブルおよび自己回帰予測テーブルを含み、
    前記装置が、さらに前記第2段量子化テーブルに前記音声信号フレームの分類を適用し、前記受信したフレームの分類情報に応じ、前記移動平均予測テーブルまたは前記自己回帰予測テーブルによって前記第2段量子化指標を処理する手段を含む、
    量子化解除装置。
  51. 請求項49又は50に記載の線形予測パラメータの量子化解除装置であって、さらに
    前記第1段予測誤差ベクトルと前記第2段予測誤差ベクトルを加え、前記回復した予測誤差ベクトルを生成する加算器、
    を含む、量子化解除装置。
  52. 請求項51に記載の線形予測パラメータの量子化解除装置であって、さらに、
    前記受信したフレームの分類情報の関数として、前記再構成した予測ベクトルに対し逆スケーリング演算を実行する手段、
    を含む、量子化解除装置。
  53. 請求項47から52のいずれかに記載の線形予測パラメータの量子化解除装置であって、前記線形予測パラメータベクトルの生成器が、
    前記回復した予測誤差ベクトルと前記再構成した予測ベクトルとを加算して、前記線形予測パラメータベクトルを生成する加算器、
    を含む、量子化解除装置。
  54. 請求項53に記載の線形予測パラメータの量子化解除装置であって、さらに、前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに平均線形予測パラメータのベクトルを加算し、前記線形予測パラメータベクトルを生成する手段を含む、量子化解除装置。
  55. 請求項47から49のいずれかに記載の線形予測パラメータの量子化解除装置であって、
    前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
    前記予測ベクトル再構成ユニットが、前記フレーム分類情報に応じ、移動平均予測によって前記回復した予測誤差ベクトルを処理するか、または自己回帰予測によって前記生成したパラメータベクトルを処理する移動平均予測器および自己回帰予測器を含む、
    量子化解除装置。
  56. 請求項55に記載の線形予測パラメータの量子化解除装置であって、前記予測ベクトル再構成ユニットが、
    前記音声信号フレームが安定な音声であることを前記フレーム分類情報が示すとき、前記自己回帰予測器によって前記生成したパラメータベクトルを処理する手段、および
    前記音声信号フレームが安定な音声でないことを前記フレーム分類情報が示すとき、前記移動平均予測器によって前記回復した予測誤差ベクトルを処理する手段、
    を含む、量子化解除装置。
  57. 請求項55又は56に記載の線形予測パラメータの量子化解除装置であって、
    前記少なくとも1つの予測器が、前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器および前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含み、
    移動平均あるいは自己回帰予測のいずれかが次のフレームにおいて使用されうることを想定して、前記自己回帰予測器および移動平均予測器が、音声信号のフレーム毎に更新されるメモリをそれぞれ含む、
    量子化解除装置。
JP2004562408A 2002-12-24 2003-12-18 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 Expired - Lifetime JP4394578B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA002415105A CA2415105A1 (en) 2002-12-24 2002-12-24 A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
PCT/CA2003/001985 WO2004059618A1 (en) 2002-12-24 2003-12-18 Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding

Publications (3)

Publication Number Publication Date
JP2006510947A JP2006510947A (ja) 2006-03-30
JP2006510947A5 JP2006510947A5 (ja) 2009-03-26
JP4394578B2 true JP4394578B2 (ja) 2010-01-06

Family

ID=32514130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004562408A Expired - Lifetime JP4394578B2 (ja) 2002-12-24 2003-12-18 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置

Country Status (16)

Country Link
US (2) US7149683B2 (ja)
EP (1) EP1576585B1 (ja)
JP (1) JP4394578B2 (ja)
KR (1) KR100712056B1 (ja)
CN (1) CN100576319C (ja)
AT (1) ATE410771T1 (ja)
AU (1) AU2003294528A1 (ja)
BR (2) BR0317652A (ja)
CA (1) CA2415105A1 (ja)
DE (1) DE60324025D1 (ja)
HK (1) HK1082587A1 (ja)
MX (1) MXPA05006664A (ja)
MY (1) MY141174A (ja)
RU (1) RU2326450C2 (ja)
UA (1) UA83207C2 (ja)
WO (1) WO2004059618A1 (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
AU2006232364B2 (en) 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
TWI317933B (en) * 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
US9071344B2 (en) * 2005-08-22 2015-06-30 Qualcomm Incorporated Reverse link interference cancellation
US8630602B2 (en) * 2005-08-22 2014-01-14 Qualcomm Incorporated Pilot interference cancellation
US8594252B2 (en) * 2005-08-22 2013-11-26 Qualcomm Incorporated Interference cancellation for wireless communications
US8611305B2 (en) 2005-08-22 2013-12-17 Qualcomm Incorporated Interference cancellation for wireless communications
US8743909B2 (en) * 2008-02-20 2014-06-03 Qualcomm Incorporated Frame termination
US9014152B2 (en) * 2008-06-09 2015-04-21 Qualcomm Incorporated Increasing capacity in wireless communications
US7587314B2 (en) * 2005-08-29 2009-09-08 Nokia Corporation Single-codebook vector quantization for multiple-rate applications
KR100717401B1 (ko) * 2006-03-02 2007-05-11 삼성전자주식회사 역방향 누적 히스토그램을 이용한 음성 특징 벡터의 정규화방법 및 그 장치
GB2436191B (en) * 2006-03-14 2008-06-25 Motorola Inc Communication Unit, Intergrated Circuit And Method Therefor
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
WO2008022181A2 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Updating of decoder states after packet loss concealment
ES2533626T3 (es) 2007-03-02 2015-04-13 Telefonaktiebolaget L M Ericsson (Publ) Métodos y adaptaciones en una red de telecomunicaciones
US20080249783A1 (en) * 2007-04-05 2008-10-09 Texas Instruments Incorporated Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding
JP5300733B2 (ja) * 2007-10-12 2013-09-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
US9277487B2 (en) 2008-08-01 2016-03-01 Qualcomm Incorporated Cell detection with interference cancellation
US9237515B2 (en) * 2008-08-01 2016-01-12 Qualcomm Incorporated Successive detection and cancellation for cell pilot detection
JP5188913B2 (ja) * 2008-09-26 2013-04-24 株式会社エヌ・ティ・ティ・ドコモ 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置
US20100097955A1 (en) * 2008-10-16 2010-04-22 Qualcomm Incorporated Rate determination
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
RU2519027C2 (ru) * 2009-02-13 2014-06-10 Панасоник Корпорэйшн Устройство векторного квантования, устройство векторного обратного квантования и способы для этого
US9160577B2 (en) 2009-04-30 2015-10-13 Qualcomm Incorporated Hybrid SAIC receiver
US8787509B2 (en) * 2009-06-04 2014-07-22 Qualcomm Incorporated Iterative interference cancellation receiver
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
US8831149B2 (en) * 2009-09-03 2014-09-09 Qualcomm Incorporated Symbol estimation methods and apparatuses
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP2013512593A (ja) 2009-11-27 2013-04-11 クゥアルコム・インコーポレイテッド 無線通信における容量の増加
US9509452B2 (en) 2009-11-27 2016-11-29 Qualcomm Incorporated Increasing capacity in wireless communications
CN105374362B (zh) * 2010-01-08 2019-05-10 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及记录介质
DE102010010736A1 (de) * 2010-03-09 2011-09-15 Arnold & Richter Cine Technik Gmbh & Co. Betriebs Kg Verfahren zur Kompression von Bilddaten
EP2372704A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor and method for processing a signal
GB2486663A (en) * 2010-12-21 2012-06-27 Sony Comp Entertainment Europe Audio data generation using parametric description of features of sounds
TWI672691B (zh) 2011-04-21 2019-09-21 南韓商三星電子股份有限公司 解碼方法
MX2013012301A (es) * 2011-04-21 2013-12-06 Samsung Electronics Co Ltd Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos.
JPWO2013061584A1 (ja) * 2011-10-28 2015-04-02 パナソニック株式会社 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法
EP2831757B1 (en) 2012-03-29 2019-06-19 Telefonaktiebolaget LM Ericsson (publ) Vector quantizer
CN103928031B (zh) * 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
CN104112451B (zh) * 2013-04-18 2017-07-28 华为技术有限公司 一种选择编码模式的方法及装置
CN104282308B (zh) 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
EP3637620A1 (en) * 2013-11-07 2020-04-15 Telefonaktiebolaget LM Ericsson (publ) Methods and devices for vector segmentation for coding
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
EP3398191B1 (en) * 2016-01-03 2021-04-28 Auro Technologies Nv A signal encoder, decoder and methods using predictor models
CN105811995A (zh) * 2016-03-04 2016-07-27 广东工业大学 一种减少量化噪声的方法
US10002086B1 (en) * 2016-12-20 2018-06-19 Sandisk Technologies Llc Multi-channel memory operations based on bit error rates
US11343301B2 (en) * 2017-11-30 2022-05-24 Goto Group, Inc. Managing jitter buffer length for improved audio quality

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0286231A (ja) * 1988-09-21 1990-03-27 Matsushita Electric Ind Co Ltd 音声予測符号化装置
JP3254696B2 (ja) * 1991-09-25 2002-02-12 三菱電機株式会社 音声符号化装置、音声復号化装置および音源生成方法
US5614996A (en) * 1994-03-03 1997-03-25 Kyocera Corporation Toner storage unit, residual toner collect unit, toner container with these units and image forming apparatus with such toner container
JPH10505718A (ja) * 1994-08-18 1998-06-02 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー オーディオ品質の解析
JPH0863198A (ja) * 1994-08-22 1996-03-08 Nec Corp ベクトル量子化器
KR100322706B1 (ko) * 1995-09-25 2002-06-20 윤종용 선형예측부호화계수의부호화및복호화방법
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
KR100938017B1 (ko) * 1997-10-22 2010-01-21 파나소닉 주식회사 벡터 양자화 장치 및 방법
EP0920204B1 (en) * 1997-11-24 2006-02-15 STMicroelectronics S.r.l. MPEG-2 decoder with reduced RAM requisite by recompression using adaptive tree search vector quantization
US6141640A (en) * 1998-02-20 2000-10-31 General Electric Company Multistage positive product vector quantization for line spectral frequencies in low rate speech coding
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP3578933B2 (ja) * 1999-02-17 2004-10-20 日本電信電話株式会社 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP2000305597A (ja) * 1999-03-12 2000-11-02 Texas Instr Inc <Ti> 音声圧縮のコード化
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6505222B1 (en) * 1999-10-29 2003-01-07 International Business Machines Corporation Systems methods and computer program products for controlling undesirable bias in an equalizer
KR100324204B1 (ko) * 1999-12-24 2002-02-16 오길록 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법
US7010482B2 (en) * 2000-03-17 2006-03-07 The Regents Of The University Of California REW parametric vector quantization and dual-predictive SEW vector quantization for waveform interpolative coding
US6785805B1 (en) * 2000-08-08 2004-08-31 Vi Technology, Inc. Network-based configuration method for systems integration in test, measurement, and automation environments
JP3916934B2 (ja) * 2000-11-27 2007-05-23 日本電信電話株式会社 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
KR100910282B1 (ko) * 2000-11-30 2009-08-03 파나소닉 주식회사 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치
KR20020075592A (ko) * 2001-03-26 2002-10-05 한국전자통신연구원 광대역 음성 부호화기용 lsf 양자화기
US7042841B2 (en) * 2001-07-16 2006-05-09 International Business Machines Corporation Controlling network congestion using a biased packet discard policy for congestion control and encoded session packets: methods, systems, and program products
US7406411B2 (en) * 2001-08-17 2008-07-29 Broadcom Corporation Bit error concealment methods for speech coding
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding

Also Published As

Publication number Publication date
RU2005123381A (ru) 2006-01-20
EP1576585B1 (en) 2008-10-08
EP1576585A1 (en) 2005-09-21
AU2003294528A1 (en) 2004-07-22
KR20050089071A (ko) 2005-09-07
WO2004059618A1 (en) 2004-07-15
US20070112564A1 (en) 2007-05-17
MY141174A (en) 2010-03-31
ATE410771T1 (de) 2008-10-15
CN100576319C (zh) 2009-12-30
JP2006510947A (ja) 2006-03-30
KR100712056B1 (ko) 2007-05-02
DE60324025D1 (de) 2008-11-20
BRPI0317652B1 (pt) 2018-05-22
UA83207C2 (ru) 2008-06-25
CN1739142A (zh) 2006-02-22
MXPA05006664A (es) 2005-08-16
US7502734B2 (en) 2009-03-10
HK1082587A1 (en) 2006-06-09
US20050261897A1 (en) 2005-11-24
CA2415105A1 (en) 2004-06-24
RU2326450C2 (ru) 2008-06-10
BR0317652A (pt) 2005-12-06
US7149683B2 (en) 2006-12-12

Similar Documents

Publication Publication Date Title
JP4394578B2 (ja) 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
US6134518A (en) Digital audio signal coding using a CELP coder and a transform coder
RU2696292C2 (ru) Аудиокодер и декодер
JP4731775B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR101246991B1 (ko) 오디오 신호 처리 방법
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
RU2389085C2 (ru) Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx
EP0981816B1 (en) Audio coding systems and methods
EP2255358B1 (en) Scalable speech and audio encoding using combinatorial encoding of mdct spectrum
KR101604774B1 (ko) 멀티-레퍼런스 lpc 필터 양자화 및 역 양자화 장치 및 방법
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
KR101698905B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
JP4879748B2 (ja) 最適化された複合的符号化方法
CA2578610A1 (en) Voice encoding device, voice decoding device, and methods therefor
JP2010020346A (ja) 音声信号および音楽信号を符号化する方法
JP2004517348A (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
US8078457B2 (en) Method for adapting for an interoperability between short-term correlation models of digital signals
US6611797B1 (en) Speech coding/decoding method and apparatus
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
KR20230129581A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
CA2511516C (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100463577B1 (ko) 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치
Leis Spectral coding methods for speech compression and speaker identification

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090129

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20090129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091009

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091015

R150 Certificate of patent or registration of utility model

Ref document number: 4394578

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131023

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term