JPH0398099A - デジタル音声コーダおよびそのコーダに用いられるパラメータを求める方法 - Google Patents

デジタル音声コーダおよびそのコーダに用いられるパラメータを求める方法

Info

Publication number
JPH0398099A
JPH0398099A JP2228531A JP22853190A JPH0398099A JP H0398099 A JPH0398099 A JP H0398099A JP 2228531 A JP2228531 A JP 2228531A JP 22853190 A JP22853190 A JP 22853190A JP H0398099 A JPH0398099 A JP H0398099A
Authority
JP
Japan
Prior art keywords
lag
parameter
lags
loop
open
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2228531A
Other languages
English (en)
Inventor
Steude Reinaldo A Valenzuela
レイノルド・オウグスト・バレンズエラ・ストュード
Ronald G Danisewicz
ロナルド・ジヨージ・ダニセウィッチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Codex Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=23593968&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPH0398099(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Codex Corp filed Critical Codex Corp
Publication of JPH0398099A publication Critical patent/JPH0398099A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、一般的に遅延( ag>をパラメー 夕とする長期予測フィルタ(Long Term Fi
lter)を有するデジタル音声エンコーダに関する。
ざらに詳しくは、本発明は、符号励起線形予測(Cod
e−Excited Liner Predictio
n C E L P )音声エンコーダの使用に適する
が、これに限定されるものではない。
(従来の技術) CELPエンコーダの場合、長期予測および短期予測フ
ィルタ(Short Term Filter)は、起
動ベクトルの表から選択された一種のベクトルによって
起動される。CELPの場合、音声は、長期予測フィル
タに関連する起動ベクトルとラグおよび増幅度パラメー
タと短期予測フィルタに関連する1組のパラメータによ
って表わされる。これらのパラメータは、受信機に送信
され、この受信機はこれらのパラメータに基づいて元の
音声形態示を導出する。
長期予測フィルタのラグLは、開ループ法または閉ルー
プ法いずれかによって決定することができる。開ループ
法の場合、ラグは送信機の入力信号から直接決定ざれる
。このラグは、正規化した自己相関関数(autoco
rrelation function)の最大値を実
現する遅延であると決定することができる。
この自己相関関数は、試験ざれる各ラグに対して計算ざ
れなければならない。
計算上の負荷を多く必要としない開ループ法の変化は、
デシメート(decimate)された音声信号の正規
化された自己の最大値を見付けることによって構成ざれ
る。試験はより少ないサンプルで行われるので、計算も
より少なくてすむ。このデシメートざれた信号の遅延は
、デシメーション係数を乗じ、デシメートしなかった信
号に対応する遅延値を得る。この方法によって得られる
ラグは、デシメートざれた信号を基礎とするので分解能
が低い。計算され、かつデシメートしなかったラグに隣
接するラグを試験することによって、より高い分解能を
得ることができる。ジュイン・フエイ・チェン(Jui
n−口wey  Chen>およびアレン●ガーショ(
Allen  Gersho>による、「後置フィルタ
を組込み可能な実時間べクトルによる4800BPSで
のAPC音声のコード化J、1987年4月付、pro
ceedrngs of85ないし2188頁を参照の
こと。
ラグを決定する閉ループ法の場合、試行ラグと長期予測
フィルタの増幅度が試験され、音声信号と従続接続ざれ
た短期予測フィルタおよび長期予測フィルタの出力との
間の重み付けされた誤差の2乗平均を最小にする。この
方法は、長期予測フィルタの遅延線中のコード化された
データと入力信号との間の一致を見出だそうとするもの
である。
長期ラグ(Lonc+ Term Laa)と増幅度は
、音声が合或される受信機に存在する実際の長期予測フ
ィルタに基づいて決定される。したがって、閉ループ法
は、開ループ法より高い分解能を実現するが、計算コス
トがより高くなる。
(発明の概要〉 本発明の目的は、高い分解能を有するがビット速度と計
算負荷要件を低減させた音声エンコーダ中の長期予測フ
ィルタのラグを決定する改良された方法と装置を提供す
ることである。
発明の1つの特徴は、開ループ・ラグ・サーチを使用す
ることである。自己相関のピーク(最大値)を有する1
組の遅延が見出される。一実施例の場合、このサーチは
係数4でデシメートざれた入力信号に対して実行される
。デシメートざれた信号を使用して、正規化した自己相
関が計算され、ピークを有するラグが見出される。幾つ
かの最大ピークの遅延は、4を乗ずることによってデシ
メートしなかった元の信号領域に変換される。正規化さ
れた自己相関は、次にデシメートしなかった信号を使用
して変換ざれた(デシメートしなかった〉ラグの近傍の
小範囲に対して計綽される。自己相関の最大値に関連す
る遅延Dpが記憶される。
Dpの75%のような所定のパーセンテージの自己相関
値を実現する所定の遅延値が保存され、苅応するラグは
ラグ値を増加させることによってラグの集団に組織ざれ
る。最小の遅延を有するラグから開始し、Dpと調和的
に関連するかどうかを決定するため、それぞれ試験ざれ
る。調和的関係を有することが分かった最初のラグが、
開ループ・ラグとして使用ざれるものとして選択ざれる
したがって、この方法は最小値を有するラグの集団から
試行ラグを選択するのに有利である。もし試行ラグがど
れもDpと調和的な関係にない場合、次にDpが開ルー
プ・ラグとして選択ざれる。
本発明の他の特徴は、閉ループの長期予測サーチ用の所
定の範囲を定義するために開ループ・ラグを使用するこ
とに関する。閉ループ・サーチの範囲は、開ループ・ラ
グに隣接するラグと開ループ・ラグの整数倍数(調和数
〉およびこのような調和数に隣接するラグを有する。最
小の閉ループ・サーチ誤差を有するラグが長期予測フィ
ルタに対するラグとして選択される。このような開ルー
プ・ラグを制限ざれた閉ループ・ラグ・サーチと組合わ
せて使用すると、従来の開ループ法と比較して、最小の
計算負荷で改良された分解能を得る。
(実施例) 本発明の重要な特徴は、開ループ法によって決定ざれる
長期ラグ・パラメータと閉ループ法によって決定される
同じパラメータとの間にしばしば存在する関係を認識す
ることである。閉ループ・ラグは、開ループ・ラグの倍
数すなわち調和数の周囲にしばしば現われる。したがっ
て、Dpと調和的に関係する実質的に正規化ざれた自己
相関値を有する最小開ループ・ラグを選択すると、特に
後続の閉ループ・ラグが調和関係に基礎を置く場合に、
改良ざれた結果が与えられる。
第1図は、本発明による改良点を含むCELP音声エン
コーダ100の実施例を示す。一般的に音声によって構
成ざれるデジタル化した信号S(n)がエンコーダの入
力に加えられる。このエンコーダの目的は、2乗平均値
E・を最小にずるパラメータと励起を決定することであ
る。これらのパラメータは、対応する受信機に送られる
受信機では、送信機から受信したコード5Bパラメータ
にしたがってコードブック103に含まれる励起ベクト
ルを従続接続した長期予測フィルタ105と短期予測フ
ィルタ106に加えることによって音声が合成される。
送信機は、受信機にこれらのフィルタに関連するパラメ
ータおよび選択されるべき励起ベクトルの識別を与える
フィルタのパラメータが選択ざれた後、この送信機はコ
ードブック103をサーチすることによって励起ベクト
ルを決定することができる。各励起ベクトルuH(n)
はこれらのフィルタを介して送られ、重み付けフィルタ
110の出力E′(n>の2乗平均値によって表わざれ
る誤差Eは、2乗ブロック109と合計ブロック108
によって計算ざれる。最小誤差を実現するベクトルが選
択ざれる。励起ベクトルに関連する索引すなわちコード
語が受信機に送られる。
短期予測フィルタのパラメータakは、LPG係数抽出
器102によって決定ざれる。これらのパラメータは、
入力波形にあける短時間相関を作る。
長期予測フィルタ105用のラグ・パラメータは、開ル
ープ・ラグ抽出器101とマッピング・ブロック104
によって決定され、これらは以下で詳細に説明する。開
ループ・ラグ抽出器101は、各フレームにつき1回、
開ループ・ラグL。penを抽出する。マッピング・ブ
ロック1o4は、闇ループ・ラグを、最終ラグが選択ざ
れる閉ループ・ラグ・サーチの基礎を形成するラグの範
囲にマッピングする。
減算器107は、入力信号s (n)と合戒された入力
信号S′ ・ (n)との間の差に基づいて誤差信@e
・ (n>を発生する。次に、誤差信号は、重み付けフ
ィルタ110によってフィルタされ、その出力はブロッ
ク109によって2乗され、部はブロック108によっ
て2乗され、その結果2乗平均誤差E・を発生する。最
小誤差E・を発生させる合戒ざれた信号は、考慮されて
いる入力信号のサンプルに対するパラメータの最適な選
択を表わす。
第2A図は、長期予測フィルタ105の簡略化したブロ
ック図を示す。フィルタ105は、加算器202によっ
て構成され、この加算器202は入力uH(n)に、遅
延線204によってLサンプルだけ遅延ざれ増幅器20
3によってβ倍ざれたこの加算器の出力を加える。遅延
線204の可変遅延しは、長期予測フィルタ105のラ
グ・パラメータを表わし、βで示される増幅度の値は、
フィルタの他のパラメータを表わす。
第2B図は、第1図に示すエンコーダを表わす等価な実
施例である。本実施例210は、長期予測フィルタ10
5のラグ・パラメータに対する閉ループ・サーチを説明
するために使用される。第1図の重み付けフィルタ11
0は、減算器107かうの出力からシフトされ、入力信
号と合或された入力信号の両方と直列に設けられた。ブ
ロック213,215は、重み付けフィルタ110と直
列の短期予測フィルタ106の転送関数口(Z)を表わ
す。マツピング・ブロック104によって決定ざれるよ
うに各閉ループ・ラグの候補は、フィルタ105のラグ
に対応するサブ・フレーム・サンプルB1 (n>を遅
延装置204と増幅度βの状態から抽出することによっ
てフレームのサブ・フレーム1つにつき一度試験ざれる
。これらのサンプルは、次にブロック215を通過して
b′1 (n〉を発生する。このブロック215の状態
は、各々の試験されるラグに対してゼロに初期化ざれる
。いずれの励起も存在しない口(2)の出力である関数
日(2)のゼロ入力応答は、ブロック213によって重
み付けざれた入力シーケンスw(n)から減じられp(
n)を発生する。p(n>とb’ L(n)との差は、
ブロック109によって2乗され、ブロック108によ
って合計され、誤差E・を発生する。最小誤差E・を発
生するこのラグ・パラメータは、最適ラグの選択を表わ
す。
第3図は、開ループ・ラグ・パラメータの選択とこれを
閉ループ・パラメータ・サーチで使用するための基本的
な段階を示す。第3図はその手順をブロック図の形態で
図示するが、長期ラグ・パラメータ・サーチはソフトウ
エアによって実現され、第4図ないし第6図でざらに詳
しく説明される。
入力信号s (n)は低域フィルタ301によってフィ
ルタされ、デシメータ302によってデシメートされ、
デシメートざれた入力信号Xd(n)を発生する。代表
的な実施例の場合、デシメーションは係数4による。自
己相関最大値検出器303は、相関最大値すなわちデシ
メートざれた入力信号に関連する種々の試行ラグに対す
る値を検索する。最大値P(n)および対応するラグI
 (n)はブロック304に入力され、このブロック3
04は所定の相関最大値の上位の組(図示の実施例の場
合5〉に対応するラグを識別する。これらのラグd,と
対応する最大値は自己相関調整(auto−corre
lation refinement)ブロック305
に入力され、このブロック305はデシメートざれた信
号に基づく遅延をデシメートざれない入力信号S(n>
に基づく遅延d′ ・に変換する。
調整ざれたラグd′ ・は決定アルゴリズム・ブロック
306の入力を発生し、このブロックは5個のラグの内
の1個を、最大相関値を有するラグDpの調和数である
最小遅延を有するラグの選択に有利なアルゴリズムに基
づく開ループ・ラグ・パラメータ1−。。。.とじて選
択する。このアルゴリズムはさらに第6図で説明する。
開ループ・ラグL。。。。は、第7図で説明する閉ルー
プ・サーチで試験ざれるN個(図示の実施例の場合8{
[11i] )の可能性のあるラグのシーケンスにマッ
プされるマッピング・ブロック307への入力として与
えられる。最小2乗平均誤差を有する試行ラグL1ない
しL8のラグは、長期予測フィルタに使用される最終ラ
グ・パラメータとして選択ざれる。
第4図は、第3図のブロック303で使用される自己相
関決定法を示すフロー図400である。
これらのパラメータは以下のように定義される。
Nは検出ざれた最大値の数を識別し、・−kはラグ値を
表わし、L ・ とL   は考慮される最小mln 
    maX および最大ラグ値を表し、fD(k)はラグkに対ずる
正規化した自己相関関数の値を表わし、P(N)はラグ
k−1に対するN番目の自己相関最大値を記憶し、I 
(N>は対応するk−1ラグを記憶する。太字の下半分
の括弧と太字の上半分の括弧は、演算子の独立変数より
小さい最大の整数と、独立変数より大ぎい最小の整数を
示す演算子をそれぞれ表わす。
ブロック401は、サブ・フレームNをゼロに、kを考
慮ざれるべき最小ラグに初期化することを示す。ここで
考えられているラグは、4でデシメートされた入力信号
に対するものであり、したがって係数4によってkを基
準化する必要がある。
ブロック402は、デシメートしたサンプルxD(n)
とXo(n−k)との間の相関性を決定する正規化自己
相関の公式を示す。この関数は技術上一般的に知られる
ブロック403,404,405は、正規化した自己相
関の最大値を有するものとして識別ざれると考えた場合
にラグk−1に対して全て真でなければならない一連の
決定を示す。もしこれらの決定が全て真であれば、ブロ
ック406は、最大値P (N>とラグk−1と関連す
るラグI (N)を記憶し、Nをインクリメントする。
ブロック407はkを次の試行ラグにインクリメントす
る。決定ブロック408は、新しいラグ値が考慮寸るぺ
き最大ラグ未満であるか否が決定するためにこの新しい
ラグの値を試験する。もしラグkが最大値未満であれば
、前の説明にしたかって、次のラグの値が試験ざれる。
もし新しいラグkが最大値を超えるなら、フロー・チャ
ート400のそれ以上の処理を中止し、プログラムは第
5図の開始点rBJに進む。したがって、この手順は自
己相関最大値とこれらの最大値に関連するラグを認識し
記憶する。
第5図は、第3図のブロック304,305の機能を実
行するフロー図500を示す。ブロック501は、Np
の最大値(図示の実施例の場合N,=5)を識別し、こ
れに対応するラグI (N>を、最大値の大きさによる
のでなく、遅延が小さい方から大きい方へと順番に並べ
る。ブロック502では、パラメータdNはブロック5
01で識別されたラクに対応し、これらは各々4を乗じ
ることによってデシメートざれない遅延の大きざに変換
される。この図では、パラメータiとkは整数の変数を
表わし、ここで1は調整ざれるラグの数を識別し、kは
ラグの値を表わす。パラメータmaXiは、自己相関調
整段階で決定ざれるように、調整ざれた各ラグに対する
最大自己相関値を記憶する。
調整ざれる各ラグおよびd.−2からd n +2のラ
グの範囲に対して(504,510参照)、ブロック5
06で正規化された自己相関関数が計算ざれる。一番大
きい最大値がmaX iとして記憶され、これに対応す
るラグはd/,として記憶される(507.508参照
〉。試行ラグd1の周辺のラグの範囲が決定ブロック5
10で決められたように計算ざれた後、自己相関の調整
が残りの4個の記憶された各ラグに対して継続ざれる。
ブロック503.504は、パラメータiとkを初期化
し、ブロック509,511はパラメータkとiをイン
クリメントする。決定ブロック512は、何時最後の試
行ラグの計算が完了したがを検知する。プログラムは制
御を第6図に続く「C」に転送する。
第5図の一般的な目的は、5つの最大値に対応する遅延
を検出し、遅延の大きさによって遅延を上昇順に並べ、
デシメートされないラグに基づいてざらに調整された自
己相関の決定を実行することである。図示の例の場合、
各々のデシメートざれていないラグは、±2の範囲でサ
ーチざれる。
この範囲は、デシメーションによって発生する可能性の
ある潜在的誤差を考慮したものである。フロー図500
の動作が完了すると、自己相関の最大値が5つのラグに
対して記憶ざれる。
第6図は、第3図のブロック306によって参照される
決定アルゴリズムを実行するフロー・ヂャート600を
示す。ブロック601で、自己相関の最大値max・を
有するラグがDpeakと■ して識別される。残りのラグは、次にDpeakの少な
くとも所定のパーセンテージ(本実施例の場合75%〉
を有するラグを見出すと考えられる。
少なくとも75%の最大値を有するラグは、上昇順にD
 ないしDNqと命名し直され、ここで01 1はこの集団の中で最小のラグを有する。ブロック60
2はし。,。。をDpeakと等しいと定義する。パラ
メータiは一連のNqを検索する力ウンタを表わす。こ
の図のパラメータkは調和関係に対する整数値を表わし
、2から4の範囲である。決定ブロック605は、ラグ
D・がラグDpeakと調和関係にあるか否かを決定す
る。ブロック605で最初の調和関係を見付けた場合(
YES),ブロック607はL    をサブopen 調和関係のラグとして再定義し、プログラムはrDJで
終了する。したがって、ラグの選択決定はDp。akと
最も近い調和関係を有する最小ラグを選択することが有
利になるようにバイアスされる。フロー図600から理
解されるように、もい ラグのいずれもがDp。akと
調和関係にq なければ、次にプログラムは610でrYEsJの判定
により終了するが、ここで10,。。はDp。akと定
義されたままである。
第7図は、第3図のブロック307によるマツピンクを
図示した一連の表を示す。ラグ値し。,。.は第7図で
はkで表わされる。10個の表はkの値を各々閉ループ
・ラグ・サーチによって試験されるる8個の試行ラグL
1ないし「8にマップする。最小の閉ループ誤差を有す
る試行ラグは、長期予測フィルタ105によって使用ざ
れるラグとして選択ざれる。
kの値が小さい場合、kと調和関係にある試行値が調和
数の範囲と同様にサーチされることか第7図から分かる
。kの値が大きい場合、これらのkの値より大きい調和
数は通常の音声に対応するラグ値が存存する範囲を超え
ることが知られているので、kの近傍のサーチ範囲のみ
が考慮されることが分かる。
デジタル式音声エンコーダの長期予測フィルタに使用さ
れるラグ・パラメータを決定する本発明の方法は、開ル
ープ・ラグ・サーチより若干計算指向であるが、閉ルー
プ・ラグ・サーチに相当する分解能を発生する。
本発明の実施例は上記のように説明され、図示されたが
、本発明の範囲は添付の請求項によって定義される。
【図面の簡単な説明】
第1図は、本発明による長期予測ラグ予測器の実施例を
含むCELPエンコーダのブロック図である。 第2A図は、長期予測フィルタの簡略ブロック図である
。 第2B図は、長期予測フィルタのラグ・パラメータに対
する閉ループ・サーチ法を示TCELPエンコーダを実
行したブロック図である。 第3図は、本発明の1実施例によって実行ざれる機能を
示すブロック図である。 第4図は、第3図のブロック303の機能を実行する方
法を示すフロー・チャートである。 第5図は、第3図のブロック304,305の機能を実
行する方法を示すフロー・チャートである。 第6図は、第3図のブロック306の機能を実行する方
法を示すフロー・チャートである。 第7図は、第3図のブロック307によるマッピングを
示すテーブルである。 100・・・CELP音声エンコーダ、101・・・開
ループ・ラグ抽出器、 102・・・LPG係数抽出器、 103・・・コードブック 104・・・マッピング、 105・・・長期予測フィルタ、 106・・・短期予測フィルタ、 107・・・減算器、 108・・・合計ブロック、 109・・・2乗ブロック、 110・・・重み付けフィルタ、 202・・・加算器、203・・・増幅器、204・・
・遅延線、210・・・エンコーダ、212・・・減算
器、 213.215・・・転送関数、 301・・・低域フィルタ、 302・・・デシメータ、 303・・・自己相関最大値検出器、 304 ・ 305・ 306・ 307・ ・遅延検出ブロック、 ・自己相関調整ブロック、 ・決定アルゴリズム、 ・マッピング。

Claims (14)

    【特許請求の範囲】
  1. (1)タイム・ラグ・パラメータを有する長期予測フィ
    ルタ(105)を含むデジタル音声エンコーダ(100
    )の前記フィルタ用の開ループ・ラグ・パラメータL_
    o_p_e_nを発生する方法において、前記方法は: 長さの異なる試行ラグ用の相関値を計算する段階; 前記値の内最大値を有する所定数の試行ラグを選択する
    段階であって、前記数の最大値が対応するラグD_pを
    有する前記段階;および 前記数のラグの少なくとも1つがラグD_pと調和関係
    にあるか否か決定し、ラグの前記数の少なくとも1つが
    ラグD_pと調和関係にある場合前記数をラグ・パラメ
    ータL_o_p_e_nとして選択し、前記数のラグの
    いずれもラグD_pと調和関係にない場合D_pをラグ
    ・パラメータL_o_p_e_nとして選択する段階; によって構成されることを特徴とする方法。
  2. (2)ラグD_pと調和関係にある前記数の値の内最小
    のラグを選択する段階によつてさらに構成されることを
    特徴とする請求項1記載の方法。
  3. (3)前記決定段階は、連続するラグによって構成され
    かつラグD_pを有するラグの範囲を定義し、前記調和
    関係の決定を前記範囲内にある前記の数のラグの整数倍
    数に基づいて決定する段階によつてさらに構成されるこ
    とを特徴とする請求項1記載の方法。
  4. (4)タイム・ラグ・パラメータを有する長期予測フィ
    ルタ(105)および前記フィルタ用の開ループ・ラグ
    ・パラメータL_o_p_e_nを決定する手段を有す
    るデジタル音声エンコーダ(100)において、前記エ
    ンコーダは: 長さの異なる試行ラグに対する相関値を計算する手段(
    303); 前記値の内最大値を有する所定数の試行ラグを選択する
    手段(304)であって、前記数の最大値が対応するラ
    グD_pを有する前記手段;前記値の数の少なくとも1
    つがラグD_pと調和関係にあるか否か決定する手段(
    306);および 調和関係にあるラグが存在する場合前記調和関係にある
    ラグをラグ・パラメータL_o_p_e_nとして選択
    し、もし前記数のラグのいずれもラグD_pと調和関係
    にない場合D_pをラグ・パラメータL_o_p_e_
    nとして選択する手段(306);によつて構成される
    ことを特徴とするエンコーダ。
  5. (5)ラグD_pと調和関係にある前記数の内最小ラグ
    を選択する手段によってさらに構成されることを特徴と
    する請求項4記載のエンコーダ。
  6. (6)連続するラグによつて構成されかつラグD_pを
    有するラグの範囲を定義する手段によつてさらに構成さ
    れ、前記決定手段は、前記ラグ数の1つの整数倍数が前
    記範囲にあるか否かに基づいて前期決定を行うことを特
    徴とする請求項4記載のエンコーダ。
  7. (7)タイム・ラグ・パラメータLを有する長期予測フ
    ィルタ(105)を含むデジタル音声エンコーダ(10
    0)の前記ラグ・パラメータLを決定する方法において
    、前記方法は: 開ループ・ラグ・パラメータL_o_p_e_nを計算
    する段階; 開ループ・ラグ・パラメータL_o_p_e_nの値に
    よって決まる所定の一連の閉ループ・ラグ・パラメータ
    試験を実行し、試験された各閉ループ・ラグ・パラメー
    タと関連する誤差を決定する段階;および 誤差が最小の前記閉ループ・ラグ・パラメータをラグ・
    パラメータLとして選択する段階;によって構成される
    ことを特徴とする方法。
  8. (8)前記所定の一連の試験の組を発生する段階によつ
    て構成され、前期組の各々が開ループ・ラグ・パラメー
    タL_o_p_e_nの範囲に対応することを特徴とす
    る請求項7記載の方法。
  9. (9)試験を実行する前記段階は、開ループ・ラグ・パ
    ラメータL_o_p_e_nと調和関係にある閉ループ
    ・ラグ・パラメータを試験する段階によってさらに構成
    されることを特徴とする請求項7記載の方法。
  10. (10)試験されたL_o_p_e_nの調和数の数が
    所定の最大値に対するパラメータL_o_p_e_nの
    値によつて決定されることを特徴とする請求項9記載の
    方法。
  11. (11)タイム・ラグ・パラメータLを有する長期予測
    フィルタ(105)および前記ラグ・パラメータLを決
    定する手段を有するデジタル音声エンコーダ(100)
    において、前記エンコーダは: 開ループ・ラグ・パラメータL_o_p_e_nを計算
    する手段(306); 開ループ・ラグ・パラメータL_o_p_e_nの値に
    よつて決まる所定の一連の閉ループ・ラグ・パラメータ
    の試験を実行し、各試験と関連する誤差を決定する手段
    (307);および 誤差が最小の前記閉ループ・ラグ・パラメータをラグ・
    パラメータLとして選択する手段(104); によって構成されることを特徴とするエンコーダ。
  12. (12)前記所定の一連の試験の組を発生する手段によ
    って構成され、前期組の各々が開ループ・ラグ・パラメ
    ータL_o_p_e_nの範囲に対応することを特徴と
    する請求項11記載のエンコーダ。
  13. (13)試験を実行する前記手段は、開ループ・ラグ・
    パラメータL_o_p_e_nと調和関係にある閉ルー
    プ・ラグ・パラメータを試験する手段によってさらに構
    成されることを特徴とする請求項11記載のエンコーダ
  14. (14)試験されたL_o_p_e_nの調和数の数が
    所定の最大値に対するパラメータL_o_p_e_nの
    値によって決定されることを特徴とする請求項13記載
    のエンコーダ。
JP2228531A 1989-08-31 1990-08-31 デジタル音声コーダおよびそのコーダに用いられるパラメータを求める方法 Pending JPH0398099A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/402,958 US5097508A (en) 1989-08-31 1989-08-31 Digital speech coder having improved long term lag parameter determination
US402,958 1989-08-31

Publications (1)

Publication Number Publication Date
JPH0398099A true JPH0398099A (ja) 1991-04-23

Family

ID=23593968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2228531A Pending JPH0398099A (ja) 1989-08-31 1990-08-31 デジタル音声コーダおよびそのコーダに用いられるパラメータを求める方法

Country Status (5)

Country Link
US (1) US5097508A (ja)
EP (1) EP0415163B1 (ja)
JP (1) JPH0398099A (ja)
CA (1) CA2021508C (ja)
DE (1) DE69020070T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0694907A2 (en) 1994-07-19 1996-01-31 Nec Corporation Speech coder

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
JP3254687B2 (ja) * 1991-02-26 2002-02-12 日本電気株式会社 音声符号化方式
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
JP2658816B2 (ja) * 1993-08-26 1997-09-30 日本電気株式会社 音声のピッチ符号化装置
KR960009530B1 (en) * 1993-12-20 1996-07-20 Korea Electronics Telecomm Method for shortening processing time in pitch checking method for vocoder
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
JPH08211895A (ja) * 1994-11-21 1996-08-20 Rockwell Internatl Corp ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
US5692101A (en) * 1995-11-20 1997-11-25 Motorola, Inc. Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques
EP0788091A3 (en) * 1996-01-31 1999-02-24 Kabushiki Kaisha Toshiba Speech encoding and decoding method and apparatus therefor
US6226604B1 (en) * 1996-08-02 2001-05-01 Matsushita Electric Industrial Co., Ltd. Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
JP2001282278A (ja) * 2000-03-31 2001-10-12 Canon Inc 音声情報処理装置及びその方法と記憶媒体
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60116000A (ja) * 1983-11-28 1985-06-22 ケイディディ株式会社 音声符号化装置
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
DE3783905T2 (de) * 1987-03-05 1993-08-19 Ibm Verfahren zur grundfrequenzbestimmung und sprachkodierer unter verwendung dieses verfahrens.
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
EP0331857B1 (en) * 1988-03-08 1992-05-20 International Business Machines Corporation Improved low bit rate voice coding method and system
DE3883519T2 (de) * 1988-03-08 1994-03-17 Ibm Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0694907A2 (en) 1994-07-19 1996-01-31 Nec Corporation Speech coder

Also Published As

Publication number Publication date
DE69020070D1 (de) 1995-07-20
EP0415163B1 (en) 1995-06-14
DE69020070T2 (de) 1996-03-07
EP0415163A2 (en) 1991-03-06
EP0415163A3 (en) 1991-10-09
CA2021508C (en) 1994-05-03
US5097508A (en) 1992-03-17
CA2021508A1 (en) 1991-03-01

Similar Documents

Publication Publication Date Title
JPH0398099A (ja) デジタル音声コーダおよびそのコーダに用いられるパラメータを求める方法
US4980916A (en) Method for improving speech quality in code excited linear predictive speech coding
US4944013A (en) Multi-pulse speech coder
JP3481390B2 (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
KR0127901B1 (ko) 음성 인코딩 장치 및 그 방법
KR930005226B1 (ko) 코드북 벡터 발생방법 및 장치
DK1509903T3 (en) METHOD AND APPARATUS FOR EFFECTIVELY HIDDEN FRAMEWORK IN LINEAR PREDICTIVE-BASED SPEECH CODECS
AU761131B2 (en) Split band linear prediction vocodor
US5930747A (en) Pitch extraction method and device utilizing autocorrelation of a plurality of frequency bands
US5487087A (en) Signal quantizer with reduced output fluctuation
US5426718A (en) Speech signal coding using correlation valves between subframes
US4736428A (en) Multi-pulse excited linear predictive speech coder
US6047253A (en) Method and apparatus for encoding/decoding voiced speech based on pitch intensity of input speech signal
KR100204740B1 (ko) 정보 코딩 방법
US5884251A (en) Voice coding and decoding method and device therefor
CA2132006C (en) Method for generating a spectral noise weighting filter for use in a speech coder
US4720865A (en) Multi-pulse type vocoder
TW440812B (en) An adaptive criterion for speech coding
KR19980024971A (ko) 음성 부호화 방법 및 장치와 피치검출 방법 및 장치
US6115685A (en) Phase detection apparatus and method, and audio coding apparatus and method
JP3168238B2 (ja) 再構成音声信号の周期性を増大させる方法および装置
Tzeng Analysis-by-synthesis linear predictive speech coding at 2.4 kbit/s
JPH10190470A (ja) 周波数荷重評価関数に基づくスペクトル特徴パラメータ抽出装置
Mei et al. An efficient method to compute LSFs from LPC coefficients
JP2892462B2 (ja) コード励振線形予測符号化器