JP5521097B2 - 信号を符号化する方法および信号を復号する方法 - Google Patents
信号を符号化する方法および信号を復号する方法 Download PDFInfo
- Publication number
- JP5521097B2 JP5521097B2 JP2013165706A JP2013165706A JP5521097B2 JP 5521097 B2 JP5521097 B2 JP 5521097B2 JP 2013165706 A JP2013165706 A JP 2013165706A JP 2013165706 A JP2013165706 A JP 2013165706A JP 5521097 B2 JP5521097 B2 JP 5521097B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- region
- prediction
- ltp
- residual signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 121
- 230000007774 longterm Effects 0.000 claims description 95
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 239000002131 composite material Substances 0.000 claims 4
- 238000005259 measurement Methods 0.000 claims 2
- 238000009432 framing Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
第1領域の信号を第2領域の信号に変換すること、
第2領域の信号についてLP(Linear Predictive)処理およびLTP(Long−Term Prediction)処理を行うこと、
判断基準に従って長期フラグ値を獲得すること、
長期フラグ値が第1の値であるときにLP処理の結果およびLTP処理の結果に従って第2領域の予測信号を獲得すること、または、長期フラグ値が第2の値であるときにLP処理の結果に従って第2領域の予測信号を獲得すること、
第2領域の予測信号を第1領域の予測信号に変換して第1領域の予測残差信号を計算すること、ならびに
第1領域の予測残差信号を含むビットストリームを出力すること
を含む。
受け取ったビットストリームを復号して第1領域の予測残差信号を獲得すること、
ビットストリームの現在フレームの第1のサンプル点を復号すること、
現在フレームの第2のサンプル点から始まる各サンプル点について連続して、
復号されたサンプル点の第2領域の信号に従ってサンプル点のLP(Linear Predictive)信号を計算するステップと、
獲得された長期フラグ値が第1の値である場合に、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得するステップと、
獲得される長期フラグ値が第1の値でない場合に、LP信号に従って第2領域の予測信号を獲得するステップと、
第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号するステップと、
現在サンプル点の第1領域の信号を第2領域の信号に変換し、第2領域の信号およびLP信号に従ってLP残差信号を獲得するステップと
の各復号ステップを実行すること
を含む。
第1領域の信号を第2領域の信号に変換し、第2領域の予測信号を第1領域の予測信号に変換するように構成された変換モジュールと、
第2領域の信号についてLP処理を行うように構成されたLP(Linear Predictive)モジュールと、
第2領域の信号についてLTP処理を行うように構成されたLTP(Long−Term Prediction)モジュールと、
判断基準に従って長期フラグ値を獲得するように構成された判断モジュールと、
長期フラグ値が第1の値であるときに第2領域のLP処理の結果および第2領域のLTP処理の結果に従って第2領域の予測信号を獲得し、長期フラグ値が第2の値であるときに第2領域のLP処理の結果に従って第2領域の予測信号を獲得するように構成された第2領域の予測モジュールと、
第1領域の予測信号に従って第1領域の予測残差信号を計算するように構成された第1領域の予測残差モジュールと、
第1領域の予測残差信号を含むビットストリームを出力するように構成された出力モジュールと
を含む。
受け取ったビットストリームを復号して第1領域の予測残差信号を獲得するように構成されたビットストリーム復号モジュールと、
現在フレームの信号の第1のサンプル点を復号するように構成された第1のサンプル点復号モジュールと、
復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号を計算するように構成されたLPモジュールと、
獲得された長期フラグ値が第1の値である場合に、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得し、獲得された長期フラグ値が第1の値でない場合に、LP信号に従って第2領域の予測信号を獲得するように構成された第2領域の予測モジュールと、
第2領域の予測信号を第1領域の予測信号に変換し、現在サンプル点の第1領域の信号を第2領域の信号に変換するように構成された変換モジュールと、
第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号するように構成された現在サンプル点復号モジュールと、
第2領域の信号およびLP予測信号に従ってLP残差信号を獲得するように構成されたLP残差モジュールと
を含む。
第1領域の信号を第2領域の信号に変換し、第2領域の信号についてLP(Linear Predictive)処理およびLTP(Long−Term Prediction)処理を行い、判断基準に従って長期フラグ値を獲得し、長期フラグ値が第1の値であるときに第2領域のLP処理の結果および第2領域のLTP処理の結果に従って第2領域の予測信号を獲得し、長期フラグ値が第2の値であるときに第2領域のLP処理の結果に従って第2領域の予測信号を獲得し、第2領域の予測信号を第1領域の予測信号に変換して第1領域の予測残差信号を計算し、第1領域の予測残差信号を含むビットストリームを出力するように構成された信号符号化装置と、
受け取ったビットストリームを復号して第1領域の予測残差信号および長期フラグを獲得し、現在フレームの信号の第1のサンプル点を復号し、現在フレームの信号の第2のサンプル点の各現在サンプル点について連続して、復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号を計算するステップと、獲得された長期フラグ値が第1の値である場合に、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得し、獲得された長期フラグ値が第1の値でない場合に、LP信号に従って第2領域の予測信号を獲得するステップと、第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号するステップと、現在サンプル点の第1領域の信号を第2領域の信号に変換し、第2領域の信号およびLP信号に従ってLP残差信号を獲得するステップとの各復号ステップを実行するように構成された信号復号装置と
を含む。
res(i)=y(i)−y’(i)、i=0,1,…,L−1 (2)
z(i)=res(i)、i=0,1,…,T1+M−1 (3)
ここで、z(i)は、LTP残差信号である。
z(i)=res(i)−g1・res(i−T1)、i=n0,…,n1−1 (4)
式中、g1は第1のサブフレームのピッチ利得を表す。
zj(i)=resj(i)−gj・resj(i−Tj)、i=nj−1,…,nj−1 (5)
式中、Tjはサブフレームjのピッチを表し、gjはサブフレームjのピッチ利得を表す。
res’(i)=g・res(i−T) (8)
y’’(i)=y’(i)+res’(i) (9)
y’’(i)=y’(i) (10)
x’(i)=PCM2A[y’’(i)] (11)
d(i)=x(i)−x’(i)、i=0,1,…,L−1 (12)
x(i)=d(i)+x’(i)、i=0,1,…,L−1 (13)
y(0)=A2PCM[x(0)]、res(0)=y(0) (14)
である。
x’(i)=PCM2A[y’’(i)] (16)
res(i)=y(i)−y’(i)、i=0,1,…,T1+M−1 (17)
y’’(i)=y’(i)+res’(i)=y’(i)+g・res(i−T) (19)
x’(i)=PCM2A[y’’(i)] (20)
res(i)=y(i)−y’(i)、i=n0,…,L−1 (21)
Claims (24)
- 非線形領域である第1領域の信号をPCM(Pulse Code Modulation)領域である第2領域の信号に変換すること、
前記第2領域の信号についてLP(Linear Prediction)処理およびLTP(Long−Term Prediction)処理を行いLP残差信号を含むLP処理の結果およびLTP残差信号を含むLTP処理の結果を取得すること、
前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得すること、
前記長期フラグ値が第1の値であるときに前記LP処理の結果および前記LTP処理の結果に従って第2領域の予測信号を獲得するか、または、前記長期フラグ値が第2の値であるときに前記LP処理の結果に従って第2領域の予測信号を獲得すること、
前記第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号を計算すること、ならびに
前記第1領域の予測残差信号を含むビットストリームを出力すること
を含む信号符号化方法。 - 前記LP処理の結果が1以上のLP係数、LP信号、およびLP残差信号を含み、前記ビットストリームが前記LP係数をさらに含む請求項1に記載の方法。
- 前記LTP処理の結果がLTP寄与信号を含む請求項2に記載の方法。
- 前記LTP処理の結果が前記LP残差信号の最適のピッチまたは前記LP残差信号の前記最適のピッチと前記LP残差信号のピッチ利得の両方をさらに含み、前記LTP処理を行うことが、
前記LP残差信号のピッチ探索を行うこと、
前記LP残差信号の前記最適のピッチまたは前記LP残差信号の前記最適のピッチと前記LP残差信号の前記ピッチ利得の両方を獲得すること、ならびに
前記LP残差信号、および前記LP残差信号の前記最適のピッチと前記LP残差信号の前記ピッチ利得のうちの少なくとも1つに従ってLTP寄与信号を獲得すること
を含む請求項3に記載の方法。 - 前記LP処理を行う前に、
前記第2領域の信号のピッチ探索を行うこと、および
前記第2領域の信号の最適のピッチを獲得すること
をさらに含む請求項2に記載の方法。 - 前記LTP処理を行うことが、
前記第2領域の信号の前記最適のピッチに従ってLP残差信号の密探索を行うこと、
前記LP残差信号の最適のピッチまたは前記LP残差信号の前記最適のピッチと前記LP残差信号のピッチ利得の両方を獲得すること、ならびに
前記LP残差信号、および前記LP残差信号の前記最適のピッチと前記LP残差信号の前記ピッチ利得のうちの少なくとも1つに従ってLTP寄与信号を獲得すること
を含む請求項5に記載の方法。 - 前記LP残差信号の前記密探索を行い、前記LP残差信号の前記最適のピッチを獲得するときに、
前記獲得された最適のピッチに従って適応的にピッチ利得を選択すること
をさらに含む請求項6に記載の方法。 - 前記LP処理の結果がLP信号を含み、
前記LP処理の結果に従って第2領域の予測信号を獲得することが、
前記第2領域の予測信号として前記LP信号を使用すること
を含む請求項1に記載の方法。 - 前記LP処理の結果がLP信号を含み、前記LTP処理の結果がLTP寄与信号を含み、
前記LP処理の結果および前記LTP処理の結果に従って第2領域の予測信号を獲得することが、
前記第2領域の予測信号として前記LP信号と前記LTP寄与信号の和を使用すること
を含む請求項1に記載の方法。 - 前記LTP処理の結果がLTP残差信号をさらに含み、前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得することが、
前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギーより大きいかどうか判断すること、および
前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギーより大きい場合に前記長期フラグ値に第1の値を割り当てること、または
前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギー以下である場合に前記長期フラグ値に第2の値を割り当てること
を含む請求項2に記載の方法。 - 前記LTP処理の結果がLTP残差信号をさらに含み、前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得することが、
前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和より大きいかどうか判断すること、および
前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和より大きい場合に前記長期フラグ値に前記第1の値を割り当てること、または
前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和以下である場合に前記長期フラグ値に前記第2の値を割り当てること
を含む請求項2に記載の方法。 - 前記LP残差信号の前記ピッチ探索を行う前に、
前記LP残差信号をフレームに分割すること
をさらに含む請求項4に記載の方法。 - 受け取ったビットストリームを復号して、第1領域の予測残差信号と、前記受け取ったビットストリームのLP残差信号のエネルギーと前記受け取ったビットストリームのLTP残差信号のエネルギーとを比較した結果に従って特定された長期フラグ値と、を獲得すること、
前記第1領域の予測残差信号の現在フレームの第1のサンプル点を復号すること、
前記第1領域の予測残差信号の現在フレームの第2のサンプル点から前記第1領域の予測残差信号の現在フレームの各現在サンプル点について連続して、
前記復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP(Linear Prediction)信号を計算するステップと、
獲得された長期フラグ値が第1の値である場合に、前記LP信号と、前記復号されたサンプル点のLP残差信号に従って獲得されるLTP(Long−Term Prediction)寄与信号とに従って第2領域の予測信号を獲得するか、または、獲得された長期フラグ値が第1の値でない場合に、前記LP信号に従って第2領域の予測信号を獲得するステップと、
前記第2領域の予測信号を第1領域の予測信号に変換し、前記第1領域の予測残差信号および前記第1領域の予測信号に従って前記現在サンプル点の第1領域の信号を復号するステップと、
前記現在サンプル点の前記第1領域の信号を第2領域の信号に変換し、前記第2領域の信号および前記LP信号に従ってLP残差信号を獲得するステップと
の各復号ステップを行うこと
を含み、
前記第1領域は非線形領域であり、前記第2領域はPCM(Pulse Code Modulation)領域であり、符号器側のLP処理の結果がLP残差信号を含み、符号器側のLTP処理の結果がLTP残差信号を含む、
信号復号方法。 - 前記LP信号およびLTP寄与信号に従って第2領域の予測信号を獲得することが、
符号器側の前記現在サンプル点がLTP処理に関与する場合に、前記第2領域の予測信号として前記LP残差信号と前記LTP寄与信号の和を使用すること、
符号器側の前記現在サンプル点がLTP処理に関与しない場合に、前記第2領域の予測信号としてLPC予測信号を使用すること
を含む請求項13に記載の方法。 - 前記ビットストリームが最適のピッチとピッチ利得の両方を含み、または前記ビットストリームが前記最適のピッチおよびピッチ利得を含み、ゆえに、
前記最適のピッチに従って適応的に前記ピッチ利得を選択すること
をさらに含む請求項13に記載の方法。 - 非線形領域である第1領域の信号をPCM(Pulse Code Modulation)領域である第2領域の信号に変換し、第2領域の予測信号を第1領域の予測信号に変換するように構成された変換モジュールと、
前記第2領域の信号についてLP(Linear Prediction)処理を行うことでLP残差信号を含むLP処理の結果を取得するように構成されたLPモジュールと、
前記第2領域の信号についてLTP(Long−Term Prediction)処理を行うことでLTP残差信号を含むLTP処理の結果を取得するように構成されたLTPモジュールと、
前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得するように構成された判断モジュールと、
前記長期フラグ値が第1の値であるときに前記LP処理の結果および前記LTP処理の結果に従って第2領域の予測信号を獲得し、前記長期フラグ値が第2の値であるときに前記LP処理の結果に従って第2領域の予測信号を獲得するように構成された第2領域予測モジュールと、
第1領域の予測信号に基づいて第1領域の予測残差信号を計算するように構成された第1領域予測残差モジュールと、
符号化された前記第1領域の予測残差信号を含むビットストリームを出力するように構成された出力モジュールと、
を含み、
前記変換モジュール、前記LPモジュール、前記LTPモジュール、前記判断モジュール、前記第2領域予測モジュール、前記第1領域予測残差モジュール、および前記出力モジュールの少なくとも一つはハードウェアモジュールである、
信号符号化器。 - 前記LP処理の結果が1以上のLP係数、LP予測信号、およびLP残差信号を含み、前記ビットストリームが前記LP係数を含み、
前記LTPモジュールは、
前記LP残差信号のピッチ探索を行い、前記LP残差信号の最適のピッチ、または前記LP残差信号の前記最適のピッチと前記LP残差信号のピッチ利得の両方を獲得し、LTP寄与信号を獲得する、ように構成されている
請求項16に記載の信号符号化器。 - 前記獲得された最適のピッチに従って適応的にピッチ利得を選択するように構成されているピッチ利得モジュールをさらに含む請求項16に記載の信号符号化器。
- 前記LP処理の結果が1以上のLP係数、LP予測信号、およびLP残差信号を含み、前記ビットストリームが前記LP係数を含み、前記LTP処理の結果がLTP寄与信号を含み、
前記信号符号化器は、
前記長期フラグ値が第1の値であるときに前記第2領域の予測信号として前記LP残差信号と前記LTP寄与信号の和を使用し、
前記長期フラグ値が第2の値であるときに前記第2領域の予測信号としてLPC予測信号を使用する、
ように構成されている第2領域予測モジュールをさらに含む、
請求項16に記載の信号符号化器。 - 前記LP処理の結果が1以上のLP係数、LP予測信号、およびLP残差信号を含み、前記ビットストリームが前記LP係数を含み、前記LTP処理の結果がLTP残差信号をさらに含み、
前記判断モジュールが、
前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギーより大きいかどうか判断し、前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギーより大きい場合に前記長期フラグ値に前記第1の値を割り当て、前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギー以下である場合に前記長期フラグ値に前記第2の値を割り当てるか、または、
前記LP残差信号の絶対値の和と経験的係数との積がLTP残差信号の絶対値の和より大きいかどうか判断し、前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和より大きい場合に前記長期フラグ値に前記第1の値を割り当て、前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和以下である場合に前記長期フラグ値に前記第2の値を割り当てる、ように構成されている、
請求項16に記載の信号符号化器。 - 受け取ったビットストリームを復号して、第1領域の予測残差信号と、前記受け取ったビットストリームのLP残差信号のエネルギーと前記受け取ったビットストリームのLTP残差信号のエネルギーとを比較した結果に従って特定された長期フラグ値と、を獲得するように構成されたビットストリーム複合モジュールと、
現在フレーム信号の第1のサンプル点を復号するように構成された第1サンプル点複合モジュールと、
前記復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP(Linear Prediction)信号を計算するLPモジュールと、
獲得された前記長期フラグ値が第1の値である場合に、前記LP信号と、前記復号されたサンプル点のLP残差信号に従って獲得されるLTP(Long−Term Prediction)寄与信号とに従って第2領域の予測信号を獲得するか、または獲得された長期フラグ値が第1の値でない場合に、前記LP信号に従って第2領域の予測信号を獲得するように構成された第2領域予測モジュールと、
前記第2領域の予測信号を第1領域の予測信号に変換し、前記現在サンプル点の前記第1領域の信号を第2領域の信号に変換するように構成された変換モジュールと、
前記第1領域の予測残差信号および前記第1領域の予測信号に従って前記現在サンプル点の第1領域の信号を復号する現在サンプル点復号モジュールと、
前記現在サンプル点の前記第1領域の信号を第2領域の信号に変換し、前記第2領域の信号および前記LP信号に従ってLP残差信号を獲得するLP残差モジュールと、を含み、
前記ビットストリーム複合モジュール、前記第1サンプル点複合モジュール、前記LPモジュール、前記第2領域予測モジュール、前記変換モジュール、前記現在サンプル点復号モジュール、および前記LP残差モジュールの少なくとも一つはハードウェアモジュールであり、前記第1領域は非線形領域であり、前記第2領域はPCM(Pulse Code Modulation)領域であり、符号器側のLP処理の結果がLP残差信号を含み、符号器側のLTP処理の結果がLTP残差信号を含む、
信号復号器。 - 前記長期フラグ値が第1の値であり、符号器側の前記現在サンプル点がLTP処理に関与する場合に、前記第2領域の予測信号として前記LP残差信号と前記LTP寄与信号の和が使用され、
前記長期フラグ値が第1の値であり、符号器側の前記現在サンプル点がLTP処理に関与しない場合に、前記第2領域の予測信号としてLPC予測信号が使用されること、
を含む請求項21に記載の信号復号器。 - 最適のピッチに従って適応的にピッチ利得を選択するように構成されたピッチ利得モジュールをさらに含む請求項21に記載の信号復号器。
- 非線形領域である第1領域の信号をPCM(Pulse Code Modulation)領域である第2領域の信号に変換し、前記第2領域の信号についてLP(Linear Prediction)処理およびLTP(Long−Term Prediction)処理を行いLP残差信号を含むLP処理の結果およびLTP残差信号を含むLTP処理の結果を取得し、前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得し、前記長期フラグ値が第1の値であるときに前記LP処理の結果および前記LTP処理の結果に従って第2領域の予測信号を獲得し、前記長期フラグ値が第2の値であるときに前記LP処理の結果に従って第2領域の予測信号を獲得し、前記第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号を計算し、前記第1領域の予測残差信号を含むビットストリームを出力する、ように構成された信号符号化器と、
受け取られた前記ビットストリームを復号して前記第1領域の予測残差信号および前記長期フラグ値を獲得し、現在フレーム信号の第1のサンプル点を復号し、前記現在フレーム信号の第2のサンプル点の各現在サンプル点について連続して、前記復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号を計算するステップと、獲得された長期フラグ値が第1の値である場合に、前記LP信号と、前記復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得するステップと、獲得された長期フラグ値が第1の値でない場合に、前記LP信号に従って第2領域の予測信号を獲得するステップと、前記第2領域の予測信号を第1領域の予測信号に変換し、前記第1領域の予測残差信号および前記第1領域の予測信号に従って前記現在サンプル点の第1領域の信号を復号するステップと、前記現在サンプル点の前記第1領域の信号を第2領域の信号に変換し、前記第2領域の信号および前記LP信号に従ってLP残差信号を獲得するステップとの各復号ステップを行うように構成された信号復号器と、
を含む信号コーデックシステム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810247427.6 | 2008-12-31 | ||
CN200810247427 | 2008-12-31 | ||
CN200910151835.6 | 2009-06-25 | ||
CN2009101518356A CN101615395B (zh) | 2008-12-31 | 2009-06-25 | 信号编码、解码方法及装置、*** |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011543970A Division JP5436576B2 (ja) | 2008-12-31 | 2009-12-30 | 信号を符号化する方法および信号を復号する方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013232013A JP2013232013A (ja) | 2013-11-14 |
JP5521097B2 true JP5521097B2 (ja) | 2014-06-11 |
Family
ID=41495006
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011543970A Active JP5436576B2 (ja) | 2008-12-31 | 2009-12-30 | 信号を符号化する方法および信号を復号する方法 |
JP2013165706A Active JP5521097B2 (ja) | 2008-12-31 | 2013-08-09 | 信号を符号化する方法および信号を復号する方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011543970A Active JP5436576B2 (ja) | 2008-12-31 | 2009-12-30 | 信号を符号化する方法および信号を復号する方法 |
Country Status (8)
Country | Link |
---|---|
US (2) | US8515744B2 (ja) |
EP (2) | EP2385522A1 (ja) |
JP (2) | JP5436576B2 (ja) |
KR (1) | KR101350285B1 (ja) |
CN (1) | CN101615395B (ja) |
BR (1) | BRPI0923887A2 (ja) |
RU (1) | RU2486610C2 (ja) |
WO (1) | WO2010075792A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101615395B (zh) * | 2008-12-31 | 2011-01-12 | 华为技术有限公司 | 信号编码、解码方法及装置、*** |
IN2012DN05235A (ja) | 2010-01-08 | 2015-10-23 | Nippon Telegraph & Telephone | |
CN102812512B (zh) * | 2010-03-23 | 2014-06-25 | Lg电子株式会社 | 处理音频信号的方法和装置 |
CN104347067B (zh) * | 2013-08-06 | 2017-04-12 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
CN107452390B (zh) * | 2014-04-29 | 2021-10-26 | 华为技术有限公司 | 音频编码方法及相关装置 |
WO2016017238A1 (ja) * | 2014-07-28 | 2016-02-04 | 日本電信電話株式会社 | 符号化方法、装置、プログラム及び記録媒体 |
CN113574889B (zh) * | 2019-03-14 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 环路整形信息的信令和语法 |
CN113129913B (zh) * | 2019-12-31 | 2024-05-03 | 华为技术有限公司 | 音频信号的编解码方法和编解码装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE9006717U1 (de) * | 1990-06-15 | 1991-10-10 | Philips Patentverwaltung GmbH, 22335 Hamburg | Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen |
US5717824A (en) * | 1992-08-07 | 1998-02-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear predictor with multiple codebook searches |
JP3232701B2 (ja) | 1992-10-15 | 2001-11-26 | 株式会社日立製作所 | 音声符号化方法 |
JPH07239699A (ja) | 1994-02-28 | 1995-09-12 | Hitachi Ltd | 音声符号化方法およびこの方法を用いた音声符号化装置 |
US5659698A (en) | 1994-11-01 | 1997-08-19 | Motorola, Inc. | Method and apparatus for generating a circular buffer address in integrated circuit that performs multiple communications tasks |
US5652903A (en) * | 1994-11-01 | 1997-07-29 | Motorola, Inc. | DSP co-processor for use on an integrated circuit that performs multiple communication tasks |
JP3137176B2 (ja) * | 1995-12-06 | 2001-02-19 | 日本電気株式会社 | 音声符号化装置 |
US5978756A (en) * | 1996-03-28 | 1999-11-02 | Intel Corporation | Encoding audio signals using precomputed silence |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US7031926B2 (en) * | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
JP3426207B2 (ja) * | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
DE10124420C1 (de) * | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
JP4622164B2 (ja) * | 2001-06-15 | 2011-02-02 | ソニー株式会社 | 音響信号符号化方法及び装置 |
US20040167772A1 (en) * | 2003-02-26 | 2004-08-26 | Engin Erzin | Speech coding and decoding in a voice communication system |
RU2316059C2 (ru) * | 2003-05-01 | 2008-01-27 | Нокиа Корпорейшн | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
GB0326263D0 (en) * | 2003-11-11 | 2003-12-17 | Nokia Corp | Speech codecs |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
US7933767B2 (en) * | 2004-12-27 | 2011-04-26 | Nokia Corporation | Systems and methods for determining pitch lag for a current frame of information |
TWI276047B (en) | 2005-12-15 | 2007-03-11 | Ind Tech Res Inst | An apparatus and method for lossless entropy coding of audio signal |
EP1852848A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
RU2319222C1 (ru) * | 2006-08-30 | 2008-03-10 | Валерий Юрьевич Тарасов | Способ кодирования и декодирования речевого сигнала методом линейного предсказания |
CN101197576A (zh) * | 2006-12-07 | 2008-06-11 | 上海杰得微电子有限公司 | 一种音频信号编码、解码方法 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN101615395B (zh) | 2008-12-31 | 2011-01-12 | 华为技术有限公司 | 信号编码、解码方法及装置、*** |
-
2009
- 2009-06-25 CN CN2009101518356A patent/CN101615395B/zh active Active
- 2009-12-30 WO PCT/CN2009/076306 patent/WO2010075792A1/zh active Application Filing
- 2009-12-30 BR BRPI0923887-5A patent/BRPI0923887A2/pt not_active IP Right Cessation
- 2009-12-30 KR KR1020117017706A patent/KR101350285B1/ko active IP Right Grant
- 2009-12-30 EP EP09836079A patent/EP2385522A1/en not_active Withdrawn
- 2009-12-30 JP JP2011543970A patent/JP5436576B2/ja active Active
- 2009-12-30 RU RU2011132152/08A patent/RU2486610C2/ru active
- 2009-12-30 EP EP20130186070 patent/EP2680444A1/en not_active Withdrawn
-
2011
- 2011-06-29 US US13/172,575 patent/US8515744B2/en active Active
-
2013
- 2013-07-17 US US13/943,812 patent/US8712763B2/en active Active
- 2013-08-09 JP JP2013165706A patent/JP5521097B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
BRPI0923887A2 (pt) | 2015-07-28 |
JP2012514225A (ja) | 2012-06-21 |
KR101350285B1 (ko) | 2014-01-10 |
JP5436576B2 (ja) | 2014-03-05 |
US20130304460A1 (en) | 2013-11-14 |
KR20110110262A (ko) | 2011-10-06 |
EP2680444A1 (en) | 2014-01-01 |
WO2010075792A1 (zh) | 2010-07-08 |
EP2385522A4 (en) | 2011-11-09 |
JP2013232013A (ja) | 2013-11-14 |
US8712763B2 (en) | 2014-04-29 |
RU2011132152A (ru) | 2013-02-20 |
US8515744B2 (en) | 2013-08-20 |
CN101615395A (zh) | 2009-12-30 |
RU2486610C2 (ru) | 2013-06-27 |
US20110313761A1 (en) | 2011-12-22 |
CN101615395B (zh) | 2011-01-12 |
EP2385522A1 (en) | 2011-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5521097B2 (ja) | 信号を符号化する方法および信号を復号する方法 | |
USRE49363E1 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
RU2437172C1 (ru) | Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках | |
JP2006510947A (ja) | 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 | |
RU2005137320A (ru) | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
US9548056B2 (en) | Signal adaptive FIR/IIR predictors for minimizing entropy | |
KR100647290B1 (ko) | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 | |
US7318024B2 (en) | Method of converting codes between speech coding and decoding systems, and device and program therefor | |
JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JPH11184498A (ja) | 音声符号化/復号化方法 | |
KR101996307B1 (ko) | 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체 | |
JP5663461B2 (ja) | 符号化方法、符号化装置、プログラム、記録媒体 | |
JP3067676B2 (ja) | Lspの予測符号化装置及び方法 | |
US9620139B2 (en) | Adaptive linear predictive coding/decoding | |
JP3874851B2 (ja) | 音声符号化装置 | |
JPH06222796A (ja) | 音声符号化方式 | |
JPH09269798A (ja) | 音声符号化方法および音声復号化方法 | |
JPH05341800A (ja) | 音声符号化装置 | |
JPH11327596A (ja) | 音声符号化/復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140407 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5521097 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |