JP5521097B2 - 信号を符号化する方法および信号を復号する方法 - Google Patents

信号を符号化する方法および信号を復号する方法 Download PDF

Info

Publication number
JP5521097B2
JP5521097B2 JP2013165706A JP2013165706A JP5521097B2 JP 5521097 B2 JP5521097 B2 JP 5521097B2 JP 2013165706 A JP2013165706 A JP 2013165706A JP 2013165706 A JP2013165706 A JP 2013165706A JP 5521097 B2 JP5521097 B2 JP 5521097B2
Authority
JP
Japan
Prior art keywords
signal
region
prediction
ltp
residual signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013165706A
Other languages
English (en)
Other versions
JP2013232013A (ja
Inventor
チャン、デジュン
ミャオ、レイ
シュ、ジァンフェン
チ、フェンヤン
チャン、チン
リ、リション
マ、フウェイ
ガオ、ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2013232013A publication Critical patent/JP2013232013A/ja
Application granted granted Critical
Publication of JP5521097B2 publication Critical patent/JP5521097B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本出願は、参照により本明細書に組み込まれる、2008年12月31日に出願された「Method for Encoding Signal,and Method for Decoding Signal」という名称の中国特許出願第200810247427.6号、および2009年6月25日に出願された「Method for Encoding Signal,and Method for Decoding Signal」という名称の中国特許出願第200910151835.6号の優先権を主張するものである。
本開示は音声の符号化および復号に関し、詳細には、信号を符号化し、復号する方法、装置、およびシステムに関する。
音声符号化分野において広く適用される符号化モデルのうちの1つが符号励振線形予測(CELP:Code Excited Linear Prediction)である。CELPモデルはほぼ白色の励振信号を使用して2つの時間変化線形再帰型フィルタを励振する。励振信号は一般にガウス白色雑音シーケンスから成るコードブックの中から選択される。各フィルタのフィードバックループは予測器を含む。予測器の1つが長期予測器(またはピッチ予測器)であり、これはP(z)で表される。P(z)は発声された音声の音調構造(例えばスペクトルの微細な構造など)を生成するのに使用される。別の一般的な予測器が短期予測器であり、F(z)で表される。F(z)は音声の短期スペクトルエンベロープを回復するのに使用される。このモデルはその逆のプロセスに由来する。すなわち、F(z)は音声信号の近いサンプル点の冗長性を除去するのに使用され、P(z)は音声信号の遠いサンプル点の冗長性を除去するのに使用される。2つのレベルの予測により正規化された残差信号が獲得される。残差信号はおおよそ標準正規分布を示す。
CELPモデルが損失の多い圧縮分野に適用されるときには、音声信号x(i)をまず線形予測符号化(LPC:Linear Predictive Coding)解析して残差信号res(i)が獲得される。LPC残差信号res(i)がフレーム化された後で、各サブフレーム信号に長期予測(LTP:Long−Term Prediction)解析を施して、対応する適応コードブックおよび適応コードブック利得が獲得される。適応コードブックは、自己相関など、多くの方法において探索され得る。LPC残差信号res(i)の長期依存性が除去された後で、LTP残差信号x2(i)が獲得される。代数コードブックを使用してLTP残差信号x2(i)が特徴付けられ、または当てはめられた後で、全符号化プロセスが完了する。最後に、適応コードブックおよび固定コードブックが符号化されてビットストリームに書き込まれ、適応コードブック利得および固定コードブック利得についての結合ベクトル量子化(joint vector quantization)またはスカラ量子化が行われる。コードブックにおいて、適応コードブック利得または固定コードブック利得が最適な利得として選択される。最適な利得に対応するインデックスが復号器に送られる。全符号化プロセスは、パルス符号変調(PCM:Pulse Code Modulation)領域で行われる。
無損失圧縮の分野では、MPEG ALC(Moving Pictures Experts Group Audio Lossless Coding)装置は、予測のために音声信号の短期および長期の依存性も使用する。その予測プロセスは以下の通りである。まず、音声信号についてLPC解析が行われ、LPC係数にエントロピー符号化が施され、ビットストリームに書き込まれる。次に、LTPのピッチおよびピッチ利得を獲得するためにLPC残差信号についてLTPが行われ、LPC残差信号がビットストリームに書き込まれる。LTPの後でLTP残差信号が獲得される。最後に、LTP残差信号にエントロピー符号化が施されてビットストリームに書き込まれ、全符号化プロセスが終了する。
前述の先行技術においては、音声信号の周期性が少ない場合、LTP処理の貢献度はほとんどない。この場合、LTP残差信号はそれでもなおビットストリームに書き込まれる。結果としてピッチ利得量子化は過度に多くのビットを消費し、符号器の圧縮性能が低下する。
本開示の実施形態はコーデックの圧縮性能を改善するように信号を符号化し、復号する方法、装置、およびシステムを提供する。
第1の観点において、信号符号化方法が提供される。方法は、
第1領域の信号を第2領域の信号に変換すること、
第2領域の信号についてLP(Linear Predictive)処理およびLTP(Long−Term Prediction)処理を行うこと、
判断基準に従って長期フラグを獲得すること、
長期フラグが第1の値であるときにLP処理の結果およびLTP処理の結果に従って第2領域の予測信号を獲得すること、または、長期フラグが第2の値であるときにLP処理の結果に従って第2領域の予測信号を獲得すること、
第2領域の予測信号を第1領域の予測信号に変換して第1領域の予測残差信号を計算すること、ならびに
第1領域の予測残差信号を含むビットストリームを出力すること
を含む。
第2の観点において信号復号方法が提供される。方法は、
受け取ったビットストリームを復号して第1領域の予測残差信号を獲得すること、
ビットストリームの現在フレームの第1のサンプル点を復号すること、
現在フレームの第2のサンプル点から始まる各ンプル点について連続して、
復号されたサンプル点の第2領域の信号に従ってサンプル点のLP(Linear Predictive)信号を計算するステップと、
獲得された長期フラグ値が第1の値である場合に、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得するステップと、
獲得される長期フラグ値が第1の値でない場合に、LP信号に従って第2領域の予測信号を獲得するステップと、
第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号するステップと、
現在サンプル点の第1領域の信号を第2領域の信号に変換し、第2領域の信号およびLP信号に従ってLP残差信号を獲得するステップと
の各復号ステップを実行すること
を含む。
第3の観点において信号符号化装置が提供される。信号符号化装置は、
第1領域の信号を第2領域の信号に変換し、第2領域の予測信号を第1領域の予測信号に変換するように構成された変換モジュールと、
第2領域の信号についてLP処理を行うように構成されたLP(Linear Predictive)モジュールと、
第2領域の信号についてLTP処理を行うように構成されたLTP(Long−Term Prediction)モジュールと、
判断基準に従って長期フラグを獲得するように構成された判断モジュールと、
長期フラグが第1のであるときに第2領域のLP処理の結果および第2領域のLTP処理の結果に従って第2領域の予測信号を獲得し、長期フラグが第2のであるときに第2領域のLP処理の結果に従って第2領域の予測信号を獲得するように構成された第2領域の予測モジュールと、
第1領域の予測信号に従って第1領域の予測残差信号を計算するように構成された第1領域の予測残差モジュールと、
第1領域の予測残差信号を含むビットストリームを出力するように構成された出力モジュールと
を含む。
第4の観点において信号復号装置が提供される。信号復号装置は、
受け取ったビットストリームを復号して第1領域の予測残差信号を獲得するように構成されたビットストリーム復号モジュールと、
現在フレームの信号の第1のサンプル点を復号するように構成された第1のサンプル点復号モジュールと、
復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号を計算するように構成されたLPモジュールと、
獲得された長期フラグが第1のである場合に、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得し、獲得された長期フラグが第1のでない場合に、LP信号に従って第2領域の予測信号を獲得するように構成された第2領域の予測モジュールと、
第2領域の予測信号を第1領域の予測信号に変換し、現在サンプル点の第1領域の信号を第2領域の信号に変換するように構成された変換モジュールと、
第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号するように構成された現在サンプル点復号モジュールと、
第2領域の信号およびLP予測信号に従ってLP残差信号を獲得するように構成されたLP残差モジュールと
を含む。
第5の観点において信号コーデックシステムが提供される。信号コーデックシステムは、
第1領域の信号を第2領域の信号に変換し、第2領域の信号についてLP(Linear Predictive)処理およびLTP(Long−Term Prediction)処理を行い、判断基準に従って長期フラグを獲得し、長期フラグが第1のであるときに第2領域のLP処理の結果および第2領域のLTP処理の結果に従って第2領域の予測信号を獲得し、長期フラグが第2のであるときに第2領域のLP処理の結果に従って第2領域の予測信号を獲得し、第2領域の予測信号を第1領域の予測信号に変換して第1領域の予測残差信号を計算し、第1領域の予測残差信号を含むビットストリームを出力するように構成された信号符号化装置と、
受け取ったビットストリームを復号して第1領域の予測残差信号および長期フラグを獲得し、現在フレームの信号の第1のサンプル点を復号し、現在フレームの信号の第2のサンプル点の各現在サンプル点について連続して、復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号を計算するステップと、獲得された長期フラグが第1の値である場合に、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得し、獲得された長期フラグが第1のでない場合に、LP信号に従って第2領域の予測信号を獲得するステップと、第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号するステップと、現在サンプル点の第1領域の信号を第2領域の信号に変換し、第2領域の信号およびLP信号に従ってLP残差信号を獲得するステップとの各復号ステップを実行するように構成された信号復号装置と
を含む。
本開示の実施形態によれば、後続の符号化または復号プロセスが長期フラグに従って適応的に行われる。長期フラグが第2のであるときにはLTP処理の結果を考慮する必要がなく、よってコーデックの圧縮性能が向上する。
本開示の第1の実施形態における信号符号化方法を示す流れ図である。 本開示の第2の実施形態における信号符号化方法を示す流れ図である。 本開示の第2の実施形態の信号符号化方法におけるフレーム化後のフレームの信号を示す図である。 本開示の第3の実施形態における信号復号方法を示す流れ図である。 本開示の第4の実施形態における信号復号方法を示す流れ図である。 本開示の第4の実施形態の信号復号方法におけるステップ404を示す流れ図である。 本開示の第4の実施形態の信号復号方法におけるステップ405を示す流れ図である。 本開示の第5の実施形態における信号符号化装置の簡易ブロック図を示す図である。 本開示の第6の実施形態における信号復号装置の簡易ブロック図を示す図である。 本開示の第7の実施形態における信号コーデックシステムの簡易ブロック図を示す図である。
以下、添付の図面および例示的実施形態を参照して本開示をより詳細に説明する。
図1は本開示の第1の実施形態における信号符号化方法の流れ図である。この方法は以下のステップを含む。
ステップ101:第1領域の信号を第2領域の信号に変換する。
ステップ102:第2領域の信号についてLP(Linear Predictive)処理およびLTP(Long−Term Prediction)処理を行う。
ステップ103:判断基準に従って長期フラグを獲得する。
ステップ104:長期フラグが第1のであるときには第2領域のLP処理の結果および第2領域のLTP処理の結果に従って第2領域の予測信号を獲得し、長期フラグが第2のであるときには第2領域のLP処理の結果に従って第2領域の予測信号を獲得する。
ステップ105:第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号を計算する。
ステップ106:第1領域の予測残差信号を含むビットストリームを出力する。
この実施形態では、長期フラグが判断基準に従って獲得され、長期フラグが第1のであるときには第2領域の予測信号がLP処理の結果およびLTP処理の結果に従って獲得され、長期フラグが第2のであるときには第2領域の予測信号がLP処理の結果に従って獲得され、ビットストリームが第2領域の予測信号に従って獲得される。この実施形態では、後続の符号化プロセスは長期フラグに従って適応的に行われる。長期フラグが第2のであるときには、LTP処理の結果を考慮する必要がなく、よってコーデックの圧縮性能が向上する。
図2は本開示の第2の実施形態における信号符号化方法の流れ図である。この実施形態では、第1領域は非線形領域であり、さらに第1領域はA−則領域またはμ−則領域とすることができ、第2領域はPCM領域であり、LP処理はLPC(Linear Predictive Coding)処理であり、LTP処理は長期予測処理である。
この実施形態における方法は以下のステップを含む。
ステップ201:非線形領域信号をPCM領域信号に変換する。
入力信号はフレームの形式を有して良い。フレーム長Lはフレーム内のサンプル数により表される。x(i)は非線形領域信号を表し、y(i)はPCM領域信号を表すと仮定する。ここで、iはフレーム内のi番目のサンプルを指す。さらに、変換プロセスが精度損失を伴い、対応する後方変換プロセスは精度損失を伴わないと仮定する
ステップ202:PCM領域の全フレーム信号y(i)についてLPC処理を行ってLP処理の結果を獲得する。LP処理の結果は、次式で表すように、LP信号として働き、LP係数で表されるLPC予測信号y’(i)を含む。
Figure 0005521097
式中、aはLP係数であり、Lはフレーム長であり、lpc_orderはLP次数である。y’(0)=0であると仮定すると、i<0のとき、y(i)=0である。
ステップ203:PCM領域信号y(i)およびLPC予測信号y’(i)に従ってLP残差信号として機能するLPC残差信号res(i)を計算する。その場合LPC残差信号はLP処理の結果として理解され得る。
res(i)=y(i)−y’(i)、i=0,1,…,L−1 (2)
ステップ204:LTP残差信号res(i)についてフレーム化を行い、次いでLTP処理を行ってLTP処理の結果を獲得する。フレーム化操作は任意選択であり、適応的フレーム化操作とすることができる。LTP処理の結果はピッチおよびピッチ利得を含む。
具体的には、このステップのLTP処理は、LPC残差信号のピッチ探索を行うこと、LPC残差信号の最適のピッチを獲得すること、またはLPC残差信号の最適のピッチとピッチ利得の両方を獲得することを含み得る。
具体的には、このステップは、フレーム化が行われない場合には、現在フレームのPCM領域信号のピッチ探索を行ってPCM領域信号の最適のピッチを獲得し、次いで、PCM領域信号の最適のピッチに従ってLPC残差信号の密探索を行ってLPC残差信号の最適のピッチを獲得し、またはLPC残差信号の最適のピッチとピッチ利得の両方を獲得すること、フレーム化が行われる場合には、フレーム化操作の前に、現在フレームのPCM領域信号のピッチ探索を行ってPCM領域信号の最適のピッチを獲得し、現在フレームのPCM領域信号の最適のピッチを第1のサブフレームの最適のピッチとして使用し、最適のピッチに従ってLPC残差信号についてのフレーム化を行うこと、残差領域内の各サブフレームのピッチの密探索を行い、すなわち、前のサブフレームのピッチの前後の各サブフレームのピッチを探索し、よって、サブフレームピッチについての差分符号化を円滑化し、各サブフレームの最適のピッチを獲得し、または最適のピッチとピッチ利得の両方を獲得すること、を含み得る。
前述のピッチを探索するプロセスでは、ピッチ利得が獲得されない場合、ピッチ利得は獲得された最適のピッチに従って適応的に選択され得る。
LPC処理では、最初の数サンプルの予測結果は一般に不正確である。LTP性能に影響を及ぼさないように、この実施形態では、Mを指定の数とする最初のMサンプルはLTP処理に関与しないものと規定する。ピッチ探索は、最初のMサンプル以外のサンプルのLPC残差信号res(i)について行われて、各サブフレームのピッチ、ピッチ利得およびLTP残差信号z(i)が獲得される。
図3に、本開示の第2の実施形態の信号符号化方法におけるフレーム化後のフレームの信号を示す。最初のMサンプルはフレーム化にもLTP処理にも関与せず、Mとlpc_orderとの関係は、0≦M≦lpc_orderである。Tは第1のサブフレームのピッチを表し、MからT+M−1までのサンプルがバッファ内のサンプルである。n=T+Mであると仮定すると、nからn−1までのサンプルは第1のサブフレーム内のサンプルであり、第1のサブフレームの長さはN=n−nである。類推により、nj−1からn−1までのサンプルはサブフレームj内のサンプルであり、サブフレームjの長さはN=n−nj−1である。1フレーム内の信号のサンプルの総量はLである。
0からT+M−1までのサンプルについて、以下の式が当てはまる。
z(i)=res(i)、i=0,1,…,T+M−1 (3)
ここで、z(i)は、LTP残差信号である。
第1のサブフレームのサンプルについて、以下の式が当てはまる。
z(i)=res(i)−g・res(i−T)、i=n,…,n−1 (4)
式中、gは第1のサブフレームのピッチ利得を表す。
サブフレームjのサンプルについて、以下の式が当てはまる。
(i)=res(i)−g・res(i−T)、i=nj−1,…,n−1 (5)
式中、Tはサブフレームjのピッチを表し、gはサブフレームjのピッチ利得を表す。
ステップ205:経験的係数とLTP処理を施されていないLPC残差信号res(i)のエネルギーの積がLTP処理を施されたLTP残差信号z(i)のエネルギーより大きいかどうか判断し、そうである場合にはステップ206に進み、そうでない場合にはステップ207に進む。
Figure 0005521097
Figure 0005521097
E1はLTP残差信号z(i)のエネルギーを表し、EはLPC残差信号res(i)のエネルギーを表し、kは0またはMとすることができる。このステップでは、E*facがE1より大きいかどうか判断し、facは経験的係数である。一般には、fac=0.94である。
別の実施形態として、このステップの代替として、経験的係数とLTP処理を施されていないLPC残差信号res(i)の絶対値の和の積がLTP処理を施されたLTP残差信号z(i)の絶対値の和より大きいかどうか判断し、そうである場合にはステップ206に進み、そうでない場合にはステップ207に進む。
ステップ206:長期フラグTflagに第1のを割り当てる。具体的には、Tflagを1とする。ステップ208に進む。
長期フラグはLTP処理のためのトリガ信号とすることができる。Tflag=1である場合、LTP処理行われることを示す。
ステップ207:長期フラグTflagに第2の値を割り当てる。具体的には、Tflagを0とする。ステップ210に進む。Tflag=0である場合、LTP処理行われないことを示す。
ステップ208:ピッチ、ピッチ利得およびLPC残差信号res(i)に従ってLTP寄与信号res’(i)を獲得する。このステップはステップ204にも含まれ得る。すなわちこのステップはLTP処理に含まれていてもよく、LTP処理の結果はさらに式(8)に表すLTP寄与信号res’(i)を含む。
res’(i)=g・res(i−T) (8)
ステップ209:式(9)に表すように、LPC予測信号y’(i)とLTP寄与信号res’(i)の和をPCM予測信号y’’(i)として使用し、ステップ211に進む。
y’’(i)=y’(i)+res’(i) (9)
ステップ210:式(10)に表すように、LPC予測信号y’(i)をPCM予測信号y’’(i)として使用し、ステップ211に進む。
y’’(i)=y’(i) (10)
ステップ211:式(11)に表すように、PCM予測信号y’’(i)を非線形領域予測信号x’(i)に変換する。
x’(i)=PCM2A[y’’(i)] (11)
関数PCM2A[]は、PCM領域信号をA−則領域信号に変換することを指す。
ステップ212:x(i)とx’(i)との差を計算して非線形領域予測残差信号を獲得し、非線形領域予測残差信号についてエントロピー符号化を行う。
ステップ213:非線形領域予測残差信号のエントロピー符号および長期フラグを含むビットストリームを出力する。具体的には、Tflag=0であるときには、ビットストリームはさらにLPC係数aを含み、Tflag=1であるときには、ビットストリームはさらにLPC係数a、ピッチ、およびピッチ利得を含む。
場合によっては、長さ変化符号化分野において、Tflag=0であるときには、LTP処理行われず、ビットストリームに長期フラグ値を含める必要はなく、Tflag=1であるときには、LTP処理行われ、長期フラグがビットストリームに含まれ、このビットストリームはさらにLPC係数a、ピッチ、およびピッチ利得を含む。
この実施形態では、経験的係数とLTP処理を施されていないLPC残差信号のエネルギーの積がLTP処理を施されたLTP残差信号のエネルギーより大きいかどうか判定することにより、システムは、LTP処理行われるかそれとも行われないかを知る。音声信号があまり周期的でないとき、LTP処理はほとんど寄与せず、LTP処理行われない。したがって、LTP寄与信号を考慮する必要がない。すなわち消費されるビット数がより少なく、符号器の圧縮性能が向上する。
図4は本開示の第3の実施形態における信号復号方法の流れ図である。この実施形態における方法は、第1の実施形態における信号符号化方法に対応しており、本実施形態における用語およびパラメータ式の定義は第1の実施形態と同様である。この方法は以下のステップを含む。
ステップ301:受け取ったビットストリームを復号して第1領域の予測残差信号を獲得する。
ステップ302:現在フレームの信号の第1のサンプル点を復号する。
現在フレームの信号の第2のサンプル点の各現在サンプル点について連続して以下の復号ステップ303〜306を行う。
ステップ303:復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号およびLP残差信号を計算する。
ステップ304:獲得された長期フラグが第1のである場合には、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の信号を獲得し、獲得された長期フラグが第1のでない場合には、LP信号に従って第2領域の予測信号を獲得する。
ステップ305:第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号する。
ステップ306:現在サンプル点の第1領域の信号を第2領域の信号に変換する。
この実施形態では後続の復号プロセスが長期フラグに従って適応的に行われ、長期フラグが第2のであるときには、LTP寄与信号を考慮する必要がなく、よって復号プロセスが簡略化される。
図5は本開示の第4の実施形態における信号復号方法の流れ図である。この実施形態の方法は第2の実施形態における信号符号化方法に対応させることができ、この実施形態における用語およびパラメータ式の定義は第2の実施形態のものと同じである。この実施形態の方法は以下のステップを含む。
ステップ401:受け取ったビットストリームを復号して非線形領域予測残差信号および長期フラグを獲得する。
場合によっては、ビットストリームが長期フラグを用いて符号化されたビットストリームである場合に、ビットストリームは長期フラグを獲得するために復号され得る。具体的には、長期フラグTflag=0であるときに、ビットストリームはさらにLPC係数aを含み、Tflag=1であるときに、ビットストリームはさらにLPC係数a、最適のピッチを含み、その上にピッチ利得も含み得る。ビットストリームがピッチ利得を含まない場合、この実施形態の方法はさらに、最適のピッチに従って適応的にピッチ利得を選択することを含む。
d(i)が非線形領域予測残差信号を表すものと仮定すると、以下の式が当てはまる。
d(i)=x(i)−x’(i)、i=0,1,…,L−1 (12)
したがって、非線形領域信号x(i)は、復号後に式(13)によって獲得され得る。
x(i)=d(i)+x’(i)、i=0,1,…,L−1 (13)
ステップ402:現在フレームの信号の第1のサンプル点を復号する。
第1のサンプル点はLPC処理を施されていない。したがって、第1のサンプル点の非線形領域予測信号はx’(0)=0になる。式(13)は、非線形領域の第1のサンプル点が損失なしで復号され得ること、すなわちx(0)=d(0)であることを明らかにする。
後続の復号プロセスについて、この実施形態は第1のサンプル点のPCM領域信号y(0)およびLPC残差信号res(0)(すなわちLP残差信号)を保持する必要があり、その場合、
y(0)=A2PCM[x(0)]、res(0)=y(0) (14)
である。
関数A2PCM[]は、A−則領域信号をPCM領域信号に変換することを指す。
場合によっては、長さ変化符号化分野において、受け取ったビットストリームが復号されて、第2のである長期フラグを獲得せずに、第1領域の予測残差信号が獲得される。復号結果が第1のである長期フラグを含むときにはLTPモジュールが有効化されることを示し、そうでない場合にはLTPモジュールは無効化される。システムは、獲得された長期フラグが第1のである場合には、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得し、獲得された長期フラグが第1のでない場合にはLP信号に従って第2領域の予測信号を獲得する。
ステップ403:長期フラグが第1のであるかどうか判断し、そうである場合にはステップ404〜405に進み、そうでない場合には、ステップ406〜408に飛ぶ。
LTP処理は2つのオプション、すなわち実行される(Tflag=1)と実行されない(Tflag=0)になる。このステップでは、システムは、Tflag=1であるかどうか判断する。代替としてシステムは、Tflag=0であるかどうか判断してLTP処理実行されるかどうか知ることもできる。LTP処理の異なる状態は異なる後続の復号プロセスに対応する。
この実施形態のステップ403が完了した後、続いて行われる復号プロセスは循環再帰プロセスである。以下の復号ステップは現在フレームの信号の第2のサンプル点の各現在サンプル点について連続して行われる。
場合によっては、符号器側が第2のである長期フラグの符号を出力しない場合に、システムは第1のが長期フラグとして獲得されるかどうか判断し、それが第1の値である場合にはステップ404〜405が行われ、そうでない場合にはステップ406〜408が行われる。
ステップ404:第1のサンプル点を除く最初のT+M−1サンプルを復号する。
この実施形態の方法は第2の実施形態の信号符号化方法に対応する。すなわち、符号化プロセスにおいて、現在フレームの最初のMサンプルはLTP処理に関与しない。したがってこの実施形態では、最初のMサンプルおよびバッファ内のサンプルがまず復号される。図6は本開示の第4の実施形態の信号復号方法におけるステップ404の流れ図である。ステップ404はさらに以下のステップを含み得る。
ステップ4041:式(15)により、復号されたサンプル点のPCM領域信号y(i)に従って現在サンプル点のLPC予測信号y’(i)を計算する。
Figure 0005521097
i≦0のとき、y(i)=0である。
例えば、現在サンプル点が現在フレームの信号の第2のサンプル点である場合、復号されたサンプル点は現在フレームの信号の第1のサンプル点である。この場合、ステップ402の復号結果が基準として使用される。
ステップ4042:現在のサンプルのLPC予測信号y’(i)に従ってPCM領域予測信号y’’(i)を獲得する。最初のT+MサンプルはLTP処理に関与しないため、y’’(i)=y’(i)である。すなわち、現在サンプル点のLPC予測信号の値がPCM領域予測信号y’’(i)に割り当てられる。
ステップ4043:PCM領域予測信号y’’(i)を非線形領域予測信号x’(i)に変換する。
x’(i)=PCM2A[y’’(i)] (16)
ステップ4044:非線形領域予測信号x’(i)および非線形領域予測残差信号d(i)に従って式(13)により非線形領域信号x(i)を獲得する。
ステップ4045:後続のサンプルを復号するために、非線形領域信号x(i)をPCM領域信号y(i)に変換し、PCM領域信号y(i)およびLPC予測信号y’(i)に従ってLPC残差信号res(i)を獲得する。
res(i)=y(i)−y’(i)、i=0,1,…,T+M−1 (17)
ステップ405:最初のT+Mサンプルを除くすべてのサブフレーム信号を復号する。
図7は本開示の第4の実施形態の信号復号方法におけるステップ405の流れ図である。ステップ405は以下のステップを含み得る。
ステップ4051:式(18)により、復号されたサンプル点のPCM領域信号y(i)に従って現在サンプル点のLPC予測信号y’(i)を計算する。
Figure 0005521097
i≦0のとき、y(i)=0である。
例えば、現在サンプル点が第1のサブフレームの第1のサンプル点である場合、復号されたサンプルは最初のT+Mサンプルである。この場合、ステップ404の復号結果が基準として使用される。
ステップ4052:式(19)により、現在サンプル点のLPC予測信号y’(i)に従ってPCM領域予測信号y’’(i)を計算する。
y’’(i)=y’(i)+res’(i)=y’(i)+g・res(i−T) (19)
ステップ4053:PCM領域予測信号y’’(i)を非線形領域予測信号x’(i)に変換する。
x’(i)=PCM2A[y’’(i)] (20)
ステップ4054:非線形領域予測信号x’(i)および非線形領域予測残差信号d(i)に従って式(13)により非線形領域信号x(i)を獲得する。
ステップ4055:後続のサンプルを復号するために、非線形領域信号x(i)をPCM領域信号y(i)に変換し、PCM領域信号y(i)およびLPC予測信号y’(i)に従ってLPC残差信号res(i)を獲得する。
res(i)=y(i)−y’(i)、i=n,…,L−1 (21)
現在サンプル点の復号の完了後に、後続のサンプルを復号する過程において、ステップ4055で獲得されたLPC残差信号を使用して後続のサンプルのPCM領域予測信号が計算される。
ステップ406:式(22)により、復号されたサンプル点のPCM領域信号y(i)に従って現在サンプル点のLPC予測信号y’(i)を計算する。
Figure 0005521097
i≦0のとき、y(i)=0である。
ステップ407:LPC予測信号y’(i)をPCM領域予測信号として使用し、PCM領域予測信号を非線形領域予測信号x’(i)に変換する。
LTPモジュールは無効であり、現在フレーム信号のサンプル点はLTP処理に関与しないため、y’’(i)=y’(i)であり、y’(i)はx’(i)に直接変換され得る。
ステップ408:非線形領域予測信号x’(i)および非線形領域予測残差信号d(i)に従って式(13)により非線形領域信号x(i)を獲得する。
この実施形態では、後続の復号プロセスが長期フラグに従って適応的に行われ、長期フラグが第2のであるときには、LTP寄与信号を考慮する必要がなく、よって復号プロセスが簡略化される。
図8に、本開示の第5の実施形態における信号符号化装置の簡略構造を示す。この装置は、変換モジュール11、LPモジュール12、LTPモジュール13、判断モジュール14、第2領域の予測モジュール15、第1領域の予測残差モジュール16、および出力モジュール17を含む。変換モジュール11は、第1領域の信号を第2領域の信号に変換し、第2領域の予測信号を第1領域の予測信号に変換するように構成されている。LPモジュール12は第2領域の信号についてLP処理を行うように構成されている。LTPモジュール13は第2領域の信号についてLTP処理を行うように構成されている。判断モジュール14は、判断基準に従って長期フラグを獲得するように構成されている。第2領域の予測モジュール15は、長期フラグが第1のであるときにLP処理の結果およびLTP処理の結果に従って第2領域の予測信号を獲得し、長期フラグが第2のであるときにLP処理の結果に従って第2領域の予測信号を獲得するように構成されている。第1領域の予測残差モジュール16は、第1領域の予測信号に従って第1領域の予測残差信号を計算するように構成されている。出力モジュール17は第1領域の予測残差信号を含むビットストリームを出力するように構成されている。
前述のLP処理の結果は、LP係数、LP信号およびLP残差信号を含み得る。前述のビットストリームはさらにLP係数を含み得る。
さらに、LTPモジュール13はLP残差信号のピッチ探索を行ってLP残差信号の最適のピッチまたは最適のピッチとピッチ利得の両方を獲得し、LTP寄与信号を獲得することができる。LTP処理の結果は、最適のピッチまたは最適のピッチとピッチ利得の両方、LTP寄与信号、およびLTP残差信号を含み得る。
第2領域の予測モジュール15は、長期フラグが第1のであるときに第2領域の予測信号としてLP残差信号とLTP寄与信号の和を使用し、長期フラグが第2のであるときに第2領域の予測信号としてLP信号を使用するように構成されている。
判断モジュール14は、2つの判断基準のいずれかに従って判断を行うことができる。すなわち、(a)経験的係数とLP残差信号のエネルギーの積がLTP残差信号のエネルギーより大きいかどうか判断するか、または、(b)経験的係数とLP残差信号の絶対値の和の積がLTP残差信号の絶対値の和より大きいかどうか判断することができる。経験的係数とLP残差信号のエネルギーの積がLTP残差信号のエネルギーより大きい場合、または、経験的係数とLP残差信号の絶対値の和の積がLTP残差信号の絶対値の和より大きい場合、判断モジュール14は長期フラグに第1のフラグの値を割り当て(長期フラグ値が第1の値であり)、そうでない場合、判断モジュール14は長期フラグに第2のフラグの値を割り当てる(長期フラグ値が第2の値である)
この実施形態の装置は、獲得された最適のピッチに従って適応的にピッチ利得を選択するピッチ利得モジュールをさらに含んでいてもよく、LP残差信号についてフレーム化を行うフレーム化モジュールをさらに含んでいてもよい。
この実施形態では、後続の符号化プロセスが長期フラグに従って適応的に行われ、長期フラグが第2のであるときにはLTP処理の結果を考慮する必要がなく、よってコーデックの圧縮性能が向上する。
図9に、本開示の第6実施形態における信号復号装置の簡略構造を示す。この装置は、ビットストリーム復号モジュール21、第1のサンプル点復号モジュール22、LPモジュール23、第2領域の予測モジュール24、変換モジュール25、現在サンプル点復号モジュール26、およびLP残差モジュール27を含む。ビットストリーム復号モジュール21は受け取ったビットストリームを復号して第1領域の予測残差信号を獲得するように構成されている。第1のサンプル点復号モジュール22は現在フレームの信号の第1のサンプル点を復号するように構成されている。LPモジュール23は復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号を計算するように構成されている。第2領域の予測モジュール24は、獲得された長期フラグが第1のである場合には、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得し、獲得された長期フラグが第1のでない場合には、LP信号に従って第2領域の予測信号を獲得するように構成されている。変換モジュール25は、第2領域の予測信号を第1領域の予測信号に変換し、現在サンプル点の第1領域の信号を第2領域の信号に変換するように構成されている。現在サンプル点復号モジュール26は、第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号するように構成されている。LP残差モジュール27は第2領域の信号およびLP信号に従ってLP残差信号を獲得するように構成されている。
さらに、長期フラグが第1のであり現在サンプル点が符号器におけるLTP処理に関与するときには、第2領域の予測モジュール24は第2領域の予測信号としてLP信号とLTP寄与信号の和を使用し、長期フラグが第1のであり現在サンプル点が符号器におけるLTP処理に関与しないときには、第2領域の予測モジュール24は第2領域の予測信号としてLP信号を使用する。
この実施形態の装置はさらに、獲得された最適のピッチに従って適応的にピッチ利得を選択するピッチ利得モジュールを含んでいてもよい。
この実施形態では、後続の復号プロセスが長期フラグに従って適応的に行われ、長期フラグが第2のフラグであるときにはLTP寄与信号を考慮する必要がなく、よって復号プロセスが簡略化される。
図10に本開示の第7の実施形態における信号コーデックシステムの簡略構造を示す。このシステムは信号符号化装置31と信号復号装置32とを含む。
信号符号化装置31は、第1領域の信号を第2領域の信号に変換し、第2領域の信号についてLP処理およびLTP処理を行い、判断基準に従って長期フラグを獲得し、長期フラグが第1のであるときにLP処理の結果およびLTP処理の結果に従って第2領域の予測信号を獲得し、長期フラグが第2のであるときにLP処理の結果に従って第2領域の予測信号を獲得し、第2領域の予測信号を第1領域の予測信号に変換して第1領域の予測残差信号を計算し、第1領域の予測残差信号を含むビットストリームを出力するように構成されている。
信号復号装置32は、受け取ったビットストリームを復号して第1領域の予測残差信号を獲得し、現在フレームの信号の第1のサンプル点を復号し、現在フレームの信号の第2のサンプル点の各現在サンプル点について連続して、復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号を計算するステップと、獲得された長期フラグが第1のである場合に、LP信号と、復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得するステップ、または、獲得された長期フラグが第1のでない場合に、LP信号に従って第2領域の予測信号を獲得するステップと、第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号および第1領域の予測信号に従って現在サンプル点の第1領域の信号を復号するステップと、現在サンプル点の第1領域の信号を第2領域の信号に変換し、第2領域の信号およびLP信号に従ってLP残差信号を獲得するステップとの各復号ステップを行うように構成されている。
さらに、この実施形態の信号符号化装置31は前述の各実施形態で説明したいずれかの信号符号化装置とすることができ、信号復号装置32は前述の各実施形態で説明したいずれかの信号復号装置とすることができる。
前述の方法実施形態の各ステップの全部または一部がプログラムによって命令されるハードウェアによって実施され得ることを当業者は理解することができる。このプログラムはコンピュータ可読記憶媒体に記憶され得る。実行されると、このプログラムは、前述の方法実施形態の各ステップを行う。記憶媒体は、例えば、読取り専用メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、磁気ディスク、コンパクトディスクなど、プログラムコードを記憶するのに適した任意の媒体とすることができる。
本開示はいくつかの例示的実施形態によって説明されているが、本開示はそのような実施形態だけに限定されるものではない。当業者は、明らかに、本開示の趣旨および範囲を逸脱することなく本開示に改変および変形を加えることができる。本開示は、それらの改変および変形が添付の特許請求の範囲およびその均等物によって定義される保護の範囲内に該当する限り、それらを包含するものである。

Claims (24)

  1. 非線形領域である第1領域の信号をPCM(Pulse Code Modulation)領域である第2領域の信号に変換すること、
    前記第2領域の信号についてLP(Linear Prediction)処理およびLTP(Long−Term Prediction)処理を行いLP残差信号を含むLP処理の結果およびLTP残差信号を含むLTP処理の結果を取得すること、
    前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得すること、
    前記長期フラグ値が第1の値であるときに前記LP処理の結果および前記LTP処理の結果に従って第2領域の予測信号を獲得するか、または、前記長期フラグ値が第2の値であるときに前記LP処理の結果に従って第2領域の予測信号を獲得すること、
    前記第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号を計算すること、ならびに
    前記第1領域の予測残差信号を含むビットストリームを出力すること
    を含む信号符号化方法。
  2. 前記LP処理の結果が1以上のLP係数、LP信号、およびLP残差信号を含み、前記ビットストリームが前記LP係数をさらに含む請求項1に記載の方法。
  3. 前記LTP処理の結果がLTP寄与信号を含む請求項に記載の方法。
  4. 前記LTP処理の結果が前記LP残差信号の最適のピッチまたは前記LP残差信号の前記最適のピッチと前記LP残差信号のピッチ利得の両方をさらに含み、前記LTP処理を行うことが、
    前記LP残差信号のピッチ探索を行うこと、
    前記LP残差信号の前記最適のピッチまたは前記LP残差信号の前記最適のピッチと前記LP残差信号の前記ピッチ利得の両方を獲得すること、ならびに
    前記LP残差信号、および前記LP残差信号の前記最適のピッチと前記LP残差信号の前記ピッチ利得のうちの少なくとも1つに従ってLTP寄与信号を獲得すること
    を含む請求項3に記載の方法。
  5. 前記LP処理を行う前に、
    前記第2領域の信号のピッチ探索を行うこと、および
    前記第2領域の信号の最適のピッチを獲得すること
    をさらに含む請求項に記載の方法。
  6. 前記LTP処理を行うことが、
    前記第2領域の信号の前記最適のピッチに従ってLP残差信号の密探索を行うこと、
    前記LP残差信号の最適のピッチまたは前記LP残差信号の前記最適のピッチと前記LP残差信号のピッチ利得の両方を獲得すること、ならびに
    前記LP残差信号、および前記LP残差信号の前記最適のピッチと前記LP残差信号の前記ピッチ利得のうちの少なくとも1つに従ってLTP寄与信号を獲得すること
    を含む請求項に記載の方法。
  7. 前記LP残差信号の前記密探索を行い、前記LP残差信号の前記最適のピッチを獲得するときに、
    前記獲得された最適のピッチに従って適応的にピッチ利得を選択すること
    をさらに含む請求項に記載の方法。
  8. 前記LP処理の結果がLP信号を含み、
    前記LP処理の結果に従って第2領域の予測信号を獲得することが、
    前記第2領域の予測信号として前記LP信号を使用すること
    を含む請求項1に記載の方法。
  9. 前記LP処理の結果がLP信号を含み、前記LTP処理の結果がLTP寄与信号を含み、
    前記LP処理の結果および前記LTP処理の結果に従って第2領域の予測信号を獲得することが、
    前記第2領域の予測信号として前記LP信号と前記LTP寄与信号の和を使用すること
    を含む請求項1に記載の方法。
  10. 前記LTP処理の結果がLTP残差信号をさらに含み、前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得することが、
    前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギーより大きいかどうか判断すること、および
    前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギーより大きい場合に前記長期フラグ値に第1の値を割り当てること、または
    前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギー以下である場合に前記長期フラグ値に第2の値を割り当てること
    を含む請求項2に記載の方法。
  11. 前記LTP処理の結果がLTP残差信号をさらに含み、前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得することが、
    前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和より大きいかどうか判断すること、および
    前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和より大きい場合に前記長期フラグ値に前記第1の値を割り当てること、または
    前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和以下である場合に前記長期フラグ値に前記第2の値を割り当てること
    を含む請求項2に記載の方法。
  12. 前記LP残差信号の前記ピッチ探索を行う前に、
    前記LP残差信号をフレームに分割すること
    をさらに含む請求項4に記載の方法。
  13. 受け取ったビットストリームを復号して第1領域の予測残差信号と、前記受け取ったビットストリームのLP残差信号のエネルギーと前記受け取ったビットストリームのLTP残差信号のエネルギーとを比較した結果に従って特定された長期フラグと、を獲得すること、
    前記第1領域の予測残差信号の現在フレームの第1のサンプル点を復号すること、
    前記第1領域の予測残差信号の現在フレームの第2のサンプル点から前記第1領域の予測残差信号の現在フレームの各現在サンプル点について連続して、
    前記復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP(Linear Prediction)信号を計算するステップと、
    獲得された長期フラグ値が第1の値である場合に、前記LP信号と、前記復号されたサンプル点のLP残差信号に従って獲得されるLTP(Long−Term Prediction)寄与信号とに従って第2領域の予測信号を獲得するか、または、獲得された長期フラグ値が第1の値でない場合に、前記LP信号に従って第2領域の予測信号を獲得するステップと、
    前記第2領域の予測信号を第1領域の予測信号に変換し、前記第1領域の予測残差信号および前記第1領域の予測信号に従って前記現在サンプル点の第1領域の信号を復号するステップと、
    前記現在サンプル点の前記第1領域の信号を第2領域の信号に変換し、前記第2領域の信号および前記LP信号に従ってLP残差信号を獲得するステップと
    の各復号ステップを行うこと
    を含み、
    前記第1領域は非線形領域であり、前記第2領域はPCM(Pulse Code Modulation)領域であり、符号器側のLP処理の結果がLP残差信号を含み、符号器側のLTP処理の結果がLTP残差信号を含む、
    号復号方法。
  14. 前記LP信号およびLTP寄与信号に従って第2領域の予測信号を獲得することが、
    符号器側の前記現在サンプル点がLTP処理に関与する場合に、前記第2領域の予測信号として前記LP残差信号と前記LTP寄与信号の和を使用すること、
    符号器側の前記現在サンプル点がLTP処理に関与しない場合に、前記第2領域の予測信号としてLPC予測信号を使用すること
    を含む請求項13に記載の方法。
  15. 前記ビットストリームが最適のピッチとピッチ利得の両方を含み、または前記ビットストリームが前記最適のピッチおよびピッチ利得を含み、ゆえに、
    前記最適のピッチに従って適応的に前記ピッチ利得を選択すること
    をさらに含む請求項13に記載の方法。
  16. 非線形領域である第1領域の信号をPCM(Pulse Code Modulation)領域である第2領域の信号に変換し、第2領域の予測信号を第1領域の予測信号に変換するように構成された変換モジュールと、
    前記第2領域の信号についてLP(Linear Prediction)処理を行うことでLP残差信号を含むLP処理の結果を取得するように構成されたLPモジュールと、
    前記第2領域の信号についてLTP(Long−Term Prediction)処理を行うことでLTP残差信号を含むLTP処理の結果を取得するように構成されたLTPモジュールと、
    前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得するように構成された判断モジュールと、
    前記長期フラグ値が第1の値であるときに前記LP処理の結果および前記LTP処理の結果に従って第2領域の予測信号を獲得し、前記長期フラグ値が第2の値であるときに前記LP処理の結果に従って第2領域の予測信号を獲得するように構成された第2領域予測モジュールと、
    第1領域の予測信号に基づいて第1領域の予測残差信号を計算するように構成された第1領域予測残差モジュールと、
    符号化された前記第1領域の予測残差信号を含むビットストリームを出力するように構成された出力モジュールと、
    を含み、
    前記変換モジュール、前記LPモジュール、前記LTPモジュール、前記判断モジュール、前記第2領域予測モジュール、前記第1領域予測残差モジュール、および前記出力モジュールの少なくとも一つはハードウェアモジュールである、
    信号符号化器。
  17. 前記LP処理の結果が1以上のLP係数、LP予測信号、およびLP残差信号を含み、前記ビットストリームが前記LP係数を含み、
    前記LTPモジュールは、
    前記LP残差信号のピッチ探索を行い、前記LP残差信号の最適のピッチ、または前記LP残差信号の前記最適のピッチと前記LP残差信号のピッチ利得の両方を獲得し、LTP寄与信号を獲得する、ように構成されている
    請求項16に記載の信号符号化器。
  18. 前記獲得された最適のピッチに従って適応的にピッチ利得を選択するように構成されているピッチ利得モジュールをさらに含む請求項16に記載の信号符号化器。
  19. 前記LP処理の結果が1以上のLP係数、LP予測信号、およびLP残差信号を含み、前記ビットストリームが前記LP係数を含み、前記LTP処理の結果がLTP寄与信号を含み、
    前記信号符号化器は、
    前記長期フラグ値が第1の値であるときに前記第2領域の予測信号として前記LP残差信号と前記LTP寄与信号の和を使用し、
    前記長期フラグ値が第2の値であるときに前記第2領域の予測信号としてLPC予測信号を使用する、
    ように構成されている第2領域予測モジュールをさらに含む、
    請求項16に記載の信号符号化器。
  20. 前記LP処理の結果が1以上のLP係数、LP予測信号、およびLP残差信号を含み、前記ビットストリームが前記LP係数を含み、前記LTP処理の結果がLTP残差信号をさらに含み、
    前記判断モジュールが、
    前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギーより大きいかどうか判断し、前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギーより大きい場合に前記長期フラグに前記第1の値を割り当て、前記LP残差信号のエネルギーと経験的係数の積が前記LTP残差信号のエネルギー以下である場合に前記長期フラグに前記第2の値を割り当てるか、または、
    前記LP残差信号の絶対値の和と経験的係数との積がLTP残差信号の絶対値の和より大きいかどうか判断し、前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和より大きい場合に前記長期フラグ値に前記第1の値を割り当て、前記LP残差信号の絶対値の和と経験的係数との積が前記LTP残差信号の絶対値の和以下である場合に前記長期フラグ値に前記第2の値を割り当てる、ように構成されている、
    請求項16に記載の信号符号化器。
  21. 受け取ったビットストリームを復号して、第1領域の予測残差信号と、前記受け取ったビットストリームのLP残差信号のエネルギーと前記受け取ったビットストリームのLTP残差信号のエネルギーとを比較した結果に従って特定された長期フラグ値と、を獲得するように構成されたビットストリーム複合モジュールと、
    現在フレーム信号の第1のサンプル点を復号するように構成された第1サンプル点複合モジュールと、
    前記復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP(Linear Prediction)信号を計算するLPモジュールと、
    獲得された前記長期フラグ値が第1の値である場合に、前記LP信号と、前記復号されたサンプル点のLP残差信号に従って獲得されるLTP(Long−Term Prediction)寄与信号とに従って第2領域の予測信号を獲得するか、または獲得された長期フラグ値が第1の値でない場合に、前記LP信号に従って第2領域の予測信号を獲得するように構成された第2領域予測モジュールと、
    前記第2領域の予測信号を第1領域の予測信号に変換し、前記現在サンプル点の前記第1領域の信号を第2領域の信号に変換するように構成された変換モジュールと、
    前記第1領域の予測残差信号および前記第1領域の予測信号に従って前記現在サンプル点の第1領域の信号を復号する現在サンプル点復号モジュールと、
    前記現在サンプル点の前記第1領域の信号を第2領域の信号に変換し、前記第2領域の信号および前記LP信号に従ってLP残差信号を獲得するLP残差モジュールと、を含み、
    前記ビットストリーム複合モジュール、前記第1サンプル点複合モジュール、前記LPモジュール、前記第2領域予測モジュール、前記変換モジュール、前記現在サンプル点復号モジュール、および前記LP残差モジュールの少なくとも一つはハードウェアモジュールであり、前記第1領域は非線形領域であり、前記第2領域はPCM(Pulse Code Modulation)領域であり、符号器側のLP処理の結果がLP残差信号を含み、符号器側のLTP処理の結果がLTP残差信号を含む、
    信号復号器。
  22. 前記長期フラグ値が第1の値であり、符号器側の前記現在サンプル点がLTP処理に関与する場合に、前記第2領域の予測信号として前記LP残差信号と前記LTP寄与信号の和が使用され、
    前記長期フラグ値が第1の値であり、符号器側の前記現在サンプル点がLTP処理に関与しない場合に、前記第2領域の予測信号としてLPC予測信号が使用されること、
    を含む請求項21に記載の信号復号器。
  23. 適のピッチに従って適応的にピッチ利得を選択するように構成されたピッチ利得モジュールをさらに含む請求項21に記載の信号復号器。
  24. 非線形領域である第1領域の信号をPCM(Pulse Code Modulation)領域である第2領域の信号に変換し、前記第2領域の信号についてLP(Linear Prediction)処理およびLTP(Long−Term Prediction)処理を行いLP残差信号を含むLP処理の結果およびLTP残差信号を含むLTP処理の結果を取得し前記LP残差信号のエネルギーと前記LTP残差信号のエネルギーとを比較した結果に従って長期フラグ値を獲得し、前記長期フラグ値が第1の値であるときに前記LP処理の結果および前記LTP処理の結果に従って第2領域の予測信号を獲得し、前記長期フラグ値が第2の値であるときに前記LP処理の結果に従って第2領域の予測信号を獲得し、前記第2領域の予測信号を第1領域の予測信号に変換し、第1領域の予測残差信号を計算し、前記第1領域の予測残差信号を含むビットストリームを出力する、ように構成された信号符号化器と、
    受け取られた前記ビットストリームを復号して前記第1領域の予測残差信号および前記長期フラグ値を獲得し、現在フレーム信号の第1のサンプル点を復号し、前記現在フレーム信号の第2のサンプル点の各現在サンプル点について連続して、前記復号されたサンプル点の第2領域の信号に従って現在サンプル点のLP信号を計算するステップと、獲得された長期フラグ値が第1の値である場合に、前記LP信号と、前記復号されたサンプル点のLP残差信号に従って獲得されるLTP寄与信号とに従って第2領域の予測信号を獲得するステップと、獲得された長期フラグ値が第1の値でない場合に、前記LP信号に従って第2領域の予測信号を獲得するステップと、前記第2領域の予測信号を第1領域の予測信号に変換し、前記第1領域の予測残差信号および前記第1領域の予測信号に従って前記現在サンプル点の第1領域の信号を復号するステップと、前記現在サンプル点の前記第1領域の信号を第2領域の信号に変換し、前記第2領域の信号および前記LP信号に従ってLP残差信号を獲得するステップとの各復号ステップを行うように構成された信号復号器と、
    を含む信号コーデックシステム。
JP2013165706A 2008-12-31 2013-08-09 信号を符号化する方法および信号を復号する方法 Active JP5521097B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN200810247427.6 2008-12-31
CN200810247427 2008-12-31
CN200910151835.6 2009-06-25
CN2009101518356A CN101615395B (zh) 2008-12-31 2009-06-25 信号编码、解码方法及装置、***

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011543970A Division JP5436576B2 (ja) 2008-12-31 2009-12-30 信号を符号化する方法および信号を復号する方法

Publications (2)

Publication Number Publication Date
JP2013232013A JP2013232013A (ja) 2013-11-14
JP5521097B2 true JP5521097B2 (ja) 2014-06-11

Family

ID=41495006

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011543970A Active JP5436576B2 (ja) 2008-12-31 2009-12-30 信号を符号化する方法および信号を復号する方法
JP2013165706A Active JP5521097B2 (ja) 2008-12-31 2013-08-09 信号を符号化する方法および信号を復号する方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011543970A Active JP5436576B2 (ja) 2008-12-31 2009-12-30 信号を符号化する方法および信号を復号する方法

Country Status (8)

Country Link
US (2) US8515744B2 (ja)
EP (2) EP2385522A1 (ja)
JP (2) JP5436576B2 (ja)
KR (1) KR101350285B1 (ja)
CN (1) CN101615395B (ja)
BR (1) BRPI0923887A2 (ja)
RU (1) RU2486610C2 (ja)
WO (1) WO2010075792A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、***
IN2012DN05235A (ja) 2010-01-08 2015-10-23 Nippon Telegraph & Telephone
CN102812512B (zh) * 2010-03-23 2014-06-25 Lg电子株式会社 处理音频信号的方法和装置
CN104347067B (zh) * 2013-08-06 2017-04-12 华为技术有限公司 一种音频信号分类方法和装置
CN107452390B (zh) * 2014-04-29 2021-10-26 华为技术有限公司 音频编码方法及相关装置
WO2016017238A1 (ja) * 2014-07-28 2016-02-04 日本電信電話株式会社 符号化方法、装置、プログラム及び記録媒体
CN113574889B (zh) * 2019-03-14 2024-01-12 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
CN113129913B (zh) * 2019-12-31 2024-05-03 华为技术有限公司 音频信号的编解码方法和编解码装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE9006717U1 (de) * 1990-06-15 1991-10-10 Philips Patentverwaltung GmbH, 22335 Hamburg Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen
US5717824A (en) * 1992-08-07 1998-02-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear predictor with multiple codebook searches
JP3232701B2 (ja) 1992-10-15 2001-11-26 株式会社日立製作所 音声符号化方法
JPH07239699A (ja) 1994-02-28 1995-09-12 Hitachi Ltd 音声符号化方法およびこの方法を用いた音声符号化装置
US5659698A (en) 1994-11-01 1997-08-19 Motorola, Inc. Method and apparatus for generating a circular buffer address in integrated circuit that performs multiple communications tasks
US5652903A (en) * 1994-11-01 1997-07-29 Motorola, Inc. DSP co-processor for use on an integrated circuit that performs multiple communication tasks
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
US5978756A (en) * 1996-03-28 1999-11-02 Intel Corporation Encoding audio signals using precomputed silence
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
JP3426207B2 (ja) * 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
DE10124420C1 (de) * 2001-05-18 2002-11-28 Siemens Ag Verfahren zur Codierung und zur Übertragung von Sprachsignalen
JP4622164B2 (ja) * 2001-06-15 2011-02-02 ソニー株式会社 音響信号符号化方法及び装置
US20040167772A1 (en) * 2003-02-26 2004-08-26 Engin Erzin Speech coding and decoding in a voice communication system
RU2316059C2 (ru) * 2003-05-01 2008-01-27 Нокиа Корпорейшн Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
GB0326263D0 (en) * 2003-11-11 2003-12-17 Nokia Corp Speech codecs
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
TWI276047B (en) 2005-12-15 2007-03-11 Ind Tech Res Inst An apparatus and method for lossless entropy coding of audio signal
EP1852848A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
RU2319222C1 (ru) * 2006-08-30 2008-03-10 Валерий Юрьевич Тарасов Способ кодирования и декодирования речевого сигнала методом линейного предсказания
CN101197576A (zh) * 2006-12-07 2008-06-11 上海杰得微电子有限公司 一种音频信号编码、解码方法
CN101197577A (zh) * 2006-12-07 2008-06-11 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
CN101615395B (zh) 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、***

Also Published As

Publication number Publication date
BRPI0923887A2 (pt) 2015-07-28
JP2012514225A (ja) 2012-06-21
KR101350285B1 (ko) 2014-01-10
JP5436576B2 (ja) 2014-03-05
US20130304460A1 (en) 2013-11-14
KR20110110262A (ko) 2011-10-06
EP2680444A1 (en) 2014-01-01
WO2010075792A1 (zh) 2010-07-08
EP2385522A4 (en) 2011-11-09
JP2013232013A (ja) 2013-11-14
US8712763B2 (en) 2014-04-29
RU2011132152A (ru) 2013-02-20
US8515744B2 (en) 2013-08-20
CN101615395A (zh) 2009-12-30
RU2486610C2 (ru) 2013-06-27
US20110313761A1 (en) 2011-12-22
CN101615395B (zh) 2011-01-12
EP2385522A1 (en) 2011-11-09

Similar Documents

Publication Publication Date Title
JP5521097B2 (ja) 信号を符号化する方法および信号を復号する方法
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
RU2437172C1 (ru) Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках
JP2006510947A (ja) 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
RU2005137320A (ru) Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
US9548056B2 (en) Signal adaptive FIR/IIR predictors for minimizing entropy
KR100647290B1 (ko) 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
US7318024B2 (en) Method of converting codes between speech coding and decoding systems, and device and program therefor
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
JPH11184498A (ja) 音声符号化/復号化方法
KR101996307B1 (ko) 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体
JP3067676B2 (ja) Lspの予測符号化装置及び方法
US9620139B2 (en) Adaptive linear predictive coding/decoding
JP3874851B2 (ja) 音声符号化装置
JPH06222796A (ja) 音声符号化方式
JPH09269798A (ja) 音声符号化方法および音声復号化方法
JPH05341800A (ja) 音声符号化装置
JPH11327596A (ja) 音声符号化/復号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140407

R150 Certificate of patent or registration of utility model

Ref document number: 5521097

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250