JP6363683B2 - 高周波数領域の符号化及び復号化の方法並びに装置 - Google Patents

高周波数領域の符号化及び復号化の方法並びに装置 Download PDF

Info

Publication number
JP6363683B2
JP6363683B2 JP2016237817A JP2016237817A JP6363683B2 JP 6363683 B2 JP6363683 B2 JP 6363683B2 JP 2016237817 A JP2016237817 A JP 2016237817A JP 2016237817 A JP2016237817 A JP 2016237817A JP 6363683 B2 JP6363683 B2 JP 6363683B2
Authority
JP
Japan
Prior art keywords
signal
frequency
frequency component
unit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016237817A
Other languages
English (en)
Other versions
JP2017068276A (ja
Inventor
チュー,ギ−ヒョン
ポロフ,アントン
オー,ウン−ミ
キム,ジュン−フェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017068276A publication Critical patent/JP2017068276A/ja
Application granted granted Critical
Publication of JP6363683B2 publication Critical patent/JP6363683B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

本発明は、音声信号または音楽信号のようなオーディオ信号を符号化したり復号化する方法並びに装置に係り、さらに詳細には、オーディオ信号のうち、高周波数領域に該当する信号を符号化したり復号化する方法並びに装置に関する。
高周波数領域に該当する信号は、低周波数領域に該当する信号に比べて、人間が声として認識するのに重要性に劣るのが一般的である。従って、オーディオ信号を符号化するにおいて、可用ビットに対する制約があり、コーディングの効率を上げねばならない場合、低周波数領域に該当する信号には、多くのビットを割り当てて符号化するが、これに比べて、高周波数領域に該当する信号には、少ないビットを割り当てて符号化する。
しかし、場合によって、高周波数領域に該当する信号にも、人間が認識するのに重要な部分がありうる。この場合には、高周波数領域に該当する信号を正確に符号化せず、復号化端で、復号化された信号の音質が低下しうるという問題点を有する。
本発明がなそうとする技術的課題は、既設定の周波数より高い領域に該当する信号から重要な周波数成分を検出して符号化し、検出された周波数成分が含まれたバンド(band)を復元するために、信号のエネルギー値を符号化する方法並びに装置を提供することである。
本発明がなそうとする他の技術的課題は、重要な周波数成分が含まれたバンドを復元するために、信号を、重要な周波数成分のエネルギー値を考慮して調節することによって復号化する方法並びに装置を提供することである。
前記課題をなすための本発明による高周波数領域の符号化方法は、既設定の周波数より高い領域に該当する信号から、既設定の基準によって、周波数成分を検出して符号化する段階、及び前記検出された周波数成分が含まれたバンドを復元するために、信号のエネルギー値を符号化する段階を含むことを特徴とする。
前記課題をなすための本発明による高周波数領域の復号化方法は、既設定の周波数より高い領域に含まれる周波数成分を復号化する段階と、前記復号化された周波数成分が含まれたバンドを復元するために、信号のエネルギー値を復号化する段階と、前記バンドを復元するために信号を生成する段階と、前記復号化されたエネルギー値を基に、前記復号化された周波数成分のエネルギー値を考慮し、前記生成された信号のエネルギー値を調節する段階と、前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する段階とを含むことを特徴とする。
前記課題をなすための本発明による高周波数領域の復号化方法は、既設定の周波数より高い領域に含まれる周波数成分を復号化する段階と、既設定の周波数より低い領域に該当する信号を利用し、既設定の周波数より高い領域に該当する信号を復号化する段階と、前記復号化された周波数成分のエネルギー値を考慮し、前記復号化された信号のエネルギー値を調節する段階と、前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する段階とを含むことを特徴とする。
前記課題をなすための本発明による記録媒体は、既設定の周波数より高い領域に該当する信号から、既設定の基準によって、周波数成分を検出して符号化する段階、及び前記検出された周波数成分が含まれたバンドを復元するために、信号のエネルギー値を符号化する段階を含む発明をコンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体である。
前記課題をなすための本発明による記録媒体は、既設定の周波数より高い領域に含まれた周波数成分を復号化する段階と、前記復号化された周波数成分が含まれたバンドを復元するために、信号のエネルギー値を復号化する段階と、前記バンドを復元するために信号を生成する段階と、前記復号化されたエネルギー値を基に、前記復号化された周波数成分のエネルギー値を考慮し、前記生成された信号のエネルギー値を調節する段階と、前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する段階とを含む発明をコンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体である。
前記課題をなすための本発明による記録媒体は、既設定の周波数より高い領域に含まれた周波数成分を復号化する段階と、既設定の周波数より低い領域に該当する信号を利用し、既設定の周波数より高い領域に該当する信号を復号化する段階と、前記復号化された周波数成分のエネルギー値を考慮し、前記復号化された信号のエネルギー値を調節する段階と、前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する段階とを含む発明をコンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体である。
前記課題をなすための本発明による高周波数領域の符号化装置は、既設定の周波数より高い領域に該当する信号から、既設定の基準によって、周波数成分を検出して符号化する周波数成分符号化部、及び前記検出された周波数成分が含まれたバンドを復元するために、信号のエネルギー値を符号化するエネルギー値符号化部を含むことを特徴とする。
前記課題をなすための本発明による高周波数領域の復号化装置は、既設定の周波数より高い領域に含まれた周波数成分を復号化する周波数成分復号化部と、前記復号化された周波数成分が含まれたバンドを復元するために、信号のエネルギー値を復号化するエネルギー値復号化部と、前記バンドを復元するために信号を生成する信号生成部と、前記復号化されたエネルギー値を基に、前記復号化された周波数成分のエネルギー値を考慮し、前記生成された信号のエネルギー値を調節する信号調節部と、前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する信号合成部とを含むことを特徴とする。
前記課題をなすための本発明による高周波数領域の復号化装置は、既設定の周波数より高い領域に含まれた周波数成分を復号化する周波数成分復号化部と、既設定の周波数より低い領域に該当する信号を利用し、既設定の周波数より高い領域に該当する信号を復号化する帯域幅拡張復号化部と、前記復号化された周波数成分のエネルギー値を考慮し、前記復号化された信号のエネルギー値を調節する信号調節部と、前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する信号合成部とを含むことを特徴とする。
本発明による符号化装置の一実施形態を図示したブロック図である。 本発明による復号化装置の一実施形態を図示したブロック図である。 本発明による復号化装置に含まれる信号調節部の一実施形態を図示したブロック図である。 図2に図示された信号生成部で、単数の信号だけを利用して信号を生成する場合、利得値を適用する一実施形態を図示した図である。 図2に図示された信号生成部で、複数の信号を利用して信号を生成する場合、利得値を適用する一実施形態を図示した図である。 本発明による符号化装置の他の実施形態を図示したブロック図である。 本発明による復号化装置の他の実施形態を図示したブロック図である。 本発明による符号化装置の他の実施形態を図示したブロック図である。 本発明による復号化装置の他の実施形態を図示したブロック図である。 本発明による符号化方法に係わる一実施形態を図示したフローチャートである。 本発明による復号化方法に係わる一実施形態を図示したフローチャートである。 本発明による復号化方法に含まれた第1140段階に係わる一実施形態を図示したフローチャートである。 本発明による符号化方法に係わる他の実施形態を図示したフローチャートである。 本発明による復号化方法に係わる他の実施形態を図示したフローチャートである。 本発明による符号化方法に係わる他の実施形態を図示したフローチャートである。 本発明による復号化方法に係わる他の実施形態を図示したフローチャートである。
以下、添付された図面を参照しつつ、本発明による符号化及び復号化の方法並びに装置について詳細に説明する。
図1は、本発明による符号化装置の一実施形態をブロック図で図示したものであり、前記符号化装置は、領域分割部100、低周波数信号符号化部105、高周波数信号符号化部110及び多重化部145を含んでなる。
領域分割部100は、既設定の周波数を基準として、入力端子INを介して入力された信号を低周波数信号と高周波数信号とに分割する。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが望ましいが、必ずしも同じ値に設定して実施しなければならないものではない。
低周波数信号符号化部105は、領域分割部100で分割された低周波数信号を、既設定の所定の符号化方式によって符号化する。低周波数信号符号化部105は、従来に開示されたいかなる符号化方式によっても符号化可能である。なぜならば、本発明による符号化装置は、高周波数信号を符号化するところに技術的特徴があるので、低周波数信号を符号化することと関連して、特定の符号化方式に限定して実施しなければならないものではない。低周波数信号符号化部105で符号化する方式の例として、AAC(Advanced Audio Coding)方式や、入力された信号から重要な周波数成分だけを検出して符号化し、残りの残余周波数成分は、所定のノイズ信号として符号化する方式などがある。
高周波数信号符号化部110は、領域分割部100で分割された高周波数信号から重要な周波数成分を検出して符号化し、重要な周波数成分が検出されたバンド(band)を復元するために、信号のエネルギー値を計算して符号化し、低周波数信号を利用し、重要な周波数成分が検出されていないバンドを復元するために、高周波数信号を符号化する。ここで、高周波数信号符号化部110は、周波数成分検出部115、周波数成分符号化部120、エネルギー値計算部125、エネルギー値符号化部130、帯域幅拡張符号化部135及びトーナリティ(tonality)符号化部140を含んでなる。
周波数成分検出部115は、領域分割部100で分割された高周波数信号から、既設定の基準によって、重要な周波数成分であると判断される周波数成分を検出する。周波数成分検出部115で重要な周波数成分を判断するにおいて、次のような方法がある。第一に、SMR(Signal to Masking Ratio)値を計算し、マスキングしきい値(threshold)より大きい信号を重要な周波数成分として選択する。第二に、所定の重み付け(weight)を考慮してスペクトルピークを抽出し、重要な周波数成分を選択する。第三に、各サブバンド(sub-band)別にSNR(Signal to Noise Ratio)値を計算し、SNR値が低いサブバンドのうち、所定サイズ以上のピーク値を有する周波数成分を、重要周波数成分として選択する。前述の三種の方法は、それぞれ実施したり、互いに結合して組み合わせることによって実施することもでき、前述の方法は、単なる例に過ぎず、前述の方法に限定して実施しなければならないものではない。
周波数成分符号化部120は、周波数成分検出部115で検出された周波数成分と、周波数成分が込められた位置を示す情報とを符号化する。
エネルギー値計算部125は、周波数成分検出部115で検出された周波数成分が含まれたバンドを復元するために、信号に係わる各エネルギー値を計算する。ここでバンドは、帯域幅拡張符号化部135で符号化を遂行するにおいて適用する処理単位をいう。例えば、QMF(Quadrature Mirror Filter)の場合、バンドは、1個のサブバンド、または1個のスケールファクタ・バンド(scale factor band)になりうる。
エネルギー値符号化部130は、エネルギー値計算部125で計算された各バンドのエネルギー値と、各バンドの位置を示す情報とを符号化する。
帯域幅拡張符号化部135は、低周波数信号を利用し、周波数成分検出部115で検出された周波数成分が含まれていないバンドを復元するために、信号を符号化する。帯域幅拡張符号化部135で信号を符号化するにおいて、低周波数信号を利用して高周波数信号を復号化できる情報を生成して符号化する。
トーナリティ符号化部140は、周波数成分検出部115で検出された周波数成分が含まれたバンドを復元するために、高周波数信号に係わる各トーナリティを計算して符号化する。しかし、本発明では、トーナリティ符号化部140を必ずしも含んで実施しなければならないものではない。ただし、デコーダ(図示せず)で周波数成分を復元するために、バンドに信号を生成するにおいて、単数の信号を利用して生成するものではなく、複数の信号を利用して単数の信号を生成する場合に、トーナリティ符号化部140が必要でありうる。例えば、デコーダ(図示せず)で任意に生成された信号と、パッチ(patch)された信号とをいずれも利用し、周波数成分が含まれたバンドを復元するために、信号を生成する場合に必要である。
多重化部145は、低周波数信号符号化部105で符号化された結果;周波数成分符号化部120で符号化された周波数成分、及び周波数成分がデコーダで復元される位置を示す情報;エネルギー値符号化部130で符号化された各バンドのエネルギー値、及び各バンドの位置を示す情報;帯域幅拡張符号化部135で符号化された低周波数信号を利用して高周波数信号を復号化する情報を含んで多重化し、出力端子OUTを介して、多重化されたビットストリームを出力する。所定の場合、多重化部145は、トーナリティ符号化部140で符号化されたトーナリティも含んで多重化できる。
図2は、本発明による復号化装置の一実施形態をブロック図で図示したものであり、前記復号化装置は、逆多重化部200、低周波数信号復号化部205、高周波数信号復号化部210及び領域合成部255を含んでなる。
逆多重化部200は、符号化端から入力端子INを介して、ビットストリームを入力されて逆多重化する。例えば、周波数成分及び周波数成分が復元される位置を示す情報、各バンドのエネルギー値、エンコーダ(図示せず)でエネルギー値が符号化されたバンドの位置、低周波数信号を利用して高周波数信号を復号化する情報、並びにトーナリティなどを逆多重化部200で逆多重化できる。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが一般的であるが、必ずしも同じ値に設定して実施しなければならないものではない。
低周波数信号復号化部205は、低周波数信号を、既設定の所定の復号化方式によって復号化する。低周波数信号復号化部205は、従来に開示されたいかなる復号化方式によっても符号化可能である。なぜならば、本発明による復号化装置は、高周波数信号を復号化するところに技術的特徴があるので、低周波数信号を復号化することと関連して、特定の方式に限定して実施しなければならないものではない。低周波数信号復号化部205で復号化する方式の例として、AAC方式や、所定の重要な周波数成分を復号化し、残りの残余周波数成分は、所定のノイズ信号として復号化したり生成する方式などがある。
高周波数信号復号化部210は、エンコーダ(図示せず)で高周波数信号のうち、重要な周波数成分を検出して符号化された周波数成分を復号化する。そして、重要な周波数成分が含まれたバンドの場合、高周波数信号復号化部210は、周波数成分が含まれたバンドを復元するために、信号のエネルギー値を復号化し、これを利用することによって、周波数成分が含まれたバンドの高周波数信号を復号化する。また、重要な周波数成分が含まれていないバンドの場合、高周波数信号復号化部210は、低周波数信号を利用し、高周波数信号を復号化する。ここで、高周波数信号復号化部210は、周波数成分復号化部215、同期化部220、エネルギー値復号化部225、信号生成部230、信号調節部235、帯域幅拡張復号化部240、信号合成部245及びトーナリティ復号化部250を含んでなる。
周波数成分復号化部215は、エンコーダ(図示せず)で、既設定の基準によって、重要な周波数成分であると判断されて符号化された所定の周波数成分を復号化する。
同期化部220は、周波数成分復号化部215で適用されるフレームと、帯域幅拡張復号化部240で適用されるフレームとが互いに一致しない場合、周波数成分復号化部215で適用されるフレームと、帯域幅拡張復号化部240で適用されるフレームとを同期化する。ここで、同期化部220は、周波数成分復号化部215で適用されるフレームを基に、帯域幅拡張復号化部240で適用されるフレームのうち、全部または一部を処理することが望ましい。
エネルギー値復号化部225は、周波数成分復号化部215で復号化された周波数成分が含まれたバンドを復元するために、信号のエネルギー値を復号化する。
信号生成部230は、周波数成分復号化部215で復号化された周波数成分が含まれたバンドを復元するための信号を生成する。
ここで、信号生成部230が信号を生成する方法として、次に記述された例がある。第一に、信号生成部230は、任意に高周波数信号を生成する。例えば、ランダムノイズ信号(random noise signal)がある。第二に、信号生成部230は、低周波数信号復号化部205で復号化された低周波数信号をコピーし、高周波数信号を生成できる。例えば、低周波数信号をパッチしたりフォールディング(folding)し、高周波数信号を生成できる。第三に、信号生成部230は、低周波数信号を利用して高周波数信号を生成できる。
信号調節部235は、エネルギー値復号化部225で復号化された各バンドのエネルギー値を基に周波数成分復号化部215で復号化された周波数成分のエネルギー値を考慮し、信号生成部230で生成された信号のエネルギーが調節されるように、信号生成部230で生成された信号を調節する。信号調節部235に係わるさらに詳細な一実施形態は、図3の説明と共に後述する。
帯域幅拡張復号化部240は、低周波数信号復号化部205で復号化された低周波数信号を利用し、高周波数信号のうち、周波数成分復号化部215で復号化された周波数成分を含まないバンドを復元するための信号を復号化する。
信号合成部245は、周波数成分復号化部215で復号化された周波数成分と、信号調節部235で調節された信号とを合成する。このように、信号合成部245で合成された信号は、周波数成分復号化部215で復号化された周波数成分が含まれたバンドを復元するので、信号合成部245は、残りのバンドに、帯域幅拡張復号化部240で復号化された信号を合成する。このように、信号合成部245で信号を合成することによって、信号合成部245は、最終的に高周波数信号を生成する。
トーナリティ復号化部250は、周波数成分復号化部215で復号化された周波数成分が含まれたバンドに込められた信号に係わるトーナリティを復号化する。しかし、本発明では、トーナリティ復号化部250を必ずしも含んで実施しなければならないものではない。ただし、信号生成部230で、単数の信号を利用して生成するものではなく、複数の信号を利用し、単数の信号を生成する場合に、トーナリティ復号化部250が必要でありうる。例えば、信号生成部230で任意に生成された信号とパッチされた信号とをいずれも利用し、周波数成分復号化部215で復号化された周波数成分が含まれたバンドを復元するための信号を生成する場合、必要でありうる。もし本発明でトーナリティ復号化部250を含んで実施する場合、信号調節部235は、トーナリティ復号化部250で復号化されたトーナリティまで考慮し、信号生成部230で生成された信号を調節する。
領域合成部255は、低周波数信号復号化部205で復号化された低周波数信号と、信号合成部245で合成された高周波数信号とを合成し、出力端子OUTを介して出力する。
図3は、本発明による復号化装置に含まれる信号調節部235の一実施形態をブロック図で図示したものであり、前記信号調節部235は、第1エネルギー計算部300、第2エネルギー計算部310、利得値計算部320及び利得値適用部330を含んでなる。図2を参照しつつ、図3に図示された実施形態について説明する。
第1エネルギー計算部300は、入力端子IN1を介して、信号生成部230で、周波数成分が含まれたバンドに生成された信号を入力され、各バンドを復元するための信号のエネルギー値を計算する。
第2エネルギー計算部310は、入力端子IN2を介して、周波数成分復号化部215で復号化された周波数成分を入力され、各周波数成分のエネルギー値を計算する。
利得値計算部320は、エネルギー値復号化部225から周波数成分が含まれたバンドのエネルギー値を入力端子IN3を介して入力され、第1エネルギー計算部300で計算された各エネルギー値が、エネルギー値復号化部225から入力された各エネルギー値から、第2エネルギー計算部310で計算された各エネルギー値を減算した値になるように利得値を計算する。例えば、利得値計算部320は、次に記載された式(1)によって、利得値を計算できる。
Figure 0006363683
ここで、
Figure 0006363683
は、エネルギー値復号化部225から入力された各エネルギー値であり、
Figure 0006363683
は、第2エネルギー計算部310で計算された各エネルギー値であり、
Figure 0006363683
は、第1エネルギー計算部300で計算された各エネルギー値をいう。
もし利得値計算部320で、トーナリティまで考慮して利得値を計算する場合、利得値計算部320は、エネルギー値復号化部225から周波数成分が含まれたバンドのエネルギー値を入力端子IN3を介して入力され、周波数成分が含まれたバンドに込められた信号に係わるトーナリティを入力端子IN4を介して入力され、入力された各エネルギー値、各トーナリティ、及び第2エネルギー計算部310で計算された各エネルギー値を利用することによって、利得値を計算する。
利得値適用部330は、入力端子IN1を介して、信号生成部230で周波数成分が含まれた各バンドに生成された信号に、利得値計算部320で計算された各バンドに係わる利得値を適用する。
図4は、図2に図示された信号生成部230で、単数の信号だけを利用して信号を生成する場合、利得値を適用する一実施形態を図示したものである。
利得値適用部330は、入力端子IN1を介して信号生成部230で周波数成分が含まれたバンドに生成された信号を入力され、利得値計算部320で計算された利得値を乗算する。
第1信号合成部400は、利得値適用部330で利得値が乗算された信号に、入力端子IN2を介して周波数成分復号化部215で復号化された周波数成分を入力されて合成する。かような第1信号合成部400は、図2に図示された信号合成部245に含まれる一部構成要素である。
図5は、図2に図示された信号生成部230で、複数の信号を利用して信号を生成する場合、利得値を適用する一実施形態を図示したものである。
まず、利得値適用部330は、信号生成部230で任意に生成された信号に、入力端子IN1を介して入力され、利得値計算部320で計算された第1利得値を乗算する。
また、利得値適用部330は、信号生成部230で、低周波数信号復号化部205で復号化された低周波数信号をコピーした信号、または低周波数信号を利用して生成された信号に、入力端子IN1’を介して入力されて利得値計算部320で計算された第2利得値を乗算する。
第2合成部500は、利得値適用部330で第1利得値が乗算された信号と、利得値適用部330で第2利得値が乗算された信号とを合成する。
第3信号合成部510は、第2合成部500で合成された信号に、入力端子IN2を介して、周波数成分復号化部215で復号化された周波数成分を入力されて合成する。かような第3信号合成部510は、図2に図示された信号合成部245に含まれる一部構成要素である。
図6は、本発明による符号化装置の一実施形態をブロック図で図示したものであり、前記符号化装置は、領域分割部600、低周波数信号符号化部605、高周波数信号符号化部610及び多重化部645を含んでなる。
領域分割部600は、既設定の周波数を基にして、入力端子INを介して入力された信号を、低周波数信号と高周波数信号とに分割する。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが望ましいが、必ずしも同じ値に設定して実施しなければならないものではない。
低周波数信号符号化部605は、領域分割部600で分割された低周波数信号を、既設定の所定の符号化方式によって符号化する。低周波数信号符号化部605は、従来に開示されたいかなる符号化方式によっても符号化可能である。なぜならば、本発明による符号化装置は、高周波数信号を符号化するところに技術的特徴があるので、低周波数信号を符号化することと関連して、特定の符号化方式に限定して実施しなければならないものではない。低周波数信号符号化部605で符号化する方式の例として、AAC方式や、入力された信号から重要な周波数成分だけを検出して符号化し、残りの残余周波数成分は、所定のノイズ信号として符号化する方式などがある。
高周波数信号符号化部610は、領域分割部600で分割された高周波数信号から重要な周波数成分を検出して符号化し、重要な周波数成分が検出されたバンドを復元するための信号のエネルギー値を計算して符号化し、重要な周波数成分が検出されていないバンドを復元するための信号の包絡線のみを抽出して符号化する。ここで、高周波数信号符号化部610は、第1変換部611、第2変換部612、周波数成分選択部615、周波数成分符号化部620、エネルギー値計算部625、エネルギー値符号化部630、第3変換部650、帯域幅拡張符号化部655を含んでなる。
第1変換部611は、領域分割部600で分割された高周波数信号を、第1変換方式によって、時間ドメインから周波数ドメインに変換する。
第2変換部612は、心理音響モデルを適用するために、第1変換方式以外の他の方式である第2変換方式によっても、高周波数信号を時間ドメインから周波数ドメインに変換する。
第1変換部611で変換された信号は、高周波数信号を符号化するのに利用され、第2変換部612で変換された信号は、高周波数信号に対して心理音響モデルを適用し、重要な周波数成分を選択するのに利用される。ここで、心理音響モデルは、ヒューマン聴覚システムの遮蔽作用に係わる数学的モデルをいう。
例えば、第1変換部611は、高周波数信号を、第1変換方式に該当するMDCT(Modified Discrete Cosine Transform)によって周波数ドメインに変換し、実数部として表現し、第2変換部612は、高周波数信号を、第2変換方式に該当するMDST(Modified Discrete Sine Transform)によって周波数ドメインに変換し、虚数部として表現できる。ここで、MDCTによって変換され、実数部として表現された信号は、高周波数信号を符号化するのに使われ、MDSTによって変換され、虚数部として表現された信号は、高周波数信号に対して心理音響モデルを適用し、重要な周波数成分を選択するのに利用される。これによって、信号の位相情報をさらに表現できるために、時間ドメインに該当する信号に対してDFT(Discrete Fourier Transform)を遂行した後、MDCTの係数を量子化することによって、発生するミスマッチ(miss match)を解決できる。
周波数成分選択部615は、第1変換部611で変換された信号から、既設定の基準によって第2変換部612で変換された信号を利用して重要な周波数成分であると判断される周波数成分を選択する。周波数成分選択部615で重要な周波数成分を選択するにおいて、次のような方法がある。第一に、SMR値を計算し、マスキングしきい値より大きい信号を重要な周波数成分として選択する。第二に、所定の重み付けを考慮してスペクトルピークを抽出し、重要な周波数成分を選択する。第三に、各サブバンド別にSNR値を計算し、SNR値が低いサブバンドのうち、所定サイズ以上のピーク値を有する周波数成分を、重要周波数成分として選択する。前述の三種の方法は、それぞれ実施したり、互いに結合して組み合わせることによって実施することができ、前述の方法は、単なる例に過ぎず、前述の方法に限定して実施しなければならないものではない。
周波数成分符号化部620は、周波数成分選択部615で選択された第1変換部611で変換された信号の周波数成分と、周波数成分が込められた位置を示す情報とを符号化する。
エネルギー値計算部625は、周波数成分選択部615で選択された周波数成分が含まれたバンドに込められた信号に係わる各エネルギー値を計算する。ここでバンドは、帯域幅拡張符号化部655で符号化を遂行するにおいて適用する処理単位をいう。例えば、QMFの場合、バンドは、1個のサブバンド、または1個のスケールファクタ・バンドになりうる。
エネルギー値符号化部630は、エネルギー値計算部625で計算された各バンドのエネルギー値と、各バンドの位置を示す情報とを符号化する。
第3変換部650は、分析フィルタバンク(analysis filterbank)によって領域分割部600で分割された高周波数信号を、所定の周波数バンド別に時間ドメインによって示すようにドメインを変換する。例えば、第3変換部650では、QMFを適用してドメインを変換する。
帯域幅拡張符号化部655は、低周波数信号を利用し、周波数成分選択部615で選択された周波数成分が含まれていないバンドに込められた高周波数信号を符号化する。帯域幅拡張符号化部655で信号を符号化するにおいて、低周波数信号を利用して高周波数信号を復号化できる情報を生成して符号化する。
多重化部645は、低周波数信号符号化部605で符号化された結果;周波数成分符号化部620で符号化された周波数成分、及び周波数成分が復元される位置を示す情報;エネルギー値符号化部630で符号化された各バンドのエネルギー値、及び各バンドの位置を示す情報;帯域幅拡張符号化部655で符号化された低周波数信号を利用して高周波数信号を復号化する情報を含んで多重化し、出力端子OUTを介して多重化されたビットストリームを出力する。
図7は、本発明による復号化装置の一実施形態をブロック図で図示したものであり、前記復号化装置は、逆多重化部700、低周波数信号復号化部705、高周波数信号復号化部710及び領域合成部755を含んでなる。
逆多重化部700は、符号化端から入力端子INを介してビットストリームを入力されて逆多重化する。例えば、周波数成分及び周波数成分が復元される位置を示す情報、各バンドのエネルギー値、エンコーダ(図示せず)でエネルギー値が符号化されたバンドの位置を示す情報、低周波数信号を利用して高周波数信号を復号化する情報などを逆多重化部700で逆多重化できる。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが一般的であるが、必ずしも同じ値に設定して実施しなければならないものではない。
低周波数信号復号化部705は、低周波数信号を、既設定の所定の復号化方式によって復号化する。低周波数信号復号化部705は、従来に開示されたいかなる復号化方式によっても符号化可能である。なぜならば、本発明による復号化装置は、高周波数信号を復号化するところに技術的特徴があるので、低周波数信号を復号化することと関連して、特定の方式に限定して実施しなければならないものではない。低周波数信号復号化部705で復号化する方式の例として、AAC方式や、所定の重要な周波数成分を復号化し、残りの残余周波数成分は、所定のノイズ信号として復号化したり生成する方式などがある。
高周波数信号復号化部710は、高周波数信号で重要な周波数成分を復号化し、重要な周波数成分が含まれたバンドを復元するための信号のエネルギー値を復号化し、低周波数信号を利用して高周波数信号を復号化する。ここで、高周波数信号復号化部710は、周波数成分復号化部715、同期化部720、エネルギー値復号化部725、信号生成部730、信号調節部735、帯域幅拡張復号化部740、信号合成部745、第1逆変換部750及び第3逆変換部753を含んでなる。
周波数成分復号化部715は、エンコーダ(図示せず)で、既設定の基準によって重要な周波数成分であると判断されて符号化された所定の周波数成分を復号化する。
第1逆変換部750は、周波数成分復号化部715で復号化された周波数成分を、図6の第1変換部611で遂行する変換の逆過程で、周波数ドメインから時間ドメインに逆変換する。
同期化部720は、周波数成分復号化部715で適用されるフレームと、帯域幅拡張復号化部740で適用されるフレームとが互いに一致しない場合、周波数成分復号化部715で適用されるフレームと、帯域幅拡張復号化部740で適用されるフレームとを同期化する。ここで、同期化部720は、周波数成分復号化部715で適用されるフレームを基に、帯域幅拡張復号化部740で適用されるフレームのうち、全部または一部を処理することが望ましい。
エネルギー値復号化部725は、周波数成分復号化部715で復号化された周波数成分が含まれたバンドを復元するための信号のエネルギー値を復号化する。
信号生成部730は、周波数成分復号化部715で復号化された周波数成分が含まれたバンドに込められる信号を生成する。
ここで、信号生成部730が信号を生成する方法として、次に記述された例がある。第一に、信号生成部730は、任意に高周波数信号を生成する。例えば、ランダムノイズ信号がある。第二に、信号生成部730は、低周波数信号復号化部705で復号化された低周波数信号をコピーし、高周波数信号を生成できる。例えば、低周波数信号をパッチしたりフォールディングし、高周波数信号を生成できる。第三に、信号生成部730は、低周波数信号を利用して高周波数信号を生成できる。
信号調節部735は、エネルギー値復号化部725で復号化された各バンドのエネルギー値を基に、周波数成分復号化部715で復号化された周波数成分のエネルギー値を考慮し、信号生成部730で生成された信号のエネルギーが調節されるように、信号生成部730で生成された信号を調節する。信号調節部735に係わるさらに詳細な一実施形態は、図3の実施形態について説明しつつ述べた。
帯域幅拡張復号化部740は、低周波数信号復号化部705で復号化された低周波数信号を利用し、高周波数信号のうち、周波数成分復号化部715で復号化された周波数成分を含まないバンドを復元するための信号を復号化する。
第3逆変換部753は、図6の第3変換部650で遂行する変換の逆過程で、帯域幅拡張復号化部740で復号化された信号のドメインを、合成フィルタバンクを介して逆変換する。
信号合成部745は、第1逆変換部750で逆変換された周波数成分を、信号調節部735で調節された信号と合成する。このように、信号合成部745で合成された信号は、第1逆変換部750で逆変換された周波数成分が含まれたバンドだけを復元するので、信号合成部745は、残りのバンドに、帯域幅拡張復号化部740で復号化され、第3逆変換部753で逆変換された信号を合成する。このように、信号合成部745で信号を合成することによって、信号合成部745は、最終的に高周波数信号を生成する。
領域合成部755は、低周波数信号復号化部705で復号化された低周波数信号と、信号合成部745で合成された高周波数信号とを合成し、出力端子OUTを介して出力する。
図8は、本発明による符号化装置の一実施形態をブロック図で図示したものであり、前記符号化装置は、領域分割部800、低周波数信号符号化部805、高周波数信号符号化部810及び多重化部845を含んでなる。
領域分割部800は、既設定の周波数を基にして、入力端子INを介して入力された信号を、低周波数信号と高周波数信号とに分割する。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが望ましいが、必ずしも同じ値に設定して実施しなければならないものではない。
低周波数信号符号化部805は、領域分割部800で分割された低周波数信号を、既設定の所定の符号化方式によって符号化する。低周波数信号符号化部805は、従来に開示されたいかなる符号化方式によっても符号化可能である。なぜならば、本発明による符号化装置は、高周波数信号を符号化するところに技術的特徴があるので、低周波数信号を符号化することと関連して、特定の符号化方式に限定して実施しなければならないものではない。低周波数信号符号化部805で符号化する方式の例として、AAC方式や、入力された信号から重要な周波数成分だけを検出して符号化し、残りの残余周波数成分は、所定のノイズ信号として符号化する方式などがある。
高周波数信号符号化部810は、領域分割部800で分割された高周波数信号から重要な周波数成分を検出して符号化し、低周波数信号を利用して高周波数信号を符号化する。ここで、高周波数信号符号化部810は、周波数成分検出部815、周波数成分符号化部820及び帯域幅拡張符号化部835を含んでなる。
周波数成分検出部815は、領域分割部800で分割された高周波数信号から、既設定の基準によって、重要な周波数成分であると判断される周波数成分を検出する。周波数成分検出部815で重要な周波数成分を判断するにおいて、次のような方法がある。第一に、SMR値を計算し、マスキングしきい値より大きい信号を重要な周波数成分として選択する。第二に、所定の重み付けを考慮してスペクトルピークを抽出し、重要な周波数成分を選択する。第三に、各サブバンド別にSNR値を計算し、SNR値が低いサブバンドのうち、所定サイズ以上のピーク値を有する周波数成分を、重要周波数成分として選択する。前述の三種の方法は、それぞれ実施できるが、少なくとも一つ以上の方法を結合して組み合わせることによって、実施することができ、前述の方法は、単なる例に過ぎず、前述の方法に限定して実施しなければならないものではない。
周波数成分符号化部820は、周波数成分検出部815で検出された周波数成分と、周波数成分が込められた位置を示す情報とを符号化する。
帯域幅拡張符号化部835は、低周波数信号を利用して高周波数信号を符号化する。帯域幅拡張符号化部835で信号を符号化するにおいて、低周波数信号を利用し、高周波数信号を復号化できる情報を生成して符号化する。
図1の帯域幅拡張符号化部135及び図6の帯域幅拡張符号化部655のように、高周波数信号をバンド別に分割し、重要な周波数成分が含まれていないバンドに対してのみ符号化するものではなく、帯域幅拡張符号化部835は、高周波数信号全てに対して低周波数信号を利用して符号化する。
多重化部845は、低周波数信号符号化部805で符号化された結果;周波数成分符号化部820で符号化された周波数成分、及び周波数成分が込められた位置を示す情報;帯域幅拡張符号化部835で符号化された低周波数信号を利用して高周波数信号を復号化する情報を含んで多重化し、出力端子OUTを介して、多重化されたビットストリームを出力する。
図9は、本発明による復号化装置の一実施形態をブロック図で図示したものであり、前記復号化装置は、逆多重化部900、低周波数信号復号化部905、高周波数信号復号化部910及び領域合成部955を含んでなる。
逆多重化部900は、符号化端から、入力端子INを介してビットストリームを入力されて逆多重化する。例えば、周波数成分及び周波数成分が込められた位置を示す情報や、低周波数信号を利用して高周波数信号を復号化する情報などを、逆多重化部900で逆多重化できる。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが一般的であるが、必ずしも同じ値に設定して実施しなければならないものではない。
低周波数信号復号化部905は、低周波数信号を既設定の所定の復号化方式によって復号化する。低周波数信号復号化部905は、従来に開示されたいかなる復号化方式によっても符号化可能である。なぜならば、本発明による復号化装置は、高周波数信号を復号化するところに技術的特徴があるので、低周波数信号を復号化することと関連して、特定の方式に限定して実施しなければならないものではない。低周波数信号復号化部905で復号化する方式の例として、AAC方式や、所定の重要な周波数成分を復号化し、残りの残余周波数成分は、所定のノイズ信号として復号化したり生成する方式などがある。
高周波数信号復号化部910は、低周波数信号を利用して高周波数信号を復号化し、高周波数信号で重要な周波数成分を復号化する。そして、高周波数信号復号化部910は、重要な周波数成分が含まれたバンドに込められた高周波数信号を調節した後、高周波数信号と重要な周波数成分とを合成する。ここで、高周波数信号復号化部910は、周波数成分復号化部915、エネルギー値計算部920、帯域幅拡張復号化部930、信号調節部940及び信号合成部950を含んでなる。
周波数成分復号化部915は、符号化端で、既設定の基準によって重要な周波数成分であると判断されて符号化された所定の周波数成分を復号化する。
エネルギー値計算部920は、周波数成分復号化部915で復号化された各周波数成分のエネルギー値を計算する。
帯域幅拡張復号化部930は、低周波数信号復号化部905で復号化された低周波数信号を利用し、高周波数信号を復号化する。
信号調節部940は、帯域幅拡張復号化部930で復号化された信号のうち、周波数成分復号化部915で復号化された周波数成分が含まれたバンドに込められた信号を調節する。
信号調節部940で調節するバンドの信号に対するエネルギーが、帯域幅拡張復号化部930で復号化された信号のエネルギー値から、エネルギー値計算部920で計算された各バンドに含まれた周波数成分のエネルギー値を減算した値になるように、帯域幅拡張復号化部930で復号化された信号を調節する。
信号合成部950は、周波数成分復号化部915で復号化された周波数成分を、信号調節部940で調節された高周波数信号と合成する。
領域合成部955は、低周波数信号復号化部905で復号化された低周波数信号と、信号合成部950で合成された高周波数信号とを合成し、出力端子OUTを介して出力する。
図10は、本発明による符号化方法に係わる一実施形態をフローチャートで図示したものである。
まず、既設定の周波数を基にして、入力された信号を低周波数信号と高周波数信号とに分割する(第1000段階)。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが望ましいが、必ずしも同じ値に設定して実施しなければならないものではない。
第1000段階で分割された低周波数信号を、既設定の所定の符号化方式によって符号化する(第1005段階)。第1005段階は、従来に開示されたいかなる符号化方式によっても符号化可能である。なぜならば、本発明による符号化方法は、高周波数信号を符号化するところに技術的特徴があるので、低周波数信号を符号化することと関連して、特定の符号化方式に限定して実施しなければならないものではない。第1005段階で符号化する方式の例として、AAC方式や、入力された信号から重要な周波数成分だけを検出して符号化し、残りの残余周波数成分は、所定のノイズ信号として符号化する方式などがある。
第1000段階で分割された高周波数信号から、既設定の基準によって、重要な周波数成分であると判断される周波数成分を検出する(第1010段階)。第1010段階で重要な周波数成分を判断するにおいて、次のような方法がある。第一に、SMR値を計算し、マスキングしきい値より大きい信号を重要な周波数成分として選択する。第二に、所定の重み付けを考慮してスペクトルピークを抽出し、重要な周波数成分を選択する。第三に、各サブバンド別にSNR値を計算し、SNR値が低いサブバンドのうち、所定サイズ以上のピーク値を有する周波数成分を、重要周波数成分として選択する。前述の三種の方法は、それぞれ実施できるが、少なくとも一つ以上方法を結合して組み合わせることによって実施することができ、前述の方法は、単なる例に過ぎず、前述の方法に限定して実施しなければならないものではない。
第1010段階で検出された周波数成分と、周波数成分が復元される位置を示す情報とを符号化する(第1015段階)。
第1010段階で選択された周波数成分が含まれたバンドに該当するか否かを判断する(第1018段階)。ここでバンドは、後述する第1035段階で、符号化を遂行するにおいて適用する処理単位をいう。例えば、QMFの場合、バンドは1個のサブバンド、または1個のスケールファクタ・バンドになりうる。
もし第1010段階で選択された周波数成分が含まれたバンドに該当すると、第1018段階で判断されれば、第1015段階で検出された周波数成分が含まれたバンドを復元するための信号に係わる各エネルギー値を計算する(第1020段階)。
第1020段階で計算された各バンドのエネルギー値と、各バンドの位置を示す情報とを符号化する(第1025段階)。
第1010段階で検出された周波数成分が含まれたバンドを復元するための高周波数信号に対する各トーナリティを計算して符号化する(第1030段階)。しかし、本発明では、第1030段階を必ずしも含んで実施しなければならないものではない。ただし、デコーダ(図示せず)で周波数成分を含むバンドを復元するための信号を生成するにおいて、単数の信号を利用して生成するものではなく、複数の信号を利用して単数の信号を生成する場合に、第1030段階が必要でありうる。例えば、デコーダ(図示せず)で任意に生成された信号と、パッチされた信号とをいずれも利用し、周波数成分が含まれたバンドを復元するための信号を生成する場合、必要である。
もし第1010段階で選択された周波数成分が含まれていないバンドに該当すると、第1018段階で判断されれば、低周波数信号を利用し、第1010段階で検出された周波数成分が含まれていないバンドを復元するための信号を符号化する(第1035段階)。第1035段階で信号を符号化するにおいて、低周波数信号を利用して高周波数信号を復号化できる情報を生成して符号化する。
第1005段階で符号化された結果;第1015段階で符号化された周波数成分、及び周波数成分が込められた位置を示す情報;第1025段階で符号化された各バンドのエネルギー値、及び各バンドの位置を示す情報;第1030段階で符号化された低周波数信号を利用して高周波数信号を復号化する情報を含んで多重化する(第1040段階)。所定の場合、第1040段階では、第1030段階で符号化されたトーナリティも含んで多重化できる。
図11は、本発明による復号化方法に係わる一実施形態をフローチャートで図示したものである。
まず、符号化端から、ビットストリームを入力されて逆多重化する(第1100段階)。例えば、周波数成分及び周波数成分が込められた位置を示す情報、各バンドのエネルギー値、エンコーダ(図示せず)でエネルギー値が符号化されたバンドの位置、低周波数信号を利用して高周波数信号を復号化する情報及びトーナリティなどを、第1100段階で逆多重化できる。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが一般的であるが、必ずしも同じ値に設定して実施しなければならないものではない。
低周波数信号を、既設定の所定の復号化方式によって復号化する(第1105段階)。第1105段階は、従来に開示されたいかなる復号化方式によっても符号化可能である。なぜならば、本発明による復号化装置は、高周波数信号を復号化するところに技術的特徴があるので、低周波数信号を復号化することと関連して、特定の方式に限定して実施しなければならないものではない。第1105段階で復号化する方式の例として、AAC方式や、所定の重要な周波数成分を復号化し、残りの残余周波数成分は、所定のノイズ信号として復号化したり生成する方式などがある。
エンコーダで、既設定の基準によって重要な周波数成分であると判断されて符号化された所定の周波数成分を復号化する(第1110段階)。
第1110段階で復号化された周波数成分を含んだバンドに該当するか否かを判断する(第1115段階)。
もし周波数成分を含んだバンドに該当すると、第1115段階で判断されれば、第1110段階で復号化された周波数成分に対して適用されるフレームと、低周波数信号を利用して高周波数信号を復号化する情報で適用されるフレームとが互いに一致するか否かを判断する(第1120段階)。
もしフレームが互いに一致しないと、第1120段階で判断されれば、第1110段階で復号化された周波数成分に対して適用されるフレームと、低周波数信号を利用して高周波数信号を復号化する情報で適用されるフレームとを同期化する(第1125段階)。第1125段階では、第1110段階で適用されるフレームを基に、低周波数信号を利用して高周波数信号を復号化する情報で適用されるフレームのうち、全てまたは一部を処理することが望ましい。
第1110段階で復号化された周波数成分が含まれたバンドに込められた信号のエネルギー値を復号化する(第1130段階)。
第1115段階で復号化された周波数成分が含まれたバンドに込められた信号に係わるトーナリティを復号化する(第1133段階)。しかし、本発明では、第1133段階を必ずしも含んで実施しなければならないものではない。ただし、第1135段階で、単数の信号を利用して生成するものではなく、複数の信号を利用して単数の信号を生成する場合に、第1133段階が必要でありうる。例えば、第1135段階で任意に生成された信号とパッチされた信号とをいずれも利用し、第1110段階で復号化された周波数成分が含まれたバンドを復元するための信号を生成する場合、必要でありうる。
第1110段階で復号化された周波数成分が含まれたバンドに込められる信号を生成する(第1135段階)。ここで、第1135段階で信号を生成する方法としては、次に記述された例がある。第一に、第1135段階では、任意に高周波数信号を生成する。例えば、ランダムノイズ信号がある。第二に、第1135段階では、第1105段階で復号化された低周波数信号をコピーし、高周波数信号を生成できる。例えば、低周波数信号をパッチしたりフォールディングし、高周波数信号を生成できる。第三に、第1135段階では、低周波数信号を利用して高周波数信号を生成できる。
第1130段階で復号化された各バンドのエネルギー値を基に、第1110段階で復号化された周波数成分のエネルギー値を考慮し、第1135段階で生成された信号のエネルギーが調節されるように、第1135段階で生成された信号を調節する(第1140段階)。第1140段階に係わるさらに詳細な一実施形態は、図3の説明で述べた。
もし本発明で、第1133段階を含んで実施する場合、第1140段階では、第1133段階で復号化されたトーナリティまで考慮し、第1133段階で生成された信号を調節する。
もし周波数成分を含まないバンドに該当すると、第1115段階で判断されれば、第1105段階で復号化された低周波数信号を利用し、高周波数信号のうち、第1110段階で復号化された周波数成分を含まないバンドを復元するための信号を復号化する(第1145段階)。
第1110段階で復号化された周波数成分を、第1140段階で調節された信号と合成する(第1150段階)。このように、第1150段階で合成された信号は、第1110段階で復号化された周波数成分が含まれたバンドだけを復元するので、第1150段階では、残りのバンドに、第1145段階で復号化された信号を合成する。このように、第1150段階で信号を合成することによって、第1150段階では、最終的に高周波数信号を生成する。
第1105段階で復号化された低周波数信号と、第1150段階で合成された高周波数信号とを合成する(第1155段階)。
図12は、本発明による復号化方法に含まれた第1140段階に係わる一実施形態を、フローチャートで図示したものである。
まず、第1135段階で、周波数成分が含まれたバンドに生成された信号を入力され、各バンドに込められた信号のエネルギー値を計算する(第1200段階)。
第1110段階で復号化された周波数成分を入力され、各周波数成分のエネルギー値を計算する(第1205段階)。
第1130段階で復号化された周波数成分が含まれたバンドのエネルギー値に対し、第1200段階で計算された各エネルギー値が、第1130段階で入力された各エネルギー値から、第1205段階で計算された各エネルギー値を減算した値になるように、利得値を計算する(第1210段階)。例えば、第1210段階では、前記の数式1によって利得値を計算できる。
もし第1210段階で、トーナリティまで考慮して利得値を計算する場合、第1210段階では、第1205段階で復号化された周波数成分が含まれたバンドのエネルギー値を入力され、周波数成分が含まれたバンドに込められた信号に係わるトーナリティを入力され、入力された各エネルギー値、各トーナリティ、及び第1205段階で計算された各エネルギー値を利用することによって、利得値を計算する。
第1135段階で、周波数成分が含まれた各バンドに生成された信号に、第1210段階で計算された各バンドに係わる利得値を適用する(第1215段階)。
図13は、本発明による符号化方法に係わる他の実施形態をフローチャートで図示したものである。
まず、既設定の周波数を基にして、入力された信号を、低周波数信号と高周波数信号とに分割する(第1300段階)。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが望ましいが、必ずしも同じ値に設定して実施しなければならないものではない。
第1300段階で分割された低周波数信号を、既設定の所定の符号化方式によって符号化する(第1305段階)。第1305段階は、従来に開示されたいかなる符号化方式によっても符号化可能である。なぜならば、本発明による符号化方法は、高周波数信号を符号化するところに技術的特徴があるので、低周波数信号を符号化することと関連して、特定の符号化方式に限定して実施しなければならないものではない。第1305段階で符号化する方式の例として、AAC方式や、入力された信号から重要な周波数成分だけを検出して符号化し、残りの残余周波数成分は、所定のノイズ信号として符号化する方式などがある。
第1300段階で分割された高周波数信号を、第1変換方式によって時間ドメインから周波数ドメインに変換する(第1310段階)。
心理音響モデルを適用するために、第1変換方式以外の他の方式の第2変換方式によっても、高周波数信号を、時間ドメインから周波数ドメインに変換する(第1315段階)。
第1310段階で変換された信号は、高周波数信号を符号化するのに利用され、第1315段階で変換された信号は、高周波数信号に対して心理音響モデルを適用し、重要な周波数成分を選択するのに利用される。ここで、心理音響モデルは、ヒューマン聴覚システムの遮蔽作用に係わる数的モデルをいう。
例えば、第1315段階では、高周波数信号を、第1変換方式に該当するMDCTによって周波数ドメインに変換して実数部として表現し、第1320段階では、高周波数信号を、第2変換方式に該当するMDSTによって周波数ドメインに変換し、虚数部として表現できる。ここで、MDCTによって変換されて実数部として表現された信号は、高周波数信号を符号化するのに使われ、MDSTによって変換されて虚数部として表現された信号は、高周波数信号に対して心理音響モデルを適用し、重要な周波数成分を選択するのに利用される。これによって、信号の位相情報をさらに表現できるために、時間ドメインに該当する信号に対してDFTを遂行した後、MDCTの係数を量子化することによって、発生するミスマッチを解決できる。
第1310段階で変換された信号から、既設定の基準によって、第1315段階で変換された信号を利用し、重要な周波数成分であると判断される周波数成分を選択する(第1320段階)。第1320段階で、重要な周波数成分を選択するにおいて、次のような方法がある。第一に、SMR値を計算し、マスキングしきい値より大きい信号を重要な周波数成分として選択する。第二に、所定の重み付けを考慮してスペクトルピークを抽出し、重要な周波数成分を選択する。第三に、各サブバンド別にSNR値を計算し、SNR値が低いサブバンドのうち、所定サイズ以上のピーク値を有する周波数成分を、重要周波数成分として選択する。前述の三種の方法は、それぞれ実施できるが、少なくとも一つ以上方法を結合して組み合わせることによって実施することができ、前述の方法は、単なる例に過ぎず、前述の方法に限定して実施しなければならないものではない。
第1320段階で選択された第1310段階で変換された信号の周波数成分と、周波数成分が復元される位置を示す情報とを符号化する(第1325段階)。
第1320段階で選択された周波数成分が含まれたバンドに該当するか否かを判断する(第1330段階)。ここでバンドは、後述する第1350段階で符号化を遂行するにおいて適用する処理単位をいう。例えば、QMFの場合、バンドは、1個のサブバンド、または1個のスケールファクタ・バンドになりうる。
もし第1320段階で選択された周波数成分が含まれたバンドに該当すると、第1330段階で判断されれば、第1320段階で選択された周波数成分が含まれたバンドに込められた信号に係わる各エネルギー値を計算する(第1335段階)。
第1335段階で計算された各バンドのエネルギー値と、各バンドの位置を示す情報とを符号化する(第1340段階)。
もし第1320段階で選択された周波数成分が含まれていないバンドに該当すると、第1330段階で判断されれば、分析フィルタバンクによって第1000段階で分割された高周波数信号を、所定の周波数バンド別に時間ドメインによって示すように、ドメインを変換する(第1345段階)。例えば、第1345段階では、QMFを適用してドメインを変換する。
低周波数信号を利用し、第1320段階で選択された周波数成分が含まれていないバンドを復元するための高周波数信号を符号化する(第1350段階)。第1350段階で、信号を符号化するにおいて、低周波数信号を利用して高周波数信号を復号化できる情報を生成して符号化する。
第1305段階で符号化された結果;第1325段階で符号化された周波数成分、及び周波数成分が込められた位置を示す情報;第1340段階で符号化された各バンドのエネルギー値、及び各バンドの位置を示す情報;第1350段階で符号化された低周波数信号を利用して高周波数信号を復号化する情報を含んで多重化することによって、ビットストリームを出力する。
図14は、本発明による復号化方法に係わる他の実施形態をフローチャートで図示したものである。
まず、符号化端から、ビットストリームを入力されて逆多重化する(第1400段階)。例えば、周波数成分及び周波数成分が復元される位置を示す情報、各バンドのエネルギー値、エンコーダ(図示せず)でエネルギー値が符号化されたバンドの位置を示す情報、低周波数信号を利用して高周波数信号を復号化する情報などを、第1400段階で逆多重化できる。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが一般的であるが、必ずしも同じ値に設定して実施しなければならないものではない。
第1400段階後に、低周波数信号を既設定の所定の復号化方式によって復号化する(第1405段階)。第1405段階では、従来に開示されたいかなる復号化方式によっても符号化可能である。なぜならば、本発明による復号化方法は、高周波数信号を復号化するところに技術的特徴があるので、低周波数信号を復号化することと関連して、特定の方式に限定して実施しなければならないものではない。第1405段階で復号化する方式の例として、AAC方式や、所定の重要な周波数成分を復号化し、残りの残余周波数成分は、所定のノイズ信号として復号化したり生成する方式などがある。
第1405段階後に、エンコーダ(図示せず)で、既設定の基準によって重要な周波数成分であると判断されて符号化された所定の周波数成分を復号化する(第1410段階)。
第1410段階で復号化された周波数成分を含んだバンドに該当するか否かを判断する(第1415段階)。
もし周波数成分を含んだバンドに該当すると、第1415段階で判断されれば、第1410段階で復号化された周波数成分に対して適用されるフレームと、低周波数信号を利用して高周波数信号を復号化する情報で適用されるフレームとが互いに一致するか否かを判断する(第1420段階)。
もしフレームが互いに一致しないと、第1420段階で判断されれば、第1410段階で適用されるフレームと、後述する第1445段階で適用されるフレームとが互いに一致しない場合、第1410段階で適用されるフレームと、後述する第1445段階で適用されるフレームとを同期化する(第1425段階)。第1425段階では、第1410段階で適用されるフレームを基に、後述する第1445段階で適用されるフレームのうち、全てまたは一部を処理することが望ましい。
第1415段階で復号化された周波数成分が含まれたバンドを復元するための信号のエネルギー値を復号化する(第1430段階)。
第1415段階で復号化された周波数成分が含まれたバンドを復元するための信号を生成する(第1435段階)。
第1435段階で信号を生成する方法として、次に記述された例がある。第一に、第1435段階では、任意に高周波数信号を生成する。例えば、ランダムノイズ信号がある。第二に、第1435段階では、第1405段階で復号化された低周波数信号をコピーし、高周波数信号を生成できる。例えば、低周波数信号をパッチしたりフォールディングし、高周波数信号を生成できる。第三に、第1435段階では、低周波数信号を利用して高周波数信号を生成できる。
第1430段階で復号化された各バンドのエネルギー値を基に、第1410段階で復号化された周波数成分のエネルギー値を考慮し、第1435段階で生成された信号のエネルギーが調節されるように、第1435段階で生成された信号を調節する(第1440段階)。第1440段階に係わるさらに詳細な一実施形態は、図3の実施形態について説明しつつ述べた。
第1405段階で復号化された低周波数信号を利用し、高周波数信号のうち、第1410段階で復号化された周波数成分を含まないバンドを復元するための信号を復号化する(第1445段階)。
図13の第1345段階で遂行する変換の逆過程によって、第1445段階で復号化された信号のドメインを、合成フィルタバンクを介して逆変換する(第1450段階)。
第1410段階で復号化された周波数成分を、第1440段階で調節された信号と合成する(第1455段階)。第1455段階で合成された信号は、第1410段階で復号化された周波数成分が含まれたバンドのみ復元するので、第1455段階では、残りのバンドに、第1445段階で復号化され、第1450段階で逆変換された信号を合成する。このように、第1455段階で信号を合成することによって、第1455段階では、最終的に高周波数信号を生成する。
第1405段階で復号化された低周波数信号と、第1455段階で合成された高周波数信号とを合成する(第1460段階)。
図15は、本発明による符号化方法に係わる他の実施形態をフローチャートで図示したものである。
まず、既設定の周波数を基にして、入力された信号を、低周波数信号と高周波数信号とに分割する(第1500段階)。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが望ましいが、必ずしも同じ値に設定して実施しなければならないものではない。
第1500段階で分割された低周波数信号を、既設定の所定の符号化方式によって符号化する(第1505段階)。第1505段階では、従来に開示されたいかなる符号化方式によっても符号化可能である。なぜならば、本発明による符号化方法は、高周波数信号を符号化するところに技術的特徴があるので、低周波数信号を符号化することと関連して、特定の符号化方式に限定して実施しなければならないものではない。第1505段階で符号化する方式の例として、AAC方式や、入力された信号から重要な周波数成分だけを検出して符号化し、残りの残余周波数成分は、所定のノイズ信号として符号化する方式などがある。
第1500段階で分割された高周波数信号から、既設定の基準によって、重要な周波数成分であると判断される周波数成分を検出する(第1510段階)。第1510段階で、重要な周波数成分を判断するにおいて、次のような方法がある。第一に、SMR値を計算し、マスキングしきい値より大きい信号を重要な周波数成分として選択する。第二に、所定の重み付けを考慮してスペクトルピークを抽出し、重要な周波数成分を選択する。第三に、各サブバンド別にSNR値を計算し、SNR値が低いサブバンドのうち、所定サイズ以上のピーク値を有する周波数成分を、重要周波数成分として選択する。前述の三種の方法はそれぞれ実施したり、互いに結合して組み合わせることによって実施することができ、前述の方法は、単なる例に過ぎず、前述の方法に限定して実施しなければならないものではない。
第1510段階で検出された周波数成分と、周波数成分が込められた位置を示す情報とを符号化する(第1515段階)。
低周波数信号を利用して高周波数信号を符号化する(第1520段階)。第1520段階で信号を符号化するにおいて、低周波数信号を利用して高周波数信号を復号化できる情報を生成して符号化する。
図10の第1035段階及び図13の第1350段階のように、高周波数信号をバンド別に分割し、重要な周波数成分が含まれていないバンドに対してのみ符号化するものではなく、第1520段階では、高周波数信号全てに対して低周波数信号を利用して符号化する。
第1505段階で符号化された結果;第1515段階で符号化された周波数成分、及び周波数成分が復元される位置を示す情報;第1520段階で符号化された低周波数信号を利用して高周波数信号を復号化する情報を含んで多重化することによって、ビットストリームを生成する(第1525段階)。
図16は、本発明による復号化方法に係わる他の実施形態をフローチャートで図示したものである。
まず、符号化端から、ビットストリームを入力されて逆多重化する(第1600段階)。例えば、周波数成分及び周波数成分が込められた位置を示す情報、並びに低周波数信号を利用し、高周波数信号を復号化する情報などを、第1600段階で逆多重化できる。ここで、低周波数信号は、既設定の第1周波数より低い領域に該当する信号であり、高周波数信号は、既設定の第2周波数より高い領域に該当する信号をいう。第1周波数と第2周波数は、互いに同じ値に設定されることが一般的であるが、必ずしも同じ値に設定して実施しなければならないものではない。
第1600段階後に、低周波数信号を既設定の所定の復号化方式によって復号化する(第1605段階)。第1605段階では、従来に開示されたいかなる復号化方式によっても符号化可能である。なぜならば、本発明による復号化方法は、高周波数信号を復号化するところに技術的特徴があるので、低周波数信号を復号化することと関連して、特定の方式に限定して実施しなければならないものではない。第1605段階で復号化する方式の例として、AAC方式や、所定の重要な周波数成分を復号化し、残りの残余周波数成分は、所定のノイズ信号として復号化したり生成する方式などがある。
第1605段階後に、符号化端で、既設定の基準によって重要な周波数成分であると判断されて符号化された所定の周波数成分を復号化する(第1610段階)。
第1610段階で復号化された各周波数成分のエネルギー値を計算する(第1615段階)。
第1605段階で復号化された低周波数信号を利用し、高周波数信号を復号化する(第1620段階)。
第1620段階で復号化された周波数成分を含んだバンドに該当するか否かを判断する(第1625段階)。ここでバンドは、第1620段階で符号化を遂行するにおいて適用する処理単位をいう。例えば、QMFの場合、バンドは、1個のサブバンド、または1個のスケールファクタ・バンドになりうる。
もし周波数成分を含んだバンドに該当すると、第1625段階で判断されれば、第1620段階で復号化された信号のうち、第1610段階で復号化された周波数成分が含まれたバンドを復元するための信号を調節する(第1630段階)。
第1630段階で調節するバンドに込められた信号に対するエネルギーが、第1620段階で復号化された信号のエネルギー値から、第1615段階で計算された各バンドに含まれた周波数成分のエネルギー値を減算した値になるように、第1620段階で復号化された信号を調節する(第1635段階)。
第1610段階で復号化された周波数成分を、第1625段階で調節された高周波数信号と合成する(第1640段階)。
このような過程によって、周波数成分を含んだバンドには、第1640段階で合成した信号として復元され、周波数成分を含まないバンドには、第1620段階で低周波数信号を利用して復号化した高周波数信号として復元される。
第1605段階で復号化された低周波数信号と、第1650段階で合成された高周波数信号とを合成する(第1645段階)。
本発明は、コンピュータで読取り可能な記録媒体にコンピュータ(情報処理機能を有する装置をいずれも含む)で読取り可能なコードとして具現することが可能である。コンピュータで読取り可能な記録媒体は、コンピュータシステムによって読取り可能なデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読取り可能な記録装置の例としては、ROM(read-only memory)、RAM(random-access memory)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。
かような本発明に対する理解を助けるために、図面に図示された実施形態を参考に説明したが、それらは例示的なものに過ぎず、当分野で当業者ならば、それらから多様な変形及び均等な他実施形態が可能であるという点を理解することができるであろう。従って、本発明の真の技術的保護範囲は、特許請求の範囲によって決まるものである。
本発明による高周波数領域の符号化方法並びに装置によれば、既設定の周波数より高い領域に該当する信号から重要な周波数成分を検出して符号化し、検出された周波数成分が含まれたバンドとして復元された信号のエネルギー値を符号化する。また、本発明による高周波数領域の復号化方法並びに装置によれば、重要な周波数成分が含まれたバンドに込められた信号を、重要な周波数成分のエネルギー値を考慮して調節することによって、復号化する。
これにより、少ないビットを利用して符号化したり復号化するにもかかわらず、高周波数領域に該当する信号の音質を低下させないので、コーディング効率を極大化できる効果を収められる。
本発明の実施例に関し、更に、以下の項目を開示する。
(1)既設定の周波数より高い領域に該当する信号から、既設定の基準によって、周波数成分を検出して符号化する段階と、
前記検出された周波数成分が含まれたバンドを復元するための信号のエネルギー値を符号化する段階とを含むことを特徴とする高周波数領域の符号化方法。
(2)既設定の周波数より高い領域のうち、前記検出された周波数成分が含まれていないバンドを復元するための信号を、既設定の周波数より低い領域に該当する信号を利用して符号化する段階をさらに含むことを特徴とする(1)に記載の高周波数領域の符号化方法。
(3)既設定の周波数より高い領域のうち、前記検出された周波数成分が含まれたバンドに込められた信号に係わるトーナリティを符号化する段階をさらに含むことを特徴とする(1)に記載の高周波数領域の符号化方法。
(4)既設定の周波数より高い領域に含まれる周波数成分を復号化する段階と、
前記復号化された周波数成分が含まれたバンドを復元するための信号のエネルギー値を復号化する段階と、
前記バンドを復元するための信号を生成する段階と、
前記復号化されたエネルギー値を基に、前記復号化された周波数成分のエネルギー値を考慮し、前記生成された信号のエネルギー値を調節する段階と、
前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する段階とを含むことを特徴とする高周波数領域の復号化方法。
(5)既設定の周波数より高い領域のうち、前記復号化された周波数成分が含まれていないバンドを復元するための信号を、既設定の周波数より低い領域に該当する信号を利用して復号化する段階をさらに含むことを特徴とする(4)に記載の高周波数領域の復号化方法。
(6)前記生成する段階で生成される信号は、
任意に生成された信号であることを特徴とする(4)に記載の高周波数領域の復号化方法。
(7)前記生成する段階で生成される信号は、
既設定の周波数より低い領域に該当する信号をコピーした信号であることを特徴とする(4)に記載の高周波数領域の復号化方法。
(8)前記生成する段階で生成される信号は、
既設定の周波数より低い領域に該当する信号を利用して生成した信号であることを特徴とする(4)に記載の高周波数領域の復号化方法。
(9)前記調節する段階は、
前記生成された信号のエネルギー値が前記復号化されたエネルギー値から、前記復号化された周波数成分のエネルギー値を減算した値になるように、調節することを特徴とする(4)に記載の高周波数領域の復号化方法。
(10)既設定の周波数より高い領域のうち、前記復号化された周波数成分が含まれたバンドに込められた信号のトーナリティを復号化する段階をさらに含むことを特徴とする(4)に記載の高周波数領域の復号化方法。
(11)前記調節する段階は、
前記復号化されたエネルギー値を基に、前記復号化された周波数成分のエネルギー値と、前記復号化されたトーナリティとを利用し、前記生成された信号のエネルギー値を調節することを特徴とする(10)に記載の高周波数領域の復号化方法。
(12)前記周波数成分を復号化する段階で利用されるフレームと、前記信号を利用して復号化する段階で利用されるフレームとが一致しない場合、フレームを同期化する段階をさらに含むことを特徴とする(5)に記載の高周波数領域の復号化方法。
(13)既設定の周波数より高い領域に含まれる周波数成分を復号化する段階と、
既設定の周波数より低い領域に該当する信号を利用し、既設定の周波数より高い領域に該当する信号を復号化する段階と、
前記復号化された周波数成分のエネルギー値を考慮し、前記復号化された信号のエネルギー値を調節する段階と、
前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する段階とを含むことを特徴とする高周波数領域の復号化方法。
(14)前記調節する段階は、
前記復号化された信号のエネルギー値から、前記復号化された周波数成分のエネルギー値を減算した値になるように、前記復号化された信号のエネルギー値を調節することを特徴とする(13)に記載の高周波数領域の復号化方法。
(15)前記周波数成分を復号化する段階で利用されるフレームと、前記信号を復号化する段階で利用されるフレームとが一致しない場合、フレームを同期化する段階をさらに含むことを特徴とする(13)に記載の高周波数領域の復号化方法。
(16)既設定の周波数より高い領域に該当する信号から、既設定の基準によって、周波数成分を検出して符号化する段階と、
前記検出された周波数成分が含まれたバンドを復元するための信号のエネルギー値を符号化する段階とを含む発明を、コンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体。
(17)既設定の周波数より高い領域に含まれた周波数成分を復号化する段階と、
前記復号化された周波数成分が含まれたバンドを復元するための信号のエネルギー値を復号化する段階と、
前記バンドを復元するための信号を生成する段階と、
前記復号化されたエネルギー値を基に、前記復号化された周波数成分のエネルギー値を考慮し、前記生成された信号のエネルギー値を調節する段階と、
前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する段階とを含む発明を、コンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体。
(18)既設定の周波数より高い領域に含まれた周波数成分を復号化する段階と、
既設定の周波数より低い領域に該当する信号を利用し、既設定の周波数より高い領域に該当する信号を復号化する段階と、
前記復号化された周波数成分のエネルギー値を考慮し、前記復号化された信号のエネルギー値を調節する段階と、
前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する段階とを含む発明を、コンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体。
(19)既設定の周波数より高い領域に該当する信号から、既設定の基準によって、周波数成分を検出して符号化する周波数成分符号化部と、
前記検出された周波数成分が含まれたバンドを復元するための信号のエネルギー値を符号化するエネルギー値符号化部とを含むことを特徴とする高周波数領域の符号化装置。
(20)既設定の周波数より高い領域のうち、前記検出された周波数成分が含まれていないバンドを復元するための信号を、既設定の周波数より低い領域に該当する信号を利用して符号化する帯域幅拡張符号化部をさらに含むことを特徴とする(19)に記載の高周波数領域の符号化装置。
(21)既設定の周波数より高い領域のうち、前記検出された周波数成分が含まれたバンドに込められた信号のトーナリティを符号化するトーナリティ符号化部をさらに含むことを特徴とする(19)に記載の高周波数領域の符号化装置。
(22)既設定の周波数より高い領域に含まれた周波数成分を復号化する周波数成分復号化部と、
前記復号化された周波数成分が含まれたバンドを復元するための信号のエネルギー値を復号化するエネルギー値復号化部と、
前記バンドを復元するための信号を生成する信号生成部と、
前記復号化されたエネルギー値を基に、前記復号化された周波数成分のエネルギー値を考慮し、前記生成された信号のエネルギー値を調節する信号調節部と、
前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する信号合成部とを含むことを特徴とする高周波数領域の復号化装置。
(23)既設定の周波数より高い領域のうち、前記復号化された周波数成分が含まれていないバンドを復元するための信号を、既設定の周波数より低い領域に該当する信号を利用して復号化する帯域幅拡張復号化部をさらに含むことを特徴とする(22)に記載の高周波数領域の復号化装置。
(24)前記信号生成部は、
任意に信号を生成することを特徴とする(22)に記載の高周波数領域の復号化装置。
(25)前記信号生成部は、
既設定の周波数より低い領域に該当する信号をコピーし、信号を生成することを特徴とする(22)に記載の高周波数領域の復号化装置。
(26)前記信号生成部は、
既設定の周波数より低い領域に該当する信号を利用し、信号を生成することを特徴とする(22)に記載の高周波数領域の復号化装置。
(27)前記信号調節部は、
前記生成された信号のエネルギー値が、前記復号化されたエネルギー値から、前記復号化された周波数成分のエネルギー値を減算した値になるように、調節することを特徴とする(22)に記載の高周波数領域の復号化装置。
(28)既設定の周波数より高い領域のうち、前記復号化された周波数成分が含まれたバンドを復元するための信号のトーナリティを復号化するトーナリティ復号化部をさらに含むことを特徴とする(22)に記載の高周波数領域の復号化装置。
(29)前記信号調節部は、
前記復号化されたエネルギー値を基に、前記復号化された周波数成分のエネルギー値と、前記復号化されたトーナリティとを利用し、前記生成された信号のエネルギー値を調節することを特徴とする(28)に記載の高周波数領域の復号化装置。
(30)前記周波数成分を復号化する段階で利用されるフレームと、前記信号を利用して復号化する段階で利用されるフレームとが一致しない場合、フレームを同期化する同期化部をさらに含むことを特徴とする(22)に記載の高周波数領域の復号化装置。
(31)既設定の周波数より高い領域に含まれた周波数成分を復号化する周波数成分復号化部と、
既設定の周波数より低い領域に該当する信号を利用し、既設定の周波数より高い領域に該当する信号を復号化する帯域幅拡張復号化部と、
前記復号化された周波数成分のエネルギー値を考慮し、前記復号化された信号のエネルギー値を調節する信号調節部と、
前記復号化された周波数成分と、前記エネルギー値が調節された信号とを合成する信号合成部とを含むことを特徴とする高周波数領域の復号化装置。
(32)前記信号調節部は、
前記復号化された信号のエネルギー値から、前記復号化された周波数成分のエネルギー値を減算した値になるように、前記復号化された信号のエネルギー値を調節することを特徴とする(31)に記載の高周波数領域の復号化装置。
(33)前記周波数成分復号化部で利用されるフレームと、前記帯域幅拡張復号化部で利用されるフレームとが一致しない場合、フレームを同期化する同期化部をさらに含むことを特徴とする(31)に記載の高周波数領域の復号化装置。

Claims (2)

  1. 音声または音楽信号既設定の周波数より低い領域の信号を符号化する第1符号化部と、
    前記音声または音楽信号において前記既設定の周波数より高い領域の信号について既設定の基準によって、主要な周波数成分を検出し、前記既設定の周波数より高い領域の信号のうち、前記検出された主要な周波数成分が含まれたバンドの場合、前記検出された主要な周波数成分と前記主要な周波数成分が含まれたバンドのエネルギーに基づき符号化処理を行い、前記検出された主要な周波数成分が含まれていないバンドの場合、前記既設定の周波数より低い領域の信号に基づき符号化処理を行う第2符号化部と、を備えることを特徴とする音声または音楽信号の符号化装置。
  2. 既設定の周波数より低い領域の符号化された周波数成分を復号化する第1復号化部と、
    設定の周波数より高い領域のうち、前記符号化された主要な周波数成分が含まれたバンドの場合、前記符号化された主要な周波数成分と前記主要な周波数成分が含まれたバンドのエネルギー値に基づき復号化処理を行い、前記符号化された主要な周波数成分が含まれていないバンドの場合、前記既設定の周波数より低い領域の符号化された周波数成分に基づき復号化処理を行う第2復号化部と、
    前記既設定の周波数より低い領域の復号化された結果と前記既設定の周波数より高い領域の処理結果とを合成する合成部と、を備えることを特徴とする音声または音楽信号の復号化装置。
JP2016237817A 2007-04-30 2016-12-07 高周波数領域の符号化及び復号化の方法並びに装置 Active JP6363683B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2007-0042035 2007-04-30
KR1020070042035A KR101355376B1 (ko) 2007-04-30 2007-04-30 고주파수 영역 부호화 및 복호화 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012263597A Division JP2013061671A (ja) 2007-04-30 2012-11-30 高周波数領域の符号化及び復号化の方法並びに装置

Publications (2)

Publication Number Publication Date
JP2017068276A JP2017068276A (ja) 2017-04-06
JP6363683B2 true JP6363683B2 (ja) 2018-07-25

Family

ID=39888052

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2010506031A Expired - Fee Related JP5543334B2 (ja) 2007-04-30 2008-02-29 高周波数領域の符号化及び復号化の方法並びに装置
JP2012263597A Pending JP2013061671A (ja) 2007-04-30 2012-11-30 高周波数領域の符号化及び復号化の方法並びに装置
JP2016237817A Active JP6363683B2 (ja) 2007-04-30 2016-12-07 高周波数領域の符号化及び復号化の方法並びに装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2010506031A Expired - Fee Related JP5543334B2 (ja) 2007-04-30 2008-02-29 高周波数領域の符号化及び復号化の方法並びに装置
JP2012263597A Pending JP2013061671A (ja) 2007-04-30 2012-11-30 高周波数領域の符号化及び復号化の方法並びに装置

Country Status (8)

Country Link
US (2) US8560304B2 (ja)
EP (2) EP2998959B1 (ja)
JP (3) JP5543334B2 (ja)
KR (1) KR101355376B1 (ja)
CN (3) CN102750953A (ja)
ES (1) ES2711889T3 (ja)
TR (1) TR201901421T4 (ja)
WO (1) WO2008133400A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
EP2294770B1 (en) * 2008-06-20 2013-08-07 Rambus, Inc. Frequency responsive bus coding
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5598536B2 (ja) * 2010-03-31 2014-10-01 富士通株式会社 帯域拡張装置および帯域拡張方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US9117459B2 (en) 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
EP2767977A4 (en) * 2011-10-21 2015-04-29 Samsung Electronics Co Ltd METHOD AND DEVICE FOR LOSS-FREE ENERGY CODING, AUDIO CODING METHOD AND DEVICE, METHOD AND APPARATUS FOR LOSS-FREE ENERGY DECODING AND AUDIO CODING METHOD AND DEVICE
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
BR112015017632B1 (pt) 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para gerar um sinal melhorado da frequência utilizando nivelamento temporal de sub-bandas
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
KR101864122B1 (ko) 2014-02-20 2018-06-05 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
MX356371B (es) 2014-07-25 2018-05-25 Fraunhofer Ges Forschung Dispositivo de codificacion de señal acustica, dispositivo de decodificacion de señal acustica, metodo para codificar una señal acustica y metodo para decodificar una señal acustica.
KR102318763B1 (ko) 2014-08-28 2021-10-28 삼성전자주식회사 기능 제어 방법 및 이를 지원하는 전자 장치
CN107294579A (zh) 2016-03-30 2017-10-24 索尼公司 无线通信***中的装置和方法以及无线通信***
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113192523A (zh) * 2020-01-13 2021-07-30 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113808597A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113948094A (zh) * 2020-07-16 2022-01-18 华为技术有限公司 音频编解码方法和相关装置及计算机可读存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5579404A (en) * 1993-02-16 1996-11-26 Dolby Laboratories Licensing Corporation Digital audio limiter
DE69924922T2 (de) 1998-06-15 2006-12-21 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierungsmethode und Audiokodierungsvorrichtung
US20020009000A1 (en) * 2000-01-18 2002-01-24 Qdesign Usa, Inc. Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
CN100395817C (zh) 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
JP3926726B2 (ja) 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
JP2003255973A (ja) 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
BRPI0306434B1 (pt) * 2002-09-19 2018-06-12 Nec Corporation Aparelho e método de decodificação de áudio
JP4168976B2 (ja) 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
DE102004036154B3 (de) 2004-07-26 2005-12-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur robusten Klassifizierung von Audiosignalen sowie Verfahren zu Einrichtung und Betrieb einer Audiosignal-Datenbank sowie Computer-Programm
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
KR20070005469A (ko) 2005-07-05 2007-01-10 엘지전자 주식회사 다채널 오디오 신호의 디코딩 장치 및 디코딩 방법
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
KR20070011100A (ko) 2005-07-18 2007-01-24 엘지전자 주식회사 다채널 오디오 코딩에서 오디오 신호의 에너지 보정방법 및그 보정을 위한 부호화된 오디오 신호 생성방법
JP4736812B2 (ja) 2006-01-13 2011-07-27 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication

Also Published As

Publication number Publication date
EP2998959A1 (en) 2016-03-23
USRE47824E1 (en) 2020-01-21
CN102750954A (zh) 2012-10-24
EP2153437A4 (en) 2011-07-13
ES2711889T3 (es) 2019-05-08
WO2008133400A1 (en) 2008-11-06
EP2153437A1 (en) 2010-02-17
JP2013061671A (ja) 2013-04-04
JP2017068276A (ja) 2017-04-06
CN101681623A (zh) 2010-03-24
EP2998959B1 (en) 2019-01-30
JP5543334B2 (ja) 2014-07-09
CN101681623B (zh) 2012-08-08
KR101355376B1 (ko) 2014-01-23
CN102750953A (zh) 2012-10-24
JP2010526331A (ja) 2010-07-29
KR20080096998A (ko) 2008-11-04
TR201901421T4 (tr) 2019-02-21
US8560304B2 (en) 2013-10-15
US20080270125A1 (en) 2008-10-30

Similar Documents

Publication Publication Date Title
JP6363683B2 (ja) 高周波数領域の符号化及び復号化の方法並びに装置
JP6386634B2 (ja) オーディオ信号の符号化及び復号化方法並びにその装置
JP7483792B2 (ja) 符号化オーディオ信号を復号する復号装置および復号方法
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
KR101747918B1 (ko) 고주파수 신호 복호화 방법 및 장치
TWI303410B (en) Audio decoding apparatus and audio decoding method
JP5336522B2 (ja) 瞬間的事象を有する音声信号の操作装置および操作方法
KR101680953B1 (ko) 인지 오디오 코덱들에서의 고조파 신호들에 대한 위상 코히어런스 제어

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180529

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180628

R150 Certificate of patent or registration of utility model

Ref document number: 6363683

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250