JP2011507050A - オーディオ信号処理方法及び装置 - Google Patents

オーディオ信号処理方法及び装置 Download PDF

Info

Publication number
JP2011507050A
JP2011507050A JP2010539300A JP2010539300A JP2011507050A JP 2011507050 A JP2011507050 A JP 2011507050A JP 2010539300 A JP2010539300 A JP 2010539300A JP 2010539300 A JP2010539300 A JP 2010539300A JP 2011507050 A JP2011507050 A JP 2011507050A
Authority
JP
Japan
Prior art keywords
band
copy
information
spectrum data
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010539300A
Other languages
English (en)
Other versions
JP5400059B2 (ja
Inventor
クク リ,ヒュン
スー キム,ドン
ヨン ユン,スン
スク パン,ヒ
ヒュン リム,ジェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2011507050A publication Critical patent/JP2011507050A/ja
Application granted granted Critical
Publication of JP5400059B2 publication Critical patent/JP5400059B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

オーディオ信号を処理する方法を開示する。本発明は、第1帯域及び第2帯域からなる周波数帯域において前記第1帯域に対応するスペクトルデータを受信し、前記第1の帯域の部分帯域に対応するコピーバンドの周波数情報に基づいて前記コピーバンドを決定し、前記コピーバンドのスペクトルデータを用いて、前記第2帯域に対応するターゲットバンドのスペクトルデータを生成することを有し、前記コピーバンドは前記第1帯域の上部に存在する。
【選択図】図2

Description

本発明は、信号を処理する装置及びその方法に関するものである。本発明は、広い範囲のアプリケーションに適応するが、特に、信号のスペクトルデータを用いてオーディオ信号をエンコーディング及びデコーディングすることに適する。
一般に、信号特性を用いたオーディオ信号の処理において、互いに異なる帯域の信号間の特性に基づいてオーディオ信号は処理される。
従来技術は、互いに異なる帯域の信号間の特性に基づいてオーディオ信号を効果的に処理するには不十分である。
本発明は、信号を処理する装置、及びその方法に向いており、関連する技術の制限や不利点による1以上の問題を実質的に取り除く。
本発明の目的は、互いに異なる帯域の信号間の特性に基づいてオーディオ信号を処理することができる信号処理装置、及びその方法を提供することにある。
本発明の他の目的は、特定帯域の複数スペクトルデータから適切なスペクトルデータを選択する方法で、異なる帯域におけるスペクトルデータを取得することができる信号処理装置、及びその方法を提供することにある。
本発明の更なる目的は、音声信号及びオーディオ信号などの互いに異なる特性を有する信号をその対応する特性に適した方式により処理するにもかかわらず、ビットレートを最小化することができる信号処理装置、及びその方法を提供することにある。
本発明の更なる特性と利点は、以下の記載で説明され、当該記載から一部が明らかとなり、又は本発明の実施により知ることができる。本発明の目的とその他の利点は、明細書、特許請求の範囲、図面で特に示される構成により、実現され、及び達成される。
実例化され、広範に記載されるように、これらの、及びその他の利点を達成するために、並びに本発明の目的に従い、本発明に係る信号処理装置は、コピーバンド決定部、帯域拡張情報受信部及びターゲットバンド生成部を有する。前記ターゲットバンド生成部は、時間拡張/圧縮部及びデシメーション部を含み、フィルタリング部をさらに含むことができる。
前記コピーバンド決定部は、低周波帯域及び高周波帯域からなる周波数帯域において、前記低周波帯域に対応するスペクトルデータを受信し、前記低周波帯域の部分帯域に対応するコピーバンドの周波数情報に基づいて前記コピーバンドを決定する。
帯域拡張情報取得部は、前記コピーバンドからターゲットバンドを生成するための付加情報を取得し、前記付加情報はビットストリームから取得することができる。前記付加情報は、ゲイン情報、ハーモニック(harmonic)情報などを含むことができる。
前記ターゲット情報生成部は、前記コピーバンドのスペクトルデータを用いて、前記高周波領域に対応するターゲットバンドのスペクトルデータを生成する。ここで、前記コピーバンドは、前記低周波帯域の上部に存在することができる。低周波帯域に存在するコピーバンドを用いて高周波帯域を生成することもでき、その逆に、高周波帯域に存在するコピーバンドを用いて低周波帯域を生成することもできる。
前記ターゲットバンド生成部は、時間拡張/圧縮部及びデシメーション部を含み、フィルタリング部をさらに含むことができる。すなわち、前記コピーバンドは、ビットストリームから取得することもでき、受信されたスペクトルデータをフィルタリングして取得することもできる。
ここで、前記コピーバンドの周波数情報は、開始周波数、開始バンド及びこれを示すインデックス情報のうち一つであって、前記ターゲットバンドのスペクトルデータは、前記コピーバンドのスペクトルデータと前記ターゲットバンドのスペクトルデータとの間のゲインに該当するゲイン情報及び前記コピーバンドのハーモニック情報のうち一つ以上を用いて生成される。前記低周波帯域のスペクトルデータは、オーディオ信号及び音声信号のうち一つによってデコーディングされる。
本発明は、既存のAAC、AC3、AMRなどのコアコーディング又は今後のコアコーディングに適用される。以下では、ダウンミックス信号に適用される場合を基準にして説明するが、これに限定されることはない。
当然のことであるが、前記の一般的な記載、及び以下の詳細な記載の両方は、典型的なもの、説明的なものであり、請求項に記載される本発明の更なる説明を提供することを目的とする。
本発明は、次のような効果と利点を提供する。
第一に、音声信号の特性を有する信号は音声信号としてデコーディングし、オーディオ信号の特性を有する信号はオーディオ信号としてデコーディングするので、各信号の特性に符合するデコーディング方式を適応的に選択することができる。
第二に、伝送されたスペクトルデータのうち最も適切なスペクトルデータを選択することによって、他の帯域のスペクトルデータを取得するので、オーディオ信号の復元率を高めることができる。
第三に、エンコーダから伝送された開始バンド情報を用いてスペクトルデータを選択するので、スペクトルデータの選択において正確度を高めることができ、演算に必要な複雑度を減少させることができる。
第四に、一部の帯域に該当するスペクトルデータの伝送を省略できるので、スペクトルデータの伝送に要されるビットを著しく節減することができる。
本発明の更なる理解を提供するために添付され、組み込まれ、及び本明細書の一部を構成する図面は、本発明の実施例を説明し、記述と共に、本発明の原理を説明する。
本発明の実施例に係るオーディオ信号エンコーディング装置の構成図である。 図1の部分帯域エンコーディング部の細部構成図である。 本発明に係るコピーバンド、ターゲットバンド及び開始バンドの関係を示した図である。 本発明の部分帯域拡張の多様な実施例を示した図である。 本発明の実施例に係るオーディオ信号デコーディング装置の構成図である。 図5の部分帯域デコーディング部の細部構成図である。 ターゲットバンドのスペクトルデータの数がコピーバンドのスペクトルデータの数より大きい場合を説明するための図である。 ターゲットバンドのスペクトルデータの個数がコピーバンドのスペクトルデータの個数より小さい場合を説明するための図である。
本発明の好適な実施例が詳細に説明され、これらの例は図面により説明される。
本発明に使用される下記の用語は、次のような基準で解釈され、記載されていない用語も下記の趣旨によって解釈される。「コーディング(coding)」は、場合によってエンコーディング又はデコーディングに解釈され、「情報(information)」は、値、パラメータ、係数、成分などを総称する用語で、場合によって異なる意味に解釈されることもあるが、本発明がこれに限定されることはない。
図1は、本発明の実施例に係るオーディオ信号エンコーディング装置の構成を示す図で、図2は、図1の部分帯域エンコーディング部の細部構成を示す図である。
図1を参照すれば、オーディオ信号エンコーディング装置は、マルチチャネルエンコーディング部110、部分帯域エンコーディング部120、オーディオ信号エンコーディング部130、音声信号エンコーディング部140及びマルチプレクサ150を含む。
マルチチャネルエンコーディング部110は、複数のチャネル信号(以下、マルチチャネル信号)を受け、ダウンミックスを行うことによってダウンミックス信号を生成し、ダウンミックス信号をマルチチャネル信号にアップミックスするために必要な空間情報を生成する。ここで、空間情報は、チャネルレベル差情報、チャネル間相関情報、チャネル予測係数及びダウンミックスゲイン情報などを含むことができる。
一方、ここでのダウンミックス信号は、時間ドメイン(例えば、残余(residual)データ)の信号であるか、周波数変換が行われた周波数ドメイン(例えば、スケールファクタ係数、スペクトルデータ)の情報である。
部分帯域エンコーディング部120は、広帯域信号から狭帯域信号及び帯域拡張情報を生成する。
複数の帯域からなる元の信号を広帯域信号といい、複数の帯域のうち少なくとも一つの帯域を狭帯域信号という。例えば、2個の帯域である低周波帯域及び高周波帯域からなる広帯域信号において、前記低周波帯域又は高周波帯域を狭帯域信号という。部分帯域は、前記狭帯域信号全体の一部を示し、以下ではコピーバンドと称する。
帯域拡張情報は、前記コピーバンドを用いてターゲットバンドを生成するための情報であって、周波数情報、ゲイン情報、ハーモニック成分情報などを含むことができる。デコーダにおいて、前記広帯域信号は、狭帯域信号に前記ターゲットバンドを結合することによって生成される。
ダウンミックス信号(狭帯域ダウンミックス信号(DMX))の特定フレーム又は特定セグメントが大きいオーディオ特性を有する場合、オーディオ信号エンコーディング部130は、オーディオコーディング方式にしたがってダウンミックス信号をエンコーディングする。ここで、オーディオ信号は、AAC(Advanced Audio Coding)標準又はHE―AAC(High Efficiency Advanced Audio Coding)標準に従うものであるが、本発明がこれに限定されることはない。一方、オーディオ信号エンコーディング部は、MDCT(Modified Discrete Transform)エンコーダに該当する。
ダウンミックス信号(狭帯域ダウンミックス信号(DMX))の特定フレーム又は特定セグメントが大きい音声特性を有する場合、音声信号エンコーディング部140は、音声コーディング方式にしたがってダウンミックス信号をエンコーディングする。ここで、音声信号は、G.7XX系列又はAMR―系列を含むことができ、これに限定されることはない。一方、音声信号エンコーディング部140は、線形予測符号化(LPC:Linear Prediction Coding)方式をさらに用いることができる。ハーモニック信号が時間軸上で高い重複性を有する場合、過去の信号から現在の信号を予測する線形予測によってモデリングされるが、この場合、線形予測符号化方式を採択することによって符号化効率を高めることができる。一方、音声信号エンコーディング部140はタイムドメインエンコーダに該当する。
このように、部分帯域エンコーディング部120を通した狭帯域ダウンミックスは、フレーム別又はセグメント別にオーディオ信号エンコーディング部130又は音声信号エンコーディング部140のうち一つによってエンコーディングされる。
マルチプレクサ150は、マルチチャネルエンコーディング部110によって生成された空間情報、部分帯域エンコーディング部120によって生成された帯域拡張情報、エンコーディングされた狭帯域ダウンミックス信号をマルチプレクシングすることによってビットストリームを生成する。
以下、図2を参照して部分帯域エンコーディング部120の細部構成について説明する。
図2を参照すれば、部分帯域エンコーディング部120は、スペクトルデータ取得部122、コピーバンド決定部124、ゲイン情報取得部126、ハーモニック成分情報取得部128及び帯域拡張情報伝送部129を含む。
スペクトルデータ取得部122は、受信された広帯域信号がスペクトルデータでない場合、ダウンミックスをスペクトル係数に変換し、スペクトル係数をスケールファクタでスケーリングした後、量子化を行うことによってスペクトルデータを生成する。ここでのスペクトルデータは、広帯域ダウンミックスに対応する広帯域のスペクトルデータである。
コピーバンド決定部124は、広帯域のスペクトルデータに基づいてコピーバンド及びターゲットバンドを決定し、帯域拡張のための周波数情報を生成し、前記周波数情報は、開始周波数又は開始バンド情報などを含むことができる。以下、図3及び図4を参照しながらコピーバンドなどについて説明する。
図3は、本発明の第1の実施例に係るコピーバンド、ターゲットバンド及び開始バンドの関係を示した図で、図4は、本発明の第2の実施例〜第4の実施例に係るコピーバンド、ターゲットバンド及び開始バンドの関係を示した図である。
まず、図3を参照すれば、0からn−1まで合計n個のスケールファクタバンド(sfb)が存在し、各スケールファクタバンド(sfb、…、sfbn−1)に対応するスペクトルデータが存在する。特定バンドに属するスペクトルデータ(sd)は多数のスペクトルデータの集合(sdi_0からsdi_m−1)を意味することができるが、スペクトルデータの個数(m)は、スペクトルデータ単位、バンド単位又はそれ以上の単位に対応して生成することができる。一方、0番目のスケールファクタバンド(sfb)が低周波帯域で、n−1番目のスケールファクタバンド(sfbn−1)が上部、すなわち、高周波帯域に該当することを例に挙げているが、その逆の場合も可能である。
広帯域信号に該当するスペクトルデータは、第1帯域及び第2帯域を含む帯域全体(sfb、…、sfbn−1)に該当するスペクトルデータである。また、狭帯域ダウンミックス(DMX)に該当するスペクトルデータは、第1帯域に該当するスペクトルデータであって、0番目のバンド(sfb)のスペクトルデータからi−1番目のバンド(sfbi−1)のスペクトルデータまでを含む。すなわち、狭帯域スペクトルデータのみがデコーダに伝送され、残りのバンド(sfbからsfbn−1)のスペクトルデータは伝送されない。
このようにスペクトルデータが伝送されないバンドをデコーダが生成し、これをターゲットバンド(target band)(tb)という。一方、コピーバンド(copy band)(cb)は、デコーダでターゲットバンド(tb)のスペクトルデータを生成するのに用いられるスペクトルデータのスケールファクタバンドである。コピーバンドは、狭帯域ダウンミックスに対応するバンド(sfb〜sfbi−1)のうち一部(sfb〜sfbi−1)である。コピーバンド(cb)が開始されるバンドは開始バンド(start band)(sb)で、開始バンドの周波数は開始周波数である。すなわち、コピーバンド(cb)は、開始バンド(sb)自体であるか、開始バンド及びそれより高い周波数バンドを含むか、開始バンド及びそれより低い周波数バンドを含むことができる。
本発明によれば、エンコーダで広帯域スペクトルデータを用いて狭帯域スペクトルデータ及び帯域拡張情報を生成し、デコーダでは、狭帯域スペクトルデータのうちコピーバンドのスペクトルデータを用いてターゲットバンドのスペクトルデータを生成する。
図4は、部分帯域拡張の三つの実施例を示している。コピーバンドは、狭帯域全体の部分帯域としてターゲットバンドを生成することができ、ここで、前記コピーバンドは、狭帯域の上部周波数帯域に位置することができる。そして、前記コピーバンドの個数は、少なくとも一つであって、複数である場合、前記コピーバンドは等間隔又は可変間隔で位置することができる。
図4(A)は、コピーバンドの帯域幅及びターゲットバンドの帯域幅が同一である場合の部分バンド拡張方式を示している。すなわち、コピーバンド(cb)は、開始バンド(sb)に該当するs番目のバンド(sfb)、n−4番目のバンド(sfbn−4)及びn−2番目のバンド(sfbn−2)である。エンコーダでは、コピーバンドのスペクトルデータを用いてコピーバンドの右側にあるターゲットバンドのスペクトルデータの伝送を省略することができる。一方、コピーバンドのスペクトルデータとターゲットバンドのスペクトルデータとの間の差であるゲイン情報(g)が生成されるが、これについては後ほど説明する。
図4(B)は、コピーバンド及びターゲットバンドの帯域幅が異なる場合を示している。ターゲットバンドの帯域幅は、コピーバンドの帯域幅の二つ以上(tb、tb’)であって、前記コピーバンドの帯域幅に該当するターゲットバンドの帯域幅のスペクトルデータに互いに異なるゲイン(g、gs+1)を適用して生成することができる。
図4(C)を参照すれば、コピーバンドのスペクトルデータを用いてターゲットバンドのスペクトルデータを生成した後、第2開始バンド(sfb)以前のバンド(sfbk0〜sfbk−1)に該当するスペクトルデータを用いて、第2ターゲットバンド(sfb、…、sfbn−1)のスペクトルデータを生成することができる。このとき、開始バンドの周波数はサンプリング周波数(f)の1/8に該当し、第2開始バンドはサンプリング周波数(f)の1/8に該当するが、本発明がこれに限定されることはない。
以上、本発明の多様な実施例に係るターゲットバンド、コピーバンド及び開始バンドの関係を説明したが、再び図2を参照しながら、残りの構成要素について説明する。
コピーバンド決定部124は、上述したように、コピーバンド、ターゲットバンド及びコピーバンドの開始バンド(sb)を決定する。開始バンドは、フレーム別に可変的に決定することができる。この開始バンドは、フレーム毎の信号の特性によって決定されるが、信号が過渡(transient)、又は定常(stationary)であるかによって決定することができる。例えば、信号が過渡である場合、信号が定常である場合よりもハーモニック成分が少ないので、開始バンドが低い周波数として決定される。
一方、開始バンドは、スペクトルセントロイドを用いた音の明るさの数値として決定することもできる。例えば、音が比較的明るい場合(高音が多い場合)は開始バンドを高周波帯域で形成し、音が比較的暗い場合(低音が多い場合)は開始バンドを低周波帯域で形成することができる。フレーム毎に可変的に開始バンドは決定されるが、音質とビットレート間のトレードオフを考慮して開始バンドを決定することが望ましい。
コピーバンド決定部124は、ターゲットバンドのスペクトルデータが除かれた狭帯域のスペクトルデータ又は狭帯域ダウンミックス(DMX)を出力する。この狭帯域ダウンミックスは、図1を参照して説明したオーディオ信号エンコーディング部又は音声信号エンコーディング部に入力される。
また、コピーバンド決定部124は、開始バンド情報を生成し、開始バンド情報は、コピーバンド(cb)が開始される開始周波数についての開始周波数情報、又はコピーバンド(cb)の開始バンド情報を示す。開始バンド情報は、実際の値のみでなく、インデックス情報としても表示される。前記開始バンド情報がインデックス情報として表示された場合、前記インデックスに該当する開始バンド情報は、テーブルに格納され、デコーダで用いることができる。開始バンド情報は、帯域拡張情報伝送部129に伝達され、帯域拡張情報として加えられる。
ゲイン情報取得部126は、ターゲットバンドのスペクトルデータ及びコピーバンドのスペクトルデータを用いてゲイン情報を生成する。ここで、ゲイン情報は、次の等式のようにコピーバンドのエネルギーとターゲットバンドのエネルギーの比として定義される。
Figure 2011507050
ここで、gはゲインで、iは現在のターゲットバンドである。
このゲイン情報は、上記のようにターゲットバンド別に決定される。ゲイン情報は、帯域拡張情報伝送部129に伝達され、これも帯域拡張情報として含まれる。
ハーモニック成分情報取得部128は、コピーバンドのハーモニック成分を分析し、ハーモニック成分情報を生成する。このハーモニック成分情報も、帯域拡張情報伝送部129に伝達され、同様に、帯域拡張情報として加えられる。
帯域拡張情報伝送部129は、開始バンド情報、ゲイン情報、ハーモニック成分情報を有する帯域拡張情報を出力し、この帯域拡張情報は、図1を参照に説明したマルチプレクサに入力される。
上記のような方法で狭帯域ダウンミックス及び帯域拡張情報が生成されるが、以下では、デコーダで帯域拡張情報及び狭帯域ダウンミックスを用いて広帯域ダウンミックスを生成する過程について説明する。
図5は、本発明の実施例に係るオーディオ信号デコーディング装置の構成を示す図で、図6は、図5の帯域拡張デコーディング部の細部構成を示す図である。
まず、図5を参照すれば、本発明の実施例に係るオーディオ信号デコーディング装置200は、デマルチプレクサ210、オーディオ信号デコーディング部220、音声信号デコーディング部230、部分帯域デコーディング部240及びマルチチャネルデコーディング部250を含む。
デマルチプレクサ210は、ビットストリームから狭帯域ダウンミックス(DMX)、帯域拡張情報及び空間情報を抽出する。オーディオ信号デコーディング部220は、狭帯域ダウンミックス信号が大きいオーディオ特性を有する場合、オーディオコーディング方式で狭帯域ダウンミックス信号をデコーディングする。ここで、オーディオ信号は、上述したように、AAC標準、HE―AAC標準に従うことができる。音声信号デコーディング部230は、狭帯域ダウンミックス信号が大きい音声特性を有する場合、音声コーディング方式で狭帯域ダウンミックス信号をデコーディングする。
部分帯域デコーディング部240は、狭帯域ダウンミックスに帯域拡張情報を適用して広帯域信号を生成する。これについては、図6を参照して具体的に説明する。
マルチチャネルデコーディング部250は、広帯域ダウンミックス及び空間情報を用いて出力信号を生成する。
図6を参照すれば、部分帯域デコーディング部240は、帯域拡張情報受信部242、コピーバンド決定部244及びターゲットバンド情報生成部246を含み、信号復元部248をさらに含むことができる。
帯域拡張情報受信部242は、帯域拡張情報から開始バンド情報、ゲイン情報、ハーモニック成分情報を抽出し、これらをコピーバンド決定部224及びターゲットバンド情報生成部246に伝達する。
コピーバンド決定部244は、狭帯域ダウンミックス(DMX)及び開始バンド情報を用いてコピーバンドを決定する。ここで、狭帯域ダウンミックス(DMX)が狭帯域のスペクトルデータでない場合、スペクトルデータに変形する。更に、前記コピーバンドは、開始バンドと同一又は異なるものとできる。前記コピーバンドが開始バンドと異なる場合、開始バンド情報に該当するバンドからスペクトルデータを有するバンドまでがコピーバンドとして決定される。そして、決定されたコピーバンドに該当するスペクトルデータをターゲットバンド情報生成部246に伝達する。
ターゲットバンド情報生成部246は、コピーバンドのスペクトルデータ及びゲイン情報などを用いてターゲットバンドのスペクトルデータを生成する。以下の等式により、ターゲットバンドのデータを生成することができる。
Figure 2011507050
ここで、gは現在バンドのゲインで、sd(taget_band)はターゲットバンドのスペクトルデータで、sd(copy_band)はコピーバンドのスペクトルデータである。
図4(A)に表示された前記実施例の場合、ターゲットバンドの左側コピーバンドのスペクトルデータにゲイン(g、gn−4、gn−2など)を適用することができる。図4の(B)の場合、最初のターゲットバンド(tb)に対しては、コピーバンドのスペクトルデータにゲイン(g、gn−3)を適用し、2番目のターゲットバンド(tb’)に対しては、コピーバンドのスペクトルデータに他のゲイン(g s+1、gn−3 n−2)を適用することができる。図4の(C)の場合も、狭帯域のうち一部の領域であるコピーバンドのスペクトルデータ(sd)にゲイン(g)を適用した後、狭帯域全体に対して他のゲイン(g2nd)を適用して2次ターゲットバンド(tb)のスペクトルデータを生成する。
一方、ターゲットバンドのスペクトルデータの個数(N)及びコピーバンドのスペクトルデータの個数(N)が異なる場合について説明する。図7は、ターゲットバンドのスペクトルデータの個数(N)がコピーバンドのスペクトルデータの個数(N)より大きい場合を説明するための図で、図8は、ターゲットバンドのスペクトルデータの個数(N)がコピーバンドのスペクトルデータの個数(N)より小さい場合を説明するための図である。
まず、図7の(A)を説明すれば、ターゲットバンド(sfb)のスペクトルデータの個数(N)が36で、コピーバンド(sfb)のスペクトルデータの個数(N)が24であることが分かる。データの個数が大きいほど、バンドの水平長さは長く表示されている。ターゲットバンドのデータの個数がより大きいので、コピーバンドのデータを2回以上用いることができる。例えば、図7の(B1)に示すように、まず、コピーバンドの24個のデータをターゲットバンドの低周波から充填し、図7の(B2)に示すように、コピーバンドの前部分12個又は後部分12個をターゲットバンドの残り部分に充填することができる。もちろん、ここでも、伝送されたゲイン情報を適用することができる。
一方、図8の(A)を参照すれば、ターゲットバンド(sfb)のスペクトルデータの個数(N)が24で、コピーバンド(sfb)のスペクトルデータの個数(N)が36であることが分かる。ターゲットバンドのデータの個数がより小さいので、コピーバンドのデータのうち一部のみを用いることができる。例えば、図8の(B)に表示されたように、コピーバンド(sfb)の前部分のスペクトルデータ24個のみを用いたり、図8の(C)に表示されたように、コピーバンド(sfb)の後部分のスペクトルデータ24個のみを用いることによって、ターゲットバンド(sfb)のスペクトルデータを生成することができる。
再び図6を参照すれば、ターゲットバンド情報生成部246は、上記した多様な方式でゲインを適用してターゲットバンドのスペクトルデータを生成する。一方、ターゲットバンド情報生成部246は、ターゲットバンドのスペクトルデータを生成するにおいて、ハーモニック成分情報をさらに用いることができる。具体的に、エンコーダによって伝送されたハーモニック成分情報を用いて、ターゲットバンドの個数又は広さに対応するサブハーモニック信号をフェーズ合成などの方法で作ることができる。
ターゲットバンド情報生成部246は、時間拡張/圧縮段階とデシメーション段階の組み合わせによりスペクトルデータを生成することができる。ここで、時間拡張/圧縮段階は、時間ドメインの信号を時間方向に拡張する段階を含むことができ、前記拡張段階は、フェーズボコーダ方式を用いることができる。一方、デシメーション段階は、時間拡張された信号を再び元の時間に圧縮する段階を含むことができる。ターゲットバンドスペクトルデータに時間拡張/圧縮段階及びデシメーション段階を適用することができる。
信号復元部248は、ターゲットバンドスペクトルデータ及び狭帯域信号を用いて広帯域信号を生成する。広帯域信号は、広帯域のスペクトルデータであるか、時間ドメインの信号に該当する。
本発明に係るオーディオ信号処理方法は、コンピュータで実行されるためのプログラムに搭載することができ、コンピュータ読み取り可能な記録媒体に格納できる。また、本発明に係るデータ構造を有するマルチメディアデータも、コンピュータ読み取り可能な記録媒体に格納できる。前記コンピュータ読み取り可能な記録媒体は、コンピュータシステムによって読まれるデータが格納されるあらゆる種類の格納装置を含む。コンピュータ読み取り可能な記録媒体の例としては、ROM、RAM、CD―ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ格納装置などがあり、キャリアウェーブ(例えば、インターネットを介した伝送)の形態で具現されることも含む。また、前記エンコーディング方法によって生成されたビットストリームは、コンピュータ読み取り可能な記録媒体に格納され、又は有無線通信網を用いて伝送できる。
本発明は、オーディオ/ビデオ信号をエンコーディング/デコーディングに適用される。
以上のように、本発明は、限定された実施例と図面によって説明されたが、本発明がこれによって限定されることはなく、本発明の属する技術分野で通常の知識を有する者によって本発明の技術思想と下記に記載する特許請求の範囲の均等範囲内で多様な修正及び変形が可能であることは当然である。

Claims (15)

  1. 第1帯域及び第2帯域を含む周波数帯域の該第1帯域に対応するスペクトルデータを受信するステップ、
    前記第1帯域の部分帯域に対応するコピーバンドの周波数情報に基づいて該コピーバンドを決定するステップ、
    前記コピーバンドのスペクトルデータを用いて、前記第2帯域に対応するターゲットバンドのスペクトルデータを生成するステップ、
    を有し、
    前記コピーバンドは、前記第1帯域の上部に存在する、オーディオ信号処理方法。
  2. 前記ターゲットバンドの前記スペクトルデータは、時間拡張/圧縮ステップとデシメーションステップの組み合わせにより生成される、請求項1に記載のオーディオ信号処理方法。
  3. 前記コピーバンドの前記周波数情報は、開始周波数、開始バンド及び該開始バンドを示すインデックス情報の少なくとも1つを有する、請求項1に記載のオーディオ信号処理方法。
  4. 前記ターゲットバンドの前記スペクトルデータは、前記コピーバンドと前記ターゲットバンドのスペクトルデータの間のゲインに該当するゲイン情報及び前記コピーバンドのハーモニック情報の少なくとも1つを用いて生成される、請求項1に記載のオーディオ信号処理方法。
  5. 前記第1帯域の前記スペクトルデータは、オーディオコーディング方式及び音声コーディング方式のどちらか一方によりデコーディングされた信号に基づいて生成される、請求項1に記載のオーディオ信号処理方法。
  6. 第1帯域及び第2帯域を含む周波数帯域の該第1帯域に対応するスペクトルデータを受信し、前記第1帯域の部分帯域に対応するコピーバンドの周波数情報に基づいて該コピーバンドを決定するコピーバンド決定部と、
    前記コピーバンドのスペクトルデータを用いて、前記第2帯域に対応するターゲットバンドのスペクトルデータを生成するターゲットバンド情報生成部と、
    を有し、
    前記コピーバンドは、前記第1帯域の上部に存在する、オーディオ信号処理装置。
  7. 前記ターゲットバンドの前記スペクトルデータは、フィルタリングステップ、時間拡張/圧縮ステップ及びデシメーションステップの組み合わせにより生成される、請求項6に記載のオーディオ信号処理装置。
  8. 前記コピーバンドの前記周波数情報は、開始周波数、開始バンド及び該開始バンドを示すインデックス情報の1つを有する、請求項6に記載のオーディオ信号処理装置。
  9. 前記ターゲットバンドの前記スペクトルデータは、前記コピーバンドと前記ターゲットバンドのスペクトルデータの間のゲインに該当するゲイン情報及び前記コピーバンドのハーモニック情報の少なくとも1つを用いて生成される、請求項6に記載のオーディオ信号処理装置。
  10. 前記第1帯域の前記スペクトルデータは、オーディオコーディング方式及び音声コーディング方式のどちらか一方によりデコーディングされた信号に基づいて生成される、請求項6に記載のオーディオ信号処理装置。
  11. 第1帯域及び第2帯域を含む周波数帯域のスペクトルデータを取得するステップ、
    前記周波数帯域の前記スペクトルデータを用いてコピーバンド及びターゲットバンドを決定するステップ、
    前記コピーバンドの周波数を示すコピーバンドの周波数情報を生成するステップ、
    前記周波数帯域の前記スペクトルデータから前記ターゲットバンドのスペクトルデータを除くことにより前記第1帯域のスペクトルデータを生成するステップ、
    を有する、オーディオ信号処理方法。
  12. 前記コピーバンドと前記ターゲットバンドのスペクトルデータの間のゲインに該当するゲイン情報を生成するステップをさらに有する、請求項11に記載のオーディオ信号処理方法。
  13. 広帯域のスペクトルデータを取得するスペクトルデータ取得部と、
    前記広帯域の前記スペクトルデータを用いてコピーバンド及びターゲットバンドを決定し、前記コピーバンドの開始周波数情報又は前記コピーバンドの開始バンドインデックス情報に対応する開始バンド情報を出力し、前記広帯域の前記スペクトルデータから前記ターゲットバンドの前記スペクトルデータを除くことにより狭帯域のスペクトルデータを出力するコピーバンド決定部と、
    を有する、オーディオ信号処理装置。
  14. 前記コピーバンドと前記ターゲットバンドのスペクトルデータの間のゲインに該当するゲイン情報を生成するゲイン情報取得部をさらに有する、請求項13に記載のオーディオ信号処理装置。
  15. 周波数帯域の第1帯域に対応するスペクトルデータ及び帯域拡張情報を有するデジタルオーディオデータを格納するコンピュータ読み取り可能な記録媒体において、
    前記周波数帯域は、前記第1帯域、及び第2帯域を有し、
    前記第2帯域のターゲットバンドを生成するためのコピーバンドは、前記第1帯域の上部に含まれ、
    前記帯域拡張情報は、前記コピーバンドの周波数情報、ゲイン情報及び前記コピーバンドのハーモニック情報の少なくとも1つを有する、コンピュータ読み取り可能な記録媒体。
JP2010539300A 2007-12-18 2008-12-18 オーディオ信号処理方法及び装置 Active JP5400059B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US1444107P 2007-12-18 2007-12-18
US61/014,441 2007-12-18
US11864708P 2008-11-30 2008-11-30
US61/118,647 2008-11-30
PCT/KR2008/007522 WO2009078681A1 (en) 2007-12-18 2008-12-18 A method and an apparatus for processing an audio signal

Publications (2)

Publication Number Publication Date
JP2011507050A true JP2011507050A (ja) 2011-03-03
JP5400059B2 JP5400059B2 (ja) 2014-01-29

Family

ID=40795707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010539300A Active JP5400059B2 (ja) 2007-12-18 2008-12-18 オーディオ信号処理方法及び装置

Country Status (9)

Country Link
US (1) US9275648B2 (ja)
EP (1) EP2229677B1 (ja)
JP (1) JP5400059B2 (ja)
KR (1) KR20100086000A (ja)
CN (1) CN101903944B (ja)
AU (1) AU2008339211B2 (ja)
CA (1) CA2708861C (ja)
RU (1) RU2439720C1 (ja)
WO (1) WO2009078681A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018511825A (ja) * 2015-03-09 2018-04-26 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101896968A (zh) * 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法
RU2483368C2 (ru) * 2007-11-06 2013-05-27 Нокиа Корпорейшн Кодер
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
KR101405976B1 (ko) * 2010-01-06 2014-06-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
ES2935637T3 (es) 2010-03-09 2023-03-08 Fraunhofer Ges Forschung Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada
JP5854520B2 (ja) 2010-03-09 2016-02-09 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ信号用の位相ボコーダに基づく帯域幅拡張方法における改善された振幅応答及び時間的整列のための装置及び方法
WO2011110496A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
BR112012024360B1 (pt) * 2010-07-19 2020-11-03 Dolby International Ab sistema configurado para gerar uma pluralidade de sinais de áudio de sub-banda de alta frequência, decodificador de áudio, codificador, método para gerar uma pluralidade de sinais de sub-banda de alta frequência, método para decodificar um fluxo de bits, método para gerar dados de controle a partir de um sinal de áudio e meio de armazenamento
EP2849180B1 (en) * 2012-05-11 2020-01-01 Panasonic Corporation Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal
US9674052B2 (en) 2012-09-20 2017-06-06 Hewlett Packard Enterprise Development Lp Data packet stream fingerprint
CN103971693B (zh) * 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
CN114566183A (zh) * 2013-04-05 2022-05-31 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
US9521501B2 (en) 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
KR101782278B1 (ko) * 2013-10-18 2017-10-23 텔레폰악티에볼라겟엘엠에릭슨(펍) 스펙트럼의 피크 위치의 코딩 및 디코딩
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CA2987808C (en) 2016-01-22 2020-03-10 Guillaume Fuchs Apparatus and method for encoding or decoding an audio multi-channel signal using spectral-domain resampling
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
KR20180056032A (ko) 2016-11-18 2018-05-28 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
CN111383646B (zh) * 2018-12-28 2020-12-08 广州市百果园信息技术有限公司 一种语音信号变换方法、装置、设备和存储介质
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263098A (ja) * 1995-03-28 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、音響信号復号化方法
JPH11175098A (ja) * 1997-12-12 1999-07-02 Nec Corp 音声及び音楽符号化方式
JP2000075899A (ja) * 1998-08-28 2000-03-14 Roland Corp 波形信号の合成装置および時間軸圧縮伸長装置
JP2001521648A (ja) * 1997-06-10 2001-11-06 コーディング テクノロジーズ スウェーデン アクチボラゲット スペクトル帯域複製を用いた原始コーディングの強化
JP2002041089A (ja) * 2000-07-21 2002-02-08 Kenwood Corp 周波数補間装置、周波数補間方法及び記録媒体
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2004053940A (ja) * 2002-07-19 2004-02-19 Matsushita Electric Ind Co Ltd オーディオ復号化装置およびオーディオ復号化方法
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
JP2004198485A (ja) * 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR9405445A (pt) 1993-06-30 1999-09-08 Sony Corp Aparelho codificador e decodificador de sinal apropriado para codificar um sinal de entrada e decodificar um sinal codificado, suporte de gravação onde sinais codificados são gravados, e processo de codificação e de decodificação de sinal para codificar um sinal de entrada e decodificar um sinal codificado.
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4431568B2 (ja) * 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
KR101169596B1 (ko) 2003-04-17 2012-07-30 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 합성
EP1621047B1 (en) * 2003-04-17 2007-04-11 Koninklijke Philips Electronics N.V. Audio signal generation
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
KR101106026B1 (ko) 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
JP4794448B2 (ja) * 2004-08-27 2011-10-19 パナソニック株式会社 オーディオエンコーダ
DE602005023503D1 (de) * 2004-10-28 2010-10-21 Panasonic Corp Skalierbare codierungsvorrichtung, skalierbare decodierungsvorrichtung und verfahren dafür
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
JP2007110565A (ja) 2005-10-14 2007-04-26 Matsushita Electric Ind Co Ltd マルチチャンネル音響復号化装置及び方法
EP1943643B1 (en) * 2005-11-04 2019-10-09 Nokia Technologies Oy Audio compression
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US20080300866A1 (en) * 2006-05-31 2008-12-04 Motorola, Inc. Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263098A (ja) * 1995-03-28 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、音響信号復号化方法
JP2001521648A (ja) * 1997-06-10 2001-11-06 コーディング テクノロジーズ スウェーデン アクチボラゲット スペクトル帯域複製を用いた原始コーディングの強化
JPH11175098A (ja) * 1997-12-12 1999-07-02 Nec Corp 音声及び音楽符号化方式
JP2000075899A (ja) * 1998-08-28 2000-03-14 Roland Corp 波形信号の合成装置および時間軸圧縮伸長装置
JP2002041089A (ja) * 2000-07-21 2002-02-08 Kenwood Corp 周波数補間装置、周波数補間方法及び記録媒体
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
JP2004053940A (ja) * 2002-07-19 2004-02-19 Matsushita Electric Ind Co Ltd オーディオ復号化装置およびオーディオ復号化方法
JP2004198485A (ja) * 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018511825A (ja) * 2015-03-09 2018-04-26 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
US10388287B2 (en) 2015-03-09 2019-08-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US10395661B2 (en) 2015-03-09 2019-08-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
JP2020074013A (ja) * 2015-03-09 2020-05-14 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
US10777208B2 (en) 2015-03-09 2020-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11107483B2 (en) 2015-03-09 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11238874B2 (en) 2015-03-09 2022-02-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
JP7181671B2 (ja) 2015-03-09 2022-12-01 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
US11741973B2 (en) 2015-03-09 2023-08-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11881225B2 (en) 2015-03-09 2024-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal

Also Published As

Publication number Publication date
JP5400059B2 (ja) 2014-01-29
CN101903944A (zh) 2010-12-01
US20100292994A1 (en) 2010-11-18
RU2439720C1 (ru) 2012-01-10
AU2008339211B2 (en) 2011-06-23
AU2008339211A1 (en) 2009-06-25
KR20100086000A (ko) 2010-07-29
CA2708861C (en) 2016-06-21
CA2708861A1 (en) 2009-06-25
CN101903944B (zh) 2013-04-03
WO2009078681A1 (en) 2009-06-25
US9275648B2 (en) 2016-03-01
EP2229677B1 (en) 2015-09-16
EP2229677A4 (en) 2010-12-08
EP2229677A1 (en) 2010-09-22

Similar Documents

Publication Publication Date Title
JP5400059B2 (ja) オーディオ信号処理方法及び装置
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
JP5485909B2 (ja) オーディオ信号処理方法及び装置
JP6262668B2 (ja) 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法
RU2449387C2 (ru) Способ и устройство для обработки сигнала
RU2667382C2 (ru) Улучшение классификации между кодированием во временной области и кодированием в частотной области
JP5975243B2 (ja) 符号化装置および方法、並びにプログラム
JP5283046B2 (ja) ピーク検出に基づく選択的スケーリングマスク計算
JP5285162B2 (ja) ピーク検出に基づいた選択型スケーリングマスク演算
KR101397058B1 (ko) 신호 처리 방법 및 이의 장치
JP6126006B2 (ja) 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法
JP6000854B2 (ja) 音声符号化装置および方法、並びに、音声復号装置および方法
JP2011527448A (ja) 帯域幅拡張出力データを生成するための装置および方法
US20090192789A1 (en) Method and apparatus for encoding/decoding audio signals
US20100250260A1 (en) Encoder
US20130226598A1 (en) Audio encoder or decoder apparatus
JP2011501216A (ja) 信号処理方法及び装置
JP2004519741A (ja) 音声の符号化
JP6042900B2 (ja) 音声信号の帯域選択的量子化方法及び装置
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131024

R150 Certificate of patent or registration of utility model

Ref document number: 5400059

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250