JP2010522348A - オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置 - Google Patents

オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置 Download PDF

Info

Publication number
JP2010522348A
JP2010522348A JP2009554434A JP2009554434A JP2010522348A JP 2010522348 A JP2010522348 A JP 2010522348A JP 2009554434 A JP2009554434 A JP 2009554434A JP 2009554434 A JP2009554434 A JP 2009554434A JP 2010522348 A JP2010522348 A JP 2010522348A
Authority
JP
Japan
Prior art keywords
audio
coding scheme
coding
band
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009554434A
Other languages
English (en)
Other versions
JP5118158B2 (ja
Inventor
リー,ナム−スク
リー,ゴン−ヒョン
オ,ジェ−ウォン
リー,チョル−ウー
ジョン,ジョン−フン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2010522348A publication Critical patent/JP2010522348A/ja
Application granted granted Critical
Publication of JP5118158B2 publication Critical patent/JP5118158B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

オーディオバンドごとに時間−周波数方式とパラメトリック方式とを混合して使用するオーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置が開示される。該エンコーディング方法は、入力オーディオ信号を複数のオーディオバンドに分ける段階、それぞれのオーディオバンドごとにコーディング方式を選択して選択されたコーディング方式によってエンコーディングする段階、及びオーディオバンドごとにエンコーディングされたデータをいずれも含むビットストリームを生成する段階を含み、それぞれのオーディオバンドごとにコーディング方式を選択する段階は、パラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものを選択する。

Description

本発明は、オーディオ信号のエンコーディング及びデコーディングに係り、特に、オーディオ信号を複数のバンドに分け、それぞれのバンドごとに効率的なコーディング方式を適用するオーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置に関する。
オーディオ信号をエンコーディングする方式には、パラメトリック(parametric)コーディング方式と、時間−周波数(time-frequency)コーディング方式とがある。ところで、パラメトリックコーディング方式は、データのビットレートが低いとき、すなわち、ロービットレート(low bit rate)であるときは、エンコーディング効率が高いが、ビットレートが高まるほど、エンコーディング効率が低くなる問題点がある。また、時間−周波数コーディング方式は、オーディオ信号の音質が高音質であるとき、すなわち、ビットレートが高いときは、パラメトリックコーディング方式に比べて効率的であるが、ビットレートが低いときは、あらゆる周波数インデックスに係わる情報を伝送せねばならないので、非効率的である。
従って、パラメトリックコーディング方式、または時間−周波数コーディング方式だけを適用する従来の方式を補完し、エンコーディング効率を向上させることが要求される。
本発明がなそうとする技術的課題は、オーディオ信号を複数のバンドに分け、それぞれのバンドごとに効率的なコーディング方式を適用するオーディオ信号のエンコーディング方法及び装置、そして前記エンコーディング方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することである。
本発明がなそうとする技術的課題はまた、前記エンコーディング方法によって生成されたビットストリームをオーディオバンドごとにデコーディングするオーディオ信号のデコーディング方法及び装置、そして前記デコーディング方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することである。
前記技術的課題をなすためのオーディオ信号のエンコーディング方法は、入力オーディオ信号を複数のオーディオバンドに分ける段階と、それぞれのオーディオバンドごとにコーディング方式を選択する段階と、前記それぞれのオーディオバンドをそれぞれのバンドごとに選択されたコーディング方式によってエンコーディングする段階と、前記オーディオバンドごとにエンコーディングされたデータをいずれも含むビットストリームを生成する段階とを含み、前記それぞれのオーディオバンドごとにコーディング方式を選択する段階は、パラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいことを選択する段階を含むことが望ましい。
前記それぞれのオーディオバンドごとにコーディング方式を選択する段階は、コーディング方式を選択しようとする当該オーディオバンドに含まれた正弦波信号の数を求める段階と、前記正弦波信号の数が所定値以上である場合、時間−周波数コーディング方式を選択する段階と、前記正弦波信号の数が所定値より小さい場合、パラメトリックコーディング方式を選択する段階とを含むことが望ましい。
前記技術的課題をなすためのオーディオ信号のエンコーディング装置は、入力オーディオ信号を複数のオーディオバンドに分けるバンド分割部と、それぞれのオーディオバンドごとにコーディング方式を選択するコーディング方式選択部と、前記それぞれのオーディオバンドをそれぞれのバンドごとに選択されたコーディング方式によってエンコーディングするオーディオエンコーディング部と、前記オーディオバンドごとにエンコーディングされたデータをいずれも含むビットストリームを生成するビットストリーム生成部とを含み、前記コーディング方式選択部は、パラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものを選択することが望ましい。
前記コーディング方式選択部は、コーディング方式を選択しようとする当該オーディオバンドに含まれた正弦波信号の数が所定値以上である場合、時間−周波数コーディング方式を選択し、前記正弦波信号の数が所定値より小さい場合、パラメトリックコーディング方式を選択することが望ましい。
前記エンコーディング方法及び装置において、前記パラメトリックコーディング方式は、正弦波コーディング(SSC:sinusoidal coding方式であり、前記時間−周波数コーディング方式は、AAC(advanced audio coding)方式であることが望ましい。
前記技術的課題をなすために、本発明の他の一実施例によるオーディオ信号のエンコーディング方法は、入力オーディオ信号を複数のオーディオバンドに分ける段階と、それぞれのオーディオバンドに含まれたオーディオデータをパラメトリックコーディング方式及び時間−周波数コーディング方式をそれぞれ適用してエンコーディングする段階と、前記それぞれのオーディオバンドごとに前記二種の方式でエンコーディングされたデータのうち、サイズが小さいものを選択する段階と、前記オーディオバンドごとに選択されたエンコーディングされたデータをいずれも含むビットストリームを生成する段階とを含むことが望ましい。
前記他の技術的課題をなすためのオーディオ信号のデコーディング方法は、入力されたビットストリームから複数のオーディオバンドごとにエンコーディングされたオーディオデータを分離する段階と、前記複数のオーディオバンドそれぞれに対して、エンコーディング装置でオーディオデータをエンコーディングしたコーディング方式に係わる情報を抽出する段階と、前記抽出された情報によるコーディング方式に従い、それぞれのオーディオバンドごとにエンコーディングされたオーディオデータをデコーディングする段階と、前記オーディオバンドごとにデコーディングされたオーディオデータを結合し、オーディオ信号を生成する段階とを含み、前記コーディング方式は、それぞれのオーディオバンドごとにパラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものが選択されたことが望ましい。
前記他の技術的課題をなすためのオーディオ信号のデコーディング装置は、入力されたビットストリームから複数のオーディオバンドごとにエンコーディングされたオーディオデータを分離するビットストリーム分離部と、前記複数のオーディオバンドそれぞれに対して、エンコーディング装置でオーディオデータをエンコーディングしたコーディング方式に係わる情報を抽出するコーディング方式抽出部と、前記抽出された情報によるコーディング方式に従い、それぞれのオーディオバンドごとにエンコーディングされたオーディオデータをデコーディングするオーディオデコーディング部と、前記オーディオバンドごとにデコーディングされたオーディオデータを結合し、オーディオ信号を生成するオーディオ信号生成部とを含み、前記コーディング方式は、それぞれのオーディオバンドごとにパラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものが選択されたことが望ましい。
前記オーディオ信号のデコーディング方法及び装置において、前記コーディング方式は、当該オーディオバンドに含まれた正弦波信号の数が所定値以上である場合、時間−周波数コーディング方式が選択され、前記正弦波信号の数が所定値より小さい場合、パラメトリックコーディング方式が選択されることが望ましい。
前記デコーディング方法及び装置において、前記パラメトリックコーディング方式は、正弦波コーディング(SSC:sinusoidal coding)方式であり、前記時間−周波数コーディング方式は、AAC(advanced audio coding)方式であることが望ましい。
本発明によるオーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置によれば、オーディオ信号を複数のバンドに分け、それぞれのバンドごとにエンコーディングされたデータのサイズがさらに小さくなるコーディング方式を選択してエンコーディングすることによって、全体オーディオデータに対して1つのコーディング方式を適用することと比較し、効率的なエンコーディングが可能である。すなわち、オーディオバンドごとに、時間−周波数方式とパラメトリック方式とを混合して使用する方式が提供される。
本発明の一実施形態によるオーディオ信号エンコーディング装置の構成を示したブロック図である。 本発明の一実施形態によるオーディオ信号エンコーディング方法を示したフローチャートである。 本発明の一実施形態によるオーディオ信号デコーディング装置の構成を示したブロック図である。 本発明の一実施形態によるオーディオ信号デコーディング方法を示したフローチャートである。 正弦波信号の数と、コーディング方式によるエンコーディングされたデータのサイズとの変化を示したグラフである。
以下、添付された図面を参照しつつ、本発明によるオーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置について、詳細に説明する。
図1は、本発明の一実施形態によるオーディオ信号エンコーディング装置の構成を示したブロック図であり、図2は、本発明の一実施形態によるオーディオ信号エンコーディング方法を示したフローチャートである。図1を参照するに、本発明によるオーディオ信号エンコーディング装置100は、バンド分割部110、コーディング方式選択部120、オーディオエンコーディング部130及びビットストリーム生成部140を含むことが望ましい。
バンド分割部110は、入力オーディオ信号1を複数のオーディオバンドBand 0,Band 1,…,Band N−1,Band Nに分ける(S100)。
コーディング方式選択部120は、それぞれのオーディオバンドごとにコーディング方式を選択する(S110)。コーディング方式選択部120は、パラメトリックコーディング方式と、時間−周波数(time-frequency)コーディング方式とのうち、当該バンドに対してより効率的なエンコーディングが可能であるものを選択する。効率的なエンコーディングとは、エンコーディングされたデータのサイズがさらに小さいものを意味する。
コーディング方式を選択する方法の一実施形態は、次の通りである。
まず、コーディング方式を選択しようとする当該オーディオバンドに含まれた正弦波信号の数を求める。求められた正弦波信号の数が所定値以上である場合には、時間−周波数コーディング方式を選択し、求められた正弦波信号の数が所定値より小さい場合には、パラメトリックコーディング方式を選択する。これについては、図5を参照しつつ、さらに詳細に説明する。
オーディオエンコーディング部130は、それぞれのオーディオバンドを、それぞれのオーディオバンドごとに選択されたコーディング方式によってエンコーディングする(S120)。
当該オーディオバンドに対して、パラメトリックコーディング方式が選択された場合、パラメトリックコーディング方式で、当該オーディオバンドに含まれたオーディオ信号をエンコーディングする。パラメトリックコーディング方式の例としては、正弦波コーディング(SSC:sinusoidal coding)方式を挙げることができる。
当該オーディオバンドに対して、時間−周波数コーディング方式が選択された場合、時間−周波数コーディング方式で、当該オーディオバンドに含まれたオーディオ信号をエンコーディングする。時間−周波数コーディング方式は、時間領域のデータを周波数領域の値に変換してコーディングする方式をいう。時間−周波数コーディング方式の例としては、AAC(advanced audio coding)方式を挙げることができる。
ビットストリーム生成部140は、オーディオバンドごとにエンコーディングされたデータをいずれも含むビットストリーム2を生成する(S130)。
図3は、本発明の一実施形態によるオーディオ信号デコーディング装置の構成を示したブロック図であり、図4は、本発明の一実施形態によるオーディオ信号デコーディング方法を示したフローチャートである。
図3を参照するに、本発明によるオーディオ信号デコーディング装置200は、ビットストリーム分離部210、コーディング方式抽出部220、オーディオデコーディング部230及びオーディオ信号生成部240を含むことが望ましい。
ビットストリーム分離部210は、入力されたビットストリーム11から、複数のオーディオバンドごとにエンコーディングされたオーディオデータを分離する(S200)。
コーディング方式抽出部220は、前記オーディオバンドそれぞれについて、コーディング方式に係わる情報を抽出する(S210)。コーディング方式とは、エンコーディング装置側で、当該オーディオバンドのオーディオデータをエンコーディングした方式を意味する。前述の通り、エンコーディング装置は、それぞれのオーディオバンドごとにパラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さい方をコーディング方式として選択する。言及した通り、一実施形態において、エンコーディング装置は、コーディング方式を選択しようとする当該オーディオバンドに含まれた正弦波信号の数を求め、この求めた正弦波信号の数が所定値以上である場合には、時間−周波数コーディング方式を選択し、求めた正弦波信号の数が所定値より小さい場合には、パラメトリックコーディング方式を選択する。
オーディオデコーディング部230は、それぞれのオーディオバンドに対して抽出された情報によるコーディング方式によってエンコーディングされたオーディオデータをデコーディングする(S220)。
当該オーディオバンドについて、コーディング方式に係わる情報がパラメトリックコーディング方式であることを示す場合、当該オーディオバンドに対してエンコーディングされたオーディオデータをパラメトリックコーディング方式でデコーディングする。パラメトリックコーディング方式の例としては、正弦波コーディング(SSC)方式を挙げることができる。
当該オーディオバンドについて、コーディング方式に係わる情報が時間−周波数コーディング方式であることを示す場合、当該オーディオバンドに対してエンコーディングされたオーディオデータを時間−周波数コーディング方式でデコーディングする。時間−周波数コーディング方式の例としては、AAC方式を挙げることができる。
オーディオ信号生成部240は、オーディオバンドごとにデコーディングされたオーディオデータを結合し、出力オーディオ信号12を生成する(S230)。
以下では、図5を参照しつつ、正弦波信号の数によるコーディング方式の選択について詳細に述べる。図5は、正弦波信号の数と、コーディング方式によるエンコーディングされたデータのサイズとの変化を示した図である。
時間−周波数コーディング方式においては、基本周波数を設定し、その周波数の倍数になるあらゆる周波数に対して振幅と位相値とを抽出してエンコーディングする。従って、オーディオ信号に含まれた正弦波信号の数に関係なく、同数の周波数に係わる情報がエンコーディングされるので、エンコーディングされたデータのサイズは同一である。これは、図5で、水平軸に平行した直線30として示される。
一方、パラメトリックコーディング方式においては、それぞれの正弦波信号に対して、周波数、振幅及び位相値に係わる情報をエンコーディングする。従って、正弦波信号の数が増加することによって、エンコーディングされたデータのサイズは増大する。これは、図5で、右上がりの直線32として示される。
従って、正弦波信号の数が所定値Nより大きい場合(B区間)は、時間−周波数コーディング方式がより効率的であり、正弦波信号の数がNより小さい場合(A区間)は、パラメトリックコーディング方式がより効率的である。
前記所定値Nを選択する方法には、さまざまなものがありえる。
前記所定値Nは、パラメトリックコーディング方式を適用した場合のエンコーディングされたデータのサイズと、時間−周波数コーディング方式を適用した場合のエンコーディングされたデータのサイズとが同じになる正弦波信号の数である。従って、時間−周波数コーディング方式で使われる周波数の数(これを、周波数インデックスの数という)を前記所定値Nとして選択することが可能である。時間−周波数コーディング方式では、周波数に係わる情報をエンコーディングしないので、前記所定値Nは、前記周波数インデックスの数よりも若干小さい値になるであろう。
他の例としては、あらかじめ所定値Nを設定しておくのではなく、実際に当該オーディオバンドに対して、パラメトリックコーディング方式と時間−周波数方式とをそれぞれ適用してエンコーディングしたデータのサイズを比較し、そのサイズが小さいものを選択する方式を考えることができる。
本発明は、コンピュータで読み取り可能な記録媒体に、コンピュータ(情報処理機能を持つ装置をいずれも含む)で読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録装置の例としては、ROM(read-only memory)、RAM(random-access memory)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。
たとえ前記説明が多様な実施形態に適用される本発明の新規特徴に焦点を合わせて説明したとしても、本技術分野に熟達した当業者は、本発明の範囲を外れずに、前記説明された装置及び方法の形態及び細部事項で、多様な削除、代替、及び変更が可能であるということを理解するであろう。従って、本発明の範囲は、前記説明においてよりは、特許請求の範囲によって定義になる。特許請求の範囲の均等範囲内のあらゆる変形は本発明の範囲に含まれる。

Claims (20)

  1. 入力オーディオ信号を複数のオーディオバンドに分ける段階と、
    それぞれのオーディオバンドごとにコーディング方式を選択する段階と、
    前記それぞれのオーディオバンド内に含まれたオーディオデータをそれぞれのバンドごとに選択されたコーディング方式によってエンコーディングする段階と、
    前記それぞれのオーディオバンド内に含まれたエンコーディングされた前記オーディオデータをいずれも含むビットストリームを生成する段階とを含み、
    前記それぞれのオーディオバンドごとにコーディング方式を選択する段階は、パラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものを選択する段階を含むことを特徴とするオーディオ信号のエンコーディング方法。
  2. 前記パラメトリックコーディング方式は、正弦波コーディング(SSC)方式であることを特徴とする請求項1に記載のオーディオ信号のエンコーディング方法。
  3. 前記時間−周波数コーディング方式は、AAC(advanced audio coding)方式であることを特徴とする請求項1に記載のオーディオ信号のエンコーディング方法。
  4. 前記それぞれのオーディオバンドごとにコーディング方式を選択する段階は、
    前記複数のオーディオバンドのうち、当該オーディオバンドに含まれた正弦波信号の数を求める段階と、
    前記正弦波信号の数が所定値以上である場合、時間−周波数コーディング方式を選択する段階と、
    前記正弦波信号の数が所定値より小さい場合、パラメトリックコーディング方式を選択する段階とを含むことを特徴とする請求項1に記載のオーディオ信号のエンコーディング方法。
  5. 入力オーディオ信号を複数のオーディオバンドに分ける段階と、
    それぞれのオーディオバンドに含まれたオーディオデータをパラメトリックコーディング方式及び時間−周波数コーディング方式をそれぞれ適用してエンコーディングする段階と、
    前記それぞれのオーディオバンドごとに、前記二種の方式でエンコーディングされた前記オーディオデータのうち、サイズが小さいものを選択する段階と、
    前記オーディオバンドごとに選択されたエンコーディングされた前記オーディオデータをいずれも含むビットストリームを生成する段階とを含むことを特徴とするオーディオ信号のエンコーディング方法。
  6. 入力オーディオ信号を複数のオーディオバンドに分けるバンド分割部と、
    それぞれのオーディオバンドごとにコーディング方式を選択するコーディング方式選択部と、
    前記それぞれのオーディオバンド内に含まれたオーディオデータを、それぞれのバンドごとに選択されたコーディング方式によってエンコーディングするオーディオエンコーディング部と、
    前記オーディオバンドごとにエンコーディングされた前記オーディオデータをいずれも含むビットストリームを生成するビットストリーム生成部とを含み、
    前記コーディング方式選択部は、パラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものを選択することを特徴とするオーディオ信号のエンコーディング装置。
  7. 前記パラメトリックコーディング方式は、正弦波コーディング(SSC)方式であることを特徴とする請求項6に記載のオーディオ信号のエンコーディング装置。
  8. 前記時間−周波数コーディング方式は、AAC(advanced audio coding)方式であることを特徴とする請求項6に記載のオーディオ信号のエンコーディング装置。
  9. 前記コーディング方式選択部は、
    前記複数のオーディオバンドのうち、当該オーディオバンドに含まれた正弦波信号の数が所定値以上である場合、時間−周波数コーディング方式を選択し、前記正弦波信号の数が所定値より小さい場合、パラメトリックコーディング方式を選択することを特徴とする請求項6に記載のオーディオ信号のエンコーディング装置。
  10. 入力されたビットストリームから複数のオーディオバンドごとにエンコーディングされたオーディオデータを分離する段階と、
    前記複数のオーディオバンドそれぞれに対して、エンコーディング装置でオーディオデータをエンコーディングしたコーディング方式に係わる情報を抽出する段階と、
    前記抽出された情報によるコーディング方式に従い、それぞれのオーディオバンドごとにエンコーディングされた前記オーディオデータをデコーディングする段階と、
    前記オーディオバンドごとにデコーディングされた前記オーディオデータを結合し、オーディオ信号を生成する段階とを含み、
    前記コーディング方式は、それぞれのオーディオバンドごとにパラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものが選択されたことを特徴とするオーディオ信号のデコーディング方法。
  11. 前記パラメトリックコーディング方式は、正弦波コーディング(SSC)方式であることを特徴とする請求項10に記載のオーディオ信号のデコーディング方法。
  12. 前記時間−周波数コーディング方式は、AAC(advanced audio coding)方式であることを特徴とする請求項10に記載のオーディオ信号のデコーディング方法。
  13. 前記コーディング方式は、
    当該オーディオバンドに含まれた正弦波信号の数が所定値以上である場合、時間−周波数コーディング方式が選択され、前記正弦波信号の数が所定値より小さい場合、パラメトリックコーディング方式が選択されることを特徴とする請求項10に記載のオーディオ信号のデコーディング方法。
  14. 入力されたビットストリームから複数のオーディオバンドごとにエンコーディングされたオーディオデータを分離するビットストリーム分離部と、
    前記複数のオーディオバンドそれぞれに対して、エンコーディング装置でオーディオデータをエンコーディングしたコーディング方式に係わる情報を抽出するコーディング方式抽出部と、
    前記抽出された情報によるコーディング方式に従い、それぞれのオーディオバンドごとにエンコーディングされた前記オーディオデータをデコーディングするオーディオデコーディング部と、
    前記オーディオバンドごとにデコーディングされた前記オーディオデータを結合し、オーディオ信号を生成するオーディオ信号生成部とを含み、
    前記コーディング方式は、それぞれのオーディオバンドごとにパラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものが選択されたことを特徴とするオーディオ信号のデコーディング装置。
  15. 前記パラメトリックコーディング方式は、正弦波コーディング(SSC)方式であることを特徴とする請求項14に記載のオーディオ信号のデコーディング装置。
  16. 前記時間−周波数コーディング方式は、AAC(advanced audio coding)方式であることを特徴とする請求項14に記載のオーディオ信号のデコーディング装置。
  17. 前記コーディング方式は、
    当該オーディオバンドに含まれた正弦波信号の数が所定値以上である場合、時間−周波数コーディング方式が選択され、前記正弦波信号の数が所定値より小さい場合、パラメトリックコーディング方式が選択されることを特徴とする請求項14に記載のオーディオ信号のデコーディング装置。
  18. オーディオ信号のエンコーディング方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体において、
    前記エンコーディング方法は、
    入力オーディオ信号を複数のオーディオバンドに分ける段階と、
    それぞれのオーディオバンドごとにコーディング方式を選択する段階と、
    前記それぞれのオーディオバンド内に含まれたオーディオデータをそれぞれのバンドごとに選択されたコーディング方式によってエンコーディングする段階と、
    前記それぞれのオーディオバンド内に含まれたエンコーディングされた前記オーディオデータをいずれも含むビットストリームを生成する段階とを含み、
    前記それぞれのオーディオバンドごとにコーディング方式を選択する段階は、パラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものを選択する段階を含むことを特徴とする記録媒体。
  19. オーディオ信号のエンコーディング方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体において、
    入力オーディオ信号を複数のオーディオバンドに分ける段階と、
    それぞれのオーディオバンドに含まれたオーディオデータを、パラメトリックコーディング方式及び時間−周波数コーディング方式をそれぞれ適用してエンコーディングする段階と、
    前記それぞれのオーディオバンドごとに前記二種の方式でエンコーディングされた前記オーディオデータのうち、サイズが小さいものを選択する段階と、
    前記オーディオバンドごとに選択されたエンコーディングされた前記オーディオデータをいずれも含むビットストリームを生成する段階とをことを特徴とする記録媒体。
  20. オーディオ信号のデコーディング方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体において、
    前記デコーディング方法は、
    入力されたビットストリームから複数のオーディオバンドごとにエンコーディングされたオーディオデータを分離する段階と、
    前記複数のオーディオバンドそれぞれに対して、エンコーディング装置でオーディオデータをエンコーディングしたコーディング方式に係わる情報を抽出する段階と、
    前記抽出された情報によるコーディング方式に従い、それぞれのオーディオバンドごとにエンコーディングされた前記オーディオデータをデコーディングする段階と、
    前記オーディオバンドごとにデコーディングされた前記オーディオデータを結合し、オーディオ信号を生成する段階とを含み、
    前記コーディング方式は、それぞれのオーディオバンドごとにパラメトリックコーディング方式及び時間−周波数コーディング方式のうち、エンコーディングされたデータのサイズがさらに小さいものが選択されたことを特徴とする記録媒体。
JP2009554434A 2007-03-20 2008-01-14 オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置 Expired - Fee Related JP5118158B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2007-0027271 2007-03-20
KR1020070027271A KR101149449B1 (ko) 2007-03-20 2007-03-20 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
PCT/KR2008/000207 WO2008114925A1 (en) 2007-03-20 2008-01-14 Method and apparatus for encoding audio signal, and method and apparatus for decoding audio signal

Publications (2)

Publication Number Publication Date
JP2010522348A true JP2010522348A (ja) 2010-07-01
JP5118158B2 JP5118158B2 (ja) 2013-01-16

Family

ID=39766016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009554434A Expired - Fee Related JP5118158B2 (ja) 2007-03-20 2008-01-14 オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置

Country Status (6)

Country Link
US (1) US8019616B2 (ja)
EP (1) EP2122614A4 (ja)
JP (1) JP5118158B2 (ja)
KR (1) KR101149449B1 (ja)
CN (1) CN101641733B (ja)
WO (1) WO2008114925A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017523455A (ja) * 2014-06-24 2017-08-17 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ符号化方法および装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9219956B2 (en) 2008-12-23 2015-12-22 Keyssa, Inc. Contactless audio adapter, and methods
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
UY33236A (es) 2010-02-25 2011-09-30 Novartis Ag Inhibidores dimericos de las iap
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
US9602648B2 (en) 2015-04-30 2017-03-21 Keyssa Systems, Inc. Adapter devices for enhancing the functionality of other devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02123400A (ja) * 1988-11-02 1990-05-10 Nec Corp 高能率音声符号化器
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
JP2002091497A (ja) * 2000-09-18 2002-03-27 Nippon Telegr & Teleph Corp <Ntt> オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
JP2002244698A (ja) * 2000-12-14 2002-08-30 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
JP2008518264A (ja) * 2004-11-01 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 振幅の包絡線を有するパラメトリックオーディオコーディング

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100346734B1 (ko) 1995-09-22 2002-11-23 삼성전자 주식회사 고속분석필터및합성필터를구비한오디오부호화기및복호화기
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US5745250A (en) 1997-03-07 1998-04-28 Xerox Corporation Method of producing tint dots with pairs of holladay halftones
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JP3352401B2 (ja) 1998-08-18 2002-12-03 松下電器産業株式会社 オーディオ信号の符号化及び複号化方法及び装置
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
WO2003065353A1 (en) * 2002-01-30 2003-08-07 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
CN101124626B (zh) * 2004-09-17 2011-07-06 皇家飞利浦电子股份有限公司 用于最小化感知失真的组合音频编码
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02123400A (ja) * 1988-11-02 1990-05-10 Nec Corp 高能率音声符号化器
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
JP2002091497A (ja) * 2000-09-18 2002-03-27 Nippon Telegr & Teleph Corp <Ntt> オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
JP2002244698A (ja) * 2000-12-14 2002-08-30 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
JP2008518264A (ja) * 2004-11-01 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 振幅の包絡線を有するパラメトリックオーディオコーディング

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017523455A (ja) * 2014-06-24 2017-08-17 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ符号化方法および装置
US10347267B2 (en) 2014-06-24 2019-07-09 Huawei Technologies Co., Ltd. Audio encoding method and apparatus
US11074922B2 (en) 2014-06-24 2021-07-27 Huawei Technologies Co., Ltd. Hybrid encoding method and apparatus for encoding speech or non-speech frames using different coding algorithms

Also Published As

Publication number Publication date
CN101641733B (zh) 2013-04-03
KR20080085562A (ko) 2008-09-24
CN101641733A (zh) 2010-02-03
KR101149449B1 (ko) 2012-05-25
EP2122614A4 (en) 2013-09-04
EP2122614A1 (en) 2009-11-25
WO2008114925A1 (en) 2008-09-25
US8019616B2 (en) 2011-09-13
US20080235033A1 (en) 2008-09-25
JP5118158B2 (ja) 2013-01-16

Similar Documents

Publication Publication Date Title
JP5118158B2 (ja) オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
JP6155274B2 (ja) 過剰サンプリングされたsbrを使ったアップサンプリング
CA2779388C (en) Sbr bitstream parameter downmix
RU2449387C2 (ru) Способ и устройство для обработки сигнала
EP2291841B1 (en) Method, apparatus and computer program product for providing improved audio processing
JP7413418B2 (ja) 信号をインタリーブするためのオーディオ復号器
KR101227932B1 (ko) 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
US9280974B2 (en) Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
CN101568959B (zh) 用带宽扩展进行编码和/或解码的方法
US20080077412A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
US8948891B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal by using semantic information
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
JP5027256B2 (ja) ノイズ信号の符号化及び復号化の装置及び方法
CN105556597A (zh) 多声道音频内容的编码
JP2004184975A (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
WO2006030754A1 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
US8781134B2 (en) Method and apparatus for encoding and decoding stereo audio
JP4470122B2 (ja) 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム
US20090055197A1 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same
JP2008033211A (ja) 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム
JP5943982B2 (ja) オーディオ再生装置及びオーディオ再生方法
JP2006195066A (ja) 符号化オーディオ信号の再生装置及び再生方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120918

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121018

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees