JP4056407B2 - スケーラブル無損失オーディオ符号化/復号化装置及びその方法 - Google Patents

スケーラブル無損失オーディオ符号化/復号化装置及びその方法 Download PDF

Info

Publication number
JP4056407B2
JP4056407B2 JP2003052519A JP2003052519A JP4056407B2 JP 4056407 B2 JP4056407 B2 JP 4056407B2 JP 2003052519 A JP2003052519 A JP 2003052519A JP 2003052519 A JP2003052519 A JP 2003052519A JP 4056407 B2 JP4056407 B2 JP 4056407B2
Authority
JP
Japan
Prior art keywords
lossless
signal
bitstream
loss
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003052519A
Other languages
English (en)
Other versions
JP2004004578A (ja
Inventor
度 亨 金
尚 ▲ウク▼ 金
重 會 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2004004578A publication Critical patent/JP2004004578A/ja
Application granted granted Critical
Publication of JP4056407B2 publication Critical patent/JP4056407B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、オーディオ符号化/復号化システムに係り、特に、損失ビットストリームと無損失ビットストリームとの切り替え操作可能なスケーラブル無損失オーディオ符号化/復号化装置及びその方法に関する。
【0002】
【従来の技術】
MP3技術が使用され始めてから、他の多くのMPEG技術が全世界的に使われてきている。ほとんどのMPEG技術において、元の信号に比べて非常に少ない情報量に圧縮されるが、損失圧縮は、多くの場合、データの損失を伴う。すなわち、符号化された情報の大きさは、大幅に減るが、原音と完全に同一ではない。しかし、インターネットの環境が、ナローバンドからワイドバンドに変わり、まもなく、無線、光通信など大容量の伝送線が構築されれば、よりクリアな音質のサービスを提供されたいという使用者の欲求が高まるであろう。このような傾向に対応して、MPEG標準化機構が無損失符号化側の標準化のための雰囲気を作っており、無損失符号化装置及び復号化装置の提供が要求されている。また、サービスの多様化のために損失符号化されたビットストリームまたは無損失符号化されたビットストリームを選択的に提供できるスケーラブル機能が要求される。
【0003】
図1は、従来の無損失符号化装置の構成を模式的に示すブロック図である。図1に示すように、従来の無損失符号化装置は、予測器100と、エラー生成部110と、無損失符号化部120とを備えて構成される。
【0004】
予測器100は、現在入力されている入力オーディオ信号(INPUT)から次に入力される入力オーディオ信号を予測し、予測された結果を予測信号として出力する。エラー生成部110は、入力オーディオ信号(INPUT)と予測器100で予測された前記予測信号とを比較して、両信号間の誤差を検出し、検出された結果を誤差信号として出力する。無損失符号化部120は、エラー生成部110から出力される前記誤差信号を無損失符号化して無損失ビットストリームを生成する。
【0005】
前記した構造の従来の無損失符号化装置は、スケーラブル機能を提供することができないという問題があった。スケーラブル機能を提供するためには、損失ビットストリームと無損失ビットストリームとを別々に生成して、分離された記憶空間に格納し、切り替え操作を通じて供給サービスする方法しかない。この場合、サーバー側記憶装置に2つのデータを同時に貯蔵しなければならないので、相対的に大容量の記憶空間が必要であり、コストが高くなるという問題もあった。
【0006】
【発明が解決しようとする課題】
前記問題点を解決するために、本発明の第1の目的は、損失符号化されたビットストリームまたは無損失符号化されたビットストリームを選択的に提供できるスケーラブル機能を有する無損失オーディオ符号化/復号化装置を提供することである。
【0007】
また、本発明の第2の目的は、損失符号化されたビットストリームまたは無損失符号化されたビットストリームを選択的に提供できるスケーラブル機能を有する無損失オーディオ符号化/復号化方法を提供することである。
【0008】
【課題を解決するための手段】
(1)前記目的を解決するための本発明に係るスケーラブル無損失オーディオ符号化装置は、入力オーディオ信号を損失符号化し基本階調に損失ビットストリームを生成する損失符号化部と、前記損失ビットストリームを復号化し、この復号化された信号と前記入力オーディオ信号とを比較して、前記損失符号化した時に失われた損失信号を再生する損失信号再生部と前記損失信号を無損失符号化して高位階調に無損失ビットストリームを生成する無損失符号化部と前記損失ビットストリームと前記無損失ビットストリームとを多重化して1つの出力ビットストリームを生成する多重化部とを備え、前記無損失符号化部は、現在入力されている前記損失信号から次に生成される損失信号を予測し、ラプラス分布になるような予測信号を生成する予測器と、前記損失信号と、前記予測器で予測された予測信号とを比較して、両信号間の誤差を検出し、検出された結果を誤差信号として出力する第2エラー生成器と、前記誤差信号を無損失符号化して前記無損失ビットストリームを生成する無損失符号化器とを備えて構成される。
【0009】
(2)本発明は、前記スケーラブル無損失オーディオ符号化装置において、前記出力ビットストリームが、前記損失ビットストリームのフレーム長を表す第1長さフィールドと、前記損失ビットストリームが記録される第1データフィールドと、前記無損失ビットストリームのフレーム長を表す第2長さフィールドと、前記無損失ビットストリームが記録される第2データフィールドとを備えて構成されることが望ましい。
【0010】
(3)本発明は、前記スケーラブル無損失オーディオ符号化装置において、前記損失符号化部が、BSAC符号化器を備えて構成されることが望ましい。
【0011】
(4)本発明は、前記スケーラブル無損失オーディオ符号化装置において、前記損失信号再生部が、前記損失ビットストリームを復号化して損失オーディオ信号を復元する損失復号化器と、前記入力オーディオ信号と復元された前記損失オーディオ信号とを比較して両信号間の誤差を検出し、検出された結果を前記損失信号として出力する第1エラー生成器とを備えて構成されることが望ましい。
【0012】
(5)本発明は、前記スケーラブル無損失オーディオ符号化装置において、前記損失復号化器が、BSAC復号化器を備えて構成されることが望ましい。
【0014】
(6)前記目的を解決するための本発明に係るスケーラブル無損失オーディオ復号化装置は、オーディオ信号が基本階層で損失符号化された損失ビットストリームと、前記オーディオ信号が損失符号化されて失われた損失信号を高位階層で無損失符号化した無損失ビットストリームと、が混合された混合ビットストリームから、前記オーディオ信号を復号化するスケーラブル無損失オーディオ復号化装置において、前記混合ビットストリームから、前記損失ビットストリーム及び前記無損失ビットストリームを逆多重化して分離する逆多重化部と、前記逆多重化部で分離された前記損失ビットストリームを復号化して基本階層を復元する損失復号化部と、前記逆多重化部で分離された前記無損失ビットストリームを復元して高位階層を復元する無損失復号化部と、前記損失復号化部から復元された基本階層の前記損失オーディオ信号と復元された高位階層の前記無損失オーディオ信号とを加算して復元された無損失オーディオ信号を出力するか、または前記損失復号化部から復元された基本階層の前記損失オーディオ信号だけを選択的に出力する第2信号生成部と、を備える構成とされる。
【0015】
)本発明は、前記スケーラブル無損失オーディオ復号化装置において、前記損失復号化部が、BSAC復号化器を備えて構成されることが望ましい。
【0016】
)本発明は、前記スケーラブル無損失オーディオ復号化装置において、前記無損失復号化部が、前記逆多重化部から分離された前記無損失ビットストリームを復元して誤差信号を生成する無損失復号化器と、前記無損失復号化部で復元された前記誤差信号から原信号を予測する予測器と、予測された前記原信号に復元された前記誤差信号を加算して前記損失信号を生成する第1信号生成部とを備えて構成されることが望ましい。
【0017】
(9)前記目的を解決するための本発明に係るスケーラブル無損失オーディオ符号化方法は、(a)入力オーディオ信号を損失符号化して基本階層に損失ビットストリームを生成する段階と、(b)前記損失ビットストリームを復号化し、復合化された信号と前記入力オーディオ信号とを比較して、前記損失符号化したときに失われた損失信号を再生する段階と、(c)前記損失信号を無損失符号化して高位階層に無損失ビットストリームを生成する段階と、(d)前記損失ビットストリームと前記無損失ビットストリームとを多重化して1つの出力ビットストリームを生成する段階と、を備え、前記段階(c)は、現在入力されている前記損失信号から次に生成される損失信号を予測し、ラニラス分布になるような予測信号を生成する段階と、前記損失信号と、前記生成された予測信号とを比較して、両信号間の誤差を検出し、検出された結果を誤差信号として出力する段階と、前記誤差信号を無損失符号化して前記無損失ビットストリームを生成する段階とを有して構成される。
【0018】
(1)本発明は、前記スケーラブル無損失オーディオ符号化方法において、前記段階(a)における損失符号化は、BSAC符号化器を用いて符号化し、前記段階(b)における損失ビットストリームの復号化は、BSAC復号化器を用いて復号化する段階を備えて構成されることが望ましい。
【0019】
(1)前記目的を解決するための本発明に係る記録媒体は、前記スケーラブル無損失オーディオ符号化方法をコンピュータにて実行可能なプログラムコードで記録されて構成されることが望ましい。
【0020】
(12)前記目的を解決するための本発明に係るオーディオ信号が損失符号化されたスケーラブル無損失オーディオ復号化方法は、オーディオ信号が基本階層で損失符号化された損失ビットストリームと、前記オーディオ信号とが損失符号化されて失われた損失信号を高位階層で無損失符号化した無損失ビットストリームと、が混合された混合ビットストリームから前記オーディオ信号を復号化するスケーラブル無損失オーディオ復号化装置において行われるスケーラブル無損失オーディオ復号化方法において、(e)前記混合ビットストリームから、前記損失ビットストリーム及び前記無損失ビットストリームを逆多重化して分離する段階と、(f)分離された前記損失ビットストリームを復号化して損失オーディオ信号を復元する段階と、(g)分離された前記無損失ビットストリームを復号化して前記損失信号を復元する段階と、(h)復元された基本階層の前記損失オーディオ信号と、復元された高位階層の前記損失信号とを加算して復元された無損失オーディオ信号を出力するか、または前記復元された基本階層の前記損失オーディオ信号だけを選択的に出力する段階と、を備えて構成される。
【0021】
(1)本発明は、前記スケーラブル無損失オーディオ符号化方法において、前記段階(f)が、BSAC復号化器を用いて損失復号化する段階を備えて構成されることが望ましい。
【0022】
(1)本発明は、前記記録媒体において、前記スケーラブル無損失オーディオ復号化方法をコンピュータにて実行可能なプログラムコードで記録されて構成されることが望ましい。
【0023】
【発明の実施の形態】
以下、添付した図面に基づき、本発明に係るスケーラブル無損失オーディオ符号化/復号化装置の好ましい実施形態の各構成及び動作と、前記本発明に係るスケーラブル無損失オーディオ符号化/復号化装置で行われるスケーラブル無損失オーディオ符号化/復号化方法について詳細に説明する。
【0024】
図2は、本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置の構成を模式的に示すブロック図である。図2に示すように、スケーラブル無損失オーディオ符号化装置は、損失符号化部200と、損失信号再生部210と、無損失符号化部220と、混合部230とを備えて構成される。
【0025】
図2に示すように、損失符号化部200は、入力オーディオ信号(INPUT)を損失符号化して損失ビットストリームを生成する。このようにして、損失符号化が行われると、人の耳に影響を与えない一部のオーディオ信号が失われる。ここで、損失符号化部200は、BSAC符号化器(BSAC:Bit Sliced Arithmetic Coding)で構成することが望ましい。
【0026】
損失信号再生部210は、損失ビットストリームを復号化して復元した信号と、入力オーディオ信号INPUTとを比較して、損失符号化部200で損失符号化された時に失ったオーディオ信号を損失信号として再生する。
【0027】
損失信号再生部210は、以下に説明するように、損失復号化器212及び第1エラー生成器214を備えて構成することが望ましい。
【0028】
損失復号化器212は、損失符号化部200から出力される損失ビットストリームを復号化して損失オーディオ信号として復元する。しかし、前記したように、損失符号化部200で損失符号化過程を経る時、一部のオーディオ信号が失われる。したがって、損失復号化器212では、一部のオーディオ信号が失われた損失オーディオ信号として復元されることになる。ここで、損失符号化部200がBSAC符号化器であれば、損失復号化器212は、BSAC復号化器であることが望ましい。
【0029】
また、第1エラー生成器214は、入力オーディオ信号INPUTと、損失復号化部212で復元された損失オーディオ信号とを比較して、両信号間の誤差を検出し、検出された結果を損失信号として出力する。
【0030】
一方、無損失符号化部220は、損失信号再生部210から入力された損失信号を無損失符号化して無損失ビットストリームとして生成する。ここで、無損失符号化部220は、予測器222、第2エラー生成器224及び無損失符号化器226を備えて構成することが望ましい。
【0031】
図3A、図3B及び図3Cは、図2に示す本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置で生成される主要信号の波形を示す図面である。図3Aは、入力オーディオ信号(INPUT)の波形を、図3Bは、第1エラー生成器214から生成される損失信号の波形を、図3Cは、第2エラー生成器224から生成された誤差信号の波形を、各々示す。
【0032】
予測器222は、損失信号生成部210から入力される現在の損失信号から次に発生する損失信号を予測する。これは、損失信号に存在するサンプル間の冗長性を除去することによって、符号化するデータの量を減らすためである。第1エラー生成器214で生成された損失信号(図3B参照)は、入力オーディオ信号(INPUT、図3A参照)と、損失符号化器200で量子化されたオーディオ信号との差であるため、全体的な平方自乗平均RMS値(RMS:Root Mean Square)は、もとの前記オーディオ信号に比べて低い値を有する。
【0033】
しかし、損失符号化部200で周波数帯別に同一に量子化したものではないため、相変らず時間的冗長性が存在する。したがって、最終的な信号は、時間的冗長性をさらに減らすために時間軸での予測によりラプラス分布になるように制御される。予測方法としては、自己回帰方法や移動平均方法を用いられる。また、単純に低次数固定の予測係数だけでも予測可能である。したがって、予測係数に対する付帯事項を考慮して自己回帰方法、移動平均方法、単純多項式予測法、及び他の任意の予測方法のうちのいずれか1つの方法を用いて、最小のビットを求める予測器を選択すればよい。
【0034】
第2エラー生成器224は、損失信号と予測器で予測された予測信号とを比較して、両信号間の誤差を検出し、検出された結果を誤差信号(図3C参照)として出力する。つまり、図3Cに示すように、第2エラー生成器224で生成された誤差信号は、第1エラー生成器214で生成された損失信号(図3B参照)の時間的冗長性を最小化してRMS値を最小化することによって、後記する無損失符号化器226で符号化されるデータ量を最小化できる。
【0035】
無損失符号化器226は、第2エラー生成部224から出力される誤差信号を無損失符号化して、前記無損失ビットストリームとして生成する。
【0036】
引続き、多重化部230は、損失符号化部200から出力される損失ビットストリームと無損失符号化部220で出力される無損失ビットストリームとを多重化して、1つの出力ビットストリームを生成する。
【0037】
図4は、図2に示す本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置の多重化部230から出力されるビットストリームの構造を説明するための図面である。
【0038】
図4に示すように、出力ビットストリームは、損失ビットストリームのフレーム長を表す第1長さフィールド500、損失ビットストリームが記録される第1データフィールド501、無損失ビットストリームのフレーム長を示す第2長さフィールド502及び無損失ビットストリームが記録される第2データフィールド503を備えて構成される。
【0039】
つまり、図2に示す本発明に係るスケーラブル無損失オーディオ符号化装置は、損失符号化された基本階層と、無損失符号化された高位階層とを1つのビットストリームとして生成して、それを伝送することができる。
【0040】
図5は、図2に示す本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置で符号化されて出力されるオーディオビットストリームを復号化するためのスケーラブル無損失オーディオ復号化装置の1実施例を模式的に示すブロック図である。図5に示すように、前記スケーラブル無損失オーディオ復号化装置は、逆多重化部300、無損失復号化部310、損失復号化部320及び第2信号生成部330を備えて構成される。
【0041】
図5に示すように、逆多重化部300は、図2に示す装置で出力される出力ビットストリームを入力ビットストリームとして入力し、入力ビットストリームから損失ビットストリーム及び無損失ビットストリームを分離する。そして、逆多重化部300は,図3に示す構造のビットストリームを入力して、損失ビットストリームのフレーム長を表す第1長さフィールド500を解釈して、損失ビットストリームが記録されている第1データフィールド501を分離し、さらに、無損失ビットストリームのフレーム長を表す第2長さフィールド502を解釈して、無損失ビットストリームが記録されている第2データフィールド503を分離する。
【0042】
損失復号化部320は,逆多重化部300から分離された損失ビットストリームを復号化して損失オーディオ信号を復元する。しかし、前述したように、損失符号化部200で損失符号化過程を経る時、一部オーディオ信号が損失される。したがって、損失復号化部320では、一部のオーディオ信号が損失された損失オーディオ信号が復元される。ここで、損失符号化部200がBSAC符号化器であれば、損失復号化部320は、BSAC復号化器であることが望ましい。
【0043】
無損失復号化部310は、逆多重化部300で分離された無損失ビットストリームを復号化し、図2に示す無損失符号化部220ですでに符号化されている損失信号を復元する。無損失復号化部310は、無損失符号化部220でのプロセスを逆に行うことによって損失信号を復元できる。無損失復号化部310は、無損失復号化器312、予測器314及び第1信号生成器316を備えて構成されることが望ましい。
【0044】
無損失復号化器312は、逆多重化部300から分離された無損失ビットストリームを復元して、図2に示す第2エラー生成器224から出力される誤差信号を復元する。
【0045】
予測器314は、無損失復号化器312で復元された誤差信号から原信号を予測する。
【0046】
第1信号生成器316は、予測器314で予測された信号に無損失復号化器312で復元された誤差信号を加算して損失信号を復元する。
【0047】
引続き、第2信号生成部330は、損失復号化部320で復元された損失オーディオ信号と、無損失復号化部310で復元された前記損失信号とを加算して無損失オーディオ信号を復元する。すなわち、復元されたオーディオ信号は、入力オーディオ信号(INPUT)が損失符号化されつつ一部のオーディオ信号が損失された信号であり、無損失復号化部310で復元された前記損失信号は、損失復号化時に損失されたオーディオ信号である。結局、第2信号生成部330は、前記損失信号を、損失復号化部310で復元された損失オーディオ信号に加算することによって、入力オーディオ信号(INPUT)を復元できる。
【0048】
一方、第2信号生成部330は、外部制御によって、損失復号化部320で復元されたオーディオ信号だけ選択的に出力するか、または復元されたオーディオ信号に復元された損失信号を加算した無損失オーディオ信号を出力できる。例えば、オーディオサービスを提供するサービス・プロバイダは、本発明に係るスケーラブル無損失復号化装置を用いて、選択的に使用者によって異なるオーディオサービスを提供できる。例えば、ナローバンド・ネットワークを用いる使用者または無料利用者には、損失復号化部320で復元された損失オーディオ信号のみを再生させ、一方、ブロードバンド・ネットワークを利用する使用者または有料利用者には、無損失オーディオ信号を再生させるようにすることができる。
【0049】
また、本発明は、コンピュータにて読取可能な記録媒体にコンピュータにて読取可能なコードとして具現できる。コンピュータにて読取可能な記録媒体は、コンピュータシステムによって読取可能なデータが貯蔵される全ての種類の記録装置を含む。コンピュータにて読取可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピーディスク、光データ貯蔵装置などがあり、また搬送波(例えば、インターネットを通じた伝送)の形に具現されることも含む。またコンピュータにて読取可能な記録媒体は、ネットワークで連結されたコンピュータシステムに分散され、その分散方式によってコンピュータにて読取可能なコードが貯蔵及び実行される。
【0050】
【発明の効果】
以上説明した通りに構成される本発明によれば、以下の効果を奏する。すなわち、本発明に係るスケーラブル無損失オーディオ符号化/復号化装置及びその方法によれば、損失符号化された損失ビットストリームと無損失符号化された無損失ビットストリームとを多重化して1つの出力ビットストリームとして生成して伝送し、前記出力ビットストリームから損失ビットストリームのみを復元した損失オーディオ信号または損失ビットストリーム及び無損失ビットストリームを全て復元して混合した無損失オーディオ信号を選択的に生成できる。
【0051】
なお、本発明に係るスケーラブル無損失オーディオ符号化/復号化装置及びその方法は、図面を参照しながら、本発明に係る望ましい実施形態を参考として説明されたが、この実施形態は、単なる例示的なものに過ぎず、当該分野において通常の知識を有する者であれば、本発明の技術的思想に基づいて、この実施形態より各種の変形及びこれと均等な実施形態を創作することが可能なことは言うまでもない。よって、本発明の真の技術的な保護範囲は、本明細書の特許請求範囲によって定まるべきである。
【図面の簡単な説明】
【図1】従来の無損失符号化装置の構成を模式的に示すブロック図である。
【図2】本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置の構成を模式的に示すブロック図である。
【図3A】図2に示す本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置で生成される入力オーディオ信号(INPUT)の波形を示す図である。
【図3B】図2に示すスケーラブル無損失オーディオ符号化装置で生成される損失信号の波形を示す図である。
【図3C】図2に示す本発明本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置で生成される誤差信号の波形を示す図である。
【図4】図2に示す本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置の多重化部から出力されるビットストリームの構造を説明するための図面である。
【図5】図2に示す本発明に係る1実施形態のスケーラブル無損失オーディオ符号化装置で符号化されて出力されるオーディオビットストリームを復号化するためのスケーラブル無損失オーディオ復号化装置の1実施例を模式的に示すブロック図である。
【符号の説明】
200 損失符号化部
210 損失信号再生部
220 無損失符号化部
230 多重化部

Claims (14)

  1. 入力オーディオ信号を損失符号化し基本階層に損失ビットストリームを生成する損失符号化部と、前記損失ビットストリームを復号化し、この復号化された信号と前記入力オーディオ信号とを比較して、前記損失符号化した時に失われた損失信号を再生する損失信号再生部と前記損失信号を無損失符号化して高位階層に無損失ビットストリームを生成する無損失符号化部と前記損失ビットストリームと前記無損失ビットストリームとを多重化して1つの出力ビットストリームを生成する多重化部とを備え、
    前記無損失符号化部は、
    現在入力されている前記損失信号から次に生成される損失信号を予測し、ラプラス分布になるような予測信号を生成する予測器と、
    前記損失信号と、前記予測器で予測された予測信号とを比較して、両信号間の誤差を検出し、検出された結果を誤差信号として出力する第2エラー生成器と、
    前記誤差信号を無損失符号化して前記無損失ビットストリームを生成する無損失符号化器とを備えることを特徴とするスケーラブル無損失オーディオ符号化装置。
  2. 前記出力ビットストリームは、
    前記損失ビットストリームのフレーム長を表す第1長さフィールドと、
    前記損失ビットストリームが記録される第1データフィールドと、
    前記無損失ビットストリームのフレーム長を表す第2長さフィールドと、
    前記無損失ビットストリームが記録される第2データフィールドと、
    を備えることを特徴とする請求項1に記載のスケーラブル無損失オーディオ符号化装置。
  3. 前記損失符号化部は、BSAC符号化器であることを特徴とする請求項1に記載のスケーラブル無損失オーディオ符号化装置。
  4. 前記損失信号再生部は、
    前記損失ビットストリームを復号化して損失オーディオ信号を復元する損失復号化器と
    前記入力オーディオ信号と復元された前記損失オーディオ信号とを比較して両信号間の誤差を検出し、検出された結果を前記損失信号として出力する第1エラー生成器と、
    を備えることを特徴とする請求項1に記載のスケーラブル無損失オーディオ符号化装置。
  5. 前記損失復号化器は、BSAC復号化器であることを特徴とする請求項4に記載のスケーラブル無損失オーディオ符号化装置。
  6. オーディオ信号が基本階層で損失符号化された損失ビットストリームと、前記オーディオ信号が損失符号化されて失われた損失信号を高位階層で無損失符号化した無損失ビットストリームと、が混合された混合ビットストリームから、前記オーディオ信号を復号化するスケーラブル無損失オーディオ復号化装置において、
    前記混合ビットストリームから、前記損失ビットストリーム及び前記無損失ビットストリームを逆多重化して分離する逆多重化部と、
    前記逆多重化部で分離された前記損失ビットストリームを復号化して基本階層を復元する損失復号化部と、
    前記逆多重化部で分離された前記無損失ビットストリームを復元して高位階層を復元する無損失復号化部と、
    前記損失復号化部から復元された基本階層の前記損失オーディオ信号と復元された高位階層の前記無損失オーディオ信号とを加算して復元された無損失オーディオ信号を出力するか、または前記損失復号化部から復元された基本階層の前記損失オーディオ信号だけを選択的に出力する第2信号生成部と、
    を備えることを特徴とするスケーラブル無損失オーディオ復号化装置。
  7. 前記損失復号化部は、BSAC復号化器であることを特徴とする請求項6に記載のスケーラブル無損失オーディオ復号化装置。
  8. 前記無損失復号化部は、
    前記逆多重化部から分離された前記無損失ビットストリームを復元して誤差信号を生成する無損失復号化器と、
    前記無損失復号化部で復元された前記誤差信号から原信号を予測する予測器と、
    予測された前記原信号に復元された前記誤差信号を加算して前記損失信号を生成する第1の信号生成部と、
    を備えることを特徴とする請求項6に記載のスケーラブル無損失オーディオ復号化装置
  9. (a)入力オーディオ信号を損失符号化して基本階層に損失ビットストリームを生成する段階と、
    (b)前記損失ビットストリームを復号化し、復合化された信号と前記入力オーディオ信号とを比較して、前記損失符号化したときに失われた損失信号を再生する段階と、
    (c)前記損失信号を無損失符号化して高位階層に無損失ビットストリームを生成する段階と、
    (d)前記損失ビットストリームと前記無損失ビットストリームとを多重化して1つの出力ビットストリームを生成する段階と、
    を備え、
    前記段階(c)は、
    現在入力されている前記損失信号から次に生成される損失信号を予測し、ラニラス分布になるような予測信号を生成する段階と、
    前記損失信号と、前記生成された予測信号とを比較して、両信号間の誤差を検出し、検出された結果を誤差信号として出力する段階と、
    前記誤差信号を無損失符号化して前記無損失ビットストリームを生成する段階とを有することを特徴とするスケーラブル無損失オーディオ符号化方法。
  10. 前記段階(a)における損失符号化は、BSAC符号化器を用いて符号化し、前記段階(b)における損失ビットストリームの復号化は、BSAC復号化器を用いて復号化することを特徴とする請求項9に記載のスケーラブル無損失オーディオ符号化方法。
  11. 請求項9に記載のスケーラブル無損失オーディオ符号化方法をコンピュータにて実行可能なプログラムコードで記録した記録媒体。
  12. オーディオ信号が基本階層で損失符号化された損失ビットストリームと、前記オーディオ信号とが損失符号化されて失われた損失信号を高位階層で無損失符号化した無損失ビットストリームと、が混合された混合ビットストリームから前記オーディオ信号を復号化するスケーラブル無損失オーディオ復号化装置において行われるスケーラブル無損失オーディオ復号化方法において、
    (e)前記混合ビットストリームから、前記損失ビットストリーム及び前記無損失ビットストリームを逆多重化して分離する段階と、
    (f)分離された前記損失ビットストリームを復号化して損失オーディオ信号を復元する段階と、
    (g)分離された前記無損失ビットストリームを復号化して前記損失信号を復元する段階と、
    (h)復元された基本階層の前記損失オーディオ信号と、復元された高位階層の前記損失信号とを加算して復元された無損失オーディオ信号を出力するか、または前記復元された基本階層の前記損失オーディオ信号だけを選択的に出力する段階と、
    を備えることを特徴とするスケーラブル無損失オーディオ復号化方法。
  13. 前記段階(f)は、BSAC復号化器を用いて損失復号化することを特徴とする請求項12に記載のスケーラブル無損失オーディオ符号化方法。
  14. 請求項12に記載のスケーラブル無損失オーディオ復号化方法をコンピュータにて実行可能なプログラムコードで記録した記録媒体。
JP2003052519A 2002-03-09 2003-02-28 スケーラブル無損失オーディオ符号化/復号化装置及びその方法 Expired - Fee Related JP4056407B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020012759A KR100908114B1 (ko) 2002-03-09 2002-03-09 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007150793A Division JP2007279761A (ja) 2002-03-09 2007-06-06 スケーラブル無損失オーディオ符号化/復号化装置及びその方法

Publications (2)

Publication Number Publication Date
JP2004004578A JP2004004578A (ja) 2004-01-08
JP4056407B2 true JP4056407B2 (ja) 2008-03-05

Family

ID=28786888

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2003052519A Expired - Fee Related JP4056407B2 (ja) 2002-03-09 2003-02-28 スケーラブル無損失オーディオ符号化/復号化装置及びその方法
JP2007150793A Pending JP2007279761A (ja) 2002-03-09 2007-06-06 スケーラブル無損失オーディオ符号化/復号化装置及びその方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2007150793A Pending JP2007279761A (ja) 2002-03-09 2007-06-06 スケーラブル無損失オーディオ符号化/復号化装置及びその方法

Country Status (4)

Country Link
US (1) US7617097B2 (ja)
JP (2) JP4056407B2 (ja)
KR (1) KR100908114B1 (ja)
DE (1) DE10306685A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100354531B1 (ko) * 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
US7742926B2 (en) * 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
KR100975522B1 (ko) * 2003-10-28 2010-08-13 삼성전자주식회사 스케일러블 오디오 복/부호화 방법 및 장치
KR100561869B1 (ko) * 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
EP1756807B1 (en) * 2004-06-08 2007-11-14 Koninklijke Philips Electronics N.V. Audio encoding
TWI285055B (en) * 2004-09-30 2007-08-01 Nippon Telegraph & Telephone Method for progressive lossless video coding, method for progressive lossless video decoding, progressive lossless video coding apparatus, progressive lossless video decoding apparatus, and recording media of progressive lossless video coding program...
JP4606418B2 (ja) * 2004-10-13 2011-01-05 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
KR100710262B1 (ko) * 2005-07-22 2007-04-20 엘지전자 주식회사 오디오 에러 검출 장치 및 그 방법
JP4640020B2 (ja) * 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
US8184691B1 (en) * 2005-08-01 2012-05-22 Kevin Martin Henson Managing telemetry bandwidth and security
EP1852849A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
EP1855271A1 (en) * 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for re-encoding signals
EP1881485A1 (en) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
US20080100595A1 (en) * 2006-10-31 2008-05-01 Tpo Displays Corp. Method for eliminating power-off residual image in a system for displaying images
JP2008257221A (ja) * 2007-03-13 2008-10-23 Matsushita Electric Ind Co Ltd 信号処理装置
KR100889750B1 (ko) * 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
KR101381602B1 (ko) * 2007-09-17 2014-04-04 삼성전자주식회사 계층적 부호화 및 복호화 방법 및 장치
JP4973422B2 (ja) * 2007-09-28 2012-07-11 ソニー株式会社 信号記録再生装置及び方法
KR101421589B1 (ko) * 2007-12-28 2014-07-22 삼성전자주식회사 휴대용 단말기의 음향 보정 필터 설계 방법 및 장치
EP2348504B1 (en) * 2009-03-27 2014-01-08 Huawei Technologies Co., Ltd. Encoding and decoding method and device
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
CN101964188B (zh) * 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码***
US9711150B2 (en) * 2012-08-22 2017-07-18 Electronics And Telecommunications Research Institute Audio encoding apparatus and method, and audio decoding apparatus and method
US10438597B2 (en) * 2017-08-31 2019-10-08 Dolby International Ab Decoder-provided time domain aliasing cancellation during lossy/lossless transitions
EP3451332B1 (en) * 2017-08-31 2020-03-25 Dolby International AB Decoder-provided time domain aliasing cancellation during lossy/lossless transitions
GB2624686A (en) * 2022-11-25 2024-05-29 Lenbrook Industries Ltd Improvements to audio coding

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0773249B2 (ja) * 1989-06-29 1995-08-02 富士通株式会社 音声符号化・復号化伝送方式
US5748763A (en) * 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
JP3629826B2 (ja) * 1995-07-28 2005-03-16 ソニー株式会社 情報信号符号化装置、符号化方法、並びに情報信号復号方法
US5777677A (en) * 1996-02-09 1998-07-07 International Business Machines Corporation Approximate MPEG decoder with compressed reference frames
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
DE69944788C5 (de) 1998-04-09 2023-10-19 Koninklijke Philips N.V. Verlustfreie kodierung/dekodierung in einem übertragungssystem
US6549147B1 (en) * 1999-05-21 2003-04-15 Nippon Telegraph And Telephone Corporation Methods, apparatuses and recorded medium for reversible encoding and decoding
JP3406275B2 (ja) 1999-05-21 2003-05-12 日本電信電話株式会社 ディジタル信号符号化方法、ディジタル信号復号化方法、これらの装置及びその各プログラム記録媒体
JP2002016925A (ja) 2000-04-27 2002-01-18 Canon Inc 符号化装置及び符号化方法
US6909812B1 (en) * 2000-07-13 2005-06-21 Lucent Technologies Inc. Methods and apparatus for nearly lossless-concatenated block transform coding
FI109393B (fi) 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
US6677868B2 (en) * 2001-03-16 2004-01-13 Sharp Laboratories Of America, Inc. Entropy coding with adaptive syntax to replace high probability symbols with lower probabilities symbols
CA3102782A1 (en) * 2010-12-14 2012-06-21 University Of Maryland, Baltimore Universal anti-tag chimeric antigen receptor-expressing t cells and methods of treating cancer

Also Published As

Publication number Publication date
US7617097B2 (en) 2009-11-10
KR20030073279A (ko) 2003-09-19
KR100908114B1 (ko) 2009-07-16
JP2004004578A (ja) 2004-01-08
JP2007279761A (ja) 2007-10-25
US20030171919A1 (en) 2003-09-11
DE10306685A1 (de) 2003-10-30

Similar Documents

Publication Publication Date Title
JP4056407B2 (ja) スケーラブル無損失オーディオ符号化/復号化装置及びその方法
JP4740548B2 (ja) 帯域幅拡張技術を利用して符号化及び復号化を行う方法及び装置
JP3354863B2 (ja) ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置
KR101404335B1 (ko) 오디오 소스 신호에 대한 손실 엔코드된 데이터 스트림과 무손실 확장 데이터 스트림으로부터 오디오 소스 신호에 대한 무손실 엔코드된 데이터 스트림을 생성하거나 상기 엔코드된 데이터 스트림을 디코딩하기 위한 방법 및 장치
JP2006031012A (ja) マルチチャンネルオーディオデータ符号化方法、マルチチャンネルオーディオデータ復号化方法、マルチチャンネルオーディオデータ符号化装置、マルチチャンネルオーディオデータ復号化装置、マルチチャンネルオーディオデータを符号化するためのプログラムを記録した媒体及びマルチチャンネルオーディオデータを復号化するためのプログラムを記録した記録媒体
KR101237559B1 (ko) 스케일러블 무손실 비트스트림의 인코딩 방법
JP3960932B2 (ja) ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
KR100528325B1 (ko) 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
KR101015497B1 (ko) 디지털 데이터의 부호화/복호화 방법 및 장치
KR100300887B1 (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
US6549147B1 (en) Methods, apparatuses and recorded medium for reversible encoding and decoding
JP4618634B2 (ja) 圧縮オーディオデータ処理方法
JP2003330497A (ja) オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体
JP3606458B2 (ja) 音声信号伝送方法及び音声復号方法
JP2004138789A (ja) ディジタル信号符号化方法、復号化方法、符号器、復号器及びこれらのプログラム
KR20070008211A (ko) 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
KR960012477B1 (ko) 인지 정보량을 이용한 적응적 스테레오 디지탈 오디오 부호화 및 복호화장치
JP4148259B2 (ja) 音声符号化方法及び音声復号方法
JP3606456B2 (ja) 音声信号伝送方法及び音声復号方法
JP2003099095A (ja) オーディオ符号化装置、方法、記録媒体及びプログラム
JP2004140569A (ja) ディジタル信号符号化方法、復号化方法、これらの符号器、復号器及びこれらのプログラム
JPH0356999A (ja) 符号化装置
JP2005208669A (ja) 音声符号化方法及び音声復号方法
JP2005208668A (ja) 音声符号化方法及び音声復号方法
JP2005208670A (ja) 音声符号化方法及び音声復号方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060403

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060704

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061026

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061027

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070606

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071211

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees