JP2007509362A - デジタル信号をスケーラブルビットストリームにエンコードする方法、及びスケーラブルビットストリームをデコードする方法 - Google Patents

デジタル信号をスケーラブルビットストリームにエンコードする方法、及びスケーラブルビットストリームをデコードする方法 Download PDF

Info

Publication number
JP2007509362A
JP2007509362A JP2006532254A JP2006532254A JP2007509362A JP 2007509362 A JP2007509362 A JP 2007509362A JP 2006532254 A JP2006532254 A JP 2006532254A JP 2006532254 A JP2006532254 A JP 2006532254A JP 2007509362 A JP2007509362 A JP 2007509362A
Authority
JP
Japan
Prior art keywords
signal
digital signal
bit
bitstream
perceptual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006532254A
Other languages
English (en)
Other versions
JP4849466B2 (ja
Inventor
ユ,ロンシャン
リン,シャオ
ラハージャ,スサント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agency for Science Technology and Research Singapore
Original Assignee
Agency for Science Technology and Research Singapore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency for Science Technology and Research Singapore filed Critical Agency for Science Technology and Research Singapore
Publication of JP2007509362A publication Critical patent/JP2007509362A/ja
Application granted granted Critical
Publication of JP4849466B2 publication Critical patent/JP4849466B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

デジタル信号をスケーラブルビットストリームにエンコードする方法であって、デジタル信号を量子化し、量子化された信号をエンコードしてコア層ビットストリームを形成する量子化工程と、デジタル信号及びコア層ビットストリームに基づきエラーマッピングを行い、前記コア層ビットストリームにエンコードされた情報を除去して、エラー信号を生じるエラーマッピング工程と、知覚モデルを用いて決定されるデジタル信号の知覚情報に基づきエラー信号をビットプレーン符号化し、上位層ビットストリームを生じるビットプレーン符号化工程と、コア層ビットストリーム及び上位層ビットストリームを多重化し、スケーラブルビットストリームを生成する多重化工程とを備える方法。スケーラブルビットストリームをデジタル信号にデコードする方法であって、スケーラブルビットストリームをコア層ビットストリーム及び上位層ビットストリームに逆多重化する逆多重化工程と、コア層ビットストリームをデコード及び逆量子化して、コア層信号を生成するデコード逆量子化工程と、デジタル信号の知覚情報に基づいて、上位層ビットストリームをビットプレーン復号化するビットプレーン復号化工程と、ビットプレーン復号化された上位層ビットストリームと逆量子化されたコア層信号に基づきエラーマッピングを行い、再構成された変換信号を生じるエラーマッピング工程とを備え、再構成された変換信号がデジタル信号である方法。

Description

近年、コンピュータの進歩に伴って、インターネット、無線LAN、ホームネットワーク及び民生用携帯電話システム等のネットワーク上におけるストリーミング音声コンテンツのネットワーキング及び通信が、音声サービス配信の主流の手段になってきている。xDSL、光ファイバー、及びブロードバンド無線アクセスを含むブロードバンドネットワーク基盤の発展とともに、これらのチャンネルのビットレートが、高サンプリングレートで高振幅解像度(例えば、96kHz、24ビット/サンプル)のロスレス(可逆)音声信号を配信するためのレートに、急速に近づいていると思われる。他方、MPEG−4 AAC(後述の文献1に記載)等の高圧縮デジタル音声フォーマットを必要とするアプリケーションも未だに存在する。結果として、現在のチャンネルと、急速に現れているブロードバンドチャンネルとを橋渡しする相互運用のソリューションが、大いに要求されている。加えて、ブロードバンドチャンネルが広く利用可能であって、且つ突き詰めればバンド幅の制限がなくなる場合でさえ、伝送中にビットレートを動的に変更可能な階層的なビットストリームを生成できるビットレートスケーラブル符号化システムが、依然として非常に有利である。例えば、何らかのアクシデント又はリソースをシェアする要求によりパケット損失が時折起こる用途に対しては、PCM(パルスコード変調)やロスレス符号化フォーマット等の現在のブロードバンドの波形方式は、ストリーミング時に深刻な歪みを受ける可能性がある。しかしながら、ネットワークリソースが動的に変化する場合にパケットの優先度を設定できれば、この問題を解決することができる。最後に、ビットレートスケーラブル符号化システムは、クライアントのサイトから過剰な要求が来た場合にQoSの正常な低下を達成できるような、音声ストリーミングサービスに都合のよいサーバーも提供する。
これまで、多くのロスレス音声符号化アルゴリズムが提案されてきた(後述の文献2から8を参照)。大抵の手法は、元の音声信号の冗長分を、残留成分をエントロピー符号化する間に除去する予測フィルタに頼るものである(後述の文献5から12に記載)。予測フィルタの存在によって、これらの予測に基づく手法で生成したビットストリームは、拡張が不可能でない場合は、ビットレートスケーラビリティを得難く効率的ではない。後述の文献3に記載されるようなその他の手法では、元の音声信号を先ずロッシー(非可逆)エンコーダで符号化し、その後、その残留成分を残りのエンコーダでロスレス符号化する二層手法を介してロスレス音声符号器を構成する。この二層手法では、ある程度のビットレートスケーラビリティが得られるが、その精度がかなり粗いので音声ストリーミング用途であまり高く評価されない。ビットレートに関して高精細スケーラビリティを与える音声コーデックが、かつて、後述の文献4及び18で提案されたが、ここで説明するシステムとは異なり、それらのコーデックでは、両コーデックにより生じるロッシービットストリームが任意の既存の音声コーデックとの互換性がないという、下位互換性が得られない。
後述の文献21、22及び23には、知覚モデルが記載されている。
本発明の課題は、下位互換性を保持しつつ、スケーラブルビットストリームのデジタル信号をエンコードする方法を提供することである。
デジタル信号をスケーラブルビットストリームにエンコードするエンコード方法であって、前記デジタル信号を量子化し、量子化された信号をエンコードしてコア層ビットストリームを形成する量子化工程と、前記デジタル信号及び前記コア層ビットストリームに基づきエラーマッピングを行い、前記コア層ビットストリームにエンコードされた情報を除去して、エラー信号を生じるエラーマッピング工程と、知覚モデルを用いて決定される前記デジタル信号の知覚情報に基づき前記エラー信号をビットプレーン符号化し、上位層ビットストリームを生じるビットプレーン符号化工程と、前記コア層ビットストリーム及び前記上位層ビットストリームを多重化し、前記スケーラブルビットストリームを生成する多重化工程とを備えることを特徴とするエンコード方法を提供する。
更に、上記の方法に係る、デジタル信号をスケーラブルビットストリームにエンコードするエンコーダ、コンピュータ読取可能媒体、コンピュータプログラム要素、スケーラブルビットストリームをデジタル信号にデコードする方法、スケーラブルビットストリームをデジタル信号にデコードするデコーダ、更なるコンピュータ読取可能媒体、及び更なるコンピュータプログラム要素を提供する。
一の実施形態では、次の特徴を持った高精細なビットレートスケーラビリティ(FGBS)を達成するロスレス音声符号化が提示される。即ち、
−下位互換性:MPEG−4 AACビットストリーム等の高圧縮コア層ビットストリームがロスレスビットストリームに埋め込まれる。
−知覚的に埋め込まれたロスレスビットストリーム:ロスレスビットストリームを、再構成された音声の知覚の最適性において、損失無く任意のロッシーレートにて切り捨てることができる。
−低複雑性:非常に限定的なメモリと同様、AAC(二進算術コーデック)時に、非常に限定的な演算が加えられるのみである。
提示された音声コーデックがもたらす豊富な機能性は、異なる音声ストリーミング用途又はストレージ用途のための各種レート/品質要求を満たすような「普遍的な」音声フォーマットとなる性能を意味するものである。例えば、コア層ビットストリームとして用いられるMPEG−4 AAC準拠ビットストリームは、従来のMPEG−4 AAC音声サービス用コーデックを用いて生成されたビットストリームから容易に取り出すことができる。他方、ロスレス圧縮も、ロスレス再構成要求とともに、音声編集用途及びストレージ用途用のコーデックにより提供される。FGBSが必要とされる音声ストリーミング用途では、コーデックのロスレスビットストリームは、実際のシステムで生じる可能性のある任意のレート/フィデリティ/複雑性の制約のために、エンコーダ/デコーダにおいて又は通信チャンネルにおいて、より低いビットレートへ更に切り捨てることができる。
一の実施形態では、デジタル信号をエンコードしてスケーラブルビットストリームを形成する方法が提供される。ここでは、デコーダによりデコードされる際に、このスケーラブルビットストリームを任意の点で切捨て、より低品質の(損失を伴う)信号を生じることができる。この方法は、音声、画像又は映像信号等の任意の種類のデジタル信号をエンコードするのに用いることができる。物理的に測定される信号に対応するデジタル信号は、対応するアナログ信号(例えば、ビデオ信号の輝度及び色度値、アナログ音声信号の振幅、又はセンサーからのアナログ検出信号)の少なくとも一つの特徴をスキャンすることで生成されてよい。例えば、マイクロホンを用いてアナログ音声信号を取得してもよい。そして、取得されたアナログ音声信号をサンプリングして量子化することにより、デジタル音声信号に変換する。ビデオカメラを用いてアナログ映像信号を取得してもよい。そして、適切なアナログ−デジタル信号変換機を用いて、デジタル映像信号に変換する。或いは、デジタルカメラを用いて、画像信号又は映像信号をデジタル信号として画像センサ(CMOS又はCCD)上において直接取得してもよい。
デジタル信号は、量子化及び符号化されて、コア層ビットストリームが形成される。コア層ビットストリームは、最小ビットレート/品質のスケーラブルビットストリームを形成する。
上位層ビットストリームを用いて、更なるビットレート/品質のスケーラブルビットストリームを得る。上位層ビットストリームは、本発明に従って、変換信号及びコア層ビットストリームに基づいてエラーマッピングを行ってエラー信号を生成することにより形成される。エラーマッピングを行う目的は、コア層ビットストリームへと既に符号化された情報を除去することである。
エラー信号はビットプレーン符号化され、上位層ビットストリームが形成される。エラー信号のビットプレーン符号化は、デジタル信号の知覚情報、即ち、知覚された又は知覚の重要性に基づいて行われる。本発明で用いられる知覚情報は、人間の感覚システム、例えば、人間の視覚システム(即ち、人間の目)や人間の聴覚システム(即ち、人間の耳)に関連する情報に関する。このようなデジタル信号(映像又は音声)用の知覚情報は、知覚モデルを用いて得られる。例えば、音声信号用のMPEG−1オーディオにおける心理音響モデルI又はII(後述の文献21に記載)、画像用ヒト視覚システムモデル(後述の文献22に記載)、及び映像で用いられる時間空間モデル(後述の文献23に記載)である。
心理音響モデルは、人間の耳が、各種の環境条件に依存するある周波数バンド内の音のみを拾い上げることができるという作用に基づくものである。同様に、HVM(ヒト視覚モデル)は、人間の目が、ある動き、色及びコントラストに注意をより払っているという作用に基づくものである。
コア層ビットストリーム及び上位層ビットストリームは多重化されてスケーラブルビットストリームを形成する。
スケーラブルビットストリームはデコードされて、ロスレス(可逆)的にデジタル信号を再構成することができる。上述のように、コア層ビットストリームは、最小ビットレート/品質のスケーラブルビットストリームを形成する埋め込み(エンベデッド)ビットストリームであり、上位層ビットストリームは、スケーラブルビットストリームのロスレス部分に対してロッシー(非可逆)を形成する。上位層ビットストリームは知覚的にビットプレーン符号化されるので、知覚的に重要性が低い上位層ビットストリームのデータを先ず切り捨てる方法で上位層ビットストリームを切り捨てることで、スケーラブルビットストリームの知覚スケラービリティを得ることができる。言い換えれば、上位層ビットストリーム、故にスケーラブルビットストリームを、より低いビットレート/品質に切り捨てる際に、知覚的に最適化するように、上位層ビットストリームを切り捨てることによってスケーラブルビットストリームをスケーラブル化することができる。
本発明に係る方法は、高バンド幅又はハイファイシステムにおいて、画像、映像又は音声信号等のデジタル信号用のロスレスエンコーダとして用いることができる。必要とされるバンド幅が変化する場合、エンコーダにより生成されるビットストリームのビットレートは、バンド幅の変化に合わせて変化してよい。このような方法は、JPEG2000のMEG音声、画像及び映像圧縮等の、多くの用途及びシステムで実施することができる。
本発明の一の実施例によれば、前記デジタル信号は、量子化により量子化信号を形成する前に、適切なドメインへ変換される。デジタル信号は、同じドメイン内で変換されてよい。または、デジタル信号をよりよく示すために一のドメインから他のドメインへ変換されてよい。これにより、コア層ビットストリームが形成するための簡単且つ効率的なデジタル信号の量子化及び符号化が可能となる。このようなドメインは、時間ドメイン、周波数ドメイン、並びに時間及び周波数混合ドメインを含んでよいが、これらに限定されない。デジタル信号の変換は、ユニタリ行列Iにより実行されてもよい。
一の実施形態では、前記デジタル信号を、整数型修正離散コサイン変換(intMDCT)を用いて変換デジタル信号に変換する。intMDCTは、MPEG−4 AACコーダで通常用いられる修正離散コサイン変換(MDCT)のフィルタバンクに対する可逆的近似法である。デジタル信号を更なる処理用の適切なドメインに変換するその他の変換も用いることができる。その他の変換は、離散コサイン変換、離散サイン変換、高速フーリエ変換及び離散ウェーブレット変換を含むが、これらに限定されない。
intMDCTを用いてデジタル信号を変換信号に変換する際、前記変換信号(詳細には、変換信号を表すintMDCT係数)を正規化又はスケーラブル化してMDCTのフィルタバンクの出力を近似することが好ましい。intMDCT変換信号の正規化は、変換信号を量子化する量子化器、例えばAAC量子化器が、intMDCTフィルタバンクの精細度とは異なる精細度を持つMDCTフィルタバンクを有する場合に有用であろう。このような正規化工程では、適切に量子化器で直接量子化及び符号化してコア層ビットストリームを形成するように、intMDCT変換信号をMDCTフィルタバンクに近似させる。
音声デジタル信号をエンコードするために、MPEG AAC仕様に従ってデジタル/変換信号を量子化及び符号化し、コア層ビットストリームを生成することが好ましい。これは、低ビットレートではあるけれども高品質の音声ビットストリームを生成するには、最も効率的な知覚音声符号化アルゴリズムのうちの一つがAACであるからである。従って、AAC(AACビットストリームと称する)を用いて生成されたコア層ビットストリームのビットレートは低く、スケーラブルビットストリームがコア層ビットストリームに切り捨てられる際にも、切り捨てられたビットストリームの知覚品質は依然高いままである。その他の量子化符号化アルゴリズム/方法、例えばMPEG−1オーディオレイヤ3、又はコア層ビットストリームを生成するその他の専有符号化/量子化方法も用いることができることに留意すべきである。
コア層ビットストリームへと既に符号化された情報を除去し、残留信号(又はエラー信号)を生成するエラーマッピングは、量子化された信号の各量子化値のより低い量子化閾値(ゼロに近い閾値)を、変換信号から差し引くことにより行われる。このような量子化閾値に基づくエラーマッピング方式は、残留信号の値が常に正であるという利点があり、残留信号の振幅が量子化閾値とは独立している。これにより、複雑性が低く効率的なエンベデッド符号化スキームの実施が可能となる。しかしながら、再構成された変換信号を変換信号から差し引いて残留信号を生成することもできる。
エラー信号におけるビットプレーン符号化用の前記デジタル信号の知覚情報を決定するために、前記知覚モデルとして心理音響モデルを用いることができる。心理音響モデルは、MPEG−1オーディオで用いられる心理音響モデルI又はII(後述の文献21に記載)、或いはMPEG−4オーディオにおける心理音響モデル(後述の文献19に記載)に基づいてよい。AACの使用に応じて用いられる量子化器等の知覚量子化器を、デジタル/変換信号の量子化及び符号化に用いる際には、知覚量子化器で用いる知覚モデルを用いて、エラー信号のビットプレーン符号化用の知覚情報を決定してもよい。言い換えれば、この場合、エラー信号のビットプレーン符号化用の知覚情報を得るために別々の知覚モデルは必要ない。
エラー信号のビットプレーン符号化用の知覚情報を、コア層ビットストリーム及び上位層ビットストリームとともに更に多重化して、スケーラブルビットストリームをサイド情報として生成することが好ましい。サイド情報を用いて、エラー信号をデコーダにより再構成することができる。
エラー信号は複数のビットプレーンに配列され、各ビットプレーンは複数のビットプレーン記号を有する。
本発明の一の実施形態では、エラー信号のビットプレーンの配列又は順序が変化され或いはシフトされ、続いてビットプレーンが連続的にスキャン及び符号化される。シフトされたビットプレーンに対してビットプレーン符号化が行われる際、より知覚的に重要なビットプレーン記号からなるビットプレーンが先ず符号化されるように、ビットプレーンがシフトされる。この実施形態では、ビットプレーンにおけるすべてのビットプレーン記号は、その後に続く隣接ビットプレーンのビットプレーン記号を符号化する前に、符号化される。
本発明の他の実施形態では、ビットプレーンのビットプレーン記号は、知覚情報に基づく順にスキャン及び符号化される。言い換えれば、別のビットプレーンのビットプレーン記号を符号化する前に、あるビットプレーンにおけるすべてのビットプレーン記号が符号化されるとは限らない。複数のビットプレーンのビットプレーン記号のスキャン及び符号化の順は、より知覚的に重要なビットプレーン記号が先ず符号化されるように、知覚情報に基づき決定される。
知覚モデルにより決定されるデジタル信号の知覚情報は、エラー信号のビットプレーン符号化用の複数のビットプレーンにおける第1(又は最大)ビットプレーンM(s)(即ち、第1ビットプレーンを特定する数(指標))、及びデジタル信号の丁度可知歪み(JND)レベルの少なくとも一方を含んでよい。知覚情報は、異なるドメイン特徴(たとえば、周波数、時間、信号振幅等)毎に又は一連のドメイン特徴におけるデジタル信号に関するものであることに留意すべきである。例えば、デジタル信号が周波数ドメインに変換される際には、周波数毎の又はある周波数バンド(周波数バンドs、又はより一般的には、ドメインバンドs)値におけるデジタル信号の知覚情報は異なっていてよい。これは、特定の周波数では、信号が知覚的により重要となり得ることを示すものである。
本発明の一の実施形態では、各周波数バンドsに対応するデジタル信号の知覚有意性Ps(s)が、知覚情報として決定される。この実施形態では、エラー信号のビットプレーンに対応するデジタル信号のJNDレベルτ(s)が決定される。そして、JNDレベルτ(s)に対応するビットプレーンを、エラー信号のビットプレーン符号化用の複数のビットプレーンにおける第1ビットプレーンM(s)の指標から差し引くことにより、知覚有意性Ps(s)が生じる。知覚有意性Ps(s)を用いてビットプレーンのシフトを制御することができ、従って、より知覚的に重要なビットプレーン記号からなるビットプレーンが初めにスキャン及び符号化される。より有利なことに、知覚有意性Ps(s)を用いて、より知覚的に重要なビットプレーン記号が初めに符号化されるように、複数のビットプレーンのビットプレーン記号のスキャン及び符号化順を制御することができる。
本発明の更なる実施形態では、知覚有意性Ps(s)は正規化されて、正規化された知覚有意性Ps’(s)が形成される。この実施形態では、知覚有意性Ps(s)の関数に基づき、デジタル信号における共通の知覚有意性Ps(s)_commonが規定される。このような知覚有意性Ps(s)の関数の例には、知覚有意性Ps(s)の平均値、最大値、最小値又は正規化値が含まれる。共通の知覚有意性Ps(s)_commonを知覚有意性Ps8s)から差し引くことにより、各周波数バンドsに対して正規化された知覚有意性Ps’(s)が生成される。周波数バンドsが、少なくとも一つのゼロ以外の値の量子化信号を含む場合は、周波数バンドsは有意バンドである。そうでなければ、周波数バンドsは非有意バンドsである。有意バンドに対しては、その対応する知覚有意性Ps(s)の値は、共通の知覚有意性Ps(s)_commonの値に設定される。非有意バンドに対しては、対応する正規化された知覚有意性Ps’(s)が、コア層ビットストリーム及び上位層ビットストリームとともに多重化されて、伝送用のスケーラブルビットストリームが生成される。この正規化された知覚有意性Ps’(s)は、デコーダにおいてスケーラブルビットストリームをデコードするために用いられるサイド情報として、スケーラブルビットストリームに含まれて伝送される。
共通の知覚有意性Ps(s)_commonを規定することにより行われる知覚有意性Ps(s)の正規化は、コア層ビットストリームを生成するためにデジタル信号/変換信号を量子化する際に得られる情報を用いることにより、スケーラブルビットストリーム中に含まれて伝送されるべき知覚情報量を減少させるという利点がある。従って、知覚情報、特に正規化された知覚有意性Ps’(s)は、非有意バンドに対してのみデコーダ側へ伝送される必要がある。有意バンド用の知覚情報は、デコーダで容易に再生成できるからである。
デジタル信号の知覚情報の一部である、エラー信号のビットプレーン符号化用の複数のビットプレーンにおける第1(又は最大)ビットプレーンM(s)の指標は、デジタル信号/変換信号を量子化するために用いる最大量子化間隔から決定することができる。有意バンドに対しては、最大量子化間隔(量子化信号の各量子化値に対応する高い量子化閾値と低い量子化閾値との差異)が決定され、これに応じて、(M(s)により特定される)第1ビットプレーンが決定される。このような最大量子化間隔も、デコーダ側で決定できる。故に、(M(s)により特定される)第1ビットプレーンは、この場合、スケーラブルビットストリームの一部として(有意バンドに対して)伝送される必要はない。
デジタル信号をスケーラブルビットストリームにエンコードする方法について説明したが、本発明は、上述のようなこの方法を逆にすることで、スケーラブルビットストリームをデジタル信号にデコードする方法も含むことは理解されるであろう。
本発明の一の実施形態では、スケーラブルビットストリームをデジタル信号にデコードするデコード方法であって、スケーラブルビットストリームをコア層ビットストリーム及び上位層ビットストリームに逆多重化する逆多重化工程と、コア層ビットストリームをデコード及び逆量子化して、コア層信号を生成するデコード逆量子化工程と、前記デジタル信号の知覚情報に基づいて上位層ビットストリームをビットプレーン復号化するビットプレーン復号化工程と、ビットプレーン復号化された上位層ビットストリームと逆量子化されたコア層信号に基づきエラーマッピングを行い、再構成された変換信号を生じるエラーマッピング工程とを備え、再構成された変換信号はデジタル信号であることを特徴とするデコード方法を提供する。スケーラブルビットストリームをデコードする方法は、上述のようなデジタル信号をスケーラブルビットストリームにエンコードする方法と組み合わせるだけでなく別々に用いてよいことに留意すべきである。
デジタル信号が再構成された変換信号とは異なるドメインにある場合、再構成された変換信号を変換して、デジタル信号を生成してよい。
スケーラブルビットストリームをデコードすることによるデジタル信号の実際の生成は、スケーラブルビットストリームがエンコーダによりどのようにエンコードされたかに依存する。一例として、intMDCTを用いて、再構成された変換信号が変換され、デジタル信号が生成されてよい。MPEG AAC仕様に従って、コア層ビットストリームがデコード及び逆量子化されてよい。変換信号及びビットプレーン復号化された上位層ビットストリームを逆量子化するために用いられるより低い量子化閾値を加えてエラーマッピングが行われ、再構成された変換信号が生成される。デコーダの利点及びその他の実施は、既に説明したエンコーダと同様である。
知覚情報がサイド情報としてスケーラブルビットストリームに多重化されている場合、デジタル信号の知覚情報は、スケーラブルビットストリームの逆多重化により取得されてもよい。或いは、コア層ビットストリームが知覚的にエンコードされる場合、コア層ビットストリームをデコード及び逆量子化することで取得される知覚情報は、上位層ビットストリームのビットプレーン復号化に用いられてもよい。
本発明の一の実施形態では、上位層ビットストリームを連続的にビットプレーン復号化して、複数のビットプレーン記号からなる複数のビットプレーンが生成され、ビットプレーンは、デジタル信号の知覚情報に基づきシフトされて、ビットプレーン復号化上位層ビットストリームが生成される。
本発明の他の実施形態では、上位層ビットストリームを、デジタル信号の知覚情報に基づく順にビットプレーン復号化して、複数のビットプレーン記号からなる複数のビットプレーンを生成し、これによりビットプレーン復号化された上位層ビットストリームが生成される。
デジタル信号の知覚情報は、(1)上位層ビットストリームのビットプレーン復号化が開始される際の上位層ビットストリームに対応するビットプレーンM(s)と、(2)デジタル信号の丁度可知歪み(JND:Just Noticeable Distortion)レベルとのうちの少なくとも一方である。sはデジタル信号の周波数バンドに相当する。
上位層ビットストリームのビットプレーン復号化が開始される際の前記上位層ビットストリームに対応する前記ビットプレーンM(s)を、前記コア層ビットストリームを反量子化するために用いる最大量子化間隔から決定する。
本発明の第2の態様は、スケーラブルビットストリームをデジタル信号にデコーダする方法に関するだけでなく、コンピュータプログラム、コンピュータ読取可能媒体、及び該方法を実施する装置を含むものである。
本発明の各種実施例及び実施について、図面を参照して詳細に説明する。
図1は、本発明の実施例に係るエンコーダ100を示す。
エンコーダ100は、スケーラブルビットストリームを生成する働きをし、二つの異なる層、即ち、コア層ビットストリームを生成するコア層と、上位層ビットストリームを生成するロスレス上位(LLE:Lossless Enhancement)層とからなる。
エンコーダは、ドメイン変換器101、量子化器102、エラーマッピングユニット103、知覚ビットプレーンコーダ104及びマルチプレクサ105を備える。
エンコーダ100では、まず、ドメイン変換器101により、デジタル信号が周波数ドメイン等のような適切なドメインに変換される。その結果、変換信号が生成される。変換信号係数は、量子化器102により量子化され、そして符号化されて、コア層ビットストリームが生成される。LLE層に対応するエラーマッピングユニット103によりエラーマッピングが行われ、変換信号係数から、コア層ビットストリームを形成するためにコア層において使用又は符号化された情報が除去される。その結果生じる残留成分又はエラー信号、特にエラー係数は、知覚ビットプレーンコーダ104によりビットプレーン符号化され、エンベデッドLLEビットストリームが生成される。このエンベデッドビットストリームは、エンコーダ100若しくは対応するデコーダ(図2に示し、且つ以下に記載するデコーダ200)又は通信チャンネルにおいて、要求される或いはレート/フィデリティに適合ように、低ビットレートに更に切り捨てられる。知覚モデル106は、エラー係数のビットプレーン符号化を制御するために用いられる。従って、知覚的により有意なエラー係数のビットが先ず符号化される。
最後に、取得されたLLE層ビットストリームは、マルチプレクサ105によりコア層ビットストリームと多重化され、スケーラブルビットストリームが生成される。加えて、エラー係数のビットプレーン符号化を制御するための知覚情報も、対応するビットプレーンデコーダがエラー係数を正しい順序で再構成できるように、サイド情報として伝送されてもよい。
LLEビットストリームを低レートに切り捨てる場合、デコード信号は元の入力信号のロッシーバージョンであろう。
図2は本発明の実施例に係るデコーダ200を示す。
デコーダ200は、エンコーダ100により生成されたスケーラブルビットストリームをデコードし、エンコーダ100によりエンコードされたデジタル信号を再構成する。
デコーダ200は、ドメイン変換器201、逆量子化器202、エラーマッピングユニット203、知覚ビットプレーンデコーダ204、及びデマルチプレクサ205を備える。
デマルチプレクサ205は、入力としてスケーラブルビットストリームを受け取り、このスケーラブルビットストリームを、エンコーダ100により生成されるようなコア層ビットストリームと上位層ビットストリームとに分離する。コア層ビットストリームは、逆量子化器202によりデコード及び逆量子化され、コア層信号を生成する。上位層ビットストリームは、知覚ビットプレーンデコーダ204により、知覚モデル206により与えられる知覚情報に基づいて知覚的にビットプレーン復号化される。続いて、エラーマッピングユニット203によりコア層信号を用いてエラーマッピングが行われ、上位層信号が生成される。最後に、上位層信号は、ドメイン変換器201によりデジタル信号のドメインに変換され、再構成されたデジタル信号である上位層変換信号が取得される。
エンコーダ100及びデコーダ200により実施される処理を、次に詳細に説明する。
入力信号は、通常、コア層ビットストリームを形成するために量子化器102(コア層エンコーダの一部)により量子化される前に、ドメイン変換器101により周波数ドメインに変換される。離散コサイン変換(DCT)、修正離散コサイン変換(MDCT)、整数型MDCT(IntMDCT)又は高速フーリエ変換(FFT)等の各種の変換関数を用いて、入力信号を周波数ドメインに変換してよい。
MPEG−4 AACエンコーダをコア層エンコーダ(音声信号用)として用いる場合には、後述の文献1に記載のように、入力音声信号を周波数ドメインに変換するためにMDCTが通常用いられる。後述の文献13では、MPEG−4 AACエンコーダと共に用いられる変形離散コサイン変換(MDCT)フィルタバンクに対して、整数型MDCT(IntMDCT)が復帰可能な近似法として提案された。IntMDCTを実施するために一般的に用いられる方法は、MDCTフィルタバンクを、次の数1に示されるギブンス回転に因数分解することである。
Figure 2007509362
これは更に、数2に示すように3つのステップに因数分解される。
Figure 2007509362
各ステップは、最も近い整数に丸める処理r:R→Zを行いつつ、整数マッピングに対する復帰可能な整数により近似できる。例えば、最後のステップは数3により近似される。
Figure 2007509362
数3は、数4により可逆的に回復される。
Figure 2007509362
よって、上述のような復帰可能な整数を用いてすべてのギブンス回転を実施することにより、IntMDCTが取得される。
デコーダでは、ドメイン変換器201によりintMDCTが再び用いられて、上位層信号が(再構成された)デジタル信号に変換される。
コア層では、変換信号係数c(k)(但し、k=1,...,1024は、コア層ビットストリームのフレーム長である)が、量子化器102により量子化され、コア層ビットストリームに符号化される。入力音声信号の内容については、MPEG−4 ACCコーダ、MPEG−1レイヤ3オーディオ(MP3)コーダ又は任意の専有音声コーダの量子化値に従って、変換信号係数を量子化してよい。
MPEG−4 ACCコーダをIntMDCTとともに用いる際には、まず、変換信号係数(IntMDCT係数としても知られる)c(k)が、数5のように正規化され、正規化された出力をMDCTフィルタバンクの出力に近似させる。次に、正規化されたIntMDCT係数c’(k)は、例えば数6で示されるAAC量子化器(後述の文献19参照)に従って、量子化及び符号化される。
Figure 2007509362
Figure 2007509362
ここで、数7の記号は、浮動型オペランドを整数に切り捨てるフロアリング処理を意味する。
Figure 2007509362
i(k)はAAC量子化係数である。scale_factor(s)は、係数c(k)が属するスケールファクタバンドsのスケールファクタである。スケールファクタは、人間の聴覚系のマスキング閾値で量子化ノイズが最もマスクされるように、ノイズシェイピング法によって順応的に調整できる。このノイズシェイピング法に広く採用される手法は、後述の文献1に詳細に記載されるような、ネスト量子化−コーディングループである。
量子化係数i(k)は、例えば後述の文献17に記載されているようなハフマン符号又はBSAC(Bit−Sliced Arithmetic Code)を用いて、ノイズを出さずに符号化される(この実施例においては、量子化器102により符号化される)。BSACは、ビットレートスケーラビリティがコア層ビットストリームにおいて必要とされる場合に好ましい。スケールファクタは、例えば、後述の文献1に記載のDPCMエンコード処理により又はハフマン符号を用いて、別個にエンコードされる。そして、AACビットストリームのシンタックに従い、符号化情報のすべてを多重化することにより、スコア層ビットストリームを生成することができる。
MPEG AACに関するより総合的な説明は、後述の文献1又は19中のMPEG AACに関する国際標準書類に記載されている。
MPEG−4 AACに準拠したビットストリームの埋め込み(エンベデッド)機構を説明したが、後述の文献20に記載されているMPEG1/2レイヤI、II、III(MP3)、ドルビーAC3又はソニーのATRACに専有のエンコーダ等の、その他のコーダに準拠するビットストリームを用いることもできることに留意すべきである。
量子化器102がMPEG AACコーダに従って作用する場合、逆量子化器202は、コア層ビットストリームをデコードし逆量子化するデコーダ200内のMPEG AACデコーダに準じて作用することが好ましい。詳細には、上位層信号を生成するデコーダ200のエラーマッピングユニット203により行われるエラーマッピングに用いられるコア層信号が、逆量子化器202を用いて生成される。
しかしながら、MP3又はその他の専有デコーダ等のその他の仕様に準じた逆量子化器をデコーダ200において用いてよいことに留意すべきである。
LLE層では、コア層ビットストリームへと既に符号化された情報を除去するために、エラーマッピング処理が行われる。このようなエラーマッピング処理を行うために考えられる手法は、各量子化係数のより低い(ゼロに近い)量子化閾値を、対応する変換入力信号の係数から差し引くことである。
これは、次式で例示できる。
e(k)=c(k)−thr(k)
但し、thr(k)は、c(k)に対するより低い(ゼロに近い)量子化閾値であり、e(k)は、エラー信号を表すエラー係数である。
MPEG−4 AACコーダを量子化器として用いる場合、数8となる。
Figure 2007509362
実際の用途では、ロバスト再構成を確保するために、整数i(k)から整数thr(k)までのマッピングが、照合表を用いて行われてよい。上記の数式から明らかなように、合計4つの表が、スケールファクタの異なる値に必要である(ビットシフトにより係Modulus4を有する場合、異なる値のスケールファクタ間で同じ表を共有することが可能である)。ここで、各表は、Modulus4を有する一連のスケールファクタのうちの任意のスケールファクタに対して、i(k)のあらゆる値と、これに対応するthr(k)との間のマッピングを含む。
後述の文献3に記載の変換信号係数から変換入力信号係数の再構成係数を差し引くことでエラーマッピング処理を行うこともできる。これは数9で例示できる。
Figure 2007509362
但し、数10の記号は、再構成された変換信号係数である。
Figure 2007509362
一般に、次式に基づくエラーマッピング処理を行うこともできる。
e(k)=c(k)−f(k)
但し、f(k)は、次式のようなc(k)に対応する任意の関数である。
f(k)=1/2(thr(k+1)−thr(k))
明らかに、コア層において既に有効であるc(k)に対して(thr(k)≠0)、IntMDCT残留成分e(k)の符号をコア層再構成から決定できる。故に、その振幅のみがLLE層で符号化される必要がある。加えて、大抵の音声信号に対して、数11の確率密度関数(pdf:Probability Density Function)を有するラプラスランダム変数によりc(k)を近似できることは、よく知られている。
Figure 2007509362
但し、σはc(k)の分散値である。ラプラス確率密度関数の「無記憶」性から、e(k)の振幅が数12のように幾何学的に分散していることを容易に検証できる。
Figure 2007509362
但し、分散パラメータθ(k)は、c(k)の分散値及びコア層量子化器のステップサイズにより決定される。この性質により、エラー信号をエンコードするためのビットプレーンゴロム符号(BPGC)0等の、非常に効率的なビットプレーン符号化スキームを利用することができる。
デコーダ200では、次式に従ってエラーマッピングユニット203により行われるエラーマッピング処理により、変換信号の係数を再構成してよい。
c(k)=e’(k)+thr(k)
但し、e’(k)は、エンコーダ100のエラー係数e(k)に対応するビットプレーン復号化された上位層ビットストリームを示す復号化エラー係数である。故に、復号化エラー係数e’(k)(LLEビットストリームを低レートに切り捨てる場合に可能性があるのは、ロッシーバージョン)と、エンベデッドコア層(AAC)ビットストリームに含まれる量子化指標i(k)を有するエンコーダにおいて同様に生成された量子化閾値thr(k)とから、変換信号係数c(k)を再生成可能であることがわかる。
エンコーダ100と同様に、デコーダ200の変換信号係数c(k)を、復号化エラー係数e’(k)とコア層ビットストリームの再構成係数とを用いて(加えて)、生成してもよい。また、変換信号係数c(k)は、復号化エラー係数e’(k)とc(k)の関数とを用いて(加えて)生成してよい。
最終エンベデッドロスレスビットストリームのロスレス部分についてスケーラブル化するために、LLE層において、ビットプレーン符号化、即ち、後述の文献3の音声符号化又は後述の文献5の画像符号化で広く採用されているエンベデッド符号化技術を用いる知覚ビットプレーンコーダ104により、残留成分又はエラー信号が更に符号化される。
一般的なビットプレーン符号化は、後述の文献4及び15に説明されている。入力n次元データベクトル ={x、...、x}を考える。但し、xは、数13にて示されるアルファベットのランダム源から抽出される。
Figure 2007509362
明らかに、xは、数15に示す2値化された符号sと振幅記号bi,j∈{0,1}とを含むバイナリビットプレーン記号により、数14に示すようにバイナリ形式で表すことができる。
Figure 2007509362
Figure 2007509362
実際には、ベクトル の最大ビットプレーンMから、ビットプレーン符号化を開始することができる。ここで、Mは数16を満たし、 が整数ベクトルである場合にビットプレーン0で終了する整数である。
Figure 2007509362
本発明の一の実施例に係る例であって、かつ知覚ビットプレーンコーダ104及び知覚ビットプレーンデコーダ204により行われる例として、ビットプレーン符号化及び復号化工程を、図3を参照して次に説明する。
図3は、上述のビットプレーン符号化工程(BPC:Bit Plane Coding)を示す。ここで、各入力ベクトルは、先ず、2値化された符号及び振幅記号に分解され、次にこれらが、ビットプレーンスキャンユニット301により所望の順序でスキャンされ、エントロピーコーダ302(例えば、算術符号、ハフマン符号又はランレングス符号として)により符号化される。加えて、例えば入力信号のラプラス分布に基づく統計モデル303を通常用いて、符号化すべき2値化された記号の夫々毎に確率割当が決定される。対応するデコーダでは、データの欠陥が逆転される。即ち、エントロピーエンコーダ302の出力が、対応する統計モデル304を用いるエントロピーデコーダ303でデコードされ、その結果は、ビットプレーン再構成ユニット304によりビットプレーンとして再構成される。ここで、データベクトルのビットプレーンを再構成するためにデコードされる符号及び振幅記号は、エンコーダにおけるスキャン順序に従っている。
上述のようなビットプレーン符号化システムを有することの最も意義のある利点は、得られる圧縮ビットストリームを任意の所望レートに容易に切り捨てることができることである。ここで、数17にて示されるデータベクトルを、この切り捨てられたビットストリームからデコードされた部分的再構成ビットプレーンより得ることもできる。最良の符号化性能を発揮するために、エンベデッド原理(後述の文献24を参照)がBPCに通常採用される。これに従って、ビットプレーン記号は、単位レートあたりの最終歪みに対して最も多大な影響を与える記号が常に最初に符号化されるように、レート歪みの傾きが減少する順序で符号化される。
Figure 2007509362
ビットプレーンスキャン順序の選択は、所望の歪み測定に依存する。平均二乗誤差(MSE)又は平方誤差関数の期待値が、数18に示すような歪み測定として用いられる。
Figure 2007509362
但し、数19の記号は歪み値であり、xは元のデータベクトルであり、数20の記号は、デコーダにおけるxの再構成ベクトルである。
Figure 2007509362
Figure 2007509362
後述の文献24から得られる結果は、非常に歪んだビットプレーン記号の分布をもつソース以外のほとんどのソースに対する逐次ビットプレーンスキャン及び符号化処理により、エンベデッド原理が満たされることを示している。
簡単な逐次ビットプレーンスキャン及び符号化方式の例は、次のステップを含む。
1.最有意ビットプレーンj=M−1から開始する。
2.bi,M−1=bi,M−2=...=bi,j+1=0であるbi,jのみをエンコードする。有意スキャンにおいてbi,j=1の場合、sをエンコードする(significance propagationパス)
3.significance propagationパスにおいてエンコードされないbi,jをエンコードする(Reninementパス)。
4.ビットプレーンj−1まで進む。
表1.ビットプレーンスキャン及び符号化方式
上記処理は、通常予め規定されたレート/歪み制限である、特定の停止基準に至るまで繰り返される。加えて、ビットプレーン記号に均一でない分布が見つかった場合には、significance propagationパスにおける符号化順の更なる調整が必要とされ得る。
上記逐次符号化処理の一例を、4次元の、例えば{9,−7,14,2}を有するデータベクトルxを考慮して示す。よって、その最有意ビットプレーン4からビットプレーン符号化される。すべての要素がまだ有意ではないので、significance propagationパスから開始される。(Xは、バイパス記号を意味する)。符号は、次のように符号化される。即ち、正を1として符号化し、負を0として符号化する。
Figure 2007509362
従って、出力バイナリストリームは、11011010001001111110である。次に、これがエントロピー符号化され、デコーダに伝送される。デコーダでは、元のデータベクトルのビットプレーン構造が再構成される。全バイナリストリームがデコーダで受信される場合、元のデータベクトルのビットプレーンは復帰可能であり、よって、元のデータベクトルをロスレスに再構成することができる。バイナリストリームのサブセット(最有意部分)のみが受信される場合も、デコーダは、元のデータベクトルの一部のビットプレーンについて復帰することができる。従って、元のデータベクトルの再構成(量子化)バージョンは粗くなる。
以上は、ビットプレーンスキャン符号化処理のほんの簡単な例である。実際には、significance propagationパスを更に細分して、JPEG2000におけるビットプレーン符号化工程等のデータベクトルにおける要素の統計的相関、又は後述の文献4に記載のエンベデッド音声符号器(EAC:Embedded Audio Coder)における要素の統計的相関を検討することができる。
上記逐次ビットプレーンスキャン符号化方式は、MSE性能を最適化する試みを与えるだけである。音声、画像又は映像符号化の領域では、MSEの代わりに知覚の歪みを最小にすることが、通常、再構成された音声、画像又は映像信号において最適な知覚品質を得るためのより効率的な符号化方法である。従って、エラー信号の逐次ビットプレーン符号化は、疑いなく、次善の選択肢である。
エンコーダ100では、好ましくは、各周波数バンドsが連続した多数のエラー係数を含むように、エラー係数は周波数バンドにグループ化される。(知覚コーダを量子化器102として用いる場合には、スケールファクタバンドグループ化は、量子化器102において採用されるバンドグループ化に基づいていてよい。しかしながら、その他のバンドグループ化も可能である。)
量子化器からの量子化係数thr(k)がゼロではないような、周波数バンドsにエラー係数が存在する場合、周波数バンドsは有意であるといえる。言い換えれば、e(k)が周波数バンドのエラー係数である場合、即ち、e(k)=c(k)−thr(k)の場合、周波数バンドsは有意であり、thr(k)≠0であり(i(k)=0のときthr(k)=0)、故にe(k)=c(k)である。そうでなければ、周波数バンドsは非有意とみなされる。
エラー係数のビットにおける知覚有意性は、周波数位置iにおける丁度可知歪み(JND:Just Noticeable Distortion)のレベルにより決定できる。このJNDのレベルTは、心理音響モデル(I又はII)又は任意の専有知覚モデル等の、知覚モデルから決定できる。コア層ビットストリームの形成に知覚量子化器を用いる場合、量子化器で用いられる知覚モデルを用いて、エラー係数の知覚ビットプレーン符号化のためのJNDを生成してよい。
簡単にするために、同じ周波数バンドsでのエラー係数のビットにおける知覚有意性を、同じ値に設定できる。
次に、知覚ビットプレーン符号化において考えられる実施態様を、図4を参照して説明する。
図4は、本発明の実施例に係るエンコーダ400を示す。
エンコーダ100と同じように、エンコーダ400は、ドメイン変換器401、量子化器402、エラーマッピングユニット403、知覚ビットプレーンコーダ404(知覚モデル406を使用)、及びマルチプレクサ405を備える。
知覚BPCブロック、即ち、知覚ビットプレーンコーダ404は、ビットプレーンシフティングブロック407と従来型BPCブロック408とを備える。
ビットプレーンシフティングブロック407では、ビットプレーンが知覚的に移動され、この知覚的に移動されたビットプレーンが、BPCブロック408において、従来の逐次スキャン及び符号化方法で符号化される。
次の数21に示すような(修正された)知覚的に重み付けされた歪み測定を考慮する。
Figure 2007509362
知覚音声符号化においては、通常、音声信号は、データベクトル が変換音声信号であって、重み付け関数w(x)が異なる周波数位置iにおけるxの重要度である、即ち、w(x)=1/Tであるように、周波数ドメインで量子化されて符号化される。
上記知覚的に重み付けされた歪み関数は、数22のように書き直されてよい。
Figure 2007509362
但し、x’は数23により示される。
Figure 2007509362
故に、重み付け平方誤差関数は、拡張ベクトル={x’,...,x’}に関する平方誤差関数となる。従って、単純にの逐次ビットプレーン符号化を行うことにより、xの知覚的に最適化された符号化を達成することができる。対応するデコーダでは、数24の記号により示されるビットプレーン復号化データベクトルの各要素を、数25の記号により示される再構成データベクトルを得るために、数26に示すように拡張しなおすことができる。
Figure 2007509362
Figure 2007509362
Figure 2007509362
明らかに、重みTがデコーダで知られていない場合は、サイド情報としてデコーダへ伝送することが好ましい。
を更に量子化し、数27となるように、2の偶数べき乗とする。
Figure 2007509362
但し、τ=1/2(log)であり、よって、拡張データベクトルは、元のデータベクトルにおける各要素を数28のようにビットシフティングすることにより得ることができる。
Figure 2007509362
これは、τによりxについて右寄せ動作(right shifting operation)を行うことにより容易に得られる。例えば、xが00010011であり、τが−2の場合、拡張データベクトル要素x’は01001100である。τが2の場合、00000100.11である。
このように、エラー係数のビットプレーンは、逐次ビットプレーン符号化がシフトビットプレーンについて行われる際に、(最も高いMSEを有する代わりに)より知覚的に有意なビットが先ずエンコードされるような方法で、知覚的にシフトされる。
明らかに、元のデータベクトルの各要素が有限長を有する整数の場合に、例えば、の各要素が最大ビットプレーンLを有する場合に、スケーラブル化されるベクトルにおけるすべてのx’がビットプレーン−τからL−τまでビットプレーン符号化されるならば、のロスレス符号化を達成することができる。
前述のように、JNDレベル等の知覚有意性に関する情報が、知覚モデルからビットプレーンシフティングブロックへ提供されうる。
ビットプレーン符号化工程では、最大ビットプレーンM(s)を用いて、ビットプレーンスキャン及び符号化を開始すべき開始ビットプレーンを特定することができる。最大ビットプレーンM(s)及びτは、デコーダがビットストリームを正確にデコードすることができるように、スケーラブルビットストリームにおけるサイド情報として、対応するデコーダに伝送されることが好ましい。サイド情報量を減らすために、M(s)及びτiを、エンコーダの同じスケールファクタバンドsに対して同じ値に制限してよい。
各周波数バンドsにおける最大ビットプレーンM(s)の値は、数29を用いてエラー係数e(k)から決定できる。
Figure 2007509362
更に、各有意周波数バンドsにおけるエラー係数の最大絶対値max(|e(k)|)は、数30に示すように、知覚量子化器の量子化間隔(quantizer interval)によって境界される。
Figure 2007509362
従って、これにより、数31で決定されるべき各有意周波数バンドsに対する最大ビットプレーンM(s)が得られる。
Figure 2007509362
知覚量子化器i(k)の量子化係数はデコーダに知られているので、有意周波数バンドsに対する最大ビットプレーンM(s)の値を、デコーダにサイド情報として伝送する必要はない。
最大ビットプレーンM(s)の値も、エンコーダ及びデコーダにおいて予め規定してよい。故に、サイド情報として伝送する必要はない。
図5は、本発明の実施例に係るデコーダ500を示す。
デコーダ500は、ビットプレーンシフティングと従来型(逐次)ビットプレーン符号化を含む知覚ビットプレーンデコーダを備える。
デコーダ200と同様に、デコーダ500は、ドメイン変換器501、逆量子化器502、エラーマッピングユニット503、知覚ビットプレーンデコーダ504(知覚モデル506を使用)、及びデマルチプレクサ505を備える。
知覚ビットプレーン符号器404と同様に、知覚ビットプレーンデコーダ504は、ビットプレーンシフティングブロック507と従来型BPCブロック508とを備える。
エンコーダ400により生成された上位層ビットストリームは、連続的逐次方法(エンコーダ400と同じ逐次ビットプレーンスキャン方式)で、デコーダ500によりビットプレーン符号化され、ビットプレーンが再構成される。再構成されたビットプレーンは、受信した又は再生成された値τに基づいて、エンコーダ400とは逆の方法でシフトされ、ビットプレーン復号化上位層ビットストリームを示す復号化エラー係数e’(k)が生成される。
図6は、本発明の実施例に係るエンコーダ600を示す。
エンコーダ600は、知覚ビットプレーン符号化を用いる。
エンコーダ600は、ドメイン変換器(intMDCT)601、量子化器(ACC量子化符号化器)602、エラーマッピングユニット603、知覚有意性算出ユニット604(心理音響モデル605を使用)、知覚ビットプレーン符号化ユニット606、及びマルチプレクサ607を備える。
この実施において、ビットプレーン及びビットプレーン記号のスキャン順序は、連続している必要はないが、異なる周波数バンドに対応するビットプレーン記号における知覚の重要性に基づくものである。ビットプレーン記号における知覚の重要性は、知覚有意性及びビットプレーン復号化に対する第1(最大)ビットプレーン等の、知覚情報に関連するパラメータを算出することにより決定される。知覚情報パラメータの算出は、知覚有意性算出ブロック、即ち、知覚的ビットプレーン符号化ユニット604として表される。
異なる周波数バンドに対応するビットプレーン記号の知覚の重要性又は特に知覚有意性を決定する方法は多数ある。広く採用されている一の方法は、入力デジタル信号における心理音響モデル、例えば後述の文献19に記載の心理音響モデル2等を用いることである。心理音響モデルを用いて決定される各周波数バンドに対する丁度可知歪み(JND)レベルT(s)は、τ(s)=1/2(log(T(s))のようにビットプレーンレベルτ(s)の単位に変換できる。
しかしながら、本発明は、T(s)又はτ(s)をどのように得ることができるかに関する方法を制約するものではない。
ここで、Ps(s)が周波数バンドsの知覚有意性を表すとする。これは、Ps(s)=M(s)−τ(s)のようにM(s)からτ(s)までの距離から決定することができる。
更に、ノイズレベル又はIntMDCTエラー係数e(k)のレベルは、(コアコーダにおけるノイズシェイピング機構の結果)有意バンドに対するJNDレベルに対して変化が少ない傾向にあることに留意することができる。言い換えれば、Ps(s)の値は、もし同一でなければ、有意周波数バンドに対して非常に近いものであろう。この事実は、共通ファクタPs_commonをすべての周波数バンドで共有することにより、本発明に係る方法において検討することができる。Ps_commonの選択として、有意なすべてのsに対する平均値、最大値、最小値又はその他のPs(s)の妥当な関数が考えられる。よって、Ps(s)を、Ps’(s)=Ps(s)−Ps_commonのように正規化できる。
有意バンドsに対するPs’(s)はゼロであることが知られているので、デコーダに伝送される必要はない。そうでなければ、非有意バンドsに対するPs’(s)は、対応するデコーダにサイド情報として伝送されることが好ましい。
その他の実施例においては、有意バンドがない場合、Ps_commonを0に設定できる。
知覚符号化に対する必要性に応えるために、コアエンコーダにおいてノイズシェイピング法を用いることもできる。よって、任意のノイズシェイピング又は上位層における知覚的有意識別を更に実施する必要はない。このような場合、Ps’(s)=0をすべてのsに対して設定することができる。通常、これらがすべてゼロであることがデコーダに知られている場合には、デコーダに伝送する必要はない。
知覚ビットプレーン符号化機構において可能な実施を、次の擬似符号を用いて表すことができる。ここで、周波数バンドの総数は、s_totalとして示される。
1.最大Ps’(s)を有する周波数バンドsを見つける。
2.バンドsにおいて、e(k)に対するビットプレーンM(s)のビットプレーン記号をエンコードする。
3.M(s)=M(s)−1、Ps’(s)=Ps’(s)−1
4.数32に対するバンドsが存在する場合、上記1に進む。
Figure 2007509362
最大ビットプレーンM(s)を得る方法をここに示す。
AAC量子化器等の知覚量子化器が用いられる場合、有意バンドに対するM(s)は、最大量子化間隔から決定できる。詳細には、M(s)は数33を満足する整数である。
Figure 2007509362
この場合、i(k)はデコーダに知られているので、M(s)をデコーダに伝送する必要はない。
非有意バンドに対するM(s)については、数34のようにe(k)から算出できる。
Figure 2007509362
また、これらの周波数に対するM(s)は、サイド情報としてデコーダに伝送されることが好ましく、このような情報はコア層ビットストリームに含まれない。
最大ビットプレーンM(s)の値もまた、エンコーダ600及び対応するデコーダにおいて予め規定されてよく、故に、サイド情報として伝送される必要はない。
ある所望のノイズシェイピング目標に対して、ビットプレーン符号化手法におけるPs(s)を検討するためのその他の代替手法も可能である。一般に、Ps(s)は、M(s)及びτ(s)の任意の関数、例えばPs(s)=M(s)−2τ(s)又はPs(s)=(M(s)−τ(s))/2により得ることもできる。
図7は、本発明の実施例に係るデコーダ700を示す。
デコーダ700は、コーダ600の対応するデコーダである。ここでは、上述のような知覚ビットプレーンスキャン方式を用いて、知覚ビットプレーン復号化が行われる。
従って、デコーダ700は、ドメイン変換器(逆intMDCT)701、逆量子化器(ACC逆量子化デコーダ)702、エラーマッピングユニット703、知覚有効性算出ユニット704、知覚ビットプレーン復号化ユニット706及びデマルチプレクサ707を備える。
デコーダ700では、有意バンドに対して、’Ps’(s)をゼロに設定し、エンコーダと同じ方法で、AAC量子化指標i(k)からM(s)を算出できる。即ち、数35に示すようにM(s)を算出できる。
Figure 2007509362
非有意バンドに対しては、伝送されたサイド情報から、Ps(s)及びM(s)を簡単に回復できる。一旦Ps(s)及びM(s)がすべての周波数バンドに対して回復されると、受け取られたビットストリームをデコードすることにより、数36の記号により示されるIntMDCTエラー係数を容易に再構成でき、そのビットプレーン記号を、エンコーダ700と全く同じ順序で再構成できる。
Figure 2007509362
例えば、上述のエンコードの例をデコードする工程は、
1.最大’Ps’(s)を有する周波数バンドsを見つける。
2.バンドにおいて数35の記号により示されるIntMDCTエラー係数に対するビットプレーンM(s)のビットプレーン記号をデコードする。
3.M(s)=M(s)−1、Ps’(s)=Ps’(s)−1
4.数37に対するバンドsが存在する場合、上記1に進む。
Figure 2007509362
エラー係数のビットプレーン符号化に対する最大ビットプレーンの決定
有意バンドs(即ち、数38により示されるエラー係数)に対して、e(k)の最大絶対値は、数39に示すようにAAC量子化器における量子化間隔により境界される。
Figure 2007509362
即ち、
Figure 2007509362
従って、最大ビットプレーンM(k)は、数40を用いて決定できる。
Figure 2007509362
i(k)は既にデコーダに知られており、またデコーダはthr(k)を再生成できるので、M(k)をデコーダに伝送する必要はなく、故に有意バンドsに対するi(k)からM(k)が得られる。
非有意バンドに対しては、M(k)をe(k)から数41のように算出できる。
Figure 2007509362
また、算出されたM(s)は、上位層ビットストリームとともに、正確にビットプレーン復号化すべき上位層ビットストリームに対するサイド情報として伝送されることが好ましい。
サイド情報量を減らすために、更にM(s)は、コア層量子化器の同じスケールファクタバンドsに対するkに対して同じ値を有するように制限してよい。従って、M(k)をM(s)として示してもよい。
デコーダ700では、エラー信号に対応するエラー係数を、M(s)に基づくエンコーダと同じビットプレーンスキャン方式を用いた上位層ビットストリームのビットプレーン復号化により再構成できる。有意バンドに対して、M(s)は、数42を用いて再生成できる。
Figure 2007509362
非有意バンドに対しては、デコーダは、エンコーダによりサイド情報として伝送されたM(s)を用いる。
<文献1> M. Bosi and et al, "ISO/IEC Mpeg-2 Advanced Audio Coding", J. Audio Eng. Soc., Vol. 45, No. 10, pp. 789-814, 1997 OCT.
<文献2> Jr. Stuart and et. al., "MLP lossless compression, "AES 9th Regional Convention Tokyo.
<文献3> R. Geiger, J. Herre, J. Koller, and K. Brandenburg, "INTMDCT - A link between perceptual and lossless audio coding," IEEE Proc. ICASSP 2002.
<文献4> J. Li, "Embedded audio coding (EAC) with implicit auditory masking", ACM Multimedia 2002, Nice, France, Dec. 2002
<文献5> T. Moriya, N. Iwakami, T. Mori, and A. Jin, "A design of lossy and lossless scalable audio coding," IEEE Proc. ICASSP 2000.
<文献6> T. Moriya and et. al., "Lossless Scalable Audio Coder and Quality Enhancement, " Proceeding of ICASSP 2002.
<文献7> M. Hans and R.W. Schafer, "Lossless Compression of Digital Audio," IEEE Signal processing magazine. Vol. 18, No. 4, pp. 21-32, 2001.
<文献8> Lin Xial, Li Gang, Li Zhengguo, CHia Thien King, Yoh Ai Ling, "A Novel Prediction Scheme for Lossless Compression of Audio Waveform", Proc. IEEE ICME2001, Aug. Japan.
<文献9> Shorten: http://www.softsound.com/Shorten.html
<文献10> WaveZip: http://www.gadgetlabs.com/wavezip.htmp
<文献11> LPAC: http;//www-ft.ee.tu-berlin.de/~liebchen/
<文献12> Wave Archiver: www.ecf.utoronto.ca/~denlee/wavarc.html
<文献13> R. Geiger, T. Sporer, J. Koller, and K. Brandenburg," Audio Coding based on Integer Transforms," 111th AES Convention, Sep. 2001.
<文献14> J. Johnston, "Estimation of Perceptual Entropy," Proc. ICASSP 1988.
<文献15> R. Yu, C. C. Ko, X. Lin and S. Rahardja, "Bit-plane Golomb code for sources with Laplacian distributions, " proceeding of ICASSP 2003.
<文献16> Monkey's Audio, http://www.monkeysaudio.com
<文献17> S. H. Park et al., "Multi-Layer Bit-Sliced Bit Rate Scalable MPEG-4 Audio Coder", presented at the 103th Convention of the AES, New York, Sep. 1997 (preprint 4520)
<文献18> Ralf Geiger and et. al., "FINE GRAIN SCALABLE PERCEPTUAL AND LOSSLESS AUDIO CODING BASED ON INTMDCT," Proceeding of IDASSP 2003.
<文献19> ISO/IEC 14496-3 Subpart 4, Information Technology - Coding of Audiovisual Objects, Part 3. Audio, Subpart 4 Time / Frequency Coding, ISO/JTC 1/SC 29/WG11, 1998
<文献20> T. Painter, A. Spanias, "Perceptual Coding of Digital Audio", IEEE Proceedings, vol. 88, no. 4, Apr 2000.
<文献21> ISO/IEC 11172-3, "CODING OF MOVING PICTURES AND ASSOCIATED AUDIO FOR DIGITAL STORAGE MEDIA AT UP TO ABOUT 1.5 MBIT/s, Part 3 AUDIO
<文献22> Westen, S. J. P., R. L. Lagendijk, and J. Biemond, "Optimization of JPEG color image coding using a human visual system model", SPIE conference on Human Vision and Electronic Imaging
<文献23> Westen, S. J. P., R. L. Lagendijk, and J. Biemond, "Spatio-Temporal Model of Human Vision For Digital Video Compression," SPIE Proceeding of Electronic Imaging 97.
<文献24> J. Li and S. Lie, "An embedded still image coder with rate-distortion optimization," IEEE Trans. On Image Processing, vol. 8, no. 7, pp. 913-924, July 1999
本発明の実施例に係るエンコーダを示す図である。 本発明の実施例に係るデコーダを示す図である。 ビットプレーン符号化工程の構造を例示する図である。 本発明の実施例に係るエンコーダを示す図である。 本発明の実施例に係るデコーダを示す図である。 本発明の実施例に係るエンコーダを示す図である。 本発明の実施例に係るデコーダを示す図である。

Claims (30)

  1. デジタル信号をスケーラブルビットストリームにエンコードするエンコード方法であって、
    前記デジタル信号を量子化し、量子化された信号をエンコードしてコア層ビットストリームを形成する量子化工程と、
    前記デジタル信号及び前記コア層ビットストリームに基づきエラーマッピングを行い、前記コア層ビットストリームにエンコードされた情報を除去して、エラー信号を生じるエラーマッピング工程と、
    知覚モデルを用いて決定される前記デジタル信号の知覚情報に基づき前記エラー信号をビットプレーン符号化し、上位層ビットストリームを生じるビットプレーン符号化工程と、
    前記コア層ビットストリーム及び前記上位層ビットストリームを多重化し、前記スケーラブルビットストリームを生成する多重化工程と
    を備えることを特徴とするエンコード方法。
  2. 前記デジタル信号を適切なドメインに変換する変換工程を更に備えており、
    前記変換信号は、前記量子化された信号をエンコードする前に、前記量子化された信号を生成するために量子化されることを特徴とする請求項1に記載のエンコード方法。
  3. 前記デジタル信号の知覚情報を、前記コア層ビットストリーム及び前記上位層ビットストリームとともに更に多重化して、前記スケーラブルビットストリームを生成することを特徴とする請求項1又は2に記載のエンコード方法。
  4. 前記デジタル信号を、整数型修正離散コサイン変換を用いて変換デジタル信号に変換することを特徴とする請求項2に記載のエンコード方法。
  5. 前記変換信号を正規化してMDCTフィルタバンクの出力を近似することを特徴とする請求項4に記載のエンコード方法。
  6. MPEG AAC(Moving Pictures Expert Group Advanced Audio Coding)仕様に従って、前記デジタル信号又は前記変換デジタル信号を量子化及びエンコードすることを特徴とする請求項1から5のいずれか一項に記載のエンコード方法。
  7. 前記エラーマッピングは、前記量子化された信号の各量子化値に対応するより低い量子化閾値を前記デジタル信号又は前記変換デジタル信号から差し引くことにより行われ、これにより前記エラー信号を生成することを特徴とする請求項1から6のいずれか一項に記載のエンコード方法。
  8. 前記デジタル信号の知覚情報を決定する前記知覚モデルとして、心理音響モデルを用いることを特徴とする請求項1から7のいずれか一項に記載のエンコード方法。
  9. 前記エラー信号は複数のビットプレーン記号を含むビットプレーンで表され、前記エラー信号のビットプレーン符号化中に連続的に前記ビットプレーンがスキャン及び符号化される際、より知覚的に重要なビットプレーンが初めに符号化されるように、前記ビットプレーンが前記デジタル信号の知覚情報に基づきシフトされることを特徴とする請求項1から8のいずれか一項に記載のエンコード方法。
  10. 前記エラー信号は複数のビットプレーン記号を含むビットプレーンで表され、前記ビットプレーン及び前記ビットプレーン記号は、より知覚的に重要な前記ビットプレーンのビットプレーン記号が先ず符号化されるように、前記エラー信号のビットプレーン符号化中に、前記デジタル信号の知覚情報に基づく順にスキャン及び符号化されることを特徴とする請求項1から8のいずれか一項に記載のエンコード方法。
  11. 前記エラー信号のビットプレーン符号化が開始される前記エラー信号のビットプレーンM(s)と、前記デジタル信号の丁度可知歪み(JND:Just Noticeable Distortion)レベルとの情報のうち少なくとも一方は、前記知覚モデルにより前記デジタル信号の知覚情報として決定され、
    sは前記デジタル信号又は前記変換デジタル信号の周波数バンドに相当することを特徴とする請求項9又は10に記載のエンコード方法。
  12. 前記デジタル信号の知覚有意性Ps(s)は、前記知覚情報として更に決定され、
    前記知覚有意性は、
    前記デジタル信号のJNDレベルτ(s)に対応する前記エラー信号のビットプレーンを決定する決定工程と、
    前記デジタル信号のJNDレベルτ(s)に対応する前記エラー信号のビットプレーンを、前記エラー信号のビットプレーン符号化が開始される前記エラー信号のビットプレーンM(s)から差し引くことにより、前記知覚有意性Ps(s)を決定する差引工程と
    から決定され、
    前記知覚有意性Ps(s)を用いて、少なくとも前記ビットプレーン又は該ビットプレーンのビットプレーン記号のスキャン及び符号化順を制御することを特徴とする請求項11に記載のエンコード方法。
  13. 前記知覚有意性Ps(s)は、
    前記知覚有意性Ps(s)の関数に基づいて、共通の知覚有意性Ps(s)_commonを規定する規定工程と、
    前記共通の知覚有意性Ps(s)_commonを前記知覚有意性Ps(s)から差し引くことにより、正規化された知覚有意性’Ps’(s)を生成する差引工程と
    により正規化され、
    前記量子化値がすべてゼロではない周波数バンドsに対しては、前記知覚有意性Ps(s)の値を、前記共通の知覚有意性Ps(s)_commonの値に設定し、
    前記量子化値がすべてゼロである周波数バンドsに対しては、前記正規化された知覚有意性’PS’(s)を、前記コア層ビットストリーム及び前記上位層ビットストリームとともに多重化して、前記スケーラブルビットストリームを生成することを特徴とする請求項12に記載のエンコード方法。
  14. 前記エラー信号のビットプレーン符号化を開始させる前記エラー信号のビットプレーンは、前記デジタル信号又は前記変換デジタル信号を量子化するための前記周波数バンドsで用いる最大量子化間隔から決定することを特徴とする請求項11に記載のエンコード方法。
  15. デジタル信号をスケーラブルビットストリームにエンコードするエンコーダであって、
    前記デジタル信号を量子化し、量子化された信号をエンコードしてコア層ビットストリームを形成する量子化手段と、
    前記デジタル信号及び前記コア層ビットストリームに基づきエラーマッピングを行い、前記コア層ビットストリームにエンコードされた情報を除去して、エラー信号を生じるエラーマッピング手段と、
    知覚モデルを用いて決定される前記デジタル信号の知覚情報に基づき前記エラー信号をビットプレーン符号化し、上位層ビットストリームを生じる知覚ビットプレーン符号化手段と、
    前記コア層ビットストリーム及び前記上位層ビットストリームを多重化し、前記スケーラブルビットストリームを生成する多重化手段と
    を備えることを特徴とするエンコーダ。
  16. デジタル信号をスケーラブルビットストリームにエンコードする方法であって、
    前記デジタル信号を量子化し、量子化された信号をエンコードしてコア層ビットストリームを形成する量子化工程と、
    前記デジタル信号及び前記コア層ビットストリームに基づきエラーマッピングを行い、前記コア層ビットストリームにエンコードされた情報を除去して、エラー信号を生じるエラーマッピング工程と、
    知覚モデルを用いて決定される前記デジタル信号の知覚情報に基づき前記エラー信号をビットプレーン符号化し、上位層ビットストリームを生じるビットプレーン符号化工程と、
    前記コア層ビットストリーム及び前記上位層ビットストリームを多重化し、前記スケーラブルビットストリームを生成する多重化工程と
    を備えるエンコード方法を、コンピュータによりプログラムが実施される際に、該コンピュータに実行させる前記プログラムが記録されていることを特徴とするコンピュータ読取可能媒体。
  17. デジタル信号をスケーラブルビットストリームにエンコードする方法であって、
    前記デジタル信号を量子化し、量子化された信号をエンコードしてコア層ビットストリームを形成する量子化工程と、
    前記デジタル信号及び前記コア層ビットストリームに基づきエラーマッピングを行い、前記コア層ビットストリームにエンコードされた情報を除去して、エラー信号を生じるエラーマッピング工程と、
    知覚モデルを用いて決定される前記デジタル信号の知覚情報に基づき前記エラー信号をビットプレーン符号化し、上位層ビットストリームを生じるビットプレーン符号化工程と、
    前記コア層ビットストリーム及び前記上位層ビットストリームを多重化し、前記スケーラブルビットストリームを生成する多重化工程と
    を備える方法を、コンピュータによりプログラム要素が実施される際に、該コンピュータに実行させることを特徴とするコンピュータプログラム要素。
  18. スケーラブルビットストリームをデジタル信号にデコードするデコード方法であって、
    前記スケーラブルビットストリームをコア層ビットストリーム及び上位層ビットストリームに逆多重化する逆多重化工程と、
    前記コア層ビットストリームをデコード及び逆量子化して、コア層信号を生成するデコード逆量子化工程と、
    前記デジタル信号の知覚情報に基づいて、前記上位層ビットストリームをビットプレーン復号化するビットプレーン復号化工程と、
    ビットプレーン復号化された上位層ビットストリームと逆量子化されたコア層信号に基づきエラーマッピングを行い、再構成された変換信号を生じるエラーマッピング工程と
    を備えており、
    前記再構成された変換信号は前記デジタル信号であることを特徴とするデコード方法。
  19. 前記再構成された変換信号を更に再構成された信号に変換し、該再構成された信号が前記デジタル信号であることを特徴とする請求項18に記載のデコード方法。
  20. 前記デジタル信号の知覚情報は、前記スケーラブルビットストリームの逆多重化により取得されることを特徴とする請求項18又は19に記載のデコード方法。
  21. 前記コア層信号及び前記上位層信号は、整数型修正離散コサイン変換を用いて変換されることを特徴とする請求項19又は20に記載のデコード方法。
  22. 前記コア層ビットストリームを、MPEG AAC(Moving Pictures Expert Group Advanced Audio Coding)仕様に従ってデコード及び逆量子化することを特徴とする請求項18から21のいずれか一項に記載のデコード方法。
  23. 前記エラーマッピングは、前記変換信号及び前記ビットプレーン復号化された上位層ビットストリームを逆量子化するために用いられたより低い量子化閾値を加えることにより行われ、これにより前記上位層信号を生成することを特徴とする請求項18から22のいずれか一項に記載のデコード方法。
  24. 前記上位層ビットストリームは連続的にビットプレーン復号化されて、複数のビットプレーン記号を含む複数のビットプレーンが生成され、前記ビットプレーンは、前記デジタル信号の知覚情報に基づきシフトされて、前記ビットプレーン復号化上位層ビットストリームが生成されることを特徴とする請求項18から23のいずれか一項に記載のデコード方法。
  25. 前記上位層ビットストリームを、前記デジタル信号の知覚情報に基づく順にビットプレーン復号化して複数のビットプレーン記号からなる複数のビットプレーンを生成し、これにより前記ビットプレーン復号化された上位層ビットストリームを生成することを特徴とする請求項18から23のいずれか一項に記載のデコード方法。
  26. 前記上位層ビットストリームのビットプレーン復号化が開始される際の前記上位層ビットストリームに対応する前記ビットプレーンであって、数M(s)により特定される前記ビットプレーンと、
    前記デジタル信号の弁別閾(JND:Just Noticeable Distortion)レベルと、
    の情報のうち、少なくとも一方を、前記知覚モデルにより前記デジタル信号の知覚情報として受け取り、
    sは前記デジタル信号又は前記変換デジタル信号の周波数バンドに対応することを特徴とする請求項24又は25に記載のデコード方法。
  27. 前記上位層ビットストリームのビットプレーン復号化が開始される際の前記上位層ビットストリームに対応する前記ビットプレーンM(s)は、前記コア層ビットストリームを逆量子化するための前記周波数バンドsで用いる最大量子化間隔から決定することを特徴とする請求項26に記載のデコード方法。
  28. スケーラブルビットストリームをデジタル信号にデコードするデコーダであって、
    前記スケーラブルビットストリームをコア層ビットストリーム及び上位層ビットストリームに逆多重化する逆多重化手段と、
    前記コア層ビットストリームをデコード及び逆量子化して、コア層信号を生成するデコード逆量子化手段と、
    前記デジタル信号の知覚情報に基づいて、前記上位層ビットストリームをビットプレーン復号化するビットプレーン復号化手段と、
    ビットプレーン復号化された上位層ビットストリームと逆量子化されたコア層信号に基づきエラーマッピングを行い、再構成された変換信号を生じるエラーマッピング手段と
    を備えており、
    前記再構成された変換信号は前記デジタル信号であることを特徴とするデコーダ。
  29. スケーラブルビットストリームをデジタル信号にデコードするデコード方法であって、
    前記スケーラブルビットストリームをコア層ビットストリーム及び上位層ビットストリームに逆多重化する逆多重化工程と、
    前記コア層ビットストリームをデコード及び逆量子化して、コア層信号を生成するデコード逆量子化工程と、
    前記デジタル信号の知覚情報に基づいて、前記上位層ビットストリームをビットプレーン復号化するビットプレーン復号化工程と、
    ビットプレーン復号化された上位層ビットストリームと逆量子化されたコア層信号に基づきエラーマッピングを行い、再構成された変換信号を生じるエラーマッピング工程と
    を備え、前記再構成された変換信号は前記デジタル信号であるデコード方法を、コンピュータによりプログラムが実施される際に、該コンピュータに実行させる前記プログラムが記録されていることを特徴とするコンピュータ読取可能媒体。
  30. スケーラブルビットストリームをデジタル信号にデコードするデコード方法であって、
    前記スケーラブルビットストリームをコア層ビットストリーム及び上位層ビットストリームに逆多重化する逆多重化工程と、
    前記コア層ビットストリームをデコード及び逆量子化して、コア層信号を生成するデコード逆量子化工程と、
    前記デジタル信号の知覚情報に基づいて、前記上位層ビットストリームをビットプレーン復号化するビットプレーン復号化工程と、
    ビットプレーン復号化された上位層ビットストリームと逆量子化されたコア層信号に基づきエラーマッピングを行い、再構成された変換信号を生じるエラーマッピング工程と
    を備え、前記再構成された変換信号は前記デジタル信号であるデコード方法を、コンピュータによりプログラム要素が実施される際に、該コンピュータに実行させることを特徴とするコンピュータプログラム要素。

JP2006532254A 2003-10-10 2004-10-06 デジタル信号をスケーラブルビットストリームにエンコードする方法、及びスケーラブルビットストリームをデコードする方法 Expired - Fee Related JP4849466B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US51062903P 2003-10-10 2003-10-10
US60/510,629 2003-10-10
PCT/SG2004/000323 WO2005036528A1 (en) 2003-10-10 2004-10-06 Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream.

Publications (2)

Publication Number Publication Date
JP2007509362A true JP2007509362A (ja) 2007-04-12
JP4849466B2 JP4849466B2 (ja) 2012-01-11

Family

ID=34435115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006532254A Expired - Fee Related JP4849466B2 (ja) 2003-10-10 2004-10-06 デジタル信号をスケーラブルビットストリームにエンコードする方法、及びスケーラブルビットストリームをデコードする方法

Country Status (11)

Country Link
US (1) US8446947B2 (ja)
EP (2) EP1673764B1 (ja)
JP (1) JP4849466B2 (ja)
KR (1) KR101141247B1 (ja)
CN (1) CN1890711B (ja)
AT (1) ATE391988T1 (ja)
DE (1) DE602004013031T2 (ja)
ES (1) ES2305852T3 (ja)
MY (1) MY137785A (ja)
TW (1) TWI347755B (ja)
WO (1) WO2005036528A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011059685A (ja) * 2009-09-04 2011-03-24 Thomson Licensing 基本層及び拡張層を有する音声信号を検出する方法

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004171301A (ja) * 2002-11-20 2004-06-17 Canon Inc 画像処理方法及び装置
KR100561869B1 (ko) * 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
EP1825687B1 (en) * 2004-12-14 2015-10-28 Samsung Electronics Co., Ltd. Determining quantization parameters using color quantization
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
EP1949693B1 (en) * 2005-10-12 2012-04-18 Samsung Electronics Co., Ltd. Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream
JP5173795B2 (ja) * 2006-03-17 2013-04-03 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
CN101206860A (zh) * 2006-12-20 2008-06-25 华为技术有限公司 一种可分层音频编解码方法及装置
CN101075436B (zh) * 2007-06-26 2011-07-13 北京中星微电子有限公司 带补偿的音频编、解码方法及装置
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
US20090103606A1 (en) * 2007-10-17 2009-04-23 Microsoft Corporation Progressive Distributed Video Coding
EP2063417A1 (en) * 2007-11-23 2009-05-27 Deutsche Thomson OHG Rounding noise shaping for integer transform based encoding and decoding
US9659568B2 (en) 2007-12-31 2017-05-23 Lg Electronics Inc. Method and an apparatus for processing an audio signal
BRPI0906767A2 (pt) * 2008-01-18 2015-07-14 Thomson Licensing Método para a avaliação da qualidade perceptual
US8386271B2 (en) * 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
KR101414412B1 (ko) 2008-05-09 2014-07-01 노키아 코포레이션 오디오 신호의 인코딩 장치, 오디오 신호의 디코딩 장치, 오디오 신호의 인코딩 방법, 스케일러블 인코딩 오디오 신호의 디코딩 방법, 인코더, 디코더, 전자기기 및 컴퓨터 판독가능한 기록 매체
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
US7949775B2 (en) 2008-05-30 2011-05-24 Microsoft Corporation Stream selection for enhanced media streaming
AU2013273846B2 (en) * 2008-07-11 2015-10-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
BR122021003142B1 (pt) * 2008-07-11 2021-11-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio
US8265140B2 (en) 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
CN101740030B (zh) * 2008-11-04 2012-07-18 北京中星微电子有限公司 语音信号的发送及接收方法、及其装置
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
CN101771417B (zh) 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、***
EP2348504B1 (en) * 2009-03-27 2014-01-08 Huawei Technologies Co., Ltd. Encoding and decoding method and device
CN102571270A (zh) * 2009-03-27 2012-07-11 华为技术有限公司 解码方法及装置
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
CN101800050B (zh) * 2010-02-03 2012-10-10 武汉大学 基于感知自适应比特分配的音频精细分级编码方法及***
CN101964188B (zh) 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码***
CN101854555B (zh) * 2010-06-18 2011-07-27 上海交通大学 基于预测残差自适应调整的视频编码***
US8965545B2 (en) * 2010-09-30 2015-02-24 Google Inc. Progressive encoding of audio
US8655092B2 (en) * 2010-12-16 2014-02-18 Beihang University Wavelet coefficient quantization method using human visual model in image compression
CN102074243B (zh) * 2010-12-28 2012-09-05 武汉大学 一种基于比特平面的感知音频分级编码***及方法
US9749633B2 (en) * 2012-01-19 2017-08-29 Vid Scale, Inc. System and method of video coding quantization and dynamic range control
US9842385B2 (en) * 2012-09-12 2017-12-12 Dolby Laboratories Licensing Corporation Display management for images with enhanced dynamic range
GB201219599D0 (en) * 2012-10-31 2012-12-12 Tangentix Ltd Apparatus and method for compression image data
US9628808B2 (en) 2013-03-26 2017-04-18 Dolby Laboratories Licensing Corporation Encoding perceptually-quantized video content in multi-layer VDR coding
GB2519070A (en) * 2013-10-01 2015-04-15 Sony Corp Data encoding and decoding
KR20150095591A (ko) * 2014-02-13 2015-08-21 한국과학기술원 시각적 인지 특성을 이용한 pvc 방법
EP2963949A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation
CN106463132B (zh) * 2014-07-02 2021-02-02 杜比国际公司 对压缩的hoa表示编码和解码的方法和装置
US10063889B2 (en) 2014-10-28 2018-08-28 Sony Corporation Image processing system with conditional coding and method of operation thereof
US9357232B2 (en) 2014-10-28 2016-05-31 Sony Corporation Image processing system with binary decomposition and method of operation thereof
US9294782B1 (en) 2014-10-28 2016-03-22 Sony Corporation Image processing system with artifact reduction mechanism and method of operation thereof
US9591330B2 (en) 2014-10-28 2017-03-07 Sony Corporation Image processing system with binary adaptive Golomb coding and method of operation thereof
US10356410B2 (en) 2014-10-28 2019-07-16 Sony Corporation Image processing system with joint encoding and method of operation thereof
US9674554B2 (en) 2014-10-28 2017-06-06 Sony Corporation Image processing system with coding mode and method of operation thereof
DE102015010412B3 (de) * 2015-08-10 2016-12-15 Universität Stuttgart Verfahren, Vorrichtung und Computerprogrammprodukt zum Komprimieren eines Eingangsdatensatzes
CN109863413B (zh) * 2016-05-20 2022-03-25 默升科技集团有限公司 Serdes应用中基于扫描的测试设计
US9934772B1 (en) * 2017-07-25 2018-04-03 Louis Yoelin Self-produced music
EP3467824B1 (en) 2017-10-03 2021-04-21 Dolby Laboratories Licensing Corporation Method and system for inter-channel coding
CN108281151A (zh) * 2018-01-25 2018-07-13 中国电子科技集团公司第五十八研究所 基于tms320f28335的多速率声码装置
DE102019204527B4 (de) * 2019-03-29 2020-11-19 Technische Universität München Kodierungs-/dekodierungsvorrichtungen und verfahren zur kodierung/dekodierung von vibrotaktilen signalen

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11234139A (ja) * 1998-02-18 1999-08-27 Fujitsu Ltd 音声符号化装置
JP2003058196A (ja) * 1998-03-11 2003-02-28 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、及びオーディオ信号復号化方法
JP2003066998A (ja) * 2001-08-28 2003-03-05 Mitsubishi Electric Corp 音響信号符号化装置
WO2003088212A1 (de) * 2002-04-18 2003-10-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994023426A1 (en) * 1993-03-26 1994-10-13 Motorola Inc. Vector quantizer method and apparatus
JP3196595B2 (ja) * 1995-09-27 2001-08-06 日本電気株式会社 音声符号化装置
JP3255022B2 (ja) 1996-07-01 2002-02-12 日本電気株式会社 適応変換符号化方式および適応変換復号方式
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
US6778953B1 (en) 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
US7047187B2 (en) * 2002-02-27 2006-05-16 Matsushita Electric Industrial Co., Ltd. Method and apparatus for audio error concealment using data hiding
US6934679B2 (en) * 2002-03-07 2005-08-23 Microsoft Corporation Error resilient scalable audio coding
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
GB2388502A (en) * 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11234139A (ja) * 1998-02-18 1999-08-27 Fujitsu Ltd 音声符号化装置
JP2003058196A (ja) * 1998-03-11 2003-02-28 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、及びオーディオ信号復号化方法
JP2003066998A (ja) * 2001-08-28 2003-03-05 Mitsubishi Electric Corp 音響信号符号化装置
WO2003088212A1 (de) * 2002-04-18 2003-10-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011059685A (ja) * 2009-09-04 2011-03-24 Thomson Licensing 基本層及び拡張層を有する音声信号を検出する方法

Also Published As

Publication number Publication date
CN1890711B (zh) 2011-01-19
TWI347755B (en) 2011-08-21
EP1673764A4 (en) 2006-12-27
EP1673764B1 (en) 2008-04-09
ES2305852T3 (es) 2008-11-01
EP1673764A1 (en) 2006-06-28
DE602004013031T2 (de) 2009-05-14
WO2005036528A1 (en) 2005-04-21
EP1939863A2 (en) 2008-07-02
EP1939863A3 (en) 2008-07-16
US20070274383A1 (en) 2007-11-29
KR20060115385A (ko) 2006-11-08
ATE391988T1 (de) 2008-04-15
DE602004013031D1 (de) 2008-05-21
TW200520400A (en) 2005-06-16
KR101141247B1 (ko) 2012-05-04
MY137785A (en) 2009-03-31
US8446947B2 (en) 2013-05-21
CN1890711A (zh) 2007-01-03
JP4849466B2 (ja) 2012-01-11

Similar Documents

Publication Publication Date Title
JP4849466B2 (ja) デジタル信号をスケーラブルビットストリームにエンコードする方法、及びスケーラブルビットストリームをデコードする方法
US6122618A (en) Scalable audio coding/decoding method and apparatus
US7774205B2 (en) Coding of sparse digital media spectral data
US6092041A (en) System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
EP1960999B1 (en) Method and apparatus encoding an audio signal
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
KR101050261B1 (ko) 콘텍스트 기반의 신호 엔코딩 및 디코딩
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
KR19990041072A (ko) 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR101119965B1 (ko) 데이터를 스케일러블 하게 인코딩 및 디코딩하는 시스템 및방법
KR19990041073A (ko) 비트율 조절이 가능한 오디오 부호화/복호화 방법 및 장치
JP4063508B2 (ja) ビットレート変換装置およびビットレート変換方法
KR101033256B1 (ko) Fgs 오디오 부호화에서 스케일 팩터방식 비트시프트
EP1310943B1 (en) Speech coding apparatus, speech decoding apparatus and speech coding/decoding method
KR20090089304A (ko) 부호화 방법, 복호화 방법, 부호화기, 복호화기 및 컴퓨터 프로그램 제품
CA2338266C (en) Coded voice signal format converting apparatus
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
MXPA06004049A (en) Method for encoding a digital signal into a scalable bitstream;method for decoding a scalable bitstream
KR100975522B1 (ko) 스케일러블 오디오 복/부호화 방법 및 장치
KR0144935B1 (ko) 비트율 조정이 가능한 부호화 및 복호화장치
De Meuleneire et al. Algebraic quantization of transform coefficients for embedded audio coding
KR20100114484A (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110728

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111012

R150 Certificate of patent or registration of utility model

Ref document number: 4849466

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees