JP4838253B2 - 画像符号化装置、画像符号化方法、画像復号化装置、画像復号化方法、および記録方法 - Google Patents

画像符号化装置、画像符号化方法、画像復号化装置、画像復号化方法、および記録方法 Download PDF

Info

Publication number
JP4838253B2
JP4838253B2 JP2007535373A JP2007535373A JP4838253B2 JP 4838253 B2 JP4838253 B2 JP 4838253B2 JP 2007535373 A JP2007535373 A JP 2007535373A JP 2007535373 A JP2007535373 A JP 2007535373A JP 4838253 B2 JP4838253 B2 JP 4838253B2
Authority
JP
Japan
Prior art keywords
picture
pictures
image
decoding
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007535373A
Other languages
English (en)
Other versions
JP2008516514A (ja
Inventor
正真 遠間
智之 岡田
リュウ サム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2008516514A publication Critical patent/JP2008516514A/ja
Application granted granted Critical
Publication of JP4838253B2 publication Critical patent/JP4838253B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、動画像を符号化する画像符号化装置、その画像符号化方法により生成されるストリーム、およびそのストリームを復号化する画像復号化装置に関する。
近年、音声、画像、その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオ、電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbits/sの伝送速度を持つサービス総合ディジタル網(ISDN:Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU-T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG−1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、MPEG−1は、動画像信号を1.5Mbpsまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG−1規格では対象とする品質を伝送速度が主として約1.5Mbpsで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化されたMPEG−2では、動画像信号を2〜15MbpsでTV放送品質を実現する。
さらに現状では、MPEG−1およびMPEG−2の標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG−1およびMPEG−2を上回る圧縮率を達成し、更に物体単位で符号化・復号・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG−4が規格化された。MPEG−4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。その後、ISO/IECとITU−Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG−4AVC(Advanced Video Coding)がされ、さらに、現在SMPTE(Society of Motion Picture and Television Engineers)においてVC−1(Proposed SMPTE Standard for Television: VC-1 Compressed Video Bitstream Format and Decoding Process, Final Committee Draft 1 Revision 6, 2005.7.13)が規格化中である。VC−1では、MPEG−2およびMPEG−4の方式をベースとして、符号化ツール等の拡張を行っている。VC−1は、BD(Blu-ray disc)やHD(High Definition)−DVDなど、次世代の光ディスク関連機器などで使用される見込みである。
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したりすることができる。
参照画像を持たず画面内予測符号化を行うものをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うものをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるものをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方である2枚のピクチャを参照することが可能である。ただし、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。
図1Aおよび図1Bは、従来のMPEG−2のストリームの構成図である。図1Bに示すように、MPEG−2のストリームは以下のような階層構造を有している。ストリームは複数のGOP(Group Of Picture)から構成されており、GOPを符号化処理の基本単位とすることで動画像の編集やランダムアクセスが可能になっている。つまり、GOPの先頭がランダムアクセスポイントとなる。GOPは、複数のピクチャから構成され、各ピクチャには、Iピクチャ、Pピクチャ又はBピクチャがある。ストリーム、GOPおよびピクチャは、さらにそれぞれの単位の区切りを示す同期信号(sync)と、当該単位に共通のデータであるヘッダとを含んで構成されている。
図2Aおよび図2Bは、MPEG−2で使用されているピクチャ間の予測構造例である。同図で斜線をつけたピクチャは、他のピクチャから参照されるピクチャである。図2Aに示すように、MPEG−2ではPピクチャ(ピクチャP0,P6,P9,P12,P15)は、表示時刻が直前1枚のIピクチャもしくはPピクチャのみを参照した予測符号化が可能である。また、Bピクチャ(ピクチャB1,B2,B4,B5,B7,B8,B10,B11,B13,B14,B16,B17,B19,B20)は、表示時刻が直前1枚と直後1枚のIピクチャもしくはPピクチャを参照した予測符号化が可能である。更に、ピクチャがストリームに配置される順序も決まっており、IピクチャおよびPピクチャは表示時刻の順序に配置され、Bピクチャは直後に表示されるIピクチャもしくはPピクチャの直後に配置される。GOP構造としては、例えば、図2Bに示すように、ピクチャI3からB14までをまとめて1つのGOPとすることができる。
図3は、VC−1のストリームの構成図である。VC−1も基本的にはMPEG−2と同一のストリーム構造をもつ。ただし、ランダムアクセスポイントは、エントリ・ポイント(Entry Point)と呼ばれ、そのエントリ・ポイントには、エントリ・ポイント・ヘッダ(Entry Point HDR)が付加される。エントリ・ポイントから次のエントリ・ポイントまでのデータがランダムアクセス単位(RAU)となり、MPEG−2におけるGOPに相当する。以降、VC−1におけるランダムアクセス単位をRAUと呼ぶ。ここで、RAUには、RAUを構成するピクチャについてのユーザーデータ(エントリ・ポイントレベルのユーザーデータ)を格納することができ、エントリ・ポイント・ヘッダの直後に格納される。
ここで、VC−1におけるピクチャのタイプについて説明する。まず、VC−1でも、Iピクチャ、PピクチャおよびBピクチャが定義されている。これらのI、P、Bピクチャについては、MPEG−2と同等の予測構造をもつ。VC−1では、これら3種類のピクチャに加えて、SkippedピクチャおよびBIピクチャの2種類が定義される。Skippedピクチャとは、画素データを含まないピクチャであり、復号順で直前の参照ピクチャと同一の画素データを持つPピクチャとして扱われる。例えば、下記の(1)および(2)に示す例では、ピクチャS5がピクチャP3と同一であるとみなされるため、ストリームの復号時の動作は、(1)と(2)で同一となる。
(1)表示順: ピクチャI0、ピクチャB2、ピクチャP1、ピクチャB4、ピクチャP3、ピクチャB6、ピクチャS5(なお、符号にIを含めて示されるピクチャはIピクチャであり、符号にPを含めて示されるピクチャはPピクチャであり、符号にBを含めて示されるピクチャはBピクチャであり、符号にSを含めて示されるピクチャはSkippedピクチャである。例えば、ピクチャS6はSkippedピクチャを示す。また、各ピクチャに付加した数字は復号順を示す。)
(2)表示順: ピクチャI0、ピクチャB2、ピクチャP1、ピクチャB4、ピクチャP3、ピクチャB6、ピクチャP5(P5はP3と同一の画素データをもつ。)
Skippedピクチャは、画像が静止しているケースにおいて特に有効である。例えば、RAUの途中から画像が静止する際には、ピクチャI0、ピクチャP1、ピクチャP2、ピクチャP3、ピクチャS4、ピクチャS5、ピクチャS6…のように、画像が静止している部分についてはSkippedピクチャを使用することで、符号量を削減することができる。
また、BIピクチャとは、BピクチャとIピクチャの性質を併せ持つピクチャである。具体的には、BIピクチャは、復号化と表示の順序が互いに異なり、他のピクチャから参照されないという点で、Bピクチャの性質をもつ。また、BIピクチャは、全てのマクロブロックが画面内符号化されており、他のピクチャを参照しないという点でIピクチャの性質をもつ。
次に、Iピクチャ、Pピクチャ、Bピクチャ、Skippedピクチャ、およびBIピクチャの判別方法を説明する。基本的には、ストリーム中のピクチャレイヤに含まれるピクチャタイプを参照することによりピクチャのタイプを判別することができる。しかし、ピクチャレイヤにより示すことのできるピクチャタイプは、プロファイルに応じて規定されている。
例えば、シンプル・プロファイルでは、IピクチャおよびPピクチャを示すことができ、メイン・プロファイルでは、Iピクチャ、Pピクチャ、およびBピクチャまたはBIピクチャを示すことができ、アドバンスト・プロファイルでは、Iピクチャ、Pピクチャ、Bピクチャ、BIピクチャおよびSkippedピクチャを示すことができる。
ここで、シンプル・ファイルおよびメイン・プロファイルの両プロファイルでは、ピクチャレイヤのピクチャタイプから、Skippedピクチャを判別できないため、任意のピクチャタイプをもつピクチャのサイズが1バイト以下である際に、当該ピクチャがSkippedピクチャであると規定されている。また、メイン・プロファイルでは、BまたはBIピクチャを示すピクチャタイプが定義されており、ピクチャタイプからBピクチャとBIピクチャとを区別することはできない。
図4は、従来の画像符号化方法を実現する画像符号化装置のブロック図である。
画像符号化装置800は、入力される画像信号Vinに対して圧縮符号化および可変長符号化等を行なうことにより、その画像信号Vinをビットストリーム(ストリーム)Strに変換して出力する装置である。この画像符号化装置800は、動き検出部801、動き補償部802、減算部803、直交変換部804、量子化部805、逆量子化部806、逆直交変換部807、加算部808、ピクチャメモリ809、スイッチ810、可変長符号化部811、および予測構造決定部812を備えている。
画像信号Vinは、減算部803および動き検出部801に入力される。減算部803は、入力された画像信号Vinと予測画像の差分値を計算し、直交変換部804に出力する。直交変換部804は、差分値を周波数係数に変換し、量子化部805に出力する。量子化部805は、入力された周波数係数を量子化し、量子化値Qcを可変長符号化部811に出力する。
逆量子化部806は、量子化値Qcを逆量子化して周波数係数に復元し、逆直交変換部807に出力する。逆直交変換部807は、周波数係数を差分値に逆周波数変換し、加算部808に出力する。加算部808は、差分値と動き補償部802から出力される予測画像とを加算して復号画像とする。スイッチ810は、当該復号画像の保存が指示された場合にONになり、その復号画像はピクチャメモリ809に保存される。
一方、画像信号Vinがマクロブロック単位で入力された動き検出部801は、ピクチャメモリ809に格納されている復号画像(参照ピクチャ)を探索対象とし、最も画像信号Vinの示すマクロブロックに近い画像を有する画像領域を検出することによって、その画像領域の位置を指し示す動きベクトルMVを決定する。
動き補償部802は、上記処理によって検出された動きベクトルMVなどを用いて、ピクチャメモリ809に格納されている復号画像から予測画像に最適な画像領域を取り出す。
予測構造決定部812は、RAU開始ピクチャUinによって、符号化の対象ピクチャがRAUの開始位置にあると判断すると、その対象ピクチャをランダムアクセスが可能な特別なピクチャとして符号化(画面内符号化)するように、ピクチャタイプPtで動き検出部801および動き補償部802に指示し、更にそのピクチャタイプPtを可変長符号化部811に符号化させる。
可変長符号化部811は、量子化値Qc、ピクチャタイプPtおよび動きベクトルMVなどを可変長符号化して、ストリームStrを生成する。
図5は、従来の画像復号化方法を実現する画像復号化装置900のブロック図である。同図において、図4の従来の画像符号化方法を実現する画像符号化装置800のユニットと同じ動作をするユニットには同じ記号を付し、そのユニットの説明を省略する。
可変長復号部901はストリームStrを復号化し、量子化値Qc、参照ピクチャの特定情報IndピクチャタイプPtおよび動きベクトルMVなどを出力する。ピクチャメモリ809は動きベクトルMVを取得し、動き補償部802は、ピクチャタイプPt、動きベクトルMVおよび参照ピクチャの特定情報Indを取得し、逆量子化部806は量子化値Qcを取得する。そして、ピクチャメモリ809、動き補償部802、逆量子化部806、逆直交変換部807、および加算部808によって復号化処理が行われる。このような復号化処理の動作は、図4の従来の画像符号化方法を実現する画像符号化装置800で説明済みである。
バッファメモリ902は、加算部808から出力される復号画像Voutを格納するメモリであり、表示部903は、バッファメモリ902から復号画像Voutを取得して、その復号画像Voutに応じた画像を表示する。なお、ピクチャメモリ809とバッファメモリ902は共用してもよい。
図6は、従来の画像復号化装置900における、高速再生などの特殊再生時の復号動作を示すフローチャートである。まず、画像復号化装置900は、ステップS1001において、ストリームStrから、処理対象のピクチャの先頭を検出する。そして、画像復号化装置900は、ステップS1002において、ピクチャレイヤのヘッダに含まれるピクチャタイプに基づいて、当該ピクチャを復号化するかどうかを判定する。ステップS1003では、画像復号化装置900は、ステップS1002においてピクチャの復号化が必要と判定されたかどうかを解釈し、必要と判定された際にはステップS1004に進み、必要ないと判定された際にはステップS1005に進む。ステップS1004では、画像復号化装置900は、ピクチャを復号化してステップS1005に進む。最後に、ステップS1005では、画像復号化装置900は、RAUあるいはストリームの最終ピクチャなど再生処理が必要な最後のピクチャまで処理が完了したかどうか判定し、未処理のピクチャが存在する際にはステップS1001からステップS1005までの処理を繰り返し、最終ピクチャの処理が完了した時点で復号処理を終了する。
しかしながら、上記従来の画像符号化装置800および画像復号化装置900では、Skippedピクチャを含むストリームStrの復号化、特に高速再生などの特殊再生時において、大きな処理負担を要するという問題がある。
図7は、上記従来の画像符号化装置800および画像復号化装置900の問題を説明するための図である。
図7の(a)は、Skippedピクチャを含む従来のRAUの構造を示す。RAUは24枚のピクチャから構成され、復号順で4番目以降のピクチャからは画像の動きが静止しているため、5番目のピクチャからは全てSkippedピクチャとなっている。このようなRAUを3倍速で再生する際には、従来の画像復号化装置900は、1、4、7、10、13、16、19、および22番目のピクチャを順に復号化して再生しようとする。しかし、実際に復号化が必要であるピクチャは、図7の(c)に示すように、1番目のIピクチャと4番目のPピクチャのみである。
つまり、従来のストリームStrのRAUでは、各ピクチャレイヤに当該ピクチャのピクチャタイプが含まれているため、画像復号化装置900は、実際に各ピクチャ(ピクチャレイヤ)の先頭をサーチしてピクチャタイプを取得しなければそのピクチャの復号化が必要かどうかを判別することができない。このため、図7の(b)に示すように、画像復号化装置900は、7、10、13、16、19、および22番目のSkippedピクチャについても、これらのピクチャのデータを実際に解析してピクチャタイプを取得する必要があった。
このように、従来の画像符号化装置および画像復号化装置では、RAUを高速再生する際には、復号化が不要なピクチャまで解析する必要があり、復号化時の処理量が多いという課題がある。
そこで本発明は、かかる問題に鑑みてなされたものであって、復号化処理の負担を軽減することができる画像符号化装置および画像復号化装置を提供することを目的とする。
上記目的を達成するために、本発明の画像符号化装置は、ピクチャを符号化する画像符号化装置であって、各ピクチャをピクチャタイプに応じて符号化する符号化手段と、符号化された複数のピクチャを含むランダムアクセス単位に含まれる、各ピクチャのピクチャタイプ情報をピクチャの復号順に並べた第1の補助情報を符号化する第1の符号化手段と、前記ランダムアクセス単位に含まれる、各ピクチャのピクチャ構造情報をピクチャの復号順に並べた第2の補助情報を符号化する第2の符号化手段と、前記符号化された第1および第2の補助情報を、前記ランダムアクセス単位内の先頭のピクチャよりも前に書き込む書き込み手段とを備え、前記各ピクチャのピクチャタイプ情報には、少なくとも、画面内符号化されるIピクチャ、1枚のピクチャを参照して画面間符号化されるPピクチャ、2枚のピクチャを参照して画面間符号化されるBピクチャ、および、復号順で直前にある参照ピクチャと同一の画像で表示されるべきスキップピクチャが含まれ、前記各ピクチャのピクチャ構造情報には、3−2プルダウン使用時に、トップフィールドとボトムフィールドのいずれから復号を開始するかを示す情報が含まれ、前記スキップピクチャは、復号順で、複数枚連続しており、静止区間を構成することを特徴とする。
また、上記目的を達成するために、本発明の画像符号化装置は、ピクチャを符号化する画像符号化装置であって、各ピクチャをピクチャタイプに応じて符号化する符号化手段と、符号化された複数のピクチャを含むランダムアクセス単位内における画像の静止区間を示すマップを生成するマップ生成手段と、前記マップ生成手段で生成されたマップを前記ランダムアクセス単位内に書き込む書き込み手段とを備えることを特徴とする。
これにより、ランダムアクセス単位にはマップが格納されているため、画像復号化装置はそのマップからランダムアクセス単位内における画像の静止区間を簡単に特定することができる。その結果、画像復号化装置は、従来のように、ランダムアクセス単位に含まれる複数のピクチャレイアを1つずつわざわざ解析して、そのピクチャがSkippedピクチャであるか否かを判別する必要がなく、復号化処理の負担を軽減することができる。
また、前記書き込み手段は、前記ランダムアクセス単位内の先頭のピクチャよりも前に前記マップを書き込むことを特徴としてもよい。
これにより、画像復号化装置はランダムアクセス単位を先頭から取得することによって、マップを容易かつ迅速に検出することができ、復号化処理の負担をさらに軽減することができる。
また、前記マップ生成手段は、前記ランダムアクセス単位に含まれる各ピクチャのピクチャタイプを示す前記マップを生成することを特徴としてもよい。例えば、前記ピクチャタイプは、対象のピクチャが復号順で直前にある参照ピクチャと同一の画像で表示されるべきスキップピクチャであるか否かを示す。
これにより、画像復号化装置は、マップに示される各ピクチャのピクチャタイプから、IピクチャまたはPピクチャの後に複数のSkippedピクチャが続く範囲を、静止区間として特定することができる。
また、前記マップ作成手段は、前記静止区間における先頭のピクチャおよび最後のピクチャを示す前記マップを生成することを特徴としてもよい。
これにより、画像復号化装置は、マップに示される先頭のピクチャおよび最後のピクチャから、静止区間を容易に特定することができる。
ここで、上記目的を達成するために、本発明の画像復号化装置は、符号化された複数のピクチャを含むランダムアクセス単位を復号化する画像復号化装置であって、前記ランダムアクセス単位内における画像の静止区間を示すマップを前記ランダムアクセス単位から検出する検出手段と、前記検出手段により検出されたマップの示す静止区間に基づいて、前記ランダムアクセス単位に含まれる符号化されたピクチャのうち、復号化すべきピクチャを選択する選択手段と、前記選択手段により選択されたピクチャを復号化する復号化手段とを備えることを特徴とする。
これにより、ピクチャの復号化処理を開始する前に、静止区間に基づいて復号化すべきピクチャが予め選択されるため、従来のように、復号化処理を開始しながら、ランダムアクセス単位に含まれる複数のピクチャレイアを1つずつわざわざ解析して、そのピクチャがSkippedピクチャであるか否かを判別する必要がなく、復号化処理の負担を軽減することができる。
また、上記目的を達成するために、本発明の画像符号化信号は、ランダムアクセス単位ごとに複数の符号化されたピクチャを含む画像符号化信号であって、前記ランダムアクセス単位ごとに、当該ランダムアクセス単位内における画像の静止区間を示すマップを有することを特徴とする。
これにより、ランダムアクセス単位にはマップが格納されているため、画像復号化装置はそのマップからランダムアクセス単位内における画像の静止区間を簡単に特定することができる。その結果、画像復号化装置は、従来のように、ランダムアクセス単位に含まれる複数のピクチャレイアを1つずつわざわざ解析して、そのピクチャがSkippedピクチャであるか否かを判別する必要がなく、復号化処理の負担を軽減することができる。
また、前記マップは、前記ランダムアクセス単位に含まれる何れのピクチャよりも前に格納されていることを特徴としてもよい。
これにより、画像復号化装置はランダムアクセス単位を先頭から取得することによって、マップを容易かつ迅速に検出することができ、復号化処理の負担をさらに軽減することができる。
なお、本発明は、上記画像符号化装置や、画像復号化装置、画像符号化信号だけでなく、画像符号化方法、画像復号化方法、プログラム、そのプログラムを格納する記憶媒体、上記各装置の集積回路としても実現することができる。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
本発明の第1の実施の形態におけるVC−1のストリームのRAU先頭には、RAUマップが格納されており、本実施の形態における画像復号化装置は、そのRAUマップを解析することにより、そのRAU内における画像の静止区間を特定する。
図8は、本実施の形態におけるVC−1のストリームに含まれるRAUの構造の一例を示す図である。
このRAUは、先頭にあるエントリ・ポイント・ヘッダ(Entry Point HDR)およびユーザーデータと、ユーザーデータの後にある複数のピクチャとを含んで構成されている。そして、ユーザーデータには、上述のRAUマップMIが含まれている。なお、VC−1の規格では、RAUはEPS(Entry Pint Segment)と称される。
つまり、従来のRAUとの違いは、RAU内にSkippedピクチャが含まれるかどうか、および画像の静止区間を特定するためのRAUマップMIがユーザーデータ(エントリ・ポイントレベルのユーザーデータ)内に配置されていることである。
従って、本実施の形態における画像復号化装置は、RAUマップMIを参照してRAU内にSkippedピクチャが存在するかどうか、および画像の静止区間を特定できるため、RAU内の各ピクチャの復号開始前に、RAU内の各ピクチャレイアを解析することなく、復号化する必要のないピクチャを特定することができ、その結果、復号時の処理量を削減できる。
図9Aは、RAUマップMIのシンタックスの一例を示す図である。
num_pic_in_RAUはRAU内のピクチャの枚数を示し、frame_field_flagはRAU内の各ピクチャがフィールド構造で符号化されているかフレーム構造で符号化されているかを示し、pic_typeは各ピクチャのピクチャタイプ(Skippedピクチャを含む)を示す。なお、各ピクチャの情報は復号順で示される。つまり、このRAUマップMIは、RAU内のピクチャごとに、そのピクチャのピクチャタイプ(Skippedピクチャを含む)を示すことで、RAU内の画像の静止区間を示している。ここで、本実施の形態における静止区間とは、復号順で参照ピクチャ(IピクチャまたはPピクチャ)の後に複数のSkippedピクチャが連続する場合において、その参照ピクチャから最後のSkippedピクチャまでの位置および範囲を示す。
例えば、RAUマップMIは、RAU内の2番目から最終ピクチャまでの全ピクチャがskippedピクチャであることを示す。この場合、画像復号化装置は、RAUマップMIのpic_typeを参照することにより、2番目以降のピクチャは復号化せずに、先頭ピクチャを復号化して繰り返し表示すればよいと判断する。
なお、ピクチャ単位で、1フレームが表示時に何フィールド分に相当するか、あるいはトップフィールドとボトムフィールドのどちらから復号を開始するかなどを示す3−2プルダウンの情報をRAUマップMIに含めてもよい。
図9Bは、RAUマップMIのシンタックスの他の例を示す図である。
VC−1のアドバンスト・プロファイルでは、フィールド符号化時の第1フィールドと第2フィールドのピクチャタイプは、ピクチャレイヤに含まれるフィールド・ピクチャタイプによって示される。フィールド・ピクチャタイプには、(第1フィールドのピクチャタイプ、第2フィールドのピクチャタイプ)として、(I、I)、(I、P)、(P、I)、(P、P)、(B、B)、(B、BI)、(BI、B)、および(BI、BI)の8通りが定義されている。従って、ピクチャがフィールドで構成される場合には、フィールド・ピクチャタイプを示すことで、フレームを構成する第1フィールドと第2フィールドのピクチャタイプを同時に示すことができる。
そこで、図9Bに示すRAUマップMIのシンタックスは、ピクチャがフィールドで構成されている場合には、そのピクチャのフィールド・ピクチャタイプも示す。具体的に、num_frame_in_RAUはRAU内のフレームの枚数を示し、field_coding_flagはピクチャがフィールドであるか否かを示す。ピクチャがフィールドで構成されているときには、field_type_modeによって、そのピクチャのフィールド・ピクチャタイプが示され、ピクチャがフィールドで構成されていないときには、picture_typeによって、そのピクチャのピクチャタイプが示される。
即ち、このRAUマップMIは、上述の図9Aに示すRAUマップMIと同様、RAU内のピクチャごとに、そのピクチャのピクチャタイプを示すことで、RAU内の画像の静止区間を示している。
また、RAUが、IピクチャとSkippedピクチャのみ、あるいは、Iピクチャ、Pピクチャ、およびSkippedピクチャのみから構成される際には、RAUの一部あるいは全てが静止区間となる。このとき、静止区間と通常の動画区間とにおいて、画像符号化装置における復号化処理および表示動作が異なるため、RAU内に静止区間が存在するかどうかを示す情報をRAUマップMIに含めてもよい。
図9Cは、RAUマップMIのシンタックスの他の例を示す図である。
このシンタックスは、motionless_flagにより、RAUが静止区間を含むかどうかを示すとともに、start_pic_numおよびend_pic_numにより、RAUの静止区間を示す。具体的に、motionless_flagが1であれば、このRAUマップMIは、RAUに静止区間があることを示す。さらに、RAUマップMIは、motionless_flagが1のとき、start_pic_numにより示されるIピクチャまたはPピクチャから、end_pic_numにより示されるSkippedピクチャまでが静止区間であることを示す。
なお、RAU全体が静止区間、一定時間以上の静止区間が存在する場合にのみmotionless_flagを1にセットしてもよい。
図9Dは、RAUマップMIのシンタックスの他の例を示す図である。
このシンタックスにおいて、number_of_pictures_in_EPSは、EPSに含まれるピクチャの数を示す。picture_structureは、ピクチャがフィールド構造であるかフレーム構造であるか、または1フレームが表示時に何フィールド分に相当するかを示す。picture_typeは、ピクチャがIピクチャ、Pピクチャ、BピクチャおよびSkippedピクチャなどのうちの何れのピクチャタイプに属するかを示す。また、stuffing_bitsは、stuffing_bits、picture_structureおよびpicture_typeの全てのビット数の総和が8ビットの整数倍で表現されるように使用される。また、このシンタックスでは、EPSに含まれる各ピクチャに対して、その各ピクチャの復号順に、stuffing_bits、picture_structureおよびpicture_typeが示される。
このようなRAUマップMIは、上述の図9Aに示すRAUマップMIと同様、RAU(EPS)内のピクチャごとに、そのピクチャのピクチャタイプを示すことで、RAU内の画像の静止区間を示している。
なお、RAUマップMIには、ピクチャの表示順で各ピクチャの情報を格納してもよい。さらに、RAUマップMIにおいて各ピクチャの情報が復号順および表示順のいずれで格納されているかを示す情報を格納してもよい。
また、RAUマップMIは、先頭ピクチャのユーザーデータに格納するなど、エントリ・ポイント・レイヤとは異なるレイヤのユーザーデータに含めてもよい。また、RAU内にSkippedピクチャが存在しない場合には、RAUマップMIを作成しないことにしてもよい。このとき、RAUマップMIの有無により、RAU内にSkippedピクチャが存在するかどうかを示すことができる。
図10は、本実施の形態における画像復号化装置100のブロック図である。
図8に示すRAUを含むストリームSTRを復号化する本実施の形態における画像復号化装置100は、可変長復号部101と、ピクチャメモリ102と、動き補償部103と、逆量子化部104と、逆直交変換部105と、バッファメモリ106と、表示部107と、加算部108と、ストリーム抽出部109と、情報取得部110とを備えている。
この画像復号化装置100は、ストリーム抽出部109と情報取得部110とを備える点において、従来の画像復号化装置900と異なる。
情報取得部110は、可変長復号部101からRAUマップMIを取得するとともに、高速再生などの特殊再生の内容を指示する再生モード信号TMを外部から取得する。そして、情報取得部110は、再生モード信号TMに基づいてRAUマップMIを解析し、復号化が必要なピクチャを決定(選択)する。情報取得部110は、その決定結果を示す復号ピクチャ指示信号SPをストリーム抽出部109に出力する。
例えば、RAUマップMIが図9Cに示すシンタックスにより構成されている場合、情報取得部110は、motionless_flagに基づいて、再生対象となるRAUに静止区間があるか否かを判別する。そして、情報取得部110は、静止区間があると判別したときには、start_pic_numおよびend_pic_numに基づいて静止区間を特定する。静止区間を特定すると、情報取得部110は、再生モード信号TMによって示される再生対象のピクチャのうち、その静止区間に含まれないピクチャのみを、復号化すべきピクチャとして決定し、その決定結果を示す復号ピクチャ指示信号SPを出力する。ただし、再生モード信号TMによって示される再生対象のピクチャに、静止区間内のピクチャが含まれる場合には、当該静止区間の先頭ピクチャを復号化すべきピクチャとして決定する。
また、RAUマップMIが図9Dに示すシンタックスにより構成されている場合、情報取得部110は、RAU内のピクチャごとに示されるpicture_typeに基づいて静止区間を特定する。そして、情報取得部110は、再生モード信号TMによって示される再生対象のピクチャのうち、その静止区間に含まれないピクチャのみを、復号化すべきピクチャとして決定し、その決定結果を示す復号ピクチャ指示信号SPを出力する。ただし、上述と同様、再生モード信号TMによって示される再生対象のピクチャに、静止区間内のピクチャが含まれる場合には、当該静止区間の先頭ピクチャを復号化すべきピクチャとして決定する。
ストリーム抽出部109は、ストリームSTRを取得すると、RAUごとに、まず、そのRAUの先頭にある符号化されたRAUマップMIを検出して可変長復号部101に出力する。そして、ストリーム抽出部109は、そのRAUマップMIに基づいて情報取得部110から出力された復号ピクチャ指示信号SPを取得すると、その復号ピクチャ指示信号SPの示す、復号化が必要なピクチャのデータを、ストリームSTRから抽出して可変長復号部101に出力する。
可変長復号部101は、ストリーム抽出部109から符号化されたRAUマップMIを取得したときには、その符号化されたRAUマップMIに対して可変長復号化を行い、復号化されたRAUマップMIを情報取得部110に出力する。また、可変長復号部101は、ストリームSTRに含まれるピクチャのデータをストリーム抽出部109から取得したときには、そのデータに対して可変長復号化を行い、量子化値Qc、参照ピクチャの特定情報Ind、ピクチャタイプPtおよび動きベクトルMVを出力する。
動き補償部103は、ピクチャメモリ102に格納され、参照ピクチャの特定情報Indにより示される復号画像(参照ピクチャ)から、動きベクトルMVによって指示される画像領域を取り出して予測画像として加算部108に出力する。
逆量子化部104は、量子化値Qcを逆量子化して周波数係数に復元し、逆直交変換部105に出力する。逆直交変換部105は、周波数係数を画素差分値に逆周波数変換して加算部108に出力する。加算部108は、画素差分値と動き補償部103から出力される予測画像とを加算して復号画像Voutを生成する。そして、加算部108は、その復号画像Voutをピクチャメモリ102およびバッファメモリ106に格納する。表示部107は、バッファメモリ106から復号画像Voutを取得して、その復号画像Voutに応じた画像を表示する。なお、ピクチャメモリ102とバッファメモリ106を1つのメモリで構成してもよい。
なお、ストリーム抽出部109は、RAUに含まれる全てのピクチャのデータを可変長復号部101に出力してもよい。この場合には、可変長復号部101は、情報取得部110から出力された復号ピクチャ指示信号SPに基づいて、RAUに含まれる全てのピクチャの中から、復号化が必要なピクチャを選択する。そして、可変長復号部101は、その選択したピクチャのデータに対して可変長復号化を行う。なお、情報取得部110により復号化するピクチャを決定するのは高速再生や逆再生などの特殊再生時のみとして、通常再生時にはRAUマップMIの解析処理を行わずに全てのピクチャを復号化すると決定してもよい。
図11は、本実施の形態に係る画像復号化装置100における特殊再生時の動作を示すフローチャートである。
まず、画像復号化装置100は、特殊再生開始の指示を受け付けると、まずエントリ・ポイント・レイヤのユーザーデータに、RAUマップMIが格納されているかどうかを判定する(ステップS100)。つまり、画像復号化装置100は、RAUマップMIを検出したか否かの判別を行なう。画像復号化装置100は、RAUマップMIを検出した際には(ステップS100のYES)ステップS102の処理を行ない、検出しなければ(ステップS100のNO)、ステップS106の処理を行なう。
具体的に、画像復号化装置100は、RAUマップMIを検出すると(ステップS100のYES)、RAUマップMIを解析して(ステップS102)、その解析結果に基づいてRAU内の特殊再生対象となるピクチャのうち、復号化すべきピクチャを決定(選択)する(ステップS104)。
なお、RAUの特殊再生を開始するときには、画像復号化装置100は、ステップS100において常にRAUマップMIを検出し、RAU内で復号化すべきピクチャを決定する。つまり、本実施の形態における画像復号化装置100は、RAUの特殊再生を開始するときには、RAUマップMIに基づいて、RAUに含まれる特殊再生対象のピクチャの中から、Skippedピクチャを除くピクチャを復号化すべきピクチャとして選択している。
ステップS100でRAUマップMIを検出しなかった後、または、ステップS104で復号化すべきピクチャを決定した後、画像復号化装置100は、RAU内にある特殊再生対象となるピクチャの先頭(スタートコード)を検出する(ステップS106)。
次に、画像復号化装置100は、ステップS106で検出された特殊再生対象のピクチャが、ステップS104において復号化すべきと決定されたピクチャであるかどうかを判定する(ステップS108)。ここで、復号化すべきと決定されたピクチャであると判定した際には(ステップS108のYES)、画像復号化装置100は、そのピクチャに対して復号化を行う(ステップS110)。
画像復号化装置100は、ステップS104で復号化すべきと決定されたピクチャでないと判定した後(ステップS108のNO)、または、ステップS110でピクチャを復号化した後に、次の特殊再生対象のピクチャ、つまり未処理のピクチャがあるか否かを判別する(ステップS112)。
未処理のピクチャがないと判別したときには(ステップS112のNO)、画像復号化装置100は全ての処理を終了し、未処理のピクチャがあると判別したときには(ステップS112のYES)、ステップS100からの動作を繰り返し実行する。例えば、直前のステップS100でRAUマップMIが検出され、これまでと同一のRAU内において再びステップS100の動作が行なわれるときには、画像復号化装置100は、その再度のステップS100では、RAUマップMIを検出することなく(ステップS100のNO)、ステップS106の処理、つまり次に特殊再生対象となるピクチャの先頭の検出を行なう。
このように、本実施の形態における画像復号化方法では、ステップS100からステップS104の処理を含む点において、従来の画像復号化方法と異なる。
図12は、本実施の形態における画像復号化装置100がRAUマップMIを解析する動作を示すフローチャートである。
例えば、RAUマップMIが図9Dに示すシンタックスによって構成されている場合には、画像復号化装置100は、まず、RAUマップMIを解析して、RAUに含まれる特殊再生対象のピクチャから、Iピクチャ、Pピクチャ、およびSkippedピクチャを特定する(ステップS120)。
次に、画像復号化装置100は、特殊再生対象のピクチャがSkippedピクチャである際には、復号順でそのSkippedピクチャの直前のIピクチャあるいはPピクチャの復号結果を、Skippedピクチャの示す画像として使用すると決定する(ステップS122)。
なお、特殊再生ではない通常再生時にも、RAUマップMIを参照して、RAUの再生開始時に、Skippedピクチャなどを特定しておいてもよい。
そして、画像復号化装置100は、そのRAUに含まれるSkippedピクチャを表示するときには、上記ステップS122で決定された、そのSkippedピクチャの直前にあるIピクチャ又はPピクチャの復号結果を表示する。
ここで、図13A、図13B、および図13Cを参照して、本実施の形態における画像復号化装置100の高速再生時の動作について説明する。
図13Aは、高速再生されるRAUを示す図である。
先頭から1番目のピクチャがIピクチャであり、2番目および3番目のピクチャがBピクチャであり、4番目のピクチャがPピクチャである。そして、5番目以降のピクチャが全てSkippedピクチャである。また、ピクチャは全てフレームである。
図13Bは、図13Aに対応するRAUマップMIを示す図である。このRAUマップMIは、図9Aに示すシンタックスにより構成されている。ここで、ピクチャは全てフレームであるため、frame_field_flagは、全てのピクチャに対して1にセットされる。また、pic_typeには、ピクチャごとに、Iピクチャ、Pピクチャ、Bピクチャ、およびSkippedピクチャのうちの何れかがセットされる。なお、図13B中、I、P、B、およびSkippedの何れかをセットしているが、実際には、各ピクチャタイプを示す数値をセットしてもよい。
図13Cは、本実施の形態の画像復号化装置100が図13AのRAUを有するストリームSTRを特殊再生する際の動作を示すフローチャートである。
画像復号化装置100は、まず、ストリームSTRに含まれる図13AのRAUを3倍速で再生すると決定する(ステップS130)。ここで、3倍速再生とは、RAU内のストリーム構造が復号順でIピクチャ、Bピクチャ、Bピクチャ、Pピクチャ、Bピクチャ、Bピクチャ、Pピクチャ、Bピクチャ、Bピクチャ、…である際に、IピクチャとPピクチャのみを再生するのと同一であり、一般的な高速再生である。
次に、画像復号化装置100は、図13Bに示すRAUマップMIの解析結果より、5番目から24番目までのピクチャは全てSkippedピクチャであって、4番目から24番目までのピクチャの範囲が静止区間であると判断する。そして、画像復号化装置100は、5番目以降の各ピクチャの表示には全て4番目のピクチャの復号結果を使用するとして、1番目と4番目のピクチャのみを復号化すると決定する(ステップS132)。続いて、画像復号化装置100は、1番目と4番目のピクチャをそれぞれ復号化して表示する(ステップS134)。さらに、画像復号化装置100は、7番目、10番目、13番目、16番目、19番目、および22番目のピクチャの復号結果として、4番目のピクチャの復号結果を繰り返し表示する。
なお、本実施の形態ではVC−1のストリームの各RAUにRAUマップを含め、画像復号化装置100はそのストリームに対して復号化を行ったが、RAUマップが含まれていれば、そのストリームの符号化方式は、MPEG−4 AVCやMPEG−2などVC-1以外の符号化方式であってもよい。ここで、Skippedピクチャと同様のピクチャタイプが定義されていない符号化方式であっても、実質的にSkippedピクチャと同様のピクチャであれば、RAUマップにおいてSkippedピクチャとすることで他のピクチャと区別してもよい。
(変形例)
ここで本実施の形態における画像復号化装置100による再生方法の変形例について説明する。
例えば、DTS(Decoding Time Stamp:復号時刻)からPTS(Presentation Time Stamp:表示時刻)までの復号化期間内に、静止区間の先頭ピクチャの復号化が間に合わないケースが起こり得る。そこで、本実施の形態では、先頭ピクチャの復号化が表示時刻までに完了しなくても、完了後にその先頭ピクチャを表示させる。
図14は、本変形例に係る画像復号化装置100の再生方法を示す説明図である。
DTS2は、静止区間における先頭ピクチャpic2の符号を載せたパケット(PESパケットと呼ばれる)のヘッダに含まれるデコードタイムスタンプの時刻を指し、先頭ピクチャpic2の復号化を開始すべき時刻を示す。PTS2は、先頭ピクチャpic2の符号を載せたパケットヘッダに含まれるプレゼンテーションタイムスタンプの時刻を指し、先頭ピクチャpic2のプレゼンテーション(出力または表示)を開始すべき時刻を示す。DTS1、PTS1、およびPTS3についても同様である。
例えば、画像復号化装置100は、この図14に示すように、先頭ピクチャpic2に対して、DTS2の時刻に復号化を開始する。しかし、デコード完了時刻がPTS2の時刻に間に合わない場合がある。そこで本変形例における画像復号化装置100は、静止区間における先頭ピクチャのデコード完了時刻がPTSの時刻に間に合わなかった場合には、デコード完了時刻の直後のフレームグリッドの時刻においてプレゼンテーションを開始する。
このように本変形例における画像復号化装置100では、符号化された先頭ピクチャに含まれるデコードタイムスタンプの時刻に復号化を開始し、プレゼンテーションタイムスタンプの時刻までに先頭ピクチャの復号化が完了しない場合に、プレゼンテーションタイムスタンプにマージンを付与し、付与後のプレゼンテーションタイムスタンプに、復号化された先頭ピクチャを表示する。
図15は、本変形例に係る画像復号化装置100の再生方法を示すフローチャートである。
本変形例に係る画像復号化装置100は、静止区間における先頭ピクチャのDTS時刻に、その先頭ピクチャの復号化を開始する(ステップS140)。そして、画像復号化装置100は、その先頭ピクチャのPTS時刻までに、その復号化が完了したか否かを判別する(ステップS142)。ここで、完了したと判別したときには(ステップS142のYES)、画像復号化装置100は、PTS時刻に復号化された先頭ピクチャを表示する(ステップS144)。一方、完了しなかったと判別したときには(ステップS142のNO)、画像復号化装置100は、PTS時刻の直後、つまり復号化完了の直後のフレームグリッドの時刻に、復号化された先頭ピクチャを表示する(ステップS146)。
このように本変形例に係る画像復号化装置100の再生方法によれば、静止区間における先頭ピクチャの復号化が遅延した場合には、表示時刻を遅らせるので、その先頭ピクチャの表示を省いてしまう場合と比べて、静止区間の画質の向上を図ることができる。
(実施の形態2)
図16は、本実施の形態における画像符号化装置のブロック図である。
本実施の形態における画像符号化装置200は、動き検出部201と、動き補償部202と、減算部203と、直交変換部204と、量子化部205と、逆量子化部206と、逆直交変換部207と、加算部208と、ピクチャメモリ209と、スイッチ210と、可変長符号化部211と、予測構造決定部212と、情報作成部213とを備えている。
動き検出部201は、画像信号Vinをマクロブロック単位で取得する。そして、動き検出部201は、ピクチャメモリ209に格納されている復号画像(参照ピクチャ)を探索対象とし、最も画像信号Vinの示すマクロブロックに近い画像を有する画像領域を検出する。動き検出部201は、その画像領域の位置を指し示す動きベクトルMVを決定して出力する。また、動き検出部201は、動きベクトルMVの検出に使用された復号画像を示す参照ピクチャの特定情報Indを出力する。
動き補償部202は、ピクチャメモリ209に格納され、参照ピクチャの特定情報Indにより示される復号画像から、動きベクトルMVにより示される画像領域を復号画像から取り出して予測画像として出力する。
予測構造決定部212は、RAU開始ピクチャUinによって、符号化の対象ピクチャがRAUの開始位置にあれば、その対象ピクチャをランダムアクセスが可能な特別なピクチャとして符号化(画面内符号化)するように、ピクチャタイプPtで動き検出部201および動き補償部202に指示し、更にそのピクチャタイプPtを可変長符号化部211に符号化させる。即ち、予測構造決定部212は、画像信号Vinに含まれる符号化対象ピクチャごとに、そのピクチャのピクチャタイプPtとして、例えば、Iピクチャ、Pピクチャ、BピクチャおよびSkippedピクチャなどの何れかのタイプを決定する。
減算部203は、画像信号Vinと予測画像を取得して、それらの差分値を計算し、直交変換部204に出力する。直交変換部204は、差分値を周波数係数に変換して量子化部205に出力する。量子化部205は、直交変換部204から出力された周波数係数を量子化し、量子化値Qcを可変長符号化部211に出力する。
逆量子化部206は、量子化値Qcを逆量子化して周波数係数に復元し、逆直交変換部207に出力する。逆直交変換部207は、周波数係数を差分値に逆周波数変換して加算部208に出力する。加算部208は、差分値と動き補償部202から出力される予測画像とを加算して復号画像を生成する。スイッチ210は、当該復号画像の保存が指示された場合にONになり、その復号画像はピクチャメモリ209に保存される。
情報作成部213は、予測構造決定部212で決定されたピクチャタイプPtに従って、図9A〜図9Dの何れかに示すようなRAUマップMIを作成して可変長符号化部211に出力する。
可変長符号化部211は、量子化値Qc、ピクチャタイプPt、RAUマップMIおよび動きベクトルMVなどを可変長符号化して、ストリームSTRを生成する。
このように本実施の形態における画像符号化装置200は、情報作成部213を備える点において、従来の画像符号化装置800と異なる。
図17は、本実施の形態に係る画像符号化装置200の符号化の動作を示すフローチャートである。
まず、画像符号化装置200は、予測構造決定部212において、符号化対象のピクチャがRAUの先頭ピクチャであるかどうかを判定する(ステップS200)。ここで、RAUの先頭ピクチャであると判定したときには(ステップS200のYES)、画像符号化装置200は、可変長符号化部211において、当該RAUマップMIを作成するための初期化処理を行うとともに、RAUマップMIを格納するための領域をエントリ・ポイント・レイヤのユーザーデータ内に確保する(ステップS202)。
さらに、画像符号化装置200は、予測構造決定部212において、符号化対象のピクチャをSkippedピクチャとすべきか否かを判別する(ステップS204)。ここで、Skippedピクチャとすべきでないと判別したときには(ステップS204のNO)、画像符号化装置200は、その符号化対象のピクチャの画素データを符号化する(ステップS206)。
そして、画像符号化装置200は、情報作成部213において、ステップS204の判別結果に基づいてRAUマップMIの生成および更新を行なう(ステップS208)。
例えば、画像符号化装置200は、ステップS206において符号化されたピクチャのピクチャタイプと、そのピクチャがフィールド構造であるかフレーム構造であるかを示す情報などとがRAUマップMIに含まれるように、図9Dに示すようなRAUマップMIを生成する。または、画像符号化装置200は、明示的な静止区間がRAUマップMIに含まれるように、図9Cに示すようなRAUマップMIを生成する。
次に、画像符号化装置200は、ステップS204において判別の対象とされたピクチャがRAUの最終ピクチャであるかどうかを判定する(ステップS210)。即ち画像符号化装置200は、RAUに属する全てのピクチャに対する処理が完了したか否かを判別する。ここで、最終ピクチャであると判定したときには(ステップS210のYES)、画像符号化装置200は、可変長符号化部211において、RAUマップMIを確定して符号化し、ステップS202において確保された領域にRAUマップMIを書き込む(ステップS212)。
そして、画像符号化装置200は、ストリームSTRに含まれるピクチャのうち未処理のピクチャがあるか否かを判別する(ステップS214)。ここで、未処理のピクチャがあると判別したときには(ステップS214のYES)、画像符号化装置200は、ステップS200からの処理を繰り返し実行し、未処理のピクチャがないと判別したときには(ステップS214のNO)、画像符号化装置200は、全ての符号化処理を終了する。
なお、RAUマップMIの情報が既知でない場合や、RAUを構成するピクチャのデータをバッファリングするのに十分なバッファメモリを備える場合などでは、ステップS202の処理を省略してもよい。この場合には、ステップS212においてRAUマップMIの格納領域を確保して、エントリ・ポイント・レイヤのユーザーデータにRAUマップMIを格納する。
また、画像符号化装置200は、Skippedピクチャを含むストリームSTRを固定ビットレートで生成してもよい。Skippedピクチャでは、1ピクチャの符号量が1バイト程度となるため、画像信号Vinを固定ビットレートで符号化する際にはパディング用のデータを挿入してストリームSTRのサイズを調節する必要がある。ここで、パディング用のデータは、Skippedピクチャにおいてのみ挿入してもよい。こうすることで、ピクチャ内のスライスデータ間に挿入されたパディング用データの処理にかかる復号時の遅延時間をなくすことができる。
また、シーケンスレイヤ、およびエントリ・ポイント・レイヤの情報は、特殊再生時などに最初に読み込まれる必要があり、データサイズをなるべく小さくすることが望ましい。従って、シーケンスレイヤとエントリ・ポイント・レイヤの間にはパディング用のデータを挿入しないことにしてもよい。
また、本実施の形態における符号化方法により生成されたストリームSTRを、オーディオデータなどと多重化して記録してもよい。多重化方式としては、MPEG−2のトランスポートストリーム、あるいはBD(Blu-ray Disc)などパッケージメディア毎に規定された方式などがある。
また、シンプル・プロファイルとメイン・プロファイルでは、ピクチャレイヤのピクチャタイプにおいてSkippedピクチャであることを示すことはできない。
そこで、本実施の形態における画像符号化装置200は、各ピクチャのピクチャレイヤにおけるピクチャタイプがIピクチャ、Pピクチャ、Bピクチャ、あるいはBIであっても、ピクチャのサイズからそのピクチャがSkippedピクチャであるかどうか判定し、Skippedピクチャである際には、そのことが示されるようにRAUマップMIを生成してもよい。即ち、画像符号化装置200により生成されるストリームSTRのRAUマップMIには、シンプル・プロファイルやメイン・プロファイルであっても、Skippedピクチャを含む各ピクチャのピクチャタイプが示される。
同様に、メイン・プロファイルにおいてはピクチャレイヤのピクチャタイプからはBピクチャとBIピクチャとを区別することができない。
そこで、本実施の形態における画像符号化装置200は、予測構造決定部212においてBピクチャとBIピクチャとを区別して決定されるピクチャタイプPtに基づいて、RAUに含まれる各ピクチャのピクチャタイプを示すRAUマップMIを生成する。即ち、画像符号化装置200により生成されるストリームSTRのRAUマップMIには、メイン・プロファイルであっても、各ピクチャのピクチャタイプがBピクチャとBIピクチャとを区別して示される。BIピクチャは、Bピクチャとは異なり単独で復号化できるため、両者が区別できると特殊再生時に復号化して再生されるピクチャの選択の自由度が高まる。
なお、シーケンスレイヤのシンタックスが存在する際には、例えば、エントリ・ポイント・レイヤにはシーケンスレイヤを必ず付加するなどとして、シーケンスレイヤも含めてRAUとしてもよい。また、エントリ・ポイント・レイヤのユーザーデータには、RAUマップMI以外の情報を含めてもよい。
また、特殊再生時には、復号化すべきピクチャを特定するとともに、復号化すべきピクチャに効率よくアクセスすることが重要となる。従って、RAUマップMIにおいて、各ピクチャのアドレス情報を示してもよい。ここで、アドレス情報は、RAU先頭からのバイト位置であってもよいし、MPEG−2システムのトランスポート・ストリーム・パケットなどにより符号化データがパケット化される際に、各ピクチャが格納されるパケットを特定するための情報であってもよい。なお、アドレス情報は全てのピクチャに付加せずに、Iピクチャ、あるいはPピクチャなど特殊再生時に復号化されるピクチャにのみ付加してもよい。
(変形例)
ここで、本実施の形態におけるSkippedピクチャについての変形例を説明する。
上記実施の形態では、Skippedピクチャを、復号順で直前の参照ピクチャと同一の画素データを持つPピクチャとして生成した。したがって、SkippedピクチャをBピクチャの代わりに用いることができない。
そこで本変形例では、Skippedピクチャを、他のピクチャから参照されないBピクチャでかつ、表示順で直前の参照ピクチャと同一の画素データをもつピクチャ(以後、B−skipピクチャと呼ぶ)として生成する。即ち、本変形例では、B−skipピクチャを新規に導入することで、MPEG−2などで一般的に使用される復号順(例えば、Iピクチャ、Bピクチャ、Bピクチャ、Pピクチャ、Bピクチャ、Bピクチャ、Pピクチャ、Bピクチャ、Bピクチャ、…)により構成されるGOP構造を作成することができ、画像復号化装置においてIP再生(IピクチャおよびPピクチャのみを再生する特殊再生)を容易に実現できる。
図18Aおよび図18Bは、B−skipピクチャの使用例を示す図である。なお、これらの図中、「I2」、「B0」、「P5」および「B−skip6」などの符号中、「I」、「B」、「P」および「B−skip」はそれぞれ各ピクチャのピクチャタイプを示し、そのピクチャタイプの後に付された番号は表示順を示す。また、図18AはRAU内のピクチャを復号順で示し、図18BはそのRAU内のピクチャを表示順で示す。ピクチャB−skip6とピクチャB−skip7は、表示順で直前の参照ピクチャであるピクチャP5のみを参照してピクチャP8を参照しない。本変形例に係る画像符号化装置200は、この図18Aおよび図18Bに示すRAUを有するストリームSTRを生成する。
ここで、ピクチャがB−skipピクチャであるかどうかはRAUマップMIのピクチャタイプにおいて示される。一方、ピクチャがB−skipピクチャであっても、そのピクチャのピクチャレイヤに含まれるピクチャタイプあるいはフィールド・ピクチャタイプはBピクチャである。したがって、このようなストリームSTRは、従来のストリームと互換性を保つことができ、RAUマップMIを解釈できない従来の画像復号化装置でもそのB−skipピクチャをBピクチャとして扱い、特殊再生を行なうことができる。
なお、ピクチャレイヤにおいてもピクチャがB−skipピクチャであるかどうかを示してもよい。また、B−skipピクチャを、表示順で直後の参照ピクチャと同一の画素データを持つピクチャとして生成してもよい。このとき、B−skipピクチャが表示順で直前あるいは直後のどちらの参照ピクチャを参照するかを、RAUマップMIに示してもよい。
(実施の形態3)
さらに、上記各実施の形態で示した画像符号化装置および画像復号化装置を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図19A、図19Bおよび図19Cは、上記各実施の形態の画像符号化装置および画像復号化装置による処理を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図19Bは、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスク本体を示す。図19Aは、記録媒体本体であるフレキシブルディスク本体の物理フォーマットの例を示している。フレキシブルディスク本体FDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスク本体FD上に割り当てられた領域に、上記プログラムが記録されている。
また、図19Cは、フレキシブルディスク本体FDに上記プログラムの記録再生を行うための構成を示す。画像符号化装置および画像復号化装置の処理を実現する上記プログラムをフレキシブルディスク本体FDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブFDDを介して書き込む。また、フレキシブルディスク内のプログラムにより、上記画像符号化装置および画像復号化装置による処理をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムCsに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
以上のように、本発明によれば、画像符号化装置がRAUの先頭にRAUマップを付加し、画像復号化装置がその付加されたRAUマップを各ピクチャの復号前に参照するため、復号処理を削減することができ、特に、特殊再生機能が重視されるパッケージメディアの再生品質を向上することができる。したがって、本発明の実用的価値は高い。
以上、本発明について上記各実施の形態およびその変形例を用いて説明したが、本発明はこれらに限定されるものではない。
例えば、ブロック図(図10および図16など)の各機能ブロックは典型的には集積回路であるLSI(Large Scale Integration)として実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、符号化または復号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としても良い。
本発明に係る画像符号化装置および画像復号化装置は、VC-1のストリームを再生する際に、高速再生などの特殊再生機能を備える機器全般に適用することができ、特殊再生機能が重視される光ディスク関連機器において特に有効である。
図1Aは、MPEG2のストリームの構成図である。 図1Bは、MPEG2のストリームの構成図である。 図2Aは、MPEG2で使用されているピクチャ間の予測構造例を示す図である。 図2Bは、MPEG2で使用されているピクチャ間の予測構造例を示す図である。 図3は、従来のVC−1のストリームの構成図である。 図4は、従来の画像符号化装置の構成を示すブロック図である。 図5は、従来の画像復号化装置の構成を示すブロック図である。 図6は、従来の画像復号化装置の動作を示すフローチャートである。 図7は、従来の画像符号化装置により作成されたストリームにおける高速再生時の課題を示す図である。 図8は、本発明の実施の形態1に係るVC−1のストリームに含まれるRAUの構造の一例を示す図である。 図9Aは、RAUマップMIのシンタックスの一例を示す図である。 図9Bは、RAUマップMIのシンタックスの他の例を示す図である。 図9Cは、RAUマップMIのシンタックスの他の例を示す図である。 図9Dは、RAUマップMIのシンタックスの他の例を示す図である。 図10は、本発明の実施の形態1における画像復号化装置の構成を示すブロック図である。 図11は、本発明の実施の形態1における画像復号化装置の動作を示すフローチャートである。 図12は、本発明の実施の形態1における画像復号化装置がRAUマップを解析する動作を示すフローチャートである。 図13Aは、本発明の実施の形態1における画像復号化装置によって高速再生されるRAUを示す図である。 図13Bは、図13Aに対応するRAUマップMIを示す図である。 図13Cは、本発明の実施の形態1における画像復号化装置が図13AのRAUを有するストリームSTRを特殊再生する際の動作を示すフローチャートである。 図14は、実施の形態1における変形例の画像復号化装置による再生方法を示す説明図である。 図15は、実施の形態1における変形例の画像復号化装置による再生方法を示すフローチャートである。 図16は、本発明の実施の形態2における画像符号化装置の構成を示すブロック図である。 図17は、本発明の実施の形態2における画像符号化装置の動作を示すフローチャートである。 図18Aは、B−skipピクチャの予測構造を示す図である。 図18Bは、B−skipピクチャの予測構造を示す図である。 図19Aは、本発明の画像符号化方法および画像復号化方法を実現するためのプログラムを記録した記録媒体を説明するための説明図である。 図19Bは、本発明の画像符号化方法および画像復号化方法を実現するためのプログラムを記録した記録媒体を説明するための説明図である。 図19Cは、本発明の画像符号化方法および画像復号化方法を実現するためのプログラムを記録した記録媒体を説明するための説明図である。

Claims (5)

  1. ピクチャを符号化する画像符号化装置であって、
    各ピクチャをピクチャタイプに応じて符号化する符号化手段と、
    符号化された複数のピクチャを含むランダムアクセス単位に含まれる、各ピクチャのピクチャタイプ情報をピクチャの復号順に並べた第1の補助情報を符号化する第1の符号化手段と、
    前記ランダムアクセス単位に含まれる、各ピクチャのピクチャ構造情報をピクチャの復号順に並べた第2の補助情報を符号化する第2の符号化手段と、
    前記符号化された第1および第2の補助情報を、前記ランダムアクセス単位内の先頭のピクチャよりも前に書き込む書き込み手段とを備え、
    前記各ピクチャのピクチャタイプ情報には、少なくとも、画面内符号化されるIピクチャ、1枚のピクチャを参照して画面間符号化されるPピクチャ、2枚のピクチャを参照して画面間符号化されるBピクチャ、および、復号順で直前にある参照ピクチャと同一の画像で表示されるべきスキップピクチャが含まれ、
    前記各ピクチャのピクチャ構造情報には、3−2プルダウン使用時に、トップフィールドとボトムフィールドのいずれから復号を開始するかを示す情報が含まれ
    前記スキップピクチャは、復号順で、複数枚連続しており、静止区間を構成す
    ことを特徴とする画像符号化装置。
  2. ピクチャを符号化する画像符号化方法であって、
    各ピクチャをピクチャタイプに応じて符号化する符号化ステップと、
    符号化された複数のピクチャを含むランダムアクセス単位に含まれる、各ピクチャのピクチャタイプ情報をピクチャの復号順に並べた第1の補助情報を符号化する第1の符号化ステップと、
    前記ランダムアクセス単位に含まれる、各ピクチャのピクチャ構造情報をピクチャの復号順に並べた第2の補助情報を符号化する第2の符号化ステップと、
    前記符号化された第1および第2の補助情報を、前記ランダムアクセス単位内の先頭のピクチャよりも前に書き込む書き込みステップとを備え、
    前記各ピクチャのピクチャタイプ情報には、少なくとも、画面内符号化されるIピクチャ、1枚のピクチャを参照して画面間符号化されるPピクチャ、2枚のピクチャを参照して画面間符号化されるBピクチャ、および、復号順で直前にある参照ピクチャと同一の画像で表示されるべきスキップピクチャが含まれ、
    前記各ピクチャのピクチャ構造情報には、3−2プルダウン使用時に、トップフィールドとボトムフィールドのいずれから復号を開始するかを示す情報が含まれ
    前記スキップピクチャは、復号順で、複数枚連続しており、静止区間を構成す
    ことを特徴とする画像符号化方法。
  3. 符号化された複数のピクチャを含むランダムアクセス単位を復号化する画像復号化装置であって、
    前記ランダムアクセス単位内の先頭のピクチャよりも前に格納されている、第1の補助情報と、第2の補助情報を検出する検出手段と、
    前記第1の補助情報と、前記第2の補助情報とに基づいて、前記ランダムアクセス単位に含まれる符号化されたピクチャのうち、復号化すべきピクチャを選択する選択手段と、
    前記選択手段により選択されたピクチャを復号化する復号化手段と
    を備え、
    前記第1の補助情報は、前記ランダムアクセス単位に含まれる、各ピクチャのピクチャタイプ情報をピクチャの復号順に並べたものであり、
    前記各ピクチャのピクチャタイプ情報には、少なくとも、画面内符号化されるIピクチャ、1枚のピクチャを参照して画面間符号化されるPピクチャ、2枚のピクチャを参照して画面間符号化されるBピクチャ、および、復号順で直前にある参照ピクチャと同一の画像で表示されるべきスキップピクチャが含まれ、
    前記第2の補助情報は、前記ランダムアクセス単位に含まれる、各ピクチャのピクチャ構造情報をピクチャの復号順に並べたものであり、
    前記各ピクチャのピクチャ構造情報には、3−2プルダウン使用時に、トップフィールドとボトムフィールドのいずれから復号を開始するかを示す情報が含まれ
    前記スキップピクチャは、復号順で、複数枚連続しており、静止区間を構成す
    ことを特徴とする画像復号化装置。
  4. 符号化された複数のピクチャを含むランダムアクセス単位を復号化する画像復号化方法であって、
    前記ランダムアクセス単位内の先頭のピクチャよりも前に格納されている、第1の補助情報と、第2の補助情報を検出する検出ステップと、
    前記第1の補助情報と、前記第2の補助情報とに基づいて、前記ランダムアクセス単位に含まれる符号化されたピクチャのうち、復号化すべきピクチャを選択する選択ステップと、
    前記選択ステップにより選択されたピクチャを復号化する復号化ステップと
    を備え、
    前記第1の補助情報は、前記ランダムアクセス単位に含まれる、各ピクチャのピクチャタイプ情報をピクチャの復号順に並べたものであり、
    前記各ピクチャのピクチャタイプ情報には、少なくとも、画面内符号化されるIピクチャ、1枚のピクチャを参照して画面間符号化されるPピクチャ、2枚のピクチャを参照して画面間符号化されるBピクチャ、および、復号順で直前にある参照ピクチャと同一の画像で表示されるべきスキップピクチャが含まれ、
    前記第2の補助情報は、前記ランダムアクセス単位に含まれる、各ピクチャのピクチャ構造情報をピクチャの復号順に並べたものであり、
    前記各ピクチャのピクチャ構造情報には、3−2プルダウン使用時に、トップフィールドとボトムフィールドのいずれから復号を開始するかを示す情報が含まれ
    前記スキップピクチャは、復号順で、複数枚連続しており、静止区間を構成す
    ことを特徴とする画像復号化方法。
  5. 符号化ストリームを記録媒体に記録する記録方法であって、
    各ピクチャをピクチャタイプに応じて符号化する符号化ステップと、
    符号化された複数のピクチャを含むランダムアクセス単位に含まれる、各ピクチャのピクチャタイプ情報をピクチャの復号順に並べた第1の補助情報を符号化する第1の符号化ステップと、
    前記ランダムアクセス単位に含まれる、各ピクチャのピクチャ構造情報をピクチャの復号順に並べた第2の補助情報を符号化する第2の符号化ステップと、
    前記符号化された第1および第2の補助情報を、前記ランダムアクセス単位内の先頭のピクチャよりも前に書き込み、符号化ストリームを生成する生成ステップと、
    前記符号化ストリームを記録媒体に記録する記録ステップとを備え、
    前記各ピクチャのピクチャタイプ情報には、少なくとも、画面内符号化されるIピクチャ、1枚のピクチャを参照して画面間符号化されるPピクチャ、2枚のピクチャを参照して画面間符号化されるBピクチャ、および、復号順で直前にある参照ピクチャと同一の画像で表示されるべきスキップピクチャが含まれ、
    前記各ピクチャのピクチャ構造情報には、3−2プルダウン使用時に、トップフィールドとボトムフィールドのいずれから復号を開始するかを示す情報が含まれ
    前記スキップピクチャは、復号順で、複数枚連続しており、静止区間を構成す
    ことを特徴とする記録方法。
JP2007535373A 2004-10-07 2005-10-05 画像符号化装置、画像符号化方法、画像復号化装置、画像復号化方法、および記録方法 Active JP4838253B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US61620304P 2004-10-07 2004-10-07
US60/616,203 2004-10-07
PCT/JP2005/018735 WO2006038716A1 (en) 2004-10-07 2005-10-05 Picture coding apparatus and picture decoding apparatus

Publications (2)

Publication Number Publication Date
JP2008516514A JP2008516514A (ja) 2008-05-15
JP4838253B2 true JP4838253B2 (ja) 2011-12-14

Family

ID=35432767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007535373A Active JP4838253B2 (ja) 2004-10-07 2005-10-05 画像符号化装置、画像符号化方法、画像復号化装置、画像復号化方法、および記録方法

Country Status (10)

Country Link
US (1) US8514938B2 (ja)
EP (1) EP1800492B1 (ja)
JP (1) JP4838253B2 (ja)
KR (1) KR101227330B1 (ja)
CN (1) CN101036391B (ja)
ES (1) ES2400955T3 (ja)
HK (1) HK1107482A1 (ja)
MY (1) MY149236A (ja)
TW (1) TWI389578B (ja)
WO (1) WO2006038716A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7370212B2 (en) 2003-02-25 2008-05-06 Microsoft Corporation Issuing a publisher use license off-line in a digital rights management (DRM) system
US7483532B2 (en) * 2003-07-03 2009-01-27 Microsoft Corporation RTP payload format
WO2006073207A2 (en) * 2005-01-10 2006-07-13 Matsushita Electric Industrial Co., Ltd. Picture coding apparatus and picture decoding apparatus
US8438645B2 (en) 2005-04-27 2013-05-07 Microsoft Corporation Secure clock with grace periods
US8725646B2 (en) 2005-04-15 2014-05-13 Microsoft Corporation Output protection levels
US20060265758A1 (en) 2005-05-20 2006-11-23 Microsoft Corporation Extensible media rights
US7684566B2 (en) * 2005-05-27 2010-03-23 Microsoft Corporation Encryption scheme for streamed multimedia content protected by rights management system
US7769880B2 (en) * 2005-07-07 2010-08-03 Microsoft Corporation Carrying protected content using a control protocol for streaming and a transport protocol
US7561696B2 (en) * 2005-07-12 2009-07-14 Microsoft Corporation Delivering policy updates for protected content
US8321690B2 (en) * 2005-08-11 2012-11-27 Microsoft Corporation Protecting digital media of various content types
US7634816B2 (en) 2005-08-11 2009-12-15 Microsoft Corporation Revocation information management
US7720096B2 (en) * 2005-10-13 2010-05-18 Microsoft Corporation RTP payload format for VC-1
US7796598B2 (en) * 2006-04-03 2010-09-14 Cisco Technology, Inc. Synchronizing redundant video streams encapsulated in IP/UDP packets
EP2094015A4 (en) * 2006-12-11 2011-09-28 Panasonic Corp MOVABLE PICTURE DECODER, SEMICONDUCTOR DEVICE, VIDEO DEVICE, AND MOBILE PICTURE DECODING PROCESS
KR101371507B1 (ko) * 2007-02-20 2014-03-12 세종대학교산학협력단 저지연 영상 통신 시스템 및 방법
KR101385884B1 (ko) * 2008-01-30 2014-04-16 고려대학교 산학협력단 다시점 동영상의 부호화 및 복호화 방법 및 장치
KR100980195B1 (ko) * 2008-05-13 2010-09-03 에스케이 텔레콤주식회사 동영상 부호화 장치 및 방법
KR102125930B1 (ko) * 2011-02-16 2020-06-23 선 페이턴트 트러스트 영상 부호화 방법 및 영상 복호 방법
DK2728861T3 (en) * 2011-07-02 2017-10-23 Samsung Electronics Co Ltd Method and apparatus for multiplexing and demultiplexing video data to identify the reproduction state of video data.
CN105981389B (zh) * 2014-02-03 2019-03-01 三菱电机株式会社 图像编码装置、图像解码装置、编码流变换装置、图像编码方法以及图像解码方法
JP6665913B2 (ja) * 2018-10-17 2020-03-13 日本電気株式会社 映像解析装置、監視装置、監視システムおよび映像解析方法
US11706415B2 (en) * 2020-12-28 2023-07-18 Advanced Micro Devices, Inc. Still frame detection in video data

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06197273A (ja) * 1992-09-18 1994-07-15 Sony Corp ビデオ信号符号化方法及び装置、ビデオ信号復号化方法及び装置、又はビデオ信号記録メディア
JP2002010271A (ja) * 2000-04-20 2002-01-11 Matsushita Electric Ind Co Ltd ビデオ符号化装置
JP2003284077A (ja) * 2002-01-16 2003-10-03 Matsushita Electric Ind Co Ltd 画像符号化装置、画像符号化方法、及び画像符号化プログラム
WO2004066635A1 (ja) * 2003-01-17 2004-08-05 Matsushita Electric Industrial Co., Ltd. 動画像符号化方法および動画像復号化方法
JP2004282703A (ja) * 2002-11-05 2004-10-07 Matsushita Electric Ind Co Ltd データ処理装置
JP2007535187A (ja) * 2004-04-28 2007-11-29 松下電器産業株式会社 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法、記録方法および動画像復号化システム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4891643A (en) * 1986-09-15 1990-01-02 International Business Machines Corporation Arithmetic coding data compression/de-compression by selectively employed, diverse arithmetic coding encoders and decoders
US5461420A (en) * 1992-09-18 1995-10-24 Sony Corporation Apparatus for coding and decoding a digital video signal derived from a motion picture film source
US6002834A (en) * 1995-02-24 1999-12-14 Hitachi, Ltd. Optical disk having table relating sector address and time and optical disk reproducing apparatus
AU718453B2 (en) * 1996-07-17 2000-04-13 Sony Corporation Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks
JP4296604B2 (ja) * 1997-10-03 2009-07-15 ソニー株式会社 符号化ストリームスプライシング装置及び方法、並びに符号化ストリーム生成装置及び方法
JP3552506B2 (ja) * 1997-12-05 2004-08-11 松下電器産業株式会社 再生方法及び再生装置
US6377713B1 (en) * 1999-01-27 2002-04-23 General Instrument Corporation Synchronous DRAM bandwidth optimization for display downsizing of an MPEG-2 image
US6956971B1 (en) * 1999-07-20 2005-10-18 Lg Electronics Inc. Terminal and method for transporting still picture
EP1236350B1 (en) * 1999-11-10 2004-08-11 Thomson Licensing S.A. Digital video recording with full screen sub-picture and associated transparency control data recording for effecting fading between successive video segments at reproduction
JP2001285877A (ja) * 2000-03-31 2001-10-12 Matsushita Electric Ind Co Ltd 圧縮符号化データ復号装置および復号方法
TW527832B (en) * 2000-04-20 2003-04-11 Matsushita Electric Ind Co Ltd Video encoding apparatus that adjusts code amount by skipping encoding of image data
US7020205B1 (en) * 2000-07-12 2006-03-28 Thomson Licensing Sending progressive video sequences suitable for MPEG and other data formats
US20030012287A1 (en) * 2001-03-05 2003-01-16 Ioannis Katsavounidis Systems and methods for decoding of systematic forward error correction (FEC) codes of selected data in a video bitstream
US7437009B2 (en) 2002-01-16 2008-10-14 Matsushita Electric Industrial Co., Ltd. Image coding apparatus, image coding method, and image coding program for coding at least one still frame with still frame coding having a higher quality than normal frame coding of other frames
US8107531B2 (en) * 2003-09-07 2012-01-31 Microsoft Corporation Signaling and repeat padding for skip frames
US7792190B2 (en) * 2004-09-09 2010-09-07 Media Tek Singapore Pte Ltd. Inserting a high resolution still image into a lower resolution video stream

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06197273A (ja) * 1992-09-18 1994-07-15 Sony Corp ビデオ信号符号化方法及び装置、ビデオ信号復号化方法及び装置、又はビデオ信号記録メディア
JP2002010271A (ja) * 2000-04-20 2002-01-11 Matsushita Electric Ind Co Ltd ビデオ符号化装置
JP2003284077A (ja) * 2002-01-16 2003-10-03 Matsushita Electric Ind Co Ltd 画像符号化装置、画像符号化方法、及び画像符号化プログラム
JP2004282703A (ja) * 2002-11-05 2004-10-07 Matsushita Electric Ind Co Ltd データ処理装置
WO2004066635A1 (ja) * 2003-01-17 2004-08-05 Matsushita Electric Industrial Co., Ltd. 動画像符号化方法および動画像復号化方法
JP2007535187A (ja) * 2004-04-28 2007-11-29 松下電器産業株式会社 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法、記録方法および動画像復号化システム

Also Published As

Publication number Publication date
EP1800492A1 (en) 2007-06-27
MY149236A (en) 2013-07-31
TWI389578B (zh) 2013-03-11
TW200625965A (en) 2006-07-16
WO2006038716A1 (en) 2006-04-13
US8514938B2 (en) 2013-08-20
HK1107482A1 (en) 2008-04-03
CN101036391B (zh) 2011-01-26
KR101227330B1 (ko) 2013-01-28
JP2008516514A (ja) 2008-05-15
CN101036391A (zh) 2007-09-12
US20080075168A1 (en) 2008-03-27
KR20070063528A (ko) 2007-06-19
EP1800492B1 (en) 2012-12-12
ES2400955T3 (es) 2013-04-15

Similar Documents

Publication Publication Date Title
JP4838253B2 (ja) 画像符号化装置、画像符号化方法、画像復号化装置、画像復号化方法、および記録方法
JP4838251B2 (ja) 画像復号化装置、画像復号化方法および画像復号化システム
JP4769717B2 (ja) 画像復号化方法
CN101778235B (zh) 运动画面产生装置,编码装置,解码装置及多路复用装置
JP4947389B2 (ja) 画像信号復号装置、画像信号復号方法、および画像信号符号化方法
US7924919B2 (en) Transcoder, recorder, and transcoding method
JP2000278692A (ja) 圧縮データ処理方法及び処理装置並びに記録再生システム
JP2009207163A (ja) 復号装置および方法、記録媒体
JP4906197B2 (ja) 復号装置および方法、並びに記録媒体
JP4178521B2 (ja) 符号化映像信号の記録方法、及び映像信号符号化装置
KR100256648B1 (ko) 영상 부호화 시스템의 압축 정보 포맷
JP2006074327A (ja) ビデオデータの再符号化装置及びビデオ配信システム
JPH09233426A (ja) 符号化データ変換方法、符号化データ記録方法、符号化データ変換装置及び符号化データ記録装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110929

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4838253

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250