JP2008160398A - 動画像符号化装置および動画像符号化方法 - Google Patents

動画像符号化装置および動画像符号化方法 Download PDF

Info

Publication number
JP2008160398A
JP2008160398A JP2006346015A JP2006346015A JP2008160398A JP 2008160398 A JP2008160398 A JP 2008160398A JP 2006346015 A JP2006346015 A JP 2006346015A JP 2006346015 A JP2006346015 A JP 2006346015A JP 2008160398 A JP2008160398 A JP 2008160398A
Authority
JP
Japan
Prior art keywords
encoding
image
image data
parameter
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006346015A
Other languages
English (en)
Other versions
JP2008160398A5 (ja
Inventor
Koji Arimura
耕治 有村
Tatsuro Shigesato
達郎 重里
Hideyuki Okose
秀之 大古瀬
Kazuo Saigo
賀津雄 西郷
Hiroshi Arakawa
博 荒川
Hiroshi Tasaka
啓 田坂
Hisaki Maruyama
悠樹 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2006346015A priority Critical patent/JP2008160398A/ja
Priority to US11/954,483 priority patent/US20080151996A1/en
Publication of JP2008160398A publication Critical patent/JP2008160398A/ja
Publication of JP2008160398A5 publication Critical patent/JP2008160398A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】H.264において新規に導入された符号化パラメータを決定する際にMPEG2の符号化パラメータを利用すること。
【解決手段】本発明に係る動画像符号化装置は、MPEG2ストリームを復号化する復号化部10と、MPEG2ストリームからMPEG2の符号化パラメータを抽出する符号化パラメータ抽出部11と、符号化パラメータ抽出部11によって抽出されたMPEGの符号化パラメータに基づいて、MPEG2によって符号化された画像データとその参照画像との相関の強さを判定し、その判定結果に基づいてH.264の符号化パラメータを決定する再符号化パラメータ決定部12と、再符号化パラメータ決定部12によって決定されたH.264の符号化パラメータを用いて、復号化部10によって復号化された画像データをH.264によって符号化する符号化部13とを備える。
【選択図】図1

Description

本発明は、動画像符号化装置および動画像符号化方法に関し、特に、MPEG2によって符号化された画像データをH.264によって再符号化する際の技術に関する。
近年、AV情報のデジタル化が進み、映像信号をデジタル化して取り扱うことのできる機器が広く普及しつつある。映像信号は、膨大な情報量を有するので、記録容量および伝送効率を考慮して情報量を削減しつつ符号化することが一般的である。映像信号の符号化技術として、MPEG2やH.264という国際規格が定められている。
MPEG2とH.264とでは、画像をマクロブロックと呼ばれるブロックに分割し、マクロブロック毎に時間的な相関や周波数変換を実施する点は類似しているが、異なる部分も多い。したがって、異なる符号化方式によって符号化されたビットストリームを相互に接続したい場合や、それぞれの符号化方式にのみ対応している再生機によって再生を実現する場合は、符号化されたビットストリームを一旦復号化してから新たに再符号化する必要がある。
従来、符号化方式を変換する場合、符号化されたビットストリームを復号する際に、最初の符号化時の符号化パラメータを抽出する。そして、抽出した符号化パラメータを再符号化の際に利用する方式が提案されている(例えば、特許文献1参照)。
図10は、従来の装置の構成を示す図である。復号化部60は、MPEG2符号化ストリームを復号化する。符号化パラメータ抽出部61は、動きベクトル情報などの符号化パラメータを抽出する。符号化部62は、符号化パラメータ抽出部61によって抽出された符号化パラメータを利用して、復号化部60によって復号された画像データをMPEG2へ再符号化する。このような従来の装置によると、符号化されたビットストリームを復号化する際に抽出される動きベクトル情報を用いて、再符号化の動きベクトルを決定することが可能である。したがって、全マクロブロックの動きベクトル検出処理を行う場合に比べ、その処理演算量を大幅に削減し、かつ、再符号化時の発生符号量の増加及び画質劣化を抑え、効率の良い再符号化を実現することができる。
特開2003−9158号公報
特許文献1に記載の動画像符号化装置によれば、最初のビットストリームから抽出されたMPEG2の符号化パラメータ(例えば、動きベクトル情報)を、同じ意味のH.264の符号化パラメータ(例えば、動きベクトル)に利用することは可能である。しかしながら、H.264には、MPEG2には存在しない新たな技術(例えば、参照画像が複数枚利用可能)が導入されており、MPEG2には存在しない符号化パラメータが導入されている。そのため、従来は、H.264で新規に導入された符号化パラメータを決定する際にMPEG2の符号化パラメータを利用することができないという課題があった。
本発明は、前記課題を解決するものであって、第2の符号化方式において新規に導入された符号化パラメータを決定する際に第1の符号化方式における符号化パラメータを利用することが可能な動画像符号化装置を提供することを目的とする。
前記目的を達成するために、本発明に係る動画像符号化装置は、画像データを符号化する装置であって、第1の符号化方式によって符号化された画像データを復号化する復号化手段と、第1の符号化方式によって符号化された画像データから、第1の符号化方式における符号化パラメータである第1の符号化パラメータを抽出する抽出手段と、前記抽出手段によって抽出された第1の符号化パラメータに基づいて、第1の符号化方式によって符号化された画像データとその参照画像との相関の強さを判定する判定手段と、前記判定手段によって判定された結果に基づいて、第2の符号化方式における符号化パラメータである第2の符号化パラメータを決定する決定手段と、前記決定手段によって決定された第2の符号化パラメータを用いて、前記復号化手段によって復号化された画像データを第2の符号化方式によって符号化する符号化手段とを備える。これによって、第1の符号化パラメータに基づいて、第1の符号化方式によって符号化された画像データとその参照画像との相関の強さが判定され、その判定結果に基づいて、第2の符号化パラメータが決定される。すなわち、第2の符号化方式において新規に導入された符号化パラメータを決定する際に第1の符号化方式における符号化パラメータを利用することが可能となる。
ここで、前記判定手段は、前記画像データとその参照画像との相関の強さを示す指標として、参照画像毎にその参照画像が参照される数を判定し、前記決定手段は、多く参照される参照画像ほど優先的に、第2の符号化方式によって符号化する際の参照画像としてもよい。これによって、相関の強い参照画像だけが選択されるので、第2の符号化方式によって符号化する際の処理量を削減することが可能となる。
また、前記判定手段は、前記画像データとその参照画像との相関の強さを示す指標として、参照画像毎にその参照画像が参照される数を判定し、前記決定手段は、多く参照される参照画像ほど、第2の符号化方式における参照画像のインデックスとして、符号量の小さなインデックスを割り振ってもよい。これによって、相関の強い参照画像ほど、符号量の小さなインデックスが割り振られるので、第2の符号化方式における圧縮効率を向上させることが可能となる。
また、前記復号化手段は、MPEG2によって符号化された画像データを復号化し、前記符号化手段は、復号された画像データをH.264によって符号化してもよい。これによって、H.264において新規に導入された符号化パラメータを決定する際にMPEG2における符号化パラメータを利用することが可能となる。
なお、本発明は、このような動画像符号化装置として実現することができるだけでなく、このような動画像符号化装置が備える特徴的な手段を備える集積回路として実現したり、このような動画像符号化装置が備える特徴的な手段をステップとする動画像符号化方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
以上の説明から明らかなように、本発明に係る動画像符号化装置によれば、第1の符号化パラメータに基づいて、第1の符号化方式によって符号化された画像データとその参照画像との相関の強さが判定され、その判定結果に基づいて、第2の符号化パラメータが決定される。すなわち、第2の符号化方式において新規に導入された符号化パラメータを決定する際に第1の符号化方式における符号化パラメータを利用することが可能となる。
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
(実施の形態1)
まず、本発明の実施の形態1に係る動画像符号化装置の構成を説明する。
図1は、本発明の実施の形態1に係る動画像符号化装置の構成を示すブロック図である。この図に示されるように、動画像符号化装置は、符号化されたMPEG2ビットストリーム(MPEG2ストリーム)を入力とし、再符号化されたH.264ビットストリーム(H.264ストリーム)を出力する装置であって、復号化部10と、符号化パラメータ抽出部11と、再符号化パラメータ決定部12と、符号化部13とを備える。各部の機能を説明する前に、本発明の概要を説明する。
まず、MPEG2は、本発明に係る第1の符号化方式の一例であり、H.264は、本発明に係る第2の符号化方式の一例である。H.264では、参照画像を示すインデックスとして、RefIdxという新規な符号化パラメータが導入された。本実施の形態では、このRefIdxを決定する際、MPEG2における符号化パラメータ(動き情報)を利用する。具体的には、MPEG2によって符号化された画像データとその参照画像との相関の強さが判定され、その判定結果に基づいて、H.264における符号化パラメータ(RefIdx)が決定される。ここでは、フィールド構造またはフィールド構造のMPEG2ストリームをフィールド構造のH.264ストリームに変換することを前提としている。
図2は、フレーム構造とフィールド構造とを説明するための図である。TV画像は1ライン毎にとびとびになった2枚の画像(フィールド)によって1枚の画像(フレーム)が形成される。このような画像をインタレース画像という。一方のフィールドともう一方のフィールドとの間には1/60秒の時間差がある。MPEG2では、符号化の単位としてフィールドもしくはフレームを選択することができる。画像の動きが少ない場合は2つのフィールド間の相関が強いため、フレーム全体を用いて処理するフレーム構造を用いるほうが有利となる。一方、画像の動きが激しい場合はフィールド間の相関が弱まるため、フィールド構造を用い別々に処理したほうが有利となる。
図3は、MPEG2における予測の種類を説明するための図である。この図に示されるように、フィールド構造の場合は、フレーム予測やフィールド予測という予測方式が用いられ、フィールド構造の場合は、フィールド予測や16x8予測という予測方式が用いられる。図中の「MV/MB」は、前方向予測の場合について1マクロブロック当たりの動きベクトルの数を示している。
図4は、MPEG2におけるフレーム構造ピクチャのフレーム予測とフィールド予測とを説明するための図である。フレーム予測では、インタレースされた2つのフィールドが合成されたフレーム毎に予測する。図4(A)では、1フレーム離れた参照フレームから前方向の予測を行う場合を例示している。一方、フィールド予測では、フィールド毎に予測する。図4(B)では、トップフィールドにはMV1、ボトムフィールドにはMV2を用いて予測を行っている。参照フィールドはトップフィールドでもボトムフィールドでもよく、マクロブロックデータ中のmotion_vertical_field_selectフラグによって設定される。図4(B)では、トップフィールド/ボトムフィールドのいずれにもトップフィールドが参照フィールドとして用いられている。
図5は、MPEG2におけるフィールド構造ピクチャのフィールド予測と16x8予測とを説明するための図である。フィールド予測では、図5(A)に示されるように、16画素x16ライン(以下、単に「16x16」と記載する)毎に予想する。一方、16x8予測では、図5(B)に示されるように、16画素x16ラインのマクロブロックを上部8ラインの16x8ブロックと下部8ラインの16x8ブロックとに分割し、その分割した単位毎に予測する。図5(B)に示されるように、参照するフィールドが上部ブロックと下部ブロックとで異なってもよい。これによって、より細かな動きに対して予測効率を高めることが可能である。
以下、MPEG2におけるフレーム構造ピクチャのフレーム予測とフィールド予測とを更に詳しく説明する。ここでは、図6(A)に示されるように、参照画像(フレーム画像)が1枚である場合を想定して説明する。この場合、フィールド予測では、図6(B)に示されるように、16x16のマクロブロック毎に1個の動きベクトルを持つ。一方、フィールド予測では、図6(C)に示されるように、マクロブロックを奇数・偶数ライン毎にまとめた16x8ブロック毎に1個の動きベクトルを持ち、16x16のマクロブロック全体としては2個の動きベクトルを持つ。
次に、MPEG2のフィールド構造ピクチャのフィールド予測と16x8予測を更に詳しく説明する。ここでは、図7(A)に示されるように、参照画像(フレーム画像)が1枚である場合を想定して説明する。この場合、フィールド予測では、図7(B)に示されるように、16x16のマクロブロック毎に一つの動きベクトルを持つ。一方、フィールド予測では、図7(C)に示されるように、マクロブロックを奇数・偶数ライン毎にまとめた16x8ブロック毎に1個の動きベクトルを持ち、16x16のマクロブロック全体としては2個の動きベクトルを持つ。
MPEG2では、2枚のフレーム画像を参照することができる。その場合、各マクロブロックは、参照画像が1枚の場合の2倍の数の動きベクトルを持つことが可能である。motion_vertical_field_selectフラグは、参照画像のトップフィールド/ボトムフィールドのどちらを利用するかを示すためのフラグである。このフラグの値が「0」である場合は、参照画像のトップフィールドを利用していることを示している。一方、このフラグの値が「1」である場合は、参照画像のボトムフィールドを利用していることを示している。
次に、本発明の実施の形態における動画像符号化装置の各部の機能について説明する。この動画像符号化装置は、図1に示されるように、復号化部10と、符号化パラメータ抽出部11と、再符号化パラメータ決定部12と、符号化部13とを備える。
復号化部10は、本発明に係る復号化手段の一例であり、第1の符号化方式によって符号化された画像データを復号化する。具体的には、復号化部10は、MPEG2ストリームを復号化し、復号化した画像データを出力する。
符号化パラメータ抽出部11は、本発明に係る抽出手段の一例であり、第1の符号化方式によって符号化された画像データから、第1の符号化方式における符号化パラメータである第1の符号化パラメータを抽出する。具体的には、符号化パラメータ抽出部11は、復号化部10による復号化処理の際、符号化パラメータをMPEG2ストリームから抽出する。この符号化パラメータは、符号化時の動きベクトル情報を含み、どの参照画像をいくつのマクロブロックが参照しているかをMPEG2ストリームのフィールド毎に示す情報である。符号化パラメータ抽出部11は、フレーム構造ピクチャの場合、フィールド予測のマクロブロックではmotion_vertical_field_selectフラグを抽出し、フレーム予測のマクロブロックでは動きベクトルの垂直成分を抽出する。一方、フィールド構造ピクチャの場合、フィールド予測のマクロブロックでも16x8フィールド予測のマクロブロックでもmotion_vertical_field_selectフラグを抽出する。
再符号化パラメータ決定部12は、本発明に係る判定手段および決定手段の一例であり、抽出手段によって抽出された第1の符号化パラメータに基づいて、第1の符号化方式によって符号化された画像データとその参照画像との相関の強さを判定し、その判定結果に基づいて、第2の符号化方式における符号化パラメータである第2の符号化パラメータを決定する。言い換えると、再符号化パラメータ決定部12は、符号化パラメータ抽出部11によって抽出された符号化パラメータを利用して、フィールド構造のH.264符号化に用いる再符号化パラメータを決定する。ここでいう再符号化パラメータとは、ListやRefIdxなどである。List0は、予測の方向が主として前方であることを意味し、List1は、予測の方向が主として後方であることを意味する。RefIdxは、動き補償に必要な情報である参照ピクチャを示す参照ピクチャ番号であり、「0」をデフォルト値とする。
符号化部13は、本発明に係る符号化手段の一例であり、前記決定手段によって決定された第2の符号化パラメータを用いて、前記復号化手段によって復号化された画像データを第2の符号化方式によって符号化する。具体的には、符号化部13は、再符号化パラメータ決定部12によって決定された再符号化パラメータを用いて、復号化部10によって復号化された画像データをH.264ストリームに再符号化する。
ここで、再符号化パラメータ決定部12の機能を更に詳しく説明する。
本実施の形態では、フィールド構造のH.264ストリームに再符号化することを想定している。そのため、再符号化パラメータ決定部12は、どのフィールド画像をいくつのマクロブロックが参照しているかフィールド毎に集計する。Bピクチャを例に説明すると、符号化するフィールド毎に、前方のトップフィールド画像を参照するマクロブロック数、前方のボトムフィールド画像を参照するマクロブロック数、後方のトップフィールド画像を参照するマクロブロック数、後方のボトムフィールド画像を参照するマクロブロック数を集計する。
最も多くのマクロブロックが参照しているフィールド画像は、元のビットストリームが参照するフィールドの中では現フィールドと最も相関が強い。従って、このようなフィールド画像を再符号化の際の参照画像として選択することによって、最も高い符号化効率を得ることができる。逆にいうと、最も少ないマクロブロックが参照しているフィールド画像は、元のビットストリームが参照するフィールドの中では現フィールドと最も相関が弱い。従って、このようなフィールド画像を再符号化の際の参照画像から除いても、画像に対する影響は最も少ない。
本実施の形態では、前記のように集計した値を使って、最も相関の強い参照画像(最も画像に影響の大きい参照画像)ほど優先的に、H.264によって符号化する際の参照画像となるようにしている。例えば、最も相関の弱い参照画像を選択し、その選択画像を参照画像から省く。これによって、相関の強い参照画像だけが選択されるので、H.264によって符号化する際の処理量を削減することが可能となる。H.264は、MPEG2と比較して動きベクトルの精度が細かく、また動き補償のサイズも多種類あり、動きベクトル検索の処理量が大きい。そのため、再符号化時の処理量を削減する手法として参照画像を削減する手法を採用するのは非常に有効である。
また、本実施の形態では、最も相関の強い参照画像ほど、H.264における参照画像のインデックスとして、符号量の小さなインデックスを割り振るようにしている。例えば、最も相関の強い参照画像のインデックスとしてRefIdx「0」を割り振る。このように最も参照される参照画像のインデックスにRefIdx「0」を割り振れば、RefIdx「0」の符号量は0であるため、圧縮効率を向上させることが可能となる。
図8は、再符号化パラメータ決定部12の動作を示すフローチャートである。ここでは、フレーム構造のMPEG2ストリームをフィールド構造のH.264ストリームに変換する場合を想定している。以下でいう現ピクチャはBピクチャであるとして説明する。
まず、現ピクチャ内のマクロブロック(MB)がイントラMBかインターMBかを判定する(S402)。イントラMBの場合、参照画像はないのでカウントしない。インターMBの場合、フレーム予測かフィールド予測かを判定する(S403)。
インターMBでフレーム予測の場合、動きベクトルの垂直成分に基づいて参照フィールドを判定する。具体的には、MBに含まれる動きベクトルの垂直成分が整数精度位置か小数精度位置かを判定し、さらに整数精度位置の場合は偶数か奇数かを判定する(S405)。
動きベクトルの垂直成分が小数精度位置の場合、カウントしない。
動きベクトルの垂直成分が整数精度位置で偶数の場合、マクロブロックに含まれるトップフィールド部分は、参照画像のトップフィールドとの差分を、ボトムフィールド部分は、参照画像のボトムフィールドとの差分を符号化している。従って、現ピクチャのトップフィールドの集計で、予測方向によって、前方のトップフィールド画像を参照するマクロブロック数または後方のトップフィールド画像を参照するマクロブロック数を+1する(S406)。また、現ピクチャのボトムフィールドの集計で、予測方向によって、前方のボトムフィールド画像を参照するマクロブロック数または、後方のボトムフィールド画像を参照するマクロブロック数を+1する(S406)。
動きベクトルの垂直成分が整数精度位置で奇数の場合、マクロブロックに含まれるトップフィールド部分は、参照画像のボトムフィールドとの差分を、ボトムフィールド部分は、参照画像のトップフィールドとの差分を符号化している。従って、現ピクチャのトップフィールドの集計で、予測方向によって、前方のボトムフィールド画像を参照するマクロブロック数または後方のボトムフィールド画像を参照するマクロブロック数を+1する(S407)。また、現ピクチャのボトムフィールドの集計で、予測方向によって、前方のトップフィールド画像を参照するマクロブロック数または後方のトップフィールド画像を参照するマクロブロック数を+1する(S407)。
この判定を、マクロブロックに含まれる全ての動きベクトルについて繰り返す。
インターMBでフィールド予測の場合は、動きベクトルに関連するmotion_vertical_field_selectフラグが0か1かを判定する(S410)。motion_vertical_field_selectフラグが0の場合、この動きベクトルが現ピクチャのトップ/ボトムフィールドのどちらに属するかによって、現ピクチャのトップまたはボトムフィールドの集計で、トップフィールド画像を参照するマクロブロック数を+0.5する。予測方向も考慮すると、前方のトップフィールド画像を参照するマクロブロック数または後方のトップフィールド画像を参照するマクロブロック数を+0.5する(S411)。また、motion_vertical_field_selectフラグが1の場合、この動きベクトルが現ピクチャのトップ/ボトムフィールドのどちらに属するかによって、現ピクチャのトップまたはボトムフィールドの集計で、ボトムフィールド画像を参照するマクロブロック数を+0.5する。予測方向も考慮すると、前方のボトムフィールド画像を参照するマクロブロック数または後方のボトムフィールド画像を参照するマクロブロック数を+0.5することになる(S412)。
この判定を、マクロブロックに含まれる全ての動きベクトルについて繰り返す。
現ピクチャに含まれる全てのマクロブロックについて以上の判定を行い、現ピクチャのトップ/ボトムフィールドに含まれるMBがどの参照フィールドをいくつ参照しているかを集計する。そして、現ピクチャのトップ/ボトムフィールド毎に、参照するマクロブロック数が多い順に参照画像として決定していく。MPEG2のBピクチャの場合、最大2フレーム画像(4フィールド画像)を参照画像として利用することができる。ここで、H.264に再符号化する際の参照画像を3フィールド画像にする場合は、参照するマクロブロック数が多い順に3つのフィールド画像を参照画像として決定する。
また、H.264では、参照画像のインデックス(RefIdx)が参照画像を特定する。参照画像のインデックスは、その値が小さい方が符号化ビットが少なくてすむ。したがって、多くのMBから参照される参照画像のインデックスを小さな値にすることで、圧縮効率を向上させることができる。この参照画像のインデックスの決定においても、参照するマクロブロック数が多い順に小さなインデックスを割り振ることにしている(S415)。
図9は、再符号化パラメータ決定部12の動作を示すフローチャートである。ここでは、フィールド構造のMPEG2ストリームをフィールド構造のH.264ストリームに変換する場合を想定している。以下でいう現ピクチャはBピクチャであるとして説明する。
まず、現ピクチャ内のマクロブロック(MB)がイントラMBかインターMBかを判定する(S501)。イントラMBの場合、参照画像はないのでカウントしない。インターMBの場合、フィールド予測か16x8予測かを判定する(S503)。
インターMBでフィールド予測の場合、動きベクトルに関連するmotion_vertical_field_selectフラグが0か1かを判定する(S504)。motion_vertical_field_selectフラグが0の場合、現ピクチャ(フィールド)の集計で、トップフィールドを参照するMB数を+1する。予測方向も考慮すると、前方のトップフィールド画像を参照するマクロブロック数または後方のトップフィールド画像を参照するマクロブロック数を+1することになる(S506)。また、motion_vertical_field_selectフラグが1の場合、現ピクチャ(フィールド)の集計で、ボトムフィールドを参照するMB数を+1する。予測方向も考慮すると、前方のボトムフィールド画像を参照するマクロブロック数または後方のボトムフィールド画像を参照するマクロブロック数を+1することになる(S507)。この判定を、マクロブロックに含まれる全ての動きベクトルについて繰り返す。
インターMBで16x8予測の場合は、動きベクトルに関連するmotion_vertical_field_selectフラグが0か1かを判定する(S510)。motion_vertical_field_selectフラグが0の場合、現ピクチャ(フィールド)の集計で、トップフィールドを参照するMB数を+0.5する。予測方向も考慮すると、前方のトップフィールド画像を参照するマクロブロック数または後方のトップフィールド画像を参照するマクロブロック数を+0.5することになる(S511)。また、motion_vertical_field_selectフラグが1の場合、現ピクチャ(フィールド)の集計で、ボトムフィールドを参照するMB数を+0.5する。予測方向も考慮すると、前方のボトムフィールド画像を参照するマクロブロック数または後方のボトムフィールド画像を参照するマクロブロック数を+0.5することになる(S512)。この判定を、マクロブロックに含まれる全ての動きベクトルについて繰り返す。
現ピクチャに含まれる全てのマクロブロックについて以上の判定を行い、現ピクチャ(フィールド)に含まれるMBがどの参照フィールドをいくつ参照しているかを集計する。そして、現ピクチャ(フィールド)は、参照フィールドを、参照するマクロブロック数が多い順に参照画像として決定していく。MPEG2のBピクチャの場合、最大2フレーム画像、(4フィールド画像)を参照画像として利用することができる。ここで、H.264に再符号化する際の参照画像を3フィールド画像にする場合は、参照するマクロブロック数が多い順に3つのフィールド画像を参照画像として決定する。
また、H.264では、参照画像のインデックス(RefIdx)が参照画像を特定する。参照画像のインデックスは、その値が小さい方が符号化ビットが少なくてすむ。したがって、多くのMBから参照される参照画像のインデックスを小さな値にすることで、圧縮効率を向上させることができる。この参照画像のインデックスの決定においても、参照するマクロブロック数が多い順に小さなインデックスを割り振ることとしている(S515)。
以上の説明から明らかなように、本発明に係る動画像符号化装置によれば、MPEG2における符号化パラメータに基づいて、MPEG2によって符号化された画像データとその参照画像との相関の強さが判定され、その判定結果に基づいて、H.264における符号化パラメータが決定される。すなわち、H.264において新規に導入された符号化パラメータを決定する際にMPEG2における符号化パラメータを利用することが可能となる。これによって、MPEG2における符号化パラメータを利用することなく、H.264において新規に導入された符号化パラメータを決定する場合に比べ、大幅に処理量を削減することが可能となる。
具体的には、最も相関の強い参照画像ほど優先的に、H.264によって符号化する際の参照画像となるようにしている。例えば、最も相関の弱い参照画像を選択し、その選択画像を参照画像から省く。これによって、相関の強い参照画像だけが選択されるので、H.264によって符号化する際の処理量を削減することが可能となる。H.264は、MPEG2と比較して動きベクトルの精度が細かく、また動き補償のサイズも多種類あり、動きベクトル検索の処理量が大きい。そのため、再符号化時の処理量を削減する手法として参照画像を削減する手法を採用するのは非常に有効である。
また、最も相関の強い参照画像ほど、H.264における参照画像のインデックスとして、符号量の小さなインデックスを割り振るようにしている。例えば、最も相関の強い参照画像のインデックスとしてRefIdx「0」を割り振る。このように最も参照される参照画像のインデックスにRefIdx「0」を割り振れば、RefIdx「0」の符号量は0であるため、圧縮効率を向上させることが可能となる。
なお、前記の説明では、MPEG2における符号化パラメータ(動き情報)に基づいて、H.264において新規に導入された符号化パラメータ(RefIdx等)を決定する場合を例示したが、第1の符号化方式における符号化パラメータや第2の符号化方式における符号化パラメータは特に限定されるものではない。すなわち、実施の形態では、第1の符号化方式における符号化パラメータを利用して参照回数を集計することとしているが、これは、第1の符号化方式における符号化パラメータのまとまり(パラメータ群)についてその特性を調べていることに等しい。従って、第1の符号化方式における符号化パラメータ群の特性を判定し、その判定結果に基づいて第2の符号化方式における符号化パラメータを決定する手法を採用する以上、同様の効果を得ることができる。
また、図8や図9のフローチャートでは、Bピクチャを想定して説明したが、本発明はもちろんPピクチャに対しても適用することができる。ただし、Pピクチャでは一方向しか参照できないため、4つのフィールド画像について参照回数を集計するのはなく、2つのフィールド画像について参照回数を集計することになる。その他の点については、Bピクチャの場合と基本的に同じであるため、ここでは詳しい説明を省略する。
本発明は、動画像符号化装置および動画像符号化方法に適用でき、特に、通信機能を備えるパーソナルコンピュータ、PDA(Personal Digital Assistants)、携帯電話機およびデジタル放送の放送局等に適用することができる。
図1は、本発明の実施の形態1に係る動画像符号化装置の構成を示すブロック図である。 図2は、フレーム構造とフィールド構造とを説明するための図である。 図3は、MPEG2における予測の種類を説明するための図である。 図4は、MPEG2におけるフレーム構造ピクチャのフレーム予測とフィールド予測とを説明するための図である。 図5は、MPEG2におけるフィールド構造ピクチャのフィールド予測と16x8予測とを説明するための図である。 図6は、MPEG2におけるフレーム構造ピクチャのフレーム予測とフィールド予測とを説明するための図である。 図7は、MPEG2におけるフィールド構造ピクチャのフィールド予測と16x8予測とを説明するための図である。 図8は、再符号化パラメータ決定部12の動作を示すフローチャートである。 図9は、再符号化パラメータ決定部12の動作を示すフローチャートである。 図10は、従来の装置の構成を示す図である。
符号の説明
10 復号化部
11 符号化パラメータ抽出部
12 再符号化パラメータ決定部
13 符号化部
60 復号化部
61 符号化パラメータ抽出部
62 符号化部

Claims (7)

  1. 動画像を符号化する動画像符号化装置であって、
    第1の符号化方式によって符号化された画像データを復号化する復号化手段と、
    第1の符号化方式によって符号化された画像データから、第1の符号化方式における符号化パラメータである第1の符号化パラメータを抽出する抽出手段と、
    前記抽出手段によって抽出された第1の符号化パラメータに基づいて、第1の符号化方式によって符号化された画像データとその参照画像との相関の強さを判定する判定手段と、
    前記判定手段によって判定された結果に基づいて、第2の符号化方式における符号化パラメータである第2の符号化パラメータを決定する決定手段と、
    前記決定手段によって決定された第2の符号化パラメータを用いて、前記復号化手段によって復号化された画像データを第2の符号化方式によって符号化する符号化手段と
    を備えることを特徴とする動画像符号化装置。
  2. 前記判定手段は、前記画像データとその参照画像との相関の強さを示す指標として、参照画像毎にその参照画像が参照される数を判定し、
    前記決定手段は、多く参照される参照画像ほど優先的に、第2の符号化方式によって符号化する際の参照画像とする
    ことを特徴とする請求項1記載の動画像符号化装置。
  3. 前記判定手段は、前記画像データとその参照画像との相関の強さを示す指標として、参照画像毎にその参照画像が参照される数を判定し、
    前記決定手段は、多く参照される参照画像ほど、第2の符号化方式における参照画像のインデックスとして、符号量の小さなインデックスを割り振る
    ことを特徴とする請求項1記載の動画像符号化装置。
  4. 前記復号化手段は、MPEG2によって符号化された画像データを復号化し、
    前記符号化手段は、復号された画像データをH.264によって符号化する
    ことを特徴とする請求項1記載の動画像符号化装置。
  5. 動画像を符号化する動画像符号化方法であって、
    第1の符号化方式によって符号化された画像データを復号化する復号化ステップと、
    第1の符号化方式によって符号化された画像データから、第1の符号化方式における符号化パラメータである第1の符号化パラメータを抽出する抽出ステップと、
    前記抽出ステップにおいて抽出された第1の符号化パラメータに基づいて、第1の符号化方式によって符号化された画像データとその参照画像との相関の強さを判定する判定ステップと、
    前記判定ステップにおいて判定された結果に基づいて、第2の符号化方式における符号化パラメータである第2の符号化パラメータを決定する決定ステップと、
    前記決定ステップにおいて決定された第2の符号化パラメータを用いて、前記復号化ステップにおいて復号化された画像データを第2の符号化方式によって符号化する符号化ステップと
    を含むことを特徴とする動画像符号化方法。
  6. 動画像を符号化するためのプログラムであって、
    第1の符号化方式によって符号化された画像データを復号化する復号化ステップと、
    第1の符号化方式によって符号化された画像データから、第1の符号化方式における符号化パラメータである第1の符号化パラメータを抽出する抽出ステップと、
    前記抽出ステップにおいて抽出された第1の符号化パラメータに基づいて、第1の符号化方式によって符号化された画像データとその参照画像との相関の強さを判定する判定ステップと、
    前記判定ステップにおいて判定された結果に基づいて、第2の符号化方式における符号化パラメータである第2の符号化パラメータを決定する決定ステップと、
    前記決定ステップにおいて決定された第2の符号化パラメータを用いて、前記復号化ステップにおいて復号化された画像データを第2の符号化方式によって符号化する符号化ステップと
    をコンピュータに実行させるためのプログラム。
  7. 動画像を符号化する集積回路であって、
    第1の符号化方式によって符号化された画像データを復号化する復号化手段と、
    第1の符号化方式によって符号化された画像データから、第1の符号化方式における符号化パラメータである第1の符号化パラメータを抽出する抽出手段と、
    前記抽出手段によって抽出された第1の符号化パラメータに基づいて、第1の符号化方式によって符号化された画像データとその参照画像との相関の強さを判定する判定手段と、
    前記判定手段によって判定された結果に基づいて、第2の符号化方式における符号化パラメータである第2の符号化パラメータを決定する決定手段と、
    前記決定手段によって決定された第2の符号化パラメータを用いて、前記復号化手段によって復号化された画像データを第2の符号化方式によって符号化する符号化手段と
    を備えることを特徴とする集積回路。
JP2006346015A 2006-12-22 2006-12-22 動画像符号化装置および動画像符号化方法 Pending JP2008160398A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006346015A JP2008160398A (ja) 2006-12-22 2006-12-22 動画像符号化装置および動画像符号化方法
US11/954,483 US20080151996A1 (en) 2006-12-22 2007-12-12 Moving picture coding apparatus and moving picture coding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006346015A JP2008160398A (ja) 2006-12-22 2006-12-22 動画像符号化装置および動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2008160398A true JP2008160398A (ja) 2008-07-10
JP2008160398A5 JP2008160398A5 (ja) 2010-01-21

Family

ID=39542758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006346015A Pending JP2008160398A (ja) 2006-12-22 2006-12-22 動画像符号化装置および動画像符号化方法

Country Status (2)

Country Link
US (1) US20080151996A1 (ja)
JP (1) JP2008160398A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005303487A (ja) * 2004-04-08 2005-10-27 Victor Co Of Japan Ltd 動画像復号装置及び動画像復号プログラム
JP2006217569A (ja) * 2005-01-07 2006-08-17 Toshiba Corp 画像符号列変換装置、画像符号列変換方法および画像符号列変換プログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT1445960T (pt) * 2001-11-06 2016-11-02 Panasonic Ip Corp America Método de codificação de figuração em movimento e método de descodificação de figuração em movimento
CN1774931A (zh) * 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 对编码视频数据的内容分析
JP4179548B2 (ja) * 2003-09-24 2008-11-12 Kddi株式会社 動きベクトル検出装置
FR2867328A1 (fr) * 2004-03-02 2005-09-09 Thomson Licensing Sa Procede de decodage d'une sequence d'images codee avec echelonnabilite spatiale et temporelle
JP4252916B2 (ja) * 2004-03-18 2009-04-08 富士通マイクロエレクトロニクス株式会社 動きベクトルの探索範囲を決定する方法
US8139647B2 (en) * 2004-10-29 2012-03-20 Sharp Kabushiki Kaisha Moving image decoding apparatus and moving image decoding method
JP4480156B2 (ja) * 2005-02-02 2010-06-16 キヤノン株式会社 画像処理装置及び方法
US8155194B2 (en) * 2005-08-05 2012-04-10 Lsi Corporation Method and apparatus for MPEG-2 to H.264 video transcoding
US7912127B2 (en) * 2005-08-05 2011-03-22 Lsi Corporation H.264 to VC-1 and VC-1 to H.264 transcoding
US8045618B2 (en) * 2005-08-05 2011-10-25 Lsi Corporation Method and apparatus for MPEG-2 to VC-1 video transcoding
US7903739B2 (en) * 2005-08-05 2011-03-08 Lsi Corporation Method and apparatus for VC-1 to MPEG-2 video transcoding
US7782955B2 (en) * 2005-09-28 2010-08-24 Avisonic Technology Corporation Transcoder and transcoding method operating in a transform domain for video coding schemes possessing different transform kernels
JP4534935B2 (ja) * 2005-10-04 2010-09-01 株式会社日立製作所 トランスコーダ、記録装置及びトランスコード方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005303487A (ja) * 2004-04-08 2005-10-27 Victor Co Of Japan Ltd 動画像復号装置及び動画像復号プログラム
JP2006217569A (ja) * 2005-01-07 2006-08-17 Toshiba Corp 画像符号列変換装置、画像符号列変換方法および画像符号列変換プログラム

Also Published As

Publication number Publication date
US20080151996A1 (en) 2008-06-26

Similar Documents

Publication Publication Date Title
US10972722B2 (en) Image processing device and image processing method
US11910013B2 (en) Image encoding method using a skip mode, and a device using the method
US10623761B2 (en) Image processing apparatus and image processing method
JP5021083B2 (ja) ビットストリーム生成方法
JP5174581B2 (ja) 順方向予測インターレース映像フレームのフィールド用の動きベクトルの予測
KR102127380B1 (ko) 적중률이 높은 mpm을 통한 영상의 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
JP2024003161A (ja) 映像復号化方法
KR100446083B1 (ko) 움직임 추정 및 모드 결정 장치 및 방법
KR101811090B1 (ko) 화상 부호화 장치 및 화상 복호 장치
JP2015529065A (ja) スケーラブルビデオコーディングおよび3dビデオコーディングのための多重仮説動き補償
JP2013034162A (ja) 画像処理装置及び画像処理方法
JP2006352181A (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
JP2011501542A (ja) フレーム間予測符号化の方法および装置
JP2007201558A (ja) 動画像符号化装置および動画像符号化方法
TW201818722A (zh) 影像預測解碼方法
WO2014038330A1 (ja) 画像処理装置及び画像処理方法
JP2008004984A (ja) 画像理装置および方法、プログラム、並びに記録媒体
US20140072055A1 (en) Image processing apparatus and image processing method
JP2009206911A (ja) 動画像変換装置
JP2008160398A (ja) 動画像符号化装置および動画像符号化方法
JP2017038377A (ja) 復号化方法
JP2018088688A (ja) 復号化方法
JP2018088687A (ja) 復号化方法
JP2017028724A (ja) 復号化装置
JP2014239504A (ja) 復号化装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712