JP4968726B2 - インターフレームのための高速モード決定符号化 - Google Patents

インターフレームのための高速モード決定符号化 Download PDF

Info

Publication number
JP4968726B2
JP4968726B2 JP2006517399A JP2006517399A JP4968726B2 JP 4968726 B2 JP4968726 B2 JP 4968726B2 JP 2006517399 A JP2006517399 A JP 2006517399A JP 2006517399 A JP2006517399 A JP 2006517399A JP 4968726 B2 JP4968726 B2 JP 4968726B2
Authority
JP
Japan
Prior art keywords
mode
macroblock
check
intra
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006517399A
Other languages
English (en)
Other versions
JP2007524279A (ja
Inventor
イン,ペング
マイケル トウラピス,アレグザンドロス
マクドナルド ボイス,ジル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2007524279A publication Critical patent/JP2007524279A/ja
Application granted granted Critical
Publication of JP4968726B2 publication Critical patent/JP4968726B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

(関連出願とのクロスリファレンス)
本出願は、2003年6月25日付で出願され、「インターフレームのための高速モード決定のための方法および装置(METHOD AND APPARATUS FOR FAST MODE DECISION FOR INTERFRAMES)」と題された米国仮特許出願第60/482,331号(事件整理番号PU030164)の利益を主張するものであり、その開示内容全体を本明細書中に盛り込むものとする。
本発明は、ビデオ符号器およびビデオ復号器に関し、より具体的には、インターフレーム・モード決定を行うための符号器に関する。
JVT(Joint Video Team、合同ビデオ・チーム)ビデオ圧縮規格においては、インターフレームのためにインター符号化およびイントラ符号化の双方を使用することができる。符号器は、符号化効率および主観的品質を考慮して各マクロブロックに対するモード決定を行う必要がある。インター・モード決定は、動き推定、様々なブロックのサイズ、さらに、複数のリファレンス・ピクチャ選択に関連する。イントラ・モード決定は、様々なブロックのタイプおよび複数の空間予測選択に関連する。つまり、インターフレーム・モード決定は、符号器に大きな負荷をかけるものである。従って、必要なものは、符号化決定の演算量(complexity)を軽減するとともに、符号化効率を維持するための新たなスキームである。
(発明の概要)
従来技術のこれらのおよび他の欠点、不都合は、インターフレーム高速モード決定符号化のための装置および方法により解決される。
インター符号化されたフレームの現在のマクロブロックのモードを選択するためのビデオ符号器および対応する方法が提供される。この方法は、マクロブロック・モードのサブセットのための第1の各モードをチェックし、チェックされた第1の各モードの動きベクトル情報に応じて他のモードを選択的にチェックし、チェックされた各モードに応じて現在のマクロブロックのためのモードを選択するステップと、少なくとも1つの隣接マクロブロックのマクロブロック・モードをチェックし、少なくとも1つのチェックされた隣接マクロブロックのマクロブロック・モードに応じて現在のマクロブロックのためのモードを選択するステップと、マクロブロック・モードのサブセットのコスト(cost)をチェックし、チェックされたコストが所定の基準を満たす場合にイントラ符号化されたモードのみをさらにチェックし、チェックされた各モードに応じて現在のマクロブロックのためのモードを選択するステップと、チェックされたマクロブロック・モードに応じて早期停止閾値を調整し、調整された早期停止閾値に達している場合にチェックされたマクロブロックのモードに応じて現在のマクロブロックのためのモードを選択するステップとのうち、少なくとも1つのステップを含んでいる。
本発明のこれらの態様、特徴および利点、また、その他の態様、特徴および利点は、添付図面を参照して以下の本発明の例示的な実施の形態の説明を読むことにより明らかになるであろう。
インター符号化方法およびイントラ符号化方法の各々は、ビデオ圧縮規格に準拠したインターフレームを符号化をするために使用される。一般的に、符号器は、符号化効率および主観的品質を考慮して、各マクロブロックについて、インター符号化またはイントラ符号化の決定を行う。JVTビデオ圧縮規格においては、インター符号化により、16×16のマクロブロック内に様々なブロック・パーティションを設けること(具体的には、マクロブロックは16×16、8×16、8×8、また、8×8のサブブロックは8×8、8×4、4×8、4×4)や、複数のリファレンス・ピクチャをサポートしている。さらに、JVTは、スキップ・モードおよびイントラ・モードをサポートしている。イントラ・モードには、2つのタイプ、即ち、INTRA4×4およびINTRA16×16が存在し、INTRA4×4は、9つのモードをサポートし、INTRA16×16は、4つのモードをサポートしている。これらの選択肢の全てにより、モード決定が極めて複雑になっている。本発明の各実施の形態は、調べることが必要な、使用する可能性のある候補となるモードの数を減少させることにより、モード決定を簡略化するものである。
JVT規格(H.264およびMPEG AVCとしても知られる)では、インターフレーム(PフレームおよびBフレーム)のためにインター符号化およびイントラ符号化の双方が使用される。個々のマクロブロックの各々は、空間相関のみを用いることによりイントラとして符号化されるか、前に符号化されたフレームからの時間相関を用いてインターとして符号化される。一般的に、符号器は、符号化効率および主観的品質を考慮して各マクロブロックに対し、インター符号化またはイントラ符号化の決定を行う。通常、インター符号化は、前のピクチャから十分に予測されるマクロブロックに対して使用され、一般的に、イントラ符号化は、従前のピクチャからは十分に予測できないマクロブロックに対して使用されるか、空間アクティビティ(spatial activity)の低いマクロブロックに対して使用される。
JVT規格は、ツリー構造の階層型マクロブロック・パーティションを使用する。インター符号化された16×16画素のマクロブロックは、16×8、8×16、または、8×8画素のサイズのマクロブロック・パーティションに分割することができる。8×8画素のマクロブロック・パーティションはサブマクロブロックとしても知られている。サブマクロブロックは、さらに、8×4、4×8、および4×4画素のサイズのサブマクロブロック・パーティションに分割することができる。符号器は、マクロブロックをどのようにパーティションやサブマクロブロックのパーティションに分割するのかを、圧縮効率および主観的な品質を最高にするために、特定のマクロブロックの特性に基づいて、選定してもよい。
インター予測については、複数のリファレンス・ピクチャを使用することができ、リファレンス・ピクチャ・インデックスは、符号化され、複数のリファレンス・ピクチャのうちのどれが使用されるのかを示す。Pピクチャ(またはPスライス)においては、単一の方向予測のみが使用され、許容されるリファレンス・ピクチャは、リスト0において管理される。Bピクチャ(またはBスライス)においては、リファレンス・ピクチャの2つのリスト、即ち、リスト0およびリスト1が管理される。Bピクチャ(またはBスライス)においては、リスト0またはリスト1を使用した単一の方向予測を使用することができ、さらに、リスト0およびリスト1の双方を使用した双予測(bi‐prediction)を使用することができる。双予測が使用される場合には、リスト0の予測値(predictor)およびリスト1の予測値は、平均化されて最終予測値を形成する。
各マクロブロック・パーティションは、独立のリファレンス・ピクチャ・インデックス、予測タイプ(リスト0、リスト1、双予測)、さらに、独立の動きベクトルを有するようにしてもよい。各サブマクロブロック・パーティションは、独立の動きベクトルを有するようにしてもよいが、同一のサブマクロブロックにおける全てのサブマクロブロック・パーティションは、同一のリファレンス・ピクチャ・インデックスおよび予測タイプを使用する。
インター符号化マクロブロックでは、Pフレームは、さらに、SKIPモードをサポートし、Bフレームは、SKIPモードとDIRECTモードの双方をサポートしている。SKIPモードにおいては、動きや残差情報は符号化されない。SKIPマクロブロックに対する動き情報は、ピクチャ/スライス・タイプ(PまたはB)により特定される動きベクトル予測値、さらに、シーケンスやスライス・レベルの各パラメータなどの他の情報と同一である。さらに、動き情報は、他の時間的、または空間的に隣接するマクロブロック、さらにスライス内のマクロブロックの位置に関する。また、DIRECTモードにおいては、動き情報は符号化されず、予測残差が符号化される。マクロブロックおよびサブマクロブロックのいずれもDIRECTモードをサポートしている。
イントラ符号化されたマクロブロックでは、2つのブロック・タイプ、即ち、4×4および16×16がサポートされている。INTRA4×4は、9つの予測モード、即ち、垂直(vertical)予測、水平(horizontal)予測、DC予測、斜め下方左(diagonal down‐left)予測、斜め下方右(diagonal down‐right)予測、垂直左(vertical‐left)予測、水平下方(horizontal‐down)予測、垂直右(vertical‐right)予測、および水平上方(horizontal‐up)予測をサポートしている。INTRA16×16は、4つの予測モード、即ち、垂直予測、水平予測、DC予測、および平面(plane)予測をサポートしている。
モード決定では、インター・ピクチャは、インター・モードおよびイントラ・モードの双方をサポートする必要がある。イントラ・モードは、INTRA4×4およびINTRA16×16を含んでいる。Pピクチャでは、インター・モードは、SKIPおよび16×16、16×8、8×16、およびサブマクロブロックの8×8のパーティションを含んでいる。8×8は、さらに、8×8、8×4、4×8、および4×4のパーティションをサポートする。Bピクチャでは、マクロブロックおよびサブマクロブロックの双方のために、リスト0およびリスト1の双方、さらに、DIRECTモードが考慮される。
JVTリファレンス・ソフトウエアにおいては、レート歪み最適化(RDO:Rate‐Distortion Optimization)フレームワークがモード決定に使用される。インター・モードでは、動き推定がモード決定とは別個に考慮される。動き推定は、まず、インター・モードの全てのブロック・タイプについて実行される。次に、モード決定は、インター・モードおよびイントラ・モードの各々のコストを比較することにより行われる。最小のコストのモードが最良のモードとして選択される。
PピクチャまたはBピクチャにおける1つのマクロブロックsを符号化する処理を以下に要約する。最後に復号化されたピクチャ、ラグランジュ乗数λMODE、λMOTION、およびマクロブロック量子化特性値(macroblock quantizer)QPが与えられているものとする。
ステップ1:使用する可能性のあるマクロブロック・モードのリファレンス・ピクチャおよび動きベクトルの各々に対し、以下の値が最小になるように動き推定およびリファレンス・ピクチャの選択を行う。
Figure 0004968726

(等式1)
この等式において、sは、オリジナルのビデオ信号であり、cは、符号化されたビデオ信号であり、mは、現在考慮されている動きベクトルである。REFは、リファレンス・ピクチャを示し、pは、動きベクトル符号化の間の予測に使用される動きベクトルである。R(m‐p)は、動きベクトルを符号化するために使用されるビットを表す。R(REF)は、リファレンス・ピクチャを符号化するためのビットである。SA(T)Dは、当初の信号と動きベクトルにより予測されたリファレンス信号との間の(変換された)差の絶対値の和(Sum of Absolute (Transformed) Differences)である。
ステップ2:以下の値が最小になるようにマクロブロック予測モードを選択する。
Figure 0004968726

(等式2)
QPおよびλMODEが与えられ、MODEは可変である。SSDは、当初の信号および再構築された信号との間の自乗差の和(Sum of Square Differences)である。R(s,c,MODE)は、マクロブロック・ヘッダ、動き係数、および全てのDCT係数を含むMODEの選択に関連するビットの数である。MODEは、使用する可能性のあるマクロブロック・モードのセット(集合)の中のモードを示す。
Figure 0004968726


INTRA4×4は次のモードを含んでいる。
Figure 0004968726


INTRA16×16は次のモードを含んでいる。
Figure 0004968726
この説明は、発明の原理を例示するものである。従って、当業者であれば、本明細書に明確に記載、図示されていなくとも、本発明の原理を実施する様々な構成を考案することが可能であり、このような構成の各々が本発明の精神および範囲に包含されることが理解できるであろう。
本明細書に記載された全ての例および条件付の文言は、本発明の原理を読者が理解するのを助けるための教示目的のものであり、発明者により寄与された概念は、技術を発展させるものであり、このような具体的に記載された例や条件に限定されるように解釈されるべきではない。
また、本明細書における本発明の原理、態様、および、実施の形態についての全ての記載、さらに、その特定の例は、構造的、機能的な均等物を包含するように意図したものである。さらに、このような均等物は、現在公知の均等物だけでなく、将来において開発される均等物、即ち、構造に係らず、同一の機能を実行するように開発された全ての要素を包含するように意図されている。
従って、例えば、当業者であれば、本明細書において示されたブロック図は、本発明の原理を実施する回路を例示する概念図であることが理解できよう。同様に、フローチャート、フロー図、状態遷移図、擬似コードなどは、いずれも様々な処理を表す。これらの処理は、実質的にコンピュータにより読み取り可能なメディアにおいて表すことができ、コンピュータまたはプロセッサにより実行され、このようなコンピュータまたはプロセッサがはっきりと図示されているかどうかに係るものではない。
各図面において示される様々な要素の機能は、専用のハードウエアの使用により提供されてもよく、適切なソフトウエアと関連付けてソフトウエアを実行することが可能なハードウエアの使用により提供されてもよい。機能が、プロセッサにより提供される場合にも、単一の専用プロセッサにより提供されてもよく、単一の共有プロセッサにより提供されてもよく、複数の別個のプロセッサにより提供されてもよく、幾つかのプロセッサが共有されていてもよい。さらに、用語「プロセッサ」または「コントローラ」を明示的に使用した場合であっても、ソフトウエアを実行することが可能なハードウエアのみを意味するように解釈されるべきではなく、限定するものではないが、ディジタル信号プロセッサ(DSP:digital signal processor)ハードウエア、ソフトウエアを格納する読み出し専用メモリ(ROM:read‐only memory)、ランダム・アクセス・メモリ(RAM:random access memory)、および不揮発性の記憶装置を含んでいる。
また、従来のおよび/または慣習的な他のハードウエアを含むこともある。同様に、図面に示されたどのスイッチも概念的なものに過ぎない。これらの機能はプログラム・ロジックの動作を介して、専用のロジックを介して、プログラム制御と専用のロジックとのインタラクションを介して、または、手動でも実行されることがある。文脈からより具体的に理解できるように、実施者により、特定の技術を選択可能である。
請求の範囲において、特定の機能を実施するための手段として表現されたいずれの要素も、この機能をどのような方法で実行するものも包含するように意図している。例えば、a)機能を実行する回路要素を組み合わせたもの、または、b)いかなる形態のソフトウエア、つまり、ファームウエア、マイクロコード等を含むもの、機能を実施するためにソフトウエアを実行する適当な回路と組み合わせたものも包含する。このような請求の範囲により定義される発明は、請求の範囲により要求されているように、様々な記載された手段により提供される機能性が組み合わされ、まとめられるという事実に基づいたものである。従って、出願人は、このような機能性を提供することが可能な手段はどのようなものであっても、本願において示されているものと均等であるとみなす。
図1を参照すると、ビデオ符号器が概ね参照符号100により示されている。符号器100に対する入力は、加算接合部(summing junction)110の非反転入力と信号通信するように結合されている。加算結合部110の出力はブロック変換器120と信号通信するように結合されている。変換器120は、量子化器130と信号通信するように結合されている。量子化器130の出力は、可変長符号器(VLC:variable length coder)140と信号通信するように結合され、VLC140の出力は、符号器100の外部的に利用可能な出力である。
さらに、量子化器130の出力は、逆量子化器150と信号通信するように結合される。逆量子化器150は、逆ブロック変換器160と信号通信するように結合される。また、逆ブロック変換器160は、リファレンス・ピクチャ記憶装置170と信号通信するように結合される。リファレンス・ピクチャ記憶装置170の第1の出力は、動き推定器180の第1の入力と信号通信するように結合される。さらに、符号器100への入力は、動き推定器180の第2の入力と信号通信するように結合される。動きベクトルを示す動き推定器180の出力は、動き補償器190の第1の入力と信号通信するように結合される。リファレンス・ピクチャ記憶装置170の第2の出力は、動き補償器190の第2の入力と信号通信するように結合される。動き補償されたリファレンス・ピクチャを示す動き補償器190の出力は、加算結合部110の反転入力と信号通信するように結合される。
図2に、ビデオ復号器が概ね参照符号200により示されている。ビデオ復号器200は、可変長復号器(VLD:variable length decoder)210を備え、VLD210は、逆量子化器220と信号通信するように結合されている。逆量子化器220は、逆変換器230と信号通信するように結合される。逆変換器230は、加算器または加算結合部240の第1の入力端子と信号通信するように結合され、加算結合部240の出力は、ビデオ復号器200の出力を提供する。加算結合部240の出力は、リファレンス・ピクチャ記憶装置250と信号通信するように結合される。リファレンス・ピクチャ記憶装置250は、動き補償器260と信号通信するように結合され、動き補償器260は、加算結合部240の第2の入力端子と信号通信するように結合される。
図3に、Pピクチャにおけるマクロブロックのための動きベクトル決定符号化のための例示的な処理が概ね参照符号400により示されている。同様の処理をBピクチャに適用してもよい。この処理は、機能ブロック420に制御を受け渡す開始ブロック410を含んでいる。機能ブロック420は、SKIPモードおよび16×16モードおよびをチェックし、制御を決定ブロック422に受け渡す。機能ブロック422は、SKIPモードにおける(等式2)における関数値Jが16×16モードの関数値Jよりも小さく、16×16モードに残差が無いという条件が満たされているかどうかを決定し、これらの条件が満たされていない場合には、制御を機能ブロック426に受け渡す。これらの条件が満たされている場合には、制御が決定ブロック424に移行する。決定ブロック424は、SKIPモードが16×16モードの場合と同じ動き情報を有するかどうかをチェックし、同じ情報を有さない場合には、制御を機能ブロック426に受け渡し、同じ情報を有する場合には、制御を機能ブロック438に受け渡し、他のインター・モードをチェックすることをスキップする。
機能ブロック426は、8×8モードのチェックを行い、制御を決定ブロック428に受け渡す。決定ブロック428は、8×8モードが16×16モードの場合と同じ動き情報を有するかどうかをチェックし、同じ情報を有する場合には、制御を機能ブロック432に受け渡し、同じ情報を有さない場合には、制御を機能ブロック430に受け渡す。次に、機能ブロック430は16×8モードおよび8×16モードをチェックし、制御を機能ブロック432に受け渡す。次に、機能ブロック432は、4×4モードをチェックし、制御を決定ブロック434に受け渡す。決定ブロック434は、4×4モードが8×8モードの場合と同じ動き情報を有するかどうかをチェックし、同じ情報を有する場合には、制御を機能ブロック438に受け渡し、同じ情報を有さない場合には、制御を機能ブロック436に受け渡す。機能ブロック436は、8×4モードおよび4×8モードをチェックし、制御を機能ブロック438に受け渡す。機能ブロック438は、各イントラ・モードをチェックし、制御を機能ブロック440に受け渡す。機能ブロック440は、最良のモードを選択する。機能ブロック440は、制御をエンド・ブロック450に受け渡す。
図4に、マクロブロックのためのミックスド・インター/イントラ(mixed inter and intra)決定符号化の例示的な処理が概ね参照符号500により示されている。この処理は、制御を機能ブロック520に受け渡す開始ブロック510を含んでいる。機能ブロック520は、SKIPモードおよび16×16モードをチェックし、制御を決定ブロック560に受け渡す。決定ブロック560は、SKIPモードのために評価される関数値Jと16×16モードのために評価される関数値Jの間の最小値であるMC2が閾値T1よりも大きいかをチェックし、閾値T1よりも大きい場合には、制御を機能ブロック570に受け渡し、閾値T1よりも大きくない場合には、制御を決定ブロック562に受け渡す。
ブロック562は、ブロック560からの値MC2が閾値T2よりも大きいかどうかをチェックし、比較を行う。閾値T2よりも大きくない場合には、ブロック562は、制御を機能ブロック568に受け渡し、閾値T2よりも大きい場合には、制御を機能ブロック564に受け渡す。機能ブロック564は、INTRA4×4DCモードをチェックし、制御を決定ブロック566に受け渡す。決定ブロック566は、INTRA4×4DCモードのために評価される関数値Jが値aに値MC2を乗算したものにbを加算したものよりも小さいかどうかを判定し、小さくない場合には、制御を機能ブロック568に受け渡し、小さい場合には、制御を機能ブロック570に受け渡す。機能ブロック568は、他の各インター・モードをチェックし、制御を機能ブロック570に受け渡す。次に、機能ブロック570は、他の各イントラ・モードをチェックし、制御を機能ブロック572に受け渡す。機能ブロック572は、最良のモードを選択し、制御をエンド・ブロック580に受け渡す。
従って、本発明の好ましい実施の形態においては、使用する可能性のあるモードの数を減少させることによりインターフレームのためのモード決定における演算量を低減するために新しいアルゴリズムが提供される。モードは、2つのカテゴリ、即ち、インター・モードおよびイントラ・モードに分割される。インター・モードは、SKIP(およびBピクチャのためのDIRECT)モード、異なるブロック・タイプ(具体的には、16×16、16×8、8×16、8×8、8×4、4×8、4×4)を含んでいる。イントラ・モードは、INTRA4×4およびINTRA16×16を含んでいる。説明のため、Pピクチャを使用する。同じ考え方をBピクチャにも適用することが可能である。Bピクチャについては、このような例示的な実施の形態に係るアルゴリズムにおいて、SKIPモードおよびDIRECTモードが同様に扱われ、サブマクロブロック・パーティションにおいては、また、サブマクロブロックのための最良のモードを選択するのにDIRECTモードが考慮される。
各実施の形態は、4つの技術的なカテゴリを提供し、これらは、一緒に、または、別個に適用される。
1つのカテゴリは動きベクトル決定のためのものである。このカテゴリにおいては、まず、二次モード(quadratic modes)、即ち、SKIP、16×16、8×8、4×4をチェックする。つまり、「二次モード」は、チェックされるべきモードの特定のサブセット(部分集合)であり、これらは4つのモード、SKIP、16×16、8×8、および4×4である。他の非二次モードをチェックする必要性は、二次モードの(動き自体、動きベクトルの予測値およびリファレンス値(motion vector predictor and reference))を含む動きベクトル情報に基づくものである。このカテゴリの決定は、1つのオブジェクトを分割するような小さなブロック・サイズよりも1つのオブジェクトを含むような最大のブロック・サイズを選択する方が効率がよいという前提に基づく。まず、SKIPモードおよび16×16モードをチェックし、J(SKIP)<J(16×16)(簡略化のため、MODEを評価する(等式2)の場合の関数Jを表すためにJ(MODE)と記載する)であり、16×16に残差が無い場合、SKIPが16×16の場合と同様の動きベクトル情報を有するかどうかをチェックする。16×16の場合と同様の動きベクトル情報を有する場合には、SKIPが選択され、他のインター・モードをチェックする必要はない。16×16の場合と同様の動きベクトル情報を有さない場合には、16×16および8×8をチェックし、これらが同様の動きベクトル情報を有する場合、即ち、4つの8×8動きベクトルが1つの16×16と同じ情報を有している場合には、16×8、8×16をチェックしないが、そうでない場合には、まず、16×8、8×16のそれぞれのために(等式1)における上述した動きベクトルおよびリファレンス選択を実行する。16×8が16×16の場合と同様の動き情報を有する場合には、RDO計算は必要とはならない。なぜならば、J(16×8)は、J(16×16)よりも大きいと考えられるからである。
必要ではないが、動きベクトルの予測値をこのような決定の範囲内にすることも考えられる。なぜならば、動きベクトルの予測値が同一であれば、J(16×16)が小さくなることが確かだからである。同じ処理を8×16に対しても行うことができる。次に、4×4をチェックする。8×8ブロックにおけるサブパーティションの各々に対し、4つの4×4の各々の動きベクトルが8×8のブロックの場合と同一の値を有する場合には、4×8および8×4をチェックする必要がない。そうでない場合には、まず、4×8および8×4の各々のために動きベクトルおよびリファレンス選択を実行する。2つの8×4のブロックが8×8のブロックと同じ動き値を有する場合には、RDO計算が必要でない。なぜならば、J(8×4)は、J(8×8)よりも大きいと考えられるからである。同じ処理を4×8のために行うことも可能である。図3は、動きベクトル決定の例を示している。この処理は、整数動き推定の直後に実行することもできる。上述した各モードの整数動きベクトルが同一であれば、サブピクセル・リファインメント(sub‐pixel refinement)を完全に回避することができ、演算量をさらに低減させることができる。
別のカテゴリは、隣接(neighborhood)決定のために使用される。H.264は、ブロック符号化構造を使用し、オブジェクトは、ブロック境界を越えることが多い。このカテゴリにおいては、モード決定をより高速に行うために隣接情報を利用する。
上側のマクロブロックのモードが16×16であり、左側のマクロブロックが16×8である場合には、現在のマクロブロックは16×8である可能性が高い。必要であれば、右上や、以前のピクチャ、またはリファレンス・ピクチャにおいて共に位置した(co‐located)ものなど、他の隣接したマクロブロックのモードを考慮することにより、このアプローチをさらに推し進めることができる。この場合、SKIP、16×16、および16×8のみをチェックすればよく、他のインター・モードを完全に無視することができる。8×16についても同様に考慮することができる。具体的には、左側のマクロブロックが16×16であり、上側のマクロブロックが8×16である場合には、SKIP、16×16、および8×16のみをチェックすればよい。同様の基準をサブマクロブロック・モード決定にも使用することができる。即ち、上側の8×8ブロックのモードが8×8であり、左側のモードが8×4である場合には、8×4のみを調べればよい。上側の8×8のモードが4×8であり、左側のモードが8×8であれば、4×8のみをチェックすればよい。上側マクロブロックおよび左側マクロブロックのモードがイントラであれば、SKIP、16×16、およびイントラ・モードのみをチェックすればよい。
比較的に同様の決定を時間的に隣接したマクロブロック(即ち、共に位置する(co‐located)マクロブロック)を用いることにより適用することができる。具体的には、特定のモード(即ち、16×16)を調べた後、最良のモードと関連する動き情報がこの時間的に隣接したマクロブロックのものと同一である場合には、直ちにモード決定を終了し、これ以上他のモードを調べることを回避することができる。この処理は、関連する歪みを考慮することによりさらに良好に行うこともできる(例えば、現在のマクロブロックの歪みが共に位置するマクロブロックの歪みや他の時間的および/または空間的に隣接したマクロブロックの歪みよりも少ない場合、終了するのが正しい可能性がより高くなる)。
さらに別のカテゴリは、ミックスド・インター/イントラ・モード決定のためのものである。一般的に、全てのインター・モードはイントラ・モードの前にチェックされる。このカテゴリにおいては、インター・モードおよびインター・モードのチェックする順番をミックスさせた技術を紹介する。2つの閾値(T1およびT2、T1>T2)が設定される。まず、SKIPおよび16×16をチェックする。MC2で示すこれらの2つの最小のコストがT1よりも大きい場合には、継続してイントラ・モードをチェックし、他のインター・モードはチェックしない。MC2がT2よりも大きい場合には、まず、INTRA4×4DCモードをチェックする。コストがa×MC2+b(aおよびbは所与のウエイト/オフセット・パラメータ)よりも小さい場合には、イントラ・モードのみがチェックされ、そうでない場合には、インター・モードおよびイントラ・モードの双方がチェックされる。図4は、ミックスド・インター/イントラ・モード決定の例を示している。
別のカテゴリは早期停止決定のためのものである。使用する可能性のある全てのモードを完全にチェックする代わりに、本発明の好ましい実施の形態においては、高速モード決定に達するための早期停止基準を使用する。各早期停止基準は、適応閾値処理メカニズム(adaptive thresholding mechanism)に基づいて行われる。1つの特定のモードに対する1つの閾値が満たされた場合には、他の残ったモードをチェックすることやめる。(等式4)において本発明における1つのモードT(モード)のためにどのように閾値処理Tを選定するかの例が示されている。この等式において、α(モード)およびβ(モード)は、1つのモードのためのスカラー(scalars)である。COSTは、(等式1)、(等式2)におけるJ、SAD、またはSSDとすることができ、COSTは、i番目の隣接ブロックのコストを示す。
Figure 0004968726
本発明のこれらの特徴および利点、また、その他の特徴および利点は、本明細書の開示内容に基づいて関連する技術分野における当業者であれば容易に確認することができるであろう。本発明の原理が、ハードウエア、ソフトウエア、ファームウエア、特定用途プロセッサ、またはこれらを組み合わせた様々な形態で実施可能であることが理解できよう。
最も好ましくは、本発明の原理は、ハードウエアとソフトウエアとを組み合わせることにより実行される。さらに、ソフトウエアは、プログラム記憶装置に具体的な形態に実装されたアプリケーション・プログラムとして実施されることが好ましい。アプリケーション・プログラムは、好ましいアーキテクチャーを有するマシンに対してアップロードされ、このマシンにより実行可能なものであってもよい。好ましくは、マシンは、1つ以上の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、入出力(I/O)インターフェースを備えるコンピュータ・プラットフォーム上で実施される。このコンピュータ・プラットフォームは、オペレーション・システムとマイクロインストラクション・コードをさらに備えるものであってもよい。本明細書において記載された様々な処理および機能は、マイクロインストラクション・コードの一部であってもよいし、アプリケーション・プログラムの一部であってもよいし、これらを組み合わせたものであってもよく、CPUにより実行されるものでもよい。さらに、コンピュータ・プラットフォームには、追加のデータ記憶装置や、印刷機等、周辺機器を接続するようにしてもよい。
さらに、添付図面に描かれた構成要素としてのシステム・コンポーネントおよび方法の幾つかは、好ましくはソフトウエアの形態で実施されるため、システム・コンポーネントまたは処理機能ブロック間の実際の接続は、本発明の実施の形態のプログラムの仕方により異なるものであることが理解できよう。本明細書の開示内容に基づいて、関連する技術分野の当業者であれば、これらの本発明の実施例、構成例、また、同様の構成例、実施例を企図することも可能であろう。
添付図面を参照して例示的な実施の形態を説明したが、本発明はこのような具体的な実施の形態に限定されるものではなく、関連する技術分野の当業者であれば、このような実施の形態に対し、本発明の範囲または精神を逸脱することなく、様々な変形、改変が可能であることが理解できるであろう。このような変形、改変は全て、付随する請求の範囲に記載された本発明の範囲に含まれるように意図されたものである。
図1は、本発明の実施の形態に係る高速モード決定のためのビデオ符号器のブロック図である。 図2は、ビデオ復号器のブロック図である。 図3は、本発明の実施の形態に係る例示的な動きベクトル符号化決定処理のフローチャートである。 図4は、本発明の実施の形態に係る例示的なミックスド・イントラ/インター符号化決定処理のフローチャートである。

Claims (4)

  1. H.264/MPEG AVCビデオ符号化においてインター符号化されたフレームの現在のマクロブロック・モードを選択する方法であって、前記マクロブロック・モードは、
    Figure 0004968726
    Figure 0004968726
    であり、前記INTRA4×4モードは、
    Figure 0004968726
    であり、前記INTRA16×16は、
    Figure 0004968726
    のモードを含んでおり、
    前記方法は、
    所与の量子化パラメーターQPで、SKIP及び16×16モードについて、前記SKIPモードの値Jが前記16×16モードのJよりも小さく、かつ、前記16×16モードに残差が無いかどうかをチェックするステップであって、Jは、当初の信号と再構築された信号との間の自乗差の和と、ラグランジュ乗数λMODEとマクロブロック・ヘッダ、動き係数及び全てのDCT係数のビットを含む現在のモードに関連して要求されるビットの数Rとの積と、の和値である、当該ステップと、
    前記チェックの結果が偽である場合は、8×8モードのチェックを続けるステップと、
    前記チェックの結果が真である場合は、前記SKIPモードが前記16×16モードと同じ動き情報を有するかどうかをチェックするステップであって、
    当該チェックの結果が偽である場合は、8×8モードの前記チェックを続け、
    当該チェックの結果が真である場合は、イントラ・モードのチェックを続ける、当該ステップと、
    前記8×8モードをチェックし、かつ、前記8×8モードが前記16×16モードと同じ動き情報を有するかどうかを判定するステップと、
    当該判定の結果が真である場合は4×4モードのチェックを続け、当該判定の結果が偽である場合は16×8モード及び8×16モードをチェックし、これらのモードが前記16×16モードと同じ動き情報を有する場合は4×4モードのチェックを続けるステップと、
    前記4×4モードをチェックし、かつ、前記4×4モードが前記8×8モードと同じ動き情報を有するかどうかを判定するステップと、
    当該判定の結果が真である場合はイントラ・モードのチェックを続け、当該判定の結果が偽である場合は8×4モード及び4×8モードをチェックし、これらのモードが前記8×8モードと同じ動き情報を有する場合はイントラ・モードのチェックを続けるステップと、を有し、
    各マクロブロック・モードに符号化コストの閾値が存在しており、現在のマクロブロックについて現在チェックされているモードの符号化コストに関して対応する閾値が満たされている場合には、現在のマクロブロックについて現在チェックされている当該モードが選択され、残りのチェックされていないモードのチェックが中止される、前記方法。
  2. 前記符号化コストの閾値T(mode)が、下記のように計算され、
    T(mode) = α(mode)*Tn + β(mode)
    Tn = MAX(COSTlowbound, MIN(COSThighbound, COST1, COST2, ..., COSTn)),
    上記式において、α(mode)およびβ(mode)は1つのモードのためのスカラーであり、COSTはi番目の隣接ブロックの符号化コストを示す、請求項1に記載の方法。
  3. 空間的または/および時間的に隣接しているマクロブロック及びブロック・パーティション情報は、チェックが必要なモードを決定することに使用される、請求項1に記載の方法。
  4. 特定のモードを調べた後、空間的または/および時間的に隣接しているマクロブロックが現在のマクロブロックの動き情報と特定の関係を有する場合にモード選択処理が終了する、請求項1に記載の方法。
JP2006517399A 2003-06-25 2004-06-17 インターフレームのための高速モード決定符号化 Expired - Lifetime JP4968726B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US48233103P 2003-06-25 2003-06-25
US60/482,331 2003-06-25
PCT/US2004/019527 WO2005004491A1 (en) 2003-06-25 2004-06-17 Fast mode-decision encoding for interframes

Publications (2)

Publication Number Publication Date
JP2007524279A JP2007524279A (ja) 2007-08-23
JP4968726B2 true JP4968726B2 (ja) 2012-07-04

Family

ID=33563851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006517399A Expired - Lifetime JP4968726B2 (ja) 2003-06-25 2004-06-17 インターフレームのための高速モード決定符号化

Country Status (10)

Country Link
US (1) US9210441B2 (ja)
EP (1) EP1639827B1 (ja)
JP (1) JP4968726B2 (ja)
CN (1) CN100594730C (ja)
BR (1) BRPI0411765A (ja)
DE (1) DE602004026580D1 (ja)
ES (1) ES2343410T3 (ja)
MX (1) MXPA05014211A (ja)
MY (1) MY143420A (ja)
WO (1) WO2005004491A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10652570B2 (en) 2016-01-15 2020-05-12 Nec Corporation Moving image encoding device, moving image encoding method, and recording medium for recording moving image encoding program

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4610195B2 (ja) 2001-12-17 2011-01-12 マイクロソフト コーポレーション スキップマクロブロックコード化
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
KR20050061762A (ko) * 2003-12-18 2005-06-23 학교법인 대양학원 부호화 모드 결정방법, 움직임 추정방법 및 부호화 장치
US7881386B2 (en) * 2004-03-11 2011-02-01 Qualcomm Incorporated Methods and apparatus for performing fast mode decisions in video codecs
JP4031455B2 (ja) * 2004-03-29 2008-01-09 株式会社東芝 画像符号化装置
JP2005348093A (ja) * 2004-06-03 2005-12-15 Sony Corp 画像処理装置、そのプログラムおよびその方法
KR100654436B1 (ko) * 2004-07-07 2006-12-06 삼성전자주식회사 비디오 코딩 방법과 디코딩 방법, 및 비디오 인코더와디코더
US8649436B2 (en) * 2004-08-20 2014-02-11 Sigma Designs Inc. Methods for efficient implementation of skip/direct modes in digital video compression algorithms
JP4501676B2 (ja) * 2004-12-22 2010-07-14 日本電気株式会社 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム
CN100338957C (zh) * 2005-06-20 2007-09-19 浙江大学 一种复杂度可分级的模式选择方法
US9077960B2 (en) 2005-08-12 2015-07-07 Microsoft Corporation Non-zero coefficient block pattern coding
CN100397906C (zh) * 2005-08-24 2008-06-25 天津大学 一种视频信息的快速帧间模式选择方法
US8155189B2 (en) 2005-10-19 2012-04-10 Freescale Semiconductor, Inc. System and method of coding mode decision for video encoding
US7916796B2 (en) 2005-10-19 2011-03-29 Freescale Semiconductor, Inc. Region clustering based error concealment for video data
US9479794B2 (en) 2005-11-10 2016-10-25 Freescale Semiconductor, Inc. Resource efficient video processing via prediction error computational adjustments
US8788933B2 (en) 2005-12-01 2014-07-22 Nokia Corporation Time-shifted presentation of media streams
US8170102B2 (en) * 2005-12-19 2012-05-01 Seiko Epson Corporation Macroblock homogeneity analysis and inter mode prediction
US7693219B2 (en) 2006-01-04 2010-04-06 Freescale Semiconductor, Inc. System and method for fast motion estimation
JP2007251923A (ja) * 2006-02-15 2007-09-27 Mitsubishi Electric Corp 画像符号化装置および画像符号化方法
US8306118B1 (en) * 2006-03-01 2012-11-06 Maxim Integrated, Inc. High quality low bitrate video coding by enabling and disabling a non-residual mode
US7889789B2 (en) 2006-04-07 2011-02-15 Microsoft Corporation Making interlace frame level coding mode decisions
US20080002770A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Methods, apparatus, and a computer program product for providing a fast inter mode decision for video encoding in resource constrained devices
KR100773761B1 (ko) 2006-09-14 2007-11-09 한국전자통신연구원 동영상 부호화 장치 및 방법
GB0619570D0 (en) * 2006-10-04 2006-11-15 Univ Bristol Complexity scalable video transcoder and encoder
US9883202B2 (en) 2006-10-06 2018-01-30 Nxp Usa, Inc. Scaling video processing complexity based on power savings factor
US8467448B2 (en) 2006-11-15 2013-06-18 Motorola Mobility Llc Apparatus and method for fast intra/inter macro-block mode decision for video encoding
US8311120B2 (en) * 2006-12-22 2012-11-13 Qualcomm Incorporated Coding mode selection using information of other coding modes
US8594187B2 (en) * 2007-03-02 2013-11-26 Qualcomm Incorporated Efficient video block mode changes in second pass video coding
CN100558169C (zh) * 2007-03-23 2009-11-04 武汉大学 视频转码中帧间模式的快速选择方法
JP5666293B2 (ja) * 2007-04-12 2015-02-12 トムソン ライセンシングThomson Licensing ビデオ・エンコーディング、およびデコーディングのためのスキップ/ダイレクトモードのコンテクストに依存するマージのための方法と装置
KR101680951B1 (ko) * 2007-04-12 2016-11-29 톰슨 라이센싱 비디오 인코더에서 고속으로 기하학적 모드를 결정하기 위한 방법들 및 장치
US20080260029A1 (en) * 2007-04-17 2008-10-23 Bo Zhang Statistical methods for prediction weights estimation in video coding
US20100101740A1 (en) * 2007-05-24 2010-04-29 Licciardi Di Stefano Carmelo Joseph Connector
FR2916931A1 (fr) * 2007-05-29 2008-12-05 Thomson Licensing Sas Procede de selection d'une donnee de codage et dispositif de codage implementant ledit procede
WO2008148272A1 (en) * 2007-06-04 2008-12-11 France Telecom Research & Development Beijing Company Limited Method and apparatus for sub-pixel motion-compensated video coding
CN101682763B (zh) * 2007-06-12 2013-09-11 汤姆森许可贸易公司 支持针对片数据的多通路视频语法结构的方法和设备
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
KR101555327B1 (ko) * 2007-10-12 2015-09-23 톰슨 라이센싱 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치
US8295342B2 (en) * 2007-11-14 2012-10-23 International Business Machines Corporation Method and system for efficient video compression with low-complexity encoder
CN100594732C (zh) * 2007-11-16 2010-03-17 中国科学院计算技术研究所 一种帧间模式选择方法
FR2925819A1 (fr) * 2007-12-21 2009-06-26 Thomson Licensing Sas Procede de codage double passe par macrobloc
KR20090095316A (ko) * 2008-03-05 2009-09-09 삼성전자주식회사 영상 인트라 예측 방법 및 장치
CN101965733B (zh) * 2008-03-09 2013-08-07 Lg电子株式会社 用于编码或解码视频信号的方法和设备
US8982951B2 (en) * 2008-03-10 2015-03-17 Mediatek Inc. Adaptive motion estimation coding
JP4990927B2 (ja) * 2008-03-28 2012-08-01 三星電子株式会社 動きベクトル情報の符号化/復号化方法及び装置
JP2009272969A (ja) * 2008-05-09 2009-11-19 Hitachi Ltd 画像符号化装置及び画像符号化方法、画像復号化装置及び画像復号化方法
CN101867818B (zh) * 2008-06-06 2012-08-29 浙江大学 宏块模式的选择方法和装置
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US8619856B2 (en) * 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8483285B2 (en) 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
US20110261876A1 (en) * 2008-10-17 2011-10-27 Yih Han Tan Method for encoding a digital picture, encoder, and computer program element
KR101173560B1 (ko) * 2008-12-15 2012-08-13 한국전자통신연구원 고속 모드 결정 장치 및 방법
US9288494B2 (en) 2009-02-06 2016-03-15 Thomson Licensing Methods and apparatus for implicit and semi-implicit intra mode signaling for video encoders and decoders
WO2010110126A1 (ja) 2009-03-23 2010-09-30 株式会社エヌ・ティ・ティ・ドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法、及び画像予測復号プログラム
US8498330B2 (en) * 2009-06-29 2013-07-30 Hong Kong Applied Science and Technology Research Institute Company Limited Method and apparatus for coding mode selection
JP5216710B2 (ja) * 2009-07-24 2013-06-19 日立コンシューマエレクトロニクス株式会社 復号化処理方法
EP2471264A1 (en) * 2009-08-28 2012-07-04 France Brevets Method for coding a sequence of images
WO2011129619A2 (ko) 2010-04-13 2011-10-20 삼성전자 주식회사 트리 구조 부호화 단위에 기반한 디블록킹 필터링을 수행하는 비디오 부호화 방법과 그 장치 및 복호화 방법과 그 장치
US8837592B2 (en) * 2010-04-14 2014-09-16 Mediatek Inc. Method for performing local motion vector derivation during video coding of a coding unit, and associated apparatus
KR101791078B1 (ko) 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
CN101848394B (zh) * 2010-05-25 2012-01-18 宁波中科集成电路设计中心有限公司 一种无线视频传感器的avs编码功耗模型优化方法
DK3661210T3 (da) 2010-07-20 2023-09-11 Ntt Docomo Inc Fremgangsmåde til forudsigende billedafkodning
US8902982B2 (en) * 2011-01-17 2014-12-02 Samsung Electronics Co., Ltd. Depth map coding and decoding apparatus and method
CN102129682B (zh) * 2011-03-09 2015-10-07 深圳市云宙多媒体技术有限公司 一种前景背景区域划分方法、***
US9131239B2 (en) 2011-06-20 2015-09-08 Qualcomm Incorporated Unified merge mode and adaptive motion vector prediction mode candidates selection
US20140002594A1 (en) * 2012-06-29 2014-01-02 Hong Kong Applied Science and Technology Research Institute Company Limited Hybrid skip mode for depth map coding and decoding
US20150172653A1 (en) * 2012-07-05 2015-06-18 Thomson Licensing Video coding and decoding method with adaptation of coding modes and corresponding encoder and decoder
US9374592B2 (en) * 2012-09-08 2016-06-21 Texas Instruments Incorporated Mode estimation in pipelined architectures
CN102932642B (zh) * 2012-11-13 2015-06-24 北京大学 一种帧间编码快速模式选择方法
US9883187B2 (en) * 2015-03-06 2018-01-30 Qualcomm Incorporated Fast video encoding method with block partitioning
CN108810531B (zh) 2017-05-03 2019-11-19 腾讯科技(深圳)有限公司 视频编码处理方法、装置及电子设备
KR102618692B1 (ko) 2018-06-15 2024-01-02 삼성전자주식회사 노이즈 또는 디서의 영향을 감소시키기 위한 디스플레이 구동 회로 및 방법
CN110149512B (zh) * 2018-09-14 2023-04-14 腾讯科技(深圳)有限公司 帧间预测加速方法、装置、计算机存储介质及设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2787944B2 (ja) * 1988-01-11 1998-08-20 富士通株式会社 動き補償動ベクトル探索方法
US5737019A (en) * 1996-01-29 1998-04-07 Matsushita Electric Corporation Of America Method and apparatus for changing resolution by direct DCT mapping
JPH1179584A (ja) 1997-09-09 1999-03-23 Mitsubishi Electric Corp エレベータ用ホールランタン
JPH11243551A (ja) * 1997-12-25 1999-09-07 Mitsubishi Electric Corp 動き補償装置と動画像符号化装置及び方法
EP1263239A3 (en) * 2001-05-30 2005-02-09 Nippon Telegraph and Telephone Corporation Image compression system
US20020196854A1 (en) * 2001-06-15 2002-12-26 Jongil Kim Fast video encoder using adaptive hierarchical video processing in a down-sampled domain
JP3732760B2 (ja) * 2001-06-29 2006-01-11 株式会社東芝 物体認識装置及び物体認識方法
PT2268039E (pt) * 2001-11-21 2015-10-26 Google Technology Holdings LLC Codificação adaptativa de quadro/campo ao nível dos macroblocos para o conteúdo de vídeo digital
US6980596B2 (en) * 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content
JP3936335B2 (ja) * 2001-11-30 2007-06-27 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、プログラム及びプログラムを記憶したコンピュータ読み取り可能な記録媒体
WO2003061284A1 (en) * 2001-12-21 2003-07-24 Polycom, Inc. Motion wake identification and control mechanism
JP4130783B2 (ja) * 2002-04-23 2008-08-06 松下電器産業株式会社 動きベクトル符号化方法および動きベクトル復号化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10652570B2 (en) 2016-01-15 2020-05-12 Nec Corporation Moving image encoding device, moving image encoding method, and recording medium for recording moving image encoding program

Also Published As

Publication number Publication date
US9210441B2 (en) 2015-12-08
US20060193385A1 (en) 2006-08-31
CN100594730C (zh) 2010-03-17
JP2007524279A (ja) 2007-08-23
WO2005004491A1 (en) 2005-01-13
ES2343410T3 (es) 2010-07-30
DE602004026580D1 (de) 2010-05-27
KR20060027813A (ko) 2006-03-28
BRPI0411765A (pt) 2006-08-08
EP1639827B1 (en) 2010-04-14
CN1810037A (zh) 2006-07-26
MY143420A (en) 2011-05-31
MXPA05014211A (es) 2006-05-31
EP1639827A1 (en) 2006-03-29

Similar Documents

Publication Publication Date Title
JP4968726B2 (ja) インターフレームのための高速モード決定符号化
JP5713415B2 (ja) ビデオ符号器におけるbフレームの高速モード決定のための方法および装置
JP5074924B2 (ja) インタフレームのための高速モード決定方法及び装置
KR100992044B1 (ko) 매크로블록 파티션의 혼합된 인터/인트라 비디오 코딩 방법
KR100984517B1 (ko) 인터프레임 인코딩을 위한 빠른 모드 결정 방법
EP1808024B1 (en) Fast intra mode prediction for a video encoder
KR101083399B1 (ko) 인터 프레임을 위한 고속 모드 결정 인코딩

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070615

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20080318

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100616

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100909

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110420

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110713

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111102

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120126

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120229

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120328

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120328

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4968726

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250