JP2006513636A - インター・フレーム符号化に関する高速モード意思決定 - Google Patents

インター・フレーム符号化に関する高速モード意思決定 Download PDF

Info

Publication number
JP2006513636A
JP2006513636A JP2004566449A JP2004566449A JP2006513636A JP 2006513636 A JP2006513636 A JP 2006513636A JP 2004566449 A JP2004566449 A JP 2004566449A JP 2004566449 A JP2004566449 A JP 2004566449A JP 2006513636 A JP2006513636 A JP 2006513636A
Authority
JP
Japan
Prior art keywords
mode
block
subset
encoder
selecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004566449A
Other languages
English (en)
Inventor
イン,ペン
ボイス,ジル,マクドナルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2006513636A publication Critical patent/JP2006513636A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/557Motion estimation characterised by stopping computation or iteration based on certain criteria, e.g. error magnitude being too large or early exit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

符号器(10)は、潜在的なモード(ブロック・サイズ)の考慮を所定の部分集合に当初は限定し、モード推定をモード意思決定とともに行うことによって符号化効率の向上を達成する。当初のモード部分集合を考慮し、部分集合におけるブロック毎の動きの推定が行われて最善の動きベクトルが確立される。歪み尺度も部分集合毎に作成される。この歪み尺度から、他のブロック・サイズについて動きを推定するか否かが判定される。否定の場合、符号化モードが推定動きによって選択される。このようにして、全ての考えられるブロック・サイズに対する動き推定を行う必要がある訳ではない。

Description

本発明は、ビデオ圧縮効率を維持する一方で、ビデオ符号化の計算量上の複雑度を低減させる手法に関する。
ビデオ・ストリームを圧縮(符号化)して記憶及び伝送を容易にする種々の手法が現存する。多くの周知の符号化手法は、空間的な類似性や時間的な類似性に依拠する。(JVTやMPEG AVCとしても知られる)提案されているH.264符号化手法は、インター・フレーム(Pフレーム及びBフレーム)の場合のインター符号化及びイントラ符号化を規定している。個々のマクロブロックの各々は、イントラ符号化を、すなわち空間的な相関を用いて、経るか、先行して符号化されたフレームからの時間的な相関を用いたインター符号化を経ることが可能である。一般的には、符号器は、符号化効率や主観的な品質の考慮点に基づいてマクロブロック毎のインター/イントラ符号化の意思決定を行う。先行フレームからうまく予測されるマクロブロックは通常、インター符号化を経る一方、先行フレームからあまりうまく予測されないマクロブロックや空間的な活動が低いマクロブロックは通常、イントラ符号化を経る。
提案されているJVT/ITU H.264符号化手法は、インター符号化の場合、16x16マクロブロックの種々のブロック・パーティションを可能にする。特に、提案されているH.264符号化手法は、16x16のマクロブロックの16x16、16x8、8x16及び8x8のパーティション、8x8の部分マクロブロックの8x8、8x4、4x8及び4x4のパーティション、更には複数の参照ピクチャを可能にする。更に、提案されているH.264の符号化手法は、スキップ・モードやイントラ・モードもサポートする。イントラ・モードには、以下ではINTRA_4x4及びINTRA_16x16として表す、4x4及び16x16の2つの種類のものが存在する。INTRA_4x4モードは9つの予測モードをサポートする一方、INTRA_16x16モードは4つの予測モードをサポートする。これらの選択は全て、モードの意思決定をタイムリーな方法で行うことに関連した複雑度を大いに増加させた。
よって、モードの意思決定を単純にする手法に対する必要性が存在する。
簡潔に述べれば、好適実施例によれば、複数の異なるブロック・サイズにパーティション化することができるマクロブロックを符号化する方法を備える。当初は、ブロック・サイズの部分集合が選択される。部分集合における各ブロック・サイズに関連した画像の動きが、最善の動きベクトルを確立するよう推定される。ブロック・サイズ毎に、歪みの尺度が確立される。この歪みの尺度に基づいて、部分集合内にないブロック・サイズについて動き推定が行われることとするか否かについての判定が行われる。否定の場合、符号器は、ブロック・サイズの選択部分集合の推定動きによってマクロブロックを符号化する符号化モードを選択する。
〔実施例〕
本願の原理の符号化方法をより良く分かるために、入力ビデオ・ストリームを符号化する通常のJVT符号器10のアーキテクチャの構成図を表す図1を参照する。符号器10は、ビデオ源(図示せず)からの入力ビデオ・フレームによってその正の入力で供給される差異ブロック13の出力を受信する第1ブロック12を含む。ブロック12は差異ブロック13から受信される各ビデオ・フレームを量子化し、更に、ブロック変換を行って、量子化フレームを、相当する変換係数群とともにもたらす。
ループ14は、ブロック12によって出力される、各量子化フレームと、相当する変換係数とをフィードバックして予測フレーム(Pフレーム又はBフレーム)の形成を可能にする。ループ14は、合計ブロック16の第1入力で受信するよう、ブロック12からの量子化フレームと変換係数との各々の逆量子化及び逆変換を行い、合計ブロック16の出力はブロッキング解除フィルタ18に結合される。ブロッキング解除フィルタ18は、合計ブロック16から受信される各ビデオ・フレームをブロック解除する。そのようなフィルタ化フレームはフレーム・メモリ20における記憶を経て、それによって、複数の参照フレーム22が記憶されたものをもたらす。フレーム・メモリ20に記憶される参照フレーム22を用いて、予測器ブロック24は、動き推定ブロック26によって生成される動きベクトルによって動き補償される再構築予測フレームを生成する。
JVTビデオ符号化標準は、Pフレーム及びBフレームのインター符号化もイントラ符号化も可能にする。インター符号化を行うよう、差異ブロック13はその負の出力を、セレクタ27を介して動き補償ブロック24に結合させている。このようにして、差異ブロック13は1つ又は複数の動き補償参照フレーム22を各入力ビデオ・フレームから減算することになる。セレクタ27は、差異ブロック13の負の出力を、イントラ符号化参照フレームを備えるイントラ・モード・ブロック28に結合することによってイントラ符号化を行う。JVTビデオ符号化標準は、イントラ符号化の2つのブロック種類(サイズ)、すなわち。4x4及び16x16をサポートする。4x4ブロック・サイズは9つの予測モード、すなわち、垂直予測、水平予測、DC予測、対角線下/左予測、対角線下/右予測、垂直―左予測、水平―下予測、垂直―右予測及び水平―上予測をサポートする。16x16のブロック・サイズは4つの予測モード、すなわち、垂直予測、水平予測、DC予測及び平面予測をサポートする。セレクタ27は、差異ブロックの負の入力が、動き補償予測器ブロック24からの再構築フレームも、イントラ・モード・ブロック28の出力も受信しない零のモードをもたらす。このモードでは、ブロック12は、減算されていない入力ビデオ・フレームを受信する。
図1の符号器10は、ブロック12からの量子化フレーム及び変換係数を、動き推定器26からの動きデータや制御データとともに合成して、符号化ビデオ・フレームをもたらす。エントロピ符号化ブロック30の出力で生成される各符号化フレームは、記憶及び/後の伝送を行うよう、ネットワーク・アブストラクション・レイヤ(NAL)(図示せず)に転送される。エントロピ符号器30は、可変長符号化(VLC)又はコンテキスト・ベースの適応2値算術符号化(CABAC)を利用することが可能である。
提案されているH.264符号化手法は、ツリー構造の階層型マクロブロック・パーティションを用いている。インター符号化された16x16の画素マクロブロックは、16x8、8x16又は8x8のマクロブロック・サイズへのパーティション化を経ることが可能である。部分マクロブロックとして知られる、8x8画素のマクロブロック・パーティションも存在することがあり得る。部分マクロブロックは、サイズ8x4、4x8、及び4x4の部分マクロブロックへのパーティション化を経ることが可能である。符号器10は通常、特定のマクロブロックの特性に基づいてマクロブロックをパーティション及び部分マクロブロック・パーティションに分割する方法を選択して、圧縮効率及び主観的な品質を最大にする。
上記のように、符号器10はインター予測の場合、複数の参照ピクチャを利用することが可能である。この点で、参照ピクチャ指数は特定の参照ピクチャを識別する。Pピクチャ(又はPスライス)は、単一方向の予測と、許容できる参照ピクチャを管理する単一のリスト(リスト0)を利用する。リスト0及びリスト1として表す、2つの参照ピクチャ・リストは、Bピクチャ(又はBスライス)に対する2つの参照ピクチャ群を管理する役目を担う。JVTビデオ符号化標準は、Bピクチャ(又はBスライス)に対してリスト0又はリスト1を用いた単一方向の予測を可能にする。2つの予測が用いられる場合、リスト0の予測子とリスト1の予測子は一緒に平均がとられて最終予測子を形成する。各マクロブロック・パーティションは、別個の参照ピクチャ指数、予測種類(リスト0、リスト1、2つの予測)、及び別個の動きベクトルを有し得る。各部分マクロブロックは別個の動きベクトルを有し得るが、同じ部分マクロブロックにおける部分マクロブロック・パーティションは全て、同じ参照ピクチャ指数及び予測種類を用いる。
インター符号化マクロブロックの場合、Pフレームは上記マクロブロック・パーティションの他にSKIPモードもサポートし得る一方、BフレームはSKIPモードもDIRECTモードもサポートし得る。SKIPモードでは、動き情報符号化も残差情報符号化も何ら行われない。動きベクトルは動きベクトル予測子と同じ状態にとどまる。DIRECTモードでは、動き情報は何ら符号化されないが、予測残差は符号化される。動きベクトルは空間的又は時間的に隣接するマクロブロックから推論される。マクロブロックも部分マクロブロックもDIRECTモードをサポートする。
従来は、図1の符号器10などのJVT符号器は、イントラ・モードとインター・モードとの何れを用いて符号化するかについての意思決定を行うレート歪み最適化(RDO)フレームワークを利用してきた。インター・モード符号化の場合、符号器は動き推定をモードの決定とは別個に検討する。動き推定はまず、全てのブロック種類について行われ、次に、符号器は、インター・モード及びイントラ・モードを用いて各ブロックを符号化するうえでのコスト(レートと歪みとの組み合わせ)を比較することによってモード決定を行う。符号器は最小のコストを備えているモードを最善のモードとして選択する。考えられるブロック・サイズが多数であれば、このようにして符号化モードを選択することはかなりの資源を費やす。
本願の原理の符号化手法は、インター・フレーム符号化を行ううえでのモード意思決定に関連した問題の多くを軽減する。本願の手法は、検討することが考えられるブロック・サイズ数を削減し、動き推定を行ううえでの先行符号化参照ピクチャの数を制限する。このようにして、一部のブロック種類についての動き推定及び参照ピクチャは不必要となる。本願の手法は検査されるイントラ・モードの数も削減する。
本願のモード選択手法の説明を簡単にするよう、モードはインター・モードとイントラ・モードとの2つの分類に分ける。説明の目的では、インター・モードはSKIPモード(及びBピクチャの場合のDIRECTモード)と、16x16、16x8、8x16、8x8、8x4、4x8、4x4を有する種々のブロック・サイズとを有する。イントラ・モードは、INTRA4x4モード及びINTRA16x16モードを有する。Pピクチャは本願の手法を示す最善の役目を担うが、手法はBピクチャへの適用可能性も有する。Bピクチャの場合、SKIPモードとDIRECTモードは同様に扱われ、DIRECTモードは、最善のモードを選択するうえで部分マクロブロックも考慮する。
本願のモード選択手法は、動き推定をモード意思決定とともに行う。動き推定は特定のインター・モードについてそれが選択されると行われる。インター・モードの場合、SKIPモードは動きサーチを必要とせず、よって、最低の計算量上の複雑度を有する。本願の原理によれば、SKIPモードは別個の状態のままにとどまっており、その低複雑度のおかげで最高の優先度を受ける。ブロック・サイズに関するモード意思決定に関しては、本願の原理の手法は、歪み(エラー)尺度とブロック・サイズとの比率が単調か否かを判断する。以下に誤差表面として表すこの比率は、ブロック・サイズの減少とともに歪みが減少し続けるかの尺度を備える。
当初、誤差表面計算は、16x16、8x8及び4x4の3つの初期ブロック・サイズの各々についてのみ行われる。この意味合いでは、「8x8」の項は8x8のパーティションのみを用いたマクロブロック全体の検査を示唆する一方、「4x4」の項は4x4のパーティションのみを用いたマクロブロック全体の検査を示唆する。誤差表面は、J(16x16)<J(8x8)<J(4x4)又はJ(16x16)>J(8x8)>J(4x4)である場合に単調であるという特性を有し、演算子Jは誤差表面演算子を表す。16x16、8x8及び4x4のブロック・サイズについての誤差表面の計算は、16x8の部分マクロブロック、8x16の部分マクロブロック、又はより細かい部分マクロブロックなどの他のモードを検査するか否かを判定することになる。単調な誤差表面がない場合、全ての他のブロック・サイズは検査を経なければならない。表面が単調な場合、最善の2つのブロック・サイズの間のブロック・サイズは更なる検査を必要とする。
例えば、2つの最善のブロック・サイズが、マクロブロックが大きめのブロック・パーティションを用いる傾向があるということを示唆する、16x16や8x8である場合、16x8のブロック・サイズと8x16のブロック・サイズのみが更なる検査を必要とする。逆に、最善の2つのブロック・サイズが8x8や4x4である場合、このことは、小さめのブロック・パーティション(又は部分マクロブロック・パーティション)によってよりうまく予測されるということを示唆し、8x4のブロック・サイズと4x8のブロック・サイズのみが更なる検査を必要とする。
図2は、インター・フレーム符号化に関するモード意思決定を行ううえでの本願の原理による方法の工程を流れ図形式で示す。この方法は、工程200が実行されると開始され、工程200では、符号器10内の種々の構成要素が再設定される。次に、工程202中には、SKIPモードについての誤差表面計算が行われる。工程204中には、SKIPモードの誤差表面が第1閾値T1よりも少ないか否かが判定される。肯定の場合、SKIPモードはインター・フレーム符号化の最善のモードとなり、SKIPモード選択が工程206中に行われる。その後、マクロブロック符号化は工程208が実行されると終了する。
工程204中にSKIPモードの誤差表面がT1以上である場合、16x16のブロック・サイズと8x8のブロック・サイズとの各々の誤差表面は工程210中に確かめられる。工程212中に、J(SKIP)<J(16x16)であり、かつJ(SKIP)<J(8x8)であるか否かが判定される。J(SKIP)<J(16x16)であり、かつJ(SKIP)<J(8x8)である場合、工程214が行われ、動きベクトル、モード自体、及び残りの残差の符号化コストを考慮して、最善のインター・モードが選択される。さもなければ、J(SKIP)<J(16x16)であり、かつJ(SKIP)<J(8x8)であるという条件が真でない場合、工程216が行われ、4x4のモードの誤差表面が計算される。SKIPモードのコストの、ブロック・サイズ16x16及びブロック・サイズ8x8のコストとの比較は、SKIPモードのRDコストが最小である場合にSKIPモードよりも低いコストを他のブロック種類が有する確率は非常に少ないので他のインター・モードを検査する必要がなくなるという前提に基づいている。
工程216に続いて、工程218で、MinJ=J(8,8)又はMaxJ=J(8x8)であるか否かが検査される。肯定の場合、工程219で、16x8、8x16、8x4及び4x8のブロック・サイズの各々の誤差表面の判定が工程214に進む前に行われる。さもなければ、MinJ=J(8,8)││MaxJ=J(8x8)が真でない場合、工程220が行われ、MaxJ=J(4x4)が真であるか否かが判定される。真の場合、工程222で、16x8及び8x16のブロック・サイズの誤差表面の判定が工程214に進む前に行われる。工程224及び工程222を行う場合、全ての参照ピクチャを検査する必要がある訳ではない。8x4及び4x8のブロック・サイズは8x8のモード及び4x4のモードのブロック・サイズの最善の参照ピクチャ内でしか検査しなくてよい一方で、16x8のモード及び8x16のモードのブロック・サイズは8x8のモード及び16x16のモードのブロック・サイズの最善の参照ピクチャ内で検査することを必要とするということを経験上のデータは示している。
工程218中及び工程220中に行われる比較は、誤差表面が単調であるか否かを明らかにし、それが真である場合には、工程219中に行われる誤差表面計算を図1の符号器10が行う必要性を不要にする。よって、工程218中及び工程220中に行われる比較は、誤差表面の測定が行われるブロック・サイズの部分集合を絞り込み、よって符号器の計算労力を軽減する役目を担う。
工程220中に検査される場合にMaxJ=J(4x4)が真でない場合には、工程224が行われ、工程224では、その計算がなければ計算されていない、部分マクロブロック・パーティションの誤差表面のその計算が工程214に進む前に行われる。よって工程224中に、別の判定処理が8x8ブロック・サイズ毎に行われて、4つの部分マクロブロック・パーティションのうちのどの種類を用いることとするかを判定する。8x4及び4x8のみが検査を経る必要がある。8x8及び4x4の初期結果は再使用可能である。その後、226中に、最善のインター・モードの残差のエネルギが第2閾値T2を超えているか否かの検査が行われる。否定の場合、工程214中に先行して選択された最善のインター・モードによって工程228中に最善のモードの選択が、工程208に進む前に行われる(これは、インター画像の場合、インター・モードはイントラ・モードよりも高い優先度を常に有するということに基づいている。)。
工程226で、最善のインター・モードの残差のエネルギがT2を超える場合、図3に関して最もうまく説明されたように、最善イントラ・モードが検査される工程230が、工程228に進む前に行われる。インター・モードの性能は、元の信号と参照信号との差を有する残差のエネルギ(振幅の2乗)によって測定される。残差は、ブロック変換係数の絶対値の和又は、現行マクロブロックにおけるブロック変換係数の数から単純に計算することが可能である。
図3は、図2の工程230の実行中に行われるイントラ・モード意思決定に関連した工程を表す。図3にみられるように、インター・モード検査は、最善のインター・モードのエネルギが第3閾値T3を超えるか否かの判定が行われる工程300が実行されると開始される。否定の場合、工程302中に、DCモードの誤差表面の計算が、図2の工程228に進む前に行われる。工程300中に最善のインター・モードのエネルギが第3閾値T3を超える場合、工程304中に、最善のインター・モードのエネルギは第4閾値T4を超えるか否かについて判断される。否定の場合、工程306中に、誤差表面が、図2の工程228に進む前に、垂直モード、水平モード及びDCモードについて確かめられる。さもなければ、工程308中に、イントラ・モード全ての誤差表面が、図2の工程228に進む前に検査される。
上記によって、インター・フレーム符号化判定及びイントラ・フレーム符号化判定に関する労力の量を削減することによってビデオ符号化の計算量上の複雑度を削減する手法を説明している。
JVT圧縮標準によってビデオを符号化する従来の符号器を示す略構成図である。 インター・フレーム符号化に関するモードの意思決定を行ううえでの本願の原理による方法を示す流れ図である。 イントラ・フレーム符号化に関するモードの意思決定を行ううえでの本願の原理による方法を示す流れ図である。

Claims (16)

  1. 複数の種々のブロック・サイズにパーティション化することができるマクロブロックを符号化する方法であって:
    (a)ブロック・サイズの部分集合を選択する工程;
    (b)該部分集合における各ブロック・サイズに関連したデータによって表される画像の動きを推定して、該各ブロック・サイズについて最善の動きベクトルを確立する工程;
    (c)該部分集合におけるブロック・サイズ毎に歪み尺度を確立する工程;及び
    (d)該部分集合内にないブロック・サイズに対して動き推定を行うこととするか否かを該歪み尺度から判定する工程を備え、否定の場合、
    (e)該推定動きによって該マクロブロックを符号化する符号化モードを選択する工程を備えることを特徴とする方法。
  2. 請求項1記載の方法であって、ブロック・サイズの部分集合から選択する工程が、JVT符号化を用いて符号化される16x16のマクロブロックについて、部分サイズ16x16、8x8及び4x4を選択することを特徴とする方法。
  3. 請求項2記載の方法であって、該判定する工程が、16x8、8x16、8x4及び4x8のブロック・サイズについて動き推定を行う工程を備えることを特徴とする方法。
  4. 請求項1記載の方法であって、更に、限定された参照ピクチャ群についてのみ、他のブロック・サイズについて動き推定を、該選択ブロック・サイズの部分集合について選択される最善参照ピクチャ群に基づいて行う工程を備えることを特徴とする方法。
  5. 請求項1記載の方法であって、更に、誤差ブロック表面が単調として分類されるか非単調として分類されるかを該歪み尺度の相対値に基づいて判定する工程を備えることを特徴とする方法。
  6. 請求項1記載の方法であって、更に、該符号化モードを選択する工程が、インター・モードとイントラ・モードとの一方を選択する工程を備えることを特徴とする方法。
  7. 請求項6記載の方法であって、該判定する工程が更に、所定の閾値を超える残差を該インター・モードが有するか否かを検査する工程を備えることを特徴とする方法。
  8. 請求項8記載の方法であって、該判定する工程が、限定されたイントラ・モード群について歪み尺度を判定する工程を備えることを特徴とする方法。
  9. 符号器であって、複数の種々のブロック・サイズにパーティション化することができるマクロブロックを符号化する方法を行い、該方法が:
    (a)ブロック・サイズの部分集合を選択する工程;
    (b)該部分集合における各ブロック・サイズに関連したデータによって表される画像の動きを推定して、該各ブロック・サイズについて最善の動きベクトルを確立する工程;
    (c)該部分集合におけるブロック・サイズ毎に歪み尺度を確立する工程;及び
    (d)該部分集合内にないブロック・サイズに対して動き推定を行うこととするか否かを該歪み尺度から判定する工程によるものであり、否定の場合、更に、
    (e)該推定動きによって該マクロブロックを符号化する符号化モードを選択する工程によるものであることを特徴とする符号器。
  10. 請求項9記載の符号器であって、該ブロック・サイズの部分集合から、JVT符号化を用いて符号化される16x16のマクロブロックについて、部分サイズ16x16、8x8及び4x4を選択することによって選択ことを特徴とする符号器。
  11. 請求項9記載の符号器であって、16x8、8x16、8x4及び4x8のブロック・サイズについて動き推定を行うことを特徴とする符号器。
  12. 請求項9記載の符号器であって、限定された参照ピクチャ群についてのみ、他のブロック・サイズについて動き推定を、該選択ブロック・サイズの部分集合について選択される最善参照ピクチャ群に基づいて行うことを特徴とする符号器。
  13. 請求項9記載の符号器であって、誤差ブロック表面が単調として分類されるか非単調として分類されるかを該歪み尺度の相対値に基づいて判定することを特徴とする符号器。
  14. 請求項9記載の符号器であって、インター・モードとイントラ・モードとの一方から該符号化モードを選択することを特徴とする符号器。
  15. 請求項14記載の符号器であって、所定の閾値を超える残差を該インター・モードが有するか否かを検査することを特徴とする符号器。
  16. 請求項15記載の符号器であって、限定されたイントラ・モード群について歪み尺度を判定することを特徴とする符号器。
JP2004566449A 2003-01-10 2003-10-24 インター・フレーム符号化に関する高速モード意思決定 Pending JP2006513636A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US43929603P 2003-01-10 2003-01-10
PCT/US2003/033923 WO2004064398A1 (en) 2003-01-10 2003-10-24 Fast mode decision making for interframe encoding

Publications (1)

Publication Number Publication Date
JP2006513636A true JP2006513636A (ja) 2006-04-20

Family

ID=32713460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004566449A Pending JP2006513636A (ja) 2003-01-10 2003-10-24 インター・フレーム符号化に関する高速モード意思決定

Country Status (10)

Country Link
US (1) US20060062302A1 (ja)
EP (1) EP1582060A4 (ja)
JP (1) JP2006513636A (ja)
KR (1) KR100984517B1 (ja)
CN (1) CN100551025C (ja)
AU (1) AU2003284958A1 (ja)
BR (1) BR0317982A (ja)
MX (1) MXPA05007453A (ja)
MY (1) MY144087A (ja)
WO (1) WO2004064398A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012504925A (ja) * 2008-10-06 2012-02-23 エルジー エレクトロニクス インコーポレイティド ビデオ信号の処理方法及び装置
WO2012023796A3 (ko) * 2010-08-17 2012-05-10 삼성전자 주식회사 가변적 트리 구조의 변환 단위를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법 및 그 장치
AU2015203115B2 (en) * 2010-08-17 2015-08-13 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
JP2017041894A (ja) * 2006-07-06 2017-02-23 トムソン ライセンシングThomson Licensing マルチビュービデオ符号化及び復号化のためにフレームナンバー及び/又はピクチャオーダカウント(poc)を分離する方法及び装置
JP2018511231A (ja) * 2015-03-06 2018-04-19 クアルコム,インコーポレイテッド ブロックの区分を用いた高速ビデオ符号化方法

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US7343291B2 (en) * 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
KR100597397B1 (ko) * 2003-11-06 2006-07-07 삼성전자주식회사 고속 움직임추정 알고리즘을 갖는 동영상 코딩방법 및 장치
US7830959B2 (en) * 2003-12-26 2010-11-09 Electronics And Telecommunications Research Institute Apparatus and method for performing intra prediction for image decoder
EP1605706A2 (en) * 2004-06-09 2005-12-14 Broadcom Corporation Advanced video coding (AVC) intra prediction scheme
KR100627329B1 (ko) 2004-08-19 2006-09-25 전자부품연구원 H.264 비디오 코덱을 위한 적응형 움직임 예측 및 모드결정 장치 및 그 방법
US8385416B2 (en) 2004-09-16 2013-02-26 Thomson Licensing Method and apparatus for fast mode decision for interframes
EP1808025B1 (en) * 2004-11-04 2016-03-09 Thomson Licensing Method and apparatus for fast mode decision of b-frames in a video encoder
US8571100B2 (en) 2004-11-04 2013-10-29 Thomson Licensing Fast intra mode prediction for a video encoder
US8356127B2 (en) * 2004-12-09 2013-01-15 Rambus Inc. Memory interface with workload adaptive encode/decode
JP4501675B2 (ja) * 2004-12-22 2010-07-14 日本電気株式会社 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム
JP4708819B2 (ja) * 2005-03-14 2011-06-22 キヤノン株式会社 画像処理装置、方法、コンピュータプログラム及び記憶媒体
CN100338957C (zh) * 2005-06-20 2007-09-19 浙江大学 一种复杂度可分级的模式选择方法
US7830961B2 (en) * 2005-06-21 2010-11-09 Seiko Epson Corporation Motion estimation and inter-mode prediction
JP4047879B2 (ja) * 2005-08-23 2008-02-13 松下電器産業株式会社 動きベクトル検出装置および動きベクトル検出方法
US7843995B2 (en) * 2005-12-19 2010-11-30 Seiko Epson Corporation Temporal and spatial analysis of a video macroblock
CN100466736C (zh) * 2005-12-30 2009-03-04 杭州华三通信技术有限公司 运动图像编码控制方法及编码装置
JP4757080B2 (ja) * 2006-04-03 2011-08-24 パナソニック株式会社 動き検出装置、動き検出方法、動き検出集積回路および画像符号化装置
JPWO2007136088A1 (ja) * 2006-05-24 2009-10-01 パナソニック株式会社 画像符号化装置、画像符号化方法、及び画像符号化用集積回路
KR100773761B1 (ko) 2006-09-14 2007-11-09 한국전자통신연구원 동영상 부호화 장치 및 방법
KR100845303B1 (ko) 2006-09-29 2008-07-10 한국전자통신연구원 고속 부호화를 위한 되먹임 구조를 가진 동영상 압축부호화 장치 및 최적 모드 결정 방법
KR100856223B1 (ko) * 2006-10-19 2008-09-03 삼성전자주식회사 H.264 인코더의 적응적 인코딩 모드 결정 장치 및결정 방법
US8923393B2 (en) * 2006-11-02 2014-12-30 Qualcomm Incorporated Apparatus and method of reduced reference frame search in video encoding
US8467448B2 (en) * 2006-11-15 2013-06-18 Motorola Mobility Llc Apparatus and method for fast intra/inter macro-block mode decision for video encoding
US20080126278A1 (en) * 2006-11-29 2008-05-29 Alexander Bronstein Parallel processing motion estimation for H.264 video codec
US8165209B2 (en) * 2007-09-24 2012-04-24 General Instrument Corporation Method and apparatus for providing a fast motion estimation process
CN101217663B (zh) * 2008-01-09 2010-09-08 上海华平信息技术股份有限公司 用于编码器的图像像素块编码模式的快速选择方法
EP2238764A4 (en) * 2008-01-25 2015-04-22 Hewlett Packard Co CODE MODE SELECTION FOR BLOCK-BASED CODING
KR100939917B1 (ko) 2008-03-07 2010-02-03 에스케이 텔레콤주식회사 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
US7925774B2 (en) 2008-05-30 2011-04-12 Microsoft Corporation Media streaming using an index file
CN100596202C (zh) * 2008-05-30 2010-03-24 四川虹微技术有限公司 一种快速帧内模式选择方法
US8265140B2 (en) * 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
KR101173560B1 (ko) * 2008-12-15 2012-08-13 한국전자통신연구원 고속 모드 결정 장치 및 방법
US20120269260A1 (en) * 2009-08-28 2012-10-25 Xavier Ducloux Method for coding a sequence of images
KR101791078B1 (ko) 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
KR20120016991A (ko) * 2010-08-17 2012-02-27 오수미 인터 프리딕션 방법
US8902982B2 (en) * 2011-01-17 2014-12-02 Samsung Electronics Co., Ltd. Depth map coding and decoding apparatus and method
JP2013009165A (ja) * 2011-06-24 2013-01-10 Mitsubishi Electric Corp 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
US10034018B2 (en) 2011-09-23 2018-07-24 Velos Media, Llc Decoded picture buffer management
US9503716B2 (en) * 2011-12-19 2016-11-22 Broadcom Corporation Block size dependent filter selection for motion compensation
US9451277B2 (en) * 2012-02-08 2016-09-20 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
CN103379321B (zh) * 2012-04-16 2017-02-01 华为技术有限公司 视频图像分量的预测方法和装置
CN103051896B (zh) * 2012-12-14 2015-05-20 华中科技大学 一种基于模式跳过的视频编码方法和***
JP6361866B2 (ja) * 2013-05-09 2018-07-25 サン パテント トラスト 画像処理方法および画像処理装置
CN110149512B (zh) * 2018-09-14 2023-04-14 腾讯科技(深圳)有限公司 帧间预测加速方法、装置、计算机存储介质及设备
SG11202112518SA (en) * 2019-05-13 2021-12-30 Beijing Bytedance Network Technology Co Ltd Block dimension settings of transform skip mode
CN117354528A (zh) 2019-05-22 2024-01-05 北京字节跳动网络技术有限公司 基于子块使用变换跳过模式

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5442400A (en) * 1993-04-29 1995-08-15 Rca Thomson Licensing Corporation Error concealment apparatus for MPEG-like video data
KR960012931B1 (ko) * 1993-08-31 1996-09-25 대우전자 주식회사 분류 벡터 양자화된 영상의 채널 오류 은폐 방법
US6571016B1 (en) * 1997-05-05 2003-05-27 Microsoft Corporation Intra compression of pixel blocks using predicted mean
JP3570863B2 (ja) * 1997-08-05 2004-09-29 三菱電機株式会社 動画像復号化装置および動画像復号化方法
JP3063715B2 (ja) * 1997-12-19 2000-07-12 日本電気株式会社 画像圧縮装置
US6307886B1 (en) * 1998-01-20 2001-10-23 International Business Machines Corp. Dynamically determining group of picture size during encoding of video sequence
US6434196B1 (en) * 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
US6304295B1 (en) * 1998-09-18 2001-10-16 Sarnoff Corporation Region-based refresh strategy for video compression
US6980596B2 (en) * 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content
US6909748B2 (en) * 2001-12-20 2005-06-21 Sorenson Media, Inc. Method and system for image compression using block size heuristics
BR0316963A (pt) * 2002-12-04 2005-10-25 Thomson Licensing Sa Codificação de fusões de vìdeo usando predição ponderada

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017041894A (ja) * 2006-07-06 2017-02-23 トムソン ライセンシングThomson Licensing マルチビュービデオ符号化及び復号化のためにフレームナンバー及び/又はピクチャオーダカウント(poc)を分離する方法及び装置
JP2018042277A (ja) * 2006-07-06 2018-03-15 トムソン ライセンシングThomson Licensing マルチビュービデオ符号化及び復号化のためにフレームナンバー及び/又はピクチャオーダカウント(poc)を分離する方法及び装置
JP2012504925A (ja) * 2008-10-06 2012-02-23 エルジー エレクトロニクス インコーポレイティド ビデオ信号の処理方法及び装置
US9648349B2 (en) 2010-08-17 2017-05-09 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
AU2015203116B2 (en) * 2010-08-17 2015-08-20 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
AU2015203115B2 (en) * 2010-08-17 2015-08-13 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
CN103181168A (zh) * 2010-08-17 2013-06-26 三星电子株式会社 使用可变树结构变换单元的视频编码方法和设备以及视频解码方法和设备
US9654799B2 (en) 2010-08-17 2017-05-16 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
US9654800B2 (en) 2010-08-17 2017-05-16 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
US9661347B2 (en) 2010-08-17 2017-05-23 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
US9674553B2 (en) 2010-08-17 2017-06-06 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
WO2012023796A3 (ko) * 2010-08-17 2012-05-10 삼성전자 주식회사 가변적 트리 구조의 변환 단위를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법 및 그 장치
US10154287B2 (en) 2010-08-17 2018-12-11 Samsung Electronics Co., Ltd. Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
JP2018511231A (ja) * 2015-03-06 2018-04-19 クアルコム,インコーポレイテッド ブロックの区分を用いた高速ビデオ符号化方法
US10085027B2 (en) 2015-03-06 2018-09-25 Qualcomm Incorporated Adaptive mode checking order for video encoding

Also Published As

Publication number Publication date
MY144087A (en) 2011-08-15
MXPA05007453A (es) 2005-09-12
BR0317982A (pt) 2005-12-06
KR20050089090A (ko) 2005-09-07
AU2003284958A1 (en) 2004-08-10
US20060062302A1 (en) 2006-03-23
KR100984517B1 (ko) 2010-10-01
CN100551025C (zh) 2009-10-14
CN1736103A (zh) 2006-02-15
WO2004064398A1 (en) 2004-07-29
EP1582060A4 (en) 2009-09-23
EP1582060A1 (en) 2005-10-05

Similar Documents

Publication Publication Date Title
JP2006513636A (ja) インター・フレーム符号化に関する高速モード意思決定
US8155191B2 (en) Method and apparatus for fast mode decision of B-frames in a video encoder
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
JP4968726B2 (ja) インターフレームのための高速モード決定符号化
EP1790167B1 (en) Method and apparatus for fast mode decision for interframes
JP4994877B2 (ja) ビデオのフレームシーケンスにおけるマクロブロックの符号化モードを選択する方法及びシステム
KR20070077609A (ko) 인트라 예측 모드 결정 방법 및 장치
KR100727991B1 (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
KR100807330B1 (ko) H.264/avc 인코더의 인트라 매크로블록 모드 스킵 방법
KR20040093253A (ko) 16×16 인트라 휘도 예측 모드 결정방법 및 장치
KR101337410B1 (ko) 동영상 부호기의 대블록에 대한 비트율 제어 방법
KR100701129B1 (ko) 영상 부호화기에서 고속 블록 모드 결정 방법
Lin et al. Fast algorithm on selecting bi-directional prediction type in H. 264/AVC scalable video coding
Mamatha et al. BIT RATE REDUCTION FOR H. 264/AVC VIDEO BASED ON NOVEL HEXAGON SEARCH ALGORITHM.
Miao et al. Efficient mode selection with extreme value detection based pre-processing algorithm for H. 264/AVC fast intra mode decision
Miao et al. Efficient mode selection with bma based pre-processing algorithms for h. 264/avc fast intra mode decision
Du Macroblock mode decision for H. 264
Huang et al. Fast H. 264 selective intra mode decision for inter-frame coding
KR101083399B1 (ko) 인터 프레임을 위한 고속 모드 결정 인코딩
Lin et al. Matched Block Detection and Motion Vector Salvage Methods for Fast H. 264/AVC Inter Mode Decision
KR20100090519A (ko) 영상 부호화 장치에서 매크로블록 모드 결정 방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090811

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100208

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100309