JP5869493B2 - ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置 - Google Patents

ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置 Download PDF

Info

Publication number
JP5869493B2
JP5869493B2 JP2012543080A JP2012543080A JP5869493B2 JP 5869493 B2 JP5869493 B2 JP 5869493B2 JP 2012543080 A JP2012543080 A JP 2012543080A JP 2012543080 A JP2012543080 A JP 2012543080A JP 5869493 B2 JP5869493 B2 JP 5869493B2
Authority
JP
Japan
Prior art keywords
block
residual
prediction
sub
template matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012543080A
Other languages
English (en)
Other versions
JP2013513333A (ja
JP2013513333A5 (ja
Inventor
ジエン,ユンフエイ
イン,ペン
ソレ,ジヨエル
ルウ,シヤオアン
シユイ,チエン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2013513333A publication Critical patent/JP2013513333A/ja
Publication of JP2013513333A5 publication Critical patent/JP2013513333A5/ja
Application granted granted Critical
Publication of JP5869493B2 publication Critical patent/JP5869493B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

(関連出願の相互参照)
本願は、米国特許仮出願番号第61/267,715号(2009年12月8日出願)の利益を主張し、当該出願は参照により、その内容は全体として本明細書に包含されている。
本発明の原理は、一般にビデオ符号化および復号化に関し、より詳細にはビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置に関する。
テンプレート・マッチング予測(TMP;Template matching prediction)は、動き/変位情報(動きベクトル、指標となる指数、変位ベクトル)の送信を回避することにより、インターおよびイントラ予測の双方につき、符号化性能を向上させることができる。しかし、TMPの利用により得られた予測は、標的ブロックとその隣接画素(すなわち、テンプレート)の相互関係に大いに依存している。よって、テンプレート・マッチングは通常、2×2などの比較的小さなブロックあるいは一画素までも処理単位として用いる。ブロックを基本とする多くのエンコーダ及びデコーダにおいては、基本ブロックサイズは、テンプレート・マッチングにより処理されるブロック単位より通常大きい変換のサイズにより、決定される。基本ブロックサイズは、テンプレート・マッチング予測のために、サブブロックに更に分割される。テンプレート・マッチングは、探索するのに使用されるテンプレートとして、隣接画素(たとえば上方または左側の隣)を利用するため、いくつかのサブブロックのテンプレートは、隣接サブブロックからいくつかの画素を含んでいる場合がある。しかし、基本ブロック全体が予測されると変換が適用されるに過ぎないため、残差は、基本ブロック全体が予測された後に、予測に追加され得るに過ぎない。よってテンプレートの一部は、残差を追加することによっては再構成されない、一部の予測データを含んでいる場合がある。テンプレート中の予測データを用いることは、サブブロック境界における起こりうるブロック性を回避することができるが、予測されたデータが再構成されたデータより情報損失が多い可能性があるため、かかる使用は低品質のマッチング結果を生じさせる場合がある。
基本的なテンプレート・マッチング予測は、ビデオ・ピクチャ中に多くの繰り返しパターンが存在する、という仮定に基づいている。これを考慮して、テンプレート・マッチングは、隣接画素をマッチングさせることにより、復号化されたビデオ・ピクチャ中に類似のパターンを探索する。後方予測特性により、テンプレート・マッチングは、動きベクトルまたは変位ベクトル等のオーバーヘッドの送信を回避することにより、符号化性能を向上させることができる。さらにテンプレート・マッチングは、インターおよびイントラ予測の双方において使用することができる。
インター予測におけるテンプレート・マッチング予測
インター予測におけるテンプレート・マッチング予測は、動きベクトルを送信することなく、標的画素を予測する一つの方法である。フレームの標的ブロックを考えると、ブロック中の標的画素は、最適画素の隣接画素が、標的画素の隣接画素と最も高い相関関係を有する、一組の基準サンプルから最適画素を検出することにより決定される。標的画素のこれらの隣接画素は、テンプレートとよばれる。先行技術では、テンプレートは通常、標的画素の再構成された周辺画素から採択される。図1を参照すると、インター予測についてのテンプレート・マッチング予測方式の一例は、参照番号100により全体的に図示されている。テンプレート・マッチング予測方式100は、探索領域111を有する再構成された参照フレーム110、探索領域111内の予測領域112、予測領域112に対する隣接領域113を伴っている。テンプレート・マッチング予測方式100は更に、標的ブロック151、標的ブロック151に関するテンプレート152、再構成された領域153を有する現フレーム150を伴う。インター予測の場合、テンプレート・マッチングプロセスは、デコーダ側で動きベクトル探索として理解することができる。ここで、テンプレート・マッチングは、従来の動き補償技術に非常に類似して行われる。すなわち動きベクトルは、参照フレーム内の相応に変位されたテンプレート型領域につき、費用関数を算定することにより判断される。そしてテンプレートについての最良の動きベクトルは、標的領域を予測するのに利用される。再構成または少なくとも予測信号が既に存在する、画像のこれらの領域のみが、探索のためにアクセスされる。よってデコーダは、テンプレート・マッチング・プロセスを実行し、追加のサイド情報なしの標的領域を予測することができる。
テンプレート・マッチングは、動きベクトルを送信することなく、標的ブロック内の画素を予測することができる。テンプレート・マッチング予測の予測性能は、標的ブロックとそのテンプレートの相関関係が高い場合は、従来のブロック・マッチング方式の予測性能に匹敵することが予想される。従来技術においては、テンプレートは、標的画素の再構成された空間隣接画素から採択される。隣接画素は、標的画素と低い相関関係を有する場合もある。それ故に、テンプレート・マッチング予測の性能は、従来のブロック・マッチング方式よりも低い場合がある。
イントラ予測におけるテンプレート・マッチング予測
イントラ予測においては、予測が標的ブロックとはかけ離れた画素により生じ得るため、テンプレート・マッチングは、利用可能な非局所予測のアプローチの一つである。イントラ・テンプレート・マッチングにおいては、テンプレートの規定は、インター・テンプレート・マッチングにおけるテンプレートの規定画定に類似している。しかし、一つの相違は、探索領域が、現ピクチャの復号化された部分に限定されるという点である。図2を参照すると、イントラ予測についてのテンプレート・マッチング予測方式の一例は、参照番号200により全体的に図示されている。テンプレート・マッチング予測方式200は、ピクチャ277の復号化された部分210を伴っている。ピクチャ277の復号化された部分210は、探索領域211、探索領域211内の候補予測領域212、候補予測領域212に対する隣接領域213を有している。テンプレート・マッチング予測方式200は更に、ピクチャ277の復号化されていない部分220を伴っている。ピクチャ277の復号化されていない部分220は、標的ブロック221、標的ブロック221に対するテンプレート222を有している。簡略化のために、以下の記述は、イントラ・テンプレート・マッチングに基づいている。しかし、インター・テンプレートの対応するものが直ちに拡張適用できることは、当該技術分野および関連する技術分野の当業者に理解される。
テンプレート・マッチングにおける残差更新方式
テンプレート・マッチングは、追加的なオーバーヘッドを回避可能であるため、映像中の比較的粒子的な領域に通常必要とされる、付随する追加的なオーバーヘッドを最小限に抑えることにより、当該領域を予測するという利点がある。テンプレート・マッチングの利点を活用するために、予測の過程における標的ブロックは、通常、基本的符号化ブロックより小さい。例えば、国際標準化機構/国際電気標準会議(ISO/IEC)動画専門グループ4(MPEG4;Moving Picture Experts Group4)のパート10、高度動画像圧縮符号化(AVC;Advanced Video Coding)規格/国際電気通信連合電気通信セクタ(ITU−T)H.264勧告(以下「MPEG4AVC規格」という)においては、基本符号化ブロックサイズは、4×4または8×8である。一つの先行技術のアプローチでは、テンプレート・マッチングの標的ブロックのサイズは2×2として画定され、これは基本的符号化ブロック4×4のサイズの半分である。図3を参照すると、イントラ・テンプレート・マッチング予測のための細分化されたブロックの一例は、参照番号300により全体的に示されている。イントラ・テンプレート・マッチング予測は、ピクチャ377の復号化された部分310を伴う。ピクチャ377の復号化された部分310は、探索領域311および探索領域311内の候補予測領域312、候補予測領域312に対する隣接領域313を有している。イントラ・テンプレート・マッチング予測は更に、ピクチャ377の復号化されていない部分320を伴っている。ピクチャ377の復号化されていない部分320は、標的ブロック321(図3の具体例では、イントラ・テンプレート・マッチング予測のための細分化されたブロックともいわれる)、および標的ブロック321に対するテンプレート322を有している。
変換サイズは通常、基本ブロックサイズ(MPEG4AVC規格においては、4×4変換および8×8変換がある)と等しいため、これは、少なくとも基本ブロック全体が予測された後は、変換され、量子化され、更新された予測残差を受け取ることができるに過ぎないことを意味する。よって、より小さい標的ブロックサイズを有するテンプレート・マッチングにおいては、テンプレートは、先行する予測されたサブブロックから得られた何らかの予測データを含んでいてもよい。このアプローチを「方法1」と呼ぶ。
図4A―Dを参照すると、(複数の)サブブロックおよびそれらのテンプレートの具体例は、参照番号400により全体的に示されている。図4の具体例は、上記「方法1」に対応する。当該具体例では、基本ブロック410は、4つのサブブロックに分割され(各々、参照番号1、2、3、4により示されている)、各々のサブブロックは、テンプレート・マッチング予測の各標的ブロックである。図4Aを参照すると、標的ブロック1のテンプレートは、参照番号411により示されており、(基本ブロックに適用されるような)テンプレート・マッチング予測の標的ブロックは、参照番号412により示され、基本ブロックサイズは、参照番号413により示されている。図4Bを参照すると、標的ブロック2のテンプレートは、参照番号421および422に表される領域により示されている。図4Cを参照すると、標的ブロック3のテンプレートは、参照番号431および432に表される領域により示されている。図4Dを参照すると、標的ブロック4のテンプレートは、参照番号441、442および443に表される領域により示されている。4つの標的ブロックの予測プロセスは、以下のステップを伴う。
(1)隣接画素を利用して、標的ブロック(例えば、標的ブロック1)について、テンプレートを生成する。
(2)マッチングを探索し、この標的ブロックについて予測を生じさせる。
(3)標的ブロックをその予測で更新する。
(4)標的ブロック2、3、4について、ステップ(1)〜(3)を繰り返す。
(5)基本ブロック全体の残差ブロックを取得する。
(6)残差ブロック全体を変換し、係数を量子化し、量子化された係数を逆変換する。
(7)予測ブロックおよび量子化された残差ブロックを追加することにより、再構成されたブロックを生成する。
(8)基本ブロックを終了する。
標的ブロック1は、ブロックの第1のサブブロックであるため、そのテンプレート中の画素は全て、再構成されたピクチャから取得される。しかし、標的ブロック2等の他の標的ブロックについては、そのテンプレートは、標的ブロック1からのいくつかの画素を有している必要がある。これに伴い、標的ブロック2を予測する際に、標的ブロック1が予測されたばかりであるが、再構成はされていない。なぜなら、4つの標的ブロックがステップ(6)で予測されるまでは、変換および量子化はされていないからである。よって、標的ブロック2のテンプレートについては、そのテンプレートの一部が、標的ブロック1の予測データから生じる。テンプレート・マッチングにより他の標的ブロック(すなわち、標的ブロック1以外の標的ブロック。上記で言及したように、標的ブロック1についてのテンプレート内の画素は全て、再構成されたピクチャから生じているからである)を予測する際にも、同様の問題がある。
先行する標的ブロックの予測データを、現在の標的ブロックのテンプレートに組み込むことにより、非常に円滑に基本ブロック全体の予測を行うことができる。更に、標的ブロックが全て完全に予測される場合、大きな変換(および付随する量子化)を適用する際に、大きな変換を利用することにより生じる利点を享受することができる。しかし、予測データをマッチングのためのテンプレートに組み込むことは、予測誤差を拡大し、予測を不良化させる。
先行技術の上記かつ他の欠点および不都合は、本発明の原理により対処されており、これはビデオ符号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置を対象としている。
本発明の原理の一つの態様によると、一つの装置が提供されている。当該装置は、テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを符号化する、ビデオエンコーダを備えている。テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを含んでいる。
本発明の原理の別の態様によると、ビデオエンコーダにおける一つの方法が提供されている。当該方法は、テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを符号化するステップを含んでいる。テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを含んでいる。
本発明の原理の更に別の態様によると、一つの装置が提供されている。当該装置は、テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを復号化する、ビデオデコーダを備えている。テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを含んでいる。
本発明の原理の更に別の態様によると、ビデオデコーダにおける一つの方法が提供されている。当該方法は、テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを符号化するステップを含んでいる。テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを含んでいる。
本発明の原理の更に別の態様によると、一つの装置が提供されている。当該装置は、テンプレート・マッチング予測を利用して、ピクチャ内のブロックを符号化するビデオエンコーダを備えている。テンプレート・マッチング予測は、ブロックを複数のサブブロックに細分化するステップと、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、複数のサブブロックのうち特定のサブブロックの残差に変換を適用するステップとを含んでいる。
本発明の原理の更に別の態様によると、ビデオエンコーダにおける一つの方法が提供されている。当該方法は、テンプレート・マッチング予測を利用して、ピクチャ内のブロックを符号化するステップを含んでいる。テンプレート・マッチング予測は、ブロックを複数のサブブロックに細分化するステップと、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、複数のサブブロックのうち特定のサブブロックの残差に変換を適用するステップとを含んでいる。
本発明の原理の更に別の態様によると、一つの装置が提供されている。当該装置は、テンプレート・マッチング予測を利用して、ピクチャ内のブロックを復号化するビデオデコーダを備えている。テンプレート・マッチング予測は、ブロックを複数のサブブロックに細分化するステップと、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、複数のサブブロックのうち特定のサブブロックの残差に変換を適用するステップとを含んでいる。
本発明の原理の更に別の態様によると、ビデオデコーダにおける一つの方法が提供されている。当該方法は、テンプレート・マッチング予測を利用して、ピクチャ内のブロックを符号化するステップを含んでおり、テンプレート・マッチング予測は、ブロックを複数のサブブロックに細分化するステップと、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、複数のサブブロックから特定のサブブロックの残差に変換を適用するステップとを含んでいる。
本発明の原理の上記および他の態様、特徴および利点は、添付図面に関連して解釈される例示的実施形態の以下の詳細な説明から明らかになる。
本発明の原理は、以下の例示的図面によりより良く理解できる。
インター予測のためのテンプレート・マッチング予測方式の一例を示す概略図である。 イントラ予測のためのテンプレート・マッチング予測方式の一例を示す概略図である。 イントラ・テンプレート・マッチング予測のための細分化されたブロックの一例を示す概略図である。 図4A−図4Dはサブブロックおよびそのテンプレートの一例を一括して示す概略図である。 本発明の原理の実施形態に従い、本発明の原理を適用できる例示的ビデオエンコーダを示すブロック図である。 本発明の原理の実施形態に従い、本発明の原理を適用できる例示的ビデオデコーダを示すブロック図である。 本発明の原理の実施形態に従い、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新のための例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新のための例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオデコーダにおけるテンプレート・マッチング予測の適応型残差更新のための例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新のための別の例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオデコーダにおけるテンプレート・マッチング予測の適応型残差更新のための別の例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新のための更に別の例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新のための更に別の例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオデコーダにおけるテンプレート・マッチング予測の適応型残差更新のための更に別の例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新のための更に別の例示的方法を示す流れ図である。 本発明の原理の実施形態に従い、ビデオデコーダにおけるテンプレート・マッチング予測の適応型残差更新のための更に別の例示的方法を示す流れ図である。
本発明の原理は、ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置を対象としている。
本説明は、本発明の原理を記述している。よって当業者は、種々の構成配置を考案し、本明細書に明示的に記述されておらず、または図示されていない場合であっても、本発明の原理を採用してその趣旨および範囲に含めることが可能であることが理解される。
本明細書に列挙されたすべての具体例および条件付文言は、技術の進歩させるために発明者(ら)が提供する本発明の原理および概念を理解する際に、読み手を助けるという教育目的を有しており、特に列挙されたかかる具体例および条件に限定することがないものとして解釈されるべきである。
また、本発明の原理の原則、態様および実施形態を列挙する本明細書中のすべての記述、ならびにこれらの特定の具体例は、これらの構造的かつ機能的な均等物の双方を包含することを意図としている。また、かかる均等物は、現在知られており、かつ将来開発される均等物、すなわち構造に関わらず、同一の機能を発揮する開発されたいずれの構成要件も包含することを意図している。
よって、例えば、本明細書で提示されたブロック図は、本発明の原理を具体化する例示的回路の概念図を表現していることが、当業者により理解されるであろう。同様に、いずれのフローチャート、流れ図、状態遷移図、擬似コード等も、コンピュータまたはプロセッサが明示的に示されているか否かにかかわらず、コンピュータ読み取り可能媒体に十分に表現することができ、コンピュータまたはプロセッサによりそのように実行される種々のプロセスを表現することが理解されるであろう。
図面に示された種々の要素の機能は、専用ハードウェアならびに適切なソフトエアと関連してソフトウェアを実行できるハードウェアの使用を介して提供できる。プロセッサにより提供される場合、機能は単一の専用プロセッサにより提供されてもよいし、単一の共有プロセッサにより提供されてもよいし、一部を共有できる複数の個別のプロセッサにより提供されてもよい。また、「プロセッサ」または「コントローラ」の文言の明示的使用は、ソフトウェアを実行することができるハードウェアのみを言及するように解釈されるべきではなく、黙示的にディジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを記憶する読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、不揮発性記憶装置を含むが、これに限定されない。
従来型および/またはカスタムの他のハードウェアが含まれてもよい。同様に、図示されたいずれのスイッチも概念的に過ぎない。その機能は、プログラムロジックの動作を介して、専用のロジックを介して、プログラム制御および専用のロジックの相互作用を介して、あるいは手動でも実行でき、特定の技術は、コンテキストからより詳細に理解されるように、実施者により選択可能である。
本明細書の請求項において、特定の機能を実行するための手段として表わされる任意の要素は、例えば、a)その機能を実行する複数の回路素子の組み合わせ、またはb)ファームウェア、マイクロコードなどを含む任意の形態のソフトウェアであって、その機能を実行する当該ソフトウェアを実行するための適切な回路と組み合わされたものなどを含め、当該機能を実行する任意の方法を含むことが意図されている。請求項によって定義される本発明の原理は、列挙される様々な手段によって提供される機能が、請求項によって提唱される手法で組み合わされ、かつ結合されるという事実に属する。したがって、これらの機能を提供することができるいずれの手段も、本明細書に示されているものと均等であるとみなされる。
明細書中の本発明の原理の「一つの実施形態」または「ある実施形態」並びにその他の変形に対する言及は、実施形態との関連で記載される特定の特徴、構造、特性等が、本発明の原理の少なくとも一つの実施形態に含まれることを意味している。よって、明細書全体を通して様々な箇所に現れている「一つの実施形態においては」または「ある実施形態においては」のフレーズの出現、並びに他のいずれの変形も、必ずしも全てが同一の実施形態に言及しているものではない。更に、実施形態および実装の語は、本明細書で互換可能に使用されることが理解されるべきである。
例えば、「A/B」、「Aおよび/またはB」、「AおよびBの少なくとも一つ」という場合の以下の「/」、「および/または」、および「少なくとも一つの」のいずれかの使用は、最初に挙げたオプション(A)のみの選択を含むか、2番目に列記されたオプション(B)のみの選択を含むか、双方のオプション(AおよびB)の選択を含むことを意図していると理解されるべきである。他の具体例としては、「A,Bおよび/またはC」と「A、B、Cのうち少なくとも一つ」の場合は、当該フレーズは、最初に挙げられたオプション(A)のみの選択を含むか、第2番目に挙げられたオプション(B)のみの選択を含むか、第3番目に挙げられたオプション(C)のみの選択を含むか、第1および第2番目に挙げられたオプション(AおよびB)のみの選択を含むか、第1および第3番目に挙げられたオプション(AおよびC)のみの選択を含むか、第2および第3番目に挙げられたオプション(BおよびC)のみの選択を含むか、3つすべてのオプション(AおよびBおよびC)の選択を含むことを意図している。上記は、当該技術分野および関連する技術分野の当業者に直ちに明らかなように、列挙された多くの項目についても拡張適用できる。
さらに本明細書で使用される際に、「ピクチャ」および「画像」の用語は、互換可能に使用され、静止画またはビデオシーケンスからのピクチャを指す。周知のように、ピクチャはフレームあるいはフィールドであってもよい。
さらに本明細書で使用される際に、「信号伝達」の用語は、対応するデコーダに何かを示すことを指す。例えば、エンコーダは、いずれの特定の残差更新方式がエンコーダ側で使用されたかをデコーダに知らせるために、1つ以上の残差更新方式を信号伝達することができる。このように、同一の残差更新方式が、エンコーダ側とデコーダ側の双方で使用できる。よって例えば、エンコーダは、特定の1つ以上の残差更新方式をデコーダに送信することができ、それによりデコーダは、同一の特定の1つ以上の残差更新方式を使用することができ、あるいはデコーダがすでに特定の1つ以上の残差更新方式並びに他の方式を備えている場合は、(送信することなく)信号伝達が利用され、デコーダがより大きな分類の残差更新方式から特定の1つ以上の残差更新方式を容易に知り、かつこれを選択できることを可能にしている。実際のいずれの残差更新方式の送信も回避することにより、ビットセービングを実現することができる。信号伝達は種々の態様で実現できることが理解されるべきである。例えば、対応するデコーダに情報を信号伝達するために、1つ以上のシンタックス要素、フラグ等を使用してもよい。
本明細書で使用される際に、「基本ブロック」の用語は、エンコーダおよびデコーダにおいて、既定の変換が適用されるブロックをいう。
記述および記載のために、MPEG4 AVC規格に対する改良との関連において、MPEG4 AVC規格を記載の基準として用い、MPEG4 AVC規格に対する改良およびこの拡張を説明しつつ、実施例を本明細書に記載する。しかし、本発明の原理は、MPEG4 AVC規格および/またはその拡張にのみ限定されるものではないことを理解すべきである。本明細書に与えられた本発明の原理の教示を前提とすると、本発明の原理は、他の規格の拡張に適用される場合、あるいは未だ開発されていない規格に適用される場合、および/またはこれに組み込まれる場合に等しく適用可能であり、少なくとも類似の効果を与えることを、当該技術分野および関連する技術分野の当業者に直ちに理解するであろう。本発明の原理は、規格に適合しないが、むしろ独自の規定に適合するビデオエンコーダおよびビデオデコーダにも適用されることが更に理解されるべきである。
図5を参照すると、本発明の原理が適用できる例示的ビデオエンコーダは、全体的に参照番号500により示されている。ビデオエンコーダ500は、コンバイナ585の非反転入力と信号通信する出力を備えたフレーム順序付けバッファ510を備えている。コンバイナ585の出力は、変換器および量子化器525の第1の入力と信号通信により接続されている。変換器および量子化器525の出力は、エントロピーコーダ545の第1の入力、ならびに逆変換器および逆量子化器550の第1の入力と信号通信により接続されている。エントロピーコーダ545の出力は、コンバイナ590の第1の非反転入力と信号通信により接続されている。コンバイナ590の出力は、出力バッファ535の第1の入力と信号通信により接続されている。
エンコーダコントローラ505の第1の出力は、フレーム順序付けバッファ510の第2の入力と、逆変換器および逆量子化器550の第2の入力と、ピクチャタイプ決定モジュール515の入力と、マクロブロック(macroblock)タイプ(MBタイプ)決定モジュール520の第1の入力と、イントラ予測モジュール560の第2の入力と、デブロッキングフィルタ565の第2の入力と、動き補償手段570の第1の入力と、動き予測手段575の第1の入力と、参照ピクチャバッファ580の第2の入力と信号通信により接続されている。
エンコーダコントローラ505の第2の出力は、付加拡張情報(SEI)インサータ530の第1の入力と、変換器および量子化器525の第2の入力と、エントロピーコーダ545の第2の入力と、出力バッファ535の第2の入力と、シーケンスパラメータセット(SPS)およびピクチャパラメータ(PPS)インサータ540の入力と信号通信により接続されている。
付加拡張情報(SEI)インサータ530の出力は、コンバイナ590の第2の非反転入力と信号通信により接続されている。
ピクチャタイプ決定モジュール515の第1の出力は、フレーム順序付けバッファ510の第3の入力と信号通信により接続されている。ピクチャタイプ決定モジュール515の第2の出力は、マクロブロック(macroblock)タイプ(MBタイプ)決定モジュール520の第2の入力と信号通信により接続されている。
シーケンスパラメータセット(SPS)およびピクチャパラメータセット(PPS)インサータ540の出力は、コンバイナ590の第3の非反転入力と信号通信により接続されている。
逆量子化器および逆変換器550の出力は、コンバイナ519の第1の非反転入力と信号通信により接続されている。コンバイナ519の出力は、イントラ予測モジュール560の第1の入力と、デブロッキングフィルタ565の第1の入力と信号通信により接続されている。デブロッキングフィルタ565の出力は、参照ピクチャバッファ580の第1の入力と信号通信により接続されている。参照ピクチャバッファ580の出力は、動き予測手段575の第2の入力および動き補償手段570の第3の入力と信号通信により接続されている。動き予測手段575の第1の出力は、動き補償手段570の第2の入力と信号通信により接続されている。動き予測手段575の第2の出力は、エントロピーコーダ545の第3の入力と信号通信により接続されている。
動き補償手段570の出力は、スイッチ597の第1の入力と信号通信により接続されている。イントラ予測モジュール560の出力は、スイッチ597の第2の入力と信号通信により接続されている。マクロブロックタイプ(MBタイプ)決定モジュール520の出力は、スイッチ597の第3の入力と信号通信により接続されている。スイッチ597の第3の入力は、(制御入力、すなわち第3の入力と比較して)スイッチの「データ」入力が、動き補償手段570またはイントラ予測モジュール560により提供されるべきか否かを判断する。スイッチ597の出力は、コンバイナ519の第2の非反転入力およびコンバイナ585の反転入力と信号通信により接続されている。
フレーム順序付けバッファ510の第1の入力およびエンコーダコントローラ505の入力は、入力ピクチャを受信するためのエンコーダ500の入力として利用可能である。また、付加拡張情報(SEI)インサータ530の第2の入力は、メタデータを受信するためのエンコーダ500の入力として利用可能である。出力バッファ535の出力は、ビットストリームを出力するためのエンコーダ500の出力として利用可能である。
図6を参照すると、本発明の原理が適用可能な例示的ビデオデコーダが、参照番号600により全体的に示されている。ビデオデコーダ600は、エントロピーデコーダ645の第1の入力と信号通信により接続されている出力を備えた入力バッファ610を含んでいる。エントロピーデコーダ645の第1の出力は、逆変換器および逆量子化器650の第1の入力と信号通信により接続されている。逆変換器および逆量子化器650の出力は、コンバイナ625の第2の非反転入力と信号通信により接続されている。コンバイナ625の出力は、デブロッキングフィルタ665の第2の入力とイントラ予測モジュール660の第1の入力と信号通信により接続されている。デブロッキングフィルタ665の第2の出力は、参照ピクチャバッファ680の第1の入力と信号通信により接続されている。参照ピクチャバッファ680の出力は、動き補償手段670の第2の入力と信号通信により接続されている。
エントロピーデコーダ645の第2の出力は、動き補償手段670の第3の入力、デブロッキングフィルタ665の第1の入力およびイントラ予測手段660の第3の入力と信号通信により接続されている。エントロピーデコーダ645の第3の出力は、デコーダコントローラ605の出力と信号通信により接続されている。デコーダコントローラ605の第1の出力は、エントロピーデコーダ645の第2の入力と信号通信により接続されている。デコーダコントローラ605の第2の出力は、逆変換器および逆量子化器650の第2の入力と信号通信により接続されている。デコーダコントローラ605の第3の出力は、デブロッキングフィルタ665の第3の入力と信号通信により接続されている。デコーダコントローラ605の第4の出力は、イントラ予測モジュール660の第2の入力、動き補償手段670の第1の入力、参照ピクチャバッファ680の第2の入力と信号通信により接続されている。
動き補償手段670の出力は、スイッチ697の第1の入力と信号通信により接続されている。イントラ予測モジュール660の出力は、スイッチ697の第2の入力と信号通信により接続されている。スイッチ697の出力は、コンバイナ625の第1の非反転入力と信号通信により接続されている。
入力バッファ610の入力は、入力ビットストリームを受信するためのデコーダ600の入力として利用可能である。デブロッキングフィルタ665の第1の出力は、出力ピクチャを出力するためのデコーダ600の出力として利用可能である。
上記で言及したように、本発明の原理は、ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置を対象としている。ある実施形態では、より小さなブロックレベルで残差を更新し、そして大きな変換および付随する量子化の効率性を犠牲にして、より良質の予測を提供することができる。符号化性能を向上しつつ、残差更新方式の利点を付与する他の実施形態では、特定の符号化ブロックにつき、最良の方式を選択するために、適応型切替手法を更に提案する。特に、符号化される現ブロックについてのテンプレート・マッチングにおける種々の残差更新方式から選択することを提案する。スイッチ状態の不確定性は、結果として生じるビットストリームで明示的に送信し、あるいは例えば、復号化されたピクチャ情報から非明示的に導くことができる。この適応型切替方式の目的は、種々の残差更新方式を利用することにより、テンプレート・マッチングについての予測と変換の最良のトレードオフを特定することにより、符号化効率を向上させることである。提案された技術は、イントラおよびインター予測の双方に適用できる。
ここで本発明の原理に従い、より小さい変換サイズを利用することにより、予測データを向上させる「方法2」と呼ばれる方法を開示し、かつ記述する。4つの標的ブロックの予測プロセスは、以下のステップを伴う。
(1)隣接画素を用いて、標的ブロックについて(および/または基本ブロックに対応する他のブロック内で)テンプレートを生成する。
(2)マッチングを探索し、この標的ブロックについて予測を生じさせる。
(3)標的ブロックをその予測で更新する。
(4)標的ブロックの残差を変換し、変換係数を取得し、係数を量子化し、量子化された係数を逆変換する。
(5)予測標的ブロックおよび量子化された残差標的ブロックを追加することにより、再構成された標的ブロックを生成する。
(6)標的ブロックをその再構成により更新する。
(7)標的ブロック2、3、4について、ステップ(1)〜(6)を繰り返す。
(8)基本ブロックを終了する。
変換がより小さなブロックに基づくと、隣接サブブロックは、より早期に再構成することができる。よって、後に予測された標的ブロックは、予測データを利用する代わりに、テンプレートとして再構成された画素を利用することができ、これにより予測性能が向上する。
適応型残差更新
第1の残差更新方式においては、(たとえばより大きな変換を利用することにより)変換においてより効率的な方式が利用されるが、予測が不良なものとなる場合があるが、一方で第2の残差更新方式は、(第1の方式よりも)良質な予測を提供できるが、大きな変換を利用することに伴う効率性を犠牲にする場合がある。本発明の原理によると、これらの2つの方式を、適応型残差更新構造に統合し、符号化効率を向上させるために、双方の方法の利点を活用することにより、予測精度と変換および量子化の効率性の間の良好なトレードオフを達成している。
種々の標的サイズおよび種々の利用可能な変換サイズにより、様々な残差更新方式を達成することができる。本発明の原理による最適な残差更新方式は、それらのすべての利点を活用することができ、それの不都合を適宜、回避することができる。
本発明の原理によると、(複数の)残差更新方式を統合するために、ある構造を構築する。この構造には、テンプレート・マッチングのための多くの種々の残差更新方式があってもよい。これらの方式の中での不確定性は、結果として生じるビットストリームで明示的に送信され、あるいは例えば、復号化されたピクチャに基づいて非明示的に導かれてもよい。記述および簡略化のために、選択する対象として利用できる2つの残差更新方式があると仮定するが、本発明の原理は、当該技術分野および関連する技術分野の当業者が直ちに、3つ以上の残差更新方式が関与するように拡張可能であることに注意されたい。
実施形態1:明示的切替方法
上記したように2つ以上の残差更新方式が存在する場合、当該方式の間の不確定性を解決する必要がある。本実施形態では、いずれの方式が選択されるかを示すために、例えばフラグまたはインディケータを利用することによる、明示的切替方法を提案する。エンコーダでは、たとえばレート歪コストを考慮して、全ての残差更新方式を評価し、最良の残差更新方式を選択し、対応するデコーダにフラグまたはインディケータを送信することができる。デコーダでは、ビットストリームからフラグまたはインディケータを読み取ることにより、不確定性を解決し、復号化する際に対応する方式を適用する。
図7を参照すると、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新の例示的方法は、参照番号700により全体的に示されている。当該方法700は、制御を機能ブロック710に渡す開始ブロック705を含んでいる。機能ブロック710は、min_rdcost=max_value,best_scheme=default_value.k=0を設定することにより、テンプレート・マッチング予測について初期化を行い、制御をループ端ブロック715に渡す。ループ端ブロック715は、一つのブロックに関する全ての残差更新方式をループにかけることを開始し、制御をループ端ブロック720に渡す。ループ端ブロック720は、すべてのサブブロックをループにかけることを開始し、制御をループ端ブロック725に渡す。機能ブロック725はテンプレートを生成し、制御を機能ブロック730に渡す。機能ブロック730はテンプレート・マッチングを行い、制御を機能ブロック735に渡す。機能ブロック735は、標的ブロックを予測により更新し、制御を機能ブロック740に渡す。機能ブロック740は、現方式に従い、現標的ブロックにつき、変換、量子化、および再構成(残差の更新)を行うべきか否かを判断し、制御をループ端ブロック745に渡す。ループ端ブロック745は、全てのサブブロックをループにかけるのを終了し、制御を機能ブロック750に渡す。機能ブロック750は、現方式に従い、現ブロックにつき、変換、量子化、および再構成(残差の更新)を行うべきか否かを判断し、制御をループ端ブロック755に渡す。機能ブロック755は、機能ブロック750により得られた判断に対応するレート歪コストを算定し、制御を決定ブロック760に渡す。決定ブロック760は、rdcost>=min_rdcostであるか否かを判断する。そうであれば、制御がループ端ブロック768に渡される。そうでない場合は、制御は機能ブロック765に渡される。機能ブロック765は、min_rdcostおよびbest_scheme=kを設定し、制御を機能ブロック768に渡す。機能ブロック768は、k=k+1を設定し、制御をループ端ブロック770に渡す。ループ端ブロック770は、全ての残差更新方式をループにかけるのを終了し、制御を機能ブロック775に渡す。機能ブロック775は、best_schemeをテンプレート・マッチング予測の出力として選択し、tmp_res_upd_indをbest_schemeと共に設定し、制御を機能ブロック780に渡す。機能ブロック780は、すべてのシンタックス(tmp_res_upd_indを含む)および関連する係数情報を符号化し、制御を終了ブロック799に渡す。
図8を参照すると、ビデオデコーダにおけるテンプレート・マッチング予測の適応型残差更新の例示的方法が、参照番号800により全体的に示されている。当該方法800は、制御を機能ブロック810に渡す開始ブロック805を含んでいる。機能ブロック810は、入力ビットストリームを構文解析し、tmp_res_upd_indと共にbest_schemeと共に設定し、制御をループ端ブロック815に渡す。ループ端ブロック815は、すべてのサブブロックをループにかけるのを開始し、制御を機能ブロック820に渡す。機能ブロック820はテンプレートを生成し、制御を機能ブロック825に渡す。機能ブロック825はテンプレート・マッチングを行い、制御を機能ブロック830に渡す。機能ブロック830は、標的ブロックを予測により更新し、制御を機能ブロック835に渡す。機能ブロック835は、best_schemeに従い、現標的ブロックを再構成(残差を更新)するか否かを決定し、制御をループ端ブロック840に渡す。ループ端ブロック840は、すべてのサブブロックをループにかけるのを終了し、制御を機能ブロック845に渡す。機能ブロック845は、best_schemeに従い、現ブロックを再構成(残差を更新)するか否かを決定し、制御を終了899に渡す。
実施形態2:非明示的切替方法
明示的切替方法は、追加のサイド情報にかかるコストを支払うことにより、エンコーダにおいて最良の方式を常に選択することができ、これにより符号化性能を低下させる場合がある。上述のように、追加のサイド情報を送信する必要性を回避するために、種々の方式間の不確定性は、非明示的に導かれてもよい。細分化情報、隣接ブロック符号化情報(たとえば変換サイズ、係数、モードおよび/またはその他)、局所的ピクチャコンテンツ統計(たとえば、平均値、分散値および/またはその他)等を活用することができる。この非明示的切替方法は、明示的切替方法における追加的なオーバーヘッドを回避することができ、これにより緩変動コンテンツの場合に使用されることが好まれる場合がある。ビデオエンコーダにおける本実施形態を伴う方法は、以下の図9との関連で記載されており、ビデオデコーダにおける本実施形態を伴う方法は、以下の図10との関連で記載されている。
実施形態3:量子化パラメータ依存の切替方法
特定のサブブロックに対して残差の更新が早期に行われるほど、(特定のサブブロックに関する)以下のサブブロックが良質な予測を得られる可能性が高くなる。またブロック全体の予測もより良質となる。ブロックが大きな量子化パラメータ(QP)の値により符号化される場合、かかる場合に残差は少ない量のデータを提供するに過ぎないため、入手可能な予測がより良質であることを好むようになる。他方、ブロックが比較的小さい量子化パラメータの値により符号化される場合は、残差は非常に重要になり、相当量の予測誤差を補償することができる。よって上記を考慮し、量子化パラメータ依存の切替方法を提供する。たとえば、上記の2つの方式のみを導入したことを考えると、量子化パラメータの値が大きい場合は、より良質の予測を入手するために、方法2を利用することができる。あるいは大きな変換を利用するという利点を維持するために、方法1を利用する。
以下の図9および10は、本明細書に記載の実施形態2および3の双方に関連する。
ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新の別の例示的方法は、参照番号900により全体的に示されている。当該方法900は、制御を機能ブロック910に渡す開始ブロック905を含んでいる。機能ブロック910は、量子化パラメータ(QP)、細分化情報、隣接ブロック情報、復号化されたコンテンツ統計および/またはその他により、best_schemeを導き、制御をループ端ブロック915に渡す。ループ端ブロック915は、全てのサブブロックをループにかけ、制御を機能ブロック920に渡す。機能ブロック920はテンプレートを生成し、制御を機能ブロック925に渡す。機能ブロック925はテンプレート・マッチングを行い、制御を機能ブロック930に渡す。機能ブロック930は、標的ブロックを予測により更新し、制御を機能ブロック935に渡す。機能ブロック935は、best_schemeに従い、現標的ブロックにつき、変換、量子化、および再構成(残差の更新)を行うべきか否かを決定し、制御をループ端ブロック940に渡す。ループ端ブロック940は、全てのサブブロックをループにかけるのを終了し、制御を機能ブロック945に渡す。機能ブロック945は、現方式に従い、現ブロックにつき、変換、量子化、および再構成(残差の更新)を行うべきか否かを判断し、制御を機能ブロック950に渡す。機能ブロック950は、すべてのシンタックスおよび関連する係数情報を符号化し、制御を終了ブロック999に渡す。
図10を参照すると、ビデオデコーダにおけるテンプレート・マッチング予測の適応型残差更新の他の例示的方法は、参照番号1000により全体的に示されている。当該方法1000は、制御を機能ブロック1010に渡す開始ブロック1005を含んでいる。機能ブロック1010は、入力ビットストリームを構文解析し、制御を機能ブロック1015に渡す。機能ブロック1015は、量子化パラメータ(QP)、細分化情報、隣接ブロック情報、復号化されたコンテンツ統計および/またはその他により、best_schemeを導き、制御をループ端ブロック1020に渡す。ループ端ブロック1020は、全てのサブブロックをループにかけるのを開始し、制御を機能ブロック1025に渡す。機能ブロック1025はテンプレートを生成し、制御を機能ブロック1030に渡す。機能ブロック1030はテンプレート・マッチングを行い、制御を機能ブロック1035に渡す。機能ブロック1035は、標的ブロックを予測により更新し、制御を機能ブロック1040に渡す。機能ブロック1040は、best_schemeに従い、現標的ブロックにつき、再構成(残差の更新)を行うべきか否かを決定し、制御をループ端ブロック1045に渡す。ループ端ブロック1045は、全てのサブブロックをループにかけるのを終了し、制御を機能ブロック1050に渡す。機能ブロック1050は、best_schemeに従い、現ブロックにつき、再構成(残差の更新)を行うべきか否かを判断し、制御を終了ブロック1099に渡す。
表1は、本発明の原理の実施形態に従い、実施形態1、2、3の例示的スライス・ヘッダ・シンタックスを図示している。
Figure 0005869493
表1の一部のシンタックス要素のセマンティクスは以下の通りである。

1に等しいuse_tmp_res_upd_flagは、テンプレート・マッチングにおける複数の残差更新方式の使用を指定している。0に等しいuse_tmp_res_upd_flagは、唯一の残差更新方式の使用を指定している。

1に等しいuse_exp_tmp_res_upd_flagは、明示的切替方法の使用を指定している。0に等しいuse_exp_tmp_res_upd_flagは、非明示的切替方法の使用を指定している。

1に等しいuse_qp_tmp_res_upd_flagは、量子化パラメータ依存の切替方法の使用を指定している。0に等しいuse_qp_tmp_res_upd_flagは、量子化パラメータ依存の切替方法を使用しないことを指定している。
tmp_res_upd_indは、現ブロックにより使用される対応する残差更新方式を示している。
実施形態4:多層構造の残差更新方法
本実施形態においては、新規の多層構造の残差更新方法が提案されている。特に、ここで提示された2つの方法のみが存在すると仮定して、基本ブロックは2回、符号化される。これにより、3つ以上の残差更新方法を伴う他の実施形態においては、基本ブロックは3回以上復号化されてもよいことが理解されるべきである。
それにもかかわらず、基本ブロックを2回、符号化するステップを伴う上記実施例においては、まずブロックは、比較的高い量子化パラメータの値を伴う方法2により符号化される。そして再構成されたヴァージョンの基本ブロックを得ることができる。第1段階では、ブロックは、比較的低い量子化パラメータの値を伴う方法1により符号化される。しかし第5段階では、テンプレートは、第1段階からの再構成されたブロック出力に基づいて生成することができる。最後に、結果として生じるビットストリームで双方のステップから残差を送信する。デコーダでは、類似のステップが実行される。一つの実装においては、実施形態4が以下のステップを含んでいる。
(1)比較的高い量子化パラメータの値を設定する。
(2)小さな変換サイズを使用して方法2により、基本ブロック全体を符号化する。
(3)方法2に基づき、再構成された基本ブロックを取得する。
(4)比較的低い量子化パラメータを設定する。
(5)大きな変換を利用して、方法1に基づき基本ブロックを符号化し、ここではテンプレート生成は、ステップ(3)から得られた再構成された基本ブロックに基づくことができる。
(6)ステップ(2)および(5)から残差係数を送信する。
(7)ブロックを終了する。
以下の図11および12におけるステップ(2)、ステップ(3)、ステップ(5)に対する言及は、実施形態4に関するステップの直前に列挙されたものと関連している。
図11を参照すると、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新の更に別の例示的方法が、参照番号1100により全体的に示されている。当該方法1100は、制御を機能ブロック1110に渡す開始ブロック1105を含んでいる。機能ブロック1110は、2つの残差更新方式についてのデフォルト量子化パラメータの値、すなわちQP1およびQP2により、テンプレート・マッチング予測に対する初期化を行い、制御をループ端ブロック1115に渡す。ループ端ブロック1115は、すべてのサブブロックをループにかけることを開始し、制御を機能ブロック1120に渡す。機能ブロック1120はテンプレートを生成し、制御を機能ブロック1125に渡す。機能ブロック1125はテンプレート・マッチングを行い、制御を機能ブロック1130に渡す。機能ブロック1130は、標的ブロックを予測により更新し、制御を機能ブロック1135に渡す。機能ブロック1135は、QP1により、現標的ブロックにつき、変換、量子化、再構成(残差の更新)を行い、制御をループ端ブロック1140に渡す。ループ端ブロック1140は、全てのサブブロックをループにかけることを終了し、制御を機能ブロック1145に渡す。機能ブロック1145は、ステップ(2)に関する係数を格納し、制御をループ端ブロック1150に渡す。ループ端ブロック1150は、全てのサブブロックをループにかけることを開始し、制御を機能ブロック1155に渡す。機能ブロック1155は、復号化されたピクチャまたはステップ(3)から得られた再構成されたブロックに基づいてテンプレートを生成し、制御を機能ブロック1160に渡す。機能ブロック1160はテンプレート・マッチングを行い、制御を機能ブロック1165に渡す。機能ブロック1165は、標的ブロックを予測により更新し、制御をループ端ブロック1170に渡す。ループ端ブロック1170は、全てのサブブロックをループにかけるのを終了し、制御を機能ブロック1175に渡す。機能ブロック1175は、QP2により、現ブロックにつき、変換、量子化、再構成(残差の更新)を行い、制御を機能ブロック1180に渡す。機能ブロック1180は、ステップ(5)に関する係数を格納し、制御を機能ブロック1185に渡す。機能ブロック1185は、すべてのシンタックス、ステップ(2)および(5)の係数等を符号化し、制御を終了ブロック1199に渡す。
図12を参照すると、ビデオデコーダにおけるテンプレート・マッチング予測の適応型残差更新の更に別の例示的方法が、参照番号1200により全体的に示されている。当該方法1200は、制御を機能ブロック1210に渡す開始ブロック1205を含んでいる。機能ブロック1210は、入力ビットストリームを構文解析し、制御をループ端ブロック1215に渡す。ループ端ブロック1215は、全てのサブブロックをループにかけることを開始し、制御を機能ブロック1220に渡す。機能ブロック1220は、テンプレートを生成し、制御を機能ブロック1225に渡す。機能ブロック1225はテンプレート・マッチングを行い、制御を機能ブロック1230に渡す。機能ブロック1230は、標的ブロックを予測により更新し、制御を機能ブロック1235に渡す。機能ブロック1235は、ステップ(2)の係数により、現標的ブロックに再構成(残差を更新)を行い、制御をループ端ブロック1240に渡す。ループ端ブロック1240は、すべてのサブブロックをループにかけるのを終了し、制御を機能ブロック1245に渡す。機能ブロック1245は、すべてのサブブロックをループにかけることを開始し、制御をループ端ブロック1250に渡す。機能ブロック1250は、復号化されたピクチャまたはステップ(3)から得られた再構成されたブロックに基づいてテンプレートを生成し、制御を機能ブロック1255に渡す。機能ブロック1255はテンプレート・マッチングを行い、制御を機能ブロック1260に渡す。機能ブロック1260は、標的ブロックを予測により更新し、制御を機能ブロック1265に渡す。ループ端ブロック1265は、すべてのサブブロックをループにかけるのを終了し、制御を機能ブロック1270に渡す。機能ブロック1270は、ステップ(5)の係数により、現ブロックに再構成(残差の更新)を行い、制御を終了ブロック1299に渡す。
シンタックス
表2は、本発明の原理の実施形態に従い、実施形態4の例示的スライス・ヘッダ・シンタックスを図示している。
Figure 0005869493
表2の一部のシンタックス要素のセマンティクスは以下の通りである。

1に等しいuse_tmp_res_upd_flagは、テンプレート・マッチングにおける複数の残差更新方式の使用を指定している。0に等しいuse_tmp_res_updは、唯一の残差更新方式の使用を指定している。

1に等しいuse_multi_layer_tmp_res_upd_flagは、多層構造の残差更新方式の使用を指定している。0に等しいuse_multi_layer_tmp_res_upd_flagは、多層構造の残差更新方式の使用をしないことを指定している。
実施形態5:複数を組み合わせた残差更新方法
本実施形態においては、複数を組み合わせた新規の残差更新方法が提案されている。特に、ここで提示された2つの残差更新方法のみが存在すると仮定して、基本ブロックは2回、符号化される。これにより、3つ以上の方法を伴う他の実施形態においては、基本ブロックは3回以上復号化されてもよいことが理解されるべきである。
それにもかかわらず、基本ブロックを2回、符号化するステップを伴う上記実施例においては、まず、ブロックは方法2により符号化される。そして再構成されたヴァージョンの基本ブロックを得ることができる。そしてブロックは方法1により符号化される。最後に、再構成されたブロックを組み合わせて、最終的な再構成されたブロックを形成する。2つの方法における残差は、結果として生じるビットストリームで送信される。
デコーダでは、類似のステップが実行される。
図13を参照すると、ビデオエンコーダにおけるテンプレート・マッチング予測の適応型残差更新の更に別の例示的方法が、参照番号1300により全体的に示されている。当該方法1300は、機能ブロック1310および機能ブロック1315に制御を渡す開始ブロック1305を含んでいる。機能ブロック1310および機能ブロック1315は、2つの独立した残差更新方式、すなわち方法1および方法2を各々利用して、テンプレート・マッチングおよび符号化を行い、2つの再構成されたヴァージョンの現ブロックを得る。そして機能ブロック1310および機能ブロック1315は、制御を機能ブロック1320に渡す。機能ブロック1320は、機能ブロック1310および機能ブロック1315から得た、2つの再構成されたヴァージョンを組み合わせ、現ブロックの最終の再構成されたブロックを形成し、制御を機能ブロック1325に渡す。機能ブロック1325は、すべてのシンタックスおよび双方の方法からの残差を符号化し、制御を終了ブロック1330に渡す。
図14を参照すると、ビデオデコーダにおけるテンプレート・マッチング予測の適応型残差更新の更に別の例示的方法が、参照番号1400により全体的に示されている。当該方法1400は、機能ブロック1410に制御を渡す開始ブロック1405を含んでいる。機能ブロック1410は、ビットストリームを構文解析し、機能ブロック1415および機能ブロック1420に制御を渡す。機能ブロック1415および機能ブロック1420は、2つの独立した方法、すなわち方法1および方法2を各々利用して、テンプレート・マッチング予測および復号化を行い、2つの再構成されたヴァージョンの現ブロックを得る。そして機能ブロック1415および1420は、制御を機能ブロック1425に渡す。機能ブロック1425は、機能ブロック1415および機能ブロック1420から得た再構成されたブロックを組み合わせ、現ブロックの最終の再構成されたブロックを形成し、制御を終了ブロック1430に渡す。
シンタックス
表3は、本発明の原理の実施形態に従い、実施形態5の例示的スライス・ヘッダ・シンタックスを図示している。
Figure 0005869493
表3の一部のシンタックス要素のセマンティクスは以下の通りである。

1に等しいuse_tmp_res_upd_flagは、テンプレート・マッチングにおける複数の残差更新方式の使用を指定している。0に等しいuse_tmp_res_upd_flagは、唯一の残差更新方式の使用を指定している。

1に等しいuse_comb_multi_tmp_res_upd_flagは、複数を組み合わせた残差更新方法の使用を指定している。0に等しいuse_comb_multi_tmp_res_upd_flagは、複数を組み合わせた残差更新方法の使用をしないことを指定している。
本発明の多くの付随する利点/特徴の幾つかに関する記載がなされており、その一部は上述されている。例えば、一つの利点/特徴は、装置が、テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを符号化する、ビデオエンコーダを備えており、テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを備えているという点である。
他の利点/特徴は、装置は上述のようなビデオエンコーダを備えており、複数の残差更新方式の少なくとも一つは、レート歪コストに基づいて選択される、という点である。
更にもう一つの利点/特徴は、装置は上述のようなビデオエンコーダを備えており、複数の残差更新方式の各々は、ブロックを複数のサブブロックに細分化するステップと、複数の残差更新方式の一つは、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、複数のサブブロックのうち特定のサブブロックの残差に変換を適用するステップを含み、複数の残差更新方式の他の一つは、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理に引き続き、複数のサブブロックのうち特定のサブブロックの残差に変換を適用するステップを含む、という点である。
更にもう一つの利点/特徴は、装置は上述のようなビデオエンコーダを備えており、複数の残差更新方式は、結果として生じるビットストリームで明示的に示される、という点である。
また他の利点/特徴は、装置は上述のようなビデオエンコーダを備えており、複数の残差更新方式の少なくとも一つは、ピクチャとしての同一のビデオシーケンスに対応する少なくとも一つの復号化されたピクチャ、少なくとも一つのブロックの量子化パラメータの値、ブロック内の少なくとも一つのサブブロック、ブロックに対する少なくとも一つの隣接ブロック、または少なくとも一つのサブブロック、ピクチャコンテンツ統計、細分化情報および少なくとも一つの隣接ブロックの符号化情報に基づいて選択される。
また他の利点/特徴は、装置は上述のようなビデオエンコーダを備えており、ブロックを予測するために、2つ以上の複数の残差更新方式が組合せ可能である、という,である。
また他の利点/特徴は、装置はビデオエンコーダを備えており、上述のように、ブロックを予測するために、2つ以上の複数の残差更新方式が組合せ可能であり、複数の残差更新方式の各々は、互いに対して独立であり、ブロックの最終予測は、少なくとも2つの複数の残差更新方式の出力の組合せである、という点である。
また他の利点/特徴は、装置はビデオエンコーダを備えており、上述のように、ブロックを予測するために、2つ以上の複数の残差更新方式が組合せ可能であり、複数の残差更新方式は互いに従属しており、複数の残差更新方式のうち特定の一つのものの一つの出力は、複数の残差更新方式の少なくとの一つの他の特定の一つのものの少なくとも一つの他の出力に従属している、という点である。
更に他の利点/特徴は、装置はテンプレート・マッチング予測を利用して、ピクチャ内のブロックを符号化するビデオエンコーダを備えており、テンプレート・マッチング予測は、ブロックを複数のサブブロックに細分化するステップ、および特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、複数のサブブロックのうち特定のサブブロックの残差に変換を適用するステップと、を含む、という点である。
本発明の原理の上記および他の特徴および利点は、本明細書に記載された教示に基づき、関連する技術分野の当業者により容易に確認できる。本発明の原理の教示は、様々な形態のハードウェア、ソフトウェア、ファームウェア、専用プロセッサまたはこれらの組合せにより実施できる。
最も好ましくは、本発明の原理の教示は、ハードウェアおよびソフトウェアの組合せとして実施される。さらにソフトウェアは、プログラム記憶装置上で実体的に具現化されるアプリケーションプログラムとして実施されてもよい。アプリケーションプログラムは、何らかの適切なアーキテクチャを有するマシンにアップロードされ、そのマシンによって実行されてもよい。好ましくは、マシンは1つ以上の中央処理装置(CPU)、ランダムアクセスメモリ(RAM)、および入力/出力(I/O)インターフェース等のハードウェアを有するコンピュータ・プラットフォーム上で実施される。コンピュータ・プラットフォームには、オペレーティングシステムおよびマイクロインストラクションコードを含んでいてもよい。本明細書に記載される種々の処理および機能は、マイクロインストラクションコードの一部、アプリケーションプログラムの一部、またはそのいずれの組合せであってもよく、CPUにより実行されるものであってもよい。また他の種々の周辺装置は、補助データ記憶装置および印刷装置等のコンピュータ・プラットフォームに接続されていてもよい。
添付図面に記載された構成システム要素および方法の一部は、ソフトウェアによって好適に実施されるため、システム構成要素間又はプロセス機能ブロック間の実際の接続は、本発明の原理がプログラミングされる態様によって異なる場合があることが理解されるべきである。本明細書に記載された教示を前提とすると、当業者は、本発明の原理のこれらおよび類似の実装または構造を予測することができるであろう。
例示的実施形態が添付の図面を参照して本明細書中で記載されてきたが、当然に、本発明の原理はこれらの厳密な実施形態に限られず、様々な変更及び改変が、本発明の原理の範囲及び趣旨から逸脱することなく、当該実施形態において当業者によって行われ得る。全てのこのような変更及び改変は、添付の特許請求の範囲に記載されている本発明の原理の範囲内に包含されることが意図される。

Claims (14)

  1. テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを符号化するビデオエンコーダを備え、前記テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを含み、残差更新方式の選択は、細分化情報、隣接ブロック符号化情報、局所的ピクチャコンテンツ統計のうちの少なくとも1つに基づき、前記複数の残差更新方式の少なくとも1つについて、後に予測されたブロックは、予測データを使用する代わりに再構成された画素をテンプレートとして利用し、ブロックを予測するために、2つ以上の前記複数の残差更新方式が組合せ可能であり、前記複数の残差更新方式の各々は、互いに対して独立であり、ブロックの最終予測は、少なくとも2つの前記複数の残差更新方式の出力の組合せである、装置。
  2. ビデオエンコーダにおける方法であって、テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを符号化するステップを含み、前記テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを含み、残差更新方式の選択は、細分化情報、隣接ブロック符号化情報、局所的ピクチャコンテンツ統計のうちの少なくとも1つに基づき、前記複数の残差更新方式の少なくとも1つについて、後に予測されたブロックは、予測データを使用する代わりに再構成された画素をテンプレートとして利用し、ブロックを予測するために、2つ以上の前記複数の残差更新方式が組合せ可能であり、前記複数の残差更新方式の各々は、互いに対して独立であり、ブロックの最終予測は、少なくとも2つの前記複数の残差更新方式の出力の組合せである、前記方法。
  3. 前記複数の残差更新方式の少なくとも一つは、レート歪コストに基づいて選択される、請求項2に記載の方法。
  4. 前記複数の残差更新方式の各々は、ブロックを複数のサブブロックに細分化するステップを含み、前記複数の残差更新方式の一つは、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、前記複数のサブブロックから特定のサブブロックの残差に変換を適用するステップを含み、前記複数の残差更新方式の他の一つは、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了に引き続き、前記複数のサブブロックのうち特定のサブブロックの残差に変換を適用するステップを含む、請求項2に記載の方法。
  5. 前記複数の残差更新方式は、結果として生じるビットストリームで明示的に示される、請求項2に記載の方法。
  6. 前記複数の残差更新方式の少なくとも一つは、ピクチャとしての同一のビデオシーケンスに対応する復号化されたピクチャ、少なくとも一つのブロックの量子化パラメータの値、ブロック内の少なくとも一つのサブブロック、ブロックに対する少なくとも一つの隣接ブロック、または少なくとも一つのサブブロック、ピクチャコンテンツ統計、細分化情報および少なくとも一つの隣接ブロックの符号化情報のうちの少なくとも1つに基づいて選択される、請求項2に記載の方法。
  7. テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを復号化する、ビデオデコーダを備えた装置であって、前記テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを備え、残差更新方式の選択は、細分化情報、隣接ブロック符号化情報、局所的ピクチャコンテンツ統計のうちの少なくとも1つに基づき、前記複数の残差更新方式の少なくとも1つについて、後に予測されたブロックは、予測データを使用する代わりに再構成された画素をテンプレートとして利用し、ブロックを予測するために、2つ以上の前記複数の残差更新方式が組合せ可能であり、前記複数の残差更新方式の各々は、互いに対して独立であり、ブロックの最終予測は、少なくとも2つの前記複数の残差更新方式の出力の組合せである、装置。
  8. テンプレート・マッチング予測を利用して、ピクチャ内の少なくとも一つのブロックについてピクチャデータを復号化するステップを含む、ビデオエンコーダにおける方法であって、前記テンプレート・マッチング予測は、ブロックを符号化する際に使用される複数の残差更新方式から選択するステップを含み、残差更新方式の選択は、細分化情報、隣接ブロック符号化情報、局所的ピクチャコンテンツ統計のうちの少なくとも1つに基づき、前記複数の残差更新方式の少なくとも1つについて、後に予測されたブロックは、予測データを使用する代わりに再構成された画素をテンプレートとして利用し、ブロックを予測するために、2つ以上の前記複数の残差更新方式が組合せ可能であり、前記複数の残差更新方式の各々は、互いに対して独立であり、ブロックの最終予測は、少なくとも2つの前記複数の残差更新方式の出力の組合せである、前記方法。
  9. 前記複数の残差更新方式の各々は、ブロックを複数のサブブロックに細分化するステップを含み、前記複数の残差更新方式の一つは、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、前記複数のサブブロックから特定のサブブロックの残差に変換を適用するステップを含み、前記複数の残差更新方式の他の一つは、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了に引き続き、前記複数のサブブロックのうち特定のサブブロックの残差に変換を適用するステップを含む、請求項8に記載の方法。
  10. 前記複数の残差更新方式の少なくとも一つは、ピクチャとしての同一のビデオシーケンスに対応する復号化されたピクチャ、少なくとも一つのブロックの量子化パラメータの値、ブロック内の少なくとも一つのサブブロック、ブロックに対する少なくとも一つの隣接ブロック、または少なくとも一つのサブブロック、ピクチャコンテンツ統計、細分化情報および少なくとも一つの隣接ブロックの符号化情報のうちの少なくとも1つに基づいて選択される、請求項8に記載の方法。
  11. テンプレート・マッチング予測を利用して、ピクチャ内のブロックを符号化するビデオエンコーダを備え、前記テンプレート・マッチング予測は、ブロックを複数のサブブロックに細分化するステップと、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、前記複数のサブブロックから特定のサブブロックの残差に変換を適用するステップとを含み、ブロックを予測するために、2つ以上の前記複数の残差更新方式が組合せ可能であり、前記複数の残差更新方式の各々は、互いに対して独立であり、前記複数の残差更新方式の少なくとも1つについて、後に予測されたブロックは、予測データを使用する代わりに再構成された画素をテンプレートとして利用し、前記ブロックは各々の残差更新方式により符号化され、各々の残差はビットストリームに含まれており、ブロックの最終予測は、少なくとも2つの前記複数の残差更新方式の出力の組合せである、装置。
  12. ビデオエンコーダにおける方法であって、テンプレート・マッチング予測を利用して、ピクチャ内のブロックを符号化するステップを含み、前記テンプレート・マッチング予測は、ブロックを複数のサブブロックに細分化するステップと、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、前記複数のサブブロックから特定のサブブロックの残差に変換を適用するステップと、を含み、ブロックを予測するために、2つ以上の前記複数の残差更新方式が組合せ可能であり、前記複数の残差更新方式の各々は、互いに対して独立であり、前記複数の残差更新方式の少なくとも1つについて、後に予測されたブロックは、予測データを使用する代わりに再構成された画素をテンプレートとして利用し、前記ブロックは各々の残差更新方式により符号化され、各々の残差はビットストリームに含まれており、ブロックの最終予測は、少なくとも2つの前記複数の残差更新方式の出力の組合せである、前記方法。
  13. テンプレート・マッチング予測を利用して、ピクチャ内のブロックを復号化するビデオデコーダを備え、前記テンプレート・マッチング予測は、
    ブロックを複数のサブブロックに細分化するステップと、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、前記複数のサブブロックから特定のサブブロックの残差に変換を適用するステップとを含み、ブロックを予測するために、2つ以上の前記複数の残差更新方式が組合せ可能であり、前記複数の残差更新方式の各々は、互いに対して独立であり、前記複数の残差更新方式の少なくとも1つについて、後に予測されたブロックは、予測データを使用する代わりに再構成された画素をテンプレートとして利用し、前記ブロックは各々の残差更新方式により符号化され、各々の残差はビットストリームに含まれており、ブロックの最終予測は、少なくとも2つの前記複数の残差更新方式の出力の組合せである、装置。
  14. ビデオデコーダにおける方法であって、テンプレート・マッチング予測を利用して、ピクチャ内のブロックを復号化するステップを含み、前記テンプレート・マッチング予測は、ブロックを複数のサブブロックに細分化するステップと、特定のサブブロックに関する予測を探索するステップに引き続き、テンプレート・マッチング予測に関するブロックの処理の完了以前に、前記複数のサブブロックから特定のサブブロックの残差に変換を適用するステップと、を含み、ブロックを予測するために、2つ以上の前記複数の残差更新方式が組合せ可能であり、前記複数の残差更新方式の各々は、互いに対して独立であり、前記複数の残差更新方式の少なくとも1つについて、後に予測されたブロックは、予測データを使用する代わりに再構成された画素をテンプレートとして利用し、前記ブロックは各々の残差更新方式により符号化され、各々の残差はビットストリームに含まれており、ブロックの最終予測は、少なくとも2つの前記複数の残差更新方式の出力の組合せである、前記方法。
JP2012543080A 2009-12-08 2010-12-02 ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置 Active JP5869493B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US26771509P 2009-12-08 2009-12-08
US61/267,715 2009-12-08
PCT/US2010/003075 WO2011071514A2 (en) 2009-12-08 2010-12-02 Methods and apparatus for adaptive residual updating of template matching prediction for video encoding and decoding

Publications (3)

Publication Number Publication Date
JP2013513333A JP2013513333A (ja) 2013-04-18
JP2013513333A5 JP2013513333A5 (ja) 2014-01-23
JP5869493B2 true JP5869493B2 (ja) 2016-02-24

Family

ID=43569947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012543080A Active JP5869493B2 (ja) 2009-12-08 2010-12-02 ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置

Country Status (6)

Country Link
US (1) US10743027B2 (ja)
EP (3) EP2640075A3 (ja)
JP (1) JP5869493B2 (ja)
KR (1) KR101839629B1 (ja)
CN (2) CN102742268B (ja)
WO (1) WO2011071514A2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5869493B2 (ja) 2009-12-08 2016-02-24 トムソン ライセンシングThomson Licensing ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置
KR101836981B1 (ko) * 2010-07-09 2018-03-09 한국전자통신연구원 템플릿 매칭을 이용한 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
CN103329532B (zh) * 2011-03-10 2016-10-26 日本电信电话株式会社 量子化控制装置和方法以及量子化控制程序
JP5982734B2 (ja) * 2011-03-11 2016-08-31 ソニー株式会社 画像処理装置および方法
WO2013051209A1 (ja) 2011-10-05 2013-04-11 パナソニック株式会社 画像符号化方法、画像符号化装置、画像復号方法、画像復号装置、および、画像符号化復号装置
CN104104966B (zh) * 2013-04-08 2017-11-24 华为技术有限公司 视频块的划分方法和装置
WO2015053594A1 (ko) 2013-10-12 2015-04-16 삼성전자 주식회사 인트라 블록 복사 예측을 이용한 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
JP2019213242A (ja) * 2014-04-28 2019-12-12 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化方法、復号方法、符号化装置および復号装置
JPWO2015166639A1 (ja) * 2014-04-28 2017-04-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化方法、復号方法、符号化装置および復号装置
CN105338351B (zh) 2014-05-28 2019-11-12 华为技术有限公司 基于模板匹配的帧内预测编、解码、阵列扫描方法及装置
CN105225212B (zh) * 2014-06-27 2018-09-28 腾讯科技(深圳)有限公司 一种图片处理方法和装置
US10412415B2 (en) 2014-10-24 2019-09-10 Lg Electronics Inc. Method and apparatus for decoding/encoding video signal using transform derived from graph template
US10958927B2 (en) * 2015-03-27 2021-03-23 Qualcomm Incorporated Motion information derivation mode determination in video coding
JP6379186B2 (ja) * 2016-02-17 2018-08-22 テレフオンアクチーボラゲット エルエム エリクソン(パブル) ビデオピクチャを符号化および復号する方法および装置
CN105704496A (zh) * 2016-03-25 2016-06-22 符锌砂 一种基于边缘检测的自适应模板匹配算法
US10397569B2 (en) * 2016-06-03 2019-08-27 Mediatek Inc. Method and apparatus for template-based intra prediction in image and video coding
WO2018097077A1 (ja) * 2016-11-22 2018-05-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
WO2018120290A1 (zh) * 2016-12-26 2018-07-05 华为技术有限公司 一种基于模板匹配的预测方法及装置
EP3580928A1 (en) * 2017-02-08 2019-12-18 Fraunhofer Gesellschaft zur Förderung der Angewand Predictive coding concept using template matching
US20200154124A1 (en) * 2017-07-04 2020-05-14 Lg Electronics Inc. Image decoding method based on inter prediction and image decoding apparatus therefor
EP3451665A1 (en) * 2017-09-01 2019-03-06 Thomson Licensing Refinement of internal sub-blocks of a coding unit
EP3685583A1 (en) * 2017-10-09 2020-07-29 Huawei Technologies Co., Ltd. Template update for motion vector refinement
JP7350757B2 (ja) * 2018-02-15 2023-09-26 アリス エンタープライジズ エルエルシー テンプレートマッチングのための可変テンプレートサイズ
WO2019190907A1 (en) 2018-03-30 2019-10-03 Vid Scale, Inc Template-based inter prediction techniques based on encoding and decoding latency reduction
CN110662033B (zh) * 2018-06-28 2021-11-23 杭州海康威视数字技术股份有限公司 一种解码、编码方法及其设备
CN109462762B (zh) * 2018-10-26 2020-12-01 国网福建省电力有限公司漳州供电公司 用于无人机航拍的图像处理方法
US11418811B2 (en) * 2019-03-12 2022-08-16 Apple Inc. Method for encoding/decoding image signal, and device therefor
CN113632493A (zh) * 2019-03-13 2021-11-09 北京字节跳动网络技术有限公司 变换跳过模式中的子块变换
US20230421751A1 (en) * 2022-05-23 2023-12-28 Tencent America LLC Subblock-based motion vector predictor with mv offset derived by template matching
US20240022763A1 (en) * 2022-07-13 2024-01-18 Tencent America LLC Intra block copy (ibc) candidate list construction with motion information of intra template-matching prediction
WO2024058637A1 (ko) * 2022-09-16 2024-03-21 주식회사 윌러스표준기술연구소 비디오 신호 처리 방법 및 이를 위한 장치
WO2024091002A1 (ko) * 2022-10-26 2024-05-02 주식회사 윌러스표준기술연구소 비디오 신호 처리 방법 및 이를 위한 장치

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US6919826B1 (en) * 2003-12-19 2005-07-19 Sun Microsystems, Inc. Systems and methods for efficient and compact encoding
CN100344163C (zh) 2004-06-16 2007-10-17 华为技术有限公司 视频编解码处理方法
JP2007043651A (ja) * 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US8005140B2 (en) * 2006-03-17 2011-08-23 Research In Motion Limited Soft decision and iterative video coding for MPEG and H.264
WO2007125856A1 (ja) 2006-04-28 2007-11-08 Ntt Docomo, Inc. 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
JP2007300380A (ja) 2006-04-28 2007-11-15 Ntt Docomo Inc 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
JP4994767B2 (ja) * 2006-10-03 2012-08-08 株式会社エヌ・ティ・ティ・ドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
CN101222641B (zh) 2007-01-11 2011-08-24 华为技术有限公司 帧内预测编解码方法及其装置
EP2453655A1 (en) * 2007-04-09 2012-05-16 NTT DoCoMo, Inc. Image coding using template matching
CN101904173B (zh) * 2007-12-21 2013-04-03 艾利森电话股份有限公司 用于视频编码的改进像素预测的方法及设备
US8228990B2 (en) * 2008-01-16 2012-07-24 Sony Corporation Template matching scheme using multiple predictors as candidates for intra-prediction
TWI500308B (zh) * 2008-03-09 2015-09-11 Lg Electronics Inc 視訊訊號之編碼或解碼方法及其裝置
JP2010268259A (ja) 2009-05-15 2010-11-25 Sony Corp 画像処理装置および方法、並びにプログラム
JP5869493B2 (ja) 2009-12-08 2016-02-24 トムソン ライセンシングThomson Licensing ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置

Also Published As

Publication number Publication date
CN105791823B (zh) 2019-11-29
CN102742268A (zh) 2012-10-17
KR20120126067A (ko) 2012-11-20
EP2621174A3 (en) 2014-02-26
JP2013513333A (ja) 2013-04-18
EP2640075A2 (en) 2013-09-18
KR101839629B1 (ko) 2018-03-16
EP2640075A3 (en) 2014-02-26
US20120281752A1 (en) 2012-11-08
CN105791823A (zh) 2016-07-20
WO2011071514A3 (en) 2011-08-25
WO2011071514A2 (en) 2011-06-16
EP2621174A2 (en) 2013-07-31
US10743027B2 (en) 2020-08-11
EP2510697B1 (en) 2017-08-23
EP2510697A2 (en) 2012-10-17
CN102742268B (zh) 2016-05-04

Similar Documents

Publication Publication Date Title
JP5869493B2 (ja) ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置
JP6708700B2 (ja) 統一された有意性マップ符号化方法および装置
KR101326610B1 (ko) 매크로블록 적응적 인터-층 인트라 텍스쳐 예측을 위한 방법 및 장치
JP5275806B2 (ja) スケーラブルビデオ符号化及び復号における重み付け予測方法及び装置
JP5801363B2 (ja) 符号化及び復号化のための装置及び方法並びにコンピュータプログラム
JP5801054B2 (ja) スライスデータ用のマルチパスビデオのシンタックス構造をサポートする方法及び装置
JP6425609B2 (ja) 空間変化残差符号化を行う方法および装置
JP2018201222A (ja) ビデオ符号化およびビデオ復号における変換の選択のための方法および装置
JP5805097B2 (ja) 映像符号化及び復号化のためのdcイントラ予測モードのための方法及び装置
JP2013523010A (ja) ビデオ符号化およびビデオ復号化のための暗示的適応型動きベクトル予測器選択の方法および装置
KR20120039728A (ko) 비디오 인코딩 및 디코딩에서 적응적 변환 선택을 위한 방법들 및 장치
JP2013522957A (ja) 変換選択を有するビデオ符号化および復号のための制約付きの変換を行う方法および装置
JP6528635B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131126

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141001

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141224

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150513

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150806

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20151021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160107

R150 Certificate of patent or registration of utility model

Ref document number: 5869493

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250