JP5792319B2 - ビデオデータのブロック係数のモード依存型スキャニング - Google Patents

ビデオデータのブロック係数のモード依存型スキャニング Download PDF

Info

Publication number
JP5792319B2
JP5792319B2 JP2013546217A JP2013546217A JP5792319B2 JP 5792319 B2 JP5792319 B2 JP 5792319B2 JP 2013546217 A JP2013546217 A JP 2013546217A JP 2013546217 A JP2013546217 A JP 2013546217A JP 5792319 B2 JP5792319 B2 JP 5792319B2
Authority
JP
Japan
Prior art keywords
scan order
block
coefficients
video data
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013546217A
Other languages
English (en)
Other versions
JP2014504489A (ja
Inventor
ジェン、ユンフェイ
コバン、ムハンメド・ゼイド
ソール・ロジャルス、ジョエル
カークゼウィックズ、マルタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2014504489A publication Critical patent/JP2014504489A/ja
Application granted granted Critical
Publication of JP5792319B2 publication Critical patent/JP5792319B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • H03M7/4012Binary arithmetic codes
    • H03M7/4018Context adapative binary arithmetic codes [CABAC]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4031Fixed length to variable length coding
    • H03M7/4037Prefix coding
    • H03M7/4043Adaptive prefix coding
    • H03M7/4068Parameterized codes
    • H03M7/4075Golomb codes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6035Handling of unkown probabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願
この出願は、下記の米国特許仮出願の利益を権利主張するものである。2010年12月22日に提出された米国特許仮出願61/426372号、2010年12月22日に提出された米国特許仮出願番号61/426349号、および2011年1月27日に提出された米国特許仮出願61/436835号、上記出願の各々の内容の全体が、参照によって本明細書に組み込まれる。
この開示は、ビデオデータを圧縮するために使用されるブロックベースのビデオエンコーディング技術、特に、エンコーディング処理中にビデオブロックデータをシリアル化するために使用されるスキャニング技術に関する。
[0003]デジタルビデオ機能は、デジタルテレビ、デジタルダイレクトブロードキャストシステム、無線電話ハンドセットのような無線通信デバイス、無線ブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、デジタルカメラ、デジタル記録デバイス、ビデオゲームデバイス、ビデオゲームコンソール、パーソナルマルチメディアプレイヤ、およびそれらと同様のものを含む幅広いビデオデバイスに組み込まれうる。このようなビデオデバイスは、ビデオデータを圧縮するために、MPEG−2、MPEG−4、またはITU−T H.264/MPEG−4、パート10、発展型ビデオコーディング(AVC)において説明されるもののような、ビデオ圧縮技術を実施しうる。ビデオ圧縮技術は、ビデオシーケンスに内在する冗長性を低減または除去するために、空間および/または時間予測を実行する。MPEGおよびITU−Tのコラボレーションである「ジョイントコラボレーションチーム−ビデオコーディング」(JCTVC)によって開発される高性能ビデオコーディング(HEVC)規格のような新たなビデオ規格が浮上および展開し続けている。新興のHEVC規格は、H.265と称されることもある。
[0004]これらのまたは他のビデオコーディング規格および技術は、ブロックベースのビデオコーディングを使用する。ブロックベースのビデオコーディング技術は、ビデオフレームのビデオデータ(またはその一部)をビデオブロックに分割し、その後、予測ブロックベース圧縮技術を用いてビデオブロックをエンコードする。ビデオブロックはさらに、ビデオブロックパーティションに分割されうる。ビデオブロック(またはそのパーティション)は、コーディングユニット(CU)と称され、1または複数のビデオ固有のエンコーディング技術のみならず、一般的なデータ圧縮技術を用いてエンコードされうる。
[0005]新興のHEVC規格を用いて、最大コーディングユニット(LCU)は、四分木分割スキームによって、より小さい(smaller and smaller)複数のCUに分割されうる。CUは、いわゆる予測ユニット(PU)に基づいて予測されうる。これは、複数のPUが所与のCUを予測するために使用されることができるように、CUのサイズに対応する、またはCUのサイズよりも小さいパーティションサイズを有しうる。CUは、ビデオフレーム内の空間冗長性を活用するために、同じフレームまたはスライス内の予測データに基づいてイントラコーディングされうる。代替的に、CUは、ビデオシーケンスのフレームにわたる時間冗長性を活用するために、別のフレームまたはスライスからの予測データに基づいてインターコーディングされうる。予測コーディング(イントラまたはインター)の後、離散コサイン変換(DCT)、整数変換、またはそれらと同様のもののような、変換コーディングが実行されうる。HEVCを用いて、変換コーディングは、変換ユニット(TU)に関して行われうる。これはまた、HEVC規格においてさまざまな変換サイズを有しうる。変換係数の量子化、量子化された変換係数のスキャニング、エントロピーコーディングもまた実行されうる。シンタックス情報は、ビデオデータをどのようにデコードするかをデコーダに通知するために、例えば、ビデオスライスヘッダまたはビデオブロックヘッダにおけるエンコードされたビデオデータを用いてシグナリングされる。
[0006]本開示は、イントラ予測モードのタイプと、変換係数の所与のブロックを変換する際に使用される変換ブロックサイズとに基づいて、異なる複数のスキャン順序が定義され、異なる複数のイントラ予測モードに対して使用される技術について説明する。1つの例において、スキャン順序の選択は、水平スキャン順序、垂直スキャン順序、およびラスタースキャン順序の中からなされるが、その他のスキャン順序もサポートされうる。望ましいスキャン順序は、例えば、エンコードされたビデオデータに対するレート歪み測定基準という意味で、ジグザグ、水平、および垂直スキャン順序の中からサーチすることと、コーディング結果を比較することとによって、エンコーダによって決定されうる。エンコーディングのために最善のスキャン順序が選択および使用され、その後、デコーダに対して(例えば、ブロックレベルシンタックス要素として)ビットストリーム内でシグナリングされうる。異なる複数のスキャン順序の使用によってもたらされうるパフォーマンスにおける改良は、最善のスキャン順序に対する徹底的な(exhaustive)サーチに起因して、複雑性をエンコーダに付加しうる。しかし、付加された複雑性とのバランスを保つために、可能性のあるスキャン順序の数は制限され、ビデオブロックのための選択されたスキャン順序をシグナリングすることを目的として、可能性のあるスキャン順序をインデックスするために、切換可能なシグナリングスキームが使用されうる。これらの技術の固定例および切替可能な例が、さらに詳細に以下に説明される。
[0007]1つの実例において、本開示は、ビデオデータのブロックに関連付けられた係数をエンコードする方法について説明している。この方法は、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて、係数に対するスキャン順序を選択することと、ビデオデータのブロックのための選択されたスキャン順序を通信するためにシンタックス要素を生成することとを備える。
[0008]別の実例において、本開示は、ビデオデータのブロックに関連付けられた係数をデコードする方法について説明している。この方法は、ビデオデータのブロックを伴うシンタックス要素を受信することと、ここにおいて、シンタックス要素は、トップスキャン順序候補のセットからスキャン順序を定義し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいてトップスキャン順序候補のセットを定義することと、ビデオデータのブロックを、定義されたトップスキャン順序候補のセットに関連するシンタックス要素に基づいて、ビデオデータのブロックのシリアル化された表現から、ビデオデータのブロックの2次元表現に逆スキャンすることと、を備える。
[0009]別の実例において、本開示は、ビデオデータのブロックに関連付けられた係数をエンコードするビデオエンコーディングデバイスについて説明しており、このビデオエンコーディングデバイスは、イントラコーディングモードに基づいてビデオデータのブロックのイントラ予測コーディングを実行する予測ユニットと、変換サイズを決定し、その変換サイズにしたがってビデオデータのブロックに変換を実行する変換ユニットと、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づく係数に対するスキャン順序を選択し、ビデオデータのブロックのための選択されたスキャン順序を通信するためにシンタックス要素を生成するスキャンユニットと、を備える。
[0010]別の実例において、本開示は、ビデオデータのブロックに関連付けられた係数をデコードするビデオデコーディングデバイスについて説明しており、このビデオデコーディングデバイスは、データのブロックを伴うシンタックス要素を受信するユニットと、ここにおいてシンタックス要素は、トップスキャン順序候補のセットからスキャン順序を定義し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいてトップスキャン順序候補のセットを定義するスキャンユニットとを備える。スキャンユニットは、ビデオデータのブロックを、定義されたトップスキャン順序候補のセットに関連するシンタックス要素に基づいて、ビデオデータのブロックのシリアル化された表現から、ビデオデータのブロックの2次元表現に逆スキャンすることを実行する。
[0011]別の実例において、本開示は、ビデオデータのブロックに関連付けられた係数をエンコードするデバイスについて説明しており、このデバイスは、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づく係数に対するスキャン順序を選択する手段と、ビデオデータのブロックのための選択されたスキャン順序を通信するためにシンタックス要素を生成する手段とを備える。
[0012]別の実例において、本開示は、ビデオデータのブロックに関連付けられた係数をデコードするデバイスについて説明しており、このデバイスは、ビデオデータのブロックを伴うシンタックス要素を受信する手段と、ここにおいて、シンタックス要素は、トップスキャン順序候補のセットからスキャン順序を定義し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいてトップスキャン順序候補のセットを定義する手段と、ビデオデータのブロックを、定義されたトップスキャン順序候補のセットに関連するシンタックス要素に基づいて、ビデオデータのブロックのシリアル化された表現から、ビデオデータのブロックの2次元表現に逆スキャンする手段とを備える。
[0013]本開示において説明された技術は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組み合わせにおいて実現されることができる。ハードウェアにおいて実現される場合、装置は、集積回路、プロセッサ、離散ロジック、またはそれら任意の組み合わせとして実現されうる。ソフトウェアにおいて実現される場合、ソフトウェアは、マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、またはデジタル信号プロセッサ(DSP)のような、1または複数のプロセッサにおいて実行されうる。この技術を実行するソフトウェアは、有形的なコンピュータ読取可能な記憶媒体に最初に記憶され、プロセッサにおいてロードおよび実行されうる。
[0014]したがって、本開示は、実行されると、プロセッサに、ビデオデータのブロックに関連付けられた係数をエンコードさせる命令群を備えるコンピュータ読取可能な記憶媒体に関し、ここにおいて、この命令群は、プロセッサに、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づく係数に対するスキャン順序を選択させ、ビデオデータのブロックのための選択されたスキャン順序を通信するためにシンタックス要素を生成させる。
[0015]さらに、本開示はまた、実行されると、プロセッサに、ビデオデータのブロックに関連付けられた係数をデコードさせる命令群を備えるコンピュータ読取可能な媒体について説明しており、ここにおいて、この命令群は、トップスキャン順序候補のセットからスキャン順序を定義する、ビデオデータのブロックを伴うシンタックス要素を受信すると、プロセッサに、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいてトップスキャン順序候補のセットを定義させ、ビデオデータのブロックを、定義されたトップスキャン順序候補のセットに関連するシンタックス要素に基づいて、ビデオデータのブロックのシリアル化された表現から、ビデオデータのブロックの2次元表現に逆スキャンさせる。
[0016]本開示の1または複数の態様の詳細が、添付の図面と、以下の記載において説明される。本開示において説明される技術のその他の特徴、目的、利点が、説明、図面、および請求項から明らかとなるだろう。
図1は、本開示の1つまたは複数の技術を実現しうるビデオエンコーディングおよびデコーディングシステムを例示するブロック図である。 図2は、本開示の1つまたは複数の実例と一致する典型的なビデオエンコーダを例示するブロック図である。 図3は、本開示の1つまたは複数の実例と一致する典型的なビデオデコーダを例示するブロック図である。 図4は、四分木分割スキームにしたがって分割されたビデオブロックの概念図である。 図5は、図4において示された四分木分割においてもたらされる分割決定を表す決定木である。 図6Aは、ジグザグスキャン順序を例示する概念図である。 図6Bは、水平スキャン順序を例示する概念図である。 図6Cは、垂直スキャン順序を例示する概念図である。 図7は、新興のHEVC規格と一致する典型的な予測モードを例示する概念図である。 図8は、四分木分割スキームにしたがって分割されたビデオブロックの別の概念図である。 図9は、本開示の技術を実現するために使用されうるテーブルである。 図10は、本開示の技術を実現するために使用されうるテーブルである。 図11は、本開示の技術を実現するために使用されうるテーブルである。 図12は、本開示の技術を実現するために使用されうるテーブルである。 図13は、本開示の技術を実現するために使用されうるテーブルである。 図14は、本開示と一致する技術を例示するフロー図である。 図15は、本開示と一致する技術を例示するフロー図である。 図16は、本開示と一致する技術を例示するフロー図である。
[0027]本開示は、ビデオデータのブロックの係数に実行されるスキャン技術に関する。係数は、いわゆる有意(significant)係数と、ゼロ値係数とを備えうる。これは、残差変換係数が有意である(すなわち、ゼロではない)か否(すなわち、ゼロである)かを定義するバイナリ値またはフラグ(すなわち、0または1)である。有意係数は、ビデオブロックの残差変換係数のうちのどれが有意であり、どれが有意ではないかを定義する有意マップを定義しうる。レベル値は、非ゼロ残差変換係数の実際値(actual value)を定義するために、有意係数と併せて定義されうる。このケースにおいて、有意係数およびゼロ値係数は、残差変換係数が有意である(すなわち、ゼロではない)か否(すなわち、ゼロである)かを定義し、レベル値は、有意である変換係数に対する実際値を定義する。
[0028]残差変換係数は、周波数ドメインにおける変換係数のブロックを備えうる。これは、残差ピクセル値のセットに関連付けられたエネルギーの分散を表す。残差ピクセル値は、空間ドメインにおいて、エンコードされるビデオデータのブロックと、予測エンコーディングのために使用される予測ビデオデータのブロックとの間の残差(residulal difference)を表す値のブロックを備えうる。残差ピクセル値は、異なるケースにおいて、量子化される可能性も量子化されない可能性もあり、本開示の技術は、何れかのまたは両方のケースに適用されることができる。予測データのブロックは、コーディングされるビデオブロックのものと同じフレームまたはスライスからのイントラ予測データであるか、または、コーディングされるビデオブロックのものに関連して、異なるフレームまたはスライスから定義されるインター予測データでありうる。離散コサイン変換(DCT)のような変換または、概念的に同様の処理が、周波数ドメインにおける変換係数をもたらすために、残差ピクセル値に適用されうる。有意係数の有意マップが、変換系位数が有意である(すなわち、ゼロではない)か否(すなわち、ゼロである)かを表すために作成されうる。
[0029]ビデオコーディングにおいて、スキャン技術は典型的に、係数のブロックを、2次元表現から1次元表現にシリアル化するために実行される。多くのケースにおいて、変換の後に続いて、ビデオブロックの右上の角の近くに位置する残差係数は、有意である可能性が最も高いが、高エネルギー係数のロケーションは、変換の方向性に起因して、いずれの場所にも位置付けられうる。いわゆるジグザグスキャンは、例えば、シリアル化された一次元表現の先頭の近くに係数を一緒にグループ化するように、有意係数のブロック(または、残差変換係数のブロック)を、二次元表現から一次元表現にシリアル化するための効果的なスキャン技術でありうる。しかしながら、(水平スキャン、垂直スキャン、ジグザグおよび水平スキャンの組み合わせ、ジグザグおよび垂直スキャンの組み合わせ、適応スキャン、またはその他のより複雑なスキャンパターンのような)その他のスキャン技術がいくつかのケースにおいてより効果的でありうる。いくつかのイントラコーディングモードはしばしば、ブロックの左垂直端またはブロックの上端に向かってバイアスされる有意係数の分散をもたらす。このようなケースにおいて、複数の異なるスキャン順序(例えば、非ジグザグ)の使用が、ビデオ圧縮を改良するためにビデオコーディングのコーディング効率を向上し得る。
[0030]本開示は、イントラ予測モードのタイプと、変換係数の所与のブロックを変換する際に使用された変換ブロックサイズとに基づいて、複数の異なるスキャン順序が定義され、複数の異なるイントラ予測モードに対して使用される技術について説明する。1つの例において、選択は、水平スキャン順序、垂直スキャン順序、およびラスタースキャン順序の中からなされるが、その他のスキャン順序もまた支援されうる。例えば、ジグザグ、水平、および垂直スキャン順序の中からサーチすることと、圧縮およびビデオ品質という点において結果を比較することとによって、望ましいスキャン順序が、エンコーディング処理におけるコーディングビットレート対歪みという意味において、エンコーダで決定できる。エンコーダによって選択されたスキャン順序が、ビットストリーム内のインデックスとして(例えば、ブロックレベルシンタックスとして)デコーダに送信されうる。複数の異なるスキャン順序の使用によってもたらされうるパフォーマンスにおける改良は、最善のスキャン順序に対する徹底的なサーチに起因して、複雑性をエンコーダに付加しうる。この理由のために、追加の技術が、エンコーダにおけるこのような複雑性を最小化するためにサーチのレベルを制限しうる。
[0031]1つの実例において、イントラブロックコーディングのためのモード依存型固定変換係数コーディング技術が提案される。モード依存型固定変換係数コーディング技術は、(「スキャニング順序」とも称される)スキャン順序をイントラ予測モードと関連付けうる。これは、イントラ予測モードのためのスキャン順序が、所与の変換サイズに対して固定されうることを意味する。エンコーダは、可能性のあるスキャン順序が少数しか存在しないかのように複雑性を低減するために、いくつかのスキャン順序の中からの徹底的なサーチを回避し得、同時に、この技術は、可能性のあるすべてのスキャン順序の徹底的なサーチに関連付けられた利益のいくつかを活用しうる。エンコーディング/デコーディングの両方ともに対するスキャン順序を固定することは、エンコーディングおよびデコーディングデバイスの両方による並行実施をサポートするために特に望ましい可能性がある。
[0032]本開示の技術は、イントラブロックコーディングに適用されうる。H.264/AVCと、新興のHEVC規格のテストモデルとにおいて、方向性外挿方法が、イントラブロックを予測するために使用されうる。方向性予測に起因して(すなわち、同じビデオスライス内のイントラデータに基づいて)、(ピクセルドメインにおける)残差ブロックは通常、方向特性を示す。これは、その後、(変換ドメインにおける)変換された係数ブロックに引き継がれる。この理由のために、変換係数のための(または、単に有意マップの有意係数のための)モード依存型スキャニングスキームが、コーディング効率を改良するために極めて有用でありうる。
[0033]別の実例において、モード依存型切換可能変換係数コーディング技術が使用されうる。このケースにおいて、トップスキャニング順序候補は、各予測モード、各変換サイズ、または予測モードおよび変換サイズの組み合わせに対して定義されうる。セットにおける候補(すなわち、トップスキャン順序候補)は、使用される予測モードおよびブロックサイズの両方に基づいて異なりうる。このケースにおいて、ブロックのための最善のスキャン順序は、予測モードに対して定められたセット内の候補の中からエンコーダによって決定されうるが、候補の数は、可能性のあるスキャン順序の総数よりも少なくなりうる。この技術は、いくらかの複雑性をエンコーダに付加しうるが、固定数のトップ候補スキャン順序に対する複雑性を制限しうる。デコーダは、エンコーダにおいて定義されたものと同じトップ候補のセットを定義しうる。そうすることで、デコーダは、適切なスキャン順序の使用を阻止するために、シンタックス要素を適切に解釈できる。
[0034]図1は、本開示の技術を実現しうる典型的なビデオエンコーディングおよびデコーディングシステム10を例示するブロック図である。図1に示されるように、システム10は、通信チャネル15によって、エンコードされたビデオを宛先デバイス16に送信するソースデバイス12を含む。ソースデバイス12および宛先デバイス16は、さまざまなデバイスのうちの任意のものを備えうる。いくつかのケースにおいて、ソースデバイス12および宛先デバイス16は、いわゆるセルラまたは衛星ラジオ電話のような、無線通信デバイスハンドセットを備えうる。しかしながら、ビデオエンコーディングおよびビデオデコーディングにおけるスキャニング技術に一般的に適用される本開示の技術は、無線アプリケーションまたは設定に必ずしも限定されるわけではなく、ビデオエンコーディングおよび/またはデコーディング機能を含む非無線デバイスに適用されうる。ソースデバイス12および宛先デバイス16は、本明細書において説明される技術を支援しうるコーディングデバイスの実例にすぎない。本開示の技術を使用しうるその他のビデオデバイスは、デジタルテレビ、デジタルダイレクトブロードキャストシステム、さまざまな無線通信デバイス、無線ブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、デジタルカメラ、デジタル記録デバイス、ビデオゲームデバイス、ビデオゲームコンソール、パーソナルマルチメディアプレイヤ、およびそれらと同様のものを含みうる。
[0035]図1の実例において、ソースデバイス12は、ビデオソース20と、ビデオエンコーダ22と、変調器/復調器(モデム)23と、送信機24とを含みうる。宛先デバイス16は、受信機26と、モデム27と、ビデオデコーダ28と、ディスプレイデバイス30とを含みうる。本開示によると、ソースデバイス12のビデオエンコーダ22は、ビデオデータのブロック係数を二次元ブロックフォーマットから一次元フォーマットにシリアル化するために、ビデオエンコーディング処理中に、本開示のスキャニング技術を実行するように構成されうる。シンタックス要素は、係数がどのようにスキャンされるかをシグナリングするためにビデオエンコーダ22において生成されうる。そうすることで、ビデオデコーダ28は、リシプロカル(すなわち、逆)スキャンを実行することができる。いくつかの実例において、ビデオエンコーダ22およびビデオデコーダ28は両方とも、例えば、コンテキスト情報に基づいて、トップスキャン順序候補のセットを決定するように構成されうる。その他の実例において、ビデオエンコーダ22は、ビデオデコーダ28による使用のために、スキャン順序を決定し、シンタックス情報におけるスキャン順序を単にエンコードしうる。
[0036]ソースデバイス12のビデオエンコーダ22は、本開示の技術を用いて、ビデオソース20から受信されたビデオデータをエンコードしうる。ビデオソース20は、ビデオカメラ、予めキャプチャされたビデオを含むビデオアーカイブ、またはビデオコンテンツプロバイダから供給されたビデオのような、ビデオキャプチャデバイスを備えうる。さらなる代替として、ビデオソース20は、ソースビデオとしてのコンピュータグラフィックベースのデータ、または、ライブビデオ、アーカイブビデオ、およびコンピュータ生成されたビデオの組み合わせを生成しうる。いくつかのケースにおいて、ビデオソース20がビデオカメラである場合、ソースデバイス12および宛先デバイス16は、いわゆるカメラ電話またはビデオ電話を形成しうる。各ケースにおいて、キャプチャ、プリキャプチャ、またはコンピュータ生成されたビデオは、ビデオエンコーダ22によってエンコードされうる。
[0037]ビデオデータがビデオエンコーダ22によってエンコードされると、エンコードされたビデオ情報は、例えば、符号分割多元接続(CDMA)、直交周波数多元多重化(OFDM)またはその他任意の通信規格または技術のような、通信規格にしたがってモデム23によって変調されうる。エンコードおよび変調されたデータがその後、送信機24によって、宛先デバイス16に送信されうる。モデム23は、様々なミキサ、フィルタ、増幅器、または信号変調のために設計されたその他の構成要素を含みうる。送信機24は、増幅器、フィルタ、および1または複数のアンテナを含む、データを送信するために設計された回路を含みうる。宛先デバイス16の受信機26は、チャネル15によって情報を受信し、モデム27は情報を復調する。ここでも、ビデオデコーダ28によって実行されるビデオデコーディング処理が、ビデオエンコーダ22によって使用されるそれらに対するリシプロカルスキャニング技術を含みうる。
[0038]通信チャネル15は、ラジオ周波数(RF)スペクトルか、1または複数の物理伝送回線のような、任意の無線または有線通信媒体、あるいはは無線および有線媒体の任意の組み合わせを備えうる。通信チャネル15は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットのようなグローバルネットワークのようなパケットベースのネットワークの一部を形成しうる。通信チャネル15は、一般的に、ビデオデータをソースデバイス12から宛先デバイス16に送信するための、任意の適切な通信媒体、または複数の異なる通信媒体のコレクションを表す。
[0039]ビデオエンコーダ22およびビデオデコーダ28は、実質的に、新興のHEVC規格のような、ビデオ圧縮規格にしたがって動作しうる。しかし、本開示の技術はまた、いくつかの古い規格、あるいは新たなまたは新興の規格を含むさまざまなその他のビデオコーディング規格のコンテキストにおいても適用されうる。
[0040]いくつかのケースにおいて、図1に示されてはいないが、ビデオエンコーダ22およびビデオデコーダ28は各々、オーディオエンコーダおよびデコーダと統合され、共通データストリームまたは別々のデータストリームにおけるオーディオおよびビデオの両方のエンコーディングを行うために、適切なMUX−DEMUXユニットまたはその他のハードウェアおよびソフトウェアを含みうる。適用可能であれば、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)のようなその他のプロトコルに準拠しうる。
[0041]ビデオエンコーダ22およびビデオデコーダ28は各々、1または複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特殊用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、離散ロジック、ソフトウェア、ハードウェア、ファームウェア、またはそれら任意の組み合わせとして実現されうる。ビデオエンコーダ22およびビデオデコーダ28の各々は、1または複数のエンコーダまたはデコーダに含まれうる。これらのうちのいずれかは、それぞれのモバイルデバイス、加入者デバイス、ブロードキャストデバイス、サーバ、またはそれらと同様のものにおける結合されたエンコーダ/デコーダ(CODEC)の一部として統合されうる。本開示において、用語コーダは、エンコーダまたはデコーダを指し、用語コーダ、エンコーダ、デコーダはすべて、本開示と一致するビデオデータのコーディング(エンコーディングまたはデコーディング)のために設計された特定の機械を指す。
[0042]いくつかのケースにおいて、デバイス12、16は、実質的に左右対称な方式で動作しうる。例えば、デバイス12、16の各々は、ビデオエンコーディングおよびデコーディング構成要素を含みうる。したがって、システム10は、例えば、ビデオストリーミング、ビデオプレイバック、ビデオブロードキャスティング、またはビデオ電話のために、ビデオデバイス12、16の間での一方向または双方向のビデオ伝送を支援しうる。
[0043]エンコーディング処理中、ビデオエンコーダ22は、多数のコーディング技術又は動作を実行しうる。一般的に、ビデオエンコーダ22は、ビデオブロックをエンコードするために、個々のビデオフレーム(または、スライスのような、独立して定義されたその他のビデオのユニット)内のビデオブロックに対して動作する。フレーム、スライス、フレームの一部、ピクチャのグループ、またはその他のデータ構造は、複数のビデオブロックを含むビデオ情報のユニットとして定義されうる。ビデオブロックは、固定されたまたは変動するサイズを有し、定められたコーディング規格にしたがってサイズが異なりうる。いくつかのケースにおいて、各ビデオフレームは、独立してデコード可能な一連のスライスを含み、各スライスは、一連のビデオブロックを含みうる。これは、さらにより小さなブロックに配置されうる。
[0044]マクロブロックは、ITU H.264規格およびその他の規格によって定義された1つのタイプのビデオブロックである。マクロブロックは一般的に、16×16のデータブロックを指す。ITU−T H.264規格は、ルーマ構成要素では16×16、8×8、または4×4、およびクロマ構成要素では8×8など、様々なブロックサイズのイントラ予測、ならびにルーマ構成要素では16×16、16×8、8×16、8×8、8×4、4×8および4×4、およびクロマ構成要素では対応するスケーリングされたサイズなど、様々なブロックサイズのインター予測を支援する。
[0045]新興のHEVC規格は、ビデオブロックのための新たな用語を定義する。具体的には、HEVCでは、ビデオブロック(または、それらのパーティション)は、「コーディングユニット」(CU)と称されうる。HEVC規格では、最大コーディングユニット(LCU)は、四分木分割スキームにしたがって、より小さいCUに分割されうる、さらに、スキームにおいて定義される複数の異なるCUは、いわゆる予測ユニット(PU)にさらに分割されうる。LCU、CU、およびPUはすべて、本開示の意味の範囲内において、ビデオブロックである。HEVC規格またはその他のビデオコーディング規格と一致する、その他のタイプのビデオブロックもまた使用されうる。このように、フレーズ「ビデオブロック」は、任意のサイズのビデオブロックを指す。さらに、ビデオブロックは、ピクセルドメインにおけるビデオデータのブロック、または、離散コサイン変換(DCT)ドメイン、DCTに類似したドメイン、ウェーブレットドメイン、またはそれらと同様のもののような、変換ドメインにおけるデータのブロックを指すこともある。
[0046]さらに、ビデオブロック(または、ビデオデータのブロック)は、いわゆる有意係数のブロックのことも指しうる。実際には、本開示のスキャン技術は、このような有意係数をスキャンする際に特に有用でありうる。有意係数は、(この場合もやはり、量子化されている可能性も、量子化されていない可能性もある)残差変換係数が有意である(すなわち、ゼロではない)か否(すなわち、ゼロである)かを定義するバイナリ値またはフラグ(すなわち、0または1)を備えうる。レベル値はまた、残差変換係数の実際値を定義するために、有意係数と併せて使用されうる。残差変換係数は、周波数ドメインにおける係数のブロックを備えうる。これは、残差ピクセル値のセットに関連付けられたエネルギーの分散を表す。同様に、残差ピクセル値は、エンコードされるビデオデータのブロックと、予測エンコーディングのために使用される予測ビデオデータのブロックとの間の残差を表す値のブロックを備えうる。予測データのブロックは、コーディングされるビデオブロックのものと同じフレームまたはスライスからのイントラ予測データであるか、または、コーディングされるビデオブロックのものに関連して、異なるフレームまたはスライスから定義されるインター予測データでありうる。本開示のスキャン技術は、イントラコーディングされる有意係数のブロックのためのスキャニング順序を選択するために使用されうるが、同様の技術が、インターコーディングされたブロックのためにも使用されうる。
[0047]ビデオエンコーダ22は、コーディングされるビデオブロックが予測ブロックを識別するために1または複数の予測候補と比較される予測コーディングを実行しうる。予測コーディングのこの処理は、イントラ(予測データが、同じビデオフレームまたはスライス内の近隣のイントラデータに基づいて生成されるケース)またはインター(予測データが、前のまたは後続のフレームまたはスライスにおけるビデオデータに基づいて生成されるケース)でありうる。繰り返しになるが、本開示のスキャニング技術は、イントラコーディングされる有意係数のブロックのためのスキャニング順序を選択するために使用されるが、同様の技術が、インターコーディングされたブロックのためにも使用されうる。
[0048]予測ブロックを生成した後、コーディングされている現在のビデオブロックと、予測ブロックとの間の差が、残差ブロックとしてコーディングされ、(インターコーディングのケースにおける動きベクトルまたはイントラコーディングのケースにおける予測モードのような)予測シンタックスが予測ブロックを識別するために使用される。残差ブロック(すなわち、残差値のブロック)は、変換係数のブロックを生成するために変換され、変換係数は量子化されうる。しかし、本開示の技術は、非量子化変換係数のケースにおいても適用されうる。変換技術は、DCT処理または概念的に類似した処理、整数変換、ウェーブレット変換、またはその他のタイプの変換を備えうる。例として、DCT処理において、変換処理は、(例えば、実際値と予測値との間の差を示す残差値のような)ピクセル値のセットを変換係数にコンバートする。これは、周波数ドメインにおけるピクセル値のエネルギーを表しうる。HEVC規格は、異なる複数のCUに対して異なる変換ユニット(TU)にしたがって変換を可能にする。TUは通常、分割されたLCUに対して定義されたCUのサイズにしたがってサイズ指定されるが、常にそうだというわけではない可能性がある。量子化は通常、変換係数に適用され、一般的に、任意の所与の変換係数に関連付けられたビットの数を制限する処理を含む。
[0049]変換および量子化の後に続いて、エントロピーコーディングが、量子化および変換された残差ビデオブロックに実行されうる。フィルタシンタックス情報、分割サイズ、動きベクトル、予測モード、またはその他の情報のようなシンタックス要素も、エントロピーコーディングされたビットストリームに含まれうる。一般に、エントロピーコーディングは、量子化された変換係数および/またはその他のシンタックス情報のシーケンスを集合的に備える1または複数の処理を備える。スキャニング技術は、二次元ビデオブロックから1または複数のシリアル化された一次元係数ベクトルを定義するために、量子化された変換係数に実行されうる。スキャンされた係数は、例えば、内容適応型可変長コーディング(CAVLC)、内容適応型バイナリ算術コーディング(CABAC)または別のエントロピーコーディング処理によって、任意のシンタックス情報と共にエントロピーコーディングされる。
[0050]本開示と一致するいくつかのケースにおいて、量子化された変換係数は、変換ブロック内の有意係数のセットを備える有意マップを最初にエンコードし、非ゼロ変換係数のレベルまたは値をエンコードすることによってエンコードされる。繰り返しになるが、有意係数は、残差変換係数が有意である(すなわち、ゼロではない)か否か(すなわち、ゼロである)を定義するバイナリ値またはフラグ(すなわち、0または1)を備えうる。追加の情報もまた、有意マップにおける有意係数に関連付けられた実際値またはレベルを定義するためにエンコードされうる。本開示のスキャニング技術は、有意マップのスキャニングに適用されうる。
[0051]エンコーディング処理の一部として、エンコードされたビデオブロックが、後続のビデオブロックの後続の予測ベースコーディングのために使用されるビデオデータを生成するためにデコードされうる。これはしばしば、エンコーディング処理のデコーディングループと称され、一般に、デコーダデバイスによって実行されるデコーディングを模倣する。エンコーダまたはデコーダのデコーディングループにおいて、フィルタリング技術は、例えば、ピクセルの境界を平滑化したり、場合によっては、デコードされたビデオからアーティファクトを除去するように、ビデオ品質を改良するために用いられうる。このフィルタリングは、インループまたはポストループでありうる。インループフィルタリングでは、再構築されたビデオデータのフィルタリングがコーディングループ内で行われる。これは、フィルタされたデータが、後続の画像データの予測における後続の使用のために、エンコーダまたはデコーダによって記憶されるということを意味する。対照的に、ポストループフィルタリングでは、再構築されたビデオデータのフィルタリングがコーディングループ外で行われる。これは、フィルタされていないバージョンのデータが、後続の画像データの予測における後続の使用のために、エンコーダまたはデコーダによって記憶されるということを意味する。ループフィルタリングはしばしば、個別のデブロックフィルタリング処理の後に起きる。これは、ビデオブロックの境界において現れるブロッキネスアーティファクトを除去するために、隣接するビデオブロックの境界における、またはその近くにあるピクセルにフィルタリングを適用する。
[0052]図2は、本開示と一致するビデオエンコーダ50を例示するブロック図である。ビデオエンコーダ50は、デバイス20のビデオエンコーダ22か、または異なるデバイスのビデオエンコーダに対応しうる。図2に示されるように、ビデオエンコーダ50は、予測ユニット32と、加算器48および51と、メモリ34とを含む。ビデオエンコーダ50はまた、変換ユニット38および量子化ユニット40に加えて、逆量子化ユニット42および逆変換ユニット44を含む。ビデオエンコーダ50はまた、エントロピーコーディングユニット46と、フィルタユニット47とを含む。これは、デブロックフィルタと、ポストループおよび/またはループフィルタとを含みうる。エンコーディングの方式を定義するエンコードされたビデオデータおよびシンタックス情報は、エントロピーエンコーディングユニット46に通信されうる。エントロピーコーディングユニット46は、スキャンユニットを含む。これは、本開示のスキャニング技術を実行しうる。
[0053]具体的には、スキャンユニット45は、ビデオデータのブロックに関連付けられた係数をエンコードする方法を実行しうる。ビデオデータのブロックは、LCU内にCUを備えうる。ここにおいて、LCUは、新興のHEVC規格と一致して、四分木分割スキームにしたがってCUのセットに分割される。係数をエンコードする際、スキャンユニット45は、ビデオデータのブロックを予測するために予測ユニット42によって使用されたイントラコーディングモードと、ビデオデータのブロックを変換するために変換ユニット38によって使用された変換ブロックサイズとに基づいて、係数(例えば、有意係数)に対するスキャン順序を選択しうる。スキャンユニット45は、ビデオデータのブロックのための選択されたスキャン順序を通信するためにシンタックス要素を生成しうる。さらに詳細に以下に説明されるように、スキャンユニット45は、ルーマブロックについての第1のルックアップテーブルからスキャン順序を選択し、クロマブロックについての第2のルックアップテーブルからスキャン順序を選択しうる。複数の異なるルックアップテーブルは、スキャンユニット45によってアクセス可能なメモリ34に記憶されるか、または、スキャンユニット45によってアクセス可能な別のメモリに記憶されうる。
[0054]いくつかのケースにおいて、スキャンユニット45は、可能性のあるすべてのスキャン順序からスキャン順序を選択するのではなく、トップスキャン順序候補のセットを定義し、トップスキャン順序候補のセットから選択しうる。このケースにおいて、デコーダは、エンコーダにおいて定義されたものと同じトップスキャン順序候補のセットを定義するように構成されうる。したがって、エンコーダとデコーダとの間のシグナリングは、インデックス値が、どのトップスキャン順序候補が使用されるかを定義しうる交換シグナリングスキームでありうる。デコーダは、インデックス値を受信し、同じトップスキャン順序候補のセットを定義し、トップスキャン順序候補のうちのどれが使用されるべきかを決定するためにインデックス値を適用しうる。
[0055]1つの交換シグナリングの実例において、スキャンユニット45は、可能性のあるスキャン順序候補のセットに基づいて可能性のある複数のイントラコーディングモードの各々のためのトップスキャン順序候補のセットを定義し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードのためのトップスキャン順序候補のセットからスキャン順序を選択し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードに関連付けられたトップ候補のセットから選択されたスキャン順序を識別するためにシンタックス要素を生成する。
[0056]別の交換シグナリングの実例において、スキャンユニット45は、可能性のあるスキャン順序候補のセットに基づいて可能性のある複数の変換ブロックサイズの各々のためのトップスキャン順序候補のセットを定義し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードのためのトップスキャン順序候補のセットからスキャン順序を選択し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードに関連付けられたトップ候補のセットから選択されたスキャン順序を識別するためにシンタックス要素を生成する。
[0057]さらに別の交換シグナリングの実例において、スキャンユニット45は、可能性のあるイントラコーディングモードと、可能性のある変換ブロックサイズとの組み合わせに対して定義された可能性のあるスキャン順序候補のセットに基づいて、可能性のあるイントラコーディングモードと、可能性のある変換ブロックサイズとの組み合わせのためのトップスキャン順序候補のセットを定義し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードのためのトップスキャン順序候補のセットからスキャン順序を選択し、ビデオデータのブロックを予測するために使用されたイントラコーディングモードに関連付けられたトップ候補のセットから選択されたスキャン順序を識別するためにシンタックス要素を生成する。
[0058]一般的に、エンコーディング処理中は、ビデオエンコーダ50は、コーディングされるビデオブロックを受信し、予測ユニット32は、予測コーディング技術を実行する。ビデオブロックは、上記で概要が述べられたCUを備えるか、または一般的に、ブロックベースのビデオコーディング技術または規格と一致して、任意のビデオデータのブロックを備えうる。インターコーディングでは、予測ユニット32は、予測ブロックを定義するために、エンコードされるビデオブロックを、1または複数のビデオ参照フレームまたはスライスにおけるさまざまなブロック(例えば、参照データの1つまたは複数の「リスト」)と比較する。再び、イントラコーディングの場合には、予測ユニット32は、同じコーディングユニット内の近隣のデータに基づいて予測ブロックを生成する。予測ユニット32は予測ブロックを出力し、加算器48は、残差ブロックを生成するために、コーディングされているビデオブロックから予測ブロックを減じる。
[0059]代替的に、インターコーディングでは、予測ユニット32は、予測ブロックを指し示す動きベクトルを識別し、その動きベクトル基づいて予測ブロックを生成する動き推定および動き補償ユニットを備えうる。典型的に、動き推定は、動きベクトルを生成する処理と見なされる。これは、動きを推定する。例えば、動きベクトルは、現在のフレーム内でコーディングされている現在のブロックに関連して予測フレーム内の予測ブロックの変位(displacement)を示しうる。動き補償は通常、動き推定によって決定された動きベクトルに基づいて、予測ブロックをフェッチまたは生成する処理と見なされる。いくつかのケースにおいて、インターコーディングのための動き補償は、サブピクセル解像度に対する補間を含みうる。これは、動き推定処理が、このようなサブピクセル解像度に対するビデオブロックの動きを推定することを可能にする。
[0060]予測ユニット32が予測ブロックを出力した後、かつ、残差ブロックを生成するために加算器48がコーディングされているビデオブロックから予測ブロックを減じた後、変換ユニット38は残差ブロックに変換を適用する。変換は、離散コサイン変換(DCT)か、または、ITU H.264規格またはHEVC規格によって定義されたもののような、概念的に類似した変換を備えうる。いわゆる「バタフライ」構造が変換を実行するために定義されうる、または、マトリクスベースの乗算も使用されうる。いくつかの実例では、HEVC規格と一致して、変換のサイズが、例えば、所与のLCUに関して行われる分割のレベルに依存して、複数の異なるCUごとに変化しうる。変換ユニット(TU)は、変換ユニット38によって適用される変換サイズを設定するために定義されうる。ウェーブレット変換、整数変換、サブバンド変換、またはその他のタイプの変換も使用されうる。任意のケースにおいて、変換ユニットは、変換を残差ブロックに適用して、残差変換係数のブロックを生成する。変換は、一般に、残差情報を、ピクセルドメインから周波数ドメインにコンバートしうる。
[0061]量子化ユニット40はその後、残差変換係数を量子化して、ビットレートをさらに低減する。量子化ユニット40は例えば、係数の各々をコーディングするために使用されるビットの数を制限しうる。量子化の後、エントロピーコーディングユニット46は、データをスキャンおよびエントロピーエンコーディングしうる。この場合もやはり、このスキャニングは、いわゆる有意係数に適用される。これは、量子化および変換された係数の各々が有意である(すなわち、ゼロではない)かどうかを定義する。このように、スキャンユニット45は、量子化および変換された係数のセットを受信し、有意マップ(それに加えて、任意の有意係数に関連付けられたレベルまたは値)を生成し、スキャン順序を選択してその有意マップに適用する。エントロピーエンコーディングユニット46はその後、エントロピーコーディングを、スキャンされた係数およびその他の値と、エンコードされたビットストリームにおけるシンタックス要素とに適用しうる。
[0062]具体的には、上述されたように、スキャンユニット45は、有意マップを形成する有意係数のセットを備えうるビデオデータのブロックに関連付けられた係数をエンコードする方法を実行しうる。係数をエンコードする際、スキャンユニット45は、ビデオデータのブロックを予測するために予測ユニット42によって使用されたイントラコーディングモードと、ビデオデータのブロックを変換するために変換ユニット38によって使用された変換ブロックサイズとに基づいて、係数(例えば、有意係数)に対するスキャン順序を選択しうる。スキャンユニット45は、ビデオデータのブロックのための選択されたスキャン順序を通信するためにシンタックス要素を生成しうる。変換ユニット38および予測ユニット32は、コンテキスト情報(例えば、モードおよびブロックサイズ)を、シンタックス情報として、エントロピーコーディングユニット46に供給しうる。
[0063]有意マップがスキャンユニット45によってスキャンされると、エントロピーエンコーディングユニット46は、エントロピーコーディング方法にしたがって、(例えば、有意マップおよび任意の非ゼロ係数に関連付けられたレベルを定義する異なる複数の要素をエンコードすることによって)量子化された変換係数をエンコードする。エントロピーコーディングユニット46によって使用されうるエントロピーコーディング技術の例は、内容適応型可変長コーディング(CAVLC)と、内容適応型バイナリ算術コーディング(CABAC)を含む。エントロピーコーディングされたビットストリームに含まれたシンタックス要素は、インターコーディングのための動きベクトルや、イントラコーディングのための予測モードのような、予測ユニット32からの予測シンタックスを含みうる。エントロピーコーディングされたビットストリームに含まれたシンタックス要素はまた、フィルタユニット47からのフィルタ情報と、例えば、変換ユニット38からのビデオブロックに適用された変換ブロックサイズとを含みうる。
[0064]CAVLCは、ITU H.264規格および新興のHEVC規格によってサポートされた1つのタイプのエントロピーコーディング技術である。これは、エントロピーコーディングユニット46によってベクトル化ベースで適用されうる。CAVLCは、係数および/またはシンタックス要素のシリアル化された「ラン(runs)」を効率的に圧縮する方式で、可変長コーディング(VLC)テーブルを使用する。CABACは、ITU H.264規格またはHEVC規格によってサポートされた別のタイプのエントロピーコーディング技術である。これは、エントロピーコーディングユニット46によってベクトル化ベースで適用されうる。CABACは、バイナリ化、コンテキストモデル選択、およびバイナリ算術コーディングを含む、いくつかのステージを含みうる。このケースにおいて、エントロピーコーディングユニット46は、CABACにしたがって係数およびシンタックス要素をコーディングする。その他の多くのタイプのエントロピーコーディング技術が存在しており、新たなエントロピーコーディング技術が将来的に現れる可能性が高い。本開示は、いかなる特定のエントロピーコーディング技術にも制限されることはない。
[0065]エントロピーエンコーディングユニット46によるエントロピーコーディングに続いて、エンコードされたビデオは、別のデバイスに送信されるか、後の送信または検索のためにアーカイブされうる。この場合もやはり、エンコードされたビデオは、エントロピーコーディングされたベクトルと、(スキャン順序をデコーダに通知するシンタックス情報を含む)さまざまなシンタックス情報を備えうる。このような情報は、デコーディング処理を適切に構成するためにデコーダによって使用されうる。逆量子化ユニット42および逆変換ユニット44はそれぞれ、ピクセルドメインにおける残差ブロックを再構築するために、逆量子化および逆変換を適用する。加算器51は、再構築された残差ブロックを、予測ユニット32によって生成された予測ブロックに追加して、メモリ34内に記憶するための再構築されたビデオブロックを生成する。しかし、このような記憶の前に、フィルタユニット47は、ビデオ品質を改良するために、フィルタリングをビデオブロックに適用しうる。フィルタユニット47によって適用されるフィルタリングは、アーティファクトを低減し、ピクセルの境界を平滑化しうる。さらに、フィルタリングは、コーディングされるビデオブロックにほぼ一致するものを備える予測ビデオブロックを生成することによって圧縮を改良しうる。
[0066]図3は、本明細書において説明される方式でエンコードされるビデオシーケンスをデコードするビデオデコーダ60の実例を例示するブロック図である。本開示のスキャニング技術は、いくつかの実例においてビデオデコーダ60によって実行されうる。ビデオデコーダ60において受信されたビデオシーケンスは、エンコードされた画像フレームのセット、フレームスライスのセット、一般的にコーディングされたピクチャのグループ(GOP)、または、(CUまたはマクロブロックのような)エンコードされたビデオブロックを含むビデオ情報と、このようなビデオブロックをどのようにデコードするかを定義するためのシンタックス情報とのさまざまなユニットを備えうる。いくつかのケースにおいて、逆スキャンユニット55は単に、エンコードされたビットストリームにおいてシグナリングされるスキャン順序を適用するのみでありうる。しかし、交換シグナリングの実例において、逆スキャンユニット55は、エンコーダ50のスキャンユニット45がトップスキャン順序候補を決定したのと同じ方式で、トップスキャン順序候補を決定する必要がありうる。
[0067]ビデオデコーダ60は、エントロピーデコーディングユニット52を含む。これは、図2のエントロピーエンコーディングユニット46によって実行されるエンコーディングのリシプロカルデコーディング機能を実行する。具体的には、エントロピーデコーディングユニット52は、CAVLCまたはCABACデコーディング、あるいは、ビデオエンコーダ50によって使用されるその他任意のタイプのエントロピーデコーディングを実行しうる。しかしながら、このようなエントロピーデコーディングの前に、逆スキャンユニット55は、ビデオデータのブロックを、一次元シリアル化フォーマットから、二次元ブロックフォーマットにリコンバートするために、エントロピーデコーディングユニット52によって起動される。有意マップにおける任意の有意係数に関連付けられたレベル値もデコードされうる。
[0068]交換シグナリングと一致する1つの実例において、ビデオデータのブロックに関連付けられた係数をデコードする方法の少なくとも一部が、インバーススキャンユニット55によって実行される。具体的には、逆スキャンユニット55は、ビデオデータのブロックを伴うシンタックス要素を受信しうる。ここにおいて、シンタックス要素は、トップスキャン順序候補のセットからスキャン順序を定義する。逆スキャンユニット55は、ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいてトップスキャン順序候補のセットを定義することと、定義されたトップスキャン順序候補のセットに関連するシンタックス要素に基づいて、ビデオデータのブロックを、ビデオデータのブロックのシリアル化された表現から、ビデオデータのブロックの2次元表現に逆スキャニングすることとを備える。この場合もやはり、係数は有意係数およびゼロ値係数を備え、ビデオデータのブロックは、有意係数およびゼロ値係数を定義する有意マップを備えうる。有意であると識別されるこれらの変換係数のために、レベルが定義され、通信されうる。
[0069]ビデオデコーダ60はまた、予測ユニット54と、逆量子化ユニット56と、逆変換ユニット58と、メモリ62と、サマー64とを含む。具体的には、ビデオエンコーダ50と同様に、ビデオデコーダ60は、予測ユニット54およびフィルタユニット57を含む。ビデオデコーダ60の予測ユニット54は、動き補償要素と、場合によっては、動き補償処理におけるサブピクセル補間のための1または複数の補間フィルタとを含みうる。フィルタユニット57は、サマー64の出力をフィルタし、ループフィルタリングにおいて適用されるフィルタ係数を定義するために、エントロピーデコードされたフィルタ情報を受信しうる。
[0070]スキャン順序シグナリングは、例えば、H.264におけるマクロブロックに対して、または、HEVCにおけるCUに対して、ブロック毎ベースで行われうる。新興のHEVC規格と一致して、ビデオデータのスライスは、ビデオフレームのいくつかまたはすべてを定義するLCUのセットに対応しうる。LCUは、HEVCフレームワーク内のコーディングユニットを指しうる。これは、それら自体が、四分木分割にしたがって、より小さいCUにサブ分割されうる。四分木分割を用いて、方形のLCUは、4つの方形のコーディングユニットに分割され、コーディングユニットはさらに、四分木分割にしたがって、より小さいコーディングユニットにサブ分割されうる。フラグは、さらなる四分木分割が使用されたかどうかを示すために各CUに関連付けられうる。LCUは、4つのCUにサブ分割され、この4つのCUは各々、より小さいCUにさらに分割されうる。HEVC規格は、最大で3つの、場合によってはそれより多くのレベルのオリジナルLCUの四分木分割をサポートしうる。LCUをさまざまなCUに分割した後、異なるCUが、PUにさらに分割されうる。これらは、CUを予測するために使用される予測サイズである。PUは、方形またはその他の矩形であると仮定される。
[0071]図4および図5は、スライス内のビデオブロック(例えば、LCU)がどのようにサブブロック(例えば、より小さいCU)に分割されうるかの1つの実例を示す。図4に示されるように、「オン」によって示された四分木サブブロックはループフィルタによってフィルタされるが、「オフ」によって示された四分木サブブロックはフィルタされない可能性がある。所与のブロックまたはサブブロックをフィルタするか否かの判断は、コーディングされるオリジナルブロックに関連してフィルタされた結果とフィルタされていない結果とを比較することによって、エンコーダにおいて判定されうる。図5は、図4において示された四分木分割においてもたらされる分割決定を表す決定木である。図4および図5は、個別にまたは集合的に、エンコーダにおいて生成され、エンコードされたビデオデータのスライス毎に少なくとも一度デコーダに通信されうるフィルタマップと見なされうる。所与のCUのために定義された任意の変換ユニットのために使用されるスキャン順序は、ビデオエンコーダにおいて決定され、ブロックレベルシンタックスの一部としてビデオデコーダに通信されうる。
[0072]新興のHEVC規格では、(離散コサイン変換、整数変換、カルーネン・レーベ(Karhunen-Loeve)変換、またはそれらと同様のもののような)変換が、データの残差ブロックの係数を周波数ドメインに分解するために使用されうる。その後、変換ブロックにおける有意(すなわち、ゼロではない)係数の分布を示す「有意マップ」がエンコードされうる。有意係数に関連付けられたレベル(すなわち、実際値)もまたエンコードされうる。(図2のスキャンユニット45のような)スキャンユニットが、これらのエンコーディングステップを実行するために使用されうる。
[0073]有意マップを効率的にエンコードするために、ゼロではない係数の大部分が変換ブロックの低周波数エリア(左上角)に位置している可能性が高いという一般仮定の下にジグザグスキャニング順序が使用されうる。しかしながら、変換係数コーディングの効率をさらに改良するために、(水平および垂直スキャニングのような)追加のスキャニング順序が、これがコーディング効率を改良させるインスタンスにおいて使用されうる。水平スキャニングは、例えば、ラスタースキャン順序の後に生じうる。より複雑かつ適応的なスキャニング順序もまた、本開示の技術と一致して定義され、使用されうる。
[0074]本開示において、スキャンユニット45は、変換係数の所与のブロックを変換する際に使用されたイントラ予測モードのタイプと、変換ブロックサイズとに基づいて、複数の異なるイントラ予測モードのために異なるスキャニング順序を実施する。1つの実例において、水平、垂直、およびラスタースキャニング順序の中から選択がなされうる。例えば、レート歪みという意味で、望ましいスキャニング順序は、ジグザグ、水平、および垂直順序(または、必要に応じて、その他のスキャン順序)の中からサーチすることによって、ビデオエンコーダ50によって(例えば、スキャンユニット45によって)決定されうる。選択されたスキャニング順序は、ビットストリーム内で(例えば、ブロックレベルシンタックスとして)デコーダに送信されうる。
[0075]HEVC規格と一致して、変換ユニット38は、別々にサイズ指定された変換を支援しうる。例えば、128×128変換、64×64変換、32×32変換、16×16変換、8×8変換、4×4変換、および2×2変換がすべてサポートされうる。本開示は、1つの例において、イントラブロックに対して特に望ましい可能性があるモード依存型固定変換係数コーディング技術について説明している。モード依存型固定変換係数コーディング技術は、スキャン順序をイントラ予測モードと関連付けうる。これは、イントラ予測モードのためのスキャン順序が、所与の変換サイズに関して固定されうることを意味する。スキャンユニット45は、可能性のあるスキャン順序が少数しか存在しないかのように、複雑性を低減するためにいくつかのスキャン順序のうちからの徹底的なサーチを回避でき、同時に、スキャンユニット45は、複数のスキャン順序に関連付けられた利益のいくつかを活用しうる。エンコーディングおよびデコーディングのためのスキャン順序を固定することは、容易かつ並列な実施のために特に望ましいことがある。
[0076]1つの例において、本開示の技術は、イントラブロックコーディングに重点を置きうる。H.264/AVCと、新興のHEVC規格のテストモデルとにおいて、方向性外挿方法が、イントラブロックを予測するために使用されうる。方向性予測に起因して(すなわち、同じビデオスライス内のイントラデータに基づいて)、(ピクセルドメインにおける)残差ブロックは通常、方向特性を示す。これは、その後、(変換ドメインにおける)変換された係数ブロックに引き継がれる。この理由のために、変換係数のための(または、単に有意マップの有意係数のための)モード依存型スキャニングスキームが、コーディング効率を改良させるために極めて有用でありうる。
[0077]下記の実例は、3つのスキャニング順序について説明しているが、追加のスキャニング順序も定義および使用されうる。3つの典型的なスキャニング順序が、ジグザグスキャン(図6A)、水平スキャン(図6B)、および垂直スキャン(図6C)を含みうる。ジグザグスキャニングと垂直または水平スキャングとの組み合わせのようなバリエーションも、より複雑(かつ場合によっては適応的な)スキャン順序と同様に使用されうる。
[0078]HEVCのテストモデルと一致する典型的なイントラ予測方向およびモードインデックスが図7に示される。ブロックは、2×2から128×128のサイズを有しうる。下記の式(1)におけるマッピング関数F(*)は、サイズ(blkSize)を伴うブロックのイントラ予測モード(preMode)を、ジグザグ、水平、および垂直スキャニングパターン(またはその他のスキャン順序)のうちのスキャン順序(scanIdx)にマッピングするために構築されうる。この技術は、図9において提供されるテーブル1に説明されるような3つのスキャニング順序のためにscanIdx値を定義しうる。
scanIdx=F(preMode,blkSize) 式(1)
[0079]マッピング関数は数学モデルまたはマッピングテーブルを備えうる。これは、エンコーダ50およびデコーダ60の両方に記憶されうる。1つの実例において、マッピング関数は、図10のテーブル2に説明されるマッピングテーブルとして実現されうる。このケースにおいて、1乃至33からのイントラモードインデックス(すなわち、preMode)および変換のサイズ(すなわち、blkSize)は、図9において提供されるテーブル1のスキャン順序値にマッピングするテーブルにインデックスされうる。図9において提供されるテーブル1は、エンコーダおよびデコーダに記憶された固定テーブルであり、テーブルのモードインデックスは、さまざまな異なるビデオシーケンスの経験的テストに基づいて選択されうる。
[0080]図10のテーブル2は、「ルーマブロック」に関して適用されたテーブルを備えうる。クロマブロックでは、類似のルックアップテーブルアプローチが、下記のテーブルを用いてスキャン方向を決定するために使用されうる。新興のHEVC規格と一致する1つの実例において、クロマブロックが4つのイントラモードを支援するのみであるように、クロマルックアップテーブルは、多くのより少ない(many fewer)モードを有しうる。図11のテーブル3は、図10のルーマルックアップテーブル(テーブル2)に関連して、対応するクロマルックアップテーブルを備えうる。
[0081]さらなる実例において、モード依存型交換可能変換係数コーディング技術は、スキャンユニット45およびスキャンユニット55によって使用されうる。このケースにおいて、トップスキャニング順序候補は、各予測モード、各変換サイズ、または予測モードおよび変換サイズの複数の異なる組み合わせに関して定義されうる。このケースにおいて、ブロックのための最善のスキャニング順序は、所与の予測モードのためのセットにおけるトップ候補の中からスキャンユニット45によって決定されるが、候補の数は、可能性のあるスキャニング順序の総数よりも少なくなりうる。この技術は、いくらかの複雑性をエンコーダ50(およびデコーダ60)に追加しうるが、同時に、固定数の候補スキャン順序に対する複雑性を制限しうる。さらに、候補は、イントラ予測モード、変換ブロックサイズ、またはイントラ予測モードおよび変換ブロックサイズの両方に依存して異なることがある。
[0082]図12におけるテーブル4は、可能性のあるスキャン順序のインデックス値に対する典型的なマッピングを例示する。スキャンユニット45、55は、式(2)にしたがって各スキャニング順序「Fs(*)」のためのスコア関数を識別し、このスコア関数は、サイズblkSizeおよび予測モードpreModeを伴うブロックの候補となるように、スキャニング順序がどれだけ選択される可能性が高いかを計算しうる。
s(scanIdx)=Fs(predMode,blkSize,scanIdx) 式(2)
式(2)によって計算されるにスコア値sに基づいて、スキャンユニット45、55は、所与の変換ブロックサイズblkSizeに関連付けられた各予測モードpreModeのためのトップ3の候補を定義しうる。図13のテーブル5は、1つの所与のブロックサイズのための上記の手順によって生成される候補テーブルの1つの実例を提供する。この技術にしたがって、スキャンユニット45は、交換可能なスキームにおいて3つの状態(候補0、候補1、候補2)のうちの1つをシグナリングするが、モードに依存して、候補は異なるスキャン順序に対してマッピングしうる。スキャンユニット55は、3つの状態が正しい候補に適切にマッピングされるように、同じ候補テーブルを適用しうる。
[0083]したがって、候補テーブルが生成されると、交換可能なスキームが、特定の予測モードおよび特定のブロックサイズを有するブロックのための候補の中からレート歪みコストという意味で最善のスキャン順序をサーチするために使用されうる。最善のスキャニング順序は、ビデオブロックシンタックスとして、ビットストリームにおいてシグナリングされうる。候補セットは通常、許可されたすべてのスキャニング順序のセットよりも小さいので、可能性のあるすべての候補スキャン順序に関連する選択をシグナリングするスキームと比較して、シグナリング情報の量は著しく低減されうる。
[0084]図14は、本開示と一致する技術を例示するフロー図である。図14は、図2のビデオエンコーダ50の観点から説明されるが、その他のデバイスが同様の技術を実行しうる。具体的には、図14はビデオデータのイントラコーディングされたブロックに関連付けられた係数(例えば、有意係数)をエンコードする1つの方法を示す。スキャンユニット45は、イントラコーディングモードを決定し(1401)、エンコーディング処理において使用された変換ブロックサイズを決定する(1402)。具体的には、変換ユニット38および予測ユニット32は、これらの決定を容易にするために、シンタックス情報をスキャンユニット45に通信しうる。変換ユニット38は変換サイズをスキャンユニット45に通信し、予測ユニットはイントラコーディングモードをスキャンユニット45に通信しうる。スキャンユニット45はその後、イントラコーディングモードと、変換ブロックサイズとに基づいてスキャン順序を選択し(1403)、選択されたスキャン順序を通信するためにシンタックス要素を生成しうる(1404)。エントロピーコーディングユニット46によるエントロピーコーディングに続いて、ビデオエンコーダ50は、エンコードされたビデオデータを伴うシンタックス要素を出力しうる(1405)。この方式において、スキャン順序は、エンコードされたビデオストリームの一部としてエンコードされ、別のデバイスへの通信のために出力されうる。そうすることで、その別のデバイスは、デコーディング処理中に、どのようにリシプロカル(逆)スキャンを実行するのかを決定することができる。
[0085]図15は、本開示と一致する交換シグナリング技術を例示するフロー図である。図15は、図2のビデオエンコーダ50の観点から説明されるが、その他のデバイスが同様の技術を実行しうる。図15を示すように、スキャンユニット45は、トップスキャン順序候補のセットを定義し(1501)、ビデオデータのブロックをエンコードするために使用されたイントラコーディングモード、変換ブロックサイズ、またはイントラコーディングモードおよび変換ブロックサイズに基づいて、トップスキャン順序候補のセットからスキャン順序を選択する(1502)。トップスキャン順序候補のセットは、イントラコーディングモード、変換ブロックサイズ、またはイントラコーディングモードおよび変換ブロックサイズの組み合わせのために、スキャンユニット45にプログラムされうる。トップスキャン順序候補のセットを定義することによって、可能性の数が、計算を制限し、シグナリングオーバヘッドの量を制限するように制限されうる。スキャンユニット45は、選択されたスキャン順序を通信するためにシンタックス要素を生成し(1503)、エントロピーコーディングユニット46によるエントロピーコーディングに続いて、ビデオエンコーダ50は、エンコードされたビデオデータと共にシンタックス要素を出力しうる(1504)。
[0086]図15の技術を支援するために、ビデオエンコーダ50およびビデオデコーダ60の両方が、異なるシナリオにおいて同じトップスキャン順序候補のセットを定義するように構成されうる。スキャン順序を定義するシンタックス要素は、トップスキャン順序候補のセットに依存し、これを、ビデオエンコーダ50およびビデオデコーダ60が各々、同様の方法で定義しうる。
[0087]図16は、本開示と一致して、ビデオデコーダ60の観点から交換シグナリング技術を例示するフロー図である。図16は図3のビデオデコーダ60の観点から説明されるが、その他のデバイスが同様の技術を実行しうる。図16に示されるように、エントロピーデコーディングユニット52は、ビデオデータのブロック(例えば、有意係数のブロック)のためのシンタックス要素を受信する。逆スキャンユニット55は、ビデオデータをコーディングする際に使用されたイントラコーディングモードと、使用された変換ブロックサイズとのうちの一方または両方に基づいて、トップスキャン順序候補のセットを定義する(1602)。これは、逆スキャンユニット55が、受信されたシンタックス要素を適切に解釈することを可能にし、シンタックス要素は、トップスキャン順序候補のセットに関連するインデックス値を備えうる。したがって、逆スキャンユニット55は、トップスキャン順序候補のセットに関するシンタックス要素に基づいて逆スキャンを実行する(1603)。
[0088]本開示の技術は、無線ハンドセット、集積回路(IC)、またはICのセット(すなわち、チップセット)を含む多種多様なデバイスまたは装置において実現されうる。機能的態様を強調するために提供される任意の構成要素、モジュール、またはユニットが説明され、異なるハードウェアユニットによる実現を必ずしも必要とするわけではない。
[0089]したがって、本明細書において説明された技術は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせにおいて実現されうる。モジュールまたは構成要素として説明される任意の機能が、集積ロジックデバイスにおいて一緒に、または、離散的だが相互運用可能なロジックデバイスとして別々に、実現されうる。ソフトウェアにおいて実現される場合、技術は、実行されると、上述された方法のうちの1または複数を実行する命令群を備えるコンピュータ読取可能な媒体によって少なくとも部分的に実現されうる。コンピュータ読取可能なデータ記憶媒体は、コンピュータプログラム製品の一部を形成しうる。これは、パッケージングマテリアルを含みうる。
[0090]コンピュータ読取可能な媒体は、同期型ダイナミックランダムアクセスメモリ(SDRAM)のようなランダムアクセスメモリ、読取専用メモリ(ROM)、非揮発性ランダムアクセスメモリ(NVRAM)、電子的消去可能プログラマブル読取専用メモリ(EEPROM)、フラッシュメモリ、磁気的または光学的データ記憶媒体、およびそれらと同様のもののような、有形的なコンピュータ読取可能な記憶媒体を備えうる。この技術は、追加的または代替的に、少なくとも部分的に、命令群またはデータ構造の形態でコードを搬送または通信し、コンピュータによってアクセス、読み取り、および/または実行されることができるコンピュータ読取可能な通信媒体によって実現されうる。
[0091]命令群は、1または複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特殊用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、またはその他同等の集積または離散ロジック回路のような、1または複数のプロセッサによって実行されうる。本明細書において使用される場合に、用語「プロセッサ」は、上述の構造の任意のものか、本明細書において説明される技術の実施に適したその他任意の構造を指しうる。それに加えて、いくつかの態様において、本明細書において説明された機能は、エンコーディングおよびデコーディングのために構成された専用ソフトウェアモジュールまたはハードウェアモジュール内で提供されうるか、結合されたビデオエンコーダデコーダ(CODEC)に組み込まれうる。さらに、この技術は、1または複数の回路またはロジック要素において完全に実施されうる。
[0092]本開示のさまざまな態様が説明されている。これらとその他の態様とが、以下の特許請求の範囲に含まれる。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1] ビデオデータのブロックに関連付けられた係数をエンコードする方法であって、
前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記係数に対するスキャン順序を選択することと、
前記ビデオデータのブロックのための前記選択されたスキャン順序を通信するためにシンタックス要素を生成することと、
を備える方法。
[2] 前記係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える[1]に記載の方法。
[3] 前記有意係数は、非ゼロ値係数を識別する1ビットフラグを備える[2]に記載の方法。
[4] 前記スキャン順序をルーマブロックのための第1のルックアップテーブルから選択することと、
前記スキャン順序をクロマブロックのための第2のルックアップテーブルから選択することと、
をさらに備える[1]に記載の方法。
[5] 可能性のあるスキャン順序候補のセットに基づいて、複数の可能性のあるイントラコーディングモードの各々のためのトップスキャン順序候補のセットを定義することと、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択することと、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成することと、
をさらに備える[1]に記載の方法。
[6] 可能性のあるスキャン順序候補のセットに基づいて、複数の可能性のある変換ブロックサイズの各々のためのトップスキャン順序候補のセットを定義することと、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択することと、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成することと、
をさらに備える[1]に記載の方法。
[7] 可能性のあるイントラコーディングモードと可能性のある変換ブロックサイズとの組み合わせのために定義された可能性のあるスキャン順序候補のセットに基づいて、前記可能性のあるイントラコーディングモードと可能性のある変換ブロックサイズとの組み合わせのためのトップスキャン順序候補のセットを定義することと、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択することと、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成することと、
をさらに備える[1]に記載の方法。
[8] 前記ビデオデータのブロックは、最大コーディングユニット(LCU)内にコーディングユニット(CU)を備え、前記LCUは、四分木分割スキームにしたがってCUのセットに分割される[1]に記載の方法。
[9] ビデオデータのブロックに関連付けられた係数をデコードする方法であって、
前記ビデオデータのブロックを伴うシンタックス要素を受信することと、前記シンタックス要素は、トップスキャン順序候補のセットからスキャン順序を定義し、
前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいて前記トップスキャン順序候補のセットを定義することと、
前記定義されたトップスキャン順序候補のセットに関連する前記シンタックス要素に基づいて、前記ビデオデータのブロックを、前記ビデオデータのブロックのシリアル化された表現から、前記ビデオデータのブロックの2次元表現に逆スキャニングすることと、
を備える方法。
[10] 前記係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える[9]に記載の方法。
[11] ビデオデータのブロックに関連付けられた係数をエンコードするビデオエンコーディングデバイスであって、
イントラコーディングモードに基づいて、前記ビデオデータのブロックのイントラ予測コーディングを実行する予測ユニットと、
変換サイズを決定し、前記変換サイズにしたがって、前記ビデオデータのブロックに変換を実行する変換ユニットと、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された前記変換ブロックサイズとに基づいて、前記係数に対するスキャン順序を選択し、前記ビデオデータのブロックのための前記選択されたスキャン順序を通信するためにシンタックス要素を生成するスキャンユニットと、
を備えるビデオエンコーディングデバイス。
[12] 前記係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える[11]に記載のビデオエンコーディングデバイス。
[13] 前記有意係数は、非ゼロ値係数を識別する1ビットフラグを備える[12]に記載のビデオエンコーディングデバイス。
[14] 前記スキャンユニットは、
ルーマブロックのための第1のルックアップテーブルから前記スキャン順序を選択し、
クロマブロックのための第2のルックアップテーブルから前記スキャン順序を選択する、
[11]に記載のビデオエンコーディングデバイス。
[15] 前記スキャンユニットは、
可能性のあるスキャン順序候補のセットに基づいて、複数の可能性のあるイントラコーディングモードの各々のためのトップスキャン順序候補のセットを定義し、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択し、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成する、
[11]に記載のビデオエンコーディングデバイス。
[16] さらに、前記スキャンユニットは、
可能性のあるスキャン順序候補のセットに基づいて、複数の可能性のある変換ブロックサイズの各々のためのトップスキャン順序候補のセットを定義し、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択し、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成する
[11]に記載のビデオエンコーディングデバイス。
[17] さらに、前記スキャンユニットは、
可能性のあるイントラコーディングモードと可能性のある変換ブロックサイズとの組み合わせのために定義された可能性のあるスキャン順序候補のセットに基づいて、前記可能性のあるイントラコーディングモードと可能性のある変換ブロックサイズの組み合わせのためのトップスキャン順序候補のセットを定義し、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択し、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成する
[11]に記載のビデオエンコーディングデバイス。
[18] 記ビデオデータのブロックは、最大コーディングユニット(LCU)内にコーディングユニット(CU)を備え、前記LCUは、四分木分割スキームにしたがってCUのセットに分割される[11]に記載のビデオエンコーディングデバイス。
[19] 前記ビデオエンコーディングデバイスは、
集積回路と、
マイクロプロセッサと、
ビデオエンコーダを含む無線通信デバイスと、
のうちの1または複数を備える[11]に記載のビデオエンコーディングデバイス。
[20] ビデオデータのブロックに関連付けられた係数をデコードするビデオデコーディングデバイスであって、
前記ビデオデータのブロックを伴うシンタックス要素を受信するユニットと、前記シンタックス要素は、トップスキャン順序候補のセットからスキャン順序を定義し、
前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいて前記トップスキャン順序候補のセットを定義するスキャンユニットと、
を備え、
前記スキャンユニットは、前記定義されたトップスキャン順序候補のセットに関連する前記シンタックス要素に基づいて、前記ビデオデータのブロックを、前記ビデオデータのブロックのシリアル化された表現から、前記ビデオデータのブロックの2次元表現に逆スキャニングすることを実行するビデオデコーディングデバイス。
[21] 前記係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える[20]に記載のビデオデコーディングデバイス。
[22] 前記イントラコーディングモードに基づいて、前記ビデオデータのブロックのイントラ予測デコーディングを実行する予測ユニットと、
前記変換ブロックサイズに基づいて、前記ビデオデータのブロックに関して、逆変換を実行する逆変換ユニットと、
をさらに備える[20]に記載のビデオデコーディングデバイス。
[23] 集積回路と、
マイクロプロセッサと、
ビデオエンコーダを含む無線通信デバイスと、
集積回路と、
マイクロプロセッサと、
ビデオエンコーダを含む無線通信デバイスと、
ビデオデコーダを含む無線通信デバイスと、
のうちの1または複数を備える[20]に記載のビデオデコーディングデバイス。
[24] ビデオデータのブロックに関連付けられた係数をエンコードするデバイスであって、
前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記係数に対するスキャン順序を選択する手段と、
前記ビデオデータのブロックのための前記選択されたスキャン順序を通信するためにシンタックス要素を生成する手段と、
を備えるデバイス。
[25] 前記係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える[24]に記載のデバイス。
[26] 前記有意係数は、非ゼロ値係数を識別する1ビットフラグを備える[25]に記載のデバイス。
[27] ルーマブロックのための第1のルックアップテーブルから前記スキャン順序を選択する手段と、
クロマブロックのための第2のルックアップテーブルから前記スキャン順序を選択する手段と、
をさらに備える[24]に記載のデバイス。
[28] 可能性のあるスキャン順序候補のセットに基づいて、複数の可能性のあるイントラコーディングモードの各々のためのトップスキャン順序候補のセットを定義する手段と、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択する手段と、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成する手段と、
をさらに備える[24]に記載のデバイス。
[29] 可能性のあるスキャン順序候補のセットに基づいて、複数の可能性のある変換ブロックサイズの各々のためのトップスキャン順序候補のセットを定義する手段と、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択する手段と、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成する手段と、
をさらに備える[24]に記載のデバイス。
[30] 可能性のあるイントラコーディングモードと可能性のある変換ブロックサイズとの組み合わせのために定義された可能性のあるスキャン順序候補のセットに基づいて、前記可能性のあるイントラコーディングモードと可能性のある変換ブロックサイズの組み合わせのためのトップスキャン順序候補のセットを定義する手段と、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択する手段と、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成する手段と、
をさらに備える[24]に記載のデバイス。
[31] 前記ビデオデータのブロックは、最大コーディングユニット(LCU)内にコーディングユニット(CU)を備え、前記LCUは、四分木分割スキームにしたがってCUのセットに分割される[24]に記載のデバイス。
[32] ビデオデータのブロックに関連付けられた係数をデコードするデバイスであって、
前記ビデオデータのブロックを伴うシンタックス要素を受信する手段と、前記シンタックス要素は、トップスキャン順序候補のセットからスキャン順序を定義し、
前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいて前記トップスキャン順序候補のセットを定義する手段と、
前記定義されたトップスキャン順序候補のセットに関連する前記シンタックス要素に基づいて、前記ビデオデータのブロックを、前記ビデオデータのブロックのシリアル化された表現から、前記ビデオデータのブロックの2次元表現に逆スキャニングする手段と、
を備えるデバイス。
[33] 前記係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える[32]に記載のデバイス。
[34] 実行されると、プロセッサに、ビデオデータのブロックに関連付けられた係数をエンコードさせる命令群を備えるコンピュータ読取可能な媒体であって、前記命令群は、前記プロセッサに、
前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記係数に対するスキャン順序を選択させ、
前記ビデオデータのブロックのための前記選択されたスキャン順序を通信するためにシンタックス要素を生成させる
コンピュータ読取可能な媒体。
[35] 前記係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える[34]に記載のコンピュータ読取可能な媒体。
[36] 前記有意係数は、非ゼロ値係数を識別する[35]に記載のコンピュータ読取可能な媒体。
[37] 前記プロセッサに、
ルーマブロックのための第1のルックアップテーブルから前記スキャン順序を選択させ、
クロマブロックのための第2のルックアップテーブルから前記スキャン順序を選択させる
命令群をさらに備える[34]に記載のコンピュータ読取可能な媒体。
[38] 前記プロセッサに、
可能性のあるスキャン順序候補のセットに基づいて、複数の可能性のあるイントラコーディングモードの各々のためのトップスキャン順序候補のセットを定義させ、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択させ、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成させる
命令群をさらに備える[34]に記載のコンピュータ読取可能な媒体。
[39] 前記プロセッサに、
可能性のあるスキャン順序候補のセットに基づいて、複数の可能性のある変換ブロックサイズの各々のためのトップスキャン順序候補のセットを定義させ、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択させ、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成させる
命令群をさらに備える[34]に記載のコンピュータ読取可能な媒体。
[40] 前記プロセッサに、
可能性のあるイントラコーディングモードと可能性のある変換ブロックサイズとの組み合わせのために定義された可能性のあるスキャン順序候補のセットに基づいて、前記可能性のあるイントラコーディングモードと可能性のある変換ブロックサイズの組み合わせのためのトップスキャン順序候補のセットを定義させ、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードのための前記トップスキャン順序候補のセットから前記スキャン順序を選択させ、
前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードに関連付けられた前記トップ候補のセットから前記選択されたスキャン順序を識別するために前記シンタックス要素を生成させる
命令群をさらに備える[34]に記載のコンピュータ読取可能な媒体。
[41] 前記ビデオデータのブロックが、最大コーディングユニット(LCU)内にコーディングユニット(CU)を備え、前記LCUは、四分木分割スキームにしたがってCUのセットに分割される[34]に記載のコンピュータ読取可能な媒体。
[42] 実行されると、プロセッサに、ビデオデータのブロックに関連付けられた係数をデコードさせる命令群を備えるコンピュータ読取可能な媒体であって、前記命令群は、前記プロセッサに、
ビデオデータのブロックを伴うシンタックス要素を受信させ、前記シンタックス要素は、トップスキャン順序候補のセットからスキャン順序を定義し、
前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとのうちの一方または両方に基づいて前記トップスキャン順序候補のセットを定義させ、
前記定義されたトップスキャン順序候補のセットに関連する前記シンタックス要素に基づいて、前記ビデオデータのブロックを、前記ビデオデータのブロックのシリアル化された表現から、前記ビデオデータのブロックの2次元表現に逆スキャニングさせる
コンピュータ読取可能な媒体。
[43] 前記係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える[42]に記載のコンピュータ読取可能な媒体。

Claims (31)

  1. ビデオデータのブロックの残差データに関連付けられた係数をエンコードする方法であって、
    前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記ビデオデータのブロックの前記残差データに関連付けられた前記係数に対するスキャン順序を決定することを含み、前記決定することは、
    各変換ブロックサイズに対し、複数のイントラコーディングモードのそれぞれについて、少なくとも4つのスキャン順序の中から3つのスキャン順序候補を決定することと、所与の変換ブロックサイズに関連付けられた各イントラコーディングモードのための前記3つのスキャン順序候補は、前記所与の変換ブロックサイズおよび前記イントラコーディングモードに対して選択される可能性が最も高い候補のセットである、
    4×4および8×8変換ブロックサイズでは、前記イントラコーディングモードに基づいて、前記係数に対して、少なくとも水平スキャン順序および垂直スキャン順序を含む3つのスキャン順序のうちの1つから前記スキャン順序を決定することと、
    8×8よりも大きい前記変換ブロックサイズでは、前記イントラコーディングモードのために、前記前記水平スキャン順序および前記垂直スキャン順序以外の前記スキャン順序を決定することと
    を含み、前記方法はさらに、
    前記決定された垂直スキャン順序、水平スキャン順序、または水平スキャン順序および垂直スキャン順序以外のスキャン順序に基づいて、変換係数の二次元表現から、前記ブロックサイズに対応する前記変換係数のシリアル化された表現に、前記変換係数のデータをスキャンすること、を備える方法。
  2. 前記変換係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える請求項1に記載の方法。
  3. 前記有意マップは、有意係数を識別する1ビットフラグを備える請求項2に記載の方法。
  4. 前記スキャン順序をルーマブロックのための第1のルックアップテーブルから決定することと、
    前記スキャン順序をクロマブロックのための第2のルックアップテーブルから決定することとをさらに備える請求項1に記載の方法。
  5. 前記ビデオデータのブロックが、最大コーディングユニット(LCU)内にコーディングユニット(CU)を備え、前記LCUは、四分木分割スキームにしたがってCUのセットに分割される請求項1に記載の方法。
  6. ビデオデータのブロックの残差データに関連付けられた係数をデコードする方法であって、前記方法は、
    前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて、前記ビデオデータのブロックの前記残差データに関連付けられた前記係数に対するスキャン順序を決定することを備え、前記決定することは、
    各変換ブロックサイズに対し、複数のイントラコーディングモードのそれぞれについて、少なくとも4つのスキャン順序の中から3つのスキャン順序候補を決定することと、所与の変換ブロックサイズに関連付けられた各イントラコーディングモードのための前記3つのスキャン順序候補は、前記所与の変換ブロックサイズおよび前記イントラコーディングモードに対して選択される可能性が最も高い候補のセットである、
    4×4および8×8変換ブロックサイズでは、前記イントラコーディングモードに基づいて、前記係数に対して、少なくとも水平スキャン順序および垂直スキャン順序を含む3つのスキャン順序のうちの1つから前記スキャン順序を決定することと、
    8×8よりも大きい前記変換ブロックサイズでは、前記イントラコーディングモードのために、前記水平スキャン順序および前記垂直スキャン順序以外の前記スキャン順序を決定することと、を含み、前記方法はさらに、
    前記決定された垂直スキャン順序、水平スキャン順序、または水平スキャン順序および垂直スキャン順序以外のスキャン順序に基づいて、前記ビデオデータのブロックを、変換係数のシリアル化された表現から、前記ブロックサイズに対応する前記変換係数の2次元表現に逆スキャニングすること、を備える方法。
  7. 前記変換係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える請求項6に記載の方法。
  8. ビデオデータのブロックの残差データに関連付けられた係数をエンコードするビデオエンコーディングデバイスであって、前記ビデオエンコーディングデバイスは、
    イントラコーディングモードに基づいて、前記ビデオデータのブロックのイントラ予測コーディングを実行する予測ユニットと、
    変換サイズを決定し、前記変換サイズにしたがって、前記ビデオデータのブロックの前記残差データに変換を実行する変換ユニットと、
    前記ビデオデータのブロックを予測するために使用された前記イントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて、前記ビデオデータのブロックの前記残差データに関連付けられた前記係数に対するスキャン順序を決定するスキャンユニットとを備え、前記スキャンユニットは、
    各変換ブロックサイズに対し、複数のイントラコーディングモードのそれぞれについて、少なくとも4つのスキャン順序の中から3つのスキャン順序候補を決定することと、所与の変換ブロックサイズに関連付けられた各イントラコーディングモードのための前記3つのスキャン順序候補は、前記所与の変換ブロックサイズおよび前記イントラコーディングモードに対して選択される可能性が最も高い候補のセットである、
    4×4および8×8変換ブロックサイズでは、前記イントラコーディングモードに基づいて、前記係数に対して、少なくとも水平スキャン順序および垂直スキャン順序を含む3つのスキャン順序のうちの1つから前記スキャン順序を決定することと、
    8×8よりも大きい前記変換ブロックサイズでは、前記イントラコーディングモードのために、前記水平スキャン順序および前記垂直スキャン順序以外の前記スキャン順序を決定し、前記決定された垂直スキャン順序、水平スキャン順序、または水平スキャン順序および垂直スキャン順序以外のスキャン順序に基づいて、変換係数の2次元表現から、前記ブロックサイズに対応する前記変換係数のシリアル化された表現に、前記変換係数のデータをスキャンすることと
    を含むビデオエンコーディングデバイス。
  9. 前記変換係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える請求項8に記載のビデオエンコーディングデバイス。
  10. 前記有意マップは、有意係数を識別する1ビットフラグを備える請求項9に記載のビデオエンコーディングデバイス。
  11. 前記スキャンユニットは、
    ルーマブロックのための第1のルックアップテーブルから前記スキャン順序を決定し、
    クロマブロックのための第2のルックアップテーブルから前記スキャン順序を決定する請求項8に記載のビデオエンコーディングデバイス。
  12. 前記ビデオデータのブロックが、最大コーディングユニット(LCU)内にコーディングユニット(CU)を備え、前記LCUは、四分木分割スキームにしたがってCUのセットに分割される請求項8に記載のビデオエンコーディングデバイス。
  13. 前記ビデオエンコーディングデバイスは、
    集積回路と、
    マイクロプロセッサと、
    ビデオエンコーダを含む無線通信デバイスと
    のうちの1または複数を備える請求項8に記載のビデオエンコーディングデバイス。
  14. ビデオデータのブロックの残差データに関連付けられた係数をデコードするビデオデコーディングデバイスであって、前記ビデオデコーディングデバイスは、
    前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記ビデオデータのブロックの前記残差データに関連付けられた前記係数に対するスキャン順序を決定するスキャンユニットを備え、
    前記スキャンユニットは、
    各変換ブロックサイズに対し、複数のイントラコーディングモードのそれぞれについて、少なくとも4つのスキャン順序の中から3つのスキャン順序候補を決定することと、所与の変換ブロックサイズに関連付けられた各イントラコーディングモードのための前記3つのスキャン順序候補は、前記所与の変換ブロックサイズおよび前記イントラコーディングモードに対して選択される可能性が最も高い候補のセットである、
    4×4および8×8変換ブロックサイズでは、前記イントラコーディングモードに基づいて、前記係数に対して、少なくとも水平スキャン順序および垂直スキャン順序を含む3つのスキャン順序のうちの1つから前記スキャン順序を決定することと、
    8×8よりも大きい前記変換ブロックサイズでは、前記イントラコーディングモードのために、前記水平スキャン順序および前記垂直スキャン順序以外の前記スキャン順序を決定することとを含み、
    前記スキャンユニットは、前記決定された垂直スキャン順序、水平スキャン順序、または水平スキャン順序および垂直スキャン順序以外のスキャン順序に基づいて、変換係数のシリアル化された表現から、前記ブロックサイズに対応する前記変換係数の2次元表現に逆スキャニングすることを実行するビデオデコーディングデバイス。
  15. 前記変換係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える請求項14に記載のビデオデコーディングデバイス。
  16. 前記イントラコーディングモードに基づいて、前記ビデオデータのブロックのイントラ予測デコーディングを実行する予測ユニットと、
    前記変換ブロックサイズに基づいて、前記ビデオデータのブロックの前記残差データに関して、逆変換を実行する逆変換ユニットとをさらに備える請求項14に記載のビデオデコーディングデバイス。
  17. 集積回路と、
    マイクロプロセッサと、
    ビデオデコーダを含む無線通信デバイスとのうちの1または複数を備える請求項14に記載のビデオデコーディングデバイス。
  18. ビデオデータのブロックの残差データに関連付けられた係数をエンコードするデバイスであって、
    前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記ビデオデータのブロックの前記残差データに関連付けられた前記係数に対するスキャン順序を決定する手段を備え、前記決定する手段は、
    各変換ブロックサイズに対し、複数のイントラコーディングモードのそれぞれについて、少なくとも4つのスキャン順序の中から3つのスキャン順序候補を決定することと、所与の変換ブロックサイズに関連付けられた各イントラコーディングモードのための前記3つのスキャン順序候補は、前記所与の変換ブロックサイズおよび前記イントラコーディングモードに対して選択される可能性が最も高い候補のセットである、
    4×4および8×8変換ブロックサイズでは、前記イントラコーディングモードに基づいて、前記係数に対して、少なくとも水平スキャン順序および垂直スキャン順序を含む3つのスキャン順序のうちの1つから前記スキャン順序を決定することと、
    8×8よりも大きい前記変換ブロックサイズでは、前記イントラコーディングモードのために、前記水平スキャン順序および前記垂直スキャン順序以外の前記スキャン順序を決定することと
    を含み、前記デバイスはさらに、
    前記決定された垂直スキャン順序、水平スキャン順序、または水平スキャン順序および垂直スキャン順序以外のスキャン順序に基づいて、変換係数の二次元表現から、前記ブロックサイズに対応する前記変換係数のシリアル化された表現に、前記変換係数のデータをスキャンする手段を備えるデバイス。
  19. 前記変換係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える請求項18に記載のデバイス。
  20. 前記有意マップは、有意係数を識別する1ビットフラグを備える請求項19に記載のデバイス。
  21. ルーマブロックのための第1のルックアップテーブルから前記スキャン順序を決定する手段と、
    クロマブロックのための第2のルックアップテーブルから前記スキャン順序を決定する手段とをさらに備える請求項18に記載のデバイス。
  22. 前記ビデオデータのブロックが、最大コーディングユニット(LCU)内にコーディングユニット(CU)を備え、前記LCUは、四分木分割スキームにしたがってCUのセットに分割される請求項18に記載のデバイス。
  23. ビデオデータのブロックの残差データに関連付けられた係数をデコードするデバイスであって、
    前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記ビデオデータのブロックの前記残差データに関連付けられた前記係数に対するスキャン順序を決定する手段を備え、前記決定する手段は、
    各変換ブロックサイズに対し、複数のイントラコーディングモードのそれぞれについて、少なくとも4つのスキャン順序の中から3つのスキャン順序候補を決定することと、所与の変換ブロックサイズに関連付けられた各イントラコーディングモードのための前記3つのスキャン順序候補は、前記所与の変換ブロックサイズおよび前記イントラコーディングモードに対して選択される可能性が最も高い候補のセットである、
    4×4および8×8変換ブロックサイズでは、前記イントラコーディングモードに基づいて、前記係数に対して、少なくとも水平スキャン順序および垂直スキャン順序を含む3つのスキャン順序のうちの1つから前記スキャン順序を決定することと、
    8×8よりも大きい前記変換ブロックサイズでは、前記イントラコーディングモードのために、前記水平スキャン順序および前記垂直スキャン順序以外の前記スキャン順序を決定することと
    を含み、前記デバイスはさらに、
    前記決定された垂直スキャン順序、水平スキャン順序、または水平スキャン順序および垂直スキャン順序以外のスキャン順序に基づいて、前記ビデオデータのブロックを、変換係数のシリアル化された表現から、前記ブロックサイズに対応する前記変換係数の2次元表現に逆スキャニングする手段を備えるデバイス。
  24. 前記変換係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える請求項23に記載のデバイス。
  25. 実行されると、プロセッサに、ビデオデータのブロックの残差データに関連付けられた係数をエンコードさせる命令群を備えるコンピュータ読取可能な媒体であって、前記命令群は、前記プロセッサに、
    前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記ビデオデータのブロックの前記残差データに関連付けられた前記係数に対するスキャン順序を決定することを実行させ、前記決定することは、
    各変換ブロックサイズに対し、複数のイントラコーディングモードのそれぞれについて、少なくとも4つのスキャン順序の中から3つのスキャン順序候補を決定することと、所与の変換ブロックサイズに関連付けられた各イントラコーディングモードのための前記3つのスキャン順序候補は、前記所与の変換ブロックサイズおよび前記イントラコーディングモードに対して選択される可能性が最も高い候補のセットである、
    4×4および8×8変換ブロックサイズでは、前記イントラコーディングモードに基づいて、前記係数に対して、少なくとも水平スキャン順序および垂直スキャン順序を含む3つのスキャン順序のうちの1つから前記スキャン順序を決定することと、
    8×8よりも大きい前記変換ブロックサイズでは、前記イントラコーディングモードのために、前記水平スキャン順序および前記垂直スキャン順序以外の前記スキャン順序を決定することと
    を含み、前記命令群はさらに、前記プロセッサに、
    前記決定された垂直スキャン順序、水平スキャン順序、または水平スキャン順序および垂直スキャン順序以外のスキャン順序に基づいて、変換係数の二次元表現から、前記ブロックサイズに対応する前記変換係数のシリアル化された表現に、前記変換係数のデータをスキャンさせるコンピュータ読取可能な媒体。
  26. 前記変換係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える請求項25に記載のコンピュータ読取可能な媒体。
  27. 前記有意マップは、有意係数を識別する1ビットフラグを備える請求項26に記載のコンピュータ読取可能な媒体。
  28. 前記プロセッサに、
    ルーマブロックのための第1のルックアップテーブルから前記スキャン順序を決定させ、
    クロマブロックのための第2のルックアップテーブルから前記スキャン順序を決定させる命令群をさらに備える請求項25に記載のコンピュータ読取可能な媒体。
  29. 前記ビデオデータのブロックが、最大コーディングユニット(LCU)内にコーディングユニット(CU)を備え、前記LCUは、四分木分割スキームにしたがってCUのセットに分割される請求項25に記載のコンピュータ読取可能な媒体。
  30. 実行されると、プロセッサに、ビデオデータのブロックの残差データに関連付けられた係数をデコードさせる命令群を備えるコンピュータ読取可能な媒体であって、前記命令群は、前記プロセッサに、
    前記ビデオデータのブロックを予測するために使用されたイントラコーディングモードと、前記ビデオデータのブロックを変換する際に使用された変換ブロックサイズとに基づいて前記ビデオデータのブロックの前記残差データに関連付けられた前記係数に対するスキャン順序を決定することを実行させ、前記決定することは、
    各変換ブロックサイズに対し、複数のイントラコーディングモードのそれぞれについて、少なくとも4つのスキャン順序の中から3つのスキャン順序候補を決定することと、所与の変換ブロックサイズに関連付けられた各イントラコーディングモードのための前記3つのスキャン順序候補は、前記所与の変換ブロックサイズおよび前記イントラコーディングモードに対して選択される可能性が最も高い候補のセットである、
    4×4および8×8変換ブロックサイズでは、前記イントラコーディングモードに基づいて、前記係数に対して、少なくとも水平スキャン順序および垂直スキャン順序を含む3つのスキャン順序のうちの1つから前記スキャン順序を決定することと、
    8×8よりも大きい前記変換ブロックサイズでは、前記イントラコーディングモードのために、前記水平スキャン順序および前記垂直スキャン順序以外の前記スキャン順序を決定することと
    を含み、前記命令群はさらに、前記プロセッサに、
    前記決定された垂直スキャン順序、水平スキャン順序、または水平スキャン順序および垂直スキャン順序以外のスキャン順序に基づいて、前記ビデオデータのブロックを、変換係数のシリアル化された表現から、前記ブロックサイズに対応する前記変換係数の2次元表現に逆スキャニングさせるコンピュータ読取可能な媒体。
  31. 前記変換係数は有意係数およびゼロ値係数を備え、前記ビデオデータのブロックは、前記有意係数および前記ゼロ値係数を定義する有意マップを備える請求項30に記載のコンピュータ読取可能な媒体。
JP2013546217A 2010-12-22 2011-12-14 ビデオデータのブロック係数のモード依存型スキャニング Active JP5792319B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201061426349P 2010-12-22 2010-12-22
US201061426372P 2010-12-22 2010-12-22
US61/426,372 2010-12-22
US61/426,349 2010-12-22
US201161436835P 2011-01-27 2011-01-27
US61/436,835 2011-01-27
US13/179,321 US9049444B2 (en) 2010-12-22 2011-07-08 Mode dependent scanning of coefficients of a block of video data
US13/179,321 2011-07-08
PCT/US2011/064964 WO2012087713A1 (en) 2010-12-22 2011-12-14 Mode dependent scanning of coefficients of a block of video data

Publications (2)

Publication Number Publication Date
JP2014504489A JP2014504489A (ja) 2014-02-20
JP5792319B2 true JP5792319B2 (ja) 2015-10-07

Family

ID=45464886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013546217A Active JP5792319B2 (ja) 2010-12-22 2011-12-14 ビデオデータのブロック係数のモード依存型スキャニング

Country Status (13)

Country Link
US (1) US9049444B2 (ja)
EP (1) EP2656607B1 (ja)
JP (1) JP5792319B2 (ja)
KR (1) KR101540528B1 (ja)
CN (1) CN103270754A (ja)
AU (1) AU2011349686A1 (ja)
BR (1) BR112013015895B1 (ja)
CA (1) CA2822259A1 (ja)
ES (1) ES2693643T3 (ja)
MY (2) MY190750A (ja)
RU (1) RU2547239C2 (ja)
SG (1) SG190930A1 (ja)
WO (1) WO2012087713A1 (ja)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101495724B1 (ko) 2010-02-02 2015-02-25 삼성전자주식회사 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR101373814B1 (ko) * 2010-07-31 2014-03-18 엠앤케이홀딩스 주식회사 예측 블록 생성 장치
US9497472B2 (en) 2010-11-16 2016-11-15 Qualcomm Incorporated Parallel context calculation in video coding
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
CN103430541B (zh) * 2011-01-06 2016-11-23 三星电子株式会社 使用分层结构的数据单元的视频解码方法
US9380319B2 (en) * 2011-02-04 2016-06-28 Google Technology Holdings LLC Implicit transform unit representation
US8878861B2 (en) * 2011-03-01 2014-11-04 Sony Corporation Conversion between z-scanning indices, raster-scanning indices and 2-D coordinates using simple bit-operations in HEVC
US10142637B2 (en) 2011-03-08 2018-11-27 Texas Instruments Incorporated Method and apparatus for parallelizing context selection in video processing
KR101668583B1 (ko) 2011-06-23 2016-10-21 가부시키가이샤 제이브이씨 켄우드 화상 인코딩 장치, 화상 인코딩 방법 및 화상 인코딩 프로그램, 및 화상 디코딩 장치, 화상 디코딩 방법 및 화상 디코딩 프로그램
HUE052897T2 (hu) * 2011-06-27 2021-05-28 Samsung Electronics Co Ltd Mozgásinformáció kódolása és dekódolása
PL3313076T3 (pl) 2011-06-28 2019-07-31 Samsung Electronics Co., Ltd. Sposób i urządzenie do kodowania wideo z predykcją wewnątrzramkową
EP2727354A1 (en) * 2011-06-30 2014-05-07 Huawei Technologies Co., Ltd Encoding of prediction residuals for lossless video coding
US9948938B2 (en) * 2011-07-21 2018-04-17 Texas Instruments Incorporated Methods and systems for chroma residual data prediction
KR20130045154A (ko) 2011-10-24 2013-05-03 (주)인터앱 영상 복호화 장치
KR20130049522A (ko) 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 방법
US10390016B2 (en) 2011-11-04 2019-08-20 Infobridge Pte. Ltd. Apparatus of encoding an image
KR20130049524A (ko) * 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 방법
CN107371024B (zh) * 2011-11-08 2020-09-04 株式会社Kt 利用解码装置对视频信号进行解码的方法
US9344722B2 (en) * 2011-11-18 2016-05-17 Futurewei Technologies, Inc. Scanning of prediction residuals in high efficiency video coding
GB2501535A (en) 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
WO2014003423A1 (ko) 2012-06-29 2014-01-03 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
US9264713B2 (en) * 2012-07-11 2016-02-16 Qualcomm Incorporated Rotation of prediction residual blocks in video coding with transform skipping
WO2014084656A1 (ko) * 2012-11-29 2014-06-05 엘지전자 주식회사 복수의 레이어를 지원하는 영상 부호화/복호화 방법 및 장치
CN105453567B (zh) * 2013-07-24 2019-04-23 微软技术许可有限责任公司 用于非变换编码的扫描次序
JP6337380B2 (ja) 2013-07-31 2018-06-06 サン パテント トラスト 画像符号化方法および画像符号化装置
WO2015096647A1 (en) * 2013-12-27 2015-07-02 Mediatek Inc. Method and apparatus for major color index map coding
US9854261B2 (en) 2015-01-06 2017-12-26 Microsoft Technology Licensing, Llc. Detecting markers in an encoded video signal
US20180027236A1 (en) * 2015-02-17 2018-01-25 Lg Electronics Inc. Method and device for encoding/decoding video signal by using adaptive scan order
EP3264771A4 (en) * 2015-02-27 2018-08-29 KDDI Corporation Coding device and decoding device
KR102370375B1 (ko) 2015-05-12 2022-03-04 삼성전자주식회사 적응적인 순서로 결정되는 블록을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
CN112272298B (zh) * 2015-06-23 2023-07-18 联发科技(新加坡)私人有限公司 转换系数编解码的方法及装置
WO2017138831A1 (en) 2016-02-12 2017-08-17 Huawei Technologies Co., Ltd. Method and apparatus for scan order selection
JP6728375B2 (ja) 2016-02-12 2020-07-22 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 走査順序選択のための方法および装置
KR20180129863A (ko) * 2016-04-25 2018-12-05 엘지전자 주식회사 영상 코딩 시스템에서 영상 디코딩 방법 및 장치
EP3453174A1 (en) * 2016-05-06 2019-03-13 VID SCALE, Inc. Method and system for decoder-side intra mode derivation for block-based video coding
KR102424418B1 (ko) 2016-08-31 2022-07-22 주식회사 케이티 비디오 신호 처리 방법 및 장치
CN116233422A (zh) * 2017-03-22 2023-06-06 汉阳大学校产学协力团 基于自适应像素分类基准的环路滤波方法
CN110650343B (zh) * 2018-06-27 2024-06-07 中兴通讯股份有限公司 图像的编码、解码方法及装置、电子设备及***
US11102513B2 (en) * 2018-12-06 2021-08-24 Tencent America LLC One-level transform split and adaptive sub-block transform
US11102490B2 (en) * 2018-12-31 2021-08-24 Tencent America LLC Coefficient scanning methods on adaptive angle mode
WO2020145381A1 (ja) * 2019-01-13 2020-07-16 ソニー株式会社 画像処理装置および方法
WO2020197038A1 (ko) 2019-03-22 2020-10-01 엘지전자 주식회사 영상 코딩 시스템에서 인트라 서브 파티션 기반의 인트라 예측 방법 및 장치
US11677969B2 (en) * 2019-03-22 2023-06-13 Tencent America LLC Method and apparatus for video coding
WO2020248954A1 (en) 2019-06-09 2020-12-17 Beijing Bytedance Network Technology Co., Ltd. Significant coefficient signaling in video coding
CN114208191B (zh) 2019-08-06 2024-01-12 北京字节跳动网络技术有限公司 基于颜色格式的视频区域分割
MX2022002188A (es) 2019-09-02 2022-03-11 Beijing Bytedance Network Tech Co Ltd Determinacion de modo de codificacion basada en formato de color.
CN114424565A (zh) * 2019-09-21 2022-04-29 北京字节跳动网络技术有限公司 基于色度帧内模式的尺寸限制
CN115004706B (zh) * 2020-01-28 2024-06-04 北京达佳互联信息技术有限公司 关于变换和系数信令的方法和装置
US11368694B1 (en) * 2021-01-26 2022-06-21 Meta Platforms, Inc. Architecture for rate estimation in video coding

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5122875A (en) * 1991-02-27 1992-06-16 General Electric Company An HDTV compression system
US6680975B1 (en) 1992-02-29 2004-01-20 Samsung Electronics Co., Ltd. Signal encoding and decoding system and method
EP1835762A3 (en) 1996-05-28 2007-10-03 Matsushita Electric Industrial Co., Ltd. decoding apparatus with intra prediction
US6054943A (en) 1998-03-25 2000-04-25 Lawrence; John Clifton Multilevel digital information compression based on lawrence algorithm
JP2000013609A (ja) 1998-06-23 2000-01-14 Fujitsu Ltd 符号化装置
US6658159B1 (en) 2000-03-17 2003-12-02 Hewlett-Packard Development Company, L.P. Block entropy coding in embedded block coding with optimized truncation image compression
KR20030005222A (ko) 2001-01-10 2003-01-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 코딩
US6870963B2 (en) 2001-06-15 2005-03-22 Qualcomm, Inc. Configurable pattern optimizer
US6795584B2 (en) * 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
US7782954B2 (en) 2003-09-07 2010-08-24 Microsoft Corporation Scan patterns for progressive video content
US7688894B2 (en) 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
US20060078049A1 (en) 2004-10-13 2006-04-13 Nokia Corporation Method and system for entropy coding/decoding of a video bit stream for fine granularity scalability
US20060256854A1 (en) 2005-05-16 2006-11-16 Hong Jiang Parallel execution of media encoding using multi-threaded single instruction multiple data processing
EP1739971A1 (en) * 2005-06-28 2007-01-03 Thomson Licensing Method and apparatus for encoding a video signal
EP1753242A2 (en) * 2005-07-18 2007-02-14 Matsushita Electric Industrial Co., Ltd. Switchable mode and prediction information coding
WO2007079782A1 (en) 2006-01-13 2007-07-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable picture coding with particular transform coefficient scan path
CN100546390C (zh) * 2006-03-16 2009-09-30 清华大学 在图象编码过程中实现自适应扫描的方法
JP4876122B2 (ja) 2006-03-22 2012-02-15 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 精度スケーラビリティを可能にする符号化スキーム
RU2406254C2 (ru) * 2006-03-29 2010-12-10 Квэлкомм Инкорпорейтед Видеообработка с масштабируемостью
CA2657267C (en) 2006-07-13 2013-07-16 Qualcomm Incorporated Video coding with fine granularity scalability using cycle-aligned fragments
KR100882949B1 (ko) 2006-08-17 2009-02-10 한국전자통신연구원 화소 유사성에 따라 적응적인 이산 코사인 변환 계수스캐닝을 이용한 부호화/복호화 장치 및 그 방법
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US8619853B2 (en) * 2007-06-15 2013-12-31 Qualcomm Incorporated Separable directional transforms
JPWO2009001793A1 (ja) * 2007-06-26 2010-08-26 株式会社東芝 画像符号化と画像復号化の方法及び装置
KR101148614B1 (ko) 2007-09-06 2012-05-25 닛본 덴끼 가부시끼가이샤 영상 부호화 장치 및 영상 부호화 방법
KR20090097689A (ko) * 2008-03-12 2009-09-16 삼성전자주식회사 영상의 인트라 예측 부호화/복호화 방법 및 장치
US8902972B2 (en) 2008-04-11 2014-12-02 Qualcomm Incorporated Rate-distortion quantization for context-adaptive variable length coding (CAVLC)
JP2010004284A (ja) 2008-06-19 2010-01-07 Toshiba Corp 画像復号装置及び画像復号方法
EP2182732A1 (en) 2008-10-28 2010-05-05 Panasonic Corporation Switching between scans in image coding
US8737613B2 (en) 2008-11-20 2014-05-27 Mediatek Inc. Scanning methods of transform-based digital data processing that conditionally adjust scan order according to characteristics information and related apparatus thereof
WO2010143853A2 (ko) * 2009-06-07 2010-12-16 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 장치
CN102045560B (zh) * 2009-10-23 2013-08-07 华为技术有限公司 一种视频编解码方法及设备
US20110280314A1 (en) * 2010-05-12 2011-11-17 Texas Instruments Incorporated Slice encoding and decoding processors, circuits, devices, systems and processes
US9172968B2 (en) 2010-07-09 2015-10-27 Qualcomm Incorporated Video coding using directional transforms
US8902988B2 (en) 2010-10-01 2014-12-02 Qualcomm Incorporated Zero-out of high frequency coefficients and entropy coding retained coefficients using a joint context model
US9497472B2 (en) 2010-11-16 2016-11-15 Qualcomm Incorporated Parallel context calculation in video coding
US9866829B2 (en) 2012-01-22 2018-01-09 Qualcomm Incorporated Coding of syntax elements that correspond to coefficients of a coefficient block in video coding

Also Published As

Publication number Publication date
US20120163455A1 (en) 2012-06-28
ES2693643T3 (es) 2018-12-13
SG190930A1 (en) 2013-07-31
WO2012087713A1 (en) 2012-06-28
KR20130105894A (ko) 2013-09-26
JP2014504489A (ja) 2014-02-20
US9049444B2 (en) 2015-06-02
EP2656607B1 (en) 2018-09-12
RU2013133841A (ru) 2015-02-10
AU2011349686A1 (en) 2013-07-04
KR101540528B1 (ko) 2015-07-29
MY190750A (en) 2022-05-12
EP2656607A1 (en) 2013-10-30
BR112013015895B1 (pt) 2021-07-27
RU2547239C2 (ru) 2015-04-10
CA2822259A1 (en) 2012-06-28
MY173210A (en) 2020-01-06
CN103270754A (zh) 2013-08-28
BR112013015895A2 (pt) 2018-06-05

Similar Documents

Publication Publication Date Title
JP5792319B2 (ja) ビデオデータのブロック係数のモード依存型スキャニング
AU2012231675B2 (en) Bi-predictive merge mode based on uni-predictive neighbors in video coding
US9288501B2 (en) Motion vector predictors (MVPs) for bi-predictive inter mode in video coding
EP2732629B1 (en) Signaling picture size in video coding
US20110249754A1 (en) Variable length coding of coded block pattern (cbp) in video compression
KR101552029B1 (ko) 1 차원 스위칭 필터 및 1 차원 적응 필터의 조합을 사용한 비디오 필터링
JP2014506752A (ja) 高性能ビデオコード化(hevc)におけるコード化単位についての量子化パラメータの変化の信号伝達
JP2014525169A (ja) ルーマおよびクロマブロックのためのvlc係数コーディング
CA2830242C (en) Bi-predictive merge mode based on uni-predictive neighbors in video coding

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150805

R150 Certificate of patent or registration of utility model

Ref document number: 5792319

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250