KR101632776B1 - 비디오 코딩에 대한 구문 엘리먼트들의 공동 코딩 - Google Patents

비디오 코딩에 대한 구문 엘리먼트들의 공동 코딩 Download PDF

Info

Publication number
KR101632776B1
KR101632776B1 KR1020137013852A KR20137013852A KR101632776B1 KR 101632776 B1 KR101632776 B1 KR 101632776B1 KR 1020137013852 A KR1020137013852 A KR 1020137013852A KR 20137013852 A KR20137013852 A KR 20137013852A KR 101632776 B1 KR101632776 B1 KR 101632776B1
Authority
KR
South Korea
Prior art keywords
sub
unit
chrominance component
syntax element
zero coefficient
Prior art date
Application number
KR1020137013852A
Other languages
English (en)
Other versions
KR20130084308A (ko
Inventor
샹린 왕
마르타 카르체비츠
웨이-정 치엔
페이송 천
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20130084308A publication Critical patent/KR20130084308A/ko
Application granted granted Critical
Publication of KR101632776B1 publication Critical patent/KR101632776B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

일 예에서는, 비디오 디코더는 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 변환 유닛에 대한 코드워드에 기초하여 결정하도록, 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 코드워드에 기초하여 결정하도록, 그리고 변환 유닛을 결정들에 기초하여 디코딩하도록 구성된다. 다른 예에서는, 비디오 인코더는 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하도록, 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하도록, 가변장 코드 테이블로부터 코드워드를 선택하되, 여기에서 가변장 코드 테이블은 코드워드가 결정들에 대응한다는 표시를 제공하도록, 그리고 코드워드를 변환 유닛에 대하여 제공하도록 구성된다.

Description

비디오 코딩에 대한 구문 엘리먼트들의 공동 코딩{JOINT CODING OF SYNTAX ELEMENTS FOR VIDEO CODING}
35 U.S.C. §119 하의 우선권 주장
본 출원은 2010 년 11 월 1 일에 출원된 미국 가출원 번호 제 61/409,052 호; 2010 년 11 월 2 일에 출원된 미국 가출원 번호 제 61/409,471 호; 2011 년 1 월 13 일에 출원된 미국 가출원 번호 제 61/432,548 호; 2011 년 1 월 23 일에 출원된 미국 가출원 번호 제 61/435,344 호; 2011 년 3 월 4 일에 출원된 미국 가출원 번호 제 61/449,556 호; 2011 년 3 월 8 일에 출원된 미국 가출원 번호 제 61/450,554 호; 및 2011 년 3 월 10 일에 출원된 미국 가출원 번호 제 61/451,448 호의 이점을 주장하며, 이들 각각의 전체 내용은 본 명세서에 참조에 의하여 통합된다.
본 개시물은 비디오 코딩에 관련하며, 그리고 좀 더 자세하게 설명하면, 코딩된 비디오 데이터에 대한 구문 정보(syntax information) 에 관련한다.
디지털 비디오 성능들은 디지털 텔레비전들, 디지털 다이렉트 브로드캐스트 시스템들, 무선 브로드캐스트 시스템들, 개인휴대 정보 단말들 (personal digital assistants, PDAs), 랩톱 또는 데스크톱 컴퓨터들, 디지털 카메라들, 디지털 레코딩 디바이스들, 디지털 미디어 재생기들, 비디오 게이밍 디바이스들, 비디오 게임 콘솔들, 셀룰러 또는 위성 무선 전화기들, 비디오 원격 화상 회의 디바이스들 (video teleconferencing devices) 및 기타 등등을 포함하는 광범위한 디바이스들 내에 통합될 수 있다. 디지털 비디오 디바이스들은 디지털 비디오 정보를 더 효율적으로 송신 및 수신하기 위하여, MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, Part 10, 고급 비디오 코딩 (Advanced Video Coding; AVC), 고 효율 비디오 코딩 (High Efficiency Video Coding; HEVC) 에 대한 도래하는 표준, 및 이러한 표준들의 확장들에 의하여 정의된 표준들에 설명되어 있는 것과 같은 비디오 압축 기법들을 구현한다.
비디오 압축 기법들은 공간적 예측 및/또는 시간적 예측을 수행하여 비디오 시퀀스들 내에 내재된 리던던시 (redundancy) 를 감소시키거나 제거한다. 블록-기반의 비디오 코딩에서는, 비디오 프레임 또는 슬라이스는 비디오 블록들로 파티셔닝 (partitioning) 될 수도 있다. 각각의 비디오 블록들은 더 파티셔닝될 수 있다. 인트라-코딩된 (I) 프레임 또는 슬라이스 내의 비디오 블록들은 인접하는 블록들에 대한 공간적 예측을 이용하여 인코딩된다. 인터-코딩된 (P 또는 B) 프레임 또는 슬라이스 내의 비디오 블록들은, 동일한 프레임 또는 슬라이스 내의 이웃하는 비디오 블록들에 대한 공간적 예측을 이용하거나, 또는 다른 참조 프레임들에 대한 시간적 예측을 이용하여 인코딩될 수도 있다.
일반적으로, 본 개시물은 비디오 데이터의 코딩 유닛들 (CUs) 의 변환 유닛들 (TUs) 에 대한 코딩된 블록 플래그 (coded block flag; CBF) 및 변환 스플릿 플래그 (transform split flag; TSF) 구문 엘리먼트들을 코딩하기 위한 기법들을 기술한다. TU는 CU의 하나 이상의 성분들 (예를 들어, 색차 및 휘도 성분들) 에 대한 잔여 데이터 (residual data) 를 포함한다. TU에 대한 CBF는 CU의 개별 성분에 대한 TU의 잔여 데이터가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 표시한다. TU에 대한 TSF는 그 TU가 서브-TU들로 파티셔닝, 또는 "스플릿"되는지의 여부를 표시한다. 본 개시물의 기법들은 TU들에 대한 CBF들 및 TSF들을 공동으로 코딩하는 것을 포함하는데, 이것이 압축 효율을 개선할 수도 있다.
일 예에서는, 비디오 데이터를 디코딩하는 방법은, 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 변환 유닛에 대한 코드워드에 기초하여 결정하는 단계, 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 상기 코드워드에 기초하여 결정하는 단계, 및 상기 변환 유닛을 상기 결정들에 기초하여 디코딩하는 단계를 포함한다.
다른 예에서는, 비디오 데이터를 디코딩하기 위한 장치는, 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 변환 유닛에 대한 코드워드에 기초하여 결정하고, 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 상기 코드워드에 기초하여 결정하며, 그리고 상기 변환 유닛을 상기 결정들에 기초하여 디코딩하도록 구성되는 비디오 디코더를 포함한다.
다른 예에서는, 비디오 데이터를 디코딩하기 위한 장치는, 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 변환 유닛에 대한 코드워드에 기초하여 결정하기 위한 수단, 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 상기 코드워드에 기초하여 결정하기 위한 수단, 및 상기 변환 유닛을 상기 결정들에 기초하여 디코딩하기 위한 수단을 포함한다.
다른 예에서는, 컴퓨터 프로그램 제품은 명령들이 저장된 컴퓨터-판독가능 저장 매체를 포함하는데, 상기 명령들은, 실행되면, 프로그램 가능한 프로세서로 하여금, 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 변환 유닛에 대한 코드워드에 기초하여 결정하게 하고, 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 상기 코드워드에 기초하여 결정하게 하고, 그리고 상기 변환 유닛을 상기 결정들에 기초하여 디코딩하게 한다.
다른 예에서는, 비디오 데이터를 인코딩하는 방법은, 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하는 단계, 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하는 단계, 가변장 코드 테이블로부터 코드워드를 선택하는 단계로서, 여기서 상기 가변장 코드 테이블은 상기 코드워드가 상기 결정들에 대응한다는 표시를 제공하는, 상기 선택하는 단계, 및 상기 코드워드를 상기 변환 유닛에 대하여 제공하는 단계를 포함한다. 이러한 예에서, 상기 방법은 상기 코드워드를 비트스트림으로 전송하는 단계를 더 포함할 수도 있다.
다른 예에서는, 비디오 데이터를 인코딩하기 위한 장치는, 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하도록, 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하도록, 가변장 코드 테이블로부터 코드워드를 선택하되, 여기서 상기 가변장 코드 테이블은 상기 코드워드가 상기 결정들에 대응한다는 표시를 제공하도록, 그리고 상기 코드워드를 상기 변환 유닛에 대하여 제공하도록 구성되는 비디오 인코더를 포함한다. 이러한 예에서, 이러한 비디오 인코더는 상기 코드워드를 비트스트림으로 전송하도록 더 구성될 수도 있다.
다른 예에서는, 비디오 데이터를 인코딩하기 위한 장치는, 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하기 위한 수단, 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하기 위한 수단, 가변장 코드 테이블로부터 코드워드를 선택하기 위한 수단으로서, 여기서 상기 가변장 코드 테이블은 상기 코드워드가 상기 결정들에 대응한다는 표시를 제공하는, 상기 선택하기 위한 수단, 및 상기 코드워드를 상기 변환 유닛에 대하여 제공하기 위한 수단을 포함한다. 이러한 예에서, 이러한 장치는 상기 코드워드를 비트스트림으로 전송하기 위한 수단을 더 포함할 수도 있다.
다른 예에서는, 컴퓨터 프로그램 제품은 명령들이 저장된 컴퓨터-판독가능 저장 매체를 포함하는데, 상기 명령들은, 실행되면, 프로세서로 하여금, 비디오 데이터의 코딩 유닛의 변환 유닛의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하게 하고, 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하게 하고, 가변장 코드 테이블로부터 코드워드를 선택하되, 여기서 상기 가변장 코드 테이블은 상기 코드워드가 상기 결정들에 대응한다는 표시를 제공하게 하고, 그리고 상기 코드워드를 상기 변환 유닛에 대하여 제공하게 한다. 이러한 예에서, 상기 컴퓨터 프로그램 제품은 상기 프로세서로 하여금 상기 코드워드를 비트스트림으로 전송하게 하는 명령들을 더 포함할 수도 있다.
본 개시물의 하나 이상의 양태들의 세부 사항들은 첨부 도면들 및 아래의 발명을 실시하기 위한 구체적인 내용에서 진술된다. 본 개시물에서 설명되는 기법들의 다른 특징들, 목적들, 그리고 장점들은 발명을 실시하기 위한 구체적인 내용 및 도면들로부터, 그리고 특허청구범위들로부터 명백해질 것이다.
도 1 은 비디오 데이터의 코딩 유닛 (CU) 의 변환 유닛 (TU) 에 대한 하나 이상의 코딩된 블록 플래그들 (CBFs) 및 변환 스플릿 플래그 (TSF) 를 공동으로 코딩하기 위한 기법들을 구현할 수도 있는 비디오 인코딩 및 디코딩 시스템의 일 예를 도시하는 블록도이다.
도 2 는 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하기 위한 기법들을 구현할 수도 있는 비디오 인코더의 일 예를 도시하는 블록도이다.
도 3 은 비디오 데이터의 CU의 TU에 대한 공동으로 인코딩된 하나 이상의 CBF들 및 TSF를 디코딩하기 위한 기법들을 구현할 수도 있는 비디오 디코더의 일 예를 도시하는 블록도이다.
도 4 는 비디오 데이터의 CU들의 TU들의 예들을 도시하는 개념도이다.
도 5a 는 비디오 데이터의 CU의 TU의 일 예를 도시하는 개념도이다.
도 5b 는 도 5a 의 TU에 대한 파티션 정보를 나타내는 잔여 쿼드트리 변환 데이터 구조의 일 예를 도시하는 개념도이다.
도 5c 는 비디오 데이터의 CU의 TU에 대한 균일한 파티션 구조의 일 예를 도시하는 개념도이다.
도 6 은 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하기 위한 예시적인 방법을 도시하는 흐름도이다.
도 7 은 비디오 데이터의 CU의 TU에 대한 공동으로 인코딩된 하나 이상의 CBF들 및 TSF를 디코딩하기 위한 예시적인 방법을 도시하는 흐름도이다.
도 8 은 비디오 데이터의 CU의 TU에 대한 휘도 CBF, 색차 CBF, 및 TSF를 공동으로 인코딩하기 위한 예시적인 방법을 도시하는 흐름도이다.
도 9 는 비디오 데이터의 CU의 TU에 대한 공동으로 인코딩된 휘도 CBF, 색차 CBF, 및 TSF를 공동으로 디코딩하기 위한 예시적인 방법을 도시하는 흐름도이다.
일반적으로, 본 개시물은 비디오 데이터의 코딩 유닛들 (CUs) 의 변환 유닛들 (TUs) 에 대한 코딩된 블록 플래그 (CBF) 및 변환 스플릿 플래그 (TSF) 구문 엘리먼트들을 코딩하기 위한 기법들을 기술한다. 본 개시물에서는, "코딩" 은 일반적으로 인코더에서의 비디오 데이터의 인코딩 및 디코더에서의 비디오 데이터의 디코딩 모두를 지칭한다. CU는 일반적으로 CU에 대한 예측 데이터를 어떻게 형성할 지를 표시하는 하나 이상의 예측 유닛들 (PUs) 을 포함한다. TU들은 잔여 데이터, 즉, 원본 비디오 데이터 및 예측 데이터 간의 픽셀-바이-픽셀 차분들, 또는 잔여 데이터의 변환된 버전 즉, 변환 계수들을 포함한다. 비디오 데이터의 프레임은 다수 개의 최대 CU들 (LCUs) 로 분할될 수도 있는데, 이것은 서브-CU들로 더 파티셔닝될 수도 있다. CU 쿼드트리는 어떻게 LCU가 서브-CU들로 파티셔닝되는지, 그리고 어떻게 각각의 서브-CU가 다른 서브-CU들로 파티셔닝되는지를 기술할 수도 있다.
파티셔닝되지 않는 CU는 CU 쿼드트리의 리프-노드에 대응한다. 이러한 CU는 리프-노드 CU 라고 지칭될 수도 있다. 각각의 리프-노드 CU는 하나 이상의 PU들 및 하나 이상의 TU들을 포함한다. CU들과 유사한, 리프-노드 CU의 TU들은 TU 쿼드트리에 따라서 서브-TU들로 파티셔닝될 수도 있다. TU 쿼드트리의 각각의 노드는 TSF 구문 엘리먼트를 포함할 수도 있는데, 여기에서, TSF는 그 노드에 대응하는 TU가 "스플릿되는지", 즉, 서브-TU들로 파티셔닝되는지의 여부를 표시한다.
일반적으로, 비디오 데이터는 RGB 컬러 공간보다는 YUV 컬러 공간에서 코딩된다. RGB 컬러 공간이 픽셀들의 적색, 녹색, 및 청색 성분들의 값들을 기술하는 반면에, YUV 컬러 공간은 픽셀들의 휘도 (Y) 및 색차 (U 그리고 V) 성분들의 값들을 기술하는데, 여기에서 U는 통상적으로 색차의 청색 휴들 (blue hues) 을 나타내고 그리고 V는 색차의 적색 휴들을 나타낸다. 또한, YUV 컬러 공간은 YCbCr로서도 기술되는데, 여기에서, Cb는 청색 휴들을 지칭하고 그리고 Cr은 적색 휴들을 지칭한다. CU의 TU는 통상적으로 하나 이상의 성분들을 포함하는데, 여기에서, 성분들의 각각은 CU의 Y, U, 또는 V 성분들 중 하나에 대응한다. 예를 들어, TU는 휘도 데이터를 나타내기 위한 Y 성분, 청색 휴 데이터를 나타내기 위한 U 성분, 그리고 적색 휴 데이터를 나타내기 위한 V 성분을 포함할 수도 있다.
또한, TU 쿼드트리의 각각의 노드는 하나 이상의 CBF 구문 엘리먼트들을 포함할 수도 있는데, 여기에서, 각각의 CBF는 그 노드에 대응하는 TU의 대응하는 성분이 코딩되는지의 여부를 표시한다. 특히, TU의 성분은 이것이 적어도 하나의 비-제로 계수를 포함하는 경우에 "코딩된" 것으로 간주된다. 다시 말하면, TU의 성분은 이것이 제로보다 더 큰 절대값을 가지는 적어도 하나의 계수를 포함하는 경우에 코딩된 것으로 간주된다. TU의 성분에 대한 CBF는 그 성분이 코딩되는지의 여부, 즉, 그 성분이 적어도 하나의 비-제로 계수, 또는 다시 말하면, 제로보다 더 큰 절대값을 가지는 적어도 하나의 계수를 포함하는지의 여부를 나타내는 값을 가진다.
본 개시물의 기법들은 CU들을 코딩하기 위하여 이용되는 비디오 데이터의 CU들의 TU들에 대한 CBF 및 TSF 구문 엘리먼트들을 코딩할 때 압축 효율을 개선할 수도 있다. 이 상황에서는, 비디오 데이터의 CU의 TU에 대한 CBF 또는 TSF는 CBF 또는 TSF가 인코딩 또는 디코딩되는 경우에, 즉, 인코더 또는 디코더가 공동으로 코딩된 CBF 및 TSF와 VLC 코드워드 사이에서 값들을 매핑하는 경우에 "코딩된다". 일반적으로, 이러한 기법들을 개발하는 데 있어서 수행된 경험적 시험이 비디오 데이터의 CU들의 TU들에 대한 CBF들 및 TSF들 사이의 상관을 입증하였다. 예를 들어, 일반적으로, TU가 서브-TU들로 스플릿되는 경우에는, TU의 성분이 또한 코딩될 가능성이 있을 수도 있다. 다른 예로서, TU의 성분이 코딩되지 않는 경우에는, TU가 서브-TU들로 스플릿되지 않을 가능성이 있을 수도 있다. 동일한 TU의 성분들이 코딩되는지의 여부 사이에도 상관이 존재할 수도 있다. 예를 들어, TU의 하나의 성분이 코딩되는 경우에는, TU의 다른 성분들이 또한 코딩될 가능성이 있을 수도 있다.
비디오 데이터의 CU의 TU의 상관된 구문 엘리먼트들 (예를 들어, 하나 이상의 CBF들 및 TSF) 을 가변장 코딩 (variable length coding; VLC) 기법들을 이용하여 공동으로 코딩하면 압축 효율을 개선할 수도 있다. 예를 들어, 상관 때문에, 구문 엘리먼트들의 값들의 어떤 조합들이 다른 조합들보다 더 가능할 수도 있다. 이와 같이, 상관된 구문 엘리먼트들을 VLC 기법들을 이용하여 공동으로 코딩하는 경우에, 더욱 가능한 조합들에게 다른, 덜 가능한 조합들에 비해 더 짧은 VLC 코드워드들이 지정될 수도 있다. 이러한 방식으로, 더욱 가능한 조합들에 대응하는 코드워드들이 덜 가능한 조합들에 대응하는 코드워드들 보다 더 적은 비트들을 포함할 수도 있다. 예를 들어, 가장 가능한 조합에 대응하는 코드워드는 오직 단일 비트만을 포함할 수도 있다. 이와 같이, 본 개시물의 기법들의 적용은, TU에 대하여 개별적으로 구문 엘리먼트들을, 예를 들어 각각의 구문 엘리먼트에 대한 단일-비트 플래그를 이용하여 코딩하는 것에 비하여, 가장 가능한 경우들에서 구문 엘리먼트들을 더 효율적으로 나타내는 비트스트림을 제공할 수도 있다.
추가적으로, 다시 한번 VLC 기법들을 이용하여, 비디오 데이터의 CU의 TU의 서브-TU들에 대한 상관된 구문 엘리먼트들 (예를 들어, TSF) 중 하나를 그 서브-TU들에 대한 다른 상관된 구문 엘리먼트 (예를 들어, CBF) 의 값들에 기초하여 공동으로 코딩하는 것도 역시 압축 효율을 개선할 수도 있다. 예를 들어, 위에서 설명된 상관 때문에, 주어진 서브-TU에 대하여, 상관된 구문 엘리먼트들 중 하나의 어떤 값들은, 다른 상관된 구문 엘리먼트의 값에 따라, 다른 값들보다 더 가능할 수도 있다. 일 예로서, 서브-TU에 대한 TSF의 어떤 값들은, 그 서브-TU에 대한 주어진 CBF의 값에 따라, 다른 값들보다 더 가능할 수도 있다. 이와 같이, 서브-TU들에 대한 TSF들을 공동으로 코딩하는 경우에, TSF들의 값들의 몇몇 조합들이, 그 서브-TU들에 대한 CBF들, 예를 들어 서브-TU들의 휘도 (Y) 성분들에 대한 CBF들의 값들에 따라, 다른 조합들보다 더 가능할 수도 있다. 결과적으로, TSF들을 공동으로 코딩하기 위하여, 상이한 VLC 테이블들이 CBF들의 값들에 기초하여 선택됨으로써, 그 CBF들의 값들이 더 많이 주어질 것 같은 TSF들의 값들의 조합들에 다른 덜 가능한 조합들보다 더 짧은 VLC 코드워드들이 지정될 수도 있도록 할 수도 있다.
마찬가지로, 서브-TU에 대한 주어진 CBF의 어떤 값들은, 그 서브-TU에 대한 TSF의 값에 따라, 다른 값들보다 더 가능할 수도 있다. 이와 같이, 특정한 성분, 예를 들어 서브-TU들 각각의 휘도 (Y) 성분에 대응하는, 그 서브-TU들에 대한 CBF들을 공동으로 코딩하는 경우에는, CBF들의 값들의 몇몇 조합들이, 그 서브-TU들에 대한 TSF들의 값들에 따라, 다른 조합들보다 더 가능할 수도 있다. 결과적으로, CBF들을 공동으로 코딩하기 위하여, 상이한 VLC 테이블들이 TSF들의 값들에 기초하여 선택됨으로써, TSF들의 값들이 더 많이 주어질 것 같은 CBF들의 값들의 조합들에 다른 덜 가능한 조합들보다 더 짧은 VLC 코드워드들이 지정될 수도 있도록 할 수도 있다. 또 다시, 본 개시물의 기법들의 적용은, 서브-TU에 대하여 개별적으로 구문 엘리먼트들을, 예를 들어 각각의 구문 엘리먼트에 대한 단일-비트 플래그를 이용하여 코딩하는 것에 비하여, 가장 가능한 경우들에서 그 서브-TU들에 대한 구문 엘리먼트들을 더 효율적으로 나타내는 비트스트림을 제공할 수도 있다.
따라서, 본 개시물의 기법들은 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하는 단계를 포함한다. 몇몇 예들에서는, 그 TU에 대한 CBF들 중 하나 이상의, 또는 TSF의 값이 추론될 수 있는 경우에는, CBF들 또는 TSF는 그 TU에 대한 나머지 CBF들 및/또는 TSF와 함께 공동으로 코딩될 필요가 없다.
일 예로서, TU의 제 1 색차 성분이 코딩되는지의 여부 및 TU의 제 2 색차 성분이 코딩되는지의 여부 사이에 상관이 존재할 수도 있다. 예를 들어, TU의 제 1 색차 성분 (예를 들어, U) 이 코딩되는 경우에는, 그 TU의 제 2 색차 성분 (예를 들어, V) 도 역시 코딩될 가능성이 있을 수도 있다. 따라서, TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하는 경우에는, 본 개시물의 기법들은 그 TU의 양자의 색차 성분들을 나타내는 CBF를 코딩하는 것을 포함할 수도 있다. 즉, 본 개시물의 기법들은 그 TU의 색차 성분들에 대한 CBF들을 비트 단위 "OR" 하는 것을 포함한다. 이러한 방식으로, 본 개시물의 기법들은 TU에 대한 색차 CBF, 예를 들어 CBFC를 제공하는 것을 포함하는데, 여기에서, CBFC는 CBFU | CBFV를 나타내고, 여기에서 U 및 V는 TU의 색차 성분들을 나타내며, 그리고 '|' 는 비트 단위 "OR" 연산자를 지칭한다. 또한, CBFC는 그 TU에 대한 TSF와 함께 공동으로 코딩될 수도 있다. TU에 대한 CBFC의 값이 TU의 색차 성분들 중 적어도 하나가 코딩된다는 것을 표시하는 경우에는, TU의 각각의 개별 색차 성분이 코딩되는지의 여부를 표시하는 추가적 정보가 제공될 수도 있다. 몇몇 예들에서는, TU의 색차 성분들에 대한 CBF들 중 하나의 값이 추론될 수 있는 경우에는, 추가적 정보가 제공될 필요가 없다.
다른 예들에서는, 이전에 설명된 바와 같이, 비디오 데이터의 CU의 TU의 각각의 서브-TU가 다른 서브-TU들로 스플릿되는지의 여부, 및 각각의 서브-TU의 하나 이상의 성분들이 코딩되는지의 여부 사이에도 역시 상관이 존재할 수도 있다. 일 예로서, 각각의 서브-TU가 다른 서브-TU들로 스플릿되는 경우에는, 각각의 서브-TU의 하나 이상의 성분들 (예를 들어, Y 성분) 이 코딩될 가능성이 있을 수도 있다. 추가적으로, 각각의 서브-TU의 하나 이상의 성분들이 코딩되지 않는 경우에는, 각각의 서브-TU가 다른 서브-TU들로 스플릿되지 않을 가능성이 있을 수도 있다. 따라서, 본 개시물의 기법들은 비디오 데이터의 CU의 TU의 서브-TU들에 대한 TSF들을 공동으로 코딩하는 것을 포함한다. 예를 들어, 본 개시물의 기법들은 각각의 서브-TU에 대한 CBF들 중 어느 것도 코딩되지 않는 경우, 즉 그 서브-TU들에 대한 CBF들의 값들이 추론되는 경우에 그 서브-TU들에 대한 TSF들을 공동으로 코딩하는 것을 포함할 수도 있다. 또 다시, 그 서브-TU들에 대한 TSF들 중 하나 이상의 값이 추론될 수 있는 경우에는, TSF들은 그 서브-TU들에 대한 나머지 TSF들과 함께 공동으로 코딩될 필요가 없다.
추가적으로, 본 개시물의 기법들은 서브-TU들 각각의 성분에 대한 CBF들을 공동으로 코딩하는 것을 포함한다. 예를 들어, 이러한 기법들은, 각각의 서브-TU의 색차 성분에 대한 CBF들 중 어느 것도 코딩되지 않는 경우, 즉, 그 서브-TU들의 색차 성분들에 대한 CBF들의 값들이 추론되는 경우에, 그리고 서브-TU들 각각에 대한 TSF가 코딩되지 않는 경우, 즉 그 서브-TU들에 대한 TSF들의 값들이 추론되는 경우에, 그 서브-TU들 각각의 Y 성분에 대한 CBF들을 공동으로 코딩하는 것을 포함할 수도 있다. 또 다시, 서브-TU들 각각의 성분에 대한 CBF들 중 하나 이상의 값이 추론될 수 있는 경우에는, CBF들은 서브-TU들에 대한 나머지 CBF들과 함께 공동으로 코딩될 필요가 없다.
도 1 은 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하기 위한 기법들을 구현할 수도 있는 비디오 인코딩 및 디코딩 시스템 (10) 의 일 예를 예시하는 블록도이다. 도 1 에 도시되는 바와 같이, 시스템 (10) 은 인코딩된 비디오를 통신 채널 (16) 을 통하여 목적지 디바이스 (14) 로 송신하는 소스 디바이스 (12) 를 포함한다. 소스 디바이스 (12) 및 목적지 디바이스 (14) 는 광범위한 디바이스들 중 임의의 것을 포함할 수도 있다. 몇몇 경우들에서, 소스 디바이스 (12) 및 목적지 디바이스 (14) 는 무선 통신 디바이스들, 예컨대 무선 핸드셋들, 소위 셀룰러 또는 위성 무선 전화기들, 또는 통신 채널 (16) 을 통해 비디오 정보를 통신할 수 있는 임의의 무선 디바이스들을 포함할 수도 있는데, 이 경우에는 통신 채널 (16) 은 무선이다.
그러나, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하기 위한 본 개시물의 기법들은 무선 애플리케이션들 또는 세팅들에 반드시 한정되는 것은 아니다. 예를 들어, 이러한 기법들은 공중파 (over-the-air) 텔레비전 브로드캐스트들, 케이블 텔레비전 송신들, 위성 텔레비전 송신들, 인터넷 비디오 송신들, 저장 매체 상에 인코딩되는 인코딩된 디지털 비디오, 또는 다른 시나리오들에도 적용될 수도 있다. 따라서, 통신 채널 (16) 은 인코딩된 비디오 데이터의 송신에 적합한 무선 또는 유선 미디어의 모든 조합을 포함할 수도 있다.
도 1 의 예에서, 소스 디바이스 (12) 는 비디오 소스 (18), 비디오 인코더 (20), 변조기/복조기 (모뎀) (22) 및 송신기 (24) 를 포함한다. 목적지 디바이스 (14) 는 수신기 (26), 모뎀 (28), 비디오 디코더 (30), 및 디스플레이 디바이스 (32) 를 포함한다. 본 개시물에 따르면, 소스 디바이스 (12) 의 비디오 인코더 (20) 및 목적지 디바이스 (14) 의 비디오 디코더 (30) 는, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하기 위한 기법들을 적용하도록 구성될 수도 있다. 다른 예들에서는, 소스 디바이스 및 목적지 디바이스는 다른 컴포넌트들 또는 배치구성물들을 포함할 수도 있다. 예를 들어, 소스 디바이스 (12) 는 외부 카메라와 같은 외부 비디오 소스 (18) 로부터 비디오 데이터를 수신할 수도 있다. 유사하게, 목적지 디바이스 (14) 는 내장된 디스플레이 디바이스를 포함하는 대신에 외부 디스플레이 디바이스와 인터페이싱할 수도 있다.
도 1 의 예시된 시스템 (10) 은 단지 한 예일 뿐이다. 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하기 위한 기법들은 임의의 디지털 비디오 인코딩 및/또는 디코딩 디바이스에 의해서 수행될 수도 있다. 비록 일반적으로 본 개시물의 기법들이 비디오 인코딩 디바이스 또는 비디오 디코딩 디바이스에 의하여 수행되지만, 이 기법들은 통상적으로는 "코덱"이라고 불리는 비디오 인코더/디코더에 의해서도 역시 수행될 수도 있다. 소스 디바이스 (12) 및 목적지 디바이스 (14) 는, 소스 디바이스 (12) 가 목적지 디바이스 (14) 로의 송신을 위한 코딩된 비디오 데이터를 생성하는 이러한 코딩 디바이스들의 예들에 불과하다. 몇몇 예들에서, 디바이스들 (12, 14) 각각이 비디오 인코딩 및 디코딩 컴포넌트들을 포함하면, 디바이스들 (12, 14) 은 실질적으로 대칭적인 방식으로 동작할 수도 있다. 그러므로, 시스템 (10) 은, 예를 들어 비디오 스트리밍, 비디오 재생, 비디오 브로드캐스팅, 또는 화상 통화 (video telephony) 를 위한 단방향 또는 양방향 비디오 송신을 비디오 디바이스들 (12, 14) 사이에서 지원할 수도 있다.
소스 디바이스 (12) 의 비디오 소스 (18) 는 비디오 카메라와 같은 비디오 캡쳐 디바이스, 이전에 캡쳐된 비디오를 포함하는 비디오 저장소, 및/또는 비디오 콘텐츠 제공자로부터의 비디오 피드 (video feed) 를 포함할 수도 있다. 다른 대안으로서, 비디오 소스 (18) 는 소스 비디오로서 컴퓨터 그래픽-기반 데이터를 생성하거나, 실시간 비디오, 저장된 비디오, 및 컴퓨터에 의하여 생성된 비디오의 조합을 생성할 수 있다. 몇몇 경우들에서, 비디오 소스 (18) 가 비디오 카메라라면, 소스 디바이스 (12) 및 목적지 디바이스 (14) 는 소위 카메라 전화기들 또는 비디오 전화기들을 형성할 수도 있다. 그러나, 위에서 언급된 바와 같이, 본 개시물에서 설명되는 기법들은 일반적으로 비디오 코딩에 적용될 수도 있으며, 그리고 무선 및/또는 유선 애플리케이션들에 적용될 수도 있다. 각 경우에서, 캡쳐되거나, 사전-캡쳐되거나, 또는 컴퓨터에 의하여 생성된 비디오는 비디오 인코더 (20) 에 의하여 인코딩될 수도 있다. 그러면, 인코딩된 비디오 정보는 통신 표준에 따라서 모뎀 (22) 에 의하여 변조될 수도 있고, 송신기 (24) 를 통하여 목적지 디바이스 (14) 로 송신될 수도 있다. 모뎀 (22) 은 다양한 믹서들, 필터들, 증폭기들 또는 신호 변조를 위하여 설계된 다른 컴포넌트들을 포함할 수도 있다. 송신기 (24) 는 데이터를 송신하기 위하여 설계된, 증폭기들, 필터들, 및 하나 이상의 안테나들을 포함하는 회로들을 포함할 수도 있다.
목적지 디바이스 (14) 의 수신기 (26) 는 채널 (16) 을 통해 정보를 수신하며, 모뎀 (28) 은 이 정보를 복조한다. 다시 한 번, 위에서 설명된 비디오 인코딩 프로세스는 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하기 위한, 본 명세서에서 설명되는 하나 이상의 기법들을 구현할 수도 있다. 채널 (16) 을 통해 통신되는 정보는 비디오 인코더 (20) 에 의하여 정의되는 구문 정보 (syntax information) 를 포함할 수도 있는데, 이것도 역시 비디오 디코더 (30) 에 의해서도 이용될 수도 있으며, 그리고, 예를 들어 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 가지는지, 즉, 그 성분이 코딩되는지의 여부, 및 그 TU가 서브-TU들로 스플릿되는지의 여부를 기술하는 구문 엘리먼트들을 포함할 수도 있다. 비디오 디코더 (30) 는 이러한 구문 정보 및 비트스트림 내의 다른 데이터를 이용하여 인코딩된 비트스트림을 디코딩하고, 그리고 디코딩된 정보를 디스플레이 디바이스 (32) 로 건네준다. 그 다음, 디스플레이 디바이스 (32) 는 사용자에게 디코딩된 비디오 데이터를 디스플레이하는데, 음극선관 (CRT), 액정 디스플레이 (LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (OLED) 디스플레이, 또는 다른 타입들의 디스플레이 디바이스와 같은 방대한 디스플레이 디바이스들 중 임의의 것을 포함할 수도 있다.
도 1 의 예에서, 통신 채널 (16) 은 무선 주파수 (radio frequency; RF) 스펙트럼 또는 하나 이상의 물리적 송신선들과 같은 임의의 무선 또는 유선 통신 매체를 포함하거나 무선 및 유선 매체의 임의의 조합을 포함할 수도 있다. 통신 채널 (16) 은 근거리 통신망, 광역 통신망, 또는 인터넷과 같은 글로벌 네트워크와 같은 패킷-기반 네트워크의 일부를 구성할 수도 있다. 통신 채널 (16) 은 일반적으로 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로 비디오 데이터를 송신하기 위한, 무선 또는 유선 매체의 임의의 적합한 조합을 포함하는 임의의 적합한 통신 매체 또는 상이한 통신 매체들의 조합을 나타낸다. 통신 채널 (16) 은 라우터들, 스위치들, 기지국들, 또는 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로의 통신을 용이화하는데 유용할 수도 있는 임의의 다른 장비를 포함할 수도 있다.
비디오 인코더 (20) 및 비디오 디코더 (30) 는 ITU-T H.264 표준과 같은 비디오 압축 표준에 따라서 동작할 수도 있는데, 이 표준은 또는 MPEG 4, 파트 10, 고급 비디오 코딩 (Advanced Video Coding; AVC) 이라고도 지칭된다. 그러나, 본 개시물의 기법들은 임의의 특정한 코딩 표준에 한정되지 않는다. 다른 예들은 MPEG-2, ITU-T H.263, 및 대두하는 고 효율 비디오 코딩 (High Efficiency Video Coding; HEVC) 을 포함한다. 일반적으로, 본 개시물의 기법들은 HEVC에 대하여 설명되는데, 하지만 이러한 기법들이 다른 비디오 코딩 표준들과도 역시 연계하여 이용될 수도 있다는 것이 이해되어야 한다. 비록 도 1 에는 도시되지 않지만, 몇몇 양태들에서는 비디오 인코더 (20) 및 비디오 디코더 (30) 는 각각 오디오 인코더 및 디코더와 통합될 수도 있으며, 그리고 공통 데이터 스트림 또는 개별 데이터 스트림 내의 오디오 및 비디오 모두의 인코딩을 핸들링하기 위한 적절한 MUX-DEMUX 유닛들, 또는 다른 하드웨어 및 소프트웨어를 포함할 수도 있다. 적용가능하다면, MUX-DEMUX 유닛들은 ITU H.223 멀티플렉서 프로토콜 또는 사용자 데이터그램 프로토콜 (user datagram protocol; UDP) 과 같은 다른 프로토콜들을 따를 수도 있다.
비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 다양한 적합한 인코더 및 디코더 회로 중 임의의 것으로서 구현될 수도 있는데, 예컨대 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서들 (DSPs), 주문형 집적회로들 (ASICs), 필드 프로그램가능 게이트 어레이들 (FPGAs), 이산 로직, 소프트웨어, 하드웨어, 펌웨어, 또는 이들의 조합으로서 구현될 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 하나 이상의 인코더들 또는 디코더들 내에 포함될 수도 있는데, 이들 중 하나는 개별 카메라, 컴퓨터, 모바일 디바이스, 가입자 디바이스, 브로드캐스트 디바이스, 셋탑 박스, 서버 등 내의 조합된 인코더/디코더 (CODEC) 의 일부로서 통합될 수도 있다.
통상적으로, 비디오 시퀀스는 일련의 비디오 프레임들을 포함한다. 픽쳐들의 그룹 (GOP) 은 일반적으로 일련의 하나 이상의 비디오 프레임들을 포함한다. GOP는 GOP 내에 포함되는 다수의 프레임들을 설명하는 구문 데이터를 GOP의 헤더 내에, GOP의 하나 이상의 프레임들의 헤더 내에, 또는 다른 곳에 포함할 수도 있다. 각각의 프레임은 개별 프레임에 대한 인코딩 모드를 기술하는 프레임 구문 데이터를 포함할 수도 있다. 통상적으로, 비디오 인코더 (20) 는 비디오 데이터를 인코딩하기 위하여 개별 비디오 프레임들 내의 비디오 블록들에 대해 동작한다. 각각의 비디오 프레임은 복수의 슬라이스들, 즉, 비디오 프레임의 부분들을 포함할 수도 있다. 각 슬라이스는 복수의 비디오 블록들 (예를 들어, LCU들) 을 포함할 수도 있는데, 이들 각각은 서브-블록들 (예를 들어, 서브-CU들) 이라고도 지칭되는 더 작은 블록들로 파티셔닝될 수도 있다. ITU-T H.264 표준에 따르면, 비디오 블록은 매크로블록 또는 매크로블록의 파티션에 대응할 수도 있다. HEVC에 따르면, 비디오 블록은 CU, 또는 CU의 파티션에 대응할 수도 있다. 일반적으로, LCU들 및 이들의 서브-CU들 (즉, CU 쿼드트리의 임의의 CU) 은 "CU"로 지칭될 수도 있다.
특정한 코딩 표준에 의존하여, 비디오 블록들은 다양한 "NxN" 서브-블록 사이즈들, 예컨대 16x16, 8x8, 4x4, 2x2 및 기타 등등으로 파티셔닝될 수도 있다. 비디오 인코더 (20) 는 각 블록을 재귀적으로, 즉, 2Nx2N 블록을 네 개의 NxN 블록들로 파티셔닝하고, 그리고 NxN 블록들 중 임의의 것 또는 전부를 네 개의 (N/2) x (N/2) 블록들로 파티셔닝하는 등을 할 수도 있다. 본 개시물에서, "NxN" 및 "N 바이 N" 이란 상호 교환가능하도록 이용되어 수직 및 수평 차원들의 관점에서의 블록의 픽셀 크기들을 지칭할 수도 있으며, 예를 들어 16x16 픽셀들 또는 16 바이 16 픽셀들이라고 사용될 수 있다. 일반적으로, 16x16 블록은 수직 방향으로 16 개의 픽셀들을 (y = 16) 그리고 수평 방향으로 16 개의 픽셀들 (x = 16) 을 가질 것이다. 마찬가지로, NxN 블록은 일반적으로 수직 방향으로 N 개의 픽셀들을 그리고 수평 방향으로 N개의 픽셀들을 가지는데, 여기서 N은 음이 아닌 정수 값을 나타낸다. 한 블록 내의 픽셀들은 행들 및 열들로 배열될 수도 있다. 또한, 블록들은 반드시 수직 방향과 동일한 개수의 픽셀들을 수평 방향에서 가질 필요가 없다. 예를 들어, 블록들은 NxM 픽셀들을 가질 수도 있는데, 여기서 M은 N과 동일할 필요가 없다. 일 예로서, ITU-T H.264 에서는 사이즈가 16x16 픽셀들인 블록들이 매크로블록들로서 지칭될 수도 있고, 그리고 16x16 픽셀들보다 더 적은 블록들이 16 바이 16 매크로블록의 파티션들로서 지칭될 수도 있다. 다른 표준들에서는, 블록들은 그들의 크기에 대하여 더 일반적으로, 예를 들어, 각각이 고정된 사이즈가 아니라 변동하는 사이즈를 가지는 CU들 및 그들의 파티션들로서 정의될 수도 있다.
비디오 블록들은, 예를 들어 이산 코사인 변환 (DCT), 정수 변환, 웨이블릿 변환, 또는 개념적으로 유사한 변환과 같은 변환을, 주어진 비디오 블록에 대한 잔여 데이터에 적용하는 것에 후속하여, 픽셀 도메인에 픽셀 데이터의 블록들을, 또는 변환 도메인에 변환 계수들의 블록들을 포함할 수도 있는데, 여기서 잔여 데이터는 블록에 대한 비디오 데이터 및 그 블록에 대하여 생성된 예측성 데이터 간의 픽셀 차분들을 나타낸다. 몇몇 경우들에서는, 비디오 블록들은 변환 도메인에 양자화된 변환 계수들의 블록들을 포함할 수도 있는데, 여기에서 주어진 비디오 블록에 대한 잔여 데이터에 변환을 적용하는 것에 후속하여, 결과적으로 초래되는 변환 계수들도 역시 양자화된다.
일반적으로, 비디오 인코더 (20) 는 블록을 블록 파티셔닝 프로세스에 따라서 서브-블록들로 파티셔닝한다. 예를 들어, 비디오 인코더 (20) 는, 어느 블록이 고-주파수 변화들 또는 다른 많은 양의 세부사항을 포함하는 경우에는 그 블록을 서브-블록들로 파티셔닝하도록 구성될 수도 있다. 몇몇 예들에서는, 비디오 인코더 (20) 는 블록을 서브-블록들로 파티셔닝할지의 여부를 결정하는 레이트-왜곡 최적화 프로세스를 구현한다. 비디오 데이터를 코딩하기 위하여 더 작은 블록들을 이용하는 것은 세부 사항의 높은 레벨들을 포함하는 블록들에 대한 더 양호한 예측을 초래할 수도 있고, 그러므로 잔여 데이터로서 표현되는 초래되는 에러 (즉, 예측 데이터 및 원본 비디오 데이터 간의 픽셀-바이-픽셀 차분) 을 감소시킬 수도 있다. 비디오 데이터의 각각의 블록은 그 블록에 대한 코딩 정보를 제공하는 데이터의 세트를 포함한다. 이러한 데이터의 세트는 그 블록에 대한 오버헤드로서 간주되는데, 이것은 또한 코딩된 비디오 데이터의 블록에 대한 메타데이터로서 지칭된다. 따라서, 비록 더 작은 블록들이 그 블록들에 대한 더 낮은 잔여 값들을 제공할 수도 있지만, 몇몇 경우들에서는 작은 블록들을 이용하는 장점들이 그 작은 블록들에 대한 헤더 데이터의 오버헤드에 의하여 압도될 수도 있다. 따라서, 비디오 인코더 (20) 는 레이트-왜곡 최적화 프로세스를 수행하도록 구성될 수도 있는데, 여기서 비디오 인코더 (20) 는 에러 (잔여 데이터 또는 왜곡) 에서의 감소를 블록들 각각과 연관된 오버헤드 (비트 레이트) 와 밸런싱하는 최적 (또는 수락가능한) 파티셔닝 기법을 결정하려고 시도한다.
일반적으로, 비디오 블록들이란 부모 블록들 및 그들의 파티션들 (즉, 서브-블록들) 모두를 지칭한다. 일반적으로, 슬라이스는 복수의 비디오 블록들 (예를 들어, LCU들의 세트) 을 포함하는데, 이들 중 임의의 것 또는 전부는, 재귀적인 방식으로 더 파티셔닝될 수도 있는 서브-블록들 (예를 들어 서브-CU들) 로 파티셔닝될 수도 있다. 각각의 슬라이스는 비디오 데이터의 독립적으로 디코딩가능한 유닛에 대응할 수도 있다. 대안적으로는, 프레임들 자체들이 디코딩가능한 유닛들에 대응할 수도 있고, 또는 프레임의 다른 부분들이 디코딩가능한 유닛들로서 정의될 수도 있다. 용어 "코딩된 유닛"은 비디오 데이터의 임의의 독립적으로 디코딩가능한 유닛, 예컨대 전체 프레임, 프레임의 슬라이스, 시퀀스라고도 지칭되는 픽쳐들의 그룹 (GOP), 또는 적용가능한 코딩 기법들에 따라서 정의되는 다른 독립적으로 디코딩가능한 유닛을 지칭할 수도 있다.
현재 고효율 비디오 코딩 (High Efficiency Video Coding; HEVC) 이라고 지칭되는 새로운 비디오 코딩 표준을 개발하기 위한 노력들이 현재 진행 중에 있다. 대두되는 HEVC 표준은 또한, H.265 라고도 지칭된다. 표준화 노력들은 HEVC 테스트 모델 (HM) 이라고 지칭되는 비디오 코딩 디바이스의 모델에 기초한다. HM은 예를 들어, ITU-T H.264/AVC에 따르는 디바이스들보다 우수한 비디오 코딩 디바이스들의 수 개의 성능들을 상정한다. 예를 들어, H.264 가 9 개의 인트라-예측 인코딩 모드들을 제공하는 반면에, HM은, 예를 들어 인트라-예측 코딩되는 중인 블록의 사이즈에 기초하여 35 개만큼 많은 인트라-예측 인코딩 모드들을 제공한다.
HM은 비디오 데이터의 블록을 CU로서 지칭한다. CU는, 압축을 위하여 다양한 코딩 툴들이 적용되는 기본 유닛 (basic unit) 으로서 기능하는 2Nx2N 픽셀 이미지 영역을 지칭할 수도 있다. CU는 개념적으로 H.264/AVC의 매크로블록과 유사하다. 비트스트림 내의 구문 데이터는 LCU를 정의할 수도 있는데, 이것은 특정 유닛 (예를 들어, 슬라이스, 프레임, GOP, 또는 LCU들을 포함하는 비디오 데이터의 다른 유닛) 에 대한 픽셀들의 수의 관점에서 최대 CU이다. 일반적으로, CU는, CU가 사이즈 구분을 가지지 않는다는 것을 제외하고는 H.264 의 매크로블록과 유사한 목적을 가진다. 따라서, 일반적으로 임의의 CU는 서브-CU들로 파티셔닝되거나 또는 스플릿될 수도 있다. 특정 CU를 생성하기 위해 LCU가 파티셔닝되는 횟수는 그 CU의 파티션 레벨, 분해 레벨 (decomposition level) 또는 "깊이" 라고 지칭될 수도 있다. 몇몇 경우들에서는, 구문 데이터는 LCU에 대한 최대 파티션 레벨을 정의하고, 그 다음 그 LCU에 대하여 발생될 수 있는 가장 작게 사이즈 결정된 CU (smallest sized CU; SCU) 를 한정할 수도 있다.
일반적으로, 본 개시물 내에서 CU라고 지칭하는 것들은 비디오 데이터의 LCU, 또는 LCU의 서브-CU를 지칭할 수도 있다. LCU는 서브-CU들로 스플릿될 수도 있고, 그리고 각각의 서브-CU는 서브-CU들로 더 스플릿될 수도 있는 등이다. 위에서 설명된 바와 같이, 비트스트림에 대한 구문 데이터는 LCU가 스플릿될 수도 있는 최대 횟수를 정의할 수도 있는데, 이것이 최대 파티션 레벨이라고 지칭될 수도 있다. 위에서 설명된 바와 같이, 비트스트림은 또한 SCU를 정의할 수도 있다. 또한, 본 개시물은 용어 "블록"을 이용하여, CU, CU의 예측 유닛 (prediction unit; PU), 또는 CU의 변환 유닛 (transform unit; TU) 중 임의의 것을 지칭한다. PU들 및 TU들은 아래에서 더 상세하게 설명된다.
LCU는 어떻게 그 LCU가 파티셔닝되는지를 표시하는 쿼드트리 데이터 구조와 연관될 수도 있다. LCU와 연관된 쿼드트리 데이터 구조는 CU 쿼드트리라고 지칭될 수도 있다. 일반적으로, CU 쿼드트리는 LCU의 CU 당 하나의 노드를 포함하는데, 여기에서 루트 노드가 LCU에 대응하고 다른 노드들은 그 LCU의 서브-CU들에 대응한다. 만일 주어진 CU가 4 개의 서브-CU들로 스플릿된다면, 그 스플릿된 CU에 대응하는 쿼드트리 내의 노드는 4 개의 자식 노드들을 포함하는데, 이들 각각은 서브-CU들 중 하나에 대응한다. 쿼드트리 데이터 구조의 각각의 노드는 대응하는 CU에 대한 구문 정보를 제공할 수도 있다. 예를 들어, 쿼드트리 내의 노드는 대응하는 CU에 대한 스플릿 플래그를 포함할 수도 있는데, 이것은 그 CU가 네 개의 서브-CU들로 스플릿되는지의 여부를 표시한다. 주어진 CU에 대한 구문 정보는 재귀적으로 정의될 수도 있고, 그리고 그 CU가 서브-CU들로 스플릿되는지의 여부에 의존할 수도 있다.
스플릿되지 않는 CU (즉, 말단에 대응하는 CU, 또는 개별 CU 쿼드트리 내의 "리프" 노드) 는 하나 이상의 예측 유닛들 (PUs) 을 포함할 수도 있다. 일반적으로, PU는 대응하는 CU의 전부 또는 일부를 나타내고, 그리고 그 CU에 대한 예측을 수행하기 위한 목적들을 위하여 그 PU에 대한 참조 샘플을 취출하기 위한 데이터를 포함한다. 예를 들어, CU가 인트라-모드 인코딩되는 경우에는, PU는 그 PU에 대한 인트라-예측 모드를 기술하는 데이터를 포함할 수도 있다. 다른 예로서, CU가 인터-모드 인코딩된다면, PU는 PU에 대한 모션 벡터를 정의하는 데이터를 포함할 수도 있다. 모션 벡터를 정의하는 데이터는, 예를 들어 모션 벡터의 수평 컴포넌트, 모션 벡터의 수직 컴포넌트, 모션 벡터에 대한 해상도 (예를 들어, 1/4 픽셀 정밀도 또는 1/8 픽셀 정밀도), 그 모션 벡터가 가리키는 참조 프레임, 및/또는 그 모션 벡터에 대한 참조 리스트 (예를 들어, 리스트 0 또는 리스트 1) 를 기술할 수도 있다. 또한, CU의 하나 이상의 PU들을 정의하는, 그 CU에 대한 데이터는, 예를 들어 그 CU를 하나 이상의 PU들로 파티셔닝하는 것을 기술할 수도 있다. 파티셔닝 모드들은 CU가 코딩되지 않는지, 인트라-예측 모드 인코딩되는지, 또는 인터-예측 모드 인코딩되는지의 여부 간에서 상이할 수도 있다.
또한, 리프 노드 CU는 하나 이상의 변환 유닛들 (TUs) 을 포함할 수도 있다. 하나 이상의 PU들을 이용한, CU에 대한 예측에 후속하여, 위에서 설명된 바와 같이, 비디오 인코더 (20) 는 하나 이상의 PU들에 대응하는 CU의 개별 부분들에 대한 하나 이상의 잔여 블록들을 연산할 수도 있다. 잔여 블록들은 그 CU에 대한 비디오 데이터 및 하나 이상의 PU들에 대한 예측된 데이터 간의 픽셀 차분을 나타낼 수도 있다. 일반적으로, TU는 그 CU에 대한 잔여 블록들의 전부 또는 일부를 나타내고, 그리고 대응하는 잔여 블록 데이터를 변환하고 양자화하기 위한 데이터를 포함하는데, 여기서 잔여 블록은 잔여 데이터를 이용하여 표현된다. 예를 들어, 비디오 인코더 (20) 는 잔여 데이터를 변환 계수들로 변환하고, 그리고 TU들의 변환 계수들을 양자화하고, 그리고 스캔하여 양자화된 변환 계수들의 세트를 형성할 수도 있다. TU는 반드시 PU의 사이즈로 한정될 필요는 없다. 따라서, TU들은 동일한 CU에 대한 대응하는 PU들보다 더 클 수도 또는 더 작을 수도 있다. 몇몇 예들에서는, TU의 최대 사이즈는 대응하는 CU의 사이즈에 대응할 수도 있다.
비디오 데이터의 CU는 대응하는 비디오 데이터의 휘도 성분 (Y), 제 1 색차 성분 (U), 및 제 2 색차 성분 (V) 각각을 포함할 수도 있다. 따라서, CU에 대한 예측 및 변환이, PU들 및 TU들에 대하여 위에서 설명된 바와 같이, 비디오 데이터의 주어진 CU의 Y, U, 및 V 성분들 각각에 대하여 수행될 수도 있다. 몇몇 예들에서는, 예측 정보 (예를 들어, 예측 모드 (인트라- 또는 인터-예측) 및 그들의 특징들 (예를 들어, 특정한 인트라-예측 모드 또는 모션 벡터)) 은 휘도 (Y) 성분에 대하여 결정되고, 그리고 색차 (U 그리고 V) 성분들에 대하여 재이용될 수도 있다. 이와 같이, CU의 주어진 TU에 대하여, TU의 잔여 데이터의 계수들은 그 TU의 Y, U, 및 V 성분들에 대한 잔여 데이터의 계수들이라고 지칭될 수도 있다. 즉, 결정된 예측 정보가 TU의 성분들 각각에 적용되어 그 성분들 각각에 대한 잔여 데이터의 개별 블록들을 형성할 수도 있는데, 여기에서, 잔여 데이터의 블록들은 픽셀-바이-픽셀 차분들을 나타내는 계수들을 포함한다. 후속하여, 잔여 데이터가 변환되고 그리고 양자화되어, 그 TU의 Y, U, 및 V 성분들 각각에 대한 양자화된 변환 계수들의 블록들을 형성할 수도 있다.
리프-노드 CU는 CU의 하나 이상의 TU들의 파티셔닝을 정의하는 변환 쿼드트리 데이터 구조를 더 포함할 수도 있다. 변환 쿼드트리 데이터 구조는 LCU에 대하여 위에서 설명된 CU 쿼드트리와 실질적으로 유사한 방식으로 CU의 TU들에 대한 파티션 정보를 표시할 수도 있다. 예를 들어, 변환 쿼드트리 데이터 구조는 어떻게 CU의 최대 TU가 서브-TU들로 파티셔닝되는지를 정의할 수도 있다. 몇몇 예들에서는, 변환 쿼드트리 데이터 구조는 "잔여 쿼드트리 변환 (residual quadtree transform; RQT)" 이라고 지칭될 수도 있다. RQT의 각각의 노드는, 그 노드에 대응하는 TU의 성분 (예를 들어, Y, U, V) 가 적어도 하나의 비-제로 계수를 가지는지, 즉, 코딩되는지의 여부, 및 TU가 서브-TU들로 스플릿되는지의 여부를 기술하는 구문 정보를 포함할 수도 있다. 이러한 구문 정보는, 위에서 설명된 바와 같이 일반적으로 그 TU에 대한 CBF 및 TSF 구문 엘리먼트들에 대응한다. 일반적으로, RQT에 따라서 서브-TU들로 스플릿되는 TU는 서브-TU들의 부모 TU로서 지칭될 수도 있고, 그리고 서브-TU들은 TU의 자식 TU들로서 지칭될 수도 있다. 추가적으로, 서브-TU들이 서로의 형제 (sibling) TU들이라고 지칭될 수도 있다. RQT에 따라서 서브-TU들로 스플릿되지 않는 TU들은 RQT의 리프-노드 TU들로서 지칭될 수도 있다.
다른 예들에서는, 본 개시물의 기법들에 따라서, CU의 TU는 균일한 파티션 구조에 따라서 파티셔닝될 수도 있는데, 이것은 도 5c 를 참조하여 아래에서 더 상세하게 설명된다. 이러한 예들에서는, TU는 CU의 최대 TU, 또는 그 CU의 최대 TU의 서브-TU일 수도 있다. CU의 최대 TU는 RQT 및 균일한 파티션 구조 모두에 따라서 서브-TU들로 파티셔닝될 수도 있다. 일 예로서, 최대 TU는 RQT에 따라서 서브-TU들로 파티셔닝될 수도 있고, 그리고 서브-TU들 중 하나 이상은 균일한 파티션 구조에 따라서 다른 서브-TU들로 파티셔닝될 수도 있다. 다른 예로서, 최대 TU는 균일한 파티션 구조에 따라서 전체적으로 파티셔닝될 수도 있다. 또 다시, 균일한 파티션 구조에 따라서 서브-TU들로 스플릿되는 TU는 서브-TU들의 부모 TU로서 지칭될 수도 있고, 그리고 서브-TU들은 TU의 자식 TU들로서, 그리고 서로의 형제 TU들로서 지칭될 수도 있다. 또한, 서브-TU들은 다른 서브-TU들로 스플릿되지 않을 수도 있고, 그리고 위에서 설명된 바와 같이 RQT 및 균일한 파티션 구조를 이용하여 또는 균일한 파티션 구조만을 이용하여 정의되든지, 따라서 그 CU에 대한 TU 파티션 구조의 리프-노드 TU들을 나타낼 수도 있다.
RQT에 대하여 위에서 설명된 것과 유사한 방식으로, 균일한 파티션 구조에 따라서 파티셔닝된 TU의 각각의 서브-TU는 서브-TU의 성분 (예를 들어, Y, U, 또는 V) 이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 기술하는 구문 정보를 포함할 수도 있다. 위에서 설명된 바와 같이, 이러한 구문 정보는 일반적으로 서브-TU에 대한 CBF에 대응하는데, 이것은 간단히 TU라고 지칭될 수도 있다. 추가적으로, TU의 서브-TU들에 대하여, 어떻게 TU가 서브-TU들로 스플릿되는지를 총괄적으로 기술하는 구문 정보가 존재할 수도 있다. 다시 말하면, 구문 정보는 각각의 서브-TU의 사이즈 및 균일한 파티션 구조에 따라서 TU를 스플릿하는 것으로부터 얼마나 많은 서브-TU들이 초래되는지를 표시할 수도 있다. 예를 들어, 서브-TU들에 대한 이러한 구문 정보는 TU 내에 포함될 수도 있다.
몇몇 예들에서는, 비디오 데이터의 CU의 TU에 대한 CBF 및 TSF 구문 엘리먼트들은, 이전에 설명된 바와 같이, 각각 단일-비트 값, 예를 들어 단일-비트 플래그를 이용하여 표현될 수도 있다. 위에서 설명된 RQT 파티셔닝 구조의 예를 참조하면, 몇몇 경우들에서는, TU의 Y, U, 및 V 성분들에 대응하는 모든 3 개의 CBF들이 그 TU와 연관된 RQT의 대응하는 노드 내에 포함될 수도 있다. 다른 경우들에서는, CBF들 중 하나 이상의 값들이 추론될 수 있는 경우에는 오직 CBF들의 서브세트만이 그 노드 내에 포함될 수도 있다.
일반적으로, 본 개시물의 기법들에 따르면, TU의 성분에 대한 CBF의 값은, 그 TU의 부모 TU의 동일한 성분에 대한 CBF의 값이 부모 TU의 성분이 코딩되지 않는다 (즉, 임의의 비-제로 계수들을 포함하지 않는다) 는 것을 표시하는 경우에 추론될 수 있다. 이 경우, 부모 TU의 각 자식 TU의 동일한 성분에 대한 CBF의 값은, 개별 성분이 코딩되지 않는다는 것을 표시하도록 추론될 수 있다. 추가적으로, TU의 성분에 대한 CBF의 값도 역시, 그 TU의 부모 TU의 동일한 성분에 대한 CBF의 값이 부모 TU의 성분이 코딩된다 (즉, 적어도 하나의 임의의 비-제로 계수들을 포함한다) 는 것을 표시하는 경우, 그리고 그 부모 TU의 모든 다른 자식 TU의 동일한 성분에 대한 CBF의 값이 개별 성분이 코딩되지 않는다는 것을 표시하는 경우에 추론될 수 있다. 이 경우, TU의 성분에 대한 CBF의 값은 그 성분이 코딩된다는 것을 표시하도록 추론될 수 있다.
또 다른 경우들에서는, 예를 들어 TU에 대한 TSF의 값이 추론될 수 있는 경우에는, TU에 대한 CBF들만이 RQT의 대응하는 노드 내에 포함될 수도 있다. 일반적으로, 본 개시물의 기법들에 따르면, TU에 대한 TSF의 값은, TU가 CU에 대한 최대 허용 사이즈, 예를 들어 CU에 대한 변환의 최대 허용 사이즈보다 더 큰 사이즈를 가질 경우에 추론될 수 있다. 이 경우, TU에 대한 TSF의 값은 그 TU가 서브-TU들로 스플릿된다는 것을 표시하도록 추론될 수도 있다. 마찬가지로, TU에 대한 TSF의 값 또한, 그 TU가 CU에 대한 최소-사이즈의 TU, 예를 들어 CU에 대한 변환의 최소 허용 사이즈에 대응하는 경우에 추론될 수 있다. 이 경우, TU에 대한 TSF의 값은 그 TU가 서브-TU들로 스플릿되지 않는다는 것을 표시하도록 추론될 수도 있다. 비디오 데이터의 CU의 TU에 대한 CBF 또는 TSF 구문 엘리먼트에 대한 값을 추론하는 것이, 본 개시물 전체에서 구문 엘리먼트 자체를 추론하는 것으로서 지칭될 수도 있다는 점에 주의하여야 한다.
또한, 몇몇 경우들에서는, CU의 TU의 Y, U, 및 V 성분들은, 예를 들어 각각의 성분에 대응하는 RQT 및/또는 균일한 파티션 구조에 따라서 개별적으로 파티셔닝될 수도 있다. 이러한 경우들에서는, TSF는 TU의 Y, U, 및 V 성분들의 각각에 대응하는 RQT의 노드 내에 제공될 수도 있다. 또한, TU를 균일한 파티션 구조에 따라서 스플릿하는 것으로부터 얼마나 많은 서브-TU들이 초래되는지를 표시하는 구문 정보가 Y, U, 및 V 성분들 각각에 대한 TU에 대하여 제공될 수도 있다.
다른 예들에서는, CU의 TU의 Y, U, 및 V 성분들은 함께 즉, 공통 RQT 및/또는 균일한 파티션 구조에 따라서 파티셔닝될 수도 있다. 이러한 예들에서, 단일 TSF가 RQT의 대응하는 노드 내의 CU의 주어진 TU에 대하여 포함될 수도 있다. 마찬가지로, TU를 균일한 파티션 구조에 따라서 스플릿하는 것으로부터 얼마나 많은 서브-TU들이 초래되는지를 표시하는 구문 정보가 Y, U, 및 V 성분들 모두에 대한 TU에 대하여 포함될 수도 있다.
예측성 데이터 및 잔여 데이터를 생성하기 위한 인트라-예측성 또는 인터-예측성 인코딩에 후속하여, 그리고 변환 계수들을 생성하기 위한 임의의 변환들 (예컨대 H.264/AVC 또는 이산 코사인 변환 (DCT) 에서 이용되는 것들과 유사한 4x4 또는 8x8 정수 변환들) 에 후속하여, 비디오 인코더 (20) 는 변환 계수들을 양자화할 수도 있다. 양자화는 일반적으로 변환 계수들이 양자화되어 계수들을 나타내기 위하여 이용되는 데이터의 양을 감소시키는 것이 가능한 프로세스를 지칭한다. 양자화 프로세스는 계수들 중 몇 개 또는 모든 것들과 연관되는 비트 깊이를 감소시킬 수도 있다. 예를 들어, n-비트 값이 양자화 도중에 m-비트 값으로 내림 (round down) 될 수도 있는데, 여기에서 n m 보다 더 크다.
양자화에 후속하여, 양자화된 데이터의 엔트로피 코딩이, 예를 들어 콘텍스트 적응 가변 길이 코딩 (context adaptive variable length coding; CAVLC), 콘텍스트 적응 이진 연산 코딩 (context adaptive binary arithmetic coding; CABAC), 또는 다른 엔트로피 코딩 방법론에 따라서 수행될 수도 있다. 엔트로피 코딩을 위하여 구성된 처리 유닛, 또는 다른 처리 유닛은, 코딩된 블록 패턴 (coded block pattern; CBP) 값들, 매크로블록 타입, 코딩 모드, 코딩된 유닛 (예컨대 프레임, 슬라이스, 매크로블록, 또는 시퀀스) 에 대한 최대 매크로블록 사이즈, 등과 같은 구문 정보의 생성 및/또는 양자화된 계수들의 제로 런 길이 코딩과 같은 다른 처리 기능들을 수행할 수도 있다. 몇몇 코딩 표준들에 따라서, 이러한 구문 정보는, 이전에 설명된 바와 같이, 예를 들면 RQT을 이용하여 표현되는, 비디오 데이터의 CU의 TU에 대한 CBF 및 TSF 구문 엘리먼트들을 포함할 수도 있다.
최근, 비디오 코딩의 초점이 고선명 비디오 및 개선된 압축으로 천이되면서, 더 양호한 코딩 효율을 획득하기 위해 더 많고 점점 더 복잡한 예측 모드들이 도입되어, 이것이 비디오 데이터의 코딩된 CU들에 대한 더 정교한 PU 및 TU 파티셔닝 방식들을 야기하고 있다. 본 개시물은, 이전에 설명된 바와 같이, 예를 들어 RQT를 이용하여 표시된 TU 파티션 정보가 시그널링되는 수단이 되는, 효율성을 개선하기 위한 기법들을 제공한다.
예를 들어, CU의 각각의 TU에 대한 개별 CBF들 및 TSF들을 제공하는 대신, 몇몇 예들에서는 비디오 인코더 (20) 는 CU의 주어진 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩 할 수도 있다. 마찬가지로, 다른 예들에서는 비디오 디코더 (30) 는 비디오 디코더 (30) 가 TU에 대한 하나 이상의 CBF들 및 TSF를 결정할 수도 있는 원천이 되는 단일 값을 수신하도록 구성될 수도 있다. 예를 들어, 하나 이상의 CBF들 및 TSF는 그 TU에 대응하는 RQT의 노드 내에 포함될 수도 있다.
마찬가지로, 몇몇 예들에서는, 비디오 인코더 (20) 는 CU의 주어진 TU의 서브-TU들에 대한 CBF들 또는 TSF들을 공동으로 인코딩할 수도 있다. 마찬가지로, 또 다른 예들에서는, 비디오 디코더 (30) 는 비디오 디코더 (30) 가 서브-TU들에 대한 CBF들 또는 TSF들을 결정할 수도 있는 원천이 되는 단일 값을 수신하도록 구성될 수도 있다. 몇몇 경우들에서는, CBF들 또는 TSF들은 서브-TU들에 대응하는 RQT의 다중 노드들 내에 포함될 수도 있다.
어떠한 경우에서도, TU에 대한 CBF들 및 TSF의 하나 이상의 값이 추론될 수 있는 경우에는, CBF들 및 TSF는 그 TU에 대한 나머지 CBF들 및/또는 TSF와 함께 공동으로 코딩될 필요가 없다. 마찬가지로, 서브-TU들에 대한 CBF들 또는 TSF들 중 하나 이상의 값이 추론될 수 있는 경우에는, CBF들 또는 TSF들은 그 서브-TU들에 대한 나머지 CBF들 또는 TSF들과 함께 공동으로 코딩될 필요가 없다. 이러한 방식으로, 추론될 수 없는 CBF들 및 TSF들만이 다른 CBF들 및/또는 TSF들과 함께 공동으로 코딩된다.
몇몇 예들에서는, 비디오 인코더 (20) 는 TU에 대한 하나 이상의 CBF들 및 TSF를 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있다. 이러한 예들에서는, 비디오 디코더 (30) 가 수신하도록 구성될 수도 있는 단일 값은 VLC 코드워드를 포함할 수도 있는데, 이것을 비디오 디코더 (30) 가 디코딩하여 TU에 대한 하나 이상의 CBF들 및 TSF를 결정할 수도 있다. 마찬가지로, 다른 예들에서는, 비디오 인코더 (20) 는 서브-TU들에 대한 CBF들 또는 TSF들도 역시 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있다. 일 예로서, 비디오 인코더 (20) 는, 각각의 서브-TU에 대한 CBF들 중 어느 것도 코딩되지 않는다면, 즉, 그 서브-TU들에 대한 CBF들의 값들이 추론된다면, 서브-TU들에 대한 TSF들을 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있다. 다른 예로서, 비디오 인코더 (20) 는, 각각의 서브-TU의 색차 성분들에 대한 CBF들 중 어느 것도 코딩되지 않는다면, 즉, 서브-TU들의 색차 성분들에 대한 CBF들의 값들이 추론된다면, 그리고 서브-TU들 각각에 대한 TSF가 역시 코딩되지 않는다면, 즉, 서브-TU들에 대한 TSF들의 값들이 역시 추론된다면, 서브-TU들 각각의 Y 성분에 대한 CBF들을 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있다. 또 다시, 이러한 예들에서는, 비디오 디코더 (30) 가 수신 하도록 구성될 수도 있는 단일 값은 VLC 코드워드를 포함할 수도 있고, 이것을 비디오 디코더 (30) 가 디코딩하여 서브-TU들에 대한 CBF들 또는 TSF들을 결정할 수도 있다.
이전에 설명된 바와 같이, 본 개시물의 기법들에 따르면 추론될 수 없는 CBF들 및 TSF들만이 다른 CBF들 및/또는 TSF들과 함께 공동으로 코딩된다. 추가적으로, 추론될 수 없는 CBF들 및 TSF들이 VLC 코드워드들을 이용하여 공동으로 코딩되는 경우에는, 어떤 CBF들 및 TSF들 추론될 수 있는지에 의존하여 상이한 VLC 테이블들이 이용될 수도 있다. 예를 들어, 본 개시물의 기법들에 따르면, TU에 대한 "플래그 패턴" 이, 그 TU에 대한 TSF 및 CBF들 중 하나 이상이 추론될 수 있는지의 여부에 의존하여, 그 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하기 위한 상이한 VLC 테이블들을 선택하기 위하여 이용될 수도 있다. 또한, 본 개시물의 기법들에 따르면, TU의 서브-TU들 각각에 대한 플래그 패턴이, 그 서브-TU들에 대한 TSF 및 CBF들 중 하나 이상이 추론될 수 있는지의 여부에 의존하여, 그 서브-TU들에 대한 CBF들 또는 TSF들을 공동으로 코딩하기 위한 상이한 VLC 테이블들을 선택하기 위하여 이용될 수도 있다.
예를 들어, TU의 서브-TU를 포함하는, TU에 대한 플래그 패턴이 그 TU에 대한 TSF 추론가능 플래그, 및 그 TU의 부모 TU의 Y, U, 및 V 성분들에 대한 CBF들을 포함한다고 처음에 결정될 수도 있다. 예를 들어, TU에 대한 TSF 추론가능 플래그는, 그 TU에 대한 TSF가 이전에 설명된 기법들을 이용하여 추론될 수 있는 지의 여부를 표시할 수도 있다. 이와 같이, 플래그 패턴은 4 개의 단일-비트 값들, 예를 들어 4 개의 단일-비트 플래그들을 이용하여 표현될 수도 있다. TU에 대한 하나 이상의 CBF들 및 TSF를 코딩하기 위한 특정한 VLC 테이블을 선택하기 위하여, 이전에 설명된 바와 같이, TU들에 대한 CBF들 및 TSF들을 추정하는 데에 적용가능한 이전에 설명된 바와 같은 기법들을 이용하여, 하나 이상의 CBF들 및 TSF 중 어느 것이 추론될 수 있고, 따라서, 그 TU에 대한 나머지 CBF들 및/또는 TSF와 함께 공동으로 코딩되지 않는지를 표시하도록 플래그 패턴이 이용될 수도 있다. 마찬가지로, TU의 서브-TU들에 대한 CBF들 또는 TSF들을 코딩하기 위한 특정한 VLC 테이블을 선택하기 위하여, 이전에 설명된 바와 같이, TU들에 대한 CBF들 및 TSF들을 추정하는 데에 적용가능한 이전에 설명된 바와 같은 기법들을 역시 이용하여, 그 서브-TU들에 대한 CBF들 및 TSF들 중 어느 것이 추론될 수 있고, 따라서, 그 서브-TU에 대한 나머지 CBF들 또는 TSF들과 함께 공동으로 코딩되지 않는지를 표시하도록, 서브-TU들 각각에 대한 플래그 패턴이 이용될 수도 있다.
예를 들어, 만일 TU에 대한 주어진 CBF가, 위에서 역시 설명된 바와 같이, 그 TU의 부모 TU에 대한 대응하는 CBF 및, 몇몇 경우들에서는, 그 TU의 형제 TU들에 대한 대응하는 CBF들에 기초하여 추론될 수 있는 경우에는, 플래그 패턴 내의 대응하는 비트 값은 그 추론을 표시하기 위하여 설정될 수도 있다 (예를 들어, "0"). 반면에, 만일 CBF가 추론 될 수 없는 경우에는, 대응하는 비트 값은 이에 상응하여 설정될 수도 있다 (예를 들어, "1"). TU에 대한 플래그 패턴 내의 TSF 추론가능 플래그에 대응하는 비트 값은, 예를 들어 만일 그 TU에 대한 TSF가 추론될 수 있다면 유사한 방식으로 설정될 수도 있는데, TSF 추론가능 플래그의 대응하는 비트 값은 "0" 으로 설정될 수도 있고, 그리고 만일 TSF가 추론 될 수 없다면, TSF 추론가능 플래그의 대응하는 비트 값은 "1" 로 설정될 수도 있다. 이와 같이, TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하는 경우에서는, VLC 테이블이 플래그 패턴에 기초하여 선택되어 그 TU에 에 대한 하나 이상의 CBF들 및 TSF 중 어느 것이 추론될 수 있는지, 그리고 하나 이상의 CBF들 및 TSF 중 어느 것이 공동으로 코딩되는지를 반영할 수도 있다. 마찬가지로, TU의 서브-TU들에 대한 CBF들 또는 TSF들을 공동으로 코딩하는 경우에서는, VLC 테이블은 서브-TU들 각각의 플래그 패턴들에 기초하여 선택되어 서브-TU들에 대한 CBF들 또는 TSF들 중 어느 것이 추론될 수 있는지, 그리고 CBF들 또는 TSF들 중 어느 것이 공동으로 코딩되는지를 반영할 수도 있다.
본 개시물의 기법들은 경험적 시험 도중에 발견된, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지, 즉, 코딩되는지의 여부를 표시하는 정보 및 TU가 서브-TU들로 스플릿되는지의 여부를 표시하는 정보 간의 상관을 활용한다. 일 예로서, 이러한 상관은 비디오 데이터의 CU의 TU의 휘도 성분이 코딩되는지의 여부를 표시하는 정보, 및 TU가 서브-TU들로 스플릿되는지의 여부를 표시하는 정보 간에 존재할 수도 있다. 예를 들어, TU가 서브-TU들로 스플릿되는 경우에는, TU의 휘도 성분이 코딩되는 것이 가능할 수도 있다. 마찬가지로, TU의 휘도 성분이 코딩되지 않는 경우에는, TU가 서브-TU들로 스플릿되지 않는 것이 가능할 수도 있다.
다른 예로서, TU의 각각의 성분이 다른 성분들과는 독립적으로 파티셔닝되는 (즉, 각각의 성분이 고유한 파티션 정보를 포함하는) 경우에서는, 그리고 성분이 코딩되지 않는 경우에는, TU의 성분이 그 성분에 대응하는 서브-TU들로 스플릿되지 않는 것이 가능할 수도 있다. 마찬가지로, TU의 성분이 그 성분에 대응하는 서브-TU들로 스플릿되는 경우에는, TU의 그 성분이 코딩되는 것이 가능할 수도 있다.
좀 더 일반적으로는, TU의 모든 성분들이 동일한 방식으로 파티셔닝되는 (즉, 각각의 성분이 동일한 파티션 정보를 공유하는) 경우에서는, 그리고 성분들이 코딩되지 않는 경우에, TU가 서브-TU들로 스플릿되지 않는 것이 가능할 수도 있다. 마찬가지로, TU가 서브-TU들로 스플릿되는 경우에, 그 TU의 성분들 각각이 코딩되는 것이 가능할 수도 있다.
추가적으로, 이전에 설명된 바와 같이 비디오 데이터의 CU의 동일한 TU의 성분들이 코딩되는지의 여부를 표시하는 정보 사이에도 상관이 또한 존재할 수도 있다. 예를 들어, TU 중 하나의 성분이 코딩되는 경우에는, 그 TU의 다른 성분들도 역시 코딩될 가능성이 있을 수도 있다. 일 예로서, 이러한 상관은 비디오 데이터의 CU의 TU의 색차 성분들이 코딩되는지의 여부를 표시하는 정보 간에 존재할 수도 있다. 예를 들어, TU의 제 1 색차 성분 (예를 들어, U) 가 코딩되는 경우에는, TU의 제 2 색차 성분 (예를 들어, V) 가 코딩될 것이 가능할 수도 있으며, 그리고 그 반대의 경우도 마찬가지이다.
이러한 기법들은 발견된 상관을 활용하여, 구문 엘리먼트들에 의하여 표현되는 정보를 공동으로 코딩함에 의하여 코딩된 CBF 및 TSF 구문 엘리먼트들에 대한 압축 효율을 개선할 수도 있다. 예를 들어, 위에서 설명된 상관에 기인하여, CU의 TU에 대한 CBF 및 TSF 값들의 몇몇 조합들이 다른 조합들보다 더 가능할 수도 있다. TU에 대한 하나 이상의 CBF들 및 TSF를 단일 VLC 코드워드를 이용하여 공동으로 코딩하는 경우에는, 만일 개별적으로 코딩된 하나 이상의 CBF들 및 TSF 보다 더 적은 비트들을 포함하는 (예를 들어, 각각 단일-비트 코드워드를 포함하는) 코드워드들이 더욱 가능한 조합들로 지정된다면, 압축 효율이 개선될 수도 있다. 마찬가지로, CU의 TU의 서브-TU들에 대한 CBF 또는 TSF 값들의 몇몇 조합들이 다른 조합들보다 더 가능할 수도 있다. 서브-TU들에 대한 CBF들 또는 TSF들을 단일 VLC 코드워드를 이용하여 공동으로 코딩하는 경우에는, 만일 개별적으로 코딩된 CBF들 또는 TSF들보다 더 적은 비트들을 포함하는 (예를 들어, 또 다시, 각각 단일-비트 코드워드를 포함하는) 코드워드들이 더욱 가능한 조합들로 지정된다면, 압축 효율이 또 다시 개선될 수도 있다.
본 개시물의 기법들에 따르면, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF는 공동으로 코딩될 수도 있다. 일 예로서, 소스 디바이스 (12) 의 비디오 인코더 (20) 는 비디오 데이터의 블록들 (예를 들어, 하나 이상의 CU들) 을 인코딩할 수도 있다. 비디오 인코더 (20) 는 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하고, TU가 서브-TU들로 스플릿되는지의 여부를 결정하고, VLC 테이블로부터 코드워드를 선택하되, 여기에서, VLC 테이블은 상기 코드워드가 결정들에 대응한다는 표시를 제공하고, 그리고 그 코드워드를 그 TU에 대하여 제공하도록 구성될 수도 있다. 이러한 예에서, 비디오 인코더 (20) 는 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
또한, 비디오 인코더 (20) 는 특정한 VLC 테이블을 선택하기 위하여 이용되는 TU에 대한 인코딩 콘텍스트를 결정하도록 구성될 수도 있다. 이러한 콘텍스트는 TU의 다양한 특징들, 예를 들어: 그 TU에 대응하는 PU에 대한 예측 모드; 그 TU에 대한 파티션 레벨; 및 코드워드에 의하여 표현될, TU의 성분들의 개수; 중 하나 이상을 포함할 수도 있다.
비디오 인코더 (20) 는 인코딩 콘텍스트를 이용하여 VLC 테이블을 선택할 수도 있다. 또한, TU의 색차 성분들에 대한 CBF들 중 하나가 코딩되고 그리고 다른 것이 추론되며, 그리고 따라서 다른 CBF들과 함께 공동으로 코딩되지 않는 경우에는, 비디오 인코더 (20) 는 어떤 CBF가 코딩되는지 그리고 어떤 CBF가 추론되는지와 무관하게 동일한 VLC 테이블을 선택할 수도 있다. 이러한 예들에서는, VLC 테이블은 코드워드들의 CBF 및 TSF 값들로의 매핑을 포함할 수도 있다. 또한, TU에 대한 TSF가 추론되고, 그리고 그러므로, TU에 대한 하나 이상의 CBF들과 함께 공동으로 코딩되지 않는 경우에는, 비디오 인코더 (20) 는 TSF가 이러한 하나 이상의 CBF들과 함께 코딩되는 경우와는 상이한 VLC 테이블을 선택할 수도 있다. 또한, 비디오 인코더 (20) 는 추론된 TSF의 값에 따라 상이한 VLC 테이블을 선택할 수도 있다. 이러한 예들에서는, VLC 테이블은 코드워드들의 CBF 값들로의 매핑을 포함할 수도 있다.
비디오 인코더 (20) 는 TU에 대한 하나 이상의 CBF들 및 TSF에 대응하는 코드워드를 VLC 테이블로부터 더 선택할 수도 있다. 마지막으로, 비디오 인코더 (20) 는 그 코드워드를 그 TU에 대하여 제공할 수도 있다. 또 다시, 이러한 예에서는 비디오 인코더 (20) 는 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
추가적으로, VLC 테이블에 대하여, 비디오 인코더 (20) 는 코드워드들의 CBF 및 TSF 값들로의 매핑을 위의 결정들에 기초하여 업데이트하여, 어떤 결정들이 그 인코딩 콘텍스트에 대하여 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 얼마나 자주 CBF 및 TSF 값들의 각각의 조합이 그 인코딩 콘텍스트에 대하여 발생하는지를 추적하고, 그리고 각 조합과 연관된 코드워드들을, 그 코드워드들이 대응하는 조합들의 우도 (likelihood) 와 반비례하는 길이들을 가지도록 설정할 수도 있다.
일 예로서, 비디오 인코더 (20) 는 TU의 휘도 성분에 대한 CBF, 예를 들어 CBFY, 그 TU의 양자의 색차 성분들에 대한 CBF, 예를 들어 이전에 설명된 바와 같은 CBFC, 및 그 TU에 대한 TSF를 공동으로 인코딩하도록 구성될 수도 있다. 예를 들어, 성분이 TU의 제 1 색차 성분을 포함하고, 그리고 여기에서, 그 TU가 제 2 의 상이한 색차 성분을 더 포함하는 경우들에서는, 비디오 인코더 (20) 는 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하도록 더 구성될 수도 있다. 이러한 예에서, 코드워드를 VLC 테이블로부터 선택하기 위하여, 비디오 인코더 (20) 는, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지, 즉, 그 TU에 대한 CBFC를 나타내는지의 여부를 코드워드가 나타낸다는 표시를 VLC 테이블이 제공하도록, 코드워드를 선택하도록 구성될 수도 있다.
TU에 대한 CBFC 값이 색차 성분들 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다고 표시하는 경우에서는, 비디오 인코더 (20) 는, 각각의 개별 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 표시하는 추가적 정보를 인코딩하도록 더 구성될 수도 있다. 몇몇 예들에서는, 하지만 색차 성분들에 대한 두 개의 CBF들 중 하나의 값이 추론될 수 있는 경우에는, 비디오 인코더 (20) 는 추가적 정보를 인코딩하지 않도록 구성될 수도 있다.
몇몇 예들에 따르면, 추가적 정보를 인코딩하기 위하여, 비디오 인코더 (20) 는 TU의 색차 성분들에 대한 CBF들을 개별적으로 인코딩하도록 구성될 수도 있다. 다른 예들에 따르면, 비디오 인코더 (20) 는 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하는 것에 대하여 위에서 설명된 바와 유사한 방식으로 TU의 색차 성분들에 대한 CBF들을 공동으로 인코딩하도록 구성될 수도 있다. 예를 들어, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는 경우들에서는, 비디오 인코더 (20) 는 제 2 의 상이한 코드워드를 제 2 의 상이한 VLC 테이블로부터 선택하도록 더 구성될 수도 있는데, 여기에서, 제 2 VLC 테이블은, 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부, 및 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 제 2 코드워드가 나타낸다는 표시를 제공한다. 비디오 인코더 (20) 는 제 2 코드워드를 그 TU에 대하여 제공하도록 더 구성될 수도 있다. 이러한 예에서, 비디오 인코더 (20) 는 제 2 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
이러한 예에서, 또 다시, 비디오 인코더 (20) 는 제 2 VLC 테이블을 선택하기 위하여 이용되는 TU에 대한 제 2 의 상이한 인코딩 콘텍스트를 결정하도록 구성될 수도 있다. 콘텍스트는: CU에 대한 파티션 레벨; 그 TU에 대한 파티션 레벨; TU에 대응하는 PU에 대한 예측 모드; 및 TU의 이웃하는 TU들의 제 1 색차 성분들 및 제 2 색차 성분들에 대응하는 CBF 값들; 중 하나 이상을 포함할 수도 있다. 예를 들어, 이웃하는 TU들은, CBF들 및 TSF들이 본 명세서에서 설명된 것과 동일한 방식으로 이전에 공동으로 인코딩되었던 대상인 CU의 다른 TU들일 수도 있다. 몇몇 예들에서는, 비디오 인코더 (20) 는 제 1 VLC 테이블 및 제 2 VLC 테이블 모두를 선택하기 위하여 동일한 인코딩 콘텍스트를 이용할 수도 있는데, 이러한 경우에는 위에서 논의된 제 1 및 제 2 인코딩 콘텍스트들은 동일한 콘텍스트를 포함할 수도 있다.
또 다시, 비디오 인코더 (20) 는 제 2 인코딩 콘텍스트를 이용하여 제 2 VLC 테이블을 선택할 수도 있다. 예를 들어, 제 2 VLC 테이블은 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 포함할 수도 있다. 비디오 인코더 (20) 는 TU에 대한 색차 CBF들, 즉 CBFU 및 CBFV에 대응하는 제 2 코드워드를 제 2 VLC 테이블로부터 선택할 수도 있다. 마지막으로, 비디오 인코더 (20) 는 제 2 코드워드를 그 TU에 대하여 제공할 수도 있다. 또 다시, 이러한 예에서, 비디오 인코더 (20) 는 제 2 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
추가적으로, 또 다시, 제 2 VLC 테이블에 대하여, 비디오 인코더 (20) 는 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 위의 결정들에 기초하여 업데이트하여 어떤 결정들이 제 2 인코딩 콘텍스트에 대하여 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 얼마나 자주 CBFU 및 CBFV 값들의 각각의 조합이 제 2 인코딩 콘텍스트에 대하여 발생하는지를 추적할 수도 있고, 그리고 코드워드들이 대응하는 조합들의 우도와 반비례하는 길이들을 가지도록 각각의 조합과 연관된 코드워드들을 설정할 수도 있다.
또 다른 예로서, TU의 서브-TU들에 대한 CBF들 또는 TSF들은 공동으로 코딩될 수도 있다. 예를 들어, TU가 서브-TU들로 스플릿되는 경우에서는, 비디오 인코더 (20) 는 서브-TU들이 다른 서브-TU들로 스플릿되는지의 여부를 표시하는 제 2 의 상이한 코드워드를 선택하고, 그리고 제 2 코드워드를 그 서브-TU들에 대하여 제공하도록 더 구성될 수도 있다. 마찬가지로, 비디오 인코더 (20) 는 제 2 코드워드를 이것이 TU의 성분에 대응하는 서브-TU들이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 나타내도록 선택하고, 그리고 이러한 제 2 코드워드를 그 서브-TU들에 대하여 제공할 수도 있다. 이러한 예들에서는, 비디오 인코더 (20) 는 제 2 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
이러한 예들에서는, 제 2 코드워드는 또한 VLC 코드워드를 포함할 수도 있다. 제 2 코드워드는 제 2 의 상이한 VLC 테이블로부터 제 2 의 상이한 인코딩 콘텍스트를 이용하여 선택될 수도 있다. 예를 들어, 서브-TU들에 대한 TSF들을 공동으로 인코딩하는 경우에, 제 2 인코딩 콘텍스트는 서브-TU들에 대한 CBF들의 값들을 포함할 수도 있다. 마찬가지로, 서브-TU들에 대한 CBF들을 공동으로 인코딩하는 경우에는, 제 2 인코딩 콘텍스트는 서브-TU들에 대한 TSF들의 값들을 포함할 수도 있다.
어떠한 경우에서도, 비디오 인코더 (20) 는, 각각의 VLC 코드워드들을 이용하여, TU에 대한 CBF들 및 TSF, 및/또는 서브-TU들에 대한 CBF들 또는 TSF들을 포함하도록, CU를 인코딩할 수도 있다. 위에서 설명된 VLC 기법들을 이용하는 것이 평균적인 경우에서는 코드워드들에 의하여 표현되는 개별적으로 인코딩된 CBF들 및 TSF들보다 더 적은 비트들을 포함하는 코드워드들을 초래할 수도 있기 때문에, 본 개시물의 기법들을 이용하는 경우에는 코드워드들을 포함하는 코딩된 비트스트림에 대한 상대적인 비트 절감들이 존재할 수도 있다.
목적지 디바이스 (14) 의 비디오 디코더 (30) 는 최종적으로 인코딩된 비디오 데이터 (예를 들어, 하나 이상의 CU들) 을 비디오 인코더 (20) 로부터, 예를 들어 모뎀 (28) 및 수신기 (26) 를 통하여 수신할 수도 있다. 대안적으로는, 비디오 디코더 (30) 는 인코딩된 비디오 데이터를 저장 매체, 예컨대 CD-ROM, 블루-레이 디스크, 플래시 드라이브, 하드 드라이브, 또는 다른 저장 매체로부터 수신할 수도 있다. 또 다시, 일 예로서, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF는 공동으로 코딩될 수도 있다. 본 개시물의 기법들에 따르면, 비디오 디코더 (30) 는 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 가지는지의 여부를 그 TU에 대한 코드워드에 기초하여 결정하고, TU가 서브-TU들로 스플릿되는지를 그 코드워드에 기초하여 결정하며, 그리고 TU를 상기 결정들에 기초하여 디코딩하도록 구성될 수도 있다.
몇몇 예들에서는, 비디오 디코더 (30) 는, 비디오 인코더 (20) 에 의하여 이용된 것과 실질적으로 유사한 방식으로 TU에 대한 디코딩 콘텍스트를 결정하여, 이전에 설명된 바와 같이, 코드워드를 포함하는 특정한 VLC 테이블을 선택하도록 구성될 수도 있다. 예를 들어, 디코딩 콘텍스트는 TU의 다양한 특징들, 예를 들어: 그 TU에 대응하는 PU에 대한 예측 모드; 그 TU에 대한 파티션 레벨; 및 그 코드워드에 의하여 표현되는 TU의 성분들의 개수; 중 하나 이상을 포함할 수도 있다.
비디오 디코더 (30) 는 디코딩 콘텍스트를 이용하여 VLC 테이블을 선택할 수도 있다. 또한, TU의 색차 성분들에 대한 CBF들 중 하나가 코딩되고 그리고 다른 것이 추론되며, 그리고 그러므로 다른 CBF들과 함께 공동으로 코딩되지 않는 경우에는, 비디오 디코더 (30) 는 어떤 CBF가 코딩되고 그리고 어떤 CBF가 추론되는지와 무관하게 동일한 VLC 테이블을 선택할 수도 있다. 이러한 예들에서는, VLC 테이블은 코드워드들의 CBF 및 TSF 값들로의 매핑을 포함할 수도 있다. 또한, TU에 대한 TSF가 추론되고, 그리고 그러므로 그 TU에 대한 하나 이상의 CBF들과 함께 공동으로 코딩되지 않는 경우에는, 비디오 디코더 (30) 는 TSF가 하나 이상의 CBF들과 함께 코딩되는 경우와는 상이한 다른 VLC 테이블을 선택할 수도 있다. 또한, 비디오 디코더 (30) 는 추론된 TSF의 값에 따라 상이한 VLC 테이블을 선택할 수도 있다. 이러한 예들에서는, VLC 테이블은 코드워드들의 CBF 값들로의 매핑을 포함할 수도 있다.
VLC 테이블을 이용함으로써, 비디오 디코더 (30) 는 TU의 하나 이상의 성분들이 적어도 하나의 비-제로 계수를 포함하는지, 즉, 코딩되는지의 여부, 및 TU가 서브-TU들로 스플릿되는지의 여부를 코드워드에 기초하여 결정할 수도 있다. 또한, 비디오 디코더 (30) 는, 어떤 결정들이 그 디코딩 콘텍스트에 대하여 더 많이 또는 더 적게 발생할 것 같은지를 반영하기 위해, 예를 들어 그 VLC 테이블 내의 매핑을, 그 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하기 위하여 비디오 인코더 (20) 에 의하여 이용되는 대응하는 VLC 테이블 내의 매핑과 조율하기 위해, 코드워드들 및 VLC 테이블 내의 CBF 및 TSF 값들 간의 매핑을 상기 결정들에 기초하여 업데이트할 수도 있다.
일 예로서, 비디오 디코더 (30) 는 TU의 휘도 성분에 대한 공동으로 인코딩된 CBF, 예를 들어 CBFY, 그 TU의 양자의 색차 성분들에 대한 CBF, 예를 들어 이전에 설명된 바와 같은 CBFC, 및 그 TU에 대한 TSF를 디코딩하도록 구성될 수도 있다. 예를 들어, 성분이 TU의 제 1 색차 성분을 포함하고, 그리고 여기에서, TU가 제 2 의 상이한 색차 성분을 더 포함하는 경우에서는, 비디오 디코더 (30) 는 코드워드에 기초하여 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하도록, 즉, 그 TU에 대한 CBFC를 결정하도록 더 구성될 수도 있다.
TU에 대한 CBFC 값이 색차 성분들 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다는 것을 표시하는 경우에서는, 비디오 디코더 (30) 는 각각의 개별 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 표시하는 추가적 정보를 디코딩하도록 더 구성될 수도 있다. 그러나, 몇몇 예들에서는, 색차 성분들에 대한 두 개의 CBF들 중 하나의 값이 추론될 수 있는 경우에는, 비디오 디코더 (30) 는 추가적 정보를 디코딩하지 않도록 구성될 수도 있다.
몇몇 예들에 따르면, 추가적 정보를 디코딩하기 위하여, 비디오 디코더 (30) 는 TU의 색차 성분들에 대한 개별적으로 인코딩된 CBF들을 디코딩하도록 구성될 수도 있다. 다른 예들에 따르면, 비디오 데이터의 CU의 TU에 대한 공동으로 인코딩된 하나 이상의 CBF들 및 TSF를 디코딩하는 것에 대하여 위에서 설명된 바와 같은 유사한 방법으로, 비디오 디코더 (30) 는 TU의 색차 성분들에 대한 공동으로 인코딩된 CBF들을 디코딩하도록 구성될 수도 있다.
예를 들어, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는 경우들에서는, 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 코드워드에 기초하여 결정하기 위하여, 비디오 디코더 (30) 는, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다고 코드워드에 기초하여 결정한 이후에, 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 그 TU에 대한 제 2 의 상이한 코드워드에 기초하여 결정하도록 더 구성될 수도 있다. 비디오 디코더 (30) 는 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 제 2 코드워드에 기초하여 결정하도록 더 구성될 수도 있다.
이러한 예에서, 또 다시, 비디오 디코더 (30) 는 TU에 대한 제 2 디코딩 콘텍스트를, 이전에 설명된 바와 같이, 제 2 코드워드를 포함하는 제 2 VLC 테이블을 선택하기 위하여 비디오 인코더 (20) 에 의하여 이용된 것과 실질적으로 유사한 방식으로 결정하도록 구성될 수도 있다. 예를 들어, 제 2 디코딩 콘텍스트는: CU에 대한 파티션 레벨; 그 TU에 대한 파티션 레벨; 그 TU에 대응하는 PU에 대한 예측 모드; 및 그 TU의 이웃하는 TU들의 제 1 색차 성분들 및 제 2 색차 성분들에 대응하는 CBF 값들; 중 하나 이상을 포함할 수도 있다. 예를 들어, 이웃하는 TU들은, 공동으로 인코딩된 CBF들 및 TSF들이 본 명세서에서 설명된 바와 동일한 방식으로 이전에 디코딩되었던 대상인 CU의 다른 TU들일 수도 있다. 몇몇 예들에서는, 비디오 디코더 (30) 는 제 1 VLC 테이블 및 제 2 VLC 테이블 모두를 선택하기 위한 동일한 디코딩 콘텍스트를 이용할 수도 있는데, 이 경우에 위에서 논의된 제 1 및 제 2 디코딩 콘텍스트들은 동일한 콘텍스트를 포함할 수도 있다.
비디오 디코더 (30) 는 제 2 디코딩 콘텍스트를 이용하여 제 2 VLC 테이블을 선택할 수도 있다. 예를 들어, 제 2 VLC 테이블은 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 포함할 수도 있다. 제 2 VLC 테이블을 이용함으로써, 비디오 디코더 (30) 는 TU의 색차 성분들 각각이 적어도 하나의 비-제로 계수를 포함하는지, 즉, 코딩되는지의 여부를 제 2 코드워드에 기초하여 결정할 수도 있다. 또한, 비디오 디코더 (30) 는, 어떤 결정들이 제 2 디코딩 콘텍스트에 대하여 더 많이 또는 더 적게 발생할 것 같은지를 반영하기 위해, 예를 들어 제 2 VLC 테이블 내의 매핑을, 그 TU에 대한 CBFU 및 CBFV를 공동으로 인코딩하기 위하여 비디오 인코더 (20) 에 의하여 이용되는 대응하는 VLC 테이블 내의 매핑과 조율하기 위해, 코드워드들 및 제 2 VLC 테이블 내의 CBFU 및 CBFV 값들 간의 매핑을 위의 결정들에 기초하여 업데이트할 수도 있다.
또 다른 예로서, TU의 서브-TU들에 대한 CBF들 또는 TSF들은 공동으로 코딩될 수도 있다. 예를 들어, TU가 서브-TU들로 스플릿되는 경우에는, 비디오 디코더 (30) 는 서브-TU들이 다른 서브-TU들로 스플릿되는지의 여부를, 그 서브-TU들에 대한 제 2 의 상이한 코드워드에 기초하여 결정하도록 구성될 수도 있다. 마찬가지로, 비디오 디코더 (30) 는 TU의 성분에 대응하는 서브-TU들의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 그 서브-TU들에 대한 제 2 코드워드에 기초하여 결정하도록 구성될 수도 있다.
이러한 예들에서는, 제 2 코드워드는 VLC 코드워드를 역시 포함할 수도 있다. 제 2 코드워드는 서브-TU들에 대한 CBF들 또는 TSF들을, 제 2 의 상이한 디코딩 콘텍스트를 이용하여 선택된 제 2 의 상이한 VLC 테이블을 이용하여 결정하기 위하여 이용될 수도 있다. 예를 들어, 서브-TU들에 대한 공동으로 인코딩된 TSF들을 디코딩하는 경우에는, 제 2 디코딩 콘텍스트는 그 서브-TU들에 대한 CBF들의 값들, 예를 들어 그 서브-TU들의 Y 성분들에 대응하는 CBF들을 포함할 수도 있다. 마찬가지로, 서브-TU들에 대한 공동으로 인코딩된 CBF들을 디코딩하는 경우에는, 제 2 디코딩 콘텍스트는 그 서브-TU들에 대한 TSF들의 값들을 포함할 수도 있다.
어떠한 경우에서도, 비디오 디코더 (30) 는 하나 이상의 코드워드들을 이용하여 결정된, TU에 대한 하나 이상의 CBF들 및 TSF, 및/또는 서브-TU들에 대한 CBF들 또는 TSF들을 이용하여 CU를 디코딩할 수도 있다. 또 다시, 위에서 설명된 VLC 기법들을 이용하는 것이 평균적인 경우에서는, 코드워드들에 의하여 표현되는, 개별적으로 코딩된 CBF들 및 TSF들보다 더 적은 비트들을 포함하는 하나 이상의 코드워드들을 초래할 수도 있기 때문에, 본 개시물의 기법들을 이용하는 경우에는 코드워드들을 포함하는 코딩된 비트스트림에 대한 상대적인 비트 절감들이 존재할 수도 있다.
비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 다양한 적합한 인코더 또는 디코더 회로 중 임의의 것으로서 구현될 수도 있는데, 예컨대 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서들 (DSPs), 주문형 집적회로들 (ASICs), 필드 프로그램가능 게이트 어레이들 (FPGAs), 이산 로직 회로부, 소프트웨어, 하드웨어, 펌웨어, 또는 이들의 조합으로서 적용가능한 바에 따라 구현될 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 중 하나 또는 두 개 모두와 실질적으로 유사한 컴포넌트들은 하나 이상의 인코더들 또는 디코더들 내에 포함될 수도 있는데, 이들 중 하나는 통합된 비디오 인코더/디코더 (CODEC) 의 일부로서 집적될 수도 있다. 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 와 실질적으로 유사한 컴포넌트들을 포함하는 장치는 집적 회로, 마이크로프로세서, 및/또는 무선 통신 디바이스, 예컨대 셀룰러 전화기를 포함할 수도 있다.
이러한 방식으로, 소스 디바이스 (12) 는, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하고, TU가 서브-TU들로 스플릿되는지의 여부를 결정하며, 코드워드를 VLC 테이블로부터 선택하되, 여기에서 VLC 테이블은 코드워드가 이러한 결정들에 대응한다는 표시를 제공하고, 그리고 그 코드워드를 그 TU에 대하여 제공하도록 구성되는 비디오 인코더를 포함하는, 비디오 데이터를 인코딩하기 위한 장치의 일 예를 나타낸다.
마찬가지로, 목적지 디바이스 (14) 는, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 그 TU에 대한 코드워드에 기초하여 결정하고, TU가 서브-TU들로 스플릿되는지의 여부를 코드워드에 기초하여 결정하며, 그리고 상기 결정들에 기초하여 그 TU를 디코딩하도록 구성되는 비디오 디코더를 포함하는, 비디오 데이터를 디코딩하기 위한 장치의 일 예를 나타낸다.
도 2 는, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하기 위한 기법들을 구현할 수도 있는 비디오 인코더 (20) 의 일 예를 예시하는 블록도이다. 비디오 인코더 (20) 는, 비디오 프레임들 내의 블록들, 예컨대 매크로블록들, 또는 CU들, 및/또는 이들의 파티션들 또는 서브-파티션들의 인트라- 및 인터-코딩을 수행할 수도 있다. 인트라-코딩은 주어진 비디오 프레임 내의 비디오에서의 공간적 리던던시를 감소 또는 제거하기 위해 공간적 예측에 의존한다. 인터-코딩은 비디오 시퀀스의 인접 프레임들 내의 비디오에서의 시간적 리던던시를 감소 또는 제거하기 위해 시간적 예측에 의존한다. 인트라-모드 (I-모드) 는 수 개의 공간적 기초 압축 모드들 중 임의의 것을 지칭할 수도 있으며, 그리고 단-방향성 예측 (P-모드) 또는 양-방향성 예측 (B-모드) 과 같은 인터-모드들은 수 개의 시간적 기초 압축 모드들 중 임의의 것을 지칭할 수도 있다.
도 2 에 도시되는 바와 같이, 비디오 인코더 (20) 는 인코딩될 비디오 프레임 내의 현재 비디오 데이터의 블록을 수신한다. 도 2 의 예에서, 비디오 인코더 (20) 는 모션 보상 유닛 (44), 모션 추정 유닛 (42), 인트라 예측 유닛 (46), 참조 프레임 저장소 (64), 합산기 (50), 변환 유닛 (52), 양자화 유닛 (54), 및 엔트로피 인코딩 유닛 (56) 을 포함한다. 비디오 블록 재구성을 위하여, 비디오 인코더 (20) 는 역양자화 유닛 (58), 역변환 유닛 (60), 및 합산기 (62) 를 또한 포함한다. 디블록킹 필터 (deblocking filter) (도 2 에는 미도시) 가 필터 블록 경계들에 또한 포함되어 블록 경계들을 필터링하여 재구성된 비디오로부터 블록화 아티팩트 (blockiness artifact) 들을 제거할 수도 있다. 원하는 경우, 디블록킹 필터는 통상적으로 합산기 (62) 의 출력을 필터링할 것이다.
인코딩 프로세스 동안에, 비디오 인코더 (20) 는 코딩될 비디오 프레임 또는 슬라이스를 수신한다. 프레임 또는 슬라이스는 다중 비디오 블록들 (예를 들어 LCU들) 로 분할될 수도 있다. 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 하나 이상의 참조 프레임들 내의 하나 이상의 블록들에 관련 있는 주어진 수신된 비디오 블록의 인터-예측성 코딩을 수행하여 시간적 압축을 제공할 수도 있다. 인트라-예측 유닛 (46) 은 코딩될 블록과 동일한 프레임 또는 슬라이스 내의 하나 이상의 이웃하는 블록들에 관련 있는 주어진 수신된 비디오 블록의 인트라-예측성 코딩을 수행하여, 그 블록을 인코딩하기 위한 공간적으로-기초한 예측 값들을 제공할 수도 있다.
모드 선택 유닛 (40) 은 인트라 또는 인터인 코딩 모드들 중 하나를, 예를 들어 에러 결과들에 기초하여 그리고 코딩되는 중인 주어진 수신된 블록을 포함하는 프레임 또는 슬라이스에 대한 프레임 또는 슬라이스 타입에 기초하여 선택하고, 그리고 초래된 인트라- 또는 인터-코딩된 블록을 합산기 (50) 로 제공하여 잔여 값 블록 데이터를 생성하고 합산기 (62) 로 제공하여 참조 프레임 또는 참조 슬라이스 내에서의 이용을 위한 인코딩된 블록을 재구성한다. 일반적으로, 인트라-예측은 이웃하는, 이전에 코딩된 블록들에 관련 있는 현재 블록을 예측하는 것을 수반하며, 반면에 인터-예측은 모션 예측 및 모션 보상을 수반하여 시간적으로 현재 블록을 예측한다.
모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 비디오 인코더 (20) 의 인터-예측 엘리먼트들을 나타낸다. 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 고집적화될 수 있는데, 하지만 개념적인 이해들을 위한 목적으로 개별적으로 예시된다. 모션 추정은 모션 벡터들을 생성하기 위한 프로세스인데, 이것은 비디오 블록들에 대한 모션을 추정한다. 예를 들어, 모션 벡터는 현재의 프레임 (또는 다른 코딩된 유닛) 내의 코딩되는 중인 현재 블록에 관련 있는 예측성 참조 프레임 (또는 다른 코딩된 유닛) 내의 예측성 블록의 변위를 표시할 수도 있다. 예측성 블록은 픽셀 차분의 관점에서, 코딩될 블록과 근접하게 매칭되는 것으로 발견되는 블록인데, 이것은 절대 차분의 합 (sum of absolute difference; SAD), 제곱 차분의 합 (sum of square difference; SSD), 또는 다른 차분 메트릭들 (metrics) 에 의하여 결정될 수도 있다. 일반적으로, 모션 벡터는 CU의 모션을 기술할 수도 있는데, 하지만 어떤 경우들 (예를 들어 CU가 머지 모드 (merge mode) 를 이용하여 코딩되는 경우) 에서는, CU는 다른 CU로부터 모션 정보를 승계할 수도 있다. 모션 보상은 모션 추정에 의하여 결정되는 모션 벡터에 기초하여 예측성 블록을 페치 (fetch) 하거나 생성하는 것을 수반할 수도 있다. 다시 말하건대, 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 몇몇 예들에서는 기능적으로 통합될 수도 있다.
모션 추정 유닛 (42) 은, 비디오 블록을 참조 프레임 저장소 (64) 내의 참조 프레임의 비디오 블록들과 비교함으로써, 인터-코딩된 프레임의 비디오 블록에 대한 모션 벡터를 연산할 수도 있다. 또한, 모션 보상 유닛 (44) 은, 이러한 비교의 목적들을 위하여, 참조 프레임의 서브-정수 픽셀들, 예를 들어 I-프레임 또는 P-프레임을 보간할 수도 있다. 일 예로서, ITU H.264 표준은 두 개의 리스트들을 기술하는데, 리스트 0 은 인코딩되는 중인 현재 프레임보다 더 이른 디스플레이 순서를 가지는 참조 프레임들을 포함하고, 그리고 리스트 1 은 인코딩되는 중인 현재 프레임보다 더 늦은 디스플레이 순서를 가지는 참조 프레임들을 포함한다. 그러므로, 참조 프레임 저장소 (64) 내에 저장되는 데이터는 이러한 리스트들에 따라서 조직화될 수도 있다.
모션 추정 유닛 (42) 은, 참조 프레임 저장소 (64) 로부터의 하나 이상의 참조 프레임들의 블록들을 현재 프레임, 예를 들어 P-프레임 또는 B-프레임의 인코딩될 블록과 비교할 수도 있다. 참조 프레임 저장소 (64) 내의 참조 프레임들이 서브-정수 픽셀들에 대한 값들을 포함하는 경우에는, 모션 추정 유닛 (42) 에 의하여 연산된 모션 벡터는 참조 프레임의 서브-정수 픽셀 위치를 지칭할 수도 있다. 또한, 모션 추정 유닛 (42) 및/또는 모션 보상 유닛 (44) 은, 만일 서브-정수 픽셀 포지션들에 대한 어떠한 값들도 참조 프레임 저장소 (64) 내에 저장되지 않는 경우에는, 참조 프레임 저장소 (64) 내에 저장된 참조 프레임들의 서브-정수 픽셀 포지션들에 대한 값들을 연산하도록 구성될 수도 있다. 모션 추정 유닛 (42) 은 연산된 모션 벡터를 엔트로피 인코딩 유닛 (56) 및 모션 보상 유닛 (44) 으로 전송할 수도 있다. 모션 벡터에 의하여 식별되는 참조 프레임 블록은 인터-예측성 블록들, 또는 더 일반적으로는 예측성 블록이라고 지칭될 수도 있다. 모션 보상 유닛 (44) 은 예측 데이터를 이러한 예측성 블록에 기초하여 연산할 수도 있다.
인트라-예측 유닛 (46) 은, 위에서 설명되는 바와 같은, 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 에 의하여 수행되는 인터-예측에 대한 대안으로서, 현재 블록을 인트라-예측할 수도 있다. 특히, 인트라-예측 유닛 (46) 은 현재 블록을 인코딩하기 위하여 이용할 인트라-예측 모드를 결정할 수도 있다. 몇몇 예들에서는, 인트라-예측 유닛 (46) 은 현재 블록을 다양한 인트라-예측 모드들을 이용하여, 예를 들어 별개의 인코딩 패스들 도중에 인코딩할 수도 있고, 그리고 인트라-예측 유닛 (46) (또는, 몇몇 예들에서는 모드 선택 유닛 (40)) 은 이용할 적합한 인트라-예측 모드를 테스트된 모드들로부터 선택할 수도 있다. 예를 들어, 인트라-예측 유닛 (46) 은 다양한 테스트된 인트라-예측 모드들에 대한 레이트-왜곡 분석을 이용하여 레이트-왜곡 값들을 연산하고, 그리고 테스트된 모드들 중에서 최적 레이트-왜곡 특징들을 가지는 인트라-예측 모드를 선택할 수도 있다. 일반적으로 레이트-왜곡 분석은 인코딩된 블록 및 원본인, 인코딩된 블록을 생성하기 위하여 인코딩되었던, 인코딩되지 않은 블록 사이의 왜곡 (또는 에러) 의 양, 및 인코딩된 블록을 생성하는데 이용되는 비트 레이트 (즉, 비트들의 개수들) 을 결정한다. 인트라-예측 유닛 (46) 은 다양한 인코딩된 블록들에 대한 왜곡들 및 레이트들로부터 비율들 (ratios) 을 연산하여 어떤 인트라-예측 모드가 현재 블록에 대한 최적 레이트-왜곡 값을 제공하는 지를 결정할 수도 있다.
몇몇 예들에서는, 모드 선택 유닛 (40) 은 변환 유닛 (52), 및/또는 비디오 인코더 (20) 의 다른 유닛들 또는 컴포넌트들과 함께, 인터-예측 인코딩된 또는 인트라-예측 인코딩된 CU의 하나 이상의 TU들에 대한 TSF들을 결정할 수도 있다. 예를 들어, 위에서 설명된 바와 같이 하나 이상의 TU들에 대한 파티션 정보를 나타내는 TSF들은 CU의 하나 이상의 PU들에 대한 파티션 정보를 결정하는 것의 일부로서 결정될 수도 있다. 따라서, CU에 대한 TU 파티션 정보는 CU에 대한 PU 파티션 정보에 의존할 수도 있다. 예를 들어, 모드 선택 유닛 (40) 은 변환 유닛 (52) 과 함께, CU의 하나 이상의 TU들이 각각의 서브-TU들로 스플릿되는지의 여부를 CU에 대한 예측 데이터를 생성하는 것의 일부로서 결정할 수도 있다. 추가적으로, 하나 이상의 TU들이 각각의 서브-TU들로 스플릿되는지의 여부도 역시, 변환 유닛 (52) 의 성질들, 예를 들어 그 CU에 대한 최대 및 최소 변환 사이즈들에 의존할 수도 있다. 또한, 엔트로피 인코딩 유닛 (56) 은 하나 이상의 TU들에 대한 CBF들을 결정할 수도 있다. 예를 들어, 엔트로피 인코딩 유닛 (56) 은 하나 이상의 TU들의 각각의 성분이 적어도 하나의 비-제로 계수를 포함하는지, 즉 코딩되는지의 여부를, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다. 또 다른 예들에서는, 비디오 인코더 (20) 의 다른 유닛들 또는 컴포넌트들이 CU의 하나 이상의 TU들에 대한 CBF들 및 TSF들을 결정할 수도 있다.
어떠한 경우에서도, 비디오 인코더 (20) 는 레이트-왜곡 최적화 프로세스를 수행하여 적합한 CU, PU, 및 TU 파티셔닝 방식들을 결정하고, 그리고 결정된 파티셔닝 방식들을 이용하여 CU를 인코딩할 수도 있다. 또한, 비디오 인코더 (20) 는 CU의 하나 이상의 TU들에 대한 CBF들 및 TSF들에 대한 값들을 몇몇 예들에서 결정할 수도 있다. 모드 선택 유닛 (40) 은 변환 유닛 (52) 과 함께, TSF들을 엔트로피 인코딩 유닛 (56) 으로 제공할 수도 있으며, 이것이 또한 CBF들을 생성할 수도 있다.
본 개시물의 기법들에 따르면, 아래에서 더 상세하게 설명되는 바와 같이, 엔트로피 인코딩 유닛 (56) 은 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩할 수도 있다. 또한, 본 개시물의 기법들에 따르면, 엔트로피 인코딩 유닛 (56) 은 CU의 TU의 서브-TU들에 대한 CBF들 또는 TSF들을 공동으로 인코딩할 수도 있다.
예를 들어, 인트라-예측 및 인터-예측을 이용하여 현재 블록을 예측한 이후에, 비디오 인코더 (20) 는 모션 보상 유닛 (44) 또는 인트라-예측 유닛 (46) 에 의하여 연산된 예측 데이터를 코딩되는 중인 원본 비디오 블록으로부터 감산함으로써 잔여 비디오 블록을 형성할 수도 있다. 합산기 (50) 는 이러한 감산 연산을 수행할 수도 있는 컴포넌트 또는 컴포넌트들을 나타낸다. 변환 유닛 (52) 은 이산 코사인 변환 (DCT) 또는 개념적으로 유사한 변환과 같은 변환을 잔여 블록에 적용하여 잔여 변환 계수 값들을 포함하는 비디오 블록을 생성할 수도 있다. 변환 유닛 (52) 은 H.264 표준에 의하여 정의되거나 HEVC에서 이용되는 것들과 같은 다른 변환들을 수행할 수도 있는데, 이들은 DCT와 개념적으로 유사하다. 웨이브릿 (wavelet) 변환들, 정수 변환들, 서브-대역 변환들, KLT들 (Karhunen-Loeve Transforms), 방향성 변환들 또는 변환들의 다른 타입들도 역시 이용될 수 있다. 어느 경우에서나, 변환 유닛 (52) 은 변환을 잔여 블록에 적용하여 잔여 변환 계수들의 블록을 생성할 수도 있다. 변환은 잔여 정보를 픽셀 도메인으로부터 변환 도메인, 예컨대 주파수 도메인으로 변환할 수도 있다. 양자화 유닛 (54) 은 잔여 변환 계수들을 양자화하여 비트 레이트를 더 감소시킬 수도 있다. 양자화 프로세스는 계수들 일부 또는 전부와 관련되는 비트 깊이 (bit depth) 를 감소시킬 수도 있다. 양자화의 정도는 양자화 파라미터를 조절함으로써 수정될 수도 있다.
양자화에 후속하여, 엔트로피 인코딩 유닛 (56) 은 양자화된 변환 계수들을 엔트로피 코딩할 수 있다. 예를 들어, 엔트로피 인코딩 유닛 (56) 은 콘텍스트 적응형 가변 길이 코딩 (CAVLC), 콘텍스트 적응형 이진 산술적 코딩 (CABAC), 또는 다른 엔트로피 코딩 기법을 수행할 수도 있다. 엔트로피 인코딩 유닛 (56) 에 의한 엔트로피 코딩에 후속하여, 인코딩된 비디오는 다른 디바이스로 송신되거나 후속 송신 또는 취출을 위하여 저장될 수도 있다. CABAC의 경우에는, 콘텍스트는 이웃하는 블록들 및/또는 블록 사이즈들에 기초할 수도 있다. CAVLC의 경우에는, 콘텍스트는 비디오 데이터의 코딩된 블록의 그리고 이전에 코딩된 이웃하는 블록들의 다양한 특징들에 기초할 수도 있다.
몇몇 경우들에서, 비디오 인코더 (20) 의 다른 유닛 또는 엔트로피 인코딩 유닛 (56) 은, 위에서 설명된 엔트로피 코딩에 추가하여 다른 코딩 기능들을 수행하도록 구성될 수도 있다. 예를 들어, 엔트로피 인코딩 유닛 (56) 은 비디오 데이터의 블록들 및 그들의 파티션들에 대한 CBP 값들을 결정하도록 구성될 수도 있다. 또한, 몇몇 경우들에서, 엔트로피 인코딩 유닛 (56) 은 블록 내의 계수들의 런렝쓰 코딩 (run length coding) 을 수행할 수도 있다. 특히, 엔트로피 인코딩 유닛 (56) 은 지그재그 스캔 또는 다른 스캔 패턴을 적용하여 블록 내의 변환 계수들을 스캔하고, 추가적인 압축을 위하여 제로들의 런 (run) 들을 인코딩할 수도 있다. 또한, 엔트로피 인코딩 유닛 (56) 은 인코딩된 비디오 비트스트림 내에, 송신을 위한 적합한 구문 엘리먼트들에 의해 헤더 정보를 구성할 수도 있다. HEVC와 같은 몇몇 코딩 표준들에 따르면, 이러한 구문 엘리먼트들은, 예를 들어 이전에 설명된 바와 같이 RQT를 이용하여 표현되는, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 포함할 수도 있다.
본 개시물의 기법들에 따르면, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF는 공동으로 코딩될 수도 있다. 일 예로서, 엔트로피 인코딩 유닛 (56) 은 비디오 데이터의 블록들 (예를 들어, 하나 이상의 CU들) 을 인코딩할 수도 있다. 엔트로피 인코딩 유닛 (56) 은 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하고, TU가 서브-TU들로 스플릿되는지의 여부를 결정하며, 코드워드를 VLC 테이블로부터 선택하되, 여기에서, VLC 테이블은 코드워드가 이러한 결정들에 대응한다는 표시를 제공하고, 그리고 그 코드워드를 그 TU에 대하여 제공하도록 구성될 수도 있다. 이러한 예에서, 엔트로피 인코딩 유닛 (56) 은 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
엔트로피 인코딩 유닛 (56) 은 특정한 VLC 테이블을 선택하기 위하여 이용되는, TU에 대한 인코딩 콘텍스트를 결정하도록 더 구성될 수도 있다. 콘텍스트는 TU의 다양한 특징들, 예를 들어: 그 TU에 대응하는 PU에 대한 예측 모드; 그 TU에 대한 파티션 레벨; 및 코드워드에 의하여 표현될 그 TU의 성분들의 개수; 중 하나 이상을 포함할 수도 있다.
엔트로피 인코딩 유닛 (56) 은 인코딩 콘텍스트를 이용하여 VLC 테이블을 선택할 수도 있다. 또한, TU의 색차 성분들에 대한 CBF들 중 하나가 코딩되고 그리고 다른 것이 추론되며, 그리고 그러므로, 다른 CBF와 함께 공동으로 코딩되지 않는 경우에는, 엔트로피 인코딩 유닛 (56) 은 어떤 CBF가 코딩되고 그리고 어떤 CBF가 추론되는지와 무관하게 동일한 VLC 테이블을 선택할 수도 있다. 이러한 예들에서는, VLC 테이블은 코드워드들의 CBF 및 TSF 값들로의 매핑을 포함할 수도 있다. 또한, TU에 대한 TSF가 추론되고, 그리고 그러므로, TU에 대한 하나 이상의 CBF들과 함께 공동으로 코딩되지 않는 경우에는, 엔트로피 인코딩 유닛 (56) 은, TSF가 하나 이상의 CBF들과 함께 코딩되는 경우와는 상이한 다른 VLC 테이블을 선택할 수도 있다. 또한, 엔트로피 인코딩 유닛 (56) 은 추론된 TSF의 값에 기초하여 상이한 VLC 테이블을 선택할 수도 있다. 이러한 예들에서는, VLC 테이블은 코드워드들의 CBF 값들로의 매핑을 포함할 수도 있다.
엔트로피 인코딩 유닛 (56) 은 TU에 대한 하나 이상의 CBF들 및 TSF에 대응하는 코드워드를 VLC 테이블로부터 더 선택할 수도 있다. 마지막으로, 엔트로피 인코딩 유닛 (56) 은 그 코드워드를 그 TU에 대하여 제공할 수도 있다. 또 다시, 이러한 예에서, 엔트로피 인코딩 유닛 (56) 은 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
추가적으로, VLC 테이블에 대하여, 엔트로피 인코딩 유닛 (56) 은 코드워드들의 CBF 및 TSF 값들로의 매핑을 위의 결정들에 기초하여 업데이트하여 어떤 결정들이 그 인코딩 콘텍스트에 대하여 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다. 예를 들어, 엔트로피 인코딩 유닛 (56) 은 얼마나 자주 CBF 및 TSF 값들 각각의 조합이 그 인코딩 콘텍스트에 대하여 발생하는지를 추적하고, 그리고 각각의 조합과 연관된 코드워드들을 그 코드워드들이 대응하는 조합들의 우도와 반비례하는 길이들을 가지도록 설정할 수도 있다.
이러한 예의 하나로서, 엔트로피 인코딩 유닛 (56) 은 TU의 휘도 성분에 대한 CBF, TU의 양자의 색차 성분들에 대한 CBF, 예를 들어 이전에 설명된 바와 같은 CBFC, 및 TU에 대한 TSF를 공동으로 인코딩하도록 구성될 수도 있다. 예를 들어, 성분이 TU의 제 1 색차 성분을 포함하고, 그리고 여기에서, TU가 제 2 의 상이한 색차 성분을 더 포함하는 경우에서는, 엔트로피 인코딩 유닛 (56) 은 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하도록 더 구성될 수도 있다. 이러한 예에서, 코드워드를 VLC 테이블로부터 선택하기 위하여, 엔트로피 인코딩 유닛 (56) 은 코드워드를, 그 코드워드가 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 나타낸다는, 즉, TU에 대한 CBFC를 나타낸다는 표시를 VLC 테이블이 제공하도록 선택하도록 구성될 수도 있다.
TU에 대한 CBFC 값이, 색차 성분들 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다고 표시하는 경우에서는, 엔트로피 인코딩 유닛 (56) 은 각각의 개별 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 표시하는 추가적 정보를 인코딩하도록 더 구성될 수도 있다. 그러나, 몇몇 예들에서는, 색차 성분들에 대한 두 개의 CBF들 중 하나의 값이 추론될 수 있는 경우에, 엔트로피 인코딩 유닛 (56) 은 추가적 정보를 인코딩하지 않도록 구성될 수도 있다.
몇몇 예들에 따르면, 추가적 정보를 코딩하기 위하여, 엔트로피 인코딩 유닛 (56) 은 TU의 색차 성분들에 대한 CBF들을 개별적으로 인코딩하도록 구성될 수도 있다. 다른 예들에 따르면, 엔트로피 인코딩 유닛 (56) 은 TU의 색차 성분들에 대한 CBF들을, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하는 것에 대하여 위에서 설명된 것과 유사한 방식으로 공동으로 인코딩하도록 구성될 수도 있다. 예를 들어, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는 경우들에서는, 엔트로피 인코딩 유닛 (56) 은 제 2 의 상이한 코드워드를 제 2 의 상이한 VLC 테이블로부터 선택하도록 더 구성될 수도 있는데, 여기에서, 제 2 VLC 테이블은, 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부, 및 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 제 2 코드워드가 나타낸다는 표시를 제공한다. 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를 그 TU에 대하여 제공하도록 더 구성될 수도 있다. 이러한 예에서, 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
이러한 예에서, 또 다시, 엔트로피 인코딩 유닛 (56) 은 제 2 VLC 테이블을 선택하기 위하여 이용되는, TU에 대한 제 2 의 상이한 인코딩 콘텍스트를 결정하도록 구성될 수도 있다. 콘텍스트는: CU에 대한 파티션 레벨; 그 TU에 대한 파티션 레벨; 그 TU에 대응하는 PU에 대한 예측 모드; 및 TU의 이웃하는 TU들의 제 1 색차 성분들 및 제 2 색차 성분들에 대응하는 CBF 값들; 중 하나 이상을 포함할 수도 있다. 예를 들어, 이웃하는 TU들은 CBF들 및 TSF들이 본 명세서에서 설명된 것과 동일한 방식으로 이전에 공동으로 인코딩되었던 대상인 CU의 다른 TU들일 수도 있다. 몇몇 예들에서는, 엔트로피 인코딩 유닛 (56) 은 제 1 VLC 테이블 및 제 2 VLC 테이블 모두를 선택하기 위하여 동일한 인코딩 콘텍스트를 이용할 수도 있는데, 이러한 경우에는 위에서 논의된 제 1 및 제 2 인코딩 콘텍스트들이 동일한 콘텍스트를 포함할 수도 있다.
또 다시, 엔트로피 인코딩 유닛 (56) 은 제 2 인코딩 콘텍스트를 이용하여 제 2 VLC 테이블을 선택할 수도 있다. 예를 들어, 제 2 VLC 테이블은 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 포함할 수도 있다. 엔트로피 인코딩 유닛 (56) 은, TU에 대한 색차 CBF들, 즉, CBFU 및 CBFV에 대응하는 제 2 코드워드를 제 2 VLC 테이블로부터 더 선택할 수도 있다. 마지막으로, 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를 그 TU에 대하여 제공할 수도 있다. 또 다시, 이러한 예에서, 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
추가적으로, 또 다시, 제 2 VLC 테이블에 대하여, 엔트로피 인코딩 유닛 (56) 은 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 위의 결정들에 기초하여 업데이트하여, 어떤 결정들이 제 2 인코딩 콘텍스트에 대하여 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다. 예를 들어, 엔트로피 인코딩 유닛 (56) 은 얼마나 자주 CBFU 및 CBFV 값들 각각의 조합이 제 2 인코딩 콘텍스트에 대하여 발생하는지를 추적하고, 그리고 각각의 조합과 연관된 코드워드들을, 그 코드워드들이 대응하는 조합들의 우도와 반비례하는 길이들을 가지도록 설정할 수도 있다.
또 다른 예로서, TU의 서브-TU들에 대한 CBF들 또는 TSF들은 공동으로 코딩될 수도 있다. 예를 들어, TU가 서브-TU들로 스플릿되는 경우에는, 엔트로피 인코딩 유닛 (56) 은 서브-TU들이 다른 서브-TU들로 스플릿되는지의 여부를 나타내는 제 2 의 상이한 코드워드를 선택하고, 그리고 제 2 코드워드를 그 서브-TU들에 대하여 제공하도록 더 구성될 수도 있다. 마찬가지로, 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를, TU의 성분에 대응하는 서브-TU들의 성분들이 적어도 하나의 비-제로 계수를 포함하는지, 즉, 코딩되는지의 여부를 이것이 나타내도록 선택하고, 그리고 제 2 코드워드를 그 서브-TU들에 대하여 제공할 수도 있다. 이러한 예들에서는, 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를 비트스트림 내로 전송하도록 더 구성될 수도 있다.
이러한 예들에서는, 제 2 코드워드는 또한 VLC 코드워드를 포함할 수도 있다. 제 2 코드워드는 제 2 의 상이한 VLC 테이블로부터 제 2 의 상이한 인코딩 콘텍스트를 이용하여 선택될 수도 있다. 예를 들어, 서브-TU들에 대한 TSF들을 공동으로 인코딩하는 경우에는, 제 2 인코딩 콘텍스트는 서브-TU들에 대한 CBF들, 예를 들어 서브-TU들의 Y 성분들에 대응하는 CBF들의 값들을 포함할 수도 있다. 마찬가지로, 서브-TU들에 대한 CBF들을 공동으로 인코딩하는 경우에는, 제 2 인코딩 콘텍스트는 서브-TU들에 대한 TSF들의 값들을 포함할 수도 있다.
표 1 내지 표 5 는 본 개시물의 기법들에 따라서 이용될 수도 있는 VLC 테이블들의 예들을 도시한다. 표 1 의 VLC 테이블은 비디오 데이터의 CU의 TU에 대한 CBF 및 TSF 값들 (열들 "CU의 TU에 대한 CBF들 및 TSF" 에서 도시됨) 의, 대응하는 CBF 및 TSF 값들을 나타내기 위하여 이용되는 VLC 코드워드들 (열 "코드워드" 에서 도시됨) 로의 매핑을 포함한다. 표 2 의 VLC 테이블은 비디오 데이터의 CU의 TU에 대한 CBFY, CBFC, 및 TSF 값들 (열들 "CU의 TU에 대한 CBFY, CBFC, 및 TSF"에서 도시됨) 의, 대응하는 CBFY, CBFC, 및 TSF 값들을 나타내기 위하여 이용되는 VLC 코드워드들 (열 "코드워드" 에서 도시됨) 로의 매핑을 포함한다. 표 3 의 VLC 테이블은 비디오 데이터의 CU의 TU에 대한 CBFU 및 CBFV 값들 (열들 "CU의 TU에 대한 CBFU 및 CBFV" 에서 도시됨) 의, 대응하는 CBFU 및 CBFV 값들을 나타내기 위하여 이용되는 VLC 코드워드들 (열 "코드워드" 에서 도시됨) 로의 매핑을 포함한다. 마지막으로, 표 4 및 표 5 의 VLC 테이블들은 CU의 TU의 4 개의 서브-TU들 각각에 대한 CBF 및 TSF 값들 (열들 "CU의 TU의 서브-TU들에 대한 CBF들" 및 "CU의 TU의 서브-TU들에 대한 TSF들" 에서 도시됨) 의, 대응하는 CBF 또는 TSF 값들을 나타내기 위하여 역시 이용되는 VLC 코드워드들 (각각의 열들 "코드워드"에서 도시됨) 로의 매핑을 포함한다.
표 1, 표 2, 표 4, 및 표 5 각각이 전체 VLC 테이블로부터의 발췌 또는 이것의 서브세트만을 포함한다는 점에 주의하여야 한다. 일 예로서 표 1 및 표 5 각각에 대한 전체 VLC 테이블은 통상적으로 대응하는 개수의 상이한 VLC 코드워드들로 매핑된 CBF 및/또는 TSF 값 조합들의 16 개까지의 상이한 엔트리들을 포함하여 TU, 또는 서브-TU들에 대한 모든 가능한 CBF 및/또는 TSF 값 조합들을 나타낼 것이다. 다른 예로서, 표 2 의 전체 VLC 테이블은 통상적으로 대응하는 개수의 상이한 VLC 코드워드들로 매핑된 CBF 및 TSF 값 조합들의 8 개까지의 상이한 엔트리들을 포함하여, 역시 TU에 대한 모든 가능한 CBF 및 TSF 값 조합들을 나타낼 것이다. 또 다른 예로서, 표 4 의 전체 VLC 테이블은 통상적으로 대응하는 개수의 상이한 VLC 코드워드들로 매핑된 CBF 값 조합들의 15 개까지의 상이한 엔트리들을 포함하여 서브-TU들에 대한 모든 가능한 CBF 값 조합들을 나타낼 것이다. 이러한 예에서, 제로인, 예를 들어 4 개의 서브-TU들의 각각의 성분에 대한 모든 4 개의 CBF들에 대응하는 CBF 값 조합이 표 4 로부터 제외되는데 그 이유는 이러한 조합이 서브-TU들의 부모 TU의 대응하는 성분에 대한 CBF에 의하여 표시될 수 있기 때문이다.
표 1 의 예에서는, 각각의 코드워드가 비디오 데이터의 CU의 TU에 대한 3 개의 CBF들 및 하나의 TSF를 나타낸다는 것이 가정된다. 다른 예들에서는, 위에서 설명된 바와 같이, 더 많거나 또는 더 적은 CBF들 및 TSF들 (예를 들어, CU의 TU에 대한 CBFY, CBFU, 및 CBFV의 서브세트, 또는 두 개 이상의 TSF) 이 표현될 수도 있다. 따라서, 표 1 내의 코드워드들의 개수는 공동으로 인코딩된 CBF들 및 TSF들의 개수에 기초하여 변동할 수도 있다. 이러한 방식으로, 표 1 은 이러한 예에서 도시된 것보다 더 많거나 또는 더 적은 엔트리들을 가질 수도 있다. 추가적으로, 표 1 의 예에서는, 열들 "CU의 TU에 대한 CBF들 및 TSF"를 참조하여, "1"의 CBF 값은 대응하는 성분이 적어도 하나의 비-제로 계수를 포함한다는 것, 즉 코딩된다는 것을 표시하고, 그리고 "0"의 값은 성분이 임의의 비-제로 계수들을 포함하지 않는다는 것, 즉, 코딩되지 않는다는 것을 표시한다. 또한, "1"의 TSF 값은 TU가 서브-TU들로 스플릿된다는 것을 표시하고, 그리고 "0"의 값은 TU가 스플릿되지 않는다는 것을 표시한다. 다른 예들에서는, 상이한 값들이 표 1 에서 이용되어 TU의 성분이 코딩되는지의 여부, 그리고 TU가 서브-TU들로 스플릿되는지의 여부를 표시할 수도 있다.
Figure 112013047971231-pct00001
표 1 의 예를 참조하면서, 비디오 데이터의 CU의 TU에 대하여, TU의 모든 성분들 (즉, Y, U, 및 V 성분들) 은 적어도 하나의 비-제로 계수를 포함한다고, (그리고 따라서 코딩된다고), 그리고 TU가 서브-TU들로 스플릿된다고 가정한다. 이러한 예에서, 이전에 설명된 바와 같이 적어도 하나의 비-제로 계수 (즉, TU의 코딩된 성분) 를 포함하는 CU의 TU의 성분이 "1"의 CBF 값으로써 표시된다고, 그리고 서브-TU들로 스플릿된 TU가 "1"의 TSF 값으로써 표시된다고 가정하면, 모드 선택 유닛 (40) 은 변환 유닛 (52) 과 함께 "1"의 값을 가지는, TU에 대한 TSF를 엔트로피 인코딩 유닛 (56) 으로 제공할 수도 있다. 추가적으로, 엔트로피 인코딩 유닛 (56) 은, 각각의 CBF가 역시 "1"의 값을 가지는, TU에 대한 CBF들을, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다. 또한, 표 1 의 예는, TU의 모든 성분들이 코딩되는 (즉, 적어도 하나의 비-제로 계수를 포함하는), 그리고 TU가 서브-TU들로 스플릿되는 경우가 그 인코딩 콘텍스트 (즉, 표 1 에 묘사된 VLC 테이블을 선택하기 위하여 이용되었던 콘텍스트) 가 주어지면 그 TU에 대한 가장 가능한 경우라는 가정을 전제로 한다. 따라서, 이러한 예에서, 엔트로피 인코딩 유닛 (56) 이 코드워드 "1"을 선택하여 TU에 대한 하나 이상의 CBF들 및 TSF를 나타낼 것이다.
표 2 의 예에서는, 각각의 코드워드가 비디오 데이터의 CU의 TU에 대한 CBFY, CBFC, TSF를 나타낸다는 것이 가정된다. 다른 예들에서는, 더 많거나 또는 더 적은 CBF들 및 TSF들 (예를 들어, CU의 TU에 대한 오직 CBFC 및 TSF) 이 표현될 수도 있다. 따라서, 표 2 내의 코드워드들의 개수는 또 다시 공동으로 인코딩된 CBF들 및 TSF들의 개수에 기초하여 변동할 수도 있고, 그리고 표 2 는 이러한 예에서 도시된 것보다 더 많거나 또는 더 적은 엔트리들을 가질 수도 있다. 또 다시, 표 2 의 예에서는, 열들 "CU의 TU에 대한 CBFY, CBFC, 및 TSF"를 참조하여, "1"의 CBF 값은 대응하는 성분이 코딩된다는 것을 표시하고, 그리고 "0"의 값은 그 성분이 코딩되지 않는다는 것을 표시한다. 구체적으로 설명하면, "1"의 CBFC 값은 TU의 색차 성분들 중 적어도 하나가 코딩된다는 것을 표시하고, 그리고 "0"의 값은 색차 성분들이 코딩되지 않는다는 것을 표시한다. 또한, "1"의 TSF 값은 TU가 서브-TU들로 스플릿된다는 것을 표시하고, 그리고 "0"의 값은 TU가 스플릿되지 않는다는 것을 표시한다. 또 다시, 다른 예들에서는, 상이한 값들이 표 2 에서 이용되어 TU의 성분이 코딩되는지의 여부, 그리고 TU가 서브-TU들로 스플릿되는지의 여부를 표시할 수도 있다.
Figure 112013047971231-pct00002
표 2 의 예를 참조하면서, 비디오 데이터의 CU의 TU에 대하여, 휘도 성분 (즉, Y 성분) 및 TU의 색차 성분들 (즉, U 및 V 성분들) 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하고, 그리고 TU가 서브-TU들로 스플릿된다고 가정한다. 이러한 예에서, 이전에 설명된 바와 같이, 적어도 하나의 비-제로 계수를 포함하는, CU의 TU의 휘도 성분, 및 적어도 하나의 비-제로 계수를 포함하는, TU의 적어도 하나의 색차 성분들이 각각 "1"의 대응하는 CBF 값으로 표시된다고, 그리고, 서브-TU들로 스플릿되는 TU가 "1"의 TSF 값으로써 표시된다고 가정하면, 모드 선택 유닛 (40) 은 변환 유닛 (52) 과 함께 "1"의 값을 가지는, TU에 대한 TSF를 엔트로피 인코딩 유닛 (56) 으로 제공할 수도 있다. 추가적으로, 엔트로피 인코딩 유닛 (56) 은, 각각의 CBF가 역시 "1"의 값을 가지는, TU에 대한 CBFY 및 CBFC를, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다. 또한, 표 2 의 예는, TU의 휘도 성분 및 색차 성분들의 적어도 하나가 적어도 하나의 비-제로 계수를 포함하고, 그리고 TU가 서브-TU들로 스플릿되는 경우가, "제 1" 인코딩 콘텍스트 (즉, 표 2 에 묘사된 VLC 테이블을 선택하기 위하여 이용되었던 인코딩 콘텍스트) 가 주어지면 그 TU에 대한 가장 가능한 경우라는 가정을 전제로 한다. 따라서, 이러한 예에서, 엔트로피 인코딩 유닛 (56) 은 코드워드 "1"을 선택하여 TU에 대한 CBFY, CBFC, 및 TSF를 나타낼 것인데, 이것이 이 예에서는 제 1 코드워드로서 지칭될 수도 있다.
표 2 의 예에서는, 색차 성분들 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다 (예를 들어, CBFC="1") 는 것을 TU에 대한 CBFC 값이 표시하는 경우에는, 엔트로피 인코딩 유닛 (56) 은, 아래에서 더 상세하게 설명되는 표 3 의 예에서 도시되는 바와 같이, 각각의 개별 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 표시하는 추가적 정보를 인코딩하도록 더 구성될 수도 있다. 그러나, 몇몇 예들에서는, 이전에 설명된 바와 같이, 색차 성분들에 대한 두 개의 CBF들 중 하나의 값이 추론될 수 있는 경우에는, 엔트로피 인코딩 유닛 (56) 은 추가적 정보를 인코딩하지 않도록 구성될 수도 있다.
표 3 의 예에 따르면, 추가적 정보를 코딩하기 위하여, 엔트로피 인코딩 유닛 (56) 은 TU의 색차 성분들에 대한 CBF들을 공동으로 인코딩하도록 구성될 수도 있다. 표 3 의 예에서는, 각각의 코드워드가 비디오 데이터의 CU의 TU에 대한 CBFU 및 CBFV를 나타낸다는 것이 가정된다. 또 다시, 표 3 의 예에서는, 열들 "CU의 TU에 대한 CBFU 및 CBFV"를 참조하여, "1"의 CBF 값은 대응하는 성분이 적어도 하나의 비-제로 계수를 포함한다는 것을 표시하고, 그리고 "0"의 값은 그 성분이 임의의 비-제로 계수들을 포함하지 않는다는 것을 표시한다. 또 다시, 다른 예들에서는, 상이한 값들이 표 3 에서 이용되어 TU의 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 표시할 수도 있다.
Figure 112013047971231-pct00003
표 3 의 예를 참조하면서, 비디오 데이터의 CU의 TU에 대하여, TU의 색차 성분들 모두 (즉, U 및 V 성분들) 가 적어도 하나의 비-제로 계수를 포함한다고 가정한다. 이러한 예에서, 적어도 하나의 비-제로 계수를 포함하는 CU의 TU의 색차 성분이, 이전에 설명된 바와 같이, "1"의 대응하는 CBF 값으로 표시된다고 가정하면, 엔트로피 인코딩 유닛 (56) 은, 각각의 CBF가 값 "1"을 가지는, TU에 대한 CBFU 및 CBFV를, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다. 표 3 의 예는, TU의 양자의 색차 성분들이 적어도 하나의 비-제로 계수를 포함하는 경우가 "제 2" 인코딩 콘텍스트 (즉, 표 3 에서 묘사되는 VLC 테이블을 선택하기 위하여 이용되었던 인코딩 콘텍스트) 가 주어지면 그 TU에 대한 가장 가능한 경우라는 가정을 더 전제로 한다. 따라서, 이러한 예에서, 엔트로피 인코딩 유닛 (56) 은 코드워드 "1"을 선택하여 TU에 대한 CBFU 및 CBFV를 나타낼 것인데, 이것이 이러한 예에서는 제 2 코드워드로서 지칭될 수도 있다.
Figure 112013047971231-pct00004
Figure 112013047971231-pct00005
마지막으로, 표 4 및 표 5 의 예들을 참조로, 비디오 데이터의 CU의 TU의 4 개의 서브-TU들에 대하여, 서브-TU들 각각의 성분 (예를 들어, Y, U, 또는 V) 이 적어도 하나의 비-제로 계수를 포함한다고, 또는 서브-TU들이 각각 다른 서브-TU들로 스플릿된다고 가정한다. 이러한 예에서, 다시 한번, 이전에 설명된 바와 같이, 적어도 하나의 비-제로 계수를 포함하는 CU의 TU의 성분이 "1"의 CBF 값으로 표시되고, 그리고 서브-TU들로 스플릿되는 TU가 "1"의 TSF 값으로 표시된다고 가정하면, 모드 선택 유닛 (40) 은 변환 유닛 (52) 과 함께 각각 "1"의 값을 가지는, 서브-TU들에 대한 TSF들을 엔트로피 인코딩 유닛 (56) 으로 제공할 수도 있다. 대안적으로는, 엔트로피 인코딩 유닛 (56) 은 각각의 CBF도 역시 "1"의 값을 가지는, 그 성분에 대응하는 서브-TU들에 대한 CBF들을, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다.
서브-TU들에 대한 CBF들을 공동으로 인코딩하는 경우에서는, 다시 한번 CBF들에 대응하는 서브-TU들의 각각의 특정한 성분이 적어도 하나의 비-제로 계수를 포함하는 경우가 인코딩 콘텍스트가 주어지면 그 서브-TU들에 대한 가장 가능한 경우라고 가정하면, 엔트로피 인코딩 유닛 (56) 은 최단 코드워드를 표 4 로부터 선택할 수도 있다. 서브-TU들에 대한 TSF를 공동으로 인코딩하는 경우에서는, 다시 한번 서브-TU들이 다른 서브-TU들로 스플릿되는 경우가 인코딩 콘텍스트가 주어지면 서브-TU들에 대한 가장 가능한 경우라고 가정하면, 엔트로피 인코딩 유닛 (56) 은 또한 최단 코드워드를 표 5 로부터 선택할 수도 있다. 어떠한 경우에서도, 이러한 예에서, 엔트로피 인코딩 유닛 (56) 은 코드워드 "1"을 선택하여 서브-TU들에 대한 CBF들 또는 TSF들을 나타낼 것이다.
아래에서 더 상세하게 논의되는, 도 3 의 비디오 디코더 (30) 를 간략하게 참조하면, 비디오 디코더 (30) 는 표 1 내지 표 5 의 예들에서 비디오 인코더 (20) 에 의하여 선택된 코드워드들 중 임의의 것에 대응하는 코드워드 "1"을 최종적으로 수신할 수도 있다. 따라서, 비디오 디코더 (30) 는 표 1 또는 표 2, 및, 몇몇 경우들에서는, 표 3 에서 묘사된 VLC 테이블과 실질적으로 유사한 VLC 테이블을 이용하여 코드워드를 디코딩하여, TU에 대한 하나 이상의 CBF들 및 TSF를 결정할 수도 있다. 마찬가지로, 비디오 디코더 (30) 는 코드워드를 표 4 또는 표 5 에서 묘사된 VLC 테이블과 실질적으로 유사한 VLC 테이블을 이용하여 디코딩하여 CU의 TU의 서브-TU들에 대한 CBF들 또는 TSF들을 개별적으로 결정할 수도 있다.
일 예로서, 표 1 을 이용하여, 비디오 디코더 (30) 는 TU의 모든 성분들 (즉, Y, U, 및 V 성분들) 이 적어도 하나의 비-제로 계수를 포함한다고, 그리고 TU가 서브-TU들로 스플릿된다고 코드워드에 기초하여 결정할 수도 있다. 마찬가지로, 표 2 또는 표 3 을 이용하여, 비디오 디코더 (30) 는 TU의 휘도 성분 (즉, Y 성분) 및 색차 성분들 (즉, U 및 V 성분들) 의 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다고, 그리고 TU가 서브-TU들로 스플릿된다고, 또는 색차 성분들의 양자가 적어도 하나의 비-제로 계수를 포함한다고, 코드워드에 기초하여 개별적으로 결정할 수도 있다. 다른 예로서, 표 4 를 이용하여, 비디오 디코더 (30) 는 서브-TU들 각각의 성분 (예를 들어, Y, U, 또는 V 성분) 이 적어도 하나의 비-제로 계수를 포함한다는 것을 코드워드에 기초하여 결정할 수도 있다. 마찬가지로, 표 5 를 이용하여, 비디오 디코더 (30) 는 서브-TU들이 각각의 다른 서브-TU들로 스플릿된다는 것을 코드워드에 기초하여 결정할 수도 있다. 이러한 예들에서는, 이전에 설명된 바와 같이, TU에 대한 하나 이상의 CBF들 및/또는 TSF (예를 들어, TU에 대한 CBFY, CBFU, CBFV, 및 TSF, 또는 CBFU 및 CBFV) 및 서브-TU들에 대한 CBF들 또는 TSF들을 개별적으로 표시하기 위하여 이용되는 두 개 내지 네 개의 비트들이 아니라 단일 비트를 포함하는 코드워드에 기인하여, 비트 절감들이 달성될 수도 있다.
표 1 내지 표 5 가 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를, 그리고 CU의 TU의 서브-TU들에 대한 CBF들 또는 TSF들을 인코딩하기 위하여 이용되는 VLC 테이블들의 예들에 지나지 않는다는 것이 이해되어야 한다. 표 1 내지 표 5 내의 VLC 테이블들의 매핑들이, 본 개시물의 기법들에 따라서 이용되는 VLC 테이블들에 대하여 존재할 수도 있는 다수 개의 가능한 매핑들 중 일부의 예들로서 제공된다.
표 1 의 VLC 테이블에서 도시되는 바와 같이, 적어도 하나의 비-제로 계수를 포함하는 CU의 TU의 모든 성분들에, 그리고 서브-TU들로 스플릿되는 TU에 대응하는 CBF 및 TSF 값들은 VLC 테이블 내의 최단 코드워드로 매핑된다. 마찬가지로, 표 2 의 VLC 테이블에서 도시되는 바와 같이, 적어도 하나의 비-제로 계수를 포함하는 CU의 TU의 휘도 성분 및 색차 성분들의 적어도 하나에 그리고 서브-TU들로 스플릿되는 TU에 대응하는 CBF 및 TSF 값들이 VLC 테이블 내의 최단 코드워드로 매핑된다. 또한, 표 3 의 VLC 테이블에서 도시되는 바와 같이, 적어도 하나의 비-제로 계수를 포함하는 TU의 양자의 색차 성분들에 대응하는 CBF 값들이 VLC 테이블 내의 최단 코드워드로 매핑된다. 마지막으로, 표 4 및 표 5 의 VLC 테이블들 내에서 도시되는 바와 같이, 적어도 하나의 비-제로 계수를 포함하는 CU의 TU의 모든 서브-TU들의 성분에 대응하는 CBF 값들, 및 다른 서브-TU들로 스플릿되는, CU의 TU의 서브-TU들에 대응하는 TSF 값들이 각각의 VLC 테이블 내의 최단 코드워드로 매핑된다. 위의 예들 각각에서는, 특정한 매핑은, 대응하는 CBF 및/또는 TSF 값들이 그 인코딩 콘텍스트에 대하여 VLC 테이블에 의하여 정의되는 가능성들 중에서 가장 가능한 값들로 결정된다는 것을 표시한다. 다른 예들에서는, 다른 CBF 및 TSF 값들이 가장 가능한 것으로 결정될 수도 있다. 예를 들어, CU의 TU의 모든 성분들이 임의의 비-제로 계수들을 포함하지 않는다는 것을 표시하는 CBF 값들, 및 TU가 서브-TU들로 스플릿되지 않는다는 것을 표시하는 TSF 값이 가장 가능한 것으로 결정될 수도 있다. 마찬가지로, CU의 TU의 서브-TU들의 각각의 성분이 임의의 비-제로 계수들을 포함하지 않는다는 것을 표시하는 CBF 값들, 또는 CU의 TU의 서브-TU들 각각이 다른 서브-TU들로 스플릿되지 않는다는 것을 표시하는 TSF 값들도 역시 가장 가능한 것으로 결정될 수도 있다.
또한, 상이한 VLC 테이블들은 상이한 매핑들을 TU 및 서브-TU들에 대한 인코딩 콘텍스트에 기초하여 제공할 수도 있다. 따라서, 선택된 상이한 VLC 테이블들에 대하여, 상이한 CBF 및/또는 TSF 값들의 상대적인 우도들을 표시하는 대응하는 매핑은 변동할 수도 있고, 그리고, 선택된 주어진 VLC 테이블에 대하여, 매핑은 CU의 다른 TU들에 대한 CBF 및/또는 TSF 값들, 및 하나 이상의 이전에 인코딩된 CU들의 TU들에 기초하여 연속적으로 업데이트될 수도 있다.
몇몇 예들에서는, 위에서 설명된 바와 같이, TU에 대하여, 또는 서브-TU들에 대하여 결정된 다중 인코딩 콘텍스트들은 공통 VLC 테이블, 예를 들어 표 1 내지 표 5 중 임의의 하나에 대응할 수도 있다. 따라서, 그럼에도 불구하고 상이한 인코딩 콘텍스트들이, TU에 대한 하나 이상의 CBF들 및 TSF, 또는 TU의 서브-TU들에 대한 CBF들 또는 TSF들을 코딩하기 위한 공통 VLC 테이블을 이용하여 초래될 수도 있는데, 이것은 시스템 복잡성 및 코딩 리소스들을 감소시킬 수도 있다.
예를 들기 위한 목적에서, 위의 표 1 내지 표 5 는 단항 (unary) 코드워드들을 사용하여 CU의 TU에 대한 하나 이상의 CBF들 및 TSF, 및 TU의 서브-TU들에 대한 CBF들 또는 TSF들을 나타낸다. 그러나, 가변장 코드들의 다른 타입들이 다른 예들에서, 예를 들어 지수적-골롬 (Exponential-Golomb), 또는 다른 허프만 코드들 (Huffman codes), 또는 산술적 코드들에서 이용될 수도 있다. 몇몇 예들에서는, 표 1 내지 표 5 내의 어떤 코드워드들은, 예를 들어 각각의 코드워드에 대응하는 CBF 및/또는 TSF 값들의 확률들이 대략적으로 동일한 경우에는 유사한 비트-길이들을 가질 수도 있다. 또한, 코드워드들 각각이 고유하게 디코딩가능한 (예를 들어, 코드워드들 중 어느 것도 동일한 테이블 내의 다른 코드워드의 프리픽스 (prefix) 가 아닌) 한 코드워드들의 임의의 세트가 표 1 내지 표 5 에 대하여 이용될 수도 있다.
비디오 인코더 (20) 는 하나 이상의 코드워드들을 이용하여 CU를 인코딩하여 TU에 대한 하나 이상의 CBF들 및 TSF, 및/또는 서브-TU들에 대한 CBF들 또는 TSF들을 포함할 수도 있다. 예를 들어, 엔트로피 인코딩 유닛 (56) 은 하나 이상의 코드워드들을, 위에서 설명된 바와 같이 CU에 대한 인코딩된 구문 정보의 일부로서 포함할 수도 있다. 위에서 설명된 VLC 코딩 기법들을 이용하는 것이, 평균적인 경우에서는, 코드워드들에 의하여 표현되는 개별적으로 코딩된 CBF들 및 TSF들보다 더 적은 비트들을 포함하는 하나 이상의 코드워드들을 초래할 수도 있기 때문에, 본 개시물의 기법들을 이용하는 경우에는 코드워드들을 포함하는 코딩된 비트스트림에 대한 상대적인 비트 절감들이 존재할 수도 있다.
역양자화 유닛 (58) 및 역변환 유닛 (60) 은 역양자화 및 역변환을 각각 적용하여, 잔여 블록을, 예를 들어 참조 블록으로서 추후 이용되도록 픽셀 도메인에서 재구성한다. 모션 보상 유닛 (44) 은 잔여 블록을 참조 프레임 저장소 (64) 의 프레임들 중 하나의 예측성 블록에 가산하여 참조 블록을 연산할 수도 있다. 또한, 모션 보상 유닛 (44) 은 하나 이상의 보간 필터들을 재구성된 잔여 블록에 적용함으로써 모션 추정에서 이용하기 위한 서브-정수 픽셀 값들을 연산할 수도 있다. 합산기 (62) 는 재구성된 잔여 블록을 모션 보상 유닛 (44) 에 의하여 생성된 모션 보상된 예측 블록에 가산하여, 참조 프레임 저장소 (64) 에 저장하기 위한 재구성된 비디오 블록을 생성한다. 재구성된 비디오 블록은 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 에 의하여, 후속 비디오 프레임 내의 블록들을 인터-코딩하기 위한 참조 블록으로서 이용될 수도 있다.
이러한 방식으로, 도 2 의 비디오 인코더 (20) 는, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하도록, TU가 서브-TU들로 스플릿되는지의 여부를 결정하도록, 코드워드를 VLC 테이블로부터 선택하되, 여기에서 VLC 테이블은 코드워드가 이러한 결정들에 대응한다는 표시를 제공하도록, 그리고 그 코드워드를 그 TU에 대하여 제공하도록 구성되는 비디오 인코더를 포함하는, 비디오 데이터를 인코딩하기 위한 장치의 일 예를 나타낸다.
도 3 은, 비디오 데이터의 CU의 TU에 대한 공동으로 인코딩된 하나 이상의 CBF들 및 TSF를 디코딩하기 위한 기법들을 구현할 수도 있는 비디오 디코더 (30) 의 일 예를 도시하는 블록도이다. 도 3 의 예에서, 비디오 디코더 (30) 는 엔트로피 디코딩 유닛 (70), 모션 보상 유닛 (72), 인트라-예측 유닛 (74), 역양자화 유닛 (76), 역변환 유닛 (78), 참조 프레임 저장소 (82) 및 합산기 (80) 를 포함한다. 몇몇 예들에서, 비디오 디코더 (30) 는 비디오 인코더 (20) (도 2) 와 관련하여 설명된 인코딩 패스 (encoding pass) 와 일반적으로 역인 디코딩 패스를 수행할 수도 있다. 모션 보상 유닛 (72) 은 엔트로피 디코딩 유닛 (70) 으로부터 수신된 모션 벡터들에 기초하여 예측 데이터를 생성할 수도 있다. 인트라 예측 유닛 (74) 은 대응하는 CU에 대하여 엔트로피 디코딩 유닛 (70) 으로부터 수신된 인트라-예측 모드에 기초하여 예측 데이터를 생성할 수도 있다.
비디오 디코더 (30) 는, 예를 들어 비디오 인코더 (20) 에 의하여 인코딩된 비디오 데이터 (예를 들어, 하나 이상의 CU들) 을 수신할 수도 있다. 대안적으로는, 비디오 디코더 (30) 는 인코딩된 비디오 데이터를 저장 매체, 예컨대 CD-ROM, 블루-레이 디스크, 플래시 드라이브, 하드 드라이브, 또는 다른 저장 매체로부터 수신할 수도 있다. 또 다시, 일 예로서, 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF는 공동으로 코딩될 수도 있다. 본 개시물의 기법들에 따르면, 엔트로피 디코딩 유닛 (70) 은 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 그 TU에 대한 코드워드에 기초하여 결정하고, TU가 서브-TU들로 스플릿되는지의 여부를 그 코드워드에 기초하여 결정하며, 그리고 상기 결정들에 기초하여 그 TU를 디코딩하도록 구성될 수도 있다.
몇몇 예들에서는, 엔트로피 디코딩 유닛 (70) 은, 도 2 를 참조하여 이전에 설명된 바와 같이, TU에 대한 디코딩 콘텍스트를 엔트로피 인코딩 유닛 (56) 에 의하여 이용된 것과 실질적으로 유사한 방식으로 결정하여, 그 코드워드를 포함하는 특정한 VLC 테이블을 선택하도록 구성될 수도 있다. 예를 들어, 디코딩 콘텍스트는 TU의 다양한 특징들, 예를 들어: 그 TU에 대응하는 PU에 대한 예측 모드; 그 TU에 대한 파티션 레벨; 및 그 코드워드에 의하여 표현되는 TU의 성분들의 개수; 중 하나 이상을 포함할 수도 있다
엔트로피 디코딩 유닛 (70) 은 디코딩 콘텍스트를 이용하여 VLC 테이블을 선택할 수도 있다. 또한, TU의 색차 성분들에 대한 CBF들 중 하나가 코딩되고 그리고 다른 것이 추론되며, 따라서, 다른 CBF와 함께 공동으로 코딩되지 않는 경우에는, 엔트로피 디코딩 유닛 (70) 은 어떤 CBF가 코딩되고 그리고 어떤 CBF가 추론되는지와 무관하게 동일한 VLC 테이블을 선택할 수도 있다. 이러한 예들에서는, VLC 테이블은 코드워드들의 CBF 및 TSF 값들로의 매핑을 포함할 수도 있다. 또한, TU에 대한 TSF가 추론되고, 그리고 그러므로, TU에 대한 하나 이상의 CBF들과 함께 공동으로 코딩되지 않는 경우에는, 엔트로피 디코딩 유닛 (70) 은 TSF가 하나 이상의 CBF들과 함께 코딩되는 경우와는 상이한 VLC 테이블을 선택할 수도 있다. 또한, 엔트로피 디코딩 유닛 (70) 은 추론된 TSF의 값에 기초하여 상이한 VLC 테이블을 선택할 수도 있다. 이러한 예들에서는, VLC 테이블은 코드워드들의 CBF 값들로의 매핑을 포함할 수도 있다.
VLC 테이블을 이용함으로써, 엔트로피 디코딩 유닛 (70) 은 TU의 하나 이상의 성분들이 적어도 하나의 비-제로 계수를 포함하는지, 즉, 코딩되는지의 여부를, 그리고 TU가 서브-TU들로 스플릿되는지의 여부를 그 코드워드에 기초하여 결정할 수도 있다. 또한, 엔트로피 디코딩 유닛 (70) 은, 어떤 결정들이 그 디코딩 콘텍스트에 대하여 더 많이 또는 더 적게 발생할 것 같은지를 반영하기 위해, 예를 들어 VLC 테이블 내의 매핑을 그 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하기 위하여 비디오 인코더 (20) 에 의하여 이용되는 대응하는 VLC 테이블 내의 매핑과 조율하기 위해, 코드워드들 및 VLC 테이블 내의 CBF 및 TSF 값들 간의 매핑을 위의 결정들에 기초하여 업데이트할 수도 있다.
또 다시, 일 예로서, 엔트로피 디코딩 유닛 (70) 은 TU의 휘도 성분에 대한 공동으로 인코딩된 CBF, 예를 들어 CBFY, TU의 양자의 색차 성분들에 대한 CBF, 예를 들어 이전에 설명된 바와 같은 CBFC, 및 TU에 대한 TSF를 디코딩하도록 구성될 수도 있다. 예를 들어, 성분이 TU의 제 1 색차 성분을 포함하고, 그리고 여기에서, TU가 제 2 의 상이한 색차 성분을 더 포함하는 경우들에서는, 엔트로피 디코딩 유닛 (70) 은 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 코드워드에 기초하여 결정하도록, 즉 그 TU에 대한 CBFC를 결정하도록 더 구성될 수도 있다.
또 다시, 색차 성분들 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다고 TU에 대한 CBFC 값이 표시하는 경우에서는, 엔트로피 디코딩 유닛 (70) 은 각각의 개별 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 표시하는 추가적 정보를 디코딩하도록 더 구성될 수도 있다. 그러나, 몇몇 예들에서는, 색차 성분들에 대한 두 개의 CBF들 중 하나의 값이 추론될 수 있는 경우에, 엔트로피 디코딩 유닛 (70) 은 추가적 정보를 디코딩하지 않도록 구성될 수도 있다.
몇몇 예들에 따르면, 추가적 정보를 디코딩하기 위하여, 엔트로피 디코딩 유닛 (70) 은 TU의 색차 성분들에 대한 개별적으로 인코딩된 CBF들을 디코딩하도록 구성될 수도 있다. 다른 예들에 따르면, 엔트로피 디코딩 유닛 (70) 은 TU의 색차 성분들에 대한 공동으로 인코딩된 CBF들을, 비디오 데이터의 CU의 TU에 대한 공동으로 인코딩된 하나 이상의 CBF들 및 TSF를 디코딩하는 것에 대하여 위에서 설명된 것과 유사한 방식으로 디코딩하도록 구성될 수도 있다.
예를 들어, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는 경우들에서는, 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 코드워드에 기초하여 결정하기 위하여, 엔트로피 디코딩 유닛 (70) 은, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다고 코드워드에 기초하여 결정한 이후에, 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 TU에 대한 제 2 의 상이한 코드워드에 기초하여 결정하도록 더 구성될 수도 있다. 엔트로피 디코딩 유닛 (70) 은 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 제 2 코드워드에 기초하여 결정하도록 더 구성될 수도 있다.
이러한 예에서, 또 다시, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 제 2 디코딩 콘텍스트를, 이전에 설명된 바와 같이, 엔트로피 인코딩 유닛 (56) 에 의하여 이용된 것과 실질적으로 유사한 방식으로 결정하여, 제 2 코드워드를 포함하는 제 2 VLC 테이블을 선택하도록 구성될 수도 있다. 예를 들어, 제 2 디코딩 콘텍스트는: CU에 대한 파티션 레벨; 그 TU에 대한 파티션 레벨; 그 TU에 대응하는 PU에 대한 예측 모드; 및 그 TU의 이웃하는 TU들의 제 1 색차 성분들 및 제 2 색차 성분들에 대응하는 CBF 값들; 중 하나 이상을 포함할 수도 있다. 예를 들어, 이웃하는 TU들은, 공동으로 인코딩된 CBF들 및 TSF들이 본 명세서에서 설명된 바와 동일한 방식으로 이전에 디코딩되었던 대상인 CU의 다른 TU들일 수도 있다. 몇몇 예들에서는, 엔트로피 디코딩 유닛 (70) 은 제 1 VLC 테이블 및 제 2 VLC 테이블 모두를 선택하기 위하여 동일한 디코딩 콘텍스트를 이용할 수도 있는데, 이러한 경우에는 위에서 논의된 제 1 및 제 2 인코딩 콘텍스트들이 동일한 콘텍스트를 포함할 수도 있다.
또 다시, 엔트로피 디코딩 유닛 (70) 은 제 2 디코딩 콘텍스트를 이용하여 제 2 VLC 테이블을 선택할 수도 있다. 예를 들어, 제 2 VLC 테이블은 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 포함할 수도 있다. 제 2 VLC 테이블을 이용함으로써, 엔트로피 디코딩 유닛 (70) 은 TU의 색차 성분들 각각이 적어도 하나의 비-제로 계수를 포함하는지, 즉 코딩되는지의 여부를 제 2 코드워드에 기초하여 결정할 수도 있다. 또한, 엔트로피 디코딩 유닛 (70) 은, 어떤 결정들이 제 2 디코딩 콘텍스트에 대하여 더 많이 또는 더 적게 발생할 것 같은지를 반영하기 위해, 예를 들어 제 2 VLC 테이블 내의 매핑을, TU에 대한 CBFU 및 CBFV를 공동으로 인코딩하기 위하여 엔트로피 인코딩 유닛 (56) 에 의하여 이용되는 대응하는 VLC 테이블 내의 매핑과 조율하기 위해, 코드워드들 및 제 2 VLC 테이블 내의 CBFU 및 CBFV 값들 간의 매핑을 위의 결정들에 기초하여 업데이트할 수도 있다.
또 다시, 또 다른 예로서, TU의 서브-TU들에 대한 CBF들 또는 TSF들은 공동으로 코딩될 수도 있다. 예를 들어, TU가 서브-TU들로 스플릿되는 경우에는, 엔트로피 디코딩 유닛 (70) 은 서브-TU들이 다른 서브-TU들로 스플릿되는지의 여부를 서브-TU들에 대한 제 2 의 상이한 코드워드에 기초하여 결정하도록 더 구성될 수도 있다. 마찬가지로, 엔트로피 디코딩 유닛 (70) 은 TU의 성분에 대응하는 서브-TU들의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 그 서브-TU들에 대한 제 2 코드워드에 기초하여 결정하도록 구성될 수도 있다.
또 다시, 이러한 예들에서는, 제 2 코드워드는 VLC 코드워드를 역시 포함할 수도 있다. 제 2 코드워드는 서브-TU들에 대한 CBF들 또는 TSF들을, 제 2 의 상이한 디코딩 콘텍스트를 이용하여 선택된 제 2 의 상이한 VLC 테이블을 이용하여 결정하기 위하여 이용될 수도 있다. 예를 들어, 서브-TU들에 대한 공동으로 인코딩된 TSF들을 디코딩하는 경우에는, 제 2 디코딩 콘텍스트는 그 서브-TU들에 대한 CBF들, 예를 들어 그 서브-TU들의 Y 성분들에 대응하는 CBF들의 값들을 포함할 수도 있다. 마찬가지로, 서브-TU들에 대한 공동으로 인코딩된 CBF들을 디코딩하는 경우에는, 제 2 디코딩 콘텍스트는 그 서브-TU들에 대한 TSF들의 값들을 포함할 수도 있다.
일 예로서, 표 1 내지 표 5 의 VLC 테이블들을 다시 참조하면서, 비디오 데이터의 CU의 TU에 대한, 엔트로피 디코딩 유닛 (70) 에 의하여 수신되는 코드워드가 "1"을 포함한다고 가정한다. 이러한 예에서, 엔트로피 디코딩 유닛 (70) 은 표 1, 또는 표 2, 및, 몇몇 경우들에서는, 표 3 에서 묘사된 코드워드 및 VLC 테이블들을 이용하여 그 TU에 대한 하나 이상의 CBF들 및 TSF를 결정할 수도 있다. 특히, 이러한 예에서, 표 1 은 코드워드가 적어도 하나의 비-제로 계수를 포함하는 TU의 모든 성분들 (즉, Y, U, 및 V 성분들) 에 대응하며, 그리고 TU는 서브-TU들로 스플릿된다는 것을 표시한다. 따라서, 엔트로피 디코딩 유닛 (70) 은 표 1 에 대응하는 디코딩 콘텍스트를 가지는 CU의 TU에 대하여, 그리고 값 "1"을 가지며 그 TU에 대하여 수신된 코드워드에 대하여, 그 TU의 모든 성분들이 적어도 하나의 비-제로 계수를 포함한다는 것, 그리고 그 TU가 서브-TU들로 스플릿된다는 것을 결정할 수도 있다.
마찬가지로, 엔트로피 디코딩 유닛 (70) 에 의하여 수신된 코드워드가 TU에 대한 제 1 코드워드를 포함한다고 가정한다. 이러한 예에서, 표 2 는 코드워드가 적어도 하나의 비-제로 계수를 포함하는 TU의 색차 성분들 (즉, U 및 V 성분들) 중 적어도 하나 및 휘도 성분 (즉 Y 성분) 에 대응한다는 것, 그리고 TU가 서브-TU들로 스플릿된다는 것을 표시한다. 따라서, 엔트로피 디코딩 유닛 (70) 은, 표 2 에 대응하는 디코딩 콘텍스트를 가지는, CU의 TU에 대하여, 그리고 값 "1"을 가지는, 그 TU에 대하여 수신된 제 1 코드워드에 대하여, 그 TU의 색차 성분들의 적어도 하나 및 휘도 성분이 적어도 하나의 비-제로 계수를 포함한다는 것, 그리고 TU가 서브-TU들로 스플릿된다는 것을 결정할 수도 있다.
또한, 이러한 예에서, 엔트로피 디코딩 유닛 (70) 에 의하여 수신되는, TU에 대한 제 2 코드워드가 역시 "1"을 포함한다고 가정한다. 표 3 은 제 2 코드워드가 적어도 하나의 비-제로 계수를 포함하는, TU의 양자의 색차 성분들 (즉, U 및 V 성분들) 에 대응한다는 것을 표시한다. 따라서, 엔트로피 디코딩 유닛 (70) 은 표 3 에 대응하는 디코딩 콘텍스트를 가지는 CU의 TU에 대하여, 그리고 값 "1"을 가지며 그 TU에 대하여 수신된 제 2 코드워드에 대하여, 그 TU의 색차 성분들 모두가 적어도 하나의 비-제로 계수를 포함한다는 것을 결정할 수도 있다.
다른 예로서, 엔트로피 디코딩 유닛 (70) 에 의하여 수신된 비디오 데이터의 CU의 TU의 서브-TU들에 대한 코드워드가 "1"을 포함한다고 가정한다. 이러한 예에서, 표 4 는, 적어도 하나의 비-제로 계수를 포함하는, 서브-TU들 각각의 성분 (즉, Y, U, 또는 V 성분) 에 코드워드가 대응한다는 것을 표시하고, 그리고 표 5 는 그 코드워드가 다른 서브-TU들로 스플릿되는 서브-TU들 각각에 대응한다는 것을 표시한다. 따라서, 이러한 경우에는, 엔트로피 디코딩 유닛 (70) 은, 표 4 또는 표 5 에 대응하는 디코딩 콘텍스트를 가지는, CU의 TU의 서브-TU들에 대하여, 그리고 값 "1"을 가지는, 그 서브-TU들에 대하여 수신된 코드워드에 대하여, 그 서브-TU들 각각의 성분이 표 4 의 경우에서는 적어도 하나의 비-제로 계수를 포함한다는 것, 즉, 코딩된다는 것, 그리고 표 5 의 경우에서는, 서브-TU들 각각이 다른 서브-TU들로 스플릿된다는 것을 결정할 수도 있다.
비디오 디코더 (30) 는 CU를, 하나 이상의 코드워드들을 이용하여 결정된, TU에 대한 하나 이상의 CBF들 및 TSF, 및/또는 서브-TU들에 대한 CBF들 또는 TSF들을 이용하여 디코딩할 수도 있다. 일 예로서, 역변환 유닛 (78) 및/또는 역양자화 유닛 (76) 은, 역변환 및 역양자화를 수행하기 위하여, 결정된 CBF들을 이용하여 CU의 하나 이상의 TU들 중 어떤 TU들이 적어도 하나의 비-제로 계수를 포함하는 성분들을 포함하는지 결정하고, 그리고 결정된 TSF들을 이용하여 하나 이상의 TU들에 대한 파티션 정보를 생성할 수도 있다. 또 다시, 위에서 설명된 VLC 코딩 기법들을 이용하는 것이, 평균적인 경우에서는, 코드워드들에 의하여 표현되는 개별적으로 코딩된 CBF들 및 TSF들보다 더 적은 비트들을 포함하는 하나 이상의 코드워드들을 초래할 수도 있기 때문에, 본 개시물의 기법들을 이용하는 경우에는 코드워드들을 포함하는 코딩된 비트스트림에 대한 상대적인 비트 절감들이 존재할 수도 있다.
모션 보상 유닛 (72) 은 비트스트림 내에서 수신된 모션 벡터들을 이용하여 참조 프레임 저장소 (82) 내의 참조 프레임들 내에서 예측 블록을 식별할 수도 있다. 인트라 예측 유닛 (74) 은 비트스트림 내에서 수신된 인트라 예측 모드들을 이용하여 예측 블록을 공간적으로 인접한 블록들로부터 형성할 수도 있다.
인트라-예측 유닛 (74) 은 인코딩된 블록에 대한 인트라-예측 모드의 표시를 이용하여, 예를 들어 이웃하는, 이전에 디코딩된 블록들의 픽셀들을 이용하여, 인코딩된 블록을 인트라-예측할 수도 있다. 블록이 인터-예측 모드 인코딩되는 예들에 대해서는, 인코딩된 블록에 대한 모션 보상된 예측 데이터를 취출하기 위하여, 모션 보상 유닛 (72) 은 모션 벡터를 정의하는 정보를 수신할 수도 있다. 어떠한 경우에서도, 모션 보상 유닛 (72) 또는 인트라-예측 유닛 (74) 은 예측 블록을 정의하는 정보를 합산기 (80) 로 제공할 수도 있다.
역양자화 유닛 (76) 은, 비트스트림 내에서 제공되며 엔트로피 디코딩 유닛 (70) 에 의하여 디코딩되는 양자화된 블록 계수들을 역 양자화, 즉, 양자화-해제 (de-quantize) 한다. 역 양자화 프로세스는, 예를 들어 H.264 디코딩 표준에 의하여 정의되거나 또는 HM에 의하여 수행되는 바와 같은 통상적인 프로세스를 포함할 수도 있다. 또한, 역 양자화 프로세스는, 각각의 블록에 대하여 인코더 (50) 에 의하여 연산된 양자화 파라미터 (QPY) 를 이용하여 양자화의 정도 및 이와 유사하게 적용되어야 하는 역 양자화의 정도를 결정하는 것을 포함할 수도 있다.
역변환 유닛 (78) 은 픽셀 도메인에서 잔여 블록들을 생성하기 위하여, 역변환, 예를 들어 역 DCT, 역 정수 변환, 또는 개념적으로 유사한 역 변환 프로세스를 변환 계수들에 적용한다. 위에서 설명된 바와 같이, 본 개시물의 기법들에 따르면, CU의 하나 이상의 TU들의 변환 계수들이 어떻게 파티셔닝되는지를 기술하는 구문 정보는 하나 이상의 TU들에 대하여 공동으로, 몇몇 경우들에서는 다른 구문 정보와 함께 코딩되고, 그리고 본 명세서에서 설명된 바와 같이 역변환 유닛 (78) 에 의하여 이용될 수도 있다.
모션 보상 유닛 (72) 은, 어쩌면 보간 필터들에 기초한 보간을 수행하여 모션 보상된 블록들을 생성한다. 서브-픽셀 정밀도 (sub-pixel precision) 를 가지는 모션 추정을 위하여 이용될 보간 필터들에 대한 식별자들이 구문 엘리먼트들 내에 포함될 수도 있다. 모션 보상 유닛 (72) 은, 비디오 블록의 인코딩 도중에 비디오 인코더 (20) 에 의하여 이용되는 바와 같은 보간 필터들을 이용하여 참조 블록의 서브-정수 픽셀들에 대한 보간된 값들을 연산할 수도 있다. 모션 보상 유닛 (72) 은 수신된 구문 정보에 따라서 비디오 인코더 (20) 에 의하여 이용되는 보간 필터들을 결정하고 그리고 이 보간 필터들을 이용하여 예측성 블록들을 생성할 수도 있다.
모션 보상 유닛 (72) 은 인코딩된 블록에 대한 구문 정보의 일부를 이용하여, 인코딩된 비디오 시퀀스의 프레임 (들) 을 인코딩하기 위하여 이용되는 블록들의 사이즈들, 인코딩된 비디오 시퀀스의 프레임 또는 슬라이스의 각각의 블록이 어떻게 파티셔닝되는지를 기술하는 파티션 정보, 각각의 파티션이 어떻게 인코딩되는지를 표시하는 모드들, 각각의 인터-인코딩된 블록 또는 파티션에 대한 하나 이상의 참조 프레임들 (및/또는 참조 프레임 리스트들), 및 인코딩된 비디오 시퀀스를 디코딩하기 위한 다른 정보를 결정한다.
합산기 (80) 는 잔여 블록들을 모션 보상 유닛 (72) 또는 인트라-예측 유닛 (74) 에 의하여 생성된 대응하는 예측 블록들과 합산하여 디코딩된 블록들을 형성한다. 원하는 경우, 블록화 아티팩트들을 제거하기 위하여, 디블록킹 필터가 적용되어 디코딩된 블록들을 필터링할 수도 있다. 그러면, 디코딩된 비디오 블록들이 참조 프레임 저장소 (82) 내에 저장되는데, 이것이 후속 모션 보상을 위한 참조 블록들을 제공하고, 그리고 또한 디스플레이 디바이스 (도 1 의 디스플레이 디바이스 (32) 와 같은 디바이스) 상에서의 프리젠테이션을 위한 디코딩된 비디오를 생성한다.
이러한 방식으로, 도 3 의 비디오 디코더 (30) 는, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 그 TU에 대한 코드워드에 기초하여 결정하고, TU가 서브-TU들로 스플릿되는지의 여부를 그 코드워드에 기초하여 결정하며, 그리고 상기 결정들에 기초하여 그 TU를 디코딩하도록 구성되는 비디오 디코더를 포함하는 비디오 데이터를 디코딩하기 위한 장치의 일 예를 나타낸다.
도 4 는 비디오 데이터의 CU들의 TU들의 예들을 도시하는 개념도이다. 도 4 에 묘사된 바와 같이, 비디오 프레임 (400) 의 현재 CU (402) 는 현재-코딩되는 CU를 나타낼 수도 있다. 예를 들어, 현재 CU (402) 는, 이전에 설명된 바와 같이, LCU와 연관된 CU 쿼드트리 내의 리프-노드에 대응하는, 비디오 프레임 (400) 의 LCU의 서브-CU를 나타낼 수도 있다. 현재 CU (402) 는 임의의 사이즈, 예를 들어 8x8, 16x16, 32x32, 또는 64x64 픽셀들을 가질 수도 있다. 도 4 에 묘사된 바와 같이, 현재 CU (402) 는 현재 TU (404) 를 포함할 수도 있고, 이것은 이제 Y 성분 (410), U 성분 (412), 및 V 성분 (414) 의 각각을 포함할 수도 있다. 예를 들어, Y 성분 (410) 은 현재 TU (404) 의 휘도 성분에 대응할 수도 있고, 그리고 U 성분 (412) 및 V 성분 (414) 은 현재 TU (404) 의 제 1 색차 성분 및 제 2 색차 성분에 각각 대응할 수도 있다.
이러한 예에서, 도 4 에 예시된 바와 같이, 현재 TU (404) 의 사이즈는 현재 CU (402) 의 사이즈에 대응할 수도 있다. 또한, Y 성분 (410), U 성분 (412), 및 V 성분 (414) 각각의 사이즈는 현재 TU (404) 의 사이즈에 대응할 수도 있다. 다시 말하면, Y 성분 (410), U 성분 (412), 및 V 성분 (414) 각각의 사이즈는 현재 CU (402) 의 사이즈에 대응할 수도 있다. 다른 예들에 따르면, 현재 TU (404) 및 연관된 Y 성분 (410), U 성분 (412), 및 V 성분 (414) 은 서브-TU들 및 각각의 Y, U, 및 V 서브-성분들로 파티셔닝될 수도 있다. 예를 들어, 현재 TU (404) 는 4 개의 서브-TU들로 파티셔닝될 수도 있는데, 여기에서, 각각의 서브-TU는 현재 TU (404) 의, Y 성분 (410), U 성분 (412), 및 V 성분 (414) 의 서브-성분들에 대응하는 각각의 Y, U, 및 V 성분들을 포함할 수도 있다.
또한, 도 4 는 비디오 프레임 (400) 의 현재 CU (402) 의 이웃하는 CU (406) 를 도시한다. 도 4 에 도시되는 바와 같이, 이웃하는 CU (406) 는 비디오 프레임 (400) 내에서 현재 CU (402) 의 좌측으로 포지셔닝된다. 다른 예들에서는, 이웃하는 CU (406), 또는 현재 CU (402) 의 임의의 다른 이웃하는 CU는, 비디오 프레임 (400) 내에서 현재 CU (402) 상부에 포지셔닝될 수도 있다. 또 다른 예들에서는, 현재 CU (402) 의 이웃하는 CU들은 현재 CU (402) 에 이웃하는 다른 위치들에서 포지셔닝될 수도 있다. 또한, 도 4 에서 도시된 바와 같이, 이웃하는 CU (406) 는 이웃하는 TU (408) 를 포함할 수도 있는데, 이것이 Y 성분 (416), U 성분 (418), 및 V 성분 (420) 을 포함할 수도 있으며, 여기에서, 이웃하는 TU (408) 및 연관된 Y 성분 (416), U 성분 (418), 및 V 성분 (420) 은, 현재 TU (404) 에 대하여 위에서 설명된 바와 실질적으로 유사한 방식으로 서브-TU들 및 각각의 Y, U, 및 V 서브-성분들로 파티셔닝될 수도 있다.
현재 TU (404) 를 포함하는, 현재 CU (402) 의 각각의 TU에 대하여, 그리고 이웃하는 TU (408) 를 포함하는, 이웃하는 CU (406) 의 각각의 TU에 대하여, 각각의 TU의 하나 이상의 성분들, 예를 들어 Y, U, 또는 V 성분들의 하나 이상이 적어도 하나의 비-제로 계수를 포함하는지, 즉 코딩되는지의 여부를, 그리고 TU가 서브-TU들로 스플릿되는지의 여부를 기술하는 구문 정보가 제공될 수도 있다. 이러한 구문 정보는, 위에서 설명된 바와 같이, 일반적으로 그 TU에 대한 하나 이상의 CBF들 및 TSF에 대응할 수도 있다. 예를 들어, TU에 대한 하나 이상의 CBF들 및 TSF는 각각 단일-비트 값, 예를 들어 단일-비트 플래그를 이용하여 표현될 수도 있다. 몇몇 예들에서는, CBF들 중 주어진 하나의 경우에서는, 비디오 인코더 (20) 는 대응하는 단일-비트 플래그를 "1"의 값을 설정하여, CBF에 대응하는, TU의 성분이 적어도 하나의 비-제로 계수를 포함한다는 것을 표시하고, 그리고 플래그를 "0"의 값으로 설정하여 그 성분이 임의의 비-제로 계수들을 포함하지 않는다는 것을 표시할 수도 있다. 마찬가지로, TSF의 경우에서는, 비디오 인코더 (20) 는 대응하는 단일-비트 플래그를 "1"의 값으로 설정하여 TU가 서브-TU들로 스플릿된다는 것을 표시하고, 그리고 플래그를 "0"의 값으로 설정하여 TU가 스플릿되지 않는다는 것을 표시할 수도 있다.
본 개시물의 기법들에 따르면, 일 예로서, 비디오 인코더 (20) 는 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF, 예를 들어 현재 TU (404), 이웃하는 TU (408), 또는 현재 TU (404) 또는 이웃하는 TU (408) 의 임의의 서브-TU를 공동으로 인코딩할 수도 있다. 예를 들어, 현재 TU (404) 에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하는 경우에는, 비디오 인코더 (20) 는 Y 성분 (410), U 성분 (412), 및 V 성분 (414) 중 하나 이상에 대응하는 하나 이상의 CBF들을, 현재 TU (404) 에 대한 TSF와 함께 공동으로 인코딩할 수도 있다. 이전에 설명된 바와 같이, 비디오 인코더 (20) 는 하나 이상의 CBF들 및 TSF를 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있다. 이와 같이, 비디오 디코더 (30) 는 단일 VLC 코드워드를 수신하고, 그리고 그 코드워드를 디코딩하여 현재 TU (404) 에 대한 하나 이상의 CBF들 및 TSF를 결정할 수도 있다.
또한, 이전에 설명된 바와 같이, 비디오 인코더 (20) 는 현재 TU (404) 에 대한, Y 성분 (410) 에 대응하는 CBF, 즉, CBFY, 및 U 성분 (412) 및 V 성분 (414) 의 양자에 대응하는 CBF, 즉, CBFC를, 현재 TU (404) 에 대한 TSF 과 함께, 역시 단일 VLC 코드워드, 예를 들어 제 1 코드워드를 이용하여 공동으로 인코딩할 수도 있다. 추가적으로, 몇몇 경우들에서는, 비디오 인코더 (20) 는, U 성분 (412) 및 V 성분 (414) 에 대응하는 CBF들, 즉, CBFU 및 CBFV를 다른 단일 VLC 코드워드, 예를 들어 제 2 코드워드를 이용하여 공동으로 더 인코딩할 수도 있다. 또 다시, 비디오 디코더 (30) 는 하나 이상의 단일 VLC 코드워드들을 수신할 수도 있고, 그리고 그 코드워드들을 디코딩하여 현재 TU (404) 에 대한 하나 이상의 CBF들 및 TSF를 결정할 수도 있다.
이러한 예들에서는, 하나 이상의 CBF들 및 TSF를 하나 이상의 단일 VLC 코드워드들을 이용하여 공동으로 인코딩하기 위하여, 비디오 인코더 (20) 는 각각의 코드워드를 포함하는 VLC 테이블을 현재 TU (404) 에 대한 인코딩 콘텍스트에 기초하여 선택할 수도 있다. 예를 들어, 현재 TU (404) 에 대한 CBFY, CBFC, 및 TSF를 포함하는 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하는 경우에는, 인코딩 콘텍스트는: 현재 TU (404) 에 대응하는 PU에 대한 예측 모드; 현재 TU (404) 에 대한 파티션 레벨; 및 단일 VLC 코드워드에 의하여 표현될, 현재 TU (404) 의 성분들의 개수; 중 하나 이상을 포함할 수도 있다. 추가적으로, 현재 TU (404) 에 대한 CBFU 및 CBFV를 공동으로 인코딩하는 경우에는, 인코딩 콘텍스트는: 현재 CU (402) 에 대한 파티션 레벨; 현재 TU (404) 에 대한 파티션 레벨; 및 현재 TU (404) 의 이웃하는 TU들의 제 1 색차 성분들 및 제 2 색차 성분들에 대응하는 CBF 값들; 중 하나 이상을 포함할 수도 있다. 이러한 예에서, 이웃하는 TU들은, 휘도 CBF들, 색차 CBF들, 그리고 TSF들이 본 명세서에서 설명된 것과 동일한 방식으로 이전에 공동으로 인코딩되었던 대상인, 현재 CU (402) 의 다른 TU들 수도 있다. 그러면, 비디오 인코더 (20) 는 각각의 단일 VLC 코드워드를 VLC 테이블로부터 선택함으로써, VLC 테이블이, 코드워드가 현재 TU (404) 에 대한 하나 이상의 CBF들 및 TSF에, 또는 색차 CBF들에 대응한다는 표시를 제공하고, 그리고 현재 TU (404) 에 대해 그 코드워드를 제공하도록 할 수도 있다.
마찬가지로, 하나 이상의 단일 VLC 코드워드들을 디코딩하여 현재 TU (404) 에 대한 하나 이상의 CBF들 및 TSF, 또는 색차 CBF들을 결정하기 위하여, 비디오 디코더 (30) 는 각각의 코드워드를 포함하는 VLC 테이블을 현재 TU (404) 에 대한 디코딩 콘텍스트에 기초하여 또한 선택할 수도 있는데, 여기에서, 디코딩 콘텍스트는 실질적으로 인코딩 콘텍스트와 동일할 수도 있다. 이와 같이, 비디오 인코더 (20) 및 비디오 디코더 (30) 에 의하여 선택되는 VLC 테이블들은 실질적으로 동일할 수도 있다. 그러면, 비디오 디코더 (30) 는 현재 TU (404) 에 대한 하나 이상의 CBF들 및 TSF를 하나 이상의 단일 VLC 코드워드들에 기초하여 결정하고, 그리고 현재 TU (404) 를 상기 결정들에 기초하여 디코딩할 수도 있다.
다른 예로서, 비디오 인코더 (20) 는 CU의 TU의 서브-TU들, 또 다시, 예를 들어 현재 TU (404), 이웃하는 TU (408), 또는 현재 TU (404) 또는 이웃하는 TU (408) 의 임의의 서브-TU에 대한 CBF들 또는 TSF들을 공동으로 인코딩할 수도 있다. 예를 들어, 현재 TU (404) 의 서브-TU들에 대한 CBF들을 공동으로 인코딩하는 경우에는, 비디오 인코더 (20) 는, 서브-TU들의 각각의 Y 성분들에 대응하며, 현재 TU (404) 의 Y 성분 (410) 의 서브-성분들에도 대응하는, CBF들을 공동으로 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는, 서브-TU들의 Y 성분들에 대한 각각의 CBF들만이 코딩되는, 즉, 서브-TU들에 대한 다른 CBF들 및 TSF들이 추론되는 경우에, 서브-TU들에 대한 CBF들을 공동으로 인코딩할 수도 있다. 마찬가지로, 현재 TU (404) 의 서브-TU들에 대한 TSF들을 공동으로 인코딩하는 경우에는, 비디오 인코더 (20) 는, 서브-TU들에 대한 CBF들 중 어느 것도 코딩되지 않는다면, 즉, 그 서브-TU들에 대한 CBF들의 모두가 추론되는 경우에는, 그 서브-TU들에 대한 TSF들을 공동으로 인코딩할 수도 있다.
또한, 이전에 설명된 바와 같이, 비디오 인코더 (20) 는 서브-TU들 에 대한 CBF들 또는 TSF들을 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있다. 이와 같이, 비디오 디코더 (30) 는 단일 VLC 코드워드를 수신하고, 그리고 그 코드워드를 디코딩하여 그 서브-TU들에 대한 CBF들 또는 TSF들을 결정할 수도 있다.
이러한 예에서, CBF들 또는 TSF들을 단일 VLC 코드워드를 이용하여 공동으로 인코딩하기 위하여, 비디오 인코더 (20) 는 다시 한번 그 코드워드를 포함하는 VLC 테이블을 서브-TU들에 대한 인코딩 콘텍스트에 기초하여 선택할 수도 있다. 예를 들어, 서브-TU들에 대한 CBF들을 공동으로 인코딩하는 경우에는, 인코딩 콘텍스트는 서브-TU들에 대한 TSF들의 값들을 포함할 수도 있다. 마찬가지로, 서브-TU들에 대한 TSF들을 공동으로 인코딩하는 경우에는, 인코딩 콘텍스트는 서브-TU들에 대한 CBF들, 예를 들어 서브-TU들의 Y 성분들에 대한 CBF들의 값들을 포함할 수도 있다. 그러면, 비디오 인코더 (20) 는 VLC 테이블로부터 단일 VLC 코드워드를 선택함으로써, VLC 테이블이, 그 코드워드가 서브-TU들에 대한 CBF들 또는 TSF들에 대응한다는 표시를 제공하도록 하고, 그리고 그 코드워드를 그 서브-TU들에 대하여 제공하도록 할 수도 있다.
마찬가지로, 단일 VLC 코드워드를 디코딩하여 서브-TU들에 대한 CBF들 또는 TSF들을 결정하기 위하여, 비디오 디코더 (30) 는 또한 VLC 테이블을 그 서브-TU들에 대한 디코딩 콘텍스트에 기초하여 선택할 수도 있는데, 여기에서, 디코딩 콘텍스트는 인코딩 콘텍스트와 실질적으로 동일할 수도 있다. 이와 같이, 비디오 인코더 (20) 및 비디오 디코더 (30) 에 의하여 선택된 VLC 테이블들은 다시 한번 실질적으로 동일할 수도 있다. 그러면, 비디오 디코더 (30) 는 서브-TU들에 대한 CBF들 또는 TSF들을 단일 VLC 코드워드에 기초하여 결정하고, 그리고 그 서브-TU들을 상기 결정들에 기초하여 디코딩할 수도 있다.
이러한 방식으로, 본 개시물의 기법들에 따르면, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩할 수도 있다. 추가적으로, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 비디오 데이터의 CU의 TU의 서브-TU들에 대한 CBF들 또는 TSF들을 공동으로 코딩할 수도 있다. 위에서 설명된 바와 같이, 이러한 기법들은, 비디오 데이터의 CU의 TU에 대한 CBF 및 TSF 구문 엘리먼트들을, 그 TU에 대한 구문 엘리먼트들을 개별적으로 코딩하는 경우보다 상대적으로 더 효율적으로 코딩할 수 있게 할 수도 있다.
도 5a 는 비디오 데이터의 CU의 TU의 일 예를 도시하는 개념도이다. 도 5a 에 도시되는 바와 같이, 리프-노드 CU의 최대 TU를 나타낼 수도 있는 TU (500) 는 서브-TU들 (502, 504, 506, 및 508) 로 스플릿될 수도 있다. 이러한 예에 대하여, TU (500) 가 2Nx2N 픽셀들의 사이즈를 가진다고 가정한다. 따라서, 서브-TU들 (502, 504, 506, 및 508) 의 각각은 NxN 픽셀들의 사이즈를 가질 수도 있다. 마찬가지로, 서브-TU (504) 는 서브-TU들 (510, 512, 514, 및 516) 로 스플릿될 수도 있는데, 여기에서, 서브-TU들 (510, 512, 514, 및 516) 의 각각은 N/2xN/2 픽셀들의 사이즈를 가질 수도 있다. 또한, 서브-TU들 (510, 512, 514, 및 516) 은 TU (500) 의 서브-TU들로서 간주된다. 마찬가지로, 서브-TU (516) 는 서브-TU들 (518, 520, 522, 및 524) 로 스플릿 수도 있는데, 여기에서, 서브-TU들 (518, 520, 522, 및 524) 의 각각은 N/4xN/4 픽셀들의 사이즈를 가질 수도 있는, 등등이다. 따라서, 이러한 예에서, TU (500) 는 서브-TU들로 스플릿될 수도 있는데, 여기에서, 서브-TU들의 몇몇은 다른 서브-TU들로 스플릿될 수도 있다. 다시 말하면, TU (500) 는 재귀적 방식으로 서브-TU들로 스플릿될 수도 있다.
CU의 파티션 레벨에 대하여 위에서 설명된 바와 유사한 방식으로, CU의 최대 TU 및 최대 TU의 서브-TU들을 포함하는, CU의 각각의 TU는, 그 CU에 대한 "최대" TU라고도 지칭되는, CU의 루트-노드 TU에 대응하는 레벨 0 로부터 시작하여, 특정한 파티션 레벨 (또는 "깊이") 와 연관될 수도 있다. 도 5a 의 예에서는, TU (500) 는 CU의 최대 TU에 대응할 수도 있고, 그리고 파티션 레벨 0 과 연관될 수도 있다. 마찬가지로, TU (500) 의 서브-TU들 (502, 504, 506, 및 508) 은 파티션 레벨 1 과 연관될 수도 있고, 서브-TU (504) 의 서브-TU들 (510, 512, 514, 및 516) 은 파티션 레벨 2 와 연관될 수도 있으며, 그리고 서브-TU (516) 의 서브-TU들 (518, 520, 522, 및 524) 은 파티션 레벨 3 과 연관될 수도 있다. 따라서, 비디오 데이터의 CU의 하나 이상의 TU들이 파티션 레벨을 공유할 수도 있다. 또한, 아래에서 더 상세하게 설명되는 바와 같이, CU의 하나 이상의 TU들에 대한 파티션 레벨을 표시하는 정보, 및 다른 구문 정보가 데이터 구조, 예컨대 RQT, 또는 균일한 파티션 구조를 이용하여 표현될 수도 있다.
도 5b 는 도 5a 의 TU (500) 에 대한 파티션 정보를 나타내는 RQT의 일 예를 도시하는 개념도이다. 도 5b 에 도시되는 바와 같이, RQT (526) 는 TU (500) 에 대응하는 루트 노드 (528) 를 포함하고, 그리고 파티션 레벨 0 과 연관된다. 또한, 도 5b 에서 도시된 바와 같이, RQT (526) 는 자식 노드들이 없는 단말, 또는 "리프" 노드들 (530, 534, 536, 538, 540, 542, 546, 548, 550, 및 552), 및 각각 4 개의 자식 노드들을 가지는 중간 노드들 (532 및 544) 을 포함한다. 이러한 예에서, 루트 노드 (528) 는 3 개의 리프 노드들 (530, 534, 및 536), 및 하나의 중간 노드 (532) 를 포함하는 4 개의 자식 노드들을 가진다. 이러한 예에서, 노드들 (530, 532, 534, 및 536) 은 TU (500) 의 서브-TU들 (502, 504, 506, 및 508) 과 각각 대응하고, 그리고 각각 파티션 레벨 1 과 연관된다.
노드 (532) 가 리프 노드가 아니기 때문에, 노드 (532) 는 3 개의 리프 노드들 (538, 540, 및 542), 및 하나의 중간 노드 (544) 를 포함하는 4 개의 자식 노드들을 포함한다. 이러한 예에서, 노드들 (538, 540, 542, 및 544) 은 TU (500) 의 서브-TU들 (510, 512, 514, 및 516) 에 각각 대응하고 그리고 각각 파티션 레벨 2 와 연관된다. 중간 노드 (544) 는 4 개의 리프 노드들 (546, 548, 550, 및 552) 을 포함하는데, 이들은 TU (500) 의 서브-TU들 (518, 520, 522 및 524) 에 각각 대응하고, 그리고 각각 파티션 레벨 3 과 연관된다. 일반적으로, 비디오 데이터의 CU의 TU에 대한 RQT는 RQT (526) 의 예보다 더 많거나 또는 더 적은 노드들 및 연관된 파티션 레벨들을 포함할 수도 있다.
도 5c 는 비디오 데이터의 CU의 TU에 대한 균일한 파티션 구조의 일 예를 도시하는 개념도이다. 예를 들어, TU (556) 는 리프-노드 CU의 최대 TU를 나타낼 수도 있다. 다른 예들에서는, TU (556) 는 CU의 최대 TU의 서브-TU를 나타낼 수도 있는데, 여기에서, 최대 TU는 이전에 설명된 바와 같이 RQT에 따라서 파티셔닝된다. 이러한 방식으로, 본 개시물의 기법들에 따르면, 균일한 파티션 구조 (554) 가 CU의 최대 TU에 대한 유일한 파티션 구조로서, 또는 도 5b 에 도시되는 바와 같이 최대 TU와 연관된 RQT 와 공동으로 이용될 수도 있다. 일 예로서, 최대 TU는 서브-TU들로 균일한 파티션 구조 (554) 에 기초하여 스플릿될 수도 있다. 다른 예로서, 최대 TU는 서브-TU들로 RQT에 기초하여 스플릿될 수도 있고, 그리고 서브-TU들의 하나 이상은 다른 서브-TU들로 균일한 파티션 구조 (554) 에 기초하여 스플릿될 수도 있다. 어떠한 경우에서도, 서브-TU들 (558-588) 은, 균일한 파티션 구조 (554) 에 따라서 파티셔닝된 TU (556) 의 서브-TU들에 대응할 수도 있다.
본 개시물의 기법들에 따르면, TU (예를 들어, CU의 최대 TU 또는 최대 TU의 서브-TU) 와 연관된 균일한 파티션 구조는 비트스트림 내에서, 균일한 파티션 구조가 그 TU에 대하여 이용되었다는 것, 그리고 균일한 파티션 구조에 따라서 그 TU가 스플릿되는 대상인 서브-TU들의 개수 (예를 들어, 4 개, 16 개, 64 개, 및 기타 등등) 을 표시하는 구문 정보를 이용하여 시그널링될 수도 있다. 예를 들어, TU가 균일한 파티션 구조에 따라서 스플릿되는 대상인 서브-TU들의 개수는 서브-TU들 각각의 사이즈를 표시할 수도 있다. 또한, 몇몇 예들에서는, TU가 균일한 파티션 구조에 따라서 스플릿되는 대상인 서브-TU들의 개수는, RTQ에 대하여 위에서 설명된 바와 유사한 방식으로, 그 서브-TU들에 대한 파티션 레벨에 대응할 수도 있다. 일반적으로, 비디오 데이터의 CU의 주어진 TU에 대한 균일한 파티션 구조는 균일한 파티션 구조 (554) 의 예보다 더 많거나 또는 더 적은 파티션들을 포함할 수도 있다.
다시 한번 도 5a 및 도 5b 를 참조하면, RQT (526) 의 각각의 노드는 대응하는 TU에 대한 하나 이상의 CBF들 및 TSF를 포함할 수도 있다. 예를 들어, 이전에 설명된 바와 같이, TU에 대한 하나 이상의 CBF들 및 TSF는 단일-비트 값, 예를 들어 단일-비트 플래그를 이용하여 각각 표현될 수도 있다. 위에서 설명된 바와 같이, 몇몇 예들에서는, CBF들의 주어진 하나의 경우에서는, 비디오 인코더 (20) 는 대응하는 단일-비트 플래그를 "1"의 값으로 설정하여 그 CBF에 대응하는 TU의 성분이 적어도 하나의 비-제로 계수를 포함한다는 것, 즉 코딩된다는 것을 표시하고, 그리고 플래그의 값을 "0"으로 설정하여 그 성분이 비-제로 계수들을 포함하지 않는다는 것, 즉, 코딩되지 않는다는 것을 표시할 수도 있다. 마찬가지로, TSF의 경우에서는, 비디오 인코더 (20) 는 대응하는 단일-비트 플래그를 "1"의 값으로 설정하여 TU가 서브-TU들로 스플릿된다는 것을 표시하고, 그리고 플래그를 "0"의 값으로 설정하여 TU가 스플릿되지 않는다는 것을 표시할 수도 있다.
본 개시물의 기법들에 따르면, 일 예로서, 비디오 인코더 (20) 는 CU의 TU, 예를 들어 TU (500), 또는 TU (500) 의 서브-TU들에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩할 수도 있다. 이전에 설명된 바와 같이, 비디오 인코더 (20) 는 하나 이상의 CBF들 및 TSF를 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있고, 그리고 비디오 디코더 (30) 는 단일 VLC 코드워드를 수신하고, 그리고 그 코드워드를 디코딩하여 그 TU에 대한 하나 이상의 CBF들 및 TSF를 결정할 수도 있다.
다른 예로서, 이전에 역시 설명된 바와 같이, 비디오 인코더 (20) 는 CU의 TU, 예를 들어 TU (500), 또는 TU (500) 의 서브-TU들의 양자의 색차 성분들에 대응하는 CBF, 즉, CBFC를 그 TU의 휘도 성분에 대응하는 CBF 및 그 TU에 대한 TSF 와 함께, 역시 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있다. 추가적으로, 이전에 역시 설명된 바와 같이, 몇몇 경우들에서는, 비디오 인코더 (20) 는, TU의 색차 성분들에 대응하는 CBF들을 다른 단일 VLC 코드워드를 이용하여 공동으로 더 인코딩할 수도 있다. 또 다시, 비디오 디코더 (30) 는 하나 이상의 단일 VLC 코드워드들을 수신하고, 그리고 그 코드워드들을 디코딩하여 그 TU에 대한 하나 이상의 CBF들 및 TSF를 결정할 수도 있다.
또 다른 예로서, 이전에 역시 설명된 바와 같이, 비디오 인코더 (20) 는 CU의 TU의 서브-TU들, 예를 들어 TU (500) 의 서브-TU들 (510, 512, 514, 및 516) 에 대한 CBF들 또는 TSF들을 공동으로 인코딩할 수도 있다. 이전에 역시 설명된 바와 같이, 비디오 인코더 (20) 는 CBF들 또는 TSF들을 역시 단일 VLC 코드워드를 이용하여 공동으로 인코딩할 수도 있고, 그리고 비디오 디코더 (30) 는 단일 VLC 코드워드를 수신하고, 그리고 그 코드워드를 디코딩하여 서브-TU들에 대한 CBF들 또는 TSF들을 결정할 수도 있다.
비디오 인코더 (20) 및/또는 비디오 디코더 (30) 가 TU, 예를 들어 TU (500), 또는 TU (500) 의 서브-TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩하는 경우들에서는, 그 TU에 대응하는 RQT (526) 의 노드는, 그 TU에 대한 하나 이상의 CBF들 및 TSF를 나타내는 하나 이상의 단일 값들 (예를 들어, 하나 이상의 단일 VLC 코드워드들) 을 포함할 수도 있다. 다시 말하면, 하나 이상의 CBF들 및 TSF를 나타내는 하나 이상의 단일 값들은 동일한 노드 또는 파티션 내에 원본인 하나 이상의 CBF들 및 TSF로서 포함될 수도 있다.
비디오 인코더 (20) 및/또는 비디오 디코더 (30) 가 TU의 서브-TU들, 예를 들어 TU (500), 또는 TU (500) 의 서브-TU에 대한 CBF들 또는 TSF들을 공동으로 인코딩하는 경우들에서는, 그 TU에 대응하는 RQT (526) 의 노드는, 그 서브-TU들에 대한 CBF들 또는 TSF들을 나타내는 단일 값 (예를 들어, 단일 VLC 코드워드) 을 포함할 수도 있다. 이러한 방식으로, 서브-TU들에 대한 CBF들 또는 TSF들을 나타내는 단일 값은 서브-TU들의 부모 TU에 대응하는 노드 내에 포함될 수도 있다. 예를 들어, TU (500) 에 대하여, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는, RQT (526) 의 노드들 (530, 532, 534, 및 536) 에 각각 대응하는, TU (500) 의 서브-TU들 (502, 504, 506, 및 508) 에 대한 CBF들 또는 TSF들을 공동으로 코딩할 수도 있다. CBF들 또는 TSF들을 나타내는, 초래되는 단일 값은 RQT (526) 의 루트 노드 (528) 내에 포함될 수도 있는데, 이것은 노드들 (530, 532, 534, 및 536) 에 대한 부모 노드이다.
이러한 방식으로, 본 개시물의 기법들에 따르면, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 코딩할 수도 있다. 추가적으로, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 비디오 데이터의 CU의 TU의 서브-TU들에 대한 CBF들 또는 TSF들을 공동으로 코딩할 수도 있다. 위에서 설명된 바와 같이, 이러한 기법들은 비디오 데이터의 CU의 TU에 대한 CBF 및 TSF 구문 엘리먼트들을, 그 TU에 대한 구문 엘리먼트들을 개별적으로 코딩하는 경우보다 상대적으로 더 효율적으로 코딩할 수 있게 할 수도 있다.
도 6 은 비디오 데이터의 CU의 TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하기 위한 예시적인 방법을 도시하는 흐름도이다. 도 6 의 기법들은 일반적으로, 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 조합으로 구현되는 임의의 처리 유닛 또는 프로세서에 의하여 수행될 수도 있는데, 소프트웨어 또는 펌웨어로 구현되면, 대응하는 하드웨어가 소프트웨어 또는 펌웨어에 대한 명령들을 실행하기 위하여 제공될 수도 있다. 예를 들기 위한 목적에서, 도 6 의 기법들은 비디오 인코더 (20) (도 1 및 도 2) 에 대하여 설명되는데, 하지만 다른 디바이스들이 유사한 기법들을 수행하도록 구성될 수도 있다는 것이 이해되어야 한다. 또한, 도 6 에서 도시된 단계들은 상이한 순서로 또는 병렬적으로 수행될 수도 있으며, 그리고, 본 개시물의 기법들로부터 벗어나지 않으면서 추가적인 단계들이 추가되거나 특정 단계들이 생략될 수도 있다.
처음에, 비디오 인코더 (20) 는 비디오 데이터의 블록을 수신할 수도 있다 (단계 600). 블록은, 위에서 설명된 바와 같이, LCU와 연관된 CU 쿼드트리 내의 리프-노드에 대응하는, CU, 예컨대 LCU의 서브-CU에 대응할 수도 있다. CU는, 예를 들어 CU의 최대 TU를 포함하는, 하나 이상의 TU들을 포함할 수도 있는데, 이것은 위에서 역시 설명된 바와 같이 그 최대 TU와 연관된 RQT에 따라서 서브-TU들로 스플릿될 수도 있다. 이러한 방식으로, 도 6 의 방법은, CU의 최대 TU, 및 최대 TU의 서브-TU들을 포함하는, CU의 임의의 TU로 재귀적으로 적용될 수도 있다.
비디오 인코더 (20) 는 블록, 또는 CU의 주어진 TU의 하나 이상의 성분들이 코딩되는지, 즉, 적어도 하나의 비-제로 계수를 포함하는지의 여부를 더 결정할 수도 있다 (단계 602). 예를 들어, 엔트로피 인코딩 유닛 (56) 은 이러한 결정을, 위에서 설명된 바와 같이, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 실행할 수도 있는데, 여기에서, 결정의 결과들은 TU의 하나 이상의 성분들에 대한 하나 이상의 CBF들에 대응할 수도 있다. 또한, 비디오 인코더 (20) 는 TU가 서브-TU들로 스플릿되는지의 여부를 결정할 수도 있다 (단계 604). 예를 들어, 이러한 결정은 위에서 역시 설명된 바와 같이, 예컨대 변환 유닛 (52), 및/또는 비디오 인코더 (20) 의 다른 유닛들 또는 컴포넌트들과 함께 모드 선택 유닛 (40) 에 의하여, CU에 대한 예측 데이터를 생성하는 것의 일부로서, 그 CU를 인코딩하는 프로세스에서 더 이전에 실행될 수도 있다. 이러한 결정의 결과들은 TU에 대한 TSF에 대응할 수도 있다.
예를 들기 위한 목적에서, 비디오 인코더 (20) 가 TU의 하나 이상의 성분들이 코딩되는지의 여부, 및 TU가 서브-TU들로 스플릿되는지의 여부를 결정한다고 가정하면, 비디오 인코더 (20) 는, 대응하는 하나 이상의 CBF들 및 TSF에 대한 값들을 더 결정할 수도 있다. 예를 들어, "1"의 CBF 값은 대응하는 성분이 코딩된다는 것을 표시할 수도 있고, 그리고 "0"의 CBF 값은 그 성분이 코딩되지 않는다는 것을 표시할 수도 있다. 마찬가지로, "1"의 TSF 값은 TU가 서브-TU들로 스플릿된다는 것을 표시할 수도 있고, 그리고 "0"의 TSF 값은 TU가 스플릿되지 않는다는 것을 표시할 수도 있다.
또한, 비디오 인코더 (20) 는 TU에 대한 하나 이상의 CBF들 및 TSF를 인코딩 할 수도 있다. 예를 들어, 모드 선택 유닛 (40) 및/또는 변환 유닛 (52) 은 그 TSF에 대한 값을 엔트로피 인코딩 유닛 (56) 으로 제공할 수도 있다. 위에서 설명된 바와 같이, 엔트로피 인코딩 유닛 (56) 은 하나 이상의 CBF들에 대한 값들을, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다.
TU에 대한 하나 이상의 CBF들 및 TSF를 인코딩하기 위하여, 엔트로피 인코딩 유닛 (56), 또는 비디오 인코더 (20) 의 다른 유닛은 그 TU에 대한 콘텍스트를 결정할 수도 있다 (단계 606). 그 TU에 대한 콘텍스트는, 예를 들어: 그 TU에 대응하는 PU에 대한 예측 모드; 그 TU에 대한 파티션 레벨; 및 코드워드에 의하여 표현될 그 TU의 성분들의 개수; 중 하나 이상을 포함할 수도 있다.
일 예로서, 엔트로피 인코딩 유닛 (56) 은 TU에 대응하는 PU에 대한 예측 모드를 표시하는 정보를 모드 선택 유닛 (40) 로부터 수신할 수도 있다. 이러한 정보는 CU에 대한 예측 데이터를 생성하는 것의 일부로서 생성될 수도 있다. 다른 예로서, 엔트로피 인코딩 유닛 (56) 은 TU에 대한 파티션 레벨을, CU의 다른 이전에 인코딩된 TU들 (예를 들어, 대응하는 RQT 내의 TU의 부모 TU) 로부터 결정할 수도 있다. 또 다른 예로서, 엔트로피 인코딩 유닛 (56) 은, 그 TU에 대한 임의의 CBF들의 값들이 CU의 다른 이전에 인코딩된 TU들 (예를 들어, 대응하는 RQT 내의 TU의 부모 및 형제 TU들) 을 이용하여 추론될 수도 있는지의 여부를 결정함으로써, 코드워드에 의하여 표현될 TU의 성분들의 개수를 결정할 수도 있다.
또한, 엔트로피 인코딩 유닛 (56) 은 VLC 테이블을 콘텍스트에 기초하여 선택할 수도 있다 (단계 608). 예를 들어, VLC 테이블은 코드워드들의 CBF 및 TSF 값들로의 매핑을 포함할 수도 있다. 또한, 엔트로피 인코딩 유닛 (56) 은 코드워드를 위의 결정들을 나타내는 VLC 테이블로부터 선택할 수도 있다 (단계 610). 즉, 엔트로피 인코딩 유닛 (56) 은 블록의 TU의 하나 이상의 성분들이 코딩되는지의 여부, 및 TU가 서브-TU들로 스플릿되는지의 여부를 나타내는 코드워드를 선택할 수도 있다. 예를 들어, 위에서 설명된 바와 같이, 엔트로피 인코딩 유닛 (56) 은, CBF 및 TSF 값들이 그 콘텍스트에 대한 TU에 대한 가장 가능한 값들인 경우에, 최단 (예를 들어, 단일-비트) 코드워드를 선택할 수도 있다. 반면에, 엔트로피 인코딩 유닛 (56) 은, CBF 및 TSF 값들이 가장 가능한 값들이 아닌 경우에는, 최단 코드워드가 아닌 코드워드를 선택할 수도 있다. 예를 들어, 코드워드는, 예를 들어 그 콘텍스트에 대하여 해당 TU에 대한 CBF 및 TSF 값들의 우도, 즉, TU의 하나 이상의 성분들이 코딩될, 그리고 TU가 서브-TU들로 스플릿될 우도에 반비례하는 길이, 예를 들어 비트 길이를 가질 수도 있다.
몇몇 예들에서는, 엔트로피 인코딩 유닛 (56) 은 또한, VLC 테이블을 위의 결정들에 기초하여 업데이트하여 어떤 결정들이 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다 (단계 612). 예를 들어, 엔트로피 인코딩 유닛 (56) 은 코드워드들의 VLC 테이블 내의 CBF 및 TSF 값들로의 매핑을 결정된 CBF 및 TSF 값들에 기초하여 업데이트함으로써, 위에서 설명된 바와 같이, 그 콘텍스트에 대하여 더 빈번하게 발생하는 값들이, 다른 덜 빈번하게-발생하는 값들보다 더 짧은 VLC 코드워드들로 매핑되도록 할 수도 있다.
마지막으로, 엔트로피 인코딩 유닛 (56) 은 코드워드를 비트스트림으로 출력할 수도 있다 (단계 614). 예를 들어, 엔트로피 인코딩 유닛 (56) 은 그 코드워드를 그 TU에 대응하는 RQT의 노드 내에 포함함으로써, 그 코드워드가 그 TU에 대한 하나 이상의 CBF들 및 TSF를 나타내는 단일 값을 포함하도록 할 수도 있다.
이러한 방식으로, 도 6 의 방법은, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하는 단계, TU가 서브-TU들로 스플릿되는지의 여부를 결정하는 단계, 코드워드를 VLC 테이블로부터 선택하는 단계로서, 여기에서, VLC 테이블은 그 코드워드가 이러한 결정들에 대응한다는 표시를 제공하는, 상기 선택하는 단계, 및 그 코드워드를 그 TU에 대하여 제공하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법의 예를 나타낸다.
도 7 은 비디오 데이터의 CU의 TU에 대한 공동으로 인코딩된 하나 이상의 CBF들 및 TSF를 디코딩하기 위한 예시적인 방법을 도시하는 흐름도이다. 또 다시, 도 7 의 기법들은 일반적으로, 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 조합으로 구현되는 임의의 처리 유닛 또는 프로세서에 의하여 수행될 수도 있고, 그리고 소프트웨어 또는 펌웨어로 구현되면, 소프트웨어 또는 펌웨어에 대한 명령들을 실행하기 위하여 대응하는 하드웨어가 제공될 수도 있다. 예를 들기 위한 목적들에서, 도 7 의 기법들은 비디오 디코더 (30) (도 1 및 도 3) 에 대하여 설명되는데, 하지만 다른 디바이스들이 유사한 기법들을 수행하도록 구성될 수도 있다는 것이 이해되어야 한다. 또한, 도 7 에서 도시된 단계들은 상이한 순서로 또는 병렬적으로 수행될 수도 있으며, 그리고, 본 개시물의 기법들로부터 벗어나지 않으면서 추가적인 단계들이 추가되거나 특정 단계들이 생략될 수도 있다.
처음에, 비디오 디코더 (30) 는 비디오 데이터의 블록의 TU에 대한 코드워드를 수신할 수도 있다 (단계 700). 또한, 비디오 디코더 (30) 는, 다른 구문 정보 및 블록에 대한 예측 모드를 표시하는, 그 블록에 대한 비디오 데이터, 예를 들어 양자화된 변환 계수들 및/또는 블록 헤더 데이터를 수신할 수도 있다. 위에서 도 6 의 예시적인 방법에 대하여 설명된 바와 같이, 블록은, LCU와 연관된 CU 쿼드트리 내의 리프-노드에 대응하는 CU, 예컨대 LCU의 서브-CU에 대응할 수도 있다. CU는, 예를 들어 CU의 최대 TU를 포함하는, 하나 이상의 TU들을 포함할 수도 있는데, 이것은 위에서 역시 설명된 바와 같이, 그 최대 TU와 연관된 RQT에 따라서 서브-TU들로 스플릿될 수도 있다. 이러한 방식으로, 도 7 의 방법은, CU의 최대 TU, 및 최대 TU의 서브-TU들을 포함하는, CU의 임의의 TU로 재귀적으로 적용될 수도 있다. 위에서 역시 설명된 바와 같이, 코드워드는 VLC 코드워드를 포함할 수도 있다.
또한, 비디오 디코더 (30) 는 TU에 대한 콘텍스트를 결정할 수도 있다 (단계 702). 예를 들어, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 콘텍스트를 엔트로피 인코딩 유닛 (56) 에 대하여 위에서 설명된 바와 실질적으로 유사한 방식으로, 예를 들어: 그 TU에 대응하는 PU에 대한 예측 모드; 그 TU에 대한 파티션 레벨; 및 코드워드에 의하여 표현되는, TU의 성분들의 개수; 중 하나 이상에 기초하여 결정할 수도 있다.
일 예로서, 엔트로피 디코딩 유닛 (70) 은 TU에 대응하는 PU에 대한 예측 모드를 CU에 대한 헤더 데이터 내에 포함된 수신된 구문 정보로부터 결정할 수도 있다. 다른 예로서, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 파티션 레벨을, CU의 다른 TU들 (예를 들어, 대응하는 RQT 내의 TU의 부모 TU) 에 대한 이전에 수신된 코드워드들로부터 결정할 수도 있다. 또 다른 예로서, 엔트로피 디코딩 유닛 (70) 은, 그 TU에 대한 임의의 CBF들의 값들이 CU의 다른 TU들 (예를 들어, 대응하는 RQT 내의 TU의 부모 및 형제 TU들) 에 대한 이전에 수신된 코드워드들을 이용하여 추론될 수도 있는지의 여부를 결정함으로써, 코드워드에 의하여 표현되는 TU의 성분들의 개수를 결정할 수도 있다.
또한, 엔트로피 디코딩 유닛 (70) 은 VLC 테이블을 콘텍스트에 기초하여 선택할 수도 있다 (단계 704). 예를 들어, VLC 테이블은 코드워드들의 CBF 및 TSF 값들로의 매핑을 포함할 수도 있다. 그러면, 엔트로피 디코딩 유닛 (70) 은 TU의 하나 이상의 성분들이 코딩되는지, 즉, 적어도 하나의 비-제로 계수를 포함하는지의 여부를, 코드워드 및 VLC 테이블에 기초하여 결정할 수도 있다. 또한, 엔트로피 디코딩 유닛 (70) 은 TU가 서브-TU들로 스플릿되는지의 여부를 코드워드 및 VLC 테이블에 기초하여 결정할 수도 있다. 예를 들어, 엔트로피 디코딩 유닛 (70) 은 VLC 테이블 내의 수신된 코드워드로 매핑되는, 위의 결정들에 대응하는 CBF 및 TSF 구문 엘리먼트에 대한 값들을 취출할 수도 있다. 이러한 방식으로, 엔트로피 디코딩 유닛 (70) 은 블록의 TU의 하나 이상의 성분들이 코딩된다는 것을 코드워드가 표시하는지의 여부 (단계 706), 및 TU가 서브-TU들로 스플릿된다는 것을 코드워드가 표시하는지의 여부를 결정할 수도 있다 (단계 708).
비디오 디코더 (30) 의 VLC 테이블들은 비디오 인코더 (20) 의 VLC 테이블들과 실질적으로 유사할 수도 있다. 이전에 설명된 바와 같이, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 콘텍스트를 엔트로피 인코딩 유닛 (56) 에 대하여 위에서 설명된 바와 실질적으로 유사한 방식으로 결정할 수도 있다. 이와 같이, 콘텍스트를 이용하여 VLC 테이블을 선택하는 비디오 디코더 (30) 는, 코드워드를 선택하기 위하여 비디오 인코더 (20) 에 의하여 이용되는 VLC 테이블의 매핑과 실질적으로 유사한, VLC 코드워드들의 CBF 및 TSF 값들로의 매핑을 포함하는 VLC 테이블을 초래할 수도 있다. 매핑들 간의 이러한 유사성은 비디오 디코더 (30) 가 코드워드 및 VLC 테이블을 이용하여 위의 결정들을 실행하는 것을 가능하게 할 수도 있다.
위에서 설명된 바와 같이, 위의 결정들의 결과들은 TU에 대한 하나 이상의 CBF들 및 TSF에 대응할 수도 있다. 예를 들어, "1"의 CBF 값은 TU의 대응하는 성분이 코딩된다는 것을 표시할 수도 있고, 그리고 "0"의 CBF 값은 그 성분이 코딩되지 않는다는 것을 표시할 수도 있다. 마찬가지로, "1"의 TSF 값은 TU가 서브-TU들로 스플릿된다는 것을 표시할 수도 있고, 그리고 "0"의 TSF 값은 그 TU가 스플릿되지 않는다는 것을 표시할 수도 있다. 위에서 역시 설명된 바와 같이, 코드워드는 그 콘텍스트에 대하여 해당 TU에 대한, CBF 및 TSF 값들의 우도, 즉 TU의 하나 이상의 성분들이 코딩될, 그리고 TU가 서브-TU들로 스플릿될 우도에 반비례하는 길이를 가질 수도 있다.
마지막으로, 엔트로피 디코딩 유닛 (70) 은 블록, 또는 CU를 위의 결정들에 기초하여 디코딩할 수도 있다 (단계 710). 추가적으로, 몇몇 예들에서는, 엔트로피 디코딩 유닛 (70) 은 VLC 테이블을 위의 결정들에 기초하여 업데이트하여 어떤 결정들이 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다 (단계 712). 예를 들어, 엔트로피 디코딩 유닛 (70) 은 코드워드들의 VLC 테이블 내의 CBF 및 TSF 값들로의 매핑을 결정된 CBF 및 TSF 값들에 기초하여 업데이트함으로써, 이전에 설명된 바와 같이, 그 콘텍스트에 대하여 더 빈번하게 발생하는 값들이 다른 덜 빈번하게-발생하는 값들보다 더 짧은 VLC 코드워드들로 매핑되도록 할 수도 있다. 이러한 방식으로, 비디오 디코더 (30) 는 VLC 테이블 내의 매핑을, TU에 대한 하나 이상의 CBF들 및 TSF를 공동으로 인코딩하기 위하여 비디오 인코더 (20) 에 의하여 이용되는 VLC 테이블 내의 매핑과 조율할 수도 있다.
이러한 방식으로, 도 7 의 방법은, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 그 TU에 대한 코드워드에 기초하여 결정하는 단계, TU가 서브-TU들로 스플릿되는지의 여부를 코드워드에 기초하여 결정하는 단계, 및 상기 결정들에 기초하여 그 TU를 디코딩하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법의 일 예를 나타낸다.
도 8 은 비디오 데이터의 CU의 TU에 대한 휘도 CBF, 색차 CBF, 및 TSF를 공동으로 인코딩하기 위한 예시적인 방법을 도시하는 흐름도이다. 또 다시, 도 8 의 기법들은 일반적으로, 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 조합으로 구현되는 임의의 처리 유닛 또는 프로세서에 의하여 수행될 수도 있고, 그리고 소프트웨어 또는 펌웨어로 구현되면, 소프트웨어 또는 펌웨어에 대한 명령들을 실행하기 위하여 대응하는 하드웨어가 제공될 수도 있다. 예를 들기 위한 목적들에서, 도 8 의 기법들은 비디오 인코더 (20) (도 1 및 도 2) 에 대하여 설명되는데, 하지만 다른 디바이스들이 유사한 기법들을 수행하도록 구성될 수도 있다는 것이 이해되어야 한다. 또한, 도 8 에서 도시된 단계들은 상이한 순서로 또는 병렬적으로 수행될 수도 있으며, 그리고, 본 개시물의 기법들로부터 벗어나지 않으면서 추가적인 단계들이 추가되거나 특정 단계들이 생략될 수도 있다.
처음에, 비디오 인코더 (20) 는 비디오 데이터의 블록을 수신할 수도 있다 (단계 800). 위에서 설명된 바와 같이, 블록은 LCU와 연관된 CU 쿼드트리 내의 리프-노드에 대응하는 CU, 예컨대 LCU의 서브-CU에 대응할 수도 있다. 위에서 역시 설명된 바와 같이, CU는, 예를 들어 CU의 최대 TU를 포함하는, 하나 이상의 TU들을 포함할 수도 있는데, 이것은 그 최대 TU와 연관된 RQT에 따라서 서브-TU들로 스플릿될 수도 있다. 이러한 방식으로, 도 8 의 방법은, CU의 최대 TU, 및 최대 TU의 서브-TU들을 포함하는, CU의 임의의 TU로 재귀적으로 적용될 수도 있다.
또한, 비디오 인코더 (20) 는 블록, 또는 CU의 주어진 TU의 제 1 색차 성분 및 제 2 색차 성분이 코딩되는지, 즉, 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정할 수도 있다 (단계 802). 예를 들어, 엔트로피 인코딩 유닛 (56) 은 TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩되는지의 여부를, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다.
엔트로피 인코딩 유닛 (56) 은, 예를 들어 CBFU 및 CBFV에 대응하는, TU의 제 1 색차 성분 및 제 2 색차 성분에 대한 CBF들의 이전에 결정된 값들을 비트 단위로 "OR" 함으로써, 이러한 결정을 실행할 수도 있는데, 여기에서, U 및 V는 각각 제 1 색차 성분 및 제 2 색차 성분을 지칭한다. 다른 예들에서는, 엔트로피 인코딩 유닛 (56) 은 이러한 결정을 다른 기법들을 이용하여, 예를 들어 이러한 결정을 직접적으로 실행함으로써 실행할 수도 있다. 어떠한 경우에서도, 이러한 결정의 결과들은 그 TU에 대한 색차 CBF, 예를 들어 CBFC에 대응할 수도 있는데, 여기에서, CBFC는 CBFU | CBFV를 나타내고, 여기에서, '|' 는 비트 단위 "OR" 연산자를 지칭한다.
몇몇 예들에서는, 비디오 인코더 (20) 는, TU의 휘도 성분이 코딩되는지의 여부를 또한 결정할 수도 있다 (단계 804). TU의 제 1 및 제 2 색차 성분들에 대하여 위에서 설명된 바와 유사한 방식으로, 엔트로피 인코딩 유닛 (56) 은 이러한 결정을 CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 실행할 수도 있다. 예를 들어, 이러한 결정의 결과들은 TU에 대한 휘도 CBF, 예를 들어 CBFY에 대응할 수도 있는데, 여기에서, Y는 휘도 성분을 지칭한다.
또한, 비디오 인코더 (20) 는 TU가 서브-TU들로 스플릿되는지의 여부를 결정할 수도 있다 (단계 806). 위에서 역시 설명된 바와 같이, 예를 들어 이러한 결정은 변환 유닛 (52) 과 연계한 모드 선택 유닛 (40) 에 의하여, CU에 대한 예측 데이터를 생성하는 것의 일부로서, 그 CU를 인코딩하는 프로세스에서 더 이전에 실행될 수도 있는데, 여기서 결정의 결과들은 TU에 대한 TSF에 대응할 수도 있다.
또 다시, 예를 들기 위한 목적에서 비디오 인코더 (20) 가 TU의 휘도 성분이 코딩되는지의 여부, TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩되는지의 여부, 및 TU가 서브-TU들로 스플릿되는지의 여부를 결정한다고 가정하면, 비디오 인코더 (20) 는, 대응하는 CBFY, CBFC, 및 TSF에 대한 값들을 또한 결정할 수도 있다. 예를 들어, "1"의 CBFY 값은 휘도 성분이 코딩된다는 것을 표시할 수도 있고, 그리고 "0"의 CBFY 값은 휘도 성분이 코딩되지 않는다는 것을 표시할 수도 있다. 마찬가지로, "1"의 CBFC 값은 TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩된다는 것을 표시할 수도 있고, 그리고 "0"의 CBFC 값은 제 1 색차 성분 및 제 2 색차 성분이 코딩되지 않는다는 것을 표시할 수도 있다. 또한, "1"의 TSF 값은 TU가 서브-TU들로 스플릿된다는 것을 표시할 수도 있고, 그리고 "0"의 TSF 값은 TU가 스플릿되지 않는다는 것을 표시할 수도 있다.
또한, 비디오 인코더 (20) 는 TU에 대한 CBFY, CBFC, 및 TSF를 공동으로 인코딩할 수도 있다. 예를 들어, 위에서 설명된 바와 같이, 모드 선택 유닛 (40) 및/또는 변환 유닛 (52) 은 그 TSF에 대한 값을 엔트로피 인코딩 유닛 (56) 으로 제공할 수도 있고, 엔트로피 인코딩 유닛 (56) 은 CBFY 및 CBFC에 대한 값들을, CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다.
TU에 대한 CBFY, CBFC, 및 TSF를 공동으로 인코딩하기 위하여, 엔트로피 인코딩 유닛 (56), 또는 비디오 인코더 (20) 의 다른 유닛은 그 TU에 대한 제 1 콘텍스트를 결정할 수도 있다 (단계 808). 도 6 및 도 7 을 참조하여 위에서 설명된 바와 유사한 방식으로, CU에 대한 제 1 콘텍스트는, 예를 들어: 그 TU에 대응하는 PU에 대한 예측 모드; 그 TU에 대한 파티션 레벨; 및 코드워드에 의하여 표현될 그 TU의 성분들의 개수; 중 하나 이상을 포함할 수도 있다.
또 다시, 일 예로서, 엔트로피 인코딩 유닛 (56) 은 TU에 대응하는 PU에 대한 예측 모드를 표시하는 정보를 모드 선택 유닛 (40) 로부터 수신할 수도 있다. 이러한 정보는 CU에 대한 예측 데이터를 생성하는 것의 일부로서 생성될 수도 있다. 다른 예로서, 엔트로피 인코딩 유닛 (56) 은 TU에 대한 파티션 레벨을, CU의 다른 이전에 인코딩된 TU들 (예를 들어, 대응하는 RQT 내의 TU의 부모 TU) 로부터 결정할 수도 있다. 또 다른 예로서, 엔트로피 인코딩 유닛 (56) 은, 그 TU에 대한 임의의 CBF들의 값들이 CU의 다른 이전에 인코딩된 TU들 (예를 들어, 대응하는 RQT 내의 TU의 부모 및 형제 TU들) 을 이용하여 추론될 수도 있는지의 여부를 결정함으로써, 코드워드에 의하여 표현될 TU의 성분들의 개수를 결정할 수도 있다.
또한, 엔트로피 인코딩 유닛 (56) 은 제 1 VLC 테이블을 제 1 콘텍스트에 기초하여 선택할 수도 있다 (단계 810). 예를 들어, 제 1 VLC 테이블은 코드워드들의 CBFY, CBFC, 및 TSF 값들로의 매핑을 포함할 수도 있다. 또한, 엔트로피 인코딩 유닛 (56) 은 제 1 코드워드를 위의 결정들을 나타내는 제 1 VLC 테이블로부터 선택할 수도 있다 (단계 812). 예를 들어, 위에서 설명된 바와 같이, 엔트로피 인코딩 유닛 (56) 은, CBFY, CBFC, 및 TSF 값들이 제 1 콘텍스트에 대하여 그 TU에 대한 가장 가능한 값들을 포함하는 경우에, 최단 (예를 들어, 단일-비트) 코드워드를 선택할 수도 있다. 반면에, 엔트로피 인코딩 유닛 (56) 은, CBFY, CBFC, 및 TSF 값들이 가장 가능한 값들이 아닌 경우에는, 최단 코드워드가 아닌 코드워드를 선택할 수도 있다. 예를 들어, 선택된 코드워드는, 예를 들어 또 다시 제 1 콘텍스트에 대하여 해당 TU에 대한, CBFY, CBFC, 및 TSF 값들의 우도, 즉, TU의 휘도 성분이 코딩될, 그 TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩될, 그리고 TU가 서브-TU들로 스플릿될 우도에 반비례하는 길이, 예를 들어 비트 길이를 가질 수도 있다.
위에서 역시 설명된 바와 같이, 몇몇 예들에서는, 엔트로피 인코딩 유닛 (56) 은, 제 1 VLC 테이블을 위의 결정들에 기초하여 또한 업데이트하여, 어떤 결정들이 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다 (단계 814). 예를 들어, 엔트로피 인코딩 유닛 (56) 은 결정된 CBFY, CBFC, 및 TSF 값들에 기초하여, 코드워드들의 제 1 VLC 테이블 내의 CBFY, CBFC, 및 TSF 값들로의 매핑을 업데이트함으로써, 위에서 설명된 바와 같이, 제 1 콘텍스트 내에서 더 빈번하게 발생하는 값들이, 다른 덜 빈번하게-발생하는 값들보다 더 짧은 코드워드들로 매핑되도록 할 수도 있다.
마지막으로, 엔트로피 인코딩 유닛 (56) 은 제 1 코드워드를 비트스트림으로 출력할 수도 있다 (단계 816). 예를 들어, 엔트로피 인코딩 유닛 (56) 은 제 1 코드워드를 그 CU에 대한 RQT 내에 포함함으로써, 제 1 코드워드가 그 TU에 대한 CBFY, CBFC, 및 TSF를 나타내는 단일 값을 포함하도록 할 수도 있다.
위에서 설명된 바와 같이, 비디오 인코더 (20) 는 블록의 TU의 제 1 색차 성분 및 제 2 색차 성분이 코딩되는지의 여부를 결정할 수도 있다 (단계 818). 이러한 방식으로, 이전에 설명된 바와 같이, 비디오 인코더 (20) 는 블록의 TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩되는지의 여부를 결정할 수도 있다. 제 1 색차 성분 및 제 2 색차 성분 모두가 코딩되지 않는 경우에서는, 엔트로피 인코딩 유닛 (56) 은 TU에 대한 휘도 CBF, 색차 CBF들, 및 TSF를 공동으로 인코딩하는 것을 중지하고 (단계 820), 그리고 다른 코딩 태스크들, 예를 들어 그 CU 또는 후속 CU에 대한 다른 구문 엘리먼트들의 인코딩으로 진행할 수도 있다. 그러나, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩되는 경우에서는, 비디오 인코더 (20) 는 제 1 및 제 2 색차 성분들 중 어느 것이 코딩되는지를 표시함으로써, 인코딩 프로세스를 계속할 수도 있다.
예를 들어, 엔트로피 인코딩 유닛 (56) 은 제 1 색차 성분이 코딩되는지의 여부를 결정할 수도 있다 (단계 822). 또한, 엔트로피 인코딩 유닛 (56) 은 제 2 색차 성분이 코딩되는지의 여부를 결정할 수도 있다 (단계 824). 위에서 설명된 바와 같이, 엔트로피 인코딩 유닛 (56) 은 이러한 결정들을, 그 CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 실행할 수도 있는데, 여기서 이러한 결정들은 TU에 대한 CBFU 및 CBFV에 각각 대응할 수도 있다. 위에서 역시 설명된 바와 같이, 몇몇 예들에서는, 이러한 결정들은 TU에 대한 CBFC를 결정하기 위한 목적으로 인코딩 프로세스에서 이전에 실행될 수도 있다. 다른 예들에서는, 이러한 결정들은 인코딩 프로세스에서 상이한 포인트에서, 예를 들어 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩되는 경우에만 실행될 수도 있다.
위에서 설명된 바와 유사한 방식으로, 예시를 위한 목적에서 TU의 제 1 색차 성분 및 제 2 색차 성분이 코딩되는지의 여부를 비디오 인코더 (20) 가 결정한다고 가정하면, 비디오 인코더 (20) 는, 대응하는 CBFU 및 CBFV에 대한 값들을 또한 결정할 수도 있다. 또 다시, 예를 들어 "1"의 CBF 값은 TU의 대응하는 색차 성분이 코딩된다는 것을 표시할 수도 있고, 그리고 "0"의 CBF 값은 그 색차 성분이 코딩되지 않는다는 것을 표시할 수도 있다.
또한, 비디오 인코더 (20) 는 TU 제 1 색차 성분 및 제 2 색차 성분이 코딩되는지의 여부의 표시를 제공할 수도 있다. 몇몇 예들에서는, 비디오 인코더 (20) 는 그 TU에 대한 CBFU 및 CBFV를 명시적으로 비트스트림 내에 시그널링함으로써 이러한 표시를 제공할 수도 있는데, 여기에서, 각각의 CBF는 개별적으로 시그널링된다. 다른 예들에서는, 비디오 인코더 (20) 는 TU에 대한 CBFY, CBFV, 및 TSF를 공동으로 인코딩하는 것에 대하여 위에서 설명된 것과 실질적으로 유사한 방식으로 TU에 대한 CBFU 및 CBFV를 공동으로 인코딩함으로써, 이러한 표시를 제공할 수도 있다.
TU에 대한 CBFU 및 CBFV를 공동으로 인코딩하기 위하여, 엔트로피 인코딩 유닛 (56), 또는 비디오 인코더 (20) 의 다른 유닛은 그 TU에 대한 제 2 콘텍스트를 결정할 수도 있다 (단계 826). 예를 들어, 엔트로피 인코딩 유닛 (56) 은, 예를 들어: 그 CU에 대한 파티션 레벨; 그 TU에 대한 파티션 레벨; 그 TU에 대응하는 PU에 대한 예측 모드; 및 그 TU의 이웃하는 TU들의 제 1 색차 성분들 및 제 2 색차 성분들에 대응하는 CBF 값들; 중 하나 이상에 기초하여 그 TU에 대한 제 2 콘텍스트를 결정할 수도 있다. 예를 들어, 이웃하는 TU들은, 휘도 CBF들, 색차 CBF들, 그리고 TSF들이 본 명세서에서 설명된 것과 동일한 방식으로 이전에 공동으로 인코딩되었던 대상이 되는, CU에 대한 다른 TU들일 수도 있다. 일 예로서, 엔트로피 인코딩 유닛 (56) 은 CU에 대한 파티션 레벨을, 예를 들어 이전에 설명된 바와 같이 CU의 LCU와 연관되는 CU 쿼드트리에 대응하는 CU를 인코딩하기 위하여 이용되는 구문 정보를 생성하는 것의 일부로서 결정할 수도 있다.
또한, 엔트로피 인코딩 유닛 (56) 은 제 2 VLC 테이블을 제 2 콘텍스트에 기초하여 선택할 수도 있다 (단계 828). 예를 들어, 제 2 VLC 테이블은 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 포함할 수도 있다. 몇몇 예들에서는, 엔트로피 코딩 유닛 (56) 은 제 1 VLC 테이블 및 제 2 VLC 테이블 모두를 선택하기 위하여 동일한 콘텍스트를 이용할 수도 있는데, 이러한 경우에는 위에서 논의된 제 1 및 제 2 콘텍스트들은 동일한 콘텍스트를 포함할 수도 있다.
또한, 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를 제 1 색차 성분 및 제 2 색차 성분에 대한 위의 결정들을 표시하는 제 2 VLC 테이블로부터 선택할 수도 있다 (단계 830). 예를 들어, 위에서 논의된 바와 같이, 엔트로피 인코딩 유닛 (56) 은 CBFU 및 CBFV 값들이 제 2 콘텍스트에 대하여 해당 TU에 대한 가장 가능한 값들을 포함하는 경우에는, 최단 (예를 들어, 단일-비트) 코드워드를 선택할 수도 있다. 반면에, 엔트로피 인코딩 유닛 (56) 은 CBFU 및 CBFV 값들이 가장 가능한 값들이 아닌 경우에는, 최단 코드워드가 아닌 코드워드를 선택할 수도 있다. 또 다시, 예를 들어 제 2 코드워드는 제 2 콘텍스트에 대하여 해당 TU에 대한 CBFU 및 CBFV 값들의 우도, 즉, 또 다시 코딩되는 중인 TU의 제 1 색차 성분 및 제 2 색차 성분의 우도에 반비례하는 길이, 예를 들어 비트 길이를 가질 수도 있다.
위에서 역시 설명된 바와 같이, 몇몇 예들에서는, 엔트로피 인코딩 유닛 (56) 은, 제 2 VLC 테이블을 위의 결정들에 기초하여 또한 업데이트하여, 어떤 결정들이 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다 (단계 832). 예를 들어, 엔트로피 인코딩 유닛 (56) 은 코드워드들의 제 2 VLC 테이블 내의 CBFU 및 CBFV 값들로의 매핑을 결정된 CBFU 및 CBFV 값들에 기초하여 업데이트함으로써, 위에서 설명된 바와 같이, 제 2 콘텍스트 내에서 더 빈번하게 발생하는 값들이, 다른 덜 빈번하게-발생하는 값들보다 더 짧은 코드워드들로 매핑되도록 할 수도 있다.
마지막으로, 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를 비트스트림으로 출력할 수도 있다 (단계 834). 예를 들어, 엔트로피 인코딩 유닛 (56) 은 제 2 코드워드를 그 CU에 대한 RQT 내에 제 1 코드워드와 함께 포함함으로써, 제 2 코드워드가 그 TU에 대한 CBFU 및 CBFV를 나타내는 단일 값을 포함하도록 할 수도 있다. 그러면, 엔트로피 인코딩 유닛 (56) 은 TU에 대한 휘도 CBF, 색차 CBF, 및 TSF를 공동으로 인코딩하는 것을 중지하고 (단계 820), 그리고 다른 코딩 태스크들, 예를 들어 그 CU 또는 후속 CU에 대한 다른 구문 엘리먼트들의 인코딩으로 진행할 수도 있다.
이러한 방식으로, 도 8 의 방법은, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하는 단계, TU가 서브-TU들로 스플릿되는지의 여부를 결정하는 단계, 코드워드를 VLC 테이블로부터 선택하는 단계로서, 여기에서, VLC 테이블은 코드워드가 이러한 결정들에 대응한다는 표시를 제공하는, 상기 선택하는 단계, 및 그 코드워드를 그 TU에 대하여 제공하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법의 일 예를 나타낸다.
도 9 는 비디오 데이터의 CU의 TU에 대한 공동으로 인코딩된 휘도 CBF, 색차 CBF, 및 TSF를 디코딩하기 위한 예시적인 방법을 도시하는 흐름도이다. 또 다시, 도 9 의 기법들은 일반적으로, 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 조합으로 구현되는 임의의 처리 유닛 또는 프로세서에 의하여 수행될 수도 있고, 그리고 소프트웨어 또는 펌웨어로 구현되면, 소프트웨어 또는 펌웨어에 대한 명령들을 실행하기 위하여 대응하는 하드웨어가 제공될 수도 있다. 예를 들기 위한 목적들에서, 도 9 의 기법들은 비디오 디코더 (30) (도 1 및 도 3) 에 대하여 설명되는데, 하지만 다른 디바이스들이 유사한 기법들을 수행하도록 구성될 수도 있다는 것이 이해되어야 한다. 또한, 도 9 에서 도시된 단계들은 상이한 순서로 또는 병렬적으로 수행될 수도 있으며, 그리고, 본 개시물의 기법들로부터 벗어나지 않으면서 추가적인 단계들이 추가되거나 특정 단계들이 생략될 수도 있다.
처음에, 비디오 디코더 (30) 는 비디오 데이터의 블록의 TU에 대한 제 1 코드워드를 수신할 수도 있다 (단계 900). 위에서 설명된 바와 같이, 비디오 디코더 (30) 는 또한, 다른 구문 정보 및 블록에 대한 예측 모드를 표시하는, 그 블록에 대한 비디오 데이터, 예를 들어 양자화된 변환 계수들 및/또는 블록 헤더 데이터를 수신할 수도 있다. 위에서 역시 설명된 바와 같이, 블록은, LCU와 연관된 CU 쿼드트리 내의 리프-노드에 대응하는 CU, 예컨대 LCU의 서브-CU에 대응할 수도 있다. CU는, 예를 들어 CU의 최대 TU를 포함하는, 하나 이상의 TU들을 포함할 수도 있는데, 이것은 위에서 역시 설명된 바와 같이 그 최대 TU와 연관된 RQT에 따라서 서브-TU들로 스플릿될 수도 있다. 이러한 방식으로, 도 9 의 방법은, CU의 최대 TU, 및 최대 TU의 서브-TU들을 포함하는, CU의 임의의 TU로 재귀적으로 적용될 수도 있다. 위에서 역시 설명된 바와 같이, 제 1 코드워드는 VLC 코드워드를 포함할 수도 있다.
또한, 비디오 디코더 (30) 는 TU에 대한 제 1 콘텍스트를 결정할 수도 있다 (단계 902). 예를 들어, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 제 1 콘텍스트를 도 8 의 엔트로피 인코딩 유닛 (56) 에 대하여 위에서 설명된 바와 실질적으로 유사한 방식으로, 예를 들어: 그 TU에 대응하는 PU에 대한 예측 모드; 그 TU에 대한 파티션 레벨; 및 코드워드에 의하여 표현되는, TU의 성분들의 개수; 중 하나 이상에 기초하여 결정할 수도 있다.
일 예로서, 엔트로피 디코딩 유닛 (70) 은 TU에 대응하는 PU에 대한 예측 모드를 CU에 대한 헤더 데이터 내에 포함된 수신된 구문 정보로부터 결정할 수도 있다. 다른 예로서, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 파티션 레벨을, CU의 다른 TU들 (예를 들어, 대응하는 RQT 내의 TU의 부모 TU) 에 대한 이전에 수신된 코드워드들로부터 결정할 수도 있다. 또 다른 예로서, 엔트로피 디코딩 유닛 (70) 은, CU의 다른 TU들 (예를 들어, 대응하는 RQT 내의 TU의 부모 및 형제 TU들) 에 대한 이전에 수신된 코드워드들을 이용하여 추론함으로써, 코드워드에 의하여 표현되는 TU의 성분들의 개수를 결정할 수도 있다.
또한, 엔트로피 디코딩 유닛 (70) 은 제 1 VLC 테이블을 제 1 콘텍스트에 기초하여 선택할 수도 있다 (단계 904). 예를 들어, 제 1 VLC 테이블은 코드워드들의 CBFY, CBFC, 및 TSF 값들로의 매핑을 포함할 수도 있다. 엔트로피 디코딩 유닛 (70) 은 TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩되는지, 즉, 적어도 하나의 비-제로 계수를 포함하는지의 여부를, 제 1 코드워드 및 제 1 VLC 테이블에 기초하여 더 결정할 수도 있다. 몇몇 예들에서는, 엔트로피 디코딩 유닛 (70) 은 TU의 휘도 성분이 코딩되는지의 여부를 제 1 코드워드 및 제 1 VLC 테이블에 기초하여 또한 결정할 수도 있다. 또한, 엔트로피 디코딩 유닛 (70) 은 TU가 서브-TU들로 스플릿되는지의 여부를 제 1 코드워드 및 제 1 VLC 테이블에 기초하여 결정할 수도 있다. 예를 들어, 엔트로피 디코딩 유닛 (70) 은 제 1 VLC 테이블 내의 수신된 제 1 코드워드로 매핑되는 위의 결정들에 대응하는 CBFY, CBFC, 및 TSF 구문 엘리먼트에 대한 값들을 취출할 수도 있다. 이러한 방식으로, 엔트로피 디코딩 유닛 (70) 은 블록의 TU의 제 1 색차 성분 또는 제 2 색차 성분이 코딩된다는 것을 제 1 코드워드가 표시하는지의 여부 (단계 906), TU의 휘도 성분이 코딩된다는 것을 제 1 코드워드가 표시하는지의 여부 (단계 908), 및 TU가 서브-TU들로 스플릿된다는 것을 제 1 코드워드가 표시하는지의 여부를 결정할 수도 있다 (단계 910).
또 다시, 비디오 디코더 (30) 의 VLC 테이블들은 비디오 인코더 (20) 의 VLC 테이블들과 실질적으로 유사할 수도 있다. 이전에 설명된 바와 같이, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 제 1 콘텍스트를 도 8 의 엔트로피 인코딩 유닛 (56) 에 대하여 위에서 설명된 바와 실질적으로 유사한 방식으로 결정할 수도 있다. 이와 같이, 제 1 콘텍스트를 이용하여 제 1 VLC 테이블을 선택하는 비디오 디코더 (30) 는, 제 1 코드워드를 선택하기 위하여 비디오 인코더 (20) 에 의하여 이용되는 VLC 테이블의 매핑과 실질적으로 유사한, VLC 코드워드들의 CBFY, CBFC, 및 TSF 값들로의 매핑을 포함하는 VLC 테이블을 초래할 수도 있다. 매핑들 간의 이러한 유사성은 비디오 디코더 (30) 가 제 1 코드워드 및 제 1 VLC 테이블을 이용하여 위의 결정들을 실행하는 것을 가능하게 할 수도 있다.
위에서 설명된 바와 같이, 위의 결정들의 결과들은 TU에 대한 CBFY, CBFC, 및 TSF에 대응할 수도 있다. 예를 들어, "1"의 CBFY 값은 TU의 휘도 성분이 코딩된다는 것을 표시할 수도 있고, 그리고 "0"의 CBFY 값은 휘도 성분이 코딩되지 않는다는 것을 표시할 수도 있다. 마찬가지로, "1"의 CBFC 값은 TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩된다는 것을 표시할 수도 있고, 그리고 "0"의 CBFC 값은 제 1 색차 성분 및 제 2 색차 성분이 코딩되지 않는다는 것을 표시할 수도 있다. 마찬가지로, "1"의 TSF 값은 TU가 서브-TU들로 스플릿된다는 것을 표시할 수도 있고, 그리고 "0"의 TSF 값은 그 TU가 스플릿되지 않는다는 것을 표시할 수도 있다. 위에서 역시 설명된 바와 같이, 제 1 코드워드는 제 1 콘텍스트에 대하여 해당 TU에 대한 CBFY, CBFC, 및 TSF 값들의 우도, 즉 TU의 휘도 성분이 코딩될, 그 TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩될, 그리고 TU가 서브-TU들로 스플릿될 우도에 반비례하는 길이를 가질 수도 있다.
위에서 역시 설명된 바와 같이, 몇몇 예들에서는, 엔트로피 디코딩 유닛 (70) 은 제 1 VLC 테이블을 위의 결정들에 기초하여 업데이트하여, 어떤 결정들이 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다 (단계 912). 예를 들어, 엔트로피 디코딩 유닛 (70) 은 코드워드들의 제 1 VLC 테이블 내의 CBFY, CBFC, 및 TSF 값들로의 매핑을 결정된 CBFY, CBFC, 및 TSF 값들에 기초하여 업데이트함으로써, 위에서 설명된 바와 같이, 제 1 콘텍스트 내에서 더 빈번하게 발생하는 값들이, 다른 덜 빈번하게-발생하는 값들보다 더 짧은 코드워드들로 매핑되도록 할 수도 있다.
위에서 설명된 바와 같이, 비디오 디코더 (30) 는 블록의 TU의 제 1 색차 성분 및 제 2 색차 성분이 코딩되는지의 여부를 결정할 수도 있다 (단계 914). 이러한 방식으로, 이전에 설명된 바와 같이, 비디오 디코더 (30) 는 블록의 TU의 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩되는지의 여부를 결정할 수도 있다. 제 1 색차 성분 및 제 2 색차 성분 모두가 코딩되지 않는 경우에서는, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 공동으로 인코딩된 휘도 CBF, 색차 CBF, 및 TSF를 디코딩하는 것을 중지하고 (단계 916), 그리고 다른 코딩 태스크들, 예를 들어 그 CU 또는 후속 CU에 대한 다른 구문 엘리먼트들의 디코딩으로 진행할 수도 있다. 그러나, 제 1 색차 성분 및 제 2 색차 성분 중 적어도 하나가 코딩되는 경우에서는, 비디오 디코더 (30) 는 제 1 및 제 2 색차 성분들 중 어느 것이 코딩되는지를 결정함으로써, 디코딩 프로세스를 계속할 수도 있다.
예를 들어, 비디오 디코더 (30) 는 TU의 제 1 색차 성분 및 제 2 색차 성분이 코딩되는지의 여부의 표시를 수신할 수도 있다. 몇몇 예들에서는, 비디오 디코더 (30) 는 이러한 표시를 비트스트림 내의, 그 TU에 대한 명백하게 시그널링된 CBFU 및 CBFV의 형태로서 수신할 수도 있는데, 여기에서 각각의 CBF는 개별적으로 시그널링된다. 다른 예들에서는, 비디오 디코더 (30) 는 이러한 표시를, 그 TU에 대한 공동으로 인코딩된 CBFY, CBFC, 및 TSF를 디코딩하는 것에 대하여 위에서 설명된 것과 실질적으로 유사한 방식으로, 그 TU에 대한 공동으로 인코딩된 CBFU 및 CBFV의 형태로 수신할 수도 있다.
예를 들어, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 제 2 코드워드를 수신할 수도 있다 (단계 918). 또한, 제 2 코드워드는 VLC 코드워드를 포함할 수도 있고, 그리고 TU에 대한 공동으로 인코딩된 CBFU 및 CBFV에 대응할 수도 있다. 제 2 코드워드를 디코딩하기 위하여, 엔트로피 디코딩 유닛 (70), 또는 비디오 디코더 (30) 의 다른 유닛은 TU에 대한 제 2 콘텍스트를 결정할 수도 있다 (단계 920). 또 다시, 예를 들어 엔트로피 디코딩 유닛 (70) 은 TU에 대한 제 2 콘텍스트를 도 8 의 엔트로피 인코딩 유닛 (56) 에 대하여 위에서 설명된 바와 실질적으로 유사한 방식으로, 예를 들어: CU에 대한 파티션 레벨; 그 TU에 대한 파티션 레벨; 그 TU에 대응하는 PU에 대한 예측 모드; TU의 이웃하는 TU들의 제 1 색차 성분들 및 제 2 색차 성분들에 대응하는 CBF 값들; 중 하나 이상에 기초하여 결정할 수도 있다. 예를 들어, 이웃하는 TU들은, 공동으로 인코딩된 휘도 CBF들, 색차 CBF들, 및 TSF들이 본 명세서에서 설명된 바와 동일한 방식으로 이전에 디코딩되었던 대상이 되는, CU의 다른 TU들일 수도 있다. 일 예로서, 엔트로피 디코딩 유닛 (70) 은 CU에 대한 파티션 레벨을, 예를 들어, 이전에 설명된 바와 같이, CU의 LCU와 연관된 CU 쿼드트리에 대응하는, CU에 대한 헤더 데이터 내에 포함된 수신된 구문 정보로부터 결정할 수도 있다.
또한, 엔트로피 디코딩 유닛 (70) 은 제 2 VLC 테이블을 제 2 콘텍스트에 기초하여 선택할 수도 있다 (단계 922). 예를 들어, 제 2 VLC 테이블은 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 포함할 수도 있다. 몇몇 예들에서는, 엔트로피 디코딩 유닛 (70) 은 제 1 VLC 테이블 및 제 2 VLC 테이블 양자를 선택하기 위하여 동일한 콘텍스트를 이용할 수도 있는데, 이러한 경우에는 위에서 논의된 제 1 및 제 2 콘텍스트들은 동일한 콘텍스트를 포함할 수도 있다.
그러면, 엔트로피 디코딩 유닛 (70) 은 TU의 제 1 색차 성분이 코딩되는지의 여부를 제 2 코드워드 및 제 2 VLC 테이블에 기초하여 결정할 수도 있다. 또한, 엔트로피 디코딩 유닛 (70) 은 TU의 제 2 색차 성분이 코딩되는지의 여부를 제 2 코드워드 및 제 2 VLC 테이블에 기초하여 결정할 수도 있다. 예를 들어, 엔트로피 디코딩 유닛 (70) 은 제 2 VLC 테이블 내의 수신된 제 2 코드워드로 매핑되는, 위의 결정들에 대응하는 CBFU 및 CBFV 구문 엘리먼트에 대한 값들을 취출할 수도 있다. 이러한 방식으로, 엔트로피 디코딩 유닛 (70) 은 TU의 제 1 색차 성분이 코딩된다는 것을 제 2 코드워드가 표시하는지의 여부 (단계 924), 및 TU의 제 2 색차 성분이 코딩된다는 것을 제 2 코드워드가 표시하는지의 여부를 결정할 수도 있다 (단계 926).
또 다시, 비디오 디코더 (30) 의 VLC 테이블들은 비디오 인코더 (20) 의 VLC 테이블들과 실질적으로 유사할 수도 있다. 이전에 설명된 바와 같이, 엔트로피 디코딩 유닛 (70) 은 TU에 대한 제 2 콘텍스트를 도 8 의 엔트로피 인코딩 유닛 (56) 에 대하여 위에서 설명된 바와 실질적으로 유사한 방식으로 결정할 수도 있다. 이와 같이, 제 2 콘텍스트를 이용하여 제 2 VLC 테이블을 선택하는 비디오 디코더 (30) 는, 제 2 코드워드를 선택하기 위하여 비디오 인코더 (20) 에 의하여 이용되는 VLC 테이블의 매핑과 실질적으로 유사한 VLC 코드워드들의 CBFU 및 CBFV 값들로의 매핑을 포함하는 제 2 VLC 테이블을 초래할 수도 있다. 매핑들 간의 이러한 유사성은 비디오 디코더 (30) 가 제 2 코드워드 및 제 2 VLC 테이블을 이용하여 위의 결정들을 실행하는 것을 가능하게 할 수도 있다.
위에서 설명된 바와 같이, 위의 결정들의 결과들은 TU에 대한 CBFU 및 CBFV에 대응할 수도 있다. 예를 들어, "1"의 CBF 값은 TU의 대응하는 색차 성분이 코딩된다는 것을 표시할 수도 있고, 그리고 "0"의 CBF 값은 색차 성분이 코딩되지 않는다는 것을 표시할 수도 있다. 위에서 역시 설명된 바와 같이, 제 2 코드워드는, 다시 한번 제 2 콘텍스트에 대하여 해당 TU에 대한, CBFU 및 CBFV 값들의 우도, 즉 TU의 제 1 색차 성분 및 제 2 색차 성분이 코딩될 우도에 반비례하는 길이를 가질 수도 있다.
위에서 역시 설명된 바와 같이, 몇몇 예들에서는, 엔트로피 디코딩 유닛 (70) 은, 제 2 VLC 테이블을 위의 결정들에 기초하여 또한 업데이트하여, 어떤 결정들이 더 많이 또는 더 적게 발생할 것 같은지를 반영할 수도 있다 (단계 928). 예를 들어, 엔트로피 디코딩 유닛 (70) 은 코드워드들의 그 제 2 VLC 테이블 내의 CBFU 및 CBFV 값들로의 매핑을 결정된 CBFU 및 CBFV 값들에 기초하여 업데이트함으로써, 이전에 설명된 바와 같이, 제 2 콘텍스트 내에서 더 빈번하게 발생하는 값들이 다른 덜 빈번하게-발생하는 값들보다 더 짧은 코드워드들로 매핑되도록 할 수도 있다.
마지막으로, 비디오 디코더 (30) 는 TU에 대한 공동으로 인코딩된 휘도 CBF, 색차 CBF, 및 TSF를 디코딩하는 것을 중지하고 (단계 916), 그리고 다른 코딩 태스크들, 예를 들어 CU 또는 후속 CU에 대한 다른 구문 엘리먼트들의 디코딩으로 진행할 수도 있다.
이러한 방식으로, 도 9 의 방법은, 비디오 데이터의 CU의 TU의 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 그 TU에 대한 코드워드에 기초하여 결정하는 단계, TU가 서브-TU들로 스플릿되는지의 여부를 그 코드워드에 기초하여 결정하는 단계, 및 상기 결정들에 기초하여 그 TU를 디코딩하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법의 일 예를 나타낸다.
하나 이상의 예들에서, 설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 그것들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현된다면, 이러한 기능들은 하나 이상의 명령들 또는 코드로서 컴퓨터 판독 가능한 매체 상에 저장되거나 이를 통하여 송신될 수 있으며, 그리고 하드웨어-기반의 처리 유닛에 의하여 실행될 수도 있다. 컴퓨터-판독 가능 매체는 컴퓨터-판독가능 저장 미디어를 포함할 수도 있는데, 이것은 데이터 저장 미디어와 같은 유형의 매체, 또는 예를 들어 통신 프로토콜에 따라, 한 장소에서 다른 장소로의 컴퓨터 프로그램의 전송을 용이하게 하는 임의의 매체를 포함하는 통신 미디어에 대응한다. 이러한 방식으로, 컴퓨터-판독 가능 미디어는 일반적으로 (1) 비-일시적인 유형의 컴퓨터-판독가능 저장 미디어 또는 (2) 신호 또는 반송파와 같은 통신 매체에 대응할 수도 있다. 데이터 저장 미디어는, 본 개시물에서 설명된 기법들의 구현을 위한 명령들, 코드 및/또는 데이터 구조들을 취출하기 위해 하나 이상의 컴퓨터들 또는 하나 이상의 프로세서들에 의해 액세스될 수 있는 임의의 이용가능한 미디어일 수도 있다. 컴퓨터 프로그램 제품은 컴퓨터-판독 가능한 매체를 포함할 수도 있다.
예로서, 이러한 컴퓨터-판독가능 저장 매체는 RAM, ROM, EEPROM, CD-ROM 또는 기타의 광 디스크 스토리지, 자기 디스크 스토리지, 또는 다른 자기 저장 디바이스들, 플래시 메모리, 또는 원하는 프로그램 코드를 명령들 또는 데이터 구조들의 형태로 저장하기 위하여 이용될 수 있고 그리고 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있는데, 이것에 한정되는 것은 아니다. 또한, 임의의 접속도 적절하게 컴퓨터-판독가능 매체라고 칭한다. 예를 들어, 명령들이 웹사이트, 서버, 또는 다른 원격 소스로부터 동축 케이블, 광섬유 케이블, 연선 (twisted pair), 디지털 가입자 회선 (DSL), 또는 무선 기술들 이를테면 적외선, 라디오, 및/또는 마이크로파를 이용하여 전송된다면, 그러면 동축 케이블, 광섬유 케이블, 연선, DSL, 또는 적외선, 라디오, 및 마이크로파와 같은 무선 기술이 매체의 정의에 포함된다. 그러나, 컴퓨터-판독 가능 저장 미디어 및 데이터 저장 미디어가, 접속들, 반송파들, 신호들 또는 다른 일시적인 미디어를 포함하지 않고, 대신에 비일시적이며 유형적인 저장 미디어에 직결된다는 것이 이해되어야 한다. 본 명세서에서 이용된 디스크 (Disk) 및 디스크 (disc) 는 콤팩트 디스크 (CD), 레이저 디스크, 광 디스크, 디지털 다기능 디스크 (DVD), 플로피 디스크 및 블루레이 디스크를 포함하는데, 디스크 (disk) 들은 보통 데이터를 자기적으로 재생하지만, 디스크 (disc) 들은 레이저들에 의해 광학적으로 데이터를 재생한다. 상기한 것들의 조합들도 컴퓨터-판독가능 미디어의 범위 내에 포함되어야 한다.
명령들은 하나 이상의 프로세서들, 이를테면 하나 이상의 디지털 신호 프로세서들 (DSPs), 범용 마이크로프로세서들, 주문형 집적회로들 (ASICs), 필드 프로그램가능 로직 어레이들 (FPGAs), 또는 기타 등가적인 집적 또는 이산 로직 회로에 의해 실행될 수 있다. 따라서, 본 명세서에서 사용된 용어 "프로세서"는 앞서의 구조 또는 본 명세서에서 설명되는 기법들의 구현에 적합한 임의의 다른 구조 중의 어느 것이라도 지칭할 수도 있다. 또한, 일부 양태들에서, 본 명세서에서 설명되는 기능성은 인코딩 및 디코딩을 위하여 구성되는 전용 하드웨어 및/또는 소프트웨어 모듈들 내에 제공되거나, 또는 조합된 코덱 (codec) 내에 통합될 수도 있다. 또한, 이러한 기술들은 하나 이상의 회로들 또는 로직 엘리먼트들 내에서 온전히 구현될 수 있다.
본 개시물의 기법들은, 무선 핸드셋, 집적회로 (IC) 또는 IC들의 세트 (예컨대, 칩 셋) 을 포함하는 매우 다양한 디바이스들 또는 장치들에서 구현될 수 있다. 다양한 구성요소들, 모듈들, 또는 유닛들은 개시된 기법들을 수행하도록 구성되는 디바이스들의 기능적 양태들을 강조하기 위하여 본 개시물에서 설명되는데, 그러나 상이한 하드웨어 유닛들에 의하여 반드시 구현되어야 하는 것은 아니다. 오히려, 위에서 설명된 바와 같이, 다양한 유닛들은 코덱 하드웨어 유닛 내에 조합되거나 또는 적합한 소프트웨어 및/또는 펌웨어와 연계하여, 위에서 설명된 바와 같은 하나 이상의 프로세서들을 포함하는, 상호운용적 하드웨어 유닛들의 컬렉션에 의해 제공될 수도 있다.
다양한 예들이 설명되었다. 이러한 그리고 다른 예들이 하기의 특허청구범위들의 범위 내에 속한다.

Claims (56)

  1. 비디오 데이터를 디코딩하는 방법으로서:
    비디오 데이터의 코딩 유닛의 변환 유닛의 제 1 구문 엘리먼트 (syntax element) 를 디코딩하는 단계로서, 상기 제 1 구문 엘리먼트는, 상기 변환 유닛의 상이한 색차 성분인 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부와 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 공동으로 나타내고, 상기 제 1 구문 엘리먼트는 상기 코딩 유닛에 대한 다른 구문 엘리먼트들과 독립된 것이고, 상기 다른 구문 엘리먼트들은 상기 제 1 색차 성분 및 상기 제 2 색차 성분에 대응하는 상기 코딩 유닛의 적어도 부분에 대한 예측 모드를 나타내는 제 2 구문 엘리먼트를 포함하는, 상기 제 1 구문 엘리먼트를 디코딩하는 단계;
    상기 변환 유닛의 상이한 색차 성분인 상기 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하는 단계;
    상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿되는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하는 단계; 및
    상기 변환 유닛을 상기 결정들에 기초하여 디코딩하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
  2. 삭제
  3. 삭제
  4. 제 1 항에 있어서,
    상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하는 단계는,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정한 이후, 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 변환 유닛에 대한 제 3 의 상이한 구문 엘리먼트에 기초하여 결정하는 단계를 포함하며,
    상기 방법은:
    상기 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 3 구문 엘리먼트에 기초하여 결정하는 단계를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
  5. 삭제
  6. 삭제
  7. 제 1 항에 있어서,
    상기 제 1 구문 엘리먼트는 코드워드를 포함하고,
    상기 방법은 가변장 코드 테이블을 상기 변환 유닛에 대한 콘텍스트에 기초하여 선택하는 단계를 더 포함하고,
    상기 콘텍스트는: 상기 변환 유닛에 대응하는 예측 유닛에 대한 예측 모드; 상기 변환 유닛에 대한 파티션 레벨; 및 상기 코드워드에 의하여 표현된 상기 변환 유닛의 성분들의 개수; 중 적어도 하나를 포함하고,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 코드워드에 기초하여 결정하는 단계는, 상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다는 것을 상기 코드워드가 나타낸다고 상기 가변장 코드 테이블이 표시하는지의 여부를 결정하는 단계를 포함하며, 그리고
    상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 상기 코드워드에 기초하여 결정하는 단계는, 상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿된다는 것을 상기 코드워드가 나타낸다고 상기 가변장 코드 테이블이 표시하는지의 여부를 결정하는 단계를 포함하는, 비디오 데이터를 디코딩하는 방법.
  8. 제 7 항에 있어서,
    상기 가변장 코드 테이블을 상기 결정들에 기초하여 업데이트하는 단계를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
  9. 제 1 항에 있어서,
    상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿되는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하는 단계는, 상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿된다는 것을 상기 제 1 구문 엘리먼트가 나타낸다고 결정하는 단계를 포함하고, 그리고
    상기 서브-변환 유닛들은 상기 코딩 유닛에 대한 최소-사이즈의 변환 유닛들에 대응하며,
    상기 방법은,
    상기 서브-변환 유닛들에 대한 각각의 상기 제 1 구문 엘리먼트들을 참조하지 않고서, 상기 서브-변환 유닛들이 다른 서브-변환 유닛들로 스플릿되지 않는다는 것을, 상기 코딩 유닛에 대한 상기 최소-사이즈의 변환 유닛들에 대응하는 상기 서브-변환 유닛들에 기초하여 결정하는 단계를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
  10. 제 1 항에 있어서,
    상기 변환 유닛은 상기 코딩 유닛의 부모 변환 유닛의 복수의 서브-변환 유닛들 중 하나를 포함하고,
    상기 부모 변환 유닛은 상기 코딩 유닛에 대한 최대 허용 사이즈보다 더 큰 사이즈를 가지며,
    상기 방법은,
    상기 부모 변환 유닛에 대한 각각의 제 1 구문 엘리먼트들을 참조하지 않고서, 상기 부모 변환 유닛이 상기 복수의 서브-변환 유닛들로 스플릿된다는 것을, 상기 코딩 유닛에 대한 최대 허용 사이즈보다 더 큰 사이즈를 가지는 부모 변환 유닛에 기초하여 결정하는 단계를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
  11. 제 1 항에 있어서,
    상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하는 단계는, 상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿된다는 것을 상기 제 1 구문 엘리먼트가 나타낸다고 결정하는 단계를 포함하며,
    상기 방법은,
    상기 서브-변환 유닛들이 다른 서브-변환 유닛들로 스플릿되는지의 여부를 상기 서브-변환 유닛들에 대한 각각의 상이한 구문 엘리먼트들에 기초하여 결정하는 단계를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
  12. 비디오 데이터를 디코딩하기 위한 장치로서:
    비디오 데이터를 저장하도록 구성된 메모리 및 비디오 디코더를 포함하고,
    상기 비디오 디코더는:
    상기 비디오 데이터의 코딩 유닛의 변환 유닛의 제 1 구문 엘리먼트 (syntax element) 를 디코딩하는 것으로서, 상기 제 1 구문 엘리먼트는, 상기 변환 유닛의 상이한 색차 성분인 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부와 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 공동으로 나타내고, 상기 제 1 구문 엘리먼트는 상기 코딩 유닛에 대한 다른 구문 엘리먼트들과 독립된 것이고, 상기 다른 구문 엘리먼트들은 상기 제 1 색차 성분 및 상기 제 2 색차 성분에 대응하는 상기 코딩 유닛의 적어도 부분에 대한 예측 모드를 나타내는 제 2 구문 엘리먼트를 포함하고;
    상기 변환 유닛의 상이한 색차 성분인 상기 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하고,
    상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿되는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하며, 그리고
    상기 변환 유닛을 상기 결정들에 기초하여 디코딩하도록 구성되는, 비디오 데이터를 디코딩하기 위한 장치.
  13. 삭제
  14. 제 12 항에 있어서,
    상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하기 위하여, 상기 비디오 디코더는,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다고 상기 제 1 구문 엘리먼트에 기초하여 결정한 이후에, 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 변환 유닛에 대한 제 3 의 상이한 구문 엘리먼트에 기초하여 결정하도록 구성되고,
    상기 비디오 디코더는:
    상기 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 3 구문 엘리먼트에 기초하여 결정하도록 더 구성되는, 비디오 데이터를 디코딩하기 위한 장치.
  15. 삭제
  16. 제 12 항에 있어서,
    상기 제 1 구문 엘리먼트는 코드워드를 포함하고,
    상기 비디오 디코더는 상기 변환 유닛에 대한 콘텍스트에 기초하여 가변장 코드 테이블을 선택하도록 더 구성되고,
    상기 콘텍스트는: 상기 변환 유닛에 대응하는 예측 유닛에 대한 예측 모드; 상기 변환 유닛에 대한 파티션 레벨; 및 상기 코드워드에 의하여 표현된 상기 변환 유닛의 성분들의 개수; 중 적어도 하나를 포함하며,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 코드워드에 기초하여 결정하기 위하여, 상기 비디오 디코더는, 상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다는 것을 상기 코드워드가 나타낸다고 상기 가변장 코드 테이블이 표시하는지의 여부를 결정하도록 구성되고, 그리고
    상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿되는지의 여부를 상기 코드워드에 기초하여 결정하기 위하여, 상기 비디오 디코더는, 상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿된다는 것을 상기 코드워드가 나타낸다고 상기 가변장 코드 테이블이 표시하는지의 여부를 결정하도록 구성되는, 비디오 데이터를 디코딩하기 위한 장치.
  17. 제 12 항에 있어서,
    상기 장치는:
    집적 회로;
    마이크로프로세서; 또는
    상기 비디오 디코더를 포함하는 무선 통신 디바이스
    중 적어도 하나를 포함하는, 비디오 데이터를 디코딩하기 위한 장치.
  18. 비디오 데이터를 디코딩하기 위한 장치로서:
    비디오 데이터의 코딩 유닛의 변환 유닛의 제 1 구문 엘리먼트 (syntax element) 를 디코딩하는 수단으로서, 상기 제 1 구문 엘리먼트는, 상기 변환 유닛의 상이한 색차 성분인 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부와 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 공동으로 나타내고, 상기 제 1 구문 엘리먼트는 상기 코딩 유닛에 대한 다른 구문 엘리먼트들과 독립된 것이고, 상기 다른 구문 엘리먼트들은 상기 제 1 색차 성분 및 상기 제 2 색차 성분에 대응하는 상기 코딩 유닛의 적어도 부분에 대한 예측 모드를 나타내는 제 2 구문 엘리먼트를 포함하는, 상기 제 1 구문 엘리먼트를 디코딩하는 수단;
    상기 변환 유닛의 상이한 색차 성분인 상기 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하기 위한 수단;
    상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿되는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하기 위한 수단; 및
    상기 변환 유닛을 상기 결정들에 기초하여 디코딩하기 위한 수단을 포함하는, 비디오 데이터를 디코딩하기 위한 장치.
  19. 삭제
  20. 삭제
  21. 제 18 항에 있어서,
    상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하기 위한 수단은, 상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정한 이후에, 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 변환 유닛에 대한 제 3 의 상이한 구문 엘리먼트에 기초하여 결정하기 위한 수단을 포함하고,
    상기 장치는:
    상기 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 3 구문 엘리먼트에 기초하여 결정하기 위한 수단을 더 포함하는, 비디오 데이터를 디코딩하기 위한 장치.
  22. 삭제
  23. 제 18 항에 있어서,
    상기 제 1 구문 엘리먼트는 코드워드를 포함하고,
    가변장 코드 테이블을 상기 변환 유닛에 대한 콘텍스트에 기초하여 선택하기 위한 수단으로서, 상기 콘텍스트는: 상기 변환 유닛에 대응하는 예측 유닛에 대한 예측 모드; 상기 변환 유닛에 대한 파티션 레벨; 및 상기 코드워드에 의하여 표현된 상기 변환 유닛의 성분들의 개수; 중 적어도 하나를 포함하는, 상기 선택하기 위한 수단을 더 포함하고,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 코드워드에 기초하여 결정하기 위한 수단은, 상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다는 것을 상기 코드워드가 나타낸다고 상기 가변장 코드 테이블이 표시하는지의 여부를 결정하기 위한 수단을 포함하며, 그리고
    상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿되는지의 여부를 상기 코드워드에 기초하여 결정하기 위한 수단은, 상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿된다는 것을 상기 코드워드가 나타낸다고 상기 가변장 코드 테이블이 표시하는지의 여부를 결정하기 위한 수단을 포함하는, 비디오 데이터를 디코딩하기 위한 장치.
  24. 명령들이 저장된 컴퓨터 판독가능한 저장 매체로서,
    상기 명령들은, 실행시, 비디오 데이터를 디코딩하기 위한 디바이스의 프로세서로 하여금:
    비디오 데이터의 코딩 유닛의 변환 유닛의 제 1 구문 엘리먼트 (syntax element) 를 디코딩하게 하고, 상기 제 1 구문 엘리먼트는, 상기 변환 유닛의 상이한 색차 성분인 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부와 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 공동으로 나타내고, 상기 제 1 구문 엘리먼트는 상기 코딩 유닛에 대한 다른 구문 엘리먼트들과 독립된 것이고, 상기 다른 구문 엘리먼트들은 상기 제 1 색차 성분 및 상기 제 2 색차 성분에 대응하는 상기 코딩 유닛의 적어도 부분에 대한 예측 모드를 나타내는 제 2 구문 엘리먼트를 포함하고,
    상기 변환 유닛의 상이한 색차 성분인 상기 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하게 하고;
    상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿되는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하게 하고; 그리고
    상기 변환 유닛을 상기 결정들에 기초하여 디코딩하게 하는, 컴퓨터 판독가능한 저장 매체.
  25. 삭제
  26. 삭제
  27. 제 24 항에 있어서,
    상기 프로세서로 하여금 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정하게 하는 명령들은, 상기 프로세서로 하여금, 상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 1 구문 엘리먼트에 기초하여 결정한 이후에, 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 변환 유닛에 대한 제 3 의 상이한 구문 엘리먼트에 기초하여 결정하게 하는 명령들을 포함하며,
    상기 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 3 구문 엘리먼트에 기초하여 결정하게 하는 명령들을 더 포함하는, 컴퓨터 판독가능한 저장 매체.
  28. 삭제
  29. 제 24 항에 있어서,
    상기 제 1 구문 엘리먼트는 코드워드를 포함하고,
    상기 프로세서로 하여금, 가변장 코드 테이블을 상기 변환 유닛에 대한 콘텍스트에 기초하여 선택하게 하는 명령들을 더 포함하고,
    상기 콘텍스트는: 상기 변환 유닛에 대응하는 예측 유닛에 대한 예측 모드; 상기 변환 유닛에 대한 파티션 레벨; 및 상기 코드워드에 의하여 표현된 상기 변환 유닛의 성분들의 개수; 중 적어도 하나를 포함하고,
    상기 프로세서로 하여금 상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 코드워드에 기초하여 결정하게 하는 명령들은, 상기 프로세서로 하여금, 상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함한다는 것을 상기 코드워드가 나타낸다고 상기 가변장 코드 테이블이 표시하는지의 여부를 결정하게 하는 명령들을 포함하고, 그리고
    상기 프로세서로 하여금 상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿되는지의 여부를 상기 코드워드에 기초하여 결정하게 하는 명령들은, 상기 프로세서로 하여금, 상기 변환 유닛이 상기 서브-변환 유닛들로 스플릿된다는 것을 상기 코드워드가 나타낸다고 상기 가변장 코드 테이블이 표시하는지의 여부를 결정하게 하는 명령들을 포함하는, 컴퓨터 판독가능한 저장 매체.
  30. 비디오 데이터를 인코딩하는 방법으로서:
    상기 비디오 데이터의 코딩 유닛의 변환 유닛의 상이한 색차 성분인 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하는 단계;
    상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하는 단계; 및
    상기 결정들에 기초하여 제 1 구문 엘리먼트를 인코딩하는 단계로서, 상기 제 1 구문 엘리먼트는 상기 변환 유닛의 상이한 색차 성분인 상기 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부와 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 공동으로 나타내고, 상기 제 1 구문 엘리먼트는 상기 코딩 유닛에 대한 다른 구문 엘리먼트들과 독립된 것이고, 상기 다른 구문 엘리먼트들은 상기 코딩 유닛의 적어도 부분에 대한 예측 모드를 가리키는 제 2 구문 엘리먼트를 포함하는, 상기 결정들에 기초하여 제 1 구문 엘리먼트를 인코딩하는 단계를 포함하는, 비디오 데이터를 인코딩하는 방법.
  31. 삭제
  32. 삭제
  33. 제 30 항에 있어서,
    상기 방법은,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는 경우,
    제 3 의 상이한 코드워드를 인코딩하는 단계로서, 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부, 및 상기 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 3 구문 엘리먼트가 나타내도록, 상기 인코딩하는 단계를 더 포함하는, 비디오 데이터를 인코딩하는 방법.
  34. 삭제
  35. 삭제
  36. 제 30 항에 있어서,
    상기 변환 유닛은 상기 서브-변환 유닛들로 스플릿되고, 그리고
    상기 서브-변환 유닛들은 상기 코딩 유닛에 대한 최소-사이즈의 변환 유닛들에 대응하며,
    상기 방법은, 상기 서브-변환 유닛들의 하나 이상의 성분들이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 나타내는 하나 이상의 구문 엘리먼트들을, 각각의 상기 서브-변환 유닛들이 다른 서브-변환 유닛들로 스플릿되는지의 여부를 상기 구문 엘리먼트들이 표시하지 않도록, 인코딩하는 단계를 더 포함하는, 비디오 데이터를 인코딩하는 방법.
  37. 제 30 항에 있어서,
    상기 변환 유닛은 상기 코딩 유닛의 부모 변환 유닛의 복수의 서브-변환 유닛들 중 하나를 포함하고,
    상기 부모 변환 유닛은 상기 코딩 유닛에 대한 최대 허용 사이즈보다 더 큰 사이즈를 가지며,
    상기 방법은, 상기 부모 변환 유닛의 하나 이상의 성분들이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 나타내는 하나 이상의 구문 엘리먼트들을, 상기 부모 변환 유닛이 상기 복수의 서브-변환 유닛들로 스플릿되는지의 여부를 상기 구문 엘리먼트들이 표시하지 않도록, 인코딩하는 단계를 더 포함하는, 비디오 데이터를 인코딩하는 방법.
  38. 제 30 항에 있어서,
    상기 제 1 구문 엘리먼트는 코드 테이블로부터 선택된 코드워드를 포함하고, 상기 방법은,
    상기 코드 테이블을 상기 변환 유닛에 대한 콘텍스트에 기초하여 선택하는 단계를 더 포함하고,
    상기 콘텍스트는: 상기 변환 유닛에 대응하는 예측 유닛에 대한 예측 모드; 상기 변환 유닛에 대한 파티션 레벨; 또는 상기 제 1 구문 엘리먼트에 의하여 표현될 상기 변환 유닛의 성분들의 개수; 중 적어도 하나를 포함하는, 비디오 데이터를 인코딩하는 방법.
  39. 제 30 항에 있어서,
    상기 변환 유닛은 상기 서브-변환 유닛들로 스플릿되며,
    상기 방법은:
    상기 서브-변환 유닛들이 다른 서브-변환 유닛들로 스플릿되는지의 여부를 나타내는 제 3 의 상이한 구문 엘리먼트를 인코딩하는 단계를 더 포함하는, 비디오 데이터를 인코딩하는 방법.
  40. 제 30 항에 있어서,
    상기 제 1 구문 엘리먼트는 코드 테이블로부터 선택된 코드워드를 포함하고, 상기 방법은 상기 코드 테이블을 상기 결정들에 기초하여 업데이트하는 단계를 더 포함하는, 비디오 데이터를 인코딩하는 방법.
  41. 비디오 데이터를 인코딩하기 위한 장치로서:
    비디오 데이터를 저장하도록 구성된 메모리; 및 비디오 인코더를 포함하고,
    상기 비디오 인코더는:
    상기 비디오 데이터의 코딩 유닛의 변환 유닛의 상이한 색차 성분인 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하고;
    상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하고;
    상기 결정들에 기초하여 제 1 구문 엘리먼트를 인코딩하는 것으로서, 상기 제 1 구문 엘리먼트는 상기 변환 유닛의 상이한 색차 성분인 상기 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부와 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 공동으로 나타내고, 상기 제 1 구문 엘리먼트는 상기 코딩 유닛에 대한 다른 구문 엘리먼트들과 독립된 것이고, 상기 다른 구문 엘리먼트들은 상기 코딩 유닛의 적어도 부분에 대한 예측 모드를 가리키는 제 2 구문 엘리먼트를 포함하는, 상기 결정들에 기초하여 제 1 구문 엘리먼트를 인코딩하도록 구성되는, 비디오 데이터를 인코딩하기 위한 장치.
  42. 삭제
  43. 삭제
  44. 제 41 항에 있어서,
    상기 비디오 인코더는,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는 경우, 제 3 의 상이한 구문 엘리먼트를 인코딩하도록 더 구성되되, 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부, 및 상기 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 3 구문 엘리먼트가 나타내는, 비디오 데이터를 인코딩하기 위한 장치.
  45. 삭제
  46. 제 41 항에 있어서,
    상기 장치는:
    집적 회로;
    마이크로프로세서; 또는
    상기 비디오 인코더를 포함하는 무선 통신 디바이스
    중 적어도 하나를 포함하는, 비디오 데이터를 인코딩하기 위한 장치.
  47. 비디오 데이터를 인코딩하기 위한 장치로서:
    상기 비디오 데이터의 코딩 유닛의 변환 유닛의 상이한 색차 성분인 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하기 위한 수단;
    상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하기 위한 수단; 및
    상기 결정들에 기초하여 제 1 구문 엘리먼트를 인코딩하기 위한 수단으로서, 상기 제 1 구문 엘리먼트는 상기 변환 유닛의 상이한 색차 성분인 상기 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부와 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 공동으로 나타내고, 상기 제 1 구문 엘리먼트는 상기 코딩 유닛에 대한 다른 구문 엘리먼트들과 독립된 것이고, 상기 다른 구문 엘리먼트들은 상기 코딩 유닛의 적어도 부분에 대한 예측 모드를 가리키는 제 2 구문 엘리먼트를 포함하는, 상기 결정들에 기초하여 제 1 구문 엘리먼트를 인코딩하기 위한 수단을 포함하는, 비디오 데이터를 인코딩하기 위한 장치.
  48. 삭제
  49. 삭제
  50. 제 47 항에 있어서,
    상기 장치는,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는 경우, 제 3 의 상이한 구문 엘리먼트를 인코딩하기 위한 수단으로서, 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부, 및 상기 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 3 구문 엘리먼트가 나타내는, 상기 제 3 구문 엘리먼트를 인코딩하기 위한 수단을 더 포함하는, 비디오 데이터를 인코딩하기 위한 장치.
  51. 삭제
  52. 명령들이 저장된 컴퓨터 판독가능한 저장 매체로서,
    상기 명령들은, 실행시, 비디오 데이터를 인코딩하기 위한 디바이스의 프로세서로 하여금:
    비디오 데이터의 코딩 유닛의 변환 유닛의 상이한 색차 성분인 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부를 결정하게 하고;
    상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 결정하게 하고;
    상기 결정들에 기초하여 제 1 구문 엘리먼트를 인코딩하게 하고, 상기 제 1 구문 엘리먼트는 상기 변환 유닛의 상이한 색차 성분인 상기 제 1 또는 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는지의 여부와 상기 변환 유닛이 서브-변환 유닛들로 스플릿되는지의 여부를 공동으로 나타내고, 상기 제 1 구문 엘리먼트는 상기 코딩 유닛에 대한 다른 구문 엘리먼트들과 독립된 것이고, 상기 다른 구문 엘리먼트들은 상기 코딩 유닛의 적어도 부분에 대한 예측 모드를 가리키는 제 2 구문 엘리먼트를 포함하는, 컴퓨터 판독가능한 저장 매체.
  53. 삭제
  54. 삭제
  55. 제 52 항에 있어서,
    상기 제 1 색차 성분 또는 상기 제 2 색차 성분 중 적어도 하나가 적어도 하나의 비-제로 계수를 포함하는 경우, 상기 프로세서로 하여금,
    제 3 의 상이한 구문 엘리먼트를 인코딩하게 하는 명령들로서, 상기 제 1 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부, 및 상기 제 2 색차 성분이 적어도 하나의 비-제로 계수를 포함하는지의 여부를 상기 제 3 구문 엘리먼트가 나타내는, 상기 제 3 구문 엘리먼트를 인코딩하게 하는 명령들을 더 포함하는, 컴퓨터 판독가능한 저장 매체.
  56. 삭제
KR1020137013852A 2010-11-01 2011-10-31 비디오 코딩에 대한 구문 엘리먼트들의 공동 코딩 KR101632776B1 (ko)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US40905210P 2010-11-01 2010-11-01
US61/409,052 2010-11-01
US40947110P 2010-11-02 2010-11-02
US61/409,471 2010-11-02
US201161432548P 2011-01-13 2011-01-13
US61/432,548 2011-01-13
US201161435344P 2011-01-23 2011-01-23
US61/435,344 2011-01-23
US201161449556P 2011-03-04 2011-03-04
US61/449,556 2011-03-04
US201161450554P 2011-03-08 2011-03-08
US61/450,554 2011-03-08
US201161451448P 2011-03-10 2011-03-10
US61/451,448 2011-03-10
US13/283,335 2011-10-27
US13/283,335 US9172963B2 (en) 2010-11-01 2011-10-27 Joint coding of syntax elements for video coding
PCT/US2011/058608 WO2012061298A1 (en) 2010-11-01 2011-10-31 Joint coding of syntax elements for video coding

Publications (2)

Publication Number Publication Date
KR20130084308A KR20130084308A (ko) 2013-07-24
KR101632776B1 true KR101632776B1 (ko) 2016-06-22

Family

ID=45996760

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137013852A KR101632776B1 (ko) 2010-11-01 2011-10-31 비디오 코딩에 대한 구문 엘리먼트들의 공동 코딩

Country Status (5)

Country Link
US (1) US9172963B2 (ko)
JP (1) JP5788520B2 (ko)
KR (1) KR101632776B1 (ko)
CN (1) CN103190147B (ko)
WO (1) WO2012061298A1 (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SI2953356T1 (sl) 2010-08-17 2018-12-31 Samsung Electronics Co., Ltd Postopek dekodiranja videa z uporabo transformacijske enote z variabilno drevesno strukturo
CN103238321B (zh) * 2010-09-30 2016-11-02 三星电子株式会社 用于对分层结构的符号进行编解码的视频编解码方法及其装置
US9172963B2 (en) * 2010-11-01 2015-10-27 Qualcomm Incorporated Joint coding of syntax elements for video coding
EP2663075B1 (en) * 2011-01-06 2020-05-06 Samsung Electronics Co., Ltd Encoding method and device of video using data unit of hierarchical structure, and decoding method and device thereof
US8948271B2 (en) * 2011-01-13 2015-02-03 Texas Instruments Incorporated Method and apparatus for a low complexity transform unit partitioning structure for HEVC
US9729879B2 (en) * 2011-03-10 2017-08-08 Hfi Innovation Inc. Method and apparatus of deblocking filter
US9247266B2 (en) * 2011-04-18 2016-01-26 Texas Instruments Incorporated Temporal motion data candidate derivation in video coding
SG10201605379RA (en) * 2011-07-01 2016-08-30 Samsung Electronics Co Ltd Method and apparatus for entropy encoding using hierarchical data unit, and method and apparatus for decoding
US10499063B2 (en) * 2011-09-16 2019-12-03 Hfi Innovation Inc. Method and apparatus for prediction mode and partition mode syntax coding for coding units in HEVC
EP2999218A1 (en) * 2012-01-12 2016-03-23 MediaTek Inc. Method and apparatus for unification of significance map context selection
US9185405B2 (en) * 2012-03-23 2015-11-10 Qualcomm Incorporated Coded block flag inference in video coding
US9467701B2 (en) 2012-04-05 2016-10-11 Qualcomm Incorporated Coded block flag coding
US9749645B2 (en) * 2012-06-22 2017-08-29 Microsoft Technology Licensing, Llc Coded-block-flag coding and derivation
PT2869563T (pt) 2012-07-02 2018-06-25 Samsung Electronics Co Ltd Método e aparelho para codificar vídeo de entropia e método e aparelho para descodifcar vídeo de entropia
CN103716607B (zh) * 2012-09-28 2017-02-08 中兴通讯股份有限公司 一种应用于HEVC‑based 3DVC的编码方法和装置
AU2012232992A1 (en) * 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
KR101516947B1 (ko) * 2013-10-31 2015-05-04 한밭대학교 산학협력단 Hevc를 위한 고속 변환 크기 결정 방법 및 장치
US9215469B2 (en) * 2014-01-10 2015-12-15 Sony Corporation Intra-plane and inter-plane predictive method for RGB image coding
US10250884B2 (en) 2014-06-20 2019-04-02 Qualcomm Incorporated Systems and methods for signaling information for layer sets in a parameter set
KR102416804B1 (ko) 2016-10-14 2022-07-05 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
CN116886906A (zh) * 2016-10-14 2023-10-13 世宗大学校产学协力团 影像编码方法、影像解码方法以及传送比特流的方法
US10523966B2 (en) * 2017-03-31 2019-12-31 Mediatek Inc. Coding transform blocks
CN110892722A (zh) * 2017-12-06 2020-03-17 富士通株式会社 模式信息的编码和解码方法、装置以及电子设备
CN110035287B (zh) * 2018-01-12 2023-05-09 富士通株式会社 对统一转换单元模式进行分组标识的方法、装置和电子设备
US10645396B2 (en) * 2018-06-04 2020-05-05 Tencent America LLC Method and apparatus for implicit transform splitting
RU183129U1 (ru) * 2018-06-18 2018-09-12 Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" Управляемый вакуумный разрядник
US11109041B2 (en) * 2019-05-16 2021-08-31 Tencent America LLC Method and apparatus for video coding
US11856232B2 (en) * 2019-05-28 2023-12-26 Dolby Laboratories Licensing Corporation Quantization parameter signaling
CN113966611B (zh) 2019-06-09 2023-12-15 北京字节跳动网络技术有限公司 视频编解码中的重要系数信令
CN114615506B (zh) * 2019-06-13 2023-07-04 北京达佳互联信息技术有限公司 视频解码方法、计算设备、存储介质
RU196889U1 (ru) * 2019-12-09 2020-03-19 Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" Управляемый разрядник
RU196890U1 (ru) * 2019-12-09 2020-03-19 Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" Управляемый разрядник
US20230141888A1 (en) * 2020-04-08 2023-05-11 Google Llc Bicriteria Block Splitting Heuristic For Lossy Compression
US20230035118A1 (en) * 2021-07-23 2023-02-02 Tencent America LLC Cross component end of block flag coding
US20230140628A1 (en) * 2021-11-04 2023-05-04 Meta Platforms, Inc. Novel buffer format for a two-stage video encoding process

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080260028A1 (en) 2004-12-22 2008-10-23 Thales Video H.264 Encryption Preserving Synchronization and Compatibility of Syntax
US20090175334A1 (en) 2007-10-12 2009-07-09 Qualcomm Incorporated Adaptive coding of video block header information

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816914A (en) 1987-01-07 1989-03-28 Pictel Corporation Method and apparatus for efficiently encoding and decoding image sequences
JPH09505188A (ja) 1993-11-15 1997-05-20 ナショナル・セミコンダクター・コーポレイション 4分木構造walsh変換符号化
TW376655B (en) 1997-07-23 1999-12-11 Matsushita Electric Ind Co Ltd Method for multi state variable length coding of multi zoned quantized DCT coefficients and apparatus therefor
US6563953B2 (en) 1998-11-30 2003-05-13 Microsoft Corporation Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock
HUE026930T2 (en) * 2002-03-15 2016-08-29 Nokia Technologies Oy Procedure for encoding motion in a series of images
US7099387B2 (en) * 2002-03-22 2006-08-29 Realnetorks, Inc. Context-adaptive VLC video transform coefficients encoding/decoding methods and apparatuses
CN100420308C (zh) 2002-04-26 2008-09-17 株式会社Ntt都科摩 图象编码装置和图象译码装置
EP1387224A3 (en) 2002-08-02 2011-11-16 Eastman Kodak Company Fuser member, apparatus and method for electrostatographic reproduction
US6795584B2 (en) * 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
US7379608B2 (en) 2003-12-04 2008-05-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Arithmetic coding for transforming video and picture data units
US7664176B2 (en) * 2004-07-09 2010-02-16 Nokia Corporation Method and system for entropy decoding for scalable video bit stream
US20060078049A1 (en) 2004-10-13 2006-04-13 Nokia Corporation Method and system for entropy coding/decoding of a video bit stream for fine granularity scalability
NO322043B1 (no) 2004-12-30 2006-08-07 Tandberg Telecom As Fremgangsmate for forenklet entropikoding
KR100746007B1 (ko) 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
US8000547B2 (en) 2005-09-23 2011-08-16 Slipstream Data Inc. Method, system and computer program product for providing entropy constrained color splitting for palette images with color-wise splitting
GB0600141D0 (en) * 2006-01-05 2006-02-15 British Broadcasting Corp Scalable coding of video signals
US7545293B2 (en) * 2006-11-14 2009-06-09 Qualcomm Incorporated Memory efficient coding of variable length codes
US7573407B2 (en) * 2006-11-14 2009-08-11 Qualcomm Incorporated Memory efficient adaptive block coding
US8102913B2 (en) * 2006-12-22 2012-01-24 Sony Corporation DCT/Q/IQ/IDCT bypass algorithm in MPEG to AVC/H.264 transcoding
US8041131B2 (en) * 2007-10-02 2011-10-18 Cisco Technology, Inc. Variable length coding of coefficient clusters for image and video compression
US8483282B2 (en) 2007-10-12 2013-07-09 Qualcomm, Incorporated Entropy coding of interleaved sub-blocks of a video block
US8107754B2 (en) * 2007-12-07 2012-01-31 Mediatek Inc. Systems and methods for randomly accessing compressed images
US8180166B2 (en) * 2008-09-23 2012-05-15 Mediatek Inc. Transcoding method
US8619856B2 (en) * 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) * 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
KR101647376B1 (ko) * 2009-03-30 2016-08-10 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR101624649B1 (ko) * 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US8340448B2 (en) * 2009-10-06 2012-12-25 Cisco Technology, Inc. Locally variable quantization and hybrid variable length coding for image and video compression
KR101791078B1 (ko) * 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
US8934540B2 (en) * 2010-07-20 2015-01-13 Cisco Technology, Inc. Video compression using multiple variable length coding methods for multiple types of transform coefficient blocks
US9172963B2 (en) * 2010-11-01 2015-10-27 Qualcomm Incorporated Joint coding of syntax elements for video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080260028A1 (en) 2004-12-22 2008-10-23 Thales Video H.264 Encryption Preserving Synchronization and Compatibility of Syntax
US20090175334A1 (en) 2007-10-12 2009-07-09 Qualcomm Incorporated Adaptive coding of video block header information

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Bumshik Lee et al: "Improved side information signalling for quad-tree based transform structure of TMuC, JCTVC-C068, Guangzhou, CN, 2010.10.15.
Karczewica M et al: "Variable Length Coding for Coded Block Flag and Large Transform", JCT-VC Meeting, JCTVC-B098, 23 July 2010.

Also Published As

Publication number Publication date
CN103190147A (zh) 2013-07-03
US20120106649A1 (en) 2012-05-03
WO2012061298A1 (en) 2012-05-10
US9172963B2 (en) 2015-10-27
KR20130084308A (ko) 2013-07-24
CN103190147B (zh) 2016-04-27
JP5788520B2 (ja) 2015-09-30
JP2013546257A (ja) 2013-12-26

Similar Documents

Publication Publication Date Title
KR101632776B1 (ko) 비디오 코딩에 대한 구문 엘리먼트들의 공동 코딩
KR101518149B1 (ko) 비디오 코딩을 위한 인트라-예측 모드 선택의 표시
KR101534416B1 (ko) 인트라-예측을 이용한 비디오 코딩
CA2823948C (en) Indicating intra-prediction mode selection for video coding using cabac
JP5587508B2 (ja) ビデオコード化のためのイントラ平滑化フィルタ
KR101469394B1 (ko) 사이즈 및 인트라 모드에 기초한 또는 에지 검출에 기초한 인트라 블록들 코딩을 위한 적응적 주파수 변환들
KR101619004B1 (ko) 인트라 예측 코딩에 있어서의 최빈 변환
KR101632130B1 (ko) 인트라 모드 코딩에서 레퍼런스 모드 선택
IL229415A (en) Enhanced prediction mode signaling for video encoding using neighboring mode
WO2011160010A1 (en) Joint coding of partition information in video coding
KR20130054461A (ko) 큰 매크로블록들을 이용한 비디오 코딩
KR20110063858A (ko) 큰 매크로블록들을 이용한 비디오 코딩
EP2636219A1 (en) Joint coding of syntax elements for video coding

Legal Events

Date Code Title Description
A201 Request for examination
E90F Notification of reason for final refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant