KR20230062630A - 비디오 코딩을 위한 잔차 및 계수 코딩 - Google Patents

비디오 코딩을 위한 잔차 및 계수 코딩 Download PDF

Info

Publication number
KR20230062630A
KR20230062630A KR1020237011788A KR20237011788A KR20230062630A KR 20230062630 A KR20230062630 A KR 20230062630A KR 1020237011788 A KR1020237011788 A KR 1020237011788A KR 20237011788 A KR20237011788 A KR 20237011788A KR 20230062630 A KR20230062630 A KR 20230062630A
Authority
KR
South Korea
Prior art keywords
flag
rice
coding
residual coding
residual
Prior art date
Application number
KR1020237011788A
Other languages
English (en)
Inventor
훙쩡 주
샤오위 슈
이원 천
충촨 마
처웨이 쿼
샹린 왕
빙 위
Original Assignee
베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 filed Critical 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드
Publication of KR20230062630A publication Critical patent/KR20230062630A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 디코딩을 위한 방법들, 장치들, 및 비일시적 컴퓨터 판독가능 저장 매체들이 제공된다. 디코더는 비디오 스트림을 수신할 수 있다. 디코더는 슬라이스 헤더 레벨에서 제어 플래그를 수신할 수 있다. 디코더는 슬라이스 헤더 레벨에서 적어도 하나의 신택스 엘리먼트를 수신할 수 있다. 디코더는 제어 플래그 및 적어도 하나의 신택스 엘리먼트에 기초하여 비디오 비트스트림을 엔트로피 디코딩할 수 있다.

Description

비디오 코딩을 위한 잔차 및 계수 코딩
관련 출원에 대한 상호 참조
본 출원은 2020년 9월 30일자로 출원된 가출원 제63/085,966호 및 2020년 9월 23일자로 출원된 가출원 제63/082,452호에 기초하고 그에 대한 우선권을 주장하며, 그 전체 내용은 모든 목적을 위해 그 전체가 본 명세서에 참고로 포함된다.
기술 분야
본 개시내용은 비디오 코딩 및 압축에 관한 것이다. 더 구체적으로는, 본 개시내용은 비디오 코딩을 위한 잔차 및 계수 코딩의 개선 및 단순화에 관한 것이다.
비디오 데이터를 압축하기 위해 다양한 비디오 코딩 기법들이 이용될 수 있다. 비디오 코딩은 하나 이상의 비디오 코딩 표준에 따라 수행된다. 예를 들어, 비디오 코딩 표준들은 VVC(versatile video coding), JEM(joint exploration test model), H.265/HEVC(high-efficiency video coding), H.264/AVC(advanced video coding), MPEG(moving picture expert group) 코딩 등을 포함한다. 비디오 코딩은 일반적으로 비디오 이미지 또는 시퀀스에 존재하는 중복성을 이용하는 예측 방법(예를 들어, 인터-예측, 인트라-예측 등)을 이용한다. 비디오 코딩 기법들의 중요한 목표는 비디오 품질에 대한 저하들을 회피하거나 최소화하면서, 비디오 데이터를 더 낮은 비트 레이트를 사용하는 형태로 압축하는 것이다.
본 개시내용의 예들은 비디오 코딩에서 잔차 및 계수 코딩을 위한 방법 및 장치를 제공한다.
본 개시내용의 제1 양태에 따르면, 비디오 디코딩을 위한 방법이 제공된다. 이 방법은 디코더가 비디오 비트스트림을 수신하는 단계를 포함할 수 있다. 디코더는 슬라이스 헤더 레벨에서 제어 플래그를 추가로 수신할 수 있다. 제어 플래그는 변환 스킵 슬라이스에 대해 라이스 파라미터가 활성화되어 있는지를 시그널링할 수 있다. 디코더는 또한 슬라이스 헤더 레벨에서 적어도 하나의 신택스 엘리먼트를 수신할 수 있다. 적어도 하나의 신택스 엘리먼트는 변환 스킵 슬라이스에 대해 시그널링되고, 라이스 파라미터를 나타낸다. 디코더는 제어 플래그 및 적어도 하나의 신택스 엘리먼트에 기초하여 비디오 비트스트림을 추가로 엔트로피 디코딩할 수 있다.
아래의 상기 일반적인 설명들 및 상세한 설명들은 단지 예시적이고 설명적이며, 본 개시내용을 제한하도록 의도되지 않는다는 점을 이해하여야 한다.
본 명세서에 통합되고 그 일부를 구성하는 첨부 도면은 본 개시내용에 따른 예를 예시하고 설명과 함께 본 개시내용의 원리를 설명하는 역할을 한다.
도 1은 본 개시내용의 예에 따른 인코더의 블록도이다.
도 2는 본 개시내용의 예에 따른 디코더의 블록도이다.
도 3a는 본 개시내용의 예에 따른, 멀티-타입 트리 구조에서의 블록 파티션들을 예시하는 도면이다.
도 3b는 본 개시내용의 예에 따른, 멀티-타입 트리 구조에서의 블록 파티션들을 예시하는 도면이다.
도 3c는 본 개시내용의 예에 따른, 멀티-타입 트리 구조에서의 블록 파티션들을 예시하는 도면이다.
도 3d는 본 개시내용의 예에 따른, 멀티-타입 트리 구조에서의 블록 파티션들을 예시하는 도면이다.
도 3e는 본 개시내용의 예에 따른, 멀티-타입 트리 구조에서의 블록 파티션들을 예시하는 도면이다.
도 4는 본 개시내용의 예에 따른 18x12 루마 CTU들을 갖는 픽처의 도면 예시이다.
도 5는 본 개시내용의 예에 따른 18x12 루마 CTU들을 갖는 픽처의 예시이다.
도 6a는 본 개시내용의 예에 따른, VTM에서의 허용되지 않은 삼진 트리(TT) 및 이진 트리(BT) 파티셔닝의 예의 예시이다.
도 6b는 본 개시내용의 예에 따른, VTM에서의 허용되지 않은 TT 및 BT 파티셔닝의 예의 예시이다.
도 6c는 본 개시내용의 예에 따른, VTM에서의 허용되지 않은 TT 및 BT 파티셔닝의 예의 예시이다.
도 6d는 본 개시내용의 예에 따른, VTM에서의 허용되지 않은 TT 및 BT 파티셔닝의 예의 예시이다.
도 6e는 본 개시내용의 예에 따른, VTM에서의 허용되지 않은 TT 및 BT 파티셔닝의 예의 예시이다.
도 6f는 본 개시내용의 예에 따른, VTM에서의 허용되지 않은 TT 및 BT 파티셔닝의 예의 예시이다.
도 6g는 본 개시내용의 예에 따른, VTM에서의 허용되지 않은 TT 및 BT 파티셔닝의 예의 예시이다.
도 6h는 본 개시내용의 예에 따른, VTM에서의 허용되지 않은 TT 및 BT 파티셔닝의 예의 예시이다.
도 7은 본 개시내용의 예에 따른, 변환 블록들에 대한 잔차 코딩 구조의 예시이다.
도 8은 본 개시내용의 예에 따른, 변환 스킵 블록들에 대한 잔차 코딩 구조의 예시이다.
도 9는 본 개시내용의 예에 따른, 2개의 스칼라 양자화기의 예시이다.
도 10a는 본 개시내용의 예에 따른 상태 천이의 예시이다.
도 10b는 본 개시내용의 예에 따른 양자화기 선택의 예시이다.
도 11은 본 개시내용에 따른, 확률 모델을 선택하는 데 사용되는 템플릿의 예시이다.
도 12는 본 개시내용에 따른 팔레트 모드에서 코딩된 블록의 예의 예시이다.
도 13은 본 개시내용에 따른 팔레트 엔트리들을 시그널링하기 위한 팔레트 예측기의 사용의 예시이다.
도 14a는 본 개시내용에 따른 수평 횡단 스캔의 예시이다.
도 14b는 본 개시내용에 따른 수직 횡단 스캔의 예시이다.
도 15a는 본 개시내용에 따른, 팔레트에 대한 서브-블록 기반 인덱스 맵 스캐닝의 예시이다.
도 15b는 본 개시내용에 따른, 팔레트에 대한 서브-블록 기반 인덱스 맵 스캐닝의 예시이다.
도 16은 본 개시내용의 예에 따른, 비디오 신호를 디코딩하기 위한 방법이다.
도 17은 본 개시내용의 예에 따른 비디오 신호를 디코딩하기 위한 방법이다.
도 18은 본 개시내용의 예에 따른, 사용자 인터페이스와 결합된 컴퓨팅 환경을 예시하는 도면이다.
이제, 예시적인 실시예를 상세히 참조할 것이고, 그의 예가 첨부 도면에 도시되어 있다. 이하의 설명은 달리 표현되지 않는 한 상이한 도면들에서의 동일한 번호들이 동일하거나 유사한 요소들을 나타내는 첨부 도면들을 참조한다. 예시적인 실시예들의 이하의 설명에서 설명되는 구현들은 본 개시내용에 따른 모든 구현들을 나타내지 않는다. 대신에, 이들은 첨부된 청구항들에 기재된 바와 같은 본 개시내용에 관련된 양태들에 따른 장치들 및 방법들의 예들에 불과하다.
본 개시내용에서 사용되는 용어는 단지 특정 실시예들을 설명하기 위한 것이며, 본 개시내용을 제한하려는 의도는 아니다. 본 개시내용 및 첨부된 청구항들에서 사용되는 바와 같이, 단수 형태들("a", "an", 및 "the")은, 문맥상 명확하게 달리 나타내지 않는 한, 복수 형태들도 포함하는 것으로 의도된다. 또한, 본 명세서에서 사용되는 "및/또는"이라는 용어는 연관된 열거된 항목들 중 하나 이상의 임의의 또는 모든 가능한 조합들을 의미하고 포함하는 것으로 의도된다는 것을 이해해야 한다.
용어들 "제1", "제2", "제3" 등이 다양한 정보를 설명하기 위해 본 명세서에서 사용될 수 있지만, 정보가 이들 용어들에 의해 제한되지 않아야 한다는 것을 이해하여야 한다. 이러한 용어들은 정보의 하나의 카테고리를 다른 카테고리와 구별하기 위해서만 사용된다. 예를 들어, 본 개시내용의 범위를 벗어나지 않고, 제1 정보는 제2 정보로서 지칭될 수 있고; 유사하게, 제2 정보는 또한 제1 정보로서 지칭될 수 있다. 본 명세서에서 사용될 때, 용어 "~인 경우"는 문맥에 따라 "~일 때" 또는 "~시에" 또는 "판단에 응답하여"를 의미하는 것으로 이해될 수 있다.
HEVC 표준의 제1 버전은 2013년 10월에 마무리되었고, 이는 이전 세대 비디오 코딩 표준 H.264/MPEG AVC에 비해 대략 50% 비트-레이트 절감 또는 동등한 지각 품질을 제공한다. HEVC 표준이 그의 선행 기술보다 상당한 코딩 개선을 제공하지만, HEVC에 더해 추가적인 코딩 도구로 우수한 코딩 효율이 달성될 수 있다는 증거가 있다. 그에 기초하여, VCEG 및 MPEG 둘 다는 미래의 비디오 코딩 표준화를 위한 새로운 코딩 기술들의 탐색 작업을 시작하였다. 하나의 JVET(Joint Video Exploration Team)는 코딩 효율의 실질적인 향상을 가능하게 할 수 있는 진보된 기술들의 상당한 연구를 시작하기 위해 ITU-T VECG 및 ISO/IEC MPEG에 의해 2015년 10월에 형성되었다. JEM(joint exploration model)이라고 지칭되는 하나의 기준 소프트웨어는 HEVC 테스트 모델(HM)에 더해 몇몇 추가적인 코딩 도구들을 통합함으로써 JVET에 의해 유지되었다.
2017년 10월에, HEVC를 초월한 능력을 갖는 비디오 압축에 관한 공동 공모(CfP)가 ITU-T 및 ISO/IEC에 의해 제기되었다. 2018년 4월에는, 10번째 JVET 미팅에서 23개의 CfP 응답이 수신되고 평가되었으며, 이는 대략 40%의 HEVC에 대비한 압축 효율 이득을 입증하였다. 이러한 평가 결과들에 기초하여, JVET는 VVC(Versatile Video Coding)로 명명되는 새로운 세대 비디오 코딩 표준을 개발하기 위해 새로운 프로젝트를 개시하였다. 동일한 달에, VVC 테스트 모델(VTM)이라고 지칭되는 하나의 기준 소프트웨어 코드베이스가 VVC 표준의 기준 구현을 증명하기 위해 설정되었다.
HEVC와 같이, VVC는 블록 기반 하이브리드 비디오 코딩 프레임워크 상에 구축된다.
도 1은 VVC에 대한 블록 기반 비디오 인코더의 일반적인 도면을 도시한다. 구체적으로, 도 1은 전형적인 인코더(100)를 도시한다. 인코더(100)는 비디오 입력(110), 모션 보상(112), 모션 추정(114), 인트라/인터 모드 결정(116), 블록 예측기(140), 가산기(128), 변환(130), 양자화(132), 예측 관련 정보(142), 인트라 예측(118), 픽처 버퍼(120), 역양자화(134), 역변환(136), 가산기(126), 메모리(124), 인-루프 필터(122), 엔트로피 코딩(138) 및 비트스트림(144)을 갖는다.
인코더(100)에서, 비디오 프레임은 처리를 위해 복수의 비디오 블록으로 분할된다. 각각의 주어진 비디오 블록에 대해, 인터 예측 접근법 또는 인트라 예측 접근법에 기초하여 예측이 형성된다.
현재 비디오 블록, 비디오 입력(110)의 일부, 및 그 예측기, 블록 예측기(140)의 일부 사이의 차이를 나타내는 예측 잔차가 가산기(128)로부터 변환(130)에 전송된다. 이어서, 변환 계수들은 엔트로피 감소를 위해 변환(130)으로부터 양자화(132)로 전송된다. 양자화된 계수들은 이후 엔트로피 코딩(138)에 공급되어 압축된 비디오 비트스트림을 생성한다. 도 1에 도시된 바와 같이, 비디오 블록 파티션 정보, 모션 벡터(MV), 참조 픽처 인덱스, 및 인트라 예측 모드와 같은 인트라/인터 모드 결정(116)으로부터의 예측 관련 정보(142)가 또한 엔트로피 코딩(138)을 통해 공급되고 압축된 비트스트림(144)에 저장된다. 압축된 비트스트림(144)은 비디오 비트스트림을 포함한다.
인코더(100)에서, 예측 목적을 위해 픽셀들을 재구성하기 위한 디코더 관련 회로들이 또한 필요하다. 먼저, 예측 잔차가 역양자화(134) 및 역변환(136)을 통해 재구성된다. 이 재구성된 예측 잔차는 블록 예측기(140)와 조합되어 현재 비디오 블록에 대한 필터링되지 않은 재구성된 픽셀들을 생성한다.
공간 예측(또는 "인트라 예측")은 현재 비디오 블록을 예측하기 위해 현재 비디오 블록과 동일한 비디오 프레임에서 이미 코딩된 이웃 블록들(참조 샘플들이라고 지칭됨)의 샘플들로부터의 픽셀들을 사용한다.
시간 예측("인터 예측"이라고도 지칭됨)은 현재 비디오 블록을 예측하기 위해 이미 코딩된 비디오 화상으로부터의 재구성된 픽셀을 사용한다. 시간 예측은 비디오 신호에 고유한 시간 중복성을 감소시킨다. 주어진 코딩 유닛(CU) 또는 코딩 블록에 대한 시간 예측 신호는 보통 현재 CU와 그의 시간 기준 사이의 모션의 양 및 방향을 나타내는 하나 이상의 MV에 의해 시그널링된다. 또한, 다수의 참조 픽처가 지원되면, 하나의 참조 픽처 인덱스가 추가로 전송되고, 이는 시간 예측 신호가 참조 픽처 저장소 내의 어느 참조 픽처로부터 유래하는지를 식별하는 데 사용된다.
모션 추정(114)은 비디오 입력(110) 및 픽처 버퍼(120)로부터의 신호를 취하고, 모션 추정 신호를 모션 보상(112)에 출력한다. 모션 보상(112)은 비디오 입력(110), 픽처 버퍼(120)로부터의 신호, 및 모션 추정(114)으로부터의 모션 추정 신호를 취하고, 모션 보상 신호를 인트라/인터 모드 결정(116)에 출력한다.
공간 및/또는 시간 예측이 수행된 후에, 인코더(100)에서의 인트라/인터 모드 결정(116)은, 예를 들어, 레이트-왜곡 최적화 방법에 기초하여 최상의 예측 모드를 선택한다. 블록 예측기(140)는 이후 현재 비디오 블록으로부터 감산되고, 결과적인 예측 잔차는 변환(130) 및 양자화(132)를 사용하여 탈상관된다. 결과적인 양자화된 잔차 계수들은 역양자화(134)에 의해 역양자화되고 역변환(136)에 의해 역변환되어 재구성된 잔차를 형성한 다음, 예측 블록에 다시 가산되어 CU의 재구성된 신호를 형성한다. 디블로킹 필터, SAO(sample adaptive offset), 및/또는 ALF(adaptive in-loop filter)와 같은, 추가의 인-루프 필터링(122)이 재구성된 CU가 픽처 버퍼(120)의 참조 픽처 저장소에 넣어져서 미래의 비디오 블록들을 코딩하는 데 사용되기 전에 재구성된 CU에 적용될 수 있다. 출력 비디오 비트스트림(144)을 형성하기 위해, 코딩 모드(인터 또는 인트라), 예측 모드 정보, 모션 정보, 및 양자화된 잔차 계수들은 모두 엔트로피 코딩 유닛(138)에 전송되어 비트스트림을 형성하기 위해 추가로 압축되고 패킹된다.
도 1은 일반적인 블록 기반 하이브리드 비디오 인코딩 시스템의 블록도를 제공한다. 입력 비디오 신호는 블록별로 처리된다(코딩 유닛(CU)이라고 지칭됨). VTM-1.0에서, CU는 최대 128x128 픽셀일 수 있다. 그러나, 쿼드-트리들에만 기초하여 블록들을 파티셔닝하는 HEVC와는 상이하게, VVC에서, 하나의 코딩 트리 유닛(CTU)은 쿼드/이진/삼진-트리에 기초하여 변화하는 로컬 특성들에 적응하기 위해 CU들로 분할된다. 정의에 의해, 코딩 트리 블록(CTB)은 N의 일부 값에 대한 샘플들의 NxN 블록이며, 따라서 성분의 CTB들로의 분할이 파티셔닝이다. CTU는 루마 샘플들의 CTB, 3개의 샘플 어레이를 갖는 픽처의 크로마 샘플들의 2개의 대응하는 CTB, 또는 샘플들을 코딩하는 데 사용되는 3개의 개별 컬러 평면 및 신택스 구조를 사용하여 코딩되는 픽처 또는 단색 픽처의 샘플들의 CTB를 포함한다. 또한, HEVC에서의 다중 파티션 유닛 타입의 개념이 제거되고- 즉, CU, 예측 유닛(PU) 및 변환 유닛(TU)의 분리가 VVC에 더 이상 존재하지 않음 -; 그 대신에, 각각의 CU는 추가의 파티션 없이 예측 및 변환 둘 다를 위한 기본 단위로서 항상 사용된다. 멀티-타입 트리 구조에서, 하나의 CTU는 먼저 쿼드-트리 구조에 의해 분할된다. 그 후, 각각의 쿼드-트리 리프 노드는 이진 및 삼진 트리 구조에 의해 더 분할될 수 있다. 도 3a, 도 3b, 도 3c, 도 3d 및 도 3e에 도시된 바와 같이, 4진 파티셔닝, 수평 이진 파티셔닝, 수직 이진 파티셔닝, 수평 삼진 파티셔닝 및 수직 삼진 파티셔닝의 5개의 분할 타입이 있다.
도 3a는 멀티-타입 트리 구조에서의 블록 4진 파티션을 예시하는 도면을 도시한다. 도 3b는 멀티-타입 트리 구조에서의 블록 수직 이진 파티션을 예시하는 도면을 도시한다. 도 3c는 본 개시내용에 따른, 멀티-타입 트리 구조에서의 블록 수평 이진 파티션을 예시하는 도면을 도시한다. 도 3d는 멀티-타입 트리 구조에서의 블록 수직 삼진 파티션을 예시하는 도면을 도시한다. 도 3e는 멀티-타입 트리 구조에서의 블록 수평 삼진 파티션을 예시하는 도면을 도시한다.
도 1에서, 공간 예측 및/또는 시간 예측이 수행될 수 있다. 공간 예측(또는 "인트라 예측")은 현재 비디오 블록을 예측하기 위해 동일한 비디오 화상/슬라이스 내의 이미 코딩된 이웃 블록들(참조 샘플들이라고 지칭됨)의 샘플들로부터의 픽셀들을 사용한다. 공간 예측은 비디오 신호에 고유한 공간 중복성을 감소시킨다. 시간 예측("인터 예측" 또는 "모션 보상 예측"이라고도 지칭됨)은 현재 비디오 블록을 예측하기 위해 이미 코딩된 비디오 화상으로부터의 재구성된 픽셀을 사용한다. 시간 예측은 비디오 신호에 고유한 시간 중복성을 감소시킨다. 주어진 CU에 대한 시간 예측 신호는 보통 현재 CU와 그의 시간 기준 사이의 모션의 양 및 방향을 나타내는 하나 이상의 모션 벡터(MV)에 의해 시그널링된다. 또한, 다수의 참조 픽처가 지원되면, 하나의 참조 픽처 인덱스가 추가로 전송되고, 이는 참조 픽처 저장소내의 어느 참조 픽처로부터 시간 예측 신호가 유래하는지를 식별하는 데 사용된다. 공간 및/또는 시간 예측 후에, 인코더의 모드 결정 블록은, 예를 들어, 레이트-왜곡 최적화 방법에 기초하여 최상의 예측 모드를 선택한다. 그 후 예측 블록이 현재 비디오 블록으로부터 감산되고; 예측 잔차는 변환을 사용하여 탈상관되고 양자화된다. 양자화된 잔차 계수들은 역양자화되고 역변환되어 재구성된 잔차를 형성한 다음, 예측 블록에 다시 가산되어 CU의 재구성된 신호를 형성한다. 디블로킹 필터, SAO(sample adaptive offset) 및 ALF(adaptive in-loop filter)와 같은 추가의 인-루프 필터링이, 그것이 참조 픽처 저장소에 넣어지기 전에 재구성된 CU에 적용되어 미래의 비디오 블록들을 코딩하는데 사용될 수 있다. 출력 비디오 비트스트림을 형성하기 위해, 코딩 모드(인터 또는 인트라), 예측 모드 정보, 모션 정보, 및 양자화된 잔차 계수들은 모두 엔트로피 코딩 유닛으로 전송되어 추가로 압축되고 패킹되어 비트스트림을 형성한다.
도 2는 VVC에 대한 비디오 디코더의 일반적인 블록도를 도시한다. 구체적으로, 도 2는 전형적인 디코더(200) 블록도를 도시한다. 디코더(200)는 비트스트림(210), 엔트로피 디코딩(212), 역양자화(214), 역변환(216), 가산기(218), 인트라/인터 모드 선택(220), 인트라 예측(222), 메모리(230), 인-루프 필터(228), 모션 보상(224), 픽처 버퍼(226), 예측 관련 정보(234) 및 비디오 출력(232)을 갖는다.
디코더(200)는 도 1의 인코더(100)에 존재하는 재구성 관련 섹션과 유사하다. 디코더(200)에서, 들어오는 비디오 비트스트림(210)은 양자화된 계수 레벨들 및 예측 관련 정보를 도출하기 위해 엔트로피 디코딩(212)을 통해 먼저 디코딩된다. 이어서, 양자화된 계수 레벨들은 역양자화(214) 및 역변환(216)을 통해 처리되어, 재구성된 예측 잔차를 획득한다. 인트라/인터 모드 선택기(220)에서 구현되는 블록 예측기 메커니즘은 디코딩된 예측 정보에 기초하여 인트라 예측(222) 또는 모션 보상(224)을 수행하도록 구성된다. 필터링되지 않은 재구성된 픽셀들의 세트는 합산기(218)를 사용하여, 역변환(216)으로부터의 재구성된 예측 잔차와 블록 예측기 메커니즘에 의해 생성된 예측 출력을 합산함으로써 획득된다.
재구성된 블록은 참조 픽처 저장소로서 기능하는 픽처 버퍼(226)에 저장되기 전에 인-루프 필터(228)를 더 통과할 수 있다. 픽처 버퍼(226) 내의 재구성된 비디오는 디스플레이 디바이스를 구동하기 위해 전송될 수 있을 뿐만 아니라, 또한 미래의 비디오 블록들을 예측하기 위해 사용될 수 있다. 인-루프 필터(228)가 턴온되는 상황에서, 최종 재구성된 비디오 출력(232)을 도출하기 위해 이들 재구성된 픽셀에 대해 필터링 동작이 수행된다.
도 2는 블록 기반 비디오 디코더의 일반적인 블록도를 제공한다. 비디오 비트스트림은 엔트로피 디코딩 유닛에서 먼저 엔트로피 디코딩된다. 코딩 모드 및 예측 정보는 공간 예측 유닛(인트라 코딩되는 경우) 또는 시간 예측 유닛(인터 코딩되는 경우)에 전송되어 예측 블록을 형성한다. 잔차 변환 계수들은 잔차 블록을 재구성하기 위해 역양자화 유닛 및 역변환 유닛에 전송된다. 그 다음, 예측 블록과 잔차 블록이 함께 추가된다. 재구성된 블록은 참조 픽처 저장소에 저장되기 전에 인-루프 필터링을 더 통과할 수 있다. 이어서, 참조 픽처 저장소 내의 재구성된 비디오가 디스플레이 디바이스를 구동하기 위해 송출될 뿐만 아니라, 또한 미래의 비디오 블록들을 예측하는 데 사용된다.
일반적으로, VVC에 적용되는 기본 인트라 예측 스킴은, 여러 모듈들이 추가로 확장 및/또는 개선된다는 점을 제외하고는, HEVC의 것과 동일하게 유지되며, 예를 들어, ISP(intra sub-partition) 코딩 모드, 광각 인트라 방향들을 갖는 확장된 인트라 예측, PDPC(position-dependent intra prediction combination) 및 4-탭 인트라 보간이다.
VVC에서의 픽처들, 타일 그룹들, 타일들, 및 CTU들의 파티셔닝
VVC에서, 타일은 픽처 내의 특정 타일 열 및 특정 타일 행 내의 CTU들의 직사각형 영역으로서 정의된다. 타일 그룹은 단일 NAL 유닛에 배타적으로 포함되는 픽처의 정수 개의 타일들의 그룹이다. 기본적으로, 타일 그룹의 개념은 HEVC에서 정의된 슬라이스와 동일하다. 예를 들어, 픽처들은 타일 그룹들 및 타일들로 분할된다. 타일은 픽처의 직사각형 영역을 커버하는 CTU들의 시퀀스이다. 타일 그룹은 픽처의 다수의 타일을 포함한다. 타일 그룹들의 2개의 모드, 즉 래스터-스캔 타일 그룹 모드 및 직사각형 타일 그룹 모드가 지원된다. 래스터-스캔 타일 그룹 모드에서, 타일 그룹은 픽처의 타일 래스터 스캔에서 타일들의 시퀀스를 포함한다. 직사각형 타일 그룹 모드에서, 타일 그룹은 집합적으로 픽처의 직사각형 영역을 형성하는 픽처의 다수의 타일을 포함한다. 직사각형 타일 그룹 내의 타일들은 타일 그룹의 타일 래스터 스캔의 순서로 되어 있다.
도 4는 픽처의 래스터-스캔 타일 그룹 파티셔닝의 예를 도시하며, 여기서 픽처는 12개의 타일 및 3개의 래스터-스캔 타일 그룹으로 분할된다. 도 4는 타일들(410, 412, 414, 416, 및 418)을 포함한다. 각각의 타일은 18개의 CTU를 갖는다. 더 구체적으로, 도 4는 12개의 타일 및 3개의 타일 그룹(정보)으로 분할되는 18x12 루마 CTU들을 갖는 픽처를 나타낸다. 3개의 타일 그룹은 다음과 같다: (1) 제1 타일 그룹은 타일(410, 412)을 포함하고, (2) 제2 타일 그룹은 타일(414, 416, 418, 420, 422)을 포함하고, (3) 제3 타일 그룹은 타일(424, 426, 428, 430, 432)을 포함한다.
도 5는 픽처의 직사각형 타일 그룹 파티셔닝의 예를 도시하며, 여기서 픽처는 24개의 타일(6개의 타일 열 및 4개의 타일 행) 및 9개의 직사각형 타일 그룹으로 분할된다. 도 5는 타일(510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556)을 포함한다. 더 구체적으로, 도 5는 24개의 타일 및 9개의 타일 그룹(정보)으로 분할되는 18x12 루마 CTU들을 갖는 픽처를 나타낸다. 타일 그룹은 타일들을 포함하고 타일은 CTU들을 포함한다. 9개의 직사각형 타일 그룹은 (1) 2개의 타일(510 및 512), (2) 2개의 타일(514 및 516), (3) 2개의 타일(518 및 520), (4) 4개의 타일(522, 524, 534, 및 536), (5) 4개의 타일 그룹(526, 528, 538, 및 540), (6) 4개의 타일(530, 532, 542, 및 544), (7) 2개의 타일(546 및 548), (8) 2개의 타일(550 및 552), 및(9) 2개의 타일(554 및 556)을 포함한다.
VVC에서 고빈도 제로화를 갖는 큰 블록-크기 변환
VTM4에서, 크기가 최대 64Х64인 큰 블록-크기 변환들이 가능하며, 이는 고해상도 비디오, 예를 들어 1080p 및 4K 시퀀스들에 주로 유용하다. 64와 동일한 크기(폭 또는 높이, 또는 폭과 높이 둘 다)를 갖는 변환 블록들에 대해 고빈도 변환 계수들이 제로 아웃되어, 저빈도 계수들만이 유지된다. 예를 들어, M이 블록 폭이고 N이 블록 높이인 MХN 변환 블록의 경우, M이 64와 같을 때, 변환 계수들의 좌측 32개의 열만이 유지된다. 유사하게, N이 64일 때, 변환 계수들의 상위 32개의 행만이 유지된다. 변환 스킵 모드가 큰 블록에 대해 사용될 때, 임의의 값들을 제로화하지 않고 전체 블록이 사용된다.
VVC의 가상 파이프라인 데이터 유닛(VPDU)
가상 파이프라인 데이터 유닛(VPDU)은 픽처 내의 비중첩 유닛으로서 정의된다. 하드웨어 디코더들에서, 연속적인 VPDU들은 다수의 파이프라인 스테이지들에 의해 동시에 처리된다. VPDU 크기는 대부분의 파이프라인 스테이지들에서 버퍼 크기에 대략 비례하므로, VPDU 크기를 작게 유지하는 것이 중요하다. 대부분의 하드웨어 디코더들에서, VPDU 크기는 최대 변환 블록(TB) 크기로 설정될 수 있다. 그러나, VVC에서, 삼진 트리(TT) 및 이진 트리(BT) 파티션은 VPDU 크기의 증가로 이어질 수 있다.
VPDU 크기를 64x64 루마 샘플들로서 유지하기 위해, (신택스 시그널링 수정을 갖는) 다음의 규범적 파티션 제한들이 VTM5에 적용된다:
폭 또는 높이, 또는 폭과 높이 둘 다가 128과 같은 CU에 대해서는 TT 분할이 허용되지 않는다. N≤ 64인 128xN CU(즉, 128과 동일한 폭 및 128보다 작은 높이)의 경우, 수평 BT는 허용되지 않는다. N ≤ 64(즉, 128과 동일한 높이 및 128보다 작은 폭)인 Nx128 CU의 경우, 수직 BT는 허용되지 않는다.
도 6a, 도 6b, 도 6c, 도 6d, 도 6e, 도 6f, 도 6g 및 도 6h는 VTM에서의 허용되지 않은 TT 및 BT 파티셔닝의 예들을 도시한다.
VVC에서의 변환 계수 코딩
VVC에서의 변환 계수 코딩은, 이들 양쪽 모두가 비중첩 계수 그룹(CG 또는 서브-블록이라고도 지칭됨)을 이용한다는 점에서 HEVC와 유사하다. 그러나, 이들 사이에는 또한 약간의 차이가 있다. HEVC에서, 계수들의 각각의 CG는 4x4의 고정된 크기를 갖는다. VVC 드래프트 6에서, CG 크기는 TB 크기에 종속된다. 그 결과, 다양한 CG 크기들(1x16, 2x8, 8x2, 2x4, 4x2 및 16x1)이 VVC에서 이용가능하다. 코딩 블록 내부의 CG들, 및 CG 내의 변환 계수들은 미리 정의된 스캔 순서들에 따라 코딩된다.
픽셀당 컨텍스트 코딩된 빈들의 최대 수를 제한하기 위해, TB의 면적 및 비디오 성분의 타입(예를 들어, 루마 성분 대 크로마 성분)은 TB에 대한 컨텍스트 코딩된 빈들(CCB)의 최대 수를 도출하는데 사용된다. 컨텍스트 코딩된 빈들의 최대 수는 Bozize*1.75과 같다. 여기서, TB_zosize는 계수 제로-아웃 후의 TB 내의 샘플들의 수를 나타낸다. CG가 비-제로 계수를 포함하는지 여부를 나타내는 플래그인 coded_sub_block_flag는 CCB 카운트에 대해 고려되지 않는다는 점에 유의한다.
계수 제로-아웃은 변환 블록의 특정 영역에 위치된 계수들이 0이 되도록 강제하기 위해 변환 블록에 대해 수행되는 연산이다. 예를 들어, 현재의 VVC에서, 64x64 변환은 연관된 제로-아웃 연산을 갖는다. 그 결과, 64x64 변환 블록 내부의 좌측 상단 32x32 영역 외부에 위치된 변환 계수들은 모두 강제로 0이 된다. 실제로, 현재 VVC에서, 특정 차원을 따라 32를 넘은 크기를 갖는 임의의 변환 블록에 대해, 계수 제로-아웃 연산이 그 차원을 따라 수행되어 좌측 상단 32x32 영역을 넘어 위치된 계수들이 0이 되도록 강제한다.
VVC에서의 변환 계수 코딩에서, 변수 remBinsPass1이 먼저 허용된 컨텍스트 코딩된 빈들(MCCB)의 최대 수로 설정된다. 코딩 프로세스에서, 변수는 컨텍스트 코딩된 빈이 시그널링될 때마다 1씩 감소된다. remBinsPass1이 4 이상인 동안, 계수는 먼저 sig_coeff_flag, abs_level_gt1_flag, par_level_flag, 및 abs_level_gt3_flag의 신택스들을 통해 시그널링되며, 이들 모두는 제1 패스에서 컨텍스트 코딩된 빈들을 사용한다. 계수의 레벨 정보의 나머지 부분은 제2 패스에서 골롬-라이스 코드 및 바이패스-코딩된 빈을 이용하여 abs_remainder의 신택스 엘리먼트로 코딩된다. 제1 패스를 코딩하는 동안 remBinsPass1이 4보다 작아질 때, 현재 계수는 제1 패스에서 코딩되지 않고, 골롬-라이스 코드 및 바이패스-코딩된 빈들을 사용하여 dec_abs_level의 신택스 엘리먼트로 제2 패스에서 직접 코딩된다. dec_abs_level[ ]에 대한 라이스 파라미터 도출 프로세스는 표 3에 명시된 바와 같이 도출된다. 전술한 모든 레벨 코딩 후에, sig_coeff_flag가 1과 같은 모든 스캔 위치들에 대한 부호들(sign_flag)이 마지막으로 바이패스 빈들로서 코딩된다. 이러한 프로세스는 도 7에 도시된다(후술됨). remBinsPass1은 모든 TB에 대해 리셋된다. sig_coeff_flag, abs_level_gt1_flag, par_level_flag, 및 abs_level_gt3_flag에 대해 컨텍스트 코딩된 빈들을 사용하는 것으로부터 나머지 계수들에 대해 바이패스-코딩된 빈들을 사용하는 것으로의 천이는 TB당 최대 한 번만 발생한다. 계수 서브-블록의 경우, remBinsPass1이 그 제1 계수를 코딩하기 전에 4보다 작다면, 전체 계수 서브-블록은 바이패스-코딩된 빈을 이용하여 코딩된다.
도 7은 변환 블록들에 대한 잔차 코딩 구조의 예시를 도시한다.
통합된(동일한) 라이스 파라미터(RicePara) 도출이 abs_remainder 및 dec_abs_level의 신택스를 시그널링하기 위해 사용된다. 유일한 차이는, abs_remainder 및 dec_abs_level을 각각 코딩하기 위해 베이스 레벨 baseLevel이 4 및 0으로 설정된다는 것이다. 라이스 파라미터는 로컬 템플릿에서의 이웃하는 5개의 변환 계수들의 절대 레벨들의 합뿐만 아니라, 또한 대응하는 베이스 레벨에 기초하여 다음과 같이 결정된다:
RicePara = RiceParTable[ 최대(min( 31, sumAbs - 5 * baseLevel), 0) ]
현재의 VVC 드래프트 사양에서의 잔차 코딩의 신택스 및 연관된 시맨틱은 각각 표 1 및 표 2에 예시된다. 표 1을 읽는 방식은 본 발명의 부록 섹션에 예시되어 있으며, 이는 VVC 사양에서도 찾을 수 있다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
VVC에서의 변환 스킵 모드를 위한 잔차 코딩
변환 계수들 및 변환 스킵 계수들 양쪽 모두를 코딩하기 위해 단일 잔차 코딩 방식이 설계되는 HEVC와는 달리, VVC에서, 변환 계수들 및 변환 스킵 계수들(즉, 잔차)에 대해 각각 2개의 별개의 잔차 코딩 방식이 이용된다.
변환 스킵 모드에서, 잔차 신호의 통계 특성은 변환 계수의 통계 특성과 상이하고, 저빈도 성분 주변의 에너지 압축은 관찰되지 않는다. 잔차 코딩은 다음을 포함하는 (공간) 변환 스킵 잔차의 상이한 신호 특성들을 고려하도록 수정된다:
마지막 x/y 위치의 시그널링 없음;
모든 이전 플래그들이 0과 동일할 때 DC 서브-블록을 제외한 모든 서브-블록에 대해 코딩되는 coded_sub_block_flag;
2개의 이웃 계수를 갖는 sig_coeff_flag 컨텍스트 모델링;
하나의 컨텍스트 모델만을 이용하는 par_level_flag;
5, 7, 9 초과의 추가 플래그들;
나머지 이진화에 대한 수정된 라이스 파라미터 도출; 및
부호 플래그에 대한 컨텍스트 모델링은 좌측 및 상부 이웃 계수 값들에 기초하여 결정되고 부호 플래그는 모든 컨텍스트 코딩된 빈들을 함께 유지하기 위해 sig_coeff_flag 후에 파싱됨.
도 8(후술됨)에 도시된 바와 같이, 신택스 엘리먼트들 sig_coeff_flag , coeff_sign_flag, abs_level_gt1_flag , par_level_flag 는 제1 패스에서 잔차 샘플에 의해 잔차 샘플로 인터리빙된 방식으로 코딩되고, 제2 패스에서 abs_level_gtX_flag 비트플래인이 후속되고, 제3 패스에서 abs_remainder 코딩이 후속된다.
패스 1: sig_coeff_flag, coeff_sign_flag, abs_level_gt1_flag, par_level_flag.
패스 2: abs_level_gt3_flag, abs_level_gt5_flag, abs_level_gt7_flag, abs_level_gt9_flag.
패스 3: abs_remainder.
도 8은 변환 스킵 블록들에 대한 잔차 코딩 구조의 예시를 도시한다.
현재의 VVC 드래프트 사양에서 변환 스킵 모드에 대한 잔차 코딩의 신택스 및 연관된 시맨틱은 각각 표 5 및 표 2에 나타나 있다. 표 5를 읽는 방식은 VVC 사양에서 또한 발견될 수 있는 본 발명의 부록 섹션에 예시되어 있다.
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
양자화
현재의 VVC에서, 최대 QP 값은 51에서 63으로 확장되었고, 초기 QP의 시그널링은 그에 따라 변경되었다. SliceQpY의 초기 값은 slice_qp_delta의 0이 아닌 값이 코딩될 때 슬라이스 세그먼트 계층에서 수정될 수 있다. 변환 스킵 블록의 경우, 최소 허용된 양자화 파라미터(QP)는, QP가 4일 때 양자화 단계 크기가 1이 되기 때문에 4로서 정의된다.
또한, 동일한 HEVC 스칼라 양자화가 종속 스칼라 양자화라고 지칭되는 새로운 개념과 함께 사용된다. 종속 스칼라 양자화는 변환 계수에 대한 허용가능한 재구성 값들의 세트가 재구성 순서에서 현재 변환 계수 레벨에 선행하는 변환 계수 레벨들의 값들에 의존하는 접근법을 지칭한다. 이 접근법의 주요 효과는, HEVC에서 사용되는 종래의 독립 스칼라 양자화와 비교하여, 허용가능한 재구성 벡터들이 N차원 벡터 공간에서 더 밀집되어 패킹된다는 것이다(N은 변환 블록 내의 변환 계수들의 수를 나타낸다). 이는, N차원 단위 체적당 허용가능한 재구성 벡터들의 주어진 평균 개수에 대해, 입력 벡터와 가장 가까운 재구성 벡터 사이의 평균 왜곡이 감소된다는 것을 의미한다. 종속 스칼라 양자화의 접근법은 다음에 의해 실현된다: (a) 상이한 재구성 레벨들을 갖는 2개의 스칼라 양자화기를 정의하는 단계 및 (b) 2개의 스칼라 양자화기 간의 스위칭을 위한 프로세스를 정의하는 단계.
Q0 및 Q1로 표시된, 사용된 2개의 스칼라 양자화기가 도 9에 예시되어 있다(후술됨). 이용가능한 재구성 레벨들의 위치는 양자화 단계 크기 △에 의해 고유하게 특정된다. 사용되는 스칼라 양자화기(Q0 또는 Q1)는 비트스트림에서 명시적으로 시그널링되지 않는다. 대신에, 현재 변환 계수에 사용되는 양자화기는 코딩/재구성 순서로 현재 변환 계수에 선행하는 변환 계수 레벨들의 패리티들에 의해 결정된다.
도 9는 종속 양자화의 제안된 접근법에서 사용되는 2개의 스칼라 양자화기의 예시를 도시한다.
(후술하는) 도 10a 및 도 10b에 예시된 바와 같이, 2개의 스칼라 양자화기(Q0 및 Q1) 사이의 스위칭은 4개의 양자화기 상태(QState)를 갖는 상태 기계를 통해 실현된다. QState는 4개의 상이한 값: 0, 1, 2, 3을 취할 수 있다. 이는 코딩/재구성 순서에서 현재 변환 계수에 선행하는 변환 계수 레벨들의 패리티들에 의해 고유하게 결정된다. 변환 블록에 대한 역양자화의 시작에서, 상태는 0과 동일하게 설정된다. 변환 계수들은 스캐닝 순서로(즉, 이들이 엔트로피 디코딩되는 것과 동일한 순서로) 재구성된다. 현재 변환 계수가 재구성된 후에, 상태는 도 10에 도시된 바와 같이 업데이트되고, 여기서 k는 변환 계수 레벨의 값을 나타낸다.
도 10a는 제안된 종속 양자화에 대한 상태 천이를 나타내는 천이도를 도시한다.
도 10b는 제안된 종속 양자화에 대한 양자화기 선택을 예시하는 표를 도시한다.
이는 또한 디폴트 및 사용자 정의 스케일링 행렬들을 시그널링하는 것이 지원된다. DEFAULT 모드 스케일링 행렬들은 모두 편평하고, 모든 TB 크기들에 대해 16과 동일한 요소들을 갖는다. IBC 및 인트라 코딩 모드들은 현재 동일한 스케일링 행렬들을 공유한다. 따라서, USER_DEFINED 행렬들의 경우에 대해, MatrixType 및 MatrixType_DC의 수는 다음과 같이 업데이트된다:
MatrixType: 30 = 2(intra&IBC/inter에 대해 2) Х 3(Y/Cb/Cr 성분) Х 5(정사각형 TB 크기: 루마의 경우 4Х4 내지 64Х64, 크로마의 경우 2Х2 내지 32Х32.
MatrixType_DC: 14 = 2(Y 성분에 대해 intra&IBC/inter Х 1에 대해 2) Х 3(TB 크기: 16Х16, 32Х32, 64Х64) + 4(Cb/Cr 성분에 대해 intra&IBC/inter Х 2에 대해 2) Х 2(TB 크기: 16Х16, 32Х32).
DC 값들은 다음의 스케일링 행렬들: 16Х16, 32Х32, 및 64Х64에 대해 개별적으로 코딩된다. 8Х8보다 작은 크기의 TB들에 대해, 하나의 스케일링 행렬 내의 모든 요소들이 시그널링된다. TB가 8Х8 이상의 크기를 갖는 경우, 하나의 8Х8 스케일링 행렬 내의 64개의 요소만이 기본 스케일링 행렬로서 시그널링된다. 8Х8보다 큰 크기의 정사각형 행렬을 얻기 위해, 8Х8 기본 스케일링 행렬은 대응하는 정사각형 크기(즉, 16Х16, 32Х32, 64Х64)로(요소의 복제에 의해) 업샘플링된다. 64-포인트 변환을 위한 고빈도 계수들의 제로화가 적용될 때, 스케일링 행렬들의 대응하는 고빈도들도 제로화된다. 즉, TB의 폭 또는 높이가 32 이상이면, 계수들의 좌측 또는 상반부만이 유지되고, 나머지 계수들은 0으로 할당된다. 또한, 64Х64 스케일링 행렬에 대해 시그널링된 요소들의 수는 또한 8Х8에서 3개의 4Х4 서브행렬로 감소되는데, 그 이유는 우하단 4Х4 요소들이 결코 사용되지 않기 때문이다.
변환 계수 코딩을 위한 컨텍스트 모델링
변환 계수 레벨들의 절대값들과 관련된 신택스 엘리먼트들에 대한 확률 모델들의 선택은 절대 레벨들의 값들 또는 로컬 이웃에서의 부분적으로 재구성된 절대 레벨들에 의존한다. 사용된 템플릿은 (후술하는) 도 11에 예시된다.
도 11은 확률 모델을 선택하는 데 사용되는 템플릿의 예시를 나타낸 것이다. 흑색 정사각형은 현재 스캔 위치를 명시하고, "x"를 갖는 정사각형은 사용된 로컬 이웃을 나타낸다.
선택된 확률 모델들은 로컬 이웃 내의 절대 레벨들(또는 부분적으로 재구성된 절대 레벨들)과 로컬 이웃 내의 0보다 큰 절대 레벨들의 수(1과 동일한 sig_coeff_flags의 수에 의해 주어짐)의 합에 의존한다. 컨텍스트 모델링 및 이진화는 로컬 이웃에 대한 이하의 척도들에 의존한다:
numSig: 로컬 이웃 내의 0이 아닌 레벨들의 수;
sumAbs1: 로컬 이웃에서의 제1 패스 후의 부분적으로 재구성된 절대 레벨들의 합(absLevel1);
sumAbs: 로컬 이웃 내의 재구성된 절대 레벨들의 합; 및
대각선 위치(d): 변환 블록 내부의 현재 스캔 위치의 수평 및 수직 좌표들의 합.
numSig, sumAbs1, 및 d의 값들에 기초하여, sig_coeff_flag, abs_level_gt1_flag, par_level_flag, 및 abs_level_gt3_flag를 코딩하기 위한 확률 모델들이 선택된다. abs_remainder 및 dec_abs_level을 이진화하기 위한 라이스 파라미터는 sumAbs 및 numSig의 값들에 기초하여 선택된다.
현재의 VVC에서, 감소된 32-포인트 MTS(RMTS32라고도 지칭됨)는 고빈도 계수들을 스킵하는 것에 기초하고 32-포인트 DST-7/DCT-8의 계산 복잡도를 감소시키는 데 사용된다. 그리고, 그것은 모든 타입의 제로-아웃(즉, DCT2에서의 고빈도 성분들에 대해 RMTS32 및 기존의 제로-아웃)을 포함하는 계수 코딩 변화들을 수반한다. 구체적으로, 마지막 비-제로 계수 위치 코딩의 이진화는 감소된 TU 크기에 기초하여 코딩되고, 마지막 비-제로 계수 위치 코딩에 대한 컨텍스트 모델 선택은 원래의 TU 크기에 의해 결정된다. 또한, 변환 계수들의 sig_coeff_flag를 코딩하기 위해 60개의 컨텍스트 모델이 사용된다. 컨텍스트 모델 인덱스의 선택은 다음과 같이 locSumAbsPass1이라 지칭되는 5개의 이전에 부분적으로 재구성된 절대 레벨의 최대값과 종속 양자화 상태 QState의 합에 기초한다:
cIdx가 0이면, ctxInc는 다음과 같이 도출된다:
ctxInc = 12 * Max( 0, QState - 1 ) +
Min( ( locSumAbsPass1 + 1 ) >> 1, 3 ) + ( d < 2 ? 8 : ( d < 5 ? 4 : 0 ) )
그렇지 않으면(cIdx가 0보다 크면), ctxInc는 다음과 같이 도출된다:
ctxInc = 36 + 8 * Max( 0, QState - 1) +
Min( ( locSumAbsPass1 + 1 ) >> 1, 3 ) + ( d < 2 ? 4 : 0 )
팔레트 모드
팔레트 모드 배후의 기본 아이디어는 CU 내의 샘플들이 작은 세트의 대표 컬러 값들에 의해 표현된다는 것이다. 이 세트는 팔레트라고 지칭된다. 3개의 컬러 성분의 by 값들이 비트스트림으로 직접 시그널링되는 이스케이프 컬러로서 그것을 시그널링함으로써 팔레트로부터 배제되는 컬러 값을 표시하는 것이 또한 가능하다. 이는 도 12에 예시된다.
도 12는 팔레트 모드에서 코딩된 블록의 예를 도시한다. 도 12는 팔레트 모드에서 코딩된 1210 블록 및 1220 팔레트를 포함한다.
도 12에서, 팔레트 크기는 4이다. 처음 3개의 샘플은 재구성을 위해 팔레트 엔트리들 2, 0 및 3을 각각 사용한다. 청색 샘플은 이스케이프 심볼을 나타낸다. CU 레벨 플래그, palette_escape_val_present_flag는 임의의 이스케이프 심볼들이 CU에 존재하는지를 표시한다. 이스케이프 심볼들이 존재하는 경우, 팔레트 크기는 1만큼 증대되고, 마지막 인덱스는 이스케이프 심볼을 나타내는 데 사용된다. 따라서, 도 12에서, 인덱스 4가 이스케이프 심볼에 할당된다.
팔레트-코딩된 블록을 디코딩하기 위해, 디코더는 다음의 정보를 가질 필요가 있다: 팔레트 테이블; 및 팔레트 인덱스들.
팔레트 인덱스가 이스케이프 심볼에 대응하는 경우, 샘플의 대응하는 컬러 값들을 표시하기 위해 추가 오버헤드가 시그널링된다.
또한, 인코더 측에서, 그 CU와 함께 사용될 적절한 팔레트를 도출하는 것이 필요하다.
손실 코딩을 위한 팔레트의 도출을 위해, 수정된 k-평균 클러스터링 알고리즘이 사용된다. 블록의 제1 샘플이 팔레트에 추가된다. 그 후, 블록으로부터의 각각의 후속 샘플에 대해, 샘플과 현재 팔레트 컬러 각각 사이의 절대 차이의 합(SAD)이 계산된다. 성분들 각각에 대한 왜곡이 최소 SAD에 대응하는 팔레트 엔트리에 대한 임계값보다 작은 경우, 샘플은 팔레트 엔트리에 속하는 클러스터에 추가된다. 그렇지 않으면, 샘플은 새로운 팔레트 엔트리로서 추가된다. 클러스터에 매핑된 샘플들의 수가 임계값을 초과할 때, 그 클러스터에 대한 중심이 업데이트되고 그 클러스터의 팔레트 엔트리가 된다.
다음의 단계에서, 클러스터들은 사용의 내림차순으로 분류된다. 그 후, 각각의 엔트리에 대응하는 팔레트 엔트리가 업데이트된다. 통상적으로, 클러스터 중심이 팔레트 엔트리로서 사용된다. 그러나, 팔레트 엔트리들을 코딩하는 비용이 고려될 때 팔레트 예측기로부터의 임의의 엔트리가 중심 대신에 업데이트된 팔레트 엔트리로서 사용되기에 더 적합할 수 있는지를 분석하기 위해 레이트-왜곡 분석이 수행된다. 이 프로세스는 모든 클러스터들이 처리되거나 최대 팔레트 크기에 도달할 때까지 계속된다. 마지막으로, 클러스터가 단일 샘플만을 갖고 대응하는 팔레트 엔트리가 팔레트 예측기에 있지 않은 경우, 샘플은 이스케이프 심볼로 변환된다. 또한, 중복 팔레트 엔트리들이 제거되고 그들의 클러스터들이 병합된다.
팔레트 도출 후에, 블록 내의 각각의 샘플은(SAD에서) 가장 가까운 팔레트 엔트리의 인덱스를 할당받는다. 그 후, 샘플들은 'INDEX' 또는 'COPY_ABOVE' 모드에 할당된다. 각각의 샘플에 대해 'INDEX' 또는 'COPY_ABOVE' 모드가 가능하다. 이어서, 모드를 코딩하는 비용이 계산된다. 비용이 더 낮은 모드가 선택된다.
팔레트 엔트리들의 코딩을 위해, 팔레트 예측기가 유지된다. 팔레트 예측기뿐만 아니라 팔레트의 최대 크기는 SPS에서 시그널링된다. 팔레트 예측기는 각각의 CTU 행, 각각의 슬라이스 및 각각의 타일의 시작에서 초기화된다.
팔레트 예측기 내의 각각의 엔트리에 대해, 재사용 플래그가 현재 팔레트의 일부인지를 나타내기 위해 시그널링된다. 이는 도 13에 도시된다.
도 13은 팔레트 엔트리들을 시그널링하기 위한 팔레트 예측기의 사용을 도시한다. 도 13은 이전 팔레트(1310) 및 현재 팔레트(1320)를 포함한다.
재사용 플래그들은 제로들의 런-길이 코딩을 이용하여 전송된다. 이 후에, 새로운 팔레트 엔트리들의 수는 차수 0의 지수 골롬 코드를 이용하여 시그널링된다. 마지막으로, 새로운 팔레트 엔트리들에 대한 성분 값들이 시그널링된다.
팔레트 인덱스들은 도 14a 및 14b에 도시된 바와 같이 수평 및 수직 횡단 스캔들을 이용하여 코딩된다. 스캔 순서는 palette_transpose_flag를 이용하여 비트스트림에서 명시적으로 시그널링된다.
도 14a는 수평 횡단 스캔을 도시한다. 도 14b는 수직 횡단 스캔을 도시한다.
팔레트 인덱스들을 코딩하기 위해, 도 15a 및 도 15b에 도시된 바와 같이, 횡단 스캔 모드에 기초하여 16개의 샘플을 갖는 다수의 세그먼트로 CU를 분할하는 라인 계수 그룹(CG) 기반 팔레트 모드가 사용되며, 여기서 이스케이프 모드에 대한 인덱스 런들, 팔레트 인덱스 값들 및 양자화된 컬러들은 각각의 CG에 대해 순차적으로 인코딩/파싱된다.
도 15a는 팔레트에 대한 서브-블록 기반 인덱스 맵 스캐닝을 도시한다. 도 15b는 팔레트에 대한 서브-블록 기반 인덱스 맵 스캐닝을 도시한다.
팔레트 인덱스들은 2개의 메인 팔레트 샘플 모드를 이용하여 코딩된다: 'INDEX' 및 'COPY_ABOVE'. 전술한 바와 같이, 이스케이프 심볼에는 최대 팔레트 크기와 동일한 인덱스가 할당된다. 'COPY_ABOVE' 모드에서, 위의 행의 샘플의 팔레트 인덱스가 복사된다. 인덱스' 모드에서, 팔레트 인덱스는 명시적으로 시그널링된다. 각각의 세그먼트에서의 팔레트 런 코딩에 대한 인코딩 순서는 다음과 같다:
각각의 픽셀에 대해, 픽셀이 이전 픽셀과 동일한 모드인 경우를, 즉 이전 스캐닝된 픽셀 및 현재 픽셀이 둘 다 런 타입 COPY_ABOVE를 갖는 경우 또는 이전 스캐닝된 픽셀 및 현재 픽셀이 둘 다 런 타입 INDEX 및 동일한 인덱스 값을 갖는 경우를 나타내는 1개의 컨텍스트 코딩된 빈 run_copy_flag = 0이 시그널링된다. 그렇지 않으면, run_copy_flag = 1이 시그널링된다.
픽셀 및 이전 픽셀이 상이한 모드인 경우, 픽셀의 런 타입, 즉, INDEX 또는 COPY_ABOVE를 나타내는 하나의 컨텍스트 코딩된 빈 copy_above_palette_indices_flag가 시그널링된다. 디코더는 샘플이 제1 행(수평 횡단 스캔) 또는 제1 열(수직 횡단 스캔)에 있다면 런 타입을 파싱할 필요가 없는데, 그 이유는 인덱스 모드가 디폴트로 사용되기 때문이다. 또한, 디코더는 이전에 파싱된 런 타입이 COPY_ABOVE이면 런 타입을 파싱할 필요가 없다.
하나의 세그먼트 내의 픽셀들의 팔레트 런 코딩 후에, 인덱스 모드(palette_idx_idc) 및 양자화된 이스케이프 컬러들(palette_escape_val)에 대한 인덱스 값들이 바이패스 코딩된다.
비디오 디코딩의 비효율성
VVC에서, 변환 계수들을 코딩할 때, abs_remainder 및 dec_abs_level의 신택스를 시그널링하기 위해 통합(동일) 라이스 파라미터(RicePara) 도출이 사용된다. 유일한 차이는, abs_remainder 및 dec_abs_level을 각각 코딩하기 위해 베이스 레벨 baseLevel이 4 및 0으로 설정된다는 것이다. 라이스 파라미터는 다음과 같이, 로컬 템플릿에서 이웃하는 5개의 변환 계수들의 절대 레벨들의 합뿐만 아니라, 또한 대응하는 베이스 레벨에 기초하여 결정된다:
RicePara = RiceParTable[ 최대(min( 31, sumAbs - 5 * baseLevel), 0) ]
즉, 신택스 엘리먼트들 abs_remainder 및 dec_abs_level에 대한 이진 코드워드들은 이웃 계수들의 레벨 정보에 따라 적응적으로 결정된다. 이 코드워드 결정은 각각의 샘플에 대해 수행되기 때문에, 계수 코딩을 위해 이 코드워드 적응을 처리하기 위해 추가 로직을 필요로 한다.
유사하게, 변환 스킵 모드 하에서 잔차 블록을 코딩할 때, 신택스 엘리먼트들 abs_remainder에 대한 이진 코드워드들은 이웃하는 잔차 샘플들의 레벨 정보에 따라 적응적으로 결정된다.
또한, 잔차 코딩 또는 변환 계수 코딩에 관련된 신택스 엘리먼트들을 코딩할 때, 확률 모델들의 선택은 이웃 레벨들의 레벨 정보에 의존하며, 이는 추가적인 로직들 및 추가적인 컨텍스트 모델들을 요구한다.
현재의 설계에서, 이스케이프 샘플들의 이진화는 3차 지수-골롬 이진화 프로세스를 호출함으로써 도출된다. 그 성능을 더 개선할 여지가 있다.
현재의 VVC에서, 2개의 상이한 레벨 매핑 방식들이 이용가능하고 정규 변환 및 변환 스킵에 각각 적용된다. 각각의 레벨 매핑 방식은 상이한 조건들, 매핑 함수 및 매핑 위치와 연관된다. 정규 변환이 적용되는 블록들의 경우, 컨텍스트 코딩된 빈(CCB)의 수가 한계를 초과한 후에 레벨 매핑 방식이 이용된다. ZeroPos[ n ]으로 표시된 매핑 위치, 및 AbsLevel[ xC ][ yC ]로 표시된 매핑 결과는 표 2에 명시된 바와 같이 도출된다. 변환 스킵이 적용되는 블록들의 경우, 컨텍스트 코딩된 빈(CCB)의 수가 한계를 초과하기 전에 또 다른 레벨 매핑 방식이 이용된다. predCoeff로 표시되는 매핑 위치 및 AbsLevel[xC][yC]로 표시되는 매핑 결과는 표 5에 명시된 바와 같이 도출된다. 이러한 통합되지 않은 설계는 표준화 관점에서 최적이 아닐 수 있다.
HEVC에서 10비트를 넘는 프로파일들에 대해, 1과 동일한 extended_precision_processing_flag는 확장된 동적 범위가 계수 파싱 및 역변환 처리를 위해 사용된다는 것을 명시한다. 현재의 VVC에서, 10-비트 초과의 변환 계수들 또는 변환 스킵 코딩에 대한 잔차 코딩은 성능의 상당한 감소의 원인으로서 보고된다. 그 성능을 더 개선할 여지가 있다.
제안된 방법
본 개시내용에서, 비디오 디코딩 관련 비효율성에 관한 섹션에서 언급된 문제들을 해결하기 위해 몇 가지 방법들이 제안된다. 이하의 방법들은 독립적으로 또는 공동으로 적용될 수 있다는 점에 유의한다.
본 개시내용의 제1 양태에 따르면, 잔차 코딩에서 특정 신택스 엘리먼트들, 예를 들어, abs_remainder을 코딩하기 위해 고정된 세트의 이진 코드워드들을 사용하는 것이 제안된다. 이진 코드워드들은 다양한 방법들을 사용하여 형성될 수 있다. 일부 예시적인 방법들은 다음과 같이 열거된다.
먼저, 현재 VVC에서 사용되는 abs_remainder에 대한 코드워드를 결정하기 위한 동일한 절차가 사용되지만, 항상 고정된 라이스 파라미터(예를 들어, 1, 2 또는 3)가 선택된다.
둘째, 고정 길이 이진화.
셋째, 절단 라이스 이진화.
넷째, TB(truncated Binary) 이진화 프로세스.
다섯째, k-차 지수-골롬 이진화 프로세스(EGk).
여섯째, 제한된 k-차 지수-골롬 이진화.
본 개시내용의 제2 양태에 따르면, 변환 계수 코딩에서, 특정 신택스 엘리먼트들, 예를 들어, abs_remainder 및 dec_abs_level을 코딩하기 위해 코드워드들의 고정된 세트를 사용하는 것이 제안된다. 이진 코드워드들은 다양한 방법들을 사용하여 형성될 수 있다. 일부 예시적인 방법들은 다음과 같이 열거된다.
먼저, 현재의 VVC에서 사용되는 abs_remainder 및 dec_abs_level에 대한 코드워드들을 결정하기 위한 동일한 절차가 사용되지만, 고정된 라이스 파라미터, 예를 들어 1, 2 또는 3을 갖는다. baseLevel의 값은 현재 VVC에서 사용되는 abs_remainder 및 dec_abs_level에 대해 여전히 상이할 수 있다. (예를 들어, baseLevel은 abs_remainder 및 dec_abs_level을 각각 코딩하기 위해 4 및 0으로 설정된다).
둘째, 현재 VVC에서 사용되는 abs_remainder 및 dec_abs_level에 대한 코드워드들을 결정하기 위한 동일한 절차가 사용되지만, 고정된 라이스 파라미터, 예를 들어 1, 2 또는 3을 갖는다. abs_remainder 및 dec_abs_level에 대한 baseLevels의 값은 동일하도록 선택된다. 예를 들어, 둘 다 0을 사용하거나 둘 다 4를 사용한다.
셋째, 고정 길이 이진화.
넷째, 절단 라이스 이진화.
다섯째, TB(truncated Binary) 이진화 프로세스.
여섯째, k-차 지수-골롬 이진화 프로세스(EGk).
일곱째, 제한된 k-차 지수-골롬 이진화.
본 개시내용의 제3 양태에 따르면, 잔차 코딩 또는 계수 코딩에 관련된 신택스 엘리먼트들의 코딩을 위해 단일 컨텍스트(예를 들어, abs_level_gtx_flag)를 사용하는 것이 제안되고, 이웃하는 디코딩된 레벨 정보에 기초한 컨텍스트 선택이 제거될 수 있다.
본 개시내용의 제4 양태에 따르면, 잔차 코딩에서, 특정 신택스 엘리먼트들, 예를 들어, abs_remainder을 코딩하기 위해 이진 코드워드들의 가변 세트들을 이용하는 것이 제안되고, 이진 코드워드들의 세트의 선택은 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스와 연관된 양자화 파라미터(QP), CU의 예측 모드들(예를 들어, IBC 모드 또는 인트라 또는 인터) 및/또는 슬라이스 타입(예를 들어, I 슬라이스, P 슬라이스 또는 B 슬라이스)에 따라 결정된다. 상이한 방법들이 이진 코드워드들의 가변 세트들을 도출하기 위해 사용될 수 있으며, 일부 예시적인 방법들은 다음과 같이 열거된다.
먼저, 현재 VVC에서 사용되는 abs_remainder에 대한 코드워드를 결정하기 위한 동일한 절차가 사용되지만, 상이한 라이스 파라미터들을 갖는다.
둘째, k-차 지수-골롬 이진화 프로세스(EGk).
셋째, 제한된 k-차 지수-골롬 이진화.
Figure pct00019
제4 양태에서 설명된 동일한 방법들이 또한 변환 효율적 코딩에 적용가능하다. 본 개시내용의 제5 양태에 따르면, 변환 계수 코딩에서, 특정 신택스 엘리먼트들, 예를 들어, abs_remainder 및 dec_abs_level을 코딩하기 위해 이진 코드워드들의 가변 세트들을 사용하는 것이 제안되고, 이진 코드워드들의 세트의 선택은 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스와 연관된 양자화 파라미터(QP), CU의 예측 모드들(예를 들어, IBC 모드 또는 인트라 또는 인터) 및/또는 슬라이스 타입(예를 들어, I 슬라이스, P 슬라이스 또는 B 슬라이스)에 따라 결정된다. 다시, 상이한 방법들이 이진 코드워드들의 가변 세트들을 도출하기 위해 사용될 수 있으며, 일부 예시적인 방법들은 다음과 같이 열거된다.
먼저, 현재 VVC에서 사용되는 abs_remainder에 대한 코드워드를 결정하기 위한 동일한 절차가 사용되지만, 상이한 라이스 파라미터들을 갖는다.
둘째, k-차 지수-골롬 이진화 프로세스(EGk).
셋째, 제한된 k-차 지수-골롬 이진화.
위의 이러한 방법들에서, 상이한 라이스 파라미터들이 이진 코드워드들의 상이한 세트를 도출하는 데 사용될 수 있다. 잔차 샘플들의 주어진 블록에 대해, 사용된 라이스 파라미터들은 이웃 레벨 정보 대신에 QPCU로 표시된 CU QP에 따라 결정된다. 하나의 구체적인 예가 표 6에 표시된 바와 같이 예시되며, 여기서 TH1 내지 TH4는(TH1 < TH2 < TH3 < TH4)를 충족시키는 미리 정의된 임계값들이고, K0 내지 K4는 미리 정의된 라이스 파라미터들이다. 동일한 로직들이 실제로 상이하게 구현될 수 있다는 점에 유의할 가치가 있다. 예를 들어, 특정 방정식들 또는 룩업 테이블이 또한 현재 CU의 QP 값으로부터, 표 6에 표시된 바와 같이, 동일한 라이스 파라미터들을 도출하기 위해 사용될 수 있다.
본 개시내용의 제5 양태에 따르면, 변환 계수 코딩 및/또는 변환 스킵 잔차 코딩의 신택스 엘리먼트들에 대한 코드워드 결정과 연관된 파라미터들 및/또는 임계값들의 세트가 비트스트림으로 시그널링된다. 결정된 코드워드들은 엔트로피 코더, 예를 들어 산술 코딩을 통해 신택스 엘리먼트들을 코딩할 때 이진화 코드워드들로서 사용된다.
파라미터들 및/또는 임계값들의 세트는 전체 세트, 또는 신택스 엘리먼트들에 대한 코드워드 결정과 연관된 모든 파라미터들 및 임계값들의 서브세트일 수 있다는 점에 유의한다. 파라미터들 및/또는 임계값들의 세트는 비디오 비트스트림 내의 상이한 레벨들에서 시그널링될 수 있다. 예를 들어, 이들은 시퀀스 레벨(예를 들어, 시퀀스 파라미터 세트), 픽처 레벨(예를 들어, 픽처 파라미터 세트, 및/또는 픽처 헤더), 슬라이스 레벨(예를 들어, 슬라이스 헤더), 코딩 트리 유닛(CTU) 레벨 또는 코딩 유닛(CU) 레벨에서 시그널링될 수 있다.
일 예에서, 변환 스킵 잔차 코딩에서 abs_remainder 신택스를 코딩하기 위한 코드워드를 결정하는데 이용되는 라이스 파라미터는, 슬라이스 헤더, 픽처 헤더, PPS, 및/또는 SPS에서 시그널링된다. 시그널링된 라이스 파라미터는, CU가 변환 스킵 모드로서 코딩되고 CU가 전술한 슬라이스 헤더, 픽처 헤더, PPS 및/또는 SPS 등과 연관될 때 신택스 abs_remainder을 코딩하기 위한 코드워드를 결정하는데 사용된다.
본 개시내용의 제6 양태에 따르면, 제1 및 제2 양태들에 예시된 바와 같은 코드워드 결정과 연관된 파라미터들 및/또는 임계값들의 세트는 변환 계수 코딩 및/또는 변환 스킵 잔차 코딩의 신택스 엘리먼트들에 사용된다. 그리고, 현재 블록이 루마 잔차/계수들 또는 크로마 잔차/계수들을 포함하는지에 따라 상이한 세트들이 사용될 수 있다. 결정된 코드워드들은 엔트로피 코더, 예를 들어 산술 코딩을 통해 신택스 엘리먼트들을 코딩할 때 이진화 코드워드들로서 사용된다.
일 예에서, 현재 VVC에서 사용되는 바와 같은 변환 잔차 코딩과 연관된 abs_remainder에 대한 코드워드는 루마 및 크로마 블록들 모두에 대해 사용되지만, 상이한 고정 라이스 파라미터들이 루마 블록 및 크로마 블록에 의해 각각 사용된다. (예를 들어, 루마 블록에 대한 K1, 크로마 블록에 대한 K2, 여기서 K1 및 K2는 정수들임)
본 개시내용의 제7 양태에 따르면, 변환 계수 코딩 및/또는 변환 스킵 잔차 코딩의 신택스 엘리먼트들에 대한 코드워드 결정과 연관된 파라미터들 및/또는 임계값들의 세트가 비트스트림으로 시그널링된다. 그리고 루마 및 크로마 블록들에 대해 상이한 세트들이 시그널링될 수 있다. 결정된 코드워드들은 엔트로피 코더, 예를 들어 산술 코딩을 통해 신택스 엘리먼트들을 코딩할 때 이진화 코드워드들로서 사용된다.
상기 양태들에서 설명된 동일한 방법들은 또한 팔레트 모드에서의 이스케이프 값 코딩, 예를 들어, palette_escape_val에 적용가능하다.
본 개시내용의 제8 양태에 따르면, 상이한 k-차의 지수-골롬 이진화가 팔레트 모드에서 이스케이프 값들을 코딩하기 위한 이진 코드워드들의 상이한 세트를 도출하는 데 사용될 수 있다. 일 예에서, 이스케이프 샘플들의 주어진 블록에 대해, 사용된 지수-골롬 파라미터, 즉 k의 값은 QPCU로 표시되는 블록의 QP 값에 따라 결정된다. 표 6에 예시된 것과 동일한 예가 블록의 주어진 QP 값에 기초하여 파라미터 k의 값을 도출하는데 사용될 수 있다. 이 예에서, 4개의 상이한 임계값(TH1 내지 TH4)이 열거되고, 5개의 상이한 k 값(K0 내지 K4)이 이들 임계값 및 QPCU에 기초하여 도출될 수 있지만, 임계값의 수는 단지 예시를 위한 것임을 언급할 가치가 있다. 실제로, 전체 QP 값 범위를 상이한 수의 QP 값 세그먼트들로 파티셔닝하기 위해 상이한 수의 임계값들이 사용될 수 있고, 각각의 QP 값 세그먼트에 대해, 팔레트 모드에서 코딩되는 블록의 이스케이프 값들을 코딩하기 위한 대응하는 이진 코드워드들을 도출하기 위해 상이한 k 값이 사용될 수 있다. 동일한 로직들이 실제로 상이하게 구현될 수 있다는 점을 또한 유의할 가치가 있다. 예를 들어, 특정 방정식들 또는 룩업 테이블이 동일한 라이스 파라미터들을 도출하기 위해 사용될 수 있다.
본 개시내용의 제9 양태에 따르면, 이스케이프 샘플의 신택스 엘리먼트들에 대한 코드워드 결정과 연관된 파라미터들 및/또는 임계값들의 세트가 비트스트림으로 시그널링된다. 결정된 코드워드들은 엔트로피 코더, 예를 들어, 산술 코딩을 통해 이스케이프 샘플들의 신택스 엘리먼트들을 코딩할 때 이진화 코드워드들로서 사용된다.
파라미터들 및/또는 임계값들의 세트는 전체 세트, 또는 신택스 엘리먼트들에 대한 코드워드 결정과 연관된 모든 파라미터들 및 임계값들의 서브세트일 수 있다는 점에 유의한다. 파라미터들 및/또는 임계값들의 세트는 비디오 비트스트림 내의 상이한 레벨들에서 시그널링될 수 있다. 예를 들어, 이들은 시퀀스 레벨(예를 들어, 시퀀스 파라미터 세트), 픽처 레벨(예를 들어, 픽처 파라미터 세트, 및/또는 픽처 헤더), 슬라이스 레벨(예를 들어, 슬라이스 헤더), 코딩 트리 유닛(CTU) 레벨 또는 코딩 유닛(CU) 레벨에서 시그널링될 수 있다.
양태에 따른 일 예에서, k-차의 지수-골롬 이진화는 팔레트 모드에서 palette_escape_val 신택스를 코딩하기 위한 코드워드들을 결정하는 데 사용되고, k의 값은 비트스트림에서 디코더에 시그널링된다. k의 값은 상이한 레벨들에서 시그널링될 수 있는데, 예를 들어, 그것은 슬라이스 헤더, 픽처 헤더, PPS, 및/또는 SPS 등에서 시그널링될 수 있다. 시그널링된 지수-골롬 파라미터는 CU가 팔레트 모드로서 코딩되고 CU가 전술한 슬라이스 헤더, 픽처 헤더, PPS 및/또는 SPS 등과 연관될 때 신택스 palette_escape_val을 코딩하기 위한 코드워드를 결정하는 데 사용된다.
변환 스킵 모드 및 정규 변환 모드에 대한 레벨 매핑의 조화
본 개시내용의 제10 양태에 따르면, 레벨 매핑을 적용하기 위한 동일한 조건이 변환 스킵 모드 및 정규 변환 모드 둘 다에 사용된다. 일 예에서, 컨텍스트 코딩된 빈들(CCB)의 수가 변환 스킵 모드 및 정규 변환 모드 둘 다에 대한 한계를 초과한 후에 레벨 매핑을 적용하는 것이 제안된다. 다른 예에서, 컨텍스트 코딩된 빈들(CCB)의 수가 변환 스킵 모드 및 정규 변환 모드 모두에 대한 한계를 초과하기 전에 레벨 매핑을 적용하는 것이 제안된다.
본 개시내용의 제11 양태에 따르면, 레벨 매핑에서의 매핑 위치의 도출을 위한 동일한 방법이 변환 스킵 모드와 정규 변환 모드 양쪽 모두에 이용된다. 일 예에서, 변환 스킵 모드 하에서 이용되는 레벨 매핑에서의 위치를 정규 변환 모드에 매핑하는 도출 방법을 역시 적용하는 것이 제안된다. 다른 예에서, 정규 변환 모드 하에서 이용되는 레벨 매핑에서의 위치를 변환 스킵 모드에 매핑하는 도출 방법을 적용하는 것도 제안된다.
본 개시내용의 제12 양태에 따르면, 동일한 레벨 매핑 방법이 변환 스킵 모드 및 정규 변환 모드 둘 다에 적용된다. 일 예에서, 변환 스킵 모드 하에서 사용되는 레벨 매핑 함수를 정규 변환 모드에도 적용하는 것이 제안된다. 다른 예에서, 정규 변환 모드 하에서 사용되는 레벨 매핑 함수를 변환 스킵 모드에도 적용하는 것이 제안된다.
잔차 코딩에서의 라이스 파라미터 도출의 단순화
본 개시내용의 제13 양태에 따르면, 골롬-라이스 코드를 사용하여 abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩함에 있어서 라이스 파라미터의 도출을 위한 룩업 테이블 대신에, 시프트 또는 나눗셈 연산과 같은 간단한 로직을 사용하는 것이 제안된다. 본 개시내용에 따르면, 표 4에 명시된 바와 같은 룩업 테이블이 제거될 수 있다. 일 예에서, 라이스 파라미터 cRiceParam은 다음과 같이 도출된다: cRiceParam =(locSumAbs >> n), 여기서 n은 양수, 예를 들어, 3이다. 실제로 다른 상이한 로직들, 예를 들어, 2 내지 n의 거듭제곱과 같은 값에 의한 나눗셈 연산이 동일한 결과들을 달성하기 위해 사용될 수 있다는 점을 유의할 가치가 있다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00020
본 개시내용의 제14 양태에 따르면, 골롬-라이스 코드를 사용하여 abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩함에 있어서 라이스 파라미터의 도출을 위해 더 적은 이웃 위치들을 사용하는 것이 제안된다. 일 예에서, abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩하는데 있어서 라이스 파라미터의 도출을 위해 2개의 이웃 위치만을 이용하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00021
다른 예에서, abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩할 때 라이스 파라미터의 도출을 위해 하나의 이웃 위치만을 사용하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00022
본 개시내용의 제15 양태에 따르면, 상이한 로직들을 사용하여, 골롬-라이스 코드를 사용하여 abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩함에 있어서 라이스 파라미터의 도출을 위해 baseLevel의 값에 기초하여 locSumAbs의 값을 조정하는 것이 제안된다. 일 예에서, 추가적인 스케일 및 오프셋 연산들은 "(locSumAbs - baseLevel * 5) *alpha + beta"의 형태로 적용된다. 알파가 1.5의 값을 취하고 베타가 1의 값을 취할 때, VVC 드래프트에 기초한 대응하는 디코딩 프로세스는 아래와 같이 예시된다.
Figure pct00023
본 개시내용의 제16 양태에 따르면, 골롬-라이스 코드를 사용하여 abs_remainder/dec_abs_level의 신택스 엘리먼트에서 라이스 파라미터의 도출을 위한 클립 동작들을 제거하는 것이 제안된다. 본 개시내용에 따르면, VVC 드래프트에 대한 디코딩 프로세스의 예가 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00024
본 개시내용에 따르면, VVC 드래프트에 대한 디코딩 프로세스의 예가 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00025
본 개시내용의 제17 양태에 따르면, 골롬-라이스 코드를 사용하여 abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩함에 있어서 라이스 파라미터의 도출을 위해 locSumAbs의 초기 값을 0으로부터 0이 아닌 정수로 변경하는 것이 제안된다. 일 예에서, 1의 초기 값은 locSumAbs에 할당되고, VVC 드래프트에 기초한 대응하는 디코딩 프로세스는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00026
본 개시내용의 제18 양태에 따르면, 골롬-라이스 코드를 사용하여 abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩함에 있어서, 라이스 파라미터의 도출을 위해 그들의 합 값 대신에 이웃 위치 레벨 값들의 최대 값을 사용하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시된다.
Figure pct00027
본 개시내용의 제19 양태에 따르면, 골롬-라이스 코드를 이용하여 abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩함에 있어서, 이웃 위치들에서의 각각의 AbsLevel 값의 상대 진폭 및 베이스 레벨 값에 기초하여 라이스 파라미터를 도출하는 것이 제안된다. 일 예에서, 라이스 파라미터는 이웃 위치들에서의 얼마나 많은 AbsLevel 값들이 베이스 레벨보다 큰지에 기초하여 도출된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00028
다른 예에서, 라이스 파라미터는 AbsLevel 값들이 베이스 레벨보다 큰 이웃 위치들에 대한(AbsLevel - baseLevel) 값들의 합에 기초하여 도출된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00029
본 개시내용에 따르면, VVC 드래프트에 대한 디코딩 프로세스의 일 예가 아래와 같이 예시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00030
잔차 코딩에서의 레벨 매핑 위치 도출의 단순화
본 개시내용의 제20 양태에 따르면, ZeroPos[ n ]이 cRiceParam으로부터만 도출되도록 ZeroPos[ n ]의 도출로부터 QState를 제거하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00031
본 개시내용의 제21 양태에 따르면, locSumAbs의 값에 기초하여 ZeroPos[ n ]을 도출하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00032
본 개시내용의 제22 양태에 따르면, 이웃 위치들의 AbsLevel의 값에 기초하여 ZeroPos[ n ]을 도출하는 것이 제안된다. 일 예에서, ZeroPos[ n ]은 AbsLevel [xC+1 ][ yC ] 및 AbsLevel[ xC ][ yC+1 ] 중 최대 값에 기초하여 도출된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00033
본 개시내용의 제23 양태에 따르면, 이웃 위치들의 모든 AbsLevel 값들의 최대 값에 기초하여 cRiceParam 및 ZeroPos[ n ] 둘 다를 도출하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00034
양태들에서 설명된 동일한 방법들은 또한 변환 스킵 모드를 위한 잔차 코딩에서 predCoeff의 도출에 적용가능하다. 일 예에서, 변수 predCoeff는 다음과 같이 도출된다:
predCoeff = Max( absLeftCoeff, absAboveCoeff ) + 1
변환 계수들에 대한 잔차 코딩
본 개시내용에서, "비디오 디코딩에 대한 비효율성" 섹션에서 지적된 바와 같은 문제들을 해결하기 위해, 잔차 코딩의 기존의 설계를 단순화 및/또는 추가로 개선하기 위한 방법들이 제공된다. 일반적으로, 본 개시내용에서 제안된 기술들의 주요 특징들은 다음과 같이 요약된다.
먼저, 현재의 설계에 기초하여 정규 잔차 코딩 하에서 이용되는 라이스 파라미터 도출을 조정한다.
둘째, 정규 잔차 코딩 하에서 사용되는 이진 방법을 변경한다.
셋째, 정규 잔차 코딩 하에서 이용되는 라이스 파라미터 도출을 변경한다.
현재 설계에 기초한 잔차 코딩에서의 라이스 파라미터 도출
본 개시내용의 제24 양태에 따르면, 잔차 코딩에서, 특정 신택스 엘리먼트들, 예를 들어, abs_remainder/dec_abs_level을 코딩하기 위해 라이스 파라미터 도출들의 가변적 방법들을 이용하는 것이 제안되고, 선택은 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스/프로파일과 연관된 양자화 파라미터 또는 코딩 비트-깊이에 따라, 및/또는 TB/CB/슬라이스/픽처/시퀀스 레벨과 연관된 새로운 플래그, 예를 들어, extended_precision_processing_flag에 따라 결정된다. 상이한 방법들이 라이스 파라미터를 도출하기 위해 사용될 수 있고, 일부 예시적인 방법들은 다음과 같이 열거된다.
먼저, cRiceParam =(cRiceParam << a)+(cRiceParam >> b)+c이고, 여기서 a, b 및 c는 양수이고, 예를 들어 {a,b,c}= {1,1,0}이다. 실제로 다른 상이한 로직들, 예를 들어, 2 내지 n의 거듭제곱과 동일한 값에 의한 곱셈 연산이 동일한 결과들을 달성하기 위해 사용될 수 있다는 점을 유의할 가치가 있다.
둘째, cRiceParam =(cRiceParam << a) +b이고, 여기서 a 및 b는 양수이고, 예를 들어 {a,b}= {1,1}이다. 실제로 다른 상이한 로직들, 예를 들어, 2 내지 n의 거듭제곱과 동일한 값에 의한 곱셈 연산이 동일한 결과들을 달성하기 위해 사용될 수 있다는 점을 유의할 가치가 있다.
셋째, cRiceParam =(cRiceParam*a) +b이고, 여기서 a 및 b는 양수이고, 예를 들어 {a,b}= {1.5,0}이다. 실제로 다른 상이한 로직들, 예를 들어, 2 내지 n의 거듭제곱과 동일한 값에 의한 곱셈 연산이 동일한 결과들을 달성하기 위해 사용될 수 있다는 점을 유의할 가치가 있다.
VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 22에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다. 동일한 로직들이 실제로 상이하게 구현될 수 있다는 점에 유의할 가치가 있다. 예를 들어, 특정 방정식들, 또는 룩업 테이블이 또한 현재 CU/시퀀스의 BitDepth 값으로부터 동일한 라이스 파라미터들을 도출하기 위해 사용될 수 있다.
Figure pct00035
Figure pct00036
다른 예에서, BitDepth가 미리 정의된 임계값(예를 들어, 10, 11, 12, 13, 14, 15 또는 16) 이상일 때, 라이스 파라미터 cRiceParam은 다음과 같이 도출된다: cRiceParam =(cRiceParam << a)+(cRiceParam >> b)+c이고, 여기서 a, b 및 c는 양수, 예를 들어, 1이다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스는 아래와 같이 예시된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 23에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다. 동일한 로직들이 실제로 상이하게 구현될 수 있다는 점에 유의할 가치가 있다. 예를 들어, 특정 방정식들, 또는 룩업 테이블이 또한 현재 CU/시퀀스의 BitDepth 값으로부터 동일한 라이스 파라미터들을 도출하기 위해 사용될 수 있다.
Figure pct00037
Figure pct00038
10-비트를 넘는 프로파일에 대한 잔차 코딩에서의 이진 방법
본 개시내용의 제25 양태에 따르면, 잔차 코딩에서, 특정 신택스 엘리먼트들, 예를 들어, abs_remainder/dec_abs_level을 코딩하기 위해 이진 코드워드들의 가변 세트들을 사용하는 것이 제안되고, 선택은 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스/프로파일과 연관된 양자화 파라미터 또는 코딩 비트-깊이에 따라, 및/또는 TB/CB/슬라이스/픽처/시퀀스 레벨과 연관된 새로운 플래그, 예를 들어, extended_precision_processing_flag에 따라 결정된다. 상이한 방법들이 이진 코드워드들의 가변 세트들을 도출하기 위해 사용될 수 있으며, 일부 예시적인 방법들은 다음과 같이 열거된다.
먼저, 현재 VVC에서 사용되는 abs_remainder에 대한 코드워드를 결정하기 위한 동일한 절차가 사용되지만, 항상 고정된 라이스 파라미터(예를 들어, 2, 3, 4, 5, 6, 7 또는 8)가 선택된다. 고정된 값은 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스/프로파일과 연관된 양자화 파라미터 또는 코딩 비트-깊이에 따라, 및/또는 TB/CB/슬라이스/픽처/시퀀스 레벨과 연관된 신택스 엘리먼트, 예를 들어, rice_parameter_value에 따라 상이한 조건에서 상이할 수 있다. 하나의 구체적인 예가 표 24에 표시된 바와 같이 예시되며, 여기서 TH1 내지 TH4는(TH1 < TH2 < TH3 < TH4)를 충족시키는 미리 정의된 임계값들이고, K0 내지 K4는 미리 정의된 라이스 파라미터들이다. 동일한 로직들이 실제로 상이하게 구현될 수 있다는 점에 유의할 가치가 있다. 예를 들어, 특정 방정식들 또는 룩업 테이블이 또한 현재 CU/시퀀스의 BitDepth 값으로부터, 표 24에 표시된 바와 같이, 동일한 라이스 파라미터들을 도출하기 위해 사용될 수 있다.
둘째, 고정 길이 이진화.
셋째, 절단 라이스 이진화.
넷째, TB(truncated Binary) 이진화 프로세스.
다섯째, k-차 지수-골롬 이진화 프로세스(EGk).
여섯째, 제한된 k-차 지수-골롬 이진화.
Figure pct00039
일 예에서, 새로운 플래그, 예를 들어, extended_precision_processing_flag가 1과 동일할 때, 라이스 파라미터 cRiceParam은 n으로서 고정되고, 여기서 n은 양수(예를 들어, 2, 3, 4, 5, 6, 7 또는 8)이다. 고정된 값은 상이한 조건에서 상이할 수 있다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 25에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00040
다른 예에서, 새로운 플래그, 예를 들어, extended_precision_processing_flag가 1과 동일할 때 abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩할 때 라이스 파라미터에 대해 하나의 고정된 값만을 사용하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스는 아래와 같이 예시된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 26에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00041
또 다른 예에서, BitDepth가 미리 정의된 임계값(예를 들어, 10, 11, 12, 13, 14, 15 또는 16) 이상일 때, 라이스 파라미터 cRiceParam은 n으로서 고정되고, 여기서 n은 양수, 예를 들어, 4, 5, 6, 7 또는 8이다. 고정된 값은 상이한 조건에서 상이할 수 있다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 TH는 미리 정의된 임계값(예를 들어, 10, 11, 12, 13, 14, 15 또는 16)이다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 27에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00042
또 다른 예에서, BitDepth가 미리 정의된 임계값(예를 들어, 10, 11, 12, 13, 14, 15 또는 16)보다 클 때 abs_remainder/dec_abs_level의 신택스 엘리먼트를 코딩하는데 있어서 라이스 파라미터에 대해 하나의 고정된 값만을 사용하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스는 아래와 같이 예시되며, 여기서 TH는 미리 정의된 임계값(예를 들어, 10, 11, 12, 13, 14, 15 또는 16)이다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 28에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00043
잔차 코딩에서의 라이스 파라미터 도출
본 개시내용의 제26 양태에 따르면, 잔차 코딩에서, 특정 신택스 엘리먼트들, 예를 들어, abs_remainder/dec_abs_level을 코딩하기 위해 라이스 파라미터 도출들의 가변적 방법들을 이용하는 것이 제안되고, 선택은 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스/프로파일과 연관된 양자화 파라미터 또는 코딩 비트-깊이에 따라, 및/또는 TB/CB/슬라이스/픽처/시퀀스 레벨과 연관된 새로운 플래그, 예를 들어, extended_precision_processing_flag에 따라 결정된다. 상이한 방법들이 라이스 파라미터를 도출하기 위해 사용될 수 있고, 일부 예시적인 방법들은 다음과 같이 열거된다.
먼저, 라이스 파라미터를 도출하기 위해 카운터들을 이용하는 것이 제안된다. 카운터들은 코딩된 계수의 값 및 현재 블록의 특정 코딩된 정보, 예를 들어, 컴포넌트 ID에 따라 결정된다. 하나의 구체적인 예, riceParameter = 카운터 / a, 여기서 a는 양수, 예를 들어, 4이고, 2개의 카운터(루마/크로마에 의해 분할됨)를 유지한다. 이러한 카운터들은 각각의 슬라이스의 시작에서 0으로 리셋된다. 일단 코딩되면, 카운터는 이것이 다음과 같이 서브-TU에서 코딩된 제1 계수이면 업데이트된다:
if(coeffValue >=(3 << 라이스)) counter++
if (((coeffValue << 1) < (1 << riceParameter)) && (counter > 0)) counter--;
둘째, VVC에서의 라이스 파라미터의 도출에 시프트 연산을 추가하는 것이 제안된다. 시프트는 코딩된 계수의 값에 따라 결정된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시되고, 시프트는 방법 1의 카운터들에 따라 결정된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 29에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00044
셋째, VVC에서의 라이스 파라미터의 도출에 시프트 연산을 추가하는 것이 제안된다. 시프트는 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스 프로파일(예를 들어, 14 비트 프로파일 또는 16 비트 프로파일)과 연관된 코딩 비트-깊이에 따라 결정된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시되고, 시프트는 방법 1의 카운터들에 따라 결정된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 30에 표시되고, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 표시한다.
Figure pct00045
변환 스킵을 위한 잔차 코딩
본 개시내용의 제27 양태에 따르면, 변환 스킵 잔차 코딩에서, 특정 신택스 엘리먼트들, 예를 들어, abs_remainder을 코딩하기 위해 이진 코드워드들의 가변 세트들을 사용하는 것이 제안되고, 선택은 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스/프로파일과 연관된 양자화 파라미터 또는 코딩 비트-깊이에 따라, 및/또는 TB/CB/슬라이스/픽처/시퀀스 레벨과 연관된 새로운 플래그, 예를 들어, extended_precision_processing_flag에 따라 결정된다. 상이한 방법들이 이진 코드워드들의 가변 세트들을 도출하기 위해 사용될 수 있으며, 일부 예시적인 방법들은 다음과 같이 열거된다.
먼저, 현재 VVC에서 사용되는 abs_remainder에 대한 코드워드를 결정하기 위한 동일한 절차가 사용되지만, 항상 고정된 라이스 파라미터(예를 들어, 2, 3, 4, 5, 6, 7 또는 8)가 선택된다. 고정된 값은 현재 블록의 특정 코딩된 정보, 예를 들어, TB/CB 및/또는 슬라이스/프로파일과 연관된 양자화 파라미터 또는 코딩 비트-깊이에 따라, 및/또는 TB/CB/슬라이스/픽처/시퀀스 레벨과 연관된 신택스 엘리먼트, 예를 들어, rice_parameter_value에 따라 상이한 조건에서 상이할 수 있다. 하나의 구체적인 예가 표 7에 표시된 바와 같이 예시되며, 여기서 TH1 내지 TH4는(TH1 < TH2 < TH3 < TH4)를 충족시키는 미리 정의된 임계값들이고, K0 내지 K4는 미리 정의된 라이스 파라미터들이다. 동일한 로직들이 실제로 상이하게 구현될 수 있다는 점에 유의할 가치가 있다. 예를 들어, 특정 방정식들, 또는 룩업 테이블이 또한 현재 CU/시퀀스의 BitDepth 값으로부터, 표 7에 표시된 바와 같이, 동일한 라이스 파라미터들을 도출하기 위해 사용될 수 있다.
둘째, 고정 길이 이진화.
셋째, 절단 라이스 이진화.
넷째, TB(truncated Binary) 이진화 프로세스.
다섯째, k-차 지수-골롬 이진화 프로세스(EGk).
여섯째, 제한된 k-차 지수-골롬 이진화.
VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시되고, VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 31에 표시되고, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 표시한다. 동일한 로직들이 실제로 상이하게 구현될 수 있다는 점에 유의할 가치가 있다. 예를 들어, 특정 방정식들 또는 룩업 테이블이 또한 동일한 라이스 파라미터들을 도출하는 데 사용될 수 있다.
Figure pct00046
다른 예에서, 새로운 플래그, 예를 들어, extended_precision_processing_flag가 1과 동일할 때 abs_remainder의 신택스 엘리먼트를 코딩하는데 있어서 라이스 파라미터에 대해 하나의 고정된 값만을 사용하는 것이 제안된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스는 아래와 같이 예시된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 32에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00047
또 다른 예에서, 새로운 플래그, 예를 들어, extended_precision_processing_flag가 1과 동일할 때, 라이스 파라미터 cRiceParam은 n으로서 고정되고, 여기서 n은 양수(예를 들어, 2, 3, 4, 5, 6, 7 또는 8)이다. 고정된 값은 상이한 조건에서 상이할 수 있다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 33에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다.
Figure pct00048
또 다른 예에서, BitDepth가 미리 정의된 임계값(예를 들어, 10, 11, 12, 13, 14, 15 또는 16) 이상일 때, 라이스 파라미터 cRiceParam은 n으로서 고정되고, 여기서 n은 양수, 예를 들어, 4, 5, 6, 7 또는 8이다. 고정된 값은 상이한 조건에서 상이할 수 있다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 TH는 미리 정의된 임계값(예를 들어, 10, 11, 12, 13, 14, 15 또는 16)이다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 34에 표시되고, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 표시한다.
Figure pct00049
또 다른 예에서, 변환 스킵 블록들에 대한 라이스 파라미터의 시그널링이 활성화 또는 비활성화되는지를 나타내기 위해 하나의 제어 플래그가 슬라이스 헤더에서 시그널링된다. 제어 플래그가 활성화된 것으로 시그널링될 때, 각각의 변환 스킵 슬라이스에 대해 하나의 신택스 엘리먼트가 추가로 시그널링되어 그 슬라이스의 라이스 파라미터를 나타낸다. 제어 플래그가 비활성화된 것으로서 시그널링될 때(예를 들어, "0"과 동일하게 설정될 때), 변환 스킵 슬라이스에 대한 라이스 파라미터를 나타내기 위해 더 이상의 신택스 엘리먼트가 하위 레벨에서 시그널링되지 않고, 모든 변환 스킵 슬라이스에 대해 디폴트 라이스 파라미터(예를 들어, 1)가 사용된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 TH는 미리 정의된 값(예를 들어, 0, 1, 2)이다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 35에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다. sh_ts_residual_coding_rice_index는 상이한 방식들로 코딩될 수 있고/있거나 최대 값을 가질 수 있다는 점을 유의할 가치가 있다. 예를 들어, u(n), n 비트를 사용하는 무부호 정수, 또는 f(n), 좌측 비트 우선으로(좌측에서 우측으로) 기입된 n 비트를 사용하는 고정 패턴 비트 스트링이 또한 동일한 신택스 엘리먼트를 인코딩/디코딩하는 데 사용될 수 있다.
Figure pct00050
1과 동일한 sh_ts_residual_coding_rice_flag는 sh_ts_residual_coding_rice_index가 현재 슬라이스에 존재할 수 있음을 특정한다. 0과 동일한 sh_ts_residual_coding_rice_flag는 sh_ts_residual_coding_rice_index가 현재 슬라이스에 존재하지 않음을 명시한다. sh_ts_residual_coding_rice_flag가 존재하지 않을 때, sh_ts_residual_coding_rice_flag의 값은 0인 것으로 추론된다.
sh_ts_residual_coding_rice_index는 residual_ts_coding() 신택스 구조에 사용되는 라이스 파라미터를 특정한다.
Figure pct00051
도 16은 비디오 디코딩을 위한 방법을 도시한다. 이 방법은, 예를 들어, 디코더에 적용될 수 있다.
단계 1610에서, 디코더는 비디오 비트스트림을 수신할 수 있다. 비디오 비트스트림은 인코딩된 비디오 정보 및 인코딩된 비디오 정보를 디코딩하기 위한 정보를 포함할 수 있다.
단계 1612에서, 디코더는 슬라이스 헤더 레벨에서 제어 플래그를 수신할 수 있다. 제어 플래그는 변환 스킵 슬라이스에 대해 라이스 파라미터가 활성화되어 있는지를 시그널링할 수 있다. 예를 들어, 제어 플래그는 인코딩된 비디오 정보를 디코딩하는 데 사용될 수 있고, 라이스 파라미터는 abs_remainder 및 dec_abs_level의 신택스를 디코딩하는 데 사용될 수 있다.
단계 1614에서, 디코더는 슬라이스 헤더 레벨에서 적어도 하나의 신택스 엘리먼트를 수신할 수 있다. 적어도 하나의 신택스 엘리먼트는 변환 스킵 슬라이스에 대해 시그널링될 수 있고, 라이스 파라미터를 나타낸다. 예를 들어, 신택스 엘리먼트는 각각의 변환 스킵 슬라이스에 대해 시그널링되어 그 슬라이스의 라이스 파라미터를 나타낼 수 있다. 다른 예에서, 신택스 엘리먼트가 변환 스킵 슬라이스에 대한 라이스 파라미터를 나타내기 위해 하위 레벨에서 시그널링되지 않을 때, 디폴트 라이스 파라미터가 모든 변환 스킵 슬라이스에 대해 사용된다.
단계 1616에서, 디코더는 제어 플래그 및 적어도 하나의 신택스 엘리먼트에 기초하여 비디오 비트스트림을 엔트로피 디코딩할 수 있다. 예를 들어, 디코더는 인코딩된 비디오 정보를 디코딩하기 위한 양자화된 계수 레벨들 및 예측-관련 정보를 도출하기 위해 제어 플래그 및 적어도 하나의 신택스 엘리먼트를 사용할 수 있다.
변환/변환-스킵 블록들에 대한 양자화 인덱스들의 엔트로피 코딩은 변환/변환-스킵 계수 코딩이라고 지칭될 수 있다.
하나 이상의 실시예에서, 인코더는 잔차 코딩 비활성화된 플래그가 0과 동일하다고 결정할 수 있다. 인코더는 또한 잔차 코딩 라이스 플래그를 시그널링할 수 있다. 적어도 하나의 신택스 엘리먼트는 잔차 코딩 라이스 플래그를 포함할 수 있다. 인코더는 또한 잔차 코딩 라이스 플래그가 1과 동일하다고 결정할 수 있다. 인코더는 잔차 코딩 라이스 인덱스 플래그를 추가로 시그널링할 수 있다. 적어도 하나의 신택스 엘리먼트는 잔차 코딩 라이스 인덱스 플래그를 포함한다.
하나 이상의 실시예에서, 디코더는 잔차 코딩 비활성화된 플래그가 0과 동일하다고 결정할 수 있다. 디코더는 잔차 코딩 라이스 플래그를 수신할 수 있다. 적어도 하나의 신택스 엘리먼트는 잔차 코딩 라이스 플래그를 포함할 수 있다. 디코더는 또한 잔차 코딩 라이스 플래그가 1과 동일하다고 결정할 수 있다. 디코더는 잔차 코딩 라이스 인덱스 플래그를 추가로 수신할 수 있다. 적어도 하나의 신택스 엘리먼트는 잔차 코딩 라이스 인덱스 플래그를 포함한다.
또 다른 예에서, 하나의 제어 플래그는 변환 스킵 블록들에 대한 라이스 파라미터의 시그널링이 활성화 또는 비활성화되는지를 나타내기 위해 시퀀스 파라미터 세트에서(또는 시퀀스 파라미터 세트 범위 확장 신택스에서) 시그널링된다. 제어 플래그가 활성화된 것으로 시그널링될 때, 각각의 변환 스킵 슬라이스에 대해 하나의 신택스 엘리먼트가 추가로 시그널링되어 그 슬라이스의 라이스 파라미터를 나타낸다. 제어 플래그가 비활성화된 것으로서 시그널링될 때(예를 들어, "0"과 동일하게 설정될 때), 변환 스킵 슬라이스에 대한 라이스 파라미터를 나타내기 위해 더 이상의 신택스 엘리먼트가 하위 레벨에서 시그널링되지 않고, 모든 변환 스킵 슬라이스에 대해 디폴트 라이스 파라미터(예를 들어, 1)가 사용된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 TH는 미리 정의된 값(예를 들어, 0, 1, 2)이다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 37에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다. sh_ts_residual_coding_rice_idx는 상이한 방식들로 코딩될 수 있고/있거나 최대 값을 가질 수 있다는 점에 유의할 가치가 있다. 예를 들어, u(n), n 비트를 사용하는 무부호 정수, 또는 f(n), 좌측 비트 우선으로(좌측에서 우측으로) 기입된 n 비트를 사용하는 고정 패턴 비트 스트링이 또한 동일한 신택스 엘리먼트를 인코딩/디코딩하는 데 사용될 수 있다.
Figure pct00052
1과 동일한 sps_ts_residual_coding_rice_present_in_sh_flag는 sh_ts_residual_coding_rice_idx가 SPS를 참조하는 SH 신택스 구조들에 존재할 수 있다는 것을 특정한다. 0과 동일한 sps_ts_residual_coding_rice_present_in_sh_flag는 SPS를 참조하는 SH 신택스 구조들에 sh_ts_residual_coding_rice_idx가 존재하지 않는다는 것을 특정한다. sps_ts_residual_coding_rice_present_in_sh_flag가 존재하지 않을 때, sps_ts_residual_coding_rice_present_in_sh_flag의 값은 0인 것으로 추론된다.
Figure pct00053
sh_ts_residual_coding_rice_idx는 residual_ts_coding() 신택스 구조에 사용되는 라이스 파라미터를 특정한다.
Figure pct00054
또 다른 예에서, 각각의 변환 스킵 슬라이스에 대해 하나의 신택스 엘리먼트가 시그널링되어 그 슬라이스의 라이스 파라미터를 나타낸다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예가 아래와 같이 예시된다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 40에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다. sh_ts_residual_coding_rice_idx는 상이한 방식들로 코딩될 수 있고/있거나 최대 값을 가질 수 있다는 점에 유의할 가치가 있다. 예를 들어, u(n), n 비트를 사용하는 무부호 정수, 또는 f(n), 좌측 비트 우선으로(좌측에서 우측으로) 기입된 n 비트를 사용하는 고정 패턴 비트 스트링이 또한 동일한 신택스 엘리먼트를 인코딩/디코딩하는 데 사용될 수 있다.
Figure pct00055
sh_ts_residual_coding_rice_idx는 residual_ts_coding() 신택스 구조에 사용되는 라이스 파라미터를 특정한다. sh_ts_residual_coding_rice_idx가 존재하지 않을 때, sh_ts_residual_coding_rice_idx의 값은 0인 것으로 추론된다.
Figure pct00056
도 17은 비디오 디코딩을 위한 방법을 도시한다. 이 방법은, 예를 들어, 디코더에 적용될 수 있다.
단계 1710에서, 디코더는 잔차 코딩 비활성화 플래그가 0과 동일하다는 결정에 응답하여, 잔차 코딩 라이스 플래그를 수신할 수 있다. 적어도 하나의 신택스 엘리먼트는 잔차 코딩 라이스 플래그를 포함한다.
단계 1712에서, 디코더는 잔차 코딩 라이스 플래그가 1과 동일하다는 결정에 응답하여, 잔차 코딩 라이스 인덱스 플래그를 수신할 수 있다. 적어도 하나의 신택스 엘리먼트는 잔차 코딩 라이스 인덱스 플래그를 포함한다.
또 다른 예에서, 하나의 제어 플래그는 변환 스킵 블록들에 대한 라이스 파라미터의 시그널링이 활성화 또는 비활성화되는지를 나타내기 위해 픽처 파라미터 세트 범위 확장 신택스에서 시그널링된다. 제어 플래그가 활성화된 것으로 시그널링될 때, 그 픽처의 라이스 파라미터를 나타내기 위해 하나의 신택스 엘리먼트가 추가로 시그널링된다. 제어 플래그가 비활성화된 것으로서 시그널링될 때(예를 들어, "0"과 동일하게 설정될 때), 변환 스킵 슬라이스에 대한 라이스 파라미터를 나타내기 위해 더 이상의 신택스 엘리먼트가 하위 레벨에서 시그널링되지 않고, 모든 변환 스킵 슬라이스에 대해 디폴트 라이스 파라미터(예를 들어, 1)가 사용된다. VVC 드래프트에 기초한 대응하는 디코딩 프로세스의 예는 아래와 같이 예시되며, 여기서 TH는 미리 정의된 값(예를 들어, 0, 1, 2)이다. VVC 드래프트에 대한 변경들은 굵은 이탤릭체 글꼴로 표 42에 표시되며, 삭선 글꼴은 디코딩 프로세스로부터 삭제되거나 제거된 단계들 또는 요소들을 나타낸다. pps_ts_residual_coding_rice_idx는 상이한 방식들로 코딩될 수 있고/있거나 최대 값을 가질 수 있다는 점에 유의할 가치가 있다. 예를 들어, u(n), n 비트를 사용하는 무부호 정수, 또는 f(n), 좌측 비트 우선으로(좌측에서 우측으로) 기입된 n 비트를 사용하는 고정 패턴 비트 스트링이 또한 동일한 신택스 엘리먼트를 인코딩/디코딩하는 데 사용될 수 있다.
Figure pct00057
1과 동일한 pps_ts_residual_coding_rice_flag는 pps_ts_residual_coding_rice_index가 현재 픽처에 존재할 수 있음을 특정한다. 0과 동일한 pps_ts_residual_coding_rice_flag는 pps_ts_residual_coding_rice_idx가 현재 픽처에 존재하지 않음을 명시한다. pps_ts_residual_coding_rice_flag가 존재하지 않을 때, pps_ts_residual_coding_rice_flag의 값은 0인 것으로 추론된다.
pps_ts_residual_coding_rice_idx는 residual_ts_coding() 신택스 구조에 사용되는 라이스 파라미터를 특정한다.
Figure pct00058
상기 방법들은 주문형 집적 회로(ASIC)들, 디지털 신호 프로세서(DSP)들, 디지털 신호 처리 디바이스(DSPD)들, 프로그램가능 로직 디바이스(PLD)들, 필드 프로그램가능 게이트 어레이(FPGA)들, 제어기들, 마이크로-제어기들, 마이크로프로세서들, 또는 다른 전자 컴포넌트들을 포함하는 하나 이상의 회로를 포함하는 장치를 사용하여 구현될 수 있다. 장치는 위에 설명된 방법들을 수행하기 위해 다른 하드웨어 또는 소프트웨어 컴포넌트들과 조합하여 회로들을 사용할 수 있다. 위에 개시된 각각의 모듈, 서브-모듈, 유닛, 또는 서브-유닛은 하나 이상의 회로를 사용하여 적어도 부분적으로 구현될 수 있다.
본 개시내용의 다른 예들은 본 명세서에 개시된 본 개시내용의 사양 및 실시의 고려로부터 본 기술분야의 통상의 기술자에게 명백할 것이다. 본 출원은 본 기술분야의 공지된 또는 관례적인 실시 내에 있는 본 개시내용으로부터의 그러한 이탈들을 포함하여, 본 개시내용의 일반적인 원리들을 따르는 본 개시내용의 임의의 변형들, 사용들, 또는 적응들을 커버하도록 의도된다. 본 명세서 및 예시는 단지 예시로서 고려되기를 의도한다.
본 개시내용은 위에서 설명되고 첨부 도면들에 예시된 정확한 예들로 제한되지 않고, 다양한 수정들 및 변경들이 그 범위로부터 벗어나지 않고 이루어질 수 있다는 것이 이해될 것이다.
도 18은 사용자 인터페이스(1860)와 결합된 컴퓨팅 환경(1810)을 도시한다. 컴퓨팅 환경(1810)은 데이터 처리 서버의 일부일 수 있다. 컴퓨팅 환경(1810)은 프로세서(1820), 메모리(1840), 및 I/O 인터페이스(1850)를 포함한다.
프로세서(1820)는 전형적으로, 디스플레이, 데이터 취득, 데이터 통신, 및 이미지 처리와 연관된 동작들과 같은, 컴퓨팅 환경(1810)의 전체적인 동작들을 제어한다. 프로세서(1820)는 전술한 방법들의 단계들의 전부 또는 일부를 수행하기 위한 명령어들을 실행하기 위한 하나 이상의 프로세서를 포함할 수 있다. 또한, 프로세서(1820)는 프로세서(1820)와 다른 컴포넌트들 사이의 상호작용을 용이하게 하는 하나 이상의 모듈을 포함할 수 있다. 프로세서는 중앙 처리 유닛(CPU), 마이크로프로세서, 단일 칩 머신, GPU 등일 수 있다.
메모리(1840)는 컴퓨팅 환경(1810)의 동작을 지원하기 위해 다양한 유형의 데이터를 저장하도록 구성된다. 메모리(1840)는 미리 결정된 소프트웨어(1842)를 포함할 수 있다. 이러한 데이터의 예들은 컴퓨팅 환경(1810), 비디오 데이터세트들, 이미지 데이터 등 상에서 동작되는 임의의 애플리케이션들 또는 방법들에 대한 명령어들을 포함한다. 메모리(1840)는 SRAM(static random access memory), EEPROM(electrically erasable programmable read-only memory), EPROM(erasable programmable read-only memory), PROM(programmable read-only memory), ROM(read-only memory), 자기 메모리, 플래시 메모리, 자기 또는 광학 디스크와 같은 임의의 타입의 휘발성 또는 비휘발성 메모리 디바이스들, 또는 이들의 조합을 사용하여 구현될 수 있다.
I/O 인터페이스(1850)는 프로세서(1820)와, 키보드, 클릭 휠, 버튼 등과 같은 주변 인터페이스 모듈들 사이의 인터페이스를 제공한다. 버튼들은 홈 버튼, 스캔 시작 버튼, 및 스캔 중지 버튼을 포함할 수 있지만, 이에 제한되지 않는다. I/O 인터페이스(1850)는 인코더 및 디코더와 결합될 수 있다.
일부 실시예들에서, 전술한 방법들을 수행하기 위해, 컴퓨팅 환경(1810) 내의 프로세서(1820)에 의해 실행 가능한, 메모리(1840)에 포함된 것과 같은 복수의 프로그램을 포함하는 비일시적 컴퓨터 판독 가능 저장 매체가 또한 제공된다. 예를 들어, 비일시적 컴퓨터 판독 가능 저장 매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광학 데이터 저장 디바이스 등일 수 있다.
비일시적 컴퓨터 판독 가능 저장 매체는 하나 이상의 프로세서를 갖는 컴퓨팅 장치에 의한 실행을 위한 복수의 프로그램을 저장하며, 복수의 프로그램은 하나 이상의 프로세서에 의해 실행될 때 컴퓨팅 장치로 하여금 전술한 모션 예측 방법을 수행하게 한다.
일부 실시예들에서, 컴퓨팅 환경(1810)은, 상기 방법들을 수행하기 위해, 하나 이상의 주문형 집적 회로(ASIC), 디지털 신호 프로세서(DSP), 디지털 신호 처리 디바이스(DSPD), 프로그램가능 로직 디바이스(PLD), 필드 프로그램가능 게이트 어레이(FPGA), 그래픽 처리 유닛(GPU), 제어기, 마이크로-제어기, 마이크로프로세서, 또는 다른 전자 컴포넌트로 구현될 수 있다.
본 개시내용의 설명은 예시의 목적으로 제시되었고, 본 개시내용을 총망라하거나 본 개시내용으로 제한되도록 의도되지 않는다. 많은 수정들, 변형들, 및 대안적인 구현들이 전술한 설명들 및 연관된 도면들에 제시된 교시들의 이점을 갖는 본 기술분야의 통상의 기술자에게 명백할 것이다.
예들은 본 개시내용의 원리들을 설명하고, 본 기술분야의 다른 통상의 기술자가 다양한 구현들에 대해 본 개시내용을 이해할 수 있게 하고, 고려되는 특정 사용에 적합한 바와 같은 다양한 수정들을 갖는 기본 원리들 및 다양한 구현들을 최상으로 이용할 수 있게 하기 위해 선택되고 설명되었다. 따라서, 본 개시내용의 범위는 개시된 구현들의 특정 예들로 제한되지 않으며, 수정들 및 다른 구현들은 본 개시내용의 범위 내에 포함되도록 의도된다는 것을 이해해야 한다.

Claims (10)

  1. 비디오 디코딩을 위한 방법으로서,
    디코더에 의해, 비디오 비트스트림을 수신하는 단계;
    상기 디코더에 의해, 슬라이스 헤더 레벨에서 제어 플래그를 수신하는 단계- 상기 제어 플래그는 변환 스킵 슬라이스에 대해 라이스 파라미터가 활성화되어 있는지를 시그널링함 -;
    상기 디코더에 의해, 상기 슬라이스 헤더 레벨에서 적어도 하나의 신택스 엘리먼트를 수신하는 단계- 상기 적어도 하나의 신택스 엘리먼트는 상기 변환 스킵 슬라이스에 대해 시그널링되고 상기 라이스 파라미터를 나타냄 -; 및
    상기 디코더에 의해, 상기 제어 플래그 및 상기 적어도 하나의 신택스 엘리먼트에 기초하여 상기 비디오 비트스트림을 엔트로피 디코딩하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 디코더에 의해, 상기 슬라이스 헤더 레벨에서 상기 적어도 하나의 신택스 엘리먼트를 수신하는 단계는,
    잔차 코딩 비활성화된 플래그가 0과 동일하다고 결정하는 것에 응답하여, 잔차 코딩 라이스 플래그를 수신하고 - 상기 적어도 하나의 신택스 엘리먼트는 상기 잔차 코딩 라이스 플래그를 포함함 -; 및
    상기 잔차 코딩 라이스 플래그가 1과 동일하다는 결정에 응답하여, 잔차 코딩 라이스 인덱스 플래그를 수신함으로써 - 상기 적어도 하나의 신택스 엘리먼트는 상기 잔차 코딩 라이스 인덱스 플래그를 포함함 -
    상기 디코더에 의해, 상기 슬라이스 헤더 레벨에서 상기 적어도 하나의 신택스 엘리먼트를 수신하는 단계를 포함하는, 방법.
  3. 제2항에 있어서, 상기 잔차 코딩 라이스 플래그가 1과 동일할 때, 상기 잔차 코딩 라이스 플래그는 상기 잔차 코딩 라이스 인덱스 플래그가 현재 슬라이스에 존재함을 나타내는, 방법.
  4. 제2항에 있어서, 상기 잔차 코딩 라이스 플래그가 0과 동일할 때, 상기 잔차 코딩 라이스 플래그는 상기 잔차 코딩 라이스 인덱스 플래그가 현재 슬라이스에 존재하지 않음을 나타내는, 방법.
  5. 제4항에 있어서, 상기 잔차 코딩 라이스 플래그가 존재하지 않는다는 결정에 응답하여, 상기 잔차 코딩 라이스 플래그의 값을 0과 동일한 것으로 추론하는 단계를 더 포함하는, 방법.
  6. 제2항에 있어서, 상기 잔차 코딩 라이스 플래그가 1과 동일하고, 변환 스킵 플래그가 1과 동일하고, 상기 잔차 코딩 비활성화된 플래그가 0과 동일하다는 결정에 응답하여, 상기 라이스 파라미터를 상기 잔차 코딩 라이스 인덱스에 미리 정의된 임계값을 더한 것과 동일하도록 설정하는 단계를 더 포함하는, 방법.
  7. 제1항에 있어서, 상기 디코더에 의해, 상기 슬라이스 헤더 레벨에서 상기 적어도 하나의 신택스 엘리먼트를 수신하는 단계는,
    잔차 코딩 비활성화된 플래그가 0과 동일하고 잔차 코딩 라이스 활성화된 플래그가 1과 동일하다는 결정에 응답하여, 잔차 코딩 라이스 인덱스 플래그를 수신함으로써 - 상기 적어도 하나의 신택스 엘리먼트는 상기 잔차 코딩 라이스 인덱스 플래그를 포함함 -, 상기 디코더에 의해, 상기 슬라이스 헤더 레벨에서 상기 적어도 하나의 신택스 엘리먼트를 수신하는 단계를 포함하는, 방법.
  8. 제7항에 있어서, 상기 변환 스킵 플래그가 1과 동일하고 상기 잔차 코딩 비활성화된 플래그가 0과 동일하다는 결정에 응답하여 상기 라이스 파라미터를 상기 잔차 코딩 라이스 인덱스 + 1과 동일하도록 설정하는 단계를 더 포함하는, 방법.
  9. 컴퓨팅 디바이스로서,
    하나 이상의 프로세서; 및
    상기 하나 이상의 프로세서들에 의해 실행가능한 명령어들을 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함하고, 상기 하나 이상의 프로세서는 제1항 내지 제8항 중 어느 한 항의 방법을 수행하도록 구성되는, 컴퓨팅 디바이스.
  10. 하나 이상의 프로세서를 갖는 컴퓨팅 디바이스에 의해 실행되는 복수의 프로그램을 저장하는 비일시적 컴퓨터 판독 가능 저장 매체로서, 상기 복수의 프로그램은, 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 컴퓨팅 디바이스로 하여금 제1항 내지 제8항 중 어느 한 항의 방법을 수행하게 하는, 비일시적 컴퓨터 판독 가능 저장 매체.
KR1020237011788A 2020-09-23 2021-09-23 비디오 코딩을 위한 잔차 및 계수 코딩 KR20230062630A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063082452P 2020-09-23 2020-09-23
US63/082,452 2020-09-23
US202063085966P 2020-09-30 2020-09-30
US63/085,966 2020-09-30
PCT/US2021/051700 WO2022066869A1 (en) 2020-09-23 2021-09-23 Residual and coefficients coding for video coding

Publications (1)

Publication Number Publication Date
KR20230062630A true KR20230062630A (ko) 2023-05-09

Family

ID=80846906

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237011788A KR20230062630A (ko) 2020-09-23 2021-09-23 비디오 코딩을 위한 잔차 및 계수 코딩

Country Status (6)

Country Link
US (1) US20230291936A1 (ko)
EP (1) EP4205400A4 (ko)
KR (1) KR20230062630A (ko)
CN (2) CN116420353A (ko)
MX (1) MX2023003333A (ko)
WO (1) WO2022066869A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2022204998B2 (en) * 2021-01-04 2024-05-02 Beijing Dajia Internet Information Technology Co., Ltd. Residual and coefficients coding for video coding
AU2021440177A1 (en) * 2021-04-12 2023-10-26 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Coefficient encoding/decoding method, encoder, decoder, and computer storage medium
US11991395B2 (en) * 2021-09-29 2024-05-21 Tencent America LLC Techniques for constraint flag signaling for range extension with rice coding

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112014021436B1 (pt) * 2012-04-13 2023-03-07 Canon Kabushiki Kaisha Método e aparelho para codificar e decodificar um subconjunto de unidades de transformação de dados de vídeo codificados
US10021419B2 (en) * 2013-07-12 2018-07-10 Qualcomm Incorported Rice parameter initialization for coefficient level coding in video coding process
US10616604B2 (en) * 2015-09-01 2020-04-07 Qualcomm Incorporated Coefficient level coding in video coding
US10110931B2 (en) * 2016-04-27 2018-10-23 Aspeed Technology Inc. Variable length coding and decoding methods and devices for grouped pixels
WO2022108978A1 (en) * 2020-11-18 2022-05-27 Beijing Dajia Internet Information Technology Co., Ltd. Residual and coefficients coding for video coding

Also Published As

Publication number Publication date
US20230291936A1 (en) 2023-09-14
CN116668695B (zh) 2024-03-26
WO2022066869A1 (en) 2022-03-31
CN116668695A (zh) 2023-08-29
CN116420353A (zh) 2023-07-11
EP4205400A4 (en) 2024-01-17
EP4205400A1 (en) 2023-07-05
MX2023003333A (es) 2023-03-27

Similar Documents

Publication Publication Date Title
KR101910618B1 (ko) 영상 정보 부호화 및 복호화 방법
WO2020151753A1 (en) Method and apparatus of transform coefficient coding with tb-level constraint
KR20230062630A (ko) 비디오 코딩을 위한 잔차 및 계수 코딩
US20240040129A1 (en) Residual and coefficients coding for video coding
US20230291906A1 (en) Residual and coefficients coding for video coding
KR20230133891A (ko) 비디오 코딩을 위한 잔차 및 계수 코딩
KR20200060282A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
RU2820669C1 (ru) Кодирование коэффициентов и остатка для кодирования видео
KR20230174267A (ko) 비디오 코딩을 위한 잔차 및 계수 코딩
WO2022193394A1 (zh) 系数的编解码方法、编码器、解码器及计算机存储介质
WO2022217417A1 (zh) 编解码方法、编码器、解码器以及存储介质
KR20230162806A (ko) 비디오 코딩을 위한 잔차 및 계수 코딩
AU2022308668A1 (en) Sequence-level and slice-level syntax representation in video coding