KR20230156456A - 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터 - Google Patents

인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터 Download PDF

Info

Publication number
KR20230156456A
KR20230156456A KR1020237038381A KR20237038381A KR20230156456A KR 20230156456 A KR20230156456 A KR 20230156456A KR 1020237038381 A KR1020237038381 A KR 1020237038381A KR 20237038381 A KR20237038381 A KR 20237038381A KR 20230156456 A KR20230156456 A KR 20230156456A
Authority
KR
South Korea
Prior art keywords
subpartition
block
sample
current
subpartitions
Prior art date
Application number
KR1020237038381A
Other languages
English (en)
Inventor
뱌오 왕
아난드 메헤르 코트라
세미흐 에센리크
한 가오
장러 천
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20230156456A publication Critical patent/KR20230156456A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/66Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving data partitioning, i.e. separation of data into packets or partitions according to importance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Filtering Of Dispersed Particles In Gases (AREA)

Abstract

이미지 인코딩 및/또는 이미지 디코딩시 코딩 블록 내의 서브파티션 경계를 디블로킹하기 위한 디블로킹 방법이 제공된다. 현재 코딩 블록이 인트라 예측 모드로 코딩되고, 현재 코딩 블록은 제1 서브파티션과 제1 서브파티션에 인접한 제2 서브파티션을 포함하는 서브파티션으로 분할된다. 디블로킹 방법은, 제1 서브파티션 또는 제2 서브파티션의 폭이 4개의 샘플일 때, 또는 제1 서브파티션 또는 제2 서브파티션의 높이가 4개의 샘플일 때, 제1/제2 서브파티션에 대해 최대 필터 길이가 1이라고 결정하는 단계; 제1 또는 제2 서브파티션의 최대 하나의 샘플의 값을 변경하는 단계 - 최대 하나의 샘플은 제1 서브파티션과 제2 서브파티션 사이의 서브파티션 경계에 수직이면서 인접한 제1 서브파티션 또는 제2 서브파티션의 행 또는 열로부터 획득됨 -를 포함한다. 본 개시는 서브파티션 경계에서 적은 수의 샘플 값을 변경할 수 있게 하고, 따라서 디블로킹 방법은 인트라 서브파티션(ISP) 툴이 적용된 현재 코딩 블록 내의 서브파티션 경계로 인한 블록 아티팩트를 감소시킬 수 있다.

Description

인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터{Deblocking filter for sub-partition boundaries caused by intra sub-partition coding tool}
이 특허 출원은 2019년 1월 10일에 출원된 미국 임시 특허 출원 번호 제62/791,003호에 대해 우선권을 주장하는 바이다. 전술한 특허 출원의 개시의 전체 내용이 원용에 의해 본 명세서에 포함된다.
본 개시의 실시예는 일반적으로 픽처 처리 분야에 관한 것으로, 상세하게는 인트라 서브파티션(intra sub-partition, ISP) 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터에 관한 것이다.
비디오 코딩(비디오 인코딩 및 디코딩)이 광범위한 디지털 비디오 애플리케이션, 예컨대 브로드캐스트 디지털 TV, 인터넷과 모바일 네트워크를 통한 비디오 전송, 비디오 채팅과 같은 실시간 대화형 애플리케이션, 화상 회의, DVD와 블루레이 디스크, 비디오 콘텐츠 획득 및 편집 시스템, 및 보안 애플리케이션의 캠코더에 사용된다.
심지어 상대적으로 짧은 비디오를 묘사하는 데 필요한 비디오 데이터의 양이 상당할 수 있으며, 이로 인해 데이터가 스트리밍되거나 또는 아니면 대역폭 용량이 제한된 통신 네트워크를 통해 전달될 때 어려움이 초래될 수 있다. 따라서, 현대의 통신 네트워크를 통해 전달되기 전에 일반적으로 비디오 데이터가 압축된다. 메모리 자원이 제한될 수 있기 때문에 비디오가 저장 장치에 저장될 때 비디오의 크기가 문제가 될 수도 있다. 비디오 압축 장치는 종종 소스에서 소프트웨어 및/또는 하드웨어를 이용하여 전송이나 저장 전에 비디오 데이터를 코딩함으로써, 디지털 비디오 이미지를 표현하는 데 필요한 데이터 양을 줄인다. 다음, 압축된 데이터는 비디오 데이터를 디코딩하는 비디오 압축 해제 장치에 의해 목적지에서 수신된다. 네트워크 자원이 제한되고 더 높은 비디오 품질에 대한 요구사항이 계속 늘어남에 따라, 화질을 거의 또는 전혀 희생하지 않고 압축률을 향상시키는 개선된 압축 및 압축 해제 기술이 바람직하다.
특히, 인트라 예측의 관점에서, 이미지 블록(변환 유닛(transform unit, TU), 예측 유닛(prediction unit, PU), 코딩 유닛(coding unit, CU) 등)이 복수의 서브파티션으로 분할되는 인트라 서브파티션(Intra Sub-Partition, ISP) 코딩 툴이 최근에 도입되었다. 하지만, 인트라 서브파티션(ISP)은 서브파티션 경계를 가로질러 샘플 값의 불연속을 초래함으로써, 시청자에 의해 인지될 수 있는 바람직하지 않은 경계 또는 에지 아티팩트(edge artifact)를 유발할 수 있다. 블록 기반의 이미지 코딩의 목표가 가시 임계값 이하로 에지 아티팩트를 줄이는 것이다. 이는 디블로킹 필터링(deblocking filtering)을 수행하여 달성된다. 이러한 디블로킹 필터링은 가시적 에지 아티팩트를 제거하기 위해 디코딩 측에서 수행되는 한편, 적어도 에지 아티팩트가 이미지에 인코딩되는 것을 방지하기 위해 인코딩 측에서도 수행된다.
따라서, 인트라 서브파티션 코딩 툴로 인한 블록 아티팩트의 효율적인 제거를 제공하는 향상된 인루프(in-loop) 디블로킹 필터 장치 및 방법이 필요하다.
전술한 과제를 고려하여, 본 출원의 실시예는 인트라 서브파티션 코딩 툴로 인한 블로킹 아티팩트를 완화하거나 또는 제거할 수 있는 디블로킹 필터 장치, 인코더, 디코더, 및 대응하는 방법을 제공하여 코딩 효율을 개선하는 것을 목표로 한다.
본 발명의 실시예가 독립항의 특징에 의해 정의되고, 이러한 실시예의 유리한 추가적 구현이 종속항의 특징에 의해 정의된다.
특정 실시예는 첨부된 독립항에 설명되어 있고, 다른 실시예는 종속항에 설명되어 있다.
전술한 목적과 다른 목적은 독립항의 주제에 의해 달성된다. 추가적인 구현 형태가 종속 청구항, 설명, 및 도면으로부터 명백하다.
본 개시의 제1 양태에 따르면, 이미지 인코딩 및/또는 이미지 디코딩시 코딩 블록 내의 서브파티션 경계를 디블로킹(deblock)하기 위한 디블로킹 방법이 제공된다. 여기서, 현재 코딩 블록이 인트라 예측 모드(intra prediction mode)로 코딩되고, 상기 현재 코딩 블록은 제1 서브파티션과 상기 제1 서브파티션에 인접한 제2 서브파티션을 포함하는 서브파티션(예컨대, 상기 제1 서브파티션의 좌측 블록이나 아래쪽 블록에 있는 상기 제2 서브파티션)으로 분할된다. 일 예에서, 상기 제2 서브파티션은 상기 제1 서브파티션에 기초하여 인트라 예측된다(즉, 상기 현재 코딩 블록은 인트라 서브파티션(Intra sub-partition, ISP) 툴을 이용하여 코딩되거나 또는 상기 서브파티션 경계는 인트라 서브파티션(ISP) 툴로 인한 것이고, 특히 상기 현재 코딩 블록은 상기 ISP 코딩 툴에 의해 서브파티션으로 분할되며, 내부의 상기 서브파티션은 "좌측에서 우측으로" 또는 "위에서 아래로"와 같이 하나씩 인트라 예측된다). 상기 디블로킹 방법은,
- 상기 제1 서브파티션의 폭이 4개의 샘플이거나 또는 상기 제2 서브파티션의 폭이 4개의 샘플일 때, 또는 상기 제1 서브파티션의 높이가 4개의 샘플이거나 또는 상기 제2 서브파티션의 높이가 4개의 샘플일 때, 상기 제1 서브파티션에 대해 제1 최대 필터 길이가 1이라고 결정하거나 및/또는 상기 제2 서브파티션에 대해 제2 최대 필터 길이가 1이라고 결정하는 단계;
- 상기 제1 서브파티션의 최대 하나의 샘플의 값을 변경(즉, 필터링)하는 단계 - 상기 최대 하나의 샘플은 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계에 수직이면서 인접한 상기 제1 서브파티션의 행 또는 열로부터 획득됨 -; 및/또는
- 상기 제2 서브파티션의 최대 하나의 샘플의 값을 변경(즉, 필터링)하는 단계 - 상기 최대 하나의 샘플은 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계에 수직이면서 인접한 상기 제2 서브파티션의 행 또는 열로부터 획득된다.
상기 제1 서브파티션에 대한 상기 제1 최대 필터 길이가, 상기 서브파티션 경계에 수직이면서 인접한 각각의 행 또는 열에서, 상기 제1 서브파티션에 대해 변경되도록 허용된 샘플의 최대 개수를 지칭할 수도 있다고 이해할 수 있을 것이다. 상기 제2 서브파티션에 대한 상기 제2 최대 필터 길이가, 상기 서브파티션 경계에 수직이면서 인접한 각각의 행 또는 열에서, 상기 제2 서브파티션에 대해 변경되도록 허용된 샘플의 최대 개수를 지칭할 수도 있다. 상기 특정 필터링 결정 단계에 따라, 일부 경우에 어떠한 샘플도 변경되지 않을 수 있거나, 또는 다른 경우에 상기 서브파티션 경계에 수직이면서 인접한 각각의 행 또는 열에서 단 하나의 샘플만이 변경될 수 있다고 이해할 수 있을 것이다.
본 발명은 수직 및 수평 서브파티션 경계 모두에 적용된다. 수직 서브파티션 경계에 대해, 상기 제1 서브파티션 또는 상기 제2 서브파티션의 폭이 4개의 샘플인지 여부가 확인된다. 수평 서브파티션 경계에 대해, 상기 제1 서브파티션 또는 상기 제2 서브파티션의 높이가 4개의 샘플인지 여부가 확인된다.
"블록", 또는 "코딩 블록", 또는 "이미지 블록"과 같은 용어가 본 개시에 사용되고, 이러한 용어가 예측 유닛(prediction unit, PU), 코딩 유닛(coding unit, CU) 등에 적용될 수 있다는 것을 유의해야 한다. VVC에서, 일반적으로, 변환 유닛과 코딩 유닛은 TU 타일링 또는 서브 블록 변환(sub block transform, SBT) 또는 ISP가 사용될 때 몇 가지 시나리오를 제외하고 대개 정렬된다. 본 개시에서, "블록/이미지 블록/코딩 블록"이라는 용어가 서로 교환될 수 있다고 이해할 수 있을 것이다. 본 개시에서, "샘플/픽셀"과 같은 용어가 서로 교환될 수 있다.
상기 인트라 서브파티션 코딩 툴은 인트라 예측 블록(즉, 인트라 예측 모드로 코딩되는 현재 코딩 블록의 약어인 인트라 코딩 블록)을 서브파티션으로 분할하고, 내부의 상기 서브파티션을 하나씩 예측한다. 상기 서브파티션 경계에 걸쳐 불연속이 존재할 수 있다. 이러한 서브파티션 경계로 인한 아티팩트(artifact)를 감소시키기 위해, 상기 제1 서브파티션 또는 상기 제2 서브파티션의 높이가 4개의 샘플일 때 또는 상기 제1 서브파티션 또는 상기 제2 서브파티션의 폭이 4개의 샘플일 때, 상기 제1 또는 제2 서브파티션에서 최대 하나의 샘플의 필터링이 수행되는 향상된 필터링 과정이 제안된다. 이를 통해 상기 파티션 경계에서 적은 수의 샘플 값을 수정할 수 있고, 따라서 상기 디블로킹 방법은 상기 ISP 적용으로 인해 상기 현재 코딩 블록 내의 서브파티션 경계로 인한 블록 아티팩트를 감소시킬 수 있다. 계산 부하 측면에서 약한 필터링이 유리하다.
제1 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수평이면, 상기 제1 서브파티션 또는 상기 제2 서브파티션의 높이가 4개의 샘플일 때, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 경계에 수직이면서 인접한 상기 제1 서브파티션 또는 상기 제2 서브파티션의 열로부터 획득되는 상기 최대 하나의 샘플이 변경된다. "상기 최대 하나의 샘플이 변경된다"가 최대 하나의 샘플이 변경되도록 허용된다는 것을 지칭한다고 이해할 수 있을 것이다. 즉, 상기 특정 필터링 결정 단계에 따라, 일부 경우에 어떠한 샘플도 변경되지 않을 수 있거나, 또는 다른 경우에 상기 서브파티션 경계에 수직이면서 인접한 각각의 열에서 단 하나의 샘플이 변경될 수 있다.
제1 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면 상기 제1 서브파티션 또는 상기 제2 서브파티션의 폭이 4개의 샘플일 때, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 경계에 수직이면서 인접한 상기 제1 서브파티션 또는 상기 제2 서브파티션의 행으로부터 획득되는 상기 최대 하나의 샘플이 변경된다. "상기 최대 하나의 샘플이 변경된다"가 최대 하나의 샘플이 변경되도록 허용된다는 것을 지칭할 수도 있다고 이해할 수 있을 것이다. 즉, 상기 특정 필터링 결정 단계에 따라, 일부 경우에 어떠한 샘플도 변경되지 않을 수 있거나, 또는 다른 경우에 상기 서브파티션 경계에 수직이면서 인접한 각각의 행에서 단 하나의 샘플만이 변경될 수 있다.
제1 양태 또는 제1 양태의 이전의 구현에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수평이면, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 수평 서브파티션 경계이고; 대안적으로, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 수직 서브파티션 경계이다.
제1 양태 또는 제1 양태의 이전의 구현에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면, 상기 제1 서브파티션은 상기 제2 서브파티션의 좌측에 있을 수 있고, 상기 제2 서브파티션은 상기 제1 서브파티션의 재구성된 값(예를 들어, 재구성된 버전)에 기초하여 인트라 예측될 수 있으며;
상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수평이면, 상기 제1 서브파티션은 상기 제2 서브파티션 위에 있을 수 있고, 상기 제2 서브파티션은 상기 제1 서브파티션의 재구성된 값(예를 들어, 재구성된 버전)에 기초하여 인트라 예측될 수 있다.
상기 제2 서브파티션이 상기 제1 서브파티션의 재구성된 버전(즉, 재구성된 값)에 기초하여 인트라 예측된다고 이해할 수 있을 것이다. 상기 재구성된 제1 서브파티션은 상기 제2 서브파티션의 인트라 예측을 위한 기준을 나타낸다. 상기 현재 코딩 블록이 속하는 현재 픽처가 재구성된 후에, 상기 재구성된 픽처가 상기 필터링 프로세스에 입력된다는 것을 유의해야 한다. 상기 현재 픽처의 재구성 중에, 상기 ISP 코딩 툴에 의해 적용되는 상기 현재 코딩 블록이 인트라 예측되어 상기 현재 코딩 블록의 예측 블록(예를 들어, 예측된 값)을 얻는다. 특히, 상기 현재 인트라 코딩 블록 내부의 상기 서브파티션이 하나씩 인트라 예측된다.
제1 양태 또는 제1 양태의 이전의 구현에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 서브파티션의 개수가 2개 또는 4개이다.
제1 양태 또는 제1 양태의 이전의 구현에 따른 디블로킹 방법의 가능한 구현 형태에서,
- 상기 현재 코딩 블록의 폭이 4이고 상기 코딩 블록의 높이가 8이면 및/또는 상기 현재 코딩 블록의 폭이 8이고 상기 현재 코딩 블록의 높이가 4이면, 상기 서브파티션의 개수가 2개이고,
- 그렇지 않으면, 상기 서브파티션의 개수가 4개이다.
제1 양태 또는 제1 양태의 이전의 구현에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 n×n 샘플 그리드와 중첩되지 않더라도, 상기 제1 서브파티션 또는 상기 제2 서브파티션 내의 상기 최대 하나의 샘플이 변경되고, n은 정수이다.
n×n 그리드와 정렬되지 않지만 ISP에 의해 야기되고 코딩 블록의 서브파티션들 사이의 내부 경계인 타깃 경계를 디블로킹하는 것이 허용된다.
제1 양태 또는 제1 양태의 이전의 구현에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 n×n 샘플 그리드와 중첩하지 않는 경우에만, 상기 제1 서브파티션 또는 상기 제2 서브파티션 내의 상기 최대 하나의 샘플이 변경되고, n은 정수이다. 예를 들어, n=4이거나 또는 n=8이다. 따라서, 상기 계산 부하가 심지어 더 낮아질 수 있다.
또한, 상기 서브파티션 모두의 높이가 4개의 샘플인 경우이거나 또는 상기 서브파티션 모두의 폭이 4개의 샘플인 경우에만, 상기 서브파티션 내의 최대 하나의 샘플의 필터링이 수행될 수 있다. 따라서, 상기 전체 코딩 과정의 계산 부하가 더 낮아질 수 있다.
일반적으로, 상기 서브파티션은 직사각형 변환 블록 서브파티션일 수 있다.
제1 양태 또는 제1 양태의 이전의 구현에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 서브파티션의 샘플이 루마 샘플(luma sample)이거나, 또는 상기 서브파티션의 샘플이 크로마 샘플(chroma sample)이다.
제1 양태 또는 제1 양태의 이전의 구현에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면, 상기 서브파티션을 인트라 예측하는 순서가 "좌측에서 우측으로"이거나, 또는 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수평이면, 상기 서브파티션을 인트라 예측하는 순서가 "위에서 아래로"이다. 즉, 상기 예측 블록을 상기 서브파티션으로 분할하는 것이 수직 방향으로 수행될 수 있다. 이 경우, 상기 서브파티션을 인트라 예측하는 순서가 "좌측에서 우측으로 하나씩"이다. 대안적으로, 상기 예측 블록을 상기 서브파티션으로 분할하는 것이 수평 방향으로 수행될 수 있다. 이 경우, 상기 2개의 서브파티션을 인트라 예측하는 순서가 "위에서 아래로 하나씩"이다.
본 개시에서, 상기 현재 코딩 블록은 인트라 서브파티션(ISP) 툴을 이용하여 코딩되거나 또는 상기 서브파티션 경계는 인트라 서브파티션(ISP) 툴에 의해 생성된다.
일반적으로, 상기 코딩 블록의 서브파티션들 사이의 모든 경계의 경계 강도(boundary strength)가, 상기 필터링 프로세스의 강도를 나타내는 상수 값(예를 들어, 2)으로 설정되어 전반적인 처리를 단순화할 수 있다.
또한, 전술한 실시예에서, 상기 디블로킹 방법은, 2개의 인접한 서브파티션에 대응하는 코딩된 블록 플래그(coded block flag, CBF) 값을 획득하고, 상기 2개의 인접한 서브파티션에 대응하는 상기 CBF 값에 따라 상기 현재 블록의 2개의 인접한 서브파티션들 사이의 경계의 경계 강도를 결정하는 단계; 및
필터링이 수행되는지 여부 또는 상기 결정된 경계 강도에 따라 상기 필터링 결정을 수행하는 단계를 포함할 수 있다. 2개의 인접한 서브파티션에 대응하는 상기 CBF 값 중 적어도 하나가 0이 아닐 수 있다. 여기서, 0은 그 서브파티션의 양자화 이후 잔차 데이터가 없다는 것을 의미한다.
본 개시의 제2 양태에 따르면, 이미지 인코딩 및/또는 이미지 디코딩시 이미지 블록 사이의 블록 에지(block edge)를 디블로킹하기 위한 디블로킹 방법이 제공된다. 여기서, 상기 블록 에지는 현재 코딩 블록(즉, 현재 인트라 코딩 블록)의 현재 서브파티션과 상기 현재 코딩 블록의 이웃 블록 사이의 에지를 포함하고, 상기 현재 코딩 블록은 인트라 예측 모드로 코딩되며, 상기 현재 코딩 블록은 서브파티션으로 분할된다(또는 상기 현재 코딩 블록은 인트라 서브파티션(ISP) 툴을 이용하여 코딩되거나 또는 인트라 서브파티션(ISP) 툴로 인한 서브파티션이다). 상기 디블로킹 방법은,
- 상기 현재 서브파티션의 폭이 4개의 샘플이거나 또는 상기 현재 서브파티션의 높이가 4개의 샘플일 때, 상기 현재 서브파티션에 대해 제3 최대 필터 길이가 1이라고 결정하거나 및/또는 상기 이웃 블록에 대해 제4 최대 필터 길이가 1이라고 결정하는 단계;
- 상기 현재 서브파티션의 최대 하나의 샘플의 값을 변경하는 단계 - 상기 최대 하나의 샘플은 상기 현재 서브파티션과 상기 이웃 블록 사이의 상기 에지에 수직이면서 인접한 상기 현재 서브파티션의 행 또는 열로부터 획득됨 -; 및/또는
- 상기 이웃 블록의 최대 하나의 샘플의 값을 변경하는 단계 - 상기 최대 하나의 샘플은 상기 현재 서브파티션과 상기 이웃 블록 사이의 상기 에지에 수직이면서 인접한 상기 이웃 블록의 행 또는 열로부터 획득됨 -를 포함한다.
상기 서브파티션의 개수가 2개이면, 상기 현재 서브파티션이 제1 양태에 따른 상기 제1 서브파티션 또는 상기 제2 서브파티션일 수 있다는 것을 유의해야 한다. 상기 서브파티션의 개수가 2개, 예컨대 4개일 때, 상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 상기 현재 서브파티션은 상기 현재 코딩 블록 내의 가장 왼쪽의 서브파티션이거나 또는 가장 오른쪽의 서브파티션일 수 있거나, 또는 상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수평이면, 상기 현재 서브파티션은 상기 현재 코딩 블록 내부에서 가장 높은 서브파티션 또는 가장 낮은 서브파티션일 수 있다.
본 개시의 제2 양태에서, 상기 현재 서브파티션은 상단 또는 좌측으로부터 인접한 상기 이웃 블록에 기초하여 인트라 예측된다. 상기 이웃 블록이 추가적인 파티션을 가진 코딩 블록이 아닐 수 있다는 것, 즉 아마도 상기 이웃 블록의 서브파티션이 없을 것이라는 점을 유의해야 한다.
상기 현재 서브파티션에 대한 상기 제3 최대 필터 길이가 상기 에지에 수직이면서 인접한 각각의 행 또는 열에서, 상기 현재 서브파티션에 대해 변경되도록 허용된 샘플의 최대 개수를 지칭한다고 이해할 수 있을 것이다. 상기 이웃 블록에 대한 제4 최대 필터 길이가 상기 에지에 수직이면서 인접한 각각의 행 또는 열에서, 상기 이웃 블록에 대해 변경되도록 허용된 샘플의 최대 개수를 지칭할 수도 있다. 상기 특정 필터링 결정 단계에 따라, 일부 경우에 어떠한 샘플도 변경되지 않을 수 있거나, 또는 다른 경우에 상기 서브파티션 경계에 수직이면서 인접한 각각의 행 또는 열에서 단 하나의 샘플만이 변경될 수 있다고 이해할 수 있을 것이다.
본 발명은 상기 현재 서브파티션과 상기 이웃 블록 사이의 수직 및 수평 에지 모두에 대해 유효하다. 수직 에지에 대해, 상기 폭이 4개의 샘플인지 여부에 따라 상기 현재 서브파티션 또는 상기 이웃 블록의 폭이 검사된다. 수평 가장자리에 대해, 상기 현재 서브파티션 또는 이웃 블록의 높이는 상기 높이가 4개의 샘플인지 여부에 따라 검사된다.
추가적인 설명에는 블록 에지와 서브파티션 경계의 차이점이 설명되어 있다. 서브파티션 경계가 인트라 서브파티션(ISP) 코딩 툴을 이용하는 코딩 블록의 내부에 있는 에지이고, 블록 에지(즉, 코딩 유닛(CU) 에지 또는 코딩 블록 에지 또는 CU 경계)가 2개의 코딩 유닛 또는 2개의 코딩 블록 사이에 공유되는 에지이다.
상기 인트라 서브파티션 코딩 툴은 인트라 예측 블록(즉, 인트라 예측 모드로 코딩되는 현재 코딩 블록에 대한 약어인 인트라 코딩 블록)을 서브파티션으로 분할하고, 상기 인트라 예측 블록 내부의 상기 서브파티션을 하나씩 예측한다. 상기 현재 코딩 블록의 현재 서브파티션과 상기 현재 코딩 블록의 이웃 블록 사이의 상기 에지에 걸쳐 불연속이 존재할 수도 있다. 따라서, 이러한 에지로 인한 상기 아티팩트를 줄이기 위한 향상된 필터링 프로세스가 제안된다. 이 필터링 프로세스에서, 상기 현재 서브파티션의 높이가 4개의 샘플이거나 또는 상기 현재 서브파티션의 폭이 4개의 샘플일 때, 현재 서브파티션 또는 상기 이웃 블록 내의 최대 하나의 샘플이 필터링된다. 이를 통해 상기 에지에서 작은 개수의 샘플 값을 변경할 수 있으므로, 상기 디블로킹 방법은, 상기 에지와 서브파티션 경계 사이의 필터링 중첩을 어느 정도까지 방지하면서 상기 ISP가 적용된 상기 현재 블록과 상기 이웃 블록 사이의 상기 에지에 의해 야기될 수 있는 블록 아티팩트를 감소시킬 수 있다.
제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서,
상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수평이면, 상기 현재 서브파티션의 높이가 4개의 샘플일 때, 상기 현재 서브파티션과 상기 현재 서브파티션 아래 또는 위에 있는 상기 이웃 블록 사이의 상기 에지에 수직이면서 인접한 상기 현재 서브파티션의 열로부터 획득된 상기 최대 하나의 샘플이 변경된다. "상기 최대 하나의 샘플이 변경된다"가 최대 하나의 샘플이 변경되도록 허용된다는 것을 지칭할 수도 있다고 이해할 수 있을 것이다. 즉, 상기 특정 필터링 결정 단계에 따라, 일부 경우에 어떠한 샘플도 변경되지 않을 수 있거나, 또는 다른 경우에 상기 에지에 수직이면서 인접한 각각의 열에서 단 하나의 샘플만이 변경될 수 있다.
제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서,
상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 상기 현재 서브파티션의 폭이 4개의 샘플일 때, 상기 현재 서브파티션과 상기 현재 서브파티션 좌측 또는 우측에 있는 상기 이웃 블록 사이의 상기 에지에 수직이면서 인접한 상기 현재 서브파티션의 행으로부터 획득된 상기 최대 하나의 샘플이 변경된다. "상기 최대 하나의 샘플이 변경된다"가 최대 하나의 샘플이 변경되도록 허용된다는 것을 지칭할 수도 있다고 이해할 수 있을 것이다. 즉, 상기 특정 필터링 결정 단계에 따라, 일부 경우에 어떠한 샘플도 변경되지 않을 수 있거나, 또는 다른 경우에 상기 에지에 수직이면서 인접한 각각의 행에서 단 하나의 샘플만이 변경될 수 있다.
제2 양태의 이전의 구현 또는 제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면, 상기 현재 서브파티션은 상기 이웃 블록 우측에 있고, 상기 현재 서브파티션은 상기 이웃 블록의 재구성된 값에 기초하여 인트라 예측되며;
상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수평이면, 상기 현재 서브파티션은 상기 이웃 블록의 아래에 있고, 상기 현재 서브파티션은 상기 이웃 블록의 재구성된 값에 기초하여 인트라 예측된다.
상기 현재 서브파티션은 상기 코딩 블록에 인접하게 위치하는 다른 코딩 블록에 기초하여 인트라 예측될 수 있다. 이 다른 코딩 블록은 상기 코딩 블록 위에 또는 상기 코딩 블록의 좌측에 있을 수 있다. 더 정확하게는, 상기 현재 서브파티션은 상기 이웃하는 코딩 블록의 재구성된 버전에 기초하여 인트라 예측될 수 있다.
제2 양태의 이전의 구현 또는 제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 서브파티션의 개수가 2개 또는 4개이다.
제2 양태의 이전의 구현 또는 제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서,
- 상기 현재 코딩 블록의 폭이 4이고 상기 코딩 블록의 높이가 8이면 및/또는 상기 현재 코딩 블록의 폭이 8이고 상기 현재 코딩 블록의 높이가 4이면, 상기 서브파티션의 개수가 2개이고,
- 그렇지 않으면, 상기 서브파티션의 개수가 4개이다.
제2 양태의 이전의 구현 또는 제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 서브파티션과 상기 이웃 블록 사이의 상기 에지가 n×n 샘플 그리드와 중첩되지 않더라도, 상기 현재 서브파티션 또는 상기 이웃 블록 내의 상기 최대 하나의 샘플이 변경되고, n은 정수이다. 예를 들어, n = 4이거나 또는 n = 8이다.
제2 양태의 이전의 구현 또는 제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 서브파티션과 상기 이웃 블록 사이의 상기 에지가 n×n 샘플 그리드와 중첩하는 경우에만, 상기 현재 서브파티션 또는 상기 이웃 블록 내의 상기 최대 하나의 샘플이 변경되고, n은 정수이다. 예를 들어, n = 4이거나 또는 n = 8이다.
제2 양태의 이전의 구현 또는 제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 서브파티션의 샘플이 루마 샘플이거나, 또는 상기 서브파티션의 샘플이 크로마 샘플이다.
제2 양태의 이전의 구현 또는 제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 서브파티션은 직사각형 변환 블록 서브파티션이다.
제2 양태의 이전의 구현 또는 제2 양태에 따른 디블로킹 방법의 가능한 구현 형태에서, 상기 현재 코딩 블록은 인트라 서브파티션(ISP) 툴을 이용하여 코딩된다.
본 개시의 제3 양태에 따르면, 코딩 블록 내의 서브파티션 경계를 디블로킹 하기 위해 이미지 인코더 및/또는 이미지 디코더에 사용되는 장치가 제공된다. 여기서, 상기 현재 코딩 블록은 인트라 예측 모드로 코딩되고, 상기 현재 코딩 블록은 제1 서브파티션과 상기 제1 서브파티션에 인접한 제2 서브파티션을 포함하는 서브파티션으로 분할되며, 상기 제2 서브파티션은 상기 제1 서브파티션에 기초하여 인트라 예측되고;
상기 장치는 디블로킹 필터를 포함하고, 상기 디블로킹 필터는,
- 상기 제1 서브파티션의 폭이 4개의 샘플이거나 또는 상기 제2 서브파티션의 폭이 4개의 샘플일 때, 또는 상기 제1 서브파티션의 높이가 4개의 샘플이거나 또는 상기 제2 서브파티션의 높이가 4개의 샘플일 때, 상기 제1 서브파티션에 대해 제1 최대 필터 길이가 1이라고 결정하거나 및/또는 상기 제2 서브파티션에 대해 제2 최대 필터 길이가 1이라고 결정하고;
- 상기 제1 서브파티션의 최대 하나의 샘플의 값을 변경하며 - 여기서, 상기 최대 하나의 샘플은 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계에 수직이면서 인접한 상기 제1 서브파티션의 행 또는 열로부터 획득됨 -; 및/또는
- 상기 제2 서브파티션의 최대 하나의 샘플의 값을 변경하도록 구성된다. 여기서, 상기 최대 하나의 샘플은 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계에 수직이면서 인접한 상기 제2 서브파티션의 행 또는 열로부터 획득된다.
본 개시의 제4 양태에 따르면, 이미지 블록들 사이의 블록 에지를 디블로킹하기 위해 이미지 인코더 및/또는 이미지 디코더에 사용되는 장치가 제공된다. 여기서, 상기 블록 에지는 현재 코딩 블록의 현재 서브파티션과 상기 현재 코딩 블록의 이웃 블록 사이의 에지를 포함하고, 상기 현재 코딩 블록은 인트라 예측 모드로 코딩되며, 상기 현재 코딩 블록은 서브파티션으로 분할되고;
상기 장치는 디블로킹 필터를 포함하고, 상기 디블로킹 필터는,
- 상기 현재 서브파티션의 폭이 4개의 샘플이거나 또는 상기 현재 서브파티션의 높이가 4개의 샘플일 때, 상기 현재 서브파티션에 대해 제3 최대 필터 길이가 1이라고 결정하거나 및/또는 상기 이웃 블록에 대해 제4 최대 필터 길이가 1이라고 결정하고;
- 상기 현재 서브파티션의 최대 하나의 샘플의 값을 변경하거나 - 여기서, 상기 최대 하나의 샘플은 상기 현재 서브파티션과 상기 이웃 블록 사이의 상기 에지에 수직이면서 인접한 상기 현재 서브파티션의 행 또는 열로부터 획득됨 -; 및/또는
- 상기 이웃 블록의 최대 하나의 샘플의 값을 변경하도록 구성된다. 여기서, 상기 최대 하나의 샘플은 상기 현재 서브파티션과 상기 이웃 블록 사이의 상기 에지에 수직이면서 인접한 상기 이웃 블록의 행 또는 열로부터 획득된다.
본 발명의 제1 양태에 따른 디블로킹 방법은 본 발명의 제3 양태에 따른 장치에 의해 수행될 수 있다. 본 발명의 제3 양태에 따른 장치의 추가적인 특징과 구현 형태가 본 발명의 제1 양태에 따른 디블로킹 방법의 특징과 구현 형태에 대응한다.
본 발명의 제2 양태에 따른 디블로킹 방법은 본 발명의 제4 양태에 따른 장치에 의해 수행될 수 있다. 본 발명의 제4 양태에 따른 장치의 추가적인 특징과 구현 형태가 본 발명의 제2 양태에 따른 디블로킹 방법의 특징과 구현 형태에 대응한다.
제5 양태에 따르면, 본 발명은 비디오 스트림을 디코딩하기 위한 장치에 관한 것으로, 프로세서와 메모리를 포함한다. 상기 메모리는 상기 프로세서로 하여금 제1 양태 또는 제2 양태에 따른 디블로킹 방법을 수행하게 하는 명령을 저장한다.
제6 양태에 따르면, 본 발명은 비디오 스트림을 인코딩하기 위한 장치에 관한 것으로, 프로세서와 메모리를 포함한다. 상기 메모리는 상기 프로세서로 하여금 제1 양태 또는 제2 양태에 따른 디블로킹 방법을 수행하게 하는 명령을 저장한다.
제7 양태에 따르면, 컴퓨터 판독가능 저장매체가 제안된다. 상기 컴퓨터 판독가능 저장매체는 실행될 때 하나 이상의 프로세서로 하여금 비디오 데이터를 코딩하게 하도록 구성된 명령이 저장되어 있다. 상기 명령은 상기 하나 이상의 프로세서로 하여금 제1 양태 또는 제2 양태 또는 제1 양태 또는 제2 양태의 가능한 실시예에 따른 디블로킹 방법을 수행하게 한다.
제8 양태에 따르면, 본 발명은 컴퓨터 프로그램에 관한 것으로, 상기 컴퓨터 프로그램은 컴퓨터 상에서 실행될 때 제1 양태 또는 제2 양태 또는 제1 양태 또는 제2 양태의 가능한 실시예에 따른 디블로킹 방법을 수행하기 위한 프로그램 코드를 포함한다.
제9 양태에 따르면, 본 발명은 인코더 또는 디코더에 관한 것으로, 상기 인코더 또는 디코더는 제1 양태 또는 제2 양태 또는 제1 양태 또는 제2 양태의 가능한 실시예에 따른 디블로킹 방법을 수행하기 위한 처리 회로를 포함한다.
본 발명의 제10 양태에 따르면, 비디오 인코딩 장치가 제공된다. 상기 비디오 인코딩 장치는 비디오 스트림의 픽처를 인코딩하고, 상기 비디오 인코딩 장치는,
상기 픽처를 재구성하도록 구성된 재구성 유닛 - 상기 픽처를 재구성하는 것은 상기 픽처에 속하는 현재 코딩 블록의 재구성된 블록을 생성하는 것을 포함하고, 상기 현재 코딩 블록은 인트라 예측 모드로 코딩되며, 상기 현재 코딩 블록은 제1 서브파티션과 제2 서브파티션을 포함하는 서브파티션으로 분할되고, 상기 제2 서브파티션은 상기 제1 서브파티션에 기초하여 인트라 예측됨 -; 및
상기 재구성된 픽처를 필터링된 재구성된 픽처로 처리하도록 구성된 필터링 유닛 - 상기 필터링 유닛은 구체적으로, 상기 현재 서브파티션에 인접한 상기 현재 서브파티션 또는 다른 서브파티션의 높이가 4개의 샘플일 때 또는 상기 현재 서브파티션에 인접한 상기 현재 서브파티션 또는 다른 서브파티션의 폭이 4개의 샘플일 때, 상기 재구성된 블록의 재구성된 서브파티션의 현재 서브파티션 내의 최대 하나의 샘플을 필터링하도록 구성되고, 상기 최대 하나의 샘플은 상기 현재 서브파티션과 상기 현재 서브파티션에 인접하게 위치하는 전술한 다른 서브파티션 사이의 경계에 수직인 상기 현재 서브파티션의 행 또는 열에 위치하며, 상기 하나의 샘플은 상기 경계에 인접하거나; 또는 상기 필터링 유닛은 구체적으로, 상기 현재 서브파티션에 대한 각각의 최대 필터 길이와 상기 이웃 블록에 대한 각각의 최대 필터 길이에 기초하여 상기 재구성된 블록의 현재 서브파티션과 상기 현재 서브파티션에 인접한 이웃 블록 사이의 경계를 필터링하도록 구성되고, 상기 현재 서브파티션의 높이가 4개의 샘플일 때 또는 상기 현재 서브파티션의 폭이 4개의 샘플일 때 상기 각각의 최대 필터 길이가 모두 1이다.
이를 통해 ISP 프레임 워크에서 재구성되는 픽처의 품질을 효율적으로 개선할 수 있다.
가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수평이면, 상기 제1 서브파티션 또는 상기 제2 서브파티션의 높이가 4개의 샘플일 때, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 경계에 수직이면서 인접한 상기 제1 서브파티션 또는 상기 제2 서브파티션의 열로부터 획득된 상기 최대 하나의 샘플이 변경된다. "상기 최대 하나의 샘플이 변경된다"가 최대 하나의 샘플이 변경되도록 허용된다는 것을 지칭할 수도 있다고 이해할 수 있을 것이다. 즉, 상기 특정 필터링 결정 단계에 따라, 일부 경우에 어떠한 샘플도 변경되지 않을 수 있거나, 또는 다른 경우에 상기 서브파티션 경계에 수직이면서 인접한 각각의 열에서 단 하나의 샘플이 변경될 수 있다.
가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 상기 제1 서브파티션 또는 상기 제2 서브파티션의 폭이 4개의 샘플일 때, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 경계에 수직이면서 인접한 상기 제1 서브파티션 또는 상기 제2 서브파티션의 행으로부터 획득된 상기 최대 하나의 샘플이 변경된다. "상기 최대 하나의 샘플이 변경된다"가 최대 하나의 샘플이 변경되도록 허용된다는 것을 지칭할 수도 있다고 이해할 수 있을 것이다. 즉, 상기 특정 필터링 결정 단계에 따라, 일부 경우에 어떠한 샘플도 변경되지 않을 수 있거나, 또는 다른 경우에 상기 서브파티션 경계에 수직이면서 인접한 각각의 행에서 단 하나의 샘플만이 변경될 수 있다. 가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수평이면, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 수평 서브파티션 경계이고; 대안적으로, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 수직 서브파티션 경계이다.
가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면, 상기 제1 서브파티션은 상기 제2 서브파티션의 좌측에 있을 수 있고, 상기 제2 서브파티션은 상기 제1 서브파티션의 재구성된 값에 기초하여 인트라 예측될 수 있으며;
상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수평이면, 상기 제1 서브파티션은 상기 제2 서브파티션 위에 있을 수 있고, 상기 제2 서브파티션은 상기 제1 서브파티션의 재구성된 값에 기초하여 인트라 예측될 수 있다.
상기 제2 서브파티션이 상기 제1 서브파티션의 재구성된 버전(즉, 재구성된 값)에 기초하여 인트라 예측된다고 이해할 수 있을 것이다. 상기 재구성된 제1 서브파티션은 상기 제2 서브파티션의 인트라 예측에 대한 기준을 나타낸다. 상기 현재 코딩 블록이 속하는 현재 픽처가 재구성된 후에, 상기 재구성된 픽처가 상기 필터링 프로세스에 입력된다는 것을 유의해야 한다. 상기 현재 픽처의 재구성 중에, 상기 ISP 코딩 툴에 의해 적용되는 상기 현재 코딩 블록이 인트라 예측되어 상기 현재 코딩 블록의 예측 블록(예를 들어, 예측된 값)을 얻는다. 특히, 상기 현재 인트라 코딩 블록 내부의 상기 서브파티션이 하나씩 인트라 예측된다.
가능한 구현 형태에서, 상기 서브파티션의 개수가 2개 또는 4개이다.
가능한 구현 형태에서,
- 상기 현재 코딩 블록의 폭이 4이고 상기 코딩 블록의 높이가 8이면 및/또는 상기 현재 코딩 블록의 폭이 8이고 상기 현재 코딩 블록의 높이가 4이면, 상기 서브파티션의 개수가 2개이다,
- 그렇지 않으면, 상기 서브파티션의 개수가 4개이다.
가능한 구현 형태에서, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 n×n 샘플 그리드와 중첩되지 않더라도, 상기 제1 서브파티션 또는 상기 제2 서브파티션 내의 상기 최대 하나의 샘플이 변경되고, n은 정수이다.
n×n 그리드와 정렬되지 않지만, ISP에 의해 야기되고 코딩 블록의 서브파티션들 사이의 내부 경계인 타깃 경계를 디블로킹하는 것이 허용된다.
가능한 구현 형태에서, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 n×n 샘플 그리드와 중첩하지 않는 경우에만, 상기 제1 서브파티션 또는 상기 제2 서브파티션 내의 상기 최대 하나의 샘플이 변경되고, n은 정수이다. 예를 들어, n = 4이거나 또는 n = 8이다. 따라서, 계산 부하가 더 낮아질 수 있다.
또한, 상기 서브파티션 내의 최대 하나의 샘플의 필터링은, 상기 서브파티션들 모두의 높이가 4개의 샘플일 때 또는 상기 서브파티션들 모두의 폭이 4개의 샘플일 때에만 수행될 수 있다. 이에 따라, 전체 코딩 프로세스의 계산 부하가 더 낮아질 수 있다.
일반적으로, 상기 서브파티션은 직사각형 변환 블록 서브파티션일 수 있다.
가능한 구현 형태에서, 상기 서브파티션의 샘플이 루마 샘플이거나, 또는 상기 서브파티션의 샘플이 크로마 샘플이다.
가능한 구현 형태에서, 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면 상기 서브파티션을 인트라 예측하는 순서가 "좌측에서 우측으로"이거나, 또는 상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수평이면, 상기 서브파티션을 인트라 예측하는 순서가 "위에서 아래로"이다. 즉, 상기 예측 블록을 상기 서브파티션으로 분할하는 것이 수직 방향으로 수행될 수 있다. 이 경우, 상기 서브파티션을 인트라 예측하는 순서가 "좌측에서 우측으로 하나씩"이다. 대안적으로, 상기 예측 블록을 상기 서브파티션으로 분할하는 것이 수평 방향으로 수행될 수 있다. 이 경우, 상기 2개의 서브파티션을 인트라 예측하는 순서가 "위에서 아래로 하나씩"이다.
본 개시에서, 상기 현재 코딩 블록은 인트라 서브파티션(ISP) 툴을 이용하여 코딩되거나 또는 상기 서브파티션 경계는 인트라 서브파티션(ISP) 툴에 의해 생성된다.
일반적으로, 상기 코딩 블록의 서브파티션들 사이의 모든 경계의 경계 강도가, 상기 필터링 프로세스의 강도를 나타내는 상수 값(예를 들어, 2)으로 설정되어 전반적인 처리를 단순화할 수 있다.
또한, 코딩된 블록 플래그(CBF) 값이 2개의 인접한 서브파티션에 대응하여 획득될 수 있고, 상기 현재 블록의 2개의 인접한 서브파티션들 사이의 경계의 경계 강도가 상기 2개의 인접한 서브파티션에 대응하는 상기 CBF 값에 따라 결정되며,
필터링이 수행되는지 여부에 대한 필터링 결정이 상기 결정된 경계 강도에 따라 수행될 수 있다. 2개의 인접한 서브파티션에 대응하는 상기 CBF 값 중 적어도 하나가 0이 아닐 수 있고, 0은 서브파티션의 양자화 이후 잔차 데이터가 없다는 것을 나타낸다.
본 발명의 제11 양태에 따르면, 비디오 디코딩 장치가 제공된다. 상기 비디오 디코딩 장치는 인코딩된 비디오 스트림의 픽처를 디코딩하기 위한 것이고, 상기 비디오 디코딩 장치는,
상기 픽처를 재구성하도록 구성된 재구성 유닛 - 상기 픽처의 재구성은 현재 픽처에 속한 현재 코딩 블록의 재구성된 블록을 생성하는 것을 포함하고, 상기 현재 코딩 블록은 인트라 예측 모드로 코딩되며, 상기 현재 코딩 블록은 제1 서브파티션과 제2 서브파티션을 포함하는 서브파티션으로 분할되고, 상기 제2 서브파티션은 상기 제1 서브파티션에 기초하여 인트라 예측됨 -; 및
상기 재구성된 픽처를 필터링된 재구성된 픽처로 처리하도록 구성된 필터링 유닛 - 상기 필터링 유닛은 구체적으로, 상기 현재 서브파티션에 인접한 상기 현재 서브파티션 또는 다른 서브파티션의 높이가 4개의 샘플일 때 또는 상기 현재 서브파티션에 인접한 상기 현재 서브파티션 또는 다른 서브파티션의 폭이 4개의 샘플일 때, 상기 재구성된 블록의 재구성된 서브파티션의 현재 서브파티션 내의 최대 하나의 샘플을 필터링하도록 구성되고, 상기 최대 하나의 샘플은 상기 현재 서브파티션과 상기 현재 서브파티션에 인접하게 위치하는 전술한 다른 서브파티션 사이의 경계에 수직인 상기 현재 서브파티션의 행 또는 열에 위치하며, 상기 하나의 샘플은 상기 경계에 인접하거나; 또는 상기 필터링 유닛은 구체적으로, 상기 현재 서브파티션에 대한 각각의 최대 필터 길이와 상기 이웃 블록에 대한 각각의 최대 필터 길이에 기초하여 상기 재구성된 블록의 현재 서브파티션과 상기 현재 서브파티션에 인접한 이웃 블록 사이의 경계를 필터링하도록 구성되고, 상기 현재 서브파티션의 높이가 4개의 샘플일 때 또는 상기 현재 서브파티션의 폭이 4개의 샘플일 때 상기 각각의 최대 필터 길이가 모두 1이다.
이를 통해 ISP 프레임 워크에서 재구성된 픽처의 품질을 효율적으로 개선할 수 있다.
또한, 인코더가 제공된다. 상기 인코더는 현재 픽처의 현재 코딩 블록을 인코딩하기 위한 수단을 포함하고, 상기 수단은 본 발명의 디블로킹 방법의 전술한 실시예 중 하나에 따라 상기 현재 코딩 블록의 재구성된 블록을 생성하기 위한 수단과 상기 현재 픽처의 재구성된 픽처를 필터링하기 위한 수단을 포함한다.
또한, 현재 픽처의 현재 코딩 블록을 디코딩하기 위한 수단을 포함하는 디코더가 제공된다. 여기서, 상기 수단은 본 발명의 디블로킹 방법의 전술한 실시예 중 하나에 따라 상기 현재 코딩 블록의 재구성된 블록을 생성하기 위한 수단과 상기 현재 픽처의 재구성된 픽처를 필터링하기 위한 수단을 포함한다.
하나 이상의 실시예의 세부사항은 첨부 도면과 아래의 설명에서 제공된다. 다른 특징, 목적, 및 이점은 설명, 도면, 및 청구 범위로부터 명백해질 것이다.
이하, 첨부 그림과 도면을 참조하여 본 발명의 실시예에 대해 더 상세하게 설명한다.
도 1a는 본 발명의 실시예를 구현하도록 구성된 비디오 코딩 시스템의 예를 나타낸 블록도이다.
도 1b는 본 발명의 실시예를 구현하도록 구성된 비디오 코딩 시스템의 다른 예를 나타낸 블록도이다.
도 2는 본 발명의 실시예를 구현하도록 구성된 비디오 인코더의 예를 나타낸 블록도이다.
도 3은 본 발명의 실시예를 구현하도록 구성된 비디오 디코더의 예시적인 구조를 도시한 블록도이다.
도 4는 인코딩 장치 또는 디코딩 장치의 예를 도시한 블록도이다.
도 5는 인코딩 장치 또는 디코딩 장치의 다른 예를 도시한 블록도이다.
도 6은 인트라 서브파티션(Intra sub-partition, ISP) 툴을 사용하는 코딩 단위(coding unit, CU) 내의 서브파티션 에지를 디블로킹하는 예를 도시한 블록도이다.
도 7은 인트라 서브파티션(ISP) 툴을 사용하는 CU 내의 서브파티션 에지를 디블로킹하는 다른 예를 도시한 블록도이다.
도 8은 8×8 샘플 그리드와 중첩하는 CU 내의 서브파티션 에지를 디블로킹하는 예를 도시한 블록도이다.
도 9는 4×4 샘플 그리드와 중첩하는 CU 내의 모든 서브파티션 에지를 디블로킹하는 예를 도시한 블록도이다.
도 10은 서브파티션 크기가 디블로킹 방향에 수직으로 8개의 샘플보다 작을 때 디블로킹 결정에 3개의 샘플만을 사용하고 하나의 샘플만을 변경하는 약한 필터가 사용되는 예를 도시한 블록도이다.
도 11은 디블로킹 필터링을 위한 예시적인 프로세스를 나타낸 흐름도이다.
도 12는 디블로킹 필터링을 위한 다른 예시적인 프로세스를 나타낸 흐름도이다.
도 13은 코딩 블록 내의 서브파티션 경계를 디블로킹하기 위한 장치를 개략적으로 도시한 도면이다.
도 14는 블록 에지를 디블로킹하기 위한 장치를 개략적으로 도시한 도면이다.
도 15는 디코딩 장치 또는 인코딩 장치에 구현된 코딩의 예시적인 프로세스를 나타낸 흐름도이다.
도 16은 디코딩 장치 또는 인코딩 장치에서 구현된 코딩의 다른 예시적인 프로세스를 나타낸 흐름도이다.
도 17은 비디오 코딩을 위한 장치를 개략적으로 나타낸 도면이다.
도 18은 비디오 코딩을 위한 장치를 개략적으로 나타낸 도면이다.
도 19는 콘텐츠 전달 서비스를 실현하는 콘텐츠 공급 시스템의 예시적인 구조를 도시한 블록도이다.
도 20은 단말 장치의 예의 구조를 도시한 블록도이다.
이하, 명시적으로 다르게 지정하지 않으면, 동일한 참조 부호가 동일하거나 또는 적어도 기능적으로 동등한 기능을 지칭한다.
다음의 설명에서, 본 개시의 일부를 형성하고, 예시로서 본 발명의 실시예의 특정 양태 또는 본 발명의 실시예가 사용될 수 있는 특정 양태을 나타내는 첨부 도면을 참조한다. 본 발명의 실시예는 다른 양태에서 사용될 수 있으며 도면에 도시되지 않은 구조적 또는 논리적 변경을 포함할 수 있다고 이해해야 한다. 따라서, 다음의 상세한 설명은 제한적인 의미로 받아들여서는 안 되며, 본 발명의 범위는 첨부된 청구 범위에 의해 정의된다.
예를 들어, 설명된 방법 및 관련 개시가 이 방법을 수행하도록 구성된 대응하는 장치나 시스템에 대해 참일 수도 있으며 그 반대의 경우도 마찬가지라고 이해해야 한다. 예를 들어, 하나 또는 복수의 특정 방법 단계가 설명되면, 비록 이러한 하나 이상의 유닛이 도면에 명시적으로 설명되거나 또는 도시되지 않았더라도, 대응하는 장치가 설명된 하나 또는 복수의 방법 단계(예를 들어, 하나 또는 복수의 단계를 수행하는 하나의 유닛, 또는 복수의 단계 중 하나 이상의 단계를 각각 수행하는 복수의 유닛)를 수행하기 위해 하나 또는 복수의 유닛, 예컨대 기능 유닛을 포함할 수 있다. 한편, 예를 들어, 특정 장치가 하나 또는 복수의 유닛, 예컨대 기능 유닛에 기초하여 설명되면, 비록 이러한 하나 또는 복수의 단계가 도면에 명시적으로 설명되거나 또는 도시되지 않았더라도, 대응하는 방법이 하나 또는 복수의 유닛의 기능을 수행하는 하나의 단계(예를 들어, 하나 또는 복수의 유닛의 기능을 수행하는 하나의 단계, 또는 각각 하나 이상의 기능을 수행하는 복수의 단계)를 포함할 수 있다. 또한, 본 명세서에 설명된 다양한 예시적인 실시예 및/또는 양태의 특징들이 특별히 달리 언급되지 않는 한 서로 결합될 수 있다고 이해해야 한다.
비디오 코딩이란 일반적으로 비디오 또는 비디오 시퀀스를 형성하는 픽처(picture)의 시퀀스를 처리하는 것을 말한다. "픽처"라는 용어 대신에, 비디오 코딩 분야에서는 "프레임" 또는 "이미지"라는 용어가 동의어로 사용될 수 있다. 비디오 코딩(또는 일반적으로 코딩)은 비디오 인코딩과 비디오 디코딩의 2개의 부분을 포함한다. 비디오 인코딩은 소스 측에서 수행되고, 통상적으로 (더 효율적인 저장 및/또는 전송을 위해) 비디오 픽처를 나타내는 데 필요한 데이터의 양을 (예를 들어, 압축에 의해) 줄이기 위해 원본 비디오 픽처를 처리하는 것을 포함한다. 비디오 디코딩은 목적지 측에서 수행되며, 통상적으로 비디오 픽처를 재구성하기 위해 인코더와 비교할 때 역처리를 포함한다. 비디오 픽처(또는 일반적으로 픽처)의 "코딩"을 언급하는 실시예가 비디오 픽처 또는 각각의 비디오 시퀀스의 "인코딩" 또는 "디코딩"에 관한 것이라고 이해해야 한다. 인코딩 파트와 디코딩 파트의 조합은 코덱(코딩 및 디코딩)이라고도 한다.
무손실 비디오 코딩의 경우, 원본 비디오 픽처가 재구성될 수 있다. 즉, 재구성된 비디오 픽처는 (저장 또는 전송 중에 전송 손실이나 기타 데이터 손실이 없다고 가정하면) 원본 비디오 픽처와 동일한 품질을 가지고 있다. 손실 비디오 코딩의 경우, 디코더에서 완전히 재구성될 수 없는, 비디오 픽처를 나타내는 데이터의 양을 줄이기 위해 예를 들어 양자화에 의한 추가 압축이 수행된다. 즉, 재구성된 비디오 픽처의 품질이 원본 비디오 픽처의 품질에 비해 낮거나 또는 나쁘다.
여러 비디오 코딩 표준은 "손실 하이브리드 비디오 코덱(lossy hybrid video codec)"의 그룹에 속한다(즉, 샘플 영역에서의 공간 및 시간 예측과 변환 영역에서의 양자화를 적용하기 위한 2D 변환 코딩을 결합한다). 비디오 시퀀스의 각각의 픽처는 통상적으로 중첩하지 않는 블록의 세트로 분할되고, 이 코딩은 일반적으로 블록 레벨에서 수행된다. 다시 말해, 인코더에서, 예를 들어 공간적(인트라 픽처) 예측 및/또는 시간적(인터 픽처) 예측을 사용하고, 현재 블록(현재 처리되는/처리될 블록)에서 예측 블록을 차감하여 잔차 블록(residual block)을 얻으며, 잔차 블록을 변환하고 변환 영역에서 잔차 블록을 양자화하여 전송될 데이터의 양을 줄임으로써 (압축) 비디오가 일반적으로 블록(비디오 블록) 레벨에서 처리되어, 즉 인코딩되어 예측 블록을 생성하고, 디코더에서, 표현을 위해 현재 블록을 재구성하기 위해, 인코더와 비교할 때 역처리가 인코딩되거나 압축된 블록에 적용된다. 또한, 인코더와 디코더가 모두 동일한 예측(예를 들어, 인트라 예측과 인터 예측) 및/또는 후속 블록을 처리하기 위한 재구성, 즉 코딩을 생성할 수 있도록, 인코더가 디코더 처리 루프를 복제한다.
비디오 코딩 시스템(10)의 다음 실시예에서, 도 1 내지 도 3에 기초하여 비디오 인코더(20)와 비디오 디코더(30)에 대해 설명한다.
도 1a는 예시적인 코딩 시스템(10), 예를 들어 본 출원의 기술을 사용할 수 있는 비디오 코딩 시스템(10)(또는 줄여서 코딩 시스템(10))을 개략적으로 도시한 블록도이다. 비디오 코딩 시스템(10)의 비디오 인코더(20)(또는 줄여서 인코더(20))와 비디오 디코더(30)(또는 줄여서 디코더(30))는 본 출원에서 설명된 다양한 예에 따라 기술을 수행하도록 구성될 수 있는 장치의 예를 나타낸다.
도 1a에 도시된 바와 같이, 코딩 시스템(10)은 인코딩된 픽처 데이터(13)를 디코딩하기 위해 인코딩된 픽처 데이터(21)를 예를 들어 목적지 장치(14)에 제공하도록 구성된 소스 장치(12)를 포함한다.
소스 장치(12)는 인코더(20)를 포함하고, 추가적으로, 즉 선택적으로, 픽처 소스(16), 전처리기(pre-processor, 18)(또는 전처리 유닛), 예컨대 픽처 전처리기(18), 및 통신 인터페이스 또는 통신 유닛(22)을 포함한다.
픽처 소스(16)은 어떤 종류의 픽처 캡처링 장치, 예컨대 현실 세계 픽처를 캡처링하기 위한 카메라, 및/또는 어떤 종류의 픽처 생성 장치, 예컨대 컴퓨터 애니메이션 픽처를 생성하기 위한 컴퓨터 그래픽 프로세서, 또는 현실 세계 픽처를 획득하거나 및/또는 제공하기 위한 어떤 종류의 다른 장치, 컴퓨터 생성 픽처(예를 들어, 스크린 콘텐츠, 가상 현실(virtual reality, VR) 픽처), 및/또는 이들의 어떤 조합(예를 들어, 증강 현실(augmented reality, AR) 픽처)일 수 있거나 또는 이들을 포함할 수 있다. 픽처 소스는 전술한 픽처 중 어떤 것도 저장하는 어떤 종류의 메모리이거나 또는 스토리지일 수 있다.
전처리기(18)와 전처리 유닛(18)에 의해 수행되는 처리와 구별하여, 픽처 또는 픽처 데이터(17)는 원시 픽처(raw picture) 또는 원시 픽처 데이터(17)로 지칭될 수 있다.
전처리기(18)는 전처리된 픽처(19) 또는 전처리된 픽처 데이터(19)를 얻기 위해 (원시) 픽처 데이터(17)를 수신하고 픽처 데이터(17)에 대해 전처리를 수행하도록 구성된다. 전처리기(18)에 의해 수행되는 전처리는, 예를 들어 트리밍(trimming), 컬러 포맷 변환(예를 들어, RGB에서 YCbCr로), 컬러 보정, 또는 노이즈 제거를 포함할 수 있다. 전처리 유닛(18)이 선택적인 구성 요소일 수 있다고 이해할 수 있을 것이다.
비디오 인코더(20)는 전처리된 픽처 데이터(19)를 수신하고 인코딩된 픽처 데이터(21)를 제공하도록 구성된다(이하, 추가적인 세부사항에 대해 예를 들어 도 2에 기초하여 설명할 것이다).
소스 장치(12)의 통신 인터페이스(22)는 인코딩된 픽처 데이터(21)를 수신하고 인코딩된 픽처 데이터(21)(또는 이러한 픽처 데이터의 추가로 처리된 어떤 버전)를 통신 채널(13)을 통해 다른 장치, 예를 들어 저장 또는 직접 재구성을 위해 목적지 장치(14) 또는 어떤 다른 장치에 송신하도록 구성될 수 있다.
목적지 장치(14)는 디코더(30)(예를 들어, 비디오 디코더(30))를 포함하고, 추가적으로, 즉 선택적으로, 통신 인터페이스 또는 통신 유닛(28), 후처리기(post-processor, 32)(또는 후처리 유닛(32)), 및 표시 장치(34)를 포함할 수 있다. .
목적지 장치(14)의 통신 인터페이스(28)는 예를 들어 소스 장치(12)로부터 직접 또는 어떤 다른 소스, 예컨대 저장 장치, 예컨대 인코딩된 픽처 데이터 저장 장치로부터 인코딩된 픽처 데이터(21)(또는 이러한 픽처 데이터의 추가로 처리된 어떤 버전)을 수신하고, 인코딩된 픽처 데이터(21)를 디코더(30)에 제공하도록 구성된다.
통신 인터페이스(22)와 통신 인터페이스(28)는 소스 장치(12)와 목적지 장치(14) 사이의 직접 통신 링크, 예컨대 직접 유선 또는 무선 연결을 통해, 또는 어떤 종류의 네트워크, 예를 들어 유선이나 무선 네트워크 또는 이들의 어떤 조합, 또는 어떤 종류의 사설 및 공용 네트워크, 또는 어떤 종류의 이들의 조합을 통해 인코딩된 픽처 데이터(21) 또는 인코딩된 데이터(13)를 송신하거나 수신하도록 구성될 수 있다.
통신 인터페이스(22)는 예를 들어, 인코딩된 픽처 데이터(21)를 적절한 포맷으로, 예를 들어 패킷으로 패키징하거나, 및/또는 통신 링크 또는 통신 네트워크를 통한 전송을 위해 어떤 종류의 전송 인코딩 또는 처리를 이용하여, 인코딩된 픽처 데이터를 처리한다.
통신 인터페이스(22)의 상대인 통신 인터페이스(28)는, 예를 들어 어떤 종류의 대응하는 전송 디코딩 또는 처리 및/또는 디패키징을 이용하여, 전송된 데이터를 수신하고 전송 데이터를 처리함으로써 인코딩된 픽처 데이터(21)를 획득하도록 구성될 수 있다.
통신 인터페이스(22)와 통신 인터페이스(28)는 모두 소스 장치(12)에서 목적지 장치(14)를 가리키는 도 1a의 통신 채널(13)에 대한 화살표로 나타낸 단방향 통신 인터페이스, 또는 양방향 통신 인터페이스로서 구성될 수 있고, 예를 들어 메시지를 송수신하도록, 예를 들어 연결을 셋업하여 통신 링크 및/또는 데이터 전송, 예를 들어 인코딩된 픽처 데이터 전송과 관련된 어떤 다른 정보를 수신 확인(acknowledge)하고 교환하도록 구성될 수 있다.
디코더(30)는 인코딩된 픽처 데이터(21)를 수신하고 디코딩된 픽처 데이터(31) 또는 디코딩된 픽처(31)를 제공하도록 구성된다(이하, 추가적인 세부사항에 대해 예를 들어 도 3 또는 도 5에 기초하여 설명할 것이다).
후처리된 픽처 데이터(33), 예를 들어 후처리된 픽처(33)를 얻기 위해, 목적지 장치(14)의 후처리기(32)는 디코딩된 픽처 데이터(31)(재구성된 픽처 데이터라고도 함), 예를 들어 디코딩된 픽처(31)를 후처리하도록 구성된다. 후처리 유닛(32)에 의해 수행되는 후처리는, 예를 들어 표시, 예를 들어 표시 장치(34)에 의한 표시를 위해 디코딩된 픽처 데이터(31)를 준비하기 위해, 예컨대 컬러 포맷 변환(예를 들어, YCbCr에서 RGB로), 컬러 보정, 트리밍, 또는 재샘플링, 또는 어떤 다른 처리를 포함할 수 있다.
예컨대 사용자 또는 시청자에게 픽처를 표시하기 위해, 목적지 장치(14)의 표시 장치(34)는 후처리된 픽처 데이터(33)를 수신하도록 구성된다. 표시 장치(34)는 재구성된 픽처를 표현하기 위한 어떤 종류의 디스플레이, 예컨대 통합 디스플레이 또는 외부 디스플레이 또는 모니터일 수 있거나 또는 이들을 포함한다. 디스플레이는 예를 들어 액정 디스플레이(liquid crystal display, LCD), 유기 발광 다이오드(organic light emitting diode, OLED) 디스플레이, 플라즈마 디스플레이, 프로젝터, 마이크로 LED 디스플레이, 실리콘 액정표시장치(crystal on silicon, LCoS), 디지털 광 프로세서(digital light processor, DLP), 또는 어떤 종류의 기타 디스플레이를 포함할 수 있다.
도 1a가 소스 장치(12)와 목적지 장치(14)를 별도의 장치로서 도시하고 있지만, 장치의 실시예가 이러한 장치 모두 또는 양쪽의 기능, 소스 장치(12) 또는 대응하는 기능 그리고 목적지 장치(14) 또는 대응하는 기능을 포함할 수도 있다. 이러한 실시예에서, 소스 장치(12) 또는 대응하는 기능 그리고 목적지 장치(14) 또는 대응하는 기능은 동일한 하드웨어 및/또는 소프트웨어를 이용하여 또는 별도의 하드웨어 및/또는 소프트웨어 또는 이들의 어떤 조합에 의해 구현될 수 있다.
이 설명에 기초하여 당업자에게 명백한 바와 같이, 도 1a에 도시된 소스 장치(12) 및/또는 목적지 장치(14) 내의 서로 다른 유닛들 또는 기능의 존재와 (정확한) 분할이 실제 장치와 적용에 따라 달라질 수 있다.
인코더(20)(예를 들어, 비디오 인코더(20)) 또는 디코더(30)(예를 들어, 비디오 디코더(30)) 또는 인코더(20)와 디코더(30)는 모두 도 1b에 도시된 바와 같이 처리 회로, 하나 이상의 마이크로프로세서, 디지털 신호 프로세서(digital signal processor, DSP), 주문형 반도체(application-specific integrated circuit, ASIC), 필드 프로그램머블 게이트 어레이(field-programmable gate array, FPGA), 디스크리트 로직(discrete logic), 하드웨어, 비디오 코딩 전용, 또는 이들의 어떤 조합을 통해 구현될 수 있다. 인코더(20)는 본 명세서에 설명된 도 2의 인코더(20) 및/또는 어떤 다른 인코더 시스템 또는 서브시스템에 관해 논의한 바와 같이 처리 회로(46)를 통해 구현되어 다양한 모듈을 구현할 수 있다. 디코더(30)는 본 명세서에서 설명된 도 3의 디코더(30) 및/또는 어떤 다른 인코더 시스템 또는 서브시스템에 관해 논의한 바와 같이 처리 회로(46)를 통해 구현되어 다양한 모듈을 구현할 수 있다. 처리 회로는 이후에 논의되는 다양한 연산을 수행하도록 구성될 수 있다. 도 5에 도시된 바와 같이, 이 기술이 소프트웨어로 부분적으로 구현되면, 장치가 적절한 비일시적 컴퓨터 판독가능 저장매체에 소프트웨어용 명령을 저장할 수 있고, 하나 이상의 프로세서를 이용하여 하드웨어 내의 명령을 실행하여 본 개시의 기술을 수행할 수 있다. 비디오 인코더(20)와 비디오 디코더(30) 중 하나가 예를 들어 도 1b에 도시된 바와 같이 단일 장치 내의 결합된 인코더/디코더(CODEC)의 일부로서 통합되어 있을 수 있다.
소스 장치(12)와 목적지 장치(14)는 어떤 종류의 휴대용 또는 고정형 장치, 예컨대 노트북이나 랩톱 컴퓨터, 휴대폰, 스마트폰, 태블릿이나 태블릿 컴퓨터, 카메라, 데스크탑 컴퓨터, 셋톱 박스, 텔레비전, 표시 장치, 디지털 미디어 플레이어, 비디오 게이밍 콘솔, 비디오 스트리밍 장치(콘텐츠 서비스 서버 또는 콘텐츠 분배 서버 등), 브로드캐스트 수신기 장치, 또는 브로드캐스트 송신기 장치 등을 포함하는 광범위한 장치 중 어떤 것을 포함할 수 있거나, 또는 어떤 종류의 운영체체도 사용하거나 또는 사용하지 않을 수 있다. 경우에 따라, 소스 장치(12)와 목적지 장치(14)는 무선 통신용으로 장착될 수 있다. 따라서, 소스 장치(12)와 목적지 장치(14)는 무선 통신 장치일 수 있다.
경우에 따라, 도 1a에 도시된 비디오 코딩 시스템(10)은 단지 예일 뿐이고 본 출원의 기술은, 인코딩 장치와 디코딩 장치 사이의 어떤 데이터 통신을 반드시 포함하지 않는 비디오 코딩 설정(예를 들어, 비디오 인코딩 또는 비디오 디코딩)에 적용될 수 있다. 다른 예에서, 데이터가 로컬 메모리로부터 검색되거나, 또는 네트워크 등을 통해 스트리밍된다. 비디오 인코딩 장치가 데이터를 인코딩하여 메모리에 저장할 수 있거나, 및/또는 비디오 디코딩 장치가 메모리로부터 데이터를 검색하여 디코딩할 수 있다. 일부 예에서, 인코딩 및 디코딩은 서로 통신하지 않지만 단순히 데이터를 메모리에 인코딩하거나 및/또는 메모리로부터 데이터를 검색하여 디코딩하는 장치에 의해 수행된다.
설명의 편의를 위해, 본 명세서에서는 예를 들어, 고효율 비디오 코딩(High-Efficiency Video Coding, HEVC) 또는 다용도 비디오 코딩(Versatile Video coding, VVC)의 레퍼런스 소프트웨어, ITU-T 비디오 코딩 전문가 그룹(Video Coding Experts Group, VCEG)과 ISO/IEC 동화상 전문가 그룹(Motion Picture Experts Group, MPEG)의 JCT-VC(Joint Collaboration Team on Video Coding)에 의해 개발된 차세대 비디오 코딩 표준을 참조하여 본 발명의 실시예에 대해 설명한다. 당업자는 본 발명의 실시예가 HEVC 또는 VVC에 제한되지 않는다고 이해할 것이다.
(인코더 및 인코딩 방법)
도 2는 본 출원의 기술을 구현하도록 구성된 예시적인 비디오 인코더(20)를 개략적으로 나타낸 블록도이다. 도 2의 예에서, 비디오 인코더(20)는 입력(201)(또는 입력 인터페이스(201)), 잔차 계산 유닛(residual calculation unit, 204), 변환 처리 유닛(206), 양자화 유닛(208), 역양자화 유닛(210), 및 역변환 처리 유닛(212), 재구성 유닛(214), 루프 필터 유닛(220), 디코딩된 픽처 버퍼(DPB, 230), 모드 선택 유닛(260), 엔트로피 인코딩 유닛(270), 및 출력(272)(또는 출력 인터페이스(272))를 포함한다. 모드 선택 유닛(260)은 인터 예측 유닛(244), 인트라 예측 유닛(254), 및 분할 유닛(262)을 포함할 수 있다. 인터 예측 유닛(244)은 움직임 추정 유닛과 움직임 보상 유닛(도시하지 않음)을 포함할 수 있다. 도 2에 도시된 비디오 인코더(20)는 하이브리드 비디오 코덱에 따른 하이브리드 비디오 인코더 또는 비디오 인코더라고도 할 수 있다.
잔차 계산 유닛(204), 변환 처리 유닛(206), 양자화 유닛(208), 모드 선택 유닛(260)은 인코더(20)의 순방향 신호 경로를 형성한다고도 할 수 있고, 역양자화 유닛(210), 역변환 처리 유닛(212), 재구성 유닛(214), 버퍼(216), 루프 필터(220), 디코딩된 픽처 버퍼(DPB, 230), 인터 예측 유닛(244), 및 인트라 예측 유닛(254)은 비디오 인코더(20)의 역방향 신호 경로를 형성한다고도 할 수 있다. 여기서, 비디오 인코더(20)의 역방향 신호 경로는 디코더(도 3의 비디오 디코더(30)를 참조)의 신호 경로에 대응한다. 역양자화 유닛(210), 역변환 처리 유닛(212), 재구성 유닛(214), 루프 필터(220), 디코딩된 픽처 버퍼(DPB, 230), 인터 예측 유닛(244), 및 인트라 예측 유닛(254)은 비디오 인코더(20)의 "내장형 디코더"를 형성하는 것이라고도 할 수 있다.
(픽처 & 픽처 파티셔닝(픽처 & 블록))
인코더(20)는 예를 들어 입력(201)을 통해, 픽처(17)(또는 픽처 데이터(17)), 예를 들어 비디오 또는 비디오 시퀀스를 형성하는 픽처 또는 픽처의 시퀀스를 수신하도록 구성될 수 있다. 수신된 픽처 또는 픽처 데이터는 전처리된 픽처(19)(또는 전처리된 픽처 데이터(19))일 수도 있다. 단순화를 위해, 다음의 설명은 도 17을 참조한다. 픽처(17)는 현재 픽처 또는 인코딩될 픽처라고도 할 수 있다(특히, 비디오 코딩에서 현재 픽처를 다른 픽처, 예를 들어 동일한 비디오 시퀀스, 즉 현재 픽처도 포함하는 비디오 시퀀스의 이전에 인코딩되거나 및/또는 디코딩된 픽처와 구별하기 위해).
(디지털) 픽처가 세기 값(intensity value)을 가진 2차원 배열이나 샘플 행렬이거나 또는 세기 값을 가진 2차원 배열이나 샘플 행렬로 간주될 수 있다. 이 배열 내의 샘플은 픽셀(픽처 엘리먼트의 짧은 형태) 또는 펠(pel)이라고도 할 수 있다. 이 배열 또는 픽처의 수평 및 수직 방향(또는 축)의 샘플의 개수가 픽처의 크기 및/또는 해상도를 정의한다. 색상을 표현하기 위해, 일반적으로 3가지 색상 성분이 사용된다. 즉, 픽처가 표현되거나 또는 3개의 샘플 배열을 포함할 수 있다. RBG 포맷 또는 색 공간에서, 픽처는 대응하는 적색, 녹색, 및 청색 샘플 배열을 포함한다. 하지만, 비디오 코딩에서, 각각의 픽셀은 일반적으로 휘도 및 색차(chrominance) 포맷 또는 색 공간(Y로 표시된 휘도 성분(때때로 대신 L이 사용됨)과 Cb와 Cr로 표시된 2개의 색차 성분을 포함하는 YCbCr을 포함)으로 표현된다. 휘도(또는 줄여서 루마) 성분 Y는 밝기 또는 (예를 들어, 그레이스케일 픽처에서와 같이) 그레이 레벨 세기를 나타내는 반면, 2개의 색차(또는 줄여서 크로마) 성분(Cb와 Cr)은 색도 또는 색상 정보 성분을 나타낸다. 따라서, YCbCr 포맷의 픽처가 휘도 샘플 값(Y)의 휘도 샘플 배열과 색차 값(Cb 및 Cr)의 2개의 색차 샘플 배열을 포함한다. RGB 포맷의 픽처가 YCbCr 포맷으로 전환되거나 또는 변환될 수 있으며 그 반대의 경우도 마찬가지이다. 이 프로세스는 색상 변환 또는 전환이라고도 한다. 픽처가 단색이면, 픽처는 휘도 샘플 어레이만을 포함할 수 있다. 따라서, 픽처가 예를 들어 단색 포맷의 루마 샘플의 배열, 또는 루마 샘플 배열과 4:2:0, 4:2:2, 및 4:4:4 색상 포맷의 2개의 대응하는 크로마 샘플의 배열일 수 있다.
비디오 인코더(20)의 실시예는 픽처(17)를 복수의(일반적으로 중첩하지 않는) 픽처 블록(203)으로 분할하도록 구성된 픽처 분할 유닛(도 2에 도시되지 않음)을 포함할 수 있다. 이러한 블록은 루트 블록, 또는 매크로 블록(H.264/AVC)이나 코딩 트리 블록(coding tree block, CTB), 또는 코딩 트리 유닛(coding tree unit, CTU)(H.265/HEVC 및 VVC)이라고도 할 수 있다. 픽처 분할 유닛은, 비디오 시퀀스의 모든 픽처 및 블록 크기를 정의하는 대응하는 그리드에 대해 동일한 블록 크기를 사용하거나 또는 픽처들 또는 서브세트들 또는 픽처의 그룹들 간의 블록 크기를 변경하고, 각각의 픽처를 대응하는 블록으로 분할하도록 구성될 수 있다.
추가적인 실시예에서, 비디오 인코더는 예를 들어 픽처(17)의 블록(203), 예를 들어 픽처(17)를 형성하는 하나의 블록, 여러 개의 블록, 또는 모든 블록을 직접 수신하도록 구성될 수 있다. 픽처 블록(203)은 현재 픽처 블록 또는 코딩될 픽처 블록이라고도 할 수 있다.
픽처(17)와 같이, 픽처 블록(203)은 픽처(17)보다 크기가 작지만, 세기 값(샘플 값)을 가진 2차원 배열 또는 샘플 행렬이거나 또는 이들로 간주될 수 있다. 다시 말해, 블록(203)은 적용되는 컬러 포맷에 따라 예를 들어, 하나의 샘플 배열(예를 들어, 단색 픽처(17)의 경우 루마 배열, 또는 루마 또는 컬러 픽처의 경우 크로마 배열) 또는 3개의 샘플 배열(예를 들어, 컬러 픽처(17)의 경우 루마 및 2개의 크로마 어레이) 또는 어떤 다른 개수 및/또는 종류의 배열을 포함할 수 있다. 블록(203)의 수평 및 수직 방향(또는 축)의 샘플의 개수가 블록(203)의 크기를 정의한다. 따라서, 블록이 예를 들어 샘플의 M×N(M열 × N행) 배열 또는 변환 계수의 M×N 배열일 수 있다.
도 2에 도시된 비디오 인코더(20)의 실시예는, 예를 들어 블록 단위로 픽처(17)를 인코딩하도록 구성될 수 있다. 예를 들어, 인코딩과 예측이 블록(203)마다 수행된다.
도 2에 도시된 비디오 인코더(20)의 실시예는 추가적으로, 슬라이스(비디오 슬라이스라고도 함)를 이용하여 픽처를 분할하거나 및/또는 인코딩하도록 구성될 수 있다. 여기서, 픽처가 하나 이상의 슬라이스로 분할되거나 또는 (일반적으로 중첩하지 않는) 하나 이상의 슬라이스를 이용하여 인코딩될 수 있고, 각각의 슬라이스가 하나 이상의 블록(예를 들어, CTU)을 포함할 수 있다.
도 2에 도시된 비디오 인코더(20)의 실시예는 추가적으로, 타일 그룹(비디오 타일 그룹이라고도 함) 및/또는 타일(비디오 타일이라고도 함)을 이용하여 픽처를 분할하거나 및/또는 인코딩하도록 구성될 수 있다. 여기서, 픽처가 (일반적으로 중첩하지 않는) 하나 이상의 타일 그룹으로 분할되거나 또는 인코딩될 수 있고, 각각의 타일 그룹이 예를 들어 하나 이상의 블록(예를 들어, CTU) 또는 하나 이상의 타일을 포함할 수 있으며, 각각의 타일이 예를 들어 직사각형 모양일 수 있고 하나 이상의 블록(예를 들어, CTU), 예를 들어 완전한 블록 또는 부분적인 블록을 포함할 수 있다.
(잔차 계산)
잔차 계산 유닛(204)은, 예를 들어 픽처 블록(203)의 샘플 값에서 예측 블록(265)의 샘플 값을 차감하여 샘플 단위로(픽셀 단위로) 샘플 영역에서 잔차 블록(205)을 획득함으로써, 픽처 블록(203)과 예측 블록(265)에 기초하여 잔차 블록(205)(잔차(205)라고도 함)을 계산하도록 구성될 수 있다(이하, 예측 블록(265)에 관한 추가적인 세부사항이 제공된다).
(변환)
변환 처리 유닛(206)은 잔차 블록(205)의 샘플 값에 대해 변환, 예를 들어 이산 코사인 변환(discrete cosine transform, DCT) 또는 이산 사인 변환(discrete sine transform, DST)을 적용하도록 구성되어 변환 영역에서 변환 계수(207)를 획득할 수 있다. 변환 계수(207)는 변환 잔차 계수라고도 할 수 있고, 변환 영역에서 잔차 블록(205)을 표현할 수 있다.
변환 처리 유닛(206)은 DCT/DST의 정수 근사치, 예컨대 H.265/HEVC에 대해 지정된 변환을 적용하도록 구성될 수 있다. 직교 DCT 변환과 비교할 때, 이러한 정수 근사치는 일반적으로 특정 요인에 의해 스케일링된다. 순방향 및 역방향 변환에 의해 처리된 잔차 블록의 표준을 보존하기 위해, 추가적인 스케일링 요인이 변환 과정의 일부로서 적용된다. 스케일링 계수는 일반적으로 시프트 연산에 대해 2의 거듭제곱인 스케일링 요인, 변환 계수의 비트 깊이, 정확도와 구현 비용 사이의 균형 등의 특정 제약조건에 따라 선택된다. 특정 스케일링 요인은 역변환 처리 유닛(212)(과 대응하는 역변환, 예를 들어 비디오 디코더(30)의 역변환 처리 유닛(312)) 및 순방향 변환에 대한 대응하는 스케일링 요인에 의해, 예를 들어 인코더(20)에서 역변환에 대해 변환 처리 유닛(206)에 의해 적절하게 지정될 수 있다.
예를 들어, 비디오 디코더(30)가 디코딩을 위한 변환 파라미터를 수신하여 사용할 수 있도록, 비디오 인코더(20)(각각 변환 처리 유닛(206))의 실시예는 변환 파라미터, 예를 들어 직접 또는 엔트로피 인코딩 유닛(270)을 통해 인코딩되거나 압축된 변환의 유형 또는 변환을 출력하도록 구성될 수 있다.
(양자화)
양자화 유닛(208)은 예를 들어 스칼라 양자화 또는 벡터 양자화를 적용함으로써 변환 계수(207)를 양자화하여 양자화된 계수(209)를 획득하도록 구성될 수 있다. 양자화된 계수(209)는 양자화된 변환 계수(209) 또는 양자화된 잔차 계수(209)라고도 할 수 있다.
양자화 프로세스는 변환 계수(207)의 일부 또는 전부와 관련된 비트 깊이를 낮출 수 있다. 예를 들어, n-비트 변환 계수가 양자화 중에 m-비트 변환 계수로 잘라 버려질 수 있다(n은 m보다 큼). 양자화의 정도가 양자화 파라미터(quantization parameter, QP)를 조정하여 변경될 수 있다. 예를 들어, 스칼라 양자화의 경우, 다른 스케일링이 적용되어 더 미세하거나 또는 거친 양자화를 달성할 수 있다. 더 작은 양자화 스텝 크기가 더 미세한 양자화에 대응하고, 더 큰 양자화 단계 크기가 더 거친 양자화에 대응한다. 적용 가능한 양자화 스텝 크기가 양자화 파라미터(QP)로 표시될 수 있다. 양자화 파라미터는 예를 들어 적용 가능한 양자화 스텝 크기의 미리 정의된 세트에 대한 인덱스일 수 있다. 예를 들어, 작은 양자화 파라미터는 미세한 양자화(작은 양자화 스텝 크기)에 대응할 수 있고, 큰 양자화 파라미터는 거친 양자화(큰 양자화 스텝 크기)에 대응할 수 있거나 또는 그 반대일 수 있다. 양자화는 양자화 스텝 크기 및 대응하거나 및/또는 역역양자화에 의한 나눗셈, 예를 들어 역양자화 유닛(210)에 의한 나눗셈을 포함할 수 있고, 양자화 스텝 크기에 의한 곱셈을 포함할 수 있다. 일부 표준, 예를 들어 HEVC에 따른 실시예는 양자화 파라미터를 이용하여 양자화 스텝 크기를 결정하도록 구성될 수 있다. 일반적으로, 양자화 스텝 크기는 나눗셈을 포함하는 수학식의 고정 소수점 근사화를 이용하여 양자화 파라미터에 기초하여 계산될 수 있다. 추가적인 스케일링 요인이 잔차 블록의 표준을 재구성하기 위해 양자화 및 역양자화에 도입될 수 있으며, 이는 양자화 스텝 크기 및 양자화 파라미터에 대한 수학식의 고정 소수점 근사화에 사용되는 스케일링으로 인해 수정될 수 있다. 하나의 예시적인 구현에서, 역변환 및 역양자화의 스케일링이 조합될 수 있다. 대안적으로, 맞춤형 양자화 테이블이 사용되어, 예를 들어 비트스트림으로 인코더에서 디코더로 시그널링될 수 있다. 양자화는 손실 연산이고, 양자화 스텝 크기가 증가함에 따라 손실이 증가한다.
예를 들어, 비디오 디코더(30)가 디코딩을 위한 양자화 파라미터를 수신하여 적용할 수 있도록, 비디오 인코더(20)(각각 양자화 유닛(208))의 실시예는 예를 들어 직접 또는 엔트로피 인코딩 유닛(270)을 통해 인코딩된 양자화 파라미터(QP)를 출력하도록 구성될 수 있다.
(역양자화)
역양자화 유닛(210)은, 양자화 유닛(208)에 의해 적용된 양자화 방식의 역을 적용하거나 또는 양자화 유닛(208)과 동일한 양자화 스텝 크기를 이용하여, 양자화된 계수에 대해 양자화 유닛(208)의 역양자화를 적용함으로써 예를 들어 역양자화 계수(211)를 획득하도록 구성된다. 역양자화된 계수(211)는 역양자화된 잔차 계수(211)라고도 할 수 있고, 일반적으로 양자화에 의한 손실로 인한 변환 계수와 동일하지는 않지만 변환 계수(207)에 대응한다.
(역변환)
역변환 처리 유닛(212)은, 샘플 영역에서 재구성된 잔차 블록(213)(또는 대응하는 역양자화된 계수(213))을 획득하기 위해, 변환 처리 유닛(206)에 의해 적용된 변환의 역변환, 예컨대 역 이산 코사인 변환(inverse discrete cosine transform, DCT) 또는 역 이산 사인 변환 (inverse discrete sine transform, DST) 또는 다른 역변환을 적용하도록 구성된다. 재구성된 잔차 블록(213)은 (재구성된) 변환 블록(213)이라고도 할 수 있다.
(재구성)
재구성 유닛(214)(예를 들어, 가산기 또는 합산기(214))은, 예를 들어 재구성된 잔차 블록(213)의 샘플 값과 예측 블록(265)의 샘플 값을 - 샘플별로 - 추가함으로써, (재구성된) 변환 블록(213)(즉, 재구성된 잔차 블록(213))을 예측 블록(265)에 추가함으로써, 샘플 영역에서 재구성된 블록(215)을 획득한다.
(필터링)
루프 필터 유닛(220)(또는 줄여서 "루프 필터"(220))은 재구성된 블록(215)을 필터링하여 필터링된 블록(221)을 획득하거나, 또는 일반적으로, 재구성된 샘플을 필터링하여 필터링된 샘플을 획득하도록 구성된다. 루프 필터 유닛은 예를 들어 픽셀 전환을 부드럽게하거나 또는 비디오 품질을 개선하도록 구성된다. 루프 필터 유닛(220)은 하나 이상의 루프 필터, 예컨대 디블로킹 필터, 샘플 적응형 오프셋(sample-adaptive offset, SAO) 필터 또는 하나 이상의 다른 필터, 예를 들어 양방향 필터, 적응형 루프 필터(adaptive loop filter, ALF), 샤프닝, 평탄화 필터, 또는 협업 필터, 또는 이들의 어떤 조합을 포함할 수 있다. 도 2에는 루프 필터 유닛(220)이 루프 필터에 있는 것으로 도시되어 있지만, 다른 구성에서, 루프 필터 유닛(220)은 포스트 루프 필터로서 구현될 수 있다. 필터링된 블록(221)은 필터링된 재구성된 블록(221)이라고도 할 수 있다.
비디오 인코더(20)(각각 루프 필터 유닛(220))의 실시예는, 예를 들어, 디코더(30)가 디코딩을 위한 동일한 루프 필터 파라미터 또는 각각의 루프 필터를 수신하여 적용할 수 있도록, 예를 들어 직접 또는 엔트로피 인코딩 유닛(270)을 통해 인코딩된 루프 필터 파라미터(샘플 적응형 오프셋 정보 등)를 출력하도록 구성될 수 있다.
(디코딩된 픽처 버퍼)
디코딩된 픽처 버퍼(DPB, 230)는 비디오 인코더(20)가 비디오 데이터를 인코딩하기 위해 참조 픽처 또는 일반적으로 참조 픽처 데이터를 저장하는 메모리일 수 있다. DPB(230)는 다양한 메모리 장치, 예컨대 동기식 동적 램(synchronous DRAM, SDRAM), 자기 저항 RAM(magnetoresistive RAM, MRAM), 저항 RAM(resistive RAM, RRAM), 또는 다른 유형의 메모리 장치를 포함하는 동적 랜덤 액세스 메모리(dynamic random access memory, DRAM) 중 어느 것에 의해 형성될 수 있다. 디코딩된 픽처 버퍼(DPB, 230)은 하나 이상의 필터링된 블록(221)을 저장하도록 구성될 수 있다. 디코딩된 픽처 버퍼(230)는 추가적으로, 이전에 필터링된 다른 블록, 예를 들어 동일한 현재 픽처 또는 서로 다른 픽처, 예를 들어 이전에 재구성된 픽처의 이전에 재구성된 필터링된 블록(221)을 저장하도록 구성될 수 있고, 예를 들어 인터 예측을 위해, 이전에 재구성된 완전한, 즉 디코딩된 픽처(와 대응하는 참조 블록 및 샘플) 및/또는 부분적으로 재구성된 현재 픽처(와 대응하는 참조 블록 및 샘플)을 제공할 수 있다. 디코딩된 픽처 버퍼(DPB, 230)는 또한 하나 이상의 필터링되지 않은 재구성된 블록(215), 또는 예를 들어 일반적으로, 재구성된 블록(215)이 루프 필터 유닛(220)에 의해 필터링되지 않으면, 필터링되지 않은 재구성된 샘플 또는 재구성된 블록 또는 샘플의 추가로 처리된 다른 버전을 저장하도록 구성될 수 있다.
모드 선택(파티셔닝 & 예측)
모드 선택 유닛(260)은 분할 유닛(262), 인트라 예측 유닛(244), 및 인트라 예측 유닛(254)을 포함하고, 동일한 (현재) 픽처의 블록 및/또는 하나 또는 복수의 이전에 디코딩된 픽처로부터, 예컨대 디코딩된 픽처 버퍼(230) 또는 다른 버퍼(예를 들어, 도시되지 않은 라인 버퍼)로부터 원본 픽처 데이터, 예를 들어 원본 블록(203)(현재 픽처(17)의 현재 블록(203)), 및 재구성된 픽처 데이터, 예를 들어필터링되거나 및/또는 필터링되지 않은 재구성된 샘플을 수신하거나 또는 획득하도록 구성된다. 재구성된 픽처 데이터는 예측 블록(265) 또는 예측자(265)를 얻기 위해 예측, 예를 들어 인터 예측 또는 인트라 예측을 위한 참조 픽처 데이터로서 사용된다.
모드 선택 유닛(260)은 (파티셔닝을 포함하지 않는) 현재 블록 예측 모드 및 예측 모드(예를 들어, 인트라 또는 인터 예측 모드)에 대한 분할을 결정하거나 또는 선택하고, 잔차 블록(205)의 계산과 재구성된 블록(215)의 재구성에 사용되는 대응하는 예측 블록(265)을 생성하도록 구성될 수 있다.
모드 선택 유닛(260)의 실시예는 (예를 들어, 모드 선택 유닛(260)에 의해 지원되거나 또는 모드 선택 유닛(260)에 사용 가능한 것으로부터) 분할 및 예측 모드를 선택하도록 구성될 수 있으며, 이는 최상의 매칭 또는 다시 말해, 최소 잔차(최소 잔차는 전송 또는 저장을 위한 더 나은 압축을 의미함), 또는 최소 시그널링 오버헤드(최소 시그널링 오버헤드는 전송 또는 저장을 위한 더 나은 압축을 의미함)을 제공하거나, 또는 양쪽을 고려하거나 또는 양쪽의 균형을 맞춘다. 모드 선택 유닛(260)은 레이트 왜곡 최적화(rate distortion optimization, RDO)에 기초하여 분할 및 예측 모드를 결정하도록, 즉 최소 레이트 왜곡을 제공하는 예측 모드를 선택하도록 구성될 수 있다. 이 문맥에서 "최상", "최소", "최적" 등과 같은 용어는 반드시 전체적인 "최상", "최소", "최적" 등을 의미하는 것은 아니지만, 임계값을 초과하거나 또는 임계값 이하로 떨어지는 값과 같은 종료 기준이나 선택 기준, 또는 잠재적으로 "차선의 선택"으로 이어지지만 복잡도와 처리 시간을 줄이는 다른 제한을 충족하는 것을 지칭할 수도 있다.
다시 말해, 분할 유닛(262)은 예를 들어 쿼드-트리-파티셔닝(quad-tree-partitioning, QT), 바이너리 파티셔닝(binary partitioning, BT) 또는 트리플-트리-파티셔닝(triple-tree-partitioning, TT) 또는 이들의 어떤 조합을 반복적으로 이용하여 블록(203)을 더 작은 블록 파티션 또는 서브블록(서브블록은 다시 블록을 형성함)으로 분할하고, 예를 들어 블록 파티션 또는 서브블록 각각에 대한 예측을 수행하도록 구성될 수 있다. 여기서, 모드 선택은 분할된 블록(203)의 트리 구조의 선택을 포함하고, 예측 모드는 블록 파티션 또는 서브블록 각각에 적용된다.
이하, 예시적인 비디오 인코더(20)에 의해 수행되는 분할(예를 들어, 분할 유닛(260)에 의한 분할)과 예측 처리(인터 예측 유닛(244)과 인트라 예측 유닛(254)에 의한 분할)에 대해 더 상세하게 설명할 것이다.
(파티셔닝)
분할 유닛(262)은 현재 블록(203)을 더 작은 파티션, 예를 들어 정사각형 또는 직사각형의 크기의 더 작은 블록으로 파티셔닝(또는 분할)할 수 있다. 이러한 더 작은 블록(하위 블록이라고도 함)은 심지어 더 작은 파티션으로 더 분할될 수 있다. 이를 트리 분할 또는 계층적 트리 분할이라고도 한다. 여기서, 루트 블록이, 예를 들어 루트 트리-레벨 0(계층-레벨 0, 깊이 0)에서, 종료 기준이 충족되기 때문에, 예를 들어 최대 트리 깊이 또는 최소 블록 크기에 도달하기 때문에 파티셔닝이 종료될 때까지 재귀적으로 분할될 수 있고, 예를 들어 다음 하위 트리-레벨의 2개 이상의 블록으로, 예를 들어 트리-레벨 1(계층-레벨 1, 깊이 1)에서 노드로 분할될 수 있고, 이러한 블록은 다음 하위 레벨의 2개 이상의 블록으로 다시 분할될 수 있으며, 예를 들어 트리-레벨 2(계층-레벨 2, 깊이 2)에서 분할될 수 있으며, 기타 등등이다. 더 분할되지 않는 블록은 트리의 리프 블록(leaf-block) 또는 리프 노드라고도 한다. 2개의 파티션으로 분할하는 트리는 바이너리 트리(binary-tree, BT), 3개의 파티션으로 분할하는 트리는 티너리 트리(ternary-tree, TT), 4개의 파티션으로 분할하는 트리를 쿼드 트리(quad-tree, QT)라고 한다.
전술한 바와 같이, 본 명세서에서 사용된 "블록"이라는 용어가 픽처의 일부, 특히 정사각형 부분이나 직사각형 부분일 수 있다. 예를 들어, HEVC와 VVC를 참조하면, 이 블록은 코딩 트리 단위(coding tree unit, CTU), 코딩 단위(coding unit, CU), 예측 단위(prediction unit, PU), 및 변환 단위(transform unit, TU)이거나 이들에 대응할 수 있거나 및/또는 대응하는 블록, 예를 들어 코딩 트리 블록(coding tree block, CTB), 또는 코딩 블록(coding block, CB), 또는 변환 블록(transform block, TB), 또는 예측 블록(prediction block, PB)에 대응할 수 있다.
예를 들어, 코딩 트리 유닛(CTU)은 루마 샘플의 CTB, 3개의 샘플 배열을 가진 픽처의 크로마 샘플의 2개의 대응하는 CTB, 또는 별도의 3개의 색상 평면 및 샘플을 코딩하는 데 사용되는 신택스 구조를 이용하여 코딩되는 단색 픽처 또는 픽처의 샘플의 CTB 일 수 있거나 또는 이들을 포함한다. 따라서, 성분을 CTB로 분할하는 것이 분할일 수 있도록, 코딩 트리 블록(CTB)은 N의 일부 값에 대한 N×N 블록의 샘플일 수 있다. 코딩 유닛(CU)이 루마 샘플의 코딩 블록, 또는 3개의 샘플 배열을 가진 픽처의 크로마 샘플의 2개의 대응하는 코딩 블록, 또는 별도의 3개의 색상 평면 및 샘플을 코딩하는 데 사용되는 신택스 구조를 이용하여 코딩되는 단색 픽처 또는 픽처의 샘플의 코딩 블록일 수 있거나 또는 이들을 포함한다. 따라서, CTB를 코딩 블록으로 분할하는 것이 파티셔닝일 수 있도록, 코딩 블록(CB)은 M과 N의 일부 값에 대한 M×N 블록의 샘플일 수 있다.
실시예에서, 예를 들어 HEVC에 따르면, 코딩 트리 단위(CTU)가 코딩 트리로 표시된 쿼드 트리 구조를 이용하여 CU로 분할될 수 있다. 인터 픽처(시간적) 또는 인트라 픽처(공간적) 예측을 이용하여 픽처 영역을 코딩할지 여부가 CU 레벨에서 결정된다. 각각의 CU는 PU 분할 유형에 따라 1개, 또는 2개, 또는 4개의 PU로 더 분할될 수 있다. 하나의 PU 내부에서, 동일한 예측 프로세스가 적용되고, 관련 정보가 PU 단위로 디코더에 전송된다. PU 분할 유형에 기반한 예측 과정을 적용하여 잔차 블록을 획득한 후에, CU는 CU에 대한 코딩 트리와 유사한 다른 쿼드 트리 구조에 따라 변환 단위(TU)로 분할될 수 있다.
실시예에서, 예를 들어, 현재 개발중인 최신 비디오 코딩 표준(VVC)(다용도 비디오 코딩(VVC)이라고도 함)에 따르면, 결합된 쿼드 트리와 이진 트리(Quad-tree and binary tree, QTBT) 분할이 예를 들어 코딩 블록을 분할하는 데 사용된다. QTBT 블록 구조에서, CU는 정사각형 또는 직사각형 모양을 가지고 있을 수 있다. 예를 들어, 코딩 트리 단위(CTU)는 쿼드트리 구조에 의해 먼저 분할된다. 쿼드트리 리프 노드는 바이너리 트리 또는 티너리(또는 트리플) 트리 구조에 의해 추가로 분할된다. 분할 트리 리프 노드는 코딩 단위(CU)로 불리며, 그 세그멘테이션이 추가적인 분할없이 예측 및 변환 처리에 사용된다. 이는 CU, PU, 및 TU가 QTBT 코딩 블록 구조에서 동일한 블록 크기를 가지고 있다는 것을 의미한다. 병렬로, 복수의 파티션, 예를 들어 트리플 트리 파티션은 QTBT 블록 구조와 함께 사용될 수 있다.
일 예에서, 비디오 인코더(20)의 모드 선택 유닛(260)은 본 명세서에 설명된 분할 기술의 어떤 조합을 수행하도록 구성될 수 있다.
전술한 바와 같이, 비디오 인코더(20)는 (예를 들어, 미리 결정된) 예측 모드의 세트로부터 최상의 또는 최적의 예측 모드를 결정하거나 또는 선택하도록 구성된다. 예측 모드의 세트는, 예를 들어 인트라 예측 모드 및/또는 인터 예측 모드를 포함할 수 있다.
(인트라 예측)
인트라 예측 모드의 세트는 예를 들어 HEVC에 정의된 바와 같이 35개의 서로 다른 인트라 예측 모드, 예를 들어 DC(또는 평균) 모드 및 평면 모드와 같은 비방향성 모드, 또는 방향성 모드를 포함할 수 있거나, 또는 예를 들어 VVC에 정의된 바와 같이 67개의 서로 다른 인트라 예측 모드, 예를 들어 DC(또는 평균) 모드 및 평면 모드와 같은 비방향성 모드, 또는 방향성 모드를 포함할 수 있다.
인트라 예측 유닛(254)은 동일한 현재 픽처의 이웃 블록의 재구성된 샘플을 이용하여 인트라 예측 모드의 세트의 인트라 예측 모드에 따라 인트라 예측 블록(265)을 생성하도록 구성된다.
인트라 예측 유닛(254)(또는 일반적으로 모드 선택 유닛(260))은 추가적으로, 예를 들어, 비디오 디코더(30)가 디코딩을 위한 예측 파라미터를 수신하여 사용할 수 있도록, 인코딩된 픽처 데이터(21)에 포함될 신택스 엘리먼트(266)의 형태로 인트라 예측 파라미터(또는 일반적으로 블록에 대한 선택된 인트라 예측 모드를 나타내는 정보)를 엔트로피 인코딩 유닛(270)에 출력하도록 구성된다.
(인터 예측)
(또는 가능한) 인터 예측 모드의 세트는 사용 가능한 참조 픽처(즉, 이전의 적어도 부분적으로 디코딩된 픽처, 예를 들어 DBP(230)에 저장됨) 및 다른 인트라-예측 파라미터, 예를 들어 전체 참조 픽처 또는 단지 일부, 예를 들어 참조 픽처의 현재 블록의 영역 주위의 검색 윈도 영역이 최상의 매칭 참조 블록을 검색하는 데 사용되는지 여부, 및/또는 예를 들어 픽셀 보간, 예를 들어 하프/세미-펠(half/semi-pel) 및/또는 쿼터-펠(quarter-pel) 보간이 적용되는지 또는 적용되지 않는지 여부에 따라 달라진다.
예측 모드 외에, 스킵 모드 및/또는 다이렉트 모드가 적용될 수있다.
인터 예측 유닛(244)은 움직임 추정(motion estimation, ME) 유닛과 움직임 보상(motion compensation, MC) 유닛(모두 도 2에 도시되지 않음)을 포함할 수 있다. 움직임 추정을 위해, 움직임 추정 유닛은 픽처 블록(203)(현재 픽처(17)의 현재 픽처 블록(203)) 및 디코딩된 픽처(231), 또는 적어도 하나의 또는 복수의 이전에 재구성된 블록, 예를 들어 하나 또는 이전에 디코딩된 복수의 다른/서로 다른 픽처(231)의 재구성된 블록을 수신하거나 또는 획득하도록 구성될 수 있다. 예를 들어, 비디오 시퀀스가 현재 픽처 및 이전에 디코딩된 픽처(231)를 포함할 수 있거나, 또는 다르게 말하면, 현재 픽처 및 이전에 디코딩된 픽처(231)는 비디오 시퀀스를 형성하는 픽처의 시퀀스의 일부이거나 또는 픽처의 시퀀스를 형성할 수 있다.
인코더(20)가 예를 들어 복수의 다른 픽처 중 동일한 또는 서로 다른 픽처의 복수의 참조 블록으로부터 참조 블록을 선택하고, 참조 블록의 위치(x, y 좌표)와 현재 블록의 위치 사이의 참조 픽처(또는 참조 픽처 인덱스) 및/또는 오프셋(공간적 오프셋)을 인터 예측 파라미터로서 움직임 추정 유닛에 제공하도록 구성될 수 있다. 이 오프셋은 움직임 벡터(motion vector)라고도 한다.
움직임 보상 유닛은 인터 예측 파라미터를 획득하고, 예를 들어 인터 예측 파라미터를 수신하고, 인터 예측 파라미터에 기초하여 또는 인터 예측 파라미터를 이용하여 인터 예측을 수행하여 인터 예측 블록(265)을 획득하도록 구성된다. 움직임 보상 유닛에 의해 수행되는 움직임 보상은, 움직임 추정에 의해 결정된 움직임/블록 벡터에 기초하여 예측 블록을 페칭하거나 또는 생성하는 것, 경우에 따라 서브 픽셀 정밀도로 보간을 수행하는 것을 포함할 수 있다. 보간 필터링은 알려진 픽셀 샘플로부터 추가적인 픽셀 샘플을 생성할 수 있기 때문에, 픽처 블록을 코딩하는 데 사용될 수 있는 후보 예측 블록의 개수를 잠재적으로 증가시킬 수 있다. 움직임 보상 유닛은, 현재 픽처 블록의 PU에 대한 움직임 벡터를 수신하면 참조 픽처 목록 중 하나에서 움직임 벡터가 가리키는 예측 블록을 찾을 수 있다.
움직임 보상 유닛은 비디오 슬라이스의 픽처 블록을 디코딩할 때 비디오 디코더(30)에 의해 사용될 블록 및 비디오 슬라이스와 연관된 신택스 엘리먼트(syntax element)도 생성할 수 있다. 슬라이스 및 각각의 신택스 엘리먼트에 대한 대안으로서 또는 이들 외에, 타일 그룹 및/또는 타일과 각각의 신택스 엘리먼트가 생성되거나 또는 사용될 수 있다.
(엔트로피 코딩)
예를 들어, 엔트로피 인코딩 유닛(270)은, 비디오 디코더(30)가 디코딩을 위한 파라미터를 수신하여 사용할 수 있도록, 예를 들어 엔트로피 인코딩 알고리즘 또는 방식(예를 들어, 가변 길이 코딩(variable length coding, VLC) 방식, 콘텍스트 적응형 VLC 방식(context adaptive VLC, CAVLC), 산술 코딩 방식, 이진화(binarization), 콘텍스트 적응형 2진 산술 코딩(context adaptive binary arithmetic coding, CABAC), 신택스 기반의 콘텍스트 적응형 2진 산술 코딩(syntax-based context-adaptive binary arithmetic coding, SBAC), 확률 간격 파티셔닝 엔트로피(probability interval partitioning entropy, PIPE) 코딩 또는 다른 엔트로피 인코딩 방법론 또는 기술) 또는 양자화된 계수(209)에 대한 우회(무압축), 인터 예측 파라미터, 인트라 예측 파라미터, 루프 필터 파라미터 및/또는 다른 신택스 엘리먼트를 적용하여 인코딩된 픽처 데이터(21)를 획득하도록 구성되고, 인코딩된 픽처 데이터(21)는 출력(272)을 통해 예를 들어 인코딩된 비트스트림(21)의 형태로 출력될 수 있다. 인코딩된 비트스트림(21)은 비디오 디코더(30)에 전송될 수 있거나, 또는 비디오 디코더(30)가 나중에 전송하거나 또는 검색하도록 메모리에 저장될 수 있다.
비디오 인코더(20)의 다른 구조적 변형이 비디오스트림을 인코딩하는 데 사용될 수 있다. 예를 들어, 비변환 기반의 인코더(20)는 특정 블록 또는 프레임에 대해 변환 처리 유닛(206) 없이 잔차 신호를 직접 양자화할 수 있다. 다른 구현에서, 인코더(20)는 단일 유닛에 결합된 양자화 유닛(208)과 역양자화 유닛(210)을 가지고 있을 수 있다.
(디코더 및 디코딩 방법)
도 3은 본 출원의 기술을 구현하도록 구성된 비디오 디코더(30)의 예이다. 디코딩된 픽처(331)를 얻기 위해, 비디오 디코더(30)는 예를 들어 인코더(20)에 의해 인코딩되는, 인코딩된 픽처 데이터(21)(예를 들어, 인코딩된 비트스트림(21))를 수신하도록 구성된다. 인코딩된 픽처 데이터 또는 비트스트림은 인코딩된 픽처 데이터를 디코딩하기 위한 정보, 예를 들어 인코딩된 비디오 슬라이스 (및/또는 타일 그룹 또는 타일)의 픽처 블록과 연관된 신택스 엘리먼트를 나타내는 데이터를 포함한다.
도 3의 예에서, 디코더(30)는 엔트로피 디코딩 유닛(304), 역양자화 유닛(310), 역변환 처리 유닛(312), 재구성 유닛(314)(예를 들어, 가산기(314)), 루프 필터(320), 디코딩된 픽처 버퍼(DBP, 330), 모드 적용 유닛(360), 인터 예측 유닛(344), 및 인트라 예측 유닛(354)을 포함한다. 인터 예측 유닛(344)은 움직임 보상 유닛일 수 있거나 또는 움직임 보상 유닛을 포함할 수 있다. 비디오 디코더(30)는, 일부 예에서, 도 2로부터의 비디오 인코더(100)에 관해 설명된 인코딩 패스(encoding pass)에 일반적으로 역인 디코딩 패스를 수행할 수 있다.
인코더(20)에 관해 설명된 바와 같이, 역양자화 유닛(210), 역변환 처리 유닛(212), 재구성 유닛(214) 루프 필터(220), 디코딩된 픽처 버퍼(DPB, 230), 인터 예측 유닛(344), 및 인트라 예측 유닛(354)은 비디오 인코더(20)의 "내장형 디코더"를 형성하는 것이라고도 한다. 따라서, 역양자화 유닛(310)은 역양자화 유닛(110)과 기능면에서 동일할 수 있고, 역변환 처리 유닛(312)은 역변환 처리 유닛(212)과 기능면에서 동일할 수 있으며, 재구성 유닛(314)은 재구성 유닛(214)과 기능면에서 동일할 수 있고, 루프 필터(320)는 루프 필터(220)와 기능면에서 동일할 수 있으며, 디코딩된 픽처 버퍼(330)는 디코딩된 픽처 버퍼(230)와 기능면에서 동일할 수 있다. 따라서, 비디오(20) 인코더의 각각의 유닛 및 기능에 대해 제공된 설명은 비디오 디코더(30)의 각각의 유닛과 기능에 대응하여 적용된다.
(엔트로피 디코딩)
엔트로피 디코딩 유닛(304)은 비트스트림(21)(또는 일반적으로 인코딩된 픽처 데이터(21))을 파싱하고, 예를 들어 인코딩된 픽처 데이터(21)에 대해 엔트로피 디코딩을 수행하도록 구성됨으로써, 예를 들어 양자화된 계수(309) 및/또는 디코딩된 코딩 파라미터(도 3에 도시하지 않음), 예를 들어 인터 예측 파라미터(예를 들어, 참조 픽처 인덱스와 움직임 벡터) 중 어느 것 또는 전부, 인트라 예측 파라미터(예를 들어, 인트라 예측 모드 또는 인덱스), 변환 파라미터, 양자화 파라미터, 루프 필터 파라미터, 및/또는 다른 신택스 엘리먼트를 획득한다. 엔트로피 디코딩 유닛(304)은 인코더(20)의 엔트로피 인코딩 유닛(270)에 관해 설명된 인코딩 방식에 대응하는 디코딩 알고리즘 또는 방식을 적용하도록 구성될 수 있다. 엔트로피 디코딩 유닛(304)은 추가적으로, 인터 예측 파라미터, 인트라 예측 파라미터, 및/또는 다른 신택스 엘리먼트를 모드 적용 유닛(360)에 제공하고, 다른 파라미터를 디코더(30)의 다른 유닛에 제공하도록 구성될 수 있다. 비디오 디코더(30)는 비디오 슬라이스 레벨 및/또는 비디오 블록 레벨에서 신택스 엘리먼트를 수신할 수 있다. 슬라이스와 각각의 신택스 엘리먼트 외에 또는 이들에 대한 대안으로서, 타일 그룹 및/또는 타일과 각각의 신택스 엘리먼트가 수신되거나 및/또는 사용될 수 있다.
(역양자화)
역양자화 유닛(310)은 (예를 들어 엔트로피 디코딩 유닛(304)이 예를 들어 파싱 및/또는 디코딩에 의해) 인코딩된 픽처 데이터(21)로부터 양자화 파라미터(QP)(또는 일반적으로 역양자화와 관련된 정보)와 양자화된 계수를 수신하고, 양자화 파라미터에 기초하여 디코딩된 양자화된 계수(309)에 대해 역양자화를 적용하여 역양자화된 계수(311)를 획득하도록 구성될 수 있다(역양자화된 계수(311)는 변환 계수(311)라고도 한다). 역양자화 프로세스는 양자화 정도 및 마찬가지로 적용되어야 하는 역양자화 정도를 결정하기 위해 비디오 슬라이스(또는 타일 또는 타일 그룹) 내의 각각의 비디오 블록에 대해 비디오 인코더(20)에 의해 결정되는 양자화 파라미터를 사용하는 것을 포함할 수 있다.
(역변환)
역변환 처리 유닛(312)은 역양자화된 계수(311)(변환 계수(311)라고도 함)를 수신하고, 변환을 역양자화된 계수(311)에 적용하여 샘플 영역에서 재구성된 잔차 블록(213)을 획득하도록 구성될 수 있다. 재구성된 잔차 블록(213)은 변환 블록(313)이라고도 할 수 있다. 이 변환은 역변환, 예를 들어 역 DCT, 또는 역 DST, 역 정수 변환, 또는 개념적으로 유사한 역변환 프로세스일 수 있다. 역변환 처리 유닛(312)은 추가적으로, 인코딩된 픽처 데이터(21)로부터 변환 파라미터 또는 대응하는 정보를 수신하여(예를 들어 엔트로피 디코딩 유닛(304)이 예를 들어 파싱 및/또는 디코딩에 의해) 역양자화된 계수(311)에 적용될 변환을 결정하도록 구성될 수 있다.
(재구성)
재구성 유닛(314)(예를 들어, 가산기 또는 합산기(314))는 재구성된 잔차 블록(313)을 예측 블록(365)에 더하여, 예를 들어, 재구성된 잔차 블록(313)의 샘플 값과 예측 블록(365)의 샘플 값을 더하여 샘플 영역에서 재구성된 블록(315)을 획득하도록 구성될 수 있다.
(필터링)
루프 필터 유닛(320)(코딩 루프 내 또는 코딩 루프 이후)은 재구성된 블록(315)을 필터링하여 필터링된 블록(321)을 획득하도록, 예를 들어 픽셀 전환을 부드럽게 하거나, 또는 그렇지 않으면 비디오 품질을 개선하도록 구성된다. 루프 필터 유닛(320)은 하나 이상의 루프 필터, 예컨대 디블로킹 필터, 샘플 적응형 오프셋(sample-adaptive offset, SAO) 필터, 또는 하나 이상의 다른 필터, 예들 들어 양방향 필터, 적응형 루프 필터(adaptive loop filter, ALF), 샤프닝 필터(sharpening filter), 스무딩(smoothing filter), 또는 협업 필터, 또는 이들의 어떤 조합을 포함할 수 있다. 도 3에 루프 필터 유닛(320)이 인루프 필터 내에 있는 것으로 도시되어 있지만, 다른 구성에서는 루프 필터 유닛(320)이 포스트 루프 필터로서 구현될 수 있다.
(디코딩된 픽처 버퍼)
픽처의 디코딩된 비디오 블록(321)은 디코딩된 픽처 버퍼(330)에 저장되고, 디코딩된 픽처 버퍼(330)는 다른 픽처에 대한 후속 움직임 보상 및/또는 각각의 표시를 출력하기 위해 디코딩된 픽처(331)를 참조 픽처로서 저장한다.
디코더(30)는 사용자에게 제시하거나 또는 사용자의 시청을 위해 예를 들어 출력(312)을 통해 디코딩된 픽처(311)를 출력하도록 구성된다.
(예측)
인터 예측 유닛(344)은 인터 예측 유닛(244)(특히, 움직임 보상 유닛)과 동일할 수 있고, 인트라 예측 유닛(354)은 기능면에서 인터 예측 유닛(254)과 동일할 수 있으며, 파티셔닝 및/또는 예측 파라미터 또는 인코딩된 픽처 데이터(21)로부터 수신된 각각의 정보에 기초하여 (예를 들어 엔트로피 디코딩 유닛(304)이 예를 들어 파싱 및/또는 디코딩에 의해) 분할 또는 파티셔닝 결정과 예측을 수행한다. 모드 적용 유닛(360)은 재구성된 픽처, 또는 블록, 또는 (필터링되거나 또는 필터링되지 않은) 각각의 샘플에 기초하여 블록마다 예측(인트라 또는 인터 예측)을 수행하여 예측 블록(365)을 획득하도록 구성될 수 있다.
비디오 슬라이스가 인트라 코딩된(I) 슬라이스로서 코딩될 때, 모드 적용 유닛(360)의 인트라 예측 유닛(354)은 현재 픽처의 이전에 디코딩된 블록으로부터의 시그널링된 인트라 예측 모드와 데이터에 기초하여 현재 비디오 슬라이스의 픽처 블록에 대한 예측 블록(365)을 생성하도록 구성된다. 비디오 픽처가 인터 코딩된(즉, B 또는 P) 슬라이스로서 코딩될 때, 모드 적용 유닛(360)의 인터 예측 유닛(344)(예를 들어, 움직임 보상 유닛)은 엔트로피 디코딩 유닛(304)으로부터 수신된 움직임 벡터 및 다른 신택스 엘리먼트에 기초하여 현재 비디오 슬라이스의 비디오 블록에 대한 예측 블록(365)을 생성하도록 구성된다. 인터 예측을 위해, 예측 블록은 참조 픽처 목록 중 하나의 목록 내의 참조 픽처 중 하나로부터 생성될 수 있다. 비디오 디코더(30)는 DPB(330)에 저장된 참조 픽처에 기반한 디폴트 구성 기술을 이용하여 참조 프레임 목록(목록 0과 목록 1)을 구성할 수 있다. 슬라이스(예를 들어, 비디오 슬라이스)에 대해 동일하거나 또는 유사한 내용이 추가적으로 또는 대안적으로 타일 그룹(예를 들어, 비디오 타일 그룹) 및/또는 타일(예를 들어, 비디오 타일)을 이용하는 실시예에 적용될 수 있다. 예를 들어, 비디오가 I 타일 그룹, 또는 P 타일 그룹, 또는 B 타일 그룹 및/또는 타일을 이용하여 코딩될 수 있다.
모드 적용 유닛(360)은 움직임 벡터 또는 관련 정보 및 다른 신택스 엘리먼트를 파싱하여 현재 비디오 슬라이스의 비디오 블록에 대한 예측 정보를 결정하고, 디코딩된 현재 비디오 블록을 예측 정보를 이용하여 예측 블록을 생성하도록 구성된다. 예를 들어, 모드 적용 유닛(360)은 수신된 신택스 엘리먼트 중 일부를 이용하여 비디오 슬라이스의 비디오 블록을 코딩하는 데 사용되는 예측 모드(예를 들어, 인트라 예측 또는 인터 예측), 인터 예측 슬라이스 유형(예를 들어, B 슬라이스, 또는 P 슬라이스, 또는 GPB 슬라이스), 슬라이스에 대한 참조 픽처 목록 중 하나 이상에 대한 구성 정보, 슬라이스의 각각의 인터 코딩된 비디오 블록에 대한 움직임 벡터, 슬라이스의 각각의 인터 코딩된 비디오 블록에 대한 인터 예측 상태, 및 기타 정보를 결정함으로써 현재 비디오 슬라이스 내의 비디오 블록을 디코딩한다. 슬라이스(예를 들어, 비디오 슬라이스)에 대해 동일하거나 또는 유사한 내용이 추가적으로 또는 대안적으로 타일 그룹(예를 들어, 비디오 타일 그룹) 및/또는 타일(예를 들어, 비디오 타일)을 이용하는 실시예에 적용될 수 있다. 예를 들어, 비디오가 I 타일 그룹, 또는 P 타일 그룹, 또는 B 타일 그룹 및/또는 타일을 이용하여 코딩될 수 있다.
도 3에 도시된 비디오 디코더(30)의 실시예는 슬라이스(비디오 슬라이스라고도 함)를 이용하여 픽처를 분할하거나 및/또는 디코딩하도록 구성될 수 있다. 여기서, 픽처는 (일반적으로 중첩하지 않는) 하나 이상의 슬라이스를 이용하여 분할되거나 또는 디코딩될 수 있고, 각각의 슬라이스는 하나 이상의 블록(예를 들어, CTU)을 포함할 수 있다.
도 3에 도시도니 비디오 디코더(30)의 실시예는 타일 그룹(비디오 타일 그룹이라고도 함) 및/또는 타일(비디오 타일이라고도 함)을 이용하여 픽처를 분할하거나 및/또는 디코딩하도록 구성될 수 있다. 여기서, 픽처는 (일반적으로 중첩하지 않는) 하나 이상의 타일 그룹으로 분할되거나 또는 디코딩될 수 있고, 각각의 타일 그룹은 예를 들어 하나 이상의 블록(예를 들어, CTU) 또는 하나 이상의 타일을 포함할 수 있으며, 각각의 타일은 예를 들어 직사각형 모양일 수 있고, 하나 이상의 블록(예를 들어, CTU), 예를 들어 완전한 블록 또는 부분적인 블록을 포함할 수 있다.
비디오 디코더(30)의 다른 변형이 인코딩된 픽처 데이터(21)를 디코딩하는 데 사용될 수 있다. 예를 들어, 디코더(30)는 루프 필터링 유닛(320) 없이 출력 비디오 스트림을 생성할 수 있다. 예를 들어, 비변환 기반의 디코더(30)는 특정 블록 또는 프레임에 대해 역변환 처리 유닛(312) 없이 직접 잔차 신호를 역양자화할 수 있다. 다른 구현에서, 비디오 디코더(30)는 단일 유닛으로 결합된 역양자화 유닛(310)과 역변환 처리 유닛(312)을 가지고 있을 수 있다.
인코더(20)와 디코더(30)에서, 현재 단계의 처리 결과가 추가로 처리된 후에 다음 단계로 출력될 수 있다고 이해해야 한다. 예를 들어, 보간 필터링, 또는 움직임 벡터 도출, 또는 루프 필터링 이후에, 보간 필터링, 또는 움직임 벡터 도출, 또는 루프 필터링의 처리 결과에 대해 클립(Clip) 또는 쉬프트(shift)와 같은 추가 연산이 수행될 수 있다.
추가 연산이 현재 블록의 도출된 움직임 벡터(아핀 모드의 제어점 움직임 벡터, 아핀 모드, 평면 모드, ATMVP 모드에서의 서브블록 움직임 벡터, 및 시간적 움직임 벡터 등을 포함하지만 이에 제한되지 않음)에 적용될 수 있다는 것을 유의해야 한다. 예를 들어, 움직임 벡터의 값은 그 표현 비트에 따라 미리 정의된 범위로 제한된다. 움직임 벡터의 표현 비트가 bitDepth이면, 그 범위가 -2^(bitDepth-1) ~ 2^(bitDepth-1)-1이다. 여기서, "^"는 누승법(exponentiation)을 의미한다. 예를 들어, bitDepth가 16으로 설정되면, 그 범위가 -32768 ~ 32767이고; bitDepth가 18로 설정되면, 그 범위가 -131072 ~ 131071이다. 예를 들어, 4개의 4×4 서브블록 MV의 정수 부분들 간의 최대 차이가 N개의 픽셀 이하, 예를 들어 1개의 픽셀 이하일 수 있도록, 도출된 움직임 벡터의 값(예를 들어, 하나의 8×8 블록 내의 4개의 4×4 서브블록의 MV)이 제한된다. 여기서는 bitDepth에 따라 움직임 벡터를 제한하는 2가지 방법을 제공한다.
도 4는 본 개시의 일 실시예에 따른 비디오 인코딩 장치(400)의 개략도이다. 비디오 코딩 장치(400)는 본 명세서에 설명된 바와 같이 개시된 실시예를 구현하기에 적합하다. 일 실시예에서, 비디오 인코딩 장치(400)는 도 1a의 비디오 디코더(30)와 같은 디코더이거나 또는 도 1a의 비디오 인코더(20)와 같은 인코더일 수 있다.
비디오 인코딩 장치(400)는 인그레스 포트(410)(또는 입력 포트(410))와 데이터를 수신하기 위한 수신기 유닛(Rx, 420); 데이터를 처리하기 위한 프로세서, 로직 유닛, 또는 중앙처리장치(CPU, 430); 데이터를 전송하기 위한 송신기 유닛(Tx, 440)과 이그레스 포트(450)(또는 출력 포트(450)); 및 데이터를 저장하기 위한 메모리(460)를 포함한다. 비디오 인코딩 장치(400)는 인그레스 포트(410), 수신기 유닛(420), 송신기 유닛(440), 및 광 신호 또는 전기 신호의 유출 또는 유입을 위한 이그레스 포트(450)에 연결된 광전(optical-to-electrical, OE) 컴포넌트와 전광(electrical-to-optical, EO) 컴포넌트를 더 포함할 수 있다.
프로세서(430)는 하드웨어와 소프트웨어에 의해 구현된다. 프로세서(430)는 하나 이상의 CPU 칩, 코어(예를 들어, 멀티코어 프로세서), FPGA, ASIC, 및 DSP로서 구현될 수 있다. 프로세서(430)는 인그레스 포트(410), 수신기 유닛(420), 송신기 유닛(440), 이그레스 포트(450), 및 메모리(460)와 통신한다. 프로세서(430)는 코딩 모듈(470)을 포함한다. 코딩 모듈(470)은 위에서 설명된 개시된 실시예를 구현한다. 예를 들어, 코딩 모듈(470)은 다양한 코딩 연산을 구현하거나, 또는 처리하거나, 또는 준비하거나, 또는 제공한다. 따라서, 코딩 모듈(470)을 포함하면 비디오 코딩 장치(400)의 기능이 실질적으로 개선되고, 비디오 코딩 장치(400)를 다른 상태로 변환하는 것에 영향을 미친다. 대안적으로, 코딩 모듈(470)은 메모리(460)에 저장되고 프로세서(430)에 의해 실행되는 명령으로서 구현된다.
메모리(460)는 하나 이상의 디스크, 테이프 드라이브, 및 솔리드 스테이트 드라이브(solid-state drive)를 포함할 수 있고 오버플로우 데이터 저장 장치로서 사용됨으로써, 이러한 프로그램이 실행을 위해 선택될 때 프로그램을 저장할 수 있고 또한 프로그램 실행 중에 판독되는 명령과 데이터를 저장할 수 있다. 메모리(460)는 예를 들어 휘발성 및/또는 비휘발성일 수 있고, 읽기 전용 메모리(read-only memory, ROM), 랜덤 액세스 메모리(random access memory, RAM), 터너리 내용 주소화 메모리(ternary content-addressable memory, TCAM), 및/또는 정적 랜덤 액세스 메모리(static random-access memory, SRAM)일 수 있다.
도 5는 예시적인 일 실시예에 따라 도 1로부터 소스 장치(12)와 목적지 장치(14) 중 하나 또는 전부로서 사용될 수 있는 장치(500)의 단순화된 블록도이다.
장치(500) 내의 프로세서(502)가 중앙 처리 장치일 수 있다. 대안적으로, 프로세서(502)는 현재 존재하거나 또는 향후 개발될 정보를 조작하거나 처리할 수 있는 어떤 다른 유형의 장치 또는 복수의 장치일 수 있다. 개시된 구현이 도시된 바와 같이 단일 프로세서, 예를 들어 프로세서(502)로 실시될 수 있지만, 하나 이상의 프로세서를 이용하여 속도와 효율의 이점이 달성될 수 있다.
일 구현에서, 장치(500) 내의 메모리(504)는 읽기 전용 메모리(ROM) 장치 또는 랜덤 액세스 메모리(RAM) 장치일 수 있다. 어떤 다른 적합한 유형의 저장 장치가 메모리(504)로서 사용될 수 있다. 메모리(504)는 버스(512)를 이용하여 프로세서(502)에 의해 액세스되는 코드와 데이터(506)를 포함할 수 있다. 메모리(504)는 운영체제(508)와 애플리케이션 프로그램(510)을 더 포함할 수 있고, 애플리케이션 프로그램(510)은 프로세서(502)가 본 명세서에 설명된 방법을 수행할 수 있게 하는 적어도 하나의 프로그램을 포함한다. 예를 들어, 애플리케이션 프로그램(510)은 본 명세서에 설명된 디블로킹방법을 수행하는 비디오 코딩 애플리케이션을 더 포함하는 애플리케이션 1 내지 애플리케이션 N을 포함할 수 있다.
장치(500)는 디스플레이(518)와 같은 하나 이상의 출력 장치를 더 포함할 수 있다. 디스플레이(518)는, 일 예에서, 디스플레이를 터치 입력을 감지하도록 작동할 수 있는 터치 감지 엘리먼트와 결합하는 터치 감지 디스플레이일 수 있다. 디스플레이(518)는 버스(512)를 통해 프로세서(502)에 연결될 수 있다.
여기서는 단일 버스로 도시되어 있지만, 장치(500)의 버스(512)는 복수의 버스로 구성될 수 있다. 또한, 보조 스토리지(514)는 장치(500)의 다른 구성 요소에 직접 결합될 수 있거나 또는 네트워크를 통해 액세스될 수 있고, 메모리 카드와 같은 단일 통합 유닛 또는 복수의 메모리 카드와 같은 복수의 유닛을 포함할 수 있다. 따라서, 장치(500)는 매우 다양한 구성으로 구현될 수 있다.
인트라 서브파티션(ISP) 코딩 툴은 인트라 (예측) 블록을 복수의 서브파티션으로 분할하고, 이러한 서브파티션을 예측한다. 예를 들어, ISP 코딩 툴은 처음에 하나의 서브파티션을 예측한 후 다음 서브파티션을 예측한다. 경우에 따라, 블록 아티팩트를 야기하는 서브파티션 경계에 걸쳐 불연속이 존재할 수 있다.
일 예에서, 도 6은 인트라 블록(600)을 복수의 서브파티션으로 ISP 분할하는 것을 도시하고 있다. 이 예에서, 2개의 방향성 파티션, 수평 파티션(601)과 수직 파티션(602)이 있고; 다른 예(도 6에 도시되지 않음)에서, 각도 방향 파티션과 같은 다른 파티션이 수행된다. 도 6에 도시된 예에서, 수직 파티션(602)이 있는 서브파티션 및 대응하는 경계가 라벨링된다. 여기서, 인트라 블록(600)은 4개의 서브 파티션, 즉 sub0, sub1, sub2, 및 sub3으로 분할된다. 3개의 서브파티션 경계, 즉 서브파티션 0과 서브파티션 1 사이의 서브파티션 경계 A, 서브파티션 1과 서브파티션 2 사이의 서브파티션 경계 B, 서브파티션 2와 서브파티션 3 사이의 서브파티션 경계 C가 라벨링되고, 유사한 정의가 수평 파티션(601)의 예에 사용될 수 있다.
일 실시예에서, 서브파티션의 예측이 ISP 툴에 의해 수행되고, 서브파티션은 순차적으로 디코딩될 수 있다. 하나의 서브파티션에 대해, 인코더에 의해 송신된 계수를 엔트로피 디코딩한 후 이들을 역양자화하고 역변환함으로써 잔차 신호를 생성할 수 있다. 다음, 서브파티션이 인트라 예측되고, 마지막으로 대응하는 재구성된 샘플이 예측 신호에 잔여 신호를 더하여 얻어진다. 예측 신호는 기본적으로 상단 및 좌측 참조 샘플 라인에서부터 각도 모드에 기초하여 수행되는 인트라 예측을 나타낼 수 있다. 잔차가 디코딩된 후 예측 신호에 추가되어 최종 예측을 형성한다. 재구성된 이러한 샘플은 다음 서브파티션을 예측하는 데 사용된다. 따라서, 하나의 서브파티션의 재구성된 값을 사용하여 다음 서브파티션의 예측을 생성할 수 있고, 이 과정이 반복될 것이다. 모든 서브파티션(sub0, sub1, sub2, sub3)은 동일한 인트라 모드를 공유한다.
일반적으로, 일반 순서와 역순서의 2가지 처리 순서가 서브파티션에 사용될 수 있다. 예를 들어, 수평 파티션의 경우, 정상 순서가 "위에서 아래로"이고, 역순서가 "아래에서 위로"이다. 다른 예에서, 수직 파티션의 경우, 일반 순서가 "좌측에서 우측으로"이고, 역순서가 "우측에서 좌측으로"이다.
도 7에 도시된 바와 같이, ISP 코딩 툴로 인한 블록 아티팩트를 감소시키기 위해, ISP가 적용된 블록 내부의 서브파티션 경계들이 코딩 블록(700)의 서브파티션(701)으로 수평 분할된 후에 이후 또는 코딩 블록(700)의 서브파티션(702)으로 수직 분할된 후 디블로킹 필터링된다. 이러한 서브파티션 경계에 디블로킹 필터를 적용하기 위해 몇 가지 대안적인 방법이 제안된다.
(경계 세기가 증가된 디블로킹 필터링)
경계 세기(Bs)는 디블로킹 필터의 세기를 제어하는 데 사용되는 파라미터이다. Bs 값이 높을수록, 경계에 수직인 더 많은 샘플이 필터링될 수 있다. ISP의 예측은 에러 전파의 문제로 이어질 수 있다. 즉, 예측 에러가 처리 순서와 함께 전파된다.
도 6에 도시된 바와 같이, 코딩 블록(코딩 유닛)이 수직 분할되고 또한 처리 순서가 정상인 하나의 예에서, 이러한 서브파티션 내의 샘플이 좌측에서 우측으로(즉, sub0, sub1, sub2, 및 sub3) 재구성된다. 일반적으로 서브파티션 0은 참조 샘플(좌측 이웃 블록과 상위 이웃 블록)이 이미 재구성되었으므로 더 나은 예측 품질을 가지고 있을 수 있다. 하지만, 서브파티션 1의 참조 샘플의 좌측 부분은 재구성된 서브파티션 0에서 유래한 것이고, 따라서 서브파티션 1의 참조 샘플이 서브파티션 0의 참조 샘플만큼 정확하지 않을 수 있어 더 많은 잔차 신호로 이어진다. 마찬가지로, 서브파티션 2의 참조 샘플은 서브파티션 1보다 열등하고, 예측 에러가 처리 순서와 함께 전파된다.
처리 순서에 따라 경계 세기를 증가시키는 방법이 제안된다. 즉, 2개의 서브파티션 사이의 경계(예를 들어, 도 6의 경계 A, 경계 B, 경계 C)가 이웃 블록에 가까운 경우, 이 경계가 오차가 작으므로, 이 경계의 Bs가 더 작은 값으로 설정된다. 경계가 인접한 블록으로부터 멀어지면, 오류 전파로 인해 경계가 더 많은 오차를 가지므로, 이 경계의 Bs가 더 높은 값으로 설정된다.
도 6에 도시된 하나의 예에서, 블록에 대해 수직 분할과 정상 처리 순서("좌측에서 우측으로")가 수행되고, 서브파티션 경계 A의 Bs가 0으로 설정되며, 서브파티션 경계 B의 Bs가 1로 설정되고, 서브파티션 경계 C의 Bs가 2로 설정된다.
도 6에 도시된 하나의 예에서, 블록에 대해 수직 분할과 역(우측에서 좌측으로의) 처리 순서가 수행되고, 서브파티션 경계 A의 Bs가 2로 설정되며, 서브파티션 경계 B의 Bs가 1로 설정되고, 서브파티션 경계 C의 Bs가 0으로 설정된다.
다른 예에서, 수평 파티션에 대해 유사한 과정이 수행된다.
(코딩된 블록 플래그(coded block flag, CBF)에 기반한 디블로킹 필터링)
일 예에서, 각각의 서브파티션은 개별적으로 예측되어 재구성되고, 각각의 서브파티션은 서로 다른 잔차(원래 신호와 예측된 신호 간의 차이) 정보를 가지고 있을 수도 있다. 특히, 코딩된 블록 플래그(CBF)는 양자화 이후에 블록 또는 서브파티션이 잔차 데이터를 가지고 있는지 여부를 나타내는 데 사용된다. 일반적으로, CBF가 1인 블록(즉, 양자화 이후에 잔차 데이터가 있는 블록)은 CBF가 0인 블록(즉, 양자화 이후에 잔차 데이터가 없는 블록)보다 왜곡이 더 많다. 이 실시예는 2개의 이웃하는 서브파티션의 CBF 플래그에 기초하여 2개의 서브파티션 사이의 경계에 디블로킹 필터를 적용한다.
일 예에서, 서브파티션 경계의 2개의 서브파티션 각각의 CBF 플래그 값이 0이면 디블로킹 필터가 적용되지 않고, 그렇지 않으면(서브파티션의 경계의 2개의 서브파티션 중 적어도 하나의 CBF 플래그 값이 1이면) 디블로킹 필터가 적용되며, 서브파티션 경계의 Bs 값이 1로 설정된다. 도 6의 예를 들면, 서브파티션 0과 서브파티션 1이 0인 CBF 플래그를 가지고 있으면, 디블로킹 필터가 서브파티션 경계 A에 적용되지 않는다. 적어도 서브파티션 0과 서브파티션 1이 1인 CBF 플래그를 가지고 있으면, B가 1로 설정된 디블로킹 필터가 서브파티션 경계 A에 적용된다.
일 예에서, 서브파티션 경계의 2개의 서브파티션 각각의 CBF 플래그 값이 0이면, 디블로킹 필터가 적용되지 않고, 그렇지 않으면(서브파티션 경계의 2개의 서브파티션 중 적어도 하나의 CBF 플래그 값이 1이면), 서브파티션 경계의 Bs 값이 2로 설정된 디블로킹 필터가 적용된다. 도 6의 예를 들면, 서브파티션 0과 1 각각의 CBF 플래그가 0이면, 디블로킹 필터가 서브파티션 A에 적용되지 않는다. 적어도 서브파티션 0과 서브파티션 1의 CBF 플래그가 1이면, Bs가 2로 설정된 디블로킹 필터가 서브파티션 경계 A에 적용된다.
(서브파티션 경계에 대한 일정한 경계 세기 설정)
일 예에서, 도 6에 도시된 모든 서브파티션 경계(A, B, 및 C)에 대해, 일정한 경계 세기(Bs)가 1로 설정된다.
일 예에서, 도 6에 도시된 모든 서브파티션 경계(A, B, 및 C)에 대해, 일정한 경계 세기(Bs)가 2로 설정된다.
도 8에 도시된 바와 같이, 다른 예에 따르면, 코딩 블록(800)을 서브파티션(801)으로 수평 분할한 후에 또는 코딩 블록(800)을 서브파티션(802)으로 수직 분할한 후에, 8×8 샘플 그리드와 중첩하는 서브파티션 경계만이 디블로킹되고 나머지 서브파티션 에지가 디블로킹되지 않는다. 이는 단지 수 개의 에지만이 디블로킹되기 때문에 계산 복잡도가 낮아지는 장점이 있다.
다른 대안이 도 9에 도시되어 있다. 이 경우, 코딩 블록(900)을 서브파티션(901)으로 수평 분할한 후에 또는 코딩 블록(900)을 서브파티션(902)으로 수직 분할한 후에, 4×4 샘플 그리드와 중첩하는 모든 서브파티션 경계가 디블로킹된다.
위치의 좌표가 (x, y)로서 정의되고, x는 전체 프레임의 좌측 상단 샘플로부터 수평 방향으로 몇 개의 샘플이 떨어져 있는지를 나타내고; y는 전체 프레임의 좌측 상단 샘플로부터 세로 방향으로 몇 개의 샘플이 떨어져 있는지를 나타낸다. 전체 프레임의 좌측 상단 샘플의 좌표가 (0, 0)이다.
일 예에서, 8×8 샘플 그리드가 (x, y)의 위치에서 시작할 수 있다(x%8 == 0). 연산자 %는 x를 8로 나눈 나머지로서 정의되는 모듈라 연산(modular operation)을 의미한다.
일 예에서, 8×8 샘플 그리드가 (x, y)의 위치에서 시작할 수 있다(x%8==4). 연산자 %는 x를 8로 나눈 나머지로서 정의되는 모듈라 연산을 의미한다.
일 예에서, 8×8 샘플 그리드가 (x, y)의 위치에서 시작할 수 있다(y%8==0). 연산자 %는 y를 8로 나눈 나머지로서 정의되는 모듈라 연산을 의미한다.
일 예에서, 8×8 샘플 그리드가 (x, y)의 위치에서 시작할 수 있다 y%8==4). 연산자 %는 y를 8로 나눈 나머지로서 정의되는 모듈라 연산을 의미한다.
(더 작은 블록 다루기)
SP를 적용하면 높이 또는 폭이 4개의 샘플인 서브파티션이 생성될 수 있다. 수직 파티션을 사용하는 도 6의 예에서, W가 16개의 샘플이면, 각각의 서브파티션의 폭이 4개의 샘플이다. 이 경우, 도 10에 도시된 바와 같이, 서브파티션(1031)과 서브파티션(33) 사이의 서브파티션 경계(1032)를 따라 최대 하나의 샘플(10314) 또는 샘플(10331)만을 변경하는 약한 필터가 사용될 수 있다. 도 10에 도시된 예에서, 예를 들어, 서브파티션(1031)과 서브파티션(1033) 사이의 서브파티션 경계(1032)에 수직이면서 인접한 서브파티션(1031, 1033)의 각각의 행에서 필터링이 수행된다. 도 10에 도시된 바와 같이, 이웃 블록(1010)과 현재 블록(1030) 사이의 에지(1020)를 따라 최대 하나의 샘플(1108) 또는 샘플(10311)만을 변경하는 약한 필터가 사용될 수 있다. 도 10에 도시된 다른 예에서, 블록(1030)의 이웃 블록(1010)과 서브파티션(1031) 사이의 에지(1020)에 수직이면서 인접한 서브파티션(1031) 또는 이웃 블록(1010)의 각각의 행에서 필터링이 수행된다. 그렇지 않으면(서브파티션 경계에 수직인 서브파티션 높이/폭이 4개 샘플보다 크면, 일반 VVC JVET-L1001 버전 13(http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document. php? id = 4834) 디블로킹 필터(예를 들어, 위의 VVC 문서에 공개된 디블로킹 필터)가 사용될 수 있다.
다른 실시예에서, 위의 실시예와 예 중 어느 하나에 대해, 서브파티션 경계가 8×8 그리드와 정렬되지 않은 경우, 디블로킹 필터가 적용되지 않는다.
제안된 방법의 인트라 서브파티션 관련 정의에 대한 세부사항에 대해 VVC 초안의 규격의 형식(7.3.9.5 및 7.4.10.5)으로 설명하면 다음과 같다.
7.3.9.5 코딩 유닛 신택스
7.4.10.5 코딩 유닛 의미론
1인 intra_subpartitions_mode_flag[x0][y0]은 현재 인트라 코딩 유닛이 NumIntraSubPartitions[x0][y0] 직사각형 변환 블록 서브파티션으로 분할된다는 것을 명시한다. 0인 intra_subpartitions_mode_flag[x0][y0]은 현재 인트라 코딩 유닛이 직사각형 변환 블록 서브파티션으로 분할되지 않는다는 것을 명시한다.
intra_subpartitions_mode_flag[x0][y0]가 없으면, 0이라고 추정된다.
intra_subpartitions_split_flag[x0][y0]은 인트라 서브파티션 분할 유형이 수평인지 수직인지 여부를 명시한다.
intra_subpartitions_split_flag [x0][y0]이 없으면, 다음과 같이 추론된다.
cbHeight가 MaxTbSizeY보다 크면, intra_subpartitions_split_flag[x0][y0]가 0이라고 추정된다.
그렇지 않으면(cbWidth가 MaxTbSizeY보다 크면), intra_subpartitions_split_flag[x0][y0]가 1이라고 추정된다.
변수 IntraSubPartitionsSplitType은 표 13에 설명된 바와 같이 현재 루마 코딩 블록에 사용되는 분할의 유형을 명시한다. IntraSubPartitionsSplitType은 다음과 같이 도출된다.
intra_subpartitions_mode_flag[x0][y0]이 0이면, IntraSubPartitionsSplitType이 0으로 설정된다.
그렇지 않으면, IntraSubPartitionsSplitType은 1 + intra_subpartitions_split_flag[x0][y0]으로 설정된다.
표 13 - IntraSubPartitionsSplitType에 대한 이름 연관관계
변수 NumIntraSubPartitions는 인트라 루마 코딩 블록이 분할되는 변환 블록 서브파티션의 개수를 명시한다. NumIntraSubPartitions은 다음과 같이 도출된다.
IntraSubPartitionsSplitType이 ISP_NO_SPLIT과 같으면, NumIntraSubPartitions가 1로 설정된다.
그렇지 않으면,
cbWidth가 4이고 cbHeight는 8인 조건, 및
cbWidth가 8이고 cbHeight가 4인 조건 조건 중 하나가 참이면, NumIntraSubPartitions가 2로 설정된다.
그렇지 않으면, NumIntraSubPartitions가 4로 설정된다.
도 11은 이미지 인코딩 및/또는 이미지 디코딩시 코딩 블록 내의 서브파티션 경계를 디블로킹하기 위한 디블로킹 방법의 흐름도이다. 여기서, 현재 코딩 블록은 인트라 예측 모드로 코딩되고, 현재 코딩 블록은 제1 서브파티션과 제1 서브파티션에 인접한 제2 서브파티션을 포함하는 서브파티션으로로 분할되며, 제2 서브파티션은 제1 서브파티션에 기초하여 인트라 예측된다. 도 6 내지 도 10과 관련하여 디블로킹 방법의 추가 세부사항에 대해 위에서 설명될 것이다.
단계 1101에서, 제1 서브파티션의 폭이 4개의 샘플이거나 또는 제2 서브파티션의 폭이 4개의 샘플일 때, 또는 제1 서브파티션의 높이가 4개의 샘플이거나 또는 제2 서브파티션의 높이가 4개의 샘플일 때, 제1 서브파티션에 대해 제1 최대 필터 길이가 1이라고 결정하거나 및/또는 제2 서브파티션에 대해 제2 최대 필터 길이가 1이라고 결정한다.
단계 1103에서, 제1 서브파티션의 최대 하나의 샘플의 값을 변경하거나 - 여기서, 최대 하나의 샘플은 제1 서브파티션과 제2 서브파티션 사이의 서브파티션 경계에 수직이면서 인접한 제1 서브파티션의 행 또는 열로부터 획득됨 -; 및/또는
단계 1105에서, 제2 서브파티션의 최대 하나의 샘플의 값을 변경한다. 여기서, 최대 하나의 샘플은 제1 서브파티션과 제2 서브파티션 사이의 서브파티션 경계에 수직이면서 인접한 제2 서브파티션의 행 또는 열로부터 획득된다.
이를 바탕으로, 본 발명은 서브파티션 경계에서 적은 수의 샘플 값을 변경할 수 있고, 따라서 SP가 적용된 블록에서 서브파티션 경계로 인한 블록 아티팩트를 감소시킬 수 있어서 코딩 효율을 개선한다.
도 12는 이미지 인코딩 및/또는 이미지 디코딩시 이미지 블록들 사이의 블록 에지(block edge)를 디블로킹하기 위한 디블로킹 방법의 흐름도이다. 여기서, 블록 에지는 현재 코딩 블록의 현재 서브파티션과 현재 코딩 블록의 이웃 블록 사이의 에지를 포함하고, 현재 코딩 블록은 인트라 예측 모드로 코딩되며, 현재 코딩 블록은 서브파티션으로 분할되고; 예를 들어 도 6 내지 도 10과 관련하여 디블로킹 방법의 추가 세부사항에 대해 위에서 설명될 것이다.
단계 1201에서, 현재 서브파티션의 폭이 4개의 샘플이거나 또는 현재 서브파티션의 높이가 4개의 샘플일 때, 현재 서브파티션에 대해 제3 최대 필터 길이가 1이라고 결정하거나 및/또는 이웃 블록에 대해 제4 최대 필터 길이가 1이라고 결정한다.
단계 1202에서, 현재 서브파티션의 최대 하나의 샘플의 값을 변경하거나 - 여기서, 최대 하나의 샘플은 현재 서브파티션과 이웃 블록 사이의 에지에 수직이면서 인접한 현재 서브파티션의 행 또는 열로부터 획득됨 -; 및/또는
단계 1203에서, 이웃 블록의 최대 하나의 샘플의 값을 변경한다. 여기서, 최대 하나의 샘플은 현재 서브파티션과 이웃 블록 사이의 에지에 수직이면서 인접한 이웃 블록의 행 또는 열로부터 획득된다.
이를 바탕으로, 본 발명은 서브파티션 경계에서 적은 수의 샘플 값을 변경할 수 있고, 따라서 ISP가 적용된 블록 내의 서브파티션 경계에 의해 야기될 수 있는 블록 아티팩트를 감소시키면서 블록 에지와 서브파티션 경계 사이의 필터링 중첩을 어느 정도 방지함으로써 코딩 효율을 개선한다.
도 13은 본 개시에 설명된 기술에 따라 코딩 블록 내의 서브파티션 경계를 디블로킹하기 위한 예시적인 장치(1300)를 도시한 블록도이다(이하, 예를 들어 도 2와 도 3 및 도 6 내지 도 10에 기초하여 추가적인 세부사항에 대해 설명할 것이다). 코딩 블록 내의 서브파티션 경계를 디블로킹하기 위해 이미지 인코더 및/또는 이미지 디코더에 사용될 장치가 제공된다. 여기서, 현재 코딩 블록은 인트라 예측 모드로 코딩되고, 현재 코딩 블록은 제1 서브파티션과 제1 서브파티션에 인접한 제2 서브파티션을 포함하는 서브파티션으로 분할되며, 일 예에서, 제2 서브파티션은 제1 서브파티션에 기초하여 인트라 예측된다.
여기서, 장치(1300)는 디블로킹 필터(1310)를 포함하고, 디블로킹 필터(1310)는,
- 제1 서브파티션의 폭이 4개의 샘플이거나 또는 제2 서브파티션의 폭이 4개의 샘플일 때, 또는 제1 서브파티션의 높이가 4개의 샘플이거나 또는 제2 서브파티션의 높이가 4개의 샘플일 때, 제1 서브파티션에 대해 제1 최대 필터 길이가 1이라고 결정하거나 및/또는 제2 서브파티션에 대해 제2 최대 필터 길이가 1이라고 결정하거나;
- 제1 서브파티션의 최대 하나의 샘플의 값을 결정하거나 - 여기서, 최대 하나의 샘플은 제1 서브파티션과 제2 서브파티션 사이의 서브파티션 경계에 수직이면서 인접한 제1 서브파티션의 행 또는 열로부터 획득됨 -; 및/또는
- 제2 서브파티션의 최대 하나의 샘플의 값을 변경하도록 구성된다. 여기서, 최대 하나의 샘플은 제1 서브파티션과 제2 서브파티션 사이의 서브파티션 경계에 수직이면서 인접한 제2 서브파티션의 행 또는 열로부터 획득된다.
도 14는 본 개시에 설명된 기술에 따라 블록 에지를 디블로킹하기 위한 예시적인 장치(1400)를 도시한 블록도이다(이하, 예를 들어 도 2와 도 3 및 도 6 내지 도 10에 기초하여 추가적인 세부사항에 대해 설명할 것이다). 이미지 인코더 및/또는 이미지 디코더에 사용될 장치가 제공된다. 여기서, 블록 에지는 현재 코딩 블록의 현재 서브파티션과 현재 코딩 블록의 이웃 블록 사이의 에지를 포함하고, 현재 코딩 블록은 인트라 예측 모드로 코딩되며, 현재 코딩 블록은 서브파티션으로 분할된다.
장치(1400)는 디블로킹 필터(1410)를 포함하고, 디블로킹 필터(1410)는,
- 현재 서브파티션의 폭이 4개의 샘플이거나 또는 현재 서브파티션의 높이가 4개의 샘플일 때, 현재 서브파티션에 대해 제3 최대 필터 길이가 1이라고 결정하거나 및/또는 이웃 블록에 대해 제4 최대 필터 길이가 1이라고 결정하거나;
- 현재 서브파티션의 최대 하나의 샘플의 값을 변경하거나 - 여기서, 최대 하나의 샘플은 현재 서브파티션과 이웃 블록 사이의 에지에 수직이면서 인접한 현재 서브파티션의 행 또는 열로부터 획득됨 -; 및/또는
- 이웃 블록의 최대 하나의 샘플의 값을 변경하도록 구성된다. 여기서, 최대 하나의 샘플은 현재 서브파티션과 이웃 블록 사이의 에지에 수직이면서 인접한 이웃 블록의 행 또는 열로부터 획득된다.
도 15는 디코딩 장치 또는 인코딩 장치에 구현되는 코딩의 방법의 흐름도이다.
단계 1501에서, 현재 픽처에 속하는 현재 코딩 블록의 재구성된 블록을 생성하고 - 여기서, 현재 코딩 블록은 인트라 예측 모드로 코딩되고, 현재 코딩 블록은 제1 서브파티션과 제2 서브파티션을 포함하는 서브파티션으로 분할되며, 제2 서브파티션은 제1 서브파티션에 기초하여 인트라 예측됨 -;
단계 1502에서, 현재 픽처의 재구성된 픽처에 대해 필터링을 수행하며 - 여기서, 현재 픽처의 재구성된 픽처에 대해 필터링을 수행하는 단계는, 현재 서브파티션의 높이가 4개의 샘플일 때 또는 현재 서브파티션의 폭이 4개의 샘플일 때, 재구성된 블록의 재구성된 서브파티션의 현재 서브파티션 내의 최대 하나의 샘플을 필터링하는 단계를 포함하고, 하나의 샘플은 현재 서브파티션과 현재 서브파티션에 인접하게 위치하는 다른 서브파티션 사이의 경계에 수직인 현재 서브파티션의 행 또는 열에 위치하며, 하나의 샘플은 경계에 인접한다.
이 실시예의 일부 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이면, 현재 서브파티션의 높이가 4개의 샘플일 때, 현재 서브파티션과 현재 서브파티션의 아래 또는 위에 있는 전술한 다른 서브파티션 사이의 경계에 수직이면서 인접한 현재 서브파티션의 열로부터 획득된 하나의 샘플의 값이 변경된다.
이 실시예의 일부 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 현재 서브파티션의 폭이 4개의 샘플일 때, 현재 서브파티션과 현재 서브파티션 좌측 또는 우측에 있는 전술한 다른 서브파티션 사이의 경계에 수직이면서 인접한 현재 서브파티션의 행으로부터 획득된 하나의 샘플의 값이 변경된다.
실시예의 일부 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수평이면, 현재 서브파티션과 현재 서브파티션에 인접하게 위치하는 전술한 다른 서브파티션 사이의 경계가 수평 서브파티션 경계이거나; 또는
현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 현재 서브파티션과 현재 서브파티션에 인접하게 위치하는 전술한 다른 서브파티션 사이의 경계가 수직의 서브파티션 경계이다.
이 실시예의 일부 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 제1 서브파티션은 제2 서브파티션 좌측에 있고, 제2 서브파티션은 제1 서브파티션의 재구성된 값에 기초하여 인트라 예측되며;
현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수평이면, 제1 서브파티션은 제2 서브파티션 위에 있고, 제2 서브파티션은 제1 서브파티션의 재구성된 값에 기초하여 인트라 예측된다.
이 실시예의 일부 구현 형태에서, 현재 서브파티션은 제1 서브파티션의 재구성된 버전 또는 제2 서브파티션의 재구성된 버전이다.
이 실시예의 일부 구현 형태에서, 서브파티션의 개수가 2개 또는 4개이다.
이 실시예의 일부 구현 형태에서,
- 코딩 블록의 폭이 4이고 코딩 블록의 높이가 8이면 및/또는 코딩 블록의 폭이 8이고 코딩 블록의 높이가 4이면, 서브파티션의 개수가 2개이고,
- 그렇지 않으면, 서브파티션의 개수가 4개이다.
이 실시예의 가능한 추가적인 구현 형태에서, 현재 서브파티션과 다른 서브파티션 사이의 경계가 재구성된 블록의 n×n 샘플 그리드와 중첩하는 경우에만, 현재 서브파티션 내의 최대 하나의 샘플의 필터링이 수행된다(n은 정수). 예를 들어, n=4이거나 또는 n=8이다. 따라서, 계산 부하가 더 낮아질 수 있다.
이 실시예의 가능한 추가적인 구현 형태에서,
서브파티션들의 높이가 모두 4개의 샘플일 때 또는 서브파티션들의 폭이 모두 4개의 샘플일 때에만, 현재 서브파티션의 최대 하나의 샘플의 필터링이 수행된다. 따라서, 전체 코딩 과정의 계산 부하가 더 줄어들 수 있다.
특히, 서브파티션은 직사각형 변환 블록 서브파티션이다. ISP가 분할될 때, 각각의 서브파티션이 변환 블록이다.
본 개시에서, 코딩 블록은 인트라 서브파티션(ISP) 툴을 이용하여 코딩된다.
이 실시예의 가능한 추가적인 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면(예를 들어, 예측 블록을 서브파티션으로 분할하는 것이 수직 방향으로 수행될 수 있음), 서브파티션을 인트라 예측하는 순서가 "좌측에서 우측으로"이거나 또는 "우측에서 좌측으로"이거나, 또는
현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형 수평이면(예측 블록을 서브파티션으로 분할하는 것이 수평 방향으로 수행될 수 있음), 서브파티션을 인트라 예측하는 순서가 "위에서 아래로"이거나 또는 "아래에서 위로"이다.
특히, 현재 서브파티션은 제1 서브파티션의 재구성된 버전(즉, 재구성된 값) 또는 제2 서브파티션의 재구성된 버전(즉, 재구성된 값)이다. 예를 들어, 서브파티션의 개수가 2개 또는 4개일 수 있다.
코딩 블록은 인트라 서브파티션(ISP) 툴을 이용하여 코딩될 수 있다. ISP 코딩 툴은 인트라 예측이 있는 코딩 블록에만 적용된다. 코딩 블록/인트라 예측 블록의 파티셔닝은 1D 서브파티션 또는 서브파티션의 라인을 초래할 수 있다. 디블로킹 방법이 이미지 인코딩에 사용되면, 재구성된 블록의 생성은, (당 업계에 알려져 있는 바와 같이) 현재 블록(즉, 원래 블록)과 인트라 예측 블록에 기반한 잔차 블록의 계산, 잔차 블록의 잔차 계수의 변환 및 양자화, 재구성된 잔차 블록을 획득하기 위한 역양자화 및 역변환의 프로세스 흐름에 기초한다(아래의 상세한 설명을 참조하라). 재구성된 블록은 재구성된 잔차 블록과 예측 블록에 기초하여 획득된다. 디블로킹 방법이 이미지 디코딩에 사용되면, 재구성된 블록의 생성은, (당 업계에 알려져 있는 바와 같이) 수신된 비트스트림에 포함된 정보에 기초하여 잔차 블록의 잔차 계수를 획득하는 것, 잔차 블록의 잔차 계수의 변환 및 양자화, 재구성된 잔차 블록을 얻기 위한 역양자화 및 역변환의 프로세스 흐름에 기초한다(아래의 상세한 설명을 참조하라). 재구성된 블록은 재구성된 잔차 블록과 예측 블록에 기초하여 획득된다. 또한, 현재 블록을 포함하는 현재 이미지의 재구성된 픽처는, 최대 하나의 샘플을 필터링함으로써 블록 기반의 이미지 인코딩 방식으로, 블록 경계에 인접한 최대 하나의 샘플을 변경하는 것을 포함하는 경계의 필터링을 의미하는 필터링 프로세스에 입력된다. 이러한 종류의 디블로킹의 결정은 3개의 샘플(수직 서브파티션들 간의 경계의 필터링을 위해 동일한 행에 인접하거나 또는 수평 서브파티션들 간의 경계 필터링을 위해 동일한 열에 인접한 샘플; 위의 자세한 설명 참조하라)에만 기초할 수 있다.
일반적으로, 코딩 블록의 서브파티션들 사이의 모든 경계의 경계 세기가 필터링 프로세스의 세기를 나타내는 상수 값(예를 들어, 2)으로 설정되어 전반적인 처리를 단순화할 수 있다.
본 발명에 따라 사용되는 약한 필터링(최대 하나의 샘플)은 불필요한 높은 계산 부하와 메모리 자원을 필요로 하지 않으면서 작은 블록에서 블록 아티팩트를 감소시킬 수 있게 한다.
도 16은 디코딩 장치 또는 인코딩 장치에 구현되는 다른 코딩 방법의 흐름도이다.
단계 1601에서, 현재 픽처에 속하는 현재 코딩 블록의 재구성된 블록을 생성하고 - 여기서, 현재 코딩 블록은 인트라 예측 모드로 코딩되고, 현재 코딩 블록은 제1 서브파티션과 제2 서브파티션을 포함하는 서브파티션으로 분할되며, 제2 서브파티션은 제1 서브파티션에 기초하여 인트라 예측됨 -;
단계 1603에서, 현재 픽처의 재구성된 픽처에 대해 필터링을 수행한다. 여기서, 현재 픽처의 재구성된 픽처에 대해 필터링을 수행하는 단계는 현재 서브파티션의 최대 필터 길이와 이웃 블록의 최대 필터 길이에 기초하여 재구성된 블록의 현재 서브파티션과 현재 서브파티션에 인접한 이웃 블록 사이의 경계(즉, 현재 블록의 이웃 블록)를 필터링하는 단계를 포함하고, 현재 서브파티션의 높이가 4개의 샘플일 때 또는 현재 서브파티션의 폭이 4개의 샘플일 때 현재 서브파티션의 최대 필터 길이와 이웃 블록의 최대 필터 길이가 1이다.
일 예에서, 단계 1203은,
- 현재 서브파티션의 최대 필터 길이(MA)에 기초하여, 경계에 인접한 현재 서브파티션의 하나의 샘플 값을 변경하는 단계; 및
- 이웃 블록의 최대 필터 길이(MB)에 기초하여, 경계에 인접한 이웃 블록의 샘플 값을 변경하는 단계를 포함할 수 있다.
MA=1이고, MB=1이다.
특히, 단계 1203은,
- 현재 서브파티션의 샘플 값의 최대 개수(MA)를 변경하는 단계 - 샘플의 최대 개수(MA)가 경계에 수직이면서 인접한 라인에 있고, MA = 1임 -를 포함할 수 있고;
최대 필터 길이(MB)에 기초하여, 경계에 인접한 이웃 블록의 샘플 값을 변경하는 단계는,
- 이웃 블록의 최대 개수(MB)의 샘플 값을 변경하는 단계 - 샘플의 최대 개수(MB)가 이 경계에 수직이면서 인접한 라인에 있고, MB = 1임 -를 포함한다.
여기서, 현재 서브파티션의 최대 필터 길이는 현재 서브파티션에 대한 필터링 과정에서 변경될 수 있는 샘플 개수를 지칭한다. 이웃 블록의 최대 필터 길이는 이웃 블록에 대한 필터링 과정세서 변경될 수 있는 샘플의 개수를 지칭한다.
이 실시예의 일부 구현 형태에서, 제1 서브파티션은 코딩 블록에 인접하게 위치하는 다른 재구성된 블록에 기초하여 인트라 예측된다.
이 실시예의 가능한 추가적인 구현 형태에서, 경계가 재구성된 블록의 n×n 샘플 그리드와 중첩하는 경우에만 필터링이 수행되고, n은 정수이다. 예를 들어, n은 4 또는 8이다.
이 실시예의 일부 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이면, 현재 서브파티션의 높이가 4개의 샘플일 때, 현재 서브파티션과 현재 서브파티션 아래 또는 위에 있는 전술한 이웃 블록 사이의 경계에 수직이면서 인접한 현재 서브파티션의 열로부터 획득된 하나의 샘플의 값이 변경된다.
이 실시예의 일부 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 현재 서브파티션의 폭이 4개의 샘플일 때, 현재 서브파티션과 현재 서브파티션의 좌측 또는 우측에 있는 전술한 이웃 블록 사이의 경계에 수직이면서 인접한 현재 서브파티션의 행으로부터 획득된 하나의 샘플의 값이 변경된다.
이 실시예의 일부 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수평이면, 현재 서브파티션과 현재 서브파티션에 인접하게 위치하는 전술한 이웃 블록 사이의 경계가 수평 경계이거나; 또는
현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 현재 서브파티션과 현재 서브파티션에 인접하게 위치하는 전술한 이웃 블록 사이의 경계가 수직 경계이다.
이 실시예의 일부 구현 형태에서, 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 제1 서브파티션은 제2 서브파티션 좌측에 있고, 제2 서브파티션은 제1 서브파티션의 재구성된 값에 기초하여 인트라 예측되고;
현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수평이면, 제1 서브파티션은 제2 서브파티션 위에 있고, 제2 서브파티션은 제1 서브파티션의 재구성된 값에 기초하여 인트라 예측된다.
특히, 서브파티션의 개수가 2개 또는 4개이다. 따라서, 서브파티션의 개수가 2개일 때, 현재 블록 내부에는 제1 서브파티션과 제2 서브파티션이 있고, 현재 서브파티션은 제1 서브파티션의 재구성된 버전 또는 제2 서브파티션의 재구성된 버전일 수 있다.
따라서, 서브파티션의 개수가 4개일 때, 현재 블록 내부에는 제1 서브파티션, 제2 서브파티션, 제3 서브파티션, 및 제4 서브파티션이 있고, 현재 서브파티션은 제1 서브파티션의 재구성된 버전이거나 또는 제4 서브파티션의 재구성된 버전일 수 있다.
제1 서브파티션, 제2 서브파티션, 제3 서브파티션, 및 제4 서브파티션이 서브파티션에 대해 다르게 사용될 뿐이라고 이해할 수 있을 것이다. 일부 경우에, 서브파티션들의 높이가 모두 4개의 샘플이거나 또는 서브파티션들의 폭이 모두 4개의 샘플이다.
이 실시예의 가능한 추가적인 구현 형태에서,
- 코딩 블록의 폭이 4이고 코딩 블록의 높이가 8이면 및/또는 코딩 블록의 폭이 8이고 코딩 블록의 높이가 4이면, 서브파티션의 개수가 2개이고,
- 그렇지 않으면, 서브파티션의 개수가 4개이다.
실시예의 가능한 추가적인 구현 형태에서, 경계가 재구성된 블록의 n×n 샘플 그리드와 중첩하는 경우에만 필터링이 수행되고, n은 정수이다. 예를 들어, n은 4 또는 8이다.
특히, 서브파티션은 직사각형 변환 블록 서브파티션이다.
본 개시에서, 코딩 블록은 인트라 서브파티션(ISP) 툴을 이용하여 코딩된다.
도 17은 본 개시에 설명된 기술에 따른 예시적인 장치(1700)의 블록도(이하, 예를 들어 도 6 내지 도 10, 및 도 15에 기초하여 추가적인 세부사항에 대해 설명할 것이다). 이 장치는 이미지 인코더 및/또는 이미지 디코더에 사용하기 위한 것이다. 일 예에서, 장치(1700)는 도 2의 인코더에 대응할 수 있다. 다른 예에서, 장치(1700)는 도 3의 디코더에 대응할 수 있다. 이 장치는,
현재 픽처에 속하는 현재 코딩 블록의 재구성된 블록을 생성하도록 구성된 재구성 유닛(1701) - 현재 코딩 블록은 인트라 예측 모드로 코딩되고, 현재 코딩 블록은 제1 서브파티션과 제2 서브파티션을 포함하는 서브파티션으로 분할되며, 제2 서브파티션은 제1 서브파티션에 기초하여 인트라 예측됨 -; 및
현재 픽처의 재구성된 픽처에 대해 필터링을 수행하도록 구성된 필터링 유닛(1730)을 포함할 수 있다. 필터링 유닛(1730)은 구체적으로, 현재 서브파티션의 높이가 4개의 샘플일 때 또는 현재 서브파티션의 폭이 4개의 샘플일 때, 재구성된 블록의 재구성된 서브파티션의 현재 서브파티션 내의 최대 하나의 샘플을 필터링하도록 구성된다. 여기서, 하나의 샘플은 현재 서브파티션과 현재 서브파티션에 인접하게 위치하는 다른 서브파티션 사이의 경계에 수직인 현재 서브파티션의 행 또는 열에 위치하고, 하나의 샘플은 경계에 인접한다.
도 18는 본 개시에 설명된 기술에 따른 예시적인 장치(1800)를 도시한 블록도이다(이하, 예를 들어 도 6 내지 도 10, 및 도 16에 기초하여 추가적인 세부사항에 대해 설명할 것이다). 이 장치는 이미지 인코더 및/또는 이미지 디코더에 사용되기 위한 것이다. 일 예에서, 장치(1800)는 도 2의 인코더에 대응할 수 있다. 다른 예에서, 장치(1800)는 도 3의 디코더에 대응할 수 있다. 이 장치는,
현재 픽처에 속한 현재 코딩 블록의 재구성된 블록을 생성하도록 구성된 재구성 유닛(1810) - 현재 코딩 블록은 인트라 예측 모드로 코딩되고, 현재 코딩 블록은 제1 서브파티션과 제2 서브파티션을 포함하는 서브파티션으로 분할되며, 제2 서브파티션은 제1 서브파티션에 기초하여 인트라 예측됨 -; 및
현재 픽처의 재구성된 픽처에 대해 필터링을 수행하도록 구성된 필터링 유닛(1830)을 포함할 수 있다. 필터링 유닛(1830)은 구체적으로, 현재 서브파티션의 최대 필터 길이와 이웃 블록의 최대 필터 길이에 기초하여, 재구성된 블록의 현재 서브파티션과 현재 서브파티션에 인접한 이웃 블록 사이의 경계를 필터링하도록 구성되고, 현재 서브파티션의 높이가 4개의 샘플일 때 또는 현재 서브파티션의 폭이 4개의 샘플일 때, 현재 서브파티션과 이웃 블록의 각각의 최대 필터 길이가 1이다.
이를 바탕으로, 본 발명은 서브파티션 경계에서 적은 수의 샘플 값을 변경할 수 있고, 따라서 ISP가 적용된 블록 내의 서브파티션 경계에 의해 야기될 수 있는 블록 아티팩트를 감소시키면서 블록 에지와 서브파티션 경계 사이의 필터링 중첩을 어느 정도 방지함으로써, 코딩 효율을 개선한다.
전술한 실시예에서 도시된 인코딩 방법 및 디코딩 방법의 적용과 이를 사용하는 시스템에 대한 설명은 다음과 같다.
도 19는 콘텐츠 배포 서비스를 실현하기 위한 콘텐츠 공급 시스템(3100)을 도시한 블록도이다. 이 콘텐츠 공급 시스템(3100)은 캡처 장치(3102)와 단말 장치(3106)를 포함하고, 선택적으로 디스플레이(3126)를 포함한다. 캡처 장치(3102)는 통신 링크(3104)를 통해 단말 장치(3106)와 통신한다. 통신 링크는 전술한 통신 채널(13)을 포함할 수 있다. 통신 링크(3104)는 WIFI, 이더넷, 케이블, 무선(3G/4G/5G), USB, 또는 이들의 어떤 종류의 조합을 포함하지만 이에 제한되지 않는다.
캡처 장치(3102)는 데이터를 생성하고, 전술한 실시예에 도시된 인코딩 방법으로 데이터를 인코딩할 수 있다. 대안적으로, 캡처 장치(3102)는 데이터를 스트리밍 서버(도면에 도시되지 않음)에 배포할 수 있고, 서버는 데이터를 인코딩하고 인코딩된 데이터를 단말 장치(3106)에 전송한다. 캡처 장치(3102)는 카메라, 스마트폰 또는 패드, 컴퓨터 또는 랩톱, 화상 회의 시스템, PDA, 차량 장착형 장치, 또는 이들 중 어떤 조합을 포함하지만 이에 제한되지 않는다. 예를 들어, 캡처 장치(3102)는 전술한 바와 같이 소스 장치(12)를 포함할 수 있다. 데이터가 비디오를 포함하는 경우, 캡처 장치(3102)에 포함된 비디오 인코더(20)는 실제로 비디오 인코딩 처리를 수행할 수 있다. 데이터가 오디오(즉, 음성)를 포함하는 경우, 캡처 장치(3102)에 포함된 오디오 인코더는 실제로 오디오 인코딩 처리를 수행할 수 있다. 일부 실제 시나리오를 위해, 캡처 장치(3102)는 인코딩된 비디오와 오디오 데이터를 함께 다중화함으로써 분배한다. 다른 실제 시나리오의 경우, 예를 들어 화상 회의 시스템에서, 인코딩된 오디오 데이터와 인코딩된 비디오 데이터가 다중화되지 않는다. 캡처 장치(3102)는 인코딩된 오디오 데이터와 인코딩된 비디오 데이터를 단말 장치(3106)에 개별적으로 배포한다.
콘텐츠 공급 시스템(3100)에서, 단말 장치(310)는 인코딩된 데이터를 수신하고 재생한다. 단말 장치(3106)는 전술한 인코딩된 데이터를 디코딩할 수 있는 데이터 수신 및 재생 기능을 가진 장치, 예컨대 스마트폰 또는 패드(3108), 컴퓨터 또는 랩톱(3110), 네트워크 비디오 레코더(network video recorder, NVR)/디지털 비디오 레코더(DVR, 3112), TV(3114), 셋톱 박스(STB, 3116), 화상 회의 시스템(3118), 비디오 감시 시스템(3120), 개인 정보 단말기(PDA, 3122), 차량 장착형 장치(3124), 또는 이들 중 어떤 것의 조합일 수 있다. 예를 들어, 단말 장치(3106)는 전술한 바와 같이 목적지 장치(14)를 포함할 수 있다. 인코딩된 데이터가 비디오를 포함하는 경우, 단말 장치에 포함된 비디오 디코더(30)는 비디오 디코딩을 수행할 우선 순위를 가지고 있다. 인코딩된 데이터가 오디오를 포함하는 경우, 단말 장치에 포함된 오디오 디코더가 오디오 디코딩 처리를 수행할 우선 순위를 가지고 있다.
디스플레이가 있는 단말 장치, 예를 들어 스마트폰 또는 패드(3108), 컴퓨터 또는 랩톱(3110), 네트워크 비디오 레코더(NVR)/디지털 비디오 레코더(DVR, 3112), TV(3114), 개인 정보 단말기(PDA, 3122), 또는 차량 장착형 장치(3124)의 경우, 단말 장치는 디코딩된 데이터를 디스플레이에 공급할 수 있다. 디스플레이가 없는 단말 장치의 경우, 예를 들어, STB(3116), 화상 회의 시스템(3118), 또는 비디오 감시 시스템(3120), 외부 디스플레이(3126)가 내부에 접촉되어 디코딩된 데이터를 수신하고 보여준다.
이 시스템의 각각의 장치가 인코딩 또는 디코딩을 수행할 때, 전술한 실시 예에 도시된 바와 같이, 픽처 인코딩 장치 또는 픽처 디코딩 장치가 사용될 수 있다.
도 20은 단말 장치(3106)의 예의 구조를 도시한 도면이다. 단말 장치(3106)가 캡처 장치(3102)로부터 스트림을 수신한 후에, 프로토콜 프로시딩 유닛(3202)이 스트림의 전송 프로토콜을 분석한다. 전송 프로토콜은 RTSP(Real Time Streaming Protocol), HTTP(Hyper Text Transfer Protocol), HLS(HTTP Live Streaming Protocol), MPEG-DASH, RTP(Real-time Transport Protocol), RTMP(Real Time Messaging Protocol), 또는 이들의 어떤 종류의 조합 등을 포함하지만 이에 제한되지 않는다.
프로토콜 프로시딩 유닛(3202)이 스트림을 처리한 후에, 스트림 파일이 생성된다. 스트림 파일은 역다중화 유닛(3204)에 출력된다. 역다중화 유닛(3204)은 다중화된 데이터를 인코딩된 오디오 데이터와 인코딩 된비디오 데이터로 분리할 수 있다. 전술한 바와 같이, 일부 실제 시나리오의 경우, 예를 들어 화상 회의 시스템에서, 인코딩된 오디오 데이터와 인코딩된 비디오 데이터는 다중화되지 않는다. 이 상황에서, 인코딩된 데이터는 역다중화 유닛(3204)을 통하지 않고 비디오 디코더(3206)와 오디오 디코더(3208)에 전송된다.
역다중화 처리를 통해, 비디오 ES(Elementary Stream), 오디오 ES, 및 선택적으로 서브타이틀이 생성된다. 전술한 실시예에서 설명된 비디오 디코더(30)를 포함하는 비디오 디코더(3206)는 전술한 실시예에 도시된 디코딩 방법으로 비디오 ES를 디코딩하여 비디오 프레임을 생성하고, 이 데이터를 싱크로너스 유닛(3212)에 공급한다. 오디오 디코더(3208)는 오디오 ES를 디코딩하여 오디오 프레임을 생성하고, 이 데이터를 싱크로너스 유닛(3212)에 공급한다. 대안적으로, 비디오 프레임은 싱크로너스 유닛(3212)에 공급되기 전에 버퍼(도 Y에 도시되지 않음)에 저장될 수 있다. 유사하게, 오디오 프레임은 싱크로너스 유닛 (3212)에 공급되기 전에 버퍼(도 Y에 도시되지 않음)에 저장될 수 있다.
싱크로너스 유닛(3212)은 비디오 프레임과 오디오 프레임을 동기화하고, 비디오/오디오를 비디오/오디오 디스플레이(3214)에 공급한다. 예를 들어, 싱크로너스 유닛(3212)은 비디오 및 오디오 정보의 프리젠테이션을 동기화한다. 인코딩된 시청각 데이터의 프리젠테이션에 관한 타임 스탬프와 데이터 스트림 자체의 전달에 관한 타임 스탬프를 이용하여 정보가 코딩될 수 있다.
서브타이틀이 스트림에 포함되면, 서브타이틀 디코더(3210)는 서브타이틀을 인코딩하고, 서브타이틀을 비디오 프레임 및 오디오 프레임과 동기화하며, 비디오/오디오/서브타이틀을 비디오/오디오/서브타이틀 디스플레이(3216)에 공급한다.
본 발명은 전술한 시스템에 제한되지 않고, 전술한 실시예의 픽처 인코딩 장치 또는 픽처 디코딩 장치가 다른 시스템, 예를 들어 자동차 시스템에 통합될 수 있다.
본 명세서에서는 다양한 실시예와 관련하여 본 발명에 대해 설명하였다. 하지만, 도면, 개시, 및 첨부된 청구 범위의 연구로부터 청구된 발명을 실시함에 있어서 개시된 실시예에 대한 다른 변형이 당업자에 의해 이해되고 실행될 수 있을 것이다. 청구 범위에서, "포함"이라는 단어가 다른 요소 또는 단계를 배제하지 않으며, "하나"가 복수를 배제하지 않는다. 단일 프로세서 또는 다른 유닛이 청구 범위에 인용된 여러 항목의 기능을 수행할 수 있다. 특정 수단이 일반적으로 서로 다른 종속항에 언급되어 있다는 사실만으로는 이러한 수단의 조합이 이점으로서 사용될 수 없다는 것을 나타내지 않는다. 컴퓨터 프로그램은 다른 하드웨어와 함께 또는 그 일부로서 제공되는 광 저장 매체 또는 솔리드 스테이트 매체와 같은 적절한 매체에 저장/배포될 수 있지만, 다른 형태로, 예컨대 인터넷 또는 다른 유선이나 무선 통신 시스템을 통해 배포될 수 있다.
당업자는 다양한 도면(방법 및 장치)의 "블록"("유닛")이 (하드웨어 또는 소프트웨어의 개별적인 "유닛"이 아니라) 본 발명의 실시예의 기능을 나타내거나 설명하고, 따라서 장치 실시예뿐만 아니라 방법 실시예의 기능이나 특징을 동일하게 설명한다는 것을 이해할 것이다(단위 = 단계).
"유닛"이라는 용어가 인코더/디코더의 실시예의 기능의 예시적인 목적으로만 사용되며, 본 개시를 제한하려는 의도가 아니다.
본 출원에서 제공된 여러 실시예에서, 개시된 시스템, 장치, 및 방법이 다른 방식으로 구현될 수 있다는 것을 이해해야 한다. 예를 들어, 설명된 장치 실시예는 예시적인 것에 불과하다. 예를 들어, 유닛 구분은 논리적인 기능 구분일 뿐이고 실제 구현에서는 다르게 구분될 수 있다. 예를 들어, 복수의 유닛 또는 구성 요소가 다른 시스템에 결합되거나 통합될 수 있거나, 또는 일부 특징이 무시되거나 수행되지 않을 수 있다. 또한, 표시되거나 논의된 상호 결합 또는 직접 결합 또는 통신 연결은 일부 인터페이스를 이용하여 구현될 수 있다. 이러한 장치들 또는 유닛들 간의 간접 결합 또는 통신 연결은 전자적 형태, 또는 기계적 형태, 또는 다른 형태로 구현될 수 있다.
별도의 부분으로 설명된 유닛은 물리적으로 분리되거나 또는 분리되지 않을 수 있고, 유닛으로 표시된 부분이 물리적 단위일 수 있거나 물리적 단위가 아닐 수 있거나, 또는 하나의 위치에 위치할 수 있거나, 또는 복수의 네트워크 유닛에 분산될 수 있다. 이러한 유닛 중 일부 또는 전부가 실제 필요에 따라 선택되어 이러한 실시예의 해결책의 목적을 달성할 수 있다.
또한, 본 발명의 실시예의 기능 유닛들이 하나의 처리 유닛으로 통합될 수 있거나, 또는 각각의 유닛이 물리적으로 단독으로 존재할 수 있거나, 또는 2개 이상의 유닛이 하나의 유닛으로 통합될 수 있다.
본 발명의 실시예는 장치, 예를 들어 본 명세서에 설명된 디블로킹 방법 및/또는 프로세스 중 어느 것을 수행하도록 구성된 처리 회로를 포함하는 인코더 및/또는 디코더를 더 포함할 수 있다..
비디오 코딩에 기초하여 본 발명의 실시예에 대해 설명하였지만, 코딩 시스템(10), 인코더(20) 및 디코더(30)의 실시예 (및 그에 따른 시스템(10))과 본 명세서에 설명된 다른 실시예가, 스틸 픽처 처리 또는 코딩, 즉 비디오 코딩에서와 같이 선행하거나 또는 연속적인 어떤 픽처와는 독립적인 개별 픽처의 처리 또는 코딩을 위해 구성될 수도 있다는 것을 유의해야 한다. 일반적으로, 픽처 처리 코딩이 단일 픽처(17)로 제한되는 경우 인터 예측 유닛(244)(인코더)과 인터 예측 유닛(344)(디코더)만이 이용 가능하지 않을 수 있다. 비디오 인코더(20)와 비디오 디코더(30)의 다른 모든 기능(툴 또는 기술이라고도 함), 예를 들어 잔차 계산(204/304), 변환(206), 양자화(208), 역양자화(210/310), (역)변환(212/312), 파티셔닝(262/362), 인트라 예측(254/354), 및/또는 루프 필터링(220, 320), 및 엔트로피 코딩(270)과 엔트로피 디코딩(304)이 스틸 픽처 처리에 동일하게 사용될 수 있다.
예를 들어, 본 명세서에 설명된 인코더(20)와 디코더(30)의 실시예, 및 기능은, 예를 들어 인코더(20)와 디코더(30)를 참조하여, 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 어떤 조합으로 구현될 수 있다. 소프트웨어로 구현되면, 이러한 기능은 컴퓨터 판독가능 매체에 저장되거나 또는 통신 매체를 통해 하나 이상의 명령 또는 코드로서 전송되고 하드웨어 기반의 처리 장치에 의해 실행될 수 있다. 컴퓨터 판독가능 매체는 데이터 저장 매체와 같은 유형의 매체에 대응하는 컴퓨터 판독가능 저장 매체를 포함하거나, 또는 예를 들어 통신 프로토콜에 따라 한 장소에서 다른 장소로 컴퓨터 프로그램을 전송하는 것을 용이하게 하는 어떤 매체를 포함하는 통신 매체를 포함할 수 있다. 이와 같이, 컴퓨터 판독가능 매체는 일반적으로 (1) 비일시적 유형의 컴퓨터 판독가능 저장 매체 또는 (2) 신호 또는 반송파와 같은 통신 매체에 대응할 수 있다. 데이터 저장 매체는 본 개시에 설명된 기술의 구현을 위한 명령, 코드, 및/또는 데이터 구조를 검색하기 위해 하나 이상의 컴퓨터 또는 하나 이상의 프로세서에 의해 액세스될 수 있는 이용 가능한 어떤 매체일 수 있다. 컴퓨터 프로그램 제품이 컴퓨터 판독가능 매체를 포함할 수 있다.
제한이 아닌 예로서, 이러한 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, CD-ROM, 또는 다른 광 디스크 스토리지, 자기 디스크 스토리지 또는 다른 자기 스토리지, 플래시 메모리, 또는 명령이나 데이터 구조의 형태로 원하는 프로그램 코드를 저장하는 데 사용할 수 있고 또한 컴퓨터에 의해 액세스될 수 있는 다른 매체를 포함할 수 있다. 또한, 어떤 연결은 적절하게 컴퓨터 판독가능 매체라고 한다. 예를 들어, 동축 케이블, 광섬유 케이블, 트위스티드 페어(twisted pair), 디지털 가입자 회선(digital subscriber line , DSL), 또는 적외선, 라디오, 및 마이크로파와 같은 무선 기술을 이용하는 웹사이트, 서버, 또는 다른 원격 소스로부터 명령이 전송되면, 동축 케이블, 광섬유 케이블, 트위스티드 페어, DSL, 또는 적외선, 라디오, 및 마이크로파와 같은 무선 기술이 매체의 정의에 포함된다. 하지만, 컴퓨터 판독가능 저장 매체와 데이터 저장 매체가 연결, 반송파, 신호, 또는 다른 일시적 매체를 포함하지 않고, 대신에 유형의 비일시적 저장 매체를 지향한다는 것을 이해해야 한다. 본 명세서에 사용되는 디스크(disk)와 디스크(disc)가 콤팩트 디스크(CD), 레이저 디스크, 광 디스크, 디지털 다기능 디스크(DVD), 플로피 디스크, 및 블루레이 디스크를 포함한다. 여기서, 디스크(disk)는 일반적으로 데이터를 자기적으로 재생하는 반면, 디스크(disc)는 레이저로 데이터를 광학적으로 재생한다. 위의 조합도 컴퓨터 판독가능 매체의 범위에 포함되어야 한다.
명령은 하나 이상의 프로세서, 예컨대 하나 이상의 디지털 신호 프로세서(digital signal processor, DSP), 범용 마이크로프로세서, 주문형 반도체(application specific integrated circuit, ASIC), 필드 프로그래머블 로직 어레이(field programmable logic array, FPGA), 또는 기타 동등한 통합 로직 회로 또는 개별 로직 회로에 의해 수행될 수 있다. 따라서, 본 명세서에서 사용되는 "프로세서"와 같은 용어는 전술한 구조 또는 본 명세서에 설명된 기술의 구현에 적합한 어떤 다른 구조를 지칭할 수 있다. 또한, 일부 양태에서, 본 명세서에 설명된 기능은 인코딩과 디코딩을 위해 구성된 전용 하드웨어 및/또는 소프트웨어 모듈 내에 제공되거나 또는 결합된 코덱에 통합될 수 있다. 또한, 이러한 기술은 하나 이상의 회로 또는 로직 엘리먼트에서 완전하게 구현될 수 있다.
본 개시의 기술은 무선 핸드셋, 집적 회로(integrated circuit, IC), 또는 IC의 세트(예를 들어, 칩 세트)를 포함하는 광범위한 디바이스 또는 장치에서 구현될 수 있다. 본 개시에서는 개시된 기술을 수행하도록 구성된 장치의 기능적 측면을 강조하기 위해 다양한 구성 요소, 모듈, 또는 유닛에 대해 설명하였지만, 반드시 서로 다른 하드웨어 유닛에 의한 구현을 필요로 하는 것은 아니다. 오히려, 전술한 바와 같이, 다양한 유닛이 코덱 하드웨어 유닛으로 결합되거나, 또는 적절한 소프트웨어 및/또는 펌웨어와 함께, 전술한 하나 이상의 프로세서를 포함하는 상호 작동하는 하드웨어 유닛의 집합으로서 제공될 수 있다.

Claims (14)

  1. 이미지 인코딩 또는 이미지 디코딩시 코딩 블록 내의 서브파티션 경계를 디블로킹(deblock)하기 위한 디블로킹 방법으로서,
    현재 코딩 블록이 인트라 예측 모드(intra prediction mode)로 코딩되고, 상기 현재 코딩 블록은 인트라 서브파티션(intra sub-partition, ISP) 툴에 의해 서브파티션으로 분할되며, 상기 서브파티션은 제1 서브파티션과 상기 제1 서브파티션에 인접한 제2 서브파티션을 포함하며, 상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형(intra sub-partitions split type)이 수직이면, 상기 디블로킹 방법은,
    상기 제1 서브파티션의 폭이 4개의 샘플일 때, 또는 상기 제2 서브파티션의 폭이 4개의 샘플일 때, 상기 제1 서브파티션에 대해 제1 최대 필터 길이가 1이라고 결정하는 것 또는 상기 제2 서브파티션에 대해 제2 최대 필터 길이가 1이라고 결정하는 것 중 하나 이상을 결정하는 단계; 및
    상기 제1 최대 필터 길이에 기초하여, 상기 제1 서브파티션의 최대 하나의 샘플의 값을 변경하는 것 - 여기서, 상기 최대 하나의 샘플은 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계에 수직인 상기 제1 서브파티션의 행(row)으로부터 획득되고, 상기 최대 하나의 샘플은 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계에 인접함 -; 또는 상기 제2 최대 필터 길이에 기초하여, 상기 제2 서브파티션의 최대 하나의 샘플의 값을 변경하는 것 - 여기서, 상기 최대 하나의 샘플은 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계에 수직인 상기 제2 서브파티션의 행(row)으로부터 획득되고, 상기 최대 하나의 샘플은 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계에 인접함 - 중 하나 이상을 수행하는 단계
    를 포함하고,
    상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계는 상기 인트라 서브파티션 툴에 의해 야기되고, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계는 상기 현재 코딩 블록의 내부이며,
    상기 제1 서브파티션에 대한 제1 최대 필터 길이는, 상기 서브파티션 경계에 수직이고 상기 서브파티션 경계에 인접한 각각의 행에서, 상기 제1 서브파티션에 대해 수정이 허용되는 최대 샘플 수를 의미하고, 상기 제2 서브파티션에 대한 제2 최대 필터 길이는, 상기 서브파티션 경계에 수직이고 상기 서브파티션 경계에 인접한 각각의 행에서, 상기 제2 서브파티션에 대해 수정이 허용되는 최대 샘플 수를 의미하는, 디블로킹 방법.
  2. 제1항에 있어서,
    상기 현재 코딩 블록을 서브파티션으로 분할하는 인트라 서브파티션 분할 유형이 수직이면, 상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 수직 서브파티션 경계인, 디블로킹 방법.
  3. 제1항에 있어서,
    상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면, 상기 제1 서브파티션은 상기 제2 서브파티션 왼쪽에 위치하고, 상기 제2 서브파티션은 상기 제1 서브파티션의 재구성된 값에 기초하여 인트라 예측되는, 디블로킹 방법.
  4. 제1항에 있어서,
    상기 현재 코딩 블록 내의 서브파티션의 개수가 2개 또는 4개인, 디블로킹 방법.
  5. 제1항에 있어서,
    상기 현재 코딩 블록의 폭이 4이고 상기 코딩 블록의 높이가 8이면 또는 상기 현재 코딩 블록의 폭이 8이고 상기 현재 코딩 블록의 높이가 4이면, 상기 현재 코딩 블록 내의 서브파티션의 개수가 2개이고,
    그렇지 않으면, 상기 서브파티션의 개수가 4개인, 디블로킹 방법.
  6. 제1항에 있어서,
    상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 n×n 샘플 그리드와 중첩되지 않더라도, 상기 제1 서브파티션 또는 상기 제2 서브파티션 내의 상기 최대 하나의 샘플이 변경되고, n은 정수인, 디블로킹 방법.
  7. 제1항에 있어서,
    상기 제1 서브파티션과 상기 제2 서브파티션 사이의 상기 서브파티션 경계가 n×n 샘플 그리드와 중첩하는 경우에만, 상기 제1 서브파티션 또는 상기 제2 서브파티션 내의 상기 최대 하나의 샘플이 변경되고, n은 정수인, 디블로킹 방법.
  8. 제7항에 있어서,
    n은 4 또는 8인, 디블로킹 방법.
  9. 제1항에 있어서,
    상기 서브파티션의 샘플이 루마 샘플(luma sample)이거나, 또는 상기 서브파티션의 샘플이 크로마 샘플(chroma sample)인, 디블로킹 방법.
  10. 제1항에 있어서,
    상기 서브파티션은 직사각형 변환 블록 서브파티션인, 디블로킹 방법.
  11. 제1항에 있어서,
    상기 현재 코딩 블록을 서브파티션으로 분할하는 상기 인트라 서브파티션 분할 유형이 수직이면, 상기 서브파티션을 인트라 예측하는 순서가 "왼쪽에서 오른쪽으로"인, 디블로킹 방법.
  12. 인코더(20)로서,
    제1항 내지 제11항 중 어느 한 항의 디블로킹 방법을 수행하기 위한 처리 회로
    를 포함하는 인코더(20).
  13. 디코더(30)로서,
    제1항 내지 제11항 중 어느 한 항의 디블로킹 방법을 수행하기 위한 처리 회로
    를 포함하는 디코더(30).
  14. 컴퓨터 판독가능 매체로서,
    상기 컴퓨터 판독가능 매체는 프로그램 코드를 싣고 있고, 상기 프로그램 코드는 컴퓨팅 장치에 의해 실행될 때 상기 컴퓨팅 장치로 하여금 제1항 내지 제11항 중 어느 한 항의 디블로킹 방법을 수행하게 하는, 컴퓨터 판독가능 매체.
KR1020237038381A 2019-01-10 2020-01-10 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터 KR20230156456A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962791003P 2019-01-10 2019-01-10
US62/791,003 2019-01-10
PCT/CN2020/071272 WO2020143729A1 (en) 2019-01-10 2020-01-10 Deblocking filter for sub-partition boundaries caused by intra sub-partition coding tool
KR1020207037388A KR102625986B1 (ko) 2019-01-10 2020-01-10 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020207037388A Division KR102625986B1 (ko) 2019-01-10 2020-01-10 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터

Publications (1)

Publication Number Publication Date
KR20230156456A true KR20230156456A (ko) 2023-11-14

Family

ID=71521950

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020237038381A KR20230156456A (ko) 2019-01-10 2020-01-10 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터
KR1020207037388A KR102625986B1 (ko) 2019-01-10 2020-01-10 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020207037388A KR102625986B1 (ko) 2019-01-10 2020-01-10 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터

Country Status (12)

Country Link
US (3) US11122299B2 (ko)
EP (2) EP4373095A2 (ko)
JP (2) JP7314281B2 (ko)
KR (2) KR20230156456A (ko)
CN (1) CN113455005A (ko)
AU (2) AU2020206823B2 (ko)
BR (1) BR112020025145A2 (ko)
CA (1) CA3126173A1 (ko)
IL (1) IL284710A (ko)
MX (1) MX2021000852A (ko)
SG (1) SG11202107542RA (ko)
WO (1) WO2020143729A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4373095A2 (en) 2019-01-10 2024-05-22 Huawei Technologies Co., Ltd. Deblocking filter for sub-partition boundaries caused by intra sub-partition coding tool
US11272198B2 (en) * 2019-01-30 2022-03-08 Tencent America LLC Method and apparatus for improved sub-block partitioning intra sub-partitions coding mode
KR20200110214A (ko) * 2019-03-12 2020-09-23 현대자동차주식회사 예측 유닛을 서브 유닛들로 분할하여 예측하는 인트라 예측 방법 및 장치
WO2022191526A1 (ko) * 2021-03-09 2022-09-15 현대자동차주식회사 세그멘테이션 정보 기반 디블록킹 필터링을 이용하는 비디오 코딩방법 및 장치
WO2022197139A1 (ko) * 2021-03-19 2022-09-22 현대자동차주식회사 크로마 블록의 인트라 서브블록 예측을 이용하는 비디오 코딩방법 및 장치

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI117534B (fi) * 2000-01-21 2006-11-15 Nokia Corp Menetelmä digitaalisten kuvien suodattamiseksi ja suodatin
US7929610B2 (en) * 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
TWI375470B (en) 2007-08-03 2012-10-21 Via Tech Inc Method for determining boundary strength
CN105847799B (zh) * 2010-04-13 2019-04-05 三星电子株式会社 视频解码设备
KR20110125153A (ko) * 2010-05-12 2011-11-18 에스케이 텔레콤주식회사 영상의 필터링 방법 및 장치와 그를 이용한 부호화/복호화를 위한 방법 및 장치
KR101341993B1 (ko) * 2010-10-06 2013-12-16 에스케이텔레콤 주식회사 고정밀 필터를 이용한 영상 부호화/복호화 방법 및 장치
CA2979455C (en) * 2011-01-12 2018-09-04 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, and image decoding method
US9338476B2 (en) * 2011-05-12 2016-05-10 Qualcomm Incorporated Filtering blockiness artifacts for video coding
KR20120140181A (ko) * 2011-06-20 2012-12-28 한국전자통신연구원 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치
WO2013034649A1 (en) * 2011-09-09 2013-03-14 Panasonic Corporation Low complex deblocking filter decisions
US9538200B2 (en) * 2012-01-19 2017-01-03 Qualcomm Incorporated Signaling of deblocking filter parameters in video coding
JP6222576B2 (ja) * 2012-03-21 2017-11-01 サン パテント トラスト 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、および画像符号化復号装置
US9686561B2 (en) * 2013-06-17 2017-06-20 Qualcomm Incorporated Inter-component filtering
US10412419B2 (en) * 2013-07-12 2019-09-10 Qualcomm Incorporated Adaptive filtering in video coding
US9510002B2 (en) 2013-09-09 2016-11-29 Apple Inc. Chroma quantization in video coding
US10038919B2 (en) * 2014-05-29 2018-07-31 Apple Inc. In loop chroma deblocking filter
CN111988606B (zh) * 2014-09-15 2022-09-20 寰发股份有限公司 去区块滤波方法、相应地编码装置和存储介质
WO2017045101A1 (en) * 2015-09-14 2017-03-23 Mediatek Singapore Pte. Ltd. Advanced deblocking filter in video coding
US10708591B2 (en) * 2017-03-20 2020-07-07 Qualcomm Incorporated Enhanced deblocking filtering design in video coding
US10750171B2 (en) * 2018-06-25 2020-08-18 Google Llc Deblocking filtering
CN112544085A (zh) * 2018-08-10 2021-03-23 华为技术有限公司 执行去块的装置和方法
EP4373095A2 (en) * 2019-01-10 2024-05-22 Huawei Technologies Co., Ltd. Deblocking filter for sub-partition boundaries caused by intra sub-partition coding tool
US11831926B2 (en) * 2019-02-15 2023-11-28 Telefonaktiebolaget Lm Ericsson (Publ) Deblocking of transform sub-block boundaries

Also Published As

Publication number Publication date
JP2023153802A (ja) 2023-10-18
NZ778339A (en) 2023-11-24
AU2024200725A1 (en) 2024-02-22
KR102625986B1 (ko) 2024-01-16
US20200404333A1 (en) 2020-12-24
SG11202107542RA (en) 2021-08-30
US20210377570A1 (en) 2021-12-02
EP4373095A2 (en) 2024-05-22
EP3895433A1 (en) 2021-10-20
AU2020206823B2 (en) 2023-11-16
AU2020206823A1 (en) 2021-08-12
MX2021000852A (es) 2021-03-26
JP7314281B2 (ja) 2023-07-25
BR112020025145A2 (pt) 2021-07-20
CA3126173A1 (en) 2020-07-16
US20230412845A1 (en) 2023-12-21
US11122299B2 (en) 2021-09-14
US11856228B2 (en) 2023-12-26
WO2020143729A1 (en) 2020-07-16
CN113455005A (zh) 2021-09-28
JP2022517081A (ja) 2022-03-04
IL284710A (en) 2021-08-31
EP3895433A4 (en) 2022-02-23
KR20210011458A (ko) 2021-02-01

Similar Documents

Publication Publication Date Title
KR102621959B1 (ko) 임의의 ctu 크기에 대한 ibc 검색 범위 최적화를 사용하는 인코더, 디코더 및 대응하는 방법
CA3122137C (en) An encoder, a decoder and corresponding methods of boundary strength derivation of deblocking filter
KR102625986B1 (ko) 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터
US11843806B2 (en) Encoder, a decoder and corresponding methods of deblocking filter adaptation
KR20210126771A (ko) 인트라 예측 모드에 관련된 인코더, 디코더 및 대응하는 방법들
KR20210139446A (ko) 인트라 스무딩을 위한 방법 및 장치
KR20210103572A (ko) 타일 구성 시그널링을 위한 인코더, 디코더 및 대응 방법
KR20210094057A (ko) 비디오 코딩에서 크로마 인트라 예측을 위한 방법 및 장치
CN113228632B (zh) 用于局部亮度补偿的编码器、解码器、以及对应方法
KR20210145824A (ko) 제산 없는 인트라 예측을 위한 방법 및 장치
RU2777967C1 (ru) Деблокирующий фильтр для границ подразделов, возникающих под действием инструмента кодирования интра-подразделов

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right