KR20180075558A - 비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치 - Google Patents

비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치 Download PDF

Info

Publication number
KR20180075558A
KR20180075558A KR1020187013816A KR20187013816A KR20180075558A KR 20180075558 A KR20180075558 A KR 20180075558A KR 1020187013816 A KR1020187013816 A KR 1020187013816A KR 20187013816 A KR20187013816 A KR 20187013816A KR 20180075558 A KR20180075558 A KR 20180075558A
Authority
KR
South Korea
Prior art keywords
filtering
pixels
encoding unit
encoding
unit
Prior art date
Application number
KR1020187013816A
Other languages
English (en)
Inventor
최나래
박민우
김찬열
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20180075558A publication Critical patent/KR20180075558A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)

Abstract

일 실시예에 따른 비디오 복호화 방법에 있어서, 현재 블록에 대한 인트라 예측에 이용될 상기 현재 블록의 주변 픽셀들을 결정하는 단계; 상기 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득하는 단계; 상기 획득된 정보에 따라 상기 복수의 필터링 방법들 중 하나를 선택하는 단계; 상기 선택된 필터링 방법을 이용하여 상기 주변 픽셀들을 필터링하는 단계; 및 상기 필터링된 주변 픽셀들을 이용하여 상기 현재 블록에 대한 상기 인트라 예측을 수행하는 단계를 포함하고, 상기 복수의 필터링 방법들은, 상기 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 상기 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 복호화 방법, 및 비디오 복호화 방법을 수행할 수 있는 비디오 복호화 장치가 제공될 수 있다.

Description

비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치
비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치에 관한 것이다. 상세하게는 인트라 예측에 이용되는 참조 샘플에 필터링을 적용하는 방법에 관한 것이다.
고해상도 또는 고화질 비디오 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 비디오 컨텐트를 효과적으로 부호화하거나 복호화하는 비디오 코덱의 필요성이 증대하고 있다. 기존의 비디오 코덱에 따르면, 참조 샘플 필터링 과정을 통해 인트라 예측에 이용되는 참조 샘플이 필터링된다. 다만, 기존의 필터링 기법은 블록 크기나 모드에 따라 단순한 형태의 필터를 참조 영역에 적용한다. 해당 방법은 참조 영역의 노이즈를 효과적으로 제거하지 못해 예측의 효율이 떨어진다. 특히, HEVC의 경우 32x32 블록에서 참조 필터링 기술이 존재하나, 이는 평활한 영역에서 참조 영역에 존재하는 변환 블록 경계에 존재하는 블록킹 현상(blocking artifact)을 어느 정도 감소시켜주는 역할만을 하며, 이 또한 역시 참조 영역의 노이즈를 효과적으로 제거하지 못한다. 참조 영역 내의 노이즈 및 강한 에지 등에 의해 발생하는 예측 오차는 변환 효율을 떨어뜨리는 문제가 발생한다.
인트라 예측에 이용되는 참조 샘플의 필터링을 통해 인트라 예측 성능 및 인트라 코딩 효율을 향상시킬 수 있는 비디오 복호화/부호화 방법 및 장치를 제공하기 위한 것이다.
일 실시예에 따른 비디오 복호화 방법에 있어서, 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정하는 단계; 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득하는 단계; 획득된 정보에 따라 복수의 필터링 방법들 중 하나를 선택하는 단계; 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하는 단계; 및 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행하는 단계를 포함하고, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 복호화 방법이 제공될 수 있다.
일 실시예에 따른 비디오 부호화 방법에 있어서, 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정하는 단계; 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 선택하는 단계; 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하는 단계; 및 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행하는 단계를 포함하고, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 부호화 방법이 제공될 수 있다.
일 실시예에 따른 비디오 복호화 장치에 있어서, 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정하는 주변 픽셀 결정부; 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득하는 정보 획득부; 및 획득된 정보에 따라 복수의 필터링 방법들 중 하나를 선택하고, 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행하는 복호화부를 포함하고, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 복호화 장치가 제공될 수 있다.
일 실시예에 따른 비디오 부호화 장치에 있어서, 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정하는 주변 픽셀 결정부; 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 선택하고, 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행하는 부호화부; 및 복수의 필터링 방법들 중 선택된 필터링 방법을 나타내는 정보를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함하고, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 부호화 장치가 제공될 수 있다.
일 실시예에 따르면, 인트라 예측시 기존의 방식과는 상이한 방식의 필터링을 수행함으로써 예측의 효율을 높일 수 있다.
도 1a는 일 실시예에 따른 비디오 복호화 장치의 블록도를 도시한다.
도 1b는 일 실시예에 따른 비디오 부호화 장치의 블록도를 도시한다.
도 2는 일 실시예에 따른 비디오 복호화 방법의 흐름도를 도시한다.
도 3은 일 실시예에 따라 현재 블록에 대한 인트라 예측에 이용될 주변 픽셀들을 결정하고 주변 픽셀들을 파티셔닝하는 것을 도시한다.
도 4는 다른 실시예에 따라 현재 블록의 주변 픽셀들을 파티셔닝하는 것을 도시한다.
도 5는 또 다른 실시예에 따라 현재 블록의 주변 픽셀들을 파티셔닝하는 것을 도시한다.
도 6은 일 실시예에 따른 주변 픽셀들의 필터링 방법을 설명하기 위한 참조도이다.
도 7a는 일 실시예에 따른 공간 영역 필터링 방법을 설명하기 위한 참조도이다.
도 7b는 일 실시예에 따른 주파수 영역 필터링 방법을 설명하기 위한 참조도이다.
도 8은 일 실시예에 따른 비디오 부호화 방법의 흐름도를 도시한다.
도 9는 일 실시예에 따라 필터링을 통해 생성된 참조 샘플을 버퍼에 저장하는 것을 설명하기 위한 참조도이다.
도 10은 일 실시예에 따라 현재 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.
도 11은 일 실시예에 따라 비-정사각형의 형태인 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.
도 12는 일 실시예에 따라 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위가 분할되는 과정을 도시한다.
도 13은 일 실시예에 따라 홀수개의 부호화 단위들 중 소정의 부호화 단위가 결정되는 방법을 도시한다.
도 14는 일 실시예에 따라 현재 부호화 단위가 분할되어 복수개의 부호화 단위들이 결정되는 경우, 복수개의 부호화 단위들이 처리되는 순서를 도시한다.
도 15는 일 실시예에 따라 소정의 순서로 부호화 단위가 처리될 수 없는 경우, 현재 부호화 단위가 홀수개의 부호화 단위로 분할되는 것으로 결정되는 과정을 도시한다.
도 16은 일 실시예에 따라 제1 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.
도 17은 일 실시예에 따라 제1 부호화 단위가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위가 소정의 조건을 만족하는 경우, 제2 부호화 단위가 분할될 수 있는 형태가 제한되는 것을 도시한다.
도 18은 일 실시예에 따라 분할 형태 정보가 4개의 정사각형 형태의 부호화 단위로 분할하는 것을 나타낼 수 없는 경우, 정사각형 형태의 부호화 단위가 분할되는 과정을 도시한다
도 19는 일 실시예에 따라 복수개의 부호화 단위들 간의 처리 순서가 부호화 단위의 분할 과정에 따라 달라질 수 있음을 도시한 것이다.
도 20은 일 실시예에 따라 부호화 단위가 재귀적으로 분할되어 복수개의 부호화 단위가 결정되는 경우, 부호화 단위의 형태 및 크기가 변함에 따라 부호화 단위의 심도가 결정되는 과정을 도시한다.
도 21은 일 실시예에 따라 부호화 단위들의 형태 및 크기에 따라 결정될 수 있는 심도 및 부호화 단위 구분을 위한 인덱스(part index, 이하 PID)를 도시한다.
도 22는 일 실시예에 따라 픽쳐에 포함되는 복수개의 소정의 데이터 단위에 따라 복수개의 부호화 단위들이 결정된 것을 도시한다.
도 23은 일 실시예에 따라 픽쳐에 포함되는 기준 부호화 단위의 결정 순서를 결정하는 기준이 되는 프로세싱 블록을 도시한다.
발명의 실시를 위한 최선의 형태
일 실시예에 따른 비디오 복호화 방법에 있어서, 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정하는 단계; 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득하는 단계; 획득된 정보에 따라 복수의 필터링 방법들 중 하나를 선택하는 단계; 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하는 단계; 및 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행하는 단계를 포함하고, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 복호화 방법이 제공될 수 있다.
일 실시예에 따라 상기 공간 영역 필터링 방법은, 상기 주변 픽셀들을 소정 픽셀 단위로 파티셔닝하는 단계; 상기 소정 픽셀 단위 각각에 대해 픽셀 값들의 평균값을 구하는 단계; 및 상기 소정 픽셀 단위 각각에 포함된 픽셀들의 픽셀 값을 상기 평균값으로 대체하는 단계를 포함할 수 있다.
일 실시예에 따라 상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계는, 상기 주변 픽셀들의 이미지 특성에 기초하여 상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계를 포함할 수 있다.
일 실시예에 따라 상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계는, 상기 주변 픽셀들의 픽셀 값에 대하여 히스토그램을 생성하는 단계; 적어도 하나의 임계치에 기초하여 상기 히스토그램에서 픽셀 값의 구간들을 설정하는 단계; 및 상기 픽셀 값이 상기 히스토그램의 동일 구간에 속하며, 서로 인접하는 픽셀들을 하나의 픽셀 단위로 결정하는 단계를 포함할 수 있다.
일 실시예에 따라 상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계는, 상기 주변 픽셀들에 대해 그래디언트(gradient) 연산을 수행하여 상기 주변 픽셀들의 그래디언트 값을 생성하는 단계; 및 그래디언트 값의 크기가 임계치 이상인 픽셀들 중 하나 이상을 이용하여 소정 픽셀 단위들 사이의 경계를 결정하는 단계를 포함할 수 있다.
일 실시예에 따라 상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계는, 상기 주변 픽셀들에 포함된 에지 정보를 추출하는 단계; 및 상기 추출된 에지 정보에 기초하여 상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계를 포함할 수 있다.
일 실시예에 따라 상기 공간 영역 필터링 방법은, 상기 소정 픽셀 단위들 사이의 경계를 필터링하는 단계를 더 포함할 수 있다.
일 실시예에 따라 상기 주파수 영역 필터링 방법은, 상기 주변 픽셀들을 상기 주파수 영역으로 변환하는 단계; 상기 변환된 주변 픽셀들을 필터링하는 단계; 및 상기 필터링된 주변 픽셀들을 상기 공간 영역으로 역변환하는 단계를 포함할 수 있다.
일 실시예에 따라 상기 변환된 주변 픽셀들을 필터링하는 단계는, 저역 통과 필터를 사용하여 상기 변환된 주변 픽셀들을 필터링하는 단계를 포함할 수 있다.
일 실시예에 따라 상기 공간 영역 필터링 방법과 상기 주파수 영역 필터링 방법은, 상기 주변 픽셀들을 포함하는 블록을 필터링하고, 상기 필터링된 블록에서 상기 주변 픽셀들에 해당하는 영역이 상기 현재 블록에 대한 상기 인트라 예측에 이용될 수 있다.
일 실시예에 따른 비디오 복호화 장치에 있어서, 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정하는 주변 픽셀 결정부; 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득하는 정보 획득부; 및 획득된 정보에 따라 복수의 필터링 방법들 중 하나를 선택하고, 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행하는 복호화부를 포함하고, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 복호화 장치가 제공될 수 있다.
일 실시예에 따른 비디오 부호화 방법에 있어서, 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정하는 단계; 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 선택하는 단계; 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하는 단계; 및 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행하는 단계를 포함하고, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 부호화 방법이 제공될 수 있다.
일 실시예에 따라 상기 선택하는 단계는, 상기 복수의 필터링 방법들 각각을 이용하여 상기 주변 픽셀들을 필터링하는 단계; 상기 필터링된 주변 픽셀들을 이용하여 상기 현재 블록에 대한 상기 인트라 예측을 수행하는 단계; 및 상기 인트라 예측 결과에 따른 코스트에 기초하여 상기 복수의 필터링 방법들 중 하나를 선택하는 단계를 포함할 수 있다.
일 실시예에 따른 비디오 부호화 장치에 있어서, 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정하는 주변 픽셀 결정부; 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 선택하고, 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행하는 부호화부; 및 복수의 필터링 방법들 중 선택된 필터링 방법을 나타내는 정보를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함하고, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 부호화 장치가 제공될 수 있다.
발명의 실시를 위한 형태
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.
이하, "영상"은 비디오의 정지영상과 같은 정적 이미지이거나 동영상, 즉 비디오 그 자체와 같은 동적 이미지를 나타낼 수 있다.
이하 "샘플"은, 영상의 샘플링 위치에 할당된 데이터로서 프로세싱 대상이 되는 데이터를 의미한다. 예를 들어, 공간영역의 영상에서 픽셀값, 변환 영역 상의 변환 계수들이 샘플들일 수 있다. 이러한 적어도 하나의 샘플들을 포함하는 단위를 블록이라고 정의할 수 있다.
아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.
도 1a는 일 실시예에 따른 비디오 복호화 장치(100)의 블록도를 도시한다.
도 1a에 도시된 바와 같이, 일 실시예에 따른 비디오 복호화 장치(100)는, 주변 픽셀 결정부(110), 정보 획득부(120), 및 복호화부(130)를 포함할 수 있다.
주변 픽셀 결정부(110)는 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정할 수 있다. 일 실시예에 따르면, 현재 블록의 크기가 nT * nT 인 경우, 주변 픽셀들은, 현재 블록의 상측에 인접한 2nT개의 픽셀들, 현재 블록의 좌측에 인접한 2nT개의 픽셀들, 및 현재 블록의 좌측 상단의 1개의 픽셀을 포함하는 1행 또는 1열의 1차원 픽셀들일 수 있다. 다만, 주변 픽셀들은 상기 실시예에 한정되지 않고 현재 블록을 중심으로 다양한 형태를 가질 수 있다. 예를 들어, 주변 픽셀들은 현재 블록에 인접한 픽셀들을 포함하는 2행 또는 2열 이상의 2차원 픽셀들일 수 있다.
정보 획득부(120)는 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득할 수 있다. 예를 들어, 복수의 필터링 방법들 중 하나를 나타내는 정보는 인덱스 정보일 수 있다.
일 실시예에 따르면, 정보 획득부(120)는 주변 픽셀들에 대해 필터링을 수행할지 여부를 나타내는 정보를 비트스트림으로부터 더 획득할 수 있고, 복호화부(130)는 획득된 정보에 따라 주변 픽셀들에 대해 필터링을 수행할지 여부를 결정할 수 있다. 예를 들어, 주변 픽셀들에 대해 필터링을 수행할지 여부를 나타내는 정보는 플래그일 수 있다.
일 실시예에 따르면, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함할 수 있다.
일 실시예에 따르면, 공간 영역 필터링 방법은, 주변 픽셀들을 소정 픽셀 단위로 파티셔닝하는 단계; 소정 픽셀 단위 각각에 대해 픽셀 값들의 평균값을 구하는 단계; 및 소정 픽셀 단위 각각에 포함된 픽셀들의 픽셀 값을 평균값으로 대체하는 단계를 포함할 수 있다.
일 실시예에 따르면, 주파수 영역 필터링 방법은, 주변 픽셀들을 주파수 영역으로 변환하는 단계; 변환된 주변 픽셀들을 필터링하는 단계; 및 필터링된 주변 픽셀들을 상기 공간 영역으로 역변환하는 단계를 포함할 수 있다.
복호화부(130)는 획득된 정보에 따라 복수의 필터링 방법들 중 하나를 선택하고, 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행할 수 있다.
도 1b는 일 실시예에 따른 비디오 부호화 장치(150)의 블록도를 도시한다.
도 1b에 도시된 바와 같이, 일 실시예에 따른 비디오 부호화 장치(150)는 주변 픽셀 결정부(160), 부호화부(170), 및 비트스트림 생성부(180)를 포함할 수 있다.
주변 픽셀 결정부(160)는 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정할 수 있다.
부호화부(170)는 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 선택하고, 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행할 수 있다.
일 실시예에 따르면, 비디오 부호화 장치(150)의 부호화부(170)는, 복수의 필터링 방법들 각각을 이용하여 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 상기 인트라 예측을 수행하고, 인트라 예측 결과에 따른 코스트에 기초하여 복수의 필터링 방법들 중 하나를 선택할 수 있다. 인트라 예측 결과에 따른 코스트는, 평균 제곱 오차(MSE; mean square error), SATD(sum of absolute transformed differences), 비트율 왜곡 최적화(RDO; rate distortion optimization) 등을 통해서 계산되고 가장 코스트 효율이 좋은 필터링 방법이 선택될 수 있다.
비트스트림 생성부(180)는 복수의 필터링 방법들 중 선택된 필터링 방법을 나타내는 정보를 포함하는 비트스트림을 생성할 수 있다. 예를 들어, 복수의 필터링 방법들 중 하나를 나타내는 정보는 인덱스 정보일 수 있다.
일 실시예에 따르면, 부호화부(170)는, 블록의 크기, 블록의 예측 모드, 인트라 예측 방향, 주변 코딩 정보, 사용자 입력, 연산 복잡도 등의 파라미터에 기초하여 주변 픽셀들에 대해 필터링을 수행할지 여부를 결정할 수 있고, 그에 따라 비트스트림 생성부(180)는 주변 픽셀들에 대해 필터링을 수행할지 여부를 나타내는 정보를 더 포함하는 비트 스트림을 생성할 수 있다. 예를 들어, 주변 픽셀들에 대해 필터링을 수행할지 여부를 나타내는 정보는 플래그일 수 있다.
일 실시예에 따르면, 주변 픽셀들에 대해 필터링을 수행할지 여부와 적용되는 필터링 방법은 부호화 단위(CU), 예측 단위(PU), 변환 단위(TU)별로 결정될 수 있고, 예를 들어, 먼저 부호화 단위에서 변환 단위별 결정 여부를 결정한 후에 변환 단위별로 결정될 수 있다.
일 실시예에 따르면, 주변 픽셀들에 대해 필터링을 수행할지 여부를 나타내는 정보를 비트스트림으로부터 더 획득할 수 있고, 복호화부(130)는 획득된 정보에 따라 주변 픽셀들에 대해 필터링을 수행할지 여부를 결정할 수 있다.
도 2는 일 실시예에 따른 비디오 복호화 방법의 흐름도를 도시한다.
S200단계에서, 비디오 복호화 장치(100)의 주변 픽셀 결정부(110)는 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정할 수 있다.
S202단계에서, 비디오 복호화 장치(100)의 정보 획득부(120)는 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득할 수 있다.
일 실시예에 따르면, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함할 수 있다.
S204단계에서, 비디오 복호화 장치(100)의 복호화부(130)는 획득된 정보에 따라 복수의 필터링 방법들 중 하나를 선택할 수 있다.
S206단계에서, 비디오 복호화 장치(100)의 복호화부(130)는 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링할 수 있다.
S208단계에서, 비디오 복호화 장치(100)의 복호화부(130)는 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행할 수 있다.
도 3은 일 실시예에 따라 현재 블록에 대한 인트라 예측에 이용될 주변 픽셀들을 결정하고 주변 픽셀들을 파티셔닝하는 것을 도시한다.
도 3에 도시된 바와 같이, 현재 블록(300)에 대한 인트라 예측에 이용될 주변 픽셀들(302)이 결정될 수 있다. 일 실시예에 따르면, 현재 블록(300)의 크기는 8x8일 수 있다. 주변 픽셀들(302)은, 현재 블록의 상측에 인접한 16개의 픽셀들, 현재 블록의 좌측에 인접한 16개의 픽셀들, 및 현재 블록의 좌측 상단의 1개의 픽셀을 포함하는 1차원 픽셀들일 수 있다.
일 실시예에 따른 공간 영역 필터링 방법 및 주파수 영역 필터링 방법은, 주변 픽셀들(302)을 소정 픽셀 단위(304)로 파티셔닝하는 단계를 포함할 수 있다. 소정 픽셀 단위(304)는 도 3에 도시된 바와 같이 1x4의 픽셀들을 포함할 수 있다.
일 실시예에 따르면, 공간 영역 필터링 방법은, 주변 픽셀들(302)의 파티셔닝 후에 파티셔닝된 복수의 소정 픽셀 단위들 각각에 대해 픽셀 값들의 평균값을 구하고, 소정 픽셀 단위 각각에 포함된 픽셀들의 픽셀 값을 평균값으로 대체함으로써 파티셔닝된 복수의 소정 픽셀 단위들에 대한 필터링을 수행할 수 있다.
일 실시예에 따르면, 주파수 영역 필터링 방법은, 주변 픽셀들을 주파수 영역으로 변환하고, 변환된 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 공간 영역으로 역변환함으로써 주변 픽셀들에 대한 필터링을 수행할 수 있다. 또한, 주파수 영역 필터링 방법은, 파티셔닝된 복수의 소정 픽셀 단위들 각각에 대해, 소정 픽셀 단위를 주파수 영역으로 변환하고, 변환된 소정 픽셀 단위를 필터링하고, 필터링된 소정 픽셀 단위를 공간 영역으로 역변환함으로써 복수의 소정 픽셀 단위들에 대한 필터링을 수행할 수 있다.
일 실시예에 따르면, 주파수 영역 필터링 방법에서, 주변 픽셀들은 이상 여현 변환(DCT; Discrete Cosine Transform), 하다마드(hadamard) 변환, KLT 등을 포함하는 다양한 주파수 변환 방법을 이용하여 주파수 변환될 수 있다.
일 실시예에 따르면, 공간 영역 필터링 방법 및 주파수 영역 필터링 방법은, 필터링된 소정 픽셀 단위들 사이의 경계를 필터링하는 단계를 더 포함할 수 있다. 예를 들어, 필터링된 소정 픽셀 단위들 사이의 경계는 [1 2 1] 필터를 이용하여 추가로 필터링될 수 있다. 필터링된 소정 픽셀 단위들의 경계에 위치한 픽셀의 픽셀 값을 B라고 가정하고, 양 쪽에 인접한 픽셀들의 픽셀값을 각각 A, C라고 가정하였을 때, 추가적인 [1 2 1] 필터링에 의하면, 필터링된 경계 픽셀 값은 (A+2B+C)/4로 계산될 수 있다. 소정 픽셀 단위들의 경계에 대한 추가적인 필터링을 통해 주변 픽셀들(302)를 평활화(smoothing)할 수 있다.
일 실시예에 따르면, 공간 영역 필터링 방법 및 주파수 영역 필터링 방법에 있어서, 주변 픽셀들을 소정 픽셀 단위로 파티셔닝하는 단계는, 주변 픽셀들의 이미지 특성에 기초하여 주변 픽셀들을 소정 픽셀 단위로 파티셔닝하는 단계를 포함할 수 있다. 이하, 도 4 및 도 5를 참조하여 이미지 특성에 기초한 주변 픽셀들의 파티셔닝 방법에 대해 설명한다.
도 4는 다른 실시예에 따라 현재 블록의 주변 픽셀들을 파티셔닝하는 것을 도시한다.
일 실시예에 따르면, 현재 블록의 주변 픽셀들의 이미지 특성 중 픽셀 값의 히스토그램 구간을 이용하여 주변 픽셀들이 파티셔닝될 수 있다. 도 4에 도시된 바와 같이, 현재 블록(400)의 인트라 예측에 이용될 현재 블록(400)의 주변 픽셀들(402)이 결정될 수 있다.
주변 픽셀들의 파티셔닝을 위해, 주변 픽셀들(402)의 픽셀 값에 대하여 히스토그램이 생성될 수 있다. 예를 들어, 도 4에 도시된 바와 같이 주변 픽셀들(402)의 픽셀 값 분포에 따라 히스토그램(404, 406)이 생성될 수 있다. 히스토그램의 가로축은 픽셀 값을 나타내고 세로축은 도수를 나타낼 수 있다. 히스토그램(404)에서, 픽셀 값의 분포에 따라 하나의 임계치(T)가 결정될 수 있고, 결정된 임계치(T)에 기초하여 히스토그램의 2개의 구간들(408)이 설정될 수 있다. 또한, 히스토그램(406)에서, 픽셀 값의 분포에 따라 2개의 임계치(T1, T2)가 결정될 수 있고, 결정된 2개의 임계치(T1, T2)에 기초하여 히스토그램의 3개의 구간들(410)이 설정될 수 있다.
일 실시예에 따르면, 픽셀 값이 히스토그램의 동일 구간에 속하며, 서로 인접하는 픽셀들이 하나의 픽셀 단위로 결정됨으로써 주변 픽셀들의 파티셔닝이 수행될 수 있다.
도 5는 또 다른 실시예에 따라 현재 블록의 주변 픽셀들을 파티셔닝하는 것을 도시한다.
일 실시예에 따르면, 현재 블록의 주변 픽셀들의 이미지 특성 중 그래디언트 값을 이용하여 주변 픽셀들이 파티셔닝될 수 있다. 도 5에 도시된 바와 같이, 현재 블록(500)의 인트라 예측에 이용될 현재 블록(500)의 주변 픽셀들(502)이 결정될 수 있다. 현재 블록(500)의 상측에 위치한 블록(504)은 주변 픽셀들(502)의 일부를 포함할 수 있다.
일 실시예에 따르면, 주변 픽셀들(502)에 대해 그래디언트(gradient) 연산을 수행하여 주변 픽셀들(502)의 그래디언트 값이 생성될 수 있다. 예를 들어, 주변 픽셀들(502) 및 블록(504)이 도 5에 도시된 바와 같은 이미지 특성을 갖는 경우, 주변 픽셀들(502)의 픽셀 값과 그래디언트 값은, 도 5에 도시된 바와 같은 픽셀 값의 분포(506) 및 그래디언트 값 분포(508)를 이룰 수 있다.
일 실시예에 따르면, 그래디언트 값의 크기가 임계치 이상인 픽셀들 중 하나 이상을 이용하여 소정 픽셀 단위들 사이의 경계가 결정될 수 있다. 예를 들어, 도 5에 도시된 바와 같이 그래디언트 값에 대한 임계치(T)가 결정될 수 있고, 그래디언트 값의 크기가 결정된 임계치(T) 이상인 픽셀들 중 그래디언트 값이 최대, 최소인 픽셀들로 경계들(510, 512)이 결정될 수 있다. 결정된 경계들(510, 512)을 소정 픽셀 단위들 사이의 경계로 하여 주변 픽셀들(502)이 소정 픽셀 단위들로 파티셔닝될 수 있다.
일 실시예에 따르면, 현재 블록의 주변 픽셀들의 이미지 특성 중 에지 정보를 이용하여 주변 픽셀들이 소정 픽셀 단위로 파티셔닝될 수 있다. 주변 픽셀들에 포함된 에지 정보는 다양한 방법을 통해 추출될 수 있다. 예를 들어, 도 5를 참조하여 설명된 바와 같이 그래디언트 값을 통해 결정된 경계를 통해서 에지 정보가 추출될 수 있다.
도 6은 일 실시예에 따른 주변 픽셀들의 필터링 방법을 설명하기 위한 참조도이다.
일 실시예에 따르면, 공간 영역 필터링 방법과 주파수 영역 필터링 방법은, 현재 블록의 주변 픽셀들만을 필터링하는 것이 아니라 주변 픽셀들을 포함하는 블록 전체를 필터링할 수 있다. 예를 들어, 도 6에 도시된 바와 같이, 공간 영역 필터링 방법과 주파수 영역 필터링 방법에 있어서, 현재 블록(600)의 주변 픽셀들(602)을 포함하는 블록들(604, 606, 608) 전체가 필터링 될 수 있다.
일 실시예에 따르면, 공간 영역 필터링 방법과 주파수 영역 필터링 방법이 주변 픽셀들을 포함하는 블록 전체를 필터링하는 경우에, 필터링된 블록에서 상기 주변 픽셀들에 해당하는 영역만이 현재 블록에 대한 인트라 예측에 이용될 수 있다.
도 7a는 일 실시예에 따른 공간 영역 필터링 방법을 설명하기 위한 참조도이다.
일 실시예에 따르면, 공간 영역 필터링 방법은 주변 픽셀들을 포함하는 블록 전체를 필터링할 수 있다. 예를 들어, 도 7a에 도시된 바와 같이, 주변 픽셀들을 포함하는 블록(700)은 소정 픽셀 단위(702)로 파티셔닝될 수 있다. 소정 픽셀 단위(702)에 대하여 공간 영역에서 각각 필터링이 수행될 수 있고, 필터링에 의해 필터링된 블록(704)이 생성될 수 있다.
일 실시예에 따르면, 공간 영역 필터링 방법이 주변 픽셀들을 포함하는 블록 전체를 필터링하는 경우에, 필터링된 블록에서 상기 주변 픽셀들에 해당하는 영역만이 현재 블록에 대한 인트라 예측에 이용될 수 있다.
일 실시예에 따르면, 2차원 픽셀들로 결정된 주변 픽셀들에 대해서도 도 7a를 참조하여 설명된 공간 영역 필터링 방법이 적용될 수 있다.
도 7b는 일 실시예에 따른 주파수 영역 필터링 방법을 설명하기 위한 참조도이다.
일 실시예에 따르면, 주파수 영역 필터링 방법은 주변 픽셀들을 포함하는 블록 전체를 필터링할 수 있다. 예를 들어, 도 7b에 도시된 바와 같이, 주변 픽셀들을 포함하는 블록(706)은, 주파수 영역으로 변환될 수 있고, 변환된 블록은 주파수 영역에서 필터링될 수 있다. 블록(706)은 2차원 이산 여현 변환을 이용하여 주파수 변환될 수 있으나, 이에 제한되지는 않는다.
일 실시예에 따르면, 주파수 영역 필터링 방법에서, 주파수 영역으로 변환된 블록은 저역 통과 필터를 사용하여 필터링될 수 있다. 예를 들어, 도 7b에 도시된 바와 같이, 변환된 블록(708, 710, 712)은 저주파수 영역만을 남김으로써 필터링될 수 있다. 블록(708)은 3/4 영역, 블록(710)은 1/2 영역, 블록(712)는 1/4 영역만을 남기고 나머지 값을 삭제할 수 있다.
일 실시예에 따르면, 주파수 영역 필터링 방법에서, 상이한 현재 블록에 대해, 블록의 크기, 블록의 예측 모드, 인트라 예측 방향, 주변 코딩 정보, 사용자 입력, 연산 복잡도 등의 파라미터에 기초하여 필터링을 적응적으로 수행할 수 있다.
일 실시예에 따르면, 주파수 영역에서 필터링된 블록은 역변환을 통해 공간 영역으로 변환될 수 있다. 예를 들어, 블록(708, 710, 712)은 필터링된 후 2차원 이산 여현 변환의 역변환을 통해 공간 영역으로 변환될 수 있다.
일 실시예에 따르면, 주파수 영역 필터링 방법이 주변 픽셀들을 포함하는 블록 전체를 필터링하는 경우에, 필터링된 블록에서 상기 주변 픽셀들에 해당하는 영역만이 현재 블록에 대한 인트라 예측에 이용될 수 있다.
일 실시예에 따르면, 2차원 픽셀들로 결정된 주변 픽셀들에 대해서도 도 7b를 참조하여 설명된 주파수 영역 필터링 방법이 적용될 수 있다.
도 8은 일 실시예에 따른 비디오 부호화 방법의 흐름도를 도시한다.
S800단계에서, 비디오 부호화 장치(150)의 주변 픽셀 결정부(160)는 현재 블록에 대한 인트라 예측에 이용될 현재 블록의 주변 픽셀들을 결정할 수 있다.
S802단계에서, 비디오 부호화 장치(150)의 부호화부(170)는 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 선택할 수 있다.
일 실시예에 따르면, 복수의 필터링 방법들은, 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함할 수 있다.
일 실시예에 따르면, 비디오 부호화 장치(150)의 부호화부(170)는, 복수의 필터링 방법들 각각을 이용하여 주변 픽셀들을 필터링하고, 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 상기 인트라 예측을 수행하고, 인트라 예측 결과에 따른 코스트에 기초하여 복수의 필터링 방법들 중 하나를 선택할 수 있다. 인트라 예측 결과에 따른 코스트는, 평균 제곱 오차(MSE; mean square error), SATD(sum of absolute transformed differences), 비트율 왜곡 최적화(RDO; rate distortion optimization) 등을 통해서 계산되고 가장 코스트 효율이 좋은 필터링 방법이 선택될 수 있다.
S804단계에서, 비디오 부호화 장치(150)의 부호화부(170)는 선택된 필터링 방법을 이용하여 주변 픽셀들을 필터링할 수 있다.
S806단계에서, 비디오 부호화 장치(150)의 부호화부(170)는 필터링된 주변 픽셀들을 이용하여 현재 블록에 대한 인트라 예측을 수행할 수 있다.
일 실시예에 따른 비디오 부호화 방법은, 복수의 필터링 방법들 중 선택된 필터링 방법을 나타내는 정보를 포함하는 비트스트림을 생성하는 단계를 더 포함할 수 있다.
도 9는 일 실시예에 따라 필터링을 통해 생성된 참조 샘플을 버퍼에 저장하는 것을 설명하기 위한 참조도이다.
일 실시예에 따르면, 입력 영상에 대한 예측 부호화를 통해 차분 계수 블록이 생성될 수 있고, 생성된 차분 계수 블록은 변환 및 양자화를 거칠 수 있다. 변환 및 양자화를 거친 차분 계수 블록의 역양자화 및 역변환을 통해 복원 차분 계수 블록이 생성될 수 있다. 복원 차분 계수 블록에 예측 블록을 더함으로써 복원 블록이 생성될 수 있다. 생성된 복원 블록은 인트라 예측에서 참조 샘플로서 이용 가능하다.
일 실시예에 따르면, 공간 영역에서 복원된 블록에 대해 앞서 설명한 다양한 실시예에 따른 공간 영역 필터링 방법이 적용될 수 있고, 주파수 영역에서 복원된 블록에 대해 앞서 설명한 다양한 실시예에 따른 주파수 영역 필터링 방법이 적용될 수 있다.
일 실시예에 따르면, 도 9에 도시된 바와 같이, 복원 블록(900)은 인터 예측에 이용되기 위해 소정의 처리를 거쳐 복원 픽쳐 버퍼(904)에 저장될 수 있다. 복원 블록(900)에 대하여 상술한 바와 같은 공간 영역 필터링 방법과 주파수 영역 필터링 방법을 포함하는 복수의 필터링 방법들이 적용될 수 있고, 도 9에 도시된 바와 같이 필터링된 블록(902)이 생성될 수 있다. 필터링된 블록(902)은 복원 픽쳐 버퍼(904)와는 상이한 별도의 픽쳐 버퍼(906)에 저장될 수 있다. 다른 실시예에 따르면, 필터링된 블록(902) 중 추후 인트라 예측 또는 인터 예측에 이용될 영역만 선택적으로 픽쳐 버퍼(906)에 저장될 수 있다.
일 실시예에 따르면, 도 9에 도시된 바와 같이, 필터링된 블록(902)은 픽쳐 버퍼(906)에 저장되어 인트라 예측의 참조 샘플로서 사용될 수 있고, 또한 인터 예측에서도 이용될 수 있다.
이하, 도 10 내지 도 23을 참조하여 일 실시예에 따른 비디오 복호화 장치(100)가 영상을 복호화하는 과정에서 이용할 수 있는 데이터 단위를 결정하는 방법을 설명하도록 한다. 비디오 부호화 장치(150)의 동작은 후술하는 비디오 복호화 장치(100)의 동작에 대한 다양한 실시예와 유사하거나 반대되는 동작이 될 수 있다.
도 10은 일 실시예에 따라 비디오 복호화 장치(100)가 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 블록 형태 정보를 이용하여 부호화 단위의 형태를 결정할 수 있고, 분할 형태 정보를 이용하여 부호화 단위가 어떤 형태로 분할되는지를 결정할 수 있다. 즉, 비디오 복호화 장치(100)가 이용하는 블록 형태 정보가 어떤 블록 형태를 나타내는지에 따라 분할 형태 정보가 나타내는 부호화 단위의 분할 방법이 결정될 수 있다.
일 실시예에 따라, 비디오 복호화 장치(100)는 현재 부호화 단위가 정사각형 형태임을 나타내는 블록 형태 정보를 이용할 수 있다. 예를 들어 비디오 복호화 장치(100)는 분할 형태 정보에 따라 정사각형의 부호화 단위를 분할하지 않을지, 수직으로 분할할지, 수평으로 분할할지, 4개의 부호화 단위로 분할할지 등을 결정할 수 있다. 도 10을 참조하면, 현재 부호화 단위(1000)의 블록 형태 정보가 정사각형의 형태를 나타내는 경우, 비디오 복호화 장치(100)는 분할되지 않음을 나타내는 분할 형태 정보에 따라 현재 부호화 단위(1000)와 동일한 크기를 가지는 부호화 단위(1010a)를 분할하지 않거나, 소정의 분할방법을 나타내는 분할 형태 정보에 기초하여 분할된 부호화 단위(1010b, 1010c, 1010d 등)를 결정할 수 있다.
도 10을 참조하면 비디오 복호화 장치(100)는 일 실시예에 따라 수직방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수직방향으로 분할한 두개의 부호화 단위(1010b)를 결정할 수 있다. 비디오 복호화 장치(100)는 수평방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수평방향으로 분할한 두개의 부호화 단위(1010c)를 결정할 수 있다. 비디오 복호화 장치(100)는 수직방향 및 수평방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수직방향 및 수평방향으로 분할한 네개의 부호화 단위(1010d)를 결정할 수 있다. 다만 정사각형의 부호화 단위가 분할될 수 있는 분할 형태는 상술한 형태로 한정하여 해석되어서는 안되고, 분할 형태 정보가 나타낼 수 있는 다양한 형태가 포함될 수 있다. 정사각형의 부호화 단위가 분할되는 소정의 분할 형태들은 이하에서 다양한 실시예를 통해 구체적으로 설명하도록 한다.
도 11은 일 실시예에 따라 비디오 복호화 장치(100)가 비-정사각형의 형태인 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위가 비-정사각형 형태임을 나타내는 블록 형태 정보를 이용할 수 있다. 비디오 복호화 장치(100)는 분할 형태 정보에 따라 비-정사각형의 현재 부호화 단위를 분할하지 않을지 소정의 방법으로 분할할지 여부를 결정할 수 있다. 도 11을 참조하면, 현재 부호화 단위(1100 또는 1150)의 블록 형태 정보가 비-정사각형의 형태를 나타내는 경우, 비디오 복호화 장치(100)는 분할되지 않음을 나타내는 분할 형태 정보에 따라 현재 부호화 단위(1100 또는 1150)와 동일한 크기를 가지는 부호화 단위(1110 또는 1160)를 분할하지 않거나, 소정의 분할방법을 나타내는 분할 형태 정보에 따라 기초하여 분할된 부호화 단위(1120a, 1120b, 1130a, 1130b, 1130c, 1170a, 1170b, 1180a, 1180b, 1180c)를 결정할 수 있다. 비-정사각형의 부호화 단위가 분할되는 소정의 분할 방법은 이하에서 다양한 실시예를 통해 구체적으로 설명하도록 한다.
일 실시예에 따라 비디오 복호화 장치(100)는 분할 형태 정보를 이용하여 부호화 단위가 분할되는 형태를 결정할 수 있고, 이 경우 분할 형태 정보는 부호화 단위가 분할되어 생성되는 적어도 하나의 부호화 단위의 개수를 나타낼 수 있다. 도 11를 참조하면 분할 형태 정보가 두개의 부호화 단위로 현재 부호화 단위(1100 또는 1150)가 분할되는 것을 나타내는 경우, 비디오 복호화 장치(100)는 분할 형태 정보에 기초하여 현재 부호화 단위(1100 또는 1150)를 분할하여 현재 부호화 단위에 포함되는 두개의 부호화 단위(1120a, 11420b, 또는 1170a, 1170b)를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)가 분할 형태 정보에 기초하여 비-정사각형의 형태의 현재 부호화 단위(1100 또는 1150)를 분할하는 경우, 비-정사각형의 현재 부호화 단위(1100 또는 1150)의 긴 변의 위치를 고려하여 현재 부호화 단위를 분할할 수 있다. 예를 들면, 비디오 복호화 장치(100)는 현재 부호화 단위(1100 또는 1150)의 형태를 고려하여 현재 부호화 단위(1100 또는 1150)의 긴 변을 분할하는 방향으로 현재 부호화 단위(1100 또는 1150)를 분할하여 복수개의 부호화 단위를 결정할 수 있다.
일 실시예에 따라, 분할 형태 정보가 홀수개의 블록으로 부호화 단위를 분할하는 것을 나타내는 경우, 비디오 복호화 장치(100)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있다. 예를 들면, 분할 형태 정보가 3개의 부호화 단위로 현재 부호화 단위(1100 또는 1150)를 분할하는 것을 나타내는 경우, 비디오 복호화 장치(100)는 현재 부호화 단위(1100 또는 1150)를 3개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)로 분할할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있으며, 결정된 부호화 단위들의 크기 모두가 동일하지는 않을 수 있다. 예를 들면, 결정된 홀수개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c) 중 소정의 부호화 단위(1130b 또는 1180b)의 크기는 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)들과는 다른 크기를 가질 수도 있다. 즉, 현재 부호화 단위(1100 또는 1150)가 분할되어 결정될 수 있는 부호화 단위는 복수의 종류의 크기를 가질 수 있고, 경우에 따라서는 홀수개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)가 각각 서로 다른 크기를 가질 수도 있다.
일 실시예에 따라 분할 형태 정보가 홀수개의 블록으로 부호화 단위가 분할되는 것을 나타내는 경우, 비디오 복호화 장치(100)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있고, 나아가 비디오 복호화 장치(100)는 분할하여 생성되는 홀수개의 부호화 단위들 중 적어도 하나의 부호화 단위에 대하여 소정의 제한을 둘 수 있다. 도 11을 참조하면 비디오 복호화 장치(100)는 현재 부호화 단위(1100 또는 1150)가 분할되어 생성된 3개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)들 중 중앙에 위치하는 부호화 단위(1130b, 1180b)에 대한 복호화 과정을 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)와 다르게 할 수 있다. 예를 들면, 비디오 복호화 장치(100)는 중앙에 위치하는 부호화 단위(1130b, 1180b)에 대하여는 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)와 달리 더 이상 분할되지 않도록 제한하거나, 소정의 횟수만큼만 분할되도록 제한할 수 있다.
도 12는 일 실시예에 따라 비디오 복호화 장치(100)가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위를 분할하는 과정을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 정사각형 형태의 제1 부호화 단위(1200)를 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다. 일 실시예에 따라 분할 형태 정보가 수평 방향으로 제1 부호화 단위(1200)를 분할하는 것을 나타내는 경우, 비디오 복호화 장치(100)는 제1 부호화 단위(1200)를 수평 방향으로 분할하여 제2 부호화 단위(1210)를 결정할 수 있다. 일 실시예에 따라 이용되는 제1 부호화 단위, 제2 부호화 단위, 제3 부호화 단위는 부호화 단위 간의 분할 전후 관계를 이해하기 위해 이용된 용어이다. 예를 들면, 제1 부호화 단위를 분할하면 제2 부호화 단위가 결정될 수 있고, 제2 부호화 단위가 분할되면 제3 부호화 단위가 결정될 수 있다. 이하에서는 이용되는 제1 부호화 단위, 제2 부호화 단위 및 제3 부호화 단위의 관계는 상술한 특징에 따르는 것으로 이해될 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 결정된 제2 부호화 단위(1210)를 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다. 도 12를 참조하면 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)를 분할하여 결정된 비-정사각형의 형태의 제2 부호화 단위(1210)를 적어도 하나의 제3 부호화 단위(1220a, 1220b, 1220c, 1220d 등)로 분할하거나 제2 부호화 단위(1210)를 분할하지 않을 수 있다. 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 획득할 수 있고 비디오 복호화 장치(100)는 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)를 분할하여 다양한 형태의 복수개의 제2 부호화 단위(예를 들면, 1210)를 분할할 수 있으며, 제2 부호화 단위(1210)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)가 분할된 방식에 따라 분할될 수 있다. 일 실시예에 따라, 제1 부호화 단위(1200)가 제1 부호화 단위(1200)에 대한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제2 부호화 단위(1210)로 분할된 경우, 제2 부호화 단위(1210) 역시 제2 부호화 단위(1210)에 대한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제3 부호화 단위(예를 들면, 1220a, 1220b, 1220c, 1220d 등)으로 분할될 수 있다. 즉, 부호화 단위는 부호화 단위 각각에 관련된 분할 형태 정보 및 블록 형태 정보 중 적어도 하나에 기초하여 재귀적으로 분할될 수 있다. 따라서 비-정사각형 형태의 부호화 단위에서 정사각형의 부호화 단위가 결정될 수 있고, 이러한 정사각형 형태의 부호화 단위가 재귀적으로 분할되어 비-정사각형 형태의 부호화 단위가 결정될 수도 있다. 도 12를 참조하면, 비-정사각형 형태의 제2 부호화 단위(1210)가 분할되어 결정되는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 소정의 부호화 단위(예를 들면, 가운데에 위치하는 부호화 단위 또는 정사각형 형태의 부호화 단위)는 재귀적으로 분할될 수 있다. 일 실시예에 따라 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 하나인 정사각형 형태의 제3 부호화 단위(1220c)는 수평 방향으로 분할되어 복수개의 제4 부호화 단위로 분할될 수 있다. 복수개의 제4 부호화 단위 중 하나인 비-정사각형 형태의 제4 부호화 단위(1240)는 다시 복수개의 부호화 단위들로 분할될 수 있다. 예를 들면, 비-정사각형 형태의 제4 부호화 단위(1240)는 홀수개의 부호화 단위(1250a, 1250b, 1250c)로 다시 분할될 수도 있다.
부호화 단위의 재귀적 분할에 이용될 수 있는 방법에 대하여는 다양한 실시예를 통해 후술하도록 한다.
일 실시예에 따라 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제3 부호화 단위(1220a, 1220b, 1220c, 1220d 등) 각각을 부호화 단위들로 분할하거나 제2 부호화 단위(1210)를 분할하지 않는 것으로 결정할 수 있다. 비디오 복호화 장치(100)는 일 실시예에 따라 비-정사각형 형태의 제2 부호화 단위(1210)를 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d)로 분할할 수 있다. 비디오 복호화 장치(100)는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 소정의 제3 부호화 단위에 대하여 소정의 제한을 둘 수 있다. 예를 들면 비디오 복호화 장치(100)는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 가운데에 위치하는 부호화 단위(1220c)에 대하여는 더 이상 분할되지 않는 것으로 제한하거나 또는 설정 가능한 횟수로 분할되어야 하는 것으로 제한할 수 있다. 도 12를 참조하면, 비디오 복호화 장치(100)는 비-정사각형 형태의 제2 부호화 단위(1210)에 포함되는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d)들 중 가운데에 위치하는 부호화 단위(1220c)는 더 이상 분할되지 않거나, 소정의 분할 형태로 분할(예를 들면 4개의 부호화 단위로만 분할하거나 제2 부호화 단위(1210)가 분할된 형태에 대응하는 형태로 분할)되는 것으로 제한하거나, 소정의 횟수로만 분할(예를 들면 n회만 분할, n>0)하는 것으로 제한할 수 있다. 다만 가운데에 위치한 부호화 단위(1220c)에 대한 상기 제한은 단순한 실시예들에 불과하므로 상술한 실시예들로 제한되어 해석되어서는 안되고, 가운데에 위치한 부호화 단위(1220c)가 다른 부호화 단위(1220b, 1220d)와 다르게 복호화 될 수 있는 다양한 제한들을 포함하는 것으로 해석되어야 한다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위를 분할하기 위해 이용되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 현재 부호화 단위 내의 소정의 위치에서 획득할 수 있다.
도 13은 일 실시예에 따라 비디오 복호화 장치(100)가 홀수개의 부호화 단위들 중 소정의 부호화 단위를 결정하기 위한 방법을 도시한다. 도 13을 참조하면, 현재 부호화 단위(1300)의 블록 형태 정보 및 분할 형태 정보 중 적어도 하나는 현재 부호화 단위(1300)에 포함되는 복수개의 샘플 중 소정 위치의 샘플(예를 들면, 가운데에 위치하는 샘플(1340))에서 획득될 수 있다. 다만 이러한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나가 획득될 수 있는 현재 부호화 단위(1300) 내의 소정 위치가 도 13에서 도시하는 가운데 위치로 한정하여 해석되어서는 안되고, 소정 위치에는 현재 부호화 단위(1300)내에 포함될 수 있는 다양한 위치(예를 들면, 최상단, 최하단, 좌측, 우측, 좌측상단, 좌측하단, 우측상단 또는 우측하단 등)가 포함될 수 있는 것으로 해석되어야 한다. 비디오 복호화 장치(100)는 소정 위치로부터 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 획득하여 현재 부호화 단위를 다양한 형태 및 크기의 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위가 소정의 개수의 부호화 단위들로 분할된 경우 그 중 하나의 부호화 단위를 선택할 수 있다. 복수개의 부호화 단위들 중 하나를 선택하기 위한 방법은 다양할 수 있으며, 이러한 방법들에 대한 설명은 이하의 다양한 실시예를 통해 후술하도록 한다.
일 실시예에 따라 비디오 복호화 장치(100) 는 현재 부호화 단위를 복수개의 부호화 단위들로 분할하고, 소정 위치의 부호화 단위를 결정할 수 있다.
도 13은 일 실시예에 따라 비디오 복호화 장치(100)가 홀수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위한 방법을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 홀수개의 부호화 단위들 중 가운데에 위치하는 부호화 단위를 결정하기 위하여 홀수개의 부호화 단위들 각각의 위치를 나타내는 정보를 이용할 수 있다. 도 13을 참조하면, 비디오 복호화 장치(100)는 현재 부호화 단위(1300)를 분할하여 홀수개의 부호화 단위들(1320a, 1320b, 1320c)을 결정할 수 있다. 비디오 복호화 장치(100)는 홀수개의 부호화 단위들(1320a, 1320b, 1320c)의 위치에 대한 정보를 이용하여 가운데 부호화 단위(1320b)를 결정할 수 있다. 예를 들면 비디오 복호화 장치(100)는 부호화 단위들(1320a, 1320b, 1320c)에 포함되는 소정의 샘플의 위치를 나타내는 정보에 기초하여 부호화 단위들(1320a, 1320b, 1320c)의 위치를 결정함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 구체적으로, 비디오 복호화 장치(100)는 부호화 단위들(1320a, 1320b, 1320c)의 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보에 기초하여 부호화 단위(1320a, 1320b, 1320c)의 위치를 결정함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다.
일 실시예에 따라 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 위치 또는 좌표에 대한 정보를 포함할 수 있다. 일 실시예에 따라 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보는 현재 부호화 단위(1300)에 포함되는 부호화단위(1320a, 1320b, 1320c)들의 너비 또는 높이를 나타내는 정보를 포함할 수 있고, 이러한 너비 또는 높이는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 좌표 간의 차이를 나타내는 정보에 해당할 수 있다. 즉, 비디오 복호화 장치(100)는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 위치 또는 좌표에 대한 정보를 직접이용하거나 좌표간의 차이값에 대응하는 부호화 단위의 너비 또는 높이에 대한 정보를 이용함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다.
일 실시예에 따라, 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 나타내는 정보는 (xa, ya) 좌표를 나타낼 수 있고, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 위치를 나타내는 정보는 (xb, yb) 좌표를 나타낼 수 있고, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 위치를 나타내는 정보는 (xc, yc) 좌표를 나타낼 수 있다. 비디오 복호화 장치(100)는 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 좌표를 이용하여 가운데 부호화 단위(1320b)를 결정할 수 있다. 예를 들면, 좌측 상단의 샘플(1330a, 1330b, 1330c)의 좌표를 오름차순 또는 내림차순으로 정렬하였을 때, 가운데에 위치하는 샘플(1330b)의 좌표인 (xb, yb)를 포함하는 부호화 단위(1320b)를 현재 부호화 단위(1300)가 분할되어 결정된 부호화 단위(1320a, 1320b, 1320c) 중 가운데에 위치하는 부호화 단위로 결정할 수 있다. 다만 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 좌표는 픽쳐 내에서의 절대적인 위치를 나타내는 좌표를 나타낼 수 있고, 나아가 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 기준으로, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 상대적 위치를 나타내는 정보인 (dxb, dyb)좌표, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 상대적 위치를 나타내는 정보인 (dxc, dyc)좌표를 이용할 수도 있다. 또한 부호화 단위에 포함되는 샘플의 위치를 나타내는 정보로서 해당 샘플의 좌표를 이용함으로써 소정 위치의 부호화 단위를 결정하는 방법이 상술한 방법으로 한정하여 해석되어서는 안되고, 샘플의 좌표를 이용할 수 있는 다양한 산술적 방법으로 해석되어야 한다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위(1300)를 복수개의 부호화 단위(1320a, 1320b, 1320c)로 분할할 수 있고, 부호화 단위(1320a, 1320b, 1320c)들 중 소정의 기준에 따라 부호화 단위를 선택할 수 있다. 예를 들면, 비디오 복호화 장치(100)는 부호화 단위(1320a, 1320b, 1320c) 중 크기가 다른 부호화 단위(1320b)를 선택할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 나타내는 정보인 (xa, ya) 좌표, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 위치를 나타내는 정보인 (xb, yb) 좌표, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 위치를 나타내는 정보인 (xc, yc) 좌표를 이용하여 부호화 단위(1320a, 1320b, 1320c) 각각의 너비 또는 높이를 결정할 수 있다. 비디오 복호화 장치(100)는 부호화 단위(1320a, 1320b, 1320c)의 위치를 나타내는 좌표인 (xa, ya), (xb, yb), (xc, yc)를 이용하여 부호화 단위(1320a, 1320b, 1320c) 각각의 크기를 결정할 수 있다.
일 실시예에 따라, 비디오 복호화 장치(100)는 상단 부호화 단위(1320a)의 너비를 xb-xa로 결정할 수 있고 높이를 yb-ya로 결정할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 가운데 부호화 단위(1320b)의 너비를 xc-xb로 결정할 수 있고 높이를 yc-yb로 결정할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 하단 부호화 단위의 너비 또는 높이는 현재 부호화 단위의 너비 또는 높이와 상단 부호화 단위(1320a) 및 가운데 부호화 단위(1320b)의 너비 및 높이를 이용하여 결정할 수 있다. 비디오 복호화 장치(100)는 결정된 부호화 단위(1320a, 1320b, 1320c)의 너비 및 높이에 기초하여 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정할 수 있다. 도 13을 참조하면, 비디오 복호화 장치(100)는 상단 부호화 단위(1320a) 및 하단 부호화 단위(1320c)의 크기와 다른 크기를 가지는 가운데 부호화 단위(1320b)를 소정 위치의 부호화 단위로 결정할 수 있다. 다만 상술한 비디오 복호화 장치(100)가 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정하는 과정은 샘플 좌표에 기초하여 결정되는 부호화 단위의 크기를 이용하여 소정 위치의 부호화 단위를 결정하는 일 실시예에 불과하므로, 소정의 샘플 좌표에 따라 결정되는 부호화 단위의 크기를 비교하여 소정 위치의 부호화 단위를 결정하는 다양한 과정이 이용될 수 있다.
다만 부호화 단위의 위치를 결정하기 위하여 고려하는 샘플의 위치는 상술한 좌측 상단으로 한정하여 해석되어서는 안되고 부호화 단위에 포함되는 임의의 샘플의 위치에 대한 정보가 이용될 수 있는 것으로 해석될 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위의 형태를 고려하여, 현재 부호화 단위가 분할되어 결정되는 홀수개의 부호화 단위들 중 소정 위치의 부호화 단위를 선택할 수 있다. 예를 들면, 현재 부호화 단위가 너비가 높이보다 긴 비-정사각형 형태라면 비디오 복호화 장치(100)는 수평 방향에 따라 소정 위치의 부호화 단위를 결정할 수 있다. 즉, 비디오 복호화 장치(100)는 수평 방향으로 위치를 달리 하는 부호화 단위들 중 하나를 결정하여 해당 부호화 단위에 대한 제한을 둘 수 있다. 현재 부호화 단위가 높이가 너비보다 긴 비-정사각형 형태라면 비디오 복호화 장치(100)는 수직 방향에 따라 소정 위치의 부호화 단위를 결정할 수 있다. 즉, 비디오 복호화 장치(100)는 수직 방향으로 위치를 달리 하는 부호화 단위들 중 하나를 결정하여 해당 부호화 단위에 대한 제한을 둘 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 짝수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여 짝수개의 부호화 단위들 각각의 위치를 나타내는 정보를 이용할 수 있다. 비디오 복호화 장치(100)는 현재 부호화 단위를 분할하여 짝수개의 부호화 단위들을 결정할 수 있고 짝수개의 부호화 단위들의 위치에 대한 정보를 이용하여 소정 위치의 부호화 단위를 결정할 수 있다. 이에 대한 구체적인 과정은 도 13에서 상술한 홀수개의 부호화 단위들 중 소정 위치(예를 들면, 가운데 위치)의 부호화 단위를 결정하는 과정에 대응하는 과정일 수 있으므로 생략하도록 한다.
일 실시예에 따라, 비-정사각형 형태의 현재 부호화 단위를 복수개의 부호화 단위로 분할한 경우, 복수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여 분할 과정에서 소정 위치의 부호화 단위에 대한 소정의 정보를 이용할 수 있다. 예를 들면 비디오 복호화 장치(100)는 현재 부호화 단위가 복수개로 분할된 부호화 단위들 중 가운데에 위치하는 부호화 단위를 결정하기 위하여 분할 과정에서 가운데 부호화 단위에 포함된 샘플에 저장된 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다.
도 13을 참조하면 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 현재 부호화 단위(1300)를 복수개의 부호화 단위들(1320a, 1320b, 1320c)로 분할할 수 있으며, 복수개의 부호화 단위들(1320a, 1320b, 1320c) 중 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 나아가 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나가 획득되는 위치를 고려하여, 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 즉, 현재 부호화 단위(1300)의 블록 형태 정보 및 분할 형태 정보 중 적어도 하나는 현재 부호화 단위(1300)의 가운데에 위치하는 샘플(1340)에서 획득될 수 있으며, 상기 블록 형태 정보 및 상기 분할 형태 정보 중 적어도 하나에 기초하여 현재 부호화 단위(1300)가 복수개의 부호화 단위들(1320a, 1320b, 1320c)로 분할된 경우 상기 샘플(1340)을 포함하는 부호화 단위(1320b)를 가운데에 위치하는 부호화 단위로 결정할 수 있다. 다만 가운데에 위치하는 부호화 단위로 결정하기 위해 이용되는 정보가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나로 한정하여 해석되어서는 안되고, 다양한 종류의 정보가 가운데에 위치하는 부호화 단위를 결정하는 과정에서 이용될 수 있다.
일 실시예에 따라 소정 위치의 부호화 단위를 식별하기 위한 소정의 정보는, 결정하려는 부호화 단위에 포함되는 소정의 샘플에서 획득될 수 있다. 도 13을 참조하면, 비디오 복호화 장치(100)는 현재 부호화 단위(1300)가 분할되어 결정된 복수개의 부호화 단위들(1320a, 1320b, 1320c) 중 소정 위치의 부호화 단위(예를 들면, 복수개로 분할된 부호화 단위 중 가운데에 위치하는 부호화 단위)를 결정하기 위하여 현재 부호화 단위(1300) 내의 소정 위치의 샘플(예를 들면, 현재 부호화 단위(1300)의 가운데에 위치하는 샘플)에서 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다. . 즉, 비디오 복호화 장치(100)는 현재 부호화 단위(1300)의 블록 블록 형태를 고려하여 상기 소정 위치의 샘플을 결정할 수 있고, 비디오 복호화 장치(100)는 현재 부호화 단위(1300)가 분할되어 결정되는 복수개의 부호화 단위(1320a, 1320b, 1320c)들 중, 소정의 정보(예를 들면, 블록 형태 정보 및 분할 형태 정보 중 적어도 하나)가 획득될 수 있는 샘플이 포함된 부호화 단위(1320b)를 결정하여 소정의 제한을 둘 수 있다. 도 13을 참조하면 일 실시예에 따라 비디오 복호화 장치(100)는 소정의 정보가 획득될 수 있는 샘플로서 현재 부호화 단위(1300)의 가운데에 위치하는 샘플(1340)을 결정할 수 있고, 비디오 복호화 장치(100)는 이러한 샘플(1340)이 포함되는 부호화 단위(1320b)를 복호화 과정에서의 소정의 제한을 둘 수 있다. 다만 소정의 정보가 획득될 수 있는 샘플의 위치는 상술한 위치로 한정하여 해석되어서는 안되고, 제한을 두기 위해 결정하려는 부호화 단위(1320b)에 포함되는 임의의 위치의 샘플들로 해석될 수 있다.
일 실시예에 따라 소정의 정보가 획득될 수 있는 샘플의 위치는 현재 부호화 단위(1300)의 형태에 따라 결정될 수 있다. 일 실시예에 따라 블록 형태 정보는 현재 부호화 단위의 형태가 정사각형인지 또는 비-정사각형인지 여부를 결정할 수 있고, 형태에 따라 소정의 정보가 획득될 수 있는 샘플의 위치를 결정할 수 있다. 예를 들면, 비디오 복호화 장치(100)는 현재 부호화 단위의 너비에 대한 정보 및 높이에 대한 정보 중 적어도 하나를 이용하여 현재 부호화 단위의 너비 및 높이 중 적어도 하나를 반으로 분할하는 경계 상에 위치하는 샘플을 소정의 정보가 획득될 수 있는 샘플로 결정할 수 있다. 또다른 예를 들면, 비디오 복호화 장치(100)는 현재 부호화 단위에 관련된 블록 형태 정보가 비-정사각형 형태임을 나타내는 경우, 현재 부호화 단위의 긴 변을 반으로 분할하는 경계에 인접하는 샘플 중 하나를 소정의 정보가 획득될 수 있는 샘플로 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위를 복수개의 부호화 단위로 분할한 경우, 복수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여, 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 부호화 단위에 포함된 소정 위치의 샘플에서 획득할 수 있고, 비디오 복호화 장치(100)는 현재 부호화 단위가 분할되어 생성된 복수개의 부호화 단위들을 복수개의 부호화 단위 각각에 포함된 소정 위치의 샘플로부터 획득되는 분할 형태 정보 및 블록 형태 정보 중 적어도 하나를 이용하여 분할할 수 있다. 즉, 부호화 단위는 부호화 단위 각각에 포함된 소정 위치의 샘플에서 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용하여 재귀적으로 분할될 수 있다. 부호화 단위의 재귀적 분할 과정에 대하여는 도 12를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정할 수 있고, 이러한 적어도 하나의 부호화 단위가 복호화되는 순서를 소정의 블록(예를 들면, 현재 부호화 단위)에 따라 결정할 수 있다.
도 14는 일 실시예에 따라 비디오 복호화 장치(100)가 현재 부호화 단위를 분할하여 복수개의 부호화 단위들을 결정하는 경우, 복수개의 부호화 단위들이 처리되는 순서를 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보에 따라 제1 부호화 단위(1400)를 수직 방향으로 분할하여 제2 부호화 단위(1410a, 1410b)를 결정하거나 제1 부호화 단위(1400)를 수평 방향으로 분할하여 제2 부호화 단위(1430a, 1430b)를 결정하거나 제1 부호화 단위(1400)를 수직 방향 및 수평 방향으로 분할하여 제2 부호화 단위(1450a, 1450b, 1450c, 1450d)를 결정할 수 있다.
도 14를 참조하면, 비디오 복호화 장치(100)는 제1 부호화 단위(1400)를 수직 방향으로 분할하여 결정된 제2 부호화 단위(1410a, 1410b)를 수평 방향(1410c)으로 처리되도록 순서를 결정할 수 있다. 비디오 복호화 장치(100)는 제1 부호화 단위(1400)를 수평 방향으로 분할하여 결정된 제2 부호화 단위(1430a, 1430b)의 처리 순서를 수직 방향(1430c)으로 결정할 수 있다. 비디오 복호화 장치(100)는 제1 부호화 단위(1400)를 수직 방향 및 수평 방향으로 분할하여 결정된 제2 부호화 단위(1450a, 1450b, 1450c, 1450d)를 하나의 행에 위치하는 부호화 단위들이 처리된 후 다음 행에 위치하는 부호화 단위들이 처리되는 소정의 순서(예를 들면, 래스터 스캔 순서((raster scan order) 또는 z 스캔 순서(z scan order)(1450e) 등)에 따라 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 부호화 단위들을 재귀적으로 분할할 수 있다. 도 14를 참조하면, 비디오 복호화 장치(100)는 제1 부호화 단위(1400)를 분할하여 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)을 결정할 수 있고, 결정된 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d) 각각을 재귀적으로 분할할 수 있다. 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)을 분할하는 방법은 제1 부호화 단위(1400)를 분할하는 방법에 대응하는 방법이 될 수 있다. 이에 따라 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)은 각각 독립적으로 복수개의 부호화 단위들로 분할될 수 있다. 도 14를 참조하면 비디오 복호화 장치(100)는 제1 부호화 단위(1400)를 수직 방향으로 분할하여 제2 부호화 단위(1410a, 1410b)를 결정할 수 있고, 나아가 제2 부호화 단위(1410a, 1410b) 각각을 독립적으로 분할하거나 분할하지 않는 것으로 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 좌측의 제2 부호화 단위(1410a)를 수평 방향으로 분할하여 제3 부호화 단위(1420a, 1420b)로 분할할 수 있고, 우측의 제2 부호화 단위(1410b)는 분할하지 않을 수 있다.
일 실시예에 따라 부호화 단위들의 처리 순서는 부호화 단위의 분할 과정에 기초하여 결정될 수 있다. 다시 말해, 분할된 부호화 단위들의 처리 순서는 분할되기 직전의 부호화 단위들의 처리 순서에 기초하여 결정될 수 있다. 비디오 복호화 장치(100)는 좌측의 제2 부호화 단위(1410a)가 분할되어 결정된 제3 부호화 단위(1420a, 1420b)가 처리되는 순서를 우측의 제2 부호화 단위(1410b)와 독립적으로 결정할 수 있다. 좌측의 제2 부호화 단위(1410a)가 수평 방향으로 분할되어 제3 부호화 단위(1420a, 1420b)가 결정되었으므로 제3 부호화 단위(1420a, 1420b)는 수직 방향(1420c)으로 처리될 수 있다. 또한 좌측의 제2 부호화 단위(1410a) 및 우측의 제2 부호화 단위(1410b)가 처리되는 순서는 수평 방향(1410c)에 해당하므로, 좌측의 제2 부호화 단위(1410a)에 포함되는 제3 부호화 단위(1420a, 1420b)가 수직 방향(1420c)으로 처리된 후에 우측 부호화 단위(1410b)가 처리될 수 있다. 상술한 내용은 부호화 단위들이 각각 분할 전의 부호화 단위에 따라 처리 순서가 결정되는 과정을 설명하기 위한 것이므로, 상술한 실시예에 한정하여 해석되어서는 안되고, 다양한 형태로 분할되어 결정되는 부호화 단위들이 소정의 순서에 따라 독립적으로 처리될 수 있는 다양한 방법으로 이용되는 것으로 해석되어야 한다.
도 15는 일 실시예에 따라 비디오 복호화 장치(100)가 소정의 순서로 부호화 단위가 처리될 수 없는 경우, 현재 부호화 단위가 홀수개의 부호화 단위로 분할되는 것임을 결정하는 과정을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 획득된 블록 형태 정보 및 분할 형태 정보에 기초하여 현재 부호화 단위가 홀수개의 부호화 단위들로 분할되는 것을 결정할 수 있다. 도 15를 참조하면 정사각형 형태의 제1 부호화 단위(1500)가 비-정사각형 형태의 제2 부호화 단위(1510a, 1510b)로 분할될 수 있고, 제2 부호화 단위(1510a, 1510b)는 각각 독립적으로 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)로 분할될 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 제2 부호화 단위 중 좌측 부호화 단위(1510a)는 수평 방향으로 분할하여 복수개의 제3 부호화 단위(1520a, 1520b)를 결정할 수 있고, 우측 부호화 단위(1510b)는 홀수개의 제3 부호화 단위(1520c, 1520d, 1520e)로 분할할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 제3 부호화 단위들(1520a, 1520b, 1520c, 1520d, 1520e)이 소정의 순서로 처리될 수 있는지 여부를 판단하여 홀수개로 분할된 부호화 단위가 존재하는지를 결정할 수 있다. 도 15를 참조하면, 비디오 복호화 장치(100)는 제1 부호화 단위(1500)를 재귀적으로 분할하여 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)를 결정할 수 있다. 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여, 제1 부호화 단위(1500), 제2 부호화 단위(1510a, 1510b) 또는 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)가 분할되는 형태 중 홀수개의 부호화 단위로 분할되는지 여부를 결정할 수 있다. 예를 들면, 제2 부호화 단위(1510a, 1510b) 중 우측에 위치하는 부호화 단위가 홀수개의 제3 부호화 단위(1520c, 1520d, 1520e)로 분할될 수 있다. 제1 부호화 단위(1500)에 포함되는 복수개의 부호화 단위들이 처리되는 순서는 소정의 순서(예를 들면, z-스캔 순서(z-scan order)(1530))가 될 수 있고, 비디오 복호화 장치(100)는 우측 제2 부호화 단위(1510b)가 홀수개로 분할되어 결정된 제3 부호화 단위(1520c, 1520d, 1520e)가 상기 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 판단할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 제1 부호화 단위(1500)에 포함되는 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)가 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 결정할 수 있으며, 상기 조건은 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)의 경계에 따라 제2 부호화 단위(1510a, 1510b)의 너비 및 높이 중 적어도 하나를 반으로 분할되는지 여부와 관련된다. 예를 들면 비-정사각형 형태의 좌측 제2 부호화 단위(1510a)의 높이를 반으로 분할하여 결정되는 제3 부호화 단위(1520a, 1520b)는 조건을 만족하지만, 우측 제2 부호화 단위(1510b)를 3개의 부호화 단위로 분할하여 결정되는 제3 부호화 단위(1520c, 1520d, 1520e)들의 경계가 우측 제2 부호화 단위(1510b)의 너비 또는 높이를 반으로 분할하지 못하므로 제3 부호화 단위(1520c, 1520d, 1520e)는 조건을 만족하지 못하는 것으로 결정될 수 있고, 비디오 복호화 장치(100)는 이러한 조건 불만족의 경우 스캔 순서의 단절(disconnection)로 판단하고, 판단 결과에 기초하여 우측 제2 부호화 단위(1510b)는 홀수개의 부호화 단위로 분할되는 것으로 결정할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 홀수개의 부호화 단위로 분할되는 경우 분할된 부호화 단위들 중 소정 위치의 부호화 단위에 대하여 소정의 제한을 둘 수 있으며, 이러한 제한 내용 또는 소정 위치 등에 대하여는 다양한 실시예를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
도 16은 일 실시예에 따라 비디오 복호화 장치(100)가 제1 부호화 단위(1600)를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다. 일 실시예에 따라 비디오 복호화 장치(100)는 획득부(110)를 통해 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1600)를 분할할 수 있다. 정사각형 형태의 제1 부호화 단위(1600)는 4개의 정사각형 형태를 가지는 부호화 단위로 분할되거나 또는 비-정사각형 형태의 복수개의 부호화 단위로 분할할 수 있다. 예를 들면 도 16을 참조하면, 블록 형태 정보가 제1 부호화 단위(1600)는 정사각형임을 나타내고 분할 형태 정보가 비-정사각형의 부호화 단위로 분할됨을 나타내는 경우 비디오 복호화 장치(100)는 제1 부호화 단위(1600)를 복수개의 비-정사각형의 부호화 단위들로 분할할 수 있다. 구체적으로, 분할 형태 정보가 제1 부호화 단위(1600)를 수평 방향 또는 수직 방향으로 분할하여 홀수개의 부호화 단위를 결정하는 것을 나타내는 경우, 비디오 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(1600)을 홀수개의 부호화 단위들로서 수직 방향으로 분할되어 결정된 제2 부호화 단위(1610a, 1610b, 1610c) 또는 수평 방향으로 분할되어 결정된 제2 부호화 단위(1620a, 1620b, 1620c)로 분할할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 제1 부호화 단위(1600)에 포함되는 제2 부호화 단위(1610a, 1610b, 1610c, 1620a, 1620b, 1620c)가 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 결정할 수 있으며, 상기 조건은 제2 부호화 단위(1610a, 1610b, 1610c, 1620a, 1620b, 1620c)의 경계에 따라 제1 부호화 단위(1600)의 너비 및 높이 중 적어도 하나를 반으로 분할되는지 여부와 관련된다. 도 16를 참조하면 정사각형 형태의 제1 부호화 단위(1600)를 수직 방향으로 분할하여 결정되는 제2 부호화 단위(1610a, 1610b, 1610c)들의 경계가 제1 부호화 단위(1600)의 너비를 반으로 분할하지 못하므로 제1 부호화 단위(1600)는 소정의 순서에 따라 처리될 수 있는 조건을 만족하지 못하는 것으로 결정될 수 있다. 또한 정사각형 형태의 제1 부호화 단위(1600)를 수평 방향으로 분할하여 결정되는 제2 부호화 단위(1620a, 1620b, 1620c)들의 경계가 제1 부호화 단위(1600)의 너비를 반으로 분할하지 못하므로 제1 부호화 단위(1600)는 소정의 순서에 따라 처리될 수 있는 조건을 만족하지 못하는 것으로 결정될 수 있다. 비디오 복호화 장치(100)는 이러한 조건 불만족의 경우 스캔 순서의 단절(disconnection)로 판단하고, 판단 결과에 기초하여 제1 부호화 단위(1600)는 홀수개의 부호화 단위로 분할되는 것으로 결정할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 홀수개의 부호화 단위로 분할되는 경우 분할된 부호화 단위들 중 소정 위치의 부호화 단위에 대하여 소정의 제한을 둘 수 있으며, 이러한 제한 내용 또는 소정 위치 등에 대하여는 다양한 실시예를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라, 비디오 복호화 장치(100)는 제1 부호화 단위를 분할하여 다양한 형태의 부호화 단위들을 결정할 수 있다.
도 16을 참조하면, 비디오 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(1600), 비-정사각형 형태의 제1 부호화 단위(1630 또는 1650)를 다양한 형태의 부호화 단위들로 분할할 수 있다.
도 17은 일 실시예에 따라 비디오 복호화 장치(100)가 제1 부호화 단위(1700)가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위가 소정의 조건을 만족하는 경우 제2 부호화 단위가 분할될 수 있는 형태가 제한되는 것을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 획득부(105)를 통해 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 정사각형 형태의 제1 부호화 단위(1700)를 비-정사각형 형태의 제2 부호화 단위(1710a, 1710b, 1720a, 1720b)로 분할하는 것으로 결정할 수 있다. 제2 부호화 단위(1710a, 1710b, 1720a, 1720b)는 독립적으로 분할될 수 있다. 이에 따라 비디오 복호화 장치(100)는 제2 부호화 단위(1710a, 1710b, 1720a, 1720b) 각각에 관련된 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 복수개의 부호화 단위로 분할하거나 분할하지 않는 것을 결정할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 수직 방향으로 제1 부호화 단위(1700)가 분할되어 결정된 비-정사각형 형태의 좌측 제2 부호화 단위(1710a)를 수평 방향으로 분할하여 제3 부호화 단위(1712a, 1712b)를 결정할 수 있다. 다만 비디오 복호화 장치(100)는 좌측 제2 부호화 단위(1710a)를 수평 방향으로 분할한 경우, 우측 제2 부호화 단위(1710b)는 좌측 제2 부호화 단위(1710a)가 분할된 방향과 동일하게 수평 방향으로 분할될 수 없도록 제한할 수 있다. 만일 우측 제2 부호화 단위(1710b)가 동일한 방향으로 분할되어 제3 부호화 단위(1714a, 1714b)가 결정된 경우, 좌측 제2 부호화 단위(1710a) 및 우측 제2 부호화 단위(1710b)가 수평 방향으로 각각 독립적으로 분할됨으로써 제3 부호화 단위(1712a, 1712b, 1714a, 1714b)가 결정될 수 있다. 하지만 이는 비디오 복호화 장치(100)가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1700)를 4개의 정사각형 형태의 제2 부호화 단위(1730a, 1730b, 1730c, 1730d)로 분할한 것과 동일한 결과이며 이는 영상 복호화 측면에서 비효율적일 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 수평 방향으로 제1 부호화 단위(11300)가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위(1720a 또는 1720b)를 수직 방향으로 분할하여 제3 부호화 단위(1722a, 1722b, 1724a, 1724b)를 결정할 수 있다. 다만 비디오 복호화 장치(100)는 제2 부호화 단위 중 하나(예를 들면 상단 제2 부호화 단위(1720a))를 수직 방향으로 분할한 경우, 상술한 이유에 따라 다른 제2 부호화 단위(예를 들면 하단 부호화 단위(1720b))는 상단 제2 부호화 단위(1720a)가 분할된 방향과 동일하게 수직 방향으로 분할될 수 없도록 제한할 수 있다.
도 18은 일 실시예에 따라 분할 형태 정보가 4개의 정사각형 형태의 부호화 단위로 분할하는 것을 나타낼 수 없는 경우, 비디오 복호화 장치(100)가 정사각형 형태의 부호화 단위를 분할하는 과정을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1800)를 분할하여 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 결정할 수 있다. 분할 형태 정보에는 부호화 단위가 분할될 수 있는 다양한 형태에 대한 정보가 포함될 수 있으나, 다양한 형태에 대한 정보에는 정사각형 형태의 4개의 부호화 단위로 분할하기 위한 정보가 포함될 수 없는 경우가 있다. 이러한 분할 형태 정보에 따르면, 비디오 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(1800)를 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할하지 못한다. 분할 형태 정보에 기초하여 비디오 복호화 장치(100)는 비-정사각형 형태의 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 비-정사각형 형태의 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 각각 독립적으로 분할할 수 있다. 재귀적인 방법을 통해 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등) 각각이 소정의 순서대로 분할될 수 있으며, 이는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1800)가 분할되는 방법에 대응하는 분할 방법일 수 있다.
예를 들면 비디오 복호화 장치(100)는 좌측 제2 부호화 단위(1810a)가 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1812a, 1812b)를 결정할 수 있고, 우측 제2 부호화 단위(1810b)가 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1814a, 1814b)를 결정할 수 있다. 나아가 비디오 복호화 장치(100)는 좌측 제2 부호화 단위(1810a) 및 우측 제2 부호화 단위(1810b) 모두 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1816a, 1816b, 1816c, 1816d)를 결정할 수도 있다. 이러한 경우 제1 부호화 단위(1800)가 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할된 것과 동일한 형태로 부호화 단위가 결정될 수 있다.
또 다른 예를 들면 비디오 복호화 장치(100)는 상단 제2 부호화 단위(1820a)가 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1822a, 1822b)를 결정할 수 있고, 하단 제2 부호화 단위(1820b)가 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1824a, 1824b)를 결정할 수 있다. 나아가 비디오 복호화 장치(100)는 상단 제2 부호화 단위(1820a) 및 하단 제2 부호화 단위(1820b) 모두 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1822a, 1822b, 1824a, 1824b)를 결정할 수도 있다. 이러한 경우 제1 부호화 단위(1800)가 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할된 것과 동일한 형태로 부호화 단위가 결정될 수 있다.
도 19는 일 실시예에 따라 복수개의 부호화 단위들 간의 처리 순서가 부호화 단위의 분할 과정에 따라 달라질 수 있음을 도시한 것이다.
일 실시예에 따라 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보에 기초하여 제1 부호화 단위(1900)를 분할할 수 있다. 블록 형태 정보가 정사각형 형태를 나타내고, 분할 형태 정보가 제1 부호화 단위(1900)가 수평 방향 및 수직 방향 중 적어도 하나의 방향으로 분할됨을 나타내는 경우, 비디오 복호화 장치(100)는 제1 부호화 단위(1900)를 분할하여 제2 부호화 단위(예를 들면, 1910a, 1910b, 1920a, 1920b, 1930a, 1930b, 1930c, 1930d 등)를 결정할 수 있다. 도 19를 참조하면 제1 부호화 단위1900)가 수평 방향 또는 수직 방향만으로 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)는 각각에 대한 블록 형태 정보 및 분할 형태 정보에 기초하여 독립적으로 분할될 수 있다. 예를 들면 비디오 복호화 장치(100)는 제1 부호화 단위(1900)가 수직 방향으로 분할되어 생성된 제2 부호화 단위(1910a, 1910b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 결정할 수 있고, 제1 부호화 단위(1900)가 수평 방향으로 분할되어 생성된 제2 부호화 단위(1920a, 1920b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 결정할 수 있다. 이러한 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)의 분할 과정은 도 17과 관련하여 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 비디오 복호화 장치(100)는 소정의 순서에 따라 부호화 단위를 처리할 수 있다. 소정의 순서에 따른 부호화 단위의 처리에 대한 특징은 도 14과 관련하여 상술하였으므로 자세한 설명은 생략하도록 한다. 도 19를 참조하면 비디오 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(1900)를 분할하여 4개의 정사각형 형태의 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)를 결정할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 제1 부호화 단위(1900)가 분할되는 형태에 따라 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)의 처리 순서를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 수직 방향으로 분할되어 생성된 제2 부호화 단위(1910a, 1910b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 결정할 수 있고, 비디오 복호화 장치(100)는 좌측 제2 부호화 단위(1910a)에 포함되는 제3 부호화 단위(1916a, 1916b)를 수직 방향으로 먼저 처리한 후, 우측 제2 부호화 단위(1910b)에 포함되는 제3 부호화 단위(1916c, 1916d)를 수직 방향으로 처리하는 순서(1917)에 따라 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 처리할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 수평 방향으로 분할되어 생성된 제2 부호화 단위(1920a, 1920b)를 수직 방향으로 각각 분할하여 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 결정할 수 있고, 비디오 복호화 장치(100)는 상단 제2 부호화 단위(1920a)에 포함되는 제3 부호화 단위(1926a, 1926b)를 수평 방향으로 먼저 처리한 후, 하단 제2 부호화 단위(1920b)에 포함되는 제3 부호화 단위(1926c, 1926d)를 수평 방향으로 처리하는 순서(1927)에 따라 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 처리할 수 있다.
도 19를 참조하면, 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)가 각각 분할되어 정사각형 형태의 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)가 결정될 수 있다. 수직 방향으로 분할되어 결정된 제2 부호화 단위(1910a, 1910b) 및 수평 방향으로 분할되어 결정된 제2 부호화 단위(1920a, 1920b)는 서로 다른 형태로 분할된 것이지만, 이후에 결정되는 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)에 따르면 결국 동일한 형태의 부호화 단위들로 제1 부호화 단위(1900)가 분할된 결과가 된다. 이에 따라 비디오 복호화 장치(100)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 상이한 과정을 통해 재귀적으로 부호화 단위를 분할함으로써 결과적으로 동일한 형태의 부호화 단위들을 결정하더라도, 동일한 형태로 결정된 복수개의 부호화 단위들을 서로 다른 순서로 처리할 수 있다.
도 20은 일 실시예에 따라 부호화 단위가 재귀적으로 분할되어 복수개의 부호화 단위가 결정되는 경우, 부호화 단위의 형태 및 크기가 변함에 따라 부호화 단위의 심도가 결정되는 과정을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 부호화 단위의 심도를 소정의 기준에 따라 결정할 수 있다. 예를 들면 소정의 기준은 부호화 단위의 긴 변의 길이가 될 수 있다. 비디오 복호화 장치(100)는 현재 부호화 단위의 긴 변의 길이가 분할되기 전의 부호화 단위의 긴 변의 길이보다 2n (n>0) 배로 분할된 경우, 현재 부호화 단위의 심도는 분할되기 전의 부호화 단위의 심도보다 n만큼 심도가 증가된 것으로 결정할 수 있다. 이하에서는 심도가 증가된 부호화 단위를 하위 심도의 부호화 단위로 표현하도록 한다.
도 20을 참조하면, 일 실시예에 따라 정사각형 형태임을 나타내는 블록 형태 정보(예를 들면 블록 형태 정보는 ′0: SQUARE′를 나타낼 수 있음)에 기초하여 비디오 복호화 장치(100)는 정사각형 형태인 제1 부호화 단위(2000)를 분할하여 하위 심도의 제2 부호화 단위(2002), 제3 부호화 단위(2004) 등을 결정할 수 있다. 정사각형 형태의 제1 부호화 단위(2000)의 크기를 2Nx2N이라고 한다면, 제1 부호화 단위(2000)의 너비 및 높이를 1/21배로 분할하여 결정된 제2 부호화 단위(2002)는 NxN의 크기를 가질 수 있다. 나아가 제2 부호화 단위(2002)의 너비 및 높이를 1/2크기로 분할하여 결정된 제3 부호화 단위(2004)는 N/2xN/2의 크기를 가질 수 있다. 이 경우 제3 부호화 단위(2004)의 너비 및 높이는 제1 부호화 단위(2000)의 1/22배에 해당한다. 제1 부호화 단위(2000)의 심도가 D인 경우 제1 부호화 단위(2000)의 너비 및 높이의 1/21배인 제2 부호화 단위(2002)의 심도는 D+1일 수 있고, 제1 부호화 단위(2000)의 너비 및 높이의 1/22배인 제3 부호화 단위(2004)의 심도는 D+2일 수 있다.
일 실시예에 따라 비-정사각형 형태를 나타내는 블록 형태 정보(예를 들면 블록 형태 정보는, 높이가 너비보다 긴 비-정사각형임을 나타내는 ′1: NS_VER′ 또는 너비가 높이보다 긴 비-정사각형임을 나타내는 ′2: NS_HOR′를 나타낼 수 있음)에 기초하여, 비디오 복호화 장치(100)는 비-정사각형 형태인 제1 부호화 단위(2010 또는 2020)를 분할하여 하위 심도의 제2 부호화 단위(2012 또는 2022), 제3 부호화 단위(2014 또는 2024) 등을 결정할 수 있다.
비디오 복호화 장치(100)는 Nx2N 크기의 제1 부호화 단위(2010)의 너비 및 높이 중 적어도 하나를 분할하여 제2 부호화 단위(예를 들면, 2002, 2012, 2022 등)를 결정할 수 있다. 즉, 비디오 복호화 장치(100)는 제1 부호화 단위(2010)를 수평 방향으로 분할하여 NxN 크기의 제2 부호화 단위(2002) 또는 NxN/2 크기의 제2 부호화 단위(2022)를 결정할 수 있고, 수평 방향 및 수직 방향으로 분할하여 N/2xN 크기의 제2 부호화 단위(2012)를 결정할 수도 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 2NxN 크기의 제1 부호화 단위(2020) 의 너비 및 높이 중 적어도 하나를 분할하여 제2 부호화 단위(예를 들면, 2002, 2012, 2022 등)를 결정할 수도 있다. 즉, 비디오 복호화 장치(100)는 제1 부호화 단위(2020)를 수직 방향으로 분할하여 NxN 크기의 제2 부호화 단위(2002) 또는 N/2xN 크기의 제2 부호화 단위(2012)를 결정할 수 있고, 수평 방향 및 수직 방향으로 분할하여 NxN/2 크기의 제2 부호화 단위(2022)를 결정할 수도 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 NxN 크기의 제2 부호화 단위(2002) 의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 비디오 복호화 장치(100)는 제2 부호화 단위(2002)를 수직 방향 및 수평 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004)를 결정하거나 N/22xN/2 크기의 제3 부호화 단위(2014)를 결정하거나 N/2xN/22 크기의 제3 부호화 단위(2024)를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 N/2xN 크기의 제2 부호화 단위(2012)의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 비디오 복호화 장치(100)는 제2 부호화 단위(2012)를 수평 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004) 또는 N/2xN/22 크기의 제3 부호화 단위(2024)를 결정하거나 수직 방향 및 수평 방향으로 분할하여 N/22xN/2 크기의 제3 부호화 단위(2014)를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 NxN/2 크기의 제2 부호화 단위(2014)의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 비디오 복호화 장치(100)는 제2 부호화 단위(2012)를 수직 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004) 또는 N/22xN/2 크기의 제3 부호화 단위(2014)를 결정하거나 수직 방향 및 수평 방향으로 분할하여 N/2xN/22크기의 제3 부호화 단위(2024)를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 정사각형 형태의 부호화 단위(예를 들면, 2000, 2002, 2004)를 수평 방향 또는 수직 방향으로 분할할 수 있다. 예를 들면, 2Nx2N 크기의 제1 부호화 단위(2000)를 수직 방향으로 분할하여 Nx2N 크기의 제1 부호화 단위(2010)를 결정하거나 수평 방향으로 분할하여 2NxN 크기의 제1 부호화 단위(2020)를 결정할 수 있다. 일 실시예에 따라 심도가 부호화 단위의 가장 긴 변의 길이에 기초하여 결정되는 경우, 2Nx2N 크기의 제1 부호화 단위(2000, 2002 또는 2004)가 수평 방향 또는 수직 방향으로 분할되어 결정되는 부호화 단위의 심도는 제1 부호화 단위(2000, 2002 또는 2004)의 심도와 동일할 수 있다.
일 실시예에 따라 제3 부호화 단위(2014 또는 2024)의 너비 및 높이는 제1 부호화 단위(2010 또는 2020)의 1/22배에 해당할 수 있다. 제1 부호화 단위(2010 또는 2020)의 심도가 D인 경우 제1 부호화 단위(2010 또는 2020)의 너비 및 높이의 1/2배인 제2 부호화 단위(2012 또는 2014)의 심도는 D+1일 수 있고, 제1 부호화 단위(2010 또는 2020)의 너비 및 높이의 1/22배인 제3 부호화 단위(2014 또는 2024)의 심도는 D+2일 수 있다.
도 21은 일 실시예에 따라 부호화 단위들의 형태 및 크기에 따라 결정될 수 있는 심도 및 부호화 단위 구분을 위한 인덱스(part index, 이하 PID)를 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(2100)를 분할하여 다양한 형태의 제2 부호화 단위를 결정할 수 있다. 도 21를 참조하면, 비디오 복호화 장치(100)는 분할 형태 정보에 따라 제1 부호화 단위(2100)를 수직 방향 및 수평 방향 중 적어도 하나의 방향으로 분할하여 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)를 결정할 수 있다. 즉, 비디오 복호화 장치(100)는 제1 부호화 단위(2100)에 대한 분할 형태 정보에 기초하여 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)를 결정할 수 있다.
일 실시예에 따라 정사각형 형태의 제1 부호화 단위(2100)에 대한 분할 형태 정보에 따라 결정되는 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)는 긴 변의 길이에 기초하여 심도가 결정될 수 있다. 예를 들면, 정사각형 형태의 제1 부호화 단위(2100)의 한 변의 길이와 비-정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 긴 변의 길이가 동일하므로, 제1 부호화 단위(2100)와 비-정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 심도는 D로 동일하다고 볼 수 있다. 이에 반해 비디오 복호화 장치(100)가 분할 형태 정보에 기초하여 제1 부호화 단위(2100)를 4개의 정사각형 형태의 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)로 분할한 경우, 정사각형 형태의 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)의 한 변의 길이는 제1 부호화 단위(2100)의 한 변의 길이의 1/2배 이므로, 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)의 심도는 제1 부호화 단위(2100)의 심도인 D보다 한 심도 하위인 D+1의 심도일 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 높이가 너비보다 긴 형태의 제1 부호화 단위(2110)를 분할 형태 정보에 따라 수평 방향으로 분할하여 복수개의 제2 부호화 단위(2112a, 2112b, 2114a, 2114b, 2114c)로 분할할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 너비가 높이보다 긴 형태의 제1 부호화 단위(2120)를 분할 형태 정보에 따라 수직 방향으로 분할하여 복수개의 제2 부호화 단위(2122a, 2122b, 2124a, 2124b, 2124c)로 분할할 수 있다.
일 실시예에 따라 비-정사각형 형태의 제1 부호화 단위(2110 또는 2120)에 대한 분할 형태 정보에 따라 결정되는 제2 부호화 단위(2112a, 2112b, 2114a, 2114b, 2116a, 2116b, 2116c, 2116d)는 긴 변의 길이에 기초하여 심도가 결정될 수 있다. 예를 들면, 정사각형 형태의 제2 부호화 단위(2112a, 2112b)의 한 변의 길이는 높이가 너비보다 긴 비-정사각형 형태의 제1 부호화 단위(2110)의 한 변의 길이의 1/2배이므로, 정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 심도는 비-정사각형 형태의 제1 부호화 단위(2110)의 심도 D보다 한 심도 하위의 심도인 D+1이다.
나아가 비디오 복호화 장치(100)가 분할 형태 정보에 기초하여 비-정사각형 형태의 제1 부호화 단위(2110)를 홀수개의 제2 부호화 단위(2114a, 2114b, 2114c)로 분할할 수 있다. 홀수개의 제2 부호화 단위(2114a, 2114b, 2114c)는 비-정사각형 형태의 제2 부호화 단위(2114a, 2114c) 및 정사각형 형태의 제2 부호화 단위(2114b)를 포함할 수 있다. 이 경우 비-정사각형 형태의 제2 부호화 단위(2114a, 2114c)의 긴 변의 길이 및 정사각형 형태의 제2 부호화 단위(2114b)의 한 변의 길이는 제1 부호화 단위(2110)의 한 변의 길이의 1/2배 이므로, 제2 부호화 단위(2114a, 2114b, 2114c)의 심도는 제1 부호화 단위(2110)의 심도인 D보다 한 심도 하위인 D+1의 심도일 수 있다. 비디오 복호화 장치(100)는 제1 부호화 단위(2110)와 관련된 부호화 단위들의 심도를 결정하는 상기 방식에 대응하는 방식으로, 너비가 높이보다 긴 비-정사각형 형태의 제1 부호화 단위(2120)와 관련된 부호화 단위들의 심도를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 분할된 부호화 단위들의 구분을 위한 인덱스(PID)를 결정함에 있어서, 홀수개로 분할된 부호화 단위들이 서로 동일한 크기가 아닌 경우, 부호화 단위들 간의 크기 비율에 기초하여 인덱스를 결정할 수 있다. 도 21를 참조하면, 홀수개로 분할된 부호화 단위들(2114a, 2114b, 2114c) 중 가운데에 위치하는 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)와 너비는 동일하지만 높이가 다른 부호화 단위들(2114a, 2114c)의 높이의 두 배일 수 있다. 즉, 이 경우 가운데에 위치하는 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)의 두 개를 포함할 수 있다. 따라서, 스캔 순서에 따라 가운데에 위치하는 부호화 단위(2114b)의 인덱스(PID)가 1이라면 그 다음 순서에 위치하는 부호화 단위(2114c)는 인덱스가 2가 증가한 3일수 있다. 즉 인덱스의 값의 불연속성이 존재할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 이러한 분할된 부호화 단위들 간의 구분을 위한 인덱스의 불연속성의 존재 여부에 기초하여 홀수개로 분할된 부호화 단위들이 서로 동일한 크기가 아닌지 여부를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위로부터 분할되어 결정된 복수개의 부호화 단위들을 구분하기 위한 인덱스의 값에 기초하여 특정 분할 형태로 분할된 것인지를 결정할 수 있다. 도 21를 참조하면 비디오 복호화 장치(100)는 높이가 너비보다 긴 직사각형 형태의 제1 부호화 단위(2110)를 분할하여 짝수개의 부호화 단위(2112a, 2112b)를 결정하거나 홀수개의 부호화 단위(2114a, 2114b, 2114c)를 결정할 수 있다. 비디오 복호화 장치(100)는 복수개의 부호화 단위 각각을 구분하기 위하여 각 부호화 단위를 나타내는 인덱스(PID)를 이용할 수 있다. 일 실시예에 따라 PID는 각각의 부호화 단위의 소정 위치의 샘플(예를 들면, 좌측 상단 샘플)에서 획득될 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 부호화 단위의 구분을 위한 인덱스를 이용하여 분할되어 결정된 부호화 단위들 중 소정 위치의 부호화 단위를 결정할 수 있다. 일 실시예에 따라 높이가 너비보다 긴 직사각형 형태의 제1 부호화 단위(2110)에 대한 분할 형태 정보가 3개의 부호화 단위로 분할됨을 나타내는 경우 비디오 복호화 장치(100)는 제1 부호화 단위(2110)를 3개의 부호화 단위(2114a, 2114b, 2114c)로 분할할 수 있다. 비디오 복호화 장치(100)는 3개의 부호화 단위(2114a, 2114b, 2114c) 각각에 대한 인덱스를 할당할 수 있다. 비디오 복호화 장치(100)는 홀수개로 분할된 부호화 단위 중 가운데 부호화 단위를 결정하기 위하여 각 부호화 단위에 대한 인덱스를 비교할 수 있다. 비디오 복호화 장치(100)는 부호화 단위들의 인덱스에 기초하여 인덱스들 중 가운데 값에 해당하는 인덱스를 갖는 부호화 단위(2114b)를, 제1 부호화 단위(2110)가 분할되어 결정된 부호화 단위 중 가운데 위치의 부호화 단위로서 결정할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 분할된 부호화 단위들의 구분을 위한 인덱스를 결정함에 있어서, 부호화 단위들이 서로 동일한 크기가 아닌 경우, 부호화 단위들 간의 크기 비율에 기초하여 인덱스를 결정할 수 있다. 도 21를 참조하면, 제1 부호화 단위(2110)가 분할되어 생성된 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)와 너비는 동일하지만 높이가 다른 부호화 단위들(2114a, 2114c)의 높이의 두 배일 수 있다. 이 경우 가운데에 위치하는 부호화 단위(2114b)의 인덱스(PID)가 1이라면 그 다음 순서에 위치하는 부호화 단위(2114c)는 인덱스가 2가 증가한 3일수 있다. 이러한 경우처럼 균일하게 인덱스가 증가하다가 증가폭이 달라지는 경우, 비디오 복호화 장치(100)는 다른 부호화 단위들과 다른 크기를 가지는 부호화 단위를 포함하는 복수개의 부호화 단위로 분할된 것으로 결정할 수 있다, 일 실시예에 따라 분할 형태 정보가 홀수개의 부호화 단위로 분할됨을 나타내는 경우, 비디오 복호화 장치(100)는 홀수개의 부호화 단위 중 소정 위치의 부호화 단위(예를 들면 가운데 부호화 단위)가 다른 부호화 단위와 크기가 다른 형태로 현재 부호화 단위를 분할할 수 있다. 이 경우 비디오 복호화 장치(100)는 부호화 단위에 대한 인덱스(PID)를 이용하여 다른 크기를 가지는 가운데 부호화 단위를 결정할 수 있다. 다만 상술한 인덱스, 결정하고자 하는 소정 위치의 부호화 단위의 크기 또는 위치는 일 실시예를 설명하기 위해 특정한 것이므로 이에 한정하여 해석되어서는 안되며, 다양한 인덱스, 부호화 단위의 위치 및 크기가 이용될 수 있는 것으로 해석되어야 한다.
일 실시예에 따라 비디오 복호화 장치(100)는 부호화 단위의 재귀적인 분할이 시작되는 소정의 데이터 단위를 이용할 수 있다.
도 22는 일 실시예에 따라 픽쳐에 포함되는 복수개의 소정의 데이터 단위에 따라 복수개의 부호화 단위들이 결정된 것을 도시한다.
일 실시예에 따라 소정의 데이터 단위는 부호화 단위가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용하여 재귀적으로 분할되기 시작하는 데이터 단위로 정의될 수 있다. 즉, 현재 픽쳐를 분할하는 복수개의 부호화 단위들이 결정되는 과정에서 이용되는 최상위 심도의 부호화 단위에 해당할 수 있다. 이하에서는 설명 상 편의를 위해 이러한 소정의 데이터 단위를 기준 데이터 단위라고 지칭하도록 한다.
일 실시예에 따라 기준 데이터 단위는 소정의 크기 및 형태를 나타낼 수 있다. 일 실시예에 따라, 기준 부호화 단위는 MxN의 샘플들을 포함할 수 있다. 여기서 M 및 N은 서로 동일할 수도 있으며, 2의 승수로 표현되는 정수일 수 있다. 즉, 기준 데이터 단위는 정사각형 또는 비-정사각형의 형태를 나타낼 수 있으며, 이후에 정수개의 부호화 단위로 분할될 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 픽쳐를 복수개의 기준 데이터 단위로 분할할 수 있다. 일 실시예에 따라 비디오 복호화 장치(100)는 현재 픽쳐를 분할하는 복수개의 기준 데이터 단위를 각각의 기준 데이터 단위에 대한 분할 정보를 이용하여 분할할 수 있다. 이러한 기준 데이터 단위의 분할 과정은 쿼드 트리(quad-tree)구조를 이용한 분할 과정에 대응될 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 픽쳐에 포함되는 기준 데이터 단위가 가질 수 있는 최소 크기를 미리 결정할 수 있다. 이에 따라, 비디오 복호화 장치(100)는 최소 크기 이상의 크기를 갖는 다양한 크기의 기준 데이터 단위를 결정할 수 있고, 결정된 기준 데이터 단위를 기준으로 블록 형태 정보 및 분할 형태 정보를 이용하여 적어도 하나의 부호화 단위를 결정할 수 있다.
도 22를 참조하면, 비디오 복호화 장치(100)는 정사각형 형태의 기준 부호화 단위(2200)를 이용할 수 있고, 또는 비-정사각형 형태의 기준 부호화 단위(2202)를 이용할 수도 있다. 일 실시예에 따라 기준 부호화 단위의 형태 및 크기는 적어도 하나의 기준 부호화 단위를 포함할 수 있는 다양한 데이터 단위(예를 들면, 시퀀스(sequence), 픽쳐(picture), 슬라이스(slice), 슬라이스 세그먼트(slice segment), 최대부호화단위 등)에 따라 결정될 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)의 획득부(105)는 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보 중 적어도 하나를 상기 다양한 데이터 단위마다 비트스트림으로부터 획득할 수 있다. 정사각형 형태의 기준 부호화 단위(2200)에 포함되는 적어도 하나의 부호화 단위가 결정되는 과정은 도 10의 현재 부호화 단위(300)가 분할되는 과정을 통해 상술하였고, 비-정사각형 형태의 기준 부호화 단위(2200)에 포함되는 적어도 하나의 부호화 단위가 결정되는 과정은 도 11의 현재 부호화 단위(1100 또는 1150)가 분할되는 과정을 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 비디오 복호화 장치(100)는 소정의 조건에 기초하여 미리 결정되는 일부 데이터 단위에 따라 기준 부호화 단위의 크기 및 형태를 결정하기 위하여, 기준 부호화 단위의 크기 및 형태를 식별하기 위한 인덱스를 이용할 수 있다. 즉, 획득부(105)는 비트스트림으로부터 상기 다양한 데이터 단위(예를 들면, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트, 최대부호화단위 등) 중 소정의 조건(예를 들면 슬라이스 이하의 크기를 갖는 데이터 단위)을 만족하는 데이터 단위로서 슬라이스, 슬라이스 세그먼트, 최대부호화 단위 등 마다, 기준 부호화 단위의 크기 및 형태의 식별을 위한 인덱스만을 획득할 수 있다. 비디오 복호화 장치(100)는 인덱스를 이용함으로써 상기 소정의 조건을 만족하는 데이터 단위마다 기준 데이터 단위의 크기 및 형태를 결정할 수 있다. 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보를 상대적으로 작은 크기의 데이터 단위마다 비트스트림으로부터 획득하여 이용하는 경우, 비트스트림의 이용 효율이 좋지 않을 수 있으므로, 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보를 직접 획득하는 대신 상기 인덱스만을 획득하여 이용할 수 있다. 이 경우 기준 부호화 단위의 크기 및 형태를 나타내는 인덱스에 대응하는 기준 부호화 단위의 크기 및 형태 중 적어도 하나는 미리 결정되어 있을 수 있다. 즉, 비디오 복호화 장치(100)는 미리 결정된 기준 부호화 단위의 크기 및 형태 중 적어도 하나를 인덱스에 따라 선택함으로써, 인덱스 획득의 기준이 되는 데이터 단위에 포함되는 기준 부호화 단위의 크기 및 형태 중 적어도 하나를 결정할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 하나의 최대 부호화 단위에 포함하는 적어도 하나의 기준 부호화 단위를 이용할 수 있다. 즉, 영상을 분할하는 최대 부호화 단위에는 적어도 하나의 기준 부호화 단위가 포함될 수 있고, 각각의 기준 부호화 단위의 재귀적인 분할 과정을 통해 부호화 단위가 결정될 수 있다. 일 실시예에 따라 최대 부호화 단위의 너비 및 높이 중 적어도 하나는 기준 부호화 단위의 너비 및 높이 중 적어도 하나의 정수배에 해당할 수 있다. 일 실시예에 따라 기준 부호화 단위의 크기는 최대부호화단위를 쿼드 트리 구조에 따라 n번 분할한 크기일 수 있다. 즉, 비디오 복호화 장치(100)는 최대부호화단위를 쿼드 트리 구조에 따라 n 번 분할하여 기준 부호화 단위를 결정할 수 있고, 다양한 실시예들에 따라 기준 부호화 단위를 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 분할할 수 있다.
도 23은 일 실시예에 따라 픽쳐(2300)에 포함되는 기준 부호화 단위의 결정 순서를 결정하는 기준이 되는 프로세싱 블록을 도시한다.
일 실시예에 따라 비디오 복호화 장치(100)는 픽쳐를 분할하는 적어도 하나의 프로세싱 블록을 결정할 수 있다. 프로세싱 블록이란, 영상을 분할하는 적어도 하나의 기준 부호화 단위를 포함하는 데이터 단위로서, 프로세싱 블록에 포함되는 적어도 하나의 기준 부호화 단위는 특정 순서대로 결정될 수 있다. 즉, 각각의 프로세싱 블록에서 결정되는 적어도 하나의 기준 부호화 단위의 결정 순서는 기준 부호화 단위가 결정될 수 있는 다양한 순서의 종류 중 하나에 해당할 수 있으며, 각각의 프로세싱 블록에서 결정되는 기준 부호화 단위 결정 순서는 프로세싱 블록마다 상이할 수 있다. 프로세싱 블록마다 결정되는 기준 부호화 단위의 결정 순서는 래스터 스캔(raster scan), Z 스캔(Z-scan), N 스캔(N-scan), 우상향 대각 스캔(up-right diagonal scan), 수평적 스캔(horizontal scan), 수직적 스캔(vertical scan) 등 다양한 순서 중 하나일 수 있으나, 결정될 수 있는 순서는 상기 스캔 순서들에 한정하여 해석되어서는 안 된다.
일 실시예에 따라 비디오 복호화 장치(100)는 프로세싱 블록의 크기에 대한 정보를 획득하여 영상에 포함되는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있다. 비디오 복호화 장치(100)는 프로세싱 블록의 크기에 대한 정보를 비트스트림으로부터 획득하여 영상에 포함되는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있다. 이러한 프로세싱 블록의 크기는 프로세싱 블록의 크기에 대한 정보가 나타내는 데이터 단위의 소정의 크기일 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)의 획득부(105)는 비트스트림으로부터 프로세싱 블록의 크기에 대한 정보를 특정의 데이터 단위마다 획득할 수 있다. 예를 들면 프로세싱 블록의 크기에 대한 정보는 영상, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트 등의 데이터 단위로 비트스트림으로부터 획득될 수 있다. 즉 획득부(105)는 상기 여러 데이터 단위마다 비트스트림으로부터 프로세싱 블록의 크기에 대한 정보를 획득할 수 있고 비디오 복호화 장치(100)는 획득된 프로세싱 블록의 크기에 대한 정보를 이용하여 픽쳐를 분할하는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있으며, 이러한 프로세싱 블록의 크기는 기준 부호화 단위의 정수배의 크기일 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 픽쳐(2300)에 포함되는 프로세싱 블록(2302, 2312)의 크기를 결정할 수 있다. 예를 들면, 비디오 복호화 장치(100)는 비트스트림으로부터 획득된 프로세싱 블록의 크기에 대한 정보에 기초하여 프로세싱 블록의 크기를 결정할 수 있다. 도 23을 참조하면, 비디오 복호화 장치(100)는 일 실시예에 따라 프로세싱 블록(2302, 2312)의 가로크기를 기준 부호화 단위 가로크기의 4배, 세로크기를 기준 부호화 단위의 세로크기의 4배로 결정할 수 있다. 비디오 복호화 장치(100)는 적어도 하나의 프로세싱 블록 내에서 적어도 하나의 기준 부호화 단위가 결정되는 순서를 결정할 수 있다.
일 실시예에 따라, 비디오 복호화 장치(100)는 프로세싱 블록의 크기에 기초하여 픽쳐(2300)에 포함되는 각각의 프로세싱 블록(2302, 2312)을 결정할 수 있고, 프로세싱 블록(2302, 2312)에 포함되는 적어도 하나의 기준 부호화 단위의 결정 순서를 결정할 수 있다. 일 실시예에 따라 기준 부호화 단위의 결정은 기준 부호화 단위의 크기의 결정을 포함할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 비트스트림으로부터 적어도 하나의 프로세싱 블록에 포함되는 적어도 하나의 기준 부호화 단위의 결정 순서에 대한 정보를 획득할 수 있고, 획득한 결정 순서에 대한 정보에 기초하여 적어도 하나의 기준 부호화 단위가 결정되는 순서를 결정할 수 있다. 결정 순서에 대한 정보는 프로세싱 블록 내에서 기준 부호화 단위들이 결정되는 순서 또는 방향으로 정의될 수 있다. 즉, 기준 부호화 단위들이 결정되는 순서는 각각의 프로세싱 블록마다 독립적으로 결정될 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 특정 데이터 단위마다 기준 부호화 단위의 결정 순서에 대한 정보를 비트스트림으로부터 획득할 수 있다. 예를 들면, 획득부(105)는 기준 부호화 단위의 결정 순서에 대한 정보를 영상, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트, 프로세싱 블록 등의 데이터 단위로마다 비트스트림으로부터 획득할 수 있다. 기준 부호화 단위의 결정 순서에 대한 정보는 프로세싱 블록 내에서의 기준 부호화 단위 결정 순서를 나타내므로, 결정 순서에 대한 정보는 정수개의 프로세싱 블록을 포함하는 특정 데이터 단위 마다 획득될 수 있다.
비디오 복호화 장치(100)는 일 실시예에 따라 결정된 순서에 기초하여 적어도 하나의 기준 부호화 단위를 결정할 수 있다.
일 실시예에 따라 획득부(105)는 비트스트림으로부터 프로세싱 블록(2302, 2312)과 관련된 정보로서, 기준 부호화 단위 결정 순서에 대한 정보를 획득할 수 있고, 비디오 복호화 장치(100)는 상기 프로세싱 블록(2302, 2312)에 포함된 적어도 하나의 기준 부호화 단위를 결정하는 순서를 결정하고 부호화 단위의 결정 순서에 따라 픽쳐(2300)에 포함되는 적어도 하나의 기준 부호화 단위를 결정할 수 있다. 도 23을 참조하면, 비디오 복호화 장치(100)는 각각의 프로세싱 블록(2302, 2312)과 관련된 적어도 하나의 기준 부호화 단위의 결정 순서(2304, 2314)를 결정할 수 있다. 예를 들면, 기준 부호화 단위의 결정 순서에 대한 정보가 프로세싱 블록마다 획득되는 경우, 각각의 프로세싱 블록(2302, 2312)과 관련된 기준 부호화 단위 결정 순서는 프로세싱 블록마다 상이할 수 있다. 프로세싱 블록(2302)과 관련된 기준 부호화 단위 결정 순서(2304)가 래스터 스캔(raster scan)순서인 경우, 프로세싱 블록(2302)에 포함되는 기준 부호화 단위는 래스터 스캔 순서에 따라 결정될 수 있다. 이에 반해 다른 프로세싱 블록(2312)과 관련된 기준 부호화 단위 결정 순서(2314)가 래스터 스캔 순서의 역순인 경우, 프로세싱 블록(2312)에 포함되는 기준 부호화 단위는 래스터 스캔 순서의 역순에 따라 결정될 수 있다.
비디오 복호화 장치(100)는 일 실시예에 따라, 결정된 적어도 하나의 기준 부호화 단위를 복호화할 수 있다. 비디오 복호화 장치(100)는 상술한 실시예를 통해 결정된 기준 부호화 단위에 기초하여 영상을 복호화 할 수 있다. 기준 부호화 단위를 복호화 하는 방법은 영상을 복호화 하는 다양한 방법들을 포함할 수 있다.
일 실시예에 따라 비디오 복호화 장치(100)는 현재 부호화 단위의 형태를 나타내는 블록 형태 정보 또는 현재 부호화 단위를 분할하는 방법을 나타내는 분할 형태 정보를 비트스트림으로부터 획득하여 이용할 수 있다. 블록 형태 정보 또는 분할 형태 정보는 다양한 데이터 단위와 관련된 비트스트림에 포함될 수 있다. 예를 들면, 비디오 복호화 장치(100)는 시퀀스 파라미터 세트(sequence parameter set), 픽쳐 파라미터 세트(picture parameter set), 비디오 파라미터 세트(video parameter set), 슬라이스 헤더(slice header), 슬라이스 세그먼트 헤더(slice segment header)에 포함된 블록 형태 정보 또는 분할 형태 정보를 이용할 수 있다. 나아가, 비디오 복호화 장치(100)는 최대 부호화 단위, 기준 부호화 단위, 프로세싱 블록마다 비트스트림으로부터 블록 형태 정보 또는 분할 형태 정보에 대응하는 신택스를 비트스트림으로부터 획득하여 이용할 수 있다.
이제까지 다양한 실시예들을 중심으로 살펴보았다. 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자는 본 개시가 본 개시의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 개시의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 개시에 포함된 것으로 해석되어야 할 것이다.
한편, 상술한 본 개시의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.

Claims (15)

  1. 비디오 복호화 방법에 있어서,
    현재 블록에 대한 인트라 예측에 이용될 상기 현재 블록의 주변 픽셀들을 결정하는 단계;
    상기 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득하는 단계;
    상기 획득된 정보에 따라 상기 복수의 필터링 방법들 중 하나를 선택하는 단계;
    상기 선택된 필터링 방법을 이용하여 상기 주변 픽셀들을 필터링하는 단계; 및
    상기 필터링된 주변 픽셀들을 이용하여 상기 현재 블록에 대한 상기 인트라 예측을 수행하는 단계를 포함하고,
    상기 복수의 필터링 방법들은, 상기 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 상기 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  2. 제1항에 있어서,
    상기 공간 영역 필터링 방법은,
    상기 주변 픽셀들을 소정 픽셀 단위로 파티셔닝하는 단계;
    상기 소정 픽셀 단위 각각에 대해 픽셀 값들의 평균값을 구하는 단계; 및
    상기 소정 픽셀 단위 각각에 포함된 픽셀들의 픽셀 값을 상기 평균값으로 대체하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  3. 제2항에 있어서,
    상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계는,
    상기 주변 픽셀들의 이미지 특성에 기초하여 상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  4. 제2항에 있어서,
    상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계는,
    상기 주변 픽셀들의 픽셀 값에 대하여 히스토그램을 생성하는 단계;
    적어도 하나의 임계치에 기초하여 상기 히스토그램에서 픽셀 값의 구간들을 설정하는 단계; 및
    상기 픽셀 값이 상기 히스토그램의 동일 구간에 속하며, 서로 인접하는 픽셀들을 하나의 픽셀 단위로 결정하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  5. 제2항에 있어서,
    상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계는,
    상기 주변 픽셀들에 대해 그래디언트(gradient) 연산을 수행하여 상기 주변 픽셀들의 그래디언트 값을 생성하는 단계; 및
    그래디언트 값의 크기가 임계치 이상인 픽셀들 중 하나 이상을 이용하여 소정 픽셀 단위들 사이의 경계를 결정하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  6. 제2항에 있어서,
    상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계는,
    상기 주변 픽셀들에 포함된 에지 정보를 추출하는 단계; 및
    상기 추출된 에지 정보에 기초하여 상기 주변 픽셀들을 상기 소정 픽셀 단위로 파티셔닝하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  7. 제2항에 있어서,
    상기 공간 영역 필터링 방법은,
    상기 소정 픽셀 단위들 사이의 경계를 필터링하는 단계를 더 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  8. 제1항에 있어서,
    상기 주파수 영역 필터링 방법은,
    상기 주변 픽셀들을 상기 주파수 영역으로 변환하는 단계;
    상기 변환된 주변 픽셀들을 필터링하는 단계; 및
    상기 필터링된 주변 픽셀들을 상기 공간 영역으로 역변환하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  9. 제8항에 있어서,
    상기 변환된 주변 픽셀들을 필터링하는 단계는,
    저역 통과 필터를 사용하여 상기 변환된 주변 픽셀들을 필터링하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 방법.
  10. 제1항에 있어서,
    상기 공간 영역 필터링 방법과 상기 주파수 영역 필터링 방법은, 상기 주변 픽셀들을 포함하는 블록을 필터링하고,
    상기 필터링된 블록에서 상기 주변 픽셀들에 해당하는 영역이 상기 현재 블록에 대한 상기 인트라 예측에 이용되는 것을 특징으로 하는 비디오 복호화 방법.
  11. 비디오 복호화 장치에 있어서,
    현재 블록에 대한 인트라 예측에 이용될 상기 현재 블록의 주변 픽셀들을 결정하는 주변 픽셀 결정부;
    상기 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 나타내는 정보를 비트스트림으로부터 획득하는 정보 획득부; 및
    상기 획득된 정보에 따라 상기 복수의 필터링 방법들 중 하나를 선택하고, 상기 선택된 필터링 방법을 이용하여 상기 주변 픽셀들을 필터링하고, 상기 필터링된 주변 픽셀들을 이용하여 상기 현재 블록에 대한 상기 인트라 예측을 수행하는 복호화부를 포함하고,
    상기 복수의 필터링 방법들은, 상기 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 상기 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 복호화 장치.
  12. 제11항에 있어서,
    상기 공간 영역 필터링 방법은,
    상기 주변 픽셀들을 소정 픽셀 단위로 파티셔닝하는 단계;
    상기 소정 픽셀 단위 각각에 대해 픽셀 값들의 평균값을 구하는 단계; 및
    상기 소정 픽셀 단위 각각에 포함된 픽셀들의 픽셀 값을 상기 평균값으로 대체하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 장치.
  13. 제11항에 있어서,
    상기 주파수 영역 필터링 방법은,
    상기 주변 픽셀들을 상기 주파수 영역으로 변환하는 단계;
    상기 변환된 주변 픽셀들을 필터링하는 단계; 및
    상기 필터링된 주변 픽셀들을 상기 공간 영역으로 역변환하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 장치.
  14. 비디오 부호화 방법에 있어서,
    현재 블록에 대한 인트라 예측에 이용될 상기 현재 블록의 주변 픽셀들을 결정하는 단계;
    상기 주변 픽셀들에 이용되는 복수의 필터링 방법들 중 하나를 선택하는 단계;
    상기 선택된 필터링 방법을 이용하여 상기 주변 픽셀들을 필터링하는 단계; 및
    상기 필터링된 주변 픽셀들을 이용하여 상기 현재 블록에 대한 상기 인트라 예측을 수행하는 단계를 포함하고,
    상기 복수의 필터링 방법들은, 상기 주변 픽셀들을 공간 영역에서 필터링하는 공간 영역 필터링 방법과 상기 주변 픽셀들을 주파수 영역에서 필터링하는 주파수 영역 필터링 방법을 포함하는 것을 특징으로 하는 비디오 부호화 방법.
  15. 제14항에 있어서,
    상기 선택하는 단계는,
    상기 복수의 필터링 방법들 각각을 이용하여 상기 주변 픽셀들을 필터링하는 단계;
    상기 필터링된 주변 픽셀들을 이용하여 상기 현재 블록에 대한 상기 인트라 예측을 수행하는 단계; 및
    상기 인트라 예측 결과에 따른 코스트에 기초하여 상기 복수의 필터링 방법들 중 하나를 선택하는 단계를 포함하는 것을 특징으로 하는 비디오 부호화 방법.
KR1020187013816A 2015-11-24 2016-11-24 비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치 KR20180075558A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562259170P 2015-11-24 2015-11-24
US62/259,170 2015-11-24
PCT/KR2016/013649 WO2017091016A1 (ko) 2015-11-24 2016-11-24 비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20180075558A true KR20180075558A (ko) 2018-07-04

Family

ID=58764394

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187013816A KR20180075558A (ko) 2015-11-24 2016-11-24 비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치

Country Status (4)

Country Link
US (1) US10432947B2 (ko)
KR (1) KR20180075558A (ko)
CN (1) CN108293118A (ko)
WO (1) WO2017091016A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102257829B1 (ko) * 2017-04-13 2021-05-28 엘지전자 주식회사 영상의 부호화/복호화 방법 및 이를 위한 장치
EP3709644A1 (en) * 2019-03-12 2020-09-16 Ateme Method for image processing and apparatus for implementing the same
WO2020190113A1 (ko) * 2019-03-21 2020-09-24 삼성전자주식회사 블록 형태별로 블록 크기가 설정되는 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN113661708B (zh) 2019-04-02 2023-12-15 北京字节跳动网络技术有限公司 基于双向光流的视频编解码和解码
KR102662024B1 (ko) 2019-04-19 2024-05-21 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 상이한 모션 벡터 정제의 그레디언트 계산
CN113711609B (zh) 2019-04-19 2023-12-01 北京字节跳动网络技术有限公司 利用光流的预测细化过程中的增量运动矢量

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101510108B1 (ko) * 2009-08-17 2015-04-10 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9930366B2 (en) 2011-01-28 2018-03-27 Qualcomm Incorporated Pixel level adaptive intra-smoothing
HRP20230996T1 (hr) 2011-04-25 2023-12-08 Lg Electronics Inc. Uređaj za dekodiranje videozapisa i uređaj za kodiranje videozapisa
TWI552583B (zh) 2011-06-28 2016-10-01 三星電子股份有限公司 用於畫面內預測編碼的方法及裝置以及用於畫面內預測解碼的方法及裝置
SG11201400753WA (en) 2011-07-01 2014-05-29 Samsung Electronics Co Ltd Video encoding method with intra prediction using checking process for unified reference possibility, video decoding method and device thereof
US20150229967A1 (en) 2012-08-21 2015-08-13 Samsung Electronics Co., Ltd. Inter-layer video coding method and device for predictive information based on tree structure coding unit, and inter-layer video decoding method and device for predictive informationbased on tree structure coding unit
JP5856583B2 (ja) * 2013-05-16 2016-02-10 日本電信電話株式会社 イントラ予測方向絞込み方法、イントラ予測方向絞込み装置及びイントラ予測方向絞込みプログラム

Also Published As

Publication number Publication date
CN108293118A (zh) 2018-07-17
US20180310001A1 (en) 2018-10-25
US10432947B2 (en) 2019-10-01
WO2017091016A1 (ko) 2017-06-01

Similar Documents

Publication Publication Date Title
KR20180075558A (ko) 비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치
KR20180075660A (ko) 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
KR102389869B1 (ko) 다중 코어 변환에 의한 비디오 복호화 방법 및 장치, 다중 코어 변환에 의한 비디오 부호화 방법 및 장치
KR102365964B1 (ko) 비디오 신호 처리 방법 및 장치
JP7247282B2 (ja) ピクチャ外郭線の符号化単位を符号化または復号する方法及びその装置
KR20180107097A (ko) 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
KR20180101711A (ko) 크로마 다중 변환에 의한 비디오 복호화 방법 및 장치,크로마 다중 변환에 의한 비디오 부호화 방법 및 장치
KR20180093950A (ko) 영상 부호화 방법 및 장치와 영상 복호화 방법 및 장치
KR20190020161A (ko) 루마 블록 및 크로마 블록을 부호화 또는 복호화하는 방법 및 장치
KR20180085714A (ko) 머지 후보 리스트를 이용한 비디오 복호화 방법 및 비디오 복호화 장치
KR20180086203A (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR102315926B1 (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR20180107153A (ko) 영상 부호화 방법 및 장치와 영상 복호화 방법 및 장치
KR20180107082A (ko) 비디오 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR20180075483A (ko) 픽셀의 기울기에 기초하여 인트라 또는 인터 예측 블록을 후처리하는 방법 및 장치
KR20180067598A (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR20180075554A (ko) 비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치
KR102264680B1 (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR20190019925A (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR102653848B1 (ko) 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
KR20200096537A (ko) 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
KR102631308B1 (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR20180075484A (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR20240006458A (ko) 영상 부호화/복호화 방법 및 비트스트림을 저장하는기록 매체
KR20230134995A (ko) 영상 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination