KR20240072180A

KR20240072180A - Isp 모드를 사용한 템플릿 기반 인트라 모드 도출(timd)의 확장

Info

Publication number: KR20240072180A
Application number: KR1020247011802A
Authority: KR
Inventors: 카람 나세르; 프랭크 갈핀; 탕이 포이리에; 필립 보르데스
Original assignee: 인터디지털 씨이 페이튼트 홀딩스, 에스에이에스
Priority date: 2021-09-22
Filing date: 2022-09-12
Publication date: 2024-05-23
Also published as: CN118140481A; WO2023046518A1

Abstract

인트라 서브분할 (ISP) 모드의 템플릿 기반 도출은 인트라 예측 코딩된 비디오 블록의 코딩 효율을 향상시키는 데 사용된다. 템플릿은 주변의 재구성된 상부 및 좌측 샘플로부터 형성된다. 일 실시형태에서, ISP는 템플릿 기반 인트라 모드 도출(TIMD)로부터 독립적으로 수행된다. 인트라 서브블록 분할 모드의 도출은 상부 템플릿 또는 좌측 템플릿에 대한 현재 예측 모드를 사용하여 템플릿 픽셀로부터 결정된다. 다른 실시형태에서, ISP 및 TIMD는 조합된다. 추가 실시형태에서, 템플릿 기반 인트라 모드 도출 및 인트라 서브블록 분할 사용을 전달하기 위해 플래그가 시그널링된다.

Description

ISP 모드를 사용한 템플릿 기반 인트라 모드 도출(TIMD)의 확장

본 실시예들 중 적어도 하나는 일반적으로, 비디오 인코딩 또는 디코딩, 압축 또는 압축해제를 위한 방법 또는 장치에 관한 것이다.

높은 압축 효율을 달성하기 위해, 이미지 및 비디오 코딩 스킴들은 통상적으로, 모션 벡터 예측을 포함한 예측과, 비디오 콘텐츠에서 공간적 및 시간적 중복성을 활용하기 위한 변환을 채용한다. 일반적으로, 인트라 또는 인터 예측을 사용하여 인트라 또는 인터 프레임 상관관계를 활용하고, 이어서, 종종 예측 오류들 또는 예측 잔차들로 표시되는, 원래의 이미지와 예측 이미지 사이의 차이들이 변환되고, 양자화되고, 엔트로피 코딩된다. 비디오를 재구성하기 위해, 압축 데이터는 엔트로피 코딩, 양자화, 변환, 및 예측에 대응하는 역 프로세스들에 의해 디코딩된다.

본 실시형태 중 적어도 하나는 일반적으로 비디오 인코딩 또는 디코딩을 위한 방법 또는 장치에 관한 것으로, 특히, 주변의 재구성된 상부 픽셀 및 좌측 픽셀로부터 코딩 블록의 인트라 서브분할 (ISP) 모드를 추론함으로써 인트라 예측의 코딩 효율을 향상시키는 방법 또는 장치에 관한 것이다.

제1 양태에 따르면, 방법이 제공된다. 상기 방법은, 현재 비디오 블록을 둘러싼 이웃 샘플의 적어도 하나의 템플릿을 분할하는 단계; 상기 적어도 하나의 템플릿으로부터 가능한 인트라 예측 모드를 결정하는 단계; 상기 현재 비디오 블록을 인코딩하기 위해 사용할 인트라 서브블록 분할 방향 및 인트라 예측 모드를 결정하는 단계; 및 상기 결정된 인트라 서브블록 분할 방향 및 인트라 예측 모드를 사용하여 상기 현재 비디오 블록을 인코딩하는 단계를 포함한다.

제2 양태에 따르면, 다른 방법이 제공된다. 상기 방법은, 현재 비디오 블록을 둘러싼 이웃 샘플의 적어도 하나의 템플릿을 분할하는 단계; 상기 적어도 하나의 템플릿으로부터 가능한 인트라 예측 모드를 결정하는 단계; 현재 비디오 블록을 인코딩하기 위해 사용할 인트라 서브블록 분할 방향 및 인트라 예측 모드를 결정하는 단계, 및 상기 결정된 인트라 서브블록 분할 방향 및 인트라 예측 모드를 사용하여 상기 현재 비디오 블록을 디코딩하는 단계를 포함하다.

다른 양태에 따르면, 장치가 제공된다. 본 장치는 프로세서를 포함한다. 프로세서는 전술된 방법들 중 임의의 것을 실행함으로써 비디오의 블록을 인코딩하거나 비트스트림을 디코딩하도록 구성될 수 있다.

적어도 하나의 실시예의 다른 일반적인 양태에 따르면, 디코딩 실시예들 중 임의의 것에 따른 장치; 및 (i) 신호를 수신하도록 구성된 안테나 - 신호는 비디오 블록을 포함함 -, (ii) 비디오 블록을 포함하는 수신된 신호를 주파수들의 대역으로 제한하도록 구성된 대역 제한기, 또는 (iii) 비디오 블록을 나타내는 출력을 디스플레이하도록 구성된 디스플레이 중 적어도 하나를 포함하는 디바이스가 제공된다.

적어도 하나의 실시예의 다른 일반적인 양태에 따르면, 기술된 인코딩 실시예들 또는 변형들 중 임의의 것에 따라 생성된 데이터 콘텐츠를 포함하는 비일시적 컴퓨터 판독 가능 매체가 제공된다.

적어도 하나의 실시예의 다른 일반적인 양태에 따르면, 기술된 인코딩 실시예들 또는 변형들 중 임의의 것에 따라 생성된 비디오 데이터를 포함하는 신호가 제공된다.

적어도 하나의 실시예의 다른 일반적인 양태에 따르면, 기술된 인코딩 실시예들 또는 변형들 중 임의의 것에 따라 생성된 데이터 콘텐츠를 포함하도록 비트스트림이 포맷화된다.

적어도 하나의 실시예의 다른 일반적인 양태에 따르면, 프로그램이 컴퓨터에 의해 실행될 때, 컴퓨터로 하여금, 기술된 디코딩 실시예들 또는 변형들 중 임의의 것을 수행하게 하는 명령어들을 포함하는 컴퓨터 프로그램 제품이 제공된다.

일반적인 양태들의 이들 및 다른 양태들, 특징들 및 이점들은 첨부된 도면들과 관련하여 읽힐 예시적인 실시예들의 다음의 상세한 설명으로부터 명백해질 것이다.

도 1은 a) 4 x 8 및 8 x 4 Cu에 대한 서브 분할 및 b) 4 x 8, 8 x 4, 및 4 x 4 이외의 CU에 대한 서브분할의 예를 나타내는 도이다.
도 2는 표준적이고 일반적인 비디오 압축 방식을 나타내는 도이다.
도 3은 표준적이고 일반적인 비디오 압축 해제 방식을 나타내는 도이다.
도 4는 템플릿 기반 ISP 모드 도출을 나타내는 도이다.
도 5는 일반적으로 설명된 양태에 따른 방법의 일 실시형태를 나타내는 도이다.
도 6은 일반적으로 설명된 양태에 따른 방법의 다른 실시형태를 나타내는 도이다.
도 7은 설명된 양태에 따른 예시적인 장치를 나타내는 도이다.
도 8은 일반적으로 설명된 양태에 따른 인코딩/디코딩을 위한 프로세서 기반 시스템을 나타내는 도이다.

본 명세서에 설명된 실시형태는 비디오 압축 분야에 속하며, 일반적으로 비디오 압축 및 비디오 인코딩 및 디코딩에 관한 것으로, 특히 템플릿으로 명명된, 주변의 재구성된 상부 픽셀 및 좌측 픽셀로부터 코딩 블록의 인트라 서브분할 (ISP) 모드를 추론함으로써 인트라 예측 부분의 코딩 효율을 향상시키는 것을 목적으로 한다. 이는 최근에 채택된 툴을 템플릿 기반 인트라 모드 도출(TIMD)로 명명된 ECM 소프트웨어로 확장한 것으로, 템플릿 픽셀로부터 인트라 예측 모드가 도출된다.

인트라-픽처 예측은 이미지 및 비디오 압축의 핵심적인 부분이다. 전통적으로, 예측 신호는 L 자 모양으로 재구성된 픽셀(기준 샘플)로부터 생성되며, 이를 상이한 각도를 따라 가정한다. 이러한 메커니즘은 각도 예측으로 알려져 있다. 다기능 비디오 코딩(VVC)은 65개의 인트라 예측 모드를 사용하며, 여기서 63개의 각도와 DC 및 평면 예측이 정의된다(도 1 참조).

VVC에서의 전통적인 인트라 예측은 다수의 툴들로 향상된다:

- 교차 컴포넌트 선형 모델(CCLM): 크로마 예측 블록은 루마 재구성 샘플의 선형 모델에 의해 생성된다.

- 다중 기준선 예측(MRL): 더 많은 기준 샘플이 예측 블록을 생성하는 데 사용된다.

- 인트라 서브분할(ISP): 예측 블록은 동일한 예측 모드를 공유하는 4개의 서브블록으로 분열된다.

- 행렬 가중 인트라 예측(MIP): 예측 블록은 기준 샘플을 일부 오프라인 최적화 예측 행렬에 곱함으로써 생성된다.

- 인트라 블록 복사(IBC): 예측 블록은 이미 재구성된 이미지 부분으로부터 다른 블록을 복사함으로써 생성되며, 여기서 변위 벡터는 비트스트림에 시그널링된다.

잔차 블록은 코어 변환 DCT-II, 또는 다중 변환 선택(MTS)으로 알려진, DST-VII와 DCT-VIII의 다른 조합 모드로 변환된다. 변환된 블록은 추가로 2차 비분리형 변환으로 변환되어 잔차 블록을 더욱 압축할 수 있다. 이러한 프로세스는 저주파 비분리형 변환(LFNST)으로 명명된다.

템플릿 매칭 예측(TMP)은 VVC에 포함되지 않은 또 다른 강력한 인트라 예측 모드이다. 이는 유사한 L 자 모양의 이웃(패치로 명명된)을 검색하여 타겟 블록을 찾는 방식으로 수행된다. 이는 하기 도면에 예시되어 있다. TMP가 사용되는 경우, 현재 템플릿은 재구성된 L-형상의 이웃들에 의해 형성된다. 현재 템플릿과 약간의 차이가 있는 유사한 템플릿이 발견되었다. 이러한 템플릿에 속하는 블록(타겟 블록)은 평균화하거나 템플릿 차이가 가장 작은 블록만 고려하여 예측 신호를 생성하는 데 사용된다.

인트라 서브분할(ISP)은 인트라 예측 부분의 코딩 효율을 향상시키기 위해 VVC에 채택된 코딩 툴이다. 이는 예측 유닛을 동일한 예측 모드를 공유하는 두 개 또는 네 개의 수평 및 수직 부품으로 분열하는 것을 기반으로 한다. 이 분열은 도 1에 도시되어 있다.

ISP는 또한 블록 차원에 따라 미리 정의된 변환 쌍을 사용한다. 이는 변환 선택을 위한 시그널링을 감소시키고, 따라서 ISP 모드의 코딩 이득을 향상시킨다.

최근에, ECM 소프트웨어가 포스트 VVC 표준 개발을 위한 테스트 모델로 채택되고 있다. ECM에서는 높은 비트레이트 감소로 인해 템플릿의 사용이 대두되고 있다. 즉, 하기 툴은 템플릿 기반 코팅을 사용한다.

- 인트라 템플릿 매칭: 예측 블록은 현재 블록의 템플릿을 기준 블록의 템플릿과 매칭시킴으로써 재구성된 영역으로부터 복사된다.

- 인터 템플릿 매칭: 모션 벡터는 현재 블록과 기준 블록의 템플릿을 매칭시키는 것을 기반으로 정교화된다.

- 템플릿 기반 인트라 모드 도출(TIMD): 예측 모드는 템플릿 픽셀로부터 도출된다.

본 발명은 템플릿 픽셀로부터 ISP 모드를 도출하는 방법을 제안한다. 이는 TIMD와 별도로 구현되거나 이와 조합될 수 있다. 주요 이점은 ISP에 대한 시그널링 감소로 인한 코딩 이득이다.

ISP 시그널링은, 사용을 지정하기 위한 플래그와 분열 방향을 지정하기 위한 두 개의 플래그로 구성된다. CU 레벨에서, 다음 두 개의 플래그가 시그널링된다.

즉, ISP의 사용을 알리기 위해 2개의 빈이 요구된다. 제안하는 방법에서는 시그널링 없이 ISP를 사용할 수 있다. 이는 TIMD와 유사한 방식으로 템플릿 픽셀로부터 추론되기 때문이다.

하기의 일반적인 양태에서는, 감소된 시그널링으로 인해 추가적인 코딩 이득을 유도하는 템플릿 픽셀로부터 ISP 모드를 추론하는 방법을 설명한다.

제안된 방법 중 하나는, 템플릿 픽셀이라고 명명된 현재 코딩 블록 주위의 재구성된 픽셀로부터 ISP 모드를 도출하는 것에 기반을 두고 있다. 구체적으로, 상부 템플릿과 하부 템플릿 두 개의 템플릿이 정의된다. TIMD에서, 인트라 예측 모드는 템플릿의 기준 샘플을 사용함으로써 도출되고, 예측 오차를 감소시키는 2개의 최상의 모드를 찾기 위해 상이한 인트라 예측 모드를 테스트한다. 이어서, 두 개의 예측 모드를 병합하여 예측 신호가 생성된다. 동일한 프로세스가 디코더 측에서 반복되기 때문에 시그널링이 필요하지 않다.

ISP에도 유사한 접근 방식이 사용될 수 있다. 이는 도 4에 도시되어 있다. 상부 템플릿은, ISP와 마찬가지로, 블록 크기에 따라 4개 또는 2개의 분할들로 분할되고, 상이한 예측 모드를 테스트하여 수직 ISP 분열에 최상의 예측 모드를 찾는다. 수평 분열에 대한 최상의 예측 모드를 찾기 위해 좌측 템플릿에 대해서도 동일한 작업이 수행된다. 절대 차이의 합과 제곱 차이의 합을 이용하여, 예측 오차를 비교함으로써, 수평 또는 수직 분열을 선택할 수 있다. 디코더 측에서도 동일한 작업이 수행되며, 따라서 분열 방향의 시그널링이 필요하지 않다.

실시형태 1: ISP 모드 전용

이 실시형태에서, ISP 모드는 TIMD로부터 독립적인 템플릿 픽셀로부터 도출된다. 구체적으로, 수평 분열을 사용할지 수직 분열을 사용할지는 템플릿 픽셀을 사용하여 도출된다. 다시 말하면, 제2 ISP 플래그는 제거되고 디코더 측에서 도출된다.

이는 분할 방향을 추론하기 위해 상부 템플릿 및 좌측 템플릿에 대한 현재 예측 모드를 사용하여 도출된다.

실시형태 2: TIMD와의 조합

ISP 도출은 TIMD와 조합될 수 있다. TIMD가 최상의 인트라 예측 모드를 도출하는 데 사용되는 동안, ISP를 템플릿 픽셀에서 테스트하여 ISP를 사용할 수 있는지 여부와 사용할 분열 방향을 결정할 수 있다.

두 가지 방법을 사용할 수 있다. 먼저, ISP 플래그의 시그널링이 필요하지 않으며, 최상의 인트라 모드와 ISP가 모두 도출된다. 이 방법은 시그널링이 필요하지 않기 때문에 코딩 효율이 가장 높다. 그러나, ISP 및 비-ISP 인트라 코딩을 테스트하는 데 필요하기 때문에, 디코더 측에서는 일부 추가적인 복잡성이 요구된다.

제2 방법은 디코더에 플래그를 신호하여 ISP의 사용을 전달하는 것이다. 즉, 이는 ISP 분열의 사용 여부를 알려주기 위해 TIMD 모드에 대해 신호를 보내는 플래그이다. ISP가 사용되는 경우, 디코더는 ISP 분열 방향과 최상의 예측 모드를 결정한다. 그렇지 않으면, 기본 TIMD 모드를 사용한다.

본 명세서에 설명된 일반적인 양태에 따른 방법(500)의 일 실시형태가 도 5에 도시되어 있다. 방법은 시작 블록(501)에서 시작되고, 제어는 현재 비디오 블록을 둘러싼 이웃 샘플의 적어도 하나의 템플릿을 분할하기 위해 블록(510)으로 진행된다. 제어는, 적어도 하나의 템플릿으로부터 가능한 인트라 예측 모드를 결정하기 위해 블록(510)에서 블록(520)으로 진행된다. 제어는, 현재 비디오 블록을 인코딩하는 데 사용할 인트라 서브블록 분할 방향 및 인트라 예측 모드를 결정하기 위해 블록(520)에서 블록(530)으로 진행된다. 제어는, 결정된 인트라 서브블록 분할 방향 및 인트라 예측 모드를 사용하여 현재 비디오 블록을 인코딩하기 위해 블록(530)에서 블록(540)으로 진행된다.

본 명세서에 설명된 일반적인 양태에 따른 방법(600)의 일 실시형태가 도 6에 도시되어 있다. 방법은 시작 블록(601)에서 시작되고, 제어는 현재 비디오 블록을 둘러싼 이웃 샘플의 적어도 하나의 템플릿을 분할하기 위해 블록(610)으로 진행된다. 제어는, 적어도 하나의 템플릿으로부터 가능한 인트라 예측 모드를 결정하기 위해 블록(610)에서 블록(620)으로 진행된다. 제어는, 현재 비디오 블록을 인코딩하는 데 사용할 인트라 서브블록 분할 방향과 인트라 예측 모드를 결정하기 위해 블록(620)에서 블록(630)으로 진행된다. 제어는, 결정된 인트라 서브블록 분할 방향과 인트라 예측 모드를 사용하여 현재 비디오 블록을 디코딩하기 위해 블록(630)에서 블록(640)으로 진행된다.

도 7에는 이웃 샘플 의존적 파라미터 모델에 기초한 코딩 모드의 단순화를 사용하여 비디오 데이터를 인코딩, 디코딩, 압축 또는 압축 해제하기 위한 장치(700)의 일 실시형태가 도시되어 있다. 장치는 프로세서(710)를 포함하고 적어도 하나의 포트를 통해 메모리(720)에 상호 접속될 수 있다. 또한, 프로세서(710) 및 메모리(720)는 모두 외부 접속부와 하나 이상의 추가적인 상호 접속이 있을 수 있다.

또한, 프로세서(710)는 비트스트림에 정보를 삽입하거나 수신하고, 설명된 양태 중 어느 하나를 사용하여 압축, 인코딩 또는 디코딩하도록 구성된다.

여기에 기술된 실시예들은 툴들, 특징부들, 실시예들, 모델들, 접근법들 등을 포함한 다양한 양태들을 포함한다. 이들 양태들 중 많은 것은 특이성을 갖고서 기술되며, 적어도, 개별 특성들을 보여주기 위해, 종종, 제한사항으로 들릴 수 있는 방식으로 기술된다. 그러나, 이는 설명의 명확성을 위한 것이며, 그들 양태들의 응용 또는 범위를 제한하지 않는다. 실제로, 상이한 모든 양태들이 조합되고 상호교환되어 추가의 양태들을 제공할 수 있다. 또한, 양태들이 조합될 수 있고, 마찬가지로 이전의 출원에 기술된 양태들과 상호교환될 수 있다.

본 출원에서 기술되고 고려되는 양태들은 많은 다양한 형태로 구현될 수 있다. 도 2, 도 3 및 도 8은 일부 실시형태를 제공하지만, 다른 실시형태도 고려되고 있으며, 도 2, 도 3 및 도 8에 대한 논의는 실시형태의 외연(breadth)을 제한하지 않는다. 양태들 중 적어도 하나는 대체적으로 비디오 인코딩 및 디코딩에 관한 것이고, 적어도 하나의 다른 양태는 대체적으로 생성되거나 인코딩된 비트스트림을 전송하는 것에 관한 것이다. 이들 및 다른 양태들은 기술된 방법들 중 임의의 방법에 따라 비디오 데이터를 인코딩 또는 디코딩하기 위한 명령어들이 저장된 방법, 장치, 컴퓨터 판독 가능 저장 매체, 및/또는 기술된 방법들 중 임의의 방법에 따라 생성된 비트스트림이 저장된 컴퓨터 판독 가능 저장 매체로서 구현될 수 있다.

본 출원에서, "재구성된"및 "디코딩된"이라는 용어들은 상호교환 가능하게 사용될 수 있으며, "픽셀" 및 "샘플"이라는 용어들은 상호교환 가능하게 사용될 수 있고, "이미지", "픽처" 및 "프레임"이라는 용어들은 상호교환 가능하게 사용될 수 있다. 반드시 그렇지는 않지만, 일반적으로, "재구성된"이라는 용어는 인코더 측에서 사용되는 반면, "디코딩된"은 디코더 측에서 사용된다.

다양한 방법들이 본 명세서에 기술되고, 각각의 방법은 기술된 방법을 달성하기 위한 하나 이상의 단계들 또는 액션들을 포함한다. 방법의 적절한 동작을 위해 단계들 또는 액션들의 특정 순서가 요구되지 않는 한, 특정 단계들 및/또는 액션들의 순서 및/또는 사용은 수정되거나 조합될 수 있다.

도 2 및 도 3에 도시된 바와 같이, 본 출원에 설명되는 다양한 방법 및 다른 양태는 비디오 인코더(100) 및 디코더(200)의 모듈, 예를 들어, 인트라 예측, 엔트로피 코딩 및/또는 디코딩 모듈(160, 360, 145, 330)을 수정하는 데 사용될 수 있다. 또한, 본 양태들은 VVC 또는 HEVC로 제한되지 않으며, 예를 들어, 기존에 존재하든 향후 개발되든, 다른 표준들 및 권고들, 및 임의의 그러한 표준들 및 권고들(VVC 및 HEVC를 포함함)의 확장들에 적용될 수 있다. 달리 나타내지 않거나, 또는 기술적으로 배제되지 않는 한, 본 출원에 기술되는 양태들은 개별적으로 또는 조합하여 사용될 수 있다.

다양한 수치 값들이 본 출원에서 사용된다. 특정 값들은 예시적인 목적들을 위한 것이고, 기술된 양태들은 이러한 특정 값들로 제한되지 않는다.

도 2는 인코더(100)를 나타내는 도이다. 이러한 인코더(100)의 변형들이 고려되지만, 인코더(100)는 모든 예상된 변형들을 기술하지 않고서 명료성의 목적들을 위해 후술된다.

인코딩되기 전에, 비디오 시퀀스는 입력 색상 픽처에 색상 변환을 적용하거나(예를 들어, RGB 4:4:4에서 YcbCr 4:2:0으로 변환), 또는 압축에 대해 보다 탄력적인 신호 분포를 얻기 위해 입력 픽처 컴포넌트의 재맵핑을 수행(예를 들어, 색상 컴포넌트 중 하나의 히스토그램 동일화를 사용)하는 것과 같은, 사전 인코딩 처리(101)를 거칠 수 있다. 메타데이터는 사전-처리와 연관될 수 있고, 비트스트림에 부착될 수 있다.

인코더(100)에서, 픽처는 후술되는 바와 같이 인코더 요소에 의해 인코딩된다. 인코딩될 픽처는 분할(102)되어 CU와 같은 유닛으로 처리된다. 각각의 유닛은, 예를 들어 인트라 또는 인터 모드를 사용하여 인코딩된다. 유닛이 인트라 모드로 인코딩되면, 이는 인트라 예측(160)을 수행한다. 인터 모드에서는, 모션 추정(175)과 보상(170)이 수행된다. 인코더는 유닛을 인코딩하는 데 사용할 인트라 모드 또는 인터 모드 중 어느 하나를 사용할지 결정하고(105), 예를 들어, 예측 모드 플래그를 통해 인트라/인터 결정을 표시한다. 예측 잔차는, 예를 들어, 원래 이미지 블록에서 예측된 블록을 감산하는 방식(110)으로 계산된다.

이어서, 예측 잔차는 변환되고(125) 양자화된다(130). 양자화된 변환 계수뿐만 아니라 모션 벡터 및 다른 신택스 요소는 엔트로피 코딩되어(145) 비트스트림을 출력한다. 인코더는 변환을 스킵할 수 있고, 비변환된 잔차 신호에 직접 양자화를 적용할 수 있다. 인코더는 변환 및 양자화 모두를 스킵할 수 있으며, 즉, 잔차는 변환 또는 양자화 프로세스들의 적용 없이 직접 코딩된다.

인코더는 인코딩된 블록을 디코딩하여 추가 예측들을 위한 기준을 제공한다. 양자화된 변환 계수는 예측 잔차를 디코딩하기 위해 역양자화(140) 및 역변환(150)된다. 디코딩된 예측 잔차와 예측된 블록을 조합하여(155), 이미지 블록이 재구성된다. 인루프(in-loop) 필터(165)는 재구성된 픽처에 적용되어, 예를 들어, 인코딩 아티팩트를 감소시키기 위해 디블록킹/샘플 적응적 오프셋(Sample Adaptive Offset,SAO) 필터링을 수행한다. 필터링된 이미지는 기준 픽처 버퍼(180)에 저장된다.

도 3은 비디오 디코더(200)를 나타내는 블록도이다. 디코더(200)에서, 비트스트림은 후술되는 바와 같이 디코더 요소에 의해 디코딩된다. 도 2에 설명된 바와 같이, 비디오 디코더(200)는 일반적으로, 인코딩 패스와 상반되는 디코딩 패스를 수행한다. 또한, 인코더(100)는 일반적으로, 비디오 데이터를 인코딩하는 일부로서 비디오 디코딩을 수행한다.

특히, 디코더의 입력은 비디오 인코더(100)에 의해 생성될 수 있는 비디오 비트스트림을 포함한다. 비트스트림은 먼저, 변환 계수, 모션 벡터 및 다른 코딩된 정보를 획득하기 위해 엔트로피 디코딩된다(230). 픽처 분할 정보는 픽처가 어떻게 분할되는지를 나타낸다. 따라서, 디코더는 픽처를 디코딩된 픽처 분할 정보에 따라 분할(235)할 수 있다. 변환 계수는 예측 잔차를 디코딩하기 위해 역양자화(240) 및 역변환된다(250). 디코딩된 예측 잔차와 예측된 블록을 조합하여(255) 이미지 블록이 재구성된다. 예측된 블록은 인트라 예측(260) 또는 모션 보상 예측(즉, 인터 예측)(275)으로부터 획득할 수 있다(270). 인루프 필터(265)가 재구성된 이미지에 적용된다. 필터링된 이미지는 기준 픽처 버퍼(280)에 저장된다.

디코딩된 픽처는 추가로, 사후-디코딩 처리(285), 예를 들어, 역 색상 변환(예컨대, YCbCr 4:2:0으로부터 RGB 4:4:4로의 변환), 또는 사전-인코딩 처리(101)에서 수행되는 재맵핑 프로세스의 역을 수행하는 역 재맵핑을 거칠 수 있다. 사후-디코딩 처리는 사전-인코딩 처리에서 도출되고 비트스트림에서 시그널링된 메타데이터를 사용할 수 있다.

도 8은 다양한 양태 및 실시형태에 의해 구현되는 시스템의 예를 나타내는 블록도이다. 시스템(1000)은 후술되는 다양한 컴포넌트들을 포함하는 디바이스로서 구현될 수 있으며, 본 문헌에 기술된 양태들 중 하나 이상을 수행하도록 구성된다. 그러한 디바이스들의 예들은, 다양한 전자 디바이스들, 예컨대 개인용 컴퓨터, 랩톱 컴퓨터, 스마트폰, 태블릿 컴퓨터, 디지털 멀티미디어 셋톱 박스, 디지털 텔레비전 수신기, 개인용 비디오 녹화 시스템, 커넥티드 가전, 및 서버를 포함하지만, 이들로 제한되지 않는다. 시스템(1000)의 요소들은 단일 집적 회로(IC), 다수의 IC들, 및/또는 별개의 컴포넌트들에서, 단독으로 또는 조합되어 구현될 수 있다. 예를 들어, 적어도 하나의 실시형태에서, 시스템(1000)의 처리 및 인코더/디코더 요소는 복수의 IC 및/또는 별개의 컴포넌트에 걸쳐 분산된다. 다양한 실시형태에서, 시스템(1000)은 예를 들어, 통신 버스 또는 전용 입력 및/또는 출력 포트를 통해 하나 이상의 다른 시스템 또는 기타 전자 장치에 통신 가능하게 연결된다. 다양한 실시형태에서, 시스템(1000)은 본 명세서에 설명되는 양태 중 하나 이상을 구현하도록 구성된다.

시스템(1000)은, 예를 들어, 본 문헌에 기술된 다양한 양태들을 구현하기 위해 그 내부에 로딩된 명령어들을 실행하도록 구성된 적어도 하나의 프로세서(1010)를 포함한다. 프로세서(1010)는 내장된 메모리, 입력 출력 인터페이스, 및 당업계에 알려진 바와 같은 다양한 다른 회로부들을 포함할 수 있다. 시스템(1000)은 적어도 하나의 메모리(1020)(예를 들어, 휘발성 메모리 장치 및/또는 비휘발성 메모리 장치)를 포함한다. 시스템(1000)은 전기적으로 소거 가능한 프로그래밍 가능 판독 전용 메모리(EEPROM), 판독 전용 메모리(ROM), 프로그래밍 가능 판독 전용 메모리(PROM), 랜덤 액세스 메모리(RAM), 동적 랜덤 액세스 메모리(DRAM), 정적 랜덤 액세스 메모리(SRAM), 플래시, 자기 디스크 드라이브 및/또는 광학 디스크 드라이브를 포함하지만 이에 제한되지 않는 비휘발성 메모리 및/또는 휘발성 메모리를 포함할 수 있는 저장 디바이스(1040)를 포함한다. 저장 디바이스(1040)는 비제한적인 예들로서, 내부 저장 디바이스, 부착된 저장 디바이스(분리 가능한 저장 디바이스 및 분리 가능하지 않은 저장 디바이스를 포함함), 및/또는 네트워크 액세스 가능한 저장 디바이스를 포함할 수 있다.

시스템(1000)은, 예를 들어, 인코딩된 비디오 또는 디코딩된 비디오를 제공하기 위해 데이터를 처리하도록 구성된 인코더/디코더 모듈(1030)을 포함하고, 인코더/디코더 모듈(1030)은 자체 프로세서 및 메모리를 포함할 수 있다. 인코더/디코더 모듈(1030)은 인코딩 및/또는 디코딩 기능들을 수행하기 위해 디바이스에 포함될 수 있는 모듈(들)을 나타낸다. 알려진 바와 같이, 디바이스는 인코딩 및 디코딩 모듈들 중 하나 또는 둘 모두를 포함할 수 있다. 추가적으로, 인코더/디코더 모듈(1030)은 시스템(1000)의 별개의 요소로서 구현될 수 있거나, 또는 당업자에게 알려진 바와 같은 하드웨어와 소프트웨어의 조합으로서 프로세서(1010) 내에 통합될 수 있다.

본 문헌에서 기술된 다양한 양태들을 수행하기 위해 프로세서(1010) 또는 인코더/디코더(1030)에 로딩될 프로그램 코드는 저장 디바이스(1040)에 저장될 수 있고, 후속적으로 프로세서(1010)에 의한 실행을 위해 메모리(1020)에 로딩될 수 있다. 다양한 실시예들에 따르면, 프로세서(1010), 메모리(1020), 저장 디바이스(1040), 및 인코더/디코더 모듈(1030) 중 하나 이상은 본 문헌에 기술된 프로세스들의 수행 동안 다양한 항목들 중 하나 이상을 저장할 수 있다. 이러한 저장된 항목들은 입력 비디오, 디코딩된 비디오 또는 디코딩된 비디오의 일부들, 비트스트림, 행렬들, 변수들, 및 식들, 공식들, 연산들 및 연산 로직의 처리로부터의 중간 또는 최종 결과들을 포함할 수 있지만, 이들로 제한되지 않는다.

일부 실시형태에서, 프로세서(1010) 및/또는 인코더/디코더 모듈(1030) 내부의 메모리는 명령을 저장하고, 인코딩 또는 디코딩 중에 필요한 처리를 위한 작업 메모리를 제공하는 데 사용된다. 그러나, 다른 실시예들에서, 처리 디바이스(예를 들어, 처리 디바이스는 프로세서(1010) 또는 인코더/디코더 모듈(1030) 중 어느 하나일 수 있음) 외부의 메모리가 이들 기능들 중 하나 이상에 사용된다. 외부 메모리는 메모리(1020) 및/또는 저장 디바이스(1040), 예를 들어, 동적 휘발성 메모리 및/또는 비휘발성 플래시 메모리일 수 있다. 일부 실시예들에서, 외부 비휘발성 플래시 메모리는 예를 들어, 텔레비전의 운영 체제를 저장하는 데 사용된다. 적어도 하나의 실시예에서, RAM과 같은 고속 외부 동적 휘발성 메모리는 MPEG-2(MPEG는 Moving Picture Experts Group을 지칭하고, MPEG-2는 또한 ISO/IEC 13818로도 지칭되고, 13818-1은 또한 H.222로도 알려져 있고, 13818-2는 또한 H.262로도 알려져 있음), HEVC(HEVC는 High Efficiency Video Coding을 지칭하고, H.265 및 MPEG-H Part 2로도 알려져 있음), 또는 VVC(Versatile Video Coding, JVET(Joint Video Experts Team)에서 개발 중인 새로운 표준)와 같은 비디오 코딩 및 디코딩 동작들을 위한 작업 메모리로 사용된다.

시스템(1000)의 요소들에 대한 입력은 블록 1130에 표시된 바와 같은 다양한 입력 디바이스들을 통해 제공될 수 있다. 그러한 입력 디바이스들은 (i) 예를 들어 브로드캐스터(broadcaster)에 의해 무선으로(over the air) 송신된 무선 주파수(RF) 신호를 수신하는 무선 주파수(RF) 부분, (ii) 컴포넌트(COMP) 입력 단자(또는 COMP 입력 단자들의 세트), (iii) 범용 직렬 버스(USB) 입력 단자 및/또는 (iv) 고화질 멀티미디어 인터페이스(HDMI) 입력 단자를 포함하지만, 이들로 제한되지 않는다. 도 8에 도시되지 않은 다른 예로는 복합 비디오(composite video)가 포함된다.

다양한 실시형태에서, 블록(1130)의 입력 장치는 당업계에 알려진 바와 같은 각 입력 처리 요소를 연관시킨다. 예를 들어, RF 부분은, (i) 원하는 주파수를 선택하는 것(신호를 선택하는 것, 또는 신호를 주파수들의 대역으로 대역 제한하는 것으로도 지칭됨), (ii) 선택된 신호를 하향변환(downconvert)하는 것, (iii) (예를 들어) 소정 실시예들에서 채널로 지칭될 수 있는 신호 주파수 대역을 선택하기 위해 주파수들의 더 좁은 대역으로 다시 대역-제한하는 것, (iv) 하향변환되고 대역-제한된 신호를 복조하는 것, (v) 에러 정정을 수행하는 것, 및 (vi) 데이터 패킷들의 원하는 스트림을 선택하기 위해 역다중화하는 것에 적합한 요소들과 연관될 수 있다. 다양한 실시형태의 RF 부분은 이러한 기능을 수행하기 위한 하나 이상의 요소, 예를 들어 주파수 선택기, 신호 선택기, 대역-제한기, 채널 선택기, 필터, 하향변환기, 복조기, 에러 정정기, 및 역다중화기를 포함한다. RF 부분은, 예를 들어, 수신된 신호를 더 낮은 주파수(예를 들어, 중간 주파수 또는 근거리 기저대역 주파수)로 또는 기저대역으로 하향변환하는 것을 포함하여 이러한 다양한 기능들을 수행하는 튜너를 포함할 수 있다. 하나의 셋톱박스 실시예에서, RF 부분 및 그의 연관된 입력 처리 요소는 유선(예를 들어, 케이블) 매체를 통해 전송된 RF 신호를 수신하고, 그리고 필터링하고, 하향변환하고 다시 원하는 주파수 대역으로 필터링함으로써 주파수 선택을 수행한다. 다양한 실시형태는 전술한(및 다른) 요소의 순서를 재배열하고, 이들 요소 중 일부를 제거하고 그리고/또는 유사하거나 상이한 기능을 수행하는 다른 요소를 추가한다. 요소를 추가하는 것은, 예를 들어, 증폭기 및 아날로그-디지털 변환기를 삽입하는 것과 같이, 기존 요소들 사이에 요소를 삽입하는 것을 포함할 수 있다. 다양한 실시형태에서, RF 부분은 안테나를 포함한다.

또한, USB 및/또는 HDMI 단자들은 시스템(1000)을 USB 및/또는 HDMI 접속부들을 통해 다른 전자 디바이스들에 접속하기 위한 각자의 인터페이스 프로세서들을 포함할 수 있다. 입력 처리의 다양한 양태들, 예를 들어, 리드-솔로몬(Reed-Solomon) 에러 정정은 필요에 따라, 예를 들어, 별개의 입력 처리 IC 내에서 또는 프로세서(1010) 내에서 구현될 수 있다는 것이 이해되어야 한다. 마찬가지로, USB 또는 HDMI 인터페이스 처리의 양태들은 필요에 따라, 별개의 인터페이스 IC들 내에서 또는 프로세서(1010) 내에서 구현될 수 있다. 복조되고 오차 정정되고 역다중화된 스트림은 예를 들어, 프로세서(1010), 및 출력 장치에서의 프리젠테이션에 필요함에 따라 데이터스트림을 처리하기 위해 메모리 및 저장 요소와 조합하여 작동하는 인코더/디코더(1030)를 포함하는 다양한 처리 요소에 제공된다.

시스템(1000)의 다양한 요소들이 집적 하우징 내에 제공될 수 있다. 집적 하우징 내에서, 다양한 요소들은 인터-IC(I2C) 버스, 배선, 및 인쇄 회로 기판들을 포함한 적합한 접속 배열물, 예를 들어, 당업계에 알려져 있는 바와 같은 내부 버스를 사용하여, 상호접속될 수 있고 그들 사이에서 데이터를 송신할 수 있다.

시스템(1000)은 통신 채널(1060)을 통해 다른 장치와 통신을 가능하게 하는 통신 인터페이스(1050)를 포함한다. 통신 인터페이스(1050)는 통신 채널(1060)을 통해 데이터를 전송하도록 그리고 수신하도록 구성된 송수신기를 포함할 수 있지만, 이에 제한되지 않는다. 통신 인터페이스(1050)는 모뎀 또는 네트워크 카드를 포함할 수 있지만 이에 제한되지 않으며, 통신 채널(1060)은 예를 들어 유선 및/또는 무선 매체 내에서 구현될 수 있다.

데이터는, Wi-Fi 네트워크, IEEE 802.11(IEEE는 전기 전자 기술자 협회(Institute of Electrical and Electronics Engineers)를 지칭함)과 같은 무선 네트워크를 사용하여, 다양한 실시형태에서 시스템(1000)에 스트리밍되거나 달리 제공된다. 이러한 실시형태의 Wi-Fi 신호는 Wi-Fi 통신에 적합한 통신 채널(1060) 및 통신 인터페이스(1050)를 통해 수신된다. 이들 실시예들의 통신 채널(1060)은 전형적으로, 스트리밍 응용들 및 다른 오버-더-탑 통신을 허용하기 위한 인터넷을 포함하는 외부 네트워크들에 대한 액세스를 제공하는 액세스 포인트 또는 라우터에 접속된다. 다른 실시형태는 입력 블록(1130)의 HDMI 연결을 통해 데이터를 전달하는 셋톱 박스를 사용하여 스트리밍된 데이터를 시스템(1000)에 제공한다. 또 다른 실시형태는, 입력 블록(1130)의 RF 연결을 사용하여 스트리밍된 데이터를 시스템(1000)에 제공한다. 전술한 바와 같이, 다양한 실시형태는 비-스트리밍 방식으로 데이터를 제공한다. 또한, 다양한 실시형태는 Wi-Fi 이외의 무선 네트워크, 예를 들어 셀룰러 네트워크 또는 블루투스 네트워크를 사용한다.

시스템(1000)은 디스플레이(1100), 스피커들(1110), 및 기타 주변 디바이스들(1120)을 포함하는 다양한 출력 디바이스들에 출력 신호를 제공할 수 있다. 다양한 실시형태의 디스플레이(1100)는 예를 들어, 터치스크린 디스플레이, 유기 발광 다이오드(OLED) 디스플레이, 곡면(curved) 디스플레이 및/또는 접는(foldable) 디스플레이 중 하나 이상을 포함한다. 디스플레이(1100)는 텔레비전, 태블릿, 랩톱, 휴대폰(모바일폰), 또는 다른 디바이스를 위한 것일 수 있다. 또한, 디스플레이(1100)는 다른 컴포넌트와 통합될 수 있고(예를 들어, 스마트폰에서와 같이), 또는 분리될 수도 있다(예를 들어, 랩톱용 외부 모니터). 실시형태의 다양한 예에서, 다른 주변 장치(1120)는 독립형 디지털 비디오 디스크(또는 디지털 다기능 디스크)(두 용어 모두 DVR), 디스크 플레이어, 스테레오 시스템 및/또는 조명 시스템 중 하나 이상을 포함한다. 다양한 실시형태는, 시스템(1000)의 출력을 기반으로 하는 기능을 제공하는 하나 이상의 주변 장치(1120)를 사용한다. 예를 들어, 디스크 플레이어는 시스템(1000)의 출력을 재생하는 기능을 수행한다.

다양한 실시예들에서, 제어 신호들은, 시그널링, 예컨대, AV.Link, CEC(Consumer Electronics Control), 또는 사용자 개입이 있거나 또는 개입 없이 디바이스 대 디바이스 제어를 가능하게 하는 다른 통신 프로토콜들을 사용하여 시스템(1000)과 디스플레이(1100), 스피커들(1110), 또는 기타 주변 디바이스들(1120) 사이에서 통신된다. 출력 디바이스들은 각자의 인터페이스들(1070, 1080, 1090)을 통해 전용 접속들을 거쳐 시스템(1000)에 통신 가능하게 결합될 수 있다. 대안적으로, 출력 디바이스들은 통신 인터페이스(1050)를 통해 통신 채널(1060)을 사용하여 시스템(1000)에 접속될 수 있다. 디스플레이(1100) 및 스피커들(1110)은, 예를 들어, 텔레비전과 같은 전자 디바이스에서 시스템(1000)의 다른 컴포넌트들과 단일 유닛으로 통합될 수 있다. 다양한 실시형태에서, 디스플레이 인터페이스(1070)는 타이밍 제어기(T Con) 칩과 같은 디스플레이 드라이버를 포함한다.

디스플레이(1100) 및 스피커(1110)는 대안적으로, 예를 들어, 입력(1130)의 RF 부분이 별개의 셋톱박스의 일부인 경우, 다른 컴포넌트들 중 하나 이상과 별개일 수 있다. 디스플레이(1100) 및 스피커(1110)가 외부 컴포넌트인 다양한 실시형태에서, 출력 신호는 예를 들어, HDMI 포트, USB 포트 또는 COMP 출력을 포함하는 전용 출력 연결을 통해 제공될 수 있다.

실시형태는 프로세서(1010)에 의해 구현되는 컴퓨터 소프트웨어에 의해 또는 하드웨어에 의해, 또는 하드웨어와 소프트웨어의 조합에 의해 수행될 수 있다. 비제한적인 예로서, 실시형태들은 하나 이상의 집적 회로들에 의해 구현될 수 있다. 메모리(1020)는 기술적 환경에 적합한 임의의 형태일 수 있고, 비제한적인 예로서 광학 메모리 장치, 자기 메모리 장치, 반도체 기반 메모리 장치, 고정 메모리 및 이동가능한 메모리와 같은 임의의 적절한 데이터 저장 기술을 사용하여 구현될 수 있다. 프로세서(1010)는 기술적 환경에 적합한 임의의 유형일 수 있고, 비제한적인 예로서, 마이크로프로세서, 범용 컴퓨터, 특수 목적 컴퓨터 및 멀티 코어 아키텍처에 기반 프로세서 중 하나 이상을 포함할 수 있다.

다양한 구현예들은 디코딩을 포함한다. 본 출원에서 사용되는 바와 같이, "디코딩"은, 예를 들어, 디스플레이에 적합한 최종 출력을 생성하기 위해 수신된 인코딩된 시퀀스에 대해 수행되는 프로세스들의 전부 또는 일부를 포괄할 수 있다. 다양한 실시형태들에서, 그러한 프로세스들은 디코더에 의해 전형적으로 수행되는 프로세스들 중 하나 이상의 프로세스들, 예를 들어, 엔트로피 디코딩, 역양자화, 역변환, 및 차동 디코딩을 포함한다. 다양한 실시형태들에서, 그러한 프로세스들은 또한, 또는 대안적으로, 본 출원에 기술된 다양한 구현예들의 디코더에 의해 수행되는 프로세스들을 포함한다.

추가 예들로서, 하나의 실시형태에서, "디코딩"은 엔트로피 디코딩만을 지칭하고, 다른 실시형태에서, "디코딩"은 차동 디코딩만을 지칭하고, 또 다른 실시형태에서, "디코딩"은 엔트로피 디코딩과 차동 디코딩의 조합을 지칭한다. 어구 "디코딩 프로세스"가 작동의 서브세트를 구체적으로 나타내기 위한 것인지, 또는 일반적으로 보다 광의의 디코딩 프로세스를 나타내기 위한 것인지 여부는 특정 설명의 맥락에 기초하여 명확할 것이며, 당업자에 의해 잘 이해될 것으로 여겨진다.

다양한 구현예들은 인코딩을 포함한다. "디코딩"에 관한 상기의 논의와 유사한 방식으로, 본 출원에서 사용되는 바와 같은 "인코딩"은, 예를 들어, 인코딩된 비트스트림을 생성하기 위해 입력 비디오 시퀀스에 대해 수행된 프로세스들의 전부 또는 일부를 포괄할 수 있다. 다양한 실시형태들에서, 이러한 프로세스들은 전형적으로 인코더에 의해 수행되는 프로세스들, 예를 들어, 분할, 차동 인코딩, 변환, 양자화, 및 엔트로피 인코딩 중 하나 이상을 포함한다. 다양한 실시예들에서, 그러한 프로세스들은 또한, 또는 대안적으로, 본 출원에서 기술된 다양한 구현예들의 인코더에 의해 수행되는 프로세스들을 포함한다.

추가 예들에서, 하나의 실시형태에서, "인코딩"은 단지 엔트로피 인코딩을 지칭하며, 다른 실시형태에서 "인코딩"은 단지 차동 인코딩을 지칭하고, 다른 실시형태에서 "인코딩"은 차동 인코딩과 엔트로피 인코딩의 조합을 지칭한다. 어구 "인코딩 프로세스"가 작동의 서브세트를 구체적으로 나타내기 위한 것인지, 또는 일반적으로 보다 광의의 인코딩 프로세스를 나타내기 위한 것인지 여부는 특정 설명의 맥락에 기초하여 명확할 것이며, 당업자에 의해 잘 이해될 것으로 여겨진다.

본 명세서에 사용된 바와 같은 신택스 요소들은 설명적 용어들임에 유의한다. 이와 같이, 이들은 다른 신택스 요소 명칭들의 사용을 배제하지 않는다.

도면이 흐름도로서 제시될 때, 그것은 또한 대응하는 장치의 블록도를 제공한다는 것을 이해해야 한다. 유사하게, 도면이 블록도로서 제시될 때, 그것은 또한 대응하는 방법/프로세스의 흐름도를 제공한다는 것을 이해해야 한다.

다양한 실시예들은 파라미터 모델(parametric model)들 또는 레이트 왜곡 최적화(RDO: rate distortion optimization)를 언급할 수 있다. 특히, 인코딩 프로세스 동안, 계산 복잡성의 제약이 종종 있게 되면, 레이트와 왜곡 사이의 균형 또는 절충이 일반적으로 고려된다. 그것은 레이트 왜곡 최적화(RDO) 메트릭을 통해, 또는 최소 제곱 평균(LMS: Least Mean Square), 절대 오차 평균(MAE: Mean of Absolute Error), 또는 다른 그러한 측정들을 통해 측정될 수 있다. 레이트 왜곡 최적화는 보통, 레이트 및 왜곡의 가중화된 합인 레이트 왜곡 함수를 최소화하는 것으로서 공식화된다. 레이트 왜곡 최적화 문제를 해결하기 위한 상이한 접근법들이 있다. 예를 들어, 접근법들은, 코딩 및 디코딩 후 재구성된 신호의 코딩 비용 및 관련된 왜곡의 완전한 평가를 이용한, 모든 고려된 모드들 또는 코딩 파라미터들 값들을 포함하는 모든 인코딩 옵션들의 광범위한 검사에 기초할 수 있다. 특히 재구성된 것이 아니라 예측 또는 예측 잔차 신호에 기초한 근사화된 왜곡의 계산과 함께 인코딩 복잡성을 덜기 위해, 더 빠른 접근법들이 또한 사용될 수 있다. 이들 2개의 접근법들의 혼합은 또한, 예컨대, 가능한 인코딩 옵션들 중 일부만에 대한 근사화된 왜곡 및 다른 인코딩 옵션들에 대한 완전한 왜곡을 사용함으로써 사용될 수 있다. 다른 접근법들은 가능한 인코딩 옵션들의 서브세트만을 평가한다. 보다 일반적으로, 많은 접근법들은 최적화를 수행하기 위해 다양한 기술들 중 임의의 기술을 채용하지만, 최적화가 반드시 코딩 비용과 관련된 왜곡 둘 모두에 대한 완전한 평가이지는 않다.

본 명세서에 기술된 구현예들 및 양태들은, 예를 들어, 방법 또는 프로세스, 장치, 소프트웨어 프로그램, 데이터 스트림, 또는 신호에서 구현될 수 있다. 구현예의 단일 형태의 맥락에서 논의된다 하더라도(예를 들어, 방법으로서만 논의됨), 논의된 특징들의 구현예는 다른 형태들(예를 들어, 장치 또는 프로그램)에서 구현될 수 있다. 장치는, 예를 들어, 적절한 하드웨어, 소프트웨어, 및 펌웨어로 구현될 수 있다. 방법들은, 예를 들어, 컴퓨터, 마이크로프로세서, 집적 회로, 또는 프로그래밍가능 로직 디바이스를 포함하는, 대체적으로 처리 디바이스들로 지칭되는, 예를 들어, 프로세서에서 구현될 수 있다. 프로세서는 또한, 예를 들어, 컴퓨터, 셀폰, 휴대용/개인 디지털 어시스턴트("PDA"), 및 최종 사용자들 사이의 정보의 통신을 용이하게 하는 기타 디바이스들과 같은 통신 디바이스를 포함한다.

"하나의 실시형태" 또는 "일 실시형태" 또는 "하나의 구현예" 또는 "일 구현예"뿐만 아니라 그의 다른 변형에 대한 언급은, 실시형태와 관련하여 기술된 특정 특징, 구조, 특성 등이 적어도 하나의 실시형태에 포함됨을 의미한다. 따라서, 본 출원 전반에 걸친 다양한 곳에서 나타나는 어구 "하나의 실시형태에서" 또는 "일 실시형태에서" 또는 "하나의 구현예에서" 또는 "일 구현예에서"뿐만 아니라 임의의 다른 변형의 출현이 반드시 모두 동일한 실시형태를 언급하는 것은 아니다.

또한, 본 출원은 여러 가지의 정보를 "결정하는 것"을 언급할 수 있다. 정보를 결정하는 것은, 예를 들어 정보를 추정하는 것, 정보를 계산하는 것, 정보를 예측하는 것, 또는 메모리로부터 정보를 검색하는 것 중 하나 이상을 포함할 수 있다.

또한, 본 출원은 여러 가지의 정보에 "액세스하는 것"을 언급할 수 있다. 정보에 액세스하는 것은, 예를 들어 정보를 수신하는 것, (예를 들어, 메모리로부터) 정보를 검색하는 것, 정보를 저장하는 것, 정보를 이동하는 것, 정보를 복사하는 것, 정보를 계산하는 것, 정보를 결정하는 것, 정보를 예측하는 것, 또는 정보를 추정하는 것 중 하나 이상을 포함할 수 있다.

또한, 본 출원은 여러 가지의 정보를 "수신하는 것"을 지칭할 수 있다. 수신하는 것은 "액세스하는 것"과 마찬가지로 광의의 용어인 것으로 의도된다. 정보를 수신하는 것은, 예를 들어, 정보에 액세스하는 것, 또는 (예를 들어, 메모리로부터) 정보를 검색하는 것 중 하나 이상을 포함할 수 있다. 또한, "수신하는 것"은 전형적으로, 예를 들어 정보를 저장하는 동작, 정보를 처리하는 동작, 정보를 전송하는 동작, 정보를 이동하는 동작, 정보를 복사하는 동작, 정보를 소거하는 동작, 정보를 계산하는 동작, 정보를 결정하는 동작, 정보를 예측하는 동작, 또는 정보를 추정하는 동작 동안 어떤 방식으로든 포함된다.

예를 들어 다음의 "A/B", "A 및/또는 B" 및 "A 및 B 중 적어도 하나"의 경우에서 "/", "및/또는", 및 "적어도 하나" 중 임의의 것의 사용은 제1 열거된 옵션(A) 단독의 선택, 또는 제2 열거된 옵션(B) 단독의 선택, 또는 두 옵션(A 및 B)의 선택을 포함하도록 의도됨을 이해해야 한다. 또 다른 예로서, "A, B 및/또는 C" 및 "A, B 및 C 중 적어도 하나"의 경우에서, 이러한 어구는 제1 열거된 옵션(A) 단독의 선택, 또는 제2 열거된 옵션(B) 단독의 선택, 또는 제3 열거된 옵션(C) 단독의 선택, 또는 제1 및 제2 열거된 옵션(A 및 B) 단독의 선택, 또는 제1 및 제3 열거된 옵션(A 및 C) 단독의 선택, 또는 제2 및 제3 열거된 옵션(B 및 C) 단독의 선택, 또는 3개의 모든 옵션(A, B 및 C)의 선택을 포함하도록 의도된다. 이는, 본 명세서에 기술된 바와 같은 많은 항목에 대해, 본 명세서 및 관련 분야의 당업자에게 명백한 바와 같이 확장될 수 있다.

또한, 본 명세서에 사용된 바와 같이, 용어 "신호"는 특히 대응하는 디코더에게 무언가를 나타내는 것을 지칭한다. 예를 들어, 소정 실시예들에서, 인코더는 복수의 변환들, 코딩 모드들 또는 플래그들 중 특정한 하나를 시그널링한다. 이러한 방식으로, 일 실시예에서, 동일한 변환, 파라미터, 또는 모드는 인코더 측 및 디코더 측 둘 모두에서 사용된다. 따라서, 예를 들어, 인코더는 디코더가 동일한 특정 파라미터를 사용할 수 있도록 디코더에 특정 파라미터를 전송할 수 있다(명시적 시그널링). 반대로, 디코더가 이미 특정 파라미터뿐만 아니라 다른 것들을 갖고 있다면, 단순히 디코더가 특정 파라미터를 알고 선택할 수 있게 하기 위해 전송 없이 시그널링이 사용될 수 있다(암시적 시그널링). 임의의 실제 기능들의 전송을 회피함으로써, 다양한 실시형태들에서 비트 절약이 실현된다. 시그널링은 다양한 방식들로 달성될 수 있다는 것이 이해되어야 한다. 예를 들어, 하나 이상의 신택스 요소들, 플래그들 등이 다양한 실시형태들에서 대응하는 디코더에 정보를 시그널링하는 데 사용된다. 전술된 표현이 단어 "신호"의 동사 형태와 관련되지만, 단어 "신호"는 또한 명사로서 본 명세서에서 사용될 수 있다.

당업자에게 명백할 바와 같이, 구현예는, 예를 들어 저장되거나 전송될 수 있는 정보를 반송하도록 포맷화된 다양한 신호를 생성할 수 있다. 예를 들어, 정보는 방법을 수행하기 위한 명령어들, 또는 기술된 구현예들 중 하나에 의해 생성된 데이터를 포함할 수 있다. 예를 들어, 신호는 기술된 실시형태의 비트스트림을 전달하도록 포맷화될 수 있다. 이러한 신호는, 예를 들어, 전자기파로서(예를 들어, 스펙트럼의 무선 주파수 부분을 사용함) 또는 기저대역 신호로서 포맷화될 수 있다. 포맷화는, 예를 들어, 데이터 스트림을 인코딩하는 것, 및 인코딩된 데이터 스트림으로 캐리어를 변조하는 것을 포함할 수 있다. 신호가 반송하는 정보는, 예를 들어, 아날로그 또는 디지털 정보일 수 있다. 신호는, 알려진 바와 같이, 다양한 상이한 유선 또는 무선 링크를 통해 전송될 수 있다. 신호는 프로세서 판독 가능 매체 상에 저장될 수 있다.

선행 섹션들은 다양한 청구범위 카테고리들 및 유형들에 걸쳐서 다수의 실시예들을 기술한다. 이들 실시예의 특징은 단독으로 또는 임의의 조합으로 제공될 수 있다. 또한, 실시예들은 다양한 청구항 카테고리들 및 유형들에 걸쳐 단독으로 또는 임의의 조합으로 하기의 특징, 디바이스, 또는 양태 중 하나 이상을 포함할 수 있다:

재구성된 샘플의 적어도 하나의 템플릿을 사용하여 인트라 서브블록 분할 방향을 도출한다.

인트라 서브블록 분할이 사용되는지 여부를 나타내거나 결정하기 위해 비디오 비트스트림을 시그널링하거나(Signaling in) 분석(parsing)한다.

인트라 예측 모드가 템플릿 픽셀로부터 도출되는 단계를 또한 포함하며, 템플릿 기반 인트라 모드 도출과 조합하여 인트라 서브블록 분할 방향을 도출하기 위해 재구성된 샘플 중 적어도 하나의 템플릿을 사용한다.

비디오 블록의 상부 또는 좌측에 있는 템플릿을 복수의 서브분할로 분할한다.

상기 방법에서, 서브분할의 수는 비디오 블록의 크기에 따라 결정된다.

하나 이상의 신택스 요소를 포함하는 비트스트림 또는 신호는 상기 기능 또는 이의 변형을 수행한다.

신택스를 포함하는 비트스트림 또는 신호는 설명된 실시형태 중 임의의 하나에 따라 생성된 정보를 전달한다.

설명된 실시형태 중 어느 하나에 따라 생성 및/또는 전달 및/또는 수신 및/또는 디코딩된다.

설명된 실시형태 중 어느 하나에 따른 방법, 프로세스, 장치, 명령을 저장하는 매체, 데이터를 저장하는 매체 또는 신호.

디코더가 인코더에 의해 사용되는 방식과 대응하는 방식으로 디코딩 정보를 결정할 수 있도록 하는 시그널링 신택스 요소에 삽입된다.

설명된 신택스 요소 또는 이의 변형 중 하나 이상을 포함하는 비트스트림 또는 신호를 생성 및/또는 전달 및/또는 수신 및/또는 디코딩한다.

TV, 셋톱 박스, 휴대폰, 태블릿 또는 다른 전자 장치는 설명된 실시형태 중 어느 하나에 따른 변환 방법(들)을 수행한다.

TV, 셋톱 박스, 휴대폰, 태블릿, 또는 다른 전자 장치는 설명된 실시형태 중 어느 하나에 따라 변환 방법(들) 결정을 수행하고, 생성된 이미지를 디스플레이(예를 들어, 모니터, 스크린 또는 다른 유형의 디스플레이를 사용)한다.

TV, 셋톱 박스, 휴대폰, 태블릿, 또는 다른 전자 장치는, 인코딩된 이미지를 포함한 신호를 수신하기 위해 채널을 선택, 대역제한 또는 조정(예를 들어, 튜너를 사용함)하고, 설명된 실시형태 중 어느 하나에 따른 변환 방법(들)을 수행한다.

TV, 셋톱 박스, 휴대폰, 태블릿, 또는 다른 전자 장치는 인코딩된 이미지가 포함된 신호를 무선으로 수신(예를 들어, 안테나를 사용함)하고 변환 방법(들)을 수행한다.

Claims

방법으로서,
현재 비디오 블록을 둘러싼 이웃 샘플의 적어도 하나의 템플릿을 분할하는 단계;
상기 적어도 하나의 템플릿으로부터 가능한 인트라 예측 모드를 결정하는 단계;
상기 현재 비디오 블록을 인코딩하기 위해 사용할 인트라 서브블록 분할 방향 및 인트라 예측 모드를 결정하는 단계; 및
상기 결정된 인트라 서브블록 분할 방향 및 인트라 예측 모드를 사용하여 상기 현재 비디오 블록을 인코딩하는 단계를 포함하는, 방법.
장치로서,
프로세서를 포함하고, 상기 프로세서는:
현재 비디오 블록을 둘러싼 이웃 샘플의 적어도 하나의 템플릿을 분할하는 것;
상기 적어도 하나의 템플릿으로부터 가능한 인트라 예측 모드를 결정하는 것;
상기 현재 비디오 블록을 인코딩하기 위해 사용할 인트라 서브블록 분할 방향 및 인트라 예측 모드를 결정하는 것; 및
상기 결정된 인트라 서브블록 분할 방향 및 인트라 예측 모드를 사용하여 상기 현재 비디오 블록을 인코딩하는 것을 수행하도록 구성된, 장치.
방법으로서,
현재 비디오 블록을 둘러싼 이웃 샘플의 적어도 하나의 템플릿을 분할하는 단계;
상기 적어도 하나의 템플릿으로부터 가능한 인트라 예측 모드를 결정하는 단계;
상기 현재 비디오 블록을 인코딩하기 위해 사용할 인트라 서브블록 분할 방향 및 인트라 예측 모드를 결정하는 단계; 및
상기 결정된 인트라 서브블록 분할 방향 및 인트라 예측 모드를 사용하여 상기 현재 비디오 블록을 디코딩하는 단계를 포함하는, 방법.
장치로서,
프로세서를 포함하고, 상기 프로세서는:
현재 비디오 블록을 둘러싼 이웃 샘플의 적어도 하나의 템플릿을 분할하는 것;
상기 적어도 하나의 템플릿으로부터 가능한 인트라 예측 모드를 결정하는 것;
상기 현재 비디오 블록을 인코딩하기 위해 사용할 인트라 서브블록 분할 방향 및 인트라 예측 모드를 결정하는 것; 및
상기 결정된 인트라 서브블록 분할 방향 및 인트라 예측 모드를 사용하여 상기 현재 비디오 블록을 디코딩하는 것을 수행하도록 구성된, 장치.
제1항 또는 제3항 중 어느 한 항에 따른 방법, 또는 제2항 또는 제4항 중 어느 한 항에 따른 장치에 있어서, 분할은 상기 현재 비디오 블록의 크기에 따라 달라지는, 방법 또는 장치.
제1항, 제3항 또는 제5항 중 어느 한 항에 따른 방법, 또는 제2항, 제4항 또는 제5항 중 어느 한 항에 따른 장치에 있어서, 분할 방향은 수평 또는 수직인, 방법 또는 장치.
제1항, 제3항, 제5항 또는 제6항 중 어느 한 항에 따른 방법, 또는 제2항, 제4항 내지 제6항 중 어느 한 항에 따른 장치에 있어서, 인트라 서브블록 분할 방향의 결정은 예측 오차를 사용하는, 방법 또는 장치.
제7항에 따른 방법 또는 장치에 있어서, 예측 오차는 절대 차이의 합과 제곱 차이의 합으로 구성되는, 방법 또는 장치.
제1항, 제3항, 제5항 내지 제8항 중 어느 한 항에 따른 방법, 또는 제2항, 제4항 내지 제8항 중 어느 한 항에 따른 장치에 있어서, 인트라 서브블록 분할 모드의 도출은 상부 템플릿 또는 좌측 템플릿 중 어느 하나에 대한 현재 예측 모드를 사용하여 템플릿 픽셀로부터 결정되는, 방법 또는 장치.
제1항, 제3항, 제5항 내지 제9항 중 어느 한 항에 따른 방법, 또는 제2항, 제4항 내지 제9항 중 어느 한 항에 따른 장치에 있어서, 템플릿 기반 인트라 모드 도출 및 인트라 서브블록 분할 사용을 전달하기 위해 플래그를 시그널링하는 단계를 추가로 포함하는, 방법 또는 장치.
제10항에 따른 방법 또는 장치에 있어서, 인트라 서브블록 분할이 사용되는 경우, 인트라 서브블록 분할의 분열 방향 및 최상의 예측 모드를 결정하며, 또는 인트라 서브블록 분할이 사용되지 않는 경우, 디폴트 템플릿 기반 인트라 모드 도출을 사용하는, 방법 또는 장치.
디바이스로서,
제4항에 따른 장치; 및
(i) 신호를 수신하도록 구성된 안테나 - 상기 신호는 코딩 단위를 포함함 -, (ii) 상기 코딩 단위를 포함하는 수신된 신호를 주파수들의 대역으로 제한하도록 구성된 대역 제한기, 및 (iii) 코딩 단위를 나타내는 출력을 디스플레이하도록 구성된 디스플레이 중 적어도 하나를 포함하는, 디바이스.
프로세서를 사용한 재생을 위해, 제1항 및 제5항 내지 제11항 중 어느 한 항의 방법에 따라 또는 제2항 및 제5항 내지 제11항 중 어느 한 항의 장치에 의해 생성된 데이터 콘텐츠를 포함하는, 비일시적 컴퓨터 판독 가능 매체.
프로세서를 사용한 재생을 위해, 제1항 및 제5항 내지 제11항 중 어느 한 항의 방법에 따라 또는 제2항 및 제5항 내지 제11항 중 어느 한 항의 장치에 의해 생성된 비디오 데이터를 포함하는, 신호.
프로그램이 컴퓨터에 의해 실행될 때, 상기 컴퓨터로 하여금 제1항, 제3항 및 제5항 내지 제11항 중 어느 한 항의 방법을 수행하게 하는 명령어들을 포함하는, 컴퓨터 프로그램 제품.