KR20220030999A

KR20220030999A - 스케일링에 기초하는 개선된 변환을 갖는 인코더, 디코더, 방법 및 컴퓨터 프로그램

Info

Publication number: KR20220030999A
Application number: KR1020227000600A
Authority: KR
Inventors: 벤자민 브로스; 판 호앙 퉁 응우옌; 헤이코 슈바르츠; 데틀레브 마르페; 토마스 비에그란트
Original assignee: 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date: 2019-06-14
Filing date: 2020-06-12
Publication date: 2022-03-11
Also published as: MX2021015312A; BR112021025017A2; EP3984220A1; CN114009028A; JP2022536376A; TW202106018A; US20220103820A1; JP7522137B2; WO2020249762A1; TWI781416B

Abstract

인코딩된 픽쳐 신호의 변환 디코딩을 사용한 블록-기반 디코딩을 위한 디코더로서, 미리 결정된 블록에 대하여, 선택된 변환 모드를 선택하고, 상기 선택된 변환 모드에 따라서 상기 미리 결정된 블록과 연관되는 양자화해제될 블록을, 데이터 스트림으로부터 엔트로피 디코딩하며, 상기 양자화해제될 블록을 상기 선택된 변환 모드에 의존하는 양자화 정확도를 사용하여 양자화해제함으로써, 양자화해제된 블록을 획득하도록 구성되는, 디코더.

Description

스케일링에 기초하는 개선된 변환을 갖는 인코더, 디코더, 방법 및 컴퓨터 프로그램

본 발명에 따른 실시형태들은 개선된 변환 기반 스케일링이 있는 인코더, 디코더, 방법 및 컴퓨터 프로그램에 관한 것이다.

서문:

후속하는 설명에서, 상이한 진보적인 실시형태 및 양태들이 설명될 것이다. 또한, 추가적인 실시형태들이 첨부된 청구 범위에 의해서 규정될 것이다.

청구 범위에 의해 규정되는 임의의 실시형태들이, 후속하는 그 외의 진보적인 실시형태 및 양태들에서 설명된 세부사항(특징 및 기능) 중 임의의 것에 의해서 보완될 수 있다는 것에 주의해야 한다.

또한, 본 명세서에서 설명되는 개별적인 양태들이 개별적으로 또는 조합되어 사용될 수 있다는 것에 주의해야 한다. 따라서, 상기 양태들 중 다른 양태에 세부사항을 추가하지 않고서, 세부사항이 상기 개별적인 양태들 각각에 추가될 수 있다.

또한 본 발명이 명시적으로 또는 암시적으로, 인코더(입력 신호의 인코딩된 표현을 제공하기 위한 장치) 및 디코더(인코딩된 표현에 기반하여 신호의 디코딩된 표현을 제공하기 위한 장치)에서 사용될 수 있는 피쳐를 기술한다는 것에도 주의해야 한다. 따라서, 본 명세서에서 설명되는 피쳐들 중 임의의 것은 인코더의 콘텍스트 및 디코더의 콘텍스트에서 사용될 수 있다.

더욱이, 본 명세서에서 방법에 관련되는 것으로 개시된 피쳐 및 기능은 장치(이러한 기능을 수행하도록 구성된 장치)에서도 사용될 수 있다. 더욱이, 본 명세서에 장치에 대해서 개시된 임의의 피쳐 및 기능은 대응하는 방법에서도 사용될 수 있다. 다르게 말하면, 본 명세서에서 설명된 방법들은 장치에 대해서 설명된 피쳐 및 기능 중 임의의 것에 의하여 보완될 수 있다.

또한, 본 명세서에서 설명된 피쳐 및 기능 중 임의의 것은 섹션 "대안적인 구현형태들"에서 설명되는 바와 같이 하드웨어 또는 소프트웨어로, 또는 하드웨어 및 소프트웨어의 조합을 사용하여 구현될 수 있다.

발명의 배경

최신식 유손실 비디오 압축 기법에서, 인코더는 예측 잔차 또는 변환된 예측 잔차를 특정한 양자화 스텝 크기

를 사용하여 양자화한다. 스텝 크기가 작아질수록, 양자화는 더 정밀해지고 원본 신호와 재구성된 신호 사이의 오차는 작아진다. 최근의 비디오 코딩 표준(예컨대 H.264 및 H.265)은 해당 양자화 스텝 크기

를, 예를 들어 소위 양자화 파라미터(QP)의 지수 함수를 사용하여 유도한다:

양자화 스텝 크기와 양자화 파라미터 사이의 지수 관계는 결과적으로 얻어지는 비트레이트를 더 정밀하게 조절할 수 있게 한다. 디코더는 양자화된 신호의 정확한 스케일링을 수행하기 위해서 양자화 스텝 크기에 대해서 알 필요가 있다. 비록 양자화는 역변환이 불가능하지만, 이러한 스테이지는 가끔 "역 양자화(inverse quantization)"라고 불린다. 이것이 디코더가 비트스트림으로부터 스케일링 인자 또는 QP를 파싱하는 이유이다. QP 시그널링은 통상적으로 계층적으로 수행되고, 즉 베이스 QP는 비트스트림 내의 더 높은 레벨에서, 예를 들어 픽쳐 레벨에서 시그널링된다. 픽쳐가 다수의 슬라이스, 타일 또는 브릭(brick)으로 이루어질 수 있는 서브-픽쳐 레벨에서는, 베이스 QP에 대한 델타만이 시그널링된다. 비트레이트를 훨씬 더 정밀한 그래뉼래러티(granularity)에서 조절하기 위해서는, 델타 QP는 심지어 블록 또는 블록들의 영역 별로 시그널링될 수 있고, 예를 들어 HEVC 내의 코딩 블록의 NxN 영역 내의 하나의 변환 유닛 내에서 시그널링될 수 있다. 인코더는 주관적 최적화(subjective optimization) 또는 레이트-제어 알고리즘을 위해 델타 QP 기법을 보통 사용한다. 일반성이 손실되지 않으면서, 후속하는 설명에서 본 발명에서 베이스 유닛은 픽쳐라는 것이 가정되고, 그러므로 베이스 QP는 단일 슬라이스로 이루어진 각각의 픽쳐에 대해서 인코더에 의해 시그널링된다. 슬라이스 QP라고도 불리는 이러한 베이스 QP에 추가하여, 델타 QP는 각각의 변환 블록(또는 양자화 그룹이라고 불리는 변환 블록의 임의의 합집합)에 대해서 시그널링될 수 있다.

고효율 비디오 코딩(High Efficiency Video Coding; HEVC), 또는 최근에 대두되고 있는 다기능 비디오 코딩(Versatile Video Coding; VVC) 표준과 같은 최신식 비디오 코딩 스킴은, 타입 II 이산 여현 변환(DCT-II)의 널리 사용되는 정수 근사화를 넘어서는 추가적인 변환을 허용함으로써 다양한 잔차 신호 타입들의 에너지 압축물(energy compaction)을 최적화한다. HEVC 표준은 특정한 인트라 방향성 모드를 사용하여 4×4 변환 블록에 대한 타입-VII 이산 사인 변환(DST-VII)의 정수 근사화를 더욱 규정한다. 이러한 고정된 매핑에 기인하여, DCT-II 또는 DST-VII이 사용되는지 여부가 시그널링될 필요가 없다. 이것에 추가하여, 항등 변환이 4×4 변환 블록들에 대해서 선택될 수 있다. 여기에서, 인코더는 DCT-II/DST-VII 또는 항등 변환이 적용되는지 여부를 시그널링할 필요가 있다. 항등 변환이 1로 승산하는 것에 대한 매트릭스 등가물이기 때문에, 이것은 변환 스킵(transform skip)이라고도 불린다. 더욱이, 현재의 VVC 개발 사례는 인코더가 잔차에 대한 DCT/DST 군의 더 많은 변환 및 추가적인 분리불가능한 변환을 선택할 수 있게 하는데, 이들은 인코더에서의 DCT/DST 변환 이후에 그리고 디코더에서의 역 DCT/DST 이전에 적용된다. DCT/DST 변환들의 확장된 세트 및 추가적인 분리불가능한 변환 양자 모두는 변환 블록마다의 추가적 시그널링을 요구한다.

도 1b는 인코더(10)에서의 잔차 신호(24)의 순방향 변환 및 후속 양자화, 및 디코더(36)에 대한 양자화된 변환 계수의 스케일링 및 후속하는 역 변환을 포함하는 하이브리드 비디오 코딩 접근법을 예시한다. 변환 및 양자화 관련 블록(28/32 및 52/54)은 강조된다.

그러므로, 개선된 압축 효율을 초래하는, 픽쳐 및/또는 비디오의 코딩에서 사용될 수 있는 양자화 및/또는 스케일링을 위한 개념을 제공하는 것이 소망된다.

이러한 목적은 본 출원의 독립항들의 기술 요지에 의해서 달성된다.

본 발명에 따른 추가적인 실시형태들은 본 출원의 종속항의 기술 요지에 의해서 규정된다.

발명의 개요

본 발명의 제 1 양태에 따르면, 본 출원의 발명자들은, 변환 계수 및 스케일링 양자화된 변환 계수를 양자화할 때에 만나게 되는 한 가지 문제점이 상이한 변환 모드 및/또는 블록 크기가 결과적으로 상이한 스케일링 인자 및 양자화 파라미터를 유발할 수 있다는 사실로부터 발생한다는 것을 인식했다. 하나의 변환 모드에서의 양자화 정확도는 다른 변환 모드에서의 왜곡이 증가되게 할 수 있다. 본 출원의 제 1 양태에 따르면, 이러한 문제점은 양자화 정확도를 양자화될 블록에 대해서 사용되는 변환 모드에 의존하여 선택함으로써 극복된다. 따라서, 상이한 변환 모드 및/또는 블록 크기에 대해서 상이한 양자화 정확도가 선택될 수 있다.

따라서, 본 출원의 제 1 양태에 따르면, 변환 코딩을 사용하는 픽쳐 신호의 블록-기반 인코딩을 위한 인코더는, 미리 결정된 블록, 예를 들어 비디오 신호 또는 픽쳐 신호 내의 블록들의 영역 내의 한 블록에 대하여, 선택된 변환 모드, 예를 들어 항등 변환 또는 비-항등 변환을 선택하도록 구성된다. 항등 변환은 변환 스킵(transform skip) 이라고 이해될 수 있다. 더욱이, 인코더는 미리 결정된 블록과 연관된 양자화될 블록을 선택된 변환 모드에 따라서 선택된 변환 모드에 의존하는 양자화 정확도를 사용하여 양자화함으로써 양자화된 블록을 획득하도록 구성된다. 양자화될 블록은, 예를 들어 선택된 변환 모드의 대상이 되는 미리 결정된 블록 및/또는 선택된 변환 모드가 비-항등 변환인 경우에는 선택된 변환 모드에 내재된 변환을 미리 결정된 블록에 적용함으로써 획득되고, 선택된 변환 모드가 항등 변환인 경우에는 미리 결정된 블록을 등화함으로써 획득되는 블록이다. 양자화 정확도는, 예를 들어 양자화 파라미터(quantization parameter; QP), 스케일링 인자 및/또는 양자화 스텝 크기에 의하여 규정된다. 양자화될 블록의 값들은, 예를 들어 양자화 파라미터(QP), 스케일링 인자 및/또는 양자화된 블록을 수용하기 위한 양자화 스텝 크기로 나누어진다. 추가적으로, 인코더는 양자화된 블록을 데이터 스트림 내에 엔트로피 인코딩하도록 구성된다.

이와 유사하게, 본 출원의 제 1 양태에 따르면, 변환 디코딩을 사용하는 인코딩된 픽쳐 신호의 블록-기반 디코딩을 위한 디코더는, 미리 결정된 블록, 예를 들어 디코딩된 픽쳐 신호 또는 비디오 신호 내의 블록들의 영역 내의 한 블록에 대하여, 선택된 변환 모드, 예를 들어 항등 변환 또는 비-항등 변환을 선택하도록 구성된다. 항등 변환은 변환 스킵(transform skip) 이라고 이해될 수 있다. 비-항등 변환은 인코더에 의해 적용된 변환의 역변환/역방향 변환일 수 있다. 더욱이, 디코더는 선택된 변환 모드에 따라서 미리 결정된 블록과 연관된 양자화해제될 블록을 데이터 스트림으로부터 엔트로피 디코딩하도록 구성된다. 양자화해제될 블록은, 예를 들어 선택된 변환 모드의 대상이 되기 이전의 미리 결정된 블록이다. 추가적으로, 디코더는 선택된 변환 모드에 의존하는 양자화 정확도를 사용하여 양자화해제될 블록을 양자화해제함으로써 양자화해제된 블록을 획득하도록 구성된다. 양자화 정확도는, 예를 들어 양자화 파라미터(quantization parameter; QP), 스케일링 인자 및/또는 양자화 스텝 크기에 의하여 규정된다. 블록의 값들은, 예를 파라미터(QP), 스케일링 인자 및/또는 양자화해제된 블록을 수용하기 위한 양자화 스텝 크기로 승산된다. 양자화 정확도는, 예를 들어 양자화해제될 블록의 양자화해제의 정확도를 규정한다. 양자화 정확도는 스케일링 정확도라고 이해될 수 있다.

일 실시형태에 따르면, 양자화 정확도는 부분적으로 선택된 변환 모드가 항등 변환 또는 비-항등 변환인지 여부에 의존한다. 예측 모드 및/또는 블록 크기 및/또는 블록 형상에 의존해서 추가적인 적응이 일어날 수 있다는 것에 주의한다. 변환 모드에 대한 의존성은 비-항등 변환이 잔차 신호의 정밀도를 증가시킬 수 있고, 이를 통해서 동적 범위도 역시 증가될 수 있다는 사상에 기반하고 있다. 그러나, 이것은 항등 변환의 경우에는 성립하지 않는다. 비-항등 변환에 대한 낮은 왜곡과 연관된 양자화 정확도는 변환 모드가 항등 변환인 경우에 왜곡이 더 심해지는 결과가 될 수 있다. 따라서, 항등 변환 및 비-항등 변환 사이를 구별하는 것이 유리하다.

선택된 변환 모드가 항등 변환이라면, 인코더 및/또는 디코더는 미리 결정된 블록에 대한 초기 양자화 정확도를 결정하고 초기 양자화 정확도가 미리 결정된 임계보다 정밀한지 여부를 점검하도록 구성될 수 있다. 비록 선택된 변환 모드가 비-항등 변환인 경우에 미리 결정된 임계보다 정밀한 양자화 정확도가 왜곡을 줄일 수 있지만, 이것은 선택된 변환 모드가 항등 변환인 경우에는 성립하지 않는다. 초기 양자화 정확도가 미리 결정된 임계보다 정밀한 경우, 인코더 및/또는 디코더는 선택된 변환 모드가 항등 변환이라면 양자화 정확도를, 예를 들어 미리 결정된 임계에 대응하는 디폴트 양자화 정확도로 설정하도록 구성될 수 있다. 따라서 디폴트 양자화 정확도에 대해서는 존재하지 않는 추가적인 왜곡이 회피될 수 있다.

추가적으로, 인코더 및/또는 디코더는 초기 양자화 정확도가 미리 결정된 임계보다 정밀하지 않은 경우, 초기 양자화 정확도를 양자화 정확도로서 사용하도록 구성될 수 있다. 이러한 경우에 초기 양자화 정확도는 추가적인 왜곡을 도입하지 않아야 하고, 이를 통해서 변경되거나 조절되지 않은 초기 양자화 정확도를 사용하는 것에는 문제가 없다.

일 실시형태에 따르면, 초기 양자화 정확도는, 인코더의 경우에는 양자화 파라미터 목록으로부터 인덱스를 결정함으로써, 그리고 디코더의 경우에는 양자화해제 파라미터 목록으로부터 인덱스를 결정함으로써 결정된다. 인덱스는, 예를 들어 양자화 파라미터, 예를 들어 양자화 파라미터 목록, 예를 들어 디코더에 대한 양자화해제 파라미터 목록 내의 디코더에 대한 양자화해제 파라미터 또는 스케일링 파라미터를 가리키고, 양자화 파라미터 목록 내의 모든 양자화 파라미터에 대해서 동일한 함수를 통하여 양자화 스텝 크기와 연관된다. 인코더는, 예를 들어 양자화될 블록의 값을 양자화 스텝 크기로 나눔으로써 양자화하도록 구성될 수 있고, 디코더는 양자화해제될 블록의 값을 양자화 스텝 크기로 승산함으로써 양자화해제하도록 구성될 수 있다. 인덱스는 양자화 파라미터(QP)와 같을 수 있고, 양자화 파라미터 목록 및/또는 양자화해제 파라미터 목록은

[]={40, 45, 51, 64, 72}에 의하여 규정될 수 있다. 양자화 스텝 크기 (

(QP))는 인덱스(QP)의 지수 함수를 사용하여 유도될 수 있고, 예를 들어

이며, 여기에서

[]={40, 45, 51, 64, 72}이다.

일 실시형태에 따르면, 인코더 및/또는 디코더는 초기 양자화 정확도가 미리 결정된 임계 보다 정밀한지 여부를 인덱스, 즉 양자화 파라미터 목록으로부터 얻은 인덱스가 미리 결정된 인덱스 값보다 작은지 여부를 점검함으로써 점검하도록 구성된다. 미리 결정된 인덱스 값은, 예를 들어 4의 인덱스를 규정하고, 즉 인덱스는 4와 같다. 선택된 변환 모드가 항등 변환인 경우, 인코더 및/또는 디코더는 인덱스, 예를 들어 양자화 파라미터(QP)를 4의 최소 값에 고정하도록 구성될 수 있다. 인코더 및/또는 디코더는 4보다 작은 양자화 파라미터(QP)를 금지하도록 구성될 수 있다. 만일 QP가 4보다 작으면, 인코더 및/또는 디코더는 QP를 4로 설정하도록 구성될 수 있고, QP가 4 이상이면, QP는, 예를 들어, Trafo Skip? Max(4, QP): QP로 유지된다. 따라서, 결과적으로 변환 스킵 모드 내에 왜곡을 도입할 수 있는 1 미만의 스케일링 인자를 초래하는 인덱스들, 예를 들어 0, 1, 2 및 3인 QP가 변환 스킵 모드에 대해서는 회피되거나 허용되지 않는다. 전술된 예가 8-비트 비디오 신호에 대한 것이고, 입력 비디오 신호 비트-깊이에 의존하는 조절을 요구한다는 것에 주의한다. 비트-깊이를 1만큼 증가시키면 결과적으로 임계 값이 마이너스 6만큼 감소된다. 시그널링은 직접적이거나 간접적일 수 있고, 예컨대 입력 비트-깊이에 대한 내부 비트-깊이의 차이의 사양을 통하여, 입력 비트-깊이의 직접 시그널링 및/또는 임계치의 시그널링일 수 있다. 간접 구성의 일 예는 다음과 같다.

sps_internal_bit_depth_minus_input_bit_depth는 변환 스킵 모드에 대한 최소 허용된 양자화 파라미터를 다음과 같이 규정한다:

QpPrimeTsMin = 4 + 6 * sps_internal_bit_depth_minus_input_bit_depth

sps_internal_bit_depth_minus_input_bit_depth의 값은 0 내지 8의 범위 안에 속할 것이고, 양단을 포함한다.

- 그렇지 않으면(transform_skip_flag[ xTbY ][ yTbY ][ cIdx ]가 1과 같음), 다음이 적용된다:

qP = Clip3(QpPrimeTsMin, 63 + QpBdOffset, qP + QpActOffset)

일 실시형태에 따르면, 인코더에 의해서 수행되는 양자화될 블록의 양자화는 정수 양자화, 예를 들어 가장 가까운 정수 값으로 근사화되는 양자화가 뒤따르는 스케일링을 포함한다. 이와 유사하게, 디코더에 의해서 수행되는 양자화해제될 블록의 양자화해제는, 정수 양자화해제, 예를 들어 가장 가까운 정수 값으로의 양자화해제가 뒤따르는 스케일링, 예를 들어 재스케일링을 포함한다. 추가적으로, 인코더 및/또는 디코더는, 미리 결정된 임계 및/또는 디폴트 양자화 정확도가 1의 스케일링 인자, 예를 들어 디코더의 경우에는 재스케일링 인자에 관련되도록 구성된다. 인코더는 양자화될 블록을 양자화하기 위하여 스케일링 인자를 사용하도록 구성될 수 있고, 디코더는 양자화해제될 블록을 양자화해제하기 위하여 스케일링 인자를 사용하도록 구성될 수 있다. 인코더는, 양자화될 블록의 값을 스케일링 인자로 나눔으로써 양자화될 블록을 양자화하도록 구성될 수 있고, 디코더는 양자화해제될 블록의 값을 양자화 인자로 승산함으로써 양자화해제될 블록을 양자화해제하도록 구성될 수 있다. 예를 들어, 인코더 및/또는 디코더는 초기 양자화 정확도가 미리 결정된 임계 보다 정밀한지 여부를, 스케일링 인자, 예를 들어 양자화 스텝 크기(

QP)가 미리 결정된 스케일링 인자보다 작은지 여부를 점검함으로써 점검하도록 구성된다. 미리 결정된 스케일링 인자는, 예를 들어, 1의 스케일링 인자를 규정한다. 선택된 변환 모드가 항등 변환인 경우, 인코더 및/또는 디코더는 스케일링 인자를 1의 최소값으로 고정하도록 구성될 수 있다. 인코더 및/또는 디코더는 1보다 작은 스케일링 인자를 금지하도록 구성될 수 있다.

(QP)가 1보다 작으면, 인코더는

(QP)를 1로 설정하도록 구성되고,

(QP)가 1 이상이면,

(QP)는 유지되고, 예를 들어, 선택된 변환 모드가 항등 변환이라면 결과적으로 적어도 1인 스케일링 인자가 된다.

일 실시형태에 따르면, 인코더 및 디코더는, 미리 결정된 블록을 포함하는 여러 블록, 예를 들어 이웃하는 블록, 예컨대 미리 결정된 블록을 포함하는 전체 픽쳐, 미리 결정된 블록을 포함하는 여러 픽쳐, 또는 미리 결정된 블록을 포함하는 픽쳐의 슬라이스에 대한 초기 양자화 정확도를 결정하도록 구성된다. 여러 픽쳐가 있는 경우에, 픽쳐들 중 적어도 하나의 또는 오직 하나가 미리 결정된 블록을 가져야 한다. 인코더의 경우에는, 픽쳐들은 인코딩될 픽쳐 신호 또는 비디오 신호의 픽쳐이고, 여러 블록은, 예를 들어 픽쳐 신호 또는 비디오 신호의 한 픽쳐 내의 블록들이다. 디코더의 경우에는, 블록들은, 예를 들어 디코딩된 픽쳐 신호 또는 디코딩된 비디오 신호의 하나의 잔차 픽쳐 내의 예측 잔차 블록들이다.

인코더는, 예를 들어 여러 블록, 예컨대 전체 픽쳐, 여러 픽쳐 또는 한 픽쳐의 슬라이스에 대한 초기 양자화 정확도를 데이터 스트림 내에서 시그널링하도록 구성될 수 있다. 디코더는, 예를 들어 여러 블록, 예컨대 전체 픽쳐, 여러 픽쳐 또는 한 픽쳐의 슬라이스에 대한 초기 양자화 정확도를 데이터 스트림으로부터 독출하도록 구성될 수 있다.

일 실시형태에 따르면, 인코더는 양자화 정확도 및/또는 선택된 변환 모드를 데이터 스트림 내에서 시그널링하도록 구성된다. 예를 들어, 디코더는 양자화 정확도 및/또는 선택된 변환 모드를 데이터 스트림으로부터 독출하도록 구성된다.

일 실시형태에 따르면, 미리 결정된 블록은, 인코더의 경우에는 블록-기반 인코딩될 픽쳐 신호의 예측 잔차의 블록을 나타낸다. 디코더의 경우에는, 미리 결정된 블록은 예를 들어 블록-기반 디코딩될 픽쳐 신호의 예측 잔차의 블록을 나타낸다. 예를 들어, 미리 결정된 블록은 디코더의 경우에는 디코딩된 잔차 블록을 나타낸다.

일 실시형태에 따르면, 디코더는 미리 결정된 블록에 대한 초기 양자화 정확도를 결정하고, 선택된 변환 모드에 의존하여 초기 양자화 정확도를 수정하도록 구성된다. 예를 들어, 초기 양자화 정확도는 인덱스, 즉 QP, 및/또는 스케일링 인자, 즉,

(QP)를 포함한다. 따라서, 압축 효율을 높이는 것이 가능해진다. 이것은, 블록들의 그룹 또는 여러 픽쳐에 대하여 초기 양자화 정확도가 데이터 스트림 내에서 시그널링될 수 있고, 인코딩되거나 디코딩될 각각의 블록에 대해서 이러한 초기 양자화 정확도를 각각의 블록에 대한 변환 모드에 의존하여 개별적으로 적응시키는 것이 가능하다는 사상에 기반하고 있다.

초기 양자화 정확도의 수정은 초기 양자화 정확도를 선택된 변환 모드에 의존하여 오프셋 값을 사용하여 오프셋시킴으로써 수행될 수 있다. 오프셋은, 예를 들어 지각되는 시각적 품질을 최대화하거나 주어진 비트레이트에 대한 제곱 오차와 같은 객관적인 왜곡(objective distortion)을 최소화하거나, 또는 주어진 품질/왜곡에 대하여 비트레이트를 감소시킴으로써 압축 효율이 증가되도록 선택될 수 있다. 일 실시형태에 따르면, 인코더 및/또는 디코더는 각각의 변환 모드에 대한 오프셋 값을 결정하도록 구성된다. 이것은 각각의 픽쳐 신호 또는 비디오 신호에 대하여 개별적으로 수행될 수 있다. 또는, 오프셋 값은 여러 픽쳐, 하나의 픽쳐, 하나의 픽쳐의 하나 이상의 슬라이스, 블록들 또는 개별적인 블록들의 그룹과 같은 더 작은 엔티티에 대하여 결정된다. 대안적으로 또는 추가적으로, 각각의 변환 모드에 대하여 오프셋 값이 오프셋 값들의 목록으로부터 획득될 수 있다.

전술된 바와 같이, 인코더는 양자화 파라미터 목록으로부터 인덱스를 결정함으로써 초기 양자화 정확도를 결정하도록 구성될 수 있다. 이와 유사하게, 디코더는 양자화해제 파라미터 목록으로부터 인덱스를 결정함으로써 초기 양자화 정확도를 결정하도록 구성될 수 있다. 일 실시형태에 따르면, 인코더 및/또는 디코더는 오프셋 값을 인덱스에 가산하거나 오프셋 값을 인덱스로부터 감산함으로써 초기 양자화 정확도를 수정하도록 구성된다. 인덱스, 즉 양자화 파라미터(QP)는, 예를 들어 오프셋 값만큼 감소되거나 증가된다.

전술된 바와 같이, 인코더의 경우에는, 양자화될 블록의 양자화는 스케일링과 그에 후속하는 정수 양자화, 예를 들어 가장 가까운 정수 값으로의 양자화를 포함할 수 있다. 인코더는 양자화될 블록의 값을 스케일링 인자로 나눔으로써 스케일링을 수행하도록 구성될 수 있다. 이와 유사하게, 디코더의 경우에는, 양자화해제될 블록의 양자화해제는 스케일링, 예를 들어 재스케일링 및 그에 후속하는 정수 양자화해제, 예를 들어 가장 가까운 정수 값으로의 양자화해제를 포함할 수 있고, 디코더는 양자화해제될 블록의 값을 스케일링 인자, 예를 들어 재스케일링 인자로 승산함으로써 스케일링을 수행하도록 구성될 수 있다. 추가적으로, 인코더 및/또는 디코더는 오프셋 값을 스케일링 인자에 가산하거나 오프셋 값을 스케일링 인자로부터 감산함으로써 초기 양자화 정확도를 수정하도록 구성될 수 있다. 스케일링 인자는, 예를 들어 양자화 스텝 크기

(QP)와 같다. 양자화 스텝 크기

(QP)는 오프셋 값만큼 감소되거나 증가될 수 있다.

일 실시형태에 따르면, 인코더 및/또는 디코더는 수정된 초기 양자화 정확도를 선택된 변환 모드가 항등 변환 또는 비-항등 변환인지 여부에 의존하여 제공하도록 구성된다. 다시 말하면, 인코더 및/또는 디코더는 수정된 초기 양자화 정확도를 선택된 변환 모드가 항등 변환 또는 비-항등 변환인지 여부에 의존하여 수정하도록 구성될 수 있다.

일 실시형태에 따르면, 인코더 및/또는 디코더는, 선택된 변환 모드가 항등 변환이면, 상기 미리 결정된 블록에 대한 초기 양자화 정확도를 결정하고, 상기 초기 양자화 정확도가 미리 결정된 임계보다 열악한지 여부를 점검하고, 추가적으로 만약 상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 열악하다면, 상기 인코더 및/또는 디코더는 상기 선택된 변환 모드에 의존하여, 수정된 초기 양자화 정확도가 상기 미리 결정된 임계보다 정밀해지도록 상기 초기 양자화 정확도를 오프셋 값을 사용하여 수정하도록 구성된다. 예를 들어, 인덱스(QP)가 10, 20, 30, 35, 40 또는 45보다 크다면, 초기 양자화 정확도는 미리 결정된 임계보다 열악하다. 다르게 말하면, 미리 결정된 임계는 10, 20, 30, 35, 40 또는 45의 인덱스에 의해 표현될 수 있다. 따라서, 인덱스 또는 스케일링 인자는 비트레이트 범위의 두 번째 끝에 있는, 즉 낮은 비트레이트에 대한 오프셋 값만큼 감소된다. 비트레이트 범위의 두 번째 끝은, 예를 들어 4 이하의 QP들과 연관되는 비트레이트 범위의 첫 번째 끝에 대해 반대인 비트레이트 범위의 끝과 연관된다.

일 실시형태에 따르면, 인코더 및/또는 디코더는, 초기 양자화 정확도가 미리 결정된 임계보다 열악하지 않다면, 초기 양자화 정확도를 선택된 변환 모드에 의존하여 오프셋 값을 사용해서 수정하지 않도록 구성된다.

일 실시형태에 따르면, 인코더 및/또는 디코더는, 선택된 변환 모드가 비-항등 변환이라면, 초기 양자화 정확도를 오프셋 값을 사용하여 수정하지 않도록 구성된다. 따라서, 예를 들어 오프셋은 변환 모드가 항등 변환인 경우에만 사용된다.

일 실시형태에 따르면, 인코더 및/또는 디코더는 레이트-왜곡 최적화를 사용하여 오프셋을 결정하도록 구성된다. 따라서, 작은 왜곡만을 초래하거나 왜곡을 초래하지 않는 높은 압축 효율이, 오프셋이 결정되는 미리 결정된 블록에 대해서 사용될 변환 모드에 의존하여 달성될 수 있다.

일 실시형태에 따르면, 인코더는, 미리 결정된 블록을 포함하는 여러 블록, 예를 들어 이웃하는 블록, 예컨대 미리 결정된 블록을 포함하는 전체 픽쳐, 미리 결정된 블록을 포함하는 여러 픽쳐, 또는 미리 결정된 블록을 포함하는 픽쳐의 슬라이스에 대한 오프셋, 예를 들어 오프셋 값 또는 오프셋 값들의 세트 내의 오프셋 값을 가리키는 인덱스를 데이터 스트림 내에 시그널링하도록 구성된다. 픽쳐들은, 예를 들어 인코딩될 픽쳐 신호 또는 비디오 신호의 픽쳐이고, 여러 블록은, 예를 들어 픽쳐 신호 또는 비디오 신호의 한 픽쳐 내의 블록들이다.

일 실시형태에 따르면, 디코더는, 미리 결정된 블록을 포함하는 여러 블록, 예컨대 미리 결정된 블록을 포함하는 전체 픽쳐, 미리 결정된 블록을 포함하는 여러 픽쳐, 또는 미리 결정된 블록을 포함하는 픽쳐의 슬라이스에 대한 오프셋, 예를 들어 오프셋 값 또는 오프셋 값들의 세트 내의 오프셋 값을 가리키는 인덱스를 데이터 스트림으로부터 독출하도록 구성된다. 디코더는, 미리 결정된 블록을 포함하는 여러 블록, 예컨대 미리 결정된 블록을 포함하는 전체 픽쳐, 미리 결정된 블록을 포함하는 여러 픽쳐, 또는 미리 결정된 블록을 포함하는 픽쳐의 슬라이스에 대한 오프셋을 데이터 스트림으로부터 독출하도록 구성된다.

인코더의 경우에는, 양자화될 블록을 양자화하는 것은, 블록-광역 스케일링, 예를 들어 블록의 모든 값에 대하여 하나의 스케일링 인자를 사용하는 스케일링, 및 인트라-블록-변동 스케일링 매트릭스를 사용한 스케일링 및 이에 후속하는 정수 양자화, 예를 들어 가장 가까운 정수 값으로의 양자화를 선택적으로 포함한다. 예를 들어, 인트라-블록-변동 스케일링 매트릭스는 복수 개의 스케일링 인자, 예를 들어 복수 개의 양자화 파라미터(QP) 또는 복수 개의 양자화 스텝 크기

(QP)를 가지는 매트릭스이다. 예를 들어, 선택된 변환을 미리 결정된 블록에 적용함으로써, 스케일링되기 이전에 인코더에 의해 획득되는 각각의 변환 계수는 스케일링 매트릭스의 복수 개의 스케일링 인자들 중 하나에 의해서 스케일링된다. 인트라-블록-변동 스케일링 매트릭스를 사용하여 스케일링하면 결과적으로 주파수-의존적 가중화 또는 공간-의존적 가중화가 얻어질 수 있다. 추가적으로, 인코더는 인트라-블록-변동 스케일링 매트릭스를 선택된 변환 모드에 의존하여 결정하도록 구성될 수 있다.

디코더의 경우에는, 양자화해제될 블록을 양자화해제하는 것은, 블록-광역 스케일링, 즉 블록-광역 재스케일링, 예를 들어 블록의 모든 값에 대하여 하나의 스케일링 인자, 즉 재스케일링 인자를 사용하는 스케일링, 및 인트라-블록-변동 스케일링 매트릭스, 즉 인트라-블록-변동 재스케일링 매트릭스를 사용한 스케일링, 예를 들어 재스케일링 및 그에 후속하는 정수 양자화해제, 예를 들어 가장 가까운 정수 값으로의 양자화해제를 포함한다. 예를 들어 인트라-블록-변동 스케일링 매트릭스는, 예를 들어 복수 개의 양자화 파라미터(QP) 또는 복수 개의 양자화 스텝 크기

(QP)를 가지는 매트릭스와 같은, 복수 개의 스케일링 인자, 즉 재스케일링 인자를 가지는 매트릭스이다. 예를 들어, 블록의 각각의 값은 스케일링 매트릭스의 복수 개의 스케일링 인자들 중 하나에 의해서 개별적으로 스케일링된다. 인트라-블록-변동 스케일링 매트릭스를 사용하여 스케일링하면, 예를 들어 결과적으로 주파수-의존적 가중화 또는 공간-의존적 가중화가 얻어질 수 있다. 추가적으로, 디코더는 인트라-블록-변동 스케일링 매트릭스를 선택된 변환 모드에 의존하여 결정하도록 구성될 수 있다.

일 실시형태에 따르면, 인코더 및/또는 디코더는, 결정 결과에 의해서 양자화되거나 양자화해제될 크기와 및 형상이 같은 상이한 블록에 대해서 상이한 인트라-블록-변동 스케일링 매트릭스들이 얻어지게끔, 인트라-블록-변동 스케일링 매트릭스를 결정하도록 구성된다. 따라서, 제 1 블록에 대한 제 1 인트라-블록-변동 스케일링 매트릭스 및 제 2 블록에 대한 제 2 인트라-블록-변동 스케일링 매트릭스가 서로 다를 수 있고, 여기에서 제 1 블록 및 제 2 블록은 동일한 크기 및 형상을 가질 수 있다.

추가적으로, 이러한 결정은 선택적으로, 양자화될 상이한 블록 또는 양자화해제될 상이한 블록에 대하여 결정되는 인트라-블록-변동 스케일링 매트릭스가 선택된 변환 모드에 의존하고, 선택된 변환 모드가 항등 변환과 동일하지 않게 되도록, 이루어지고, 여기에서 상이한 블록은 크기 및 형상에 있어서 동일하다. 이것은, 선택된 변환 모드가 항등 변환인 경우에는, 주파수-가중된 스케일링이 유익하지 않다는 사상에 기반하고 있다. 항등 변환의 경우에는, 예를 들어 블록-광역 스케일링 또는 공간-가중된 스케일링 매트릭스가 사용될 수 있다. 그러나, 변환 모드가 비-항등 변환과 동일한 경우에는, 양자화되거나 양자화해제될 블록의 모든 변환 계수를 개별적으로 스케일링하는 것이 유리하다. 인트라-블록-변동 스케일링 매트릭스는 상이한 비-항등 변환 모드들에 대하여 다를 수 있다.

일 실시형태에 따르면, 상기 인코더는, 선택된 변환 모드가 비-항등 변환인 경우, 상기 선택된 변환 모드(에 대응하는 변환을 상기 미리 결정된 블록에 적용하여 상기 양자화될 블록을 획득하도록 구성되고, 상기 선택된 변환 모드가 항등 변환인 경우에는, 상기 미리 결정된 블록이 상기 양자화될 블록이 된다.

일 실시형태에 따르면, 상기 디코더는 상기 선택된 변환 모드가 비-항등 변환인 경우, 상기 선택된 변환 모드에 대응하는 역변환을 양자화해제된 블록에 적용하여 상기 미리 결정된 블록을 획득하도록 구성되고, 상기 선택된 변환 모드가 항등 변환인 경우에는, 상기 양자화해제된 블록이 상기 미리 결정된 블록이 된다.

일 실시형태는 변환 코딩을 사용하는 픽쳐 신호의 블록-기반 인코딩을 위한 방법에 관한 것이고, 이러한 방법은 미리 결정된 블록, 예를 들어 비디오 신호 또는 픽쳐 신호 내의 블록들의 구역 내의 블록에 대하여, 선택된 변환 모드, 예를 들어 항등 변환 또는 비-항등 변환을 선택하는 단계를 포함한다. 항등 변환은, 예를 들어 변환 스킵(transform skip)이라고 이해된다. 추가적으로, 이러한 방법은 미리 결정된 블록과 연관된 양자화될 블록을 선택된 변환 모드에 따라서 선택된 변환 모드에 의존하는 양자화 정확도를 사용하여 양자화함으로써 양자화된 블록을 획득하는 단계를 포함한다. 양자화될 블록은, 예를 들어 선택된 변환 모드의 대상이 되는 미리 결정된 블록 및/또는 선택된 변환 모드가 비-항등 변환인 경우에는 선택된 변환 모드에 내재된 변환을 미리 결정된 블록에 적용함으로써 획득되고, 선택된 변환 모드가 항등 변환인 경우에는 미리 결정된 블록을 등화함으로써 획득되는 블록이다. 양자화 정확도는, 예를 들어 양자화 파라미터(quantization parameter; QP), 스케일링 인자 및/또는 양자화 스텝 크기에 의하여 규정된다. 블록의 값들은, 예를 들어 양자화 파라미터(QP), 스케일링 인자 및/또는 양자화된 블록을 수용하기 위한 양자화 스텝 크기로 나누어진다. 더욱이, 본 발명의 방법은 양자화된 블록을 데이터 스트림 내에 엔트로피 인코딩하는 단계를 포함한다.

일 실시형태는 변환 디코딩을 사용한 인코딩된 픽쳐 신호의 블록-기반 디코딩을 위한 방법에 관한 것인데, 이러한 방법은 미리 결정된 블록, 예를 들어 디코딩된 잔차 픽쳐 신호 또는 잔차 비디오 신호 내의 이웃하는 잔차 블록의 구역 내의 잔차 블록에 대하여, 선택된 변환 모드, 예를 들어 항등 변환 또는 비-항등 변환을 선택하는 단계를 포함한다. 예를 들어, 항등 변환은 변환 스킵으로 이해되고, 예를 들어 비-항등 변환은 인코더에 의해 적용된 변환의 역변환/역방향 변환이다. 추가적으로, 본 발명의 방법은 선택된 변환 모드에 따른 미리 결정된 블록과 연관된 양자화해제될 블록을 데이터 스트림으로부터 엔트로피 디코딩하는 단계, 및 양자화해제될 블록을 선택된 변환 모드에 의존하는 양자화 정확도를 사용하여 양자화해제하여 양자화해제된 블록을 얻는 단계를 포함한다. 양자화 정확도는, 예를 들어 양자화 파라미터(quantization parameter; QP), 스케일링 인자 및/또는 양자화 스텝 크기에 의하여 규정된다. 블록의 값들은, 예를 파라미터(QP), 스케일링 인자 및/또는 양자화해제된 블록을 수용하기 위한 양자화 스텝 크기로 승산될 수 있다. 양자화 정확도는, 예를 들어 양자화해제될 블록의 양자화해제의 정확도를 규정한다.

전술된 바와 같은 방법은 전술된 인코더 및/또는 디코더와 같은 고려사항들에 기반하고 있다. 이러한 방법들은 디코더 및/또는 인코더에 관하여 역시 설명되는 모든 피쳐 및 기능성을 사용하여 완성될 수 있다.

일 실시형태는, 컴퓨터에서 실행될 때 본 명세서에서 설명된 방법을 수행하기 위한 프로그램 코드를 가지는 컴퓨터 프로그램에 관한 것이다.

일 실시형태는 픽쳐 신호의 블록-기반 인코딩을 위한 방법에 의해 획득되는 방법에 관한 것이다.

도면들은 반드시 척도에 맞는 것은 아니고, 본 발명의 원리를 예시하기 위하여 일반적으로 제공되는 대신에 강조된다. 후속하는 발명을 실시하기 위한 구체적인 내용에서, 본 발명의 다양한 실시형태들이 후속하는 도면을 참조하여 설명된다:
도 1a는 인코더의 개략도를 도시한다;
도 1b는 다른 인코더의 개략도를 도시한다;
도 2는 디코더의 개략도를 도시한다;
도 3은 블록-기반 코딩의 개략도를 도시한다;
도 4는 일 실시형태에 따르는 인코더의 개략도를 도시한다;
도 5는 일 실시형태에 따르는 디코더의 개략도를 도시한다;
도 6은 최근 비디오 코딩 표준에서의 디코더-측 스케일링 및 역 변환의 개략도를 도시한다;
도 7은 일 실시형태에 따르는 디코더-측 스케일링 및 역 변환의 개략도를 도시한다;
도 8은 일 실시형태에 따르는 블록-기반 인코딩을 위한 방법의 블록도를 도시한다; 그리고
도 9는 일 실시형태에 따르는 블록-기반 디코딩을 위한 방법의 블록도를 도시한다.

동일하거나 균등한 요소들 또는 동일하거나 균등한 기능성을 가지는 요소들은 이들이 다른 도면에 나오더라도 다음의 발명을 실시하기 위한 구체적인 내용에서 동일하거나 균등한 참조 번호에 의해서 표시된다.

후속하는 발명을 실시하기 위한 구체적인 내용에서, 본 발명의 실시형태들의 더 철저한 설명을 제공하기 위해서 복수 개의 세부사항들이 진술된다. 그러나, 본 발명의 실시형태들은 이러한 구체적인 세부내용들이 없이도 실시될 수 있다는 것이 당업자에게 명백하게 이해될 것이다. 다른 경우에, 잘 알려져 있는 구조체 및 디바이스는 본 발명의 실시형태들이 불명확해지게 하는 것을 피하기 위하여 자세하게 표시되는 것이 아니라 블록도 형태로 표시된다. 또한, 후술되는 상이한 실시형태들의 특징들은 특히 그렇지 않다고 언급되지 않는 한 서로 결합될 수 있다.

도면의 후속하는 설명은 본 발명의 실시형태들이 그 안에 구축될 수 있는 코딩 프레임워크에 대한 일 예를 형성하기 위하여, 비디오의 픽쳐를 코딩하기 위한 블록-기반 예측 코덱의 인코더 및 디코더의 설명을 제공하는 것으로부터 시작된다. 인코더 및 디코더 각각은 도 1a 내지 도 3을 참조하여 설명된다. 본 발명의 개념의 본 명세서에서 설명된 실시형태들은 비록 도 4 내지 도 7과 함께 설명된 실시형태들이 도 1a, 도 1b 및 도 2의 인코더 및 디코더에 내재된 코딩 프레임워크에 따라서 동작하지 않는 인코더 및 디코더를 형성하기 위해서 사용될 수 있더라도, 도 1a, 도 1b 및 도 2의 인코더 및 디코더 내에 빌트인될 수 있다.

도 1a는 픽쳐(12)를 예시적으로 변환-기반 잔차 코딩을 사용하여 데이터 스트림(14) 내에 예측적으로 코딩하기 위한 장치(예를 들어 비디오 인코더 및/또는 픽쳐 인코더)를 도시한다. 이러한 장치, 또는 인코더는 레퍼런스 부호 10을 사용하여 표시된다. 도 1b는 픽쳐(12)를 데이터 스트림(14) 내로 예측적으로 코딩하기 위한 장치를 더 도시하는데, 여기에서는 가능한 예측 모듈(44)이 더 상세하게 도시된다. 도 2는 대응하는 디코더(20), 즉, 역시 변환-기반 잔차 디코딩을 사용하여 데이터 스트림(14)으로부터 픽쳐(12')를 예측 디코딩하도록 구성되는 장치(20)를 도시하는데, 어퍼스트로피는 디코더(20)에 의해 재구성된 픽쳐(12')가 장치(10)에 의해 원래 인코딩된 픽쳐(12)로부터, 예측 잔차 신호의 양자화에 의해 도입된 코딩 손실의 관점에서 편차를 가진다는 것을 표시하기 위하여 사용되었다. 도 1a, 도 1b 및 도 2는 변환에 기반한 예측 잔차 코딩을 예시적으로 사용하지만, 본 출원의 실시형태들은 이러한 종류의 예측 잔차 코딩으로 한정되지 않는다. 이것은 도 1a, 도 1b 및 도 2에 관하여 설명되는, 지금부터 개략적으로 설명되는 바와 같은 다른 세부 내용에 대해서도 역시 사실이다.

인코더(10)는 예측 잔차 신호를 공간-스펙트럼 변환에 노출시키고, 그렇게 획득된 예측 잔차 신호를 데이터 스트림(14)으로 인코딩하도록 구성된다. 이와 유사하게, 디코더(20)는 데이터 스트림(14)으로부터 예측 잔차 신호를 디코딩하고, 그렇게 획득된 예측 잔차 신호를 스펙트럼-공간 변환에 노출시키도록 구성된다.

내부적으로, 인코더(10)는, 원본 신호, 즉 픽쳐(12)로부터의 예측 신호(26)의 편차를 측정하기 위하여 예측 잔차(24)를 생성하는 예측 잔차 신호 형성기(22)를 포함할 수 있는데, 여기에서 예측 신호(26)는 본 발명의 일 실시형태에 따르는 하나 이상의 예측기 블록들의 세트의 선형 조합이라고 해석될 수 있다. 예측 잔차 신호 형성기(22)는, 예를 들어 예측 신호를 원본 신호로부터, 즉, 픽쳐(12)로부터 감산하는 감산기일 수 있다. 그러면, 인코더(10)는, 예측 잔차 신호(24)를 공간-스펙트럼 변환에 노출시켜서 스펙트럼-도메인 예측 잔차 신호(24')를 획득하는 변환기(28)를 더 포함하고, 이러한 신호가 이제 역시 인코더(10)에 의해 포함된 양자화기(32)에 의한 양자화에 노출된다. 그러므로 양자화된 예측 잔차 신호(24'')가 비트스트림(14)으로 코딩된다. 이러한 목적을 위해서, 인코더(10)는, 변환되고 양자화된 바와 같은 예측 잔차 신호를 데이터 스트림(14)으로 엔트로피 코딩 하는 엔트로피 코더(34)를 선택적으로 포함한다.

예측 신호(26)는 데이터 스트림(14)으로 인코딩되고, 그로부터 디코딩될 수 있는 예측 잔차 신호(24'')에 기반하여, 인코더(10)의 예측 스테이지(36)에 의해 생성된다. 이러한 목적을 위해서, 예측 스테이지(36)는 내부적으로, 도 1에 도시된 바와 같이, 양자화 손실을 제외하고는 신호(24')에 대응하는 스펙트럼-도메인 예측 잔차 신호(24''')를 얻기 위해서 예측 잔차 신호(24'')를 양자화해제하는 양자화해제기(38), 및 후자의 예측 잔차 신호(24''')를 역변환, 즉, 스펙트럼-공간 변환에 노출시켜서 양자화 손실을 제외하고는 원본 예측 잔차 신호(24)에 대응하는 예측 잔차 신호(24'''')를 획득하는, 그 뒤에 오는 역변환기(40)를 포함할 수 있다. 그러면, 예측 스테이지(36)의 합성기(42)는, 재구성된 신호(46), 즉, 원본 신호(12)의 재구성본을 획득하기 위하여, 예측 신호(26) 및 예측 잔차 신호(24'''')를 재결합한다. 재구성된 신호(46)는 신호(12')에 대응할 수 있다. 그러면, 예측 스테이지(36)의 예측 모듈(44)은, 예를 들어 도 1b에서 더 상세히 도시되는 공간 예측, 즉, 인트라-픽쳐 예측, 및/또는 시간적 예측, 즉, 인터-픽쳐 예측을 사용함으로써 신호(46)에 기반하여 예측 신호(26)를 생성한다.

이와 유사하게, 도 2에 도시된 바와 같이, 디코더(20)는 예측 스테이지(36)에 대응하고 대응하는 방식으로 상호연결되는 컴포넌트들로 내부적으로 구성될 수 있다. 특히, 디코더(20)의 엔트로피 디코더(50)는 데이터 스트림으로부터 양자화된 스펙트럼-도메인 예측 잔차 신호(24'')를 엔트로피 디코딩하고, 여기에서, 예측 스테이지(36)의 모듈에 대해서 전술된 바와 같은 방식으로 상호연결되고 협력하는 양자화해제기(dequantizer; 52), 역변환기(inverse transformer; 54), 합성기(combiner; 56) 및 예측 모듈(58)이 예측 잔차 신호(24'')에 기반하여 재구성된 신호를 복원함으로써, 도 2에 도시된 바와 같이, 합성기(56)의 출력이 재구성된 신호, 즉 픽쳐(12')가 되게 한다.

비록 앞선 부분에서 특정되어 설명되지는 않았지만, 인코더(10)가, 예를 들어 예측 모드, 모션 파라미터 및 기타 등등을 포함하는 일부 코딩 파라미터를, 예를 들어 일부 레이트 및 편차와 관련된 기준, 즉, 코딩 비용을 최적화하는 방식과 같은 일부 최적화 기법에 따라서 설정할 수 있다는 것이 용이하게 분명해질 것이다. 예를 들어, 인코더(10) 및 디코더(20) 및 대응하는 모듈들(44, 58) 각각은 인트라-코딩 모드 및 인터-코딩 모드와 같은 상이한 예측 모드들을 지원할 수 있다. 인코더 및 디코더가 이러한 예측 모드 타입들 사이에서 스위칭하는 그래뉼래리티(granularity)는, 픽쳐(12 및 12') 각각을 코딩 세그멘트 또는 코딩 블록으로 하위분할하는 것에 대응할 수 있다. 이러한 코딩 세그멘트의 유닛들에서, 예를 들어 픽쳐는 인트라-코딩되고 있는 블록들과 인터-코딩되고 있는 블록들로 하위분할될 수 있다.

인트라-코딩된 블록은 더 상세하게 아래에서 후술되는 바와 같이 개별적인 블록(예를 들어, 현재 블록)의 공간적으로 이미 코딩된/디코딩된 이웃(예를 들어, 현재 템플릿)에 기반하여 예측된다. 방향성 또는 각도(angular) 인트라-코딩 모드를 포함하는 수 개의 인트라-코딩 모드들이 존재하고 개별적인 인트라-코딩된 세그멘트에 대해서 선택될 수 있는데, 이러한 코딩 모드에 따라서 개별적인 방향성 인트라-코딩 모드에 대해 특유한 특정 방향에 따른 이웃의 샘플 값을 외삽함으로써 채워져서 개별적인 인트라-코딩된 세그멘트가 되게 된다. 인트라-코딩 모드는, 예를 들어 DC 코딩 모드 및/또는 평면(planar) 인트라-코딩 모드와 같은 하나 이상의 추가적인 모드를 더 포함할 수 있는데, DC 코딩 모드에 따라서 개별적인 인트라-코딩된 블록의 예측은 개별적인 인트라-코딩된 세그멘트 내의 모든 샘플에 DC 값을 지정하고, 평면 인트라-코딩 모드에 따라서 개별적인 블록의 예측은 이웃하는 샘플에 기반하여 2-차원 선형 함수에 의해 규정되는 틸트 및 오프셋을 구동하면서, 개별적인 인트라-코딩된 블록의 샘플 위치에 걸친 2-차원 선형 함수에 의해 기술되는 샘플 값의 공간 분포가 되도록 근사화되거나 결정된다.

이것들에 비교하여, 인터-코딩된 블록은, 예를 들어 시간적으로 예측될 수 있다. 인터-코딩된 블록의 경우, 모션 벡터는 데이터 스트림(14) 내에서 시그널링될 수 있고, 모션 벡터는 픽쳐(12)가 속하는 비디오의 이전에 코딩된 픽쳐(예를 들어, 레퍼런스 픽쳐)의 부분의 공간적 변위를 표시하고, 여기에서 이전에 코딩된/디코딩된 픽쳐는 각각의 인터-코딩된 블록에 대한 예측 신호를 획득하기 위하여 샘플링된다. 이것은, 양자화된 스펙트럼-도메인 예측 잔차 신호(24'')를 나타내는 엔트로피-코딩된 변환 계수 레벨과 같이, 데이터 스트림(14)에 포함되는 잔차 신호 코딩에 추가하여, 데이터 스트림(14)이, 다양한 블록에 코딩 모드를 지정하기 위한 코딩 모드 파라미터, 블록들 중 일부에 대한 예측 파라미터, 예컨대 인터-코딩된 세그멘트에 대한 모션 파라미터, 및 픽쳐(12 및 12') 각각을 세그멘트로 하위분할하는 것을 제어하고 시그널링하기 위한 파라미터와 같은 선택적인 추가적인 파라미터를 그 안에 인코딩했을 수 있다. 디코더(20)는 이러한 파라미터를 사용하여 인코더가 수행한 것과 동일한 방식으로 픽쳐를 하위분할하여, 동일한 예측 모드를 세그멘트들에 지정하고, 동일한 예측을 수행하여 동일한 예측 신호를 얻는다.

도 3은 일면으로는 재구성 신호, 즉 재구성 픽쳐(12')와 다른 면으로는 데이터 스트림(14) 내에서 시그널링된 예측 잔차 신호(24'''') 및 예측 신호(26)의 조합 사이의 관계를 예시한다. 앞에서 이미 표시된 바와 같이, 합성은 합산일 수 있다. 예측 신호(26)는 도 3에서, 픽쳐 영역을 빗금을 사용하여 예시적으로 표시된 인트라-코딩된 블록, 및 예시적으로 빗금이 없이 표시된 인터-코딩된 블록으로 하위분할하는 것으로서 예시된다. 하위분할은 임의의 하위분할, 예컨대 픽쳐 구역을 사각형 블록 또는 비사각형 블록들의 행 및 열로 규칙적 하위분할하는 것, 또는 트리의 루트 블록으로부터의 픽쳐(12)를 변동하는 크기의 복수 개의 리프 블록들 내에 멀티-트리 하위분할하는 것, 예컨대 쿼드트리 하위분할 또는 기타 등등일 수 있는데, 여기에서 이들의 혼합이 픽쳐 구역이 우선 트리-루트 블록의 행 및 열로 하위분할되고, 그 후에 이것이 재귀적 멀티-트리 하위분할에 따라서 하나 이상의 리프 블록으로 추가적으로 하위분할되는 도 3에 예시된다.

다시 말하건대, 데이터 스트림(14)은 인트라-코딩된 블록(80)에 대한 인트라-코딩 모드를 그 안에 코딩하여 가지고 있을 수 있고, 이것이 수 개의 지원되는 인트라-코딩 모드 중 하나를 개별적인 인트라-코딩된 블록(80)에 지정한다. 인터-코딩된 블록(82)의 경우, 데이터 스트림(14)은 그 안에 코딩된 하나 이상의 모션 파라미터를 가질 수 있다. 일반적으로 말하자면, 인터-코딩된 블록(82)은 시간적으로 코딩되는 것으로 한정되지 않는다. 대안적으로, 인터-코딩된 블록(82)은 현재의 픽쳐(12) 자체를 넘어 이전에 코딩된 부분, 예컨대 픽쳐(12)가 속하는 비디오의 이전에 코딩된 픽쳐, 또는 인코더 및 디코더가 각각 스케일링될 수 있는 인코더 및 디코더인 경우에는 다른 장면 또는 계층적으로 더 낮은 층의 픽쳐로부터 예측된 임의의 블록일 수 있다.

도 3에서 예측 잔차 신호(24'''')는 픽쳐 영역을 블록(84)으로 하위분할하는 것으로 역시 예시된다. 이러한 블록은 코딩 블록(80 및 82)과 구별하기 위하여 변환 블록이라고 불릴 수 있다. 결과적으로, 도 3은, 인코더(10) 및 디코더(20)가 픽쳐(12) 및 픽쳐(12')를 블록들로 분할하는 두 개의 상이한 하위분할, 즉 하나의 하위분할은 코딩 블록(80 및 82) 각각으로 분할하고, 다른 하위분할은 변환 블록(84)으로 분할하는 하위분할을 사용할 수 있다는 것을 예시한다. 양자 모두의 하위분할은 동일할 수 있고, 즉, 각각의 코딩 블록(80 및 82)은 변환 블록(84)을 동시에 형성할 수 있지만, 도 3은, 예를 들어 변환 블록(84)으로의 하위분할이 코딩 블록(80, 82)으로의 하위분할의 확장을 형성함으로써, 블록(80 및 82) 중 두 개의 블록들 사이의 임의의 경계가 두 개의 블록들(84) 사이의 경계에 오버레이하도록 하는 경우, 또는 다르게 말하자면 각각의 블록(80, 82)이 변환 블록(84) 중 하나와 일치하거나 변환 블록들(84)의 클러스터와 일치하는 경우를 예시한다. 그러나, 하위분할은, 변환 블록(84)이 대안적으로 블록들(80, 82) 사이의 블록 경계와 교차할 수 있도록, 서로로부터 독립적으로 결정되거나 선택될 수도 있다. 변환 블록(84)으로의 하위분할에 관하여, 따라서 블록(80, 82)으로의 하위분할에 대하여 성립되는 것들과 같은 유사한 진술이 성립하는데, 즉, 블록(84)은 픽쳐 영역을 블록으로 정규 하위분할한 결과일 수 있고(행 및 열로 정렬될 수도 있고 그렇지 않을 수도 있음), 픽쳐 영역의 재귀적 멀티-트리 하위분할의 결과일 수도 있으며, 또는 이들의 조합이거나 임의의 다른 종류의 블록화(blockation)일 수도 있다. 덧붙여 말하자면, 블록들(80, 82 및 84)은 정방형, 사각형 또는 임의의 다른 형상인 것으로 한정되지 않는다.

도 3은 예측 신호(26) 및 예측 잔차 신호(24'''')를 합성하면 재구성된 신호(12')가 직접적으로 얻어진다는 것을 추가적으로 예시한다. 그러나, 두 개 이상의 예측 신호들(26)이 예측 잔차 신호(24'''')와 합성되어 대안적인 실시형태에 따른 픽쳐(12')가 될 수 있다는 것에 주의해야 한다.

도 3에서, 변환 블록(84)은 다음의 중요도를 가질 것이다. 변환기(28) 및 역변환기(54)는 그들의 변환을 이러한 변환 블록(84)의 유닛에서 수행한다. 예를 들어, 많은 코덱은 모든 변환 블록(84)에 대하여 일부 종류의 DST(이산 정현 변환) 또는 DCT(이산 여현 변환)를 사용한다. 일부 코덱은 변환을 스킵함으로써, 변환 블록(84) 중 일부에 대하여 예측 잔차 신호가 공간 도메인에서 직접적으로 코딩되게 할 수 있다. 그러나, 아래에 설명되는 실시형태에 따르면, 인코더(10) 및 디코더(20)는 그들이 수 개의 변환을 지원하는 방식으로 구성된다. 예를 들어, 인코더(10) 및 디코더(20)에 의해 지원되는 변환은 다음을 포함할 수 있다:

● DCT-II(또는 DCT-III), 여기에서 DCT는 이산 여현 변환을 나타냄

● DST-IV, 여기에서 DST는 이산 정현 변환을 나타냄

● DCT-IV

● DST-VII

● 항등 변환(Identity Transformation; IT)

자연적으로, 변환기(28)는 이러한 변환들의 순방향 변환 버전들 모두를 지원할 것이지만, 디코더(20) 또는 역변환기(54)는 이것의 대응하는 역방향 또는 반전 버전을 지원할 것이다:

● 역 DCT-II(또는 역 DCT-III)

● 역 DST-IV

● 역 DCT-IV

● 역 DST-VII

● 항등 변환(IT)

후속하는 설명은 변환이 인코더(10) 및 디코더(20)에 의해 지원될 수 있는 것에 대한 추가적인 세부 내용을 제공한다. 어떠한 경우에서도, 지원되는 변환들의 세트는 하나의 스펙트럼-공간 또는 공간-스펙트럼 변환과 같은 하나의 변환만을 포함할 수 있지만, 인코더 또는 디코더에 의해서 모든 블록 또는 단일 블록(80, 82, 84)에 대하여 변환이 사용되지 않는 것도 가능하다는 것에 주의해야 한다.

앞서 개략적으로 설명된 바와 같이, 도 1a 내지 도 2는 일 예로서 제공되었고, 여기에서 본 명세서에서 설명되는 본 발명의 개념이 본 발명에 따른 인코더 및 디코더에 대한 특정한 예를 형성하기 위해서 구현될 수 있다. 지금까지, 도 1a, 도 1b 및 도 2의 인코더 및 디코더는 본 명세서에서 전술된 인코더 및 디코더의 가능한 구현형태들을 나타낼 수 있다. 그러나, 도 1a, 도 1b 및 도 2는 예들에 불과하다. 하지만, 본 출원의 실시형태에 따른 인코더는 앞서 더 상세히 설명되거나 후술되는 개념을 사용하여 픽쳐(12)의 블록-기반 인코딩을 수행할 수 있고, 예를 들어 블록(80)으로의 하위-분할이 도 3에 예시된 것과 다른 방식으로 수행된다는 점 및/또는 변환(예를 들어 변환 스킵/항등 변환)이 모든 블록 또는 단일 블록에 대해서 사용되지 않는다는 점과 같은 측면에서 도 1a 또는 도 1b의 인코더와 다르다. 이와 유사하게, 본 출원의 실시형태에 따른 디코더는 더 상세히 후술되는 코딩 개념을 사용하여 데이터 스트림(14)으로부터의 픽쳐(12')의 블록-기반 디코딩을 수행할 수 있지만, 예를 들어 이것이 픽쳐(12')를 도 3에서 설명된 방식과 다른 방식으로 블록으로 하위-분할한다는 점 및/또는 예를 들어 이것이 변환 도메인에서 데이터 스트림(14)으로부터 예측 잔차를 유도하지 않고, 공간적 도메인에서 유도한다는 점 및/또는 이것이 모든 블록 또는 단일 블록에 대해서 임의의 변환을 사용하지 않는다는 점에서, 도 2의 디코더(20)와 다를 수 있다.

일 실시형태에 따르면 전술된 본 발명의 개념은 인코더의 양자화기(32) 또는 디코더의 양자화해제기(38, 52)에서 구현될 수 있다. 따라서 일 실시형태에 따르면, 양자화기(32) 및/또는 양자화해제기(38, 52)는 변환기(28)에 의해 적용되거나 역변환기(54)에 의해 적용될 선택된 변환에 의존하여, 양자화될 블록에 상이한 스케일링을 적용하도록 구성될 수 있다. 따라서, 양자화기(32) 및/또는 양자화해제기(38, 52)는 모든 변환 모드(즉 변환 타입)에 대하여 하나의 미리 정의된 스케일링을 사용하는 것뿐만 니라 각각의 선택된 변환 모드에 대하여 상이한 스케일링을 사용하도록 구성된다.

최신식 하이브리드 비디오 코딩 기술은 채용된 변환 및 블록 크기로부터 독립적으로 역 양자화를 위하여 동일한 스케일링 인자를 채용한다. 본 발명은 선택된 변환 및 블록 크기에 의존하여 상이한 스케일링 인자를 사용할 수 있게 한다. 인코더의 관점에서 볼 때, 양자화 스텝 크기는 선택된 변환 및 변환 블록 크기에 의존하여 달라진다. 변환 타입 및 변환 블록 크기에 의존하여 상이한 양자화 스텝 크기를 조합함으로써, 인코더는 더 높은 압축 효율을 달성할 수 있다.

도 4는 변환 코딩을 사용한 픽쳐 신호의 블록-기반 인코딩을 위한 인코더(10)를 도시한다. 입력 픽쳐(12)의 예측 잔차(24)의 미리 결정된 블록(18)은 인코더(10)에 의해 실행된다.

인코더(10)는 선택된 변환 모드(130)를 미리 결정된 블록(18)에 대하여 선택하도록 구성된다. 예를 들어, 선택된 변환 모드(130)는 미리 결정된 블록(18)의 콘텐츠에 기반하여 또는 입력 픽쳐(12)의 예측 잔차(24)의 콘텐츠에 기반하여 또는 기반하여 입력 픽쳐(12)의 콘텐츠에 기반하여 선택된다. 인코더는 변환 모드(128) 중에서 선택된 변환 모드(130)를 선택할 수 있는데, 이것은 비-항등 변환(128₁) 및 항등 변환(128₂)으로 나누어질 수 있다.

일 실시형태에 따르면, 비-항등 변환(128₁)은 DCT-II, DCT-III, DCT-IV, DST-IV 및/또는 DST-VII 변환을 포함한다.

추가적으로, 인코더(10)는 미리 결정된 블록(18)과 연관된 양자화될 블록(18')을 선택된 변환 모드(130)에 따라서, 선택된 변환 모드(130)에 의존하는 양자화 정확도(140)를 사용하여 양자화함으로써 양자화된 블록(18'')을 획득하도록 구성된다.

일 실시형태에 따르면, 양자화기(32)에 의해 양자화될 블록(18')은 미리 결정된 블록(18)에 적용되는 하나 이상의 처리 단계에 의하여 인코더에 의해 획득될 수 있는데, 여기에서 인코더(10)는 선택된 변환 모드(130)를 단계들 중 하나의 단계에서 사용하도록 구성될 수 있다. 양자화될 블록(18')은, 예를 들어 미리 결정된 블록(18)의 처리된 버전이다. 예를 들어, 양자화될 블록(18')은 선택된 변환 모드(130)를 미리 결정된 블록(18)에 적용함으로써 획득되는데, 여기에서 항등 변환은 변환 스킵에 대응할 수 있다.

양자화될 블록(18')은 특정 양자화 정확도(140)를 가지고 양자화된다. 양자화 정확도(140)는 미리 결정된 블록(18)에 대해서 선택되는 선택된 변환 모드(130)에 기반하여 결정될 수 있고, 이러한 미리 결정된 블록(18)은 양자화될 블록(18')과 연관된다. 양자화 정확도(140)가 최적화되면, 양자화로부터 초래되는 왜곡이 감소될 수 있다. 동일한 양자화 정확도가 상이한 변환 모드(128)에 대해서 상이한 양의 왜곡을 초래할 수 있다. 따라서, 개별적인 양자화 정확도들(140)을 상이한 변환 모드들(128)과 연관시키는 것이 유리하다.

예를 들어, 인코더(10)는 양자화 정확도(140)를 규정하는 양자화 파라미터를 양자화될 블록(18')에 대해서 결정하도록 구성된다. 양자화 정확도(140)는, 예를 들어 양자화 파라미터(quantization parameter; QP), 스케일링 인자 및/또는 양자화 스텝 크기에 의하여 규정된다.

블록(18')을 개별적인 양자화 정확도(140)로 양자화함으로써 초래되는 양자화된 블록(18'')은 인코더(10)의 엔트로피 인코더(34)에 의해서 데이터 스트림(14) 내에 엔트로피 인코딩된다.

선택적으로, 인코더(10)는 이와 유사하게 또는 도 7에 대해서 설명된 바와 같은 추가적인 피쳐를 포함할 수 있다.

도 5는 인코딩된 픽쳐 신호를 변환 디코딩을 사용하여 블록-기반 디코딩하기 위한 디코더(20)를 도시한다. 디코더(20)는 데이터 스트림(14)으로부터 출력 픽쳐를 재구성하도록 구성될 수 있는데, 여기에서 미리 결정된 블록(118)은 출력 픽쳐의 예측 잔차의 블록을 나타낼 수 있다.

디코더(20)는 미리 결정된 블록(118)에 대하여, 선택된 변환 모드(130)를 선택하도록 구성된다. 예를 들어, 선택된 변환 모드(130)는 데이터 스트림(14) 내에서의 시그널링에 기반하여 선택된다. 디코더는 변환 모드(128) 중에서 선택된 변환 모드(130)를 선택할 수 있는데, 이것은 비-항등 변환(128₁) 및 항등 변환(128₂)으로 나누어질 수 있다.

비-항등 변환(128₁)은 인코더에 의해 적용되는 변환의 역변환/역방향 변환을 나타낼 수 있다. 일 실시형태에 따르면, 비-항등 변환(128₁)은 역 DCT-II, 역 DCT-III, 역 DCT-IV, 역 DST-IV 및/또는 역 DST-VII 변환을 포함한다.

추가적으로, 디코더(20)는 미리 결정된 블록(118)과 연관된 양자화해제될 블록(118')을 선택된 변환 모드(130)에 따라서 엔트로피 디코더(50)에 의하여 데이터 스트림(14)으로부터 엔트로피 디코딩하도록 구성된다. 일 실시형태에 따르면, 양자화해제될 블록(118')은 디코더(20)에 의해 실행되는 하나 이상의 처리 단계에 의하여 처리되어 미리 결정된 블록(118)이 결과적으로 얻어질 수 있는데, 여기에서 디코더(20)는 선택된 변환 모드(130)를 단계들 중 하나의 단계에서 사용하도록 구성될 수 있다. 예를 들어, 미리 결정된 블록(118)은 양자화해제될 블록(118')의 처리된 버전이다. 양자화될 블록(118')은, 예를 들어 선택된 변환 모드(130)의 대상이 되기 이전의 미리 결정된 블록(118)이다. 도 5에 도시된 바와 같이, 선택적으로 디코더(20)는 미리 결정된 블록(118)을 선택된 변환 모드(130)를 사용하여 획득하기 위해서 역변환기(54)를 사용하도록 구성된다.

추가적으로, 디코더(20)는 양자화해제될 블록(118')을 선택된 변환 모드(130)에 의존하는 양자화 정확도(140)를 사용하여 양자화해제기(52)에 의하여 양자화해제함으로써, 양자화해제된 블록(118'')을 획득하도록 구성된다.

양자화해제될 블록(118')은 특정 양자화 정확도(140)를 사용하여 양자화해제된다. 양자화 정확도(140)는, 미리 결정된 블록(118)에 대해서 선택되는 선택된 변환 모드(130)에 기반하여 결정될 수 있는데, 이러한 미리 결정된 블록(118)은 양자화해제될 블록(118')과 연관된다. 양자화 정확도(140)가 최적화되면, 양자화로부터 초래되는 왜곡이 감소될 수 있다. 동일한 양자화 정확도가 상이한 변환 모드(128)에 대해서 상이한 양의 왜곡을 초래할 수 있다. 따라서, 개별적인 양자화 정확도들(140)을 상이한 변환 모드들(128)과 연관시키는 것이 유리하다.

예를 들어, 디코더(20)는 양자화 정확도(140)를 규정하는 양자화해제 파라미터를 양자화해제될 블록(118')에 대해서 결정하도록 구성된다. 양자화 정확도(140)는, 예를 들어 양자화 파라미터(quantization parameter; QP), 스케일링 인자 및/또는 양자화 스텝 크기에 의하여 규정된다.

선택적인 변환기(54)는 양자화해제된 블록(118'')을 선택된 변환 모드(130)를 사용하여 변환하여 미리 결정된 블록(118)을 획득하도록 구성될 수 있다.

본 발명은 양자화 스텝 크기, 즉 양자화 정확도를 선택된 변환 및 변환 블록 크기에 의존하여 변경하는 것을 가능하게 한다. 후속하는 설명은 디코더 관점으로 기록되고, 양자화 스텝 크기를 가지고 수행되는 디코더-측 스케일링(52)(승산)은 스텝 크기에 의한 인코더-측 나누기의 역(비-가역적)으로 볼 수 있다.

디코더 측에서, H.265/HEVC와 같은 현재의 비디오 코딩 표준에서의 (양자화된) 변환 계수 레벨의 스케일링(52), 즉 양자화해제는 도 6에 도시된 바와 같이 더 높은 정밀도를 가지는 DCT/DST 정수 변환으로부터 결과적으로 얻어지는 변환 계수에 대해서 설계된다. 여기에서, 변수 bitDepth는 이미지 샘플의 비트 깊이, 예를 들어 8 또는 10-비트를 규정한다. 변수 log2TbW 및 log2TbH는 변환 블록 폭 및 높이 각각의 이진 대수(binary logarithm)를 규정한다. 도 6은 H.265/HEVC와 같은 최근 비디오 코딩 표준에서의 디코더-측 스케일링(52) 및 역변환(54)을 보여준다.

디코더에서, 두 개의 1D DCT/DST-기반 정수 변환(128₁)이

의 추가적인 인자를 도입하는데, 이것은 역의 스케일링에 의해서 보상될 필요가 있다. 기수 log2TbH + log2TbW를 가지는 비-정방형 블록의 경우, 스케일링은

의 인자를 포함한다. 이것은, 181/256의 스케일 인자를 가산하거나, 이러한 경우에 해당 인자를 포함하는 levelScale 값들의 상이한 세트, 예를 들어

를 사용하여 고려될 수 있다. 항등 변환 또는 변환 스킵 케이스(128₂)의 경우, 이것은 적용되지 않는다.

스텝 크기 또는 스케일링 인자(

)가 4 미만의 QP에 대해서 1보다 작아진다는 것을 알 수 있는데, 그 이유는 이러한 QP에 대한 levelScale이 64=2⁶보다 작기 때문이다. 변환 계수의 경우, 정수 순방향 변환(128₁)이 잔차 신호의 정밀도 및 결과적으로 동적 범위를 증가시키기 때문에 이것은 문제가 되지 않는다. 그러나, 항등 변환 또는 변환 스킵(128₂)의 경우의 잔차 신호에 대해서는, 동적 범위에서의 증가가 없다. 이러한 경우에, 스케일링 인자가 1보다 작으면 4 미만인 QP에 대하여 왜곡을 도입할 수 있고, 이것은 1의 스케일링 인자를 가지는 QP 4에 대해서는 존재하지 않는다. 이것은 QP를 감소시키는 것이 왜곡을 감소시킬 것이라는 양자화기 디자인 의도와 상충된다.

선택된 변환, 예를 들어 변환이 스킵되거나 그렇지 않은지 여부에 의존하여 양자화 스텝 크기를 변경하는 것은, 변환 스킵(128₂)에 대한 상이한 양자화 스텝 크기를 유도하기 위하여 사용될 수 있다. 특히, 가장 낮은 QP들인 0,1,2 및 3의 경우, 이것은 최저 QP들에 대해서 1 미만의 양자화 스텝 크기 / 스케일링 인자를 가지는 문제점을 해결할 수 있다. 도 7에 도시되는 일 실시형태에서, 이러한 솔루션은 양자화 파라미터를 4의 최소 허용된 값(QP')로 클리핑하여(53), 결과적으로 1보다 작을 수 없는 양자화 스텝 크기를 얻는 것일 수 있다. 이것에 추가하여, 변환에 의해서 요구되는, bdShift1(54₁)을 사용한 크기-의존적 정규화 및 bdShift2를 사용한 비트 깊이로의 최종 반올림(54₂)이 변환 경로(54)로 이동될 수 있다. 그러면 변환 스킵 스케일링이 반올림이 있는 10-비트 만큼의 다운시프트로 감소될 것이다. 다른 실시형태에서, 인코더가 QP 값을 4로 클리핑하는 대신에 변환 스킵에 대하여 1 미만의 스케일링 인자가 얻어지게 하는 QP 값을 인코더가 사용하도록 허용하지 않는 비트스트림 제약이 규정될 수 있다. 도 7은 본 발명에 따른 개선된 디코더-측 스케일링(52) 및 역변환(54)을 보여준다.

비트레이트 범위의 다른 끝에서, 즉 하부 비트레이트의 경우, 항등 변환(128₂)에 대한 양자화 스텝 크기는 오프셋만큼 감소되어, 결과적으로 변환을 적용하지 않거나 항등 변환(128₂)을 적용하는 블록에 대하여 더 높은 충실도가 얻어지게 할 수 있다. 그러면 인코더가 변환 스킵 블록에 대하여 적절한 QP 값을 선택하여 더 높은 압축 효율을 달성하게 될 것이다. 이러한 양태는 항등 변환 / 변환 스킵(128₂)으로 한정되지 않고, 이것은 다른 변환 타입(128₁)을 오프셋에 의하여 수정하기 위해서 사용될 수도 있다. 예를 들어, 인코더는 이러한 오프셋을, 예를 들어 지각되는 시각적 품질을 최대화하거나 주어진 비트레이트에 대하여 제곱 오차와 같은 객관적인 왜곡을 최소화하거나, 또는 주어진 품질/왜곡에 대하여 비트레이트를 감소시킴으로써 코딩 효율을 증가시키는 방식으로 결정할 것이다. 슬라이스 QP 로부터의 이러한(적용된 기준의 관점에서의) 최적의 유도는, 예를 들어 콘텐츠, 비트레이트 또는 복잡도 동작 포인트(complexity operation point), 및 선택된 변환 및 변환 블록 크기와 같은 추가적인 인자에 의존한다. 본 발명은 다수의 변환들의 경우에 대하여 QP 오프셋을 시그널링하기 위한 방법을 기술한다. 범용성을 잃지 않으면서, 두 가지 대안적인 변환이 주어지면, 고정된 QP 오프셋이 두 번의 대안적인 변환들 각각에 대하여 인코더에 의해서 고레벨 신택스 구조체(예컨대 시퀀스 파라미터 세트, 픽쳐 파라미터 세트, 타일 그룹 헤더, 슬라이스 헤더 등)에서 송신될 수 있다. 또는, 인코더가 대안적인 변환을 선택했다면 QP 오프셋은, 예를 들어 각각의 변환 블록에 대해서 인코더에 의해 송신된다. 두 번의 접근법들을 조합한 것이, 기저 QP 오프셋(basis QP offset)을 고레벨 신택스 구조체에서 시그널링하고 대안적인 변환을 사용하는 각각의 변환 블록에 대한 추가적인 오프셋을 시그널링하는 것이다. 오프셋은 기저 QP 또는 오프셋 값들의 세트 내의 인덱스에 가산되거나 감산되는 값일 수 있다. 이러한 세트는 미리 규정되거나 고레벨 신택스 구조체에서 시그널링될 수 있다.

● 본 발명의 바람직한 실시형태에서, 항등 변환에 대한 기저 QP에 상대적인 QP 오프셋은, 예를 들어 시퀀스, 픽쳐, 타일 그룹, 타일, 또는 슬라이스 레벨에서 고레벨 신택스 구조체 내에서 시그널링된다.

● 본 발명의 다른 바람직한 실시형태에서, 항등 변환에 대한 기저 QP에 상대적인 QP 오프셋은 각각의 코딩 유닛 또는 코딩 유닛들의 미리 규정된 세트에 대해서 시그널링된다.

● 본 발명의 다른 바람직한 실시형태에서, 항등 변환에 대한 기저 QP에 상대적인 QP 오프셋은 항등 변환을 적용하는 각각의 변환 유닛에 대해서 시그널링된다.

본 발명의 다른 양태는 상이한 변환 타입, 예를 들어 항등 변환 / 변환 스킵에 대해서 상이한 스케일링 매트릭스들을 사용하는 것이다. 스케일링 매트릭스들은 모든 변환 계수를 상이하게 스케일링할 수 있게 한다. 이것은 주파수-의존적 가중화로서 해석될 수 있는데, 그 이유는 변환 계수가 통상적으로 잔차 신호의 상이한 공간 주파수에 관련되기 때문이다. 상이한 변환 타입들로부터 결과적으로 얻어지는 계수들의 분포가 다를 수 있기 때문에, 상이한 변환 타입에 대해서 상이한 스케일링 매트릭스들을 사용하는 것이 제안된다. 이것의 특별한 경우는 항등 변환이고, 여기에서 계수들은 공간 주파수에 관련되지 않은 잔차 샘플과 같다. 그러한 경우에, 주파수-가중된 스케일링은 유용하지 않고, 별개의 공간적으로-가중된 스케일링 매트릭스들이 적용되거나 매트릭스-기반 스케일링이 적용되지 않을 수 있다.

더욱이, 도 8 및 도 9는 전술된 인코더 및/또는 디코더에 관하여 설명된 원리에 기반한 방법을 보여준다.

도 8은, 선택된 변환 모드, 예를 들어 항등 변환 또는 비-항등 변환을 미리 결정된 블록에 대하여 선택하는 단계(810)를 포함하는, 변환 코딩을 사용한 픽쳐 신호의 블록-기반 인코딩을 위한 방법(800)을 도시하는데, 여기에서 항등 변환은 변환 스킵이라고 이해될 수 있다. 추가적으로, 이러한 방법(800)은 양자화될 블록, 예를 들어 미리 결정된 블록과 연관된 선택된 변환 모드의 대상이 되는 미리 결정된 블록을 선택된 변환 모드에 따라서, 예를 들어 양자화 파라미터(QP), 스케일링 인자 및/또는 양자화 스텝 크기에 의해 규정되는 양자화 정확도를 사용하여 양자화함으로써 양자화된 블록을 획득하는 단계(820)를 포함하는데, 이러한 양자화 정확도는 선택된 변환 모드에 의존한다. 양자화될 블록은, 선택된 변환 모드가 비-항등 변환인 경우에는 선택된 변환 모드에 내재된 변환을 미리 결정된 블록에 적용함으로써 획득되고, 선택된 변환 모드가 항등 변환인 경우에는 미리 결정된 블록을 등화함으로써 획득될 수 있다. 양자화(820)는 블록의 값을 양자화 파라미터(QP), 스케일링 인자 및/또는 양자화된 블록을 수용하기 위한 양자화 스텝 크기에 의해서 나눔으로써 수행될 수 있다. 추가적으로, 방법(800)은 양자화된 블록을 데이터 스트림 내에 엔트로피 인코딩하는 단계(830)를 포함한다.

도 9는 변환 디코딩을 사용한 인코딩된 픽쳐 신호의 블록-기반 디코딩을 위한 방법(900)을 도시하는데, 이러한 방법은 미리 결정된 블록, 예를 들어 디코딩된 잔차 픽쳐 신호 또는 잔차 비디오 신호 내의 이웃하는 잔차 블록의 구역 내의 잔차 블록에 대하여, 선택된 변환 모드, 예를 들어 항등 변환 또는 비-항등 변환을 선택하는 단계(910)를 포함한다. 항등 변환은 변환 스킵이라고 이해될 수 있고, 비-항등 변환은 인코더에 의해서 적용되거나 인코딩 방법에 의해서 사용되는 변환의 역변환/역방향 변환일 수 있다. 추가적으로, 방법(900)은 양자화해제될 블록, 예를 들어 선택된 변환 모드의 대상이 되기 이전의 미리 결정된 블록을 데이터 스트림으로부터 엔트로피 디코딩하는 단계(920)를 포함하는데, 이러한 양자화해제될 블록은 선택된 변환 모드에 따르는 미리 결정된 블록과 연관된다. 더욱이, 방법(900)은 양자화해제될 블록을 선택된 변환 모드에 의존하는 양자화 정확도를 사용하여 양자화해제함으로써 양자화해제된 블록을 획득하는 단계(930)를 포함한다. 양자화 정확도는 양자화해제될 블록의 양자화해제의 정확도를 규정할 수 있다(930). 양자화 정확도는, 예를 들어 양자화 파라미터(quantization parameter; QP), 스케일링 인자 및/또는 양자화 스텝 크기에 의하여 규정된다. 양자화해제(930)는, 예를 들어 블록의 값을 양자화 파라미터(QP), 스케일링 인자 및/또는 양자화해제된 블록을 수용하기 위한 양자화 스텝 크기로 승산함으로써 수행된다.

구현형태의 대안들:

비록 몇 가지 양태들이 장치의 콘텍스트에서 설명되었지만, 이러한 양태들이 대응하는 방법의 설명을 역시 나타낸다는 것이 명백한데, 여기에서 블록 또는 디바이스는 방법 단계 또는 방법 단계의 특징에 대응한다. 이와 유사하게, 방법의 콘텍스트에서 설명된 양태들도 역시 대응하는 장치의 대응하는 블록 또는 아이템 또는 특징의 설명을 역시 나타낸다. 방법 단계 중 일부 또는 전부는, 예를 들어 마이크로프로세서, 프로그램가능 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해서(또는 이것을 사용하여) 실행될 수 있다. 일부 실시형태들에서, 가장 중요한 방법 단계 중 일부 또는 여러 가지는 이러한 장치에 의하여 수행될 수 있다.

특정한 구현형태의 요구 사항에 의존하여, 본 발명의 실시형태들은 하드웨어로 또는 소프트웨어로 구현될 수 있다. 구현형태는 저장된 전자적으로 판독가능한 제어 신호를 가지는 디지털 저장 매체, 예를 들어 플로피 디스크, DVD, 블루-레이, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리를 사용하여 수행될 수 있는데, 이것은 각각의 방법이 수행되도록 프로그래밍가능한 컴퓨터 시스템과 상호동작한다(또는 상호 동작할 수 있다). 그러므로, 디지털 저장 매체는 컴퓨터에 의해 판독될 수 있다.

본 발명에 따르는 몇 가지 실시형태는 전자적으로 판독가능한 제어 신호를 가지는 데이터 캐리어를 포함하는데, 이것은 프로그래밍가능한 컴퓨터 시스템과 함께 상호 동작하여 본 명세서에서 설명되는 방법들 중 하나가 수행되게 할 수 있다.

일반적으로, 본 발명의 실시형태들은 프로그램 코드가 있는 컴퓨터 프로그램 제품으로서 구현될 수 있고, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때 방법들 중 하나를 수행하도록 동작한다. 프로그램 코드는, 예를 들어 머신 판독가능 캐리어에 저장될 수도 있다.

다른 실시형태들은 본 명세서에서 설명되는 방법들 중 하나를 수행하기 위하여 머신 판독가능 캐리어에 저장되는 컴퓨터 프로그램을 포함한다.

다르게 말하면, 그러므로, 본 발명의 방법의 일 실시형태는 컴퓨터 프로그램이 컴퓨터에서 실행될 때에 본 명세서에서 설명되는 방법들 중 하나를 수행하기 위한 프로그램 코드를 가지는 컴퓨터 프로그램이다.

그러므로, 본 발명의 방법의 다른 실시형태는 본 명세서에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 그 위에 기록되는 데이터 캐리어(또는 디지털 저장 매체, 또는 컴퓨터-판독가능 매체)이다. 데이터 캐리어, 디지털 저장 매체 또는 기록 매체는 통상적으로 유형적이고 및/또는 일시적이지 않다.

그러므로, 본 발명의 방법의 다른 실시형태는 본 명세서에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호의 시퀀스이다. 데이터 스트림 또는 신호의 시퀀스는, 예를 들어 데이터 통신 접속을 통하여, 예를 들어 인터넷을 통하여 전송되도록 구성될 수도 있다.

다른 실시형태는, 본 명세서에서 설명되는 중 방법들 중 하나를 수행하도록 구성되거나 적응되는, 처리 수단, 예를 들어 컴퓨터, 또는 프로그래밍가능한 로직 디바이스를 포함한다.

다른 실시형태는 본 명세서에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 그 위에 설치한 컴퓨터를 포함한다.

본 발명에 따른 추가적인 실시형태들은, 본 명세서에서 설명되는 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 수신기로 전송하도록 구성되는(예를 들어, 전자적으로 또는 광학적으로) 장치 또는 시스템을 포함한다. 수신기는, 예를 들어 컴퓨터, 모바일 디바이스, 메모리 디바이스 또는 기타 등등일 수 있다. 이러한 장치 또는 시스템은, 예를 들어 컴퓨터 프로그램을 수신기에 전달하기 위한 파일 서버를 포함할 수 있다.

몇 가지 실시형태들에서, 프로그래밍가능한 로직 디바이스(예를 들어 필드 프로그램가능 게이트 어레이)가 본 명세서에서 설명되는 방법의 기능성 중 일부 또는 전부를 수행하도록 사용될 수도 있다. 몇 가지 실시형태들에서, 필드 프로그램가능 게이트 어레이는 본 명세서에서 설명되는 방법들 중 하나를 수행하기 위하여 마이크로프로세서와 함께 상호동작할 수도 있다. 일반적으로, 이러한 방법은 임의의 하드웨어 장치에 의하여 수행되는 것이 바람직하다.

본 명세서에서 설명되는 장치는 하드웨어 장치를 사용하여, 또는 컴퓨터를 사용하여, 또는 하드웨어 장치 및 컴퓨터의 조합을 사용하여 구현될 수 있다.

본 명세서에서 설명되는 장치, 또는 본 명세서에서 설명되는 장치의 임의의 컴포넌트들은 적어도 부분적으로 하드웨어 및/또는 소프트웨어로 구현될 수 있다.

본 명세서에서 설명되는 방법은 하드웨어 장치를 사용하여, 또는 컴퓨터를 사용하여, 또는 하드웨어 장치 및 컴퓨터의 조합을 사용하여 수행될 수 있다.

본 명세서에서 설명되는 방법, 또는 본 명세서에서 설명되는 장치의 임의의 컴포넌트들은 적어도 부분적으로 하드웨어에 의하여 및/또는 소프트웨어에 의하여 수행될 수 있다.

위에서 설명된 실시형태는 본 발명의 원리에 대한 예시일 뿐이다. 본 명세서에서 설명되는 배치구성 및 세부 사항의 변경 및 변형이 당업자에게는 명백하게 이해될 것이라는 것이 이해된다. 그러므로, 출원 중인 청구항의 범위에 의해서만 제한되고 본 명세서의 실시형태를 기술하고 설명하는 것에 의하여 제시되는 구체적인 세부사항에 의해서 제한되는 것은 의도되지 않는다.

Claims

변환 코딩을 사용하는 픽쳐 신호의 블록-기반 인코딩을 위한 인코더(10)로서,
미리 결정된 블록(18)에 대하여, 선택된 변환 모드(130)를 선택하고,
상기 미리 결정된 블록(18)과 연관된 양자화될 블록(18')을 선택된 변환 모드(130)에 따라서, 선택된 변환 모드(130)에 의존하는 양자화 정확도(140)를 사용하여 양자화(32)하여 양자화된 블록(18")을 획득하며,
상기 양자화된 블록(18")을 데이터 스트림(14) 내에 엔트로피 인코딩하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 1 항에 있어서,
상기 양자화 정확도(140)는 선택된 변환 모드(130)가 항등 변환(128₂) 또는 비-항등 변환(128₁)인지 여부에 의존하는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 2 항에 있어서,
상기 인코더(10)는,
선택된 변환 모드(130)가 항등 변환(128₂)이면, 상기 미리 결정된 블록(18)에 대한 초기 양자화 정확도를 결정하고, 상기 초기 양자화 정확도가 미리 결정된 임계보다 정밀한지 여부를 점검하고,
상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 정밀한 경우, 상기 양자화 정확도(140)를 디폴트 양자화 정확도(140)로 설정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 3 항에 있어서,
상기 인코더(10)는,
상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 정밀하지 않은 경우, 상기 초기 양자화 정확도를 상기 양자화 정확도(140)로서 사용하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 3 항 또는 제 4 항에 있어서,
상기 인코더(10)는,
양자화 파라미터 목록으로부터 인덱스를 결정함으로써 상기 초기 양자화 정확도를 결정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 5 항에 있어서,
상기 인덱스는 상기 양자화 파라미터 목록 내의 양자화 파라미터를 가리키고, 상기 양자화 파라미터 목록 내의 모든 양자화 파라미터에 대해서 동일한 함수를 통하여 양자화 스텝 크기와 연관되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 5 항 또는 제 6 항에 있어서,
상기 인코더(10)는,
상기 인덱스가 미리 결정된 인덱스 값보다 작은지 여부를 점검함으로써, 상기 초기 양자화 정확도가 상기 미리 결정된 임계 보다 정밀한지 여부를 점검하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 3 항 내지 제 7 항 중 어느 한 항에 있어서,
상기 양자화될 블록(18')을 양자화(32)하는 것은, 정수 양자화(integer quantization)가 뒤따르는 스케일링을 포함하고,
상기 인코더(10)는,
상기 미리 결정된 임계 및/또는 상기 디폴트 양자화 정확도(140)가 1의 스케일링 인자에 관련되도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 3 항 내지 제 8 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
미리 결정된 블록(18)을 포함하는 여러 블록, 예컨대 미리 결정된 블록(18)을 포함하는 전체 픽쳐(12), 미리 결정된 블록(18)을 포함하는 여러 픽쳐(12), 또는 미리 결정된 블록(18)을 포함하는 픽쳐(12)의 슬라이스에 대한 초기 양자화 정확도를 결정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 2 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
상기 양자화 정확도(140) 및/또는 상기 선택된 변환 모드(130)를 상기 데이터 스트림(14) 내에서 시그널링하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 3 항 내지 제 10 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
상기 초기 양자화 정확도를 상기 데이터 스트림(14) 내에서 시그널링하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
상기 미리 결정된 블록(18)은 블록-기반 인코딩될 픽쳐 신호의 예측 잔차(24)의 블록을 나타내는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 1 항 내지 제 12 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
상기 미리 결정된 블록(18)에 대한 초기 양자화 정확도를 결정하고,
상기 선택된 변환 모드(130)에 의존하여 상기 초기 양자화 정확도를 수정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 13 항에 있어서,
상기 인코더(10)는,
상기 초기 양자화 정확도를 수정하는 것을, 상기 선택된 변환 모드(130)에 의존하여 오프셋 값을 사용해서 상기 초기 양자화 정확도를 오프셋함으로써 수행하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 13 항 또는 제 14 항에 있어서,
상기 인코더(10)는,
양자화 파라미터 목록으로부터 인덱스를 결정함으로써 상기 초기 양자화 정확도를 결정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 15 항에 있어서,
상기 인덱스는 상기 양자화 파라미터 목록 내의 양자화 파라미터를 가리키고, 상기 양자화 파라미터 목록 내의 모든 양자화 파라미터에 대해서 동일한 함수를 통하여 양자화 스텝 크기와 연관되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 15 항 또는 제 16 항에 있어서,
상기 인코더(10)는,
상기 오프셋 값을 상기 인덱스에 가산하거나 상기 오프셋 값을 상기 인덱스로부터 감산함으로써 상기 초기 양자화 정확도를 수정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 13 항 내지 제 17 항 중 어느 한 항에 있어서,
상기 양자화될 블록(18')을 양자화하는 것은, 정수 양자화가 뒤따르는 스케일링을 포함하고,
상기 인코더(10)는,
상기 오프셋 값을 상기 스케일링 인자에 가산하거나 상기 오프셋 값을 상기 스케일링 인자로부터 감산함으로써 상기 초기 양자화 정확도를 수정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 13 항 내지 제 18 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
상기 선택된 변환 모드(130)가 항등 변환(128₂) 또는 비-항등 변환(128₁)인지 여부에 의존하여 상기 수정된 초기 양자화 정확도를 제공하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 13 내지 제 19 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
상기 선택된 변환 모드(130)가 항등 변환(128₂)이면, 상기 미리 결정된 블록(18)에 대한 초기 양자화 정확도를 결정하고, 상기 초기 양자화 정확도가 미리 결정된 임계보다 열악한지 여부를 점검하며,
상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 열악한 경우, 상기 선택된 변환 모드(130)에 의존하여, 수정된 초기 양자화 정확도가 상기 미리 결정된 임계보다 정밀해지도록 상기 양자화 정확도(140)를 오프셋 값을 사용하여 수정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 20 항에 있어서,
상기 인코더(10)는,
상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 열악하지 않은 경우, 상기 선택된 변환 모드(130)에 의존하여, 상기 양자화 정확도(140)를 상기 오프셋 값을 사용하여 수정하지 않도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 20 항 또는 제 21 항에 있어서,
상기 인코더(10)는,
상기 선택된 변환 모드(130)가 비-항등 변환(128₁)인 경우, 상기 초기 양자화 정확도를 상기 오프셋 값을 사용하여 수정하지 않도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 13 항 내지 제 22 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
미리 결정된 블록(18)을 포함하는 여러 블록, 예컨대 미리 결정된 블록(18)을 포함하는 전체 픽쳐, 미리 결정된 블록(18)을 포함하는 여러 픽쳐, 또는 미리 결정된 블록(18)을 포함하는 픽쳐의 슬라이스에 대한 초기 양자화 정확도를 결정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 13 항 내지 제 23 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
레이트-왜곡 최적화(rate-distortion optimization)를 사용하여 상기 오프셋을 결정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 14 항 내지 제 24 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
미리 결정된 블록(18)을 포함하는 여러 블록, 예컨대 미리 결정된 블록(18)을 포함하는 전체 픽쳐, 미리 결정된 블록(18)을 포함하는 여러 픽쳐, 또는 미리 결정된 블록(18)을 포함하는 픽쳐의 슬라이스에 대한 상기 오프셋을 데이터 스트림(14) 내에서 시그널링하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 1 항 내지 제 25 항 중 어느 한 항에 있어서,
상기 양자화될 블록(18')의 양자화는, 블록-광역 스케일링(block-global scaling) 및 정수 양자화가 뒤따르는 인트라-블록-변동 스케일링 매트릭스(intra-block-varying scaling matrix)를 사용한 스케일링을 포함하고,
상기 인코더(10)는,
상기 인트라-블록-변동 스케일링 매트릭스를 상기 선택된 변환 모드(130)에 의존하여 결정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 26 항에 있어서,
상기 인코더(10)는,
결정한 결과로서 크기 및 형상에 있어서 동일한 양자화될 상이한 블록에 대해서 상이한 인트라-블록-변동 스케일링 매트릭스들이 얻어지게끔, 상기 인트라-블록-변동 스케일링 매트릭스를 결정하도록
구성되는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 27 항에 있어서,
상기 결정은,
크기 및 형상에 있어서 동일한 양자화될 상이한 블록에 대해서 결정된 인트라-블록-변동 스케일링 매트릭스가 상기 선택된 변환 모드(130)에 의존하고, 상기 선택된 변환 모드(130)는 항등 변환(128₂)과 동일하지 않게 되도록 하는, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
제 1 항 내지 제 28 항 중 어느 한 항에 있어서,
상기 인코더(10)는,
상기 선택된 변환 모드(130)가 비-항등 변환(128₁)인 경우, 상기 선택된 변환 모드(130)에 대응하는 변환을 상기 미리 결정된 블록(18)에 적용하여 상기 양자화될 블록(18')을 획득하도록
구성되고,
상기 선택된 변환 모드(130)가 항등 변환(128₂)인 경우, 상기 미리 결정된 블록(18)은 상기 양자화될 블록(18')인, 픽셀 신호의 블록-기반 인코딩을 위한 인코더(10).
인코딩된 픽쳐 신호의 변환 디코딩을 사용한 블록-기반 디코딩을 위한 디코더로서,
미리 결정된 블록에 대하여, 선택된 변환 모드(130)를 선택하고,
상기 선택된 변환 모드(130)에 따라서 상기 미리 결정된 블록과 연관되는 양자화해제될 블록을, 데이터 스트림(14)으로부터 엔트로피 디코딩하며,
상기 양자화해제될 블록을 상기 선택된 변환 모드(130)에 의존하는 양자화 정확도(140)를 사용하여 양자화해제함으로써, 양자화해제된 블록을 획득하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 30 항에 있어서,
상기 양자화 정확도(140)는 선택된 변환 모드(130)가 항등 변환(128₂) 또는 비-항등 변환(128₁)인지 여부에 의존하는, 블록-기반 디코딩을 위한 디코더.
제 31 항에 있어서,
상기 디코더는,
선택된 변환 모드(130)가 항등 변환(128₂)이면, 상기 미리 결정된 블록에 대한 초기 양자화 정확도를 결정하고, 상기 초기 양자화 정확도가 미리 결정된 임계보다 정밀한지 여부를 점검하고,
상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 정밀한 경우, 상기 양자화 정확도(140)를 디폴트 양자화 정확도(140)로 설정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 32 항에 있어서,
상기 디코더는,
상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 정밀하지 않은 경우, 상기 초기 양자화 정확도를 상기 양자화 정확도(140)로서 사용하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 32 항 또는 제 33 항에 있어서,
상기 디코더는,
상기 초기 양자화 정확도를, 양자화해제 파라미터 목록으로부터 인덱스를 결정함으로써 결정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 34 항에 있어서,
상기 인덱스는 상기 양자화해제 파라미터 목록 내의 양자화 파라미터를 가리키고, 상기 양자화해제 파라미터 목록 내의 모든 양자화 파라미터에 대해서 동일한 함수를 통하여 양자화 스텝 크기와 연관되는, 블록-기반 디코딩을 위한 디코더.
제 34 항 또는 제 35 항에 있어서,
상기 디코더는,
상기 인덱스가 미리 결정된 인덱스 값보다 작은지 여부를 점검함으로써, 상기 초기 양자화 정확도가 상기 미리 결정된 임계 보다 정밀한지 여부를 점검하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 32 항 내지 제 36 항 중 어느 한 항에 있어서,
상기 양자화해제될 블록을 양자화해제하는 것은, 정수 양자화해제가 뒤따르는 스케일링을 포함하고,
상기 디코더는,
상기 미리 결정된 임계 및/또는 상기 디폴트 양자화 정확도(140)가 1의 스케일링 인자에 관련되도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 32 항 내지 제 37 항 중 어느 한 항에 있어서,
상기 디코더는,
미리 결정된 블록을 포함하는 여러 블록, 예컨대 미리 결정된 블록을 포함하는 전체 픽쳐, 미리 결정된 블록을 포함하는 여러 픽쳐, 또는 미리 결정된 블록을 포함하는 픽쳐의 슬라이스에 대한 초기 양자화 정확도를 결정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 31 항 내지 제 38 항 중 어느 한 항에 있어서,
상기 디코더는,
상기 선택된 변환 모드(130)를 상기 데이터 스트림(14)으로부터 판독하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 32 항 내지 제 39 항 중 어느 한 항에 있어서,
상기 디코더는,
상기 초기 양자화 정확도를 상기 데이터 스트림(14)으로부터 판독하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 30 항 내지 제 40 항 중 어느 한 항에 있어서,
상기 미리 결정된 블록은 블록-기반 디코딩될 픽쳐 신호의 예측 잔차의 블록을 나타내는, 블록-기반 디코딩을 위한 디코더.
제 30 항 내지 제 41 항 중 어느 한 항에 있어서,
상기 디코더는,
상기 미리 결정된 블록에 대한 초기 양자화 정확도를 결정하고, 상기 선택된 변환 모드(130)에 의존하여 상기 초기 양자화 정확도를 수정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 42 항에 있어서,
상기 디코더는,
상기 초기 양자화 정확도를 수정하는 것을, 상기 선택된 변환 모드(130)에 의존하여 오프셋 값을 사용해서 오프셋함으로써 수행하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 42 항 또는 제 43 항에 있어서,
상기 디코더는,
상기 초기 양자화 정확도를, 양자화해제 파라미터 목록으로부터 인덱스를 결정함으로써 결정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 44 항에 있어서,
상기 인덱스는 상기 양자화해제 파라미터 목록 내의 양자화 파라미터를 가리키고, 상기 양자화해제 파라미터 목록 내의 모든 양자화 파라미터에 대해서 동일한 함수를 통하여 양자화 스텝 크기와 연관되는, 블록-기반 디코딩을 위한 디코더.
제 44 항 또는 제 45 항에 있어서,
상기 디코더는,
상기 오프셋 값을 상기 인덱스에 가산하거나 상기 오프셋 값을 상기 인덱스로부터 감산함으로써 상기 초기 양자화 정확도를 수정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 42 항 내지 제 46 항 중 어느 한 항에 있어서,
상기 양자화해제될 블록을 양자화해제하는 것은, 정수 양자화해제가 뒤따르는 스케일링을 포함하고,
상기 디코더는,
상기 오프셋 값을 상기 스케일링 인자에 가산하거나 상기 오프셋 값을 상기 스케일링 인자로부터 감산함으로써 상기 초기 양자화 정확도를 수정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 42 항 내지 제 47 항 중 어느 한 항에 있어서,
상기 디코더는,
상기 선택된 변환 모드(130)가 항등 변환(128₂) 또는 비-항등 변환(128₁)인지 여부에 의존하여 상기 수정된 초기 양자화 정확도를 제공하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 42 내지 제 48 항 중 어느 한 항에 있어서,
상기 디코더는,
상기 선택된 변환 모드(130)가 항등 변환(128₂)이면, 상기 미리 결정된 블록에 대한 초기 양자화 정확도를 결정하고, 상기 초기 양자화 정확도가 미리 결정된 임계보다 열악한지 여부를 점검하며,
상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 열악한 경우, 상기 선택된 변환 모드(130)에 의존하여, 수정된 초기 양자화 정확도가 상기 미리 결정된 임계보다 정밀해지도록 상기 양자화 정확도를 오프셋 값을 사용하여 수정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 49 항에 있어서,
상기 디코더는,
상기 초기 양자화 정확도가 상기 미리 결정된 임계보다 열악하지 않은 경우, 상기 선택된 변환 모드(130)에 의존하여, 상기 양자화 정확도를 상기 오프셋 값을 사용하여 수정하지 않도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 49 항 또는 제 50 항에 있어서,
상기 디코더는,
상기 선택된 변환 모드(130)가 비-항등 변환(128₁)인 경우, 상기 초기 양자화 정확도를 상기 오프셋 값을 사용하여 수정하지 않도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 42 항 내지 제 51 항 중 어느 한 항에 있어서,
상기 디코더는,
미리 결정된 블록을 포함하는 여러 블록, 예컨대 미리 결정된 블록을 포함하는 전체 픽쳐, 미리 결정된 블록을 포함하는 여러 픽쳐, 또는 미리 결정된 블록을 포함하는 픽쳐의 슬라이스에 대한 초기 양자화 정확도를 결정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 42 항 내지 제 52 항 중 어느 한 항에 있어서,
상기 디코더는,
레이트-왜곡 최적화(rate-distortion optimization)를 사용하여 상기 오프셋을 결정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 43 항 내지 제 53 항 중 어느 한 항에 있어서,
상기 디코더는,
미리 결정된 블록을 포함하는 여러 블록, 예컨대 미리 결정된 블록을 포함하는 전체 픽쳐, 미리 결정된 블록을 포함하는 여러 픽쳐, 또는 미리 결정된 블록을 포함하는 픽쳐의 슬라이스에 대한 상기 오프셋을 데이터 스트림(14)으로부터 판독하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 30 항 내지 제 54 항 중 어느 한 항에 있어서,
상기 양자화해제될 블록의 양자화해제는, 블록-광역 스케일링(block-global scaling) 및 정수 양자화해제가 뒤따르는 인트라-블록-변동 스케일링 매트릭스(intra-block-varying scaling matrix)를 사용한 스케일링을 포함하고,
상기 디코더는,
상기 인트라-블록-변동 스케일링 매트릭스를 상기 선택된 변환 모드(130)에 의존하여 결정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 55 항에 있어서,
상기 디코더는,
결정한 결과로서 크기 및 형상에 있어서 동일한 양자화해제될 상이한 블록에 대해서 상이한 인트라-블록-변동 스케일링 매트릭스들이 얻어지도록, 상기 인트라-블록-변동 스케일링 매트릭스를 결정하도록
구성되는, 블록-기반 디코딩을 위한 디코더.
제 56 항에 있어서,
상기 결정은,
크기 및 형상에 있어서 동일한 양자화해제될 상이한 블록에 대해서 결정된 인트라-블록-변동 스케일링 매트릭스가 상기 선택된 변환 모드(130)에 의존하고, 상기 선택된 변환 모드(130)는 항등 변환(128₂)과 동일하지 않게 되도록 하는, 픽셀 신호의 블록-기반 인코딩을 위한 디코더.
제 30 항 내지 제 57 항 중 어느 한 항에 있어서,
상기 디코더는,
상기 선택된 변환 모드(130)가 비-항등 변환(128₁)인 경우, 상기 선택된 변환 모드(130)에 대응하는 역변환을 양자화해제블록에 적용하여 상기 미리 결정된 블록을 획득하도록
구성되고,
상기 선택된 변환 모드(130)가 항등 변환(128₂)인 경우, 상기 양자화해제된 블록은 상기 미리 결정된 블록인, 블록-기반 디코딩을 위한 디코더.
변환 코딩을 사용하는 픽쳐 신호의 블록-기반 인코딩을 위한 방법으로서,
미리 결정된 블록에 대하여, 선택된 변환 모드를 선택하는 단계;
상기 미리 결정된 블록과 연관된 양자화될 블록을 선택된 변환 모드에 따라서, 선택된 변환 모드에 의존하는 양자화 정확도를 사용하여 양자화하여 양자화된 블록을 획득하는 단계; 및
상기 양자화된 블록을 데이터 스트림 내로 엔트로피 인코딩하는 단계를 포함하는, 블록-기반 인코딩 방법.
인코딩된 픽쳐 신호의 변환 디코딩을 사용한 블록-기반 디코딩을 위한 방법으로서,
미리 결정된 블록에 대하여, 선택된 변환 모드를 선택하는 단계;
상기 선택된 변환 모드에 따라서 상기 미리 결정된 블록과 연관되는 양자화해제될 블록을, 데이터 스트림으로부터 엔트로피 디코딩하는 단계; 및
상기 양자화해제될 블록을 상기 선택된 변환 모드에 의존하는 양자화 정확도를 사용하여 양자화해제함으로써, 양자화해제된 블록을 획득하는 단계를 포함하는, 블록-기반 디코딩 방법.
컴퓨터 프로그램으로서,
컴퓨터 상에서 실행될 때, 제 59 항 또는 제 60 항의 방법을 수행하기 위한 프로그램 코드를 포함하는, 컴퓨터 프로그램.
데이터 스트림으로서,
제 59 항 또는 제 60 항에 따른 방법에 의해 획득되는, 데이터 스트림.