PL231160B1

PL231160B1 - Sposób dekodowania sygnału wideo

Info

Publication number: PL231160B1
Application number: PL408821A
Authority: PL
Inventors: Bae Keun Lee; Jae Cheol Kwon; Joo Young Kim
Original assignee: Kt Corp
Priority date: 2011-10-18
Filing date: 2012-10-18
Publication date: 2019-01-31
Also published as: CN107835415A; AU2012326819B2; CN104067622A; CN107835414B; RU2016126955A3; US20150139308A1; KR20140110093A; GB2561487B; CN107105244B; CN107820080A; KR101762294B1; RU2016126982A; RU2016126941A3; CN107835418A; KR20140059837A; RU2016126960A3; AU2012326819A1; MX369192B; KR20140119822A; RU2016126960A

Description

Opis wynalazku

Niniejszy wynalazek dotyczy kodowania i dekodowania wideo, a w szczególności, sposobu dekodowania sygnału wideo.

Stan techniki

W ostatnim czasie, w różnych zakresach zastosowań wzrosło zapotrzebowanie na wideo o wysokiej rozdzielczości i wysokiej jakości, takie jak wideo o wysokiej rozdzielczości (HD) i wideo o bardzo wysokiej rozdzielczości (UHD).

W miarę większej rozdzielczości i wyższej jakości danych wideo, bardziej wzrasta ilość danych względem istniejących danych wideo. W związku z tym, gdy dane wideo są przesyłane z wykorzystaniem środków takich jak istniejące przewodowe i bezprzewodowe linie szerokopasmowe lub są zapisywane na istniejących nośnikach pamięci, wzrasta koszt przesyłu i koszt przechowywania.

W celu rozwiązania tych problemów pojawiających się wraz ze wzrostem rozdzielczości i jakości danych wideo, mogą być wykorzystane techniki kompresji wideo o dużej wydajności.

Technologia kompresji wideo obejmuje różne techniki, takie jak technika predykcji międzyklatkowej polegająca na przewidywaniu wartości piksela zawartego w bieżącym obrazie z poprzednich lub następnych obrazów względem bieżącego obrazu, technika predykcji wewnątrzklatkowej polegająca na przewidywaniu wartości piksela zawartego w bieżącym obrazie z wykorzystaniem informacji piksela w bieżącym obrazie, technika przekształcania informacji pikseli do dziedziny częstotliwości przez z góry określoną jednostkę i kwantyzowania współczynnika przekształcenia oraz technika kodowania entropijnego polegająca na przypisywaniu krótkiego kodu do wartości o dużej częstotliwości występowania i przypisywaniu długiego kodu do wartości o małej częstotliwości występowania.

Dane wideo mogą być skutecznie kompresowane i przesyłane lub zachowywane z wykorzystaniem takich technik kompresji wideo.

Opis wynalazku

Cel i istota wynalazku

Celem wynalazku jest zapewnienie sposobu dekodowania sygnału wideo. Cel ten jest osiągnięty przez sposób dekodowania sygnału wideo, obejmujący otrzymywanie, przez moduł dekodowania entropijnego, współczynników resztkowych dotyczących bieżącego bloku oraz wskaźnika pomijania przekształcenia dla bieżącego bloku z sygnału wideo, przy czym wskaźnik pomijania przekształcenia określa, czy przekształcenie odwrotne jest pomijane dla bieżącego bloku, przy czym resztkowe współczynniki są kwantyzowane odwrotnie przez moduł dekwantyzacji; i otrzymywanie, przez moduł przekształcenia odwrotnego, resztkowych próbek przez selektywne wykonywanie przekształcenia odwrotnego dla kwantyzowanych odwrotnie współczynników resztkowych bieżącego bloku na podstawie wskaźnika pomijania przekształcenia, przy czym przekształcenie odwrotne jest wykonywane przez wykorzystanie jednego przekształcenia spośród dyskretnej transformacji kosinusowej (DCT) i dyskretnej transformacji sinusowej (DST).

Korzystnie, gdy wskaźnik pomijania przekształcenia określa, że przekształcenie odwrotne jest pomijane dla bieżącego bloku, resztkowe próbki są otrzymywane przez skalowanie kwantyzowanych odwrotnie współczynników resztkowych przez z góry określoną wartość.

Korzystnie, skalowanie jest wykonywane przez wykorzystanie operacji przemieszczenia bitów.

Korzystnie, wskaźnik pomijania przekształcenia jest otrzymywany na podstawie rozmiaru jednostki przekształcenia, przy czym jednostka przekształcenia stanowi reprezentację jednostki, gdy przekształcenie odwrotne jest wykonywane dla bieżącego bloku.

Korzystnie, wskaźnik pomijania przekształcenia jest otrzymywany, gdy rozmiar jednostki przekształcenia jest równy rozmiarowi minimalnego bloku NxN.

Korzystnie, przekształcenie odwrotne obejmuje przekształcenie na wierszach bieżącego bloku i przekształcenie na kolumnach bieżącego bloku.

Poniżej przedstawiono przykłady, które są użyteczne dla zrozumienia wynalazku.

Jeden przykład przedstawia sposób kodowania wideo obejmujący wykonywanie predykcji dla bieżącego bloku i przekształcanie resztki generowanej przez predykcję, przy czym, w etapie przekształcania, drugie przekształcenie jest wykonywane w dziedzinie niskiej częstotliwości po wykonaniu pierwszego przekształcenia na resztce, i określa tryb drugiego przekształcenia na podstawie trybu pierwszego przekształcenia.

PL 231 160 B1

W etapie wykonywania, predykcja wewnątrzklatkowa może być wykonana dla bieżącego bloku, a tryb pierwszego przekształcenia może być określony jako jeden spośród: 2-kierunkowego (2D) przekształcenia, 1-kierunkowego (1D) przekształcenia pionowego, przekształcenia 1D poziomego i bez przekształcenia na podstawie kierunku trybu predykcji dla predykcji wewnątrzklatkowej. W tym przypadku, tryb drugiego przekształcenia może być taki sam, jak tryb pierwszego przekształcenia.

W etapie wykonywania, predykcja międzyklatkowa może być wykonana dla bieżącego bloku, a tryb pierwszego przekształcenia może być określony jako jeden spośród: przekształcenia 2D, przekształcenia 1D pionowego, przekształcenia 1D poziomego i bez przekształcenia na podstawie kształtu bieżącego bloku. W tym przypadku, tryb drugiego przekształcenia może być taki sam, jak tryb pierwszego przekształcenia.

W etapie przekształcania, tryb pierwszego przekształcenia może być określony na podstawie optymalizacji przepływność-zniekształcenie. W tym przypadku, mogą być transmitowane informacje wskazujące określony tryb pierwszego przekształcenia.

Drugie przekształcenie może być dyskretną transformacją sinusową (DST) wykonaną przez blok 4x4.

Inny przykład przedstawia sposób dekodowania wideo obejmujący wykonywanie przekształcenia odwrotnego w celu generowania bloku resztkowego dla bieżącego bloku i wykonywanie predykcji w celu generowania przewidywanego bloku dla bieżącego bloku, przy czym, podczas wykonywania przekształcenia odwrotnego, drugie przekształcenie odwrotne w dziedzinie niskiej częstotliwości może być wykonane po wykonaniu pierwszego przekształcenia odwrotnego na zakodowanych informacjach resztkowych dla bieżącego bloku, a tryb drugiego przekształcenia może być określony na podstawie trybu pierwszego przekształcenia.

Podczas wykonywania predykcji, predykcja wewnątrzklatkowa może być wykonana dla bieżącego bloku, a tryb pierwszego przekształcenia odwrotnego może być określony jako jeden spośród: przekształcenia 2D, przekształcenia 1D pionowego, przekształcenia 1D poziomego i bez przekształcenia na podstawie kierunku trybu predykcji dla predykcji wewnątrzklatkowej. W tym przypadku, tryb drugiego przekształcenia odwrotnego może być taki sam, jak tryb pierwszego przekształcenia odwrotnego.

Podczas wykonywania predykcji, predykcja międzyklatkowa może być wykonana dla bieżącego bloku, a tryb pierwszego przekształcenia odwrotnego jest określony jako jeden spośród: przekształcenia 2D, przekształcenia 1D pionowego, przekształcenia 1D poziomego i bez przekształcenia na podstawie kształtu bieżącego bloku. W tym przypadku, tryb drugiego przekształcenia odwrotnego może być taki sam, jak tryb pierwszego przekształcenia odwrotnego.

Podczas wykonywania przekształcenia odwrotnego, pierwsze przekształcenie odwrotne może być wykonane zgodnie z trybem wskazanym przez odebrane informacje, a odebrane informacje wskazują jeden tryb spośród: przekształcenia 2D, przekształcenia 1 D pionowego, przekształcenia 1D poziomego i bez przekształcenia jako tryb pierwszego przekształcenia odwrotnego. W tym przypadku, tryb drugiego przekształcenia odwrotnego może być taki sam, jak tryb pierwszego przekształcenia odwrotnego.

Drugie przekształcenie może być transformacją DST wykonaną przez blok 4x4.

Jeszcze inny przykład przedstawia urządzenie kodujące wideo zawierające moduł predykcji do wykonywania predykcji dla bieżącego bloku, i moduł przekształcania do przekształcania resztki generowanej przez predykcję, przy czym moduł przekształcania wykonuje drugie przekształcenie w dziedzinie niskiej częstotliwości po wykonaniu pierwszego przekształcenia na resztce i określa tryb drugiego przekształcenia na podstawie trybu pierwszego przekształcenia.

Jeszcze inny przykład przedstawia sposób dekodowania wideo zawierający moduł przekształcenia odwrotnego do generowania bloku resztkowego dla bieżącego bloku przez wykonywanie przekształcenia odwrotnego i moduł predykcji do generowania przewidywanego bloku dla bieżącego bloku, przy czym moduł przekształcenia odwrotnego wykonuje drugie przekształcenie odwrotne w dziedzinie niskiej częstotliwości po wykonaniu pierwszego przekształcenia odwrotnego na zakodowanych informacjach resztkowych dla bieżącego bloku, i określa tryb drugiego przekształcenia na podstawie trybu pierwszego przekształcenia.

Korzystne skutki

Zgodnie z przedstawionym przykładem, informacje resztkowe mogą być wydajnie przekształcane i przekształcane odwrotnie.

PL 231 160 B1

Zgodnie z przedstawionym przykładem, pierwsze przekształcenie może być wykonane zgodnie ze sposobem predykcji, a drugie przekształcenie może być wykonane w dziedzinie niskiej częstotliwości zgodnie z pierwszym przekształceniem, zwiększając w ten sposób wydajność kompresji i transmisji.

Zgodnie z przedstawionym przykładem, pierwsze przekształcenie może być wykonane zgodnie z podzielonym kształtem, a drugie przekształcenie może być wykonane w dziedzinie niskiej częstotliwości zgodnie z pierwszym przekształceniem, zwiększając w ten sposób wydajność kompresji i transmisji.

Opis rysunków

FIG. 1 przedstawia schemat blokowy ilustrujący urządzenie kodujące wideo.

FIG. 2 przedstawia schemat blokowy ilustrujący urządzenie dekodujące wideo.

FIG. 3 schematycznie przedstawia tryb predykcji wykorzystywany dla predykcji wewnątrzklatkowej.

FIG. 4 schematycznie przedstawia tryb pomijania przekształcenia (TMS).

FIG. 5 przedstawia sieć działań schematycznie ilustrującą proces kodowania przyjmujący tryb pomijania przekształcenia i drugie przekształcenie.

FIG. 6 schematycznie przedstawia informacje o sąsiednim bloku dostępne w trybie pomijania, trybie łączenia i trybie AMVP.

FIG. 7 przedstawia sieć działań schematycznie ilustrującą proces dekodowania przyjmujący tryb pomijania przekształcenia i drugie przekształcenie.

Tryb dla wynalazku

Niniejszy wynalazek może być w różny sposób zmieniany i modyfikowany i może być zilustrowany w odniesieniu do różnych przykładów wykonania, z których niektóre zostaną opisane i przedstawione na rysunkach. Jednakże, przedstawione przykłady wykonania nie mają na celu ograniczania wynalazku, ale są interpretowane jako obejmujące wszystkie modyfikacje, ekwiwalenty i zastąpienia, które należą do istoty i technicznego zakresu wynalazku. Te same oznaczenia odsyłające na rysunkach odnoszą się do tych samych elementów w całym opisie.

Mimo że określenia pierwszy, drugi, itd. mogą być wykorzystane do opisania różnych elementów, to te elementy nie powinny być ograniczane przez te określenia. Te określenia są wykorzystywane tylko do odróżnienia jednego elementu od drugiego elementu. Na przykład, pierwszy element mógłby być nazwany drugim elementem, a drugi element mógłby być nazwany pierwszym elementem bez odbiegania od treści niniejszego wynalazku.

Określenie „i/lub” obejmuje dowolne i wszystkie kombinacje spośród wielu powiązanych wymienionych elementów.

Zrozumiale będzie, że, gdy element jest określany jako „połączony z” lub „podłączony do” innego elementu, to element może być bezpośrednio połączony lub podłączony do innego elementu lub elementów pośredniczących. Z drugiej strony, gdy element jest określony jako „bezpośrednio połączony z” lub „bezpośrednio podłączony do” innego elementu, nie występują żadne elementy pośredniczące.

Terminologia wykorzystana w niniejszym dokumencie ma na celu opisanie tylko szczególnych przykładów wykonania i nie ma na celu ograniczania wynalazku. Wykorzystane w niniejszym dokumencie formy w liczbie pojedynczej mają na celu objęcie także form w liczbie mnogiej, o ile kontekst wyraźnie nie wskazuje inaczej. Będzie ponadto zrozumiałe, że określenia „obejmuje” i/lub „posiada”, gdy są wykorzystywane w tym opisie, określają występowanie wskazanych cech, liczb całkowitych, etapów, operacji, elementów i/lub komponentów, ale nie wykluczają występowania lub dodania jednej lub większej liczby cech, liczb całkowitych, etapów, operacji, elementów, komponentów i/lub ich grup.

W dalszej części opisu, przykłady użyteczne dla zrozumienia wynalazku zostaną szczegółowo opisane w odniesieniu do dołączonych rysunków. Te same oznaczenia odsyłające na rysunkach odnoszą się do tych samych elementów w całym opisie, a zbędny opis tych samych elementów zostanie w niniejszym opisie pominięty.

FIG. 1 przedstawia schemat blokowy ilustrujący urządzenie kodujące wideo.

Odnosząc się do FIG. 1, urządzenie 100 kodujące wideo zawiera moduł 105 podziału obrazu, moduł 110 predykcji, moduł 115 przekształcania, moduł 120 kwantyzacji, moduł 125 przegrupowania, moduł 130 kodowania entropijnego, moduł 135 dekwantyzacji, moduł 140 przekształcenia odwrotnego, moduł 145 filtra i pamięć 150.

Mimo że elementy zilustrowane na FIG. 1 są niezależnie przedstawione w celu reprezentowania różnych charakterystycznych funkcji w urządzeniu kodującym wideo, to taka konfiguracja nie wskazuje,

PL 231 160 B1 że każdy element jest utworzony przez oddzielny komponent sprzętowy lub komponent oprogramowania. To oznacza, że elementy są niezależnie rozmieszczone dla ułatwienia opisu, przy czym co najmniej dwa elementy mogą być połączone w pojedynczy element, lub pojedynczy element może być podzielony na wiele elementów w celu wykonywania funkcji. Należy zaznaczyć, że przykłady wykonania, w których niektóre elementy są zintegrowane w jeden połączony element i/lub element jest podzielony na wiele oddzielnych elementów, należą do zakresu niniejszego wynalazku bez odchodzenia od istoty niniejszego wynalazku.

Niektóre elementy mogą nie być istotne dla zasadniczych funkcji w wynalazku i mogą być opcjonalnymi składnikami jedynie zwiększającymi wydajność. Wynalazek może być zrealizowany przez zawarcie tylko tych składników, które są istotne dla realizacji wynalazku, z wyjątkiem składników wykorzystywanych jedynie do zwiększenia wydajności. Struktura zawierająca tylko istotne składniki z wyjątkiem optycznych składników wykorzystywanych jedynie do zwiększenia wydajności należy do zakresu wynalazku.

Moduł 105 podziału obrazu może dzielić obraz wejściowy na co najmniej jedną jednostkę procesu. W tym przypadku, jednostka procesu może być jednostką predykcji (PU), jednostką przekształcenia (TU) lub jednostką kodowania (CU). Moduł 105 podziału obrazu może dzielić jeden obraz na wiele kombinacji jednostek kodowania, jednostek predykcji i jednostek przekształcenia i wybierać jedną kombinację jednostek kodowania, jednostek predykcji i jednostek przekształcenia na podstawie z góry określonego kryterium (na przykład, funkcji kosztu), kodując w ten sposób obraz.

Na przykład, jeden obraz może być podzielony na wiele jednostek kodowania. Struktura drzewa rekursywnego, taka jak struktura drzewa czwórkowego, może być wykorzystana do podzielenia obrazu na jednostki kodowania. Będąc obrazem lub jednostką kodowania o maksymalnym rozmiarze jako korzeń, jednostka kodowania może być podzielona na podjednostki kodowania z tyloma węzłami potomnymi, ile jest podzielonych jednostek kodowania. Jednostka kodowania, która nie jest już dalej dzielona zgodnie z określonym z góry ograniczeniem, jest węzłem-liściem. Oznacza to, że przy założeniu, że jednostka kodowania może być podzielona tylko na kwadraty, pojedyncza jednostka kodowania może być podzielona na maksymalnie cztery jednostki kodowania.

W przykładach, jednostka kodowania może być wykorzystana do odnoszenia się nie tylko do jednostki kodowania, ale także do jednostki dekodowania.

Jednostka predykcji może być podzielona na co najmniej jedną postać kwadratową lub prostokątną o tym samym rozmiarze w jednostce kodowania lub może być podzielona tak, że kształt podzielonej jednostki predykcji jest inny, niż kształt innej jednostki predykcji w jednostce kodowania.

Gdy jednostka predykcji, która ma być poddana predykcji wewnątrzklatkowej, jest generowana na podstawie jednostki kodowania i jednostka kodowania nie jest minimalną jednostką kodowania, predykcja wewnątrzklatkowa może być wykonana bez dzielenia jednostki kodowania na wiele jednostek predykcji (NxN).

Moduł 110 predykcji może zawierać moduł predykcji międzyklatkowej do wykonywania predykcji międzyklatkowej i moduł predykcji wewnątrzklatkowej do wykonywania predykcji wewnątrzklatkowej. Moduł predykcji może określać to, która predykcja spośród predykcji międzyklatkowej lub predykcji wewnątrzklatkowej powinna być wykonana na jednostce predykcji, i może określać specyficzne informacje (na przykład, tryb predykcji wewnątrzklatkowej, wektor ruchu i obraz referencyjny, itd.) zgodnie z określonym sposobem predykcji. W tym przypadku, jednostka procesu, na której wykonywana jest predykcja, może być inna, niż jednostka procesu, dla której określany jest sposób predykcji i specyficzne informacje. Na przykład, sposób predykcji i tryb predykcji mogą być określone dla każdej jednostki predykcji, natomiast predykcja może być wykonana dla każdej jednostki przekształcenia. Wartość resztkowa (blok resztkowy) między generowanym przewidywanym blokiem i oryginalnym blokiem może być wprowadzana do modułu 115 przekształcania. Ponadto, informacje trybu predykcji, informacje wektora ruchu i temu podobne wykorzystywane dla predykcji mogą być zakodowane razem z wartością resztkową przez moduł 130 kodowania entropijnego i mogą być transmitowane do urządzenia dekodującego. Gdy wykorzystywany jest specyficzny tryb kodowania, oryginalny blok może być zakodowany i przetransmitowany do urządzenia dekodującego bez generowania przewidywanego bloku za pośrednictwem modułu 110 predykcji.

Moduł predykcji międzyklatkowej może przewidywać jednostkę predykcji na podstawie informacji dotyczących co najmniej jednego obrazu spośród poprzedniego obrazu i następnego obrazu bieżącego obrazu. Moduł predykcji międzyklatkowej może zawierać moduł interpolacji obrazu referencyjnego, moduł predykcji ruchu i moduł kompensacji ruchu.

PL 231 160 B1

Moduł interpolacji obrazu referencyjnego może odbierać z pamięci 150 informacje obrazu referencyjnego i generować informacje pikseli mniejsze niż całkowitoliczbowa jednostka pozycji pikseli (całkowitoliczbowa jednostka pikseli lub jednostka pikseli) z obrazu referencyjnego. W przypadku pikseli jasności, oparty na transformacji DCT 8-segmentowy filtr interpolacyjny mający zmienny współczynnik filtra może być wykorzystany do generowania informacji pikseli mniejszych niż całkowitoliczbowa jednostka pikseli w jednostce 1/4 pozycji piksela (jednostka 1/4 piksela). W przypadku pikseli chrominancji, oparty na transformacji DCT 4-segmentowy filtr interpolacyjny mający zmienny współczynnik filtra może być wykorzystany do generowania informacji pikseli mniejszych niż całkowitoliczbowa jednostka pikseli w jednostce 1/8 piksela.

Moduł predykcji ruchu może wykonywać predykcję r uchu na podstawie obrazu referencyjnego interpolowanego przez moduł interpolacji obrazu referencyjnego. Różne metody, takie jak algorytm dopasowania bloków oparty na pełnym poszukiwaniu (FBMA), algorytm trzystopniowego poszukiwania (TSS) i nowy algorytm tr zystopniowego poszukiwania (NTS) mogą być wykorzystane do obliczania wektora ruchu. Wektor ruchu ma wartość wektora ruchu w jednostce 1/2 lub 1/4 piksela na podstawie interpolowanego piksela. Moduł predykcji ruchu może wykonywać predykcję na bieżącej jednostce predykcji z wykorzystaniem innych sposobów predykcji ruchu. Różne metody, takie jak pomijanie, łączenie i zaawansowana predykcja wektora ruchu (AMVP) itd. mogą być wykorzystane jako sposób predykcji ruchu.

Moduł predykcji wewnątrzklatkowej może generować blok predykcji na podstawie informacji piksela referencyjnego sąsiadujący z bieżącym blokiem, które stanowią informacje pikseli w bieżącym obrazie. Gdy blok sąsiadujący z aktualną jednostką predykcji jest blokiem poddawanym predykcji międzyklatkowej i piksel referencyjny jest pikselem poddawanym predykcji międzyklatkowej, informacje pikseli referencyjnych zawarte w bloku poddawanym predykcji międzyklatkowej mogą być zastąpione informacjami pikseli referencyjnych w bloku poddawanym predykcji wewnątrzklatkowej. Oznacza to, że, gdy piksel referencyjny nie jest dostępny, informacje o niedostępnym pikselu referencyjnym mogą być zastąpione co najmniej jednym pikselem referencyjnym spośród dostępnych pikseli referencyjnych.

Tryb predykcji dla predykcji wewnątrzklatkowej obejmuje tryb predykcji kierunkowej, w którym informacje o pikselu referencyjnym są wykorzystywane zgodnie z kierunkiem predykcji, oraz tryb predykcji bezkierunkowej, w którym informacje kierunku nie są wykorzystywane przy wykonywaniu predykcji. Tryb przewidywania informacji o jasności i tryb przewidywania informacji o chrominancji mogą być od siebie różne. Informacje trybu predykcji wewnątrzklatkowej wykorzystywane do otrzymywania informacji o jasności lub informacji o przewidywanym sygnale jasności mogą być wykorzystywane do przewidywania informacji o chrominancji.

Gdy jednostka predykcji i jednostka przekształcenia mają ten sam rozmiar przy wykonywaniu predykcji wewnątrzklatkowej, predykcja wewnątrzklatkowa na jednostce predykcji może być wykonana na podstawie pikseli z lewej strony, górnego lewego piksela i górnych pikseli jednostki predykcji. Z drugiej strony, gdy jednostka predykcji i jednostka przekształcenia mają różne rozmiary przy wykonywaniu predykcji wewnątrzklatkowej, predykcja wewnątrzklatkowa może być wykonana z wykorzystaniem pikseli referencyjnych na podstawie jednostki przekształcenia. Predykcja wewnątrzklatkowa z podziałem NxN może być wykonana tylko dla minimalnej jednostki kodowania.

W sposobie predykcji wewnątrzklatkowej, filtr adaptacyjnego wygładzania wewnątrzklatkowego (AIS) może być stosowany względem pikseli referencyjnych zgodnie z trybem predykcji przed generowaniem przewidywanego bloku. Różne rodzaje filtrów AIS mogą być stosowane względem pikseli referencyjnych. W sposobie predykcji wewnątrzklatkowej, tryb predykcji wewnątrzklatkowej bieżącej jednostki predykcji może być przewidziany na podstawie trybu predykcji wewnątrzklatkowej jednostki predykcji zlokalizowanej sąsiadująco z bieżącą jednostką predykcji. W przewidywaniu dla trybu predykcji bieżącej jednostki predykcji z wykorzystaniem informacji trybu przewidywanych na podstawie sąsiedniej jednostki predykcji, gdy bieżąca jednostka predykcji i sąsiednia jednostka predykcji mają ten sam tryb predykcji wewnątrzklatkowej, informacje wskazujące, że bieżąca jednostka predykcji i sąsiednia jednostka predykcji mają ten sam tryb predykcji, mogą być transmitowane z wykorzystaniem z góry określonych informacji znacznika. Jeżeli bieżąca jednostka predykcji i sąsiednia jednostka predykcji mają różne tryby predykcji, informacje dotyczące trybu predykcji bieżącego bloku mogą być zakodowane przez kodowanie entropijne.

PL 231 160 B1

Blok resztkowy zawierający informacje resztkowe, które dotyczą różnicy między przewidywanym blokiem i oryginalnym blokiem jednostki predykcji, może być generowany na podstawie jednostki predykcji przez moduł 110 predykcji. Wygenerowany blok resztkowy może być wprowadzany do modułu 115 przekształcania.

Moduł 115 przekształcania może przekształcać blok resztkowy zawierający informacje resztkowe jednostki predykcji generowanej na podstawie oryginalnego bloku przez moduł 110 predykcji z wykorzystaniem sposobu przekształcania takiego jak dyskretna transformacja kosinusowa (DCT) lub Dyskretna transformacja sinusowa (DST). Sposób przekształcania, który ma być wykorzystany do przekształcania bloku resztkowego, może być określony spośród transformacji DCT i transformacji DST na podstawie informacji trybu predykcji wewnątrzklatkowej jednostki predykcji wykorzystywanego do generowania bloku resztkowego.

Moduł 120 kwantyzacji może kwantyzować wartości przekształcone do dziedziny częstotliwości przez moduł 115 przekształcania. Parametr kwantyzacji może się zmieniać w zależności od bloku lub ważności obrazu. Wartości dostarczane z modułu 120 kwantyzacji mogą być dostarczane do modułu 135 dekwantyzacji i modułu 125 przegrupowania.

Dla kwantyzowanych resztkowych wartości, moduł 125 przegrupowania może przeorganizować współczynniki.

Moduł 125 przegrupowania może zmieniać dwuwymiarowy (2D) blok współczynników na jednowymiarowy (1D) wektor współczynników poprzez skanowanie współczynników. Na przykład, moduł 125 przegrupowania może zmieniać blok 2D współczynników na wektor 1D współczynników z wykorzystaniem skanowania prostopadłego. Skanowanie pionowe bloku 2D współczynników w kierunku kolumny i skanowanie poziome bloku 2D współczynników w kierunku wiersza może być wykorzystane w zależności od rozmiaru jednostki przekształcenia i trybu predykcji wewnątrzklatkowej, zamiast skanowania prostopadłego. Oznacza to, że sposób skanowania do wykorzystania może być wybrany na podstawie rozmiaru jednostki przekształcenia i trybu predykcji wewnątrzklatkowej spośród skanowania prostopadłego, skanowania pionowego i skanowania poziomego.

Moduł 130 kodowania entropijnego może wykonywać kodowanie entropijne na podstawie wartości otrzymanych przez moduł 125 przegrupowania. Różne sposoby kodowania, takie jak wykładnicze kodowanie Golomba, kontekstowe adaptacyjne kodowanie o zmiennej długości słowa (CAVLC) i kontekstowe adaptacyjne kodowanie ciągu symboli binarnych (CABAC) może być wykorzystane dla kodowania entropijnego.

Moduł 130 kodowania entropijnego może kodować wiele różnych informacji, takich jak informacje resztkowe współczynnika i informacje o rodzaju bloku dotyczące jednostki kodowania, informacje trybu predykcji, informacje o jednostce podziału, informacje o jednostce predykcji, informacje o jednostce transferu, informacje wektora ruchu, informacje o klatce odniesienia, informacje o interpolacji bloku i informacje o filtrowaniu, które mogą być otrzymane z modułu 125 przegrupowania i modułu 110 predykcji.

Moduł 130 kodowania entropijnego może kodować entropijnie współczynniki jednostki kodowania wprowadzane z modułu 125 przegrupowania.

Moduł 135 dekwantyzacji i moduł 140 przekształcenia odwrotnego dekwantyzują wartości kwantyzowane przez moduł 120 kwantyzacji i przekształcają odwrotnie wartości przekształcone przez moduł 115 przekształcania. Resztka generowana przez moduł 135 dekwantyzacji i moduł 140 przekształcenia odwrotnego może być dodawana do przewidywanego bloku, który jest przewidywany przez moduł predykcji wektora ruchu, moduł kompensacji ruchu i moduł predykcji wewnątrzklatkowej modułu 110 predykcji, generując w ten sposób zrekonstruowany blok.

Moduł 145 filtra może zawierać co najmniej jeden spośród: filtra rozbioru bloku, modułu korekcji przesunięcia i adaptacyjnego filtra pętlowego (ALF).

Filtr 145 rozbioru bloku może usuwać zniekształcenia bloku generowane na granicach między blokami w zrekonstruowanym obrazie. To, czy należy zastosować filtr rozbioru bloku względem bieżącego bloku, może być określone na podstawie pikseli zawartych w kilku rzędach lub kolumnach bloku. Gdy filtr rozbioru bloku jest stosowany względem bloku, może być zastosowany silny filtr lub słaby filtr w zależności od wymaganej siły filtrowania rozbioru bloku. Ponadto, gdy filtrowanie poziome i filtrowanie pionowe są realizowane podczas stosowania filtra rozbioru bloku, filtrowanie poziome i filtrowanie pionowe może być wykonane równolegle.

Moduł korekcji przesunięcia może korygować przesunięcie obrazu filtrowanego przez rozbiór bloku względem oryginalnego obrazu o piksel. Sposób podziału pikseli obrazu na z góry określoną

PL 231 160 B1 liczbę obszarów, określania obszaru, który ma być poddany korekcji przesunięcia i stosowania korekcji przesunięcia względem określonego obszaru lub sposób stosowania korekcji przesunięcia przy uwzględnieniu informacji brzegowych dla każdego piksela może być wykorzystany do wykonania korekcji przesunięcia względem określonego obrazu.

Filtr ALF może wykonywać filtrowanie na podstawie wyniku porównania filtrowanego zrekonstruowanego obrazu i oryginalnego obrazu. Piksele zawarte w obrazie mogą być podzielone na z góry określone grupy, może być określony filtr, który ma być zastosowany względem każdej grupy i dla każdej grupy może być wykonane filtrowanie różnicowe. Informacje o tym, czy zastosować filtr ALF mogą być przesyłane przez każdą jednostkę kodowania (CU), a kształt i współczynnik filtra ALF, które mają być zastosowane względem każdego bloku, mogą się zmieniać. Filtr ALF może mieć różne rodzaje i może się zmieniać liczba współczynników zawartych w odpowiednim filtrze. Ponadto, filtr ALF o tej samej postaci (stałej postaci) może być stosowany względem bloku niezależnie od charakterystyk bloku.

Pamięć 150 może przechowywać zrekonstruowany blok lub obraz dostarczany z modułu 145 filtra, a zachowany zrekonstruowany blok lub obraz może być dostarczony do modułu 110 predykcji podczas wykonywania predykcji międzyklatkowej.

FIG. 2 przedstawia schemat blokowy ilustrujący urządzenie dekodujące wideo.

Odnosząc się do FIG. 2, urządzenie 200 dekodujące wideo może zawierać moduł 210 dekodowania entropijnego, moduł 215 przegrupowania, moduł 220 dekwantyzacji, moduł 225 przekształcenia odwrotnego, moduł predykcji 230, moduł 235 filtra i pamięć 240.

Gdy strumień bitów wideo jest wprowadzany z urządzenia kodującego wideo, wejściowy strumień bitów może być dekodowany zgodnie z procesem odwrotnym dla procesu kodowania wideo przez urządzenie kodujące wideo.

Moduł 210 dekodowania entropijnego może wykonywać dekodowanie entropijne zgodnie z procesem odwrotnym dla procesu kodowania entropijnego przez moduł kodowania entropijnego urządzenia kodującego wideo. Na przykład, różne sposoby, takie jak wykładnicze kodowanie Golomba, kodowanie CAVLC i CABAC, mogą być wykorzystane dla dekodowania entropijnego, odpowiadające sposobowi wykorzystanemu przez urządzenie kodujące wideo.

Moduł 210 dekodowania entropijnego może dekodować informacje powiązane z predykcją wewnątrzklatkową i predykcją międzyklatkową wykonywanymi przez urządzenie kodujące.

Moduł 215 przegrupowania może wykonywać przegrupowanie strumienia bitów dekodowanego entropijnie przez moduł 210 dekodowania entropijnego na podstawie sposobu przegrupowania modułu kodowania. Moduł 215 przegrupowania może rekonstruować i przegrupowywać współczynniki wyrażone w postaci wektora 1D na współczynniki w bloku 2D. Moduł 215 przegrupowania może mieć dostarczone informacje związane ze skanowaniem współczynników wykonywanym przez moduł kodowania i może wykonywać przegrupowanie z wykorzystaniem sposobu skanowania odwrotnego współczynników na podstawie porządku skanowania, zgodnie z którym skanowanie jest wykonywane przez moduł kodowania.

Moduł 220 dekwantyzacji może wykonywać dekwantyzację na podstawie parametru kwantyzacji dostarczanego z urządzenia kodującego i przegrupowanych współczynników bloku.

Moduł 225 przekształcenia odwrotnego może wykonywać odwrotną transformację DCT i odwrotną transformację DST względem transformacji DCT i DST wykonywanych przez moduł przekształcania, przy czym transformacje DCT i DST zostały wykonane na wyniku kwantyzacji wykonanej przez urządzenie kodujące wideo. Przekształcenie odwrotne może być wykonane na podstawie jednostki przekształcenia określonej przez urządzenie kodujące wideo. Moduł przekształcania urządzenia kodującego wideo może selektywnie wykonywać transformacje DCT i DST w zależności od wielu elementów informacji, takich jak sposób predykcji, rozmiar bieżącego bloku i kierunek predykcji, itd., a moduł 225 przekształcenia odwrotnego urządzenia dekodującego wideo może wykonywać przekształcenie odwrotne na podstawie informacji dotyczących przekształcenia wykonywanego przez moduł przekształcania urządzenia kodującego wideo.

Moduł 230 predykcji może generować przewidywany blok na podstawie informacji generowania przewidywanego bloku dostarczonych z modułu 210 dekodowania entropijnego i informacji dotyczących wcześniej dekodowanego bloku lub obrazu dostarczonych z pamięci 240.

Podobnie do działania urządzenia kodującego wideo jak opisano powyżej, gdy jednostka predykcji i jednostka przekształcenia mają ten sam rozmiar przy wykonywaniu predykcji wewnątrzklatkowej, predykcja wewnątrzklatkowa na jednostce predykcji jest wykonywana na podstawie pikseli z lewej strony, górnego lewego piksela i górnych pikseli jednostki predykcji. Z drugiej strony, gdy jednostka

PL 231 160 B1 predykcji i jednostka przekształcenia mają różne rozmiary przy wykonywaniu predykcji wewnątrzklatkowej, predykcja wewnątrzklatkowa może być wykonana z wykorzystaniem pikseli referencyjnych na podstawie jednostki przekształcenia. Predykcja wewnątrzklatkowa z podziałem NxN może być wykonana tylko dla minimalnej jednostki kodowania.

Moduł 230 predykcji zawiera moduł określania jednostki predykcji, moduł predykcji międzyklatkowej i moduł predykcji wewnątrzklatkowej. Moduł określania jednostki predykcji może odbierać różne informacje, takie jak informacje o jednostce predykcji wprowadzane z modułu dekodowania entropijnego, informacje trybu predykcji sposobu predykcji wewnątrzklatkowej i informacje związane z predykcją ruchu dotyczące sposobu predykcji międzyklatkowej. Moduł określania jednostki predykcji może określać jednostkę predykcji w bieżącej jednostce kodowania i może określać, która spośród predykcji międzyklatkowej i predykcji wewnątrzklatkowej jest wykonywana na jednostce predykcji. Moduł predykcji międzyklatkowej może wykonywać predykcję międzyklatkową na bieżącej jednostce predykcji na podstawie informacji o co najmniej jednym obrazie spośród poprzedniego obrazu i następnego obrazu dla bieżącego obrazu zawierającego bieżącą jednostkę predykcji z wykorzystaniem informacji niezbędnych dla predykcji międzyklatkowej dla bieżącej jednostki predykcji dostarczanych z urządzenia kodującego wideo.

W celu wykonania predykcji międzyklatkowej, może być określone na podstawie jednostki kodowania to, czy sposób predykcji ruchu dla jednostki predykcji zawartej w jednostce kodowania jest trybem pomijania, trybem łączenia, czy trybem AMVP.

Moduł predykcji wewnątrzklatkowej może generować przewidywany blok na podstawie informacji pikseli w bieżącym obrazie. Gdy jednostka predykcji jest jednostką predykcji, na której wykonywana jest predykcja wewnątrzklatkowa, predykcja wewnątrzklatkowa może być wykonana na podstawie informacji trybu predykcji wewnątrzklatkowej dotyczących jednostki predykcji dostarczanych z urządzenia kodującego wideo. Moduł predykcji wewnątrzklatkowej może zawierać filtr AIS, moduł interpolacji piksela odniesienia i filtr DC. Filtr AIS wykonuje filtrowanie pikseli referencyjnych bieżącego bloku i to, czy należy zastosować filtr AIS może być określone w zależności od trybu predykcji dla bieżącej jednostki predykcji. Filtrowanie AIS może być wykonane na pikselach referencyjnych bieżącego bloku z wykorzystaniem trybu predykcji dla jednostki predykcji i informacji dotyczących filtra AIS dostarczanych z urządzenia kodującego wideo. Gdy tryb predykcji dla bieżącego bloku jest trybem nieobejmującym filtrowania AIS, filtr AIS może nie być stosowany.

Gdy tryb predykcji dla jednostki predykcji jest trybem predykcji dla wykonywania predykcji wewnątrzklatkowej na podstawie wartości pikseli otrzymanych przez interpolowanie pikse li referencyjnych, moduł interpolacji piksela odniesienia może generować piksele referencyjne w jednostce piksela mniejszej niż całkowitoliczbowa jednostka pozycji przez interpolowanie pikseli referencyjnych. Gdy tryb predykcji dla bieżącej jednostki predykcji jest trybem predykcji dla generowania przewidywanego bloku bez interpolowania pikseli referencyjnych, piksele referencyjne mogą nie być interpolowane. Filtr DC może generować przewidywany blok poprzez filtrowanie, gdy trybem predykcji dla bieżącego bloku jest tryb DC.

Zrekonstruowany blok lub obraz może być dostarczony do modułu 235 filtra. Moduł 235 filtra może zawierać filtr rozbioru bloku, moduł korekcji przesunięcia lub filtr ALF.

Informacje o tym, czy filtr rozbioru bloku jest stosowany względem odpowiedniego bloku lub obrazu i informacje o tym, który filtr jest stosowany spośród silnego filtra i słabego filtra, gdy filtr rozbioru bloku jest wykorzystywany, mogą być dostarczone z urządzenia kodującego wideo. Filtr rozbioru bloku urządzenia dekodującego wideo może mieć dostarczone informacje dotyczące filtrowania rozbioru bloku z urządzenia kodującego wideo i może wykonywać filtrowanie rozbioru bloku względem odpowiedniego bloku.

Moduł korekcji przesunięcia może wykonywać korekcję przesunięcia na zrekonstruowanym obrazie na podstawie typu korekcji przesunięcia i informacji o wartości przesunięcia zastosowanego względem obrazu w procesie kodowania.

Filtr ALF może być stosowany względem jednostki kodowania na podstawie informacji o tym, czy filtr ALF jest stosowany czy nie, i informacji o współczynniku ALF dostarczanych z urządzenia kodującego. Informacje o filtrze ALF mogą być zawarte i dostarczone w określonym zestawie parametrów.

Pamięć 240 może przechowywać zrekonstruowany obraz lub blok do wykorzystania jako obraz referencyjny lub blok referencyjny, i może dostarczać zrekonstruowany obraz do modułu wyjściowego.

PL 231 160 B1

Jak opisano powyżej, w przykładach użytecznych dla zrozumienia wynalazku, określenie „jednostka kodowania” jest stosowane jako jednostka kodowania i może być także wykorzystana jako jednostka dekodowania (jednostka dekodowania).

Jak zilustrowano na fig. 1 i 2, moduły przekształcania urządzenia kodującego i urządzenia dekodującego mogą wykonywać przekształcenie oparte na bloku, takie jak transformacja DST lub DCT, na bloku resztkowym (bloku przekształcenia).

W tym przypadku, jeżeli blok resztkowy jest generowany na podstawie przewidywanego bloku generowanego przez predykcję wewnątrzklatkową, przekształcenie może być określone zgodnie z trybem predykcji.

FIG. 3 schematycznie przedstawia tryb predykcji wykorzystywany dla predykcji wewnątrzklatkowej. Odnosząc się do FIG. 3, predykcja wewnątrzklatkowa jest przeprowadzana z wykorzystaniem dwóch trybów predykcji bezkierunkowej i 32 trybów predykcji kierunkowej.

Urządzenie kodujące i urządzenie dekodujące mogą wykonywać predykcję wewnątrzklatkową na bieżącym bloku z wykorzystaniem trybu predykcji wybranego spośród dwóch trybów predykcji bezkierunkowej, trybu płaskiego i trybu DC, oraz 32 trybów predykcji kierunkowej odpowiadających kierunkom przedstawionym na FIG. 3.

Gdy wykorzystywany jest tryb predykcji kierunkowej wewnątrzklatkowej, urządzenie kodujące i urządzenie dekodujące mogą wykonywać predykcję na bieżącym bloku w celu generowania przewidywanego bloku na podstawie próbek znajdujących się w odpowiednim kierunku wśród próbek sąsiednich dla bieżącego bloku.

Zatem, jak opisano powyżej, urządzenie kodujące i urządzenie dekodujące mogą określać sposób przekształcania na podstawie trybu predykcji wykorzystywanego do generowania przewidywanego bloku.

Natomiast, gdy zawarty jest rzadki sygnał, lub gdy sygnały poziome i pionowe mają różne charakterystyki, przekształcenie pionowe lub przekształcenie poziome może być pominięte lub oba przekształcenia mogą być pominięte dla sygnału, redukując w ten sposób złożoność przetwarzania w urządzeniu dekodującym i poprawiając wydajność kodowania.

Dla urządzenia kodującego, tryb pomijania przekształcenia (TSM) jest sposobem zwiększania wydajności kodowania przez wykonanie wszystkich 2-wymiarowych (2D) przekształceń, pomijając przekształcenie pionowe lub przekształcenie poziome, lub pomijając zarówno przekształcenie poziome, jak i przekształcenie pionowe.

Wśród trybów pomijania przekształcenia, TS0 jest trybem wykonywania przekształcenia 2D na bloku przekształcenia. TS1 jest trybem wykonywania przekształcenia tylko na wierszach w bloku przekształcenia (przekształcenie na wierszach), a TS2 jest trybem wykonywania przekształcenia tylko na kolumnach w bloku przekształcenia (przekształcenie na kolumnach). TS3 jest trybem bez wykonywania ani przekształcenia na wierszach (przekształcenia poziomego), ani przekształcenia na kolumnach (przekształcenia pionowego).

Dla urządzenia dekodującego, tryb pomijania przekształcenia jest sposobem wykonywania wszystkich przekształceń odwrotnych 2D, pomijania pionowego przekształcenia odwrotnego lub poziomego przekształcenia odwrotnego, lub pomijania zarówno poziomego, jak i pionowego przekształcenia odwrotnego.

Na przykład, w procesie dekodowania, wśród trybów pomijania przekształcenia, TS0 jest trybem wykonywania przekształcenia odwrotnego 2D na bloku przekształcenia. TS1 jest trybem wykonywania przekształcenia odwrotnego tylko na wierszach w bloku przekształcenia (przekształcenie odwrotne na wierszach), a TS2 jest trybem wykonywania przekształcenia odwrotnego tylko na kolumnach w bloku przekształcenia (przekształcenie odwrotne na kolumnach). TS3 jest trybem bez wykonywania ani przekształcenia odwrotnego na wierszach (poziomego przekształcenia odwrotnego), ani przekształcenia odwrotnego na kolumnach (pionowego przekształcenia odwrotnego).

FIG. 4 schematycznie przedstawia tryb pomijania przekształcenia.

Gdy wykorzystywany jest tryb TS0 400 w urządzeniu kodującym, przekształcenie 2D jest stosowane względem bloku przekształcenia. W tym przypadku, gdy wykorzystywany jest tryb TS0 400, przekształcenie poziome może być wykonane przed przekształceniem pionowym lub przekształcenie pionowe może być wykonane przed przekształceniem poziomym. Gdy wykorzystywany jest tryb TS1 420, przekształcenie poziome jest wykonywane na bloku przekształcenia. Gdy wykorzystywany jest tryb TS2 440, przekształcenie pionowe jest wykonywane na bloku przekształcenia. Gdy wykorzystywany jest tryb

PL 231 160 B1

TS3 460, na bloku przekształcenia nie jest wykonywane ani przekształcenie poziome, ani przekształcenia pionowe.

Gdy wykorzystywany jest tryb TS0 400 w urządzeniu dekodującym, przekształcenie odwrotne 2D jest stosowane względem bloku przekształcenia. W tym przypadku, gdy wykorzystywany jest tryb TSO 400, poziome przekształcenie odwrotne może być wykonane przed pionowym przekształceniem odwrotnym lub pionowe przekształcenie odwrotne może być wykonane przed poziomym przekształceniem odwrotnym. Gdy wykorzystywany jest tryb TS1 420, poziome przekształcenie odwrotne jest wykonywane na bloku przekształcenia. Gdy wykorzystywany jest tryb TS2 440, pionowe przekształcenie odwrotne jest wykonywane na bloku przekształcenia. Gdy wykorzystywany jest tryb TS3 460, na bloku przekształcenia nie jest wykonywane ani poziome przekształcenie odwrotne, ani pionowe przekształcenie odwrotne.

Tabela 1 ilustruje słowo kodowe przydzielone do każdego trybu w trybach pomijania przekształcenia.

[T a b e l a 1]

TSM	Przekształcenie na wierszach	Przekształcenie na kolumnach	Słowo kodowe	Opis
TS0	O	O	1	Przekształcenie 2D
TS1	O	-	01	Przekształcenie 1D
TS2	-	O	001	Przekształcenie 1D
TS3	-	-	000	Bez przekształcenia

Gdy stosowany jest tryb pomijania przekształcenia, skalowanie może być wykonane bez zmiany lub modyfikowania macierzy kwantyzacji.

Równanie 1 ilustruje przykład skalowania, które ma być wykonane przez urządzenie kodujące i urządzenie dekodujące [Równanie 1]

Y = (X - skala + przesunięcie) >> przemieszczenie

W równaniu 1, X jest docelowym parametrem skalowania, a Y jest wartością skalowanego parametru. Współczynnik operacji przemieszczenia (przemieszczenie) może być adaptacyjnie określony w urządzeniu kodującym lub może być określony wcześniej.

Współczynnik skalowania (skala) jest zależny od rozmiaru jednostki TU i może być określony na podstawie rozmiaru jednostki TU. Tabela 2 ilustruje współczynnik skalowania zgodnie z rozmiarem bloku (na przykład, jednostki TU).

[T a b e l a 2]

N	4	8	16	32
Skala	128	181	256	362

Odnosząc się do tabeli 2, współczynnik skalowania może być określony zgodnie z rozmiarem bloku (NxN), na przykład, współczynnikiem skalowania dla bloku 4x4 jest 128, współczynnikiem skalowania dla bloku 8x8 jest 181, współczynnikiem skalowania dla bloku 16x16 jest 256, a współczynnikiem skalowania dla bloku 32x32 jest 362.

Mimo że w powyższym opisie stosowany jest tryb pomijania przekształcenia na podstawie trybu predykcji wewnątrzklatkowej, niniejszy wynalazek nie jest do tego ograniczony, a tryb pomijania przekształcenia może być także zastosowany w predykcji międzyklatkowej.

Tryb pomijania przekształcenia może być zastosowany na podstawie wykorzystanego trybu predykcji wewnątrzklatkowej, gdy stosowana jest predykcja wewnątrzklatkowa, natomiast tryb pomijania przekształcenia może być zastosowany na podstawie kształtu bloku, gdy stosowana jest predykcja międzyklatkowa.

Kształtami bloku, względem których predykcja międzyklatkowa może być zastosowana, są: kwadratowy blok 2Nx2N, blok minimalnych rozmiarów NxN, i asymetryczne bloki 2NxN, Nx2N, 2NxnU, 2NxnD, nLx2N i nRx2N, a tryb pomijania przekształcenia może być zastosowany na podstawie kształtu bloku.

Tabela 3 ilustruje tryby pomijania przekształcenia możliwe do zastosowania w predykcji międzyklatkowej.

PL 231 160 B1 [T a b e l a 3]

Natomiast, po przekształceniu bloku przekształcenia, inne przekształcenie może być stosowane względem dziedziny niskiej częstotliwości, które dla ułatwienia jest określane jako drugie przekształcenie. Na przykład, po zastosowaniu przekształcenia, transformacja DST może być stosowana względem dziedziny niskiej częstotliwości przez każdy blok 4x4 w celu zwiększenia wydajności.

Zastosowana transformacja DST jako drugie przekształcenie może być transformacją DST 2D, poziomą transformacją DST lub pionową transformacją DST zgodnie z trybami predykcji wewnątrzklatkowej zilustrowanymi na FIG. 3. Tabela 4 ilustruje rodzaje transformacji DST możliwe do zastosowania zgodnie z trybami predykcji wewnątrzklatkowej.

T a b e l a 4

IntraPred- Mode	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
horizTrType	0	1	0	1	1	0	0	1	1	1	1	1	0	0	1	1	1	1
vertTrType	1	0	0	1	1	1	1	1	0	0	1	1	1	1	1	1	0	0

IntraPred- Mode	18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34
horizTrType	1	1	1	1	0	0	0	0	1	1	1	1	1	1	1	1	1
vertTrType	1	1	1	1	1	1	1	1	1	1	1	1	0	0	0	0	1

Odnosząc się do tabeli 4, określone jest, czy należy wykonać poziomą transformację DST (horizTrType=1), czy pionową transformację DST (vertTrType=1) na podstawie trybu predykcji wewnątrzklatkowej.

Mimo że tabela 4 ilustruje, że to, czy należy wykonać poziomą transformację DST, czy pionową transformację DST jest określone na podstawie trybu predykcji wewnątrzklatkowej, to zarówno pionowa transformacja DST, jak i pozioma transformacja DST mogą być zastosowane przez bloki 4x4 niezależnie od trybów predykcji wewnątrzklatkowej.

Natomiast, gdy stosowany jest tryb pomijania przekształcenia, kwestię może stanowić to, jak zastosować drugie przekształcenie. W tym przypadku, drugie przekształcenie może być wykonane na podstawie zastosowanego trybu pomijania przekształcenia.

Na przykład, transformacja DST w drugim przekształceniu może być wykonana w ten sam sposób przekształcania, jak w trybie pomijania przekształcenia. W tym przypadku, jako przykład tego samego sposobu przekształcania jak został wykorzystany w trybie pomijania przekształcenia (TSM), może być rozważony kierunek przekształcenia. W szczególności, gdy tryb przekształcenia 2D TS0 jest stosowany jako tryb pomijania przekształcenia, transformacja DST 2D może być zastosowana jako drugie przekształcenie. Gdy przekształcenie poziome TS1 jest stosowane jako tryb pomijania przekształcenia, pozioma transformacja DST może być zastosowana jako drugie przekształcenie. Gdy przekształcenie pionowe TS2 jest stosowane jako tryb pomijania przekształcenia, pionowa transformacja DST może być zastosowana jako drugie przekształcenie. Gdy TS3 jest stosowane, to znaczy, gdy nie jest stosowane ani przekształcenie poziome, ani przekształcenie pionowe, drugie przekształcenie może nie być zastosowane.

PL 231 160 B1

T a b e l a 5 ilustruje typ drugiego przekształcenia (tryb) zgodnie z TSM

TSM	TS0	TS1	TS2	TS3
Drugie przekształcenie	horizTrType=1	1	1	0	0
vertTrType=1	1	0	1	0

Mimo że zilustrowano drugie przekształcenie w predykcji wewnątrzklatkowej, niniejszy wynalazek nie jest do tego ograniczony, a drugie przekształcenie może być zastosowane w ten sam sposób w predykcji międzyklatkowej. Na przykład, gdy została wykonana predykcja międzyklatkowa, drugie przekształcenie może być także zastosowane na podstawie trybu pomijania przekształcenia zastosowanego względem odpowiedniego bloku. W szczególności, gdy tryb przekształcenia 2D TS0 jest stosowany jako tryb pomijania przekształcenia, transformacja DST 2D może być zastosowana jako drugie przekształcenie. Gdy przekształcenie poziome TS1 jest stosowane jako tryb pomijania przekształcenia, pozioma transformacja DST może być zastosowana jako drugie przekształcenie. Gdy przekształcenie pionowe TS2 jest stosowane jako tryb pomijania przekształcenia, pionowa transformacja DST może być zastosowana jako drugie przekształcenie. Gdy TS3 jest stosowane, to znaczy, gdy nie jest stosowane ani przekształcenie poziome, ani przekształcenia pionowe, drugie przekształcenie może nie być stosowane.

FIG. 5 przedstawia sieć działań schematycznie ilustrującą proces kodowania przyjmujący tryb pomijania przekształcenia i drugie przekształcenie zgodnie z przedstawionym przykładem.

Odnosząc się do FIG. 5, urządzenie kodujące może dzielić obraz wejściowy (S510). Obra z wejściowy może być podzielony na bloki, takie jak jednostki CU, PU i TU.

Urządzenie kodujące może wykonywać predykcję dla docelowego bloku przetwarzania, który jest bieżącym blokiem (S520). Urządzenie kodujące może wykonywać predykcję międzyklatkową lub predykcję wewnątrzklatkową dla bieżącego bloku w celu generowania przewidywanego bloku i generować blok resztkowy na podstawie przewidywanego bloku.

Urządzenie kodujące może kodować informacje predykcji (S530). Urządzenie kodujące może kodować informacje dotyczące ruchu, gdy predykcja międzyklatkowa jest stosowana i kodować informacje wskazujące tryb predykcji wewnątrzklatkowej, gdy predykcja wewnątrzklatkowa jest stosowana.

Urządzenie kodujące może przekształcać resztkowy sygnał i kodować przekształcony resztkowy sygnał (S540). Urządzenie kodujące może stosować tryb pomijania przekształcenia względem resztkowego sygnału i wykonywać drugie przekształcenie na podstawie trybu pomijania przekształcenia.

Urządzenie kodujące może określać informacje do transmisji (S550). Urządzenie kodujące może określać poprzez optymalizację przepływność-zniekształcenie (RDO), co transmitować spośród bloku resztkowego i współczynników przekształcenia.

W celu transmitowania współczynników przekształcenia, urządzenie kodujące może skanować współczynniki przekształcenia (S560). Współczynniki przekształcenia są przeorganizowywane poprzez skanowanie.

Urządzenie kodujące może kodować entropijnie skanowane współczynniki przekształcenia (S570). Urządzenie kodujące może transmitować kodowane entropijnie współczynniki przekształcenia jako strumień bitów.

W dalszej części opisu, proces kodowania zilustrowany na FIG. 5 jest opisany szczegółowo.

Urządzenie kodujące może dzielić obraz wejściowy (S510). Obraz wejściowy jest dzielony dla kodowania. Na przykład, bieżący obraz lub klatka może być dzielony na jednostki kodowania (CU).

Jedna jednostka kodowania wewnętrznego CU może zawierać wiele jednostek predykcji międzyklatkowej PU i posiadać wiele trybów predykcji PreMode. Na przykład, wiele trybów predykcji może obejmować tryb pomijania MODE_SKIP i tryb międzyklatkowy MODE_INTER. W trybie pomijania, predykcja może być wykonana dla bloku mającego tryb podziału PartMode w postaci PART_2Nx2N, bez dzielenia na mniejsze jednostki predykcji PU. Zatem, predykcja jest wykonywana z wykorzystaniem informacji o ruchu dotyczących sąsiedniego bloku jako informacji o ruchu przydzielonych do jednostki predykcji PU PART_2Nx2N, a resztkowy sygnał nie jest transmitowany.

W trybie międzyklatkowym, jednostka kodowania może zawierać cztery rodzaje podziałów jednostki predykcji, na przykład, PART_2Nx2N, PART_2NxN, PART_Nx2N i PART_NxN. W tym przypadku, urządzenie kodujące może sygnalizować, że tryb predykcji PreMode jest trybem międzyklatkowym MODE_INTER i informacje PartMode wskazujące urządzeniu dekodującemu, który jest to typ podziału spośród czterech typów.

PL 231 160 B1

Gdy jednostka kodowania jest podzielona na wiele jednostek predykcji, predykcja może być wykonana dla jednostki predykcji, która ma być aktualnie zakodowana (bieżący blok).

Urządzenie kodujące może wykonywać predykcję dla docelowego bloku predykcji, to znaczy dla bieżącego bloku (S520).

Gdy predykcja międzyklatkowa jest wykonywana dla bieżącego bloku lub bieżącej jednostki predykcji, urządzenie kodujące może wykonywać predykcję ruchu dla bieżącego bloku z wykorzystaniem poprzednich obrazów. Lub, gdy predykcja międzyklatkowa jest wykonywana dla bieżącego bloku lub bieżącej jednostki predykcji, urządzenie kodujące może wykonywać predykcję ruchu dla bieżącego bloku z wykorzystaniem klatek; lub poprzedniego i następnego obrazu; lub klatek. Informacje dotyczące ruchu obejmujące wektor ruchu i wykaz obrazów referencyjnych, itd. mogą być otrzymane przez predykcję ruchu. Gdy predykcja wewnątrzklatkowa jest wykonywana dla bieżącego bloku, urządzenie kodujące może wykonywać predykcję wewnątrzklatkową dla bieżącego bloku z wykorzystaniem próbek sąsiadujących z bieżącym blokiem i wyznaczać tryb predykcji wewnątrzklatkowej.

Informacje dotyczące bieżącej jednostki predykcji nie są transmitowane w swojej postaci, lecz wartość różnicowa względem przewidzianej wartości otrzymanej z sąsiednich bloków może być transmitowana, aby zwiększyć wydajność kompresji. W tym przypadku, w trybie pomijania, predykcja jest wykonywana z wykorzystaniem informacji o ruchu dotyczących sąsiedniego bloku jako informacji o ruchu dotyczących bieżącego bloku, ale wartość różnicowa nie jest transmitowana.

W trybie łączenia i trybie AMVP, predykcja jest wykonywana z wykorzystaniem informacji o ruchu dotyczących sąsiedniego bloku i wartość różnicowa (resztkowy sygnał) jest transmitowana.

W celu otrzymania przewidywanej wartości ruchu bieżącego bloku 600, urządzenie kodujące może utworzyć potencjalną listę łączenia i potencjalną listę AMVP. Potencjalne listy mogą być utworzone na podstawie potencjalnych bloków przestrzennych A0, A1, B0, B1 i B2 sąsiadujących z bieżącym blokiem 600 i odpowiedniego bloku we współumiejscowionym obrazie 610 jako tymczasowego potencjalnego bloku. W tym przypadku, tymczasowy potencjalny blok może być jednym spośród: C0, C3, BR i H. Na potencjalnej liście łączenia, potencjalne bloki A (A0 >A1), B (B0 >B1 >B2) i tymczasowy potencjalny blok mogą być rozpatrywane w kolejności. Na potencjalnej liście AMVP, potencjalne bloki mogą być rozpatrywane w tej samej kolejności jak w przypadku potencjalnej listy łączenia lub potencjalne bloki mogą być rozpatrywane w kolejności tymczasowego potencjalnego bloku, A (A0>A1) i B (B0>B1>B2).

Urządzenie kodujące może wykonywać predykcję dla bieżącego bloku z wykorzystaniem informacji o ruchu dotyczących potencjalnych bloków.

Gdy stosowany jest tryb łączenia, urządzenie kodujące wyznacza potencjalne łączenia na podstawie informacji o ruchu dotyczących bloków tymczasowo i przestrzennie sąsiadujących z bieżącym blokiem (na przykład, jednostką predykcji). Jeżeli potencjalny blok posiadający te same informacje o ruchu jak bieżący blok jest obecny wśród potencjalnych bloków, urządzenie kodujące transmituje znacznik wskazujący, że tryb łączenia jest wykorzystywany i indeks potencjalnego bloku zawierającego te same informacje dotyczące ruchu jak bieżący blok. Na przykład, w trybie łączenia, (i) urządzenie kodujące może wyznaczać dostępną tymczasową wartość predykcji wektora ruchu z wykorzystaniem wyznaczonego indeksu obrazu referencyjnego (refldxLX, X=0 lub 1). (ii) Urządzenie kodujące może utworzyć potencjalną listę łączenia (MergeCandList). (iii), gdy obecny jest potencjalny blok zawierający te same informacje dotyczące ruchu jak bieżący blok, urządzenie kodujące ustawia znacznik łączenia (Merge_flag) równy 1 i koduje indeks (Merge_Idx) dla potencjalnego bloku.

W trybie AMVP, urządzenie kodujące wyznacza potencjalne bloki AMVP na podstawie informacji o ruchu dotyczących bloków tymczasowo i przestrzennie sąsiadujących z bieżącym blokiem (na przykład, jednostką PU). (i) Urządzenie kodujące wyznacza potencjalne predyktory przestrzennego wektora ruchu (MVP) spośród sąsiednich bloków (na przykład, jednostek PU) dla bieżącego bloku. Sąsiednie bloki przedstawione na FIG. 6 mogą być wykorzystane do wyznaczenia potencjalnych przestrzennych wektorów ruchu. (ii) Urządzenie kodujące wyznacza tymczasowy potencjalny wektor ruchu współumiejscowionego bloku z wykorzystaniem indeksu obrazu referencyjnego (RefldxLX) otrzymanego w procesie oszacowania ruchu. (iii) Urządzenie kodujące tworzy listę MVP (mvpListLX). W tym przypadku, wektory ruchu mogą mieć priorytety w kolejności: © wektor ruchu tymczasowego współumiejscowionego bloku (mvLXCol), na przykład, współumiejscowiony blok może być jednym z odpowiednich bloków: C0, C3, BR i H z FIG. 6, © wektory ruchu sąsiadujących bloków po lewej stronie bieżącego bloku (mvLXA)

PL 231 160 B1 i ® wektory ruchu sąsiadujących bloków po górnej stronie bieżącego bloku (mvLXB), spośród dostępnych wektorów ruchu. W tym przypadku, dostępne bloki, takie jak współumiejscowiony blok, sąsiednie bloki po lewej stronie bieżącego bloku i sąsiednie bloki po górnej stronie bieżącego bloku, są zilustrowane powyżej na FIG. 6. (iv), gdy wiele wektorów ruchu ma tę samą wartość, urządzenie kodujące usuwa wektory ruchu innej niż wektor ruchu mający najwyższy priorytet wśród wektorów ruchu mających tę samą wartość z listy MVP. (v) Urządzenie kodujące ustawia optymalny MVP wśród potencjalnych wektorów ruchu na liście MVP (mvListLX) jako MVP dla bieżącego bloku. Optymalny MVP stanowi MVP potencjalnego bloku minimalizujący funkcję kosztu.

Natomiast, gdy tryb predykcji wewnątrzklatkowej jest stosowany, urządzenie kodujące wykonuje predykcję z wykorzystaniem próbek sąsiadujących z bieżącym blokiem. Urządzenie kodujące może określać optymalny tryb predykcji wewnątrzklatkowej z wykorzystaniem optymalizacji RDO. W trybie DC lub trybie płaskim, urządzenie kodujące może generować przewidywany blok dla bieżącego bloku z wykorzystaniem wartości piksela wyznaczonej na podstawie średniej wartości pikseli sąsiednich próbek lub wartości pikseli sąsiednich próbek niezależnie od kierunku sąsiednich próbek. Gdy wykorzystywany jest tryb kierunkowy, urządzenie kodujące może generować przewidywany blok dla bieżącego bloku z wykorzystaniem próbki w kierunku wskazanym przez tryb predykcji wewnątrzklatkowej dla bieżącego bloku.

Urządzenie kodujące może kodować informacje predykcji (S530).

W trybie łączenia, gdy potencjalny blok zawiera te same informacje dotyczące ruchu jak bieżący blok (na przykład, jednostka PU) wśród potencjalnych bloków łączenia, urządzenie kodujące wskazuje, że bieżący blok jest w trybie łączenia i transmituje znacznik łączenia wskazujący, że tryb łączenia jest wykorzystywany i indeks łączenia (Merge_Idx) wskazujący, który potencjalny blok jest wybrany spośród potencjalnych bloków łączenia. Urządzenie kodujące otrzymuje sygnał różnicowy (resztkowy sygnał) między bieżącym blokiem i blokiem przewidywanym przez tryb łączenia po kompensacji ruchu. Gdy nie występuje resztkowy sygnał do transmisji, urządzenie kodujące może transmitować informacje wskazujące, że wykorzystywany jest tryb pomijania łączenia.

W trybie AMVP, urządzenie kodujące określa potencjalny blok minimalizujący funkcję kosztu spośród potencjalnych bloków AMVP przez porównywanie informacji wektora ruchu potencjalnych bloków AMVP i informacji wektora ruchu bloku, który ma być aktualnie zakodowany. Urządzenie kodujące otrzymuje wartość różnicową w informacjach dotyczących ruchu między bieżącym blokiem i potencjalnym blokiem minimalizującym funkcję kosztu, i resztkowy sygnał przez kompensację ruchu z wykorzystaniem potencjalnego bloku AMVP. Urządzenie kodujące koduje entropijnie różnicę wektora ruchu między wektorem ruchu bieżącego bloku (na przykład, jednostki predykcji) i wektorem ruchu potencjalnego bloku (optymalnego predyktora) minimalizującego funkcję kosztu.

Gdy wykorzystywana jest predykcja wewnątrzklatkowa, urządzenie kodujące uzyskuje resztkowy sygnał jako różnicę między bieżącym blokiem i przewidywanym blokiem generowanym z wykorzystaniem trybu predykcji wewnątrzklatkowej. Urządzenie kodujące może kodować entropijnie resztkowy sygnał. Urządzenie kodujące może także kodować informacje wskazujące, że stosowany jest tryb predykcji wewnątrzklatkowej.

Jak opisano powyżej, urządzenie kodujące może przekształcać i kodować resztkowy sygnał generowany za pomocą predykcji (S540). Urządzenie kodujące może wyznaczać resztkowy sygnał przez otrzymywanie różnicy między wartością piksela bieżącego bloku i wartością piksela przewidywanego bloku z pikselem jako jednostką.

Urządzenie kodujące może przekształcać i kodować generowany resztkowy sygnał. W tym przypadku, dostępnymi jądrami przekształcania i kodowania mogą być bloki 2x2, 4x4, 8x8, 16x16, 32x32 i 64x64, wśród których może być wcześniej ustalone z góry określone jądro kodowania jako jądro do wykorzystania dla przekształcenia.

Gdy wykorzystywana jest predykcja wewnątrzklatkowa, urządzenie kodujące może określać tryb pomijania przekształcenia na podstawie kierunku trybu predykcji wewnątrzklatkowej. Mimo że powyższy opis ilustruje, że tryb pomijania przekształcenia jest określony zgodnie z kierunkiem trybu predykcji wewnątrzklatkowej, urządzenie kodujące może określać tryb pomijania przekształcenia na podstawie optymalizacji RDO i może sygnalizować informacje o określonym trybie pomijania przekształcenia. W tym przypadku, liczba potencjalnych trybów pomijania przekształcenia może być określona inaczej zgodnie z kierunkami trybów predykcji wewnątrzklatkowej. Ponadto, informacje wskazujące tryby pomijania przekształcenia mogą być kodowane z wykorzystaniem różnych słów kodowych na p odstawie kierunków trybów predykcji wewnątrzklatkowej.

PL 231 160 B1

Gdy wykorzystywana jest predykcja międzyklatkowa, urządzenie kodujące może określać tryb pomijania przekształcenia na podstawie kształtu bieżącego bloku (na przykład, jednostki predykcji). Mimo że powyższy opis ilustruje, że tryb pomijania przekształcenia jest określony na podstawie kształtu bieżącego bloku, urządzenie kodujące może określać tryb pomijania przekształcenia na podstawie optymalizacji RDO i może sygnalizować informacje o określonym trybie pomijania przekształcenia. W tym przypadku, liczba potencjalnych trybów pomijania przekształcenia może być określona inaczej na podstawie kształtów bieżącego bloku. Ponadto, informacje wskazujące tryby pomijania przekształcenia mogą być kodowane z wykorzystaniem różnych słów kodowych na podstawie kształtów bieżącego bloku.

Urządzenie kodujące może wykonywać przekształcenie 2D, przekształcenie 1D (przekształcenie na kolumnach i przekształcenie na wierszach) lub pomijanie przekształcenia zgodnie z trybem pomijania przekształcenia.

Natomiast, ten sam tryb pomijania przekształcenia jak dla składowej jasności może być stosowany względem składowej chrominancji.

Po zastosowaniu trybu pomijania przekształcenia, urządzenie kodujące może wykonywać drugie przekształcenie na podstawie zastosowanego trybu pomijania przekształcenia. Drugie przekształcenie może być wykonywane przez stosowanie transformacji DST względem każdego bloku 4x4. Urządzenie kodujące określa typ drugiego przekształcenia na podstawie trybu pomijania przekształcenia i stosuje określony typ drugiego przekształcenia względem dziedziny niskiej częstotliwości. Na przykład, urządzenie kodujące może wykonywać transformację DST w dziedzinie niskiej częstotliwości z wykorzystaniem bloku o rozmiarze 4x4.

Jako typ drugich sposobów przekształcania określony zgodnie z trybami pomijania przekształcenia, jak opisano powyżej, transformacja DST 2D jest stosowana jako drugie przekształcenie, gdy tryb przekształcenia 2D TS0 jest stosowany jako tryb pomijania przekształcenia; pozioma transformacja DST jest stosowana jako drugie przekształcenie, gdy przekształcenie poziome TS1 jest stosowane jako tryb pomijania przekształcenia; pionowa transformacja DST jest stosowana jako drugie przekształcenie, gdy przekształcenie pionowe TS2 jest stosowane jako tryb pomijania przekształcenia; i drugie przekształcenie może nie być stosowane, gdy TS3 jest stosowane, to znaczy, gdy nie jest stosowane ani przekształcenie poziome, ani przekształcenia pionowe.

Natomiast, współczynnik przekształcenia C dla bloku n x n może być określone przez równanie 2. [Równanie 2]

C(n, n) = T(n, n) x B(n, n) x T(n, n)^T

W równaniu 2, T jest macierzą przekształcenia, a B jest blokiem resztkowym.

Urządzenie kodujące kwantyzuje współczynniki przekształcenia.

Urządzenie kodujące może określać informacje do transmisji (S550). Urządzenie kodujące może określać, co będzie transmitować spośród resztkowego sygnału i współczynników przekształcenia za pomocą optymalizacji przepływność-zniekształcenie (RDO). Jeżeli resztkowy sygnał jest mały, gdy predykcja jest prawidłowo wykonana, urządzenie kodujące może transmitować resztkowy sygnał w jego postaci. Alternatywnie, urządzenie kodujące może transmitować informacje, które minimalizują koszt przez porównanie kosztów przed i po przekształceniu i kodowaniu. Gdy określone są informacje do transmisji, urządzenie kodujące może sygnalizować typ określonych informacji, to znaczy, czy określone informacje stanowią resztkowy sygnał czy współczynniki przekształcenia.

FIG. 7 przedstawia sieć działań schematycznie ilustrującą proces dekodowania przyjmujący tryb pomijania przekształcenia i drugie przekształcenie zgodnie z przedstawionym przykładem.

Odnosząc się do FIG. 7, urządzenie dekodujące dekoduje entropijnie strumień bitów odebrany z urządzenia kodującego (S710). Urządzenie dekodujące może wykonywać dekodowanie entropijne z wykorzystaniem odpowiedniego sposobu dla kodowania entropijnego stosowanego przez urządzenie kodujące.

PL 231 160 B1

Urządzenie dekodujące może przekształcać odwrotnie entropijnie dekodowane informacje (S720). Urządzenie dekodujące może skanować odwrotnie entropijnie dekodowane inform acje w celu generowania dwuwymiarowego bloku.

Urządzenie dekodujące wykonuje predykcję dla bieżącego bloku (na przykład, jednostki PU) (S730). Urządzenie dekodujące może generować przewidywany blok dla bieżącego bloku zgodnie ze sposobem predykcji wykorzystywanym dla urządzenia kodującego.

Urządzenie dekodujące może generować zrekonstruowany sygnał dla bieżącego bloku (S740). Urządzenie dekodujące może dodawać przewidywany blok i blok resztkowy w celu rekonstruowania bieżącego bloku.

W dalszej części opisu, proces dekodowania zilustrowany na fig. 7 jest szczegółowo opisany.

Na początku, urządzenie dekodujące dekoduje entropijnie strumień bitów odebrany z urządzenia kodującego (S710). Urządzenie dekodujące może otrzymywać, z odebranego strumienia bitów, typ bloku dla bieżącego bloku i informacje dotyczące trybu predykcji dla bieżącego bloku. Na przykład, gdy wykorzystywane jest kodowanie o zmiennej długości słowa (VLC) względem bieżącego bloku w kodowaniu entropijnym.

Urządzenie dekodujące może określić na podstawie typu informacji, czy transmitowane informacje dotyczące bieżącego bloku stanowią sygnały resztkowe czy współczynniki przekształcenia. Urządzenie dekodujące może otrzymywać informacje dotyczące resztkowego sygnału lub współczynników przekształcenia bieżącego bloku.

Urządzenie dekodujące może przekształcać odwrotnie entropijnie dekodowane informacje (S720). Urządzenie dekodujące może skanować odwrotnie entropijnie dekodowany resztkowy sygnał lub współczynnik przekształcenia w celu generowania dwuwymiarowego bloku.

Gdy predykcja wewnątrzklatkowa jest stosowana względem bieżącego bloku, urządzenie dekodujące może wyznaczać tryb pomijania przekształcenia na podstawie trybu predykcji wewnątrzklatkowej i wykonywać przekształcenie odwrotne zgodnie z wyznaczonym trybem pomijania przekształcenia. Gdy tryb pomijania przekształcenia jest określony niezależnie od trybu predykcji wewnątrzklatkowej (na przykład, określony na podstawie optymalizacji RDO), urządzenie dekodujące może dekodować informacje, odebrane z urządzenia kodującego, wskazujące tryb pomijania przekształcenia i wykonywać proces przekształcania odwrotnego zgodnie z trybem pomijania przekształcenia.

Gdy predykcja międzyklatkowa jest stosowana względem bieżącego bloku, urządzenie dekodujące może wyznaczać tryb pomijania przekształcenia na podstawie kształtu bieżącego bloku (na przykład, jednostki predykcji) i wykonywać przekształcenie odwrotne zgodnie z wyznaczonym trybem pomijania przekształcenia. Gdy tryb pomijania przekształcenia jest określony niezależnie od kształtu bieżącego bloku (na przykład, określony na podstawie optymalizacji RDO), urządzenie dekodujące może dekodować informacje, odebrane z urządzenia kodującego, wskazujące tryb pomijania przekształcenia i wykonywać przekształcenie odwrotne zgodnie z informacjami odebranymi z urządzenia kodującego.

Te same informacje jak informacje wykorzystywane dla składowej jasności mogą być ponownie wykorzystane do określania trybu pomijania przekształcenia dla składowej chrominancji.

Po zastosowaniu trybu pomijania przekształcenia, urządzenie dekodujące może wykonywać drugie przekształcenie odwrotne na podstawie trybu pomijania przekształcenia zastosowanego względem bieżącego bloku. Drugie przekształcenie odwrotne może być wykonywane przez zastosowanie odwrotnej transformacji DST względem każdego bloku 4x4. Urządzenie dekodujące określa typ drugiego sposobu odwrotnego przekształcania na podstawie trybu pomijania przekształcenia i stosuje określony typ drugiego przekształcenia odwrotnego względem dziedziny niskiej częstotliwości. Na przykład, urządzenie dekodujące może wykonywać odwrotną transformację DST w dziedzinie niskiej częstotliwości z wykorzystaniem bloku o rozmiarze 4x4.

Jako typ drugiego przekształcenia odwrotnego określony zgodnie z trybami pomijania przekształcenia, odwrotna transformacja DST 2D jest stosowana jako drugie przekształcenie odwrotne, gdy odwrotne przekształcenie 2D TS0 jest stosowane jako tryb pomijania przekształcenia; odwrotna pozioma transformacja DST jest stosowana jako drugie przekształcenie odwrotne, gdy odwrotne przekształcenie poziome TS1 jest stosowane jako tryb pomijania przekształcenia; odwrotna pionowa transformacja DST jest stosowana jako drugie przekształcenie odwrotne, gdy odwrotne przekształcenie pionowe TS2 jest stosowane jako tryb pomijania przekształcenia; i drugie przekształcenie odwrotne może nie być stosowane, gdy TS3 jest stosowane jako tryb pomijania przekształcenia, to znaczy, gdy nie jest stosowane ani odwrotne przekształcenie poziome, ani odwrotne przekształcenie pionowe.

PL 231 160 B1

Gdy transmitowany sygnał jest resztkowym sygnałem, urządzenie dekodujące może generować blok resztkowy na podstawie resztkowego sygnału.

Gdy transmitowany sygnał jest współczynnikiem przekształcenia, urządzenie dekodujące może generować blok współczynnika przekształcenia na podstawie współczynnika przekształcenia. Urządzenie dekodujące może dekwantyzować i przekształcać odwrotnie blok współczynnika przekształcenia w celu wyznaczenia bloku resztkowego.

Równanie 3 ilustruje przykład przekształcenia odwrotnego stosowanego względem bieżącego bloku współczynnika przekształcenia.

[Równanie 3]

B(n, n) = T(n, n) x C(n, n) x T(n, n)^T

W równaniu 3, każdy współczynnik jest taki sam, jak opisano powyżej w równaniu 2.

Urządzenie dekodujące wykonuje predykcję dla bieżącego bloku (na przykład, jednostki predykcji) (S730).

Nawet jeżeli informacje transmitowane z urządzenia kodującego wskazują, że tryb predykcji jest trybem pomijania (PredMode=MODE_SKIP), urządzenie dekodujące może otrzymywać wektor ruchu (mvLX) i indeks obrazu referencyjnego za pomocą trybu łączenia, gdy znacznik łączenia ma wartość wynoszącą 1.

Urządzenie dekodujące może wyznaczać potencjalne bloki łączenia spośród bloków (na przykład, jednostek predykcji) sąsiadujących z bieżącym blokiem (na przykład, jednostką predykcji). Ponadto, urządzenie dekodujące może wyznaczać indeks obrazu referencyjnego (refldxLX) tak, aby otrzymać tymczasowy potencjalny blok łączenia. Potencjalne bloki łączenia zostały zilustrowane na FIG. 6.

Urządzenie dekodujące wyznacza dostępną tymczasową wartość predyktora wektora ruchu (MUP) z wykorzystaniem wyznaczonego indeksu obrazu referencyjnego.

Gdy liczba potencjalnych bloków (NumMergeCand) na potencjalnej liście łączenia (MergeCandList) wynosi 1, urządzenie dekodujące może ustawić indeks łączenia (Merge_Idx) równy 1. W innym przypadku, urządzenie dekodujące może ustawić indeks łączenia równy wartości indeksu odebranego z urządzenia kodującego.

Urządzenie dekodujące może wyznaczać wektor ruchu (mvLX) potencjalnego bloku łączenia wskazanego przez indeks łączenia i indeks obrazu referencyjnego (refldxLX), i wykonywać kompensację ruchu z wykorzystaniem wyznaczonego wektora ruchu i indeksu obrazu referencyjnego.

Gdy stosowany jest tryb AMVP, urządzenie dekodujące może wyznaczać indeks obrazu referencyjnego (refldxLX) bieżącego bloku (na przykład, jednostki predykcji).

Urządzenie dekodujące może wyznaczać wartość predyktora wektora ruchu (MVP) z wykorzystaniem indeksu obrazu referencyjnego.

W tym celu, urządzenie dekodujące może wyznaczać potencjalne przestrzenne wektory ruchu (MVP) na podstawie bloków (na przykład, jednostek predykcji) sąsiadujących z bieżącym blokiem. Urządzenie dekodujące może także wyznaczać tymczasowy predyktor wektora ruchu (MVP) współumiejscowionego bloku wskazanego przez indeks obrazu referencyjnego. Urządzenie dekodujące może tworzyć listę MVP (mvpListLX). W tym przypadku, wektory ruchu mogą mieć priorytety w kolejności: © wektor ruchu tymczasowego współumiejscowionego bloku (mvLXCol), na przykład, tymczasowy współumiejscowiony blok może być jednym z odpowiednich bloków: C0, C3, BR i H na FIG. 6, ®) wektory ruchu sąsiadujących bloków po lewej stronie bieżącego bloku (mvLXA) i ® wektory ruchu sąsiadujących bloków po górnej stronie bieżącego bloku (mvLXB) spośród dostępnych wektorów.

Gdy wiele wektorów ruchu ma tę samą wartość, urządzenie dekodujące może usuwać z listy MVP wektory ruchu inne niż wektor ruchu mający najwyższy priorytet spośród wektorów ruchu mających tę samą wartość.

Gdy liczba (NumMVPCand(LX)) potencjalnych MVP na liście MVP wynosi 1, urządzenie dekodujące może ustawić indeks mvpldx równy 1. Gdy liczba potencjalnych MVP wynosi 2 lub więcej, urządzenie dekodujące może ustawić indeks mvpldx równy wartości indeksu odebranej z urządzenia kodującego. Urządzenie dekodujące umieszcza wektor ruchu wskazany przez indeks mvpldx spośród potencjalnych MVP na liście mvpListLX jako wartość predyktora wektora ruchu mvpLX.

Urządzenie dekodujące może wyznaczać wektor ruchu dla bieżącego bloku z wykorzystaniem równania 4.

PL 231 160 B1 [Równanie 4] mvLX[0] = mvdLX[0] + mvpLX[0] mvLX[l] = mvdLX[l] + mvpLX[1]

W równaniu 4, mvLX[0] jest składową x wektora ruchu dla bieżącego bloku, mvdLX[0] jest składową x wartości różnicowej wektora ruchu dla bieżącego bloku, a mvpLX[0] jest składową x wartości predyktora wektora ruchu dla bieżącego bloku. mvLX[1] jest składową y wektora ruchu dla bieżącego bloku, mvdLX[1] jest składową y wartości różnicowej wektora ruchu dla bieżącego bloku, a mvpLX[1] jest składową y wartości predyktora wektora ruchu dla bieżącego bloku.

Natomiast, gdy stosowana jest predykcja wewnątrzklatkowa, urządzenie dekodujące może generować przewidywany blok dla bieżącego bloku na podstawie sąsiednich próbek z wykorzystaniem trybu predykcji wewnątrzklatkowej dla bieżącego bloku.

Urządzenie dekodujące może generować zrekonstruowany sygnał dla bieżącego bloku (S740). Gdy stosowana jest predykcja międzyklatkowa, urządzenie dekodujące może generować przewidywany blok z wykorzystaniem wyznaczonego wektora ruchu i dodawać przewidywany blok i blok resztkowy w celu rekonstruowania bieżącego bloku. Gdy stosowana jest predykcja wewnątrzklatkowa, urządzenie dekodujące może także dodać przewidywany blok i blok resztkowy w celu rekonstruowania bieżącego bloku jak opisano.

Mimo że sposoby zostały opisane przez ciąg etapów lub bloków na podstawie sieci działań we wcześniej wspomnianych przykładach wykonania, niniejszy wynalazek nie jest ograniczony do wyżej wspomnianej sekwencji etapów. Niektóre etapy mogą być wykonane w innej kolejności niż kolejność opisana powyżej lub w tym samym czasie. Ponadto, wspomniane wyżej przykłady wykonania obejmują przykłady różnych aspektów. Na przykład, zilustrowane przykłady wykonania mogą być uzyskane w różnych kombinacjach w zakresie niniejszego wynalazku. Znawcy z dziedziny zauważą, że można dokonać zmian, modyfikacji i alternatyw w tych przykładach wykonania bez odchodzenia od zasad i istoty wynalazku, którego zakres jest określony w dołączonych zastrzeżeniach i ich ekwiwalentach.

Claims

Zastrzeżenia patentowe

1. Sposób dekodowania sygnału wideo, znamienny tym, że obejmuje:

otrzymywanie, przez moduł (210) dekodowania entropijnego, współczynników resztkowych dotyczących bieżącego bloku oraz wskaźnika pomijania przekształcenia dla bieżącego bloku z sygnału wideo, przy czym wskaźnik pomijania przekształcenia określa, czy przekształcenie odwrotne jest pomijane dla bieżącego bloku, przy czym resztkowe współczynniki są kwantyzowane odwrotnie przez moduł (220) dekwantyzacji (S710); i otrzymywanie, przez moduł (225) przekształcenia odwrotnego, resztkowych próbek przez selektywne wykonywanie przekształcenia odwrotnego dla kwantyzowanych odwrotnie współczynników resztkowych bieżącego bloku na podstawie wskaźnika pomijania przekształcenia (S720), przy czym przekształcenie odwrotne jest wykonywane przez wykorzystanie jednego przekształcenia spośród dyskretnej transformacji kosinusowej (DCT) i dyskretnej transformacji sinusowej (DST).
2. Sposób według zastrz. 1, znamienny tym, że, gdy wskaźnik pomijania przekształcenia określa, że przekształcenie odwrotne jest pomijane dla bieżącego bloku, resztkowe próbki są otrzymywane przez skalowanie kwantyzowanych odwrotnie współczynników resztkowych przez z góry określoną wartość.
3. Sposób według zastrz. 2, znamienny tym, że skalowanie jest wykonywane przez wykorzystanie operacji przemieszczenia bitów.
4. Sposób według zastrz. 1, znamienny tym, że wskaźnik pomijania przekształcenia jest otrzymywany na podstawie rozmiaru jednostki przekształcenia, przy czym jednostka przekształcenia stanowi reprezentację jednostki, gdy przekształcenie odwrotne jest wykonywane dla bieżącego bloku.
5. Sposób według zastrz. 4, znamienny tym, że wskaźnik pomijania przekształcenia jest otrzymywany, gdy rozmiar jednostki przekształcenia jest równy rozmiarowi minimalnego bloku NxN.
6. Sposób według zastrz. 1, znamienny tym, że przekształcenie odwrotne obejmuje przekształcenie na wierszach bieżącego bloku i przekształcenie na kolumnach bieżącego bloku.