NO335667B1

NO335667B1 - Metode for videokomprimering

Info

Publication number: NO335667B1
Application number: NO20110939A
Authority: NO
Inventors: Gisle Bjøntegaard; Arild Fuldseth
Original assignee: Cisco Systems Int Sarl
Priority date: 2011-06-29
Filing date: 2011-06-29
Publication date: 2015-01-19
Also published as: NO20110939A1; WO2013003726A1; US20130003871A1; US9332278B2

Abstract

Fremgangsmåte i videokomprimering, omfattende koding og dekoding av digitale videosignaler ved å anvende et adaptivt sløyfefilter (ALF) for filtrering av pikselverdier i minst en del av en bilderamme i en videokodings- eller 5 -dekodingsprosess. Filtertap-ene for ALF er adaptive hva gjelder minimering av kvadratdifferansen mellom minst en del av bilderamme, og en korresponderende rekonstruert del av en bilderamme etter ALF-filtrering, og hvor filtertap-ene er assosiert med pikselposisjoner i bilderammen i et filtertap-mønster som er symmetrisk omkring en piksel posisjon for en piksel som skal filtreres.

Description

Fremgangsmåte for videokomprimering

Område for oppfinnelsen

Oppfinnelsen vedrører området digital videokomprimering, inkludert koding og dekoding av digitale videosignaler.

Bakgrunn

Mange video komprimeringsstandarder har blitt utviklet i løpet av de siste 20 årene. Mange av disse fremgangsmåtene er standardisert gjennom ISO (International Standards Organization) eller ITU (International Telecommunications Union). Dessuten har en rekke andre proprietære fremgangsmåter blitt utviklet. De viktigste standardiserte fremgangsmåtene er: ITU: H.261, H.262, H.263, H.264

ISO: MPEG1, MPEG2, MPEG4/AVC)

En videokoder blir vanligvis implementert ved å dele hver ramme av originale videodata i blokker av piksler. I eksisterende standarder for videokomprimering vil disse blokkene normalt være av størrelse 16x16 og bli referert til som makroblokker (MB). I den fremtidige HEVC/H.265-standard vil blokkene typisk være større (for eksempel 64x64) og kan være rektangulære, for eksempel ved rammegrenser. Vanligvis blir blokkene prosessert og / eller overført i raster scan-rekkefølge, dvs. fra den øverste raden av blokker til den nederste raden av blokker, og fra venstre til høyre i hver rad med blokker.

For hver blokk av originale pikseldata blir kodingen vanligvis utført på følgende måte: - Produsér prediksjonspiksler med rekonstruerte pikselverdier fra i) forrige ramme (interprediksjon), eller ii) tidligere rekonstruerte piksler i gjeldende ramme (intraprediksjon). Avhengig av prediksjonstype blir blokken klassifisert som en interblokk eller et intrablokk. - Beregn differansen mellom hver original piksel og tilsvarende prediksjonspiksel innenfor blokken. - Anvend en todimensjonal transform på differansesamplene, hvilket resulterer i et sett av transformkoeffisienter. - Kvantisér hver transformkoeffisient til et heltall. Dette er hovedverktøy for å kontrollere bitproduksjonen og den rekonstruerte bildekvaliteten. - Etabler en skanning av de todimensjonale transformkoeffisientdataene til et endimensjonalt sett av data.

Trinnene ovenfor er oppført i en naturlig rekkefølge for koderen. Dekoderen vil til en viss grad utføre operasjonene i motsatt rekkefølge og gjøre "inverse" operasjoner slik som invers transform i stedet for transform og dekvantisering istedenfor kvantisering.

Ved koderen så vel som ved dekoderen vil bildene bli rekonstruert. Grunnet kvantiseringstrinnet vil de rekonstruerte bildene avvike fra de ukomprimerte inngangsbildene. Imidlertid skal de rekonstruerte bildene være identiske ved koder-og dekodersiden.

En implementering av en kodings- og dekodingsprosess i henhold til eksisterende standarder for videokomprimering er nærmere gjennomgått i det følgende, med henvisning til figur 2 og 3.

Med henvisning til figur 3 er en gjeldende ramme og en prediksjonsramme inngangsdata til en subtraherer 9. Subtrahereren 9 forsynes med inndata fra en intraprediksjonsprosesseringsbane 3 og en bevegelseskompenseringsprosesseringsbane 5. Valget mellom disse styres av bryteren 7. Intraprediksjonsprosessering velges for å finne likheter innenfor den aktuelle bilderammen, og er således referert til som "intra"-prediksjon. Bevegelseskompensasjon har en temporal komponent, og involverer derfor en analyse mellom etterfølgende rammer, som omtales som "inter"-prediksjon.

Utgangen fra bryteren 7 subtraheres fra pikslene for den gjeldende ramme i en subtraherer 9, før den gjøres til gjenstand for en todimensjonal transformprosess 13. De transformerte koeffisientene blir deretter gjort til gjenstand for kvantisering i kvantisereren 15 og deretter til gjenstand for en entropikoder 17. Entropikoding fjerner redundans uten tap av informasjon, og er referert til som en tapsfri kodingsprosess. Deretter blir de kodede data arrangert i nettverkspakker via en pakker (eng.: packetizer), før disse blir overført i en bitstrøm.

Imidlertid blir utgangen av kvantisereren 15 også tilført en invers transform og benyttet for å assistere i prediksjonsprosessering. Utgangen føres til et deblokkingsfilter 8, som undertrykker noe av skarpheten i kantene for å forbedre klarhet og for bedre å støtte prediksjonsprosessering. Utgangen fra deblokkingsfilteret 8 er ført til et rammeminne 6, som holder de prosesserte

bildepikseldata i minnet for bruk i etterfølgende bevegelsesprosessering.

Den tilsvarende dekodingsprosessen for hver blokk kan beskrives som følger (som angitt i figur 4). Etter entropidekoding 22 (for å produsere de kvantiserte transformkoeffisientene) og todimensjonal invers transformasjon 26 av den kvantiserte transformkoeffisienten for å gi en kvantisert versjon av differansesamplene, rekonstrueres det resulterende bildet etter tilføyelse av interprediksjons- og intrapre diksjons data som omtalt tidligere.

Noen av de mer detaljerte kodings- og dekodingsprosesseringstrinn vil nå bli beskrevet i nærmere detalj. I videokodere kan blokker deles inn i sub-blokker. Vanligvis blokkene er av fast (kvadratisk) størrelse, mens sub-blokker kan være av ulike fasonger, for eksempel rektangulære. Dessuten vil partisjonering i sub-blokker vanligvis variere fra en blokk til en annen.

Interprediksjon oppnås normalt ved å utlede et sett av bevegelsesvektorer for hver sub-blokk. Bevegelsesvektorene definerer romlig forskyvning mellom de opprinnelige pikseldata og de tilsvarende rekonstruerte pikseldata i foregående ramme. Således kan mengden av data som må sendes til en dekoder bli sterkt redusert dersom et element (eng.: a feature) i en første ramme kan identifiseres som å ha flyttet til et annet sted i en etterfølgende ramme. I denne situasjon kan en bevegelsesvektor benyttes til effektivt å formidle informasjon om elementet som har endret posisjon fra en ramme til den neste.

Intraprediksjon oppnås vanligvis ved å avlede en intraretningsmodus for hver sub-blokk. Intraretningsmodusen definerer den romlige forskyvning mellom de opprinnelige pikseldata og tidligere rekonstruerte pikseldata i gjeldende ramme. Både bevegelsesvektorer og intraretningsmoduser kodes og overføres til dekoderen som sideinformasjon for hver sub-blokk. For å redusere antallet bits som brukes for denne sideinformasjonen, avhenger koding av disse parametrene av tilsvarende parametre i tidligere prosesserte sub-blokker.

Typisk benyttes en form for adaptiv entropikoding. Tilpasningen gjør entropikoding/-dekoding for en sub-blokk avhengig av tidligere prosesserte sub-blokker. Entropi koding er tapsfri koding som reduserer antall av bits som er nødvendig for å formidle informasjon til et mottakende sted.

Adaptivt sløyfefilter ( eng. : Adaptive Loop Filter) ( ALF)

I den tidligere nevnte HEVC/H.265 standarden, under utvikling, blir ALF vanligvis utført i tillegg til en kodings-/dekodingsprosedyre som angitt ovenfor. "L" står for Loop, som betyr at filteroperasjonen finner sted innenfor kodings-/ prediksjonssløyfen, i motsetning til mange andre vanlig kjente filteroperasjoner som utføres utenfor sløyfen, enten som et pre-kodings- eller som et post-dekodingstrinn, for eksempel for å minimere subjektiv kodingsstøy. Derfor må filtreringsprosessen være identisk på koder- og dekoderside for å sikre samme basis for etterfølgende prediksjoner.

I HEV C/H.265 standarden som er under utvikling finnes det i dag en versjon av ALF som vil bli kort beskrevet nedenfor. Denne versjonen vil i det følgende bli referert til som HM-ALF.

Hensikten med ALF

Hensikten med å innføre en filtreringsprosess i sløyfen er å redusere kodingsstøyen ved å filtrere de rekonstruerte piksler med filter-taps (eng.: filter taps) opprettet for å minimalisere forskjellen fra de opprinnelige piksler. Filter-tapsene er adaptive og blir generelt kodet, overført og dekodet sammen med residualene, eller en indikasjon på hvilke av et antall forhåndsdefinerte filtertaps som nåværende er i bruk og som transmiteres i den kodede datastrømmen.

Det finnes flere mulige filtertap-mønstre eller piksel-masker som danner et filtertap-sett i HM. En typisk maske er den 7x7-diamantformede masken vist nedenfor.

j

k h i

1 m e f g

d c b a b c d

g f e m 1

i h k

j

Posisjonene til bokstavene a til m indikerer pikselposisjoner. a er i senterposisjon, og er posisjonen som skal filtreres. Bokstavene a til m angir verdiene for filtertap-ene som brukes under filtrering. Hvis mønsteret ovenfor er rotert 180 grader, er bokstavene fortsatt i samme posisjon. Denne egenskapen kalles rotasjonssymmetri.

Vanligvis, på bildebasis, blir filteruttalene a til m beregnet og tilpasset for å minimere kvadratdifferansen mellom det opprinnelige bildet og det rekonstruerte bildet etter ALF-operasjonen. Beregningen som utføres på kodersiden innebærer de følgende trinn: • Å etablere et uttrykk for kvadratdifferansen mellom det opprinnelige bildet og det rekonstruerte bildet • Å minimalisere denne differansen ved å kreve at den partialderiverte med hensyn til hver filtertap er lik 0. Dette resulterer i 13 lineære ligninger - én for hver koeffisient a til m.

• Å løse dette settet med 13 ligninger ved hjelp av en standard ligningsløser.

Når filtertap-ene er beregnet, blir de kvantisert på en lignende måte som transformkoeffisientene standard videokoding. I den foreliggende versjon av ALF består dette i det grunnleggende i å inndele koeffisientene med en trinnstørrelse på 2"°. De resulterende kvantiserte koeffisienter a' til j' kan da representeres med heltall.

De kvantiserte filtertaps blir så kodet tapsfritt, for eksempel ved entropikoding, og overføres til dekoderen.

Med den beskrevne fremgangsmåten vil både koder og dekoder ha tilgjengelig flere sett av filtertaps til å utføre på individuelle pikselposisjoner innen hver ramme. Imidlertid kan kodede filtertaps-sett overføres for bildesegmenter mindre enn det totale bildet. Et slikt segment kan være en Largest Coding Unit (LCU), og kan typisk bestå av 64x64 piksler. Vanligvis vil koderen utføre filtrering med flere av de tilgjengelige sett av filtertaps dedikert for denne LCU og finne ut hvilket sett som resulterer i den beste rekonstruksjon. Tallet for dette beste settet signaliseres til dekoderen for å sette dekoderen i stand til å gjøre den samme filtrering som koderen.

I tillegg kan pikslene i rammen som skal filtreres, klassifiseres i henhold til varisjon av pikselverdier omkring en piksel. Denne variasjonen beregnes på følgende måte. Anta at pikselen som tas i betraktning i mønsteret nedenfor, er c.

a

bed

e

La I 2c-b-d | + | 2c-a-e | angi pikselvariasjon omkring piksel c. Beregn så:

Varians = sum_over_et _lite_pikseområde (|2ci-bi-di| + |2ci-aj-ei |) hvor a; til e; representerer pikselverdier i et lite pikselområde. Variansen brukes til å klassifisere en piksel eller et lite område av piksler i ulike pikselklasser. Beregningen ovenfor av filterkoeffisienter blir utført for hver klasse av piksler.

Filtreringen kan typisk være som dette:

Filteredpixelposition

a= ^coeffV* pixel; +2n_1 »n

^Vi=o ) )

Coeff i er de kvantiserte koeffisienter a' til m' i henhold til piksel masken i det ovenstående.

Pixelier pikselverdiene.

» N er et høyreskift eller divisjon hvor n avhenger av kvantiseringstrinnstørrelse.

Den "objektive forsterkning" (eng.: the "objective gain") kan defineres som reduksjonen i bitrate ved fortsatt produksjon med den samme toppverdi-signal-til-støyforhold (eng.: Peak Signal to Noise Ratio) (PSNR). Den objektive forsterkning for ALF brukt i HM er typisk 5%.

Tilsvarende "subjektiv forsterkning" (eng.: "subjective gain") kan defineres som reduksjonen i bitrate når det fortsatt produseres en videokvalitet som bedømmes av menneskelig inspeksjon å være den samme. Den subjektive foresterkning med ALF er vanligvis større enn den objektive forsterkning.

På den negative siden er den beskrevne versjon av ALF svært prosesseringsintensiv. For noen anvendelser kan dette innebære at ALF ikke kan brukes.

En annen ulempe med HM-ALF er relatert til kodingsforsinkelse. Operasjoner blir vanligvis utført på hele videorammer. Dette vil introdusere en ekstra kodingsforsinkelse på én videoramme eller mer. Dette er en ulempe for bruk av kodingsfremgangsmåten i samtaletjenester der lav kodings-/dekodingsforsinkelse er ett av de viktigste krav.

WO-2010034206 Al fremlegger en videokoder som benytter adaptiv filtrering for koding av videodata.

US-2007064792 Al fremlegger et filtertap-mønster med pikselen som skal behandles, i senteret.

Sammenfatning av oppfinnelsen

Den foreliggende oppfinnelse omfatter et adaptivt sløyfefilter (eng.: Adaptive Loop Filter) (ALF) som angitt i det selvstendige krav 1.

Det adaptive sløyfefilteret er et adaptivt sløyfefilter for filtrering av pikselverdier i minst en del av en bilderamme i en videokodings eller dekodingsprosess, idet filtertaps for ALF er adaptive når det gjelder minimalisering av kvadratforskjellen mellom i det minste en del av bilderammen og en tilsvarende rekonstruert del av en bilderamme etter ALF-filtrering, idet filtertap-ene er assosiert med pikselposisjoner i bilderammen i et filtertap-mønster som er symmetrisk omkring en pikselposisjon til en piksel som skal filtreres, hvor: filtertap-mønsteret er dannet av fire linjer, langs hvilke respektive subsett av filtertap-ene er jevnt fordelt, innbefattende en horisontal linje, er en vertikal linje, et første diagonal linje i en vinkel på 45 grader med den horisontale linje, og en andre

diagonal linje i en vinkel på 45 grader med den vertikale linje,

de respektive midtpunktsposisjoner for de fire linjer sammenfaller alle med pikselposisjonen for pikselen som skal filtreres,

de respektive subsett av filtertaps er individuelt symmetriske omkring pikselposisjonen for pikselen som skal filtreres ved at to filtertaps med samme avstand på hver side av pikselposisjonen for pikselen som skal filtreres er like.

Ytterligere trekk ved oppfinnelsen er blitt fremsatt i de vedføyde uselvstendige krav.

Kort beskrivelse av tegningene

Figur 1 viser rektangulære områder som angir videoramme og enheter; Figur 2 viser de forskjellige trinnene i en kodingsprosess;

Figur 3 er et blokkskjema for en videokoder, og

Figur 4 er et blokkskjema for en videodekoder.

Detaljert beskrivelse av oppfinnelsen

Foreliggende oppfinnelse beskriver en ny ALF-fremgangsmåte som oppfinnerne har funnet tilveiebringer den samme eller bedre objektive og subjektive kodingsforsterkning, sammenlignet med den tidligere kjente fremgangsmåten beskrevet ovenfor, men som på samme tid er funnet å være omvendt mindre prosesseringsintensiv. En annen viktig egenskap er lav kodings-/ dekodingsforsinkelse. Fremgangsmåten ifølge foreliggende oppfinnelse er derfor spesielt nyttig i anvendelser med stramme grenser for beregningsressurser og/eller med strenge krav til kodings-/dekodingsforsinkelse. Hovedtrekkene ved fremgangsmåten er beskrevet i det følgende. Filtertaps (eng.: filter taps) vil også bli referert til som ALF-koeffisienter.

Pikselmasken vist i beskrivelsen ovenfor kan kalles en tett pikselmaske, siden alle piksler i et område er inkludert. Ifølge én utførelsesform av den foreliggende oppfinnelse, brukes den viste piksel masken nedenfor.

Pikslene i piksel masken ligger på de 4 linjer som betegnes som horisontale, vertikale, diagonal_45 og dioganal_135. Pikselmasken kan være mindre eller større enn den som er vist.

I en alternativ utførelsesform av den foreliggende oppfinnelse kan en pikselmaske, egnet for lav kompleksitet,være som følger:

En klassifisering av piksler i ulike klasser kan også anvendes. Klassifiseringsprosedyren er forskjellig fra den som brukes i HM-ALF. Et område av piksler n<*>m er tilordnet et klassetall. Klassifiseringen kan typisk gjøres i henhold til variasjoner av pikselverdier innenfor n<*>m pikselområde eller i samsvar med orientering (f.eks horisontal eller vertikal), eller strukturen av pikselinnholdet innenfor n*m-pikselområdet Bare én klasse kun brukes (i praksis ingen klassifisering), eller typisk et lite antall klasser (for eksempel opp til 16). Typisk kan n = 4 og m = 4, men andre verdier av n og m kan brukes. De følgende beregninger av ALF-koeffisienter er deretter gjort for hver pikselklasse.

I de følgende eksempler i henhold til foreliggende oppfinnelse vil de to sist illustrerte pikselmasker ovenfor bli brukt. Imidlertid er den foreliggende oppfinnelsen ikke begrenset til bare disse to masker.

Pikselmaskene ifølge utførelser av den foreliggende oppfinnelse illustrert ovenfor, fremlegger bare mønsteret for maskene. Imidlertid er et annet viktig trekk ved foreliggende oppfinnelse symmetrien for filtertap-ene omkring pikselposisjonen som skal beregnes.

Symmetri omkring senterpikselposisjonen langs de ulike aksene ifølge teknikkens stand er også brukt i den foreliggende oppfinnelsen, men symmetrien er også utvidet. Anta videre den følgende pikselmaske.

Med denne type av pikselmaske og rotasjonssymmetri er det mulig å gjøre eksplisitt filtrering i en av de fire retningene.

• Horisontal filtrering hvis ingen andre koeffisienter enn a, b, c, d ^ 0

• Vertikal filtrering hvis ingen andre koeffisienter enn a, e, f ^ 0

• Diagonal_45 filtrering hvis ingen andre koeffisienter enn a, g, h ^ 0

• Diagonal_135 filtrering hvis ingen andre koeffisienter enn a, i, j ^ 0

Som et eksempel vil beregningene for å oppnå optimale ALF-koeffisienter vises for den mindre pikselmatrisen ovenfor. I pikselmasken nedenfor betegner nO posisjonen av pikselen som skal filtreres. nO til nl8 betegner piksel posisjoner som skal brukes til å beregne den filtrerte versjonen ved posisjon nO, idet pi er pikselverdien ved posisjon i.

Kvadratdifferansen mellom pnO og den filtrerte versjonen ved posisjon pnO er:

Merk at p-parameteren i fet skrift i uttrykket ovenfor og i de følgende uttrykk er en ikke-kodet pikselverdi, mens P-parametrene som ikke er i fet skrift, er rekonstruerte pikselverdier.

For å finne koeffisientene a til j kreves at kvadratdifferansen over et sett av piksler skal minimaliseres. Dette settet med piksler kan være et fullstendig bilde, en LCU eller noe annet. Spesielt kan rektangulære områder, som angitt i figur 1, benyttes.

Stort rektangel angir en videoramme. De to mindre rektangler indikerer mulige enheter for å utføre ALF. Hovedpoenget er den begrensede vertikale størrelse på enhetene for å redusere kodings-/ dekodingsforsinkelse.

Dette settet av piksler der koeffisientene beregnes og ALF utføres, vil bli referert til som en ALF-enhet.

Uttrykket som skal minimaliseres, kan være:

Summen over n indikerer summen av settet av piksler inkludert i f.eks en LCU eller et helt bilde. Den normale måten å minimalisere dette uttrykket på, er å kreve at hver av de partiellderiverte med hensyn til koeffisientene a til j skal være 0. Som et eksempel kreves at den partiellderiverte med hensyn til a, må være null, eller:

Lignende uttrykk kan oppnås som de partiellderiverte med hensyn til de andre koeffisienter b til j. Dette resulterer i et sett av 10 lineære ligninger som kan løses for å finne de ukjente a til j.

En kvantiseringsmåte er å multiplisere koeffisientene med et tall etterfulgt av en konvertering til et heltall. Det er hensiktsmessig å multiplisere med et tall 2n. n kan typisk avhenge av kvantiseringsparameteren (qp) brukt i den initielle koding, ved bruk av mindre n for større qp. En typisk verdi for n kan være 6, slik at 2<6>= 64. Deretter avledes kvantiserte versjoner av b til j:

b - Nearest integer (b<*>64)

c Nearest integer (c<*>64)

d - Nearest integer (d<*>64)

e - Nearest_integer (e<*>64)

f Nearest integer (f<*>64)

g - Nearest_integer (g<*>64)

h '= Nearest integer (h<*>64)

i Nearest integer (i<*>64)

j '= Nearest_integer (j<*>64)

Nearest integer () er en funksjon som gir nærmeste heltall som en utgang.

Eksempel:

Nearest_integer (23.64) = 24

Sett til slutt:

Dette resulterer i en DC-respons for filteret lik 1.. Hvis vi hadde kvantisert tilsvarende for de andre koeffisientene, vi ville ha hatt behov for en finere kvantiserer, som krever flere bits for overføring, for å sikre en egnet DC-respons.

De kvantiserte ALF-koeffisientene gjennomgår videre tapsfri koding og overføres til dekoderen. Tidligere kjent CABAC eller CAVLC kan brukes i denne forbindelse.

Etter eksempelet ovenfor beregnes en ny verdi for pikselposisjon NO som:

der » 6 betyr høyreskift med 6 biter, som er det samme som divisjon med 64.

Som nevnt i forbindelse med tidligere kjent HM-ALF, kan filtreringen utføres på et sett av piksler forsjellig fra det som ble brukt for å beregne filterkoeffisienter.

Ett aspekt ved foreliggende oppfinnelse foreslår at beregningen av koeffisienter og følgende filtrering gjøres på det samme sett av piksler. Dette kan være en LCU bestående av 64x64 piksler eller annen enhet. Denne tilnærmingen bidrar å balansere relativt grov kvantisering beskrevet ovenfor, som resulterer i en moderat bruk av bits for å overføre et sett av kvantiserte koeffisienter.

Med denne tilnærmingen er det lite eller intet behov for å gjøre multippel filtrering med ulike sett av koeffisienter, siden beregnede koeffisientene er de optimale de for piksler som skal filtreres (for eksempel en LCU).

Ved å gjøre en i-sløyfe-filtrering, vil virkningen av filtreringen bestå i de neste pikslene i den samme romlige lokasjonen. Spesielt, vil hvis det ikke er noen endring fra ramme til ramme, vil filtreringseffekten alltid bestå, og det er ingen grunn til å filtrere på nytt. Dette er svært nyttig for å redusere prosesseringskompleksiteten for ALF. De følgende fremgangsmåter for å redusere antallet av piksler for å gjennomgå ALF kan brukes: • Systematisk filtrering av maksimalt en fraksjon av pikslene. lA er et eksempel på en slik fraksjon, og det synes som om kodingseffekten er praktisk talt den samme som om alle piksler ble filtrert. Dette kan implementeres ved å gjøre ALF på lA av bildene. Andre valgregler kan brukes, som å gjøre ALF på lA av hver ramme på en systematisk måte. Det antas at koderen og dekoderen kan benytte de samme regler for å unngå å sende bits i denne forbindelse. • Utelat ALF hvis det ikke har vært noen signifikant endring av piksler som skal filtreres siden sist det ble tatt i betraktning for ALF. Både koder og dekoder kan gjøre den samme beslutning uten å sende bits i denne sammenheng. • Utelat filtrering hvis b' til j' = 0.1 dette tilfellet filtrering vil ikke ha noen effekt. 1 bit kan brukes til å signalisere om alle koeffisienter b 'til j' er 0 eller ikke. • Giveren kan gjøre en rate-distorsjonsbeslutning om å bruke ALF. Dette innebærer beregning av en kostnads funksjon basert på bitbruk av ALF koeffisienter og distorsjonsforbedring.

Generelt brukes én bit for å gi signal til dekoderen om ALF-enheten skal filtreres eller ikke. I det tilfellet at ALF-enheten ikke skal filtrere, kodes ingen filterkoeffisienter.

Claims

1. Et adaptivt sløyfefilter (ALF) for filtrering av pikselverdier i minst en del av en bilderamme i en videokodings- eller dekodingsprosess, idet filtertaps for sløyfefilteret er adaptive når det gjelder minimalisering av kvadratforskjellen mellom i det minste en del av bilderammen og en tilsvarende rekonstruert del av en bilderamme etter ALF-filtrering, idet filtertap-ene er assosiert med pikselposisjoner i bilderammen i et filtertap-mønster som er symmetrisk omkring en pikselposisjon til en piksel som skal filtreres, hvor: filtertap-mønsteret er dannet av fire linjer, langs hvilke respektive subsett av filtertap-ene er uniformt fordelt, innbefattende en horisontal linje, er en vertikal linje, et første diagonal linje i en vinkel på 45 grader med den horisontale linje, og en andre diagonal linje i en vinkel på 45 grader med den vertikale linje, de respektive midtpunktsposisjoner for de fire linjer sammenfaller alle med pikselposisjonen for pikselen som skal filtreres, de respektive subsett av filtertaps er individuelt symmetriske omkring pikselposisjonen for pikselen som skal filtreres ved at to filtertaps med samme avstand på hver side av pikselposisjonen for pikselen som skal filtreres, er like.

2. Et adaptivt sløyfefilter (ALF) ifølge krav 1, hvor kodings- eller dekodingsprosessen innbefatter koding eller dekoding av filtertap-ene.

3. Et adaptivt sløyfefilter (ALF) ifølge krav 2, hvor kodingen av filtertap-ene omfatter kvantisering av de respektive filtertaps bortsett fra en filtertap assosiert med pikselposisjonen for pikselen som skal filtreres ved å multiplisere med m og å avrunde til nærmeste heltall, og å beregne filtertap-en assosiert med pikselposisjonen for pikselen som skal filtreres ved å subtrahere fra m summen av alle de andre kvantiserte filtertaps multiplisert med 1, slik at den resulterende DC-respons for filteret er lik 1.

4. Et adaptivt sløyfefilter (ALF) ifølge krav 3, hvor m er lik 64 og n er lik 2.

5. Et adaptivt sløyfefilter (ALF) ifølge krav 1, hvor ALF-et anvendes på en fraksjon av rammene i et videobilde eller en fraksjon av hver ramme.

6. Et adaptivt sløyfefilter (ALF) ifølge krav 5, hvor ALF-et anvendes på hver fjerde ramme i et videobilde eller lA av pikslene i en ramme.

7. Et adaptivt sløyfefilter (ALF) ifølge krav 1, hvor hvert subsett av filtertaps omfatter ni filtertaps.

8. Et adaptivt sløyfefilter (ALF) ifølge krav 1, hvor hvert subsett av filtertaps omfatter fem filtertaps.

9. Et adaptivt sløyfefilter (ALF) ifølge krav 1, hvor en bit er tildelt for å indikere om i det minste en del av bilderammen skal filtreres, og derved kodede filtertaps skal overføres, eller ikke.

10. Et adaptivt sløyfefilter (ALF) ifølge krav 1, hvor minst en del av bilderammen er rektangulærformet med den vertikale lengde vesentlig mindre enn den horisontale lengde.