NO319629B1 - Fremgangsmate for korrigering av interpolerte pikselverdier - Google Patents

Fremgangsmate for korrigering av interpolerte pikselverdier Download PDF

Info

Publication number
NO319629B1
NO319629B1 NO20035322A NO20035322A NO319629B1 NO 319629 B1 NO319629 B1 NO 319629B1 NO 20035322 A NO20035322 A NO 20035322A NO 20035322 A NO20035322 A NO 20035322A NO 319629 B1 NO319629 B1 NO 319629B1
Authority
NO
Norway
Prior art keywords
values
pixel
accordance
procedure
rounding
Prior art date
Application number
NO20035322A
Other languages
English (en)
Other versions
NO20035322D0 (no
NO20035322L (no
Inventor
Gisle Bjontegaard
Original Assignee
Tandberg Telecom As
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tandberg Telecom As filed Critical Tandberg Telecom As
Priority to NO20035322A priority Critical patent/NO319629B1/no
Publication of NO20035322D0 publication Critical patent/NO20035322D0/no
Priority to EP04808859.5A priority patent/EP1690421B1/en
Priority to CN200480031775.XA priority patent/CN100589548C/zh
Priority to PCT/NO2004/000365 priority patent/WO2005053312A1/en
Priority to JP2006541068A priority patent/JP4412672B2/ja
Priority to US10/997,925 priority patent/US7660471B2/en
Publication of NO20035322L publication Critical patent/NO20035322L/no
Publication of NO319629B1 publication Critical patent/NO319629B1/no

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Image Signal Generators (AREA)
  • Color Image Communication Systems (AREA)
  • Transforming Light Signals Into Electric Signals (AREA)

Description

Område for oppfinnelsen
Oppfinnelsen vedrører videokomprirneringssystemer, og spesielt komprimering/dekomprimering i digitale videosystemer.
Bakgrunn for oppfinnelsen
Transmisjon av bevegelige bilder i sanntid anvendes i flere applikasjoner, slik som f.eks. i videokonferanser, nettmøter, TV-kringkasting og videotelefoni.
Det å representere bevegelige bilder krever imidlertid store mengder informasjon, idet digital video typisk beskrives ved å representere hver piksel i et bilde med 8
bits (I byte). Slike ukomprimerte videodata fører til store bitvolumer, og kan ikke overføres over konvensjonelle kommunikasjonsnettverk og transmisjonslinjer i sanntid på grunn av begrenset båndbredde.
For å muliggjøre sanntids videotransmisjon kreves derfor stor grad av datakomprimering. Datakomprimering kan imidlertid gå på bekostning av bildekvalitet. Derfor har det blitt lagt stor innsats i å utvikle komprimeringsteknikker som tillater sanntidstransmisjon av høykvalitetsvideo over båndbreddebegrensede dataforbindelser.
I videokomprimeirngssystemer er hovedmålet å representere videoinformasjon med så liten kapasitet som mulig. Kapasitet defineres med bits, enten som en konstantverdi eller som bits/tidsenhet. I begge tilfeller er hovedmålet å redusere antallet bits.
Den mest alminnelige videokodingsmetoden er beskrevet i standardene MPEG<*> og H.26<*>, og alle disse benytter blokkbasert prediksjon fra tidligere kodede og dekodede bilder. Videodataene gjennomløper fire hovedprosesser før transmisjon, nemlig prediksjon, transformasjon, kvantisering og entropikoding.
Prediksjonsprosessen reduserer betraktelig mengden av bits som er nødvendig for at hvert bilde i en videosekvens skal overføres. Den drar fordel av at deler av sekvensen har likhet med andre deler av sekvensen. Siden prediktordelen er kjent både for koderen og dekoderen, behøver bare forskjellen overføres. Denne forskjellen krever typisk mye mindre kapasitet for sin representasjon. Prediksjonen er hovedsakelig basert på bildeinnhold fra tidligere rekonstruerte bilder der beliggenheten av innholdet er definert ved bevegelsesvektorer.
I en typisk videosekvens vil innholdet av en nåværende blokk M ligne en korresponderende blokk i et tidligere dekodet bilde. Dersom ingen endringer hadde opptrådt siden det tidligere dekodede bildet, ville innholdet av M være lik en blokk med samme beliggenhet i det tidligere dekodede bildet. I andre tilfeller kan et objekt i bildet ha blitt flyttet, slik at innholdet av M er mer likt en blokk med ulik beliggenhet i det tidligere dekodede bildet. Slike bevegelser representeres ved bevegelsesvektorer (V). Som eksempel betyr en bevegelsesvektor (3; 4) at innholdet av M har beveget seg 3 piksler til venstre og 4 piksler oppover siden det tidligere dekodede bildet.
En bevegelsesvektor assosiert med en blokk bestemmes ved eksekvering av et bevegelsessøk. Søket utføres ved påfølgende å sammenligne innholdet av blokken med blokker i tidligere bilder med ulike rom-offsets. Offseten i forhold til den nåværende blokk assosiert med sammenligningsblokken med den beste tilpasning sammenlignet med den nåværende blokk, bestemmes å være den assosierte bevegelsesvektor.
I H.262, H.263, MPEG1, MPEG2 er det samme konseptet utvidet slik at bevegelsesvektorer også kan innta '/i-pikselverdier. En vektorkomponent på 5,5 impliserer da at bevegelsen er midt mellom 5 og 6 piksler. Mer spesifikt oppnås prediksjonen ved å ta gjennomsnittet mellom pikselen som representerer en bevegelse på 5 og pikselen som representerer en bevegelse på 6. Dette kalles et 2-tap-filter på grunn av operasjonen på 2 piksler for å fremskaffe prediksjonen av en . piksel mellom dem. Bevegelsesvektorer av denne type omtales ofte som å ha fraksjonell pikseloppløsning eller fraksjonelle bevegelsesvektorer. Alle filteroperasjoner kan defineres ved en impulsrespons. Operasjonen med å ta gjennomsnittet av to piksler kan uttrykkes ved en impulsrespons på { Vi, '/i). Tilsvarende vil et gjennomsnitt over 4 piksler implisere en impulsrespons på (<l>/4, Vi,
<%,><%>)<.>
Sammenfatning av oppfinnelsen
Fremgangsmåtene ifølge den foreliggende oppfinnelsen er kjennetegnet ved trekkene som er definert i de selvstendige, vedføyde krav.
Spesielt, i samsvar med et første aspekt av oppfinnelsen, angir den foreliggende oppfinnelsen en fremgangsmåte i videokoding eller videodekoding for beregning av interpolerte Vi-posisjonspiksel verdier og 14-posisjonspiksel verdier som befinner seg mellom heltallspikselposisjoner ved bestemmelse av en prediksjon av en første pikselblokk i et videobilde fra en andre pikselblokk i et tidligere dekodet videobilde med romlig offset relativt til den første pikselblokk i samsvar med en bevegelsesvektor i et sett av bevegelsesvektorer, som utføres ved å beregne 14-posisjonspikselverdiene ved hjelp av et n-tapfilter på naboheltallspikselposisjonsverdier innbefattende en avrundingstilleggsverdi, å beregne V4-posisjonspikselverdiene ved å midle to nabo-14-posisjonspikselverdier eller en nabo-14-posisjonspikseIverdi og en heltallsposisjonspikselverdi etterfulgt av avrunding eller trunkering, og tilstrekkelig å justere avrundingstilleggsverdien for å introdusere en korrektiv forskyvning i 14-posisjonspikselverdiene og 14-posisjonspikselverdiene for å kompensere for en feilaktig forskyvning i pikselverdiene som ble introdusert ved avrunding eller trunkering av V*-po s i sj on spiksel verdi ene.
Videre, i samsvar med et andre aspekt av den foreliggende oppfinnelsen, vedrører oppfinnelsen en fremgangsmåte i videokoding eller videodekoding for beregning av interpolerte '/4-posisjonspikselverdier og '/1-posisjonspikselverdier som befinner seg mellom heltallspikselposisjoner ved bestemmelse av en prediksjon av en første pikselblokk i et videobilde fra en andre pikselblokk i et tidligere dekodet videobilde med romlig offset relativt til den første pikselblokk i samsvar med en bevegelsesvektor i et sett av bevegelsesvektorer. Fremgangsmåten omfatter trinnene å beregne Vi-posisjonspikselverdiene ved hjelp av et n-tapfilter på naboheltallspikselposisjonsverdier innbefattende en avrundingstilleggsverdi, å beregne Vi-posisjonspikselverdiene ved å midle to nabo-<l>/4-posisjonspikselverdier . etterfulgt av avrunding, å tilordne en første eller en andre notasjon til respektive bevegelsesvektorer i settet av bevegelsesvektorer, å konvertere desimalinterpolasjonsverdier som respektivt har en fraksjonsdel på 0,5, til korresponderende nærmeste nedre heltallsverdier ved beregning av interpolasjonsverdier i den andre pikselblokk dersom bevegelsesvektoren er tilordnet nevnte første notasjon, og å konvertere desimalinterpolasjonsverdier som respektivt har en fraksjonsdel på 0,5, til korresponderende nærmeste øvre heltallsverdier ved beregning av interpolasjonsverdier i den andre pikselblokken dersom bevegelsesvektoren er tilordnet nevnte andre notasjon.
Oppfinnelsen vedrører også bruk av en slik fremgangsmåte i pikselbevegelseskompensering i samsvar med kodingsstandarden H.264/AVC.
Detaljert beskrivelse av den foreliggende oppfinnelsen
I det følgende vil den foreliggende oppfinnelsen bli forklart ved å beskrive en foretrukket utførelsesform, og ved henvisning til den vedføyde tegning. En fagmann på området vil imidlertid innse at andre anvendelser og modifikasjoner finnes innenfor rekkevidden av oppfinnelsen slik den er definert i det vedføyde, selvstendige krav.
En ny videokomprimeirngsstandard har nylig blitt utviklet som en samarbeidsoppgave mellom ITU og ISO/IEC. De formelle titlene på den felles standarden i de to standardiseringsorganene er: "ITU-T Recommendation H.264" og "ISO/IEC MPEG-4 (Part 10) Advanced Video Coding". I det følgende vil denne felles standarden bli omtalt som H.24/AVC.
I H.264/AVC har kodingsmetoder blitt forbedret både hva gjelder bevegelsesoppløsning og antall piksler før hver interpolasjon. Metodene benytter bevegelseskompensert prediksjon med inntil Va piksels nøyaktighet. Til og med 1/8 piksels nøyaktighet er definert, men ikke innbefattet i noen profil. Et eksempel på heltalls- og fraksjonelle pikselposisjoner er angitt nedenfor (for enkelhets skyld er interpolasjoner bare vist mellom A, E, U og Y):
Posisjonene A E U Y angir heltall pikselposisjoner, og A", E', A' og E" angir heltallsposisjoner på linjen A-E. c k m o w angir halvpikselposisjoner. De interpolerte verdiene i disse posisjonene fremskaffes ved f.eks. å benytte et 6-tap-filtermed impulsrespons (1/32, -5/32, 20/32, 20/32, -5/32, 1/32) som opererer på heltallspikselverdiene. Som eksempel blir da c beregnet ved følgende uttrykk:
Bemerk at dividenden er valgt å være lik 32 for å tilpasse middelverdioperasjonen til dataprosessering, idet divisjon med 32 enkelt kan implementeres vha. en enkel forskyvningsoperasjon. Høyreforskyvningsoperasjonen etterlater en trunkert verdi i dataskiftregisteret, i idet de minst signifikante bits faller ut fra registeret. For å tilveiebringe avrunding i stedet for trunkering i digital dataprosessering, blir en avrundings verdi på 0,5 konvensjonelt innbefattet i operasjonen, hvilket impliserer å legge til 16 før høyreforskyvningsoperasjonen.
Alternativt kunne også et 4-tap-filter beregne de interpolerte verdiene ved bruk av det følgende uttrykk:
Filteret opereres horisontalt eller vertikalt, slik det er hensiktsmessig. Videre, for å fremskaffe verdien for m, opererer filteret ikke på heltallsverdiene, men på allerede interpolerte verdier i den andre retningen. De gjenværende posisjoner i kvadratet avbildet ovenfor fremskaffes ved midling av henholdsvis heltalls- og halv-nabopikselposisjoner (2-tap-filter):
Alle beregninger av interpolasjoner kan resultere i desimalverdier, dvs. verdier med fraksjonsdeler. Normalt, dersom fraksjonsdel ene var jevnt fordelt, ville konvertering til nærmeste heltall ikke introdusere totale offsetfeil. I mange tilfeller, slik som ved anvendelse av et 2-tap-filter for beregning av V* pikselposisjonene, ville imidlertid alle desimalverdiene innbefatte en fraksjonsdel på 0,5. Når man anvender en normal avrundingsprosedyre på disse desimalverdiene, vil alle avrundes oppover. Med henvisning til pikselnotasjonene definert ovenfor, dersom A=100 og c=101, såerb=101.
Slik det allerede er angitt, blir %-pikselposisjonene i H.264/AVC fremskaffet som middelverdien av to posisjoner, som kan være heltallspiksel eller 14-piksel med avrunding. Dette betyr at de beregnede verdier er lik eller større (inntil 0,5) enn den eksakte middelverdi av de to pikslene. Dette kan kalles en positiv offset for beregnet prediksjon. Offseten introduserer en prediksjonsfeil, som representerer et forventet tillegg til forskjellen mellom et virkelig bilde og den assosierte prediksjon. Dette forventede tillegg resulterer i et merkbart tap av kodingsforsterkning, idet større forskjeller krever transmisjon av større bitmengder. Tilsvarende ville konsekvent trunkering føre til liknende negativ offset.
I samsvar med den foreliggende oppfinnelsen blir avrundingsoffseten beskrevet ovenfor dempet ved passende å forskyve opp eller ned (avhengig av om 14-posisjonspiklsene ble avrundet opp eller trunkert) resultatet av beregningen av 14-posisjonspiksel verdiene.
I en utførelsesform av den foreliggende oppfinnelsen oppnås dette ved å introdusere en mindre negativ eller positiv forskyvning i beregningen av 14-posisjonspiksler for å kompensere for den ovenfor nevnte positive eller negative avrundingsoffset som er introdusert ved avrunding eller trunkering av middelverdien for to 14-posisjonspikselverdier (eller en heltallsposisjonpiksel- og en 14-posisjonspikselverdi). Følgelig må likningen for 14-posisjonspikselverdiberegningen modifiseres.
I samsvar med tidligere kjent teknikk blir 14-posisjonspikselverdiene vanligvis avrundet oppover. Dette medfører en positiv avrundingsoffset, som antas å være tilfelle i det følgende eksempel.
Modifikasjonen av likningen for 14-pikselverdiberegning kan implementeres på ulike måter, men erfaring har vist at denne kompenseringen kan introduseres ved å redusere avrundingstilleggsverdien som adderes til likningen ovenfor. Dette vil redusere de totale verdier for 14-posisjonspikslene, slik at en korrekt reduksjon av avrundingstilleggsverdien vil balansere avrundingsfeilen for 14-posisjonspikselverdier, idet 14-posisjonspikselverdier beregnes fra de nedsatte 14-posisjonspikselverdier. Eksperimenter har vist at en korrekt reduksjon av avrundingstilleggsverdien vil være å redusere verdien fra 16/32 til 6/32.1 tilfelle av et 4-tap-filter reduseres avrundingstilleggsverdien fra 4/8 til 1/8.
I en annen utførelsesform av den foreliggende oppfinnelsen dempes avrundingsoffseten beskrevet ovenfor ved alternerende å konvertere til den øvre eller nedre nærmeste heltallsverdi for desimalverdiene som har en fraksjonsdel på 0,5.
Som et eksempel vil et resultat av den foreliggende oppfinnelsen være at middelverdien mellom 100 og 101 i noen tilfeller vil bli konvertert til 100 og i andre tilfeller til 101, avhengig av hva som er definert for den bestemte interpolerte pikselposisjonen.
Definisjonen fra hvilke interpolerte pikselposisjoner som skal konverteres oppover og hvilke som skal konverteres nedover (fra nå av omtalt som 0,5-konvertering) kan implementeres på ulike måter. Det er imidlertid å foretrekke at den samme 0,5-konvertering benyttes for hver piksel i en blokk for den samme bevegelsesvektor. Erfaring har vist at alternerende 0,5-konvertering internt innen en blokk introduserer høyfrekvensinnhold som typisk fører til større bitbruk.
I en foretrukket utførelsesform av den foreliggende oppfinnelsen blir således en 0,5-konvertering tilordnet til hver bevegelsesvektorverdi, men 0,5-konverteringen kan variere mellom tilstøtende bevegelsesvektorer. På denne måten unngås biasavmnding som forårsaker en offset til pikselverdiene.
For ytterligere å illustrere den foretrukkede utførelsesformen, ta i betraktning at et bevegelsessøk utføres for en bestemt pikselblokk. I et bevegelsessøk blir blokken etterfølgende sammenlignet med innholdet av blokker i det foregående bildet med ulike romlige offseter relativt til den nåværende blokk. Disse offsetene assosieres med respektive bevegelsessektorer. F.eks. korresponderer en bevegelsesvektor (0, Va) til sammenligning av den nåværende blokk med blokken i det foregående bildet forskjøvet Va posisjon i den vertikale retning. Alle middelverdier med en fraksjon på 0,5 i den forskjøvne blokk vil da enten konverteres oppover eller nedover avhengig av hva slags 0,5-konvertering den aktuelle bevegelsesvektoren er tilordnet. Således er typen av 0,5-konvertering for prediksjonen av en blokk i den foretrukkede utførelsesform avhengig av posisjonen relativt til blokken for et foregående bilde, som prediksjonen tas fra, og 0,5-konverteringstilordningen for den korresponderende bevegelsesvektoren.
Videre anses det å være foretrukket at det finnes en høy grad av forskyvning i 0,5-konverteringen mellom nærliggende bevegelsesvektorer. En grunn til dette er at en typisk koder vil gjøre endelig vektorsøk i et lite lokalt område av vektorposisjoner. Under dette endelige søket er det foretrukket at de testede vektorposisjoner representerer en rimelig blanding av å konvertere 0,5-fraksjonsverdier oppover og nedover.
Reglene for å tilordne 0,5-konverteringer kan variere. Den enkleste måten er å ha et fast distribusjonsmønster av 0,5-konverteringstyper i bevegelsesvektorplanet. Dette re illustrert nedenfor. Her er hver '/4-pikselvektorposisjon tilordnet én av notasjonene "opp" og "ned", som definerer hvorvidt desimalverdier med en fraksjon på 0,5 skal konverteres oppover eller nedover til det nærmeste heltall. Store bokstaver angir heltallsposisjoner, mens små bokstaver angir '/2-pikselposisjoner. I dette tilfellet har ikke '/2-pikselposisjoner noen notasjon, siden effekten betraktes å være uvesentlig.
Bemerk at det illustrerte mønsteret bare er et eksempel, og at andre mønstre også kan være formålstjenlige.
Et alternativ til et fast mønster av 0,5-konverteringer er å ha en tilfeldig eller pseudo-tilfeldig definisjon av tilordningen av 0,5-konverteringer til de ulike bevegelsesvektorer. Dette kan være en prosess som defineres på en slik måte at både koderen og dekoderen er i stand til å avlede hvilken % -posisjon som skal konverteres opp og hvilken som skal konverteres ned. Denne prosessen kan avhenge av bildedata, som er kjent både for koderen og dekoderen. Slike data kan være (men er ikke begrenset til) blokknummerering, bevegelsesvektorverdier, og kodingsmodus. Dataene kan innleses til en prosedyre som bestemmer et pseudotilfeldig mønster av alternerende 0,5-konverteringstilordninger over bevegelsesvektorplanet.
Enda et alternativ til faste mønstre er et ikke-forhåndsbestemt mønster, som kommuniseres fra koderen til dekoderen på transmisjonstidspunktet. I dette tilfellet er det foretrukket at mengden av data som er dedikert for dette formålet er begrenset slik at den ikke går på bekostning av kodingseffektivitet.
Bemerk at det finnes mange mulige verdier for fraksjonsdelen av interpoleringsverdiene, slik som f.eks. ved bruk av 6-tap-filteret beskrevet ovenfor for halvpikselposisjoner, fraksjonsdelen på 0,5 opptrer sjelden, og det gjør vanligvis ikke stor forskjell hvilken 0,5-konvertering som anvendes. På den annen side, ved midling mellom to piksler, hvilket er tilfelle for !4-pikselposisjoner, kan fraksjonsdelen på 0,5 typisk opptre i om lag halvparten av hendelsene. Forskjellen mellom å gjøre en påfølgende 0,5-konvertering er derfor mye større, og den foreliggende oppfinnelsen er derfor mest nyttig ved beregning av kvartpikselposisjoner.
Den viktigste fordel ved oppfinnelsen er at den fjerner offseten som introduseres ved biasavrunding, og derved øker kodingseffektiviteten.

Claims (14)

1. Fremgangsmåte i videokoding eller videodekoding for beregning av interpolerte % -posi sjonspiksel verdi er og '/4-posisjonspikseIverdier som befinner seg mellom heltallspikselposisjoner ved bestemmelse av en prediksjon av en første pikselblokk i et videobilde fra en andre pikselblokk i et tidligere dekodet videobilde med romlig offset relativt til den første pikselblokk i samsvar med en bevegelsesvektor i et sett av bevegelsesvektorer, hvor fremgangsmåten omfatter trinnene å beregne Vi-posisjonspikselverdiene ved hjelp av et n-tapfilter på naboheltallspikselposisjonsverdier innbefattende en avrundingstilleggsverdi, og å beregne 14-posisjonspikselverdiene ved å midle to nabo-Vi-posisjonspikselverdier eller en nabo-VS-posisjonspikselverdi og en heltallsposisjonspikselverdi etterfulgt av avrunding eller trunkering, karakterisert ved de ytterligere trinn tilstrekkelig å justere avrundingstilleggsverdien for å introdusere en korrektiv forskyvning i '/z-posisjonspikselverdiene og 14-posisjonspikselverdiene for å kompensere for en feilaktig forskyvning i pikselverdiene som ble introdusert ved avrunding eller trunkering av !4-posisjonspikselverdiene.
2. Fremgangsmåte i samsvar med krav 1, hvor n-tap-filteret er et 6-tap-filter.
3. Fremgangsmåte i samsvar med krav 2, hvor 6-tap-filteret har en impulsrespons på (1/32, -5/32, 20/32, 20/32, -5/32, 1/32) og avrundingstilleggsverdien er redusert fra 16/32 til 6/32.
4. Fremgangsmåte i samsvar med krav 1, hvor n-tap-filteret er et 4-tap-filter.
5. Fremgangsmåte i samsvar med krav 3, hvor 4-tap-filteret har en impulsrespons på (-1/8, 5/8, 5/8, -1/8) og avrundingstilleggsverdien er redusert fra 4/8 til 1/8.
6. Fremgangsmåte i samsvar med et av kravene 1 -5, hvor videobildene er kodet i samsvar med kodingsstandarden H.264/AVC.
7. Fremgangsmåte i videokoding eller videodekoding for beregning av interpolerte Vi-posi sjonspiksel verdier og V* -posisjonspiksel verdier som befinner seg mellom heltallspikselposisjoner ved bestemmelse av en prediksjon av en første pikselblokk i et videobilde fra en andre pikselblokk i et tidligere dekodet videobilde med romlig offset relativt til den første pikselblokk i samsvar med en bevegelsesvektor i et sett av bevegelsesvektorer, hvor fremgangsmåten omfatter trinnene: å beregne Va-posisjonspikselverdiene ved hjelp av et n-tapfilter på naboheltallspikselposisjonsverdier innbefattende en avrundingstilleggsverdi, og å beregne 14-posisjonspikselverdiene ved å midle to nabo-l^-posisjonspikselverdier etterfulgt av avrunding,karakterisert ved de ytterligere trinn å tilordne en første eller en andre notasjon til respektive bevegelsesvektorer i settet av bevegelsesvektorer, å konvertere desimalinterpolasjonsverdier som respektivt har en fraksjonsdel på 0,5, til korresponderende nærmeste nedre heltallsverdier ved beregning av interpolasjonsverdier i den andre pikselblokk dersom bevegelsesvektoren er tilordnet nevnte første notasjon, å konvertere desimalinterpolasjonsverdier som respektivt har en fraksjonsdel på 0,5, til korresponderende nærmeste øvre heltallsverdier ved beregning av interpolasjonsverdier i den andre pikselblokken dersom bevegelsesvektoren er tilordnet nevnte andre notasjon.
8. Fremgangsmåte i samsvar med krav 7, hvor tilordningstrinnet videre omfatter å tilordne enten nevnte første eller andre notasjon til respektive bevegelsesvektorer i settet av bevegelsesvektorer med et forhåndsbestemt alternerende mønster.
9. Fremgangsmåte i samsvar med krav 7, hvor tilordningstrinnet videre innbefatter å tilordne enten nevnte første eller andre notasjon til respektive bevegelsesvektorer i settet av bevegelsesvektorer med et alternerende mønster bestemt av en tilfeldig eller pseudotilfeldig prosedyre som har pikseldata som inngang.
10. Fremgangsmåte i samsvar med krav 7, hvor tilordningstrinnet videre innbefatter å tilordne enten nevnte første eller andre notasjon til respektive bevegelsesvektorer i settet av bevegelsesvektorer med et alternerende mønster som kommuniseres mellom en koder og dekoder som er involvert ved kommunikasjonstidspunktet.
11. Fremgangsmåte i samsvar med krav 7, hvor interpolasjonsverdiene er 54- pikselposisjonsverdier beregnet ved hjelp av et 2-tap-filter.
12. Fremgangsmåte i samsvar med krav 7, hvor interpolasjonsverdiene er % -pikselposisjonsverdier beregnet ved hjelp av et 2-tap-filter.
13. Bruk av en fremgangsmåte i samsvar med et kravene 7-12, hvor videobildene er kodet i samsvar med kodingsstandarden H.264/AVC.
14. Bruk av en fremgangsmåte i samsvar med et av de ovenstående krav i pikselbevegelseskompensering i samsvar med kodingsstandarden H.264/AVC.
NO20035322A 2003-11-28 2003-11-28 Fremgangsmate for korrigering av interpolerte pikselverdier NO319629B1 (no)

Priority Applications (6)

Application Number Priority Date Filing Date Title
NO20035322A NO319629B1 (no) 2003-11-28 2003-11-28 Fremgangsmate for korrigering av interpolerte pikselverdier
EP04808859.5A EP1690421B1 (en) 2003-11-28 2004-11-26 Method for correcting interpolated pixel values
CN200480031775.XA CN100589548C (zh) 2003-11-28 2004-11-26 校正内插像素值的方法
PCT/NO2004/000365 WO2005053312A1 (en) 2003-11-28 2004-11-26 Method for correcting interpolated pixel values
JP2006541068A JP4412672B2 (ja) 2003-11-28 2004-11-26 補間された画素値を修正する方法
US10/997,925 US7660471B2 (en) 2003-11-28 2004-11-29 Method for correcting interpolated pixel values

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
NO20035322A NO319629B1 (no) 2003-11-28 2003-11-28 Fremgangsmate for korrigering av interpolerte pikselverdier

Publications (3)

Publication Number Publication Date
NO20035322D0 NO20035322D0 (no) 2003-11-28
NO20035322L NO20035322L (no) 2005-05-30
NO319629B1 true NO319629B1 (no) 2005-09-05

Family

ID=30439605

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20035322A NO319629B1 (no) 2003-11-28 2003-11-28 Fremgangsmate for korrigering av interpolerte pikselverdier

Country Status (6)

Country Link
US (1) US7660471B2 (no)
EP (1) EP1690421B1 (no)
JP (1) JP4412672B2 (no)
CN (1) CN100589548C (no)
NO (1) NO319629B1 (no)
WO (1) WO2005053312A1 (no)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101194513B (zh) * 2005-06-10 2011-07-20 Nxp股份有限公司 上下交替运动矢量
JP4879558B2 (ja) * 2005-11-02 2012-02-22 パナソニック株式会社 動きベクトル検出装置
JP2007288446A (ja) * 2006-04-14 2007-11-01 Toshiba Corp 動画像復号装置
US8331454B2 (en) * 2007-11-12 2012-12-11 Cisco Technology, Inc. Integer transform function for video compression systems
US8804831B2 (en) * 2008-04-10 2014-08-12 Qualcomm Incorporated Offsets at sub-pixel resolution
US9967590B2 (en) 2008-04-10 2018-05-08 Qualcomm Incorporated Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter
US20090262249A1 (en) * 2008-04-22 2009-10-22 Himax Media Solutions, Inc. Interpolated frame generating method
US8750378B2 (en) 2008-09-23 2014-06-10 Qualcomm Incorporated Offset calculation in switched interpolation filters
JP2010161747A (ja) * 2009-01-09 2010-07-22 Toshiba Corp サブピクセル生成装置及び方法並びに動き補償装置
EP2442569A1 (en) * 2009-06-09 2012-04-18 Sony Corporation Image processing device and method
US8508659B2 (en) * 2009-08-26 2013-08-13 Nxp B.V. System and method for frame rate conversion using multi-resolution temporal interpolation
CN101715125B (zh) * 2009-09-11 2011-09-28 中山大学 一种用于h.264视频编码的联合分数点运动估计和插值方法
JP5390458B2 (ja) * 2010-04-08 2014-01-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
CN102611887B (zh) * 2011-01-21 2015-08-05 华为技术有限公司 非整像素位置运动矢量的坐标值取整方法和装置
US8437581B2 (en) * 2011-03-04 2013-05-07 General Instrument Corporation Method and system for interpolating fractional video pixels
US9313519B2 (en) 2011-03-11 2016-04-12 Google Technology Holdings LLC Interpolation filter selection using prediction unit (PU) size
US9264725B2 (en) 2011-06-24 2016-02-16 Google Inc. Selection of phase offsets for interpolation filters for motion compensation
RU2581553C2 (ru) 2011-06-28 2016-04-20 Самсунг Электроникс Ко., Лтд. Способ кодирования видео с использованием регулирований смещения согласно классификации пикселов и устройство для этого, способ и устройство декодирования видео для этого
MX2013015056A (es) 2011-07-01 2014-06-23 Motorola Mobility Llc Filtro de interpolacion de sub-pixel conjunto para prediccion temporal.
KR20130050149A (ko) * 2011-11-07 2013-05-15 오수미 인터 모드에서의 예측 블록 생성 방법
US9325991B2 (en) 2012-04-11 2016-04-26 Qualcomm Incorporated Motion vector rounding
TWI597968B (zh) * 2012-12-21 2017-09-01 杜比實驗室特許公司 在高位元深度視訊的可適性編碼中,高精度升取樣
US10009622B1 (en) 2015-12-15 2018-06-26 Google Llc Video coding with degradation of residuals

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0151210B1 (ko) * 1994-09-23 1998-10-15 구자홍 엠펙2를 수용하는 반화소 움직임 보상조절장치
GB2301972B (en) * 1995-06-06 1999-10-20 Sony Uk Ltd Video compression
JP3183155B2 (ja) * 1996-03-18 2001-07-03 株式会社日立製作所 画像復号化装置、及び、画像復号化方法
DE69817460T2 (de) * 1997-06-09 2004-06-09 Hitachi, Ltd. Bildsequenzdekodierungsverfahren
US6259734B1 (en) * 1998-04-03 2001-07-10 Matsushita Electric Industrial Co., Ltd. Image processing method, image processing apparatus, and data storage media
JP4398099B2 (ja) * 1999-04-26 2010-01-13 エヌエックスピー ビー ヴィ サブピクセル精度の動きベクトル推定及び動き補償された補間
US20020172288A1 (en) * 2001-03-08 2002-11-21 Nyeongku Kwon Device and method for performing half-pixel accuracy fast search in video coding
US6950469B2 (en) * 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation
US20030059089A1 (en) * 2001-09-25 2003-03-27 Quinlan James E. Block matching at the fractional pixel level for motion estimation
US7630566B2 (en) * 2001-09-25 2009-12-08 Broadcom Corporation Method and apparatus for improved estimation and compensation in digital video compression and decompression
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US7620109B2 (en) 2002-04-10 2009-11-17 Microsoft Corporation Sub-pixel interpolation in motion estimation and compensation
US7305034B2 (en) 2002-04-10 2007-12-04 Microsoft Corporation Rounding control for multi-stage interpolation
US7116831B2 (en) * 2002-04-10 2006-10-03 Microsoft Corporation Chrominance motion vector rounding
JP4120301B2 (ja) * 2002-04-25 2008-07-16 ソニー株式会社 画像処理装置およびその方法
CA2491679A1 (en) * 2002-07-09 2004-01-15 Nokia Corporation Method and system for selecting interpolation filter type in video coding
KR100472476B1 (ko) * 2002-08-31 2005-03-10 삼성전자주식회사 움직임 보상을 위한 보간 방법 및 그 장치
US20040076333A1 (en) * 2002-10-22 2004-04-22 Huipin Zhang Adaptive interpolation filter system for motion compensated predictive video coding
US7408988B2 (en) * 2002-12-20 2008-08-05 Lsi Corporation Motion estimation engine with parallel interpolation and search hardware
US7170529B2 (en) * 2003-10-24 2007-01-30 Sigmatel, Inc. Image processing
NO319660B1 (no) * 2003-11-17 2005-09-05 Tandberg Telecom As Fremgangsmåte for interpolering av pixelverdier

Also Published As

Publication number Publication date
EP1690421A1 (en) 2006-08-16
JP4412672B2 (ja) 2010-02-10
WO2005053312A1 (en) 2005-06-09
NO20035322D0 (no) 2003-11-28
JP2007512761A (ja) 2007-05-17
US20050117810A1 (en) 2005-06-02
US7660471B2 (en) 2010-02-09
CN100589548C (zh) 2010-02-10
NO20035322L (no) 2005-05-30
CN1875628A (zh) 2006-12-06
EP1690421B1 (en) 2014-01-08

Similar Documents

Publication Publication Date Title
NO319629B1 (no) Fremgangsmate for korrigering av interpolerte pikselverdier
CN100553321C (zh) 编码动态滤波器
KR101403343B1 (ko) 부화소 움직임 추정을 이용한 인터 예측 부호화, 복호화방법 및 장치
US7630566B2 (en) Method and apparatus for improved estimation and compensation in digital video compression and decompression
KR100472476B1 (ko) 움직임 보상을 위한 보간 방법 및 그 장치
EP1469682A1 (en) Moving picture signal coding method, decoding method, coding apparatus, and decoding apparatus
NO320114B1 (no) Forbedret utregning av interpolerte pixelverdier
JPWO2009047917A1 (ja) 映像符号化方法及び映像復号方法
WO2013069095A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
US20040240550A1 (en) Moving picture signal coding method, decoding method, coding apparatus, and decoding apparatus
KR100541623B1 (ko) 움직임 보상을 이용한 예측 코딩 방법 및 장치
JP2017017629A (ja) 動画像符号化装置、動画像符号化方法、及びプログラム
US11876958B2 (en) Video picture component prediction method and apparatus, and computer storage medium
NO319660B1 (no) Fremgangsmåte for interpolering av pixelverdier
RU2505938C2 (ru) Интерполяция на основе искажений в зависимости от скорости передачи для кодирования видео на основе неперестраиваемого фильтра или адаптивного фильтра
AU2015255215B2 (en) Image processing apparatus and method
KR100734876B1 (ko) 부화소의 볼록 성질을 사용한 움직임 벡터 추정 방법 및연속영상 생성 방법
JP2018023121A (ja) 復号方法および復号装置
JP5238735B2 (ja) 信号修正装置、符号化装置、復号装置及びプログラム
JP2011229013A (ja) 信号修正装置、符号化装置、復号装置及びプログラム
WO2008097104A1 (en) Method for pixel prediction with low complexity
JP2009095066A (ja) 動画像復号化装置、動画像復号化方法、動画像符号化装置、および動画像符号化方法
JP2001313948A (ja) 動きベクトル変換装置及び方法

Legal Events

Date Code Title Description
MM1K Lapsed by not paying the annual fees