NO319660B1 - Fremgangsmåte for interpolering av pixelverdier - Google Patents
Fremgangsmåte for interpolering av pixelverdier Download PDFInfo
- Publication number
- NO319660B1 NO319660B1 NO20035125A NO20035125A NO319660B1 NO 319660 B1 NO319660 B1 NO 319660B1 NO 20035125 A NO20035125 A NO 20035125A NO 20035125 A NO20035125 A NO 20035125A NO 319660 B1 NO319660 B1 NO 319660B1
- Authority
- NO
- Norway
- Prior art keywords
- pixel
- frequency response
- values
- frequency
- response
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 17
- 230000004044 response Effects 0.000 claims description 73
- 238000012935 Averaging Methods 0.000 claims description 12
- 230000033001 locomotion Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims 1
- 238000007906 compression Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
Description
Området for oppfinnelsen
Oppfinnelsen angår videokomprimeringssystemer, og spesielt
komprimering/dekomprimering i digitale videosystemer.
Bakgrunn for oppfinnelsen
Transmisjon av bevegelige bilder i sanntid anvendes i flere applikasjoner, slik som f.eks. videokonferanser, nettmøter, TV-kringkasting og videotelefoni.
Det å representere bevegelige bilder krever imidlertid store mengder informasjon, idet digital video typisk beskrives ved å representere hver piksel i et bilde med 8
bits (1 byte). Slike ukomprimerte videodata fører til store bitvolumer, og kan ikke overføres over konvensjonelle kommunikasjonsnettverk og transmisjonslinjer i sanntid på grunn av begrenset båndbredde.
For å muliggjøre sanntids videotransmisjon kreves derfor stor grad av datakomprimering. Datakomprimering kan imidlertid gå på bekostning av bildekvalitet. Derfor har det vært gjort stor innsats for å utvikle komprimeringsteknikker som tillater sanntidstransmisjon av høykvalitets video over båndbreddebegrensede dataforbindelser.
I videokomprimeirngssystemer er hovedmålet å representere videoinformasjonen med så liten kapasitet som mulig. Kapasitet defineres med bits, enten som en konstantverdi eller som bits/tidsenhet. I begge tilfeller er hovedmålet å redusere antallet bits.
Den mest alminnelige videokodingsmetoden er beskrevet i standardene MPEG<*> og H.26<*>, og alle disse bruker blokkbasert prediksjon fra tidligere kodede og dekodede bilder. Videodataene gjennomløper fire hovedprosesser før transmisjon, nemlig prediksjon, transformasjon, kvantisering og entropikoding.
Prediksjonsprosessen reduserer betraktelig den mengden av bits som er nødvendig for at hvert bilde i en videosekvens skal overføres. Den drar fordelen av deler av sekvensen har likhet med andre deler av sekvensen. Siden prediktordelen er kjent både for koderen og dekoderen, behøver bare forskjellen overføres. Denne forskjellen krever typisk mye mindre kapasitet for sin representasjon. Prediksjonen er hovedsakelig basert på bildeinnhold fra tidligere rekonstruerte bilder, der beliggenheten av innholdet er definert ved bevegelsesvektorer.
I en typisk videosekvens vil innholdet av en nåværende blokk M ligne en korresponderende blokk i et tidligere dekodet bilde. Dersom ingen endringer hadde opptrådt siden det tidligere dekodede bildet, ville innholdet av M være lik en blokk med den samme beliggenhet i det tidligere dekodede bildet. I andre tilfeller kan et objekt i bildet ha blitt flyttet, slik at innholdet av M er mer likt en blokk med ulik beliggenhet i det tidligere dekodede bildet. Slike bevegelser representeres ved bevegelsesvektorer (V). Som eksempel betyr en bevegelsesvektor (3; 4) at innholdet av M har beveget seg 3 piksler til venstre og fire piksler oppover siden det tidligere dekodede bildet.
I H.262, H.263, MPEG1, MPEG2 er det samme konseptet utvidet, slik at bevegelsesvektorer også kan innta '/i-pikselverdier. En vektorkomponent på 5.5 impliserer da at bevegelsen er midt mellom 5 og 6 piksler. Mer spesifikt oppnås prediksjonen ved å ta gjennomsnittet mellom pikselen som representerer en bevegelse på 5 og pikselen som representerer en bevegelse på 6. Dette kalles et 2-tap-filter på grunn av operasjonen på to piksler for å fremskaffe prediksjonen av 1 piksel mellom dem. Alle filteroperasjoner kan defineres ved en impulsrespons. Operasjonen med å ta gjennomsnittet av 2 piksler kan uttrykkes med en impulsrespons på ( lA , Vi). Tilsvarende vil et gjennomsnitt over 4 piksler implisere en impulsrespons på %, %, 14).
Hensikten med midlingen er å definere en bevegelse av bildeinnholdet med en nøyaktighet på Vi piksel. I fortsettelsen av impulsresponsbeskrivelsen kan operasjonen også tolkes som lavpassfiltrering, fordi prosessen demper høye piksel-til-piksel-verdivariasjoner. Anta som et enkelt eksempel at de to heltallspikslene som skal midles, har verdiene (a, a), dvs. en minimumsvariasjon. Midling av pikslene innebærer å bruke impulsresponsen <l>Æ), og dette resulterer i verdien Yt
<*> a + Vi <*>a = a. I dette tilfellet går ingen informasjon tapt, og responsen defineres til å være 1. Motsatt impliserer (a, -a) maksimalvariasjon, og å utsette disse pikselverdiene for den samme impulsresponsen fører til V4 <*> a - Vi <*> a = 0, og den korresponderende responsen er null. Herav kan det avledes at frekvensresponsen nærmer seg en mot lave frekvenser (eller pikselverdivariasjoner) og null mot høye frekvenser. Dette samsvarer med karakteristikkene for et lavpassfilter. Midlingsprosessen fjerner informasjonsinnhold og i økende grad for høye frekvenser.
Fig. 1 viser frekvensresponsen som resulterer fra midling av to piksler. Kurven merket "ingen filtrering" er lik 1 helt opptil 180 på x-aksen (romfrekvens). Kurven "2-tap-filter" faller til null for høye frekvensverdier.
Det er ingen klart definert optimal form for frekvensresponskurven. Imidlertid vil fagfolk på området innse fordelen ved å ha frekvensresponsen nær 1 opptil en bestemt frekvens. Ved høyere frekvenser bør kurven avta. Årsaken til det sistnevnte er at høyfrekvensinnhold er vanskeligere å prediktere, og prediksjonen ved disse frekvenser (bildeinnhold med høy tekstur) synes ikke fornuftig, fordi korrelasjonen mellom prediksjonen og det virkelige bildeinnholdet sannsynligvis er liten. Det er derfor ønskelig at denne delen av frekvensinnholdet dempes eller fullstendig fjernes. Dette er illustrert ved "ideell frekvensrespons" i fig. 1. Begrepet "ideell frekvensrespons" vil bli benyttet i det følgende selv om det ikke er veldefinert.
Videre finnes en sammenheng mellom impulsresponsen og frekvensresponsen. Målet i videokomprimering er å gjøre avveininger mellom fremskaffelse av en frekvensresponskurve med karakteristikker nær den som er vist i kurven "ideell frekvensrespons" i fig. 1, og å ha en impulsrespons med så få filtertap-er som mulig. Det sistnevnte skyldes at lange filtre fører til ringing nær skarpt bildeinnhold, noe som kan resultere i subjektivt forstyrrende artefakter i det rekonstruerte bildet.
Sammenfatning av oppfinnelsen
Fremgangsmåten ifølge den foreliggende oppfinnelsen er kjennetegnet ved trekkene definert i det selvstendige, vedføyde krav.
Spesielt tilveiebringer den foreliggende oppfinnelsen en fremgangsmåte i videokoding og -dekoding for interpolering mellom heltallspikselposisjoner i et videobilde ved hjelp av et symmetrisk tap-filter, innbefattende trinnene å beregne verdier for Vi-pikselposisjoner ved det symmetriske tap-filteret som har en impulsrespons på (a,b,b,a), der tap-ene er av formen k/2<n>, a+b+b+a=l, og a er innenfor [-0.12, -0.09], og å beregne verdier for 14-pikselposisjoner ved midling mellom to verdier av naboposisjoner, hvorav minst én er en '/4-pikselposisjon i den horisontale og/eller vertikale retning.
Kort beskrivelse av tegningene
For å gjøre oppfinnelsen enklere å forstå, vil den følgende redegjørelse henvise til de vedføyde tegninger. Fig. 1 viser en ideell frekvensrespons i tillegg til frekvensresponsen for et 2-tap-filter og tilfellet uten filtrering, Fig. 2 viser frekvensresponser for alternative 4-tap-filtre for <!>/4-pikselposisjoner, Fig. 3 viser frekvensresponser for alternative 4-tap-filtre for 14-pikselposisjoner, Fig. 4 viser de kombinerte frekvensresponser for det som er vist i fig. 2 og 3.
Detaljert beskrivelse av den foreliggende oppfinnelsen
1 det følgende vil den foreliggende oppfinnelsen bli forklart ved å beskrive en foretrukket utførelsesform, og med henvisning til de vedføyde tegninger. En fagmann på området vil imidlertid innse andre anvendelser og modifikasjoner som finnes innenfor rekkevidden av oppfinnelsen, slik den er definert i det vedføyde selvstendige krav.
En ny videokomprimeringsstandard har nylig blitt utviklet som en samarbeidsoppgave mellom ITU og ISO/IEC. De formelle titlene for den felles standarden i de to standardiseirngsorganene er: "ITU-T Recommendation H.264" og "ISO/IEC MPEG-4 (Part 10) Advanced Video Coding". I det følgende vil denne felles standarden bli omtalt som H.264/AVC.
I H.264/AVC har kodingsmetoder blitt forbedret både hva gjelder bevegelsesoppløsning og antall piksler for hver interpolasjon. Metodene benytter bevegelseskompensert prediksjon med opptil Vi piksels nøyaktighet. Til og med 1/8 piksels nøyaktighet er definert, men ikke innbefattet i noen profil. Heltalls- og brøk-pikselposisjonene er angitt nedenfor (for enkelthets skyld er interpolasjoner bare vist mellom A og E):
Posisjonene A E U Y angir heltallspikselposisjoner, og A", E', A' og E" angir ytterligere heltallsposisjoner på linjen A-E. c k m o w angir halvpikselposisjonene. De interpolerte verdiene i disse posisjonene fremskaffes ved å benytte et 6-tapp-filter med impulsrespons (1/32, -5/32, 20/32, 20/32, -5/32, 1/32) som opererer på heltallspikselverdier. Som eksempel blir c da beregnet ved det følgende uttrykk:
Filteret opererer horisontalt eller vertikalt, slik det er hensiktsmessig. For å fremskaffe verdien for m, opererer filteret ikke på heltallsverdier, men på allerede interpolerte verdier i den andre retningen. De gjenværende posisjoner i kvadratet avbildet ovenfor fremskaffes ved midling av henholdsvis heltalls- og halv-nabopikselposisjoner:
Alle disse beregningene utføres med avrunding mot nærmeste heltall. Dette betyr at dersom A=100 og c= 101, blir b=101 (og ikke 100, som er like nær den virkelige middelverdi 100,5).
Ett av problemene ved 6-tapp-filteret i den tidligere kjente teknikk er at det ikke tilstrekkelig passer til beregningskapabilitetene for standardprosessorer. Derfor er typisk mer enn ett beregn i ngstrinn nødvendig for å fremskaffe én interpolert verdi, og dette er ikke å foretrekke på grunn av større forsinkelse og høyere prosessorkrav. Et filter med 4 tap-er eller mindre kunne på den annen side typisk utføres med én beregningssyklus. Siden vi ønsker å beregne halvpikselposisjoner og foretrekker et symmetrisk filter, finnes det bare to alternativer av filteret som innbefatter mindre enn 6 tap-er, nemlig 4-tap-filter og 2-tap-filter.
Oppfinneren av den foreliggende oppfinnelse har funnet at den subjektive oppfatning av bildekvalitet hos de fleste mennesker er bedre med bruk av 4-tap-filtre en ved 2-tap-filtre. Således antas i den følgende deduktive tilnærming at et 4-tap-filter benyttes.
Impulsresponsen for et symmetrisk 4-tap-filter kan uttrykkes som (a,b,b,a). Det antas videre at a+b+b+a=l (eller nær 1). Verdiene for a og b er videre foretrukket å være på formen k/2<n>, der k og n er heltall. Årsaken til dette er også i hovedsak å redusere beregningskompleksitet på grunn av den binære natur av prosessorene. Et eksempel på en impulsrespons for et 4-tap-filter utformet i samsvar med de ovenfor nevnte kriterier kan derfor være: (1/8, 3/8, 3/8, 1/8).
Med disse restriksjonene finnes det faktisk bare én frihetsdimensjon for variasjon av filteret. Dette velges å være verdien av a i det generelle uttrykket for 4-tap-filtre (a,b,b,a). b avledes fra a, siden a+b=<1>/2. Derved kan a benyttes som innstillingsparameter for å fremskaffe en filterkaråkteristikk nær en ideell frekvensrespons slik som den som er avbildet i fig. 1, dvs. en frekvensrespons som er maksimalt flat ved låve frekvenser.
Fig. 2 viser frekvensresponsene for fem 4-tap-filtre som impulsresponsene som er innbefattet i dem, korresponderer med. Frekvensresponsene er i det grunnleggende avledet ved å utføre den diskrete Fourier-transform for impulsresponsene. Ved sammenligning av disse frekvensresponsene med den ideelle frekvensresponsen i fig. 1, ser frekvensresponsene 1 og 2 ut til å være gode kandidater.
Impulsresponsene beskrevet ovenfor vedrører alle beregning av '/S-pikselposisjoner. 1 samsvar med teknikkens stilling utføres midling mellom en heltallsposisjon og en Vi-pikselposisjon ved å beregne verdier for W-pikselsposisjonene. Med henvisning til omtalen av pikselposisjonene gjengitt i bakgrunnsavsnittet, er et eksempel b=(A+c)/2.1 andre tilfeller gjøres midlingen på to '/i-pikselverdier, f.eks. ved beregning av g=(c+k)/2, der både c og k er '/a-pikselbeliggenheter, men i ulike retninger. Det tilsvarende gjelder for i, s og q. Mer generelt beregnes en middelverdi mellom to posisjoner. Filtreringseffekten av denne midlingen kan betraktes separat i hver retning (horisontalt og vertikalt). For hver retning viser det seg at én av de to posisjonene ikke filtreres i den relevante retning og at den andre posisjonen filtreres i samsvar med halvpikselinterpolasjonen. I eksemplet med g=(c+k)/2 filtreres c horisontalt på grunn av '/i-pikselinterpolasjonen, mens k ikke filtreres horisontalt. Vertikalt er situasjonen den motsatte.
Som resultat: Dersom den endimensjonale impulsresponsen for Vi-pikselinterpolasjonen er (a,b,b,a), og %-pikselverdier er avledet fra middelverdien av en '/4-pikselinterpolasjon og en ikke-J^-pikselinterpolasjon (f.eks. en heltallsverdi), kan den resulterende impulsrespons for '/4-pikselposisjoner på noen måte representeres ved (a/2, b/2+1/2, b/2, a/2). De resulterende absoluttverdiér for frekvensresponsene er vist i fig. 3 ved bruk av de samme '/4-pikselfiltrene som i fig. 2. Med sammenligning av disse frekvensresponsene med den ideelle frekvensresponsen i fig. 1, ser frekvensresponsene 4 og 5 ut til å være gode kandidater.
Frekvensresponsene for '/i-pikselverdier er forskjellig fra frekvensresponsene for !4-pikselverdier på grunn av ulik impulsrespons. Hensikten ved den ideelle frekvensrespons, dvs. å slippe gjennom lave frekvenser så uberørt som mulig og å dempe høye frekvenser, gjelder imidlertid bildeinnholdet som helhet. Derfor bør impulsresponsen innstilles i lys av å fremskaffe en kombinert frekvensrespons så nær som den ideelle frekvensrespons som mulig. Dette fører ikke nødvendigvis til de samme verdier som ved innstilling av Vi-pikselresponser og 14-pikselresponser separat.
Det finnes i gjennomsnitt 4 ganger så mange 14-pikselposisjoner som ¥2-pikselposisjoner. Ved bruk av blokkbasert bevegelseskompensasjon vil alle disse posisjonene benyttes. Statistikken for bruken er ikke nødvendigvis jevnt fordelt, men den kombinerte filtreringseffekten vil være et resultat av en kombinasjon av bruken av V2- og 14-pikselposisjoner. I figur 4 er de resulterende frekvensresponser for de fem filtrene vist ved midling med 1/5 vekt på kurvene i fig. 2 og 4/5 vekt på kurvene i fig. 3. Dette er bare et eksempel på hvordan en kombinert frekvensrespons kan beregnes. Andre beregninger kan benyttes for å beregne en kombinert frekvensrespons som tar i betraktning at en blanding av l/2-pikselposisjoner og 14-pikselposisjoner benyttes i prediksjonsprosessen.
Kurvene i denne figuren er et bedre grunnlag for utformingen av filteret. Ved sammenligning av disse frekvensresponsene med den ideelle frekvensresponsen i fig. 1, ser frekvensresponskurvene i området 3-4 ut til å resultere i god kombinert frekvensrespons. Dette tilsier at et foretrukket område for verdien av a er -0,12 til -0,09.
Claims (5)
1. Fremgangsmåte i videokoding og -dekoding for interpolering mellom heltallspikselposisjoner i et videobilde ved hjelp av et symmetrisk tap-filter, karakterisert ved trinnene: - å beregne verdier for <!>/4-pikselposisjoner ved det symmetriske tap-filteret som har en første diskret impulsrespons på (a,b,b,a), der tap-ene (a, b) er av formen k/2", a+b+b+a=l, og a er innenfor [-0,12, -0,09], - å beregne verdier for '/4-pikselposisjoner ved å midle mellom to verdier av naboposisjoner, hvorav minst én er en /4-pikselposisjon i den horisontale og/eller vertikale retning.
2. Fremgangsmåte i samsvar med krav 1,
karakterisert ved de ytterligere trinn: - å kombinere en første frekvensrespons assosiert med den første diskrete impulsrespons og en andre frekvensrespons assosiert med en andre diskret impulsrespons på (a/2, b/2+1/2, b/2, a/2), samsvarende med beregning av verdier for %-pikselposisjoner, til en tredje frekvensrespons, og - å innstille den første diskrete impulsrespons slik at nevnte tredje frekvensrespons nærmer seg en ideell frekvensrespons som har karakteristikker av å være nær én og i det vesentlige flat ved lave frekvenser og avtakende mot 0 ved høye frekvenser.
3. Fremgangsmåte i samsvar med krav 2,
karakterisert ved at trinnet med å innstille den første impulsrespons omfatter å sette verdien for en tap (a, b) som innstillingsparameter.
4. Fremgangsmåte i samsvar med krav 2 eller 3,
karakterisert ved at trinnet å kombinere den første frekvensrespons og den andre frekvensrespons innbefatter midling av nevnte første og andre frekvensrespons med en vekt på henholdsvis 1/5 og 4/5.
5. Bruk av en fremgangsmåte i samsvar med et av kravene 1-4, i pikselbevegelseskompensasjon i samsvar med kodingsstandarden H.264/AVC.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NO20035125A NO319660B1 (no) | 2003-11-17 | 2003-11-17 | Fremgangsmåte for interpolering av pixelverdier |
US10/986,758 US20050105611A1 (en) | 2003-11-17 | 2004-11-15 | Video compression method |
PCT/NO2004/000352 WO2005048608A1 (en) | 2003-11-17 | 2004-11-16 | Video compression method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NO20035125A NO319660B1 (no) | 2003-11-17 | 2003-11-17 | Fremgangsmåte for interpolering av pixelverdier |
Publications (3)
Publication Number | Publication Date |
---|---|
NO20035125D0 NO20035125D0 (no) | 2003-11-17 |
NO20035125L NO20035125L (no) | 2005-05-18 |
NO319660B1 true NO319660B1 (no) | 2005-09-05 |
Family
ID=30439571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20035125A NO319660B1 (no) | 2003-11-17 | 2003-11-17 | Fremgangsmåte for interpolering av pixelverdier |
Country Status (3)
Country | Link |
---|---|
US (1) | US20050105611A1 (no) |
NO (1) | NO319660B1 (no) |
WO (1) | WO2005048608A1 (no) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NO319629B1 (no) * | 2003-11-28 | 2005-09-05 | Tandberg Telecom As | Fremgangsmate for korrigering av interpolerte pikselverdier |
US9071847B2 (en) | 2004-10-06 | 2015-06-30 | Microsoft Technology Licensing, Llc | Variable coding resolution in video codec |
US8243820B2 (en) * | 2004-10-06 | 2012-08-14 | Microsoft Corporation | Decoding variable coded resolution video with native range/resolution post-processing operation |
US7956930B2 (en) * | 2006-01-06 | 2011-06-07 | Microsoft Corporation | Resampling and picture resizing operations for multi-resolution video coding and decoding |
US7916791B2 (en) * | 2006-06-16 | 2011-03-29 | International Business Machines Corporation | Method and system for non-linear motion estimation |
US8107571B2 (en) * | 2007-03-20 | 2012-01-31 | Microsoft Corporation | Parameterized filters and signaling techniques |
US8331454B2 (en) * | 2007-11-12 | 2012-12-11 | Cisco Technology, Inc. | Integer transform function for video compression systems |
US9049454B2 (en) * | 2011-01-19 | 2015-06-02 | Google Technology Holdings Llc. | High efficiency low complexity interpolation filters |
US20120224639A1 (en) * | 2011-03-03 | 2012-09-06 | General Instrument Corporation | Method for interpolating half pixels and quarter pixels |
US9313519B2 (en) | 2011-03-11 | 2016-04-12 | Google Technology Holdings LLC | Interpolation filter selection using prediction unit (PU) size |
EP2724532A1 (en) * | 2011-06-22 | 2014-04-30 | Motorola Mobility LLC | Fractional pixel interpolation filter for video compression |
EP2724534A2 (en) | 2011-06-24 | 2014-04-30 | Motorola Mobility LLC | Selection of phase offsets for interpolation filters for motion compensation |
BR112013033743A2 (pt) | 2011-07-01 | 2019-09-24 | Motorola Mobility Inc | filtro de interpolação de subpixel conjunto para predição temporal |
US10009622B1 (en) | 2015-12-15 | 2018-06-26 | Google Llc | Video coding with degradation of residuals |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6101277A (en) * | 1994-10-28 | 2000-08-08 | Oki Electric Industry Co., Ltd. | Image encoding and decoding method and apparatus using edge synthesis and inverse wavelet transform |
EP1296523A2 (en) * | 2001-09-25 | 2003-03-26 | Broadcom Corporation | Method and apparatus for improved motion estimation and compensation in digital video compression and decompression |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5574572A (en) * | 1994-09-07 | 1996-11-12 | Harris Corporation | Video scaling method and device |
US6531973B2 (en) * | 2000-09-11 | 2003-03-11 | Broadcom Corporation | Sigma-delta digital-to-analog converter |
US7516107B2 (en) * | 2001-02-21 | 2009-04-07 | Sony Corporation | Signal processing device |
JP2005532725A (ja) * | 2002-07-09 | 2005-10-27 | ノキア コーポレイション | ビデオ符号化における内挿フィルタタイプの選択方法および選択システム |
KR100472476B1 (ko) * | 2002-08-31 | 2005-03-10 | 삼성전자주식회사 | 움직임 보상을 위한 보간 방법 및 그 장치 |
US20040076333A1 (en) * | 2002-10-22 | 2004-04-22 | Huipin Zhang | Adaptive interpolation filter system for motion compensated predictive video coding |
-
2003
- 2003-11-17 NO NO20035125A patent/NO319660B1/no not_active IP Right Cessation
-
2004
- 2004-11-15 US US10/986,758 patent/US20050105611A1/en not_active Abandoned
- 2004-11-16 WO PCT/NO2004/000352 patent/WO2005048608A1/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6101277A (en) * | 1994-10-28 | 2000-08-08 | Oki Electric Industry Co., Ltd. | Image encoding and decoding method and apparatus using edge synthesis and inverse wavelet transform |
EP1296523A2 (en) * | 2001-09-25 | 2003-03-26 | Broadcom Corporation | Method and apparatus for improved motion estimation and compensation in digital video compression and decompression |
Also Published As
Publication number | Publication date |
---|---|
NO20035125L (no) | 2005-05-18 |
US20050105611A1 (en) | 2005-05-19 |
WO2005048608A1 (en) | 2005-05-26 |
NO20035125D0 (no) | 2003-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6434197B1 (en) | Multi-functional transcoder for compressed bit streams | |
CA2755889C (en) | Image processing device and method | |
JP5528985B2 (ja) | ビデオ復号化装置用のデブロッキングフィルタ装置、及びビデオ復号化用のデブロッキングフィルタの選択方法 | |
KR100989296B1 (ko) | 아티팩트 평가를 통한 향상된 이미지/비디오 품질 | |
JP3904248B2 (ja) | インタレースフィールドより成る画像間の動きを推定する方法および回路 | |
Huang et al. | A VVC proposal with quaternary tree plus binary-ternary tree coding block structure and advanced coding techniques | |
US20040101059A1 (en) | Low-complexity deblocking filter | |
US8265151B1 (en) | Mode decision using approximate 1/2 pel interpolation | |
WO2010143583A1 (ja) | 画像処理装置および方法 | |
AU2011312795B2 (en) | Optimized deblocking filters | |
MXPA04006814A (es) | Filtros dinamicos de codificacion. | |
EP1690421B1 (en) | Method for correcting interpolated pixel values | |
KR20110059654A (ko) | 적응 필터 | |
NO319660B1 (no) | Fremgangsmåte for interpolering av pixelverdier | |
EP2704434B1 (en) | Method and device for encoding video image, method and device for decoding video image, and program therefor | |
KR102632259B1 (ko) | 교차-성분 선형 모델을 사용하는 비디오 코딩 | |
JP4761390B2 (ja) | 内挿される画素値の計算方法の改良 | |
NO318318B1 (no) | Fremgangsmate for forbedret koding av video | |
US20090180541A1 (en) | Video motion compensation | |
NO320048B1 (no) | Fremgangsmate for chroma de-blokking | |
KR101601848B1 (ko) | 인터 예측 프레임 생성장치 및 그 생성방법, 및 거기에 이용되는 참조 프레임 보간장치 및 그 방법 | |
CN114125439B (zh) | 使用交叉分量线性模型的视频编解码 | |
WO2008097104A1 (en) | Method for pixel prediction with low complexity | |
AU2015255215A1 (en) | Image processing apparatus and method | |
KR100203659B1 (ko) | 비트 발생량 조절기능을 갖는 영상 부호화 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM1K | Lapsed by not paying the annual fees |