DE60119660T2 - Verfahren zur Verarbeitung von Videodateien - Google Patents

Verfahren zur Verarbeitung von Videodateien Download PDF

Info

Publication number
DE60119660T2
DE60119660T2 DE60119660T DE60119660T DE60119660T2 DE 60119660 T2 DE60119660 T2 DE 60119660T2 DE 60119660 T DE60119660 T DE 60119660T DE 60119660 T DE60119660 T DE 60119660T DE 60119660 T2 DE60119660 T2 DE 60119660T2
Authority
DE
Germany
Prior art keywords
data
transformation
max
image
der
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60119660T
Other languages
English (en)
Other versions
DE60119660D1 (de
Inventor
Societe Civile S.P.I.D. Arnaud Gesnot
Societe Civile S.P.I.D. Carolina Miro-Sorolla
Societe Civile S.P.I.D. Jorge Caviedes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of DE60119660D1 publication Critical patent/DE60119660D1/de
Application granted granted Critical
Publication of DE60119660T2 publication Critical patent/DE60119660T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • H04N19/865Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness with detection of the former encoding block subdivision in decompressed video

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Technischer Bereich der Erfindung
  • Diese Erfindung betrifft ein in einem digitalen Eingangsbild enthaltenes Datenverarbeitungsverfahren.
  • Sie kommt zum Einsatz bei der Detektion von Blöcken in einem digitalen Bild, zuvor codiert dann decodiert, gemäß einer Technik zur Codierung in Blöcken, der MPEG-Norm (in Englisch „Moving Pictures Expert Group") beispielsweise, und zur Korrektur der Daten, enthalten in diese Blöcken, zur Verringerung der sichtbaren Artefakten, verursacht durch die Technik zur Codierung in Blöcken.
  • Stand der alten Technik
  • Der Artikel mit dem Titel „On the POCS-based Postprocessing Technique to Reduce the Blocking Artifacts in Transform Coded Images", veröffentlicht von Hoon Paek, Rin-Chul Kim und Blut-Uk Lee in „IEEE Transactions on Circuits and Systems for Video Technology", Vol. 8, Nr. 3, Juni 1998, S. 358–367, beschreibt ein Datenverarbeitungsverfahren, enthalten in einem digitalen Eingangsbild, wobei das besagte Verfahren die Schritte enthält zur:
    • • Berechnung einer ersten diskreten Transformation einer ersten Dateneinheit,
    • • Berechnung einer zweiten diskreten Transformation einer zweiten Dateneinheit, angrenzend an die erste Einheit,
    • • Berechnung einer globalen diskreten Transformation einer Dateneinheit entsprechend der Verkettung der ersten und zweiten Einheiten, und
    • • Bestimmung einer vorausgesagten höchsten Frequenz anhand der transformierten Daten, kommend aus den ersten und zweiten Transformationen.
  • Der Artikel mit dem Titel „A projection-based post-processing technique to reduce blocking artifacts using a priori information on DCT coefficients of adjacent blocks", veröffentlicht von Hoon Paek und Sang-Uk Lee in „Proceedings of 3rd IEEE International Conference on Image Processing, Vol. 2, Lausanne, Schweiz, 16.–19. Sept. 1996, S. 53–56, beschreibt ein Filterverfahren von in einem digitalen Bild enthaltenen Daten.
  • Dieses Verfahren wird im Gegensatz zu den meisten bislang verwendeten Verfahren im Frequenzbereich angewendet, d.h. nach der Anwendung einer diskreten Transformation auf das digitale Eingangsbild, und nicht im spatialen Bereich. Diese diskrete Transformation ist beispielsweise eine Transformation in diskretem Kosinus DCT. Das Verarbeitungsverfahren zielt ab auf die Korrektur der Koeffizienten DCT, die Blockartefakten entsprechen. Um die mit Blockartefakten verbundenen Frequenzen zu finden und zu beseitigen wird das Verfahren nach dem alten Stand der Technik aus folgenden Schritten gebildet:
    • – Berechnung einer ersten Transformation in diskretem Kosinus U eines Segments u mit N Pixeln, mit N = 8 im folgenden Beispiel: U = DCT[u] = {U(0), U(1), ..., U(N-1)}, mit
      Figure 00020001
      wobei k die Frequenz des transformierten Datenwerts ist U, k ∊ [0, N-1]
    • – Berechnung einer zweiten Transformation in diskretem Kosinus V eines zweiten Segments v mit N Pixeln, an das Segment u angrenzend: V = DCT(v) = {V(0), V(1), ..., V(N-1)}, womit
      Figure 00020002
    • – Berechnung einer Transformation in globalem diskretem Kosinus W der Segmente w mit 2N, also 16 Pixeln entsprechend der Verkettung der Segmente u und v: W = DCT(w) = {W(O), W(1.), W(2N=1)}, womit
      Figure 00020003
  • 1 zeigt die zwei angrenzenden Segmente u (13) und v (14), die respektive zu zwei Blöcken (11, 12) mit 8 x 8 Pixeln (10) gehören und beiderseits einer Blockgrenze angeordnet sind (16). In der Annahme, dass die Frequenzinhalte der Segmente u und v unweit sind und dass der Inhalt der Segmente einheitlich ist, enthält das Segment w (15) entsprechend der Verkettung der ersten und zweiten Segmente spatiale Hochfrequenzen über denen der Segmente u und v, wenn ein Blockartefakt zwischen den Segmenten u und v vorhanden ist. Dabei kann W entsprechend U und V wie folgt ausgedrückt werden:
    Figure 00030001
  • Die vorausgesagte höchste Frequenz kwpred von W hängt theoretisch, d.h. wenn kein Blockartefakt vorhanden wäre, von den Höchstfrequenzen kumax und kvmax von U und V ab, wie folgt: kwpred = 2.max(kumax, kvmax ) + 2mit kumax = max(k ∊ {0, ..., N-1}/U(k)0)
    kvmax = max(k ∊ {0, ..., N-1}/V(k)0)
    und max ist die Funktion, die unter einer Einheit von bestimmten Werten am meisten k gibt.
  • Die Koeffizienten W(k) entsprechend ungeraden Frequenzen k über der vorausgesagten höchsten Frequenz kwpred werden gleichgesetzt mit Blockartefakten und aufgrund dessen auf Null gestellt.
  • Darstellung der Erfindung
  • Ziel dieser Erfindung ist es, ein Datenverarbeitungsverfahren vorzuschlagen, welches es ermöglicht, eine bessere visuelle Qualität der digitalen Bilder, die auf dem Bildschirm angezeigt werden, zu haben. Die Erfindung berücksichtigt folgende Überlegungen.
  • Ein Bild eines digitalen Videosignals wird aufgegliedert in Blöcke zu 8 Zeilen mit 8 Pixeln, um gemäß der MPEG-Norm codiert zu werden, wobei der erste Block des Bildes an Position (0,0) beginnt. Aufgrund der Konvertierungen digital-analog und analog-digital und infolge der eventuellen Verwendung von Algorithmen zur Vorverarbeitung des digitalen Videosignals kann ein originales Bild des besagten Signals um einige Pixel versetzt werden, und die Größe eines Rasters entsprechend den MPEG-Blöcken kann modifiziert sein. Dabei enthält das Eingangsbild, das am Eingang eines Fernsehgeräts verfügbar ist, nicht die Informationen, welche es ermöglichen, die ursprüngliche Änderung des decodierten Bildes oder die Änderung der Größe des Rasters entsprechend den Blöcken nach der Decodierung zu bestimmen. Das Datenverarbeitungsverfahren nach dem alten Stand der Technik erweist sich dann ineffizient, wenn es unverändert angewendet wird, denn es setzt voraus, dass der Ursprung des decodierten Bildes (0,0) ist und dass die Blöcke die Größe von 8 × 8 Pixeln haben.
  • Um diese Nachteile zu beheben ist das Datenverarbeitungsverfahren, enthalten in einem digitalen Eingangsbild gemäß dieser Erfindung, dadurch bemerkenswert, dass es einen Schritt zur Bestimmung einer reellen Höchstfrequenz anhand der transformierten Daten enthält, erhalten nach der globalen Transformation, und einen Schritt zur Detektion des Rasters anhand einem Vergleich zwischen der reellen Höchstfrequenz und der vorausgesagten Höchstfrequenz auf einem Teil des besagten digitalen Eingangsbilds.
  • Dieser Schritt zur Detektion des Rasters ermöglicht es, zu bestimmen, ob das digitale Eingangsbild codiert wurde oder nicht gemäß einer Technik zur Codierung in Blöcken, wobei die Größe des Rasters den Codierblöcken entspricht, ursprünglich zu 8 Zeilen mit 8 Pixeln, im Falle der MPEG-Norm, nach einer eventuellen Neuabtastung des Bildes während der Decodierung, was dann Blöcke zu 8 Zeilen mit 10, 12, oder 16 Pixeln im Falle der besagten Norm ergibt.
  • Kurze Beschreibung der Figuren
  • Diese Aspekte der Erfindung sowie noch andere detailliertere Aspekte werden dank der nachfolgenden Beschreibung mehrerer Ausführungsformen der Erfindung, die als nicht erschöpfende Beispiele gegeben werden, und hinsichtlich der beigefügten Figuren eindeutig ersichtlich, in denen:
  • 1 das Datenverarbeitungsverfahren nach dem alten Stand der Technik zeigt,
  • 2 ein Diagramm ist, welches ein Datenverarbeitungsverfahren gemäß der Erfindung für die Verarbeitung eines digitalen Videosignals darstellt,
  • 3 ein Diagramm ist, welches ein Datenverarbeitungsverfahren gemäß der Erfindung für die Detektion der codierten Bildsequenzen gemäß einer Technik zur Codierung in Blöcken darstellt,
  • 4 ein Organigramm ist des Schritts zur Detektion codierter Bilder gemäß einer Technik zur Codierung in Blöcken, und
  • 5 ein Diagramm ist, welches ein Datenverarbeitungsverfahren gemäß der Erfindung für die Korrektur der codierten digitalen Bilder darstellt.
  • Detaillierte Darstellung von mindestens einer Ausführungsform der Erfindung
  • Diese Erfindung betrifft ein Datenverarbeitungsverfahren, enthalten in einem digitalen Videoeingangssignal, wobei das besagte Verfahren dafür bestimmt ist, die visuelle Qualität des besagten digitalen Videosignals zu verbessern, wenn es zuvor entsprechend einer Technik zur Codierung in Blöcken codiert wurde.
  • 2 zeigt eine komplette Kette zur Verarbeitung eines digitalen Videosignals mit codierten digitalen Bildern (S1). Die besagte Kette umfasst eine Decodiereinheit (20), bestimmt für die Übertragung über einen Kanal CH (23) eines decodierten analogen Bilds (S2) an einen Fernsehempfänger (27). Die Decodiereinheit enthält einen Decodierer MPD (21), welcher die Decodierung des digitalen Videosignals, codiert gemäß der Technik zur Codierung in Blöcken, ermöglicht, und einen Digital-Analog-Wandler DAC (22). Der Fernsehempfänger enthält einen Analog-Digital-Wandler ADC (24), bestimmt für die Bereitstellung eines digitalen Eingangsbilds (S3) an eine Vorrichtung DET (25), welche eine Detektion ermöglicht, wenn das besagte digitale Eingangsbild gemäß einer Technik zur Codierung in Blöcken codiert wurde. Eine Vorrichtung zur Korrektur oder zur Nachverarbeitung COR (26) (in Englisch „postprocessing"), im Gegensatz zu einer Vorverarbeitung des Signals, die vor der Codierung des besagten Signals stattfinden würde, ermöglicht dann eine Verbesserung der visuellen Qualität der digitalen Bilder hinsichtlich ihrer Anzeige auf dem Bildschirm. Die Nachverarbeitung wird angewendet entsprechend der Daten, die von der Vorrichtung zur Detektion bereitgestellt werden.
  • Das Videosignal, das am Eingang eines Fernsehgeräts verfügbar ist, enthält Bilder, die aus Pixeln gebildet werden, doch enthält keine Informationen bezüglich der eventuellen Parameter zur Codierung und zur Decodierung des besagten Signals, wenn dieses letztere zuvor gemäß einer Technik zur Codierung in Blöcken codiert wurde. Deshalb ist die Vorrichtung zur Detektion dafür bestimmt, die Größe und die Rasterposition entsprechend den Blöcken zu bestimmen, die von der Technik zur Codierung verwendet wurde, die während der Decodierung erneut abgetastet werden konnten. Eine geeignete Anwendung der Vorrichtung zur Korrektur hängt tatsächlich ab von der Detektion und der Lokalisation des Rasters.
  • Das Datenverarbeitungsverfahren wurde insbesondere im Rahmen von codierten dann decodierten digitalen Bildsequenzen gemäß der MPEG-Norm entwickelt. Es ist jedoch auf jedes andere codierte dann decodierte digitale Videosignal gemäß einer Technik zur Codierung in Blöcken, beispielsweise wie H.261 oder H.263, anwendbar.
  • Ein Bild eines digitalen Videosignals, codiert gemäß der MPEG-Norm, gliedert sich in Blöcke zu 8 Zeilen mit 8 Pixeln, wobei der erste Block des Bildes an Position (0,0) beginnt. Aufgrund der Digital-Analog- und Analog-Digital-Konvertierungen und infolge der eventuellen Verwendung von Algorithmen zur Vorverarbeitung des digitalen Videosignals kann ein originales Bild des besagten Signals um einige Pixel versetzt werden. Andererseits kann das originale Bild gemäß verschiedenen horizontalen Formaten zur Codierung codiert werden für den Erhalt einer guten visuellen Qualität bei niedrigen Übertragungsgeschwindigkeiten. In diesem Fall wird das originale Bild horizontal unterabgetastet, bevor es codierte wird, dann während der Decodierung horizontal überabgetastet, um wieder sein anfängliches Format zu erhalten. Dies hat eine Änderung der Größe des Rasters zur Folge, bedingt durch Überabtasten, wobei die Codierung weiterhin auf Blöcken zu 8 Zeilen mit 8 Pixeln ausgeführt wird.
  • Um diesen Nachteil zu beheben zielt das Datenverarbeitungsverfahren gemäß der Erfindung auf die Detektion der digitalen Videosignale ab, kodiert gemäß der Technik zur Codierung in Blöcken. Dafür enthält das besagte Verfahren, gezeigt in 3, die folgenden Schritte:
    • – Einen Berechnungsschritt einer ersten diskreten Transformation DCT1 (31), eine Transformation in Kosinus beispielsweise, einer ersten Dateneinheit u (13). In der vorgezogenen Ausführungsform wird diese Dateneinheit gebildet anhand der Luminanzwerte von N Pixeln, mit N = 8 in unserem Beispiel. Das Verfahren zur Datenverarbeitung wird angewendet gemäß einer Dimension, d.h. gemäß einer Zeile von N Pixeln, um die Breite des Rasters zu erkennen, und gemäß einer Spalte von N Pixeln, um die Höhe des besagten Rasters zu erkennen.
    • – Einen Berechnungsschritt einer zweiten diskreten Transformation DCTI (32) einer zweiten Dateneinheit v (14), angrenzend an die erste Einheit. Diese Einheit wird in der vorgezogenen Ausführungsform ebenfalls aus N Pixeln gebildet.
    • – Einen Berechnungsschritt einer globalen diskreten Transformation DCT2 (33) einer Dateneinheit w (15) entsprechend der Verkettung CON (30) der ersten und zweiten Einheiten, und gebildet folglich aus 2N Pixel in unserem Fall.
    • – Einen Schritt zur Bestimmung PRED (34) einer vorausgesagten Höchstfrequenz kwpred (37) anhand der transformierten Daten U (13') und V (14'), kommend aus den ersten (31) und zweiten (32) Transformationen DCT1, folgendermaßen berechnet: kwpred = 2.max(kumax, kvmax ) + 2 mit kumax = max(k ∊ {0, ..., N-1}/abs(U(k)) > T), kvmax = max(k ∊ {0, ..., N-1}/abs(V(k)) > T), abs(x) ist die Funktion für den Erhalt des absoluten Werts von x, und wobei T ein Grenzwert größer oder gleich Null ist.
    • – Einen Schritt zur Bestimmung REA (35) einer reellen Höchstfrequenz kwmax (38), anhand der transformierten Daten W (15'), ausgehend von der globalen Transformation, folgendermaßen berechnet: kwmax = max(k ∊ {0, ..., 2N-1}/abs(W(k)) > T)
    • – Einen Schritt zur Detektion GRI (36), welcher es ermöglicht, zu bestimmen, ob das digitale Eingangsbild codiert wurde gemäß einer Technik zur Codierung in Blöcken, anhand einem Vergleich zwischen der reellen Höchstfrequenz kwmax (38) und der vorausgesagten Höchstfrequenz kwpred (37) auf einem Teil des digitalen Eingangsbildes. In der vorgezogenen Ausführungsform wird der besagte Teil aus einer Zeile alle zwanzig Zeilen eines Bildes für die Detektion der Breite des Rasters und aus einer Spalte alle zwanzig Spalten des besagten Bilds für die Detektion der Höhe des Rasters gebildet. Ein solches Verfahren erfordert geringe Rechenressourcen und versichert gleichzeitig eine gute Qualität der Detektion. Die Werte kwpred(j) und kwmax(j) werden dann für jedes Pixel j der Zeile oder der Spalte berechnet, indem die Berechnung der Transformationen DCT1 und DCT2 nach jedem Inkrement um ein Pixel iteriert werden. Der Schritt zur Detektion zeigt dann auf, ob ein Raster erkannt wurde, und wenn dies zutrifft die Größe und die Lokalisation dieses Rasters (39).
  • 4 ist ein Organigramm, das den Detektionsschritt (36) genauer veranschaulicht. Der besagte Schritt zur Detektion enthält einen Unterschritt zur Berechnung COMP (40) einer Größe X(j) wie: X(j) = kwpred(j) – kwmax(j).
  • An einer Blockgrenze liegt der Wert von X(j) über einem Grenzwert XT. In der vorgezogenen Ausführungsform wurde der Wert des Grenzwerts XT auf 4 festgelegt. Um die Position und die Größe des Rasters zu erkennen werden die Werte j von X, die diese Bedingung erfüllen, beibehalten, und es wird ein Histogramm dieser Werte Modulo 8 nachvollzogen. Das Raster wird erkannt, wenn ein Wert des Histogramms groß ist und beträchtlich mehr hervortritt als die 7 anderen, und dies in der vorgezogenen Ausführungsform, wenn:
    • – Der erste Höchstwert des Histogramms größer als 1 plus 3 Mal dem zweiten Höchstwert des besagten Histogramms ist, und
    • – der erste Höchstwert des Histogramms größer als 10 ist.
  • Ein erster Test HG (401) wird dann in der horizontalen Richtung ausgeführt, um zu bestimmen, ob ein Raster mit einer Breite von 8 Pixeln erkannt wurde. Wenn dies der Fall ist, wird der Schritt zur Detektion für den Erhalt des Ergebnisses HG1 (43) fertig gestellt mit der Angabe dessen, dass ein Raster mit einer Breite von 8 oder von 16 Pixeln erkannt wurde, wobei der letzte Fall einem 1/2 Bildformat entspricht. Im gegenteiligen Falle wird ein erster Unterschritt zur Konvertierung des Formats FC1 (41) ausgeführt, um von einem ursprünglichen Bild mit einer Breite von 720 Pixeln zu einem Bild mit einer Breite von 540 Pixeln zu wechseln, also einem 3/4 Bildformat. Dafür wird die Zeile eines Bilds mit einem Faktor 3 überabgetastet, indem zwei Nullen zwischen zwei Pixel des ursprünglichen Bildes hinzugefügt und mithilfe eines Filters F1 gefiltert wird. Als Beispiel enthält der Filter F1 19 Koeffizienten und ist der folgende:
    F1 = [9,6,0,-21,-9,0,103,220,295,330,295,220,103,0,-9,-21,0,6,9]
  • Das somit erhaltene Signal wird dann unterabgetastet, indem ein Pixel von vieren ausgewählt wird.
  • Das Detektionsverfahren des Rasters wird dann erneut angewendet, mit dem konvertierten digitalen Videosignal. Ein zweiter Test HG (402) wird dann ausgeführt, in horizontaler Richtung, um zu bestimmen, ob ein Raster mit einer Breite von 8 Pixeln in dem Bild nach der Konvertierung des Formats erkannt wurde. Wenn dies der Fall ist, dann wird der Schritt zur Detektion fertig gestellt, für den Erhalt des Ergebnisses HG2 (44) mit der Angabe, dass ein Raster mit einer Breite von 10 Pixeln in dem Anfangsbild vor der Konvertierung des Formats erkannt wurde. Im gegenteiligen Falle wird ein zweit Unterschritt zur Konvertierung des Bildformats FC2 (42) ausgeführt, um von einem ursprünglichen Bild mit einer Breite von 720 Pixeln zu einem Bild mit einer Breite von 480 Pixeln, also einem 2/3 Bildformat, zu wechseln. Dafür wird die Zeile eines Bilds mit einem Faktor 2 überabgetastet, indem eine Null zwischen zwei Pixel des ursprünglichen Bildes hinzugefügt und in mithilfe eines Filters F2 gefiltert wird. Als Beispiel enthält der Filter F2 15 Koeffizienten und ist der folgende:
    F2 = [-3,-37,-41,-20,52,163,248,300,248,163,52,-20,-41,-37,-3]
  • Das somit erhaltene Signal wird dann unterabgetastet, indem ein Pixel von dreien ausgewählt wird.
  • Das Detektionsverfahren des Rasters wird dann erneut angewendet, mit dem somit konvertierten digitalen Videosignal. Ein dritter Test HG (403) wird dann ausgeführt, in horizontaler Richtung, um zu bestimmen, ob ein Raster mit einer Breite von 8 Pixeln in dem Bild nach der Konvertierung des Formats erkannt wurde. Wenn dies der Fall ist, dann wird der Schritt zur Detektion fertig gestellt, für den Erhalt des Ergebnisses HG3 (45) mit der Angabe, dass ein Raster mit einer Breite von 12 Pixeln in dem ursprünglichen Bild erkannt wurde. Im gegenteiligen Falle entspricht das Ergebnis NHG (46) der Tatsache, dass keinerlei Raster in der horizontalen Richtung erkannt wurde.
  • Parallel dazu wird das Detektionsverfahren des Rasters auf das digitale Eingangsbild in der vertikalen Richtung angewendet. Ein Test VG (404) wird ausgeführt, um zu bestimmen, ob ein Raster mit einer Höhe von 8 Pixeln erkannt wurde. Wenn dies der Fall ist, dann wird der Schritt zur Detektion fertig gestellt, für den Erhalt des Ergebnisses VG (47) mit der Angabe, dass ein Raster mit einer Höhe von 8 Pixeln erkannt wurde. Im gegenteiligen Falle entspricht das Ergebnis NVG (48) der Tatsache, dass keinerlei Raster in der vertikalen Richtung erkannt wurde.
  • Das Detektionsverfahren des Rasters wurde im Falle der hauptsächlichen Bildformate beschrieben, die von der MPEG-Norm verwendet werden. Sie beschränkt sich nicht jedoch nicht auf diese Formate, und es können andere Bildformate in diesem Verfahren berücksichtigt werden, ohne dafür den Rahmen der Erfindung zu verlassen.
  • Das Detektionsverfahren, das hier beschrieben wurde, ermöglicht die Detektion, wenn ein von einem Fernsehgerät erhaltenes Videosignal gemäß einer Technik zur Codierung in Blöcken codiert wurde. Das besagte Verfahren bezeichnet zugleich die Größe und die Lokalisation des Rasters entsprechend den Blöcken, auf Grundlage derer die Codierung ausgeführt wurde. Es wird dann eine Verfahren zur Nachverarbeitung angewendet, entsprechend den Daten, die vom Detektionsverfahren bereitgestellt wurden, vorzugsweise auf dem Bild nach der Konvertierung des Formats, um Blöcke zu 8 Zeilen mit 8 Pixeln zu verarbeiten. Nach seiner Verarbeitung hinsichtlich seiner Anzeige auf dem Bildschirm wird das Bild dann erneut in das volles Bildschirmgrößenformat (d.h. 720 Pixel) konvertiert.
  • Einer vorteilhaften Ausführungsform zufolge verwendet das Verfahren zur Nachverarbeitung gemeinsame Schritte mit dem Detektionsverfahren gemäß der Erfindung. 5 beschreibt ein solches Verfahren zur Nachverarbeitung von digitalen Videodaten. Das besagte Verfahren enthält:
    • – Einen Berechnungsschritt einer ersten diskreten Transformation DCT1 (3l) einer ersten Einheit von N Daten u (13),
    • – einen Berechnungsschritt einer zweiten diskreten Transformation DCT1 (32) einer zweiten Einheit von N Daten v (14), angrenzend an die erste Einheit,
    • – einen Berechnungsschritt einer globalen diskreten Transformation DCT2 (33) einer Einheit mit 2N Daten w (15) entsprechend der Verkettung CON (30) der ersten und zweiten Einheiten und für den Erhalt einer Einheit mit transformierten Daten W (15').
    • – einen Schritt zur Bestimmung PRED (34) einer vorausgesagten Höchstfrequenz kwpred (37) anhand der transformierten Daten, U (13') und V (14'), kommend aus den ersten (31) und zweiten (32) Transformationen DCT1, berechnet folgendermaßen: kwpred = 2.max(kumax, kvmax ) + 2mit kumax = max( k ∊ {0, ..., N-1}/abs(U(k)) > T) kvmax = max(k ∊ {0, ..., N-1}/abs(V(k)) > T) wobei T ein Grenzwert ungleich Null ist.
  • Der Bestimmungsschritt gemäß der Erfindung führt eine Verfeinerung der Berechnung der kritischen Höchstfrequenz anhand des eingeführten Grenzwerts T aus. Diese Verfeinerung ermöglicht eine effizientere Korrektur des Bildes. Der Wert des Grenzwerts T hängt ab von der Anzahl an Pixeln, die zu den Dateneinheiten u und v gehören.
  • Das Verfahren zur Nachverarbeitung enthält ebenfalls einen Schritt zur Korrektur PROC (51) mit wiederum einem Unterschritt zur Detektion natürlicher Konturen anhand der Werte von Initialen u und v und transformierten U und V Daten. Dieser Unterschritt ermöglicht die Unterscheidung der besagten natürlichen Konturen von den Grenzen der Blöcke aufgrund von Artefakten zur Codierung. Somit wird eine natürliche Kontur erkannt, wenn zwei Bedingungen erfüllt werden:
    • – Die durchschnittlichen Werte ū und v der Dateneinheiten u und v beiderseits einer Blockgrenze sind unterschiedlich zu einem bedeutenden Wert, über M, womit: |ū – v| < M, und
    • – die Dateneinheiten u und v sind geringer Tätigkeit, was zu der Tatsache führt, dass die Werte von kumax und kvmax gering sind und unter k0 liegen, womit kumax < k0 und kvmax = < k0.
  • Der Schritt zur Korrektur PROC enthält zugleich einen Unterschritt zum Stutzen mit Nullstellung der ungeraden transformierten Daten W (15'), erhalten nach der globalen diskreten Transformation, wobei die Frequenz höher ist als die vorausgesagte Höchstfrequenz, für den Erhalt der gestutzten Daten (15'').
  • Das Verfahren zur Nachverarbeitung enthält schließlich einen Berechnungsschritt der umgekehrten diskreten Transformation IDCT2 (52) der gestutzten Daten, für den Erhalt der decodierten Daten (15'''), die dann dafür bestimmt sind, auf dem Bildschirm angezeigt zu werden.
  • Im Unterschied zum zuvor beschriebenen Detektionsverfahren, das auf einen Teil des Bildes, einige Zeilen und einige Spalten beispielsweise, angewendet werden kann, wird das Verfahren zur Nachverarbeitung vorzugsweise auf das gesamte Bild angewendet.
  • Außerdem kann dieses Verfahren zur Nachverarbeitung genauso gut nach dem Detektionsverfahren wie direkt am Ausgang eines Decodierers (21) angewendet werden, wobei die vom Decodierer bereitgestellten Parameter es ermöglichen, die Position des Rasters entsprechend den Codierblöcken zu kennen.
  • Das Verfahren zur Nachverarbeitung enthält zugleich zwei aufeinanderfolgende Phasen, deren Anwendungsfolge gleichgültig ist:
    • – Die Korrektur der vertikalen Artefakte, entsprechend einer Verarbeitung der Daten nach Zeilen,
    • – die Korrektur der horizontalen Artefakte, entsprechend einer Verarbeitung der Daten nach Spalten.
  • Schließlich, im Falle von verflochtenen Bildsequenzen, wird das Bild entflochten und bildet somit zwei Frames. Jeder der zwei Frames wird daraufhin dem Verfahren zur Nachverarbeitung unterzogen. Schließlich werden die zwei Frames nach der Verarbeitung erneut verflochten.
  • In einer ersten Ausführungsform des Verfahrens zur Nachverarbeitung gemäß der Erfindung enthalten die Dateneinheiten u (13) und v (14) die zugehörigen Luminanzwerte von N = 8 aufeinanderfolgenden Pixeln. Der Bestimmungsschritt PRED (34) der vorausgesagten höchsten Frequenz kwpred (37) anhand der transformierten Daten, U (13') und V (14'), kommend aus den ersten (31) und zweiten (32) Transformationen DCT1, wird dann mit einem horizontalen Grenzwert Th = 5 für die Korrektur der vertikalen Artefakte und mit einem vertikalen Grenzwert Tv = 5 in progressivem Modus (d.h. nicht verflochten) und Tv = 3 in verflochtenem Modus für die Korrektur der horizontalen Artefakte ausgeführt. Tatsächlich wird in diesem letzten Fall die Korrektur der horizontalen Artefakte ausgeführt, indem Dateneinheiten u und v entsprechend einer halben Auflösung der horizontalen Auflösung behandelt werden, was den Wert des vertikalen Grenzwerts bezüglich dem des horizontalen Grenzwerts erklärt. Was den Unterschritt zur Detektion der natürlichen Konturen betrifft, werden die Werte von M und von k0 vorzugsweise auf 30 und 3 festgelegt.
  • In einer zweiten Ausführungsform des Verfahrens zur Nachverarbeitung gemäß der Erfindung enthalten die Dateneinheiten u (13) und v (14) die Luminanzwerte in Verbindung mit N = 4 aufeinanderfolgenden Pixeln. Die Werte der Grenzwerte werden dann dementsprechend geändert, mit beispielsweise Th = 10, Tv = 5 in verflochtenem Modus, M = 25 und k0 = 1. Eine solche Vereinfachung ermöglicht die Verringerung der Komplexität des Verarbeitungsalgorithmus, kann jedoch weitgehend die Effizienz der Korrektur vermindern.
  • Schließlich, in einer dritten Ausführungsform des Verfahren zur Nachverarbeitung gemäß der Erfindung, enthalten die Dateneinheiten u (13) und v (14) jeweils die Luminanzwerte in Verbindung mit N = 8 aufeinanderfolgenden Pixeln. Allerdings werden die Dateneinheiten u (13) und v (14) respektive subdividiert in zwei Untereinheiten u', u'' einerseits und v', v'' andererseits, wobei die Untereinheiten u', v' die Daten ungeraden Rangs enthalten und die Untereinheiten u'' und v'' die Daten geraden Rangs enthalten.
  • Die Schritte zur Berechnung der diskreten Transformationen (31, 32, 33) werden angewendet auf die Untereinheiten u', v' einerseits und u'', v'' andererseits für den respektiven Erhalt der transformierten Daten U', V', W' einerseits und U'', V'', W'' andererseits.
  • Der Bestimmungsschritt PRED (34) liefert parallel die vorausgesagten Höchstfrequenzen kw'pred und kw''pred (37), folgendermaßen berechnet: kw'pred = 2.max( ku'max, kv'max ) + 2mit ku'max = max( k ∊ {0, ..., N-1}/abs(U'(k)) > Th oder Tv)
    kv'max = max(k ∊ {0, ..., N-1}/abs(V'(k)) > Th oder Tv) kw''pred = 2.max(ku''max, kv''max) + 2mit ku''max = max(k ∊ {0, ..., N-1}/abs(U''(k)) > Th oder Tv)
    kv''max = max( k ∊ {0, ..., N-1}/abs(V''(k)) > Th oder Tv)
    wobei beispielsweise Th = 10 und Tv = 5 in verflochtenem Modus.
  • Der Schritt zur Korrektur PROC (51) wird dann unabhängig von den transformierten Daten W' und W'' angewendet, mit:
    • – Einem Unterschritt zur Detektion natürlicher Konturen wie, beispielsweise: |ū' – v'|> 25, ku'max < 1 und kv'max < 1 wobei |ū'' – v''| > 25, ku''max < 1 und kv''max < 1
    • – einem Unterschritt zum Stutzen der transformierten Daten W' oder W'', erhalten nach der globalen diskreten Transformation, wobei die Frequenz höher ist als die vorausgesagte Höchstfrequenz kw'pred oder kw''pred.
  • Diese letzte Ausführungsform ermöglicht zugleich die Verringerung der Verarbeitungskomplexität unter Beibehaltung der Korrektureffizienz der ersten Ausführungsform.
  • Die vorhergehende Beschreibung in Bezug auf 2 bis 5 veranschaulicht die Erfindung eher, als sie zu begrenzen. Es ist offensichtlich, dass es andere Alternativen gibt, die den hiernach beigefügten Ansprüchen entsprechen.
  • Es gibt zahlreiche Möglichkeiten, um die beschriebenen Funktionen mittels eines Softwareprogramms (in Englisch „Software" zu implementieren. Diesbezüglich sind die 2 bis 5 sehr schematisch, wobei jede Figur nur eine Ausführungsform darstellt. Folglich schließt, obwohl eine Figur unterschiedliche Funktionen in der Form von gesonderten Blöcken zeigt, dies nicht aus, dass ein einziges Softwareprogramm mehrere Funktionen ausführt. Dies schließt auch nicht aus, dass eine Funktion von einer Softwareprogrammeinheit ausgeführt werden kann.
  • Es ist im Falle der Nachbearbeitungsmethode möglich, diese Funktionen mit einer Fernsehempfangsschaltung oder einer digitalen Fernseh- und Decoderempfangsschaltung (in Englisch „set top box") einzusetzen, nachdem die besagte Schaltung richtig programmiert wurde. Ein in einem Programmierspeicher enthaltener Anweisungenssatz kann die Schaltung zur Durchführung unterschiedlicher Operationen veranlassen, wie zuvor in Bezug auf 2 bis 5 beschrieben. Der Anweisungenssatz kann auch durch das Lesen eines Datenträgers, wie beispielsweise einer Platte, die den Anweisungenssatz enthält, in den Programmierspeicher geladen werden. Das Lesen kann auch über ein Kommunikationsnetzwerk wie beispielsweise das Internet stattfinden. In diesem Fall wird den Interessenten der Anweisungssatz von einem Service-Provider bereitgestellt.
  • In den Ansprüchen darf keines der Referenzzeichen in Klammern erschöpfend interpretiert werden. Das Wort „enthalten" schließt nicht das Vorhandensein anderer Elemente oder Schritte aus, die in einem Anspruch aufgeführt werden. Das Wort „ein" vor einem Element oder einem Schritt schließt nicht das Vorhandensein einer Vielzahl dieser Elemente oder dieser Schritte aus.

Claims (4)

  1. Datenverarbeitungsverfahren enthalten in einem digitalen Eingangsbild, wobei das besagte Verfahren die Schritte enthält zur: – Berechnung einer ersten diskreten Transformation (31) einer ersten Dateneinheit (13 ), – Berechnung einer zweiten diskrete Transformation (32) einer zweiten Dateneinheit (14), angrenzend an die erste Einheit, – Berechnung einer globalen diskreten Transformation (33) einer Dateneinheit (15) entsprechend der Verkettung (30) der ersten und zweiten Einheiten, und – Bestimmung (34) einer vorausgesagten Höchstfrequenz (37) anhand der transformierten Daten, kommend aus den ersten und zweiten Transformationen (13', 14'), wobei das besagte Verarbeitungsverfahren dadurch gekennzeichnet ist, dass es außerdem die Schritte enthält zur: – Bestimmung (35) einer reellen Höchstfrequenz (38) anhand der transformierten Daten, erhalten nach der globalen Transformation (15'), und – Detektion (36) des Rasters (39) anhand eines Vergleichs zwischen der reellen Höchstfrequenz und der vorausgesagten Höchstfrequenz auf einem Teil des besagten digitalen Eingangsbilds.
  2. Datenverarbeitungsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass es einen Schritt zur Korrektur des digitalen Eingangsbildes enthält, wenn ein Raster (39) erkannt wurde, wobei der Schritt zur Korrektur unter Berücksichtigung einer Größe und einer Position des besagten Rasters angewendet wird.
  3. Datenverarbeitungsverfahren nach Anspruch 1, mit: – Einem Schritt zum Stutzen (51) der transformierten Daten, erhalten nach der globalen diskreten Transformation (15'), wobei die Frequenz höher ist als die vorausgesagte Höchstfrequenz, – den ersten und zweiten Einheiten u (13) und v (14) der Daten, die respektive subdividiert werden in zwei Untereinheiten u', u'' einerseits und v', v'' andererseits, wobei die Untereinheiten u', v' die Daten ungeraden Rangs enthalten und die Untereinheiten u'' und v'' die Daten geraden Rangs enthalten, den Schritten zur Berechnung der diskreten Transformationen (31, 32, 33) zur Bestimmung (34) der vorausgesagten höchsten Frequenz und zum Stutzen (51) der transformierten Daten, erhalten nach der globalen diskreten Transformation, die auf die Untereinheiten u', v' einerseits und u'', v'' andererseits angewendet werden.
  4. Produkt der Reihe „Computerprogramm", in den Speicher eines digitalen Empfangsdecoders eines Fernsehers ladbar, mit dem Softwareprogrammcode für die Ausführung der Schritte des Datenverarbeitungsverfahrens nach einem der Ansprüche 1 bis 3, wenn das besagte Programm am digitalen Empfangsdecoder des Fernsehens ausgeführt wird. Bildtext einfügen
DE60119660T 2000-10-10 2001-10-02 Verfahren zur Verarbeitung von Videodateien Expired - Lifetime DE60119660T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0012936 2000-10-10
FR0012936 2000-10-10

Publications (2)

Publication Number Publication Date
DE60119660D1 DE60119660D1 (de) 2006-06-22
DE60119660T2 true DE60119660T2 (de) 2007-02-22

Family

ID=8855172

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60119660T Expired - Lifetime DE60119660T2 (de) 2000-10-10 2001-10-02 Verfahren zur Verarbeitung von Videodateien

Country Status (6)

Country Link
US (1) US7724825B2 (de)
EP (1) EP1202577B1 (de)
JP (1) JP3939524B2 (de)
KR (1) KR100859422B1 (de)
CN (1) CN1201592C (de)
DE (1) DE60119660T2 (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60119660T2 (de) * 2000-10-10 2007-02-22 Koninklijke Philips Electronics N.V. Verfahren zur Verarbeitung von Videodateien
FR2841424A1 (fr) * 2002-06-25 2003-12-26 Koninkl Philips Electronics Nv Procede de detection d'artefacts de bloc
FR2841423A1 (fr) * 2002-06-25 2003-12-26 Koninkl Philips Electronics Nv Procede de detection d'artefacts de bloc
EP1527610A1 (de) * 2002-07-31 2005-05-04 Koninklijke Philips Electronics N.V. Dynamische detektion von blockartefakten
KR20040046250A (ko) * 2002-11-26 2004-06-05 한국정보통신주식회사 게이트웨이 기능을 구비한 신용카드 조회기
FR2848373A1 (fr) 2002-12-04 2004-06-11 Koninkl Philips Electronics Nv Procede de mesure d'artefacts de bloc
KR20110106403A (ko) 2009-01-27 2011-09-28 톰슨 라이센싱 비디오 인코딩 및 디코딩에서 변환 선택을 위한 방법 및 장치
AU2014291253B2 (en) * 2013-07-19 2018-07-05 Sony Corporation Information processing device and method

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0585573A3 (en) * 1992-08-31 1994-07-13 Ibm System and method for suppressing blocking artifacts in decoded transform coded images
JPH08191444A (ja) * 1995-01-09 1996-07-23 Matsushita Electric Ind Co Ltd ビデオ信号復号化装置
US5850294A (en) * 1995-12-18 1998-12-15 Lucent Technologies Inc. Method and apparatus for post-processing images
KR100244290B1 (ko) * 1997-09-09 2000-02-01 구자홍 저속 전송에서의 동영상을 위한 디블록킹 필터링 방법
US6795580B1 (en) * 1998-09-10 2004-09-21 Tektronix, Inc. Picture quality measurement using blockiness
DE60119660T2 (de) * 2000-10-10 2007-02-22 Koninklijke Philips Electronics N.V. Verfahren zur Verarbeitung von Videodateien

Also Published As

Publication number Publication date
US7724825B2 (en) 2010-05-25
DE60119660D1 (de) 2006-06-22
CN1348311A (zh) 2002-05-08
KR20020028838A (ko) 2002-04-17
EP1202577A9 (de) 2002-08-28
CN1201592C (zh) 2005-05-11
US20020126761A1 (en) 2002-09-12
KR100859422B1 (ko) 2008-09-23
JP3939524B2 (ja) 2007-07-04
EP1202577A1 (de) 2002-05-02
JP2002305747A (ja) 2002-10-18
EP1202577B1 (de) 2006-05-17

Similar Documents

Publication Publication Date Title
DE69632622T2 (de) Universaler MPEG-Dekoder mit skalierbarer Bildgrösse
DE69631108T2 (de) Nachfilterung zur Entfernung von Artefakten in DCT-codierten Bildern
DE69728801T2 (de) Verfahren und Vorrichtung zum Verändern der Auflösung durch direkte DCT Koeffizenten-Umsetzung
DE69936723T2 (de) Verfahren zur Datenbearbeitung und zum Einfügen eines Wasserzeichens
DE69628282T2 (de) Verfahren zur kompression mehrerer videobilder
DE69206847T2 (de) Bildverarbeitungsverfahren
DE69735679T2 (de) Verfahren zur Bilddecodierung
DE69032177T2 (de) Kodierungsgerät
DE69826928T2 (de) Kompression eines Mosaikbildes
DE69123646T2 (de) Kodierverfahren und -vorrichtung
DE69818751T2 (de) Dekompression von interpolierten Bildern
DE60117915T2 (de) Bilddatenverarbeitungsverfahren
DE19815861A1 (de) Verfahren und Vorrichtung für eine auf Blöcken basierende Bildverarbeitung
DE60203850T2 (de) System und Verfahren zum Verarbeiten von Bildern mit aufgelöster Mosaikstruk- tur, um durch Farb-Aliasing hervorgerufenen Artefakte zu verringern.
DE69814212T2 (de) Gerät zur Bildsignalumwandlung
DE10219132A1 (de) System und Verfahren zum Verbessern der Bildqualität bei verarbeiteten Bildern
DE69915843T2 (de) Teilbandkodierung/-dekodierung
EP0490983B1 (de) Verfahren, Coder und Decoder zur Übertragung und zum kompatiblen Empfang von standardisierten Fernsehsignalen
DE60119660T2 (de) Verfahren zur Verarbeitung von Videodateien
DE60303614T2 (de) Verfahren zur bildskalierung
DE69126525T2 (de) Digitale bildverarbeitung mit filterung der blockkanten
DE69304556T2 (de) Trennbare Unterabtastung von digitalen Bilddaten mit allgemeiner periodischer Symmetrie
DE69723325T2 (de) Verfahren und Vorrichtung zur Codierung und Decodierung von Bildern
DE60311781T2 (de) Bildsignalnachbearbeitungsverfahren
EP1110407B1 (de) Verfahren und anordnung zur codierung und decodierung eines digitalisierten bildes mit anwendung eines gesamtbewegungsvektors

Legal Events

Date Code Title Description
8364 No opposition during term of opposition