DE69827548T2 - Anordnung zur Vorverarbeitung für MPEG-2-Kodierung - Google Patents

Anordnung zur Vorverarbeitung für MPEG-2-Kodierung Download PDF

Info

Publication number
DE69827548T2
DE69827548T2 DE69827548T DE69827548T DE69827548T2 DE 69827548 T2 DE69827548 T2 DE 69827548T2 DE 69827548 T DE69827548 T DE 69827548T DE 69827548 T DE69827548 T DE 69827548T DE 69827548 T2 DE69827548 T2 DE 69827548T2
Authority
DE
Germany
Prior art keywords
image
images
coding
gop
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69827548T
Other languages
English (en)
Other versions
DE69827548D1 (de
Inventor
Claude Perron
Jean-Christophe Morizur
Patrice Alexandre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Broadband Systems
Thomson Broadcast Systems
Original Assignee
Thomson Broadband Systems
Thomson Broadcast Systems
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Broadband Systems, Thomson Broadcast Systems filed Critical Thomson Broadband Systems
Application granted granted Critical
Publication of DE69827548D1 publication Critical patent/DE69827548D1/de
Publication of DE69827548T2 publication Critical patent/DE69827548T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Description

  • Die Erfindung betrifft eine Vorrichtung zur Vorverarbeitung von Videobildern, die zur Codierung nach der MPEG 2-Video-Norm vorgesehen sind.
  • Ein System zur Codierung nach der MPEG 2-Videonorm benutzt die Eigenschaften des Signals, um seine Bitrate zu verringern.
  • Der angewendete Codieralgorithmus beschreibt die Bilder in Blöcken, unter Auswertung der räumlichen Redundanz und der zeitlichen Redundanz der zu codierenden Bilder.
  • Die räumliche Redundanz wird hauptsächlich durch die Aufeinanderfolge von drei Vorgängen ausgewertet: ein Vorgang, der allgemein bezeichnet wird mit diskreter Cosinustransformation, (DCT), ein Vorgang zur Quantisierung der Koeffizienten von der DCT und ein Vorgang zur Codierung mit variabler Länge zur Beschreibung der quantisierten Koeffizienten von der DCT.
  • Die zeitliche Redundanz wird analysiert durch einen Bewegungs-Kompensationsvorgang, der in der Suche, der Anwendung eines Translationsvorgangs für jeden Block des laufenden Bildes für den ähnlichsten Block in einem Referenzbild besteht. Die Analyse der zeitlichen Redundanz arbeitet mit einer Bestimmung eines Feldes von Translationsvektoren, allgemein bezeichnet mit Bewegungsvektoren, sowie einer Fehlervoraussage, nämlich die Differenz zwischen dem Signal des laufenden Bildes und dem Signal des durch die Bewegungskompensation vorausgesagten Bildes. Der Voraussagefehler wird dann gemäß dem Prinzip der räumlichen Redundanz analysiert.
  • Die MPEG 2-Codierung ist eine Codierung vom Voraussagetyp. Daraus folgt, dass der Decodiervorgang dafür regelmäßig neu-initialisiert werden muss, um das Signal gegenüber Übertragungsfehler oder Unterbrechungen in dem Signal aufgrund des Toggling (Umkippen) des Decoders von einem Programm zu dem anderen zu schützen.
  • Zu diesem Zweck sieht die MPEG 2-Norm vor, dass die Bilder in einem räumlichen Modus codiert werden müssen, d. h. gemäß einem Modus, der nur die räumliche Redundanz auswertet. Die in dem räumlichen Modus codierten Bilder werden allgemein mit INTRA-Bilder oder I-Bilder bezeichnet.
  • Die Bilder, die durch Auswertung der zeitlichen Redundanz codiert werden, sind von zwei Typen: Sie sind einerseits diejenigen Bilder, die bezüglich eines zeitlich früheren Referenzbildes gebildet werden, und andererseits diejenigen Bilder, die durch Referenz zu einem zeitlich früheren und einem zeitlich späteren Bild gebildet werden.
  • Die codierten Bilder, die durch Referenz zu einem zeitlich früheren Bild gebildet werden, werden im Allgemeinen als vorausgesagte Bilder oder P-Bilder bezeichnet, und die codierten Bilder, die durch Referenz zu einem zeitlich früheren Bild und einem zeitlich späteren Bild gebildet werden, werden allgemein als bidirektionale Bilder oder B-Bilder bezeichnet.
  • Ein I-Bild wird ohne Referenz zu anderen Bildern als ihm selbst decodiert. Ein P-Bild wird durch Referenz zu einem P- oder I-Bild decodiert, das ihm vorangeht. Ein B-Bild wird durch Anwendung des I- oder P-Bildes decodiert, das ihm vorangeht, und dem I- oder P-Bild, das ihm folgt.
  • Die Periodizität der I-Bilder bildet eine Gruppe von Bildern, die allgemein als GOP bezeichnet werden (das Akronym GOP steht für "Group of Pictures").
  • Wie dem Fachmann auf diesem Gebiet bekannt, ist innerhalb einer bestimmten GOP die Datenmenge in einem I-Bild im Allgemeinen größer als die Datenmenge in einem P-Bild, und die Datenmenge in einem P-Bild ist im Allgemeinen größer als die Datenmenge in einem B-Bild.
  • Zur Verwaltung dieser Disparität zwischen den Datenmengen abhängig von dem Typ des Bildes enthält ein MPEG 2-Coder eine Vorrichtung zur Selbststeuerung (servocontrolling) der Datenbitrate.
  • Eine derartige Servosteuerungsvorrichtung ermöglicht, den Strom der codierten Daten zu steuern. Sie enthält einen Pufferspeicher zur Speicherung der codierten Daten und bestimmt den Zustand des dualen Pufferspeichers gegenüber einem so genannten Referenzdecoder. Die Servosteuerungs-Einheit glättet die Bitraten der den Pufferspeicher verlassenden Daten derart, dass die Summe der Daten in dem Coder und in dem Referenzdecoder konstant ist.
  • Das beinhaltet, abhängig von dem Bildtyp (I, P oder B), die Verwaltung der Tatsache, dass die I-Bilder eine Bitrate größer als die mittlere Bitrate (im Allgemeinen gleich 3 bis 6 mal der mittleren Bitrate) erzeugen, dass die P-Bilder eine Bitrate in der Nähe der mittleren Bitrate erzeugen und dass die B-Bilder eine Bitrate kleiner als die mittlere Bitrate erzeugen (im Allgemeinen gleich 0,1 bis 0,5 mal der mittleren Bitrate).
  • Gemäß dem Stand der Technik erfolgt die Codierung eines I-Bildes in zwei Schritten. Zur Bestimmung des für die Codierung eines I-Bildes erforderlichen Quantisierschritts wird eine Proportionalitätsregel folgendermaßen angewendet: Qsp*Nbsp = Qpp*Nbpp,Qsp ist der Wert des für die Codierung des I-Bildes angewandten Quantisierschritts während des zweiten Schritts, Nbsp ist die Anzahl der Bit, die für die Codierung des I-Bildes während des zweiten Schritts vorgesehen ist, Qpp ist der Wert des Quantisierschritts, der für die Codierung des I-Bildes während des ersten Schritts angewendet wird, und Nbpp ist die Anzahl der Bit, die durch Codierung des I-Bildes während des ersten Schritts erzeugt werden.
  • Hinsichtlich der Codierung der P- oder B-Bilder arbeitet die Stromsteuerung entsprechend der Annahme eines stationären Signals. Unter dieser Annahme erzeugt jedes P- oder B-Bild für denselben Wert des Quantisierschritts eine Zahl von Bit identisch zu der Anzahl von Bit, die durch das vorangehende Bild derselben Art (P bzw. B) erzeugt werden.
  • In dem Fall, wo die Vollbildfrequenz des Signals 60 Hz beträgt, enthält das zu codierende Videosignal redundante Vollbilder. Der MPEG 2-Standard liefert dann die Möglichkeit, diese Vollbilder nicht zu codieren und dafür eine Replikationsreihenfolge zu dem Coder zu übertragen. Zur Ermittlung der redundanten Vollbilder erfolgen Messungen der Luminanzdifferenz zwischen Pixeln von aufeinander folgenden Vollbildern. Derartige Messungen der Differenz Pixel-zu-Pixel bieten keine relevanten Informationen bezüglich der Art und dem Maß der in den Bildern enthaltenen Bewegung. Daraus folgt, dass die Verteilung der Bildtypen (P oder B) in einer GOP im Allgemeinen durch die Frequenz des Auftretens von Bildern vom Typ P allein festgelegt ist. In den meisten Fällen ermöglichen die Differenzmessungen Pixel-zu-Pixel die Detektion einer Änderung der möglicherweise manifestierten Szene, in bestimmten Fällen durch die Einstellung der Größe der GOP.
  • Der oben beschriebene Codiertyp von I, P oder B-Bildern hat Nachteile.
  • Das I-Bild einer GOP ist dasjenige mit den höchsten Kosten hinsichtlich der Informationsmenge. Der oben erwähnte Pufferspeicher muss die sehr beachtliche Bitrate dieses Bildes absorbieren. Gemäß dem Stand der Technik werden, um das Auftreten einer kritischen Situation auf Grund einer Zunahme in der Entropie des Signals in den ersten wenigen Bildern nach der Codierung eines I-Bildes zu vermeiden, die Kosten I-Bildes begrenzt, um so auszuschließen, dass der Pufferspeicher des Coders in die Sättigung gelangt und der Pufferspeicher des Referenzdecoder austrocknet (dry up). Es ist daher üblich, zu verhindern, dass der Pufferspeicher des Decoders auf mehr als 60 bis 70% gefüllt wird. Das resultiert in einer Begrenzung der Qualität der I-Bilder.
  • Da das I-Bild einer GOP als Referenz in der Codierung aller anderen Bilder der GOP dient, enthält die Begrenzung der Qualität eines I-Bildes eine Begrenzung der Qualität aller anderen Bilder der GOP.
  • Allgemeiner, wenn das zu codierende Signal nennenswerte Änderungen aufweist, z. B. auf Grund einer Änderung des aufgenommenen Bildes, oder allgemeiner, auf Grund einer plötzlichen Änderung in der Entropie des Signals (die Entropie des Signals bezeichnet den Betrag an innewohnenden (inhärenten) Informationen, die das Signal enthält) erscheint eine zeitliche Instabilität in der Wiedergabe der Bilder. Diese zeitliche Instabilität zeigt sich in einem Qualitätsabfall der Bilder.
  • Außerdem bewirkt die Entropie des Signals, wie dem Fachmann auf diesem Gebiet bekannt ist, ein Bild, das einer beträchtlichen Änderung in der Entropie des Signals entspricht, hohe Codierkosten der Codierung entsprechend der eines I- oder P-Bildes. Unabhängig von dem oben genannten Abfall in der Qualität der Bilder wird das Codiersystem dann gezwungen, die Bitrate der Bilder zu verringern, die auf das der beachtlichen Zunahme in der Entropie entsprechende Bild folgen.
  • Außerdem muss, wenn die codierten Videosignale mit anderen Signalen desselben Typs gemultiplext werden sollen, die Gesamtbitrate des Multiplex zwischen den verschiedenen Signalen aufgeteilt werden. Diese Konfiguration tritt z. B. auf, wenn die Videoprogramme über Satelliten übertragen werden. In diesem Fall kann die Bitrate des Multiplex 40 MB/s erreichen und somit die Übertragung von mehreren Programmen gleichzeitig ermöglichen (zum Beispiel 10 Programme bei je 4 MB/s).
  • Ein Videoprogramm aus einer Codierung vom Typ MPEG 2 bei einer konstanten Bitrate enthält nach der Decodierung eine Änderung in der Qualität des wiederhergestellten Bildes. Das stammt von der Veränderbarkeit der Entropie des Videosignals mit der Zeit. Diese Veränderbarkeit erweist sich als eine Änderung in dem Quantisierwert der DCT-Koeffizienten.
  • Eine geeignete Zuordnung der Bitraten zu den Videoprogrammen erlaubt dann eine Gesamtverbesserung in der Qualität aller Videoprogramme und/oder eine Zunahme in der Anzahl der gesendeten Programme. Gemäß dem Stand der Technik dient dann das Ergebnis der Codierung der GOP der Ordnung k als Voraussage für die erwartete Schwierigkeit in der Codierung der GOP der Ordnung k + 1. Diese Lösung hat jedoch zwei Nachteile:
    • 1. Sollte sich der Inhalt des Videosignals stark ändern, kann das Ergebnis der Codierung der GOP mit dem Index k erheblich von dem Ergebnis der Codierung der GOP mit dem Index k + 1 abweichen.
    • 2. Die GOP mit dem Index k + 1 kann aus Optimierungsgründen beträchtlichen strukturellen Änderungen unterliegen (die Größe der GOP und die Verteilung von 2). Die GOP mit dem Index k + 1 kann aus Optimierungsgründen einer be trächtlichen strukturellen Änderung unterliegen (die Größe der GOP und die Verteilung der B- und P-Bilder innerhalb der GOP) bezüglich der GOP mit dem Index k.
  • Das Dokument EP-A-705 041 von Sony Corporation vom 22. September 1995 zeigt ein Verfahren, wo die Szenenänderungdetektion den Codiertyp des laufenden Vollbildes beeinflusst.
  • Das Dokument EP-A-0 708 564 von At&T Corporation, angemeldet am 11. Oktober 1995, zeigt ein Verfahren aufgrund von Statistiken mit Anwendung der vorangehenden Vollbilder für die Codierung des laufenden Vollbilds.
  • Das Dokument WO 952 9559 von Thomson Consumer Electronics, angemeldet am 20. April 1994, zeigt ein Verfahren auf der Grundlage eines statistischen Multiplex. Diese Dokumente schlagen Verfahren vor, wo der Codiertyp des laufenden Vollbildes abhängig ist von anderen Vollbildern oder von anderen Strömen.
  • Zusammenfassung der Erfindung
  • In vorteilhafter Weise ermöglicht die Erfindung, diese Nachteile durch Bildung für jede zu codierende GOP einer Voraussage der Kosten der Codierung entsprechend der angenommenen Struktur für diese GOP zu vermeiden. Diese Voraussage wird dann direkt durch den Bitraten-Zuordner ausgewertet.
  • Die Erfindung betrifft eine Vorrichtung zur Vorverarbeitung von Bildern zur Strukturierung in der Form von aufeinander folgenden Gruppen von codierten Bildern, wobei das erste Bild jeder Gruppe aus einem im räumlichen Modus codierten Bild besteht, mit
    • – einem Bildspeicher, der es ermöglicht, alle Bilder zu speichern, die eine Gruppe von Bildern bilden sollen, und
    • – einer Analyseschaltung, die es ermöglicht, den Bildspeicher zu lesen, die folgende Merkmale enthält:
    • – Mittel zur Berechnung eines Befehls mit
    • – für jedes gelesene Bild,
    • – einem redundanten Vollbildkennsignal,
    • – einem Kennsignal, das den Typ angibt, nach dem das Bild codiert werden soll,
    • – einem Kennsignal, das die Komplexität des Bildes misst, und
    • – Bildung einer Gruppe von Bildern für alle Bilder
    • – ein Kennsignal, das den Aggregatwert der Komplexitäten der verschiedenen Bilder der Gruppe misst.
  • Gemäß der Erfindung enthalten die Mittel zur Berechnung des Befehls folgendes:
    • – Mittel zur Berechnung
    • – der Kosten der Codierung im räumlichen Modus für jedes laufende gelesene Billd
    • – der Kosten der Codierung im zeitlichen Modus jedes gelesenen laufenden Bilds,
    • – der räumlichen und zeitlichen Komplexität eines Bildes aufgrund der Messungen der Codierkosten im räumlichen Modus und der Kosten der Codierung in zeitlichen Modus,
    • – Mittel zur Berechnung des Verhältnisses zwischen der Messung der zeitlichen Komplexität und der Messung der räumlichen Komplexität und Mittel zum Vergleich des Verhältnisses mit einem Schwellwert NS, wobei der durch das Verhältnis genommene Wert zu der Wahl eines Bilds vom Typ P führt, wenn er größer als NS ist, und der Wahl eines Bilds vom Typ P, wenn es kleiner als oder gleich NS ist.
  • Die Erfindung betrifft außerdem eine Vorrichtung zur Codierung von Bildern nach der MPEG 2-Videonorm mit Verarbeitungsschaltungen zur Codierung der Bilder. Das Bildcodiersystem enthält eine Einheit zur Vorverarbeitung der Bilder gemäß der Erfindung, so wie die oben genannte Einheit.
  • Die Erfindung betrifft außerdem ein System zur Zuordnung der dynamischen Bitrate für Videodaten mit n Einheiten zur Codierung gemäß der MPEG 2-Videonorm, einer Bitraten-Zuordnungsmöglichkeit und einem Multiplexer, die es ermöglichen, dass Videodaten von den verschiedenen Codiereinheiten gemäß der Erfindung, die zur Erzeugung der Befehle derselben Bitraten-Zuordnungsmöglichkeit zugeführt werden.
  • Die Vorverarbeitungs-Vorrichtung gemäß der Erfindung ermöglicht in vorteilhafter Weise die Bestimmung der Grenzen einer GOP in einer adaptiven Weise, um den Typ (I, P oder B) der verschiedenen, in einer GOP enthaltenen Bilder bestmöglich zu verteilen und eine Voraussage der Codierkosten (räumlich und zeitlich) für jedes Bild der GOP zu erhalten.
  • Wie vorangehend erwähnt, sind die Bilder von einer bei 60 Hz arbeitenden Quelle redundante Vollbilder. In vorteilhafter Weise ermöglicht die Erfindung, die Anzahl von redundanten Vollbildern in einer GOP festzustellen und demzufolge die Codierung dieser Vollbilder zu vermeiden. Das resultiert insgesamt in einer besseren Strategie für die Zuordnung der Bitrate der die zu codierenden Bilder darstellenden Daten.
  • Weitere Merkmale und Vorteile der Erfindung ergeben sich aus einer bevorzugten Ausführungsform anhand der beigefügten Figuren:
  • 1 ist eine schematische Darstellung eines Codiersystems, das eine Vorverarbeitungs-Vorrichtung gemäß der Erfindung benutzt.
  • 2 ist eine detaillierte Darstellung der Vorverarbeitungs-Vorrichtung gemäß einer ersten Ausführungsform der Erfindung,
  • 3 ist eine Darstellung in der Form eines Zustandsdiagramms eines elementaren Algorithmus, der in der Vorverarbeitungs-Vorrichtung gemäß der Erfindung angewendet wird, eine detaillierte schematische Darstellung der Vorverarbeitungs-Vorrichtung gemäß einer zweiten Ausführungsform der Erfindung,
  • 5 ist eine schematische Darstellung eines Systems zur dynamischen Bitraten-Zuordnung für eine MPEG 2-Codierung mit Anwendung einer Anordnung von Vorverarbeitungs-Vorrichtungen gemäß der Erfindung.
  • 1 ist eine schematische Darstellung eines Codiersystems mit einer Anwendung einer Vorverarbeitungs-Vorrichtung gemäß der Erfindung.
  • Das Codiersystem enthält eine Vorverarbeitungs-Vorrichtung 1 gemäß der Erfindung und einen mit 2 bezeichneten MPEG 2-Coder. Die Vorverarbeitungs-Vorrichtung 1 enthält einen Bildspeicher 3 und eine Bildanalyseeinheit 4. Der Coder 2 enthält einen Block 6 von Vorverarbeitungs-Schaltungen und einen Mikroprozessor 5.
  • In 1 ist die Vorverarbeitungs-Vorrichtung 1 ein Block von Schaltungen außerhalb des MPEG 2-Coders. Die Erfindung betrifft jedoch auch den Fall, wo die Vorrichtung 1 in den MPEG 2-Coder eingebaut ist. Die Vorrichtung 1 und der Block 6 bilden dann ein und denselben Block von Schaltungen.
  • Das Eingangssignal S1 der Vorverarbeitungs-Vorrichtung 1 besteht aus digitalen Bildern, die gemäß der CCIR 601-Norm formatiert sind. Das Signal S1 wird dem Eingang des Bildspeichers 3 zugeführt, der die Bildanalyseeinheit 4 versorgt. Die Bildanalyseeinheit 4 macht es möglich, Messungen der räumlichen und zeitlichen Komplexitäten der das Signal S1 darstellenden verschiedenen Bilder sowie die Messungen einer Ermittlung eines Szenenwechsels und eines redundanten Vollbilds durchzuführen.
  • Gemäß der Erfindung ermöglichen die durch die Einheit 4 durchgeführten Messungen, die dem Mikroprozessor 5 zugeführten Kennsignale INF1 zu bilden. Die Verzögerung, die bei der Berechnung der Kennsignale INF1 benötigt wird, wird durch den Bildspeicher 3 den Bildern zugeführt, die er speichert. Sobald die Analyse erfolgt ist, werden die in dem Speicher 3 enthaltenen Bilder zu dem Block 6 der Verarbeitungsschaltungen des Coders 2 übertragen.
  • Die räumliche Komplexität eines Bildes wird durch Messung der Informationsmenge geschätzt, die es enthält. Die zeitliche Komplexität eines Bildes erfolgt durch Messung der in dem Bild enthaltenen Informationsmenge, die durch die Pixel-zu-Pixel-Differenz zwischen diesem Bild und einem zeitlich früheren Referenzbild gebildet ist. Vorzugsweise ist das zeitlich frühere Referenzbild ein bewegungskompensiertes Bild, das das laufende Bild wiedergibt und als das vorausgesagte Bild bezeichnet wird.
  • Die Messungen der räumlichen und zeitlichen Komplexität gemäß der Erfindung ermöglicht es in vorteilhafter Weise, den Wert der Schwierigkeit der Codierung der Folge der verarbeiteten Bilder genau zu ermitteln.
  • Die Ermittlungen eines Szenenwechsels und eines redundanten Vollbilds kann durch Beachtung der Differenzen in der Luminanz zwischen Pixeln mit denselben Koordinaten erfolgen, die in zwei aufeinander folgenden Vollbildern der gleichen Parität enthalten sind. Im Fall einer starken Ähnlichkeit zwischen zwei aufeinander folgenden Vollbildern gleicher Parität kann das zweite als redundant bezeichnet werden. Im Gegensatz dazu zeigt eine starke Zunahme in der Unähnlichkeit zwischen zwei aufeinander folgenden Vollbildern gleicher Parität einen Szenenwechsel an.
  • Die verschiedenen, oben genannten Messungen ermöglichen, die Kennsignale INF1, die von der Analyseeinheit 4 kommen und zu dem Mikroprozessor 5 übertragen werden, zu bilden. Unter diesen Kennsignalen erscheinen in einer nicht einschränkenden Weise, der Typ (I, P oder B), gemäß dem ein Bild codiert werden muss, die Anwesenheit eines redundanten Vollbildes in einem Bild, die räumliche Komplexität in dem Fall eines Bild, das als ein Bild vom Typ I codiert werden muss, die zeitliche Komplexität in dem Fall eines Bildes, das in einem Bild vom Typus B oder P codiert werden muss, und die Aggregat-Komplexität über eine GOP. Der Ausdruck Aggregat-Komplexität über einer GOP soll als ein Mittel zur Messung verstanden werden, die es ermöglicht, ein Komplexitätskennsignal für alle Bilder in ein und derselben GOP abzuleiten. Anhand eines nicht-einschränkenden Beispiels kann die Aggregatkomplexität einer GOP gleich der gewichteten Summe XG sein, so dass: XG = KI*XI + ΣBGOPKB*XB + ΣPGOPKP*XP,wobei:
    XI, XP, XB die Komplexitäten für die Bilder der jeweiligen Typen I, P und B in der GOP darstellen,
    KI, KP, KB die statischen Koeffizienten für die Bilder der jeweiligen Typen I, P und B darstellen.
    ΣBGOP ist die Summe über alle Bilder vom Typ B in der GOP,
    ΣPGOP ist die Summe über alle Bilder vom Typ P in der GOP.
  • Der Inhalt der Kennsignale INF1 ist durch einen Konfigurationsbefehl CONF1 bestimmt, der von dem Mikroprozessor 5 stammt und der Analyseeinheit 4 zugeführt wird. Der Befehl CONF1 bezeichnet den Konfigurationszustand bestimmter Parameter in dem MPEG 2-Coder.
  • Der Mikroprozessor 5 wendet die Vorverarbeitung und den Regelalgorithmus an, die die Steuerung der verschiedenen Verarbeitungsschaltungen in dem Block 6 ermöglichen.
  • Wie es dem Fachmann auf diesem Gebiet bekannt ist, bestehen die Vorverarbeitungsschaltungen in dem Block 6 unter anderen Dingen aus einer Einheit zur horizontalen und vertikalen Filterung, einer Einheit zur Umsetzung der Bilder, einem Bewegungsschätzer, einem Codier-Entscheidungsblock, einer Schaltung zur Quantisierung der Koeffizienten von der diskreten Cosinustransformation, einem Coder mit variabler Länger und dem Pufferspeicher der vorangehend erwähnten Servosteuereinheit.
  • Gemäß der bevorzugten Ausführungsform der Erfindung tragen die Kennsignale, die als Parameter des Regelalgorithmus dienen, zur Erzeugung der verschiedenen Befehle CM, CF, CT, CQ und CH bei, die von dem Mikroprozessor 5 stammen und dem Schaltungsblock 6 zugeführt werden.
  • Der Befehl CM ist ein Befehl, der dem Block für die Codierung durch die Quantisierung der DCT-Koeffizienten zugeführt wird. Dieser Befehlt ermöglicht, die Werte der beiden Sätze von 64 Koeffizienten zu bestimmen, die die Intra- und Inter-Quantisiermatrices gemäß der MPEG 2-Videonorm bilden. Der Befehl CM stammt vorzugsweise von dem Kennsignal für die Neuumsetzung der Komplexität über das zu codierende GOP in Korrelation mit dem Bitraten-Einstellpunkt D.
  • Der Befehl CF ist ein Befehl, der der horizontalen und vertikalen Filtereinheit zugeführt wird. Dieser Befehl ermöglicht, die Auflösung eines Bildes zu bestimmen. Es ist dann möglich, zum Beispiel eine Bildauflösung mit 720, 544, 480 oder 352 Pixeln je Zeile zu wählen. Der Befehl CF wird gemeinsam mit dem Befehl CM, vorzugsweise mit denselben Kennsignalen, angewendet.
  • Der Befehl CT ist ein Befehl, der der Einheit zur Umsetzung der Bilder zugeführt wird. Dieser Befehl ermöglicht, die Struktur einer GOP durch die Bildtypen (I, P oder B) zu bestimmen, die in denselben Kennsignalen INF1 enthalten sind. Er wird au ßerdem dem Codier-Entscheidungsblock zugeführt, der dem Bildtyp (I, P oder B) kennen muss, den der Codierblock 6 codieren soll.
  • Der Befehl CQ ist ein Befehl, der der Schaltung zur Quantisierung der Koeffizienten von der diskreten Cosinustransformation zugeführt wird. Dieser Befehl ermöglicht, den Quantisierschritt zu ändern, der durch die Quantisierschaltung durchgeführt wird, um so mit der Einstellpunkt-Bitrate D übereinzustimmen, die dem Mikroprozessor 5 zugeführt wird. Die Komplexitätsmessungen sowie das redundante Vollbild-Kennsignal, die in dem INF1 enthalten sind, bilden einen Beitrag für den Aufbau des in dem Befehl CQ enthaltenen Kennsignals.
  • Der Befehl CH ist ein Befehl, der dem Pufferspeicher der Servosteuer-Einheit zugeführt wird. Er ermöglicht, einen Header mit jeder GOP und mit jedem Bild innerhalb der GOP zu bestimmen.
  • Die verschieden Befehle CM, CF, CT und CQ ermöglichen in vorteilhafter Weise, die Codierstrategie, die in den Verarbeitungsschaltungen vom Block 6 angewendet wird, anzupassen.
  • Zum Beispiel arbeitet die Analyseeinheit 4 für eine vorher bestimmte Größe der GOP über 12 Bilder, auf 18 Bilder, bevor ein Codiervorgang beginnt. Diese 18 Bilder stellen dann die maximal zulässige Größe für die Einstellung der GOP des Rangs k dar. Wie dem Fachmann auf diesem Gebiet bekannt ist, bestimmt die Größe einer GOP direkt die Zeitverzögerung, die durch den Decoder gefordert wird, um mit der Decodierung des MPEG-2-Stroms zu beginnen, der empfangen wird. Dadurch ist die maximale Größe einer GOP durch die Verzögerung begrenzt, die ein Benutzer zulässt, damit der Decoder das erste Bild wiedergibt. Im Allgemeinen wird eine nominelle Größe der GOP von 12 Bildern benutzt, zum Beispiel für die Satellitensendung von Videoprogrammen in das Format PAL/625 Zeilen/50 Hz. In diesem Fall dauert ein Bild 40 ms, und die sogenannte "lock on"-Verzögerung beträgt 12 mal 40 ms, das heißt 480 ms.
  • Gemäß der Erfindung wird in dem Fall, wo eine starke zeitliche Diskontinuität in einem der Bilder 1 bis 6 der vorausgesagten GOP vom Rang k + 1 verlängert die Vorve rarbeitungs-Einheit die GOP vom Rang k derart, dass das erste Bild der GOP vom Rang k + 1 auf dem ersten Bild liegt, das zeitlich dieser Diskontinuität folgt. Andererseits verkürzt in dem Fall, wo eine starke zeitliche Diskontinuität in einem der Bilder 7 bis 12 der GOP vom Rang k auftritt, dann die Vorverarbeitungs-Einheit die GOP vom Rang k, derart, dass das erste Bild der GOP vom Rang k + 1 auf dem ersten Bild liegt, das zeitlich dieser Diskontinuität folgt.
  • In dem Fall, wo keine zeitliche Diskontinuität der Bilder unter den oben genannten Bedingungen auftritt, dann die GOP vom Rang k ohne Änderung ihrer Begrenzungen bildet, das heißt, in dem oben genannten Beispiel, auf der Basis einer Struktur mit 12 Bildern.
  • Wie dem Fachmann auf diesem Gebiet bekannt ist, muss gemäß der MPEG 2-Videonorm die Bitrate der codierten Daten, die die Bilder darstellen, mit dem Einstellpunkt D übereinstimmen. Der Regelalgorithmus muss dann auf den Wert D des Datenvolumens eingestellt werden, die von einer GOP zu der nächsten auf dem Befehl CQ codiert werden.
  • Gemäß der Erfindung ermöglichen die Kennsignale INF1 die Optimierung der Verteilung der codierten Daten innerhalb ein und derselben GOP. Das ergibt eine größere Effektivität in der Wahl der Quantisierwerte, die zur Codierung aller eine GOP bildenden Bilder dienen, und demzufolge eine Qualitätsverbesserung der empfangenen Bilder.
  • 2 ist eine detaillierte schematische Darstellung einer ersten Ausführungsform der Vorverarbeitungseinheit gemäß der Erfindung.
  • Die Einheit von 2 enthält zwei Bildspeicher 7 und 8 vom Typ FIFO (die Abkürzung FIFO steht für "First In First Out"), ein Modul 9 für die Ermittlung eines redundanten Vollbildes und eines Szenenwechsels, ein Modul 10 zur Analyse der zeitlichen Komplexität, eine Einheit 11 zur Analyse der räumlichen Komplexität und ein GOP-Struktur-Zuordnungsmodul 12.
  • Die Bildspeicher 7 und 8 sind in Reihe angeordnet und bilden den in 1 mit 3 bezeichneten Bildspeicher.
  • Das Signal S1 gelangt in den Bildspeicher 7 und, parallel, in das Modul 9 für die Detektion eines redundanten Vollbilds und Szenenwechsels. Das CRT-Signal von dem Modul 9 wird zu dem Modul 12 übertragen. Die Kapazität des Bildspeichers 7 entspricht der Differenz zwischen Nmax und Nnom, wobei, wie oben definiert, Nmax die Maximalgröße darstellt, die für eine GOP zulässig ist, und Nnom die nominelle Größe einer GOP darstellt, das heißt die Größe, die von Anfang an als die definiert ist, die einer GOP zugeordnet werden muss.
  • Vorzugsweise verzögert der Bildspeicher 8 die Bilder von dem Bildspeicher 7 um eine Tiefe gleich der maximal zusätzlichen Größe Nmax derart, dass die Sendung der Kennsignale INF1 für eine Ansammlung von Bildern, die eine GOP darstellen, spätestens in dem Zeitpunkt beginnt, in dem das erste Bild der Gruppe von Bildern von dem Speicher 8 kommt.
  • Die von dem Bildspeicher 7 kommenden Bilder werden durch die räumliche Komplexitäts-Analyseeinheit 11 an ihrem Eingang empfangen. Die Einheit 11 enthält Mittel zur Durchführung der nacheinander folgenden Vorgänge: Zerhacken (chopping) eines Bildes in Matrixblöcke von 8 × 8 Pixeln, DCT-Transformation auf jedem Block, Quantisierung der Koeffizienten von der DCT, Codierung der quantisierten Koeffizienten mit variabler Länge. Unter der Wirkung des von dem Modul 12 stammenden Befehls CTRL1 erzeugt die Einheit 11, Bild für Bild, ein Kennsignal CS1, das die Kosten hinsichtlich der Anzahl von Bit des analysierten Bildes darstellt.
  • Das Modul 10 für die zeitliche Komplexitätsanalyse enthält einen Bildspeicher 13, eine Einheit 14 zur Bewegungskompensation, einen Differenzbilder 15 und eine Einheit 16 für die zeitliche Komplexität und den Szenenwechsel. Gemäß der Erfindung wird eine Differenz von Bildern, die von dem Differenzbilder 15 stammen, durch die Einheit 16 an ihrem Eingang empfangen. Diese Differenz der Bilder besteht, Pixel für Pixel, aus der Diskrepanz zwischen dem laufenden Bild (zugeführt zu dem positiven Eingang (+) des Differenzbilders 15) und einem Referenzbild (zugeführt zu dem ne gativen Eingang (–) des Differenzbilders 15), das von der Bewegungs-Kompensations-Einheit 14 stammt.
  • Das Referenzbild von der Einheit 14 zur Bewegungskompensation ist ein vorausgesagtes Bild, gebildet aus dem laufenden Bild und einem in dem Bildspeicher 13 gespeicherten Bild. Das in dem Bildspeicher 13 gespeicherte Bild ist das letzte durch das Modul 12 berechnete Bild, wie es als ein Bild vom Typ P oder vom Typ I codiert werden muss. Es wird durch Wirkung eines Befehls CTRL3 von dem Modul 12 in den Speicher 13 geladen. Die Bewegungs-Kompensationseinheit 14 kann wahlweise ein Feld von Vektoren bei einem Pixelwert liefern oder auch die Bewegungsvektoren über Blöcke von 8 Pixeln × 8 Pixeln suchen.
  • Die Einheit 16 enthält Mittel zur Durchführung der aufeinander folgenden Vorgänge: Aufteilung oder Zerhackung der Bilddifferenz in Matrixblöcke von 8 × 8 Pixeln, DCT-Transformation auf jedem Block, Quantisierung der Koeffizienten von der DCT, eine Codierung mit variabler Länge der quantisierten Koeffizienten. Unter der Wirkung des Befehls CTRL2 von dem Modul 12 erzeugt die Einheit 16 für jede analysierte Differenz von Bildern ein Kennsignal CT1, das die Kosten hinsichtlich der Anzahl der Bit der analysierten Bilddifferenz darstellt.
  • Am Ausgang des Moduls 12 für die Zuordnung der GOP-Struktur sind drei Kennsignale (PDF, TYPI, CXI) mit der Bildfrequenz verfügbar: Ein Kennsignal PDF zeigt die Anwesenheit eines redundanten Vollbildes in dem laufenden Bild an, ein Kennsignal TYPI gibt den Typ (I, P oder B) an, gemäß dem das laufende Bild codiert werden soll, und ein Kennsignal CXI misst die Komplexität des laufenden Bilds (räumliche Komplexität für ein Bild vom Typ I oder zeitliche Komplexität für ein Bild vom Typ P oder B).
  • Die Messungen für die räumliche und zeitliche Komplexität werden durch das Modul 12 berechnet. Die Messung für die räumliche Komplexität ist gleich dem Produkt der Kosten CS1 mal dem Schritt des Quantisiervorgangs, der in der Einheit 11 erfolgt. Die Messung der zeitlichen Komplexität ist gleich dem Produkt der Kosten CT1 mal dem Vorgang des Schritts der Quantisierung, der in der Einheit 16 erfolgt.
  • Gemäß der bevorzugten Ausführungsform der Erfindung liegen drei Kennsignale PDF, TYPI und CXI durch beliebige bekannte Mittel in Phase, wobei das Signal S2 von dem Speicher 8 ausgeht. Das Modul 12 für die Zuordnung der GOP-Struktur erzeugt außerdem ein viertes Kennsignal CXG, dessen Aufgabe es ist, den Aggregatwert der Komplexitäten der verschiedenen Bilder zu messen, die eine GOP bilden. Gemäß der bevorzugten Ausführungsform der Erfindung liegt das Kennsignal CXG in Phase mit dem Kennsignal CXI, das dem ersten Bild einer GOP entspricht.
  • Die Gruppe der Kennsignale PDF, TYPI, CXI und CXG bildet das Befehlssignal INF1.
  • Gemäß der in 2 dargestellten Ausführungsform der Erfindung ist das Referenzbild ein vorausgesagtes Bild von dem Bewegungsschätzer 14. Die Erfindung betrifft jedoch auch den Fall, wo die Einheit 10 keinen Bewegungsschätzer enthält und wo das Differenzbild durch das von dem Speicher 13 kommende Bild ist.
  • 3 ist eine detaillierte schematische Darstellung in der Form eines Zustandsdiagramms eines Algorithmus, der in der Vorverarbeitungseinheit gemäß der Erfindung durchgeführt wird.
  • Der Algorithmus von 3 ist der Algorithmus, der durch die Möglichkeit 12 für die GOP-Struktur-Zuordnung benutzt wird.
  • Dieses Diagramm wird in 3 zeitlich von der Oberseite bis zu der Unterseite ausgewertet. Es erfolgt mit der Ankunft jedes neuen Bildes am Eingang der Vorrichtung 12 (Zustand E1 beim Start und darauf folgend E10). Die Initialisierungsphase (Zustand E2) ermöglicht, die Parameter für den Betrieb des Moduls 12 festzusetzen, unter denen zum Beispiel identifiziert werden: Nnom, die nominelle Größe einer GOP ohne Szenenwechsel, Mmax, die Maximalzahl der zulässigen aufeinander folgenden Bilder vom Typus B, NS, der Schwellwert des Vergleichs zwischen der zeitlichen und räumlichen Komplexität. Nach der Initialisierung können diese Parameter auch mit jedem Bild (Zustand E10) aktualisiert werden.
  • Die in dem Diagramm von 3 erwähnten Parameter N, M und TYPI betreffen die Bilder, die durch die Einheiten 11 und 16 für die Komplexitätsanalyse verarbeitet werden, und stellen jeweils die Gesamtzahl der Bilder dar, die bereits in der laufenden GOP identifiziert wurden, strukturiert durch die Anzahl der aufeinander folgenden Bilder B, die bereits in der derzeit strukturierten GOP identifiziert werden, und dem Typ des gerade analysierten Bildes. Bei der Initialisierung werden N, M und TYPI auf die folgenden Werte eingestellt: N = 0, M = 0, TYPI = undefiniert.
  • Die Messungen der räumlichen (Xs) und zeitlichen (Xt) Komplexität werden aus den Kosten CS1 und CT1 von den Komplexitäts-Analyseeinheiten 11 bzw. 16 gewonnen. Gemäß der Erfindung wird angenommen, dass die zeitliche Komplexität nicht größer sein kann als die räumliche Komplexität, so dass das Verhältnis der zeitlichen Komplexität zu der räumlichen Komplexität einen Wert zwischen 0 und 1 annimmt.
  • Drei Möglichkeiten bieten sich selbst für die Berechnung des Wertes von TYPI an. Die erste ergibt sich, wenn der Parameter N den Wert Nnom übersteigt und wenn keine Szenenänderung oder ein Schnitt in den Bildern in dem Speicher 7 detektiert worden ist (Zustände E3 und E4 bleiben wahr) oder wenn ein Szenenwechsel in dem laufenden Bild von dem Speicher 7 detektiert worden ist (Zustände E3 + E17 halten wahr). In diesem ersten Fall nimmt TYPI den Typ I an (Zustand E15), und die Aggregat-Komplexität CXG wird vor dem Rücksetzen auf Null gespeichert, um so in den Kennsignalen INF1 in Phase mit dem ersten Bild der GOP dargestellt zu werden, die gerade abgeschlossen ist. Die Parameter N und M werden dann neu initialisiert (Zustand E16), und der Speicher 13, der das Referenzbild enthält, das durch den Bewegungsschätzer 14 benutzt wird, wird mit dem laufenden Bild geladen (Zustand E14).
  • Wenn die Bedingungen für den Zustand E3 und den Zustand E4 nicht erfüllt sind, werden zwei neue Tests durchgeführt. Der erste besteht in der Prüfung, ob die Anzahl der aufeinander folgenden Bilder vom Typ B den maximal zulässigen Wert übersteigt (Zustand E5), der zweite besteht in dem Vergleich der Werte der räumlichen (Xs) und zeitlichen (Xt) Komplexitäten, die vorher berechnet wurden (Zustand E6) auf der Basis der Kosten CS1 und CT1 von den Komplexitäts-Analyseeinheiten 11 und 16. Der Test (Zustand E7) besteht dann in der Prüfung, ob das Verhältnis zwischen der zeitlichen Komplexität Xt und der räumlichen Komplexität Xs den Schwellwert NS übersteigt. Wenn die eine oder die andere der Bedingungen für die Zustände E5 und E7 erfüllt ist, nimmt TYPI den Wert P an (Zustand E12), und der Speicher 13 mit dem Referenzbild, das durch den Bewegungsschätzer 14 benutzt wird, wird mit dem laufenden Bild (Zustand E11) geladen. Gemäß dieser Wahl wird der Parameter M auf null gesetzt, und der Parameter N wird um ein Bild inkrementiert (Zustand E13).
  • Wenn die Tests für die Zustände E5 und E7 nicht wahr halten, erscheint der dritte besondere Fall, in dem TYPI den Wert B annimmt (Zustand E8). In diesem letzten Fall werden die Parameter M und N um ein Bild inkrementiert (Stufe E9).
  • Für jedes verarbeitete Bild mit dem Übergangszustand E10 nimmt das Bild-Komplexitäts-Kennsignal CXI einen zu Xs proportionalen Wert an, wenn das Bild vom Typ I ist, oder einen Wert proportional zu Xt, wenn das Bild vom Typ P oder B ist. Die Proportionalitätsregeln entsprechend dem Typ des Bildes sind in den Konfigurations-Parametern CONF1 definiert. Der Aggregat-Komplexitätswert CXG wird dann durch Hinzufügung des laufenden Wertes CXI aktualisiert.
  • 4 ist eine detaillierte schematische Darstellung der Vorverarbeitungseinheit gemäß einer zweiten Ausführungsform der Erfindung.
  • Die Einheit von 4 enthält Blöcke 7, 8, 9, 10, 11 und 12 wie diejenigen, die in 2 beschrieben wurden. Zusätzlich zu den Blöcken 7, 8, 9, 10, 11 und 12 enthält die Vorrichtung gemäß der zweiten Ausführungsform der Erfindung eine Einheit 17 zur Messung des Rauschwertes und einen Rauschreduzierer 18. Die Einheit 17 parallel zu dem Modul 9 empfängt das Signal S1 an ihrem Eingang. Der Eingang des Rauschreduzierers 18 ist mit dem Ausgang des Speichers 7 verbunden, und ihr Ausgang ist mit dem Eingang der Komplexitäts-Analyse-Module 10 und 11 sowie mit dem Eingang des Bildspeichers 8 verbunden.
  • Die Einheit 17 ermöglicht, in für sich bekannter Weise, den Grund-Videorauschwert (im Allgemeinen zur Vereinfachung mit "noise floor" bezeichnet) der das Signal S1 darstellenden Bilder. Die Rauschwertmessung NB von der Einheit 17 wird in dersel ben Weise wie das redundante Vollbild und die Szenenwechsel-Kennsignale CRT zu dem Modul 12 für die Zuordnung der GOP-Struktur übertragen. Umgekehrt steuert das Modul 12 den Rauschreduzierer 18 über einen Befehl CB. Dieser Befehl kann, unter anderem, die Aktivierung oder anderenfalls die Rauschfilter steuern.
  • Der Rauschreduzierer benutzt in einer für sich bekannten Weise Lösungen mit einer räumlich-zeitlichen Filterung von Median- und rekursiven Typen. Er kann auch eine Bewegungskompensationseinheit enthalten, wie die Einheit 14, um so die Effektivität der Filterung für die bewegte Objekte darstellenden Daten zu verbessern.
  • Der von der Einheit 17 stammende Rauschwert NB wird durch das GOP-Struktur-Zuordnungsmodul 12 den Kennsignalen PDF, TYPI, CXI und CXG zugeordnet, um so eine Gruppe von Kennsignalen INF2 zu bilden.
  • Der Bildspeicher 7 wird durch die Verzögerung durch den Rauschreduzierer 18 derart verringert, dass die Kennsignale INF2 in Phase mit den das Signal darstellenden Bildern gehalten werden. Gemäß der bevorzugten Ausführungsform bewirkt der Rauschreduzierer eine weitere Verzögerung um drei Vollbilder.
  • 5 zeigt das Schema eines dynamischen Bitraten-Zuordnungssystems für eine MPEG-2-Codierung mit Anwendung einer Gruppe von vorverarbeitenden Einheiten gemäß der Erfindung. Dieses System enthält n Bildquellen S11, S12, ... S1j, ... S1n, n vorverarbeitende Einheiten gemäß der Erfindung P1, P2, ... Pj, ... Pn, n MPEG 2-Coder C1, C2, ..., Cj, ... Cn, eine Bitraten-Zuordnungseinheit OD und einen Multiplexer MX, die ermöglichen, dass die verschiedenen Quellen gemeinsam denselben Sendekanal K benutzen. Wie in 1 gezeigt werden die Videosignale S2j (j = 1, 2, ..., n), die von dem vorverarbeitenden Gerät Pj stammen, zu dem Coder Cj übertragen, und der Befehl CONFj, der von dem Coder Cj stammt, wird der vorverarbeitenden Einheit Pj zugeführt.
  • Gemäß dem Stand der Technik (d. h. wenn das System keine Vorverarbeitungseinheit der Erfindung enthält), bewirkt die Bitraten-Zuordnungseinheit OD eine Zuordnung zu jedem der Coder einer Bitrate proportional zu der Komplexität der zu codierenden Bildern, während er in jedem Zeitpunkt garantiert, dass die Summe der Bitra ten die durch den Kanal zugelassene Bitrate nicht übersteigt. Wie dem Fachmann auf diesem Gebiet bekannt, wird das Bitraten-Kennsignal, das durch die Entscheidungseinheit zu einem Coder gesendet wird, dann mit einer bestimmten Verzögerung aufgrund der Dauer der Austauschvorgänge zwischen der Entscheidungs-Einheit und dem Coder zu einem Coder übertragen.
  • Insbesondere kann sich auf Grund eines Wechsels oder einer plötzlichen Bildänderung die Bitraten-Anforderung als sehr beträchtlich erweisen, während der Coder den Einstellpunkt entsprechend dieser Anforderung mit einer Verzögerung von mehreren Bildern empfängt. Die Voraussagecodierung resultiert in einer Verschlechterung der Bilder, die dem einen Wechsel oder Sprung darstellenden Bild folgen.
  • Das Zuordnungssystem für die dynamische Bitrate gemäß der Erfindung weist diese Nachteile nicht auf.
  • Gemäß der Erfindung geht jedem MPEG 2-Coder Cj (j = 1, 2, ..., n) eine Vorverarbeitungseinheit Pj voraus, wie eine derjenigen, die in 2 oder 4 beschrieben wurden. Kennsignale, die die Bitraten-Zuordnungseinheit OD zur Erzeugung der verschiedenen Bitraten-Einstellpunkte erzeugen, sind dann entweder die Kennsignale INF1, in dem Fall einer Vorverarbeitungsschaltung wie derjenigen, die in 2 beschrieben wurde, oder das Kennsignal INF2 in dem Fall einer Vorverarbeitungseinheit wie diejenige, die in 4 beschrieben wurde.
  • In 5 sind die Kennsignale INF1 oder INF2 in Übereinstimmung mit der Vorverarbeitungseinheit der Größenordnung j mit CPXj bezeichnet.
  • In vorteilhafter Weise ist dann die Bitraten-Zuordnungseinheit OD unter Steuerung der Kennsignale CPXj in der Lage, Bitraten-Einstellpunkte Dj ohne die oben genannte Verzögerung zu erzeugen. Außerdem entsprechen die durch die Einheit OD erzeugten Bitraten den Wahlen der GOP-Strukturen der Vorverarbeitungseinheit. Das ergibt eine bessere Verteilung der Bitraten über den gesamten Übertragungskanal.
  • Eine besonders vorteilhafte Anwendung eines Bitraten-Zuordnungssystems gemäß der Erfindung betrifft die Codierung von mehreren Quellen im Zusammenhang mit der direkten Satellitensendung.

Claims (8)

  1. Vorrichtung (1) zur Vorverarbeitung von Bildern zur Strukturierung in der Form von aufeinander folgenden Gruppen (GOP) von codierten Bildern, wobei das erste Bild jeder Gruppe aus einem im räumlichen Modus codierten Bild besteht, mit – einem Bildspeicher (3), der es ermöglicht, alle Bilder zu speichern, die eine Gruppe von Bildern (GOP) bilden sollen, und – einer Analyseschaltung (4), die es ermöglicht, den Bildspeicher (3) zu lesen, und die folgende Merkmale enthält: – Mittel (12) zur Berechnung eines Befehls (INF1) mit – für jedes gelesene Bild, – einem redundanten Vollbildkennsignal (PDF), – einem Kennsignal (TYPI), das einen Typ angibt, nach dem das Bild codiert werden soll, – einem Kennsignal (CXI), das die Komplexität des Bildes misst, und – Bildung einer Gruppe von Bildern (GOP) für alle Bilder – einem Kennsignal, das den Aggregatwert der Komplexitäten der verschiedenen Bilder der Gruppe misst, dadurch gekennzeichnet, dass – die Mittel (12) zur Berechnung des Befehls folgendes enthalten – Mittel zur Berechnung – der Kosten der Codierung im räumlichen Modus (CS1) für jedes laufende gelesene Bilds, – der Kosten der Codierung im zeitlichen Modus (CT1) jedes gelesenen laufenden Bilds, – der räumlichen und zeitlichen Komplexität eines Bildes aufgrund der Messungen der Codierkosten im räumlichen Modus (CS1) und der Kosten der Codierung in zeitlichen Modus (CT1), – Mittel zur Berechnung des Verhältnisses zwischen der Messung der zeitlichen Komplexität und der Messung der räumlichen Komplexität und Mittel zum Vergleich des Verhältnisses mit einem Schwellwert NS, wobei der durch das Verhältnis genommene Wert zu der Wahl eines Bilds vom Typ P führt, wenn er größer als NS ist, und zur Wahl eines Bilds vom Typ P führt, wenn es kleiner als oder gleich NS ist.
  2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, dass sie Mittel zur Detektierung einer Szenenänderung und eines redundanten Vollbilds enthält und dass die Mittel zur Berechnung des Befehls den Befehl auf der Grundlage des Signals von dem redundanten Vollbild und den Szenendetektiermitteln berechnen.
  3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, dass die Mittel zum Messen der Kosten der Codierung im zeitlichen Modus (CT1) einen Bildspeicher (13) enthalten, der ein Referenzbild und einen Differenzierer (15) enthält, die es ermöglichen, die Differenz zwischen dem laufenden gelesenen Bild und dem Referenzbild zu nehmen.
  4. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, dass die Mittel (11) zur Messung der Codierkosten im zeitlichen Modus (CT1) einen Bildspeicher (13), mit einem Referenzbild, einen Bewegungsschätzer (14) enthalten, der es ermöglicht, ein vorausgesagtes Bild auf der Grundlage des laufenden gelesenen Bildes und des Referenzbilds zu bilden, und einen Differenzierer (15) enthalten, der es ermöglicht, die Differenz zwischen dem laufenden gelesenen Bild und dem vorausgesagten Bild von dem Bewegungsschätzer (14) zu nehmen.
  5. Vorrichtung nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass sie Mittel zur Zuführung eines Befehls (CTRL3) enthält, die es ermöglichen, in den Bildspeicher (13) als Referenzsignal ein Bild zu laden, das als ein Bild vom Typ P oder ein Bild vom Typ I codiert werden muß.
  6. Vorrichtung (1) nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, dass sie eine Messeinheit (17) für den Rauschwert (NB) enthält, die parallel mit den Mitteln (9) zur Detektierung einer Szenenänderung und eines redundanten Halbbildes liegt, und dass der Bildspeicher (3) zur Speicherung aller Bilder, die eine Gruppe von Bildern darstellen, einen ersten Bildspeicher (7) und einen zweiten Bildspeicher (8) enthält, und dass die Vorrichtung einen Rauschreduzierer (18) enthält, dessen Eingang mit dem Ausgang des ersten Bildspeichers (7) und dessen Ausgang mit dem Eingang des zweiten Bildspeichers (8) verbunden ist.
  7. Vorrichtung zur Codierung von Bildern gemäß der MPEG-2-Videonorm mit Verarbeitungsschaltungen (6) zur Codierung der Bilder, dadurch gekennzeichnet, dass sie eine Einheit zur Vorverarbeitung der Bilder nach einem der Ansprüche 1 bis 6 enthält, und dass die Vorverarbeitungseinheit 1 es ermöglicht, Kennsignale (INF1, INF2) zur erzeugen, die zur Erzeugung von Befehlen (CF, CR, CD, CQ, CM) für die Verarbeitungsschaltungen (6) dienen.
  8. System zur Zuordnung der dynamischen Bitrate für Videodaten mit n Einheiten zur Codierung gemäß der MPEG 2-Videonorm, einer Bitraten-Zuordnungsmöglichkeit (OD) und einem Multiplexer (MX), die es ermöglichen, dass Videodaten von den verschiedenen Codiereinheiten an demselben Sendekanal (K) beteiligt sind, dadurch gekennzeichnet, dass wenigstens eine Codiereinheit eine Codiereinheit nach Anspruch 7 ist und dass die Kennsignale (INF1, INF2), die zur Erzeugung der Befehle der Verarbeitungsschaltung von der Vorverarbeitungsschaltung (1) dienen, der Bitraten-Zuordnungsmöglichkeit (OD) zugeführt werden.
DE69827548T 1997-05-27 1998-04-07 Anordnung zur Vorverarbeitung für MPEG-2-Kodierung Expired - Lifetime DE69827548T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9706461A FR2764156B1 (fr) 1997-05-27 1997-05-27 Dispositif de pretraitement pour codage mpeg ii
FR9706461 1997-05-27

Publications (2)

Publication Number Publication Date
DE69827548D1 DE69827548D1 (de) 2004-12-23
DE69827548T2 true DE69827548T2 (de) 2005-12-08

Family

ID=9507270

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69827548T Expired - Lifetime DE69827548T2 (de) 1997-05-27 1998-04-07 Anordnung zur Vorverarbeitung für MPEG-2-Kodierung

Country Status (5)

Country Link
US (1) US6229925B1 (de)
EP (1) EP0881836B1 (de)
JP (1) JP4404975B2 (de)
DE (1) DE69827548T2 (de)
FR (1) FR2764156B1 (de)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2790899B1 (fr) * 1999-03-09 2001-04-20 Thomson Broadcast Systems Dispositif et procede de regulation de debit dans un systeme de multiplexage statistique de flux d'images codees selon le codage mpeg 2
IL134182A (en) * 2000-01-23 2006-08-01 Vls Com Ltd Method and apparatus for visual lossless pre-processing
US6879988B2 (en) * 2000-03-09 2005-04-12 Pkware System and method for manipulating and managing computer archive files
WO2001080571A1 (en) * 2000-04-18 2001-10-25 Koninklijke Philips Electronics N.V. Bit rate allocation in joint bit rate transcoding
US6753929B1 (en) 2000-06-28 2004-06-22 Vls Com Ltd. Method and system for real time motion picture segmentation and superposition
US6631163B1 (en) * 2000-11-14 2003-10-07 Koninklijke Philips Electronics N.V. Dynamic adaptation of complexity in an MPEG-2 scalable decoder
JP4203707B2 (ja) * 2001-01-31 2009-01-07 日本電気株式会社 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
US6996183B2 (en) * 2001-09-26 2006-02-07 Thomson Licensing Scene cut detection in a video bitstream
US20030123538A1 (en) * 2001-12-21 2003-07-03 Michael Krause Video recording and encoding in devices with limited processing capabilities
KR100850705B1 (ko) * 2002-03-09 2008-08-06 삼성전자주식회사 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치
US7042943B2 (en) 2002-11-08 2006-05-09 Apple Computer, Inc. Method and apparatus for control of rate-distortion tradeoff by mode selection in video encoders
DE10313455A1 (de) * 2003-03-25 2004-10-14 Henkel Kgaa Wasch- und Reinigungsmittel
DE10313458A1 (de) * 2003-03-25 2004-11-18 Henkel Kgaa Wasch- oder Reinigungsmittel
DE10313457A1 (de) * 2003-03-25 2004-10-14 Henkel Kgaa Wasch- oder Reinigungsmittel
FR2857205B1 (fr) * 2003-07-04 2005-09-23 Nextream France Dispositif et procede de codage de donnees video
JP3914212B2 (ja) * 2004-03-05 2007-05-16 日本電信電話株式会社 動画像符号化装置,動画像符号化方法,動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR100955161B1 (ko) 2004-05-04 2010-04-28 콸콤 인코포레이티드 모션 보상된 프레임 레이트 상향 변환을 위한 방법 및 장치
US8005139B2 (en) 2004-06-27 2011-08-23 Apple Inc. Encoding with visual masking
US8406293B2 (en) 2004-06-27 2013-03-26 Apple Inc. Multi-pass video encoding based on different quantization parameters
KR100913260B1 (ko) 2004-07-01 2009-08-21 콸콤 인코포레이티드 규모 가변적 비디오 코딩에서 프레임 레이트 업 변환을 이용하는 방법 및 장치
JP2008507915A (ja) * 2004-07-20 2008-03-13 クゥアルコム・インコーポレイテッド 映像圧縮のための符号器補助式フレーム速度アップコンバージョンのための方法及び装置
US8553776B2 (en) 2004-07-21 2013-10-08 QUALCOMM Inorporated Method and apparatus for motion vector assignment
US7639892B2 (en) * 2004-07-26 2009-12-29 Sheraizin Semion M Adaptive image improvement
US7903902B2 (en) 2004-07-26 2011-03-08 Sheraizin Semion M Adaptive image improvement
US8780957B2 (en) * 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
US7526142B2 (en) * 2005-02-22 2009-04-28 Sheraizin Vitaly S Enhancement of decompressed video
AR052601A1 (es) * 2005-03-10 2007-03-21 Qualcomm Inc Clasificacion de contenido para procesamiento de multimedia
US8208536B2 (en) * 2005-04-28 2012-06-26 Apple Inc. Method and apparatus for encoding using single pass rate controller
US8879856B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US20070206117A1 (en) * 2005-10-17 2007-09-06 Qualcomm Incorporated Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video
US9602840B2 (en) 2006-02-06 2017-03-21 Thomson Licensing Method and apparatus for adaptive group of pictures (GOP) structure selection
US8204104B2 (en) * 2006-03-09 2012-06-19 Sony Corporation Frame rate conversion system, method of converting frame rate, transmitter, and receiver
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability
US8634463B2 (en) 2006-04-04 2014-01-21 Qualcomm Incorporated Apparatus and method of enhanced frame interpolation in video compression
US8750387B2 (en) 2006-04-04 2014-06-10 Qualcomm Incorporated Adaptive encoder-assisted frame rate up conversion
US9131164B2 (en) 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
WO2009141011A1 (en) * 2008-05-22 2009-11-26 Telefonaktiebolaget L M Ericsson (Publ) Content adaptive video encoder and coding method
US8976857B2 (en) * 2011-09-23 2015-03-10 Microsoft Technology Licensing, Llc Quality-based video compression
KR102049644B1 (ko) * 2017-12-12 2019-11-28 전자부품연구원 노이즈 동영상의 효율적인 부호화를 위한 계층적 노이즈 제거 방법

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5134480A (en) * 1990-08-31 1992-07-28 The Trustees Of Columbia University In The City Of New York Time-recursive deinterlace processing for television-type signals
JPH06233277A (ja) * 1993-02-05 1994-08-19 Sharp Corp 画像符号化装置
BE1007490A3 (nl) * 1993-09-10 1995-07-11 Philips Electronics Nv Inrichting voor het overdragen van een pluraliteit van televisie signalen over een transmissie kanaal.
CA2118880A1 (en) * 1994-03-11 1995-09-12 Kannan Ramchandran Jpeg/mpeg decoder-compatible optimized thresholding for image and video signal compression
WO1995029559A1 (en) * 1994-04-20 1995-11-02 Thomson Consumer Electronics, Inc. A multiplexer system using constant bit rate encoders
JP3711571B2 (ja) * 1994-09-29 2005-11-02 ソニー株式会社 画像符号化装置及び画像符号化方法
US5621468A (en) * 1994-10-07 1997-04-15 Daewoo Electronics Co., Ltd. Motion adaptive spatio-temporal filtering of video signals
US5734419A (en) * 1994-10-21 1998-03-31 Lucent Technologies Inc. Method of encoder control
FR2728129A1 (fr) * 1994-12-13 1996-06-14 Matra Communication Dispositif de multiplexage numerique de programmes video
JP3694912B2 (ja) * 1995-02-23 2005-09-14 株式会社日立製作所 メモリ制御方法及び画像復号装置
JP3353604B2 (ja) * 1995-08-09 2002-12-03 ソニー株式会社 動画像符号化方法及び装置、並びに信号記録媒体
JPH0974566A (ja) * 1995-09-04 1997-03-18 Sony Corp 圧縮符号化装置及び圧縮符号化データの記録装置
EP0778707B1 (de) * 1995-12-06 2002-06-19 THOMSON multimedia Einrichtung zur Vorverarbeitung eines Stromes digitaler Videodaten
US5963256A (en) * 1996-01-11 1999-10-05 Sony Corporation Coding according to degree of coding difficulty in conformity with a target bit rate
US5867221A (en) * 1996-03-29 1999-02-02 Interated Systems, Inc. Method and system for the fractal compression of data using an integrated circuit for discrete cosine transform compression/decompression
GB9607645D0 (en) * 1996-04-12 1996-06-12 Snell & Wilcox Ltd Processing of video signals prior to compression
GB9611455D0 (en) * 1996-05-29 1996-08-07 Digi Media Vision Ltd Method and apparatus for processing a digital signal
JPH10136380A (ja) * 1996-10-31 1998-05-22 Matsushita Electric Ind Co Ltd 動画像符号化装置、および方法

Also Published As

Publication number Publication date
FR2764156A1 (fr) 1998-12-04
FR2764156B1 (fr) 1999-11-05
US6229925B1 (en) 2001-05-08
EP0881836B1 (de) 2004-11-17
JPH10336663A (ja) 1998-12-18
DE69827548D1 (de) 2004-12-23
JP4404975B2 (ja) 2010-01-27
EP0881836A1 (de) 1998-12-02

Similar Documents

Publication Publication Date Title
DE69827548T2 (de) Anordnung zur Vorverarbeitung für MPEG-2-Kodierung
DE69233411T2 (de) Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung
DE69815159T2 (de) Kodierung von bewegten bildern mit globaler konstanter bitrate
DE3871998T2 (de) Fernsehsystem, in dem digitalisierte transformationskodierte bildsignale von einer kodierstation zu einer dekodierstation uebertragen werden.
DE69031045T2 (de) Einrichtung zur adaptiven Zwischenbild-Prädiktionsdekodierung eines Videosignals
DE69938093T2 (de) Steuerung der Datenrate für einen MPEG-Transcoder ohne a-priori Kenntnis des Bildtyps
DE69435000T2 (de) Bildkodierungsvorrichtung
DE69831894T2 (de) Signalkodierung, -aufnahme und -übertragung
DE69738264T2 (de) Videokodierungs- und Videodekodierungsvorrichtung
DE60027495T2 (de) Video-codierverfahren und video-codiervorrichtung
DE4228220B4 (de) Vorrichtung zur hierarchischen Unterteilung von Videosignalen
DE69735756T2 (de) Dynamische steuerung der kodierrate in einem blockbasierten videokodierungssystem
DE69213271T2 (de) Kodierung von Videosignalen
DE69837003T2 (de) Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem
DE4233543B4 (de) Vorrichtung zur Steuerung der Quantisierung von Videodaten
DE69908562T2 (de) Bewegungsvektorenextrapolation zur transkodierung von videosequenzen
DE69826823T2 (de) Verfahren zur videocodierung mit variabler bitrate und entsprechender videocodierer
DE69826155T2 (de) Verfahren und Vorrichtung zur digitalen Videosignalfilterung und -kodierung
DE69637335T2 (de) Bildsignalkodierungsmethode und -vorrichtung
DE60035740T2 (de) Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen
DE60023779T2 (de) Vorrichtung und Verfahren zur Überblendungsdetektion und Überblendungsinformationscodierung
DE4228221B4 (de) Vorrichtung zur Aufteilung von Videosignalen zwischen zwei Kanälen
DE69116972T2 (de) Verfahren und Einrichtung zur Datenkompression für Videosignale
WO2004077360A1 (de) Verfahren und anordnung zur videocodierung, wobei die videocodierung texturanalyse und textursynthese umfasst, sowie ein entsprechendes computerprogramm und ein entsprechendes computerlesbares speichermedium
DE19743202B4 (de) Verfahren zum Codieren eines Bewegungsvektors

Legal Events

Date Code Title Description
8364 No opposition during term of opposition