EP1285538A1 - Verfahren zur transformationscodierung von bewegtbildsequenzen - Google Patents

Verfahren zur transformationscodierung von bewegtbildsequenzen

Info

Publication number
EP1285538A1
EP1285538A1 EP01921209A EP01921209A EP1285538A1 EP 1285538 A1 EP1285538 A1 EP 1285538A1 EP 01921209 A EP01921209 A EP 01921209A EP 01921209 A EP01921209 A EP 01921209A EP 1285538 A1 EP1285538 A1 EP 1285538A1
Authority
EP
European Patent Office
Prior art keywords
transformation
coding
blocks
block
motion compensation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP01921209A
Other languages
English (en)
French (fr)
Inventor
Alexander Romanowski
Sven Bauer
Peter Siepen
Mathias Wien
Thomas Wedi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of EP1285538A1 publication Critical patent/EP1285538A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Definitions

  • the invention is based on a method for
  • Transformation coding of moving image sequences in which motion vectors with which the motion compensation is carried out are estimated in blocks between a reference image signal and a current image signal of the image sequence.
  • a motion vector field is estimated block by block between a previously created picture signal (reference frame) and a current frame of a picture sequence and then one with this vector field
  • Block transformations are usually used to code the prediction error, usually a discrete cosine transformation (DCT) with 8 8 coefficients.
  • DCT discrete cosine transformation
  • Transformation coding used [1, 2].
  • Motion compensation uses blocks of size 16 x 16 and 8 x 8 pixels and with MPEG-4 in the case of interlaced coding also 16 x 8 pixels [1].
  • the size of the block transformation is constant with 8 x 8 coefficients.
  • the method according to the invention namely the coupling of the block size of the transformation for the prediction error to the block size used in motion compensation, is Particularly advantageous if the blocks to be transformed are not only limited to square shapes, but also allow rectangular blocks, for example 4 x 8 or 16 x 8 pixels.
  • the use of block sizes coupled to the motion compensation offers the advantage of being able to jointly transform maximally large parts of the prediction error without the block boundaries contained therein having disruptive high-frequency
  • Proportions reduce the transformation gain. An increased coding efficiency is thereby achieved.
  • the energy of the transformed signal is concentrated on a few coefficients by the transformation.
  • the number of consecutive zeros within blocks is increased by using larger blocks, which can be used for more effective coding (run-length coding).
  • FIG. 1 shows a possible division of a macroblock into subblocks
  • FIG. 2 shows an adaptive block division of a macroblock
  • the picture sequence frames are divided into macro blocks (MB), which consist of a block with 16 x 16 pixels of the luminance component and two corresponding chrominance blocks, often 8 x 8 pixels, 4: 2: 0 YUV format [5].
  • MB macro blocks
  • the first block represents a macro block with 16 x 16 pixels
  • the finely divided macro block has 4 x 4 sub-blocks.
  • Motion compensation is performed. Different block sizes are used.
  • the prediction error is transformation coded.
  • the block size of the transformation coding is coupled to the block size used in motion compensation, in particular the block size for the
  • Transformation coding of the prediction error is chosen equal to the block size that was used for the motion compensation. Not only square but also rectangular blocks are permitted in order to be able to transform large parts of the prediction error together. This leads to a very effective coding, since the block sizes for the motion compensation are already to be coded in the transmission bit stream and thus for the adaptive transform coding with regard to them
  • Block sizes no further signaling is required.
  • the number of consecutive zeros within the blocks can be used for an effective coding, in particular a run length coding.
  • Figure 2 shows some macro blocks MB with 16 x 16 pixels in the upper left corner of a frame.
  • the macroblocks MB are marked with small letters for the rows and large letters for the columns.
  • Macroblock MB (aA) is divided into four sub-blocks, each of which is assigned a motion vector. Each of these sub-blocks is predicted independently of the others from the reference frame. MB (aB) has only one motion vector, so the sub-block here corresponds to the entire macro block MB. In the MB (bA) example, there are eight sub-blocks that are predicted independently of one another with their own motion vectors. The prediction error that remains with the motion compensation also shows the block structure shown.
  • the information about the sub-block division of the macro blocks known from the motion compensation is used.
  • that block transformation is selected that has the same block size as the subblocks. So: in the Macroblock MB (aA), each of the four sub-blocks is transformed with an 8 x 8 transformation.
  • Macroblock MB (aB) gets a 16 x 16 transformation, macroblock MB (aC) two 8 x 16 transformations etc.
  • the block size of the transformations corresponds to that Block size of the motion compensation (size of the sub-blocks).
  • Separable transformations are used, i.e. the transformation matrix is applied in the horizontal and vertical directions, i.e. in the square case
  • T is the transformation matrix of size n x n. This is orthogonal, i.e.
  • Tft denotes the transformation matrix for the rows, T v that for the columns.
  • Unnormalized transformation matrices can be assumed, especially if integer transformations are used. In this case, no generally applicable quantizer can be specified step by step. Since, in general, a uniform distortion is desirable in all blocks of the encoded frame must quantizer tables are created in which a predetermined encoding for qp for each occurrence of a block form qp j _ is assigned to a corresponding.
  • T ⁇ is an nxn and T v is an mxm matrix. Then the quantizer step size for the nx m block B-j_ with

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Bei einem Verfahren zur Transformationscodierung von Bewegtbildsequenzen werden blockweise Bewegungsvektoren geschätzt, mit denen eine Bewegungskompensation durchgeführt wird. Der Prädiktionsfehler wird transformationscodiert. Erfindungsgemäß wird die Blockgröße der Transformationscodierung an die für die Bewegungskompensation jeweils verwendete Blockgröße gekoppelt. Durch diese Maßnahme läßt sich eine Effizienz-Steigerung bei der Codierung des Prädiktionsfehlers in hybriden Codierverfahren, die verschiedene Blockgrößen verwenden, erzielen.

Description

Verfahren zur Transformationscodierung von Bewegtbildsequenzen
Stand der Technik
Die Erfindung geht aus von einem Verfahren zur
Transformationscodierung von Bewegtbildsequenzen, bei welchem zwischen einem Referenzbildsignal und einem aktuellen Bildsignal der Bildsequenz blockweise Bewegungsvektoren geschätzt werden, mit denen die Bewegungskompensation durchgeführt wird.
Bei hybriden Codierkonzepten zur Codierung von Bewegtbildsequenzen wird zwischen einem zuvor erstellten Bildsignal (Referenz-Frame) und einem aktuellen Frame einer Bildsequenz blockweise ein Bewegungsvektorfeld geschätzt und anschließend mit diesem Vektorfeld eine
Bewegungskompensation durchgeführt. Das Bewegungsvektorfeld und der verbleibende Pradiktionsfehler werden codiert und an den Empfänger übertragen. Zur Codierung des Pradiktionsfehlers werden meist Blocktransformationen eingesetzt, üblicherweise eine diskrete Cosinus Transformation (DCT) mit 8 8 Koeffizienten.
In den bisher standardisierten Verfahren zur Bewegtbildcodierung wird eine 8 x 8 DCT zur
Transformationscodierung eingesetzt [1, 2]. Bei der Bewegungskompensation kommen Blöcke der Größe 16 x 16 und 8 x 8 Pixel und bei MPEG-4 im Fall von Interlaced Codierung auch 16 x 8 Pixel [1] zum Einsatz. Die Größe der Blocktransformation ist mit 8 x 8 Koeffizienten konstant.
Im Testmodell zum neuen Videocodierstandard H26L [3] wird eine an die DCT angelehnte 4 x 4 Integer-Transformation vorgeschlagen. Diese hat gegenüber der DCT den Vorteil, daß die ganzzahlig vorliegenden Pixelwerte auf ganzzahlige Transformationskoeffizienten abgebildet werden. Dadurch wird zum einen die Möglichkeit zu perfekter Rekonstruktion gegeben, zum anderen entfallen die bei der bisher üblichen float-DCT möglichen Transformationsfehler, die auftreten, wenn die inverse DCT in Sender und Empfänger unterschiedlich implementiert sind, z.B. Verwendung der Datentypen float auf der einen und double auf der anderen Seite. In [4] wird eine Integer-Transformation vorgestellt, die die Transformationseigenschaften der DCT approximiert und anstelle der float-DCT verwendet werden kann.
Im Testmodell zu H.26L werden zur Bewegungskompensation Blockgrößen von 16 x 16 bis 4 x Pixel verwendet. Zur Transformationscodierung werden diese im Testmodell in 4 x 4 Blöcke zerlegt.
Vorteile der Erfindung
Mit den Maßnahmen des Anspruchs 1 und den Weiterbildungen der Unteransprüche läßt sich eine Effizienz-Steigerung bei der Codierung des Pradiktionsfehlers, insbesondere in hybriden Codierverfahren, erreichen, wenn verschiedene Blockgrößen bei der Bewegungskompensation eingesetzt werden.
Das Verfahren nach der Erfindung, nämlich die Kopplung der Blockgröße der Transformation für den Pradiktionsfehler an die bei der Bewegungskompensation verwendete Blockgröße, ist insbesondere dann vorteilhaft, wenn die zu transformierenden Blocke nicht nur auf quadratische Formen begrenzt sind, sondern auch rechteckige Blocke zulassen, z.B. 4 x 8 oder 16 x 8 Pixel.
Gegenüber den herkömmlichen Verfahren bieten die Verwendung von an die Bewegungskompensation gekoppelten Blockgroßen den Vorteil, maximal große Teile des Pradiktionsfehlers gemeinsam transformieren zu können, ohne daß darin enthaltene Blockgrenzen mit störenden hochfrequenten
Anteilen (Blocking-Artefakte) den Transformationsgewinn schmälern. Dadurch wird eine erhöhte Codiereffizienz erreicht. Die Transformation von großen Blocken (16 x 16) und Blocken mit nicht quadratischer Form, z.B. 8 x oder 16 x 8 Pixel, fuhrt gegenüber den bekannten Verfahren zu Codiergewinnen. Durch die Transformation wird die Energie des transformierten Signals auf wenige Koeffizienten konzentriert. Die Zahl von aufeinander folgenden Nullen innerhalb von Blocken wird durch die Verwendung größerer Blocke erhöht, was zu einer effektiveren Codierung verwendet werden kann (Lauflangen-Codierung) .
Da die Wahl der Blockgroßen bereits für die Bewegungskompensation im Bitstrom codiert ist, ist für die Verwendung der angepaßten Transformationen keine weitere Signalisierung notwendig.
Zeichnungen
Anhand der Zeichnungen werden Ausfuhrungsbeispiele der Erfindung naher erläutert. Es zeigen:
Figur 1 eine mögliche Teilung eines Macroblockes in Unterblocke,
Figur 2 eine adaptive Blockaufteilung eines Macroblockes, Beschreibung von Ausführungsbeispielen
In den standardisierten Codierverfahren und in H.26L erfolgt eine Teilung der Bildsequenz-Frames in Macroblöcke (MB) , die aus einem Block mit 16 x 16 Pixeln der Luminanzkomponente und zwei dazu korrespondierenden Chrominanz-Blöcken bestehen, häufig 8 x 8 Pixel, 4:2:0 YUV-Format [5]. Im folgenden wird nur die Luminanz-Komponente betrachtet und mit MB bezeichnet. In Figur 1 sind die für H.26L vorgeschlagenen möglichen Teilungen eines Macroblockes MB dargestellt. Der erste Block repräsentiert einen Macroblock mit 16 x 16 Pixeln, wohingegen der am feinsten unterteilte Macroblock 4 x 4 Unterblöcke aufweist.
Bei der Erfindung werden zwischen einem aktuellen Referenzbildsignal, insbesondere einem zeitlich zuvor übertragenen oder ermittelten Bildsignal, und einem aktuellen Bildsignal einer Bewegtbildssequenz blockweise die Bewegungsvektoren geschätzt, mit denen die
Bewegungskompensation durchgeführt wird. Es werden dabei unterschiedliche Blockgrößen eingesetzt. Der Pradiktionsfehler wird transformationscodiert. Die Blockgröße der Transformationscodierung wird an die bei der Bewegungskompensation verwendete Blockgröße gekoppelt, insbesondere wird die Blockgröße für die
Transformationscodierung des Pradiktionsfehlers gleich der Blockgröße gewählt, die für die Bewegungskompensation verwendet wurde. Dabei werden nicht nur quadratische sondern auch rechteckige Blöcke zugelassen, um maximal große Teile des Pradiktionsfehler gemeinsam transformieren zu können. Dies führt zu einer sehr effektiven Codierung, da die Blockgrößen für die Bewegungskompensation bereits im Übertragungsbitstrom zu codieren sind und so für die adaptive Transformationscodierung bezüglich deren
Blockgrößen keine weitere Signalisierung erforderlich ist. Die Zahl von aufeinanderfolgenden Nullen innerhalb der Blöcke kann zu einer effektiven Codierung, insbesondere einer Lauflängencodierung verwendet werden.
Figur 2 zeigt einige Macroblöcke MB mit 16 x 16 Bildpunkten in der linken oberen Ecke eines Frames. Die Macroblöcke MB sind hier mit kleinen Buchstaben für die Zeilen und großen Buchstaben für die Spalten gekennzeichnet. Beispiel: Der erste Macroblock MB in der zweiten Zeile wird mit MB (bA) referenziert .
Dargestellt ist die Aufteilung der Macroblöcke, die zur Bewegungskompensation ermittelt wurde. Das heißt, Macroblock MB(aA) ist in vier Unterblöcke geteilt, denen jeweils ein Bewegungsvektor zugeordnet ist. Jeder dieser Unterblöcke wird unabhängig von den anderen aus dem Referenz-Frame prädiziert. MB(aB) hat nur einen Bewegungsvektor, der Unterblock entspricht hier also hier dem gesamten Makroblock MB. Im Beispiel MB (bA) gibt es acht Unterblöcke, die mit eigenen Bewegungsvektoren unabhängig voneinander prädiziert werden. Der Pradiktionsfehler, der bei der Bewegungskompensation verbleibt, zeigt ebenfalls die dargestellte Blockstruktur.
Für die Transformationen mit adaptiver Blockgröße wird auf die von der Bewegungskompensation bekannte Information über die Unterblock-Aufteilung der Macroblöcke zurückgegriffen. Für jeden Macroblock MB wird jene Block-Transformation gewählt, die dieselbe Blockgröße wie die Unterblöcke besitzen. Also: im Macroblock MB(aA) wird jeder der vier Unterblöcke mit einer 8 x 8-Transformation transformiert. Makroblock MB(aB) bekommt eine 16 x 16-Transformation, Makroblock MB (aC) zwei 8 x 16-Transformationen u.s.w. Die Blockgröße der Transformationen entspricht also der Blockgröße der Bewegungskompensation (Größe der Unterblöcke) .
Quadratische Blöcke
Es werden separierbare Transformationen eingesetzt, d.h. die Transformationsmatrix wird in horizontaler und vertikaler Richtung angewendet, d.h. im quadratischen Fall
C = T x B x T
Hierbei bezeichnet B ein Block mit n x n Pixeln und C den transformierten Block, T ist die Transformationsmatrix der Größe n x n. Diese ist orthogonal, d.h.
T x T = T x T = konstant x In,
wobei In die n x n-Einheitsmatrix bezeichnet. Für orthonormale Transformationen gilt: T x Tτ = I, d.h. konstant = 1.
Rechteckige Blöcke
Im Fall von rechteckigen Blöcken der Größe n x m, mit n ≠ m, werden ebenfalls separierbare orthogonale Transformationen verwendet . Die Transformationsmatrixen für die Zeilen und Spalten haben unterschiedliche Größen, was durch die Indizierung in folgender Gleichung gekennzeichnet ist:
cn,m = τv m,m Bn,m x τ h n,n-
Tft bezeichnet die Transformationsmatrix für die Zeilen, Tv diejenige für die Spalten.
Quantisierung Im folgenden wird von einer skalaren Quantisierung ausgegangen. Für andere Quantisierer sind die nachfolgenden Beziehungen entsprechend zu modifizieren.
Die Blöcke des Pradiktionsfehlers werden transformiert. Wenn orthonormale Transformationsmatrixen eingesetzt werden, d.h. T x Tτ = I, führt eine skalare Quantisierung mit konstanter Quantisierer-Schrittweite qp für alle Transformations- Blockgrößen zum selben Maß an Verzerrung.
Insbesondere wenn ganzzahlige, d.h. Integer- Transformationen, angewendet werden, ist von nicht normierten Transformationsmatrizen auszugehen. In diesem Fall kann keine allgemeingültige Quantisiererschrittweise angegeben werden. Da im allgemeinen eine gleichmäßige Verzerrung in allen Blöcken des codierten Frames wünschenswert ist, müssen Quantisierer-Tabellen erstellt werden, in denen einem zur Codierung vorgegebenen qp für jede auftretende Blockform ein korrespondierendes qpj_ zugeordnet wird.
Seien c^ und cv die Normierungskonstanten der Transformationsmatrizen in horizontaler und vertikaler Richtung
τh x τTh = ch x In#
Tv x T v = cv x Im;
wobei T^ eine n x n und Tv eine m x m Matrix sind. Dann kann die Quantisierer-Schrittweite für den n x m-Block B-j_ mit
bestimmt werden. Im Falle von ganzzahligen Transformationen - Integer-Transformationen - soll qp j_ ganzzahlig sein. Dazu muß eine Zuordnungstabelle angelegt werden, die für jede Blockgröße das entsprechend angepaßte ganzzahlige qp-j_ enthält .
Typisch für die Erfindung ist, daß bei sehr grober Quantisierung in der rekonstruierten Frames Basisfunktionen oder Basisbilder der zugrundeliegenden Transformationen sichtbar werden. Bei der herkömmlichen Codierverfahren ist die Blockgröße dieser Basisfunktionen im gesamten Frame konstant; bei Verwendung der adaptiven Blockgrößen lassen sich Basisbilder in verschiedenen Größen und vor allem nicht-quadratische Formen, entsprechend den Blöcken der Bewegungskompensation, ausmachen.
Literatur
[1] ISO/IEC JTC1 IS 14496-2 (MPEG-4) . "Information technology - generic coding of audio-visual objects (final draft of international Standard)," Oct. 1998.
[2] Telecom. Standardization Sector of ITU, "Video coding for low bitrate communication (H.263 Version 2)," Sept. 1997.
[3] Telecom. Standardization Sector of ITU, "H26L test model long term 3," in Study Group 16, Question 15, Meeting J,
(Osaka, Japan), ITU, Mar. 2000
[4] T.D. Tran, "Fast ultilierless approximation of the DCT," in 99rd Annual Conference on Information Science and Systems, (Baltimore, MD, USA), Mar. 1999
[5] J.-R. Ohm, Digitale Bildcodierung. Berlin, Heidelberg, New York: Springer-Verlag, 1995

Claims

Ansprüche
1. Verfahren zur Transformationscodierung von
Bewegtbildsequenzen, bei welchem zwischen einem Referenzbildsignal und einem aktuellen Bildsignal der Bildsequenz blockweise Bewegungsvektoren geschätzt werden, mit denen eine Bewegungskompensation durchgeführt wird, wobei zur Bewegungskompensation unterschiedliche Blockgrößen eingesetzt werden und der verbleibende Pr diktionsfehler transformationscodiert wird mit folgender Maßnahme: - die Blockgröße der Transformationscodierung wird an die für die Bewegungskompensation jeweils verwendete Blockgröße gekoppelt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei Unterteilung der einzelnen Frames der Bildsequenz in Macroblöcke neben quadratischen Unterblöcken auch rechteckige Unterblöcke für die Transformationscodierung des Pradiktionsfehlers zugelassen werden, wobei für jeden Macroblock diejenige Blocktransformation gewählt wird, die dieselbe Blockgröße wie die Unterblöcke für die Bewegungskompensation besitzt.
3. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, daß für die Transformationscodierung separierbare Transformationen sowohl für quadratische als auch für rechteckige Blöcke eingesetzt werden.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß für die Transformationscodierung ganzzahlige Koeffizienten gewählt werden.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß für die Transformationscodierung orthonormale Transformationsmatrizen mit skalarer Quantisierung eingesetzt werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Quantisierungs-Schrittweite für die Transformationscodierung so festgelegt wird, daß in allen Transformationsblöcken das gleiche Maß an insbesondere durch die Quantisierung hervorgerufenen Verzerrungen auftritt.
7. Verfahren nach einem der Ansprüche 4 bis 6, dadurch gekennzeichnet, daß für die Transformationscodierung mit ganzzahligen Koeffizienten eine Zuordnung, insbesondere in Form einer Zuordnungstabelle, getroffen wird, die für jede Blockgröße die entsprechend angepaßte ganzzahlige Quantisierungsschrittweite (qpj_) vorgibt.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß für die Information über die jeweils verwendete Blockgröße bei der Transformationscodierung zwischen Encoder und Decoder keine separate Signalisierung vorgesehen wird, sondern auf die Codierung der Blockgrößen im Zusammenhang mit der Bewegungskompensation zurückgegriffen wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß zur Codierung eine Lauflängencodierung eingesetzt wird.
EP01921209A 2000-05-10 2001-03-16 Verfahren zur transformationscodierung von bewegtbildsequenzen Withdrawn EP1285538A1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10022331A DE10022331A1 (de) 2000-05-10 2000-05-10 Verfahren zur Transformationscodierung von Bewegtbildsequenzen
DE10022331 2000-05-10
PCT/DE2001/001018 WO2001086961A1 (de) 2000-05-10 2001-03-16 Verfahren zur transformationscodierung von bewegtbildsequenzen

Publications (1)

Publication Number Publication Date
EP1285538A1 true EP1285538A1 (de) 2003-02-26

Family

ID=7641163

Family Applications (1)

Application Number Title Priority Date Filing Date
EP01921209A Withdrawn EP1285538A1 (de) 2000-05-10 2001-03-16 Verfahren zur transformationscodierung von bewegtbildsequenzen

Country Status (5)

Country Link
US (1) US7397857B2 (de)
EP (1) EP1285538A1 (de)
JP (1) JP2003533141A (de)
DE (1) DE10022331A1 (de)
WO (1) WO2001086961A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010051846A1 (en) * 2008-11-06 2010-05-14 Nokia Corporation Fast block selection algorithm for video coding using spatially varying transform

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1377071A4 (de) * 2001-03-28 2010-12-22 Sony Corp Bildverarbeitungseinrichtung, bildverarbeitungsverfahren, bildverarbeitungsprogramm und aufzeichnungsmedium
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US7408988B2 (en) * 2002-12-20 2008-08-05 Lsi Corporation Motion estimation engine with parallel interpolation and search hardware
BRPI0406507B1 (pt) * 2003-02-21 2018-10-16 Matsushita Electric Ind Co Ltd método de codificação de imagem e método de decodificação de imagem
JP4617644B2 (ja) * 2003-07-18 2011-01-26 ソニー株式会社 符号化装置及び方法
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US7830963B2 (en) * 2003-07-18 2010-11-09 Microsoft Corporation Decoding jointly coded transform type and subblock pattern information
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
CN100568974C (zh) * 2004-09-08 2009-12-09 松下电器产业株式会社 动态图像编码方法及动态图像解码方法
KR100644629B1 (ko) * 2004-09-18 2006-11-10 삼성전자주식회사 하이브리드 블록 매칭 기반의 움직임 추정 방법 및 그를적용한 프레임 레이트 변환 장치
JP4635016B2 (ja) * 2007-02-16 2011-02-16 株式会社東芝 情報処理装置およびインター予測モード判定方法
US8228983B2 (en) * 2007-12-04 2012-07-24 Hong Kong Applied Science And Technology Research Method and device for order-16 integer transform from order-8 integer cosine transform
TWI521939B (zh) 2008-02-27 2016-02-11 恩康普丁公司 用於低頻寬顯示資訊傳輸之系統及方法
RU2497303C2 (ru) * 2008-10-03 2013-10-27 Квэлкомм Инкорпорейтед Видео кодирование с использованием преобразования больше чем 4×4 и 8×8
US8634456B2 (en) 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US8483285B2 (en) * 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8619856B2 (en) * 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
JP5001964B2 (ja) * 2009-02-18 2012-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
KR20100095992A (ko) 2009-02-23 2010-09-01 한국과학기술원 비디오 부호화에서의 분할 블록 부호화 방법, 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
US8723891B2 (en) * 2009-02-27 2014-05-13 Ncomputing Inc. System and method for efficiently processing digital video
EA024522B1 (ru) * 2009-04-08 2016-09-30 Шарп Кабусики Кайся Устройство и способ кодирования видеокадров и устройство и способ декодирования видеокадров
US9357219B2 (en) 2009-04-08 2016-05-31 Sharp Kabushiki Kaisha Video encoding apparatus and video decoding apparatus
JP5363581B2 (ja) * 2009-09-16 2013-12-11 株式会社日立製作所 動画像復号化方法及び動画像符号化方法
US8971656B2 (en) * 2009-12-10 2015-03-03 Sk Telecom Co., Ltd. Encoding/decoding method and apparatus using a tree structure
SG10202001623RA (en) 2010-04-09 2020-04-29 Mitsubishi Electric Corp Moving image encoding device and moving image decoding device
US8907987B2 (en) 2010-10-20 2014-12-09 Ncomputing Inc. System and method for downsizing video data for memory bandwidth optimization
US9066097B2 (en) 2011-02-01 2015-06-23 Sony Corporation Method to optimize the transforms and/or predictions in a video codec
JP2013038758A (ja) * 2011-07-13 2013-02-21 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
CN103108177B (zh) * 2011-11-09 2016-11-23 华为技术有限公司 图像编码方法及图像编码装置
JP6337380B2 (ja) 2013-07-31 2018-06-06 サン パテント トラスト 画像符号化方法および画像符号化装置
WO2020002762A1 (en) * 2018-06-28 2020-01-02 Nokia Technologies Oy Method and apparatus for motion compensation with non-square sub-blocks in video coding

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2702139B2 (ja) * 1988-03-18 1998-01-21 富士通株式会社 動画像の予測符号化方式
US5021891A (en) * 1990-02-27 1991-06-04 Qualcomm, Inc. Adaptive block size image compression method and system
US5107345A (en) 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
JP2639176B2 (ja) * 1990-05-28 1997-08-06 日本電気株式会社 2次元信号符号化復号化方法とその符号化装置・復号化装置
US5784107A (en) 1991-06-17 1998-07-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for picture coding and method and apparatus for picture decoding
JP3363915B2 (ja) * 1991-09-30 2003-01-08 株式会社日立国際電気 高能率符号化方式
JP2991833B2 (ja) 1991-10-11 1999-12-20 松下電器産業株式会社 インターレス走査ディジタルビデオ信号の符号化装置及びその方法
JPH06188742A (ja) * 1992-12-22 1994-07-08 Mitsubishi Electric Corp 変換符号化/復号化装置
AU6099594A (en) * 1993-02-03 1994-08-29 Qualcomm Incorporated Interframe video encoding and decoding system
KR960013055A (ko) * 1994-09-27 1996-04-20 김광호 조건부 퀴드트리 분할방식의 화상압축방법 및 장치
FR2752474B1 (fr) * 1996-08-14 1998-12-31 Iona Donescu Procede de transformation du signal image sur des supports de forme arbitraire
JPH10210480A (ja) * 1997-01-20 1998-08-07 Mitsubishi Electric Corp 動画像符号化方式
JPH11146367A (ja) * 1997-11-06 1999-05-28 Matsushita Electric Ind Co Ltd モバイルビデオフォン
US6600836B1 (en) * 2000-01-28 2003-07-29 Qualcomm, Incorporated Quality based image compression

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO0186961A1 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010051846A1 (en) * 2008-11-06 2010-05-14 Nokia Corporation Fast block selection algorithm for video coding using spatially varying transform

Also Published As

Publication number Publication date
DE10022331A1 (de) 2001-11-15
WO2001086961A1 (de) 2001-11-15
US7397857B2 (en) 2008-07-08
US20040062309A1 (en) 2004-04-01
JP2003533141A (ja) 2003-11-05

Similar Documents

Publication Publication Date Title
WO2001086961A1 (de) Verfahren zur transformationscodierung von bewegtbildsequenzen
DE69116869T2 (de) Digitale bildkodierung mit einer zufallsabtastung der bilder
DE69434668T2 (de) Adaptives Codierungs- und Decodierungsverfahren mit variabler Länge für Bilddaten
EP1487113A2 (de) Kodierung und Dekodierung von Transformationskoeffizienten in Bild- oder Videokodierern
EP0368139A2 (de) Verfahren zur Codierung von Restfehlerbildern
DE602004001993T2 (de) Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression
DE69125315T2 (de) Kodierverfahren und Kodiervorrichtung
EP1665805B1 (de) Verfahren zur transcodierung eines datenstroms, der ein oder mehrere codierte digitalisierte bilder umfasst mit intra-prädiktionsmodi
DE10204617B4 (de) Verfahren und Vorrichtungen zur Kompression und Dekompression eines Videodatenstroms
DE69126525T2 (de) Digitale bildverarbeitung mit filterung der blockkanten
DE10196431B4 (de) Alternative Blockreihenfolgen zur besseren Vorhersage
DE10218541A1 (de) Verfahren zur Videocodierung und Computerprogrammprodukt
DE10022520A1 (de) Verfahren zur örtlichen skalierbaren Bewegtbildcodierung
DE60310128T2 (de) Verfahren zur wavelet-bildcodierung und entsprechendes decodierungsverfahren
EP0336510B1 (de) Prädiktiver Standbildcodierer
EP1285537B1 (de) Verfahren und eine anordnung zur codierung bzw. decodierung einer folge von bildern
EP1110407A1 (de) Verfahren und anordnung zur codierung und decodierung eines digitalisierten bildes mit anwendung eines objektgesamtbewegungsvektors
EP0981910B1 (de) Verfahren und vorrichtung zur codierung eines digitalisierten bildes
EP1869890B1 (de) Verfahren und vorrichtung zur reduktion eines quantisierungsfehlers
DE102020207711B3 (de) Verfahren und vorrichtungen zur codierung von bilddaten
WO2001062009A1 (de) Verfahren und anordnung zur kodierung bzw. zur kodierung und dekodierung einer zahlenfolge
EP0439675B1 (de) Verfahren zur Aufbereitung von Bilddaten, insbesondere für Standbildübertragungszwecke
DE10039474B4 (de) Verfahren zur Zerlegung eines Bildblockes mit transformierten Koeffizienten sowie Coder und Decoder
EP1304885A2 (de) Verfahren und Computerprogrammprodukt zur Codierung und Decodierung von Videosignalen
EP1157557A1 (de) Verfahren und anordnung zur transformation eines bildbereichs

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20021210

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

RIN1 Information on inventor provided before grant (corrected)

Inventor name: WEDI, THOMAS

Inventor name: WIEN, MATHIAS

Inventor name: SIEPEN, PETER

Inventor name: BAUER, SVEN

Inventor name: ROMANOWSKI, ALEXANDER

RIN1 Information on inventor provided before grant (corrected)

Inventor name: WEDI, THOMAS

Inventor name: WIEN, MATHIAS

Inventor name: SIEPEN, PETER

Inventor name: BAUER, SVEN

Inventor name: ROMANOWSKI, ALEXANDER

RBV Designated contracting states (corrected)

Designated state(s): DE FR GB IT

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20121002