WO2014051372A1 - 영상 복호화 방법 및 이를 이용하는 장치 - Google Patents

영상 복호화 방법 및 이를 이용하는 장치 Download PDF

Info

Publication number
WO2014051372A1
WO2014051372A1 PCT/KR2013/008672 KR2013008672W WO2014051372A1 WO 2014051372 A1 WO2014051372 A1 WO 2014051372A1 KR 2013008672 W KR2013008672 W KR 2013008672W WO 2014051372 A1 WO2014051372 A1 WO 2014051372A1
Authority
WO
WIPO (PCT)
Prior art keywords
reference picture
information
picture list
unit
prediction
Prior art date
Application number
PCT/KR2013/008672
Other languages
English (en)
French (fr)
Inventor
헨드리헨드리
전용준
김철근
김정선
전병문
박준영
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to KR1020217029000A priority Critical patent/KR102352871B1/ko
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020157005837A priority patent/KR102226893B1/ko
Priority to KR1020227001403A priority patent/KR102414518B1/ko
Priority to KR1020157002026A priority patent/KR101553514B1/ko
Priority to KR1020217006891A priority patent/KR102302504B1/ko
Priority to US14/352,586 priority patent/US9560369B2/en
Priority to KR1020227021604A priority patent/KR102574869B1/ko
Publication of WO2014051372A1 publication Critical patent/WO2014051372A1/ko
Priority to US15/418,888 priority patent/US9848200B2/en
Priority to US15/845,770 priority patent/US10390032B2/en
Priority to US16/540,499 priority patent/US10567783B2/en
Priority to US16/773,704 priority patent/US11259038B2/en
Priority to US17/578,182 priority patent/US20220141478A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction

Definitions

  • the present invention relates to video compression technology, and more particularly, to a method and apparatus for signaling reference picture list information.
  • video quality of the terminal device can be supported and the network environment is diversified, in general, video of general quality may be used in one environment, but higher quality video may be used in another environment. .
  • a consumer who purchases video content on a mobile terminal can view the same video content on a larger screen and at a higher resolution through a large display in the home.
  • UHD Ultra High Definition
  • the quality of the image for example, the image quality, the resolution of the image, the size of the image. It is necessary to provide scalability in the frame rate of video and the like. In addition, various image processing methods associated with such scalability should be discussed.
  • An object of the present invention is to provide a method and apparatus for describing reference picture list information in a bitstream.
  • an object of the present invention is to provide a method and apparatus for signaling whether a configuration of a picture list changes in picture units when configuring a reference picture list.
  • Another object of the present invention is to provide a method for changing the configuration of a picture list and a device using the same in response to specification of a picture when constructing a reference picture list.
  • the decoding method of an image for decoding a bitstream there is first information indicating whether the same reference picture list is applied to a slice belonging to a picture and whether there is additional information about a change of the reference picture list.
  • the second information may be included in a picture parameter set.
  • the first information may be included in a video usability information (VUI) parameter.
  • VUI video usability information
  • the reference picture list structure when the first information is 1, the reference picture list structure may be derived once for one picture.
  • the second information may be received when the value of the first information is one.
  • the reference picture list structure when the first information is 0, the reference picture list structure may be derived for each slice included in the picture.
  • an apparatus for decoding a video decoding a bitstream includes first information indicating whether the same reference picture list is applied to a slice belonging to a picture and whether there is additional information about a change of the reference picture list.
  • an object of the present invention is to provide a method and apparatus for describing reference picture list information.
  • a method and apparatus for signaling whether a configuration of a picture list is changed in a picture unit when a reference picture list is constructed is provided.
  • a method and apparatus using the same are provided for changing the configuration of a picture list in response to the specification of a picture when constructing a reference picture list.
  • FIG. 1 is a block diagram schematically illustrating a video encoding apparatus according to an embodiment of the present invention.
  • FIG. 2 is a block diagram schematically illustrating a video decoding apparatus according to an embodiment of the present invention.
  • FIG. 3 is a diagram schematically illustrating an embodiment of a candidate block that may be used when inter prediction is performed on a current block.
  • FIG. 4 is a flowchart schematically illustrating an embodiment of a method of constructing a reference picture list based on a reference picture set.
  • FIG. 5 is a block diagram schematically illustrating an embodiment of an apparatus for performing initialization of a reference picture list.
  • FIG. 6 is a diagram exemplarily illustrating a dynamic change of a reference picture list in a coded picture.
  • FIG. 7 is a diagram exemplarily illustrating a dynamic change of a reference picture list according to the present invention.
  • FIG. 8 is a control flowchart illustrating a video decoding method according to an embodiment of the present invention.
  • each of the components in the drawings described in the present invention are shown independently for the convenience of description of the different characteristic functions in the video encoding apparatus / decoding apparatus, each component is a separate hardware or separate software It does not mean that it is implemented.
  • two or more of each configuration may be combined to form one configuration, or one configuration may be divided into a plurality of configurations.
  • Embodiments in which each configuration is integrated and / or separated are also included in the scope of the present invention without departing from the spirit of the present invention.
  • FIG. 1 is a block diagram schematically illustrating a video encoding apparatus according to an embodiment of the present invention.
  • the video encoding / decoding method or apparatus may be implemented by an extension of a general video encoding / decoding method or apparatus that does not provide scalability, and the block diagram of FIG. 1 is based on a scalable video encoding apparatus.
  • An embodiment of a video encoding apparatus that may be represented.
  • the encoding apparatus 100 may include a picture divider 105, a predictor 110, a transformer 115, a quantizer 120, a reordering unit 125, an entropy encoding unit 130, An inverse quantization unit 135, an inverse transform unit 140, a filter unit 145, and a memory 150 are provided.
  • the picture dividing unit 105 may divide the input picture into at least one processing unit block.
  • the block as the processing unit may be a prediction unit (hereinafter referred to as a PU), a transform unit (hereinafter referred to as a TU), or a coding unit (hereinafter referred to as "CU"). It may be called.
  • the processing unit blocks divided by the picture divider 105 may have a quad-tree structure.
  • the predictor 110 includes an inter predictor for performing inter prediction and an intra predictor for performing intra prediction, as described below.
  • the prediction unit 110 generates a prediction block by performing prediction on the processing unit of the picture in the picture division unit 105.
  • the processing unit of the picture in the prediction unit 110 may be a CU, a TU, or a PU.
  • the prediction unit 110 may determine whether the prediction performed on the processing unit is inter prediction or intra prediction, and determine specific contents (eg, prediction mode, etc.) of each prediction method.
  • the processing unit in which the prediction is performed may differ from the processing unit in which specific contents of the prediction method and the prediction method are determined.
  • the method of prediction and the prediction mode may be determined in units of PUs, and the prediction may be performed in units of TUs.
  • a prediction block may be generated by performing prediction based on information of at least one picture of a previous picture and / or a subsequent picture of the current picture.
  • a prediction block may be generated by performing prediction based on pixel information in a current picture.
  • a skip mode, a merge mode, a motion vector prediction (MVP), and the like can be used.
  • a reference picture may be selected for a PU and a reference block corresponding to the PU may be selected.
  • the reference block may be selected in integer pixel units.
  • a prediction block is generated in which a residual signal with the current PU is minimized and the size of the motion vector is also minimized.
  • the prediction block may be generated in integer sample units, or may be generated in sub-pixel units such as 1/2 pixel unit or 1/4 pixel unit.
  • the motion vector may also be expressed in units of integer pixels or less.
  • the residual may be used as the reconstructed block, and thus the residual may not be generated, transformed, quantized, or transmitted.
  • a prediction mode When performing intra prediction, a prediction mode may be determined in units of PUs, and prediction may be performed in units of PUs. In addition, a prediction mode may be determined in units of PUs, and intra prediction may be performed in units of TUs.
  • the prediction mode may have 33 directional prediction modes and at least two non-directional modes.
  • the non-directional mode may include a DC prediction mode and a planner mode (Planar mode).
  • a prediction block may be generated after applying a filter to a reference sample.
  • whether to apply the filter to the reference sample may be determined according to the intra prediction mode and / or the size of the current block.
  • the residual value (the residual block or the residual signal) between the generated prediction block and the original block is input to the converter 115.
  • the prediction mode information, the motion vector information, etc. used for the prediction are encoded by the entropy encoding unit 130 together with the residual value and transmitted to the decoding apparatus.
  • the transform unit 115 performs transform on the residual block in units of transform blocks and generates transform coefficients.
  • the transform block is a rectangular block of samples to which the same transform is applied.
  • the transform block can be a transform unit (TU) and can have a quad tree structure.
  • the transformer 115 may perform the transformation according to the prediction mode applied to the residual block and the size of the block.
  • the residual block is transformed using a discrete sine transform (DST), otherwise the residual block is transformed into a discrete cosine transform (DCT). Can be converted using.
  • DST discrete sine transform
  • DCT discrete cosine transform
  • the transform unit 115 may generate a transform block of transform coefficients by the transform.
  • the quantization unit 120 may generate quantized transform coefficients by quantizing the residual values transformed by the transform unit 115, that is, the transform coefficients.
  • the value calculated by the quantization unit 120 is provided to the inverse quantization unit 135 and the reordering unit 125.
  • the reordering unit 125 rearranges the quantized transform coefficients provided from the quantization unit 120. By rearranging the quantized transform coefficients, the encoding efficiency of the entropy encoding unit 130 may be increased.
  • the reordering unit 125 may rearrange the quantized transform coefficients in the form of a 2D block into a 1D vector form through a coefficient scanning method.
  • the entropy encoding unit 130 entropy-codes a symbol according to a probability distribution based on the quantized transform values rearranged by the reordering unit 125 or the encoding parameter value calculated in the coding process, thereby performing a bit stream. ) Can be printed.
  • the entropy encoding method receives a symbol having various values and expresses it as a decodable column while removing statistical redundancy.
  • the symbol means a syntax element, a coding parameter, a residual signal, or the like that is an encoding / decoding object.
  • An encoding parameter is a parameter necessary for encoding and decoding, and may include information that may be inferred in the encoding or decoding process as well as information encoded by an encoding device and transmitted to the decoding device, such as a syntax element. This means the information needed when The encoding parameter may be, for example, a value such as an intra / inter prediction mode, a moving / motion vector, a reference image index, a coding block pattern, a residual signal presence, a transform coefficient, a quantized transform coefficient, a quantization parameter, a block size, block partitioning information, or the like.
  • the residual signal may mean a difference between the original signal and the prediction signal, and a signal in which the difference between the original signal and the prediction signal is transformed or a signal in which the difference between the original signal and the prediction signal is converted and quantized It may mean.
  • the residual signal may be referred to as a residual block in block units.
  • Encoding methods such as exponential golomb, context-adaptive variable length coding (CAVLC), and context-adaptive binary arithmetic coding (CABAC) may be used for entropy encoding.
  • the entropy encoding unit 130 may store a table for performing entropy encoding, such as a variable length coding (VLC) table, and the entropy encoding unit 130 may store a stored variable length encoding (VLC) table, and the entropy encoding unit 130 may store a stored variable length encoding (VLC) table, and the entropy encoding unit 130 may store a stored variable length encoding (VLC) table, and the entropy encoding unit 130 may store a stored variable length encoding (VLC) table) (VLC) table)
  • the entropy encoding unit 130 may perform entropy encoding using the VLC table, and the entropy encoding unit 130 derives a binarization method of the
  • binarization means expressing a symbol value as a binary sequence (bin sequence / string).
  • a bin means the value of each binary number (0 or 1) when the symbol is represented as a column of binary numbers through binarization.
  • the probability model refers to a predicted probability of an encoding / decoding target symbol / bin that can be derived through a context information / context model.
  • the contextual information / contextual model refers to information for determining a probability of a symbol / bin to be encoded / decoded.
  • the CABAC entropy encoding method binarizes non-binarized symbols into bins and converts the context model using encoding information of neighboring and encoding target blocks or information of symbols / bins encoded in the previous step.
  • the bitstream may be generated by performing an arithmetic encoding of the bin by predicting the occurrence probability of the bin according to the determined context model.
  • the CABAC entropy encoding method may update the context model by using the information of the encoded symbol / bin for the context model of the next symbol / bean after determining the context model.
  • the entropy encoding unit 130 may apply a constant change to a parameter set or syntax to be transmitted.
  • the inverse quantizer 135 inversely quantizes the quantized values (quantized transform coefficients) in the quantizer 120, and the inverse transformer 140 inversely transforms the inverse quantized values in the inverse quantizer 135.
  • the reconstructed block may be generated by combining the residual values generated by the inverse quantizer 135 and the inverse transform unit 140 and the prediction blocks predicted by the prediction unit 110.
  • a reconstructed block is generated by adding a residual block and a prediction block through an adder.
  • the adder may be viewed as a separate unit (restore block generation unit) for generating a reconstruction block.
  • the filter unit 145 may apply a deblocking filter, an adaptive loop filter (ALF), and a sample adaptive offset (SAO) to the reconstructed picture.
  • ALF adaptive loop filter
  • SAO sample adaptive offset
  • the deblocking filter may remove distortion generated at the boundary between blocks in the reconstructed picture.
  • the adaptive loop filter may perform filtering based on a value obtained by comparing the reconstructed image with the original image after the block is filtered through the deblocking filter. ALF may be performed only when high efficiency is applied.
  • the SAO restores the offset difference from the original image on a pixel-by-pixel basis to the residual block to which the deblocking filter is applied, and is applied in the form of a band offset and an edge offset.
  • the filter unit 145 may not apply filtering to the reconstructed block used for inter prediction.
  • the memory 150 may store the reconstructed block or the picture calculated by the filter unit 145.
  • the reconstructed block or picture stored in the memory 150 may be provided to the predictor 110 that performs inter prediction.
  • FIG. 2 is a block diagram schematically illustrating a video decoding apparatus according to an embodiment of the present invention.
  • the scalable video encoding / decoding method or apparatus may be implemented by extension of a general video encoding / decoding method or apparatus that does not provide scalability, and the block diagram of FIG. 2 shows scalable video decoding.
  • FIG. 2 shows scalable video decoding.
  • the video decoding apparatus 200 includes an entropy decoding unit 210, a reordering unit 215, an inverse quantization unit 220, an inverse transform unit 225, a prediction unit 230, and a filter unit 235.
  • Memory 240 may be included.
  • the input bitstream may be decoded according to a procedure in which image information is processed in the video encoding apparatus.
  • the entropy decoding unit 210 may entropy decode the input bitstream according to a probability distribution to generate symbols including symbols in the form of quantized coefficients.
  • the entropy decoding method is a method of generating each symbol by receiving a binary string.
  • the entropy decoding method is similar to the entropy encoding method described above.
  • VLC variable length coding
  • 'VLC' variable length coding
  • CABAC CABAC
  • the CABAC entropy decoding method receives a bin corresponding to each syntax element in a bitstream, and decodes syntax element information and decoding information of neighboring and decoding target blocks or information of symbols / bins decoded in a previous step.
  • a context model may be determined using the context model, and a probability corresponding to the value of each syntax element may be generated by performing arithmetic decoding of the bin by predicting a probability of occurrence of a bin according to the determined context model.
  • the CABAC entropy decoding method may update the context model by using the information of the decoded symbol / bin for the context model of the next symbol / bean after determining the context model.
  • the entropy decoding method When the entropy decoding method is applied, a small number of bits are allocated to a symbol having a high probability of occurrence and a large number of bits are allocated to a symbol having a low probability of occurrence, whereby the size of the bit string for each symbol is increased. Can be reduced. Therefore, the compression performance of the image decoding can be improved through the entropy decoding method.
  • Information for generating the prediction block among the information decoded by the entropy decoding unit 210 is provided to the predictor 230, and a residual value where entropy decoding is performed by the entropy decoding unit 210, that is, a quantized transform coefficient It may be input to the reordering unit 215.
  • the reordering unit 215 may reorder the information of the bitstream entropy decoded by the entropy decoding unit 210, that is, the quantized transform coefficients, based on the reordering method in the encoding apparatus.
  • the reordering unit 215 may reorder the coefficients expressed in the form of a one-dimensional vector by restoring the coefficients in the form of a two-dimensional block.
  • the reordering unit 215 may generate an array of coefficients (quantized transform coefficients) in the form of a 2D block by scanning coefficients based on the prediction mode applied to the current block (transform block) and the size of the transform block.
  • the inverse quantization unit 220 may perform inverse quantization based on the quantization parameter provided by the encoding apparatus and the coefficient values of the rearranged block.
  • the inverse transform unit 225 may perform inverse DCT and / or inverse DST on the DCT and the DST performed by the transform unit of the encoding apparatus with respect to the quantization result performed by the video encoding apparatus.
  • the inverse transformation may be performed based on a transmission unit determined by the encoding apparatus or a division unit of an image.
  • the DCT and / or DST in the encoding unit of the encoding apparatus may be selectively performed according to a plurality of pieces of information, such as a prediction method, a size and a prediction direction of the current block, and the inverse transformer 225 of the decoding apparatus may be Inverse transformation may be performed based on the performed transformation information.
  • the prediction unit 230 may generate the prediction block based on the prediction block generation related information provided by the entropy decoding unit 210 and the previously decoded block and / or picture information provided by the memory 240.
  • intra prediction for generating a prediction block based on pixel information in the current picture may be performed.
  • inter prediction on the current PU may be performed based on information included in at least one of a previous picture or a subsequent picture of the current picture.
  • motion information required for inter prediction of the current PU provided by the video encoding apparatus for example, a motion vector, a reference picture index, and the like, may be derived by checking a skip flag, a merge flag, and the like received from the encoding apparatus.
  • the reconstruction block may be generated using the prediction block generated by the predictor 230 and the residual block provided by the inverse transform unit 225.
  • FIG. 2 it is described that the reconstructed block is generated by combining the prediction block and the residual block in the adder.
  • the adder may be viewed as a separate unit (restore block generation unit) for generating a reconstruction block.
  • the residual is not transmitted and the prediction block may be a reconstruction block.
  • the reconstructed block and / or picture may be provided to the filter unit 235.
  • the filter unit 235 may apply deblocking filtering, sample adaptive offset (SAO), and / or ALF to the reconstructed block and / or picture.
  • SAO sample adaptive offset
  • the memory 240 may store the reconstructed picture or block to use as a reference picture or reference block and provide the reconstructed picture to the output unit.
  • Components directly related to the decoding of an image for example, an entropy decoding unit 210, a reordering unit 215, an inverse quantization unit 220, an inverse transform unit 225, a prediction unit 230, and a filter unit ( 235) and the like may be distinguished from other components by a decoder or a decoder.
  • the decoding apparatus 200 may further include a parsing unit (not shown) which parses information related to an encoded image included in the bitstream.
  • the parsing unit may include the entropy decoding unit 210 or may be included in the entropy decoding unit 210. Such a parser may also be implemented as one component of the decoder.
  • FIG. 3 is a diagram schematically illustrating an embodiment of a candidate block that may be used when inter prediction is performed on a current block.
  • the prediction unit of the encoding apparatus and the decoding apparatus may use a block of a predetermined position around the current block 300 as a candidate block.
  • a block of a predetermined position around the current block 300 For example, in the example of FIG. 3, two blocks A0 310 and A1 320 located at the lower left of the current block, and three blocks B0 330, B1 340, and B2 350 located at the upper right and upper left of the current block It may be selected as a spatial candidate block.
  • the above-described Col block 360 may be used as the candidate block as a temporal candidate block in addition to the spatially adjacent blocks.
  • the reference picture for the current block may be derived from the reference picture of the neighboring block or indicated by information received from the encoding apparatus.
  • the prediction unit of the decoding apparatus may use the reference picture of the neighboring block as the reference picture of the current block.
  • the prediction unit of the decoding apparatus may receive information indicating the reference picture for the current block from the encoding apparatus.
  • Pictures encoded / decoded before the current picture may be stored in a memory (eg, a Decoded Picture Buffer (DPB)) and used for prediction of the current block (current picture).
  • a memory eg, a Decoded Picture Buffer (DPB)
  • Pictures available for inter prediction of the current block may be maintained as a reference picture list.
  • the reference picture used for inter prediction of the current block may be indicated by a reference picture index. That is, the reference picture index may mean an index indicating a reference picture used for inter prediction of the current block among the reference pictures configuring the reference picture list.
  • An I slice is a slice that is decoded through intra prediction.
  • P slices are slices that are decoded through intra prediction or inter prediction using at most one motion vector and one reference picture.
  • a B slice is a slice decoded through intra prediction or inter prediction using up to two motion vectors and two reference pictures.
  • the reference picture may include a short term reference picture (hereinafter referred to as STRP) and a long term reference picture (hereinafter referred to as LTRP).
  • the short-term reference picture and the long-term reference picture may be reconstructed pictures stored in a decoded picture buffer (DPB).
  • DPB decoded picture buffer
  • Short-term reference pictures may be marked as “used as a short-term reference picture” or “used as a reference picture” (marked as “used for short-term reference” or “used for reference”).
  • the long-term reference picture may be marked as “used as a long-term reference picture” or “used as a reference picture” (marked as “used for long-term reference” or “used for reference”).
  • the POC difference between the decoding target picture and the long-term reference picture may have a value corresponding to a range of '1' to '224-1'.
  • the picture order count (POC) may indicate a display order of pictures.
  • Reference picture list 0 (referred to as 'L0' for convenience of description) is a reference picture list used for inter prediction of a P slice or a B slice.
  • Reference picture list 1 (referred to as 'L1' for convenience of description) may be used for inter prediction of a B slice. Accordingly, unidirectional prediction based on L0 may be performed in inter prediction on blocks of P slices, and bi-prediction based on L0 and L1 may be performed in inter prediction on blocks of B slices. Can be performed.
  • the encoding apparatus and / or the decoding apparatus may construct a reference picture list when performing encoding and / or decoding on the P slice and the B slice through inter prediction.
  • a reference picture used for inter prediction may be designated through a reference picture index.
  • the reference picture index may mean an index indicating a reference picture on the reference picture list used for inter prediction.
  • the reference picture list may be configured based on a reference picture set determined or generated by the encoding apparatus and the decoding apparatus.
  • Reference pictures constituting the reference picture list may be stored in a memory (eg, DPB).
  • Pictures stored in the memory may be managed by an encoding device and a decoding device.
  • the reference picture When a sliding window method is used as a method of managing a reference picture, the reference picture may be managed by a simple method of storing the reference picture in memory and releasing it after a certain time, but there are some problems. have. For example, even if there are reference pictures that are no longer needed, the efficiency may be lowered because they cannot be immediately released from the memory. In addition, since the stored reference picture is emitted from the memory after a certain time, it may be difficult to manage the Long Term Reference Picture (LTRP).
  • LTRP Long Term Reference Picture
  • a memory management command operation (MMCO) method may be used in which indication information regarding management of a reference picture is directly signaled from the encoding apparatus.
  • MMCO memory management command operation
  • a command for assigning a picture to LTRP, a command for changing the state of the LTRP to STRP, and a marking for LTRP as “not used as a reference picture” ( to mark LTRP as “unused for reference”) command and the like can be defined.
  • information related to the reference picture set required for the decoding process of a slice (and / or picture) is stored in a sequence parameter set (SPS), a picture parameter set (PPS) and / or a slice header.
  • SPS sequence parameter set
  • PPS picture parameter set
  • the method of transmission may be used.
  • the reference picture list may be constructed based on the reference picture set.
  • the reference picture set may include reference pictures used for reference of the current picture / slice or future picture / slice.
  • the reference picture used in the decoding process of the slice (and / or picture) may include a short term reference picture (STRP) and a long term reference picture (LTRP).
  • the short-term reference picture (STRP) may include a forward short-term reference picture having a POC smaller than the current picture and a reverse short-term reference picture having a POC larger than the current picture.
  • the reference picture set may be determined or generated for each of the forward short-term reference picture, the reverse short-term reference picture, and the long-term reference picture.
  • the reference picture set for the forward short-term reference picture is referred to as the forward short-term reference picture set
  • the reference picture set for the backward short-term reference picture is referred to as a backward short-term reference picture set and is referred to as a long-term reference picture.
  • the picture set is called a long-term reference picture set.
  • the forward short term reference picture set may be represented by RefPicSetStCurrBefore
  • the reverse short term reference picture set may be represented by RefPicSetStCurrAfter
  • the long term reference picture set may be represented by RefPicSetLtCurr.
  • FIG. 4 is a flowchart schematically illustrating an embodiment of a method of constructing a reference picture list based on a reference picture set.
  • FIG. 4 The embodiment of FIG. 4 is described based on the operation of the decoding apparatus for convenience of description.
  • the reference picture list generation process to be described later may be viewed as a reference picture list initialization process.
  • the decoding apparatus may configure the reference picture set based on the reference picture set related information transmitted from the encoding apparatus (S410).
  • the reference picture set may be configured for each picture to which inter prediction is applied.
  • the reference picture set may include a forward short term reference picture set, a reverse short term reference picture set, and a long term reference picture set.
  • Reference pictures included in each reference picture set may be specified by a picture order count (POC).
  • POC Picture Order Count
  • POC Picture Order Count
  • the POCs of the reference pictures included in the forward short term reference picture set and the reverse short term reference picture set may be determined by a relative POC.
  • the information about the relative POC may be transmitted from the encoding device to the decoding device.
  • the relative POC may indicate a POC difference between two pictures in the reference picture set.
  • the relative POC of reference pictures prior to the current picture (reference pictures having a smaller POC than the POC of the current picture) in the POC order may correspond to a POC difference with a previous reference picture in the reference picture set.
  • Relative POCs of reference pictures after the current picture in the POC order may also correspond to a POC difference from a previous reference picture in the reference picture set.
  • forward short-term reference pictures having a POC value smaller than the POC of the current picture may be located in descending order of the POC.
  • pictures having a POC value smaller than the POC of the current picture among pictures existing in the DPB may be located in descending order of the POC from the beginning of the forward short-term reference picture set.
  • backward short-term reference pictures having a POC value larger than the POC of the current picture may be located in ascending order of the POC.
  • pictures having a POC value smaller than the POC of the current picture among the pictures existing in the DPB may be located in the ascending order of the POC from the beginning of the backward short-term reference picture set.
  • Reference pictures included in the long-term reference picture set may be determined based on the long-term reference picture set related information transmitted from the encoder.
  • the long-term reference picture set related information may include information for determining reference pictures (and / or POCs of the reference pictures) included in the long-term reference picture set.
  • the decoding apparatus may generate a reference picture list based on the reference picture set (S420).
  • the decoding apparatus When configuring the reference picture list L0, the decoding apparatus performs the order of the forward short-term reference picture constituting the forward short-term reference picture set, the reverse short-term reference picture constituting the reverse short-term reference picture set, and the long-term reference picture constituting the long-term reference picture set.
  • the reference picture list can be constructed by allocating a reference picture index. That is, backward short-term reference pictures may be added to the reference picture list L0 after forward short-term reference pictures are allocated, and finally long-term reference pictures may be added.
  • the forward short term reference pictures constituting the forward short term reference picture set may be added to the reference picture list L0 in the same order as included in the forward short term reference picture set. That is, the forward short-term reference pictures may be located in the descending order of the POC in the reference picture list L0, and the smaller the POC, the larger the reference picture index value may be assigned.
  • backward short-term reference pictures constituting the backward short-term reference picture set may be added to the reference picture list L0 in the same order as included in the backward short-term reference picture set. That is, backward short-term reference pictures may be located in the ascending order of POCs in the reference picture list L0, and a larger reference picture index value may be assigned as the POC is larger.
  • the long-term reference pictures constituting the long-term reference picture set may be added to the reference picture list L0 in the same order as included in the long-term reference picture set.
  • the decoding apparatus performs the order of the reverse short-term reference picture constituting the reverse short-term reference picture set, the forward short-term reference picture constituting the forward short-term reference picture set, and the long-term reference picture constituting the long-term reference picture set.
  • the reference picture list can be constructed by allocating a reference picture index. That is, the forward short term reference pictures may be added to the reference picture list L1 after the backward short term reference pictures are allocated, and finally the long term reference pictures may be added.
  • the reverse short term reference pictures constituting the reverse short term reference picture set may be added to the reference picture list L1 in the same order as included in the reverse short term reference picture set. That is, backward short-term reference pictures may be located in the ascending order of POCs in the reference picture list L1, and a larger reference picture index value may be assigned as the POC is larger.
  • the forward short term reference pictures constituting the forward short term reference picture set may be added to the reference picture list L1 in the same order as included in the forward short term reference picture set. That is, the forward short-term reference pictures may be located in the descending order of the POC in the reference picture list L1, and a larger reference picture index value may be allocated as the POC is smaller.
  • the long-term reference pictures constituting the long-term reference picture set may be added to the reference picture list L1 in the same order as included in the long-term reference picture set.
  • Reference pictures indexes may be allocated to reference pictures added to the reference picture lists L0 and L1 in order.
  • the decoding apparatus may utilize the first N (reference pictures from reference picture index 0 to reference picture index N-1, where N is a natural number) among the reference pictures included in the reference picture list as available reference pictures. In this case, information about the number N of reference pictures available may be transmitted from the encoding apparatus.
  • the reference picture list is implicitly derived.
  • the encoding apparatus and the decoding apparatus may derive the reference picture list to be used for inter prediction of the current picture based on the POC of the pictures as described above.
  • the decoding apparatus may modify the implicitly derived reference picture list based on the information explicitly transmitted from the encoding apparatus.
  • the encoding apparatus may transmit entry information indicating a specific entry constituting the reference picture list together with reference picture list modification information indicating that the reference picture list implicitly modified is modified.
  • the reference picture list is finally specified by modifying the reference picture list based on the information explicitly transmitted from the encoding apparatus, it may be considered that the reference picture list is explicitly specified.
  • the encoding device may transmit entry information about L0 when L0 is explicitly specified.
  • the entry information about L0 may indicate a reference picture corresponding to the index on L0.
  • the encoding apparatus may transmit entry information about L1 when L1 is explicitly specified.
  • the entry information about L1 may indicate a reference picture corresponding to the index on L1.
  • the order (and / or reference picture index) in the reference picture list of forward short term reference pictures, reverse short term reference pictures, and long term reference pictures is implicit. It may differ from the order (and / or reference picture index) in the derived reference picture list.
  • available reference pictures utilized may also be different from the case of the reference picture list implicitly derived.
  • the decoding apparatus may configure the same reference picture list as the reference picture list configured by the encoding apparatus based on the reference picture list modification information and the entry information.
  • the reference picture set and the reference picture list have been described by considering only pictures that are available for convenience of description, but considering whether to use or not use the reference pictures in the encoding device and the decoding device.
  • the reference picture set and / or the reference picture list may be constructed.
  • FIG. 5 is a block diagram schematically illustrating an embodiment of an apparatus for performing initialization of a reference picture list.
  • the reference picture list initialization apparatus 500 may include a reference picture set configuration unit 510 and a reference picture list generation unit 520.
  • the reference picture set configuration unit 510 may configure a reference picture set based on input reference picture set related information.
  • the reference picture set may be configured for each picture to which inter prediction is applied.
  • the reference picture set may include a forward short term reference picture set, a reverse short term reference picture set, and a long term reference picture set.
  • Reference pictures included in each reference picture set may be specified by a picture order count (POC).
  • POC Picture Order Count
  • POC Picture Order Count
  • the reference picture list generator 520 may generate a reference picture list based on the reference picture set. There may be L0 and L1 in the reference picture list generated by the reference picture list generator 520. Details of operations performed by the reference picture list generator 520 are the same as those described in the reference picture list generation step S420 of FIG. 4, and thus descriptions thereof will be omitted.
  • the reference picture list generated by the reference picture list generator 520 may be stored in the DPB for prediction or transferred to the predictor for reference.
  • the reference picture list initialization is described as being performed in a separate configuration (reference picture list initialization device), but this is for convenience of explanation and understanding of the invention, and the present invention is not limited thereto.
  • initialization of the reference picture list may be performed in a memory of the encoding apparatus and the decoding apparatus described with reference to FIGS. 1 and 2, for example, a DPB.
  • the above-described reference picture list apparatus may be a DPB.
  • the initialization of the reference picture list may be performed by the prediction unit of the encoding apparatus and the decoding apparatus described with reference to FIGS. 1 and 2.
  • the above-described reference picture list initialization apparatus may be a prediction unit.
  • the reference picture list initialization apparatus may be included as separate components in the encoding apparatus and the decoding apparatus.
  • the reference picture list may be the same in all slices in the picture or may be different for each slice.
  • Information indicating whether a reference picture list is the same for a slice belonging to one picture may be signaled with a flag such as restricted_ref_pic_lists_flag, and such flag information may be included in a sequence parameter set (SPS).
  • SPS sequence parameter set
  • restricted_ref_pic_lists_flag indicates whether the reference picture list 0 for all P slices and B slices (if any) belonging to the picture is the same, and whether reference picture list 1 for all B slices (if any) belonging to the picture is the same Can be.
  • restricted_ref_pic_lists_flag 1 indicates that the reference picture construction process occurs once for each picture, not for an individual slice. If restricted_ref_pic_lists_flag equals 0, the reference picture construction process does not occur once for a picture. Indicates. If restricted_ref_pic_lists_flag is 1, the complexity of the reference picture construction process is improved.
  • flag information such as lists_modification_present_flag may be additionally signaled.
  • lists_modification_present_flag is a flag signal indicating whether there is additional information on modification of the reference picture list. That is, when lists_modification_present_flag is 1, it indicates that there is additional information about the change of the reference picture list. If restricted_ref_pic_lists_flag is 0, it is obvious that lists_modification_present_flag is 1, so lists_modification_present_flag is not signaled.
  • this signaling method is somewhat inflexible because it signals whether the reference picture construction process occurs once for each picture but not for individual slices. It may be restricted in the transmission of information about.
  • the order of the reference pictures in the reference picture list does not need to be changed for each slice.
  • the order of reference pictures in the reference picture list may be changed for each slice in order to improve compression efficiency.
  • FIG. 6 is a diagram exemplarily illustrating a dynamic change of a reference picture list in a coded picture.
  • a slice included in one coded picture may have the same reference picture list or may have a different reference picture list for each slice.
  • the reference picture list of all slices belonging to the pictures for a certain period of time are the same, and in the case of a slice belonging to the pictures B for another particular period of time.
  • the reference picture list is different for each slice.
  • some reference picture lists of the slices belonging to one picture may be the same and some reference picture lists may be different.
  • the decoding apparatus cannot use the feature of constructing a single reference picture list for a picture (for example, A) in which the reference picture list belongs to the same specific period in one picture.
  • the present invention proposes to change the signaling position of the restricted_ref_pic_lists_flag and / or lists_modification_present_flag described above in order to improve the feature of limiting the configuration of the reference picture list.
  • Table 1 shows a picture parameter set (PPS) according to an embodiment of the present invention.
  • restricted_ref_pic_lists_flag is the reference picture list 1 for all P slices and B slices (if any) belonging to the picture, whether the reference picture list 0 is the same, and all the B slices belonging to the picture (if any). Indicates whether this is the same. If restricted_ref_pic_lists_flag is 1, it indicates that the reference picture lists for all slices belonging to the picture are the same, and if restricted_ref_pic_lists_flag is 0, it indicates that the reference picture lists for all slices belonging to the picture are not the same.
  • lists_modification_present_flag indicates whether there is additional information on modification of the reference picture list. If lists_modification_present_flag is 1, this indicates that there is an additional syntax element for changing the reference picture list in the slice level, e.g., the slice header; Indicates.
  • both restricted_ref_pic_lists_flag and lists_modification_present_flag are signaled by being included in the PPS rather than the SPS.
  • the encoding device and the decoding device can easily encode and decode information on whether the reference picture list configuration is applied to the individual pictures.
  • Tables 2 and 3 show SPS and PPS according to another embodiment of the present invention.
  • lists_modification_present_flag indicates whether additional information on modification of the reference picture list exists.
  • a list_modification_present_flag of 1 indicates that there is an additional syntax element for changing the reference picture list in the slice level, e.g., a slice header, and a list_modification_present_flag of 0 indicates that there is no additional syntax element for changing the reference picture list in the slice header. Indicates.
  • restricted_ref_pic_lists_flag shows whether reference picture list 0 for all P slices and B slices (if any) belonging to the picture is the same, and reference picture list 1 for all B slices (if any) belonging to the picture. Indicates whether it is the same.
  • restricted_ref_pic_lists_flag may be signaled by being included in the PPS rather than the SPS.
  • FIG. 7 is a diagram exemplarily illustrating a dynamic change of a reference picture list according to the present invention.
  • a reference picture list may be the same in a slice included in one coded picture, or a reference picture list may be different for each slice.
  • a reference picture list may be changed, since such changed information can be signaled in units of pictures, information about the reference picture list can be signaled more efficiently, and coding efficiency can be improved.
  • restricted_ref_pic_lists_flag is signaled as 1.
  • additionally lists_modification_present_flag will be signaled. That is, when new information is added to the picture parameter set as shown in FIG. 7, the new picture parameter set is signaled correspondingly.
  • restricted_ref_pic_lists_flag is signaled as 0.
  • restricted_ref_pic_lists_flag may be signaled by being included in parameter information other than PPS.
  • restricted_ref_pic_lists_flag may be signaled by being included in a video usability information (VUI) parameter.
  • VUI video usability information
  • Table 4 and Table 5 show the VUI parameters and PPS according to another embodiment of the present invention.
  • restricted_ref_pic_lists_flag is the reference picture list 1 for all P slices and B slices (if any) belonging to the picture, whether the reference picture list 0 is the same, and all the B slices belonging to the picture (if any). Indicates whether this is the same.
  • restricted_ref_pic_lists_flag may be signaled by being included in a VUI parameter other than SPS.
  • lists_modification_present_flag indicates whether additional information on modification of the reference picture list exists.
  • a list_modification_present_flag of 1 indicates that there is an additional syntax element for changing the reference picture list in the slice level, e.g., a slice header, and a list_modification_present_flag of 0 indicates that there is no additional syntax element for changing the reference picture list in the slice header. Indicates.
  • the lists_modification_present_flag may be signaled separately from the restricted_ref_pic_lists_flag as shown in Table 5 in the PPS.
  • FIG. 8 is a control flowchart illustrating a video decoding method according to an embodiment of the present invention.
  • the decoding apparatus receives and recognizes first information indicating whether the same reference picture list is applied to a slice belonging to a picture (S810).
  • This first information may be restricted_ref_pic_lists_flag, and such flag information may be received by being included in a PPS or VUI parameter other than the SPS.
  • restricted_ref_pic_lists_flag is 0 (S820)
  • a reference picture list is constructed using additional reference picture list information that may be used (S830).
  • the decoding apparatus may receive second information indicating whether there is additional information on change of the reference picture list.
  • the second information may be lists_modification_present_flag, and this flag information may be included in the existing SPS and transmitted, or may be included in the PPS and transmitted.
  • lists_modification_present_flag is 0 (S840)
  • one reference picture list configuration is applied to the corresponding picture, and the decoding apparatus uses the information about the reference picture list configuration transmitted at the SPS level or the PPS level to determine the initial reference picture list.
  • the initial reference picture list may be used as a reference picture list of the corresponding picture (S850).
  • the reference picture list may be generated based on the reference picture set configuration, which is similar to the contents described with reference to FIGS. 4 and 5, and thus redundant descriptions thereof will be omitted.
  • the present invention relates to a method and apparatus for signaling whether or not a configuration of a picture list is changed in a picture unit when a reference picture list is constructed, and to change a structure of a picture list in response to specification of a picture when configuring a reference picture list. It can be effective.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명에 따른 비트스트림을 디코딩하는 영상의 디코딩 방법은 픽쳐에 속하는 슬라이스에 동일한 참조 픽쳐 리스트가 적용되는지 여부를 나타내는 제1 정보 및 상기 참조 픽쳐 리스트의 변경에 대한 추가적인 정보가 존재하는지 여부를 나타내는 제2 정보 중 적어도 하나를 포함하는 픽쳐 파라미터 세트를 수신하는 단계와; 상기 픽쳐 파라미터 세트에 기초하여 상기 참조 픽쳐 리스트 구성을 유도하는 단계를 포함할 수 있다. 이로 인하여, 참조 픽쳐 리스트 구성 시 픽쳐 리스트의 구성의 변동 여부를 픽쳐 단위로 시그널링 하는 방법 및 장치가 제공된다.

Description

영상 복호화 방법 및 이를 이용하는 장치
본 발명은 비디오 압축 기술에 관한 것으로서 더 구체적으로는 참조 픽쳐 리스트 정보를 시그널링 하는 방법 및 장치에 관한 것이다.
최근 고해상도, 고품질의 영상에 대한 요구가 다양한 응용 분야에서 증가하고 있다. 영상이 고해상도를 가지고 고품질이 될수록 해당 영상에 관한 정보량도 함께 증가하고 있다.
정보량의 증가로 인해 다양한 성능의 장치와 다양한 환경의 네트워크가 등장하고 있다. 다양한 성능의 장치와 다양한 환경의 네트워크가 등장함에 따라서, 동일한 콘텐츠를 다양한 품질로 이용할 수 있게 되었다.
구체적으로, 단말 장치가 지원할 수 있는 품질의 영상이 다양해지고, 구축된 네트워크 환경이 다양해짐으로써, 어떤 환경에서는 일반적인 품질의 영상을 이용하지만, 또 다른 환경에서는 더 높은 품질의 영상을 이용할 수 있게 된다.
예를 들어, 휴대 단말에서 비디오 콘텐츠를 구매한 소비자가 가정 내 대화면의 디스플레이를 통해 동일한 비디오 콘텐츠를 더 큰 화면과 더 높은 해상도로 감상할 수 있게 되는 것이다.
최근에는 HD(High Definition) 해상도를 가지는 방송이 서비스되면서 많은 사용자들은 이미 고해상도, 고화질의 영상에 익숙해지고 있고, 서비스 제공자와 사용자들은 HDTV와 더불어 HDTV의 4배 이상의 해상도를 갖는 UHD(Ultra High Definition)의 서비스에도 관심을 기울이고 있다.
따라서, 다양한 환경에서 사용자가 요구하는 영상 서비스를 품질에 따라서 다양하게 제공하기 위해 고용량 비디오에 대한 고효율의 인코딩/디코딩 방법을 기반으로 영상의 품질, 예컨대 영상의 화질, 영상의 해상도, 영상의 크기, 비디오의 프레임 레이트 등에 스케일러빌러티를 제공하는 것이 필요하다. 또한, 이러한 스케일러빌러티에 수반되는 다양한 영상 처리 방법이 논의되어야 한다.
본 발명은 비트스트림 내 참조 픽쳐 리스트 정보를 기술하는 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 참조 픽쳐 리스트 구성 시 픽쳐 리스트의 구성의 변동 여부를 픽쳐 단위로 시그널링 하는 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 참조 픽쳐 리스트 구성 시 픽쳐의 특정에 대응하여 픽쳐 리스트의 구성을 변경할 수 있는 방법 및 이를 이용하는 장치를 제공하는 것을 목적으로 한다.
본 발명의 일 실시형태에 따른 비트스트림을 디코딩하는 영상의 디코딩 방법은 픽쳐에 속하는 슬라이스에 동일한 참조 픽쳐 리스트가 적용되는지 여부를 나타내는 제1 정보 및 상기 참조 픽쳐 리스트의 변경에 대한 추가적인 정보가 존재하는지 여부를 나타내는 제2 정보 중 적어도 하나를 포함하는 픽쳐 파라미터 세트를 수신하는 단계와; 상기 픽쳐 파라미터 세트에 기초하여 상기 참조 픽쳐 리스트 구성을 유도하는 단계를 포함할 수 있다.
상기 제2 정보는 픽처 파라미터 세트에 포함될 수 있다.
상기 제1 정보는 VUI(Video usability information) 파라미터에 포함될 수 있다.
상기 참조 픽쳐 리스트 구성을 유도하는 단계는 상기 제1 정보가 1이면, 하나의 픽쳐에 대하여 상기 참조 픽쳐 리스트 구성을 한번 유도할 수 있다.
상기 제2 정보는 상기 제1 정보의 값이 1이면 수신될 수 있다.
상기 참조 픽쳐 리스트 구성을 유도하는 단계는 상기 제1 정보가 0이면, 픽쳐에 포함되어 있는 슬라이스 별로 상기 참조 픽쳐 리스트 구성을 유도할 수 있다.
본 발명의 다른 실시형태에 따른 비트스트림을 디코딩하는 영상의 디코딩 장치는 픽쳐에 속하는 슬라이스에 동일한 참조 픽쳐 리스트가 적용되는지 여부를 나타내는 제1 정보 및 상기 참조 픽쳐 리스트의 변경에 대한 추가적인 정보가 존재하는지 여부를 나타내는 제2 정보 중 적어도 하나를 포함하는 픽쳐 파라미터 세트를 파싱하는 파싱부와; 상기 픽쳐 파라미터 세트에 포함된 상기 제1 정보 및 상기 제2 정보에 기초하여 참조 픽쳐 리스트 구성을 유도하는 예측부를 포함할 수 있다.
본 발명의 일 실시예에 따르면, 참조 픽쳐 리스트 정보를 기술하는 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명의 일 실시예에 따르면 참조 픽쳐 리스트 구성 시 픽쳐 리스트의 구성의 변동 여부를 픽쳐 단위로 시그널링 하는 방법 및 장치가 제공된다.
또한, 본 발명의 일 실시예에 따르면 참조 픽쳐 리스트 구성 시 픽쳐의 특정에 대응하여 픽쳐 리스트의 구성을 변경할 수 있는 방법 및 이를 이용하는 장치가 제공된다.
도 1은 본 발명의 일 실시예에 따른 비디오 인코딩 장치를 개략적으로 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 비디오 디코딩 장치를 개략적으로 도시한 블록도이다.
도 3은 현재 블록에 대해 인터 예측이 수행되는 경우에 이용될 수 있는 후보 블록의 일 실시예를 개략적으로 설명하는 도면이다.
도 4는 참조 픽쳐 세트를 기반으로 참조 픽쳐 리스트를 구성하는 방법의 일 실시예를 개략적으로 나타내는 흐름도이다.
도 5는 참조 픽쳐 리스트의 초기화를 수행하는 장치의 일 실시예를 개략적으로 나타내는 블록도이다.
도 6은 코딩된 픽쳐에서 참조 픽쳐 리스트의 동적인 변화를 예시적으로 도시한 도면이다.
도 7은 본 발명에 따른 참조 픽쳐 리스트의 동적인 변화를 예시적으로 도시한 도면이다.
도 8은 본 발명의 일 실시예에 따른 비디오 디코딩 방법을 설명하기 위한 제어 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니다. 본 명세서에서 사용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
한편, 본 발명에서 설명되는 도면상의 각 구성들은 비디오 인코딩 장치/디코딩 장치에서 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 일 실시예에 따른 비디오 인코딩 장치를 개략적으로 도시한 블록도이다. 비디오 인코딩/ 디코딩 방법 또는 장치는 스케일러빌리티(scalability)를 제공하지 않는 일반적인 비디오 인코딩/ 디코딩 방법 또는 장치의 확장(extension)에 의해 구현될 수 있으며, 도 1의 블록도는 스케일러블 비디오 인코딩 장치의 기초가 될 수 있는 비디오 인코딩 장치의 일 실시예를 나타낸다.
도 1을 참조하면, 인코딩 장치(100)는 픽처 분할부(105), 예측부(110), 변환부(115), 양자화부(120), 재정렬부(125), 엔트로피 인코딩부(130), 역양자화부(135), 역변환부(140), 필터부(145) 및 메모리(150)를 구비한다.
픽처 분할부(105)는 입력된 픽처를 적어도 하나의 처리 단위 블록으로 분할할 수 있다. 이때, 처리 단위로서의 블록은 예측 유닛(Prediction Unit, 이하 ‘PU’라 함)일 수도 있고, 변환 유닛(Transform Unit, 이하 ‘TU’라 함)일 수도 있으며, 코딩 유닛(Coding Unit, 이하 ‘CU’라 함)일 수도 있다.
픽처 분할부(105)에서 분할되는 처리 단위 블록들은 쿼드 트리(quad-tree) 구조를 가질 수 있다.
예측부(110)는 후술하는 바와 같이, 인터 예측을 수행하는 인터 예측부와 인트라 예측을 수행하는 인트라 예측부를 포함한다. 예측부(110)는, 픽처 분할부(105)에서 픽처의 처리 단위에 대하여 예측을 수행하여 예측 블록을 생성한다. 예측부(110)에서 픽처의 처리 단위는 CU일 수도 있고, TU일 수도 있고, PU일 수도 있다. 또한, 예측부(110)는 해당 처리 단위에 대하여 실시되는 예측이 인터 예측인지 인트라 예측인지를 결정하고, 각 예측 방법의 구체적인 내용(예컨대, 예측 모드 등)을 정할 수 있다. 이때, 예측이 수행되는 처리 단위와 예측 방법 및 예측 방법의 구체적인 내용이 정해지는 처리 단위는 다를 수 있다. 예컨대, 예측의 방법과 예측 모드 등은 PU 단위로 결정되고, 예측의 수행은 TU 단위로 수행될 수도 있다.
인터 예측을 통해서는 현재 픽처의 이전 픽처 및/또는 이후 픽처 중 적어도 하나의 픽처의 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 또한, 인트라 예측을 통해서는 현재 픽처 내의 픽셀 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다.
인터 예측의 방법으로서, 스킵(skip) 모드, 머지(merge) 모드, MVP(Motion Vector Predtiction) 등을 이용할 수 있다. 인터 예측에서는 PU에 대하여, 참조 픽처를 선택하고 PU에 대응하는 참조 블록을 선택할 수 있다. 참조 블록은 정수 픽셀 단위로 선택될 수 있다. 이어서, 현재 PU와의 레지듀얼(residual) 신호가 최소화되며 움직임 벡터 크기 역시 최소가 되는 예측 블록이 생성된다.
예측 블록은 정수 샘플 단위로 생성될 수도 있고, 1/2 픽셀 단위 또는 1/4 픽셀 단위와 같이 정수 이하 픽셀 단위로 생성될 수도 있다. 이때, 움직임 벡터 역시 정수 픽셀 이하의 단위로 표현될 수 있다.
인터 예측을 통해 선택된 참조 픽처의 인덱스, 움직임 벡터(ex. Motion Vector Predictor), 레지듀얼 신호 등의 정보는 엔트로피 인코딩되어 디코딩 장치에 전달된다. 스킵 모드가 적용되는 경우에는 레지듀얼을 예측 블록을 복원 블록으로 할 수 있으므로, 레지듀얼을 생성, 변환, 양자화, 전송하지 않을 수 있다.
인트라 예측을 수행하는 경우에는, PU 단위로 예측 모드가 정해져서 PU 단위로 예측이 수행될 수 있다. 또한, PU 단위로 예측 모드가 정해지고 TU 단위로 인트라 예측이 수행될 수도 있다.
인트라 예측에서 예측 모드는 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비향성성 모드는 DC 예측 모드 및 플래이너 모드(Planar 모드)을 포함할 수 있다.
인트라 예측에서는 참조 샘플에 필터를 적용한 후 예측 블록을 생성할 수 있다. 이때, 참조 샘플에 필터를 적용할 것인지는 현재 블록의 인트라 예측 모드 및/또는 사이즈에 따라 결정될 수 있다.
생성된 예측 블록과 원본 블록 사이의 레지듀얼 값(레지듀얼 블록 또는 레지듀얼 신호)은 변환부(115)로 입력된다. 또한, 예측을 위해 사용한 예측 모드 정보, 움직임 벡터 정보 등은 레지듀얼 값과 함께 엔트로피 인코딩부(130)에서 인코딩되어 디코딩 장치에 전달된다.
변환부(115)는 변환 블록 단위로 레지듀얼 블록에 대한 변환을 수행하고 변환 계수를 생성한다.
변환 블록은 샘플들의 직사각형 블록으로서 동일한 변환이 적용되는 블록이다. 변환 블록은 변환 유닛(TU)일 수 있으며, 쿼드 트리(quad tree) 구조를 가질 수 있다.
변환부(115)는 레지듀얼 블록에 적용된 예측 모드와 블록의 크기에 따라서 변환을 수행할 수 있다.
예컨대, 레지듀얼 블록에 인트라 예측이 적용되었고 블록이 4x4의 레지듀얼 배열이라면, 레지듀얼 블록을 DST(Discrete Sine Transform)를 이용하여 변환하고, 그 외의 경우라면 레지듀얼 블록을 DCT(Discrete Cosine Transform)를 이용하여 변환할 수 있다.
변환부(115)는 변환에 의해 변환 계수들의 변환 블록을 생성할 수 있다.
양자화부(120)는 변환부(115)에서 변환된 레지듀얼 값들, 즉 변환 계수들을 양자화하여 양자화된 변환 계수를 생성할 수 있다. 양자화부(120)에서 산출된 값은 역양자화부(135)와 재정렬부(125)에 제공된다.
재정렬부(125)는 양자화부(120)로부터 제공된 양자화된 변환 계수를 재정렬한다. 양자화된 변환 계수를 재정렬함으로써 엔트로피 인코딩부(130)에서의 인코딩 효율을 높일 수 있다.
재정렬부(125)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원 블록 형태의 양자화된 변환 계수들을 1차원의 벡터 형태로 재정렬할 수 있다.
엔트로피 인코딩부(130)는 재정렬부(125)에 의해 재정렬된 양자화된 변환 값들 또는 코딩 과정에서 산출된 인코딩 파라미터 값 등을 기초로 심볼(symbol)을 확률 분포에 따라 엔트로피 코딩하여 비트스트림(bit stream)을 출력할 수 있다. 엔트로피 인코딩 방법은 다양한 값을 갖는 심볼을 입력 받아, 통계적 중복성을 제거하면서, 디코딩 가능한 2진수의 열로 표현하는 방법이다.
여기서, 심볼이란 인코딩/디코딩 대상 구문 요소(syntax element) 및 코딩 파라미터(coding parameter), 잔여 신호(residual signal)의 값 등을 의미한다. 인코딩 파라미터는 인코딩 및 디코딩에 필요한 매개변수로서, 구문 요소와 같이 인코딩 장치에서 인코딩되어 디코딩 장치로 전달되는 정보뿐만 아니라, 인코딩 혹은 디코딩 과정에서 유추될 수 있는 정보를 포함할 수 있으며 영상을 인코딩하거나 디코딩할 때 필요한 정보를 의미한다. 인코딩 파라미터는 예를 들어 인트라/인터 예측모드, 이동/움직임 벡터, 참조 영상 색인, 코딩 블록 패턴, 잔여 신호 유무, 변환 계수, 양자화된 변환 계수, 양자화 파라미터, 블록 크기, 블록 분할 정보 등의 값 또는 통계를 포함할 수 있다. 또한 잔여 신호는 원신호와 예측 신호의 차이를 의미할 수 있고, 또한 원신호와 예측 신호의 차이가 변환(transform)된 형태의 신호 또는 원신호와 예측 신호의 차이가 변환되고 양자화된 형태의 신호를 의미할 수도 있다. 잔여 신호는 블록 단위에서는 잔여 블록이라 할 수 있다.
엔트로피 인코딩이 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 인코딩 대상 심볼들에 대한 비트열의 크기가 감소될 수 있다. 따라서 엔트로피 인코딩을 통해서 영상 인코딩의 압축 성능이 높아질 수 있다.
엔트로피 인코딩을 위해 지수 골룸(exponential golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 인코딩 방법이 사용될 수 있다. 예를 들어, 엔트로피 인코딩부(130)에는 가변 길이 부호화(VLC: Variable Lenghth Coding/Code) 테이블과 같은 엔트로피 인코딩을 수행하기 위한 테이블이 저장될 수 있고, 엔트로피 인코딩부(130는 저장된 가변 길이 부호화(VLC) 테이블을 사용하여 엔트로피 인코딩을 수행할 수 있다. 또한 엔트로피 인코딩부(130)는 대상 심볼의 이진화(binarization) 방법 및 대상 심볼/빈(bin)의 확률 모델(probability model)을 도출한 후, 도출된 이진화 방법 또는 확률 모델을 사용하여 엔트로피 인코딩을 수행할 수도 있다.
여기서, 이진화(binarization)란 심볼의 값을 2진수의 열(bin sequence/string)로 표현하는 것을 의미한다. 빈(bin)은 심볼이 이진화를 통해 2진수의 열로 표현될 때, 각각의 2진수의 값(0 또는 1)을 의미한다.
확률 모델이란, 문맥 정보(context information)/문맥 모델(context model)을 통해서 도출될 수 있는 인코딩/디코딩 대상 심볼/빈의 예측된 확률을 의미한다. 문맥 정보/문맥 모델은 인코딩/디코딩 대상 심볼/빈의 확률을 결정하기 위한 정보를 말한다.
보다 상세하게, CABAC 엔트로피 인코딩 방법은, 이진화되지 않은 심볼을 이진화(binarization)하여 빈으로 변환하고, 주변 및 인코딩 대상 블록의 인코딩 정보 혹은 이전 단계에서 인코딩된 심볼/빈의 정보를 이용하여 문맥 모델을 결정하고, 결정된 문맥 모델에 따라 빈(bin)의 발생 확률을 예측하여 빈의 산술 부호화(arithmetic encoding)를 수행하여 비트스트림을 생성할 수 있다. 이때, CABAC 엔트로피 인코딩 방법은 문맥 모델 결정 후 다음 심볼/빈의 문맥 모델을 위해 인코딩된 심볼/빈의 정보를 이용하여 문맥 모델을 업데이트할 수 있다.
또한, 엔트로피 인코딩부(130)는 필요한 경우에, 전송하는 파라미터 셋(parameter set) 또는 신택스에 일정한 변경을 가할 수도 있다.
역양자화부(135)는 양자화부(120)에서 양자화된 값(양자화된 변환 계수)들을 역양자화하고, 역변환부(140)는 역양자화부(135)에서 역양자화된 값들을 역변환한다.
역양자화부(135) 및 역변환부(140)에서 생성된 레지듀얼 값과 예측부(110)에서 예측된 예측 블록이 합쳐져 복원 블록(Reconstructed Block)이 생성될 수 있다.
도 1에서는 가산기를 통해서, 레지듀얼 블록과 예측 블록이 합쳐져 복원 블록이 생성되는 것으로 설명하고 있다. 이때, 가산기를 복원 블록을 생성하는 별도의 유닛(복원 블록 생성부)로 볼 수도 있다.
필터부(145)는 디블록킹 필터, ALF(Adaptive Loop Filter), SAO(Sample Adaptive Offset)를 복원된 픽처에 적용할 수 있다.
디블록킹 필터는 복원된 픽처에서 블록 간의 경계에 생긴 왜곡을 제거할 수 있다. ALF(Adaptive Loop Filter)는 디블록킹 필터를 통해 블록이 필터링된 후 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있다. ALF는 고효율을 적용하는 경우에만 수행될 수도 있다. SAO는 디블록킹 필터가 적용된 레지듀얼 블록에 대하여, 픽셀 단위로 원본 영상과의 오프셋 차이를 복원하며, 밴드 오프셋(Band Offset), 에지 오프셋(Edge Offset) 등의 형태로 적용된다.
한편, 인터 예측에 사용되는 복원 블록에 대해서 필터부(145)는 필터링을 적용하지 않을 수도 있다.
메모리(150)는 필터부(145)를 통해 산출된 복원 블록 또는 픽처를 저장할 수 있다. 메모리(150)에 저장된 복원 블록 또는 픽처는 인터 예측을 수행하는 예측부(110)에 제공될 수 있다.
도 2는 본 발명의 일 실시예에 따른 비디오 디코딩 장치를 개략적으로 나타낸 블록도이다. 도 1에서 상술한 바와 같이 스케일러블 비디오 인코딩/디코딩 방법 또는 장치는 스케일러빌리티를 제공하지 않는 일반적인 비디오 인코딩/디코딩 방법 또는 장치의 확장에 의해 구현될 수 있으며, 도 2의 블록도는 스케일러블 비디오 디코딩 장치의 기초가 될 수 있는 비디오 디코딩 장치의 일 실시예를 나타낸다
도 2를 참조하면, 비디오 디코딩 장치(200)는 엔트로피 디코딩부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230), 필터부(235) 메모리(240)를 포함할 수 있다.
비디오 인코딩 장치에서 영상 비트스트림이 입력된 경우, 입력된 비트스트림은 비디오 인코딩 장치에서 영상 정보가 처리된 절차에 따라서 디코딩될 수 있다.
엔트로피 디코딩부(210)는, 입력된 비트스트림을 확률 분포에 따라 엔트로피 디코딩하여, 양자화된 계수(quantized coefficient) 형태의 심볼을 포함한 심볼들을 생성할 수 있다. 엔트로피 디코딩 방법은 2진수의 열을 입력 받아 각 심볼들을 생성하는 방법이다. 엔트로피 디코딩 방법은 상술한 엔트로피 인코딩 방법과 유사하다.
예컨대, 비디오 인코딩 장치에서 엔트로피 인코딩을 수행하기 위해 CAVLC 등의 가변 길이 부호화(Variable Length Coding: VLC, 이하 ‘VLC’ 라 함)가 사용된 경우에, 엔트로피 디코딩부(210)도 인코딩 장치에서 사용한 VLC 테이블과 동일한 VLC 테이블로 구현하여 엔트로피 디코딩을 수행할 수 있다. 또한, 비디오 인코딩 장치에서 엔트로피 인코딩을 수행하기 위해 CABAC을 이용한 경우에, 엔트로피 디코딩부(210)는 이에 대응하여 CABAC을 이용한 엔트로피 디코딩을 수행할 수 있다.
보다 상세하게, CABAC 엔트로피 디코딩 방법은, 비트스트림에서 각 구문 요소에 해당하는 빈을 수신하고, 디코딩 대상 구문 요소 정보와 주변 및 디코딩 대상 블록의 디코딩 정보 혹은 이전 단계에서 디코딩된 심볼/빈의 정보를 이용하여 문맥 모델을 결정하고, 결정된 문맥 모델에 따라 빈(bin)의 발생 확률을 예측하여 빈의 산술 복호화(arithmetic decoding)를 수행하여 각 구문 요소의 값에 해당하는 심볼을 생성할 수 있다. 이때, CABAC 엔트로피 디코딩 방법은 문맥 모델 결정 후 다음 심볼/빈의 문맥 모델을 위해 디코딩된 심볼/빈의 정보를 이용하여 문맥 모델을 업데이트할 수 있다.
엔트로피 디코딩 방법이 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 각 심볼들에 대한 비트열의 크기가 감소될 수 있다. 따라서 엔트로피 디코딩 방법을 통해서 영상 디코딩의 압축 성능이 높아질 수 있다.
엔트로피 디코딩부(210)에서 디코딩된 정보 중 예측 블록을 생성하기 위한 정보는 예측부(230)로 제공되고, 엔트로피 디코딩부(210)에서 엔트로피 디코딩이 수행된 레지듀얼 값, 즉 양자화된 변환 계수는 재정렬부(215)로 입력될 수 있다.
재정렬부(215)는 엔트로피 디코딩부(210)에서 엔트로피 디코딩된 비트스트림의 정보, 즉 양자화된 변환 계수를 인코딩 장치에서 재정렬한 방법을 기초로 재정렬할 수 있다.
재정렬부(215)는 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다. 재정렬부(215)는 현재 블록(변환 블록)에 적용된 예측 모드와 변환 블록의 크기를 기반으로 계수에 대한 스캐닝을 수행하여 2 차원 블록 형태의 계수(양자화된 변환 계수) 배열을 생성할 수 있다.
역양자화부(220)는 인코딩 장치에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다.
역변환부(225)는 비디오 인코딩 장치에서 수행된 양자화 결과에 대해, 인코딩 장치의 변환부가 수행한 DCT 및 DST에 대해 역DCT 및/또는 역DST를 수행할 수 있다.
역변환은 인코딩 장치에서 결정된 전송 단위 또는 영상의 분할 단위를 기초로 수행될 수 있다. 인코딩 장치의 변환부에서 DCT 및/또는 DST는 예측 방법, 현재 블록의 크기 및 예측 방향 등 복수의 정보에 따라 선택적으로 수행될 수 있고, 디코딩 장치의 역변환부(225)는 인코딩 장치의 변환부에서 수행된 변환 정보를 기초로 역변환을 수행할 수 있다.
예측부(230)는 엔트로피 디코딩부(210)에서 제공된 예측 블록 생성 관련 정보와 메모리(240)에서 제공된 이전에 디코딩된 블록 및/또는 픽처 정보를 기초로 예측 블록을 생성할 수 있다.
현재 PU에 대한 예측 모드가 인트라 예측(intra prediction) 모드인 경우에, 현재 픽처 내의 픽셀 정보를 기초로 예측 블록을 생성하는 인트라 예측을 수행할 수 있다.
현재 PU에 대한 예측 모드가 인터 예측(inter prediction) 모드인 경우에, 현재 픽처의 이전 픽처 또는 이후 픽처 중 적어도 하나의 픽처에 포함된 정보를 기초로 현재 PU에 대한 인터 예측을 수행할 수 있다. 이때, 비디오 인코딩 장치에서 제공된 현재 PU의 인터 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽처 인덱스 등에 관한 정보는 인코딩 장치로부터 수신한 스킵 플래그, 머지 플래그 등을 확인하고 이에 대응하여 유도될 수 있다.
복원 블록은 예측부(230)에서 생성된 예측 블록과 역변환부(225)에서 제공된 레지듀얼 블록을 이용해 생성될 수 있다. 도 2에서는 가산기에서 예측 블록과 레지듀얼 블록이 합쳐져 복원 블록이 생성되는 것으로 설명하고 있다. 이때, 가산기를 복원 블록을 생성하는 별도의 유닛(복원 블록 생성부)로 볼 수 있다.
스킵 모드가 적용되는 경우에는 레지듀얼이 전송되지 않으며 예측 블록을 복원 블록으로 할 수 있다.
복원된 블록 및/또는 픽처는 필터부(235)로 제공될 수 있다. 필터부(235)는 복원된 블록 및/또는 픽처에 디블록킹 필터링, SAO(Sample Adaptive Offset) 및/또는 ALF 등을 적용할 수 있다.
메모리(240)는 복원된 픽처 또는 블록을 저장하여 참조 픽처 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽처를 출력부로 제공할 수 있다.
디코딩 장치(200)에 포함되어 있는 엔트로피 디코딩부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230), 필터부(235) 및 메모리(240) 중 영상의 디코딩에 직접적으로 관련된 구성요소들, 예컨대, 엔트로피 디코딩부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230), 필터부(235) 등을 다른 구성요소와 구분하여 디코더 또는 디코딩부로 표현할 수 있다.
또한, 디코딩 장치(200)는 비트스트림에 포함되어 있는 인코딩된 영상에 관련된 정보를 파싱하는 도시하지 않은 파싱부를 더 포함할 수 있다. 파싱부는 엔트로피 디코딩부(210)를 포함할 수도 있고, 엔트로피 디코딩부(210)에 포함될 수도 있다. 이러한 파싱부는 또한 디코딩부의 하나의 구성요소로 구현될 수도 있다.
도 3은 현재 블록에 대해 인터 예측이 수행되는 경우에 이용될 수 있는 후보 블록의 일 실시예를 개략적으로 설명하는 도면이다.
인코딩 장치 및 디코딩 장치의 예측부는 현재 블록(300) 주변 소정 위치의 블록을 후보 블록으로 이용할 수 있다. 예컨대, 도 3의 예에서는 현재 블록 좌하단에 위치하는 두 개의 블록 A0(310)와 A1(320) 그리고 현재 블록 우상단과 좌상단의 세 블록 B0(330), B1(340), B2(350)이 공간적인 후보 블록으로 선택될 수 있다. 또한, 공간적으로 인접하는 블록 외에 시간적인 후보 블록으로서, 상술한 Col 블록(360)이 후보 블록으로 이용될 수 있다.
한편, 인터 예측에 사용되는 참조 픽쳐에 관해서, 현재 블록에 대한 참조 픽쳐는 주변 블록의 참조 픽쳐로부터 유도되거나 인코딩 장치로부터 수신된 정보에 의해 지시될 수 있다. 스킵 모드 또는 머지 모드의 경우에, 디코딩 장치의 예측부는 주변 블록의 참조 픽쳐를 현재 블록의 참조 픽쳐로 이용할 수 있다. MVP가 적용되는 경우에, 디코딩 장치의 예측부는 현재 블록에 대한 참조 픽쳐를 지시하는 정보를 인코딩 장치로부터 수신할 수 있다.
현재 픽쳐보다 이전에 부호화/복호화된 픽쳐들은 메모리(예컨대, Decoded Picture Buffer: DPB)에 저장되어 현재 블록(현재 픽쳐)의 예측에 이용될 수 있다. 현재 블록의 인터 예측에 이용 가능한 픽쳐들은 참조 픽쳐 리스트로 유지될 수 있다. 이 때, 참조 픽쳐 리스트에 포함된 참조 픽쳐들 중에서 현재 블록의 인터 예측에 사용되는 참조 픽쳐는 참조 픽쳐 인덱스에 의해 지시될 수 있다. 즉, 참조 픽쳐 인덱스는 참조 픽쳐 리스트를 구성하는 참조 픽쳐들 중에서 현재 블록의 인터 예측에 사용되는 참조 픽쳐를 지시하는 인덱스를 의미할 수 있다.
I 슬라이스는 인트라 예측을 통해 복호화되는 슬라이스이다. P 슬라이스는 인트라 예측 또는 최대 하나의 움직임 벡터와 하나의 참조 픽쳐를 이용하는 인터 예측을 통해 복호화되는 슬라이스이다. B 슬라이스는 인트라 예측 또는 최대 두 개의 움직임 벡터와 두 개의 참조 픽쳐를 이용하는 인터 예측을 통해 복호화되는 슬라이스이다. 이때, 참조 픽쳐는 단기 참조 픽쳐(Short Term Reference Picture: STRP, 이하 STRP라 함) 및 장기 참조 픽쳐(Long Term Reference Picture: LTRP, 이하 LTRP라 함)를 포함할 수 있다.
여기서, 단기 참조 픽쳐 및 장기 참조 픽쳐는 DPB(Decoded Picture Buffer)에 저장되어 있는 복원된 픽쳐일 수 있다. 단기 참조 픽쳐는 “단기 참조 픽쳐로 이용됨” 또는 “참조 픽쳐로 이용됨”으로 마킹될 수 있다(marked as “used for short-term reference” or “used for reference”). 또한, 장기 참조 픽쳐는 “장기 참조 픽쳐로 이용됨” 또는 “참조 픽쳐로 이용됨”으로 마킹될 수 있다(marked as “used for long-term reference” or “used for reference”). 일례로, 복호화 대상 픽쳐와 장기 참조 픽쳐 간의 POC 차이는 ‘1’부터 ‘224-1’까지의 범위에 해당되는 값을 가질 수 있다. 여기서, POC(Picture Order Count)는 픽쳐의 표시 순서를 나타낼 수 있다.
참조 픽쳐 리스트 0 (reference picture list 0, 이하 설명의 편의를 위해 ‘L0’이라 함)는 P 슬라이스 또는 B 슬라이스의 인터 예측에 이용되는 참조 픽쳐 리스트이다. 참조 픽쳐 리스트 1 (reference picture list 1, 이하 설명의 편의를 위해 ‘L1’이라 함)은 B 슬라이스의 인터 예측을 위해 이용될 수 있다. 따라서, P 슬라이스의 블록에 대한 인터 예측 시에는 L0를 기반으로 하는 단방향 예측이 수행될 수 있고, B 슬라이스의 블록에 대한 인터 예측 시에는 L0와 L1을 기반으로 하는 쌍예측(bi-prediction)이 수행될 수 있다.
인코딩 장치 및/또는 디코딩 장치는 인터 예측을 통해 P 슬라이스와 B 슬라이스에 대한 부호화 및/또는 복호화를 수행하는 경우에, 참조 픽쳐 리스트를 구성(construct)할 수 있다. 이 때, 인터 예측에 이용되는 참조 픽쳐는 참조 픽쳐 인덱스를 통해 지정될 수 있다. 상술한 바와 같이, 참조 픽쳐 인덱스는 인터 예측에 이용되는 참조 픽쳐 리스트 상의 참조 픽쳐를 지시하는 인덱스를 의미할 수 있다.
참조 픽쳐 리스트는 인코딩 장치 및 디코딩 장치에서 결정되거나 생성되는 참조 픽쳐 세트(reference picture set)를 기반으로 구성될 수 있다. 참조 픽쳐 리스트를 구성하는 참조 픽쳐들은 메모리(예컨대, DPB)에 저장될 수 있다. 메모리에 저장되는 픽쳐들(현재 픽쳐 이전에 부호화/복호화된 픽쳐들)은 인코딩 장치와 디코딩 장치에 의해 관리될 수 있다.
참조 픽쳐를 관리하는 방법으로서 슬라이딩 윈도우(sliding window) 방식이 이용되는 경우에는 참조 픽쳐를 메모리에 저장한 후 일정 시간이 지나면 방출하는 간단한 방법에 의해 참조 픽쳐가 관리될 수 있지만, 몇 가지 문제를 가지고 있다. 예컨대, 더 이상 필요하지 않게 된 참조 픽쳐가 있다고 해도 메모리에서 바로 방출될 수 없기 때문에 효율이 저하될 수 있다. 또한, 저장된 참조 픽쳐가 일정 시간 후에는 메모리로부터 방출되므로, LTRP(Long Term Reference Picture)를 관리하기가 어려워질 수 있다.
슬라이딩 윈도우 방식의 문제를 고려하여, 인코딩 장치로부터 참조 픽쳐의 관리에 관한 지시 정보가 직접 시그널링되는 MMCO(Memory Management Command Operation) 방법이 이용될 수도 있다. 특히 MMCO에서는 LTRP 관리(management)와 관련하여, 픽쳐를 LTRP로 할당하기 위한 커맨드(command), LTRP의 상태를 STRP로 변경하기 위한 커맨드 및 LTRP를 “참조 픽쳐로 이용되지 않음”으로 마킹하기 위한(to mark LTRP as “unused for reference”) 커맨드 등이 정의될 수 있다.
하지만, MMCO 방법이 이용되는 경우에도 시그널링 과정에서 픽쳐 손실(picture loss)이 발생할 수 있고, 손실된 픽쳐가 MMCO 명령(command)을 포함하고 있었다면, 손실된 MMCO 정보를 복원할 수 없게 됨으로써, 메모리(DPB)가 현재 필요한 픽쳐들이 관리되는 정확한 상태로 유지될 수 없다. 따라서, 인터 예측도 부정확하게 수행될 우려가 있다.
상술한 문제들을 해결하기 위해, 슬라이스(및/또는 픽쳐)의 복호화 과정에 필요한 참조 픽쳐 세트와 관련된 정보를 SPS(Sequence Parameter Set), PPS(Picture Parameter Set) 및/또는 슬라이스 헤더(slice header)에서 전송하는 방법이 이용될 수 있다. 이 때, 참조 픽쳐 리스트는 참조 픽쳐 세트를 기반으로 구성될 수 있다.
참조 픽쳐 세트는 현재 픽쳐/슬라이스 또는 미래(future) 픽쳐/슬라이스의 참조를 위해 이용되는 참조 픽쳐들을 포함할 수 있다. 슬라이스(및/또는 픽쳐)의 복호화 과정에서 사용되는 참조 픽쳐는 단기 참조 픽쳐(STRP) 및 장기 참조 픽쳐(LTRP)를 포함할 수 있다. 또한, 단기 참조 픽쳐(STRP)에는 현재 픽쳐보다 작은 POC를 갖는 순방향 단기 참조 픽쳐 및 현재 픽쳐보다 큰 POC를 갖는 역방향 단기 참조 픽쳐가 있을 수 있다. 이 때, 참조 픽쳐 세트는 순방향 단기 참조 픽쳐, 역방향 단기 참조 픽쳐 및 장기 참조 픽쳐 각각에 대해 결정되거나 생성될 수 있다.
이하, 본 명세서에서는 설명의 편의를 위해 순방향 단기 참조 픽쳐에 대한 참조 픽쳐 세트는 순방향 단기 참조 픽쳐 세트라 하고, 역방향 단기 참조 픽쳐에 대한 참조 픽쳐 세트는 역방향 단기 참조 픽쳐 세트라 하며, 장기 참조 픽쳐에 대한 참조 픽쳐 세트는 장기 참조 픽쳐 세트라 한다. 여기서, 일례로 순방향 단기 참조 픽쳐 세트는 RefPicSetStCurrBefore로 나타내어질 수 있고, 역방향 단기 참조 픽쳐 세트는 RefPicSetStCurrAfter로 나타내어질 수 있으며, 장기 참조 픽쳐 세트는 RefPicSetLtCurr로 나타내어질 수 있다.
도 4는 참조 픽쳐 세트를 기반으로 참조 픽쳐 리스트를 구성하는 방법의 일 실시예를 개략적으로 나타내는 흐름도이다.
도 4의 실시예는 설명의 편의상 디코딩 장치의 동작을 중심으로 서술된다. 후술되는 참조 픽쳐 리스트 생성 과정은 참조 픽쳐 리스트 초기화(initialization) 과정으로 볼 수도 있다.
도 4를 참조하면, 디코딩 장치는 인코딩 장치로부터 전송된 참조 픽쳐 세트 관련 정보를 기반으로 참조 픽쳐 세트를 구성할 수 있다(S410). 일례로, 참조 픽쳐 세트는 인터 예측이 적용되는 픽쳐마다 구성될 수 있다.
여기서, 참조 픽쳐 세트는 순방향 단기 참조 픽쳐 세트, 역방향 단기 참조 픽쳐 세트 및 장기 참조 픽쳐 세트를 포함할 수 있다. 각각의 참조 픽쳐 세트에 포함되는 참조 픽쳐들은 POC(Picture Order Count)에 의해 특정될 수 있다. POC(Picture Order Count)는 픽쳐의 표시 순서를 나타낸다.
순방향 단기 참조 픽쳐 세트 및 역방향 단기 참조 픽쳐 세트에 포함되는 참조 픽쳐들의 POC는 상대적 POC(relative POC)에 의해 결정될 수 있다. 여기서, 상대적 POC에 관한 정보는 인코딩 장치에서 디코딩 장치로 전송될 수 있다.
상대적 POC는 참조 픽쳐 세트 내 두 픽쳐들 간의 POC 차를 나타낼 수 있다. POC 순서상 현재 픽쳐 이전의 참조 픽쳐들(현재 픽쳐의 POC보다 POC가 작은 참조 픽쳐들)의 상대적 POC는 참조 픽쳐 세트 내에서 바로 전의 참조 픽쳐와의 POC 차이에 해당될 수 있다. POC 순서상 현재 픽쳐 이후의 참조 픽쳐들(현재 픽쳐의 POC보다 POC가 큰 참조 픽쳐들)의 상대적 POC도 참조 픽쳐 세트 내에서 바로 전의 참조 픽쳐와의 POC 차이에 해당될 수 있다.
순방향 단기 참조 픽쳐 세트에서는 현재 픽쳐의 POC 보다 작은 POC 값을 갖는 순방향 단기 참조 픽쳐들이 POC의 내림차순으로 위치할 수 있다. 다시 말하면, DPB에 존재하는 픽쳐들 중에서 현재 픽쳐의 POC 보다 작은 POC 값을 갖는 픽쳐들이 순방향 단기 참조 픽쳐 세트의 처음부터 POC의 내림차순으로 위치할 수 있다.
역방향 단기 참조 픽쳐 세트에서는 현재 픽쳐의 POC 보다 큰 POC 값을 갖는 역방향 단기 참조 픽쳐들이 POC의 오름차순으로 위치할 수 있다. 다시 말하면, DPB에 존재하는 픽쳐들 중에서 현재 픽쳐의 POC 보다 작은 POC 값을 갖는 픽쳐들이 역방향 단기 참조 픽쳐 세트의 처음부터 POC의 오름차순으로 위치할 수 있다.
장기 참조 픽쳐 세트에 포함되는 참조 픽쳐들은 부호화기로부터 전송된 장기 참조 픽쳐 세트 관련 정보를 기반으로 결정될 수 있다. 여기서, 장기 참조 픽쳐 세트 관련 정보에는 장기 참조 픽쳐 세트에 포함되는 참조 픽쳐들(및/또는 상기 참조 픽쳐들의 POC)를 결정하기 위한 정보 등이 포함될 수 있다.
다시 도 4를 참조하면, 디코딩 장치는 참조 픽쳐 세트를 기반으로 참조 픽쳐 리스트를 생성할 수 있다(S420).
참조 픽쳐 리스트 L0를 구성하는 경우, 디코딩 장치는 순방향 단기 참조 픽쳐 세트를 구성하는 순방향 단기 참조 픽쳐, 역방향 단기 참조 픽쳐 세트를 구성하는 역방향 단기 참조 픽쳐, 장기 참조 픽쳐 세트를 구성하는 장기 참조 픽쳐의 순서로 참조 픽쳐 인덱스를 할당함으로써 참조 픽쳐 리스트를 구성할 수 있다. 즉, 참조 픽쳐 리스트 L0에는 순방향 단기 참조 픽쳐들이 할당된 후 역방향 단기 참조 픽쳐들이 추가될 수 있으며, 마지막으로 장기 참조 픽쳐들이 추가될 수 있다.
순방향 단기 참조 픽쳐 세트를 구성하는 순방향 단기 참조 픽쳐들은, 순방향 단기 참조 픽쳐 세트에 포함된 순서와 동일한 순서로 참조 픽쳐 리스트 L0에 추가될 수 있다. 즉, 순방향 단기 참조 픽쳐들은 참조 픽쳐 리스트 L0 내에서 POC의 내림차순으로 위치할 수 있으며, POC가 작을수록 큰 참조 픽쳐 인덱스 값이 할당될 수 있다.
또한, 역방향 단기 참조 픽쳐 세트를 구성하는 역방향 단기 참조 픽쳐들은, 역방향 단기 참조 픽쳐 세트에 포함된 순서와 동일한 순서로 참조 픽쳐 리스트 L0에 추가될 수 있다. 즉, 역방향 단기 참조 픽쳐들은 참조 픽쳐 리스트 L0 내에서 POC의 오름차순으로 위치할 수 있으며, POC가 클수록 큰 참조 픽쳐 인덱스 값이 할당될 수 있다.
그리고, 장기 참조 픽쳐 세트를 구성하는 장기 참조 픽쳐들은, 장기 참조 픽쳐 세트에 포함된 순서와 동일한 순서로 참조 픽쳐 리스트 L0에 추가될 수 있다.
B 슬라이스의 경우 참조 픽쳐 리스트 L0뿐만 아니라, 참조 픽쳐 리스트 L1도 생성될 수 있다. 참조 픽쳐 리스트 L1을 구성하는 경우, 디코딩 장치는 역방향 단기 참조 픽쳐 세트를 구성하는 역방향 단기 참조 픽쳐, 순방향 단기 참조 픽쳐 세트를 구성하는 순방향 단기 참조 픽쳐, 장기 참조 픽쳐 세트를 구성하는 장기 참조 픽쳐의 순서로 참조 픽쳐 인덱스를 할당함으로써 참조 픽쳐 리스트를 구성할 수 있다. 즉, 참조 픽쳐 리스트 L1에는 역방향 단기 참조 픽쳐들이 할당된 후 순방향 단기 참조 픽쳐들이 추가될 수 있으며, 마지막으로 장기 참조 픽쳐들이 추가될 수 있다.
역방향 단기 참조 픽쳐 세트를 구성하는 역방향 단기 참조 픽쳐들은, 역방향 단기 참조 픽쳐 세트에 포함된 순서와 동일한 순서로 참조 픽쳐 리스트 L1에 추가될 수 있다. 즉, 역방향 단기 참조 픽쳐들은 참조 픽쳐 리스트 L1 내에서 POC의 오름차순으로 위치할 수 있으며, POC가 클수록 큰 참조 픽쳐 인덱스 값이 할당될 수 있다.
또한, 순방향 단기 참조 픽쳐 세트를 구성하는 순방향 단기 참조 픽쳐들은, 순방향 단기 참조 픽쳐 세트에 포함된 순서와 동일한 순서로 참조 픽쳐 리스트 L1에 추가될 수 있다. 즉, 순방향 단기 참조 픽쳐들은 참조 픽쳐 리스트 L1 내에서 POC의 내림차순으로 위치할 수 있으며, POC가 작을수록 큰 참조 픽쳐 인덱스 값이 할당될 수 있다. 그리고, 장기 참조 픽쳐 세트를 구성하는 장기 참조 픽쳐들은, 장기 참조 픽쳐 세트에 포함된 순서와 동일한 순서로 참조 픽쳐 리스트 L1에 추가될 수 있다.
참조 픽쳐 리스트 L0 및 L1에 추가되는 참조 픽쳐들에는 순서대로 참조 픽쳐 인덱스가 할당될 수 있다.
디코딩 장치는 참조 픽쳐 리스트에 포함된 참조 픽쳐들 중에서 첫 N개(참조 픽쳐 인덱스 0부터 참조 픽쳐 인덱스 N-1까지의 참조 픽쳐들, 여기서 N은 자연수임)를 이용 가능한 참조 픽쳐로서 활용할 수 있다. 이 때, 이용 가능한 참조 픽쳐의 개수 N에 관한 정보는 인코딩 장치로부터 전송될 수 있다.
상술한 과정에서는 참조 픽쳐 리스트가 묵시적으로(implicitly) 유도되는 것으로 볼 수 있다. 참조 픽쳐 리스트가 묵시적으로 유도되는 경우에, 인코딩 장치와 디코딩 장치는 픽쳐들의 POC를 기반으로 현재 픽쳐의 인터 예측에 이용될 참조 픽쳐 리스트를 상술한 바와 같이 유도할 수 있다.
한편, 디코딩 장치는 인코딩 장치에서 명시적으로(explicitly) 전송된 정보를 기반으로, 묵시적으로 유도된 참조 픽쳐 리스트를 수정(modify)할 수도 있다. 이 때, 인코딩 장치는 묵시적으로 유도되는 참조 픽쳐 리스트가 수정(modify)된다는 것을 지시하는 참조 픽쳐 리스트 수정 정보와 함께 참조 픽쳐 리스트를 구성하는 구체적인 엔트리(entry)를 지시하는 엔트리 정보를 전송할 수 있다. 인코딩 장치로부터 명시적으로 전송된 정보를 기반으로 참조 픽쳐 리스트를 수정함으로써 최종적으로 참조 픽쳐 리스트가 특정되는 경우, 참조 픽쳐 리스트가 명시적으로 특정되는 것으로 볼 수도 있다.
인코딩 장치는 L0가 명시적으로 특정되는 경우에는 L0에 관한 엔트리 정보를 전송할 수 있다. L0에 관한 엔트리 정보는 L0 상에서의 인덱스에 대응되는 참조 픽쳐를 지시할 수 있다. 또한 인코딩 장치는 L1이 명시적으로 특정되는 경우에는 L1에 관한 엔트리 정보를 전송할 수 있다. L1에 관한 엔트리 정보는 L1 상에서의 인덱스에 대응되는 참조 픽쳐를 지시할 수 있다.
예컨대, 엔트리 정보에 의해 참조 픽쳐 리스트가 명시적으로 특정되면, 순방향 단기 참조 픽쳐들, 역방향 단기 참조 픽쳐들 및 장기 참조 픽쳐들의 참조 픽쳐 리스트 내에서의 순서(및/또는 참조 픽쳐 인덱스)가 묵시적으로 유도되는 참조 픽쳐 리스트 내에서의 순서(및/또는 참조 픽쳐 인덱스)와 달라질 수 있다. 또한, 엔트리 정보에 의해 참조 픽쳐 리스트가 특정되면, 활용되는 가용 참조 픽쳐들도 묵시적으로 유도되는 참조 픽쳐 리스트의 경우와는 달라질 수 있다.
참조 픽쳐 리스트가 명시적으로 특정되는 경우에는, 참조 픽쳐 리스트 수정 정보 및 엔트리 정보를 기반으로 디코딩 장치는 인코딩 장치가 구성한 참조 픽쳐 리스트와 동일한 참조 픽쳐 리스트를 구성할 수 있다.
앞서 설명한 참조 픽쳐 리스트의 묵시적 유도 방법에서는, 설명의 편의를 위해 이용 가능한 픽쳐들만을 고려하여 참조 픽쳐 세트 및 참조 픽쳐 리스트를 설명하였으나, 인코딩 장치 및 디코딩 장치에서 참조 픽쳐들의 이용 가부 혹은 이용 여부를 고려하여 참조 픽쳐 세트 및/또는 참조 픽쳐 리스트를 구성할 수도 있다.
도 5는 참조 픽쳐 리스트의 초기화를 수행하는 장치의 일 실시예를 개략적으로 나타내는 블록도이다.
도 5의 실시예에서, 참조 픽쳐 리스트 초기화 장치(500)는 참조 픽쳐 세트 구성부(510) 및 참조 픽쳐 리스트 생성부(520)를 포함할 수 있다.
도 5를 참조하면, 참조 픽쳐 세트 구성부(510)는 입력되는 참조 픽쳐 세트 관련 정보를 기반으로 참조 픽쳐 세트를 구성할 수 있다. 일례로, 참조 픽쳐 세트는 인터 예측이 적용되는 픽쳐마다 구성될 수 있다.
여기서, 참조 픽쳐 세트는 순방향 단기 참조 픽쳐 세트, 역방향 단기 참조 픽쳐 세트 및 장기 참조 픽쳐 세트를 포함할 수 있다. 각각의 참조 픽쳐 세트에 포함되는 참조 픽쳐들은 POC(Picture Order Count)에 의해 특정될 수 있다. POC(Picture Order Count)는 픽쳐의 표시 순서를 나타낸다.
참조 픽쳐 세트 구성부(510)가 수행하는 동작의 구체적인 내용은 도 4의 참조 픽쳐 세트 구성 단계(S410)에서 설명한 바와 동일하므로, 여기서는 생략하기로 한다.
다시 도 5를 참조하면, 참조 픽쳐 리스트 생성부(520)는 참조 픽쳐 세트를 기반으로 참조 픽쳐 리스트를 생성할 수 있다. 참조 픽쳐 리스트 생성부(520)에서 생성되는 참조 픽쳐 리스트에는 L0 및 L1이 있을 수 있다. 참조 픽쳐 리스트 생성부(520)가 수행하는 동작의 구체적인 내용은 도 4의 참조 픽쳐 리스트 생성 단계(S420)에서 설명한 바와 동일하므로, 여기서는 생략하기로 한다.
참조 픽쳐 리스트 생성부(520)에서 생성된 참조 픽쳐 리스트는 예측을 위해 DPB에 저장되거나 예측부에 전달되어 예측에 참조될 수 있다.
여기서는 참조 픽쳐 리스트 초기화가 별도의 구성(참조 픽쳐 리스트 초기화 장치)에서 수행되는 것으로 설명하였으나, 이는 설명의 편의와 발명의 이해를 위한 것으로서, 본 발명은 이에 한정되지 않는다. 예컨대, 참조 픽쳐 리스트의 초기화는 도 1 및 도 2에서 설명한 인코딩 장치 및 디코딩 장치의 메모리, 예컨대, DPB에서 수행될 수도 있다. 이 경우, 상술한 참조 픽쳐 리스트 장치는 DPB일 수 있다. 또한, 참조 픽쳐 리스트의 초기화는 도 1 및 도 2에서 설명한 인코딩 장치 및 디코딩 장치의 예측부에서 수행될 수도 있다. 이 경우, 상술한 참조 픽쳐 리스트 초기화 장치는 예측부일 수 있다. 뿐만 아니라, 참조 픽쳐 리스트 초기화 장치가 인코딩 장치 및 디코딩 장치 내에 별도의 구성으로서 포함될 수도 있다.
한편, 참조 픽쳐 리스트는 픽쳐 내 모든 슬라이스에서 동일할 수도 있고, 슬라이스 별로 다를 수도 있다. 하나의 픽쳐에 속하는 슬라이스에 대하여 참조 픽쳐 리스트가 동일한지 여부를 나타내는 정보는 restricted_ref_pic_lists_flag 와 같은 플래그로 시그널링될 수 있으며, 이러한 플래그 정보는 시퀀스 파라미터 세트(Sequence parameter set, SPS)에 포함될 수 있다.
restricted_ref_pic_lists_flag 는 픽쳐에 속하는 모든 P 슬라이스 및 B 슬라이스(존재하는 경우)에 대한 참조 픽쳐 리스트 0이 동일한지 여부 및 픽쳐에 속하는 모든 B 슬라이스(존재하는 경우)에 대한 참조 픽쳐 리스트 1이 동일한지 여부를 나타낼 수 있다.
restricted_ref_pic_lists_flag가 1이면 참조 픽쳐 구성 과정(reference picture construction process)이 개별적인 슬라이스에 대해서가 아닌 각 픽쳐에 대하여 한 번 발생하는 것을 나타내고, restricted_ref_pic_lists_flag가 0이면 참조 픽쳐 구성 과정이 픽쳐에 대하여 한 번 발생하는 것은 아님을 나타낸다. restricted_ref_pic_lists_flag가 1이면 참조 픽쳐 구성 과정에 대한 복잡도가 개선되는 효과가 있다.
restricted_ref_pic_lists_flag가 1로 시그널링 되면, lists_modification_present_flag와 같은 플래그 정보가 추가적으로 시그널링 될 수 있다.
lists_modification_present_flag는 참조 픽쳐 리스트의 변경(modification)에 대한 추가적인 정보가 존재하는 여부를 지시하는 플래그 신호이다. 즉, lists_modification_present_flag가 1이면 참조 픽쳐 리스트의 변경에 대한 추가적인 정보가 존재하는 것을 나타내고. restricted_ref_pic_lists_flag가 0이면 lists_modification_present_flag가 1인 것이 자명하기 때문에 lists_modification_present_flag는 시그널링 되지 않는다.
한편, restricted_ref_pic_lists_flag가 SPS에 포함되면, 비트스트림 전체에 걸쳐 참조 픽쳐 구성 과정이 개별적인 슬라이스에 대해서가 아닌 각 픽쳐에 대하여 한 번 발생하는지 여부를 시그널링 하기 때문에 이러한 시그널링 방식은 다소 유연하지 못하고, 참조 픽쳐 리스트에 대한 정보 전달에 있어 제약될 수 있다.
실질적으로, 복잡하지 않고 단순한 장면이 많은 비트스트림 중 일부의 경우 참조 픽쳐 리스트의 참조 픽쳐의 순서는 슬라이스 별로 변경될 필요가 없다. 반면, 복잡한 장면이 많은 비트스트림의 일부의 경우 압축 효율을 향상시키기 위하여 참조 픽쳐 리스트의 참조 픽쳐의 순서는 슬라이스 별로 변경되는 것이 좋다.
도 6은 코딩된 픽쳐에서 참조 픽쳐 리스트의 동적인 변화를 예시적으로 도시한 도면이다.
도 6과 같이, 하나의 코딩된 픽처에 포함되어 있는 슬라이스는 참조 픽쳐 리스트가 동일할 수도 있고, 슬라이스 별로 참조 픽쳐 리스트가 상이할 수도 있다.
도 6의 비트스림에 속하는 픽쳐들 중 일부(A), 예컨대 특정 기간 동안의 픽쳐들에 속한 모든 슬라이스의 참조 픽쳐 리스트가 동일하고, 또 다른 특정 기간 동안의 픽쳐들(B)에 속한 슬라이스의 경우 각 슬라이스 별로 참조 픽쳐 리스트가 다르다. 물론, 하나의 픽쳐에서 속한 슬라이스 중 일부의 참조 픽쳐 리스트는 동일하고 일부의 참조 픽쳐 리스트는 상이할 수도 있다.
도 6과 같은 비트스트림의 경우 restricted_ref_pic_lists_flag 이 SPS에서 시그널링 된다면, restricted_ref_pic_lists_flag 값은 0이 된다. 따라서, 디코딩 장치는 하나의 픽쳐 내에서 참조 픽쳐 리스트가 동일한 특정 기간에 속해 있는 픽쳐(예컨대 A)에 대하여 단일의 참조 픽쳐 리스트를 구성하는 특징을 이용할 수 없다.
본 발명은 참조 픽쳐 리스트의 구성을 제한하는 특징을 개선하기 위하여 상술한 restricted_ref_pic_lists_flag 또는/및 lists_modification_present_flag의 시그널링 위치를 변경할 것을 제안한다.
표 1은 본 발명의 일 예에 따른 픽쳐 파라미터 세트(Picture parameter set, PPS)를 도시한 것이다.
표 1
Figure PCTKR2013008672-appb-T000001
표 1을 참조하면, restricted_ref_pic_lists_flag는 픽쳐에 속하는 모든 P 슬라이스 및 B 슬라이스(존재하는 경우)에 대한 참조 픽쳐 리스트 0이 동일한지 여부 및 픽쳐에 속하는 모든 B 슬라이스(존재하는 경우)에 대한 참조 픽쳐 리스트 1이 동일한지 여부를 나타낸다. restricted_ref_pic_lists_flag가 1이면 픽쳐에 속하는 모든 슬라이스에 대한 참조 픽쳐 리스트가 동일한 것을 나타내고, restricted_ref_pic_lists_flag가 0이면 픽쳐에 속하는 모든 슬라이스에 대한 참조 픽쳐 리스트가 동일한 것은 아님을 나타낸다.
lists_modification_present_flag는 참조 픽쳐 리스트의 변경(modification)에 대한 추가적인 정보가 존재하는 여부를 나타낸다. lists_modification_present_flag가 1이면, 슬라이스 레벨, 예를 들어 슬라이스 헤더에 참조 픽쳐 리스트 변경에 대한 추가 구문 요소가 존재하는 것을 나타내고, lists_modification_present_flag가 0이면 슬라이스 헤더에 참조 픽쳐 리스트 변경에 대한 추가 구문 요소가 존재하지 않는 것을 나타낸다.
본 실시예에 따를 경우, restricted_ref_pic_lists_flag 및 lists_modification_present_flag 모두 SPS가 아닌 PPS 에 포함되어 시그널링 된다. 이 경우, 비트스트림에서 참조 픽쳐 리스트가 변경될 때 마다 참조 픽쳐 리스트 변경 여부를 실시간으로 시그널링 할 수 있다. 인코딩 장치 및 디코딩 장치는 개별적인 픽쳐에 대하여 참조 픽쳐 리스트 구성이 적용되는지 여부에 대한 정보를 쉽게 인코딩 및 디코딩할 수 있다.
표 2 및 표 3은 본 발명의 다른 실시예에 따른 SPS 및 PPS를 도시한 것이다.
표 2
Figure PCTKR2013008672-appb-T000002
표 3
Figure PCTKR2013008672-appb-T000003
표 2를 참조하면, lists_modification_present_flag는 참조 픽쳐 리스트의 변경(modification)에 대한 추가적인 정보가 존재하는 여부를 나타낸다. lists_modification_present_flag가 1이면, 슬라이스 레벨, 예를 들어 슬라이스 헤더에 참조 픽쳐 리스트 변경에 대한 추가 구문 요소가 존재하는 것을 나타내고, lists_modification_present_flag가 0이면 슬라이스 헤더에 참조 픽쳐 리스트 변경에 대한 추가 구문 요소가 존재하지 않는 것을 나타낸다.
lists_modification_present_flag는 표 2와 같이, SPS에 포함되어 시그널링 될 수 있다.
표 3을 참조하면 restricted_ref_pic_lists_flag는 픽쳐에 속하는 모든 P 슬라이스 및 B 슬라이스(존재하는 경우)에 대한 참조 픽쳐 리스트 0이 동일한지 여부 및 픽쳐에 속하는 모든 B 슬라이스(존재하는 경우)에 대한 참조 픽쳐 리스트 1이 동일한지 여부를 나타낸다.
restricted_ref_pic_lists_flag는 SPS가 아닌 PPS에 포함되어 시그널링 될 수 있다.
도 7은 본 발명에 따른 참조 픽쳐 리스트의 동적인 변화를 예시적으로 도시한 도면이다.
도 7과 같이, 하나의 코딩된 픽처에 포함되어 있는 슬라이스는 참조 픽쳐 리스트가 동일할 수도 있고, 슬라이스 별로 참조 픽쳐 리스트가 상이할 수도 있다. 참조 픽쳐 리스트의 구성이 변경되는 경우, 픽쳐 단위로 이러한 변경된 정보를 시그널링 할 수 있으므로 보다 효율적으로 참조 픽쳐 리스트에 대한 정보를 시그널링 할 수 있고, 코딩 효율도 향상되는 효과가 있다.
하나의 픽쳐 내에 속한 슬라이스에 대하여 동일한 참조 픽쳐 리스트가 적용되는 픽쳐들에 대한 PPS 0, PPS 2의 경우, restricted_ref_pic_lists_flag는 1로 시그널링 된다. 이 경우, 추가적으로 lists_modification_present_flag이 시그널링 될 것이다. 즉, 도 7과 같이 픽쳐 파라미터 세트에 새로운 정보가 추가되는 경우, 새로운 픽쳐 파라미터 세트가 이에 대응하여 시그널링 된다.
반면, 하나의 픽쳐 내에 속한 슬라이스에 대하여 상이한 참조 픽쳐 리스트가 적용되는 픽쳐들에 대한 PPS 1, PPS 3의 경우, restricted_ref_pic_lists_flag는 0으로 시그널링 된다.
한편, 픽쳐 마다 참조 픽쳐 리스트의 변경 여부에 대한 정보가 시그널링 될 수 있다면, restricted_ref_pic_lists_flag는 PPS가 아닌 다른 파라미터 정보에 포함되어 시그널링 될 수도 있다. 예를 들어, restricted_ref_pic_lists_flag는 VUI(Video usability information) 파라미터에 포함되어 시그널링 될 수도 있다.
표 4 및 표 5는 본 발명의 다른 실시예에 따른 VUI 파라미터 및 PPS를 도시한 것이다.
표 4
Figure PCTKR2013008672-appb-T000004
표 5
Figure PCTKR2013008672-appb-T000005
표 4를 참조하면, restricted_ref_pic_lists_flag는 픽쳐에 속하는 모든 P 슬라이스 및 B 슬라이스(존재하는 경우)에 대한 참조 픽쳐 리스트 0이 동일한지 여부 및 픽쳐에 속하는 모든 B 슬라이스(존재하는 경우)에 대한 참조 픽쳐 리스트 1이 동일한지 여부를 나타낸다.
restricted_ref_pic_lists_flag는 SPS가 아닌 VUI 파라미터에 포함되어 시그널링 될 수 있다.
표 5를 참조하면 lists_modification_present_flag는 참조 픽쳐 리스트의 변경(modification)에 대한 추가적인 정보가 존재하는 여부를 나타낸다. lists_modification_present_flag가 1이면, 슬라이스 레벨, 예를 들어 슬라이스 헤더에 참조 픽쳐 리스트 변경에 대한 추가 구문 요소가 존재하는 것을 나타내고, lists_modification_present_flag가 0이면 슬라이스 헤더에 참조 픽쳐 리스트 변경에 대한 추가 구문 요소가 존재하지 않는 것을 나타낸다.
lists_modification_present_flag는 표 5와 같이, restricted_ref_pic_lists_flag와 분리되어 PPS에 포함되어 시그널링 될 수 있다.
도 8은 본 발명의 일 실시예에 따른 비디오 디코딩 방법을 설명하기 위한 제어 흐름도이다.
우선, 디코딩 장치는 픽쳐에 속하는 슬라이스에 동일한 참조 픽쳐 리스트가 적용되는지 여부를 나타내는 제1 정보를 수신하여 파악한다(S810).
이러한 제1 정보는 restricted_ref_pic_lists_flag일 수 있으며, 이러한 플래그 정보는 SPS가 아닌 PPS 또는 VUI 파라미터에 포함되어 수신될 수 있다.
만약 restricted_ref_pic_lists_flag가 0이면(S820), 이는 픽쳐에 속하는 슬라이스에 동일한 참조 픽쳐 리스트가 적용되지 않는 것을 나타내므로, 디코딩 장치는 슬라이스 레벨에서 전송되는 참조 픽쳐 리스트의 변경 정보, 즉 초기 참조 픽쳐 리스트에서 변형될 수 있는 추가적인 참조 픽쳐 리스트 정보를 이용하여 참조 픽쳐 리스트를 구성한다(S830).
한편, restricted_ref_pic_lists_flag가 1이면(S820), 디코딩 장치는 참조 픽쳐 리스트의 변경에 대한 추가적인 정보가 존재하는지 여부를 나타내는 제2 정보를 수신할 수 있다.
제 2 정보는 lists_modification_present_flag일 수 있으며, 이러한 플래그 정보는 기존의 SPS에 포함되어 전송될 수도 있고, PPS에 포함되어 전송될 수도 있다.
lists_modification_present_flag가 1이면(S840), 참조 픽쳐 리스트의 변경에 대한 추가적인 정보가 존재하는 것을 나타내므로, 디코딩 장치는 S830과 같이 추가적인 참조 픽쳐 리스트 정보를 이용하여 참조 픽쳐 리스트를 구성한다(S830).
반면, lists_modification_present_flag가 0이면(S840), 해당 픽처에 대하여는 하나의 참조 픽쳐 리스트 구성이 적용되고, 디코딩 장치는 SPS 레벨 또는 PPS 레벨에서 전송되는 참조 픽쳐 리스트 구성에 대한 정보를 이용하여 초기 참조 픽쳐 리스트를 구성할 수 있고, 이러한 초기 참조 픽쳐 리스트가 해당 픽쳐의 참조 픽쳐 리스트로 이용될 수 있다(S850).
참조 픽쳐 리스트는은 참조 픽쳐 세트 구성을 기초로 하여 생성될 수 있으며, 이는 도 4 및 도 5를 참조하여 설명된 내용과 대동 소이하므로 중복된 설명은 생략한다.
본 발명은 상술한 바와 같이, 참조 픽쳐 리스트 구성 시 픽쳐 리스트의 구성의 변동 여부를 픽쳐 단위로 시그널링 하는 방법 및 장치에 대한 것이며, 참조 픽쳐 리스트 구성 시 픽쳐의 특정에 대응하여 픽쳐 리스트의 구성을 변경할 수 있는 효과가 있다.
상술한 예시적인 시스템에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 상술한 실시예들은 다양한 양태의 예시들을 포함할 수 있으므로 각 실시예의 조합 역시 본 발명의 일 실시예로서 이해되어야 할 것이다. 따라서, 본 발명은 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.

Claims (12)

  1. 비트스트림을 디코딩하는 영상의 디코딩 방법에 있어서,
    픽쳐에 속하는 슬라이스에 동일한 참조 픽쳐 리스트가 적용되는지 여부를 나타내는 제1 정보 및 상기 참조 픽쳐 리스트의 변경에 대한 추가적인 정보가 존재하는지 여부를 나타내는 제2 정보 중 적어도 하나를 포함하는 픽쳐 파라미터 세트를 수신하는 단계와;
    상기 픽쳐 파라미터 세트에 기초하여 상기 참조 픽쳐 리스트 구성을 유도하는 단계를 포함하는 것을 특징으로 하는 디코딩 방법.
  2. 제1항에 있어서,
    상기 제2 정보는 픽처 파라미터 세트에 포함되는 것을 특징으로 하는 디코딩 방법.
  3. 제1항에 있어서,
    상기 제1 정보는 VUI(Video usability information) 파라미터에 포함되는 것을 특징으로 하는 디코딩 방법.
  4. 제1항에 있어서,
    상기 참조 픽쳐 리스트 구성을 유도하는 단계는 상기 제1 정보가 1이면, 하나의 픽쳐에 대하여 상기 참조 픽쳐 리스트 구성을 한번 유도하는 것을 특징으로 하는 디코딩 방법.
  5. 제1항에 있어서,
    상기 제2 정보는 상기 제1 정보의 값이 1이면 수신되는 것을 특징으로 하는 디코딩 방법.
  6. 제1항에 있어서,
    상기 참조 픽쳐 리스트 구성을 유도하는 단계는 상기 제1 정보가 0이면, 픽쳐에 포함되어 있는 슬라이스 별로 상기 참조 픽쳐 리스트 구성을 유도하는 것을 특징으로 하는 디코딩 방법.
  7. 픽쳐에 속하는 슬라이스에 동일한 참조 픽쳐 리스트가 적용되는지 여부를 나타내는 제1 정보 및 상기 참조 픽쳐 리스트의 변경에 대한 추가적인 정보가 존재하는지 여부를 나타내는 제2 정보 중 적어도 하나를 포함하는 픽쳐 파라미터 세트를 파싱하는 파싱부와;
    상기 픽쳐 파라미터 세트에 포함된 상기 제1 정보 및 상기 제2 정보에 기초하여 참조 픽쳐 리스트 구성을 유도하는 예측부를 포함하는 것을 특징으로 하는 디코딩 장치.
  8. 제7항에 있어서,
    상기 제2 정보는 픽처 파라미터 세트에 포함되는 것을 특징으로 하는 디코딩 장치.
  9. 제7항에 있어서,
    상기 제1 정보는 VUI(Video usability information) 파라미터에 포함되는 것을 특징으로 하는 디코딩 장치.
  10. 제7항에 있어서,
    상기 예측부는 상기 제1 정보가 1이면, 하나의 픽쳐에 대하여 상기 참조 픽쳐 리스트 구성을 한번 유도하는 것을 특징으로 하는 디코딩 장치.
  11. 제7항에 있어서,
    상기 제2 정보는 상기 제1 정보의 값이 1이면 수신되는 것을 특징으로 하는 디코딩 장치.
  12. 제7항에 있어서,
    상기 예측부는 상기 제1 정보가 0이면, 픽쳐에 포함되어 있는 슬라이스 별로 상기 참조 픽쳐 리스트 구성을 유도하는 것을 특징으로 하는 디코딩 장치.
PCT/KR2013/008672 2012-09-28 2013-09-27 영상 복호화 방법 및 이를 이용하는 장치 WO2014051372A1 (ko)

Priority Applications (12)

Application Number Priority Date Filing Date Title
US14/352,586 US9560369B2 (en) 2012-09-28 2013-09-27 Video decoding method and apparatus using the same
KR1020157005837A KR102226893B1 (ko) 2012-09-28 2013-09-27 영상 복호화 방법 및 이를 이용하는 장치
KR1020227001403A KR102414518B1 (ko) 2012-09-28 2013-09-27 영상 복호화 방법 및 이를 이용하는 장치
KR1020157002026A KR101553514B1 (ko) 2012-09-28 2013-09-27 영상 복호화 방법 및 이를 이용하는 장치
KR1020217006891A KR102302504B1 (ko) 2012-09-28 2013-09-27 영상 복호화 방법 및 이를 이용하는 장치
KR1020217029000A KR102352871B1 (ko) 2012-09-28 2013-09-27 영상 복호화 방법 및 이를 이용하는 장치
KR1020227021604A KR102574869B1 (ko) 2012-09-28 2013-09-27 영상 복호화 방법 및 이를 이용하는 장치
US15/418,888 US9848200B2 (en) 2012-09-28 2017-01-30 Video decoding method and apparatus using the same
US15/845,770 US10390032B2 (en) 2012-09-28 2017-12-18 Video decoding method and apparatus using the same
US16/540,499 US10567783B2 (en) 2012-09-28 2019-08-14 Video decoding method and apparatus using the same
US16/773,704 US11259038B2 (en) 2012-09-28 2020-01-27 Video decoding method and apparatus using the same
US17/578,182 US20220141478A1 (en) 2012-09-28 2022-01-18 Video decoding method and apparatus using the same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261706783P 2012-09-28 2012-09-28
US61/706,783 2012-09-28

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US14/352,586 A-371-Of-International US9560369B2 (en) 2012-09-28 2013-09-27 Video decoding method and apparatus using the same
US15/418,888 Continuation US9848200B2 (en) 2012-09-28 2017-01-30 Video decoding method and apparatus using the same

Publications (1)

Publication Number Publication Date
WO2014051372A1 true WO2014051372A1 (ko) 2014-04-03

Family

ID=50388658

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2013/008672 WO2014051372A1 (ko) 2012-09-28 2013-09-27 영상 복호화 방법 및 이를 이용하는 장치

Country Status (3)

Country Link
US (6) US9560369B2 (ko)
KR (6) KR102302504B1 (ko)
WO (1) WO2014051372A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10848758B2 (en) 2016-11-22 2020-11-24 Electronics And Telecommunications Research Institute Image encoding/decoding image method and device, and recording medium storing bit stream

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10432928B2 (en) 2014-03-21 2019-10-01 Qualcomm Incorporated Using a current picture as a reference for video coding
CN118200558A (zh) * 2018-09-17 2024-06-14 三星电子株式会社 用于编码和解码运动信息的方法及用于编码和解码运动信息的装置
KR20220088796A (ko) * 2019-12-12 2022-06-28 엘지전자 주식회사 영상 정보를 시그널링하는 방법 및 장치
WO2024010370A1 (ko) * 2022-07-05 2024-01-11 엘지전자 주식회사 양방향 인터 예측에 기반한 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110139304A (ko) * 2009-04-22 2011-12-28 엘지전자 주식회사 다시점 영상의 참조 픽쳐 리스트 변경 방법
KR20120017407A (ko) * 2010-08-18 2012-02-28 에스케이 텔레콤주식회사 영상 부호화/복호화 장치 및 방법, 및 참조픽처 인덱싱 장치 및 방법
JP2012054982A (ja) * 2002-07-15 2012-03-15 Thomson Licensing ビデオ復号化における参照ピクチャの適応重み付け
KR20120078647A (ko) * 2010-12-31 2012-07-10 한국전자통신연구원 영상 정보 부호화 방법 및 복호화 방법과 이를 이용한 장치
KR20120104128A (ko) * 2011-03-11 2012-09-20 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8406301B2 (en) 2002-07-15 2013-03-26 Thomson Licensing Adaptive weighting of reference pictures in video encoding
US7376186B2 (en) 2002-07-15 2008-05-20 Thomson Licensing Motion estimation with weighting prediction
KR100803611B1 (ko) * 2006-11-28 2008-02-15 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JP5037570B2 (ja) 2009-07-02 2012-09-26 日立建機株式会社 作業機械
WO2012023817A2 (ko) 2010-08-18 2012-02-23 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법, 및 참조픽처 인덱싱 장치 및 방법
KR20120050863A (ko) 2010-11-11 2012-05-21 에스앤제이클린텍(주) 음식물 쓰레기 처리 장치
US8934552B2 (en) * 2011-03-31 2015-01-13 Qualcomm Incorporated Combined reference picture list construction and mapping
KR20130050863A (ko) 2011-11-08 2013-05-16 삼성전자주식회사 참조리스트를 이용하는 예측을 수반하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
DK3016391T3 (en) * 2012-01-17 2017-06-26 ERICSSON TELEFON AB L M (publ) Managing reference image list
US8693793B2 (en) * 2012-01-19 2014-04-08 Sharp Laboratories Of America, Inc. Reducing reference picture set signal overhead on an electronic device
US9369710B2 (en) * 2012-02-06 2016-06-14 Qualcomm Incorporated Reference picture list modification for video coding
EP2838263A4 (en) * 2012-04-15 2015-12-23 Samsung Electronics Co Ltd INTERPRETING METHOD BY WHICH LISTS OF REFERENCE PICTURES CAN BE MODIFIED, AND APPARATUS THEREFOR

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012054982A (ja) * 2002-07-15 2012-03-15 Thomson Licensing ビデオ復号化における参照ピクチャの適応重み付け
KR20110139304A (ko) * 2009-04-22 2011-12-28 엘지전자 주식회사 다시점 영상의 참조 픽쳐 리스트 변경 방법
KR20120017407A (ko) * 2010-08-18 2012-02-28 에스케이 텔레콤주식회사 영상 부호화/복호화 장치 및 방법, 및 참조픽처 인덱싱 장치 및 방법
KR20120078647A (ko) * 2010-12-31 2012-07-10 한국전자통신연구원 영상 정보 부호화 방법 및 복호화 방법과 이를 이용한 장치
KR20120104128A (ko) * 2011-03-11 2012-09-20 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10848758B2 (en) 2016-11-22 2020-11-24 Electronics And Telecommunications Research Institute Image encoding/decoding image method and device, and recording medium storing bit stream
US11343490B2 (en) 2016-11-22 2022-05-24 Electronics And Telecommunications Research Institute Image encoding/decoding image method and device, and recording medium storing bit stream
US11825077B2 (en) 2016-11-22 2023-11-21 Electronics And Telecommunications Research Institute Image encoding/decoding image method and device, and recording medium storing bit stream

Also Published As

Publication number Publication date
US20170142436A1 (en) 2017-05-18
KR102414518B1 (ko) 2022-06-29
KR20150050560A (ko) 2015-05-08
KR20150034203A (ko) 2015-04-02
US9848200B2 (en) 2017-12-19
KR102352871B1 (ko) 2022-01-18
KR20220098255A (ko) 2022-07-11
KR20220011223A (ko) 2022-01-27
KR102226893B1 (ko) 2021-03-11
KR102302504B1 (ko) 2021-09-15
US10390032B2 (en) 2019-08-20
US9560369B2 (en) 2017-01-31
KR20210028756A (ko) 2021-03-12
US10567783B2 (en) 2020-02-18
KR20210113451A (ko) 2021-09-15
KR102574869B1 (ko) 2023-09-06
US11259038B2 (en) 2022-02-22
US20220141478A1 (en) 2022-05-05
US20180109803A1 (en) 2018-04-19
US20150195552A1 (en) 2015-07-09
US20190373275A1 (en) 2019-12-05
KR101553514B1 (ko) 2015-10-15
US20200162752A1 (en) 2020-05-21

Similar Documents

Publication Publication Date Title
WO2017052081A1 (ko) 영상 코딩 시스템에서 인터 예측 방법 및 장치
WO2020071829A1 (ko) 히스토리 기반 영상 코딩 방법 및 그 장치
WO2020071830A1 (ko) 히스토리 기반 움직임 정보를 이용한 영상 코딩 방법 및 그 장치
WO2017057953A1 (ko) 비디오 코딩 시스템에서 레지듀얼 신호 코딩 방법 및 장치
WO2017034331A1 (ko) 영상 코딩 시스템에서 크로마 샘플 인트라 예측 방법 및 장치
WO2016200043A1 (ko) 비디오 코딩 시스템에서 가상 참조 픽처 기반 인터 예측 방법 및 장치
WO2017082443A1 (ko) 영상 코딩 시스템에서 임계값을 이용한 적응적 영상 예측 방법 및 장치
WO2014098456A2 (ko) 영상 인코딩/디코딩 방법 및 이를 이용하는 장치
WO2016204373A1 (ko) 영상 코딩 시스템에서 영상 특성에 기반한 적응적 필터링 방법 및 장치
WO2017057877A1 (ko) 영상 코딩 시스템에서 영상 필터링 방법 및 장치
WO2014042460A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2017048008A1 (ko) 영상 코딩 시스템에서 인터 예측 방법 및 장치
WO2017061671A1 (ko) 영상 코딩 시스템에서 적응적 변환에 기반한 영상 코딩 방법 및 장치
WO2013162249A1 (ko) 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
WO2014084656A1 (ko) 복수의 레이어를 지원하는 영상 부호화/복호화 방법 및 장치
WO2015009036A1 (ko) 시간적 서브 레이어 정보에 기반한 인터 레이어 예측 방법 및 장치
WO2016204374A1 (ko) 영상 코딩 시스템에서 영상 필터링 방법 및 장치
WO2014007515A1 (ko) 영상 정보 코딩 방법 및 이를 이용하는 장치
WO2017159901A1 (ko) 비디오 코딩 시스템에서 블록 구조 도출 방법 및 장치
WO2018128222A1 (ko) 영상 코딩 시스템에서 영상 디코딩 방법 및 장치
WO2021201515A1 (ko) Hls를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체
WO2014051372A1 (ko) 영상 복호화 방법 및 이를 이용하는 장치
WO2014038905A2 (ko) 영상 복호화 방법 및 이를 이용하는 장치
WO2016178485A1 (ko) 영상 코딩 시스템에서 코딩 유닛 처리 방법 및 장치
WO2015057032A1 (ko) 멀티 뷰를 포함하는 비디오 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 14352586

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13840581

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 1020157002026

Country of ref document: KR

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13840581

Country of ref document: EP

Kind code of ref document: A1